KR20220081991A

KR20220081991A - 아카르보스의 개선된 형성을 위한 방법

Info

Publication number: KR20220081991A
Application number: KR1020227012323A
Authority: KR
Inventors: 알프레드 퓔러; 외른 칼리노브스키; 수산네 슈네이커-베켈; 마르쿠스 페르시케; 레나 샤페르트
Original assignee: 바이엘 악티엔게젤샤프트
Priority date: 2019-10-16
Filing date: 2020-10-02
Publication date: 2022-06-16
Also published as: JP2022553183A; EP4045520A1; CN114555811A; WO2021073900A1; US20230227879A1

Abstract

본 발명은 아카르보스의 개선된 형성을 위한 악티노미세탈레스 균주에 관한 것이다. dTDP-D-글루코스-4,6-데히드라타제 (AcbB) 및/또는 우리딜트랜스퍼라제 (GtaB)를 과다발현하도록 조작된 악티노미세탈레스 균주가 제공된다. 또한, 작은 탄수화물 결합 단백질 (Cgt)의 발현 감소 또는 부재 및/또는 카로티노이드 합성에 필수적인 유전자의 발현 감소 또는 부재를 갖도록 조작된 악티노미세탈레스 균주가 제공된다. 또한 이들 균주를 생성하기 위한 도구, 방법 및 수단이 제공된다.

Description

아카르보스의 개선된 형성을 위한 방법

본 발명은 아카르보스의 개선된 형성을 위한 악티노미세탈레스(Actinomycetales) 균주에 관한 것이다. dTDP-D-글루코스-4,6-데히드라타제 (AcbB) 및/또는 우리딜트랜스퍼라제 (GtaB)를 과다발현하도록 조작된 악티노미세탈레스 균주가 제공된다. 또한, 작은 탄수화물 결합 단백질 (Cgt)의 발현 감소 또는 부재 및/또는 카로티노이드 합성에 필수적인 유전자의 발현 감소 또는 부재를 갖도록 조작된 악티노미세탈레스 균주가 제공된다. 또한 이들 균주를 생성하기 위한 도구, 방법 및 수단이 제공된다.

아카르보스

치료제 아카르비오실-말토스 (아카르보스)는 1990년부터 당뇨병의 의학적 치료에 사용되고 있다 (Wehmeier and Piepersberg 2004; Wehmeier 2004). 그것은 환자의 엄격한 식단 계획을 지원하고 고탄수화물 식사를 섭취할 때 당 피크를 방지해야 한다. 경구 적용 후, 아카르보스는 장내 α-글루코시다제를 억제하여 전분 및 수크로스 함유 식이로부터 모노사카라이드의 방출을 지연시킨다. 이를 통해 아카르보스는 모노사카라이드가 혈액 시스템으로 흡수되는 속도를 제어하는 데 도움이 되며, 이는 심혈관 질환 사망률의 맥락에서 결정적인 것으로 추정되는 식후 혈액 및 혈청 당 수치를 감소시킨다.

산업적 적용가능성

아카르보스는 유럽과 중국에서는 글루코바이(Glucobay) [바이엘 아게(Bayer AG)]로서, 북미에서는 프레코스(Precose) [바이엘 파마슈티칼스(Bayer Pharmaceuticals)]로서, 캐나다에서는 프란다스(Prandase) (바이엘 아게)로서 공지되어 있고 판매되고 있다. 당뇨병의 치료를 위한 중요하고 수요가 많은 약물로서, 고수율 및 고품질의 아카르보스를 제공할 필요가 있다. 제II형 당뇨병의 발병률이 전 세계적으로 지속적으로 증가함에 따라, 제품 수율과 품질의 최적화가 현재의 관심사이다.

아카르보스 생산 균주

아카르보스는 스트렙토미세스 코엘리코플라부스(Streptomyces coelicoflavus) ZG0656 (Geng et al. 2009), 스트렙토미세스 글라우세스센스(Streptomyces glaucescens) GLA.O (Rockser and Wehmeier 2009; Ortseifen et al. 2015) 및 악티노플라네스 종(Actinoplanes sp.) SE50/110 (문헌 [Wehmeier and Piepersberg 2004]에 의해 검토됨)과 같은 상이한 악티노미세탈레스에 의해 자연적으로 생산되며, 이 중 후자는 산업 생산자 균주의 야생형이다 (Ortseifen 2016; Mahmud et al. 1999). 악티노플라네스 속은 카우치(Couch) (1950)에 의해 미크로모노스포라세아에(Micromonosporaceae) 과, 악티노미세탈레스 목, 악티노박테리아(Actinobacteria) 문의 구성원으로서 처음 도입되었다. 악티노플라네스 종 SE50/110 (ATCC 31044, CBS 674.73)은 천천히 성장하는 SE50의 자연 유도물이다 (ATCC 31042, CBS 961.70) (Frommer et al. 1973). SE50은 1970년 바이엘 아게가 케냐의 커피 농장 근처 토양 샘플로부터 스크리닝 프로그램을 진행하는 동안 단리되었다 (Frommer et al. 1972). SE50/110은 배지에 말토스가 제공될 때 대략 1 g·L^-1 아카르보스를 생산한다 (Wendler et al. 2014). 예를 들어 (EP2601209B1) 및 (CN103298828B)에 기재된 바와 같이, 추가 생산 균주가 조작되었다.

악티노플라네스 종 SE50/110에 대하여, 아카르비오실-당의 생합성은 배양 배지 내의 탄소 공급원의 공급에 의존하는 것으로 제시되었다 (Wendler et al. 2014). 글루코스에서 성장하면, 아카르비오실-글루코스가 주요 화합물로서 형성되는 반면, 말토스에서 성장하면 아카르비오실-말토스가 주로 형성되고 (Wendler et al. 2014), 말토트리오스에서 성장하면 아카르비오실-말토트리오스가 형성된다 (Ortseifen 2016).

산업용 아카르보스 생산자 균주의 야생형으로서의 의학적 및 산업적 관련성으로 인해, 악티노플라네스 종 SE50/110은 지난 몇 년 동안 광범위하게 연구되었다: 완전한 게놈 (Schwientek et al. 2012), 트랜스크립톰 (Schwientek et al. 2013) 및 프로테옴 (Wendler et al. 2015b; Wendler et al. 2015a; Wendler et al. 2013)을 종합적으로 분석하였다. 이는 2017년에 정련된 게놈 서열과 개선된 주석으로 이어졌다 (진뱅크: LT827010.1) (Wolf et al. 2017b). 또한, 속간 접합 시스템 (Gren et al. 2016) 뿐만 아니라 CRISPR/Cas9의 사용에 의한 진보된 게놈 편집 도구 (Wolf et al. 2016)가 확립되어, 표적화된 유전적 조작이 가능하였다. 여전히, 악티노플라네스 종 SE50/110에 대해 중간 정도 내지 강한 유전자 발현을 가능하게 하는 신뢰할 수 있는 발현 시스템이 없다. 단일 유전자의 중간 정도의 강한 과다발현에 적합한 시스템이 이전에는 존재하지 않았기 때문에, 본 발명에 따라 상이한 전략을 테스트하고 평가하여, pSETT4라는 신규 발현 시스템을 개발하게 되었다.

아카르보스 생합성

아카르보스의 생합성 경로는 단일 단계를 촉매하는 단일 작용성 효소를 기반으로 한다 (도 1) (Wehmeier and Piepersberg 2009). 문헌 [Zhang et al. (2002)]의 모델에 따르면, 이러한 생합성은 중간체 발리에논-7P를 통해 진행된다. 문헌 [Wehmeier (2003)]에 의한 정련에서는, 환원 및 탈수 단계가 변경되어 중간체로서 발리올롤-7P가 생성되었다. 단계의 순서는 공지되지 않았기 때문에, 대괄호로 표시된다. 세도-헵툴로스-7P로부터 2-에피-5-에피-발리올론을 형성하기 위한 AcbC에 의한 순환 반응인 아카르보스 생합성의 제1 단계는 본 예시에서 누락되었다. 지난 수십 년 동안 연구의 초점이 되었지만, 여전히 아카르보스 생합성 경로는 아직 완전히 풀리지 않았다. 생합성의 처음 3개 단계만이 실험적으로 확증되었다. 아카르보스 생합성의 제1 효소인 AcbC (ACSP50_3607)는 세도 헵툴로스 7P7P로부터 2-에피-5-에피-발리올론을 생성하는 순환 반응을 촉매한다 (Stratmann et al., 1999). 2-에피-5-에피-발리올론-7P로의 인산화는 ATP의 존재 하에 키나제 AcbM (ACSP50_3603)에 의해 촉매되고 (Zhang et al. 2002), 5-에피-발리올론-7P로의 에피머화는 보조인자 비의존성 에피머라제 AcbO (ACSP50_3606)에 의해 촉매된다 (Zhang et al. 2002; Zhang et al. 2003).

단백질 상동성 및 기능적 예측에 기반한 모델의 나머지 단계 (Zhang et al. (2002), Wehmeier (2003), Wehmeier and Piepersberg (2004), Wehmeier and Piepersberg (2009) and Wendler et al. (2013)): NADH-의존성 (폴리올)데히드로게나제/리덕타제 AcbL (ACSP50_3604) 및 시클리톨 데히드로게나제/옥시도리덕타제 AcbN (ACSP50_3605)은 1-에피-발리에놀-7P로의 환원 및 5,6 탈수를 촉매하는 것으로 제안되었다. 1,7-디포스포-1-에피-발리에놀로의 인산화는 1-에피-발리에놀-7-포스페이트-1-키나제 AcbU (ACSP50_3595) 및/또는 히드롤라제 AcbJ (ACSP50_3600)에 의해 촉매되는 것으로 추정된다. NDP-1-에피-발리에놀-7P로의 뉴클레오티딜화는 GlgC 관련 NDP-폴리올 신타제 AcbR (ACSP50_3597) (1-에피-발리에놀-1,7-비스포스페이트-1-아데닐릴트랜스퍼라제)에 의해 촉매될 수 있으며, 활성화된 중간체에서 활성화된 아미노 당으로의 전이는 글리코실-트랜스퍼라제 AcbI (ACSP50_3599) 및/또는 AcbS (ACSP50_3596)에 의해 매개되어 아카르비오신-7P를 생성하는 것으로 보인다.

활성화된 아미노 당은 3가지 단계에서 D-글루코스-1-포스페이트로부터 합성되는 것으로 가정되며 (Wehmeier and Piepersberg 2004; Wehmeier and Piepersberg 2009; Zhang et al. 2002), 이러한 단계는 (i) dTDP-글루코스-신타제 AcbA (ACSP50_3609)에 의한 dTDP-D-글루코스로의 뉴클레오티딜화, (ii) dTDP-D-글루코스-4,6-데히드라타제 AcbB (ACSP50_3608)에 의한 dTDP-4-케토-6-데옥시-D-글루코스로의 탈수, 및 (iii) GabT-유사 아미노트랜스퍼라제 AcbV (ACSP50_3594)에 의한 dTDP-4-아미노-4,6-디데옥시-D-글루코스로의 아민화 단계이다 (Diaz-Guardamino Uribe 2000; Zhang et al. 2019).

글루코스-1P는 글리코겐 대사, 갈락토스 대사 및 - 글루코스-6P로의 전환 후 - 당분해 과정과 같은 상이한 경로에서 중요한 역할을 하는 분기 대사산물이다 (Frey 1996; Purves 2006). UDP-글루코스-1P 우리딜트랜스퍼라제 GtaB는 글루코스-1P와 UDP-글루코스의 상호 전환을 촉매한다.

마지막으로, 말토스는 잠재적으로 AcbS에 의해 1-단계 반응으로 전이된다 (Hemker et al. 2001). 그러나 AcbI 또는 AcbJ는 또한 전이 반응을 촉매하는 것으로 제안되었다 (Wehmeier and Piepersberg 2004; Wendler et al. 2013). 이러한 반응에 대한 또 다른 후보는 아밀로말타제 AcbQ (ACSP50_3601)일 수 있다.

악티노플라네스 종 SE50/110에서, 생합성 유전자는 1999년 스트라트만(Stratmann) 등에 의해 처음 확인되었고 후속적으로 시퀀싱된 아카르보스 생합성 유전자 클러스터 (acb 유전자 클러스터)에서 구성된다 (진뱅크: Y18523.4) (Stratmann et al. 1999; Thomas 2001). 클러스터는 22개의 유전자를 함유한다 (도 2).

이미 언급된 생합성 유전자 (acbCMOLNUJRSIVBA) 외에도, 클러스터는 세포외 전분 분해 (AcbEZ, ACSP50_3610 및 ACSP50_3590), 트랜스글리코실화 (AcbD, ACSP50_3611) 및 아카르보스 유출 (AcbWXY, ACSP50_3591-3)에서의 기능을 코딩한다. 또한, 아카르보스-7-키나제 (AcbK, ACSP50_3602)와 세포내 아밀로말타제 (AcbQ)가 코딩되어 있으며, 이는 카르보포어 내의 기능에 할당되었다 (Wendler et al. 2015b; Schwientek et al. 2012; Wehmeier and Piepersberg 2009). NTP-피로포스포히드롤라제로서 주석이 달린 AcbP (ACSP50_3598)의 기능은 공지되어 있지 않다.

가능한 대사 관련성이 있는 악티노플라네스 단백질

단일 CBM-20 도메인 단백질 Cgt는 악티노플라네스 종 SE50/110 및 파생된 아카르보스 생산자 균주에서 가장 강하게 발현되는 유전자 중 하나이다 (Ortseifen 2016; Wendler et al. 2015a; Schwientek et al. 2013). 이것은 SignalP 분석 (Almagro Armenteros et al. 2019)에 따라 Sec-경로를 통해 분비되며, 이러한 유기체의 총 분비된 프로테옴의 최대 8%를 구성한다 (데이터는 제시되지 않음). Cgt는 149개의 아미노산과 β-샌드위치 구조를 특징으로 하는 폴드-패밀리 1, 작용기 A의 CBM-20 도메인을 함유한다 (Schwientek et al. 2013; Guillen et al. 2010). 이러한 패밀리의 구성원은 전분과 결합하는 것으로 기재된다 (Guillen et al. 2010).

악티노플라네스에서 유전자 결실을 위한 방법

속간 접합 시스템 (Gren et al. 2016)과 CRISPR/Cas9 기술 (Wolf et al. 2016)의 확립으로 악티노플라네스 종 SE50/110에서의 게놈 편집이 가능해진다.

또한, 본 발명에 따르면, 본 발명자들은 문헌 [Zhao et al. (2017)]에 기재된 바와 같이, 인테그라제가 없는 벡터 백본과 역선택을 위해 CodA를 사용하는 상동 재조합을 통해 신규 결실 시스템을 성공적으로 확립하였다. 이로써 악티노플라네스 종 SE50/110에 대한 유전자 도구상자는 추가로 확장될 수 있었다. 원리 증명으로서 신규 결실 시스템은 예시 유전자 cgt의 결실에 대해 성공적으로 테스트되었다. 상동 재조합 (HR)은 악티노박테리아에서의 통상적인 프로세스이며, 이중 교차를 통해 결실 돌연변이체를 생성하는 데 기술적으로 사용될 수 있다. pSG5 레플리콘과 같은 온도-감수성 레플리콘은 이러한 프로세스를 지원하고 강제할 수 있다 (Du et al. 2015; Garg and Parry 2010; Myronovskyy et al. 2009; Zhang and Parry 2007). 추가 방법, 예를 들어 문헌 [Tong et al. 2019]에 따른 단일 뉴클레오티드 교환을 위한 CRISPR-염기 편집 시스템, CRISPR-BEST, 문헌 [Qi et al. 2013]에 따른 CRISPRi/dCas9, RNA 간섭 등이 관련 기술분야에 존재한다.

악티노플라네스에서 유전자 과다발현을 위한 방법

악티노플라네스 종 SE50/110은 지난 수십 년 동안 광범위하게 연구되었다. 적절한 발현 시스템은 설계하기 어렵다 (문헌 [Schaffert et al. (2019)] 참조). 이러한 간행물의 전체 내용, 특히 악티노플라네스의 유전자 조작을 위한 발현 시스템 및 프로모터에 대한 설명은 그 전체 내용이 본원에 포함된다.

이전 연구에서는 에이. 테이코미세티쿠스(A. teichomyceticus)에서 pKC1139를 사용하여 유전자를 성공적으로 발현하는 것으로 제시된 바 있다 (Horbal et al. 2012). 그러나, 복제 pSG5-기반 벡터 pKC1139 (문헌 [Bierman et al.(1992)]에 의해 구축됨)는 악티노플라네스 종 SE50/110에서의 상동 유전자의 발현에 부적합한 것으로 밝혀졌는데, 이는 상동 재조합에 의한 원치 않는 벡터 통합이 발생하기 때문이다 (문헌 [Schaffert et al. (2019)] 참조). 이것은 추정상 벡터 복제의 높은 대사 비용으로 인해 선호되는 프로세스인 것으로 보인다. 이론에 얽매이는 것은 아니지만, SE50/110에서 ACSP50_7170에 의해 코딩된 단백질은 재조합효소 A (recA)로서 예측되어 재조합 프로세스를 촉매할 수 있다. 흥미롭게도, 에이. 테이코미세티쿠스의 게놈에서는 recA의 상동체가 발견되지 않았다. 악티노플라네스 종 SE50/110에서의 recA의 존재 및 에이. 테이코미세티쿠스에서의 결여는 HR-매개 벡터 통합이 에이. 테이코미세티쿠스에 대해 이전에 보고되지 않은 이유에 대한 결정적인 설명을 제공한다. 따라서 pSG5-기반 복제 발현 시스템은 악티노플라네스 종 SE50/110에서 재조합효소 유전자 recA를 결실시킴으로써 구현될 수 있다.

SCP2*-레플리콘을 기반으로 하는 pKC1218 (Kieser et al. 2000)과 pIJ101-레플리콘을 기반으로 하는 pSOK101 (Zotchev et al. 2000)과 같은 다른 복제 스트렙토미세스-이. 콜라이(E. coli) 셔틀 플라스미드는 악티노플라네스 종 SE50/110과의 접합완료체를 제공하지 않았다 (Gren 2017). 이러한 레플리콘은 아마도 SE50/110에서 불안정하거나 불활성일 수 있으며, 이는 관련 종 에이. 테이코미세티쿠스로부터의 발견에 따른 것이다 (Horbal et al. 2012).

통합 벡터 시스템을 사용함으로써, 별개의 게놈 위치에서 부가의 유전자 카피를 운반하는 완전한 벡터의 통합에 의해 유전적 중복이 달성될 수 있다. 이러한 프로세스는 파지 인테그라제에 의해 매개된다. 파지 인테그라제는 플라스미드에 국한된 attP와 숙주 염색체에 국한된 attB의 두 부착 부위의 표적화된 단방향 재조합을 촉매한다 (te Poele et al., 2008). 통합 후, 벡터는 attP-attB-재조합으로부터 유래된 부착 부위 좌측 (attL)과 우측 (attR)에 의해 플랭킹된다 (te Poele et al., 2008).

악티노플라네스 종 SE50/110에 대해 4가지 상이한 통합 벡터가 설명되었다 (Gren et al. 2016): 2개는 파지 φC31의 통합 메커니즘을 기반으로 한다 (pSET152 및 pIJ6902). 벡터 pRT801/2 및 pSOK804는 파지 φBT1 및 VWB-파지의 통합 메커니즘을 기반으로 한다. 그러나, 천연 프로모터를 사용하여 상대적 전사체 양을 두 배로 늘리는 것은 달성되지 않았다 (문헌 [Schaffert et al. (2019)] 참조).

통합 벡터에 대한 상종 및 이종 프로모터의 평가

강도와 관련하여 상종 및 이종 프로모터를 평가하는 방법은 그 전체 내용이 본원에 포함되는 문헌 [Schaffert et al. (2019)]에 제공된다. 간단히 언급하면, 통합 φC31-기반 벡터 pSET152가 악티노플라네스 종 SE50/110에서 프로모터 스크리닝에 사용되었다 (Gren et al. 2016). 13개의 상동 및 이종 프로모터의 프로모터 강도는 단백질 수준에서 분석되었고, 이들 중 12개는 전사체 수준에서 분석되었다 (표 1, 도 3).

표 1. 프로모터 스크리닝 실험에서 테스트된 리포터 유전자 gusA를 수반한 구축물.

전략

본 발명의 경우, 유전자 결실 및 과다발현에 의해 아카비오실-말토스 대사를 연구하여 아카르보스의 개선된 생산을 위한 균주를 조작하는 일련의 관련 도구 및 방법을 도출하였다. 아카르비오스 합성을 개선시키기 위해, 3가지 상이한 전략을 수행하였다: (i) 아카르보스 생합성을 통한 플럭스를 증강시키기 위한 acb 유전자의 유전자 용량 증가, (ii) 아카르보스 생합성의 전구체 전개 및 (iii) 대사 부담 감소 (도 4). 이러한 관련 전략 각각에 대한 접근 방식은 놀랍게도 개선된 아카르보스 형성으로 이어졌다: dTDP-D-글루코스-4,6-데히드라타제 AcbB의 과다발현에 의해, 최종 아카르보스 농도는 대략 50%만큼 상당히 증가되었다. 우리딜트랜스퍼라제의 과다발현에 의해 GtaB 아카르보스 수율이 8.5%만큼 개선되었는데, 이는 아마도 전구체 글루코스-1P의 공급이 개선되었기 때문일 것이다. 작은 탄수화물 결합 단백질 Cgt의 기능적 결실에 의해, 아카르보스 형성이 8 - 16%만큼 상당히 증강되었으며, 이는 아마도 대사 부담이 감소했기 때문일 수 있다. 증강은 장기간에 걸쳐 상이한 배양 환경에서 강력하였다.

더욱이, 빛에 노출된 경우 및 빛으로부터 감춰진 경우의 야생형 및 조절인자 돌연변이체 ΔmerR의 성장 실험을 시행한 결과, 광 유발 스트레스 및 카로티노이드 형성이 아카르보스 생산에 부정적인 영향을 미치는 것으로 밝혀졌다. 결과적으로, 카로티노이드 형성을 감소시킴으로써 아카르보스 생산을 더욱 개선시킬 수 있다.

도 1. 악티노플라네스 종 SE50/110에서의 아카르비오실-말토스의 생합성 모델. 2-에피-5-에피-발리올론으로부터의 아카르보스 생합성의 11가지 단계가 제시되어 있다 (Zhang (2002))
도 2. 악티노플라네스 종 SE50/110 (진뱅크: LT827010.1)의 게놈에서 아카르보스 생합성 유전자 클러스터 및 유전자 배치 (Schaffert, et al. 2019).
도 3. 악티노플라네스 종 SE50/110 균주에서 단백질과 전사체 수준에 대한 프로모터 스크리닝, 표 1 참조. 좌측에는 정규화된 글루쿠로니다제 활성 (절대값)이 제시되고 우측에는 RT-qPCR에 의해 계산된 gusA 유전자의 상대적 전사체 양이 제시된다. 글루쿠로니다제 검정의 경우, 인디고의 흡수 곡선의 기울기는 선형 회귀에 의해 계산되었고 세포 건조 중량에 의해 정규화되었다. 정규화된 활성은 양측 t-검정에서 pGUS와 비교하여 유의한 차이에 대해 테스트되었다 (p-값: P₂₄₇₅: 0.8889, P_efp: 3.048e-07, P_cdaR: 8.967e-07, P_rpsL: 1.296e-08, P_rpsJ: 0.0003677, P_cgt: 2.183e-06, P_tipA: 0.0001651, P_apm: 0.0001078, P_ermE _*: 0.007406, P_katE: 0.002577, P_moeE5: 0.001809, P_gapDH: 0.0005821, P_act: 0.02042). gusA 유전자의 상대적 전사체 양을 pGUS-벡터와 관련하여 분석하였다 (1로 설정됨). act-프로모터의 경우, 심각한 성장 결핍으로 인해 RNA를 단리할 수 없었다. 잔여 프로모터의 경우, 상대적 전사체 양에서의 상당한 증가가 측정되었다 (양측 t-검정의 p-값: P₂₄₇₅: 0.0001133, P_efp: 4.871e-05, P_cdaR: 0.002509, P_rpsL: 9.928e-06, P_rpsJ: 1.167e-08, P_cgt: 5.911e-08, P_tipA: 7.158e-06, P_apm: 4.596e-05, P_ermE _*: 0.0009364, P_katE: 0.0001373, P_moeE5: 0.0002518, P_gapDH: 4.207e-06). 계산된 p-값의 유의한 수준은 별표로 제시된다: * < α = 5%, ** < α = 1%, *** < α = 0.1%. 문헌 [Schaffert, et al. 2019]에 공개된 도면.
도 4. 개선된 아카르보스 생산을 위한 전략. 아카르보스 생산을 개선시키기 위해 3가지 사이한 전략이 제공된다: 1. 아카르보스 생합성 유전자의 유전자 용량 증가, 2. 아카르보스 생합성의 전구체 전개 및 3. 유전자 결실에 의한 대사 부담 감소. 본 작업에서 평가된 표적 유전자가 제시된다. 더욱이, 단일 유전자의 과다발현을 위해 과다발현 시스템을 구현해야 했다.
도 5. 아카르보스의 화학 구조. 아카르보스는 아카르비오스라고 불리는 슈도디사카라이드 (발리에나미닐-4-아미노-4,6-디데옥시글루코스)와 말토스로 구성된 시클리톨 함유 아미노글리코시드이다. 둘 다 α-1,4-글리코시드 결합에 의해 연결된다. 문헌 [Wolf 2017]에 공개된 도면.
도 6. 신규 클로닝 시스템 pSETT4의 벡터 카드 (서열식별번호(SEQ ID NO): 110, 서열식별번호: 111 참조). 프로모터, 예컨대 에게르텔라 렌타(Eggerthella lenta)로부터의 유전자 gapDH의 강한 프로모터 또는 tipA 프로모터는 발현 카세트, 예를 들어 lacZ 카세트 앞에 클로닝된다. lacZ-카세트는 제한 효소, 예를 들어 BsaI의 인식 측면에 의해 플랭킹된다. 제한 부위는 깁슨 어셈블리, 제한/라이게이션 클로닝 또는 골든 게이트 클로닝에 의해 관심 유전자에 의한 lacZ의 교환을 가능하게 한다. 종결을 위해, T4-종결인자가 클로닝 측 전후에 도입된다. 클로닝 측 뒤에서 2개의 역평행 지향 T4-종결인자는 양방향으로부터의 번역-초과를 방지해야 한다. 프로모터 서열의 교환을 위해, 추가 제한 부위, 예를 들어 NdeI 및 KpnI 제한 부위가 도입되었다. 더욱이, 벡터는 파지 φC31의 인테그라제 유전자 int 및 부착 부위 attP, 전이 기점 (ncP) 및 릴랙소좀 유전자 traJ, 높은 카피 수 ColE1/pMB1/pBR322/pUC 복제 기점 및 내성 유전자 (여기서: 아프라마이신 내성 유전자 aac(3)IV(apmR))를 포함한다.
도 7. 신규 결실 시스템의 계획과 상동 재조합 동안의 프로세스 (제1 및 제2 교차). 벡터 통합의 선택은 아프라마이신 또는 카나마이신을 사용하여 수행된다 (제1 교차, apm^R 또는 kan^R에 의해 매개된 내성). 역선택은 5-플루오로우라실을 사용하여 수행된다 (제2 교차, codA에 의해 매개된 감도).
도 8. 상동 재조합을 사용한 신규 결실 시스템의 작업 흐름.
도 9. Cgt의 아미노산 서열에 대한 BlastP 분석은 단일 CBM-20 도메인으로 이루어진 17개의 다른 단백질을 식별한다. BlastP에 의해 수행된 다중 서열 정렬을 기반으로 단백질 트리가 생성되고 시각화되었다 (Altschul et al. 1990). 이러한 단백질 트리는 NCBI 수탁 번호 및 그의 숙주로써 식별되는 18개의 단일 CBM-20 도메인 단백질의 거리를 제시한다. 괄호 안에 BlastP 분석의 서열 동일률과 양성률이 백분율로 제시된다.
도 10. 상이한 탄소 공급원이 보충된 (동일한 C-몰량) 최소 배지에서의 야생형 악티노플라네스 종 SE50/110의 성장. 적어도 3개의 생물학적 복제물의 세포 건조 중량과 표준 편차가 제시된다 (n_glc = 3, n_mal = 5, n_cel = 4, n_lac = 3, n_ara = 5, n_starch = 5).
도 11. a. 말토스 최소 배지에서 성장한 배양물과 비교하여, 탄소 공급원으로서 전분, C-Pur, 글루코스, 갈락토스, 셀로비오스 또는 락토스가 보충된 최소 배지에서 성장한 악티노플라네스 종 SE50/110에서의 cgt의 상대적 전사체 양. 양측 t-검정에서의 차이에 대한 테스트는 말토스와 비교하여 탄소 공급원 글루코스 (p-값 = 0.002848), 갈락토스 (p-값 = 0.002945) 및 락토스 (p-값 = 0.00114) 상에서의 cgt 유전자의 유의한 차등 유전자 발현을 표시하였다. b . 72.06 g·L^-1 말토스에서 성장한 배양물과 비교하여 44.40 g·L^-1 말토스가 보충된 말토스 최소 배지에서 성장한 악티노플라네스 종 SE50/110에서의 cgt의 상대적 전사체 양. 양측 t-검정에서의 차이에 대한 검정은 감소된 양의 말토스를 함유하는 배지에서 cgt의 유의하게 감소된 유전자 발현을 표시하였다 (p-값 = 0.04141).
도 12. 상이한 탄소 공급원이 보충된 최소 배지에서의 악티노플라네스 종 SE50/110의 야생형 및 결실 돌연변이체 Δcgt의 성장. 시간에 따른 세포 건조 중량 및 표준 편차가 제시된다 (야생형: n_glc = 3, n_mal = 5, n_cel = 4, n_lac = 3, n_ara = 5, n_starch = 5, Δcgt: n_glc = 2, n_mal = 5, n_cel = 4, n_lac = 4, n_ara = 5, n_starch = 5).
도 13. 6가지 상이한 탄소 공급원이 보충된 최소 배지에서 야생형 및 Δcgt 돌연변이체의 배양에서 수득된 최종 세포 건조 중량. 오차 막대는 표준 편차를 나타낸다.
도 14. 탄소 공급원으로서 제한된 양의 전분 하에 Δcgt 및 야생형의 성장. 배지에 1 g·L^-1, 2 g·L^-1, 3 g·L^-1, 4 g·L^-1 및 5 g·L^-1 전분을 보충시키고 m2p 랩스의 로보렉터(RoboLector)® 시스템에서 배양을 수행하였다. 막대 다이어그램의 후방산란 신호와 적어도 3개의 생물학적 복제물의 표준 편차가 제시된다. Δcgt에 대한 성장 억제는 관찰되지 않았다. 1 g·L^-1의 경우, 성장이 상당히 더 증강되는 것으로 밝혀졌다 (양측 t-검정의 p-값: 0.006141, n_wt = 3, n_Δcgt = 4).
도 15. 말토스 최소 배지에서 pH 스크리닝 실험의 최종 세포 건조 중량. 악티노플라네스 종 SE50/110의 야생형 및 Δcgt 돌연변이체는 m2p-랩스의 로보렉터® 시스템에 있는 48-웰 플라워플레이트에서 1 mL 반응 용적으로 성장되었다. 4 내지 7 범위의 pH에서는, 최종 세포 건조 중량에 있어서의 유의한 차이가 관찰되지 않았다 (양측 t-검정에 의해 검정됨, n_wt = 3, n_Δcgt = 4).
도 16. m2p-랩스의 로보렉터® 시스템에서 오스몰농도 내성 스크리닝: 말토스 일수화물 농도가 3.6 내지 108.1 g·L^-1인 말토스 최소 배지에서 최종 세포 건조 중량. 유의한 성장 차이는 관찰되지 않았다 (양측 t-검정에 의해 검정됨, n_wt = 3, n_Δcgt = 4).
도 17. m2p-랩스의 로보렉터® 시스템에서 오스몰농도 내성 스크리닝: 말토스 최소 배지에서 오스몰농도 스크리닝 실험의 최종 세포 건조 중량. 0 mM 내지 280 mM 범위의 농도로 이노시톨을 부가함으로써 상이한 오스몰농도를 달성하였다. 야생형과 Δcgt 간에는 유의한 성장 차이가 관찰되지 않았다 (양측 t-검정에 의해 검정됨, n_wt = 3, n_Δcgt = 4).
도 18. 각각 11.0 g·L^-1 말토스- 및 10.0 g·L^-1 글루코스-일수화물이 보충된 복합 배지 NBS에서 악티노플라네스 종 SE50/110 야생형 및 Δcgt 돌연변이체의 성장 및 아카르보스 생산. 차별적인 성장은 검출되지 않았다. 성장기 동안, 상당히 증가된 아카르보스 농도가 Δcgt에서 측정되었다 (배양 49시간 후 t-검정의 유의성: p-값 = 0.006778, n_wt _-acb = 3, n_Δcgt _-acb = 3, n_wt _- _cdwGlc = 4, n_Δcgt _- _cdwGlc = 3, n_wt-cdwMal = 4, n_Δcgt-cdwMal = 4).
도 19. a. 막대 차트에서 세포 건조 중량을 기준으로 한 아카르보스의 최종 수율 계수. 오차 막대는 가우스 오차 전파에 의해 계산되었다. b . 말토스 최소 배지에서 배양하는 동안 상등액 중의 세포 건조 중량 및 아카르보스 농도 (n_cdw = 5, n_acb = 4).
도 20. 말토스 최소 배지에서 성장한 악티노플라네스 종 SE50/110의 야생형과 비교하여 돌연변이체 Δcgt의 유전자 acbZ, acbW, acbV, acbA, acbB, acbE 및 acbD의 상대적 전사체 양 (n = 3-6).
도 21. 악티노플라네스 종 SE50/110에서의 카로티노이드 생합성의 재구축. NCBI 데이터베이스에 대항한 BLASTX 분석에 의해 식별된 악티노플라네스 종 SE50/110에서 추정되는 상동 유전자가 제시된다. 유전자 및 게놈의 교토 백과사전의 도움으로 재구축을 수행하였다 (Kanehisa et al. (2014)).
a. 메발로네이트 경로의 대체 대사 경로로서 공지되기도 한, 이소프레노이드 전구체 이소펜테닐 피로포스페이트 (IPP) 및 디메틸알릴 피로포스페이트 (DMAPP)의 생합성을 위한 메틸에리트리톨포스페이트 (MEP) 경로.
b-c: 카로티노이드 생합성. b . 이소프레노이드 전구체로부터 리코펜의 형성. c. 살리노스포라 트로피카(Salinospora tropica) CNB-440에서 글리코실화된 카로티노이드 시옥산틴의 합성 (문헌 [Richter et al.(2015)]의 도 1).
d. 악티노플라네스 종 SE50/110에서 확인된 유전자의 게놈 구성. 유전자 클러스터 2b는 박테리아 및 진균 게놈에서 2차 대사산물 생합성 유전자 클러스터의 주석 및 분석을 위한 신속한 게놈 전체 식별 도구인 antiSMASH에 의한 분석에 따라 살리노스포라 트로피카 CNB-440의 시옥산틴 유전자 클러스터에 대한 상동성을 표시한다 (Weber et al., 2015).
도 22. 빛에 노출된 경우 및 빛으로부터 가려진 경우의 악티노플라네스 종 SE50/110의 성장, 아카르보스 및 색소 형성. a . 전구 빛 (22-44 μE, 1 μE = μmol_광자 m^-2 s^- ¹)에 노출되거나 전구 빛으로부터 가려진 말토스 최소 배지에서의 야생형 악티노플라네스 종 SE50/110의 배양. 5개의 생물학적 복제물의 세포 건조 중량과 3개의 생물학적 복제물의 상등액 중 아카르보스 농도가 제시된다. b . 최종 배양 시간에서의 펠릿 및 상등액. c . 자연광에 노출되거나 자연광으로부터 가려진 SFM 한천 플레이트 상의 고체 배양물에서의 성장 및 색소 형성.
도 23. 테르펜 클러스터 1에서 MerR-조절인자를 코딩하는 유전자의 위치 및 악티노플라네스 종 SE50/110의 게놈에서의 그의 배치 (도 21 및 표 E12 참조). 클러스터의 유전자는 MerR-유사 전사 조절인자 (ACSP50_0145), 이소펜테닐-디포스페이트 델타-이소머라제 (idi, ACSP50_0146), 피토엔 데히드로게나제 (crtI, ACSP50_0147), 폴리프레닐 신테타제 (crtE, ACSP50_0148), 피토엔 신타제 (crtB, ACSP50_0149), 데옥시리보디피리미딘 포토-리아제 (ACSP50_0150) 및 피리딘 뉴클레오티드-디술피드 옥시도리덕타제 (ACSP50_0151)를 코딩한다.
도 24. 빛에 노출된 경우 및 빛으로부터 가려진 경우의 악티노플라네스 종 SE50/110 및 결실 돌연변이체 ΔmerR의 성장, 아카르보스 및 색소 형성. a . 전구 빛 (22-44 μE, 1 μE = μmol_광자 m^-2 s^- ¹)에 노출되거나 전구 빛으로부터 가려진 말토스 최소 배지에서의 악티노플라네스 종 SE50/110의 야생형 및 결실 돌연변이체 ΔmerR의 배양. 적어도 4개의 생물학적 복제물의 세포 건조 중량과 3개의 생물학적 복제물의 상등액 중의 아카르보스 농도가 제시된다. b . 최종 배양 시간에서의 펠릿 및 상등액. c . 고체 배지 (SFM 한천 플레이트)에서의 성장 및 색소 형성. d. 최대 아카르보스 농도 (양측 t-검정의 p-값: wt 어두움 vs. wt 밝음: 0.003975, wt 어두움 vs. ΔmerR 어두움: 0.09711, wt 어두움 vs. ΔmerR 밝음: 0.007043, ΔmerR 어두움 vs. wt 밝음: 0.02081, ΔmerR 어두움 vs. ΔmerR 밝음: 0.0002131). e . 어두운 조건 하에 배양될 때 야생형 (1의 값으로 설정됨)과 비교하여 결실 돌연변이체에서의 유전자 crtE (ACSP50_0148), crtB (ACSP50_0149), crtI (ACSP50_0147), idi (ACSP50_0146) 및 merR (ACSP50_0145)의 상대적 전사체 양 (양측 t-검정의 p-값: crtE: 0.04245, crtB: 0.01017, crtI: 0.07162, idi: 0.004366). 별표는 유의성 수준을 나타낸다: * p-값 < α = 5%, ** p-값 < α = 1%, *** p-값 < α = 0.1%.
도 25. 어두운 곳에서 성장한 배양물과 비교하여 빛에 노출된 악티노플라네스 종 SE50/110에서 차등적으로 전사된 유전자의 비율/강도 플롯. 비율 (log2(변화 배수))은 마이크로어레이 실험의 평균 강도에 대항하여 플롯된다. 더 어두운 점은 빛으로부터 가려진 배양물과 비교하여 빛에 노출된 배양물에서 상당한 차등 전사 수준을 갖는 유전자를 나타낸다.
도 26. pSET152-벡터 시스템에서 관심 유전자 뒤에 있는 추정 안티센스 프로모터의 TSS를 제시하는 ReadXplorer (Hilker et al. 2016; Hilker et al. 2014) 뷰. TSS는 풀링된 1차 전사체 라이브러리의 시퀀싱에 의해 결정되었다. pGUS::Papm:gusA의 통합 벡터-돌연변이체에 매핑된 예시적인 스택 읽기가 제시된다. 2개의 TSS (상자로 둘러싸여 있음)는 안티센스 배향 (a)에서 관심 유전자 뒤에 국한된다. 이러한 TSS는 σA/RNA-폴리머라제 복합체에 의해 프로모터 서열로서 추정상 인식되는 벡터 백본 상의 서열 모티프 (b)에 할당될 수 있다. -10- 및 -35-헥사머의 보존된 뉴클레오티드가 강조 표시된다. TG-이량체는 존재하는 경우 흑색 볼드체 글자로 제시된다. 헥사머 사이의 거리는 s1로 표시되고; -10-모티프와 TSS 사이의 거리는 s2로 제시된다.
도 27. 말토스 최소 배지에서 acbB 과다발현 균주의 성장 및 아카르보스 생산. 2가지 독립적인 배양이 제시된다 (a 및 b). RNA 단리를 위한 샘플링 시간은 t₁ ("초기 성장기") 및 t₂ ("선형 성장기")로 표시된다.
도 28. 말토스 최소 배지에서 acbB 과다발현 돌연변이체의 수율 계수. 이종 tipA-프로모터의 제어 하에 전사된 acbB를 갖는 돌연변이체는 증강된 수율 계수 (대략 50%)를 표시한 반면, gapDH-프로모터가 있는 구축물에 대해서는 약간의 차이만이 관찰되었다. 오차는 가우스 오차 전파에 의해 계산되었다. 모든 차이는 양측 t-검정에 의해 유의성에 대해 검정되었다 (본 도면에 할당된 약어). 별표는 유의성 수준을 나타낸다: * p-값 < α = 5%, ** p-값 < α = 1%, *** p-값 < α = 0.1%.
도 29. LC-MS에 의한 acbB 과다발현 돌연변이체의 세포내 대사산물의 분석. 질량 m/z = 545 [M-H⁺]의 정규화된 피크 면적이 제시된다. a . 글루코스-1P 및 갈락토스-1P (m/z = 259 [M-H⁺]. b . 글루코스-6P (m/z = 259 [M-H⁺] 및 c. UDP-글루코스 (m/z = 565 [M-H⁺]). d . UDP-글루코스의 정규화된 피크 면적 (양측 t-검정의 p-값: Ptip: 0.01068, Pgap: 0.001356) 및 질량 m/z = 545 [M-H⁺] (양측 t-검정의 p-값: Ptip: 0.0412)에 대하여 빈 벡터 대조군과 비교하여 유의한 차이가 관찰되었다.
도 30. 초기 성장기의 acbB 과다발현 돌연변이체에서 유전자 acbB, acbA 및 acbV의 상대적 전사체 양. 적어도 3개의 생물학적 복제물의 평균 및 표준 편차가 제시된다. 빈 벡터 대조군 (1의 값으로 설정됨)에 대한 차이는 양측 t-검정에 의해 검정되었다 (pSETT4gap::acbB, pSETT4tip::acbB, pSETT4::P_acbB:acbB, pSET152::P_acbB:acbB에 상응하는 좌측에서 우측으로 p-값: acbB: 4.332e-05, 4.561e-06, 0.3511, 0.7082; acbA: 0.3384, 0.0001164, 0.5967, 0.4246; acbV: 0.3033, 0.0423, 0.73, 0.4687). 별표는 유의성 수준을 나타낸다: * p-값 < α = 5%, ** p-값 < α = 1%, *** p-값 < α = 0.1%.
도 31. 선형 성장기에서 acbB-과다발현 돌연변이체에서의 유전자 acbB의 상대적 전사체 양. 적어도 3개의 생물학적 복제물의 평균 및 표준 편차가 제시된다. RT-qPCR은 양측 t-검정에 의해 검정된 (pSETT4gap::acbB, pSETT4tip::acbB, pSETT4::P_acbB:acbB, pSET152::P_acbB:acbB에 상응하는 좌측에서 우측으로의 p-값: acbB: 0.02217, 0.02771, 0.03895, 0.1582) 빈 벡터 대조군 (1의 값으로 설정됨)과 비교하여 유전자 발현에 있어서의 유의한 차이를 나타낸다. 별표는 유의성 수준을 나타낸다: * p-값 < α = 5%, ** p-값 < α = 1%, *** p-값 < α = 0.1%.
도 32. 말토스 최소 배지에서 gtaB 과다발현 돌연변이체의 성장 및 아카르보스 생산. RNA 단리를 위한 샘플링 시간은 화살표로 표시된다.
도 33. 과다발현 돌연변이체에서 gtaB의 상대적 전사체 양. RT-qPCR은 빈 벡터 대조군 (1의 값으로 설정됨)과 비교하여 gtaB 발현의 상당한 증가를 나타낸다 (양측 t-검정의 p-값: 0.01295). 별표는 유의성 수준을 나타낸다: * p-값 < α = 5%, ** p-값 < α = 1.
도 34. LC-MS에 의한 gtaB 과다발현 돌연변이체의 세포내 대사산물의 분석. 유전자 gtaB의 과다발현 균주에서 질량 m/z = 545 [M-H⁺] (a), 글루코스-1P 및 갈락토스-1P (m/z = 259 [M-H⁺] (b), 글루코스-6P (m/ z = 259 [M-H⁺]) (c) 및 UDP-글루코스 (m/z = 565 [M-H⁺]) (d)의 피크 면적이 제시된다. 질량 m/z = 545 [M-H⁺]의 정규화된 피크 면적에 대해 빈 벡터 대조군과 비교하여 유의한 차이가 관찰되었다 (양측 t-검정의 p-값: 0.01531). 다른 모든 피크 면적은 양측 t-검정에 따라 유의하게 상이하지 않다.
서열식별번호의 간단한 설명
본 출원과 관련된 서열 목록은 전자 형식으로 제출되며 이로써 그 전체 내용이 본 명세서에 참조로 포함된다.

정의

달리 정의되지 않는 한, 설명, 도면 및 청구범위에 사용된 모든 과학적 및 기술적 용어는 관련 기술분야의 통상의 기술자가 통상적으로 이해하는 바와 같은 일반적인 의미를 갖는다. 본원에 언급된 모든 간행물, 특허 출원, 특허 및 기타 참고문헌은 그 전체 내용이 참조로 포함된다. 상충되는 경우, 정의를 포함한 본 명세서가 우선할 것이다. 참조로 포함된 둘 이상의 문서에 서로 상충되고/거나 일관성이 없는 개시내용이 포함된 경우, 유효 날짜가 더 늦은 문서가 우선한다. 재료, 방법 및 예는 예시일 뿐이며 제한하려는 의도가 아니다. 달리 명시되지 않는 한, 설명 및 청구범위를 포함하여 본 문서에서 사용되는 하기 용어는 하기에 제공된 정의를 갖는다.

용어 "포함하는", "포함한", "함유하는", "갖는" 등은 광범위하게 또는 개방형이고 제한 없이 판독되어야 한다. 단수 형태는 문맥상 달리 명확하게 나타내지 않는 한 복수 지시대상을 포함한다. 달리 표시되지 않는 한, 일련의 요소 앞에 오는 용어 "적어도"는 일련의 모든 요소를 지칭하는 것으로 이해되어야 한다. 용어 "적어도 하나" 및 "중 적어도 하나"는 예를 들어 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 그 초과의 요소를 포함한다.

더욱이 명시된 범위 위 및 아래에서 약간의 변동이 그 범위 내의 값과 실질적으로 동일한 결과를 달성하기 위해 사용될 수 있음을 이해해야 한다. 또한, 달리 명시되지 않는 한, 범위의 개시는 최소 값과 최대 값 사이의 모든 값을 포함한 연속적인 범위로서 의도된다.

단백질 또는 아미노산 서열이 본 출원 전반에 걸쳐 제공되는 경우, 단일 또는 다중 아미노산이 실질적으로 동일한 효과, 즉 동등한 결과를 달성하기 위해 유사한 특성을 갖는 아미노산으로 교환될 수 있다는 것도 통상의 기술자에 의해 이해된다. 더욱이, 통상의 기술자는 정의된 단백질 또는 아미노산 서열이 다양한 핵산 서열에 의해 코딩될 수 있음을 알고 있다. 본원에 정의된 바와 같은 주어진 아미노산 서열에 대해, 특이적 아미노산 서열을 코딩하는 각각의 카운트가능한 핵산 서열은 본원에 개시된 것으로 간주되어야 한다. 핵산 서열이 본 출원 전반에 걸쳐 제공되는 경우, 침묵 돌연변이가 도입될 수 있음이 또한 이해된다.

O-{4,6-디데옥시-4[1S-(1,4,6/5)-4,5,6-트리히드록시-3-히드록시메틸-2-시클로헥센-1-일]-아미노-α-D-글루코-피라노실}-(1→4)-O-α-D-글루코피라노실-(1→4)-D-글루코피라노스 또는 "아카르보스"는 슈도디사카라이드와 α-1,4-글리코시드 결합된 말토스로 구성된 시클리톨 함유 아미노글리코시드이다 (Wehmeier and Piepersberg 2009). 아카르비오스로 명명된 슈도디사카라이드는 질소 결합에 의해 4,6-디데속시-D-글루코스의 C4에 연결된, 발리에놀 또는 발리엔아민으로서 지칭되기도 한 불포화 C7-아미노시클리톨에 의해 만들어진다 (도 5 참조) (Wehmeier and Piepersberg 2009). 이러한 N-글리코시드 결합은 외래 알파-1,4-글루코시드 히드롤라제에 의해 가수분해되지 않아, 거의 비가역적인 억제 효과를 초래할 수 있다 (Wehmeier and Piepersberg 2009; Brayer et al. 2000).

본원에 기재된 바와 같은 유전자 산물 또는 단백질의 "과다발현"은 야생형 또는 명시된 참조 균주와 비교하여 발현에서의 증가를 지칭한다. 바람직하게는, 참조 균주 또는 대조군은 각각의 유전자(들) 또는 단백질(들)의 특이적 과다발현을 위해 조작되지 않은 균주이다. 예를 들어, 대조군은 각각의 유전자 산물 또는 단백질에 대한 발현 카세트를 포함하는 벡터를 포함하지 않는다. 예를 들어, 유전자 산물의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안의 증가 또는 임의의 다른 시간 동안의 증가일 수 있다. 바람직하게는, 과다발현은 대조군과 비교하여 적어도 1.5의 인자 또는 적어도 2의 인자만큼 유전자 산물 또는 단백질의 증가이다. 전사체 양과 관련하여 본원에서 달리 정의되지 않는 경우, 강한 과다발현은 log2(변화 배수) > 6을 지칭한다. 전사체 양과 관련하여 본원에서 달리 정의되지 않는 경우, 약한 과다발현은 log2(변화 배수) < 2를 지칭한다. 전사체 양과 관련하여 본원에서 달리 정의되지 않는 경우, 중간 정도의 강한 과다발현은 log2(배수 변화) ≥ 2 및 ≤ 6을 지칭한다.

본원에 기재된 바와 같은 유전자 산물 또는 단백질의 발현은 각각의 유전자가 그의 유전자 산물이 전혀 발현되지 않거나 유의하게 감소된 양 (예를 들어, 0.75배 미만 또는 0.5배 미만)으로 발현되는 방식으로 결실되거나 돌연변이된 경우에 "부재하거나 감소된다". 본원에 기재된 바와 같은 유전자 산물 또는 단백질의 발현은 또한, 그러한 유전자 산물 또는 단백질이, 예를 들어 일시적 또는 영구적인 방식으로, 예를 들어 돌연변이 또는 녹다운에 의해 기능성을 상실한 경우에 부재하거나 감소된 것으로 간주된다. 유전자 산물 또는 단백질의 양 및/또는 활성을 모니터링하는 방법은 관련 기술분야에 공지되어 있으며 또한 예시적인 방식으로 본원에 기재되어 있다. 일반적으로, 유전자 산물의 발현 부재 또는 감소를 수득하기 위한 적합한 방법은 유전적 서열 또는 유전자 발현 요소를 변경시키는 방법 (예를 들어, 결실 또는 점 돌연변이에 의함) 및/또는 유전자의 전사 및 번역 또는 유전자 산물 (단백질)의 활성 또는 반감기에 부정적인 영향을 미치는 방법이다.

달리 명시되지 않는 경우, 부호 "Δ"는 "결실 돌연변이체", 즉 특이적 유전자 서열이 적어도 부분적으로 결실된 돌연변이체를 지칭한다.

"초기 성장기"는 악티노플라네스 균주가 배지에 적응하고 세포 건조 중량이 3 g·L^-1 미만인 시간이다. 환경에 적응한 후, 배양물은 배지에 의해 공급된 영양소를 대사하고 성장하기 시작한다. 악티노플라네스는 구형 균사체에서 성장하고 있으며, 이 균사체는 구형의 외부로만 확장할 수 있기 때문에, 중간에 있는 세포는 영양소로부터 보호되고 세포 분열을 위한 제한된 공간만 있다. 따라서 구형 균사체의 외층에 있는 세포만이 분열하고 있다. 이로써, 악티노플라네스의 성장은 선형이고 지수적이지 않으며 - 이는 단세포로 성장하는 다른 박테리아와 대조적이다. 악티노플라네스 아종에 대한 성장기는 "선형 성장기"라고 하고 3 g·L^-1의 세포 건조 중량에서 시작한다. "정지기"는 세포가 각각 용량 한계 (공간 및 영양소의 용량 한계)에 도달하는 성장기로서 정의되며, 이때 억제성 부산물의 형성 또는 기타 화학적 및 물리적 요인, 예컨대 오스몰농도 또는 pH에서의 변화로 인해 성장이 감소한다. 정지기는 죽어가는 세포의 수가 분열하는 세포의 수와 동일해지는 성장기이다. 이러한 기는 통상적으로 말토스 최소 배지에서 16-18 g·L^-1의 세포 건조 중량에서 시작한다.

본원에 사용된 바와 같은 용어 "벡터"는 그에 연결된 핵산 분자를 증식시킬 수 있는 핵산 분자를 지칭한다.

본원에 사용된 바와 같은 용어 "발현 카세트"는 발현을 위한 유전자 및 조절 서열, 예컨대 프로모터를 적어도 포함하는 핵산 분자를 지칭한다.

"프로모터"는 특정한 유전자의 전사 개시를 유도하는 핵산 서열이다.

본원에 정의된 바와 같은 "강한 프로모터"는 글루쿠로니다제 검정에서 적어도 5·10^-4 [L·g^-1·min^- ¹]의 정규화된 글루쿠로니다제 활성을 초래하고/거나 프로모터가 없는 pGUS 대조군 벡터와 비교하여 gusA 유전자의 350배 상대적 전사 (log2(변화 배수))를 초래하는 프로모터이다. 프로모터의 강도를 명확히 규명하는 방법에 대한 자세한 설명은 본 실시예 및 문헌 [Schaffert, et al. 2019] 내에 제공된다.

그 예는 하기의 프로모터를 포함한다:

apm: 9.2·10^-4 [L·g^-1·min^-1] 및 log2(변화 배수) = 360.78

ermE*: 9.7·10^-4 [L·g^-1·min^-1] 및 log2(변화 배수) = 291.03

katE: 5.1·10^-4 [L·g^-1·min^-1] 및 log2(변화 배수) = 342.51

moeE5: 9.7·10^-4 [L·g^-1·min^-1] 및 log2(변화 배수) = 329.32

gapDH: 11.5·10^-4 [L·g^-1·min^-1] 및 log2(변화 배수) = 931.45, 및

actP: 22.9·10^-4 [L·g^-1·min^-1].

"중간 정도의 강한 프로모터"는 글루쿠로니다제 검정에서 적어도 1·10^-4 [L·g^-1·min^-1]의 정규화된 글루쿠로니다제 활성을 초래하고/거나 프로모터가 없는 pGUS 대조군 벡터와 비교하여 gusA 유전자의 10배 상대적 전사 (log2(변화 배수))를 초래하는 프로모터로서 정의된다. 그 예는 하기의 프로모터를 포함한다:

efp: 3.1·10^-4 [L·g^-1·min^-1] 및 log2(변화 배수) = 53.08

cdaR: 3.1·10^-4 [L·g^-1·min^-1] 및 log2(변화 배수) = 86.82

rpsL: 3.5·10^-4 [L·g^-1·min^-1] 및 log2(변화 배수) = 98.53

rpsJ: 3.7·10^-4 [L·g^-1·min^-1] 및 log2(변화 배수) = 123.97

cgt: 2.5·10^-4 [L·g^-1·min^-1] 및 log2(변화 배수) = 347.29, 및

tipA: 4.2·10^-4 [L·g^-1·min^-1] 및 log2(변화 배수) = 191.

일부 경우에, 중간 정도의 강한 프로모터는 글루쿠로니다제 검정에서 적어도 1·10^-4 [L·g^-1·min^-1] 및 최대 5·10^-4 [L·g^-1·min^- ¹]의 정규화된 글루쿠로니다제 활성을 초래한다.

"약한 프로모터"는 1·10^-4 [L·g^-1·min^-1] 미만의 정규화된 글루쿠로니다제 활성을 초래하고/거나 프로모터가 없는 pGUS 대조군 벡터와 비교하여 10배 미만의 상대적 전사를 초래하는 프로모터로서 정의된다.

용어 "Cgt" (ACSP50_5024, 이전명: ACPL_5091)는 세포외 작은 탄수화물 결합 단백질을 지칭하며, 이전에는 악티노플라네스 종, 예를 들어 균주 ATCC 31044 / CBS 674.73 / SE50/110으로부터 수득된, 시클로덱스트린 글리코실트랜스퍼라제의 C-말단 도메인과의 높은 유사성으로 인해 시클로말토덱스트린 글루카노트랜스퍼라제로서 기재되었다. Cgt 단백질은 유전자 cgt에 의해 코딩된다. 서열(들)은 본원에 기재되어 있거나 (서열식별번호: 20) 또는 유니프롯 식별자 G8S155 (G8S155_ACTS5)를 통해 액세스할 수 있다. 상이한 균주에 대해 상이한 이소형 및 변이체가 존재할 수 있고 모두 상기 용어에 포함된다. 특이적 돌연변이가 초기 서열의 기재된 촉매적 특성을 변경하지 않고 교환될 수 있는 경우, 그러한 기능적으로 침묵하는 돌연변이를 갖는 서열이 초기 서열과 관련하여 동등하다는 것은 명백하다. 또한, 단백질은 더욱이, 다양한 변형, 예를 들어 합성 또는 자연적으로 발생하는 변형의 대상이 될 수 있다.

용어 "AcbB" (ACSP50_3608, 이전명: ACPL_3681)는 악티노플라네스 종, 예를 들어 균주 ATCC 31044 / CBS 674.73 / SE50/110으로부터 수득된 dTDP-D-글루코스-4,6-데히드라타제를 지칭하며, 이는 아마도 아카르보스의 아카르비오스 모이어티의 생합성에 관여할 것이다. AcbB 단백질은 유전자 acbB에 의해 코딩된다. 서열(들)은 본원에 기재되어 있거나 (서열식별번호: 13) 또는 유니프롯 식별자 Q9ZAE8 (RMLB_ACTS5)을 통해 액세스할 수 있다. 상이한 균주에 대해 상이한 이소형 및 변이체가 존재할 수 있고 모두 상기 용어에 포함된다. 특이적 돌연변이가 초기 서열의 기재된 촉매적 특성을 변경하지 않고 교환될 수 있는 경우, 그러한 기능적으로 침묵하는 돌연변이를 갖는 서열이 초기 서열과 관련하여 동등하다는 것은 명백하다. 또한, 단백질은 더욱이, 다양한 변형, 예를 들어 합성 또는 자연적으로 발생하는 변형의 대상이 될 수 있다.

용어 "GtaB" 또한 "GalU" (ACSP50_7820, 이전명: ACPL_7811)는 악티노플라네스 종, 예를 들어 균주 ATCC 31044 / CBS 674.73 / SE50/110으로부터 수득된 UTP-글루코스-1-포스페이트 우리딜릴트랜스퍼라제를 지칭한다. GtaB는 글루코스-1P와 UDP-글루코스의 상호 전환을 촉매하는 것으로 보이며 아카르보스에 대한 전구체 공급에 관여할 수 있다. GtaB 단백질은 유전자 gtaB에 의해 코딩된다. 서열(들)은 본원에 기재되어 있거나 (서열식별번호: 19) 또는 유니프롯 식별자 G8S608 (ACPL_7811)을 통해 액세스할 수 있다. 상이한 균주에 대해 상이한 이소형 및 변이체가 존재할 수 있고 모두 상기 용어에 포함된다. 특이적 돌연변이가 초기 서열의 기재된 촉매적 특성을 변경하지 않고 교환될 수 있는 경우, 그러한 기능적으로 침묵하는 돌연변이를 갖는 서열이 초기 서열과 관련하여 동등하다는 것은 명백하다. 또한, 단백질은 더욱이, 다양한 변형, 예를 들어 합성 또는 자연적으로 발생하는 변형의 대상이 될 수 있다.

본원에 정의된 바와 같이, "카로티노이드 합성에 필수적인 유전자"는 카로티노이드의 합성에 긍정적으로 필요한 유전자로서 정의된다. 악티노플라네스는 클래스 카로티노이드의 황색, 주황색 및 분홍색 색소를 비롯한 다양한 가용성 색소를 생산하는 것으로 공지되 있다. 악티노플라네스에서, 카로티노이드 합성에 필수적인 유전자 세트는 MEP/DOXP 경로로부터의 유전자, 테르펜 클러스터 1의 유전자, 테르펜 클러스터 2a의 유전자, 테르펜 클러스터 2b의 유전자 및 캄펜-유사 모노테르펜 생합성 테르펜 클러스터 3의 유전자를 포함한다. MEP / DOXP 경로의 유전자는 하기를 포함한다:

i. 1-데옥시-D-크실룰로스-5-포스페이트 신타제 유전자 dxs (ACSP50_7096, 서열식별번호: 23),

ii. 4-히드록시-3-메틸부트-2-엔-1-일 디포스페이트 신타제 유전자 ispG (ACSP50_7248, 서열식별번호: 24),

iii. 1-데옥시-D-크실룰로스-5-포스페이트 리덕토이소머라제 유전자 dxr (ACSP50_7250, 서열식별번호: 25),

iv. 4-히드록시-3-메틸부트-2-에닐 디포스페이트 리덕타제 유전자 ispH (ACSP50_7707, 서열식별번호: 26),

v. 4-(시티딘 5'-디포스포)-2-C-메틸-D-에리트리톨 키나제 유전자 ispE (ACSP50_7802, 서열식별번호: 27),

vi. 2-C-메틸-D-에리트리톨 2;4-시클로디포스페이트 신타제 유전자 ispF, ACSP50_8046, 서열식별번호: 28), 및/또는

vii. 2-C-메틸-D-에리트리톨 4-포스페이트 시티딜릴트랜스퍼라제 유전자 ispD (ACSP50_8047, 서열식별번호: 29).

테르펜 클러스터 1의 유전자는 하기를 포함한다:

i. 이소펜테닐-디포스페이트 델타-이소머라제 유전자 idi (ACSP50_0146, 서열식별번호: 30),

ii. 제타-피토엔 데새투라제 유전자 crtI (ACSP50_0147, 서열식별번호: 10),

iii. 폴리프레닐 신테타제 유전자 crtE/ldsA (ACSP50_0148, 서열식별번호: 31),

iv. 피토엔 신타제 유전자 crtB (ACSP50_0149, 서열식별번호: 32),

v. 데옥시리보디피리미딘 포토-리아제 유전자 (ACSP50_0150, 서열식별번호: 33), 또는

vi. 피리딘 뉴클레오티드-디술피드 옥시도리덕타제 유전자 (ACSP50_0151, 서열식별번호: 34).

테르펜 클러스터 2a의 유전자는 하기를 포함한다:

i. 전사 조절인자 유전자 (ACSP50_1631, 서열식별번호: 35),

ii. 리코펜 시클라제 유전자 (ACSP50_1632, 서열식별번호: 36),

iii. 리코펜 시클라제 유전자 (ACSP50_1633, 서열식별번호: 37),

iv. 폴리프레닐 신테타제 (파르네실 피로포스페이트 신테타제 2 유전자 fps2/crtE (ACSP50_1634, 서열식별번호: 38), 및

v. 메틸렌테트라히드로폴레이트 리덕타제 (NADPH) 유전자 (ACSP50_1635, 서열식별번호: 39).

테르펜 클러스터 2b의 유전자는 하기를 포함한다:

i. LysR-패밀리 전사 조절인자 유전자 (ACSP50_1650, 서열식별번호: 40),

ii. 메틸트랜스퍼라제 유형 11 유전자 (ACSP50_1651, 서열식별번호: 41),

iii. CDP-알콜포스파티딜트랜스퍼라제 pgsA (ACSP50_1652, 서열식별번호: 42),

iv. 제타-피토엔 데새투라제 (crtI-패밀리) 유전자 crtD (ACSP50_1653, 서열식별번호: 43),

v. 글리코실 트랜스퍼라제 유전자 cruC (ACSP50_1654, 서열식별번호: 44),

vi. 가상 단백질 (추정 막 단백질) 유전자 cruF, (ACSP50_1655, 서열식별번호: 45),

vii. GCN5 패밀리 아세틸트랜스퍼라제 유전자 (ACSP50_1656, 서열식별번호: 46),

viii. 모노옥시게나제 유전자 (ACSP50_1657, 서열식별번호: 47), 및

ix. 단쇄 데히드로게나제 유전자 (ACSP50_1658, 서열식별번호: 48).

카로티노이드 합성에 필수적인 또 다른 유전자는 폴리프레닐 신테타제 유전자 crtE (ACSP50_3873, 서열식별번호: 49)이다.

캄펜 -유사 모노테르펜 생합성 테르펜 클러스터 3의 유전자는 하기를 포함한다:

i. 전사 조절인자 (Crp/Fnr 패밀리) 유전자 eshA (ACSP50_1949, 서열식별번호: 104),

ii. 캄펜 신타제 유전자 (ACSP50_1950, 서열식별번호: 50),

iii. 메틸트랜스퍼라제 (SAM-의존성) 유형 11 유전자 (ACSP50_1951, 서열식별번호: 105),

iv. 글리코실-히드롤라제 유전자 (ACSP50_1952, 서열식별번호: 106), 및

v. 옥시도리덕타제/알도/케토리덕타제 (ACSP50_1953, 서열식별번호: 107).

실시양태

악티노미세탈레스 균주 악티노플라네스 종 SE50/110이 본 발명에 대한 모델 균주로서 사용되었지만, 일반적인 메커니즘 및 발견은 다른 아카르보스 생산 균주, 예컨대 현재 아카르보스의 상업적 생산을 위해 사용되고 있는 아카르보스 생산 균주에 적용될 수 있다는 것은 통상의 기술자에게 명백하다. 일부 실시양태에 따르면, 악티노미세탈레스 균주는 미크로모노스포라세아에 균주이다. 일부 실시양태에 따르면, 악티노미세탈레스 균주는 악티노플라네스 균주이다. 일부 실시양태에 따르면, 악티노미세탈레스 균주는 악티노플라네스 SE50 (ATCC 31042, CBS 961.70) (Frommer et al. 1973), 악티노플라네스 종 SE50/110 (ATCC 31044, CBS 674.73) 또는 그의 유래된 악티노플라네스 균주이다. 일부 실시양태에서, 악티노미세탈레스 균주는 아카르보스 생산을 위해 상업적으로 사용되고 있는 악티노플라네스 균주이다. 일부 실시양태에서, 악티노미세탈레스 균주는 아카르보스 생산을 위해 상업적으로 사용되고 있는 악티노플라네스 균주, 예컨대 예를 들어, EP 2601209 B1 및 CN103298828 B에 개시된 바와 같은 SN223-29-47, C445-P47, SN12755-38, SC3687-18-43, SC7177-40-17 또는 SN19910-37-21, 또는 그의 유래된 균주이다.

아카르보스 생산의 개선은 특이적 시간 (전체적으로 또는 세포 성장에 비례하여)에 걸친 아카르보스 수율의 증가 및/또는 아카르보스의 순도의 개선, 예를 들어 부산물 및/또는 아카르보스 유사체 예컨대 성분 C의 감소를 지칭한다. 악티노플라네스 균주의 배양은 관련 기술분야에 공지된 바와 같이 또는 본원에 기재된 바와 같이 일어날 수 있다. 일부 실시양태에서, 악티노플라네스 균주의 배양은 말토스 최소 배지에서 발생한다.

본 발명의 제1 측면에 따르면, 아카르보스의 개선된 생산을 위해 악티노미세탈레스 균주, 예컨대 악티노플라네스 균주를 조작하는 방법이 제공된다.

제1 측면에 따른 일부 제1 실시양태에 따르면, 제1 측면에 따른 방법은 세포외 작은 탄수화물 결합 단백질 Cgt (서열식별번호: 20)의 발현 부재 또는 감소를 위해 악티노미세탈레스 균주를 조작하는 것을 포함한다.

놀랍게도, 탄수화물 결합 단백질 Cgt (서열식별번호: 20)의 결실은 아카르보스의 개선된 생산을 초래하였다. 8.3% 내지 16.6%의 최종 아카르보스 수율 증가가 3개의 독립적인 진탕 플라스크 배양에서 달성되었다 (예시 "Δcgt는 말토스 최소 배지에서 아카르보스의 개선된 형성을 표시한다", 도 18, 도 19, 표 E10, 표 E11 참조).

더욱이, 야생형과 비교하여, 유전자 결실 돌연변이체 Δcgt는 상이한 탄소 공급원 또는 탄소 제한 조건 하에서 (예시 "상이한 탄소 공급원에서 성장하는 동안 cgt 발현의 분석", "상이한 탄소 공급원 또는 탄소 제한 조건 하에서의 Δcgt ", 도 12, 도 13, 도 14 참조) 또는 pH 및 삼투질 스트레스 하에서 (예시 "Δcgt는 오스몰농도 내성 또는 pH 내성에 영향을 미치지 않는다", 도 15, 도 16, 도 17 참조) 테스트하는 스크리닝 실험에서 명백한 성장 표현형을 나타내지 않았다. 더욱이, 본 발명자들은 cgt의 결실이 아카르보스 생합성 유전자의 발현에 부정적인 영향을 미치지 않았다는 것을 제시할 수 있었다 (예시 "Δcgt는 아카르보스 생합성 유전자의 발현에 영향을 미치지 않는다", 도 20 참조).

이론에 얽매이는 것은 아니지만, Cgt는 세포외 프로테옴 (Wendler et al. 2013; Ortseifen 2016) 및 트랜스크립톰 (Schwientek et al. 2013)에 대한 포괄적인 연구에 따르면 악티노플라네스 종 SE50/110에서 고도로 발현되는 것으로 밝혀졌다. 그의 유전자 산물은 분비된 전체 프로테옴의 약 8%를 차지하는 세포외 공간으로 유출된다. 본 발명자들은 BlastP 분석에 의해 원핵생물 세계에서 CBM-20 단일-도메인 단백질의 분포를 분석하였다. 흥미롭게도, 단일 CBM-20 도메인 단백질은 17개의 다른 종에서만 발견되었다 (예시 "유박테리아 세계에서 단일 도메인 CBM -20 단백질의 분포" 참조). 이들 중 대부분은 악티노미세탈레스 목의 종, 예를 들어 악티노플라네스 속의 모든 균주에서 발견된다. 이론에 얽매이는 것은 아니지만, cgt의 결실 또는 감소된 발현에 의해, 에너지 및 자원, 예컨대 ATP 및 아미노산이 구제된다. 그런 다음 이러한 자원은 성장 관련 산물인 아카르보스 생합성으로 리디렉션될 수 있다.

제1 측면에 따른 일부 실시양태에 따르면, 상기 방법은 세포외 작은 탄수화물 결합 단백질 Cgt (서열식별번호: 20)를 코딩하는 유전자의 결실 또는 돌연변이를 포함한다. 속간 접합 시스템 (Gren et al. 2016)과 CRISPR/Cas9 기술 (Wolf et al. 2016)의 확립으로 악티노플라네스 종 SE50/110에서의 게놈 편집이 가능해진다. 제1 측면에 따른 일부 실시양태에서, 발현 부재 또는 감소를 위해 악티노미세탈레스 균주를 조작하는 것은 CRISPR/Cas9 기술을 사용하여 발생할 수 있다. 일부 실시양태에서, 발현 부재 또는 감소를 위해 악티노미세탈레스 균주를 조작하는 것은 문헌 [Wolf et al. 2016]에 기재된 바와 같이 발생할 수 있다. 일부 실시양태에서, 발현 부재 또는 감소를 위하여 악티노미세탈레스 균주를 조작하는 것은 본원에 기재된 바와 같이, 예를 들어 예시 "CRISPR / Cas9 기술에 의한 유전자 cgt의 결실" 또는 "시토신 데아미나제 CodA와의 상동 재조합 및 역선택에 기초한 결실 시스템"에 기재된 바와 같이 발생할 수 있다.

예를 들어, 본 발명자들은 문헌 [Zhao et al. (2017)]에 기재된 바와 같이, 인테그라제가 없는 벡터 백본과 역선택을 위해 CodA를 사용하는 상동 재조합을 통해 신규 결실 시스템을 성공적으로 확립하였다.

제1 측면에 따른 일부 제2 실시양태에 따르면, 제1 측면에 따른 방법은 카로티노이드 합성에 필수적인 적어도 하나의 유전자의 발현 부재 또는 감소를 위해 악티노미세탈레스 균주를 조작하는 것을 포함한다. 일부 실시양태에서, 카로티노이드는 악티노플라네스 또는 그의 유도체의 주황색 색소이다. 일부 상이하거나 동일한 실시양태에서, 카로티노이드는 C40-카로티노이드이다.

발현 부재 또는 감소를 위해 악티노미세탈레스 균주를 조작하는 것은 본 측면에 대해 이전에 기재된 바와 같이 발생할 수 있다. 제1 측면에 따른 일부 실시양태에 따르면, 상기 방법은 카로티노이드 합성에 필수적인 유전자의 결실 또는 돌연변이를 포함한다.

악티노플라네스는 클래스 카로티노이드의 황색, 주황색 및 분홍색 색소를 비롯한 다양한 가용성 색소를 생산하는 것으로 공지되 있다 (Parenti and Coronelli 1979). 본 발명자들은 강한 색소침착이 아카르보스 생산 손실과 관련되어 있음을 관찰하였다. 이것은 빛에 노출된 경우 및 빛으로부터 가려진 경우의 배양물의 성장과 아카르보스 수율을 비교함으로써 확증되었다 (예시 "광-의존성 카로티노이드 형성 및 산화적 스트레스는 악티노플라네스 종 SE50/110에서 아카르보스 생산을 감소시킨다", 도 22 참조). 카로티노이드 형성이 유도되긴 하지만, 악티노플라네스 종 SE50/110이 전구 빛에 노출되었을 때, 이의 아카르보스 생산 및 성장이 크게 감소되었다 (도 22). 전체적으로, 최종 아카르보스 농도의 39% 손실이 모니터링되었다.

이러한 발견으로부터, 생산된 색소가 필수적이지 않을 뿐만 아니라 (예를 들어, 상업적인 아카르보스 생산을 위한 기술 설정에서) 악티노플라네스에서 카로티노이드 합성을 감소 또는 고갈시키는 것이 아카르보스 형성을 개선시키는 데 사용될 수 있다는 것이 타당하다. 이를 위해, 제1 측면에 따른 방법은 카로티노이드 합성에 필수적인 적어도 하나의 유전자의 발현을 감소 또는 고갈시키는 것을 포함한다.

본 발명자들은 더욱이, 악티노플라네스 종 SE50/110에서의 카로티노이드 생합성을 재구축할 수 있었다 (예시 "카로티노이드 형성의 기능적 관련성 분석", 도 21 참조). 악티노플라네스에서의 카로티노이드 합성에 필수적인 유전자 세트는 MEP/DOXP 경로로부터의 유전자, 테르펜 클러스터 1의 유전자, 테르펜 클러스터 2a의 유전자, 테르펜 클러스터 2b의 유전자, 캄펜-유사 모노테르펜 생합성 테르펜 클러스터 3의 유전자를 포함한다.

본 측면 및 실시양태에 따른 일부 실시양태에 따르면, 카로티노이드 합성에 필수적인 적어도 하나의 유전자는 MEP/DOXP 경로의 유전자, 예컨대 하기이다:

본 측면 및 실시양태에 따른 일부 실시양태에 따르면, 카로티노이드 합성에 필수적인 적어도 하나의 유전자는 테르펜 클러스터 1의 유전자, 예컨대 하기이다:

iv. 피토엔 신타제 유전자 crtB (ACSP50_0149, 서열식별번호: 32),

본 측면 및 실시양태에 따른 일부 실시양태에 따르면, 카로티노이드 합성에 필수적인 적어도 하나의 유전자는 제타-피토엔 데새투라제 유전자 crtI (ACSP50_0147, 서열식별번호: 10)이다. 앞서 논의된 바와 같이, 카로티노이드 형성은 실험실 조건에서 필수적이다. 아카르보스 생산을 개선시키기 위해, 특히 중앙 유전자 crtI의 결실에 의해 공동 카로티노이드 생합성 경로를 차단하는 것이 균주 개발을 위해 사용될 수 있다.

본 측면 및 실시양태에 따른 일부 실시양태에 따르면, 카로티노이드 합성에 필수적인 적어도 하나의 유전자는 테르펜 클러스터 2a의 유전자, 예컨대 하기이다:

i. 전사 조절인자 유전자 (ACSP50_1631, 서열식별번호: 35),

ii. 리코펜 시클라제 유전자 (ACSP50_1632, 서열식별번호: 36),

iii. 리코펜 시클라제 유전자 (ACSP50_1633, 서열식별번호: 37),

iv. 폴리프레닐 신테타제 (파르네실 피로포스페이트 신테타제 2 유전자 fps2/crtE (ACSP50_1634, 서열식별번호: 38), 또는

본 측면 및 실시양태에 따른 일부 실시양태에 따르면, 카로티노이드 합성에 필수적인 적어도 하나의 유전자는 테르펜 클러스터 2b의 유전자, 예컨대 하기이다:

viii. 모노옥시게나제 유전자 (ACSP50_1657, 서열식별번호: 47), 또는

본 측면 및 실시양태에 따른 일부 실시양태에 따르면, 카로티노이드 합성에 필수적인 적어도 하나의 유전자는 폴리프레닐 신테타제 유전자 crtE (ACSP50_3873, 서열식별번호: 49)이다.

본 측면 및 실시양태에 따른 일부 실시양태에 따르면, 카로티노이드 합성에 필수적인 적어도 하나의 유전자는 캄펜-유사 모노테르펜 생합성 테르펜 클러스터 3의 유전자, 예컨대 하기이다:

ii. 캄펜 신타제 유전자 (ACSP50_1950, 서열식별번호: 50),

iv. 글리코실-히드롤라제 유전자 (ACSP50_1952, 서열식별번호: 106), 또는

카로티노이드는 막의 유동성에 영향을 미치므로, 카로티노이드의 결여, 특히 C40-카로티노이드의 결여는 악티노플라네스 종 SE50/110의 표면 및 균사체 구조에 영향을 미칠 수도 있다. 균사체 덩어리의 생산 분열과 관련하여, 균사체 표면과 생화학적으로 이용가능한 세포의 수를 증가시키는 것이 유리하다.

일부 추가 실시양태에 따르면, 제1 측면에 따른 방법은 MerR-/HTH-전사 조절인자 유전자 merR (ACSP50_0145, 서열식별번호: 11)의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것을 포함한다. 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것은 본원의 다른 곳에 기재된 바와 같이 발생할 수 있다.

카로티노이드 합성에 필수적인 것으로 언급된 유전자들 외에도, 본 발명자들은 놀랍게도 테르펜 클러스터 1의 유전자 중에서 카로티노이드 합성을 위한 전사 억제인자를 확인하였다: ACSP50_0145 (서열식별번호: 11, MerR-/HTH-전사 조절인자 유전자 merR) (예시 "SE50/110에서의 merR의 결실은 빛에 노출되지 않고 카로티노이드 형성을 유도한다", 도 24 참조). SE50/110에서 상응하는 유전자의 CRISPR/Cas9 결실에 의해, 카로티노이드 형성은 빛에 노출되지 않고 강하게 유도되었다 (도 24b 및 c). 이와 일치하여, 아카르보스 생산이 감소된 것으로 밝혀졌다. 조명을 받으면, 야생형과 ΔmerR 둘 다가 강하게 착색되고 최종 아카르보스 농도는 균주 둘 다에서 유사하며, 대략 0.52 g·L^-1에 도달하였다 (도 24b 및 d). 이것은 어두운 조건 하에서의 야생형 (0.83 g·L^-1에 도달)과 비교하여 대략 38%의 아카르보스 형성의 감소에 상응한다. 이것은 야생형의 이전 성장 실험에 따른 것이다.

어두운 조건 하에서, ΔmerR은 야생형보다 대략 15% 더 적은 아카르보스를 생산한다 (0.70 g·L^-1) (도 24d). 이론에 얽매이는 것은 아니지만, 이러한 생산 손실은 결실 돌연변이체에서 카로티노이드 형성에 의한 자원 낭비로 인해 야기된 것으로 추정된다 (도 24c). 결론적으로, 밝은 조건 하에서의 생산 손실 (38-39%)은 결실 돌연변이체와 야생형 둘 다에서 추가의 광 유발 스트레스로 할당될 수 있다.

제1 측면에 따른 일부 제3 실시양태에 따르면, 상기 방법은 dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것을 포함한다.

본 발명에 따르면 놀랍게도, dTDP-D-글루코스-4,6-데히드라타제 AcbB를 코딩하는 acb 유전자의 과다발현이 최종 아카르보스 농도를 대략 50%만큼 상당히 증가시키는 것으로 밝혀졌다. Acb 클러스터, 예컨대 AcbC의 다른 유전자는 아카르보스의 개선된 형성을 초래하지 않았기 때문에, 이것은 특히 놀라운 일이었다. 더욱이, 관찰된 증가는 문헌 [Zhao, Xie, et al. 2017]에 기재된 바와 같이 전체 Acb 클러스터의 과다발현에 대해 관찰된 증가와 비교하여 우수하였다.

일부 실시양태에 따르면, 상기 균주는 AcbA를 제외한 Acb 클러스터의 다른 유전자의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것을 포함하지 않는다.

dTDP-D-글루코스-4,6-데히드라타제 AcbB는 아카르보스 생합성의 피딩 경로인 D-글루코스-1P로부터 활성화된 아미노 당의 생성에 관여하는 것으로 보인다 (도 1): 이론에 얽매이는 것은 아니지만, 증가된 AcbB 활성은 놀랍게도, 변형된 전구체의 공급을 또한 개선시키는 것으로 밝혀졌다.

본원에 기재된 바와 같은 AcbB의 과다발현은 야생형 또는 명시된 참조 균주 / 대조군과 비교하여 AcbB에 대한 발현의 증가를 지칭한다. 예를 들어, 유전자 산물의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안의 증가 또는 임의의 다른 시간 동안의 증가일 수 있다.

바람직하게는, 본원에 기재된 바와 같이, AcbB의 과다발현은 대조군과 비교하여 적어도 1.5의 인자 또는 적어도 2의 인자만큼의 AcbB 전사체 및/또는 단백질의 증가를 지칭한다. AcbB 전사체 양과 관련하여 본원에서 달리 정의되지 않는 경우, 강한 과다발현은 log2(변화 배수) > 6을 지칭한다. AcbB 전사체 양과 관련하여 본원에서 달리 정의되지 않는 경우, 중간 정도의 강한 과다발현은 log2(배수 변화) ≥ 2 및 ≤ 6을 지칭한다.

일부 실시양태에 따르면, dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안 적어도 1.5 또는 적어도 2의 log2(변화 배수) 인자만큼의 AcbB 전사체 및/또는 단백질의 발현 증가 또는 임의의 다른 시간 동안의 증가이다.

일부 실시양태에 따르면, dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안 log2(변화 배수) ≥ 2 및 ≤ 6만큼의 AcbB 전사체 및/또는 단백질의 발현 증가 또는 임의의 다른 시간 동안의 증가, 예컨대 초기 성장기 동안 및/또는 선형 성장기 동안의 증가이다.

일부 실시양태에 따르면, dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안 log2(변화 배수) > 3 및 < 5만큼의 AcbB 전사체 및/또는 단백질의 발현 증가 또는 임의의 다른 시간 동안의 증가이다.

일부 실시양태에 따르면, dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안 log2(변화 배수) > 6만큼의 AcbB 전사체 및/또는 단백질의 발현 증가 또는 임의의 다른 시간 동안의 증가이다.

이종 프로모터를 포함하는 발현 벡터가 있는 과다발현 돌연변이체에서, acbB의 상대적 전사는 pSETT4tip::acbB (중간 정도의 강한 프로모터)에서 두 샘플링 시간 사이에 4.06배에서 3.33배 (log2(변화 배수))로 감속되었고, pSETT4gap::acbB (강한 프로모터)에서는 6.54배에서 2.05배로 감속되었다 (예시 "acbB의 중간 정도의 과다발현은 개선된 아카르보스 형성을 초래한다" 참조).

일부 실시양태에 따르면, 제1 측면에 따른 유전자의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것은 관련 기술분야에 공지되거나 본원에 기재된 임의의 방법에 의해 발생될 수 있다.

예시 "acbB의 중간 정도의 과다발현은 개선된 아카르보스 형성을 초래한다"에 기재된 바와 같이, acbB가 중간 정도의 강한 tipA-프로모터 또는 강한 gapDH-프로모터의 제어 하에 전사되는 2개의 pSETT4-기반 과다발현 돌연변이체가 생성되었다. 천연 프로모터가 대조군으로서 pSET152-벡터 및 pSETT4-벡터 배경 둘 다에 사용되었다. 특히, 이종 tipA-프로모터의 제어 하에 전사된 acbB를 갖는 돌연변이체는 대조군 균주와 비교하여 증강된 아카르보스 생산을 나타냈다 (도 27, 도 28). 수율 계수는 빈 벡터 대조군과 비교하여 48.6 및 51.9%로 증가되었다. 강한 gapDH-프로모터를 사용하면, 아카르보스 수율 계수가 약간 증가하는 것으로 밝혀졌다 (도 28).

일부 실시양태에 따르면, 제1 측면에 따른 유전자의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것은 AcbB (서열식별번호: 13)에 대한 발현 카세트를 포함하는 벡터를 악티노미세탈레스 균주 내로 도입함으로써 발생할 수 있다. 일부 실시양태에서, 발현 벡터는 pSET152로부터 유래된다. 일부 실시양태에서, 발현 벡터는 pSETT4로부터 유래된다. 벡터는 제2 벡터의 적어도 1개, 2개, 3개, 4개의 요소를 포함하는 경우에, 또 다른 벡터로부터 유래된다.

일부 실시양태에 따르면, 제1 측면에 따른 유전자의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것은 AcbB (서열식별번호: 13)에 대한 발현 카세트를 포함하는 벡터를 악티노미세탈레스 균주 내로 도입함으로써 발생할 수 있다. 이들 또는 다른 실시양태의 일부에서, 발현 카세트는, 예를 들어 본원의 다른 곳에 기재된 바와 같은 글루쿠로니다제 검정에서 적어도 1 x 10^-4, 바람직하게는 1 x 10^-4 내지 5 x 10^-4 [L·g^-1·min^- ¹]의 정규화된 글루쿠로니다제 활성을 특징으로 하는, 중간 정도의 강한 프로모터의 제어 하에 있다. 일부 실시양태에서 상기 프로모터는 efp 프로모터 (서열식별번호: 92), cdaR 프로모터 (서열식별번호: 97), rpsL 프로모터 (서열식별번호: 99), rpsJ 프로모터 (서열식별번호: 93), cgt 프로모터 (서열식별번호: 91), 또는 tipA 프로모터 (서열식별번호: 81)로부터 선택된다. 일부 실시양태에서 프로모터는 tipA 프로모터 (서열식별번호: 81)이다. pSETT4tip::acbB를 사용하여 아카르보스 생산에 대한 우수한 결과를 수득하였다 (도 27, 도 28 참조).

일부 실시양태에서 발현 카세트는, 예를 들어 본원의 다른 곳에 기재된 바와 같은 글루쿠로니다제 검정에서 적어도 5 x 10^-5 [L·g^-1·min^- ¹]의 정규화된 글루쿠로니다제 활성을 특징으로 하는, 강한 프로모터의 제어 하에 있다. 일부 실시양태에서 상기 프로모터는 apm 프로모터 (서열식별번호: 96), ermE* 프로모터 (서열식별번호: 98), katE 프로모터 (서열식별번호: 94), moeE5 프로모터 (서열식별번호: 95) 또는 gapDH 프로모터 (서열식별번호: 82)로부터 선택된다.

일부 실시양태에 따르면, 제1 측면에 따른 방법은 dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13) 및 임의적으로 AcbA (서열식별번호: 12)의 중간 정도의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것을 포함한다. 달리 명시적으로 언급되지 않는 한 본원에 기재된 다른 모든 실시양태와 또한 양립가능한 일부 실시양태에서, 유전적 조작은 AcbB 및 AcbA 이외의 Acb 유전자에 대해 log2(변화 배수) ≥ 2만큼의 전사체 및/또는 단백질의 증가를 초래하지 않는다. 본원에 기재된 다른 모든 실시양태와 또한 양립가능한 일부 실시양태에서, 유전적 조작은 AcbC에 대해 log2(변화 배수) ≥ 2만큼의 전사체 및/또는 단백질의 증가를 초래하지 않는다.

AcbB의 과다발현 시, acb 유전자 클러스터의 추가 유전자는 acbA 및 acbV에 대해 제시된 것처럼, 예를 들어 초기 성장기에서 유의하게 영향을 받지 않았다 (도 30). 유일한 예외는 pSETT4tip::acbB에서 acbA의 전사 풍부도가 약간 더 높다는 것이다 (log2(변화 배수) = 1.87).

일부 실시양태에 따르면, 제1 측면에 따른 방법은 AcbB (서열식별번호: 13) 및 AcbS (ACSP50_3596) 및/또는 AcbI (ACSP50_3599)의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것을 포함한다.

AcbS 및/또는 AcbI의 (부가의) 과다발현에 의해, 아미노 당의 시클리톨 전구체로의 전이 반응이 강화될 수 있다. 본 발명의 모델 (도 1 참조)에 따르면, 이러한 반응은 AcbS (ACSP50_3596) 또는 AcbI (ACSP50_3599)에 의해 촉매된다.

일부 실시양태에 따르면, 제1 측면에 따른 방법은 AcbB (서열식별번호: 13) 및 AcbCUJ (AcbC (ACSP50_3607) 및/또는 AcbU (ACSP50_3595) 및/또는 AcbJ (ACSP50_3600)) 및/또는 AcbSI (AcbS (ACSP50_3596) 및/또는 AcbI (ACSP50_3599))의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것을 포함한다. 이론에 얽매이는 것은 아니지만, 이러한 조합은 아카르보스 합성 가닥 둘 다를 그럴듯하게 보강시킬 수 있다.

제1 측면에 따른 일부 제4 실시양태에 따르면, 상기 방법은 UDP-글루코스-1P 우리딜트랜스퍼라제 GtaB (서열식별번호: 19)의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것을 포함한다.

gtaB의 중간 정도의 과다발현에 의해, 최종 아카르보스 농도의 8.5% 증가가 관찰되었으며, 예시 "gtaB의 중간 정도의 과다발현은 개선된 아카르보스 형성으로 이어진다", 도 32, 도 33을 참조한다. 흥미롭게도, 아카르보스 형성은 후기 선형 내지 정지 성장기에서 특히 증가한다 (도 32). 이론에 얽매이는 것은 아니지만, 이는 전구체 글루코스-1P의 개선된 전개로부터의 결과일 수 있다 (도 34 참조).

본원에 기재된 바와 같은 GtaB (서열식별번호: 19)의 과다발현은 야생형 또는 명시된 참조 균주 / 대조군과 비교하여 GtaB 전사체 및/또는 단백질에 대한 발현의 증가를 지칭한다. 예를 들어, 유전자 산물의 과다발현은 초기 성장기 동안 및/또는 선형 성장기 동안 및/또는 정지기 동안의 증가 및/또는 임의의 다른 시간 동안의 증가일 수 있다.

바람직하게는, 과다발현은 대조군과 비교하여 적어도 1.5의 인자 또는 적어도 2의 인자만큼의 GtaB 전사체 및/또는 단백질의 증가이다. GtaB 전사체 양과 관련하여 본원에서 달리 정의되지 않는 경우, 강한 과다발현은 log2(변화 배수) > 6을 지칭한다. GtaB 전사체 양과 관련하여 본원에서 달리 정의되지 않는 경우, 중간 정도의 강한 과다발현은 log2(변화 배수) ≥ 2 및 ≤ 6을 지칭한다.

일부 실시양태에 따르면 UDP-글루코스-1P 우리딜트랜스퍼라제 GtaB의 과다발현은 초기 성장기 동안 및/또는 선형 성장기 동안 및/또는 정지기 동안 적어도 1.5 또는 적어도 2의 log2(변화 배수) 인자만큼의 GtaB의 발현 증가 및/또는 임의의 다른 시간 동안의 증가이다.

본원에 기재된 과다발현 돌연변이체 중 하나에서, 유전자 gtaB의 상대적 전사체 양은 2.64배 증가된다 (log2(변화 배수)) (도 33).

일부 실시양태에 따르면 UDP-글루코스-1P 우리딜트랜스퍼라제 GtaB의 과다발현은 초기 성장기 동안 및/또는 선형 성장기 동안 및/또는 정지기 동안 log2(변화 배수) ≥ 2 및 ≤ 6만큼의 GtaB 전사체 및/또는 단백질의 발현 증가, 및/또는 임의의 다른 시간 동안의 증가이다. 일부 실시양태에 따르면 UDP-글루코스-1P 우리딜트랜스퍼라제 GtaB의 과다발현은 초기 성장기 동안 및/또는 선형 성장기 동안 및/또는 정지기 동안 log2(변화 배수) ≥ 3 및 ≤ 5만큼의 GtaB의 발현 증가, 및/또는 임의의 다른 시간 동안의 증가이다.

일부 실시양태에 따르면 UDP-글루코스-1P 우리딜트랜스퍼라제 GtaB의 과다발현은 초기 성장기 동안 및/또는 선형 성장기 동안 및/또는 정지기 동안 log2(변화 배수) ≥ 6만큼의 GtaB의 발현 증가이다.

일부 실시양태에 따르면, 제1 측면에 따른 유전자의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것은 GtaB (서열식별번호: 19)에 대한 발현 카세트를 포함하는 벡터를 악티노미세탈레스 균주 내로 도입함으로써 발생할 수 있다. 일부 실시양태에서, 발현 벡터는 pSET152로부터 유래된다. 일부 실시양태에서, 발현 벡터는 pSETT4로부터 유래된다. 벡터는 제2 벡터의 적어도 1개, 2개, 3개, 4개의 요소를 포함하는 경우에, 또 다른 벡터로부터 유래된다.

일부 실시양태에 따르면, 제1 측면에 따른 유전자의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것은 GtaB (서열식별번호: 19)에 대한 발현 카세트를 포함하는 벡터를 악티노미세탈레스 균주 내로 도입함으로써 발생할 수 있다.

이들 또는 다른 실시양태의 일부에서, 발현 카세트는, 예를 들어 본원의 다른 곳에 기재된 바와 같은 글루쿠로니다제 검정에서 1 x 10^-4 내지 5 x 10^-5 [L·g^-1·min^-1]의 정규화된 글루쿠로니다제 활성을 특징으로 하는, 중간 정도의 강한 프로모터의 제어 하에 있다. 일부 실시양태에서 상기 프로모터는 efp 프로모터 (서열식별번호: 92), cdaR 프로모터 (서열식별번호: 97), rpsL 프로모터 (서열식별번호: 99), rpsJ 프로모터 (서열식별번호: 93), cgt 프로모터 (서열식별번호: 91), 또는 tipA 프로모터 (서열식별번호: 81)로부터 선택된다. 일부 실시양태에서 프로모터는 tipA 프로모터 (서열식별번호: 81)이다. pSETT4tip::gtaB를 사용하여 아카르보스 생산에 대한 우수한 결과를 수득하였다 (도 32, 도 33 참조).

제1 측면의 일부 추가의 또는 동일한 실시양태에 따르면, 상기 방법은 dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13) 및 GtaB (서열식별번호: 19)의 중간 정도의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것을 포함한다.

놀랍게도 GtaB의 과다발현이 개선된 아카르보스 형성을 촉발하는 것으로 밝혀졌다. acbB의 중간 정도의 과다발현에 의해 (예를 들어, tipA-프로모터의 사용에 의함), 아카르보스 생산에 대한 긍정적인 효과가 관찰되어, 2가지 독립적인 배양에서 대략 50% 더 많은 아카르보스가 산출되었다. 따라서, 단일 acb 유전자 AcbB의 과다발현에 의한 아카르보스 생합성의 개선이 달성되었다. 더욱이, gtaB의 중간 정도의 과다발현에 의해, 최종 아카르보스 농도의 8.5% 증가가 관찰되었다. acbB와 gtaB의 조합된 과다발현에 의해, 아미노 당 생합성을 통한 플럭스가 개선되어 아카르보스 생산이 추가로 증강된다는 것은 타당하다.

이론에 얽매이는 것은 아니지만, AcbB의 강한 과다발현은 AcbB의 중간 정도의 강한 과다발현과 비교하여 단지 더 작은 아카르보스 생산 증가를 유도하였다. 이것은 AcbB의 대량 과다발현 시 발생하는 글루코스-포스페이트-대사에 있어서의 불균형 때문일 수 있다. gtaB의 과다발현은 이러한 불균형을 치유할 수 있으며, 따라서 acbB와 gtaB 둘 다의 조합된 과다발현은 아마도 아카르보스 생산에 있어서의 추가 증가로 이어질 것이다.

흥미롭게도, pSETT4tip::gtaB에서 질량 m/z = 545 [M-H+]의 상당히 감소된 양이 발견되었으며 (대략 48% 감소), 이는 AcbB의 제안된 산물인 dTDP-4-케토-6-데옥시-D-글루코스에 상응할 수 있다. 이것은 합성 가닥을 통한 흐름이 더 균형을 이루고 있음을 나타낼 수 있는데, 이는 이러한 대사산물의 축적이 빈 벡터 대조군 및 AcbB-과다발현 돌연변이체와 비교하여 감소되기 때문이다 (도 34).

일부 실시양태에 따르면, 제1 측면에 따른 방법은

(i) 세포외 작은 탄수화물 결합 단백질 Cgt (서열식별번호: 20)의 발현 부재 또는 감소를 위해, 및/또는

(ii) 카로티노이드 합성에 관여하는 적어도 하나의 유전자의 발현 부재 또는 감소를 위해, 및/또는

(iii) dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현을 위해, 및/또는

(iv) UDP-글루코스-1P 우리딜트랜스퍼라제 GtaB (서열식별번호: 19)의 과다발현을 위해

악티노미세탈레스 균주를 조작하는 것을 포함한다.

일부 실시양태에 따르면, 제1 측면에 따른 방법은 treY의 발현 부재 또는 감소를 위해 악티노미세탈레스 균주를 조작하는 것을 추가로 포함한다.

일부 실시양태에 따르면, 제1 측면에 따른 방법은 하기를 추가로 포함한다:

(i) 세포외 작은 탄수화물 결합 단백질 Cgt (서열식별번호: 20)를 코딩하는 유전자의 결실 또는 돌연변이 및/또는

(ii) 카로티노이드 합성에 관여하는 적어도 하나의 유전자의 결실 또는 돌연변이 및/또는

(iii) AcbB (서열식별번호: 13)에 대한 발현 카세트를 포함하는 벡터를 악티노미세탈레스 균주 내로 도입하는 것 및/또는

(iv) GtaB (서열식별번호: 19)에 대한 발현 카세트를 포함하는 벡터를 악티노미세탈레스 균주 내로 도입하는 것.

일부 실시양태에 따르면, (iii) 및/또는 (iv)에 따른 발현 카세트는 글루쿠로니다제 검정에서 1 x 10^-4 내지 5 x 10^-5 [L·g^-1·min^- ¹]의 정규화된 글루쿠로니다제 활성을 특징으로 하는, 중간 정도의 강한 프로모터의 제어 하에 있다.

제2 측면에 따르면, 아카르보스의 생산을 위한 악티노미세탈레스 균주, 예컨대 악티노플라네스 균주가 제공된다. 일부 실시양태에 따르면, 악티노미세탈레스 균주는 제1 측면에 따른 방법에 의해 생성된 균주이다. 일부 다른 실시양태에 따르면, 악티노미세탈레스 균주는 세포외 작은 탄수화물 결합 단백질 Cgt (서열식별번호: 20)의 발현 부재 또는 감소를 위해 유전적으로 조작된다. 일부 실시양태에 따르면, 악티노미세탈레스 균주는 Δcgt 돌연변이체이다. Δcgt 돌연변이체는 유전자 Cgt (서열식별번호: 20)가 적어도 부분적으로 결실되거나 역전된 악티노미세탈레스 균주의 변이체이다.

이들 또는 다른 실시양태의 일부에 따르면, 악티노미세탈레스 균주는 카로티노이드 합성에 필수적인 적어도 하나의 유전자의 발현 부재 또는 감소를 위해 유전적으로 조작된다. 일부 실시양태에 따르면, 카로티노이드 합성에 필수적인 적어도 하나의 유전자는 적어도 부분적으로 결실되거나 역전되었다. 이들 실시양태의 일부에 따르면, 카로티노이드 합성에 필수적인 적어도 하나의 유전자는 하기 중 임의의 것으로부터 선택된 적어도 하나의 유전자를 포함한다:

a. MEP/DOXP 경로의 유전자, 예컨대

vi. 2-C-메틸-D-에리트리톨 2;4-시클로디포스페이트 신타제 유전자 ispF, (ACSP50_8046, 서열식별번호: 28), 및/또는

vii. 2-C-메틸-D-에리트리톨 4-포스페이트 시티딜릴트랜스퍼라제 유전자 ispD (ACSP50_8047, 서열식별번호: 29),

b. 테르펜 클러스터 1의 유전자, 예컨대

iv. 피토엔 신타제 유전자 crtB (ACSP50_0149, 서열식별번호: 32),

vi. 피리딘 뉴클레오티드-디술피드 옥시도리덕타제 유전자 (ACSP50_0151, 서열식별번호: 34),

c. 테르펜 클러스터 2a의 유전자, 예컨대

i. 전사 조절인자 유전자 (ACSP50_1631, 서열식별번호: 35),

ii. 리코펜 시클라제 유전자 (ACSP50_1632, 서열식별번호: 36),

iii. 리코펜 시클라제 유전자 (ACSP50_1633, 서열식별번호: 37),

v. 메틸렌테트라히드로폴레이트 리덕타제 (NADPH) 유전자 (ACSP50_1635, 서열식별번호: 39),

d. 테르펜 클러스터 2b의 유전자, 예컨대

viii. 모노옥시게나제 유전자 (ACSP50_1657, 서열식별번호: 47),

ix. 단쇄 데히드로게나제 유전자 (ACSP50_1658, 서열식별번호: 48),

e. 폴리프레닐 신테타제 유전자 crtE (ACSP50_3873, 서열식별번호: 49), 또는

f. 캄펜-유사 모노테르펜 생합성 테르펜 클러스터 3에 대한 유전자, 예컨대

ii. 캄펜 신타제 유전자 (ACSP50_1950, 서열식별번호: 50),

iv. 글리코실-히드롤라제 유전자 (ACSP50_1952, 서열식별번호: 106),

이들 또는 다른 실시양태의 일부에 따르면, 악티노미세탈레스 균주는 MerR-/HTH-전사 조절인자 유전자 merR (ACSP50_0145, 서열식별번호: 11)의 과다발현을 위해 유전적으로 조작된다.

이들 또는 다른 실시양태의 일부에 따르면, 악티노미세탈레스 균주는 dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현을 위해 유전적으로 조작된다.

본원의 다른 곳에 기재된 바와 같이, AcbB의 과다발현은 대조군과 비교하여 적어도 1.5의 인자 또는 적어도 2의 인자만큼 AcbB의 증가를 지칭한다. 바람직하게는, 대조군은 dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 특이적 과다발현을 위해 조작되지 않은 균주이다. 예를 들어, 대조군은 AcbB에 대한 발현 카세트를 포함하는 벡터를 포함하지 않는다.

예를 들어, 유전자 산물의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안의 증가, 또는 임의의 다른 시간 동안의 증가일 수 있다.

일부 실시양태에 따르면, dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안의 적어도 1.5 또는 적어도 2의 log2(변화 배수) 인자만큼의 AcbB 전사체 및/또는 단백질의 발현 증가, 또는 임의의 다른 시간 동안의 증가이다.

일부 실시양태에 따르면, dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현을 위해 유전적으로 조작된 악티노미세탈레스 균주는 AcbB의 과다발현을 위한 벡터를 포함한다. 이들 실시양태의 일부에 따르면, 벡터는 본원에 기재된 바와 같은 벡터, 바람직하게는 본원에 기재된 측면에 따른 벡터이다.

일부 실시양태에 따르면, dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현을 위해 유전적으로 조작된 악티노미세탈레스 균주는 중간 정도의 강한 프로모터의 제어 하에 AcbB (서열식별번호: 13)에 대한 발현 카세트를 포함한다.

일부 실시양태에 따르면, dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현을 위해 유전적으로 조작된 악티노미세탈레스 균주는 강한 프로모터의 제어 하에 AcbB (서열식별번호: 13)에 대한 발현 카세트를 포함한다. 바람직하게는, 프로모터는 AcbB의 천연 프로모터가 아니다.

이들 또는 다른 실시양태의 일부에 따르면 악티노미세탈레스 균주는 UDP-글루코스-1P 우리딜트랜스퍼라제 GtaB (서열식별번호: 19)의 과다발현을 위해 유전적으로 조작된다.

본원의 다른 곳에 기재된 바와 같은 GtaB (서열식별번호: 19)의 과다발현은 야생형 또는 명시된 참조 균주 / 대조군과 비교하여 GtaB에 대한 발현의 증가를 지칭한다. 바람직하게는, 대조군은 GtaB (서열식별번호: 19)의 특이적 과다발현을 위해 조작되지 않은 균주이다. 예를 들어, 대조군은 GtaB (서열식별번호: 19)에 대한 발현 카세트를 포함하는 벡터를 포함하지 않는다. 예를 들어, 유전자 산물의 과다발현은 초기 성장기 동안 및/또는 선형 성장기 동안 및/또는 정지기 동안의 증가 및/또는 임의의 다른 시간 동안의 증가일 수 있다.

일부 실시양태에 따르면 GtaB의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안 적어도 1.5 또는 적어도 2의 log2(변화 배수) 인자만큼의 GtaB 전사체 및/또는 단백질의 발현 증가 및/또는 임의의 다른 시간 동안의 증가이다.

일부 실시양태에 따르면 GtaB의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안 log2(변화 배수) ≥ 2 및 ≤ 6만큼의 GtaB 전사체 및/또는 단백질의 발현 증가 및/또는 임의의 다른 시간 동안의 증가, 예컨대 초기 성장기 동안 및/또는 선형 성장기 동안의 증가이다.

일부 실시양태에 따르면 GtaB의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안 log2(변화 배수) > 3 및 < 5만큼의 GtaB 전사체 및/또는 단백질의 발현 증가 및/또는 임의의 다른 시간 동안의 증가이다.

일부 실시양태에 따르면 GtaB의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안 log2(변화 배수) > 6만큼의 GtaB 전사체 및/또는 단백질의 발현 증가 또는 임의의 다른 시간 동안의 증가이다.

일부 실시양태에 따르면 GtaB의 과다발현을 위해 유전적으로 조작된 악티노미세탈레스 균주는 GtaB의 과다발현을 위한 벡터를 포함한다. 이들 실시양태의 일부에 따르면, 벡터는 본원에 기재된 바와 같은 벡터, 바람직하게는 본원에 기재된 측면에 따른 벡터이다.

일부 실시양태에 따르면, GtaB (서열식별번호: 19)의 과다발현을 위해 유전적으로 조작된 악티노미세탈레스 균주는 중간 정도의 강한 프로모터의 제어 하에 GtaB (서열식별번호: 19)에 대한 발현 카세트를 포함한다.

일부 실시양태에 따르면, GtaB (서열식별번호: 19)의 과다발현을 위해 유전적으로 조작된 악티노미세탈레스 균주는 강한 프로모터의 제어 하에 GtaB (서열식별번호: 19)에 대한 발현 카세트를 포함한다. 바람직하게는, 프로모터는 GtaB의 천연 프로모터가 아니다.

제3 측면에 따르면, 아카르보스의 생산에 사용하기 위한 아카르보스의 생산을 위한 악티노미세탈레스 균주, 예컨대 악티노플라네스 균주가 제공된다.

일부 실시양태에 따르면, 제2 측면에 따른 악티노미세탈레스 균주의 사용을 포함하는, 아카르보스의 생산을 위한 방법이 제공된다.

악티노플라네스의 유전적 조작을 위해서는, 단일 또는 다중 유전자의 과다발현을 위한 발현 시스템이 필요한다. 제4 측면에 따르면 악티노플라네스에 대한 발현 벡터가 제공된다.

일부 실시양태에 따르면, 제4 측면에 따른 벡터는 글루쿠로니다제 검정에서 적어도 1 x 10^-4 [L·g^-1·min^- ¹]의 정규화된 글루쿠로니다제 활성을 특징으로 하는 중간 정도의 강한 프로모터를 포함한다. 일부 실시양태에서, 중간 정도의 강한 프로모터는 서열식별번호: 92에 따른 efp, 서열식별번호: 97에 따른 cdaR, 서열식별번호: 99에 따른 rpsL, 서열식별번호: 93에 따른 rpsJ, 서열식별번호: 91에 따른 cgt, 또는 서열식별번호: 81에 따른 tipA로부터 선택된다.

일부 실시양태에 따르면, 제4 측면에 따른 벡터는 글루쿠로니다제 검정에서 적어도 5 x 10^-4 [L·g^-1·min^- ¹]의 정규화된 글루쿠로니다제 활성을 특징으로 하는 강한 프로모터를 포함한다. 일부 실시양태에서, 강한 프로모터는 서열식별번호: 96에 따른 apm, 서열식별번호: 98에 따른 ermE*, 서열식별번호: 94에 따른 katE, 서열식별번호: 95에 따른 moeE5 또는 서열식별번호: 82에 따른 gapDH로부터 선택된다.

중간 내지 강한 유전자 발현을 허용하는 추가의 적합한 프로모터를 찾기 위해, pSET152-벡터 시스템에서 클로닝된 리포터 GusA를 기반으로 하는, 문헌 [Horbal et al. (2013) and Myronovskyi et al. (2011)]의 스크리닝 시스템을 사용하여 프로모터 스크리닝을 수행할 수 있다 (도 3, 표 1 참조).

일부 실시양태에서, 제1 측면에 따른 벡터는 발현 카세트를 포함한다. 바람직하게는 벡터는 AcbB (서열식별번호: 13)에 대한 발현 카세트 및/또는 GtaB (서열식별번호: 19)에 대한 발현 카세트 및/또는 MerR에 대한 발현 카세트를 포함한다.

일부 실시양태에서, 발현 카세트는 더욱이 lac-프로모터의 제어 하에 있는 lacZα-유전자를 포함할 수 있다. lacZα-유전자는 클로닝 균주 에스케리키아 콜라이(Escherichia coli) DH5αMCR (NC_017638.1) (Grant et al. 1990)에서 청색/백색 선택을 통해 표적 서열의 통합을 빠르게 선택할 수 있도록 하는 β-갈락토시다제의 촉매 도메인을 코딩한다.

이론에 얽매이는 것은 아니지만, 본 측면에 따른 벡터는 벡터 복제, 전달, 유지 및 선택을 위한 요소를 포함한다. 일부 실시양태에서, 이들 요소 중 적어도 하나는 pSET152로부터 유래된다.

일부 실시양태에서, 본 측면에 따른 벡터는 문헌 [Bierman et al. (1992)]의 pSET152 벡터의 서열의 일부를 포함한다.

바람직하게는, 벡터는 서열식별번호: 108 및/또는 서열식별번호: 109에 따른 추정 안티센스 프로모터를 포함하지 않는다. 이들 안티센스 프로모터는 5'-1차 전사체 라이브러리의 시퀀싱에 의해 본 발명자들에 의해 확인되었고 벡터 pSET152의 적합성을 손상시킨다. 간단히 언급하면, 확인은 강화된 1차 전사체 라이브러리의 시퀀싱에 의해 이루어졌다. 2개의 추정 프로모터는 안티센스 배향에서 관심 유전자 뒤에서 확인되었다 (도 26). 안티센스 전사를 방지하기 위해 이들 2개의 슈도-프로모터를 제거하였다.

더욱이, 추가의 추정 안티센스 판독을 방지하기 위해 T4-종결인자를 반대 배향으로 발현 카세트 뒤에 도입하였다 (예를 들어, 도 6 참조). 일부 실시양태에서, 벡터는 적어도 하나의 T4-종결인자 (박테리오파지 T4로부터 유래됨)를 포함한다. T4-종결인자는 전사를 효율적으로 차단하고 인테그라제 유전자로부터 관심 유전자로의 번역-초과를 방지할 수 있다. 일부 실시양태에서, 벡터는 추가의 추정 안티센스 판독을 방지하기 위해 반대 배향으로 발현 카세트 뒤에 T4-종결인자를 포함한다. 예를 들어, 벡터는 발현 카세트 앞에 적어도 하나의 T4-종결인자를 포함하고/거나 발현 카세트 뒤에 적어도 하나의 T4-종결인자를 포함할 수 있다. 일부 실시양태에서, 벡터는 3개의 종결인자를 포함할 수 있으며, 하나는 발현 카세트 앞에 있고 2개는 발현 카세트 뒤에 있다.

일부 실시양태에서 벡터는 φC31 인테그라제 유전자 int를 포함한다. 이들 실시양태의 일부에서 φC31 인테그라제 유전자 int는 pSET152로부터 유래된다. 일부 실시양태에서, 제1 측면에 따른 벡터는 더욱이 부착 부위 attP를 포함한다. φC31 인테그라제 유전자 int의 인테그라제는 2개의 부착 부위: 벡터에 국한된 attP 및 유전자 ACSP50_6589 (이전명: ACPL_6602) (te Poele et al. 2008; Gren et al. 2016])에서 숙주 염색체에 국한된 attB의 표적화된 단방향 재조합을 촉매함으로써 별개의 게놈 위치에서 벡터의 숙주 염색체로의 통합을 매개한다. 이론에 얽매이는 것은 아니지만, 통합 후 벡터는 attP-attB-재조합으로부터 유래되는 부착 부위 좌측 (attL) 및 우측 (attR)에 의해 플랭킹된다 (te Poele, Bolhuis und Dijkhuizen 2008).

일부 실시양태에서 벡터는 전달 기점, 예컨대 전달 기점 (incP) 및/또는 릴랙소좀 유전자, 예컨대 릴랙소좀 유전자 traJ를 포함한다. 이들 실시양태의 일부에서, 전달 기점, 예컨대 전달 기점 (incP) 및/또는 릴랙소좀 유전자, 예컨대 traJ는 pSET152로부터 유래된다. 전달 기점 및 릴랙소좀 유전자는 공여자 균주 (예를 들어 에스케리키아 콜라이 ET12567/pUZ8002 (Kieser et al. 2000))로부터 플라스미드의 전달을 가능하게 한다.

일부 실시양태에서, 제1 측면에 따른 벡터는 복제 기점, 예컨대 높은 카피 수 ColE1/pMB1/pBR322/pUC 복제 기점 (ori)을 포함한다. 이들 실시양태의 일부에서 복제 기점, 예컨대 높은 카피 수 ColE1/pMB1/pBR322/pUC 복제 기점 (ori)은 pSET152로부터 유래된다. 복제 기점, 예컨대 높은 카피 수 ColE1/pMB1/pBR322/pUC 복제 기점 (ori)은 클로닝 균주 (에스케리키아 콜라이 DH5αMCR) 및 공여자 균주 (에스케리키아 콜라이 ET12567/pUZ8002)에서 플라스미드의 복제를 가능하게 한다.

일부 실시양태에서, 제1 측면에 따른 벡터는 적어도 하나의 내성 마커, 예컨대 아프라마이신 내성을 매개하는 내성 마커 (aac(3)IV, apmR)를 포함한다. 아프라마이신 내성을 매개하는 내성 마커 (aac(3)IV, apmR)를 선택에 사용할 수 있다.

제4 측면에 따른 일부 실시양태에 따르면, 발현 벡터는 pSET152의 적어도 하나의 요소, 예컨대 (a) 서열식별번호: 85에 따른 φC31 인테그라제 유전자 int, (b) 서열식별번호: 87에 따른 전달 기점 (incP), (c) 서열식별번호: 88에 따른 릴랙소좀 유전자 traJ, 또는 (d) 서열식별번호: 89에 따른 높은 카피 수 ColE1/pMB1/pBR322/pUC를 포함하고, 더욱이 서열식별번호: 108 및 서열식별번호: 109에 따른 추정 안티센스 프로모터를 포함하지 않는다.

제4 측면에 따른 일부 실시양태에 따르면, 발현 벡터는 (a) 서열식별번호: 85에 따른 φC31 인테그라제 유전자 int, 및 (b) 서열식별번호: 87에 따른 전달 기점 (incP), 및 (c) 서열식별번호: 88에 따른 릴랙소좀 유전자 traJ, 및 (d) 복제 기점, 예컨대 서열식별번호: 89에 따른 높은 카피 수 ColE1/pMB1/pBR322/pUC 복제 기점 (ori) 및 (e) 임의적으로 적어도 하나의 내성 마커, 예컨대 아프라마이신 내성을 매개하는 내성 마커, 예컨대 서열식별번호: 90에 따른 aac(3)IV, apmR, 및 (f) 임의적으로 적어도 하나의 T4-종결인자를 포함하고, (g) 임의적으로, 여기서 벡터는 서열식별번호: 108 및/또는 서열식별번호: 109에 따른 추정 안티센스 프로모터를 포함하지 않는다.

일부 실시양태에 따르면, 벡터는 서열식별번호: 110 또는 서열식별번호: 111에 따른 서열을 포함한다. 일부 실시양태에 따르면, 벡터는 서열식별번호: 110 또는 서열식별번호: 111에 따른 서열, 또는 그의 단편을 포함한다.

일부 실시양태에서, 벡터는 상이한 프로모터의 통합을 허용하는 용이한 클로닝 메커니즘에 의해 우수하다. 이를 통해, 시스템은 추가 종, 예를 들어 아카르보스의 생산 균주에 빠르게 적응할 수 있다.

실시예

일반 도구 및 방법

균주 및 플라스미드

본 작업에 사용된 모든 균주는 표 E1에 나열되어 있다. 본 작업에서 사용되거나 생성된 재조합 균주는 표 E2, 표 E3 및 표 E4에 나열되어 있다 (표 E2에는 플라스미드-기반 발현 시스템이 나열되어 있고, 표 E3에는 이. 콜라이 DH5αMCR에서 클로닝 및 저장된 결실 및 통합 구축물이 나열되어 있으며, 표 E4에는 악티노플라네스 종 SE50/110의 결실 및 통합 돌연변이체가 나열되어 있다).

표 E1 미생물의 배양 수집.

표 E2 복제 및 통합 벡터 시스템.

표 E3 문헌 [Cobb et al. (2015)]의 pCRISPomyces-2를 기반으로 하는 표적화된 결실 및 통합을 위한 벡터 시스템.

표 E4 CRISPR/Cas9 기술에 의해 악티노플라네스 아종에서 수득된 결실 및 통합 돌연변이체.

배지 및 배양 조건

달리 명시되지 않는 한, 모든 화학 물질 및 배지 성분은 칼 로스 게엠베하 운트 코. 카게 (Carl Roth GmbH & Co. KG; 독일 칼스루에), 시그마 알드리치 (Sigma-Aldrich; 미국 세인트 루이스), 세르바 일렉트로포레시스 게엠베하 (SERVA Electrophoresis GmbH; 독일 하이델베르크) 또는 VWR 인터내셔널 (VWR International; 미국 펜실베니아주)로부터 수득된다.

악티노플라네스 종 SE50/110의 글리세롤 스톡의 제조

글리세롤 스톡의 제조를 위해, 악티노플라네스 종 SE50/110 (ATCC 31044)을 복합 배지 NBS (11 g·L^-1 글루코스·1H₂O, 4 g·L^-1 펩톤, 4 g·L^-1 효모 추출물, 1 g·L^-1 MgSO₄·7H₂O, 2 g·L^-1 KH₂PO₄, 4 g·L^-1 K₂HPO₄)에서 성장시키고 멸균 86% (v/v) 글리세롤과 2:3으로 혼합하였다. 글리세롤 스톡을 -80℃ 하에 저장한다.

고체 배지에서의 성장 및 포자 용액의 제조

포자 형성을 위해, 200-300 μL의 글리세롤 스톡을 대두분 배지 (SFM-한천) (20 g·L^-1 대두분 (SOBO® 나투르코스트(Naturkost) (독일 쾰른)), 20 g·L^-1 D-만니톨, 20 g·L^-1 박토(Bacto)™ 한천 (벡톤 디킨슨 (Becton-Dickinson; 독일 하이델베르크)), 수돗물 중 167 μL 10 N NaOH)의 한천 플레이트에서 성장시켰다. 문헌 [Wolf et al. (2016)]에 기재된 바와 같이, 면봉으로 3 mL ddH₂O로 씻어내어 28℃에서 5-7일 동안 인큐베이션한 후 포자를 수거할 수 있었다.

최소 배지의 제조

말토스 최소 배지 (72.06 g·L^-1 말토스·1H₂O, 5 g·L^-1 (NH₄)₂SO₄, 0.184 g·L^-1 FeCl₂·4H₂O, 5.7 g·L^-1 Na₃C₆H₅O₇·2H₂O, 1 g·L^-1 MgCl₂·6H₂O, 2 g·L^-1 CaCl₂·2H₂O, 미량 원소 (최종 농도: 1 M HCl에 용해된 1 μM CuCl₂, 50 μM ZnCl₂, 7.5 μM MnCl₂) 및 ddH₂O 중 K₂HPO₄ 및 KH₂PO₄ 각각 5 g·L^-1로 이루어진 인산염 완충제)를 제조하고 문헌 [Wendler et al. (2013)]의 프로토콜에 따라 필터 멸균시켰다.

탄소 공급원 말토스의 치환을 위해, 79.2 g·L^-1 글루코스·1H₂O, 72.0 g·L^-1 C-pur (케레스타(Cerestar) 01908, 케레스타 게엠베하 (Cerestar GmbH; 독일 크레펠트)), 71.9 g·L^-1 갈락토스, 68.4 g·L^-1 셀로비오스, 71.9 g·L^-1 D-아라비노스 또는 72.0 g·L^-1 D-락토스를 말토스-일수화물 대신에 각각 사용하였다. 말토스와 글루코스의 혼합물은 90:10, 80:20 및 50:50 (v/v)의 비율로 제조되었다.

전분 배지의 경우, 아크로스 오가닉스(Acros Organics) (써모 피셔 사이언티픽 (Thermo Fisher Scientific; 벨기에 헤일)의 일부)로부터의 "전분 가용성"의 4% (w/v) 유백색 용액이 생성되었다. 이를 위해, 멸균수를 수 욕조에서 90℃로 예열하고, 칭량한 전분의 일부분을 교반하면서 부가하였다. 그 후, 잔여 배지 성분을 부가하였다. 전분 배양과 비교할 수 있도록, 거의 동등한 수준의 C-몰농도를 갖는 말토스 최소 배지를 생성하였다 (여기서 44.4 g·L^-1 말토스·1H₂O의 순 중량). pH와 오스몰농도가 상이한 배지는 보정제 (HCl 또는 NaOH)를 부가하고, 본 발명자들의 연구에 따라 대사되지 않는 이노시톨을 부가하여 탄소 공급원 말토스의 농도를 각각 다르게 하여 생성되었다 (데이터는 제시되지 않음).

더욱이, 아크로스 오가닉스로부터의 1 g·L^-1, 2 g·L^-1, 3 g·L^-1, 4 g·L^-1 및 5 g·L^-1 "전분 가용성"이 있는 최소 배지는 제한된 탄소 공급원 하에서의 배양을 위해 생성되었다.

모든 배지의 pH 및 오스몰농도는 제조업체의 지침에 따라 니크 게엠베하 (Knick GmbH; 독일 베를린)의 pH 측정기 칼리마틱(Calimatic) 및 고노텍 게엠베하 (Gonotec GmbH; 독일 베를린)의 오스모마트(Osmomat) 3000에 의해 결정되었다.

진탕 플라스크 배양

GFL 진탕 배양기 3032 또는 3033 (독일 버그웨델)에서 7일 동안 28℃ 및 140 rpm에서 250 mL 코닝(Corning)® 에를렌마이어(Erlenmeyer) 칸막이가 있는 세포 배양 플라스크에서 배양을 수행하였다. 50 mL 배지의 접종을 위해, OD = 3-5의 1 mL 포자 용액을 사용하였다. 세포 건조 중량은 문헌 [Wolf et al. (2017a)]에 기재된 바와 같이 결정되었다. 상등액은 추후 분석을 위해 -20℃에서 저장하였다.

m2p - 랩스 게엠베하 (독일 바스웨일러 )의 바이오렉터 시스템에서 소형화 배양

비교 성장 실험은 기체 투과성 밀봉 호일로 덮인 48-웰 플라워플레이트 (m2p-랩스 게엠베하; 독일 바스웨일러)에서 1 mL 반응 용적에서 수행되었고 m2p-랩스의 로보렉터®에서 28℃ 및 800 rpm에서 1주일 동안 인큐베이션하였다. 성장은 후방산란 신호에 의해 기록되었다. 최종 세포 건조 중량의 결정을 위해, 800 μL의 각각의 웰을 칭량된 반응 튜브에서 샘플링하고 (14,000 g, 2분), 탈이온수로 세척하며 60-70℃에서 1일 동안 건조시켰다. 상등액은 추후 분석을 위해 -20℃에서 저장하였다.

재조합 DNA 작업

달리 명시되지 않는 한, 플라스미드 구축 및 어셈블리는 깁슨 어셈블리에 의해 수행되었다 (Gibson et al. 2009). 단편을 에펜도르프 써모사이클러 바포.프로텍트(Eppendorf thermocycler vapo.protect) (독일 함부르크)에서 PCR (GC 완충액이 포함된 푸션(Phusion)® 고 충실도 PCR 마스터 믹스, NEB; 미국 매사추세츠주 입스위치)로 증폭시키고, 필요한 경우 DpnI (써모 피셔 사이언티픽; 미국 매사추세츠주 월섬)로 처리하였다. PCR 산물 및 겔 추출물의 정제는 뉴클레오스핀(NucleoSpin)® 겔 및 PCR 클린 업 키트 [맥커리 나겔 (Macherey-Nagel; 독일 두렌)]를 사용하여 수행되었다. 등몰량의 DNA 단편을 1:4의 비율로 깁슨 어셈블리 마스터 믹스에 부가하였다. 마스터 믹스는 0.64 μL T5 엑소뉴클레아제 (10 U·μL^-1, NEB; 미국 매사추세츠주 입스위치), 20 μL 푸션 고 충실도 DNA 폴리머라제 (2 U·μL^-1, 써모 피셔 사이언티픽; 미국), 160 μL Taq DNA 라이가제 (NEB; 미국 매사추세츠주 입스위치), 699.36 μL 증류수 및 320 μL 등온 반응 완충액 (25% PEG-8000, 1 mL 1 M 트리스-HCl, 100 μL 1 M MgCl₂, 100 μL 1 M DTT, 20 μL 각각 1 mM dNTP, 200 μL NAD)으로 이루어진다. 샘플을 50℃에서 적어도 1시간 동안 인큐베이션한 후 문헌 [Beyer et al. (2015)]의 프로토콜에 따라 화학적 변환을 통해 에스케리키아 콜라이 DH5αMCR로 옮겼다. 이. 콜라이의 선택은 15 g·L^-1 한천-한천 (둘 다: 칼 로스 게엠베하 운트 코. 카게; 독일 칼스루에) 및 50 mg·L^-1 아프라마이신-술페이트를 포함하는 루리아/밀러(Luria/Miller) 브로스 배지에서 수행되었다. 양성 콜로니는 PCR 및 겔 전기영동 뿐만 아니라 본 발명자들의 사내 시퀀싱 핵심 시설에 의한 생어(Sanger) 시퀀싱에 의해 테스트되었다.

gusA 리포터 시스템을 위한 플라스미드의 구축

gusA 리포터 시스템을 위한 플라스미드의 구축에 대해서는 문헌 [Schaffert et al. (2019)]을 참조한다.

신규 pSETT4 발현 시스템의 구축

신규 pSETT4 발현 시스템의 클로닝을 위해, 문헌 [Bierman et al. (1992)]의 의 pSET152 벡터가 주형으로서 사용되었다. 벡터 백본은 PCR에 의해 선형화되었다 (표 E5).

gapDH-프로모터, lac-프로모터의 제어 하에 있는 lacZ-유전자 및 3개의 T4-종결인자에 의해 플랭킹된 여러 제한 부위로 이루어진 클로닝 카세트가 인티그레이티드 DNA 테크놀로지스 (Integrated DNA Technologies; 미국 아이오와주)에서 스트링 DNA로서 주문되었다. 복잡한 구조로 인해, 상기 카세트는 3가지 부분으로 주문되었으며 표 E5에서의 프라이머를 사용하여 GeneSOEing (Horton 1995)에 의해 어셈블리되었다. 마지막으로, 백본과 삽입물은 깁슨 어셈블리에 의해 어셈블리되었다 (Gibson et al. 2009). 신규 벡터 시스템은 pSETT4gap으로 명명되었다.

tipA-프로모터에 의한 gapDH-프로모터의 교환을 위해, pSETT4gap를 NdeI 및 KpnI로 소화시키고 공급자의 지침에 따라 새우 알칼리성 포스파타제로 처리하였다. 모든 효소는 써모 피셔 사이언티픽 (미국 매사추세츠주 월섬)으로부터 구입하였다. tipA-프로모터는 프라이머 tipA_GAF 및 tipA_GAR을 사용하여 pSETGUS (Myronovskyi et al. 2011)으로부터 증폭되었고 깁슨 어셈블리에 의해 선형화된 백본으로 어셈블리되었다 (Gibson et al. 2009). 벡터는 pSETT4tip으로 명명되었다 (도 6 참조).

표 E5 신규 발현 시스템 pSETT4gap 및 pSETT4tip의 어셈블리를 위한 깁슨 어셈블리 프라이머.

신규 pSETT4 발현 시스템에서 단일 유전자의 과다발현

단일 유전자의 과다발현을 위해, 삽입물을 PCR로 증폭시켰다 (표 E6). 벡터 (pSETT4gap 또는 pSETT4tip)는 BsaI (NEB; 미국 매사추세츠주 입스위치)로 소화시키고 깁슨 어셈블리에 의해 삽입물과 어셈블리되었다 (Gibson et al. 2009). 천연 프로모터의 제어 하에 acbB 유전자의 발현을 위해, 벡터 백본 pSETT4gap를 BsaI 및 NdeI로 소화시켜, 프로모터 제거 하에 벡터의 선형화를 유도하였다. 관심 유전자 및 천연 프로모터는 표 E6에서의 프라이머를 사용하여 증폭되었고 깁슨 어셈블리에 의해 벡터 백본과 어셈블리되었다 (Gibson et al. 2009).

표 E6 pSETT4gap 및 pSETT4tip 벡터 시스템으로의 제한 클로닝 및 골든 게이트 클로닝을 위한 삽입물의 증폭을 위한 프라이머.

pCRISPomyces -2 결실 및 통합 벡터의 구축

CRISPR/Cas9 기술에 의한 결실 및 통합 돌연변이체의 구축을 위해, 플라스미드 pCRISPomyces-2 (Cobb et al. 2015)가 문헌 [Wolf et al. (2016)]의 프로토콜에 따라 사용되었다. 스페이서 및 그의 역 보체는 중첩이 있는 올리고뉴클레오티드로서 메타비온 게엠베하 (metabion GmbH; 독일 스틴키르헨) 또는 시그마 알드리치 (독일 타우프키르헨)에서 주문되었다 (표 E7).

올리고뉴클레오티드는 이중 가닥으로 어닐링되었고 문헌 [Cobb et al. (2015)]의 프로토콜에 따라 골든 게이트 어셈블리 (Engler et al. 2008)에 의해 플라스미드와 어셈블리되었다. Cas9 유도 이중 가닥 파손의 복구를 위해, DNA 주형이 깁슨 어셈블리에 의해 벡터 백본에 클로닝되었다 (Gibson et al. 2009). DNA 주형으로서, 표적 유전자의 상류 및 하류에 있는 플랭킹 서열 (각각의 라운드 약 1 kB)을 게놈 DNA로부터 PCR (표 E8)에 의해 증폭시켰다.

표 E7 pCRISPomyes-2와의 골든 게이트 어셈블리에 사용되는 스페이서 및 역 보체.

표 E8 pCRISPomyes-2 결실 및 통합 벡터를 위한 깁슨 어셈블리 프라이머.

CRISPR / Cas9 기술에 의한 유전자 cgt의 결실

CRISPR/Cas9 기술 (클러스터된 규칙적으로 공간을 둔 짧은 팔린드롬성 반복부/CRISPR-관련 엔도뉴클레아제 9)에 의한 Δcgt (ΔACSP50_5024) 결실 돌연변이체의 구축을 위해, 플라스미드 pCRISPomyces-2가 사용되었다 (Cobb et al. 2015). 스페이서 서열은 문헌 [Wolf et al. (2016)]에 따라 선택되었고 메타비온 게엠베하 (독일 스틴키르헨)에서 그의 역 보체와 함께 올리고뉴클레오티드로서 주문되었다 (스페이서_1: 5'-acgcAGCGTCGCCCGCTGGGAGAA-3', 스페이서_2: 5'-aaacTTCTCCCAGCGGGCGACGCT-3'). 올리고뉴클레오티드는 이중 가닥으로 어닐링되었고 문헌 [Cobb et al. (2015)]의 프로토콜에 따라 BsaI (NEB; 미국 매사추세츠주 입스위치)를 사용하여 골든 게이트 어셈블리 (Engler et al. 2008)에 의해 플라스미드와 어셈블리되었다 (Cobb et al. 2015). Cas9 유도 이중 가닥 파손의 복구를 위해, 데옥시리보핵산 (DNA) 주형을 깁슨 어셈블리에 의해 XbaI 선형화된 벡터에 클로닝하였다 (Gibson et al. 2009). DNA 주형으로서, 표적 유전자의 상류 및 하류에 있는 플랭킹 서열 (각각 라운드 약 1 kB)을 GC 완충액이 포함된 푸션® 고 충실도 PCR 마스터 믹스 (NEB; 미국 매사추세츠주 입스위치)로 폴리머라제 연쇄 반응 (PCR)으로 증폭시켰다 (프라이머 서열: cgt_플랭크1_fw: 5'- tcggttgccgccgggcgttttttatCCGGTACCCTGCTCCTCGTC-3', cgt_플랭크1_rv: 5'- gtgacgcattgacgcaggtcGAGGGATATGGCTCAGATAC-3', cgt_플랭크2_fw: 5'- gtatctgagccatatccctcGACCTGCGTCAATGCGTCAC-3', cgt_플랭크2_rv: 5'- gcggcctttttacggttcctggcctACCTGACCCTGCTGAAATGG-3'). 깁슨 어셈블리를 위해, DNA 단편 (플랭크_1: 1101 bp 및 플랭크_2: 982 bp)을 0.64 μL T5 엑소뉴클레아제 (10 U/μL, NEB; 미국 매사추세츠주 입스위치), 20 μL 푸션 고 충실도 DNA 폴리머라제 (2 U/μL, 써모 피셔 사이언티픽; 미국) 및 160 μL Taq DNA 라이가제 (40 U/μL NEB; 미국 매사추세츠주 입스위치), 699.36 μL 증류수 및 320 μL 등온 반응 완충액 (25% PEG-8000, 1 mL 1 M 트리스-HCl, 100 μL 1 M MgCl₂, 100 μL 1 M DTT, 20 μL 각각 1 mM dNTP, 200 μL NAD)으로 이루어진 깁슨 어셈블리 마스터 믹스에 1:4의 비율로 등몰 부가하여 혼합하였다. 50℃에서 적어도 1시간 동안 인큐베이션한 후, 반응 혼합물을 프로토콜 (Beyer et al. 2015)에 따라 화학적 변환에 의해 에스케리키아 콜라이 DH5αMCR로 옮겼다. 이. 콜라이의 성장 및 선택은 50 mg·L^-1 아프라마이신-술페이트가 보충된 15 g·L^-1 한천-한천 KobeI (둘 다: 칼 로스, 게엠베하 운트 코. 카게; 독일 칼스루에)가 포함된 루리아/밀러 배지 (LB-배지) 상에 플레이팅함으로써 수행되었다. 플레이트를 37℃에서 10-14시간 동안 인큐베이션하였다. 아프라마이신 내성 콜로니는 먼저 PCR 및 겔 전기영동으로 테스트하고, 두 번째는 본 발명자들의 사내 시퀀싱 핵심 시설에서 생어 시퀀싱으로 테스트하였다 (PCR을 위한 프라이머 서열: for: 5'-GGCGTTCCTGCAATTCTTAG-3', rev: 5'-TCGCCACCTCTGACTTGAGC-3', 시퀀싱을 위한 워킹 프라이머: w1: 5'-CGCTGATCTTCAGCTTCC-3', w2: 5'-GCCTTCACCTTCCATCTG-3', w3: 5'-TCGGGAAAGCCGCCGGAG-3').

악티노플라네스 종 SE50/110으로의 접합성 전이

적격한 악티노플라네스 종 SE50/110 세포는 새로 성장한 NBS 배양물로부터 제조되었다 (상기 참조). 세포를 10% (w/v) 빙냉 수크로스에서 2회 세척하고 빙냉 15% (v/v) 글리세롤에서 2회 세척하였다. 마지막으로, 세포를 15% (v/v) 빙냉 글리세롤 (세포 펠릿의 약 4배 용적의 부가에 의함)에 넣고 반응 튜브에서 100 μL로 분취하고 액체 질소에서 급속 동결하였다. 적격한 악티노플라네스 세포를 -80℃ 하에 저장한다.

접합을 위해, 에스케리키아 콜라이 ET12567/pUZ8002 (Kieser et al. 2000)를 사용하였다. 문헌 [Beyer et al. (2015)]에 따라 이. 콜라이 ET12567/pUZ8002 내로 원하는 구축물을 전달하고 50 mg·L^-1 아프라마이신-술페이트, 50 mg·L^-1 카나마이신-술페이트 및 15 mg·L^-1 클로람페니콜이 보충된 LB 한천 플레이트 상에서의 선택 후, 세포를 액체 배양물 (동일한 보충물이 포함된 LB-배지)에서 성장시키고 0.4-0.6의 광학 밀도에서 수거하였다. 세포를 빙냉 LB 배지에서 2회 세척하고 악티노플라네스 종 SE50/110의 적격 세포와 혼합하였다. 세포 현탁액을 SFM 한천 플레이트에 플레이팅하였다. 28℃에서 20-24시간 동안 인큐베이션한 후, ddH₂O에 용해된 1 mL 500 mg·L^-1 아프라마이신-술페이트를 멸균 면봉으로 플레이트 상에 분포시켰다. 악티노플라네스 종 SE50/110의 제1 접합완료체가 1주 후에 관찰될 수 있다. 접합완료체를 50 mg·L^-1 아프라마이신-술페이트가 보충된 SFM 한천 플레이트로 옮겼다. 이. 콜라이로부터 악티노플라네스 접합완료체를 정제하기 위해 반복적인 스트리킹을 여러 번 수행한다. 이러한 프로세스를 촉진하기 위해, 50 mg·L^-1 포스포마이신 또는 트리메토프림을 배지에 보충하여 공여자 균주를 제거할 수 있다.

악티노플라네스 종 SE50/110의 마커 무함유 CRISPR / Cas9 결실/통합 돌연변이체를 수득하기 위한 플라스미드 큐어링

플라스미드 큐어링은 승온에서 복합 배지 NBS에서 배양함으로써 문헌 [Wolf et al. (2016)]의 프로토콜에 따라 수행되었다. 아프라마이신 함유 및 아프라마이신 무함유 SFM 플레이트 상에 평행 스트리킹함으로써 플라스미드의 존재에 대해 콜로니를 테스트하였다. 아프라마이신-감수성 접합완료체는 PCR에 의해 결실에 대해 테스트하였다 (프라이머 서열 데이터는 제시되지 않음). PCR 단편은 겔로부터 절단되어 본 발명자들의 사내 생어 시퀀싱 핵심 시설에서 시퀀싱되었다.

부가적으로, 결실 또는 통합 돌연변이체의 게놈 DNA도 옥스포드 나노포어(Oxford Nanopore) 기술 (영국 옥스포드)에 의해 시퀀싱되어 오프 타겟 효과를 배제하였다. 이를 위해, 뉴클레오스핀® 미생물 DNA 키트 (맥커리 나겔; 독일 두렌)를 사용하여 NBS-성장된 배양물의 게놈 DNA를 단리하였다. 라이게이션 키트 (옥스포드 나노포어; 영국 옥스포드)에 의해 1D 게놈 DNA의 도움으로 라이브러리를 제조하였다.

시토신 데아미나제 CodA와의 상동 재조합 및 역선택을 기반으로 하는 결실 시스템.

acb 유전자 클러스터의 유전자로의 벡터 통합은 복제 벡터 pKC1139를 사용하여 발생하였다. 이러한 관찰에 기초하여, 상동 재조합을 사용하는 신규 결실 시스템이 개발되었고 유전자 cgt (ACSP50_5024)의 예에 의해 테스트되었다.

전달 기점 (ncP) 및 릴랙소좀 유전자 traJ를 갖는 벡터 백본을 사용하여 악티노플라네스 종 SE50/110 내로의 접합이 가능해졌다. 본 작업에서는, 아프라마이신 및 카나마이신 내성을 매개하는 2가지 상이한 항생제 내성 마커가 선택에 대해 테스트되었다: aph(3')II (kan^R, 카나마이신) 및 aac(3)IV (apm^R, 아프라마이신). 더욱이, 높은 카피 수 ColE1/pMB1/pBR322/pUC 복제 기점이 통합되어 공여자 균주 이. 콜라이에서의 복제가 가능해진다. ori, oriT_ncP, tra 유전자 및 내성 카세트는 각각 pRT802 및 pRT801로부터 취하였다 (Gregory et al. 2003). 악티노플라네스 종 SE50/110에서 복제를 위한 레플리콘 뿐만 아니라 부착 부위가 있는 인테그라제 유전자도 신규 결실 시스템에 함유되어 있지 않기 때문에, 벡터는 상동 재조합에 의해 게놈에 통합될 때 악티노플라네스 종 SE50/110에서만 유지될 수 있다 (도 7). 이를 위해 유전자 cgt를 플랭킹하는 2 kB의 상동 서열이 통합되었다. 악티노플라네스 종 SE50/110에서의 접합성 전이 후, 제1 교차가 발생한 돌연변이체가 아프라마이신 또는 카나마이신 내성에 의해 선택될 수 있다. 벡터 백본의 분해를 강제하기 위해 (제2 교차), 5-플루오로시토신 (5-FC)이 부가되고, 이는 시토신 데아미나제 CodA에 의해 독성 산물인 5-플루오로우라실 (5-FU)로 전환된다. 이러한 작업에서는, 스트렙토미세스 아종에 대해 코돈 최적화된 codA가 사용된다 (Dubeau et al. 2009). 제2 교차 후 야생형의 유전자형 또는 결실 돌연변이체의 유전자형이 존재한다.

신규 결실 시스템은 유전자 cgt에 대해 성공적으로 테스트되었으며, 이는 콜로니 PCR 및 ONT 시퀀싱에 의해 제시되었다. 성공적인 제2 교차 후 결실 돌연변이체의 비율은 25% 내지 32%였다. 작업 흐름은 도 8에 예시되어 있다.

분석 방법

고성능 액체 크로마토그래피 ( HPLC )에 의한 상등액으로부터의 아카르보스 정량화

악티노플라네스 아종의 말토스 성장된 배양물의 상등액을 원심분리하고 (20,000 g, 2분), 와동에 의해 메탄올과 1:5로 혼합하고, 다시 원심분리하여 침전물을 제거하였다 (20,000 g, 2분). 샘플을 HPLC 바이알로 옮기고 애질런트(Agilent)의 HPLC 시스템 1100 시리즈 (G1312A 이원 펌프 일련번호 DE43616357, G1329A ALS 자동샘플러 일련번호 DE43613/10, G1315A 다이오드 어레이 검출기 (DAD) 일련번호 DE9200246)에서 분석하였다. 정지상으로서, 써모 피셔 사이언티픽 인크. (미국 매사추세츠주 월섬)의 하이퍼실(Hypersil) APS-2 칼럼 (125x4 mm, 3 μm 입자 크기)을 사용하고 40℃로 가열하였다. 이동상으로서 1 mL·min^-1 68% 아세토니트릴 (용매 B) 및 32% 인산염 완충액 (0.62 g·L^-1 KH₂PO₄ 및 0.38 g·L^-1 Na₂HPO₄·2H₂O) (용매 A)의 등용매 흐름이 적용되었다. 40 μL의 각각의 샘플을 주입하고 10분 실행으로 분리하였다. 아카르보스의 검출은 210 nm (참조 360 nm)에서 DAD 검출기로 수행되었고 교정 곡선의 피크 면적으로부터 정량화되었다.

액체 크로마토그래피-질량 분석법 (LC-MS)

세포내 대사산물의 분석을 위한 샘플 제조

악티노플라네스 종 SE50/110 균주의 삼중물을 적어도 4일 동안 말토스 최소 배지에서 성장시켰다. 배양액 10 mL를 부흐너 깔때기로 여과지를 통해 빠르게 여과하고 2.63 g·L^-1 NaCl 용액으로 세척하였다. 세포를 미리 칭량된 둥근 바닥 스크류 캡 튜브로 옮기고 액체 질소에서 급속 냉동하고 -80℃에서 저장하였다. 세포를 써모 피셔 사이언티픽 (미국 매사추세츠주 월섬)의 원심 증발기 (SpeedVac)에서 밤새 건조시켰다. 4 mg의 건조된 세포를 0.1 mm, 0.05 mm 및 0.01 mm 크기의 지르코니아/실리카 마이크로 비드 혼합물 [바이오 스펙 프러덕츠 인크. (Bio Spec Products Inc.; 미국 바틀즈빌)] 약 500 μL를 함유하는 신선한 2 mL 스크류 캡 튜브로 옮겼다. 700 μL 80% MeOH를 세포와 비드에 부가하였다. 세포 파괴는 균질화기 (패스트프렙 FP120, 써모 피셔 사이언티픽; 미국 매사추세츠주 월섬)에서 속도 설정 6.5에서 30초 동안 3회 수행되었다. 샘플을 중간에 얼음 위에서 5분 동안 냉각시켰다. 세포 현탁액을 13,000 g 및 4℃에서 5분 동안 원심분리하였다. 500 μL의 상등액을 HPLC 바이알로 옮기고, 질소 흐름 하에서 건조시키고, 50 μL 증류수에 용해시켰다.

세포외 아카르비오실 -대사물질의 분석을 위한 샘플 제조

샘플 제조는 문헌 [Ortseifen (2016)]에 기재된 프로토콜에 따라 시행되었다. 크로마본드(Chromabond)® 이지 칼럼 (맥커리 나겔; 독일 두렌, REF 730753)을 사용하여 고체상 추출에 의해 10 mL의 상등액으로부터 당 및 유사 당을 농축시켰다. 칼럼을 3 mL 메탄올로 평형화한 후, 샘플을 로딩하기 전에 3 mL 증류수로 세척하였다. 비특이적 결합 대사산물을 3 mL 95% (v/v) 메탄올로 세정하였다. 3 mL 메탄올에서 용리를 시행하였다.

세포내 및 세포외 대사산물의 LC- ESI -MS

LC-MS의 경우, 마이크로TOF-Q 하이브리드 사중극자/비행 시간 질량 분석기 [브루커 달토닉스 (Bruker Daltonics; 독일 브레멘)]에 커플링된 라크롬울트라(LaChromUltra) [히타치 유럽 리미티드 (Hitachi Europe Ltd.; 영국)] HPLC 시스템이 사용되었으며, 이에는 전자분무 이온화 (ESI) 소스가 장착되어 있다.

세포내 대사산물의 분석을 위해, 세콴트(SeQuant)® ZIC®-pHILIC 5 μm 폴리머 칼럼 (150 x 2.1 mm) [머크 (Merck; 독일 다름슈타트)]으로 2 μL의 샘플을 분리하였다. 용리액 A (20 mM NH₄HCO₃, pH 9.3, 암모니아 수용액으로 조정됨) 및 용리액 B (아세토니트릴)를 하기 구배를 사용하여 0.2 mL·min^-1의 유속으로 적용하였다: 0분 B: 90%, 30분 B: 25%, 37.5분 B: 25%, 40.0분 B: 80%.

피크 확인을 위한 표준으로서, 10 μM의 UDP-글루코스, 글루코스-1-포스페이트, 갈락토스-1-포스페이트, 글루코스-6-포스페이트 및 dTDP-글루코스 2 μL를 주입하였다.

세포외 아카르비오실-대사산물의 분석을 위해, 샘플 10 μL를 코젠트 다이아몬드 하이브리드(Cogent Diamond Hydride)™ HPLC 칼럼 (마이크로솔브 테크놀로지 코포레이션(MicroSolv Technology Corporation); 150 mm x 2.1 mm, 3 μL 입자 크기)으로 분리하였다. 용리액 A (50% (v/v) 아세토니트릴, 50% (v/v) H₂O 및 0.1% (v/v) 포름산) 및 용리액 B (90% (v/v) 아세토니트릴, 10% (v/v) H₂O 및 0.1% (v/v) 포름산)을 하기 구배를 사용하여 0.4 mL·min^-1의 유속으로 적용하였다: 0분 B: 100%, 8분 B: 0%, 13분 B: 0%, 15.5분 B: 100%, 18분 B: 100%.

ESI 소스는 세포내 대사산물의 분석을 위한 음성 이온화 모드와 세포외 아카르비오실-대사산물의 분석을 위한 양성 이온화 모드에서 작동되었다. 건조 기체 및 모세관의 온도는 180℃로 설정되었다. MS의 스캔 범위는 각각 200-1,000 m/z (세포내 대사산물) 및 50-3,000 m/z (세포외 아카르비오실-대사산물)로 설정되었다.

특이적 질량의 피크 면적은 소프트웨어 콤파스(Compass)™ (브루커 달토닉스; 독일 브레멘)를 사용하여 통합되었다. 피크는 각각 건조된 세포의 칭량된 양 (세포내 대사산물) 및 샘플링 시 세포 건조 중량 (세포외 아카르비오실-대사산물)에 대해 정규화되었다.

카로티노이드의 추출 및 분석

추출

악티노플라네스 종 SE50/110으로부터의 세포 펠릿을, 0.1 mm, 0.05 mm 및 0.01 mm 크기의 지르코니아/실리카 마이크로 비드 혼합물 (바이오 스펙 프러덕츠 인크.; 미국 바틀즈빌) 약 500 μL이 포함된 2 mL 스크류 캡 튜브로 옮겼다. 1 mL의 아세톤 또는 메탄올을 추출 용매로서 부가하였다. 세포 파괴는 균질화기 (패스트프렙 FP120, 써모 피셔 사이언티픽; 미국 매사추세츠주 월섬)에서 속도 설정 6.5에서 45초 동안 3회 수행되었다. 샘플을 중간에 얼음 위에서 5분 동안 냉각시켰다. 균질화된 세포 현탁액을 13,000 g 및 4℃에서 20분 동안 원심분리하였다. 상등액을 유리 바이알로 옮겼다. HPLC 분석을 위해, 아세톤 추출물과 메탄올 추출물의 혼합물을 7:3의 비율로 생성하고 신규 유리 바이알로 옮겼다.

박층 크로마토그래피 (TLC) 및 스펙트럼 분석

추출된 카로티노이드 50 μL를 실리카 겔 매트릭스 [HPTLC-HL, Cat. 58077, 아날테크 인크. (Analtech Inc.; 미국 뉴어크)] 상에 5 μL-단계로 적용하고 100 mL 페트로리움, 11 mL 이소프로판올 및 50 μL 물로 채워진 TLC-챔버에서 인큐베이션하였다. 본 실행은 어두움 속에서 수행되었다. TLC 플레이트를 건조시킨 후, 메스로 밴드를 벗겨내고 신규 튜브로 옮겼다. 1 mL 에탄올을 부가한 후, 써모 피셔 사이언티픽 (미국 매사추세츠주 월섬)의 제네시스(Genesys) 10S UV-Vis 분광 광도계를 사용하여 흡수 스펙트럼을 분석하였다.

흡광도 스캔을 통한 카로티노이드의 HPLC 분석

카로티노이드는 UV-Vis 스펙트럼을 위한 다이오드 어레이 검출기 (DAD)를 포함하는 애질런트 1200 시리즈 HPLC 시스템 [애질런트 테크놀로지스 게엠베하 운트 코. 카게 (Agilent Technologies GmbH&Co. KG; 독일 뵈블링겐)]을 사용하여 문헌 [Henke et al. (2017) and Heider et al. (2014)]에 따라 역상 HPLC에 의해 분리되었다. 20 μL 샘플 용적을 0.5 mL·min^-1의 유속으로 적용하였다. 정지상으로서, CS 크로마토그래피서비스 게엠베하 (CS ChromatographieService GmbH; 독일 랑게르웨)로부터의 프리-칼럼 (10x4 mm 물토하이(MultoHigh) 100 RP18-5)과 메인 칼럼 (프론토실(ProntoSIL) 200-5 C30, 250x4 mm)이 이전에 설명된 바와 같이 사용되었다 (Heider et al. 2014; Henke et al. 2017).

하기 구배가 적용되었다: 0분 A: 100%, 32분 A: 75%, 47분 A: 0%, 70분 A: 0%, 75분 A: 100%, 용리액 A는 15:85 (v/v)의 비율로 탈이온수 중 0.1 M 암모늄 아세테이트와 메탄올로 이루어진다. 용리액 B는 44:43:13 (v/v)의 비율로 메탄올, 아세토니트릴 및 아세톤의 혼합물로 이루어진다. 카로티노이드의 검출은 470 nm에서 시행되었다. 부가적으로, 360 nm 내지 700 nm의 파장 스캔은 상기 실행 동안 매초 수행되었다.

검정

글루쿠로니다제 활성의 분광광도 측정에 의한 프로모터 스크리닝 실험

2가지 상이한 유형의 글루쿠로니다제 검정이 수행되었다: 하나는 단백질 원료 추출물을 사용하고 다른 하나는 전체 세포를 사용한다. 문헌 [Horbal et al. (2013) and Siegl et al. (2013)]에 기재된 프로토콜이 악티노플라네스 종 SE50/110에 적응되었다. 기질 5-브로모-4-클로로-3-인돌릴-β-D-글루쿠로니드 [X-Gluc, 애플리켐 게엠베하 (AppliChem GmbH; 독일 다름슈타트)]가 선택되었으며, 이는 기질 p-니트로페닐-D-글루쿠로니드가 본 발명자들의 검정 조건 하에서 해리되는 것으로 밝혀졌기 때문이다.

성장 조건 및 샘플 제조

gusA 유전자를 갖는 프로모터 구축물을 보유하는 악티노플라네스 돌연변이체를 상기 기재된 바와 같이 말토스 최소 배지에서 1주 동안 배양하였다. 검정은 성장기 동안 시행되었다. 500 μL의 각각의 배양물을 전체 세포로 검정하기 위해 샘플링하였다. 단백질 원료 추출물을 사용한 검정을 위해 1 mL를 샘플링하고 0.1 mm 및 0.05 mm 크기의 지르코니아/실리카 마이크로 비드 (바이오 스펙 프러덕츠 인크.; 미국 바틀즈빌)를 함유하는 스크류 캡 튜브로 옮겼다. 세포를 균질화기 (패스트프렙 FP120, 써모 피셔 사이언티픽; 미국 매사추세츠주 월섬)에서 속도 설정 6.5에서 30초 동안 2회 및 그 중간에 얼음 위에서 5분 동안 파괴하였다. 원심분리 후, 용해물을 새로운 반응 튜브로 옮기고 원심분리하였다. 상등액은 무세포 검정에 사용되었다. 총 단백질 정량화는 브래드포드(Bradford) 검정에 의해 수행되었다 (상기 참조).

글루쿠로니다제 (gus) 검정

gus 검정은 흑색 미세역가 플레이트 [96 웰 PS F-바닥 μCLEAR, 흑색, 중간 바인딩, 그라이너 바이오-원 (Greiner Bio-One; 오스트리아 크렘스윈스터), REF 655096]에서 수행되었다. 100 μL의 각각의 샘플 (세포 현탁액 또는 용해물)을 3개의 웰에 피펫팅했으며, 그 중 하나는 음성 대조군으로서 제공되고, 2개는 기술적 복제물로서 제공되었다. gus 완충액 [5 mM DTT 및 0.1% 트리톤-X-100이 포함된 50 mM 인산염 완충액 pH 7.0 (5.136 g·L^-1 Na₂HPO₄·2H₂O, 3.299 g·L^-1 NaH₂PO₄·2H₂O)]을 2 mM 기질 X-Gluc (원액: DMF 중 0.2 M)로 보충시켰다. 샘플 100μL에 100 μL를 부가하였다. 음성 대조군의 경우, 기질이 없는 100 μL gus 완충액을 부가하였다. 각각의 샘플의 개별 음성 대조군 외에, 배지 및 기질 대조군도 제조하였다.

미세역가 플레이트는 미리 가온된 테칸 리더 인피니티(Tecan reader Infinite) M200 [Ref 30016056, 테칸 그룹 아게 (Tecan Group AG; 스위스 므네도르프)] (37℃)에서 각각 3시간 (전체 세포를 사용한 검정) 및 2시간 (용해물을 사용한 검정)으로 측정되었다. 인디고의 최대 흡수는 610 및 660 nm에서 측정되었다. 모든 대조군의 흡수 값을 할인한 후, 각각의 흡수 곡선의 기울기를 선형 회귀에 의해 계산하고 세포 건조 중량 (전체 세포를 사용한 검정) 또는 전체 단백질 양 (용해물을 사용한 검정)에 대해 정규화하였다. 정규화된 기울기를 사용하여 상이한 돌연변이체에서 β-글루쿠로니다제 활성을 비교하였다.

바이오로그 ( Biolog )® 옴니로그 ( OmniLog ) 표현형 마이크로어레이 시스템에서의 스크리닝 실험

상이한 탄소 공급원 (패널 PM1 및 PM2)에 대한 호흡을 평가하기 위해 바이오로그® 옴니로그 확인 시스템 (미국 캘리포니아주 헤이워드)에서 사전 스크리닝 실험을 수행하였다. 악티노플라네스 종 SE50/110 야생형 및 결실 돌연변이체 Δcgt는 본원의 다른 곳에서 기재된 바와 같이 SFM 한천 플레이트에서 성장시켰다. 멸균 면봉을 사용하여 세포를 수거하고 PM1 및 PM2에 대한 접종액 IF-0a에 희석하였다. 세포 현탁액의 탁도는 제조업체의 프로토콜에 따라 바이오로그®의 탁도계에서 80% 투과율을 달성하도록 검사되었다. 2.32 mL의 세포 현탁액을 제조업체의 프로토콜에 따라 20 mL IF-0a, 0.24 mL 0.5 M MgCl₂, 0.24 mL 0.5 M Na₂SO₄, 0.24 mL 1.5 M NH₄Cl, 0.24 mL 1.0 M Na₃PO₄, 0.24 mL 증류수, 0.24 mL 바이오로그 레독스 염료 믹스 G, 및 0.24 mL 금속 이온 칵테일 (5.0 mM 각각: ZnCl₂·7H₂0, FeCl₂·6H₂O, MnCl₂·4H₂O, CaCl₂·2H₂O)에 부가하였다. PM 패널에 제조된 용액을 웰당 100 μL씩 접종하고 옴니로그 시스템 (모드 71000 일련번호 406)에서 28-30℃ 하에 1주 동안 인큐베이션하였다. 데이터 평가는 제조업체의 소프트웨어 (역학 분석, 바이오로그 및 옴니로그 2.3, 바이오로그)를 사용하여 수행되었다.

RNA 작업

샘플링 및 RNA 단리

트랜스크립톰 분석을 위해, 성장기 동안 2x 1 mL 배양물을 취하고, 원심분리 (10초)에 의해 상등액으로부터 분리하고 액체 질소에서 급속 동결하였다. 펠릿은 추가 프로세싱이 있을 때까지 -80℃에서 저장되었다.

리보핵산 (RNA)의 단리를 위해, 동결된 세포 펠릿을 500 μL LB 완충액 (뉴클레오스핀® RNA 플러스, 맥커리 나겔; 독일 두렌)에 재현탁하고 2 mL 용해 매트릭스 튜브 [0.1 mm 구형 실리카 비드, MP 바이오메디칼즈 (MP Biomedicals; 미국 캘리포니아주 산타 아나)]에 옮겼다. 세포 파괴는 균질화기 (패스트프렙 FP120, 써모 피셔 사이언티픽; 미국 매사추세츠주 월섬)에서 속도 설정 6.5 및 중간에 5분 동안 얼음에서 20초 동안 3회 수행되었다. 이어서, 세포 현탁액을 13,000 g 및 4℃에서 5분 동안 원심분리하였다. 상등액은 온-칼럼 DNA 소화를 위해 rDNase 세트 (맥커리 나겔; 독일 두렌)와 조합하여 뉴클레오스핀® RNA 플러스 키트를 사용하여 RNA 추출에 사용되었다. 제조업체의 프로토콜에 따라 클린 업 및 용리한 후, DNA-소화를 반복하고 (용액 중) 샘플을 동일한 키트를 사용하여 다시 클린 업하였다. 악티노플라네스 종 SE50/110의 게놈 DNA와 결합하고 약 200-300 nt에서 작은 단편을 증폭시키는 2개의 프라이머 쌍을 사용하여, 잔류 DNA에 대해 샘플을 테스트하였다. 필요한 경우 DNA 소화 및 RNA 클린 업을 반복하였다. RNA의 양은 나노드롭(NanoDrop) 1000 분광계 [페클랩 (Peqlab; 독일 에를랑겐)]로 분석되었다.

역전사 정량적 PCR

역전사 정량적 PCR은 문헌 [Wolf et al. (2017a)]의 프로토콜에 따라 로슈(Roche) (독일 만하임)의 라이트사이클러 96 시스템에서 센시패스트(SensiFast) SYBR No-Rox 1-단계 키트 [바이오라인 (Bioline; 영국 런던)] 및 96 웰 라이트사이클러 플레이트 [사르스테트 (Sarstedt; 독일 넴브레흐트)]를 사용하여 수행하였다. 상대적 RNA 양은 총 RNA (100 ng)에 대해 정규화되었고 2^- ^ΔCq로서 계산되었다. ΔCq는 대조군 균주와 비교하여 돌연변이체 균주에서의 평균 Cq의 차이이다. 표 E9에서의 프라이머는 유전자의 상대적 전사를 결정하는 데 사용되었다.

표 E9 RT-qPCR 실험에 사용되는 프라이머.

전체 게놈 올리고뉴클레오티드 마이크로어레이

전체 게놈 올리고뉴클레오티드 마이크로어레이는 문헌 [Wolf et al. (2017a)]의 프로토콜에 따라 수행되었으며, 여기서는 악티노플라네스 종 SE50/110의 높은 G + C 함량에 혼성화 절차를 적응시켰다.

삼중물의 RNA를 단리하고 등몰 풀링하였다 (12 μL 중 5 μg 풀링된 RNA의 총량). cDNA 합성, 표지화 및 마이크로어레이 혼성화를 위해, 2-색 마이크로어레이-기반 원핵생물 분석 페어플레이 III 표지화 키트 (버전 1.4, 애질런트 테크놀로지스; 미국 캘리포니아주 산타 클라라)를 문헌 [Wolf et al. (2017a)]에 기재된 실제적인 조정을 사용하여 제조업체의 지침에 따라 사용하였다. 아머샴 시다이(Amersham CyDye) 단일 반응성 염료 팩 [GE 헬스케어 (GE Healthcare; 영국 리틀챌폰트)]을 표지화에 활용하였다. 악티노플라네스 종 SE50/110의 코딩 서열을 나타내는 맞춤형 전체 게놈 올리고뉴클레오티드 마이크로어레이가 사용되었으며, 이는 문헌 [Wolf et al. (2017a)]에 의해 설계되었다 (4x44K 형식, 8,238개의 유전자 및 1,417개의 대조군 지점을 나타내는 43,803개의 피쳐, 공급업체: 애질런트 테크놀로지스; 미국 캘리포니아주 산타 클라라). 혼성화 오븐 및 스캐너를 포함한 모든 마이크로어레이 특이적 시약 및 장치는 애질런트 테크놀로지스 (미국 캘리포니아주 산타 클라라)로부터 사용되었다. 애질런트 피쳐 추출 소프트웨어 버전 10.7.3.1 (애질런트 테크놀로지스; 미국 캘리포니아주 산타 클라라)이 피쳐 추출에 사용되었다 (프로토콜 GE2_107_Sep09). LOWESS 정규화 및 통계 분석을 포함한 후속 데이터 분석은 마이크로어레이 및 유전자 발현 (MAGE) 호환 시스템 EMMA 2를 사용하여 수행되었다 (Dondrup et al. 2009). 0.05의 p-값은 유의성에 대한 컷오프로서 사용되었다. 0.01의 잘못된 발견 비율에 대한 M-값 컷오프는 문헌 [Wolf et al. (2017a)]에 의해 수행된 이전 "황색 실험"에 따라 1.1 및 -1.1로서 결정되었다.

Cgt의 기능적 관련성의 분석

유박테리아 세계에서 단일 도메인 CBM -20 단백질의 분포

본 발명자들은 BlastP 분석에 의해 원핵생물 세계에서 CBM-20 단일-도메인 단백질의 분포를 분석하였다.

간단히 언급하면, 단일 CBM-20-도메인 단백질의 분포는 NCBI 비-중복 단백질 데이터베이스를 사용하는 BlastP 분석에 의해 분석되었다 (Altschul et al. 2005; Altschul et al. 1990). CBM-20 도메인은 다양한 상이한 단백질과 효소에서 발생하기 때문에, 데이터 필터링을 수행해야 하였다: 초기 3,316개의 BlastP 히트 중에서, 모든 진핵생물 기원과 기능-특이적 주석 또는 350개 초과의 아미노산 크기를 가진 모든 효소는 배제되었다. 나머지 80개의 BlastP 히트의 도메인 구조가 분석되었다 (Marchler-Bauer et al. 2017; Marchler-Bauer and Bryant 2004; Marchler-Bauer et al. 2015; Marchler-Bauer et al. 2010). 이들 대부분은 총 53개의 단백질로, 글리코-히드로-77-슈퍼패밀리 4-알파-글루카노트랜스퍼라제로서 기재된 상위 도메인이 가로지르는 2개의 CBM-20 도메인을 함유한다. 10개는 상이한 부가의 도메인을 함유한다: 그 중 5개는 알파-아밀라제 억제제 도메인이고, 2개는 각각 N-말단에 있는 CBM-25 및 CBM-26 결합 도메인이며, 2개는 가능한 조절 기능이 있는 IPT-슈퍼패밀리의 N-말단 도메인이고, 1개는 여러 알파-아밀라제에서 발생하는 것으로 기재된 DUF1393-도메인이다 (NCBI 데이터베이스로부터 가져온 정보). 이들 후보 또한 배제되었다. 18개의 후보 (악티노플라네스 종 SE50/110으로부터의 Cgt 포함)만이 단일 CBM-20 도메인을 표시하였다. BlastP에 의해 수행된 다중 서열 정렬을 기반으로 하여 NCBI 데이터베이스 (NCBI 데이터베이스)의 Blast 트리 뷰 1.17.5에 의해 단백질 트리가 생성되었다 (Altschul et al. 1990; Altschul et al. 2005).

흥미롭게도, 단일 CBM-20 도메인 단백질은 17개의 다른 종에서만 발견되었다 (도 9). 이들 중 대부분은 악티노미세탈레스 목의 종, 예를 들어 악티노플라네스 속의 모든 균주에서 발견된다. 17개 종의 대부분, 즉 에이. 미소우리엔시스(A. missouriensis) ([Parenti and Coronelli 1979), 에이. 우타헨시스(A. utahensis) (문헌 [[Parenti and Coronelli (1979)]에 기재되고 문헌 [Couch (1963)]에 의해 처음으로 단리됨), 에이. 테이코미세티쿠스 (Wink et al. 2006), 스트렙토미세스 종 94 (Chu et al. 1996), 스트렙토미세스 종 OK885 (뿌리로부터 단리됨, 미국 테네시주, NCBI (NCBI 데이터베이스)의 진뱅크 (Benson et al. 2013)로부터 가져온 정보), 스트렙토스포란지움 로세움(Streptosporangium roseum) (Nolan et al. 2010), 스트렙토스포란지움 스클레로티알루스(Streptosporangium sclerotialus) [동의어: 카이니아 안티비오티카(Chainia antibiotica)] (Thirumalachar 1955), 셀룰로모나스(Cellulomonas) 종 B6 (Piccinni et al. 2016), 파에니바실루스(Paenibacillus) 종 P22 (Hanak et al. 2014), 및 클로스트리디움(Clostridium) 종 DMHC 10 (이는 증류소 폐기물 처리 공장의 슬러지로부터 단리되었다)은 원래 토양 및 환경 샘플로부터 단리되었다 (Kamalaskar et al. 2010). CBM-20 단백질은 또한, 샘플링 부위가 보고되지 않은 스트렙토미세스 종 DI166, 및 슈도모나다세아에(Pseudomonadaceae) 과의 여러 종에서 발생한다. 그들은 토양에 서식하는 구성원을 포함하는 것으로 공지된 속에 속한다.

서식지 토양 또는 환경에 직접 연계되지 않으면서 단일 CBM-20 단백질을 운반하는 균주는 인간 병원체 클라미디아 트라코마티스(Chlamydia trachomatis) (Thomson et al. 2008) 및 미코박테리움 압세수스(Mycobacterium abscessus) (Ryan and Byrd 2018; Moore and Frerichs 1953)의 단일 단리물과 같이 가끔씩만 발생한다.

시험관내 검정에 의한 전분 결합 기능의 확증

CBM-20 도메인은 전분 결합 기능을 갖는 것으로 기재되어 있으며, 이는 본 발명자들이 시험관내 검정으로 테스트하고자 하였다. 작은 탄수화물 결합 단백질 Cgt는 N-말단 신호 펩티드로 인해 세포외 공간에서 고도로 발현되고 풍부하기 때문에 (Wendler et al. 2015a), 상기 단백질은 여과에 의해 상등액으로부터 직접 농축될 수 있었다. 상이한 농도의 감자로부터의 전분을 사용하여 전분 결합 검정을 수행하였다. 전분 분획 뿐만 아니라 상등액 둘 다를 SDS-PAGE로 분석하였다. 모든 전분 분획 (전분의 1 내지 10% (w/v) 범위)에서, 약 15 kDA에서의 단백질 밴드가 검출되었으며, 이는 MALDI-TOF-MS에 의해 Cgt로서 명확하게 확인되었다. 대조적으로, 상등액 분획은 Cgt에 의해 거의 완전히 고갈되었다. 상등액 중 잔류 Cgt가 발견되었으며, 이는 부가된 전분이 Cgt에 의해 완전히 포화되었음을 나타낸다. 전분이 없는 음성 대조군에서는, 대부분의 Cgt가 상등액 분획에 남아있다. Cgt 외에, 기능이 공지되지 않은 또 다른 작은 세포외 단백질인 ACSP50_6253이 전분 결합 검정에 의해 확인되었다 (데이터는 제시되지 않음).

상이한 탄소 공급원에서 성장하는 동안 cgt 발현의 분석

유전자 cgt는 글루코스 및 말토스에 대한 트랜스크립톰 및 프로테옴 분석에 의해 결정된 바와 같이, 상이한 탄소 공급원의 존재 하에서 차등적으로 발현되는 것으로 보고되었다 (Schwientek et al. 2013; Wendler et al. 2015a; Ortseifen 2016). 본 발명자들은 역전사 정량적 PCR (RT-qPCR)에 의해 전사체 양을 측정함으로써 cgt 유전자의 발현에 대한 여러 탄소 공급원의 효과를 테스트하였다. 이를 위해, 악티노플라네스 종 SE50/110의 야생형 균주를 말토스, 글루코스, 전분, 갈락토스, 셀로비오스, 락토스 및 C-Pur가 보충된 최소 배지에서 성장시켰다 (케레스타 01908) (도 10). 후자는 주로 말토스와 말토트리오스로 이루어진 전분의 분해로부터의 당 함유 산물이다. 모든 탄소 공급원은 등가의 C-몰 양으로 보충되었다. 유일한 예외는 전분이었다: 낮은 용해도로 인해, 여기에서 아크로스 오가닉스로부터의 "전분 가용성"의 4% (w/v) 유백색 용액이 생성되었다. 비교를 위해, 감소된 양의 말토스를 포함하는 말토스 최소 배지 (여기서: 44.40 g·L^-1 말토스 일수화물)를 제조하였으며, 여기서 C-몰농도는 전분 배지 중의 C-몰농도와 비슷해야 한다.

대부분의 테스트된 탄소 공급원의 경우, cgt 유전자의 전사는 말토스 성장된 배양물과 비교하여 유사하거나 약간 무의미하게 감소되었다 (도 11a). 갈락토스에 대한 차등 전사가 약간 관찰되었다 (3.4배 덜 전사됨, log2(변화 배수) = 0.291). 탄소 공급원 글루코스 (142배 덜 전사됨, log2(변화 배수) = 0.007) 및 락토스 (62배 덜 전사됨, log2(변화 배수) = 0.016)에 대해 cgt 전사체의 상당한 감소가 측정되었다. 세포가 감소된 양의 말토스 (여기서: 72.06 g·L^-1 대신 44.4 g·L^- ¹)를 포함하는 말토스 최소 배지에서 성장했을 때, cgt 유전자의 전사가 2.9배 감소되는 것으로 관찰되었다 (log2(변화 배수) = 0.345) (도 11b).

유전자 결실 돌연변이체 Δcgt의 분석

상이한 탄소 공급원 또는 탄소 제한 조건 하에서의 Δcgt

탄소 공급원의 의존성에 있어서의 cgt의 차등 전사 프로파일은 이전에 추정된 것처럼 당 대사 내의 기능을 나타내었다 (Ortseifen 2016). 문헌 [Ortseifen 2016]에서는 카르보포어 모델의 맥락에서 탄소를 에너지원으로서 보유하는 책임이 Cgt에 있다고 제안되었다. 야생형 및 CRISPR/Cas9 결실 돌연변이체 Δcgt의 성장은 액체 배양물 중 상이한 탄소 공급원에서 테스트되었다.

이전에, 옴니로그 표현형 마이크로어레이 시스템 [바이오로그 인크. (Biolog Inc.; 미국 헤이워드)]에서 사전 스크리닝 실험을 수행하였으며, 이러한 시스템은 다중-웰 플레이트에서 총 190개의 상이한 탄소 공급원에 대한 세포 호흡 활동을 측정함으로써 빠른 표현형 스크리닝을 허용한다. 이들 중에서, 악티노플라네스는 103개의 탄소 공급원에서 호흡을 표시하였다. 아라비노스 및 락토스를 제외하고, 나머지 101개의 탄소 공급원에서 Δcgt에 대해 차등 호흡 프로파일이 관찰되지 않았다. 성장 수준에서 이러한 결과를 검증하기 위해, 탄소 공급원 아라비노스 및 락토스를 진탕 플라스크 배양에서 추가로 테스트하였다. 또한, 표준 실험실 당 말토스 및 글루코스, 복합 탄소 공급원 전분 뿐만 아니라 디사카라이드 셀로비오스를 테스트하여 서식지 토양의 자연 탄소 공급원을 모방하였다. Δcgt에 대해서는 성장에 대한 제한이 관찰되지 않았다 (도 12 및 도 13).

더욱이, 탄소 제한된 조건 (여기서: 1 g·L^-1, 2 g·L^-1, 3 g·L^-1, 4 g·L^-1 및 5 g·L^-1 전분) 하에서의 성장은 m2p-랩스의 로보렉터® 시스템에서 테스트되었다. Δcgt 돌연변이체에 대한 성장 단점은 야생형과 비교하여 탄소 공급원 제약의 경우에 관찰되지 않았다 (도 14).

Δcgt는 오스몰농도 내성 또는 pH 내성에 영향을 미치지 않는다

Cgt 다량체는 다량체화를 통해 표면층을 형성하기 위해 제안되었다 (Wendler et al. 2015a). 이것은 가뭄, pH 및 오스몰농도와 같은 환경 변화로부터 보호하는 잠재적인 역할을 제안할 수 있다.

로보렉터® 시스템에서 액체 배양물 뿐만 아니라 고체 배지에서 pH 스크리닝을 수행하였다. 고체 배지 상에서의 스크리닝을 위해, pH 4 내지 11 범위의 pH의 SFM-한천 플레이트 (1의 단계에서)를 제조하고 야생형 포자와 결실 돌연변이체 Δcgt의 희석 시리즈의 액적을 적용하였다. 돌연변이체와 야생형 둘 다는 pH 5 내지 11에서 성장할 수 있었다. 한천-플레이트 상에서는 성장 또는 포자 형성에 있어서의 차이가 관찰되지 않았다.

가뭄 내성의 효과를 평가하기 어렵기 때문에, 본 발명자들은 박테리아 잔디 표면 상의 콜로니 및 포자 형성을 분석하고 야생형과 Δcgt 간에 차이를 발견하지 못하였다.

액체 배양물에서의 pH 스크리닝을 위해, 4 내지 7 범위의 pH의 말토스 최소 배지를 제조하였다. 배지 성분이 침전되는 경향이 있으므로, 더 높은 pH 값은 액체 배양물에서 테스트될 수 없었다. 균주 둘 다가 pH 4.5 내지 7에서 성장하였다 (도 15). 최종 세포 건조 중량과 관련하여 차이가 관찰되지 않았다.

오스몰농도 스크리닝을 위해, 말토스 최소 배지는 3.6 내지 108.1 g·L^-1 말토스 일수화물 범위의 상이한 농도의 말토스 및 323.5 내지 681.0 mOsmol·kg^-1 범위의 오스몰농도를 사용하여 제조되었다 (표 E11). 야생형과 결실 돌연변이체 Δcgt 간에는 유의한 성장 차이가 관찰되지 않았다 (도 16).

또한, 이노시톨은 삼투질로서 테스트되었는데, 이는 이것이 악티노플라네스에 의해 소비되지 않기 때문이다. 여기에서, 오스몰농도는 388.5 내지 695.0 mOsmol·kg^-1의 범위였지만 성장 차이는 관찰되지 않았다 (도 17).

복합 배지 NBS를 사용하여 159 내지 190 mOsmol·kg^-1의 더 낮은 오스몰농도를 테스트하였다 (도 19, 표 E10). 다시 언급하면, 야생형 균주와 결실 돌연변이체 Δcgt 간에는 성장에 있어서의 유의한 차이가 관찰되지 않았다.

표 E10 스크리닝 실험의 표 요약. 오스몰농도 및 pH 스크리닝을 위해 본 작업에 사용된 상이한 최소 배지의 최종 세포 건조 중량, 최종 아카르보스 농도, pH 및 오스몰농도. pH 스크리닝에 사용되는 배지에서의 상이한 오스몰농도는 보정제의 부가로 인해 야기된다.

Δcgt는 말토스 최소 배지에서 개선된 아카르보스 형성을 나타낸다.

테스트된 조건 하에서 뚜렷한 성장 표현형이 관찰되지 않았지만, 고도로 발현된 Cgt 단백질의 결여는 세포의 대사 자원, 예컨대 ATP 및 아미노산을 절약하는 것으로 보인다. 이들은 세포 성장 또는 기타 동화 프로세스에 사용될 수 있다. 본 실험에서는, Δcgt가 유의한 성장 이점을 나타내지 않았다. 그러나, 야생형과 비교하여 결실 돌연변이체 Δcgt에 대해 현저하게 더 높은 최종 아카르보스 농도가 검출되었다 (표 E10). 복합 배지에서의 배양의 경우, 이는 성장기 동안 가장 두드러졌다 (도 18).

개선된 아카르보스-생산 표현형은 말토스 최소 배지에서 3가지 독립적인 진탕 플라스크 배양물에 의해 검증되었다 (도 19 및 표 E11). 상등액으로부터 아카르보스의 정량화는 야생형과 비교하여 결실 돌연변이체의 증강된 아카르보스 수율 계수를 나타냈다. 최종 아카르보스 수율에서의 차이는 유의하였다 (양측 t-검정에 의해 검정됨, p-값 = 0.04608). 이에 따라, Δcgt에서 최종 아카르보스 농도의 8.3 내지 16.6% 증가에 도달하였다 (표 E11 참조).

표 E11. 아카르보스 생산 조건 하에서 성장 실험의 표 요약. 말토스 최소 배지에서 Δcgt 및 야생형의 3가지 독립적인 배양물의 최종 아카르보스 농도, 최종 세포 건조 중량 및 복제물 n의 수.

Δcgt는 아카르보스 생합성 유전자의 발현에 영향을 미치지 않는다

고도로 발현된 유전자 cgt의 결실이 다양한 조건 하에서 유기체의 성장 또는 생육력에 부정적인 영향을 미치지 않지만 증강된 아카르보스 생산 표현형을 가져다준다는 발견은 놀라운 것이었다. 이로 인해 그리고 아카르보스 생합성 (acb) 유전자의 조절에 대한 직접적인 영향을 배제하기 위해, 대표적인 acb 유전자의 RT-qPCR을 수행하였다. 이를 위해, 야생형 및 Δcgt를 말토스 최소 배지에서 성장시키고 초기 성장기 샘플로부터 RNA를 단리하였다. 아카르보스 생합성 클러스터 유전자 acbZ, acbW, acbV, acbA, acbB, acbD 및 acbE의 상대적 전사체 양을 야생형과 비교하여 Δcgt에 대해 계산하였다 (도 20). 유전자 acbV는 아카르보스 생합성 유전자 클러스터의 주요 오페론 내에서 폴리시스트로닉으로 전사된 여러 유전자 중 제1 유전자이다 (Wolf et al. 2017b). 세포외 아카르보스 대사의 단백질을 코딩하는 모노시스트로닉으로 전사된 유전자 acbD 및 acbE는 아카르보스 조절인자 AcrC에 의해 강력하게 조절되는 것으로 제시된 바 있다 (Wolf et al. 2017a). 유전자 acbA, acbB 및 acbZ가 또한 모노시스트로닉으로 전사되며, 각각 아카르보스 생합성의 효소 (acbAB) 및 그의 세포외 대사의 효소 (acbZ)로서 주석이 달려 있다. AcbW는 acbWXY-오페론의 제1 유전자로, ABC 트랜스포터를 코딩하는 것으로 추정된다. 선택된 모든 전사체에 대해, 야생형과 비교하여 결실 돌연변이체 Δcgt에서 상대적 전사체 수준에 있어서의 유의한 변화가 측정되지 않았다 (도 20).

논의

탄수화물 대사와 아카르보스 생합성의 연결은 높은 관심을 받고 있다. 최근 연구에서는 야생형에서 아카르보스와 추가 아카르비오실 대사산물의 생합성과 관련하여 탄소 활용의 중요성을 지적하였다 (Wendler et al. 2014).

이러한 맥락에서, 전분 결합 단백질 Cgt는 굉장히 매력적이다. 이것은 전체 분비된 프로테옴의 약 8%를 차지하는 (본 발명자들의 미공개 데이터) 악티노플라네스 종 SE50/110에서 가장 강하게 발현되는 유전자 중 하나이다 (Schwientek et al. 2013). 그것의 유전자 산물은 세포외 공간으로 유출된다 (Wendler et al. 2013). 과잉 생산 및 유출은 세포에 대한 높은 비용을 의미한다: 번역 프로세스에 대해서만, 펩티드 결합당 4개의 ATP가 필요한데 (Campbell and Reece 2011; Purves 2006), 즉 RNA 합성, 아미노산 생산, 단백질 폴딩 및 유출에 대한 부가의 비용은 포함되지 않는다. 따라서 본 발명자들은 Cgt가 악티노플라네스 종 SE50/110 생리학에서 중요한 역할을 한다고 결론지었다. Cgt의 2가지 상이한 기능, 즉 당 대사 내에서의 역할 및 표면 단백질로서의 역할이 본원에서 제안되고 분석된다.

전분 결합 도메인으로 인해, 문헌 [Ortseifen 2016]에서는 Cgt가 카르보포어 모델 (Wehmeier 2003)의 맥락에서 에너지원의 결합 및 유지에 관여할 수 있다고 제안되었다. RT-qPCR에 의해 증거가 제공되었으며, 이는 말토스, 고급 말토덱스트린 및 셀로비오스에서 성장한 배양물과 비교하여 글루코스, 갈락토스 및 락토스에서 성장한 배양물에서의 유전자 cgt의 차별적인 발현을 나타내었다. 이것은 탄소 공급원 말토스와 글루코스에 대한 차등 프로테옴 분석에 따른 것이다 (Wendler et al. 2015a; Wendler et al. 2015b). 이러한 결과는 cgt의 탄소-의존적 발현을 나타낸다. 조절 메커니즘을 밝히는 것은 흥미로울 것이다. 그러나 900개 초과의 유전자가 악티노플라네스 종 SE50/110의 전사 조절에 관여하는 것으로 추정되며, 그 중 697개는 문헌 [Wolf et al. (2017b)]의 주석에 따라 전사 조절인자로서 주석이 달린 것으로 여전히 고려된다 (진뱅크: LT827010.1).

cgt의 당-의존적 발현은 말토스, 고급 말토덱스트린, 및 잠재적으로 또한 셀로비오스의 활용 내에서의 기능을 나타낼 수 있다. 그러나, 결실 돌연변이체 Δcgt에 대한 본 발명자들의 연구는 탄소 활용에 관한 표현형별 차이를 밝히지 못하였다. 이것은 총 105개의 상이한 탄소 공급원에 대해 테스트되었으며, 그 중 103개는 옴니로그 스크리닝 시스템에서 분석되었고, 6개는 액체 배양물에서 분석되었다.

Cgt의 기능은 과량의 탄소 공급원에서는 무시할 수 있지만 제한된 탄소 공급원이 있는 조건 하에서 성장하는 경우에는 불필요할 수 있으므로, 본 발명자들은 전분 농도가 낮은 최소 배지에서 결실 돌연변이체 Δcgt 및 야생형의 성장을 테스트하였다. 전분 결합 검정에서 확증된 Cgt의 전분 결합 활성으로 인해, 전분을 탄소 공급원으로서 선택하였다. 그럼에도 불구하고, 돌연변이체의 성장 표현형은 제한된 탄소 공급원 조건 하에서 관찰될 수 없었다.

당 대사 내의 또 다른 기능은 불용성 결정질 기질의 결합으로 구성될 수 있으며, 이는 기질 접근성을 증가시키고 아밀라제와 같은 다른 가수분해 효소의 활성을 증강시키는 구조적 변화를 유발할 수 있다. 이러한 메커니즘은 이미 토양 박테리아 세라티아 마르세센스(Serratia marcescens)에서 키틴분해에 대해 보고되었고 (Vaaje-Kolstad et al. 2005) 써모비피다 푸스카(Thermobifida fusca)에서 세포분해에 대해 보고되었다 (Moser et al. 2008). 악티노플라네스 종 SE50/110의 게놈에서, 추정 α-글리오시드 기능을 갖는 여러 유전자가 코딩되며, 그 중 3개, 즉 α-아밀라제/풀룰라나제 AcbE, AcbZ 및 PulA가 세포외 공간에 축적되는 것으로 제시되었다 (Wendler et al. 2015a). 부가적으로, 공지되지 않은 기능과 전분 결합 능력의 또 다른 작은 세포외 단백질 (ACSP50_6253)이 전분 결합 검정에서 확인되었다. Cgt 및 ACSP50_6253 둘 다의 존재 및 부재 하에 세포외 아밀라제 및 효소 검정의 이종 발현에 의해, 전분 분해 동안 지지 기능이 향후 실험에서 검출될 수 있다.

당 대사 외에도, 표면층 단백질로서의 기능도 생각할 수 있으며, 이는 Cgt가 다량체를 형성한다는 사실에 의해 뒷받침된다 (Ortseifen 2016; Wendler et al. 2013). 문헌 [Wendler et al. (2015) (Wendler et al. 2015a)]에서는 Cgt 단백질에서 2개의 막횡단 도메인을 확인하였으며, 그 중 하나는 리더 펩티드의 일부로서 Sec 경로에 의한 전위에 관여하고 다른 하나는 다량체화에 필요한 것으로 추정된다. Cgt가 물리적으로 막에 고정되어 있지는 않지만 (Wendler et al. 2015a), Cgt 단백질은 감소된 유체 흐름으로 인해 균사체의 메쉬에서 다량체로서 남을 수 있다. 이러한 맥락에서, 전분 결합 도메인은 앵커 역할도 할 수 있다.

추정 표면 단백질로서의 역할에서, 본 발명자들은 초기에 pH 및 삼투질 스트레스 또는 가뭄의 맥락에서 보호 기능을 추정하였다. 그러나, 스크리닝 실험은 cgt 유전자의 결실이 액체 배양물 내의 상이한 pH에서 유의한 성장 억제로 이어지지 않았는다는 것을 제시하였다. 고체 배지에 대한 스크리닝 실험으로부터, Cgt가 pH 또는 가뭄의 경우 보호 기능을 가질 수 있다는 징후는 없었다.

오스몰농도 조절과 관련하여 추정되는 기능에 대한 힌트는 상이한 양의 말토스에서 성장한 야생형의 역전사 정량적 PCR에 의해 제공되었다. 여기에서, 본 발명자들은 72 g·L^-1과 비교하여 44.4 g·L^-1 말토스에서 성장할 때, 유전자 cgt의 전사가 2.9배 감소한 것을 관찰했으며, 이는 오스몰농도의 영향일 수 있다. 본 발명자들은 159 내지 681 mOsmol·kg^-1 범위의 배지를 사용한 액체 배양에서의 여러 스크리닝 실험에서 결실 돌연변이체 Δcgt의 성장을 분석하였다. 테스트된 모든 조건 하에서, 야생형과 비교하여 결실 돌연변이체 Δcgt에 대해 성장 및 생육력에서의 차이가 관찰되지 않았다.

놀랍게도 상이한 탄소 공급원을 과도하게 활용하거나 제한적으로 활용하거나, 상이한 pH 또는 삼투질 조건 하에서 cgt 유전자의 결실에 의해 명백한 생리학적 영향이 관찰되지 않았기 때문에, Cgt의 기능은 그의 자연 환경 및 다른 토양 유기체와의 가능한 경쟁에서만 명백해질 수 있다. 흥미롭게도, 본 발명자들은 대부분이 악티노미세탈레스 목에 속하는 17개의 다른 원핵생물 종에서 유사한 독립적인 단일 CBM-20 도메인 단백질을 발견하였다. 드물지만 이것은 적어도 특정 분포를 나타내고 Cgt가 균주-특이적 단백질이 아님을 제시한다. 단일 도메인 CBM-20 단백질을 보유하는 대부분의 종은 토양 서식지와 관련이 있다. 이러한 사실을 취합하면, 그러한 cgt는 악티노플라네스 종 SE50/110에서 고도로 발현되며, 이것은 Cgt와 같은 단백질이 이러한 서식지 내에 사는 박테리아에서 중요한 기능을 수행한다는 가설을 뒷받침해준다. Cgt의 기능은 다른 미생물 경쟁자와 직접 접촉하는 공동 배양에 의해 미래에 테스트될 수 있다.

Cgt가 테스트된 실험실 조건 하에서 필요하지 않은 것으로 밝혀진 것은 놀라운 일이지만, 본 발명자들은 아카르보스 생산과 관련하여 양성 표현형을 관찰하였다. 8.3 내지 16.6%의 아카르보스 수율 증가는 cgt의 결실에 의해 달성되었다. 최종 산물 수율은 배치 배양 간에 약간 다르지만, Δcgt 돌연변이체는 항상 훨씬 더 나은 성능을 보였다. 이것은 3개의 독립적인 진탕 플라스크에서 수개월의 기간에 걸쳐 (데이터는 제시되지 않음), 말토스 최소 배지에서 수행된 여러 마이크로 규모 배양에서 제시되었다. 따라서 개선된 생산은 장기간에 걸쳐 상이한 배양 환경에서 견고하였다.

본 발명자들는 이것이 야생형에서 cgt 유전자의 발현에 의한 대사 부담 때문이라고 추정하며, 이는 Δcgt에서 에너지와 자유 자원의 구제를 불러일으킨다. 이러한 자원은 아마도 성장 관련 산물인 아카르보스 생합성으로 리디렉션될 것이다. acb 유전자의 발현에 대한 cgt의 결실에 의한 직접적인 조절 효과는 관찰되지 않았다.

카로티노이드 형성의 기능적 관련성의 분석

광-의존성 카로티노이드 형성 및 산화적 스트레스는 악티노플라네스 종 SE50/110에서 아카르보스 생산을 감소시킨다

악티노플라네스는 카로티노이드 클래스의 황색, 주황색 및 분홍색 색소를 비롯한 다양한 가용성 색소를 생산하는 것으로 공지되어 있다 (Parenti and Coronelli 1979). 악티노플라네스 종 SE50/110의 색소는 주황색이다. 빛에 노출되어 배양될 때 그의 형성이 강화된다. 상등액에서도 마찬가지로 색소가 발견되었기 때문에, 그것은 수용액에 가용성인 것으로 보인다. 세포 추출 및 박층 크로마토그래피에 의한 분리 후, 스펙트럼 분석은 450, 475 및 505-510에서 최대 흡수를 나타내며, 이는 HPLC 분리 동안 수행된 흡광도 스캔에 의해 확증되었다. 인 실리코 재구축에서 이러한 발견과 일치하여, 악티노플라네스 종 SE50/110은 살리노스포라 트로피카 CNB-440으로부터의 시옥산틴과의 유사성을 갖는 C40-카로티노이드를 생산하는 완전한 유전적 장비를 갖추고 있는 것으로 제시되어 있다 (Richter et al. 2015; Wolf et al. 2017b) (도 21 및 표 E12).

표 E12. 악티노플라네스 종 SE50/110에서 카로티노이드 합성의 재구축. 2개의 테르펜 합성 유전자 클러스터가 antiSMASH 분석 (Blin et al. 2017; Weber et al. 2015)에 의해 확인되었으며, 이는 살리노스포라 트로피카 CNB-440으로부터의 시옥산틴 유전자 클러스터 (Richter et al. 2015) (테르펜 클러스터 1-2)와의 유사성을 갖는 C40-카로티노이드의 형성으로 할당될 수 있었다. 더욱이, 캄펜-유사 모노테르펜 유전자 클러스터 (테르펜 클러스터 3), MEP/DOXP 경로의 모든 유전자 및 리코펜의 분해를 코딩하는 유전자가 BLASTP 분석 (Altschul et al. 2005) 및 KEGG (Kanehisa et al. 2014)에 의해 확인되었다.

C40-카로티노이드 생합성의 유전자는 3가지 유전자 클러스터인 테르펜 클러스터 1, 2a 및 2b로 구성된다 (도 21d 참조).

에스. 트로피카(S. tropica)와 달리, 시클라제 및 데새투라제를 코딩하는 crtY 및 crtU의 동족체는 악티노플라네스 종 SE50/110에서 확인될 수 없었다 (Wolf et al. 2017b). 대신, CarR-도메인 슈퍼패밀리의 두 시클라제가 본 작업에서 발견되었다. 그들은 테르펜 클러스터 2b에 국한되어 있다 (도 21). CarR-도메인 시클라제는 진균, 고세균 및 박테리아 게놈에서 흔하다 (NCBI의 CDD 검색으로부터 가져온 정보 (Marchler-Bauer et al. 2017)). SE50/110의 색소는 주황색이기 때문에, 적색 전구체인 리코펜의 말단 순환이 일어날 가능성이 높으며 CarR 도메인 시클라제 중 하나 또는 둘 다에 의해 촉매될 수 있다. 에스. 트로피카와 유사하게, SE50/110의 카로티노이드 유전자 클러스터는 글리코실트랜스퍼라제 CruC를 함유한다 (도 21, 표 E12). 이것은 관찰에 따르면 글리코실화된 카로티노이드에 대해 상등액에서 발견되었기 때문에, 그 색소가 극성 특징을 갖는 것으로 보인다는 것을 강력하게 나타낸다 (도 22b).

소프트웨어 플랫폼 EDGAR 2.0 (Blom et al. 2016)에 의한 비교 게놈 분석은 악티노플라네스 속의 관련 종에서 유사한 테르펜 클러스터 배열을 표시하는 반면, 스트렙토미세스에서는 상이한 구성이 발견되었다 (데이터는 제시되지 않음). 이로써 SE50/110 및 CNB-440에서 발견된 유전자 배열 (Richter et al. 2015; Wolf et al. 2017b)은 미크로모노스포라세아에 과에 특징적인 것으로 보인다.

게다가, MEP/DOXP-경로를 통한 빌딩 블록 IPP 및 DMAPP의 합성을 위한 유전자 (표 E12), 캄펜-유사 모노테르펜 신타제를 코딩하는 유전자 (테르펜 클러스터 3, 표 E12) 뿐만 아니라 카로티노이드 절단 디옥시게나제를 코딩하는 유전자 (ACSP50_5522, 표 E12)가 SE50/110의 게놈에서 발견되었다. 후자의 두 가지는 악취 물질의 형성에 관여할 수 있다 (Yamada et al. 2015). 본 발명자들은 강한 착색이 생산 손실과 관련되어 있음을 관찰하였다. 이것은 빛에 노출된 경우 및 빛으로부터 가려진 경우의 배양물의 성장 및 아카르보스 수율을 비교함으로써 확증되었다 (도 22). 카로티노이드 형성이 유도되긴 하였지만, 22-44 μE (1 μE = μmol_광 _자 m^-2 s^- ¹)의 강도로 전구 빛 (36 W, 오스람(Osram) 830U)에 노출되었을 때, 악티노플라네스 종 SE50/110의 아카르보스 생산 및 성장은 크게 감소되었다. 전체적으로, 최종 아카르보스 농도의 39% 손실이 모니터링되었다.

SE50/110에서 merR의 결실은 빛에 노출되지 않으면서 카로티노이드 형성을 유도한다

자연광 또는 전구 빛이 카로티노이드 형성을 유도할 수 있었기 때문에 (도 22b, c), 본 연구에서는 SE50/110에서 가능한 조절 유전자를 검색하였다. MerR 조절인자는 테르펜 클러스터 1 (ACSP50_0145, 도 23) 내에서 발견되었다.

MerR-패밀리은 주로 산화적 스트레스, 중금속 또는 항생제와 같은 환경 자극에 반응할 수 있는 활성인자로 이루어진다 (Brown et al. 2003). 실제로, MerR-패밀리의 여러 구성원은 관련 악티노미세테(actinomycete) 에스. 코엘리콜로르(S. coelicolor) (Takano et al. 2005; Takano et al. 2006)에서, 그람 음성 써무스 써모필레스(Thermus thermophiles) HB27 (Takano et al. 2011)에서 및 그람 양성 바실루스 메가테리움(Bacillus megaterium) QM B1551 (Takano et al. 2015)에서 비-광합성 박테리아, 예를 들어 LitR에서의 카로티노이드 생합성의 광-의존적 활성인자 또는 억제인자 둘 다로서 기재되었다. 여기서, 코발라민 (비타민 B12)은 보조인자로 작용하여, 자외선과 청색 광을 흡수할 수 있기 때문에 광 감도를 매개한다: 조절인자와 공유적으로 결합하거나 또는 광 여기 후 떨어져 나감으로써, 조절인자의 입체 형태와 활성을 조정할 수 있다 (van der Horst et al. 2007). 조절 메커니즘과 결합 부위는 상당히 상이하다: 티. 써모필레스(T. thermophiles)와 비. 메가테리움(B. megaterium)에서는 litR/crtB (Takano et al. 2011) 또는 litR 및 crtI (Takano et al. 2015)의 프로모터 영역이 어두운 곳에서 억제되고 조명 후 완화되는 반면, 에스. 코엘리콜로르에서의 LitR은 ECF 시그마 인자를 코딩하고 카로티노이드 생합성 유전자의 전사를 지시하는 인접 국소화 litS의 필수 광 유도 전사 활성인자인 것으로 보인다 (Takano et al. 2005). ECF 시그마 인자를 코딩하는 유전자는 SE50/110의 유전자 클러스터 내에서 발생하지 않는다. 그람 음성 박테리움 믹소코쿠스 크산투스(Myxococcus xanthus)에서는, B12-의존성 MerR 조절인자가 8개의 추가 조절 유전자를 포함한 복잡한 조절 캐스케이드의 일부이다 (Fontes et al. 2003; Galbis-Martinez et al. 2012). 실제로, 엠. 크산투스(M. xanthus)로부터의 조절 네트워크의 동족체는 BLASTP 분석에 의해 SE50/110의 게놈에서 확인되지 않았다 (데이터는 제시되지 않음).

악티노플라네스 종 SE50/110의 MerR-패밀리 조절인자 ACSP50_0145는 N-말단 HTH-모티프와 C-말단 B12-결합 도메인을 함유한다 [BLASTP 분석 및 CDD 검색에 따름 (Marchler-Bauer et al. 2015; Marchler-Bauer et al. 2010; Altschul et al. 2005)]. HTH 도메인의 위치는 전사 억제인자가 차지하고 있다 (Perez-Rueda and Collado-Vides 2000).

SE50/110에서의 상응하는 유전자의 CRISPR/Cas9 결실에 의해, 카로티노이드 형성은 빛에 노출되지 않고 강하게 유도되었다 (도 24b, c). 이것은 전사 억제인자로서의 기능을 확증한다.

실제로, 전형적인 주황색은 빛에 노출되지 않은 야생형에서도 생산되기 때문에, 억제인자/오퍼레이터 시스템이 누출된다는 점에 유의해야 한다. 이에 따르면, 유전자 crtEBI 및 idi (ACSP50_0146-0149)의 전사는 어두운 조건 하에서의 야생형과 비교하여 ΔmerR에서 단지 2배로 증가되었다 (도 24e). 이러한 차이는 crtE, crtB 및 idi에 대해 중요하였다. acb 유전자의 전사에 대한 영향은 관찰되지 않았다.

그러나 이러한 작업의 맥락에서, ΔmerR에서의 색소 형성이 미세 화학물질 아카르보스의 형성에 영향을 미치는지 여부에 대한 질문이 조사되었다. 다시 언급하면, 더 높은 카로티노이드 형성은 더 낮은 아카르보스 형성과 관련이 있다 (도 24a, d). 조명을 받으면, 야생형과 ΔmerR 둘 다가 강하게 착색되고 최종 아카르보스 농도는 균주 둘 다에 대해 유사하며, 대략 0.52 g·L^-1에 도달하였다 (도 24b, d). 이는 어두운 조건 하에서의 야생형과 비교하여 대략 38%의 아카르보스 형성 감소에 상응한다 (0.83 g·L^-1에 도달함). 이는 본원에 기재된 바와 같이 야생형의 이전 성장 실험에 따른 것이다.

어두운 조건 하에서, ΔmerR은 야생형보다 대략 15% 더 적은 양의 아카르보스를 생산한다 (0.70 g·L^-1) (도 24d). 이러한 생산 손실은 결실 돌연변이체에서 카로티노이드 형성에 의한 자원 낭비에 기인한다고 제안된다 (도 24c). 결론적으로, 밝은 조건 하에서의 생산 손실 (38-39%)은 결실 돌연변이체와 야생형 둘 다에서 추가의 광 유도 스트레스로 인해 발생할 수 있다.

마이크로어레이 기술을 사용하여 어두운 조건 및 밝은 조건 하에서 배양된 야생형의 비교 트랜스크립톰 분석은 다양한 유전자에 영향을 미치는 전사체 수준에 대한 복잡한 반응을 나타낸다 (도 25 참조). 차등적으로 발현되는 여러 유전자는 산화적 스트레스와 싸우기 위한 세포 반응을 나타낸다. 산화적 스트레스는 에너지 전달 (일중항 산소로 유도) 또는 전자 전달 (슈퍼옥시드, 과산화수소 및 히드록실 라디칼로 유도)에 의해 형성되는 반응성 산소 종 (ROS)에 의해 야기된다 (Ziegelhoffer and Donohue 2009). 고농도에서 ROS는 독성이 있으며 단백질 및 막 산화 및 DNA 손상을 유발한다 (Ziegelhoffer and Donohue 2009; Gout 2019).

SE50/110에서는, 갈색 색소 유멜라닌의 형성에 관여하는 (Wolf et al. 2016) 광 보호제인 티로시나제 MelC (ACSP50_4950, 이전명: ACPL_5017), 및 리보플라빈 생합성의 유전자 (ACSP50_6437-40)가 빛에 노출될 때 더 강하게 전사된다 (도 25). 리보플라빈은 374 및 445 nm에서 흡수하는 수용성 광산화 증감제이다 (Silva et al. 1999; Kim et al. 1993). 이것은 플라빈 모노뉴클레오티드 (FMN) 및 플라빈 아데닌 디뉴클레오티드 (FAD)의 전구체이다. 이들은 세포성 레독스 대사, 빛 감지, DNA 복구 및 추가 기능에 관여하는 단백질의 보조인자이다 (Garcia-Angulo (2017)에서 검토됨). 이로써 리보플라빈 및 그의 유도체는 세포가 산화적 스트레스를 극복할 수 있도록 하는 중요한 미량 영양소이다 (Chen et al. 2013).

이에 따르면, 여러 플라빈-의존성 옥시게나제는 빛에 노출될 때 더 강하게 전사된다. 그 중 하나는 그의 기질이 시스테인의 분해 산물인 타우린 디옥시게나제로서 주석이 달려 있다. 시스테인과 같은 황 함유 아미노산은 ROS를 포착하고 레독스 완충제로 기능할 수 있는 저분자량 티올 (LMW 티올) 군에 속한다 (Gout 2019). 이에 상응하여, 아마도 시스테인 및 메티오닌 대사 및 수송에 관여하는 추가 유전자는 빛에 노출된 세포에서 더 강하게 전사된다.

놀랍게도, 여러 전사 조절인자 유전자 및 시그마 인자 SigE를 코딩하는 유전자 (ACSP50_0558)도 더 강하게 전사된다 (도 25). SigE는 광합성 박테리움 로도코쿠스 스파에로이데스(Rhodococcus sphaeroides) (문헌 [Ziegelhoffer and Donohue (2009)]에서 검토됨)에서의 산화적 스트레스 반응과 관련이 있고, 관련 종 에스. 코엘리콜로르 (Hutchings et al. 2006) 및 씨. 글루타미쿰(C. glutamicum) (Park et al. 2008)에서의 외피 스트레스 반응과 관련이 있다. SigE가 SE50/110에서의 산화적 스트레스 반응에 관여할 가능성이 있다.

흥미롭게도 카로티노이드 생합성의 유전자 및 조절인자 MerR의 유전자는 빛으로부터 가려진 야생형과 비교하여 빛에 노출된 야생형에서 훨씬 더 강하게 전사되지 않는다. 이것은 야생형에서 카로티노이드 형성에 대한 빛의 분명한 효과를 관찰할 수 있기 때문에 주목할만한 것이다. 카로티노이드 합성은 어두운 곳과 밝은 곳 둘 다에서 일어나며 상대적 전사체 양의 증강은 조절인자 돌연변이체에서 상당히 완만하기 때문에 (상기 참조), 전사체 수준에 대한 영향은 눈에 띄지 않을 수 있다. 예를 들어 카로티노이드 절단 디옥시게나제 (ACSP50_5522)에 의한 카로티노이드 또는 테르페노이드-전구체의 분해에 의해, 단백질 수준 또는 대사체 수준에 대한 카로티노이드 합성의 추가 조절이 존재할 수 있다고 추정한다. 그러나 야생형의 마이크로어레이로부터 수득된 결과에 따르면, crt 유전자 발현은 로도코쿠스 스파에로이데스로부터의 연구 결과와 유사하게 전반적인 산화적 스트레스 반응의 주요 표적이 아닌 것으로 보인다 (문헌 [Ziegelhoffer and Donohue (2009)]에서 검토됨).

모두 취합해 보면, 조명은 산화적 스트레스 반응을 촉발시키고 성장, 카로티노이드 및 아카르보스 형성을 위한 대사 자원의 분포에 중요한 영향을 미치는 것으로 보인다. 카로티노이드 생합성의 조절은 산화적 스트레스에 대한 전반적인 반응으로부터 분리되어 있는 것으로 보이며, 이에 대해서는 추가 조사가 필요하다. 대사 플럭스를 아카르보스 생산으로 향하게 하기 위해서는, 향후 이러한 프로세스를 더 잘 이해하는 것이 바람직하다. 시그마 인자 SigE는 빛에 노출될 때 더 많이 전사되기 때문에 산화적 스트레스 반응에 대한 책임이 있을 수 있다.

광 스트레스 외에도, 본 작업은 생산 손실의 많은 부분이 카로티노이드 형성에 직접 할당될 수 있음을 명확하게 보여준다. 비-광합성 박테리아의 카로티노이드는 광역학적 사멸로부터 보호하는 것으로 제시된 바 있기 때문에 (Mathews and Sistrom 1959), 광보호제로서의 기능을 갖는 것으로 추정된다 (Lee and Schmidt-Dannert 2002). 빛의 영향은 간단한 구조적 조치에 의해 배제될 수 있으므로, 카로티노이드 형성은 실험실 조건 하에서 불필요한 것으로 추정된다. 아카르보스 생산을 개선시키기 위해, 예를 들어 중앙 유전자 crtI의 결실에 의해 공동 카로티노이드 생합성 경로를 차단하는 것이 균주 개발에 사용될 수 있다. 카로티노이드는 막의 유동성에 영향을 미치기 때문에 (Gruszecki and Strzałka 2005), C40-카로티노이드의 결여는 악티노플라네스 종 SE50/110의 표면과 균사체 구조에도 영향을 미칠 수 있다. 생산과 관련하여, 균사체 덩어리의 분해는 균사체 표면과 생화학적으로 이용가능한 세포의 수를 증가시키는 데 유리한다.

acbB 및 gtaB의 과다발현

발현 벡터 pSETT4는 유전자 acbB 및 gtaB에 대해 테스트되었다. 유전자 acbB와 gtaB 둘 다는 아마도 아카르보스 생합성의 피딩 분지인 아미노 당 합성에 관여할 것이다: AcbB는 dTDP-D-글루코스의 dTDP-4-케토-6-데옥시-D-글루코스로의 탈수를 촉매하고 GtaB는 전구체 글루코스-1P의 공급에 관여하는 것으로 추정된다. 흥미롭게도, 두 단백질 모두 아카르보스 생산자의 세포질에서 증가된 단백질 양을 나타낸다.

단일 유전자의 과다발현을 위한 pSETT4gap 및 pSETT4tip 벡터

악티노플라네스 균주, 예컨대 악티노플라네스 종 SE50/110에서 단일 유전자의 용이한 클로닝과 과다발현을 허용하는 신규 클로닝 시스템이 구현되었다. 이를 위해, 에게텔라 렌타로부터의 유전자 gapDH의 강한 프로모터를 pSET152-백본에서 lacZ-카세트 앞에 클로닝하였다. 유전자 lacZ는 lac-프로모터의 제어 하에 전사되고 깁슨 어셈블리 (Gibson et al. 2009), 제한/라이게이션 클로닝 또는 골든 게이트 클로닝 (Engler et al. 2008)에 의해 관심 유전자에 의한 lacZ의 교환을 가능하게 하는 제한 효소 BsaI의 인식 측면에 의해 플랭킹된다. 강한 발현은 강한 종결을 필요로 하기 때문에, 신규 발현 시스템의 클로닝 측면 전후에 T4-종결인자가 도입되었다. T4-종결인자는 문헌 [Myronovskyi et al. (2011)]에서 개발된 pGUS-클로닝 시스템에서 이미 성공적으로 사용되었다. 본원에서 수행된 pGUS-통합 돌연변이체의 전체 트랙 RNAseq 분석에 따르면, T4-종결인자가 전사를 효율적으로 차단하고 인테그라제 유전자에서부터 관심 유전자로의 번역-초과를 방지하는 것으로 제시되었다. 사전 실험에 의해 제시된 바와 같이, T4-종결인자는 pSET152 통합을 통해 악티노플라네스 종 SE50/110 내로 도입될 때 acb 유전자의 전사에 대해 어떠한 부작용도 나타내지 않는다.

게다가, 프로모터-스크리닝 실험으로부터 유래된 강화된 1차 전사체 라이브러리의 시퀀싱에 의해, 안티센스 배향으로 관심 유전자 뒤에 있는 2개의 추정 프로모터가 확인되었다 (도 26). 안티센스 전사를 방지하기 위해 이들 2개의 슈도-프로모터를 신규 발현 시스템에서 제거하였다. 더욱이, 부가의 (제3의) T4-종결인자가 반대 배향으로 클로닝 측면 뒤에 도입되어 추가의 추정 안티센스 판독을 방지하였다.

프로모터 서열의 교환을 허용하기 위해, NdeI 및 KpnI 제한 부위가 도입되었다. 본 작업에서는, 강한 gapDH-프로모터가 에스. 리비단스(S. lividans)로부터의 중간 정도의 강한 tipA-프로모터로 교환되었다. 이로써, 예를 들어 악티노미세탈레스 목의 다른 종에 맞도록 조정하기 위해, 시스템을 쉽게 변형시킬 수 있는 것으로 제시되었다. 벡터 (pSETT4gap 및 pSETT4tip으로 명명됨)는 유전자 acbB 및 gtaB의 강한 및 중간 정도의 강한 과다발현에 대해 테스트되었다.

acbB의 중간 정도의 과다발현은 개선된 아카르보스 형성을 초래한다

dTDP-D-글루코스-4,6-데히드라타제 AcbB는 아카르보스 생합성의 피딩 경로 (도 1)인 D-글루코스-1P로부터 활성화된 아미노 당의 생성에 관여하는 것으로 보인다: 증가된 AcbB-활성은 변형된 전구체의 공급을 개선시키는 것으로 밝혀졌다:

간단히 언급하면, 본원의 다른 곳에서 기재된 발현 벡터 pSETT4에 기초하여 2개의 과다발현 돌연변이체가 생성되었다. 이들 돌연변이체에서 acbB는 중간 정도의 강한 tipA-프로모터 또는 강한 gapDH-프로모터의 제어 하에 전사된다. 이전에 발표된 바와 같이 (Schaffert, et al. 2019), 천연 프로모터를 사용한 발현 벡터는 Acb 유전자 클러스터의 유전자의 상당한 과다발현으로 이어지지 않았다. 따라서 천연 프로모터는 pSET152- 및 pSETT4-벡터 배경 둘 다에서 대조군으로서 사용되었다. 성장 및 아카르보스 형성은 말토스 최소 배지 중의 2개의 진탕 플라스크 배양물에서 모니터링되었다 (도 27).

이종 tipA-프로모터의 제어 하에 전사된 acbB를 갖는 돌연변이체는 대조군 균주와 비교하여 증강된 아카르보스 생산을 나타내었다: 수율 계수는 2가지 독립적인 배양물에서 빈 벡터 대조군과 비교하여 48.6 및 51.9%로 증가되었다 (도 28). 강한 gapDH-프로모터를 사용함으로써, 아카르보스 수율 계수가 약간 증가되었다 (도 28).

pSETT4tip::acbB에서, 인산화된 글루코스/갈락토스 및 UDP-글루코스의 정규화된 피크 면적은 빈 벡터 대조군과 비교하여 유사하거나 심지어 약간 증가하였다 (도 29). 따라서, 활성화된 글루코스 모이어티의 공급이 보장되는 것으로 보인다. 이러한 돌연변이체에서, 질량 m/z = 545 [M-H⁺]의 증가된 양이 발견되었다 (도 29, 대략 41%). 이론에 얽매이는 것은 아니지만, 이러한 중간체는, 예를 들어 pSETT4tip::acbB를 사용하여 중간 정도의 AcbB-과다발현에 의해 축적된다.

초기 성장기에서는, acbB의 증강된 발현이 예상 범위 내에서 관찰되었다: 가장 강한 과다발현은 gapDH-프로모터 (log2(변화 배수) = 6.54)를 사용한 다음 tipA-프로모터 (log2(변화 배수) = 4.06)를 사용함으로써 달성되었다 (도 30). 천연 프로모터의 사용은 acbB의 상대적 전사체 양의 상당한 증가로 이어지지 않는다. 이것은 pSET152 및 pSETT4 벡터 배경 둘 다에서 테스트되었다 (도 30). acb 유전자 클러스터의 추가 유전자는 acbA 및 acbV에 대해 제시된 바와 같이 유의하게 영향을 받지 않았다 (도 30). 유일한 예외는 pSETT4tip::acbB에서 acbA의 전사 풍부도가 약간 더 높다는 것이다 (log2(변화 배수) = 1.87).

현저하게, 선형 성장기의 전사 프로파일은 초기 성장기와 상이하다: 여기에서, gapDH-프로모터를 사용하여 전사체 양의 2배 증가만 도달한 반면 (log2(변화 배수) = 2.05), tipA-프로모터를 사용함으로써 acbB의 과다발현은 유지되었지만 더 적은 정도였다 (log2(변화 배수) = 3.33) (도 30, 도 31).

이종 프로모터를 포함한 과다발현 돌연변이체에서는, acbB의 상대적 전사가 pSETT4tip::acbB에서의 두 샘플링 시간 사이에 4.06배에서 3.33배 (log2(변화 배수))로 감소되고 pSETT4gap::acbB에서는 6.54배에서 2.05배로 감소된다. 염색체 acbB-카피의 전사가 이들 돌연변이체에서 하향조절되는 반면, 벡터 카피의 전사는 이종 프로모터에 의해 유지되는 것으로 추정된다. 상이한 샘플링 시간에 acbB-전사에 있어서의 차이는 또한, acb 유전자 전사의 하향 조절이 pSETT4tip::acbB와 비교하여 pSETT4gap::acbB에서 각각 더 일찍 더 강하게 발생한다는 것을 시사한다. acbB의 과다발현 (pSETT4gap::acbB 및 pSETT4tip::acbB)은 선형 성장기 동안에 감속되는 것으로 보인다.

요약하면, 특히 tipA-프로모터의 사용에 의한 acbB의 중간 정도의 과다발현은 아카르보스 생산에 유익한 것으로 보이는 반면, gapDH-프로모터의 사용에 의한 강한 과다발현은 아카르보스 형성에 미치는 영향이 더 작은 것으로 보인다. 아카르보스 형성에 있어서의 추가 개선은 acbB의 발현 수준을 변화시킴으로써, 예를 들어 프로모터 스크리닝으로부터 대체 프로모터를 사용하거나 또는 다수의 유전자 카피를 도입함으로써 달성될 수 있다.

요약하면, 본 작업은 AcbB의 중간 정도의 과다발현이 아마도, 개선된 아미노 당 공급으로 인해 아카르보스 수율을 증가시킨다는 것을 입증해준다. acbB의 중간 정도의 과다발현 (예를 들어 tipA-프로모터의 사용에 의함)에 의해, 2가지 독립적인 배양물에서 약 50% 더 많은 아카르보스를 가져다주는 아카르보스 생산에 대한 긍정적인 효과가 관찰되었다. 따라서, 단일 acb 유전자의 과다발현에 의한 아카르보스 생합성의 개선이 달성되었다.

gtaB의 중간 정도의 과다발현은 개선된 아카르보스 형성으로 이어진다

GtaB는 UDP-글루코스과 글루코스-1P의 상호 전환을 촉매하는 것으로 가정된다. 놀랍게도 GtaB의 과다발현이 아카르보스 형성을 촉발시키는 것으로 밝혀졌다. 이론에 얽매이는 것은 아니지만, 이것은 전구체 글루코스-1P의 개선된 전개에 의해 발생할 수 있다. 말토스 최소 배지에서 진탕 플라스크 배양에 의해 제시된 바와 같이 (도 32), pSETT4tip 내로 도입된 gtaB의 과다발현 돌연변이체의 아카르보스에 대한 최종 수율 계수는 8.56%로 증가되었다.

흥미롭게도, 아카르보스 형성은 후기 선형 내지 정지 성장기에서 특히 증가된다. 과다발현 돌연변이체에서, 유전자 gtaB의 상대적 전사체 양은 2.64배 증가된다 (log2(변화 배수)) (도 33).

활성화된 당의 대사는 다른 대사 경로에 연결되거나 또는 이러한 경로에 리디렉션되기 때문에, 축적되지 않는 것으로 가정된다. 그러나, 이전 실험에 제시된 바와 같이, 공급이 심각하게 방해받을 수 있다. 세포내 대사체의 분석은 유사한 양의 인산화된 헥소스 및/또는 UDP-글루코스를 나타낸다 (도 34). 따라서, 활성화된 C6-당의 풀은 gtaB의 과다발현에 의해 유의하게 영향을 받지 않는다.

흥미롭게도, pSETT4tip::gtaB에서 질량 m/z = 545 [M-H⁺]의 상당한 감소량이 발견되었으며 (대략 48% 감소), 이는 AcbB의 제안된 산물인 dTDP-4-케토-6-데옥시-D-글루코스에 상응할 수 있다. 이것은 합성 가닥을 통한 흐름이 더 균형을 이루고 있음을 나타낼 수 있는데, 그 이유는 이러한 대사산물의 축적이 빈 벡터 대조군 및 AcbB-과다발현 돌연변이체와 비교하여 감소되기 때문이다 (도 34). 취합해 보면, 세포성 제품의 분포에 대한 gtaB-과다발현의 영향이 여전히 불분명하지만, gtaB의 제2 유전자 카피의 도입은 아카르보스 생산에 긍정적인 영향을 미친다.

이러한 구축물을 악티노플라네스의 생산자 균주로 전달하는 것은 유익한 효과의 증가를 초래할 수 있는데, 이는 여기서 전구체에 대한 수요가 야생형과 비교하여 더 높기 때문이다. AcbB의 강한 과다발현은 글루코스-포스페이트-대사에 있어서의 불균형을 초래하기 때문에, acbB와 gtaB의 조합된 과다발현이 단일 과다발현에 대해 관찰된 효과를 넘어 아카르보스 생산을 그럴듯하게 더 개선시킬 것이다.

100~117

SEQUENCE LISTING <110> Bayer Aktiengesellschaft <120> METHODS FOR THE IMPROVED FORMATION OF ACARBOSE <130> BHC191038 <160> 111 <170> PatentIn version 3.5 <210> 1 <211> 912 <212> DNA <213> Artificial Sequence <220> <223> >acbA (ACSP50_3609) <400> 1 gtgcgcggaa tattgctggc cgggggaacc ggctcacggc ttcgaccggt gacctgggcg 60 gtttccaaac aactgatgcc ggtctatgac aaaccgatga tctactatcc gctggccacg 120 ctcgtcagct gcgggatccg ggagatcctg gtcatcacga ccgagaccga ggccgcccag 180 ttccagcggt tgctgggtga cggctcgcag tggggcctgc gtctggagtt cgccgtgcag 240 cagcgccccg ggggcatcgc cgaggccttc ctcatcggcg aggagttcct ggccggtggg 300 ccggtggcgc tcatgctcgg cgacaacctg ctgcacgggg tggacttccg cccctgcgtg 360 cagcgggcac gcgagacggc cggtgggcac gtcttcggag tggcggtggc cgacccgtcg 420 gcctacgggg tggtcgagtt cgacgccgcc gggcgggtgc tgtccatcga ggagaaaccg 480 gtccgtcccc gctcgccgta cgcggttccc ggcttctacc tctacgacgc cgatgtggtc 540 gagacggccc ggtcgctgcg gcccagcgcc cgcggggagc tggagatcac cgaggtcaac 600 caggcctacc tgcggcgcgg cgcactctcg gtgacgctgc tgggtcgggg cgcggtctgg 660 ctcgacaccg gcaccctggc cgactgcatg cgcgcggtcg actacgtgcg cgccatcgac 720 gagggccagg gcatcaagat cggctgtgtg gaggaggcgg cctggcgggc cggtttcctc 780 gacaccgcgc agctgcgtgc cctcgccgag ccgttgatga gcagcggcta cggacagtac 840 ctgctggctc tgaccggcga cgggctcagc cgtaccccgc agtggccggc cttgaccgcc 900 gccgccgggt ga 912 <210> 2 <211> 963 <212> DNA <213> Artificial Sequence <220> <223> >acbB (ACSP50_3608) <400> 2 atgaaaatct tggtcaccgg cggagccggc tttatcgggt cccattttgt aacttccctg 60 atcagtggcg acattgccac accacaaccc gtgacgcagg ttacggtcgt cgacaaactg 120 ggttacggag gcaatctcag aaatctcgcc gaagcgtcgg cggaccctcg tttcagcttc 180 gttcggggcg acatctgtga cgaaggtcta atcgaggggc tgatggcgcg gcacgacacc 240 gtggcgcact tcgccgccga gacccacgtc gaccgctcgg tggtcgcctc cggccccttc 300 gtggccagca acctggtcgg cactcaggtg ctactggacg ccgcgctacg ccaccatatc 360 ggccgcttcc tgcatgtttc caccgacgag gtgtacgggt cgatcgacac cggctcgtgg 420 gccgagggcc atccgctggc gcccaactcg ccgtacgccg cgagcaaagc cgggtccgac 480 ctcctcgctc tggcctacca ccagacgcac gggatggacg tcgtggtgac ccgctgctcg 540 aacaactacg ggccccggca attcccggag aaaatgattc cgctgttcgt caccaggctg 600 ctcgacgggc tcgacgtacc ggtctacggc gacggccgca acatccgcga ctggctccac 660 gtcagcgacc attgccgcgg tctcgccctg gccctgggtg ccggccgggc aggcgaggtc 720 tatcacatcg gcggtgggtg ggaggcgacg aatctcgaat tgaccgagat cctcctcgag 780 gcgtgcggcg ccccggcttc gcgcatatct ttcgtgaccg atcgcaaagg tcacgaccgg 840 cgctattctc tcgactattc gaaaatcgcc ggggaactcg gttaccggcc gcgggtcgat 900 ttcaccgacg gcatcgcgga aacggtcgcg tggtatcgcg ccaaccgttc ctggtggacc 960 tga 963 <210> 3 <211> 1197 <212> DNA <213> Artificial Sequence <220> <223> >acbC (ACSP50_3607) <400> 3 gtgagtggtg tcgagacggt aggggtgcac gcggatgcgc accgcgactc gtggcaggtg 60 cgggcccaga agcagatcac ctacgaggtg cgcttccggg acgacgtgtt cgggctggac 120 tccaccgacc tgctggaggc cggggcggac ggggccggtt cacggcggcg gttcgtggtg 180 gtggacagcg ccgtcgacgc cttgtacggg tcccggatcc gggagtactt cacccatcac 240 ggcatcgatc attcgatcct ggtgatgcgg gtgggcgaga cggtcaagga cttcgacacg 300 gcgggccgca tcgtcgccgc gatggacgcc ttcggactgg cccgccgccg ggagccgatg 360 atcgtcgtcg gtggtggggt gctgatggac gtggccggtc tggtggccag cctctaccgg 420 cgcggcacgc cgttcctgcg ggtgccgacg acactggtcg gactgatcga cgcgggtgtc 480 ggcgcgaaga ccggggtcaa cttcaacggc cacaagaacc ggctgggtac gtacgccccg 540 gctgatctga ccctgctgga ccgccgcttc ctggccaccc tggaccggcg ccacctcagc 600 aacgggctcg ccgagatgct caagatcgcg ctgatcaagg atgccgagct gttccagctg 660 ctggagcggc acgggcgggt cctgatcgag gaacggttcc agggccgtac cggaaccggt 720 gaccgggccg ccgtccgggc cctgcgcgcg gccacccatg gcatgctgga ggaactcggc 780 cccaatctgt gggagagccg gctggaacgc agtgtcgact acgggcacac gttcagcccg 840 accatcgaga tgcgcgcgct gccggctctg ctgcacggcg aggccgtgtg tgtggacatg 900 gcgctgacca cggtgctggc gtaccggcgg ggtctgctcg acgtcgcgca gcgggaccgg 960 atcttcgcgg tgatgaccgc cctgggcctg ccgacctggc atccgctgct cacgccggag 1020 gtgctggagg cggcgttgca ggacaccgtc cggcaccggg acgggtggca gcggctgcca 1080 ctgccggtgg ggatcggggg tgtcacgttc gtcaacgacg tgacggccgc cgagctgcag 1140 gccgccgcgc tgatgcagca ccggctcgcc gaggacgccc tgctgctgcg cgcctag 1197 <210> 4 <211> 2130 <212> DNA <213> Artificial Sequence <220> <223> >acbS (ACSP50_3596) <400> 4 atgcacatca tcgagacgta cttcgaatgc ggcggcttcg accaccggtt catccagggc 60 ggcacctcgg tctatctctg gcagctgtcg cgtggcctgg ccgacctggg acaccgggtc 120 tccatcgtca caccggcgca cggccgcctg gacgatctgc gccggctgca cgaggtcgag 180 gacctgcccg gcaccgacga gtacgaactg ccgctggtgc tcgacccgcg cgtgtggggc 240 gaacggttcc cggcccagat ggacatcgcc ctgcggacca ccgcgcatcg gatccggctg 300 gcgggcgtgg acctgtactt cctctccaac gaactgctcg atcagttgcc ggaccggttc 360 tatcccccgt acgagagcaa gggggttgat ctggtcttct tcaagccgct cgcctatcag 420 gtggcggcca tccggttcat caggtcgcac ttcggtgacc agcgcgcgat cgtgcacgca 480 cacgagccgt tctaccacta cctgatgccg gccgccttcg ccgcggaccc ggccaaacac 540 gtggtcagca cggtgcagag caacatgccg atcaacaagt cggtgtaccg ggccgaggtg 600 gcgcggctgc tcggcttcct cggcgccccg aacgcgctgc ccgccgacga tccggccggc 660 agccgttcgc cgcacaccgt ggcgatgagc cagtaccagc agctgaccca cctgcactac 720 gaatacccgc cggaccacgt gcgggtctac gacctggtgg ccgagcacgc cgaccggatc 780 gacttcctgt cgccggggca ccgcgactac tacacctgct tcgccgacac cccgttcgcg 840 cagctgttcg ccaccctgcc ggtgtcgcgg acggtacggc gcaacgcgga caagacgttc 900 gtcggcggct gcgccgtcgg tgacgagtgg gtgaccggcg agctgccccc ggtcgaccgg 960 gagaaggtgc tggccgggct cggcctggac ccggacctgc cggccttcta ccacaacgcc 1020 cggtacgcgg tcaaccacaa ggggcaggtc gagctgatcc gggccgtcga ccgggtgctg 1080 agcggcggcg tgcgggccag cttcatcgtg cgctgcctca gcgacgccgg gatcgccgac 1140 ccgctcttcc acgaggtggt ggcccgccac ccgggccggg tgaatctgga gtggcaccgg 1200 gtgccggagg accagctgcg ggagtacgcc cgagccgcgg acttctgtct cttcccgtcc 1260 aagttcgaga tggacacctt cctgatcgcc cagggtgagg cgatggctgc cggtgcggta 1320 ccgatcgcca ccgcccagct ggggatggcg cacttcggtc acgtcgccga cccgctgacc 1380 gggccggacg cggcgacggc caccggattc gccgtcaacc gctcgttcgc cgaggacgat 1440 ccgctgctgg tccagggcct gaccgagcag atccgccggg ccgtcacgct ctggaacgag 1500 cagcccggcc agtaccgccg gttgtccgcc aacgccgtcg cccgggcccg cgagttcacc 1560 tggcggcggg cggcccaggc gcacgaggcc gcgttcgccg gggtgtgggc cggccgtacc 1620 ccccgcctgc cggtcggtga cctgctgcgg ttcggctggt tcgacgagct gcccgcggac 1680 gcctggacgc tgcaccgcga cgagatcgcg gaggtggccc tggcccacgg cgacgccgac 1740 gcctacctgc gctgccggcc cgacgacctc gacgccctgg cggcactctt cgagcgggcc 1800 tgggcccggg ccgacttccc ggcctgcgcg cggaccgtag agctggccga ggagcaccgg 1860 caggagcggg tgccgcagtg gcgggcccgg ctcgccggcc gcggccgcat cgaccgcgac 1920 ggtcggctgc actaccgtcc gccgtccgcc gaacgggtcg aactggtctt gcccgacctg 1980 gccgaacccc tgcgcggaac ggtcaccgtg accgcgatgg ctccgaccgg cgacaccttc 2040 accggacagc tgccggccgg aacccggcgt gccgacctgc tgctcaccct cagtgacggg 2100 cgcaccgtct gggacgaggt gacggcatga 2130 <210> 5 <211> 1074 <212> DNA <213> Artificial Sequence <220> <223> >acbW (ACSP50_3593) <400> 5 atgcccgggt acgcccggca tgcccggccg gacggcacga ccggcatgat cgtcgccgag 60 cacctcagca agcacttcaa gcgctaccgg cgcgagccgg gtctgcgggg cagcctgcga 120 accatgttct cggcccggta cgacgtggtc cgggccgtcg acgacatcag cttcgaggtc 180 ccgtccggtg tcaagatcgc ctacatcggg gcgaacggcg cgggcaagtc caccacgatc 240 aaactcctga ccggcatcat gcgcccgacc accgggcggg tccgggtcga cggcctcgac 300 ccgcaccggc agcgcacccg ggtcgccggc cggatcggcg tggtcttcgg ccagcgcagc 360 cagctctggt gggatctgcc ggtcctcgac tcgttccgca tcctgcggca cgtctacgag 420 gtgccgcagg cggtgtacga ccggaacatg cgcctgttcc gggaccggct ggacctcggc 480 gccctcggca acaccccggt ccgccagctg agcctgggcc agcgcatgcg ggccgagatc 540 gccgcctcgc tgctgcacga cccggccgtg gtcttcctcg acgaacccac catcggcctg 600 gacctggtcc tcaagcaggc ggtccgggac ctgatcaacc acatccacgc cgaactgggc 660 accacggtca tgctgaccag ccacgacatc ggcgacatca ccagcatctg cgatcaggcg 720 ctggtcgtgg accgcgggac gatcgtccac cagggaacga tgcgggacct gctgcggtcg 780 gtggacaccc gggcggtcac cttcgagtac gccgccggca gcgtctccga ggccgccgcg 840 ctgcgcatca tcaccgaagg actgcccgag gtggacgcca ctccggccga gtccggccgg 900 atccgggtcg agttcccggt ggaccgctgg tcggcccggc aggtgatcgc cttcctgctg 960 gaccggttcg acctgagcga cgtgctggtg ccggacgccg atctggagac actgctgcgc 1020 cgcatctacg ccgggtcgcg cccggagccg gtcaccgccg gggacggcgc atga 1074 <210> 6 <211> 804 <212> DNA <213> Artificial Sequence <220> <223> >acbX (ACSP50_3592) <400> 6 atgatccgcg ccgcgcgccg gtacgcgccg ttcgccctcg ccggactgca cgccgtcacc 60 cgttaccgct cgaccatcgt cctgagcgca ctcacggcgg ctgcggccac ctcgttgcag 120 gtgttcctgt ggcgagccgt ctacgccggc ggaccggcac cggccggcct cccgttcgca 180 cagctcacct cgtacatcgt gctcgcgcag gtgctcggga tgctgcacac caaccggatc 240 gacgagatga tcgccggcga ggtgtaccgc ggggacatcg cggtctccct ggtacgcccg 300 gcgaactacg cgctcagctg tctggcggtg aacctgccga ccgccgcgct cagtgcgctg 360 ctggccggcg ccccggtgct cgccggtttc gcgatgttcg cgtcgctgcc cgctcccccg 420 cccgccaacc tgctgctgtt cgccgtcgcg ctgctgctct cggtgatcct cgccttcgag 480 atcaacttcc tggtgggtct cgccgccttc gtcacgacca acacctgggg catccgtacg 540 atcaagaacg cgctcgtcgc cttcctggcc ggccaggtcg tcccgctcgc gctgttcccg 600 gacggcgtgg cccggctgct gcggctgctg ccgttccagg gcctgatcga cagcccgttg 660 cggctgctgc tcggcggcta ctccggcggt tccggcgccg ctgccatcct cggtgtccag 720 gcgctctggg cggtactgct gtacggcgtg ctggccctgg cctggaaccg gtcgctgcgc 780 agggtggagg tgctcggcgg atga 804 <210> 7 <211> 804 <212> DNA <213> Artificial Sequence <220> <223> >acbY (ACSP50_3591) <400> 7 atgaccgtct ccacggcgcg ccggtacctg cgcctcacgg cggtgctgtg cggggcgagc 60 ctgcaccggc tcaccgcgta ccggatggac ttcctcatcg gggcggccag cttcgtcatc 120 cggatcgcct gccagatcgc cctgatcggg gtgatcttcc agtacgttcc ggcgctcggc 180 ggctggaccc gccagcaggc gctgttcctg ctcgggttct ccctgctgcc ccgcgggctg 240 gaccggctct tcaccgacca gctgtggatc ctggcctggc agctggtgcg caccggcgac 300 ttcttccgct acctgatccg gccggtgaac ccgttctacg cgctgctgtc cgaacggttc 360 ctctatccgg acgggttcgg ggagctggcc accggcatcg ccatcgtggt caccgcggcc 420 gggacgatgg acctgcacct gaccgtggca cagtggctgc tgttgctgcc cctggtcctc 480 ggcggcgccc tgatccacac cttcctcaag gcgttcctgg cctccctgtc gttctggatg 540 accagcagcc tcaacgtgat ggtggcggtc aaccagctca gcgagttcac cgcgtacccg 600 ctcaacctct accacccggt gctgcgcggg gtgctcacct gggtgctgcc gttcgcgttc 660 accgcctacc taccggtgcg ctacctgctc accggggacg ccgggccgct gctgtggatg 720 ctgccggtca ccacgctcac cgtcctgctg gggtacggca ccttccggct cgggctgcgg 780 cgctacgaga tgcccggcag ctga 804 <210> 8 <211> 912 <212> DNA <213> Artificial Sequence <220> <223> >gtaB galU (ACSP50_7820) <400> 8 atgacgacga acgcgcaagg gtcgggcaag cgcgcggtga aagcagtgat tccggcggcc 60 ggcctagcca cgcgtttcct gcctgccacc aaagccgttc cgaaagagct gctgccggtc 120 gtcgaccggc cggtcctgca gtacatcgtc gaggaggccg ccgcggccgg catcaccgac 180 gtgctgctgg tgaccgggcg tggcaagacc tcgatggtcg accacttcga ccgtcgcccc 240 gacgtggagc agcggctgga ggagaagggc gacaccgagc ggctcgccgc cgtccggcgc 300 accagtgagc tggccgacat ctacacctgc cgacaggggg agccgctcgg cctcggccat 360 gccgtcggga ccgccgcctc gcacgtcggg gacaacccgt tcgcggtgct gctcggggac 420 gagttcgtcg aggagggcag cccgctgctg cccgacatgc tcgacctgca ggcccgcacc 480 ggcggcatcg tgctcgcctt catcgaggtc accccggagg agacgtcgcg ctacgggatc 540 gcctcggtgc gggagtccga cctgggcgag ggcgtggtcg aggtgaccgg cctggtggag 600 aagccgtcgc cggaggaggc gccgagcaac cttgccgtgg tggggcggta cgtgctgcct 660 ggcaggatct tcgagacgat cgccggcacc aagccgggca gcgggggcga gatccagctg 720 accgacgcga tggcgacgct gctggccgag ggcaccccgg tgcacggcat cgtctaccgc 780 ggtgtccggt acgacaccgg ccagccgctg ggctacctgc agaccgtcgt ccagctcgcg 840 gctcagcgtc ccgacctggg tgccgagttc cgggcctggc tcaccgactt cgtcggtggt 900 cagaagggat ga 912 <210> 9 <211> 450 <212> DNA <213> Artificial Sequence <220> <223> >cgt (ACSP50_5024) <400> 9 atgaatcgca ccaccgttcg ggccggcgtg ctggccaccg ccctgatcag cggcgtgctc 60 ggggtggccg gcccggcgct cgccgccccg gtcaccgacg cggcgccggt cgccgccgcc 120 ggcaccgccg tcgcgccgat cgccgcgacc ttcaacgtga ccgccgggtt caccagctgg 180 ggtcagaacg tctacgtcgt cggcagcatc ccggcgctcg gctcctggga cgtctccaag 240 gcggtgccgc tgaccaccac gagcagcgcc ttcccgacct ggaccgggag cgtggcgctg 300 ccggcgaaca cgtacaccga gttccagtac gtggtgaaga acgccgacgg cagcgtcgcc 360 cgctgggaga agggtttcca gcagaaccgc accacgatca ccccgccgac cggcacctac 420 gtcacgcacg acaccttcgg cgcgtactga 450 <210> 10 <211> 1515 <212> DNA <213> Artificial Sequence <220> <223> >crtI (ACSP50_0147) <400> 10 atgatgaaac cccccacccc ctggagccgc ggcgtgcgca ctgttaccgg acccaccgat 60 cgtgtcgtga tagtgggggc cggcctggcc ggcctctcct gcgccttgca cctggccgca 120 gccgggcggc aggtcaccgt cgtcgagcgg gagccggtgc cgggcggccg cgccgggcgc 180 ctctcggtcg gcggatacga cttcgacacc ggcccgaccg tgctgaccat gccggaactg 240 atcgccgagc cgctcgccgc ggtcggcgag aatctctccg actggctgga gctgaccccg 300 ctcgacccgg cctaccgggc gtactacccg gacggctcca cgctggacgt ccgcaccgac 360 accacccgga tggcggccga gatcgcccag gtctgcggcg cccgcgaggc cgacggctac 420 ctgcggttcg tcgactacac ccggcggctc tggcagctgg aacgggacca cttcatcgac 480 cggaacctgg acagtccgct cgacctgctc aacctcaacc tgctgaagct gctcgggatg 540 ggcgctttcg gtcgcctgca gccgaagatc aacgagttct tccgcgatcc gcggacccag 600 cggatcttct cgttccaggc gatgtacgcc ggtctcgccc cgcacgacgc gatggccatc 660 tacgcggtga tcgcctacct cgactcggtc gccggggtgt actaccccaa gggcggcatg 720 cacgccgtcc ccaaggcgct ggccggcgcc gccgagaagc acggggtcac cttccgttac 780 gacacgacgg tcgagcgggt gctcacccag cacggccggg cgaccggggt ggtgaccgtc 840 ggcggggacg tgatcgaggc ggacaccgtc gtactcaatc ccgacctgcc catcgcgtac 900 cgcgacctgc tgcctgcccg gaacagccgc aacctgcgct tttcgccctc ctgcgtggta 960 ctccacatcg gatcgtcaca gcggtattcg aagatcgcac accacaacat ccactttggt 1020 acgacgtggc gccgcacctt cgacgaagtg atcaaccgtg ggctgctgat gagcgacccg 1080 tcactgctgg tcaccaatcc cacgcacacc gacccctctg ccgcgcccga cggcaaacag 1140 acctactacg tgctggcgcc cgccccgaac ctcgtctccg gtccgatgaa ctggcgcggc 1200 ggcctcgccg aacggtatgc cgacgagctg ctgcgtaccc tggagcagcg cggctacatc 1260 ggcttccggg acggggtcga ggtcgaacgg atcatcacgc cggccgactg ggccgacgac 1320 gggatggcgg ccggcacgcc gttcgccgcc gcgcacacct tcgcccagac cggcccgttc 1380 cggccggcga acctgcaccc cacgctgccg aacgtggtct tcaccggttc gggcacacaa 1440 cccggggtcg gcgtgccgat ggtgctcatc tccgggaagc tggccgcgag ccggatcaca 1500 cagggagcct catga 1515 <210> 11 <211> 1260 <212> DNA <213> Artificial Sequence <220> <223> >merR (ACSP50_0145) <400> 11 gtggccggtg aggcgttgag cgccgagatc cccacctcgc cgggcagctc ggtcgcctcc 60 tcgcacgaca tcccggccac agccggtccc ggcgccgtcc ggaccggccc ggtggctgcc 120 gcgcccggtg gcccgagcga tacgcccctg accgacgcga cagctgccgc gtcgggtgcc 180 gcggacgacg cctcccgggc ccgcccggcg accgccacgg acgacgcctc ccgcaccggc 240 ccggcgaccg ccgcgacgga ttctccggac gacgccgtcc ggaccggcgt ggcagatgcc 300 gcgccggccg ggcgggcggg cgatgtggcg ttgagtgccg gggcggccgc gcggcggctg 360 ggagtggcgg tcacgaccct gcgcacctgg caccagcggt acgggctcgg gccgagccgg 420 cacgagcccg gacatcaccg gcggtacacc gccgaggaca tggaccggct gcaggtgatg 480 cagcggctca ccactcaggg cgtggcgccc gccgaggccg ccgcctgggc gcggtccagg 540 cccctcaccc caccggagcc cggcgcggcg ctgtacgacc ccaccgccgt ggcgtcgcca 600 cccaccccgg ccgctcccgg acagcccccg gtcggccccg ccggccgggg cacccgcccg 660 acccgcggac cggccccggc cgctcgcggg ctgacccggg ccgcgatgcg gctcgacgtg 720 cgcggcatgc gcgacatcct ctgcagcacg ctgcacgacc gcggcgtgat acccgcctgg 780 accgaggtga tggtcccggc tctggccgcg atcggcgacc ggtacgaggc cactcggcgt 840 ttcgtcgagg tcgaacacct gctgtcgcgc gccgtcaccg aaatcctcgc ctcggtccca 900 caccccgccg gctctccccg ggtgctgctc gccgccgccg acgaggaaca gcacacactg 960 cccctggagg ccctggccgc cgccctggcc gagggaggcg tgccgagccg tctgttcggc 1020 gcccgggtgc cgtcacaggc cctgctggac gccatcgccc gcaccggccc ggctgccgtc 1080 gtgctctggt cgcagcgccc ggccaccggc atcgtcaccc agctgacccg ggtccgcgac 1140 atcccgcacc cgccgctggt catcgccgcc gccggccccg gctggccgca tgacctgcct 1200 tccgggatca cccgcctgac cggcctcacc gaggccgtcc acctgctcgc cacggtctag 1260 <210> 12 <211> 303 <212> PRT <213> Artificial Sequence <220> <223> >AcbA (ACSP50_3609) <400> 12 Met Arg Gly Ile Leu Leu Ala Gly Gly Thr Gly Ser Arg Leu Arg Pro 1 5 10 15 Val Thr Trp Ala Val Ser Lys Gln Leu Met Pro Val Tyr Asp Lys Pro 20 25 30 Met Ile Tyr Tyr Pro Leu Ala Thr Leu Val Ser Cys Gly Ile Arg Glu 35 40 45 Ile Leu Val Ile Thr Thr Glu Thr Glu Ala Ala Gln Phe Gln Arg Leu 50 55 60 Leu Gly Asp Gly Ser Gln Trp Gly Leu Arg Leu Glu Phe Ala Val Gln 65 70 75 80 Gln Arg Pro Gly Gly Ile Ala Glu Ala Phe Leu Ile Gly Glu Glu Phe 85 90 95 Leu Ala Gly Gly Pro Val Ala Leu Met Leu Gly Asp Asn Leu Leu His 100 105 110 Gly Val Asp Phe Arg Pro Cys Val Gln Arg Ala Arg Glu Thr Ala Gly 115 120 125 Gly His Val Phe Gly Val Ala Val Ala Asp Pro Ser Ala Tyr Gly Val 130 135 140 Val Glu Phe Asp Ala Ala Gly Arg Val Leu Ser Ile Glu Glu Lys Pro 145 150 155 160 Val Arg Pro Arg Ser Pro Tyr Ala Val Pro Gly Phe Tyr Leu Tyr Asp 165 170 175 Ala Asp Val Val Glu Thr Ala Arg Ser Leu Arg Pro Ser Ala Arg Gly 180 185 190 Glu Leu Glu Ile Thr Glu Val Asn Gln Ala Tyr Leu Arg Arg Gly Ala 195 200 205 Leu Ser Val Thr Leu Leu Gly Arg Gly Ala Val Trp Leu Asp Thr Gly 210 215 220 Thr Leu Ala Asp Cys Met Arg Ala Val Asp Tyr Val Arg Ala Ile Asp 225 230 235 240 Glu Gly Gln Gly Ile Lys Ile Gly Cys Val Glu Glu Ala Ala Trp Arg 245 250 255 Ala Gly Phe Leu Asp Thr Ala Gln Leu Arg Ala Leu Ala Glu Pro Leu 260 265 270 Met Ser Ser Gly Tyr Gly Gln Tyr Leu Leu Ala Leu Thr Gly Asp Gly 275 280 285 Leu Ser Arg Thr Pro Gln Trp Pro Ala Leu Thr Ala Ala Ala Gly 290 295 300 <210> 13 <211> 320 <212> PRT <213> Artificial Sequence <220> <223> >AcbB (ACSP50_3608) <400> 13 Met Lys Ile Leu Val Thr Gly Gly Ala Gly Phe Ile Gly Ser His Phe 1 5 10 15 Val Thr Ser Leu Ile Ser Gly Asp Ile Ala Thr Pro Gln Pro Val Thr 20 25 30 Gln Val Thr Val Val Asp Lys Leu Gly Tyr Gly Gly Asn Leu Arg Asn 35 40 45 Leu Ala Glu Ala Ser Ala Asp Pro Arg Phe Ser Phe Val Arg Gly Asp 50 55 60 Ile Cys Asp Glu Gly Leu Ile Glu Gly Leu Met Ala Arg His Asp Thr 65 70 75 80 Val Ala His Phe Ala Ala Glu Thr His Val Asp Arg Ser Val Val Ala 85 90 95 Ser Gly Pro Phe Val Ala Ser Asn Leu Val Gly Thr Gln Val Leu Leu 100 105 110 Asp Ala Ala Leu Arg His His Ile Gly Arg Phe Leu His Val Ser Thr 115 120 125 Asp Glu Val Tyr Gly Ser Ile Asp Thr Gly Ser Trp Ala Glu Gly His 130 135 140 Pro Leu Ala Pro Asn Ser Pro Tyr Ala Ala Ser Lys Ala Gly Ser Asp 145 150 155 160 Leu Leu Ala Leu Ala Tyr His Gln Thr His Gly Met Asp Val Val Val 165 170 175 Thr Arg Cys Ser Asn Asn Tyr Gly Pro Arg Gln Phe Pro Glu Lys Met 180 185 190 Ile Pro Leu Phe Val Thr Arg Leu Leu Asp Gly Leu Asp Val Pro Val 195 200 205 Tyr Gly Asp Gly Arg Asn Ile Arg Asp Trp Leu His Val Ser Asp His 210 215 220 Cys Arg Gly Leu Ala Leu Ala Leu Gly Ala Gly Arg Ala Gly Glu Val 225 230 235 240 Tyr His Ile Gly Gly Gly Trp Glu Ala Thr Asn Leu Glu Leu Thr Glu 245 250 255 Ile Leu Leu Glu Ala Cys Gly Ala Pro Ala Ser Arg Ile Ser Phe Val 260 265 270 Thr Asp Arg Lys Gly His Asp Arg Arg Tyr Ser Leu Asp Tyr Ser Lys 275 280 285 Ile Ala Gly Glu Leu Gly Tyr Arg Pro Arg Val Asp Phe Thr Asp Gly 290 295 300 Ile Ala Glu Thr Val Ala Trp Tyr Arg Ala Asn Arg Ser Trp Trp Thr 305 310 315 320 <210> 14 <211> 398 <212> PRT <213> Artificial Sequence <220> <223> >AcbC (ACSP50_3607) <400> 14 Met Ser Gly Val Glu Thr Val Gly Val His Ala Asp Ala His Arg Asp 1 5 10 15 Ser Trp Gln Val Arg Ala Gln Lys Gln Ile Thr Tyr Glu Val Arg Phe 20 25 30 Arg Asp Asp Val Phe Gly Leu Asp Ser Thr Asp Leu Leu Glu Ala Gly 35 40 45 Ala Asp Gly Ala Gly Ser Arg Arg Arg Phe Val Val Val Asp Ser Ala 50 55 60 Val Asp Ala Leu Tyr Gly Ser Arg Ile Arg Glu Tyr Phe Thr His His 65 70 75 80 Gly Ile Asp His Ser Ile Leu Val Met Arg Val Gly Glu Thr Val Lys 85 90 95 Asp Phe Asp Thr Ala Gly Arg Ile Val Ala Ala Met Asp Ala Phe Gly 100 105 110 Leu Ala Arg Arg Arg Glu Pro Met Ile Val Val Gly Gly Gly Val Leu 115 120 125 Met Asp Val Ala Gly Leu Val Ala Ser Leu Tyr Arg Arg Gly Thr Pro 130 135 140 Phe Leu Arg Val Pro Thr Thr Leu Val Gly Leu Ile Asp Ala Gly Val 145 150 155 160 Gly Ala Lys Thr Gly Val Asn Phe Asn Gly His Lys Asn Arg Leu Gly 165 170 175 Thr Tyr Ala Pro Ala Asp Leu Thr Leu Leu Asp Arg Arg Phe Leu Ala 180 185 190 Thr Leu Asp Arg Arg His Leu Ser Asn Gly Leu Ala Glu Met Leu Lys 195 200 205 Ile Ala Leu Ile Lys Asp Ala Glu Leu Phe Gln Leu Leu Glu Arg His 210 215 220 Gly Arg Val Leu Ile Glu Glu Arg Phe Gln Gly Arg Thr Gly Thr Gly 225 230 235 240 Asp Arg Ala Ala Val Arg Ala Leu Arg Ala Ala Thr His Gly Met Leu 245 250 255 Glu Glu Leu Gly Pro Asn Leu Trp Glu Ser Arg Leu Glu Arg Ser Val 260 265 270 Asp Tyr Gly His Thr Phe Ser Pro Thr Ile Glu Met Arg Ala Leu Pro 275 280 285 Ala Leu Leu His Gly Glu Ala Val Cys Val Asp Met Ala Leu Thr Thr 290 295 300 Val Leu Ala Tyr Arg Arg Gly Leu Leu Asp Val Ala Gln Arg Asp Arg 305 310 315 320 Ile Phe Ala Val Met Thr Ala Leu Gly Leu Pro Thr Trp His Pro Leu 325 330 335 Leu Thr Pro Glu Val Leu Glu Ala Ala Leu Gln Asp Thr Val Arg His 340 345 350 Arg Asp Gly Trp Gln Arg Leu Pro Leu Pro Val Gly Ile Gly Gly Val 355 360 365 Thr Phe Val Asn Asp Val Thr Ala Ala Glu Leu Gln Ala Ala Ala Leu 370 375 380 Met Gln His Arg Leu Ala Glu Asp Ala Leu Leu Leu Arg Ala 385 390 395 <210> 15 <211> 709 <212> PRT <213> Artificial Sequence <220> <223> >AcbS (ACSP50_3596) <400> 15 Met His Ile Ile Glu Thr Tyr Phe Glu Cys Gly Gly Phe Asp His Arg 1 5 10 15 Phe Ile Gln Gly Gly Thr Ser Val Tyr Leu Trp Gln Leu Ser Arg Gly 20 25 30 Leu Ala Asp Leu Gly His Arg Val Ser Ile Val Thr Pro Ala His Gly 35 40 45 Arg Leu Asp Asp Leu Arg Arg Leu His Glu Val Glu Asp Leu Pro Gly 50 55 60 Thr Asp Glu Tyr Glu Leu Pro Leu Val Leu Asp Pro Arg Val Trp Gly 65 70 75 80 Glu Arg Phe Pro Ala Gln Met Asp Ile Ala Leu Arg Thr Thr Ala His 85 90 95 Arg Ile Arg Leu Ala Gly Val Asp Leu Tyr Phe Leu Ser Asn Glu Leu 100 105 110 Leu Asp Gln Leu Pro Asp Arg Phe Tyr Pro Pro Tyr Glu Ser Lys Gly 115 120 125 Val Asp Leu Val Phe Phe Lys Pro Leu Ala Tyr Gln Val Ala Ala Ile 130 135 140 Arg Phe Ile Arg Ser His Phe Gly Asp Gln Arg Ala Ile Val His Ala 145 150 155 160 His Glu Pro Phe Tyr His Tyr Leu Met Pro Ala Ala Phe Ala Ala Asp 165 170 175 Pro Ala Lys His Val Val Ser Thr Val Gln Ser Asn Met Pro Ile Asn 180 185 190 Lys Ser Val Tyr Arg Ala Glu Val Ala Arg Leu Leu Gly Phe Leu Gly 195 200 205 Ala Pro Asn Ala Leu Pro Ala Asp Asp Pro Ala Gly Ser Arg Ser Pro 210 215 220 His Thr Val Ala Met Ser Gln Tyr Gln Gln Leu Thr His Leu His Tyr 225 230 235 240 Glu Tyr Pro Pro Asp His Val Arg Val Tyr Asp Leu Val Ala Glu His 245 250 255 Ala Asp Arg Ile Asp Phe Leu Ser Pro Gly His Arg Asp Tyr Tyr Thr 260 265 270 Cys Phe Ala Asp Thr Pro Phe Ala Gln Leu Phe Ala Thr Leu Pro Val 275 280 285 Ser Arg Thr Val Arg Arg Asn Ala Asp Lys Thr Phe Val Gly Gly Cys 290 295 300 Ala Val Gly Asp Glu Trp Val Thr Gly Glu Leu Pro Pro Val Asp Arg 305 310 315 320 Glu Lys Val Leu Ala Gly Leu Gly Leu Asp Pro Asp Leu Pro Ala Phe 325 330 335 Tyr His Asn Ala Arg Tyr Ala Val Asn His Lys Gly Gln Val Glu Leu 340 345 350 Ile Arg Ala Val Asp Arg Val Leu Ser Gly Gly Val Arg Ala Ser Phe 355 360 365 Ile Val Arg Cys Leu Ser Asp Ala Gly Ile Ala Asp Pro Leu Phe His 370 375 380 Glu Val Val Ala Arg His Pro Gly Arg Val Asn Leu Glu Trp His Arg 385 390 395 400 Val Pro Glu Asp Gln Leu Arg Glu Tyr Ala Arg Ala Ala Asp Phe Cys 405 410 415 Leu Phe Pro Ser Lys Phe Glu Met Asp Thr Phe Leu Ile Ala Gln Gly 420 425 430 Glu Ala Met Ala Ala Gly Ala Val Pro Ile Ala Thr Ala Gln Leu Gly 435 440 445 Met Ala His Phe Gly His Val Ala Asp Pro Leu Thr Gly Pro Asp Ala 450 455 460 Ala Thr Ala Thr Gly Phe Ala Val Asn Arg Ser Phe Ala Glu Asp Asp 465 470 475 480 Pro Leu Leu Val Gln Gly Leu Thr Glu Gln Ile Arg Arg Ala Val Thr 485 490 495 Leu Trp Asn Glu Gln Pro Gly Gln Tyr Arg Arg Leu Ser Ala Asn Ala 500 505 510 Val Ala Arg Ala Arg Glu Phe Thr Trp Arg Arg Ala Ala Gln Ala His 515 520 525 Glu Ala Ala Phe Ala Gly Val Trp Ala Gly Arg Thr Pro Arg Leu Pro 530 535 540 Val Gly Asp Leu Leu Arg Phe Gly Trp Phe Asp Glu Leu Pro Ala Asp 545 550 555 560 Ala Trp Thr Leu His Arg Asp Glu Ile Ala Glu Val Ala Leu Ala His 565 570 575 Gly Asp Ala Asp Ala Tyr Leu Arg Cys Arg Pro Asp Asp Leu Asp Ala 580 585 590 Leu Ala Ala Leu Phe Glu Arg Ala Trp Ala Arg Ala Asp Phe Pro Ala 595 600 605 Cys Ala Arg Thr Val Glu Leu Ala Glu Glu His Arg Gln Glu Arg Val 610 615 620 Pro Gln Trp Arg Ala Arg Leu Ala Gly Arg Gly Arg Ile Asp Arg Asp 625 630 635 640 Gly Arg Leu His Tyr Arg Pro Pro Ser Ala Glu Arg Val Glu Leu Val 645 650 655 Leu Pro Asp Leu Ala Glu Pro Leu Arg Gly Thr Val Thr Val Thr Ala 660 665 670 Met Ala Pro Thr Gly Asp Thr Phe Thr Gly Gln Leu Pro Ala Gly Thr 675 680 685 Arg Arg Ala Asp Leu Leu Leu Thr Leu Ser Asp Gly Arg Thr Val Trp 690 695 700 Asp Glu Val Thr Ala 705 <210> 16 <211> 357 <212> PRT <213> Artificial Sequence <220> <223> >AcbW (ACSP50_3593) <400> 16 Met Pro Gly Tyr Ala Arg His Ala Arg Pro Asp Gly Thr Thr Gly Met 1 5 10 15 Ile Val Ala Glu His Leu Ser Lys His Phe Lys Arg Tyr Arg Arg Glu 20 25 30 Pro Gly Leu Arg Gly Ser Leu Arg Thr Met Phe Ser Ala Arg Tyr Asp 35 40 45 Val Val Arg Ala Val Asp Asp Ile Ser Phe Glu Val Pro Ser Gly Val 50 55 60 Lys Ile Ala Tyr Ile Gly Ala Asn Gly Ala Gly Lys Ser Thr Thr Ile 65 70 75 80 Lys Leu Leu Thr Gly Ile Met Arg Pro Thr Thr Gly Arg Val Arg Val 85 90 95 Asp Gly Leu Asp Pro His Arg Gln Arg Thr Arg Val Ala Gly Arg Ile 100 105 110 Gly Val Val Phe Gly Gln Arg Ser Gln Leu Trp Trp Asp Leu Pro Val 115 120 125 Leu Asp Ser Phe Arg Ile Leu Arg His Val Tyr Glu Val Pro Gln Ala 130 135 140 Val Tyr Asp Arg Asn Met Arg Leu Phe Arg Asp Arg Leu Asp Leu Gly 145 150 155 160 Ala Leu Gly Asn Thr Pro Val Arg Gln Leu Ser Leu Gly Gln Arg Met 165 170 175 Arg Ala Glu Ile Ala Ala Ser Leu Leu His Asp Pro Ala Val Val Phe 180 185 190 Leu Asp Glu Pro Thr Ile Gly Leu Asp Leu Val Leu Lys Gln Ala Val 195 200 205 Arg Asp Leu Ile Asn His Ile His Ala Glu Leu Gly Thr Thr Val Met 210 215 220 Leu Thr Ser His Asp Ile Gly Asp Ile Thr Ser Ile Cys Asp Gln Ala 225 230 235 240 Leu Val Val Asp Arg Gly Thr Ile Val His Gln Gly Thr Met Arg Asp 245 250 255 Leu Leu Arg Ser Val Asp Thr Arg Ala Val Thr Phe Glu Tyr Ala Ala 260 265 270 Gly Ser Val Ser Glu Ala Ala Ala Leu Arg Ile Ile Thr Glu Gly Leu 275 280 285 Pro Glu Val Asp Ala Thr Pro Ala Glu Ser Gly Arg Ile Arg Val Glu 290 295 300 Phe Pro Val Asp Arg Trp Ser Ala Arg Gln Val Ile Ala Phe Leu Leu 305 310 315 320 Asp Arg Phe Asp Leu Ser Asp Val Leu Val Pro Asp Ala Asp Leu Glu 325 330 335 Thr Leu Leu Arg Arg Ile Tyr Ala Gly Ser Arg Pro Glu Pro Val Thr 340 345 350 Ala Gly Asp Gly Ala 355 <210> 17 <211> 267 <212> PRT <213> Artificial Sequence <220> <223> >AcbX (ACSP50_3592) <400> 17 Met Ile Arg Ala Ala Arg Arg Tyr Ala Pro Phe Ala Leu Ala Gly Leu 1 5 10 15 His Ala Val Thr Arg Tyr Arg Ser Thr Ile Val Leu Ser Ala Leu Thr 20 25 30 Ala Ala Ala Ala Thr Ser Leu Gln Val Phe Leu Trp Arg Ala Val Tyr 35 40 45 Ala Gly Gly Pro Ala Pro Ala Gly Leu Pro Phe Ala Gln Leu Thr Ser 50 55 60 Tyr Ile Val Leu Ala Gln Val Leu Gly Met Leu His Thr Asn Arg Ile 65 70 75 80 Asp Glu Met Ile Ala Gly Glu Val Tyr Arg Gly Asp Ile Ala Val Ser 85 90 95 Leu Val Arg Pro Ala Asn Tyr Ala Leu Ser Cys Leu Ala Val Asn Leu 100 105 110 Pro Thr Ala Ala Leu Ser Ala Leu Leu Ala Gly Ala Pro Val Leu Ala 115 120 125 Gly Phe Ala Met Phe Ala Ser Leu Pro Ala Pro Pro Pro Ala Asn Leu 130 135 140 Leu Leu Phe Ala Val Ala Leu Leu Leu Ser Val Ile Leu Ala Phe Glu 145 150 155 160 Ile Asn Phe Leu Val Gly Leu Ala Ala Phe Val Thr Thr Asn Thr Trp 165 170 175 Gly Ile Arg Thr Ile Lys Asn Ala Leu Val Ala Phe Leu Ala Gly Gln 180 185 190 Val Val Pro Leu Ala Leu Phe Pro Asp Gly Val Ala Arg Leu Leu Arg 195 200 205 Leu Leu Pro Phe Gln Gly Leu Ile Asp Ser Pro Leu Arg Leu Leu Leu 210 215 220 Gly Gly Tyr Ser Gly Gly Ser Gly Ala Ala Ala Ile Leu Gly Val Gln 225 230 235 240 Ala Leu Trp Ala Val Leu Leu Tyr Gly Val Leu Ala Leu Ala Trp Asn 245 250 255 Arg Ser Leu Arg Arg Val Glu Val Leu Gly Gly 260 265 <210> 18 <211> 267 <212> PRT <213> Artificial Sequence <220> <223> >AcbY (ACSP50_3591) <400> 18 Met Thr Val Ser Thr Ala Arg Arg Tyr Leu Arg Leu Thr Ala Val Leu 1 5 10 15 Cys Gly Ala Ser Leu His Arg Leu Thr Ala Tyr Arg Met Asp Phe Leu 20 25 30 Ile Gly Ala Ala Ser Phe Val Ile Arg Ile Ala Cys Gln Ile Ala Leu 35 40 45 Ile Gly Val Ile Phe Gln Tyr Val Pro Ala Leu Gly Gly Trp Thr Arg 50 55 60 Gln Gln Ala Leu Phe Leu Leu Gly Phe Ser Leu Leu Pro Arg Gly Leu 65 70 75 80 Asp Arg Leu Phe Thr Asp Gln Leu Trp Ile Leu Ala Trp Gln Leu Val 85 90 95 Arg Thr Gly Asp Phe Phe Arg Tyr Leu Ile Arg Pro Val Asn Pro Phe 100 105 110 Tyr Ala Leu Leu Ser Glu Arg Phe Leu Tyr Pro Asp Gly Phe Gly Glu 115 120 125 Leu Ala Thr Gly Ile Ala Ile Val Val Thr Ala Ala Gly Thr Met Asp 130 135 140 Leu His Leu Thr Val Ala Gln Trp Leu Leu Leu Leu Pro Leu Val Leu 145 150 155 160 Gly Gly Ala Leu Ile His Thr Phe Leu Lys Ala Phe Leu Ala Ser Leu 165 170 175 Ser Phe Trp Met Thr Ser Ser Leu Asn Val Met Val Ala Val Asn Gln 180 185 190 Leu Ser Glu Phe Thr Ala Tyr Pro Leu Asn Leu Tyr His Pro Val Leu 195 200 205 Arg Gly Val Leu Thr Trp Val Leu Pro Phe Ala Phe Thr Ala Tyr Leu 210 215 220 Pro Val Arg Tyr Leu Leu Thr Gly Asp Ala Gly Pro Leu Leu Trp Met 225 230 235 240 Leu Pro Val Thr Thr Leu Thr Val Leu Leu Gly Tyr Gly Thr Phe Arg 245 250 255 Leu Gly Leu Arg Arg Tyr Glu Met Pro Gly Ser 260 265 <210> 19 <211> 303 <212> PRT <213> Artificial Sequence <220> <223> >GtaB GalU (ACSP50_7820) <400> 19 Met Thr Thr Asn Ala Gln Gly Ser Gly Lys Arg Ala Val Lys Ala Val 1 5 10 15 Ile Pro Ala Ala Gly Leu Ala Thr Arg Phe Leu Pro Ala Thr Lys Ala 20 25 30 Val Pro Lys Glu Leu Leu Pro Val Val Asp Arg Pro Val Leu Gln Tyr 35 40 45 Ile Val Glu Glu Ala Ala Ala Ala Gly Ile Thr Asp Val Leu Leu Val 50 55 60 Thr Gly Arg Gly Lys Thr Ser Met Val Asp His Phe Asp Arg Arg Pro 65 70 75 80 Asp Val Glu Gln Arg Leu Glu Glu Lys Gly Asp Thr Glu Arg Leu Ala 85 90 95 Ala Val Arg Arg Thr Ser Glu Leu Ala Asp Ile Tyr Thr Cys Arg Gln 100 105 110 Gly Glu Pro Leu Gly Leu Gly His Ala Val Gly Thr Ala Ala Ser His 115 120 125 Val Gly Asp Asn Pro Phe Ala Val Leu Leu Gly Asp Glu Phe Val Glu 130 135 140 Glu Gly Ser Pro Leu Leu Pro Asp Met Leu Asp Leu Gln Ala Arg Thr 145 150 155 160 Gly Gly Ile Val Leu Ala Phe Ile Glu Val Thr Pro Glu Glu Thr Ser 165 170 175 Arg Tyr Gly Ile Ala Ser Val Arg Glu Ser Asp Leu Gly Glu Gly Val 180 185 190 Val Glu Val Thr Gly Leu Val Glu Lys Pro Ser Pro Glu Glu Ala Pro 195 200 205 Ser Asn Leu Ala Val Val Gly Arg Tyr Val Leu Pro Gly Arg Ile Phe 210 215 220 Glu Thr Ile Ala Gly Thr Lys Pro Gly Ser Gly Gly Glu Ile Gln Leu 225 230 235 240 Thr Asp Ala Met Ala Thr Leu Leu Ala Glu Gly Thr Pro Val His Gly 245 250 255 Ile Val Tyr Arg Gly Val Arg Tyr Asp Thr Gly Gln Pro Leu Gly Tyr 260 265 270 Leu Gln Thr Val Val Gln Leu Ala Ala Gln Arg Pro Asp Leu Gly Ala 275 280 285 Glu Phe Arg Ala Trp Leu Thr Asp Phe Val Gly Gly Gln Lys Gly 290 295 300 <210> 20 <211> 149 <212> PRT <213> Artificial Sequence <220> <223> >Cgt (ACSP50:5024) <400> 20 Met Asn Arg Thr Thr Val Arg Ala Gly Val Leu Ala Thr Ala Leu Ile 1 5 10 15 Ser Gly Val Leu Gly Val Ala Gly Pro Ala Leu Ala Ala Pro Val Thr 20 25 30 Asp Ala Ala Pro Val Ala Ala Ala Gly Thr Ala Val Ala Pro Ile Ala 35 40 45 Ala Thr Phe Asn Val Thr Ala Gly Phe Thr Ser Trp Gly Gln Asn Val 50 55 60 Tyr Val Val Gly Ser Ile Pro Ala Leu Gly Ser Trp Asp Val Ser Lys 65 70 75 80 Ala Val Pro Leu Thr Thr Thr Ser Ser Ala Phe Pro Thr Trp Thr Gly 85 90 95 Ser Val Ala Leu Pro Ala Asn Thr Tyr Thr Glu Phe Gln Tyr Val Val 100 105 110 Lys Asn Ala Asp Gly Ser Val Ala Arg Trp Glu Lys Gly Phe Gln Gln 115 120 125 Asn Arg Thr Thr Ile Thr Pro Pro Thr Gly Thr Tyr Val Thr His Asp 130 135 140 Thr Phe Gly Ala Tyr 145 <210> 21 <211> 504 <212> PRT <213> Artificial Sequence <220> <223> >CrtI (ACSP50_0147) <400> 21 Met Met Lys Pro Pro Thr Pro Trp Ser Arg Gly Val Arg Thr Val Thr 1 5 10 15 Gly Pro Thr Asp Arg Val Val Ile Val Gly Ala Gly Leu Ala Gly Leu 20 25 30 Ser Cys Ala Leu His Leu Ala Ala Ala Gly Arg Gln Val Thr Val Val 35 40 45 Glu Arg Glu Pro Val Pro Gly Gly Arg Ala Gly Arg Leu Ser Val Gly 50 55 60 Gly Tyr Asp Phe Asp Thr Gly Pro Thr Val Leu Thr Met Pro Glu Leu 65 70 75 80 Ile Ala Glu Pro Leu Ala Ala Val Gly Glu Asn Leu Ser Asp Trp Leu 85 90 95 Glu Leu Thr Pro Leu Asp Pro Ala Tyr Arg Ala Tyr Tyr Pro Asp Gly 100 105 110 Ser Thr Leu Asp Val Arg Thr Asp Thr Thr Arg Met Ala Ala Glu Ile 115 120 125 Ala Gln Val Cys Gly Ala Arg Glu Ala Asp Gly Tyr Leu Arg Phe Val 130 135 140 Asp Tyr Thr Arg Arg Leu Trp Gln Leu Glu Arg Asp His Phe Ile Asp 145 150 155 160 Arg Asn Leu Asp Ser Pro Leu Asp Leu Leu Asn Leu Asn Leu Leu Lys 165 170 175 Leu Leu Gly Met Gly Ala Phe Gly Arg Leu Gln Pro Lys Ile Asn Glu 180 185 190 Phe Phe Arg Asp Pro Arg Thr Gln Arg Ile Phe Ser Phe Gln Ala Met 195 200 205 Tyr Ala Gly Leu Ala Pro His Asp Ala Met Ala Ile Tyr Ala Val Ile 210 215 220 Ala Tyr Leu Asp Ser Val Ala Gly Val Tyr Tyr Pro Lys Gly Gly Met 225 230 235 240 His Ala Val Pro Lys Ala Leu Ala Gly Ala Ala Glu Lys His Gly Val 245 250 255 Thr Phe Arg Tyr Asp Thr Thr Val Glu Arg Val Leu Thr Gln His Gly 260 265 270 Arg Ala Thr Gly Val Val Thr Val Gly Gly Asp Val Ile Glu Ala Asp 275 280 285 Thr Val Val Leu Asn Pro Asp Leu Pro Ile Ala Tyr Arg Asp Leu Leu 290 295 300 Pro Ala Arg Asn Ser Arg Asn Leu Arg Phe Ser Pro Ser Cys Val Val 305 310 315 320 Leu His Ile Gly Ser Ser Gln Arg Tyr Ser Lys Ile Ala His His Asn 325 330 335 Ile His Phe Gly Thr Thr Trp Arg Arg Thr Phe Asp Glu Val Ile Asn 340 345 350 Arg Gly Leu Leu Met Ser Asp Pro Ser Leu Leu Val Thr Asn Pro Thr 355 360 365 His Thr Asp Pro Ser Ala Ala Pro Asp Gly Lys Gln Thr Tyr Tyr Val 370 375 380 Leu Ala Pro Ala Pro Asn Leu Val Ser Gly Pro Met Asn Trp Arg Gly 385 390 395 400 Gly Leu Ala Glu Arg Tyr Ala Asp Glu Leu Leu Arg Thr Leu Glu Gln 405 410 415 Arg Gly Tyr Ile Gly Phe Arg Asp Gly Val Glu Val Glu Arg Ile Ile 420 425 430 Thr Pro Ala Asp Trp Ala Asp Asp Gly Met Ala Ala Gly Thr Pro Phe 435 440 445 Ala Ala Ala His Thr Phe Ala Gln Thr Gly Pro Phe Arg Pro Ala Asn 450 455 460 Leu His Pro Thr Leu Pro Asn Val Val Phe Thr Gly Ser Gly Thr Gln 465 470 475 480 Pro Gly Val Gly Val Pro Met Val Leu Ile Ser Gly Lys Leu Ala Ala 485 490 495 Ser Arg Ile Thr Gln Gly Ala Ser 500 <210> 22 <211> 419 <212> PRT <213> Artificial Sequence <220> <223> >MerR (ACSP50_0145) <400> 22 Met Ala Gly Glu Ala Leu Ser Ala Glu Ile Pro Thr Ser Pro Gly Ser 1 5 10 15 Ser Val Ala Ser Ser His Asp Ile Pro Ala Thr Ala Gly Pro Gly Ala 20 25 30 Val Arg Thr Gly Pro Val Ala Ala Ala Pro Gly Gly Pro Ser Asp Thr 35 40 45 Pro Leu Thr Asp Ala Thr Ala Ala Ala Ser Gly Ala Ala Asp Asp Ala 50 55 60 Ser Arg Ala Arg Pro Ala Thr Ala Thr Asp Asp Ala Ser Arg Thr Gly 65 70 75 80 Pro Ala Thr Ala Ala Thr Asp Ser Pro Asp Asp Ala Val Arg Thr Gly 85 90 95 Val Ala Asp Ala Ala Pro Ala Gly Arg Ala Gly Asp Val Ala Leu Ser 100 105 110 Ala Gly Ala Ala Ala Arg Arg Leu Gly Val Ala Val Thr Thr Leu Arg 115 120 125 Thr Trp His Gln Arg Tyr Gly Leu Gly Pro Ser Arg His Glu Pro Gly 130 135 140 His His Arg Arg Tyr Thr Ala Glu Asp Met Asp Arg Leu Gln Val Met 145 150 155 160 Gln Arg Leu Thr Thr Gln Gly Val Ala Pro Ala Glu Ala Ala Ala Trp 165 170 175 Ala Arg Ser Arg Pro Leu Thr Pro Pro Glu Pro Gly Ala Ala Leu Tyr 180 185 190 Asp Pro Thr Ala Val Ala Ser Pro Pro Thr Pro Ala Ala Pro Gly Gln 195 200 205 Pro Pro Val Gly Pro Ala Gly Arg Gly Thr Arg Pro Thr Arg Gly Pro 210 215 220 Ala Pro Ala Ala Arg Gly Leu Thr Arg Ala Ala Met Arg Leu Asp Val 225 230 235 240 Arg Gly Met Arg Asp Ile Leu Cys Ser Thr Leu His Asp Arg Gly Val 245 250 255 Ile Pro Ala Trp Thr Glu Val Met Val Pro Ala Leu Ala Ala Ile Gly 260 265 270 Asp Arg Tyr Glu Ala Thr Arg Arg Phe Val Glu Val Glu His Leu Leu 275 280 285 Ser Arg Ala Val Thr Glu Ile Leu Ala Ser Val Pro His Pro Ala Gly 290 295 300 Ser Pro Arg Val Leu Leu Ala Ala Ala Asp Glu Glu Gln His Thr Leu 305 310 315 320 Pro Leu Glu Ala Leu Ala Ala Ala Leu Ala Glu Gly Gly Val Pro Ser 325 330 335 Arg Leu Phe Gly Ala Arg Val Pro Ser Gln Ala Leu Leu Asp Ala Ile 340 345 350 Ala Arg Thr Gly Pro Ala Ala Val Val Leu Trp Ser Gln Arg Pro Ala 355 360 365 Thr Gly Ile Val Thr Gln Leu Thr Arg Val Arg Asp Ile Pro His Pro 370 375 380 Pro Leu Val Ile Ala Ala Ala Gly Pro Gly Trp Pro His Asp Leu Pro 385 390 395 400 Ser Gly Ile Thr Arg Leu Thr Gly Leu Thr Glu Ala Val His Leu Leu 405 410 415 Ala Thr Val <210> 23 <211> 1923 <212> DNA <213> Artificial Sequence <220> <223> >dxs (ACSP50_7096) <400> 23 atgagcgact ccccttcgac cccggccggc ctgctggcga gcgtcaccgg tcccggtgct 60 ctcaagcgac tgtccgcgga gcagctgacc ctgctcgcgg ccgagatccg tgacttcctc 120 gtggccaagg tgtcgaagac cggggggcac ctcggaccga acctgggcgt ggtcgagatg 180 accctcgcca tgcaccgggt cttcgactcg ccgcgcgaca agatcctctt cgacaccggc 240 caccaggcgt acgtgcacaa gatcgtcacc ggccggcagg acggtttcga cctgctccgc 300 cagcggggtg gcctgaccgg ctacccgagc caggcggaga gcgagcacga cctcatcgag 360 aactcgcacg cctccaccgc gttgtcctac gccgacggcc tggccaaggc gttcgcgctg 420 cgcggcgagg accggcacgt ggtggccgtg gtcggcgacg gcgcgctcac cggcggcatg 480 tgctgggagg cgctcaacaa catcgccgcc acgaagaaca ggctggtcat cgtcgtcaac 540 gacaacggtc ggtcgtacgc gccgacgatc ggcggcctgg ccgaccacct ctccacgctg 600 cggctcaacc ccggctacga gaaggtgctc gacctggtca aggacgcgct cggctcgacc 660 ccgctggtcg gaaagccggt cttcgaggtg ctgcacgcgg tcaagcgcgg gatcaaggac 720 gcggtcagcc cgcagccgat gttcgaggac ctcggcctga agtacatcgg gccggtcgac 780 ggtcacgacc agcaggcgat ggagtccgcg ctgcgccggg ccaaggggtt caacgcgccg 840 gtgatcgtgc acgcggtgac ccgcaagggc tacggctacc gtcccgccga gcaggacgag 900 gcggactgcc tgcacggccc gggcgccttc gacccgcaga ccggcgcgct caccgccaag 960 ccgtcgctca agtggaccaa ggtcttcgcc gaggagctgg tgaagatcgc cgacgaacgc 1020 cccgacgtgg tgggcatcac ggccgccatg gccgagccga ccggcatcgc cgctctcgcc 1080 aagaagtacc ccgaccgggc gtacgacgtg ggcatcgccg agcagcacgc cgcgaccagc 1140 gccgcgggcc tggcgatggg cggcctgcac ccggtggtgg cggtctacgc caccttcctg 1200 aaccgcgctt tcgaccaggt gctgctggac gtcgcgatgc atcggctgcc ggtgaccttc 1260 gtgctggacc gggccggcat caccgggccg gacggcccca gccactacgg catctgggac 1320 atgagtgtct tcggcgccgt ccccggcctg cgcatcgccg ccccgcggga cgccgccacc 1380 ctgcgcgagg aactgcgcga ggcggtcgcg gtcgacgacg gcccgaccat cgtgcggttc 1440 ccgaccggtg cggtcgccgc ggacaccccg gcggtgcgcc gggtcggtca ggtcgacgtg 1500 ctgcgcgagg cggagaagaa ggacatcctg ctggtcgcgg tcggctcgtt cgtcggcctc 1560 gggctggacg ccgccgagcg gctcgccgag caggggtacg gcgtgaccgt ggtcgacccg 1620 cgctgggtgc gcccggtgcc gatcgagctg accggcctgg ccgcccagca ccgcctggtg 1680 gtgaccctgg aggacgggat ccgcgccggt ggtgtcggtg acgcggtggc cgccgcgctg 1740 cgcgacgccg gggtgcacgt gccgctgcgc gatttcggcg tgccggccgg tttccacccg 1800 cacggcaccc gggccgagat cctcgcctcg ctgggtctga ccgcgcagga cgtcgcgcgg 1860 gacgtgaccg gctgggtgtc cggcctggac gccggcacgt cggtggcggc cccggcgatc 1920 tga 1923 <210> 24 <211> 1173 <212> DNA <213> Artificial Sequence <220> <223> >ispG (ACSP50_7248) <400> 24 gtgaccgcga tcagtctcgg aatgccggcc gtccccccgc cgccgctggc cccgcgccgc 60 cagagccggc agatcaacgt cggaggagtc ctggtcggcg ggggcgcccc ggtcagcgtc 120 cagtcgatga ccaccaccct cacctccgac gtcaacgcga ccctgcagca gatcgccgag 180 ctgaccgcgg ccggctgcca gatcgtccgg gtcgccgtgc cgtcccagga cgacgtcgag 240 gcgctgccgg cgatcgccaa gaagtcgcag atcccggtga tcgccgacat ccacttccag 300 cccaagtacg tgttcgccgc gatcgacgcg ggctgcgcgg cggtccgggt caatccgggc 360 aacatccgcc agttcgacga caaggtcaag gagatcgccc gggccgcgtc cgacgccggc 420 gtgccgatcc ggatcggggt caacgccggc tcgctcgaca agcggcttct cgagaaatac 480 ggcaaggcca ccgccgaggc gctggtggag tcggcgctct gggagtgctc gctgttcgag 540 gagcacggtt tccgggacat caagatctcg gtcaaacaca acgatccggt cgtgatgatc 600 cgcgcctacc gtcagctcgc cgagcagtgc gactacccgc tgcacctggg cgtgaccgag 660 gccgggccgg ccttccaggg cacgatcaag tcggcggtgg cgttcggcgc gctgctcgcc 720 gaggggatcg gcgacaccat ccgggtctcg ctgtccgcgc cgccggtcga ggagatcaag 780 gtcgggcagc agatcctgga gtcgctcggc ctgcgcgaac gcggcctgga gatcgtctcc 840 tgcccgtcct gcgggcgggc ccaggtcgac gtctacacgc tggccgagca ggtgaccgcg 900 gcgctcgacg ggttcccggt gccgctgcga gtggccgtga tgggctgcgt cgtgaacggg 960 cccggggagg ctcgcgaggc cgacctcggg gtcgcctccg gcaacggcaa ggggcagatc 1020 ttcgtcaagg gcaaggtgat caagacggtg ccggaggcgg tgatcgtcga gacgctggtc 1080 gaggaggcgc tgcggctcgc cgacgagatg ggcgcggagc tgcccgacga gctgcgcgag 1140 ctgctgcccg gtcccacggt caccgtgcac tag 1173 <210> 25 <211> 1200 <212> DNA <213> Artificial Sequence <220> <223> >dxr (ACSP50_7250) <400> 25 atgcgtgagc ttgtgctgct ggggtcgacc gggtccatcg gcacccaggc catcgatatc 60 gtccggcgca acccggagct gttccgggtg gtcgcgatcg gggccggggg tggcaacgtc 120 gcgttgctcg cggcgcaggc gctggagctg ggcgtcgagg tggtcggggt ggcccgggcc 180 tcggtcgtgc aggatctgca gctggccttc tacgccgagg cgcagaagcg tggctggtcg 240 tccggcgact tcaaactgcc gaagatcgtg gccgggccgg acgcgatgac cgagctggcc 300 cgctggccgt gtgacgtcgt tctcaacggg gtggtcggca gcctcggcct ggcgccgacc 360 ctggccgctc tggagtccgg gcggatcctt gcgctggcca acaaggagtc gctggtcgcc 420 ggcggcccgc tggtccggcg gatcgccaag gacgggcaga tcgtcccggt cgactcggag 480 cattcggcgc tggcccagtg cctgcgcggc gggcgggccg cggaggtgcg ccggctggtg 540 ctgaccgcca gcgggggagc cttccgcggg cggcggcgcg cggagctgac gaacgtcacc 600 cccgaggagg cgctcaagca cccgacctgg gacatggggc cggtcgtcac gatcaactcg 660 gcgaccatgg tgaacaaggc gctggaagtg atcgaggcgc acgagctgtt cggcgtgccg 720 tacgacgaca tcgcggtgat ggtgcacccg cagtcggtgc tgcattcgct ggtcgagttc 780 accgacggct cgacgctggc ccaggccagc ccgccggaca tgcggctgcc gatcgcgctg 840 gcgctggcct ggccggaccg ggtgccgggg gcggccgccg cggtggactg gacgctggcg 900 cacaactggg agctgcgacc gctggacgac gaggcgttcc cggcggtcga gctggccaag 960 gcggccggcc ggtacggtcg ctgccgtccg gcgatcttca acgccgccaa cgaggagtgt 1020 gtggccgctt tcgccgccgg tcggctacct ttcttgggca tcgtcgacac cctggaacgg 1080 gtgctcgcgg cggccccgga tttcgcggag ccgagtaccg tcgatgacgt gctggccgca 1140 gaatcctggg cgcgtgccca ggcacagcgg acgatcgcga ctgtggctga aggagcctga 1200 <210> 26 <211> 963 <212> DNA <213> Artificial Sequence <220> <223> >ispH (ACSP50_7707) <400> 26 gtgttgctcg ccaagccgcg tggttactgc gccggtgtcg accgcgccgt gcagaccgtc 60 gaggaggcgc tgaaactcta cggcgccccg gtctacgtgc gtaagcagat cgtgcacaac 120 aagcacgtgg tcagcacgct ggaggcccgc ggcgcgatct tcgtcgagga gaactacgag 180 gtgcccgagg gcgccaccgt ggtgttctcc gcgcacggcg tcgcccccga ggtgcacgac 240 caggcccgcg agcgccggct caaggcgatc gacgcgacct gcccgctggt caccaaggtg 300 caccacgagg cgaaacggtt cgccgccgag gactacgaca tcctgctgat cggtcacgag 360 gggcacgagg aggtcatcgg cacctccggc gaggccccgg cgcacatcca gctcgtcgac 420 ggccccgacg acgtggcgaa cgtcgtcgtc cgcgacccgg ccaaggtcgt ctggctgtcg 480 cagaccacgc tgtcggtgga cgagacgatg gagacggtgg cccggctcaa gacccggctg 540 ccgctgctgc agtcgccgcc cagcgacgac atctgctacg ccacctcgaa ccggcagcac 600 gtgatcaagg agatcgcgcc ggagtgcgac gtggtgatcg tggtcggctc gaccaactcg 660 tcgaactcgg tccgcctggt cgaggtcgcc ctcggtgccg gcgcccgggc cggtcacctc 720 gtcgactacg ccgccgagat ccaggacgag tggctggccg gcgccaccac ggtcggtgtc 780 tcctccggcg ccagcgtgcc ggacgagctg gtgatggagg tgctggcgca cctcgcggag 840 cgtggcttcg gcgaggtcac cgagttcacc acggccgagg agcggctcac cttctccctc 900 ccgcaggagc tccgcaagga catgaaggcc gccgaggcgg cccgggccgc tgccgccggc 960 tga 963 <210> 27 <211> 948 <212> DNA <213> Artificial Sequence <220> <223> >ispE (ACSP50_7802) <400> 27 atgaccgagg cgtggggtcc ggacgacgac gagccgcgcc cgtacagcgg cccggtcaag 60 gtccgcgtgc cggccaaaat caacctgcac ctcgcggtcg gcccgctgcg acccgacggc 120 taccacgagc tgaacaccgt ctaccacgcc atctcgctgt tcgacgagat caccgcccgg 180 cacggcgaca ccctcaccct caccatggag ggcgagggca ccggcgacct cgccctcgac 240 gagaccaacc tgatcatccg cgccgcccgc gccctggccg cccgcgcccg cgtccccgcc 300 tacgcccggc tgcacctgcg caagagcatc ccgctcgccg gcggcctggc cggcggcagc 360 gccgacgccg ccgccaccct gatcgcctgc gacctgctct ggggcctcgg catgagccgc 420 gacgagctcg ccgaggtcgg cgcccaactc ggctccgaca tccccttcct gctgcacggc 480 ggcaccgccc tcggcaccgg ccacggcgag gcggtcagcc ccatcctggc ccgccccacc 540 acctggcact ggaccgtcgc catcgccgac ggcggcctgg ccacccccgc cgtctaccgc 600 gagctcgaca ccctgcgcgc cggcacctgg ccacccactc cgctcggcag cgccgacacc 660 ctgatggccg ccctgcgcca gcgcaacccg gaaatcctcg gcgccgccct cggcaacgac 720 ctgcaaccgg ccgccctcgc cctgcgcccc cagctcgccg acgtgctcaa agccggcacc 780 gaggccggcg ccctcgccgg cctcgtctcc ggctccggcc ccacctgcgt cttcctcgcc 840 gccgacgcca cacacgccca ggagatcgcc gacagcctca ccgaagccgg cgtctgccgg 900 gccgcggtca ccgcccgcgg accccagccc ggcgcgcggg taatctag 948 <210> 28 <211> 489 <212> DNA <213> Artificial Sequence <220> <223> >ispF (ACSP50_8046) <400> 28 gtgatcattc cgcgggtggg tatcggcacg gacgtgcacg cattcgacgc tgaccgggcc 60 tgctgggtgg ccgggctgga gtggccgggg gagccggggc tggccgggca ctcggacgcg 120 gacgtggtgg cccacgcggc ctgtgacgcg ctgctgtcgg cggccgggct cggggatctg 180 gggggcaact tcgggacgag ccggccggag tgggccgggg cagccggggt cacgctgctc 240 gccgagacgg cgcggctggt ccgggcggcc gggttcgcga tcggcaacgt gtcggtgcag 300 gtgatcggga accggccgaa gatcgggaag cggcgggccg aggccgagaa ggtgctctcc 360 gcggcggtgg gggcgccggt caccgtgtcc gggaccacat ccgacgggct ggggctcacc 420 gggcgtggtg aggggctggc cggagtcgcg gtggcgatgg tctacacgga gaacgctctt 480 ccggcctga 489 <210> 29 <211> 732 <212> DNA <213> Artificial Sequence <220> <223> >ispD (ACSP50_8047) <400> 29 gtgatcgccg accgcgacgt gaccgcgcag ctcaatgctc gcggtgacgt cgcggtcgtc 60 gttccggcgg cgggggcggg tctccggctc ggcccgggcg gcccgaaagc tctgcgtctg 120 ctcgacggcg agccgctgct cgtgcacgcg gtccggcggt tggccgcggc cgcgccggtc 180 cgcatgatcg tggtggccgc tccgcccgcc gaggtcgacg cggtgtccgc gctcctcgcc 240 ccggtggccc cggtcaccgt cgtgcccggc ggcgccgaac gccaggaatc ggtcgccgcg 300 gcactcgcgg tcgttccgcc ggacgttccg atcgttctgg tccacgacgc ggctcgatgc 360 ctcaccccgc cctcggttac ggagcgtgtc gccgccgctg tccgggacgg tgccgacgcg 420 gtgatcccgg tcctgccggt cgtcgacacg atcaaagagg tcgcggccga tgccaccgtt 480 ctcggcacgg tcgaccgttc cgtgctgcgt gcggtacaga ctccgcaagg cttccgcgcc 540 tcggtgctgc gcgccgctca ccgggccgcc gccgactcac acaccgacga cgccggtgcc 600 gtcgagaagc tcggcatccc ggtcctgtgc gtcccgggct ccgacctcgc gctcaagatc 660 acccggccga tcgatctggc gctcgccacg cacctcctgg ccctgccgga cccggacgcc 720 cctaccgcct ga 732 <210> 30 <211> 585 <212> DNA <213> Artificial Sequence <220> <223> >idi (ACSP50_0146) <400> 30 atgagcagca tcggtcacct caaccgtgaa gatcatctcg tcgagctcgt caacgaggag 60 gggcagccgc tcgggtcggc caccgtctcc gacgcccacc tctcgccggg tgcgctgcac 120 cgggccttct cggtcttcct caccgacgat gagggccggg tgctgctcca gcagcgggcc 180 gcggccaaaa cccgcttccc gctccgctgg ggcaacacct gctgcggcca ccccgcgccc 240 ggcgagccgg tcacggtcgc cgcggcgcgg cgtctcaccg aggaattggc ggtacgtgac 300 gtcacgctga ccgagatcgg cgtgtacacc taccgcgcga ccgacccggt caccggccgg 360 gtggagcacg aatacgacca cgtgctgatc ggcgccctgc cggacggcgt cgtgccacac 420 cccgatccgg cggagatcgc cacgctgcgc tgggcctcgc tgcccgggct gcgcaccggg 480 ttgacggagt cccccgagct gtacgcgccc tggctccccg gggtgttcga gattctcacg 540 gagcggtcgg gtgtcctttc cacggagcgg tcgggtggcc ggtga 585 <210> 31 <211> 1071 <212> DNA <213> Artificial Sequence <220> <223> >crtE ldsA (ACSP50_0148) <400> 31 gtggccaatg acaccctcga gggaaatcgc cttgccgcga taccccggca gtccgtctct 60 cacactgggc tggtcggtgc agtcgagggg acgctcgccg acttcctcgc ctcccagatc 120 gcctctctcg acgccgtcga cccatcgctc ggtggcttcg gccgcaccgc ccgtgacctg 180 gtgatggccg gcggcaaacg gctgcggccg acgttcgcgt actggggctg gcgcggcgtc 240 gccgggccgg ccgcggacgc cgagacgctg ctgcccgcgc tcggcgcgct ggagctgatg 300 cacaccttcg cgctcgtcca cgacgacgtg atggacgact cgtccacccg ccgcggccgg 360 cccaccgccc accggatctt cgcggcccag cacggcggcc ggttcggcac gtcggccgcg 420 atcctggtcg gcgacctctg cctggtctgg gccgaccagc tgttggcccg caccccggtg 480 ccggcggcca ccctgcttgc agtccgcgcg cattacgacc ggatgcggat cgaggcggtc 540 gccgggcagt atctggacgt cctcggtgag accgatccgg cgtcctggtc ggtggagcgc 600 gcactgctgg tcgcccggca caagaccgcc agctacaccg tgcagcggcc gctcgacttc 660 ggcctggccc tggccggggt cgaggacgtg gaggtcgccg aggcgtaccg gacctacggc 720 atcgccgtcg gcgaggcctt ccagctgcgc gacgacctgc tcggtgtcta cggcgacccg 780 gcggtgaccg gcaaaccggt cagcgacgac ctgcgcaccg gcaaaccgac cgcactgctg 840 atgctggccc gtcggatggc cacccccggc cagctggccg agctggagtc ggcggagatc 900 gagcgcaagg cgcaggtcgt cgccgagacc ggcgccccgg cccgggtcga ggagatgatc 960 cgtgcccggg tcaccgaagg actgaccgcg ctggcctcgg cgccgatcga cgccgaggcc 1020 cgtgccaccc tgatcgagct ggccaccgtg gcgacgcagc gcccggcatg a 1071 <210> 32 <211> 888 <212> DNA <213> Artificial Sequence <220> <223> >crtB (ACSP50_0149) <400> 32 atggaaaccg atctggccgc cgcctatgag cggtgccgtg agctacaccg agagcacgga 60 cgcacgtact acctggcgac ccggttacta ccggcctgga agcgccggca tgtgcacgct 120 ctgtatggat tcacccggtt cgccgacgag atcgtcgacc gcaccgaggc gcaaccaccc 180 gccgagcgcg ccgccgagct ggccacctgg tccgccggat tcctcgccgg actgcgcggc 240 gagccggtcg acgacccgct gctcccggcc gtgctgcaca ccatcgcggt cttcgggctc 300 gacctggagg acttcgcgaa gttcctgcgc agcatggaga tggacctcac cgtcaccggc 360 taccgcacct acgacgacct gctcgactac atggagggct cggccgccgt gatcggcacc 420 atgatgctgc cgatcctggg ctccaccgac ccggccgccg cccgcgaacc ggcccgccag 480 ctcggcttcg ccttccagct caccaacttc atccgggacg tcgccgagga cctcgcgcgg 540 gaccggatct acctgcccga ggagcacctc gccgagttcg gtgtgacccg cgccgacctg 600 gccgccggcg tcgccacccc ggcgatccgc gcgctcatcc gggccgaggt ggaccgcgcc 660 cgtgagcact acgcggccgc cgcccccggc atcccgctgc tcgaacgcac ctcgcaggcc 720 tgcatgcgga ccgccttcca gctgtacggc gggatcctgg acgagatcga ggcggccgac 780 tacgacgtgt tcgcccggcg ggtcacggtg ccgaaccggc gccgggccgc ggtcgccgtc 840 cgcagcctgc tcacccggcc cggcaccccg gtcgaactgg cggcctga 888 <210> 33 <211> 1311 <212> DNA <213> Artificial Sequence <220> <223> >ACSP50_0150 <400> 33 atgggcgccc gcgtcgcgct gttcacccgc gacctgcgga tccacgacaa cccgctgctc 60 agcgggcccg acccggtggt gccgctgttc gtcctcgacc cacggctgag cggcctctcg 120 gccaaccgca gccgctttct ccaccagagc ctggccgacc tgcggaacag tctccgcgag 180 cgtggcgccg acctggtgat ccgggagggc gacccggtgg ccgagaccat cgcggtcgcc 240 tccgaggtgg acgcgtcgac gatcacggtg gccgccgacg tgaccggtta cgcccagcgg 300 cgcgagcggc ggctgcggga cgagcgattc cgggtgaaga cggtgccgag cgtcacggtg 360 ctgccgcccg gtacggtccg gccgggcggg ggaggcgagt cgtaccgcgt gttcacgccg 420 tacttcaaag cctgggagaa agctgggtgg cgcgcaccct ccgcaacgcc ggggaaggtc 480 gcgatgccgg ccggcatcgc gccgggaagg ctccccgaga tgcccgccgg cgactcaccg 540 gacgccgtcg ccggtggcga gaccgagggc cgccgccggc tccaggcctg gcagaaagaa 600 atggcgcggt acgccgagga ccacgacgac atggccgccg acaacaccag ccggctcagc 660 gcctacctcc ggttcggctg cctgtcgccg ctcgaactgg cgctggccgc gaaagccgac 720 gactctcccg gcgcccaggc ctacctgcgg caactgtgct ggcgggactt ctactaccag 780 gtcaccgcga ccttcccgga gatctccacc cggccgctgc gggagaaggc ggaccagaac 840 tggcgatacg acgacgacgc gctgcgtcac tggcaggacg gcctgaccgg ggtgccgatc 900 gtcgacgccg gcatgcgcca gctccgcgcg gagggctgga tgcacaaccg ggcccggctg 960 atcaccgccg cgttcctcac caaacacctg ggcatcgact ggcggcccgg gctgcaatgg 1020 ttcttccgct ggctgctcga cggcgacgtg ccgaacaact ccggcaactg gcagtggacc 1080 gccggcaccg gcaacgacac ccggccctat cgcaggttca atcccattcg ccaagcgcag 1140 cgattcgatg cgcagggcgt gtacgttcgg cgctacgtac cggagttgaa agacatcgac 1200 ggtgtcacgg tgcatcagcc gtggcgactg ccggaatcgg tacgccgcgg gctcgactat 1260 cccggaccgt tggagtcaca tcgggacgag gcggtctggc tgcgcgactg a 1311 <210> 34 <211> 1362 <212> DNA <213> Artificial Sequence <220> <223> >ACSP50_0151 <400> 34 atgtctgaag cgcggcaagt ggacgtggtg gtcgtcgggc tcggtgtcgg cggcgaggag 60 gtcgccggtc gcctggccgc ggccggcctg agcgtgatcg gcgtcgaaca ccgactggtc 120 ggtggcgaat gcccgtactg gggatgcatc cccaccaaga tcatggtccg cgccgggaac 180 gcgctggccg aggcccgccg gatccccggc ctcgccggga cgtccacggt gcgggccgac 240 tgggcgccgg tcgccaaacg gatccgcgac gaggccaccg acgactggaa cgacaaggtc 300 gccgtcgagc ggttcaccgg taagggcgga acgttcgtcc ggggcacggc cgaactgacc 360 ggtcccggtc aggtccgggt cggggaccag gaattcgccg cttcgcgcgg cgtggtcatc 420 gccaccggca ccgccgctgt ggtcccaccc atcgagggcc tgtccggtac gccgttctgg 480 acgaaccgtg aggccgtgga agcggcggcc ctgcccgcat cgatgctggt gctcggcggc 540 ggggcgatcg ggtgcgagct ggcccaggcg tacgcccggt tcggcgtgca ggtgacggtc 600 atcgagggct caccccgggt gctggccatg gaggaaccgg agtcgtccga ggtggcggcc 660 gccgccctga ccgccgacgg ggtccggatc gtcaccgggg tgcgcgcgca gaaggtcgcc 720 cacgacgacg ggttccacgt gaccctctcc gacggcagcg tgctggccgg cgagaagctg 780 ctggtcgcga ccgggcgggc ggcccggctc ggcgggctcg ggctggaccg ggtggggctg 840 gacccgtcgg ctcgattcct ggccaccgat gaccggctgc gcgccggcga gggcatctgg 900 gcggtggggg acgtgaccgg gaacggggcg ttcacccaca tggcgatgta cgaggcggac 960 atcgcggtgc gggacatcct ggggcagggc ggcccgggag ccgactaccg ggcgcggccg 1020 cgggtgacct tcctcgaccc ggagatcggg gcggtgggga tgaccgagca gcaggcccgg 1080 gacgccggcc tcgaggtgcg ggtggggtac gtgccgctga accagacctc gcgagggttc 1140 atccacgggc cggggaacga gggattcctc aaacttgtcg cggacgggga gcggggagtg 1200 ctggtcggcg ggacgaccgc cgggcagtcc ggtggcgaga tgatcggggc ggtggcggtg 1260 gcggtgcacg ccgaggtgcc ggtgtcgacg ttgctcagcc agatctgggc gtacccgacg 1320 tttcatcggg ggctggggca ggcgcttcag tcgctggcct ga 1362 <210> 35 <211> 351 <212> DNA <213> Artificial Sequence <220> <223> >ACSP50_1631 <400> 35 gtgagcgaac ccgtcatcac cgaaccggct gcctggatca acctgcccga cctgtccgag 60 aggctggacg tgtcgatcag caaggtgcac cagatgatca gagacggcga cctgctcgcg 120 gtccgccgcg acggcatccg cgtggtgccc gccgaactgg tggccaacgc caccgtcctc 180 aagcatctgc ccggtgtgct gaacgtgctc cgcgacgccg ggtacaacga cgaagaggcc 240 ttccggtggc tctacgccga ggacgccgag gtcggcggca gcgccgcgat cgcgctcggc 300 ggtcagcagg cgcgcgagat caagcgccgc gcgcaggccc tcggcttctg a 351 <210> 36 <211> 327 <212> DNA <213> Artificial Sequence <220> <223> >ACSP50_1632 <400> 36 atgaggcatt tgtcgtacgt cgcggtgctg gccggatgcc tggccggggc gctgtggctg 60 gaaccgatcc tgcgggtcaa cgtgctgcgc cggtggcgtc ggctgctgct ggccgtgctg 120 ccgatggcgg tcgtcttcac cctgtgggac ctggcggcga tcgcggccgg ccactggcac 180 ttcgacccgg cccagatcac cggcgtctac ctcggcggcg ggctgcccct cgacgaggtg 240 ctgttcttcc tggtggtgcc ggtctgcgcg atcctcggct tcgaggccgt gcgggccgtg 300 ctgcgacgtc cggcggggga cgagtga 327 <210> 37 <211> 336 <212> DNA <213> Artificial Sequence <220> <223> >ACSP50_1633 <400> 37 gtgacctaca ccaccgctgc ggtgctcggc gtgctggccg ccctcacgct cgacgtgctg 60 atcctgcgga cccggctcgt cgggcgactg gtgttctggg ccacgtaccc catcatcttc 120 gtctttcagt tgatctcgaa cggcattctg accgggcgcg acatcgtgat gtacgacccg 180 gccgcgatcc tcggcccgcg gctcgtccac gccccggtcg aggacctgct gttcggtttc 240 gccctggtgc tcggcacgct gtcgctgtgg gtggcgctgg gccggcgcgg catccagcgc 300 accccgcgag ccgggtctag acggaccgac gagtag 336 <210> 38 <211> 1071 <212> DNA <213> Artificial Sequence <220> <223> >crtE fps2(ACSP50_1634) <400> 38 gtgacgaact ccccgctcga cgaggccggt ctgcggtcgc gtgtcgacaa ggcgctgacc 60 gtgttcctgg ccgggcagcg tgaccggctg ctggcgatcg acccggcgct ggccgagatg 120 tccgccacgg tctccgagtt cgtgctgggc ggcgggaagc ggctgcggcc ggcattcgcc 180 tactggggtt tccgcggggc cggcggcgcc gactcggacg ccgtggtggc ggccgtcgcc 240 gcgctggagc tggtgcaggc cagcgcgctg atccacgacg atctgatgga ccgctcggac 300 acccggcgcg gggtgccgtc ggtgcaccgt cggttcgaga aactgcacgc cggcgagggc 360 tggcggggca gcgcggccgg gttcggcgac tgcgccgcgg tgctgctcgg cgacctggcc 420 ctggtctggt cggacgagct gctgcacacc tcggggatgg cggtggccga cgtgcaacgg 480 gcccgcccga tcttcgacgg gatgcgcacc gaggtgaccg tcgggcagta cctggacgtg 540 ctcacccagg cgaccggcga cacgtcgctg gagcgggccg gcaaggtggc cgtctacaag 600 gccgcgaaat acaccgtgga gcgtccgctg ctgctgggcg cggcgctggc cggagcggcc 660 cccggggtgc acgcggcgta ctcggcgttc ggcctgccgc tgggcgaggc gttccagctg 720 cgcgacgacg tgctgggcgt gttcggcgac ccggagcgga ccggcaagcc ggccggcgac 780 gacctgcgcg agggcaagcg cacctatctg gtcgcggccg ccttcggcgc gctggacgcg 840 gccgggcggg ccgaactgga cgccgcgctc ggcgaccccg gcctggacga ggccggggtg 900 gcccggctgc gcacggtcat ccgggacagc ggtgcgctgg ccgcgaccga ggcccggatc 960 gacgagctga tgaccgcgtc gatcggcgcg ctggacgcgg caccgatcga tcaggacgcc 1020 cgggaggtgc tgcgccggct ggccgacgcg gctactcgtc ggtccgtcta g 1071 <210> 39 <211> 924 <212> DNA <213> Artificial Sequence <220> <223> >ACSP50_1635 <400> 39 gtgtctctcg gacttccctc ccggctgccc ggcaccccgt cgatcggcga cctggtccgc 60 ggcgcggcgc cgacgttctc cttcgagttc ttcccgccga agacaccgga cggggagcgg 120 ctgctctggc aggccatccg ggagctggag tcgctgcggc ccagcttcgt ctcgatcacc 180 tacggggccg gcggcaccac ccgggagacc acggtcgcgg tcaccgagcg ggtcgccacc 240 gagaccacgc tgctgccgct ggcccacctc accgcggtcg accactcagt ggccgacctg 300 cgcaacgtga tcggccggct ggccggcgcc gggatccgca acgtgctggc gctgcgcggc 360 gacccgccgg gcgacccgat gggcgagtgg gtccggcacc cggacggcgt cggttacgcc 420 gacgagctgg tccggctgat ccgcgagtcc ggcgacttca gcgtcggggt ggccgccttc 480 ccgcacaaac acccccggtc ggccggcgtc aaggacgaca cccgcaactt cgtccgcaag 540 tgccgggccg gtgccgacta cgcgatcacc cagatgttct tcgacgccga cgaatatctg 600 cggctgcgcg accgggtggt ggccgccggc tgtcacaccc cgatcgtggc cggcgtgatg 660 ccggtgaccc ggatggccac catcgcgcgc tccacccagc tctccggcgc gcccttcccg 720 ccggcgctgc tgcgcgactt cgagcgggtc gccggcgacg acgcggcggt gcgcgagctg 780 ggcatcgaga cgtgcgcggc gatgtgcgcc cggttgctgc gggagggtgt gccgggcatc 840 cacttcatca ccatgaaccg gtccaccgcc acccgcgagg tctggcagcg gctggccccc 900 gcggaagtcg ccgcgtcggc gtga 924 <210> 40 <211> 933 <212> DNA <213> Artificial Sequence <220> <223> >ACSP50_1650 <400> 40 gtgcagctgc aacaactccg gtacttcctg gcggtggtgg agacccggca tttcacccaa 60 gcagcggaca ttctgggcgt ctcgcaacct accttgagta agcagattca cacccttgag 120 atgtcactcg gagccccgct gttcgagcgg atgcgcggtg cggtgaccct gaccgtcgcc 180 ggcgagacat tgctgccgat ggcccagcgg atcgtcgccg acgccgacgc ggcccgcgac 240 gccgtgcagg acatcgtcgg tctgcgccgc ggcgaggtgc gcctgggtgc caccccgagc 300 ctgtgctcct cgctggtccc ggccgtgttg cgcaccttcc gcgccgacca cccgggggtc 360 aagctgcaca tcagtgaggg cagctcgcac gacctgaccg ccggcctgct ggcgcacacc 420 ctggatctgg ccctgatcgt gcagcccgag cacggcgtcg atccggccct ggtggccatc 480 gagctgctgc gcgagagcct ggtggtggcc tcggtcgcgg ccggcccgcc gcccaccgtg 540 ggccgccaac tggagctctc cgagctgcgc cacaccccga tggtgatgtt ccgcgagggc 600 tacgacatcc gtgaggtcac cctgcacgcc tgcgagcggg ccggcttcgc gccgaagttc 660 gcggtcgagg gtggtgagat ggacgcggtg ctcgccttcg tcgaggccgg cctcggggtc 720 gccctggtgc ccagcatggt gctcgccaac cggccgctgc tgcgggccac cccgctcgcg 780 ccgccgggga tgcgccggac catcgcgctc gcccagcgcc gtgccgcggt gctgccgcat 840 gccgcggccg cgctgcgtga ggtggtgctc gaccacatcg gctcgggccg gctgccgttc 900 ggcgtgcgcg ccctggagag accgtccact tag 933 <210> 41 <211> 750 <212> DNA <213> Artificial Sequence <220> <223> >ACSP50_1651 <400> 41 atgggcgagt tccacgaccc gcgactcgtc gaggtctacg acgccgaatg tccctggggc 60 tgggacgacg acttcttcat ggccgtgctc gccgaacgct ccgcgcaccg ggtcgccgac 120 ctggggtgcg gcaccggccg gctggccatc gcgatggccg cggccgggca cgaggtgatc 180 gcgatcgacc cggcgccggc cgccctggcc gcggcccgcc gcaagccggg cggcacccgg 240 gtgcgctggc tgcagggctc ggccgagcgg ctcgccccgc gctcgctcga cgccgcgttc 300 atgaccggtc acgtcgccca gtccttcgtc gacgacgagg aatgggacac cgtgctccgc 360 gggctgcgcc gggcgctggt cccggaggga cggctggtct tcgacagccg ggacccggac 420 gaccggccgt ggcagcagtg gaacccgcag gattcgtggc gcaccgtggt gctcgacgac 480 gggagggtgg tggaggcgtg gagcgaggcc gagcaggtcg ggctgaacac cgtgcgcgtc 540 accgggcgct accggttcgc cgacggaggg gaactggcga actcggcgac cctgcgtttc 600 cggaccgagc cggagctgcg cgactcactg cgcgaggcgg gcttccgggt cgagcggatc 660 tacggcggct gggggcgcga gccggtgggt ctgagcggcg acggcgagtt catcgtgatc 720 gcggtcgcga cgccccggct gatgtcctga 750 <210> 42 <211> 1722 <212> DNA <213> Artificial Sequence <220> <223> >ACSP50_1652 <400> 42 atgcccgaga acgagtggcc cgacgacccc cgcccgcccg accagggcga gtggagccag 60 ccgcatcacg agccgccacc cggccgtggc cgcgccctgc tggccgccgc ggtggtggtg 120 ctggtcctgc tggccgccgg cggcatcgcc tggcgtctga tgagcagccg cggcgctacg 180 ccggtggcgc agcccaccgc gcccgccccg acgcccaccg cgcagaccgc gccaccctgc 240 ccacagccgc gcctgcgggt cgccgccgcg ccggagatcg ccccggtgat ccagcaggcc 300 gccgccgcac tcagccagcc cggccagcgc tgctccgagg tgctggtgca ggccgccgag 360 ccgggcgccg cgctgaccgg caagccggac gtctgggtgc cgtccagcag cgtgtggctg 420 gccctggcca aaagccgcgg cgacgtctac accacgcagg gcgcgtcgct ggcctggtcg 480 ccgctggtga tcgccgggcc ggagtcgatc gccagcctgt tcgcgccgaa cggggtcacc 540 tcctggtccg gcctggtcca gggcaccatc cagaaacggg tgccggcggt ccggatgccc 600 gatccgacgc tgaccacgac cggactgctc agcgtctacg cggtgggcca ggccacggtc 660 aaggccaacc cggacgccgg gatcgcccag ttgcaggcgc tcaccctgcg cagccggctg 720 gagaacgcgg ccgccgaccc ggcggaactg ttcgcgcaga tgggcaagca gaccgacgcg 780 gccacggcga tctaccaggt cggggtcttc ccgaccaccg agcagcagct gctgacctat 840 cagaagagtc agcacgacgt ccggctgtcc ggctcggcgc ccgccgacgg ccagatcgac 900 gccgactatc cgtacgcggt ccgcaagggc gccccggccg acctggtcga gagccttcgc 960 gaggcgatca ccccggacgc gctgacgacg gccggattcc gggccaccgc gaccaagaac 1020 gcgctgcgcc tgccggcccc ggccgtgctc gccggggcgg cccggcagtg gtcggcgtac 1080 aagtcggtgg ccttccaggt gctgctgctg atcgacgcgt ccggctcgat gaacgagaag 1140 atcaccgacc gggccggccg cagcgtcacc aaggccgcgc tgctgcgcga gtccgggacc 1200 agcgcggccc agctcttcgg tgacgacacc agcctcggcc tgtggttctt cggcaccccg 1260 acggcggaca gcccggcgca caccgaggag gtgccgttcg gcccggtcat cgccaccgtc 1320 gacggcaaga gccgccgtga cctgctggcc gccaagatcg gcgagtaccg gccggtggcg 1380 aacgccggga ccccgctcta ccagagcgtg ctggacggcg tcgccgagat gcgcggccgg 1440 gccaagccgg acacggcgac cgtggtggtg gtcctcaccg acggctcgga cggcggcacg 1500 aagtaccgga tgtccaacgc ggacttcctg aagaagctga ccgccggtgc cgaccccgcc 1560 aagccggtgc cggtgatcgc cgtcggttac ggcccggccg cgaacgccac cgccctgcag 1620 gccatggcca aggccaccgg tggccaggcg gtcaccgtca agaacccggc cgacctggcc 1680 gccggcatcg cccaggcctt cctcgccgca cacacccact ag 1722 <210> 43 <211> 1437 <212> DNA <213> Artificial Sequence <220> <223> >crtD (ACSP50_1653) <400> 43 atgagcgaca tcgtggtggt cggggctggg gtcggcgggc tggccgcggc gatccggctg 60 gccgaggcgg ggcatcgggt cagcatccat gagcggtccg gcgtggtcgg cggcaagctg 120 gcggcatacg agagggacgg ctaccggttc gacaccggcc ccagcctgct caccctgccg 180 gacgtgttca ccggcctcgg tctggacctg cgcccggagc cgctggaccc ggtggtgcgg 240 cacttcttcc cggacggcac ggtgctggac tcgtcgtcgg accacgagac cttcctggcc 300 cggatcaccg acgcgctggg cggtgccgcg gcgcgcgact gggaccggtt ctggcgccgt 360 gccgagcgga tctggcacgc ctcctgggag tcggtgctgc gccgcccggt gaccgcggcg 420 tcgctggccc ggctgtcctg gcggctcggt gacctggccg cgatcgctcc cggccggtca 480 ctgcggtcgc tgggccgccg ctatctgcgc gacccgcggc tgcggatgct gctggaccgc 540 tatgcgacgt attcgggcgc ggatccgcgg cgggcgccgg cggcgctggc cgcgatcccc 600 tacgccgagc tggcgttcgg cgggtggtat ctgccgggtg ggctggtcac cctcgcggag 660 gcgctgctcg cccgatgcga gaaactgggc gtacgggtgc atctgcactc accggtcgcc 720 tcgatcgcca cgaccggcgc ccgggtgtcc ggggtccggc tgggggacgg gacccgcctc 780 gcggcggacg tcgtcgtctc caacgtggac gccgtcacgc tctaccggga tctgctgccc 840 agtccgaaac cgctggcccg cctcgccgac cggagcctgg ccggattcgt gctgctgctc 900 gcggtgcggg gcgagactcc gcggctggcg caccacaacg tgttcttccc gcgggactac 960 gacgccgagt tcgacgcggt cttcgggggg ccggggcggc gggcgcggcc ggccggcgac 1020 ccgaccgtct tcgtcacccg ggccgcggat ccggcggtgc gcccggccgg cgacgaggcg 1080 tggttcgtgc tggtcaacgc ggcgccacac ggcacctcgt ggtccaccgt ggactggctg 1140 cgggcggggc tggccgacgc gtaccgggat cgggtcctcg aggtcctggc ggggcgcggt 1200 ctcgacgtac gcgatcggct gatcttcgcc gagacccgga ccccggcgga tctggcggcg 1260 tcggccgcag cgccgggcgg agcgatctac ggcaccgccg gcggcctggt ccggccggcg 1320 aaccgcgcgc cggtcgacgg gttgttcctg gtcggcggct cgacgcatcc cggcggcggg 1380 ctgccgatgg tcaccctctc cgccgagatc gtcgcgggca tgatcggatc gaactga 1437 <210> 44 <211> 1080 <212> DNA <213> Artificial Sequence <220> <223> >cruC (ACSP50_1654) <400> 44 atgatcgtcg cctggctgat cctgccgccg ctgctgctga tcaccgcaca caccgccgtc 60 aacgcgctgc tgctgcgccg cccgcgccgg gcggcgacca gcaccgaacg ggtcgccgtc 120 ctgctcccgc tgcgcgacga ggccacccgg gtcaccccgt gcctgcgcgc cctgctcgcc 180 cagcgcggcg tcgccgatct caccgtgcac gtgctcgacg acggctccac cgacggcacc 240 gcggacgtgg tccgggcggt cgccggcgac cgggtccggc tgcacaccgg cactccgccg 300 ccgcccggct ggctcggcaa accggccgcc tgccaacggc tcgccgacct ggccggggac 360 gtggacgtgc tggtcttcgt cgacgccgac gtggtgctcg cgccggacgc ggtggccggg 420 gccgtcgatc tgctgcgccg ggccggagcg gacctgctca gcccgtaccc gaagatcgtc 480 ggtgccggcc ggctggtcca gccgctgctg cagtggtcct ggctgagttt cctgccactg 540 cgcgcgatgg aacgctcggc gcggccgtcg ctggccgccg ccggtggcca gtggctggtg 600 ctggaccggg ccggttaccg gcgagccggt ggccacgccg cggtgcgcgg cgagatcctg 660 gaggacatcg cgctggcccg cgcggtcaaa cgggccggcg ggcggatcgc cctggccgac 720 ggttccggcc tggccacctg ccggatgtac gagtcctggg acgagctcgc cgacggatac 780 gccaaatcgc tgtgggcgtc attggggtcc gcggccggcg cgaccgccgt cacgctcctg 840 ctgattctgc tgtacgtggt gccacccctg ctggcgccct tcgccccgct tccggcggtg 900 ctcggctacc tgctcggcgt gaccggccgg atgatcgccg ccagggccac cggcggccgc 960 gtcctgcccg gcacgctggc ccatccggtc tccatcgtcc tgttcggcta cctgatcgcc 1020 cgctccttcc ggctgcgccg ggccggccgc ctggcctggc gcggccgccc ggtgccctga 1080 <210> 45 <211> 756 <212> DNA <213> Artificial Sequence <220> <223> >cruF (ACSP50_1655) <400> 45 gtgtctcccc gtcatctgcc ctggggcctg ctcggggcgc tcgtgctcgc ccagatctgc 60 tatccgctca ccgagggtga cacccgggcc gggctgaccg tgctcaccgt gctgctcggc 120 gtcgcgttct cgctgagcca cgcgctgctc acccggggcc cccgggcgct cacggcgctg 180 ctgtcgaccg ccaccctggg cgggttcgcg gtggaggcga tcggggtggc caccggtttc 240 ccgttcggtt cctacgagta ctccgggcgt ctcggtccgc gcctgctcgg cgtaccgctg 300 atcatcccgc tggcctggac ctggatggcc tggccggcct ggctcgccgc gctgcgggtg 360 acccggcggc ggctcccccg gatcctggtc gccggggccg gcctggccgc ctgggacgtc 420 ttcctcgacc cgcagatggt cgccgaggac tactggcggt ggcggcaccc ggtgcccgcg 480 ctgcccggcg tgcccggtgt gccgctcggc aactacctgg gctggctcgg cttcgcgctg 540 ctgctgatga ccgcgctggc cgccgtcgcc ggccgggccg ccgaccggcc gctgtccgcc 600 gaccggccgg cgctcgccct gtggatctgg acgtacgcct cgtcggtgct cgcccacgcc 660 gtcttcctgt cgctgccggc gtccgcggcg tggggcgcgc tgatcatggg cgccgcggtc 720 ctcccgctgc tcgcccggct gcgcgcaccc gcatga 756 <210> 46 <211> 579 <212> DNA <213> Artificial Sequence <220> <223> >ACSP50_1656 <400> 46 atgaggcttg tggcgtggca gccggacgac ctgctgcggc ggctcgacga cgtggtcggg 60 gtctacggcg aggcgatggg ctaccgccag gagctgctgc agacccgccg gggatacatc 120 gggtcgcacg tgcgccggcc cgggttccgg gcggtggcca cgctgaccac cgagggccgg 180 ctgatgggct tcggatacgg ctacacctcc gccgccggcc agtggtggca cgaccaggtc 240 cggttcgctc tcggcgagga cgaccgccgg cagtggctga ccgactgctt cgaggtggtc 300 gagctgcacg tgcgcccggc cgcgcagggc cacggggtgg gcgcccggca gctgcgcgcg 360 ctgctggcca tggccaaagg ccgcaccgtg ctgctgtcca ctccggaggc cgacgagcag 420 gcgtcccgcg cctggcggct gtaccggcgg tacggcttcg ccgacgtgct gcggcacttc 480 tacttcccgg gtgacgagcg ggccttcgcg gtcctcggcc gcgagctgcc gctggccgag 540 cgtccgctcg aggacgcacc gggcatcgcc ggcgcctga 579 <210> 47 <211> 675 <212> DNA <213> Artificial Sequence <220> <223> >ACSP50_1657 <400> 47 atgacgcacg tcgccctgca cgtctggcgg gtgccgcgca gcgccgtcgg ctcggccatg 60 ctgcgcatgg ccttcgcgcg gcgccatctg gccggtctgc ggttcggcaa gttcctcggc 120 accggcaccg gcaccggctt cggtcccggc gacaccgatc tcacccggtg ggcggcgatc 180 acggtcagtg atgcgccggt acgtttcccc gtctgggagc ggatcgccgt caacggcgcc 240 cggatcgatc tggagccact gatcagccgg ggcacctggg ccggccgtac cccgttcgag 300 cccaccggcc gccgcccgga cggtccggtg ctcgcgctca cccgggcccg gctgcggccg 360 gctcgcgcgc tgaccttctg gcgggcggtc ccggcggtgg tgcgcgaggt gcaccgggcg 420 cccgggctgc tcgcccggtt cggcgtcggc gaggcgccga tcggctggca gggcaccgtc 480 accgtgtggc gggacgcggc ggatctcgtc gcgttcgcgt accgtcagcc ggagcatcgc 540 gcggcgatcg cccggacccc ggccgaccgc tggtacgccg aggagttgtt cgcccggttc 600 gcggtgctcg ggatcagcgg tgaccggtcc gtgctgggct ggaccgccga cgaaggggaa 660 cgggcggaag catga 675 <210> 48 <211> 816 <212> DNA <213> Artificial Sequence <220> <223> >ACSP50_1658 <400> 48 atgacacaga ccatcgtgat caccggggcc agctccgggg tcgggctggc cgccgccgag 60 cagctcgccg cccgcggtga cgaggtggtg ctggtcggcc gcgacccggg ccggctcgac 120 gcggccgtgc agcgggtccg ggaggccggc ggcggccgcg cgccccggca cttccgggcc 180 gacttcgaac ggctcgacga cgtgcgggag ctcgccgccg ggctgctggc cgagctgccc 240 cggatcgacg tgctggccaa caacgccggc gggatcatca agcggccccg gcagacggtg 300 gacggccacg aggccaccat ccagggcaac cacctggccc cgttcctgct cacccacctg 360 ctgcgggagc ggctgaccgg gggccgggtg gtgaacaccg cctcggcggc acacgtgcag 420 ggccggcccg gcacccggtt caccgacgac ccgaagtcgt acagtccgtg gcgctcctac 480 ggggcgagca aggcggccaa catcctgttc gccgccgagg ccgcccgccg ctggccggac 540 gtgtgcagcg tctcgttcca ccccggtgtg gtgcgcacca acttcgggga gggccggctg 600 atccggctgt tctaccggta cgcgcccggc ctggtcaccc cggaggccgc cggcgagctg 660 ctgacctggc tgtgcaccac cccggccggg gagctggaga acggcgccta ctacgtcaag 720 cgtcaggtga cccggccggc cgcgcacgcc cgcgacccgc ggctggccgc cgagttgtgg 780 gacgccagcc tgaccgcgac cggcctcgcc ggatga 816 <210> 49 <211> 1020 <212> DNA <213> Artificial Sequence <220> <223> >crtE (ACSP50_3873) <400> 49 gtgatcgacg acttcctcag cgcgcaacgc gacgtgctgg ccgaggtcag cgacgactgc 60 gcgccgctgg aacgctacgt ggccgacctg atgggcggcg gcaaacgact ccggccggcg 120 ttctgctact gggcgtggcg ggcggccggc gcccccgacg gcccgggcat cgtggcggcc 180 gcgacatccc tggagttcct gcaggccgcc gcgctgatcc acgacgacat catggacgat 240 tcggacaccc gtcgcggcgc cccggcggtg caccgcagac tggcggccct gcactccggc 300 ggccgctggg ccggggacgc cgaccacttc gggctgtccg ccgccgtgct cgccggcgac 360 ctgtgcctga cctggagcga cgcgttgtat tcgggcagcg gcctgcaccc gtccgcgctg 420 gcccggggcc ggccggtctt cgaccggatg cgcacccagc tgatgggcgg ccagtatctg 480 gacctgctgg accaggcgcg gccgtcccgg ggcggcgtcg accgggcgcg ccgggtggtg 540 cacttcaaga gcgccaagta caccgtcgaa catccgctgc tgctcggcgc ccggctcgcc 600 ggcgcggacg acgatctgct cgcccggttg tccgcgttcg gtctgccgct gggcgaggcg 660 ttccagctgc gcgacgacct gctcggggtc ttcggcgacg cggcgcagac cggcaaaccc 720 accggcgacg acctgcgcga gggaaagcgc accacgctgg tcatcctggc cgcggaccgc 780 gccaccgcac cccagcaggc cgccctcacc gcgctgctcg gcgatcgcgg cctgaccggg 840 gccggcgtcg acaccctccg gcagatcatc gtggacaccg gtgcccgggc cgaggtcgag 900 cggatgatcg agcaactgct ggcgacgagt ctcggcgtgc tcagcggcac gcccgtcgac 960 gaggcggccc gctcggtgct gctcgccctc gccgaggcgg cgaccgcccg cagctcctga 1020 <210> 50 <211> 1029 <212> DNA <213> Artificial Sequence <220> <223> >ACSP50_1950 <400> 50 atggtgagca cagtgatcgc ctcggggccc accggcctgg gcacctccgc ggcccgtctc 60 ttcggtcggg tggaccggga cgagccggag ctcttctgcc cggcgccgct gcgcgacgac 120 cgggcgctgg gggagcgggt caacgacgcc gtggtccagt gggccgagaa ggccggcatc 180 taccccggcc ggctggacaa gctgcgcggg gcgaacttcg gccgcttcat gatgctcgcc 240 cacccggcca ccagcgatcc cgaccggctg ctcgccgcga cgaagtgtct ggtcgccgag 300 tgggcggcgg acgactacta cgtcgacgag gtgtccctgg gcgcggatcc gatggtggtc 360 ggctcgcggc tggccaacct ctactcggtg gtcgacccgg cctcgctgac cccgcgctat 420 caggccgact tcgagaagca tcaccgcctg cagccgatct cggtggcgtt ccgcaccgcg 480 atggaacacc tggccgagta cgcctcggtc acccaactgg cccggttcca gcaccagatg 540 gcgatcctgt tcgtcgcctg gtcgcaggag gccgactggc acgccaaccg gcgcaccccg 600 ccggtctggg agtatctggt gcagcggcac ctgaacagct atctgccgcc gatgatcctg 660 gtcgacgtgc tggccgggta cgagctgtcg ccggccgagt tcttcgatcc gcgggtccgc 720 gcggcgttca ccaccgcagg caacgccgcc gtgctggtca acgacctcta ctcgggcagg 780 aacgagtccg agaccgatca caacctgccg accgtgctgg tgtccgggga gcggctcacg 840 ccgcgggccg cggtccggcg caccgtggag atccacaacg agttgatgca caccttcgtg 900 acctcggccg cgtcgttgag cgcgtccggc tcgccgcagc tgcgccggtt tctcgcggac 960 acctgggcct ggctgggcgg aagtcgcgag tggcacgcca cgagcggccg ctaccactca 1020 tccaactga 1029 <210> 51 <211> 1344 <212> DNA <213> Artificial Sequence <220> <223> >ACSP50_5522 <400> 51 atgacgacca ccgcaccgac tcccgcccac ctcgccggca acttcgcgcc cgtcaccggg 60 gagaccacca cgctcgacct gccggtcacc ggcgccgtcc cggccgaact gaccgggtgg 120 tatctgcgca acgggcccaa cccccaccac gggacctcgg cgcactggtt tctcggcgac 180 ggcatggtgc acggcgtccg cctcgatcac ggccgggcca cctggtaccg caaccgctgg 240 gtgcggaccc gggtgctgac cgacgacgcc cgcgcctacg gcccggacgg cacccgcgac 300 ctcaccgccg gcccggcgaa caccaacgtc gtgcgccacg gcggacgact gctggcgctg 360 gtcgagtccg cgcttccgta cgagatcacc accgacctgg agaccgtcgg cccctacgac 420 ttcggcggcc gcctgcacac cccgatgacc gcccacccca aggtctgtcc caccaccggg 480 gagatgcact tcttcggcta cggcggactc gagccgccct acctcaccta ccaccgcgcc 540 ggcgcggacg gccggctgtc gctcagccgc ccgatcgacg tccccgcgca cacgatgatg 600 cacgacttca gcctcaccgc ggcccacgtg atcttcatgg acctgccggt gctgttcagc 660 ctggacgggg cgcggaccgg cggcatgccg taccggtggg acgacaccta ccaggcgcgc 720 ctgggcgtgc tgcggcgcga cgccccgcag ggggaggtcc gctggtacac catcgatccc 780 ggatacgtct tccacaccct gaacgcccac gacgacggcg accggatcgt catgcacgtc 840 gtccgccacg agcacgcgta ccgcccgggg cagcccgccg ccgcaccgga cctctggcgc 900 tggaccatcg accagcgcac cggccgggtc gccgaggaac ggctggacga cgaagcggtc 960 gagttccccc gcatcgacga tcggcgcacc gggcagccgg cccgttacgg cttcgccgtg 1020 accgacaacg ttccccgccg gctcgccgac gtcagcgccg tcatccgcta cgacctgcac 1080 accggctcga ccacccggca ccgcctgccg accgggcagg tacccgggga ggcggtcttc 1140 gtgccggccg gcggcgcccc cgccggatcg gccgacggct ggctgctgac gttcgcctac 1200 gacccggggc gcgacgccag cgatctgatc atcatcgacg ccaccgacct cgccgccccg 1260 ccgctggccc ggatccacct gccgcaccgg gtgccgttcg gcttccacgg caactggctg 1320 cccgaccacg accgcgcaga atag 1344 <210> 52 <211> 640 <212> PRT <213> Artificial Sequence <220> <223> >Dxs (ACSP50_7096) <400> 52 Met Ser Asp Ser Pro Ser Thr Pro Ala Gly Leu Leu Ala Ser Val Thr 1 5 10 15 Gly Pro Gly Ala Leu Lys Arg Leu Ser Ala Glu Gln Leu Thr Leu Leu 20 25 30 Ala Ala Glu Ile Arg Asp Phe Leu Val Ala Lys Val Ser Lys Thr Gly 35 40 45 Gly His Leu Gly Pro Asn Leu Gly Val Val Glu Met Thr Leu Ala Met 50 55 60 His Arg Val Phe Asp Ser Pro Arg Asp Lys Ile Leu Phe Asp Thr Gly 65 70 75 80 His Gln Ala Tyr Val His Lys Ile Val Thr Gly Arg Gln Asp Gly Phe 85 90 95 Asp Leu Leu Arg Gln Arg Gly Gly Leu Thr Gly Tyr Pro Ser Gln Ala 100 105 110 Glu Ser Glu His Asp Leu Ile Glu Asn Ser His Ala Ser Thr Ala Leu 115 120 125 Ser Tyr Ala Asp Gly Leu Ala Lys Ala Phe Ala Leu Arg Gly Glu Asp 130 135 140 Arg His Val Val Ala Val Val Gly Asp Gly Ala Leu Thr Gly Gly Met 145 150 155 160 Cys Trp Glu Ala Leu Asn Asn Ile Ala Ala Thr Lys Asn Arg Leu Val 165 170 175 Ile Val Val Asn Asp Asn Gly Arg Ser Tyr Ala Pro Thr Ile Gly Gly 180 185 190 Leu Ala Asp His Leu Ser Thr Leu Arg Leu Asn Pro Gly Tyr Glu Lys 195 200 205 Val Leu Asp Leu Val Lys Asp Ala Leu Gly Ser Thr Pro Leu Val Gly 210 215 220 Lys Pro Val Phe Glu Val Leu His Ala Val Lys Arg Gly Ile Lys Asp 225 230 235 240 Ala Val Ser Pro Gln Pro Met Phe Glu Asp Leu Gly Leu Lys Tyr Ile 245 250 255 Gly Pro Val Asp Gly His Asp Gln Gln Ala Met Glu Ser Ala Leu Arg 260 265 270 Arg Ala Lys Gly Phe Asn Ala Pro Val Ile Val His Ala Val Thr Arg 275 280 285 Lys Gly Tyr Gly Tyr Arg Pro Ala Glu Gln Asp Glu Ala Asp Cys Leu 290 295 300 His Gly Pro Gly Ala Phe Asp Pro Gln Thr Gly Ala Leu Thr Ala Lys 305 310 315 320 Pro Ser Leu Lys Trp Thr Lys Val Phe Ala Glu Glu Leu Val Lys Ile 325 330 335 Ala Asp Glu Arg Pro Asp Val Val Gly Ile Thr Ala Ala Met Ala Glu 340 345 350 Pro Thr Gly Ile Ala Ala Leu Ala Lys Lys Tyr Pro Asp Arg Ala Tyr 355 360 365 Asp Val Gly Ile Ala Glu Gln His Ala Ala Thr Ser Ala Ala Gly Leu 370 375 380 Ala Met Gly Gly Leu His Pro Val Val Ala Val Tyr Ala Thr Phe Leu 385 390 395 400 Asn Arg Ala Phe Asp Gln Val Leu Leu Asp Val Ala Met His Arg Leu 405 410 415 Pro Val Thr Phe Val Leu Asp Arg Ala Gly Ile Thr Gly Pro Asp Gly 420 425 430 Pro Ser His Tyr Gly Ile Trp Asp Met Ser Val Phe Gly Ala Val Pro 435 440 445 Gly Leu Arg Ile Ala Ala Pro Arg Asp Ala Ala Thr Leu Arg Glu Glu 450 455 460 Leu Arg Glu Ala Val Ala Val Asp Asp Gly Pro Thr Ile Val Arg Phe 465 470 475 480 Pro Thr Gly Ala Val Ala Ala Asp Thr Pro Ala Val Arg Arg Val Gly 485 490 495 Gln Val Asp Val Leu Arg Glu Ala Glu Lys Lys Asp Ile Leu Leu Val 500 505 510 Ala Val Gly Ser Phe Val Gly Leu Gly Leu Asp Ala Ala Glu Arg Leu 515 520 525 Ala Glu Gln Gly Tyr Gly Val Thr Val Val Asp Pro Arg Trp Val Arg 530 535 540 Pro Val Pro Ile Glu Leu Thr Gly Leu Ala Ala Gln His Arg Leu Val 545 550 555 560 Val Thr Leu Glu Asp Gly Ile Arg Ala Gly Gly Val Gly Asp Ala Val 565 570 575 Ala Ala Ala Leu Arg Asp Ala Gly Val His Val Pro Leu Arg Asp Phe 580 585 590 Gly Val Pro Ala Gly Phe His Pro His Gly Thr Arg Ala Glu Ile Leu 595 600 605 Ala Ser Leu Gly Leu Thr Ala Gln Asp Val Ala Arg Asp Val Thr Gly 610 615 620 Trp Val Ser Gly Leu Asp Ala Gly Thr Ser Val Ala Ala Pro Ala Ile 625 630 635 640 <210> 53 <211> 390 <212> PRT <213> Artificial Sequence <220> <223> >IspG (ACSP50_7248) <400> 53 Met Thr Ala Ile Ser Leu Gly Met Pro Ala Val Pro Pro Pro Pro Leu 1 5 10 15 Ala Pro Arg Arg Gln Ser Arg Gln Ile Asn Val Gly Gly Val Leu Val 20 25 30 Gly Gly Gly Ala Pro Val Ser Val Gln Ser Met Thr Thr Thr Leu Thr 35 40 45 Ser Asp Val Asn Ala Thr Leu Gln Gln Ile Ala Glu Leu Thr Ala Ala 50 55 60 Gly Cys Gln Ile Val Arg Val Ala Val Pro Ser Gln Asp Asp Val Glu 65 70 75 80 Ala Leu Pro Ala Ile Ala Lys Lys Ser Gln Ile Pro Val Ile Ala Asp 85 90 95 Ile His Phe Gln Pro Lys Tyr Val Phe Ala Ala Ile Asp Ala Gly Cys 100 105 110 Ala Ala Val Arg Val Asn Pro Gly Asn Ile Arg Gln Phe Asp Asp Lys 115 120 125 Val Lys Glu Ile Ala Arg Ala Ala Ser Asp Ala Gly Val Pro Ile Arg 130 135 140 Ile Gly Val Asn Ala Gly Ser Leu Asp Lys Arg Leu Leu Glu Lys Tyr 145 150 155 160 Gly Lys Ala Thr Ala Glu Ala Leu Val Glu Ser Ala Leu Trp Glu Cys 165 170 175 Ser Leu Phe Glu Glu His Gly Phe Arg Asp Ile Lys Ile Ser Val Lys 180 185 190 His Asn Asp Pro Val Val Met Ile Arg Ala Tyr Arg Gln Leu Ala Glu 195 200 205 Gln Cys Asp Tyr Pro Leu His Leu Gly Val Thr Glu Ala Gly Pro Ala 210 215 220 Phe Gln Gly Thr Ile Lys Ser Ala Val Ala Phe Gly Ala Leu Leu Ala 225 230 235 240 Glu Gly Ile Gly Asp Thr Ile Arg Val Ser Leu Ser Ala Pro Pro Val 245 250 255 Glu Glu Ile Lys Val Gly Gln Gln Ile Leu Glu Ser Leu Gly Leu Arg 260 265 270 Glu Arg Gly Leu Glu Ile Val Ser Cys Pro Ser Cys Gly Arg Ala Gln 275 280 285 Val Asp Val Tyr Thr Leu Ala Glu Gln Val Thr Ala Ala Leu Asp Gly 290 295 300 Phe Pro Val Pro Leu Arg Val Ala Val Met Gly Cys Val Val Asn Gly 305 310 315 320 Pro Gly Glu Ala Arg Glu Ala Asp Leu Gly Val Ala Ser Gly Asn Gly 325 330 335 Lys Gly Gln Ile Phe Val Lys Gly Lys Val Ile Lys Thr Val Pro Glu 340 345 350 Ala Val Ile Val Glu Thr Leu Val Glu Glu Ala Leu Arg Leu Ala Asp 355 360 365 Glu Met Gly Ala Glu Leu Pro Asp Glu Leu Arg Glu Leu Leu Pro Gly 370 375 380 Pro Thr Val Thr Val His 385 390 <210> 54 <211> 399 <212> PRT <213> Artificial Sequence <220> <223> >Dxr (ACSP50_7250) <400> 54 Met Arg Glu Leu Val Leu Leu Gly Ser Thr Gly Ser Ile Gly Thr Gln 1 5 10 15 Ala Ile Asp Ile Val Arg Arg Asn Pro Glu Leu Phe Arg Val Val Ala 20 25 30 Ile Gly Ala Gly Gly Gly Asn Val Ala Leu Leu Ala Ala Gln Ala Leu 35 40 45 Glu Leu Gly Val Glu Val Val Gly Val Ala Arg Ala Ser Val Val Gln 50 55 60 Asp Leu Gln Leu Ala Phe Tyr Ala Glu Ala Gln Lys Arg Gly Trp Ser 65 70 75 80 Ser Gly Asp Phe Lys Leu Pro Lys Ile Val Ala Gly Pro Asp Ala Met 85 90 95 Thr Glu Leu Ala Arg Trp Pro Cys Asp Val Val Leu Asn Gly Val Val 100 105 110 Gly Ser Leu Gly Leu Ala Pro Thr Leu Ala Ala Leu Glu Ser Gly Arg 115 120 125 Ile Leu Ala Leu Ala Asn Lys Glu Ser Leu Val Ala Gly Gly Pro Leu 130 135 140 Val Arg Arg Ile Ala Lys Asp Gly Gln Ile Val Pro Val Asp Ser Glu 145 150 155 160 His Ser Ala Leu Ala Gln Cys Leu Arg Gly Gly Arg Ala Ala Glu Val 165 170 175 Arg Arg Leu Val Leu Thr Ala Ser Gly Gly Ala Phe Arg Gly Arg Arg 180 185 190 Arg Ala Glu Leu Thr Asn Val Thr Pro Glu Glu Ala Leu Lys His Pro 195 200 205 Thr Trp Asp Met Gly Pro Val Val Thr Ile Asn Ser Ala Thr Met Val 210 215 220 Asn Lys Ala Leu Glu Val Ile Glu Ala His Glu Leu Phe Gly Val Pro 225 230 235 240 Tyr Asp Asp Ile Ala Val Met Val His Pro Gln Ser Val Leu His Ser 245 250 255 Leu Val Glu Phe Thr Asp Gly Ser Thr Leu Ala Gln Ala Ser Pro Pro 260 265 270 Asp Met Arg Leu Pro Ile Ala Leu Ala Leu Ala Trp Pro Asp Arg Val 275 280 285 Pro Gly Ala Ala Ala Ala Val Asp Trp Thr Leu Ala His Asn Trp Glu 290 295 300 Leu Arg Pro Leu Asp Asp Glu Ala Phe Pro Ala Val Glu Leu Ala Lys 305 310 315 320 Ala Ala Gly Arg Tyr Gly Arg Cys Arg Pro Ala Ile Phe Asn Ala Ala 325 330 335 Asn Glu Glu Cys Val Ala Ala Phe Ala Ala Gly Arg Leu Pro Phe Leu 340 345 350 Gly Ile Val Asp Thr Leu Glu Arg Val Leu Ala Ala Ala Pro Asp Phe 355 360 365 Ala Glu Pro Ser Thr Val Asp Asp Val Leu Ala Ala Glu Ser Trp Ala 370 375 380 Arg Ala Gln Ala Gln Arg Thr Ile Ala Thr Val Ala Glu Gly Ala 385 390 395 <210> 55 <211> 320 <212> PRT <213> Artificial Sequence <220> <223> >IspH (ACSP50_7707) <400> 55 Met Leu Leu Ala Lys Pro Arg Gly Tyr Cys Ala Gly Val Asp Arg Ala 1 5 10 15 Val Gln Thr Val Glu Glu Ala Leu Lys Leu Tyr Gly Ala Pro Val Tyr 20 25 30 Val Arg Lys Gln Ile Val His Asn Lys His Val Val Ser Thr Leu Glu 35 40 45 Ala Arg Gly Ala Ile Phe Val Glu Glu Asn Tyr Glu Val Pro Glu Gly 50 55 60 Ala Thr Val Val Phe Ser Ala His Gly Val Ala Pro Glu Val His Asp 65 70 75 80 Gln Ala Arg Glu Arg Arg Leu Lys Ala Ile Asp Ala Thr Cys Pro Leu 85 90 95 Val Thr Lys Val His His Glu Ala Lys Arg Phe Ala Ala Glu Asp Tyr 100 105 110 Asp Ile Leu Leu Ile Gly His Glu Gly His Glu Glu Val Ile Gly Thr 115 120 125 Ser Gly Glu Ala Pro Ala His Ile Gln Leu Val Asp Gly Pro Asp Asp 130 135 140 Val Ala Asn Val Val Val Arg Asp Pro Ala Lys Val Val Trp Leu Ser 145 150 155 160 Gln Thr Thr Leu Ser Val Asp Glu Thr Met Glu Thr Val Ala Arg Leu 165 170 175 Lys Thr Arg Leu Pro Leu Leu Gln Ser Pro Pro Ser Asp Asp Ile Cys 180 185 190 Tyr Ala Thr Ser Asn Arg Gln His Val Ile Lys Glu Ile Ala Pro Glu 195 200 205 Cys Asp Val Val Ile Val Val Gly Ser Thr Asn Ser Ser Asn Ser Val 210 215 220 Arg Leu Val Glu Val Ala Leu Gly Ala Gly Ala Arg Ala Gly His Leu 225 230 235 240 Val Asp Tyr Ala Ala Glu Ile Gln Asp Glu Trp Leu Ala Gly Ala Thr 245 250 255 Thr Val Gly Val Ser Ser Gly Ala Ser Val Pro Asp Glu Leu Val Met 260 265 270 Glu Val Leu Ala His Leu Ala Glu Arg Gly Phe Gly Glu Val Thr Glu 275 280 285 Phe Thr Thr Ala Glu Glu Arg Leu Thr Phe Ser Leu Pro Gln Glu Leu 290 295 300 Arg Lys Asp Met Lys Ala Ala Glu Ala Ala Arg Ala Ala Ala Ala Gly 305 310 315 320 <210> 56 <211> 315 <212> PRT <213> Artificial Sequence <220> <223> >IspE (ACSP50_7802) <400> 56 Met Thr Glu Ala Trp Gly Pro Asp Asp Asp Glu Pro Arg Pro Tyr Ser 1 5 10 15 Gly Pro Val Lys Val Arg Val Pro Ala Lys Ile Asn Leu His Leu Ala 20 25 30 Val Gly Pro Leu Arg Pro Asp Gly Tyr His Glu Leu Asn Thr Val Tyr 35 40 45 His Ala Ile Ser Leu Phe Asp Glu Ile Thr Ala Arg His Gly Asp Thr 50 55 60 Leu Thr Leu Thr Met Glu Gly Glu Gly Thr Gly Asp Leu Ala Leu Asp 65 70 75 80 Glu Thr Asn Leu Ile Ile Arg Ala Ala Arg Ala Leu Ala Ala Arg Ala 85 90 95 Arg Val Pro Ala Tyr Ala Arg Leu His Leu Arg Lys Ser Ile Pro Leu 100 105 110 Ala Gly Gly Leu Ala Gly Gly Ser Ala Asp Ala Ala Ala Thr Leu Ile 115 120 125 Ala Cys Asp Leu Leu Trp Gly Leu Gly Met Ser Arg Asp Glu Leu Ala 130 135 140 Glu Val Gly Ala Gln Leu Gly Ser Asp Ile Pro Phe Leu Leu His Gly 145 150 155 160 Gly Thr Ala Leu Gly Thr Gly His Gly Glu Ala Val Ser Pro Ile Leu 165 170 175 Ala Arg Pro Thr Thr Trp His Trp Thr Val Ala Ile Ala Asp Gly Gly 180 185 190 Leu Ala Thr Pro Ala Val Tyr Arg Glu Leu Asp Thr Leu Arg Ala Gly 195 200 205 Thr Trp Pro Pro Thr Pro Leu Gly Ser Ala Asp Thr Leu Met Ala Ala 210 215 220 Leu Arg Gln Arg Asn Pro Glu Ile Leu Gly Ala Ala Leu Gly Asn Asp 225 230 235 240 Leu Gln Pro Ala Ala Leu Ala Leu Arg Pro Gln Leu Ala Asp Val Leu 245 250 255 Lys Ala Gly Thr Glu Ala Gly Ala Leu Ala Gly Leu Val Ser Gly Ser 260 265 270 Gly Pro Thr Cys Val Phe Leu Ala Ala Asp Ala Thr His Ala Gln Glu 275 280 285 Ile Ala Asp Ser Leu Thr Glu Ala Gly Val Cys Arg Ala Ala Val Thr 290 295 300 Ala Arg Gly Pro Gln Pro Gly Ala Arg Val Ile 305 310 315 <210> 57 <211> 162 <212> PRT <213> Artificial Sequence <220> <223> >IspF (ACSP50_8046) <400> 57 Met Ile Ile Pro Arg Val Gly Ile Gly Thr Asp Val His Ala Phe Asp 1 5 10 15 Ala Asp Arg Ala Cys Trp Val Ala Gly Leu Glu Trp Pro Gly Glu Pro 20 25 30 Gly Leu Ala Gly His Ser Asp Ala Asp Val Val Ala His Ala Ala Cys 35 40 45 Asp Ala Leu Leu Ser Ala Ala Gly Leu Gly Asp Leu Gly Gly Asn Phe 50 55 60 Gly Thr Ser Arg Pro Glu Trp Ala Gly Ala Ala Gly Val Thr Leu Leu 65 70 75 80 Ala Glu Thr Ala Arg Leu Val Arg Ala Ala Gly Phe Ala Ile Gly Asn 85 90 95 Val Ser Val Gln Val Ile Gly Asn Arg Pro Lys Ile Gly Lys Arg Arg 100 105 110 Ala Glu Ala Glu Lys Val Leu Ser Ala Ala Val Gly Ala Pro Val Thr 115 120 125 Val Ser Gly Thr Thr Ser Asp Gly Leu Gly Leu Thr Gly Arg Gly Glu 130 135 140 Gly Leu Ala Gly Val Ala Val Ala Met Val Tyr Thr Glu Asn Ala Leu 145 150 155 160 Pro Ala <210> 58 <211> 243 <212> PRT <213> Artificial Sequence <220> <223> >IspD (ACSP50_8047) <400> 58 Met Ile Ala Asp Arg Asp Val Thr Ala Gln Leu Asn Ala Arg Gly Asp 1 5 10 15 Val Ala Val Val Val Pro Ala Ala Gly Ala Gly Leu Arg Leu Gly Pro 20 25 30 Gly Gly Pro Lys Ala Leu Arg Leu Leu Asp Gly Glu Pro Leu Leu Val 35 40 45 His Ala Val Arg Arg Leu Ala Ala Ala Ala Pro Val Arg Met Ile Val 50 55 60 Val Ala Ala Pro Pro Ala Glu Val Asp Ala Val Ser Ala Leu Leu Ala 65 70 75 80 Pro Val Ala Pro Val Thr Val Val Pro Gly Gly Ala Glu Arg Gln Glu 85 90 95 Ser Val Ala Ala Ala Leu Ala Val Val Pro Pro Asp Val Pro Ile Val 100 105 110 Leu Val His Asp Ala Ala Arg Cys Leu Thr Pro Pro Ser Val Thr Glu 115 120 125 Arg Val Ala Ala Ala Val Arg Asp Gly Ala Asp Ala Val Ile Pro Val 130 135 140 Leu Pro Val Val Asp Thr Ile Lys Glu Val Ala Ala Asp Ala Thr Val 145 150 155 160 Leu Gly Thr Val Asp Arg Ser Val Leu Arg Ala Val Gln Thr Pro Gln 165 170 175 Gly Phe Arg Ala Ser Val Leu Arg Ala Ala His Arg Ala Ala Ala Asp 180 185 190 Ser His Thr Asp Asp Ala Gly Ala Val Glu Lys Leu Gly Ile Pro Val 195 200 205 Leu Cys Val Pro Gly Ser Asp Leu Ala Leu Lys Ile Thr Arg Pro Ile 210 215 220 Asp Leu Ala Leu Ala Thr His Leu Leu Ala Leu Pro Asp Pro Asp Ala 225 230 235 240 Pro Thr Ala <210> 59 <211> 194 <212> PRT <213> Artificial Sequence <220> <223> >Idi (ACSP50_0146) <400> 59 Met Ser Ser Ile Gly His Leu Asn Arg Glu Asp His Leu Val Glu Leu 1 5 10 15 Val Asn Glu Glu Gly Gln Pro Leu Gly Ser Ala Thr Val Ser Asp Ala 20 25 30 His Leu Ser Pro Gly Ala Leu His Arg Ala Phe Ser Val Phe Leu Thr 35 40 45 Asp Asp Glu Gly Arg Val Leu Leu Gln Gln Arg Ala Ala Ala Lys Thr 50 55 60 Arg Phe Pro Leu Arg Trp Gly Asn Thr Cys Cys Gly His Pro Ala Pro 65 70 75 80 Gly Glu Pro Val Thr Val Ala Ala Ala Arg Arg Leu Thr Glu Glu Leu 85 90 95 Ala Val Arg Asp Val Thr Leu Thr Glu Ile Gly Val Tyr Thr Tyr Arg 100 105 110 Ala Thr Asp Pro Val Thr Gly Arg Val Glu His Glu Tyr Asp His Val 115 120 125 Leu Ile Gly Ala Leu Pro Asp Gly Val Val Pro His Pro Asp Pro Ala 130 135 140 Glu Ile Ala Thr Leu Arg Trp Ala Ser Leu Pro Gly Leu Arg Thr Gly 145 150 155 160 Leu Thr Glu Ser Pro Glu Leu Tyr Ala Pro Trp Leu Pro Gly Val Phe 165 170 175 Glu Ile Leu Thr Glu Arg Ser Gly Val Leu Ser Thr Glu Arg Ser Gly 180 185 190 Gly Arg <210> 60 <211> 356 <212> PRT <213> Artificial Sequence <220> <223> >CrtE ldsA (ACSP50_0148) <400> 60 Met Ala Asn Asp Thr Leu Glu Gly Asn Arg Leu Ala Ala Ile Pro Arg 1 5 10 15 Gln Ser Val Ser His Thr Gly Leu Val Gly Ala Val Glu Gly Thr Leu 20 25 30 Ala Asp Phe Leu Ala Ser Gln Ile Ala Ser Leu Asp Ala Val Asp Pro 35 40 45 Ser Leu Gly Gly Phe Gly Arg Thr Ala Arg Asp Leu Val Met Ala Gly 50 55 60 Gly Lys Arg Leu Arg Pro Thr Phe Ala Tyr Trp Gly Trp Arg Gly Val 65 70 75 80 Ala Gly Pro Ala Ala Asp Ala Glu Thr Leu Leu Pro Ala Leu Gly Ala 85 90 95 Leu Glu Leu Met His Thr Phe Ala Leu Val His Asp Asp Val Met Asp 100 105 110 Asp Ser Ser Thr Arg Arg Gly Arg Pro Thr Ala His Arg Ile Phe Ala 115 120 125 Ala Gln His Gly Gly Arg Phe Gly Thr Ser Ala Ala Ile Leu Val Gly 130 135 140 Asp Leu Cys Leu Val Trp Ala Asp Gln Leu Leu Ala Arg Thr Pro Val 145 150 155 160 Pro Ala Ala Thr Leu Leu Ala Val Arg Ala His Tyr Asp Arg Met Arg 165 170 175 Ile Glu Ala Val Ala Gly Gln Tyr Leu Asp Val Leu Gly Glu Thr Asp 180 185 190 Pro Ala Ser Trp Ser Val Glu Arg Ala Leu Leu Val Ala Arg His Lys 195 200 205 Thr Ala Ser Tyr Thr Val Gln Arg Pro Leu Asp Phe Gly Leu Ala Leu 210 215 220 Ala Gly Val Glu Asp Val Glu Val Ala Glu Ala Tyr Arg Thr Tyr Gly 225 230 235 240 Ile Ala Val Gly Glu Ala Phe Gln Leu Arg Asp Asp Leu Leu Gly Val 245 250 255 Tyr Gly Asp Pro Ala Val Thr Gly Lys Pro Val Ser Asp Asp Leu Arg 260 265 270 Thr Gly Lys Pro Thr Ala Leu Leu Met Leu Ala Arg Arg Met Ala Thr 275 280 285 Pro Gly Gln Leu Ala Glu Leu Glu Ser Ala Glu Ile Glu Arg Lys Ala 290 295 300 Gln Val Val Ala Glu Thr Gly Ala Pro Ala Arg Val Glu Glu Met Ile 305 310 315 320 Arg Ala Arg Val Thr Glu Gly Leu Thr Ala Leu Ala Ser Ala Pro Ile 325 330 335 Asp Ala Glu Ala Arg Ala Thr Leu Ile Glu Leu Ala Thr Val Ala Thr 340 345 350 Gln Arg Pro Ala 355 <210> 61 <211> 295 <212> PRT <213> Artificial Sequence <220> <223> >CrtB (ACSP50_0149) <400> 61 Met Glu Thr Asp Leu Ala Ala Ala Tyr Glu Arg Cys Arg Glu Leu His 1 5 10 15 Arg Glu His Gly Arg Thr Tyr Tyr Leu Ala Thr Arg Leu Leu Pro Ala 20 25 30 Trp Lys Arg Arg His Val His Ala Leu Tyr Gly Phe Thr Arg Phe Ala 35 40 45 Asp Glu Ile Val Asp Arg Thr Glu Ala Gln Pro Pro Ala Glu Arg Ala 50 55 60 Ala Glu Leu Ala Thr Trp Ser Ala Gly Phe Leu Ala Gly Leu Arg Gly 65 70 75 80 Glu Pro Val Asp Asp Pro Leu Leu Pro Ala Val Leu His Thr Ile Ala 85 90 95 Val Phe Gly Leu Asp Leu Glu Asp Phe Ala Lys Phe Leu Arg Ser Met 100 105 110 Glu Met Asp Leu Thr Val Thr Gly Tyr Arg Thr Tyr Asp Asp Leu Leu 115 120 125 Asp Tyr Met Glu Gly Ser Ala Ala Val Ile Gly Thr Met Met Leu Pro 130 135 140 Ile Leu Gly Ser Thr Asp Pro Ala Ala Ala Arg Glu Pro Ala Arg Gln 145 150 155 160 Leu Gly Phe Ala Phe Gln Leu Thr Asn Phe Ile Arg Asp Val Ala Glu 165 170 175 Asp Leu Ala Arg Asp Arg Ile Tyr Leu Pro Glu Glu His Leu Ala Glu 180 185 190 Phe Gly Val Thr Arg Ala Asp Leu Ala Ala Gly Val Ala Thr Pro Ala 195 200 205 Ile Arg Ala Leu Ile Arg Ala Glu Val Asp Arg Ala Arg Glu His Tyr 210 215 220 Ala Ala Ala Ala Pro Gly Ile Pro Leu Leu Glu Arg Thr Ser Gln Ala 225 230 235 240 Cys Met Arg Thr Ala Phe Gln Leu Tyr Gly Gly Ile Leu Asp Glu Ile 245 250 255 Glu Ala Ala Asp Tyr Asp Val Phe Ala Arg Arg Val Thr Val Pro Asn 260 265 270 Arg Arg Arg Ala Ala Val Ala Val Arg Ser Leu Leu Thr Arg Pro Gly 275 280 285 Thr Pro Val Glu Leu Ala Ala 290 295 <210> 62 <211> 436 <212> PRT <213> Artificial Sequence <220> <223> >ACSP50_0150 <400> 62 Met Gly Ala Arg Val Ala Leu Phe Thr Arg Asp Leu Arg Ile His Asp 1 5 10 15 Asn Pro Leu Leu Ser Gly Pro Asp Pro Val Val Pro Leu Phe Val Leu 20 25 30 Asp Pro Arg Leu Ser Gly Leu Ser Ala Asn Arg Ser Arg Phe Leu His 35 40 45 Gln Ser Leu Ala Asp Leu Arg Asn Ser Leu Arg Glu Arg Gly Ala Asp 50 55 60 Leu Val Ile Arg Glu Gly Asp Pro Val Ala Glu Thr Ile Ala Val Ala 65 70 75 80 Ser Glu Val Asp Ala Ser Thr Ile Thr Val Ala Ala Asp Val Thr Gly 85 90 95 Tyr Ala Gln Arg Arg Glu Arg Arg Leu Arg Asp Glu Arg Phe Arg Val 100 105 110 Lys Thr Val Pro Ser Val Thr Val Leu Pro Pro Gly Thr Val Arg Pro 115 120 125 Gly Gly Gly Gly Glu Ser Tyr Arg Val Phe Thr Pro Tyr Phe Lys Ala 130 135 140 Trp Glu Lys Ala Gly Trp Arg Ala Pro Ser Ala Thr Pro Gly Lys Val 145 150 155 160 Ala Met Pro Ala Gly Ile Ala Pro Gly Arg Leu Pro Glu Met Pro Ala 165 170 175 Gly Asp Ser Pro Asp Ala Val Ala Gly Gly Glu Thr Glu Gly Arg Arg 180 185 190 Arg Leu Gln Ala Trp Gln Lys Glu Met Ala Arg Tyr Ala Glu Asp His 195 200 205 Asp Asp Met Ala Ala Asp Asn Thr Ser Arg Leu Ser Ala Tyr Leu Arg 210 215 220 Phe Gly Cys Leu Ser Pro Leu Glu Leu Ala Leu Ala Ala Lys Ala Asp 225 230 235 240 Asp Ser Pro Gly Ala Gln Ala Tyr Leu Arg Gln Leu Cys Trp Arg Asp 245 250 255 Phe Tyr Tyr Gln Val Thr Ala Thr Phe Pro Glu Ile Ser Thr Arg Pro 260 265 270 Leu Arg Glu Lys Ala Asp Gln Asn Trp Arg Tyr Asp Asp Asp Ala Leu 275 280 285 Arg His Trp Gln Asp Gly Leu Thr Gly Val Pro Ile Val Asp Ala Gly 290 295 300 Met Arg Gln Leu Arg Ala Glu Gly Trp Met His Asn Arg Ala Arg Leu 305 310 315 320 Ile Thr Ala Ala Phe Leu Thr Lys His Leu Gly Ile Asp Trp Arg Pro 325 330 335 Gly Leu Gln Trp Phe Phe Arg Trp Leu Leu Asp Gly Asp Val Pro Asn 340 345 350 Asn Ser Gly Asn Trp Gln Trp Thr Ala Gly Thr Gly Asn Asp Thr Arg 355 360 365 Pro Tyr Arg Arg Phe Asn Pro Ile Arg Gln Ala Gln Arg Phe Asp Ala 370 375 380 Gln Gly Val Tyr Val Arg Arg Tyr Val Pro Glu Leu Lys Asp Ile Asp 385 390 395 400 Gly Val Thr Val His Gln Pro Trp Arg Leu Pro Glu Ser Val Arg Arg 405 410 415 Gly Leu Asp Tyr Pro Gly Pro Leu Glu Ser His Arg Asp Glu Ala Val 420 425 430 Trp Leu Arg Asp 435 <210> 63 <211> 453 <212> PRT <213> Artificial Sequence <220> <223> >ACSP50_0151 <400> 63 Met Ser Glu Ala Arg Gln Val Asp Val Val Val Val Gly Leu Gly Val 1 5 10 15 Gly Gly Glu Glu Val Ala Gly Arg Leu Ala Ala Ala Gly Leu Ser Val 20 25 30 Ile Gly Val Glu His Arg Leu Val Gly Gly Glu Cys Pro Tyr Trp Gly 35 40 45 Cys Ile Pro Thr Lys Ile Met Val Arg Ala Gly Asn Ala Leu Ala Glu 50 55 60 Ala Arg Arg Ile Pro Gly Leu Ala Gly Thr Ser Thr Val Arg Ala Asp 65 70 75 80 Trp Ala Pro Val Ala Lys Arg Ile Arg Asp Glu Ala Thr Asp Asp Trp 85 90 95 Asn Asp Lys Val Ala Val Glu Arg Phe Thr Gly Lys Gly Gly Thr Phe 100 105 110 Val Arg Gly Thr Ala Glu Leu Thr Gly Pro Gly Gln Val Arg Val Gly 115 120 125 Asp Gln Glu Phe Ala Ala Ser Arg Gly Val Val Ile Ala Thr Gly Thr 130 135 140 Ala Ala Val Val Pro Pro Ile Glu Gly Leu Ser Gly Thr Pro Phe Trp 145 150 155 160 Thr Asn Arg Glu Ala Val Glu Ala Ala Ala Leu Pro Ala Ser Met Leu 165 170 175 Val Leu Gly Gly Gly Ala Ile Gly Cys Glu Leu Ala Gln Ala Tyr Ala 180 185 190 Arg Phe Gly Val Gln Val Thr Val Ile Glu Gly Ser Pro Arg Val Leu 195 200 205 Ala Met Glu Glu Pro Glu Ser Ser Glu Val Ala Ala Ala Ala Leu Thr 210 215 220 Ala Asp Gly Val Arg Ile Val Thr Gly Val Arg Ala Gln Lys Val Ala 225 230 235 240 His Asp Asp Gly Phe His Val Thr Leu Ser Asp Gly Ser Val Leu Ala 245 250 255 Gly Glu Lys Leu Leu Val Ala Thr Gly Arg Ala Ala Arg Leu Gly Gly 260 265 270 Leu Gly Leu Asp Arg Val Gly Leu Asp Pro Ser Ala Arg Phe Leu Ala 275 280 285 Thr Asp Asp Arg Leu Arg Ala Gly Glu Gly Ile Trp Ala Val Gly Asp 290 295 300 Val Thr Gly Asn Gly Ala Phe Thr His Met Ala Met Tyr Glu Ala Asp 305 310 315 320 Ile Ala Val Arg Asp Ile Leu Gly Gln Gly Gly Pro Gly Ala Asp Tyr 325 330 335 Arg Ala Arg Pro Arg Val Thr Phe Leu Asp Pro Glu Ile Gly Ala Val 340 345 350 Gly Met Thr Glu Gln Gln Ala Arg Asp Ala Gly Leu Glu Val Arg Val 355 360 365 Gly Tyr Val Pro Leu Asn Gln Thr Ser Arg Gly Phe Ile His Gly Pro 370 375 380 Gly Asn Glu Gly Phe Leu Lys Leu Val Ala Asp Gly Glu Arg Gly Val 385 390 395 400 Leu Val Gly Gly Thr Thr Ala Gly Gln Ser Gly Gly Glu Met Ile Gly 405 410 415 Ala Val Ala Val Ala Val His Ala Glu Val Pro Val Ser Thr Leu Leu 420 425 430 Ser Gln Ile Trp Ala Tyr Pro Thr Phe His Arg Gly Leu Gly Gln Ala 435 440 445 Leu Gln Ser Leu Ala 450 <210> 64 <211> 116 <212> PRT <213> Artificial Sequence <220> <223> >ACSP50_1631 <400> 64 Met Ser Glu Pro Val Ile Thr Glu Pro Ala Ala Trp Ile Asn Leu Pro 1 5 10 15 Asp Leu Ser Glu Arg Leu Asp Val Ser Ile Ser Lys Val His Gln Met 20 25 30 Ile Arg Asp Gly Asp Leu Leu Ala Val Arg Arg Asp Gly Ile Arg Val 35 40 45 Val Pro Ala Glu Leu Val Ala Asn Ala Thr Val Leu Lys His Leu Pro 50 55 60 Gly Val Leu Asn Val Leu Arg Asp Ala Gly Tyr Asn Asp Glu Glu Ala 65 70 75 80 Phe Arg Trp Leu Tyr Ala Glu Asp Ala Glu Val Gly Gly Ser Ala Ala 85 90 95 Ile Ala Leu Gly Gly Gln Gln Ala Arg Glu Ile Lys Arg Arg Ala Gln 100 105 110 Ala Leu Gly Phe 115 <210> 65 <211> 108 <212> PRT <213> Artificial Sequence <220> <223> >ACSP50_1632 <400> 65 Met Arg His Leu Ser Tyr Val Ala Val Leu Ala Gly Cys Leu Ala Gly 1 5 10 15 Ala Leu Trp Leu Glu Pro Ile Leu Arg Val Asn Val Leu Arg Arg Trp 20 25 30 Arg Arg Leu Leu Leu Ala Val Leu Pro Met Ala Val Val Phe Thr Leu 35 40 45 Trp Asp Leu Ala Ala Ile Ala Ala Gly His Trp His Phe Asp Pro Ala 50 55 60 Gln Ile Thr Gly Val Tyr Leu Gly Gly Gly Leu Pro Leu Asp Glu Val 65 70 75 80 Leu Phe Phe Leu Val Val Pro Val Cys Ala Ile Leu Gly Phe Glu Ala 85 90 95 Val Arg Ala Val Leu Arg Arg Pro Ala Gly Asp Glu 100 105 <210> 66 <211> 111 <212> PRT <213> Artificial Sequence <220> <223> >ACSP50_1633 <400> 66 Met Thr Tyr Thr Thr Ala Ala Val Leu Gly Val Leu Ala Ala Leu Thr 1 5 10 15 Leu Asp Val Leu Ile Leu Arg Thr Arg Leu Val Gly Arg Leu Val Phe 20 25 30 Trp Ala Thr Tyr Pro Ile Ile Phe Val Phe Gln Leu Ile Ser Asn Gly 35 40 45 Ile Leu Thr Gly Arg Asp Ile Val Met Tyr Asp Pro Ala Ala Ile Leu 50 55 60 Gly Pro Arg Leu Val His Ala Pro Val Glu Asp Leu Leu Phe Gly Phe 65 70 75 80 Ala Leu Val Leu Gly Thr Leu Ser Leu Trp Val Ala Leu Gly Arg Arg 85 90 95 Gly Ile Gln Arg Thr Pro Arg Ala Gly Ser Arg Arg Thr Asp Glu 100 105 110 <210> 67 <211> 356 <212> PRT <213> Artificial Sequence <220> <223> >CrtE fps2(ACSP50_1634) <400> 67 Met Thr Asn Ser Pro Leu Asp Glu Ala Gly Leu Arg Ser Arg Val Asp 1 5 10 15 Lys Ala Leu Thr Val Phe Leu Ala Gly Gln Arg Asp Arg Leu Leu Ala 20 25 30 Ile Asp Pro Ala Leu Ala Glu Met Ser Ala Thr Val Ser Glu Phe Val 35 40 45 Leu Gly Gly Gly Lys Arg Leu Arg Pro Ala Phe Ala Tyr Trp Gly Phe 50 55 60 Arg Gly Ala Gly Gly Ala Asp Ser Asp Ala Val Val Ala Ala Val Ala 65 70 75 80 Ala Leu Glu Leu Val Gln Ala Ser Ala Leu Ile His Asp Asp Leu Met 85 90 95 Asp Arg Ser Asp Thr Arg Arg Gly Val Pro Ser Val His Arg Arg Phe 100 105 110 Glu Lys Leu His Ala Gly Glu Gly Trp Arg Gly Ser Ala Ala Gly Phe 115 120 125 Gly Asp Cys Ala Ala Val Leu Leu Gly Asp Leu Ala Leu Val Trp Ser 130 135 140 Asp Glu Leu Leu His Thr Ser Gly Met Ala Val Ala Asp Val Gln Arg 145 150 155 160 Ala Arg Pro Ile Phe Asp Gly Met Arg Thr Glu Val Thr Val Gly Gln 165 170 175 Tyr Leu Asp Val Leu Thr Gln Ala Thr Gly Asp Thr Ser Leu Glu Arg 180 185 190 Ala Gly Lys Val Ala Val Tyr Lys Ala Ala Lys Tyr Thr Val Glu Arg 195 200 205 Pro Leu Leu Leu Gly Ala Ala Leu Ala Gly Ala Ala Pro Gly Val His 210 215 220 Ala Ala Tyr Ser Ala Phe Gly Leu Pro Leu Gly Glu Ala Phe Gln Leu 225 230 235 240 Arg Asp Asp Val Leu Gly Val Phe Gly Asp Pro Glu Arg Thr Gly Lys 245 250 255 Pro Ala Gly Asp Asp Leu Arg Glu Gly Lys Arg Thr Tyr Leu Val Ala 260 265 270 Ala Ala Phe Gly Ala Leu Asp Ala Ala Gly Arg Ala Glu Leu Asp Ala 275 280 285 Ala Leu Gly Asp Pro Gly Leu Asp Glu Ala Gly Val Ala Arg Leu Arg 290 295 300 Thr Val Ile Arg Asp Ser Gly Ala Leu Ala Ala Thr Glu Ala Arg Ile 305 310 315 320 Asp Glu Leu Met Thr Ala Ser Ile Gly Ala Leu Asp Ala Ala Pro Ile 325 330 335 Asp Gln Asp Ala Arg Glu Val Leu Arg Arg Leu Ala Asp Ala Ala Thr 340 345 350 Arg Arg Ser Val 355 <210> 68 <211> 307 <212> PRT <213> Artificial Sequence <220> <223> >ACSP50_1635 <400> 68 Met Ser Leu Gly Leu Pro Ser Arg Leu Pro Gly Thr Pro Ser Ile Gly 1 5 10 15 Asp Leu Val Arg Gly Ala Ala Pro Thr Phe Ser Phe Glu Phe Phe Pro 20 25 30 Pro Lys Thr Pro Asp Gly Glu Arg Leu Leu Trp Gln Ala Ile Arg Glu 35 40 45 Leu Glu Ser Leu Arg Pro Ser Phe Val Ser Ile Thr Tyr Gly Ala Gly 50 55 60 Gly Thr Thr Arg Glu Thr Thr Val Ala Val Thr Glu Arg Val Ala Thr 65 70 75 80 Glu Thr Thr Leu Leu Pro Leu Ala His Leu Thr Ala Val Asp His Ser 85 90 95 Val Ala Asp Leu Arg Asn Val Ile Gly Arg Leu Ala Gly Ala Gly Ile 100 105 110 Arg Asn Val Leu Ala Leu Arg Gly Asp Pro Pro Gly Asp Pro Met Gly 115 120 125 Glu Trp Val Arg His Pro Asp Gly Val Gly Tyr Ala Asp Glu Leu Val 130 135 140 Arg Leu Ile Arg Glu Ser Gly Asp Phe Ser Val Gly Val Ala Ala Phe 145 150 155 160 Pro His Lys His Pro Arg Ser Ala Gly Val Lys Asp Asp Thr Arg Asn 165 170 175 Phe Val Arg Lys Cys Arg Ala Gly Ala Asp Tyr Ala Ile Thr Gln Met 180 185 190 Phe Phe Asp Ala Asp Glu Tyr Leu Arg Leu Arg Asp Arg Val Val Ala 195 200 205 Ala Gly Cys His Thr Pro Ile Val Ala Gly Val Met Pro Val Thr Arg 210 215 220 Met Ala Thr Ile Ala Arg Ser Thr Gln Leu Ser Gly Ala Pro Phe Pro 225 230 235 240 Pro Ala Leu Leu Arg Asp Phe Glu Arg Val Ala Gly Asp Asp Ala Ala 245 250 255 Val Arg Glu Leu Gly Ile Glu Thr Cys Ala Ala Met Cys Ala Arg Leu 260 265 270 Leu Arg Glu Gly Val Pro Gly Ile His Phe Ile Thr Met Asn Arg Ser 275 280 285 Thr Ala Thr Arg Glu Val Trp Gln Arg Leu Ala Pro Ala Glu Val Ala 290 295 300 Ala Ser Ala 305 <210> 69 <211> 310 <212> PRT <213> Artificial Sequence <220> <223> >ACSP50_1650 <400> 69 Met Gln Leu Gln Gln Leu Arg Tyr Phe Leu Ala Val Val Glu Thr Arg 1 5 10 15 His Phe Thr Gln Ala Ala Asp Ile Leu Gly Val Ser Gln Pro Thr Leu 20 25 30 Ser Lys Gln Ile His Thr Leu Glu Met Ser Leu Gly Ala Pro Leu Phe 35 40 45 Glu Arg Met Arg Gly Ala Val Thr Leu Thr Val Ala Gly Glu Thr Leu 50 55 60 Leu Pro Met Ala Gln Arg Ile Val Ala Asp Ala Asp Ala Ala Arg Asp 65 70 75 80 Ala Val Gln Asp Ile Val Gly Leu Arg Arg Gly Glu Val Arg Leu Gly 85 90 95 Ala Thr Pro Ser Leu Cys Ser Ser Leu Val Pro Ala Val Leu Arg Thr 100 105 110 Phe Arg Ala Asp His Pro Gly Val Lys Leu His Ile Ser Glu Gly Ser 115 120 125 Ser His Asp Leu Thr Ala Gly Leu Leu Ala His Thr Leu Asp Leu Ala 130 135 140 Leu Ile Val Gln Pro Glu His Gly Val Asp Pro Ala Leu Val Ala Ile 145 150 155 160 Glu Leu Leu Arg Glu Ser Leu Val Val Ala Ser Val Ala Ala Gly Pro 165 170 175 Pro Pro Thr Val Gly Arg Gln Leu Glu Leu Ser Glu Leu Arg His Thr 180 185 190 Pro Met Val Met Phe Arg Glu Gly Tyr Asp Ile Arg Glu Val Thr Leu 195 200 205 His Ala Cys Glu Arg Ala Gly Phe Ala Pro Lys Phe Ala Val Glu Gly 210 215 220 Gly Glu Met Asp Ala Val Leu Ala Phe Val Glu Ala Gly Leu Gly Val 225 230 235 240 Ala Leu Val Pro Ser Met Val Leu Ala Asn Arg Pro Leu Leu Arg Ala 245 250 255 Thr Pro Leu Ala Pro Pro Gly Met Arg Arg Thr Ile Ala Leu Ala Gln 260 265 270 Arg Arg Ala Ala Val Leu Pro His Ala Ala Ala Ala Leu Arg Glu Val 275 280 285 Val Leu Asp His Ile Gly Ser Gly Arg Leu Pro Phe Gly Val Arg Ala 290 295 300 Leu Glu Arg Pro Ser Thr 305 310 <210> 70 <211> 249 <212> PRT <213> Artificial Sequence <220> <223> >ACSP50_1651 <400> 70 Met Gly Glu Phe His Asp Pro Arg Leu Val Glu Val Tyr Asp Ala Glu 1 5 10 15 Cys Pro Trp Gly Trp Asp Asp Asp Phe Phe Met Ala Val Leu Ala Glu 20 25 30 Arg Ser Ala His Arg Val Ala Asp Leu Gly Cys Gly Thr Gly Arg Leu 35 40 45 Ala Ile Ala Met Ala Ala Ala Gly His Glu Val Ile Ala Ile Asp Pro 50 55 60 Ala Pro Ala Ala Leu Ala Ala Ala Arg Arg Lys Pro Gly Gly Thr Arg 65 70 75 80 Val Arg Trp Leu Gln Gly Ser Ala Glu Arg Leu Ala Pro Arg Ser Leu 85 90 95 Asp Ala Ala Phe Met Thr Gly His Val Ala Gln Ser Phe Val Asp Asp 100 105 110 Glu Glu Trp Asp Thr Val Leu Arg Gly Leu Arg Arg Ala Leu Val Pro 115 120 125 Glu Gly Arg Leu Val Phe Asp Ser Arg Asp Pro Asp Asp Arg Pro Trp 130 135 140 Gln Gln Trp Asn Pro Gln Asp Ser Trp Arg Thr Val Val Leu Asp Asp 145 150 155 160 Gly Arg Val Val Glu Ala Trp Ser Glu Ala Glu Gln Val Gly Leu Asn 165 170 175 Thr Val Arg Val Thr Gly Arg Tyr Arg Phe Ala Asp Gly Gly Glu Leu 180 185 190 Ala Asn Ser Ala Thr Leu Arg Phe Arg Thr Glu Pro Glu Leu Arg Asp 195 200 205 Ser Leu Arg Glu Ala Gly Phe Arg Val Glu Arg Ile Tyr Gly Gly Trp 210 215 220 Gly Arg Glu Pro Val Gly Leu Ser Gly Asp Gly Glu Phe Ile Val Ile 225 230 235 240 Ala Val Ala Thr Pro Arg Leu Met Ser 245 <210> 71 <211> 573 <212> PRT <213> Artificial Sequence <220> <223> >ACSP50_1652 <400> 71 Met Pro Glu Asn Glu Trp Pro Asp Asp Pro Arg Pro Pro Asp Gln Gly 1 5 10 15 Glu Trp Ser Gln Pro His His Glu Pro Pro Pro Gly Arg Gly Arg Ala 20 25 30 Leu Leu Ala Ala Ala Val Val Val Leu Val Leu Leu Ala Ala Gly Gly 35 40 45 Ile Ala Trp Arg Leu Met Ser Ser Arg Gly Ala Thr Pro Val Ala Gln 50 55 60 Pro Thr Ala Pro Ala Pro Thr Pro Thr Ala Gln Thr Ala Pro Pro Cys 65 70 75 80 Pro Gln Pro Arg Leu Arg Val Ala Ala Ala Pro Glu Ile Ala Pro Val 85 90 95 Ile Gln Gln Ala Ala Ala Ala Leu Ser Gln Pro Gly Gln Arg Cys Ser 100 105 110 Glu Val Leu Val Gln Ala Ala Glu Pro Gly Ala Ala Leu Thr Gly Lys 115 120 125 Pro Asp Val Trp Val Pro Ser Ser Ser Val Trp Leu Ala Leu Ala Lys 130 135 140 Ser Arg Gly Asp Val Tyr Thr Thr Gln Gly Ala Ser Leu Ala Trp Ser 145 150 155 160 Pro Leu Val Ile Ala Gly Pro Glu Ser Ile Ala Ser Leu Phe Ala Pro 165 170 175 Asn Gly Val Thr Ser Trp Ser Gly Leu Val Gln Gly Thr Ile Gln Lys 180 185 190 Arg Val Pro Ala Val Arg Met Pro Asp Pro Thr Leu Thr Thr Thr Gly 195 200 205 Leu Leu Ser Val Tyr Ala Val Gly Gln Ala Thr Val Lys Ala Asn Pro 210 215 220 Asp Ala Gly Ile Ala Gln Leu Gln Ala Leu Thr Leu Arg Ser Arg Leu 225 230 235 240 Glu Asn Ala Ala Ala Asp Pro Ala Glu Leu Phe Ala Gln Met Gly Lys 245 250 255 Gln Thr Asp Ala Ala Thr Ala Ile Tyr Gln Val Gly Val Phe Pro Thr 260 265 270 Thr Glu Gln Gln Leu Leu Thr Tyr Gln Lys Ser Gln His Asp Val Arg 275 280 285 Leu Ser Gly Ser Ala Pro Ala Asp Gly Gln Ile Asp Ala Asp Tyr Pro 290 295 300 Tyr Ala Val Arg Lys Gly Ala Pro Ala Asp Leu Val Glu Ser Leu Arg 305 310 315 320 Glu Ala Ile Thr Pro Asp Ala Leu Thr Thr Ala Gly Phe Arg Ala Thr 325 330 335 Ala Thr Lys Asn Ala Leu Arg Leu Pro Ala Pro Ala Val Leu Ala Gly 340 345 350 Ala Ala Arg Gln Trp Ser Ala Tyr Lys Ser Val Ala Phe Gln Val Leu 355 360 365 Leu Leu Ile Asp Ala Ser Gly Ser Met Asn Glu Lys Ile Thr Asp Arg 370 375 380 Ala Gly Arg Ser Val Thr Lys Ala Ala Leu Leu Arg Glu Ser Gly Thr 385 390 395 400 Ser Ala Ala Gln Leu Phe Gly Asp Asp Thr Ser Leu Gly Leu Trp Phe 405 410 415 Phe Gly Thr Pro Thr Ala Asp Ser Pro Ala His Thr Glu Glu Val Pro 420 425 430 Phe Gly Pro Val Ile Ala Thr Val Asp Gly Lys Ser Arg Arg Asp Leu 435 440 445 Leu Ala Ala Lys Ile Gly Glu Tyr Arg Pro Val Ala Asn Ala Gly Thr 450 455 460 Pro Leu Tyr Gln Ser Val Leu Asp Gly Val Ala Glu Met Arg Gly Arg 465 470 475 480 Ala Lys Pro Asp Thr Ala Thr Val Val Val Val Leu Thr Asp Gly Ser 485 490 495 Asp Gly Gly Thr Lys Tyr Arg Met Ser Asn Ala Asp Phe Leu Lys Lys 500 505 510 Leu Thr Ala Gly Ala Asp Pro Ala Lys Pro Val Pro Val Ile Ala Val 515 520 525 Gly Tyr Gly Pro Ala Ala Asn Ala Thr Ala Leu Gln Ala Met Ala Lys 530 535 540 Ala Thr Gly Gly Gln Ala Val Thr Val Lys Asn Pro Ala Asp Leu Ala 545 550 555 560 Ala Gly Ile Ala Gln Ala Phe Leu Ala Ala His Thr His 565 570 <210> 72 <211> 478 <212> PRT <213> Artificial Sequence <220> <223> >CrtD (ACSP50_1653) <400> 72 Met Ser Asp Ile Val Val Val Gly Ala Gly Val Gly Gly Leu Ala Ala 1 5 10 15 Ala Ile Arg Leu Ala Glu Ala Gly His Arg Val Ser Ile His Glu Arg 20 25 30 Ser Gly Val Val Gly Gly Lys Leu Ala Ala Tyr Glu Arg Asp Gly Tyr 35 40 45 Arg Phe Asp Thr Gly Pro Ser Leu Leu Thr Leu Pro Asp Val Phe Thr 50 55 60 Gly Leu Gly Leu Asp Leu Arg Pro Glu Pro Leu Asp Pro Val Val Arg 65 70 75 80 His Phe Phe Pro Asp Gly Thr Val Leu Asp Ser Ser Ser Asp His Glu 85 90 95 Thr Phe Leu Ala Arg Ile Thr Asp Ala Leu Gly Gly Ala Ala Ala Arg 100 105 110 Asp Trp Asp Arg Phe Trp Arg Arg Ala Glu Arg Ile Trp His Ala Ser 115 120 125 Trp Glu Ser Val Leu Arg Arg Pro Val Thr Ala Ala Ser Leu Ala Arg 130 135 140 Leu Ser Trp Arg Leu Gly Asp Leu Ala Ala Ile Ala Pro Gly Arg Ser 145 150 155 160 Leu Arg Ser Leu Gly Arg Arg Tyr Leu Arg Asp Pro Arg Leu Arg Met 165 170 175 Leu Leu Asp Arg Tyr Ala Thr Tyr Ser Gly Ala Asp Pro Arg Arg Ala 180 185 190 Pro Ala Ala Leu Ala Ala Ile Pro Tyr Ala Glu Leu Ala Phe Gly Gly 195 200 205 Trp Tyr Leu Pro Gly Gly Leu Val Thr Leu Ala Glu Ala Leu Leu Ala 210 215 220 Arg Cys Glu Lys Leu Gly Val Arg Val His Leu His Ser Pro Val Ala 225 230 235 240 Ser Ile Ala Thr Thr Gly Ala Arg Val Ser Gly Val Arg Leu Gly Asp 245 250 255 Gly Thr Arg Leu Ala Ala Asp Val Val Val Ser Asn Val Asp Ala Val 260 265 270 Thr Leu Tyr Arg Asp Leu Leu Pro Ser Pro Lys Pro Leu Ala Arg Leu 275 280 285 Ala Asp Arg Ser Leu Ala Gly Phe Val Leu Leu Leu Ala Val Arg Gly 290 295 300 Glu Thr Pro Arg Leu Ala His His Asn Val Phe Phe Pro Arg Asp Tyr 305 310 315 320 Asp Ala Glu Phe Asp Ala Val Phe Gly Gly Pro Gly Arg Arg Ala Arg 325 330 335 Pro Ala Gly Asp Pro Thr Val Phe Val Thr Arg Ala Ala Asp Pro Ala 340 345 350 Val Arg Pro Ala Gly Asp Glu Ala Trp Phe Val Leu Val Asn Ala Ala 355 360 365 Pro His Gly Thr Ser Trp Ser Thr Val Asp Trp Leu Arg Ala Gly Leu 370 375 380 Ala Asp Ala Tyr Arg Asp Arg Val Leu Glu Val Leu Ala Gly Arg Gly 385 390 395 400 Leu Asp Val Arg Asp Arg Leu Ile Phe Ala Glu Thr Arg Thr Pro Ala 405 410 415 Asp Leu Ala Ala Ser Ala Ala Ala Pro Gly Gly Ala Ile Tyr Gly Thr 420 425 430 Ala Gly Gly Leu Val Arg Pro Ala Asn Arg Ala Pro Val Asp Gly Leu 435 440 445 Phe Leu Val Gly Gly Ser Thr His Pro Gly Gly Gly Leu Pro Met Val 450 455 460 Thr Leu Ser Ala Glu Ile Val Ala Gly Met Ile Gly Ser Asn 465 470 475 <210> 73 <211> 359 <212> PRT <213> Artificial Sequence <220> <223> >CruC (ACSP50_1654) <400> 73 Met Ile Val Ala Trp Leu Ile Leu Pro Pro Leu Leu Leu Ile Thr Ala 1 5 10 15 His Thr Ala Val Asn Ala Leu Leu Leu Arg Arg Pro Arg Arg Ala Ala 20 25 30 Thr Ser Thr Glu Arg Val Ala Val Leu Leu Pro Leu Arg Asp Glu Ala 35 40 45 Thr Arg Val Thr Pro Cys Leu Arg Ala Leu Leu Ala Gln Arg Gly Val 50 55 60 Ala Asp Leu Thr Val His Val Leu Asp Asp Gly Ser Thr Asp Gly Thr 65 70 75 80 Ala Asp Val Val Arg Ala Val Ala Gly Asp Arg Val Arg Leu His Thr 85 90 95 Gly Thr Pro Pro Pro Pro Gly Trp Leu Gly Lys Pro Ala Ala Cys Gln 100 105 110 Arg Leu Ala Asp Leu Ala Gly Asp Val Asp Val Leu Val Phe Val Asp 115 120 125 Ala Asp Val Val Leu Ala Pro Asp Ala Val Ala Gly Ala Val Asp Leu 130 135 140 Leu Arg Arg Ala Gly Ala Asp Leu Leu Ser Pro Tyr Pro Lys Ile Val 145 150 155 160 Gly Ala Gly Arg Leu Val Gln Pro Leu Leu Gln Trp Ser Trp Leu Ser 165 170 175 Phe Leu Pro Leu Arg Ala Met Glu Arg Ser Ala Arg Pro Ser Leu Ala 180 185 190 Ala Ala Gly Gly Gln Trp Leu Val Leu Asp Arg Ala Gly Tyr Arg Arg 195 200 205 Ala Gly Gly His Ala Ala Val Arg Gly Glu Ile Leu Glu Asp Ile Ala 210 215 220 Leu Ala Arg Ala Val Lys Arg Ala Gly Gly Arg Ile Ala Leu Ala Asp 225 230 235 240 Gly Ser Gly Leu Ala Thr Cys Arg Met Tyr Glu Ser Trp Asp Glu Leu 245 250 255 Ala Asp Gly Tyr Ala Lys Ser Leu Trp Ala Ser Leu Gly Ser Ala Ala 260 265 270 Gly Ala Thr Ala Val Thr Leu Leu Leu Ile Leu Leu Tyr Val Val Pro 275 280 285 Pro Leu Leu Ala Pro Phe Ala Pro Leu Pro Ala Val Leu Gly Tyr Leu 290 295 300 Leu Gly Val Thr Gly Arg Met Ile Ala Ala Arg Ala Thr Gly Gly Arg 305 310 315 320 Val Leu Pro Gly Thr Leu Ala His Pro Val Ser Ile Val Leu Phe Gly 325 330 335 Tyr Leu Ile Ala Arg Ser Phe Arg Leu Arg Arg Ala Gly Arg Leu Ala 340 345 350 Trp Arg Gly Arg Pro Val Pro 355 <210> 74 <211> 251 <212> PRT <213> Artificial Sequence <220> <223> >CruF (ACSP50_1655) <400> 74 Met Ser Pro Arg His Leu Pro Trp Gly Leu Leu Gly Ala Leu Val Leu 1 5 10 15 Ala Gln Ile Cys Tyr Pro Leu Thr Glu Gly Asp Thr Arg Ala Gly Leu 20 25 30 Thr Val Leu Thr Val Leu Leu Gly Val Ala Phe Ser Leu Ser His Ala 35 40 45 Leu Leu Thr Arg Gly Pro Arg Ala Leu Thr Ala Leu Leu Ser Thr Ala 50 55 60 Thr Leu Gly Gly Phe Ala Val Glu Ala Ile Gly Val Ala Thr Gly Phe 65 70 75 80 Pro Phe Gly Ser Tyr Glu Tyr Ser Gly Arg Leu Gly Pro Arg Leu Leu 85 90 95 Gly Val Pro Leu Ile Ile Pro Leu Ala Trp Thr Trp Met Ala Trp Pro 100 105 110 Ala Trp Leu Ala Ala Leu Arg Val Thr Arg Arg Arg Leu Pro Arg Ile 115 120 125 Leu Val Ala Gly Ala Gly Leu Ala Ala Trp Asp Val Phe Leu Asp Pro 130 135 140 Gln Met Val Ala Glu Asp Tyr Trp Arg Trp Arg His Pro Val Pro Ala 145 150 155 160 Leu Pro Gly Val Pro Gly Val Pro Leu Gly Asn Tyr Leu Gly Trp Leu 165 170 175 Gly Phe Ala Leu Leu Leu Met Thr Ala Leu Ala Ala Val Ala Gly Arg 180 185 190 Ala Ala Asp Arg Pro Leu Ser Ala Asp Arg Pro Ala Leu Ala Leu Trp 195 200 205 Ile Trp Thr Tyr Ala Ser Ser Val Leu Ala His Ala Val Phe Leu Ser 210 215 220 Leu Pro Ala Ser Ala Ala Trp Gly Ala Leu Ile Met Gly Ala Ala Val 225 230 235 240 Leu Pro Leu Leu Ala Arg Leu Arg Ala Pro Ala 245 250 <210> 75 <211> 192 <212> PRT <213> Artificial Sequence <220> <223> >ACSP50_1656 <400> 75 Met Arg Leu Val Ala Trp Gln Pro Asp Asp Leu Leu Arg Arg Leu Asp 1 5 10 15 Asp Val Val Gly Val Tyr Gly Glu Ala Met Gly Tyr Arg Gln Glu Leu 20 25 30 Leu Gln Thr Arg Arg Gly Tyr Ile Gly Ser His Val Arg Arg Pro Gly 35 40 45 Phe Arg Ala Val Ala Thr Leu Thr Thr Glu Gly Arg Leu Met Gly Phe 50 55 60 Gly Tyr Gly Tyr Thr Ser Ala Ala Gly Gln Trp Trp His Asp Gln Val 65 70 75 80 Arg Phe Ala Leu Gly Glu Asp Asp Arg Arg Gln Trp Leu Thr Asp Cys 85 90 95 Phe Glu Val Val Glu Leu His Val Arg Pro Ala Ala Gln Gly His Gly 100 105 110 Val Gly Ala Arg Gln Leu Arg Ala Leu Leu Ala Met Ala Lys Gly Arg 115 120 125 Thr Val Leu Leu Ser Thr Pro Glu Ala Asp Glu Gln Ala Ser Arg Ala 130 135 140 Trp Arg Leu Tyr Arg Arg Tyr Gly Phe Ala Asp Val Leu Arg His Phe 145 150 155 160 Tyr Phe Pro Gly Asp Glu Arg Ala Phe Ala Val Leu Gly Arg Glu Leu 165 170 175 Pro Leu Ala Glu Arg Pro Leu Glu Asp Ala Pro Gly Ile Ala Gly Ala 180 185 190 <210> 76 <211> 224 <212> PRT <213> Artificial Sequence <220> <223> >ACSP50_1657 <400> 76 Met Thr His Val Ala Leu His Val Trp Arg Val Pro Arg Ser Ala Val 1 5 10 15 Gly Ser Ala Met Leu Arg Met Ala Phe Ala Arg Arg His Leu Ala Gly 20 25 30 Leu Arg Phe Gly Lys Phe Leu Gly Thr Gly Thr Gly Thr Gly Phe Gly 35 40 45 Pro Gly Asp Thr Asp Leu Thr Arg Trp Ala Ala Ile Thr Val Ser Asp 50 55 60 Ala Pro Val Arg Phe Pro Val Trp Glu Arg Ile Ala Val Asn Gly Ala 65 70 75 80 Arg Ile Asp Leu Glu Pro Leu Ile Ser Arg Gly Thr Trp Ala Gly Arg 85 90 95 Thr Pro Phe Glu Pro Thr Gly Arg Arg Pro Asp Gly Pro Val Leu Ala 100 105 110 Leu Thr Arg Ala Arg Leu Arg Pro Ala Arg Ala Leu Thr Phe Trp Arg 115 120 125 Ala Val Pro Ala Val Val Arg Glu Val His Arg Ala Pro Gly Leu Leu 130 135 140 Ala Arg Phe Gly Val Gly Glu Ala Pro Ile Gly Trp Gln Gly Thr Val 145 150 155 160 Thr Val Trp Arg Asp Ala Ala Asp Leu Val Ala Phe Ala Tyr Arg Gln 165 170 175 Pro Glu His Arg Ala Ala Ile Ala Arg Thr Pro Ala Asp Arg Trp Tyr 180 185 190 Ala Glu Glu Leu Phe Ala Arg Phe Ala Val Leu Gly Ile Ser Gly Asp 195 200 205 Arg Ser Val Leu Gly Trp Thr Ala Asp Glu Gly Glu Arg Ala Glu Ala 210 215 220 <210> 77 <211> 271 <212> PRT <213> Artificial Sequence <220> <223> >ACSP50_1658 <400> 77 Met Thr Gln Thr Ile Val Ile Thr Gly Ala Ser Ser Gly Val Gly Leu 1 5 10 15 Ala Ala Ala Glu Gln Leu Ala Ala Arg Gly Asp Glu Val Val Leu Val 20 25 30 Gly Arg Asp Pro Gly Arg Leu Asp Ala Ala Val Gln Arg Val Arg Glu 35 40 45 Ala Gly Gly Gly Arg Ala Pro Arg His Phe Arg Ala Asp Phe Glu Arg 50 55 60 Leu Asp Asp Val Arg Glu Leu Ala Ala Gly Leu Leu Ala Glu Leu Pro 65 70 75 80 Arg Ile Asp Val Leu Ala Asn Asn Ala Gly Gly Ile Ile Lys Arg Pro 85 90 95 Arg Gln Thr Val Asp Gly His Glu Ala Thr Ile Gln Gly Asn His Leu 100 105 110 Ala Pro Phe Leu Leu Thr His Leu Leu Arg Glu Arg Leu Thr Gly Gly 115 120 125 Arg Val Val Asn Thr Ala Ser Ala Ala His Val Gln Gly Arg Pro Gly 130 135 140 Thr Arg Phe Thr Asp Asp Pro Lys Ser Tyr Ser Pro Trp Arg Ser Tyr 145 150 155 160 Gly Ala Ser Lys Ala Ala Asn Ile Leu Phe Ala Ala Glu Ala Ala Arg 165 170 175 Arg Trp Pro Asp Val Cys Ser Val Ser Phe His Pro Gly Val Val Arg 180 185 190 Thr Asn Phe Gly Glu Gly Arg Leu Ile Arg Leu Phe Tyr Arg Tyr Ala 195 200 205 Pro Gly Leu Val Thr Pro Glu Ala Ala Gly Glu Leu Leu Thr Trp Leu 210 215 220 Cys Thr Thr Pro Ala Gly Glu Leu Glu Asn Gly Ala Tyr Tyr Val Lys 225 230 235 240 Arg Gln Val Thr Arg Pro Ala Ala His Ala Arg Asp Pro Arg Leu Ala 245 250 255 Ala Glu Leu Trp Asp Ala Ser Leu Thr Ala Thr Gly Leu Ala Gly 260 265 270 <210> 78 <211> 339 <212> PRT <213> Artificial Sequence <220> <223> >CrtE (ACSP50_3873) <400> 78 Met Ile Asp Asp Phe Leu Ser Ala Gln Arg Asp Val Leu Ala Glu Val 1 5 10 15 Ser Asp Asp Cys Ala Pro Leu Glu Arg Tyr Val Ala Asp Leu Met Gly 20 25 30 Gly Gly Lys Arg Leu Arg Pro Ala Phe Cys Tyr Trp Ala Trp Arg Ala 35 40 45 Ala Gly Ala Pro Asp Gly Pro Gly Ile Val Ala Ala Ala Thr Ser Leu 50 55 60 Glu Phe Leu Gln Ala Ala Ala Leu Ile His Asp Asp Ile Met Asp Asp 65 70 75 80 Ser Asp Thr Arg Arg Gly Ala Pro Ala Val His Arg Arg Leu Ala Ala 85 90 95 Leu His Ser Gly Gly Arg Trp Ala Gly Asp Ala Asp His Phe Gly Leu 100 105 110 Ser Ala Ala Val Leu Ala Gly Asp Leu Cys Leu Thr Trp Ser Asp Ala 115 120 125 Leu Tyr Ser Gly Ser Gly Leu His Pro Ser Ala Leu Ala Arg Gly Arg 130 135 140 Pro Val Phe Asp Arg Met Arg Thr Gln Leu Met Gly Gly Gln Tyr Leu 145 150 155 160 Asp Leu Leu Asp Gln Ala Arg Pro Ser Arg Gly Gly Val Asp Arg Ala 165 170 175 Arg Arg Val Val His Phe Lys Ser Ala Lys Tyr Thr Val Glu His Pro 180 185 190 Leu Leu Leu Gly Ala Arg Leu Ala Gly Ala Asp Asp Asp Leu Leu Ala 195 200 205 Arg Leu Ser Ala Phe Gly Leu Pro Leu Gly Glu Ala Phe Gln Leu Arg 210 215 220 Asp Asp Leu Leu Gly Val Phe Gly Asp Ala Ala Gln Thr Gly Lys Pro 225 230 235 240 Thr Gly Asp Asp Leu Arg Glu Gly Lys Arg Thr Thr Leu Val Ile Leu 245 250 255 Ala Ala Asp Arg Ala Thr Ala Pro Gln Gln Ala Ala Leu Thr Ala Leu 260 265 270 Leu Gly Asp Arg Gly Leu Thr Gly Ala Gly Val Asp Thr Leu Arg Gln 275 280 285 Ile Ile Val Asp Thr Gly Ala Arg Ala Glu Val Glu Arg Met Ile Glu 290 295 300 Gln Leu Leu Ala Thr Ser Leu Gly Val Leu Ser Gly Thr Pro Val Asp 305 310 315 320 Glu Ala Ala Arg Ser Val Leu Leu Ala Leu Ala Glu Ala Ala Thr Ala 325 330 335 Arg Ser Ser <210> 79 <211> 342 <212> PRT <213> Artificial Sequence <220> <223> >ACSP50_1950 <400> 79 Met Val Ser Thr Val Ile Ala Ser Gly Pro Thr Gly Leu Gly Thr Ser 1 5 10 15 Ala Ala Arg Leu Phe Gly Arg Val Asp Arg Asp Glu Pro Glu Leu Phe 20 25 30 Cys Pro Ala Pro Leu Arg Asp Asp Arg Ala Leu Gly Glu Arg Val Asn 35 40 45 Asp Ala Val Val Gln Trp Ala Glu Lys Ala Gly Ile Tyr Pro Gly Arg 50 55 60 Leu Asp Lys Leu Arg Gly Ala Asn Phe Gly Arg Phe Met Met Leu Ala 65 70 75 80 His Pro Ala Thr Ser Asp Pro Asp Arg Leu Leu Ala Ala Thr Lys Cys 85 90 95 Leu Val Ala Glu Trp Ala Ala Asp Asp Tyr Tyr Val Asp Glu Val Ser 100 105 110 Leu Gly Ala Asp Pro Met Val Val Gly Ser Arg Leu Ala Asn Leu Tyr 115 120 125 Ser Val Val Asp Pro Ala Ser Leu Thr Pro Arg Tyr Gln Ala Asp Phe 130 135 140 Glu Lys His His Arg Leu Gln Pro Ile Ser Val Ala Phe Arg Thr Ala 145 150 155 160 Met Glu His Leu Ala Glu Tyr Ala Ser Val Thr Gln Leu Ala Arg Phe 165 170 175 Gln His Gln Met Ala Ile Leu Phe Val Ala Trp Ser Gln Glu Ala Asp 180 185 190 Trp His Ala Asn Arg Arg Thr Pro Pro Val Trp Glu Tyr Leu Val Gln 195 200 205 Arg His Leu Asn Ser Tyr Leu Pro Pro Met Ile Leu Val Asp Val Leu 210 215 220 Ala Gly Tyr Glu Leu Ser Pro Ala Glu Phe Phe Asp Pro Arg Val Arg 225 230 235 240 Ala Ala Phe Thr Thr Ala Gly Asn Ala Ala Val Leu Val Asn Asp Leu 245 250 255 Tyr Ser Gly Arg Asn Glu Ser Glu Thr Asp His Asn Leu Pro Thr Val 260 265 270 Leu Val Ser Gly Glu Arg Leu Thr Pro Arg Ala Ala Val Arg Arg Thr 275 280 285 Val Glu Ile His Asn Glu Leu Met His Thr Phe Val Thr Ser Ala Ala 290 295 300 Ser Leu Ser Ala Ser Gly Ser Pro Gln Leu Arg Arg Phe Leu Ala Asp 305 310 315 320 Thr Trp Ala Trp Leu Gly Gly Ser Arg Glu Trp His Ala Thr Ser Gly 325 330 335 Arg Tyr His Ser Ser Asn 340 <210> 80 <211> 447 <212> PRT <213> Artificial Sequence <220> <223> >ACSP50_5522 <400> 80 Met Thr Thr Thr Ala Pro Thr Pro Ala His Leu Ala Gly Asn Phe Ala 1 5 10 15 Pro Val Thr Gly Glu Thr Thr Thr Leu Asp Leu Pro Val Thr Gly Ala 20 25 30 Val Pro Ala Glu Leu Thr Gly Trp Tyr Leu Arg Asn Gly Pro Asn Pro 35 40 45 His His Gly Thr Ser Ala His Trp Phe Leu Gly Asp Gly Met Val His 50 55 60 Gly Val Arg Leu Asp His Gly Arg Ala Thr Trp Tyr Arg Asn Arg Trp 65 70 75 80 Val Arg Thr Arg Val Leu Thr Asp Asp Ala Arg Ala Tyr Gly Pro Asp 85 90 95 Gly Thr Arg Asp Leu Thr Ala Gly Pro Ala Asn Thr Asn Val Val Arg 100 105 110 His Gly Gly Arg Leu Leu Ala Leu Val Glu Ser Ala Leu Pro Tyr Glu 115 120 125 Ile Thr Thr Asp Leu Glu Thr Val Gly Pro Tyr Asp Phe Gly Gly Arg 130 135 140 Leu His Thr Pro Met Thr Ala His Pro Lys Val Cys Pro Thr Thr Gly 145 150 155 160 Glu Met His Phe Phe Gly Tyr Gly Gly Leu Glu Pro Pro Tyr Leu Thr 165 170 175 Tyr His Arg Ala Gly Ala Asp Gly Arg Leu Ser Leu Ser Arg Pro Ile 180 185 190 Asp Val Pro Ala His Thr Met Met His Asp Phe Ser Leu Thr Ala Ala 195 200 205 His Val Ile Phe Met Asp Leu Pro Val Leu Phe Ser Leu Asp Gly Ala 210 215 220 Arg Thr Gly Gly Met Pro Tyr Arg Trp Asp Asp Thr Tyr Gln Ala Arg 225 230 235 240 Leu Gly Val Leu Arg Arg Asp Ala Pro Gln Gly Glu Val Arg Trp Tyr 245 250 255 Thr Ile Asp Pro Gly Tyr Val Phe His Thr Leu Asn Ala His Asp Asp 260 265 270 Gly Asp Arg Ile Val Met His Val Val Arg His Glu His Ala Tyr Arg 275 280 285 Pro Gly Gln Pro Ala Ala Ala Pro Asp Leu Trp Arg Trp Thr Ile Asp 290 295 300 Gln Arg Thr Gly Arg Val Ala Glu Glu Arg Leu Asp Asp Glu Ala Val 305 310 315 320 Glu Phe Pro Arg Ile Asp Asp Arg Arg Thr Gly Gln Pro Ala Arg Tyr 325 330 335 Gly Phe Ala Val Thr Asp Asn Val Pro Arg Arg Leu Ala Asp Val Ser 340 345 350 Ala Val Ile Arg Tyr Asp Leu His Thr Gly Ser Thr Thr Arg His Arg 355 360 365 Leu Pro Thr Gly Gln Val Pro Gly Glu Ala Val Phe Val Pro Ala Gly 370 375 380 Gly Ala Pro Ala Gly Ser Ala Asp Gly Trp Leu Leu Thr Phe Ala Tyr 385 390 395 400 Asp Pro Gly Arg Asp Ala Ser Asp Leu Ile Ile Ile Asp Ala Thr Asp 405 410 415 Leu Ala Ala Pro Pro Leu Ala Arg Ile His Leu Pro His Arg Val Pro 420 425 430 Phe Gly Phe His Gly Asn Trp Leu Pro Asp His Asp Arg Ala Glu 435 440 445 <210> 81 <211> 103 <212> DNA <213> Artificial Sequence <220> <223> >tipA promoter <400> 81 atccctagaa cgtccgggct tgcacctcac gtcacgtgag gaggcagcgt ggacggcgtg 60 gtaccaagct tattggcact agtcgagcaa cggaggtatt ccg 103 <210> 82 <211> 209 <212> DNA <213> Artificial Sequence <220> <223> >gapDH promoter <400> 82 gtactggccg atgctgggag aagcgcgctg ctgtacggcg cgcaccgggt gcggagcccc 60 tcggcgagcg gtgtgaaact tctgtgaatg gcctgttcgg ttgctttttt tatacggctg 120 ccagataagg cttgcagcat ctgggcggct accgctatga tcggggcgtt cctgcaattc 180 ttagtgcgag tatctgaaag gggatacgc 209 <210> 83 <211> 460 <212> DNA <213> Artificial Sequence <220> <223> >lacZ? promoter and gene <400> 83 taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 60 tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgacatgat 120 tacgaattcg atatcgcgcg cggccgcgga tcctctagag tcgacctgca gcccaagctt 180 ggcactggcc gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa 240 tcgccttgca gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga 300 tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg cgcctgatgc ggtattttct 360 ccttacgcat ctgtgcggta tttcacaccg cataaattcc ccaatgtcaa gcacttccgg 420 aatcgggagc gcggccgatg caaagtgccg atcaacataa 460 <210> 84 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> >T4 terminator <400> 84 aagctttatg cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct 60 agggtcccca attaattagt aatataatct attaaaggtc attcaaaagg tcatcca 117 <210> 85 <211> 1818 <212> DNA <213> Artificial Sequence <220> <223> >PhiC31 integrase gene <400> 85 gtggacacgt acgcgggtgc ttacgaccgt cagtcgcgcg agcgcgagaa ttcgagcgca 60 gcaagcccag cgacacagcg tagcgccaac gaagacaagg cggccgacct tcagcgcgaa 120 gtcgagcgcg acgggggccg gttcaggttc gtcgggcatt tcagcgaagc gccgggcacg 180 tcggcgttcg ggacggcgga gcgcccggag ttcgaacgca tcctgaacga atgccgcgcc 240 gggcggctca acatgatcat tgtctatgac gtgtcgcgct tctcgcgcct gaaggtcatg 300 gacgcgattc cgattgtctc ggaattgctc gccctgggcg tgacgattgt ttccactcag 360 gaaggcgtct tccggcaggg aaacgtcatg gacctgattc acctgattat gcggctcgac 420 gcgtcgcaca aagaatcttc gctgaagtcg gcgaagattc tcgacacgaa gaaccttcag 480 cgcgaattgg gcgggtacgt cggcgggaag gcgccttacg gcttcgagct tgtttcggag 540 acgaaggaga tcacgcgcaa cggccgaatg gtcaatgtcg tcatcaacaa gcttgcgcac 600 tcgaccactc cccttaccgg acccttcgag ttcgagcccg acgtaatccg gtggtggtgg 660 cgtgagatca agacgcacaa acaccttccc ttcaagccgg gcagtcaagc cgccattcac 720 ccgggcagca tcacggggct ttgtaagcgc atggacgctg acgccgtgcc gacccggggc 780 gagacgattg ggaagaagac cgcttcaagc gcctgggacc cggcaaccgt tatgcgaatc 840 cttcgggacc cgcgtattgc gggcttcgcc gctgaggtga tctacaagaa gaagccggac 900 ggcacgccga ccacgaagat tgagggttac cgcattcagc gcgacccgat cacgctccgg 960 ccggtcgagc ttgattgcgg accgatcatc gagcccgctg agtggtatga gcttcaggcg 1020 tggttggacg gcagggggcg cggcaagggg ctttcccggg ggcaagccat tctgtccgcc 1080 atggacaagc tgtactgcga gtgtggcgcc gtcatgactt cgaagcgcgg ggaagaatcg 1140 atcaaggact cttaccgctg ccgtcgccgg aaggtggtcg acccgtccgc acctgggcag 1200 cacgaaggca cgtgcaacgt cagcatggcg gcactcgaca agttcgttgc ggaacgcatc 1260 ttcaacaaga tcaggcacgc cgaaggcgac gaagagacgt tggcgcttct gtgggaagcc 1320 gcccgacgct tcggcaagct cactgaggcg cctgagaaga gcggcgaacg ggcgaacctt 1380 gttgcggagc gcgccgacgc cctgaacgcc cttgaagagc tgtacgaaga ccgcgcggca 1440 ggcgcgtacg acggacccgt tggcaggaag cacttccgga agcaacaggc agcgctgacg 1500 ctccggcagc aaggggcgga agagcggctt gccgaacttg aagccgccga agccccgaag 1560 cttccccttg accaatggtt ccccgaagac gccgacgctg acccgaccgg ccctaagtcg 1620 tggtgggggc gcgcgtcagt agacgacaag cgcgtgttcg tcgggctctt cgtagacaag 1680 atcgttgtca cgaagtcgac tacgggcagg gggcagggaa cgcccatcga gaagcgcgct 1740 tcgatcacgt gggcgaagcc gccgaccgac gacgacgaag acgacgccca ggacggcacg 1800 gaagacgtag cggcgtag 1818 <210> 86 <211> 100 <212> DNA <213> Artificial Sequence <220> <223> >PhiC31 attachment site <400> 86 cccaggtcag aagcggtttt cgggagtagt gccccaactg gggtaacctt tgagttctct 60 cagttggggg cgtagggtcg ccgacatgac acaaggggtt 100 <210> 87 <211> 110 <212> DNA <213> Artificial Sequence <220> <223> >incP <400> 87 ccggccagcc tcgcagagca ggattcccgt tgagcaccgc caggtgcgaa taagggacag 60 tgaagaagga acacccgctc gcgggtgggc ctacttcacc tatcctgccc 110 <210> 88 <211> 372 <212> DNA <213> Artificial Sequence <220> <223> >traJ <400> 88 atggctgatg aaaccaagcc aaccaggaag ggcagcccac ctatcaaggt gtactgcctt 60 ccagacgaac gaagagcgat tgaggaaaag gcggcggcgg ccggcatgag cctgtcggcc 120 tacctgctgg ccgtcggcca gggctacaaa atcacgggcg tcgtggacta tgagcacgtc 180 cgcgagctgg cccgcatcaa tggcgacctg ggccgcctgg gcggcctgct gaaactctgg 240 ctcaccgacg acccgcgcac ggcgcggttc ggtgatgcca cgatcctcgc cctgctggcg 300 aagatcgaag agaagcagga cgagcttggc aaggtcatga tgggcgtggt ccgcccgagg 360 gcagagccat ga 372 <210> 89 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> >ColE1/pMB1/pBR322/pUC ori <400> 89 ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 60 agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 120 cagcagagcg cagataccaa atactgttct tctagtgtag ccgtagttag gccaccactt 180 caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 240 tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 300 ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 360 ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 420 gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 480 gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 540 tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaa 589 <210> 90 <211> 777 <212> DNA <213> Artificial Sequence <220> <223> > aac(3)IV <400> 90 gtgcaatacg aatggcgaaa agccgagctc atcggtcagc ttctcaacct tggggttacc 60 cccggcggtg tgctgctggt ccacagctcc ttccgtagcg tccggcccct cgaagatggg 120 ccacttggac tgatcgaggc cctgcgtgct gcgctgggtc cgggagggac gctcgtcatg 180 ccctcgtggt caggtctgga cgacgagccg ttcgatcctg ccacgtcgcc cgttacaccg 240 gaccttggag ttgtctctga cacattctgg cgcctgccaa atgtaaagcg cagcgcccat 300 ccatttgcct ttgcggcagc ggggccacag gcagagcaga tcatctctga tccattgccc 360 ctgccacctc actcgcctgc aagcccggtc gcccgtgtcc atgaactcga tgggcaggta 420 cttctcctcg gcgtgggaca cgatgccaac acgacgctgc atcttgccga gttgatggca 480 aaggttccct atggggtgcc gagacactgc accattcttc aggatggcaa gttggtacgc 540 gtcgattatc tcgagaatga ccactgctgt gagcgctttg ccttggcgga caggtggctc 600 aaggagaaga gccttcagaa ggaaggtcca gtcggtcatg cctttgctcg gttgatccgc 660 tcccgcgaca ttgtggcgac agccctgggt caactgggcc gagatccgtt gatcttcctg 720 catccgccag aggcgggatg cgaagaatgc gatgccgctc gccagtcgat tggctga 777 <210> 91 <211> 582 <212> DNA <213> Artificial Sequence <220> <223> >cgt promoter <400> 91 gcccggccct gtcgagctga cggctgtccc gcggcctcgt catcggtgct gtcgagcagg 60 ctgtcgcctg gtaggaagat tgccatggtc cagatggacc ccctcagcgc acgtcccgat 120 ggacgacgtt ccgtcttgtc gacgactccg agccgcccga cccaccgggc ctgagcgcgc 180 ccgatcacgg ctccccggcc tgacgggttc tgcacctccg gcggctttcc cgaggacggc 240 gtggtggtcg gtgacggctg ctggacctcc tccggtgggc aagcgtttcg gtgaggtggg 300 cagcccggct gcgggcacat cgggggcgga gagacgctta ggtttattgc aagttctttc 360 ttcggtggcg cggcgtgtca tcagcagccg attgtggcat tctggtgacg cattgacgca 420 ggtcacagat ttgttgggat aggcaacgaa caattcctaa atcgcctatt cggacaaata 480 ggcttgacct gacgacgctg tcccaccact gtggatgacg cctaccgcgc aagttctgga 540 agtacttgca atcagcggtg aggatcatca aaggggactg tc 582 <210> 92 <211> 115 <212> DNA <213> Artificial Sequence <220> <223> >efp promoter <400> 92 tggagcacat ctgccggtag acccgattcg ccctcaccag cgaatcgccg gtaaagtggt 60 tcggtcaacg attcgagtca agatcaaggc aggacatggc ttccaccaac gacct 115 <210> 93 <211> 372 <212> DNA <213> Artificial Sequence <220> <223> >rpsJ promoter <400> 93 attgcgggtt gtcgccggtg agagccggtg acaaccccca ccggtgaccc cgattagcaa 60 tgctgcgttc aatcgggcat actagtcagg ttgcgtccgc gcggggtggg tggctggcgt 120 tcgtcagccg cccaccctcg ccgggtgtcc gggtgtgttt ccagccgccc ggcgccctca 180 gatccccgcg atcgcgttcg tccccggcaa gatcggggat ggaggccgaa agctgagtgc 240 ccagcactct gtgacgaggc gcgacacgcc cgaccgcggg ggtcggacaa cgcaggatca 300 acggtcctgc gggcatgtgg gggccaccgc ctccgcacgt agcggcatcg agagaaggaa 360 acagaagcca cc 372 <210> 94 <211> 264 <212> DNA <213> Artificial Sequence <220> <223> >katE promoter <400> 94 atctcgggct cggtaggcat caggcactcg tttcgtcggg ctctcgtgac agtgaccttg 60 atactggagg ggtacgacaa aaccgggacc gccaccgacg tccggaccga cccgatcgtc 120 ggccacgaac agggccggat ggtcgtcgtg acgcgtccgc gagacgccgt ccgggccggg 180 ccgatgctcg gccggaccgt ttgccggggt tcatgcgggg tatccgccat ccgatcacat 240 acccttatcg aggagtttgt ccgg 264 <210> 95 <211> 470 <212> DNA <213> Artificial Sequence <220> <223> >moeE5 promoter <400> 95 agggcgccac cagctggagc cccatccccg cggggaccag gagggcgagc agcgccacgg 60 cggtccgttc accgcgcagg tagcggacaa acgtggagag atgccgcaac ggactgtctg 120 ccaacgcgcc cctcccccgt tcgcccggcg gcgagcggcc agcataaagt cctgtgcgcc 180 tccttgtgaa tgacgcctcg tcaacggcgg ccggagcacg ccctttctgc gggaagccga 240 tagcggacgc cgctccggga gggggcgaag cacaccattg ctcgtgattg acgcatgctg 300 ttagactccc cacgtctctt ggtccggaca tgcgtttctc aacgccgaaa gcctggtcaa 360 ccgcactttc ggcaccgcac agtcccacgg cgtccgagcg gtcgcgcgag tcggcccggt 420 cgagccagag gcagccacac gaacgtgcac cgcaatgcac cgccttgatc 470 <210> 96 <211> 334 <212> DNA <213> Artificial Sequence <220> <223> >apm promoter <400> 96 ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 60 ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 120 gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 180 cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttgg 240 ttcatgtgca gctccatcag caaaagggga tgataagttt atcaccaccg actatttgca 300 acagtgccgt tgatcgtgct atgatcgact gagc 334 <210> 97 <211> 1094 <212> DNA <213> Artificial Sequence <220> <223> >cdaR promoter <400> 97 gggccccccc tcgaggtcga cggtatcgat aagcttgatt tttctggaca acctggacgc 60 cgagacctcg gcggcgaccc tcgcgctgtt cctcacggcc ctgtgggcgc tggccgtcat 120 cgcccgcccc tacacctggt ggcgcgtgct gctggtgctg accatggcgg tgggcttcgc 180 cgtggtgctg gtggtgccct acctccagga gttcttccag ctgaagctgg tcggcgtcac 240 cgcgccgtgg gcggcggtcg cctgtgcggc ggtcgccggg ctggtgctgg agttggtgtg 300 ggcacgtatg cggcgtcgtc tcgacgccga ctgagcccac cgggcggtcg acccccgtac 360 cgcccggtga agaggagggg acgcccggtc cgtgccgggc gtcccctccg tctttgtgcg 420 ccccccgccg accggaacgg cacgatccgg ccaaacctgc gcagcggtgc ggccggagga 480 gccgcttccg ggccgttcga cgggcggccc gccacgggac cggaacgagc cccggcatcc 540 gccgccacca gcggatttca cattccttac gcaatcggcg gcgagagcga ccggcaggta 600 acctcggggc tgaatccagg ccatcgggga atagcaaacg gcgcactgac gaaagcaagg 660 gcagagacct gccgaaagtt gagtgttgga ttcaaagaag atccgtatta ttccgactgc 720 aggcaggggg gagccggcta cgaaggaaaa gttccgcagg tcagattggg ccgggtcgca 780 ggcagcgccg caccggcaac cacgaccgcg actttcgtcg acgcaccccc tcgcaccgcc 840 gcccggccac cggtccgggc gcacgacccg aagggaagtg aggctcacgc acggaccagc 900 agctcctgac gcagcgaccc ggacccggag gtgagtgaca tgacgacgag gccccgacca 960 gcggtgaacc ctgctgaccc ggccgtaacg aagtcttcat gcccgtggca cccgacggct 1020 tcggagagtt tcggcacgca gacatcagca caacttgacg cgggggtatc aagaggtcat 1080 ggatcttcgg tacc 1094 <210> 98 <211> 145 <212> DNA <213> Artificial Sequence <220> <223> >ermE* promoter <400> 98 gcggttgatc ggcgatcgca ggtgcacgcg gtcgatcttg acggctggcg agaggtgcgg 60 ggaggatctg accgacgcgg tccacacgtg gcaccgcgat gctgttgtgg gcacaatcgt 120 gccggttggt aggatccagc gagca 145 <210> 99 <211> 321 <212> DNA <213> Artificial Sequence <220> <223> >rpsL promoter <400> 99 tgagcacgtc cgcgagctgg ccctgcaggc ggaagtcagg tagacacgac ttccgctagt 60 ccttgcaagg tctgctgacg tgaggcgggg cggtcgtttt tgaccgccct gccttcgtca 120 tgtaggctcg ctcgctgtgc ctggcgtgtc atcagacgcc caggtcccgg tgccgtgagg 180 cccgggccat cgagccggtg gtacgtggct gcggtcccct tgtgagggct gcgcgccgtg 240 tgctgtccgg cgcgcacagc cttgaatcca cccgcggggg ccggccggtc tccgtgagct 300 cgagtagacg acggagacgt a 321 <210> 100 <211> 1410 <212> DNA <213> Artificial Sequence <220> <223> >ACSP50_1949 <400> 100 gtggcgactc ccacgcagtc cgagatccgc gaggaagagc acgaagagca gcggcagagc 60 ctgagcacgg cggcggcccg caacctcacg accaccacca agaccgcgcc gcagatgcag 120 gagatcactt cgcgatggct gctccgtaag cttccctggg ttcaggtcgc cggtggggcg 180 tatcgggtga accggcggat gacttatcgg atcggcgacg gccggctgag cttcaccaac 240 gtcggtgcgc aggtccgggt cgtcccggcc gagctgcggg aactctcggt gctcagcgag 300 ttcgacgacg cggacgtgct ggccgccatg gccgacaagt tcgtgcagca ggagtaccag 360 cccggtcagg tgatcgtcga gttcggctcg gtcgccgacc acgtgtacgt gatcgcgcac 420 ggcaaggtga acaaggtcgg cgtcggcaac tacggcgacc cggtcaacct gggggtgctc 480 gccgacgggg aggcgttcgg cgagaagtcg ctcaccgacg aggagcggat ctgggactac 540 accgccaagg cgatgaccgc ggtgaccctg ctggccatgc cgcgctcggc gttcaccgcg 600 ctgctcggcc agagtgacca cctgcgcacg cacgtcgagc agttccgggc caagaaccgc 660 cggccgcaga acaagcacgg cgaggcggag atctcggtgg ccgccgggca caccggcgaa 720 ccgaagctgg acggcacgta cgtcgactac gagctgacgc cgcgcgaata cgagctgagc 780 gtcgcgcaga ccgtgctgcg cgtgcacacc cgggtcgccg acctctacaa cgagccgatg 840 aaccaggtgg agcagcagct ccggctgacc gtcgaggcgc tgcgcgagcg tcaggaatac 900 gaaatgatca acaaccgcga gttcggcctg ctgcacaacg ccgacctgcg gcagcgcatc 960 cacacccggg gcggcccgcc caccccggac gacctcgacg agctgctcag catgcggcgc 1020 ggcaccagga tgttcgtggc ccacccgcag gcggtcgccg cgttcggccg ggagtgcacc 1080 aagcggggca tctatccacc gatgctggaa caggacggcg gcaccttcct gtcctggcgc 1140 ggggtcccga tcctgccgtg cggcaagatc ccggtgaccg agacgcacac cacctcgatc 1200 ctggcgatgc gcaccgggga gagcgaccag ggtgtggtcg ggctgcacca gaccgggatc 1260 ccggacgagt acgagccgag cctgtccgtg cggttcatgg ggatcagcga gcaggcgatc 1320 atgtcgtacc tggtgagcgc gtactactcg gccgcggtgc tggtgccgga cgcgctgggc 1380 atcctggacc acgtcgagct gtcccactga 1410 <210> 101 <211> 855 <212> DNA <213> Artificial Sequence <220> <223> >ACSP50_1951 <400> 101 atgacaagtg ctgttgcttc gccactgcgg accgacttcg agcgctcggt cgccagctac 60 tggaacacca accgggccga cccggtcaac ctgcgcctcg gcgaggtcga cgggctgtac 120 caccaccact acggcgtcgg cgagcccgac ctcagcgtgc tggacggccc ggccgacacc 180 cgcgagcagc ggatcatcgc cgagctgcac cggctggaga acgcccaggc cgacctgctg 240 ctcgaccacc tcggcccgat ccggccgggc gacgcgctgc tcgacggcgg gtccggccgc 300 ggcggcacca gcatcatggc caacgcgcgg ttcggctgcc gggtcgacgg ggtgtccatc 360 tcggaatacc aggtgggttt cgccaacgag caggccgctc agcgcggcgt cgccgacagg 420 gtgcgcttcc acttccgcaa catgctggac tccggattcg cgaccgggtc acggcaggcg 480 atctggacga acgagacgac gatgtacgtc gacctgttcg acctgtacgc ggagttcgcc 540 cggatgctcg gcttcggcgg ccgctacgtg tgcatcaccg gttgcgccaa cgacgtgacc 600 ggccggcgct ccaaggcggt caacaggatc aacgagcact acacctgtga catccacccg 660 cgcagcgact acttcaaggc gctcgccgcc cacgatctcg tgccgatcgc cgtcaccgac 720 ctgaccgcgg ccaccatccc gtactgggag ctgcgcgccc ggtccgaggt ggcgaccggg 780 atcgaacagg ctttcctcac ggcgtactca gaaggcagtt tccactacct tctgatcgcc 840 gccgatcggg tctga 855 <210> 102 <211> 1803 <212> DNA <213> Artificial Sequence <220> <223> >ACSP50_1952 <400> 102 atggccctgc cgatcgagga ctacgcgatc atcgccgaca cccagaccgc ggccctggtc 60 ggtcgcaacg gatcgatcga ctggctctgc gtgccccgct tcgactccgg cgcgatcttc 120 gcggcgctgc tcggcgaggc ggagaacggc cactggacca tcgcaccgtc cggcgaggtg 180 gtcaccaccc gccgccgcta ccgggacgac acgctggtgt tggagacgga gttcgagacg 240 gccggcggcg tcgcccggtt gatcgacttc atgccgccgc gcaccgactc gccgtccgtc 300 atccggatcg tcgagggcgt ccgcgggcag gtggacttcg gcatggagct gcggctgcgc 360 ttcgactatg gacacgtcgt gccatgggtc taccgcgagg gtggggcgct cgtcgcggtc 420 gccggtccgg acgcggcctg gttgcgcacc gacgtgccga cccggggcga gaatctgacc 480 accaaagccg atttccgggt acgggcgggg gaacgcgccg ccttcaccct gacctggcgc 540 ccgtcgcatc tgccctcgcc cgccccgctg gacccggccc acgagctcgg cgtgaccgag 600 ggttactggc gcggctgggt gtccgcctgc acgtacgagg gggagtggcg ggacgccgtc 660 gtccgatcgc tgctcactct gaaagccctc acctacgcac ccaccggcgg cattgtcgcg 720 gccgccacca ccagcctccc ggagaaactc ggcggcgtcc gcaactggga ctaccgcttc 780 tgctggctcc gcgacgccac catcaccctg cagtcgctgc tcttctccgg tttccagagt 840 gaggcgatcg cctggcgcaa atggctgctg cgcgcgatcg ccggcaaccc cgccgagctg 900 cagatcatgt acggcgtcgc cggcgaacgc cgcctcgacg agtatctggc cgactggctc 960 accggctacg acggcaaccc ggtccggatc ggcaacgccg ccgccgagca gttccagttg 1020 gacgtgtacg gcgaggtgat ggacgccctg catcagggcc gccgggccgg cctcaaagcc 1080 gacgacccgt cctggggcct gcaggtcaaa ctgatggagt tcgtcgagga gcactggcag 1140 gacccggacg agggcatctg ggaggtccgc ggcggccccc gccagttcac ccactccaaa 1200 ctgatggcct gggtcgccgc cgaccgcgcc gtcaaggccg tcgaggagtt cggcctggac 1260 ggccccgccg accgctggcg ccgcctgcgc gacgagatcc gtcaggacat cctggacaag 1320 ggttacgacc cggtccgcaa gaccttcacc cagtactacg gctccgatga gctcgacgcc 1380 gcgatgctga tggtccccct ggtcggcttc ctccccgggg atgacgaacg cgtcgccggc 1440 acggtcgccg ccatcgagca acacctgctg gtcgacggtt tcgtccagcg gtacacccaa 1500 catccggacg ccgacgtcga cggccttccc ccgggcgagg gcgcgttcct ggcctgcacg 1560 ttctggctgg ccgacaacta cgcgctgatg ggtcgccacg acgaggcccg ggagacgttc 1620 gcccgcctgc tggccctgcg caacgacgtg ggtctgctcg ccgaggagta cgacaccacc 1680 accggccgcc tggtcggcaa cttccctcag gccttcagtc acgtcccgct gatcgacacg 1740 gcccggacct tgaccagcgc gctggcgccg accgaggccc gggcctcgga gggcctcagg 1800 tag 1803 <210> 103 <211> 276 <212> DNA <213> Artificial Sequence <220> <223> >ACSP50_1953 <400> 103 atgcgtacgg tgattcgtgg gatcgtggtg ttggcgctgg tggccggggg tggcgccggc 60 atggtggggc ccgccggagc ggcgccggcg gtgacgttca agaactgcac tgagctgaac 120 aagaagtaca agcacggggt cggcaagcgg ggcgccgagg acagggtgag cgggtccacc 180 aagccggtca ccaccttctc cgtgaacaac gatctctatg cggcgaacaa gaggctggac 240 cgtgacaagg acgggatcgc ctgcgagaag cggtga 276 <210> 104 <211> 469 <212> PRT <213> Artificial Sequence <220> <223> >ACSP50_1949 <400> 104 Met Ala Thr Pro Thr Gln Ser Glu Ile Arg Glu Glu Glu His Glu Glu 1 5 10 15 Gln Arg Gln Ser Leu Ser Thr Ala Ala Ala Arg Asn Leu Thr Thr Thr 20 25 30 Thr Lys Thr Ala Pro Gln Met Gln Glu Ile Thr Ser Arg Trp Leu Leu 35 40 45 Arg Lys Leu Pro Trp Val Gln Val Ala Gly Gly Ala Tyr Arg Val Asn 50 55 60 Arg Arg Met Thr Tyr Arg Ile Gly Asp Gly Arg Leu Ser Phe Thr Asn 65 70 75 80 Val Gly Ala Gln Val Arg Val Val Pro Ala Glu Leu Arg Glu Leu Ser 85 90 95 Val Leu Ser Glu Phe Asp Asp Ala Asp Val Leu Ala Ala Met Ala Asp 100 105 110 Lys Phe Val Gln Gln Glu Tyr Gln Pro Gly Gln Val Ile Val Glu Phe 115 120 125 Gly Ser Val Ala Asp His Val Tyr Val Ile Ala His Gly Lys Val Asn 130 135 140 Lys Val Gly Val Gly Asn Tyr Gly Asp Pro Val Asn Leu Gly Val Leu 145 150 155 160 Ala Asp Gly Glu Ala Phe Gly Glu Lys Ser Leu Thr Asp Glu Glu Arg 165 170 175 Ile Trp Asp Tyr Thr Ala Lys Ala Met Thr Ala Val Thr Leu Leu Ala 180 185 190 Met Pro Arg Ser Ala Phe Thr Ala Leu Leu Gly Gln Ser Asp His Leu 195 200 205 Arg Thr His Val Glu Gln Phe Arg Ala Lys Asn Arg Arg Pro Gln Asn 210 215 220 Lys His Gly Glu Ala Glu Ile Ser Val Ala Ala Gly His Thr Gly Glu 225 230 235 240 Pro Lys Leu Asp Gly Thr Tyr Val Asp Tyr Glu Leu Thr Pro Arg Glu 245 250 255 Tyr Glu Leu Ser Val Ala Gln Thr Val Leu Arg Val His Thr Arg Val 260 265 270 Ala Asp Leu Tyr Asn Glu Pro Met Asn Gln Val Glu Gln Gln Leu Arg 275 280 285 Leu Thr Val Glu Ala Leu Arg Glu Arg Gln Glu Tyr Glu Met Ile Asn 290 295 300 Asn Arg Glu Phe Gly Leu Leu His Asn Ala Asp Leu Arg Gln Arg Ile 305 310 315 320 His Thr Arg Gly Gly Pro Pro Thr Pro Asp Asp Leu Asp Glu Leu Leu 325 330 335 Ser Met Arg Arg Gly Thr Arg Met Phe Val Ala His Pro Gln Ala Val 340 345 350 Ala Ala Phe Gly Arg Glu Cys Thr Lys Arg Gly Ile Tyr Pro Pro Met 355 360 365 Leu Glu Gln Asp Gly Gly Thr Phe Leu Ser Trp Arg Gly Val Pro Ile 370 375 380 Leu Pro Cys Gly Lys Ile Pro Val Thr Glu Thr His Thr Thr Ser Ile 385 390 395 400 Leu Ala Met Arg Thr Gly Glu Ser Asp Gln Gly Val Val Gly Leu His 405 410 415 Gln Thr Gly Ile Pro Asp Glu Tyr Glu Pro Ser Leu Ser Val Arg Phe 420 425 430 Met Gly Ile Ser Glu Gln Ala Ile Met Ser Tyr Leu Val Ser Ala Tyr 435 440 445 Tyr Ser Ala Ala Val Leu Val Pro Asp Ala Leu Gly Ile Leu Asp His 450 455 460 Val Glu Leu Ser His 465 <210> 105 <211> 284 <212> PRT <213> Artificial Sequence <220> <223> >ACSP50_1951 <400> 105 Met Thr Ser Ala Val Ala Ser Pro Leu Arg Thr Asp Phe Glu Arg Ser 1 5 10 15 Val Ala Ser Tyr Trp Asn Thr Asn Arg Ala Asp Pro Val Asn Leu Arg 20 25 30 Leu Gly Glu Val Asp Gly Leu Tyr His His His Tyr Gly Val Gly Glu 35 40 45 Pro Asp Leu Ser Val Leu Asp Gly Pro Ala Asp Thr Arg Glu Gln Arg 50 55 60 Ile Ile Ala Glu Leu His Arg Leu Glu Asn Ala Gln Ala Asp Leu Leu 65 70 75 80 Leu Asp His Leu Gly Pro Ile Arg Pro Gly Asp Ala Leu Leu Asp Gly 85 90 95 Gly Ser Gly Arg Gly Gly Thr Ser Ile Met Ala Asn Ala Arg Phe Gly 100 105 110 Cys Arg Val Asp Gly Val Ser Ile Ser Glu Tyr Gln Val Gly Phe Ala 115 120 125 Asn Glu Gln Ala Ala Gln Arg Gly Val Ala Asp Arg Val Arg Phe His 130 135 140 Phe Arg Asn Met Leu Asp Ser Gly Phe Ala Thr Gly Ser Arg Gln Ala 145 150 155 160 Ile Trp Thr Asn Glu Thr Thr Met Tyr Val Asp Leu Phe Asp Leu Tyr 165 170 175 Ala Glu Phe Ala Arg Met Leu Gly Phe Gly Gly Arg Tyr Val Cys Ile 180 185 190 Thr Gly Cys Ala Asn Asp Val Thr Gly Arg Arg Ser Lys Ala Val Asn 195 200 205 Arg Ile Asn Glu His Tyr Thr Cys Asp Ile His Pro Arg Ser Asp Tyr 210 215 220 Phe Lys Ala Leu Ala Ala His Asp Leu Val Pro Ile Ala Val Thr Asp 225 230 235 240 Leu Thr Ala Ala Thr Ile Pro Tyr Trp Glu Leu Arg Ala Arg Ser Glu 245 250 255 Val Ala Thr Gly Ile Glu Gln Ala Phe Leu Thr Ala Tyr Ser Glu Gly 260 265 270 Ser Phe His Tyr Leu Leu Ile Ala Ala Asp Arg Val 275 280 <210> 106 <211> 600 <212> PRT <213> Artificial Sequence <220> <223> >ACSP50_1952 <400> 106 Met Ala Leu Pro Ile Glu Asp Tyr Ala Ile Ile Ala Asp Thr Gln Thr 1 5 10 15 Ala Ala Leu Val Gly Arg Asn Gly Ser Ile Asp Trp Leu Cys Val Pro 20 25 30 Arg Phe Asp Ser Gly Ala Ile Phe Ala Ala Leu Leu Gly Glu Ala Glu 35 40 45 Asn Gly His Trp Thr Ile Ala Pro Ser Gly Glu Val Val Thr Thr Arg 50 55 60 Arg Arg Tyr Arg Asp Asp Thr Leu Val Leu Glu Thr Glu Phe Glu Thr 65 70 75 80 Ala Gly Gly Val Ala Arg Leu Ile Asp Phe Met Pro Pro Arg Thr Asp 85 90 95 Ser Pro Ser Val Ile Arg Ile Val Glu Gly Val Arg Gly Gln Val Asp 100 105 110 Phe Gly Met Glu Leu Arg Leu Arg Phe Asp Tyr Gly His Val Val Pro 115 120 125 Trp Val Tyr Arg Glu Gly Gly Ala Leu Val Ala Val Ala Gly Pro Asp 130 135 140 Ala Ala Trp Leu Arg Thr Asp Val Pro Thr Arg Gly Glu Asn Leu Thr 145 150 155 160 Thr Lys Ala Asp Phe Arg Val Arg Ala Gly Glu Arg Ala Ala Phe Thr 165 170 175 Leu Thr Trp Arg Pro Ser His Leu Pro Ser Pro Ala Pro Leu Asp Pro 180 185 190 Ala His Glu Leu Gly Val Thr Glu Gly Tyr Trp Arg Gly Trp Val Ser 195 200 205 Ala Cys Thr Tyr Glu Gly Glu Trp Arg Asp Ala Val Val Arg Ser Leu 210 215 220 Leu Thr Leu Lys Ala Leu Thr Tyr Ala Pro Thr Gly Gly Ile Val Ala 225 230 235 240 Ala Ala Thr Thr Ser Leu Pro Glu Lys Leu Gly Gly Val Arg Asn Trp 245 250 255 Asp Tyr Arg Phe Cys Trp Leu Arg Asp Ala Thr Ile Thr Leu Gln Ser 260 265 270 Leu Leu Phe Ser Gly Phe Gln Ser Glu Ala Ile Ala Trp Arg Lys Trp 275 280 285 Leu Leu Arg Ala Ile Ala Gly Asn Pro Ala Glu Leu Gln Ile Met Tyr 290 295 300 Gly Val Ala Gly Glu Arg Arg Leu Asp Glu Tyr Leu Ala Asp Trp Leu 305 310 315 320 Thr Gly Tyr Asp Gly Asn Pro Val Arg Ile Gly Asn Ala Ala Ala Glu 325 330 335 Gln Phe Gln Leu Asp Val Tyr Gly Glu Val Met Asp Ala Leu His Gln 340 345 350 Gly Arg Arg Ala Gly Leu Lys Ala Asp Asp Pro Ser Trp Gly Leu Gln 355 360 365 Val Lys Leu Met Glu Phe Val Glu Glu His Trp Gln Asp Pro Asp Glu 370 375 380 Gly Ile Trp Glu Val Arg Gly Gly Pro Arg Gln Phe Thr His Ser Lys 385 390 395 400 Leu Met Ala Trp Val Ala Ala Asp Arg Ala Val Lys Ala Val Glu Glu 405 410 415 Phe Gly Leu Asp Gly Pro Ala Asp Arg Trp Arg Arg Leu Arg Asp Glu 420 425 430 Ile Arg Gln Asp Ile Leu Asp Lys Gly Tyr Asp Pro Val Arg Lys Thr 435 440 445 Phe Thr Gln Tyr Tyr Gly Ser Asp Glu Leu Asp Ala Ala Met Leu Met 450 455 460 Val Pro Leu Val Gly Phe Leu Pro Gly Asp Asp Glu Arg Val Ala Gly 465 470 475 480 Thr Val Ala Ala Ile Glu Gln His Leu Leu Val Asp Gly Phe Val Gln 485 490 495 Arg Tyr Thr Gln His Pro Asp Ala Asp Val Asp Gly Leu Pro Pro Gly 500 505 510 Glu Gly Ala Phe Leu Ala Cys Thr Phe Trp Leu Ala Asp Asn Tyr Ala 515 520 525 Leu Met Gly Arg His Asp Glu Ala Arg Glu Thr Phe Ala Arg Leu Leu 530 535 540 Ala Leu Arg Asn Asp Val Gly Leu Leu Ala Glu Glu Tyr Asp Thr Thr 545 550 555 560 Thr Gly Arg Leu Val Gly Asn Phe Pro Gln Ala Phe Ser His Val Pro 565 570 575 Leu Ile Asp Thr Ala Arg Thr Leu Thr Ser Ala Leu Ala Pro Thr Glu 580 585 590 Ala Arg Ala Ser Glu Gly Leu Arg 595 600 <210> 107 <211> 91 <212> PRT <213> Artificial Sequence <220> <223> >ACSP50_1953 <400> 107 Met Arg Thr Val Ile Arg Gly Ile Val Val Leu Ala Leu Val Ala Gly 1 5 10 15 Gly Gly Ala Gly Met Val Gly Pro Ala Gly Ala Ala Pro Ala Val Thr 20 25 30 Phe Lys Asn Cys Thr Glu Leu Asn Lys Lys Tyr Lys His Gly Val Gly 35 40 45 Lys Arg Gly Ala Glu Asp Arg Val Ser Gly Ser Thr Lys Pro Val Thr 50 55 60 Thr Phe Ser Val Asn Asn Asp Leu Tyr Ala Ala Asn Lys Arg Leu Asp 65 70 75 80 Arg Asp Lys Asp Gly Ile Ala Cys Glu Lys Arg 85 90 <210> 108 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> >antisense 1 (putative antisense promoters) <400> 108 cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtgg 57 <210> 109 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> >antisense 2 (putative antisense promoters) <400> 109 acgcggtcga acacgcggtg gtacatgtcc agccacgcgc actggtactc ttcggac 57 <210> 110 <211> 6815 <212> DNA <213> Artificial Sequence <220> <223> >pSETT4gap <400> 110 aagcgcgggg aagaatcgat caaggactct taccgctgcc gtcgccggaa ggtggtcgac 60 ccgtccgcac ctgggcagca cgaaggcacg tgcaacgtca gcatggcggc actcgacaag 120 ttcgttgcgg aacgcatctt caacaagatc aggcacgccg aaggcgacga agagacgttg 180 gcgcttctgt gggaagccgc ccgacgcttc ggcaagctca ctgaggcgcc tgagaagagc 240 ggcgaacggg cgaaccttgt tgcggagcgc gccgacgccc tgaacgccct tgaagagctg 300 tacgaagacc gcgcggcagg cgcgtacgac ggacccgttg gcaggaagca cttccggaag 360 caacaggcag cgctgacgct ccggcagcaa ggggcggaag agcggcttgc cgaacttgaa 420 gccgccgaag ccccgaagct tccccttgac caatggttcc ccgaagacgc cgacgctgac 480 ccgaccggcc ctaagtcgtg gtgggggcgc gcgtcagtag acgacaagcg cgtgttcgtc 540 gggctcttcg tagacaagat cgttgtcacg aagtcgacta cgggcagggg gcagggaacg 600 cccatcgaga agcgcgcttc gatcacgtgg gcgaagccgc cgaccgacga cgacgaagac 660 gacgcccagg acggcacgga agacgtagcg gcgtagcgag acacccggga agcctgatct 720 acgtctgtcg agaagtttct gatcgaaaag ttcgacagcg tctccgacct gatgcagctc 780 tcgcagggcg aagaatctcg tgctttcagc ttcgatgtag gagggcgtgg atatgtcctg 840 cgggtaaata gctgcgccga tggttctctg tcgtcgctga cgtctgtagt ctagcctcat 900 tatgattgta cgctattcag ggattgactg ataccggaag acatctcaaa tgaagtggtc 960 aagctttatg cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct 1020 agggtcccca attaattagt aatataatct attaaaggtc attcaaaagg tcatccaagc 1080 ttggctgttt tggcggatga gagaagattt tcagcctgat acagattaaa tcagaacgca 1140 gaagcggtct gataaaacag aatttgcctg gcggcagtag cgcggtggtc ccacctgacc 1200 ccatgccgaa ctcagaagtg aaacgccgta gcgccgatgg tagtgtggcc catgcgagag 1260 tacatatggt actggccgat gctgggagaa gcgcgctgct gtacggcgcg caccgggtgc 1320 ggagcccctc ggcgagcggt gtgaaacttc tgtgaatggc ctgttcggtt gcttttttta 1380 tacggctgcc agataaggct tgcagcatct gggcggctac cgctatgatc ggggcgttcc 1440 tgcaattctt agtgcgagta tctgaaaggg gatacgcatg gtaccgagac cttatgttga 1500 tcggcacttt gcatcggccg cgctcccgat tccggaagtg cttgacattg gggaatttat 1560 gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc gccattcgcc 1620 attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca 1680 gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca 1740 gtcacgacgt tgtaaaacga cggccagtgc caagcttggg ctgcaggtcg actctagagg 1800 atccgcggcc gcgcgcgata tcgaattcgt aatcatgtca tagctgtttc ctgtgtgaaa 1860 ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt gtaaagcctg 1920 gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgcggtctcg gcgtttcgtg 1980 ccgcgtgatt ttccgccaaa aactttaacg aacgttcgtt ataatggtgt catgaccttc 2040 acgacgaagt actaaaattg gcccgaatca tcagctaagc tttatgcttg taaaccgttt 2100 tgtgaaaaaa tttttaaaat aaaaaagggg acctctaggg tccccaatta attagtaata 2160 taatctatta aaggtcattc aaaaggtcat ccacctcact tcggtgaatc gaagcgcggc 2220 atcagggtta ctttttggat acctgagaca ttcgtcgctt ccgggtatgc gctctatgtg 2280 acggtctttt ggcgcacaaa tgctcagcac catttaaatt agaccgactc cagatctgta 2340 aggtccaaca aaacccatcg tagtccttag acttggcaca cttacacctg cagtggatga 2400 ccttttgaat gacctttaat agattatatt actaattaat tggggaccct agaggtcccc 2460 ttttttattt taaaaatttt ttcacaaaac ggtttacaag cataaagctt gccacgcaga 2520 cgacagccca cgctgaccga tctacctgaa cggcgaccat ctgtgtggta ctggggcgga 2580 gagataacta cggtgccgct taccgggctc actcaaaggc ggtaatacgg ttatccacag 2640 aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 2700 gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 2760 aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 2820 ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 2880 tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 2940 tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 3000 ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 3060 tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 3120 ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 3180 tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 3240 aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 3300 aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 3360 aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 3420 ttttggttca tgtgcagctc catcagcaaa aggggatgat aagtttatca ccaccgacta 3480 tttgcaacag tgccgttgat cgtgctatga tcgactgatg tcatcagcgg tggagtgcaa 3540 tgtcgtgcaa tacgaatggc gaaaagccga gctcatcggt cagcttctca accttggggt 3600 tacccccggc ggtgtgctgc tggtccacag ctccttccgt agcgtccggc ccctcgaaga 3660 tgggccactt ggactgatcg aggccctgcg tgctgcgctg ggtccgggag ggacgctcgt 3720 catgccctcg tggtcaggtc tggacgacga gccgttcgat cctgccacgt cgcccgttac 3780 accggacctt ggagttgtct ctgacacatt ctggcgcctg ccaaatgtaa agcgcagcgc 3840 ccatccattt gcctttgcgg cagcggggcc acaggcagag cagatcatct ctgatccatt 3900 gcccctgcca cctcactcgc ctgcaagccc ggtcgcccgt gtccatgaac tcgatgggca 3960 ggtacttctc ctcggcgtgg gacacgatgc caacacgacg ctgcatcttg ccgagttgat 4020 ggcaaaggtt ccctatgggg tgccgagaca ctgcaccatt cttcaggatg gcaagttggt 4080 acgcgtcgat tatctcgaga atgaccactg ctgtgagcgc tttgccttgg cggacaggtg 4140 gctcaaggag aagagccttc agaaggaagg tccagtcggt catgcctttg ctcggttgat 4200 ccgctcccgc gacattgtgg cgacagccct gggtcaactg ggccgagatc cgttgatctt 4260 cctgcatccg ccagaggcgg gatgcgaaga atgcgatgcc gctcgccagt cgattggctg 4320 agctcatgag cggagaacga gatgacgttg gaggggcaag gtcgcgctga ttgctggggc 4380 aacacgtgga gcggatcggg gattgtcttt cttcagctcg ctgatgatat gctgacgctc 4440 aatgccgttt ggcctccgac taacgaaaat cccgcatttg gacggctgat ccgattggca 4500 cggcggacgg cgaatggcgg agcagacgct cgtccggggg caatgagata tgaaaaagcc 4560 tgaactcacc gcgacgtatc gggccctggc cagctagcta gagtcgacct gcaggtcccc 4620 ggggatcggt cttgccttgc tcgtcggtga tgtacttcac cagctccgcg aagtcgctct 4680 tcttgatgga gcgcatgggg acgtgcttgg caatcacgcg caccccccgg ccgttttagc 4740 ggctaaaaaa gtcatggctc tgccctcggg cggaccacgc ccatcatgac cttgccaagc 4800 tcgtcctgct tctcttcgat cttcgccagc agggcgagga tcgtggcatc accgaaccgc 4860 gccgtgcgcg ggtcgtcggt gagccagagt ttcagcaggc cgcccaggcg gcccaggtcg 4920 ccattgatgc gggccagctc gcggacgtgc tcatagtcca cgacgcccgt gattttgtag 4980 ccctggccga cggccagcag gtaggccgac aggctcatgc cggccgccgc cgccttttcc 5040 tcaatcgctc ttcgttcgtc tggaaggcag tacaccttga taggtgggct gcccttcctg 5100 gttggcttgg tttcatcagc catccgcttg ccctcatctg ttacgccggc ggtagccggc 5160 cagcctcgca gagcaggatt cccgttgagc accgccaggt gcgaataagg gacagtgaag 5220 aaggaacacc cgctcgcggg tgggcctact tcacctatcc tgcccggctg acgccgttgg 5280 atacaccaag gaaagtctac acgaaccctt tggcaaaatc ctgtatatcg tgcgaaaaag 5340 gatggatata ccgaaaaaat cgctataatg accccgaagc agggttatgc agcggaaaag 5400 atccgtcgac ctgcaggcat gcaagctcta gcgattccag acgtcccgaa ggcgtggcgc 5460 ggcttccccg tgccggagca atcgccctgg gtgggttaca cgacgcccct ctatggcccg 5520 tactgacgga cacaccgaag ccccggcggc aaccctcagc ggatgccccg gggcttcacg 5580 ttttcccagg tcagaagcgg ttttcgggag tagtgcccca actggggtaa cctttgagtt 5640 ctctcagttg ggggcgtagg gtcgccgaca tgacacaagg ggttgtgacc ggggtggaca 5700 cgtacgcggg tgcttacgac cgtcagtcgc gcgagcgcga gaattcgagc gcagcaagcc 5760 cagcgacaca gcgtagcgcc aacgaagaca aggcggccga ccttcagcgc gaagtcgagc 5820 gcgacggggg ccggttcagg ttcgtcgggc atttcagcga agcgccgggc acgtcggcgt 5880 tcgggacggc ggagcgcccg gagttcgaac gcatcctgaa cgaatgccgc gccgggcggc 5940 tcaacatgat cattgtctat gacgtgtcgc gcttctcgcg cctgaaggtc atggacgcga 6000 ttccgattgt ctcggaattg ctcgccctgg gcgtgacgat tgtttccact caggaaggcg 6060 tcttccggca gggaaacgtc atggacctga ttcacctgat tatgcggctc gacgcgtcgc 6120 acaaagaatc ttcgctgaag tcggcgaaga ttctcgacac gaagaacctt cagcgcgaat 6180 tgggcgggta cgtcggcggg aaggcgcctt acggcttcga gcttgtttcg gagacgaagg 6240 agatcacgcg caacggccga atggtcaatg tcgtcatcaa caagcttgcg cactcgacca 6300 ctccccttac cggacccttc gagttcgagc ccgacgtaat ccggtggtgg tggcgtgaga 6360 tcaagacgca caaacacctt cccttcaagc cgggcagtca agccgccatt cacccgggca 6420 gcatcacggg gctttgtaag cgcatggacg ctgacgccgt gccgacccgg ggcgagacga 6480 ttgggaagaa gaccgcttca agcgcctggg acccggcaac cgttatgcga atccttcggg 6540 acccgcgtat tgcgggcttc gccgctgagg tgatctacaa gaagaagccg gacggcacgc 6600 cgaccacgaa gattgagggt taccgcattc agcgcgaccc gatcacgctc cggccggtcg 6660 agcttgattg cggaccgatc atcgagcccg ctgagtggta tgagcttcag gcgtggttgg 6720 acggcagggg gcgcggcaag gggctttccc gggggcaagc cattctgtcc gccatggaca 6780 agctgtactg cgagtgtggc gccgtcatga cttcg 6815 <210> 111 <211> 6705 <212> DNA <213> Artificial Sequence <220> <223> >pSETT4tip <400> 111 aagcgcgggg aagaatcgat caaggactct taccgctgcc gtcgccggaa ggtggtcgac 60 ccgtccgcac ctgggcagca cgaaggcacg tgcaacgtca gcatggcggc actcgacaag 120 ttcgttgcgg aacgcatctt caacaagatc aggcacgccg aaggcgacga agagacgttg 180 gcgcttctgt gggaagccgc ccgacgcttc ggcaagctca ctgaggcgcc tgagaagagc 240 ggcgaacggg cgaaccttgt tgcggagcgc gccgacgccc tgaacgccct tgaagagctg 300 tacgaagacc gcgcggcagg cgcgtacgac ggacccgttg gcaggaagca cttccggaag 360 caacaggcag cgctgacgct ccggcagcaa ggggcggaag agcggcttgc cgaacttgaa 420 gccgccgaag ccccgaagct tccccttgac caatggttcc ccgaagacgc cgacgctgac 480 ccgaccggcc ctaagtcgtg gtgggggcgc gcgtcagtag acgacaagcg cgtgttcgtc 540 gggctcttcg tagacaagat cgttgtcacg aagtcgacta cgggcagggg gcagggaacg 600 cccatcgaga agcgcgcttc gatcacgtgg gcgaagccgc cgaccgacga cgacgaagac 660 gacgcccagg acggcacgga agacgtagcg gcgtagcgag acacccggga agcctgatct 720 acgtctgtcg agaagtttct gatcgaaaag ttcgacagcg tctccgacct gatgcagctc 780 tcgcagggcg aagaatctcg tgctttcagc ttcgatgtag gagggcgtgg atatgtcctg 840 cgggtaaata gctgcgccga tggttctctg tcgtcgctga cgtctgtagt ctagcctcat 900 tatgattgta cgctattcag ggattgactg ataccggaag acatctcaaa tgaagtggtc 960 aagctttatg cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct 1020 agggtcccca attaattagt aatataatct attaaaggtc attcaaaagg tcatccaagc 1080 ttggctgttt tggcggatga gagaagattt tcagcctgat acagattaaa tcagaacgca 1140 gaagcggtct gataaaacag aatttgcctg gcggcagtag cgcggtggtc ccacctgacc 1200 ccatgccgaa ctcagaagtg aaacgccgta gcgccgatgg tagtgtggcc catgcgagag 1260 tacaatccct agaacgtccg ggcttgcacc tcacgtcacg tgaggaggca gcgtggacgg 1320 cgtggtacca agcttattgg cactagtcga gcaacggagg tattccgatg gtaccgagac 1380 cttatgttga tcggcacttt gcatcggccg cgctcccgat tccggaagtg cttgacattg 1440 gggaatttat gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc 1500 gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 1560 tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 1620 ggttttccca gtcacgacgt tgtaaaacga cggccagtgc caagcttggg ctgcaggtcg 1680 actctagagg atccgcggcc gcgcgcgata tcgaattcgt aatcatgtca tagctgtttc 1740 ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt 1800 gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgcggtctcg 1860 gcgtttcgtg ccgcgtgatt ttccgccaaa aactttaacg aacgttcgtt ataatggtgt 1920 catgaccttc acgacgaagt actaaaattg gcccgaatca tcagctaagc tttatgcttg 1980 taaaccgttt tgtgaaaaaa tttttaaaat aaaaaagggg acctctaggg tccccaatta 2040 attagtaata taatctatta aaggtcattc aaaaggtcat ccacctcact tcggtgaatc 2100 gaagcgcggc atcagggtta ctttttggat acctgagaca ttcgtcgctt ccgggtatgc 2160 gctctatgtg acggtctttt ggcgcacaaa tgctcagcac catttaaatt agaccgactc 2220 cagatctgta aggtccaaca aaacccatcg tagtccttag acttggcaca cttacacctg 2280 cagtggatga ccttttgaat gacctttaat agattatatt actaattaat tggggaccct 2340 agaggtcccc ttttttattt taaaaatttt ttcacaaaac ggtttacaag cataaagctt 2400 gccacgcaga cgacagccca cgctgaccga tctacctgaa cggcgaccat ctgtgtggta 2460 ctggggcgga gagataacta cggtgccgct taccgggctc actcaaaggc ggtaatacgg 2520 ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 2580 gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 2640 gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 2700 taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 2760 accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 2820 tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 2880 cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 2940 agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 3000 gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca 3060 gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 3120 tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 3180 acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 3240 cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 3300 acctagatcc ttttggttca tgtgcagctc catcagcaaa aggggatgat aagtttatca 3360 ccaccgacta tttgcaacag tgccgttgat cgtgctatga tcgactgatg tcatcagcgg 3420 tggagtgcaa tgtcgtgcaa tacgaatggc gaaaagccga gctcatcggt cagcttctca 3480 accttggggt tacccccggc ggtgtgctgc tggtccacag ctccttccgt agcgtccggc 3540 ccctcgaaga tgggccactt ggactgatcg aggccctgcg tgctgcgctg ggtccgggag 3600 ggacgctcgt catgccctcg tggtcaggtc tggacgacga gccgttcgat cctgccacgt 3660 cgcccgttac accggacctt ggagttgtct ctgacacatt ctggcgcctg ccaaatgtaa 3720 agcgcagcgc ccatccattt gcctttgcgg cagcggggcc acaggcagag cagatcatct 3780 ctgatccatt gcccctgcca cctcactcgc ctgcaagccc ggtcgcccgt gtccatgaac 3840 tcgatgggca ggtacttctc ctcggcgtgg gacacgatgc caacacgacg ctgcatcttg 3900 ccgagttgat ggcaaaggtt ccctatgggg tgccgagaca ctgcaccatt cttcaggatg 3960 gcaagttggt acgcgtcgat tatctcgaga atgaccactg ctgtgagcgc tttgccttgg 4020 cggacaggtg gctcaaggag aagagccttc agaaggaagg tccagtcggt catgcctttg 4080 ctcggttgat ccgctcccgc gacattgtgg cgacagccct gggtcaactg ggccgagatc 4140 cgttgatctt cctgcatccg ccagaggcgg gatgcgaaga atgcgatgcc gctcgccagt 4200 cgattggctg agctcatgag cggagaacga gatgacgttg gaggggcaag gtcgcgctga 4260 ttgctggggc aacacgtgga gcggatcggg gattgtcttt cttcagctcg ctgatgatat 4320 gctgacgctc aatgccgttt ggcctccgac taacgaaaat cccgcatttg gacggctgat 4380 ccgattggca cggcggacgg cgaatggcgg agcagacgct cgtccggggg caatgagata 4440 tgaaaaagcc tgaactcacc gcgacgtatc gggccctggc cagctagcta gagtcgacct 4500 gcaggtcccc ggggatcggt cttgccttgc tcgtcggtga tgtacttcac cagctccgcg 4560 aagtcgctct tcttgatgga gcgcatgggg acgtgcttgg caatcacgcg caccccccgg 4620 ccgttttagc ggctaaaaaa gtcatggctc tgccctcggg cggaccacgc ccatcatgac 4680 cttgccaagc tcgtcctgct tctcttcgat cttcgccagc agggcgagga tcgtggcatc 4740 accgaaccgc gccgtgcgcg ggtcgtcggt gagccagagt ttcagcaggc cgcccaggcg 4800 gcccaggtcg ccattgatgc gggccagctc gcggacgtgc tcatagtcca cgacgcccgt 4860 gattttgtag ccctggccga cggccagcag gtaggccgac aggctcatgc cggccgccgc 4920 cgccttttcc tcaatcgctc ttcgttcgtc tggaaggcag tacaccttga taggtgggct 4980 gcccttcctg gttggcttgg tttcatcagc catccgcttg ccctcatctg ttacgccggc 5040 ggtagccggc cagcctcgca gagcaggatt cccgttgagc accgccaggt gcgaataagg 5100 gacagtgaag aaggaacacc cgctcgcggg tgggcctact tcacctatcc tgcccggctg 5160 acgccgttgg atacaccaag gaaagtctac acgaaccctt tggcaaaatc ctgtatatcg 5220 tgcgaaaaag gatggatata ccgaaaaaat cgctataatg accccgaagc agggttatgc 5280 agcggaaaag atccgtcgac ctgcaggcat gcaagctcta gcgattccag acgtcccgaa 5340 ggcgtggcgc ggcttccccg tgccggagca atcgccctgg gtgggttaca cgacgcccct 5400 ctatggcccg tactgacgga cacaccgaag ccccggcggc aaccctcagc ggatgccccg 5460 gggcttcacg ttttcccagg tcagaagcgg ttttcgggag tagtgcccca actggggtaa 5520 cctttgagtt ctctcagttg ggggcgtagg gtcgccgaca tgacacaagg ggttgtgacc 5580 ggggtggaca cgtacgcggg tgcttacgac cgtcagtcgc gcgagcgcga gaattcgagc 5640 gcagcaagcc cagcgacaca gcgtagcgcc aacgaagaca aggcggccga ccttcagcgc 5700 gaagtcgagc gcgacggggg ccggttcagg ttcgtcgggc atttcagcga agcgccgggc 5760 acgtcggcgt tcgggacggc ggagcgcccg gagttcgaac gcatcctgaa cgaatgccgc 5820 gccgggcggc tcaacatgat cattgtctat gacgtgtcgc gcttctcgcg cctgaaggtc 5880 atggacgcga ttccgattgt ctcggaattg ctcgccctgg gcgtgacgat tgtttccact 5940 caggaaggcg tcttccggca gggaaacgtc atggacctga ttcacctgat tatgcggctc 6000 gacgcgtcgc acaaagaatc ttcgctgaag tcggcgaaga ttctcgacac gaagaacctt 6060 cagcgcgaat tgggcgggta cgtcggcggg aaggcgcctt acggcttcga gcttgtttcg 6120 gagacgaagg agatcacgcg caacggccga atggtcaatg tcgtcatcaa caagcttgcg 6180 cactcgacca ctccccttac cggacccttc gagttcgagc ccgacgtaat ccggtggtgg 6240 tggcgtgaga tcaagacgca caaacacctt cccttcaagc cgggcagtca agccgccatt 6300 cacccgggca gcatcacggg gctttgtaag cgcatggacg ctgacgccgt gccgacccgg 6360 ggcgagacga ttgggaagaa gaccgcttca agcgcctggg acccggcaac cgttatgcga 6420 atccttcggg acccgcgtat tgcgggcttc gccgctgagg tgatctacaa gaagaagccg 6480 gacggcacgc cgaccacgaa gattgagggt taccgcattc agcgcgaccc gatcacgctc 6540 cggccggtcg agcttgattg cggaccgatc atcgagcccg ctgagtggta tgagcttcag 6600 gcgtggttgg acggcagggg gcgcggcaag gggctttccc gggggcaagc cattctgtcc 6660 gccatggaca agctgtactg cgagtgtggc gccgtcatga cttcg 6705

Claims

아카르보스의 개선된 생산을 위해 악티노미세탈레스(Actinomycetales) 균주, 바람직하게는 악티노플라네스(Actinoplanes) 균주를 조작하는 방법으로서,
(i) 서열식별번호: 20에 따른 세포외 작은 탄수화물 결합 단백질 Cgt의 발현 부재 또는 감소를 위해, 및/또는
(ii) 카로티노이드 합성에 필수적인 적어도 하나의 유전자의 발현 부재 또는 감소를 위해, 및/또는
(iii) 서열식별번호: 13에 따른 dTDP-D-글루코스-4,6-데히드라타제 AcbB의 과다발현을 위해, 및/또는
(iv) 서열식별번호: 19에 따른 UDP-글루코스-1P 우리딜트랜스퍼라제 GtaB의 과다발현을 위해
악티노미세탈레스 균주를 조작하는 것을 포함하는 방법.
제1항에 있어서, 하기를 포함하는 방법:
(i) 서열식별번호: 20에 따른 세포외 작은 탄수화물 결합 단백질 Cgt를 코딩하는 유전자의 결실 또는 돌연변이 및/또는
(ii) 카로티노이드 합성에 필수적인 적어도 하나의 유전자의 결실 또는 돌연변이 및/또는
(iii) AcbB에 대한 발현 카세트를 포함하는 벡터를 악티노미세탈레스 균주 내로 도입하는 것 및/또는
(iv) GtaB에 대한 발현 카세트를 포함하는 벡터를 악티노미세탈레스 균주 내로 도입하는 것.
제2항에 있어서, (iii) 및/또는 (iv)에 따른 발현 카세트가 글루쿠로니다제 검정에서 적어도 1 x 10^-4 [L·g^-1·min^- ¹]의 정규화된 글루쿠로니다제 활성을 특징으로 하는 중간 정도의 강한 프로모터 또는 글루쿠로니다제 검정에서 적어도 5 x 10^-4 [L·g^-1·min^- ¹]의 정규화된 글루쿠로니다제 활성을 특징으로 하는 강한 프로모터의 제어 하에 있는 것인 방법.
서열식별번호: 20에 따른 세포외 작은 탄수화물 결합 단백질 Cgt의 발현 부재 또는 감소를 위해 유전적으로 조작된, 아카르보스의 생산을 위한 악티노미세탈레스 균주, 바람직하게는 악티노플라네스 균주.
제4항에 있어서, cgt 결실 돌연변이체인 악티노미세탈레스 균주.
카로티노이드 합성에 필수적인 적어도 하나의 유전자의 발현 부재 또는 감소를 위해 유전적으로 조작된, 아카르보스의 생산을 위한 악티노미세탈레스 균주, 바람직하게는 악티노플라네스 균주.
서열식별번호: 13에 따른 dTDP-D-글루코스-4,6-데히드라타제 AcbB의 과다발현을 위해 유전적으로 조작된, 아카르보스의 생산을 위한 악티노미세탈레스 균주, 바람직하게는 악티노플라네스 균주.
서열식별번호: 19에 따른 UDP-글루코스-1P 우리딜트랜스퍼라제 GtaB의 과다발현을 위해 유전적으로 조작된, 아카르보스의 생산을 위한 악티노미세탈레스 균주, 바람직하게는 악티노플라네스 균주.
제1항 내지 제3항 및 제6항 중 어느 한 항에 있어서, 카로티노이드 합성에 필수적인 적어도 하나의 유전자가 하기 중 임의의 것으로부터 선택된 적어도 하나의 유전자를 포함하는 것인 아카르보스의 생산을 위한 악티노미세탈레스 균주 또는 방법:
a. MEP/DOXP 경로의 유전자
i. 서열식별번호: 23에 따른 1-데옥시-D-크실룰로스-5-포스페이트 신타제 유전자 dxs, ACSP50_7096,
ii. 서열식별번호: 24에 따른 4-히드록시-3-메틸부트-2-엔-1-일 디포스페이트 신타제 유전자 ispG, ACSP50_7248,
iii. 서열식별번호: 25에 따른 1-데옥시-D-크실룰로스-5-포스페이트 리덕토이소머라제 유전자 dxr, ACSP50_7250,
iv. 서열식별번호: 26에 따른 4-히드록시-3-메틸부트-2-에닐 디포스페이트 리덕타제 유전자 ispH, ACSP50_7707,
v. 서열식별번호: 27에 따른 4-(시티딘 5'-디포스포)-2-C-메틸-D-에리트리톨 키나제 유전자 ispE, ACSP50_7802,
vi. 서열식별번호: 28에 따른 2-C-메틸-D-에리트리톨 2;4-시클로디포스페이트 신타제 유전자 ispF, ACSP50_8046, 및/또는
vii. 서열식별번호: 29에 따른 2-C-메틸-D-에리트리톨 4-포스페이트 시티딜릴트랜스퍼라제 유전자 ispD, ACSP50_8047,
b. 테르펜 클러스터 1의 유전자
i. 서열식별번호: 30에 따른 이소펜테닐-디포스페이트 델타-이소머라제 유전자 idi, ACSP50_0146,
ii. 서열식별번호: 10에 따른 제타-피토엔 데새투라제 유전자 crtI, ACSP50_0147,
iii. 서열식별번호: 31에 따른 폴리프레닐 신테타제 유전자 crtE/ldsA, ACSP50_0148,
iv. 서열식별번호: 32에 따른 피토엔 신타제 유전자 crtB, ACSP50_0149,
v. 서열식별번호: 33에 따른 데옥시리보디피리미딘 포토-리아제 유전자, ACSP50_0150, 또는
vi. 서열식별번호: 34에 따른 피리딘 뉴클레오티드-디술피드 옥시도리덕타제 유전자, ACSP50_0151,
c. 테르펜 클러스터 2a의 유전자
i. 서열식별번호: 35에 따른 전사 조절인자 유전자 ACSP50_1631,
ii. 서열식별번호: 36에 따른 리코펜 시클라제 유전자 ACSP50_1632,
iii. 서열식별번호: 37에 따른 리코펜 시클라제 유전자 ACSP50_1633,
iv. 서열식별번호: 38에 따른 폴리프레닐 신테타제, 파르네실 피로포스페이트 신테타제 2 유전자 fps2/crtE, ACSP50_1634, 또는
v. 서열식별번호: 39에 따른 메틸렌테트라히드로폴레이트 리덕타제 (NADPH) 유전자, ACSP50_1635,
d. 테르펜 클러스터 2b의 유전자
i. 서열식별번호: 40에 따른 LysR-패밀리 전사 조절인자 유전자, ACSP50_1650,
ii. 서열식별번호: 41에 따른 메틸트랜스퍼라제 유형 11 유전자, ACSP50_1651,
iii. 서열식별번호: 42에 따른 CDP-알콜포스파티딜트랜스퍼라제 pgsA, ACSP50_1652,
iv. 서열식별번호: 43에 따른 제타-피토엔 데새투라제 (crtI-패밀리) 유전자 crtD, ACSP50_1653,
v. 서열식별번호: 44에 따른 글리코실 트랜스퍼라제 유전자 cruC, ACSP50_1654,
vi. 서열식별번호: 45에 따른 가상 단백질 (추정 막 단백질) 유전자 cruF, ACSP50_1655,
vii. 서열식별번호: 46에 따른 GCN5 패밀리 아세틸트랜스퍼라제 유전자, ACSP50_1656,
viii. 서열식별번호: 47에 따른 모노옥시게나제 유전자, ACSP50_1657,
ix. 서열식별번호: 48에 따른 단쇄 데히드로게나제 유전자, ACSP50_1658,
e. 서열식별번호: 49에 따른 폴리프레닐 신테타제 유전자 crtE, ACSP50_3873, 또는
f. 캄펜-유사 모노테르펜 생합성 테르펜 클러스터 3에 대한 유전자
i. 서열식별번호: 104에 따른 전사 조절인자 (Crp/Fnr 패밀리) 유전자 eshA, ACSP50_1949,
ii. 서열식별번호: 50에 따른 캄펜 신타제 유전자, ACSP50_1950,
iii. 서열식별번호: 105에 따른 메틸트랜스퍼라제 (SAM-의존성) 유형 11 유전자, ACSP50_1951,
iv. 서열식별번호: 106에 따른 글리코실-히드롤라제 유전자, ACSP50_1952, 또는
v. 서열식별번호: 107에 따른 옥시도리덕타제/알도/케토리덕타제, ACSP50_1953.
서열식별번호: 13에 따른 AcbB에 대한 발현 카세트 및/또는 서열식별번호: 19에 따른 GtaB에 대한 발현 카세트 및/또는 서열식별번호: 22에 따른 MerR에 대한 발현 카세트를 포함하는 악티노플라네스에 대한 발현 벡터.
제10항에 있어서, 글루쿠로니다제 검정에서 적어도 1 x 10^-4 [L·g^-1·min^- ¹]의 정규화된 글루쿠로니다제 활성을 특징으로 하는 중간 정도의 강한 프로모터 또는 글루쿠로니다제 검정에서 적어도 5 x 10^-4 [L·g^-1·min^- ¹]의 정규화된 글루쿠로니다제 활성을 특징으로 하는 강한 프로모터를 추가로 포함하는 발현 벡터.
제10항 또는 제11항에 있어서,
a. 서열식별번호: 85에 따른 φC31 인테그라제 유전자 int, 및
b. 서열식별번호: 87에 따른 전달 기점 (incP), 및
c. 서열식별번호: 88에 따른 릴랙소좀 유전자 traJ, 및
d. 복제 기점,
바람직하게는 서열식별번호: 89에 따른 높은 카피 수 ColE1/pMB1/pBR322/pUC 복제 기점 (ori) 및
e. 임의적으로 적어도 하나의 내성 마커,
바람직하게는 아프라마이신 내성을 매개하는 내성 마커, 보다 바람직하게는 서열식별번호: 90에 따른 aac(3)IV, apmR, 및
f. 임의적으로 적어도 하나의 T4-종결인자
를 추가로 포함하며,
임의적으로, 여기서 벡터가 서열식별번호: 108 및/또는 서열식별번호: 109에 따른 추정 안티센스 프로모터를 포함하지 않는 것인
발현 벡터.
제11항 또는 제12항에 있어서, 상기 강한 프로모터가
a. 서열식별번호: 96에 따른 apm,
b. 서열식별번호: 98에 따른 ermE*,
c. 서열식별번호: 94에 따른 katE,
d. 서열식별번호: 95에 따른 moeE5, 또는
e. 서열식별번호: 82에 따른 gapDH
로 이루어진 군으로부터 선택되고/거나,
상기 중간 정도의 강한 프로모터가
f. 서열식별번호: 92에 따른 efp,
g. 서열식별번호: 97에 따른 cdaR,
h. 서열식별번호: 99에 따른 rpsL,
i. 서열식별번호: 93에 따른 rpsJ,
j. 서열식별번호: 91에 따른 cgt, 또는
k. 서열식별번호: 81에 따른 tipA
로 이루어진 군으로부터 선택되는 것인
발현 벡터.
제4항 내지 제9항 중 어느 한 항에 있어서, 균주가 제10항 내지 제13항 중 어느 한 항에 따른 벡터를 포함하는 것인, 아카르보스의 생산을 위한 악티노미세탈레스 균주.
아카르보스의 생산에 있어서의 제4항 내지 제9항 중 어느 한 항에 따른 악티노미세탈레스 균주의 용도.