KR20220081991A - 아카르보스의 개선된 형성을 위한 방법 - Google Patents
아카르보스의 개선된 형성을 위한 방법 Download PDFInfo
- Publication number
- KR20220081991A KR20220081991A KR1020227012323A KR20227012323A KR20220081991A KR 20220081991 A KR20220081991 A KR 20220081991A KR 1020227012323 A KR1020227012323 A KR 1020227012323A KR 20227012323 A KR20227012323 A KR 20227012323A KR 20220081991 A KR20220081991 A KR 20220081991A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- gene
- acsp50
- ala
- leu
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/365—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinoplanes (G)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/76—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Actinomyces; for Streptomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/07—Nucleotidyltransferases (2.7.7)
- C12Y207/07009—UTP-glucose-1-phosphate uridylyltransferase (2.7.7.9), i.e. UDP-glucose-pyrophosphorylase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y402/00—Carbon-oxygen lyases (4.2)
- C12Y402/01—Hydro-lyases (4.2.1)
- C12Y402/01046—Hydro-lyases (4.2.1) dTDP-glucose 4,6-dehydratase (4.2.1.46)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/045—Actinoplanes
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 아카르보스의 개선된 형성을 위한 악티노미세탈레스 균주에 관한 것이다. dTDP-D-글루코스-4,6-데히드라타제 (AcbB) 및/또는 우리딜트랜스퍼라제 (GtaB)를 과다발현하도록 조작된 악티노미세탈레스 균주가 제공된다. 또한, 작은 탄수화물 결합 단백질 (Cgt)의 발현 감소 또는 부재 및/또는 카로티노이드 합성에 필수적인 유전자의 발현 감소 또는 부재를 갖도록 조작된 악티노미세탈레스 균주가 제공된다. 또한 이들 균주를 생성하기 위한 도구, 방법 및 수단이 제공된다.
Description
본 발명은 아카르보스의 개선된 형성을 위한 악티노미세탈레스(Actinomycetales) 균주에 관한 것이다. dTDP-D-글루코스-4,6-데히드라타제 (AcbB) 및/또는 우리딜트랜스퍼라제 (GtaB)를 과다발현하도록 조작된 악티노미세탈레스 균주가 제공된다. 또한, 작은 탄수화물 결합 단백질 (Cgt)의 발현 감소 또는 부재 및/또는 카로티노이드 합성에 필수적인 유전자의 발현 감소 또는 부재를 갖도록 조작된 악티노미세탈레스 균주가 제공된다. 또한 이들 균주를 생성하기 위한 도구, 방법 및 수단이 제공된다.
아카르보스
치료제 아카르비오실-말토스 (아카르보스)는 1990년부터 당뇨병의 의학적 치료에 사용되고 있다 (Wehmeier and Piepersberg 2004; Wehmeier 2004). 그것은 환자의 엄격한 식단 계획을 지원하고 고탄수화물 식사를 섭취할 때 당 피크를 방지해야 한다. 경구 적용 후, 아카르보스는 장내 α-글루코시다제를 억제하여 전분 및 수크로스 함유 식이로부터 모노사카라이드의 방출을 지연시킨다. 이를 통해 아카르보스는 모노사카라이드가 혈액 시스템으로 흡수되는 속도를 제어하는 데 도움이 되며, 이는 심혈관 질환 사망률의 맥락에서 결정적인 것으로 추정되는 식후 혈액 및 혈청 당 수치를 감소시킨다.
산업적 적용가능성
아카르보스는 유럽과 중국에서는 글루코바이(Glucobay) [바이엘 아게(Bayer AG)]로서, 북미에서는 프레코스(Precose) [바이엘 파마슈티칼스(Bayer Pharmaceuticals)]로서, 캐나다에서는 프란다스(Prandase) (바이엘 아게)로서 공지되어 있고 판매되고 있다. 당뇨병의 치료를 위한 중요하고 수요가 많은 약물로서, 고수율 및 고품질의 아카르보스를 제공할 필요가 있다. 제II형 당뇨병의 발병률이 전 세계적으로 지속적으로 증가함에 따라, 제품 수율과 품질의 최적화가 현재의 관심사이다.
아카르보스
생산 균주
아카르보스는 스트렙토미세스 코엘리코플라부스(Streptomyces coelicoflavus) ZG0656 (Geng et al. 2009), 스트렙토미세스 글라우세스센스(Streptomyces glaucescens) GLA.O (Rockser and Wehmeier 2009; Ortseifen et al. 2015) 및 악티노플라네스 종(Actinoplanes sp.) SE50/110 (문헌 [Wehmeier and Piepersberg 2004]에 의해 검토됨)과 같은 상이한 악티노미세탈레스에 의해 자연적으로 생산되며, 이 중 후자는 산업 생산자 균주의 야생형이다 (Ortseifen 2016; Mahmud et al. 1999). 악티노플라네스 속은 카우치(Couch) (1950)에 의해 미크로모노스포라세아에(Micromonosporaceae) 과, 악티노미세탈레스 목, 악티노박테리아(Actinobacteria) 문의 구성원으로서 처음 도입되었다. 악티노플라네스 종 SE50/110 (ATCC 31044, CBS 674.73)은 천천히 성장하는 SE50의 자연 유도물이다 (ATCC 31042, CBS 961.70) (Frommer et al. 1973). SE50은 1970년 바이엘 아게가 케냐의 커피 농장 근처 토양 샘플로부터 스크리닝 프로그램을 진행하는 동안 단리되었다 (Frommer et al. 1972). SE50/110은 배지에 말토스가 제공될 때 대략 1 g·L-1 아카르보스를 생산한다 (Wendler et al. 2014). 예를 들어 (EP2601209B1) 및 (CN103298828B)에 기재된 바와 같이, 추가 생산 균주가 조작되었다.
악티노플라네스 종 SE50/110에 대하여, 아카르비오실-당의 생합성은 배양 배지 내의 탄소 공급원의 공급에 의존하는 것으로 제시되었다 (Wendler et al. 2014). 글루코스에서 성장하면, 아카르비오실-글루코스가 주요 화합물로서 형성되는 반면, 말토스에서 성장하면 아카르비오실-말토스가 주로 형성되고 (Wendler et al. 2014), 말토트리오스에서 성장하면 아카르비오실-말토트리오스가 형성된다 (Ortseifen 2016).
산업용 아카르보스 생산자 균주의 야생형으로서의 의학적 및 산업적 관련성으로 인해, 악티노플라네스 종 SE50/110은 지난 몇 년 동안 광범위하게 연구되었다: 완전한 게놈 (Schwientek et al. 2012), 트랜스크립톰 (Schwientek et al. 2013) 및 프로테옴 (Wendler et al. 2015b; Wendler et al. 2015a; Wendler et al. 2013)을 종합적으로 분석하였다. 이는 2017년에 정련된 게놈 서열과 개선된 주석으로 이어졌다 (진뱅크: LT827010.1) (Wolf et al. 2017b). 또한, 속간 접합 시스템 (Gren et al. 2016) 뿐만 아니라 CRISPR/Cas9의 사용에 의한 진보된 게놈 편집 도구 (Wolf et al. 2016)가 확립되어, 표적화된 유전적 조작이 가능하였다. 여전히, 악티노플라네스 종 SE50/110에 대해 중간 정도 내지 강한 유전자 발현을 가능하게 하는 신뢰할 수 있는 발현 시스템이 없다. 단일 유전자의 중간 정도의 강한 과다발현에 적합한 시스템이 이전에는 존재하지 않았기 때문에, 본 발명에 따라 상이한 전략을 테스트하고 평가하여, pSETT4라는 신규 발현 시스템을 개발하게 되었다.
아카르보스
생합성
아카르보스의 생합성 경로는 단일 단계를 촉매하는 단일 작용성 효소를 기반으로 한다 (도 1) (Wehmeier and Piepersberg 2009). 문헌 [Zhang et al. (2002)]의 모델에 따르면, 이러한 생합성은 중간체 발리에논-7P를 통해 진행된다. 문헌 [Wehmeier (2003)]에 의한 정련에서는, 환원 및 탈수 단계가 변경되어 중간체로서 발리올롤-7P가 생성되었다. 단계의 순서는 공지되지 않았기 때문에, 대괄호로 표시된다. 세도-헵툴로스-7P로부터 2-에피-5-에피-발리올론을 형성하기 위한 AcbC에 의한 순환 반응인 아카르보스 생합성의 제1 단계는 본 예시에서 누락되었다. 지난 수십 년 동안 연구의 초점이 되었지만, 여전히 아카르보스 생합성 경로는 아직 완전히 풀리지 않았다. 생합성의 처음 3개 단계만이 실험적으로 확증되었다. 아카르보스 생합성의 제1 효소인 AcbC (ACSP50_3607)는 세도 헵툴로스 7P7P로부터 2-에피-5-에피-발리올론을 생성하는 순환 반응을 촉매한다 (Stratmann et al., 1999). 2-에피-5-에피-발리올론-7P로의 인산화는 ATP의 존재 하에 키나제 AcbM (ACSP50_3603)에 의해 촉매되고 (Zhang et al. 2002), 5-에피-발리올론-7P로의 에피머화는 보조인자 비의존성 에피머라제 AcbO (ACSP50_3606)에 의해 촉매된다 (Zhang et al. 2002; Zhang et al. 2003).
단백질 상동성 및 기능적 예측에 기반한 모델의 나머지 단계 (Zhang et al. (2002), Wehmeier (2003), Wehmeier and Piepersberg (2004), Wehmeier and Piepersberg (2009) and Wendler et al. (2013)): NADH-의존성 (폴리올)데히드로게나제/리덕타제 AcbL (ACSP50_3604) 및 시클리톨 데히드로게나제/옥시도리덕타제 AcbN (ACSP50_3605)은 1-에피-발리에놀-7P로의 환원 및 5,6 탈수를 촉매하는 것으로 제안되었다. 1,7-디포스포-1-에피-발리에놀로의 인산화는 1-에피-발리에놀-7-포스페이트-1-키나제 AcbU (ACSP50_3595) 및/또는 히드롤라제 AcbJ (ACSP50_3600)에 의해 촉매되는 것으로 추정된다. NDP-1-에피-발리에놀-7P로의 뉴클레오티딜화는 GlgC 관련 NDP-폴리올 신타제 AcbR (ACSP50_3597) (1-에피-발리에놀-1,7-비스포스페이트-1-아데닐릴트랜스퍼라제)에 의해 촉매될 수 있으며, 활성화된 중간체에서 활성화된 아미노 당으로의 전이는 글리코실-트랜스퍼라제 AcbI (ACSP50_3599) 및/또는 AcbS (ACSP50_3596)에 의해 매개되어 아카르비오신-7P를 생성하는 것으로 보인다.
활성화된 아미노 당은 3가지 단계에서 D-글루코스-1-포스페이트로부터 합성되는 것으로 가정되며 (Wehmeier and Piepersberg 2004; Wehmeier and Piepersberg 2009; Zhang et al. 2002), 이러한 단계는 (i) dTDP-글루코스-신타제 AcbA (ACSP50_3609)에 의한 dTDP-D-글루코스로의 뉴클레오티딜화, (ii) dTDP-D-글루코스-4,6-데히드라타제 AcbB (ACSP50_3608)에 의한 dTDP-4-케토-6-데옥시-D-글루코스로의 탈수, 및 (iii) GabT-유사 아미노트랜스퍼라제 AcbV (ACSP50_3594)에 의한 dTDP-4-아미노-4,6-디데옥시-D-글루코스로의 아민화 단계이다 (Diaz-Guardamino Uribe 2000; Zhang et al. 2019).
글루코스-1P는 글리코겐 대사, 갈락토스 대사 및 - 글루코스-6P로의 전환 후 - 당분해 과정과 같은 상이한 경로에서 중요한 역할을 하는 분기 대사산물이다 (Frey 1996; Purves 2006). UDP-글루코스-1P 우리딜트랜스퍼라제 GtaB는 글루코스-1P와 UDP-글루코스의 상호 전환을 촉매한다.
마지막으로, 말토스는 잠재적으로 AcbS에 의해 1-단계 반응으로 전이된다 (Hemker et al. 2001). 그러나 AcbI 또는 AcbJ는 또한 전이 반응을 촉매하는 것으로 제안되었다 (Wehmeier and Piepersberg 2004; Wendler et al. 2013). 이러한 반응에 대한 또 다른 후보는 아밀로말타제 AcbQ (ACSP50_3601)일 수 있다.
악티노플라네스 종 SE50/110에서, 생합성 유전자는 1999년 스트라트만(Stratmann) 등에 의해 처음 확인되었고 후속적으로 시퀀싱된 아카르보스 생합성 유전자 클러스터 (acb 유전자 클러스터)에서 구성된다 (진뱅크: Y18523.4) (Stratmann et al. 1999; Thomas 2001). 클러스터는 22개의 유전자를 함유한다 (도 2).
이미 언급된 생합성 유전자 (acbCMOLNUJRSIVBA) 외에도, 클러스터는 세포외 전분 분해 (AcbEZ, ACSP50_3610 및 ACSP50_3590), 트랜스글리코실화 (AcbD, ACSP50_3611) 및 아카르보스 유출 (AcbWXY, ACSP50_3591-3)에서의 기능을 코딩한다. 또한, 아카르보스-7-키나제 (AcbK, ACSP50_3602)와 세포내 아밀로말타제 (AcbQ)가 코딩되어 있으며, 이는 카르보포어 내의 기능에 할당되었다 (Wendler et al. 2015b; Schwientek et al. 2012; Wehmeier and Piepersberg 2009). NTP-피로포스포히드롤라제로서 주석이 달린 AcbP (ACSP50_3598)의 기능은 공지되어 있지 않다.
가능한 대사 관련성이 있는
악티노플라네스
단백질
단일 CBM-20 도메인 단백질 Cgt는 악티노플라네스 종 SE50/110 및 파생된 아카르보스 생산자 균주에서 가장 강하게 발현되는 유전자 중 하나이다 (Ortseifen 2016; Wendler et al. 2015a; Schwientek et al. 2013). 이것은 SignalP 분석 (Almagro Armenteros et al. 2019)에 따라 Sec-경로를 통해 분비되며, 이러한 유기체의 총 분비된 프로테옴의 최대 8%를 구성한다 (데이터는 제시되지 않음). Cgt는 149개의 아미노산과 β-샌드위치 구조를 특징으로 하는 폴드-패밀리 1, 작용기 A의 CBM-20 도메인을 함유한다 (Schwientek et al. 2013; Guillen et al. 2010). 이러한 패밀리의 구성원은 전분과 결합하는 것으로 기재된다 (Guillen et al. 2010).
악티노플라네스에서
유전자 결실을 위한 방법
속간 접합 시스템 (Gren et al. 2016)과 CRISPR/Cas9 기술 (Wolf et al. 2016)의 확립으로 악티노플라네스 종 SE50/110에서의 게놈 편집이 가능해진다.
또한, 본 발명에 따르면, 본 발명자들은 문헌 [Zhao et al. (2017)]에 기재된 바와 같이, 인테그라제가 없는 벡터 백본과 역선택을 위해 CodA를 사용하는 상동 재조합을 통해 신규 결실 시스템을 성공적으로 확립하였다. 이로써 악티노플라네스 종 SE50/110에 대한 유전자 도구상자는 추가로 확장될 수 있었다. 원리 증명으로서 신규 결실 시스템은 예시 유전자 cgt의 결실에 대해 성공적으로 테스트되었다. 상동 재조합 (HR)은 악티노박테리아에서의 통상적인 프로세스이며, 이중 교차를 통해 결실 돌연변이체를 생성하는 데 기술적으로 사용될 수 있다. pSG5 레플리콘과 같은 온도-감수성 레플리콘은 이러한 프로세스를 지원하고 강제할 수 있다 (Du et al. 2015; Garg and Parry 2010; Myronovskyy et al. 2009; Zhang and Parry 2007). 추가 방법, 예를 들어 문헌 [Tong et al. 2019]에 따른 단일 뉴클레오티드 교환을 위한 CRISPR-염기 편집 시스템, CRISPR-BEST, 문헌 [Qi et al. 2013]에 따른 CRISPRi/dCas9, RNA 간섭 등이 관련 기술분야에 존재한다.
악티노플라네스에서
유전자 과다발현을 위한 방법
악티노플라네스 종 SE50/110은 지난 수십 년 동안 광범위하게 연구되었다. 적절한 발현 시스템은 설계하기 어렵다 (문헌 [Schaffert et al. (2019)] 참조). 이러한 간행물의 전체 내용, 특히 악티노플라네스의 유전자 조작을 위한 발현 시스템 및 프로모터에 대한 설명은 그 전체 내용이 본원에 포함된다.
이전 연구에서는 에이. 테이코미세티쿠스(A. teichomyceticus)에서 pKC1139를 사용하여 유전자를 성공적으로 발현하는 것으로 제시된 바 있다 (Horbal et al. 2012). 그러나, 복제 pSG5-기반 벡터 pKC1139 (문헌 [Bierman et al.(1992)]에 의해 구축됨)는 악티노플라네스 종 SE50/110에서의 상동 유전자의 발현에 부적합한 것으로 밝혀졌는데, 이는 상동 재조합에 의한 원치 않는 벡터 통합이 발생하기 때문이다 (문헌 [Schaffert et al. (2019)] 참조). 이것은 추정상 벡터 복제의 높은 대사 비용으로 인해 선호되는 프로세스인 것으로 보인다. 이론에 얽매이는 것은 아니지만, SE50/110에서 ACSP50_7170에 의해 코딩된 단백질은 재조합효소 A (recA)로서 예측되어 재조합 프로세스를 촉매할 수 있다. 흥미롭게도, 에이. 테이코미세티쿠스의 게놈에서는 recA의 상동체가 발견되지 않았다. 악티노플라네스 종 SE50/110에서의 recA의 존재 및 에이. 테이코미세티쿠스에서의 결여는 HR-매개 벡터 통합이 에이. 테이코미세티쿠스에 대해 이전에 보고되지 않은 이유에 대한 결정적인 설명을 제공한다. 따라서 pSG5-기반 복제 발현 시스템은 악티노플라네스 종 SE50/110에서 재조합효소 유전자 recA를 결실시킴으로써 구현될 수 있다.
SCP2*-레플리콘을 기반으로 하는 pKC1218 (Kieser et al. 2000)과 pIJ101-레플리콘을 기반으로 하는 pSOK101 (Zotchev et al. 2000)과 같은 다른 복제 스트렙토미세스-이. 콜라이(E. coli) 셔틀 플라스미드는 악티노플라네스 종 SE50/110과의 접합완료체를 제공하지 않았다 (Gren 2017). 이러한 레플리콘은 아마도 SE50/110에서 불안정하거나 불활성일 수 있으며, 이는 관련 종 에이. 테이코미세티쿠스로부터의 발견에 따른 것이다 (Horbal et al. 2012).
통합 벡터 시스템을 사용함으로써, 별개의 게놈 위치에서 부가의 유전자 카피를 운반하는 완전한 벡터의 통합에 의해 유전적 중복이 달성될 수 있다. 이러한 프로세스는 파지 인테그라제에 의해 매개된다. 파지 인테그라제는 플라스미드에 국한된 attP와 숙주 염색체에 국한된 attB의 두 부착 부위의 표적화된 단방향 재조합을 촉매한다 (te Poele et al., 2008). 통합 후, 벡터는 attP-attB-재조합으로부터 유래된 부착 부위 좌측 (attL)과 우측 (attR)에 의해 플랭킹된다 (te Poele et al., 2008).
악티노플라네스 종 SE50/110에 대해 4가지 상이한 통합 벡터가 설명되었다 (Gren et al. 2016): 2개는 파지 φC31의 통합 메커니즘을 기반으로 한다 (pSET152 및 pIJ6902). 벡터 pRT801/2 및 pSOK804는 파지 φBT1 및 VWB-파지의 통합 메커니즘을 기반으로 한다. 그러나, 천연 프로모터를 사용하여 상대적 전사체 양을 두 배로 늘리는 것은 달성되지 않았다 (문헌 [Schaffert et al. (2019)] 참조).
통합
벡터에 대한 상종 및
이종 프로모터의 평가
강도와 관련하여 상종 및 이종 프로모터를 평가하는 방법은 그 전체 내용이 본원에 포함되는 문헌 [Schaffert et al. (2019)]에 제공된다. 간단히 언급하면, 통합 φC31-기반 벡터 pSET152가 악티노플라네스 종 SE50/110에서 프로모터 스크리닝에 사용되었다 (Gren et al. 2016). 13개의 상동 및 이종 프로모터의 프로모터 강도는 단백질 수준에서 분석되었고, 이들 중 12개는 전사체 수준에서 분석되었다 (표 1, 도 3).
표 1. 프로모터 스크리닝 실험에서 테스트된 리포터 유전자 gusA를 수반한 구축물.
전략
본 발명의 경우, 유전자 결실 및 과다발현에 의해 아카비오실-말토스 대사를 연구하여 아카르보스의 개선된 생산을 위한 균주를 조작하는 일련의 관련 도구 및 방법을 도출하였다. 아카르비오스 합성을 개선시키기 위해, 3가지 상이한 전략을 수행하였다: (i) 아카르보스 생합성을 통한 플럭스를 증강시키기 위한 acb 유전자의 유전자 용량 증가, (ii) 아카르보스 생합성의 전구체 전개 및 (iii) 대사 부담 감소 (도 4). 이러한 관련 전략 각각에 대한 접근 방식은 놀랍게도 개선된 아카르보스 형성으로 이어졌다: dTDP-D-글루코스-4,6-데히드라타제 AcbB의 과다발현에 의해, 최종 아카르보스 농도는 대략 50%만큼 상당히 증가되었다. 우리딜트랜스퍼라제의 과다발현에 의해 GtaB 아카르보스 수율이 8.5%만큼 개선되었는데, 이는 아마도 전구체 글루코스-1P의 공급이 개선되었기 때문일 것이다. 작은 탄수화물 결합 단백질 Cgt의 기능적 결실에 의해, 아카르보스 형성이 8 - 16%만큼 상당히 증강되었으며, 이는 아마도 대사 부담이 감소했기 때문일 수 있다. 증강은 장기간에 걸쳐 상이한 배양 환경에서 강력하였다.
더욱이, 빛에 노출된 경우 및 빛으로부터 감춰진 경우의 야생형 및 조절인자 돌연변이체 ΔmerR의 성장 실험을 시행한 결과, 광 유발 스트레스 및 카로티노이드 형성이 아카르보스 생산에 부정적인 영향을 미치는 것으로 밝혀졌다. 결과적으로, 카로티노이드 형성을 감소시킴으로써 아카르보스 생산을 더욱 개선시킬 수 있다.
도 1. 악티노플라네스 종 SE50/110에서의 아카르비오실-말토스의 생합성 모델. 2-에피-5-에피-발리올론으로부터의 아카르보스 생합성의 11가지 단계가 제시되어 있다 (Zhang (2002))
도 2. 악티노플라네스 종 SE50/110 (진뱅크: LT827010.1)의 게놈에서 아카르보스 생합성 유전자 클러스터 및 유전자 배치 (Schaffert, et al. 2019).
도 3. 악티노플라네스 종 SE50/110 균주에서 단백질과 전사체 수준에 대한 프로모터 스크리닝, 표 1 참조. 좌측에는 정규화된 글루쿠로니다제 활성 (절대값)이 제시되고 우측에는 RT-qPCR에 의해 계산된 gusA 유전자의 상대적 전사체 양이 제시된다. 글루쿠로니다제 검정의 경우, 인디고의 흡수 곡선의 기울기는 선형 회귀에 의해 계산되었고 세포 건조 중량에 의해 정규화되었다. 정규화된 활성은 양측 t-검정에서 pGUS와 비교하여 유의한 차이에 대해 테스트되었다 (p-값: P2475: 0.8889, Pefp: 3.048e-07, PcdaR: 8.967e-07, PrpsL: 1.296e-08, PrpsJ: 0.0003677, Pcgt: 2.183e-06, PtipA: 0.0001651, Papm: 0.0001078, PermE *: 0.007406, PkatE: 0.002577, PmoeE5: 0.001809, PgapDH: 0.0005821, Pact: 0.02042). gusA 유전자의 상대적 전사체 양을 pGUS-벡터와 관련하여 분석하였다 (1로 설정됨). act-프로모터의 경우, 심각한 성장 결핍으로 인해 RNA를 단리할 수 없었다. 잔여 프로모터의 경우, 상대적 전사체 양에서의 상당한 증가가 측정되었다 (양측 t-검정의 p-값: P2475: 0.0001133, Pefp: 4.871e-05, PcdaR: 0.002509, PrpsL: 9.928e-06, PrpsJ: 1.167e-08, Pcgt: 5.911e-08, PtipA: 7.158e-06, Papm: 4.596e-05, PermE *: 0.0009364, PkatE: 0.0001373, PmoeE5: 0.0002518, PgapDH: 4.207e-06). 계산된 p-값의 유의한 수준은 별표로 제시된다: * < α = 5%, ** < α = 1%, *** < α = 0.1%. 문헌 [Schaffert, et al. 2019]에 공개된 도면.
도 4. 개선된 아카르보스 생산을 위한 전략. 아카르보스 생산을 개선시키기 위해 3가지 사이한 전략이 제공된다: 1. 아카르보스 생합성 유전자의 유전자 용량 증가, 2. 아카르보스 생합성의 전구체 전개 및 3. 유전자 결실에 의한 대사 부담 감소. 본 작업에서 평가된 표적 유전자가 제시된다. 더욱이, 단일 유전자의 과다발현을 위해 과다발현 시스템을 구현해야 했다.
도 5. 아카르보스의 화학 구조. 아카르보스는 아카르비오스라고 불리는 슈도디사카라이드 (발리에나미닐-4-아미노-4,6-디데옥시글루코스)와 말토스로 구성된 시클리톨 함유 아미노글리코시드이다. 둘 다 α-1,4-글리코시드 결합에 의해 연결된다. 문헌 [Wolf 2017]에 공개된 도면.
도 6. 신규 클로닝 시스템 pSETT4의 벡터 카드 (서열식별번호(SEQ ID NO): 110, 서열식별번호: 111 참조). 프로모터, 예컨대 에게르텔라 렌타(Eggerthella lenta)로부터의 유전자 gapDH의 강한 프로모터 또는 tipA 프로모터는 발현 카세트, 예를 들어 lacZ 카세트 앞에 클로닝된다. lacZ-카세트는 제한 효소, 예를 들어 BsaI의 인식 측면에 의해 플랭킹된다. 제한 부위는 깁슨 어셈블리, 제한/라이게이션 클로닝 또는 골든 게이트 클로닝에 의해 관심 유전자에 의한 lacZ의 교환을 가능하게 한다. 종결을 위해, T4-종결인자가 클로닝 측 전후에 도입된다. 클로닝 측 뒤에서 2개의 역평행 지향 T4-종결인자는 양방향으로부터의 번역-초과를 방지해야 한다. 프로모터 서열의 교환을 위해, 추가 제한 부위, 예를 들어 NdeI 및 KpnI 제한 부위가 도입되었다. 더욱이, 벡터는 파지 φC31의 인테그라제 유전자 int 및 부착 부위 attP, 전이 기점 (ncP) 및 릴랙소좀 유전자 traJ, 높은 카피 수 ColE1/pMB1/pBR322/pUC 복제 기점 및 내성 유전자 (여기서: 아프라마이신 내성 유전자 aac(3)IV(apmR))를 포함한다.
도 7. 신규 결실 시스템의 계획과 상동 재조합 동안의 프로세스 (제1 및 제2 교차). 벡터 통합의 선택은 아프라마이신 또는 카나마이신을 사용하여 수행된다 (제1 교차, apmR 또는 kanR에 의해 매개된 내성). 역선택은 5-플루오로우라실을 사용하여 수행된다 (제2 교차, codA에 의해 매개된 감도).
도 8. 상동 재조합을 사용한 신규 결실 시스템의 작업 흐름.
도 9. Cgt의 아미노산 서열에 대한 BlastP 분석은 단일 CBM-20 도메인으로 이루어진 17개의 다른 단백질을 식별한다. BlastP에 의해 수행된 다중 서열 정렬을 기반으로 단백질 트리가 생성되고 시각화되었다 (Altschul et al. 1990). 이러한 단백질 트리는 NCBI 수탁 번호 및 그의 숙주로써 식별되는 18개의 단일 CBM-20 도메인 단백질의 거리를 제시한다. 괄호 안에 BlastP 분석의 서열 동일률과 양성률이 백분율로 제시된다.
도 10. 상이한 탄소 공급원이 보충된 (동일한 C-몰량) 최소 배지에서의 야생형 악티노플라네스 종 SE50/110의 성장. 적어도 3개의 생물학적 복제물의 세포 건조 중량과 표준 편차가 제시된다 (nglc = 3, nmal = 5, ncel = 4, nlac = 3, nara = 5, nstarch = 5).
도 11. a. 말토스 최소 배지에서 성장한 배양물과 비교하여, 탄소 공급원으로서 전분, C-Pur, 글루코스, 갈락토스, 셀로비오스 또는 락토스가 보충된 최소 배지에서 성장한 악티노플라네스 종 SE50/110에서의 cgt의 상대적 전사체 양. 양측 t-검정에서의 차이에 대한 테스트는 말토스와 비교하여 탄소 공급원 글루코스 (p-값 = 0.002848), 갈락토스 (p-값 = 0.002945) 및 락토스 (p-값 = 0.00114) 상에서의 cgt 유전자의 유의한 차등 유전자 발현을 표시하였다. b . 72.06 g·L-1 말토스에서 성장한 배양물과 비교하여 44.40 g·L-1 말토스가 보충된 말토스 최소 배지에서 성장한 악티노플라네스 종 SE50/110에서의 cgt의 상대적 전사체 양. 양측 t-검정에서의 차이에 대한 검정은 감소된 양의 말토스를 함유하는 배지에서 cgt의 유의하게 감소된 유전자 발현을 표시하였다 (p-값 = 0.04141).
도 12. 상이한 탄소 공급원이 보충된 최소 배지에서의 악티노플라네스 종 SE50/110의 야생형 및 결실 돌연변이체 Δcgt의 성장. 시간에 따른 세포 건조 중량 및 표준 편차가 제시된다 (야생형: nglc = 3, nmal = 5, ncel = 4, nlac = 3, nara = 5, nstarch = 5, Δcgt: nglc = 2, nmal = 5, ncel = 4, nlac = 4, nara = 5, nstarch = 5).
도 13. 6가지 상이한 탄소 공급원이 보충된 최소 배지에서 야생형 및 Δcgt 돌연변이체의 배양에서 수득된 최종 세포 건조 중량. 오차 막대는 표준 편차를 나타낸다.
도 14. 탄소 공급원으로서 제한된 양의 전분 하에 Δcgt 및 야생형의 성장. 배지에 1 g·L-1, 2 g·L-1, 3 g·L-1, 4 g·L-1 및 5 g·L-1 전분을 보충시키고 m2p 랩스의 로보렉터(RoboLector)® 시스템에서 배양을 수행하였다. 막대 다이어그램의 후방산란 신호와 적어도 3개의 생물학적 복제물의 표준 편차가 제시된다. Δcgt에 대한 성장 억제는 관찰되지 않았다. 1 g·L-1의 경우, 성장이 상당히 더 증강되는 것으로 밝혀졌다 (양측 t-검정의 p-값: 0.006141, nwt = 3, nΔcgt = 4).
도 15. 말토스 최소 배지에서 pH 스크리닝 실험의 최종 세포 건조 중량. 악티노플라네스 종 SE50/110의 야생형 및 Δcgt 돌연변이체는 m2p-랩스의 로보렉터® 시스템에 있는 48-웰 플라워플레이트에서 1 mL 반응 용적으로 성장되었다. 4 내지 7 범위의 pH에서는, 최종 세포 건조 중량에 있어서의 유의한 차이가 관찰되지 않았다 (양측 t-검정에 의해 검정됨, nwt = 3, nΔcgt = 4).
도 16. m2p-랩스의 로보렉터® 시스템에서 오스몰농도 내성 스크리닝: 말토스 일수화물 농도가 3.6 내지 108.1 g·L-1인 말토스 최소 배지에서 최종 세포 건조 중량. 유의한 성장 차이는 관찰되지 않았다 (양측 t-검정에 의해 검정됨, nwt = 3, nΔcgt = 4).
도 17. m2p-랩스의 로보렉터® 시스템에서 오스몰농도 내성 스크리닝: 말토스 최소 배지에서 오스몰농도 스크리닝 실험의 최종 세포 건조 중량. 0 mM 내지 280 mM 범위의 농도로 이노시톨을 부가함으로써 상이한 오스몰농도를 달성하였다. 야생형과 Δcgt 간에는 유의한 성장 차이가 관찰되지 않았다 (양측 t-검정에 의해 검정됨, nwt = 3, nΔcgt = 4).
도 18. 각각 11.0 g·L-1 말토스- 및 10.0 g·L-1 글루코스-일수화물이 보충된 복합 배지 NBS에서 악티노플라네스 종 SE50/110 야생형 및 Δcgt 돌연변이체의 성장 및 아카르보스 생산. 차별적인 성장은 검출되지 않았다. 성장기 동안, 상당히 증가된 아카르보스 농도가 Δcgt에서 측정되었다 (배양 49시간 후 t-검정의 유의성: p-값 = 0.006778, nwt -acb = 3, nΔcgt -acb = 3, nwt - cdwGlc = 4, nΔcgt - cdwGlc = 3, nwt-cdwMal = 4, nΔcgt-cdwMal = 4).
도 19. a. 막대 차트에서 세포 건조 중량을 기준으로 한 아카르보스의 최종 수율 계수. 오차 막대는 가우스 오차 전파에 의해 계산되었다. b . 말토스 최소 배지에서 배양하는 동안 상등액 중의 세포 건조 중량 및 아카르보스 농도 (ncdw = 5, nacb = 4).
도 20. 말토스 최소 배지에서 성장한 악티노플라네스 종 SE50/110의 야생형과 비교하여 돌연변이체 Δcgt의 유전자 acbZ, acbW, acbV, acbA, acbB, acbE 및 acbD의 상대적 전사체 양 (n = 3-6).
도 21. 악티노플라네스 종 SE50/110에서의 카로티노이드 생합성의 재구축. NCBI 데이터베이스에 대항한 BLASTX 분석에 의해 식별된 악티노플라네스 종 SE50/110에서 추정되는 상동 유전자가 제시된다. 유전자 및 게놈의 교토 백과사전의 도움으로 재구축을 수행하였다 (Kanehisa et al. (2014)).
a. 메발로네이트 경로의 대체 대사 경로로서 공지되기도 한, 이소프레노이드 전구체 이소펜테닐 피로포스페이트 (IPP) 및 디메틸알릴 피로포스페이트 (DMAPP)의 생합성을 위한 메틸에리트리톨포스페이트 (MEP) 경로.
b-c: 카로티노이드 생합성. b . 이소프레노이드 전구체로부터 리코펜의 형성. c. 살리노스포라 트로피카(Salinospora tropica) CNB-440에서 글리코실화된 카로티노이드 시옥산틴의 합성 (문헌 [Richter et al.(2015)]의 도 1).
d. 악티노플라네스 종 SE50/110에서 확인된 유전자의 게놈 구성. 유전자 클러스터 2b는 박테리아 및 진균 게놈에서 2차 대사산물 생합성 유전자 클러스터의 주석 및 분석을 위한 신속한 게놈 전체 식별 도구인 antiSMASH에 의한 분석에 따라 살리노스포라 트로피카 CNB-440의 시옥산틴 유전자 클러스터에 대한 상동성을 표시한다 (Weber et al., 2015).
도 22. 빛에 노출된 경우 및 빛으로부터 가려진 경우의 악티노플라네스 종 SE50/110의 성장, 아카르보스 및 색소 형성. a . 전구 빛 (22-44 μE, 1 μE = μmol광자 m-2 s- 1)에 노출되거나 전구 빛으로부터 가려진 말토스 최소 배지에서의 야생형 악티노플라네스 종 SE50/110의 배양. 5개의 생물학적 복제물의 세포 건조 중량과 3개의 생물학적 복제물의 상등액 중 아카르보스 농도가 제시된다. b . 최종 배양 시간에서의 펠릿 및 상등액. c . 자연광에 노출되거나 자연광으로부터 가려진 SFM 한천 플레이트 상의 고체 배양물에서의 성장 및 색소 형성.
도 23. 테르펜 클러스터 1에서 MerR-조절인자를 코딩하는 유전자의 위치 및 악티노플라네스 종 SE50/110의 게놈에서의 그의 배치 (도 21 및 표 E12 참조). 클러스터의 유전자는 MerR-유사 전사 조절인자 (ACSP50_0145), 이소펜테닐-디포스페이트 델타-이소머라제 (idi, ACSP50_0146), 피토엔 데히드로게나제 (crtI, ACSP50_0147), 폴리프레닐 신테타제 (crtE, ACSP50_0148), 피토엔 신타제 (crtB, ACSP50_0149), 데옥시리보디피리미딘 포토-리아제 (ACSP50_0150) 및 피리딘 뉴클레오티드-디술피드 옥시도리덕타제 (ACSP50_0151)를 코딩한다.
도 24. 빛에 노출된 경우 및 빛으로부터 가려진 경우의 악티노플라네스 종 SE50/110 및 결실 돌연변이체 ΔmerR의 성장, 아카르보스 및 색소 형성. a . 전구 빛 (22-44 μE, 1 μE = μmol광자 m-2 s- 1)에 노출되거나 전구 빛으로부터 가려진 말토스 최소 배지에서의 악티노플라네스 종 SE50/110의 야생형 및 결실 돌연변이체 ΔmerR의 배양. 적어도 4개의 생물학적 복제물의 세포 건조 중량과 3개의 생물학적 복제물의 상등액 중의 아카르보스 농도가 제시된다. b . 최종 배양 시간에서의 펠릿 및 상등액. c . 고체 배지 (SFM 한천 플레이트)에서의 성장 및 색소 형성. d. 최대 아카르보스 농도 (양측 t-검정의 p-값: wt 어두움 vs. wt 밝음: 0.003975, wt 어두움 vs. ΔmerR 어두움: 0.09711, wt 어두움 vs. ΔmerR 밝음: 0.007043, ΔmerR 어두움 vs. wt 밝음: 0.02081, ΔmerR 어두움 vs. ΔmerR 밝음: 0.0002131). e . 어두운 조건 하에 배양될 때 야생형 (1의 값으로 설정됨)과 비교하여 결실 돌연변이체에서의 유전자 crtE (ACSP50_0148), crtB (ACSP50_0149), crtI (ACSP50_0147), idi (ACSP50_0146) 및 merR (ACSP50_0145)의 상대적 전사체 양 (양측 t-검정의 p-값: crtE: 0.04245, crtB: 0.01017, crtI: 0.07162, idi: 0.004366). 별표는 유의성 수준을 나타낸다: * p-값 < α = 5%, ** p-값 < α = 1%, *** p-값 < α = 0.1%.
도 25. 어두운 곳에서 성장한 배양물과 비교하여 빛에 노출된 악티노플라네스 종 SE50/110에서 차등적으로 전사된 유전자의 비율/강도 플롯. 비율 (log2(변화 배수))은 마이크로어레이 실험의 평균 강도에 대항하여 플롯된다. 더 어두운 점은 빛으로부터 가려진 배양물과 비교하여 빛에 노출된 배양물에서 상당한 차등 전사 수준을 갖는 유전자를 나타낸다.
도 26. pSET152-벡터 시스템에서 관심 유전자 뒤에 있는 추정 안티센스 프로모터의 TSS를 제시하는 ReadXplorer (Hilker et al. 2016; Hilker et al. 2014) 뷰. TSS는 풀링된 1차 전사체 라이브러리의 시퀀싱에 의해 결정되었다. pGUS::Papm:gusA의 통합 벡터-돌연변이체에 매핑된 예시적인 스택 읽기가 제시된다. 2개의 TSS (상자로 둘러싸여 있음)는 안티센스 배향 (a)에서 관심 유전자 뒤에 국한된다. 이러한 TSS는 σA/RNA-폴리머라제 복합체에 의해 프로모터 서열로서 추정상 인식되는 벡터 백본 상의 서열 모티프 (b)에 할당될 수 있다. -10- 및 -35-헥사머의 보존된 뉴클레오티드가 강조 표시된다. TG-이량체는 존재하는 경우 흑색 볼드체 글자로 제시된다. 헥사머 사이의 거리는 s1로 표시되고; -10-모티프와 TSS 사이의 거리는 s2로 제시된다.
도 27. 말토스 최소 배지에서 acbB 과다발현 균주의 성장 및 아카르보스 생산. 2가지 독립적인 배양이 제시된다 (a 및 b). RNA 단리를 위한 샘플링 시간은 t1 ("초기 성장기") 및 t2 ("선형 성장기")로 표시된다.
도 28. 말토스 최소 배지에서 acbB 과다발현 돌연변이체의 수율 계수. 이종 tipA-프로모터의 제어 하에 전사된 acbB를 갖는 돌연변이체는 증강된 수율 계수 (대략 50%)를 표시한 반면, gapDH-프로모터가 있는 구축물에 대해서는 약간의 차이만이 관찰되었다. 오차는 가우스 오차 전파에 의해 계산되었다. 모든 차이는 양측 t-검정에 의해 유의성에 대해 검정되었다 (본 도면에 할당된 약어). 별표는 유의성 수준을 나타낸다: * p-값 < α = 5%, ** p-값 < α = 1%, *** p-값 < α = 0.1%.
도 29. LC-MS에 의한 acbB 과다발현 돌연변이체의 세포내 대사산물의 분석. 질량 m/z = 545 [M-H+]의 정규화된 피크 면적이 제시된다. a . 글루코스-1P 및 갈락토스-1P (m/z = 259 [M-H+]. b . 글루코스-6P (m/z = 259 [M-H+] 및 c. UDP-글루코스 (m/z = 565 [M-H+]). d . UDP-글루코스의 정규화된 피크 면적 (양측 t-검정의 p-값: Ptip: 0.01068, Pgap: 0.001356) 및 질량 m/z = 545 [M-H+] (양측 t-검정의 p-값: Ptip: 0.0412)에 대하여 빈 벡터 대조군과 비교하여 유의한 차이가 관찰되었다.
도 30. 초기 성장기의 acbB 과다발현 돌연변이체에서 유전자 acbB, acbA 및 acbV의 상대적 전사체 양. 적어도 3개의 생물학적 복제물의 평균 및 표준 편차가 제시된다. 빈 벡터 대조군 (1의 값으로 설정됨)에 대한 차이는 양측 t-검정에 의해 검정되었다 (pSETT4gap::acbB, pSETT4tip::acbB, pSETT4::PacbB:acbB, pSET152::PacbB:acbB에 상응하는 좌측에서 우측으로 p-값: acbB: 4.332e-05, 4.561e-06, 0.3511, 0.7082; acbA: 0.3384, 0.0001164, 0.5967, 0.4246; acbV: 0.3033, 0.0423, 0.73, 0.4687). 별표는 유의성 수준을 나타낸다: * p-값 < α = 5%, ** p-값 < α = 1%, *** p-값 < α = 0.1%.
도 31. 선형 성장기에서 acbB-과다발현 돌연변이체에서의 유전자 acbB의 상대적 전사체 양. 적어도 3개의 생물학적 복제물의 평균 및 표준 편차가 제시된다. RT-qPCR은 양측 t-검정에 의해 검정된 (pSETT4gap::acbB, pSETT4tip::acbB, pSETT4::PacbB:acbB, pSET152::PacbB:acbB에 상응하는 좌측에서 우측으로의 p-값: acbB: 0.02217, 0.02771, 0.03895, 0.1582) 빈 벡터 대조군 (1의 값으로 설정됨)과 비교하여 유전자 발현에 있어서의 유의한 차이를 나타낸다. 별표는 유의성 수준을 나타낸다: * p-값 < α = 5%, ** p-값 < α = 1%, *** p-값 < α = 0.1%.
도 32. 말토스 최소 배지에서 gtaB 과다발현 돌연변이체의 성장 및 아카르보스 생산. RNA 단리를 위한 샘플링 시간은 화살표로 표시된다.
도 33. 과다발현 돌연변이체에서 gtaB의 상대적 전사체 양. RT-qPCR은 빈 벡터 대조군 (1의 값으로 설정됨)과 비교하여 gtaB 발현의 상당한 증가를 나타낸다 (양측 t-검정의 p-값: 0.01295). 별표는 유의성 수준을 나타낸다: * p-값 < α = 5%, ** p-값 < α = 1.
도 34. LC-MS에 의한 gtaB 과다발현 돌연변이체의 세포내 대사산물의 분석. 유전자 gtaB의 과다발현 균주에서 질량 m/z = 545 [M-H+] (a), 글루코스-1P 및 갈락토스-1P (m/z = 259 [M-H+] (b), 글루코스-6P (m/ z = 259 [M-H+]) (c) 및 UDP-글루코스 (m/z = 565 [M-H+]) (d)의 피크 면적이 제시된다. 질량 m/z = 545 [M-H+]의 정규화된 피크 면적에 대해 빈 벡터 대조군과 비교하여 유의한 차이가 관찰되었다 (양측 t-검정의 p-값: 0.01531). 다른 모든 피크 면적은 양측 t-검정에 따라 유의하게 상이하지 않다.
서열식별번호의 간단한 설명
본 출원과 관련된 서열 목록은 전자 형식으로 제출되며 이로써 그 전체 내용이 본 명세서에 참조로 포함된다.
도 2. 악티노플라네스 종 SE50/110 (진뱅크: LT827010.1)의 게놈에서 아카르보스 생합성 유전자 클러스터 및 유전자 배치 (Schaffert, et al. 2019).
도 3. 악티노플라네스 종 SE50/110 균주에서 단백질과 전사체 수준에 대한 프로모터 스크리닝, 표 1 참조. 좌측에는 정규화된 글루쿠로니다제 활성 (절대값)이 제시되고 우측에는 RT-qPCR에 의해 계산된 gusA 유전자의 상대적 전사체 양이 제시된다. 글루쿠로니다제 검정의 경우, 인디고의 흡수 곡선의 기울기는 선형 회귀에 의해 계산되었고 세포 건조 중량에 의해 정규화되었다. 정규화된 활성은 양측 t-검정에서 pGUS와 비교하여 유의한 차이에 대해 테스트되었다 (p-값: P2475: 0.8889, Pefp: 3.048e-07, PcdaR: 8.967e-07, PrpsL: 1.296e-08, PrpsJ: 0.0003677, Pcgt: 2.183e-06, PtipA: 0.0001651, Papm: 0.0001078, PermE *: 0.007406, PkatE: 0.002577, PmoeE5: 0.001809, PgapDH: 0.0005821, Pact: 0.02042). gusA 유전자의 상대적 전사체 양을 pGUS-벡터와 관련하여 분석하였다 (1로 설정됨). act-프로모터의 경우, 심각한 성장 결핍으로 인해 RNA를 단리할 수 없었다. 잔여 프로모터의 경우, 상대적 전사체 양에서의 상당한 증가가 측정되었다 (양측 t-검정의 p-값: P2475: 0.0001133, Pefp: 4.871e-05, PcdaR: 0.002509, PrpsL: 9.928e-06, PrpsJ: 1.167e-08, Pcgt: 5.911e-08, PtipA: 7.158e-06, Papm: 4.596e-05, PermE *: 0.0009364, PkatE: 0.0001373, PmoeE5: 0.0002518, PgapDH: 4.207e-06). 계산된 p-값의 유의한 수준은 별표로 제시된다: * < α = 5%, ** < α = 1%, *** < α = 0.1%. 문헌 [Schaffert, et al. 2019]에 공개된 도면.
도 4. 개선된 아카르보스 생산을 위한 전략. 아카르보스 생산을 개선시키기 위해 3가지 사이한 전략이 제공된다: 1. 아카르보스 생합성 유전자의 유전자 용량 증가, 2. 아카르보스 생합성의 전구체 전개 및 3. 유전자 결실에 의한 대사 부담 감소. 본 작업에서 평가된 표적 유전자가 제시된다. 더욱이, 단일 유전자의 과다발현을 위해 과다발현 시스템을 구현해야 했다.
도 5. 아카르보스의 화학 구조. 아카르보스는 아카르비오스라고 불리는 슈도디사카라이드 (발리에나미닐-4-아미노-4,6-디데옥시글루코스)와 말토스로 구성된 시클리톨 함유 아미노글리코시드이다. 둘 다 α-1,4-글리코시드 결합에 의해 연결된다. 문헌 [Wolf 2017]에 공개된 도면.
도 6. 신규 클로닝 시스템 pSETT4의 벡터 카드 (서열식별번호(SEQ ID NO): 110, 서열식별번호: 111 참조). 프로모터, 예컨대 에게르텔라 렌타(Eggerthella lenta)로부터의 유전자 gapDH의 강한 프로모터 또는 tipA 프로모터는 발현 카세트, 예를 들어 lacZ 카세트 앞에 클로닝된다. lacZ-카세트는 제한 효소, 예를 들어 BsaI의 인식 측면에 의해 플랭킹된다. 제한 부위는 깁슨 어셈블리, 제한/라이게이션 클로닝 또는 골든 게이트 클로닝에 의해 관심 유전자에 의한 lacZ의 교환을 가능하게 한다. 종결을 위해, T4-종결인자가 클로닝 측 전후에 도입된다. 클로닝 측 뒤에서 2개의 역평행 지향 T4-종결인자는 양방향으로부터의 번역-초과를 방지해야 한다. 프로모터 서열의 교환을 위해, 추가 제한 부위, 예를 들어 NdeI 및 KpnI 제한 부위가 도입되었다. 더욱이, 벡터는 파지 φC31의 인테그라제 유전자 int 및 부착 부위 attP, 전이 기점 (ncP) 및 릴랙소좀 유전자 traJ, 높은 카피 수 ColE1/pMB1/pBR322/pUC 복제 기점 및 내성 유전자 (여기서: 아프라마이신 내성 유전자 aac(3)IV(apmR))를 포함한다.
도 7. 신규 결실 시스템의 계획과 상동 재조합 동안의 프로세스 (제1 및 제2 교차). 벡터 통합의 선택은 아프라마이신 또는 카나마이신을 사용하여 수행된다 (제1 교차, apmR 또는 kanR에 의해 매개된 내성). 역선택은 5-플루오로우라실을 사용하여 수행된다 (제2 교차, codA에 의해 매개된 감도).
도 8. 상동 재조합을 사용한 신규 결실 시스템의 작업 흐름.
도 9. Cgt의 아미노산 서열에 대한 BlastP 분석은 단일 CBM-20 도메인으로 이루어진 17개의 다른 단백질을 식별한다. BlastP에 의해 수행된 다중 서열 정렬을 기반으로 단백질 트리가 생성되고 시각화되었다 (Altschul et al. 1990). 이러한 단백질 트리는 NCBI 수탁 번호 및 그의 숙주로써 식별되는 18개의 단일 CBM-20 도메인 단백질의 거리를 제시한다. 괄호 안에 BlastP 분석의 서열 동일률과 양성률이 백분율로 제시된다.
도 10. 상이한 탄소 공급원이 보충된 (동일한 C-몰량) 최소 배지에서의 야생형 악티노플라네스 종 SE50/110의 성장. 적어도 3개의 생물학적 복제물의 세포 건조 중량과 표준 편차가 제시된다 (nglc = 3, nmal = 5, ncel = 4, nlac = 3, nara = 5, nstarch = 5).
도 11. a. 말토스 최소 배지에서 성장한 배양물과 비교하여, 탄소 공급원으로서 전분, C-Pur, 글루코스, 갈락토스, 셀로비오스 또는 락토스가 보충된 최소 배지에서 성장한 악티노플라네스 종 SE50/110에서의 cgt의 상대적 전사체 양. 양측 t-검정에서의 차이에 대한 테스트는 말토스와 비교하여 탄소 공급원 글루코스 (p-값 = 0.002848), 갈락토스 (p-값 = 0.002945) 및 락토스 (p-값 = 0.00114) 상에서의 cgt 유전자의 유의한 차등 유전자 발현을 표시하였다. b . 72.06 g·L-1 말토스에서 성장한 배양물과 비교하여 44.40 g·L-1 말토스가 보충된 말토스 최소 배지에서 성장한 악티노플라네스 종 SE50/110에서의 cgt의 상대적 전사체 양. 양측 t-검정에서의 차이에 대한 검정은 감소된 양의 말토스를 함유하는 배지에서 cgt의 유의하게 감소된 유전자 발현을 표시하였다 (p-값 = 0.04141).
도 12. 상이한 탄소 공급원이 보충된 최소 배지에서의 악티노플라네스 종 SE50/110의 야생형 및 결실 돌연변이체 Δcgt의 성장. 시간에 따른 세포 건조 중량 및 표준 편차가 제시된다 (야생형: nglc = 3, nmal = 5, ncel = 4, nlac = 3, nara = 5, nstarch = 5, Δcgt: nglc = 2, nmal = 5, ncel = 4, nlac = 4, nara = 5, nstarch = 5).
도 13. 6가지 상이한 탄소 공급원이 보충된 최소 배지에서 야생형 및 Δcgt 돌연변이체의 배양에서 수득된 최종 세포 건조 중량. 오차 막대는 표준 편차를 나타낸다.
도 14. 탄소 공급원으로서 제한된 양의 전분 하에 Δcgt 및 야생형의 성장. 배지에 1 g·L-1, 2 g·L-1, 3 g·L-1, 4 g·L-1 및 5 g·L-1 전분을 보충시키고 m2p 랩스의 로보렉터(RoboLector)® 시스템에서 배양을 수행하였다. 막대 다이어그램의 후방산란 신호와 적어도 3개의 생물학적 복제물의 표준 편차가 제시된다. Δcgt에 대한 성장 억제는 관찰되지 않았다. 1 g·L-1의 경우, 성장이 상당히 더 증강되는 것으로 밝혀졌다 (양측 t-검정의 p-값: 0.006141, nwt = 3, nΔcgt = 4).
도 15. 말토스 최소 배지에서 pH 스크리닝 실험의 최종 세포 건조 중량. 악티노플라네스 종 SE50/110의 야생형 및 Δcgt 돌연변이체는 m2p-랩스의 로보렉터® 시스템에 있는 48-웰 플라워플레이트에서 1 mL 반응 용적으로 성장되었다. 4 내지 7 범위의 pH에서는, 최종 세포 건조 중량에 있어서의 유의한 차이가 관찰되지 않았다 (양측 t-검정에 의해 검정됨, nwt = 3, nΔcgt = 4).
도 16. m2p-랩스의 로보렉터® 시스템에서 오스몰농도 내성 스크리닝: 말토스 일수화물 농도가 3.6 내지 108.1 g·L-1인 말토스 최소 배지에서 최종 세포 건조 중량. 유의한 성장 차이는 관찰되지 않았다 (양측 t-검정에 의해 검정됨, nwt = 3, nΔcgt = 4).
도 17. m2p-랩스의 로보렉터® 시스템에서 오스몰농도 내성 스크리닝: 말토스 최소 배지에서 오스몰농도 스크리닝 실험의 최종 세포 건조 중량. 0 mM 내지 280 mM 범위의 농도로 이노시톨을 부가함으로써 상이한 오스몰농도를 달성하였다. 야생형과 Δcgt 간에는 유의한 성장 차이가 관찰되지 않았다 (양측 t-검정에 의해 검정됨, nwt = 3, nΔcgt = 4).
도 18. 각각 11.0 g·L-1 말토스- 및 10.0 g·L-1 글루코스-일수화물이 보충된 복합 배지 NBS에서 악티노플라네스 종 SE50/110 야생형 및 Δcgt 돌연변이체의 성장 및 아카르보스 생산. 차별적인 성장은 검출되지 않았다. 성장기 동안, 상당히 증가된 아카르보스 농도가 Δcgt에서 측정되었다 (배양 49시간 후 t-검정의 유의성: p-값 = 0.006778, nwt -acb = 3, nΔcgt -acb = 3, nwt - cdwGlc = 4, nΔcgt - cdwGlc = 3, nwt-cdwMal = 4, nΔcgt-cdwMal = 4).
도 19. a. 막대 차트에서 세포 건조 중량을 기준으로 한 아카르보스의 최종 수율 계수. 오차 막대는 가우스 오차 전파에 의해 계산되었다. b . 말토스 최소 배지에서 배양하는 동안 상등액 중의 세포 건조 중량 및 아카르보스 농도 (ncdw = 5, nacb = 4).
도 20. 말토스 최소 배지에서 성장한 악티노플라네스 종 SE50/110의 야생형과 비교하여 돌연변이체 Δcgt의 유전자 acbZ, acbW, acbV, acbA, acbB, acbE 및 acbD의 상대적 전사체 양 (n = 3-6).
도 21. 악티노플라네스 종 SE50/110에서의 카로티노이드 생합성의 재구축. NCBI 데이터베이스에 대항한 BLASTX 분석에 의해 식별된 악티노플라네스 종 SE50/110에서 추정되는 상동 유전자가 제시된다. 유전자 및 게놈의 교토 백과사전의 도움으로 재구축을 수행하였다 (Kanehisa et al. (2014)).
a. 메발로네이트 경로의 대체 대사 경로로서 공지되기도 한, 이소프레노이드 전구체 이소펜테닐 피로포스페이트 (IPP) 및 디메틸알릴 피로포스페이트 (DMAPP)의 생합성을 위한 메틸에리트리톨포스페이트 (MEP) 경로.
b-c: 카로티노이드 생합성. b . 이소프레노이드 전구체로부터 리코펜의 형성. c. 살리노스포라 트로피카(Salinospora tropica) CNB-440에서 글리코실화된 카로티노이드 시옥산틴의 합성 (문헌 [Richter et al.(2015)]의 도 1).
d. 악티노플라네스 종 SE50/110에서 확인된 유전자의 게놈 구성. 유전자 클러스터 2b는 박테리아 및 진균 게놈에서 2차 대사산물 생합성 유전자 클러스터의 주석 및 분석을 위한 신속한 게놈 전체 식별 도구인 antiSMASH에 의한 분석에 따라 살리노스포라 트로피카 CNB-440의 시옥산틴 유전자 클러스터에 대한 상동성을 표시한다 (Weber et al., 2015).
도 22. 빛에 노출된 경우 및 빛으로부터 가려진 경우의 악티노플라네스 종 SE50/110의 성장, 아카르보스 및 색소 형성. a . 전구 빛 (22-44 μE, 1 μE = μmol광자 m-2 s- 1)에 노출되거나 전구 빛으로부터 가려진 말토스 최소 배지에서의 야생형 악티노플라네스 종 SE50/110의 배양. 5개의 생물학적 복제물의 세포 건조 중량과 3개의 생물학적 복제물의 상등액 중 아카르보스 농도가 제시된다. b . 최종 배양 시간에서의 펠릿 및 상등액. c . 자연광에 노출되거나 자연광으로부터 가려진 SFM 한천 플레이트 상의 고체 배양물에서의 성장 및 색소 형성.
도 23. 테르펜 클러스터 1에서 MerR-조절인자를 코딩하는 유전자의 위치 및 악티노플라네스 종 SE50/110의 게놈에서의 그의 배치 (도 21 및 표 E12 참조). 클러스터의 유전자는 MerR-유사 전사 조절인자 (ACSP50_0145), 이소펜테닐-디포스페이트 델타-이소머라제 (idi, ACSP50_0146), 피토엔 데히드로게나제 (crtI, ACSP50_0147), 폴리프레닐 신테타제 (crtE, ACSP50_0148), 피토엔 신타제 (crtB, ACSP50_0149), 데옥시리보디피리미딘 포토-리아제 (ACSP50_0150) 및 피리딘 뉴클레오티드-디술피드 옥시도리덕타제 (ACSP50_0151)를 코딩한다.
도 24. 빛에 노출된 경우 및 빛으로부터 가려진 경우의 악티노플라네스 종 SE50/110 및 결실 돌연변이체 ΔmerR의 성장, 아카르보스 및 색소 형성. a . 전구 빛 (22-44 μE, 1 μE = μmol광자 m-2 s- 1)에 노출되거나 전구 빛으로부터 가려진 말토스 최소 배지에서의 악티노플라네스 종 SE50/110의 야생형 및 결실 돌연변이체 ΔmerR의 배양. 적어도 4개의 생물학적 복제물의 세포 건조 중량과 3개의 생물학적 복제물의 상등액 중의 아카르보스 농도가 제시된다. b . 최종 배양 시간에서의 펠릿 및 상등액. c . 고체 배지 (SFM 한천 플레이트)에서의 성장 및 색소 형성. d. 최대 아카르보스 농도 (양측 t-검정의 p-값: wt 어두움 vs. wt 밝음: 0.003975, wt 어두움 vs. ΔmerR 어두움: 0.09711, wt 어두움 vs. ΔmerR 밝음: 0.007043, ΔmerR 어두움 vs. wt 밝음: 0.02081, ΔmerR 어두움 vs. ΔmerR 밝음: 0.0002131). e . 어두운 조건 하에 배양될 때 야생형 (1의 값으로 설정됨)과 비교하여 결실 돌연변이체에서의 유전자 crtE (ACSP50_0148), crtB (ACSP50_0149), crtI (ACSP50_0147), idi (ACSP50_0146) 및 merR (ACSP50_0145)의 상대적 전사체 양 (양측 t-검정의 p-값: crtE: 0.04245, crtB: 0.01017, crtI: 0.07162, idi: 0.004366). 별표는 유의성 수준을 나타낸다: * p-값 < α = 5%, ** p-값 < α = 1%, *** p-값 < α = 0.1%.
도 25. 어두운 곳에서 성장한 배양물과 비교하여 빛에 노출된 악티노플라네스 종 SE50/110에서 차등적으로 전사된 유전자의 비율/강도 플롯. 비율 (log2(변화 배수))은 마이크로어레이 실험의 평균 강도에 대항하여 플롯된다. 더 어두운 점은 빛으로부터 가려진 배양물과 비교하여 빛에 노출된 배양물에서 상당한 차등 전사 수준을 갖는 유전자를 나타낸다.
도 26. pSET152-벡터 시스템에서 관심 유전자 뒤에 있는 추정 안티센스 프로모터의 TSS를 제시하는 ReadXplorer (Hilker et al. 2016; Hilker et al. 2014) 뷰. TSS는 풀링된 1차 전사체 라이브러리의 시퀀싱에 의해 결정되었다. pGUS::Papm:gusA의 통합 벡터-돌연변이체에 매핑된 예시적인 스택 읽기가 제시된다. 2개의 TSS (상자로 둘러싸여 있음)는 안티센스 배향 (a)에서 관심 유전자 뒤에 국한된다. 이러한 TSS는 σA/RNA-폴리머라제 복합체에 의해 프로모터 서열로서 추정상 인식되는 벡터 백본 상의 서열 모티프 (b)에 할당될 수 있다. -10- 및 -35-헥사머의 보존된 뉴클레오티드가 강조 표시된다. TG-이량체는 존재하는 경우 흑색 볼드체 글자로 제시된다. 헥사머 사이의 거리는 s1로 표시되고; -10-모티프와 TSS 사이의 거리는 s2로 제시된다.
도 27. 말토스 최소 배지에서 acbB 과다발현 균주의 성장 및 아카르보스 생산. 2가지 독립적인 배양이 제시된다 (a 및 b). RNA 단리를 위한 샘플링 시간은 t1 ("초기 성장기") 및 t2 ("선형 성장기")로 표시된다.
도 28. 말토스 최소 배지에서 acbB 과다발현 돌연변이체의 수율 계수. 이종 tipA-프로모터의 제어 하에 전사된 acbB를 갖는 돌연변이체는 증강된 수율 계수 (대략 50%)를 표시한 반면, gapDH-프로모터가 있는 구축물에 대해서는 약간의 차이만이 관찰되었다. 오차는 가우스 오차 전파에 의해 계산되었다. 모든 차이는 양측 t-검정에 의해 유의성에 대해 검정되었다 (본 도면에 할당된 약어). 별표는 유의성 수준을 나타낸다: * p-값 < α = 5%, ** p-값 < α = 1%, *** p-값 < α = 0.1%.
도 29. LC-MS에 의한 acbB 과다발현 돌연변이체의 세포내 대사산물의 분석. 질량 m/z = 545 [M-H+]의 정규화된 피크 면적이 제시된다. a . 글루코스-1P 및 갈락토스-1P (m/z = 259 [M-H+]. b . 글루코스-6P (m/z = 259 [M-H+] 및 c. UDP-글루코스 (m/z = 565 [M-H+]). d . UDP-글루코스의 정규화된 피크 면적 (양측 t-검정의 p-값: Ptip: 0.01068, Pgap: 0.001356) 및 질량 m/z = 545 [M-H+] (양측 t-검정의 p-값: Ptip: 0.0412)에 대하여 빈 벡터 대조군과 비교하여 유의한 차이가 관찰되었다.
도 30. 초기 성장기의 acbB 과다발현 돌연변이체에서 유전자 acbB, acbA 및 acbV의 상대적 전사체 양. 적어도 3개의 생물학적 복제물의 평균 및 표준 편차가 제시된다. 빈 벡터 대조군 (1의 값으로 설정됨)에 대한 차이는 양측 t-검정에 의해 검정되었다 (pSETT4gap::acbB, pSETT4tip::acbB, pSETT4::PacbB:acbB, pSET152::PacbB:acbB에 상응하는 좌측에서 우측으로 p-값: acbB: 4.332e-05, 4.561e-06, 0.3511, 0.7082; acbA: 0.3384, 0.0001164, 0.5967, 0.4246; acbV: 0.3033, 0.0423, 0.73, 0.4687). 별표는 유의성 수준을 나타낸다: * p-값 < α = 5%, ** p-값 < α = 1%, *** p-값 < α = 0.1%.
도 31. 선형 성장기에서 acbB-과다발현 돌연변이체에서의 유전자 acbB의 상대적 전사체 양. 적어도 3개의 생물학적 복제물의 평균 및 표준 편차가 제시된다. RT-qPCR은 양측 t-검정에 의해 검정된 (pSETT4gap::acbB, pSETT4tip::acbB, pSETT4::PacbB:acbB, pSET152::PacbB:acbB에 상응하는 좌측에서 우측으로의 p-값: acbB: 0.02217, 0.02771, 0.03895, 0.1582) 빈 벡터 대조군 (1의 값으로 설정됨)과 비교하여 유전자 발현에 있어서의 유의한 차이를 나타낸다. 별표는 유의성 수준을 나타낸다: * p-값 < α = 5%, ** p-값 < α = 1%, *** p-값 < α = 0.1%.
도 32. 말토스 최소 배지에서 gtaB 과다발현 돌연변이체의 성장 및 아카르보스 생산. RNA 단리를 위한 샘플링 시간은 화살표로 표시된다.
도 33. 과다발현 돌연변이체에서 gtaB의 상대적 전사체 양. RT-qPCR은 빈 벡터 대조군 (1의 값으로 설정됨)과 비교하여 gtaB 발현의 상당한 증가를 나타낸다 (양측 t-검정의 p-값: 0.01295). 별표는 유의성 수준을 나타낸다: * p-값 < α = 5%, ** p-값 < α = 1.
도 34. LC-MS에 의한 gtaB 과다발현 돌연변이체의 세포내 대사산물의 분석. 유전자 gtaB의 과다발현 균주에서 질량 m/z = 545 [M-H+] (a), 글루코스-1P 및 갈락토스-1P (m/z = 259 [M-H+] (b), 글루코스-6P (m/ z = 259 [M-H+]) (c) 및 UDP-글루코스 (m/z = 565 [M-H+]) (d)의 피크 면적이 제시된다. 질량 m/z = 545 [M-H+]의 정규화된 피크 면적에 대해 빈 벡터 대조군과 비교하여 유의한 차이가 관찰되었다 (양측 t-검정의 p-값: 0.01531). 다른 모든 피크 면적은 양측 t-검정에 따라 유의하게 상이하지 않다.
서열식별번호의 간단한 설명
본 출원과 관련된 서열 목록은 전자 형식으로 제출되며 이로써 그 전체 내용이 본 명세서에 참조로 포함된다.
정의
달리 정의되지 않는 한, 설명, 도면 및 청구범위에 사용된 모든 과학적 및 기술적 용어는 관련 기술분야의 통상의 기술자가 통상적으로 이해하는 바와 같은 일반적인 의미를 갖는다. 본원에 언급된 모든 간행물, 특허 출원, 특허 및 기타 참고문헌은 그 전체 내용이 참조로 포함된다. 상충되는 경우, 정의를 포함한 본 명세서가 우선할 것이다. 참조로 포함된 둘 이상의 문서에 서로 상충되고/거나 일관성이 없는 개시내용이 포함된 경우, 유효 날짜가 더 늦은 문서가 우선한다. 재료, 방법 및 예는 예시일 뿐이며 제한하려는 의도가 아니다. 달리 명시되지 않는 한, 설명 및 청구범위를 포함하여 본 문서에서 사용되는 하기 용어는 하기에 제공된 정의를 갖는다.
용어 "포함하는", "포함한", "함유하는", "갖는" 등은 광범위하게 또는 개방형이고 제한 없이 판독되어야 한다. 단수 형태는 문맥상 달리 명확하게 나타내지 않는 한 복수 지시대상을 포함한다. 달리 표시되지 않는 한, 일련의 요소 앞에 오는 용어 "적어도"는 일련의 모든 요소를 지칭하는 것으로 이해되어야 한다. 용어 "적어도 하나" 및 "중 적어도 하나"는 예를 들어 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 그 초과의 요소를 포함한다.
더욱이 명시된 범위 위 및 아래에서 약간의 변동이 그 범위 내의 값과 실질적으로 동일한 결과를 달성하기 위해 사용될 수 있음을 이해해야 한다. 또한, 달리 명시되지 않는 한, 범위의 개시는 최소 값과 최대 값 사이의 모든 값을 포함한 연속적인 범위로서 의도된다.
단백질 또는 아미노산 서열이 본 출원 전반에 걸쳐 제공되는 경우, 단일 또는 다중 아미노산이 실질적으로 동일한 효과, 즉 동등한 결과를 달성하기 위해 유사한 특성을 갖는 아미노산으로 교환될 수 있다는 것도 통상의 기술자에 의해 이해된다. 더욱이, 통상의 기술자는 정의된 단백질 또는 아미노산 서열이 다양한 핵산 서열에 의해 코딩될 수 있음을 알고 있다. 본원에 정의된 바와 같은 주어진 아미노산 서열에 대해, 특이적 아미노산 서열을 코딩하는 각각의 카운트가능한 핵산 서열은 본원에 개시된 것으로 간주되어야 한다. 핵산 서열이 본 출원 전반에 걸쳐 제공되는 경우, 침묵 돌연변이가 도입될 수 있음이 또한 이해된다.
O-{4,6-디데옥시-4[1S-(1,4,6/5)-4,5,6-트리히드록시-3-히드록시메틸-2-시클로헥센-1-일]-아미노-α-D-글루코-피라노실}-(1→4)-O-α-D-글루코피라노실-(1→4)-D-글루코피라노스 또는 "아카르보스"는 슈도디사카라이드와 α-1,4-글리코시드 결합된 말토스로 구성된 시클리톨 함유 아미노글리코시드이다 (Wehmeier and Piepersberg 2009). 아카르비오스로 명명된 슈도디사카라이드는 질소 결합에 의해 4,6-디데속시-D-글루코스의 C4에 연결된, 발리에놀 또는 발리엔아민으로서 지칭되기도 한 불포화 C7-아미노시클리톨에 의해 만들어진다 (도 5 참조) (Wehmeier and Piepersberg 2009). 이러한 N-글리코시드 결합은 외래 알파-1,4-글루코시드 히드롤라제에 의해 가수분해되지 않아, 거의 비가역적인 억제 효과를 초래할 수 있다 (Wehmeier and Piepersberg 2009; Brayer et al. 2000).
본원에 기재된 바와 같은 유전자 산물 또는 단백질의 "과다발현"은 야생형 또는 명시된 참조 균주와 비교하여 발현에서의 증가를 지칭한다. 바람직하게는, 참조 균주 또는 대조군은 각각의 유전자(들) 또는 단백질(들)의 특이적 과다발현을 위해 조작되지 않은 균주이다. 예를 들어, 대조군은 각각의 유전자 산물 또는 단백질에 대한 발현 카세트를 포함하는 벡터를 포함하지 않는다. 예를 들어, 유전자 산물의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안의 증가 또는 임의의 다른 시간 동안의 증가일 수 있다. 바람직하게는, 과다발현은 대조군과 비교하여 적어도 1.5의 인자 또는 적어도 2의 인자만큼 유전자 산물 또는 단백질의 증가이다. 전사체 양과 관련하여 본원에서 달리 정의되지 않는 경우, 강한 과다발현은 log2(변화 배수) > 6을 지칭한다. 전사체 양과 관련하여 본원에서 달리 정의되지 않는 경우, 약한 과다발현은 log2(변화 배수) < 2를 지칭한다. 전사체 양과 관련하여 본원에서 달리 정의되지 않는 경우, 중간 정도의 강한 과다발현은 log2(배수 변화) ≥ 2 및 ≤ 6을 지칭한다.
본원에 기재된 바와 같은 유전자 산물 또는 단백질의 발현은 각각의 유전자가 그의 유전자 산물이 전혀 발현되지 않거나 유의하게 감소된 양 (예를 들어, 0.75배 미만 또는 0.5배 미만)으로 발현되는 방식으로 결실되거나 돌연변이된 경우에 "부재하거나 감소된다". 본원에 기재된 바와 같은 유전자 산물 또는 단백질의 발현은 또한, 그러한 유전자 산물 또는 단백질이, 예를 들어 일시적 또는 영구적인 방식으로, 예를 들어 돌연변이 또는 녹다운에 의해 기능성을 상실한 경우에 부재하거나 감소된 것으로 간주된다. 유전자 산물 또는 단백질의 양 및/또는 활성을 모니터링하는 방법은 관련 기술분야에 공지되어 있으며 또한 예시적인 방식으로 본원에 기재되어 있다. 일반적으로, 유전자 산물의 발현 부재 또는 감소를 수득하기 위한 적합한 방법은 유전적 서열 또는 유전자 발현 요소를 변경시키는 방법 (예를 들어, 결실 또는 점 돌연변이에 의함) 및/또는 유전자의 전사 및 번역 또는 유전자 산물 (단백질)의 활성 또는 반감기에 부정적인 영향을 미치는 방법이다.
달리 명시되지 않는 경우, 부호 "Δ"는 "결실 돌연변이체", 즉 특이적 유전자 서열이 적어도 부분적으로 결실된 돌연변이체를 지칭한다.
"초기 성장기"는 악티노플라네스 균주가 배지에 적응하고 세포 건조 중량이 3 g·L-1 미만인 시간이다. 환경에 적응한 후, 배양물은 배지에 의해 공급된 영양소를 대사하고 성장하기 시작한다. 악티노플라네스는 구형 균사체에서 성장하고 있으며, 이 균사체는 구형의 외부로만 확장할 수 있기 때문에, 중간에 있는 세포는 영양소로부터 보호되고 세포 분열을 위한 제한된 공간만 있다. 따라서 구형 균사체의 외층에 있는 세포만이 분열하고 있다. 이로써, 악티노플라네스의 성장은 선형이고 지수적이지 않으며 - 이는 단세포로 성장하는 다른 박테리아와 대조적이다. 악티노플라네스 아종에 대한 성장기는 "선형 성장기"라고 하고 3 g·L-1의 세포 건조 중량에서 시작한다. "정지기"는 세포가 각각 용량 한계 (공간 및 영양소의 용량 한계)에 도달하는 성장기로서 정의되며, 이때 억제성 부산물의 형성 또는 기타 화학적 및 물리적 요인, 예컨대 오스몰농도 또는 pH에서의 변화로 인해 성장이 감소한다. 정지기는 죽어가는 세포의 수가 분열하는 세포의 수와 동일해지는 성장기이다. 이러한 기는 통상적으로 말토스 최소 배지에서 16-18 g·L-1의 세포 건조 중량에서 시작한다.
본원에 사용된 바와 같은 용어 "벡터"는 그에 연결된 핵산 분자를 증식시킬 수 있는 핵산 분자를 지칭한다.
본원에 사용된 바와 같은 용어 "발현 카세트"는 발현을 위한 유전자 및 조절 서열, 예컨대 프로모터를 적어도 포함하는 핵산 분자를 지칭한다.
"프로모터"는 특정한 유전자의 전사 개시를 유도하는 핵산 서열이다.
본원에 정의된 바와 같은 "강한 프로모터"는 글루쿠로니다제 검정에서 적어도 5·10-4 [L·g-1·min- 1]의 정규화된 글루쿠로니다제 활성을 초래하고/거나 프로모터가 없는 pGUS 대조군 벡터와 비교하여 gusA 유전자의 350배 상대적 전사 (log2(변화 배수))를 초래하는 프로모터이다. 프로모터의 강도를 명확히 규명하는 방법에 대한 자세한 설명은 본 실시예 및 문헌 [Schaffert, et al. 2019] 내에 제공된다.
그 예는 하기의 프로모터를 포함한다:
"중간 정도의 강한 프로모터"는 글루쿠로니다제 검정에서 적어도 1·10-4 [L·g-1·min-1]의 정규화된 글루쿠로니다제 활성을 초래하고/거나 프로모터가 없는 pGUS 대조군 벡터와 비교하여 gusA 유전자의 10배 상대적 전사 (log2(변화 배수))를 초래하는 프로모터로서 정의된다. 그 예는 하기의 프로모터를 포함한다:
일부 경우에, 중간 정도의 강한 프로모터는 글루쿠로니다제 검정에서 적어도 1·10-4 [L·g-1·min-1] 및 최대 5·10-4 [L·g-1·min- 1]의 정규화된 글루쿠로니다제 활성을 초래한다.
"약한 프로모터"는 1·10-4 [L·g-1·min-1] 미만의 정규화된 글루쿠로니다제 활성을 초래하고/거나 프로모터가 없는 pGUS 대조군 벡터와 비교하여 10배 미만의 상대적 전사를 초래하는 프로모터로서 정의된다.
용어 "Cgt" (ACSP50_5024, 이전명: ACPL_5091)는 세포외 작은 탄수화물 결합 단백질을 지칭하며, 이전에는 악티노플라네스 종, 예를 들어 균주 ATCC 31044 / CBS 674.73 / SE50/110으로부터 수득된, 시클로덱스트린 글리코실트랜스퍼라제의 C-말단 도메인과의 높은 유사성으로 인해 시클로말토덱스트린 글루카노트랜스퍼라제로서 기재되었다. Cgt 단백질은 유전자 cgt에 의해 코딩된다. 서열(들)은 본원에 기재되어 있거나 (서열식별번호: 20) 또는 유니프롯 식별자 G8S155 (G8S155_ACTS5)를 통해 액세스할 수 있다. 상이한 균주에 대해 상이한 이소형 및 변이체가 존재할 수 있고 모두 상기 용어에 포함된다. 특이적 돌연변이가 초기 서열의 기재된 촉매적 특성을 변경하지 않고 교환될 수 있는 경우, 그러한 기능적으로 침묵하는 돌연변이를 갖는 서열이 초기 서열과 관련하여 동등하다는 것은 명백하다. 또한, 단백질은 더욱이, 다양한 변형, 예를 들어 합성 또는 자연적으로 발생하는 변형의 대상이 될 수 있다.
용어 "AcbB" (ACSP50_3608, 이전명: ACPL_3681)는 악티노플라네스 종, 예를 들어 균주 ATCC 31044 / CBS 674.73 / SE50/110으로부터 수득된 dTDP-D-글루코스-4,6-데히드라타제를 지칭하며, 이는 아마도 아카르보스의 아카르비오스 모이어티의 생합성에 관여할 것이다. AcbB 단백질은 유전자 acbB에 의해 코딩된다. 서열(들)은 본원에 기재되어 있거나 (서열식별번호: 13) 또는 유니프롯 식별자 Q9ZAE8 (RMLB_ACTS5)을 통해 액세스할 수 있다. 상이한 균주에 대해 상이한 이소형 및 변이체가 존재할 수 있고 모두 상기 용어에 포함된다. 특이적 돌연변이가 초기 서열의 기재된 촉매적 특성을 변경하지 않고 교환될 수 있는 경우, 그러한 기능적으로 침묵하는 돌연변이를 갖는 서열이 초기 서열과 관련하여 동등하다는 것은 명백하다. 또한, 단백질은 더욱이, 다양한 변형, 예를 들어 합성 또는 자연적으로 발생하는 변형의 대상이 될 수 있다.
용어 "GtaB" 또한 "GalU" (ACSP50_7820, 이전명: ACPL_7811)는 악티노플라네스 종, 예를 들어 균주 ATCC 31044 / CBS 674.73 / SE50/110으로부터 수득된 UTP-글루코스-1-포스페이트 우리딜릴트랜스퍼라제를 지칭한다. GtaB는 글루코스-1P와 UDP-글루코스의 상호 전환을 촉매하는 것으로 보이며 아카르보스에 대한 전구체 공급에 관여할 수 있다. GtaB 단백질은 유전자 gtaB에 의해 코딩된다. 서열(들)은 본원에 기재되어 있거나 (서열식별번호: 19) 또는 유니프롯 식별자 G8S608 (ACPL_7811)을 통해 액세스할 수 있다. 상이한 균주에 대해 상이한 이소형 및 변이체가 존재할 수 있고 모두 상기 용어에 포함된다. 특이적 돌연변이가 초기 서열의 기재된 촉매적 특성을 변경하지 않고 교환될 수 있는 경우, 그러한 기능적으로 침묵하는 돌연변이를 갖는 서열이 초기 서열과 관련하여 동등하다는 것은 명백하다. 또한, 단백질은 더욱이, 다양한 변형, 예를 들어 합성 또는 자연적으로 발생하는 변형의 대상이 될 수 있다.
본원에 정의된 바와 같이, "카로티노이드 합성에 필수적인 유전자"는 카로티노이드의 합성에 긍정적으로 필요한 유전자로서 정의된다. 악티노플라네스는 클래스 카로티노이드의 황색, 주황색 및 분홍색 색소를 비롯한 다양한 가용성 색소를 생산하는 것으로 공지되 있다. 악티노플라네스에서, 카로티노이드 합성에 필수적인 유전자 세트는 MEP/DOXP 경로로부터의 유전자, 테르펜 클러스터 1의 유전자, 테르펜 클러스터 2a의 유전자, 테르펜 클러스터 2b의 유전자 및 캄펜-유사 모노테르펜 생합성 테르펜 클러스터 3의 유전자를 포함한다. MEP / DOXP 경로의 유전자는 하기를 포함한다:
i. 1-데옥시-D-크실룰로스-5-포스페이트 신타제 유전자 dxs (ACSP50_7096, 서열식별번호: 23),
ii. 4-히드록시-3-메틸부트-2-엔-1-일 디포스페이트 신타제 유전자 ispG (ACSP50_7248, 서열식별번호: 24),
iii. 1-데옥시-D-크실룰로스-5-포스페이트 리덕토이소머라제 유전자 dxr (ACSP50_7250, 서열식별번호: 25),
iv. 4-히드록시-3-메틸부트-2-에닐 디포스페이트 리덕타제 유전자 ispH (ACSP50_7707, 서열식별번호: 26),
v. 4-(시티딘 5'-디포스포)-2-C-메틸-D-에리트리톨 키나제 유전자 ispE (ACSP50_7802, 서열식별번호: 27),
vi. 2-C-메틸-D-에리트리톨 2;4-시클로디포스페이트 신타제 유전자 ispF, ACSP50_8046, 서열식별번호: 28), 및/또는
vii. 2-C-메틸-D-에리트리톨 4-포스페이트 시티딜릴트랜스퍼라제 유전자 ispD (ACSP50_8047, 서열식별번호: 29).
테르펜 클러스터 1의 유전자는 하기를 포함한다:
i. 이소펜테닐-디포스페이트 델타-이소머라제 유전자 idi (ACSP50_0146, 서열식별번호: 30),
ii. 제타-피토엔 데새투라제 유전자 crtI (ACSP50_0147, 서열식별번호: 10),
iii. 폴리프레닐 신테타제 유전자 crtE/ldsA (ACSP50_0148, 서열식별번호: 31),
iv. 피토엔 신타제 유전자 crtB (ACSP50_0149, 서열식별번호: 32),
v. 데옥시리보디피리미딘 포토-리아제 유전자 (ACSP50_0150, 서열식별번호: 33), 또는
vi. 피리딘 뉴클레오티드-디술피드 옥시도리덕타제 유전자 (ACSP50_0151, 서열식별번호: 34).
테르펜 클러스터 2a의 유전자는 하기를 포함한다:
i. 전사 조절인자 유전자 (ACSP50_1631, 서열식별번호: 35),
ii. 리코펜 시클라제 유전자 (ACSP50_1632, 서열식별번호: 36),
iii. 리코펜 시클라제 유전자 (ACSP50_1633, 서열식별번호: 37),
iv. 폴리프레닐 신테타제 (파르네실 피로포스페이트 신테타제 2 유전자 fps2/crtE (ACSP50_1634, 서열식별번호: 38), 및
v. 메틸렌테트라히드로폴레이트 리덕타제 (NADPH) 유전자 (ACSP50_1635, 서열식별번호: 39).
테르펜 클러스터 2b의 유전자는 하기를 포함한다:
i. LysR-패밀리 전사 조절인자 유전자 (ACSP50_1650, 서열식별번호: 40),
ii. 메틸트랜스퍼라제 유형 11 유전자 (ACSP50_1651, 서열식별번호: 41),
iii. CDP-알콜포스파티딜트랜스퍼라제 pgsA (ACSP50_1652, 서열식별번호: 42),
iv. 제타-피토엔 데새투라제 (crtI-패밀리) 유전자 crtD (ACSP50_1653, 서열식별번호: 43),
v. 글리코실 트랜스퍼라제 유전자 cruC (ACSP50_1654, 서열식별번호: 44),
vi. 가상 단백질 (추정 막 단백질) 유전자 cruF, (ACSP50_1655, 서열식별번호: 45),
vii. GCN5 패밀리 아세틸트랜스퍼라제 유전자 (ACSP50_1656, 서열식별번호: 46),
viii. 모노옥시게나제 유전자 (ACSP50_1657, 서열식별번호: 47), 및
ix. 단쇄 데히드로게나제 유전자 (ACSP50_1658, 서열식별번호: 48).
카로티노이드 합성에 필수적인 또 다른 유전자는 폴리프레닐 신테타제 유전자 crtE (ACSP50_3873, 서열식별번호: 49)이다.
캄펜 -유사 모노테르펜 생합성 테르펜 클러스터 3의 유전자는 하기를 포함한다:
i. 전사 조절인자 (Crp/Fnr 패밀리) 유전자 eshA (ACSP50_1949, 서열식별번호: 104),
ii. 캄펜 신타제 유전자 (ACSP50_1950, 서열식별번호: 50),
iii. 메틸트랜스퍼라제 (SAM-의존성) 유형 11 유전자 (ACSP50_1951, 서열식별번호: 105),
iv. 글리코실-히드롤라제 유전자 (ACSP50_1952, 서열식별번호: 106), 및
v. 옥시도리덕타제/알도/케토리덕타제 (ACSP50_1953, 서열식별번호: 107).
실시양태
악티노미세탈레스 균주 악티노플라네스 종 SE50/110이 본 발명에 대한 모델 균주로서 사용되었지만, 일반적인 메커니즘 및 발견은 다른 아카르보스 생산 균주, 예컨대 현재 아카르보스의 상업적 생산을 위해 사용되고 있는 아카르보스 생산 균주에 적용될 수 있다는 것은 통상의 기술자에게 명백하다. 일부 실시양태에 따르면, 악티노미세탈레스 균주는 미크로모노스포라세아에 균주이다. 일부 실시양태에 따르면, 악티노미세탈레스 균주는 악티노플라네스 균주이다. 일부 실시양태에 따르면, 악티노미세탈레스 균주는 악티노플라네스 SE50 (ATCC 31042, CBS 961.70) (Frommer et al. 1973), 악티노플라네스 종 SE50/110 (ATCC 31044, CBS 674.73) 또는 그의 유래된 악티노플라네스 균주이다. 일부 실시양태에서, 악티노미세탈레스 균주는 아카르보스 생산을 위해 상업적으로 사용되고 있는 악티노플라네스 균주이다. 일부 실시양태에서, 악티노미세탈레스 균주는 아카르보스 생산을 위해 상업적으로 사용되고 있는 악티노플라네스 균주, 예컨대 예를 들어, EP 2601209 B1 및 CN103298828 B에 개시된 바와 같은 SN223-29-47, C445-P47, SN12755-38, SC3687-18-43, SC7177-40-17 또는 SN19910-37-21, 또는 그의 유래된 균주이다.
아카르보스 생산의 개선은 특이적 시간 (전체적으로 또는 세포 성장에 비례하여)에 걸친 아카르보스 수율의 증가 및/또는 아카르보스의 순도의 개선, 예를 들어 부산물 및/또는 아카르보스 유사체 예컨대 성분 C의 감소를 지칭한다. 악티노플라네스 균주의 배양은 관련 기술분야에 공지된 바와 같이 또는 본원에 기재된 바와 같이 일어날 수 있다. 일부 실시양태에서, 악티노플라네스 균주의 배양은 말토스 최소 배지에서 발생한다.
본 발명의 제1 측면에 따르면, 아카르보스의 개선된 생산을 위해 악티노미세탈레스 균주, 예컨대 악티노플라네스 균주를 조작하는 방법이 제공된다.
제1 측면에 따른 일부 제1 실시양태에 따르면, 제1 측면에 따른 방법은 세포외 작은 탄수화물 결합 단백질 Cgt (서열식별번호: 20)의 발현 부재 또는 감소를 위해 악티노미세탈레스 균주를 조작하는 것을 포함한다.
놀랍게도, 탄수화물 결합 단백질 Cgt (서열식별번호: 20)의 결실은 아카르보스의 개선된 생산을 초래하였다. 8.3% 내지 16.6%의 최종 아카르보스 수율 증가가 3개의 독립적인 진탕 플라스크 배양에서 달성되었다 (예시 "Δcgt는 말토스 최소 배지에서 아카르보스의 개선된 형성을 표시한다", 도 18, 도 19, 표 E10, 표 E11 참조).
더욱이, 야생형과 비교하여, 유전자 결실 돌연변이체 Δcgt는 상이한 탄소 공급원 또는 탄소 제한 조건 하에서 (예시 "상이한 탄소 공급원에서 성장하는 동안 cgt 발현의 분석", "상이한 탄소 공급원 또는 탄소 제한 조건 하에서의 Δcgt ", 도 12, 도 13, 도 14 참조) 또는 pH 및 삼투질 스트레스 하에서 (예시 "Δcgt는 오스몰농도 내성 또는 pH 내성에 영향을 미치지 않는다", 도 15, 도 16, 도 17 참조) 테스트하는 스크리닝 실험에서 명백한 성장 표현형을 나타내지 않았다. 더욱이, 본 발명자들은 cgt의 결실이 아카르보스 생합성 유전자의 발현에 부정적인 영향을 미치지 않았다는 것을 제시할 수 있었다 (예시 "Δcgt는 아카르보스 생합성 유전자의 발현에 영향을 미치지 않는다", 도 20 참조).
이론에 얽매이는 것은 아니지만, Cgt는 세포외 프로테옴 (Wendler et al. 2013; Ortseifen 2016) 및 트랜스크립톰 (Schwientek et al. 2013)에 대한 포괄적인 연구에 따르면 악티노플라네스 종 SE50/110에서 고도로 발현되는 것으로 밝혀졌다. 그의 유전자 산물은 분비된 전체 프로테옴의 약 8%를 차지하는 세포외 공간으로 유출된다. 본 발명자들은 BlastP 분석에 의해 원핵생물 세계에서 CBM-20 단일-도메인 단백질의 분포를 분석하였다. 흥미롭게도, 단일 CBM-20 도메인 단백질은 17개의 다른 종에서만 발견되었다 (예시 "유박테리아 세계에서 단일 도메인 CBM -20 단백질의 분포" 참조). 이들 중 대부분은 악티노미세탈레스 목의 종, 예를 들어 악티노플라네스 속의 모든 균주에서 발견된다. 이론에 얽매이는 것은 아니지만, cgt의 결실 또는 감소된 발현에 의해, 에너지 및 자원, 예컨대 ATP 및 아미노산이 구제된다. 그런 다음 이러한 자원은 성장 관련 산물인 아카르보스 생합성으로 리디렉션될 수 있다.
제1 측면에 따른 일부 실시양태에 따르면, 상기 방법은 세포외 작은 탄수화물 결합 단백질 Cgt (서열식별번호: 20)를 코딩하는 유전자의 결실 또는 돌연변이를 포함한다. 속간 접합 시스템 (Gren et al. 2016)과 CRISPR/Cas9 기술 (Wolf et al. 2016)의 확립으로 악티노플라네스 종 SE50/110에서의 게놈 편집이 가능해진다. 제1 측면에 따른 일부 실시양태에서, 발현 부재 또는 감소를 위해 악티노미세탈레스 균주를 조작하는 것은 CRISPR/Cas9 기술을 사용하여 발생할 수 있다. 일부 실시양태에서, 발현 부재 또는 감소를 위해 악티노미세탈레스 균주를 조작하는 것은 문헌 [Wolf et al. 2016]에 기재된 바와 같이 발생할 수 있다. 일부 실시양태에서, 발현 부재 또는 감소를 위하여 악티노미세탈레스 균주를 조작하는 것은 본원에 기재된 바와 같이, 예를 들어 예시 "CRISPR / Cas9 기술에 의한 유전자 cgt의 결실" 또는 "시토신 데아미나제 CodA와의 상동 재조합 및 역선택에 기초한 결실 시스템"에 기재된 바와 같이 발생할 수 있다.
예를 들어, 본 발명자들은 문헌 [Zhao et al. (2017)]에 기재된 바와 같이, 인테그라제가 없는 벡터 백본과 역선택을 위해 CodA를 사용하는 상동 재조합을 통해 신규 결실 시스템을 성공적으로 확립하였다.
제1 측면에 따른 일부 제2 실시양태에 따르면, 제1 측면에 따른 방법은 카로티노이드 합성에 필수적인 적어도 하나의 유전자의 발현 부재 또는 감소를 위해 악티노미세탈레스 균주를 조작하는 것을 포함한다. 일부 실시양태에서, 카로티노이드는 악티노플라네스 또는 그의 유도체의 주황색 색소이다. 일부 상이하거나 동일한 실시양태에서, 카로티노이드는 C40-카로티노이드이다.
발현 부재 또는 감소를 위해 악티노미세탈레스 균주를 조작하는 것은 본 측면에 대해 이전에 기재된 바와 같이 발생할 수 있다. 제1 측면에 따른 일부 실시양태에 따르면, 상기 방법은 카로티노이드 합성에 필수적인 유전자의 결실 또는 돌연변이를 포함한다.
악티노플라네스는 클래스 카로티노이드의 황색, 주황색 및 분홍색 색소를 비롯한 다양한 가용성 색소를 생산하는 것으로 공지되 있다 (Parenti and Coronelli 1979). 본 발명자들은 강한 색소침착이 아카르보스 생산 손실과 관련되어 있음을 관찰하였다. 이것은 빛에 노출된 경우 및 빛으로부터 가려진 경우의 배양물의 성장과 아카르보스 수율을 비교함으로써 확증되었다 (예시 "광-의존성 카로티노이드 형성 및 산화적 스트레스는 악티노플라네스 종 SE50/110에서 아카르보스 생산을 감소시킨다", 도 22 참조). 카로티노이드 형성이 유도되긴 하지만, 악티노플라네스 종 SE50/110이 전구 빛에 노출되었을 때, 이의 아카르보스 생산 및 성장이 크게 감소되었다 (도 22). 전체적으로, 최종 아카르보스 농도의 39% 손실이 모니터링되었다.
이러한 발견으로부터, 생산된 색소가 필수적이지 않을 뿐만 아니라 (예를 들어, 상업적인 아카르보스 생산을 위한 기술 설정에서) 악티노플라네스에서 카로티노이드 합성을 감소 또는 고갈시키는 것이 아카르보스 형성을 개선시키는 데 사용될 수 있다는 것이 타당하다. 이를 위해, 제1 측면에 따른 방법은 카로티노이드 합성에 필수적인 적어도 하나의 유전자의 발현을 감소 또는 고갈시키는 것을 포함한다.
본 발명자들은 더욱이, 악티노플라네스 종 SE50/110에서의 카로티노이드 생합성을 재구축할 수 있었다 (예시 "카로티노이드 형성의 기능적 관련성 분석", 도 21 참조). 악티노플라네스에서의 카로티노이드 합성에 필수적인 유전자 세트는 MEP/DOXP 경로로부터의 유전자, 테르펜 클러스터 1의 유전자, 테르펜 클러스터 2a의 유전자, 테르펜 클러스터 2b의 유전자, 캄펜-유사 모노테르펜 생합성 테르펜 클러스터 3의 유전자를 포함한다.
본 측면 및 실시양태에 따른 일부 실시양태에 따르면, 카로티노이드 합성에 필수적인 적어도 하나의 유전자는 MEP/DOXP 경로의 유전자, 예컨대 하기이다:
i. 1-데옥시-D-크실룰로스-5-포스페이트 신타제 유전자 dxs (ACSP50_7096, 서열식별번호: 23),
ii. 4-히드록시-3-메틸부트-2-엔-1-일 디포스페이트 신타제 유전자 ispG (ACSP50_7248, 서열식별번호: 24),
iii. 1-데옥시-D-크실룰로스-5-포스페이트 리덕토이소머라제 유전자 dxr (ACSP50_7250, 서열식별번호: 25),
iv. 4-히드록시-3-메틸부트-2-에닐 디포스페이트 리덕타제 유전자 ispH (ACSP50_7707, 서열식별번호: 26),
v. 4-(시티딘 5'-디포스포)-2-C-메틸-D-에리트리톨 키나제 유전자 ispE (ACSP50_7802, 서열식별번호: 27),
vi. 2-C-메틸-D-에리트리톨 2;4-시클로디포스페이트 신타제 유전자 ispF, ACSP50_8046, 서열식별번호: 28), 및/또는
vii. 2-C-메틸-D-에리트리톨 4-포스페이트 시티딜릴트랜스퍼라제 유전자 ispD (ACSP50_8047, 서열식별번호: 29).
본 측면 및 실시양태에 따른 일부 실시양태에 따르면, 카로티노이드 합성에 필수적인 적어도 하나의 유전자는 테르펜 클러스터 1의 유전자, 예컨대 하기이다:
i. 이소펜테닐-디포스페이트 델타-이소머라제 유전자 idi (ACSP50_0146, 서열식별번호: 30),
ii. 제타-피토엔 데새투라제 유전자 crtI (ACSP50_0147, 서열식별번호: 10),
iii. 폴리프레닐 신테타제 유전자 crtE/ldsA (ACSP50_0148, 서열식별번호: 31),
iv. 피토엔 신타제 유전자 crtB (ACSP50_0149, 서열식별번호: 32),
v. 데옥시리보디피리미딘 포토-리아제 유전자 (ACSP50_0150, 서열식별번호: 33), 또는
vi. 피리딘 뉴클레오티드-디술피드 옥시도리덕타제 유전자 (ACSP50_0151, 서열식별번호: 34).
본 측면 및 실시양태에 따른 일부 실시양태에 따르면, 카로티노이드 합성에 필수적인 적어도 하나의 유전자는 제타-피토엔 데새투라제 유전자 crtI (ACSP50_0147, 서열식별번호: 10)이다. 앞서 논의된 바와 같이, 카로티노이드 형성은 실험실 조건에서 필수적이다. 아카르보스 생산을 개선시키기 위해, 특히 중앙 유전자 crtI의 결실에 의해 공동 카로티노이드 생합성 경로를 차단하는 것이 균주 개발을 위해 사용될 수 있다.
본 측면 및 실시양태에 따른 일부 실시양태에 따르면, 카로티노이드 합성에 필수적인 적어도 하나의 유전자는 테르펜 클러스터 2a의 유전자, 예컨대 하기이다:
i. 전사 조절인자 유전자 (ACSP50_1631, 서열식별번호: 35),
ii. 리코펜 시클라제 유전자 (ACSP50_1632, 서열식별번호: 36),
iii. 리코펜 시클라제 유전자 (ACSP50_1633, 서열식별번호: 37),
iv. 폴리프레닐 신테타제 (파르네실 피로포스페이트 신테타제 2 유전자 fps2/crtE (ACSP50_1634, 서열식별번호: 38), 또는
v. 메틸렌테트라히드로폴레이트 리덕타제 (NADPH) 유전자 (ACSP50_1635, 서열식별번호: 39).
본 측면 및 실시양태에 따른 일부 실시양태에 따르면, 카로티노이드 합성에 필수적인 적어도 하나의 유전자는 테르펜 클러스터 2b의 유전자, 예컨대 하기이다:
i. LysR-패밀리 전사 조절인자 유전자 (ACSP50_1650, 서열식별번호: 40),
ii. 메틸트랜스퍼라제 유형 11 유전자 (ACSP50_1651, 서열식별번호: 41),
iii. CDP-알콜포스파티딜트랜스퍼라제 pgsA (ACSP50_1652, 서열식별번호: 42),
iv. 제타-피토엔 데새투라제 (crtI-패밀리) 유전자 crtD (ACSP50_1653, 서열식별번호: 43),
v. 글리코실 트랜스퍼라제 유전자 cruC (ACSP50_1654, 서열식별번호: 44),
vi. 가상 단백질 (추정 막 단백질) 유전자 cruF, (ACSP50_1655, 서열식별번호: 45),
vii. GCN5 패밀리 아세틸트랜스퍼라제 유전자 (ACSP50_1656, 서열식별번호: 46),
viii. 모노옥시게나제 유전자 (ACSP50_1657, 서열식별번호: 47), 또는
ix. 단쇄 데히드로게나제 유전자 (ACSP50_1658, 서열식별번호: 48).
본 측면 및 실시양태에 따른 일부 실시양태에 따르면, 카로티노이드 합성에 필수적인 적어도 하나의 유전자는 폴리프레닐 신테타제 유전자 crtE (ACSP50_3873, 서열식별번호: 49)이다.
본 측면 및 실시양태에 따른 일부 실시양태에 따르면, 카로티노이드 합성에 필수적인 적어도 하나의 유전자는 캄펜-유사 모노테르펜 생합성 테르펜 클러스터 3의 유전자, 예컨대 하기이다:
i. 전사 조절인자 (Crp/Fnr 패밀리) 유전자 eshA (ACSP50_1949, 서열식별번호: 104),
ii. 캄펜 신타제 유전자 (ACSP50_1950, 서열식별번호: 50),
iii. 메틸트랜스퍼라제 (SAM-의존성) 유형 11 유전자 (ACSP50_1951, 서열식별번호: 105),
iv. 글리코실-히드롤라제 유전자 (ACSP50_1952, 서열식별번호: 106), 또는
v. 옥시도리덕타제/알도/케토리덕타제 (ACSP50_1953, 서열식별번호: 107).
카로티노이드는 막의 유동성에 영향을 미치므로, 카로티노이드의 결여, 특히 C40-카로티노이드의 결여는 악티노플라네스 종 SE50/110의 표면 및 균사체 구조에 영향을 미칠 수도 있다. 균사체 덩어리의 생산 분열과 관련하여, 균사체 표면과 생화학적으로 이용가능한 세포의 수를 증가시키는 것이 유리하다.
일부 추가 실시양태에 따르면, 제1 측면에 따른 방법은 MerR-/HTH-전사 조절인자 유전자 merR (ACSP50_0145, 서열식별번호: 11)의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것을 포함한다. 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것은 본원의 다른 곳에 기재된 바와 같이 발생할 수 있다.
카로티노이드 합성에 필수적인 것으로 언급된 유전자들 외에도, 본 발명자들은 놀랍게도 테르펜 클러스터 1의 유전자 중에서 카로티노이드 합성을 위한 전사 억제인자를 확인하였다: ACSP50_0145 (서열식별번호: 11, MerR-/HTH-전사 조절인자 유전자 merR) (예시 "SE50/110에서의 merR의 결실은 빛에 노출되지 않고 카로티노이드 형성을 유도한다", 도 24 참조). SE50/110에서 상응하는 유전자의 CRISPR/Cas9 결실에 의해, 카로티노이드 형성은 빛에 노출되지 않고 강하게 유도되었다 (도 24b 및 c). 이와 일치하여, 아카르보스 생산이 감소된 것으로 밝혀졌다. 조명을 받으면, 야생형과 ΔmerR 둘 다가 강하게 착색되고 최종 아카르보스 농도는 균주 둘 다에서 유사하며, 대략 0.52 g·L-1에 도달하였다 (도 24b 및 d). 이것은 어두운 조건 하에서의 야생형 (0.83 g·L-1에 도달)과 비교하여 대략 38%의 아카르보스 형성의 감소에 상응한다. 이것은 야생형의 이전 성장 실험에 따른 것이다.
어두운 조건 하에서, ΔmerR은 야생형보다 대략 15% 더 적은 아카르보스를 생산한다 (0.70 g·L-1) (도 24d). 이론에 얽매이는 것은 아니지만, 이러한 생산 손실은 결실 돌연변이체에서 카로티노이드 형성에 의한 자원 낭비로 인해 야기된 것으로 추정된다 (도 24c). 결론적으로, 밝은 조건 하에서의 생산 손실 (38-39%)은 결실 돌연변이체와 야생형 둘 다에서 추가의 광 유발 스트레스로 할당될 수 있다.
제1 측면에 따른 일부 제3 실시양태에 따르면, 상기 방법은 dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것을 포함한다.
본 발명에 따르면 놀랍게도, dTDP-D-글루코스-4,6-데히드라타제 AcbB를 코딩하는 acb 유전자의 과다발현이 최종 아카르보스 농도를 대략 50%만큼 상당히 증가시키는 것으로 밝혀졌다. Acb 클러스터, 예컨대 AcbC의 다른 유전자는 아카르보스의 개선된 형성을 초래하지 않았기 때문에, 이것은 특히 놀라운 일이었다. 더욱이, 관찰된 증가는 문헌 [Zhao, Xie, et al. 2017]에 기재된 바와 같이 전체 Acb 클러스터의 과다발현에 대해 관찰된 증가와 비교하여 우수하였다.
일부 실시양태에 따르면, 상기 균주는 AcbA를 제외한 Acb 클러스터의 다른 유전자의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것을 포함하지 않는다.
dTDP-D-글루코스-4,6-데히드라타제 AcbB는 아카르보스 생합성의 피딩 경로인 D-글루코스-1P로부터 활성화된 아미노 당의 생성에 관여하는 것으로 보인다 (도 1): 이론에 얽매이는 것은 아니지만, 증가된 AcbB 활성은 놀랍게도, 변형된 전구체의 공급을 또한 개선시키는 것으로 밝혀졌다.
본원에 기재된 바와 같은 AcbB의 과다발현은 야생형 또는 명시된 참조 균주 / 대조군과 비교하여 AcbB에 대한 발현의 증가를 지칭한다. 예를 들어, 유전자 산물의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안의 증가 또는 임의의 다른 시간 동안의 증가일 수 있다.
바람직하게는, 본원에 기재된 바와 같이, AcbB의 과다발현은 대조군과 비교하여 적어도 1.5의 인자 또는 적어도 2의 인자만큼의 AcbB 전사체 및/또는 단백질의 증가를 지칭한다. AcbB 전사체 양과 관련하여 본원에서 달리 정의되지 않는 경우, 강한 과다발현은 log2(변화 배수) > 6을 지칭한다. AcbB 전사체 양과 관련하여 본원에서 달리 정의되지 않는 경우, 중간 정도의 강한 과다발현은 log2(배수 변화) ≥ 2 및 ≤ 6을 지칭한다.
일부 실시양태에 따르면, dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안 적어도 1.5 또는 적어도 2의 log2(변화 배수) 인자만큼의 AcbB 전사체 및/또는 단백질의 발현 증가 또는 임의의 다른 시간 동안의 증가이다.
일부 실시양태에 따르면, dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안 log2(변화 배수) ≥ 2 및 ≤ 6만큼의 AcbB 전사체 및/또는 단백질의 발현 증가 또는 임의의 다른 시간 동안의 증가, 예컨대 초기 성장기 동안 및/또는 선형 성장기 동안의 증가이다.
일부 실시양태에 따르면, dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안 log2(변화 배수) > 3 및 < 5만큼의 AcbB 전사체 및/또는 단백질의 발현 증가 또는 임의의 다른 시간 동안의 증가이다.
일부 실시양태에 따르면, dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안 log2(변화 배수) > 6만큼의 AcbB 전사체 및/또는 단백질의 발현 증가 또는 임의의 다른 시간 동안의 증가이다.
이종 프로모터를 포함하는 발현 벡터가 있는 과다발현 돌연변이체에서, acbB의 상대적 전사는 pSETT4tip::acbB (중간 정도의 강한 프로모터)에서 두 샘플링 시간 사이에 4.06배에서 3.33배 (log2(변화 배수))로 감속되었고, pSETT4gap::acbB (강한 프로모터)에서는 6.54배에서 2.05배로 감속되었다 (예시 "acbB의 중간 정도의 과다발현은 개선된 아카르보스 형성을 초래한다" 참조).
일부 실시양태에 따르면, 제1 측면에 따른 유전자의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것은 관련 기술분야에 공지되거나 본원에 기재된 임의의 방법에 의해 발생될 수 있다.
예시 "acbB의 중간 정도의 과다발현은 개선된 아카르보스 형성을 초래한다"에 기재된 바와 같이, acbB가 중간 정도의 강한 tipA-프로모터 또는 강한 gapDH-프로모터의 제어 하에 전사되는 2개의 pSETT4-기반 과다발현 돌연변이체가 생성되었다. 천연 프로모터가 대조군으로서 pSET152-벡터 및 pSETT4-벡터 배경 둘 다에 사용되었다. 특히, 이종 tipA-프로모터의 제어 하에 전사된 acbB를 갖는 돌연변이체는 대조군 균주와 비교하여 증강된 아카르보스 생산을 나타냈다 (도 27, 도 28). 수율 계수는 빈 벡터 대조군과 비교하여 48.6 및 51.9%로 증가되었다. 강한 gapDH-프로모터를 사용하면, 아카르보스 수율 계수가 약간 증가하는 것으로 밝혀졌다 (도 28).
일부 실시양태에 따르면, 제1 측면에 따른 유전자의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것은 AcbB (서열식별번호: 13)에 대한 발현 카세트를 포함하는 벡터를 악티노미세탈레스 균주 내로 도입함으로써 발생할 수 있다. 일부 실시양태에서, 발현 벡터는 pSET152로부터 유래된다. 일부 실시양태에서, 발현 벡터는 pSETT4로부터 유래된다. 벡터는 제2 벡터의 적어도 1개, 2개, 3개, 4개의 요소를 포함하는 경우에, 또 다른 벡터로부터 유래된다.
일부 실시양태에 따르면, 제1 측면에 따른 유전자의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것은 AcbB (서열식별번호: 13)에 대한 발현 카세트를 포함하는 벡터를 악티노미세탈레스 균주 내로 도입함으로써 발생할 수 있다. 이들 또는 다른 실시양태의 일부에서, 발현 카세트는, 예를 들어 본원의 다른 곳에 기재된 바와 같은 글루쿠로니다제 검정에서 적어도 1 x 10-4, 바람직하게는 1 x 10-4 내지 5 x 10-4 [L·g-1·min- 1]의 정규화된 글루쿠로니다제 활성을 특징으로 하는, 중간 정도의 강한 프로모터의 제어 하에 있다. 일부 실시양태에서 상기 프로모터는 efp 프로모터 (서열식별번호: 92), cdaR 프로모터 (서열식별번호: 97), rpsL 프로모터 (서열식별번호: 99), rpsJ 프로모터 (서열식별번호: 93), cgt 프로모터 (서열식별번호: 91), 또는 tipA 프로모터 (서열식별번호: 81)로부터 선택된다. 일부 실시양태에서 프로모터는 tipA 프로모터 (서열식별번호: 81)이다. pSETT4tip::acbB를 사용하여 아카르보스 생산에 대한 우수한 결과를 수득하였다 (도 27, 도 28 참조).
일부 실시양태에서 발현 카세트는, 예를 들어 본원의 다른 곳에 기재된 바와 같은 글루쿠로니다제 검정에서 적어도 5 x 10-5 [L·g-1·min- 1]의 정규화된 글루쿠로니다제 활성을 특징으로 하는, 강한 프로모터의 제어 하에 있다. 일부 실시양태에서 상기 프로모터는 apm 프로모터 (서열식별번호: 96), ermE* 프로모터 (서열식별번호: 98), katE 프로모터 (서열식별번호: 94), moeE5 프로모터 (서열식별번호: 95) 또는 gapDH 프로모터 (서열식별번호: 82)로부터 선택된다.
일부 실시양태에 따르면, 제1 측면에 따른 방법은 dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13) 및 임의적으로 AcbA (서열식별번호: 12)의 중간 정도의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것을 포함한다. 달리 명시적으로 언급되지 않는 한 본원에 기재된 다른 모든 실시양태와 또한 양립가능한 일부 실시양태에서, 유전적 조작은 AcbB 및 AcbA 이외의 Acb 유전자에 대해 log2(변화 배수) ≥ 2만큼의 전사체 및/또는 단백질의 증가를 초래하지 않는다. 본원에 기재된 다른 모든 실시양태와 또한 양립가능한 일부 실시양태에서, 유전적 조작은 AcbC에 대해 log2(변화 배수) ≥ 2만큼의 전사체 및/또는 단백질의 증가를 초래하지 않는다.
AcbB의 과다발현 시, acb 유전자 클러스터의 추가 유전자는 acbA 및 acbV에 대해 제시된 것처럼, 예를 들어 초기 성장기에서 유의하게 영향을 받지 않았다 (도 30). 유일한 예외는 pSETT4tip::acbB에서 acbA의 전사 풍부도가 약간 더 높다는 것이다 (log2(변화 배수) = 1.87).
일부 실시양태에 따르면, 제1 측면에 따른 방법은 AcbB (서열식별번호: 13) 및 AcbS (ACSP50_3596) 및/또는 AcbI (ACSP50_3599)의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것을 포함한다.
AcbS 및/또는 AcbI의 (부가의) 과다발현에 의해, 아미노 당의 시클리톨 전구체로의 전이 반응이 강화될 수 있다. 본 발명의 모델 (도 1 참조)에 따르면, 이러한 반응은 AcbS (ACSP50_3596) 또는 AcbI (ACSP50_3599)에 의해 촉매된다.
일부 실시양태에 따르면, 제1 측면에 따른 방법은 AcbB (서열식별번호: 13) 및 AcbCUJ (AcbC (ACSP50_3607) 및/또는 AcbU (ACSP50_3595) 및/또는 AcbJ (ACSP50_3600)) 및/또는 AcbSI (AcbS (ACSP50_3596) 및/또는 AcbI (ACSP50_3599))의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것을 포함한다. 이론에 얽매이는 것은 아니지만, 이러한 조합은 아카르보스 합성 가닥 둘 다를 그럴듯하게 보강시킬 수 있다.
제1 측면에 따른 일부 제4 실시양태에 따르면, 상기 방법은 UDP-글루코스-1P 우리딜트랜스퍼라제 GtaB (서열식별번호: 19)의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것을 포함한다.
gtaB의 중간 정도의 과다발현에 의해, 최종 아카르보스 농도의 8.5% 증가가 관찰되었으며, 예시 "gtaB의 중간 정도의 과다발현은 개선된 아카르보스 형성으로 이어진다", 도 32, 도 33을 참조한다. 흥미롭게도, 아카르보스 형성은 후기 선형 내지 정지 성장기에서 특히 증가한다 (도 32). 이론에 얽매이는 것은 아니지만, 이는 전구체 글루코스-1P의 개선된 전개로부터의 결과일 수 있다 (도 34 참조).
본원에 기재된 바와 같은 GtaB (서열식별번호: 19)의 과다발현은 야생형 또는 명시된 참조 균주 / 대조군과 비교하여 GtaB 전사체 및/또는 단백질에 대한 발현의 증가를 지칭한다. 예를 들어, 유전자 산물의 과다발현은 초기 성장기 동안 및/또는 선형 성장기 동안 및/또는 정지기 동안의 증가 및/또는 임의의 다른 시간 동안의 증가일 수 있다.
바람직하게는, 과다발현은 대조군과 비교하여 적어도 1.5의 인자 또는 적어도 2의 인자만큼의 GtaB 전사체 및/또는 단백질의 증가이다. GtaB 전사체 양과 관련하여 본원에서 달리 정의되지 않는 경우, 강한 과다발현은 log2(변화 배수) > 6을 지칭한다. GtaB 전사체 양과 관련하여 본원에서 달리 정의되지 않는 경우, 중간 정도의 강한 과다발현은 log2(변화 배수) ≥ 2 및 ≤ 6을 지칭한다.
일부 실시양태에 따르면 UDP-글루코스-1P 우리딜트랜스퍼라제 GtaB의 과다발현은 초기 성장기 동안 및/또는 선형 성장기 동안 및/또는 정지기 동안 적어도 1.5 또는 적어도 2의 log2(변화 배수) 인자만큼의 GtaB의 발현 증가 및/또는 임의의 다른 시간 동안의 증가이다.
본원에 기재된 과다발현 돌연변이체 중 하나에서, 유전자 gtaB의 상대적 전사체 양은 2.64배 증가된다 (log2(변화 배수)) (도 33).
일부 실시양태에 따르면 UDP-글루코스-1P 우리딜트랜스퍼라제 GtaB의 과다발현은 초기 성장기 동안 및/또는 선형 성장기 동안 및/또는 정지기 동안 log2(변화 배수) ≥ 2 및 ≤ 6만큼의 GtaB 전사체 및/또는 단백질의 발현 증가, 및/또는 임의의 다른 시간 동안의 증가이다. 일부 실시양태에 따르면 UDP-글루코스-1P 우리딜트랜스퍼라제 GtaB의 과다발현은 초기 성장기 동안 및/또는 선형 성장기 동안 및/또는 정지기 동안 log2(변화 배수) ≥ 3 및 ≤ 5만큼의 GtaB의 발현 증가, 및/또는 임의의 다른 시간 동안의 증가이다.
일부 실시양태에 따르면 UDP-글루코스-1P 우리딜트랜스퍼라제 GtaB의 과다발현은 초기 성장기 동안 및/또는 선형 성장기 동안 및/또는 정지기 동안 log2(변화 배수) ≥ 6만큼의 GtaB의 발현 증가이다.
일부 실시양태에 따르면, 제1 측면에 따른 유전자의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것은 GtaB (서열식별번호: 19)에 대한 발현 카세트를 포함하는 벡터를 악티노미세탈레스 균주 내로 도입함으로써 발생할 수 있다. 일부 실시양태에서, 발현 벡터는 pSET152로부터 유래된다. 일부 실시양태에서, 발현 벡터는 pSETT4로부터 유래된다. 벡터는 제2 벡터의 적어도 1개, 2개, 3개, 4개의 요소를 포함하는 경우에, 또 다른 벡터로부터 유래된다.
일부 실시양태에 따르면, 제1 측면에 따른 유전자의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것은 GtaB (서열식별번호: 19)에 대한 발현 카세트를 포함하는 벡터를 악티노미세탈레스 균주 내로 도입함으로써 발생할 수 있다.
이들 또는 다른 실시양태의 일부에서, 발현 카세트는, 예를 들어 본원의 다른 곳에 기재된 바와 같은 글루쿠로니다제 검정에서 1 x 10-4 내지 5 x 10-5 [L·g-1·min-1]의 정규화된 글루쿠로니다제 활성을 특징으로 하는, 중간 정도의 강한 프로모터의 제어 하에 있다. 일부 실시양태에서 상기 프로모터는 efp 프로모터 (서열식별번호: 92), cdaR 프로모터 (서열식별번호: 97), rpsL 프로모터 (서열식별번호: 99), rpsJ 프로모터 (서열식별번호: 93), cgt 프로모터 (서열식별번호: 91), 또는 tipA 프로모터 (서열식별번호: 81)로부터 선택된다. 일부 실시양태에서 프로모터는 tipA 프로모터 (서열식별번호: 81)이다. pSETT4tip::gtaB를 사용하여 아카르보스 생산에 대한 우수한 결과를 수득하였다 (도 32, 도 33 참조).
일부 실시양태에서 발현 카세트는, 예를 들어 본원의 다른 곳에 기재된 바와 같은 글루쿠로니다제 검정에서 적어도 5 x 10-5 [L·g-1·min- 1]의 정규화된 글루쿠로니다제 활성을 특징으로 하는, 강한 프로모터의 제어 하에 있다. 일부 실시양태에서 상기 프로모터는 apm 프로모터 (서열식별번호: 96), ermE* 프로모터 (서열식별번호: 98), katE 프로모터 (서열식별번호: 94), moeE5 프로모터 (서열식별번호: 95) 또는 gapDH 프로모터 (서열식별번호: 82)로부터 선택된다.
제1 측면의 일부 추가의 또는 동일한 실시양태에 따르면, 상기 방법은 dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13) 및 GtaB (서열식별번호: 19)의 중간 정도의 과다발현을 위해 악티노미세탈레스 균주를 조작하는 것을 포함한다.
놀랍게도 GtaB의 과다발현이 개선된 아카르보스 형성을 촉발하는 것으로 밝혀졌다. acbB의 중간 정도의 과다발현에 의해 (예를 들어, tipA-프로모터의 사용에 의함), 아카르보스 생산에 대한 긍정적인 효과가 관찰되어, 2가지 독립적인 배양에서 대략 50% 더 많은 아카르보스가 산출되었다. 따라서, 단일 acb 유전자 AcbB의 과다발현에 의한 아카르보스 생합성의 개선이 달성되었다. 더욱이, gtaB의 중간 정도의 과다발현에 의해, 최종 아카르보스 농도의 8.5% 증가가 관찰되었다. acbB와 gtaB의 조합된 과다발현에 의해, 아미노 당 생합성을 통한 플럭스가 개선되어 아카르보스 생산이 추가로 증강된다는 것은 타당하다.
이론에 얽매이는 것은 아니지만, AcbB의 강한 과다발현은 AcbB의 중간 정도의 강한 과다발현과 비교하여 단지 더 작은 아카르보스 생산 증가를 유도하였다. 이것은 AcbB의 대량 과다발현 시 발생하는 글루코스-포스페이트-대사에 있어서의 불균형 때문일 수 있다. gtaB의 과다발현은 이러한 불균형을 치유할 수 있으며, 따라서 acbB와 gtaB 둘 다의 조합된 과다발현은 아마도 아카르보스 생산에 있어서의 추가 증가로 이어질 것이다.
흥미롭게도, pSETT4tip::gtaB에서 질량 m/z = 545 [M-H+]의 상당히 감소된 양이 발견되었으며 (대략 48% 감소), 이는 AcbB의 제안된 산물인 dTDP-4-케토-6-데옥시-D-글루코스에 상응할 수 있다. 이것은 합성 가닥을 통한 흐름이 더 균형을 이루고 있음을 나타낼 수 있는데, 이는 이러한 대사산물의 축적이 빈 벡터 대조군 및 AcbB-과다발현 돌연변이체와 비교하여 감소되기 때문이다 (도 34).
일부 실시양태에 따르면, 제1 측면에 따른 방법은
(i) 세포외 작은 탄수화물 결합 단백질 Cgt (서열식별번호: 20)의 발현 부재 또는 감소를 위해, 및/또는
(ii) 카로티노이드 합성에 관여하는 적어도 하나의 유전자의 발현 부재 또는 감소를 위해, 및/또는
(iii) dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현을 위해, 및/또는
(iv) UDP-글루코스-1P 우리딜트랜스퍼라제 GtaB (서열식별번호: 19)의 과다발현을 위해
악티노미세탈레스 균주를 조작하는 것을 포함한다.
일부 실시양태에 따르면, 제1 측면에 따른 방법은 treY의 발현 부재 또는 감소를 위해 악티노미세탈레스 균주를 조작하는 것을 추가로 포함한다.
일부 실시양태에 따르면, 제1 측면에 따른 방법은 하기를 추가로 포함한다:
(i) 세포외 작은 탄수화물 결합 단백질 Cgt (서열식별번호: 20)를 코딩하는 유전자의 결실 또는 돌연변이 및/또는
(ii) 카로티노이드 합성에 관여하는 적어도 하나의 유전자의 결실 또는 돌연변이 및/또는
(iii) AcbB (서열식별번호: 13)에 대한 발현 카세트를 포함하는 벡터를 악티노미세탈레스 균주 내로 도입하는 것 및/또는
(iv) GtaB (서열식별번호: 19)에 대한 발현 카세트를 포함하는 벡터를 악티노미세탈레스 균주 내로 도입하는 것.
일부 실시양태에 따르면, (iii) 및/또는 (iv)에 따른 발현 카세트는 글루쿠로니다제 검정에서 1 x 10-4 내지 5 x 10-5 [L·g-1·min- 1]의 정규화된 글루쿠로니다제 활성을 특징으로 하는, 중간 정도의 강한 프로모터의 제어 하에 있다.
제2 측면에 따르면, 아카르보스의 생산을 위한 악티노미세탈레스 균주, 예컨대 악티노플라네스 균주가 제공된다. 일부 실시양태에 따르면, 악티노미세탈레스 균주는 제1 측면에 따른 방법에 의해 생성된 균주이다. 일부 다른 실시양태에 따르면, 악티노미세탈레스 균주는 세포외 작은 탄수화물 결합 단백질 Cgt (서열식별번호: 20)의 발현 부재 또는 감소를 위해 유전적으로 조작된다. 일부 실시양태에 따르면, 악티노미세탈레스 균주는 Δcgt 돌연변이체이다. Δcgt 돌연변이체는 유전자 Cgt (서열식별번호: 20)가 적어도 부분적으로 결실되거나 역전된 악티노미세탈레스 균주의 변이체이다.
이들 또는 다른 실시양태의 일부에 따르면, 악티노미세탈레스 균주는 카로티노이드 합성에 필수적인 적어도 하나의 유전자의 발현 부재 또는 감소를 위해 유전적으로 조작된다. 일부 실시양태에 따르면, 카로티노이드 합성에 필수적인 적어도 하나의 유전자는 적어도 부분적으로 결실되거나 역전되었다. 이들 실시양태의 일부에 따르면, 카로티노이드 합성에 필수적인 적어도 하나의 유전자는 하기 중 임의의 것으로부터 선택된 적어도 하나의 유전자를 포함한다:
a. MEP/DOXP 경로의 유전자, 예컨대
i. 1-데옥시-D-크실룰로스-5-포스페이트 신타제 유전자 dxs (ACSP50_7096, 서열식별번호: 23),
ii. 4-히드록시-3-메틸부트-2-엔-1-일 디포스페이트 신타제 유전자 ispG (ACSP50_7248, 서열식별번호: 24),
iii. 1-데옥시-D-크실룰로스-5-포스페이트 리덕토이소머라제 유전자 dxr (ACSP50_7250, 서열식별번호: 25),
iv. 4-히드록시-3-메틸부트-2-에닐 디포스페이트 리덕타제 유전자 ispH (ACSP50_7707, 서열식별번호: 26),
v. 4-(시티딘 5'-디포스포)-2-C-메틸-D-에리트리톨 키나제 유전자 ispE (ACSP50_7802, 서열식별번호: 27),
vi. 2-C-메틸-D-에리트리톨 2;4-시클로디포스페이트 신타제 유전자 ispF, (ACSP50_8046, 서열식별번호: 28), 및/또는
vii. 2-C-메틸-D-에리트리톨 4-포스페이트 시티딜릴트랜스퍼라제 유전자 ispD (ACSP50_8047, 서열식별번호: 29),
b. 테르펜 클러스터 1의 유전자, 예컨대
i. 이소펜테닐-디포스페이트 델타-이소머라제 유전자 idi (ACSP50_0146, 서열식별번호: 30),
ii. 제타-피토엔 데새투라제 유전자 crtI (ACSP50_0147, 서열식별번호: 10),
iii. 폴리프레닐 신테타제 유전자 crtE/ldsA (ACSP50_0148, 서열식별번호: 31),
iv. 피토엔 신타제 유전자 crtB (ACSP50_0149, 서열식별번호: 32),
v. 데옥시리보디피리미딘 포토-리아제 유전자 (ACSP50_0150, 서열식별번호: 33), 또는
vi. 피리딘 뉴클레오티드-디술피드 옥시도리덕타제 유전자 (ACSP50_0151, 서열식별번호: 34),
c. 테르펜 클러스터 2a의 유전자, 예컨대
i. 전사 조절인자 유전자 (ACSP50_1631, 서열식별번호: 35),
ii. 리코펜 시클라제 유전자 (ACSP50_1632, 서열식별번호: 36),
iii. 리코펜 시클라제 유전자 (ACSP50_1633, 서열식별번호: 37),
iv. 폴리프레닐 신테타제 (파르네실 피로포스페이트 신테타제 2 유전자 fps2/crtE (ACSP50_1634, 서열식별번호: 38), 또는
v. 메틸렌테트라히드로폴레이트 리덕타제 (NADPH) 유전자 (ACSP50_1635, 서열식별번호: 39),
d. 테르펜 클러스터 2b의 유전자, 예컨대
i. LysR-패밀리 전사 조절인자 유전자 (ACSP50_1650, 서열식별번호: 40),
ii. 메틸트랜스퍼라제 유형 11 유전자 (ACSP50_1651, 서열식별번호: 41),
iii. CDP-알콜포스파티딜트랜스퍼라제 pgsA (ACSP50_1652, 서열식별번호: 42),
iv. 제타-피토엔 데새투라제 (crtI-패밀리) 유전자 crtD (ACSP50_1653, 서열식별번호: 43),
v. 글리코실 트랜스퍼라제 유전자 cruC (ACSP50_1654, 서열식별번호: 44),
vi. 가상 단백질 (추정 막 단백질) 유전자 cruF, (ACSP50_1655, 서열식별번호: 45),
vii. GCN5 패밀리 아세틸트랜스퍼라제 유전자 (ACSP50_1656, 서열식별번호: 46),
viii. 모노옥시게나제 유전자 (ACSP50_1657, 서열식별번호: 47),
ix. 단쇄 데히드로게나제 유전자 (ACSP50_1658, 서열식별번호: 48),
e. 폴리프레닐 신테타제 유전자 crtE (ACSP50_3873, 서열식별번호: 49), 또는
f. 캄펜-유사 모노테르펜 생합성 테르펜 클러스터 3에 대한 유전자, 예컨대
i. 전사 조절인자 (Crp/Fnr 패밀리) 유전자 eshA (ACSP50_1949, 서열식별번호: 104),
ii. 캄펜 신타제 유전자 (ACSP50_1950, 서열식별번호: 50),
iii. 메틸트랜스퍼라제 (SAM-의존성) 유형 11 유전자 (ACSP50_1951, 서열식별번호: 105),
iv. 글리코실-히드롤라제 유전자 (ACSP50_1952, 서열식별번호: 106),
v. 옥시도리덕타제/알도/케토리덕타제 (ACSP50_1953, 서열식별번호: 107).
이들 또는 다른 실시양태의 일부에 따르면, 악티노미세탈레스 균주는 MerR-/HTH-전사 조절인자 유전자 merR (ACSP50_0145, 서열식별번호: 11)의 과다발현을 위해 유전적으로 조작된다.
이들 또는 다른 실시양태의 일부에 따르면, 악티노미세탈레스 균주는 dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현을 위해 유전적으로 조작된다.
본원의 다른 곳에 기재된 바와 같이, AcbB의 과다발현은 대조군과 비교하여 적어도 1.5의 인자 또는 적어도 2의 인자만큼 AcbB의 증가를 지칭한다. 바람직하게는, 대조군은 dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 특이적 과다발현을 위해 조작되지 않은 균주이다. 예를 들어, 대조군은 AcbB에 대한 발현 카세트를 포함하는 벡터를 포함하지 않는다.
예를 들어, 유전자 산물의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안의 증가, 또는 임의의 다른 시간 동안의 증가일 수 있다.
일부 실시양태에 따르면, dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안의 적어도 1.5 또는 적어도 2의 log2(변화 배수) 인자만큼의 AcbB 전사체 및/또는 단백질의 발현 증가, 또는 임의의 다른 시간 동안의 증가이다.
일부 실시양태에 따르면, dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안 log2(변화 배수) ≥ 2 및 ≤ 6만큼의 AcbB 전사체 및/또는 단백질의 발현 증가 또는 임의의 다른 시간 동안의 증가, 예컨대 초기 성장기 동안 및/또는 선형 성장기 동안의 증가이다.
일부 실시양태에 따르면, dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안 log2(변화 배수) > 3 및 < 5만큼의 AcbB 전사체 및/또는 단백질의 발현 증가 또는 임의의 다른 시간 동안의 증가이다.
일부 실시양태에 따르면, dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안 log2(변화 배수) > 6만큼의 AcbB 전사체 및/또는 단백질의 발현 증가 또는 임의의 다른 시간 동안의 증가이다.
일부 실시양태에 따르면, dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현을 위해 유전적으로 조작된 악티노미세탈레스 균주는 AcbB의 과다발현을 위한 벡터를 포함한다. 이들 실시양태의 일부에 따르면, 벡터는 본원에 기재된 바와 같은 벡터, 바람직하게는 본원에 기재된 측면에 따른 벡터이다.
일부 실시양태에 따르면, dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현을 위해 유전적으로 조작된 악티노미세탈레스 균주는 중간 정도의 강한 프로모터의 제어 하에 AcbB (서열식별번호: 13)에 대한 발현 카세트를 포함한다.
일부 실시양태에 따르면, dTDP-D-글루코스-4,6-데히드라타제 AcbB (서열식별번호: 13)의 과다발현을 위해 유전적으로 조작된 악티노미세탈레스 균주는 강한 프로모터의 제어 하에 AcbB (서열식별번호: 13)에 대한 발현 카세트를 포함한다. 바람직하게는, 프로모터는 AcbB의 천연 프로모터가 아니다.
이들 또는 다른 실시양태의 일부에 따르면 악티노미세탈레스 균주는 UDP-글루코스-1P 우리딜트랜스퍼라제 GtaB (서열식별번호: 19)의 과다발현을 위해 유전적으로 조작된다.
본원의 다른 곳에 기재된 바와 같은 GtaB (서열식별번호: 19)의 과다발현은 야생형 또는 명시된 참조 균주 / 대조군과 비교하여 GtaB에 대한 발현의 증가를 지칭한다. 바람직하게는, 대조군은 GtaB (서열식별번호: 19)의 특이적 과다발현을 위해 조작되지 않은 균주이다. 예를 들어, 대조군은 GtaB (서열식별번호: 19)에 대한 발현 카세트를 포함하는 벡터를 포함하지 않는다. 예를 들어, 유전자 산물의 과다발현은 초기 성장기 동안 및/또는 선형 성장기 동안 및/또는 정지기 동안의 증가 및/또는 임의의 다른 시간 동안의 증가일 수 있다.
일부 실시양태에 따르면 GtaB의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안 적어도 1.5 또는 적어도 2의 log2(변화 배수) 인자만큼의 GtaB 전사체 및/또는 단백질의 발현 증가 및/또는 임의의 다른 시간 동안의 증가이다.
일부 실시양태에 따르면 GtaB의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안 log2(변화 배수) ≥ 2 및 ≤ 6만큼의 GtaB 전사체 및/또는 단백질의 발현 증가 및/또는 임의의 다른 시간 동안의 증가, 예컨대 초기 성장기 동안 및/또는 선형 성장기 동안의 증가이다.
일부 실시양태에 따르면 GtaB의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안 log2(변화 배수) > 3 및 < 5만큼의 GtaB 전사체 및/또는 단백질의 발현 증가 및/또는 임의의 다른 시간 동안의 증가이다.
일부 실시양태에 따르면 GtaB의 과다발현은 초기 성장기 동안, 선형 성장기 동안, 정지기 동안 log2(변화 배수) > 6만큼의 GtaB 전사체 및/또는 단백질의 발현 증가 또는 임의의 다른 시간 동안의 증가이다.
일부 실시양태에 따르면 GtaB의 과다발현을 위해 유전적으로 조작된 악티노미세탈레스 균주는 GtaB의 과다발현을 위한 벡터를 포함한다. 이들 실시양태의 일부에 따르면, 벡터는 본원에 기재된 바와 같은 벡터, 바람직하게는 본원에 기재된 측면에 따른 벡터이다.
일부 실시양태에 따르면, GtaB (서열식별번호: 19)의 과다발현을 위해 유전적으로 조작된 악티노미세탈레스 균주는 중간 정도의 강한 프로모터의 제어 하에 GtaB (서열식별번호: 19)에 대한 발현 카세트를 포함한다.
일부 실시양태에 따르면, GtaB (서열식별번호: 19)의 과다발현을 위해 유전적으로 조작된 악티노미세탈레스 균주는 강한 프로모터의 제어 하에 GtaB (서열식별번호: 19)에 대한 발현 카세트를 포함한다. 바람직하게는, 프로모터는 GtaB의 천연 프로모터가 아니다.
제3 측면에 따르면, 아카르보스의 생산에 사용하기 위한 아카르보스의 생산을 위한 악티노미세탈레스 균주, 예컨대 악티노플라네스 균주가 제공된다.
일부 실시양태에 따르면, 제2 측면에 따른 악티노미세탈레스 균주의 사용을 포함하는, 아카르보스의 생산을 위한 방법이 제공된다.
악티노플라네스의 유전적 조작을 위해서는, 단일 또는 다중 유전자의 과다발현을 위한 발현 시스템이 필요한다. 제4 측면에 따르면 악티노플라네스에 대한 발현 벡터가 제공된다.
일부 실시양태에 따르면, 제4 측면에 따른 벡터는 글루쿠로니다제 검정에서 적어도 1 x 10-4 [L·g-1·min- 1]의 정규화된 글루쿠로니다제 활성을 특징으로 하는 중간 정도의 강한 프로모터를 포함한다. 일부 실시양태에서, 중간 정도의 강한 프로모터는 서열식별번호: 92에 따른 efp, 서열식별번호: 97에 따른 cdaR, 서열식별번호: 99에 따른 rpsL, 서열식별번호: 93에 따른 rpsJ, 서열식별번호: 91에 따른 cgt, 또는 서열식별번호: 81에 따른 tipA로부터 선택된다.
일부 실시양태에 따르면, 제4 측면에 따른 벡터는 글루쿠로니다제 검정에서 적어도 5 x 10-4 [L·g-1·min- 1]의 정규화된 글루쿠로니다제 활성을 특징으로 하는 강한 프로모터를 포함한다. 일부 실시양태에서, 강한 프로모터는 서열식별번호: 96에 따른 apm, 서열식별번호: 98에 따른 ermE*, 서열식별번호: 94에 따른 katE, 서열식별번호: 95에 따른 moeE5 또는 서열식별번호: 82에 따른 gapDH로부터 선택된다.
중간 내지 강한 유전자 발현을 허용하는 추가의 적합한 프로모터를 찾기 위해, pSET152-벡터 시스템에서 클로닝된 리포터 GusA를 기반으로 하는, 문헌 [Horbal et al. (2013) and Myronovskyi et al. (2011)]의 스크리닝 시스템을 사용하여 프로모터 스크리닝을 수행할 수 있다 (도 3, 표 1 참조).
일부 실시양태에서, 제1 측면에 따른 벡터는 발현 카세트를 포함한다. 바람직하게는 벡터는 AcbB (서열식별번호: 13)에 대한 발현 카세트 및/또는 GtaB (서열식별번호: 19)에 대한 발현 카세트 및/또는 MerR에 대한 발현 카세트를 포함한다.
일부 실시양태에서, 발현 카세트는 더욱이 lac-프로모터의 제어 하에 있는 lacZα-유전자를 포함할 수 있다. lacZα-유전자는 클로닝 균주 에스케리키아 콜라이(Escherichia coli) DH5αMCR (NC_017638.1) (Grant et al. 1990)에서 청색/백색 선택을 통해 표적 서열의 통합을 빠르게 선택할 수 있도록 하는 β-갈락토시다제의 촉매 도메인을 코딩한다.
이론에 얽매이는 것은 아니지만, 본 측면에 따른 벡터는 벡터 복제, 전달, 유지 및 선택을 위한 요소를 포함한다. 일부 실시양태에서, 이들 요소 중 적어도 하나는 pSET152로부터 유래된다.
일부 실시양태에서, 본 측면에 따른 벡터는 문헌 [Bierman et al. (1992)]의 pSET152 벡터의 서열의 일부를 포함한다.
바람직하게는, 벡터는 서열식별번호: 108 및/또는 서열식별번호: 109에 따른 추정 안티센스 프로모터를 포함하지 않는다. 이들 안티센스 프로모터는 5'-1차 전사체 라이브러리의 시퀀싱에 의해 본 발명자들에 의해 확인되었고 벡터 pSET152의 적합성을 손상시킨다. 간단히 언급하면, 확인은 강화된 1차 전사체 라이브러리의 시퀀싱에 의해 이루어졌다. 2개의 추정 프로모터는 안티센스 배향에서 관심 유전자 뒤에서 확인되었다 (도 26). 안티센스 전사를 방지하기 위해 이들 2개의 슈도-프로모터를 제거하였다.
더욱이, 추가의 추정 안티센스 판독을 방지하기 위해 T4-종결인자를 반대 배향으로 발현 카세트 뒤에 도입하였다 (예를 들어, 도 6 참조). 일부 실시양태에서, 벡터는 적어도 하나의 T4-종결인자 (박테리오파지 T4로부터 유래됨)를 포함한다. T4-종결인자는 전사를 효율적으로 차단하고 인테그라제 유전자로부터 관심 유전자로의 번역-초과를 방지할 수 있다. 일부 실시양태에서, 벡터는 추가의 추정 안티센스 판독을 방지하기 위해 반대 배향으로 발현 카세트 뒤에 T4-종결인자를 포함한다. 예를 들어, 벡터는 발현 카세트 앞에 적어도 하나의 T4-종결인자를 포함하고/거나 발현 카세트 뒤에 적어도 하나의 T4-종결인자를 포함할 수 있다. 일부 실시양태에서, 벡터는 3개의 종결인자를 포함할 수 있으며, 하나는 발현 카세트 앞에 있고 2개는 발현 카세트 뒤에 있다.
일부 실시양태에서 벡터는 φC31 인테그라제 유전자 int를 포함한다. 이들 실시양태의 일부에서 φC31 인테그라제 유전자 int는 pSET152로부터 유래된다. 일부 실시양태에서, 제1 측면에 따른 벡터는 더욱이 부착 부위 attP를 포함한다. φC31 인테그라제 유전자 int의 인테그라제는 2개의 부착 부위: 벡터에 국한된 attP 및 유전자 ACSP50_6589 (이전명: ACPL_6602) (te Poele et al. 2008; Gren et al. 2016])에서 숙주 염색체에 국한된 attB의 표적화된 단방향 재조합을 촉매함으로써 별개의 게놈 위치에서 벡터의 숙주 염색체로의 통합을 매개한다. 이론에 얽매이는 것은 아니지만, 통합 후 벡터는 attP-attB-재조합으로부터 유래되는 부착 부위 좌측 (attL) 및 우측 (attR)에 의해 플랭킹된다 (te Poele, Bolhuis und Dijkhuizen 2008).
일부 실시양태에서 벡터는 전달 기점, 예컨대 전달 기점 (incP) 및/또는 릴랙소좀 유전자, 예컨대 릴랙소좀 유전자 traJ를 포함한다. 이들 실시양태의 일부에서, 전달 기점, 예컨대 전달 기점 (incP) 및/또는 릴랙소좀 유전자, 예컨대 traJ는 pSET152로부터 유래된다. 전달 기점 및 릴랙소좀 유전자는 공여자 균주 (예를 들어 에스케리키아 콜라이 ET12567/pUZ8002 (Kieser et al. 2000))로부터 플라스미드의 전달을 가능하게 한다.
일부 실시양태에서, 제1 측면에 따른 벡터는 복제 기점, 예컨대 높은 카피 수 ColE1/pMB1/pBR322/pUC 복제 기점 (ori)을 포함한다. 이들 실시양태의 일부에서 복제 기점, 예컨대 높은 카피 수 ColE1/pMB1/pBR322/pUC 복제 기점 (ori)은 pSET152로부터 유래된다. 복제 기점, 예컨대 높은 카피 수 ColE1/pMB1/pBR322/pUC 복제 기점 (ori)은 클로닝 균주 (에스케리키아 콜라이 DH5αMCR) 및 공여자 균주 (에스케리키아 콜라이 ET12567/pUZ8002)에서 플라스미드의 복제를 가능하게 한다.
일부 실시양태에서, 제1 측면에 따른 벡터는 적어도 하나의 내성 마커, 예컨대 아프라마이신 내성을 매개하는 내성 마커 (aac(3)IV, apmR)를 포함한다. 아프라마이신 내성을 매개하는 내성 마커 (aac(3)IV, apmR)를 선택에 사용할 수 있다.
제4 측면에 따른 일부 실시양태에 따르면, 발현 벡터는 pSET152의 적어도 하나의 요소, 예컨대 (a) 서열식별번호: 85에 따른 φC31 인테그라제 유전자 int, (b) 서열식별번호: 87에 따른 전달 기점 (incP), (c) 서열식별번호: 88에 따른 릴랙소좀 유전자 traJ, 또는 (d) 서열식별번호: 89에 따른 높은 카피 수 ColE1/pMB1/pBR322/pUC를 포함하고, 더욱이 서열식별번호: 108 및 서열식별번호: 109에 따른 추정 안티센스 프로모터를 포함하지 않는다.
제4 측면에 따른 일부 실시양태에 따르면, 발현 벡터는 (a) 서열식별번호: 85에 따른 φC31 인테그라제 유전자 int, 및 (b) 서열식별번호: 87에 따른 전달 기점 (incP), 및 (c) 서열식별번호: 88에 따른 릴랙소좀 유전자 traJ, 및 (d) 복제 기점, 예컨대 서열식별번호: 89에 따른 높은 카피 수 ColE1/pMB1/pBR322/pUC 복제 기점 (ori) 및 (e) 임의적으로 적어도 하나의 내성 마커, 예컨대 아프라마이신 내성을 매개하는 내성 마커, 예컨대 서열식별번호: 90에 따른 aac(3)IV, apmR, 및 (f) 임의적으로 적어도 하나의 T4-종결인자를 포함하고, (g) 임의적으로, 여기서 벡터는 서열식별번호: 108 및/또는 서열식별번호: 109에 따른 추정 안티센스 프로모터를 포함하지 않는다.
일부 실시양태에 따르면, 벡터는 서열식별번호: 110 또는 서열식별번호: 111에 따른 서열을 포함한다. 일부 실시양태에 따르면, 벡터는 서열식별번호: 110 또는 서열식별번호: 111에 따른 서열, 또는 그의 단편을 포함한다.
일부 실시양태에서, 벡터는 상이한 프로모터의 통합을 허용하는 용이한 클로닝 메커니즘에 의해 우수하다. 이를 통해, 시스템은 추가 종, 예를 들어 아카르보스의 생산 균주에 빠르게 적응할 수 있다.
실시예
일반 도구 및 방법
균주 및 플라스미드
본 작업에 사용된 모든 균주는 표 E1에 나열되어 있다. 본 작업에서 사용되거나 생성된 재조합 균주는 표 E2, 표 E3 및 표 E4에 나열되어 있다 (표 E2에는 플라스미드-기반 발현 시스템이 나열되어 있고, 표 E3에는 이. 콜라이 DH5αMCR에서 클로닝 및 저장된 결실 및 통합 구축물이 나열되어 있으며, 표 E4에는 악티노플라네스 종 SE50/110의 결실 및 통합 돌연변이체가 나열되어 있다).
표 E1 미생물의 배양 수집.
표 E2 복제 및 통합 벡터 시스템.
표 E3 문헌 [Cobb et al. (2015)]의 pCRISPomyces-2를 기반으로 하는 표적화된 결실 및 통합을 위한 벡터 시스템.
표 E4 CRISPR/Cas9 기술에 의해 악티노플라네스 아종에서 수득된 결실 및 통합 돌연변이체.
배지 및 배양 조건
달리 명시되지 않는 한, 모든 화학 물질 및 배지 성분은 칼 로스 게엠베하 운트 코. 카게 (Carl Roth GmbH & Co. KG; 독일 칼스루에), 시그마 알드리치 (Sigma-Aldrich; 미국 세인트 루이스), 세르바 일렉트로포레시스 게엠베하 (SERVA Electrophoresis GmbH; 독일 하이델베르크) 또는 VWR 인터내셔널 (VWR International; 미국 펜실베니아주)로부터 수득된다.
악티노플라네스
종 SE50/110의 글리세롤
스톡의
제조
글리세롤 스톡의 제조를 위해, 악티노플라네스 종 SE50/110 (ATCC 31044)을 복합 배지 NBS (11 g·L-1 글루코스·1H2O, 4 g·L-1 펩톤, 4 g·L-1 효모 추출물, 1 g·L-1 MgSO4·7H2O, 2 g·L-1 KH2PO4, 4 g·L-1 K2HPO4)에서 성장시키고 멸균 86% (v/v) 글리세롤과 2:3으로 혼합하였다. 글리세롤 스톡을 -80℃ 하에 저장한다.
고체 배지에서의 성장 및 포자 용액의 제조
포자 형성을 위해, 200-300 μL의 글리세롤 스톡을 대두분 배지 (SFM-한천) (20 g·L-1 대두분 (SOBO® 나투르코스트(Naturkost) (독일 쾰른)), 20 g·L-1 D-만니톨, 20 g·L-1 박토(Bacto)™ 한천 (벡톤 디킨슨 (Becton-Dickinson; 독일 하이델베르크)), 수돗물 중 167 μL 10 N NaOH)의 한천 플레이트에서 성장시켰다. 문헌 [Wolf et al. (2016)]에 기재된 바와 같이, 면봉으로 3 mL ddH2O로 씻어내어 28℃에서 5-7일 동안 인큐베이션한 후 포자를 수거할 수 있었다.
최소 배지의 제조
말토스 최소 배지 (72.06 g·L-1 말토스·1H2O, 5 g·L-1 (NH4)2SO4, 0.184 g·L-1 FeCl2·4H2O, 5.7 g·L-1 Na3C6H5O7·2H2O, 1 g·L-1 MgCl2·6H2O, 2 g·L-1 CaCl2·2H2O, 미량 원소 (최종 농도: 1 M HCl에 용해된 1 μM CuCl2, 50 μM ZnCl2, 7.5 μM MnCl2) 및 ddH2O 중 K2HPO4 및 KH2PO4 각각 5 g·L-1로 이루어진 인산염 완충제)를 제조하고 문헌 [Wendler et al. (2013)]의 프로토콜에 따라 필터 멸균시켰다.
탄소 공급원 말토스의 치환을 위해, 79.2 g·L-1 글루코스·1H2O, 72.0 g·L-1 C-pur (케레스타(Cerestar) 01908, 케레스타 게엠베하 (Cerestar GmbH; 독일 크레펠트)), 71.9 g·L-1 갈락토스, 68.4 g·L-1 셀로비오스, 71.9 g·L-1 D-아라비노스 또는 72.0 g·L-1 D-락토스를 말토스-일수화물 대신에 각각 사용하였다. 말토스와 글루코스의 혼합물은 90:10, 80:20 및 50:50 (v/v)의 비율로 제조되었다.
전분 배지의 경우, 아크로스 오가닉스(Acros Organics) (써모 피셔 사이언티픽 (Thermo Fisher Scientific; 벨기에 헤일)의 일부)로부터의 "전분 가용성"의 4% (w/v) 유백색 용액이 생성되었다. 이를 위해, 멸균수를 수 욕조에서 90℃로 예열하고, 칭량한 전분의 일부분을 교반하면서 부가하였다. 그 후, 잔여 배지 성분을 부가하였다. 전분 배양과 비교할 수 있도록, 거의 동등한 수준의 C-몰농도를 갖는 말토스 최소 배지를 생성하였다 (여기서 44.4 g·L-1 말토스·1H2O의 순 중량). pH와 오스몰농도가 상이한 배지는 보정제 (HCl 또는 NaOH)를 부가하고, 본 발명자들의 연구에 따라 대사되지 않는 이노시톨을 부가하여 탄소 공급원 말토스의 농도를 각각 다르게 하여 생성되었다 (데이터는 제시되지 않음).
더욱이, 아크로스 오가닉스로부터의 1 g·L-1, 2 g·L-1, 3 g·L-1, 4 g·L-1 및 5 g·L-1 "전분 가용성"이 있는 최소 배지는 제한된 탄소 공급원 하에서의 배양을 위해 생성되었다.
모든 배지의 pH 및 오스몰농도는 제조업체의 지침에 따라 니크 게엠베하 (Knick GmbH; 독일 베를린)의 pH 측정기 칼리마틱(Calimatic) 및 고노텍 게엠베하 (Gonotec GmbH; 독일 베를린)의 오스모마트(Osmomat) 3000에 의해 결정되었다.
진탕 플라스크 배양
GFL 진탕 배양기 3032 또는 3033 (독일 버그웨델)에서 7일 동안 28℃ 및 140 rpm에서 250 mL 코닝(Corning)® 에를렌마이어(Erlenmeyer) 칸막이가 있는 세포 배양 플라스크에서 배양을 수행하였다. 50 mL 배지의 접종을 위해, OD = 3-5의 1 mL 포자 용액을 사용하였다. 세포 건조 중량은 문헌 [Wolf et al. (2017a)]에 기재된 바와 같이 결정되었다. 상등액은 추후 분석을 위해 -20℃에서 저장하였다.
m2p
-
랩스
게엠베하
(독일
바스웨일러
)의
바이오렉터
시스템에서 소형화 배양
비교 성장 실험은 기체 투과성 밀봉 호일로 덮인 48-웰 플라워플레이트 (m2p-랩스 게엠베하; 독일 바스웨일러)에서 1 mL 반응 용적에서 수행되었고 m2p-랩스의 로보렉터®에서 28℃ 및 800 rpm에서 1주일 동안 인큐베이션하였다. 성장은 후방산란 신호에 의해 기록되었다. 최종 세포 건조 중량의 결정을 위해, 800 μL의 각각의 웰을 칭량된 반응 튜브에서 샘플링하고 (14,000 g, 2분), 탈이온수로 세척하며 60-70℃에서 1일 동안 건조시켰다. 상등액은 추후 분석을 위해 -20℃에서 저장하였다.
재조합 DNA 작업
달리 명시되지 않는 한, 플라스미드 구축 및 어셈블리는 깁슨 어셈블리에 의해 수행되었다 (Gibson et al. 2009). 단편을 에펜도르프 써모사이클러 바포.프로텍트(Eppendorf thermocycler vapo.protect) (독일 함부르크)에서 PCR (GC 완충액이 포함된 푸션(Phusion)® 고 충실도 PCR 마스터 믹스, NEB; 미국 매사추세츠주 입스위치)로 증폭시키고, 필요한 경우 DpnI (써모 피셔 사이언티픽; 미국 매사추세츠주 월섬)로 처리하였다. PCR 산물 및 겔 추출물의 정제는 뉴클레오스핀(NucleoSpin)® 겔 및 PCR 클린 업 키트 [맥커리 나겔 (Macherey-Nagel; 독일 두렌)]를 사용하여 수행되었다. 등몰량의 DNA 단편을 1:4의 비율로 깁슨 어셈블리 마스터 믹스에 부가하였다. 마스터 믹스는 0.64 μL T5 엑소뉴클레아제 (10 U·μL-1, NEB; 미국 매사추세츠주 입스위치), 20 μL 푸션 고 충실도 DNA 폴리머라제 (2 U·μL-1, 써모 피셔 사이언티픽; 미국), 160 μL Taq DNA 라이가제 (NEB; 미국 매사추세츠주 입스위치), 699.36 μL 증류수 및 320 μL 등온 반응 완충액 (25% PEG-8000, 1 mL 1 M 트리스-HCl, 100 μL 1 M MgCl2, 100 μL 1 M DTT, 20 μL 각각 1 mM dNTP, 200 μL NAD)으로 이루어진다. 샘플을 50℃에서 적어도 1시간 동안 인큐베이션한 후 문헌 [Beyer et al. (2015)]의 프로토콜에 따라 화학적 변환을 통해 에스케리키아 콜라이 DH5αMCR로 옮겼다. 이. 콜라이의 선택은 15 g·L-1 한천-한천 (둘 다: 칼 로스 게엠베하 운트 코. 카게; 독일 칼스루에) 및 50 mg·L-1 아프라마이신-술페이트를 포함하는 루리아/밀러(Luria/Miller) 브로스 배지에서 수행되었다. 양성 콜로니는 PCR 및 겔 전기영동 뿐만 아니라 본 발명자들의 사내 시퀀싱 핵심 시설에 의한 생어(Sanger) 시퀀싱에 의해 테스트되었다.
gusA
리포터 시스템을 위한 플라스미드의 구축
gusA 리포터 시스템을 위한 플라스미드의 구축에 대해서는 문헌 [Schaffert et al. (2019)]을 참조한다.
신규
pSETT4
발현 시스템의 구축
신규 pSETT4 발현 시스템의 클로닝을 위해, 문헌 [Bierman et al. (1992)]의 의 pSET152 벡터가 주형으로서 사용되었다. 벡터 백본은 PCR에 의해 선형화되었다 (표 E5).
gapDH-프로모터, lac-프로모터의 제어 하에 있는 lacZ-유전자 및 3개의 T4-종결인자에 의해 플랭킹된 여러 제한 부위로 이루어진 클로닝 카세트가 인티그레이티드 DNA 테크놀로지스 (Integrated DNA Technologies; 미국 아이오와주)에서 스트링 DNA로서 주문되었다. 복잡한 구조로 인해, 상기 카세트는 3가지 부분으로 주문되었으며 표 E5에서의 프라이머를 사용하여 GeneSOEing (Horton 1995)에 의해 어셈블리되었다. 마지막으로, 백본과 삽입물은 깁슨 어셈블리에 의해 어셈블리되었다 (Gibson et al. 2009). 신규 벡터 시스템은 pSETT4gap으로 명명되었다.
tipA-프로모터에 의한 gapDH-프로모터의 교환을 위해, pSETT4gap를 NdeI 및 KpnI로 소화시키고 공급자의 지침에 따라 새우 알칼리성 포스파타제로 처리하였다. 모든 효소는 써모 피셔 사이언티픽 (미국 매사추세츠주 월섬)으로부터 구입하였다. tipA-프로모터는 프라이머 tipA_GAF 및 tipA_GAR을 사용하여 pSETGUS (Myronovskyi et al. 2011)으로부터 증폭되었고 깁슨 어셈블리에 의해 선형화된 백본으로 어셈블리되었다 (Gibson et al. 2009). 벡터는 pSETT4tip으로 명명되었다 (도 6 참조).
표 E5 신규 발현 시스템 pSETT4gap 및 pSETT4tip의 어셈블리를 위한 깁슨 어셈블리 프라이머.
신규
pSETT4
발현 시스템에서 단일 유전자의 과다발현
단일 유전자의 과다발현을 위해, 삽입물을 PCR로 증폭시켰다 (표 E6). 벡터 (pSETT4gap 또는 pSETT4tip)는 BsaI (NEB; 미국 매사추세츠주 입스위치)로 소화시키고 깁슨 어셈블리에 의해 삽입물과 어셈블리되었다 (Gibson et al. 2009). 천연 프로모터의 제어 하에 acbB 유전자의 발현을 위해, 벡터 백본 pSETT4gap를 BsaI 및 NdeI로 소화시켜, 프로모터 제거 하에 벡터의 선형화를 유도하였다. 관심 유전자 및 천연 프로모터는 표 E6에서의 프라이머를 사용하여 증폭되었고 깁슨 어셈블리에 의해 벡터 백본과 어셈블리되었다 (Gibson et al. 2009).
표 E6 pSETT4gap 및 pSETT4tip 벡터 시스템으로의 제한 클로닝 및 골든 게이트 클로닝을 위한 삽입물의 증폭을 위한 프라이머.
pCRISPomyces
-2 결실 및 통합 벡터의 구축
CRISPR/Cas9 기술에 의한 결실 및 통합 돌연변이체의 구축을 위해, 플라스미드 pCRISPomyces-2 (Cobb et al. 2015)가 문헌 [Wolf et al. (2016)]의 프로토콜에 따라 사용되었다. 스페이서 및 그의 역 보체는 중첩이 있는 올리고뉴클레오티드로서 메타비온 게엠베하 (metabion GmbH; 독일 스틴키르헨) 또는 시그마 알드리치 (독일 타우프키르헨)에서 주문되었다 (표 E7).
올리고뉴클레오티드는 이중 가닥으로 어닐링되었고 문헌 [Cobb et al. (2015)]의 프로토콜에 따라 골든 게이트 어셈블리 (Engler et al. 2008)에 의해 플라스미드와 어셈블리되었다. Cas9 유도 이중 가닥 파손의 복구를 위해, DNA 주형이 깁슨 어셈블리에 의해 벡터 백본에 클로닝되었다 (Gibson et al. 2009). DNA 주형으로서, 표적 유전자의 상류 및 하류에 있는 플랭킹 서열 (각각의 라운드 약 1 kB)을 게놈 DNA로부터 PCR (표 E8)에 의해 증폭시켰다.
표 E7 pCRISPomyes-2와의 골든 게이트 어셈블리에 사용되는 스페이서 및 역 보체.
표 E8 pCRISPomyes-2 결실 및 통합 벡터를 위한 깁슨 어셈블리 프라이머.
CRISPR
/
Cas9
기술에 의한 유전자
cgt의
결실
CRISPR/Cas9 기술 (클러스터된 규칙적으로 공간을 둔 짧은 팔린드롬성 반복부/CRISPR-관련 엔도뉴클레아제 9)에 의한 Δcgt (ΔACSP50_5024) 결실 돌연변이체의 구축을 위해, 플라스미드 pCRISPomyces-2가 사용되었다 (Cobb et al. 2015). 스페이서 서열은 문헌 [Wolf et al. (2016)]에 따라 선택되었고 메타비온 게엠베하 (독일 스틴키르헨)에서 그의 역 보체와 함께 올리고뉴클레오티드로서 주문되었다 (스페이서_1: 5'-acgcAGCGTCGCCCGCTGGGAGAA-3', 스페이서_2: 5'-aaacTTCTCCCAGCGGGCGACGCT-3'). 올리고뉴클레오티드는 이중 가닥으로 어닐링되었고 문헌 [Cobb et al. (2015)]의 프로토콜에 따라 BsaI (NEB; 미국 매사추세츠주 입스위치)를 사용하여 골든 게이트 어셈블리 (Engler et al. 2008)에 의해 플라스미드와 어셈블리되었다 (Cobb et al. 2015). Cas9 유도 이중 가닥 파손의 복구를 위해, 데옥시리보핵산 (DNA) 주형을 깁슨 어셈블리에 의해 XbaI 선형화된 벡터에 클로닝하였다 (Gibson et al. 2009). DNA 주형으로서, 표적 유전자의 상류 및 하류에 있는 플랭킹 서열 (각각 라운드 약 1 kB)을 GC 완충액이 포함된 푸션® 고 충실도 PCR 마스터 믹스 (NEB; 미국 매사추세츠주 입스위치)로 폴리머라제 연쇄 반응 (PCR)으로 증폭시켰다 (프라이머 서열: cgt_플랭크1_fw: 5'- tcggttgccgccgggcgttttttatCCGGTACCCTGCTCCTCGTC-3', cgt_플랭크1_rv: 5'- gtgacgcattgacgcaggtcGAGGGATATGGCTCAGATAC-3', cgt_플랭크2_fw: 5'- gtatctgagccatatccctcGACCTGCGTCAATGCGTCAC-3', cgt_플랭크2_rv: 5'- gcggcctttttacggttcctggcctACCTGACCCTGCTGAAATGG-3'). 깁슨 어셈블리를 위해, DNA 단편 (플랭크_1: 1101 bp 및 플랭크_2: 982 bp)을 0.64 μL T5 엑소뉴클레아제 (10 U/μL, NEB; 미국 매사추세츠주 입스위치), 20 μL 푸션 고 충실도 DNA 폴리머라제 (2 U/μL, 써모 피셔 사이언티픽; 미국) 및 160 μL Taq DNA 라이가제 (40 U/μL NEB; 미국 매사추세츠주 입스위치), 699.36 μL 증류수 및 320 μL 등온 반응 완충액 (25% PEG-8000, 1 mL 1 M 트리스-HCl, 100 μL 1 M MgCl2, 100 μL 1 M DTT, 20 μL 각각 1 mM dNTP, 200 μL NAD)으로 이루어진 깁슨 어셈블리 마스터 믹스에 1:4의 비율로 등몰 부가하여 혼합하였다. 50℃에서 적어도 1시간 동안 인큐베이션한 후, 반응 혼합물을 프로토콜 (Beyer et al. 2015)에 따라 화학적 변환에 의해 에스케리키아 콜라이 DH5αMCR로 옮겼다. 이. 콜라이의 성장 및 선택은 50 mg·L-1 아프라마이신-술페이트가 보충된 15 g·L-1 한천-한천 KobeI (둘 다: 칼 로스, 게엠베하 운트 코. 카게; 독일 칼스루에)가 포함된 루리아/밀러 배지 (LB-배지) 상에 플레이팅함으로써 수행되었다. 플레이트를 37℃에서 10-14시간 동안 인큐베이션하였다. 아프라마이신 내성 콜로니는 먼저 PCR 및 겔 전기영동으로 테스트하고, 두 번째는 본 발명자들의 사내 시퀀싱 핵심 시설에서 생어 시퀀싱으로 테스트하였다 (PCR을 위한 프라이머 서열: for: 5'-GGCGTTCCTGCAATTCTTAG-3', rev: 5'-TCGCCACCTCTGACTTGAGC-3', 시퀀싱을 위한 워킹 프라이머: w1: 5'-CGCTGATCTTCAGCTTCC-3', w2: 5'-GCCTTCACCTTCCATCTG-3', w3: 5'-TCGGGAAAGCCGCCGGAG-3').
악티노플라네스
종 SE50/110으로의 접합성 전이
적격한 악티노플라네스 종 SE50/110 세포는 새로 성장한 NBS 배양물로부터 제조되었다 (상기 참조). 세포를 10% (w/v) 빙냉 수크로스에서 2회 세척하고 빙냉 15% (v/v) 글리세롤에서 2회 세척하였다. 마지막으로, 세포를 15% (v/v) 빙냉 글리세롤 (세포 펠릿의 약 4배 용적의 부가에 의함)에 넣고 반응 튜브에서 100 μL로 분취하고 액체 질소에서 급속 동결하였다. 적격한 악티노플라네스 세포를 -80℃ 하에 저장한다.
접합을 위해, 에스케리키아 콜라이 ET12567/pUZ8002 (Kieser et al. 2000)를 사용하였다. 문헌 [Beyer et al. (2015)]에 따라 이. 콜라이 ET12567/pUZ8002 내로 원하는 구축물을 전달하고 50 mg·L-1 아프라마이신-술페이트, 50 mg·L-1 카나마이신-술페이트 및 15 mg·L-1 클로람페니콜이 보충된 LB 한천 플레이트 상에서의 선택 후, 세포를 액체 배양물 (동일한 보충물이 포함된 LB-배지)에서 성장시키고 0.4-0.6의 광학 밀도에서 수거하였다. 세포를 빙냉 LB 배지에서 2회 세척하고 악티노플라네스 종 SE50/110의 적격 세포와 혼합하였다. 세포 현탁액을 SFM 한천 플레이트에 플레이팅하였다. 28℃에서 20-24시간 동안 인큐베이션한 후, ddH2O에 용해된 1 mL 500 mg·L-1 아프라마이신-술페이트를 멸균 면봉으로 플레이트 상에 분포시켰다. 악티노플라네스 종 SE50/110의 제1 접합완료체가 1주 후에 관찰될 수 있다. 접합완료체를 50 mg·L-1 아프라마이신-술페이트가 보충된 SFM 한천 플레이트로 옮겼다. 이. 콜라이로부터 악티노플라네스 접합완료체를 정제하기 위해 반복적인 스트리킹을 여러 번 수행한다. 이러한 프로세스를 촉진하기 위해, 50 mg·L-1 포스포마이신 또는 트리메토프림을 배지에 보충하여 공여자 균주를 제거할 수 있다.
악티노플라네스
종 SE50/110의
마커
무함유
CRISPR
/
Cas9
결실/통합 돌연변이체를 수득하기 위한 플라스미드 큐어링
플라스미드 큐어링은 승온에서 복합 배지 NBS에서 배양함으로써 문헌 [Wolf et al. (2016)]의 프로토콜에 따라 수행되었다. 아프라마이신 함유 및 아프라마이신 무함유 SFM 플레이트 상에 평행 스트리킹함으로써 플라스미드의 존재에 대해 콜로니를 테스트하였다. 아프라마이신-감수성 접합완료체는 PCR에 의해 결실에 대해 테스트하였다 (프라이머 서열 데이터는 제시되지 않음). PCR 단편은 겔로부터 절단되어 본 발명자들의 사내 생어 시퀀싱 핵심 시설에서 시퀀싱되었다.
부가적으로, 결실 또는 통합 돌연변이체의 게놈 DNA도 옥스포드 나노포어(Oxford Nanopore) 기술 (영국 옥스포드)에 의해 시퀀싱되어 오프 타겟 효과를 배제하였다. 이를 위해, 뉴클레오스핀® 미생물 DNA 키트 (맥커리 나겔; 독일 두렌)를 사용하여 NBS-성장된 배양물의 게놈 DNA를 단리하였다. 라이게이션 키트 (옥스포드 나노포어; 영국 옥스포드)에 의해 1D 게놈 DNA의 도움으로 라이브러리를 제조하였다.
시토신
데아미나제
CodA와의
상동 재조합 및 역선택을 기반으로 하는 결실 시스템.
acb 유전자 클러스터의 유전자로의 벡터 통합은 복제 벡터 pKC1139를 사용하여 발생하였다. 이러한 관찰에 기초하여, 상동 재조합을 사용하는 신규 결실 시스템이 개발되었고 유전자 cgt (ACSP50_5024)의 예에 의해 테스트되었다.
전달 기점 (ncP) 및 릴랙소좀 유전자 traJ를 갖는 벡터 백본을 사용하여 악티노플라네스 종 SE50/110 내로의 접합이 가능해졌다. 본 작업에서는, 아프라마이신 및 카나마이신 내성을 매개하는 2가지 상이한 항생제 내성 마커가 선택에 대해 테스트되었다: aph(3')II (kanR, 카나마이신) 및 aac(3)IV (apmR, 아프라마이신). 더욱이, 높은 카피 수 ColE1/pMB1/pBR322/pUC 복제 기점이 통합되어 공여자 균주 이. 콜라이에서의 복제가 가능해진다. ori, oriTncP, tra 유전자 및 내성 카세트는 각각 pRT802 및 pRT801로부터 취하였다 (Gregory et al. 2003). 악티노플라네스 종 SE50/110에서 복제를 위한 레플리콘 뿐만 아니라 부착 부위가 있는 인테그라제 유전자도 신규 결실 시스템에 함유되어 있지 않기 때문에, 벡터는 상동 재조합에 의해 게놈에 통합될 때 악티노플라네스 종 SE50/110에서만 유지될 수 있다 (도 7). 이를 위해 유전자 cgt를 플랭킹하는 2 kB의 상동 서열이 통합되었다. 악티노플라네스 종 SE50/110에서의 접합성 전이 후, 제1 교차가 발생한 돌연변이체가 아프라마이신 또는 카나마이신 내성에 의해 선택될 수 있다. 벡터 백본의 분해를 강제하기 위해 (제2 교차), 5-플루오로시토신 (5-FC)이 부가되고, 이는 시토신 데아미나제 CodA에 의해 독성 산물인 5-플루오로우라실 (5-FU)로 전환된다. 이러한 작업에서는, 스트렙토미세스 아종에 대해 코돈 최적화된 codA가 사용된다 (Dubeau et al. 2009). 제2 교차 후 야생형의 유전자형 또는 결실 돌연변이체의 유전자형이 존재한다.
신규 결실 시스템은 유전자 cgt에 대해 성공적으로 테스트되었으며, 이는 콜로니 PCR 및 ONT 시퀀싱에 의해 제시되었다. 성공적인 제2 교차 후 결실 돌연변이체의 비율은 25% 내지 32%였다. 작업 흐름은 도 8에 예시되어 있다.
분석 방법
고성능 액체 크로마토그래피 (
HPLC
)에 의한 상등액으로부터의
아카르보스
정량화
악티노플라네스 아종의 말토스 성장된 배양물의 상등액을 원심분리하고 (20,000 g, 2분), 와동에 의해 메탄올과 1:5로 혼합하고, 다시 원심분리하여 침전물을 제거하였다 (20,000 g, 2분). 샘플을 HPLC 바이알로 옮기고 애질런트(Agilent)의 HPLC 시스템 1100 시리즈 (G1312A 이원 펌프 일련번호 DE43616357, G1329A ALS 자동샘플러 일련번호 DE43613/10, G1315A 다이오드 어레이 검출기 (DAD) 일련번호 DE9200246)에서 분석하였다. 정지상으로서, 써모 피셔 사이언티픽 인크. (미국 매사추세츠주 월섬)의 하이퍼실(Hypersil) APS-2 칼럼 (125x4 mm, 3 μm 입자 크기)을 사용하고 40℃로 가열하였다. 이동상으로서 1 mL·min-1 68% 아세토니트릴 (용매 B) 및 32% 인산염 완충액 (0.62 g·L-1 KH2PO4 및 0.38 g·L-1 Na2HPO4·2H2O) (용매 A)의 등용매 흐름이 적용되었다. 40 μL의 각각의 샘플을 주입하고 10분 실행으로 분리하였다. 아카르보스의 검출은 210 nm (참조 360 nm)에서 DAD 검출기로 수행되었고 교정 곡선의 피크 면적으로부터 정량화되었다.
액체 크로마토그래피-질량 분석법 (LC-MS)
세포내
대사산물의
분석을 위한 샘플 제조
악티노플라네스 종 SE50/110 균주의 삼중물을 적어도 4일 동안 말토스 최소 배지에서 성장시켰다. 배양액 10 mL를 부흐너 깔때기로 여과지를 통해 빠르게 여과하고 2.63 g·L-1 NaCl 용액으로 세척하였다. 세포를 미리 칭량된 둥근 바닥 스크류 캡 튜브로 옮기고 액체 질소에서 급속 냉동하고 -80℃에서 저장하였다. 세포를 써모 피셔 사이언티픽 (미국 매사추세츠주 월섬)의 원심 증발기 (SpeedVac)에서 밤새 건조시켰다. 4 mg의 건조된 세포를 0.1 mm, 0.05 mm 및 0.01 mm 크기의 지르코니아/실리카 마이크로 비드 혼합물 [바이오 스펙 프러덕츠 인크. (Bio Spec Products Inc.; 미국 바틀즈빌)] 약 500 μL를 함유하는 신선한 2 mL 스크류 캡 튜브로 옮겼다. 700 μL 80% MeOH를 세포와 비드에 부가하였다. 세포 파괴는 균질화기 (패스트프렙 FP120, 써모 피셔 사이언티픽; 미국 매사추세츠주 월섬)에서 속도 설정 6.5에서 30초 동안 3회 수행되었다. 샘플을 중간에 얼음 위에서 5분 동안 냉각시켰다. 세포 현탁액을 13,000 g 및 4℃에서 5분 동안 원심분리하였다. 500 μL의 상등액을 HPLC 바이알로 옮기고, 질소 흐름 하에서 건조시키고, 50 μL 증류수에 용해시켰다.
세포외
아카르비오실
-대사물질의 분석을 위한 샘플 제조
샘플 제조는 문헌 [Ortseifen (2016)]에 기재된 프로토콜에 따라 시행되었다. 크로마본드(Chromabond)® 이지 칼럼 (맥커리 나겔; 독일 두렌, REF 730753)을 사용하여 고체상 추출에 의해 10 mL의 상등액으로부터 당 및 유사 당을 농축시켰다. 칼럼을 3 mL 메탄올로 평형화한 후, 샘플을 로딩하기 전에 3 mL 증류수로 세척하였다. 비특이적 결합 대사산물을 3 mL 95% (v/v) 메탄올로 세정하였다. 3 mL 메탄올에서 용리를 시행하였다.
세포내
및
세포외
대사산물의
LC-
ESI
-MS
LC-MS의 경우, 마이크로TOF-Q 하이브리드 사중극자/비행 시간 질량 분석기 [브루커 달토닉스 (Bruker Daltonics; 독일 브레멘)]에 커플링된 라크롬울트라(LaChromUltra) [히타치 유럽 리미티드 (Hitachi Europe Ltd.; 영국)] HPLC 시스템이 사용되었으며, 이에는 전자분무 이온화 (ESI) 소스가 장착되어 있다.
세포내 대사산물의 분석을 위해, 세콴트(SeQuant)® ZIC®-pHILIC 5 μm 폴리머 칼럼 (150 x 2.1 mm) [머크 (Merck; 독일 다름슈타트)]으로 2 μL의 샘플을 분리하였다. 용리액 A (20 mM NH4HCO3, pH 9.3, 암모니아 수용액으로 조정됨) 및 용리액 B (아세토니트릴)를 하기 구배를 사용하여 0.2 mL·min-1의 유속으로 적용하였다: 0분 B: 90%, 30분 B: 25%, 37.5분 B: 25%, 40.0분 B: 80%.
피크 확인을 위한 표준으로서, 10 μM의 UDP-글루코스, 글루코스-1-포스페이트, 갈락토스-1-포스페이트, 글루코스-6-포스페이트 및 dTDP-글루코스 2 μL를 주입하였다.
세포외 아카르비오실-대사산물의 분석을 위해, 샘플 10 μL를 코젠트 다이아몬드 하이브리드(Cogent Diamond Hydride)™ HPLC 칼럼 (마이크로솔브 테크놀로지 코포레이션(MicroSolv Technology Corporation); 150 mm x 2.1 mm, 3 μL 입자 크기)으로 분리하였다. 용리액 A (50% (v/v) 아세토니트릴, 50% (v/v) H2O 및 0.1% (v/v) 포름산) 및 용리액 B (90% (v/v) 아세토니트릴, 10% (v/v) H2O 및 0.1% (v/v) 포름산)을 하기 구배를 사용하여 0.4 mL·min-1의 유속으로 적용하였다: 0분 B: 100%, 8분 B: 0%, 13분 B: 0%, 15.5분 B: 100%, 18분 B: 100%.
ESI 소스는 세포내 대사산물의 분석을 위한 음성 이온화 모드와 세포외 아카르비오실-대사산물의 분석을 위한 양성 이온화 모드에서 작동되었다. 건조 기체 및 모세관의 온도는 180℃로 설정되었다. MS의 스캔 범위는 각각 200-1,000 m/z (세포내 대사산물) 및 50-3,000 m/z (세포외 아카르비오실-대사산물)로 설정되었다.
특이적 질량의 피크 면적은 소프트웨어 콤파스(Compass)™ (브루커 달토닉스; 독일 브레멘)를 사용하여 통합되었다. 피크는 각각 건조된 세포의 칭량된 양 (세포내 대사산물) 및 샘플링 시 세포 건조 중량 (세포외 아카르비오실-대사산물)에 대해 정규화되었다.
카로티노이드의 추출 및 분석
추출
악티노플라네스 종 SE50/110으로부터의 세포 펠릿을, 0.1 mm, 0.05 mm 및 0.01 mm 크기의 지르코니아/실리카 마이크로 비드 혼합물 (바이오 스펙 프러덕츠 인크.; 미국 바틀즈빌) 약 500 μL이 포함된 2 mL 스크류 캡 튜브로 옮겼다. 1 mL의 아세톤 또는 메탄올을 추출 용매로서 부가하였다. 세포 파괴는 균질화기 (패스트프렙 FP120, 써모 피셔 사이언티픽; 미국 매사추세츠주 월섬)에서 속도 설정 6.5에서 45초 동안 3회 수행되었다. 샘플을 중간에 얼음 위에서 5분 동안 냉각시켰다. 균질화된 세포 현탁액을 13,000 g 및 4℃에서 20분 동안 원심분리하였다. 상등액을 유리 바이알로 옮겼다. HPLC 분석을 위해, 아세톤 추출물과 메탄올 추출물의 혼합물을 7:3의 비율로 생성하고 신규 유리 바이알로 옮겼다.
박층
크로마토그래피 (TLC) 및 스펙트럼 분석
추출된 카로티노이드 50 μL를 실리카 겔 매트릭스 [HPTLC-HL, Cat. 58077, 아날테크 인크. (Analtech Inc.; 미국 뉴어크)] 상에 5 μL-단계로 적용하고 100 mL 페트로리움, 11 mL 이소프로판올 및 50 μL 물로 채워진 TLC-챔버에서 인큐베이션하였다. 본 실행은 어두움 속에서 수행되었다. TLC 플레이트를 건조시킨 후, 메스로 밴드를 벗겨내고 신규 튜브로 옮겼다. 1 mL 에탄올을 부가한 후, 써모 피셔 사이언티픽 (미국 매사추세츠주 월섬)의 제네시스(Genesys) 10S UV-Vis 분광 광도계를 사용하여 흡수 스펙트럼을 분석하였다.
흡광도 스캔을 통한 카로티노이드의
HPLC
분석
카로티노이드는 UV-Vis 스펙트럼을 위한 다이오드 어레이 검출기 (DAD)를 포함하는 애질런트 1200 시리즈 HPLC 시스템 [애질런트 테크놀로지스 게엠베하 운트 코. 카게 (Agilent Technologies GmbH&Co. KG; 독일 뵈블링겐)]을 사용하여 문헌 [Henke et al. (2017) and Heider et al. (2014)]에 따라 역상 HPLC에 의해 분리되었다. 20 μL 샘플 용적을 0.5 mL·min-1의 유속으로 적용하였다. 정지상으로서, CS 크로마토그래피서비스 게엠베하 (CS ChromatographieService GmbH; 독일 랑게르웨)로부터의 프리-칼럼 (10x4 mm 물토하이(MultoHigh) 100 RP18-5)과 메인 칼럼 (프론토실(ProntoSIL) 200-5 C30, 250x4 mm)이 이전에 설명된 바와 같이 사용되었다 (Heider et al. 2014; Henke et al. 2017).
하기 구배가 적용되었다: 0분 A: 100%, 32분 A: 75%, 47분 A: 0%, 70분 A: 0%, 75분 A: 100%, 용리액 A는 15:85 (v/v)의 비율로 탈이온수 중 0.1 M 암모늄 아세테이트와 메탄올로 이루어진다. 용리액 B는 44:43:13 (v/v)의 비율로 메탄올, 아세토니트릴 및 아세톤의 혼합물로 이루어진다. 카로티노이드의 검출은 470 nm에서 시행되었다. 부가적으로, 360 nm 내지 700 nm의 파장 스캔은 상기 실행 동안 매초 수행되었다.
검정
글루쿠로니다제
활성의
분광광도
측정에 의한 프로모터 스크리닝 실험
2가지 상이한 유형의 글루쿠로니다제 검정이 수행되었다: 하나는 단백질 원료 추출물을 사용하고 다른 하나는 전체 세포를 사용한다. 문헌 [Horbal et al. (2013) and Siegl et al. (2013)]에 기재된 프로토콜이 악티노플라네스 종 SE50/110에 적응되었다. 기질 5-브로모-4-클로로-3-인돌릴-β-D-글루쿠로니드 [X-Gluc, 애플리켐 게엠베하 (AppliChem GmbH; 독일 다름슈타트)]가 선택되었으며, 이는 기질 p-니트로페닐-D-글루쿠로니드가 본 발명자들의 검정 조건 하에서 해리되는 것으로 밝혀졌기 때문이다.
성장 조건 및 샘플 제조
gusA 유전자를 갖는 프로모터 구축물을 보유하는 악티노플라네스 돌연변이체를 상기 기재된 바와 같이 말토스 최소 배지에서 1주 동안 배양하였다. 검정은 성장기 동안 시행되었다. 500 μL의 각각의 배양물을 전체 세포로 검정하기 위해 샘플링하였다. 단백질 원료 추출물을 사용한 검정을 위해 1 mL를 샘플링하고 0.1 mm 및 0.05 mm 크기의 지르코니아/실리카 마이크로 비드 (바이오 스펙 프러덕츠 인크.; 미국 바틀즈빌)를 함유하는 스크류 캡 튜브로 옮겼다. 세포를 균질화기 (패스트프렙 FP120, 써모 피셔 사이언티픽; 미국 매사추세츠주 월섬)에서 속도 설정 6.5에서 30초 동안 2회 및 그 중간에 얼음 위에서 5분 동안 파괴하였다. 원심분리 후, 용해물을 새로운 반응 튜브로 옮기고 원심분리하였다. 상등액은 무세포 검정에 사용되었다. 총 단백질 정량화는 브래드포드(Bradford) 검정에 의해 수행되었다 (상기 참조).
글루쿠로니다제
(gus) 검정
gus 검정은 흑색 미세역가 플레이트 [96 웰 PS F-바닥 μCLEAR, 흑색, 중간 바인딩, 그라이너 바이오-원 (Greiner Bio-One; 오스트리아 크렘스윈스터), REF 655096]에서 수행되었다. 100 μL의 각각의 샘플 (세포 현탁액 또는 용해물)을 3개의 웰에 피펫팅했으며, 그 중 하나는 음성 대조군으로서 제공되고, 2개는 기술적 복제물로서 제공되었다. gus 완충액 [5 mM DTT 및 0.1% 트리톤-X-100이 포함된 50 mM 인산염 완충액 pH 7.0 (5.136 g·L-1 Na2HPO4·2H2O, 3.299 g·L-1 NaH2PO4·2H2O)]을 2 mM 기질 X-Gluc (원액: DMF 중 0.2 M)로 보충시켰다. 샘플 100μL에 100 μL를 부가하였다. 음성 대조군의 경우, 기질이 없는 100 μL gus 완충액을 부가하였다. 각각의 샘플의 개별 음성 대조군 외에, 배지 및 기질 대조군도 제조하였다.
미세역가 플레이트는 미리 가온된 테칸 리더 인피니티(Tecan reader Infinite) M200 [Ref 30016056, 테칸 그룹 아게 (Tecan Group AG; 스위스 므네도르프)] (37℃)에서 각각 3시간 (전체 세포를 사용한 검정) 및 2시간 (용해물을 사용한 검정)으로 측정되었다. 인디고의 최대 흡수는 610 및 660 nm에서 측정되었다. 모든 대조군의 흡수 값을 할인한 후, 각각의 흡수 곡선의 기울기를 선형 회귀에 의해 계산하고 세포 건조 중량 (전체 세포를 사용한 검정) 또는 전체 단백질 양 (용해물을 사용한 검정)에 대해 정규화하였다. 정규화된 기울기를 사용하여 상이한 돌연변이체에서 β-글루쿠로니다제 활성을 비교하였다.
바이오로그
(
Biolog
)®
옴니로그
(
OmniLog
) 표현형
마이크로어레이
시스템에서의 스크리닝 실험
상이한 탄소 공급원 (패널 PM1 및 PM2)에 대한 호흡을 평가하기 위해 바이오로그® 옴니로그 확인 시스템 (미국 캘리포니아주 헤이워드)에서 사전 스크리닝 실험을 수행하였다. 악티노플라네스 종 SE50/110 야생형 및 결실 돌연변이체 Δcgt는 본원의 다른 곳에서 기재된 바와 같이 SFM 한천 플레이트에서 성장시켰다. 멸균 면봉을 사용하여 세포를 수거하고 PM1 및 PM2에 대한 접종액 IF-0a에 희석하였다. 세포 현탁액의 탁도는 제조업체의 프로토콜에 따라 바이오로그®의 탁도계에서 80% 투과율을 달성하도록 검사되었다. 2.32 mL의 세포 현탁액을 제조업체의 프로토콜에 따라 20 mL IF-0a, 0.24 mL 0.5 M MgCl2, 0.24 mL 0.5 M Na2SO4, 0.24 mL 1.5 M NH4Cl, 0.24 mL 1.0 M Na3PO4, 0.24 mL 증류수, 0.24 mL 바이오로그 레독스 염료 믹스 G, 및 0.24 mL 금속 이온 칵테일 (5.0 mM 각각: ZnCl2·7H20, FeCl2·6H2O, MnCl2·4H2O, CaCl2·2H2O)에 부가하였다. PM 패널에 제조된 용액을 웰당 100 μL씩 접종하고 옴니로그 시스템 (모드 71000 일련번호 406)에서 28-30℃ 하에 1주 동안 인큐베이션하였다. 데이터 평가는 제조업체의 소프트웨어 (역학 분석, 바이오로그 및 옴니로그 2.3, 바이오로그)를 사용하여 수행되었다.
RNA 작업
샘플링 및 RNA 단리
트랜스크립톰 분석을 위해, 성장기 동안 2x 1 mL 배양물을 취하고, 원심분리 (10초)에 의해 상등액으로부터 분리하고 액체 질소에서 급속 동결하였다. 펠릿은 추가 프로세싱이 있을 때까지 -80℃에서 저장되었다.
리보핵산 (RNA)의 단리를 위해, 동결된 세포 펠릿을 500 μL LB 완충액 (뉴클레오스핀® RNA 플러스, 맥커리 나겔; 독일 두렌)에 재현탁하고 2 mL 용해 매트릭스 튜브 [0.1 mm 구형 실리카 비드, MP 바이오메디칼즈 (MP Biomedicals; 미국 캘리포니아주 산타 아나)]에 옮겼다. 세포 파괴는 균질화기 (패스트프렙 FP120, 써모 피셔 사이언티픽; 미국 매사추세츠주 월섬)에서 속도 설정 6.5 및 중간에 5분 동안 얼음에서 20초 동안 3회 수행되었다. 이어서, 세포 현탁액을 13,000 g 및 4℃에서 5분 동안 원심분리하였다. 상등액은 온-칼럼 DNA 소화를 위해 rDNase 세트 (맥커리 나겔; 독일 두렌)와 조합하여 뉴클레오스핀® RNA 플러스 키트를 사용하여 RNA 추출에 사용되었다. 제조업체의 프로토콜에 따라 클린 업 및 용리한 후, DNA-소화를 반복하고 (용액 중) 샘플을 동일한 키트를 사용하여 다시 클린 업하였다. 악티노플라네스 종 SE50/110의 게놈 DNA와 결합하고 약 200-300 nt에서 작은 단편을 증폭시키는 2개의 프라이머 쌍을 사용하여, 잔류 DNA에 대해 샘플을 테스트하였다. 필요한 경우 DNA 소화 및 RNA 클린 업을 반복하였다. RNA의 양은 나노드롭(NanoDrop) 1000 분광계 [페클랩 (Peqlab; 독일 에를랑겐)]로 분석되었다.
역전사
정량적
PCR
역전사 정량적 PCR은 문헌 [Wolf et al. (2017a)]의 프로토콜에 따라 로슈(Roche) (독일 만하임)의 라이트사이클러 96 시스템에서 센시패스트(SensiFast) SYBR No-Rox 1-단계 키트 [바이오라인 (Bioline; 영국 런던)] 및 96 웰 라이트사이클러 플레이트 [사르스테트 (Sarstedt; 독일 넴브레흐트)]를 사용하여 수행하였다. 상대적 RNA 양은 총 RNA (100 ng)에 대해 정규화되었고 2- ΔCq로서 계산되었다. ΔCq는 대조군 균주와 비교하여 돌연변이체 균주에서의 평균 Cq의 차이이다. 표 E9에서의 프라이머는 유전자의 상대적 전사를 결정하는 데 사용되었다.
표 E9 RT-qPCR 실험에 사용되는 프라이머.
전체 게놈 올리고뉴클레오티드
마이크로어레이
전체 게놈 올리고뉴클레오티드 마이크로어레이는 문헌 [Wolf et al. (2017a)]의 프로토콜에 따라 수행되었으며, 여기서는 악티노플라네스 종 SE50/110의 높은 G + C 함량에 혼성화 절차를 적응시켰다.
삼중물의 RNA를 단리하고 등몰 풀링하였다 (12 μL 중 5 μg 풀링된 RNA의 총량). cDNA 합성, 표지화 및 마이크로어레이 혼성화를 위해, 2-색 마이크로어레이-기반 원핵생물 분석 페어플레이 III 표지화 키트 (버전 1.4, 애질런트 테크놀로지스; 미국 캘리포니아주 산타 클라라)를 문헌 [Wolf et al. (2017a)]에 기재된 실제적인 조정을 사용하여 제조업체의 지침에 따라 사용하였다. 아머샴 시다이(Amersham CyDye) 단일 반응성 염료 팩 [GE 헬스케어 (GE Healthcare; 영국 리틀챌폰트)]을 표지화에 활용하였다. 악티노플라네스 종 SE50/110의 코딩 서열을 나타내는 맞춤형 전체 게놈 올리고뉴클레오티드 마이크로어레이가 사용되었으며, 이는 문헌 [Wolf et al. (2017a)]에 의해 설계되었다 (4x44K 형식, 8,238개의 유전자 및 1,417개의 대조군 지점을 나타내는 43,803개의 피쳐, 공급업체: 애질런트 테크놀로지스; 미국 캘리포니아주 산타 클라라). 혼성화 오븐 및 스캐너를 포함한 모든 마이크로어레이 특이적 시약 및 장치는 애질런트 테크놀로지스 (미국 캘리포니아주 산타 클라라)로부터 사용되었다. 애질런트 피쳐 추출 소프트웨어 버전 10.7.3.1 (애질런트 테크놀로지스; 미국 캘리포니아주 산타 클라라)이 피쳐 추출에 사용되었다 (프로토콜 GE2_107_Sep09). LOWESS 정규화 및 통계 분석을 포함한 후속 데이터 분석은 마이크로어레이 및 유전자 발현 (MAGE) 호환 시스템 EMMA 2를 사용하여 수행되었다 (Dondrup et al. 2009). 0.05의 p-값은 유의성에 대한 컷오프로서 사용되었다. 0.01의 잘못된 발견 비율에 대한 M-값 컷오프는 문헌 [Wolf et al. (2017a)]에 의해 수행된 이전 "황색 실험"에 따라 1.1 및 -1.1로서 결정되었다.
Cgt의
기능적 관련성의 분석
유박테리아
세계에서 단일 도메인
CBM
-20 단백질의 분포
본 발명자들은 BlastP 분석에 의해 원핵생물 세계에서 CBM-20 단일-도메인 단백질의 분포를 분석하였다.
간단히 언급하면, 단일 CBM-20-도메인 단백질의 분포는 NCBI 비-중복 단백질 데이터베이스를 사용하는 BlastP 분석에 의해 분석되었다 (Altschul et al. 2005; Altschul et al. 1990). CBM-20 도메인은 다양한 상이한 단백질과 효소에서 발생하기 때문에, 데이터 필터링을 수행해야 하였다: 초기 3,316개의 BlastP 히트 중에서, 모든 진핵생물 기원과 기능-특이적 주석 또는 350개 초과의 아미노산 크기를 가진 모든 효소는 배제되었다. 나머지 80개의 BlastP 히트의 도메인 구조가 분석되었다 (Marchler-Bauer et al. 2017; Marchler-Bauer and Bryant 2004; Marchler-Bauer et al. 2015; Marchler-Bauer et al. 2010). 이들 대부분은 총 53개의 단백질로, 글리코-히드로-77-슈퍼패밀리 4-알파-글루카노트랜스퍼라제로서 기재된 상위 도메인이 가로지르는 2개의 CBM-20 도메인을 함유한다. 10개는 상이한 부가의 도메인을 함유한다: 그 중 5개는 알파-아밀라제 억제제 도메인이고, 2개는 각각 N-말단에 있는 CBM-25 및 CBM-26 결합 도메인이며, 2개는 가능한 조절 기능이 있는 IPT-슈퍼패밀리의 N-말단 도메인이고, 1개는 여러 알파-아밀라제에서 발생하는 것으로 기재된 DUF1393-도메인이다 (NCBI 데이터베이스로부터 가져온 정보). 이들 후보 또한 배제되었다. 18개의 후보 (악티노플라네스 종 SE50/110으로부터의 Cgt 포함)만이 단일 CBM-20 도메인을 표시하였다. BlastP에 의해 수행된 다중 서열 정렬을 기반으로 하여 NCBI 데이터베이스 (NCBI 데이터베이스)의 Blast 트리 뷰 1.17.5에 의해 단백질 트리가 생성되었다 (Altschul et al. 1990; Altschul et al. 2005).
흥미롭게도, 단일 CBM-20 도메인 단백질은 17개의 다른 종에서만 발견되었다 (도 9). 이들 중 대부분은 악티노미세탈레스 목의 종, 예를 들어 악티노플라네스 속의 모든 균주에서 발견된다. 17개 종의 대부분, 즉 에이. 미소우리엔시스(A. missouriensis) ([Parenti and Coronelli 1979), 에이. 우타헨시스(A. utahensis) (문헌 [[Parenti and Coronelli (1979)]에 기재되고 문헌 [Couch (1963)]에 의해 처음으로 단리됨), 에이. 테이코미세티쿠스 (Wink et al. 2006), 스트렙토미세스 종 94 (Chu et al. 1996), 스트렙토미세스 종 OK885 (뿌리로부터 단리됨, 미국 테네시주, NCBI (NCBI 데이터베이스)의 진뱅크 (Benson et al. 2013)로부터 가져온 정보), 스트렙토스포란지움 로세움(Streptosporangium roseum) (Nolan et al. 2010), 스트렙토스포란지움 스클레로티알루스(Streptosporangium sclerotialus) [동의어: 카이니아 안티비오티카(Chainia antibiotica)] (Thirumalachar 1955), 셀룰로모나스(Cellulomonas) 종 B6 (Piccinni et al. 2016), 파에니바실루스(Paenibacillus) 종 P22 (Hanak et al. 2014), 및 클로스트리디움(Clostridium) 종 DMHC 10 (이는 증류소 폐기물 처리 공장의 슬러지로부터 단리되었다)은 원래 토양 및 환경 샘플로부터 단리되었다 (Kamalaskar et al. 2010). CBM-20 단백질은 또한, 샘플링 부위가 보고되지 않은 스트렙토미세스 종 DI166, 및 슈도모나다세아에(Pseudomonadaceae) 과의 여러 종에서 발생한다. 그들은 토양에 서식하는 구성원을 포함하는 것으로 공지된 속에 속한다.
서식지 토양 또는 환경에 직접 연계되지 않으면서 단일 CBM-20 단백질을 운반하는 균주는 인간 병원체 클라미디아 트라코마티스(Chlamydia trachomatis) (Thomson et al. 2008) 및 미코박테리움 압세수스(Mycobacterium abscessus) (Ryan and Byrd 2018; Moore and Frerichs 1953)의 단일 단리물과 같이 가끔씩만 발생한다.
시험관내
검정에 의한 전분 결합 기능의 확증
CBM-20 도메인은 전분 결합 기능을 갖는 것으로 기재되어 있으며, 이는 본 발명자들이 시험관내 검정으로 테스트하고자 하였다. 작은 탄수화물 결합 단백질 Cgt는 N-말단 신호 펩티드로 인해 세포외 공간에서 고도로 발현되고 풍부하기 때문에 (Wendler et al. 2015a), 상기 단백질은 여과에 의해 상등액으로부터 직접 농축될 수 있었다. 상이한 농도의 감자로부터의 전분을 사용하여 전분 결합 검정을 수행하였다. 전분 분획 뿐만 아니라 상등액 둘 다를 SDS-PAGE로 분석하였다. 모든 전분 분획 (전분의 1 내지 10% (w/v) 범위)에서, 약 15 kDA에서의 단백질 밴드가 검출되었으며, 이는 MALDI-TOF-MS에 의해 Cgt로서 명확하게 확인되었다. 대조적으로, 상등액 분획은 Cgt에 의해 거의 완전히 고갈되었다. 상등액 중 잔류 Cgt가 발견되었으며, 이는 부가된 전분이 Cgt에 의해 완전히 포화되었음을 나타낸다. 전분이 없는 음성 대조군에서는, 대부분의 Cgt가 상등액 분획에 남아있다. Cgt 외에, 기능이 공지되지 않은 또 다른 작은 세포외 단백질인 ACSP50_6253이 전분 결합 검정에 의해 확인되었다 (데이터는 제시되지 않음).
상이한 탄소 공급원에서 성장하는 동안
cgt
발현의 분석
유전자 cgt는 글루코스 및 말토스에 대한 트랜스크립톰 및 프로테옴 분석에 의해 결정된 바와 같이, 상이한 탄소 공급원의 존재 하에서 차등적으로 발현되는 것으로 보고되었다 (Schwientek et al. 2013; Wendler et al. 2015a; Ortseifen 2016). 본 발명자들은 역전사 정량적 PCR (RT-qPCR)에 의해 전사체 양을 측정함으로써 cgt 유전자의 발현에 대한 여러 탄소 공급원의 효과를 테스트하였다. 이를 위해, 악티노플라네스 종 SE50/110의 야생형 균주를 말토스, 글루코스, 전분, 갈락토스, 셀로비오스, 락토스 및 C-Pur가 보충된 최소 배지에서 성장시켰다 (케레스타 01908) (도 10). 후자는 주로 말토스와 말토트리오스로 이루어진 전분의 분해로부터의 당 함유 산물이다. 모든 탄소 공급원은 등가의 C-몰 양으로 보충되었다. 유일한 예외는 전분이었다: 낮은 용해도로 인해, 여기에서 아크로스 오가닉스로부터의 "전분 가용성"의 4% (w/v) 유백색 용액이 생성되었다. 비교를 위해, 감소된 양의 말토스를 포함하는 말토스 최소 배지 (여기서: 44.40 g·L-1 말토스 일수화물)를 제조하였으며, 여기서 C-몰농도는 전분 배지 중의 C-몰농도와 비슷해야 한다.
대부분의 테스트된 탄소 공급원의 경우, cgt 유전자의 전사는 말토스 성장된 배양물과 비교하여 유사하거나 약간 무의미하게 감소되었다 (도 11a). 갈락토스에 대한 차등 전사가 약간 관찰되었다 (3.4배 덜 전사됨, log2(변화 배수) = 0.291). 탄소 공급원 글루코스 (142배 덜 전사됨, log2(변화 배수) = 0.007) 및 락토스 (62배 덜 전사됨, log2(변화 배수) = 0.016)에 대해 cgt 전사체의 상당한 감소가 측정되었다. 세포가 감소된 양의 말토스 (여기서: 72.06 g·L-1 대신 44.4 g·L- 1)를 포함하는 말토스 최소 배지에서 성장했을 때, cgt 유전자의 전사가 2.9배 감소되는 것으로 관찰되었다 (log2(변화 배수) = 0.345) (도 11b).
유전자 결실 돌연변이체
Δcgt의
분석
상이한 탄소 공급원 또는 탄소 제한 조건 하에서의
Δcgt
탄소 공급원의 의존성에 있어서의 cgt의 차등 전사 프로파일은 이전에 추정된 것처럼 당 대사 내의 기능을 나타내었다 (Ortseifen 2016). 문헌 [Ortseifen 2016]에서는 카르보포어 모델의 맥락에서 탄소를 에너지원으로서 보유하는 책임이 Cgt에 있다고 제안되었다. 야생형 및 CRISPR/Cas9 결실 돌연변이체 Δcgt의 성장은 액체 배양물 중 상이한 탄소 공급원에서 테스트되었다.
이전에, 옴니로그 표현형 마이크로어레이 시스템 [바이오로그 인크. (Biolog Inc.; 미국 헤이워드)]에서 사전 스크리닝 실험을 수행하였으며, 이러한 시스템은 다중-웰 플레이트에서 총 190개의 상이한 탄소 공급원에 대한 세포 호흡 활동을 측정함으로써 빠른 표현형 스크리닝을 허용한다. 이들 중에서, 악티노플라네스는 103개의 탄소 공급원에서 호흡을 표시하였다. 아라비노스 및 락토스를 제외하고, 나머지 101개의 탄소 공급원에서 Δcgt에 대해 차등 호흡 프로파일이 관찰되지 않았다. 성장 수준에서 이러한 결과를 검증하기 위해, 탄소 공급원 아라비노스 및 락토스를 진탕 플라스크 배양에서 추가로 테스트하였다. 또한, 표준 실험실 당 말토스 및 글루코스, 복합 탄소 공급원 전분 뿐만 아니라 디사카라이드 셀로비오스를 테스트하여 서식지 토양의 자연 탄소 공급원을 모방하였다. Δcgt에 대해서는 성장에 대한 제한이 관찰되지 않았다 (도 12 및 도 13).
더욱이, 탄소 제한된 조건 (여기서: 1 g·L-1, 2 g·L-1, 3 g·L-1, 4 g·L-1 및 5 g·L-1 전분) 하에서의 성장은 m2p-랩스의 로보렉터® 시스템에서 테스트되었다. Δcgt 돌연변이체에 대한 성장 단점은 야생형과 비교하여 탄소 공급원 제약의 경우에 관찰되지 않았다 (도 14).
Δcgt는
오스몰농도 내성 또는 pH 내성에 영향을 미치지
않는다
Cgt 다량체는 다량체화를 통해 표면층을 형성하기 위해 제안되었다 (Wendler et al. 2015a). 이것은 가뭄, pH 및 오스몰농도와 같은 환경 변화로부터 보호하는 잠재적인 역할을 제안할 수 있다.
로보렉터® 시스템에서 액체 배양물 뿐만 아니라 고체 배지에서 pH 스크리닝을 수행하였다. 고체 배지 상에서의 스크리닝을 위해, pH 4 내지 11 범위의 pH의 SFM-한천 플레이트 (1의 단계에서)를 제조하고 야생형 포자와 결실 돌연변이체 Δcgt의 희석 시리즈의 액적을 적용하였다. 돌연변이체와 야생형 둘 다는 pH 5 내지 11에서 성장할 수 있었다. 한천-플레이트 상에서는 성장 또는 포자 형성에 있어서의 차이가 관찰되지 않았다.
가뭄 내성의 효과를 평가하기 어렵기 때문에, 본 발명자들은 박테리아 잔디 표면 상의 콜로니 및 포자 형성을 분석하고 야생형과 Δcgt 간에 차이를 발견하지 못하였다.
액체 배양물에서의 pH 스크리닝을 위해, 4 내지 7 범위의 pH의 말토스 최소 배지를 제조하였다. 배지 성분이 침전되는 경향이 있으므로, 더 높은 pH 값은 액체 배양물에서 테스트될 수 없었다. 균주 둘 다가 pH 4.5 내지 7에서 성장하였다 (도 15). 최종 세포 건조 중량과 관련하여 차이가 관찰되지 않았다.
오스몰농도 스크리닝을 위해, 말토스 최소 배지는 3.6 내지 108.1 g·L-1 말토스 일수화물 범위의 상이한 농도의 말토스 및 323.5 내지 681.0 mOsmol·kg-1 범위의 오스몰농도를 사용하여 제조되었다 (표 E11). 야생형과 결실 돌연변이체 Δcgt 간에는 유의한 성장 차이가 관찰되지 않았다 (도 16).
또한, 이노시톨은 삼투질로서 테스트되었는데, 이는 이것이 악티노플라네스에 의해 소비되지 않기 때문이다. 여기에서, 오스몰농도는 388.5 내지 695.0 mOsmol·kg-1의 범위였지만 성장 차이는 관찰되지 않았다 (도 17).
복합 배지 NBS를 사용하여 159 내지 190 mOsmol·kg-1의 더 낮은 오스몰농도를 테스트하였다 (도 19, 표 E10). 다시 언급하면, 야생형 균주와 결실 돌연변이체 Δcgt 간에는 성장에 있어서의 유의한 차이가 관찰되지 않았다.
표 E10 스크리닝 실험의 표 요약. 오스몰농도 및 pH 스크리닝을 위해 본 작업에 사용된 상이한 최소 배지의 최종 세포 건조 중량, 최종 아카르보스 농도, pH 및 오스몰농도. pH 스크리닝에 사용되는 배지에서의 상이한 오스몰농도는 보정제의 부가로 인해 야기된다.
Δcgt는
말토스
최소 배지에서 개선된 아카르보스 형성을 나타낸다.
테스트된 조건 하에서 뚜렷한 성장 표현형이 관찰되지 않았지만, 고도로 발현된 Cgt 단백질의 결여는 세포의 대사 자원, 예컨대 ATP 및 아미노산을 절약하는 것으로 보인다. 이들은 세포 성장 또는 기타 동화 프로세스에 사용될 수 있다. 본 실험에서는, Δcgt가 유의한 성장 이점을 나타내지 않았다. 그러나, 야생형과 비교하여 결실 돌연변이체 Δcgt에 대해 현저하게 더 높은 최종 아카르보스 농도가 검출되었다 (표 E10). 복합 배지에서의 배양의 경우, 이는 성장기 동안 가장 두드러졌다 (도 18).
개선된 아카르보스-생산 표현형은 말토스 최소 배지에서 3가지 독립적인 진탕 플라스크 배양물에 의해 검증되었다 (도 19 및 표 E11). 상등액으로부터 아카르보스의 정량화는 야생형과 비교하여 결실 돌연변이체의 증강된 아카르보스 수율 계수를 나타냈다. 최종 아카르보스 수율에서의 차이는 유의하였다 (양측 t-검정에 의해 검정됨, p-값 = 0.04608). 이에 따라, Δcgt에서 최종 아카르보스 농도의 8.3 내지 16.6% 증가에 도달하였다 (표 E11 참조).
표 E11. 아카르보스 생산 조건 하에서 성장 실험의 표 요약. 말토스 최소 배지에서 Δcgt 및 야생형의 3가지 독립적인 배양물의 최종 아카르보스 농도, 최종 세포 건조 중량 및 복제물 n의 수.
Δcgt는
아카르보스
생합성 유전자의 발현에 영향을 미치지
않는다
고도로 발현된 유전자 cgt의 결실이 다양한 조건 하에서 유기체의 성장 또는 생육력에 부정적인 영향을 미치지 않지만 증강된 아카르보스 생산 표현형을 가져다준다는 발견은 놀라운 것이었다. 이로 인해 그리고 아카르보스 생합성 (acb) 유전자의 조절에 대한 직접적인 영향을 배제하기 위해, 대표적인 acb 유전자의 RT-qPCR을 수행하였다. 이를 위해, 야생형 및 Δcgt를 말토스 최소 배지에서 성장시키고 초기 성장기 샘플로부터 RNA를 단리하였다. 아카르보스 생합성 클러스터 유전자 acbZ, acbW, acbV, acbA, acbB, acbD 및 acbE의 상대적 전사체 양을 야생형과 비교하여 Δcgt에 대해 계산하였다 (도 20). 유전자 acbV는 아카르보스 생합성 유전자 클러스터의 주요 오페론 내에서 폴리시스트로닉으로 전사된 여러 유전자 중 제1 유전자이다 (Wolf et al. 2017b). 세포외 아카르보스 대사의 단백질을 코딩하는 모노시스트로닉으로 전사된 유전자 acbD 및 acbE는 아카르보스 조절인자 AcrC에 의해 강력하게 조절되는 것으로 제시된 바 있다 (Wolf et al. 2017a). 유전자 acbA, acbB 및 acbZ가 또한 모노시스트로닉으로 전사되며, 각각 아카르보스 생합성의 효소 (acbAB) 및 그의 세포외 대사의 효소 (acbZ)로서 주석이 달려 있다. AcbW는 acbWXY-오페론의 제1 유전자로, ABC 트랜스포터를 코딩하는 것으로 추정된다. 선택된 모든 전사체에 대해, 야생형과 비교하여 결실 돌연변이체 Δcgt에서 상대적 전사체 수준에 있어서의 유의한 변화가 측정되지 않았다 (도 20).
논의
탄수화물 대사와 아카르보스 생합성의 연결은 높은 관심을 받고 있다. 최근 연구에서는 야생형에서 아카르보스와 추가 아카르비오실 대사산물의 생합성과 관련하여 탄소 활용의 중요성을 지적하였다 (Wendler et al. 2014).
이러한 맥락에서, 전분 결합 단백질 Cgt는 굉장히 매력적이다. 이것은 전체 분비된 프로테옴의 약 8%를 차지하는 (본 발명자들의 미공개 데이터) 악티노플라네스 종 SE50/110에서 가장 강하게 발현되는 유전자 중 하나이다 (Schwientek et al. 2013). 그것의 유전자 산물은 세포외 공간으로 유출된다 (Wendler et al. 2013). 과잉 생산 및 유출은 세포에 대한 높은 비용을 의미한다: 번역 프로세스에 대해서만, 펩티드 결합당 4개의 ATP가 필요한데 (Campbell and Reece 2011; Purves 2006), 즉 RNA 합성, 아미노산 생산, 단백질 폴딩 및 유출에 대한 부가의 비용은 포함되지 않는다. 따라서 본 발명자들은 Cgt가 악티노플라네스 종 SE50/110 생리학에서 중요한 역할을 한다고 결론지었다. Cgt의 2가지 상이한 기능, 즉 당 대사 내에서의 역할 및 표면 단백질로서의 역할이 본원에서 제안되고 분석된다.
전분 결합 도메인으로 인해, 문헌 [Ortseifen 2016]에서는 Cgt가 카르보포어 모델 (Wehmeier 2003)의 맥락에서 에너지원의 결합 및 유지에 관여할 수 있다고 제안되었다. RT-qPCR에 의해 증거가 제공되었으며, 이는 말토스, 고급 말토덱스트린 및 셀로비오스에서 성장한 배양물과 비교하여 글루코스, 갈락토스 및 락토스에서 성장한 배양물에서의 유전자 cgt의 차별적인 발현을 나타내었다. 이것은 탄소 공급원 말토스와 글루코스에 대한 차등 프로테옴 분석에 따른 것이다 (Wendler et al. 2015a; Wendler et al. 2015b). 이러한 결과는 cgt의 탄소-의존적 발현을 나타낸다. 조절 메커니즘을 밝히는 것은 흥미로울 것이다. 그러나 900개 초과의 유전자가 악티노플라네스 종 SE50/110의 전사 조절에 관여하는 것으로 추정되며, 그 중 697개는 문헌 [Wolf et al. (2017b)]의 주석에 따라 전사 조절인자로서 주석이 달린 것으로 여전히 고려된다 (진뱅크: LT827010.1).
cgt의 당-의존적 발현은 말토스, 고급 말토덱스트린, 및 잠재적으로 또한 셀로비오스의 활용 내에서의 기능을 나타낼 수 있다. 그러나, 결실 돌연변이체 Δcgt에 대한 본 발명자들의 연구는 탄소 활용에 관한 표현형별 차이를 밝히지 못하였다. 이것은 총 105개의 상이한 탄소 공급원에 대해 테스트되었으며, 그 중 103개는 옴니로그 스크리닝 시스템에서 분석되었고, 6개는 액체 배양물에서 분석되었다.
Cgt의 기능은 과량의 탄소 공급원에서는 무시할 수 있지만 제한된 탄소 공급원이 있는 조건 하에서 성장하는 경우에는 불필요할 수 있으므로, 본 발명자들은 전분 농도가 낮은 최소 배지에서 결실 돌연변이체 Δcgt 및 야생형의 성장을 테스트하였다. 전분 결합 검정에서 확증된 Cgt의 전분 결합 활성으로 인해, 전분을 탄소 공급원으로서 선택하였다. 그럼에도 불구하고, 돌연변이체의 성장 표현형은 제한된 탄소 공급원 조건 하에서 관찰될 수 없었다.
당 대사 내의 또 다른 기능은 불용성 결정질 기질의 결합으로 구성될 수 있으며, 이는 기질 접근성을 증가시키고 아밀라제와 같은 다른 가수분해 효소의 활성을 증강시키는 구조적 변화를 유발할 수 있다. 이러한 메커니즘은 이미 토양 박테리아 세라티아 마르세센스(Serratia marcescens)에서 키틴분해에 대해 보고되었고 (Vaaje-Kolstad et al. 2005) 써모비피다 푸스카(Thermobifida fusca)에서 세포분해에 대해 보고되었다 (Moser et al. 2008). 악티노플라네스 종 SE50/110의 게놈에서, 추정 α-글리오시드 기능을 갖는 여러 유전자가 코딩되며, 그 중 3개, 즉 α-아밀라제/풀룰라나제 AcbE, AcbZ 및 PulA가 세포외 공간에 축적되는 것으로 제시되었다 (Wendler et al. 2015a). 부가적으로, 공지되지 않은 기능과 전분 결합 능력의 또 다른 작은 세포외 단백질 (ACSP50_6253)이 전분 결합 검정에서 확인되었다. Cgt 및 ACSP50_6253 둘 다의 존재 및 부재 하에 세포외 아밀라제 및 효소 검정의 이종 발현에 의해, 전분 분해 동안 지지 기능이 향후 실험에서 검출될 수 있다.
당 대사 외에도, 표면층 단백질로서의 기능도 생각할 수 있으며, 이는 Cgt가 다량체를 형성한다는 사실에 의해 뒷받침된다 (Ortseifen 2016; Wendler et al. 2013). 문헌 [Wendler et al. (2015) (Wendler et al. 2015a)]에서는 Cgt 단백질에서 2개의 막횡단 도메인을 확인하였으며, 그 중 하나는 리더 펩티드의 일부로서 Sec 경로에 의한 전위에 관여하고 다른 하나는 다량체화에 필요한 것으로 추정된다. Cgt가 물리적으로 막에 고정되어 있지는 않지만 (Wendler et al. 2015a), Cgt 단백질은 감소된 유체 흐름으로 인해 균사체의 메쉬에서 다량체로서 남을 수 있다. 이러한 맥락에서, 전분 결합 도메인은 앵커 역할도 할 수 있다.
추정 표면 단백질로서의 역할에서, 본 발명자들은 초기에 pH 및 삼투질 스트레스 또는 가뭄의 맥락에서 보호 기능을 추정하였다. 그러나, 스크리닝 실험은 cgt 유전자의 결실이 액체 배양물 내의 상이한 pH에서 유의한 성장 억제로 이어지지 않았는다는 것을 제시하였다. 고체 배지에 대한 스크리닝 실험으로부터, Cgt가 pH 또는 가뭄의 경우 보호 기능을 가질 수 있다는 징후는 없었다.
오스몰농도 조절과 관련하여 추정되는 기능에 대한 힌트는 상이한 양의 말토스에서 성장한 야생형의 역전사 정량적 PCR에 의해 제공되었다. 여기에서, 본 발명자들은 72 g·L-1과 비교하여 44.4 g·L-1 말토스에서 성장할 때, 유전자 cgt의 전사가 2.9배 감소한 것을 관찰했으며, 이는 오스몰농도의 영향일 수 있다. 본 발명자들은 159 내지 681 mOsmol·kg-1 범위의 배지를 사용한 액체 배양에서의 여러 스크리닝 실험에서 결실 돌연변이체 Δcgt의 성장을 분석하였다. 테스트된 모든 조건 하에서, 야생형과 비교하여 결실 돌연변이체 Δcgt에 대해 성장 및 생육력에서의 차이가 관찰되지 않았다.
놀랍게도 상이한 탄소 공급원을 과도하게 활용하거나 제한적으로 활용하거나, 상이한 pH 또는 삼투질 조건 하에서 cgt 유전자의 결실에 의해 명백한 생리학적 영향이 관찰되지 않았기 때문에, Cgt의 기능은 그의 자연 환경 및 다른 토양 유기체와의 가능한 경쟁에서만 명백해질 수 있다. 흥미롭게도, 본 발명자들은 대부분이 악티노미세탈레스 목에 속하는 17개의 다른 원핵생물 종에서 유사한 독립적인 단일 CBM-20 도메인 단백질을 발견하였다. 드물지만 이것은 적어도 특정 분포를 나타내고 Cgt가 균주-특이적 단백질이 아님을 제시한다. 단일 도메인 CBM-20 단백질을 보유하는 대부분의 종은 토양 서식지와 관련이 있다. 이러한 사실을 취합하면, 그러한 cgt는 악티노플라네스 종 SE50/110에서 고도로 발현되며, 이것은 Cgt와 같은 단백질이 이러한 서식지 내에 사는 박테리아에서 중요한 기능을 수행한다는 가설을 뒷받침해준다. Cgt의 기능은 다른 미생물 경쟁자와 직접 접촉하는 공동 배양에 의해 미래에 테스트될 수 있다.
Cgt가 테스트된 실험실 조건 하에서 필요하지 않은 것으로 밝혀진 것은 놀라운 일이지만, 본 발명자들은 아카르보스 생산과 관련하여 양성 표현형을 관찰하였다. 8.3 내지 16.6%의 아카르보스 수율 증가는 cgt의 결실에 의해 달성되었다. 최종 산물 수율은 배치 배양 간에 약간 다르지만, Δcgt 돌연변이체는 항상 훨씬 더 나은 성능을 보였다. 이것은 3개의 독립적인 진탕 플라스크에서 수개월의 기간에 걸쳐 (데이터는 제시되지 않음), 말토스 최소 배지에서 수행된 여러 마이크로 규모 배양에서 제시되었다. 따라서 개선된 생산은 장기간에 걸쳐 상이한 배양 환경에서 견고하였다.
본 발명자들는 이것이 야생형에서 cgt 유전자의 발현에 의한 대사 부담 때문이라고 추정하며, 이는 Δcgt에서 에너지와 자유 자원의 구제를 불러일으킨다. 이러한 자원은 아마도 성장 관련 산물인 아카르보스 생합성으로 리디렉션될 것이다. acb 유전자의 발현에 대한 cgt의 결실에 의한 직접적인 조절 효과는 관찰되지 않았다.
카로티노이드 형성의 기능적 관련성의 분석
광-의존성 카로티노이드 형성 및
산화적
스트레스는
악티노플라네스
종 SE50/110에서 아카르보스 생산을 감소시킨다
악티노플라네스는 카로티노이드 클래스의 황색, 주황색 및 분홍색 색소를 비롯한 다양한 가용성 색소를 생산하는 것으로 공지되어 있다 (Parenti and Coronelli 1979). 악티노플라네스 종 SE50/110의 색소는 주황색이다. 빛에 노출되어 배양될 때 그의 형성이 강화된다. 상등액에서도 마찬가지로 색소가 발견되었기 때문에, 그것은 수용액에 가용성인 것으로 보인다. 세포 추출 및 박층 크로마토그래피에 의한 분리 후, 스펙트럼 분석은 450, 475 및 505-510에서 최대 흡수를 나타내며, 이는 HPLC 분리 동안 수행된 흡광도 스캔에 의해 확증되었다. 인 실리코 재구축에서 이러한 발견과 일치하여, 악티노플라네스 종 SE50/110은 살리노스포라 트로피카 CNB-440으로부터의 시옥산틴과의 유사성을 갖는 C40-카로티노이드를 생산하는 완전한 유전적 장비를 갖추고 있는 것으로 제시되어 있다 (Richter et al. 2015; Wolf et al. 2017b) (도 21 및 표 E12).
표 E12. 악티노플라네스 종 SE50/110에서 카로티노이드 합성의 재구축. 2개의 테르펜 합성 유전자 클러스터가 antiSMASH 분석 (Blin et al. 2017; Weber et al. 2015)에 의해 확인되었으며, 이는 살리노스포라 트로피카 CNB-440으로부터의 시옥산틴 유전자 클러스터 (Richter et al. 2015) (테르펜 클러스터 1-2)와의 유사성을 갖는 C40-카로티노이드의 형성으로 할당될 수 있었다. 더욱이, 캄펜-유사 모노테르펜 유전자 클러스터 (테르펜 클러스터 3), MEP/DOXP 경로의 모든 유전자 및 리코펜의 분해를 코딩하는 유전자가 BLASTP 분석 (Altschul et al. 2005) 및 KEGG (Kanehisa et al. 2014)에 의해 확인되었다.
C40-카로티노이드 생합성의 유전자는 3가지 유전자 클러스터인 테르펜 클러스터 1, 2a 및 2b로 구성된다 (도 21d 참조).
에스. 트로피카(S. tropica)와 달리, 시클라제 및 데새투라제를 코딩하는 crtY 및 crtU의 동족체는 악티노플라네스 종 SE50/110에서 확인될 수 없었다 (Wolf et al. 2017b). 대신, CarR-도메인 슈퍼패밀리의 두 시클라제가 본 작업에서 발견되었다. 그들은 테르펜 클러스터 2b에 국한되어 있다 (도 21). CarR-도메인 시클라제는 진균, 고세균 및 박테리아 게놈에서 흔하다 (NCBI의 CDD 검색으로부터 가져온 정보 (Marchler-Bauer et al. 2017)). SE50/110의 색소는 주황색이기 때문에, 적색 전구체인 리코펜의 말단 순환이 일어날 가능성이 높으며 CarR 도메인 시클라제 중 하나 또는 둘 다에 의해 촉매될 수 있다. 에스. 트로피카와 유사하게, SE50/110의 카로티노이드 유전자 클러스터는 글리코실트랜스퍼라제 CruC를 함유한다 (도 21, 표 E12). 이것은 관찰에 따르면 글리코실화된 카로티노이드에 대해 상등액에서 발견되었기 때문에, 그 색소가 극성 특징을 갖는 것으로 보인다는 것을 강력하게 나타낸다 (도 22b).
소프트웨어 플랫폼 EDGAR 2.0 (Blom et al. 2016)에 의한 비교 게놈 분석은 악티노플라네스 속의 관련 종에서 유사한 테르펜 클러스터 배열을 표시하는 반면, 스트렙토미세스에서는 상이한 구성이 발견되었다 (데이터는 제시되지 않음). 이로써 SE50/110 및 CNB-440에서 발견된 유전자 배열 (Richter et al. 2015; Wolf et al. 2017b)은 미크로모노스포라세아에 과에 특징적인 것으로 보인다.
게다가, MEP/DOXP-경로를 통한 빌딩 블록 IPP 및 DMAPP의 합성을 위한 유전자 (표 E12), 캄펜-유사 모노테르펜 신타제를 코딩하는 유전자 (테르펜 클러스터 3, 표 E12) 뿐만 아니라 카로티노이드 절단 디옥시게나제를 코딩하는 유전자 (ACSP50_5522, 표 E12)가 SE50/110의 게놈에서 발견되었다. 후자의 두 가지는 악취 물질의 형성에 관여할 수 있다 (Yamada et al. 2015). 본 발명자들은 강한 착색이 생산 손실과 관련되어 있음을 관찰하였다. 이것은 빛에 노출된 경우 및 빛으로부터 가려진 경우의 배양물의 성장 및 아카르보스 수율을 비교함으로써 확증되었다 (도 22). 카로티노이드 형성이 유도되긴 하였지만, 22-44 μE (1 μE = μmol광 자 m-2 s- 1)의 강도로 전구 빛 (36 W, 오스람(Osram) 830U)에 노출되었을 때, 악티노플라네스 종 SE50/110의 아카르보스 생산 및 성장은 크게 감소되었다. 전체적으로, 최종 아카르보스 농도의 39% 손실이 모니터링되었다.
SE50/110에서
merR의
결실은 빛에 노출되지 않으면서 카로티노이드 형성을 유도한다
자연광 또는 전구 빛이 카로티노이드 형성을 유도할 수 있었기 때문에 (도 22b, c), 본 연구에서는 SE50/110에서 가능한 조절 유전자를 검색하였다. MerR 조절인자는 테르펜 클러스터 1 (ACSP50_0145, 도 23) 내에서 발견되었다.
MerR-패밀리은 주로 산화적 스트레스, 중금속 또는 항생제와 같은 환경 자극에 반응할 수 있는 활성인자로 이루어진다 (Brown et al. 2003). 실제로, MerR-패밀리의 여러 구성원은 관련 악티노미세테(actinomycete) 에스. 코엘리콜로르(S. coelicolor) (Takano et al. 2005; Takano et al. 2006)에서, 그람 음성 써무스 써모필레스(Thermus thermophiles) HB27 (Takano et al. 2011)에서 및 그람 양성 바실루스 메가테리움(Bacillus megaterium) QM B1551 (Takano et al. 2015)에서 비-광합성 박테리아, 예를 들어 LitR에서의 카로티노이드 생합성의 광-의존적 활성인자 또는 억제인자 둘 다로서 기재되었다. 여기서, 코발라민 (비타민 B12)은 보조인자로 작용하여, 자외선과 청색 광을 흡수할 수 있기 때문에 광 감도를 매개한다: 조절인자와 공유적으로 결합하거나 또는 광 여기 후 떨어져 나감으로써, 조절인자의 입체 형태와 활성을 조정할 수 있다 (van der Horst et al. 2007). 조절 메커니즘과 결합 부위는 상당히 상이하다: 티. 써모필레스(T. thermophiles)와 비. 메가테리움(B. megaterium)에서는 litR/crtB (Takano et al. 2011) 또는 litR 및 crtI (Takano et al. 2015)의 프로모터 영역이 어두운 곳에서 억제되고 조명 후 완화되는 반면, 에스. 코엘리콜로르에서의 LitR은 ECF 시그마 인자를 코딩하고 카로티노이드 생합성 유전자의 전사를 지시하는 인접 국소화 litS의 필수 광 유도 전사 활성인자인 것으로 보인다 (Takano et al. 2005). ECF 시그마 인자를 코딩하는 유전자는 SE50/110의 유전자 클러스터 내에서 발생하지 않는다. 그람 음성 박테리움 믹소코쿠스 크산투스(Myxococcus xanthus)에서는, B12-의존성 MerR 조절인자가 8개의 추가 조절 유전자를 포함한 복잡한 조절 캐스케이드의 일부이다 (Fontes et al. 2003; Galbis-Martinez et al. 2012). 실제로, 엠. 크산투스(M. xanthus)로부터의 조절 네트워크의 동족체는 BLASTP 분석에 의해 SE50/110의 게놈에서 확인되지 않았다 (데이터는 제시되지 않음).
악티노플라네스 종 SE50/110의 MerR-패밀리 조절인자 ACSP50_0145는 N-말단 HTH-모티프와 C-말단 B12-결합 도메인을 함유한다 [BLASTP 분석 및 CDD 검색에 따름 (Marchler-Bauer et al. 2015; Marchler-Bauer et al. 2010; Altschul et al. 2005)]. HTH 도메인의 위치는 전사 억제인자가 차지하고 있다 (Perez-Rueda and Collado-Vides 2000).
SE50/110에서의 상응하는 유전자의 CRISPR/Cas9 결실에 의해, 카로티노이드 형성은 빛에 노출되지 않고 강하게 유도되었다 (도 24b, c). 이것은 전사 억제인자로서의 기능을 확증한다.
실제로, 전형적인 주황색은 빛에 노출되지 않은 야생형에서도 생산되기 때문에, 억제인자/오퍼레이터 시스템이 누출된다는 점에 유의해야 한다. 이에 따르면, 유전자 crtEBI 및 idi (ACSP50_0146-0149)의 전사는 어두운 조건 하에서의 야생형과 비교하여 ΔmerR에서 단지 2배로 증가되었다 (도 24e). 이러한 차이는 crtE, crtB 및 idi에 대해 중요하였다. acb 유전자의 전사에 대한 영향은 관찰되지 않았다.
그러나 이러한 작업의 맥락에서, ΔmerR에서의 색소 형성이 미세 화학물질 아카르보스의 형성에 영향을 미치는지 여부에 대한 질문이 조사되었다. 다시 언급하면, 더 높은 카로티노이드 형성은 더 낮은 아카르보스 형성과 관련이 있다 (도 24a, d). 조명을 받으면, 야생형과 ΔmerR 둘 다가 강하게 착색되고 최종 아카르보스 농도는 균주 둘 다에 대해 유사하며, 대략 0.52 g·L-1에 도달하였다 (도 24b, d). 이는 어두운 조건 하에서의 야생형과 비교하여 대략 38%의 아카르보스 형성 감소에 상응한다 (0.83 g·L-1에 도달함). 이는 본원에 기재된 바와 같이 야생형의 이전 성장 실험에 따른 것이다.
어두운 조건 하에서, ΔmerR은 야생형보다 대략 15% 더 적은 양의 아카르보스를 생산한다 (0.70 g·L-1) (도 24d). 이러한 생산 손실은 결실 돌연변이체에서 카로티노이드 형성에 의한 자원 낭비에 기인한다고 제안된다 (도 24c). 결론적으로, 밝은 조건 하에서의 생산 손실 (38-39%)은 결실 돌연변이체와 야생형 둘 다에서 추가의 광 유도 스트레스로 인해 발생할 수 있다.
마이크로어레이 기술을 사용하여 어두운 조건 및 밝은 조건 하에서 배양된 야생형의 비교 트랜스크립톰 분석은 다양한 유전자에 영향을 미치는 전사체 수준에 대한 복잡한 반응을 나타낸다 (도 25 참조). 차등적으로 발현되는 여러 유전자는 산화적 스트레스와 싸우기 위한 세포 반응을 나타낸다. 산화적 스트레스는 에너지 전달 (일중항 산소로 유도) 또는 전자 전달 (슈퍼옥시드, 과산화수소 및 히드록실 라디칼로 유도)에 의해 형성되는 반응성 산소 종 (ROS)에 의해 야기된다 (Ziegelhoffer and Donohue 2009). 고농도에서 ROS는 독성이 있으며 단백질 및 막 산화 및 DNA 손상을 유발한다 (Ziegelhoffer and Donohue 2009; Gout 2019).
SE50/110에서는, 갈색 색소 유멜라닌의 형성에 관여하는 (Wolf et al. 2016) 광 보호제인 티로시나제 MelC (ACSP50_4950, 이전명: ACPL_5017), 및 리보플라빈 생합성의 유전자 (ACSP50_6437-40)가 빛에 노출될 때 더 강하게 전사된다 (도 25). 리보플라빈은 374 및 445 nm에서 흡수하는 수용성 광산화 증감제이다 (Silva et al. 1999; Kim et al. 1993). 이것은 플라빈 모노뉴클레오티드 (FMN) 및 플라빈 아데닌 디뉴클레오티드 (FAD)의 전구체이다. 이들은 세포성 레독스 대사, 빛 감지, DNA 복구 및 추가 기능에 관여하는 단백질의 보조인자이다 (Garcia-Angulo (2017)에서 검토됨). 이로써 리보플라빈 및 그의 유도체는 세포가 산화적 스트레스를 극복할 수 있도록 하는 중요한 미량 영양소이다 (Chen et al. 2013).
이에 따르면, 여러 플라빈-의존성 옥시게나제는 빛에 노출될 때 더 강하게 전사된다. 그 중 하나는 그의 기질이 시스테인의 분해 산물인 타우린 디옥시게나제로서 주석이 달려 있다. 시스테인과 같은 황 함유 아미노산은 ROS를 포착하고 레독스 완충제로 기능할 수 있는 저분자량 티올 (LMW 티올) 군에 속한다 (Gout 2019). 이에 상응하여, 아마도 시스테인 및 메티오닌 대사 및 수송에 관여하는 추가 유전자는 빛에 노출된 세포에서 더 강하게 전사된다.
놀랍게도, 여러 전사 조절인자 유전자 및 시그마 인자 SigE를 코딩하는 유전자 (ACSP50_0558)도 더 강하게 전사된다 (도 25). SigE는 광합성 박테리움 로도코쿠스 스파에로이데스(Rhodococcus sphaeroides) (문헌 [Ziegelhoffer and Donohue (2009)]에서 검토됨)에서의 산화적 스트레스 반응과 관련이 있고, 관련 종 에스. 코엘리콜로르 (Hutchings et al. 2006) 및 씨. 글루타미쿰(C. glutamicum) (Park et al. 2008)에서의 외피 스트레스 반응과 관련이 있다. SigE가 SE50/110에서의 산화적 스트레스 반응에 관여할 가능성이 있다.
흥미롭게도 카로티노이드 생합성의 유전자 및 조절인자 MerR의 유전자는 빛으로부터 가려진 야생형과 비교하여 빛에 노출된 야생형에서 훨씬 더 강하게 전사되지 않는다. 이것은 야생형에서 카로티노이드 형성에 대한 빛의 분명한 효과를 관찰할 수 있기 때문에 주목할만한 것이다. 카로티노이드 합성은 어두운 곳과 밝은 곳 둘 다에서 일어나며 상대적 전사체 양의 증강은 조절인자 돌연변이체에서 상당히 완만하기 때문에 (상기 참조), 전사체 수준에 대한 영향은 눈에 띄지 않을 수 있다. 예를 들어 카로티노이드 절단 디옥시게나제 (ACSP50_5522)에 의한 카로티노이드 또는 테르페노이드-전구체의 분해에 의해, 단백질 수준 또는 대사체 수준에 대한 카로티노이드 합성의 추가 조절이 존재할 수 있다고 추정한다. 그러나 야생형의 마이크로어레이로부터 수득된 결과에 따르면, crt 유전자 발현은 로도코쿠스 스파에로이데스로부터의 연구 결과와 유사하게 전반적인 산화적 스트레스 반응의 주요 표적이 아닌 것으로 보인다 (문헌 [Ziegelhoffer and Donohue (2009)]에서 검토됨).
모두 취합해 보면, 조명은 산화적 스트레스 반응을 촉발시키고 성장, 카로티노이드 및 아카르보스 형성을 위한 대사 자원의 분포에 중요한 영향을 미치는 것으로 보인다. 카로티노이드 생합성의 조절은 산화적 스트레스에 대한 전반적인 반응으로부터 분리되어 있는 것으로 보이며, 이에 대해서는 추가 조사가 필요하다. 대사 플럭스를 아카르보스 생산으로 향하게 하기 위해서는, 향후 이러한 프로세스를 더 잘 이해하는 것이 바람직하다. 시그마 인자 SigE는 빛에 노출될 때 더 많이 전사되기 때문에 산화적 스트레스 반응에 대한 책임이 있을 수 있다.
광 스트레스 외에도, 본 작업은 생산 손실의 많은 부분이 카로티노이드 형성에 직접 할당될 수 있음을 명확하게 보여준다. 비-광합성 박테리아의 카로티노이드는 광역학적 사멸로부터 보호하는 것으로 제시된 바 있기 때문에 (Mathews and Sistrom 1959), 광보호제로서의 기능을 갖는 것으로 추정된다 (Lee and Schmidt-Dannert 2002). 빛의 영향은 간단한 구조적 조치에 의해 배제될 수 있으므로, 카로티노이드 형성은 실험실 조건 하에서 불필요한 것으로 추정된다. 아카르보스 생산을 개선시키기 위해, 예를 들어 중앙 유전자 crtI의 결실에 의해 공동 카로티노이드 생합성 경로를 차단하는 것이 균주 개발에 사용될 수 있다. 카로티노이드는 막의 유동성에 영향을 미치기 때문에 (Gruszecki and Strzałka 2005), C40-카로티노이드의 결여는 악티노플라네스 종 SE50/110의 표면과 균사체 구조에도 영향을 미칠 수 있다. 생산과 관련하여, 균사체 덩어리의 분해는 균사체 표면과 생화학적으로 이용가능한 세포의 수를 증가시키는 데 유리한다.
acbB
및
gtaB의
과다발현
발현 벡터 pSETT4는 유전자 acbB 및 gtaB에 대해 테스트되었다. 유전자 acbB와 gtaB 둘 다는 아마도 아카르보스 생합성의 피딩 분지인 아미노 당 합성에 관여할 것이다: AcbB는 dTDP-D-글루코스의 dTDP-4-케토-6-데옥시-D-글루코스로의 탈수를 촉매하고 GtaB는 전구체 글루코스-1P의 공급에 관여하는 것으로 추정된다. 흥미롭게도, 두 단백질 모두 아카르보스 생산자의 세포질에서 증가된 단백질 양을 나타낸다.
단일 유전자의 과다발현을 위한
pSETT4gap
및
pSETT4tip
벡터
악티노플라네스 균주, 예컨대 악티노플라네스 종 SE50/110에서 단일 유전자의 용이한 클로닝과 과다발현을 허용하는 신규 클로닝 시스템이 구현되었다. 이를 위해, 에게텔라 렌타로부터의 유전자 gapDH의 강한 프로모터를 pSET152-백본에서 lacZ-카세트 앞에 클로닝하였다. 유전자 lacZ는 lac-프로모터의 제어 하에 전사되고 깁슨 어셈블리 (Gibson et al. 2009), 제한/라이게이션 클로닝 또는 골든 게이트 클로닝 (Engler et al. 2008)에 의해 관심 유전자에 의한 lacZ의 교환을 가능하게 하는 제한 효소 BsaI의 인식 측면에 의해 플랭킹된다. 강한 발현은 강한 종결을 필요로 하기 때문에, 신규 발현 시스템의 클로닝 측면 전후에 T4-종결인자가 도입되었다. T4-종결인자는 문헌 [Myronovskyi et al. (2011)]에서 개발된 pGUS-클로닝 시스템에서 이미 성공적으로 사용되었다. 본원에서 수행된 pGUS-통합 돌연변이체의 전체 트랙 RNAseq 분석에 따르면, T4-종결인자가 전사를 효율적으로 차단하고 인테그라제 유전자에서부터 관심 유전자로의 번역-초과를 방지하는 것으로 제시되었다. 사전 실험에 의해 제시된 바와 같이, T4-종결인자는 pSET152 통합을 통해 악티노플라네스 종 SE50/110 내로 도입될 때 acb 유전자의 전사에 대해 어떠한 부작용도 나타내지 않는다.
게다가, 프로모터-스크리닝 실험으로부터 유래된 강화된 1차 전사체 라이브러리의 시퀀싱에 의해, 안티센스 배향으로 관심 유전자 뒤에 있는 2개의 추정 프로모터가 확인되었다 (도 26). 안티센스 전사를 방지하기 위해 이들 2개의 슈도-프로모터를 신규 발현 시스템에서 제거하였다. 더욱이, 부가의 (제3의) T4-종결인자가 반대 배향으로 클로닝 측면 뒤에 도입되어 추가의 추정 안티센스 판독을 방지하였다.
프로모터 서열의 교환을 허용하기 위해, NdeI 및 KpnI 제한 부위가 도입되었다. 본 작업에서는, 강한 gapDH-프로모터가 에스. 리비단스(S. lividans)로부터의 중간 정도의 강한 tipA-프로모터로 교환되었다. 이로써, 예를 들어 악티노미세탈레스 목의 다른 종에 맞도록 조정하기 위해, 시스템을 쉽게 변형시킬 수 있는 것으로 제시되었다. 벡터 (pSETT4gap 및 pSETT4tip으로 명명됨)는 유전자 acbB 및 gtaB의 강한 및 중간 정도의 강한 과다발현에 대해 테스트되었다.
acbB의
중간 정도의 과다발현은 개선된 아카르보스 형성을
초래한다
dTDP-D-글루코스-4,6-데히드라타제 AcbB는 아카르보스 생합성의 피딩 경로 (도 1)인 D-글루코스-1P로부터 활성화된 아미노 당의 생성에 관여하는 것으로 보인다: 증가된 AcbB-활성은 변형된 전구체의 공급을 개선시키는 것으로 밝혀졌다:
간단히 언급하면, 본원의 다른 곳에서 기재된 발현 벡터 pSETT4에 기초하여 2개의 과다발현 돌연변이체가 생성되었다. 이들 돌연변이체에서 acbB는 중간 정도의 강한 tipA-프로모터 또는 강한 gapDH-프로모터의 제어 하에 전사된다. 이전에 발표된 바와 같이 (Schaffert, et al. 2019), 천연 프로모터를 사용한 발현 벡터는 Acb 유전자 클러스터의 유전자의 상당한 과다발현으로 이어지지 않았다. 따라서 천연 프로모터는 pSET152- 및 pSETT4-벡터 배경 둘 다에서 대조군으로서 사용되었다. 성장 및 아카르보스 형성은 말토스 최소 배지 중의 2개의 진탕 플라스크 배양물에서 모니터링되었다 (도 27).
이종 tipA-프로모터의 제어 하에 전사된 acbB를 갖는 돌연변이체는 대조군 균주와 비교하여 증강된 아카르보스 생산을 나타내었다: 수율 계수는 2가지 독립적인 배양물에서 빈 벡터 대조군과 비교하여 48.6 및 51.9%로 증가되었다 (도 28). 강한 gapDH-프로모터를 사용함으로써, 아카르보스 수율 계수가 약간 증가되었다 (도 28).
pSETT4tip::acbB에서, 인산화된 글루코스/갈락토스 및 UDP-글루코스의 정규화된 피크 면적은 빈 벡터 대조군과 비교하여 유사하거나 심지어 약간 증가하였다 (도 29). 따라서, 활성화된 글루코스 모이어티의 공급이 보장되는 것으로 보인다. 이러한 돌연변이체에서, 질량 m/z = 545 [M-H+]의 증가된 양이 발견되었다 (도 29, 대략 41%). 이론에 얽매이는 것은 아니지만, 이러한 중간체는, 예를 들어 pSETT4tip::acbB를 사용하여 중간 정도의 AcbB-과다발현에 의해 축적된다.
초기 성장기에서는, acbB의 증강된 발현이 예상 범위 내에서 관찰되었다: 가장 강한 과다발현은 gapDH-프로모터 (log2(변화 배수) = 6.54)를 사용한 다음 tipA-프로모터 (log2(변화 배수) = 4.06)를 사용함으로써 달성되었다 (도 30). 천연 프로모터의 사용은 acbB의 상대적 전사체 양의 상당한 증가로 이어지지 않는다. 이것은 pSET152 및 pSETT4 벡터 배경 둘 다에서 테스트되었다 (도 30). acb 유전자 클러스터의 추가 유전자는 acbA 및 acbV에 대해 제시된 바와 같이 유의하게 영향을 받지 않았다 (도 30). 유일한 예외는 pSETT4tip::acbB에서 acbA의 전사 풍부도가 약간 더 높다는 것이다 (log2(변화 배수) = 1.87).
현저하게, 선형 성장기의 전사 프로파일은 초기 성장기와 상이하다: 여기에서, gapDH-프로모터를 사용하여 전사체 양의 2배 증가만 도달한 반면 (log2(변화 배수) = 2.05), tipA-프로모터를 사용함으로써 acbB의 과다발현은 유지되었지만 더 적은 정도였다 (log2(변화 배수) = 3.33) (도 30, 도 31).
이종 프로모터를 포함한 과다발현 돌연변이체에서는, acbB의 상대적 전사가 pSETT4tip::acbB에서의 두 샘플링 시간 사이에 4.06배에서 3.33배 (log2(변화 배수))로 감소되고 pSETT4gap::acbB에서는 6.54배에서 2.05배로 감소된다. 염색체 acbB-카피의 전사가 이들 돌연변이체에서 하향조절되는 반면, 벡터 카피의 전사는 이종 프로모터에 의해 유지되는 것으로 추정된다. 상이한 샘플링 시간에 acbB-전사에 있어서의 차이는 또한, acb 유전자 전사의 하향 조절이 pSETT4tip::acbB와 비교하여 pSETT4gap::acbB에서 각각 더 일찍 더 강하게 발생한다는 것을 시사한다. acbB의 과다발현 (pSETT4gap::acbB 및 pSETT4tip::acbB)은 선형 성장기 동안에 감속되는 것으로 보인다.
요약하면, 특히 tipA-프로모터의 사용에 의한 acbB의 중간 정도의 과다발현은 아카르보스 생산에 유익한 것으로 보이는 반면, gapDH-프로모터의 사용에 의한 강한 과다발현은 아카르보스 형성에 미치는 영향이 더 작은 것으로 보인다. 아카르보스 형성에 있어서의 추가 개선은 acbB의 발현 수준을 변화시킴으로써, 예를 들어 프로모터 스크리닝으로부터 대체 프로모터를 사용하거나 또는 다수의 유전자 카피를 도입함으로써 달성될 수 있다.
요약하면, 본 작업은 AcbB의 중간 정도의 과다발현이 아마도, 개선된 아미노 당 공급으로 인해 아카르보스 수율을 증가시킨다는 것을 입증해준다. acbB의 중간 정도의 과다발현 (예를 들어 tipA-프로모터의 사용에 의함)에 의해, 2가지 독립적인 배양물에서 약 50% 더 많은 아카르보스를 가져다주는 아카르보스 생산에 대한 긍정적인 효과가 관찰되었다. 따라서, 단일 acb 유전자의 과다발현에 의한 아카르보스 생합성의 개선이 달성되었다.
gtaB의
중간 정도의 과다발현은 개선된 아카르보스 형성으로
이어진다
GtaB는 UDP-글루코스과 글루코스-1P의 상호 전환을 촉매하는 것으로 가정된다. 놀랍게도 GtaB의 과다발현이 아카르보스 형성을 촉발시키는 것으로 밝혀졌다. 이론에 얽매이는 것은 아니지만, 이것은 전구체 글루코스-1P의 개선된 전개에 의해 발생할 수 있다. 말토스 최소 배지에서 진탕 플라스크 배양에 의해 제시된 바와 같이 (도 32), pSETT4tip 내로 도입된 gtaB의 과다발현 돌연변이체의 아카르보스에 대한 최종 수율 계수는 8.56%로 증가되었다.
흥미롭게도, 아카르보스 형성은 후기 선형 내지 정지 성장기에서 특히 증가된다. 과다발현 돌연변이체에서, 유전자 gtaB의 상대적 전사체 양은 2.64배 증가된다 (log2(변화 배수)) (도 33).
활성화된 당의 대사는 다른 대사 경로에 연결되거나 또는 이러한 경로에 리디렉션되기 때문에, 축적되지 않는 것으로 가정된다. 그러나, 이전 실험에 제시된 바와 같이, 공급이 심각하게 방해받을 수 있다. 세포내 대사체의 분석은 유사한 양의 인산화된 헥소스 및/또는 UDP-글루코스를 나타낸다 (도 34). 따라서, 활성화된 C6-당의 풀은 gtaB의 과다발현에 의해 유의하게 영향을 받지 않는다.
흥미롭게도, pSETT4tip::gtaB에서 질량 m/z = 545 [M-H+]의 상당한 감소량이 발견되었으며 (대략 48% 감소), 이는 AcbB의 제안된 산물인 dTDP-4-케토-6-데옥시-D-글루코스에 상응할 수 있다. 이것은 합성 가닥을 통한 흐름이 더 균형을 이루고 있음을 나타낼 수 있는데, 그 이유는 이러한 대사산물의 축적이 빈 벡터 대조군 및 AcbB-과다발현 돌연변이체와 비교하여 감소되기 때문이다 (도 34). 취합해 보면, 세포성 제품의 분포에 대한 gtaB-과다발현의 영향이 여전히 불분명하지만, gtaB의 제2 유전자 카피의 도입은 아카르보스 생산에 긍정적인 영향을 미친다.
이러한 구축물을 악티노플라네스의 생산자 균주로 전달하는 것은 유익한 효과의 증가를 초래할 수 있는데, 이는 여기서 전구체에 대한 수요가 야생형과 비교하여 더 높기 때문이다. AcbB의 강한 과다발현은 글루코스-포스페이트-대사에 있어서의 불균형을 초래하기 때문에, acbB와 gtaB의 조합된 과다발현이 단일 과다발현에 대해 관찰된 효과를 넘어 아카르보스 생산을 그럴듯하게 더 개선시킬 것이다.
100~117
SEQUENCE LISTING
<110> Bayer Aktiengesellschaft
<120> METHODS FOR THE IMPROVED FORMATION OF ACARBOSE
<130> BHC191038
<160> 111
<170> PatentIn version 3.5
<210> 1
<211> 912
<212> DNA
<213> Artificial Sequence
<220>
<223> >acbA (ACSP50_3609)
<400> 1
gtgcgcggaa tattgctggc cgggggaacc ggctcacggc ttcgaccggt gacctgggcg 60
gtttccaaac aactgatgcc ggtctatgac aaaccgatga tctactatcc gctggccacg 120
ctcgtcagct gcgggatccg ggagatcctg gtcatcacga ccgagaccga ggccgcccag 180
ttccagcggt tgctgggtga cggctcgcag tggggcctgc gtctggagtt cgccgtgcag 240
cagcgccccg ggggcatcgc cgaggccttc ctcatcggcg aggagttcct ggccggtggg 300
ccggtggcgc tcatgctcgg cgacaacctg ctgcacgggg tggacttccg cccctgcgtg 360
cagcgggcac gcgagacggc cggtgggcac gtcttcggag tggcggtggc cgacccgtcg 420
gcctacgggg tggtcgagtt cgacgccgcc gggcgggtgc tgtccatcga ggagaaaccg 480
gtccgtcccc gctcgccgta cgcggttccc ggcttctacc tctacgacgc cgatgtggtc 540
gagacggccc ggtcgctgcg gcccagcgcc cgcggggagc tggagatcac cgaggtcaac 600
caggcctacc tgcggcgcgg cgcactctcg gtgacgctgc tgggtcgggg cgcggtctgg 660
ctcgacaccg gcaccctggc cgactgcatg cgcgcggtcg actacgtgcg cgccatcgac 720
gagggccagg gcatcaagat cggctgtgtg gaggaggcgg cctggcgggc cggtttcctc 780
gacaccgcgc agctgcgtgc cctcgccgag ccgttgatga gcagcggcta cggacagtac 840
ctgctggctc tgaccggcga cgggctcagc cgtaccccgc agtggccggc cttgaccgcc 900
gccgccgggt ga 912
<210> 2
<211> 963
<212> DNA
<213> Artificial Sequence
<220>
<223> >acbB (ACSP50_3608)
<400> 2
atgaaaatct tggtcaccgg cggagccggc tttatcgggt cccattttgt aacttccctg 60
atcagtggcg acattgccac accacaaccc gtgacgcagg ttacggtcgt cgacaaactg 120
ggttacggag gcaatctcag aaatctcgcc gaagcgtcgg cggaccctcg tttcagcttc 180
gttcggggcg acatctgtga cgaaggtcta atcgaggggc tgatggcgcg gcacgacacc 240
gtggcgcact tcgccgccga gacccacgtc gaccgctcgg tggtcgcctc cggccccttc 300
gtggccagca acctggtcgg cactcaggtg ctactggacg ccgcgctacg ccaccatatc 360
ggccgcttcc tgcatgtttc caccgacgag gtgtacgggt cgatcgacac cggctcgtgg 420
gccgagggcc atccgctggc gcccaactcg ccgtacgccg cgagcaaagc cgggtccgac 480
ctcctcgctc tggcctacca ccagacgcac gggatggacg tcgtggtgac ccgctgctcg 540
aacaactacg ggccccggca attcccggag aaaatgattc cgctgttcgt caccaggctg 600
ctcgacgggc tcgacgtacc ggtctacggc gacggccgca acatccgcga ctggctccac 660
gtcagcgacc attgccgcgg tctcgccctg gccctgggtg ccggccgggc aggcgaggtc 720
tatcacatcg gcggtgggtg ggaggcgacg aatctcgaat tgaccgagat cctcctcgag 780
gcgtgcggcg ccccggcttc gcgcatatct ttcgtgaccg atcgcaaagg tcacgaccgg 840
cgctattctc tcgactattc gaaaatcgcc ggggaactcg gttaccggcc gcgggtcgat 900
ttcaccgacg gcatcgcgga aacggtcgcg tggtatcgcg ccaaccgttc ctggtggacc 960
tga 963
<210> 3
<211> 1197
<212> DNA
<213> Artificial Sequence
<220>
<223> >acbC (ACSP50_3607)
<400> 3
gtgagtggtg tcgagacggt aggggtgcac gcggatgcgc accgcgactc gtggcaggtg 60
cgggcccaga agcagatcac ctacgaggtg cgcttccggg acgacgtgtt cgggctggac 120
tccaccgacc tgctggaggc cggggcggac ggggccggtt cacggcggcg gttcgtggtg 180
gtggacagcg ccgtcgacgc cttgtacggg tcccggatcc gggagtactt cacccatcac 240
ggcatcgatc attcgatcct ggtgatgcgg gtgggcgaga cggtcaagga cttcgacacg 300
gcgggccgca tcgtcgccgc gatggacgcc ttcggactgg cccgccgccg ggagccgatg 360
atcgtcgtcg gtggtggggt gctgatggac gtggccggtc tggtggccag cctctaccgg 420
cgcggcacgc cgttcctgcg ggtgccgacg acactggtcg gactgatcga cgcgggtgtc 480
ggcgcgaaga ccggggtcaa cttcaacggc cacaagaacc ggctgggtac gtacgccccg 540
gctgatctga ccctgctgga ccgccgcttc ctggccaccc tggaccggcg ccacctcagc 600
aacgggctcg ccgagatgct caagatcgcg ctgatcaagg atgccgagct gttccagctg 660
ctggagcggc acgggcgggt cctgatcgag gaacggttcc agggccgtac cggaaccggt 720
gaccgggccg ccgtccgggc cctgcgcgcg gccacccatg gcatgctgga ggaactcggc 780
cccaatctgt gggagagccg gctggaacgc agtgtcgact acgggcacac gttcagcccg 840
accatcgaga tgcgcgcgct gccggctctg ctgcacggcg aggccgtgtg tgtggacatg 900
gcgctgacca cggtgctggc gtaccggcgg ggtctgctcg acgtcgcgca gcgggaccgg 960
atcttcgcgg tgatgaccgc cctgggcctg ccgacctggc atccgctgct cacgccggag 1020
gtgctggagg cggcgttgca ggacaccgtc cggcaccggg acgggtggca gcggctgcca 1080
ctgccggtgg ggatcggggg tgtcacgttc gtcaacgacg tgacggccgc cgagctgcag 1140
gccgccgcgc tgatgcagca ccggctcgcc gaggacgccc tgctgctgcg cgcctag 1197
<210> 4
<211> 2130
<212> DNA
<213> Artificial Sequence
<220>
<223> >acbS (ACSP50_3596)
<400> 4
atgcacatca tcgagacgta cttcgaatgc ggcggcttcg accaccggtt catccagggc 60
ggcacctcgg tctatctctg gcagctgtcg cgtggcctgg ccgacctggg acaccgggtc 120
tccatcgtca caccggcgca cggccgcctg gacgatctgc gccggctgca cgaggtcgag 180
gacctgcccg gcaccgacga gtacgaactg ccgctggtgc tcgacccgcg cgtgtggggc 240
gaacggttcc cggcccagat ggacatcgcc ctgcggacca ccgcgcatcg gatccggctg 300
gcgggcgtgg acctgtactt cctctccaac gaactgctcg atcagttgcc ggaccggttc 360
tatcccccgt acgagagcaa gggggttgat ctggtcttct tcaagccgct cgcctatcag 420
gtggcggcca tccggttcat caggtcgcac ttcggtgacc agcgcgcgat cgtgcacgca 480
cacgagccgt tctaccacta cctgatgccg gccgccttcg ccgcggaccc ggccaaacac 540
gtggtcagca cggtgcagag caacatgccg atcaacaagt cggtgtaccg ggccgaggtg 600
gcgcggctgc tcggcttcct cggcgccccg aacgcgctgc ccgccgacga tccggccggc 660
agccgttcgc cgcacaccgt ggcgatgagc cagtaccagc agctgaccca cctgcactac 720
gaatacccgc cggaccacgt gcgggtctac gacctggtgg ccgagcacgc cgaccggatc 780
gacttcctgt cgccggggca ccgcgactac tacacctgct tcgccgacac cccgttcgcg 840
cagctgttcg ccaccctgcc ggtgtcgcgg acggtacggc gcaacgcgga caagacgttc 900
gtcggcggct gcgccgtcgg tgacgagtgg gtgaccggcg agctgccccc ggtcgaccgg 960
gagaaggtgc tggccgggct cggcctggac ccggacctgc cggccttcta ccacaacgcc 1020
cggtacgcgg tcaaccacaa ggggcaggtc gagctgatcc gggccgtcga ccgggtgctg 1080
agcggcggcg tgcgggccag cttcatcgtg cgctgcctca gcgacgccgg gatcgccgac 1140
ccgctcttcc acgaggtggt ggcccgccac ccgggccggg tgaatctgga gtggcaccgg 1200
gtgccggagg accagctgcg ggagtacgcc cgagccgcgg acttctgtct cttcccgtcc 1260
aagttcgaga tggacacctt cctgatcgcc cagggtgagg cgatggctgc cggtgcggta 1320
ccgatcgcca ccgcccagct ggggatggcg cacttcggtc acgtcgccga cccgctgacc 1380
gggccggacg cggcgacggc caccggattc gccgtcaacc gctcgttcgc cgaggacgat 1440
ccgctgctgg tccagggcct gaccgagcag atccgccggg ccgtcacgct ctggaacgag 1500
cagcccggcc agtaccgccg gttgtccgcc aacgccgtcg cccgggcccg cgagttcacc 1560
tggcggcggg cggcccaggc gcacgaggcc gcgttcgccg gggtgtgggc cggccgtacc 1620
ccccgcctgc cggtcggtga cctgctgcgg ttcggctggt tcgacgagct gcccgcggac 1680
gcctggacgc tgcaccgcga cgagatcgcg gaggtggccc tggcccacgg cgacgccgac 1740
gcctacctgc gctgccggcc cgacgacctc gacgccctgg cggcactctt cgagcgggcc 1800
tgggcccggg ccgacttccc ggcctgcgcg cggaccgtag agctggccga ggagcaccgg 1860
caggagcggg tgccgcagtg gcgggcccgg ctcgccggcc gcggccgcat cgaccgcgac 1920
ggtcggctgc actaccgtcc gccgtccgcc gaacgggtcg aactggtctt gcccgacctg 1980
gccgaacccc tgcgcggaac ggtcaccgtg accgcgatgg ctccgaccgg cgacaccttc 2040
accggacagc tgccggccgg aacccggcgt gccgacctgc tgctcaccct cagtgacggg 2100
cgcaccgtct gggacgaggt gacggcatga 2130
<210> 5
<211> 1074
<212> DNA
<213> Artificial Sequence
<220>
<223> >acbW (ACSP50_3593)
<400> 5
atgcccgggt acgcccggca tgcccggccg gacggcacga ccggcatgat cgtcgccgag 60
cacctcagca agcacttcaa gcgctaccgg cgcgagccgg gtctgcgggg cagcctgcga 120
accatgttct cggcccggta cgacgtggtc cgggccgtcg acgacatcag cttcgaggtc 180
ccgtccggtg tcaagatcgc ctacatcggg gcgaacggcg cgggcaagtc caccacgatc 240
aaactcctga ccggcatcat gcgcccgacc accgggcggg tccgggtcga cggcctcgac 300
ccgcaccggc agcgcacccg ggtcgccggc cggatcggcg tggtcttcgg ccagcgcagc 360
cagctctggt gggatctgcc ggtcctcgac tcgttccgca tcctgcggca cgtctacgag 420
gtgccgcagg cggtgtacga ccggaacatg cgcctgttcc gggaccggct ggacctcggc 480
gccctcggca acaccccggt ccgccagctg agcctgggcc agcgcatgcg ggccgagatc 540
gccgcctcgc tgctgcacga cccggccgtg gtcttcctcg acgaacccac catcggcctg 600
gacctggtcc tcaagcaggc ggtccgggac ctgatcaacc acatccacgc cgaactgggc 660
accacggtca tgctgaccag ccacgacatc ggcgacatca ccagcatctg cgatcaggcg 720
ctggtcgtgg accgcgggac gatcgtccac cagggaacga tgcgggacct gctgcggtcg 780
gtggacaccc gggcggtcac cttcgagtac gccgccggca gcgtctccga ggccgccgcg 840
ctgcgcatca tcaccgaagg actgcccgag gtggacgcca ctccggccga gtccggccgg 900
atccgggtcg agttcccggt ggaccgctgg tcggcccggc aggtgatcgc cttcctgctg 960
gaccggttcg acctgagcga cgtgctggtg ccggacgccg atctggagac actgctgcgc 1020
cgcatctacg ccgggtcgcg cccggagccg gtcaccgccg gggacggcgc atga 1074
<210> 6
<211> 804
<212> DNA
<213> Artificial Sequence
<220>
<223> >acbX (ACSP50_3592)
<400> 6
atgatccgcg ccgcgcgccg gtacgcgccg ttcgccctcg ccggactgca cgccgtcacc 60
cgttaccgct cgaccatcgt cctgagcgca ctcacggcgg ctgcggccac ctcgttgcag 120
gtgttcctgt ggcgagccgt ctacgccggc ggaccggcac cggccggcct cccgttcgca 180
cagctcacct cgtacatcgt gctcgcgcag gtgctcggga tgctgcacac caaccggatc 240
gacgagatga tcgccggcga ggtgtaccgc ggggacatcg cggtctccct ggtacgcccg 300
gcgaactacg cgctcagctg tctggcggtg aacctgccga ccgccgcgct cagtgcgctg 360
ctggccggcg ccccggtgct cgccggtttc gcgatgttcg cgtcgctgcc cgctcccccg 420
cccgccaacc tgctgctgtt cgccgtcgcg ctgctgctct cggtgatcct cgccttcgag 480
atcaacttcc tggtgggtct cgccgccttc gtcacgacca acacctgggg catccgtacg 540
atcaagaacg cgctcgtcgc cttcctggcc ggccaggtcg tcccgctcgc gctgttcccg 600
gacggcgtgg cccggctgct gcggctgctg ccgttccagg gcctgatcga cagcccgttg 660
cggctgctgc tcggcggcta ctccggcggt tccggcgccg ctgccatcct cggtgtccag 720
gcgctctggg cggtactgct gtacggcgtg ctggccctgg cctggaaccg gtcgctgcgc 780
agggtggagg tgctcggcgg atga 804
<210> 7
<211> 804
<212> DNA
<213> Artificial Sequence
<220>
<223> >acbY (ACSP50_3591)
<400> 7
atgaccgtct ccacggcgcg ccggtacctg cgcctcacgg cggtgctgtg cggggcgagc 60
ctgcaccggc tcaccgcgta ccggatggac ttcctcatcg gggcggccag cttcgtcatc 120
cggatcgcct gccagatcgc cctgatcggg gtgatcttcc agtacgttcc ggcgctcggc 180
ggctggaccc gccagcaggc gctgttcctg ctcgggttct ccctgctgcc ccgcgggctg 240
gaccggctct tcaccgacca gctgtggatc ctggcctggc agctggtgcg caccggcgac 300
ttcttccgct acctgatccg gccggtgaac ccgttctacg cgctgctgtc cgaacggttc 360
ctctatccgg acgggttcgg ggagctggcc accggcatcg ccatcgtggt caccgcggcc 420
gggacgatgg acctgcacct gaccgtggca cagtggctgc tgttgctgcc cctggtcctc 480
ggcggcgccc tgatccacac cttcctcaag gcgttcctgg cctccctgtc gttctggatg 540
accagcagcc tcaacgtgat ggtggcggtc aaccagctca gcgagttcac cgcgtacccg 600
ctcaacctct accacccggt gctgcgcggg gtgctcacct gggtgctgcc gttcgcgttc 660
accgcctacc taccggtgcg ctacctgctc accggggacg ccgggccgct gctgtggatg 720
ctgccggtca ccacgctcac cgtcctgctg gggtacggca ccttccggct cgggctgcgg 780
cgctacgaga tgcccggcag ctga 804
<210> 8
<211> 912
<212> DNA
<213> Artificial Sequence
<220>
<223> >gtaB galU (ACSP50_7820)
<400> 8
atgacgacga acgcgcaagg gtcgggcaag cgcgcggtga aagcagtgat tccggcggcc 60
ggcctagcca cgcgtttcct gcctgccacc aaagccgttc cgaaagagct gctgccggtc 120
gtcgaccggc cggtcctgca gtacatcgtc gaggaggccg ccgcggccgg catcaccgac 180
gtgctgctgg tgaccgggcg tggcaagacc tcgatggtcg accacttcga ccgtcgcccc 240
gacgtggagc agcggctgga ggagaagggc gacaccgagc ggctcgccgc cgtccggcgc 300
accagtgagc tggccgacat ctacacctgc cgacaggggg agccgctcgg cctcggccat 360
gccgtcggga ccgccgcctc gcacgtcggg gacaacccgt tcgcggtgct gctcggggac 420
gagttcgtcg aggagggcag cccgctgctg cccgacatgc tcgacctgca ggcccgcacc 480
ggcggcatcg tgctcgcctt catcgaggtc accccggagg agacgtcgcg ctacgggatc 540
gcctcggtgc gggagtccga cctgggcgag ggcgtggtcg aggtgaccgg cctggtggag 600
aagccgtcgc cggaggaggc gccgagcaac cttgccgtgg tggggcggta cgtgctgcct 660
ggcaggatct tcgagacgat cgccggcacc aagccgggca gcgggggcga gatccagctg 720
accgacgcga tggcgacgct gctggccgag ggcaccccgg tgcacggcat cgtctaccgc 780
ggtgtccggt acgacaccgg ccagccgctg ggctacctgc agaccgtcgt ccagctcgcg 840
gctcagcgtc ccgacctggg tgccgagttc cgggcctggc tcaccgactt cgtcggtggt 900
cagaagggat ga 912
<210> 9
<211> 450
<212> DNA
<213> Artificial Sequence
<220>
<223> >cgt (ACSP50_5024)
<400> 9
atgaatcgca ccaccgttcg ggccggcgtg ctggccaccg ccctgatcag cggcgtgctc 60
ggggtggccg gcccggcgct cgccgccccg gtcaccgacg cggcgccggt cgccgccgcc 120
ggcaccgccg tcgcgccgat cgccgcgacc ttcaacgtga ccgccgggtt caccagctgg 180
ggtcagaacg tctacgtcgt cggcagcatc ccggcgctcg gctcctggga cgtctccaag 240
gcggtgccgc tgaccaccac gagcagcgcc ttcccgacct ggaccgggag cgtggcgctg 300
ccggcgaaca cgtacaccga gttccagtac gtggtgaaga acgccgacgg cagcgtcgcc 360
cgctgggaga agggtttcca gcagaaccgc accacgatca ccccgccgac cggcacctac 420
gtcacgcacg acaccttcgg cgcgtactga 450
<210> 10
<211> 1515
<212> DNA
<213> Artificial Sequence
<220>
<223> >crtI (ACSP50_0147)
<400> 10
atgatgaaac cccccacccc ctggagccgc ggcgtgcgca ctgttaccgg acccaccgat 60
cgtgtcgtga tagtgggggc cggcctggcc ggcctctcct gcgccttgca cctggccgca 120
gccgggcggc aggtcaccgt cgtcgagcgg gagccggtgc cgggcggccg cgccgggcgc 180
ctctcggtcg gcggatacga cttcgacacc ggcccgaccg tgctgaccat gccggaactg 240
atcgccgagc cgctcgccgc ggtcggcgag aatctctccg actggctgga gctgaccccg 300
ctcgacccgg cctaccgggc gtactacccg gacggctcca cgctggacgt ccgcaccgac 360
accacccgga tggcggccga gatcgcccag gtctgcggcg cccgcgaggc cgacggctac 420
ctgcggttcg tcgactacac ccggcggctc tggcagctgg aacgggacca cttcatcgac 480
cggaacctgg acagtccgct cgacctgctc aacctcaacc tgctgaagct gctcgggatg 540
ggcgctttcg gtcgcctgca gccgaagatc aacgagttct tccgcgatcc gcggacccag 600
cggatcttct cgttccaggc gatgtacgcc ggtctcgccc cgcacgacgc gatggccatc 660
tacgcggtga tcgcctacct cgactcggtc gccggggtgt actaccccaa gggcggcatg 720
cacgccgtcc ccaaggcgct ggccggcgcc gccgagaagc acggggtcac cttccgttac 780
gacacgacgg tcgagcgggt gctcacccag cacggccggg cgaccggggt ggtgaccgtc 840
ggcggggacg tgatcgaggc ggacaccgtc gtactcaatc ccgacctgcc catcgcgtac 900
cgcgacctgc tgcctgcccg gaacagccgc aacctgcgct tttcgccctc ctgcgtggta 960
ctccacatcg gatcgtcaca gcggtattcg aagatcgcac accacaacat ccactttggt 1020
acgacgtggc gccgcacctt cgacgaagtg atcaaccgtg ggctgctgat gagcgacccg 1080
tcactgctgg tcaccaatcc cacgcacacc gacccctctg ccgcgcccga cggcaaacag 1140
acctactacg tgctggcgcc cgccccgaac ctcgtctccg gtccgatgaa ctggcgcggc 1200
ggcctcgccg aacggtatgc cgacgagctg ctgcgtaccc tggagcagcg cggctacatc 1260
ggcttccggg acggggtcga ggtcgaacgg atcatcacgc cggccgactg ggccgacgac 1320
gggatggcgg ccggcacgcc gttcgccgcc gcgcacacct tcgcccagac cggcccgttc 1380
cggccggcga acctgcaccc cacgctgccg aacgtggtct tcaccggttc gggcacacaa 1440
cccggggtcg gcgtgccgat ggtgctcatc tccgggaagc tggccgcgag ccggatcaca 1500
cagggagcct catga 1515
<210> 11
<211> 1260
<212> DNA
<213> Artificial Sequence
<220>
<223> >merR (ACSP50_0145)
<400> 11
gtggccggtg aggcgttgag cgccgagatc cccacctcgc cgggcagctc ggtcgcctcc 60
tcgcacgaca tcccggccac agccggtccc ggcgccgtcc ggaccggccc ggtggctgcc 120
gcgcccggtg gcccgagcga tacgcccctg accgacgcga cagctgccgc gtcgggtgcc 180
gcggacgacg cctcccgggc ccgcccggcg accgccacgg acgacgcctc ccgcaccggc 240
ccggcgaccg ccgcgacgga ttctccggac gacgccgtcc ggaccggcgt ggcagatgcc 300
gcgccggccg ggcgggcggg cgatgtggcg ttgagtgccg gggcggccgc gcggcggctg 360
ggagtggcgg tcacgaccct gcgcacctgg caccagcggt acgggctcgg gccgagccgg 420
cacgagcccg gacatcaccg gcggtacacc gccgaggaca tggaccggct gcaggtgatg 480
cagcggctca ccactcaggg cgtggcgccc gccgaggccg ccgcctgggc gcggtccagg 540
cccctcaccc caccggagcc cggcgcggcg ctgtacgacc ccaccgccgt ggcgtcgcca 600
cccaccccgg ccgctcccgg acagcccccg gtcggccccg ccggccgggg cacccgcccg 660
acccgcggac cggccccggc cgctcgcggg ctgacccggg ccgcgatgcg gctcgacgtg 720
cgcggcatgc gcgacatcct ctgcagcacg ctgcacgacc gcggcgtgat acccgcctgg 780
accgaggtga tggtcccggc tctggccgcg atcggcgacc ggtacgaggc cactcggcgt 840
ttcgtcgagg tcgaacacct gctgtcgcgc gccgtcaccg aaatcctcgc ctcggtccca 900
caccccgccg gctctccccg ggtgctgctc gccgccgccg acgaggaaca gcacacactg 960
cccctggagg ccctggccgc cgccctggcc gagggaggcg tgccgagccg tctgttcggc 1020
gcccgggtgc cgtcacaggc cctgctggac gccatcgccc gcaccggccc ggctgccgtc 1080
gtgctctggt cgcagcgccc ggccaccggc atcgtcaccc agctgacccg ggtccgcgac 1140
atcccgcacc cgccgctggt catcgccgcc gccggccccg gctggccgca tgacctgcct 1200
tccgggatca cccgcctgac cggcctcacc gaggccgtcc acctgctcgc cacggtctag 1260
<210> 12
<211> 303
<212> PRT
<213> Artificial Sequence
<220>
<223> >AcbA (ACSP50_3609)
<400> 12
Met Arg Gly Ile Leu Leu Ala Gly Gly Thr Gly Ser Arg Leu Arg Pro
1 5 10 15
Val Thr Trp Ala Val Ser Lys Gln Leu Met Pro Val Tyr Asp Lys Pro
20 25 30
Met Ile Tyr Tyr Pro Leu Ala Thr Leu Val Ser Cys Gly Ile Arg Glu
35 40 45
Ile Leu Val Ile Thr Thr Glu Thr Glu Ala Ala Gln Phe Gln Arg Leu
50 55 60
Leu Gly Asp Gly Ser Gln Trp Gly Leu Arg Leu Glu Phe Ala Val Gln
65 70 75 80
Gln Arg Pro Gly Gly Ile Ala Glu Ala Phe Leu Ile Gly Glu Glu Phe
85 90 95
Leu Ala Gly Gly Pro Val Ala Leu Met Leu Gly Asp Asn Leu Leu His
100 105 110
Gly Val Asp Phe Arg Pro Cys Val Gln Arg Ala Arg Glu Thr Ala Gly
115 120 125
Gly His Val Phe Gly Val Ala Val Ala Asp Pro Ser Ala Tyr Gly Val
130 135 140
Val Glu Phe Asp Ala Ala Gly Arg Val Leu Ser Ile Glu Glu Lys Pro
145 150 155 160
Val Arg Pro Arg Ser Pro Tyr Ala Val Pro Gly Phe Tyr Leu Tyr Asp
165 170 175
Ala Asp Val Val Glu Thr Ala Arg Ser Leu Arg Pro Ser Ala Arg Gly
180 185 190
Glu Leu Glu Ile Thr Glu Val Asn Gln Ala Tyr Leu Arg Arg Gly Ala
195 200 205
Leu Ser Val Thr Leu Leu Gly Arg Gly Ala Val Trp Leu Asp Thr Gly
210 215 220
Thr Leu Ala Asp Cys Met Arg Ala Val Asp Tyr Val Arg Ala Ile Asp
225 230 235 240
Glu Gly Gln Gly Ile Lys Ile Gly Cys Val Glu Glu Ala Ala Trp Arg
245 250 255
Ala Gly Phe Leu Asp Thr Ala Gln Leu Arg Ala Leu Ala Glu Pro Leu
260 265 270
Met Ser Ser Gly Tyr Gly Gln Tyr Leu Leu Ala Leu Thr Gly Asp Gly
275 280 285
Leu Ser Arg Thr Pro Gln Trp Pro Ala Leu Thr Ala Ala Ala Gly
290 295 300
<210> 13
<211> 320
<212> PRT
<213> Artificial Sequence
<220>
<223> >AcbB (ACSP50_3608)
<400> 13
Met Lys Ile Leu Val Thr Gly Gly Ala Gly Phe Ile Gly Ser His Phe
1 5 10 15
Val Thr Ser Leu Ile Ser Gly Asp Ile Ala Thr Pro Gln Pro Val Thr
20 25 30
Gln Val Thr Val Val Asp Lys Leu Gly Tyr Gly Gly Asn Leu Arg Asn
35 40 45
Leu Ala Glu Ala Ser Ala Asp Pro Arg Phe Ser Phe Val Arg Gly Asp
50 55 60
Ile Cys Asp Glu Gly Leu Ile Glu Gly Leu Met Ala Arg His Asp Thr
65 70 75 80
Val Ala His Phe Ala Ala Glu Thr His Val Asp Arg Ser Val Val Ala
85 90 95
Ser Gly Pro Phe Val Ala Ser Asn Leu Val Gly Thr Gln Val Leu Leu
100 105 110
Asp Ala Ala Leu Arg His His Ile Gly Arg Phe Leu His Val Ser Thr
115 120 125
Asp Glu Val Tyr Gly Ser Ile Asp Thr Gly Ser Trp Ala Glu Gly His
130 135 140
Pro Leu Ala Pro Asn Ser Pro Tyr Ala Ala Ser Lys Ala Gly Ser Asp
145 150 155 160
Leu Leu Ala Leu Ala Tyr His Gln Thr His Gly Met Asp Val Val Val
165 170 175
Thr Arg Cys Ser Asn Asn Tyr Gly Pro Arg Gln Phe Pro Glu Lys Met
180 185 190
Ile Pro Leu Phe Val Thr Arg Leu Leu Asp Gly Leu Asp Val Pro Val
195 200 205
Tyr Gly Asp Gly Arg Asn Ile Arg Asp Trp Leu His Val Ser Asp His
210 215 220
Cys Arg Gly Leu Ala Leu Ala Leu Gly Ala Gly Arg Ala Gly Glu Val
225 230 235 240
Tyr His Ile Gly Gly Gly Trp Glu Ala Thr Asn Leu Glu Leu Thr Glu
245 250 255
Ile Leu Leu Glu Ala Cys Gly Ala Pro Ala Ser Arg Ile Ser Phe Val
260 265 270
Thr Asp Arg Lys Gly His Asp Arg Arg Tyr Ser Leu Asp Tyr Ser Lys
275 280 285
Ile Ala Gly Glu Leu Gly Tyr Arg Pro Arg Val Asp Phe Thr Asp Gly
290 295 300
Ile Ala Glu Thr Val Ala Trp Tyr Arg Ala Asn Arg Ser Trp Trp Thr
305 310 315 320
<210> 14
<211> 398
<212> PRT
<213> Artificial Sequence
<220>
<223> >AcbC (ACSP50_3607)
<400> 14
Met Ser Gly Val Glu Thr Val Gly Val His Ala Asp Ala His Arg Asp
1 5 10 15
Ser Trp Gln Val Arg Ala Gln Lys Gln Ile Thr Tyr Glu Val Arg Phe
20 25 30
Arg Asp Asp Val Phe Gly Leu Asp Ser Thr Asp Leu Leu Glu Ala Gly
35 40 45
Ala Asp Gly Ala Gly Ser Arg Arg Arg Phe Val Val Val Asp Ser Ala
50 55 60
Val Asp Ala Leu Tyr Gly Ser Arg Ile Arg Glu Tyr Phe Thr His His
65 70 75 80
Gly Ile Asp His Ser Ile Leu Val Met Arg Val Gly Glu Thr Val Lys
85 90 95
Asp Phe Asp Thr Ala Gly Arg Ile Val Ala Ala Met Asp Ala Phe Gly
100 105 110
Leu Ala Arg Arg Arg Glu Pro Met Ile Val Val Gly Gly Gly Val Leu
115 120 125
Met Asp Val Ala Gly Leu Val Ala Ser Leu Tyr Arg Arg Gly Thr Pro
130 135 140
Phe Leu Arg Val Pro Thr Thr Leu Val Gly Leu Ile Asp Ala Gly Val
145 150 155 160
Gly Ala Lys Thr Gly Val Asn Phe Asn Gly His Lys Asn Arg Leu Gly
165 170 175
Thr Tyr Ala Pro Ala Asp Leu Thr Leu Leu Asp Arg Arg Phe Leu Ala
180 185 190
Thr Leu Asp Arg Arg His Leu Ser Asn Gly Leu Ala Glu Met Leu Lys
195 200 205
Ile Ala Leu Ile Lys Asp Ala Glu Leu Phe Gln Leu Leu Glu Arg His
210 215 220
Gly Arg Val Leu Ile Glu Glu Arg Phe Gln Gly Arg Thr Gly Thr Gly
225 230 235 240
Asp Arg Ala Ala Val Arg Ala Leu Arg Ala Ala Thr His Gly Met Leu
245 250 255
Glu Glu Leu Gly Pro Asn Leu Trp Glu Ser Arg Leu Glu Arg Ser Val
260 265 270
Asp Tyr Gly His Thr Phe Ser Pro Thr Ile Glu Met Arg Ala Leu Pro
275 280 285
Ala Leu Leu His Gly Glu Ala Val Cys Val Asp Met Ala Leu Thr Thr
290 295 300
Val Leu Ala Tyr Arg Arg Gly Leu Leu Asp Val Ala Gln Arg Asp Arg
305 310 315 320
Ile Phe Ala Val Met Thr Ala Leu Gly Leu Pro Thr Trp His Pro Leu
325 330 335
Leu Thr Pro Glu Val Leu Glu Ala Ala Leu Gln Asp Thr Val Arg His
340 345 350
Arg Asp Gly Trp Gln Arg Leu Pro Leu Pro Val Gly Ile Gly Gly Val
355 360 365
Thr Phe Val Asn Asp Val Thr Ala Ala Glu Leu Gln Ala Ala Ala Leu
370 375 380
Met Gln His Arg Leu Ala Glu Asp Ala Leu Leu Leu Arg Ala
385 390 395
<210> 15
<211> 709
<212> PRT
<213> Artificial Sequence
<220>
<223> >AcbS (ACSP50_3596)
<400> 15
Met His Ile Ile Glu Thr Tyr Phe Glu Cys Gly Gly Phe Asp His Arg
1 5 10 15
Phe Ile Gln Gly Gly Thr Ser Val Tyr Leu Trp Gln Leu Ser Arg Gly
20 25 30
Leu Ala Asp Leu Gly His Arg Val Ser Ile Val Thr Pro Ala His Gly
35 40 45
Arg Leu Asp Asp Leu Arg Arg Leu His Glu Val Glu Asp Leu Pro Gly
50 55 60
Thr Asp Glu Tyr Glu Leu Pro Leu Val Leu Asp Pro Arg Val Trp Gly
65 70 75 80
Glu Arg Phe Pro Ala Gln Met Asp Ile Ala Leu Arg Thr Thr Ala His
85 90 95
Arg Ile Arg Leu Ala Gly Val Asp Leu Tyr Phe Leu Ser Asn Glu Leu
100 105 110
Leu Asp Gln Leu Pro Asp Arg Phe Tyr Pro Pro Tyr Glu Ser Lys Gly
115 120 125
Val Asp Leu Val Phe Phe Lys Pro Leu Ala Tyr Gln Val Ala Ala Ile
130 135 140
Arg Phe Ile Arg Ser His Phe Gly Asp Gln Arg Ala Ile Val His Ala
145 150 155 160
His Glu Pro Phe Tyr His Tyr Leu Met Pro Ala Ala Phe Ala Ala Asp
165 170 175
Pro Ala Lys His Val Val Ser Thr Val Gln Ser Asn Met Pro Ile Asn
180 185 190
Lys Ser Val Tyr Arg Ala Glu Val Ala Arg Leu Leu Gly Phe Leu Gly
195 200 205
Ala Pro Asn Ala Leu Pro Ala Asp Asp Pro Ala Gly Ser Arg Ser Pro
210 215 220
His Thr Val Ala Met Ser Gln Tyr Gln Gln Leu Thr His Leu His Tyr
225 230 235 240
Glu Tyr Pro Pro Asp His Val Arg Val Tyr Asp Leu Val Ala Glu His
245 250 255
Ala Asp Arg Ile Asp Phe Leu Ser Pro Gly His Arg Asp Tyr Tyr Thr
260 265 270
Cys Phe Ala Asp Thr Pro Phe Ala Gln Leu Phe Ala Thr Leu Pro Val
275 280 285
Ser Arg Thr Val Arg Arg Asn Ala Asp Lys Thr Phe Val Gly Gly Cys
290 295 300
Ala Val Gly Asp Glu Trp Val Thr Gly Glu Leu Pro Pro Val Asp Arg
305 310 315 320
Glu Lys Val Leu Ala Gly Leu Gly Leu Asp Pro Asp Leu Pro Ala Phe
325 330 335
Tyr His Asn Ala Arg Tyr Ala Val Asn His Lys Gly Gln Val Glu Leu
340 345 350
Ile Arg Ala Val Asp Arg Val Leu Ser Gly Gly Val Arg Ala Ser Phe
355 360 365
Ile Val Arg Cys Leu Ser Asp Ala Gly Ile Ala Asp Pro Leu Phe His
370 375 380
Glu Val Val Ala Arg His Pro Gly Arg Val Asn Leu Glu Trp His Arg
385 390 395 400
Val Pro Glu Asp Gln Leu Arg Glu Tyr Ala Arg Ala Ala Asp Phe Cys
405 410 415
Leu Phe Pro Ser Lys Phe Glu Met Asp Thr Phe Leu Ile Ala Gln Gly
420 425 430
Glu Ala Met Ala Ala Gly Ala Val Pro Ile Ala Thr Ala Gln Leu Gly
435 440 445
Met Ala His Phe Gly His Val Ala Asp Pro Leu Thr Gly Pro Asp Ala
450 455 460
Ala Thr Ala Thr Gly Phe Ala Val Asn Arg Ser Phe Ala Glu Asp Asp
465 470 475 480
Pro Leu Leu Val Gln Gly Leu Thr Glu Gln Ile Arg Arg Ala Val Thr
485 490 495
Leu Trp Asn Glu Gln Pro Gly Gln Tyr Arg Arg Leu Ser Ala Asn Ala
500 505 510
Val Ala Arg Ala Arg Glu Phe Thr Trp Arg Arg Ala Ala Gln Ala His
515 520 525
Glu Ala Ala Phe Ala Gly Val Trp Ala Gly Arg Thr Pro Arg Leu Pro
530 535 540
Val Gly Asp Leu Leu Arg Phe Gly Trp Phe Asp Glu Leu Pro Ala Asp
545 550 555 560
Ala Trp Thr Leu His Arg Asp Glu Ile Ala Glu Val Ala Leu Ala His
565 570 575
Gly Asp Ala Asp Ala Tyr Leu Arg Cys Arg Pro Asp Asp Leu Asp Ala
580 585 590
Leu Ala Ala Leu Phe Glu Arg Ala Trp Ala Arg Ala Asp Phe Pro Ala
595 600 605
Cys Ala Arg Thr Val Glu Leu Ala Glu Glu His Arg Gln Glu Arg Val
610 615 620
Pro Gln Trp Arg Ala Arg Leu Ala Gly Arg Gly Arg Ile Asp Arg Asp
625 630 635 640
Gly Arg Leu His Tyr Arg Pro Pro Ser Ala Glu Arg Val Glu Leu Val
645 650 655
Leu Pro Asp Leu Ala Glu Pro Leu Arg Gly Thr Val Thr Val Thr Ala
660 665 670
Met Ala Pro Thr Gly Asp Thr Phe Thr Gly Gln Leu Pro Ala Gly Thr
675 680 685
Arg Arg Ala Asp Leu Leu Leu Thr Leu Ser Asp Gly Arg Thr Val Trp
690 695 700
Asp Glu Val Thr Ala
705
<210> 16
<211> 357
<212> PRT
<213> Artificial Sequence
<220>
<223> >AcbW (ACSP50_3593)
<400> 16
Met Pro Gly Tyr Ala Arg His Ala Arg Pro Asp Gly Thr Thr Gly Met
1 5 10 15
Ile Val Ala Glu His Leu Ser Lys His Phe Lys Arg Tyr Arg Arg Glu
20 25 30
Pro Gly Leu Arg Gly Ser Leu Arg Thr Met Phe Ser Ala Arg Tyr Asp
35 40 45
Val Val Arg Ala Val Asp Asp Ile Ser Phe Glu Val Pro Ser Gly Val
50 55 60
Lys Ile Ala Tyr Ile Gly Ala Asn Gly Ala Gly Lys Ser Thr Thr Ile
65 70 75 80
Lys Leu Leu Thr Gly Ile Met Arg Pro Thr Thr Gly Arg Val Arg Val
85 90 95
Asp Gly Leu Asp Pro His Arg Gln Arg Thr Arg Val Ala Gly Arg Ile
100 105 110
Gly Val Val Phe Gly Gln Arg Ser Gln Leu Trp Trp Asp Leu Pro Val
115 120 125
Leu Asp Ser Phe Arg Ile Leu Arg His Val Tyr Glu Val Pro Gln Ala
130 135 140
Val Tyr Asp Arg Asn Met Arg Leu Phe Arg Asp Arg Leu Asp Leu Gly
145 150 155 160
Ala Leu Gly Asn Thr Pro Val Arg Gln Leu Ser Leu Gly Gln Arg Met
165 170 175
Arg Ala Glu Ile Ala Ala Ser Leu Leu His Asp Pro Ala Val Val Phe
180 185 190
Leu Asp Glu Pro Thr Ile Gly Leu Asp Leu Val Leu Lys Gln Ala Val
195 200 205
Arg Asp Leu Ile Asn His Ile His Ala Glu Leu Gly Thr Thr Val Met
210 215 220
Leu Thr Ser His Asp Ile Gly Asp Ile Thr Ser Ile Cys Asp Gln Ala
225 230 235 240
Leu Val Val Asp Arg Gly Thr Ile Val His Gln Gly Thr Met Arg Asp
245 250 255
Leu Leu Arg Ser Val Asp Thr Arg Ala Val Thr Phe Glu Tyr Ala Ala
260 265 270
Gly Ser Val Ser Glu Ala Ala Ala Leu Arg Ile Ile Thr Glu Gly Leu
275 280 285
Pro Glu Val Asp Ala Thr Pro Ala Glu Ser Gly Arg Ile Arg Val Glu
290 295 300
Phe Pro Val Asp Arg Trp Ser Ala Arg Gln Val Ile Ala Phe Leu Leu
305 310 315 320
Asp Arg Phe Asp Leu Ser Asp Val Leu Val Pro Asp Ala Asp Leu Glu
325 330 335
Thr Leu Leu Arg Arg Ile Tyr Ala Gly Ser Arg Pro Glu Pro Val Thr
340 345 350
Ala Gly Asp Gly Ala
355
<210> 17
<211> 267
<212> PRT
<213> Artificial Sequence
<220>
<223> >AcbX (ACSP50_3592)
<400> 17
Met Ile Arg Ala Ala Arg Arg Tyr Ala Pro Phe Ala Leu Ala Gly Leu
1 5 10 15
His Ala Val Thr Arg Tyr Arg Ser Thr Ile Val Leu Ser Ala Leu Thr
20 25 30
Ala Ala Ala Ala Thr Ser Leu Gln Val Phe Leu Trp Arg Ala Val Tyr
35 40 45
Ala Gly Gly Pro Ala Pro Ala Gly Leu Pro Phe Ala Gln Leu Thr Ser
50 55 60
Tyr Ile Val Leu Ala Gln Val Leu Gly Met Leu His Thr Asn Arg Ile
65 70 75 80
Asp Glu Met Ile Ala Gly Glu Val Tyr Arg Gly Asp Ile Ala Val Ser
85 90 95
Leu Val Arg Pro Ala Asn Tyr Ala Leu Ser Cys Leu Ala Val Asn Leu
100 105 110
Pro Thr Ala Ala Leu Ser Ala Leu Leu Ala Gly Ala Pro Val Leu Ala
115 120 125
Gly Phe Ala Met Phe Ala Ser Leu Pro Ala Pro Pro Pro Ala Asn Leu
130 135 140
Leu Leu Phe Ala Val Ala Leu Leu Leu Ser Val Ile Leu Ala Phe Glu
145 150 155 160
Ile Asn Phe Leu Val Gly Leu Ala Ala Phe Val Thr Thr Asn Thr Trp
165 170 175
Gly Ile Arg Thr Ile Lys Asn Ala Leu Val Ala Phe Leu Ala Gly Gln
180 185 190
Val Val Pro Leu Ala Leu Phe Pro Asp Gly Val Ala Arg Leu Leu Arg
195 200 205
Leu Leu Pro Phe Gln Gly Leu Ile Asp Ser Pro Leu Arg Leu Leu Leu
210 215 220
Gly Gly Tyr Ser Gly Gly Ser Gly Ala Ala Ala Ile Leu Gly Val Gln
225 230 235 240
Ala Leu Trp Ala Val Leu Leu Tyr Gly Val Leu Ala Leu Ala Trp Asn
245 250 255
Arg Ser Leu Arg Arg Val Glu Val Leu Gly Gly
260 265
<210> 18
<211> 267
<212> PRT
<213> Artificial Sequence
<220>
<223> >AcbY (ACSP50_3591)
<400> 18
Met Thr Val Ser Thr Ala Arg Arg Tyr Leu Arg Leu Thr Ala Val Leu
1 5 10 15
Cys Gly Ala Ser Leu His Arg Leu Thr Ala Tyr Arg Met Asp Phe Leu
20 25 30
Ile Gly Ala Ala Ser Phe Val Ile Arg Ile Ala Cys Gln Ile Ala Leu
35 40 45
Ile Gly Val Ile Phe Gln Tyr Val Pro Ala Leu Gly Gly Trp Thr Arg
50 55 60
Gln Gln Ala Leu Phe Leu Leu Gly Phe Ser Leu Leu Pro Arg Gly Leu
65 70 75 80
Asp Arg Leu Phe Thr Asp Gln Leu Trp Ile Leu Ala Trp Gln Leu Val
85 90 95
Arg Thr Gly Asp Phe Phe Arg Tyr Leu Ile Arg Pro Val Asn Pro Phe
100 105 110
Tyr Ala Leu Leu Ser Glu Arg Phe Leu Tyr Pro Asp Gly Phe Gly Glu
115 120 125
Leu Ala Thr Gly Ile Ala Ile Val Val Thr Ala Ala Gly Thr Met Asp
130 135 140
Leu His Leu Thr Val Ala Gln Trp Leu Leu Leu Leu Pro Leu Val Leu
145 150 155 160
Gly Gly Ala Leu Ile His Thr Phe Leu Lys Ala Phe Leu Ala Ser Leu
165 170 175
Ser Phe Trp Met Thr Ser Ser Leu Asn Val Met Val Ala Val Asn Gln
180 185 190
Leu Ser Glu Phe Thr Ala Tyr Pro Leu Asn Leu Tyr His Pro Val Leu
195 200 205
Arg Gly Val Leu Thr Trp Val Leu Pro Phe Ala Phe Thr Ala Tyr Leu
210 215 220
Pro Val Arg Tyr Leu Leu Thr Gly Asp Ala Gly Pro Leu Leu Trp Met
225 230 235 240
Leu Pro Val Thr Thr Leu Thr Val Leu Leu Gly Tyr Gly Thr Phe Arg
245 250 255
Leu Gly Leu Arg Arg Tyr Glu Met Pro Gly Ser
260 265
<210> 19
<211> 303
<212> PRT
<213> Artificial Sequence
<220>
<223> >GtaB GalU (ACSP50_7820)
<400> 19
Met Thr Thr Asn Ala Gln Gly Ser Gly Lys Arg Ala Val Lys Ala Val
1 5 10 15
Ile Pro Ala Ala Gly Leu Ala Thr Arg Phe Leu Pro Ala Thr Lys Ala
20 25 30
Val Pro Lys Glu Leu Leu Pro Val Val Asp Arg Pro Val Leu Gln Tyr
35 40 45
Ile Val Glu Glu Ala Ala Ala Ala Gly Ile Thr Asp Val Leu Leu Val
50 55 60
Thr Gly Arg Gly Lys Thr Ser Met Val Asp His Phe Asp Arg Arg Pro
65 70 75 80
Asp Val Glu Gln Arg Leu Glu Glu Lys Gly Asp Thr Glu Arg Leu Ala
85 90 95
Ala Val Arg Arg Thr Ser Glu Leu Ala Asp Ile Tyr Thr Cys Arg Gln
100 105 110
Gly Glu Pro Leu Gly Leu Gly His Ala Val Gly Thr Ala Ala Ser His
115 120 125
Val Gly Asp Asn Pro Phe Ala Val Leu Leu Gly Asp Glu Phe Val Glu
130 135 140
Glu Gly Ser Pro Leu Leu Pro Asp Met Leu Asp Leu Gln Ala Arg Thr
145 150 155 160
Gly Gly Ile Val Leu Ala Phe Ile Glu Val Thr Pro Glu Glu Thr Ser
165 170 175
Arg Tyr Gly Ile Ala Ser Val Arg Glu Ser Asp Leu Gly Glu Gly Val
180 185 190
Val Glu Val Thr Gly Leu Val Glu Lys Pro Ser Pro Glu Glu Ala Pro
195 200 205
Ser Asn Leu Ala Val Val Gly Arg Tyr Val Leu Pro Gly Arg Ile Phe
210 215 220
Glu Thr Ile Ala Gly Thr Lys Pro Gly Ser Gly Gly Glu Ile Gln Leu
225 230 235 240
Thr Asp Ala Met Ala Thr Leu Leu Ala Glu Gly Thr Pro Val His Gly
245 250 255
Ile Val Tyr Arg Gly Val Arg Tyr Asp Thr Gly Gln Pro Leu Gly Tyr
260 265 270
Leu Gln Thr Val Val Gln Leu Ala Ala Gln Arg Pro Asp Leu Gly Ala
275 280 285
Glu Phe Arg Ala Trp Leu Thr Asp Phe Val Gly Gly Gln Lys Gly
290 295 300
<210> 20
<211> 149
<212> PRT
<213> Artificial Sequence
<220>
<223> >Cgt (ACSP50:5024)
<400> 20
Met Asn Arg Thr Thr Val Arg Ala Gly Val Leu Ala Thr Ala Leu Ile
1 5 10 15
Ser Gly Val Leu Gly Val Ala Gly Pro Ala Leu Ala Ala Pro Val Thr
20 25 30
Asp Ala Ala Pro Val Ala Ala Ala Gly Thr Ala Val Ala Pro Ile Ala
35 40 45
Ala Thr Phe Asn Val Thr Ala Gly Phe Thr Ser Trp Gly Gln Asn Val
50 55 60
Tyr Val Val Gly Ser Ile Pro Ala Leu Gly Ser Trp Asp Val Ser Lys
65 70 75 80
Ala Val Pro Leu Thr Thr Thr Ser Ser Ala Phe Pro Thr Trp Thr Gly
85 90 95
Ser Val Ala Leu Pro Ala Asn Thr Tyr Thr Glu Phe Gln Tyr Val Val
100 105 110
Lys Asn Ala Asp Gly Ser Val Ala Arg Trp Glu Lys Gly Phe Gln Gln
115 120 125
Asn Arg Thr Thr Ile Thr Pro Pro Thr Gly Thr Tyr Val Thr His Asp
130 135 140
Thr Phe Gly Ala Tyr
145
<210> 21
<211> 504
<212> PRT
<213> Artificial Sequence
<220>
<223> >CrtI (ACSP50_0147)
<400> 21
Met Met Lys Pro Pro Thr Pro Trp Ser Arg Gly Val Arg Thr Val Thr
1 5 10 15
Gly Pro Thr Asp Arg Val Val Ile Val Gly Ala Gly Leu Ala Gly Leu
20 25 30
Ser Cys Ala Leu His Leu Ala Ala Ala Gly Arg Gln Val Thr Val Val
35 40 45
Glu Arg Glu Pro Val Pro Gly Gly Arg Ala Gly Arg Leu Ser Val Gly
50 55 60
Gly Tyr Asp Phe Asp Thr Gly Pro Thr Val Leu Thr Met Pro Glu Leu
65 70 75 80
Ile Ala Glu Pro Leu Ala Ala Val Gly Glu Asn Leu Ser Asp Trp Leu
85 90 95
Glu Leu Thr Pro Leu Asp Pro Ala Tyr Arg Ala Tyr Tyr Pro Asp Gly
100 105 110
Ser Thr Leu Asp Val Arg Thr Asp Thr Thr Arg Met Ala Ala Glu Ile
115 120 125
Ala Gln Val Cys Gly Ala Arg Glu Ala Asp Gly Tyr Leu Arg Phe Val
130 135 140
Asp Tyr Thr Arg Arg Leu Trp Gln Leu Glu Arg Asp His Phe Ile Asp
145 150 155 160
Arg Asn Leu Asp Ser Pro Leu Asp Leu Leu Asn Leu Asn Leu Leu Lys
165 170 175
Leu Leu Gly Met Gly Ala Phe Gly Arg Leu Gln Pro Lys Ile Asn Glu
180 185 190
Phe Phe Arg Asp Pro Arg Thr Gln Arg Ile Phe Ser Phe Gln Ala Met
195 200 205
Tyr Ala Gly Leu Ala Pro His Asp Ala Met Ala Ile Tyr Ala Val Ile
210 215 220
Ala Tyr Leu Asp Ser Val Ala Gly Val Tyr Tyr Pro Lys Gly Gly Met
225 230 235 240
His Ala Val Pro Lys Ala Leu Ala Gly Ala Ala Glu Lys His Gly Val
245 250 255
Thr Phe Arg Tyr Asp Thr Thr Val Glu Arg Val Leu Thr Gln His Gly
260 265 270
Arg Ala Thr Gly Val Val Thr Val Gly Gly Asp Val Ile Glu Ala Asp
275 280 285
Thr Val Val Leu Asn Pro Asp Leu Pro Ile Ala Tyr Arg Asp Leu Leu
290 295 300
Pro Ala Arg Asn Ser Arg Asn Leu Arg Phe Ser Pro Ser Cys Val Val
305 310 315 320
Leu His Ile Gly Ser Ser Gln Arg Tyr Ser Lys Ile Ala His His Asn
325 330 335
Ile His Phe Gly Thr Thr Trp Arg Arg Thr Phe Asp Glu Val Ile Asn
340 345 350
Arg Gly Leu Leu Met Ser Asp Pro Ser Leu Leu Val Thr Asn Pro Thr
355 360 365
His Thr Asp Pro Ser Ala Ala Pro Asp Gly Lys Gln Thr Tyr Tyr Val
370 375 380
Leu Ala Pro Ala Pro Asn Leu Val Ser Gly Pro Met Asn Trp Arg Gly
385 390 395 400
Gly Leu Ala Glu Arg Tyr Ala Asp Glu Leu Leu Arg Thr Leu Glu Gln
405 410 415
Arg Gly Tyr Ile Gly Phe Arg Asp Gly Val Glu Val Glu Arg Ile Ile
420 425 430
Thr Pro Ala Asp Trp Ala Asp Asp Gly Met Ala Ala Gly Thr Pro Phe
435 440 445
Ala Ala Ala His Thr Phe Ala Gln Thr Gly Pro Phe Arg Pro Ala Asn
450 455 460
Leu His Pro Thr Leu Pro Asn Val Val Phe Thr Gly Ser Gly Thr Gln
465 470 475 480
Pro Gly Val Gly Val Pro Met Val Leu Ile Ser Gly Lys Leu Ala Ala
485 490 495
Ser Arg Ile Thr Gln Gly Ala Ser
500
<210> 22
<211> 419
<212> PRT
<213> Artificial Sequence
<220>
<223> >MerR (ACSP50_0145)
<400> 22
Met Ala Gly Glu Ala Leu Ser Ala Glu Ile Pro Thr Ser Pro Gly Ser
1 5 10 15
Ser Val Ala Ser Ser His Asp Ile Pro Ala Thr Ala Gly Pro Gly Ala
20 25 30
Val Arg Thr Gly Pro Val Ala Ala Ala Pro Gly Gly Pro Ser Asp Thr
35 40 45
Pro Leu Thr Asp Ala Thr Ala Ala Ala Ser Gly Ala Ala Asp Asp Ala
50 55 60
Ser Arg Ala Arg Pro Ala Thr Ala Thr Asp Asp Ala Ser Arg Thr Gly
65 70 75 80
Pro Ala Thr Ala Ala Thr Asp Ser Pro Asp Asp Ala Val Arg Thr Gly
85 90 95
Val Ala Asp Ala Ala Pro Ala Gly Arg Ala Gly Asp Val Ala Leu Ser
100 105 110
Ala Gly Ala Ala Ala Arg Arg Leu Gly Val Ala Val Thr Thr Leu Arg
115 120 125
Thr Trp His Gln Arg Tyr Gly Leu Gly Pro Ser Arg His Glu Pro Gly
130 135 140
His His Arg Arg Tyr Thr Ala Glu Asp Met Asp Arg Leu Gln Val Met
145 150 155 160
Gln Arg Leu Thr Thr Gln Gly Val Ala Pro Ala Glu Ala Ala Ala Trp
165 170 175
Ala Arg Ser Arg Pro Leu Thr Pro Pro Glu Pro Gly Ala Ala Leu Tyr
180 185 190
Asp Pro Thr Ala Val Ala Ser Pro Pro Thr Pro Ala Ala Pro Gly Gln
195 200 205
Pro Pro Val Gly Pro Ala Gly Arg Gly Thr Arg Pro Thr Arg Gly Pro
210 215 220
Ala Pro Ala Ala Arg Gly Leu Thr Arg Ala Ala Met Arg Leu Asp Val
225 230 235 240
Arg Gly Met Arg Asp Ile Leu Cys Ser Thr Leu His Asp Arg Gly Val
245 250 255
Ile Pro Ala Trp Thr Glu Val Met Val Pro Ala Leu Ala Ala Ile Gly
260 265 270
Asp Arg Tyr Glu Ala Thr Arg Arg Phe Val Glu Val Glu His Leu Leu
275 280 285
Ser Arg Ala Val Thr Glu Ile Leu Ala Ser Val Pro His Pro Ala Gly
290 295 300
Ser Pro Arg Val Leu Leu Ala Ala Ala Asp Glu Glu Gln His Thr Leu
305 310 315 320
Pro Leu Glu Ala Leu Ala Ala Ala Leu Ala Glu Gly Gly Val Pro Ser
325 330 335
Arg Leu Phe Gly Ala Arg Val Pro Ser Gln Ala Leu Leu Asp Ala Ile
340 345 350
Ala Arg Thr Gly Pro Ala Ala Val Val Leu Trp Ser Gln Arg Pro Ala
355 360 365
Thr Gly Ile Val Thr Gln Leu Thr Arg Val Arg Asp Ile Pro His Pro
370 375 380
Pro Leu Val Ile Ala Ala Ala Gly Pro Gly Trp Pro His Asp Leu Pro
385 390 395 400
Ser Gly Ile Thr Arg Leu Thr Gly Leu Thr Glu Ala Val His Leu Leu
405 410 415
Ala Thr Val
<210> 23
<211> 1923
<212> DNA
<213> Artificial Sequence
<220>
<223> >dxs (ACSP50_7096)
<400> 23
atgagcgact ccccttcgac cccggccggc ctgctggcga gcgtcaccgg tcccggtgct 60
ctcaagcgac tgtccgcgga gcagctgacc ctgctcgcgg ccgagatccg tgacttcctc 120
gtggccaagg tgtcgaagac cggggggcac ctcggaccga acctgggcgt ggtcgagatg 180
accctcgcca tgcaccgggt cttcgactcg ccgcgcgaca agatcctctt cgacaccggc 240
caccaggcgt acgtgcacaa gatcgtcacc ggccggcagg acggtttcga cctgctccgc 300
cagcggggtg gcctgaccgg ctacccgagc caggcggaga gcgagcacga cctcatcgag 360
aactcgcacg cctccaccgc gttgtcctac gccgacggcc tggccaaggc gttcgcgctg 420
cgcggcgagg accggcacgt ggtggccgtg gtcggcgacg gcgcgctcac cggcggcatg 480
tgctgggagg cgctcaacaa catcgccgcc acgaagaaca ggctggtcat cgtcgtcaac 540
gacaacggtc ggtcgtacgc gccgacgatc ggcggcctgg ccgaccacct ctccacgctg 600
cggctcaacc ccggctacga gaaggtgctc gacctggtca aggacgcgct cggctcgacc 660
ccgctggtcg gaaagccggt cttcgaggtg ctgcacgcgg tcaagcgcgg gatcaaggac 720
gcggtcagcc cgcagccgat gttcgaggac ctcggcctga agtacatcgg gccggtcgac 780
ggtcacgacc agcaggcgat ggagtccgcg ctgcgccggg ccaaggggtt caacgcgccg 840
gtgatcgtgc acgcggtgac ccgcaagggc tacggctacc gtcccgccga gcaggacgag 900
gcggactgcc tgcacggccc gggcgccttc gacccgcaga ccggcgcgct caccgccaag 960
ccgtcgctca agtggaccaa ggtcttcgcc gaggagctgg tgaagatcgc cgacgaacgc 1020
cccgacgtgg tgggcatcac ggccgccatg gccgagccga ccggcatcgc cgctctcgcc 1080
aagaagtacc ccgaccgggc gtacgacgtg ggcatcgccg agcagcacgc cgcgaccagc 1140
gccgcgggcc tggcgatggg cggcctgcac ccggtggtgg cggtctacgc caccttcctg 1200
aaccgcgctt tcgaccaggt gctgctggac gtcgcgatgc atcggctgcc ggtgaccttc 1260
gtgctggacc gggccggcat caccgggccg gacggcccca gccactacgg catctgggac 1320
atgagtgtct tcggcgccgt ccccggcctg cgcatcgccg ccccgcggga cgccgccacc 1380
ctgcgcgagg aactgcgcga ggcggtcgcg gtcgacgacg gcccgaccat cgtgcggttc 1440
ccgaccggtg cggtcgccgc ggacaccccg gcggtgcgcc gggtcggtca ggtcgacgtg 1500
ctgcgcgagg cggagaagaa ggacatcctg ctggtcgcgg tcggctcgtt cgtcggcctc 1560
gggctggacg ccgccgagcg gctcgccgag caggggtacg gcgtgaccgt ggtcgacccg 1620
cgctgggtgc gcccggtgcc gatcgagctg accggcctgg ccgcccagca ccgcctggtg 1680
gtgaccctgg aggacgggat ccgcgccggt ggtgtcggtg acgcggtggc cgccgcgctg 1740
cgcgacgccg gggtgcacgt gccgctgcgc gatttcggcg tgccggccgg tttccacccg 1800
cacggcaccc gggccgagat cctcgcctcg ctgggtctga ccgcgcagga cgtcgcgcgg 1860
gacgtgaccg gctgggtgtc cggcctggac gccggcacgt cggtggcggc cccggcgatc 1920
tga 1923
<210> 24
<211> 1173
<212> DNA
<213> Artificial Sequence
<220>
<223> >ispG (ACSP50_7248)
<400> 24
gtgaccgcga tcagtctcgg aatgccggcc gtccccccgc cgccgctggc cccgcgccgc 60
cagagccggc agatcaacgt cggaggagtc ctggtcggcg ggggcgcccc ggtcagcgtc 120
cagtcgatga ccaccaccct cacctccgac gtcaacgcga ccctgcagca gatcgccgag 180
ctgaccgcgg ccggctgcca gatcgtccgg gtcgccgtgc cgtcccagga cgacgtcgag 240
gcgctgccgg cgatcgccaa gaagtcgcag atcccggtga tcgccgacat ccacttccag 300
cccaagtacg tgttcgccgc gatcgacgcg ggctgcgcgg cggtccgggt caatccgggc 360
aacatccgcc agttcgacga caaggtcaag gagatcgccc gggccgcgtc cgacgccggc 420
gtgccgatcc ggatcggggt caacgccggc tcgctcgaca agcggcttct cgagaaatac 480
ggcaaggcca ccgccgaggc gctggtggag tcggcgctct gggagtgctc gctgttcgag 540
gagcacggtt tccgggacat caagatctcg gtcaaacaca acgatccggt cgtgatgatc 600
cgcgcctacc gtcagctcgc cgagcagtgc gactacccgc tgcacctggg cgtgaccgag 660
gccgggccgg ccttccaggg cacgatcaag tcggcggtgg cgttcggcgc gctgctcgcc 720
gaggggatcg gcgacaccat ccgggtctcg ctgtccgcgc cgccggtcga ggagatcaag 780
gtcgggcagc agatcctgga gtcgctcggc ctgcgcgaac gcggcctgga gatcgtctcc 840
tgcccgtcct gcgggcgggc ccaggtcgac gtctacacgc tggccgagca ggtgaccgcg 900
gcgctcgacg ggttcccggt gccgctgcga gtggccgtga tgggctgcgt cgtgaacggg 960
cccggggagg ctcgcgaggc cgacctcggg gtcgcctccg gcaacggcaa ggggcagatc 1020
ttcgtcaagg gcaaggtgat caagacggtg ccggaggcgg tgatcgtcga gacgctggtc 1080
gaggaggcgc tgcggctcgc cgacgagatg ggcgcggagc tgcccgacga gctgcgcgag 1140
ctgctgcccg gtcccacggt caccgtgcac tag 1173
<210> 25
<211> 1200
<212> DNA
<213> Artificial Sequence
<220>
<223> >dxr (ACSP50_7250)
<400> 25
atgcgtgagc ttgtgctgct ggggtcgacc gggtccatcg gcacccaggc catcgatatc 60
gtccggcgca acccggagct gttccgggtg gtcgcgatcg gggccggggg tggcaacgtc 120
gcgttgctcg cggcgcaggc gctggagctg ggcgtcgagg tggtcggggt ggcccgggcc 180
tcggtcgtgc aggatctgca gctggccttc tacgccgagg cgcagaagcg tggctggtcg 240
tccggcgact tcaaactgcc gaagatcgtg gccgggccgg acgcgatgac cgagctggcc 300
cgctggccgt gtgacgtcgt tctcaacggg gtggtcggca gcctcggcct ggcgccgacc 360
ctggccgctc tggagtccgg gcggatcctt gcgctggcca acaaggagtc gctggtcgcc 420
ggcggcccgc tggtccggcg gatcgccaag gacgggcaga tcgtcccggt cgactcggag 480
cattcggcgc tggcccagtg cctgcgcggc gggcgggccg cggaggtgcg ccggctggtg 540
ctgaccgcca gcgggggagc cttccgcggg cggcggcgcg cggagctgac gaacgtcacc 600
cccgaggagg cgctcaagca cccgacctgg gacatggggc cggtcgtcac gatcaactcg 660
gcgaccatgg tgaacaaggc gctggaagtg atcgaggcgc acgagctgtt cggcgtgccg 720
tacgacgaca tcgcggtgat ggtgcacccg cagtcggtgc tgcattcgct ggtcgagttc 780
accgacggct cgacgctggc ccaggccagc ccgccggaca tgcggctgcc gatcgcgctg 840
gcgctggcct ggccggaccg ggtgccgggg gcggccgccg cggtggactg gacgctggcg 900
cacaactggg agctgcgacc gctggacgac gaggcgttcc cggcggtcga gctggccaag 960
gcggccggcc ggtacggtcg ctgccgtccg gcgatcttca acgccgccaa cgaggagtgt 1020
gtggccgctt tcgccgccgg tcggctacct ttcttgggca tcgtcgacac cctggaacgg 1080
gtgctcgcgg cggccccgga tttcgcggag ccgagtaccg tcgatgacgt gctggccgca 1140
gaatcctggg cgcgtgccca ggcacagcgg acgatcgcga ctgtggctga aggagcctga 1200
<210> 26
<211> 963
<212> DNA
<213> Artificial Sequence
<220>
<223> >ispH (ACSP50_7707)
<400> 26
gtgttgctcg ccaagccgcg tggttactgc gccggtgtcg accgcgccgt gcagaccgtc 60
gaggaggcgc tgaaactcta cggcgccccg gtctacgtgc gtaagcagat cgtgcacaac 120
aagcacgtgg tcagcacgct ggaggcccgc ggcgcgatct tcgtcgagga gaactacgag 180
gtgcccgagg gcgccaccgt ggtgttctcc gcgcacggcg tcgcccccga ggtgcacgac 240
caggcccgcg agcgccggct caaggcgatc gacgcgacct gcccgctggt caccaaggtg 300
caccacgagg cgaaacggtt cgccgccgag gactacgaca tcctgctgat cggtcacgag 360
gggcacgagg aggtcatcgg cacctccggc gaggccccgg cgcacatcca gctcgtcgac 420
ggccccgacg acgtggcgaa cgtcgtcgtc cgcgacccgg ccaaggtcgt ctggctgtcg 480
cagaccacgc tgtcggtgga cgagacgatg gagacggtgg cccggctcaa gacccggctg 540
ccgctgctgc agtcgccgcc cagcgacgac atctgctacg ccacctcgaa ccggcagcac 600
gtgatcaagg agatcgcgcc ggagtgcgac gtggtgatcg tggtcggctc gaccaactcg 660
tcgaactcgg tccgcctggt cgaggtcgcc ctcggtgccg gcgcccgggc cggtcacctc 720
gtcgactacg ccgccgagat ccaggacgag tggctggccg gcgccaccac ggtcggtgtc 780
tcctccggcg ccagcgtgcc ggacgagctg gtgatggagg tgctggcgca cctcgcggag 840
cgtggcttcg gcgaggtcac cgagttcacc acggccgagg agcggctcac cttctccctc 900
ccgcaggagc tccgcaagga catgaaggcc gccgaggcgg cccgggccgc tgccgccggc 960
tga 963
<210> 27
<211> 948
<212> DNA
<213> Artificial Sequence
<220>
<223> >ispE (ACSP50_7802)
<400> 27
atgaccgagg cgtggggtcc ggacgacgac gagccgcgcc cgtacagcgg cccggtcaag 60
gtccgcgtgc cggccaaaat caacctgcac ctcgcggtcg gcccgctgcg acccgacggc 120
taccacgagc tgaacaccgt ctaccacgcc atctcgctgt tcgacgagat caccgcccgg 180
cacggcgaca ccctcaccct caccatggag ggcgagggca ccggcgacct cgccctcgac 240
gagaccaacc tgatcatccg cgccgcccgc gccctggccg cccgcgcccg cgtccccgcc 300
tacgcccggc tgcacctgcg caagagcatc ccgctcgccg gcggcctggc cggcggcagc 360
gccgacgccg ccgccaccct gatcgcctgc gacctgctct ggggcctcgg catgagccgc 420
gacgagctcg ccgaggtcgg cgcccaactc ggctccgaca tccccttcct gctgcacggc 480
ggcaccgccc tcggcaccgg ccacggcgag gcggtcagcc ccatcctggc ccgccccacc 540
acctggcact ggaccgtcgc catcgccgac ggcggcctgg ccacccccgc cgtctaccgc 600
gagctcgaca ccctgcgcgc cggcacctgg ccacccactc cgctcggcag cgccgacacc 660
ctgatggccg ccctgcgcca gcgcaacccg gaaatcctcg gcgccgccct cggcaacgac 720
ctgcaaccgg ccgccctcgc cctgcgcccc cagctcgccg acgtgctcaa agccggcacc 780
gaggccggcg ccctcgccgg cctcgtctcc ggctccggcc ccacctgcgt cttcctcgcc 840
gccgacgcca cacacgccca ggagatcgcc gacagcctca ccgaagccgg cgtctgccgg 900
gccgcggtca ccgcccgcgg accccagccc ggcgcgcggg taatctag 948
<210> 28
<211> 489
<212> DNA
<213> Artificial Sequence
<220>
<223> >ispF (ACSP50_8046)
<400> 28
gtgatcattc cgcgggtggg tatcggcacg gacgtgcacg cattcgacgc tgaccgggcc 60
tgctgggtgg ccgggctgga gtggccgggg gagccggggc tggccgggca ctcggacgcg 120
gacgtggtgg cccacgcggc ctgtgacgcg ctgctgtcgg cggccgggct cggggatctg 180
gggggcaact tcgggacgag ccggccggag tgggccgggg cagccggggt cacgctgctc 240
gccgagacgg cgcggctggt ccgggcggcc gggttcgcga tcggcaacgt gtcggtgcag 300
gtgatcggga accggccgaa gatcgggaag cggcgggccg aggccgagaa ggtgctctcc 360
gcggcggtgg gggcgccggt caccgtgtcc gggaccacat ccgacgggct ggggctcacc 420
gggcgtggtg aggggctggc cggagtcgcg gtggcgatgg tctacacgga gaacgctctt 480
ccggcctga 489
<210> 29
<211> 732
<212> DNA
<213> Artificial Sequence
<220>
<223> >ispD (ACSP50_8047)
<400> 29
gtgatcgccg accgcgacgt gaccgcgcag ctcaatgctc gcggtgacgt cgcggtcgtc 60
gttccggcgg cgggggcggg tctccggctc ggcccgggcg gcccgaaagc tctgcgtctg 120
ctcgacggcg agccgctgct cgtgcacgcg gtccggcggt tggccgcggc cgcgccggtc 180
cgcatgatcg tggtggccgc tccgcccgcc gaggtcgacg cggtgtccgc gctcctcgcc 240
ccggtggccc cggtcaccgt cgtgcccggc ggcgccgaac gccaggaatc ggtcgccgcg 300
gcactcgcgg tcgttccgcc ggacgttccg atcgttctgg tccacgacgc ggctcgatgc 360
ctcaccccgc cctcggttac ggagcgtgtc gccgccgctg tccgggacgg tgccgacgcg 420
gtgatcccgg tcctgccggt cgtcgacacg atcaaagagg tcgcggccga tgccaccgtt 480
ctcggcacgg tcgaccgttc cgtgctgcgt gcggtacaga ctccgcaagg cttccgcgcc 540
tcggtgctgc gcgccgctca ccgggccgcc gccgactcac acaccgacga cgccggtgcc 600
gtcgagaagc tcggcatccc ggtcctgtgc gtcccgggct ccgacctcgc gctcaagatc 660
acccggccga tcgatctggc gctcgccacg cacctcctgg ccctgccgga cccggacgcc 720
cctaccgcct ga 732
<210> 30
<211> 585
<212> DNA
<213> Artificial Sequence
<220>
<223> >idi (ACSP50_0146)
<400> 30
atgagcagca tcggtcacct caaccgtgaa gatcatctcg tcgagctcgt caacgaggag 60
gggcagccgc tcgggtcggc caccgtctcc gacgcccacc tctcgccggg tgcgctgcac 120
cgggccttct cggtcttcct caccgacgat gagggccggg tgctgctcca gcagcgggcc 180
gcggccaaaa cccgcttccc gctccgctgg ggcaacacct gctgcggcca ccccgcgccc 240
ggcgagccgg tcacggtcgc cgcggcgcgg cgtctcaccg aggaattggc ggtacgtgac 300
gtcacgctga ccgagatcgg cgtgtacacc taccgcgcga ccgacccggt caccggccgg 360
gtggagcacg aatacgacca cgtgctgatc ggcgccctgc cggacggcgt cgtgccacac 420
cccgatccgg cggagatcgc cacgctgcgc tgggcctcgc tgcccgggct gcgcaccggg 480
ttgacggagt cccccgagct gtacgcgccc tggctccccg gggtgttcga gattctcacg 540
gagcggtcgg gtgtcctttc cacggagcgg tcgggtggcc ggtga 585
<210> 31
<211> 1071
<212> DNA
<213> Artificial Sequence
<220>
<223> >crtE ldsA (ACSP50_0148)
<400> 31
gtggccaatg acaccctcga gggaaatcgc cttgccgcga taccccggca gtccgtctct 60
cacactgggc tggtcggtgc agtcgagggg acgctcgccg acttcctcgc ctcccagatc 120
gcctctctcg acgccgtcga cccatcgctc ggtggcttcg gccgcaccgc ccgtgacctg 180
gtgatggccg gcggcaaacg gctgcggccg acgttcgcgt actggggctg gcgcggcgtc 240
gccgggccgg ccgcggacgc cgagacgctg ctgcccgcgc tcggcgcgct ggagctgatg 300
cacaccttcg cgctcgtcca cgacgacgtg atggacgact cgtccacccg ccgcggccgg 360
cccaccgccc accggatctt cgcggcccag cacggcggcc ggttcggcac gtcggccgcg 420
atcctggtcg gcgacctctg cctggtctgg gccgaccagc tgttggcccg caccccggtg 480
ccggcggcca ccctgcttgc agtccgcgcg cattacgacc ggatgcggat cgaggcggtc 540
gccgggcagt atctggacgt cctcggtgag accgatccgg cgtcctggtc ggtggagcgc 600
gcactgctgg tcgcccggca caagaccgcc agctacaccg tgcagcggcc gctcgacttc 660
ggcctggccc tggccggggt cgaggacgtg gaggtcgccg aggcgtaccg gacctacggc 720
atcgccgtcg gcgaggcctt ccagctgcgc gacgacctgc tcggtgtcta cggcgacccg 780
gcggtgaccg gcaaaccggt cagcgacgac ctgcgcaccg gcaaaccgac cgcactgctg 840
atgctggccc gtcggatggc cacccccggc cagctggccg agctggagtc ggcggagatc 900
gagcgcaagg cgcaggtcgt cgccgagacc ggcgccccgg cccgggtcga ggagatgatc 960
cgtgcccggg tcaccgaagg actgaccgcg ctggcctcgg cgccgatcga cgccgaggcc 1020
cgtgccaccc tgatcgagct ggccaccgtg gcgacgcagc gcccggcatg a 1071
<210> 32
<211> 888
<212> DNA
<213> Artificial Sequence
<220>
<223> >crtB (ACSP50_0149)
<400> 32
atggaaaccg atctggccgc cgcctatgag cggtgccgtg agctacaccg agagcacgga 60
cgcacgtact acctggcgac ccggttacta ccggcctgga agcgccggca tgtgcacgct 120
ctgtatggat tcacccggtt cgccgacgag atcgtcgacc gcaccgaggc gcaaccaccc 180
gccgagcgcg ccgccgagct ggccacctgg tccgccggat tcctcgccgg actgcgcggc 240
gagccggtcg acgacccgct gctcccggcc gtgctgcaca ccatcgcggt cttcgggctc 300
gacctggagg acttcgcgaa gttcctgcgc agcatggaga tggacctcac cgtcaccggc 360
taccgcacct acgacgacct gctcgactac atggagggct cggccgccgt gatcggcacc 420
atgatgctgc cgatcctggg ctccaccgac ccggccgccg cccgcgaacc ggcccgccag 480
ctcggcttcg ccttccagct caccaacttc atccgggacg tcgccgagga cctcgcgcgg 540
gaccggatct acctgcccga ggagcacctc gccgagttcg gtgtgacccg cgccgacctg 600
gccgccggcg tcgccacccc ggcgatccgc gcgctcatcc gggccgaggt ggaccgcgcc 660
cgtgagcact acgcggccgc cgcccccggc atcccgctgc tcgaacgcac ctcgcaggcc 720
tgcatgcgga ccgccttcca gctgtacggc gggatcctgg acgagatcga ggcggccgac 780
tacgacgtgt tcgcccggcg ggtcacggtg ccgaaccggc gccgggccgc ggtcgccgtc 840
cgcagcctgc tcacccggcc cggcaccccg gtcgaactgg cggcctga 888
<210> 33
<211> 1311
<212> DNA
<213> Artificial Sequence
<220>
<223> >ACSP50_0150
<400> 33
atgggcgccc gcgtcgcgct gttcacccgc gacctgcgga tccacgacaa cccgctgctc 60
agcgggcccg acccggtggt gccgctgttc gtcctcgacc cacggctgag cggcctctcg 120
gccaaccgca gccgctttct ccaccagagc ctggccgacc tgcggaacag tctccgcgag 180
cgtggcgccg acctggtgat ccgggagggc gacccggtgg ccgagaccat cgcggtcgcc 240
tccgaggtgg acgcgtcgac gatcacggtg gccgccgacg tgaccggtta cgcccagcgg 300
cgcgagcggc ggctgcggga cgagcgattc cgggtgaaga cggtgccgag cgtcacggtg 360
ctgccgcccg gtacggtccg gccgggcggg ggaggcgagt cgtaccgcgt gttcacgccg 420
tacttcaaag cctgggagaa agctgggtgg cgcgcaccct ccgcaacgcc ggggaaggtc 480
gcgatgccgg ccggcatcgc gccgggaagg ctccccgaga tgcccgccgg cgactcaccg 540
gacgccgtcg ccggtggcga gaccgagggc cgccgccggc tccaggcctg gcagaaagaa 600
atggcgcggt acgccgagga ccacgacgac atggccgccg acaacaccag ccggctcagc 660
gcctacctcc ggttcggctg cctgtcgccg ctcgaactgg cgctggccgc gaaagccgac 720
gactctcccg gcgcccaggc ctacctgcgg caactgtgct ggcgggactt ctactaccag 780
gtcaccgcga ccttcccgga gatctccacc cggccgctgc gggagaaggc ggaccagaac 840
tggcgatacg acgacgacgc gctgcgtcac tggcaggacg gcctgaccgg ggtgccgatc 900
gtcgacgccg gcatgcgcca gctccgcgcg gagggctgga tgcacaaccg ggcccggctg 960
atcaccgccg cgttcctcac caaacacctg ggcatcgact ggcggcccgg gctgcaatgg 1020
ttcttccgct ggctgctcga cggcgacgtg ccgaacaact ccggcaactg gcagtggacc 1080
gccggcaccg gcaacgacac ccggccctat cgcaggttca atcccattcg ccaagcgcag 1140
cgattcgatg cgcagggcgt gtacgttcgg cgctacgtac cggagttgaa agacatcgac 1200
ggtgtcacgg tgcatcagcc gtggcgactg ccggaatcgg tacgccgcgg gctcgactat 1260
cccggaccgt tggagtcaca tcgggacgag gcggtctggc tgcgcgactg a 1311
<210> 34
<211> 1362
<212> DNA
<213> Artificial Sequence
<220>
<223> >ACSP50_0151
<400> 34
atgtctgaag cgcggcaagt ggacgtggtg gtcgtcgggc tcggtgtcgg cggcgaggag 60
gtcgccggtc gcctggccgc ggccggcctg agcgtgatcg gcgtcgaaca ccgactggtc 120
ggtggcgaat gcccgtactg gggatgcatc cccaccaaga tcatggtccg cgccgggaac 180
gcgctggccg aggcccgccg gatccccggc ctcgccggga cgtccacggt gcgggccgac 240
tgggcgccgg tcgccaaacg gatccgcgac gaggccaccg acgactggaa cgacaaggtc 300
gccgtcgagc ggttcaccgg taagggcgga acgttcgtcc ggggcacggc cgaactgacc 360
ggtcccggtc aggtccgggt cggggaccag gaattcgccg cttcgcgcgg cgtggtcatc 420
gccaccggca ccgccgctgt ggtcccaccc atcgagggcc tgtccggtac gccgttctgg 480
acgaaccgtg aggccgtgga agcggcggcc ctgcccgcat cgatgctggt gctcggcggc 540
ggggcgatcg ggtgcgagct ggcccaggcg tacgcccggt tcggcgtgca ggtgacggtc 600
atcgagggct caccccgggt gctggccatg gaggaaccgg agtcgtccga ggtggcggcc 660
gccgccctga ccgccgacgg ggtccggatc gtcaccgggg tgcgcgcgca gaaggtcgcc 720
cacgacgacg ggttccacgt gaccctctcc gacggcagcg tgctggccgg cgagaagctg 780
ctggtcgcga ccgggcgggc ggcccggctc ggcgggctcg ggctggaccg ggtggggctg 840
gacccgtcgg ctcgattcct ggccaccgat gaccggctgc gcgccggcga gggcatctgg 900
gcggtggggg acgtgaccgg gaacggggcg ttcacccaca tggcgatgta cgaggcggac 960
atcgcggtgc gggacatcct ggggcagggc ggcccgggag ccgactaccg ggcgcggccg 1020
cgggtgacct tcctcgaccc ggagatcggg gcggtgggga tgaccgagca gcaggcccgg 1080
gacgccggcc tcgaggtgcg ggtggggtac gtgccgctga accagacctc gcgagggttc 1140
atccacgggc cggggaacga gggattcctc aaacttgtcg cggacgggga gcggggagtg 1200
ctggtcggcg ggacgaccgc cgggcagtcc ggtggcgaga tgatcggggc ggtggcggtg 1260
gcggtgcacg ccgaggtgcc ggtgtcgacg ttgctcagcc agatctgggc gtacccgacg 1320
tttcatcggg ggctggggca ggcgcttcag tcgctggcct ga 1362
<210> 35
<211> 351
<212> DNA
<213> Artificial Sequence
<220>
<223> >ACSP50_1631
<400> 35
gtgagcgaac ccgtcatcac cgaaccggct gcctggatca acctgcccga cctgtccgag 60
aggctggacg tgtcgatcag caaggtgcac cagatgatca gagacggcga cctgctcgcg 120
gtccgccgcg acggcatccg cgtggtgccc gccgaactgg tggccaacgc caccgtcctc 180
aagcatctgc ccggtgtgct gaacgtgctc cgcgacgccg ggtacaacga cgaagaggcc 240
ttccggtggc tctacgccga ggacgccgag gtcggcggca gcgccgcgat cgcgctcggc 300
ggtcagcagg cgcgcgagat caagcgccgc gcgcaggccc tcggcttctg a 351
<210> 36
<211> 327
<212> DNA
<213> Artificial Sequence
<220>
<223> >ACSP50_1632
<400> 36
atgaggcatt tgtcgtacgt cgcggtgctg gccggatgcc tggccggggc gctgtggctg 60
gaaccgatcc tgcgggtcaa cgtgctgcgc cggtggcgtc ggctgctgct ggccgtgctg 120
ccgatggcgg tcgtcttcac cctgtgggac ctggcggcga tcgcggccgg ccactggcac 180
ttcgacccgg cccagatcac cggcgtctac ctcggcggcg ggctgcccct cgacgaggtg 240
ctgttcttcc tggtggtgcc ggtctgcgcg atcctcggct tcgaggccgt gcgggccgtg 300
ctgcgacgtc cggcggggga cgagtga 327
<210> 37
<211> 336
<212> DNA
<213> Artificial Sequence
<220>
<223> >ACSP50_1633
<400> 37
gtgacctaca ccaccgctgc ggtgctcggc gtgctggccg ccctcacgct cgacgtgctg 60
atcctgcgga cccggctcgt cgggcgactg gtgttctggg ccacgtaccc catcatcttc 120
gtctttcagt tgatctcgaa cggcattctg accgggcgcg acatcgtgat gtacgacccg 180
gccgcgatcc tcggcccgcg gctcgtccac gccccggtcg aggacctgct gttcggtttc 240
gccctggtgc tcggcacgct gtcgctgtgg gtggcgctgg gccggcgcgg catccagcgc 300
accccgcgag ccgggtctag acggaccgac gagtag 336
<210> 38
<211> 1071
<212> DNA
<213> Artificial Sequence
<220>
<223> >crtE fps2(ACSP50_1634)
<400> 38
gtgacgaact ccccgctcga cgaggccggt ctgcggtcgc gtgtcgacaa ggcgctgacc 60
gtgttcctgg ccgggcagcg tgaccggctg ctggcgatcg acccggcgct ggccgagatg 120
tccgccacgg tctccgagtt cgtgctgggc ggcgggaagc ggctgcggcc ggcattcgcc 180
tactggggtt tccgcggggc cggcggcgcc gactcggacg ccgtggtggc ggccgtcgcc 240
gcgctggagc tggtgcaggc cagcgcgctg atccacgacg atctgatgga ccgctcggac 300
acccggcgcg gggtgccgtc ggtgcaccgt cggttcgaga aactgcacgc cggcgagggc 360
tggcggggca gcgcggccgg gttcggcgac tgcgccgcgg tgctgctcgg cgacctggcc 420
ctggtctggt cggacgagct gctgcacacc tcggggatgg cggtggccga cgtgcaacgg 480
gcccgcccga tcttcgacgg gatgcgcacc gaggtgaccg tcgggcagta cctggacgtg 540
ctcacccagg cgaccggcga cacgtcgctg gagcgggccg gcaaggtggc cgtctacaag 600
gccgcgaaat acaccgtgga gcgtccgctg ctgctgggcg cggcgctggc cggagcggcc 660
cccggggtgc acgcggcgta ctcggcgttc ggcctgccgc tgggcgaggc gttccagctg 720
cgcgacgacg tgctgggcgt gttcggcgac ccggagcgga ccggcaagcc ggccggcgac 780
gacctgcgcg agggcaagcg cacctatctg gtcgcggccg ccttcggcgc gctggacgcg 840
gccgggcggg ccgaactgga cgccgcgctc ggcgaccccg gcctggacga ggccggggtg 900
gcccggctgc gcacggtcat ccgggacagc ggtgcgctgg ccgcgaccga ggcccggatc 960
gacgagctga tgaccgcgtc gatcggcgcg ctggacgcgg caccgatcga tcaggacgcc 1020
cgggaggtgc tgcgccggct ggccgacgcg gctactcgtc ggtccgtcta g 1071
<210> 39
<211> 924
<212> DNA
<213> Artificial Sequence
<220>
<223> >ACSP50_1635
<400> 39
gtgtctctcg gacttccctc ccggctgccc ggcaccccgt cgatcggcga cctggtccgc 60
ggcgcggcgc cgacgttctc cttcgagttc ttcccgccga agacaccgga cggggagcgg 120
ctgctctggc aggccatccg ggagctggag tcgctgcggc ccagcttcgt ctcgatcacc 180
tacggggccg gcggcaccac ccgggagacc acggtcgcgg tcaccgagcg ggtcgccacc 240
gagaccacgc tgctgccgct ggcccacctc accgcggtcg accactcagt ggccgacctg 300
cgcaacgtga tcggccggct ggccggcgcc gggatccgca acgtgctggc gctgcgcggc 360
gacccgccgg gcgacccgat gggcgagtgg gtccggcacc cggacggcgt cggttacgcc 420
gacgagctgg tccggctgat ccgcgagtcc ggcgacttca gcgtcggggt ggccgccttc 480
ccgcacaaac acccccggtc ggccggcgtc aaggacgaca cccgcaactt cgtccgcaag 540
tgccgggccg gtgccgacta cgcgatcacc cagatgttct tcgacgccga cgaatatctg 600
cggctgcgcg accgggtggt ggccgccggc tgtcacaccc cgatcgtggc cggcgtgatg 660
ccggtgaccc ggatggccac catcgcgcgc tccacccagc tctccggcgc gcccttcccg 720
ccggcgctgc tgcgcgactt cgagcgggtc gccggcgacg acgcggcggt gcgcgagctg 780
ggcatcgaga cgtgcgcggc gatgtgcgcc cggttgctgc gggagggtgt gccgggcatc 840
cacttcatca ccatgaaccg gtccaccgcc acccgcgagg tctggcagcg gctggccccc 900
gcggaagtcg ccgcgtcggc gtga 924
<210> 40
<211> 933
<212> DNA
<213> Artificial Sequence
<220>
<223> >ACSP50_1650
<400> 40
gtgcagctgc aacaactccg gtacttcctg gcggtggtgg agacccggca tttcacccaa 60
gcagcggaca ttctgggcgt ctcgcaacct accttgagta agcagattca cacccttgag 120
atgtcactcg gagccccgct gttcgagcgg atgcgcggtg cggtgaccct gaccgtcgcc 180
ggcgagacat tgctgccgat ggcccagcgg atcgtcgccg acgccgacgc ggcccgcgac 240
gccgtgcagg acatcgtcgg tctgcgccgc ggcgaggtgc gcctgggtgc caccccgagc 300
ctgtgctcct cgctggtccc ggccgtgttg cgcaccttcc gcgccgacca cccgggggtc 360
aagctgcaca tcagtgaggg cagctcgcac gacctgaccg ccggcctgct ggcgcacacc 420
ctggatctgg ccctgatcgt gcagcccgag cacggcgtcg atccggccct ggtggccatc 480
gagctgctgc gcgagagcct ggtggtggcc tcggtcgcgg ccggcccgcc gcccaccgtg 540
ggccgccaac tggagctctc cgagctgcgc cacaccccga tggtgatgtt ccgcgagggc 600
tacgacatcc gtgaggtcac cctgcacgcc tgcgagcggg ccggcttcgc gccgaagttc 660
gcggtcgagg gtggtgagat ggacgcggtg ctcgccttcg tcgaggccgg cctcggggtc 720
gccctggtgc ccagcatggt gctcgccaac cggccgctgc tgcgggccac cccgctcgcg 780
ccgccgggga tgcgccggac catcgcgctc gcccagcgcc gtgccgcggt gctgccgcat 840
gccgcggccg cgctgcgtga ggtggtgctc gaccacatcg gctcgggccg gctgccgttc 900
ggcgtgcgcg ccctggagag accgtccact tag 933
<210> 41
<211> 750
<212> DNA
<213> Artificial Sequence
<220>
<223> >ACSP50_1651
<400> 41
atgggcgagt tccacgaccc gcgactcgtc gaggtctacg acgccgaatg tccctggggc 60
tgggacgacg acttcttcat ggccgtgctc gccgaacgct ccgcgcaccg ggtcgccgac 120
ctggggtgcg gcaccggccg gctggccatc gcgatggccg cggccgggca cgaggtgatc 180
gcgatcgacc cggcgccggc cgccctggcc gcggcccgcc gcaagccggg cggcacccgg 240
gtgcgctggc tgcagggctc ggccgagcgg ctcgccccgc gctcgctcga cgccgcgttc 300
atgaccggtc acgtcgccca gtccttcgtc gacgacgagg aatgggacac cgtgctccgc 360
gggctgcgcc gggcgctggt cccggaggga cggctggtct tcgacagccg ggacccggac 420
gaccggccgt ggcagcagtg gaacccgcag gattcgtggc gcaccgtggt gctcgacgac 480
gggagggtgg tggaggcgtg gagcgaggcc gagcaggtcg ggctgaacac cgtgcgcgtc 540
accgggcgct accggttcgc cgacggaggg gaactggcga actcggcgac cctgcgtttc 600
cggaccgagc cggagctgcg cgactcactg cgcgaggcgg gcttccgggt cgagcggatc 660
tacggcggct gggggcgcga gccggtgggt ctgagcggcg acggcgagtt catcgtgatc 720
gcggtcgcga cgccccggct gatgtcctga 750
<210> 42
<211> 1722
<212> DNA
<213> Artificial Sequence
<220>
<223> >ACSP50_1652
<400> 42
atgcccgaga acgagtggcc cgacgacccc cgcccgcccg accagggcga gtggagccag 60
ccgcatcacg agccgccacc cggccgtggc cgcgccctgc tggccgccgc ggtggtggtg 120
ctggtcctgc tggccgccgg cggcatcgcc tggcgtctga tgagcagccg cggcgctacg 180
ccggtggcgc agcccaccgc gcccgccccg acgcccaccg cgcagaccgc gccaccctgc 240
ccacagccgc gcctgcgggt cgccgccgcg ccggagatcg ccccggtgat ccagcaggcc 300
gccgccgcac tcagccagcc cggccagcgc tgctccgagg tgctggtgca ggccgccgag 360
ccgggcgccg cgctgaccgg caagccggac gtctgggtgc cgtccagcag cgtgtggctg 420
gccctggcca aaagccgcgg cgacgtctac accacgcagg gcgcgtcgct ggcctggtcg 480
ccgctggtga tcgccgggcc ggagtcgatc gccagcctgt tcgcgccgaa cggggtcacc 540
tcctggtccg gcctggtcca gggcaccatc cagaaacggg tgccggcggt ccggatgccc 600
gatccgacgc tgaccacgac cggactgctc agcgtctacg cggtgggcca ggccacggtc 660
aaggccaacc cggacgccgg gatcgcccag ttgcaggcgc tcaccctgcg cagccggctg 720
gagaacgcgg ccgccgaccc ggcggaactg ttcgcgcaga tgggcaagca gaccgacgcg 780
gccacggcga tctaccaggt cggggtcttc ccgaccaccg agcagcagct gctgacctat 840
cagaagagtc agcacgacgt ccggctgtcc ggctcggcgc ccgccgacgg ccagatcgac 900
gccgactatc cgtacgcggt ccgcaagggc gccccggccg acctggtcga gagccttcgc 960
gaggcgatca ccccggacgc gctgacgacg gccggattcc gggccaccgc gaccaagaac 1020
gcgctgcgcc tgccggcccc ggccgtgctc gccggggcgg cccggcagtg gtcggcgtac 1080
aagtcggtgg ccttccaggt gctgctgctg atcgacgcgt ccggctcgat gaacgagaag 1140
atcaccgacc gggccggccg cagcgtcacc aaggccgcgc tgctgcgcga gtccgggacc 1200
agcgcggccc agctcttcgg tgacgacacc agcctcggcc tgtggttctt cggcaccccg 1260
acggcggaca gcccggcgca caccgaggag gtgccgttcg gcccggtcat cgccaccgtc 1320
gacggcaaga gccgccgtga cctgctggcc gccaagatcg gcgagtaccg gccggtggcg 1380
aacgccggga ccccgctcta ccagagcgtg ctggacggcg tcgccgagat gcgcggccgg 1440
gccaagccgg acacggcgac cgtggtggtg gtcctcaccg acggctcgga cggcggcacg 1500
aagtaccgga tgtccaacgc ggacttcctg aagaagctga ccgccggtgc cgaccccgcc 1560
aagccggtgc cggtgatcgc cgtcggttac ggcccggccg cgaacgccac cgccctgcag 1620
gccatggcca aggccaccgg tggccaggcg gtcaccgtca agaacccggc cgacctggcc 1680
gccggcatcg cccaggcctt cctcgccgca cacacccact ag 1722
<210> 43
<211> 1437
<212> DNA
<213> Artificial Sequence
<220>
<223> >crtD (ACSP50_1653)
<400> 43
atgagcgaca tcgtggtggt cggggctggg gtcggcgggc tggccgcggc gatccggctg 60
gccgaggcgg ggcatcgggt cagcatccat gagcggtccg gcgtggtcgg cggcaagctg 120
gcggcatacg agagggacgg ctaccggttc gacaccggcc ccagcctgct caccctgccg 180
gacgtgttca ccggcctcgg tctggacctg cgcccggagc cgctggaccc ggtggtgcgg 240
cacttcttcc cggacggcac ggtgctggac tcgtcgtcgg accacgagac cttcctggcc 300
cggatcaccg acgcgctggg cggtgccgcg gcgcgcgact gggaccggtt ctggcgccgt 360
gccgagcgga tctggcacgc ctcctgggag tcggtgctgc gccgcccggt gaccgcggcg 420
tcgctggccc ggctgtcctg gcggctcggt gacctggccg cgatcgctcc cggccggtca 480
ctgcggtcgc tgggccgccg ctatctgcgc gacccgcggc tgcggatgct gctggaccgc 540
tatgcgacgt attcgggcgc ggatccgcgg cgggcgccgg cggcgctggc cgcgatcccc 600
tacgccgagc tggcgttcgg cgggtggtat ctgccgggtg ggctggtcac cctcgcggag 660
gcgctgctcg cccgatgcga gaaactgggc gtacgggtgc atctgcactc accggtcgcc 720
tcgatcgcca cgaccggcgc ccgggtgtcc ggggtccggc tgggggacgg gacccgcctc 780
gcggcggacg tcgtcgtctc caacgtggac gccgtcacgc tctaccggga tctgctgccc 840
agtccgaaac cgctggcccg cctcgccgac cggagcctgg ccggattcgt gctgctgctc 900
gcggtgcggg gcgagactcc gcggctggcg caccacaacg tgttcttccc gcgggactac 960
gacgccgagt tcgacgcggt cttcgggggg ccggggcggc gggcgcggcc ggccggcgac 1020
ccgaccgtct tcgtcacccg ggccgcggat ccggcggtgc gcccggccgg cgacgaggcg 1080
tggttcgtgc tggtcaacgc ggcgccacac ggcacctcgt ggtccaccgt ggactggctg 1140
cgggcggggc tggccgacgc gtaccgggat cgggtcctcg aggtcctggc ggggcgcggt 1200
ctcgacgtac gcgatcggct gatcttcgcc gagacccgga ccccggcgga tctggcggcg 1260
tcggccgcag cgccgggcgg agcgatctac ggcaccgccg gcggcctggt ccggccggcg 1320
aaccgcgcgc cggtcgacgg gttgttcctg gtcggcggct cgacgcatcc cggcggcggg 1380
ctgccgatgg tcaccctctc cgccgagatc gtcgcgggca tgatcggatc gaactga 1437
<210> 44
<211> 1080
<212> DNA
<213> Artificial Sequence
<220>
<223> >cruC (ACSP50_1654)
<400> 44
atgatcgtcg cctggctgat cctgccgccg ctgctgctga tcaccgcaca caccgccgtc 60
aacgcgctgc tgctgcgccg cccgcgccgg gcggcgacca gcaccgaacg ggtcgccgtc 120
ctgctcccgc tgcgcgacga ggccacccgg gtcaccccgt gcctgcgcgc cctgctcgcc 180
cagcgcggcg tcgccgatct caccgtgcac gtgctcgacg acggctccac cgacggcacc 240
gcggacgtgg tccgggcggt cgccggcgac cgggtccggc tgcacaccgg cactccgccg 300
ccgcccggct ggctcggcaa accggccgcc tgccaacggc tcgccgacct ggccggggac 360
gtggacgtgc tggtcttcgt cgacgccgac gtggtgctcg cgccggacgc ggtggccggg 420
gccgtcgatc tgctgcgccg ggccggagcg gacctgctca gcccgtaccc gaagatcgtc 480
ggtgccggcc ggctggtcca gccgctgctg cagtggtcct ggctgagttt cctgccactg 540
cgcgcgatgg aacgctcggc gcggccgtcg ctggccgccg ccggtggcca gtggctggtg 600
ctggaccggg ccggttaccg gcgagccggt ggccacgccg cggtgcgcgg cgagatcctg 660
gaggacatcg cgctggcccg cgcggtcaaa cgggccggcg ggcggatcgc cctggccgac 720
ggttccggcc tggccacctg ccggatgtac gagtcctggg acgagctcgc cgacggatac 780
gccaaatcgc tgtgggcgtc attggggtcc gcggccggcg cgaccgccgt cacgctcctg 840
ctgattctgc tgtacgtggt gccacccctg ctggcgccct tcgccccgct tccggcggtg 900
ctcggctacc tgctcggcgt gaccggccgg atgatcgccg ccagggccac cggcggccgc 960
gtcctgcccg gcacgctggc ccatccggtc tccatcgtcc tgttcggcta cctgatcgcc 1020
cgctccttcc ggctgcgccg ggccggccgc ctggcctggc gcggccgccc ggtgccctga 1080
<210> 45
<211> 756
<212> DNA
<213> Artificial Sequence
<220>
<223> >cruF (ACSP50_1655)
<400> 45
gtgtctcccc gtcatctgcc ctggggcctg ctcggggcgc tcgtgctcgc ccagatctgc 60
tatccgctca ccgagggtga cacccgggcc gggctgaccg tgctcaccgt gctgctcggc 120
gtcgcgttct cgctgagcca cgcgctgctc acccggggcc cccgggcgct cacggcgctg 180
ctgtcgaccg ccaccctggg cgggttcgcg gtggaggcga tcggggtggc caccggtttc 240
ccgttcggtt cctacgagta ctccgggcgt ctcggtccgc gcctgctcgg cgtaccgctg 300
atcatcccgc tggcctggac ctggatggcc tggccggcct ggctcgccgc gctgcgggtg 360
acccggcggc ggctcccccg gatcctggtc gccggggccg gcctggccgc ctgggacgtc 420
ttcctcgacc cgcagatggt cgccgaggac tactggcggt ggcggcaccc ggtgcccgcg 480
ctgcccggcg tgcccggtgt gccgctcggc aactacctgg gctggctcgg cttcgcgctg 540
ctgctgatga ccgcgctggc cgccgtcgcc ggccgggccg ccgaccggcc gctgtccgcc 600
gaccggccgg cgctcgccct gtggatctgg acgtacgcct cgtcggtgct cgcccacgcc 660
gtcttcctgt cgctgccggc gtccgcggcg tggggcgcgc tgatcatggg cgccgcggtc 720
ctcccgctgc tcgcccggct gcgcgcaccc gcatga 756
<210> 46
<211> 579
<212> DNA
<213> Artificial Sequence
<220>
<223> >ACSP50_1656
<400> 46
atgaggcttg tggcgtggca gccggacgac ctgctgcggc ggctcgacga cgtggtcggg 60
gtctacggcg aggcgatggg ctaccgccag gagctgctgc agacccgccg gggatacatc 120
gggtcgcacg tgcgccggcc cgggttccgg gcggtggcca cgctgaccac cgagggccgg 180
ctgatgggct tcggatacgg ctacacctcc gccgccggcc agtggtggca cgaccaggtc 240
cggttcgctc tcggcgagga cgaccgccgg cagtggctga ccgactgctt cgaggtggtc 300
gagctgcacg tgcgcccggc cgcgcagggc cacggggtgg gcgcccggca gctgcgcgcg 360
ctgctggcca tggccaaagg ccgcaccgtg ctgctgtcca ctccggaggc cgacgagcag 420
gcgtcccgcg cctggcggct gtaccggcgg tacggcttcg ccgacgtgct gcggcacttc 480
tacttcccgg gtgacgagcg ggccttcgcg gtcctcggcc gcgagctgcc gctggccgag 540
cgtccgctcg aggacgcacc gggcatcgcc ggcgcctga 579
<210> 47
<211> 675
<212> DNA
<213> Artificial Sequence
<220>
<223> >ACSP50_1657
<400> 47
atgacgcacg tcgccctgca cgtctggcgg gtgccgcgca gcgccgtcgg ctcggccatg 60
ctgcgcatgg ccttcgcgcg gcgccatctg gccggtctgc ggttcggcaa gttcctcggc 120
accggcaccg gcaccggctt cggtcccggc gacaccgatc tcacccggtg ggcggcgatc 180
acggtcagtg atgcgccggt acgtttcccc gtctgggagc ggatcgccgt caacggcgcc 240
cggatcgatc tggagccact gatcagccgg ggcacctggg ccggccgtac cccgttcgag 300
cccaccggcc gccgcccgga cggtccggtg ctcgcgctca cccgggcccg gctgcggccg 360
gctcgcgcgc tgaccttctg gcgggcggtc ccggcggtgg tgcgcgaggt gcaccgggcg 420
cccgggctgc tcgcccggtt cggcgtcggc gaggcgccga tcggctggca gggcaccgtc 480
accgtgtggc gggacgcggc ggatctcgtc gcgttcgcgt accgtcagcc ggagcatcgc 540
gcggcgatcg cccggacccc ggccgaccgc tggtacgccg aggagttgtt cgcccggttc 600
gcggtgctcg ggatcagcgg tgaccggtcc gtgctgggct ggaccgccga cgaaggggaa 660
cgggcggaag catga 675
<210> 48
<211> 816
<212> DNA
<213> Artificial Sequence
<220>
<223> >ACSP50_1658
<400> 48
atgacacaga ccatcgtgat caccggggcc agctccgggg tcgggctggc cgccgccgag 60
cagctcgccg cccgcggtga cgaggtggtg ctggtcggcc gcgacccggg ccggctcgac 120
gcggccgtgc agcgggtccg ggaggccggc ggcggccgcg cgccccggca cttccgggcc 180
gacttcgaac ggctcgacga cgtgcgggag ctcgccgccg ggctgctggc cgagctgccc 240
cggatcgacg tgctggccaa caacgccggc gggatcatca agcggccccg gcagacggtg 300
gacggccacg aggccaccat ccagggcaac cacctggccc cgttcctgct cacccacctg 360
ctgcgggagc ggctgaccgg gggccgggtg gtgaacaccg cctcggcggc acacgtgcag 420
ggccggcccg gcacccggtt caccgacgac ccgaagtcgt acagtccgtg gcgctcctac 480
ggggcgagca aggcggccaa catcctgttc gccgccgagg ccgcccgccg ctggccggac 540
gtgtgcagcg tctcgttcca ccccggtgtg gtgcgcacca acttcgggga gggccggctg 600
atccggctgt tctaccggta cgcgcccggc ctggtcaccc cggaggccgc cggcgagctg 660
ctgacctggc tgtgcaccac cccggccggg gagctggaga acggcgccta ctacgtcaag 720
cgtcaggtga cccggccggc cgcgcacgcc cgcgacccgc ggctggccgc cgagttgtgg 780
gacgccagcc tgaccgcgac cggcctcgcc ggatga 816
<210> 49
<211> 1020
<212> DNA
<213> Artificial Sequence
<220>
<223> >crtE (ACSP50_3873)
<400> 49
gtgatcgacg acttcctcag cgcgcaacgc gacgtgctgg ccgaggtcag cgacgactgc 60
gcgccgctgg aacgctacgt ggccgacctg atgggcggcg gcaaacgact ccggccggcg 120
ttctgctact gggcgtggcg ggcggccggc gcccccgacg gcccgggcat cgtggcggcc 180
gcgacatccc tggagttcct gcaggccgcc gcgctgatcc acgacgacat catggacgat 240
tcggacaccc gtcgcggcgc cccggcggtg caccgcagac tggcggccct gcactccggc 300
ggccgctggg ccggggacgc cgaccacttc gggctgtccg ccgccgtgct cgccggcgac 360
ctgtgcctga cctggagcga cgcgttgtat tcgggcagcg gcctgcaccc gtccgcgctg 420
gcccggggcc ggccggtctt cgaccggatg cgcacccagc tgatgggcgg ccagtatctg 480
gacctgctgg accaggcgcg gccgtcccgg ggcggcgtcg accgggcgcg ccgggtggtg 540
cacttcaaga gcgccaagta caccgtcgaa catccgctgc tgctcggcgc ccggctcgcc 600
ggcgcggacg acgatctgct cgcccggttg tccgcgttcg gtctgccgct gggcgaggcg 660
ttccagctgc gcgacgacct gctcggggtc ttcggcgacg cggcgcagac cggcaaaccc 720
accggcgacg acctgcgcga gggaaagcgc accacgctgg tcatcctggc cgcggaccgc 780
gccaccgcac cccagcaggc cgccctcacc gcgctgctcg gcgatcgcgg cctgaccggg 840
gccggcgtcg acaccctccg gcagatcatc gtggacaccg gtgcccgggc cgaggtcgag 900
cggatgatcg agcaactgct ggcgacgagt ctcggcgtgc tcagcggcac gcccgtcgac 960
gaggcggccc gctcggtgct gctcgccctc gccgaggcgg cgaccgcccg cagctcctga 1020
<210> 50
<211> 1029
<212> DNA
<213> Artificial Sequence
<220>
<223> >ACSP50_1950
<400> 50
atggtgagca cagtgatcgc ctcggggccc accggcctgg gcacctccgc ggcccgtctc 60
ttcggtcggg tggaccggga cgagccggag ctcttctgcc cggcgccgct gcgcgacgac 120
cgggcgctgg gggagcgggt caacgacgcc gtggtccagt gggccgagaa ggccggcatc 180
taccccggcc ggctggacaa gctgcgcggg gcgaacttcg gccgcttcat gatgctcgcc 240
cacccggcca ccagcgatcc cgaccggctg ctcgccgcga cgaagtgtct ggtcgccgag 300
tgggcggcgg acgactacta cgtcgacgag gtgtccctgg gcgcggatcc gatggtggtc 360
ggctcgcggc tggccaacct ctactcggtg gtcgacccgg cctcgctgac cccgcgctat 420
caggccgact tcgagaagca tcaccgcctg cagccgatct cggtggcgtt ccgcaccgcg 480
atggaacacc tggccgagta cgcctcggtc acccaactgg cccggttcca gcaccagatg 540
gcgatcctgt tcgtcgcctg gtcgcaggag gccgactggc acgccaaccg gcgcaccccg 600
ccggtctggg agtatctggt gcagcggcac ctgaacagct atctgccgcc gatgatcctg 660
gtcgacgtgc tggccgggta cgagctgtcg ccggccgagt tcttcgatcc gcgggtccgc 720
gcggcgttca ccaccgcagg caacgccgcc gtgctggtca acgacctcta ctcgggcagg 780
aacgagtccg agaccgatca caacctgccg accgtgctgg tgtccgggga gcggctcacg 840
ccgcgggccg cggtccggcg caccgtggag atccacaacg agttgatgca caccttcgtg 900
acctcggccg cgtcgttgag cgcgtccggc tcgccgcagc tgcgccggtt tctcgcggac 960
acctgggcct ggctgggcgg aagtcgcgag tggcacgcca cgagcggccg ctaccactca 1020
tccaactga 1029
<210> 51
<211> 1344
<212> DNA
<213> Artificial Sequence
<220>
<223> >ACSP50_5522
<400> 51
atgacgacca ccgcaccgac tcccgcccac ctcgccggca acttcgcgcc cgtcaccggg 60
gagaccacca cgctcgacct gccggtcacc ggcgccgtcc cggccgaact gaccgggtgg 120
tatctgcgca acgggcccaa cccccaccac gggacctcgg cgcactggtt tctcggcgac 180
ggcatggtgc acggcgtccg cctcgatcac ggccgggcca cctggtaccg caaccgctgg 240
gtgcggaccc gggtgctgac cgacgacgcc cgcgcctacg gcccggacgg cacccgcgac 300
ctcaccgccg gcccggcgaa caccaacgtc gtgcgccacg gcggacgact gctggcgctg 360
gtcgagtccg cgcttccgta cgagatcacc accgacctgg agaccgtcgg cccctacgac 420
ttcggcggcc gcctgcacac cccgatgacc gcccacccca aggtctgtcc caccaccggg 480
gagatgcact tcttcggcta cggcggactc gagccgccct acctcaccta ccaccgcgcc 540
ggcgcggacg gccggctgtc gctcagccgc ccgatcgacg tccccgcgca cacgatgatg 600
cacgacttca gcctcaccgc ggcccacgtg atcttcatgg acctgccggt gctgttcagc 660
ctggacgggg cgcggaccgg cggcatgccg taccggtggg acgacaccta ccaggcgcgc 720
ctgggcgtgc tgcggcgcga cgccccgcag ggggaggtcc gctggtacac catcgatccc 780
ggatacgtct tccacaccct gaacgcccac gacgacggcg accggatcgt catgcacgtc 840
gtccgccacg agcacgcgta ccgcccgggg cagcccgccg ccgcaccgga cctctggcgc 900
tggaccatcg accagcgcac cggccgggtc gccgaggaac ggctggacga cgaagcggtc 960
gagttccccc gcatcgacga tcggcgcacc gggcagccgg cccgttacgg cttcgccgtg 1020
accgacaacg ttccccgccg gctcgccgac gtcagcgccg tcatccgcta cgacctgcac 1080
accggctcga ccacccggca ccgcctgccg accgggcagg tacccgggga ggcggtcttc 1140
gtgccggccg gcggcgcccc cgccggatcg gccgacggct ggctgctgac gttcgcctac 1200
gacccggggc gcgacgccag cgatctgatc atcatcgacg ccaccgacct cgccgccccg 1260
ccgctggccc ggatccacct gccgcaccgg gtgccgttcg gcttccacgg caactggctg 1320
cccgaccacg accgcgcaga atag 1344
<210> 52
<211> 640
<212> PRT
<213> Artificial Sequence
<220>
<223> >Dxs (ACSP50_7096)
<400> 52
Met Ser Asp Ser Pro Ser Thr Pro Ala Gly Leu Leu Ala Ser Val Thr
1 5 10 15
Gly Pro Gly Ala Leu Lys Arg Leu Ser Ala Glu Gln Leu Thr Leu Leu
20 25 30
Ala Ala Glu Ile Arg Asp Phe Leu Val Ala Lys Val Ser Lys Thr Gly
35 40 45
Gly His Leu Gly Pro Asn Leu Gly Val Val Glu Met Thr Leu Ala Met
50 55 60
His Arg Val Phe Asp Ser Pro Arg Asp Lys Ile Leu Phe Asp Thr Gly
65 70 75 80
His Gln Ala Tyr Val His Lys Ile Val Thr Gly Arg Gln Asp Gly Phe
85 90 95
Asp Leu Leu Arg Gln Arg Gly Gly Leu Thr Gly Tyr Pro Ser Gln Ala
100 105 110
Glu Ser Glu His Asp Leu Ile Glu Asn Ser His Ala Ser Thr Ala Leu
115 120 125
Ser Tyr Ala Asp Gly Leu Ala Lys Ala Phe Ala Leu Arg Gly Glu Asp
130 135 140
Arg His Val Val Ala Val Val Gly Asp Gly Ala Leu Thr Gly Gly Met
145 150 155 160
Cys Trp Glu Ala Leu Asn Asn Ile Ala Ala Thr Lys Asn Arg Leu Val
165 170 175
Ile Val Val Asn Asp Asn Gly Arg Ser Tyr Ala Pro Thr Ile Gly Gly
180 185 190
Leu Ala Asp His Leu Ser Thr Leu Arg Leu Asn Pro Gly Tyr Glu Lys
195 200 205
Val Leu Asp Leu Val Lys Asp Ala Leu Gly Ser Thr Pro Leu Val Gly
210 215 220
Lys Pro Val Phe Glu Val Leu His Ala Val Lys Arg Gly Ile Lys Asp
225 230 235 240
Ala Val Ser Pro Gln Pro Met Phe Glu Asp Leu Gly Leu Lys Tyr Ile
245 250 255
Gly Pro Val Asp Gly His Asp Gln Gln Ala Met Glu Ser Ala Leu Arg
260 265 270
Arg Ala Lys Gly Phe Asn Ala Pro Val Ile Val His Ala Val Thr Arg
275 280 285
Lys Gly Tyr Gly Tyr Arg Pro Ala Glu Gln Asp Glu Ala Asp Cys Leu
290 295 300
His Gly Pro Gly Ala Phe Asp Pro Gln Thr Gly Ala Leu Thr Ala Lys
305 310 315 320
Pro Ser Leu Lys Trp Thr Lys Val Phe Ala Glu Glu Leu Val Lys Ile
325 330 335
Ala Asp Glu Arg Pro Asp Val Val Gly Ile Thr Ala Ala Met Ala Glu
340 345 350
Pro Thr Gly Ile Ala Ala Leu Ala Lys Lys Tyr Pro Asp Arg Ala Tyr
355 360 365
Asp Val Gly Ile Ala Glu Gln His Ala Ala Thr Ser Ala Ala Gly Leu
370 375 380
Ala Met Gly Gly Leu His Pro Val Val Ala Val Tyr Ala Thr Phe Leu
385 390 395 400
Asn Arg Ala Phe Asp Gln Val Leu Leu Asp Val Ala Met His Arg Leu
405 410 415
Pro Val Thr Phe Val Leu Asp Arg Ala Gly Ile Thr Gly Pro Asp Gly
420 425 430
Pro Ser His Tyr Gly Ile Trp Asp Met Ser Val Phe Gly Ala Val Pro
435 440 445
Gly Leu Arg Ile Ala Ala Pro Arg Asp Ala Ala Thr Leu Arg Glu Glu
450 455 460
Leu Arg Glu Ala Val Ala Val Asp Asp Gly Pro Thr Ile Val Arg Phe
465 470 475 480
Pro Thr Gly Ala Val Ala Ala Asp Thr Pro Ala Val Arg Arg Val Gly
485 490 495
Gln Val Asp Val Leu Arg Glu Ala Glu Lys Lys Asp Ile Leu Leu Val
500 505 510
Ala Val Gly Ser Phe Val Gly Leu Gly Leu Asp Ala Ala Glu Arg Leu
515 520 525
Ala Glu Gln Gly Tyr Gly Val Thr Val Val Asp Pro Arg Trp Val Arg
530 535 540
Pro Val Pro Ile Glu Leu Thr Gly Leu Ala Ala Gln His Arg Leu Val
545 550 555 560
Val Thr Leu Glu Asp Gly Ile Arg Ala Gly Gly Val Gly Asp Ala Val
565 570 575
Ala Ala Ala Leu Arg Asp Ala Gly Val His Val Pro Leu Arg Asp Phe
580 585 590
Gly Val Pro Ala Gly Phe His Pro His Gly Thr Arg Ala Glu Ile Leu
595 600 605
Ala Ser Leu Gly Leu Thr Ala Gln Asp Val Ala Arg Asp Val Thr Gly
610 615 620
Trp Val Ser Gly Leu Asp Ala Gly Thr Ser Val Ala Ala Pro Ala Ile
625 630 635 640
<210> 53
<211> 390
<212> PRT
<213> Artificial Sequence
<220>
<223> >IspG (ACSP50_7248)
<400> 53
Met Thr Ala Ile Ser Leu Gly Met Pro Ala Val Pro Pro Pro Pro Leu
1 5 10 15
Ala Pro Arg Arg Gln Ser Arg Gln Ile Asn Val Gly Gly Val Leu Val
20 25 30
Gly Gly Gly Ala Pro Val Ser Val Gln Ser Met Thr Thr Thr Leu Thr
35 40 45
Ser Asp Val Asn Ala Thr Leu Gln Gln Ile Ala Glu Leu Thr Ala Ala
50 55 60
Gly Cys Gln Ile Val Arg Val Ala Val Pro Ser Gln Asp Asp Val Glu
65 70 75 80
Ala Leu Pro Ala Ile Ala Lys Lys Ser Gln Ile Pro Val Ile Ala Asp
85 90 95
Ile His Phe Gln Pro Lys Tyr Val Phe Ala Ala Ile Asp Ala Gly Cys
100 105 110
Ala Ala Val Arg Val Asn Pro Gly Asn Ile Arg Gln Phe Asp Asp Lys
115 120 125
Val Lys Glu Ile Ala Arg Ala Ala Ser Asp Ala Gly Val Pro Ile Arg
130 135 140
Ile Gly Val Asn Ala Gly Ser Leu Asp Lys Arg Leu Leu Glu Lys Tyr
145 150 155 160
Gly Lys Ala Thr Ala Glu Ala Leu Val Glu Ser Ala Leu Trp Glu Cys
165 170 175
Ser Leu Phe Glu Glu His Gly Phe Arg Asp Ile Lys Ile Ser Val Lys
180 185 190
His Asn Asp Pro Val Val Met Ile Arg Ala Tyr Arg Gln Leu Ala Glu
195 200 205
Gln Cys Asp Tyr Pro Leu His Leu Gly Val Thr Glu Ala Gly Pro Ala
210 215 220
Phe Gln Gly Thr Ile Lys Ser Ala Val Ala Phe Gly Ala Leu Leu Ala
225 230 235 240
Glu Gly Ile Gly Asp Thr Ile Arg Val Ser Leu Ser Ala Pro Pro Val
245 250 255
Glu Glu Ile Lys Val Gly Gln Gln Ile Leu Glu Ser Leu Gly Leu Arg
260 265 270
Glu Arg Gly Leu Glu Ile Val Ser Cys Pro Ser Cys Gly Arg Ala Gln
275 280 285
Val Asp Val Tyr Thr Leu Ala Glu Gln Val Thr Ala Ala Leu Asp Gly
290 295 300
Phe Pro Val Pro Leu Arg Val Ala Val Met Gly Cys Val Val Asn Gly
305 310 315 320
Pro Gly Glu Ala Arg Glu Ala Asp Leu Gly Val Ala Ser Gly Asn Gly
325 330 335
Lys Gly Gln Ile Phe Val Lys Gly Lys Val Ile Lys Thr Val Pro Glu
340 345 350
Ala Val Ile Val Glu Thr Leu Val Glu Glu Ala Leu Arg Leu Ala Asp
355 360 365
Glu Met Gly Ala Glu Leu Pro Asp Glu Leu Arg Glu Leu Leu Pro Gly
370 375 380
Pro Thr Val Thr Val His
385 390
<210> 54
<211> 399
<212> PRT
<213> Artificial Sequence
<220>
<223> >Dxr (ACSP50_7250)
<400> 54
Met Arg Glu Leu Val Leu Leu Gly Ser Thr Gly Ser Ile Gly Thr Gln
1 5 10 15
Ala Ile Asp Ile Val Arg Arg Asn Pro Glu Leu Phe Arg Val Val Ala
20 25 30
Ile Gly Ala Gly Gly Gly Asn Val Ala Leu Leu Ala Ala Gln Ala Leu
35 40 45
Glu Leu Gly Val Glu Val Val Gly Val Ala Arg Ala Ser Val Val Gln
50 55 60
Asp Leu Gln Leu Ala Phe Tyr Ala Glu Ala Gln Lys Arg Gly Trp Ser
65 70 75 80
Ser Gly Asp Phe Lys Leu Pro Lys Ile Val Ala Gly Pro Asp Ala Met
85 90 95
Thr Glu Leu Ala Arg Trp Pro Cys Asp Val Val Leu Asn Gly Val Val
100 105 110
Gly Ser Leu Gly Leu Ala Pro Thr Leu Ala Ala Leu Glu Ser Gly Arg
115 120 125
Ile Leu Ala Leu Ala Asn Lys Glu Ser Leu Val Ala Gly Gly Pro Leu
130 135 140
Val Arg Arg Ile Ala Lys Asp Gly Gln Ile Val Pro Val Asp Ser Glu
145 150 155 160
His Ser Ala Leu Ala Gln Cys Leu Arg Gly Gly Arg Ala Ala Glu Val
165 170 175
Arg Arg Leu Val Leu Thr Ala Ser Gly Gly Ala Phe Arg Gly Arg Arg
180 185 190
Arg Ala Glu Leu Thr Asn Val Thr Pro Glu Glu Ala Leu Lys His Pro
195 200 205
Thr Trp Asp Met Gly Pro Val Val Thr Ile Asn Ser Ala Thr Met Val
210 215 220
Asn Lys Ala Leu Glu Val Ile Glu Ala His Glu Leu Phe Gly Val Pro
225 230 235 240
Tyr Asp Asp Ile Ala Val Met Val His Pro Gln Ser Val Leu His Ser
245 250 255
Leu Val Glu Phe Thr Asp Gly Ser Thr Leu Ala Gln Ala Ser Pro Pro
260 265 270
Asp Met Arg Leu Pro Ile Ala Leu Ala Leu Ala Trp Pro Asp Arg Val
275 280 285
Pro Gly Ala Ala Ala Ala Val Asp Trp Thr Leu Ala His Asn Trp Glu
290 295 300
Leu Arg Pro Leu Asp Asp Glu Ala Phe Pro Ala Val Glu Leu Ala Lys
305 310 315 320
Ala Ala Gly Arg Tyr Gly Arg Cys Arg Pro Ala Ile Phe Asn Ala Ala
325 330 335
Asn Glu Glu Cys Val Ala Ala Phe Ala Ala Gly Arg Leu Pro Phe Leu
340 345 350
Gly Ile Val Asp Thr Leu Glu Arg Val Leu Ala Ala Ala Pro Asp Phe
355 360 365
Ala Glu Pro Ser Thr Val Asp Asp Val Leu Ala Ala Glu Ser Trp Ala
370 375 380
Arg Ala Gln Ala Gln Arg Thr Ile Ala Thr Val Ala Glu Gly Ala
385 390 395
<210> 55
<211> 320
<212> PRT
<213> Artificial Sequence
<220>
<223> >IspH (ACSP50_7707)
<400> 55
Met Leu Leu Ala Lys Pro Arg Gly Tyr Cys Ala Gly Val Asp Arg Ala
1 5 10 15
Val Gln Thr Val Glu Glu Ala Leu Lys Leu Tyr Gly Ala Pro Val Tyr
20 25 30
Val Arg Lys Gln Ile Val His Asn Lys His Val Val Ser Thr Leu Glu
35 40 45
Ala Arg Gly Ala Ile Phe Val Glu Glu Asn Tyr Glu Val Pro Glu Gly
50 55 60
Ala Thr Val Val Phe Ser Ala His Gly Val Ala Pro Glu Val His Asp
65 70 75 80
Gln Ala Arg Glu Arg Arg Leu Lys Ala Ile Asp Ala Thr Cys Pro Leu
85 90 95
Val Thr Lys Val His His Glu Ala Lys Arg Phe Ala Ala Glu Asp Tyr
100 105 110
Asp Ile Leu Leu Ile Gly His Glu Gly His Glu Glu Val Ile Gly Thr
115 120 125
Ser Gly Glu Ala Pro Ala His Ile Gln Leu Val Asp Gly Pro Asp Asp
130 135 140
Val Ala Asn Val Val Val Arg Asp Pro Ala Lys Val Val Trp Leu Ser
145 150 155 160
Gln Thr Thr Leu Ser Val Asp Glu Thr Met Glu Thr Val Ala Arg Leu
165 170 175
Lys Thr Arg Leu Pro Leu Leu Gln Ser Pro Pro Ser Asp Asp Ile Cys
180 185 190
Tyr Ala Thr Ser Asn Arg Gln His Val Ile Lys Glu Ile Ala Pro Glu
195 200 205
Cys Asp Val Val Ile Val Val Gly Ser Thr Asn Ser Ser Asn Ser Val
210 215 220
Arg Leu Val Glu Val Ala Leu Gly Ala Gly Ala Arg Ala Gly His Leu
225 230 235 240
Val Asp Tyr Ala Ala Glu Ile Gln Asp Glu Trp Leu Ala Gly Ala Thr
245 250 255
Thr Val Gly Val Ser Ser Gly Ala Ser Val Pro Asp Glu Leu Val Met
260 265 270
Glu Val Leu Ala His Leu Ala Glu Arg Gly Phe Gly Glu Val Thr Glu
275 280 285
Phe Thr Thr Ala Glu Glu Arg Leu Thr Phe Ser Leu Pro Gln Glu Leu
290 295 300
Arg Lys Asp Met Lys Ala Ala Glu Ala Ala Arg Ala Ala Ala Ala Gly
305 310 315 320
<210> 56
<211> 315
<212> PRT
<213> Artificial Sequence
<220>
<223> >IspE (ACSP50_7802)
<400> 56
Met Thr Glu Ala Trp Gly Pro Asp Asp Asp Glu Pro Arg Pro Tyr Ser
1 5 10 15
Gly Pro Val Lys Val Arg Val Pro Ala Lys Ile Asn Leu His Leu Ala
20 25 30
Val Gly Pro Leu Arg Pro Asp Gly Tyr His Glu Leu Asn Thr Val Tyr
35 40 45
His Ala Ile Ser Leu Phe Asp Glu Ile Thr Ala Arg His Gly Asp Thr
50 55 60
Leu Thr Leu Thr Met Glu Gly Glu Gly Thr Gly Asp Leu Ala Leu Asp
65 70 75 80
Glu Thr Asn Leu Ile Ile Arg Ala Ala Arg Ala Leu Ala Ala Arg Ala
85 90 95
Arg Val Pro Ala Tyr Ala Arg Leu His Leu Arg Lys Ser Ile Pro Leu
100 105 110
Ala Gly Gly Leu Ala Gly Gly Ser Ala Asp Ala Ala Ala Thr Leu Ile
115 120 125
Ala Cys Asp Leu Leu Trp Gly Leu Gly Met Ser Arg Asp Glu Leu Ala
130 135 140
Glu Val Gly Ala Gln Leu Gly Ser Asp Ile Pro Phe Leu Leu His Gly
145 150 155 160
Gly Thr Ala Leu Gly Thr Gly His Gly Glu Ala Val Ser Pro Ile Leu
165 170 175
Ala Arg Pro Thr Thr Trp His Trp Thr Val Ala Ile Ala Asp Gly Gly
180 185 190
Leu Ala Thr Pro Ala Val Tyr Arg Glu Leu Asp Thr Leu Arg Ala Gly
195 200 205
Thr Trp Pro Pro Thr Pro Leu Gly Ser Ala Asp Thr Leu Met Ala Ala
210 215 220
Leu Arg Gln Arg Asn Pro Glu Ile Leu Gly Ala Ala Leu Gly Asn Asp
225 230 235 240
Leu Gln Pro Ala Ala Leu Ala Leu Arg Pro Gln Leu Ala Asp Val Leu
245 250 255
Lys Ala Gly Thr Glu Ala Gly Ala Leu Ala Gly Leu Val Ser Gly Ser
260 265 270
Gly Pro Thr Cys Val Phe Leu Ala Ala Asp Ala Thr His Ala Gln Glu
275 280 285
Ile Ala Asp Ser Leu Thr Glu Ala Gly Val Cys Arg Ala Ala Val Thr
290 295 300
Ala Arg Gly Pro Gln Pro Gly Ala Arg Val Ile
305 310 315
<210> 57
<211> 162
<212> PRT
<213> Artificial Sequence
<220>
<223> >IspF (ACSP50_8046)
<400> 57
Met Ile Ile Pro Arg Val Gly Ile Gly Thr Asp Val His Ala Phe Asp
1 5 10 15
Ala Asp Arg Ala Cys Trp Val Ala Gly Leu Glu Trp Pro Gly Glu Pro
20 25 30
Gly Leu Ala Gly His Ser Asp Ala Asp Val Val Ala His Ala Ala Cys
35 40 45
Asp Ala Leu Leu Ser Ala Ala Gly Leu Gly Asp Leu Gly Gly Asn Phe
50 55 60
Gly Thr Ser Arg Pro Glu Trp Ala Gly Ala Ala Gly Val Thr Leu Leu
65 70 75 80
Ala Glu Thr Ala Arg Leu Val Arg Ala Ala Gly Phe Ala Ile Gly Asn
85 90 95
Val Ser Val Gln Val Ile Gly Asn Arg Pro Lys Ile Gly Lys Arg Arg
100 105 110
Ala Glu Ala Glu Lys Val Leu Ser Ala Ala Val Gly Ala Pro Val Thr
115 120 125
Val Ser Gly Thr Thr Ser Asp Gly Leu Gly Leu Thr Gly Arg Gly Glu
130 135 140
Gly Leu Ala Gly Val Ala Val Ala Met Val Tyr Thr Glu Asn Ala Leu
145 150 155 160
Pro Ala
<210> 58
<211> 243
<212> PRT
<213> Artificial Sequence
<220>
<223> >IspD (ACSP50_8047)
<400> 58
Met Ile Ala Asp Arg Asp Val Thr Ala Gln Leu Asn Ala Arg Gly Asp
1 5 10 15
Val Ala Val Val Val Pro Ala Ala Gly Ala Gly Leu Arg Leu Gly Pro
20 25 30
Gly Gly Pro Lys Ala Leu Arg Leu Leu Asp Gly Glu Pro Leu Leu Val
35 40 45
His Ala Val Arg Arg Leu Ala Ala Ala Ala Pro Val Arg Met Ile Val
50 55 60
Val Ala Ala Pro Pro Ala Glu Val Asp Ala Val Ser Ala Leu Leu Ala
65 70 75 80
Pro Val Ala Pro Val Thr Val Val Pro Gly Gly Ala Glu Arg Gln Glu
85 90 95
Ser Val Ala Ala Ala Leu Ala Val Val Pro Pro Asp Val Pro Ile Val
100 105 110
Leu Val His Asp Ala Ala Arg Cys Leu Thr Pro Pro Ser Val Thr Glu
115 120 125
Arg Val Ala Ala Ala Val Arg Asp Gly Ala Asp Ala Val Ile Pro Val
130 135 140
Leu Pro Val Val Asp Thr Ile Lys Glu Val Ala Ala Asp Ala Thr Val
145 150 155 160
Leu Gly Thr Val Asp Arg Ser Val Leu Arg Ala Val Gln Thr Pro Gln
165 170 175
Gly Phe Arg Ala Ser Val Leu Arg Ala Ala His Arg Ala Ala Ala Asp
180 185 190
Ser His Thr Asp Asp Ala Gly Ala Val Glu Lys Leu Gly Ile Pro Val
195 200 205
Leu Cys Val Pro Gly Ser Asp Leu Ala Leu Lys Ile Thr Arg Pro Ile
210 215 220
Asp Leu Ala Leu Ala Thr His Leu Leu Ala Leu Pro Asp Pro Asp Ala
225 230 235 240
Pro Thr Ala
<210> 59
<211> 194
<212> PRT
<213> Artificial Sequence
<220>
<223> >Idi (ACSP50_0146)
<400> 59
Met Ser Ser Ile Gly His Leu Asn Arg Glu Asp His Leu Val Glu Leu
1 5 10 15
Val Asn Glu Glu Gly Gln Pro Leu Gly Ser Ala Thr Val Ser Asp Ala
20 25 30
His Leu Ser Pro Gly Ala Leu His Arg Ala Phe Ser Val Phe Leu Thr
35 40 45
Asp Asp Glu Gly Arg Val Leu Leu Gln Gln Arg Ala Ala Ala Lys Thr
50 55 60
Arg Phe Pro Leu Arg Trp Gly Asn Thr Cys Cys Gly His Pro Ala Pro
65 70 75 80
Gly Glu Pro Val Thr Val Ala Ala Ala Arg Arg Leu Thr Glu Glu Leu
85 90 95
Ala Val Arg Asp Val Thr Leu Thr Glu Ile Gly Val Tyr Thr Tyr Arg
100 105 110
Ala Thr Asp Pro Val Thr Gly Arg Val Glu His Glu Tyr Asp His Val
115 120 125
Leu Ile Gly Ala Leu Pro Asp Gly Val Val Pro His Pro Asp Pro Ala
130 135 140
Glu Ile Ala Thr Leu Arg Trp Ala Ser Leu Pro Gly Leu Arg Thr Gly
145 150 155 160
Leu Thr Glu Ser Pro Glu Leu Tyr Ala Pro Trp Leu Pro Gly Val Phe
165 170 175
Glu Ile Leu Thr Glu Arg Ser Gly Val Leu Ser Thr Glu Arg Ser Gly
180 185 190
Gly Arg
<210> 60
<211> 356
<212> PRT
<213> Artificial Sequence
<220>
<223> >CrtE ldsA (ACSP50_0148)
<400> 60
Met Ala Asn Asp Thr Leu Glu Gly Asn Arg Leu Ala Ala Ile Pro Arg
1 5 10 15
Gln Ser Val Ser His Thr Gly Leu Val Gly Ala Val Glu Gly Thr Leu
20 25 30
Ala Asp Phe Leu Ala Ser Gln Ile Ala Ser Leu Asp Ala Val Asp Pro
35 40 45
Ser Leu Gly Gly Phe Gly Arg Thr Ala Arg Asp Leu Val Met Ala Gly
50 55 60
Gly Lys Arg Leu Arg Pro Thr Phe Ala Tyr Trp Gly Trp Arg Gly Val
65 70 75 80
Ala Gly Pro Ala Ala Asp Ala Glu Thr Leu Leu Pro Ala Leu Gly Ala
85 90 95
Leu Glu Leu Met His Thr Phe Ala Leu Val His Asp Asp Val Met Asp
100 105 110
Asp Ser Ser Thr Arg Arg Gly Arg Pro Thr Ala His Arg Ile Phe Ala
115 120 125
Ala Gln His Gly Gly Arg Phe Gly Thr Ser Ala Ala Ile Leu Val Gly
130 135 140
Asp Leu Cys Leu Val Trp Ala Asp Gln Leu Leu Ala Arg Thr Pro Val
145 150 155 160
Pro Ala Ala Thr Leu Leu Ala Val Arg Ala His Tyr Asp Arg Met Arg
165 170 175
Ile Glu Ala Val Ala Gly Gln Tyr Leu Asp Val Leu Gly Glu Thr Asp
180 185 190
Pro Ala Ser Trp Ser Val Glu Arg Ala Leu Leu Val Ala Arg His Lys
195 200 205
Thr Ala Ser Tyr Thr Val Gln Arg Pro Leu Asp Phe Gly Leu Ala Leu
210 215 220
Ala Gly Val Glu Asp Val Glu Val Ala Glu Ala Tyr Arg Thr Tyr Gly
225 230 235 240
Ile Ala Val Gly Glu Ala Phe Gln Leu Arg Asp Asp Leu Leu Gly Val
245 250 255
Tyr Gly Asp Pro Ala Val Thr Gly Lys Pro Val Ser Asp Asp Leu Arg
260 265 270
Thr Gly Lys Pro Thr Ala Leu Leu Met Leu Ala Arg Arg Met Ala Thr
275 280 285
Pro Gly Gln Leu Ala Glu Leu Glu Ser Ala Glu Ile Glu Arg Lys Ala
290 295 300
Gln Val Val Ala Glu Thr Gly Ala Pro Ala Arg Val Glu Glu Met Ile
305 310 315 320
Arg Ala Arg Val Thr Glu Gly Leu Thr Ala Leu Ala Ser Ala Pro Ile
325 330 335
Asp Ala Glu Ala Arg Ala Thr Leu Ile Glu Leu Ala Thr Val Ala Thr
340 345 350
Gln Arg Pro Ala
355
<210> 61
<211> 295
<212> PRT
<213> Artificial Sequence
<220>
<223> >CrtB (ACSP50_0149)
<400> 61
Met Glu Thr Asp Leu Ala Ala Ala Tyr Glu Arg Cys Arg Glu Leu His
1 5 10 15
Arg Glu His Gly Arg Thr Tyr Tyr Leu Ala Thr Arg Leu Leu Pro Ala
20 25 30
Trp Lys Arg Arg His Val His Ala Leu Tyr Gly Phe Thr Arg Phe Ala
35 40 45
Asp Glu Ile Val Asp Arg Thr Glu Ala Gln Pro Pro Ala Glu Arg Ala
50 55 60
Ala Glu Leu Ala Thr Trp Ser Ala Gly Phe Leu Ala Gly Leu Arg Gly
65 70 75 80
Glu Pro Val Asp Asp Pro Leu Leu Pro Ala Val Leu His Thr Ile Ala
85 90 95
Val Phe Gly Leu Asp Leu Glu Asp Phe Ala Lys Phe Leu Arg Ser Met
100 105 110
Glu Met Asp Leu Thr Val Thr Gly Tyr Arg Thr Tyr Asp Asp Leu Leu
115 120 125
Asp Tyr Met Glu Gly Ser Ala Ala Val Ile Gly Thr Met Met Leu Pro
130 135 140
Ile Leu Gly Ser Thr Asp Pro Ala Ala Ala Arg Glu Pro Ala Arg Gln
145 150 155 160
Leu Gly Phe Ala Phe Gln Leu Thr Asn Phe Ile Arg Asp Val Ala Glu
165 170 175
Asp Leu Ala Arg Asp Arg Ile Tyr Leu Pro Glu Glu His Leu Ala Glu
180 185 190
Phe Gly Val Thr Arg Ala Asp Leu Ala Ala Gly Val Ala Thr Pro Ala
195 200 205
Ile Arg Ala Leu Ile Arg Ala Glu Val Asp Arg Ala Arg Glu His Tyr
210 215 220
Ala Ala Ala Ala Pro Gly Ile Pro Leu Leu Glu Arg Thr Ser Gln Ala
225 230 235 240
Cys Met Arg Thr Ala Phe Gln Leu Tyr Gly Gly Ile Leu Asp Glu Ile
245 250 255
Glu Ala Ala Asp Tyr Asp Val Phe Ala Arg Arg Val Thr Val Pro Asn
260 265 270
Arg Arg Arg Ala Ala Val Ala Val Arg Ser Leu Leu Thr Arg Pro Gly
275 280 285
Thr Pro Val Glu Leu Ala Ala
290 295
<210> 62
<211> 436
<212> PRT
<213> Artificial Sequence
<220>
<223> >ACSP50_0150
<400> 62
Met Gly Ala Arg Val Ala Leu Phe Thr Arg Asp Leu Arg Ile His Asp
1 5 10 15
Asn Pro Leu Leu Ser Gly Pro Asp Pro Val Val Pro Leu Phe Val Leu
20 25 30
Asp Pro Arg Leu Ser Gly Leu Ser Ala Asn Arg Ser Arg Phe Leu His
35 40 45
Gln Ser Leu Ala Asp Leu Arg Asn Ser Leu Arg Glu Arg Gly Ala Asp
50 55 60
Leu Val Ile Arg Glu Gly Asp Pro Val Ala Glu Thr Ile Ala Val Ala
65 70 75 80
Ser Glu Val Asp Ala Ser Thr Ile Thr Val Ala Ala Asp Val Thr Gly
85 90 95
Tyr Ala Gln Arg Arg Glu Arg Arg Leu Arg Asp Glu Arg Phe Arg Val
100 105 110
Lys Thr Val Pro Ser Val Thr Val Leu Pro Pro Gly Thr Val Arg Pro
115 120 125
Gly Gly Gly Gly Glu Ser Tyr Arg Val Phe Thr Pro Tyr Phe Lys Ala
130 135 140
Trp Glu Lys Ala Gly Trp Arg Ala Pro Ser Ala Thr Pro Gly Lys Val
145 150 155 160
Ala Met Pro Ala Gly Ile Ala Pro Gly Arg Leu Pro Glu Met Pro Ala
165 170 175
Gly Asp Ser Pro Asp Ala Val Ala Gly Gly Glu Thr Glu Gly Arg Arg
180 185 190
Arg Leu Gln Ala Trp Gln Lys Glu Met Ala Arg Tyr Ala Glu Asp His
195 200 205
Asp Asp Met Ala Ala Asp Asn Thr Ser Arg Leu Ser Ala Tyr Leu Arg
210 215 220
Phe Gly Cys Leu Ser Pro Leu Glu Leu Ala Leu Ala Ala Lys Ala Asp
225 230 235 240
Asp Ser Pro Gly Ala Gln Ala Tyr Leu Arg Gln Leu Cys Trp Arg Asp
245 250 255
Phe Tyr Tyr Gln Val Thr Ala Thr Phe Pro Glu Ile Ser Thr Arg Pro
260 265 270
Leu Arg Glu Lys Ala Asp Gln Asn Trp Arg Tyr Asp Asp Asp Ala Leu
275 280 285
Arg His Trp Gln Asp Gly Leu Thr Gly Val Pro Ile Val Asp Ala Gly
290 295 300
Met Arg Gln Leu Arg Ala Glu Gly Trp Met His Asn Arg Ala Arg Leu
305 310 315 320
Ile Thr Ala Ala Phe Leu Thr Lys His Leu Gly Ile Asp Trp Arg Pro
325 330 335
Gly Leu Gln Trp Phe Phe Arg Trp Leu Leu Asp Gly Asp Val Pro Asn
340 345 350
Asn Ser Gly Asn Trp Gln Trp Thr Ala Gly Thr Gly Asn Asp Thr Arg
355 360 365
Pro Tyr Arg Arg Phe Asn Pro Ile Arg Gln Ala Gln Arg Phe Asp Ala
370 375 380
Gln Gly Val Tyr Val Arg Arg Tyr Val Pro Glu Leu Lys Asp Ile Asp
385 390 395 400
Gly Val Thr Val His Gln Pro Trp Arg Leu Pro Glu Ser Val Arg Arg
405 410 415
Gly Leu Asp Tyr Pro Gly Pro Leu Glu Ser His Arg Asp Glu Ala Val
420 425 430
Trp Leu Arg Asp
435
<210> 63
<211> 453
<212> PRT
<213> Artificial Sequence
<220>
<223> >ACSP50_0151
<400> 63
Met Ser Glu Ala Arg Gln Val Asp Val Val Val Val Gly Leu Gly Val
1 5 10 15
Gly Gly Glu Glu Val Ala Gly Arg Leu Ala Ala Ala Gly Leu Ser Val
20 25 30
Ile Gly Val Glu His Arg Leu Val Gly Gly Glu Cys Pro Tyr Trp Gly
35 40 45
Cys Ile Pro Thr Lys Ile Met Val Arg Ala Gly Asn Ala Leu Ala Glu
50 55 60
Ala Arg Arg Ile Pro Gly Leu Ala Gly Thr Ser Thr Val Arg Ala Asp
65 70 75 80
Trp Ala Pro Val Ala Lys Arg Ile Arg Asp Glu Ala Thr Asp Asp Trp
85 90 95
Asn Asp Lys Val Ala Val Glu Arg Phe Thr Gly Lys Gly Gly Thr Phe
100 105 110
Val Arg Gly Thr Ala Glu Leu Thr Gly Pro Gly Gln Val Arg Val Gly
115 120 125
Asp Gln Glu Phe Ala Ala Ser Arg Gly Val Val Ile Ala Thr Gly Thr
130 135 140
Ala Ala Val Val Pro Pro Ile Glu Gly Leu Ser Gly Thr Pro Phe Trp
145 150 155 160
Thr Asn Arg Glu Ala Val Glu Ala Ala Ala Leu Pro Ala Ser Met Leu
165 170 175
Val Leu Gly Gly Gly Ala Ile Gly Cys Glu Leu Ala Gln Ala Tyr Ala
180 185 190
Arg Phe Gly Val Gln Val Thr Val Ile Glu Gly Ser Pro Arg Val Leu
195 200 205
Ala Met Glu Glu Pro Glu Ser Ser Glu Val Ala Ala Ala Ala Leu Thr
210 215 220
Ala Asp Gly Val Arg Ile Val Thr Gly Val Arg Ala Gln Lys Val Ala
225 230 235 240
His Asp Asp Gly Phe His Val Thr Leu Ser Asp Gly Ser Val Leu Ala
245 250 255
Gly Glu Lys Leu Leu Val Ala Thr Gly Arg Ala Ala Arg Leu Gly Gly
260 265 270
Leu Gly Leu Asp Arg Val Gly Leu Asp Pro Ser Ala Arg Phe Leu Ala
275 280 285
Thr Asp Asp Arg Leu Arg Ala Gly Glu Gly Ile Trp Ala Val Gly Asp
290 295 300
Val Thr Gly Asn Gly Ala Phe Thr His Met Ala Met Tyr Glu Ala Asp
305 310 315 320
Ile Ala Val Arg Asp Ile Leu Gly Gln Gly Gly Pro Gly Ala Asp Tyr
325 330 335
Arg Ala Arg Pro Arg Val Thr Phe Leu Asp Pro Glu Ile Gly Ala Val
340 345 350
Gly Met Thr Glu Gln Gln Ala Arg Asp Ala Gly Leu Glu Val Arg Val
355 360 365
Gly Tyr Val Pro Leu Asn Gln Thr Ser Arg Gly Phe Ile His Gly Pro
370 375 380
Gly Asn Glu Gly Phe Leu Lys Leu Val Ala Asp Gly Glu Arg Gly Val
385 390 395 400
Leu Val Gly Gly Thr Thr Ala Gly Gln Ser Gly Gly Glu Met Ile Gly
405 410 415
Ala Val Ala Val Ala Val His Ala Glu Val Pro Val Ser Thr Leu Leu
420 425 430
Ser Gln Ile Trp Ala Tyr Pro Thr Phe His Arg Gly Leu Gly Gln Ala
435 440 445
Leu Gln Ser Leu Ala
450
<210> 64
<211> 116
<212> PRT
<213> Artificial Sequence
<220>
<223> >ACSP50_1631
<400> 64
Met Ser Glu Pro Val Ile Thr Glu Pro Ala Ala Trp Ile Asn Leu Pro
1 5 10 15
Asp Leu Ser Glu Arg Leu Asp Val Ser Ile Ser Lys Val His Gln Met
20 25 30
Ile Arg Asp Gly Asp Leu Leu Ala Val Arg Arg Asp Gly Ile Arg Val
35 40 45
Val Pro Ala Glu Leu Val Ala Asn Ala Thr Val Leu Lys His Leu Pro
50 55 60
Gly Val Leu Asn Val Leu Arg Asp Ala Gly Tyr Asn Asp Glu Glu Ala
65 70 75 80
Phe Arg Trp Leu Tyr Ala Glu Asp Ala Glu Val Gly Gly Ser Ala Ala
85 90 95
Ile Ala Leu Gly Gly Gln Gln Ala Arg Glu Ile Lys Arg Arg Ala Gln
100 105 110
Ala Leu Gly Phe
115
<210> 65
<211> 108
<212> PRT
<213> Artificial Sequence
<220>
<223> >ACSP50_1632
<400> 65
Met Arg His Leu Ser Tyr Val Ala Val Leu Ala Gly Cys Leu Ala Gly
1 5 10 15
Ala Leu Trp Leu Glu Pro Ile Leu Arg Val Asn Val Leu Arg Arg Trp
20 25 30
Arg Arg Leu Leu Leu Ala Val Leu Pro Met Ala Val Val Phe Thr Leu
35 40 45
Trp Asp Leu Ala Ala Ile Ala Ala Gly His Trp His Phe Asp Pro Ala
50 55 60
Gln Ile Thr Gly Val Tyr Leu Gly Gly Gly Leu Pro Leu Asp Glu Val
65 70 75 80
Leu Phe Phe Leu Val Val Pro Val Cys Ala Ile Leu Gly Phe Glu Ala
85 90 95
Val Arg Ala Val Leu Arg Arg Pro Ala Gly Asp Glu
100 105
<210> 66
<211> 111
<212> PRT
<213> Artificial Sequence
<220>
<223> >ACSP50_1633
<400> 66
Met Thr Tyr Thr Thr Ala Ala Val Leu Gly Val Leu Ala Ala Leu Thr
1 5 10 15
Leu Asp Val Leu Ile Leu Arg Thr Arg Leu Val Gly Arg Leu Val Phe
20 25 30
Trp Ala Thr Tyr Pro Ile Ile Phe Val Phe Gln Leu Ile Ser Asn Gly
35 40 45
Ile Leu Thr Gly Arg Asp Ile Val Met Tyr Asp Pro Ala Ala Ile Leu
50 55 60
Gly Pro Arg Leu Val His Ala Pro Val Glu Asp Leu Leu Phe Gly Phe
65 70 75 80
Ala Leu Val Leu Gly Thr Leu Ser Leu Trp Val Ala Leu Gly Arg Arg
85 90 95
Gly Ile Gln Arg Thr Pro Arg Ala Gly Ser Arg Arg Thr Asp Glu
100 105 110
<210> 67
<211> 356
<212> PRT
<213> Artificial Sequence
<220>
<223> >CrtE fps2(ACSP50_1634)
<400> 67
Met Thr Asn Ser Pro Leu Asp Glu Ala Gly Leu Arg Ser Arg Val Asp
1 5 10 15
Lys Ala Leu Thr Val Phe Leu Ala Gly Gln Arg Asp Arg Leu Leu Ala
20 25 30
Ile Asp Pro Ala Leu Ala Glu Met Ser Ala Thr Val Ser Glu Phe Val
35 40 45
Leu Gly Gly Gly Lys Arg Leu Arg Pro Ala Phe Ala Tyr Trp Gly Phe
50 55 60
Arg Gly Ala Gly Gly Ala Asp Ser Asp Ala Val Val Ala Ala Val Ala
65 70 75 80
Ala Leu Glu Leu Val Gln Ala Ser Ala Leu Ile His Asp Asp Leu Met
85 90 95
Asp Arg Ser Asp Thr Arg Arg Gly Val Pro Ser Val His Arg Arg Phe
100 105 110
Glu Lys Leu His Ala Gly Glu Gly Trp Arg Gly Ser Ala Ala Gly Phe
115 120 125
Gly Asp Cys Ala Ala Val Leu Leu Gly Asp Leu Ala Leu Val Trp Ser
130 135 140
Asp Glu Leu Leu His Thr Ser Gly Met Ala Val Ala Asp Val Gln Arg
145 150 155 160
Ala Arg Pro Ile Phe Asp Gly Met Arg Thr Glu Val Thr Val Gly Gln
165 170 175
Tyr Leu Asp Val Leu Thr Gln Ala Thr Gly Asp Thr Ser Leu Glu Arg
180 185 190
Ala Gly Lys Val Ala Val Tyr Lys Ala Ala Lys Tyr Thr Val Glu Arg
195 200 205
Pro Leu Leu Leu Gly Ala Ala Leu Ala Gly Ala Ala Pro Gly Val His
210 215 220
Ala Ala Tyr Ser Ala Phe Gly Leu Pro Leu Gly Glu Ala Phe Gln Leu
225 230 235 240
Arg Asp Asp Val Leu Gly Val Phe Gly Asp Pro Glu Arg Thr Gly Lys
245 250 255
Pro Ala Gly Asp Asp Leu Arg Glu Gly Lys Arg Thr Tyr Leu Val Ala
260 265 270
Ala Ala Phe Gly Ala Leu Asp Ala Ala Gly Arg Ala Glu Leu Asp Ala
275 280 285
Ala Leu Gly Asp Pro Gly Leu Asp Glu Ala Gly Val Ala Arg Leu Arg
290 295 300
Thr Val Ile Arg Asp Ser Gly Ala Leu Ala Ala Thr Glu Ala Arg Ile
305 310 315 320
Asp Glu Leu Met Thr Ala Ser Ile Gly Ala Leu Asp Ala Ala Pro Ile
325 330 335
Asp Gln Asp Ala Arg Glu Val Leu Arg Arg Leu Ala Asp Ala Ala Thr
340 345 350
Arg Arg Ser Val
355
<210> 68
<211> 307
<212> PRT
<213> Artificial Sequence
<220>
<223> >ACSP50_1635
<400> 68
Met Ser Leu Gly Leu Pro Ser Arg Leu Pro Gly Thr Pro Ser Ile Gly
1 5 10 15
Asp Leu Val Arg Gly Ala Ala Pro Thr Phe Ser Phe Glu Phe Phe Pro
20 25 30
Pro Lys Thr Pro Asp Gly Glu Arg Leu Leu Trp Gln Ala Ile Arg Glu
35 40 45
Leu Glu Ser Leu Arg Pro Ser Phe Val Ser Ile Thr Tyr Gly Ala Gly
50 55 60
Gly Thr Thr Arg Glu Thr Thr Val Ala Val Thr Glu Arg Val Ala Thr
65 70 75 80
Glu Thr Thr Leu Leu Pro Leu Ala His Leu Thr Ala Val Asp His Ser
85 90 95
Val Ala Asp Leu Arg Asn Val Ile Gly Arg Leu Ala Gly Ala Gly Ile
100 105 110
Arg Asn Val Leu Ala Leu Arg Gly Asp Pro Pro Gly Asp Pro Met Gly
115 120 125
Glu Trp Val Arg His Pro Asp Gly Val Gly Tyr Ala Asp Glu Leu Val
130 135 140
Arg Leu Ile Arg Glu Ser Gly Asp Phe Ser Val Gly Val Ala Ala Phe
145 150 155 160
Pro His Lys His Pro Arg Ser Ala Gly Val Lys Asp Asp Thr Arg Asn
165 170 175
Phe Val Arg Lys Cys Arg Ala Gly Ala Asp Tyr Ala Ile Thr Gln Met
180 185 190
Phe Phe Asp Ala Asp Glu Tyr Leu Arg Leu Arg Asp Arg Val Val Ala
195 200 205
Ala Gly Cys His Thr Pro Ile Val Ala Gly Val Met Pro Val Thr Arg
210 215 220
Met Ala Thr Ile Ala Arg Ser Thr Gln Leu Ser Gly Ala Pro Phe Pro
225 230 235 240
Pro Ala Leu Leu Arg Asp Phe Glu Arg Val Ala Gly Asp Asp Ala Ala
245 250 255
Val Arg Glu Leu Gly Ile Glu Thr Cys Ala Ala Met Cys Ala Arg Leu
260 265 270
Leu Arg Glu Gly Val Pro Gly Ile His Phe Ile Thr Met Asn Arg Ser
275 280 285
Thr Ala Thr Arg Glu Val Trp Gln Arg Leu Ala Pro Ala Glu Val Ala
290 295 300
Ala Ser Ala
305
<210> 69
<211> 310
<212> PRT
<213> Artificial Sequence
<220>
<223> >ACSP50_1650
<400> 69
Met Gln Leu Gln Gln Leu Arg Tyr Phe Leu Ala Val Val Glu Thr Arg
1 5 10 15
His Phe Thr Gln Ala Ala Asp Ile Leu Gly Val Ser Gln Pro Thr Leu
20 25 30
Ser Lys Gln Ile His Thr Leu Glu Met Ser Leu Gly Ala Pro Leu Phe
35 40 45
Glu Arg Met Arg Gly Ala Val Thr Leu Thr Val Ala Gly Glu Thr Leu
50 55 60
Leu Pro Met Ala Gln Arg Ile Val Ala Asp Ala Asp Ala Ala Arg Asp
65 70 75 80
Ala Val Gln Asp Ile Val Gly Leu Arg Arg Gly Glu Val Arg Leu Gly
85 90 95
Ala Thr Pro Ser Leu Cys Ser Ser Leu Val Pro Ala Val Leu Arg Thr
100 105 110
Phe Arg Ala Asp His Pro Gly Val Lys Leu His Ile Ser Glu Gly Ser
115 120 125
Ser His Asp Leu Thr Ala Gly Leu Leu Ala His Thr Leu Asp Leu Ala
130 135 140
Leu Ile Val Gln Pro Glu His Gly Val Asp Pro Ala Leu Val Ala Ile
145 150 155 160
Glu Leu Leu Arg Glu Ser Leu Val Val Ala Ser Val Ala Ala Gly Pro
165 170 175
Pro Pro Thr Val Gly Arg Gln Leu Glu Leu Ser Glu Leu Arg His Thr
180 185 190
Pro Met Val Met Phe Arg Glu Gly Tyr Asp Ile Arg Glu Val Thr Leu
195 200 205
His Ala Cys Glu Arg Ala Gly Phe Ala Pro Lys Phe Ala Val Glu Gly
210 215 220
Gly Glu Met Asp Ala Val Leu Ala Phe Val Glu Ala Gly Leu Gly Val
225 230 235 240
Ala Leu Val Pro Ser Met Val Leu Ala Asn Arg Pro Leu Leu Arg Ala
245 250 255
Thr Pro Leu Ala Pro Pro Gly Met Arg Arg Thr Ile Ala Leu Ala Gln
260 265 270
Arg Arg Ala Ala Val Leu Pro His Ala Ala Ala Ala Leu Arg Glu Val
275 280 285
Val Leu Asp His Ile Gly Ser Gly Arg Leu Pro Phe Gly Val Arg Ala
290 295 300
Leu Glu Arg Pro Ser Thr
305 310
<210> 70
<211> 249
<212> PRT
<213> Artificial Sequence
<220>
<223> >ACSP50_1651
<400> 70
Met Gly Glu Phe His Asp Pro Arg Leu Val Glu Val Tyr Asp Ala Glu
1 5 10 15
Cys Pro Trp Gly Trp Asp Asp Asp Phe Phe Met Ala Val Leu Ala Glu
20 25 30
Arg Ser Ala His Arg Val Ala Asp Leu Gly Cys Gly Thr Gly Arg Leu
35 40 45
Ala Ile Ala Met Ala Ala Ala Gly His Glu Val Ile Ala Ile Asp Pro
50 55 60
Ala Pro Ala Ala Leu Ala Ala Ala Arg Arg Lys Pro Gly Gly Thr Arg
65 70 75 80
Val Arg Trp Leu Gln Gly Ser Ala Glu Arg Leu Ala Pro Arg Ser Leu
85 90 95
Asp Ala Ala Phe Met Thr Gly His Val Ala Gln Ser Phe Val Asp Asp
100 105 110
Glu Glu Trp Asp Thr Val Leu Arg Gly Leu Arg Arg Ala Leu Val Pro
115 120 125
Glu Gly Arg Leu Val Phe Asp Ser Arg Asp Pro Asp Asp Arg Pro Trp
130 135 140
Gln Gln Trp Asn Pro Gln Asp Ser Trp Arg Thr Val Val Leu Asp Asp
145 150 155 160
Gly Arg Val Val Glu Ala Trp Ser Glu Ala Glu Gln Val Gly Leu Asn
165 170 175
Thr Val Arg Val Thr Gly Arg Tyr Arg Phe Ala Asp Gly Gly Glu Leu
180 185 190
Ala Asn Ser Ala Thr Leu Arg Phe Arg Thr Glu Pro Glu Leu Arg Asp
195 200 205
Ser Leu Arg Glu Ala Gly Phe Arg Val Glu Arg Ile Tyr Gly Gly Trp
210 215 220
Gly Arg Glu Pro Val Gly Leu Ser Gly Asp Gly Glu Phe Ile Val Ile
225 230 235 240
Ala Val Ala Thr Pro Arg Leu Met Ser
245
<210> 71
<211> 573
<212> PRT
<213> Artificial Sequence
<220>
<223> >ACSP50_1652
<400> 71
Met Pro Glu Asn Glu Trp Pro Asp Asp Pro Arg Pro Pro Asp Gln Gly
1 5 10 15
Glu Trp Ser Gln Pro His His Glu Pro Pro Pro Gly Arg Gly Arg Ala
20 25 30
Leu Leu Ala Ala Ala Val Val Val Leu Val Leu Leu Ala Ala Gly Gly
35 40 45
Ile Ala Trp Arg Leu Met Ser Ser Arg Gly Ala Thr Pro Val Ala Gln
50 55 60
Pro Thr Ala Pro Ala Pro Thr Pro Thr Ala Gln Thr Ala Pro Pro Cys
65 70 75 80
Pro Gln Pro Arg Leu Arg Val Ala Ala Ala Pro Glu Ile Ala Pro Val
85 90 95
Ile Gln Gln Ala Ala Ala Ala Leu Ser Gln Pro Gly Gln Arg Cys Ser
100 105 110
Glu Val Leu Val Gln Ala Ala Glu Pro Gly Ala Ala Leu Thr Gly Lys
115 120 125
Pro Asp Val Trp Val Pro Ser Ser Ser Val Trp Leu Ala Leu Ala Lys
130 135 140
Ser Arg Gly Asp Val Tyr Thr Thr Gln Gly Ala Ser Leu Ala Trp Ser
145 150 155 160
Pro Leu Val Ile Ala Gly Pro Glu Ser Ile Ala Ser Leu Phe Ala Pro
165 170 175
Asn Gly Val Thr Ser Trp Ser Gly Leu Val Gln Gly Thr Ile Gln Lys
180 185 190
Arg Val Pro Ala Val Arg Met Pro Asp Pro Thr Leu Thr Thr Thr Gly
195 200 205
Leu Leu Ser Val Tyr Ala Val Gly Gln Ala Thr Val Lys Ala Asn Pro
210 215 220
Asp Ala Gly Ile Ala Gln Leu Gln Ala Leu Thr Leu Arg Ser Arg Leu
225 230 235 240
Glu Asn Ala Ala Ala Asp Pro Ala Glu Leu Phe Ala Gln Met Gly Lys
245 250 255
Gln Thr Asp Ala Ala Thr Ala Ile Tyr Gln Val Gly Val Phe Pro Thr
260 265 270
Thr Glu Gln Gln Leu Leu Thr Tyr Gln Lys Ser Gln His Asp Val Arg
275 280 285
Leu Ser Gly Ser Ala Pro Ala Asp Gly Gln Ile Asp Ala Asp Tyr Pro
290 295 300
Tyr Ala Val Arg Lys Gly Ala Pro Ala Asp Leu Val Glu Ser Leu Arg
305 310 315 320
Glu Ala Ile Thr Pro Asp Ala Leu Thr Thr Ala Gly Phe Arg Ala Thr
325 330 335
Ala Thr Lys Asn Ala Leu Arg Leu Pro Ala Pro Ala Val Leu Ala Gly
340 345 350
Ala Ala Arg Gln Trp Ser Ala Tyr Lys Ser Val Ala Phe Gln Val Leu
355 360 365
Leu Leu Ile Asp Ala Ser Gly Ser Met Asn Glu Lys Ile Thr Asp Arg
370 375 380
Ala Gly Arg Ser Val Thr Lys Ala Ala Leu Leu Arg Glu Ser Gly Thr
385 390 395 400
Ser Ala Ala Gln Leu Phe Gly Asp Asp Thr Ser Leu Gly Leu Trp Phe
405 410 415
Phe Gly Thr Pro Thr Ala Asp Ser Pro Ala His Thr Glu Glu Val Pro
420 425 430
Phe Gly Pro Val Ile Ala Thr Val Asp Gly Lys Ser Arg Arg Asp Leu
435 440 445
Leu Ala Ala Lys Ile Gly Glu Tyr Arg Pro Val Ala Asn Ala Gly Thr
450 455 460
Pro Leu Tyr Gln Ser Val Leu Asp Gly Val Ala Glu Met Arg Gly Arg
465 470 475 480
Ala Lys Pro Asp Thr Ala Thr Val Val Val Val Leu Thr Asp Gly Ser
485 490 495
Asp Gly Gly Thr Lys Tyr Arg Met Ser Asn Ala Asp Phe Leu Lys Lys
500 505 510
Leu Thr Ala Gly Ala Asp Pro Ala Lys Pro Val Pro Val Ile Ala Val
515 520 525
Gly Tyr Gly Pro Ala Ala Asn Ala Thr Ala Leu Gln Ala Met Ala Lys
530 535 540
Ala Thr Gly Gly Gln Ala Val Thr Val Lys Asn Pro Ala Asp Leu Ala
545 550 555 560
Ala Gly Ile Ala Gln Ala Phe Leu Ala Ala His Thr His
565 570
<210> 72
<211> 478
<212> PRT
<213> Artificial Sequence
<220>
<223> >CrtD (ACSP50_1653)
<400> 72
Met Ser Asp Ile Val Val Val Gly Ala Gly Val Gly Gly Leu Ala Ala
1 5 10 15
Ala Ile Arg Leu Ala Glu Ala Gly His Arg Val Ser Ile His Glu Arg
20 25 30
Ser Gly Val Val Gly Gly Lys Leu Ala Ala Tyr Glu Arg Asp Gly Tyr
35 40 45
Arg Phe Asp Thr Gly Pro Ser Leu Leu Thr Leu Pro Asp Val Phe Thr
50 55 60
Gly Leu Gly Leu Asp Leu Arg Pro Glu Pro Leu Asp Pro Val Val Arg
65 70 75 80
His Phe Phe Pro Asp Gly Thr Val Leu Asp Ser Ser Ser Asp His Glu
85 90 95
Thr Phe Leu Ala Arg Ile Thr Asp Ala Leu Gly Gly Ala Ala Ala Arg
100 105 110
Asp Trp Asp Arg Phe Trp Arg Arg Ala Glu Arg Ile Trp His Ala Ser
115 120 125
Trp Glu Ser Val Leu Arg Arg Pro Val Thr Ala Ala Ser Leu Ala Arg
130 135 140
Leu Ser Trp Arg Leu Gly Asp Leu Ala Ala Ile Ala Pro Gly Arg Ser
145 150 155 160
Leu Arg Ser Leu Gly Arg Arg Tyr Leu Arg Asp Pro Arg Leu Arg Met
165 170 175
Leu Leu Asp Arg Tyr Ala Thr Tyr Ser Gly Ala Asp Pro Arg Arg Ala
180 185 190
Pro Ala Ala Leu Ala Ala Ile Pro Tyr Ala Glu Leu Ala Phe Gly Gly
195 200 205
Trp Tyr Leu Pro Gly Gly Leu Val Thr Leu Ala Glu Ala Leu Leu Ala
210 215 220
Arg Cys Glu Lys Leu Gly Val Arg Val His Leu His Ser Pro Val Ala
225 230 235 240
Ser Ile Ala Thr Thr Gly Ala Arg Val Ser Gly Val Arg Leu Gly Asp
245 250 255
Gly Thr Arg Leu Ala Ala Asp Val Val Val Ser Asn Val Asp Ala Val
260 265 270
Thr Leu Tyr Arg Asp Leu Leu Pro Ser Pro Lys Pro Leu Ala Arg Leu
275 280 285
Ala Asp Arg Ser Leu Ala Gly Phe Val Leu Leu Leu Ala Val Arg Gly
290 295 300
Glu Thr Pro Arg Leu Ala His His Asn Val Phe Phe Pro Arg Asp Tyr
305 310 315 320
Asp Ala Glu Phe Asp Ala Val Phe Gly Gly Pro Gly Arg Arg Ala Arg
325 330 335
Pro Ala Gly Asp Pro Thr Val Phe Val Thr Arg Ala Ala Asp Pro Ala
340 345 350
Val Arg Pro Ala Gly Asp Glu Ala Trp Phe Val Leu Val Asn Ala Ala
355 360 365
Pro His Gly Thr Ser Trp Ser Thr Val Asp Trp Leu Arg Ala Gly Leu
370 375 380
Ala Asp Ala Tyr Arg Asp Arg Val Leu Glu Val Leu Ala Gly Arg Gly
385 390 395 400
Leu Asp Val Arg Asp Arg Leu Ile Phe Ala Glu Thr Arg Thr Pro Ala
405 410 415
Asp Leu Ala Ala Ser Ala Ala Ala Pro Gly Gly Ala Ile Tyr Gly Thr
420 425 430
Ala Gly Gly Leu Val Arg Pro Ala Asn Arg Ala Pro Val Asp Gly Leu
435 440 445
Phe Leu Val Gly Gly Ser Thr His Pro Gly Gly Gly Leu Pro Met Val
450 455 460
Thr Leu Ser Ala Glu Ile Val Ala Gly Met Ile Gly Ser Asn
465 470 475
<210> 73
<211> 359
<212> PRT
<213> Artificial Sequence
<220>
<223> >CruC (ACSP50_1654)
<400> 73
Met Ile Val Ala Trp Leu Ile Leu Pro Pro Leu Leu Leu Ile Thr Ala
1 5 10 15
His Thr Ala Val Asn Ala Leu Leu Leu Arg Arg Pro Arg Arg Ala Ala
20 25 30
Thr Ser Thr Glu Arg Val Ala Val Leu Leu Pro Leu Arg Asp Glu Ala
35 40 45
Thr Arg Val Thr Pro Cys Leu Arg Ala Leu Leu Ala Gln Arg Gly Val
50 55 60
Ala Asp Leu Thr Val His Val Leu Asp Asp Gly Ser Thr Asp Gly Thr
65 70 75 80
Ala Asp Val Val Arg Ala Val Ala Gly Asp Arg Val Arg Leu His Thr
85 90 95
Gly Thr Pro Pro Pro Pro Gly Trp Leu Gly Lys Pro Ala Ala Cys Gln
100 105 110
Arg Leu Ala Asp Leu Ala Gly Asp Val Asp Val Leu Val Phe Val Asp
115 120 125
Ala Asp Val Val Leu Ala Pro Asp Ala Val Ala Gly Ala Val Asp Leu
130 135 140
Leu Arg Arg Ala Gly Ala Asp Leu Leu Ser Pro Tyr Pro Lys Ile Val
145 150 155 160
Gly Ala Gly Arg Leu Val Gln Pro Leu Leu Gln Trp Ser Trp Leu Ser
165 170 175
Phe Leu Pro Leu Arg Ala Met Glu Arg Ser Ala Arg Pro Ser Leu Ala
180 185 190
Ala Ala Gly Gly Gln Trp Leu Val Leu Asp Arg Ala Gly Tyr Arg Arg
195 200 205
Ala Gly Gly His Ala Ala Val Arg Gly Glu Ile Leu Glu Asp Ile Ala
210 215 220
Leu Ala Arg Ala Val Lys Arg Ala Gly Gly Arg Ile Ala Leu Ala Asp
225 230 235 240
Gly Ser Gly Leu Ala Thr Cys Arg Met Tyr Glu Ser Trp Asp Glu Leu
245 250 255
Ala Asp Gly Tyr Ala Lys Ser Leu Trp Ala Ser Leu Gly Ser Ala Ala
260 265 270
Gly Ala Thr Ala Val Thr Leu Leu Leu Ile Leu Leu Tyr Val Val Pro
275 280 285
Pro Leu Leu Ala Pro Phe Ala Pro Leu Pro Ala Val Leu Gly Tyr Leu
290 295 300
Leu Gly Val Thr Gly Arg Met Ile Ala Ala Arg Ala Thr Gly Gly Arg
305 310 315 320
Val Leu Pro Gly Thr Leu Ala His Pro Val Ser Ile Val Leu Phe Gly
325 330 335
Tyr Leu Ile Ala Arg Ser Phe Arg Leu Arg Arg Ala Gly Arg Leu Ala
340 345 350
Trp Arg Gly Arg Pro Val Pro
355
<210> 74
<211> 251
<212> PRT
<213> Artificial Sequence
<220>
<223> >CruF (ACSP50_1655)
<400> 74
Met Ser Pro Arg His Leu Pro Trp Gly Leu Leu Gly Ala Leu Val Leu
1 5 10 15
Ala Gln Ile Cys Tyr Pro Leu Thr Glu Gly Asp Thr Arg Ala Gly Leu
20 25 30
Thr Val Leu Thr Val Leu Leu Gly Val Ala Phe Ser Leu Ser His Ala
35 40 45
Leu Leu Thr Arg Gly Pro Arg Ala Leu Thr Ala Leu Leu Ser Thr Ala
50 55 60
Thr Leu Gly Gly Phe Ala Val Glu Ala Ile Gly Val Ala Thr Gly Phe
65 70 75 80
Pro Phe Gly Ser Tyr Glu Tyr Ser Gly Arg Leu Gly Pro Arg Leu Leu
85 90 95
Gly Val Pro Leu Ile Ile Pro Leu Ala Trp Thr Trp Met Ala Trp Pro
100 105 110
Ala Trp Leu Ala Ala Leu Arg Val Thr Arg Arg Arg Leu Pro Arg Ile
115 120 125
Leu Val Ala Gly Ala Gly Leu Ala Ala Trp Asp Val Phe Leu Asp Pro
130 135 140
Gln Met Val Ala Glu Asp Tyr Trp Arg Trp Arg His Pro Val Pro Ala
145 150 155 160
Leu Pro Gly Val Pro Gly Val Pro Leu Gly Asn Tyr Leu Gly Trp Leu
165 170 175
Gly Phe Ala Leu Leu Leu Met Thr Ala Leu Ala Ala Val Ala Gly Arg
180 185 190
Ala Ala Asp Arg Pro Leu Ser Ala Asp Arg Pro Ala Leu Ala Leu Trp
195 200 205
Ile Trp Thr Tyr Ala Ser Ser Val Leu Ala His Ala Val Phe Leu Ser
210 215 220
Leu Pro Ala Ser Ala Ala Trp Gly Ala Leu Ile Met Gly Ala Ala Val
225 230 235 240
Leu Pro Leu Leu Ala Arg Leu Arg Ala Pro Ala
245 250
<210> 75
<211> 192
<212> PRT
<213> Artificial Sequence
<220>
<223> >ACSP50_1656
<400> 75
Met Arg Leu Val Ala Trp Gln Pro Asp Asp Leu Leu Arg Arg Leu Asp
1 5 10 15
Asp Val Val Gly Val Tyr Gly Glu Ala Met Gly Tyr Arg Gln Glu Leu
20 25 30
Leu Gln Thr Arg Arg Gly Tyr Ile Gly Ser His Val Arg Arg Pro Gly
35 40 45
Phe Arg Ala Val Ala Thr Leu Thr Thr Glu Gly Arg Leu Met Gly Phe
50 55 60
Gly Tyr Gly Tyr Thr Ser Ala Ala Gly Gln Trp Trp His Asp Gln Val
65 70 75 80
Arg Phe Ala Leu Gly Glu Asp Asp Arg Arg Gln Trp Leu Thr Asp Cys
85 90 95
Phe Glu Val Val Glu Leu His Val Arg Pro Ala Ala Gln Gly His Gly
100 105 110
Val Gly Ala Arg Gln Leu Arg Ala Leu Leu Ala Met Ala Lys Gly Arg
115 120 125
Thr Val Leu Leu Ser Thr Pro Glu Ala Asp Glu Gln Ala Ser Arg Ala
130 135 140
Trp Arg Leu Tyr Arg Arg Tyr Gly Phe Ala Asp Val Leu Arg His Phe
145 150 155 160
Tyr Phe Pro Gly Asp Glu Arg Ala Phe Ala Val Leu Gly Arg Glu Leu
165 170 175
Pro Leu Ala Glu Arg Pro Leu Glu Asp Ala Pro Gly Ile Ala Gly Ala
180 185 190
<210> 76
<211> 224
<212> PRT
<213> Artificial Sequence
<220>
<223> >ACSP50_1657
<400> 76
Met Thr His Val Ala Leu His Val Trp Arg Val Pro Arg Ser Ala Val
1 5 10 15
Gly Ser Ala Met Leu Arg Met Ala Phe Ala Arg Arg His Leu Ala Gly
20 25 30
Leu Arg Phe Gly Lys Phe Leu Gly Thr Gly Thr Gly Thr Gly Phe Gly
35 40 45
Pro Gly Asp Thr Asp Leu Thr Arg Trp Ala Ala Ile Thr Val Ser Asp
50 55 60
Ala Pro Val Arg Phe Pro Val Trp Glu Arg Ile Ala Val Asn Gly Ala
65 70 75 80
Arg Ile Asp Leu Glu Pro Leu Ile Ser Arg Gly Thr Trp Ala Gly Arg
85 90 95
Thr Pro Phe Glu Pro Thr Gly Arg Arg Pro Asp Gly Pro Val Leu Ala
100 105 110
Leu Thr Arg Ala Arg Leu Arg Pro Ala Arg Ala Leu Thr Phe Trp Arg
115 120 125
Ala Val Pro Ala Val Val Arg Glu Val His Arg Ala Pro Gly Leu Leu
130 135 140
Ala Arg Phe Gly Val Gly Glu Ala Pro Ile Gly Trp Gln Gly Thr Val
145 150 155 160
Thr Val Trp Arg Asp Ala Ala Asp Leu Val Ala Phe Ala Tyr Arg Gln
165 170 175
Pro Glu His Arg Ala Ala Ile Ala Arg Thr Pro Ala Asp Arg Trp Tyr
180 185 190
Ala Glu Glu Leu Phe Ala Arg Phe Ala Val Leu Gly Ile Ser Gly Asp
195 200 205
Arg Ser Val Leu Gly Trp Thr Ala Asp Glu Gly Glu Arg Ala Glu Ala
210 215 220
<210> 77
<211> 271
<212> PRT
<213> Artificial Sequence
<220>
<223> >ACSP50_1658
<400> 77
Met Thr Gln Thr Ile Val Ile Thr Gly Ala Ser Ser Gly Val Gly Leu
1 5 10 15
Ala Ala Ala Glu Gln Leu Ala Ala Arg Gly Asp Glu Val Val Leu Val
20 25 30
Gly Arg Asp Pro Gly Arg Leu Asp Ala Ala Val Gln Arg Val Arg Glu
35 40 45
Ala Gly Gly Gly Arg Ala Pro Arg His Phe Arg Ala Asp Phe Glu Arg
50 55 60
Leu Asp Asp Val Arg Glu Leu Ala Ala Gly Leu Leu Ala Glu Leu Pro
65 70 75 80
Arg Ile Asp Val Leu Ala Asn Asn Ala Gly Gly Ile Ile Lys Arg Pro
85 90 95
Arg Gln Thr Val Asp Gly His Glu Ala Thr Ile Gln Gly Asn His Leu
100 105 110
Ala Pro Phe Leu Leu Thr His Leu Leu Arg Glu Arg Leu Thr Gly Gly
115 120 125
Arg Val Val Asn Thr Ala Ser Ala Ala His Val Gln Gly Arg Pro Gly
130 135 140
Thr Arg Phe Thr Asp Asp Pro Lys Ser Tyr Ser Pro Trp Arg Ser Tyr
145 150 155 160
Gly Ala Ser Lys Ala Ala Asn Ile Leu Phe Ala Ala Glu Ala Ala Arg
165 170 175
Arg Trp Pro Asp Val Cys Ser Val Ser Phe His Pro Gly Val Val Arg
180 185 190
Thr Asn Phe Gly Glu Gly Arg Leu Ile Arg Leu Phe Tyr Arg Tyr Ala
195 200 205
Pro Gly Leu Val Thr Pro Glu Ala Ala Gly Glu Leu Leu Thr Trp Leu
210 215 220
Cys Thr Thr Pro Ala Gly Glu Leu Glu Asn Gly Ala Tyr Tyr Val Lys
225 230 235 240
Arg Gln Val Thr Arg Pro Ala Ala His Ala Arg Asp Pro Arg Leu Ala
245 250 255
Ala Glu Leu Trp Asp Ala Ser Leu Thr Ala Thr Gly Leu Ala Gly
260 265 270
<210> 78
<211> 339
<212> PRT
<213> Artificial Sequence
<220>
<223> >CrtE (ACSP50_3873)
<400> 78
Met Ile Asp Asp Phe Leu Ser Ala Gln Arg Asp Val Leu Ala Glu Val
1 5 10 15
Ser Asp Asp Cys Ala Pro Leu Glu Arg Tyr Val Ala Asp Leu Met Gly
20 25 30
Gly Gly Lys Arg Leu Arg Pro Ala Phe Cys Tyr Trp Ala Trp Arg Ala
35 40 45
Ala Gly Ala Pro Asp Gly Pro Gly Ile Val Ala Ala Ala Thr Ser Leu
50 55 60
Glu Phe Leu Gln Ala Ala Ala Leu Ile His Asp Asp Ile Met Asp Asp
65 70 75 80
Ser Asp Thr Arg Arg Gly Ala Pro Ala Val His Arg Arg Leu Ala Ala
85 90 95
Leu His Ser Gly Gly Arg Trp Ala Gly Asp Ala Asp His Phe Gly Leu
100 105 110
Ser Ala Ala Val Leu Ala Gly Asp Leu Cys Leu Thr Trp Ser Asp Ala
115 120 125
Leu Tyr Ser Gly Ser Gly Leu His Pro Ser Ala Leu Ala Arg Gly Arg
130 135 140
Pro Val Phe Asp Arg Met Arg Thr Gln Leu Met Gly Gly Gln Tyr Leu
145 150 155 160
Asp Leu Leu Asp Gln Ala Arg Pro Ser Arg Gly Gly Val Asp Arg Ala
165 170 175
Arg Arg Val Val His Phe Lys Ser Ala Lys Tyr Thr Val Glu His Pro
180 185 190
Leu Leu Leu Gly Ala Arg Leu Ala Gly Ala Asp Asp Asp Leu Leu Ala
195 200 205
Arg Leu Ser Ala Phe Gly Leu Pro Leu Gly Glu Ala Phe Gln Leu Arg
210 215 220
Asp Asp Leu Leu Gly Val Phe Gly Asp Ala Ala Gln Thr Gly Lys Pro
225 230 235 240
Thr Gly Asp Asp Leu Arg Glu Gly Lys Arg Thr Thr Leu Val Ile Leu
245 250 255
Ala Ala Asp Arg Ala Thr Ala Pro Gln Gln Ala Ala Leu Thr Ala Leu
260 265 270
Leu Gly Asp Arg Gly Leu Thr Gly Ala Gly Val Asp Thr Leu Arg Gln
275 280 285
Ile Ile Val Asp Thr Gly Ala Arg Ala Glu Val Glu Arg Met Ile Glu
290 295 300
Gln Leu Leu Ala Thr Ser Leu Gly Val Leu Ser Gly Thr Pro Val Asp
305 310 315 320
Glu Ala Ala Arg Ser Val Leu Leu Ala Leu Ala Glu Ala Ala Thr Ala
325 330 335
Arg Ser Ser
<210> 79
<211> 342
<212> PRT
<213> Artificial Sequence
<220>
<223> >ACSP50_1950
<400> 79
Met Val Ser Thr Val Ile Ala Ser Gly Pro Thr Gly Leu Gly Thr Ser
1 5 10 15
Ala Ala Arg Leu Phe Gly Arg Val Asp Arg Asp Glu Pro Glu Leu Phe
20 25 30
Cys Pro Ala Pro Leu Arg Asp Asp Arg Ala Leu Gly Glu Arg Val Asn
35 40 45
Asp Ala Val Val Gln Trp Ala Glu Lys Ala Gly Ile Tyr Pro Gly Arg
50 55 60
Leu Asp Lys Leu Arg Gly Ala Asn Phe Gly Arg Phe Met Met Leu Ala
65 70 75 80
His Pro Ala Thr Ser Asp Pro Asp Arg Leu Leu Ala Ala Thr Lys Cys
85 90 95
Leu Val Ala Glu Trp Ala Ala Asp Asp Tyr Tyr Val Asp Glu Val Ser
100 105 110
Leu Gly Ala Asp Pro Met Val Val Gly Ser Arg Leu Ala Asn Leu Tyr
115 120 125
Ser Val Val Asp Pro Ala Ser Leu Thr Pro Arg Tyr Gln Ala Asp Phe
130 135 140
Glu Lys His His Arg Leu Gln Pro Ile Ser Val Ala Phe Arg Thr Ala
145 150 155 160
Met Glu His Leu Ala Glu Tyr Ala Ser Val Thr Gln Leu Ala Arg Phe
165 170 175
Gln His Gln Met Ala Ile Leu Phe Val Ala Trp Ser Gln Glu Ala Asp
180 185 190
Trp His Ala Asn Arg Arg Thr Pro Pro Val Trp Glu Tyr Leu Val Gln
195 200 205
Arg His Leu Asn Ser Tyr Leu Pro Pro Met Ile Leu Val Asp Val Leu
210 215 220
Ala Gly Tyr Glu Leu Ser Pro Ala Glu Phe Phe Asp Pro Arg Val Arg
225 230 235 240
Ala Ala Phe Thr Thr Ala Gly Asn Ala Ala Val Leu Val Asn Asp Leu
245 250 255
Tyr Ser Gly Arg Asn Glu Ser Glu Thr Asp His Asn Leu Pro Thr Val
260 265 270
Leu Val Ser Gly Glu Arg Leu Thr Pro Arg Ala Ala Val Arg Arg Thr
275 280 285
Val Glu Ile His Asn Glu Leu Met His Thr Phe Val Thr Ser Ala Ala
290 295 300
Ser Leu Ser Ala Ser Gly Ser Pro Gln Leu Arg Arg Phe Leu Ala Asp
305 310 315 320
Thr Trp Ala Trp Leu Gly Gly Ser Arg Glu Trp His Ala Thr Ser Gly
325 330 335
Arg Tyr His Ser Ser Asn
340
<210> 80
<211> 447
<212> PRT
<213> Artificial Sequence
<220>
<223> >ACSP50_5522
<400> 80
Met Thr Thr Thr Ala Pro Thr Pro Ala His Leu Ala Gly Asn Phe Ala
1 5 10 15
Pro Val Thr Gly Glu Thr Thr Thr Leu Asp Leu Pro Val Thr Gly Ala
20 25 30
Val Pro Ala Glu Leu Thr Gly Trp Tyr Leu Arg Asn Gly Pro Asn Pro
35 40 45
His His Gly Thr Ser Ala His Trp Phe Leu Gly Asp Gly Met Val His
50 55 60
Gly Val Arg Leu Asp His Gly Arg Ala Thr Trp Tyr Arg Asn Arg Trp
65 70 75 80
Val Arg Thr Arg Val Leu Thr Asp Asp Ala Arg Ala Tyr Gly Pro Asp
85 90 95
Gly Thr Arg Asp Leu Thr Ala Gly Pro Ala Asn Thr Asn Val Val Arg
100 105 110
His Gly Gly Arg Leu Leu Ala Leu Val Glu Ser Ala Leu Pro Tyr Glu
115 120 125
Ile Thr Thr Asp Leu Glu Thr Val Gly Pro Tyr Asp Phe Gly Gly Arg
130 135 140
Leu His Thr Pro Met Thr Ala His Pro Lys Val Cys Pro Thr Thr Gly
145 150 155 160
Glu Met His Phe Phe Gly Tyr Gly Gly Leu Glu Pro Pro Tyr Leu Thr
165 170 175
Tyr His Arg Ala Gly Ala Asp Gly Arg Leu Ser Leu Ser Arg Pro Ile
180 185 190
Asp Val Pro Ala His Thr Met Met His Asp Phe Ser Leu Thr Ala Ala
195 200 205
His Val Ile Phe Met Asp Leu Pro Val Leu Phe Ser Leu Asp Gly Ala
210 215 220
Arg Thr Gly Gly Met Pro Tyr Arg Trp Asp Asp Thr Tyr Gln Ala Arg
225 230 235 240
Leu Gly Val Leu Arg Arg Asp Ala Pro Gln Gly Glu Val Arg Trp Tyr
245 250 255
Thr Ile Asp Pro Gly Tyr Val Phe His Thr Leu Asn Ala His Asp Asp
260 265 270
Gly Asp Arg Ile Val Met His Val Val Arg His Glu His Ala Tyr Arg
275 280 285
Pro Gly Gln Pro Ala Ala Ala Pro Asp Leu Trp Arg Trp Thr Ile Asp
290 295 300
Gln Arg Thr Gly Arg Val Ala Glu Glu Arg Leu Asp Asp Glu Ala Val
305 310 315 320
Glu Phe Pro Arg Ile Asp Asp Arg Arg Thr Gly Gln Pro Ala Arg Tyr
325 330 335
Gly Phe Ala Val Thr Asp Asn Val Pro Arg Arg Leu Ala Asp Val Ser
340 345 350
Ala Val Ile Arg Tyr Asp Leu His Thr Gly Ser Thr Thr Arg His Arg
355 360 365
Leu Pro Thr Gly Gln Val Pro Gly Glu Ala Val Phe Val Pro Ala Gly
370 375 380
Gly Ala Pro Ala Gly Ser Ala Asp Gly Trp Leu Leu Thr Phe Ala Tyr
385 390 395 400
Asp Pro Gly Arg Asp Ala Ser Asp Leu Ile Ile Ile Asp Ala Thr Asp
405 410 415
Leu Ala Ala Pro Pro Leu Ala Arg Ile His Leu Pro His Arg Val Pro
420 425 430
Phe Gly Phe His Gly Asn Trp Leu Pro Asp His Asp Arg Ala Glu
435 440 445
<210> 81
<211> 103
<212> DNA
<213> Artificial Sequence
<220>
<223> >tipA promoter
<400> 81
atccctagaa cgtccgggct tgcacctcac gtcacgtgag gaggcagcgt ggacggcgtg 60
gtaccaagct tattggcact agtcgagcaa cggaggtatt ccg 103
<210> 82
<211> 209
<212> DNA
<213> Artificial Sequence
<220>
<223> >gapDH promoter
<400> 82
gtactggccg atgctgggag aagcgcgctg ctgtacggcg cgcaccgggt gcggagcccc 60
tcggcgagcg gtgtgaaact tctgtgaatg gcctgttcgg ttgctttttt tatacggctg 120
ccagataagg cttgcagcat ctgggcggct accgctatga tcggggcgtt cctgcaattc 180
ttagtgcgag tatctgaaag gggatacgc 209
<210> 83
<211> 460
<212> DNA
<213> Artificial Sequence
<220>
<223> >lacZ? promoter and gene
<400> 83
taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 60
tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgacatgat 120
tacgaattcg atatcgcgcg cggccgcgga tcctctagag tcgacctgca gcccaagctt 180
ggcactggcc gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa 240
tcgccttgca gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga 300
tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg cgcctgatgc ggtattttct 360
ccttacgcat ctgtgcggta tttcacaccg cataaattcc ccaatgtcaa gcacttccgg 420
aatcgggagc gcggccgatg caaagtgccg atcaacataa 460
<210> 84
<211> 117
<212> DNA
<213> Artificial Sequence
<220>
<223> >T4 terminator
<400> 84
aagctttatg cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct 60
agggtcccca attaattagt aatataatct attaaaggtc attcaaaagg tcatcca 117
<210> 85
<211> 1818
<212> DNA
<213> Artificial Sequence
<220>
<223> >PhiC31 integrase gene
<400> 85
gtggacacgt acgcgggtgc ttacgaccgt cagtcgcgcg agcgcgagaa ttcgagcgca 60
gcaagcccag cgacacagcg tagcgccaac gaagacaagg cggccgacct tcagcgcgaa 120
gtcgagcgcg acgggggccg gttcaggttc gtcgggcatt tcagcgaagc gccgggcacg 180
tcggcgttcg ggacggcgga gcgcccggag ttcgaacgca tcctgaacga atgccgcgcc 240
gggcggctca acatgatcat tgtctatgac gtgtcgcgct tctcgcgcct gaaggtcatg 300
gacgcgattc cgattgtctc ggaattgctc gccctgggcg tgacgattgt ttccactcag 360
gaaggcgtct tccggcaggg aaacgtcatg gacctgattc acctgattat gcggctcgac 420
gcgtcgcaca aagaatcttc gctgaagtcg gcgaagattc tcgacacgaa gaaccttcag 480
cgcgaattgg gcgggtacgt cggcgggaag gcgccttacg gcttcgagct tgtttcggag 540
acgaaggaga tcacgcgcaa cggccgaatg gtcaatgtcg tcatcaacaa gcttgcgcac 600
tcgaccactc cccttaccgg acccttcgag ttcgagcccg acgtaatccg gtggtggtgg 660
cgtgagatca agacgcacaa acaccttccc ttcaagccgg gcagtcaagc cgccattcac 720
ccgggcagca tcacggggct ttgtaagcgc atggacgctg acgccgtgcc gacccggggc 780
gagacgattg ggaagaagac cgcttcaagc gcctgggacc cggcaaccgt tatgcgaatc 840
cttcgggacc cgcgtattgc gggcttcgcc gctgaggtga tctacaagaa gaagccggac 900
ggcacgccga ccacgaagat tgagggttac cgcattcagc gcgacccgat cacgctccgg 960
ccggtcgagc ttgattgcgg accgatcatc gagcccgctg agtggtatga gcttcaggcg 1020
tggttggacg gcagggggcg cggcaagggg ctttcccggg ggcaagccat tctgtccgcc 1080
atggacaagc tgtactgcga gtgtggcgcc gtcatgactt cgaagcgcgg ggaagaatcg 1140
atcaaggact cttaccgctg ccgtcgccgg aaggtggtcg acccgtccgc acctgggcag 1200
cacgaaggca cgtgcaacgt cagcatggcg gcactcgaca agttcgttgc ggaacgcatc 1260
ttcaacaaga tcaggcacgc cgaaggcgac gaagagacgt tggcgcttct gtgggaagcc 1320
gcccgacgct tcggcaagct cactgaggcg cctgagaaga gcggcgaacg ggcgaacctt 1380
gttgcggagc gcgccgacgc cctgaacgcc cttgaagagc tgtacgaaga ccgcgcggca 1440
ggcgcgtacg acggacccgt tggcaggaag cacttccgga agcaacaggc agcgctgacg 1500
ctccggcagc aaggggcgga agagcggctt gccgaacttg aagccgccga agccccgaag 1560
cttccccttg accaatggtt ccccgaagac gccgacgctg acccgaccgg ccctaagtcg 1620
tggtgggggc gcgcgtcagt agacgacaag cgcgtgttcg tcgggctctt cgtagacaag 1680
atcgttgtca cgaagtcgac tacgggcagg gggcagggaa cgcccatcga gaagcgcgct 1740
tcgatcacgt gggcgaagcc gccgaccgac gacgacgaag acgacgccca ggacggcacg 1800
gaagacgtag cggcgtag 1818
<210> 86
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> >PhiC31 attachment site
<400> 86
cccaggtcag aagcggtttt cgggagtagt gccccaactg gggtaacctt tgagttctct 60
cagttggggg cgtagggtcg ccgacatgac acaaggggtt 100
<210> 87
<211> 110
<212> DNA
<213> Artificial Sequence
<220>
<223> >incP
<400> 87
ccggccagcc tcgcagagca ggattcccgt tgagcaccgc caggtgcgaa taagggacag 60
tgaagaagga acacccgctc gcgggtgggc ctacttcacc tatcctgccc 110
<210> 88
<211> 372
<212> DNA
<213> Artificial Sequence
<220>
<223> >traJ
<400> 88
atggctgatg aaaccaagcc aaccaggaag ggcagcccac ctatcaaggt gtactgcctt 60
ccagacgaac gaagagcgat tgaggaaaag gcggcggcgg ccggcatgag cctgtcggcc 120
tacctgctgg ccgtcggcca gggctacaaa atcacgggcg tcgtggacta tgagcacgtc 180
cgcgagctgg cccgcatcaa tggcgacctg ggccgcctgg gcggcctgct gaaactctgg 240
ctcaccgacg acccgcgcac ggcgcggttc ggtgatgcca cgatcctcgc cctgctggcg 300
aagatcgaag agaagcagga cgagcttggc aaggtcatga tgggcgtggt ccgcccgagg 360
gcagagccat ga 372
<210> 89
<211> 589
<212> DNA
<213> Artificial Sequence
<220>
<223> >ColE1/pMB1/pBR322/pUC ori
<400> 89
ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 60
agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 120
cagcagagcg cagataccaa atactgttct tctagtgtag ccgtagttag gccaccactt 180
caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 240
tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 300
ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 360
ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 420
gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 480
gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 540
tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaa 589
<210> 90
<211> 777
<212> DNA
<213> Artificial Sequence
<220>
<223> > aac(3)IV
<400> 90
gtgcaatacg aatggcgaaa agccgagctc atcggtcagc ttctcaacct tggggttacc 60
cccggcggtg tgctgctggt ccacagctcc ttccgtagcg tccggcccct cgaagatggg 120
ccacttggac tgatcgaggc cctgcgtgct gcgctgggtc cgggagggac gctcgtcatg 180
ccctcgtggt caggtctgga cgacgagccg ttcgatcctg ccacgtcgcc cgttacaccg 240
gaccttggag ttgtctctga cacattctgg cgcctgccaa atgtaaagcg cagcgcccat 300
ccatttgcct ttgcggcagc ggggccacag gcagagcaga tcatctctga tccattgccc 360
ctgccacctc actcgcctgc aagcccggtc gcccgtgtcc atgaactcga tgggcaggta 420
cttctcctcg gcgtgggaca cgatgccaac acgacgctgc atcttgccga gttgatggca 480
aaggttccct atggggtgcc gagacactgc accattcttc aggatggcaa gttggtacgc 540
gtcgattatc tcgagaatga ccactgctgt gagcgctttg ccttggcgga caggtggctc 600
aaggagaaga gccttcagaa ggaaggtcca gtcggtcatg cctttgctcg gttgatccgc 660
tcccgcgaca ttgtggcgac agccctgggt caactgggcc gagatccgtt gatcttcctg 720
catccgccag aggcgggatg cgaagaatgc gatgccgctc gccagtcgat tggctga 777
<210> 91
<211> 582
<212> DNA
<213> Artificial Sequence
<220>
<223> >cgt promoter
<400> 91
gcccggccct gtcgagctga cggctgtccc gcggcctcgt catcggtgct gtcgagcagg 60
ctgtcgcctg gtaggaagat tgccatggtc cagatggacc ccctcagcgc acgtcccgat 120
ggacgacgtt ccgtcttgtc gacgactccg agccgcccga cccaccgggc ctgagcgcgc 180
ccgatcacgg ctccccggcc tgacgggttc tgcacctccg gcggctttcc cgaggacggc 240
gtggtggtcg gtgacggctg ctggacctcc tccggtgggc aagcgtttcg gtgaggtggg 300
cagcccggct gcgggcacat cgggggcgga gagacgctta ggtttattgc aagttctttc 360
ttcggtggcg cggcgtgtca tcagcagccg attgtggcat tctggtgacg cattgacgca 420
ggtcacagat ttgttgggat aggcaacgaa caattcctaa atcgcctatt cggacaaata 480
ggcttgacct gacgacgctg tcccaccact gtggatgacg cctaccgcgc aagttctgga 540
agtacttgca atcagcggtg aggatcatca aaggggactg tc 582
<210> 92
<211> 115
<212> DNA
<213> Artificial Sequence
<220>
<223> >efp promoter
<400> 92
tggagcacat ctgccggtag acccgattcg ccctcaccag cgaatcgccg gtaaagtggt 60
tcggtcaacg attcgagtca agatcaaggc aggacatggc ttccaccaac gacct 115
<210> 93
<211> 372
<212> DNA
<213> Artificial Sequence
<220>
<223> >rpsJ promoter
<400> 93
attgcgggtt gtcgccggtg agagccggtg acaaccccca ccggtgaccc cgattagcaa 60
tgctgcgttc aatcgggcat actagtcagg ttgcgtccgc gcggggtggg tggctggcgt 120
tcgtcagccg cccaccctcg ccgggtgtcc gggtgtgttt ccagccgccc ggcgccctca 180
gatccccgcg atcgcgttcg tccccggcaa gatcggggat ggaggccgaa agctgagtgc 240
ccagcactct gtgacgaggc gcgacacgcc cgaccgcggg ggtcggacaa cgcaggatca 300
acggtcctgc gggcatgtgg gggccaccgc ctccgcacgt agcggcatcg agagaaggaa 360
acagaagcca cc 372
<210> 94
<211> 264
<212> DNA
<213> Artificial Sequence
<220>
<223> >katE promoter
<400> 94
atctcgggct cggtaggcat caggcactcg tttcgtcggg ctctcgtgac agtgaccttg 60
atactggagg ggtacgacaa aaccgggacc gccaccgacg tccggaccga cccgatcgtc 120
ggccacgaac agggccggat ggtcgtcgtg acgcgtccgc gagacgccgt ccgggccggg 180
ccgatgctcg gccggaccgt ttgccggggt tcatgcgggg tatccgccat ccgatcacat 240
acccttatcg aggagtttgt ccgg 264
<210> 95
<211> 470
<212> DNA
<213> Artificial Sequence
<220>
<223> >moeE5 promoter
<400> 95
agggcgccac cagctggagc cccatccccg cggggaccag gagggcgagc agcgccacgg 60
cggtccgttc accgcgcagg tagcggacaa acgtggagag atgccgcaac ggactgtctg 120
ccaacgcgcc cctcccccgt tcgcccggcg gcgagcggcc agcataaagt cctgtgcgcc 180
tccttgtgaa tgacgcctcg tcaacggcgg ccggagcacg ccctttctgc gggaagccga 240
tagcggacgc cgctccggga gggggcgaag cacaccattg ctcgtgattg acgcatgctg 300
ttagactccc cacgtctctt ggtccggaca tgcgtttctc aacgccgaaa gcctggtcaa 360
ccgcactttc ggcaccgcac agtcccacgg cgtccgagcg gtcgcgcgag tcggcccggt 420
cgagccagag gcagccacac gaacgtgcac cgcaatgcac cgccttgatc 470
<210> 96
<211> 334
<212> DNA
<213> Artificial Sequence
<220>
<223> >apm promoter
<400> 96
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 60
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 120
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 180
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttgg 240
ttcatgtgca gctccatcag caaaagggga tgataagttt atcaccaccg actatttgca 300
acagtgccgt tgatcgtgct atgatcgact gagc 334
<210> 97
<211> 1094
<212> DNA
<213> Artificial Sequence
<220>
<223> >cdaR promoter
<400> 97
gggccccccc tcgaggtcga cggtatcgat aagcttgatt tttctggaca acctggacgc 60
cgagacctcg gcggcgaccc tcgcgctgtt cctcacggcc ctgtgggcgc tggccgtcat 120
cgcccgcccc tacacctggt ggcgcgtgct gctggtgctg accatggcgg tgggcttcgc 180
cgtggtgctg gtggtgccct acctccagga gttcttccag ctgaagctgg tcggcgtcac 240
cgcgccgtgg gcggcggtcg cctgtgcggc ggtcgccggg ctggtgctgg agttggtgtg 300
ggcacgtatg cggcgtcgtc tcgacgccga ctgagcccac cgggcggtcg acccccgtac 360
cgcccggtga agaggagggg acgcccggtc cgtgccgggc gtcccctccg tctttgtgcg 420
ccccccgccg accggaacgg cacgatccgg ccaaacctgc gcagcggtgc ggccggagga 480
gccgcttccg ggccgttcga cgggcggccc gccacgggac cggaacgagc cccggcatcc 540
gccgccacca gcggatttca cattccttac gcaatcggcg gcgagagcga ccggcaggta 600
acctcggggc tgaatccagg ccatcgggga atagcaaacg gcgcactgac gaaagcaagg 660
gcagagacct gccgaaagtt gagtgttgga ttcaaagaag atccgtatta ttccgactgc 720
aggcaggggg gagccggcta cgaaggaaaa gttccgcagg tcagattggg ccgggtcgca 780
ggcagcgccg caccggcaac cacgaccgcg actttcgtcg acgcaccccc tcgcaccgcc 840
gcccggccac cggtccgggc gcacgacccg aagggaagtg aggctcacgc acggaccagc 900
agctcctgac gcagcgaccc ggacccggag gtgagtgaca tgacgacgag gccccgacca 960
gcggtgaacc ctgctgaccc ggccgtaacg aagtcttcat gcccgtggca cccgacggct 1020
tcggagagtt tcggcacgca gacatcagca caacttgacg cgggggtatc aagaggtcat 1080
ggatcttcgg tacc 1094
<210> 98
<211> 145
<212> DNA
<213> Artificial Sequence
<220>
<223> >ermE* promoter
<400> 98
gcggttgatc ggcgatcgca ggtgcacgcg gtcgatcttg acggctggcg agaggtgcgg 60
ggaggatctg accgacgcgg tccacacgtg gcaccgcgat gctgttgtgg gcacaatcgt 120
gccggttggt aggatccagc gagca 145
<210> 99
<211> 321
<212> DNA
<213> Artificial Sequence
<220>
<223> >rpsL promoter
<400> 99
tgagcacgtc cgcgagctgg ccctgcaggc ggaagtcagg tagacacgac ttccgctagt 60
ccttgcaagg tctgctgacg tgaggcgggg cggtcgtttt tgaccgccct gccttcgtca 120
tgtaggctcg ctcgctgtgc ctggcgtgtc atcagacgcc caggtcccgg tgccgtgagg 180
cccgggccat cgagccggtg gtacgtggct gcggtcccct tgtgagggct gcgcgccgtg 240
tgctgtccgg cgcgcacagc cttgaatcca cccgcggggg ccggccggtc tccgtgagct 300
cgagtagacg acggagacgt a 321
<210> 100
<211> 1410
<212> DNA
<213> Artificial Sequence
<220>
<223> >ACSP50_1949
<400> 100
gtggcgactc ccacgcagtc cgagatccgc gaggaagagc acgaagagca gcggcagagc 60
ctgagcacgg cggcggcccg caacctcacg accaccacca agaccgcgcc gcagatgcag 120
gagatcactt cgcgatggct gctccgtaag cttccctggg ttcaggtcgc cggtggggcg 180
tatcgggtga accggcggat gacttatcgg atcggcgacg gccggctgag cttcaccaac 240
gtcggtgcgc aggtccgggt cgtcccggcc gagctgcggg aactctcggt gctcagcgag 300
ttcgacgacg cggacgtgct ggccgccatg gccgacaagt tcgtgcagca ggagtaccag 360
cccggtcagg tgatcgtcga gttcggctcg gtcgccgacc acgtgtacgt gatcgcgcac 420
ggcaaggtga acaaggtcgg cgtcggcaac tacggcgacc cggtcaacct gggggtgctc 480
gccgacgggg aggcgttcgg cgagaagtcg ctcaccgacg aggagcggat ctgggactac 540
accgccaagg cgatgaccgc ggtgaccctg ctggccatgc cgcgctcggc gttcaccgcg 600
ctgctcggcc agagtgacca cctgcgcacg cacgtcgagc agttccgggc caagaaccgc 660
cggccgcaga acaagcacgg cgaggcggag atctcggtgg ccgccgggca caccggcgaa 720
ccgaagctgg acggcacgta cgtcgactac gagctgacgc cgcgcgaata cgagctgagc 780
gtcgcgcaga ccgtgctgcg cgtgcacacc cgggtcgccg acctctacaa cgagccgatg 840
aaccaggtgg agcagcagct ccggctgacc gtcgaggcgc tgcgcgagcg tcaggaatac 900
gaaatgatca acaaccgcga gttcggcctg ctgcacaacg ccgacctgcg gcagcgcatc 960
cacacccggg gcggcccgcc caccccggac gacctcgacg agctgctcag catgcggcgc 1020
ggcaccagga tgttcgtggc ccacccgcag gcggtcgccg cgttcggccg ggagtgcacc 1080
aagcggggca tctatccacc gatgctggaa caggacggcg gcaccttcct gtcctggcgc 1140
ggggtcccga tcctgccgtg cggcaagatc ccggtgaccg agacgcacac cacctcgatc 1200
ctggcgatgc gcaccgggga gagcgaccag ggtgtggtcg ggctgcacca gaccgggatc 1260
ccggacgagt acgagccgag cctgtccgtg cggttcatgg ggatcagcga gcaggcgatc 1320
atgtcgtacc tggtgagcgc gtactactcg gccgcggtgc tggtgccgga cgcgctgggc 1380
atcctggacc acgtcgagct gtcccactga 1410
<210> 101
<211> 855
<212> DNA
<213> Artificial Sequence
<220>
<223> >ACSP50_1951
<400> 101
atgacaagtg ctgttgcttc gccactgcgg accgacttcg agcgctcggt cgccagctac 60
tggaacacca accgggccga cccggtcaac ctgcgcctcg gcgaggtcga cgggctgtac 120
caccaccact acggcgtcgg cgagcccgac ctcagcgtgc tggacggccc ggccgacacc 180
cgcgagcagc ggatcatcgc cgagctgcac cggctggaga acgcccaggc cgacctgctg 240
ctcgaccacc tcggcccgat ccggccgggc gacgcgctgc tcgacggcgg gtccggccgc 300
ggcggcacca gcatcatggc caacgcgcgg ttcggctgcc gggtcgacgg ggtgtccatc 360
tcggaatacc aggtgggttt cgccaacgag caggccgctc agcgcggcgt cgccgacagg 420
gtgcgcttcc acttccgcaa catgctggac tccggattcg cgaccgggtc acggcaggcg 480
atctggacga acgagacgac gatgtacgtc gacctgttcg acctgtacgc ggagttcgcc 540
cggatgctcg gcttcggcgg ccgctacgtg tgcatcaccg gttgcgccaa cgacgtgacc 600
ggccggcgct ccaaggcggt caacaggatc aacgagcact acacctgtga catccacccg 660
cgcagcgact acttcaaggc gctcgccgcc cacgatctcg tgccgatcgc cgtcaccgac 720
ctgaccgcgg ccaccatccc gtactgggag ctgcgcgccc ggtccgaggt ggcgaccggg 780
atcgaacagg ctttcctcac ggcgtactca gaaggcagtt tccactacct tctgatcgcc 840
gccgatcggg tctga 855
<210> 102
<211> 1803
<212> DNA
<213> Artificial Sequence
<220>
<223> >ACSP50_1952
<400> 102
atggccctgc cgatcgagga ctacgcgatc atcgccgaca cccagaccgc ggccctggtc 60
ggtcgcaacg gatcgatcga ctggctctgc gtgccccgct tcgactccgg cgcgatcttc 120
gcggcgctgc tcggcgaggc ggagaacggc cactggacca tcgcaccgtc cggcgaggtg 180
gtcaccaccc gccgccgcta ccgggacgac acgctggtgt tggagacgga gttcgagacg 240
gccggcggcg tcgcccggtt gatcgacttc atgccgccgc gcaccgactc gccgtccgtc 300
atccggatcg tcgagggcgt ccgcgggcag gtggacttcg gcatggagct gcggctgcgc 360
ttcgactatg gacacgtcgt gccatgggtc taccgcgagg gtggggcgct cgtcgcggtc 420
gccggtccgg acgcggcctg gttgcgcacc gacgtgccga cccggggcga gaatctgacc 480
accaaagccg atttccgggt acgggcgggg gaacgcgccg ccttcaccct gacctggcgc 540
ccgtcgcatc tgccctcgcc cgccccgctg gacccggccc acgagctcgg cgtgaccgag 600
ggttactggc gcggctgggt gtccgcctgc acgtacgagg gggagtggcg ggacgccgtc 660
gtccgatcgc tgctcactct gaaagccctc acctacgcac ccaccggcgg cattgtcgcg 720
gccgccacca ccagcctccc ggagaaactc ggcggcgtcc gcaactggga ctaccgcttc 780
tgctggctcc gcgacgccac catcaccctg cagtcgctgc tcttctccgg tttccagagt 840
gaggcgatcg cctggcgcaa atggctgctg cgcgcgatcg ccggcaaccc cgccgagctg 900
cagatcatgt acggcgtcgc cggcgaacgc cgcctcgacg agtatctggc cgactggctc 960
accggctacg acggcaaccc ggtccggatc ggcaacgccg ccgccgagca gttccagttg 1020
gacgtgtacg gcgaggtgat ggacgccctg catcagggcc gccgggccgg cctcaaagcc 1080
gacgacccgt cctggggcct gcaggtcaaa ctgatggagt tcgtcgagga gcactggcag 1140
gacccggacg agggcatctg ggaggtccgc ggcggccccc gccagttcac ccactccaaa 1200
ctgatggcct gggtcgccgc cgaccgcgcc gtcaaggccg tcgaggagtt cggcctggac 1260
ggccccgccg accgctggcg ccgcctgcgc gacgagatcc gtcaggacat cctggacaag 1320
ggttacgacc cggtccgcaa gaccttcacc cagtactacg gctccgatga gctcgacgcc 1380
gcgatgctga tggtccccct ggtcggcttc ctccccgggg atgacgaacg cgtcgccggc 1440
acggtcgccg ccatcgagca acacctgctg gtcgacggtt tcgtccagcg gtacacccaa 1500
catccggacg ccgacgtcga cggccttccc ccgggcgagg gcgcgttcct ggcctgcacg 1560
ttctggctgg ccgacaacta cgcgctgatg ggtcgccacg acgaggcccg ggagacgttc 1620
gcccgcctgc tggccctgcg caacgacgtg ggtctgctcg ccgaggagta cgacaccacc 1680
accggccgcc tggtcggcaa cttccctcag gccttcagtc acgtcccgct gatcgacacg 1740
gcccggacct tgaccagcgc gctggcgccg accgaggccc gggcctcgga gggcctcagg 1800
tag 1803
<210> 103
<211> 276
<212> DNA
<213> Artificial Sequence
<220>
<223> >ACSP50_1953
<400> 103
atgcgtacgg tgattcgtgg gatcgtggtg ttggcgctgg tggccggggg tggcgccggc 60
atggtggggc ccgccggagc ggcgccggcg gtgacgttca agaactgcac tgagctgaac 120
aagaagtaca agcacggggt cggcaagcgg ggcgccgagg acagggtgag cgggtccacc 180
aagccggtca ccaccttctc cgtgaacaac gatctctatg cggcgaacaa gaggctggac 240
cgtgacaagg acgggatcgc ctgcgagaag cggtga 276
<210> 104
<211> 469
<212> PRT
<213> Artificial Sequence
<220>
<223> >ACSP50_1949
<400> 104
Met Ala Thr Pro Thr Gln Ser Glu Ile Arg Glu Glu Glu His Glu Glu
1 5 10 15
Gln Arg Gln Ser Leu Ser Thr Ala Ala Ala Arg Asn Leu Thr Thr Thr
20 25 30
Thr Lys Thr Ala Pro Gln Met Gln Glu Ile Thr Ser Arg Trp Leu Leu
35 40 45
Arg Lys Leu Pro Trp Val Gln Val Ala Gly Gly Ala Tyr Arg Val Asn
50 55 60
Arg Arg Met Thr Tyr Arg Ile Gly Asp Gly Arg Leu Ser Phe Thr Asn
65 70 75 80
Val Gly Ala Gln Val Arg Val Val Pro Ala Glu Leu Arg Glu Leu Ser
85 90 95
Val Leu Ser Glu Phe Asp Asp Ala Asp Val Leu Ala Ala Met Ala Asp
100 105 110
Lys Phe Val Gln Gln Glu Tyr Gln Pro Gly Gln Val Ile Val Glu Phe
115 120 125
Gly Ser Val Ala Asp His Val Tyr Val Ile Ala His Gly Lys Val Asn
130 135 140
Lys Val Gly Val Gly Asn Tyr Gly Asp Pro Val Asn Leu Gly Val Leu
145 150 155 160
Ala Asp Gly Glu Ala Phe Gly Glu Lys Ser Leu Thr Asp Glu Glu Arg
165 170 175
Ile Trp Asp Tyr Thr Ala Lys Ala Met Thr Ala Val Thr Leu Leu Ala
180 185 190
Met Pro Arg Ser Ala Phe Thr Ala Leu Leu Gly Gln Ser Asp His Leu
195 200 205
Arg Thr His Val Glu Gln Phe Arg Ala Lys Asn Arg Arg Pro Gln Asn
210 215 220
Lys His Gly Glu Ala Glu Ile Ser Val Ala Ala Gly His Thr Gly Glu
225 230 235 240
Pro Lys Leu Asp Gly Thr Tyr Val Asp Tyr Glu Leu Thr Pro Arg Glu
245 250 255
Tyr Glu Leu Ser Val Ala Gln Thr Val Leu Arg Val His Thr Arg Val
260 265 270
Ala Asp Leu Tyr Asn Glu Pro Met Asn Gln Val Glu Gln Gln Leu Arg
275 280 285
Leu Thr Val Glu Ala Leu Arg Glu Arg Gln Glu Tyr Glu Met Ile Asn
290 295 300
Asn Arg Glu Phe Gly Leu Leu His Asn Ala Asp Leu Arg Gln Arg Ile
305 310 315 320
His Thr Arg Gly Gly Pro Pro Thr Pro Asp Asp Leu Asp Glu Leu Leu
325 330 335
Ser Met Arg Arg Gly Thr Arg Met Phe Val Ala His Pro Gln Ala Val
340 345 350
Ala Ala Phe Gly Arg Glu Cys Thr Lys Arg Gly Ile Tyr Pro Pro Met
355 360 365
Leu Glu Gln Asp Gly Gly Thr Phe Leu Ser Trp Arg Gly Val Pro Ile
370 375 380
Leu Pro Cys Gly Lys Ile Pro Val Thr Glu Thr His Thr Thr Ser Ile
385 390 395 400
Leu Ala Met Arg Thr Gly Glu Ser Asp Gln Gly Val Val Gly Leu His
405 410 415
Gln Thr Gly Ile Pro Asp Glu Tyr Glu Pro Ser Leu Ser Val Arg Phe
420 425 430
Met Gly Ile Ser Glu Gln Ala Ile Met Ser Tyr Leu Val Ser Ala Tyr
435 440 445
Tyr Ser Ala Ala Val Leu Val Pro Asp Ala Leu Gly Ile Leu Asp His
450 455 460
Val Glu Leu Ser His
465
<210> 105
<211> 284
<212> PRT
<213> Artificial Sequence
<220>
<223> >ACSP50_1951
<400> 105
Met Thr Ser Ala Val Ala Ser Pro Leu Arg Thr Asp Phe Glu Arg Ser
1 5 10 15
Val Ala Ser Tyr Trp Asn Thr Asn Arg Ala Asp Pro Val Asn Leu Arg
20 25 30
Leu Gly Glu Val Asp Gly Leu Tyr His His His Tyr Gly Val Gly Glu
35 40 45
Pro Asp Leu Ser Val Leu Asp Gly Pro Ala Asp Thr Arg Glu Gln Arg
50 55 60
Ile Ile Ala Glu Leu His Arg Leu Glu Asn Ala Gln Ala Asp Leu Leu
65 70 75 80
Leu Asp His Leu Gly Pro Ile Arg Pro Gly Asp Ala Leu Leu Asp Gly
85 90 95
Gly Ser Gly Arg Gly Gly Thr Ser Ile Met Ala Asn Ala Arg Phe Gly
100 105 110
Cys Arg Val Asp Gly Val Ser Ile Ser Glu Tyr Gln Val Gly Phe Ala
115 120 125
Asn Glu Gln Ala Ala Gln Arg Gly Val Ala Asp Arg Val Arg Phe His
130 135 140
Phe Arg Asn Met Leu Asp Ser Gly Phe Ala Thr Gly Ser Arg Gln Ala
145 150 155 160
Ile Trp Thr Asn Glu Thr Thr Met Tyr Val Asp Leu Phe Asp Leu Tyr
165 170 175
Ala Glu Phe Ala Arg Met Leu Gly Phe Gly Gly Arg Tyr Val Cys Ile
180 185 190
Thr Gly Cys Ala Asn Asp Val Thr Gly Arg Arg Ser Lys Ala Val Asn
195 200 205
Arg Ile Asn Glu His Tyr Thr Cys Asp Ile His Pro Arg Ser Asp Tyr
210 215 220
Phe Lys Ala Leu Ala Ala His Asp Leu Val Pro Ile Ala Val Thr Asp
225 230 235 240
Leu Thr Ala Ala Thr Ile Pro Tyr Trp Glu Leu Arg Ala Arg Ser Glu
245 250 255
Val Ala Thr Gly Ile Glu Gln Ala Phe Leu Thr Ala Tyr Ser Glu Gly
260 265 270
Ser Phe His Tyr Leu Leu Ile Ala Ala Asp Arg Val
275 280
<210> 106
<211> 600
<212> PRT
<213> Artificial Sequence
<220>
<223> >ACSP50_1952
<400> 106
Met Ala Leu Pro Ile Glu Asp Tyr Ala Ile Ile Ala Asp Thr Gln Thr
1 5 10 15
Ala Ala Leu Val Gly Arg Asn Gly Ser Ile Asp Trp Leu Cys Val Pro
20 25 30
Arg Phe Asp Ser Gly Ala Ile Phe Ala Ala Leu Leu Gly Glu Ala Glu
35 40 45
Asn Gly His Trp Thr Ile Ala Pro Ser Gly Glu Val Val Thr Thr Arg
50 55 60
Arg Arg Tyr Arg Asp Asp Thr Leu Val Leu Glu Thr Glu Phe Glu Thr
65 70 75 80
Ala Gly Gly Val Ala Arg Leu Ile Asp Phe Met Pro Pro Arg Thr Asp
85 90 95
Ser Pro Ser Val Ile Arg Ile Val Glu Gly Val Arg Gly Gln Val Asp
100 105 110
Phe Gly Met Glu Leu Arg Leu Arg Phe Asp Tyr Gly His Val Val Pro
115 120 125
Trp Val Tyr Arg Glu Gly Gly Ala Leu Val Ala Val Ala Gly Pro Asp
130 135 140
Ala Ala Trp Leu Arg Thr Asp Val Pro Thr Arg Gly Glu Asn Leu Thr
145 150 155 160
Thr Lys Ala Asp Phe Arg Val Arg Ala Gly Glu Arg Ala Ala Phe Thr
165 170 175
Leu Thr Trp Arg Pro Ser His Leu Pro Ser Pro Ala Pro Leu Asp Pro
180 185 190
Ala His Glu Leu Gly Val Thr Glu Gly Tyr Trp Arg Gly Trp Val Ser
195 200 205
Ala Cys Thr Tyr Glu Gly Glu Trp Arg Asp Ala Val Val Arg Ser Leu
210 215 220
Leu Thr Leu Lys Ala Leu Thr Tyr Ala Pro Thr Gly Gly Ile Val Ala
225 230 235 240
Ala Ala Thr Thr Ser Leu Pro Glu Lys Leu Gly Gly Val Arg Asn Trp
245 250 255
Asp Tyr Arg Phe Cys Trp Leu Arg Asp Ala Thr Ile Thr Leu Gln Ser
260 265 270
Leu Leu Phe Ser Gly Phe Gln Ser Glu Ala Ile Ala Trp Arg Lys Trp
275 280 285
Leu Leu Arg Ala Ile Ala Gly Asn Pro Ala Glu Leu Gln Ile Met Tyr
290 295 300
Gly Val Ala Gly Glu Arg Arg Leu Asp Glu Tyr Leu Ala Asp Trp Leu
305 310 315 320
Thr Gly Tyr Asp Gly Asn Pro Val Arg Ile Gly Asn Ala Ala Ala Glu
325 330 335
Gln Phe Gln Leu Asp Val Tyr Gly Glu Val Met Asp Ala Leu His Gln
340 345 350
Gly Arg Arg Ala Gly Leu Lys Ala Asp Asp Pro Ser Trp Gly Leu Gln
355 360 365
Val Lys Leu Met Glu Phe Val Glu Glu His Trp Gln Asp Pro Asp Glu
370 375 380
Gly Ile Trp Glu Val Arg Gly Gly Pro Arg Gln Phe Thr His Ser Lys
385 390 395 400
Leu Met Ala Trp Val Ala Ala Asp Arg Ala Val Lys Ala Val Glu Glu
405 410 415
Phe Gly Leu Asp Gly Pro Ala Asp Arg Trp Arg Arg Leu Arg Asp Glu
420 425 430
Ile Arg Gln Asp Ile Leu Asp Lys Gly Tyr Asp Pro Val Arg Lys Thr
435 440 445
Phe Thr Gln Tyr Tyr Gly Ser Asp Glu Leu Asp Ala Ala Met Leu Met
450 455 460
Val Pro Leu Val Gly Phe Leu Pro Gly Asp Asp Glu Arg Val Ala Gly
465 470 475 480
Thr Val Ala Ala Ile Glu Gln His Leu Leu Val Asp Gly Phe Val Gln
485 490 495
Arg Tyr Thr Gln His Pro Asp Ala Asp Val Asp Gly Leu Pro Pro Gly
500 505 510
Glu Gly Ala Phe Leu Ala Cys Thr Phe Trp Leu Ala Asp Asn Tyr Ala
515 520 525
Leu Met Gly Arg His Asp Glu Ala Arg Glu Thr Phe Ala Arg Leu Leu
530 535 540
Ala Leu Arg Asn Asp Val Gly Leu Leu Ala Glu Glu Tyr Asp Thr Thr
545 550 555 560
Thr Gly Arg Leu Val Gly Asn Phe Pro Gln Ala Phe Ser His Val Pro
565 570 575
Leu Ile Asp Thr Ala Arg Thr Leu Thr Ser Ala Leu Ala Pro Thr Glu
580 585 590
Ala Arg Ala Ser Glu Gly Leu Arg
595 600
<210> 107
<211> 91
<212> PRT
<213> Artificial Sequence
<220>
<223> >ACSP50_1953
<400> 107
Met Arg Thr Val Ile Arg Gly Ile Val Val Leu Ala Leu Val Ala Gly
1 5 10 15
Gly Gly Ala Gly Met Val Gly Pro Ala Gly Ala Ala Pro Ala Val Thr
20 25 30
Phe Lys Asn Cys Thr Glu Leu Asn Lys Lys Tyr Lys His Gly Val Gly
35 40 45
Lys Arg Gly Ala Glu Asp Arg Val Ser Gly Ser Thr Lys Pro Val Thr
50 55 60
Thr Phe Ser Val Asn Asn Asp Leu Tyr Ala Ala Asn Lys Arg Leu Asp
65 70 75 80
Arg Asp Lys Asp Gly Ile Ala Cys Glu Lys Arg
85 90
<210> 108
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> >antisense 1 (putative antisense promoters)
<400> 108
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtgg 57
<210> 109
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> >antisense 2 (putative antisense promoters)
<400> 109
acgcggtcga acacgcggtg gtacatgtcc agccacgcgc actggtactc ttcggac 57
<210> 110
<211> 6815
<212> DNA
<213> Artificial Sequence
<220>
<223> >pSETT4gap
<400> 110
aagcgcgggg aagaatcgat caaggactct taccgctgcc gtcgccggaa ggtggtcgac 60
ccgtccgcac ctgggcagca cgaaggcacg tgcaacgtca gcatggcggc actcgacaag 120
ttcgttgcgg aacgcatctt caacaagatc aggcacgccg aaggcgacga agagacgttg 180
gcgcttctgt gggaagccgc ccgacgcttc ggcaagctca ctgaggcgcc tgagaagagc 240
ggcgaacggg cgaaccttgt tgcggagcgc gccgacgccc tgaacgccct tgaagagctg 300
tacgaagacc gcgcggcagg cgcgtacgac ggacccgttg gcaggaagca cttccggaag 360
caacaggcag cgctgacgct ccggcagcaa ggggcggaag agcggcttgc cgaacttgaa 420
gccgccgaag ccccgaagct tccccttgac caatggttcc ccgaagacgc cgacgctgac 480
ccgaccggcc ctaagtcgtg gtgggggcgc gcgtcagtag acgacaagcg cgtgttcgtc 540
gggctcttcg tagacaagat cgttgtcacg aagtcgacta cgggcagggg gcagggaacg 600
cccatcgaga agcgcgcttc gatcacgtgg gcgaagccgc cgaccgacga cgacgaagac 660
gacgcccagg acggcacgga agacgtagcg gcgtagcgag acacccggga agcctgatct 720
acgtctgtcg agaagtttct gatcgaaaag ttcgacagcg tctccgacct gatgcagctc 780
tcgcagggcg aagaatctcg tgctttcagc ttcgatgtag gagggcgtgg atatgtcctg 840
cgggtaaata gctgcgccga tggttctctg tcgtcgctga cgtctgtagt ctagcctcat 900
tatgattgta cgctattcag ggattgactg ataccggaag acatctcaaa tgaagtggtc 960
aagctttatg cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct 1020
agggtcccca attaattagt aatataatct attaaaggtc attcaaaagg tcatccaagc 1080
ttggctgttt tggcggatga gagaagattt tcagcctgat acagattaaa tcagaacgca 1140
gaagcggtct gataaaacag aatttgcctg gcggcagtag cgcggtggtc ccacctgacc 1200
ccatgccgaa ctcagaagtg aaacgccgta gcgccgatgg tagtgtggcc catgcgagag 1260
tacatatggt actggccgat gctgggagaa gcgcgctgct gtacggcgcg caccgggtgc 1320
ggagcccctc ggcgagcggt gtgaaacttc tgtgaatggc ctgttcggtt gcttttttta 1380
tacggctgcc agataaggct tgcagcatct gggcggctac cgctatgatc ggggcgttcc 1440
tgcaattctt agtgcgagta tctgaaaggg gatacgcatg gtaccgagac cttatgttga 1500
tcggcacttt gcatcggccg cgctcccgat tccggaagtg cttgacattg gggaatttat 1560
gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc gccattcgcc 1620
attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca 1680
gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca 1740
gtcacgacgt tgtaaaacga cggccagtgc caagcttggg ctgcaggtcg actctagagg 1800
atccgcggcc gcgcgcgata tcgaattcgt aatcatgtca tagctgtttc ctgtgtgaaa 1860
ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt gtaaagcctg 1920
gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgcggtctcg gcgtttcgtg 1980
ccgcgtgatt ttccgccaaa aactttaacg aacgttcgtt ataatggtgt catgaccttc 2040
acgacgaagt actaaaattg gcccgaatca tcagctaagc tttatgcttg taaaccgttt 2100
tgtgaaaaaa tttttaaaat aaaaaagggg acctctaggg tccccaatta attagtaata 2160
taatctatta aaggtcattc aaaaggtcat ccacctcact tcggtgaatc gaagcgcggc 2220
atcagggtta ctttttggat acctgagaca ttcgtcgctt ccgggtatgc gctctatgtg 2280
acggtctttt ggcgcacaaa tgctcagcac catttaaatt agaccgactc cagatctgta 2340
aggtccaaca aaacccatcg tagtccttag acttggcaca cttacacctg cagtggatga 2400
ccttttgaat gacctttaat agattatatt actaattaat tggggaccct agaggtcccc 2460
ttttttattt taaaaatttt ttcacaaaac ggtttacaag cataaagctt gccacgcaga 2520
cgacagccca cgctgaccga tctacctgaa cggcgaccat ctgtgtggta ctggggcgga 2580
gagataacta cggtgccgct taccgggctc actcaaaggc ggtaatacgg ttatccacag 2640
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 2700
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 2760
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 2820
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 2880
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 2940
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 3000
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 3060
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 3120
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 3180
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 3240
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 3300
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 3360
aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 3420
ttttggttca tgtgcagctc catcagcaaa aggggatgat aagtttatca ccaccgacta 3480
tttgcaacag tgccgttgat cgtgctatga tcgactgatg tcatcagcgg tggagtgcaa 3540
tgtcgtgcaa tacgaatggc gaaaagccga gctcatcggt cagcttctca accttggggt 3600
tacccccggc ggtgtgctgc tggtccacag ctccttccgt agcgtccggc ccctcgaaga 3660
tgggccactt ggactgatcg aggccctgcg tgctgcgctg ggtccgggag ggacgctcgt 3720
catgccctcg tggtcaggtc tggacgacga gccgttcgat cctgccacgt cgcccgttac 3780
accggacctt ggagttgtct ctgacacatt ctggcgcctg ccaaatgtaa agcgcagcgc 3840
ccatccattt gcctttgcgg cagcggggcc acaggcagag cagatcatct ctgatccatt 3900
gcccctgcca cctcactcgc ctgcaagccc ggtcgcccgt gtccatgaac tcgatgggca 3960
ggtacttctc ctcggcgtgg gacacgatgc caacacgacg ctgcatcttg ccgagttgat 4020
ggcaaaggtt ccctatgggg tgccgagaca ctgcaccatt cttcaggatg gcaagttggt 4080
acgcgtcgat tatctcgaga atgaccactg ctgtgagcgc tttgccttgg cggacaggtg 4140
gctcaaggag aagagccttc agaaggaagg tccagtcggt catgcctttg ctcggttgat 4200
ccgctcccgc gacattgtgg cgacagccct gggtcaactg ggccgagatc cgttgatctt 4260
cctgcatccg ccagaggcgg gatgcgaaga atgcgatgcc gctcgccagt cgattggctg 4320
agctcatgag cggagaacga gatgacgttg gaggggcaag gtcgcgctga ttgctggggc 4380
aacacgtgga gcggatcggg gattgtcttt cttcagctcg ctgatgatat gctgacgctc 4440
aatgccgttt ggcctccgac taacgaaaat cccgcatttg gacggctgat ccgattggca 4500
cggcggacgg cgaatggcgg agcagacgct cgtccggggg caatgagata tgaaaaagcc 4560
tgaactcacc gcgacgtatc gggccctggc cagctagcta gagtcgacct gcaggtcccc 4620
ggggatcggt cttgccttgc tcgtcggtga tgtacttcac cagctccgcg aagtcgctct 4680
tcttgatgga gcgcatgggg acgtgcttgg caatcacgcg caccccccgg ccgttttagc 4740
ggctaaaaaa gtcatggctc tgccctcggg cggaccacgc ccatcatgac cttgccaagc 4800
tcgtcctgct tctcttcgat cttcgccagc agggcgagga tcgtggcatc accgaaccgc 4860
gccgtgcgcg ggtcgtcggt gagccagagt ttcagcaggc cgcccaggcg gcccaggtcg 4920
ccattgatgc gggccagctc gcggacgtgc tcatagtcca cgacgcccgt gattttgtag 4980
ccctggccga cggccagcag gtaggccgac aggctcatgc cggccgccgc cgccttttcc 5040
tcaatcgctc ttcgttcgtc tggaaggcag tacaccttga taggtgggct gcccttcctg 5100
gttggcttgg tttcatcagc catccgcttg ccctcatctg ttacgccggc ggtagccggc 5160
cagcctcgca gagcaggatt cccgttgagc accgccaggt gcgaataagg gacagtgaag 5220
aaggaacacc cgctcgcggg tgggcctact tcacctatcc tgcccggctg acgccgttgg 5280
atacaccaag gaaagtctac acgaaccctt tggcaaaatc ctgtatatcg tgcgaaaaag 5340
gatggatata ccgaaaaaat cgctataatg accccgaagc agggttatgc agcggaaaag 5400
atccgtcgac ctgcaggcat gcaagctcta gcgattccag acgtcccgaa ggcgtggcgc 5460
ggcttccccg tgccggagca atcgccctgg gtgggttaca cgacgcccct ctatggcccg 5520
tactgacgga cacaccgaag ccccggcggc aaccctcagc ggatgccccg gggcttcacg 5580
ttttcccagg tcagaagcgg ttttcgggag tagtgcccca actggggtaa cctttgagtt 5640
ctctcagttg ggggcgtagg gtcgccgaca tgacacaagg ggttgtgacc ggggtggaca 5700
cgtacgcggg tgcttacgac cgtcagtcgc gcgagcgcga gaattcgagc gcagcaagcc 5760
cagcgacaca gcgtagcgcc aacgaagaca aggcggccga ccttcagcgc gaagtcgagc 5820
gcgacggggg ccggttcagg ttcgtcgggc atttcagcga agcgccgggc acgtcggcgt 5880
tcgggacggc ggagcgcccg gagttcgaac gcatcctgaa cgaatgccgc gccgggcggc 5940
tcaacatgat cattgtctat gacgtgtcgc gcttctcgcg cctgaaggtc atggacgcga 6000
ttccgattgt ctcggaattg ctcgccctgg gcgtgacgat tgtttccact caggaaggcg 6060
tcttccggca gggaaacgtc atggacctga ttcacctgat tatgcggctc gacgcgtcgc 6120
acaaagaatc ttcgctgaag tcggcgaaga ttctcgacac gaagaacctt cagcgcgaat 6180
tgggcgggta cgtcggcggg aaggcgcctt acggcttcga gcttgtttcg gagacgaagg 6240
agatcacgcg caacggccga atggtcaatg tcgtcatcaa caagcttgcg cactcgacca 6300
ctccccttac cggacccttc gagttcgagc ccgacgtaat ccggtggtgg tggcgtgaga 6360
tcaagacgca caaacacctt cccttcaagc cgggcagtca agccgccatt cacccgggca 6420
gcatcacggg gctttgtaag cgcatggacg ctgacgccgt gccgacccgg ggcgagacga 6480
ttgggaagaa gaccgcttca agcgcctggg acccggcaac cgttatgcga atccttcggg 6540
acccgcgtat tgcgggcttc gccgctgagg tgatctacaa gaagaagccg gacggcacgc 6600
cgaccacgaa gattgagggt taccgcattc agcgcgaccc gatcacgctc cggccggtcg 6660
agcttgattg cggaccgatc atcgagcccg ctgagtggta tgagcttcag gcgtggttgg 6720
acggcagggg gcgcggcaag gggctttccc gggggcaagc cattctgtcc gccatggaca 6780
agctgtactg cgagtgtggc gccgtcatga cttcg 6815
<210> 111
<211> 6705
<212> DNA
<213> Artificial Sequence
<220>
<223> >pSETT4tip
<400> 111
aagcgcgggg aagaatcgat caaggactct taccgctgcc gtcgccggaa ggtggtcgac 60
ccgtccgcac ctgggcagca cgaaggcacg tgcaacgtca gcatggcggc actcgacaag 120
ttcgttgcgg aacgcatctt caacaagatc aggcacgccg aaggcgacga agagacgttg 180
gcgcttctgt gggaagccgc ccgacgcttc ggcaagctca ctgaggcgcc tgagaagagc 240
ggcgaacggg cgaaccttgt tgcggagcgc gccgacgccc tgaacgccct tgaagagctg 300
tacgaagacc gcgcggcagg cgcgtacgac ggacccgttg gcaggaagca cttccggaag 360
caacaggcag cgctgacgct ccggcagcaa ggggcggaag agcggcttgc cgaacttgaa 420
gccgccgaag ccccgaagct tccccttgac caatggttcc ccgaagacgc cgacgctgac 480
ccgaccggcc ctaagtcgtg gtgggggcgc gcgtcagtag acgacaagcg cgtgttcgtc 540
gggctcttcg tagacaagat cgttgtcacg aagtcgacta cgggcagggg gcagggaacg 600
cccatcgaga agcgcgcttc gatcacgtgg gcgaagccgc cgaccgacga cgacgaagac 660
gacgcccagg acggcacgga agacgtagcg gcgtagcgag acacccggga agcctgatct 720
acgtctgtcg agaagtttct gatcgaaaag ttcgacagcg tctccgacct gatgcagctc 780
tcgcagggcg aagaatctcg tgctttcagc ttcgatgtag gagggcgtgg atatgtcctg 840
cgggtaaata gctgcgccga tggttctctg tcgtcgctga cgtctgtagt ctagcctcat 900
tatgattgta cgctattcag ggattgactg ataccggaag acatctcaaa tgaagtggtc 960
aagctttatg cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct 1020
agggtcccca attaattagt aatataatct attaaaggtc attcaaaagg tcatccaagc 1080
ttggctgttt tggcggatga gagaagattt tcagcctgat acagattaaa tcagaacgca 1140
gaagcggtct gataaaacag aatttgcctg gcggcagtag cgcggtggtc ccacctgacc 1200
ccatgccgaa ctcagaagtg aaacgccgta gcgccgatgg tagtgtggcc catgcgagag 1260
tacaatccct agaacgtccg ggcttgcacc tcacgtcacg tgaggaggca gcgtggacgg 1320
cgtggtacca agcttattgg cactagtcga gcaacggagg tattccgatg gtaccgagac 1380
cttatgttga tcggcacttt gcatcggccg cgctcccgat tccggaagtg cttgacattg 1440
gggaatttat gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc 1500
gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 1560
tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 1620
ggttttccca gtcacgacgt tgtaaaacga cggccagtgc caagcttggg ctgcaggtcg 1680
actctagagg atccgcggcc gcgcgcgata tcgaattcgt aatcatgtca tagctgtttc 1740
ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt 1800
gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgcggtctcg 1860
gcgtttcgtg ccgcgtgatt ttccgccaaa aactttaacg aacgttcgtt ataatggtgt 1920
catgaccttc acgacgaagt actaaaattg gcccgaatca tcagctaagc tttatgcttg 1980
taaaccgttt tgtgaaaaaa tttttaaaat aaaaaagggg acctctaggg tccccaatta 2040
attagtaata taatctatta aaggtcattc aaaaggtcat ccacctcact tcggtgaatc 2100
gaagcgcggc atcagggtta ctttttggat acctgagaca ttcgtcgctt ccgggtatgc 2160
gctctatgtg acggtctttt ggcgcacaaa tgctcagcac catttaaatt agaccgactc 2220
cagatctgta aggtccaaca aaacccatcg tagtccttag acttggcaca cttacacctg 2280
cagtggatga ccttttgaat gacctttaat agattatatt actaattaat tggggaccct 2340
agaggtcccc ttttttattt taaaaatttt ttcacaaaac ggtttacaag cataaagctt 2400
gccacgcaga cgacagccca cgctgaccga tctacctgaa cggcgaccat ctgtgtggta 2460
ctggggcgga gagataacta cggtgccgct taccgggctc actcaaaggc ggtaatacgg 2520
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 2580
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 2640
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 2700
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 2760
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 2820
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 2880
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 2940
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 3000
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca 3060
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 3120
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 3180
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 3240
cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 3300
acctagatcc ttttggttca tgtgcagctc catcagcaaa aggggatgat aagtttatca 3360
ccaccgacta tttgcaacag tgccgttgat cgtgctatga tcgactgatg tcatcagcgg 3420
tggagtgcaa tgtcgtgcaa tacgaatggc gaaaagccga gctcatcggt cagcttctca 3480
accttggggt tacccccggc ggtgtgctgc tggtccacag ctccttccgt agcgtccggc 3540
ccctcgaaga tgggccactt ggactgatcg aggccctgcg tgctgcgctg ggtccgggag 3600
ggacgctcgt catgccctcg tggtcaggtc tggacgacga gccgttcgat cctgccacgt 3660
cgcccgttac accggacctt ggagttgtct ctgacacatt ctggcgcctg ccaaatgtaa 3720
agcgcagcgc ccatccattt gcctttgcgg cagcggggcc acaggcagag cagatcatct 3780
ctgatccatt gcccctgcca cctcactcgc ctgcaagccc ggtcgcccgt gtccatgaac 3840
tcgatgggca ggtacttctc ctcggcgtgg gacacgatgc caacacgacg ctgcatcttg 3900
ccgagttgat ggcaaaggtt ccctatgggg tgccgagaca ctgcaccatt cttcaggatg 3960
gcaagttggt acgcgtcgat tatctcgaga atgaccactg ctgtgagcgc tttgccttgg 4020
cggacaggtg gctcaaggag aagagccttc agaaggaagg tccagtcggt catgcctttg 4080
ctcggttgat ccgctcccgc gacattgtgg cgacagccct gggtcaactg ggccgagatc 4140
cgttgatctt cctgcatccg ccagaggcgg gatgcgaaga atgcgatgcc gctcgccagt 4200
cgattggctg agctcatgag cggagaacga gatgacgttg gaggggcaag gtcgcgctga 4260
ttgctggggc aacacgtgga gcggatcggg gattgtcttt cttcagctcg ctgatgatat 4320
gctgacgctc aatgccgttt ggcctccgac taacgaaaat cccgcatttg gacggctgat 4380
ccgattggca cggcggacgg cgaatggcgg agcagacgct cgtccggggg caatgagata 4440
tgaaaaagcc tgaactcacc gcgacgtatc gggccctggc cagctagcta gagtcgacct 4500
gcaggtcccc ggggatcggt cttgccttgc tcgtcggtga tgtacttcac cagctccgcg 4560
aagtcgctct tcttgatgga gcgcatgggg acgtgcttgg caatcacgcg caccccccgg 4620
ccgttttagc ggctaaaaaa gtcatggctc tgccctcggg cggaccacgc ccatcatgac 4680
cttgccaagc tcgtcctgct tctcttcgat cttcgccagc agggcgagga tcgtggcatc 4740
accgaaccgc gccgtgcgcg ggtcgtcggt gagccagagt ttcagcaggc cgcccaggcg 4800
gcccaggtcg ccattgatgc gggccagctc gcggacgtgc tcatagtcca cgacgcccgt 4860
gattttgtag ccctggccga cggccagcag gtaggccgac aggctcatgc cggccgccgc 4920
cgccttttcc tcaatcgctc ttcgttcgtc tggaaggcag tacaccttga taggtgggct 4980
gcccttcctg gttggcttgg tttcatcagc catccgcttg ccctcatctg ttacgccggc 5040
ggtagccggc cagcctcgca gagcaggatt cccgttgagc accgccaggt gcgaataagg 5100
gacagtgaag aaggaacacc cgctcgcggg tgggcctact tcacctatcc tgcccggctg 5160
acgccgttgg atacaccaag gaaagtctac acgaaccctt tggcaaaatc ctgtatatcg 5220
tgcgaaaaag gatggatata ccgaaaaaat cgctataatg accccgaagc agggttatgc 5280
agcggaaaag atccgtcgac ctgcaggcat gcaagctcta gcgattccag acgtcccgaa 5340
ggcgtggcgc ggcttccccg tgccggagca atcgccctgg gtgggttaca cgacgcccct 5400
ctatggcccg tactgacgga cacaccgaag ccccggcggc aaccctcagc ggatgccccg 5460
gggcttcacg ttttcccagg tcagaagcgg ttttcgggag tagtgcccca actggggtaa 5520
cctttgagtt ctctcagttg ggggcgtagg gtcgccgaca tgacacaagg ggttgtgacc 5580
ggggtggaca cgtacgcggg tgcttacgac cgtcagtcgc gcgagcgcga gaattcgagc 5640
gcagcaagcc cagcgacaca gcgtagcgcc aacgaagaca aggcggccga ccttcagcgc 5700
gaagtcgagc gcgacggggg ccggttcagg ttcgtcgggc atttcagcga agcgccgggc 5760
acgtcggcgt tcgggacggc ggagcgcccg gagttcgaac gcatcctgaa cgaatgccgc 5820
gccgggcggc tcaacatgat cattgtctat gacgtgtcgc gcttctcgcg cctgaaggtc 5880
atggacgcga ttccgattgt ctcggaattg ctcgccctgg gcgtgacgat tgtttccact 5940
caggaaggcg tcttccggca gggaaacgtc atggacctga ttcacctgat tatgcggctc 6000
gacgcgtcgc acaaagaatc ttcgctgaag tcggcgaaga ttctcgacac gaagaacctt 6060
cagcgcgaat tgggcgggta cgtcggcggg aaggcgcctt acggcttcga gcttgtttcg 6120
gagacgaagg agatcacgcg caacggccga atggtcaatg tcgtcatcaa caagcttgcg 6180
cactcgacca ctccccttac cggacccttc gagttcgagc ccgacgtaat ccggtggtgg 6240
tggcgtgaga tcaagacgca caaacacctt cccttcaagc cgggcagtca agccgccatt 6300
cacccgggca gcatcacggg gctttgtaag cgcatggacg ctgacgccgt gccgacccgg 6360
ggcgagacga ttgggaagaa gaccgcttca agcgcctggg acccggcaac cgttatgcga 6420
atccttcggg acccgcgtat tgcgggcttc gccgctgagg tgatctacaa gaagaagccg 6480
gacggcacgc cgaccacgaa gattgagggt taccgcattc agcgcgaccc gatcacgctc 6540
cggccggtcg agcttgattg cggaccgatc atcgagcccg ctgagtggta tgagcttcag 6600
gcgtggttgg acggcagggg gcgcggcaag gggctttccc gggggcaagc cattctgtcc 6660
gccatggaca agctgtactg cgagtgtggc gccgtcatga cttcg 6705
Claims (15)
- 아카르보스의 개선된 생산을 위해 악티노미세탈레스(Actinomycetales) 균주, 바람직하게는 악티노플라네스(Actinoplanes) 균주를 조작하는 방법으로서,
(i) 서열식별번호: 20에 따른 세포외 작은 탄수화물 결합 단백질 Cgt의 발현 부재 또는 감소를 위해, 및/또는
(ii) 카로티노이드 합성에 필수적인 적어도 하나의 유전자의 발현 부재 또는 감소를 위해, 및/또는
(iii) 서열식별번호: 13에 따른 dTDP-D-글루코스-4,6-데히드라타제 AcbB의 과다발현을 위해, 및/또는
(iv) 서열식별번호: 19에 따른 UDP-글루코스-1P 우리딜트랜스퍼라제 GtaB의 과다발현을 위해
악티노미세탈레스 균주를 조작하는 것을 포함하는 방법. - 제1항에 있어서, 하기를 포함하는 방법:
(i) 서열식별번호: 20에 따른 세포외 작은 탄수화물 결합 단백질 Cgt를 코딩하는 유전자의 결실 또는 돌연변이 및/또는
(ii) 카로티노이드 합성에 필수적인 적어도 하나의 유전자의 결실 또는 돌연변이 및/또는
(iii) AcbB에 대한 발현 카세트를 포함하는 벡터를 악티노미세탈레스 균주 내로 도입하는 것 및/또는
(iv) GtaB에 대한 발현 카세트를 포함하는 벡터를 악티노미세탈레스 균주 내로 도입하는 것. - 제2항에 있어서, (iii) 및/또는 (iv)에 따른 발현 카세트가 글루쿠로니다제 검정에서 적어도 1 x 10-4 [L·g-1·min- 1]의 정규화된 글루쿠로니다제 활성을 특징으로 하는 중간 정도의 강한 프로모터 또는 글루쿠로니다제 검정에서 적어도 5 x 10-4 [L·g-1·min- 1]의 정규화된 글루쿠로니다제 활성을 특징으로 하는 강한 프로모터의 제어 하에 있는 것인 방법.
- 서열식별번호: 20에 따른 세포외 작은 탄수화물 결합 단백질 Cgt의 발현 부재 또는 감소를 위해 유전적으로 조작된, 아카르보스의 생산을 위한 악티노미세탈레스 균주, 바람직하게는 악티노플라네스 균주.
- 제4항에 있어서, cgt 결실 돌연변이체인 악티노미세탈레스 균주.
- 카로티노이드 합성에 필수적인 적어도 하나의 유전자의 발현 부재 또는 감소를 위해 유전적으로 조작된, 아카르보스의 생산을 위한 악티노미세탈레스 균주, 바람직하게는 악티노플라네스 균주.
- 서열식별번호: 13에 따른 dTDP-D-글루코스-4,6-데히드라타제 AcbB의 과다발현을 위해 유전적으로 조작된, 아카르보스의 생산을 위한 악티노미세탈레스 균주, 바람직하게는 악티노플라네스 균주.
- 서열식별번호: 19에 따른 UDP-글루코스-1P 우리딜트랜스퍼라제 GtaB의 과다발현을 위해 유전적으로 조작된, 아카르보스의 생산을 위한 악티노미세탈레스 균주, 바람직하게는 악티노플라네스 균주.
- 제1항 내지 제3항 및 제6항 중 어느 한 항에 있어서, 카로티노이드 합성에 필수적인 적어도 하나의 유전자가 하기 중 임의의 것으로부터 선택된 적어도 하나의 유전자를 포함하는 것인 아카르보스의 생산을 위한 악티노미세탈레스 균주 또는 방법:
a. MEP/DOXP 경로의 유전자
i. 서열식별번호: 23에 따른 1-데옥시-D-크실룰로스-5-포스페이트 신타제 유전자 dxs, ACSP50_7096,
ii. 서열식별번호: 24에 따른 4-히드록시-3-메틸부트-2-엔-1-일 디포스페이트 신타제 유전자 ispG, ACSP50_7248,
iii. 서열식별번호: 25에 따른 1-데옥시-D-크실룰로스-5-포스페이트 리덕토이소머라제 유전자 dxr, ACSP50_7250,
iv. 서열식별번호: 26에 따른 4-히드록시-3-메틸부트-2-에닐 디포스페이트 리덕타제 유전자 ispH, ACSP50_7707,
v. 서열식별번호: 27에 따른 4-(시티딘 5'-디포스포)-2-C-메틸-D-에리트리톨 키나제 유전자 ispE, ACSP50_7802,
vi. 서열식별번호: 28에 따른 2-C-메틸-D-에리트리톨 2;4-시클로디포스페이트 신타제 유전자 ispF, ACSP50_8046, 및/또는
vii. 서열식별번호: 29에 따른 2-C-메틸-D-에리트리톨 4-포스페이트 시티딜릴트랜스퍼라제 유전자 ispD, ACSP50_8047,
b. 테르펜 클러스터 1의 유전자
i. 서열식별번호: 30에 따른 이소펜테닐-디포스페이트 델타-이소머라제 유전자 idi, ACSP50_0146,
ii. 서열식별번호: 10에 따른 제타-피토엔 데새투라제 유전자 crtI, ACSP50_0147,
iii. 서열식별번호: 31에 따른 폴리프레닐 신테타제 유전자 crtE/ldsA, ACSP50_0148,
iv. 서열식별번호: 32에 따른 피토엔 신타제 유전자 crtB, ACSP50_0149,
v. 서열식별번호: 33에 따른 데옥시리보디피리미딘 포토-리아제 유전자, ACSP50_0150, 또는
vi. 서열식별번호: 34에 따른 피리딘 뉴클레오티드-디술피드 옥시도리덕타제 유전자, ACSP50_0151,
c. 테르펜 클러스터 2a의 유전자
i. 서열식별번호: 35에 따른 전사 조절인자 유전자 ACSP50_1631,
ii. 서열식별번호: 36에 따른 리코펜 시클라제 유전자 ACSP50_1632,
iii. 서열식별번호: 37에 따른 리코펜 시클라제 유전자 ACSP50_1633,
iv. 서열식별번호: 38에 따른 폴리프레닐 신테타제, 파르네실 피로포스페이트 신테타제 2 유전자 fps2/crtE, ACSP50_1634, 또는
v. 서열식별번호: 39에 따른 메틸렌테트라히드로폴레이트 리덕타제 (NADPH) 유전자, ACSP50_1635,
d. 테르펜 클러스터 2b의 유전자
i. 서열식별번호: 40에 따른 LysR-패밀리 전사 조절인자 유전자, ACSP50_1650,
ii. 서열식별번호: 41에 따른 메틸트랜스퍼라제 유형 11 유전자, ACSP50_1651,
iii. 서열식별번호: 42에 따른 CDP-알콜포스파티딜트랜스퍼라제 pgsA, ACSP50_1652,
iv. 서열식별번호: 43에 따른 제타-피토엔 데새투라제 (crtI-패밀리) 유전자 crtD, ACSP50_1653,
v. 서열식별번호: 44에 따른 글리코실 트랜스퍼라제 유전자 cruC, ACSP50_1654,
vi. 서열식별번호: 45에 따른 가상 단백질 (추정 막 단백질) 유전자 cruF, ACSP50_1655,
vii. 서열식별번호: 46에 따른 GCN5 패밀리 아세틸트랜스퍼라제 유전자, ACSP50_1656,
viii. 서열식별번호: 47에 따른 모노옥시게나제 유전자, ACSP50_1657,
ix. 서열식별번호: 48에 따른 단쇄 데히드로게나제 유전자, ACSP50_1658,
e. 서열식별번호: 49에 따른 폴리프레닐 신테타제 유전자 crtE, ACSP50_3873, 또는
f. 캄펜-유사 모노테르펜 생합성 테르펜 클러스터 3에 대한 유전자
i. 서열식별번호: 104에 따른 전사 조절인자 (Crp/Fnr 패밀리) 유전자 eshA, ACSP50_1949,
ii. 서열식별번호: 50에 따른 캄펜 신타제 유전자, ACSP50_1950,
iii. 서열식별번호: 105에 따른 메틸트랜스퍼라제 (SAM-의존성) 유형 11 유전자, ACSP50_1951,
iv. 서열식별번호: 106에 따른 글리코실-히드롤라제 유전자, ACSP50_1952, 또는
v. 서열식별번호: 107에 따른 옥시도리덕타제/알도/케토리덕타제, ACSP50_1953. - 서열식별번호: 13에 따른 AcbB에 대한 발현 카세트 및/또는 서열식별번호: 19에 따른 GtaB에 대한 발현 카세트 및/또는 서열식별번호: 22에 따른 MerR에 대한 발현 카세트를 포함하는 악티노플라네스에 대한 발현 벡터.
- 제10항에 있어서, 글루쿠로니다제 검정에서 적어도 1 x 10-4 [L·g-1·min- 1]의 정규화된 글루쿠로니다제 활성을 특징으로 하는 중간 정도의 강한 프로모터 또는 글루쿠로니다제 검정에서 적어도 5 x 10-4 [L·g-1·min- 1]의 정규화된 글루쿠로니다제 활성을 특징으로 하는 강한 프로모터를 추가로 포함하는 발현 벡터.
- 제10항 또는 제11항에 있어서,
a. 서열식별번호: 85에 따른 φC31 인테그라제 유전자 int, 및
b. 서열식별번호: 87에 따른 전달 기점 (incP), 및
c. 서열식별번호: 88에 따른 릴랙소좀 유전자 traJ, 및
d. 복제 기점,
바람직하게는 서열식별번호: 89에 따른 높은 카피 수 ColE1/pMB1/pBR322/pUC 복제 기점 (ori) 및
e. 임의적으로 적어도 하나의 내성 마커,
바람직하게는 아프라마이신 내성을 매개하는 내성 마커, 보다 바람직하게는 서열식별번호: 90에 따른 aac(3)IV, apmR, 및
f. 임의적으로 적어도 하나의 T4-종결인자
를 추가로 포함하며,
임의적으로, 여기서 벡터가 서열식별번호: 108 및/또는 서열식별번호: 109에 따른 추정 안티센스 프로모터를 포함하지 않는 것인
발현 벡터. - 제11항 또는 제12항에 있어서, 상기 강한 프로모터가
a. 서열식별번호: 96에 따른 apm,
b. 서열식별번호: 98에 따른 ermE*,
c. 서열식별번호: 94에 따른 katE,
d. 서열식별번호: 95에 따른 moeE5, 또는
e. 서열식별번호: 82에 따른 gapDH
로 이루어진 군으로부터 선택되고/거나,
상기 중간 정도의 강한 프로모터가
f. 서열식별번호: 92에 따른 efp,
g. 서열식별번호: 97에 따른 cdaR,
h. 서열식별번호: 99에 따른 rpsL,
i. 서열식별번호: 93에 따른 rpsJ,
j. 서열식별번호: 91에 따른 cgt, 또는
k. 서열식별번호: 81에 따른 tipA
로 이루어진 군으로부터 선택되는 것인
발현 벡터. - 제4항 내지 제9항 중 어느 한 항에 있어서, 균주가 제10항 내지 제13항 중 어느 한 항에 따른 벡터를 포함하는 것인, 아카르보스의 생산을 위한 악티노미세탈레스 균주.
- 아카르보스의 생산에 있어서의 제4항 내지 제9항 중 어느 한 항에 따른 악티노미세탈레스 균주의 용도.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19203693.7 | 2019-10-16 | ||
EP19203693 | 2019-10-16 | ||
PCT/EP2020/077688 WO2021073900A1 (en) | 2019-10-16 | 2020-10-02 | Methods for the improved formation of acarbose |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220081991A true KR20220081991A (ko) | 2022-06-16 |
Family
ID=68424577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227012323A KR20220081991A (ko) | 2019-10-16 | 2020-10-02 | 아카르보스의 개선된 형성을 위한 방법 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230227879A1 (ko) |
EP (1) | EP4045520A1 (ko) |
JP (1) | JP2022553183A (ko) |
KR (1) | KR20220081991A (ko) |
CN (1) | CN114555811A (ko) |
WO (1) | WO2021073900A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118086157A (zh) * | 2022-11-28 | 2024-05-28 | 浙江海正药业股份有限公司 | 生产阿卡波糖的工程菌及其构建方法和应用 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2064092C2 (de) | 1970-12-28 | 1983-06-01 | Bayer Ag, 5090 Leverkusen | Inhibitoren für Glykosidhydrolasen aus Actinomyceten |
DE2209834C3 (de) | 1972-03-01 | 1978-04-20 | Bayer Ag, 5090 Leverkusen | Herstellung von Saccharase-Inhibitoren |
US5501968A (en) * | 1987-10-15 | 1996-03-26 | Novo Nordisk A/S | Thermostable cyclodextrin glycosyl transferase and processes using it |
DE19708127A1 (de) * | 1997-02-28 | 1998-09-03 | Bayer Ag | Acarbose acb-Cluster: Isolierung von weiteren Genen der Acarbose Biosynthese und des Acarbose-Stoffwechsels aus Actinoplanes sp. SE 50/110 sowie deren Verwendung |
TW201217533A (en) * | 2010-08-04 | 2012-05-01 | Bayer Pharma AG | Genomics of actinoplanes utahensis |
-
2020
- 2020-10-02 KR KR1020227012323A patent/KR20220081991A/ko unknown
- 2020-10-02 JP JP2022522688A patent/JP2022553183A/ja active Pending
- 2020-10-02 WO PCT/EP2020/077688 patent/WO2021073900A1/en unknown
- 2020-10-02 CN CN202080072811.6A patent/CN114555811A/zh active Pending
- 2020-10-02 EP EP20780751.2A patent/EP4045520A1/en active Pending
- 2020-10-02 US US17/769,001 patent/US20230227879A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2022553183A (ja) | 2022-12-22 |
EP4045520A1 (en) | 2022-08-24 |
CN114555811A (zh) | 2022-05-27 |
WO2021073900A1 (en) | 2021-04-22 |
US20230227879A1 (en) | 2023-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10344285B2 (en) | DNA vectors, transposons and transposases for eukaryotic genome modification | |
KR102700050B1 (ko) | 조작된 내수송/외수송을 가진 미생물 숙주에서 모유 올리고당류의 생산 | |
Kobayashi et al. | Flavonoids induce temporal shifts in gene‐expression of nod‐box controlled loci in Rhizobium sp. NGR234 | |
KR101659101B1 (ko) | 박테리아 [2Fe-2S] 다이하이드록시산 탈수효소의 동정 및 용도 | |
US12054702B2 (en) | DNA vectors, transposons and transposases for eukaryotic genome modification | |
Jonuscheit et al. | A reporter gene system for the hyperthermophilic archaeon Sulfolobus solfataricus based on a selectable and integrative shuttle vector | |
US20200255830A1 (en) | Novel crispr-associated transposon systems and components | |
Boccazzi et al. | Generation of dominant selectable markers for resistance to pseudomonic acid by cloning and mutagenesis of the ileS gene from the archaeon Methanosarcina barkeri Fusaro | |
IL236992A (en) | Genetically modified cyanobacteria that produce ethanol | |
CN107278227A (zh) | 用于体外病毒基因组工程的组合物和方法 | |
JP2004524031A (ja) | 合成遺伝子、およびCpGを欠く細菌プラスミド | |
KR20140113997A (ko) | 부탄올 생성을 위한 유전자 스위치 | |
US11339395B2 (en) | RNA-based regulatory technologies for miRNA sensors | |
Heffron et al. | Roles of germination-specific lytic enzymes CwlJ and SleB in Bacillus anthracis | |
TW202237845A (zh) | 用於涉及去胺作用之基因體編輯之多核苷酸、組合物及方法 | |
Garcia et al. | Characterization of a two-component regulatory system that regulates succinate-mediated catabolite repression in Sinorhizobium meliloti | |
Crawford et al. | The stringent response in Myxococcus xanthus is regulated by SocE and the CsgA C-signaling protein | |
US20220372533A1 (en) | Transgenic microorganisms and synthesis of piperazic acid, piperazic acid containing products, and derivatives thereof | |
Magrini et al. | Site-specific recombination of temperate Myxococcus xanthus phage Mx8: genetic elements required for integration | |
WO2005103229A2 (en) | Transgenomic mitochondria, transmitochondrial cells and organisms, and methods of making and using | |
Keating et al. | A Sinorhizobium meliloti lipopolysaccharide mutant altered in cell surface sulfation | |
KR20220081991A (ko) | 아카르보스의 개선된 형성을 위한 방법 | |
Bi et al. | Inefficient translation renders the Enterococcus faecalis fabK enoyl-acyl carrier protein reductase phenotypically cryptic | |
Stuitje et al. | Initiation signals for complementary strand DNA synthesis in the region of the replication origin of the Escherichia coli chromosome | |
US20040247620A1 (en) | Transformation system based on the integrase gene and attachment site for Myxococcus xanthus bacteriophage Mx9 |