KR20230041694A

KR20230041694A - 알라닌 라세마제 이중 결실 및 트랜스 보완

Info

Publication number: KR20230041694A
Application number: KR1020237001807A
Authority: KR
Inventors: 막스 파비안 펠레; 슈테판 예네바인; 크리슈토퍼 자우어; 토비아스 클라인
Original assignee: 바스프 에스이
Priority date: 2020-07-24
Filing date: 2021-07-23
Publication date: 2023-03-24
Also published as: JP2023534719A; CN116249777A; US20230295603A1; BR112023000958A2; EP4185690A1; MX2023001017A; JP2023534742A; US20230272358A1; CA3186369A1; WO2022018260A1; EP4185689A1; CA3186383A1; BR112023001024A2; MX2023001016A; WO2022018268A1; KR20230042088A

Abstract

본 발명은 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자 및 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자가 불활성화된 박테리아 숙주 세포에 관한 것이다. 상기 박테리아 숙주 세포는 - 적어도 하나의 자율 복제 서열을 포함하는 플라스미드 상에 또는 염색체 내 다수 카피로서 존재하는 - 프로모터에 작동적으로 연결된, 적어도 하나의 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및 프로모터에 작동적으로 연결된, 제3 알라닌 라세마제를 코딩하는 폴리뉴클레오티드를 포함하는 유전자 발현 카세트를 포함한다. 본 발명은 또한 본 발명의 박테리아 숙주 세포의 배양을 기반으로 하는 적어도 하나의 관심 폴리펩티드를 제조하기 위한 방법에 관한 것이다.

Description

알라닌 라세마제 이중 결실 및 트랜스 보완

본 발명은 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자 및 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자가 불활성화된 박테리아 숙주 세포에 관한 것이다. 상기 박테리아 숙주 세포는 적어도 하나의 자율 복제 서열, 프로모터에 작동적으로 연결된, 적어도 하나의 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및 프로모터에 작동적으로 연결된, 제3 알라닌 라세마제를 코딩하는 폴리뉴클레오티드를 포함하는 플라스미드를 포함한다. 본 발명은 또한 본 발명의 박테리아 숙주 세포의 배양을 기반으로 하는 적어도 하나의 관심 폴리펩티드를 제조하기 위한 방법에 관한 것이다.

유전자 조작 기술의 진보는 이종성 단백질의 생산자로서 미생물 세포의 개선을 허용하였다. 단백질 생산은 전형적으로 대량의 재조합 단백질을 발현하도록 미생물에서 유전자 발현의 조작을 통해 달성된다.

바실러스 (Bacillus) 속의 미생물은 가치있는 화합물, 예를 들어, 화학물, 중합체, 단백질, 및 특히 세척- 및/또는 세정-활성 효소같은 단백질의 생산을 위한 산업적 일꾼으로서 널리 적용된다. 이들 유용한 물질의 생물공학적 생산은 발효 및 생산물의 후속 정제를 통해 수행된다. 바실러스 종은 발효 액체배지로 상당한 양의 단백질을 분비할 수 있다. 이것은 세포내 생산과 비교하여 단순한 생산물 정제 과정을 가능하게 하고 산업적 적용에서 바실러스의 성공을 설명한다.

재조합 생산 숙주에 의한 화합물의 고수준 생산을 위해서, 안정한 발현 시스템이 필수적이다. 재조합 생산 숙주는 더 높은 수준으로 관심 화합물을 생산하도록 천연 야생형 숙주와 비교하여 유전자 변형된다. 그러나, 재조합 생산 숙주는 야생형 숙주에 비해서 낮은 적합도의 단점을 가져서 발효 과정에서 야생형 세포의 과성장 및 생산물 수율의 손실을 초래한다.

자율 복제 플라스미드는 숙주 게놈과 독립적으로 복제되는 원형 DNA 플라스미드이다. 플라스미드는 관심 화합물의 생산을 위해 생물공학적 적용분야에서 수십여년 동안 원핵생물 및 진핵생물에서 사용되어 왔다.

일부 천연 발생 플라스미드와 달리, 대부분의 재조합 플라스미드는 특히 관심 화합물의 생산이 세포의 적합도에 대한 단점을 나타낼 때, 박테리아에서 다소 불안정하다. 게다가, 플라스미드의 안정한 유지는 박테리아에 대한 물질대사적 부담이다.

플라스미드 및 그에 따라 재조합 숙주의 생산성을 유지하기 위한 다수의 접근법이 시도되어 왔다. 예를 들어, 항생제 내성 마커 및 영양요구성 내성 마커에 의해 부여되는 양성 선택을 사용하여 만족할만한 수준으로 생산 수율을 유지시켰다.

플라스미드 상에 항생제 내성 마커의 사용 및 배지에 항생제의 보충이 발효 과정에서 양성 선택으로서 널리 사용되고 있다. 그러나, 관심 화합물의 강력한 생산 조건 하에서, 세포 개체군 내 플라스미드의 상실이 관찰되었는데 플라스미드 선택에 사용되는 항생제의 농도가 종종 희석 및/또는 효소 분해의 결과로서 장기간 배양 동안 감소되기 때문이다. 게다가, 최종 생산물 및 폐수 중에 항생제의 존재는 일반적으로 허용되지 않으므로, 추가 정제가 요구된다.

영양요구성 마커, 예를 들어, 아미노산 생합성 경로의 효소는 또한 상응하는 유전자에 결함이 있는 숙주 세포와 발효 과정 동안 순수 및 한정 배지가 사용될 때 플라스미드 상의 양성 선택에 사용될 수 있다. 다수-카피 플라스미드에 영양요구성 마커의 제공은 효소 기능이 야생형 숙주와 비교하여 세포 생리와 균형을 이루지 못하기 때문에 세포 성장 및 세포 생산성에 부정적인 영향을 미칠 수 있다. 뿐만 아니라, 발효 과정 동안 세포 용해는 영양요구성 마커에 의해 만들어진 화합물의 교차-공급을 초래하여, 시스템이 플라스미드 유지에 덜 효과적이게 만든다.

EP 3 083 965 A1은 필수, 세포질 유전자 frr (리보솜 재활용 인자)의 염색체 카피를 결실시키고 그것을 플라스미드에 위치시켜서 숙주 세포에서 플라스미드 안정성의 생성 및/또는 항생제 내성의 결실을 위한 방법을 개시한다. 그 결과로, 오직 플라스미드-보유 세포만이 성장할 수 있어서, 숙주 세포가 플라스미드에 전적으로 의존하게 만든다. 게다가, 영양요구성 마커에 대해 설명된 교차-공급은 전체 단백질이 세포 내로 유입될 수 없으므로 존재하지 않는다.

재조합 숙주 세포 구축의 단점은 염색체 유전자의 결실이 플라스미드 상에 적어도 하나의 유전자 카피의 존재 하에서만 만들어질 수 있다는 것이다. 다른 플라스미드, 예를 들어, 생산하고자 하는 상이한 관심 유전자가 제1 플라스미드와 상이한 플라스미드에 의한 이러한 플라스미드의 교체는 지루하고, 제1 플라스미드의 효율적인 제거를 위해 역선택 마커를 필요로 할 수 있다.

단백질 생산을 위한 대안적인 접근법으로서, 효소 알라닌 라세마제는 원핵생물에서 플라스미드 유지에 사용되었다. 알라닌 라세마제 (EC 5.1.1.1)는 L-알라닌을 D-알라닌으로 전환시키는 고유한 원핵생물 효소이다 (Wasserman,S.A., E.Daub, P.Grisafi, D.Botstein, and C.T.Walsh. 1984. Catabolic alanine racemase from Salmonella typhimurium: DNA sequence, enzyme purification, and characterization. Biochemistry 23: 5182-5187). D-알라닌은 세포벽의 기본 성분을 형성하는 펩티도글리칸 층의 필수 성분이다 (Watanabe,A., T.Yoshimura, B.Mikami, H.Hayashi, H.Kagamiyama, and N.Esaki. 2002. Reaction mechanism of alanine racemase from Bacillus stearothermophilus: x-ray crystallographic studies of the enzyme bound with N-(5'-phosphopyridoxyl)alanine. J. Biol. Chem. 277: 19166-19172).

Ferrari 등 (Ferrari,E. 1985. Isolation of an alanine racemase gene from Bacillus subtilis and its use for plasmid maintenance in B. subtilis. Biotechnology 3:1003-1007.)은 비. 서브틸리스 (B. subtilis)에서 결실 시 신속한 세포 사멸을 초래하는 비. 서브틸리스의 D-알라닌 라세마제 유전자 dal (alr 유전자라고도 함)을 단리하였고, 비. 서브틸리스에서 복제성 플라스미드에 위치할 때 선택 마커로서 dal 유전자의 유효성을 보여주었다.

락토바실러스 플란타룸 (Lactobacillus plantarum)의 alr 유전자를 동정하였고 알라닌 라세마제로서 이의 기능성은 이의 2개 알라닌 라세마제 유전자 alr 및 dadX 에 결함이 있는 이. 콜라이 (E. coli)의 성장 결함의 보완을 통해서 증명되었다 (P Hols, C Defrenne, T Ferain, S Derzelle, B Delplace, J Delcour Journal of Bacteriology Jun 1997, 179 (11) 3804-3807).

Ferrari 등의 작업과 유사하게, 락토코커스 락티스 (Lactococcus lactis) 및 락토바실러스 플라타룸 (Lactobacillus plantarum) 유래 락트산 박테리아의 알라닌 라세마제 유전자 (alr)를 게놈에서 결실시켰고 플라스미드에 트랜스로 위치시켜서 200 세대 동안 안정한 플라스미드 유지를 야기시키고 식품 등급 선택 마커로서 적용을 위해 상동성 alr 유전자의 사용을 보여주었다 (Bron,P.A., M.G.Benchimol, J.Lambert, E.Palumbo, M.Deghorain, J.Delcour, W.M.de Vos, M.Kleerebezem, and P.Hols. 2002. Use of the alr gene as a food-grade selection marker in lactic acid bacteria. Appl. Environ. Microbiol. 68: 5663-5670, Ferrari, 1985).

WO 2015/055558은 dal 유전자가 불활성화된 비. 서브틸리스 숙주 세포에서 플라스미드 유지를 위해 바실러스 서브틸리스 dal 유전자의 사용을 기술한다. 플라스미드 상에서 dal 유전자의 발현 수준은 비변경된 RBS와 비교하여 더 낮은 수준으로 리보솜 결합 부위 RBS를 돌연변이시켜서 감소되었다. 그리하여, 플라스미드 카피수는 고카피수로 유지될 수 있었고 아밀라제 생산 수율을 증가시킬 수 있었다.

대안적으로, alr 유전자는 표적 숙주 균주의 alr 영양요구성을 보완하여서 염색체로 유전자 발현 카세트의 효율적인 단일 카피 통합을 위한 선택 마커로서 사용되었다 (US2003032186). alr 유전자는 또한 유전자좌 확장이라고 하는 '증폭 유닛'으로 조직화된 유전자 발현 카세트의 증폭을 위한 선택 마커로서 사용되었다 (WO09120929). 특히, 유전자 발현 카세트, alr 유전자, 및 염색체의 표적 영역에 상동성인 하나의 DNA 영역을 보유하는 비-복제성 플라스미드는 알라닌 라세마제 유전자의 억제제의 존재 하에서 증폭 유닛의 증폭 후에 바실러스 세포로 전달되었다.

많은 그람-음성 유기체, 예컨대 에스케리치아 콜라이 (Escherichia coli), 슈도모나스 애루지노사 (Pseudomonas aeruginosa), 및 살모넬라 티피뮤리움 (Salmonella typhimurium)과 달리, 조사된 대부분의 그람-양성 박테리아 예컨대 바실러스 스테아로써모필루스 (Bacillus stearothermophilus), 락토바실러스 플라타룸 (Lactobacillus plantarum), 및 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum)은 오직 하나의 알라닌 라세마제 유전자를 갖는 것으로 보인다 (Pierce,K.J., S.P.Salifu, and M.Tangney. 2008. Gene cloning and characterization of a second alanine racemase from Bacillus subtilis encoded by yncD. FEMS Microbiol. Lett. 283: 69-74). 바실러스 서브틸리스 경우에, 제2 알라닌 라세마제 유전자, 즉 yncD 가 동정되었고 이. 콜라이의 D-알라닌 영양요구성 균주에서 플라스미드에 위치된 yncD 유전자로의 보완이 확인되었다 (Pierce et al., 2008). 유사하게, 제2 알라닌 라세마제 유전자 alr2 (비. 서브틸리스 yncD 유전자와 상동성)가 바실러스 리케니포르미스 (Bacillus licheniformis)에서 발견되었고, lac 프로모터의 제어 하에서 플라스미드로부터 발현될 때 2개 알라닌 라세마제 유전자 alr 및 dadX 에 결함이 있는 이. 콜라이의 D-알라닌 영양요구성 표현형을 보완할 수 있는 것으로 확인되었다 (Salifu,S.P., K.J.Pierce, and M.Tangney. 2008. Cloning and analysis of two alanine racemase genes from Bacillus licheniformis. Anals of Microbiology 58: 287-291).

최근 연구 (Munch,K.M., J.Muller, S.Wienecke, S.Bergmann, S.Heyber, R.Biedendieck, R.Munch, and D.Jahn. 2015. Polar Fixation of Plasmids during Recombinant Protein Production in Bacillus megaterium Results in Population Heterogeneity. Appl. Environ. Microbiol. 81: 5976-5986)는 배양 동안 재조합 숙주의 생산성에 대한 세포 이종성의 효과를 기술한다. 바실러스 메가테리움 (Bacillus megaterium) 및 비. 서브틸리스 (B. subtilis) 에서 이종성 단백질 생산으로 예시된 생산성의 손실은 단순한 플라스미드 상실에 의해서가 아니라, 세포 분열 동안 플라스미드의 비대칭적 분포에 의해 야기되어서 적은 개체군의 소위 '고-생산자' 및 대량 개체군의 '저-생산자'를 초래하였다.

그러므로, 전체적으로 증강된 화합물 생산을 이끄는 안정한 유전자 발현-숙주 시스템에 대한 요구가 여전히 존재한다.

유리하게, 박테리아 숙주 세포에서 제1 알라닌 라세마제 및 제2 알라닌 라세마제를 코딩하는 2개 염색체 유전자의 조합된 불활성화, 및 적어도 하나의 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 플라스미드의 도입이 대조군 세포와 비교하여 관심 폴리펩티드의 발현 증가를 허용한다는 것이 본 발명의 근간이 되는 연구에서 확인되었다 (실시예 2 및 도 1 참조).

따라서, 본 발명은 적어도 하나의 관심 폴리펩티드를 제조하기 위한 방법에 관한 것으로서, 상기 방법은

a) 적어도 하기 염색체 유전자:

i. 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자, 및

ii. 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자

가 불활성화된 박테리아 숙주 세포를 제공하는 단계로서,

숙주 세포는

1. 적어도 하나의 자율 복제 서열,

2. 프로모터에 작동적으로 연결된, 적어도 하나의 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및

3. 프로모터에 작동적으로 연결된, 제3 알라닌 라세마제를 코딩하는 폴리뉴클레오티드

를 포함하는 플라스미드를 포함하는 것인 단계, 및

b) 박테리아 숙주 세포에서 상기 플라스미드를 유지하는데 도움이 되고, 상기 적어도 하나의 관심 폴리펩티드를 발현하는데 도움이 되는 조건 하에서 박테리아 숙주 세포를 배양하여, 상기 적어도 하나의 관심 폴리펩티드를 생산하는 단계를 포함한다.

본 발명의 방법의 일 구현예에서, 단계 a)는 하기 단계를 포함한다:

a1) i) 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자, 및 ii) 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자를 포함하는 박테리아 숙주 세포를 제공하는 단계,

a2) 상기 제1 및 상기 제2 염색체 유전자를 불활성화시키는 단계, 및

a3) 상기 박테리아 숙주 세포로,

1. 적어도 하나의 자율 복제 서열,

를 포함하는 플라스미드를 도입시키는 단계.

본 발명의 방법의 일 구현예에서, 적어도 하나의 관심 폴리펩티드는 박테리아 숙주 세포에 의해서 발효 액체배지로 분비된다.

본 발명의 방법의 일 구현예에서, 방법은 단계 (b) 이후에 수득된 박테리아 숙주 세포 배양물로부터 관심 폴리펩티드를 수득하는 단계, 및/또는 관심 폴리펩티드를 정제하는 추가 단계를 더 포함한다.

본 발명은 또한 적어도 하기 염색체 유전자가 불활성화된 박테리아 숙주 세포에 관한 것이다:

i. 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자, 및

ii. 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자.

한 구현예에서, 박테리아 숙주 세포는

1. 적어도 하나의 자율 복제 서열,

를 포함하는 플라스미드를 포함한다.

본 발명의 박테리아 숙주 세포의 일 구현예에서, 박테리아 숙주 세포는 상기 기재된 바와 같은 단계 a1), a2) 및 a3)을 수행하여 수득되거나 또는 수득가능하다.

대안적인 구현예에서, 본 발명의 숙주는

u1) 임의로, 플러스 복제 기원 (ori+),

u2) 프로모터에 작동적으로 연결된, 적어도 하나의 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드,

u3) 프로모터에 작동적으로 연결된, 제3 알라닌 라세마제를 코딩하는 폴리뉴클레오티드,

u4) 재조합에 의해서 박테리아 숙주 세포의 염색체로 비-복제성 벡터의 통합을 허용하도록 박테리아 숙주 세포의 염색체 폴리뉴클레오티드에 대해 상동성인 폴리뉴클레오티드

를 포함하는 비-복제성 벡터를 포함한다.

본 발명의 방법 또는 숙주 세포의 한 구현예에서, 숙주 세포는 피르미큐테스 (Firmicutes) 문에 속한다.

본 발명의 방법 또는 숙주 세포의 한 구현예에서, 숙주 세포는 바실리 (Bacilli)의 강에 속한다.

본 발명의 방법 또는 숙주 세포의 한 구현예에서, 숙주 세포는 바실랄레스 (Bacillales)의 목 또는 락토바실랄레스 (Lactobacillales)의 목에 속한다.

본 발명의 방법 또는 숙주 세포의 한 구현예에서, 숙주 세포는 바실라세아에 (Bacillaceae)의 과 또는 락토바실라세아에 (Lactobacillaceae)의 과에 속한다.

본 발명의 방법 또는 숙주 세포의 한 구현예에서, 숙주 세포는 바실러스 (Bacillus) 속에 속한다. 예를 들어, 숙주 세포는 바실러스 푸밀루스 (Bacillus pumilus), 바실러스 세레우스 (Bacillus cereus), 바실러스 벨레젠시스 (Bacillus velezensis), 바실러스 메가테리움 (Bacillus megaterium), 바실러스 리케니포르미스 (Bacillus licheniformis) 또는 바실러스 서브틸리스 (Bacillus subtilis)의 종에 속한다.

일 구현예에서, 숙주 세포는 바실러스 리케니포르미스 (Bacillus licheniformis) 숙주 세포, 예컨대 바실러스 리케니포르미스 균주 ATCC14580 (DSM13)이다.

본 발명의 방법 또는 숙주 세포의 한 구현예에서, 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자는 바실러스 리케니포르미스의 alr 유전자이고, 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자는 바실러스 리케니포르미스의 yncD 유전자이다.

본 발명의 방법 또는 박테리아 숙주 세포의 일 구현예에서, 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자 및 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자는 돌연변이에 의해 불활성화되었다. 일부 구현예에서, 돌연변이는 상기 제1 및 제2 염색체 유전자, 또는 이의 단편의 결실이다.

본 발명의 방법 또는 박테리아 숙주 세포의 일 구현예에서, 제3 알라닌 라세마제를 코딩하는 폴리뉴클레오티드는 박테리아 숙주 세포에 이종성이다.

본 발명의 방법 또는 박테리아 숙주 세포의 일 구현예에서, 제3 알라닌 라세마제를 코딩하는 폴리뉴클레오티드에 작동적으로 연결된 프로모터는 비. 서브틸리스 alrA 유전자의 프로모터, 또는 상기 프로모터와 적어도 80%, 85%, 90%, 93%, 95%, 98% 또는 99% 서열 동일성을 갖는 이의 변이체이다. 바람직하게, 비. 서브틸리스 alrA 유전자의 프로모터는 SEQ ID NO: 46으로 표시된 바와 같은 서열을 포함한다.

본 발명의 방법 또는 박테리아 숙주 세포의 일 구현예에서, 관심 폴리펩티드는 효소이다. 예를 들어, 효소는 아밀라제, 프로테아제, 리파제, 만나나제, 파이타제, 자일라나제, 포스파타제, 글루코아밀라제, 뉴클레아제, 및 셀룰라제로 이루어진 군으로부터 선택되는 효소일 수 있다.

본 발명의 방법 또는 박테리아 숙주 세포의 일 구현예에서, 효소는 프로테아제, 예컨대 아미노펩티다제 (EC 3.4.11), 디펩티다제 (EC 3.4.13), 디펩티딜-펩티다제 또는 트리펩티딜-펩티다제 (EC 3.4.14), 펩티딜-디펩티다제 (EC 3.4.15), 세린-유형 카르복시펩티다제 (EC 3.4.16), 메탈로카르복시펩티다제 (EC 3.4.17), 시스테인-유형 카르복시펩티다제 (EC 3.4.18), 오메가 펩티다제 (EC 3.4.19), 세린 엔도펩티다제 (EC 3.4.21), 시스테인 엔도펩티다제 (EC 3.4.22), 아스파르트산 엔도펩티다제 (EC 3.4.23), 메탈로-엔도펩티다제 (EC 3.4.24), 또는 트레오닌 엔도펩티다제 (EC 3.4.25)이다.

본 발명은 또한 본 발명의 박테리아 숙주 세포를 포함하는 발효 액체배지에 관한 것이다.

도 1: 내생성 알라닌 라세마제 유전자 (alr 및 ycnD)의 존재 (+) 또는 부재 (-) 하에 비. 리케니포르미스 (B. licheniformis)에서 실시예 2에 기술된 바와 같은 유가식 발효배양에서 프로테아제 수율의 분석. 프로테아제 수율은 양쪽 내생성 유전자 (BES#158)를 포함하는 비. 리케니포르미스에서의 프로테아제 수율에 대해 정규화되었다. 균주 BES#158의 프로테아제 수율은 100%로 설정되었다.

명세서 및 청구항에서 사용되는 바와 같은, "한" 또는 "일"은 이것이 사용되는 문맥에 따라서, 하나 이상을 의미할 수 있다는 것을 이해해야 한다. 따라서, 예를 들어, "한 세포"에 대한 언급은 적어도 하나의 세포가 이용될 수 있다는 것을 의미할 수 있다.

또한, 본 명세서에서 사용되는 용어 "적어도 하나"는 용어 뒤에 언급된 항목 중 하나 이상이 본 발명에 따라서 사용될 수 있다는 것을 이해할 것이다. 예를 들어, 용어가 적어도 하나의 공급 용액이 사용되어야 한다는 것을 의미하는 경우에 이것은 하나의 공급 용액 또는 하나 초과의 공급 용액, 즉, 2개, 3개, 4개, 5개, 또는 임의의 다른 개수의 공급 용액으로서 이해될 수 있다.

항목에 따라서, 용어는 그 용어가 있다면 참조할 수 있는 상한값에 관하여 당업자가 이해한다는 것을 의미한다.

본 명세서에서 사용되는 용어 "약"은 상기 용어 뒤에 인용되는 임의 숫자와 관련하여 기술적 효과가 달성될 수 있는 간격 정확도가 존재한다는 것을 의미한다. 따라서, 본 명세서에서 언급되는 약은 바람직하게, ±20%, 바람직하게 ±15%, 보다 바람직하게 ±10%, 및 보다 더 바람직하게 ±5%의 정확한 수치값 또는 상기 정확한 수치값 근처 범위를 의미한다.

본 명세서에서 사용되는 용어 "포함하는"은 제한적인 의미로 이해해서는 안된다. 그 보다 이 용어는 언급된 실제 항목 이상이 존재할 수 있다는 것을 의미하고, 예를 들어, 일정 단계를 포함하는 방법을 언급하는 경우에, 추가 단계의 존재를 배제해서는 않된다. 그러나, 용어 "포함하는"은 또한 언급된 항목만이 존재하는 구현예를 포함하고, 다시 말해서, "∼이루어지는"의 의미에서 제한적인 의미를 갖는다.

상기 기재된 바와 같이, 본 발명은 박테리아 숙주 세포에서 적어도 하나의 관심 폴리펩티드를 제조하기 위한 방법이 제공된다. 방법은 실험실 및 산업적 규모의 발효 과정으로 박테리아 숙주 세포의 배양에 적용될 수 있다. 방법은 a) 상기 정의된 바와 같은 박테리아 숙주 세포를 제공하는 단계, 및 b) 박테리아 숙주 세포에서 상기 플라스미드를 유지하는데 도움이 되고 상기 적어도 하나의 관심 폴리펩티드를 발현하는데 도움이 되는 조건 하에서 박테리아 숙주 세포를 배양하여서, 상기 적어도 하나의 관심 폴리펩티드를 생산하는 단계를 포함한다.

본 발명에 따른 방법은 또한 추가 단계를 포함할 수 있다. 이러한 추가 단계는 배양의 종결 및/또는 적절한 정제 기술에 의해 숙주 세포 배양물로부터 관심 단백질의 수득을 포괄할 수 있다. 따라서, 본 발명의 방법은 단계 (b) 이후에 수득된 박테리아 숙주 세포 배양물로부터 관심 폴리펩티드를 수득하는 단계를 더 포함할 수 있다. 또한, 방법은 관심 폴리펩티드를 정제하는 단계를 포함할 수 있다.

본 명세서에서 사용되는 용어 "알라닌 라세마제"는 아미노산 알라닌의 L-이성질체를 이의 D-이성질체로 전환시키는 효소를 의미한다. 따라서, 알라닌 라세마제는 L-알라닌을 D-알라닌으로 전환시킨다. 알라닌 라세마제는 국제 생화학 및 분자 생물학 연맹 (International Union of Biochemistry and Molecular Biology)의 명명법에 따라서 EC 5.1.1.1로서 기술된 활성을 가져야 한다 (참조: Recommendations (1992) of the Nomenclature Committee of the International Union of Biochemistry and Molecular Biology including its supplements published 1993-1999)). 폴리펩티드가 알라닌 라세마제 활성을 갖는지 여부는 충분히 공지된 알라닌 라세마제 어세이를 통해서 평가될 수 있다. 일 구현예에서, 실시예 부분에 기술된 대로 평가된다 (실시예 3 참조).

본 발명에 따라서, 2종의 (상이한) 알라닌 라세마제 (본 명세서에서 "제1 알라닌 라세마제" 및 "제2 알라닌 라세마제"라고 함)를 코딩하는 2개 염색체 유전자 (본 명세서에서 "제1 염색체 유전자" 및 "제2 염색체 유전자"라고 함)는 박테리아 숙주 세포에서 불활성화되어야 한다. 따라서, 본 발명의 방법은 바람직하게, 2종의 (상이한) 알라닌 라세마제를 코딩하는 2개 염색체 유전자를 천연적으로 포함하는 숙주 세포로부터 유래되는 것이 요구된다. 따라서, 상기 2개 염색체 유전자는 숙주 세포에서 불활성화되어야 한다.

따라서, 본 발명의 방법의 단계 a)에서 제공되는 박테리아 숙주 세포는 하기 단계에 의해서 수득되거나 또는 수득가능하다:

a1) 박테리아 숙주 세포를 제공하는 단계로서, 상기 숙주 세포는 i) 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자, 및 ii) 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자를 포함하는 것인 단계,

a3) 상기 박테리아 숙주 세포로,

1. 적어도 하나의 자율 복제 서열,

를 포함하는 플라스미드를 도입시키는 단계.

따라서, 본 발명의 방법의 단계 a)는 상기 단계 a1), a2) 및 a3)을 포함할 수 있다.

숙주 세포

본 발명에 따른 용어 "숙주 세포"는 박테리아 세포를 의미한다. 일 구현예에서, 박테리아 숙주 세포는 그람-양성 박테리아이다. 대안적인 구현예에서, 숙주 세포는 그람-음성 박테리아이다.

상기 기재된 바와 같이, 단계 a1)에서 제공되는 숙주 세포는 바람직하게, 알라닌 라세마제를 코딩하는 2개 염색체 유전자를 포함한다. 따라서, 단계 a1)에서 제공되는 박테리아 숙주 세포는 알라닌 라세마제를 코딩하는 2개 미만의 염색체 유전자를 포함하는 박테리아 숙주 세포 (예컨대, 알라닌 라세마제를 코딩하는 오직 하나의 염색체 유전자를 천연적으로 포함하는 숙주 세포, 또는 이러한 유전자가 결여된 숙주 세포)가 아닌 것을 고려한다. 또한, 단계 a1)에서 제공되는 박테리아 숙주 세포는 알라닌 라세마제를 코딩하는 2개 초과의 염색체 유전자 (예컨대, 3개 또는 4개 염색체 유전자)를 포함하는 박테리아 숙주 세포가 아닌 것을 고려한다.

특정 박테리아 숙주 세포가 2종의 (상이한) 알라닌 라세마제를 코딩하는 2종의 (상이한) 염색체 유전자를 포함하는지 여부는 충분히 공지된 방법을 통해서 평가될 수 있다. 예를 들어, 이것은 실시예 부분의 실시예 4에 기술된 바와 같이 인 실리코에서 평가될 수 있다. 실시예 4의 표 3은 2종의 (상이한) 알라닌 라세마제를 포함하는 박테리아 종에 대한 개요를 제공한다. 바람직하게, 숙주 세포는 표 3의 "속" 컬럼에 열거된 바와 같은 속에 속한다. 보다 바람직하게, 숙주 세포는 표 3의 "종" 컬럼에 열거된 종에 속한다. 보다 더 바람직하게, 숙주 세포는 표 4에 열거된 바와 같은 종에 속한다.

바람직한 구현예에서, 박테리아 숙주 세포는 피르미큐테스 (Firmicutes)의 문에 속한다. 피르미큐테스의 문에 속하는 숙주 세포는 바람직하게, 바실리 (Bacilli)의 강, 보다 바람직하게, 락토바실랄레스 (Lactobacillales)의 목, 또는 바실랄레스 (Bacillales)의 목, 보다 더 바람직하게, 바실라세아에 (Bacillaceae)의 과 또는 락토바실라세아에 (Lactobacillaceae)의 과, 및 가장 바람직하게, 바실러스 (Bacillus) 또는 락토바실러스 (Lactobacillus)의 속에 속한다.

특히 바람직한 구현예에서, 숙주 세포는 바실러스 푸밀루스 (Bacillus pumilus), 바실러스 세레우스 (Bacillus cereus), 바실러스 벨레젠시스 (Bacillus velezensis), 바실러스 메가테리움 (Bacillus megaterium), 바실러스 리케니포르미스 (Bacillus licheniformis), 바실러스 서브틸리스 (Bacillus subtilis), 바실러스 아트로파에우스 (Bacillus atrophaeus), 바실러스 모자벤시스 (Bacillus mojavensis), 바실러스 스노렌시스 (Bacillus sonorensis), 바실러스 시아메넨시스 (Bacillus xiamenensis) 또는 바실러스 장조우엔시스 (Bacillus zhangzhouensis)의 종에 속한다. 예를 들어, 숙주 세포는 바실러스 푸밀루스 (Bacillus pumilus) 바실러스 세레우스 (Bacillus cereus), 바실러스 벨레젠시스 (Bacillus velezensis), 바실러스 메가테리움 (Bacillus megaterium), 바실러스 리케니포르미스 (Bacillus licheniformis), 또는 바실러스 서브틸리스 (Bacillus subtilis)의 종에 속한다.

한 구현예에서, 숙주 세포는 바실러스 리케니포르미스 (Bacillus licheniformis) 종, 예컨대 미국 생물자원 센터 (American Type Culture Collection) 번호 ATCC14580 (DSM13과 동일, 참조: Veith et al. "The complete genome sequence of Bacillus licheniformis DSM13, an organism with great industrial potential." J. Mol. Microbiol. Biotechnol. (2004) 7:204-211)로서 기탁된 바실러스 리케니포르미스 균주의 숙주 세포에 속한다. 대안적으로, 숙주 세포는 바실러스 리케니포르미스 균주 ATCC31972의 숙주 세포일 수 있다. 대안적으로, 숙주 세포는 바실러스 리케니포르미스 균주 ATCC53757의 숙주 세포일 수 있다. 대안적으로, 숙주 세포는 바실러스 리케니포르미스 균주 ATCC53926의 숙주 세포일 수 있다. 대안적으로, 숙주 세포는 바실러스 리케니포르미스 균주 ATCC55768의 숙주 세포일 수 있다. 대안적으로, 숙주 세포는 바실러스 리케니포르미스 균주 DSM394의 숙주 세포일 수 있다. 대안적으로, 숙주 세포는 바실러스 리케니포르미스 균주 DSM641의 숙주 세포일 수 있다. 대안적으로, 숙주 세포는 바실러스 리케니포르미스 균주 DSM1913의 숙주 세포일 수 있다. 대안적으로, 숙주 세포는 바실러스 리케니포르미스 균주 DSM11259의 숙주 세포일 수 있다. 대안적으로, 숙주 세포는 바실러스 리케니포르미스 균주 DSM26543의 숙주 세포일 수 있다.

바람직하게, 바실러스 리케니포르미스 균주는 바실러스 리케니포르미스 ATCC 14580, ATCC 31972, ATCC 53757, ATCC 53926, ATCC 55768, DSM 13, DSM 394, DSM 641, DSM 1913, DSM 11259, 및 DSM 26543로 이루어진 군으로부터 선택된다.

또한, 본 명세서에 기재된 바와 같은 숙주 세포는 인식 서열 GCNGC을 갖는 제한 변형 시스템을 코딩하는 바실러스 리케니포르미스 종에 속한다는 것을 고려한다.

바실러스 리케니포르미스의 내생성 염색체 알라닌 라세마제 유전자는 alr 및 yncD 이다. 숙주 세포가 바실러스 리케니포르미스인 경우에, 따라서, 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자는 alr 유전자이고, 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자는 yncD 유전자이다.

바실러스 리케니포르미스 alr 유전자의 코딩 서열은 SEQ ID NO: 1로 표시된다. 상기 유전자에 의해 코딩되는 알라닌 라세마제 폴리펩티드는 SEQ ID NO: 2에 표시된 아미노산 서열을 갖는다. 바실러스 리케니포르미스 yncD 유전자의 코딩 서열은 SEQ ID NO: 24로 표시된다. 상기 유전자에 의해 코딩되는 알라닌 라세마제 폴리펩티드는 SEQ ID NO: 25로 표시된 아미노산 서열을 갖는다.

실시예 4에 기술된 바와 같이, 박테리아 유기체는 2개 알라닌 라세마제 유전자를 포함하는 것이 동정되었다. 일부 종, 예컨대 바실러스 아트로파에우스 (Bacillus atrophaeus), 바실러스 모자벤시스 (Bacillus mojavensis), 바실러스 푸밀루스 (Bacillus pumilus), 바실러스 소노렌시스 (Bacillus sonorensis), 바실러스 벨레젠시스 (Bacillus velezensis), 바실러스 시아메넨시스 (Bacillus xiamenensis), 바실러스 장조우엔시스 (Bacillus zhangzhouensis) 및 바실러스 서브틸리스 (Bacillus subtilis)는 각각 바실러스 리케니포르미스의 Alr 및 YncD 알라닌 라세마제 폴리펩티드와 높은 정도의 동일성을 보이는 알라닌 라세마제를 함유하였다. 실시예 부분의 표 4는 이들 종에서 YncD 상동체에 대한 개요를 제공한다. 실시예 부분의 표 5는 이들 종의 Alr 상동체에 대한 개요를 제공한다. 따라서, 숙주 세포는 바실러스 아트로파에우스 (Bacillus atrophaeus), 바실러스 모자벤시스 (Bacillus mojavensis), 바실러스 푸밀루스 (Bacillus pumilus), 바실러스 소노렌시스 (Bacillus sonorensis), 바실러스 벨레젠시스 (acillus velezensis), 바실러스 시아메넨시스 (Bacillus xiamenensis), 또는 바실러스 장조우엔시스 (Bacillus zhangzhouensis) 숙주 세포인 것을 고려하고, 불활성화시키려는 제1 염색체 유전자는 표 5에 표시된 바와 같은 SEQ ID NO를 갖는 알라닌 라세마제를 코딩하고, (불활성화시키려는) 제2 염색체 유전자는 (각 숙주 세포에 대해서) 표 4에 표시된 바와 같은 SEQ ID NO를 갖는 알라닌 라세마제를 코딩한다.

예를 들어, 숙주 세포는 바실러스 푸밀루스 (Bacillus pumilus) 숙주 세포일 수 있다 (참조: 예를 들어, Kuppers et al., Microb Cell Fact. 2014;13(1):46, 또는 Schallmey et al., Can J Microbiol. 2004;50(1):1-17). 바실러스 푸밀루스와 관련하여, 불활성화시키려는 제1 알라닌 라세마제는 바람직하게, SEQ ID NO: 47에 표시된 바와 같은 아미노산 서열을 갖고, 불활성화시키려는 제2 알라닌 라세마제는 바람직하게, SEQ ID NO: 54에 표시된 바와 같은 아미노산 서열을 갖는다.

제1 및 제2 염색체 유전자와 관련하여 용어 "불활성화"는 바람직하게, 각각 상기 제1 및 제2 염색체 유전자에 의해 코딩되는 제1 및 제2 알라닌 라세마제의 효소 활성이 대조군 세포에서의 효소 활성화 비교하여 감소되었다는 것을 의미한다. 대조군 세포는 제1 및 제2 염색체 유전자가 불활성화되지 않은 상응하는 숙주 세포, 즉 상기 제1 및 제2 염색체 유전자를 포함하는 상응하는 숙주 세포이다. 바람직하게, 본 발명의 박테리아 숙주 세포에서 제1 및 제2 알라닌 라세마제의 효소 활성이 대조군 세포에서의 상응하는 효소 활성과 비교하여 적어도 40% 예컨대 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 또는 적어도 90%까지 감소되었다. 보다 바람직하게, 상기 효소 활성은 적어도 95% 까지 감소되었다. 가장 바람직하게, 상기 효소 활성은 100% 까지 감소되었고, 다시 말해서, 완전하게 제거되었다.

본 명세서에서 언급되는 유전자의 불활성화는 적절하다고 간주되는 임의의 방법을 통해서 달성될 수 있다. 일 구현예에서, 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자 및 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자는 돌연변이에 의해서, 즉 제1 및 제2 염색체 유전자를 돌연변이시켜서 불활성화되었다. 바람직하게, 상기 돌연변이는 결실이고, 즉 상기 제1 및 제2 염색체 유전자가 결실되었다.

본 명세서에서 사용되는 유전자의 "결실"은 전체 코딩 서열의 결실, 코딩 서열의 일부의 결실, 또는 측접한 영역을 포함하는 코딩 서열의 결실을 의미한다. 최종 결과는 결실된 유전자가 효과적으로 비-기능성인 것이다. 단순 용어로, "결실"은 하나 이상의 뉴클레오티드 또는 아미노산 잔기가 각각이 제거 (즉, 부재)된 뉴클레오티드 또는 아미노산 서열의 변화로서 정의된다. 따라서, 결실 균주는 각각의 야생형 유기체에 비해서 더 적은 뉴클레오티드 또는 아미노산을 갖는다.

다른 구현예에서, 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자 및 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자는 유전자 침묵화에 의해 불활성화되었다. 유전자 침묵화는 상기 박테리아 숙주 세포 안티센스 발현 구성체에 도입되어서 각각 제1 및 제2 염색체 유전자의 mRNA에 상보성인 안티센스 RNA를 생성시키고, 그리하여 상기 유전자의 발현을 억제하여 달성될 수 있다. 대안적으로, 상기 유전자의 발현은 CRISPR-억제의 기전을 통해서 전사 개시 또는 전사 연장을 차단하여서 억제될 수 있다 (WO18009520).

박테리아 숙주 세포는 전형적으로 제1 및 제2 알라닌 라세마제 유전자에 유전자 결실을 포함하는 야생형 세포이다. 산업적 발효 과정의 경우, 박테리아 숙주 세포는 최고 생산물 순도 및 규제 요건의 필요성을 충족하도록 유전자 변형될 수 있다. 그러므로, 관심 폴리펩티드의 생산, 회수 또는 적용에 유해할 수 있는 다른 유전자의 결실 또는 파괴를 추가로 함유할 수 있는 바실러스 생산 숙주를 사용하는 것도 본 발명의 범주이다. 한 구현예에서, 박테리아 숙주 세포는 프로테아제-결핍 세포이다. 박테리아 숙주 세포, 예를 들어, 바실러스 세포는 바람직하게 aprE, mpr, vpr, bpr, 및/또는 epr 을 포함하지만, 이에 제한되지 않는 세포외 프로테아제 유전자의 파괴 또는 결실을 포함한다. 더욱 바람직하게, 박테리아 숙주 세포는 포자를 생산하지 않는다. 더욱 바람직하게, 박테리아 숙주 세포, 예를 들어, 바실러스 세포는 spoIIAC, sigE, 및/또는 sigG 의 파괴 또는 결실을 포함한다. 또한, 바람직하게, 박테리아 숙주 세포, 예를 들어, 바실러스 세포는 서팩틴, 예를 들어, srfA, srfB, srfC, 및/또는 srfD 의 생합성에 관여되는 유전자 중 하나의 파괴 또는 결실을 포함하고, 예를 들어, 미국 특허 제5,958,728호를 참조한다. 박테리아 숙주 세포는 폴리글루탐산의 생합성에 관여하는 유전자 중 하나의 파괴 또는 결실을 포함하는 것이 또한 바람직하다. 관심 폴리펩티드의 생산, 회수 또는 적용에 유해한, amyE 유전자를 포함하지만, 이에 제한되지 않는 다른 유전자가 또한 파괴될 수 있거나 또는 결실될 수 있다.

플라스미드

본 명세서에서 언급되는 박테리아 숙주 세포는 플라스미드를 포함할 것이다. 상기 플라스미드는 i) 적어도 하나의 자율 복제 서열, ii) 프로모터에 작동적으로 연결된, 적어도 하나의 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및 iii) 프로모터에 작동적으로 연결된, 제3 알라닌 라세마제를 코딩하는 폴리뉴클레오티드를 포함할 것이다.

본 명세서에서 사용되는, 용어 "벡터"는 염색체외 원형 DNA를 의미한다. 벡터는 숙주 세포에서 자율적으로 복제할 수 있거나, 또는 그렇지 않을 수 있다. 용어 "플라스미드"는 염색체외 원형 DNA, 즉, 숙주 세포에서 자율적으로 복제하는 벡터를 의미한다. 따라서, 플라스미드는 염색체외 벡터로서 이해한다 (그리고, 박테리아 염색체에 안정하게 통합되지 않음).

본 발명에 따라서, 플라스미드의 복제는 박테리아 숙주 세포의 염색체의 복제에 독립적일 것이다. 자율 복제를 위해서, 플라스미드는 자율 복제 서열, 즉 플라스미드가 박테리아 숙주 세포에서 자율적으로 복제할 수 있는 복제 기원을 포함한다. 박테리아 복제 기원의 예는 바실러스에서 복제를 허용하는 플라스미드 pUB110, pBC16, pE194, pC194, pTB19, pAMß1, pTA1060, 및 이. 콜라이에서 복제를 허용하는 플라스미드 pBR322, colE1, pUC19, pSC101, pACYC177, 및 pACYC184의 복제 기원이다 (참조: 예를 들어, Sambrook,J. and Russell,D.W. Molecular cloning. A laboratory manual, 3rd ed, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY. 2001.). 플라스미드의 카피수는 정상적인 성장 조건 하에서 염색체 당 또는 박테리아 세포 당 플라스미드의 평균수로서 정의된다. 게다가, 박테리아 숙주에서 상이한 카피수를 생성시키는 상이한 유형의 복제 기원이 존재한다. 플라스미드 레플리콘 pBS72 (등록 번호 AY102630.1) 및 플라스미드 pTB19 및 유도체 pTB51, pTB52는 바실러스 세포 내에서, 각각 6 카피 및 1 내지 8 카피의 낮은 카피수를 부여하는데 반해서, 플라스미드 pE194 (등록 번호 V01278.1) 및 pUB110 (등록 번호 M19465.1)/pBC16 (등록 번호 U32369.1)은 각각 세포 당 14-20의 저-중간 카피수 및 30-50 카피의 중간 카피수를 부여한다. 플라스미드 pE194는 보다 상세히 분석되었고 (Villafane, et al (1987): J.Bacteriol. 169(10), 4822-4829), 몇몇 pE194 - cop 돌연변이체는 85 카피 내지 202 카피 범위로 바실러스 내에서 높은 카피수를 갖는 것으로 기술되었다. 게다가, 플라스미드 pE194는 온도 민감성으로서, 37℃ 까지 안정한 카피수를 가지지만, 43℃ 이상에서는 복제가 없어진다. 또한, cop-repF 영역 (nt 1235 내지 nt 1431) 내에 2개 점 돌연변이를 갖는 pE194ts로서 언급되는 pE194 변이체가 존재하는데, 보다 급격한 온도 민감성으로서, 32℃ 까지 안정한 카피수이지만, 37℃에서는 세포 당 오직 1 내지 2 카피수를 초래한다.

일부 구현예에서, 플라스미드가 포함하는 자율 복제 서열은 박테리아 숙주 세포에서 낮은 카피수, 예컨대 박테리아 숙주 세포에서 1 내지 8 카피의 플라스미드를 부여한다.

일부 구현예에서, 자율 복제 서열은 박테리아 세포에서 저-중간 카피수, 예컨대 박테리아 숙주 세포에서 9 내지 20 카피의 플라스미드를 부여한다.

일부 구현예에서, 자율 복제 서열은 박테리아 세포에서 중간 카피수, 예컨대 박테리아 숙주 세포에서 21 내지 60 카피의 플라스미드를 부여한다.

일부 구현예에서, 자율 복제 서열은 박테리아 세포에서 고카피수, 예컨대 박테리아 숙주 세포에서 61 이상의 카피의 플라스미드를 부여한다.

바람직한 구현예에서, 플라스미드는 자율 복제 서열로서 레플리콘 pBS72 (등록 번호 AY102630.1)를 포함한다. 다른 바람직한 구현예에서, 플라스미드는 자율 복제 서열로서 pUB110 (등록 번호 M19465.1)/pBC16 (등록 번호 U32369.1)의 복제 기원을 포함한다.

플라스미드는 세포로 플라스미드를 전달하는데 적합한 임의 방법에 의해서, 예를 들어, 전기천공을 사용한 형질전환, 원형질체 형질전환 또는 접합에 의해서 숙주 세포로 도입될 수 있다.

관심 폴리펩티드

적어도 하나의 자율 복제 서열 이외에도, 본 명세서에서 언급되는 플라스미드는 (프로모터에 작동적으로 연결된) 관심 폴리펩티드를 코딩하는 적어도 하나의 폴리뉴클레오티드를 포함하게 된다.

용어 "폴리뉴클레오티드", "핵산 서열", "뉴클레오티드 서열", "핵산", "핵산 분자"는 본 명세서에서 상호교환적으로 사용되고, 임의 길이의 중합체 비분지 형태인, 뉴클레오티드, 전형적으로 데옥시리보뉴클레오티드를 의미한다. 용어 "폴리펩티드" 및 "단백질"은 본 명세서에서 상호교환적으로 사용되고, 펩티드 결합에 의해서 함께 연결된, 임의 길이의 중합체 형태의 아미노산을 의미한다.

용어 "∼를 코딩하는" 및 "∼를 코딩"은 본 명세서에서 상호교환적으로 사용된다. 전형적으로, 이 용어는 다른 거대분자 예컨대 아미노산의 정의된 서열의 합성을 위한 주형으로서 제공되는, 폴리뉴클레오티드, 예컨대 유전자, cDNA, 또는 mRNA의 뉴클레오티드의 특정 서열의 성질을 의미한다. 따라서, 유전자는 그 유전자에 상응하는 mRNA의 전사 및 번역이 세포 또는 다른 생물학적 시스템에서 단백질을 생산한다면, 단백질을 코딩한다.

본 명세서에서 사용되는 용어 "관심 폴리펩티드"는 박테리아 숙주 세포에서 생산되도록 의도된 임의의 단백질, 펩티드 또는 이의 단편을 의미한다. 따라서, 단백질은 폴리펩티드, 펩티드, 이의 단편을 비롯하여 융합 단백질 등을 포괄한다.

바람직하게, 관심 폴리펩티드는 효소이다. 특정 구현예에서, 효소는 옥시도리덕타제 (EC 1), 트랜스퍼라제 (EC 2), 히드롤라제 (EC 3), 리아제 (EC 4), 이소머라제 (EC 5), 또는 리가제 (EC 6)로서 분류된다. 바람직한 구현예에서, 관심 단백질은 세제에서 사용하기에 적합한 효소이다.

가장 바람직하게, 효소는 히드롤라제 (EC 3), 바람직하게, 글리코시다제 (EC 3.2) 또는 펩티다제 (EC 3.4)이다. 특히 바람직한 효소는 아밀라제 (특히, 알파-아밀라제 (EC 3.2.1.1)), 셀룰라제 (EC 3.2.1.4), 락타제 (EC 3.2.1.108), 만나나제 (EC 3.2.1.25), 리파제 (EC 3.1.1.3), 파이타제 (EC 3.1.3.8), 뉴클레아제 (EC 3.1.11 내지 EC 3.1.31), 및 프로테아제 (EC 3.4)로 이루어진 군으로부터 선택되는 효소이고; 특히, 아밀라제, 프로테아제, 리파제, 만나나제, 파이타제, 자일라나제, 포스파타제, 글루코아밀라제, 뉴클레아제, 및 셀룰라제로 이루어진 군으로부터 선택되는 효소, 바람직하게, 아밀라제 또는 프로테아제, 바람직하게, 프로테아제이다. 가장 바람직한 것은 세린 프로테아제 (EC 3.4.21), 바람직하게 서브틸리신 프로테아제이다.

특히, 하기 관심 단백질이 바람직하다:

단백질 가수분해 활성을 갖는 효소는 "프로테아제" 또는 "펩티다제"라고 한다. 프로테아제는 "프로테아제 활성" 또는 "단백질 가수분해 활성"을 발휘하는 활성 단백질이다. 프로테아제는 EC 3.4 부류의 구성원이다. 프로테아제는 아미노펩티다제 (EC 3.4.11), 디펩티다제 (EC 3.4.13), 디펩티딜-펩티다제 및 트리펩티딜-펩티다제 (EC 3.4.14), 펩티딜-디펩티다제 (EC 3.4.15), 세린-유형 카르복시펩티다제 (EC 3.4.16), 메탈로카르복시펩티다제 (EC 3.4.17), 시스테인-유형 카르복시펩티다제 (EC 3.4.18), 오메가 펩티다제 (EC 3.4.19), 세린 엔도펩티다제 (EC 3.4.21), 시스테인 엔도펩티다제 (EC 3.4.22), 아스파르트산 엔도펩티다제 (EC 3.4.23), 메탈로-엔도펩티다제 (EC 3.4.24), 트레오닌 엔도펩티다제 (EC 3.4.25), 미지 촉매 기전의 엔도-펩티다제 (EC 3.4.99)를 포함한다. 상업적으로 입수가능한 프로테아제 효소는 Lavergy™ Pro (BASF); Alcalase®, Blaze®, Duralase™, Durazym™, Relase®, Relase® Ultra, Savinase®, Savinase® Ultra, Primase®, Polarzyme®, Kannase®, Liquanase®, Liquanase® Ultra, Ovozyme®, Coro-nase®, Coronase® Ultra, Neutrase®, Everlase® 및 Esperase® (Novozymes A/S), 상표명 Maxatase®, Maxacal®, Maxapem®, Purafect®, Purafect® Prime, Pura-fect MA®, Purafect Ox®, Purafect OxP®, Puramax®, Properase®, FN2®, FN3®, FN4®, Ex-cellase®, Eraser®, Ultimase®, Opticlean®, Effectenz®, Preferenz® 및 Optimase® (Dan-isco/DuPont)로 판매되는 것들, Axapem™ (Gist-Brocases N.V.), 바실러스 렌투스 (Bacillus lentus) 알칼리 프로테아제, 및 Kao의 KAP (바실러스 알칼로필루스 (Bacillus alkalophilus) 서브틸리신)를 포함하지만, 이에 제한되지 않는다. 적어도 하나의 프로테아제는 세린 프로테아제 (EC 3.4.21)로부터 선택될 수 있다. 세린 프로테아제 또는 세린 펩티다제 (EC 3.4.21)는 촉매 반응 동안 기질과 공유 부가물을 형성하는, 촉매적 활성 부위에 세린을 갖는 것을 특징으로 한다. 세린 프로테아제는 키모트립신 (예, EC 3.4.21.1), 엘라스타제 (예, EC 3.4.21.36), 엘라스타제 (예, EC 3.4.21.37 또는 EC 3.4.21.71), 그랜자임 (예, EC 3.4.21.78 또는 EC 3.4.21.79), 칼리크레인 (예, EC 3.4.21.34, EC 3.4.21.35, EC 3.4.21.118, 또는 EC 3.4.21.119,) 플라스민 (예, EC 3.4.21.7), 트립신 (예, EC 3.4.21.4), 트롬빈 (예, EC 3.4.21.5,) 및 서브틸리신 (서브틸로펩티다제, 예를 들어, EC 3.4.21.62로도 공지됨)으로 이루어진 군으로부터 선택될 수 있고, 후자는 이후에 또한 "서브틸리신"이라고 한다. 본 발명에 따른 프로테아제는 단백질 가수분해 활성을 갖는다. 단백질 가수분해 활성을 결정하기 위한 방법은 문헌에 충분히 공지되어 있다 (참조: 예를 들어, Gupta et al. (2002), Appl. Microbiol. Bio-technol. 60: 381-395).

일 구현예에서, 적어도 하나의 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드는 박테리아 숙주 세포에 이종성이다. 명세서 전반에서 사용되는 용어 "이종성" (또는 외생성 또는 외래 또는 재조합 또는 비-천연) 폴리펩티드 또는 단백질은 숙주 세포에 천연이 아닌 폴리펩티드 또는 단백질로서 본 명세서에서 정의된다. 유사하게, 용어 "이종성" (또는 외생성 또는 외래 또는 재조합 또는 비-천연) 폴리뉴클레오티드는 숙주 세포에 천연이 아닌 폴리뉴클레오티드를 의미한다.

다른 구현예에서, 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드는 박테리아 숙주 세포에 천연이다. 따라서, 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드는 숙주 세포에 천연일 수 있다. 명세서 전반에서 사용되는 용어 "천연" (또는 야생형 또는 내생성) 폴리뉴클레오티드 또는 폴리펩티드는 숙주 세포에서 천연적으로 발견되는 대상 폴리뉴클레오티드 또는 폴리펩티드를 의미한다. 그러나, 폴리뉴클레오티드는 플라스미드 상에서 숙주 세포로 도입되었으므로, "천연" 폴리뉴클레오티드 또는 폴리펩티드는 여전히 재조합으로서 간주된다.

제3 알라닌 라세마제

적어도 하나의 자율 복제 서열 및 관심 폴리펩티드를 코딩하는 적어도 하나의 폴리뉴클레오티드 이외에도, 본 명세서에서 언급되는 플라스미드는 제3 알라닌 라세마제를 코딩하는 폴리뉴클레오티드를 포함하게 된다. 상기 폴리뉴클레오티드는 적합한 프로모터, 예컨대 항상성 프로모터에 작동적으로 연결될 것이다.

용어 "알라닌 라세마제"는 상기에 정의되었다. 일 구현예에서, 제3 알라닌 라세마제는 박테리아 숙주 세포에 대해 이종성이다. 따라서, 제3 알라닌 라세마제의 아미노산 서열은 제1 및 제2 알라닌 라세마제의 서열과 상이하다. 예를 들어, 제3 알라닌 라세마제는 제1 및 제2 알라닌 라세마제와 90% 미만의 서열 동일성을 나타낸다.

또한, 제3 알라닌 라세마제는 박테리아 숙주 세포에서 천연적으로 발생하고, 따라서, 박테리아 숙주 세포에 대해서 천연 (즉, 내생성)인 라세마제일 수 있다. 이러한 구현예에서, 제3 알라닌 라세마제는 제1 알라닌 라세마제 또는 제2 알라닌 라세마제와 동일한 아미노산 서열을 가질 수 있다.

일부 구현예에서, 제3 알라닌 라세마제는 박테리아 알라닌 라세마제이다. 적합한 박테리아 알라닌 라세마제는 예를 들어, 실시예 4에 기술된 인 실리코 분석을 수행하여 확인할 수 있다. 따라서, COG0787에 대해 유의한 정렬을 확인할 수 있다 (보다 상세한 설명은 실시예를 참조함).

제3 알라닌 라세마제는 알라닌 라세마제 활성을 갖는 한 임의의 알라닌 라세마제일 수 있다. 바람직한 구현예에서, 제3 알라닌 라세마제는 박테리아 알라닌 라세마제, 예컨대 표 3에 표시된 바와 같은 종 또는 속으로부터 유래된 박테리아 라세마제이다. 바람직한 아미노산 서열은 표 4 및 표 5에 표시되어 있다.

일 구현예에서, 제3 알라닌 라세마제는 SEQ ID NO: 4, 2, 47, 48, 49, 50, 51, 52 또는 53으로 표시된 바와 같은 아미노산 서열을 포함하거나, 또는 이의 변이체이다. 특히, 제3 알라닌 라세마제는 SEQ ID NO: 4로 표시된 바와 같은 아미노산 서열을 포함하거나, 또는 이의 변이체이다. 대안적으로, 제3 알라닌 라세마제는 SEQ ID NO: 2로 표시된 바와 같은 아미노산 서열을 포함하거나, 또는 이의 변이체이다.

SEQ ID NO: 4, 2, 47, 48, 49, 50, 51, 52 또는 53으로 표시된 바와 같은 아미노산 서열을 갖는 알라닌 라세마제는 또한 본 명세서에서 "부모 효소" 또는 "부모 서열이라고 한다. "부모" 서열 (예, "부모 효소" 또는 "부모 단백질")은 부모 서열의 "변이체"를 생성시키는 서열의 변화의 도입 (예를 들어, 하나 이상의 아미노산 치환의 도입에 의함)을 위한 출발 서열이다. 따라서, 용어 "효소 변이체" 또는 "서열 변이체" 또는 "단백질 변이체"는 개별 변이체 효소에 대한 기원인 부모 효소와 관련하여 사용된다. 그러므로, 부모 효소는 추가 변이체의 개발에 사용되는 야생형 효소 및 야생형 효소의 변이체를 포함한다. 변이체 효소는 일정 정도까지 그들 아미노산 서열이 부모 효소와 상이하지만, 변이체는 적어도 개별 부모 효소의 효소 성질을 유지한다. 한 구현예에서, 효소 성질은 개별 부모 효소와 비교했을 때 변이체 효소에서 개선된다. 한 구현예에서, 변이체 효소는 개별 부모 효소와 비교했을 때 적어도 동일한 효소 활성을 갖거나 또는 변이체 효소는 개별 부모 효소와 비교했을 때 증가된 효소 활성을 갖는다.

부모 효소 분자의 변이체 (예를 들어, SEQ ID NO: 4, 2, 47, 48, 49, 50, 51, 52 또는 53으로 표시된 바와 같은 아미노산 서열을 갖는 제3 알라닌 라세마제)는 효소 활성을 갖는 개별 부모 효소의 아미노산 서열과 적어도 n 퍼센트 동일한 아미노산 서열을 가질 수 있고, 전체 길이 폴리펩티드 서열과 비교하여 n은 50 내지 100의 정수, 바람직하게 50, 55, 60, 65, 70, 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99이다. 부모 효소와 비교했을 때 n 퍼센트 동일한 본 명세서에 기술된 변이체 효소는 효소 활성을 갖는다.

일부 구현예에서, 제3 알라닌 라세마제의 변이체는 SEQ ID NO: 4, 2, 47, 48, 49, 50, 51, 52 또는 53 (바람직하게 SEQ ID NO: 4)으로 표시된 바와 같은 아미노산 서열과 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95% 또는 적어도 98% 동일한 아미노산 서열을 포함한다.

따라서, 효소 변이체는 부모 효소와 비교했을 때 그들 서열 동일성에 의해 정의될 수 있다. 서열 동일성은 일반적으로 "% 서열 동일성" 또는 "% 동일성"으로 제공된다. 제1 단계에서 2개 아미노산 서열 간 퍼센트-동일성을 결정하기 위해서, 쌍별 서열 정렬은 2개 서열 간에 생성시키고, 2개 서열은 그들 전체 길이 상에서 정렬된다 (즉, 쌍별 전체 정렬). 정렬은 Needleman 및 Wunsch 알고리즘 (J. Mol. Biol. (1979) 48, p. 443-453)을 구현하는 프로그램으로, 바람직하게 프로그램 디폴트 매개변수 (갭개방=10.0, 갭확장=0.5 및 매트릭스=EBLOSUM62)를 사용해 프로그램 "NEEDLE" (The European Molecular Biology Open Software Suite (EMBOSS))을 사용하여 생성된다. 본 발명의 목적을 위해 바람직한 정렬은 최고 서열 동일성을 결정할 수 있는 정렬이다.

2개 서열을 정렬한 이후에, 제2 단계에서, 동일성 값은 정렬로부터 결정될 것이다. 그러므로, 본 발명에 따라서 퍼센트-동일성의 하기 계산이 적용된다:

%-동일성 = (동일한 잔기 / 이의 전체 길이 상에서 본 발명의 개별 서열을 보여주는 정렬 영역의 길이) *100. 따라서, 이러한 구현예에 따라서 2개 아미노산 서열의 비교에 대한 서열 동일성은 이의 전체 길이 상에서 본 발명의 개별 서열을 보여주는 정렬 영역의 길이로 동일한 잔기의 개수를 나누어서 계산된다. 이러한 값은 100을 곱해서 "%-동일성"을 제공한다.

2개 DNA 서열의 퍼센트 동일성을 계산하기 위해서, 일부 사양을 갖는 2개 아미노산 서열의 퍼센트 동일성의 계산에 동일하게 적용된다. 단백질을 코딩하는 DNA 서열 경우에, 쌍별 정렬은 인트론을 제외한 출발부터 중지 코돈까지 코딩 영역의 전체 길이 상에서 이루어져야 한다. 비-단백질-코딩 DNA 서열 경우에, 본 발명의 서열의 전체 길이 상에서 쌍별 정렬이 이루어져야 하고, 그래서 본 발명의 전체 서열은 다른 서열, 또는 다른 서열외의 영역과 비교된다. 또한, Needleman 및 Wunsch 알고리즘 (J. Mol. Biol. (1979) 48, p. 443-453)을 구현하는 바람직한 정렬 프로그램은 프로그램 디폴트 매개변수 (갭개방=10.0, 갭확장=0.5 및 매트릭스=EDNAFULL)를 사용하는 "NEEDLE" (The European Molecular Biology Open Software Suite (EMBOSS))이다.

효소 변이체는 부모 효소와 비교했을 때 그들 서열 유사성으로 정의될 수 있다. 일반적으로 서열 유사성은 "% 서열 유사성" 또는 "%-유사성"으로 제공된다. 제1 단계에서 서열 유사성을 계산하기 위해서, 서열 정렬은 상기 기술된 바와 같이 생성되어야 한다. 제2 단계에서, 퍼센트-유사성이 계산되어야 하는 한편, 퍼센트 서열 유사성은 아미노산의 정의된 세트가 예를 들어, 그들 크기, 그들 소수성, 그들 전하, 또는 다른 특징에 의해서 유사한 성질을 공유한다는 것을 고려한다. 본 명세서에서, 유사한 아미노산으로 한 아미노산의 교환을 "보존성 돌연변이"라고 한다. 보존성 돌연변이를 포함하는 효소 변이체는 부모 효소의 효소 성질과 비교했을 때 일정 효소 성질이 실질적으로 유지되게 단백질 폴딩에 최소 효과를 갖는 것으로 보인다.

본 발명에 따른 %-유사성을 결정하기 위해서, 또한 데이터베이스 검색 및 서열 정렬을 위해 가장 많이 사용되는 아미노산 유사성 매트릭스 중 하나인, BLOSUM62 매트릭스에 따라서, 하기가 적용된다.

아미노산 A는 아미노산 S와 유사하고,

아미노산 D는 아미노산 E; N과 유사하고,

아미노산 E는 아미노산 D; K; Q와 유사하고,

아미노산 F는 아미노산 W; Y와 유사하고,

아미노산 H는 아미노산 N; Y와 유사하고,

아미노산 I는 아미노산 L; M; V와 유사하고,

아미노산 K는 아미노산 E; Q; R과 유사하고,

아미노산 L은 아미노산 I; M; V와 유사하고,

아미노산 M은 아미노산 I; L; V와 유사하고,

아미노산 N은 아미노산 D; H; S와 유사하고,

아미노산 Q는 아미노산 E; K; R과 유사하고,

아미노산 R은 아미노산 K; Q와 유사하고,

아미노산 S는 아미노산 A; N; T와 유사하고,

아미노산 T는 아미노산 S와 유사하고,

아미노산 V는 아미노산 I; L; M과 유사하고,

아미노산 W는 아미노산 F; Y와 유사하고,

아미노산 Y는 아미노산 F; H; W와 유사하다.

보존성 아미노산 치환은 기능성 단백질 예컨대 효소의 폴리펩티드 서열의 서열의 전체 길이 상에서 일어날 수 있다. 한 구현예에서, 이러한 돌연변이는 효소의 기능성 도메인과 관련되지 않는다. 다른 구현예에서, 보존성 돌연변이는 효소의 촉매 중심과 관련되지 않는다.

그러므로, 본 발명에 따라서, 퍼센트-유사성의 하기 계산이 적용된다:

%-유사성 = [ (동일한 잔기 + 유사한 잔기) / 이의 전체 길이 상에서 본 발명의 개별 서열을 나타내는 정렬 영역의 길이] *100. 따라서, 본 명세서에서 2개 아미노산 서열의 비교와 관련한 서열 유사성은 동일한 잔기의 개수 + 유사한 잔기의 개수를 이의 전체 길이 상에서 본 발명의 개별 서열을 나타내는 정렬 영역의 길이로 나누어 계산된다. 이러한 값에 100을 곱해서 "%-유사성"을 제공한다.

특히, 전체 길이 폴리펩티드 서열과 비교하여 m이 50 내지 100의 정수, 바람직하게 50, 55, 60, 65, 70, 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99인, 개별 부모 서열과 적어도 m 퍼센트 유사한 보존성 돌연변이를 포함하는 변이체 효소는 본질적으로 변화되지 않은 효소 성질을 갖는다고 예상된다. 부모 효소와 비교했을 때 m 퍼센트-유사성을 갖는 본 명세서에 기술된 변이체 효소는 효소 활성을 갖는다.

프로모터

관심 폴리펩티드를 코딩하는 폴리뉴클레오티드 및 제3 알라닌 라세마제를 코딩하는 폴리뉴클레오티드는 박테리아 숙주 세포에서 발현될 것이다. 따라서, 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드 및 제3 알라닌 라세마제를 코딩하는 폴리뉴클레오티드 둘 모두는 프로모터에 작동적으로 연결되어야 한다.

본 명세서에서 사용되는 용어 "작동적으로 연결된"은 프로모터 서열이 관심 유전자의 전사를 개시할 수 있도록, 프로모터 서열 및 관심 유전자 간 기능성 연결을 의미한다.

"프로모터" 또는 "프로모터 서열"은 그 유전자의 전사를 가능하게 하는 유전와 동일한 가닥 상의 유전자의 상류에 위치된 뉴클레오티드 서열이다. 프로모터는 유전자의 전사 출발 부위가 후속된다. 프로모터는 RNA 중합효소 (임의의 필요한 전사 인자와 함께)에 의해 인식되어서, 전사가 개시된다. 프로모터의 기능성 단편 또는 기능성 변이체는 RNA 중합효소에 의해 인식가능하고, 전사를 개시할 수 있는, 뉴클레오티드 서열이다.

"활성 프로모터 단편", "활성 프로모터 변이체", "기능성 프로모터 단편" 또는 "기능성 프로모터 변이체"는 여전히 프로모터 활성을 갖는, 프로모터의 뉴클레오티드 서열의 단편 또는 변이체를 기술한다.

프로모터는 항상성 프로모터 또는 다른 세포 조절 인자의 제어 하에 있는 프로모터를 포함한 "유도인자-의존적 프로모터" 또는 "유도인자-독립적 프로모터"일 수 있다.

당업자는 제3 알라닌 라세마제 및 관심 폴리펩티드를 발현하기 위해 적합한 프로모터를 선택할 수 있다. 예를 들어, 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드는 바람직하게, "유도인자-의존적 프로모터" 또는 "유도인자-독립적 프로모터"에 작동적으로 연결된다. 또한, 제3 알라닌 라세마제를 코딩하는 폴리뉴클레오티드는 바람직하게, "유도인자-독립적 프로모터", 예컨대 항상성 프로모터에 작동적으로 연결된다.

"유도인자 의존적 프로모터"는 본 명세서에서 "유도인자 분자"를 발효 배지에 첨가 시 프로모터가 작동적으로 연결된 유전자의 전사가 가능하도록 이의 활성이 증가된 프로모터로서 이해된다. 따라서, 유도인자-의존적 프로모터 경우에, 유도인자 분자의 존재는 신호 전달을 통해서 프로모터에 작동적으로 연결된 유전자의 발현 증가를 촉발시킨다. 유도인자 분자의 존재에 의한 활성화 이전에 유전자 발현은 부재할 필요는 없지만, 또한 유도인자 분자의 첨가 이후에 증가되는 낮은 수준의 기본 유전자 발현으로 존재할 수 있다. "유도인자 분자"는 발효 배지 중 존재가 유전자에 작동적으로 연결된 유도인자-의존적 프로모터의 활성을 증가시켜서 유전자의 발현 증가에 영향을 미칠 수 있는 분자이다. 바람직하게, 유도인자 분자는 탄수화물 또는 이의 유도체이다. 한 구현예에서, 유도인자 분자는 바실러스 세포의 제2 탄소원이다. 탄수화물의 혼합물의 존재 하에서, 세포는 그들에게 최고의 에너지 및 성장 장점을 제공하는 탄소원 (1차 탄소원)을 선택적으로 흡수한다. 동시에, 그들은 덜 바람직한 탄소원 (2차 탄소원)의 흡수 및 이화작용에 관여하는 다양한 기능을 억제한다. 전형적으로, 바실러스에 대한 1차 탄소원은 포도당이고, 다양한 다른 당 및 당 유도체는 2차 탄소원으로서 바실러스가 사용한다. 2차 탄소원은 예를 들어 만노스 또는 락토스를 포함하지만, 이들에 제한되지 않는다.

유도인자 의존적 프로모터의 예는 개별 오페론과 관련하여 하기 표에 제공된다:

이와 대조적으로, 유도인자 분자의 존재에 의존하지 않는 프로모터 (본 명세서에서 '유도인자-독립적 프로모터'라고 함)의 활성은 항상적으로 활성이 있거나 또는 발효 배지에 첨가되는 유도인자 분자의 존재와 무관하게 증가될 수 있다.

항상성 프로모터는 다른 세포 조절 인자에 독립적이고 전사 개시는 시그마 인자 A (sigA)에 의존적이다. sigA-의존적 프로모터는 시그마 인자 A 특이적 인식 부위 '-35'-영역및 '-10'-영역을 포함한다.

바람직하게, '유도인자-독립적 프로모터' 서열은 항상성 프로모터, 제한없이 프로모터 Pveg, PlepA, PserA, PymdA, Pfba 및 상이한 유전자 발현 강도의 이의 유도체 (Guiziou et al, (2016): Nucleic Acids Res. 44(15), 7495-7508), aprE 프로모터, 박테리오파지 SPO1 프로모터 P4, P5, P15 (WO15118126), 바실러스 투린지엔시스 (Bacillus thuringiensis) 유래 cryIIIA 프로모터 (WO9425612), 바실러스 아밀로리케파시엔스 (Bacillus amyloliquefaciens) 유래 amyQ 프로모터, 바실러스 리케니포르미스 (Bacillus licheniformis) 유래 amyL 프로모터 및 프로모터 변이체 (US5698415) 및 이의 조합, 또는 이의 활성 단편 또는 변이체, 바람직하게 aprE 프로모터 서열로 이루어진 군으로부터 선택된다.

바람직한 구현예에서, 유도인자-독립적 프로모터는 aprE 프로모터이다.

"aprE 프로모터" 또는 "aprE 프로모터 서열"은 aprE 유전자의 전사를 가능하게 하는 aprE 유전자와 동일한 가닥 상에, aprE 유전자, 즉, 바실러스 서브틸리신 칼스버그 프로테아제를 코딩하는 유전자의 상류에 위치하는 뉴클레오티드 서열 (또는 이의 일부 또는 변이체)이다.

칼스버그 프로테아제를 코딩하는 유전자로부터의 천연 프로모터는 또한 aprE 프로모터라고도 하며, 당분야에서 충분히 설명되어 있다. aprE 유전자는 시그마 인자 A (sigA)에 의해 전사되고, 이의 발현은 몇몇 조절인자 - aprE 발현의 활성인자로서 작용하는 DegU에 의해 고도로 제어되는 한편, AbrB, ScoC (hpr) 및 SinR은 aprE 발현의 리프레서이다.

WO9102792는 바실러스 리케니포르미스에서 서브틸리신 칼스버그-유형 프로테아제의 대규모 생산을 위한 알칼리 프로테아제 유전자의 프로모터의 기능성을 개시한다. 특히, WO9102792는 기능성 aprE 유전자 프로모터를 포함하는 바실러스 리케니포르미스의 서브틸리신 칼스버그 프로테아제 코딩 aprE 유전자의 5' 영역 (도 27), 및 리보솜 결합 부위 (샤인 달가르노 서열)를 포함하는 5' UTR을 기술한다.

또한, 사용하려는 프로모터는 발현시키고자 하는 폴리뉴클레오티드로부터의 내생성 프로모터일 수 있다. 상기 기재된 바와 같이, 제3 알라닌 라세마제는 박테리아 알라닌 라세마제일 수 있다. 따라서, 상기 박테리아 알라닌 라세마제를 코딩하는 폴리뉴클레오티드는 내생성, 즉, 천연의, 박테리아 알라닌 라세마제를 코딩하는 유전자의 프로모터에 작동적으로 연결될 수 있다.

바람직한 구현예에서, 제3 알라닌 라세마제를 코딩하는 폴리뉴클레오티드는 alr 프로모터, 예컨대 바실러스 alr 프로모터에 작동적으로 연결된다. 예를 들어, 프로모터는 바실러스 서브틸리스 alrA 프로모터, 또는 이의 변이체이다. 바람직하게, 바실러스 서브틸리스 유래의 alrA 프로모터는 SEQ ID NO: 46으로 표시된 바와 같은 핵산 서열을 포함한다. 이러한 프로모터의 변이체는 바람직하게, SEQ ID NO: 46으로 표시된 바와 같은 핵산 서열과 적어도 80%, 85%, 90%, 93%, 95%, 98% 또는 99% 서열 동일성을 갖는 핵산 서열을 포함한다.

용어 "전사 출발 부위" 또는 "전사의 출발 부위"는 전사가 유전자 서열의 5' 말단에서 출발하는 위치로서 이해한다. 원핵생물에서, +1이라고하는, 제1 뉴클레오티드는 일반적으로 아데노신 (A) 또는 구아노신 (G) 뉴클레오티드이다. 이러한 문맥에서, 용어 "부위" 및 "신호"는 본 명세서에서 상호교환적으로 사용될 수 있다.

용어 "발현" 또는 "유전자 발현"은 특이적 유전자 또는 특이적 유전자들 또는 특이적 핵산 구성체의 전사를 의미한다. 용어 "발현" 또는 "유전자 발현"은 특히, 유전자 또는 유전자들 또는 유전자 구성체의 구조적 RNA (예, rRNA, tRNA) 또는 단백질로의 후속 번역이 있거나 또는 없는 mRNA로의 전사를 의미한다. 과정은 DNA의 전사 및 최종 mRNA 생산물의 프로세싱을 포함한다.

또한, 임의로 프로모터는 5'UTR을 포함한다. 이것은 -1 프로모터 위치의 하류에 전사되지만 번역되지 않는 영역이다. 이러한 비번역 영역은 예를 들어, 표적 유전자가 펩티드 또는 폴리펩티드를 코딩하는 경우에 번역을 촉진하기 위해 리보솜 결합 부위를 함유해야 한다.

5'UTR과 관련하여, 본 발명은 특히 본 발명의 프로모터를 하나 이상의 안정화 구성요소를 포함하는 5'UTR과 조합한다고 교시한다. 이러한 방식으로 프로모터 영역으로부터 합성된 mRNA는 프로세싱되어서 전사물의 5' 말단에 안정화 서열을 갖는 mRNA 전사물을 생성시킬 수 있다. 바람직하게, mRNA 전사물의 5' 말단에 이러한 안정화 서열은 [Hue et al, 1995, Journal of Bacteriology 177: 3465-3471]에 기술된 바와 같이 그들 반감기를 증가시킨다. 적합한 mRNA 안정화 구성요소는 하기에 기술된 것들이다:

- WO08148575, 바람직하게 WO08140615의 SEQ ID NO. 1 내지 5, 또는 mRNA 안정화 기능을 유지하는 이들 서열의 단편, 및

- WO08140615, 바람직하게 바실러스 투린지엔시스 CrylllA mRNA 안정화 서열 또는 박테리오파지 SP82 mRNA 안정화 서열, 보다 바람직하게 WO08140615의 SEQ ID NO. 4 또는 5에 따른 mRNA 안정화 서열, 보다 바람직하게 WO08140615의 SEQ ID NO. 6에 따른 변형된 mRNA 안정화 서열, 또는 mRNA 안정화 기능을 유지하는 이들 서열의 단편.

바람직한 mRNA 안정화 구성요소는 aprE, grpE, cotG, SP82, RSBgsiB, CrylllA mRNA 안정화 구성요소, 또는 mRNA 안정화 기능을 유지하는 이들 서열의 단편으로 이루어진 군으로부터 선택된다. 바람직한 mRNA 안정화 구성요소는 grpE mRNA 안정화 구성요소 (WO08148575의 SEQ ID NO. 2에 상응)이다.

5'UTR은 또한 바람직하게 프로모터의 하류 및 리보솜 결합 부위 (RBS)의 상류에 위치하는 변형된 rib 리더 서열을 포함한다. 본 발명의 문맥에서, rib 리더는 본 명세서에서 바실러스 세포, 보다 바람직하게 바실러스 서브틸리스 세포에서 리보플라빈 생합성 유전자 (rib 오페론) 상류의 리더 서열로서 정의된다. 바실러스 서브틸리스에서, 리보플라빈 생합성에 관여하는 유전자를 포함하는, rib 오페론은 ribG (ribD), ribB (ribE), ribA, 및 ribH 유전자를 포함한다. 비. 서브틸리스에서 rib 프로모터 (Prib)로부터 리보플라빈 오페론의 전사는 오페론의 제1 유전자, ribG의 전사 출발 및 번역 출발 코돈 사이에서 rib 오페론의 5'-영역에 위치된 거의 300 뉴클레오티드의 비번역 조절 리더 영역 (rib 리더)을 포함한 리보스위치에 의해 제어된다. 적합한 rib 리더 서열은 참조로 본 명세서에 편입된, WO2015/1181296, 특히, 페이지 23-25에 기술되어 있다.

본 발명의 방법의 단계 b)에서, 박테리아 숙주 세포는 박테리아 숙주 세포에서 상기 플라스미드를 유지하고 상기 적어도 하나의 관심 폴리펩티드를 발현시키는데 도움이 되는 조건 하에서 배양된다. 그리하여, 적어도 하나의 관심 폴리펩티드가 생산된다. 따라서, 박테리아 숙주 세포는 박테리아 숙주 세포에서 상기 플라스미드를 유지하고 상기 적어도 하나의 관심 폴리펩티드를 발현하도록 허용하는 조건 하에서 배양된다. 거기서, 적어도 하나의 관심 폴리펩티드가 생산된다.

본 명세서에서 사용되는 용어 "배양되는"은 적어도 사전결정된 시간 동안 배양물에 포함된 박테리아 숙주 세포를 살아있도록 유지시키고/시키거나 번식시키는 것을 의미한다. 이 용어는 접종 이후 성장 시작 시 기하급수적 세포 성장기를 비롯하여 성장 정지기를 포괄한다. 당업자는 박테리아 숙주 세포에서 상기 플라스미드를 유지하고 상기 적어도 하나의 관심 폴리펩티드를 발현하도록 허용하는 조건을 선택할 수 있다. 바람직하게, 조건은 상기 숙주 세포에서 상기 플라스미드를 유지하기 위해 선택적이다. 조건은 박테리아 숙주 세포 균주에 의존적일 수 있다. 바실러스 리케니포르미스를 위한 예시적인 배양 배지 및 예시적인 배양 조건은 실시예 2에 개시되어 있다. 박테리아 숙주 세포에서 플라스미드를 유지하도록 허용하기 위해서, 박테리아 숙주 세포는 바람직하게 외부적으로 첨가된 D-알라닌의 부재 하에서 배양되고, 다시 말해서, 배양 배지에 D-알라닌은 첨가되지 않았다.

또한, 배양이 항생제 부재 하에서 수행되는 것을 고려한다. 따라서, 본 명세서에서 언급되는 플라스미드가 항생제 내성 유전자를 포함하지 않는 것을 고려한다.

본 발명의 방법은 적용가능하면, 적어도 하나의 관심 폴리펩티드의 발현, 즉 생산의 증가를 허용한다. 바람직하게, 발현은 대조군 세포와 비교하여 증가된다. 대조군 세포는 2개 염색체 알라닌 라세마제 유전자가 불활성화되지 않은 동일한 종의 대조군 세포일 수 있다. 바람직한 구현예에서, 적어도 하나의 관심 폴리펩티드의 발현은 대조군 세포에서 발현과 비교하여 적어도 10%, 예컨대 적어도 15%, 예컨대 적어도 18% 까지 증가된다. 예를 들어, 적어도 하나의 관심 폴리펩티드의 발현은 대조군 세포와 비교하여 15% 내지 25% 까지 증가될 수 있다. 발현은 숙주 세포 및/또는 배양 배지에서 폴리펩티드의 양을 결정하여 측정할 수 있다.

상기 본 명세서에 제공된 정의 및 설명은 바람직하게, 준용하여 하기에 적용된다:

i. 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자, 및

ii. 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자.

제1 구현예에서, 상기 박테리아 숙주 세포는

1. 적어도 하나의 자율 복제 서열,

를 포함하는 플라스미드를 포함한다.

따라서, 본 발명은 적어도 하기 염색체 유전자가 불활성화된 박테리아 숙주 세포에 관한 것이다:

i. 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자, 및

ii. 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자.

상기 박테리아 숙주 세포는

1. 적어도 하나의 자율 복제 서열,

를 포함하는 플라스미드를 포함한다.

상기 숙주 세포는 바람직하게 하기 단계를 수행하여 수득되거나 또는 수득가능하다:

a1) i) 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자, 및 ii) 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자를 포함하는, 박테리아 숙주 세포를 제공하는 단계,

a3) 상기 플라스미드를 상기 박테리아 숙주 세포에 도입시키는 단계.

바람직하게, 박테리아 숙주 세포는 적어도 하나의 관심 폴리펩티드 및 제3 알라닌 라세마제를 발현한다. 보다 바람직하게, 적어도 하나의 관심 폴리펩티드의 발현은 (본 명세서의 다른 곳에 기술된 바와 같이) 대조군 세포에서의 발현과 비교하여 증가된다.

제2 구현예에서, 본 발명의 숙주 세포는

u) 비-복제성 벡터로서,

u1) 임의로, 플러스 복제 기원 (ori+),

u3) 프로모터에 작동적으로 연결된, 제3 알라닌 라세마제를 코딩하는 폴리뉴클레오티드, 및

u4) 재조합에 의한 박테리아 숙주 세포의 염색체로 비-복제성 벡터의 통합을 허용하도록 박테리아 숙주 세포의 염색체 폴리뉴클레오티드에 대해 상동성을 갖는 폴리뉴클레오티드

를 포함하는 비-복제성 벡터를 포함한다.

i. 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자, 및

ii. 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자,

여기서, 상기 박테리아 숙주 세포는 u)의 비-복제성 벡터를 포함하는 플라스미드를 포함한다.

바람직한 구현예에서, 제2 구현예에 따른 박테리아 숙주 세포는

v) 복제성 벡터로서,

v1) 플러스 복제 기원 (ori+),

v2) 프로모터에 작동적으로 연결된, 복제 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및

v3) 임의로, 프로모터에 작동적으로 연결된, 역선택 폴리펩티드를 코딩하는 폴리뉴클레오티드

를 포함하는 복제성 벡터를 더 포함하고,

폴리뉴클레오티드 v2)에 의해 코딩되는 복제 폴리펩티드는 박테리아 숙주 세포에서 비-복제성 벡터 및 복제성 벡터를 유지할 수 있다.

상기 제공된 정의 및 설명은 상기 숙주 세포, 즉 제2 구현예에 따른 숙주 세포 (달리 명시된 경우 제외)에 준용하여 적용된다.

비-복제성 벡터 벡터는 숙주 세포에 존재할 때 숙주 세포에서 자율적으로 복제될 수 없는 벡터여야 한다. 바람직하게, 비-복제성 벡터는 원형 벡터이다. 비-복제성 벡터는 플러스 복제 기원을 포함할 수 있거나 또는 포함하지 않을 수 있다. 복제성 벡터 v)가 존재하는 경우에, 비-복제성 벡터는 바람직하게 플러스 복제 기원을 포함한다.

비-복제성 벡터는 u4) 재조합에 의한 박테리아 숙주 세포의 염색체로 비-복제성 벡터의 통합을 허용하도록 박테리아 숙주 세포의 염색체 폴리뉴클레오티드와 상동성, 즉 충분한 상동성을 갖는 폴리뉴클레오티드를 포함한다. 염색체 폴리뉴클레오티드에 대한 폴리뉴클레오티드 u4)의 상동성이 충분한지 여부는 통상의 측정을 통해서 당업자가 평가할 수 있다. 또한, 당분야에 공지되어 있다 (Khasanov FK, Zvingila DJ, Zainullin AA, Prozorov AA, Bashkirov VI. Homologous recombination be-tween plasmid and chromosomal DNA in Bacillus subtilis requires approximately 70 bp of homology. Mol Gen Genet. 1992;234(3):494-497; Michel B, Ehrlich SD. Recombination efficiency is a quadratic function of the length of homology during plasmid transformation of Bacillus subtilis protoplasts and Escherichia coli competent cells. EMBO J. 1984;3(12):2879-2884). 예를 들어, 폴리뉴클레오티드는 적어도 70 bp, 예컨대 적어도 100 bp 또는 적어도 200 bp의 길이를 가질 수 있다. 상기 폴리뉴클레오티드는 박테리아 숙주 세포의 염색체 폴리뉴클레오티드와 적어도 90% 서열 동일성, 예컨대 적어도 95% 서열 동일성, 또는 100% 서열 동일성을 가질 수 있다. 바람직하게, 상기 염색체 폴리뉴클레오티드는 비-복제성 벡터가 통합되는 게놈 유전자좌이다. 바람직하게 폴리뉴클레오티드는 세포 내에서 효율적인 상동성 재조합을 허용하도록 400 bp 초과, 또는 500 bp 초과, 또는 1000 bp 초과의 길이를 가질 수 있다.

당업자는 적합한 게놈 유전자좌를 선택할 수 있다. 바람직하게,이러한 유전자좌로 비-복제성 벡터의 통합은 세포의 생존능에 영향을 미치지 않는다.

바람직한 구현예에서, 비-복제성 벡터는 박테리아 숙주 세포에서 상기 벡터를 유지할 수 있는, 복제 폴리펩티드, 즉, 기능성 복제 폴리펩티드를 코딩하는 폴리뉴클레오티드가 결여되어 있다. 그러나, 복제성 벡터는 프로모터에 작동적으로 연결된, 복제 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함할 것이다. 상기 복제 폴리펩티드는 박테리아 숙주 세포에서 비-복제성 벡터 및 복제성 벡터를 유지할 수 있을 것이다.

용어 "복제 폴리펩티드"는 또한 본 명세서에서 "Rep 단백질" 또는 "플라스미드 복제 개시인자 단백질 (Rep)"이라고 한다. 바람직하게, 벡터 u) 및 v)의 플러스 복제 기원은 플라스미드 복제 개시인자 단백질 (Rep)에 의해 활성화가능하다. 이러한 Rep 단백질은 일반적으로 당업자에게 공지되어 있다. 기능적 의미에서, Rep 단백질 및 플라스미드 카피수 제어의 그들 상응하는 야생형 기전은 2개 그룹으로 분류될 수 있다: 제1 및 바람직한 그룹에서, Rep 단백질은 Rep 단백질의 임의의 생리적으로 허용가능한 농도에서, 전형적으로 복제 기원에 결합하여 플라스미드 복제를 실시한다. 이러한 플라스미드, 복제 기원, Rep 단백질 및 카피수 제어 생산물 (Cop 및/또는 안티센스 RNA)은 [Khan, Microbiology and Molecular Biology reviews, 1997, 442-455]에 상세하게 기술되어 있고, 이 문헌의 내용은 그 전문이 본 명세서에 편입된다. 충분히 공지된 플라스미드는 이. 콜라이에서 복제를 허용하는, pBR322, pUC19, pACYC177 및 pACYC184, 및 바실러스에서 복제를 허용하는, pUB110, pE194, pLS1, pT181, pTA1060의 패밀리에 속하는 것들이다. Khan이 기술한 바와 같이 제1 그룹에 속하는 전형적인 플라스미드는 pLS1 또는 pUB110의 패밀리에 속한다. 제2 그룹에서, Rep 단백질은 고농도로 발현될 때 그 자신의 리프레서로서 작용한다. 이러한 Rep 단백질 및 플라스미드 카피수 자가 조절의 그들 기전은 [Ishiai et al., Proc. Natl. Acad. Sci USA, 1994, 3839-3843], 및 [Giraldo et al., Nature Structural Biology 2003, 565-571]에 기술되어 있다.

한 구현예에서, 복제 폴리펩티드는 repU이다.

바람직하게, 비-복제성 벡터 및 복제성 벡터는 박테리아 숙주 세포에서 존재할 때, 비-복제성 및 복제성 벡터를 형성하는 단일 벡터로부터 유래된다. 이것은 예를 들어, 이의 전체 개시 내용을 참조하여 본 명세서에 편입되는, [Jorgensen, S.T., Tangney, M., Jorgensen, P.L. et al. Integration and amplification of a cyclodextrin glycosyltransferase gene from Thermoanaerobacter sp. ATCC 53627 on the Bacillus subtilis chromosome. Biotechnology Techniques 12, 15-19 (1998)]에 기술되어 있다. 따라서, 2개의 개별 자손 벡터, 즉 복제성 벡터 및 비-복제성 벡터가 형성되고, 비-복제성 벡터는 비-복제성 벡터가 기능성 Rep 폴리펩티드에 대한 발현 카세트가 결여되어 있으므로, 복제를 위해 복제성 벡터에 의존한다. 복제성 벡터에 의해 코딩되는 Rep 폴리펩티드는 비-복제성 벡터의 ori(+) 서열 상에서 트랜스로 기능하고, 따라서 플라스미드 복제에 필수적이다.

바람직한 구현예에서, 상기 단일 벡터는

i) 비-복제성 벡터의 구성요소 u1), u2), u3) 및 u4)를 포함하지만, 복제 폴리펩티드를 코딩하는 폴리뉴클레오티드가 결여된 제1 부분, 및

ii) 복제성 벡터의 구성요소 v1), v2) 및 v3)을 포함하는 제2 부분

을 포함하고, 플러스 복제 기원 u1) 및 플러스 복제 기원 v1)은 동일한 배향으로 단일 벡터에 존재하고,

박테리아 숙주 세포로 상기 단일 벡터의 도입 시, 단일 벡터의 제1 부분은 비-복제성 벡터를 형성하고, 제2 부분은 복제성 벡터를 형성한다.

바람직한 구현예에서, 숙주 세포, 예컨대 바실러스 숙주 세포, 예컨대 상기 기재된 바와 같은 바실러스 숙주 세포는 비-복제성 벡터 u) 및 복제성 벡터 v)를 포함한다. 그러나, 복제성 벡터 v)의 존재는 요구되지 않는다.

본 발명은 또한 적어도 하나의 게놈 유전자좌에, 비-복제성 벡터의 다수 카피를 포함하는 박테리아 숙주 세포를 제조하기 위한 방법에 관한 것으로서,

(a) 적어도 하기 염색체 유전자가 불활성화된 박테리아 숙주 세포를 제공하는 단계: 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자, 및 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자,

(b) 상기 박테리아 숙주 세포에

(b1) 상기 정의된 바와 같은 비-복제성 벡터,

(b2) 상기 정의된 바와 같은 비-복제성 벡터 u) 및 상기 정의된 바와 같은 복제성 벡터 v), 또는

(b3) 상기 정의된 바와 같은 단일 벡터

를 도입하는 단계, 및

(c) 박테리아 숙주 세포의 적어도 하나의 게놈 유전자좌로 단계 (b1) 또는 (b2)에서 도입된 비-복제성 벡터, 또는 단계 (b3)에서 도입된 단일 벡터로부터 유래된 비-복제성 벡터의 다수 카피의 통합을 허용하는 조건 하에서 숙주 세포를 배양하는 단계, 및 임의로

(d) 적어도 하나의 게놈 유전자좌에, 비-복제성 벡터의 다수 카피를 포함하는 숙주 세포를 선택하는 단계

를 포함한다.

한 구현예에서, 상기 정의된 바와 같은 비-복제성 벡터 u)는 숙주 세포에 도입된다.

대안적인 구현예에서, 상기 정의된 바와 같은 비-복제성 벡터 u) 및 복제성 벡터 v)는 숙주 세포로 도입된다.

대안적인 구현예에서, 상기 정의된 바와 같은 단일 벡터는 숙주 세포에 도입되고, 박테리아 숙주 세포로 상기 단일 벡터의 도입 시에, 단일 벡터의 제1 부분은 비-복제성 벡터 u)를 형성하고, 제2 부분은 복제성 벡터 v)를 형성한다.

상기 방법의 단계 c)에서, 숙주 세포는 박테리아 숙주 세포의 적어도 하나의 게놈 유전자좌로 단계 (b1) 또는 (b2)에서 도입된 비-복제성 벡터, 또는 단계 (b3)에서 도입된 단일 벡터로부터 유래된 비-복제성 벡터의 다수 카피의 통합을 허용하는 조건 하에서 배양된다.

바람직한 구현예에서, 숙주 세포는 알라닌 라세마제 억제제의 유효량의 존재 하에서 배양된다. 예를 들어, 알라닌 라세마제 억제제는 베타-클로로-D-알라닌이다. 그러나, 원칙적으로, 알라닌 라세마제 억제제의 존재가 요구되지는 않는다. 그럼에도 불구하고, 억제제는 게놈 유전자좌에서 비-복제성 벡터의 카피수를 더 증가시키기 위해서 첨가될 수 있다.

대안적으로 또는 추가로, 숙주 세포는 임의로 역선택 폴리펩티드에 대한 역선택제의 유효량 (필요하면)의 존재 하에서, 역선택 폴리펩티드를 효과적으로 발현하기 위한 조건 하에서 배양된다. 이것은 예를 들어, 단계 (b2) 또는 (b3)이 수행될 때 행해진다.

박테리아 숙주 세포는 바람직하게 외부에서 첨가된 D-알라닌의 부재 하에서 배양되고, 다시 말해서, D-알라닌은 배양 배지에 첨가되지 않았다.

바람직한 구현예에서, 역선택 폴리펩티드는 피리미딘 물질대사에 관여되는 폴리펩티드이다. 따라서, 역선택 폴리펩티드, 예컨대 oroP, pyrE, pyrF, upp는 피리미딘 물질대사에서 중간체의 불소화 유사체, 예컨대, 5-플루오로-오로테이트 또는 5-플루오로-우리딘을 사용한다.

대안적으로, 독소-항-독소 시스템 (TA)의 독소 예컨대 mazEF, ccdAB는 바실러스에서 기능성 역선택 폴리펩티드로서 사용될 수 있다 (참조: Dong, H., Zhang, D. Current development in genetic engineering strategies of Bacillus species. Microb Cell Fact 13, 63 (2014)).

보다 더 바람직한 구현예에서, 역선택 폴리펩티드는 예컨대 codBA 시스템에 의해 제공되는 시토신 데아미나제이다 (Kostner D, Rachinger M, Liebl W, Ehrenreich A. Markerless deletion of putative alanine dehydrogenase genes in Bacillus licheniformis using a codBA-based counterselection technique. Microbiology. 2017;163(11):1532-1539). 바람직하게, 역선택제는 5-플루오로-시토신이다.

생성된 숙주 세포는 적어도 하나의 게놈 유전자좌에, 비-복제성 벡터의 다수 카피를 포함하게 된다. 용어 "다수 카피"는 바람직하게 비-복제성 벡터의 적어도 20 카피, 보다 바람직하게, 적어도 30 카피, 보다 더 바람직하게 적어도 40 카피, 및 가장 바람직하게, 적어도 50 카피를 의미한다.

바람직하게, 숙주 세포는 하나의 게놈 유전자좌에 다수 카피를 포함한다.

마지막으로, 본 발명은 적어도 하기 염색체 유전자가 불활성화된 박테리아 숙주 세포에 관한 것이다:

i. 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자, 및

ii. 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자,

그리고, 박테리아 숙주 세포는 적어도 하나의 게놈 유전자좌 (예를 들어, 하나의 유전자좌)에, 상기 정의된 바와 같은 비-복제성 벡터의 다수 카피를 포함한다.

상기 박테리아 숙주 세포는 적어도 하나의 관심 폴리펩티드를 생산하는데 사용될 수 있다. 따라서, 본 발명은 또한 a) 상기 숙주 세포를 제공하는 단계, 및 상기 적어도 하나의 관심 폴리펩티드를 발현하는데 도움이 되는 조건 하에서 상기 숙주 세포를 배양하는 단계를 포함하는, 적어도 하나의 관심 폴리펩티드를 제조하기 위한 방법을 제공한다.

하기 실시예는 오직 본 발명을 예시하기 위해 제공된다. 당업자에게 자명한 다수의 가능한 변동이 또한 본 발명의 범주 내에 속한다.

실시예

재료 및 방법

달리 명시하지 않으면, 하기 실험은 미생물의 배양에 의한 화학적 화합물의 발효적 생산 및 유전자 조작에서 사용되는 표준 장비, 방법, 화학물, 및 생화학물을 적용하여 수행되었다. 또한, Sambrook 등 (Sambrook, J. and Russell, D.W. Molecular cloning. A laboratory manual, 3^rd ed, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY. 2001)을 참조한다.

전기적격 바실러스 리케니포르미스 세포 및 전기천공

비. 리케니포르미스 ATCC53926으로 DNA의 형질전환은 전기천공을 통해서 수행된다. 전기적격 비. 리케니포르미스 ATCC53926 세포의 제조 및 DNA의 형질전환은 하기 변형과 함께 Brigidi 등 (Brigidi, P., Mateuzzi, D. (1991). Biotechnol. Techniques 5, 5)이 본질적으로 기술한 바와 같이 수행되었다: DNA의 형질전환 시, 세포는 1 mL LBSPG 완충액 중에 회수하고, 선택적 LB-한천 플레이트 상에 플레이팅한 후에 60분 동안 37℃에서 인큐베이션시킨다 (Vehmaanpera J., 1989, FEMS Microbio. Lett., 61: 165-170). 알라닌 라세마제에 결함이 있는 비. 리케니포르미스 균주, 100 μg/mL D-알라닌을 모든 배양 배지, 배양-한천 플레이트 및 완충액에 첨가하였다. 알라닌 라세마제 유전자를 보유하는 플라스미드, 예를 들어 pUA58P의 형질전환 시, D-알라닌은 회수 LBSPG 완충액에 첨가되었지만, 선택 플레이트에는 첨가되지 않았다.

바실러스 리케니포르미스 균주 ATCC53926의 바실러스 리케니포르미스 특이적 제한 변형 시스템을 극복하기 위해서, 플라스미드 DNA는 하기 기술된 바와 같이 Ec#098 세포 또는 비. 서브틸리스 Bs#056 세포로부터 단리된다.

플라스미드 단리

플라스미드 DNA는 (Sambrook,J. and Russell,D.W. Molecular cloning. A laboratory manual, 3^rd ed, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY. 2001)에 기술된 표준 분자 생물학 방법 또는 알칼리 용해 방법 (Birnboim, H. C., Doly, J. (1979). Nucleic Acids Res 7(6): 1513-1523)을 통해서 바실러스 및 이. 콜라이 세포로부터 단리되었다. 바실러스 세포는 이. 콜라이와 비교하여 10 mg/mL 리소자임을 사용하여 30분 동안 37℃에서 세포 용해 전에 처리되었다.

분자 생물학 방법 및 기술

바실러스 및 이. 콜라이 미생물의 배양, DNA의 전기천공, 게놈 및 플라스미드 DNA의 단리, PCR 반응, 클로닝 기술에 제한되지 않는 분자 생물학의 표준 방법은 Sambrook 및 Rusell (상기 참조)이 본질적으로 기술한 대로 수행되었다.

균주

비. 서브틸리스 균주 Bs#056

자가영양 바실러스 서브틸리스 균주 KO-7S (BGSCID: 1S145; Zeigler D.R.)는 Spizizen의 방법 (Anagnostopoulos,C. and Spizizen,J. (1961). J. Bacteriol. 81, 741-746.)에 따라서 적격하게 만들어졌고, WO2019/016051에서 비. 서브틸리스 Bs#053의 생성에 대해 기술된 바와 같이 amyE 유전자에 DNA-메틸트랜스퍼라제의 통합을 위해 선형화된 DNA-메틸트랜스퍼라제 발현 플라스미드 pMIS012로 형질전환되었다. 세포는 10 μg/mL 클로람페니콜을 함유하는 LB-한천 플레이트 상에 살포되어서 37℃에서 밤새 인큐베이션되었다. 37℃에서 밤새 인큐베이션 후에, 성장된 콜로니를 선택하고, 10 μg/mL 클로람페니콜을 함유하는 LB-한천 플레이트 및 10 μg/mL 클로람페니콜 및 0.5% 용해성 전분 (Sigma)을 함유하는 LB-한천 플레이트 둘 모두 상에 스트리킹하였다. 전분 플레이트를 요오드 함유 Lugols 용액으로 덮었고, 양성 통합 클론은 음성 아밀라제 활성으로 확인하였다. 양성 클론의 게놈 DNA는 PCR을 통해서 MTase 발현 카세트의 올바른 통합의 분석 이후에, 3℃에서 리소자임 (10 mg/mL)으로 30분 처리 후 표준 페놀/클로로포름 추출 방법을 통해서 단리되었다. 최종 비. 서브틸리스 균주는 Bs#056으로 명명된다.

이. 콜라이 균주 Ec#098

이. 콜라이 균주 Ec#098은 DNA-메틸트랜스퍼라제를 코딩하는 발현 플라스미드 pMDS003을 보유하는 이. 콜라이 INV110 균주 (Invitrogen/Life technologies)이다 (WO2019016051).

비. 리케니포르미스 유전자 녹-아웃 균주의 생성

비. 리케니포르미스 균주 ATCC53926 (US5352604) 및 이의 유도체에서 유전자 결실을 위해서, 결실 플라스미드는 100 μg/mL 암피실린 및 30 μg/mL 클로람페니콜을 함유하는 LB-한천 플레이트 상에 37℃에서 선택 이후에, Chung의 방법 (Chung, C.T., Niemela, S.L., and Miller, R.H. (1989). One-step preparation of competent Escherichia coli: transformation and storage of bacterial cells in the same solution. PNAS 86, 2172-2175)에 따라서 적격하게 만들어진 이. 콜라이 균주 Ec#098을 형질전환시켰다. 플라스미드 DNA는 개별 클론으로부터 단리되었고 PCR 분석을 통해서 정확성을 분석하였다. 단리된 플라스미드 DNA는 비. 리케니포르미스 ATCC53926의 DNA 메틸화 패턴을 보유하고, 비. 리케니포르미스로 전달 시 분해로부터 보호된다.

aprE 유전자 결실 균주 Bli#002

전기적격 비. 리케니포르미스 ATCC53926 세포 (US5352604)는 상기 기술된 대로 제조되었고, 37℃에서 5 μg/mL 에리쓰로마이신을 함유하는 LB-한천 플레이트 상에 플레이팅 이후에 이. 콜라이 Ec#098로부터 단리된 1 μg의 pDel003 aprE 유전자 결실 플라스미드로 형질전환되었다. 유전자 결실 절차는 하기에 기술된 대로 수행되었다: 플라스미드를 보유하는 비. 리케니포르미스 세포는 5 μg/mL 에리쓰로마이신 존재의 LB-한천 플레이트 상에 45℃에서 성장시켜서 aprE 유전자의 서열 5' 또는 3'에 상동성인 pDel003의 상동성 영역 중 하나를 사용해 염색체로 캠벨 (Campbell) 재조합을 통해서 결실 플라스미드의 통합을 강제하였다. 30℃에서 5 μg/mL 에리쓰로마이신이 존재하는 LB-한천 플레이트 상에 플레이팅 이후에, 클론을 선택하였고, 6시간 동안 45℃에서 선택 압력없는 LB-배지에서 배양하였다. 개별 클론을 선택하였고, aprE 유전자의 성공적인 결실에 대해 올리고뉴클레오티드 SEQ ID NO: 27 및 SEQ ID NO: 28을 사용한 콜로니-PCR을 통하여 분석하였다. 추정 결실 양성 개별 클론을 선택하였고 플라스미드를 큐어링하기 위해 45℃에서 항생제없는 LB 배지 중에 2회 연속 밤샘 인큐베이션을 통해 선택하고, 30℃에서 밤샘 인큐베이션을 위해 LB-한천 플레이트 상에 플레이팅하였다. 단일 클론을 5μg/mL 에리쓰로마이신 존재의 LB-한천 플레이트 상에 다시 재스트리킹하였고, aprE 유전자의 성공적인 결실에 대해 콜로니 PCR을 통해 분석하였다. aprE 유전자가 올바르게 결실된 단일 에리쓰로마이신-민감성 클론을 단리하였고 Bli#002로 명명하였다.

amyB 유전자 결실 균주 Bli#003

전기적격 비. 리케니포르미스 Bli#002 세포는 상기 기술된 대로 제조하였고, 30℃에서 5 μg/mL 에리쓰로마이신을 함유하는 LB-한천 플레이트 상에 플레이팅 이후에 이. 콜라이 Ec#098로부터 단리된 1 μg의 pDel004 amyB 유전자 결실 플라스미드로 형질전환시켰다. 유전자 결실 절차는 aprE 유전자에 대해 기술된 바와 같이 수행되었다. amyB 유전자의 결실은 올리고뉴클레오티드 SEQ ID NO: 30 및 SEQ ID NO: 31을 사용한 PCR을 통해 분석되었다. 결실된 aprE 및 결실된 amyB 유전자를 갖는 최종 비. 리케니포르미스 균주는 Bli#003이라고 명명된다.

sigF 유전자 결실 균주 Bli#004

전기적격 비. 리케니포르미스 Bli#003 세포는 상기 기술된 대로 제조되었고, 30℃에서 5 μg/mL 에리쓰로마이신을 함유하는 LB-한천 플레이트 상에 플레이팅 이후에 이. 콜라이 Ec#098로부터 단리된 1 μg의 pDel005 sigF 유전자 결실 플라스미드로 형질전환시켰다.

유전자 결실 절차는 aprE 유전자에 대해 기술된 대로 수행되었다. sigF 유전자의 결실은 올리고뉴클레오티드 SEQ ID NO: 33 및 SEQ ID NO: 34를 사용한 PCR로 분석되었다. 결실된 aprE, 결실된 amyB 유전자 및 결실된 sigF 유전자를 갖는 최종 비. 리케니포르미스 균주는 Bli#004로 명명된다. 비. 리케니포르미스 균주 Bli#004는 (Fleming,A.B., M.Tangney, P.L.Jorgensen, B.Diderichsen, and F.G.Priest. 1995. Extracellular enzyme synthesis in a sporulation-deficient strain of Bacillus licheniformis. Appl. Environ. Microbiol. 61: 3775-3780)에 기술된 대로 더 이상 포자를 형성할 수 없다.

폴리-감마 글루타메이트 합성 유전자 결실 균주 Bli#008

전기적격 바실러스 리케니포르미스 Bli#004 세포는 상기 기술된 대로 제조되었고, 30℃에서 5 μg/mL 에리쓰로마이신을 함유하는 LB-한천 플레이트 상에 플레이팅 이후 이. 콜라이 Ec#098로부터 단리된 1 μg의 pDel007 pga 유전자 결실 플라스미드로 형질전환시켰다.

유전자 결실 절차는 aprE 유전자의 결실에 대해 기술된 대로 수행되었다. pga 유전자의 결실은 올리고뉴클레오티드 SEQ ID NO: 36 및 SEQ ID NO: 37을 사용한 PCR을 통해 분석되었다. 결실된 aprE, 결실된 amyB 유전자, 결실된 sigF 유전자 및 결실된 pga 유전자 클러스터를 갖는 최종 바실러스 리케니포르미스 균주는 Bli#008이라고 명명된다.

alr 유전자 결실 균주 Bli#071

전기적격 비. 리케니포르미스 Bli#008 세포는 상기 기술된 대로 제조하였고, 30℃에서 5 μg/mL 에리쓰로마이신을 함유하는 LB-한천 플레이트 상에 플레이팅 이후에, 이. 콜라이 Ec#098로부터 단리된 1 μg의 pDel0035 alr 유전자 결실 플라스미드로 형질전환시켰다. 유전자 결실 절차는 aprE 유전자에 대해 기술된 대로 수행되었지만, 모든 배지 및 배지-한천 플레이트는 추가로 100μg/mL D-알라닌이 보충되었다 (Ferrari, 1985). alr 유전자의 결실은 올리고뉴클레오티드 SEQ ID NO: 39 및 SEQ ID NO: 40을 사용한 PCR을 통해 분석되었다. 결실된 aprE, 결실된 amyB 유전자, 결실된 sigF 유전자, 결실된 pga 유전자 클러스터 및 결실된 alr 유전자를 갖는 최종 비. 리케니포르미스 균주는 비. 리케니포르미스 Bli#071로 명명된다.

yncD 유전자 결실 균주 Bli#072

전기적격 비. 리케니포르미스 Bli#071 세포는 상기 기술된 대로 제조되었지만, 모든 시점에 배지, 완충액 및 용액은 100 μg/mL D-알라닌이 보충되었다. 전기적격 Bli#071 세포는 30℃에서 5 μg/mL 에리쓰로마이신 및 100 μg/mL D-알라닌을 함유하는 LB-한천 플레이트 상에 플레이팅 이후 이. 콜라이 Ec#098로부터 단리된 1 μg의 pDel0036 yncD 유전자 결실 플라스미드로 형질전환되었다. 유전자 결실 절차는 aprE 유전자에 대해 기술된 대로 수행되었지만, 모든 배지 및 배지-한천 플레이트는 추가로 100 μg/mL D-알라닌이 보충되었다. yncD 유전자의 결실은 올리고뉴클레오티드 SEQ ID NO: 42 및 SEQ ID NO: 43을 사용한 PCR로 분석되었다. 결실된 aprE, 결실된 amyB 유전자, 결실된 sigF 유전자, 결실된 pga 유전자 클러스터, 결실된 alr 유전자 및 결실된 yncD 를 갖는 최종 비. 리케니포르미스 균주는 비. 리케니포르미스 Bli#072로 명명된다.

yncD 유전자 결실 균주 Bli#073

전기적격 비. 리케니포르미스 Bli#008 세포는 상기 기술된 대로 제조되었고, 30℃에서 5 μg/mL 에리쓰로마이신을 함유하는 LB-한천 플레이트 상에 플레이팅 이후에 이. 콜라이 Ec#098로부터 단리된 1 μg의 pDel0036 yncD 유전자 결실 플라스미드로 형질전환되었다.

유전자 결실 절차는 aprE 유전자에 대해 기술된 대로 수행되었지만, 모든 배지 및 배지-한천 플레이트는 추가로 100 μg/mL D-알라닌이 보충되었다. yncD 유전자의 결실은 올리고뉴클레오티드 SEQ ID NO: 42 및 SEQ ID NO: 43을 사용한 PCR을 통해 분석되었다. 결실된 aprE, 결실된 amyB 유전자, 결실된 sigF 유전자, 결실된 pga 유전자 클러스터 및 결실된 yncD 를 갖는 최종 비. 리케니포르미스 균주는 비. 리케니포르미스 Bli#073으로 명명된다.

플라스미드

플라스미드 pUK57S: II형-조립 목적 셔틀 플라스미드

repU 유전자 내 BsaI 부위를 비롯하여 프로테아제 발현 플라스미드 pUK56S (WO2019016051)의 카나마이신 내성 유전자의 5' BpiI 부위는 각각 quickchange 올리고뉴클레오티드 SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12, SEQ ID NO: 13과 Quickchange 돌연변이유발 키트 (Agilent)를 적용하여 2회의 순차적 라운드에서 제거하였다. 후속하여, 플라스미드는 효소 NdeI 및 SacI로 절단된, 변형된 II-형 조립 mRFP 카세트와 결찰 이후에 제한 엔도뉴클레아제 NdeI 및 SacI를 사용해 제한하였다.

변형된 mRFP 카세트 (SEQ ID NO: 14)는 측접된 BpiI의 II형 제한 효소 부위, 바실러스 리케니포르미스 유래 aprE 유전자의 종결인자 영역, 및 측접된 NdeI 및 SacI 부위를 갖는, 플라스미드 pBSd141R (등록 번호: KY995200, Radeck,J., D.Meyer, N.Lautenschlager, and T.Mascher. 2017. Bacillus SEVA siblings: A Golden Gate-based toolbox to create personalized integrative plasmids for Bacillus subtilis. Sci. Rep. 7: 14134) 유래 mRPF 카세트를 포함하고, 유전자 합성 단편으로서 주문하였다 (Geneart, Regensburg). 결찰 혼합물로 이. 콜라이 DH10B 세포 (Life technologies)를 형질전환시켰다. 형질전환체는 100 μg/mL 암피실린을 함유하는 LB-한천 플레이트 상에 분산시켰고 밤새 37℃에 인큐베이션시켰다. 플라스미드 DNA는 개별 클론으로부터 단리하였고, 제한 분해를 통해 정확성을 분석하였다. 최종 플라스미드는 pUK57S로 명명된다.

플라스미드 pUK57: II형-조립 목적 바실러스 플라스미드

pUK57S의 골격은 추가의 EcoRI 부위를 포함하는 올리고뉴클레오티드 SEQ ID NO: 15 및 SEQ ID NO: 16을 사용해 PCR-증폭되었다. EcoRI 및 DpnI 제한 이후에, PCR 단편은 20 μg/mL 카나마이신을 갖는 LB-한천 플레이트 상에 플레이팅 후 Spizizen의 방법 (Anagnostopoulos,C. and Spizizen,J. (1961). J. Bacteriol. 81, 741-746)에 따라서 적격하게 만들어진 비. 서브틸리스 Bs#056 세포로 형질전환 이후 T4 리가제 (NEB)를 사용해 결찰하였다. 최종 플라스미드 pUK57의 올바른 클론은 제한 효소 분해 및 시퀀싱으로 분석하였다.

플라스미드 pUKA57: alrA 유전자를 갖는 II형-조립 목적 바실러스 플라스미드

이의 천연 프로모터 영역 (SEQ ID 005)을 갖는 비. 서브틸리스 유래 alrA 유전자는 추가의 EcoRI 부위를 포함하는 올리고뉴클레오티드 SEQ ID NO: 17 및 SEQ ID NO: 18을 사용해 PCR-증폭하였다. pUK57S의 골격은 추가의 EcoRI 부위를 포함하는 올리고뉴클레오티드 SEQ ID 015, SEQ ID 016을 사용해 PCR-증폭하였다. EcoRI 및 DpnI 제한 이후에, 2개 PCR 단편은 20 μg/mL 카나마이신 및 160 μg/mL CDA (β-클로로-D-알라닌 히드로클로라이드, Sigma Aldrich)를 갖는 LB-한천 플레이트 상에 플레이팅 후 Spizizen의 방법 (Anagnostopoulos,C. and Spizizen, J. (1961). J. Bacteriol. 81, 741-746)에 따라서 적격하게 만들어진 비. 서브틸리스 Bs#056 세포로 형질전환 후 T4 리가제 (NEB)를 사용해 결찰시켰다. 최종 플라스미드 pUKA57의 올바른 클론은 제한 효소 분해 및 시퀀싱으로 분석되었다. alrA 유전자의 오픈 리딩 프레임은 카나마이신 내성 유전자에 반대이다.

플라스미드 pUA57: alrA 유전자를 갖는 II형-조립 목적 바실러스 플라스미드

이의 천연 프로모터 영역을 갖는 비. 서브틸리스 유래 alrA 유전자 (SEQ ID NO: 5)는 추가적인 EcoRI 부위를 포함하는 올리고뉴클레오티드 SEQ ID NO: 17 및 SEQ ID NO: 18을 사용해 PCR-증폭하였다. 카나마이신 내성 유전자없는 pUK57S의 골격은 추가적인 EcoRI 부위를 포함하는 올리고뉴클레오티드 SEQ ID NO: 015 및 SEQ ID NO: 19를 사용하여 PCR-증폭하였다. EcoRI 및 DpnI 제한 이후에, 2개 PCR 단편은 160 μg/mL CDA (β-클로로-D-알라닌 히드로클로라이드, Sigma Aldrich)를 갖는 LB-한천 플레이트 상에 플레이팅 후에, Spizizen의 방법 (상기 참조)에 따라서 적격하게 만든 비. 서브틸리스 Bs#056 세포로 형질전환 후 T4 리가제 (NEB)를 사용해 결찰시켰다. 최종 플라스미드 pUA57의 올바른 클론은 제한 효소 분해 및 시퀀싱으로 분석되었다. alrA 유전자의 오픈 리딩 프레임은 repU 유전자에 반대이다.

프로테아제 발현 플라스미드 pUKA58P

프로테아제 발현 플라스미드는 3개 부분 - pUKA57의 플라스미드 골격, pCB56C로부터의 바실러스 리케니포르미스 유래 aprE 유전자의 프로모터 (US5352604), 및 pCB56C의 프로테아제 유전자 (US5352604)로 구성된다. 프로모터 단편은 제한 엔도뉴클레아제 BpiI에 대한 추가적인 뉴클레오티드를 포함하는 올리고뉴클레오티드 SEQ ID NO: 20 및 SEQ ID NO: 21을 사용해 PCR-증폭하였다. 프로테아제 유전자는 제한 엔도뉴클레아제 BpiI에 대한 추가적인 뉴클레오티드를 포함하는 올리고뉴클레오티드 SEQ ID NO: 22 및 SEQ ID NO: 23을 사용해 플라스미드 pCB56C (US5352604)로부터 PCR-증폭하였다. 제한 엔도뉴클레아제 BpiI을 사용한 II형 조립은 기술된 대로 수행하였고 (Radeck et al., 2017), 반응 혼합물은 후속하여 20 μg/mL 카나마이신 및 160 μg/mL CDA (β-클로로-D-알라닌 히드로클로라이드, Sigma Aldrich)를 갖는 LB-한천 플레이트 상에 플레이팅 후 Spizizen의 방법 (상기 참조)에 따라서 적격하게 만든 비. 서브틸리스 Bs#056 세포에 형질전환되었다. 최종 플라스미드 pUKA58P의 올바른 클론은 제한 효소 분해 및 시퀀싱으로 분석되었다.

바실러스 온도 민감성 결실 플라스미드

플라스미드 pE194는 측접된 PvuII 부위를 갖는 올리고뉴클레오티드 SEQ ID 006 및 SEQ ID 007을 사용해 PCR-증폭하였고, 제한 엔도뉴클레아제 PvuII로 분해시키고, 제한 효소 SmaI로 분해된 플라스미드 pCE1에 결찰시킨다. pCE1은 pUC18 유도체로서, 여기서 암피실린 내성 유전자 내 BsaI 부위는 침묵 돌연변이를 통해서 제거되었다. 결찰 혼합물은 이. 콜라이 DH10B 세포 (Life technologies)에 형질전환시켰다. 형질전환체는 100 μg/mL 암피실린을 함유하는 LB-한천 플레이트 상에 확산시켰고 밤새 37℃에서 인큐베이션시켰다. 플라스미드 DNA는 개별 클론으로부터 단리하였고, 제한 분해를 통해 정확성을 분석하였다. 최종 플라스미드는 pEC194S로 명명된다.

II형-조립 mRFP 카세트는 제한 부위 BamHI에 대한 추가적인 뉴클레오티드를 포함하는, 올리고뉴클레오티드 SEQ ID 008 및 SEQ ID 009를 사용해 플라스미드 pBSd141R (등록 번호: KY995200)(Radeck et al., 2017)로부터 PCR-증폭하였다. PCR 단편 및 pEC194S는 결찰 후에 제한 효소 BamHI를 사용해 제한시키고, 이. 콜라이 DH10B 세포 (Life technologies)로 형질전환시켰다. 형질전환체는 100 μg/mL 암피실린을 함유하는 LB-한천 플레이트 상에 분산시켰고 밤새 37℃에서 인큐베이션하였다. 플라스미드 DNA는 개별 클론으로부터 단리하였고 제한 분해를 통해 정확성을 분석하였다. 최종 플라스미드 pEC194RS는 에리쓰로마이신 내성 유전자의 리딩 프레임에 반대인 오픈 리딩 프레임을 갖는 mRFP 카세트를 보유한다.

pDel003 - aprE 유전자 결실 플라스미드

바실러스 리케니포르미스의 aprE 유전자에 대한 유전자 결실 플라스미드는 pEC194RS와 상용성인 BsaI 부위가 측접된 aprE 유전자의 게놈 영역 5' 및 3'을 포함하는 유전자 합성 구성체 SEQ ID NO: 26 및 플라스미드 pEC194RS를 사용해 구축하였다. 제한 엔도뉴클레아제 BsaI과 II-형 조립은 기술된 대로 수행되었고 (Radeck et al., 2017), 반응 혼합물은 후속하여 이. 콜라이 DH10B 세포 (Life technologies)에 형질전환되었다. 형질전환체는 100 μg/mL 암피실린을 함유하는 LB-한천 플레이트 상에 확산시켰고 밤새 37℃에서 인큐베이션하였다. 플라스미드 DNA는 개별 클론으로부터 단리하였고 제한 분해를 통해 정확성을 분석하였다. 최종 aprE 결실 플라스미드는 pDel003으로 명명된다.

pDel004 - amyB 유전자 결실 플라스미드

바실러스 리케니포르미스의 amyB 유전자에 대한 유전자 결실 플라스미드는 pDel003에 대해 기술된 바와 같이 구축되었지만, pEC194RS에 상용성인 BsaI 부위가 측접된 amyB 유전자의 게놈 영역 5' 및 3'을 포함하는 유전자 합성 구성체 SEQ ID 029가 사용되었다. 최종 amyB 결실 플라스미드는 pDel004로 명명된다.

pDel005 - sigF 유전자 결실 플라스미드

바실러스 리케니포르미스의 igF 유전자 (spoIIAC 유전자)에 대한 유전자 결실 플라스미드는 pDel003에 대해 기술된 대로 구축되었지만, pEC194RS에 상용성인 BsaI 부위가 측접된 sigF 유전자의 게놈 영역 5' 및 3'을 포함하는 유전자 합성 구성체 SEQ ID 032가 사용되었다. 최종 sigF 결실 플라스미드는 pDel005로 명명된다.

pDel007 - 폴리-감마-글루타메이트 합성 유전자 결실 플라스미드

폴리-감마-글루타메이트 (pga) 생산에 관여되는 유전자, 즉 바실러스 리케니포르미스의 ywsC (pgsB), ywtA (pgsC), ywtB (pgsA), ywtC (pgsE)의 결실을 위한 결실 플라스미드는 pDel003에 대해 기술된 대로 구축되었지만, pEC194RS에 상용성인 BsaI 부위가 측접된 ywsC, ywtA (pgsC), ywtB (pgsA), ywtC (pgsE) 유전자에 측접한 게놈 영역 5' 및 3'을 포함하는 유전자 합성 구성체 SEQ ID 035를 사용하였다. 최종 pga 결실 플라스미드는 pDel007로 명명된다.

pDel035 - alr 유전자 결실 플라스미드

바실러스 리케니포르미스의 alr 유전자 (SEQ ID 001)에 대한 유전자 결실 플라스미드는 pDel003에 대해 기술된 대로 구축되었지만, pEC194RS에 상용성인 BsaI 부위가 측접된 alr 유전자의 게놈 영역 5' 및 3'을 포함하는 유전자 합성 구성체 SEQ ID 038이 사용되었다. 최종 alr 결실 플라스미드는 pDel035로 명명된다.

pDel036 - yncD 유전자 결실 플라스미드

바실러스 리케니포르미스의 yncD 유전자 (SEQ ID 024)에 대한 유전자 결실 플라스미드는 pDel003에 대해 기술된 대로 구축되었지만, pEC194RS에 상용성인 BsaI 부위가 측접된 yncD 유전자의 게놈 영역 5' 및 3'을 포함하는 유전자 합성 구성체 SEQ ID NO: 41이 사용되었다. 최종 yncD 결실 플라스미드는 pDel036으로 명명된다.

실시예 1: 비. 리케니포르미스 효소 발현 균주의 생성

표 1에 열거된 바와 같은 바실러스 리케니포르미스 균주는 상기 기술된 대로 적격하게 만들었다. alr 유전자 및/또는 yncD 에 결실을 갖는 비. 리케니포르미스 균주 경우, D-알라닌이 모든 배지 및 완충액에 보충되었다. 프로테아제 발현 플라스미드 pUKA58P는 비. 리케니포르미스 특이적 DNA 메틸화 패턴을 보유하도록 비. 서브틸리스 Bs#056 균주로부터 단리되었다. 플라스미드는 표시된 균주에 형질전환시켰고 20 μg/μL 카나마이신을 갖는 LB-한천 플레이트 상에 플레이팅하였다. 개별 클론은 제한 분해를 통해서 플라스미드 DNA의 정확성을 분석하였고, 기능성 효소 발현은 프로테아제 생산 균주의 투명대 형성에 대해서 1% 탈지유 존재의 LB-플레이트 상에 개별 클론의 전달을 통해 평가하였다. 최종 비. 리케니포르미스 발현 균주는 표 1에 열거된다.

표 1: 비. 리케니포르미스 (B. licheniformis) 발현 균주의 개요

실시예 2: 바실러스 리케니포르미스 프로테아제 발현 균주의 배양

바실러스 리케니포르미스 균주는 화학적 한정 발효 배지를 사용한 발효 과정으로 배양하였다.

하기 대량원소가 발효 과정에서 제공되었다:

화합물 분자식 농도 [g/L 초기 부피]

시트르산 C₆H₈O₇ 3.0

칼슘 술페이트 CaSO₄ 0.7

모노포타슘 포스페이트 KH₂PO₄ 25

마그네슘 술페이트 MgSO₄*7H₂O 4.8

소듐 히드록시드 NaOH 4.0

암모니아 NH₃ 1.3

하기 미량 원소가 발효 과정에서 제공되었다:

미량 원소 기호 농도 [mM]

망간 Mn 24

아연 Zn 17

구리 Cu 32

코발트 Co 1

니켈 Ni 2

몰리브덴 Mo 0.2

철 Fe 38

발효는 8 g/L 포도당을 함유하는 배지로 시작하였다. 50% 포도당을 함유하는 용액이 공급 용액으로서 사용되었다. pH는 암모니아를 사용하여 발효 동안 조정되었다. 양쪽 실험에서, 첨가된 화학적 한정 탄소원의 총량은 초기 배지 리터 당 200 g 이상으로 유지되었다. 발효는 70시간 초과 기간 동안 호기성 조건 하에서 수행되었다.

발효 과정의 종료 시에, 샘플을 추출하였고 프로테아제 활성은 광도측정으로 결정하였다: 단백질 가수분해 활성은 기질로서 숙시닐-Ala-Ala-Pro-Phe-p-니트로아닐리드 (Suc-AAPF-pNA, 짧게 AAPF; 참조, 예를 들어 DelMar et al. (1979), Analytical Biochem 99, 316-320)를 사용해 결정하였다. pNA는 30℃, pH 8.6 TRIS 완충액에서 단백질가수분해 절단을 통해 기질 분자로부터 절단되어, 유리 pNA의 노란색 색상 방출을 일으켜서, OD₄₀₅에서 측정을 통해 정량되었다.

프로테아제 수율은 최종 반응기 부피 당 첨가된 포도당의 양으로 생산물 역가를 나누어서 계산되었다. 균주 BES#158의 프로테아제 수율은 100%로 설정하였고, 그에 따라서 다른 균주의 프로테아제 수율은 BES#158을 참조하였다. alr 유전자가 결실된, 비. 리케니포르미스 발현 균주 BES#159는 비. 리케니포르미스 발현 균주 BES#158과 비교하여 프로테아제 수율의 9% 개선을 보였다. 각각 알라닌 라세마제 유전자 alr 및 yncD 의 이중 녹아웃은 BES#158과 비교하여 프로테아제 수율의 20% 개선을 보였다.

대조적으로, yncD 유전자의 단일 녹아웃은 103%의 프로테아제 수율을 보였다. 결론적으로, alr 및 yncD 유전자 둘 모두의 결실은 각각의 단일 유전자 녹아웃의 조합 효과를 초과하는, 프로테아제 수율에 대한 상승적 양성 효과를 보인다 (도 1 참조).

실시예 3: 비. 리케니포르미스 균주의 알라닌 라세마제 활성

바실러스 리케니포르미스 세포는 200 μg/mL D-알라닌이 보충된 LB 배지 중에 30℃에서 배양하였고 16시간의 배양 이후에 원심분리를 통해서 수확하였다. 세포 펠렛은 1x PBS 완충액을 사용해 2회 세척하였고, 10 mg/mL의 리소자임이 보충된 1xPBS에 재현탁하였다. 리소자임 처리는 30분 동안 37℃에서 수행하였다. 완전한 세포 용해는 ribolyser (Precellys 24)를 사용해 수행하였다. 시토졸 단백질은 원심분리를 통해 회수하였고 상청액은 알라닌 라세마제 활성의 결정에 사용하였다. 활성은 Wanatabe 등, 1999 (Watanabe et al., 1999; J Biochem; 126(4):781-6)이 기술한 방법을 사용해 결정하였다. 간략하게, 알라닌 라세마제는 37℃에서 기질로서 D-알라닌을 사용하여 분광광도측정으로 어세이하였다. D-알라닌의 L-알라닌으로의 전환은 L-알라닌 데히드로게나제와의 커플링 반응에서 NADH의 형성 이후에 결정되었다. 어세이 혼합물은 0,2 mL의 최종 부피로, 100 mM CAPS 완충액 (pH 10.5), 0.15 유닛의 L-알라닌 데히드로게나제, 30 mM D-알라닌, 및 2.5 mM NAD+를 함유하였다. 반응은 15분 동안 37℃에서 혼합물의 사전-인큐베이션 이후에 알라닌 라세마제의 첨가를 통해 시작되었다. NADH의 형성 덕분에 340 nm에서 흡광도 증가를 모니터링하였다. 효소의 1 유닛은 분 당 1 μmol 기질의 라세미화를 촉매한 효소의 양으로서 정의되었다. 활성은 브래드포드 (Bradford) 결정으로 측정된 단백질 함량을 사용해 정규화하였다. 표 2는 상이한 비. 리케니포르미스 균주의 알라닌 라세마제 활성을 요약한다.

표 2: 상이한 비. 리케니포르미스 (B. licheniformis) 균주에서 알라닌 라세마제 활성

표 2는 결실된 alr 유전자를 갖는 바실러스 리케니포르미스 균주 Bli#071 및 결실된 alr 및 yncD 유전자를 갖는 바실러스 리케니포르미스 균주 Bli#072가 알라닌 라세마제 활성의 완전한 상실 (<5 [U/mg], 배경 수준 이하)을 보인다는 것을 보여준다. 대조적으로, 결실된 yncD 유전자를 갖는 바실러스 리케니포르미스 균주 Bli#073은 71.2 U/mg의 알라닌 라세마제 활성을 보인다. 그런 이유로, alr 및 yncD 유전자의 유전자 결실의 조합의 프로테아제 수율에 대한 놀라운 상승적 양성 효과는 내생성 알라닌 라세마제 활성으로 설명될 수 없다.

실시예 4: 박테리아 세포에서 알라닌 라세마제 유전자의 존재의 인 실리코 평가

인 실리코 분석은 EggNOG 5.0 데이터베이스를 사용하여 박테리아 세포에서 alr 유전자 패밀리의 모든 구성원을 확인하기 위해 수행되었다 (Huerta-Cepas J, Szklarczyk D, Heller D, et al. eggNOG 5.0: a hierarchical, functionally and phylogenetically annotated orthology resource based on 5090 organisms and 2502 viruses. Nucleic Acids Res. 2019;47(D1):D309-D314). 유전자는 EggNOG 5.0이 제공하는 오솔로그 유전자의 클러스터 (COG)의 컬렉션에 대해 검색했을 때, COG0787에 대한 유의한 정렬을 갖는다면, 이 패밀리의 구성원으로 간주된다. 즉, COG0787은 e-값 > 1e^-10 및 점수 > 100으로서, 최고 히트이다. 이러한 검색은 eggNOG-mapper를 사용하여 다수 서열에 대해 수행될 수 있다 (Huerta-Cepas J, Forslund K, Coelho LP, et al. Fast Genome-Wide Functional Annotation through Orthology Assignment by eggNOG-Mapper. Mol Biol Evol. 2017;34(8):2115-2122).

1개 내지 5개 알라닌 라세마제 유전자를 포함하는 4214종의 상이한 박테리아 종이 확인되었다. 829개 종은 2개의 상이한 알라닌 라세마제 유전자를 함유한다. 이들 종은 하기 문 중 하나에 속한다: 악티노박테리아 (Actinobacteria); 박테로이데테스 (Bacteroidetes), 시아노박테리아 (Cyanobacteria), 데이노코쿠스-써무스 (Deinococcus-Thermus), 피르미큐테스 (Firmicutes), 푸소박테리아 (Fusobacteria), 프로테오박테리아 (Proteobacteria), 스피로카에테스 (Spirochaetes), 시너지스테테스 (Synergistetes), 베루코미크로비아 (Verrucomicrobia). 표 3은 2개 알라닌 라세마제 유전자를 포함하는 박테리아 종의 목록을 제공한다.

확인된 알라닌 라세마제는 비. 리케니포르미스 유래 라세마제와 비교하였다. 표 4는 비. 리케니포르미스 YncD 폴리펩티드와 높은 정도의 동일성을 갖는 YncD 상동체에 대한 개요를 제공한다. 실시예 부분에서 표 5는 비. 리케니포르미스 Alr 폴리펩티드와 높은 정도의 동일성을 갖는 Alr 상동체에 대한 개요를 제공한다.

표 3: 2종 알라닌 라세마제 유전자를 포함하는 박테리아 숙주 세포의 개요

표 4: 상이한 바실러스 (Bacillus) 종의 YncD 상동체의 개요

표 5: 상이한 바실러스 (Bacillus) 종의 Alr 상동체의 개요

실시예 5: 비. 리케니포르미스 효소 발현 균주의 생성

게놈 통합 및 유전자좌 확장을 위한 프로테아제 발현 플라스미드 pIL-PA는 Tangney 등 (Tangney M, Jorgensen PL, Diderichsen B, Jorgensen ST. A new method for integration and stable DNA amplification in poorly transformable bacilli. FEMS Microbiol Lett. 1995;125(1):107-114)이 기술한 바와 같은 전략을 기반으로 한다. 증폭 방법은 2개의 임계적으로 위치된 플러스 복제 기원 (+ori)을 도입시킨 pUB110-유래 플라스미드에 의존적이다. 이러한 플라스미드는 2개의 별개 자손 벡터를 형성할 수 있는데, 하나는 '복제성'이고 하나는 '비-복제성' 벡터이다. '복제성' 벡터는 트랜스 작용 복제 단백질을 코딩한다. 그리하여, '비-복제성' 벡터는 오직 '복제성' 벡터의 존재 하에서만 유지될 수 있다. '복제성' 벡터의 상실 및 '비-복제성' 벡터의 선택 시에, 비-복제성 벡터는 상동성 DNA 영역이 존재할 때 캠벨 재조합에 의해 게놈으로 통합된다.

플라스미드 pIL-PA는 깁슨 (Gibson) 조립 방법 (NEBuilder)을 통해 구축되고, 소정 순서로 하기 구성요소를 포함한다:

A.) '복제성' 벡터 단편: + ori, 플라스미드 pUB110 (등록 번호 M19465.1)의 repU 유전자, Pupp 프로모터의 제어 하에 있는 역선택 마커 codBA, ColE1 복제 기원 (이. 콜라이)

B.) '비-복제성' 벡터 단편: + ori, 플라스미드 pUB110의 repU 유전자의 비-기능성 단편, 비. 서브틸리스의 alrA 단편 (SEQ ID No 5), 플라스미드 pUKA58P의 프로테아제 발현 카세트, 비. 리케니포르미스 adaA 영역.

플라스미드 pIL-PA는 상기 기술된 대로 이. 콜라이 균주 Ec#098로부터 전달 및 재단리 이후에 이. 콜라이 DH10B 세포에 클로닝된다. 표 6에 열거된 바와 같은 바실러스 리케니포르미스 균주는 상기 기술된 대로 적격하게 만들어진다. alr 유전자 및/또는 yncD 유전자에 결실을 갖는 비. 리케니포르미스 균주 경우, D-알라닌은 모든 배지 및 완충액에 보충된다.

표 6: 통합된 유전자좌 확장 카세트를 갖는 비. 리케니포르미스 (B. licheniformis) 발현 균주의 개요

플라스미드 pIL-PA는 2% 포도당, 0.2% 포타슘 글루타메이트, 40 μg/mL 5-FC (5-플루오로-시토신) 및 100 μg/mL CDA (β-클로로-D-알라닌)가 보충된 최소 염 한천 플레이트 상에 플레이팅하고 37℃에서 48시간 동안 인큐베이션 후 전기영동을 통해서 비. 리케니포르미스 균주에 전달된다. 비. 리케니포르미스 균주 Bli#071 및 Bli#072는 CDA의 첨가를 필요로 하지 않는다.

'복제성' 벡터는 5-FC를 사용한 역선택 시 상실되고, '비-복제성' 벡터는 상동성 adaA 영역과 캠벨 재조합을 통해 게놈에 통합된다.

임의로, 비. 리케니포르미스 발현 균주를 사용하여, adaA 영역, alrA 단편, 프로테아제 발현 카세트, adaA 영역을 포함하는 통합된 증폭 유닛은 예컨대 400 μg/mL CDA 까지, CDA 농도의 단계식 증가를 통해서 모든 균주에서 증폭시킬 수 있다.

대안적인 접근법으로서, 비-복제성, 원형 벡터는 하기 구성요소를 포함하는 시험관내 깁슨 조립을 통해 구축된다:

- 비. 서브틸리스의 alrA 단편 (SEQ ID No 5), 플라스미드 pUKA58P의 프로테아제 발현 카세트, 비. 리케니포르미스 adaA 영역.

후속하여, 원형 벡터는 형질전환 및 각각의 비. 리케니포르미스 균주의 게놈으로 통합 이후에 Illustra Templifhi 키트 (GE Healthcare)를 사용해 증폭된다. 형질전환체는 비. 리케니포르미스 균주 Bli#008 및 Bli#073에 대해서 100 μg/mL CDA가 보충된 상기 기술된 바와 같은 최소 염 한천 플레이트 상에서 성장시킨다.

임의로, 증폭 유닛은 예컨대 400 μg/mL CDA 까지, CDA 농도의 단계식 증가를 통해서 모든 균주에서 증식될 수 있다.

SEQUENCE LISTING <110> BASF SE <120> Alanine racemase double deletion and transcomplementation <130> B191285PC <150> EP20187745.3 <151> 2020-07-24 <150> EP20187746.1 <151> 2020-07-24 <160> 60 <170> According Wipo Std 25 <210> 1 <211> 1170 <212> DNA <213> Bacillus licheniformis <220> <223> CDS alr <400> 1 atgagcttaa aaccattcta tagaaagaca tgggccgaaa tcgatttaac ggctttaaaa 60 gaaaacgtcc gcaatatgaa gcggcacatc ggcgagcatg tccgcctgat ggccgtcgtt 120 aaagcgaatg cctacggaca cggggatgca caggtagcga aggcggctct tgcagaaggg 180 gcgtccattc ttgctgtggc tttattggat gaagcgcttt cgctgagggc gcaggggatt 240 gaagaaccga ttcttgtcct cggtgcagtg ccgaccgaat atgcaagcat tgccgcggaa 300 aagcgcatta tcgtgactgg ctactccgtc ggctggctga aagacgtgct cggttttctg 360 aatgaggccg aagctcctct tgaatatcat ttgaagatcg acacgggcat gggccgcctt 420 ggctgcaaaa cggaagaaga gatcaaagaa atgatggaga tgaccgaatc gaacgataag 480 ctcaattgta cgggcgtgtt cactcatttc gccacggcgg acgaaaagga caccgattat 540 ttcaacatgc agcttgaccg ctttaaagag ctgatcagcc ccctcccgct tgaccgtttg 600 atggtgcatt cgtcaaacag cgccgcgggt ctgcgcttca gggaacagct atttaatgcc 660 gtccgcttcg gcatcggcat gtacggtttg gcgccgtcaa ccgaaataaa agacgagctg 720 ccgtttcgtc tgcgggaagt gttttcgctt cataccgaac tcacccatgt gaaaaaaatt 780 aaaaaaggcg agagcgtcag ctacggggcg acatatacag ctcagcgcga cgaatggatc 840 gggacagtcc ccgtcgggta tgccgacgga tggctgaggc gcctggccgg aacggaagtg 900 ctgatcgacg gaaaacgcca aaaaatagca gggagaatct gcatggacca gttcatgatt 960 tcccttgccg aagaataccc tgtcggcaca aaggttacct tgatcggaaa gcaaaaagac 1020 gaatggatct cagtcgacga aatcgcccaa aatttgcaga cgatcaatta tgaaattacc 1080 tgtatgataa gttcaagggt gccccgtatg tttttggaaa atgggagtat aatggaaata 1140 aggaatccga tcttgcctga tcaatcctga 1170 <210> 2 <211> 389 <212> PRT <213> Bacillus licheniformis <220> <223> CDS alr <400> 2 Met Ser Leu Lys Pro Phe Tyr Arg Lys Thr Trp Ala Glu Ile Asp Leu 1 5 10 15 Thr Ala Leu Lys Glu Asn Val Arg Asn Met Lys Arg His Ile Gly Glu 20 25 30 His Val Arg Leu Met Ala Val Val Lys Ala Asn Ala Tyr Gly His Gly 35 40 45 Asp Ala Gln Val Ala Lys Ala Ala Leu Ala Glu Gly Ala Ser Ile Leu 50 55 60 Ala Val Ala Leu Leu Asp Glu Ala Leu Ser Leu Arg Ala Gln Gly Ile 65 70 75 80 Glu Glu Pro Ile Leu Val Leu Gly Ala Val Pro Thr Glu Tyr Ala Ser 85 90 95 Ile Ala Ala Glu Lys Arg Ile Ile Val Thr Gly Tyr Ser Val Gly Trp 100 105 110 Leu Lys Asp Val Leu Gly Phe Leu Asn Glu Ala Glu Ala Pro Leu Glu 115 120 125 Tyr His Leu Lys Ile Asp Thr Gly Met Gly Arg Leu Gly Cys Lys Thr 130 135 140 Glu Glu Glu Ile Lys Glu Met Met Glu Met Thr Glu Ser Asn Asp Lys 145 150 155 160 Leu Asn Cys Thr Gly Val Phe Thr His Phe Ala Thr Ala Asp Glu Lys 165 170 175 Asp Thr Asp Tyr Phe Asn Met Gln Leu Asp Arg Phe Lys Glu Leu Ile 180 185 190 Ser Pro Leu Pro Leu Asp Arg Leu Met Val His Ser Ser Asn Ser Ala 195 200 205 Ala Gly Leu Arg Phe Arg Glu Gln Leu Phe Asn Ala Val Arg Phe Gly 210 215 220 Ile Gly Met Tyr Gly Leu Ala Pro Ser Thr Glu Ile Lys Asp Glu Leu 225 230 235 240 Pro Phe Arg Leu Arg Glu Val Phe Ser Leu His Thr Glu Leu Thr His 245 250 255 Val Lys Lys Ile Lys Lys Gly Glu Ser Val Ser Tyr Gly Ala Thr Tyr 260 265 270 Thr Ala Gln Arg Asp Glu Trp Ile Gly Thr Val Pro Val Gly Tyr Ala 275 280 285 Asp Gly Trp Leu Arg Arg Leu Ala Gly Thr Glu Val Leu Ile Asp Gly 290 295 300 Lys Arg Gln Lys Ile Ala Gly Arg Ile Cys Met Asp Gln Phe Met Ile 305 310 315 320 Ser Leu Ala Glu Glu Tyr Pro Val Gly Thr Lys Val Thr Leu Ile Gly 325 330 335 Lys Gln Lys Asp Glu Trp Ile Ser Val Asp Glu Ile Ala Gln Asn Leu 340 345 350 Gln Thr Ile Asn Tyr Glu Ile Thr Cys Met Ile Ser Ser Arg Val Pro 355 360 365 Arg Met Phe Leu Glu Asn Gly Ser Ile Met Glu Ile Arg Asn Pro Ile 370 375 380 Leu Pro Asp Gln Ser 385 <210> 3 <211> 1170 <212> DNA <213> Bacillus subtilis <220> <223> CDS alrA <400> 3 atgagcacaa aaccttttta cagagatacg tgggcggaaa ttgacttgtc cgcgataaag 60 gaaaatgtca gcaatatgaa aaaacatatc ggtgaacatg tccacttgat ggcagttgtg 120 aaagcaaacg cctacgggca tggtgatgca gaaacagcaa aggctgctct tgacgcaggt 180 gcttcatgct tggccgtggc cattttggat gaagcgattt cactgcgcaa aaagggattg 240 aaggcgccta tattggtgct tggcgcggtt cccccggagt atgtggcaat cgctgctgag 300 tatgacgtga ccttaacagg ttattctgtt gaatggcttc aggaggcagc ccgccacacg 360 aaaaaaggtt ctcttcattt tcatctgaag gtcgatacgg ggatgaacag acttggtgta 420 aaaacagagg aagaagttca gaacgtgatg gcaattcttg accgcaaccc tcgtttaaag 480 tgcaaagggg tatttaccca ttttgcgaca gcggatgaaa aagaaagagg ctatttctta 540 atgcagtttg agcgctttaa agagctgatt gctccgctgc cgttaaagaa tctaatggtc 600 cactgcgcga acagcgccgc tggactccgg ctgaaaaaag gcttttttaa tgcagtcaga 660 ttcggcatcg gcatgtatgg ccttcgcccg tctgctgaca tgtcggacga gataccgttt 720 cagctgcgtc cggcatttac cctgcattcg acactgtcac atgtcaaact gatcagaaaa 780 ggcgagagcg tcagctacgg agccgagtac acagcggaaa aagacacatg gatcgggacg 840 gtgcctgtag gctatgcgga cggctggctc cgaaaattga aagggaccga catccttgtg 900 aagggaaaac gcctgaaaat tgccggccga atttgcatgg accaatttat ggtggagctg 960 gatcaggaat atccgccggg cacaaaagtc acattaatag gccggcaggg ggatgaatat 1020 atttccatgg atgagattgc aggaaggctc gaaaccatta actatgaggt ggcctgtaca 1080 ataagttccc gtgttccccg tatgtttttg gaaaatggga gtataatgga agtaagaaat 1140 cctttattgc aggtaaatat aagcaattaa 1170 <210> 4 <211> 389 <212> PRT <213> Bacillus subtilis <220> <223> CDS alrA <400> 4 Met Ser Thr Lys Pro Phe Tyr Arg Asp Thr Trp Ala Glu Ile Asp Leu 1 5 10 15 Ser Ala Ile Lys Glu Asn Val Ser Asn Met Lys Lys His Ile Gly Glu 20 25 30 His Val His Leu Met Ala Val Val Lys Ala Asn Ala Tyr Gly His Gly 35 40 45 Asp Ala Glu Thr Ala Lys Ala Ala Leu Asp Ala Gly Ala Ser Cys Leu 50 55 60 Ala Val Ala Ile Leu Asp Glu Ala Ile Ser Leu Arg Lys Lys Gly Leu 65 70 75 80 Lys Ala Pro Ile Leu Val Leu Gly Ala Val Pro Pro Glu Tyr Val Ala 85 90 95 Ile Ala Ala Glu Tyr Asp Val Thr Leu Thr Gly Tyr Ser Val Glu Trp 100 105 110 Leu Gln Glu Ala Ala Arg His Thr Lys Lys Gly Ser Leu His Phe His 115 120 125 Leu Lys Val Asp Thr Gly Met Asn Arg Leu Gly Val Lys Thr Glu Glu 130 135 140 Glu Val Gln Asn Val Met Ala Ile Leu Asp Arg Asn Pro Arg Leu Lys 145 150 155 160 Cys Lys Gly Val Phe Thr His Phe Ala Thr Ala Asp Glu Lys Glu Arg 165 170 175 Gly Tyr Phe Leu Met Gln Phe Glu Arg Phe Lys Glu Leu Ile Ala Pro 180 185 190 Leu Pro Leu Lys Asn Leu Met Val His Cys Ala Asn Ser Ala Ala Gly 195 200 205 Leu Arg Leu Lys Lys Gly Phe Phe Asn Ala Val Arg Phe Gly Ile Gly 210 215 220 Met Tyr Gly Leu Arg Pro Ser Ala Asp Met Ser Asp Glu Ile Pro Phe 225 230 235 240 Gln Leu Arg Pro Ala Phe Thr Leu His Ser Thr Leu Ser His Val Lys 245 250 255 Leu Ile Arg Lys Gly Glu Ser Val Ser Tyr Gly Ala Glu Tyr Thr Ala 260 265 270 Glu Lys Asp Thr Trp Ile Gly Thr Val Pro Val Gly Tyr Ala Asp Gly 275 280 285 Trp Leu Arg Lys Leu Lys Gly Thr Asp Ile Leu Val Lys Gly Lys Arg 290 295 300 Leu Lys Ile Ala Gly Arg Ile Cys Met Asp Gln Phe Met Val Glu Leu 305 310 315 320 Asp Gln Glu Tyr Pro Pro Gly Thr Lys Val Thr Leu Ile Gly Arg Gln 325 330 335 Gly Asp Glu Tyr Ile Ser Met Asp Glu Ile Ala Gly Arg Leu Glu Thr 340 345 350 Ile Asn Tyr Glu Val Ala Cys Thr Ile Ser Ser Arg Val Pro Arg Met 355 360 365 Phe Leu Glu Asn Gly Ser Ile Met Glu Val Arg Asn Pro Leu Leu Gln 370 375 380 Val Asn Ile Ser Asn 385 <210> 5 <211> 1254 <212> DNA <213> Bacillus subtilis <220> <223> functional fragment: alrA <400> 5 ttttcgttag acatcgtttc cctttagcct ttaattttag tatgatatgt aaatgatatt 60 gaataaaagc taggaagtgt cgtaatgagc acaaaacctt tttacagaga tacgtgggcg 120 gaaattgact tgtccgcgat aaaggaaaat gtcagcaata tgaaaaaaca tatcggtgaa 180 catgtccact tgatggcagt tgtgaaagca aacgcctacg ggcatggtga tgcagaaaca 240 gcaaaggctg ctcttgacgc aggtgcttca tgcttggccg tggccatttt ggatgaagcg 300 atttcactgc gcaaaaaggg attgaaggcg cctatattgg tgcttggcgc ggttcccccg 360 gagtatgtgg caatcgctgc tgagtatgac gtgaccttaa caggttattc tgttgaatgg 420 cttcaggagg cagcccgcca cacgaaaaaa ggttctcttc attttcatct gaaggtcgat 480 acggggatga acagacttgg tgtaaaaaca gaggaagaag ttcagaacgt gatggcaatt 540 cttgaccgca accctcgttt aaagtgcaaa ggggtattta cccattttgc gacagcggat 600 gaaaaagaaa gaggctattt cttaatgcag tttgagcgct ttaaagagct gattgctccg 660 ctgccgttaa agaatctaat ggtccactgc gcgaacagcg ccgctggact ccggctgaaa 720 aaaggctttt ttaatgcagt cagattcggc atcggcatgt atggccttcg cccgtctgct 780 gacatgtcgg acgagatacc gtttcagctg cgtccggcat ttaccctgca ttcgacactg 840 tcacatgtca aactgatcag aaaaggcgag agcgtcagct acggagccga gtacacagcg 900 gaaaaagaca catggatcgg gacggtgcct gtaggctatg cggacggctg gctccgaaaa 960 ttgaaaggga ccgacatcct tgtgaaggga aaacgcctga aaattgccgg ccgaatttgc 1020 atggaccaat ttatggtgga gctggatcag gaatatccgc cgggcacaaa agtcacatta 1080 ataggccggc agggggatga atatatttcc atggatgaga ttgcaggaag gctcgaaacc 1140 attaactatg aggtggcctg tacaataagt tcccgtgttc cccgtatgtt tttggaaaat 1200 gggagtataa tggaagtaag aaatccttta ttgcaggtaa atataagcaa ttaa 1254 <210> 6 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of pE194 <400> 6 tatatacagc tggattcaca aaaaataggc ac 32 <210> 7 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of pE194 <400> 7 tatatacagc tggattatgt cttttgcgca gtc 33 <210> 8 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of functional mRFP cass ette <400> 8 tatatggatc cgtaatcagg gtatcgaggc 30 <210> 9 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of functional mRFP cass ette <400> 9 tatatggatc cctcattagg cgggctacta a 31 <210> 10 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: Quickchange G to C, BsaI site removal <400> 10 caagacaaaa agtggaaaag tcagaccatg gagagaaaag aaaat 45 <210> 11 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: Quickchange G to C, BsaI site removal <400> 11 attttctttt ctctccatgg tctgactttt ccactttttg tcttg 45 <210> 12 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: Quickchange G to C, BpiI site removal <400> 12 aaaaggattg aaggatgctt aggtagacga gttattaata gctgaat 47 <210> 13 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: Quickchange G to C, BpiI site removal <400> 13 attcagctat taataactcg tctacctaag catccttcaa tcctttt 47 <210> 14 <211> 1015 <212> DNA <213> Artificial Sequence <220> <223> functional fragment: Type-II mRFP cassette <400> 14 acatatgtcg agggtcttcg gtaccttgtc ggataaagct gtgttatatt atgtcttggt 60 gttaaataca cacgcttaac gatttatgca gagggtgctg caggcggcag ttctgtacaa 120 aaatgaccta agcggaggaa aaaaaccatt atattaggag gaaataacat ggcctcttca 180 gaggatgtta ttaaagaatt tatgcggttt aaggtgagga tggaaggctc ggtgaacgga 240 catgagttcg aaattgaggg agaaggtgaa ggccgccctt atgaaggtac tcagacagcg 300 aaattgaaag tcacgaaagg cggaccgctg ccgtttgctt gggacattct ctcacctcaa 360 tttcaatatg gctcaaaagc ctacgtaaaa cacccggctg acatccctga ttacttaaag 420 ctatccttcc cggagggctt taaatgggaa cgagttatga attttgagga cggcggcgtc 480 gttactgtca cacaggattc ttcccttcag gatggcgaat ttatttacaa agtaaaactt 540 cgtggaacta acttcccaag cgatggtccc gtgatgcaaa aaaaaacaat gggatgggaa 600 gcatctacgg aacgtatgta tccggaggat ggagccttaa agggtgaaat caaaatgcgc 660 ctgaaactta aagatggcgg acactatgac gcggaagtta aaacaacata tatggctaaa 720 aaaccagtcc aactgccggg agcatataag acggatataa agttggacat taccagccat 780 aatgaagatt acacgattgt ggaacagtat gagagagcag agggcagaca tagcacaggc 840 gcgtaagaat taatgaaaaa taagcggcag cctgcttttc catgcgggct gccgcttatc 900 gggttattgc ggccgcgttt ataatgaaga ccctagccat attctaacaa atagcatata 960 gaaaaagcta gtgtttttag cactagcttt ttcttcattc tgatgaaggg agctc 1015 <210> 15 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of functional pUK57S <400> 15 tattagaatt caaatctttt tgttccatta aagggc 36 <210> 16 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of functional pUK57S <400> 16 tatagaattc gccactacgt aaccaacatg attaa 35 <210> 17 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of functional alrA frag ment <400> 17 tataggaatt cttttcgtta gacatcgttt ccctt 35 <210> 18 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of functional alrA frag ment <400> 18 tatagaattc ttaattgctt atatttacct gcaata 36 <210> 19 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of functional pUK57S <400> 19 atatagaatt ccgtctacct aagcatcctt caatc 35 <210> 20 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of promoter PaprE <400> 20 tatatgaaga ccttcgactc gggacctctt tccctcg 37 <210> 21 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of promoter PaprE <400> 21 tatagaagac ttatatctca ctctcctcct ctttattcag a 41 <210> 22 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of protease pUK56 <400> 22 tataatgatg aggaaaaaga gtttttgg 28 <210> 23 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of protease pUK56 <400> 23 tatagaagac ttgctattag cgtgttgccg cttctg 36 <210> 24 <211> 1182 <212> DNA <213> Bacillus licheniformis <220> <223> CDS yncD <400> 24 atgaaaaagc tttgccgtga agtttgggta gaggtaaatc ttgatgcgat caaaaaaaat 60 ttgcgcgcgt ttcggcggca tattccgaaa aagagcaaaa ttatggctgt cgtaaaagcg 120 aatgcttatg gtcacggatc ggtggaagtt gcacgccatg cacttgaaca tggtgcgagt 180 gagctcgccg ttgcctcggt ggaggaagcg gtcgttttac gaaaagcggg gattaaagcg 240 ccgatccttg tgcttggttt caccccgctg agctgtgtga aagaagcggc agcttggaat 300 atatcgttat cagcttttca agttgactgg attaaagaag cgaacgagat attggaaaat 360 gaagcagatc ctaaccggct ggctgttcat atcaatgtgg ataccggcat ggggcgttta 420 ggtgtacgaa caaaggaaaa gcttttagca atcgtggaag cgctgacggc aagtgaaaac 480 ctcgaatggg aaggaatttt tacgcatttt tccacagctg acgaaccgga tactgagcta 540 accatgattc aacacgaaaa gtttatcagc tttcttcgct ttctgaaaga acaaggcttt 600 aagctgccta cggtgcatat gaacaatacg gccgcggcga tcgcttttcc ggaattcagc 660 gctgatatga ttcgcttagg catcggaatg tatggattat atccttccga ttatatcagg 720 cagcttaatc tcgttaagct tgtgcctgca ctaagcttga aggcgcgaat cgcttatgtg 780 aaaaccatgt tgactgaacc gcggacggtt agttatggtg ctacatatgt tgcagagcgc 840 ggggaagtca ttgccacaat tccggtcggc tatgctgacg gctattcccg tgaactttcc 900 aaccgcggtt ttattcttca tcgaggaaga cgagtgccgg tggcgggaag agtaacaatg 960 gatatgataa tggtcagtct gggagagggt gaaggtaaac aaggagagga agtcgtgatt 1020 tacggccggc aaaagggagc agagatatct gttgatgaaa ttgcggaaat gcttgatacg 1080 atcaactatg aagtggtatc taccataagc tggcgcgtcc ctcgttttta tataagagac 1140 ggcgagattt ttaaaaagtc gaccccgctg ttatacgtgt ag 1182 <210> 25 <211> 393 <212> PRT <213> Bacillus licheniformis <220> <223> CDS yncD <400> 25 Met Lys Lys Leu Cys Arg Glu Val Trp Val Glu Val Asn Leu Asp Ala 1 5 10 15 Ile Lys Lys Asn Leu Arg Ala Phe Arg Arg His Ile Pro Lys Lys Ser 20 25 30 Lys Ile Met Ala Val Val Lys Ala Asn Ala Tyr Gly His Gly Ser Val 35 40 45 Glu Val Ala Arg His Ala Leu Glu His Gly Ala Ser Glu Leu Ala Val 50 55 60 Ala Ser Val Glu Glu Ala Val Val Leu Arg Lys Ala Gly Ile Lys Ala 65 70 75 80 Pro Ile Leu Val Leu Gly Phe Thr Pro Leu Ser Cys Val Lys Glu Ala 85 90 95 Ala Ala Trp Asn Ile Ser Leu Ser Ala Phe Gln Val Asp Trp Ile Lys 100 105 110 Glu Ala Asn Glu Ile Leu Glu Asn Glu Ala Asp Pro Asn Arg Leu Ala 115 120 125 Val His Ile Asn Val Asp Thr Gly Met Gly Arg Leu Gly Val Arg Thr 130 135 140 Lys Glu Lys Leu Leu Ala Ile Val Glu Ala Leu Thr Ala Ser Glu Asn 145 150 155 160 Leu Glu Trp Glu Gly Ile Phe Thr His Phe Ser Thr Ala Asp Glu Pro 165 170 175 Asp Thr Glu Leu Thr Met Ile Gln His Glu Lys Phe Ile Ser Phe Leu 180 185 190 Arg Phe Leu Lys Glu Gln Gly Phe Lys Leu Pro Thr Val His Met Asn 195 200 205 Asn Thr Ala Ala Ala Ile Ala Phe Pro Glu Phe Ser Ala Asp Met Ile 210 215 220 Arg Leu Gly Ile Gly Met Tyr Gly Leu Tyr Pro Ser Asp Tyr Ile Arg 225 230 235 240 Gln Leu Asn Leu Val Lys Leu Val Pro Ala Leu Ser Leu Lys Ala Arg 245 250 255 Ile Ala Tyr Val Lys Thr Met Leu Thr Glu Pro Arg Thr Val Ser Tyr 260 265 270 Gly Ala Thr Tyr Val Ala Glu Arg Gly Glu Val Ile Ala Thr Ile Pro 275 280 285 Val Gly Tyr Ala Asp Gly Tyr Ser Arg Glu Leu Ser Asn Arg Gly Phe 290 295 300 Ile Leu His Arg Gly Arg Arg Val Pro Val Ala Gly Arg Val Thr Met 305 310 315 320 Asp Met Ile Met Val Ser Leu Gly Glu Gly Glu Gly Lys Gln Gly Glu 325 330 335 Glu Val Val Ile Tyr Gly Arg Gln Lys Gly Ala Glu Ile Ser Val Asp 340 345 350 Glu Ile Ala Glu Met Leu Asp Thr Ile Asn Tyr Glu Val Val Ser Thr 355 360 365 Ile Ser Trp Arg Val Pro Arg Phe Tyr Ile Arg Asp Gly Glu Ile Phe 370 375 380 Lys Lys Ser Thr Pro Leu Leu Tyr Val 385 390 <210> 26 <211> 1027 <212> DNA <213> Artificial Sequence <220> <223> homology regions: Fusion of 5-prime and 3-prime regions of aprE gene with flanking BsaI sites <400> 26 ggtctcgacc cgaagttctt ttttaacata taggtaaaac aatacgaaaa aaggcgccaa 60 gtattgaaga attgcagcag ccgcggcatt tcccttttcg attgaagcaa aaaacgtata 120 ttgaacagta agcattccaa aaatggaaaa tactaaaatc gaacaaatat ctgttttttt 180 cttccatatc tgacacacat gttgaaaacc gtttttcatt gaaacatata acaagagaat 240 gactcccgat gccagaagcc tgacagagac aagcgagccg gcttcaaccg ctcccctttc 300 aaatatgtac tgtgcagcgc ttcccgataa tccccacaat gaagcccctg caagcaccat 360 caatacgcct ttcacatgag ctgatttcat atctttcacc cgtttctgta tgcgatatat 420 tgcatatttt aatagatgat cgacaaggcc gcaacctcct tcggcaaaaa atgatctcat 480 aaaataaatg aatagtattt tcataaaatg agctcaataa catattctaa caaatagcat 540 atagaaaaag ctagtgtttt tagcactagc tttttcttca ttctgatgaa ggttgttcaa 600 tattttgaat ccgttccatg atcgtcggat ggccgtattt aaaaatcttg acgagaaacg 660 gcgggtttgc ctcgctcagc ccggcttttg agagctcttg aaacgtcgaa accgctgcat 720 cgctgttttg cgtcagttca atcgcatact ggtcagcagc tttttcctga tgcctcgaaa 780 ctgcgttcgt aaatggagac gacgcgaaag agatgacccc catcagcatc agaagaagcg 840 gaagtgcggc tagatcggat tttcctgcaa tatgaaggct tcttccatag cggccgatga 900 tccgcttgta cagcttgtcg atcacataaa agacagcaag ggataaaagc agatacccgc 960 caagtcctat gtaaacatgc ttcatcacat agtgccccat ttcgtgcgcc atgatgctca 1020 ggagacc 1027 <210> 27 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of aprE genomic region <400> 27 ccggttgtca ttgatccttt a 21 <210> 28 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of aprE genomic region <400> 28 atcctcctgc aaaaaccgta t 21 <210> 29 <211> 1022 <212> DNA <213> Artificial Sequence <220> <223> homology regions: Fusion of 5-prime and 3-prime regions of amyB gene with flanking BsaI sites <400> 29 ggtctcgacc cacaaggctg tcaaacgaaa aagcgtatca ggagattaac gacacgcaag 60 aaatgatcga aaaaatcagc ggacacctgc ctgtacactt gcgtcctcca tacggcggga 120 tcaatgattc cgtccgctcg ctttccaatc tgaaggtttc attgtgggat gttgatccgg 180 aagattggaa gtacaaaaat aagcaaaaga ttgtcaatca tgtcatgagc catgcgggag 240 acggaaaaat cgtcttaatg cacgatattt atgcaacgtc cgcagatgct gctgaagaga 300 ttattaaaaa gctgaaagca aaaggctatc aattggtaac tgtatctcag cttgaagaag 360 tgaagaagca gagaggctat tgaataaatg agtagaaagc gccatatcgg cgcttttctt 420 ttggaagaaa atatagggaa aatggtattt gttaaaaatt cggaatattt atacaatatc 480 atatgtttca cattgaaagg ggaggagaat ctagaagagc agagaggacg gatttcctga 540 aggaaatccg tttttttatt ttgcccgtct tataaatttc tttgattaca ttttataatt 600 aattttaaca aagtgtcatc agccctcagg aaggacttgc tgacagtttg aatcgcatag 660 gtaaggcggg gatgaaatgg caacgttatc tgatgtagca aagaaagcaa atgtgtcgaa 720 aatgacggta tcgcgggtga tcaatcatcc tgagactgtg acggatgaat tgaaaaagct 780 tgttcattcc gcaatgaagg agctcaatta tataccgaac tatgcagcaa gagcgctcgt 840 tcaaaacaga acacaggtcg tcaagctgct catactggaa gaaatggata caacagaacc 900 ttattatatg aatctgttaa cgggaatcag ccgcgagctg gaccgtcatc attatgcttt 960 gcagcttgtc acaaggaaat ctctcaatat cggccagtgc gacggcatta tctcaggaga 1020 cc 1022 <210> 30 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of amyB genomic region <400> 30 agaagcatga agggcatgcg ac 22 <210> 31 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of amyB genomic region <400> 31 caacaacagg ctgtctgacg g 21 <210> 32 <211> 1022 <212> DNA <213> Artificial Sequence <220> <223> homology regions: Fusion of 5-prime and 3-prime regions of sigF gene with flanking BsaI sites <400> 32 ggtctcgacc caaaatcatt cgccttgagc aatcagagca gcgtgcactt gaaacgttgg 60 gggtggcgtc atgaaaaatg aaatgaacat tcagtttaca gcgctcagcc aaaatgaatc 120 gtttgcacgg gtgacagtcg ctgcttttat cgctcagctt gacccgacga tggatgaact 180 gaccgaaatt aaaacggtcg tatccgaagc ggtcacaaac gcgatcattc acggttatga 240 aaactcaggg cagggaaacg tatatatttc cgtcactctc gaggaccata ttgtctattt 300 aacgatccgc gacgaaggag tcggcatccc tgatcttgaa gaagcgcgcc agcccctgtt 360 cacgacaaag cctgaactcg agcggtcggg aatgggcttt acgatcatgg aaaatttcat 420 ggatgatatt tcgatcgact cctcacctga gatgggaacc acaatacact taacaaagca 480 cttatcaaaa agcaaagcgc tttgcaatta atgaggctgc tcatgttgca ggcagcctcg 540 gatgtccgat gaaaaaccgg acgctcttgg gagcgttccg gttttttttg tgtggtaatt 600 tatggtcttt tgcgcctttc tgaatgataa atgggatgta cttcatacta caactataac 660 catcatatag gaagtgaccc agatggaacg tcaagttttt atcagactcc gccaccggct 720 tgaggcagat ccggatgaat tgattttgct cggccatatc gcacaggtag cgggtgaccg 780 cggatacaaa gaaaagcttg aacggctgcc tatttatcag gtcagcaaag cggatcaaag 840 catggtggtg ctggacgtga tgaaggtgat tgaagctgta cataaatcgt ttcctgacct 900 tgatgtccaa accgtcggcg gttctgaaac catcgtggag atccaatatc cgaaaagggg 960 tctgtcgccc gtgcttttca tcgccgtctg gctgctcttg ttcgtcggtg cctcaggaga 1020 cc 1022 <210> 33 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of sigF genomic region <400> 33 agcagctcgg cggagaaat 19 <210> 34 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of sigF genomic region <400> 34 accttgcccg tcaccatttc g 21 <210> 35 <211> 1363 <212> DNA <213> Artificial Sequence <220> <223> homology regions: Fusion of 5-prime and 3-prime regions of pga genes with flanking BsaI sites <400> 35 ggtctcgacc cgaacactga aattttagac cgggctggga tatcgagaca tatatagggg 60 cgtttaatgg cgaatacagt aacaatgaga atagtaagaa aaattaaaaa tgttaaagtt 120 tgatgaatta tcattgaaaa aaattaatgg ctttttaaat cctaggattt taacctaaaa 180 tctgaagaaa taaggtggat cgaacgactc acaaaatatt tggatttgtc aatgaatccc 240 gctttatgct aaaagagatt ttcatttttt gatagatggt ctgattgtca taggacggat 300 ttgttttgaa gagggaacat tggtgacttt ttaacctgtt cgaaaagagc gaaaatacta 360 aaagaaaaga gacatcccgg ctgacagccc atttaaaggg gattgcggcc gggggaaaaa 420 agagatcctg aatccatcct tcaacctttc atctgaaata gggagaaaag tacaaaaatc 480 ataatgtcga attttgaaag cgcatactta aaacgctgac aaaaatctga taggaattaa 540 gaactttcga tttccaaaaa tatcaataaa aagataggca ttaatgactc gggcgaggtg 600 atctttgtca cggaaaattt cgtcgtcttc tgttacataa tgccgattgt gatttcatag 660 tgaaccctga tcccggttat aaaagacctg tgaaaagcgg ccggtttgaa agggaaacac 720 gacaattttc ttaaccggtc agtgtataaa gttttataga aaatcaggag gatatataca 780 tggttttggg gttcatgttt attgtattct tttgaaggga ataaaaactg acaaatttcg 840 actgaagcaa aatttgaaaa tgcatcacct taccaattcg ggatgggaac cgcacctcat 900 gttcatgacc tctttagaat atttcccttc atctttttaa tccgcgctta ggtgaaaaag 960 ctgatcatgc tgtgctgagc gtttcttctc gctatgacgc tgctgtacat gcaaaaaaag 1020 tcctttaaat atcccagttg aatgacgatg aaagaggaaa gaagaggagg aacagatcaa 1080 ttgataaaaa aagcggcaaa caaaaagttg gttttgtttt gtggaattgc ggtgctttgg 1140 atgtctttat ttttaacgaa tcataatgat gtacgcgccg atacgatcgg cgagaaaata 1200 gcggaaactg ccagacagct tgagggtgcg aaatacagct acggcggaga gaagccgaaa 1260 acggggtttg actcgtcagg ctttgtgcaa tatgtgtttc aatcgctcga tattacgctt 1320 ccgagaacgg taaaggaaca atcgactctt ggctcaggag acc 1363 <210> 36 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of pga genomic region <400> 36 aaagccttct cctctctatt 20 <210> 37 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of pga genomic region <400> 37 ttcttgaaaa agacaaggtc 20 <210> 38 <211> 1034 <212> DNA <213> Artificial Sequence <220> <223> homology regions: Fusion of 5-prime and 3-prime regions of alr gene with flanking BsaI sites <400> 38 ggtctcgacc cggatccctt gaagagaaag agatggcgac tgaagacggc aaacggatcg 60 tcatcacata tggcggtgaa aaatccttta cattgattca ggaaaaagca cgcgtcgcca 120 aaacatccac ttccgtatcc atgaacggag agcccgttga cctcggcttc acggtcggcg 180 cactgacgga taaatcgttg tcatggacat atgacggagt cgattacttc atctcatcag 240 aagatctttc tcaagatgaa cttctgatgg ttgcaaaaag catgcaggga cagtcttcaa 300 aatagactgt gccgtacccg gcagcctgtt ttccgcccgg aagcggaaag caggcttttt 360 tatatttgcg tcgcaagcgt atgatttcga cagcttttcc gtaaaatgca taccgtgcca 420 gcaatttttc ttttgttcag ggctgatgat cccgtgcaaa atttcccttt ctccgaactt 480 tttagtatga tgggaaggac gagtgaaaca aggaacaaaa ttgatgaatt agcggaaaaa 540 caactttgct tgcgaaaaga ataatgatat gattatgaat ggaatggata gagtgttgta 600 tccgtaagtt tggtggaggt gtatgttttt gtctgaatcc agcgcaacaa ctgaaatatt 660 gattcgcttg ccagaagctt tagtatcaga actggatggt gtcgtcatgc aagataacgg 720 gagcagaaat gaactgattt accaagccac aaaaatgtat ttacgcgaac gcaaaaatcg 780 acaaattcgg gaatcgatga gacgcggtta tatggagatg gccaagatca atttgaacat 840 ctcttctgag gctcaatttg cagagtatga ggctgaaaac acagtagagc gcttagtaag 900 cggaggataa tcatttgatt gttaaacgcg gcgatgttta ttttgctgac ctatctcctg 960 ttgttggctc agaacaaggc ggggtgcgcc cggttttagt gattcaaaac aacatcgcca 1020 tggctcagga gacc 1034 <210> 39 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of alr genomic region <400> 39 gatggtaaag gttgagttta caagc 25 <210> 40 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of alr genomic region <400> 40 catttcatca tcgagatggg tgatt 25 <210> 41 <211> 1020 <212> DNA <213> Artificial Sequence <220> <223> homology regions: Fusion of 5-prime and 3-prime regions of yncD gene with flanking BsaI sites <400> 41 ggtctcgacc ctaactgcat atgtgtgtct gaaaaagaaa actttaaatt agggattgct 60 ccggcatctg tttttggagg aacgaacatg tcgggattct ctaaatcccg catcacgtcg 120 cgggggccaa aatcggtcgc gcccgcacca tcgtttctta ttggatgcgg cacgtgattg 180 taccaagctg gagtcccggc tgttcttttc atgcggaaag ctcccttcac aggtcgtgta 240 taccgaaatt tatgacaggg acgcttaaaa tatatcaaat cggagcctta ttaagacact 300 tttaaaaaac tagatggaca gatttgcatt tcctttggca gcagaaggaa accttcgatt 360 taaagtctgc acggcacggg ctcctgctgt ttgccttcca ccgctaacga ttactggctg 420 aatgatttcg cccgaagctg aataagaatg agatagaaag catccgggca attttcgaac 480 ggctacatga aatgaatact atgggacaag atagttttcc catactcaca ggccgtttgc 540 tcgatcattg atcaaaataa aaaagagcaa tttcttgaca aaaaaattta tttatgatat 600 aatttaataa ttaaatattg gtgtgtataa taggattctc ctggccggga gaatcctatt 660 tttttgcgtt tatgaaggag tgtccgacat gaaaaaagat gaatcgagta taacgtccct 720 tatttcggct tttggcagag cttatcacag ccagtatgat gaaccaaaaa tctttgatga 780 taatctggcc aaatcgctca tttcccaaca agaatttgct gatatcaaaa acagcttcat 840 tcaaggcata cagttcttca acaaagctat agcggaaaaa tacgagggag acgatgaaga 900 aatattaaga tggatcacac aagttcagct ctctccgacg ccgctcgccc gtgccgctta 960 ttgcgaaaga gtgctgcatc atgagattcg gcttgggaca gaacaatacc tcaggagacc 1020 <210> 42 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of yncD genomic region <400> 42 atcctcaagc ccttgaatcg agtgc 25 <210> 43 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide: PCR-amplification of yncD genomic region <400> 43 ctttttcaat ttctgtgtcg ctggg 25 <210> 44 <211> 1185 <212> DNA <213> Bacillus subtilis <220> <223> CDS yncD <400> 44 atgataaagc tttgccgaga agtttggatc gaagtcaatc ttgatgccgt taaaaagaat 60 ttgcgagcga tccgccgtca tattccacat aagagcaaaa ttatggctgt tgtaaaagcg 120 aacggttatg gccacgggtc tatagaagtg gcacgccatg cactggaaca cggggcgagt 180 gagctcgctg ttgccagtgt ggaggaagga atcgttttac gtaaagctgg gattacagca 240 cctatccttg tgcttggttt tacatccctt agttgtgtaa agaagtcagc agcttggaat 300 ataacattat cagcatttca ggttgattgg atgaaagaag caaacgagat attggaaaaa 360 gaagcgagtg ctaaccggct ggccattcat attaacgtgg ataccggcat gggacgatta 420 ggtgtacgca caaaggaaga acttttagag gtagtgaaag ccttaaaggc aagtaaattc 480 ctcagatgga cagggatttt cacacatttt tcgacagctg atgaaccgga cacaacactc 540 acaaagctgc agcatgaaaa attcatcagt tttctcagct ttttaaaaaa acaggggatt 600 gagctgccca ccgtgcatat gtgcaacacg gctgcagcta tcgcatttcc ggaatttagc 660 gctgatatga tccgtttagg tatcggctta tatggtttat atccttcagc ctatattaaa 720 caactaaatc tcgttaagct tgaacctgcg ttaagtttaa aggcacgcat cgcttatgtg 780 aaaaccatgc ggacagaacc ccgaaccgtt agctatggtg ctacatacat cgcagaacct 840 aatgaagtaa ttgctacact cccgattggc tatgctgacg gctattctcg tgccctttcc 900 aatcgcgggt ttgttcttca tcgcggaaaa cgagtgccag tggcgggaag agtaacaatg 960 gatatgatca tggtcagttt aggagaaaac ggtgaaggta aacaaggaga tgaagtcgtg 1020 atttacggta agcaaaaagg agccgagatt tccgttgatg aagtggctga aatgctcaat 1080 acgattaact atgaagtcgt gtctacatta agccgccgca tccctcgttt ttatataaga 1140 gatggcgaga tttttaaagt atcaactcca gtattatacg tgtag 1185 <210> 45 <211> 394 <212> PRT <213> Bacillus subtilis <220> <223> CDS yncD <400> 45 Met Ile Lys Leu Cys Arg Glu Val Trp Ile Glu Val Asn Leu Asp Ala 1 5 10 15 Val Lys Lys Asn Leu Arg Ala Ile Arg Arg His Ile Pro His Lys Ser 20 25 30 Lys Ile Met Ala Val Val Lys Ala Asn Gly Tyr Gly His Gly Ser Ile 35 40 45 Glu Val Ala Arg His Ala Leu Glu His Gly Ala Ser Glu Leu Ala Val 50 55 60 Ala Ser Val Glu Glu Gly Ile Val Leu Arg Lys Ala Gly Ile Thr Ala 65 70 75 80 Pro Ile Leu Val Leu Gly Phe Thr Ser Leu Ser Cys Val Lys Lys Ser 85 90 95 Ala Ala Trp Asn Ile Thr Leu Ser Ala Phe Gln Val Asp Trp Met Lys 100 105 110 Glu Ala Asn Glu Ile Leu Glu Lys Glu Ala Ser Ala Asn Arg Leu Ala 115 120 125 Ile His Ile Asn Val Asp Thr Gly Met Gly Arg Leu Gly Val Arg Thr 130 135 140 Lys Glu Glu Leu Leu Glu Val Val Lys Ala Leu Lys Ala Ser Lys Phe 145 150 155 160 Leu Arg Trp Thr Gly Ile Phe Thr His Phe Ser Thr Ala Asp Glu Pro 165 170 175 Asp Thr Thr Leu Thr Lys Leu Gln His Glu Lys Phe Ile Ser Phe Leu 180 185 190 Ser Phe Leu Lys Lys Gln Gly Ile Glu Leu Pro Thr Val His Met Cys 195 200 205 Asn Thr Ala Ala Ala Ile Ala Phe Pro Glu Phe Ser Ala Asp Met Ile 210 215 220 Arg Leu Gly Ile Gly Leu Tyr Gly Leu Tyr Pro Ser Ala Tyr Ile Lys 225 230 235 240 Gln Leu Asn Leu Val Lys Leu Glu Pro Ala Leu Ser Leu Lys Ala Arg 245 250 255 Ile Ala Tyr Val Lys Thr Met Arg Thr Glu Pro Arg Thr Val Ser Tyr 260 265 270 Gly Ala Thr Tyr Ile Ala Glu Pro Asn Glu Val Ile Ala Thr Leu Pro 275 280 285 Ile Gly Tyr Ala Asp Gly Tyr Ser Arg Ala Leu Ser Asn Arg Gly Phe 290 295 300 Val Leu His Arg Gly Lys Arg Val Pro Val Ala Gly Arg Val Thr Met 305 310 315 320 Asp Met Ile Met Val Ser Leu Gly Glu Asn Gly Glu Gly Lys Gln Gly 325 330 335 Asp Glu Val Val Ile Tyr Gly Lys Gln Lys Gly Ala Glu Ile Ser Val 340 345 350 Asp Glu Val Ala Glu Met Leu Asn Thr Ile Asn Tyr Glu Val Val Ser 355 360 365 Thr Leu Ser Arg Arg Ile Pro Arg Phe Tyr Ile Arg Asp Gly Glu Ile 370 375 380 Phe Lys Val Ser Thr Pro Val Leu Tyr Val 385 390 <210> 46 <211> 84 <212> DNA <213> Bacillus subtilis <220> <223> promoter alrA <400> 46 ttttcgttag acatcgtttc cctttagcct ttaattttag tatgatatgt aaatgatatt 60 gaataaaagc taggaagtgt cgta 84 <210> 47 <211> 392 <212> PRT <213> Bacillus pumilus <220> <223> CDS alr <400> 47 Met Asp Thr Asn Ala Phe Tyr Arg Asp Thr Trp Ala Glu Ile Asn Leu 1 5 10 15 Ser Ala Ile Lys His Asn Val Ser His Met Lys Asp His Ile Gly Gln 20 25 30 Ser Val Gln Leu Met Ala Val Val Lys Ala Asn Ala Tyr Gly His Gly 35 40 45 Asp Ile Glu Val Ala Ser Ala Ala Leu Lys Ala Gly Ala Asp Ile Leu 50 55 60 Ala Val Ala Phe Leu Asp Glu Ala Val Ser Leu Arg Asn Lys Gly Ile 65 70 75 80 Lys Ala Pro Ile Leu Val Leu Gly Ala Val Pro Thr Glu Tyr Val Lys 85 90 95 Val Ala Val Arg Tyr Asn Val Ile Met Thr Ala Tyr Ser Ile Asp Trp 100 105 110 Leu Lys Asp Val Ile Asn Met Met Glu Gly Gln Met Gly Gln Pro Ile 115 120 125 Arg Phe His Leu Lys Ile Asp Ser Gly Met Asn Arg Leu Gly Val Lys 130 135 140 Thr Ile Glu Gln Val Asn Glu Val Lys Lys Leu Val Asp Glu His Ser 145 150 155 160 Tyr Leu Gln Leu Glu Gly Val Phe Thr His Phe Ala Thr Ala Asp Glu 165 170 175 Lys Asp Glu Ala Tyr Phe Asp Arg Gln Val Asp Thr Phe Gln Thr Leu 180 185 190 Leu Glu Pro Leu His Thr Asp Lys Leu Leu Ile His Cys Ala Asn Ser 195 200 205 Ala Ala Gly Leu Arg Phe Lys Asp Val Leu Phe Asn Met Val Arg Phe 210 215 220 Gly Ile Ser Met Tyr Gly Leu Ser Pro Ser Glu Glu Ile Lys Asp Glu 225 230 235 240 Leu Pro Phe Lys Leu Glu Glu Ala Met Ser Leu His Thr Lys Leu Ala 245 250 255 His Val Lys His Ile Gln Lys Gly Glu Ser Val Ser Tyr Gly Ala Thr 260 265 270 Tyr Thr Ala Asn Gln Asp Thr Trp Ile Gly Thr Val Pro Val Gly Tyr 275 280 285 Ala Asp Gly Trp Ile Arg Lys Leu Ala Gly Thr Glu Val Leu Val Gly 290 295 300 Gly Lys Arg Arg Lys Ile Thr Gly Arg Ile Cys Met Asp Gln Phe Met 305 310 315 320 Val Glu Leu Lys Asp Lys Leu Pro Val Gly Glu Pro Val Val Leu Ile 325 330 335 Gly Lys Gln Gly Glu Asp Met Ile Gln Val Asp Glu Ile Ala Lys Arg 340 345 350 Leu Glu Thr Ile Asn Tyr Glu Ile Thr Cys Ser Ile Gly His Arg Val 355 360 365 Pro Arg Val Tyr Ile Glu Asp Gly Lys Arg Val Gln Val Arg Asn Pro 370 375 380 Leu Leu Gln Gly Gly Pro Ser Phe 385 390 <210> 48 <211> 389 <212> PRT <213> Bacillus velezensis <220> <223> CDS alr <400> 48 Met Asn Thr Ala Ser Phe Tyr Arg Glu Thr Trp Ala Glu Ile Asn Leu 1 5 10 15 Ser Ala Ile Lys Glu Asn Val Thr His Met Lys Lys His Ile Gly Gln 20 25 30 Asn Val His Leu Met Ala Val Val Lys Ala Asn Ala Tyr Gly His Gly 35 40 45 Asp Leu Glu Val Gly Lys Ala Ala Leu Glu Ala Gly Ala Ser Cys Leu 50 55 60 Ala Val Ala Ile Leu Asp Glu Ala Ile Ser Leu Arg Lys Arg Gly Ile 65 70 75 80 Thr Ala Pro Ile Leu Val Leu Gly Ala Val Pro Pro Glu Tyr Val Gln 85 90 95 Ala Ala Ala Glu Tyr Asp Val Thr Leu Thr Gly Tyr Ser Val Glu Trp 100 105 110 Leu Gln Glu Ala Ala Arg His Leu Gly Ser Ala Thr Val Pro Phe His 115 120 125 Leu Lys Val Asp Thr Gly Met Asn Arg Leu Gly Val Lys Thr Glu Glu 130 135 140 Glu Ile Gln Ser Val Leu Lys Ile Leu Ser Gln Asn Pro Gly Leu Val 145 150 155 160 Cys Lys Gly Val Phe Thr His Phe Ala Thr Ala Asp Glu Lys Asn Arg 165 170 175 Asp Tyr Phe Leu Phe Gln Phe Asp Arg Phe Lys Thr Leu Ile Ala Pro 180 185 190 Leu Pro Leu Lys Glu Leu Met Val His Cys Ala Asn Ser Ala Ala Gly 195 200 205 Leu Arg Leu Lys Lys Gly Phe Phe Asn Ala Val Arg Phe Gly Ile Ser 210 215 220 Met Tyr Gly Leu Arg Pro Ser Ala Asp Ile Gln Ser Glu Ile Pro Phe 225 230 235 240 Gln Leu Lys Pro Ala Phe Ala Leu His Ser Val Leu Ser His Val Lys 245 250 255 Lys Ile Arg Lys Gly Glu Ser Val Ser Tyr Gly Ala Thr Tyr Thr Ala 260 265 270 Glu Lys Asp Gln Trp Ile Gly Thr Val Pro Ile Gly Tyr Ala Asp Gly 275 280 285 Trp Leu Arg Lys Leu Ser Gly Thr Ser Val Leu Ile Gly Gly Lys Arg 290 295 300 Met Asn Ile Ala Gly Arg Ile Cys Met Asp Gln Leu Met Val Glu Leu 305 310 315 320 Asp Gln Ser Tyr Pro Pro Gly Thr Lys Val Thr Leu Ile Gly Ser Gln 325 330 335 Lys Glu Glu Thr Ile Thr Met Asp Glu Ile Ala Gly Arg Leu Gly Thr 340 345 350 Ile Asn Tyr Glu Val Pro Cys Thr Ile Ser Ser Arg Val Pro Arg Met 355 360 365 Phe Leu Glu Asn Glu Ser Ile Met Glu Val Arg Asn Pro Leu Leu Gln 370 375 380 Asp Asn Thr Ser Lys 385 <210> 49 <211> 389 <212> PRT <213> Bacillus atrophaeus <220> <223> CDS alr <400> 49 Met Asn Ile Lys Pro Phe Tyr Arg Asp Thr Trp Ala Glu Ile Asn Leu 1 5 10 15 Ser Ala Ile Glu Glu Asn Val Ser Asn Met Lys Lys His Ile Gly Asp 20 25 30 Arg Val Glu Leu Met Ala Val Val Lys Ala Asn Ala Tyr Gly His Gly 35 40 45 Asp Ala Glu Val Ala Glu Ala Ala Leu Ser Ala Gly Ala Ser Cys Leu 50 55 60 Ala Val Ala Ile Leu Asp Glu Ala Ile Ser Leu Arg Lys Arg Gly Leu 65 70 75 80 Ala Ala Pro Ile Leu Val Leu Gly Ala Val Pro Pro Glu Tyr Val Glu 85 90 95 Ile Ala Ala Glu Tyr Asp Val Thr Leu Thr Gly Tyr Ser Val Glu Trp 100 105 110 Ile Gln Glu Ala Ala Arg His Ile Lys Glu Thr Pro Val His Phe His 115 120 125 Leu Lys Val Asp Thr Gly Met Asn Arg Leu Gly Val Lys Thr Glu Glu 130 135 140 Glu Val Gln Asn Val Met Lys Ile Leu Glu Arg Asn Pro Gly Leu Leu 145 150 155 160 Cys Lys Gly Val Phe Thr His Phe Ala Thr Ala Asp Glu Lys Asp Arg 165 170 175 Ser Tyr Phe Leu Met Gln Phe Glu Arg Phe Lys Glu Leu Ile Ala Pro 180 185 190 Leu Pro Trp Lys Gln Leu Met Val His Cys Ala Asn Ser Ala Ala Gly 195 200 205 Leu Arg Leu Lys Lys Gly Phe Phe Asn Ala Val Arg Phe Gly Val Gly 210 215 220 Met Tyr Gly Leu Arg Pro Ser Ala Glu Ile Thr Asn Glu Ile Pro Phe 225 230 235 240 Arg Leu His Gln Ala Phe Thr Leu Asn Ser Thr Leu Thr His Val Lys 245 250 255 Lys Ile His Lys Gly Glu Ser Val Ser Tyr Gly Ala Thr Tyr Thr Ala 260 265 270 Glu Lys Asp Gln Trp Ile Gly Thr Val Pro Val Gly Tyr Ala Asp Gly 275 280 285 Trp Leu Arg Lys Leu Gln Gly Thr Glu Val Leu Ile Asn Gly Lys Arg 290 295 300 Leu Lys Ile Ala Gly Arg Ile Cys Met Asp Gln Phe Met Val Glu Leu 305 310 315 320 Asp Lys Glu Tyr Pro Pro Gly Ser Arg Val Thr Leu Ile Gly Arg Gln 325 330 335 Lys Asp Asp Cys Ile Thr Val Asp Glu Ile Ala Ser Arg Leu Glu Thr 340 345 350 Ile Asn Tyr Glu Val Thr Cys Thr Ile Ser Ser Arg Val Pro Arg Met 355 360 365 Phe Leu Lys Asn Gly Ser Ile Met Glu Val Arg Asn Pro Leu Leu Gln 370 375 380 Glu Asn Ala Ser Lys 385 <210> 50 <211> 389 <212> PRT <213> Bacillus mojavensis <220> <223> CDS alr <400> 50 Met Ser Thr Lys Pro Phe Tyr Arg Asp Thr Trp Ala Glu Ile Asp Leu 1 5 10 15 Ser Ala Ile Lys Glu Asn Val Ser Asn Met Lys Lys His Ile Gly Glu 20 25 30 Gln Val His Leu Met Ala Val Val Lys Ala Asn Ala Tyr Gly His Gly 35 40 45 Asp Ala Glu Val Ala Lys Ala Ala Leu Glu Ala Gly Ala Ser Cys Leu 50 55 60 Ala Val Ala Ile Leu Asp Glu Ala Ile Ser Leu Arg Gln Arg Gly Leu 65 70 75 80 Thr Ala Pro Ile Leu Val Leu Gly Ala Val Pro Pro Glu Tyr Val Lys 85 90 95 Ile Ala Ala Glu Tyr Asp Val Thr Leu Thr Gly Tyr Ser Val Glu Trp 100 105 110 Leu Gln Glu Ala Ala Arg His Leu Lys Lys Ala Ser Leu His Phe His 115 120 125 Leu Lys Val Asp Thr Gly Met Asn Arg Leu Gly Val Lys Thr Glu Glu 130 135 140 Glu Ile His His Val Met Thr Ile Leu Glu Arg Asn Pro Gly Leu Lys 145 150 155 160 Cys Lys Gly Val Phe Thr His Phe Ala Thr Ala Asp Glu Lys Gln Arg 165 170 175 Gly Tyr Phe Leu Met Gln Phe Glu Arg Phe Lys Glu Leu Ile Ala Pro 180 185 190 Leu Pro Leu Lys Lys Leu Met Val His Cys Ala Asn Ser Ala Ala Gly 195 200 205 Leu Arg Leu Lys Lys Gly Phe Phe Asn Ala Val Arg Phe Gly Ile Gly 210 215 220 Met Tyr Gly Leu Arg Pro Ser Ala Glu Ile Thr Asp Glu Ile Pro Phe 225 230 235 240 Lys Leu Arg Pro Ala Phe Thr Leu His Ser Thr Leu Ser His Val Lys 245 250 255 Lys Val Arg Lys Gly Glu Ser Val Ser Tyr Gly Ala Glu Tyr Thr Ala 260 265 270 Lys Lys Asp Thr Trp Ile Gly Thr Val Pro Val Gly Tyr Ala Asp Gly 275 280 285 Trp Leu Arg Lys Leu Lys Gly Thr Glu Ile Leu Val Lys Gly Lys Arg 290 295 300 Leu Lys Ile Ala Gly Arg Ile Cys Met Asp Gln Phe Met Val Glu Leu 305 310 315 320 Asp His Glu Tyr Pro Pro Gly Thr Lys Val Thr Leu Ile Gly Arg Gln 325 330 335 Gly Asp Glu Tyr Ile Ser Met Asp Glu Ile Ala Gly Arg Leu Glu Thr 340 345 350 Ile Asn Tyr Glu Val Ala Cys Thr Ile Ser Ser Arg Val Pro Arg Met 355 360 365 Phe Leu Glu Asn Gly Ser Ile Met Glu Val Arg Asn Pro Leu Leu Gln 370 375 380 Gly Asn Ala Ser Lys 385 <210> 51 <211> 392 <212> PRT <213> Bacillus xiamenensis <220> <223> CDS alr <400> 51 Met Asp Thr Asn Ala Phe Tyr Arg Asp Thr Trp Ala Glu Ile Asp Leu 1 5 10 15 Thr Ala Ile Lys His Asn Val Ser His Met Lys Asp His Ile Gly Gln 20 25 30 Asn Val Gln Leu Met Ala Val Val Lys Ala Asn Ala Tyr Gly His Gly 35 40 45 Asp Ile Glu Val Ala Arg Ala Ala Leu Lys Ala Gly Ala Asp Leu Leu 50 55 60 Ala Val Ala Phe Leu Asp Glu Ala Ile Ser Leu Arg Asn Lys Gly Ile 65 70 75 80 Lys Ala Pro Ile Leu Val Leu Gly Ala Val Pro Ala Glu Tyr Val Lys 85 90 95 Val Ala Val Lys Tyr Asn Val Ile Met Thr Ala Tyr Ser Ile Glu Trp 100 105 110 Leu Arg Glu Val Val Lys Val Val Gln Gly Gln Met Gly Gln Pro Ile 115 120 125 Arg Phe His Leu Lys Met Asp Ser Gly Met Asn Arg Leu Gly Val Lys 130 135 140 Thr Leu Glu Gln Val Asn Glu Val Lys Glu Leu Val Arg Glu His Ser 145 150 155 160 Tyr Leu Lys Leu Glu Gly Val Phe Thr His Phe Ala Thr Ala Asp Glu 165 170 175 Gln Asp Glu Asp Tyr Phe Asn Arg Gln Val Asp Thr Phe His Thr Leu 180 185 190 Leu Gln Pro Leu Arg Ala Asp Gln Leu Leu Ile His Cys Ala Asn Ser 195 200 205 Ala Ala Gly Leu Arg Phe Lys Glu Val Leu Phe Asn Met Val Arg Phe 210 215 220 Gly Ile Ser Met Tyr Gly Leu Ser Pro Ser Glu Glu Ile Lys Asp Glu 225 230 235 240 Leu Pro Phe Lys Leu Glu Glu Ala Leu Ser Leu His Thr Lys Leu Ala 245 250 255 His Val Lys Leu Ile Gln Lys Gly Glu Ser Val Ser Tyr Gly Ala Thr 260 265 270 Tyr Thr Ala Asn Gln Asp Thr Trp Ile Gly Thr Val Pro Val Gly Tyr 275 280 285 Ala Asp Gly Trp Ile Arg Lys Leu Ala Gly Thr Glu Val Leu Val Gly 290 295 300 Gly Lys Arg Arg Lys Ile Ala Gly Arg Val Cys Met Asp Gln Phe Met 305 310 315 320 Val Glu Leu Lys Glu His Met Pro Ala Gly Glu Pro Val Val Leu Ile 325 330 335 Gly Ala Gln Gly Ala Glu Lys Val Ser Val Asp Glu Ile Ala Lys Arg 340 345 350 Leu Glu Thr Ile Asn Tyr Glu Val Thr Cys Ser Ile Gly His Arg Val 355 360 365 Pro Arg Val Tyr Ile Glu Asp Gly Lys Arg Val Tyr Val Arg Asn Pro 370 375 380 Leu Leu Gln Asp Gly Pro Asn Phe 385 390 <210> 52 <211> 393 <212> PRT <213> Bacillus zhangzhouensis <220> <223> CDS alr <400> 52 Met Asp Thr Asn Ala Phe Tyr Arg Asp Thr Trp Ala Glu Ile Asp Leu 1 5 10 15 Thr Ala Ile Lys His Asn Val Ser His Met Lys Asp His Ile Gly Gln 20 25 30 Asn Val Gln Leu Met Ala Val Val Lys Ala Asn Ala Tyr Gly His Gly 35 40 45 Asp Ile Glu Val Ala Arg Ala Ala Leu Lys Ala Gly Ala Asp Leu Leu 50 55 60 Ala Val Ala Phe Leu Asp Glu Ala Ile Ser Leu Arg Asn Lys Gly Ile 65 70 75 80 Lys Ala Pro Ile Leu Val Leu Gly Ala Val Pro Pro Glu Tyr Val Lys 85 90 95 Val Ala Val Arg Tyr Asn Val Ile Met Thr Ala Tyr Ser Ile Glu Trp 100 105 110 Leu Arg Asp Val Val Lys Val Val Lys Gly Gln Ile Gly Gln Pro Phe 115 120 125 Arg Phe His Leu Lys Ile Asp Ser Gly Met Asn Arg Leu Gly Val Lys 130 135 140 Thr Leu Ala Gln Val Asn Glu Val Lys Glu Leu Ser Arg Asp His Ser 145 150 155 160 Tyr Leu His Leu Glu Gly Val Phe Thr His Phe Ala Thr Ala Asp Glu 165 170 175 Lys Asp Glu Asp Tyr Phe Asp Met Gln Val Asp Thr Phe Gln Thr Leu 180 185 190 Leu Gln Pro Leu His Thr Asp Lys Leu Leu Val His Cys Ala Asn Ser 195 200 205 Ala Ala Gly Leu Arg Phe Lys Glu Val Leu Phe Asn Met Val Arg Phe 210 215 220 Gly Ile Ser Met Tyr Gly Leu Ser Pro Ser Glu Glu Ile Lys Asp Glu 225 230 235 240 Leu Pro Phe Lys Leu Glu Glu Ala Met Ser Leu His Thr Lys Leu Ala 245 250 255 His Val Lys Leu Ile Arg Lys Gly Glu Ser Val Ser Tyr Gly Ala Thr 260 265 270 Tyr Thr Ala Asn Gln Asp Thr Trp Ile Gly Thr Val Pro Val Gly Tyr 275 280 285 Ala Asp Gly Trp Ile Arg Lys Leu Ala Gly Thr Glu Val Leu Val Gly 290 295 300 Gly Lys Arg Arg Lys Ile Ala Gly Arg Val Cys Met Asp Gln Phe Met 305 310 315 320 Val Glu Leu Lys Glu Asp Ile Pro Ala Gly Glu Pro Val Val Leu Ile 325 330 335 Gly Ser Gln Gly Glu Glu Lys Val Ser Val Asp Glu Ile Ala Lys Arg 340 345 350 Leu Glu Thr Ile Asn Tyr Glu Val Thr Cys Ser Ile Gly His Arg Val 355 360 365 Pro Arg Val Tyr Lys Glu Asp Gly Lys Arg Val His Val Arg Asn Pro 370 375 380 Leu Leu Gln Gly Gly Pro Ser Phe Leu 385 390 <210> 53 <211> 391 <212> PRT <213> Bacillus sonorensis <220> <223> CDS alr <400> 53 Met Ser Leu Lys Pro Phe Tyr Arg Lys Thr Trp Ala Glu Ile Asp Leu 1 5 10 15 Thr Ala Val Lys Glu Asn Val Arg Asn Met Lys Arg His Ile Gly Gly 20 25 30 Arg Val His Leu Met Ala Val Val Lys Ala Asn Ala Tyr Gly His Gly 35 40 45 Asp Ala Gln Val Ala Lys Ala Ala Leu Glu Glu Gly Ala Ser Ile Leu 50 55 60 Ala Val Ala Phe Leu Asp Glu Ala Leu Ser Leu Arg Gly Gln Gly Ile 65 70 75 80 Asp Ala Pro Ile Leu Val Leu Gly Ala Val Pro Pro Glu Tyr Val Gly 85 90 95 Ile Ala Ala Glu His Arg Ile Thr Val Thr Ala Tyr Ser Val Arg Trp 100 105 110 Leu Lys Asp Val Leu Gly Phe Ile Gly Ser Val Ser Val Pro Leu Asp 115 120 125 Phe His Leu Lys Ile Asp Thr Gly Met Gly Arg Leu Gly Cys Lys Thr 130 135 140 Glu Glu Glu Ile Lys Glu Met Met Asp Met Thr Glu Ala Ser Asp Lys 145 150 155 160 Leu Asn Cys Arg Gly Val Phe Thr His Phe Ala Thr Ala Asp Glu Lys 165 170 175 Glu Thr Asp Tyr Phe Asn Met Gln Leu Asp Arg Phe Lys Glu Leu Ile 180 185 190 Lys Pro Leu Pro Leu Asp Arg Leu Met Val His Ser Ser Asn Ser Ala 195 200 205 Ala Gly Met Arg Phe Lys Glu Gln Leu Phe Asn Ala Val Arg Phe Gly 210 215 220 Val Ser Met Tyr Gly Leu Ser Pro Ser Ser Glu Ile Lys Asp Glu Leu 225 230 235 240 Pro Phe Pro Leu Lys Glu Val Phe Ser Leu His Thr Glu Leu Val His 245 250 255 Val Lys Lys Ile His Lys Gly Glu Ser Val Ser Tyr Gly Ala Thr Tyr 260 265 270 Thr Ala Glu His Asp Glu Trp Ile Gly Thr Val Pro Val Gly Tyr Ala 275 280 285 Asp Gly Trp Leu Arg Arg Leu Ala Gly Ser Glu Val Leu Ile Asp Gly 290 295 300 Lys Arg Gln Lys Ile Ala Gly Arg Ile Cys Met Asp Gln Phe Met Ile 305 310 315 320 Ser Leu Ser Glu Glu Tyr Pro Val Gly Thr Lys Val Thr Leu Ile Gly 325 330 335 Lys Gln Lys Asp Glu Ser Ile Ser Val Asp Glu Ile Ala Lys Lys Leu 340 345 350 Gln Thr Ile Asn Tyr Glu Ile Thr Cys Met Ile Ser Ser Arg Val Pro 355 360 365 Arg Met Phe Leu Glu Lys Gly Ser Ile Met Glu Ile Arg Asn Pro Ile 370 375 380 Leu Pro Asn Asp Ile Glu Lys 385 390 <210> 54 <211> 393 <212> PRT <213> Bacillus pumilus <220> <223> CDS yncD <400> 54 Met Lys Lys Leu Cys Arg Glu Val Trp Ile Glu Val Asn Leu Asp Ala 1 5 10 15 Ile Lys Arg Asn Ile Glu Ala Ile Gln Ala His Ile Pro Arg Lys Ser 20 25 30 Lys Ile Met Ala Val Val Lys Ala Asn Ala Tyr Gly His Gly Ser Val 35 40 45 Glu Val Ala Arg Gln Ala Leu Glu Ser Gly Ala Thr Glu Leu Ala Val 50 55 60 Ala Ser Leu Glu Glu Gly Ile Val Leu Arg Arg Ala Lys Ile Glu Ala 65 70 75 80 Pro Ile Leu Val Leu Gly Phe Thr Pro Leu Asp Cys Val Lys Arg Ala 85 90 95 Ala Ala Trp Arg Ile Asp Leu Ser Gly Leu Arg Glu Asp Trp Ile Val 100 105 110 Glu Ala Asn Glu Ile Leu Ala Glu Glu Glu Ser Gln Arg Arg Leu Gly 115 120 125 Ile His Val Asn Val Asp Thr Gly Met Gly Arg Leu Gly Val Arg Thr 130 135 140 Lys Glu Glu Leu Leu Gly Val Val Glu Ala Leu Glu Lys Ser Glu Asn 145 150 155 160 Leu Arg Trp Asp Gly Ile Phe Thr His Phe Ser Thr Ala Asp Glu Pro 165 170 175 Asp Pro Asp Phe Thr Leu Leu Gln His Ser Ile Phe Ile Asp Phe Leu 180 185 190 Arg Phe Leu Lys Lys Gln Gly Ile Lys Leu Pro Thr Val His Met Asn 195 200 205 Asn Thr Ala Ala Ala Ile Ala Phe Pro Glu Phe Ser Ala Asp Met Ile 210 215 220 Arg Leu Gly Ile Gly Leu Tyr Gly Leu Tyr Pro Ser Gln Tyr Ile Glu 225 230 235 240 Ser Leu Asp Ala Val Gln Leu Glu Pro Ala Leu Ser Leu Lys Ala Arg 245 250 255 Ile Ala Phe Val Lys Glu Met Val Thr Glu Pro Arg Thr Val Ser Tyr 260 265 270 Gly Ala Thr Tyr Val Ala Lys Arg Asp Glu Val Ile Ala Thr Ile Pro 275 280 285 Ile Gly Tyr Ala Asp Gly Tyr Ser Arg Ala Leu Ser Asn Arg Gly Phe 290 295 300 Met Leu Phe Arg Gly Glu Arg Met Pro Ile Ala Gly Arg Val Thr Met 305 310 315 320 Asp Met Thr Met Ile Ser Leu Gly Glu Met Lys Ala Lys Gln Gly Glu 325 330 335 Glu Val Val Ile Tyr Gly Arg Gln Lys Gly Gly Glu Ile Ser Val Asp 340 345 350 Glu Ile Ala Glu Met Leu Asn Thr Ile Asn Tyr Glu Val Ile Ala Thr 355 360 365 Leu Ser Arg Arg Val Pro Arg Phe Tyr Arg Arg Gly Gly Lys Ile Ile 370 375 380 Lys Ile Ser Thr Pro Val Met Tyr Val 385 390 <210> 55 <211> 393 <212> PRT <213> Bacillus velezensis <220> <223> CDS yncD <400> 55 Met Lys Lys Leu Cys Arg Glu Val Trp Ile Glu Val Asp Leu Asp Ala 1 5 10 15 Ile Lys Lys Asn Val Arg Ala Ile Arg Arg His Ile Pro Asn Thr Ser 20 25 30 Lys Ile Met Ala Val Val Lys Ala Asn Ala Tyr Gly His Gly Ser Val 35 40 45 Glu Val Ala Arg Gln Ala Leu Glu Ser Gly Ala Ser Glu Leu Ala Val 50 55 60 Ala Ser Val Glu Glu Gly Ile Val Leu Arg Arg Ala Gly Ile Thr Ala 65 70 75 80 Pro Ile Leu Val Leu Gly Phe Thr Ala Leu Ser Cys Val Lys Lys Ser 85 90 95 Ala Val Trp Asn Ile Thr Leu Ser Ala Phe Gln Val Ser Trp Ile Lys 100 105 110 Lys Ala Asn Arg Ile Leu Glu Lys Glu Ala Asp Ser Lys Arg Leu Ser 115 120 125 Ile His Ile Asn Val Asp Thr Gly Met Gly Arg Leu Gly Val Arg Thr 130 135 140 Glu Glu Asp Leu Leu Ala Val Val Lys Ala Leu Lys Ser Ser Thr Tyr 145 150 155 160 Leu Ser Trp Asp Gly Ile Phe Thr His Phe Ser Thr Ala Asp Glu Pro 165 170 175 Asp Thr Glu Leu Thr Met Leu Gln His Glu Lys Phe Ile Ser Phe Leu 180 185 190 Arg Phe Leu Lys Asn Gln Asp Ile Thr Leu Pro Thr Val His Met Cys 195 200 205 Asn Thr Ala Ala Ala Ile Ala Phe Pro Glu Phe Ser Ala Asp Met Ile 210 215 220 Arg Leu Gly Ile Gly Leu Tyr Gly Leu Tyr Pro Ser Ala Ser Ile Lys 225 230 235 240 Glu Leu Asn Leu Val Asp Leu Thr Pro Ala Leu Ser Leu Lys Ala Arg 245 250 255 Ile Ala Tyr Val Lys Ala Met Val Thr Asp Pro Arg Thr Val Ser Tyr 260 265 270 Gly Ala Thr Tyr Ile Ala Glu Pro Gly Glu Ile Ile Ala Thr Ile Pro 275 280 285 Ile Gly Tyr Gly Asp Gly Tyr Ser Arg Ala Leu Ser Asn Arg Gly Phe 290 295 300 Ile Leu His Arg Gly Arg Arg Val Pro Val Ala Gly Arg Val Thr Met 305 310 315 320 Asp Met Ile Met Val Ser Leu Gly Glu Asn Glu Gly Lys Gln Gly Glu 325 330 335 Glu Val Val Ile Tyr Gly Lys Gln Gln Gly Ala Glu Ile Ser Val Asp 340 345 350 Glu Ile Ala Glu Met Leu Gly Thr Ile Ser Tyr Glu Val Leu Ser Val 355 360 365 Leu Ser Arg Arg Val Pro Arg Phe Tyr Phe Arg Asp Gly Lys Ile Ile 370 375 380 Lys Ile Ser Ala Pro Val Leu Tyr Val 385 390 <210> 56 <211> 393 <212> PRT <213> Bacillus atrophaeus <220> <223> CDS yncD <400> 56 Met Thr Lys Leu Cys Arg Glu Val Trp Ile Glu Val Asn Leu Asp Ala 1 5 10 15 Ile Lys Lys Asn Leu Arg Ala Ile Arg His His Ile Pro Lys Lys Ser 20 25 30 Lys Ile Met Ala Val Val Lys Ala Asn Ala Tyr Gly His Gly Ser Val 35 40 45 Glu Val Ala Arg His Ala Leu Glu Asn Gly Ala Ser Glu Leu Ala Val 50 55 60 Ala Ser Val Glu Glu Gly Ile Val Leu Arg Lys Ala Gly Ile Thr Ala 65 70 75 80 Pro Ile Leu Val Leu Gly Phe Thr Ser Leu Ser Cys Val Lys Glu Ser 85 90 95 Ala Ala Trp Asn Ile Glu Leu Ser Ala Phe Gln Val Asp Trp Ile Lys 100 105 110 Glu Ala Asn Glu Ile Leu Lys Asn Glu Ala Arg Pro Asn Arg Leu Gly 115 120 125 Ile His Ile Asn Val Asp Thr Gly Met Gly Arg Leu Gly Val Arg Thr 130 135 140 Lys Glu Glu Leu Leu Ala Val Val Asn Ala Leu Thr Ala Ser Lys Phe 145 150 155 160 Leu Arg Trp Ala Gly Ile Phe Thr His Phe Ser Thr Ala Asp Glu Pro 165 170 175 Asp Thr Thr Leu Thr Lys Leu Gln His Asp Lys Phe Ile Arg Phe Leu 180 185 190 Arg Phe Leu Lys Asn Gln Gly Ile Glu Leu Pro Thr Val His Met Ser 195 200 205 Asn Thr Ala Ala Ala Ile Ala Phe Pro Glu Phe Ser Ala Asp Met Ile 210 215 220 Arg Leu Gly Ile Gly Leu Tyr Gly Leu Tyr Pro Ser Ala Tyr Ile Lys 225 230 235 240 Gln Leu His Leu Val Lys Leu Glu Pro Ala Leu Ser Leu Lys Ala Arg 245 250 255 Ile Ala Tyr Val Lys Thr Met Arg Thr Glu Pro Arg Thr Ile Ser Tyr 260 265 270 Gly Ala Thr Tyr Ile Ala Glu Pro Asp Glu Val Ile Ala Thr Leu Pro 275 280 285 Val Gly Tyr Ala Asp Gly Tyr Ser Arg Ala Leu Ser Asn Arg Gly Phe 290 295 300 Val Leu His Arg Gly Arg Arg Val Pro Val Val Gly Arg Val Thr Met 305 310 315 320 Asp Leu Ile Met Val Ser Leu Gly Glu Ser Glu Gly Lys Gln Gly Glu 325 330 335 Glu Val Val Ile Tyr Gly Gln Gln Lys Gly Ala Glu Ile Ser Val Asp 340 345 350 Glu Val Ala Glu Met Leu Asn Thr Ile Asn Tyr Glu Val Val Ser Thr 355 360 365 Leu Ser Arg Arg Ile Pro Arg Phe Tyr Ile Arg Asp Gly Gly Ile Phe 370 375 380 Lys Val Ser Thr Pro Val Met Tyr Val 385 390 <210> 57 <211> 362 <212> PRT <213> Bacillus mojavensis <220> <223> CDS yncD <400> 57 Met Ala Val Val Lys Ala Asn Gly Tyr Gly His Gly Ser Val Glu Val 1 5 10 15 Ala Arg His Ala Leu Glu His Gly Ala Ser Glu Leu Ala Val Ala Ser 20 25 30 Val Glu Glu Gly Ile Val Leu Arg Lys Ala Gly Ile Thr Ala Pro Ile 35 40 45 Leu Val Leu Gly Phe Thr Ser Leu Ser Cys Val Lys Lys Ser Ala Ala 50 55 60 Trp Asn Ile Glu Leu Ser Ala Phe Gln Val Asp Trp Ile Lys Lys Ala 65 70 75 80 Asn Arg Ile Leu Glu Asn Glu Glu Ser Thr Glu Ser Thr Ser Arg Leu 85 90 95 Gly Ile His Ile Asn Val Asp Thr Gly Met Gly Arg Leu Gly Val Arg 100 105 110 Thr Lys Glu Lys Leu Leu Ala Val Val Glu Ala Leu Thr Glu Ser Lys 115 120 125 Phe Leu Arg Trp Ser Gly Ile Phe Thr His Phe Ser Thr Ala Asp Glu 130 135 140 Ala Asp Thr Thr Leu Thr Lys Leu Gln His Glu Lys Phe Ile Asn Phe 145 150 155 160 Leu Ser Phe Leu Lys Asn Arg Gly Ile Glu Leu Pro Thr Val His Met 165 170 175 Ser Asn Thr Ala Ala Ala Ile Ala Phe Pro Glu Tyr Ser Ala Asp Met 180 185 190 Ile Arg Leu Gly Ile Gly Leu Tyr Gly Leu Tyr Pro Ser Asp Tyr Ile 195 200 205 Lys Gln Leu Asn Leu Val Lys Leu Glu Pro Ala Leu Ser Leu Lys Ala 210 215 220 Arg Ile Ala Tyr Val Lys Thr Met Arg Thr Glu Pro Arg Thr Ile Ser 225 230 235 240 Tyr Gly Ala Thr Tyr Ile Ala Glu Pro Glu Glu Val Ile Ala Thr Leu 245 250 255 Pro Val Gly Tyr Ala Asp Gly Tyr Ser Arg Ala Leu Ser Asn Arg Gly 260 265 270 Phe Val Leu His Arg Gly Lys Arg Val Pro Val Val Gly Arg Val Thr 275 280 285 Met Asp Met Ile Met Val Ser Leu Gly Glu Ser Glu Gly Lys Gln Gly 290 295 300 Glu Glu Val Val Ile Tyr Gly His Gln Lys Gly Ala Glu Ile Pro Val 305 310 315 320 Asp Glu Val Ala Glu Met Leu Asn Thr Ile Asn Tyr Glu Val Val Ser 325 330 335 Thr Leu Ser Arg Arg Val Pro Arg Phe Tyr Ile Arg Asp Gly Glu Met 340 345 350 Phe Lys Val Ser Thr Pro Val Met Tyr Val 355 360 <210> 58 <211> 393 <212> PRT <213> Bacillus xiamenensis <220> <223> CDS yncD <400> 58 Met Lys Asn Leu Cys Arg Glu Val Trp Ile Glu Val Asn Leu Asp Ala 1 5 10 15 Ile Lys Arg Asn Ile Glu Ala Ile Gln Ala His Ile Pro Arg Lys Ser 20 25 30 Lys Ile Met Ala Val Val Lys Ala Asn Ala Tyr Gly His Gly Ser Val 35 40 45 Glu Val Ala Arg Gln Ala Leu Glu Ser Gly Ala Thr Glu Leu Ala Val 50 55 60 Ala Ser Leu Glu Glu Gly Ile Val Leu Arg Arg Ala Lys Val Glu Ala 65 70 75 80 Pro Ile Leu Val Leu Gly Phe Thr Pro Leu Asp Cys Val Lys Lys Ala 85 90 95 Ala Ala Trp Lys Ile Asp Leu Ser Gly Leu Arg Ala Asp Trp Ile Lys 100 105 110 Gln Ala Asn Glu Ile Leu Glu Glu Glu Glu Ser Gln Asn Gln Leu Gly 115 120 125 Ile His Val Asn Val Asp Thr Gly Met Gly Arg Leu Gly Val Arg Thr 130 135 140 Lys Glu Glu Leu Leu Ala Val Val Glu Ala Leu Glu Lys Ser Glu Lys 145 150 155 160 Leu Arg Trp Asp Gly Ile Phe Thr His Phe Ser Ser Ala Asp Glu Pro 165 170 175 Asp Pro Asp Phe Thr Leu Leu Gln His Ser Ile Phe Ile Asp Phe Leu 180 185 190 Arg Phe Leu Lys Lys Gln Gly Ile Thr Leu Pro Thr Val His Met Asn 195 200 205 Asn Thr Ala Ala Ala Ile Ala Phe Pro Glu Phe Ser Ala Asp Met Ile 210 215 220 Arg Leu Gly Ile Gly Leu Tyr Gly Leu Tyr Pro Ser Thr Tyr Ile Gln 225 230 235 240 Ser Leu Asp Ala Val Gln Leu Glu Pro Ala Leu Ser Leu Lys Ala Arg 245 250 255 Ile Ala Phe Val Lys Glu Met Val Thr Glu Pro Arg Thr Val Ser Tyr 260 265 270 Gly Ala Thr Tyr Val Ala Lys Pro Asp Glu Val Ile Ala Thr Ile Pro 275 280 285 Ile Gly Tyr Ala Asp Gly Tyr Ser Arg Ala Leu Ser Asn Arg Gly Phe 290 295 300 Met Leu Phe Cys Gly Glu Arg Val Pro Ile Ala Gly Arg Val Thr Met 305 310 315 320 Asp Met Thr Met Ile Ser Leu Gly Asp Met Lys Ala Lys Gln Gly Glu 325 330 335 Glu Val Val Ile Tyr Gly Arg Gln Lys Gly Gly Glu Ile Ser Val Asp 340 345 350 Glu Ile Ala Glu Met Leu Asn Thr Ile Asn Tyr Glu Val Val Ala Thr 355 360 365 Leu Ser Arg Arg Val Pro Arg Phe Tyr Arg Arg Gly Gly Gln Met Ile 370 375 380 Lys Ile Ser Thr Pro Val Met Tyr Val 385 390 <210> 59 <211> 393 <212> PRT <213> Bacillus zhangzhouensis <220> <223> CDS yncD <400> 59 Met Ile Lys Leu Cys Arg Glu Val Trp Ile Glu Val Asn Leu Asp Ala 1 5 10 15 Ile Lys Arg Asn Ile Glu Ala Ile Gln Ala His Ile Pro Arg Lys Ser 20 25 30 Lys Ile Met Ala Val Val Lys Ala Asn Ala Tyr Gly His Gly Ser Val 35 40 45 Glu Val Ala Arg Gln Ala Leu Glu Ser Gly Ala Thr Glu Leu Ala Val 50 55 60 Ala Ser Leu Glu Glu Gly Ile Val Leu Arg Arg Ala Lys Ile Glu Ala 65 70 75 80 Pro Ile Leu Val Leu Gly Phe Thr Pro Leu Asp Cys Val Lys Lys Ala 85 90 95 Ala Ala Trp Arg Ile Asp Leu Ser Gly Leu Arg Ala Asp Trp Ile Asn 100 105 110 Gln Ala Asn Ala Ile Leu Ala Glu Glu Glu Ser Gln His Arg Leu Gly 115 120 125 Ile His Val Asn Val Asp Thr Gly Met Gly Arg Leu Gly Val Arg Thr 130 135 140 Lys Glu Glu Leu Leu Glu Val Val Glu Ala Leu Glu Glu Ser Glu Tyr 145 150 155 160 Leu Arg Trp Asp Gly Ile Phe Thr His Phe Ser Thr Ala Asp Glu Pro 165 170 175 Asp Pro Asp Phe Thr Leu Leu Gln His Ser Ile Phe Ile Asp Phe Leu 180 185 190 Arg Phe Leu Lys Lys Gln Gly Ile Pro Leu Pro Thr Val His Met Asn 195 200 205 Asn Thr Ala Ala Ser Ile Ala Phe Pro Glu Phe Ser Ala Asp Met Ile 210 215 220 Arg Leu Gly Ile Gly Leu Tyr Gly Leu Tyr Pro Ser Gln Tyr Ile Glu 225 230 235 240 Ser Leu Asp Ala Val Gln Leu Glu Pro Ala Leu Ser Leu Lys Ala Arg 245 250 255 Ile Ala Phe Val Lys Glu Met Val Thr Lys Pro Arg Thr Val Ser Tyr 260 265 270 Gly Ala Thr Tyr Val Ala Lys Pro Asp Glu Val Ile Ala Thr Ile Pro 275 280 285 Ile Gly Tyr Ala Asp Gly Tyr Ser Arg Ala Leu Ser Asn Arg Gly Phe 290 295 300 Met Leu Phe Arg Gly Lys Arg Val Pro Ile Ala Gly Arg Val Thr Met 305 310 315 320 Asp Met Thr Met Ile Ser Leu Gly Glu Met Lys Ala Lys Gln Gly Glu 325 330 335 Glu Val Val Ile Tyr Gly Arg Gln Lys Gly Gly Asp Ile Ser Val Asp 340 345 350 Glu Ile Ala Glu Met Leu Asn Thr Ile Asn Tyr Glu Val Ile Ala Thr 355 360 365 Leu Ser Arg Arg Val Pro Arg Phe Tyr Arg Arg Gly Gly Lys Ile Ile 370 375 380 Lys Ile Ser Thr Pro Val Met Tyr Val 385 390 <210> 60 <211> 393 <212> PRT <213> Bacillus sonorensis <220> <223> CDS yncD <400> 60 Met Lys Lys Leu Cys Arg Glu Val Trp Ala Glu Val Asp Leu Asp Ala 1 5 10 15 Ile Lys Lys Asn Leu Arg Ala Ile Arg His His Ile Pro Lys Lys Ser 20 25 30 Lys Ile Met Ala Val Val Lys Ala Asn Ala Tyr Gly His Gly Ser Val 35 40 45 Glu Val Ala Arg His Ala Leu Glu His Gly Ala Ser Glu Leu Ala Val 50 55 60 Ala Ser Leu Glu Glu Gly Ile Val Leu Arg Lys Ala Gly Ile Thr Ala 65 70 75 80 Pro Ile Leu Val Leu Gly Phe Thr Pro Leu Arg Cys Val Lys Glu Ser 85 90 95 Ala Ala Trp Asn Ile Thr Leu Ser Ala Phe Gln Val Asp Trp Ile Lys 100 105 110 Glu Ala Asn Glu Ile Leu Glu Lys Glu Ala Glu Thr Asn Arg Leu Asn 115 120 125 Ile His Ile Asn Val Asp Thr Gly Met Gly Arg Leu Gly Val Arg Thr 130 135 140 Lys Glu Lys Leu Leu Glu Ile Val Lys Ala Leu Thr Ala Ser Lys Phe 145 150 155 160 Leu Arg Trp Lys Gly Ile Phe Thr His Phe Ser Thr Ala Asp Glu Pro 165 170 175 Asp Thr Thr Leu Thr Arg Leu Gln His Asp Lys Phe Ile Ser Phe Leu 180 185 190 Arg Phe Leu Lys Asp Gln Gly Phe Glu Leu Pro Thr Val His Met Asn 195 200 205 Asn Thr Ala Ala Ser Ile Ala Phe Pro Glu Phe Ser Ala Asp Met Ile 210 215 220 Arg Leu Gly Ile Gly Met Tyr Gly Leu Tyr Pro Ser Glu Tyr Ile Lys 225 230 235 240 Gln Leu Asn Leu Val Lys Leu Val Pro Ala Leu Ser Leu Lys Ala Arg 245 250 255 Ile Ala Tyr Val Lys Thr Met Leu Thr Glu Pro Arg Thr Ile Ser Tyr 260 265 270 Gly Ala Thr Tyr Ile Ala Glu Pro Gly Glu Val Ile Ala Thr Leu Pro 275 280 285 Val Gly Tyr Ala Asp Gly Tyr Ser Arg Ala Leu Ser Asn Arg Gly Phe 290 295 300 Val Leu His Arg Gly Arg Arg Val Pro Val Ala Gly Arg Val Thr Met 305 310 315 320 Asp Met Ile Met Val Ser Leu Gly Glu Gly Glu Gly Arg Gln Gly Glu 325 330 335 Glu Val Val Ile Tyr Gly Arg Gln Lys Gly Ala Glu Ile Ser Val Asp 340 345 350 Glu Val Ala Asp Met Leu Asp Thr Ile Asn Tyr Glu Val Val Ser Thr 355 360 365 Ile Ser Arg Arg Val Pro Arg Ile Tyr Ile Arg Asp Gly Glu Ile Leu 370 375 380 Lys Val Ser Thr Pro Val Leu Tyr Val 385 390

Claims

적어도 하나의 관심 폴리펩티드를 제조하기 위한 방법으로서, 상기 방법은
a) 적어도 하기 염색체 유전자:
i. 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자, 및
ii. 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자
가 불활성화된 피르미큐테스 (Firmicutes)의 문에 속하는 박테리아 숙주 세포를 제공하는 단계로서, 박테리아 숙주 세포는
1. 적어도 하나의 자율 복제 서열,
2. 프로모터에 작동적으로 연결된, 적어도 하나의 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및
3. 프로모터에 작동적으로 연결된, 제3 알라닌 라세마제를 코딩하는 폴리뉴클레오티드
를 포함하는 플라스미드를 포함하는 것인 단계, 및
b) 박테리아 숙주 세포에서 상기 플라스미드를 유지시키는데 도움이 되고 상기 적어도 하나의 관심 폴리펩티드를 발현시키는데 도움이 되는 조건 하에서, 박테리아 숙주 세포를 배양하여, 상기 적어도 하나의 관심 폴리펩티드를 생산하는 단계
를 포함하는 것인 제조 방법.
제1항에 있어서, 단계 a)는 하기 단계를 포함하는 것인 제조 방법:
a1) 피르미큐테스 (Firmicutes)의 문에 속하는 박테리아 숙주 세포를 제공하는 단계로서, 상기 숙주 세포는 i) 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자, 및 ii) 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자를 포함하는 것인 단계,
a2) 상기 제1 및 상기 제2 염색체 유전자를 불활성화시키는 단계, 및
a3) 상기 박테리아 숙주 세포로
1. 적어도 하나의 자율 복제 서열,
2. 프로모터에 작동적으로 연결된, 적어도 하나의 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및
3. 프로모터에 작동적으로 연결된, 제3 알라닌 라세마제를 코딩하는 폴리뉴클레오티드
를 포함하는 플라스미드를 도입시키는 단계.
제1항 또는 제2항에 있어서, 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자 및 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자는 돌연변이에 의해서 불활성화되었고, 바람직하게, 상기 돌연변이는 상기 제1 및 제2 염색체 유전자의 결실인 제조 방법.
제3항에 있어서, 박테리아 숙주 세포는 바실리 (Bacilli)의 강에 속하고, 예를 들어, 숙주 세포는 바실랄레스 (Bacillales) 또는 락토바실랄레스 (Lactobacillales)의 목에 속하고, 예를 들어, 박테리아 숙주 세포는 바실라세아에 (Bacillaceae) 또는 락토바실라세아에 (Lactobacillaceae)의 과에 속하고, 바람직하게, 박테리아 숙주 세포는 바실러스 (Bacillus) 또는 락토바실러스 (Lactobacillus)의 속에 속하고, 보다 바람직하게, 숙주 세포는 바실러스 푸밀루스 (Bacillus pumilus), 바실러스 세레우스 (Bacillus cereus), 바실러스 벨레젠시스 (Bacillus velezensis), 바실러스 메가테리움 (Bacillus megaterium), 바실러스 리케니포르미스 (Bacillus licheniformis), 바실러스 서브틸리스 (Bacillus subtilis), 바실러스 아트로파에우스 (Bacillus atrophaeus), 바실러스 모자벤시스 (Bacillus mojavensis), 바실러스 소노렌시스 (Bacillus sonorensis), 바실러스 시아메넨시스 (Bacillus xiamenensis) 또는 바실러스 장조우엔시스 (Bacillus zhangzhouensis)의 종에 속하는 것인 제조 방법.
제1항 내지 제4항 중 어느 하나의 항에 있어서, 숙주 세포는 바실러스 리케니포르미스 (Bacillus licheniformis) 숙주 세포이고, 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자는 alr 유전자이고, 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자는 yncD 유전자인 제조 방법.
제1항 내지 제5항 중 어느 하나의 항에 있어서, 제3 알라닌 라세마제를 코딩하는 폴리뉴클레오티드는 박테리아 숙주 세포에 이종성이고/이거나, 적어도 하나의 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드는 박테리아 숙주 세포에 이종성인 제조 방법.
제6항에 있어서, 제3 알라닌 라세마제는 SEQ ID NO: 4와 적어도 40% 동일한 아미노산 서열을 포함하는 것인 제조 방법.
제1항 내지 제7항 중 어느 하나의 항에 있어서, 제3 알라닌 라세마제를 코딩하는 폴리뉴클레오티드에 작동적으로 연결되는 프로모터는 항상성 프로모터인 제조 방법.
제1항 내지 제8항 중 어느 하나의 항에 있어서, 제3 알라닌 라세마제를 코딩하는 폴리뉴클레오티드에 작동적으로 연결되는 프로모터는 비. 서브틸리스 (B. subtilis) alrA 유전자의 프로모터인 제조 방법.
제1항 내지 제9항 중 어느 하나의 항에 있어서, 관심 폴리펩티드는 효소, 바람직하게, 아밀라제, 프로테아제, 리파제, 만나나제, 파이타제, 자일라나제, 포스파타제, 글루코아밀라제, 뉴클레아제, 및 셀룰라제로 이루어진 군으로부터 선택되는 효소이고, 바람직하게 프로테아제는 아미노펩티다제 (EC 3.4.11), 디펩티다제 (EC 3.4.13), 디펩티딜-펩티다제 또는 트리펩티딜-펩티다제 (EC 3.4.14), 펩티딜-디펩티다제 (EC 3.4.15), 세린-유형 카르복시펩티다제 (EC 3.4.16), 메탈로카르복시펩티다제 (EC 3.4.17), 시스테인-유형 카르복시펩티다제 (EC 3.4.18), 오메가 펩티다제 (EC 3.4.19), 세린 엔도펩티다제 (EC 3.4.21), 시스테인 엔도펩티다제 (EC 3.4.22), 아스파르트산 엔도펩티다제 (EC 3.4.23), 메탈로-엔도펩티다제 (EC 3.4.24), 또는 트레오닌 엔도펩티다제 (EC 3.4.25)인 제조 방법.
제1항 내지 제10항 중 어느 하나의 항에 있어서, 관심 폴리펩티드를 정제하는 단계 c)를 더 포함하는 것인 제조 방법.
적어도 하기 염색체 유전자가 불활성화된 피르미큐테스 (Firmicutes)의 문에 속하는 박테리아 숙주 세포:
i. 제1 알라닌 라세마제를 코딩하는 제1 염색체 유전자, 및
ii. 제2 알라닌 라세마제를 코딩하는 제2 염색체 유전자.
제12항에 있어서, 상기 박테리아 숙주 세포는
1. 적어도 하나의 자율 복제 서열,
2. 프로모터에 작동적으로 연결된, 적어도 하나의 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및
3. 프로모터에 작동적으로 연결된, 제3 알라닌 라세마제를 코딩하는 폴리뉴클레오티드
를 포함하는 플라스미드를 포함하는 것인 박테리아 숙주 세포.
제12항에 있어서, 상기 박테리아 숙주 세포는
u) 비-복제성 벡터로서,
u1) 임의로, 플러스 복제 기원 (ori+),
u2) 프로모터에 작동적으로 연결된, 적어도 하나의 관심 폴리펩티드를 코딩하는 폴리뉴클레오티드,
u3) 프로모터에 작동적으로 연결된, 제3 알라닌 라세마제를 코딩하는 폴리뉴클레오티드,
u4) 재조합에 의한 박테리아 숙주 세포의 염색체로 비-복제성 벡터의 통합을 허용하도록 박테리아 숙주 세포의 염색체 폴리뉴클레오티드에 대한 상동성을 갖는 폴리뉴클레오티드
를 포함하는 비-복제성 벡터를 포함하는 것인 박테리아 숙주 세포.
제14항에 있어서, 비-복제성 벡터는 박테리아 숙주 세포에서 상기 벡터를 유지시킬 수 있는 복제 폴리펩티드를 코딩하는 폴리뉴클레오티드가 결여된 것인 박테리아 숙주 세포.
제14항 또는 제15항에 있어서, 상기 박테리아 숙주 세포는
v) 복제성 벡터로서,
v1) 플러스 복제 기원 (ori+),
v2) 프로모터에 작동적으로 연결된, 복제 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및
v3) 임의로, 프로모터에 작동적으로 연결된, 역선택 폴리펩티드를 코딩하는 폴리뉴클레오티드
를 포함하는 복제성 벡터를 더 포함하고, 폴리뉴클레오티드 v2)에 의해 코딩되는 복제 폴리펩티드는 박테리아 숙주 세포에서 비-복제성 벡터 및 복제성 벡터를 유지시킬 수 있는 것인 박테리아 숙주 세포.
제16항에 있어서, 비-복제성 벡터 및 복제성 벡터는 박테리아 숙주 세포에 존재할 때, 비-복제성 및 복제성 벡터를 형성하는 단일 벡터로부터 유래되고,
예를 들어, 상기 단일 벡터는
i) 비-복제성 벡터의 구성요소 u1), u2), u3) 및 u4)를 포함하지만, 복제 폴리펩티드를 코딩하는 폴리뉴클레오티드는 결여된 제1 부분, 및
ii) 복제성 벡터의 구성요소 v1), v2) 및 v3)을 포함하는 제2 부분
을 포함하고,
플러스 복제 기원 u1) 및 플러스 복제 기원 v1)은 동일한 배향으로 단일 벡터에 존재하고,
박테리아 숙주 세포로 상기 단일 벡터의 도입 시, 단일 벡터의 제1 부분은 비-복제성 벡터를 형성하고, 제2 부분은 복제성 벡터를 형성하는 것인 박테리아 숙주 세포.
적어도 하나의 게놈 유전자좌에, 비-복제성 벡터의 다수 카피를 포함하는 박테리아 숙주 세포를 제조하기 위한 방법으로서,
(a) 제12항의 박테리아 숙주 세포를 제공하는 단계,
(b) 상기 박테리아 숙주 세포로,
(b1) 제14항 또는 제15항에 정의된 바와 같은 비-복제성 벡터,
(b2) 제13항 또는 제14항에 정의된 바와 같은 비-복제성 벡터 및 제15항에 정의된 바와 같은 복제성 벡터, 또는
(b3) 제16항에 정의된 바와 같은 단일 벡터
를 도입시키는 단계, 및
(c) 박테리아 숙주 세포의 적어도 하나의 게놈 유전자좌로 단계 (b1) 또는 (b2)에서 도입되거나, 또는 단계 (b3)에서 도입된 단일 벡터로부터 유래된 비-복제성 벡터의 다수 카피의 통합을 허용하는 조건 하에서 숙주 세포를 배양하는 단계, 및 임의로
(d) 적어도 하나의 게놈 유전자좌에, 비-복제성 벡터의 다수 카피를 포함하는 숙주 세포를 선택하는 단계
를 포함하는 것인 제조 방법.
제18항에 있어서, 숙주 세포는 알라닌 라세마제 억제제의 유효량의 존재 하에서 배양되고, 예를 들어, 알라닌 라세마제 억제제는 베타-클로로-D-알라닌이고/이거나, 숙주 세포는 임의로 역선택 폴리펩티드에 대한 역선택제의 유효량의 존재 하에서, 역선택 폴리펩티드를 효과적으로 발현하기 위한 조건 하에서 배양되고, 바람직하게, 역선택 폴리펩티드는 피리미딘 물질대사에 관여하고, 예를 들어, 역선택 폴리펩티드는 시토신 데아미나제이고, 역선택제는 5-플루오로-시토신, 5-플루오로-우리딘 또는 5-플루오로-오로테이트인 제조 방법.