KR102277406B1 - Novel excinuclease ABC subunit A variant and a method for producing L-glutamic acid using the same - Google Patents
Novel excinuclease ABC subunit A variant and a method for producing L-glutamic acid using the same Download PDFInfo
- Publication number
- KR102277406B1 KR102277406B1 KR1020210011243A KR20210011243A KR102277406B1 KR 102277406 B1 KR102277406 B1 KR 102277406B1 KR 1020210011243 A KR1020210011243 A KR 1020210011243A KR 20210011243 A KR20210011243 A KR 20210011243A KR 102277406 B1 KR102277406 B1 KR 102277406B1
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- gly
- ala
- val
- glu
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/77—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/14—Glutamic acid; Glutamine
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
Description
본 출원은 신규한 엑시뉴클레아제 ABC 서브유닛 A 변이체, 상기 변이체를 포함하는 코리네박테리움 글루타미쿰 균주 및 상기 균주를 이용한 L-글루탐산 생산 방법에 관한 것이다. The present application relates to a novel exinuclease ABC subunit A variant, a Corynebacterium glutamicum strain comprising the variant, and a method for producing L-glutamic acid using the strain.
L-아미노산 및 기타 유용물질을 생산하기 위하여, 고효율 생산 미생물 및 발효공정기술 개발을 위한 다양한 연구들이 수행되고 있다. 예를 들어, L-글루탐산 생합성에 관여하는 효소를 코딩하는 유전자의 발현을 증가시키거나 또는 생합성에 불필요한 유전자를 제거하는 것과 같은 목적 물질 특이적 접근 방법이 주로 이용되고 있다(US 8206954 B2).In order to produce L-amino acids and other useful substances, various studies are being conducted for the development of high-efficiency production microorganisms and fermentation process technology. For example, a target substance-specific approach such as increasing the expression of a gene encoding an enzyme involved in L-glutamic acid biosynthesis or removing a gene unnecessary for biosynthesis is mainly used (US 8206954 B2).
다만, L-글루탐산의 수요 증가에 따라 효과적인 L-글루탐산의 생산능 증가를 위한 연구가 여전히 필요한 실정이다.However, as the demand for L-glutamic acid increases, there is still a need for research to effectively increase the production capacity of L-glutamic acid.
본 출원의 하나의 목적은 서열번호 3의 아미노산 서열의 575번째 위치에 상응하는 아미노산인 글리신(glycine)이 아스파르트산(aspartic acid)으로 치환된, 서열번호 1로 기재된 아미노산 서열로 이루어진, 엑시뉴클레아제 ABC 서브유닛 A 변이체를 제공하는 것이다.One object of the present application is that glycine, which is an amino acid corresponding to position 575 of the amino acid sequence of SEQ ID NO: 3, is substituted with aspartic acid, consisting of the amino acid sequence set forth in SEQ ID NO: 1, exinuclea to provide a first ABC subunit A variant.
본 출원의 다른 하나의 목적은 본 출원의 변이체를 코딩하는 폴리뉴클레오티드를 제공하는 것이다.Another object of the present application is to provide a polynucleotide encoding the variant of the present application.
본 출원의 또 다른 하나의 목적은 본 출원의 변이체 또는 상기 변이체를 코딩하는 폴리뉴클레오티드를 포함하고, L-글루탐산 생산능을 가진, 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) 균주를 제공하는 것이다.Another object of the present application is to provide a strain of Corynebacterium glutamicum, which includes the variant of the present application or a polynucleotide encoding the variant, and has L-glutamic acid production ability.
본 출원의 또 다른 하나의 목적은 변이체 또는 상기 변이체를 코딩하는 폴리뉴클레오티드를 포함하고, L-글루탐산 생산능을 가진, 코리네박테리움 글루타미쿰 균주를 배지에서 배양하는 단계를 포함하는, L-글루탐산 생산 방법을 제공하는 것이다.Another object of the present application is to include a variant or a polynucleotide encoding the variant, and having L-glutamic acid-producing ability, including the step of culturing a Corynebacterium glutamicum strain in a medium, L- To provide a method for producing glutamic acid.
이를 구체적으로 설명하면 다음과 같다. 한편, 본 출원에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시 형태에도 적용될 수 있다. 즉, 본 출원에서 개시된 다양한 요소들의 모든 조합이 본 출원의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 출원의 범주가 제한된다고 볼 수 없다. 또한, 본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.This will be described in detail as follows. Meanwhile, each description and embodiment disclosed in the present application may be applied to each other description and embodiment. That is, all combinations of the various elements disclosed in this application fall within the scope of this application. In addition, it cannot be seen that the scope of the present application is limited by the detailed description described below. In addition, a number of papers and patent documents are referenced throughout this specification and their citations are indicated. The disclosure contents of the cited papers and patent documents are incorporated herein by reference in their entirety to more clearly describe the level of the technical field to which the present invention pertains and the content of the present invention.
본 출원의 하나의 양태는 서열번호 3의 아미노산 서열의 575번째 위치에 상응하는 아미노산인 글리신(glycine)이 아스파르트산(aspartic acid)으로 치환된, 서열번호 1로 기재된 아미노산 서열로 이루어진, 변이체를 제공한다. One aspect of the present application provides a variant, consisting of the amino acid sequence set forth in SEQ ID NO: 1, in which glycine, an amino acid corresponding to position 575 of the amino acid sequence of SEQ ID NO: 3, is substituted with aspartic acid do.
본 출원의 변이체는 서열번호 1로 기재된 아미노산 서열을 가지거나 포함하거나, 상기 아미노산 서열로 필수적으로 이루어질(essentially consisting of) 수 있다.The variant of the present application may have or include the amino acid sequence set forth in SEQ ID NO: 1, or may consist essentially of the amino acid sequence.
또한, 본 출원의 변이체는 상기 서열번호 1로 기재된 아미노산 서열에서 서열번호 3의 아미노산 서열을 기준으로 575번 위치에 상응하는 아미노산은 아스파르트산이고, 상기 서열번호 1로 기재된 아미노산 서열과 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.7% 또는 99.9% 이상의 상동성 또는 동일성을 가지는 아미노산 서열을 포함할 수 있다. 또한, 이러한 상동성 또는 동일성을 가지며 본 출원의 변이체에 상응하는 효능을 나타내는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환, 보존적 치환 또는 부가된 아미노산 서열을 갖는 변이체도 본 출원의 범위 내에 포함됨은 자명하다. In addition, in the variant of the present application, the amino acid corresponding to position 575 based on the amino acid sequence of SEQ ID NO: 3 in the amino acid sequence set forth in SEQ ID NO: 1 is aspartic acid, and at least 70% of the amino acid sequence set forth in SEQ ID NO: 1, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.7%, or an amino acid sequence having at least 99.9% homology or identity. In addition, as long as it is an amino acid sequence having such homology or identity and exhibiting efficacy corresponding to the variant of the present application, variants having an amino acid sequence in which some sequences are deleted, modified, substituted, conservatively substituted or added are also included within the scope of the present application. is self-evident
예를 들어, 상기 아미노산 서열 N-말단, C-말단 그리고/또는 내부에 본 출원의 변이체의 기능을 변경하지 않는 서열 추가 또는 결실, 자연적으로 발생할 수 있는 돌연변이, 잠재성 돌연변이 (silent mutation) 또는 보존적 치환을 가지는 경우이다.For example, sequence additions or deletions, naturally occurring mutations, silent mutations or conservation in the N-terminus, C-terminus and/or within the amino acid sequence that do not alter the function of the variants of the present application It is a case of having an enemy substitution.
상기 "보존적 치환(conservative substitution)"은 한 아미노산을 유사한 구조적 및/또는 화학적 성질을 갖는 또 다른 아미노산으로 치환시키는 것을 의미한다. 이러한 아미노산 치환은 일반적으로 잔기의 극성, 전하, 용해도, 소수성, 친수성 및/또는 양친매성(amphipathic nature)에서의 유사성에 근거하여 발생할 수 있다. 통상적으로, 보존적 치환은 단백질 또는 폴리펩티드의 활성에 거의 영향을 미치지 않거나 또는 영향을 미치지 않을 수 있다.The term "conservative substitution" means substituting an amino acid for another amino acid having similar structural and/or chemical properties. Such amino acid substitutions may generally occur based on similarity in polarity, charge, solubility, hydrophobicity, hydrophilicity and/or amphipathic nature of the residues. Typically, conservative substitutions may have little or no effect on the activity of the protein or polypeptide.
본 출원에서 용어, "변이체(variant)"는 하나 이상의 아미노산이 보존적 치환(conservative substitution) 및/또는 변형(modification)되어 상기 변이체의 변이 전 아미노산 서열과 상이하나 기능(functions) 또는 특성(properties)이 유지되는 폴리펩티드를 지칭한다. 이러한 변이체는 일반적으로 상기 폴리펩티드의 아미노산 서열 중 하나 이상의 아미노산을 변형하고, 상기 변형된 폴리펩티드의 특성을 평가하여 동정(identify)될 수 있다. 즉, 변이체의 능력은 변이 전 폴리펩티드에 비하여 증가되거나, 변하지 않거나, 또는 감소될 수 있다. 또한, 일부 변이체는 N-말단 리더 서열 또는 막전이 도메인(transmembrane domain)과 같은 하나 이상의 부분이 제거된 변이체를 포함할 수 있다. 다른 변이체는 성숙 단백질(mature protein)의 N- 및/또는 C-말단으로부터 일부분이 제거된 변이체를 포함할 수 있다. 상기 용어 "변이체"는 변이형, 변형, 변이형 폴리펩티드, 변이된 단백질, 변이 및 변이체 등의 용어(영문 표현으로는 modification, modified polypeptide, modified protein, mutant, mutein, divergent 등)가 혼용되어 사용될 수 있으며, 변이된 의미로 사용되는 용어라면 이에 제한되지 않는다. 본 출원의 목적상 상기 변이체는 서열번호 3의 아미노산 서열의 575번째 위치에 상응하는 아미노산인 글리신이 아스파르트산으로 치환된, 서열번호 1로 기재된 아미노산 서열을 포함하는 폴리펩티드일 수 있다.As used herein, the term "variant" means that one or more amino acids are conservatively substituted and/or modified so that they differ from the amino acid sequence before the mutation of the variant, but have functions or properties. refers to a polypeptide that is maintained. Such variants can generally be identified by modifying one or more amino acids in the amino acid sequence of the polypeptide and evaluating the properties of the modified polypeptide. That is, the ability of the variant may be increased, unchanged, or decreased compared to the polypeptide before the mutation. In addition, some variants may include variants in which one or more portions, such as an N-terminal leader sequence or a transmembrane domain, are removed. Other variants may include variants in which a portion is removed from the N- and/or C-terminus of the mature protein. The term "variant" may be used interchangeably with terms such as mutant, modified, mutant polypeptide, mutated protein, mutant and mutant (in English, modified, modified polypeptide, modified protein, mutant, mutein, divergent, etc.) and, as long as it is a term used in a mutated sense, it is not limited thereto. For the purposes of the present application, the variant may be a polypeptide comprising the amino acid sequence set forth in SEQ ID NO: 1 in which glycine, which is an amino acid corresponding to position 575 of the amino acid sequence of SEQ ID NO: 3, is substituted with aspartic acid.
또한, 변이체는 폴리펩티드의 특성과 2차 구조에 최소한의 영향을 갖는 아미노산들의 결실 또는 부가를 포함할 수 있다. 예를 들면 변이체의 N-말단에는 번역-동시에(co-translationally) 또는 번역-후에(post-translationally) 단백질의 이동(translocation)에 관여하는 시그널(또는 리더) 서열이 컨쥬게이트 될 수 있다. 또한 상기 변이체는 확인, 정제, 또는 합성할 수 있도록 다른 서열 또는 링커와 컨쥬게이트 될 수 있다. In addition, variants may contain deletions or additions of amino acids that have minimal effect on the properties and secondary structure of the polypeptide. For example, a signal (or leader) sequence involved in protein translocation may be conjugated to the N-terminus of the mutant, either co-translationally or post-translationally. The variants may also be conjugated with other sequences or linkers for identification, purification, or synthesis.
본 출원에서 용어, '상동성 (homology)' 또는 '동일성 (identity)'은 두 개의 주어진 아미노산 서열 또는 염기 서열 상호간 유사한 정도를 의미하며 백분율로 표시될 수 있다. 용어 상동성 및 동일성은 종종 상호교환적으로 이용될 수 있다.As used herein, the term 'homology' or 'identity' refers to the degree of similarity between two given amino acid sequences or nucleotide sequences and may be expressed as a percentage. The terms homology and identity can often be used interchangeably.
보존된(conserved) 폴리뉴클레오티드 또는 폴리펩티드의 서열 상동성 또는 동일성은 표준 배열 알고리즘에 의해 결정되며, 사용되는 프로그램에 의해 확립된 디폴트 갭 페널티가 함께 이용될 수 있다. 실질적으로, 상동성을 갖거나(homologous) 또는 동일한(identical) 서열은 일반적으로 서열 전체 또는 일부분과 중간 또는 높은 엄격한 조건(stringent conditions)에서 하이브리드할 수 있다. 하이브리드화는 폴리뉴클레오티드에서 일반 코돈 또는 코돈 축퇴성을 고려한 코돈을 함유하는 폴리뉴클레오티드와의 하이브리드화 역시 포함됨이 자명하다.Sequence homology or identity of a conserved polynucleotide or polypeptide is determined by standard alignment algorithms, with default gap penalties established by the program used may be used. Substantially homologous or identical sequences are generally capable of hybridizing with all or part of the sequence under moderate or high stringent conditions. It is apparent that hybridization also includes hybridization with a polynucleotide containing a common codon in a polynucleotide or a codon in consideration of codon degeneracy.
임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는, 예를 들어, Pearson et al (1988) [Proc. Natl. Acad. Sci. USA 85]: 2444에서와 같은 디폴트 파라미터를 이용하여 "FASTA" 프로그램과 같은 공지의 컴퓨터 알고리즘을 이용하여 결정될 수 있다. 또는, EMBOSS 패키지의 니들만 프로그램(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277)(버전 5.0.0 또는 이후 버전)에서 수행되는 바와 같은, 니들만-운치(Needleman-Wunsch) 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)이 사용되어 결정될 수 있다(GCG 프로그램 패키지 (Devereux, J., et al, Nucleic Acids Research 12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop, [ED.,] Academic Press, San Diego,1994, 및 [CARILLO ETA/.](1988) SIAM J Applied Math 48: 1073을 포함한다). 예를 들어, 국립 생물공학 정보 데이터베이스 센터의 BLAST, 또는 ClustalW를 이용하여 상동성, 유사성 또는 동일성을 결정할 수 있다.Whether any two polynucleotide or polypeptide sequences have homology, similarity or identity can be determined, for example, by Pearson et al (1988) [Proc. Natl. Acad. Sci. USA 85]: 2444, using a known computer algorithm such as the “FASTA” program. or, as performed in the Needleman program of the EMBOSS package (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277) (version 5.0.0 or later), Needleman-Wunsch algorithm (Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453) can be used to determine (GCG program package (Devereux, J., et al, Nucleic Acids) Research 12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop , [ED.,] Academic Press, San Diego, 1994, and [CARILLO ETA/.] (1988) SIAM J Applied Math 48: 1073).For example, BLAST of the National Center for Biotechnology Information Database, or ClustalW can be used to determine homology, similarity or identity.
폴리뉴클레오티드 또는 폴리펩티드의 상동성, 유사성 또는 동일성은, 예를 들어, Smith and Waterman, Adv. Appl. Math (1981) 2:482 에 공지된 대로, 예를 들면, Needleman et al. (1970), J Mol Biol. 48:443과 같은 GAP 컴퓨터 프로그램을 이용하여 서열 정보를 비교함으로써 결정될 수 있다. 요약하면, GAP 프로그램은 두 서열 중 더 짧은 것에서의 기호의 전체 수로, 유사한 배열된 기호(즉, 뉴클레오티드 또는 아미노산)의 수를 나눈 값으로 정의할 수 있다. GAP 프로그램을 위한 디폴트 파라미터는 (1) 이진법 비교 매트릭스(동일성을 위해 1 그리고 비-동일성을 위해 0의 값을 함유함) 및 Schwartz and Dayhoff, eds., Atlas Of Protein Sequence And Structure, National Biomedical Research Foundation, pp. 353-358 (1979)에 의해 개시된 대로, Gribskov et al(1986) Nucl. Acids Res. 14: 6745의 가중된 비교 매트릭스 (또는 EDNAFULL (NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스); (2) 각 갭을 위한 3.0의 페널티 및 각 갭에서 각 기호를 위한 추가의 0.10 페널티 (또는 갭 개방 패널티 10, 갭 연장 패널티 0.5); 및 (3) 말단 갭을 위한 무 페널티를 포함할 수 있다.Homology, similarity or identity of polynucleotides or polypeptides is described, for example, in Smith and Waterman, Adv. Appl. Math (1981) 2:482, see, for example, Needleman et al. (1970), J Mol Biol. can be determined by comparing sequence information using a GAP computer program such as 48:443. In summary, a GAP program can be defined as the total number of symbols in the shorter of the two sequences divided by the number of similarly aligned symbols (ie, nucleotides or amino acids). Default parameters for the GAP program are: (1) a binary comparison matrix (containing values of 1 for identity and 0 for non-identity) and Schwartz and Dayhoff, eds., Atlas Of Protein Sequence And Structure, National Biomedical Research Foundation , pp. 353-358 (1979), Gribskov et al (1986) Nucl. Acids Res. 14: weighted comparison matrix of 6745 (or EDNAFULL (EMBOSS version of NCBI NUC4.4) substitution matrix); (2) a penalty of 3.0 for each gap and an additional 0.10 penalty for each symbol in each gap (or a gap opening penalty of 10, a gap extension penalty of 0.5); and (3) no penalty for end gaps.
본 출원의 일 예로, 본 출원의 변이체는 엑시뉴클레아제 ABC 서브유닛 A 활성을 가질 수 있다. 또한, 본 출원의 변이체는 엑시뉴클레아제 ABC 서브유닛 A 활성을 갖는 야생형 폴리펩티드에 비해 L-글루탐산 생산능이 증가되도록 하는 활성을 가질 수 있다. As an example of the present application, the variant of the present application may have exinuclease ABC subunit A activity. In addition, the mutant of the present application may have an activity such that the ability to produce L-glutamic acid is increased compared to the wild-type polypeptide having exinuclease ABC subunit A activity.
본 출원에서 용어, "엑시뉴클레아제 ABC 서브유닛 A(Excinuclease ABC subunit A)"는 UV 손상에 의한 DNA를 수선하는 폴리펩티드이다. 구체적으로, 본 출원의 엑시뉴클레아제 ABC 서브유닛 A는 엑시젼 뉴클라아제 서브유닛 A, UvrABC 엔도뉴클레아제 서브유닛 A 또는 UvrA로 혼용하여 사용될 수 있다. 본 출원에서 상기 엑시뉴클레아제 ABC 서브유닛 A는 공지의 데이터 베이스인 NCBI의 GenBank에서 그 서열을 얻을 수 있다. 구체적으로 uvrA에 의해 코딩되는 엑시뉴클레아제 ABC 서브유닛 A 활성을 갖는 폴리펩티드일 수 있으나, 이에 제한되지 않는다. As used herein, the term "Excinuclease ABC subunit A" is a polypeptide that repairs DNA caused by UV damage. Specifically, exinuclease ABC subunit A of the present application may be used interchangeably as exciton nuclease subunit A, UvrABC endonuclease subunit A, or UvrA. In the present application, the sequence of the exinuclease ABC subunit A can be obtained from GenBank of NCBI, a known database. Specifically, it may be a polypeptide having exinuclease ABC subunit A activity encoded by uvrA, but is not limited thereto.
본 출원에서, 용어 "상응하는(corresponding to)"은, 폴리펩티드에서 열거되는 위치의 아미노산 잔기이거나, 또는 폴리펩티드에서 열거되는 잔기와 유사하거나 동일하거나 상동한 아미노산 잔기를 지칭한다. 상응하는 위치의 아미노산을 확인하는 것은 특정 서열을 참조하는 서열의 특정 아미노산을 결정하는 것일 수 있다. 본 출원에 사용된 "상응 영역"은 일반적으로 관련 단백질 또는 참조 (reference) 단백질에서의 유사하거나 대응되는 위치를 지칭한다. As used herein, the term “corresponding to” refers to an amino acid residue at a listed position in a polypeptide, or an amino acid residue that is similar, identical to, or homologous to a listed residue in a polypeptide. Identifying the amino acid at the corresponding position may be determining the specific amino acid of a sequence that refers to the specific sequence. As used herein, "corresponding region" generally refers to a similar or corresponding position in a related or reference protein.
예를 들어, 임의의 아미노산 서열을 서열번호 3과 정렬(align)하고, 이를 토대로 상기 아미노산 서열의 각 아미노산 잔기는 서열번호 3의 아미노산 잔기와 상응하는 아미노산 잔기의 숫자 위치를 참조하여 넘버링 할 수 있다. 예를 들어, 본 출원에 기재된 것과 같은 서열 정렬 알고리즘은, 쿼리 시퀀스("참조 서열"이라고도 함)와 비교하여 아미노산의 위치, 또는 치환, 삽입 또는 결실 등의 변형이 발생하는 위치를 확인할 수 있다.For example, any amino acid sequence is aligned with SEQ ID NO: 3, and based on this, each amino acid residue of the amino acid sequence can be numbered with reference to the numerical position of the amino acid residue corresponding to the amino acid residue of SEQ ID NO: 3 . For example, a sequence alignment algorithm such as that described in this application can identify the position of an amino acid, or a position at which modifications, such as substitutions, insertions, or deletions, occur compared to a query sequence (also referred to as a "reference sequence").
이러한 정렬에는 예를 들어 Needleman-Wunsch 알고리즘 (Needleman 및 Wunsch, 1970, J. Mol. Biol. 48: 443-453), EMBOSS 패키지의 Needle 프로그램 (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000), Trends Genet. 16: 276-277) 등을 이용할 수 있으나, 이에 제한되지 않고 당업계에 알려진 서열 정렬 프로그램, 쌍 서열(pairwise sequence) 비교 알고리즘 등을 적절히 사용할 수 있다.Such alignments include, for example, the Needleman-Wunsch algorithm (Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453), the Needle program in the EMBOSS package (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al. , 2000), Trends Genet. 16: 276-277), etc., but is not limited thereto, and a sequence alignment program, pairwise sequence comparison algorithm, etc. known in the art may be appropriately used.
본 출원의 다른 하나의 양태는 본 출원의 변이체를 코딩하는 폴리뉴클레오티드를 제공하는 것이다.Another aspect of the present application is to provide a polynucleotide encoding the variant of the present application.
본 출원에서 용어, "폴리뉴클레오티드"는 뉴클레오티드 단위체(monomer)가 공유결합에 의해 길게 사슬모양으로 이어진 뉴클레오티드의 중합체(polymer)로 일정한 길이 이상의 DNA 또는 RNA 가닥으로서, 보다 구체적으로는 상기 변이체를 코딩하는 폴리뉴클레오티드 단편을 의미한다.As used herein, the term "polynucleotide" refers to a DNA or RNA strand of a certain length or longer as a polymer of nucleotides in which nucleotide monomers are linked in a long chain by covalent bonds, and more specifically, encoding the variant. polynucleotide fragments.
본 출원의 변이체를 코딩하는 폴리뉴클레오티드는 서열번호 1으로 기재된 아미노산 서열을 코딩하는 염기서열을 포함할 수 있다. 본 출원의 일 예로, 본 출원의 폴리뉴클레오티드는 서열번호 2의 서열을 가지거나 포함할 수 있다. 또한, 본 출원의 폴리뉴클레오티드는 서열번호 2의 서열로 이루어지거나, 필수적으로 구성될 수 있다. The polynucleotide encoding the variant of the present application may include a nucleotide sequence encoding the amino acid sequence set forth in SEQ ID NO: 1. As an example of the present application, the polynucleotide of the present application may have or include the sequence of SEQ ID NO: 2. In addition, the polynucleotide of the present application may consist of, or consist essentially of, the sequence of SEQ ID NO: 2.
본 출원의 폴리뉴클레오티드는 코돈의 축퇴성(degeneracy) 또는 본 출원의 변이체를 발현시키고자 하는 생물에서 선호되는 코돈을 고려하여, 본 출원의 변이체의 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. 구체적으로, 본 출원의 폴리뉴클레오티드는 서열번호 2의 서열과 상동성 또는 동일성이 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열을 가지거나 포함하거나, 또는 서열번호 2의 서열과 상동성 또는 동일성이 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 및 100% 미만인 염기서열로 이루어지거나 필수적으로 이루어질 수 있으나, 이에 제한되지 않는다. 이때, 상기 상동성 또는 동일성을 갖는 서열에서, 서열번호 1의 575번째 위치에 상응하는 아미노산을 코딩하는 코돈은, 아스파르트산을 코딩하는 코돈 중 하나일 수 있다.In consideration of codon degeneracy or preferred codons in organisms that want to express the variants of the present application, the polynucleotides of the present application are various in the coding region within the range that does not change the amino acid sequence of the variants of the present application. Deformation can be made. Specifically, the polynucleotide of the present application has 70% or more, 75% or more, 80% or more, 85% or more, 90% or more, 95% or more, 96% or more, 97% or more homology or identity to the sequence of SEQ ID NO: 2 Having or including a nucleotide sequence that is more than, 98% or more, and less than 100%, or homology or identity with the sequence of SEQ ID NO: 2 is 70% or more, 75% or more, 80% or more, 85% or more, 90% or more, 95% or more, 96% or more, 97% or more, 98% or more, and less than 100% of the base sequence may consist of or consist essentially of, but is not limited thereto. In this case, in the sequence having the homology or identity, the codon encoding the amino acid corresponding to the 575th position of SEQ ID NO: 1 may be one of the codons encoding aspartic acid.
또한, 본 출원의 폴리뉴클레오티드는 공지의 유전자 서열로부터 제조될 수 있는 프로브, 예를 들면, 본 출원의 폴리뉴클레오티드 서열의 전체 또는 일부에 대한 상보 서열과 엄격한 조건 하에 하이드리드화할 수 있는 서열이라면 제한없이 포함될 수 있다. 상기 "엄격한 조건(stringent condition)"이란 폴리뉴클레오티드 간의 특이적 혼성화를 가능하게 하는 조건을 의미한다. 이러한 조건은 문헌(J. Sambrook et al.,Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; F.M. Ausubel et al.,Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York, 9.50-9.51, 11.7-11.8 참조)에 구체적으로 기재되어 있다. 예를 들어, 상동성 또는 동일성이 높은 폴리뉴클레오티드끼리, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 상동성 또는 동일성을 갖는 폴리뉴클레오티드끼리 하이브리드화하고, 그보다 상동성 또는 동일성이 낮은 폴리뉴클레오티드끼리 하이브리드화하지 않는 조건, 또는 통상의 써던 하이브리드화(southern hybridization)의 세척 조건인 60℃, 1×SSC, 0.1% SDS, 구체적으로 60℃, 0.1×SSC, 0.1% SDS, 보다 구체적으로 68℃, 0.1×SSC, 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 구체적으로 2회 내지 3회 세정하는 조건을 열거할 수 있다.In addition, the polynucleotide of the present application is a probe that can be prepared from a known gene sequence, for example, a sequence that can hybridize under stringent conditions with a sequence complementary to all or part of the polynucleotide sequence of the present application, without limitation. may be included. The "stringent condition" refers to a condition that enables specific hybridization between polynucleotides. These conditions are described in J. Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory press, Cold Spring Harbor, New York, 1989; FM Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, Inc., New York, 9.50-9.51, 11.7-11.8). For example, polynucleotides with high homology or identity, 70% or more, 75% or more, 80% or more, 85% or more, 90% or more, 95% or more, 96% or more, 97% or more, 98% or more, or a condition in which polynucleotides having 99% or more homology or identity hybridize with each other, and polynucleotides having lower homology or identity do not hybridize, or 60 ° C., which is a washing condition of conventional Southern hybridization, 1×SSC, 0.1% SDS, specifically 60°C, 0.1×SSC, 0.1% SDS, more specifically 68°C, 0.1×SSC, 0.1% SDS at a salt concentration and temperature equivalent to once, specifically twice The conditions for washing to 3 times can be enumerated.
혼성화는 비록 혼성화의 엄격도에 따라 염기 간의 미스매치(mismatch)가 가능할지라도, 두 개의 핵산이 상보적 서열을 가질 것을 요구한다. 용어, "상보적"은 서로 혼성화가 가능한 뉴클레오티드 염기 간의 관계를 기술하는데 사용된다. 예를 들면, DNA에 관하여, 아데닌은 티민에 상보적이며 시토신은 구아닌에 상보적이다. 따라서, 본 출원의 폴리뉴클레오티드는 또한 실질적으로 유사한 핵산 서열뿐만 아니라 전체 서열에 상보적인 단리된 핵산 단편을 포함할 수 있다.Hybridization requires that two nucleic acids have complementary sequences, although mismatch between bases is possible depending on the stringency of hybridization. The term "complementary" is used to describe the relationship between nucleotide bases capable of hybridizing to each other. For example, with respect to DNA, adenine is complementary to thymine and cytosine is complementary to guanine. Accordingly, the polynucleotides of the present application may also include substantially similar nucleic acid sequences as well as isolated nucleic acid fragments complementary to the overall sequence.
구체적으로, 본 출원의 폴리뉴클레오티드와 상동성 또는 동일성을 가지는 폴리뉴클레오티드는 55 ℃의 Tm 값에서 혼성화 단계를 포함하는 혼성화 조건을 사용하고 상술한 조건을 사용하여 탐지할 수 있다. 또한, 상기 Tm 값은 60 ℃, 63 ℃ 또는 65 ℃일 수 있으나, 이에 제한되는 것은 아니고 그 목적에 따라 당업자에 의해 적절히 조절될 수 있다.Specifically, a polynucleotide having homology or identity to the polynucleotide of the present application can be detected using the hybridization conditions including a hybridization step at a Tm value of 55° C. and using the above-described conditions. In addition, the Tm value may be 60 °C, 63 °C or 65 °C, but is not limited thereto and may be appropriately adjusted by those skilled in the art according to the purpose.
상기 폴리뉴클레오티드를 혼성화하는 적절한 엄격도는 폴리뉴클레오티드의 길이 및 상보성 정도에 의존하고 변수는 해당기술분야에 잘 알려져 있다(예컨대, J. Sambrook et al., 상동).The appropriate stringency for hybridizing the polynucleotides depends on the length of the polynucleotides and the degree of complementarity, and the parameters are well known in the art (eg, J. Sambrook et al., supra).
본 출원의 또 다른 하나의 양태는 본 출원의 폴리뉴클레오티드를 포함하는 벡터를 제공하는 것이다. 상기 벡터는 상기 폴리뉴클레오티드를 숙주세포에서 발현시키기 위한 발현 벡터일 수 있으나, 이에 제한되지 않는다.Another aspect of the present application is to provide a vector comprising the polynucleotide of the present application. The vector may be an expression vector for expressing the polynucleotide in a host cell, but is not limited thereto.
본 출원의 벡터는 적합한 숙주 내에서 목적 폴리펩티드를 발현시킬 수 있도록 적합한 발현조절영역(또는 발현조절서열)에 작동 가능하게 연결된 상기 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드의 염기서열을 포함하는 DNA 제조물을 포함할 수 있다. 상기 발현조절영역은 전사를 개시할 수 있는 프로모터, 그러한 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합부위를 코딩하는 서열, 및 전사 및 해독의 종결을 조절하는 서열을 포함할 수 있다. 벡터는 적당한 숙주세포 내로 형질전환된 후, 숙주 게놈과 무관하게 복제되거나 기능할 수 있으며, 게놈 그 자체에 통합될 수 있다.The vector of the present application may include a DNA preparation comprising a base sequence of a polynucleotide encoding the target polypeptide operably linked to a suitable expression control region (or expression control sequence) so that the target polypeptide can be expressed in a suitable host. can The expression control region may include a promoter capable of initiating transcription, an optional operator sequence for regulating such transcription, a sequence encoding a suitable mRNA ribosome binding site, and a sequence regulating the termination of transcription and translation. After transformation into a suitable host cell, the vector can replicate or function independently of the host genome, and can be integrated into the genome itself.
본 출원에서 사용되는 벡터는 특별히 한정되지 않으며, 당업계에 알려진 임의의 벡터를 이용할 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스 및 박테리오파지를 들 수 있다. 예를 들어, 파지 벡터 또는 코스미드 벡터로서 pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, 및 Charon21A 등을 사용할 수 있으며, 플라스미드 벡터로서 pDZ계, pBR계, pUC계, pBluescriptII계, pGEM계, pTZ계, pCL계 및 pET계 등을 사용할 수 있다. 구체적으로는 pDZ, pDC, pDCM2, pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118, pCC1BAC 벡터 등을 사용할 수 있다.The vector used in the present application is not particularly limited, and any vector known in the art may be used. Examples of commonly used vectors include plasmids, cosmids, viruses and bacteriophages in a natural or recombinant state. For example, pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, and Charon21A may be used as phage vectors or cosmid vectors, and pDZ-based, pBR-based, and pUC-based plasmid vectors may be used. , pBluescript II-based, pGEM-based, pTZ-based, pCL-based, pET-based and the like can be used. Specifically, pDZ, pDC, pDCM2, pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118, pCC1BAC vectors and the like can be used.
일례로 세포 내 염색체 삽입용 벡터를 통해 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드를 염색체 내로 삽입할 수 있다. 상기 폴리뉴클레오티드의 염색체 내로의 삽입은 당업계에 알려진 임의의 방법, 예를 들면, 상동재조합(homologous recombination)에 의하여 이루어질 수 있으나, 이에 한정되지는 않는다. 상기 염색체 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 벡터로 형질전환된 세포를 선별, 즉 목적 핵산 분자의 삽입 여부를 확인하기 위한 것으로, 약물 내성, 영양 요구성, 세포 독성제에 대한 내성 또는 표면 폴리펩티드의 발현과 같은 선택가능 표현형을 부여하는 마커들이 사용될 수 있다. 선택제(selective agent)가 처리된 환경에서는 선별 마커를 발현하는 세포만 생존하거나 다른 표현 형질을 나타내므로, 형질전환된 세포를 선별할 수 있다.For example, a polynucleotide encoding a target polypeptide may be inserted into a chromosome through a vector for intracellular chromosome insertion. The insertion of the polynucleotide into the chromosome may be performed by any method known in the art, for example, homologous recombination, but is not limited thereto. It may further include a selection marker (selection marker) for confirming whether the chromosome is inserted. The selection marker is used to select cells transformed with the vector, that is, to determine whether a target nucleic acid molecule is inserted, and selectable phenotypes such as drug resistance, auxotrophy, resistance to cytotoxic agents, or surface polypeptide expression. Markers to be given can be used. In an environment treated with a selective agent, only the cells expressing the selectable marker survive or exhibit other expression traits, so that the transformed cells can be selected.
본 출원에서 용어 "형질전환"은 표적 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 숙주세포 혹은 미생물 내에 도입하여 숙주세포 내에서 상기 폴리뉴클레오티드가 코딩하는 폴리펩티드가 발현할 수 있도록 하는 것을 의미한다. 형질전환된 폴리뉴클레오티드는 숙주세포 내에서 발현될 수 있기만 한다면, 숙주세포의 염색체 내에 삽입되어 위치하거나 염색체 외에 위치하거나 상관없이 이들 모두를 포함할 수 있다. 또한, 상기 폴리뉴클레오티드는 목적 폴리펩티드를 코딩하는 DNA 및/또는 RNA를 포함한다. 상기 폴리뉴클레오티드는 숙주세포 내로 도입되어 발현될 수 있는 것이면, 어떠한 형태로도 도입될 수 있다. 예를 들면, 상기 폴리뉴클레오티드는 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체인 발현 카세트(expression cassette)의 형태로 숙주세포에 도입될 수 있다. 상기 발현 카세트는 통상 상기 폴리뉴클레오티드에 작동 가능하게 연결되어 있는 프로모터(promoter), 전사 종결신호, 리보좀 결합부위 및 번역 종결신호를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 또한, 상기 폴리뉴클레오티드는 그 자체의 형태로 숙주세포에 도입되어 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있으며, 이에 제한되지 않는다.As used herein, the term “transformation” refers to introducing a vector including a polynucleotide encoding a target polypeptide into a host cell or microorganism so that the polypeptide encoded by the polynucleotide can be expressed in the host cell. The transformed polynucleotide may include all of them regardless of whether they are inserted into the chromosome of the host cell or located outside the chromosome, as long as they can be expressed in the host cell. In addition, the polynucleotide includes DNA and/or RNA encoding a target polypeptide. The polynucleotide may be introduced in any form as long as it can be introduced and expressed into a host cell. For example, the polynucleotide may be introduced into a host cell in the form of an expression cassette, which is a gene construct including all elements necessary for self-expression. The expression cassette may include a promoter operably linked to the polynucleotide, a transcription termination signal, a ribosome binding site, and a translation termination signal. The expression cassette may be in the form of an expression vector capable of self-replication. In addition, the polynucleotide may be introduced into a host cell in its own form and operably linked to a sequence required for expression in the host cell, but is not limited thereto.
또한, 상기에서 용어 "작동 가능하게 연결"된 것이란 본 출원의 목적 변이체를 코딩하는 폴리뉴클레오티드의 전사를 개시 및 매개하도록 하는 프로모터 서열과 상기 폴리뉴클레오티드 서열이 기능적으로 연결되어 있는 것을 의미한다.In addition, the term “operably linked” as used herein means that a promoter sequence that initiates and mediates transcription of a polynucleotide encoding the target variant of the present application and the polynucleotide sequence are functionally linked.
본 출원의 또 다른 하나의 양태는 본 출원의 변이체 또는 본 출원의 폴리뉴클레오티드를 포함하는, 코리네박테리움 글루타미쿰(Corynebacterium glutamicum) 균주를 제공하는 것이다. Another aspect of the present application, Corynebacterium glutamicum ( Corynebacterium glutamicum ) It is to provide a strain comprising the mutant of the present application or the polynucleotide of the present application.
본 출원의 균주는 본 출원의 변이형 폴리펩티드, 상기 폴리펩티드를 암호화하는 폴리뉴클레오티드, 또는 본 출원의 폴리뉴클레오티드를 포함하는 벡터를 포함할 수 있다.The strain of the present application may include a vector comprising the variant polypeptide of the present application, a polynucleotide encoding the polypeptide, or the polynucleotide of the present application.
본 출원에서 용어, "균주(또는, 미생물)"는 야생형 미생물이나 자연적 또는 인위적으로 유전적 변형이 일어난 미생물을 모두 포함하며, 외부 유전자가 삽입되거나 내재적 유전자의 활성이 강화되거나 불활성화되는 등의 원인으로 인해서 특정 기작이 약화되거나 강화된 미생물로서, 목적하는 폴리펩티드, 단백질 또는 산물의 생산을 위하여 유전적 변형(modification)을 포함하는 미생물일 수 있다.As used herein, the term "strain (or microorganism)" includes both wild-type microorganisms or microorganisms in which genetic modification has occurred naturally or artificially, and causes such as insertion of an external gene or enhanced or inactivated activity of an intrinsic gene Due to this, as a microorganism with a weakened or enhanced specific mechanism, it may be a microorganism containing genetic modification for the production of a desired polypeptide, protein or product.
본 출원의 균주는 본 출원의 변이체, 본 출원의 폴리뉴클레오티드 및 본 출원의 폴리뉴클레오티드를 포함하는 벡터 중 어느 하나 이상을 포함하는 균주; 본 출원의 변이체 또는 본 출원의 폴리뉴클레오티드를 발현하도록 변형된 균주; 본 출원의 변이체, 또는 본 출원의 폴리뉴클레오티드를 발현하는 균주 (예컨대, 재조합 균주); 또는 본 출원의 변이체 활성을 갖는 균주 (예컨대, 재조합 균주)일 수 있으나, 이에 제한되지 않는다.The strain of the present application includes a strain comprising any one or more of a mutant of the present application, a polynucleotide of the present application, and a vector including the polynucleotide of the present application; a strain modified to express a variant of the present application or a polynucleotide of the present application; a variant of the present application, or a strain expressing the polynucleotide of the present application (eg, a recombinant strain); Or it may be a strain having the mutant activity of the present application (eg, a recombinant strain), but is not limited thereto.
본 출원의 균주는 L-글루탐산 생산능을 가진 균주일 수 있다.The strain of the present application may be a strain having the ability to produce L-glutamic acid.
본 출원의 균주는 자연적으로 엑시뉴클레아제 ABC 서브유닛 A 또는 L-글루탐산 생산능을 가지고 있는 미생물, 또는 엑시뉴클레아제 ABC 서브유닛 A 또는 L-글루탐산 생산능이 없는 모균주에 본 출원의 변이체 또는 이를 코딩하는 폴리뉴클레오티드 (또는 상기 폴리뉴클레오티드를 포함하는 벡터)가 도입되거나 및/또는 L-글루탐산 생산능이 부여된 미생물일 수 있으나 이에 제한되지 않는다. The strain of the present application is a microorganism naturally having exinuclease ABC subunit A or L-glutamic acid producing ability, or a mutant or It may be a microorganism into which a polynucleotide encoding the same (or a vector including the polynucleotide) has been introduced and/or imparted with L-glutamic acid production ability, but is not limited thereto.
일 예로, 본 출원의 균주는 본 출원의 폴리뉴클레오티드 또는 본 출원의 변이체를 코딩하는 폴리뉴클레오티드를 포함하는 벡터로 형질전환되어, 본 출원의 변이체를 발현하는 세포 또는 미생물로서, 본 출원의 목적상 본 출원의 균주는 본 출원의 변이체를 포함하여 L-글루탐산을 생산할 수 있는 미생물을 모두 포함할 수 있다. 예를 들어, 본 출원의 균주는 천연의 야생형 미생물 또는 L-글루탐산을 생산하는 미생물에 본 출원의 변이체를 코딩하는 폴리뉴클레오티드가 도입됨으로써 엑시뉴클레아제 ABC 서브유닛 A 변이체가 발현되어, L-글루탐산 생산능이 증가된 재조합 균주일 수 있다. 상기 L-글루탐산 생산능이 증가된 재조합 균주는, 천연의 야생형 미생물 또는 엑시뉴클레아제 ABC 서브유닛 A 비변형 미생물 (즉, 야생형 엑시뉴클레아제 ABC 서브유닛 A(서열번호 3)를 발현하는 미생물 또는 변이형(서열번호 1) 단백질을 발현하지 않는 미생물)에 비하여 L-글루탐산 생산능이 증가된 미생물일 수 있으나, 이에 제한되는 것은 아니다. 그 예로, 상기 L-글루탐산 생산능의 증가 여부를 비교하는 대상 균주인, 엑시뉴클레아제 ABC 서브유닛 A 비변형 미생물은 ATCC13869 균주 또는 ATCC13869 △odhA 균주(Appl Environ Microbiol. 2007 Feb;73(4):1308-19. Epub 2006 Dec 8.) 일 수 있으나, 이에 제한되지 않는다.As an example, the strain of the present application is transformed with a vector containing the polynucleotide of the present application or a polynucleotide encoding the variant of the present application, and expresses the variant of the present application as a cell or microorganism, The strains of the application may include all microorganisms capable of producing L-glutamic acid, including the variants of the present application. For example, in the strain of the present application, the exinuclease ABC subunit A variant is expressed by introducing a polynucleotide encoding the variant of the present application into a natural wild-type microorganism or a microorganism producing L-glutamic acid, and L-glutamic acid It may be a recombinant strain with increased production capacity. The recombinant strain having an increased ability to produce L-glutamic acid is a natural wild-type microorganism or exinuclease ABC subunit A unmodified microorganism (ie, a microorganism expressing wild-type exinuclease ABC subunit A (SEQ ID NO: 3) or The mutant (SEQ ID NO: 1) may be a microorganism having an increased ability to produce L-glutamic acid compared to a microorganism that does not express the protein, but is not limited thereto. For example, the target strain, exinuclease ABC subunit A unmodified microorganism for comparing the increase in the L-glutamic acid production ability, is the ATCC13869 strain or the ATCC13869 ΔodhA strain (Appl Environ Microbiol. 2007 Feb; 73(4)) :1308-19. Epub 2006 Dec 8.), but is not limited thereto.
일 예로, 상기 생산능이 증가된 재조합 균주는 변이 전 모균주 또는 비변형 미생물의 L-글루탐산 생산능에 비하여 약 1% 이상, 구체적으로는 1% 이상, 약 2.5% 이상, 약 5% 이상, 약 6% 이상, 약 7% 이상, 약 8% 이상, 약 9% 이상, 약 10% 이상, 약 10.5% 이상, 약 11% 이상, 약 11.5%이상, 약 12% 이상, 약 12.5% 이상, 약 13% 이상, 약 13.5% 이상, 약 14% 이상, 약 14.5% 이상, 약 15% 이상, 약 15.5% 이상, 약 16% 이상, 약 16.5% 이상, 약 17% 이상, 약 17.5% 이상, 약 18% 이상, 약 18.5% 이상, 약 19% 이상, 약 19.5% 이상, 약 20% 이상, 약 20.5% 이상 또는 약 21% 이상 (상한값은 특별한 제한은 없으며, 예컨대, 약 200% 이하, 약 150% 이하, 약 100% 이하, 약 50% 이하, 약 45% 이하, 약 40% 이하, 약 35% 이하, 약 30% 이하, 약 25% 이하 또는 약 22% 이하 일 수 있음)증가된 것일 수 있으나, 변이 전 모균주 또는 비변형 미생물의 생산능에 비해 +값의 증가량을 갖는 한, 이에 제한되지 않는다. 다른 예에서, 상기 생산능이 증가된 재조합 균주는 변이 전 모균주 또는 비변형 미생물에 비하여, L-글루탐산 생산능이 약 1.1배 이상, 약 1.12배 이상, 약 1.13배 이상, 1.15배 이상, 1.16배 이상, 1.17배 이상, 1.18배 이상, 1.19배 이상, 1.2배 이상 또는 1.21배 이상 (상한값은 특별한 제한은 없으며, 예컨대, 약 10배 이하, 약 5배 이하, 약 3배 이하 또는 약 2배 이하일 수 있음) 증가된 것일 수 있으나, 이에 제한되지 않는다. 상기 용어 “약(about)”은 ±0.5, ±0.4, ±0.3, ±0.2, ±0.1 등을 모두 포함하는 범위로, 약 이란 용어 뒤에 나오는 수치와 동등하거나 유사한 범위의 수치를 모두 포함하나, 이에 제한되지 않는다.For example, the recombinant strain with increased production capacity is about 1% or more, specifically 1% or more, about 2.5% or more, about 5% or more, about 6 compared to the L-glutamic acid production capacity of the parent strain or unmodified microorganism before mutation. % or more, about 7% or more, about 8% or more, about 9% or more, about 10% or more, about 10.5% or more, about 11% or more, about 11.5% or more, about 12% or more, about 12.5% or more, about 13 % or more, about 13.5% or more, about 14% or more, about 14.5% or more, about 15% or more, about 15.5% or more, about 16% or more, about 16.5% or more, about 17% or more, about 17.5% or more, about 18 % or more, about 18.5% or more, about 19% or more, about 19.5% or more, about 20% or more, about 20.5% or more, or about 21% or more (the upper limit is not particularly limited, for example, about 200% or less, about 150% or more) or less, about 100% or less, about 50% or less, about 45% or less, about 40% or less, about 35% or less, about 30% or less, about 25% or less, or about 22% or less) , as long as it has an increased amount of + value compared to the production capacity of the parent strain or unmodified microorganism before mutation, but is not limited thereto. In another example, the recombinant strain with increased production capacity has an L-glutamic acid production capacity of about 1.1 times or more, about 1.12 times or more, about 1.13 times or more, 1.15 times or more, 1.16 times or more, compared to the parent strain or unmodified microorganism before mutation. , 1.17 times or more, 1.18 times or more, 1.19 times or more, 1.2 times or more, or 1.21 times or more (the upper limit is not particularly limited, for example, about 10 times or less, about 5 times or less, about 3 times or less, or about 2 times or less. Yes) may be increased, but is not limited thereto. The term “about” is a range including all of ±0.5, ±0.4, ±0.3, ±0.2, ±0.1, etc., and includes all values in a range equal to or similar to the value following the term about, but not limited
본 출원에서 용어, "비변형 미생물"은 미생물에 자연적으로 발생할 수 있는 돌연변이를 포함하는 균주를 제외하는 것이 아니며, 야생형 균주 또는 천연형 균주 자체이거나, 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화되기 전 균주를 의미할 수 있다. 예를 들어, 상기 비변형 미생물은 본 명세서에 기재된 엑시뉴클레아제 ABC 서브유닛 A 변이체가 도입되지 않거나 도입되기 전의 균주를 의미할 수 있다. 상기 "비변형 미생물"은 "변형 전 균주", "변형 전 미생물", "비변이 균주", "비변형 균주", "비변이 미생물" 또는 "기준 미생물"과 혼용될 수 있다.As used herein, the term "unmodified microorganism" does not exclude a strain containing a mutation that can occur naturally in a microorganism, it is a wild-type strain or a natural-type strain itself, or a genetic variation caused by natural or artificial factors. It may mean the strain before being changed. For example, the unmodified microorganism may refer to a strain in which the exinuclease ABC subunit A variant described herein has not been introduced or has been introduced. The "unmodified microorganism" may be used interchangeably with "strain before modification", "microbe before modification", "unmodified strain", "unmodified strain", "unmodified microorganism" or "reference microorganism".
본 출원의 또 다른 일 예로, 본 출원의 미생물은 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 코리네박테리움 크루디락티스(Corynebacterium crudilactis), 코리네박테리움 데세르티(Corynebacterium deserti), 코리네박테리움 이피시엔스(Corynebacterium efficiens), 코리네박테리움 칼루내(Corynebacterium callunae), 코리네박테리움 스테셔니스(Corynebacterium stationis), 코리네박테리움 싱굴라레(Corynebacterium singulare), 코리네박테리움 할로톨레란스(Corynebacterium halotolerans), 코리네박테리움 스트리아툼(Corynebacterium striatum), 코리네박테리움 암모니아게네스(Corynebacterium ammoniagenes), 코리네박테리움 폴루티솔리(Corynebacterium pollutisoli), 코리네박테리움 이미탄스(Corynebacterium imitans), 코리네박테리움 테스투디노리스(Corynebacterium testudinoris) 또는 코리네박테리움 플라베스센스(Corynebacterium flavescens)일 수 있다.In another example of the present application, the microorganism of the present application is Corynebacterium glutamicum ( Corynebacterium glutamicum ), Corynebacterium crudilactis ( Corynebacterium crudilactis ), Corynebacterium deserti ( Corynebacterium deserti ), Cory Nebacterium efficiens ( Corynebacterium efficiens ), Corynebacterium callunae ( Corynebacterium callunae ), Corynebacterium stationis , Corynebacterium stationis , Corynebacterium singulare ( Corynebacterium singulare ), Corynebacterium halo Toledo lance (Corynebacterium halotolerans), Corynebacterium registry Atum (Corynebacterium striatum), Corynebacterium ammoniagenes to Ness (Corynebacterium ammoniagenes), Corynebacterium pole Ruti Solid (Corynebacterium pollutisoli), Corynebacterium already Tansu (Corynebacterium imitans ), Corynebacterium testudinoris ) or Corynebacterium flavescens ).
본 출원의 미생물은 OdhA 단백질의 활성이 추가적으로 약화 또는불활성화된 미생물일 수 있다. The microorganism of the present application may be a microorganism in which the activity of the OdhA protein is further weakened or inactivated.
본 출원에서 용어, 폴리펩티드의 "약화"는 내재적 활성에 비하여 활성이 감소되거나 또는 활성이 없는 것을 모두 포함하는 개념이다. 상기 약화는 불활성화(inactivation), 결핍(deficiency), 하향조절(down-regulation), 감소(decrease), 저하(reduce), 감쇠(attenuation) 등의 용어와 혼용될 수 있다. As used herein, the term "weakening" of a polypeptide is a concept that includes both reduced or no activity compared to intrinsic activity. The attenuation may be used interchangeably with terms such as inactivation, deficiency, down-regulation, decrease, reduce, attenuation, and the like.
상기 약화는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드의 변이 등으로 폴리펩티드 자체의 활성이 본래 미생물이 가지고 있는 폴리펩티드의 활성에 비해 감소 또는 제거된 경우, 이를 코딩하는 폴리뉴클레오티드의 유전자의 발현 저해 또는 폴리펩티드로의 번역(translation) 저해 등으로 세포 내에서 전체적인 폴리펩티드 활성 정도 및/또는 농도(발현량)가 천연형 균주에 비하여 낮은 경우, 상기 폴리뉴클레오티드의 발현이 전혀 이루어지지 않은 경우, 및/또는 폴리뉴클레오티드의 발현이 되더라도 폴리펩티드의 활성이 없는 경우 역시 포함할 수 있다. 상기 "내재적 활성"은 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화하는 경우, 형질 변화 전 모균주, 야생형 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성을 의미한다. 이는 "변형 전 활성"과 혼용되어 사용될 수 있다. 폴리펩티드의 활성이 내재적 활성에 비하여 "불활성화, 결핍, 감소, 하향조절, 저하, 감쇠"한다는 것은, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성에 비하여 낮아진 것을 의미한다. The attenuation is when the activity of the polypeptide itself is reduced or eliminated compared to the activity of the polypeptide possessed by the original microorganism due to mutation of the polynucleotide encoding the polypeptide, etc., inhibiting the expression of the gene encoding the polynucleotide or translation into a polypeptide When the overall polypeptide activity level and/or concentration (expression amount) in the cell is lower than that of the native strain due to (translation) inhibition, etc., when the expression of the polynucleotide is not made at all, and/or when the expression of the polynucleotide is However, it may also include cases in which there is no activity of the polypeptide. The "intrinsic activity" refers to the activity of a specific polypeptide originally possessed by the parent strain, wild-type or unmodified microorganism before the transformation when the trait is changed due to genetic mutation caused by natural or artificial factors. This may be used interchangeably with "activity before modification". "Inactivation, deficiency, reduction, downregulation, reduction, attenuation" of the activity of the polypeptide compared to the intrinsic activity means that the activity of the specific polypeptide originally possessed by the parent strain or unmodified microorganism before transformation is lowered.
이러한 폴리펩티드의 활성의 약화는, 당업계에 알려진 임의의 방법에 의하여 수행될 수 있으나 이로 제한되는 것은 아니며, 당해 분야에 잘 알려진 다양한 방법의 적용으로 달성될 수 있다(예컨대, Nakashima N et al., Bacterial cellular engineering by genome editing and gene silencing. Int J Mol Sci. 2014;15(2):2773-2793, Sambrook et al. Molecular Cloning 2012 등).Attenuation of the activity of the polypeptide may be performed by any method known in the art, but is not limited thereto, and may be achieved by application of various methods well known in the art (eg, Nakashima N et al., Bacterial cellular engineering by genome editing and gene silencing. Int J Mol Sci. 2014;15(2):2773-2793, Sambrook et al. Molecular Cloning 2012, etc.).
구체적으로, 본 출원의 폴리펩티드의 약화는Specifically, the attenuation of the polypeptide of the present application is
1) 폴리펩티드를 코딩하는 유전자 전체 또는 일부의 결손;1) deletion of all or part of a gene encoding a polypeptide;
2) 폴리펩티드를 코딩하는 유전자의 발현이 감소하도록 발현조절영역(또는 발현조절서열)의 변형;2) modification of the expression control region (or expression control sequence) to reduce the expression of the gene encoding the polypeptide;
3) 폴리펩티드의 활성이 제거 또는 약화되도록 상기 폴리펩티드를 구성하는 아미노산 서열의 변형(예컨대, 아미노산 서열 상의 1 이상의 아미노산의 삭제/치환/부가);3) modification of the amino acid sequence constituting the polypeptide such that the activity of the polypeptide is eliminated or attenuated (eg, deletion/substitution/addition of one or more amino acids on the amino acid sequence);
4) 폴리펩티드의 활성이 제거 또는 약화되도록 상기 폴리펩티드를 코딩하는 유전자 서열의 변형 (예를 들어, 폴리펩티드의 활성이 제거 또는 약화되도록 변형된 폴리펩티드를 코딩하도록 상기 폴리펩티드 유전자의 핵산염기 서열 상의 1 이상의 핵산염기의 삭제/치환/부가);4) modification of the gene sequence encoding the polypeptide such that the activity of the polypeptide is eliminated or attenuated (e.g., one or more nucleobases on the nucleotide sequence of the polypeptide gene to encode a polypeptide modified such that the activity of the polypeptide is eliminated or attenuated) deletion/replacement/addition of);
5) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열의 변형;5) modification of the nucleotide sequence encoding the initiation codon or 5'-UTR region of the gene transcript encoding the polypeptide;
6) 폴리펩티드를 코딩하는 상기 유전자의 전사체에 상보적으로 결합하는 안티센스 올리고뉴클레오티드(예컨대, 안티센스 RNA)의 도입;6) introduction of an antisense oligonucleotide (eg, antisense RNA) that complementarily binds to the transcript of said gene encoding the polypeptide;
7) 리보솜(ribosome)의 부착이 불가능한 2차 구조물을 형성시키기 위하여 폴리펩티드를 코딩하는 유전자의 사인-달가르노(Shine-Dalgarno) 서열 앞단에 사인-달가르노 서열과 상보적인 서열의 부가;7) addition of a sequence complementary to the Shine-Dalgarno sequence in front of the Shine-Dalgarno sequence of the gene encoding the polypeptide to form a secondary structure that cannot be attached to the ribosome;
8) 폴리펩티드를 코딩하는 유전자 서열의 ORF(open reading frame)의 3' 말단에 반대 방향으로 전사되는 프로모터의 부가(Reverse transcription engineering, RTE); 또는8) addition of a promoter transcribed in the opposite direction to the 3' end of the open reading frame (ORF) of the gene sequence encoding the polypeptide (Reverse transcription engineering, RTE); or
9) 상기 1) 내지 8) 중 선택된 2 이상의 조합일 수 있으나, 이에, 특별히 제한되는 것은 아니다.9) It may be a combination of two or more selected from 1) to 8) above, but is not particularly limited thereto.
예컨대, for example,
상기 1) 폴리펩티드를 코딩하는 상기 유전자 일부 또는 전체의 결손은, 염색체 내 내재적 목적 폴리펩티드를 코딩하는 폴리뉴클레오티드 전체의 제거, 일부 뉴클레오티드가 결실된 폴리뉴클레오티드로의 교체 또는 마커 유전자로 교체일 수 있다.1) The deletion of a part or all of the gene encoding the polypeptide may be the removal of the entire polynucleotide encoding the endogenous target polypeptide in the chromosome, replacement with a polynucleotide in which some nucleotides are deleted, or replacement with a marker gene.
또한, 상기 2) 발현조절영역(또는 발현조절서열)의 변형은, 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 발현조절영역(또는 발현조절서열) 상의 변이 발생, 또는 더욱 약한 활성을 갖는 서열로의 교체일 수 있다. 상기 발현조절영역에는 프로모터, 오퍼레이터 서열, 리보좀 결합부위를 코딩하는 서열, 및 전사와 해독의 종결을 조절하는 서열을 포함하나, 이에 한정되는 것은 아니다.In addition, the above 2) modification of the expression control region (or expression control sequence), deletion, insertion, non-conservative or conservative substitution, or a combination thereof, mutation in the expression control region (or expression control sequence) occurs, or weaker replacement with an active sequence. The expression control region includes, but is not limited to, a promoter, an operator sequence, a sequence encoding a ribosome binding site, and a sequence regulating the termination of transcription and translation.
또한, 상기 3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열 변형은, 예를 들면, 내재적 개시코돈에 비해 폴리펩티드 발현율이 더 낮은 다른 개시코돈을 코딩하는 염기서열로 치환하는 것일 수 있으나, 이에 제한되지 않는다.In addition, 3) the base sequence modification encoding the start codon or 5'-UTR region of the gene transcript encoding the polypeptide is, for example, a base encoding another start codon having a lower polypeptide expression rate than the intrinsic start codon It may be substituted with a sequence, but is not limited thereto.
또한, 상기 4) 및 5)의 아미노산 서열 또는 폴리뉴클레오티드 서열의 변형은 폴리펩티드의 활성을 약화하도록 상기 폴리펩티드의 아미노산 서열 또는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 약한 활성을 갖도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열 또는 활성이 없도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열로의 교체일 수 있으나, 이에 한정되는 것은 아니다. 예를 들면, 폴리뉴클레오티드 서열 내 변이를 도입하여 종결 코돈을 형성시킴으로써, 유전자의 발현을 저해하거나 약화시킬 수 있으나, 이에 제한되지 않는다.In addition, the modification of the amino acid sequence or polynucleotide sequence of 4) and 5) above deletes, inserts, non-conservative or conservative substitution of the amino acid sequence of the polypeptide or the polynucleotide sequence encoding the polypeptide to weaken the activity of the polypeptide. Or a combination thereof may result in sequence mutation, or replacement with an amino acid sequence or polynucleotide sequence improved to have weaker activity or an amino acid sequence or polynucleotide sequence improved to have no activity, but is not limited thereto. For example, by introducing a mutation in the polynucleotide sequence to form a stop codon, the expression of a gene may be inhibited or attenuated, but is not limited thereto.
상기 6) 폴리펩티드를 코딩하는 상기 유전자의 전사체에 상보적으로 결합하는 안티센스 올리고뉴클레오티드(예컨대, 안티센스 RNA)의 도입은 예를 들어 문헌 [Weintraub, H. et al., Antisense-RNA as a molecular tool for genetic analysis, Reviews - Trends in Genetics, Vol. 1(1) 1986]을 참고할 수 있다.6) The introduction of an antisense oligonucleotide (eg, antisense RNA) complementary to the transcript of the gene encoding the polypeptide is described, for example, in Weintraub, H. et al., Antisense-RNA as a molecular tool. for genetic analysis, Reviews - Trends in Genetics, Vol. 1(1) 1986].
상기 7) 리보솜(ribosome)의 부착이 불가능한 2차 구조물을 형성시키기 위하여 폴리펩티드를 코딩하는 유전자의 사인-달가르노(Shine-Dalgarno) 서열 앞단에 사인-달가르노 서열과 상보적인 서열의 부가는 mRNA 번역을 불가능하게 하거나 속도를 저하시키는 것일 수 있다.7) The addition of a sequence complementary to the Shine-Dalgarno sequence in front of the Shine-Dalgarno sequence of the gene encoding the polypeptide to form a secondary structure that cannot be attached to the ribosome is mRNA translation It may make it impossible or slow it down.
상기 8) 폴리펩티드를 코딩하는 유전자서열의 ORF(open reading frame)의 3' 말단에 반대 방향으로 전사되는 프로모터의 부가(Reverse transcription engineering, RTE)는 상기 폴리펩티드를 코딩하는 유전자의 전사체에 상보적인 안티센스 뉴클레오티드를 만들어 활성을 약화하는 것일 수 있다.8) the addition of a promoter transcribed in the opposite direction to the 3' end of the open reading frame (ORF) of the gene sequence encoding the polypeptide (Reverse transcription engineering, RTE) is an antisense complementary to the transcript of the gene encoding the polypeptide It may be to attenuate activity by making nucleotides.
본 출원에서 용어, 폴리펩티드 활성의 "강화"는, 폴리펩티드의 활성이 내재적 활성에 비하여 증가되는 것을 의미한다. 상기 강화는 활성화(activation), 상향조절(up-regulation), 과발현(overexpression), 증가(increase) 등의 용어와 혼용될 수 있다. 여기서 활성화, 강화, 상향조절, 과발현, 증가는 본래 가지고 있지 않았던 활성을 나타내게 되는 것, 또는 내재적 활성 또는 변형 전 활성에 비하여 향상된 활성을 나타내게 되는 것을 모두 포함할 수 있다. 상기 “내재적 활성"은 자연적 또는 인위적 요인에 의한 유전적 변이로 형질이 변화하는 경우, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성을 의미한다. 이는 "변형 전 활성"과 혼용되어 사용될 수 있다. 폴리펩티드의 활성이 내재적 활성에 비하여 "강화", "상향조절", "과발현" 또는 "증가"한다는 것은, 형질 변화 전 모균주 또는 비변형 미생물이 본래 가지고 있던 특정 폴리펩티드의 활성 및/또는 농도(발현량)에 비하여 향상된 것을 의미한다. As used herein, the term "enhancement" of a polypeptide activity means that the activity of the polypeptide is increased compared to the intrinsic activity. The reinforcement may be used interchangeably with terms such as activation, up-regulation, overexpression, and increase. Here, activation, enhancement, upregulation, overexpression, and increase may include those that exhibit an activity that was not originally possessed, or that exhibit improved activity compared to intrinsic activity or activity before modification. The “intrinsic activity” refers to the activity of a specific polypeptide originally possessed by the parent strain or unmodified microorganism before transformation when the trait is changed due to genetic mutation caused by natural or artificial factors. It can be used interchangeably.To "enhance", "upregulate", "overexpress" or "increase" the activity of a polypeptide compared to its intrinsic activity means that the activity of a specific polypeptide originally possessed by the parent strain or unmodified microorganism before transformation. And / or concentration (expression amount) means improved compared to.
상기 강화는 외래의 폴리펩티드를 도입하거나, 내재적인 폴리펩티드의 활성 강화 및/또는 농도(발현량)를 통해 달성할 수 있다. 상기 폴리펩티드의 활성의 강화 여부는 해당 폴리펩티드의 활성 정도, 발현량 또는 해당 폴리펩티드로부터 배출되는 산물의 양의 증가로부터 확인할 수 있다.The enhancement can be achieved by introducing an exogenous polypeptide, or by enhancing the activity and/or concentration (expression amount) of the endogenous polypeptide. Whether or not the activity of the polypeptide is enhanced can be confirmed from the increase in the level of activity, expression, or the amount of product excreted from the polypeptide.
상기 폴리펩티드의 활성의 강화는 당해 분야에 잘 알려진 다양한 방법의 적용이 가능하며, 목적 폴리펩티드의 활성을 변형전 미생물보다 강화시킬 수 있는 한, 제한되지 않는다. 구체적으로, 분자생물학의 일상적 방법인 당업계의 통상의 기술자에게 잘 알려진 유전자 공학 및/또는 단백질 공학을 이용한 것일 수 있으나, 이로 제한되지 않는다(예컨대, Sitnicka et al. Functional Analysis of Genes. Advances in Cell Biology. 2010, Vol. 2. 1-16, Sambrook et al. Molecular Cloning 2012 등).The enhancement of the activity of the polypeptide can be applied by various methods well known in the art, and is not limited as long as it can enhance the activity of the target polypeptide compared to the microorganism before modification. Specifically, it may be one using genetic engineering and/or protein engineering well known to those skilled in the art, which is a routine method of molecular biology, but is not limited thereto (eg, Sitnicka et al. Functional Analysis of Genes. Advances in Cell). Biology 2010, Vol. 2. 1-16, Sambrook et al. Molecular Cloning 2012, etc.).
구체적으로, 본 출원의 폴리펩티드의 강화는Specifically, the enrichment of the polypeptide of the present application is
1) 폴리펩티드를 코딩하는 폴리뉴클레오티드의 세포 내 카피수 증가; 1) increasing the intracellular copy number of a polynucleotide encoding the polypeptide;
2) 폴리펩티드를 코딩하는 염색체상의 유전자 발현조절영역을 활성이 강력한 서열로 교체; 2) replacing the gene expression control region on the chromosome encoding the polypeptide with a sequence with strong activity;
3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열의 변형; 3) modification of the nucleotide sequence encoding the initiation codon or 5'-UTR region of the gene transcript encoding the polypeptide;
4) 폴리펩티드 활성이 강화되도록 상기 폴리펩티드의 아미노산 서열의 변형;4) modification of the amino acid sequence of said polypeptide to enhance polypeptide activity;
5) 폴리펩티드 활성이 강화도록 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열의 변형 (예를 들어, 폴리펩티드의 활성이 강화되도록 변형된 폴리펩티드를 코딩하도록 상기 폴리펩티드 유전자의 폴리뉴클레오티드 서열의 변형);5) modification of the polynucleotide sequence encoding the polypeptide to enhance the activity of the polypeptide (eg, modification of the polynucleotide sequence of the polypeptide gene to encode a polypeptide modified to enhance the activity of the polypeptide);
6) 폴리펩티드의 활성을 나타내는 외래 폴리펩티드 또는 이를 코딩하는 외래 폴리뉴클레오티드의 도입; 6) introduction of a foreign polypeptide exhibiting the activity of the polypeptide or a foreign polynucleotide encoding the same;
7) 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈 최적화; 7) codon optimization of the polynucleotide encoding the polypeptide;
8) 폴리펩티드의 삼차구조를 분석하여 노출 부위를 선택하여 변형하거나 화학적으로 수식; 또는8) by analyzing the tertiary structure of the polypeptide to select an exposed site for modification or chemical modification; or
9) 상기 1) 내지 8) 중 선택된 2 이상의 조합일 수 있으나, 이에, 특별히 제한되는 것은 아니다.9) It may be a combination of two or more selected from 1) to 8) above, but is not particularly limited thereto.
보다 구체적으로,More specifically,
상기 1) 폴리펩티드를 코딩하는 폴리뉴클레오티드의 세포 내 카피수 증가는, 해당 폴리펩티드를 코딩하는 폴리뉴클레오티드가 작동가능하게 연결된, 숙주와 무관하게 복제되고 기능할 수 있는 벡터의 숙주세포 내로의 도입에 의해 달성되는 것일 수 있다. 또는, 해당 폴리펩티드를 코딩하는 폴리뉴클레오티드가 숙주세포 내의 염색체 내에 1 카피 또는 2 카피 이상 도입에 의해 달성되는 것일 수 있다. 상기 염색체 내에 도입은 숙주세포 내의 염색체 내로 상기 폴리뉴클레오티드를 삽입시킬 수 있는 벡터가 숙주세포 내에 도입됨으로써 수행될 수 있으나, 이에 제한되지 않는다. 상기 벡터는 전술한 바와 같다.1) The increase in the intracellular copy number of the polynucleotide encoding the polypeptide is achieved by introduction of a vector to which the polynucleotide encoding the polypeptide is operably linked, which can replicate and function independently of the host, into a host cell. it may be Alternatively, the polynucleotide encoding the polypeptide may be achieved by introducing one copy or two or more copies into a chromosome in a host cell. The introduction into the chromosome may be performed by introducing a vector capable of inserting the polynucleotide into the chromosome in the host cell into the host cell, but is not limited thereto. The vector is the same as described above.
상기 2) 폴리펩티드를 코딩하는 염색체상의 유전자 발현조절영역(또는 발현조절서열)을 활성이 강력한 서열로 교체는, 예를 들면, 상기 발현조절영역의 활성을 더욱 강화하도록 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 강한 활성을 가지는 서열로의 교체일 수 있다. 상기 발현조절영역은, 특별히 이에 제한되지 않으나 프로모터, 오퍼레이터 서열, 리보좀 결합 부위를 코딩하는 서열, 그리고 전사 및 해독의 종결을 조절하는 서열 등을 포함할 수 있다. 일 예로, 본래의 프로모터를 강력한 프로모터로 교체시키는 것일 수 있으나, 이에 제한되지 않는다.2) Replacing the gene expression control region (or expression control sequence) on the chromosome encoding the polypeptide with a sequence with strong activity is, for example, deletion, insertion, non-conservative or Conservative substitution or a combination thereof may result in a mutation in the sequence, or replacement with a sequence having a stronger activity. The expression control region is not particularly limited thereto, but may include a promoter, an operator sequence, a sequence encoding a ribosome binding site, and a sequence for regulating the termination of transcription and translation. As an example, the original promoter may be replaced with a strong promoter, but is not limited thereto.
공지된 강력한 프로모터의 예에는 CJ1 내지 CJ7 프로모터(미국등록특허 US 7662943 B2), lac 프로모터, trp 프로모터, trc 프로모터, tac 프로모터, 람다 파아지 PR 프로모터, PL 프로모터, tet 프로모터, gapA 프로모터, SPL7 프로모터, SPL13(sm3) 프로모터(미국등록특허 US 10584338 B2), O2 프로모터(미국등록특허 US 10273491 B2), tkt 프로모터, yccA 프로모터 등이 있으나, 이에 제한되지 않는다.Examples of known strong promoters include CJ1 to CJ7 promoter (US 7662943 B2), lac promoter, trp promoter, trc promoter, tac promoter, lambda phage PR promoter, PL promoter, tet promoter, gapA promoter, SPL7 promoter, SPL13 (sm3) promoter (US Patent US 10584338 B2), O2 promoter (US Patent US 10273491 B2), tkt promoter, yccA promoter, etc., but is not limited thereto.
상기 3) 폴리펩티드를 코딩하는 유전자 전사체의 개시코돈 또는 5'-UTR 지역을 코딩하는 염기서열 변형은, 예를 들면, 내재적 개시코돈에 비해 폴리펩티드 발현율이 더 높은 다른 개시코돈을 코딩하는 염기 서열로 치환하는 것일 수 있으나, 이에 제한되지 않는다.3) The modification of the nucleotide sequence encoding the start codon or 5'-UTR region of the gene transcript encoding the polypeptide is, for example, a nucleotide sequence encoding another start codon having a higher expression rate of the polypeptide compared to the intrinsic start codon. It may be a substitution, but is not limited thereto.
상기 4) 및 5)의 아미노산 서열 또는 폴리뉴클레오티드 서열의 변형은, 폴리펩티드의 활성을 강화하도록 상기 폴리펩티드의 아미노산 서열 또는 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열을 결실, 삽입, 비보존적 또는 보존적 치환 또는 이들의 조합으로 서열상의 변이 발생, 또는 더욱 강한 활성을 갖도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열 또는 활성이 증가하도록 개량된 아미노산 서열 또는 폴리뉴클레오티드 서열로의 교체일 수 있으나, 이에 한정되는 것은 아니다. 상기 교체는 구체적으로 상동재조합에 의하여 폴리뉴클레오티드를 염색체내로 삽입함으로써 수행될 수 있으나, 이에 제한되지 않는다. 이때 사용되는 벡터는 염색체 삽입 여부를 확인하기 위한 선별 마커 (selection marker)를 추가로 포함할 수 있다. 상기 선별 마커는 전술한 바와 같다.The modification of the amino acid sequence or polynucleotide sequence of 4) and 5) above may include deletion, insertion, non-conservative or conservative substitution of the amino acid sequence of the polypeptide or the polynucleotide sequence encoding the polypeptide to enhance the activity of the polypeptide; A combination thereof may result in sequence mutation, or replacement with an amino acid sequence or polynucleotide sequence improved to have stronger activity or an amino acid sequence or polynucleotide sequence improved to increase activity, but is not limited thereto. The replacement may be specifically performed by inserting a polynucleotide into a chromosome by homologous recombination, but is not limited thereto. In this case, the vector used may further include a selection marker for confirming whether or not the chromosome is inserted. The selection marker is the same as described above.
상기 6) 폴리펩티드의 활성을 나타내는 외래 폴리뉴클레오티드의 도입은, 상기 폴리펩티드와 동일/유사한 활성을 나타내는 폴리펩티드를 코딩하는 외래 폴리뉴클레오티드의 숙주세포 내 도입일 수 있다. 상기 외래 폴리뉴클레오티드는 상기 폴리펩티드와 동일/유사한 활성을 나타내는 한 그 유래나 서열에 제한이 없다. 상기 도입에 이용되는 방법은 공지된 형질전환 방법을 당업자가 적절히 선택하여 수행될 수 있으며, 숙주 세포 내에서 상기 도입된 폴리뉴클레오티드가 발현됨으로써 폴리펩티드가 생성되어 그 활성이 증가될 수 있다.6) The introduction of the foreign polynucleotide exhibiting the activity of the polypeptide may be introduction of the foreign polynucleotide encoding the polypeptide exhibiting the same/similar activity as the polypeptide into a host cell. The foreign polynucleotide is not limited in its origin or sequence as long as it exhibits the same/similar activity as the polypeptide. The method used for the introduction can be performed by appropriately selecting a known transformation method by those skilled in the art, and the introduced polynucleotide is expressed in a host cell to generate a polypeptide and increase its activity.
상기 7) 폴리펩티드를 암호화하는 폴리뉴클레오티드의 코돈 최적화는, 내재 폴리뉴클레오티드가 숙주세포 내에서 전사 또는 번역이 증가하도록 코돈 최적화한 것이거나, 또는 외래 폴리뉴클레오티드가 숙주세포 내에서 최적화된 전사, 번역이 이루어지도록 이의 코돈을 최적화한 것일 수 있다.7) Codon optimization of the polynucleotide encoding the polypeptide is codon-optimized so that the transcription or translation of the endogenous polynucleotide is increased in the host cell, or the transcription and translation of the foreign polynucleotide are optimized in the host cell. It may be that its codons are optimized so that the
상기 8) 폴리펩티드의 삼차구조를 분석하여 노출 부위를 선택하여 변형하거나 화학적으로 수식하는 것은, 예를 들어 분석하고자 하는 폴리펩티드의 서열정보를 기지 단백질들의 서열정보가 저장된 데이터베이스와 비교함으로써 서열의 유사성 정도에 따라 주형 단백질 후보를 결정하고 이를 토대로 구조를 확인하여, 변형하거나 화학적으로 수식할 노출 부위를 선택하여 변형 또는 수식하는 것일 수 있다.8) Selecting an exposed site by analyzing the tertiary structure of the polypeptide and modifying or chemically modifying it, for example, compares the sequence information of the polypeptide to be analyzed with a database in which sequence information of known proteins is stored. Accordingly, it may be to determine a template protein candidate, check the structure based on it, select an exposed site to be modified or chemically modified, and modify or modify it.
이와 같은 폴리펩티드 활성의 강화는, 상응하는 폴리펩티드의 활성 또는 농도 이야생형이나 변형 전 미생물 균주에서 발현된 폴리펩티드의 활성 또는 농도를 기준으로 하여 증가되거나, 해당 폴리펩티드로부터 생산되는 산물의 양의 증가되는 것일 수 있으나, 이에 제한되는 것은 아니다.Such enhancement of polypeptide activity may be an increase in the activity or concentration of the corresponding polypeptide based on the activity or concentration of the polypeptide expressed in the wild-type or microbial strain prior to modification, or an increase in the amount of product produced from the polypeptide. However, the present invention is not limited thereto.
보다 구체적으로, 본 출원의 코리네박테리움 글루타미쿰 균주는 서열번호 17을 포함하는 폴리펩티드, 서열번호 17을 포함하는 폴리펩티드를 코딩하는 뉴클레오티드 또는 서열번호 18을 포함하는 뉴클레오티드가 추가로 결실된 미생물일 수 있다. More specifically, the Corynebacterium glutamicum strain of the present application is a microorganism in which a polypeptide comprising SEQ ID NO: 17, a nucleotide encoding a polypeptide comprising SEQ ID NO: 17, or a nucleotide comprising SEQ ID NO: 18 is further deleted. can
본 출원의 미생물에서 폴리뉴클레오티드의 일부 또는 전체의 변형은 (a) 미생물 내 염색체 삽입용 벡터를 이용한 상동 재조합 또는 유전자가위 (engineered nuclease, e.g., CRISPR-Cas9)을 이용한 유전체 교정 및/또는 (b) 자외선 및 방사선 등과 같은 빛 및/또는 화학물질 처리에 의해 유도될 수 있으나 이에 제한되지 않는다. 상기 유전자 일부 또는 전체의 변형 방법에는 DNA 재조합 기술에 의한 방법이 포함될 수 있다. 예를 들면, 목적 유전자와 상동성이 있는 뉴클레오티드 서열을 포함하는 뉴클레오티드 서열 또는 벡터를 상기 미생물에 주입하여 상동 재조합(homologous recombination)이 일어나게 함으로써 유전자 일부 또는 전체의 결손이 이루어질 수 있다. 상기 주입되는 뉴클레오티드 서열 또는 벡터는 우성 선별 마커를 포함할 수 있으나, 이에 제한되는 것은 아니다. Modification of part or all of the polynucleotide in the microorganism of the present application is (a) homologous recombination using a vector for chromosome insertion in the microorganism or genome correction using engineered nuclease (eg, CRISPR-Cas9) and/or (b) It may be induced by light and/or chemical treatments such as, but not limited to, ultraviolet and radiation. The method for modifying part or all of the gene may include a method by DNA recombination technology. For example, by injecting a nucleotide sequence or a vector including a nucleotide sequence homologous to a target gene into the microorganism to cause homologous recombination, a part or all of a gene may be deleted. The injected nucleotide sequence or vector may include a dominant selection marker, but is not limited thereto.
본 출원의 미생물에서, 변이체, 폴리뉴클레오티드 및 L-글루탐산 등은 상기 다른 양태에서 기재한 바와 같다.In the microorganism of the present application, variants, polynucleotides, L-glutamic acid, and the like are as described in the other aspects above.
본 출원의 또 다른 하나의 양태는 본 출원의 변이체 또는 본 출원의 폴리뉴클레오티드를 포함하는 코리네박테리움 글루타미쿰 균주를 배지에서 배양하는 단계를 포함하는, L-글루탐산 생산방법을 제공한다. Another aspect of the present application provides a method for producing L-glutamic acid, comprising the step of culturing a Corynebacterium glutamicum strain comprising a mutant of the present application or a polynucleotide of the present application in a medium.
본 출원의 L-글루탐산 생산방법은 본 출원의 변이체 또는 본 출원의 폴리뉴클레오티드 또는 본 출원의 벡터를 포함하는 코리네박테리움 글루타미쿰 균주를 배지에서 배양하는 단계를 포함할 수 있다.The L-glutamic acid production method of the present application may include culturing a Corynebacterium glutamicum strain comprising the mutant of the present application or the polynucleotide of the present application or the vector of the present application in a medium.
본 출원에서, 용어 "배양"은 본 출원의 코리네박테리움 글루타미쿰 균주를 적당히 조절된 환경 조건에서 생육시키는 것을 의미한다. 본 출원의 배양과정은 당업계에 알려진 적당한 배지와 배양조건에 따라 이루어질 수 있다. 이러한 배양 과정은 선택되는 균주에 따라 당업자가 용이하게 조정하여 사용할 수 있다. 구체적으로 상기 배양은 회분식, 연속식 및/또는 유가식일 수 있으나, 이에 제한되는 것은 아니다.In the present application, the term "cultivation" means growing the Corynebacterium glutamicum strain of the present application under moderately controlled environmental conditions. The culturing process of the present application may be made according to a suitable medium and culture conditions known in the art. Such a culture process can be easily adjusted and used by those skilled in the art according to the selected strain. Specifically, the culture may be a batch, continuous and/or fed-batch, but is not limited thereto.
본 출원에서 용어, "배지"는 본 출원의 코리네박테리움 글루타미쿰 균주를 배양하기 위해 필요로 하는 영양물질을 주성분으로 혼합한 물질을 의미하며, 생존 및 발육에 불가결한 물을 비롯하여 영양물질 및 발육인자 등을 공급한다. 구체적으로, 본 출원의 코리네박테리움 글루타미쿰 균주의 배양에 사용되는 배지 및 기타 배양 조건은 통상의 미생물의 배양에 사용되는 배지라면 특별한 제한 없이 어느 것이나 사용할 수 있으나, 본 출원의 코리네박테리움 글루타미쿰 균주를 적당한 탄소원, 질소원, 인원, 무기화합물, 아미노산 및/또는 비타민 등을 함유한 통상의 배지 내에서 호기성 조건 하에서 온도, pH 등을 조절하면서 배양할 수 있다. As used herein, the term "medium" refers to a material in which nutrients required for culturing the Corynebacterium glutamicum strain of the present application are mixed as a main component, and nutrients including water essential for survival and growth and growth factors. Specifically, any medium and other culture conditions used for culturing the Corynebacterium glutamicum strain of the present application may be used without particular limitation as long as it is a medium used for culturing conventional microorganisms, but Corynebacterium glutamicum of the present application Lium glutamicum strain can be cultured while controlling temperature, pH, etc. under aerobic conditions in a conventional medium containing an appropriate carbon source, nitrogen source, phosphorus, inorganic compound, amino acid and / or vitamin and the like.
구체적으로, 코리네박테리움 속 균주에 대한 배양 배지는 문헌["Manual of Methods for General Bacteriology" by the American Society for Bacteriology (Washington D.C., USA, 1981)]에서 찾아 볼 수 있다.Specifically, the culture medium for the Corynebacterium sp. strain can be found in the literature ["Manual of Methods for General Bacteriology" by the American Society for Bacteriology (Washington D.C., USA, 1981)].
본 출원에서 상기 탄소원으로는 글루코오스, 사카로오스, 락토오스, 프룩토오스, 수크로오스, 말토오스 등과 같은 탄수화물; 만니톨, 소르비톨 등과 같은 당 알코올, 피루브산, 락트산, 시트르산 등과 같은 유기산; 글루탐산, 메티오닌, 리신 등과 같은 아미노산 등이 포함될 수 있다. 또한, 전분 가수분해물, 당밀, 블랙스트랩 당밀, 쌀겨울, 카사버, 사탕수수 찌꺼기 및 옥수수 침지액 같은 천연의 유기 영양원을 사용할 수 있으며, 구체적으로는 글루코오스 및 살균된 전처리 당밀(즉, 환원당으로 전환된 당밀) 등과 같은 탄수화물이 사용될 수 있으며, 그 외의 적정량의 탄소원을 제한 없이 다양하게 이용할 수 있다. 이들 탄소원은 단독으로 사용되거나 2 종 이상이 조합되어 사용될 수 있으며, 이에 한정되는 것은 아니다.As the carbon source in the present application, carbohydrates such as glucose, saccharose, lactose, fructose, sucrose, maltose; sugar alcohols such as mannitol and sorbitol; organic acids such as pyruvic acid, lactic acid, citric acid and the like; Amino acids such as glutamic acid, methionine, lysine, and the like may be included. In addition, natural organic nutrient sources such as starch hydrolyzate, molasses, blackstrap molasses, rice winter, cassava, sugar cane offal and corn steep liquor can be used, specifically glucose and sterilized pre-treated molasses (i.e., converted to reducing sugar). molasses) may be used, and other appropriate amounts of carbon sources may be variously used without limitation. These carbon sources may be used alone or in combination of two or more, but is not limited thereto.
상기 질소원으로는 암모니아, 황산암모늄, 염화암모늄, 초산암모늄, 인산암모늄, 탄산안모늄, 질산암모늄 등과 같은 무기질소원; 글루탐산, 메티오닌, 글루타민 등과 같은 아미노산, 펩톤, NZ-아민, 육류 추출물, 효모 추출물, 맥아 추출물, 옥수수 침지액, 카세인 가수분해물, 어류 또는 그의 분해생성물, 탈지 대두 케이크 또는 그의 분해 생성물 등과 같은 유기 질소원이 사용될 수 있다. 이들 질소원은 단독으로 사용되거나 2 종 이상이 조합되어 사용될 수 있으며, 이에 한정되는 것은 아니다.Examples of the nitrogen source include inorganic nitrogen sources such as ammonia, ammonium sulfate, ammonium chloride, ammonium acetate, ammonium phosphate, anmonium carbonate, and ammonium nitrate; Amino acids such as glutamic acid, methionine, glutamine, and organic nitrogen sources such as peptone, NZ-amine, meat extract, yeast extract, malt extract, corn steep liquor, casein hydrolyzate, fish or degradation products thereof, defatted soybean cake or degradation products thereof, etc. can be used These nitrogen sources may be used alone or in combination of two or more, but is not limited thereto.
상기 인원으로는 인산 제1칼륨, 인산 제2칼륨, 또는 이에 대응되는 소디움-함유 염 등이 포함될 수 있다. 무기화합물로는 염화나트륨, 염화칼슘, 염화철, 황산마그네슘, 황산철, 황산망간, 탄산칼슘 등이 사용될 수 있으며, 그 외에 아미노산, 비타민 및/또는 적절한 전구체 등이 포함될 수 있다. 이들 구성성분 또는 전구체는 배지에 회분식 또는 연속식으로 첨가될 수 있다. 그러나, 이에 한정되는 것은 아니다.The phosphorus may include potassium first potassium phosphate, second potassium phosphate, or a sodium-containing salt corresponding thereto. As the inorganic compound, sodium chloride, calcium chloride, iron chloride, magnesium sulfate, iron sulfate, manganese sulfate, calcium carbonate, etc. may be used, and in addition, amino acids, vitamins and/or appropriate precursors may be included. These components or precursors may be added to the medium either batchwise or continuously. However, the present invention is not limited thereto.
또한, 본 출원의 코리네박테리움 글루타미쿰 균주의 배양 중에 수산화암모늄, 수산화칼륨, 암모니아, 인산, 황산 등과 같은 화합물을 배지에 적절한 방식으로 첨가하여, 배지의 pH를 조정할 수 있다. 또한, 배양 중에는 지방산 폴리글리콜 에스테르와 같은 소포제를 사용하여 기포 생성을 억제할 수 있다. 또한, 배지의 호기 상태를 유지하기 위하여, 배지 내로 산소 또는 산소 함유 기체를 주입하거나 혐기 및 미호기 상태를 유지하기 위해 기체의 주입 없이 혹은 질소, 수소 또는 이산화탄소 가스를 주입할 수 있으며, 이에 한정되는 것은 아니다.In addition, during the culture of the Corynebacterium glutamicum strain of the present application, compounds such as ammonium hydroxide, potassium hydroxide, ammonia, phosphoric acid, sulfuric acid, etc. may be added to the medium in an appropriate manner to adjust the pH of the medium. In addition, during culturing, an antifoaming agent such as fatty acid polyglycol ester may be used to suppress bubble formation. In addition, in order to maintain the aerobic state of the medium, oxygen or oxygen-containing gas may be injected into the medium, or nitrogen, hydrogen or carbon dioxide gas may be injected without injection of gas or without injection of gas to maintain anaerobic and microaerobic conditions, which are limited thereto. it is not
본 출원의 배양에서 배양온도는 20 내지 45℃구체적으로는 25 내지 40℃를 유지할 수 있고, 약 10 내지 160 시간 동안 배양할 수 있으나, 이에 한정되는 것은 아니다. In the culture of the present application, the culture temperature may be maintained at 20 to 45°C, specifically, 25 to 40°C, and may be cultured for about 10 to 160 hours, but is not limited thereto.
본 출원의 배양에 의하여 생산된 L-글루탐산은 배지 중으로 분비되거나 세포 내에 잔류할 수 있다.L-glutamic acid produced by the culture of the present application may be secreted into the medium or may remain in the cell.
본 출원의 L- 글루탐산 생산방법은, 본 출원의 코리네박테리움 글루타미쿰 균주를 준비하는 단계, 상기 균주를 배양하기 위한 배지를 준비하는 단계, 또는 이들의 조합(순서에 무관, in any order)을, 예를 들어, 상기 배양하는 단계 이전에, 추가로 포함할 수 있다. The L- glutamic acid production method of the present application includes the steps of preparing the Corynebacterium glutamicum strain of the present application, preparing a medium for culturing the strain, or a combination thereof (regardless of the order, in any order) ), for example, prior to the culturing step, may further include.
본 출원의 L- 글루탐산 생산방법은, 상기 배양에 따른 배지(배양이 수행된 배지) 또는 코리네박테리움 글루타미쿰 균주로부터 L- 글루탐산을 회수하는 단계를 추가로 포함할 수 있다. 상기 회수하는 단계는 상기 배양하는 단계 이후에 추가로 포함될 수 있다.The method for producing L- glutamic acid of the present application may further include recovering L- glutamic acid from the culture medium (cultured medium) or the Corynebacterium glutamicum strain. The recovering step may be further included after the culturing step.
상기 회수는 본 출원의 미생물의 배양 방법, 예를 들어 회분식, 연속식 또는 유가식 배양 방법 등에 따라 당해 기술 분야에 공지된 적합한 방법을 이용하여 목적하는 L- 글루탐산을 수집(collect)하는 것일 수 있다. 예를 들어, 원심분리, 여과, 결정화 단백질 침전제에 의한 처리(염석법), 추출, 초음파 파쇄, 한외여과, 투석법, 분자체 크로마토그래피(겔여과), 흡착크로마토그래피, 이온교환 크로마토그래피, 친화도 크로마토그래피 등의 각종 크로마토그래피, HPLC 또는 이들의 방법을 조합하여 사용될 수 있으며, 당해 분야에 공지된 적합한 방법을 이용하여 배지 또는 미생물로부터 목적하는 L-글루탐산을 회수할 수 있다.The recovery may be to collect the desired L-glutamic acid using a suitable method known in the art according to the culture method of the microorganism of the present application, for example, a batch, continuous or fed-batch culture method. . For example, centrifugation, filtration, treatment with a crystallized protein precipitating agent (salting out method), extraction, ultrasonic disruption, ultrafiltration, dialysis, molecular sieve chromatography (gel filtration), adsorption chromatography, ion exchange chromatography, affinity Various chromatography such as island chromatography, HPLC, or a combination thereof may be used, and the desired L-glutamic acid may be recovered from the medium or microorganism using a suitable method known in the art.
또한, 본 출원의 L-글루탐산 생산방법은, 추가적으로 정제 단계를 포함할 수 있다. 상기 정제는 당해 기술분야에 공지된 적합한 방법을 이용하여, 수행할 수 있다. 일 예에서, 본 출원의 L-글루탐산 생산방법이 회수 단계와 정제 단계를 모두 포함하는 경우, 상기 회수 단계와 정제 단계는 순서에 상관없이 연속적 또는 비연속적으로 수행되거나, 동시에 또는 하나의 단계로 통합되어 수행될 수 있으나, 이에 제한되는 것은 아니다.In addition, the L-glutamic acid production method of the present application may additionally include a purification step. The purification may be performed using a suitable method known in the art. In one example, when the L-glutamic acid production method of the present application includes both the recovery step and the purification step, the recovery step and the purification step are performed continuously or discontinuously, regardless of the order, or are integrated simultaneously or in one step may be performed, but is not limited thereto.
본 출원의 방법에서, 변이체, 폴리뉴클레오티드, 벡터 및 균주 등은 상기 다른 양태에서 기재한 바와 같다.In the method of the present application, variants, polynucleotides, vectors, strains, and the like are as described in the other aspects above.
본 출원의 또 다른 하나의 양태는 본 출원의 변이체, 상기 변이체를 코딩하는 폴리뉴클레오타이드, 상기 폴리뉴클레오타이드를 포함하는 벡터 또는 본 출원의 폴리뉴클레오티드를 포함하는 코리네박테리움 글루타미쿰 균주; 이를 배양한 배지; 또는 이들 중 2 이상의 조합을 포함하는 L-글루탐산 생산용 조성물을 제공하는 것이다.Another aspect of the present application is a Corynebacterium glutamicum strain comprising a variant of the present application, a polynucleotide encoding the variant, a vector including the polynucleotide or the polynucleotide of the present application; the culture medium; Or to provide a composition for the production of L- glutamic acid comprising a combination of two or more of them.
본 출원의 조성물은 아미노산 생산용 조성물에 통상 사용되는 임의의 적합한 부형제를 추가로 포함할 수 있으며, 이러한 부형제는, 예를 들어 보존제, 습윤제, 분산제, 현탁화제, 완충제, 안정화제 또는 등장화제 등일 수 있으나, 이에 한정되는 것은 아니다.The composition of the present application may further include any suitable excipients commonly used in compositions for the production of amino acids, and these excipients may be, for example, preservatives, wetting agents, dispersing agents, suspending agents, buffering agents, stabilizing agents or isotonic agents, etc. However, the present invention is not limited thereto.
본 출원의 조성물에서, 변이체, 폴리뉴클레오티드, 벡터, 균주, 배지 및 L- 글루탐산 등은 상기 다른 양태에서 기재한 바와 같다.In the composition of the present application, variants, polynucleotides, vectors, strains, media and L-glutamic acid are the same as those described in the other aspects above.
본 출원의 엑시뉴클레아제 ABC 서브유닛 A의 변이체를 포함하는, 코리네박테리움 글루타미쿰 균주를 배양하는 경우, 기존 비변형 폴리펩티드를 갖는 미생물에 비해 고수율의 L-글루탐산 생산이 가능하다. In the case of culturing a Corynebacterium glutamicum strain comprising a variant of the exinuclease ABC subunit A of the present application, it is possible to produce L-glutamic acid in a high yield compared to a microorganism having an existing unmodified polypeptide.
도 1은 pDCM2 플라스미드의 모식도이다.1 is a schematic diagram of a pDCM2 plasmid.
이하 본 출원을 실시예에 의해 보다 상세하게 설명한다. 그러나 하기 실시예는 본 출원을 예시하기 위한 바람직한 실시양태에 불과한 것이며 따라서, 본 출원의 권리범위를 이에 한정하는 것으로 의도되지는 않는다. 한편, 본 명세서에 기재되지 않은 기술적인 사항들은 본 출원의 기술 분야 또는 유사 기술 분야에서 숙련된 통상의 기술자이면 충분히 이해하고 용이하게 실시할 수 있다.Hereinafter, the present application will be described in more detail by way of Examples. However, the following examples are merely preferred embodiments for illustrating the present application, and therefore, are not intended to limit the scope of the present application thereto. On the other hand, technical matters not described in this specification can be sufficiently understood and easily implemented by those skilled in the art or similar technical fields of the present application.
실시예 1: 플라스미드의 제작Example 1: Construction of Plasmids
코리네박테리움 염색체 내 유전자의 삽입 및 교체를 위한 플라스미드(pDCM2, 도 1, 서열번호 19)를 디자인하였고, 바이오닉스(주)의 유전자 합성(Gene-synthesis) 서비스를 이용하여 플라스미드를 합성하였다. 일반적으로 알려진 sacB 시스템 관련 논문[Gene, 145 (1994) 69-73]을 참고로 하여 클로닝에 활용하기 용이한 제한효소(restriction enzyme)를 포함하도록 플라스미드를 설계하였다. 이렇게 합성된 pDCM2 플라스미드는 다음과 같은 특성을 갖는다. A plasmid (pDCM2, FIG. 1, SEQ ID NO: 19) for the insertion and replacement of genes in the Corynebacterium chromosome was designed, and the plasmid was synthesized using the Gene-synthesis service of Bionics Co., Ltd. A plasmid was designed to include a restriction enzyme that is easy to use for cloning with reference to the generally known sacB system related paper [Gene, 145 (1994) 69-73]. The thus synthesized pDCM2 plasmid has the following characteristics.
1) 대장균에서만 작용하는 복제 기점(replication origin)을 가지고 있어 대장균 내에서는 자가 복제(self-replication)가 가능하나 코리네박테리움에서는 자가 복제가 불가능한 특성을 갖는다. 1) Since it has a replication origin that works only in E. coli, self-replication is possible in E. coli, but self-replication is impossible in Corynebacterium.
2) 선별 마커로 카나마이신 내성 유전자를 갖는다. 2) It has a kanamycin resistance gene as a selectable marker.
3) 2차 양성 선별(positive-selection) 마커로 레반 수크라제(Levan sucrose) 유전자(sacB)를 갖는다. 3) It has a Levan sucrose gene (sacB) as a secondary positive-selection marker.
4) 최종 제작된 균주에는 pDCM2 플라스미드로부터 유래한 어떠한 유전자 정보도 남지 않는다. 4) No genetic information derived from the pDCM2 plasmid is left in the finally constructed strain.
실시예 2: 미생물내 엑시뉴클레아제 ABC 서브유닛 AExample 2: Exinuclease ABC Subunit A in Microorganisms 변이체 발현을 위한 벡터 제작Vector construction for mutant expression
엑시뉴클레아제 ABC 서브유닛 A 아미노산 서열(서열번호 3)의 575번째 위치 글리신이 아스파르트산으로 치환된 변이체(G575D; 서열번호 1)가 L-글루탐산 생산에 미치는 영향을 확인하고자 이의 발현 균주 제작을 위한 벡터를 하기와 같이 제작하였다. In order to confirm the effect of the glycine at position 575 of the exinuclease ABC subunit A amino acid sequence (SEQ ID NO: 3) with aspartic acid on the production of L-glutamic acid, the mutant (G575D; SEQ ID NO: 1) was produced. A vector was prepared as follows.
야생형 코리네박테리움 글루타미쿰 ATCC13869의 gDNA(genomic DNA)를 주형으로 서열번호 5 및 6의 서열의 프라이머 쌍과 서열번호 7 및 8의 서열의 프라이머 쌍을 이용하여 각각 PCR을 수행하였다. 상기에서 얻어진 두 단편의 혼합물을 주형으로 서열번호 5 및 서열번호 8의 서열의 프라이머 쌍을 이용하여 다시 오버랩핑(overlapping) PCR을 수행하여 단편을 수득하였다. PCR은 94℃에서 5분간 변성 후, 94℃에서 30초, 55℃에서 30초, 72℃에서 1분 30초를 30회 반복한 후, 72℃에서 5분간 수행하였다. pDCM2 벡터는 smaI을 처리하고 상기에서 수득한 PCR 산물을 퓨전 클로닝하였다. 퓨전 클로닝은 In-Fusion® HD 클로닝 키트(Clontech)를 사용하였다. 결과로 얻은 플라스미드를 pDCM2-uvrA(G575D)라 명명하였다.Using the gDNA (genomic DNA) of wild-type Corynebacterium glutamicum ATCC13869 as a template, PCR was performed using a pair of primers of SEQ ID NOs: 5 and 6 and a pair of primers of SEQ ID NOs: 7 and 8, respectively. Using the mixture of the two fragments obtained above as a template, overlapping PCR was performed again using the primer pair of SEQ ID NO: 5 and SEQ ID NO: 8 to obtain a fragment. After denaturing at 94°C for 5 minutes, PCR was repeated 30 times at 94°C for 30 seconds, at 55°C for 30 seconds, at 72°C for 1 minute and 30 seconds, and then at 72°C for 5 minutes. The pDCM2 vector was treated with smal and the PCR product obtained above was fusion cloned. Fusion cloning was performed using the In-Fusion® HD cloning kit (Clontech). The resulting plasmid was named pDCM2-uvrA (G575D).
실시예 3: 야생형 코리네박테리움 글루타미쿰 유래 L-글루탐산 생산주 제작 및 엑시뉴클레아제 ABC 서브유닛 A 변이체 도입 균주 제작Example 3: Production of wild-type Corynebacterium glutamicum-derived L-glutamic acid production strain and exinuclease ABC subunit A mutant introduction strain production
실시예 3-1: 야생형 코리네박테리움 글루타미쿰 유래 L-글루탐산 생산능을 갖는 코리네박테리움 글루타미쿰 균주 제작Example 3-1: Preparation of Corynebacterium glutamicum strain having L-glutamic acid-producing ability derived from wild-type Corynebacterium glutamicum
코리네박테리움 글루타미쿰 ATCC13869 유래 L-글루탐산 생산능을 갖는 균주를 제작하기 위해 선행문헌(Appl Environ Microbiol. 2007 Feb;73(4):1308-19. Epub 2006 Dec 8.)을 바탕으로 odhA 유전자를 결손한 코리네박테리움 글루타미쿰 ATCC13869 △odhA 균주를 제작하였다.Corynebacterium glutamicum ATCC13869-derived odhA based on the prior literature (Appl Environ Microbiol. 2007 Feb; 73(4): 1308-19. Epub 2006 Dec 8.) to produce a strain having L-glutamic acid-producing ability derived from ATCC13869. A strain of Corynebacterium glutamicum ATCC13869 ΔodhA in which the gene was deleted was prepared.
구체적으로 odhA 결손을 위하여 코리네박테리움 글루타미쿰 ATCC13869 염색체 DNA를 주형으로 하여 서열번호 11과 서열번호 12, 서열번호 13과 서열번호 14의 프라이머 쌍을 이용하여 각각 PCR을 수행하였다. 상기에서 얻어진 두 단편의 혼합물을 주형으로 서열번호 11 및 서열번호 14의 서열의 프라이머 쌍을 이용하여 다시 오버랩핑(overlapping) PCR을 수행하여 단편을 수득하였다. PCR은 94℃에서 5분간 변성 후, 94℃에서 30초, 55℃에서 30초, 72℃에서 1분 30초를 30회 반복한 후, 72℃에서 5분간 수행하였다. pDCM2 벡터는 smaI을 처리하고 상기에서 수득한 PCR 산물을 퓨전 클로닝하였다. 퓨전 클로닝은 In-Fusion® HD 클로닝 키트(Clontech)를 사용하였다. 결과로 얻은 플라스미드를 pDCM2-△odhA라 명명하였다. Specifically, PCR was performed using the primer pairs of SEQ ID NO: 11 and SEQ ID NO: 12, SEQ ID NO: 13 and SEQ ID NO: 14 using Corynebacterium glutamicum ATCC13869 chromosomal DNA as a template for odhA deletion. Using the mixture of the two fragments obtained above as a template, overlapping PCR was performed again using the primer pair of SEQ ID NO: 11 and SEQ ID NO: 14 to obtain a fragment. After denaturing at 94°C for 5 minutes, PCR was repeated 30 times at 94°C for 30 seconds, at 55°C for 30 seconds, at 72°C for 1 minute and 30 seconds, and then at 72°C for 5 minutes. The pDCM2 vector was treated with smal and the PCR product obtained above was fusion cloned. Fusion cloning was performed using the In-Fusion® HD cloning kit (Clontech). The resulting plasmid was named pDCM2-ΔodhA.
제작된 pDCM2-△odhA 벡터를 코리네박테리움 글루타미쿰 ATCC13869 균주에 전기천공법으로 형질 전환 후, 2차 교차 과정을 거쳐 염색체 상에서 odhA 유전자가 결손된 균주를 수득하였다. 유전자 결손 여부는 서열번호 15와 서열번호 16을 이용한 PCR 과 게놈 시퀀싱을 통해 확인하였으며, 제작된 균주를 ATCC13869 △odhA로 명명하였다.The prepared pDCM2-ΔodhA vector was transformed into the Corynebacterium glutamicum ATCC13869 strain by electroporation, and then a strain in which the odhA gene was deleted on the chromosome was obtained through a secondary crossover process. The gene deletion was confirmed through PCR and genome sequencing using SEQ ID NO: 15 and SEQ ID NO: 16, and the prepared strain was named ATCC13869 ΔodhA.
여기에서 사용된 프라이머 서열은 하기 표 1과 같다.The primer sequences used herein are shown in Table 1 below.
실시예 3-2: 엑시뉴클레아제 ABC 서브유닛 AExample 3-2: Exinuclease ABC Subunit A 변이체 발현 균주 제작Production of variant expression strains
상기 실시예 2에서 제작한 벡터를 상기 실시예 3-1에서 제작한 ATCC13869△odhA에 형질전환 하였다. The vector prepared in Example 2 was transformed into ATCC13869ΔodhA prepared in Example 3-1.
상동성 재조합이 일어난 균주에서 서열번호 9와 10을 이용하여 변이체가 도입된 균주를 선별하였다. 각 선별된 균주를 ATCC13869 △odhA_uvrA_G575D 로 명명하였다.In the strain in which the homologous recombination occurred, the strain into which the mutant was introduced was selected using SEQ ID NOs: 9 and 10. Each selected strain was named ATCC13869 ΔodhA_uvrA_G575D.
실시예 3-3: 엑시뉴클레아제 ABC 서브유닛 A 변이체 발현 균주의 L-글루탐산 생산능 비교Example 3-3: Comparison of L-glutamic acid production ability of exinuclease ABC subunit A mutant expression strains
상기 실시예 3-1에서 제작된 균주를 L-글루탐산 생산능을 확인하고자 ATCC13869 △odhA 균주를 대조군으로 하여 아래와 같은 방법으로 배양하였다.In order to confirm the L-glutamic acid production ability of the strain prepared in Example 3-1, the strain ATCC13869 ΔodhA was used as a control and cultured in the following manner.
종 배지 25 ㎖을 함유하는 250 ㎖ 코너-바플 플라스크에 각 균주들을 접종하고, 30 ℃에서 20 시간 동안, 200 rpm으로 진탕 배양하였다. 그런 다음, 생산 배지 25 ㎖을 함유하는 250 ㎖ 코너-바플 플라스크에 1 ㎖의 종 배양액을 접종하고 30 ℃에서 40시간 동안, 200 rpm에서 진탕 배양하였다. 배양 종료 후, 고성능 액체 크로마토그래피(HPLC)를 이용하여 L-글루탐산 생산능을 측정하였으며, 측정 결과는 하기 표 2에 나타내었다. 실험한 각 균주에 대한 배양액 중의 글루탐산 농도 및 농도 증가율은 하기 표 2와 같다. Each strain was inoculated into a 250 ml corner-baffle flask containing 25 ml of the seed medium, and incubated at 30° C. for 20 hours with shaking at 200 rpm. Then, 1 ml of the seed culture solution was inoculated into a 250 ml corner-baffle flask containing 25 ml of the production medium and cultured with shaking at 30° C. for 40 hours at 200 rpm. After completion of the culture, L-glutamic acid production capacity was measured using high performance liquid chromatography (HPLC), and the measurement results are shown in Table 2 below. The glutamic acid concentration and concentration increase rate in the culture medium for each strain tested are shown in Table 2 below.
<종배지> <Servant Place>
포도당 1%, 육즙 0.5%, 폴리펩톤 1%, 염화나트륨 0.25%, 효모엑기스 0.5%, 한천 2%, 유레아 0.2%, pH 7.2Glucose 1%, broth 0.5%, polypeptone 1%, sodium chloride 0.25%, yeast extract 0.5%, agar 2%, urea 0.2%, pH 7.2
<생산배지> <Production medium>
원당 6%, 탄산칼슘 5%, 황산암모늄 2.25%, 일인산칼륨 0.1%, 황산마그네슘 0.04%, 황산철 10 mg/L, 티아민 염산염 0.2 mg/L, 비오틴 50㎍/LRaw sugar 6%, calcium carbonate 5%, ammonium sulfate 2.25%, potassium monophosphate 0.1%, magnesium sulfate 0.04%, iron sulfate 10 mg/L, thiamine hydrochloride 0.2 mg/L, biotin 50㎍/L
상기 표 2에서 나타난 바와 같이 ATCC13869 △odhA 균주 에 비하여 uvrA_G575D 유전자가 도입된 ATCC13869 △odhA_uvrA_G575D에서 L-글루탐산의 농도가 현저히 증가함을 확인하였다. As shown in Table 2, it was confirmed that the concentration of L-glutamic acid was significantly increased in ATCC13869 ΔodhA_uvrA_G575D into which the uvrA_G575D gene was introduced compared to the ATCC13869 ΔodhA strain.
상기 ATCC13869 △odhA_uvrA_G575D는 CA02-1612로 명명하였으며, 부다페스트조약 하의 수탁기관인 한국미생물보존센터에 2020년 11월 30일자로 기탁하여 수탁번호 KCCM12853P를 부여받았다. The ATCC13869 △odhA_uvrA_G575D was named CA02-1612, and was deposited with the Korea Microorganism Conservation Center, a trustee institution under the Budapest Treaty on November 30, 2020, and was given an accession number KCCM12853P.
이상의 설명으로부터, 본 출원이 속하는 기술분야의 당업자는 본 출원이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 출원의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 출원의 범위에 포함되는 것으로 해석되어야 한다.From the above description, those skilled in the art to which the present application pertains will understand that the present application may be embodied in other specific forms without changing the technical spirit or essential characteristics thereof. In this regard, it should be understood that the embodiments described above are illustrative in all respects and not restrictive. The scope of the present application should be construed as including all changes or modifications derived from the meaning and scope of the claims to be described later rather than the above detailed description and equivalent concepts thereof.
<110> CJ CheilJedang Corporation <120> Novel excinuclease ABC subunit A variant and a method for producing L-glutamic acid using the same <130> KPA201585-KR <160> 19 <170> KoPatentIn 3.0 <210> 1 <211> 949 <212> PRT <213> Unknown <220> <223> excinuclease ABC subunit A variant amino acid sequence <400> 1 Met Ala Asp Arg Leu Val Val Arg Gly Ala Arg Glu His Asn Leu Lys 1 5 10 15 Gly Val Asp Ile Asp Leu Pro Arg Asp Ser Met Val Val Phe Thr Gly 20 25 30 Leu Ser Gly Ser Gly Lys Ser Ser Leu Ala Phe Asp Thr Ile Phe Ala 35 40 45 Glu Gly Gln Arg Arg Tyr Val Glu Ser Leu Ser Ser Tyr Ala Arg Met 50 55 60 Phe Leu Gly Gln Met Asp Lys Pro Asp Val Asp Leu Ile Asp Gly Leu 65 70 75 80 Ser Pro Ala Val Ser Ile Asp Gln Lys Ser Thr Asn Arg Asn Pro Arg 85 90 95 Ser Thr Val Gly Thr Ile Thr Glu Val Tyr Asp Tyr Leu Arg Leu Leu 100 105 110 Tyr Ala Arg Ala Gly Thr Ala His Cys Pro Val Cys Asp Ala Arg Val 115 120 125 Glu Arg Gln Thr Pro Gln Gln Met Val Asp Gln Ile Leu Gly Met Glu 130 135 140 Glu Gly Leu Lys Phe Gln Ile Leu Ala Pro Val Val Arg Thr Arg Lys 145 150 155 160 Gly Glu Phe Val Asp Leu Phe Ala Asp Leu Ala Ser Gln Gly Tyr Ser 165 170 175 Arg Val Arg Val Asp Gly Glu Val His Gln Leu Ser Asp Pro Pro Lys 180 185 190 Leu Glu Lys Gln Ile Lys His Asp Ile Asp Val Val Val Asp Arg Leu 195 200 205 Gln Val Lys Ala Ser Gln Lys Gln Arg Leu Thr Asp Ser Met Glu Thr 210 215 220 Ala Leu Arg Leu Ala Asp Gly Val Ala Val Leu Glu Phe Val Gly Leu 225 230 235 240 Glu Glu Asp Asp Pro Asn Arg Leu Arg Arg Phe Ser Glu Lys Met Ser 245 250 255 Cys Pro Asn Gly His Ala Leu Thr Val Asp Glu Leu Glu Pro Arg Ala 260 265 270 Phe Ser Phe Asn Ser Pro Tyr Gly Ala Cys Pro Ala Cys Asp Gly Leu 275 280 285 Gly Val Arg Thr Glu Val Asp Ile Asp Leu Ile Ile Pro Asp Pro Asp 290 295 300 Ala Pro Ala Thr Lys Ala Val Gln Pro Trp Asn Ser Ser Pro Asn His 305 310 315 320 Ser Tyr Phe Glu Lys Leu Ile Glu Gly Leu Ala Lys Ala Leu Gly Phe 325 330 335 Asp Pro Glu Thr Pro Tyr Ser Glu Leu Thr Ala Ala Gln Lys Lys Ala 340 345 350 Leu Val Tyr Gly Ser Lys Glu Glu Val Ser Val Arg Tyr Lys Asn Arg 355 360 365 Tyr Gly Arg Val Arg Ser Trp Thr Ala Pro Phe Glu Gly Val Met Gly 370 375 380 Tyr Phe Asp Arg Lys Leu Glu Gln Thr Asp Ser Glu Thr Gln Lys Asp 385 390 395 400 Arg Leu Leu Gly Tyr Thr Arg Glu Val Pro Cys Pro Thr Cys Lys Gly 405 410 415 Ala Arg Leu Lys Pro Glu Ile Leu Ala Val Arg Leu Asp Ser Gly Ser 420 425 430 His Gly Ala Leu Ser Ile Ala Gly Leu Thr Ala Leu Ser Val His Glu 435 440 445 Ala Phe Glu Phe Leu Asp Asn Leu Thr Leu Gly Lys Arg Glu Glu Met 450 455 460 Ile Ala Gly Ala Val Leu Arg Glu Ile His Ala Arg Leu Lys Phe Leu 465 470 475 480 Leu Asp Val Gly Leu Ser Tyr Leu Thr Leu Asp Arg Ala Ala Gly Thr 485 490 495 Leu Ser Gly Gly Glu Ala Gln Arg Ile Arg Leu Ala Thr Gln Ile Gly 500 505 510 Ser Gly Leu Ala Gly Val Leu Tyr Val Leu Asp Glu Pro Ser Ile Gly 515 520 525 Leu His Gln Arg Asp Asn Gln Arg Leu Ile Thr Thr Leu Glu His Leu 530 535 540 Arg Asp Ile Gly Asn Thr Leu Ile Val Val Glu His Asp Glu Asp Thr 545 550 555 560 Ile Arg Arg Ala Asp Trp Leu Val Asp Ile Gly Pro Arg Ala Asp Glu 565 570 575 Phe Gly Gly Glu Val Val Tyr Gln Gly Glu Pro Lys Gly Ile Leu Asp 580 585 590 Cys Glu Glu Ser Leu Thr Gly Ala Tyr Leu Ser Gly Arg Arg Thr Leu 595 600 605 Gly Val Pro Asp Thr Arg Arg Glu Ile Asp Lys Glu Arg Gln Leu Lys 610 615 620 Val Val Gly Ala Arg Glu Asn Asn Leu Arg Gly Ile Asp Val Lys Ile 625 630 635 640 Pro Leu Gly Val Leu Cys Cys Ile Thr Gly Val Ser Gly Ser Gly Lys 645 650 655 Ser Thr Leu Val Asn Gln Ile Leu Ala Lys Val Leu Ala Asn Lys Leu 660 665 670 Asn Arg Ala Arg Gln Val Pro Gly Arg Ala Lys Arg Val Glu Gly Leu 675 680 685 Glu His Leu Asp Lys Leu Val Gln Val Asp Gln Ser Pro Ile Gly Arg 690 695 700 Thr Pro Arg Ser Asn Pro Ala Thr Tyr Thr Gly Val Phe Asp Lys Val 705 710 715 720 Arg Asn Leu Phe Ala Glu Thr Thr Glu Ala Lys Val Arg Gly Tyr Lys 725 730 735 Pro Gly Arg Phe Ser Phe Asn Ile Lys Gly Gly Arg Cys Glu Ala Cys 740 745 750 Gln Gly Asp Gly Thr Leu Lys Ile Glu Met Asn Phe Leu Pro Asp Val 755 760 765 Tyr Val Pro Cys Glu Val Cys Asp Gly Gln Arg Tyr Asn Arg Glu Thr 770 775 780 Leu Glu Val Lys Tyr Lys Gly Lys Asn Ile Ala Glu Val Leu Gly Met 785 790 795 800 Pro Ile Ser Glu Ala Ala Asp Phe Phe Glu Pro Ile Thr Ser Ile His 805 810 815 Arg Tyr Leu Ala Thr Leu Val Asp Val Gly Leu Gly Tyr Val Arg Leu 820 825 830 Gly Gln Ala Ala Thr Thr Leu Ser Gly Gly Glu Ala Gln Arg Val Lys 835 840 845 Leu Ala Ala Glu Leu Gln Lys Arg Ser Asn Gly Arg Thr Val Tyr Ile 850 855 860 Leu Asp Glu Pro Thr Thr Gly Leu His Phe Glu Asp Ile Arg Lys Leu 865 870 875 880 Met Met Val Ile Gln Gly Leu Val Asp Lys Gly Asn Ser Val Ile Ile 885 890 895 Ile Glu His Asn Leu Asp Val Ile Lys Ala Ala Asp Trp Ile Val Asp 900 905 910 Met Gly Pro Glu Gly Gly Ser Gly Gly Gly Thr Val Val Ala Glu Gly 915 920 925 Thr Pro Glu Gln Val Ala Glu Val Ala Gly Ser Tyr Thr Gly Gln Phe 930 935 940 Leu Lys Glu Leu Leu 945 <210> 2 <211> 2850 <212> DNA <213> Unknown <220> <223> excinuclease ABC subunit A variant nucleotide sequence <400> 2 ttggctgatc gcctcgtagt gcgcggagcg cgtgaacaca acctaaaagg cgtggatatt 60 gatctgccac gcgactcgat ggtggtgttc accggcctgt caggttccgg taaatcatca 120 ctggcctttg acaccatctt tgcggaaggc cagcgccgtt acgtggagtc gttgtccagt 180 tacgcccgca tgttcttggg gcagatggac aagccggacg tggatttgat tgatggatta 240 tccccagcgg tctccattga ccaaaagtcc accaaccgca accctcggtc caccgtcggt 300 accatcacgg aagtctatga ctacctgcgt cttctgtatg cccgcgctgg taccgcacac 360 tgcccagtgt gtgatgcccg cgtggagcgt caaaccccgc agcagatggt ggaccagatc 420 cttggcatgg aggagggact gaagttccaa atccttgcgc ctgtggtgcg tacccgtaaa 480 ggtgagttcg ttgatctttt cgcagatctt gcatcccaag gttattcccg cgtgcgggtt 540 gatggggaag tgcaccagct ctcggatcct ccaaagctag aaaagcagat caagcacgat 600 attgatgttg tggttgaccg tctgcaggta aaagccagcc aaaagcagcg cctgacagac 660 tctatggaaa ccgcacttcg cctggccgat ggcgtggctg tgctggagtt cgttggcctg 720 gaggaagatg atccgaatag gcttcgtcga ttctctgaaa agatgagctg ccctaacggt 780 cacgcgttga cggttgatga gctggagcct cgtgcttttt ccttcaactc tccttatggc 840 gcgtgtcctg cctgtgatgg cttgggtgtg cgcaccgaag ttgatattga tctgatcatc 900 ccagatccag atgcacctgc aactaaagcg gttcagccct ggaactccag cccaaaccac 960 tcttactttg aaaagctcat tgaaggcctg gcgaaagccc tcggatttga tccggaaact 1020 ccgtacagtg agctcaccgc agctcaaaag aaggctctgg tctatggatc gaaggaagaa 1080 gtaagcgttc gatacaagaa ccgctacgga cgcgtgcgtt cttggactgc gccttttgaa 1140 ggtgtcatgg gctactttga tcgcaagttg gagcagactg attccgaaac ccaaaaagac 1200 cgactgttgg gctacacccg tgaagtgccc tgcccaacct gtaaaggcgc acgcctcaag 1260 ccggaaatct tggccgtacg cctagactcc ggaagccatg gagcgttgtc cattgctgga 1320 ctaaccgcgc tgtcggtgca tgaagcattc gagtttttgg ataacctcac actgggcaag 1380 cgcgaggaaa tgatcgcggg agctgtgctg agggaaattc acgcccgcct gaaattcttg 1440 cttgacgtgg gcctttccta cctcaccctt gatcgcgccg caggcaccct gtctggtggt 1500 gaagcgcagc gtatccgcct ggctactcaa attggttccg gtctggctgg tgtgctctac 1560 gtcttggatg agccatccat tggtctgcac caacgtgaca accagcgctt aatcactacc 1620 cttgagcatc tccgagatat cggaaacaca ctcattgttg tggaacacga tgaagacacc 1680 atcaggcgcg cagattggct cgtggatatt ggtcctcgag ctgatgaatt tggtggtgaa 1740 gtggtctacc aaggtgagcc gaagggcatt ttggactgcg aagaatccct cacaggtgct 1800 tacttgtctg gtcgtcgaac cctgggtgtt cctgatactc gccgtgagat cgacaaagag 1860 cgacagctca aggtggttgg tgctagggaa aacaacctgc ggggcatcga tgtgaaaatc 1920 ccactgggtg tgctgtgctg catcactggt gtgtcgggat ctggtaaatc cacgctggtc 1980 aatcagattt tggccaaggt tctggccaac aaactcaacc gcgcacgcca agtgcctggt 2040 cgcgcaaagc gggtggaagg cctcgagcac ttggataagt tggtccaggt ggatcagtcg 2100 ccaattggtc gtactccacg ttcaaaccca gcgacgtaca cgggtgtgtt tgataaagtc 2160 cgtaaccttt ttgccgagac cactgaagcg aaggtccgcg gttacaagcc tggccgcttc 2220 tccttcaata ttaagggtgg acgctgcgaa gcatgtcagg gcgatggcac gctgaagatc 2280 gaaatgaact tcctgcccga cgtgtatgtt ccgtgtgaag tctgtgatgg tcagcgctac 2340 aaccgcgaga ccctcgaggt gaagtacaag ggcaaaaaca tcgctgaagt attgggcatg 2400 ccgatctctg aggctgcgga cttctttgag cccatcacct caattcaccg atacctagca 2460 acgctggttg atgtcggcct tggctatgtc cgtttgggcc aggcagcaac aaccttgtct 2520 ggtggtgaag cccagcgtgt gaaacttgcc gctgagctgc agaagcgttc caacggtcgc 2580 accgtttaca tcctcgatga gccaactact ggtttgcact ttgaagatat tcgcaaactc 2640 atgatggtga tccaaggcct ggtggacaag ggtaactccg tgatcatcat cgagcacaac 2700 ctcgacgtga tcaaggctgc cgactggatc gtggacatgg gtccagaagg cggaagcggc 2760 ggtggaactg tggtcgctga aggaacccca gagcaagttg ctgaagttgc gggttcctac 2820 accggccaat tccttaaaga gttgttgtag 2850 <210> 3 <211> 949 <212> PRT <213> Unknown <220> <223> excinuclease ABC subunit A amino acid sequence <400> 3 Met Ala Asp Arg Leu Val Val Arg Gly Ala Arg Glu His Asn Leu Lys 1 5 10 15 Gly Val Asp Ile Asp Leu Pro Arg Asp Ser Met Val Val Phe Thr Gly 20 25 30 Leu Ser Gly Ser Gly Lys Ser Ser Leu Ala Phe Asp Thr Ile Phe Ala 35 40 45 Glu Gly Gln Arg Arg Tyr Val Glu Ser Leu Ser Ser Tyr Ala Arg Met 50 55 60 Phe Leu Gly Gln Met Asp Lys Pro Asp Val Asp Leu Ile Asp Gly Leu 65 70 75 80 Ser Pro Ala Val Ser Ile Asp Gln Lys Ser Thr Asn Arg Asn Pro Arg 85 90 95 Ser Thr Val Gly Thr Ile Thr Glu Val Tyr Asp Tyr Leu Arg Leu Leu 100 105 110 Tyr Ala Arg Ala Gly Thr Ala His Cys Pro Val Cys Asp Ala Arg Val 115 120 125 Glu Arg Gln Thr Pro Gln Gln Met Val Asp Gln Ile Leu Gly Met Glu 130 135 140 Glu Gly Leu Lys Phe Gln Ile Leu Ala Pro Val Val Arg Thr Arg Lys 145 150 155 160 Gly Glu Phe Val Asp Leu Phe Ala Asp Leu Ala Ser Gln Gly Tyr Ser 165 170 175 Arg Val Arg Val Asp Gly Glu Val His Gln Leu Ser Asp Pro Pro Lys 180 185 190 Leu Glu Lys Gln Ile Lys His Asp Ile Asp Val Val Val Asp Arg Leu 195 200 205 Gln Val Lys Ala Ser Gln Lys Gln Arg Leu Thr Asp Ser Met Glu Thr 210 215 220 Ala Leu Arg Leu Ala Asp Gly Val Ala Val Leu Glu Phe Val Gly Leu 225 230 235 240 Glu Glu Asp Asp Pro Asn Arg Leu Arg Arg Phe Ser Glu Lys Met Ser 245 250 255 Cys Pro Asn Gly His Ala Leu Thr Val Asp Glu Leu Glu Pro Arg Ala 260 265 270 Phe Ser Phe Asn Ser Pro Tyr Gly Ala Cys Pro Ala Cys Asp Gly Leu 275 280 285 Gly Val Arg Thr Glu Val Asp Ile Asp Leu Ile Ile Pro Asp Pro Asp 290 295 300 Ala Pro Ala Thr Lys Ala Val Gln Pro Trp Asn Ser Ser Pro Asn His 305 310 315 320 Ser Tyr Phe Glu Lys Leu Ile Glu Gly Leu Ala Lys Ala Leu Gly Phe 325 330 335 Asp Pro Glu Thr Pro Tyr Ser Glu Leu Thr Ala Ala Gln Lys Lys Ala 340 345 350 Leu Val Tyr Gly Ser Lys Glu Glu Val Ser Val Arg Tyr Lys Asn Arg 355 360 365 Tyr Gly Arg Val Arg Ser Trp Thr Ala Pro Phe Glu Gly Val Met Gly 370 375 380 Tyr Phe Asp Arg Lys Leu Glu Gln Thr Asp Ser Glu Thr Gln Lys Asp 385 390 395 400 Arg Leu Leu Gly Tyr Thr Arg Glu Val Pro Cys Pro Thr Cys Lys Gly 405 410 415 Ala Arg Leu Lys Pro Glu Ile Leu Ala Val Arg Leu Asp Ser Gly Ser 420 425 430 His Gly Ala Leu Ser Ile Ala Gly Leu Thr Ala Leu Ser Val His Glu 435 440 445 Ala Phe Glu Phe Leu Asp Asn Leu Thr Leu Gly Lys Arg Glu Glu Met 450 455 460 Ile Ala Gly Ala Val Leu Arg Glu Ile His Ala Arg Leu Lys Phe Leu 465 470 475 480 Leu Asp Val Gly Leu Ser Tyr Leu Thr Leu Asp Arg Ala Ala Gly Thr 485 490 495 Leu Ser Gly Gly Glu Ala Gln Arg Ile Arg Leu Ala Thr Gln Ile Gly 500 505 510 Ser Gly Leu Ala Gly Val Leu Tyr Val Leu Asp Glu Pro Ser Ile Gly 515 520 525 Leu His Gln Arg Asp Asn Gln Arg Leu Ile Thr Thr Leu Glu His Leu 530 535 540 Arg Asp Ile Gly Asn Thr Leu Ile Val Val Glu His Asp Glu Asp Thr 545 550 555 560 Ile Arg Arg Ala Asp Trp Leu Val Asp Ile Gly Pro Arg Ala Gly Glu 565 570 575 Phe Gly Gly Glu Val Val Tyr Gln Gly Glu Pro Lys Gly Ile Leu Asp 580 585 590 Cys Glu Glu Ser Leu Thr Gly Ala Tyr Leu Ser Gly Arg Arg Thr Leu 595 600 605 Gly Val Pro Asp Thr Arg Arg Glu Ile Asp Lys Glu Arg Gln Leu Lys 610 615 620 Val Val Gly Ala Arg Glu Asn Asn Leu Arg Gly Ile Asp Val Lys Ile 625 630 635 640 Pro Leu Gly Val Leu Cys Cys Ile Thr Gly Val Ser Gly Ser Gly Lys 645 650 655 Ser Thr Leu Val Asn Gln Ile Leu Ala Lys Val Leu Ala Asn Lys Leu 660 665 670 Asn Arg Ala Arg Gln Val Pro Gly Arg Ala Lys Arg Val Glu Gly Leu 675 680 685 Glu His Leu Asp Lys Leu Val Gln Val Asp Gln Ser Pro Ile Gly Arg 690 695 700 Thr Pro Arg Ser Asn Pro Ala Thr Tyr Thr Gly Val Phe Asp Lys Val 705 710 715 720 Arg Asn Leu Phe Ala Glu Thr Thr Glu Ala Lys Val Arg Gly Tyr Lys 725 730 735 Pro Gly Arg Phe Ser Phe Asn Ile Lys Gly Gly Arg Cys Glu Ala Cys 740 745 750 Gln Gly Asp Gly Thr Leu Lys Ile Glu Met Asn Phe Leu Pro Asp Val 755 760 765 Tyr Val Pro Cys Glu Val Cys Asp Gly Gln Arg Tyr Asn Arg Glu Thr 770 775 780 Leu Glu Val Lys Tyr Lys Gly Lys Asn Ile Ala Glu Val Leu Gly Met 785 790 795 800 Pro Ile Ser Glu Ala Ala Asp Phe Phe Glu Pro Ile Thr Ser Ile His 805 810 815 Arg Tyr Leu Ala Thr Leu Val Asp Val Gly Leu Gly Tyr Val Arg Leu 820 825 830 Gly Gln Ala Ala Thr Thr Leu Ser Gly Gly Glu Ala Gln Arg Val Lys 835 840 845 Leu Ala Ala Glu Leu Gln Lys Arg Ser Asn Gly Arg Thr Val Tyr Ile 850 855 860 Leu Asp Glu Pro Thr Thr Gly Leu His Phe Glu Asp Ile Arg Lys Leu 865 870 875 880 Met Met Val Ile Gln Gly Leu Val Asp Lys Gly Asn Ser Val Ile Ile 885 890 895 Ile Glu His Asn Leu Asp Val Ile Lys Ala Ala Asp Trp Ile Val Asp 900 905 910 Met Gly Pro Glu Gly Gly Ser Gly Gly Gly Thr Val Val Ala Glu Gly 915 920 925 Thr Pro Glu Gln Val Ala Glu Val Ala Gly Ser Tyr Thr Gly Gln Phe 930 935 940 Leu Lys Glu Leu Leu 945 <210> 4 <211> 2850 <212> DNA <213> Unknown <220> <223> excinuclease ABC subunit A nucleotide sequence <400> 4 ttggctgatc gcctcgtagt gcgcggagcg cgtgaacaca acctaaaagg cgtggatatt 60 gatctgccac gcgactcgat ggtggtgttc accggcctgt caggttccgg taaatcatca 120 ctggcctttg acaccatctt tgcggaaggc cagcgccgtt acgtggagtc gttgtccagt 180 tacgcccgca tgttcttggg gcagatggac aagccggacg tggatttgat tgatggatta 240 tccccagcgg tctccattga ccaaaagtcc accaaccgca accctcggtc caccgtcggt 300 accatcacgg aagtctatga ctacctgcgt cttctgtatg cccgcgctgg taccgcacac 360 tgcccagtgt gtgatgcccg cgtggagcgt caaaccccgc agcagatggt ggaccagatc 420 cttggcatgg aggagggact gaagttccaa atccttgcgc ctgtggtgcg tacccgtaaa 480 ggtgagttcg ttgatctttt cgcagatctt gcatcccaag gttattcccg cgtgcgggtt 540 gatggggaag tgcaccagct ctcggatcct ccaaagctag aaaagcagat caagcacgat 600 attgatgttg tggttgaccg tctgcaggta aaagccagcc aaaagcagcg cctgacagac 660 tctatggaaa ccgcacttcg cctggccgat ggcgtggctg tgctggagtt cgttggcctg 720 gaggaagatg atccgaatag gcttcgtcga ttctctgaaa agatgagctg ccctaacggt 780 cacgcgttga cggttgatga gctggagcct cgtgcttttt ccttcaactc tccttatggc 840 gcgtgtcctg cctgtgatgg cttgggtgtg cgcaccgaag ttgatattga tctgatcatc 900 ccagatccag atgcacctgc aactaaagcg gttcagccct ggaactccag cccaaaccac 960 tcttactttg aaaagctcat tgaaggcctg gcgaaagccc tcggatttga tccggaaact 1020 ccgtacagtg agctcaccgc agctcaaaag aaggctctgg tctatggatc gaaggaagaa 1080 gtaagcgttc gatacaagaa ccgctacgga cgcgtgcgtt cttggactgc gccttttgaa 1140 ggtgtcatgg gctactttga tcgcaagttg gagcagactg attccgaaac ccaaaaagac 1200 cgactgttgg gctacacccg tgaagtgccc tgcccaacct gtaaaggcgc acgcctcaag 1260 ccggaaatct tggccgtacg cctagactcc ggaagccatg gagcgttgtc cattgctgga 1320 ctaaccgcgc tgtcggtgca tgaagcattc gagtttttgg ataacctcac actgggcaag 1380 cgcgaggaaa tgatcgcggg agctgtgctg agggaaattc acgcccgcct gaaattcttg 1440 cttgacgtgg gcctttccta cctcaccctt gatcgcgccg caggcaccct gtctggtggt 1500 gaagcgcagc gtatccgcct ggctactcaa attggttccg gtctggctgg tgtgctctac 1560 gtcttggatg agccatccat tggtctgcac caacgtgaca accagcgctt aatcactacc 1620 cttgagcatc tccgagatat cggaaacaca ctcattgttg tggaacacga tgaagacacc 1680 atcaggcgcg cagattggct cgtggatatt ggtcctcgag ctggtgaatt tggtggtgaa 1740 gtggtctacc aaggtgagcc gaagggcatt ttggactgcg aagaatccct cacaggtgct 1800 tacttgtctg gtcgtcgaac cctgggtgtt cctgatactc gccgtgagat cgacaaagag 1860 cgacagctca aggtggttgg tgctagggaa aacaacctgc ggggcatcga tgtgaaaatc 1920 ccactgggtg tgctgtgctg catcactggt gtgtcgggat ctggtaaatc cacgctggtc 1980 aatcagattt tggccaaggt tctggccaac aaactcaacc gcgcacgcca agtgcctggt 2040 cgcgcaaagc gggtggaagg cctcgagcac ttggataagt tggtccaggt ggatcagtcg 2100 ccaattggtc gtactccacg ttcaaaccca gcgacgtaca cgggtgtgtt tgataaagtc 2160 cgtaaccttt ttgccgagac cactgaagcg aaggtccgcg gttacaagcc tggccgcttc 2220 tccttcaata ttaagggtgg acgctgcgaa gcatgtcagg gcgatggcac gctgaagatc 2280 gaaatgaact tcctgcccga cgtgtatgtt ccgtgtgaag tctgtgatgg tcagcgctac 2340 aaccgcgaga ccctcgaggt gaagtacaag ggcaaaaaca tcgctgaagt attgggcatg 2400 ccgatctctg aggctgcgga cttctttgag cccatcacct caattcaccg atacctagca 2460 acgctggttg atgtcggcct tggctatgtc cgtttgggcc aggcagcaac aaccttgtct 2520 ggtggtgaag cccagcgtgt gaaacttgcc gctgagctgc agaagcgttc caacggtcgc 2580 accgtttaca tcctcgatga gccaactact ggtttgcact ttgaagatat tcgcaaactc 2640 atgatggtga tccaaggcct ggtggacaag ggtaactccg tgatcatcat cgagcacaac 2700 ctcgacgtga tcaaggctgc cgactggatc gtggacatgg gtccagaagg cggaagcggc 2760 ggtggaactg tggtcgctga aggaacccca gagcaagttg ctgaagttgc gggttcctac 2820 accggccaat tccttaaaga gttgttgtag 2850 <210> 5 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer 1F <400> 5 tcgagctcgg tacccagtgc cctgcccaac ctgta 35 <210> 6 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer 2R <400> 6 ccaaattcat cagctcgagg 20 <210> 7 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer 3F <400> 7 cctcgagctg atgaatttgg 20 <210> 8 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer 4R <400> 8 ctctagagga tccccaggag aagcggccag gcttg 35 <210> 9 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer 5F <400> 9 agtgccctgc ccaacctgta 20 <210> 10 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer 6R <400> 10 aggagaagcg gccaggcttg 20 <210> 11 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer odhA_up_F <400> 11 tgaattcgag ctcggtaccc ttgaacggaa ttgggtgg 38 <210> 12 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer odhA_up_R <400> 12 cccaggtggc atcggtacct tcacccagcg ccacgcag 38 <210> 13 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer odhA_down_F <400> 13 cgctgggtga aggtaccgat gccacctggg ttggtcaag 39 <210> 14 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer odhA_down_R <400> 14 gtcgactcta gaggatcccc ggacaaggaa tggagaga 38 <210> 15 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> primer odhA_del_F <400> 15 cttaccgttg ttgccctt 18 <210> 16 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer odhA_del_R <400> 16 ctccttcacc cacatcatt 19 <210> 17 <211> 1205 <212> PRT <213> Unknown <220> <223> OdhA amino acid sequence <400> 17 Met Phe Gln Gln Phe Gln Lys Asp Pro Lys Ser Val Asp Lys Glu Trp 1 5 10 15 Arg Glu Leu Phe Glu Ala Gln Gly Gly Pro Asn Ala Thr Pro Ala Thr 20 25 30 Thr Glu Ala Gln Pro Ser Ala Pro Lys Glu Ser Ala Lys Pro Ala Pro 35 40 45 Lys Ala Ala Pro Ala Ala Lys Ala Ala Pro Arg Val Glu Thr Lys Pro 50 55 60 Ala Ala Lys Thr Ala Pro Lys Ala Lys Glu Ser Ser Val Pro Gln Gln 65 70 75 80 Pro Lys Leu Pro Glu Pro Gly Gln Thr Pro Ile Arg Gly Ile Phe Lys 85 90 95 Ser Ile Ala Lys Asn Met Asp Ile Ser Leu Glu Ile Pro Thr Ala Thr 100 105 110 Ser Val Arg Asp Met Pro Ala Arg Leu Met Phe Glu Asn Arg Ala Met 115 120 125 Val Asn Asp Gln Leu Lys Arg Thr Arg Gly Gly Lys Ile Ser Phe Thr 130 135 140 His Ile Ile Gly Tyr Ala Met Val Lys Ala Val Met Ala His Pro Asp 145 150 155 160 Met Asn Asn Ser Tyr Asp Val Ile Asp Gly Lys Pro Thr Leu Ile Val 165 170 175 Pro Glu His Ile Asn Leu Gly Leu Ala Ile Asp Leu Pro Gln Lys Asp 180 185 190 Gly Ser Arg Ala Leu Val Val Ala Ala Ile Lys Glu Thr Glu Lys Met 195 200 205 Asn Phe Ser Glu Phe Leu Ala Ala Tyr Glu Asp Ile Val Thr Arg Ser 210 215 220 Arg Lys Gly Lys Leu Thr Met Asp Asp Tyr Gln Gly Val Thr Val Ser 225 230 235 240 Leu Thr Asn Pro Gly Gly Ile Gly Thr Arg His Ser Val Pro Arg Leu 245 250 255 Thr Lys Gly Gln Gly Thr Ile Ile Gly Val Gly Ser Met Asp Tyr Pro 260 265 270 Ala Glu Phe Gln Gly Ala Ser Glu Asp Arg Leu Ala Glu Leu Gly Val 275 280 285 Gly Lys Leu Val Thr Ile Thr Ser Thr Tyr Asp His Arg Val Ile Gln 290 295 300 Gly Ala Val Ser Gly Glu Phe Leu Arg Thr Met Ser Arg Leu Leu Thr 305 310 315 320 Asp Asp Ser Phe Trp Asp Glu Ile Phe Asp Ala Met Asn Val Pro Tyr 325 330 335 Thr Pro Met Arg Trp Ala Gln Asp Val Pro Asn Thr Gly Val Asp Lys 340 345 350 Asn Thr Arg Val Met Gln Leu Ile Glu Ala Tyr Arg Ser Arg Gly His 355 360 365 Leu Ile Ala Asp Thr Asn Pro Leu Ser Trp Val Gln Pro Gly Met Pro 370 375 380 Val Pro Asp His Arg Asp Leu Asp Ile Glu Thr His Ser Leu Thr Ile 385 390 395 400 Trp Asp Leu Asp Arg Thr Phe Ser Val Gly Gly Phe Gly Gly Lys Glu 405 410 415 Thr Met Thr Leu Arg Glu Val Leu Ser Arg Leu Arg Ala Ala Tyr Thr 420 425 430 Leu Lys Val Gly Ser Glu Tyr Thr His Ile Leu Asp Arg Asp Glu Arg 435 440 445 Thr Trp Leu Gln Asp Arg Leu Glu Ala Gly Met Pro Lys Pro Thr Gln 450 455 460 Ala Glu Gln Lys Tyr Ile Leu Gln Lys Leu Asn Ala Ala Glu Ala Phe 465 470 475 480 Glu Asn Phe Leu Gln Thr Lys Tyr Val Gly Gln Lys Arg Phe Ser Leu 485 490 495 Glu Gly Ala Glu Ala Leu Ile Pro Leu Met Asp Ser Ala Ile Asp Thr 500 505 510 Ala Ala Gly Gln Gly Leu Asp Glu Val Val Ile Gly Met Pro His Arg 515 520 525 Gly Arg Leu Asn Val Leu Phe Asn Ile Val Gly Lys Pro Leu Ala Ser 530 535 540 Ile Phe Asn Glu Phe Glu Gly Gln Met Glu Gln Gly Gln Ile Gly Gly 545 550 555 560 Ser Gly Asp Val Lys Tyr His Leu Gly Ser Glu Gly Gln His Leu Gln 565 570 575 Met Phe Gly Asp Gly Glu Ile Lys Val Ser Leu Thr Ala Asn Pro Ser 580 585 590 His Leu Glu Ala Val Asn Pro Val Met Glu Gly Ile Val Arg Ala Lys 595 600 605 Gln Asp Tyr Leu Asp Lys Gly Val Asp Gly Lys Thr Val Val Pro Leu 610 615 620 Leu Leu His Gly Asp Ala Ala Phe Ala Gly Leu Gly Ile Val Pro Glu 625 630 635 640 Thr Ile Asn Leu Ala Lys Leu Arg Gly Tyr Asp Val Gly Gly Thr Ile 645 650 655 His Ile Val Val Asn Asn Gln Ile Gly Phe Thr Thr Thr Pro Asp Ser 660 665 670 Ser Arg Ser Met His Tyr Ala Thr Asp Tyr Ala Lys Ala Phe Gly Cys 675 680 685 Pro Val Phe His Val Asn Gly Asp Asp Pro Glu Ala Val Val Trp Val 690 695 700 Gly Gln Leu Ala Thr Glu Tyr Arg Arg Arg Phe Gly Lys Asp Val Phe 705 710 715 720 Ile Asp Leu Val Cys Tyr Arg Leu Arg Gly His Asn Glu Ala Asp Asp 725 730 735 Pro Ser Met Thr Gln Pro Lys Met Tyr Glu Leu Ile Thr Gly Arg Glu 740 745 750 Thr Val Arg Ala Gln Tyr Thr Glu Asp Leu Leu Gly Arg Gly Asp Leu 755 760 765 Ser Asn Glu Asp Ala Glu Ala Val Val Arg Asp Phe His Asp Gln Met 770 775 780 Glu Ser Val Phe Asn Glu Val Lys Glu Gly Gly Lys Lys Gln Ala Glu 785 790 795 800 Ala Gln Thr Gly Ile Thr Gly Ser Gln Lys Leu Pro His Gly Leu Glu 805 810 815 Thr Asn Ile Ser Arg Glu Glu Leu Leu Glu Leu Gly Gln Ala Phe Ala 820 825 830 Asn Thr Pro Glu Gly Phe Asn Tyr His Pro Arg Val Ala Pro Val Ala 835 840 845 Lys Lys Arg Val Ser Ser Val Thr Glu Gly Gly Ile Asp Trp Ala Trp 850 855 860 Gly Glu Leu Leu Ala Phe Gly Ser Leu Ala Asn Ser Gly Arg Leu Val 865 870 875 880 Arg Leu Ala Gly Glu Asp Ser Arg Arg Gly Thr Phe Thr Gln Arg His 885 890 895 Ala Val Ala Ile Asp Pro Ala Thr Ala Glu Glu Phe Asn Pro Leu His 900 905 910 Glu Leu Ala Gln Ser Lys Gly Asn Asn Gly Lys Phe Leu Val Tyr Asn 915 920 925 Ser Ala Leu Thr Glu Tyr Ala Gly Met Gly Phe Glu Tyr Gly Tyr Ser 930 935 940 Val Gly Asn Glu Asp Ser Val Val Ala Trp Glu Ala Gln Phe Gly Asp 945 950 955 960 Phe Ala Asn Gly Ala Gln Thr Ile Ile Asp Glu Tyr Val Ser Ser Gly 965 970 975 Glu Ala Lys Trp Gly Gln Thr Ser Lys Leu Ile Leu Leu Leu Pro His 980 985 990 Gly Tyr Glu Gly Gln Gly Pro Asp His Ser Ser Ala Arg Ile Glu Arg 995 1000 1005 Phe Leu Gln Leu Cys Ala Glu Gly Ser Met Thr Val Ala Gln Pro Ser 1010 1015 1020 Thr Pro Ala Asn His Phe His Leu Leu Arg Arg His Ala Leu Ser Asp 1025 1030 1035 1040 Leu Lys Arg Pro Leu Val Ile Phe Thr Pro Lys Ser Met Leu Arg Asn 1045 1050 1055 Lys Ala Ala Ala Ser Ala Pro Glu Asp Phe Thr Glu Val Thr Lys Phe 1060 1065 1070 Gln Ser Val Ile Asp Asp Pro Asn Val Ala Asp Ala Ala Lys Val Lys 1075 1080 1085 Lys Val Met Leu Val Ser Gly Lys Leu Tyr Tyr Glu Leu Ala Lys Arg 1090 1095 1100 Lys Glu Lys Asp Gly Arg Asp Asp Ile Ala Ile Val Arg Ile Glu Met 1105 1110 1115 1120 Leu His Pro Ile Pro Phe Asn Arg Ile Ser Glu Ala Leu Ala Gly Tyr 1125 1130 1135 Pro Asn Ala Glu Glu Val Leu Phe Val Gln Asp Glu Pro Ala Asn Gln 1140 1145 1150 Gly Pro Trp Pro Phe Tyr Gln Glu His Leu Pro Glu Leu Ile Pro Asn 1155 1160 1165 Met Pro Lys Met Arg Arg Val Ser Arg Arg Ala Gln Ser Ser Thr Ala 1170 1175 1180 Thr Gly Val Ala Lys Val His Gln Leu Glu Glu Lys Gln Leu Ile Asp 1185 1190 1195 1200 Glu Ala Phe Glu Ala 1205 <210> 18 <211> 3618 <212> DNA <213> Unknown <220> <223> OdhA nucleotide sequence <400> 18 atgttccagc agttccagaa ggaccccaag tccgtggaca aggaatggag agaactcttt 60 gaggcgcagg ggggaccaaa tgctaccccc gctacaacag aagcacagcc ttcagcgccc 120 aaggagtctg cgaaaccagc accaaaggct gcccctgcag ccaaggcagc accgcgcgta 180 gaaaccaagc cggccgccaa gaccgcccct aaggccaagg agtcctcagt gccacagcaa 240 cctaagcttc cggagccagg acaaacccca atcaggggta ttttcaagtc catcgcgaag 300 aacatggata tctccctgga aatcccaacc gcaacctcgg ttcgcgatat gccagctcgc 360 ctcatgttcg aaaaccgcgc gatggtcaac gatcagctca agcgcacccg cggtggcaag 420 atctccttca cccacatcat tggctacgcc atggtgaagg cagtcatggc tcacccggac 480 atgaacaact cctacgacgt catcgacggc aagccaaccc tgatcgtgcc tgagcacatc 540 aacctgggcc ttgccatcga ccttcctcag aaggacggct cccgcgcact tgtcgtagca 600 gccatcaagg aaaccgagaa gatgaacttc tccgagttcc tcgcagcata cgaagacatc 660 gtgacacgct cccgcaaggg caagctcacc atggatgact accagggcgt taccgtttcc 720 ttgaccaacc caggtggcat cggtacccgc cactctgtcc cacgtctgac caagggccag 780 ggcaccatca tcggtgtcgg ttccatggat tacccagcag agttccaggg cgcttccgaa 840 gaccgccttg cagagctcgg cgttggcaag cttgtcacca tcacctccac ctacgatcac 900 cgcgtgatcc agggtgctgt gtccggtgaa ttcctgcgta ccatgtctcg cctgctcacc 960 gatgattcct tctgggatga gatcttcgac gcaatgaacg ttccttacac cccaatgcgt 1020 tgggcacagg acgttccaaa caccggtgtt gataagaaca cccgcgtcat gcagctcatt 1080 gaggcatacc gctcccgtgg acacctcatc gctgacacca acccactttc atgggttcag 1140 cctggcatgc cagttccaga ccaccgcgac ctcgacatcg agacccacag cctgaccatc 1200 tgggatctgg accgtacctt cagcgtcggt ggcttcggcg gcaaggagac catgaccctg 1260 cgcgaggtac tgtcccgcct gcgcgctgcc tacaccttga aggtcggctc cgaatacacc 1320 cacatcctgg accgcgacga gcgcacctgg ctgcaggacc gcctcgaagc cggaatgcca 1380 aagccaaccc aggcagagca gaagtacatc ctgcagaagc tgaacgccgc agaggctttc 1440 gagaacttcc tgcagaccaa gtacgtcggc cagaagcgct tctccctcga aggtgcagaa 1500 gctctcatcc cactgatgga ctccgccatc gacaccgccg caggccaggg cctcgacgaa 1560 gttgtcatcg gtatgccaca ccgtggtcgc ctcaacgtgc tgttcaacat cgtgggcaag 1620 ccactggcat ccatcttcaa cgagtttgaa ggccaaatgg agcagggcca gatcggtggc 1680 tccggtgacg tgaagtacca cctcggttcc gaaggccagc acctgcagat gttcggcgac 1740 ggcgagatca aggtctccct gactgctaac ccgtcccacc tggaagctgt taacccagtg 1800 atggaaggta tcgtccgcgc aaagcaggac tacctggaca agggcgtaga cggcaagact 1860 gttgtgccac tgctgctcca cggtgacgct gcattcgcag gcctgggcat cgtgccagaa 1920 accatcaacc tggctaagct gcgtggctac gacgtcggag gcaccatcca catcgtggtg 1980 aacaaccaga tcggcttcac caccacccca gactccagcc gctccatgca ctacgcaacc 2040 gactacgcca aggcattcgg ctgcccagtc ttccacgtca atggtgatga cccagaggca 2100 gttgtctggg ttggccagct ggcaaccgag taccgtcgtc gcttcggcaa ggacgtcttc 2160 atcgacctcg tttgctaccg cctccgcggc cacaacgaag ctgatgatcc ttccatgacc 2220 cagccaaaga tgtatgagct catcaccggc cgcgagaccg ttcgtgctca gtacaccgaa 2280 gacctgctcg gacgtggaga cctctccaac gaagatgcag aagcagtcgt ccgcgacttc 2340 cacgaccaga tggaatctgt gttcaacgaa gtcaaggaag gcggcaagaa gcaggctgag 2400 gcacagaccg gcatcaccgg ctcccagaag cttccacacg gccttgagac caacatctcc 2460 cgtgaagagc tcctggaact gggacaggct ttcgccaaca ccccagaagg cttcaactac 2520 cacccacgtg tggctccagt tgctaagaag cgcgtctcct ctgtcaccga aggtggcatc 2580 gactgggcat ggggcgagct cctcgccttc ggttccctgg ctaactccgg ccgcttggtt 2640 cgccttgcag gtgaagattc ccgccgcggt accttcaccc agcgccacgc agttgccatc 2700 gacccagcga ccgctgaaga gttcaaccca ctccacgagc ttgcacagtc caagggcaac 2760 aacggtaagt tcctggtcta caactccgca ctgaccgagt acgcaggcat gggcttcgag 2820 tacggctact ccgtaggaaa cgaagactcc gtcgttgcat gggaagcaca gttcggcgac 2880 ttcgccaacg gcgctcagac catcatcgat gagtacgtct cctcaggcga agctaagtgg 2940 ggccagacct ccaagctgat ccttctgctg cctcacggct acgaaggcca gggcccagac 3000 cactcttccg cacgtatcga gcgcttcctg cagctgtgcg ctgagggttc catgactgtt 3060 gctcagccat ccaccccagc aaaccacttc cacctgctgc gtcgtcacgc tctgtccgac 3120 ctgaagcgtc cactggttat cttcaccccg aagtccatgc tgcgtaacaa ggctgctgcc 3180 tccgcaccag aagacttcac tgaggtcacc aagttccaat ccgtgatcga cgatccaaac 3240 gttgcagatg cagccaaggt gaagaaggtc atgctggtct ccggcaagct gtactacgaa 3300 ttggcaaagc gcaaggagaa ggacggacgc gacgacatcg cgatcgttcg tatcgaaatg 3360 ctccacccaa ttccgttcaa ccgcatctcc gaggctcttg ccggctaccc taacgctgag 3420 gaagtcctct tcgttcagga tgagccagca aaccagggcc catggccgtt ctaccaggag 3480 cacctcccag agctgatccc gaacatgcca aagatgcgcc gcgtttcccg ccgcgctcag 3540 tcctccaccg caactggtgt tgctaaggtg caccagctgg aggagaagca gcttatcgac 3600 gaggctttcg aggcttaa 3618 <210> 19 <211> 5803 <212> DNA <213> Artificial Sequence <220> <223> pDCM2 nucleotide sequence <400> 19 gttcgcttgc tgtccataaa accgcccagt ctagctatcg ccatgtaagc ccactgcaag 60 ctacctgctt tctctttgcg cttgcgtttt cccttgtcca gatagcccag tagctgacat 120 tcatccgggg tcagcaccgt ttctgcggac tggctttcta cgtgttccgc ttcctttagc 180 agcccttgcg ccctgagtgc ttgcggcagc gtgaagctag cttttatcgc cattcgccat 240 tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc 300 tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg ttttcccagt 360 cacgacgttg taaaacgacg gccagtgaat tcgagctcgg tacccgggga tcctctagag 420 tcgacctgca ggcatgcaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat 480 tgttatccgc tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg 540 ggtgcctaat gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag 600 tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt 660 ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg 720 ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg 780 gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag 840 gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga 900 cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct 960 ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc 1020 tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta tctcagttcg 1080 gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc 1140 tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca 1200 ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag 1260 ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct 1320 ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc 1380 accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga 1440 tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca 1500 cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttgggg 1560 tgggcgaaga actccagcat gagatccccg cgctggagga tcatccagcc ctgatagaaa 1620 cagaagccac tggagcacct caaaaacacc atcatacact aaatcagtaa gttggcagca 1680 tcacccgacg cactttgcgc cgaataaata cctgtgacgg aagatcactt cgcagaataa 1740 ataaatcctg gtgtccctgt tgataccggg aagccctggg ccaacttttg gcgaaaatga 1800 gacgttgatc ggcacgtaag aggttccaac tttcaccata atgaaataag atcactaccg 1860 ggcgtatttt ttgagttatc gagattttca ggagctgata gaaacagaag ccactggagc 1920 acctcaaaaa caccatcata cactaaatca gtaagttggc agcatcaccc gacgcacttt 1980 gcgccgaata aatacctgtg acggaagatc acttcgcaga ataaataaat cctggtgtcc 2040 ctgttgatac cgggaagccc tgggccaact tttggcgaaa atgagacgtt gatcggcacg 2100 taagaggttc caactttcac cataatgaaa taagatcact accgggcgta ttttttgagt 2160 tatcgagatt ttcaggagct ctttggcatc gtctctcgcc tgtcccctca gttcagtaat 2220 ttcctgcatt tgcctgtttc cagtcggtag atattccaca aaacagcagg gaagcagcgc 2280 ttttccgctg cataaccctg cttcggggtc attatagcga ttttttcggt atatccatcc 2340 tttttcgcac gatatacagg attttgccaa agggttcgtg tagactttcc ttggtgtatc 2400 caacggcgtc agccgggcag gataggtgaa gtaggcccac ccgcgagcgg gtgttccttc 2460 ttcactgtcc cttattcgca cctggcggtg ctcaacggga atcctgctct gcgaggctgg 2520 ccggctaccg ccggcgtaac agatgagggc aagcggatgg ctgatgaaac caagccaacc 2580 aggaagggca gcccacctat caaggtgtac tgccttccag acgaacgaag agcgattgag 2640 gaaaaggcgg cggcggccgg catgagcctg tcggcctacc tgctggccgt cggccagggc 2700 tacaaaatca cgggcgtcgt ggactatgag cacgtccgcg agggcgtccc ggaaaacgat 2760 tccgaagccc aacctttcat agaaggcggc ggtggaatcg aaatctcgtg atggcaggtt 2820 gggcgtcgct tggtcggtca tttcgaaaaa ggttaggaat acggttagcc atttgcctgc 2880 ttttatatag ttcantatgg gattcacctt tatgttgata agaaataaaa gaaaatgcca 2940 ataggatatc ggcattttct tttgcgtttt tatttgttaa ctgttaattg tccttgttca 3000 aggatgctgt ctttgacaac agatgttttc ttgcctttga tgttcagcag gaagctcggc 3060 gcaaacgttg attgtttgtc tgcgtagaat cctctgtttg tcatatagct tgtaatcacg 3120 acattgtttc ctttcgcttg aggtacagcg aagtgtgagt aagtaaaggt tacatcgtta 3180 ggcggatcaa gatccatttt taacacaagg ccagttttgt tcagcggctt gtatgggcca 3240 gttaaagaat tagaaacata accaagcatg taaatatcgt tagacgtaat gccgtcaatc 3300 gtcatttttg atccgcggga gtcagtgaac aggtaccatt tgccgttcat tttaaagacg 3360 ttcgcgcgtt caatttcatc tgttactgtg ttagatgcaa tcagcggttt catcactttt 3420 ttcagtgtgt aatcatcgtt tagctcaatc ataccgagag cgccgtttgc taactcagcc 3480 gtgcgttttt tatcgctttg cagaagtttt tgactttctt gacggaagaa tgatgtgctt 3540 ttgccatagt atgctttgtt aaataaagat tcttcgcctt ggtagccatc ttcagttcca 3600 gtgtttgctt caaatactaa gtatttgtgg cctttatctt ctacgtagtg aggatctctc 3660 agcgtatggt tgtcgcctga gctgtagttg ccttcatcga tgaactgctg tacattttga 3720 tacgtttttc cgtcaccgtc aaagattgat ttataatcct ctacaccgtt gatgttcaaa 3780 gagctgtctg atgctgatac gttaacttgt gcagttgtca gtgtttgttt gccgtaatgt 3840 ttaccggaga aatcagtgta gaataaacgg atttttccgt cagatgtaaa tgtggctgaa 3900 cctgaccatt cttgtgtttg gtcttttagg atagaatcat ttgcatcgaa tttgtcgctg 3960 tctttaaaga cgcggccagc gtttttccag ctgtcaatag aagtttcgcc gactttttga 4020 tagaacatgt aaatcgatgt gtcatccgca tttttaggat ctccggctaa tgcaaagacg 4080 atgtggtagc cgtgatagtt tgcgacagtg ccgtcagcgt tttgtaatgg ccagctgtcc 4140 caaacgtcca ggccttttgc agaagagata tttttaattg tggacgaatc aaattcagaa 4200 acttgatatt tttcattttt ttgctgttca gggatttgca gcatatcatg gcgtgtaata 4260 tgggaaatgc cgtatgtttc cttatatggc ttttggttcg tttctttcgc aaacgcttga 4320 gttgcgcctc ctgccagcag tgcggtagta aaggttaata ctgttgcttg ttttgcaaac 4380 tttttgatgt tcatcgttca tgtctccttt tttatgtact gtgttagcgg tctgcttctt 4440 ccagccctcc tgtttgaaga tggcaagtta gttacgcaca ataaaaaaag acctaaaata 4500 tgtaaggggt gacgccaaag tatacacttt gccctttaca cattttaggt cttgcctgct 4560 ttatcagtaa caaacccgcg cgatttactt ttcgacctca ttctattaga ctctcgtttg 4620 gattgcaact ggtctatttt cctcttttgt ttgatagaaa atcataaaag gatttgcaga 4680 ctacgggcct aaagaactaa aaaatctatc tgtttctttt cattctctgt attttttata 4740 gtttctgttg catgggcata aagttgcctt tttaatcaca attcagaaaa tatcataata 4800 tctcatttca ctaaataata gtgaacggca ggtatatgtg atgggttaaa aaggatcacc 4860 ccagagtccc gctcagaaga actcgtcaag aaggcgatag aaggcgatgc gctgcgaatc 4920 gggagcggcg ataccgtaaa gcacgaggaa gcggtcagcc cattcgccgc caagctcttc 4980 agcaatatca cgggtagcca acgctatgtc ctgatagcgg tccgccacac ccagccggcc 5040 acagtcgatg aatccagaaa agcggccatt ttccaccatg atattcggca agcaggcatc 5100 gccatgggtc acgacgagat cctcgccgtc gggcatccgc gccttgagcc tggcgaacag 5160 ttcggctggc gcgagcccct gatgctcttc gtccagatca tcctgatcga caagaccggc 5220 ttccatccga gtacgtgctc gctcgatgcg atgtttcgct tggtggtcga atgggcaggt 5280 agccggatca agcgtatgca gccgccgcat tgcatcagcc atgatggata ctttctcggc 5340 aggagcaagg tgagatgaca ggagatcctg ccccggcact tcgcccaata gcagccagtc 5400 ccttcccgct tcagtgacaa cgtcgagaca gctgcgcaag gaacgcccgt cgtggccagc 5460 cacgatagcc gcgctgcctc gtcttggagt tcattcaggg caccggacag gtcggtcttg 5520 acaaaaagaa ccgggcgccc ctgcgctgac agccggaaca cggcggcatc agagcagccg 5580 attgtctgtt gtgcccagtc atagccgaat agcctctcca cccaagcggc cggagaacct 5640 gcgtgcaatc catcttgttc aatcatgcga aacgatcctc atcctgtctc ttgatcagat 5700 cttgatcccc tgcgccatca gatccttggc ggcaagaaag ccatccagtt tactttgcag 5760 ggcttcccaa ccttaccaga gggcgcccca gctggcaatt ccg 5803 <110> CJ CheilJedang Corporation <120> Novel excinuclease ABC subunit A variant and a method for producing L-glutamic acid using the same <130> KPA201585-KR <160> 19 <170> KoPatentIn 3.0 <210> 1 <211> 949 <212> PRT <213> Unknown <220> <223> excinuclease ABC subunit A variant amino acid sequence <400> 1 Met Ala Asp Arg Leu Val Val Arg Gly Ala Arg Glu His Asn Leu Lys 1 5 10 15 Gly Val Asp Ile Asp Leu Pro Arg Asp Ser Met Val Val Phe Thr Gly 20 25 30 Leu Ser Gly Ser Gly Lys Ser Ser Leu Ala Phe Asp Thr Ile Phe Ala 35 40 45 Glu Gly Gln Arg Arg Tyr Val Glu Ser Leu Ser Ser Tyr Ala Arg Met 50 55 60 Phe Leu Gly Gln Met Asp Lys Pro Asp Val Asp Leu Ile Asp Gly Leu 65 70 75 80 Ser Pro Ala Val Ser Ile Asp Gln Lys Ser Thr Asn Arg Asn Pro Arg 85 90 95 Ser Thr Val Gly Thr Ile Thr Glu Val Tyr Asp Tyr Leu Arg Leu Leu 100 105 110 Tyr Ala Arg Ala Gly Thr Ala His Cys Pro Val Cys Asp Ala Arg Val 115 120 125 Glu Arg Gln Thr Pro Gln Gln Met Val Asp Gln Ile Leu Gly Met Glu 130 135 140 Glu Gly Leu Lys Phe Gln Ile Leu Ala Pro Val Val Arg Thr Arg Lys 145 150 155 160 Gly Glu Phe Val Asp Leu Phe Ala Asp Leu Ala Ser Gln Gly Tyr Ser 165 170 175 Arg Val Arg Val Asp Gly Glu Val His Gln Leu Ser Asp Pro Lys 180 185 190 Leu Glu Lys Gln Ile Lys His Asp Ile Asp Val Val Val Asp Arg Leu 195 200 205 Gln Val Lys Ala Ser Gln Lys Gln Arg Leu Thr Asp Ser Met Glu Thr 210 215 220 Ala Leu Arg Leu Ala Asp Gly Val Ala Val Leu Glu Phe Val Gly Leu 225 230 235 240 Glu Glu Asp Asp Pro Asn Arg Leu Arg Arg Phe Ser Glu Lys Met Ser 245 250 255 Cys Pro Asn Gly His Ala Leu Thr Val Asp Glu Leu Glu Pro Arg Ala 260 265 270 Phe Ser Phe Asn Ser Pro Tyr Gly Ala Cys Pro Ala Cys Asp Gly Leu 275 280 285 Gly Val Arg Thr Glu Val Asp Ile Asp Leu Ile Ile Pro Asp Pro Asp 290 295 300 Ala Pro Ala Thr Lys Ala Val Gln Pro Trp Asn Ser Ser Pro Asn His 305 310 315 320 Ser Tyr Phe Glu Lys Leu Ile Glu Gly Leu Ala Lys Ala Leu Gly Phe 325 330 335 Asp Pro Glu Thr Pro Tyr Ser Glu Leu Thr Ala Ala Gln Lys Lys Ala 340 345 350 Leu Val Tyr Gly Ser Lys Glu Glu Val Ser Val Arg Tyr Lys Asn Arg 355 360 365 Tyr Gly Arg Val Arg Ser Trp Thr Ala Pro Phe Glu Gly Val Met Gly 370 375 380 Tyr Phe Asp Arg Lys Leu Glu Gln Thr Asp Ser Glu Thr Gln Lys Asp 385 390 395 400 Arg Leu Leu Gly Tyr Thr Arg Glu Val Pro Cys Pro Thr Cys Lys Gly 405 410 415 Ala Arg Leu Lys Pro Glu Ile Leu Ala Val Arg Leu Asp Ser Gly Ser 420 425 430 His Gly Ala Leu Ser Ile Ala Gly Leu Thr Ala Leu Ser Val His Glu 435 440 445 Ala Phe Glu Phe Leu Asp Asn Leu Thr Leu Gly Lys Arg Glu Glu Met 450 455 460 Ile Ala Gly Ala Val Leu Arg Glu Ile His Ala Arg Leu Lys Phe Leu 465 470 475 480 Leu Asp Val Gly Leu Ser Tyr Leu Thr Leu Asp Arg Ala Ala Gly Thr 485 490 495 Leu Ser Gly Gly Glu Ala Gln Arg Ile Arg Leu Ala Thr Gln Ile Gly 500 505 510 Ser Gly Leu Ala Gly Val Leu Tyr Val Leu Asp Glu Pro Ser Ile Gly 515 520 525 Leu His Gln Arg Asp Asn Gln Arg Leu Ile Thr Thr Leu Glu His Leu 530 535 540 Arg Asp Ile Gly Asn Thr Leu Ile Val Val Glu His Asp Glu Asp Thr 545 550 555 560 Ile Arg Arg Ala Asp Trp Leu Val Asp Ile Gly Pro Arg Ala Asp Glu 565 570 575 Phe Gly Gly Glu Val Val Tyr Gln Gly Glu Pro Lys Gly Ile Leu Asp 580 585 590 Cys Glu Glu Ser Leu Thr Gly Ala Tyr Leu Ser Gly Arg Arg Thr Leu 595 600 605 Gly Val Pro Asp Thr Arg Arg Glu Ile Asp Lys Glu Arg Gln Leu Lys 610 615 620 Val Val Gly Ala Arg Glu Asn Asn Leu Arg Gly Ile Asp Val Lys Ile 625 630 635 640 Pro Leu Gly Val Leu Cys Cys Ile Thr Gly Val Ser Gly Ser Gly Lys 645 650 655 Ser Thr Leu Val Asn Gln Ile Leu Ala Lys Val Leu Ala Asn Lys Leu 660 665 670 Asn Arg Ala Arg Gln Val Pro Gly Arg Ala Lys Arg Val Glu Gly Leu 675 680 685 Glu His Leu Asp Lys Leu Val Gln Val Asp Gln Ser Pro Ile Gly Arg 690 695 700 Thr Pro Arg Ser Asn Pro Ala Thr Tyr Thr Gly Val Phe Asp Lys Val 705 710 715 720 Arg Asn Leu Phe Ala Glu Thr Thr Glu Ala Lys Val Arg Gly Tyr Lys 725 730 735 Pro Gly Arg Phe Ser Phe Asn Ile Lys Gly Gly Arg Cys Glu Ala Cys 740 745 750 Gln Gly Asp Gly Thr Leu Lys Ile Glu Met Asn Phe Leu Pro Asp Val 755 760 765 Tyr Val Pro Cys Glu Val Cys Asp Gly Gln Arg Tyr Asn Arg Glu Thr 770 775 780 Leu Glu Val Lys Tyr Lys Gly Lys Asn Ile Ala Glu Val Leu Gly Met 785 790 795 800 Pro Ile Ser Glu Ala Ala Asp Phe Phe Glu Pro Ile Thr Ser Ile His 805 810 815 Arg Tyr Leu Ala Thr Leu Val Asp Val Gly Leu Gly Tyr Val Arg Leu 820 825 830 Gly Gln Ala Ala Thr Thr Leu Ser Gly Gly Glu Ala Gln Arg Val Lys 835 840 845 Leu Ala Ala Glu Leu Gln Lys Arg Ser Asn Gly Arg Thr Val Tyr Ile 850 855 860 Leu Asp Glu Pro Thr Thr Gly Leu His Phe Glu Asp Ile Arg Lys Leu 865 870 875 880 Met Met Val Ile Gln Gly Leu Val Asp Lys Gly Asn Ser Val Ile Ile 885 890 895 Ile Glu His Asn Leu Asp Val Ile Lys Ala Ala Asp Trp Ile Val Asp 900 905 910 Met Gly Pro Glu Gly Gly Ser Gly Gly Gly Thr Val Val Ala Glu Gly 915 920 925 Thr Pro Glu Gln Val Ala Glu Val Ala Gly Ser Tyr Thr Gly Gln Phe 930 935 940 Leu Lys Glu Leu Leu 945 <210> 2 <211> 2850 <212> DNA <213> Unknown <220> <223> excinuclease ABC subunit A variant nucleotide sequence <400> 2 ttggctgatc gcctcgtagt gcgcggagcg cgtgaacaca acctaaaagg cgtggatatt 60 gatctgccac gcgactcgat ggtggtgttc accggcctgt caggttccgg taaatcatca 120 ctggcctttg acaccatctt tgcggaaggc cagcgccgtt acgtggagtc gttgtccagt 180 tacgcccgca tgttcttggg gcagatggac aagccggacg tggatttgat tgatggatta 240 tccccagcgg tctccattga ccaaaagtcc accaaccgca accctcggtc caccgtcggt 300 accatcacgg aagtctatga ctacctgcgt cttctgtatg cccgcgctgg taccgcacac 360 tgcccagtgt gtgatgcccg cgtggagcgt caaaccccgc agcagatggt ggaccagatc 420 cttggcatgg aggagggact gaagttccaa atccttgcgc ctgtggtgcg tacccgtaaa 480 ggtgagttcg ttgatctttt cgcagatctt gcatcccaag gttattcccg cgtgcgggtt 540 gatggggaag tgcaccagct ctcggatcct ccaaagctag aaaagcagat caagcacgat 600 attgatgttg tggttgaccg tctgcaggta aaagccagcc aaaagcagcg cctgacagac 660 tctatggaaa ccgcacttcg cctggccgat ggcgtggctg tgctggagtt cgttggcctg 720 gaggaagatg atccgaatag gcttcgtcga ttctctgaaa agatgagctg ccctaacggt 780 cacgcgttga cggttgatga gctggagcct cgtgcttttt ccttcaactc tccttatggc 840 gcgtgtcctg cctgtgatgg cttgggtgtg cgcaccgaag ttgatattga tctgatcatc 900 ccagatccag atgcacctgc aactaaagcg gttcagccct ggaactccag cccaaaccac 960 tcttactttg aaaagctcat tgaaggcctg gcgaaagccc tcggatttga tccggaaact 1020 ccgtacagtg agctcaccgc agctcaaaag aaggctctgg tctatggatc gaaggaagaa 1080 gtaagcgttc gatacaagaa ccgctacgga cgcgtgcgtt cttggactgc gccttttgaa 1140 ggtgtcatgg gctactttga tcgcaagttg gagcagactg attccgaaac ccaaaaagac 1200 cgactgttgg gctacacccg tgaagtgccc tgcccaacct gtaaaggcgc acgcctcaag 1260 ccggaaatct tggccgtacg cctagactcc ggaagccatg gagcgttgtc cattgctgga 1320 ctaaccgcgc tgtcggtgca tgaagcattc gagtttttgg ataacctcac actgggcaag 1380 cgcgaggaaa tgatcgcggg agctgtgctg agggaaattc acgcccgcct gaaattcttg 1440 cttgacgtgg gcctttccta cctcaccctt gatcgcgccg caggcaccct gtctggtggt 1500 gaagcgcagc gtatccgcct ggctactcaa attggttccg gtctggctgg tgtgctctac 1560 gtcttggatg agccatccat tggtctgcac caacgtgaca accagcgctt aatcactacc 1620 cttgagcatc tccgagatat cggaaacaca ctcattgttg tggaacacga tgaagacacc 1680 atcaggcgcg cagattggct cgtggatatt ggtcctcgag ctgatgaatt tggtggtgaa 1740 gtggtctacc aaggtgagcc gaagggcatt ttggactgcg aagaatccct cacaggtgct 1800 tacttgtctg gtcgtcgaac cctgggtgtt cctgatactc gccgtgagat cgacaaagag 1860 cgacagctca aggtggttgg tgctagggaa aacaacctgc ggggcatcga tgtgaaaatc 1920 ccactgggtg tgctgtgctg catcactggt gtgtcgggat ctggtaaatc cacgctggtc 1980 aatcagattt tggccaaggt tctggccaac aaactcaacc gcgcacgcca agtgcctggt 2040 cgcgcaaagc gggtggaagg cctcgagcac ttggataagt tggtccaggt ggatcagtcg 2100 ccaattggtc gtactccacg ttcaaaccca gcgacgtaca cgggtgtgtt tgataaagtc 2160 cgtaaccttt ttgccgagac cactgaagcg aaggtccgcg gttacaagcc tggccgcttc 2220 tccttcaata ttaagggtgg acgctgcgaa gcatgtcagg gcgatggcac gctgaagatc 2280 gaaatgaact tcctgcccga cgtgtatgtt ccgtgtgaag tctgtgatgg tcagcgctac 2340 aaccgcgaga ccctcgaggt gaagtacaag ggcaaaaaca tcgctgaagt attgggcatg 2400 ccgatctctg aggctgcgga cttctttgag cccatcacct caattcaccg atacctagca 2460 acgctggttg atgtcggcct tggctatgtc cgtttgggcc aggcagcaac aaccttgtct 2520 ggtggtgaag cccagcgtgt gaaacttgcc gctgagctgc agaagcgttc caacggtcgc 2580 accgtttaca tcctcgatga gccaactact ggtttgcact ttgaagatat tcgcaaactc 2640 atgatggtga tccaaggcct ggtggacaag ggtaactccg tgatcatcat cgagcacaac 2700 ctcgacgtga tcaaggctgc cgactggatc gtggacatgg gtccagaagg cggaagcggc 2760 ggtggaactg tggtcgctga aggaacccca gagcaagttg ctgaagttgc gggttcctac 2820 accggccaat tccttaaaga gttgttgtag 2850 <210> 3 <211> 949 <212> PRT <213> Unknown <220> <223> excinuclease ABC subunit A amino acid sequence <400> 3 Met Ala Asp Arg Leu Val Val Arg Gly Ala Arg Glu His Asn Leu Lys 1 5 10 15 Gly Val Asp Ile Asp Leu Pro Arg Asp Ser Met Val Val Phe Thr Gly 20 25 30 Leu Ser Gly Ser Gly Lys Ser Ser Leu Ala Phe Asp Thr Ile Phe Ala 35 40 45 Glu Gly Gln Arg Arg Tyr Val Glu Ser Leu Ser Ser Tyr Ala Arg Met 50 55 60 Phe Leu Gly Gln Met Asp Lys Pro Asp Val Asp Leu Ile Asp Gly Leu 65 70 75 80 Ser Pro Ala Val Ser Ile Asp Gln Lys Ser Thr Asn Arg Asn Pro Arg 85 90 95 Ser Thr Val Gly Thr Ile Thr Glu Val Tyr Asp Tyr Leu Arg Leu Leu 100 105 110 Tyr Ala Arg Ala Gly Thr Ala His Cys Pro Val Cys Asp Ala Arg Val 115 120 125 Glu Arg Gln Thr Pro Gln Gln Met Val Asp Gln Ile Leu Gly Met Glu 130 135 140 Glu Gly Leu Lys Phe Gln Ile Leu Ala Pro Val Val Arg Thr Arg Lys 145 150 155 160 Gly Glu Phe Val Asp Leu Phe Ala Asp Leu Ala Ser Gln Gly Tyr Ser 165 170 175 Arg Val Arg Val Asp Gly Glu Val His Gln Leu Ser Asp Pro Lys 180 185 190 Leu Glu Lys Gln Ile Lys His Asp Ile Asp Val Val Val Asp Arg Leu 195 200 205 Gln Val Lys Ala Ser Gln Lys Gln Arg Leu Thr Asp Ser Met Glu Thr 210 215 220 Ala Leu Arg Leu Ala Asp Gly Val Ala Val Leu Glu Phe Val Gly Leu 225 230 235 240 Glu Glu Asp Asp Pro Asn Arg Leu Arg Arg Phe Ser Glu Lys Met Ser 245 250 255 Cys Pro Asn Gly His Ala Leu Thr Val Asp Glu Leu Glu Pro Arg Ala 260 265 270 Phe Ser Phe Asn Ser Pro Tyr Gly Ala Cys Pro Ala Cys Asp Gly Leu 275 280 285 Gly Val Arg Thr Glu Val Asp Ile Asp Leu Ile Ile Pro Asp Pro Asp 290 295 300 Ala Pro Ala Thr Lys Ala Val Gln Pro Trp Asn Ser Ser Pro Asn His 305 310 315 320 Ser Tyr Phe Glu Lys Leu Ile Glu Gly Leu Ala Lys Ala Leu Gly Phe 325 330 335 Asp Pro Glu Thr Pro Tyr Ser Glu Leu Thr Ala Ala Gln Lys Lys Ala 340 345 350 Leu Val Tyr Gly Ser Lys Glu Glu Val Ser Val Arg Tyr Lys Asn Arg 355 360 365 Tyr Gly Arg Val Arg Ser Trp Thr Ala Pro Phe Glu Gly Val Met Gly 370 375 380 Tyr Phe Asp Arg Lys Leu Glu Gln Thr Asp Ser Glu Thr Gln Lys Asp 385 390 395 400 Arg Leu Leu Gly Tyr Thr Arg Glu Val Pro Cys Pro Thr Cys Lys Gly 405 410 415 Ala Arg Leu Lys Pro Glu Ile Leu Ala Val Arg Leu Asp Ser Gly Ser 420 425 430 His Gly Ala Leu Ser Ile Ala Gly Leu Thr Ala Leu Ser Val His Glu 435 440 445 Ala Phe Glu Phe Leu Asp Asn Leu Thr Leu Gly Lys Arg Glu Glu Met 450 455 460 Ile Ala Gly Ala Val Leu Arg Glu Ile His Ala Arg Leu Lys Phe Leu 465 470 475 480 Leu Asp Val Gly Leu Ser Tyr Leu Thr Leu Asp Arg Ala Ala Gly Thr 485 490 495 Leu Ser Gly Gly Glu Ala Gln Arg Ile Arg Leu Ala Thr Gln Ile Gly 500 505 510 Ser Gly Leu Ala Gly Val Leu Tyr Val Leu Asp Glu Pro Ser Ile Gly 515 520 525 Leu His Gln Arg Asp Asn Gln Arg Leu Ile Thr Thr Leu Glu His Leu 530 535 540 Arg Asp Ile Gly Asn Thr Leu Ile Val Val Glu His Asp Glu Asp Thr 545 550 555 560 Ile Arg Arg Ala Asp Trp Leu Val Asp Ile Gly Pro Arg Ala Gly Glu 565 570 575 Phe Gly Gly Glu Val Val Tyr Gln Gly Glu Pro Lys Gly Ile Leu Asp 580 585 590 Cys Glu Glu Ser Leu Thr Gly Ala Tyr Leu Ser Gly Arg Arg Thr Leu 595 600 605 Gly Val Pro Asp Thr Arg Arg Glu Ile Asp Lys Glu Arg Gln Leu Lys 610 615 620 Val Val Gly Ala Arg Glu Asn Asn Leu Arg Gly Ile Asp Val Lys Ile 625 630 635 640 Pro Leu Gly Val Leu Cys Cys Ile Thr Gly Val Ser Gly Ser Gly Lys 645 650 655 Ser Thr Leu Val Asn Gln Ile Leu Ala Lys Val Leu Ala Asn Lys Leu 660 665 670 Asn Arg Ala Arg Gln Val Pro Gly Arg Ala Lys Arg Val Glu Gly Leu 675 680 685 Glu His Leu Asp Lys Leu Val Gln Val Asp Gln Ser Pro Ile Gly Arg 690 695 700 Thr Pro Arg Ser Asn Pro Ala Thr Tyr Thr Gly Val Phe Asp Lys Val 705 710 715 720 Arg Asn Leu Phe Ala Glu Thr Thr Glu Ala Lys Val Arg Gly Tyr Lys 725 730 735 Pro Gly Arg Phe Ser Phe Asn Ile Lys Gly Gly Arg Cys Glu Ala Cys 740 745 750 Gln Gly Asp Gly Thr Leu Lys Ile Glu Met Asn Phe Leu Pro Asp Val 755 760 765 Tyr Val Pro Cys Glu Val Cys Asp Gly Gln Arg Tyr Asn Arg Glu Thr 770 775 780 Leu Glu Val Lys Tyr Lys Gly Lys Asn Ile Ala Glu Val Leu Gly Met 785 790 795 800 Pro Ile Ser Glu Ala Ala Asp Phe Phe Glu Pro Ile Thr Ser Ile His 805 810 815 Arg Tyr Leu Ala Thr Leu Val Asp Val Gly Leu Gly Tyr Val Arg Leu 820 825 830 Gly Gln Ala Ala Thr Thr Leu Ser Gly Gly Glu Ala Gln Arg Val Lys 835 840 845 Leu Ala Ala Glu Leu Gln Lys Arg Ser Asn Gly Arg Thr Val Tyr Ile 850 855 860 Leu Asp Glu Pro Thr Thr Gly Leu His Phe Glu Asp Ile Arg Lys Leu 865 870 875 880 Met Met Val Ile Gln Gly Leu Val Asp Lys Gly Asn Ser Val Ile Ile 885 890 895 Ile Glu His Asn Leu Asp Val Ile Lys Ala Ala Asp Trp Ile Val Asp 900 905 910 Met Gly Pro Glu Gly Gly Ser Gly Gly Gly Thr Val Val Ala Glu Gly 915 920 925 Thr Pro Glu Gln Val Ala Glu Val Ala Gly Ser Tyr Thr Gly Gln Phe 930 935 940 Leu Lys Glu Leu Leu 945 <210> 4 <211> 2850 <212> DNA <213> Unknown <220> <223> excinuclease ABC subunit A nucleotide sequence <400> 4 ttggctgatc gcctcgtagt gcgcggagcg cgtgaacaca acctaaaagg cgtggatatt 60 gatctgccac gcgactcgat ggtggtgttc accggcctgt caggttccgg taaatcatca 120 ctggcctttg acaccatctt tgcggaaggc cagcgccgtt acgtggagtc gttgtccagt 180 tacgcccgca tgttcttggg gcagatggac aagccggacg tggatttgat tgatggatta 240 tccccagcgg tctccattga ccaaaagtcc accaaccgca accctcggtc caccgtcggt 300 accatcacgg aagtctatga ctacctgcgt cttctgtatg cccgcgctgg taccgcacac 360 tgcccagtgt gtgatgcccg cgtggagcgt caaaccccgc agcagatggt ggaccagatc 420 cttggcatgg aggagggact gaagttccaa atccttgcgc ctgtggtgcg tacccgtaaa 480 ggtgagttcg ttgatctttt cgcagatctt gcatcccaag gttattcccg cgtgcgggtt 540 gatggggaag tgcaccagct ctcggatcct ccaaagctag aaaagcagat caagcacgat 600 attgatgttg tggttgaccg tctgcaggta aaagccagcc aaaagcagcg cctgacagac 660 tctatggaaa ccgcacttcg cctggccgat ggcgtggctg tgctggagtt cgttggcctg 720 gaggaagatg atccgaatag gcttcgtcga ttctctgaaa agatgagctg ccctaacggt 780 cacgcgttga cggttgatga gctggagcct cgtgcttttt ccttcaactc tccttatggc 840 gcgtgtcctg cctgtgatgg cttgggtgtg cgcaccgaag ttgatattga tctgatcatc 900 ccagatccag atgcacctgc aactaaagcg gttcagccct ggaactccag cccaaaccac 960 tcttactttg aaaagctcat tgaaggcctg gcgaaagccc tcggatttga tccggaaact 1020 ccgtacagtg agctcaccgc agctcaaaag aaggctctgg tctatggatc gaaggaagaa 1080 gtaagcgttc gatacaagaa ccgctacgga cgcgtgcgtt cttggactgc gccttttgaa 1140 ggtgtcatgg gctactttga tcgcaagttg gagcagactg attccgaaac ccaaaaagac 1200 cgactgttgg gctacacccg tgaagtgccc tgcccaacct gtaaaggcgc acgcctcaag 1260 ccggaaatct tggccgtacg cctagactcc ggaagccatg gagcgttgtc cattgctgga 1320 ctaaccgcgc tgtcggtgca tgaagcattc gagtttttgg ataacctcac actgggcaag 1380 cgcgaggaaa tgatcgcggg agctgtgctg agggaaattc acgcccgcct gaaattcttg 1440 cttgacgtgg gcctttccta cctcaccctt gatcgcgccg caggcaccct gtctggtggt 1500 gaagcgcagc gtatccgcct ggctactcaa attggttccg gtctggctgg tgtgctctac 1560 gtcttggatg agccatccat tggtctgcac caacgtgaca accagcgctt aatcactacc 1620 cttgagcatc tccgagatat cggaaacaca ctcattgttg tggaacacga tgaagacacc 1680 atcaggcgcg cagattggct cgtggatatt ggtcctcgag ctggtgaatt tggtggtgaa 1740 gtggtctacc aaggtgagcc gaagggcatt ttggactgcg aagaatccct cacaggtgct 1800 tacttgtctg gtcgtcgaac cctgggtgtt cctgatactc gccgtgagat cgacaaagag 1860 cgacagctca aggtggttgg tgctagggaa aacaacctgc ggggcatcga tgtgaaaatc 1920 ccactgggtg tgctgtgctg catcactggt gtgtcgggat ctggtaaatc cacgctggtc 1980 aatcagattt tggccaaggt tctggccaac aaactcaacc gcgcacgcca agtgcctggt 2040 cgcgcaaagc gggtggaagg cctcgagcac ttggataagt tggtccaggt ggatcagtcg 2100 ccaattggtc gtactccacg ttcaaaccca gcgacgtaca cgggtgtgtt tgataaagtc 2160 cgtaaccttt ttgccgagac cactgaagcg aaggtccgcg gttacaagcc tggccgcttc 2220 tccttcaata ttaagggtgg acgctgcgaa gcatgtcagg gcgatggcac gctgaagatc 2280 gaaatgaact tcctgcccga cgtgtatgtt ccgtgtgaag tctgtgatgg tcagcgctac 2340 aaccgcgaga ccctcgaggt gaagtacaag ggcaaaaaca tcgctgaagt attgggcatg 2400 ccgatctctg aggctgcgga cttctttgag cccatcacct caattcaccg atacctagca 2460 acgctggttg atgtcggcct tggctatgtc cgtttgggcc aggcagcaac aaccttgtct 2520 ggtggtgaag cccagcgtgt gaaacttgcc gctgagctgc agaagcgttc caacggtcgc 2580 accgtttaca tcctcgatga gccaactact ggtttgcact ttgaagatat tcgcaaactc 2640 atgatggtga tccaaggcct ggtggacaag ggtaactccg tgatcatcat cgagcacaac 2700 ctcgacgtga tcaaggctgc cgactggatc gtggacatgg gtccagaagg cggaagcggc 2760 ggtggaactg tggtcgctga aggaacccca gagcaagttg ctgaagttgc gggttcctac 2820 accggccaat tccttaaaga gttgttgtag 2850 <210> 5 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer 1F <400> 5 tcgagctcgg tacccagtgc cctgcccaac ctgta 35 <210> 6 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer 2R <400> 6 ccaaattcat cagctcgagg 20 <210> 7 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer 3F <400> 7 cctcgagctg atgaatttgg 20 <210> 8 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer 4R <400> 8 ctctagagga tccccaggag aagcggccag gcttg 35 <210> 9 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer 5F <400> 9 agtgccctgc ccaacctgta 20 <210> 10 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer 6R <400> 10 aggagaagcg gccaggcttg 20 <210> 11 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer odhA_up_F <400> 11 tgaattcgag ctcggtaccc ttgaacggaa ttgggtgg 38 <210> 12 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer odhA_up_R <400> 12 cccaggtggc atcggtacct tcacccagcg ccacgcag 38 <210> 13 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer odhA_down_F <400> 13 cgctgggtga aggtaccgat gccacctggg ttggtcaag 39 <210> 14 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer odhA_down_R <400> 14 gtcgactcta gaggatcccc ggacaaggaa tggagaga 38 <210> 15 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> primer odhA_del_F <400> 15 cttaccgttg ttgccctt 18 <210> 16 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer odhA_del_R <400> 16 ctccttcacc cacatcatt 19 <210> 17 <211> 1205 <212> PRT <213> Unknown <220> <223> OdhA amino acid sequence <400> 17 Met Phe Gln Gln Phe Gln Lys Asp Pro Lys Ser Val Asp Lys Glu Trp 1 5 10 15 Arg Glu Leu Phe Glu Ala Gln Gly Gly Pro Asn Ala Thr Pro Ala Thr 20 25 30 Thr Glu Ala Gln Pro Ser Ala Pro Lys Glu Ser Ala Lys Pro Ala Pro 35 40 45 Lys Ala Ala Pro Ala Ala Lys Ala Ala Pro Arg Val Glu Thr Lys Pro 50 55 60 Ala Ala Lys Thr Ala Pro Lys Ala Lys Glu Ser Ser Val Pro Gln Gln 65 70 75 80 Pro Lys Leu Pro Glu Pro Gly Gln Thr Pro Ile Arg Gly Ile Phe Lys 85 90 95 Ser Ile Ala Lys Asn Met Asp Ile Ser Leu Glu Ile Pro Thr Ala Thr 100 105 110 Ser Val Arg Asp Met Pro Ala Arg Leu Met Phe Glu Asn Arg Ala Met 115 120 125 Val Asn Asp Gln Leu Lys Arg Thr Arg Gly Gly Lys Ile Ser Phe Thr 130 135 140 His Ile Ile Gly Tyr Ala Met Val Lys Ala Val Met Ala His Pro Asp 145 150 155 160 Met Asn Asn Ser Tyr Asp Val Ile Asp Gly Lys Pro Thr Leu Ile Val 165 170 175 Pro Glu His Ile Asn Leu Gly Leu Ala Ile Asp Leu Pro Gln Lys Asp 180 185 190 Gly Ser Arg Ala Leu Val Val Ala Ala Ile Lys Glu Thr Glu Lys Met 195 200 205 Asn Phe Ser Glu Phe Leu Ala Ala Tyr Glu Asp Ile Val Thr Arg Ser 210 215 220 Arg Lys Gly Lys Leu Thr Met Asp Asp Tyr Gln Gly Val Thr Val Ser 225 230 235 240 Leu Thr Asn Pro Gly Gly Ile Gly Thr Arg His Ser Val Pro Arg Leu 245 250 255 Thr Lys Gly Gln Gly Thr Ile Ile Gly Val Gly Ser Met Asp Tyr Pro 260 265 270 Ala Glu Phe Gln Gly Ala Ser Glu Asp Arg Leu Ala Glu Leu Gly Val 275 280 285 Gly Lys Leu Val Thr Ile Thr Ser Thr Tyr Asp His Arg Val Ile Gln 290 295 300 Gly Ala Val Ser Gly Glu Phe Leu Arg Thr Met Ser Arg Leu Leu Thr 305 310 315 320 Asp Asp Ser Phe Trp Asp Glu Ile Phe Asp Ala Met Asn Val Pro Tyr 325 330 335 Thr Pro Met Arg Trp Ala Gln Asp Val Pro Asn Thr Gly Val Asp Lys 340 345 350 Asn Thr Arg Val Met Gln Leu Ile Glu Ala Tyr Arg Ser Arg Gly His 355 360 365 Leu Ile Ala Asp Thr Asn Pro Leu Ser Trp Val Gln Pro Gly Met Pro 370 375 380 Val Pro Asp His Arg Asp Leu Asp Ile Glu Thr His Ser Leu Thr Ile 385 390 395 400 Trp Asp Leu Asp Arg Thr Phe Ser Val Gly Gly Phe Gly Gly Lys Glu 405 410 415 Thr Met Thr Leu Arg Glu Val Leu Ser Arg Leu Arg Ala Ala Tyr Thr 420 425 430 Leu Lys Val Gly Ser Glu Tyr Thr His Ile Leu Asp Arg Asp Glu Arg 435 440 445 Thr Trp Leu Gln Asp Arg Leu Glu Ala Gly Met Pro Lys Pro Thr Gln 450 455 460 Ala Glu Gln Lys Tyr Ile Leu Gln Lys Leu Asn Ala Ala Glu Ala Phe 465 470 475 480 Glu Asn Phe Leu Gln Thr Lys Tyr Val Gly Gln Lys Arg Phe Ser Leu 485 490 495 Glu Gly Ala Glu Ala Leu Ile Pro Leu Met Asp Ser Ala Ile Asp Thr 500 505 510 Ala Ala Gly Gln Gly Leu Asp Glu Val Val Ile Gly Met Pro His Arg 515 520 525 Gly Arg Leu Asn Val Leu Phe Asn Ile Val Gly Lys Pro Leu Ala Ser 530 535 540 Ile Phe Asn Glu Phe Glu Gly Gln Met Glu Gln Gly Gln Ile Gly Gly 545 550 555 560 Ser Gly Asp Val Lys Tyr His Leu Gly Ser Glu Gly Gln His Leu Gln 565 570 575 Met Phe Gly Asp Gly Glu Ile Lys Val Ser Leu Thr Ala Asn Pro Ser 580 585 590 His Leu Glu Ala Val Asn Pro Val Met Glu Gly Ile Val Arg Ala Lys 595 600 605 Gln Asp Tyr Leu Asp Lys Gly Val Asp Gly Lys Thr Val Val Pro Leu 610 615 620 Leu Leu His Gly Asp Ala Ala Phe Ala Gly Leu Gly Ile Val Pro Glu 625 630 635 640 Thr Ile Asn Leu Ala Lys Leu Arg Gly Tyr Asp Val Gly Gly Thr Ile 645 650 655 His Ile Val Val Asn Asn Gln Ile Gly Phe Thr Thr Thr Pro Asp Ser 660 665 670 Ser Arg Ser Met His Tyr Ala Thr Asp Tyr Ala Lys Ala Phe Gly Cys 675 680 685 Pro Val Phe His Val Asn Gly Asp Asp Pro Glu Ala Val Val Trp Val 690 695 700 Gly Gln Leu Ala Thr Glu Tyr Arg Arg Arg Phe Gly Lys Asp Val Phe 705 710 715 720 Ile Asp Leu Val Cys Tyr Arg Leu Arg Gly His Asn Glu Ala Asp Asp 725 730 735 Pro Ser Met Thr Gln Pro Lys Met Tyr Glu Leu Ile Thr Gly Arg Glu 740 745 750 Thr Val Arg Ala Gln Tyr Thr Glu Asp Leu Leu Gly Arg Gly Asp Leu 755 760 765 Ser Asn Glu Asp Ala Glu Ala Val Val Arg Asp Phe His Asp Gln Met 770 775 780 Glu Ser Val Phe Asn Glu Val Lys Glu Gly Gly Lys Lys Gln Ala Glu 785 790 795 800 Ala Gln Thr Gly Ile Thr Gly Ser Gln Lys Leu Pro His Gly Leu Glu 805 810 815 Thr Asn Ile Ser Arg Glu Glu Leu Leu Glu Leu Gly Gln Ala Phe Ala 820 825 830 Asn Thr Pro Glu Gly Phe Asn Tyr His Pro Arg Val Ala Pro Val Ala 835 840 845 Lys Lys Arg Val Ser Ser Val Thr Glu Gly Gly Ile Asp Trp Ala Trp 850 855 860 Gly Glu Leu Leu Ala Phe Gly Ser Leu Ala Asn Ser Gly Arg Leu Val 865 870 875 880 Arg Leu Ala Gly Glu Asp Ser Arg Arg Gly Thr Phe Thr Gln Arg His 885 890 895 Ala Val Ala Ile Asp Pro Ala Thr Ala Glu Glu Phe Asn Pro Leu His 900 905 910 Glu Leu Ala Gln Ser Lys Gly Asn Asn Gly Lys Phe Leu Val Tyr Asn 915 920 925 Ser Ala Leu Thr Glu Tyr Ala Gly Met Gly Phe Glu Tyr Gly Tyr Ser 930 935 940 Val Gly Asn Glu Asp Ser Val Val Ala Trp Glu Ala Gln Phe Gly Asp 945 950 955 960 Phe Ala Asn Gly Ala Gln Thr Ile Ile Asp Glu Tyr Val Ser Ser Gly 965 970 975 Glu Ala Lys Trp Gly Gln Thr Ser Lys Leu Ile Leu Leu Leu Pro His 980 985 990 Gly Tyr Glu Gly Gln Gly Pro Asp His Ser Ser Ala Arg Ile Glu Arg 995 1000 1005 Phe Leu Gln Leu Cys Ala Glu Gly Ser Met Thr Val Ala Gln Pro Ser 1010 1015 1020 Thr Pro Ala Asn His Phe His Leu Leu Arg Arg His Ala Leu Ser Asp 1025 1030 1035 1040 Leu Lys Arg Pro Leu Val Ile Phe Thr Pro Lys Ser Met Leu Arg Asn 1045 1050 1055 Lys Ala Ala Ala Ser Ala Pro Glu Asp Phe Thr Glu Val Thr Lys Phe 1060 1065 1070 Gln Ser Val Ile Asp Asp Pro Asn Val Ala Asp Ala Ala Lys Val Lys 1075 1080 1085 Lys Val Met Leu Val Ser Gly Lys Leu Tyr Tyr Glu Leu Ala Lys Arg 1090 1095 1100 Lys Glu Lys Asp Gly Arg Asp Asp Ile Ala Ile Val Arg Ile Glu Met 1105 1110 1115 1120 Leu His Pro Ile Pro Phe Asn Arg Ile Ser Glu Ala Leu Ala Gly Tyr 1125 1130 1135 Pro Asn Ala Glu Glu Val Leu Phe Val Gln Asp Glu Pro Ala Asn Gln 1140 1145 1150 Gly Pro Trp Pro Phe Tyr Gln Glu His Leu Pro Glu Leu Ile Pro Asn 1155 1160 1165 Met Pro Lys Met Arg Arg Val Ser Arg Arg Ala Gln Ser Ser Thr Ala 1170 1175 1180 Thr Gly Val Ala Lys Val His Gln Leu Glu Glu Lys Gln Leu Ile Asp 1185 1190 1195 1200 Glu Ala Phe Glu Ala 1205 <210> 18 <211> 3618 <212> DNA <213> Unknown <220> <223> OdhA nucleotide sequence <400> 18 atgttccagc agttccagaa ggaccccaag tccgtggaca aggaatggag agaactcttt 60 gaggcgcagg ggggaccaaa tgctaccccc gctacaacag aagcacagcc ttcagcgccc 120 aaggagtctg cgaaaccagc accaaaggct gcccctgcag ccaaggcagc accgcgcgta 180 gaaaccaagc cggccgccaa gaccgcccct aaggccaagg agtcctcagt gccacagcaa 240 cctaagcttc cggagccagg acaaacccca atcaggggta ttttcaagtc catcgcgaag 300 aacatggata tctccctgga aatcccaacc gcaacctcgg ttcgcgatat gccagctcgc 360 ctcatgttcg aaaaccgcgc gatggtcaac gatcagctca agcgcacccg cggtggcaag 420 atctccttca cccacatcat tggctacgcc atggtgaagg cagtcatggc tcacccggac 480 atgaacaact cctacgacgt catcgacggc aagccaaccc tgatcgtgcc tgagcacatc 540 aacctgggcc ttgccatcga ccttcctcag aaggacggct cccgcgcact tgtcgtagca 600 gccatcaagg aaaccgagaa gatgaacttc tccgagttcc tcgcagcata cgaagacatc 660 gtgacacgct cccgcaaggg caagctcacc atggatgact accagggcgt taccgtttcc 720 ttgaccaacc caggtggcat cggtacccgc cactctgtcc cacgtctgac caagggccag 780 ggcaccatca tcggtgtcgg ttccatggat tacccagcag agttccaggg cgcttccgaa 840 gaccgccttg cagagctcgg cgttggcaag cttgtcacca tcacctccac ctacgatcac 900 cgcgtgatcc agggtgctgt gtccggtgaa ttcctgcgta ccatgtctcg cctgctcacc 960 gatgattcct tctgggatga gatcttcgac gcaatgaacg ttccttacac cccaatgcgt 1020 tgggcacagg acgttccaaa caccggtgtt gataagaaca cccgcgtcat gcagctcatt 1080 gaggcatacc gctcccgtgg acacctcatc gctgacacca acccactttc atgggttcag 1140 cctggcatgc cagttccaga ccaccgcgac ctcgacatcg agacccacag cctgaccatc 1200 tgggatctgg accgtacctt cagcgtcggt ggcttcggcg gcaaggagac catgaccctg 1260 cgcgaggtac tgtcccgcct gcgcgctgcc tacaccttga aggtcggctc cgaatacacc 1320 cacatcctgg accgcgacga gcgcacctgg ctgcaggacc gcctcgaagc cggaatgcca 1380 aagccaaccc aggcagagca gaagtacatc ctgcagaagc tgaacgccgc agaggctttc 1440 gagaacttcc tgcagaccaa gtacgtcggc cagaagcgct tctccctcga aggtgcagaa 1500 gctctcatcc cactgatgga ctccgccatc gacaccgccg caggccaggg cctcgacgaa 1560 gttgtcatcg gtatgccaca ccgtggtcgc ctcaacgtgc tgttcaacat cgtgggcaag 1620 ccactggcat ccatcttcaa cgagtttgaa ggccaaatgg agcagggcca gatcggtggc 1680 tccggtgacg tgaagtacca cctcggttcc gaaggccagc acctgcagat gttcggcgac 1740 ggcgagatca aggtctccct gactgctaac ccgtcccacc tggaagctgt taacccagtg 1800 atggaaggta tcgtccgcgc aaagcaggac tacctggaca agggcgtaga cggcaagact 1860 gttgtgccac tgctgctcca cggtgacgct gcattcgcag gcctgggcat cgtgccagaa 1920 accatcaacc tggctaagct gcgtggctac gacgtcggag gcaccatcca catcgtggtg 1980 aacaaccaga tcggcttcac caccacccca gactccagcc gctccatgca ctacgcaacc 2040 gactacgcca aggcattcgg ctgcccagtc ttccacgtca atggtgatga cccagaggca 2100 gttgtctggg ttggccagct ggcaaccgag taccgtcgtc gcttcggcaa ggacgtcttc 2160 atcgacctcg tttgctaccg cctccgcggc cacaacgaag ctgatgatcc ttccatgacc 2220 cagccaaaga tgtatgagct catcaccggc cgcgagaccg ttcgtgctca gtacaccgaa 2280 gacctgctcg gacgtggaga cctctccaac gaagatgcag aagcagtcgt ccgcgacttc 2340 cacgaccaga tggaatctgt gttcaacgaa gtcaaggaag gcggcaagaa gcaggctgag 2400 gcacagaccg gcatcaccgg ctcccagaag cttccacacg gccttgagac caacatctcc 2460 cgtgaagagc tcctggaact gggacaggct ttcgccaaca ccccagaagg cttcaactac 2520 cacccacgtg tggctccagt tgctaagaag cgcgtctcct ctgtcaccga aggtggcatc 2580 gactgggcat ggggcgagct cctcgccttc ggttccctgg ctaactccgg ccgcttggtt 2640 cgccttgcag gtgaagattc ccgccgcggt accttcaccc agcgccacgc agttgccatc 2700 gacccagcga ccgctgaaga gttcaaccca ctccacgagc ttgcacagtc caagggcaac 2760 aacggtaagt tcctggtcta caactccgca ctgaccgagt acgcaggcat gggcttcgag 2820 tacggctact ccgtaggaaa cgaagactcc gtcgttgcat gggaagcaca gttcggcgac 2880 ttcgccaacg gcgctcagac catcatcgat gagtacgtct cctcaggcga agctaagtgg 2940 ggccagacct ccaagctgat ccttctgctg cctcacggct acgaaggcca gggcccagac 3000 cactcttccg cacgtatcga gcgcttcctg cagctgtgcg ctgagggttc catgactgtt 3060 gctcagccat ccaccccagc aaaccacttc cacctgctgc gtcgtcacgc tctgtccgac 3120 ctgaagcgtc cactggttat cttcaccccg aagtccatgc tgcgtaacaa ggctgctgcc 3180 tccgcaccag aagacttcac tgaggtcacc aagttccaat ccgtgatcga cgatccaaac 3240 gttgcagatg cagccaaggt gaagaaggtc atgctggtct ccggcaagct gtactacgaa 3300 ttggcaaagc gcaaggagaa ggacggacgc gacgacatcg cgatcgttcg tatcgaaatg 3360 ctccacccaa ttccgttcaa ccgcatctcc gaggctcttg ccggctaccc taacgctgag 3420 gaagtcctct tcgttcagga tgagccagca aaccagggcc catggccgtt ctaccaggag 3480 cacctcccag agctgatccc gaacatgcca aagatgcgcc gcgtttcccg ccgcgctcag 3540 tcctccaccg caactggtgt tgctaaggtg caccagctgg aggagaagca gcttatcgac 3600 gaggctttcg aggcttaa 3618 <210> 19 <211> 5803 <212> DNA <213> Artificial Sequence <220> <223> pDCM2 nucleotide sequence <400> 19 gttcgcttgc tgtccataaa accgcccagt ctagctatcg ccatgtaagc ccactgcaag 60 ctacctgctt tctctttgcg cttgcgtttt cccttgtcca gatagcccag tagctgacat 120 tcatccgggg tcagcaccgt ttctgcggac tggctttcta cgtgttccgc ttcctttagc 180 agcccttgcg ccctgagtgc ttgcggcagc gtgaagctag cttttatcgc cattcgccat 240 tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc 300 tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg ttttcccagt 360 cacgacgttg taaaacgacg gccagtgaat tcgagctcgg tacccgggga tcctctagag 420 tcgacctgca ggcatgcaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat 480 tgttatccgc tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg 540 ggtgcctaat gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag 600 tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt 660 ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg 720 ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg 780 gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag 840 gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga 900 cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct 960 ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc 1020 tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta tctcagttcg 1080 gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc 1140 tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca 1200 ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag 1260 ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct 1320 ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc 1380 accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga 1440 tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca 1500 cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttgggg 1560 tgggcgaaga actccagcat gagatccccg cgctggagga tcatccagcc ctgatagaaa 1620 cagaagccac tggagcacct caaaaacacc atcatacact aaatcagtaa gttggcagca 1680 tcacccgacg cactttgcgc cgaataaata cctgtgacgg aagatcactt cgcagaataa 1740 ataaatcctg gtgtccctgt tgataccggg aagccctggg ccaacttttg gcgaaaatga 1800 gacgttgatc ggcacgtaag aggttccaac tttcaccata atgaaataag atcactaccg 1860 ggcgtatttt ttgagttatc gagattttca ggagctgata gaaacagaag ccactggagc 1920 acctcaaaaa caccatcata cactaaatca gtaagttggc agcatcaccc gacgcacttt 1980 gcgccgaata aatacctgtg acggaagatc acttcgcaga ataaataaat cctggtgtcc 2040 ctgttgatac cgggaagccc tgggccaact tttggcgaaa atgagacgtt gatcggcacg 2100 taagaggttc caactttcac cataatgaaa taagatcact accgggcgta ttttttgagt 2160 tatcgagatt ttcaggagct ctttggcatc gtctctcgcc tgtcccctca gttcagtaat 2220 ttcctgcatt tgcctgtttc cagtcggtag atattccaca aaacagcagg gaagcagcgc 2280 ttttccgctg cataaccctg cttcggggtc attatagcga ttttttcggt atatccatcc 2340 tttttcgcac gatatacagg attttgccaa agggttcgtg tagactttcc ttggtgtatc 2400 caacggcgtc agccgggcag gataggtgaa gtaggcccac ccgcgagcgg gtgttccttc 2460 ttcactgtcc cttattcgca cctggcggtg ctcaacggga atcctgctct gcgaggctgg 2520 ccggctaccg ccggcgtaac agatgagggc aagcggatgg ctgatgaaac caagccaacc 2580 aggaagggca gcccacctat caaggtgtac tgccttccag acgaacgaag agcgattgag 2640 gaaaaggcgg cggcggccgg catgagcctg tcggcctacc tgctggccgt cggccagggc 2700 tacaaaatca cgggcgtcgt ggactatgag cacgtccgcg agggcgtccc ggaaaacgat 2760 tccgaagccc aacctttcat agaaggcggc ggtggaatcg aaatctcgtg atggcaggtt 2820 gggcgtcgct tggtcggtca tttcgaaaaa ggttaggaat acggttagcc atttgcctgc 2880 ttttatatag ttcantatgg gattcacctt tatgttgata agaaataaaa gaaaatgcca 2940 ataggatatc ggcattttct tttgcgtttt tatttgttaa ctgttaattg tccttgttca 3000 aggatgctgt ctttgacaac agatgttttc ttgcctttga tgttcagcag gaagctcggc 3060 gcaaacgttg attgtttgtc tgcgtagaat cctctgtttg tcatatagct tgtaatcacg 3120 acattgtttc ctttcgcttg aggtacagcg aagtgtgagt aagtaaaggt tacatcgtta 3180 ggcggatcaa gatccatttt taacacaagg ccagttttgt tcagcggctt gtatgggcca 3240 gttaaagaat tagaaacata accaagcatg taaatatcgt tagacgtaat gccgtcaatc 3300 gtcatttttg atccgcggga gtcagtgaac aggtaccatt tgccgttcat tttaaagacg 3360 ttcgcgcgtt caatttcatc tgttactgtg tagatgcaa tcagcggttt catcactttt 3420 ttcagtgtgt aatcatcgtt tagctcaatc ataccgagag cgccgtttgc taactcagcc 3480 gtgcgttttt tatcgctttg cagaagtttt tgactttctt gacggaagaa tgatgtgctt 3540 ttgccatagt atgctttgtt aaataaagat tcttcgcctt ggtagccatc ttcagttcca 3600 gtgtttgctt caaatactaa gtatttgtgg cctttatctt ctacgtagtg aggatctctc 3660 agcgtatggt tgtcgcctga gctgtagttg ccttcatcga tgaactgctg tacattttga 3720 tacgtttttc cgtcaccgtc aaagattgat ttataatcct ctacaccgtt gatgttcaaa 3780 gagctgtctg atgctgatac gttaacttgt gcagttgtca gtgtttgttt gccgtaatgt 3840 ttaccggaga aatcagtgta gaataaacgg atttttccgt cagatgtaaa tgtggctgaa 3900 cctgaccatt cttgtgtttg gtcttttagg atagaatcat ttgcatcgaa tttgtcgctg 3960 tctttaaaga cgcggccagc gtttttccag ctgtcaatag aagtttcgcc gactttttga 4020 tagaacatgt aaatcgatgt gtcatccgca tttttaggat ctccggctaa tgcaaagacg 4080 atgtggtagc cgtgatagtt tgcgacagtg ccgtcagcgt tttgtaatgg ccagctgtcc 4140 caaacgtcca ggccttttgc agaagagata tttttaattg tggacgaatc aaattcagaa 4200 acttgatatt tttcattttt ttgctgttca gggatttgca gcatatcatg gcgtgtaata 4260 tgggaaatgc cgtatgtttc cttatatggc ttttggttcg tttctttcgc aaacgcttga 4320 gttgcgcctc ctgccagcag tgcggtagta aaggttaata ctgttgcttg ttttgcaaac 4380 tttttgatgt tcatcgttca tgtctccttt tttatgtact gtgttagcgg tctgcttctt 4440 ccagccctcc tgtttgaaga tggcaagtta gttacgcaca ataaaaaaag acctaaaata 4500 tgtaaggggt gacgccaaag tatacacttt gccctttaca cattttaggt cttgcctgct 4560 ttatcagtaa caaacccgcg cgatttactt ttcgacctca ttctattaga ctctcgtttg 4620 gattgcaact ggtctatttt cctcttttgt ttgatagaaa atcataaaag gatttgcaga 4680 ctacgggcct aaagaactaa aaaatctatc tgtttctttt cattctctgt attttttata 4740 gtttctgttg catgggcata aagttgcctt tttaatcaca attcagaaaa tatcataata 4800 tctcatttca ctaaataata gtgaacggca ggtatatgtg atgggttaaa aaggatcacc 4860 ccagagtccc gctcagaaga actcgtcaag aaggcgatag aaggcgatgc gctgcgaatc 4920 gggagcggcg ataccgtaaa gcacgaggaa gcggtcagcc cattcgccgc caagctcttc 4980 agcaatatca cgggtagcca acgctatgtc ctgatagcgg tccgccacac ccagccggcc 5040 acagtcgatg aatccagaaa agcggccatt ttccaccatg atattcggca agcaggcatc 5100 gccatgggtc acgacgagat cctcgccgtc gggcatccgc gccttgagcc tggcgaacag 5160 ttcggctggc gcgagcccct gatgctcttc gtccagatca tcctgatcga caagaccggc 5220 ttccatccga gtacgtgctc gctcgatgcg atgtttcgct tggtggtcga atgggcaggt 5280 agccggatca agcgtatgca gccgccgcat tgcatcagcc atgatggata ctttctcggc 5340 aggagcaagg tgagatgaca ggagatcctg ccccggcact tcgcccaata gcagccagtc 5400 ccttcccgct tcagtgacaa cgtcgagaca gctgcgcaag gaacgcccgt cgtggccagc 5460 cacgatagcc gcgctgcctc gtcttggagt tcattcaggg caccggacag gtcggtcttg 5520 acaaaaagaa ccgggcgccc ctgcgctgac agccggaaca cggcggcatc agagcagccg 5580 attgtctgtt gtgcccagtc atagccgaat agcctctcca cccaagcggc cggagaacct 5640 gcgtgcaatc catcttgttc aatcatgcga aacgatcctc atcctgtctc ttgatcagat 5700 cttgatcccc tgcgccatca gatccttggc ggcaagaaag ccatccagtt tactttgcag 5760 ggcttcccaa ccttaccaga gggcgcccca gctggcaatt ccg 5803
Claims (5)
An exinuclease ABC subunit A variant comprising the amino acid sequence set forth in SEQ ID NO: 1, wherein glycine, an amino acid corresponding to position 575 of SEQ ID NO: 3, is substituted with aspartic acid.
A polynucleotide encoding the variant of claim 1 .
The variant of claim 1 or comprising a polynucleotide encoding the variant, Corynebacterium glutamicum strain.
According to claim 3, wherein the strain is L- glutamic acid production capacity is increased compared to Corynebacterium glutamicum comprising the polypeptide of SEQ ID NO: 3 or a polynucleotide encoding it, the strain.
A method for producing L- glutamic acid, comprising the step of culturing in a medium a Corynebacterium glutamicum strain having L-glutamic acid-producing ability comprising the variant of claim 1 or a polynucleotide encoding the variant.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210011243A KR102277406B1 (en) | 2021-01-27 | 2021-01-27 | Novel excinuclease ABC subunit A variant and a method for producing L-glutamic acid using the same |
PCT/KR2021/005155 WO2022163936A1 (en) | 2021-01-27 | 2021-04-23 | Novel excinuclease abc subunit a variant, and method for producing l-glutamic acid using same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210011243A KR102277406B1 (en) | 2021-01-27 | 2021-01-27 | Novel excinuclease ABC subunit A variant and a method for producing L-glutamic acid using the same |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102277406B1 true KR102277406B1 (en) | 2021-07-14 |
Family
ID=76863125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210011243A KR102277406B1 (en) | 2021-01-27 | 2021-01-27 | Novel excinuclease ABC subunit A variant and a method for producing L-glutamic acid using the same |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR102277406B1 (en) |
WO (1) | WO2022163936A1 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080034334A (en) * | 2006-10-16 | 2008-04-21 | 씨제이제일제당 (주) | A microorganism producing glutamic acid in high yield and a process of producing glutamic acid using the same |
US20080096211A1 (en) * | 1999-06-25 | 2008-04-24 | Basf Aktiengesellschaft | Corynebacterium glutamicum genes encoding proteins involved in genetic stability, gene expression, and protein secretion and folding |
KR100837844B1 (en) * | 2006-12-14 | 2008-06-13 | 씨제이제일제당 (주) | - - Microoragnism of Corynbacterium genus with an enhanced L-glutamic acid productivity and method of producing L-glutamic acid using the microorganism |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102075160B1 (en) * | 2018-12-13 | 2020-02-10 | 대상 주식회사 | Mutant strain with enhanced L-glutamic acid productivity and method for preparing L-glutamic acid using the same |
-
2021
- 2021-01-27 KR KR1020210011243A patent/KR102277406B1/en active IP Right Grant
- 2021-04-23 WO PCT/KR2021/005155 patent/WO2022163936A1/en active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080096211A1 (en) * | 1999-06-25 | 2008-04-24 | Basf Aktiengesellschaft | Corynebacterium glutamicum genes encoding proteins involved in genetic stability, gene expression, and protein secretion and folding |
KR20080034334A (en) * | 2006-10-16 | 2008-04-21 | 씨제이제일제당 (주) | A microorganism producing glutamic acid in high yield and a process of producing glutamic acid using the same |
KR100837844B1 (en) * | 2006-12-14 | 2008-06-13 | 씨제이제일제당 (주) | - - Microoragnism of Corynbacterium genus with an enhanced L-glutamic acid productivity and method of producing L-glutamic acid using the microorganism |
Non-Patent Citations (1)
Title |
---|
NCBI Genbank accession No.WP_003861576.1 * |
Also Published As
Publication number | Publication date |
---|---|
WO2022163936A1 (en) | 2022-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102257842B1 (en) | Novel D-alanine-D-alanine ligase A variant and a method for producing L-glutamic acid using the same | |
KR102266233B1 (en) | Novel ABC transporter ATP-binding protein variant and a method for producing L-glutamic acid using the same | |
KR102254635B1 (en) | Novel glucosamine-6-phosphate deaminase variant and a method for producing L-glutamic acid using the same | |
KR102266231B1 (en) | Novel MFS transporter variant and a method for producing L-glutamic acid using the same | |
KR102281368B1 (en) | Novel protein variant and a method for producing L-valine using the same | |
KR102259338B1 (en) | Novel 2,5-diketo-D-gluconic acid reductase variant and a method for producing XMP or GMP using the same | |
KR102259337B1 (en) | Novel phosphonoacetate hydrolase variant and a method for producing XMP or GMP using the same | |
KR102288396B1 (en) | Novel anaerobic coproporphyrinogen Ⅲ oxidase variant and a method for producing IMP using the same | |
KR102281361B1 (en) | Novel asparagine synthase variant and a method for producing L-valine using the same | |
KR102281363B1 (en) | Novel cysteine sulfinate desulfinase variant and a method for producing L-valine using the same | |
KR102281360B1 (en) | Novel ATP phosphoribosyltransferase variant and a method for producing L-valine using the same | |
KR102288395B1 (en) | Novel 1,4-alpha-glucan-branching enzyme variant and a method for producing IMP using the same | |
KR102525074B1 (en) | Novel citrate synthase variant and a method for producing O-Acetyl-L-Homoserine or L-Methionine using the same | |
KR102254633B1 (en) | Novel 3D-(3,5/4)-trihydroxycyclohexane-1,2-dione acylhydrolase variant and a method for producing IMP using the same | |
KR102277406B1 (en) | Novel excinuclease ABC subunit A variant and a method for producing L-glutamic acid using the same | |
KR102266230B1 (en) | Novel ABC transporter ATP-binding protein variant and a method for producing L-glutamic acid using the same | |
KR102277403B1 (en) | Novel ribonuclease P variant and a method for producing L-glutamic acid using the same | |
KR102277404B1 (en) | Novel galactoside O-acetyltransferase variant and a method for producing L-glutamic acid using the same | |
KR102277405B1 (en) | Novel spermidine synthase variant and a method for producing L-glutamic acid using the same | |
KR102273637B1 (en) | Novel Peptidyl-dipeptidase variant and a method for producing XMP or GMP using the same | |
KR102288397B1 (en) | Novel aldehyde dehydrogenase variant and a method for producing XMP or GMP using the same | |
KR102288398B1 (en) | Novel NAD(P)-dependent oxidoreductase variant and a method for producing XMP or GMP using the same | |
KR102266232B1 (en) | Novel polyketide synthase variant and a method for producing XMP or GMP using the same | |
KR102259339B1 (en) | Novel aldehyde dehydrogenase variant and a method for producing XMP or GMP using the same | |
KR102274483B1 (en) | Novel 2-succinyl-5-enolpyruvyl-6-hydroxy-3-cyclohexene-1-carboxylate synthase variant and a method for producing XMP or GMP using the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |