KR102308173B1 - 신규 과당-4-에피머화 효소 및 이를 이용한 타가토스의 제조 방법 - Google Patents
신규 과당-4-에피머화 효소 및 이를 이용한 타가토스의 제조 방법 Download PDFInfo
- Publication number
- KR102308173B1 KR102308173B1 KR1020190099827A KR20190099827A KR102308173B1 KR 102308173 B1 KR102308173 B1 KR 102308173B1 KR 1020190099827 A KR1020190099827 A KR 1020190099827A KR 20190099827 A KR20190099827 A KR 20190099827A KR 102308173 B1 KR102308173 B1 KR 102308173B1
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- leu
- glu
- val
- arg
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/02—Monosaccharides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/24—Preparation of compounds containing saccharide radicals produced by the action of an isomerase, e.g. fructose
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y401/00—Carbon-carbon lyases (4.1)
- C12Y401/02—Aldehyde-lyases (4.1.2)
- C12Y401/0204—Tagatose-bisphosphate aldolase (4.1.2.40)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Medicinal Chemistry (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 출원은 타가토스 전환 활성을 갖는 타가토스-이인산 알돌레이즈 변이체 및 이를 이용하여 타가토스를 제조하는 방법에 관한 것이다.
Description
본 출원은 전환 활성 또는 안정성이 향상된 과당-4-에피머화 효소 변이체 및 이를 이용하여 타가토스를 제조하는 방법에 관한 것이다.
타가토스는 설탕과 거의 구별할 수 없는 천연의 단맛을 가지고 있으며, 물리적 성질 또한 설탕과 비슷하다. 타가토스는 우유, 치즈, 카카오 등의 식품, 사과와 귤과 같은 단맛이 나는 천연과일에 소량 존재하는 천연감미료로, 칼로리는 1.5 kcal/g으로 설탕의 1/3 수준이며 GI(Glycemic index, 혈당지수)는 3으로 설탕의 5% 수준인데 반해, 설탕의 맛과 유사한 단맛을 내면서 다양한 건강 기능성을 가지고 있기 때문에 여러 제품 적용 시 건강과 맛을 동시에 만족시킬 수 있는 대체감미료로 이용될 수 있다.
종래 알려진 타가토스의 생산 방법으로는 주로 갈락토스를 원료로 한 화학적(촉매 반응)방법과 생물학적(이성화 효소반응) 방법이 있다(대한민국 등록특허 제10-0964091호 참조). 상기 반응들의 원료인 갈락토스를 경제적으로 수득하기 위하여 갈락토스를 함유하는 다양한 기초 원료 및 이로부터 갈락토스를 수득하여 타가토스를 제조하는 방법에 대한 연구가 선행되어 왔다. 갈락토스를 얻기 위한 대표적인 기초 원료는 유당이나, 국제 시장에서의 원유(原乳) 및 유당의 생산량, 수요 및 공급량 등에 따라 유당 또는 유당을 함유하는 제품의 가격의 불안정성이 존재하여, 타가토스 생산 원료의 안정적 수급에 한계가 있다. 따라서, 보편화된 일반당(설탕, 포도당, 과당 등)을 사용하여 타가토스를 제조할 수 있는 새로운 방법이 필요하다.
이러한 배경하에, 본 발명자들은 서열번호 1의 아미노산 서열에서 하나 이상의 아미노산 치환을 포함하는 신규한 변이형 단백질을 발굴하고, 상기 변이형 단백질이 서열번호 1의 야생형과 같이 전환활성을 가지거나, 야생형 대비 전환 활성 또는 안정성이 향상되고, 타가토스의 생산능을 증가시킴을 확인함으로써, 본 출원을 완성하였다.
본 출원의 하나의 목적은 서열번호 1의 아미노산 서열을 포함하는 과당-4-에피머화 효소에서 하나 이상의 아미노산 잔기가 치환된, 과당-4-에피머화 효소 변이체를 제공하는 것이다.
본 출원의 다른 하나의 목적은 상기 과당-4-에피머화 효소 변이체를 코딩하는 폴리뉴클레오티드를 제공하는 것이다.
본 출원의 또 다른 목적은 상기 폴리뉴클레오티드를 포함하는 벡터를 제공하는 것이다.
본 출원의 또 다른 목적은 상기 변이체를 포함하는 미생물을 제공하는 것이다.
본 출원의 다른 하나의 목적은 과당-4-에피머화 효소 또는 과당-4-에피머화 효소 변이체; 이를 포함하는 미생물; 또는 상기 미생물의 배양물을 하나 이상 포함하는 타가토스 생산용 조성물을 제공하는 것이다.
본 출원의 또 다른 목적은 과당-4-에피머화 효소 또는 과당-4-에피머화 효소 변이체; 이를 발현하는 미생물; 상기 미생물의 배양물, 또는 이들로부터 유래한 과당-4-에피머화 효소 존재하에, 과당을 반응시키는 단계를 포함하는 타가토스 제조방법을 제공하는 것이다.
이를 구체적으로 설명하면 다음과 같다. 한편, 본 출원에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시 형태에도 적용될 수 있다. 즉, 본 출원에서 개시된 다양한 요소들의 모든 조합이 본 출원의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 출원의 범주가 제한된다고 볼 수 없다.
상기 목적을 달성하기 위한 본 출원의 하나의 양태는 과당-4-에피머화 효소의 아미노산 서열에서 하나 이상의 아미노산 치환을 포함하는, 과당-4-에피머화 효소 변이체를 제공한다.
상기 목적을 달성하기 위한 본 출원의 하나의 양태는 서열번호 1의 아미노산 서열에서 하나 이상의 아미노산 치환을 포함하는, 과당-4-에피머화 효소 변이체를 제공한다.
본 출원에서 용어, "과당-4-에피머화 효소"는 과당의 4번 탄소 위치를 에피머화하여 과당을 타가토스로 전환시키는 과당-4-에피머화 활성을 갖는 효소이다. 본 출원의 목적상 과당을 기질로 하여 타가토스를 생산할 수 있다면 제한없이 포함될 수 있으며, 'D-과당 C4-에피머화 효소'와 혼용되어 사용될 수 있다. 일례로 공지의 데이터 베이스인 KEGG(Kyoto Encyclopedia of Genes and Genomes)에서 EC 4.1.2.40 인 타가토스 이인산 알돌레이즈 또는 타가토스-이인산 알돌레이즈 class II 악세서리 단백질(Tagatose-bisphosphate aldolase or tagatose- bisphosphate class II accessory protein)이 과당을 기질로 타가토스로 전환하는 활성을 가진다면 과당-4-에피머화 효소로 포함될 수 있다. 상기 타가토스-이인산 알돌레이즈는 기존에 하기 [반응식 1]과 같이 D-타가토스 1,6-이인산(D-tagatose 1,6-bisphosphate)를 기질로 하여 글리세론 포스페이트(glycerone phosphate)와 D-글리세랄데하이드 3-포스페이트(D-glyceraldehyde 3-phosphate)를 생산하는 효소로 공지되어 있다.
[반응식 1]
D-타가토스 1,6-이인산 <=> 글리세론 포스페이트 + D-글리세랄데하이드 3-포스페이트
일례로 타가토스-6-인산 키나아제 (Tagatose 6 phosphate kinase; EC 2.7.1.144)가 과당을 기질로 타가토스로 전환하는 활성을 가진다면 과당-4-에피머화 효소로 포함될 수 있다. 상기 타가토스-6-인산 키나아제는 기존에 하기 [반응식 2]와 같이 ATP와 D-타가토스 6-인산(D-tagatose 6-phosphate)를 기질로 하여 ADP와 D-타가토스 1,6-이인산(D-tagatose 1,6-bisphosphate)를 생산하는 효소로 공지되어 있다.
[반응식 2]
ATP + D-타가토스 6-인산 <=> ADP + D-타가토스 1,6-이인산
상기 과당-4-에피머화 효소의 활성은 기질인 과당으로부터 타가토스로의 전환율(전환율=타가토스 중량/초기 과당 중량 *100)이 0.01% 이상, 구체적으로 0.1% 이상, 더욱 구체적으로 0.3% 이상인 것일 수 있다. 보다 구체적으로 전환율은 0.01% 내지 100%의 범위, 0.1% 내지 50%의 범위일 수 있다.
본 출원의 과당-4-에피머화 효소, 타가토스-이인산 알돌레이즈, 타가토스-6-인산 키나아제는 내열성 미생물 유래 효소 또는 그 변이체일 수 있으며, 예를 들어, 코스모토가 오엘리아(Kosmotoga olearia), 썸언에어로드릭스 데센시스(Thermanaerothrix daxensis), 로도써무스 프로펀디(Rhodothermus profundi), 로도써무스 마리너스(Rhodothermus marinus), 림노초르다 필오사(Limnochorda pilosa), 칼디스리스 아비시 (Caldithrix abyssi), 칼디리네 에로필라 (Caldilinea aerophila) 써모언에로박터, 써모하이드로썰퓨리쿠스(Thermoanaerobacter thermohydrosulfuricus), 에시도박테리알레스 박테리움(Acidobacteriales bacterium), 칼디셀룰로시럽터 크로노스키엔시스(Caldicellulosiruptor kronotskyensis), 써모언에어로박테리움 써모사카롤리티쿰(Thermoanaerobacterium thermosaccharolyticum), 또는 슈도알테로모나스 sp. H103, 유래 효소 또는 그 변이체일 수 있으나, 이에 제한되지 않는다. 구체적으로, 코스모토가 오엘리아(Kosmotoga olearia)(서열번호 1), 써모사카롤리티쿰(Thermoanaerobacterium thermosaccharolyticum)(서열번호 3), 슈도알테로모나스 sp. H103(서열번호 5), 썸언에어로드릭스 데센시스(Thermanaerothrix daxensis)(서열번호 7), 에시도박테리알레스 박테리움(Acidobacteriales bacterium)(서열번호 9), 로도써무스 프로펀디(Rhodothermus profundi)(서열번호 11), 로도써무스 마리너스(Rhodothermus marinus)(서열번호 13), 림노초르다 필오사(Limnochorda pilosa)(서열번호 15), 칼디스리스 아비시 (Caldithrix abyssi)(서열번호 17), 칼디셀룰로시럽터 크로노스키엔시스(Caldicellulosiruptor kronotskyensis)(서열번호 19), 칼디리네 에로필라 (Caldilinea aerophila)(서열번호 21), 또는 써모언에로박터 써모하이드로썰퓨리쿠스(Thermoanaerobacter thermohydrosulfuricus)(서열번호 23) 유래 효소 또는 그 변이체일 수 있으나, 이에 제한되지 않는다.
구체적으로, 상기 과당-4-에피머화 효소, 타가토스-이인산 알돌레이즈, 또는 타가토스-6-인산 키나아제는 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23의 아미노산 서열 또는 이와 70% 이상의 상동성 또는 동일성을 갖는 아미노산 서열을 포함할 수 있으나, 이에 제한되지 않는다. 더욱 구체적으로, 본 출원의 과당-4-에피머화 효소는 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23의 아미노산 서열과 적어도 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 상동성 또는 동일성을 가지는 폴리펩티드를 포함할 수 있다. 또한, 이러한 상동성 또는 동일성을 가지며 상기 단백질에 상응하는 효능을 나타내는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 갖는 보조 단백질도 본 출원의 범위 내에 포함됨은 자명하다.
본 출원에서 상기 서열번호 1은 과당-4-에피머화 효소 활성을 갖는 아미노산 서열을 의미한다. 상기 서열번호 1은 공지의 데이터 베이스인 NCBI의 GenBank또는 KEGG(Kyoto Encyclopedia of Genes and Genomes)에서 그 서열을 얻을 수 있다. 일 예로, 코스모토가 오엘리아 (Kosmotoga olearia) 유래일 수 있으며, 더욱 구체적으로는 서열번호 1로 기재된 아미노산 서열을 포함하는 폴리펩티드/단백질일 수 있으나, 이에 제한되지 않는다. 또한 상기 아미노산 서열과 동일한 활성을 갖는 서열은 제한없이 포함될 수 있다. 또한, 서열번호 1의 아미노산 서열 또는 이와 70% 이상의 상동성(homology) 또는 동일성(identity)을 갖는 아미노산 서열을 포함할 수 있으나, 이에 제한되는 것은 아니다. 구체적으로 상기 아미노산 서열은 서열번호 1 및 상기 서열번호 1와 적어도 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 가지는 아미노산 서열을 포함할 수 있다. 또한, 이러한 상동성 또는 동일성을 가지며 상기 단백질에 상응하는 효능을 나타내는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 갖는 단백질도 본 출원의 범위내에 포함됨은 자명하다.
즉, 본 출원에서 '특정 서열번호로 기재된 아미노산 서열을 갖는 단백질 '이라고 기재되어 있다 하더라도, 해당 서열번호의 아미노산 서열로 이루어진 단백질과 동일 혹은 상응하는 활성을 가지는 경우라면, 일부 서열이 결실, 변형, 치환, 보존적 치환 또는 부가된 아미노산 서열을 갖는 단백질도 본 출원에서 사용될 수 있음은 자명하다. 예를 들어, 상기 단백질과 동일 혹은 상응하는 활성을 가지는 경우라면 상기 아미노산 서열 앞뒤에 단백질의 기능을 변경하지 않는 서열 추가, 자연적으로 발생할 수 있는 돌연변이, 이의 잠재성 돌연변이 (silent mutation) 또는 보존적 치환을 제외하는 것이 아니며, 이러한 서열 추가 혹은 돌연변이를 가지는 경우에도 본원의 범위 내에 속하는 것이 자명하다.
본 출원에서 용어, "타가토스"는 단당류 중 케토헥소스의 일종으로 "D-타가토스"와 혼용되어 사용된다.
본 출원에서 용어, "과당-4-에피머화 효소 변이체"는 과당-4-에피머화 효소 활성을 갖는 폴리펩티드의 아미노산 서열에서 하나 이상의 아미노산 치환을 포함하는 과당-4-에피머화 효소 변이체를 의미한다.
구체적으로 상기 아미노산 치환은 N-말단으로부터 8번째, 20번째, 23번째, 25번째, 26번째, 29번째, 45번째, 51번째, 53번째, 63번째, 86번째, 91번째, 97번째, 110번째, 133번째, 144번째, 146번째, 151번째, 155번째, 167번째, 172번째, 173번째, 174번째, 181번째, 191번째, 239번째, 263번째, 266번째, 285번째, 294번째, 298번째, 308번째, 315번째, 316번째, 317번째, 323번째, 336번째, 347번째, 359번째, 367번째, 385번째, 386번째, 388번째, 389번째, 410번째, 414번째, 및 417번째로 이루어진 군에서 선택되는 하나의 이상의 위치의 아미노산이 다른 아미노산으로 치환된 것을 포함하는 것일 수 있으나, 이에 제한되지 않는다.
본 출원의 'N번 위치'은 N번 위치 및 N번 위치와 상응(Correspoding)하는 아미노산 위치를 포함할 수 있다. 구체적으로 특정 아미노산 서열에 개시된 성숙 폴리펩티드(mature polypeptide)에서 임의의 아미노산 잔기에 상응하는 아미노산 위치를 포함할 수 있다. 상기 특정 아미노산 서열은 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23의 아미노산 서열 중 어느 하나일 수 있다.
상기 N번 위치와 상응하는 아미노산 위치 또는 상기 특정 아미노산 서열에 개시된 성숙 폴리펩티드에서의 임의의 아미노산 잔기에 상응하는 아미노산 위치는 EMBOSS 패키지의 Needle 프로그램(EMBOSS: The European Molecular Biology Open Software Suite, 문헌[Rice et al., 2000, Trends Genet. 16:276-277])에서 구현되는 바와 같이 Needleman-Wunsch 알고리즘(문헌[Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453]), 구체적으로 버전 5.0.0 또는 그 이후를 사용하여 결정될 수 있다. 사용되는 파라미터는 10의 갭 오픈 페널티, 0.5의 갭 연장 페널티 및 EBLOSUM62(BLOSUM62의 EMBOSS 버전) 치환 매트릭스일 수 있다.
상기 N번 위치와 상응하는 아미노산 위치 또는 상기 특정 아미노산 서열에 개시된 성숙 폴리펩티드에서의 임의의 아미노산 잔기에 상응하는 아미노산 위치의 아미노산 잔기의 확인은 비제한적으로 그들 각각의 디폴트 파라미터를 사용하는 MUSCLE(multiple sequence comparison by log-expectation; 버전 3.5 또는 그 이후; 문헌[Edgar, 2004, Nucleic Acids Research 32: 1792-1797]), MAFFT(버전 6.857 또는 그 이후; 문헌[Katoh and Kuma, 2002, Nucleic Acids Research 30: 3059-3066]; 문헌[Katoh et al., 2005, Nucleic Acids Research 33: 511-518]; 문헌[Katoh and Toh, 2007, Bioinformatics 23: 372-374]; 문헌[Katoh et al., 2009, Methods in Molecular Biology 537: 39-64]; 문헌[Katoh and Toh, 2010, Bioinformatics 26: 1899-1900]) 및 ClustalW를 사용하는 EMBOSS EMMA(1.83 또는 그 이후; 문헌[Thompson et al., 1994, Nucleic Acids Research 22: 4673-4680])를 포함하는 몇몇 컴퓨터 프로그램을 사용한 다중 폴리펩티드 서열의 정렬에 의해 결정될 수 있다.
그 밖의 폴리펩티드가 특정 아미노산 서열의 성숙 폴리펩티드로부터 벗어나서, 종래의 서열 기반의 비교로 그들의 관계를 검출하지 못하게 되는 경우(문헌[Lindahl and Elofsson, 2000, J. Mol. Biol. 295: 613-615]), 그 밖의 쌍별 서열 비교 알고리즘이 사용될 수 있다. 서열 기반의 검색에서 보다 큰 감수성은 데이터베이스를 검색하기 위한 폴리펩티드 패밀리(프로파일)의 확률론적 표시를 이용하는 검색 프로그램을 사용하여 얻어질 수 있다. 예를 들어, PSI-BLAST 프로그램은 반복적인 데이터베이스 검색 과정을 통하여 프로파일을 산출하고 원거리 상동체를 검출할 수 있다(문헌[Atschul et al., 1997, Nucleic Acids Res. 25: 3389-3402]). 폴리펩티드에 대한 패밀리 또는 슈퍼패밀리가 단백질 구조 데이터베이스에서 1개 이상의 표시를 가진다면 훨씬 더 큰 민감성이 달성될 수 있다. GenTHREADER(문헌[Jones, 1999, J. Mol. Biol. 287: 797-815]; 문헌[McGuffin and Jones, 2003, Bioinformatics 19: 874-881])와 같은 프로그램은 질의 서열(query sequence)에 대한 구조적 폴딩을 예측하는 신경망에 대한 입력으로서 다양한 공급원(PSI-BLAST, 2차 구조 예측, 구조정렬 프로파일 및 용매화 포텐셜)으로부터의 정보를 이용한다. 유사하게는 문헌[Gough et al., 2000, J. Mol. Biol. 313: 903-919]의 방법은 알려지지 않은 구조의 서열과 SCOP 데이터베이스에 존재 하는 슈퍼패밀리 모델을 정렬하기 위해 사용될 수 있다. 이들 정렬은 폴리펩티드에 대한 상동성, 유사성, 또는 동일성 모델을 생성하기 위해 차례로 사용될 수 있고, 이러한 모델은 그 목적을 위해 개발된 다양한 툴을 사용하여 정확성에 대해 평가될 수 있다.
상기 '다른 아미노산'은 각 위치에 해당되는 아미노산을 제외한 다른 아미노산이면 제한되지 않는다. '아미노산'은 곁사슬의 성질에 따라 산성, 염기성, 극성(친수성), 비극성(소수성)의 네 가지 종류로 구분된다.
상기 변이체는 서열번호 1의 아미노산 서열에서 각 위치의 아미노산이 비극성 아미노산인 글리신(G), 알라닌(A), 발린(V), 류신(L), 이소류신(I), 메티오닌(M), 페닐알라닌(F), 트립토판(W), 및 프롤린(P); 극성 아미노산인 세린(S), 쓰레오닌(T), 시스테인(C), 티로신(Y), 아스팔트산(D), 및 글루타민(Q); 산성 아미노산인 아스파라긴(N), 및 글루탐산(E); 염기성 아미노산인 라이신(K), 아르기닌(R), 및 히스티딘(H)으로 이루어진 군으로부터 선택되는 하나 이상의 아미노산으로 치환된 단백질일 수 있으나, 이에 제한되지 않는다.
구체적으로, 8번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 글루탐산(E), 히스티딘(H), 류신(L), 프롤린(P), 글루타민(Q) 또는 발린(V)으로 치환되는 것일 수 있다. 20번째 위치의 아미노산은 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 아르기닌(R)으로 치환되는 것일 수 있다. 23번째 위치의 아미노산은 극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 시스테인(C)으로 치환되는 것일 수 있다. 25번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 발린(V), 세린(S), 아스팔트산(D), 히스티딘(H), 페닐알라닌(F), 류신(L), 글리신(G), 아스파라긴(N), 메티오닌(M), 글루탐산(E), 글루타민(Q), 프롤린(P), 라이신(K), 티로신(Y), 아르기닌(R), 트립토판(W), 이소류신(I), 또는 쓰레오닌(T)으로 치환되는 것일 수 있다. 26번째 위치의 아미노산은 비극성 아미노산, 또는 극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 쓰레오닌(T) 또는 발린(V)을 치환되는 것일 수 있다. 29번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 트립토판(W), 시스테인(C), 라이신(K), 알라닌(A), 글루탐산(E), 류신(L), 프롤린(P), 글루타민(Q), 세린(S) 또는 발린(V)을 치환되는 것일 수 있다. 45번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 글루타민(Q), 발린(V), 라이신(K), 글루탐산(E), 또는 메티오닌(M)으로 치환되는 것일 수 있다. 51번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 알라닌(A), 발린(V), 류신(L), 이소류신(I), 메티오닌(M), 페닐알라닌(F), 트립토판(W), 프롤린(P), 세린(S), 시스테인(C), 티로신(Y), 아스팔트산(D), 글루타민(Q), 아스파라긴(N), 글루탐산(E), 라이신(K), 아르기닌(R), 또는 히스티딘(H)으로 치환되는 것일 수 있다. 53번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 트립토판(W), 페닐알라닌(F), 시스테인(C), 라이신(K), 아르기닌(R), 글리신(G), 세린(S), 류신(L), 쓰레오닌(T), 또는 프롤린(P)으로 치환되는 것일 수 있다. 63번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 산성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 프롤린(P), 알라닌(A), 메티오닌(M), 발린(V), 글루탐산(E), 또는 류신(L)으로 치환되는 것일 수 있으며, 86번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 아르기닌(R), 발린(V), 메티오닌(M), 알라닌(A), 류신(L), 또는 글리신(G)으로 치환되는 것일 수 있다. 91번째 위치의 아미노산은 비극성 아미노산, 또는 극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 페닐알라닌(F), 트립토판(W), 또는 티로신(Y)으로 치환되는 것일 수 있다. 97번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 류신(L), 프롤린(P), 티로신(Y), 글루탐산(E), 라이신(K)으로 치환되는 것일 수 있다. 110번째 위치의 아미노산은 극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 티로신(Y)으로 치환되는 것일 수 있다. 133번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 발린(V), 류신(L), 프롤린(P), 글루타민(Q), 아스파라긴(N), 또는 글루탐산(E)으로 치환되는 것일 수 있다. 144번째 위치의 아미노산은 비극성 아미노산, 또는 극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 발린(V), 이소류신(I), 페닐알라닌(F), 또는 세린(S)으로 치환되는 것일 수 있다. 146번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 류신(L), 이소류신(I), 프롤린(P), 글루타민(Q), 또는 히스티딘(H)으로 치환되는 것일 수 있다. 151번째 위치의 아미노산은 비극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G)으로 치환되는 것일 수 있다. 155번째 위치의 아미노산은 비극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G)으로 치환되는 것일 수 있다. 167번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 발린(V), 글리신(G), 알라닌(A), 아르기닌(R), 류신(L), 쓰레오닌(T), 아스팔트산(D)으로 치환되는 것일 수 있다. 172번째 위치의 아미노산은 비극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 또는 쓰레오닌(T)으로 치환되는 것일 수 있다. 173번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 산성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 발린(V), 쓰레오닌(T), 글루탐산(E) 또는 아스팔트산(D)으로 치환되는 것일 수 있다. 174번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 발린(V), 류신(L), 메티오닌(M), 페닐알라닌(F), 트립토판(W), 세린(S), 티로신(Y), 아스팔트산(D), 라이신(K), 또는 아르기닌(R)으로 치환되는 것일 수 있다. 181번째 위치의 아미노산은 비극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 알라닌(A), 류신(L), 이소류신(I), 프롤린(P), 라이신(K), 또는 아르기닌(R)으로 치환되는 것일 수 있다. 191번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 알라닌(A), 발린(V), 류신(L), 이소류신(I), 세린(S), 쓰레오닌(T) 또는 아르기닌(R)으로 치환되는 것일 수 있다. 239번째 위치의 아미노산은 비극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 알라닌(A), 발린(V), 류신(L), 트립토판(W), 프롤린(P), 글루탐산(E), 또는 라이신(K)으로 치환되는 것일 수 있다. 263번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 류신(L), 글루타민(Q), 글루탐산(E), 또는 라이신(K)으로 치환되는 것일 수 있다. 266번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 알라닌(A), 발린(V), 류신(L), 이소류신(I), 트립토판(W), 프롤린(P), 시스테인(C), 티로신(Y), 아스팔트산(D), 또는 아르기닌(R)으로 치환되는 것일 수 있다. 285번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 산성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 발린(V), 류신(L), 메티오닌(M), 티로신(Y), 아스팔트산(D), 글루타민(Q), 또는 글루탐산(E)으로 치환되는 것일 수 있다. 294번째 위치의 아미노산은 비극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G)으로 치환되는 것일 수 있다. 298번째 위치의 아미노산은 비극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G)으로 치환되는 것일 수 있다. 308번째 위치의 아미노산은 비극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 발린(V), 류신(L), 이소류신(I), 트립토판(W), 아르기닌(R), 또는 히스티딘(H)으로 치환되는 것일 수 있다. 315번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 발린(V), 류신(L), 프롤린(P), 아스팔트산(D), 또는 히스티딘(H)으로 치환되는 것일 수 있다. 316번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 발린(V), 류신(L), 메티오닌(M), 프롤린(P), 쓰레오닌(T), 아스파라긴(N), 라이신(K), 또는 아르기닌(R)으로 치환되는 것일 수 있다. 317번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 발린(V), 이소류신(I), 세린(S), 아스팔트산(D), 아르기닌(R), 또는 히스티딘(H)으로 치환되는 것일 수 있다. 323번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 발린(V), 류신(L), 메티오닌(M), 아스팔트산(D), 아르기닌(R), 또는 히스티딘(H)으로 치환되는 것일 수 있다. 336번째 위치의 아미노산은 비극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 알라닌(A), 또는 아르기닌(R)으로 치환되는 것일 수 있다. 347번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 산성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 프롤린(P), 세린(S), 티로신(Y), 아스팔트산(D), 아스파라긴(N), 또는 페닐알라닌(F)으로 치환되는 것일 수 있다. 359번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 알라닌(A), 발린(V), 아스팔트산(D), 아스파라긴(N), 또는 아르기닌(R)으로 치환되는 것일 수 있다. 367번째 위치의 아미노산은 비극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 알라닌(A), 발린(V), 류신(L), 이소류신(I), 또는 아르기닌(R)으로 치환되는 것일 수 있다. 385번째 위치의 아미노산은 비극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 또는 아르기닌(R)으로 치환되는 것일 수 있다. 386번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 발린(V), 류신(L), 이소류신(I), 세린(S), 쓰레오닌(T), 아스팔트산(D), 아르기닌(R), 또는 히스티딘(H)으로 치환되는 것일 수 있다. 388번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 발린(V), 이소류신(I), 세린(S), 쓰레오닌(T), 아스팔트산(D), 또는 아르기닌(R)으로 치환되는 것일 수 있다. 389번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 발린(V), 메티오닌(M), 세린(S), 아스팔트산(D), 글루탐산(E), 라이신(K), 또는 아르기닌(R)으로 치환되는 것일 수 있다. 410번째 위치의 아미노산은 비극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 발린(V), 류신(L), 또는 쓰레오닌(T)으로 치환되는 것일 수 있다. 414번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 산성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 프롤린(P), 글루타민(Q), 또는 글루탐산(E)으로 치환되는 것일 수 있다. 417번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 알라닌(A), 발린(V), 류신(L), 메티오닌(M), 프롤린(P), 세린(S), 아스팔트산(D), 또는 아르기닌(R)으로 치환되는 것일 수 있으나, 이에 제한되지 않는다.
상기 과당-4-에피머화 효소 변이체는 특정 위치의 아미노산이 다른 아미노산으로 치환된 것 이외의 하나 이상의 아미노산이 보존적 치환(conservative substitution) 및/또는 변형(modification)에 있어서 상기 열거된 서열 (the recited sequence)과 상이하나, 상기 단백질의 기능(functions) 또는 특성(properties)이 유지되는 폴리펩티드를 포함할 수 있다.
본 출원에서 용어 "보존적 치환(conservative substitution)"은 한 아미노산을 유사한 구조적 및/또는 화학적 성질을 갖는 또 다른 아미노산으로 치환시키는 것을 의미한다. 상기 변이형은 하나 이상의 생물학적 활성을 여전히 보유하면서, 예를 들어 하나 이상의 보존적 치환을 가질 수 있다. 보존적 치환은 생성된 폴리펩티드의 활성에 거의 영향을 미치지 않거나 또는 영향을 미치지 않는다.
또한, 전술한 특정 위치의 아미노산 이외의 하나 이상의 아미노산이 변이된 변이형은 폴리펩티드의 특성과 2차 구조에 최소한의 영향을 갖는 아미노산들의 결실 또는 부가를 포함할 수 있다. 예를 들면 폴리펩티드는 번역-동시에(co-translationally) 또는 번역-후에(post-translationally) 단백질의 전이 (transfer)에 관여하는 단백질 N-말단의 시그널 (또는 리더)서열과 컨쥬게이트 할 수 있다. 또한 상기 폴리펩티드는 폴리펩티드를 확인, 정제, 또는 합성할 수 있도록 다른 서열 또는 링커와 컨쥬게이트 될 수 있다.
또한 상기 변이체는 위에서 설명한 서열번호 1의 변이 및/또는 상기 서열번호 1의 변이와 변이 위치 외 적어도 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 가지는 아미노산을 포함한다. 상기 서열번호 1의 변이는 전술한 바와 같으며, 이의 상동성 또는 동일성은 전술한 변이 외의 위치에서 상동성 또는 동일성을 가지는 것일 수 있다.
본 출원의 목적상 상기 과당-4-에피머화 효소 변이체는 전환 활성 또는 안정성이 야생형에 비하여 향상된 것을 특징으로 한다.
상기 용어 "전환 활성"은 D-프럭토스(과당)의 4번 탄소 위치를 에피머화하여 타가토스로 전환시키는 것을 의미하며, 상기 용어 "안정성"은 내열성이 높은 효소로서 열 안정성을 갖는 것을 의미한다.
구체적으로, 서열번호 1의 야생형에 비하여 D-프럭토스(과당)의 4번 탄소 위치를 에피머화하여 타가토스로 전환하는 활성 및/또는 안정성이 향상되는 것을 특징으로 한다.
일 예로, 본 출원의 과당-4-에피머화 효소 변이체는 내열성이 높은 효소일 수 있다. 구체적으로, 본 출원의 과당-4-에피머화 효소 변이체는 50℃내지 70℃에서 최대 활성의 50% 내지 100%, 60% 내지 100%, 70% 내지 100% 또는 75% 내지 100%의 활성을 나타낼 수 있다. 보다 구체적으로, 본 출원의 과당-4-에피머화 효소 변이체는 55℃ 내지 60℃, 60℃ 내지 70℃, 55℃, 60℃, 또는 70℃에서 최대 활성의 80% 내지 100% 또는 85% 내지 100%의 활성을 나타낼 수 있다.
상기 변이체의 변이 위치와 변이된 아미노산은 그 예로 표 1 내지 표 6에 기재된 바와 같으나, 이에 제한되지 않는다.
본 출원의 다른 하나의 양태는 상기 과당-4-에피머화 효소 변이체를 코딩하는 폴리뉴클레오티드, 또는 상기 폴리뉴클레오티드를 포함하는 벡터를 제공하는 것이다.
본 출원에서 용어, "폴리뉴클레오티드"는 뉴클레오티드 단위체(monomer)가 공유결합에 의해 길게 사슬모양으로 이어진 뉴클레오티드의 중합체(polymer)로 일정한 길이 이상의 DNA 또는 RNA 가닥으로서, 보다 구체적으로는 상기 변이형 단백질을 코딩하는 폴리뉴클레오티드 단편을 의미한다.
본 출원의 과당-4-에피머화 효소 변이체를 코딩하는 폴리뉴클레오티드는, 본 출원의 과당-4-에피머화 효소 변이체를 코딩하는 폴리뉴클레오티드 서열이라면 제한없이 포함될 수 있다. 일 예로, 본 출원의 과당-4-에피머화 효소 변이체를 코딩하는 폴리뉴클레오티드는 상기 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열일 수 있으나, 이에 제한되는 것은 아니다. 상기 폴리뉴클레오티드는 코돈의 축퇴성(degeneracy)으로 인하여 또는 상기 단백질을 발현시키고자 하는 생물에서 선호되는 코돈을 고려하여, 단백질의 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. 따라서, 코돈 축퇴성 (codon degeneracy)에 의해 상기 아미노산 서열로 이루어진 폴리펩타이드 또는 이와 상동성 또는 동일성을 가지는 폴리펩타이드로 번역될 수 있는 폴리뉴클레오티드 역시 포함될 수 있음은 자명하다.
또한 공지의 유전자 서열로부터 조제될 수 있는 프로브, 예를 들면, 상기 염기 서열의 전체 또는 일부에 대한 상보 서열과 엄격한 조건 하에 하이브리드화하여, 상기 과당-4-에피머화 효소 변이체를 코딩하는 서열이라면 제한없이 포함될 수 있다.
상기 "엄격한 조건(stringent condition)"이란 폴리뉴클레오티드 간의 특이적 혼성화를 가능하게 하는 조건을 의미한다. 이러한 조건은 문헌 (예컨대, J. Sambrook et al., 상동)에 구체적으로 기재되어 있다. 예를 들어, 상동성(homology) 또는 동일성(identity)이 높은 유전자끼리, 70% 이상, 80% 이상, 85% 이상, 구체적으로는 90% 이상, 보다 구체적으로는 95% 이상, 더욱 구체적으로는 97% 이상, 특히 구체적으로는 99% 이상의 상동성 또는 동일성을 갖는 유전자끼리 하이브리드화하고, 그보다 상동성 또는 동일성이 낮은 유전자끼리 하이브리드화하지 않는 조건, 또는 통상의 써던 하이브리드화(southern hybridization)의 세척 조건인 60℃, 1 X SSC, 0.1% SDS, 구체적으로는 60℃, 0.1 X SSC, 0.1% SDS, 보다 구체적으로는 68℃, 0.1 X SSC, 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 구체적으로는 2회 내지 3회 세정하는 조건을 열거할 수 있다.
혼성화는 비록 혼성화의 엄격도에 따라 염기 간의 미스매치 (mismatch)가 가능할지라도, 두 개의 핵산이 상보적 서열을 가질 것을 요구한다. 용어, "상보적"은 서로 혼성화가 가능한 뉴클레오티드 염기 간의 관계를 기술하는데 사용된다. 예를 들면, DNA에 관하여, 아데노신은 티민에 상보적이며 시토신은 구아닌에 상보적이다. 따라서, 본 출원은 또한 실질적으로 유사한 핵산 서열뿐만 아니라 전체 서열에 상보적인 단리된 핵산 단편을 포함할 수 있다.
구체적으로, 상동성 또는 동일성을 가지는 폴리뉴클레오티드는 55 ℃의 Tm 값에서 혼성화 단계를 포함하는 혼성화 조건을 사용하고 상술한 조건을 사용하여 탐지할 수 있다. 또한, 상기 Tm 값은 60 ℃, 63 ℃ 또는 65 ℃일 수 있으나, 이에 제한되는 것은 아니고 그 목적에 따라 당업자에 의해 적절히 조절될 수 있다.
폴리뉴클레오티드를 혼성화하는 적절한 엄격도는 폴리뉴클레오티드의 길이 및 상보성 정도에 의존하고 변수는 해당기술분야에 잘 알려져 있다(Sambrook et al., supra, 9.50-9.51, 11.7-11.8 참조).
본 출원에서 용어, '상동성(homology)' 또는 '동일성(identity)'은 두 개의 주어진 아미노산 서열 또는 염기 서열과 서로 관련된 정도를 의미하며 백분율로 표시될 수 있다.
용어 상동성 및 동일성은 종종 상호교환적으로 이용될 수 있다.
보존된 (conserved) 폴리뉴클레오티드 또는 폴리펩티드의 서열 상동성 또는 동일성은 표준 배열 알고리즘에 의해 결정되며, 사용되는 프로그램에 의해 확립된 디폴트 갭 페널티가 함께 이용될 수 있다. 실질적으로, 상동성을 갖거나 (homologous) 또는 동일한 (identical) 서열은 중간 또는 높은 엄격한 조건(stringent conditions)에서 일반적으로 서열 전체 또는 전체-길이의 적어도 약 50%, 60%, 70%, 80% 또는 90% 이상으로 하이브리드화할 수 있다. 하이브리드화는 폴리뉴클레오티드에서 코돈 대신 축퇴 코돈을 함유하는 폴리뉴클레오티드 또한 고려된다.
임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는 예를 들어, Pearson et al (1988)[Proc. Natl. Acad. Sci. USA 85: 2444]에서와 같은 디폴트 파라미터를 이용하여 "FASTA" 프로그램과 같은 공지의 컴퓨터 알고리즘을 이용하여 결정될 수 있다. 또는, EMBOSS 패키지의 니들만 프로그램(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277)(버전 5.0.0 또는 이후 버전)에서 수행되는 바와 같은, 니들만-운치(Needleman-Wunsch) 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)이 사용되어 결정될 수 있다. (GCG 프로그램 패키지 (Devereux, J., et al, Nucleic Acids Research 12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop, [ED.,] Academic Press, San Diego,1994, 및 [CARILLO ETA/.](1988) SIAM J Applied Math 48: 1073을 포함한다). 예를 들어, 국립 생물공학 정보 데이터베이스 센터의 BLAST, 또는 ClustalW를 이용하여 상동성, 유사성 또는 동일성을 결정할 수 있다.
폴리뉴클레오티드 또는 폴리펩티드의 상동성, 유사성 또는 동일성은 예를 들어, Smith and Waterman, Adv. Appl. Math (1981) 2:482에 공지된 대로, 예를 들면, Needleman et al. (1970), J Mol Biol.48 : 443과 같은 GAP 컴퓨터 프로그램을 이용하여 서열 정보를 비교함으로써 결정될 수 있다. 요약하면, GAP 프로그램은 두 서열 중 더 짧은 것에서의 기호의 전체 수로, 유사한 배열된 기호(즉, 뉴클레오티드 또는 아미노산)의 수를 나눈 값으로 정의한다. GAP 프로그램을 위한 디폴트 파라미터는 (1) 이진법 비교 매트릭스(동일성을 위해 1 그리고 비-동일성을 위해 0의 값을 함유함) 및 Schwartz and Dayhoff, eds., Atlas Of Protein Sequence And Structure, National Biomedical Research Foundation, pp. 353-358 (1979)에 의해 개시된 대로, Gribskov et al(1986) Nucl. Acids Res. 14: 6745의 가중된 비교 매트릭스 (또는 EDNAFULL(NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스); (2) 각 갭을 위한 3.0의 페널티 및 각 갭에서 각 기호를 위한 추가의 0.10 페널티 (또는 갭 개방 패널티 10, 갭 연장 패널티 0.5); 및 (3) 말단 갭을 위한 무 페널티를 포함할 수 있다. 따라서, 본원에서 사용된 것으로서, 용어 "상동성" 또는 "동일성"은 서열들간의 관련성(relevance)를 나타낸다.
본 출원에서 사용된 용어, "벡터"는 적합한 숙주 내에서 목적 변이형 단백질을 발현시킬 수 있도록 적합한 조절 서열에 작동 가능하게 연결된 상기 목적 변이형 단백질을 코딩하는 폴리뉴클레오티드의 염기서열을 함유하는 DNA 제조물을 의미한다. 상기 조절 서열은 전사를 개시할 수 있는 프로모터, 그러한 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합부위 서열, 및 전사 및 해독의 종결을 조절하는 서열을 포함할 수 있다. 벡터는 적당한 숙주세포 내로 형질전환된 후, 숙주 게놈과 무관하게 복제되거나 기능할 수 있으며, 게놈 그 자체에 통합될 수 있다.
본 출원에서 사용되는 벡터는 숙주세포 내에서 복제 가능한 것이면 특별히 한정되지 않으며, 당업계에 알려진 임의의 벡터를 이용할 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스 및 박테리오파지를 들 수 있다. 예를 들어, 파지 벡터 또는 코스미드 벡터로서 pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, 및 Charon21A 등을 사용할 수 있으며, 플라스미드 벡터로서 pBR계, pUC계, pBluescriptII계, pGEM계, pTZ계, pCL계 및 pET계 등을 사용할 수 있다. 구체적으로는 pDZ, pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118, pCC1BAC 벡터 등을 사용할 수 있다.
일례로 세포 내 염색체 삽입용 벡터를 통해 염색체 내에 목적 변이형 단백질을 코딩하는 폴리뉴클레오티드를 변이된 폴리뉴클레오티드로 교체시킬 수 있다. 상기 폴리뉴클레오티드의 염색체 내로의 삽입은 당업계에 알려진 임의의 방법, 예를 들면, 상동 재조합(homologous recombination)에 의하여 이루어질 수 있으나, 이에 한정되지는 않는다. 상기 염색체 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 선별 마커는 벡터로 형질전환된 세포를 선별, 즉 목적 핵산 분자의 삽입 여부를 확인하기 위한 것으로, 약물 내성, 영양 요구성, 세포 독성제에 대한 내성 또는 표면 변이형 단백질의 발현과 같은 선택가능 표현형을 부여하는 마커들이 사용될 수 있다. 선택제(selective agent)가 처리된 환경에서는 선별 마커를 발현하는 세포만 생존하거나 다른 표현 형질을 나타내므로, 형질전환된 세포를 선별할 수 있다.
본 출원의 또 하나의 양태로서, 본 출원은 상기 변이형 단백질을 포함하거나, 상기 변이형 단백질을 코딩하는 폴리뉴클레오티드를 포함하여, 타가토스를 생산하는 미생물을 제공하는 것이다. 구체적으로 변이형 단백질 및/또는 상기 변이형 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 미생물은 변이형 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 벡터로 형질전환에 의해 제조되는 미생물일 수 있으나, 이에 제한되지 않는다.
본 출원에서 용어 "형질전환"은 표적 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 숙주세포 내에 도입하여 숙주세포 내에서 상기 폴리뉴클레오티드가 코딩하는 단백질이 발현할 수 있도록 하는 것을 의미한다. 형질전환된 폴리뉴클레오티드는 숙주세포 내에서 발현될 수 있기만 한다면, 숙주세포의 염색체 내에 삽입되어 위치하거나 염색체 외에 위치하거나 상관없이 이들 모두를 포함할 수 있다. 또한, 상기 폴리뉴클레오티드는 표적 단백질을 코딩하는 DNA 및 RNA를 포함한다. 상기 폴리뉴클레오티드는 숙주세포 내로 도입되어 발현될 수 있는 것이면, 어떠한 형태로 도입되는 것이든 상관없다. 예를 들면, 상기 폴리뉴클레오티드는 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체인 발현 카세트 (expression cassette)의 형태로 숙주세포에 도입될 수 있다. 상기 발현 카세트는 통상 상기 폴리뉴클레오티드에 작동 가능하게 연결되어 있는 프로모터 (promoter), 전사 종결신호, 리보좀 결합부위 및 번역 종결신호를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 또한, 상기 폴리뉴클레오티드는 그 자체의 형태로 숙주세포에 도입되어 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있으며, 이에 한정되지 않는다.
또한, 상기에서 용어 "작동 가능하게 연결"된 것이란 본 출원의 목적 변이형 단백질을 코딩하는 폴리뉴클레오티드의 전사를 개시 및 매개하도록 하는 프로모터 서열과 상기 유전자 서열이 기능적으로 연결되어 있는 것을 의미한다.
본 출원의 다른 하나의 과당-4-에피머화 효소 변이체, 상기 과당-4-에피머화 효소 변이체를 코딩하는 폴리뉴클레오티드, 또는 상기 폴리뉴클레오티드를 포함하는 벡터를 포함하는 미생물을 제공하는 것이다.
상기 미생물은 상기 과당-4-에피머화 효소 변이체 또는 타가토스를 생산하는 미생물일 수 있다.
본 출원에서 사용되는 용어 "과당-4-에피머화 효소 변이체를 포함하는 미생물"이란, 본 출원의 과당-4-에피머화 효소 변이체가 발현되도록 재조합된 미생물을 의미할 수 있다. 예를 들어 과당-4-에피머화 효소 변이체를 코딩하는 폴리뉴클레오티드를 포함하거나, 또는 과당-4-에피머화 효소 변이체를 코딩하는 폴리뉴클레오티드를 포함하는 벡터로 형질전환되어 상기 변이체를 발현할 수 있는 숙주세포 또는 미생물을 의미한다. 본 출원의 목적상 구체적으로 상기 미생물은 서열번호 1의 아미노산 서열 내 하나 이상의 아미노산 치환을 포함하는 과당-4-에피머화 효소 변이체를 발현하는 미생물로서, 상기 아미노산 치환은 N-말단으로부터 하나 이상의 위치에서 하나 이상의 아미노산이 치환되어, 과당-4-에피머화 효소 활성을 갖는, 변이형 단백질을 발현하는 미생물일 수 있으나 이에 제한되지 않는다.
본 출원의 과당-4-에피머화 효소 변이체는 본 출원의 상기 효소 또는 이의 변이체를 발현하는 DNA를 E. coli 등의 균주에 형질전환시킨 다음, 이를 배양하여 배양물을 수득하고, 상기 배양물을 파쇄하여, 컬럼 등을 통해 정제하여 수득한 것일 수 있다. 상기 형질전환용 균주는 대장균(Escherichia coli) 외에도 코리네박테리움 글루타미쿰(Corynebacterum glutamicum), 아스퍼질러스 오리제(Aspergillus oryzae), 또는 바실러스 섭틸리스(Bacillus subtilis) 등이 있으나, 이에 제한되지 않는다.
본 출원의 미생물은 본 출원의 핵산 또는 본 출원의 재조합 벡터를 포함하여 본 출원의 과당-4-에피머화 효소를 생산할 수 있는 미생물이라면, 원핵 미생물 및 진핵 미생물 어느 것이나 포함될 수 있다. 예를 들면 에스케리키아(Escherichia) 속, 어위니아(Erwinia) 속, 세라티아(Serratia) 속, 프로비덴시아(Providencia) 속, 코리네박테리움(Corynebacterium) 속 및 브레비박테리움(Brevibacterium) 속에 속하는 미생물 균주가 포함될 수 있으나, 이에 제한되지 않는다.
본 출원의 미생물은 상기 핵산 또는 벡터 도입 이외에도 다양한 공지의 방법에 의해 본 출원의 과당-4-에피머화 효소를 발현할 수 있는 미생물을 모두 포함할 수 있다.
본 출원의 미생물의 배양물은 본 출원의 과당-4-에피머화 효소를 발현하는 미생물을 배지에서 배양하여 제조된 것일 수 있다.
상기 방법에 있어서, "배양"은 상기 미생물을 적당히 조절된 환경 조건에서 생육시키는 것을 의미한다. 상기 미생물을 배양하는 과정은 특별히 제한되지 않으나, 공지된 회분식 배양방법, 연속식 배양방법, 유가식 배양방법 등에 의해 수행될 수 있다. 이때, 배양조건은, 특별히 이에 제한되지 않으나, 염기성 화합물 (예: 수산화나트륨, 수산화칼륨 또는 암모니아) 또는 산성 화합물 (예: 인산 또는 황산)을 사용하여 적정 pH (예컨대, pH 5 내지 9, 구체적으로는 pH 6 내지 8, 가장 구체적으로는 pH 6.8)를 조절할 수 있고, 산소 또는 산소-함유 가스 혼합물을 배양물에 도입시켜 호기성 조건을 유지할 수 있다. 배양온도는 20 내지 45℃ 구체적으로는 25 내지 40 ℃를 유지할 수 있고, 약 10 내지 160 시간 동안 배양할 수 있으나, 이에 제한 되는 것은 아니다.
아울러, 사용되는 배양용 배지는 탄소 공급원으로는 당 및 탄수화물 (예: 글루코오스, 슈크로오스, 락토오스, 프럭토오스, 말토오스, 몰라세, 전분 및 셀룰로오스), 유지 및 지방 (예: 대두유, 해바라기씨유, 땅콩유 및 코코넛유), 지방산 (예: 팔미트산, 스테아르산 및 리놀레산), 알코올 (예: 글리세롤 및 에탄올) 및 유기산 (예: 아세트산) 등을 개별적으로 사용하거나 또는 혼합하여 사용할 수 있으나, 이에 제한되지 않는다. 질소 공급원으로는 질소-함유 유기 화합물 (예: 펩톤, 효모 추출액, 육즙, 맥아 추출액, 옥수수 침지액, 대두 박분 및 우레아), 또는 무기 화합물 (예: 황산암모늄, 염화암모늄, 인산암모늄, 탄산암모늄 및 질산암모늄) 등을 개별적으로 사용하거나 또는 혼합하여 사용할 수 있으나, 이에 제한되지 않는다. 인 공급원으로 인산 이수소칼륨, 인산수소이칼륨, 이에 상응하는 나트륨 함유 염 등을 개별적으로 사용하거나 또는 혼합하여 사용할 수 있으나, 이에 제한되지 않는다. 또한, 배지에는 기타 금속염 (예: 황산마그네슘 또는 황산철), 아미노산 및 비타민과 같은 필수성장-촉진 물질을 포함할 수 있다.
본 출원의 또 하나의 양태로서, 서열번호 1의 아미노산 서열을 포함하는 과당-4-에피머화 효소 또는 상기 과당-4-에피머화 효소 변이체; 이를 포함하는 미생물; 또는 상기 미생물의 배양물을 포함하는 타가토스 생산용 조성물을 제공한다.
본 출원의 타가토스 생산용 조성물은 추가로 과당을 포함할 수 있다.
또한, 본 출원의 타가토스 생산용 조성물은 당해 타가토스 생산용 조성물에 통상 사용되는 임의의 적합한 부형제를 추가로 포함할 수 있다. 이러한 부형제로는, 예를 들어, 보존제, 습윤제, 분산제, 현탁화제, 완충제, 안정화제 또는 등장화제 등일 수 있으나, 이에 한정되는 것은 아니다.
본 출원의 타가토스 생산용 조성물은 금속이온 또는 금속염을 추가로 포함할 수 있다. 일 구현예에서, 상기 금속이온 또는 금속염의 금속은 2가 양이온을 포함하는 금속일 수 있다. 구체적으로 본 출원의 금속은 니켈(Ni), 철(Fe), 코발트(Co), 마그네슘(Mg) 또는 망간(Mn)일 수 있다. 보다 구체적으로, 상기 금속염은 MgSO4, FeSO4, NiSO4, NiCl2, CoSO4, MgCl2, MnCl2 또는 MnSO4일 수 있다.
본 출원의 또 하나의 양태로서, 서열번호 1의 아미노산 서열을 포함하는 과당-4-에피머화 효소 또는 상기 과당-4-에피머화 효소 변이체를 포함하는 미생물; 또는 이의 배양물을 과당과 접촉시켜, 과당을 타가토스로 전환시키는 단계를 포함하는 타가토스 제조방법을 제공한다.
일 예로, 본 출원의 접촉은 pH 5.0 내지 pH 9.0 조건에서, 30℃내지 80℃온도 조건에서, 및/또는 0.5시간 내지 48시간 동안 수행할 수 있다.
구체적으로, 본 출원의 접촉은 pH 6.0 내지 pH 9.0 조건 또는 pH 7.0 내지 pH 9.0 조건에서 수행할 수 있다. 또한, 본 출원의 접촉은 35℃내지 80℃, 40℃ 내지 80℃, 45℃ 내지 80℃, 50℃ 내지 80℃, 55℃ 내지 80℃, 60℃ 내지 80℃, 30℃ 내지 70℃, 35℃ 내지 70℃, 40℃ 내지 70℃, 45℃ 내지 70℃, 50℃ 내지 70℃, 55℃ 내지 70℃, 60℃ 내지 70℃, 30℃ 내지 65℃, 35℃ 내지 65℃, 40℃ 내지 65℃, 45℃ 내지 65℃, 50℃ 내지 65℃, 55℃ 내지 65℃, 30℃ 내지 60℃, 35℃ 내지 60℃, 40℃ 내지 60℃, 45℃ 내지 60℃, 50℃ 내지 60℃ 또는 55℃ 내지 60℃ 온도 조건에서 수행할 수 있다. 더불어, 본 출원의 접촉은 0.5시간 내지 36시간 동안, 0.5시간 내지 24시간 동안, 0.5시간 내지 12시간 동안, 0.5시간 내지 6시간 동안, 1시간 내지 48시간 동안, 1시간 내지 36시간 동안, 1시간 내지 24시간 동안, 1시간 내지 12시간 동안, 1시간 내지 6시간 동안, 3시간 내지 48시간 동안, 3시간 내지 36시간 동안, 3시간 내지 24시간 동안, 3시간 내지 12시간 동안, 3시간 내지 6시간 동안, 6시간 내지 48시간 동안, 6시간 내지 36시간 동안, 6시간 내지 24시간 동안, 6시간 내지 12시간 동안, 12시간 내지 48시간 동안, 12시간 내지 36시간 동안, 12시간 내지 24시간 동안, 18시간 내지 48시간 동안, 18시간 내지 36시간 동안 또는 18시간 내지 30시간 동안 수행할 수 있다.
또한, 본 출원의 접촉은 금속이온 또는 금속염 존재하에서 수행할 수 있다. 사용될 수 있는 금속이온 또는 금속염은 전술한 양태에서와 같다.
본 출원의 제조방법은 제조된 타가토스를 분리 및/또는 정제하는 단계를 추가로 포함할 수 있다. 상기 분리 및/또는 정제는 본 출원의 기술 분야에서 통상적으로 사용하는 방법을 사용할 수 있으며. 비제한적인 예로, 투석, 침전, 흡착, 전기영동, 이온교환 크로마토그래피 및 분별 결정 등을 사용할 수 있다. 상기 정제는 하나의 방법만 실시될 수도 있으며, 두 가지 이상의 방법을 함께 실시할 수도 있다.
또한, 본 출원의 제조방법은 상기 분리 및/또는 정제하는 단계 이전 또는 이후에 탈색 및/또는 탈염을 수행하는 단계를 추가로 포함할 수 있다. 상기 탈색 및/또는 탈염을 실시함으로써, 보다 품질이 우수한 타가토스를 얻을 수 있다.
다른 예로, 본 출원의 제조방법은 본 출원의 타가토스로 전환하는 단계, 분리 및/또는 정제하는 단계, 또는 탈색 및/또는 탈염하는 단계 이후 타가토스를 결정화하는 단계를 추가로 포함할 수 있다. 상기 결정화는 통상적으로 사용하는 결정화 방법을 사용하여 수행할 수 있다. 예를 들어, 냉각결정화 방법을 사용하여 결정화를 수행할 수 있다.
또한, 본 출원의 제조 방법은 상기 결정화하는 단계 이전에 타가토스를 농축하는 단계를 추가로 포함할 수 있다. 상기 농축은 결정화 효율을 높일 수 있다.
다른 예로, 본 출원의 제조방법은 본 출원의 분리 및/또는 정제하는 단계 이후 미반응된 과당을 본 출원의 효소, 상기 효소를 발현하는 미생물 또는 상기 미생물의 배양물과 접촉시키는 단계, 본 출원의 결정화하는 단계 이후 결정이 분리된 모액을 상기 분리 및/또는 정제 단계에 재사용하는 단계, 또는 이의 조합을 추가로 포함할 수 있다. 상기 추가 단계를 통해 타가토스를 더욱 고수율로 수득할 수 있으며 버려지는 과당의 양을 절감할 수 있어 경제적 이점이 있다.
본 출원의 과당-4-에피머화 효소 변이체는 특성이 우수한 타가토스 생산이 산업적으로 가능하고, 보편화된 당인 과당을 타가토스로 전환하는 바 경제성이 높은 효과가 있다.
도 1은 본 출원의 일 실시예들에서 제조된 타가토스-이인산 알돌레이즈 효소 (CJ_KO_F4E)이 과당-4-에피머화 효소 활성을 가짐을 보여주는 HPLC 크로마토그래피 결과이다.
도 2 및 도 3은 변이체들의 열안정성을 평가하기 위해 60℃ 온도조건에서의 시간 변화에 따른 잔존활성을 상대적인 수치로 나타낸 그래프이다.
도 2 및 도 3은 변이체들의 열안정성을 평가하기 위해 60℃ 온도조건에서의 시간 변화에 따른 잔존활성을 상대적인 수치로 나타낸 그래프이다.
실시예 1. 과당-4-에피머화 효소 유전자를 포함하는 재조합 발현벡터 및 형질전환체의 제조
실시예 1-1. 야생형 과당-4-에피머화 효소 제조
과당-4-에피머화 효소를 제조하기 위해 코스모토가 오엘리아 (Kosmotoga olearia)에서 유래한 아미노산 서열(서열번호 1) 및 유전자 정보를 확보하여 대장균 발현 가능 벡터 및 형질전환 미생물(형질전환체)을 제조하였다. 상기 서열이 과당으로부터 타가토스로 전환하는 과당-4-에피머화 효소로 이용될 수 있음을 확인하였다(도 1).
구체적으로, 상기 유전자를 KEGG(Kyoto Encyclopedia of Genes and Genomes)에 등록된 코스모토가 오엘리아 유전자 서열을 대상으로 타가토스-이인산 알돌레이즈 유전자 서열을 선발하였고, 코스모토가 오엘리아의 타가토스-이인산 알돌레이즈 class II accessory protein AgaZ인 아미노산 서열 (서열번호 1)과 염기 서열 (서열번호 2)를 바탕으로 대장균 발현 가능 벡터인 pBT7-C-His에 삽입하여 재조합 발현벡터 pBT7-C-His-KO를 바이오니아에 합성 의뢰하여 제작하였다.
단백질 발현을 유도하고자 대장균 발현용 균주인 BL21(DE3)에 형질 전환하였고, E.coli BL21(DE3)/CJ_KO_F4E로 명명하였다. 부다페스트 조약 하에 상기 E.coli BL21(DE3)/CJ_KO_F4E는 2017년 3월 24일에 기탁번호 KCCM11999P로 기탁되었다.
재조합 효소를 제조하기 위해, 상기 E.coli BL21(DE3)/CJ_KO_F4E 를 앰피실린 (ampicillin)이 포함된 LB 액체배지 5ml를 포함하는 배양 튜브에 접종하고, 600nm에서 흡광도가 2.0이 될 때까지 37℃ 진탕 배양기에서 종균 배양을 하였다. 본 종균 배양된 배양액을 LB와 단백질 발현 조절인자인 유당이 함유된 액체배지를 포함하는 배양 플라스크에 접종하여 본 배양을 진행하였다. 상기 배양 과정 중의 교반속도는 180rpm이며, 배양 온도는 37℃가 유지되도록 하였다. 배양액은 8,000rpm으로 4℃에서 20분 동안 원심분리 후 균체를 회수하였다. 회수된 균체는 50 mM Tris-HCl(pH8.0) 완충용액으로 2회 세척하였고, 10mM 이미다졸(imidazole)과 300mM NaCl이 포함되어 있는 50mM NaH2PO4(pH 8.0) 완충용액에 재현탁하였다. 상기 현탁된 균체를 세포파쇄기(sonicator)를 이용하여 파쇄하였으며, 세포 파쇄물은 13,000rpm으로 4℃에서 20분 동안 원심분리 후 상등액만을 취하였다. 상기 상등액은 His-taq 친화 크로마토그래피를 사용하여 정제되었고, 20mM 이미다졸 및 300mM NaCl을 함유하는 50mM NaH2PO4(pH 8.0) 완충용액을 충진제의 10배의 액량으로 흘려주어 비특이적 결합 가능 단백질을 제거하였다. 최종 250mM 이미다졸 및 300mM NaCl을 함유하는 50mM NaH2PO4(pH8.0) 완충용액을 흘려주어 용출 정제하였으며, 50mM Tris-HCl(pH 8.0) 완충용액으로 투석 후 효소 특성 분석을 위한 효소를 확보하였다.
실시예 1-2. 과당으로부터 타가토스로의 전환 활성 평가
상기 실시예 1-1에서 얻어진 효소들의 활성을 측정하기 위하여, 30 중량% 과당을 사용하였고, 여기에 50mM Tris-HCl (pH 8.0), 1mM CoSO4, 상기 실시예 2에서 분리된 20mg/ml 정제효소를 첨가하여 온도 60℃에서 2시간 반응하였다. CJ_KO_F4E 에 의해 전환된 타가토스의 농도 및 과당으로부터 타가토스로 전환된 전환율은 16.0 %였다.
상기 전환율은 다음 식으로 산출되었다: 전환율=타가토스 중량/초기과당 중량 X 100
실시예 2. 변이체 라이브러리 제조 및 라이브러리를 이용한 활성이 개량된 변이체의 스크리닝
실시예 1에서 코스모토가 오엘리아 (Kosmotoga olearia)에서 유래한 과당-4-에피머화 효소 유전자를 주형으로 하여 에러-프론 중합효소연쇄반응법(error-prone PCR)을 통하여 과당-4-에피머화 효소의 변이체 라이브러리를 구성하였다. 구체적으로는, Diversify random mutagenesis kit(ClonTech사)을 이용하여 과당-4-에피머화 효소 유전자를 1000개의 염기쌍 당 2 내지 3개의 변이가 일어나게 하는 무작위 돌연변이를 유도하였고, PCR 반응 조건은 아래 표 1 및 2에 나타냈다. 과당-4-에피머화 효소의 변이체를 코딩하는 유전자 라이브러리를 구성한 다음, 이를 E.coli BL21(DE3)에 삽입하였다.
반응용액 조성 | 첨가량 (μl) |
PCR Grade Water | 36 |
10X TITANIUM Taq Buffer | 5 |
MnSO4 (8 mM) | 4 |
dGTP (2 mM) | 1 |
50X Diversify dNTP Mix | 1 |
Primer mix | 1 |
Template DNA | 1 |
TITANIUM Taq Polym. | 1 |
단계 | 온도 (℃) | 시간(초) | 사이클 |
Initial Denaturation | 94 | 30 | 1 |
Denaturation | 94 | 30 | 25 |
Annealing/ Extension | 68 | 60 | |
Final Extension | 68 | 60 | 1 |
상기 과당-4-에피머화 효소의 변이체 유전자를 포함하고 있는 pBT7-C-His 플라스미드를 가지고 있는 E.coli BL21(DE3)을, 앰피실린(ampicillin) 항생제가 포함된 LB 액체배지 0.2 mL를 포함하는 deep well rack에 접종하고, 37℃진탕 배양기에서 16시간 이상 종균 배양을 하였다. 상기 종균 배양결과 얻은 배양액을 LB와 단백질 발현조절인자인 유당이 함유된 액체배지를 포함하는 배양 deep well rack에 접종하여 본 배양을 진행하였다. 상기 종균 배양 및 본 배양은 교반속도 180 rpm 및 37℃조건에서 실시하였다. 다음, 상기 배양액을 4,000 rpm으로 4℃에서 20분 동안 원심분리 후 균체를 회수하였다.
제작된 무작위돌연변이 라이브러리에서 활성개량 변이효소를 대량으로 고속 스크리닝 하기 위해 D-과당을 특이적으로 정량화 할 수 있는 발색 측정법을 이용하였다. 구체적으로, 70% 폴린-치오칼토 용액(folin-ciocalteu reagent, SIGMA-ALDRICH)과 기질반응 완료액을 15: 1 비율로 혼합한 후 80도에서 5분간 반응하여 900nm에서 측정하여 OD 값으로 비교 분석하였다.
야생효소 및 활성이 개량된 효소간 균체 시료를 사용한 반응액(기질 D-과당) 분석결과, 상기 발색 측정법은 유효성이 있는 것으로 평가되어, 제작된 라이브러리의 개량활성 스크리닝에 사용하였다.
상기 라이브러리를 활성이 개량된 변이체 스크리닝에 사용하였으며, 구체적으로, 야생형 효소(서열번호 1)와 상대활성 비교 시 활성(D-과당으로부터 D-타가토스 전환)이 있는 변이체들을 선발하였다. 해당 유전자들은 염기서열 분석 후 아미노산 변이 정보를 분석하였다.
이중 가장 활성이 높게 측정된 50개의 콜로니를 선별하여 이들을 시퀀싱하여 염기서열을 확인한 결과, 총 47개 부위, 구체적으로는, 8번째, 20번째, 23번째, 25번째, 26번째, 29번째, 45번째, 51번째, 53번째, 63번째, 86번째, 91번째, 97번째, 110번째, 133번째, 144번째, 146번째, 151번째, 155번째, 167번째, 172번째, 173번째, 174번째, 181번째, 191번째, 239번째, 263번째, 266번째, 285번째, 294번째, 298번째, 308번째, 315번째, 316번째, 317번째, 323번째, 336번째, 347번째, 359번째, 367번째, 385번째, 386번째, 388번째, 389번째, 410번째, 414번째, 또는 417번째가 변이되어 있음을 확인하였다.
실시예 3. 추가 특성이 개량된 제작 및 변이효소 선별
선발된 개량 부위의 정보들을 통합하여 변이효소를 제작 후 과당-4-에피머화 전환반응의 단위활성이 향상된 변이효소를 개발하였다.
실시예 3-1. 포화 돌연변이 (saturation mutagenesis)
야생형 효소 유전자 의 대장균 BL21(DE3) 발현을 위해 제작된 재조합발현벡터 pBT7-C-His-KO (야생형의 C-말단에 6xHis-tag이 결합한 재조합효소를 발현함)를 실시예 2에서 선별된 활성 개량 부위 47곳의 추가 변이주 라이브러리 제작을 위한 포화돌연변이법의 주형(template)으로 사용하였다. 변이분포 다양성 및 변이체 수율 등을 고려하여 역 (inverse) PCR 기반 포화 돌연변이법을 사용하였고(2014. Anal. Biochem. 449:90-98), 제작된 변이주 라이브러리의 스크리닝 규모를 최소화(포화돌연변이 시 도입되는 코돈 수를 최소화함)하기 위해 종결코돈을 배제하고, 대장균의 희귀코돈(rare codons)이 최소화된 NDT/VMA/ATG/TGG 혼합 프라이머를(2012. Biotechniques 52:149-158) 디자인하여 사용하였다. 구체적으로, 각각의 부위의 앞쪽염기 15bp와 치환염기3bp, 뒤쪽염기 15bp로 총 길이는 33bp로 하여 프라이머를 제작 이용하였다. PCR 조건은 94 ℃에서 2분간 변성 후, 94℃ 30초 변성, 60℃ 30초 어닐링, 72℃ 10분 신장을 30회 반복한 후, 72℃에서 60분간 신장반응을 수행하였다. 선정 아미노산 부위별로 포화돌연변이 라이브러리를 제작 후 라이브러리별 변이주를 무작위 선발(<변이 11개)하고 염기서열을 분석하여 아미노산 변이분포를 평가하였다. 이의 분석결과를 기반으로 라이브러리별 서열 범위(sequence coverage) 90% 이상의 스크리닝 규모를 설정하였다(2003. Nucleic Acids Res. 15;31:e30)
상기 47곳의 단일부위 포화돌연변이를 통하여 고 활성 보유 후보 변이주를 제작하고 염기서열 분석하여 변이부위를 확인하였다. 이를 통해 총 288개의 변이체를 확보하였다(표 3).
변이위치 | 기존서열 | 변이서열 |
8 | D | A,E,H,L,P,Q,V, |
20 | C | R |
23 | S | C |
25 | C | A,V,S,D,H,F,L,G,N,M,E,Q,P,K,Y,R,W,I,T |
26 | S | A,T,V |
29 | R | W,C,K,E,Q,A,S,V,L,P |
45 | T | A,Q,V,K,E,M |
51 | T | V,P,I,N,F,D,H,W,Q,E,L,A,G,C,M,K,Y,S,R |
53 | N | W,F,C,K,R,G,S,L,T,P |
63 | G | P,A,M,V,E,L |
86 | K | R,V,A,M,L,G |
91 | G | F,W,Y |
97 | N | K,L,E,Y,P |
110 | N | Y |
133 | R | P,N,E,V,Q,L |
144 | P | A,I,V,F,S |
146 | N | L,P,H,G |
151 | A | G |
155 | A | G |
167 | E | V,R,A,G,T,L,D |
172 | L | T,A |
173 | R | A,T,E,V,D |
174 | P | K,G,L,R,D, M,V,F,S,Y,W |
181 | D | I,A,L,K,R,P,G,M |
191 | E | T,R,G,V,S,L,I,A |
239 | N | V,G,A,E,K,W,L,P |
263 | I | A,Q,L,K,E |
266 | E | L,R,W,D,G,A,T,P,C,V,Y,I |
285 | G | M,V,E,H,D,Q,Y,L |
294 | A | G |
298 | A | G |
308 | S | V,A,D,I, H,L,R,W |
315 | Y | D,V,A,P,H,L |
316 | D | L,V,N,K,P,R,M,T |
317 | T | V,I,D,H,R,S |
323 | N | M,K,G,V,L,H,D,I,R |
336 | P | A,R,G |
347 | E | D,G,N,P,S |
359 | L | V,R,G,A,D,N,T |
367 | N | A,G,L,R,I,V |
385 | K | R,A |
386 | E | T,I,V,A,L,D,H,S |
388 | P | V,D,S,R,I,G,T |
389 | L | K,G,R,V,D,S,E,M |
410 | K | V,L,A,T |
414 | S | P,Q |
417 | K | G,V,S,P,R,D,L,A,M |
실시예 3-2. 변이효소 제작
단위활성이 개량된 단일부위에 대한 변이효소 및 이들이 조합된 다중부위에 대한 변이효소에 대해 과당-4-에피머화의 상대활성을 평가하기 위하여, 상기 3-1에서 제조한 포화돌연변이 라이브러리 유전자를 E. coli BL21(DE3) 에 형질전환한 후 각각의 형질전환 미생물을 앰피실린(ampicillin) 항생제가 포함된 LB 액체배지 5 mL를 포함하는 배양 튜브에 접종하고, 600 nm에서 흡광도가 2.0이 될 때까지 37℃진탕 배양기에서 종균 배양을 하였다. 상기 종균 배양결과 얻은 배양액을 LB와 단백질 발현조절인자인 유당이 함유된 액체배지를 포함하는 배양 플라스크에 접종하여 본 배양을 진행하였다. 상기 종균 배양 및 본 배양은 교반속도 180 rpm 및 37℃조건에서 실시하였다. 다음, 상기 배양액을 8,000 rpm으로 4℃에서 20분 동안 원심분리 후 균체를 회수하였다. 상기 회수된 균체를 50 mM Tris-HCl(pH8.0) 완충용액으로 2회 세척하고, 10 mM 이미다졸(imidazole)과 300 mM NaCl이 포함되어 있는 50 mM NaH2PO4(pH 8.0) 완충용액에 재현탁하였다. 상기 재현탁된 균체를 세포파쇄기(sonicator)를 이용하여 파쇄하고, 13,000 rpm으로 4℃에서 20분 동안 원심분리 후 상등액만을 취하였다. 상기 상등액을 His-taq 친화 크로마토그래피를 사용하여 정제하고, 20 mM 이미다졸 및 300 mM NaCl을 함유하는 50 mM NaH2PO4(pH 8.0) 완충용액을 충진제의 10배의 액량으로 흘려주어 비특이적 결합 가능 단백질을 제거하였다. 이어서, 250 mM 이미다졸 및 300 mM NaCl을 함유하는 50 mM NaH2PO4(pH8.0) 완충용액을 추가로 흘려주어 용출 정제한 다음, 50 mM Tris-HCl(pH 8.0)완충용액으로 투석하여 효소 특성 분석을 위하여 각각의 정제효소를 확보하였다.
실시예 4. 변이효소 특성 비교 평가
상기 실시예 3-2에서 확보한 재조합 변이효소들의 과당-4-에피머화 활성을 측정하기 위하여, 30 중량% 과당에 50 mM Tris-HCl(pH 8.0), 3 mM MnSO4 및 각 5 mg/mL 를 첨가하여 60℃에서 2시간 동안 반응시켰다.
그 결과, 야생형(KO)의 전환활성이 4.7%로, 본 출원의 변이주의 모두 과당-4-에피머화 활성이 있으며 특히 야생형 보다 활성이 증가하였으며, 구체적인 결과는 하기 표 4와 같다.
변이위치 | 기존서열 | 변이서열 | 상대활성(%) |
20 | C | R | 193 |
23 | S | C | 207 |
26 | S | A | 100 |
T | 173 | ||
V | 100 | ||
45 | T | A | 141 |
Q | 185 | ||
V | 179 | ||
K | 197 | ||
E | 203 | ||
M | 241 | ||
51 | T | V | 163 |
P | 163 | ||
53 | N | W | 141 |
F | 188 | ||
C | 108 | ||
G | 163 | ||
S | 200 | ||
T | 238 | ||
P | 217 | ||
63 | G | A | 126 |
E | 100 | ||
86 | K | R | 147 |
V | 127 | ||
M | 297 | ||
L | 161 | ||
G | 111 | ||
91 | G | Y | 136 |
W | 131 | ||
133 | R | P | 133 |
N | 143 | ||
Q | 178 | ||
L | 285 | ||
144 | P | A | 108 |
I | 113 | ||
V | 117 | ||
F | 248 | ||
S | 222 | ||
151 | A | G | 140 |
172 | L | T | 142 |
A | 120 | ||
173 | R | A | 193 |
T | 169 | ||
E | 183 | ||
V | 129 | ||
D | 163 | ||
174 | P | K | 239 |
R | 132 | ||
D | 171 | ||
V | 130 | ||
F | 130 | ||
181 | D | R | 108 |
A | 115 | ||
K | 112 | ||
191 | E | T | 159 |
R | 140 | ||
G | 129 | ||
V | 175 | ||
S | 152 | ||
L | 187 | ||
I | 179 | ||
A | 159 | ||
266 | E | Y | 116 |
294 | A | G | 116 |
298 | A | G | 200 |
316 | D | L | 157 |
V | 152 | ||
N | 194 | ||
P | 193 | ||
R | 133 | ||
M | 137 | ||
T | 129 | ||
317 | T | V | 122 |
I | 272 | ||
D | 136 | ||
H | 159 | ||
R | 182 | ||
S | 166 | ||
323 | N | G | 190 |
L | 181 | ||
336 | P | A | 107 |
R | 366 | ||
347 | E | S | 106 |
G | 131 | ||
N | 134 | ||
P | 123 | ||
359 | L | V | 153 |
385 | K | R | 133 |
386 | E | I | 175 |
V | 142 | ||
L | 134 | ||
D | 133 | ||
H | 137 | ||
S | 94 | ||
388 | P | V | 120 |
D | 206 | ||
S | 219 | ||
R | 277 | ||
I | 205 | ||
G | 324 | ||
T | 120 | ||
389 | L | K | 336 |
G | 282 | ||
R | 288 | ||
V | 212 | ||
D | 263 | ||
S | 222 | ||
E | 291 | ||
M | 261 | ||
410 | K | V | 163 |
L | 223 | ||
A | 152 | ||
T | 130 | ||
414 | S | P | 142 |
Q | 250 | ||
KO | 100 |
상기와 같은 결과를 통해, 본 출원의 변이주는 과당-4-에피머화 활성이 야생형보다 증가함을 알 수 있었다.
실시예 5. 변이효소 제작 및 활성, 안정성 개량 변이효소 선별
상기 실시예 3-2에서 확보한 타겟 부위(8, 25, 29, 97, 110, 146, 155, 167, 239, 263, 285, 308, 315, 367, 417번 위치) 15곳의 단일부위 포화 돌연변이 유전체 및 효소를 제작하였다.
실시예 5-1. 포화 돌연변이 (saturation mutagenesis)
야생형 효소 유전자의 대장균 BL21(DE3) 발현을 위해 제작된 재조합발현벡터 pBT7-C-His-KO (야생형의 C-말단에 6xHis-tag이 결합한 재조합효소를 발현함)를 변이주 라이브러리 제작을 위한 포화돌연변이법의 주형(template)으로 사용하였다. 변이분포 다양성 및 변이체 수율 등을 고려하여 역방향(inversed) PCR 기반 포화 돌연변이법을 사용하였고(2014. Anal. Biochem. 449:90-98), 제작된 변이주 라이브러리의 스크리닝 규모를 최소화(포화돌연변이 시 도입되는 코돈 수를 최소화함)하기 위해 종결코돈을 배제하고, 대장균의 희귀코돈(rare codons)이 최소화된 NDT/VMA/ATG/TGG 혼합 프라이머를(2012. Biotechniques 52:149-158) 디자인하여 사용하였다. 구체적으로, 각각의 부위의 앞쪽염기 15bp와 치환염기3bp, 뒤쪽염기 15bp로 총 길이는 33bp로 하여 프라이머를 제작 이용하였다. PCR 조건은 94 ℃에서 2분간 변성 후, 94℃ 30초 변성, 60℃ 30초 어닐링, 72℃ 10분 신장을 30회 반복한 후, 72℃에서 60분간 신장반응을 수행하였다. 선정 아미노산 부위별로 포화돌연변이 라이브러리를 제작 후 라이브러리별 변이주를 무작위 선발(<변이 11개)하고 염기서열을 분석하여 아미노산 변이분포를 평가하였다(표 5). 이의 분석결과를 기반으로 라이브러리별 서열 범위(sequence coverage) 90% 이상의 스크리닝 규모를 설정하였다(2003. Nucleic Acids Res. 15;31:e30)
변이위치 | |||||||||||||||||||
D8 | A | E | H | L | P | Q | V | P | |||||||||||
C25 | A | V | S | D | H | F | L | G | N | M | E | Q | P | K | Y | R | W | I | T |
R29 | W | C | K | E | Q | A | S | V | L | P | |||||||||
N97 | K | L | E | Y | P | ||||||||||||||
N110 | Y | ||||||||||||||||||
N146 | L | P | H | G | |||||||||||||||
A155 | G | ||||||||||||||||||
E167 | V | R | A | G | T | D | |||||||||||||
N239 | V | G | A | E | K | W | L | P | |||||||||||
I263 | A | Q | L | K | E | ||||||||||||||
G285 | M | V | E | H | D | Q | Y | L | |||||||||||
S308 | V | A | D | I | V | H | L | R | W | ||||||||||
Y315 | D | V | A | P | H | L | |||||||||||||
N367 | A | G | L | R | I | V | |||||||||||||
K417 | G | V | S | P | R | D | L | A | A | M | P |
실시예 5-2. 활성 및 열안정성 개량 변이효소 제작
단위활성 및 열안정성이 개량된 단일부위에 대한 변이효소 및 이들이 조합된 다중부위에 대한 변이효소에 대해 과당-4-에피머화의 상대활성을 평가하기 위하여, 상기 2-1에서 제조한 포화돌연변이 라이브러리 유전자를 E. coli BL21(DE3) 에 형질전환한 후 각각의 형질전환 미생물을 앰피실린(ampicillin) 항생제가 포함된 LB 액체배지 5 mL를 포함하는 배양 튜브에 접종하고, 600 nm에서 흡광도가 2.0이 될 때까지 37℃진탕 배양기에서 종균 배양을 하였다. 상기 종균 배양결과 얻은 배양액을 LB와 단백질 발현조절인자인 유당이 함유된 액체배지를 포함하는 배양 플라스크에 접종하여 본 배양을 진행하였다. 상기 종균 배양 및 본 배양은 교반속도 180 rpm 및 37℃조건에서 실시하였다. 다음, 상기 배양액을 8,000 rpm으로 4℃에서 20분 동안 원심분리 후 균체를 회수하였다. 상기 회수된 균체를 50 mM Tris-HCl(pH8.0) 완충용액으로 2회 세척하고, 10 mM 이미다졸(imidazole)과 300 mM NaCl이 포함되어 있는 50 mM NaH2PO4(pH 8.0) 완충용액에 재현탁하였다. 상기 재현탁된 균체를 세포파쇄기(sonicator)를 이용하여 파쇄하고, 13,000 rpm으로 4℃에서 20분 동안 원심분리 후 상등액만을 취하였다. 상기 상등액을 His-taq 친화 크로마토그래피를 사용하여 정제하고, 20 mM 이미다졸 및 300 mM NaCl을 함유하는 50 mM NaH2PO4(pH 8.0) 완충용액을 충진제의 10배의 액량으로 흘려주어 비특이적 결합 가능 단백질을 제거하였다. 이어서, 250 mM 이미다졸 및 300 mM NaCl을 함유하는 50 mM NaH2PO4(pH8.0) 완충용액을 추가로 흘려주어 용출 정제한 다음, 50 mM Tris-HCl(pH 8.0)완충용액으로 투석하여 효소 특성 분석을 위하여 각각의 정제효소를 확보하였다.
실시예 6. 활성, 안정성 개량 변이효소 특성 비교 평가
상기 실시예 5-2에서 확보한 재조합 변이효소들의 과당-4-에피머화 활성 측정하기 위하여, 30 중량% 과당에 50 mM Tris-HCl(pH 8.0), 3 mM MnSO4 및 각 5 mg/mL 를 첨가하여 60℃에서 2시간 동안 반응시켰다. 아울러 확보한 재조합 변이효소들의 과당-4-에피머화 안정성 측정하기 위하여, 각 5 mg/mL 를 60℃에서 최소 19시간에서 최대 90시간 동안 놓아둔 후, ice에 5분간 방치한 후, 30 중량% 과당에 50 mM Tris-HCl(pH 8.0), 3 mM MnSO4 를 첨가하여 반응시켰다.
그 결과, 본 출원의 변이주 모두 과당-4-에피머화 전환 활성 및 안정성이 야생형 보다 증가하였으며, 구체적인 결과로서, 활성 결과는 하기 표 6과 같으며, 안정성 결과는 도 2 및 도 3과 같다.
변이위치 | 기존서열 | 변이서열 | 상대활성(%) |
8 | D | A | 360 |
E | 357 | ||
H | 379 | ||
L | 364 | ||
P | 484 | ||
Q | 340 | ||
V | 263 | ||
25 | C | A | 152 |
V | 142 | ||
S | 165 | ||
29 | R | W | 399 |
C | 330 | ||
K | 273 | ||
E | 264 | ||
Q | 279 | ||
A | 267 | ||
S | 383 | ||
V | 333 | ||
L | 331 | ||
P | 287 | ||
97 | N | K | 110 |
L | 458 | ||
E | 165 | ||
Y | 528 | ||
P | 110 | ||
110 | N | Y | 303 |
146 | N | L | 433 |
P | 439 | ||
H | 461 | ||
G | 456 | ||
155 | A | G | 156 |
167 | E | V | 261 |
R | 253 | ||
A | 346 | ||
G | 322 | ||
T | 193 | ||
D | 490 | ||
239 | N | V | 112 |
G | 242 | ||
A | 226 | ||
E | 132 | ||
K | 215 | ||
W | 102 | ||
L | 169 | ||
P | 139 | ||
263 | I | A | 289 |
Q | 328 | ||
L | 211 | ||
K | 244 | ||
E | 189 | ||
285 | G | M | 170 |
V | 170 | ||
E | 141 | ||
H | 304 | ||
D | 259 | ||
Q | 181 | ||
Y | 204 | ||
L | 200 | ||
308 | S | V | 211 |
A | 172 | ||
D | 206 | ||
I | 206 | ||
H | 206 | ||
L | 222 | ||
R | 211 | ||
W | 228 | ||
315 | Y | D | 137 |
V | 133 | ||
A | 149 | ||
P | 153 | ||
H | 137 | ||
L | 133 | ||
367 | N | A | 234 |
G | 285 | ||
L | 238 | ||
R | 255 | ||
I | 300 | ||
V | 234 | ||
417 | K | G | 236 |
V | 274 | ||
S | 309 | ||
P | 258 | ||
R | 244 | ||
D | 287 | ||
L | 288 | ||
A | 321 | ||
M | 206 | ||
P | 236 | ||
KO(WT) | 100 |
본 발명자들은 E.coil BL21(DE3) 균주에 형질전환하여 E.coil BL21(DE3)/CJ_KO_F4E_M1(C25S), E.coil BL21(DE3)/CJ_KO_F4E_M2(T51V), E.coil BL21(DE3)/CJ_KO_F4E_M5(T317Y)이라 명명된 형질전환체(형질전환 미생물)을 각각 제조하고, 상기 형질전환체를 부다페스트 조약 하에 국제기탁기관인 한국미생물보존센터 (KCCM)에 2018년 9월 19일자에 기탁하여 수탁번호 KCCM12320P(E.coil BL21(DE3)/CJ_KO_F4E_M1), KCCM12321P(E.coil BL21(DE3)/CJ_KO_F4E_M2), KCCM12324P(E.coil BL21(DE3)/CJ_KO_F4E_M5)로 각각 기탁하였다.
이상의 설명으로부터, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
<110> CJ CHEILJEDANG CORPORATION
<120> A Novel Fructose C4 epimerases and Preparation Method for
producing Tagatose using the same
<130> KPA181088-KR-P3
<150> KR 10-2018-0116609
<151> 2018-09-28
<150> KR 10-2018-0117237
<151> 2018-10-01
<160> 24
<170> KoPatentIn 3.0
<210> 1
<211> 435
<212> PRT
<213> Unknown
<220>
<223> Kosmotoga olearia
<220>
<221> PEPTIDE
<222> (1)..(435)
<223> Tagatose-bisphosphate aldolase
<400> 1
Met Lys Lys His Pro Leu Gln Asp Ile Val Ser Leu Gln Lys Gln Gly
1 5 10 15
Ile Pro Lys Gly Val Phe Ser Val Cys Ser Ala Asn Arg Phe Val Ile
20 25 30
Glu Thr Thr Leu Glu Tyr Ala Lys Met Lys Gly Thr Thr Val Leu Ile
35 40 45
Glu Ala Thr Cys Asn Gln Val Asn Gln Phe Gly Gly Tyr Thr Gly Met
50 55 60
Thr Pro Ala Asp Phe Arg Glu Met Val Phe Ser Ile Ala Glu Asp Ile
65 70 75 80
Gly Leu Pro Lys Asn Lys Ile Ile Leu Gly Gly Asp His Leu Gly Pro
85 90 95
Asn Pro Trp Lys Gly Gln Pro Ser Asp Gln Ala Met Arg Asn Ala Ile
100 105 110
Glu Met Ile Arg Glu Tyr Ala Lys Ala Gly Phe Thr Lys Leu His Leu
115 120 125
Asp Ala Ser Met Arg Leu Ala Asp Asp Pro Gly Asn Glu Asn Glu Pro
130 135 140
Leu Asn Pro Glu Val Ile Ala Glu Arg Thr Ala Leu Leu Cys Leu Glu
145 150 155 160
Ala Glu Arg Ala Phe Lys Glu Ser Ala Gly Ser Leu Arg Pro Val Tyr
165 170 175
Val Ile Gly Thr Asp Val Pro Pro Pro Gly Gly Ala Gln Asn Glu Gly
180 185 190
Lys Ser Ile His Val Thr Ser Val Gln Asp Phe Glu Arg Thr Val Glu
195 200 205
Leu Thr Lys Lys Ala Phe Phe Asp His Gly Leu Tyr Glu Ala Trp Gly
210 215 220
Arg Val Ile Ala Val Val Val Gln Pro Gly Val Glu Phe Gly Asn Glu
225 230 235 240
His Ile Phe Glu Tyr Asp Arg Asn Arg Ala Arg Glu Leu Thr Glu Ala
245 250 255
Ile Lys Lys His Pro Asn Ile Val Phe Glu Gly His Ser Thr Asp Tyr
260 265 270
Gln Thr Ala Lys Ala Leu Lys Glu Met Val Glu Asp Gly Val Ala Ile
275 280 285
Leu Lys Val Gly Pro Ala Leu Thr Phe Ala Leu Arg Glu Ala Phe Phe
290 295 300
Ala Leu Ser Ser Ile Glu Lys Glu Leu Phe Tyr Asp Thr Pro Gly Leu
305 310 315 320
Cys Ser Asn Phe Val Glu Val Val Glu Arg Ala Met Leu Asp Asn Pro
325 330 335
Lys His Trp Glu Lys Tyr Tyr Gln Gly Glu Glu Arg Glu Asn Arg Leu
340 345 350
Ala Arg Lys Tyr Ser Phe Leu Asp Arg Leu Arg Tyr Tyr Trp Asn Leu
355 360 365
Pro Glu Val Arg Thr Ala Val Asn Lys Leu Ile Thr Asn Leu Glu Thr
370 375 380
Lys Glu Ile Pro Leu Thr Leu Ile Ser Gln Phe Met Pro Met Gln Tyr
385 390 395 400
Gln Lys Ile Arg Asn Gly Leu Leu Arg Lys Asp Pro Ile Ser Leu Ile
405 410 415
Lys Asp Arg Ile Thr Leu Val Leu Asp Asp Tyr Tyr Phe Ala Thr His
420 425 430
Pro Glu Cys
435
<210> 2
<211> 1308
<212> DNA
<213> Unknown
<220>
<223> Kosmotoga olearia
<220>
<221> gene
<222> (1)..(1308)
<223> Tagatose-bisphosphate aldolase
<400> 2
atgaaaaaac atcctcttca ggacattgtt tcattgcaaa aacagggaat acccaaaggg 60
gttttctctg tatgtagtgc caatagattt gttattgaaa ccactctgga atatgcgaag 120
atgaaaggga caacggttct tatagaggcc acctgcaatc aggtaaacca gttcggtggc 180
tacaccggta tgactcctgc tgatttcaga gaaatggttt tttctatcgc tgaggatatt 240
ggacttccca aaaataaaat catccttggt ggcgaccatc ttggcccaaa tccctggaag 300
ggtcagccgt cagatcaggc tatgcgtaac gccattgaaa tgattcgaga atacgctaaa 360
gctgggttta ccaagcttca tctggatgcc agcatgcgtc ttgcagacga tccggggaac 420
gaaaacgagc cgctgaaccc ggaagttata gcggaaagaa cagctcttct ctgtcttgaa 480
gccgagaggg cttttaaaga atccgccggt tctctccggc ctgtttacgt tattggtacg 540
gatgttccgc caccgggtgg agcgcaaaac gaaggtaaat cgattcatgt aaccagtgtt 600
caggattttg agcgtaccgt tgagttgacc aaaaaggcat ttttcgacca tggtttgtat 660
gaagcctggg gaagggtgat tgcggttgtt gtgcaaccgg gagtagaatt cgggaatgaa 720
catatattcg aatatgatag aaatcgagcg agagaactta ctgaggcgat aaaaaagcat 780
ccaaatatag tttttgaagg tcactcgaca gattatcaaa cggcaaaagc attgaaagaa 840
atggtagaag acggtgtagc catactcaag gttgggccag ctctaacatt tgcgctcaga 900
gaggcttttt ttgcgttgag cagcattgaa aaagagttat tttatgatac acccgggctt 960
tgttcaaact ttgttgaagt tgtcgagaga gcgatgcttg acaatccaaa acattgggaa 1020
aaatattacc agggagaaga gagagaaaat agattagccc gtaaatacag ctttctcgat 1080
cgcttgaggt attactggaa tcttcctgag gttagaacag cggtgaataa gctgataacc 1140
aaccttgaaa caaaagaaat cccgttaacg cttataagcc agttcatgcc gatgcagtac 1200
caaaaaatca gaaacggttt gctaagaaag gatccaataa gccttataaa agatcgaatt 1260
acccttgttc ttgatgacta ctatttcgca actcaccctg aatgttga 1308
<210> 3
<211> 434
<212> PRT
<213> Unknown
<220>
<223> Thermoanaerobacterium thermosaccharolyticum
<220>
<221> PEPTIDE
<222> (1)..(434)
<223> Tagatose-bisphosphate aldolase
<400> 3
Met Ala Lys Glu His Pro Leu Lys Glu Leu Val Asn Lys Gln Lys Ser
1 5 10 15
Gly Ile Ser Glu Gly Ile Val Ser Ile Cys Ser Ser Asn Glu Phe Val
20 25 30
Ile Glu Ala Ser Met Glu Arg Ala Leu Thr Asn Gly Asp Tyr Val Leu
35 40 45
Ile Glu Ser Thr Ala Asn Gln Val Asn Gln Tyr Gly Gly Tyr Ile Gly
50 55 60
Met Thr Pro Ile Glu Phe Lys Lys Phe Val Phe Ser Ile Ala Lys Lys
65 70 75 80
Val Asp Phe Pro Leu Asp Lys Leu Ile Leu Gly Gly Asp His Leu Gly
85 90 95
Pro Leu Ile Trp Lys Asn Glu Ser Ser Asn Leu Ala Leu Ala Lys Ala
100 105 110
Ser Glu Leu Ile Lys Glu Tyr Val Leu Ala Gly Tyr Thr Lys Ile His
115 120 125
Ile Asp Thr Ser Met Arg Leu Lys Asp Asp Thr Asp Phe Asn Thr Glu
130 135 140
Ile Ile Ala Gln Arg Ser Ala Val Leu Leu Lys Ala Ala Glu Asn Ala
145 150 155 160
Tyr Met Glu Leu Asn Lys Asn Asn Lys Asn Val Leu His Pro Val Tyr
165 170 175
Val Ile Gly Ser Glu Val Pro Ile Pro Gly Gly Ser Gln Gly Ser Asp
180 185 190
Glu Ser Leu Gln Ile Thr Asp Ala Lys Asp Phe Glu Asn Thr Val Glu
195 200 205
Ile Phe Lys Asp Val Phe Ser Lys Tyr Gly Leu Ile Asn Glu Trp Glu
210 215 220
Asn Ile Val Ala Phe Val Val Gln Pro Gly Val Glu Phe Gly Asn Asp
225 230 235 240
Phe Val His Glu Tyr Lys Arg Asp Glu Ala Lys Glu Leu Thr Asp Ala
245 250 255
Leu Lys Asn Tyr Lys Thr Phe Val Phe Glu Gly His Ser Thr Asp Tyr
260 265 270
Gln Thr Arg Glu Ser Leu Lys Gln Met Val Glu Asp Gly Ile Ala Ile
275 280 285
Leu Lys Val Gly Pro Ala Leu Thr Phe Ala Leu Arg Glu Ala Leu Ile
290 295 300
Ala Leu Asn Asn Ile Glu Asn Glu Leu Leu Asn Asn Val Asp Ser Ile
305 310 315 320
Lys Leu Ser Asn Phe Thr Asn Val Leu Val Ser Glu Met Ile Asn Asn
325 330 335
Pro Glu His Trp Lys Asn His Tyr Phe Gly Asp Asp Ala Arg Lys Lys
340 345 350
Phe Leu Cys Lys Tyr Ser Tyr Ser Asp Arg Cys Arg Tyr Tyr Leu Pro
355 360 365
Thr Arg Asn Val Lys Asn Ser Leu Asn Leu Leu Ile Arg Asn Leu Glu
370 375 380
Asn Val Lys Ile Pro Met Thr Leu Ile Ser Gln Phe Met Pro Leu Gln
385 390 395 400
Tyr Asp Asn Ile Arg Arg Gly Leu Ile Lys Asn Glu Pro Ile Ser Leu
405 410 415
Ile Lys Asn Ala Ile Met Asn Arg Leu Asn Asp Tyr Tyr Tyr Ala Ile
420 425 430
Lys Pro
<210> 4
<211> 1305
<212> DNA
<213> Unknown
<220>
<223> Thermoanaerobacterium thermosaccharolyticum
<220>
<221> gene
<222> (1)..(1305)
<223> Tagatose-bisphosphate aldolase
<400> 4
atggctaaag aacatccatt aaaggaatta gtaaataaac aaaaaagtgg tatatccgag 60
ggtatagttt ctatttgtag ttcaaatgaa tttgttattg aagcatctat ggagcgtgca 120
ttaacaaatg gtgattatgt tttaattgaa tcaacagcaa atcaggtgaa tcaatatggt 180
ggatatattg gtatgacacc tattgagttt aaaaaatttg tattttcaat agctaaaaaa 240
gtagattttc cattagataa attgattctt ggtggggatc atttaggccc attaatatgg 300
aaaaatgaat ctagtaattt ggcgttagca aaagcatccg agcttattaa agaatatgta 360
ttagccggat atactaaaat tcatatagac actagtatgc ggctaaaaga tgatactgat 420
tttaatacag aaattattgc tcaaagaagt gcagtattgt taaaggcagc ggaaaatgca 480
tatatggaat tgaataaaaa taataaaaat gttttacatc ctgtctatgt tataggaagt 540
gaagtcccaa tacctggggg cagccaaggc agtgatgaat cgctccaaat tactgatgct 600
aaggattttg aaaatacagt tgaaatattt aaagatgttt tttcaaaata tggattaatt 660
aatgagtggg aaaacatagt agcatttgtt gttcaaccag gagttgagtt tggaaatgat 720
tttgtacatg aatataaacg tgatgaagca aaagaattaa cagatgcact taaaaattat 780
aaaacatttg tttttgaagg acattctact gattatcaaa cacgtgaatc attaaaacaa 840
atggtggaag atggcattgc aattttaaaa gttggacctg cattaacatt tgcactacgt 900
gaagccttaa tagcactaaa taatatagaa aatgagttgc ttaataatgt agatagtata 960
aaattatcaa attttactaa tgtactcgta agtgaaatga tcaataaccc cgaacattgg 1020
aaaaatcatt attttggtga tgatgcaagg aaaaagtttc tatgtaaata tagttattcg 1080
gatagatgta ggtactattt accaactaga aatgtaaaaa actcattaaa tcttcttatt 1140
agaaatctag aaaatgtgaa aataccaatg acattaataa gtcaatttat gcctttgcaa 1200
tatgataata ttagaagagg actcataaaa aatgaaccaa tttctttaat taaaaatgca 1260
ataatgaacc gacttaatga ctattattat gctataaagc cgtaa 1305
<210> 5
<211> 434
<212> PRT
<213> Unknown
<220>
<223> Pseudoalteromonas sp. H103
<220>
<221> PEPTIDE
<222> (1)..(434)
<223> Tagatose-bisphosphate aldolase
<400> 5
Met Arg Gly Asp Lys Arg Val Thr Thr Asp Phe Leu Lys Glu Ile Val
1 5 10 15
Gln Gln Asn Arg Ala Gly Gly Ser Arg Gly Ile Tyr Ser Val Cys Ser
20 25 30
Ala His Arg Leu Val Ile Glu Ala Ser Met Gln Gln Ala Lys Ser Asp
35 40 45
Gly Ser Pro Leu Leu Val Glu Ala Thr Cys Asn Gln Val Asn His Glu
50 55 60
Gly Gly Tyr Thr Gly Met Thr Pro Ser Asp Phe Cys Lys Tyr Val Leu
65 70 75 80
Asp Ile Ala Lys Glu Val Gly Phe Ser Gln Glu Gln Leu Ile Leu Gly
85 90 95
Gly Asp His Leu Gly Pro Asn Pro Trp Thr Asp Leu Pro Ala Ala Gln
100 105 110
Ala Met Glu Ala Ala Lys Lys Met Val Ala Asp Tyr Val Ser Ala Gly
115 120 125
Phe Ser Lys Ile His Leu Asp Ala Ser Met Ala Cys Ala Asp Asp Val
130 135 140
Glu Pro Leu Ala Asp Glu Val Ile Ala Gln Arg Ala Thr Ile Leu Cys
145 150 155 160
Ala Ala Gly Glu Ala Ala Val Ser Asp Lys Asn Ala Ala Pro Met Tyr
165 170 175
Ile Ile Gly Thr Glu Val Pro Val Pro Gly Gly Ala Gln Glu Asp Leu
180 185 190
His Glu Leu Ala Thr Thr Asn Ile Asp Asp Leu Lys Gln Thr Ile Lys
195 200 205
Thr His Lys Ala Lys Phe Ser Glu Asn Gly Leu Gln Asp Ala Trp Asp
210 215 220
Arg Val Ile Gly Val Val Val Gln Pro Gly Val Glu Phe Asp His Ala
225 230 235 240
Met Val Ile Gly Tyr Gln Ser Glu Lys Ala Gln Thr Leu Ser Lys Thr
245 250 255
Ile Leu Asp Phe Asp Asn Leu Val Tyr Glu Ala His Ser Thr Asp Tyr
260 265 270
Gln Thr Glu Thr Ala Leu Thr Asn Leu Val Asn Asp His Phe Ala Ile
275 280 285
Leu Lys Val Gly Pro Gly Leu Thr Tyr Ala Ala Arg Glu Ala Leu Phe
290 295 300
Ala Leu Ser Tyr Ile Glu Gln Glu Trp Ile Thr Asn Lys Pro Leu Ser
305 310 315 320
Asn Leu Arg Gln Val Leu Glu Glu Arg Met Leu Glu Asn Pro Lys Asn
325 330 335
Trp Ala Lys Tyr Tyr Thr Gly Thr Glu Gln Glu Gln Ala Phe Ala Arg
340 345 350
Lys Tyr Ser Phe Ser Asp Arg Ser Arg Tyr Tyr Trp Ala Asp Pro Ile
355 360 365
Val Asp Gln Ser Val Gln Thr Leu Ile Asn Asn Leu Thr Glu Gln Pro
370 375 380
Ala Pro Met Thr Leu Leu Ser Gln Phe Met Pro Leu Gln Tyr Ala Ala
385 390 395 400
Phe Arg Ala Gly Gln Leu Asn Asn Asp Pro Leu Ser Leu Ile Arg His
405 410 415
Trp Ile Gln Glu Val Val Ser Thr Tyr Ala Arg Ala Ser Gly Leu Ala
420 425 430
Val Lys
<210> 6
<211> 1305
<212> DNA
<213> Unknown
<220>
<223> Pseudoalteromonas sp. H103
<220>
<221> gene
<222> (1)..(1305)
<223> Tagatose-bisphosphate aldolase
<400> 6
atcagaggag ataaaagggt gactacagat tttctgaaag aaattgttca acaaaacaga 60
gccggtggta gcagaggtat ttactctgtt tgttctgcgc atcgccttgt tattgaagcg 120
tctatgcagc aagccaaaag cgatggctca ccactgttag tagaggcaac atgtaatcag 180
gttaatcacg aaggtggtta taccggtatg accccaagcg acttttgcaa atacgtgtta 240
gatattgcaa aagaagtggg cttttcccaa gagcaactta ttttaggggg cgaccactta 300
gggcctaacc cgtggactga cctaccagct gcacaggcaa tggaagcggc caaaaaaatg 360
gttgctgatt acgtaagtgc gggcttttca aaaatacatt tagatgcaag catggcatgt 420
gcagatgatg tagagccgct tgctgatgag gttatagcgc agcgcgccac tattttatgt 480
gctgccggcg aagctgctgt tagcgataaa aatgcagccc caatgtatat tattggtacc 540
gaagtgccgg taccaggtgg cgcacaagaa gatttacacg aacttgctac aaccaatatt 600
gatgatttaa aacaaaccat taaaacccat aaagcaaaat ttagcgaaaa cggtttgcaa 660
gacgcatggg atagagtaat tggtgtagta gtgcagcctg gtgttgagtt tgaccacgcg 720
atggtaattg gctatcaaag cgaaaaagca caaacactaa gtaaaactat tttagatttt 780
gataatttgg tttatgaagc gcattcaacc gattatcaaa ccgaaacagc gttaactaac 840
ttggttaacg accactttgc tattttaaaa gtgggcccag ggcttactta tgcagcgcgc 900
gaagcgttgt ttgcacttag ttatattgag caagagtgga taaccaataa gcctctttct 960
aatttgcgcc aagtgcttga agagcgcatg ctcgaaaacc ctaaaaactg ggctaagtat 1020
tacacaggta cagagcaaga gcaggccttt gcacgaaaat atagctttag cgatagatcg 1080
cgttactatt gggccgatcc tattgttgat caaagtgttc aaacactcat taataactta 1140
actgagcagc cagcgccaat gaccttgctg agtcaattta tgccacttca atatgcggca 1200
tttcgtgcag gacaattaaa taacgatccg ctttctttga tcagacactg gatccaagaa 1260
gttgtatcaa cctacgcccg cgctagcgga cttgcagtaa aatag 1305
<210> 7
<211> 426
<212> PRT
<213> Unknown
<220>
<223> Thermanaerothrix daxensis
<220>
<221> PEPTIDE
<222> (1)..(426)
<223> Tagatose-biphosphate aldolase
<400> 7
Met Val Thr Tyr Leu Asp Phe Val Val Leu Ser His Arg Phe Arg Arg
1 5 10 15
Pro Leu Gly Ile Thr Ser Val Cys Ser Ala His Pro Tyr Val Ile Glu
20 25 30
Ala Ala Leu Arg Asn Gly Met Met Thr His Thr Pro Val Leu Ile Glu
35 40 45
Ala Thr Cys Asn Gln Val Asn Gln Tyr Gly Gly Tyr Thr Gly Met Thr
50 55 60
Pro Ala Asp Phe Val Arg Tyr Val Glu Asn Ile Ala Ala Arg Val Gly
65 70 75 80
Ser Pro Arg Glu Asn Leu Leu Leu Gly Gly Asp His Leu Gly Pro Leu
85 90 95
Val Trp Ala His Glu Pro Ala Glu Ser Ala Met Glu Lys Ala Arg Ala
100 105 110
Leu Val Lys Ala Tyr Val Glu Ala Gly Phe Arg Lys Ile His Leu Asp
115 120 125
Cys Ser Met Pro Cys Ala Asp Asp Arg Asp Phe Ser Pro Lys Val Ile
130 135 140
Ala Glu Arg Ala Ala Glu Leu Ala Gln Val Ala Glu Ser Thr Cys Asp
145 150 155 160
Val Met Gly Leu Pro Leu Pro Asn Tyr Val Ile Gly Thr Glu Val Pro
165 170 175
Pro Ala Gly Gly Ala Lys Ala Glu Ala Glu Thr Leu Arg Val Thr Arg
180 185 190
Pro Glu Asp Ala Ala Glu Thr Ile Ala Leu Thr Arg Ala Ala Phe Phe
195 200 205
Lys Arg Gly Leu Glu Ser Ala Trp Glu Arg Val Val Ala Leu Val Val
210 215 220
Gln Pro Gly Val Glu Phe Gly Asp His Gln Ile His Val Tyr Arg Arg
225 230 235 240
Glu Glu Ala Gln Ala Leu Ser Arg Phe Ile Glu Ser Gln Pro Gly Leu
245 250 255
Val Tyr Glu Ala His Ser Thr Asp Tyr Gln Pro Arg Asp Ala Leu Arg
260 265 270
Ala Leu Val Glu Asp His Phe Ala Ile Leu Lys Val Gly Pro Ala Leu
275 280 285
Thr Phe Ala Phe Arg Glu Ala Val Phe Ala Leu Ala Ser Ile Glu Asp
290 295 300
Trp Val Cys Asp Ser Pro Ser Arg Ile Leu Glu Val Leu Glu Thr Thr
305 310 315 320
Met Leu Ala Asn Pro Val Tyr Trp Gln Lys Tyr Tyr Leu Gly Asp Glu
325 330 335
Arg Ala Arg Arg Ile Ala Arg Gly Tyr Ser Phe Ser Asp Arg Ile Arg
340 345 350
Tyr Tyr Trp Ser Ala Pro Ala Val Glu Gln Ala Phe Glu Arg Leu Arg
355 360 365
Ala Asn Leu Asn Arg Val Ser Ile Pro Leu Val Leu Leu Ser Gln Tyr
370 375 380
Leu Pro Asp Gln Tyr Arg Lys Val Arg Asp Gly Arg Leu Pro Asn Gln
385 390 395 400
Phe Asp Ala Leu Ile Leu Asp Lys Ile Gln Ala Val Leu Glu Asp Tyr
405 410 415
Asn Val Ala Cys Gly Val Arg Ile Gly Glu
420 425
<210> 8
<211> 1281
<212> DNA
<213> Unknown
<220>
<223> Thermanaerothrix daxensis
<220>
<221> gene
<222> (1)..(1281)
<223> Tagatose-biphosphate aldolase
<400> 8
atggttacct atttggattt tgtggtgctt tctcatcgtt ttaggcgccc cctgggcatt 60
acctcagtgt gttcggcgca tccgtatgtc attgaggcgg cgctgcgtaa tgggatgatg 120
acccatacac cggtcctaat cgaggccact tgcaatcaag tcaatcagta tgggggatat 180
acggggatga ccccggcaga tttcgtgcgg tatgtggaga atattgctgc acgggtaggc 240
tctccacgtg aaaacctcct tttgggtggc gatcatttgg gacccctggt ctgggctcat 300
gaacctgctg agagtgccat ggaaaaagct cgagctctgg tcaaagccta tgtagaggct 360
ggttttcgca aaattcatct ggattgctca atgccctgtg cggatgatcg cgatttttct 420
ccaaaggtca ttgctgagcg ggcagccgaa ttggctcagg tggcagagtc aacttgtgat 480
gttatgggct tgcccttgcc caactacgtc attggaaccg aggtgccccc agcaggtggc 540
gccaaggctg aagccgaaac tttgagggta acccgtccgg aggatgcagc ggagaccatt 600
gcactgacca gagcggcttt tttcaagcga ggtttagagt ctgcctggga acgtgtagtg 660
gcgttagtag tgcaacccgg tgttgaattc ggagatcatc agattcatgt ttaccgccgt 720
gaggaagcgc aggctctttc ccgcttcatt gaaagccagc ccggcttagt ctatgaggct 780
cactccaccg actatcagcc ccgtgatgcg ctgcgggctt tggttgagga tcatttcgca 840
atcctgaagg tgggtccggc gctaaccttt gcttttcgtg aggcagtttt tgccctggcc 900
agtatcgagg attgggtatg cgattcaccc agtcgcatcc tggaagtttt ggaaacaacc 960
atgctggcca acccggtcta ctggcaaaag tattacttgg gcgatgagcg agcgcgtcgg 1020
attgccagag ggtatagttt cagcgatcgc attcgttatt attggagtgc accagcggtt 1080
gaacaggcct ttgaacgctt gcgggcaaat ctgaatcgtg tttcgatccc ccttgtcctt 1140
ctcagtcagt atttgccgga tcaatatcgc aaagtgcggg atggacggct gcctaaccag 1200
tttgatgctt tgattctgga taaaatccaa gccgtactgg aagactacaa tgtggcgtgt 1260
ggtgtgagga taggggagtg a 1281
<210> 9
<211> 431
<212> PRT
<213> Unknown
<220>
<223> Acidobacteriales bacterium
<220>
<221> PEPTIDE
<222> (1)..(431)
<223> Tagatose-biphosphate aldolase
<400> 9
Met Ser Asp Asn Leu Gln Val Phe Leu Arg Glu Ser Arg Gly Arg Arg
1 5 10 15
Gly Ile Tyr Ser Val Cys Ser Ala His Pro Arg Val Ile Glu Ala Ala
20 25 30
Met Arg Gln Ala Gly Ala Asp Gly Thr His Leu Leu Leu Glu Ala Thr
35 40 45
Ser Asn Gln Val Asn Gln Ala Gly Gly Tyr Thr Gly Met Thr Pro Ala
50 55 60
Met Phe Arg Asp Tyr Val Tyr Asp Ile Ala Gln Glu Ile Gly Phe Asp
65 70 75 80
Arg Ser Arg Leu Ile Leu Gly Gly Asp His Leu Gly Pro Asn Pro Trp
85 90 95
Gln Gln Leu Asp Ala Ser Thr Ala Met Gln Tyr Ala Glu Glu Met Val
100 105 110
Arg Leu Tyr Ile Glu Ala Gly Phe Thr Lys Ile His Leu Asp Ala Ser
115 120 125
Met Arg Cys Ala Asp Asp Ala Ala Ile Val Pro Asp Glu Val Met Ala
130 135 140
Gly Arg Ala Ala Ala Leu Cys Ser Ala Ala Glu Ser Ala Arg Ala Arg
145 150 155 160
Leu Gly Leu Ala Pro Val Val Tyr Val Ile Gly Thr Glu Val Pro Thr
165 170 175
Pro Gly Gly Ala Ser His Ala Leu Asn Thr Leu Glu Val Thr Thr Arg
180 185 190
Glu Ala Val Glu His Thr Leu Ser Val His Arg Lys Ala Phe His Asp
195 200 205
Ala Gly Leu Asp Ala Ala Trp Gln Arg Val Ile Ala Val Val Val Gln
210 215 220
Pro Gly Val Glu Phe Asp His Asp Ser Val Val Asp Tyr Asp Ala Ala
225 230 235 240
Lys Ala Gly His Leu Gln Glu Phe Leu Gln Ala His Pro Glu Leu Val
245 250 255
Met Glu Ala His Ser Ser Asp Tyr Gln Lys Pro Gln Ala Tyr Lys Glu
260 265 270
Leu Val Arg Asp Gly Phe Ala Ile Leu Lys Val Gly Pro Ala Leu Thr
275 280 285
Phe Ala Leu Arg Glu Met Leu Tyr Ala Leu Ala Ala Ile Glu Arg Glu
290 295 300
Leu Val Pro Glu Ala Glu Gln Ser His Leu Val Glu Thr Met Glu Glu
305 310 315 320
Ile Met Leu Ala His Pro Glu Asn Trp Gln Lys Tyr Tyr Arg Gly Ser
325 330 335
Ala Glu Gln Gln Arg Leu Leu Arg Val Tyr Ser Tyr Ser Asp Arg Ile
340 345 350
Arg Tyr Tyr Trp Gly Arg Pro Glu Ala Glu Ala Ala Val Thr Arg Leu
355 360 365
Met Arg Asn Leu His Gln Thr Thr Ile Pro Glu Thr Leu Leu Ser Gln
370 375 380
Tyr Cys Pro Arg Glu Tyr Glu Ala Met Arg Glu Gly Arg Leu Arg Asn
385 390 395 400
Asp Pro Ala Glu Leu Thr Ile Ala Ser Ile Arg Thr Val Leu Glu Ser
405 410 415
Tyr Ser Ser Ala Cys Arg Gly Asp Gly Ser Asn Ser Gly Lys Gln
420 425 430
<210> 10
<211> 1296
<212> DNA
<213> Unknown
<220>
<223> Acidobacteriales bacterium
<220>
<221> gene
<222> (1)..(1296)
<223> Tagatose-biphosphate aldolase
<400> 10
atgtccgaca atttgcaggt gtttcttcgt gagtcccgag gccggcgcgg catctattcg 60
gtatgctccg cgcatccccg ggtgatcgag gccgccatgc ggcaagctgg cgcagacggc 120
acgcatctgc tgctggaagc gacgtcgaat caggtgaacc aagccggagg ctacaccggc 180
atgactcccg cgatgtttcg cgattacgtt tatgacattg cacaggagat cggcttcgac 240
cgcagccgtt tgattcttgg cggagatcat ttgggcccca atccctggca gcagctcgac 300
gccagcacag cgatgcagta tgcagaggag atggttcgac tgtacatcga ggcaggattc 360
accaagattc atctcgacgc cagcatgcgt tgtgccgacg atgcggcaat cgttcccgat 420
gaagtgatgg caggacgcgc cgccgcattg tgcagcgcgg ctgagtcggc gcgagcacgg 480
ctgggactgg cgccggtggt ctacgtgatc ggaaccgagg ttccaacgcc gggtggagca 540
agccatgctc tcaacacgct ggaggtaaca acgcgggagg cagtcgagca tacgctgtcg 600
gttcatcgca aagccttcca cgatgcggga ttggacgctg catggcagcg cgtgatcgcg 660
gtggtcgtgc agccgggcgt ggagttcgat cacgatagcg ttgtcgacta tgacgccgca 720
aaagcgggcc atttgcaaga atttctacaa gcccacccgg aactggtgat ggaggcacac 780
tccagcgatt accagaagcc gcaagcctac aaggaactgg tccgtgatgg cttcgcgatc 840
ctgaaggtcg ggcctgcgtt gacgtttgcg ctgcgggaga tgctctacgc gctggccgcc 900
atcgagcggg aactggtgcc ggaggcggag cagtcccatc tggtagagac gatggaagag 960
atcatgctgg ctcatcccga gaactggcag aagtactatc gcggaagcgc agagcagcag 1020
cgattgctgc gcgtctatag ctacagcgac cgcattcgct attactgggg acgtccggag 1080
gccgaagctg ccgtcacgcg cctgatgcga aatctgcatc agacgacgat tcccgagact 1140
ctcctaagcc agtattgtcc gcgcgaatat gaggcaatgc gcgaaggaag actgcgaaac 1200
gatccggctg agttgacgat cgcgagcatt cgaactgtgc tggagtccta cagcagcgct 1260
tgtcgcggtg acggctcgaa ctccggtaaa cagtaa 1296
<210> 11
<211> 420
<212> PRT
<213> Unknown
<220>
<223> Rhodothermus profundi
<220>
<221> PEPTIDE
<222> (1)..(420)
<223> Tagatose-biphosphate aldolase
<400> 11
Met Gln Ala His Val Leu Leu Ala Pro Ser Phe Glu Gln Leu Ala Asp
1 5 10 15
His Arg His Gly Phe Val Gly Trp Leu Val Asp Leu Leu Arg Gly Pro
20 25 30
Leu Ala Tyr Arg His Thr Leu Leu Ala Val Cys Pro Asn Ser Glu Ala
35 40 45
Val Thr Arg Ala Ala Leu Glu Ala Ala Arg Glu Ala Asn Ala Pro Leu
50 55 60
Phe Phe Ala Ala Thr Leu Asn Gln Val Asp Leu Asp Gly Gly Tyr Thr
65 70 75 80
Gly Trp Thr Pro Ala Thr Leu Ala Arg Phe Val Ala Asp Glu Arg Ile
85 90 95
Arg Leu Gly Leu Arg Ala Pro Val Val Leu Gly Leu Asp His Gly Gly
100 105 110
Pro Trp Lys Lys Asp Trp His Val Arg Asn Arg Leu Pro Tyr Glu Ala
115 120 125
Thr Leu Gln Ala Val Leu Arg Ala Ile Glu Ala Cys Leu Asp Ala Gly
130 135 140
Tyr Gly Leu Leu His Leu Asp Pro Thr Val Asp Leu Glu Leu Pro Pro
145 150 155 160
Gly Thr Pro Val Pro Ile Pro Arg Ile Val Glu Arg Thr Val Ala Leu
165 170 175
Leu Gln His Ala Glu Thr Tyr Arg Gln Gln Arg Arg Leu Pro Pro Val
180 185 190
Ala Tyr Glu Val Gly Thr Glu Glu Val Gly Gly Gly Leu Gln Ala Glu
195 200 205
Ala Arg Met Ala Glu Phe Leu Asp Arg Leu Trp Thr Val Leu Asp Arg
210 215 220
Glu Gly Leu Pro Arg Pro Val Phe Val Val Gly Asp Ile Gly Thr Arg
225 230 235 240
Leu Asp Thr His Thr Phe Asp Phe Glu Arg Ala Arg Arg Leu Asp Ala
245 250 255
Leu Val Arg Arg Tyr Gly Ala Leu Ile Lys Gly His Tyr Thr Asp Gly
260 265 270
Val Asp Arg Leu Asp Leu Tyr Pro Gln Ala Gly Ile Gly Gly Ala Asn
275 280 285
Val Gly Pro Gly Leu Ala Ala Ile Glu Phe Glu Ala Leu Glu Ala Leu
290 295 300
Val Ala Glu Ala His Arg Arg Lys Leu Pro Val Thr Phe Asp Arg Thr
305 310 315 320
Ile Arg Gln Ala Val Ile Glu Ser Gly Arg Trp Gln Lys Trp Leu Arg
325 330 335
Pro Glu Glu Lys Gly Arg Pro Phe Glu Ala Leu Pro Pro Glu Arg Gln
340 345 350
Arg Trp Leu Val Ala Thr Gly Ser Arg Tyr Val Trp Thr His Pro Ala
355 360 365
Val Arg Gln Ala Arg His Gln Leu Tyr Gln Val Leu Ala Pro Trp Leu
370 375 380
Asp Ala Asp Ala Phe Val Arg Ala Arg Ile Lys Ala Arg Leu Met Asp
385 390 395 400
Tyr Phe Arg Ala Phe Asn Leu Ile Gly Phe Asn Glu Arg Leu Gln Ala
405 410 415
Phe Leu Pro Asn
420
<210> 12
<211> 1263
<212> DNA
<213> Unknown
<220>
<223> Rhodothermus profundi
<220>
<221> gene
<222> (1)..(1263)
<223> Tagatose-biphosphate aldolase
<400> 12
atgcaggcgc acgtcctgct tgccccttcg ttcgagcagc tagcagacca caggcacgga 60
tttgttggct ggttggtcga tttgctgcgc ggaccgctgg cttaccggca cacgctgctg 120
gccgtatgtc ccaattccga agccgtaacg cgcgccgccc tggaagctgc gcgcgaagcc 180
aacgccccgc tattttttgc ggctaccctg aaccaggtcg acctggatgg cggatatacc 240
ggctggaccc cggccacgct ggctcgtttt gttgccgacg agcgcatccg cctgggcctt 300
cgcgcccctg tcgtacttgg tctggatcac ggtggcccct ggaaaaagga ttggcatgtc 360
cgcaaccgtc ttccgtacga ggcaacgctc caggcggtgc ttcgcgcgat tgaggcctgc 420
ctcgacgcag gttatgggct gcttcatctg gacccgacgg tagatctgga attgccgccc 480
ggcacacccg tccccatccc acgtattgtc gaacgaacgg tagcgctttt acaacatgct 540
gaaacgtatc gccaacagcg tcgcctgccc ccggtcgcct acgaggtagg cacggaggag 600
gttggcggcg gcctgcaggc tgaggcgcga atggcagaat ttctggatcg actctggacc 660
gtcctggatc gggaagggct accccgtccg gtgtttgtgg tgggtgacat tggcacccgg 720
cttgacacgc acaccttcga ctttgaacgc gcccgtcgcc tggatgccct ggtgcgccgc 780
tacggtgccc tgatcaaggg gcactacacc gatggagtag accgcctgga tctatatcca 840
caggcgggta tcggtggagc aaacgtgggg cctggcctgg ctgctatcga gtttgaagcg 900
ctggaggccc tggtggccga agcgcaccgc cgcaagctgc ccgttacctt tgaccggacc 960
atccgccagg ctgtcattga aagtggacgc tggcaaaaat ggctgcgccc tgaagagaaa 1020
ggacgtccct ttgaagcatt acctccagaa cgccagcggt ggctggtcgc tacaggcagc 1080
cgctacgtgt ggacgcaccc ggctgtccgg caggcgcgcc atcaattgta tcaggtgctc 1140
gctccctggc tcgatgccga tgcttttgtg cgcgcgcgca tcaaggcccg cctgatggac 1200
tacttccgcg ctttcaacct gataggcttc aatgaacggc tgcaggcctt tttacctaat 1260
tga 1263
<210> 13
<211> 420
<212> PRT
<213> Unknown
<220>
<223> Rhodothermus marinus
<220>
<221> PEPTIDE
<222> (1)..(420)
<223> Tagatose-biphosphate aldolase
<400> 13
Met Gln Ala Gln Ala Leu Leu Thr Val Pro Phe Asp Arg Val Ala Thr
1 5 10 15
His Ala Arg Gly Phe Val Gly Trp Val Ala Glu Leu Leu Gln Gly Pro
20 25 30
Leu Ala Tyr Gln His Thr Leu Leu Ala Val Cys Pro Asn Ser Glu Ala
35 40 45
Val Thr Arg Ala Ala Leu Glu Ala Ala Ala Glu Ala Asn Ala Pro Leu
50 55 60
Leu Phe Ala Ala Thr Leu Asn Gln Val Asp Leu Asp Gly Gly Tyr Thr
65 70 75 80
Gly Trp Thr Pro Ala Thr Leu Ala Arg Phe Val Ala Asp Glu Leu Ala
85 90 95
Arg Leu Asp Leu His Ile Pro Val Val Leu Gly Leu Asp His Gly Gly
100 105 110
Pro Trp Lys Lys Asp Leu His Ala Arg Asn Arg Leu Ser Phe Glu Glu
115 120 125
Thr Phe Gln Ala Val Leu Arg Ala Ile Glu Ala Cys Leu Asp Ala Gly
130 135 140
Tyr Gly Leu Leu His Leu Asp Pro Thr Val Asp Leu Glu Leu Ser Pro
145 150 155 160
Gly Thr Pro Val Pro Ile Pro Arg Ile Val Glu Arg Ser Val Ala Leu
165 170 175
Leu Arg His Ala Glu Thr Tyr Arg Leu Arg Arg Asn Leu Pro Pro Val
180 185 190
Ala Tyr Glu Val Gly Thr Glu Glu Val Gly Gly Gly Leu Gln Ala Glu
195 200 205
Ala Arg Met Ala Glu Phe Leu Asp Arg Leu Trp Thr Ala Leu Asp Arg
210 215 220
Glu Gly Leu Pro His Pro Val Phe Val Val Gly Asp Ile Gly Thr Arg
225 230 235 240
Leu Asp Thr Arg Thr Phe Asp Phe Glu Arg Ala Arg Arg Leu Asp Ala
245 250 255
Leu Val Arg Arg Tyr Gly Ala Leu Ile Lys Gly His Tyr Thr Asp Asp
260 265 270
Val Asp Arg Leu Asp Leu Tyr Pro Lys Ala Gly Ile Gly Gly Ala Asn
275 280 285
Val Gly Pro Gly Leu Ala Ala Ile Glu Phe Glu Ala Leu Glu Ala Leu
290 295 300
Val Glu Glu Ala Arg Arg Arg Gly Leu Ser Val Thr Phe Asp Gln Ala
305 310 315 320
Ile Arg Arg Ala Val Val Glu Ser Gly Arg Trp Thr Lys Trp Leu Gln
325 330 335
Pro Glu Glu Lys Gly Gln Pro Phe Asp Ala Leu Asp Pro Glu Arg Gln
340 345 350
Arg Trp Leu Val Ala Thr Gly Ser Arg Tyr Val Trp Thr His Pro Ala
355 360 365
Val Leu Gln Ala Arg Arg Glu Leu Tyr Glu Ala Leu Ala Pro Trp Leu
370 375 380
Asp Ala Asp Ala Phe Val Arg Thr Arg Ile Lys Ala Arg Leu Met Asp
385 390 395 400
Tyr Phe Arg Ala Phe Asn Leu Ile His Phe Asn Glu Arg Leu Gln Ala
405 410 415
Phe Leu Pro Glu
420
<210> 14
<211> 1263
<212> DNA
<213> Unknown
<220>
<223> Rhodothermus marinus
<220>
<221> gene
<222> (1)..(1263)
<223> Tagatose-biphosphate aldolase
<400> 14
atgcaggcgc aggccctgct gaccgttcca tttgatcggg tggcgaccca cgcacgcggg 60
tttgtgggct gggtggccga actgctgcag gggcccctgg cctatcagca tacgctgctg 120
gctgtctgtc ccaattcgga agcggtaaca cgggccgcgc tggaggccgc cgccgaggcc 180
aacgccccgc tgctttttgc cgccacgctg aaccaggtgg acctcgacgg cggctacacc 240
ggctggacgc ccgccacgct ggcccggttc gtggcggacg aactggcccg cctggacctg 300
cacatccccg tcgtgctcgg cctggaccac ggcggcccct ggaaaaagga tctgcacgcc 360
cgcaaccgat tgtcctttga ggaaaccttc caggccgtgc tgcgggccat cgaggcctgt 420
ctggatgccg gctacggcct gctgcacctg gatccgacgg tcgatctgga gctatcgccc 480
ggcacgccgg tgcccatccc gcgcattgtc gaacgctcgg tagcgctttt gcgtcatgcc 540
gaaacctatc gacttcgacg taacctgccg ccggtcgcct acgaggtggg caccgaagaa 600
gtcggcggcg gcctgcaggc cgaagcgcgc atggcggagt ttctggatcg cctctggacc 660
gcactggacc gggaaggcct gccccatcca gtcttcgtgg tgggcgacat cggcacccgg 720
ctcgacacgc gcacgttcga cttcgagcgg gcccgacggc tggacgcgct ggtgcgccgc 780
tacggtgccc tcatcaaagg gcactacacc gacgacgtgg atcgcctcga tctgtacccg 840
aaggcgggca tcggcggggc caacgtgggc ccgggcctgg ccgccatcga gtttgaagcg 900
ctggaggcgc tggtggagga agcccgtcgc cgcggtcttt cggtgacgtt cgatcaggcc 960
atccgccggg ccgtcgtcga aagcggacgc tggacgaagt ggctccaacc ggaagagaaa 1020
ggccagccgt tcgatgcgct ggatcccgag cggcaacgct ggctggtggc caccggcagc 1080
cgctacgtgt ggacgcatcc ggccgtcctg caggcccgcc gcgaactcta cgaggcgctc 1140
gccccctggc tcgatgccga cgctttcgtg cgcacgcgca tcaaagcacg cctgatggac 1200
tactttcgtg ccttcaacct gatccatttc aacgagcggc tgcaggcctt tctccccgaa 1260
tga 1263
<210> 15
<211> 448
<212> PRT
<213> Unknown
<220>
<223> Limnochorda pilosa
<220>
<221> PEPTIDE
<222> (1)..(448)
<223> Tagatose-biphosphate aldolase
<400> 15
Met Gln Thr Ser Thr Ala Tyr Val Arg Gln Val Ile Trp Gly Gln Gly
1 5 10 15
Thr Arg Asp Pro Arg Gly Ile Tyr Ser Val Cys Thr Ala Asp Pro Leu
20 25 30
Val Leu Arg Ala Ala Leu Lys Gln Ala Val Glu Asp Gly Ser Pro Ala
35 40 45
Leu Ile Glu Ala Thr Ser Asn Gln Val Asn Gln Phe Gly Gly Tyr Thr
50 55 60
Gly Met Glu Pro Pro Ala Phe Val Glu Phe Val Leu Gly Leu Ala Arg
65 70 75 80
Glu Met Gly Leu Pro Pro Glu Arg Leu Ile Leu Gly Gly Asp His Leu
85 90 95
Gly Pro Asn Pro Trp Gln Arg Leu Ala Ala Glu Glu Ala Met Arg His
100 105 110
Ala Cys Asp Leu Val Glu Ala Phe Val Ala Cys Gly Phe Thr Lys Ile
115 120 125
His Leu Asp Ala Ser Met Pro Leu Gly Glu Glu Arg Ala Gly Gly Ala
130 135 140
Leu Ser Lys Arg Val Val Ala Glu Arg Thr Ala Gln Leu Cys Glu Ala
145 150 155 160
Ala Glu Ala Ala Phe Arg Lys Arg Ser Gln Ala Glu Gly Ala Ser Ala
165 170 175
Pro Pro Leu Tyr Val Ile Gly Ser Asp Val Pro Pro Pro Gly Gly Glu
180 185 190
Thr Ser Gly Ser Gln Gly Pro Lys Val Thr Thr Pro Glu Glu Phe Glu
195 200 205
Glu Thr Val Ala Leu Thr Arg Ala Thr Phe His Asp Arg Gly Leu Asp
210 215 220
Asp Ala Trp Gly Arg Val Ile Ala Val Val Val Gln Pro Gly Val Asp
225 230 235 240
Phe Gly Glu Trp Gln Val His Pro Tyr Asp Arg Ala Ala Ala Ala Ser
245 250 255
Leu Thr Arg Ala Leu Thr Gln His Pro Gly Leu Ala Phe Glu Gly His
260 265 270
Ser Thr Asp Tyr Gln Thr Pro Gly Arg Leu Arg Gln Met Ala Glu Asp
275 280 285
Gly Ile Ala Ile Leu Lys Val Gly Pro Ala Leu Thr Phe Ala Lys Arg
290 295 300
Glu Ala Leu Phe Ala Leu Asn Ala Leu Glu Ser Glu Val Leu Gly Thr
305 310 315 320
Asp Gly Arg Ala Arg Arg Ser Asn Val Glu Ala Ala Leu Glu Glu Ala
325 330 335
Met Leu Ala Asp Pro Arg His Trp Ser Ala Tyr Tyr Ser Gly Asp Glu
340 345 350
His Glu Leu Arg Leu Lys Arg Lys Tyr Gly Leu Ser Asp Arg Cys Arg
355 360 365
Tyr Tyr Trp Pro Val Pro Ser Val Gln Glu Ala Val Gln Arg Leu Leu
370 375 380
Gly Asn Leu Arg Glu Ala Gly Ile Pro Leu Pro Leu Leu Ser Gln Phe
385 390 395 400
Leu Pro Arg Gln Tyr Glu Arg Val Arg Glu Gly Val Leu Arg Asn Asp
405 410 415
Pro Glu Glu Leu Val Leu Asp Arg Ile Arg Asp Val Leu Arg Gly Tyr
420 425 430
Ala Ala Ala Val Gly Thr Gly Ala Arg Arg Ala Glu Pro Ser Pro Ala
435 440 445
<210> 16
<211> 1347
<212> DNA
<213> Unknown
<220>
<223> Limnochorda pilosa
<220>
<221> gene
<222> (1)..(1347)
<223> Tagatose-biphosphate aldolase
<400> 16
atgcaaacct cgacggcgta cgtgaggcag gtcatttggg gtcaagggac gagggacccc 60
cgcggcatct actcggtctg taccgcagac cccctcgtcc ttcgggccgc cctcaagcag 120
gcggtggagg atggctcccc cgcgctgatc gaggcgacgt ccaaccaggt gaaccagttc 180
ggcgggtata cggggatgga gcccccggcg ttcgtggagt tcgtgctggg acttgcccgc 240
gagatgggac tcccgcccga gcggctgatc ctcgggggcg atcacctcgg ccccaaccca 300
tggcagcggc tggcggccga agaggccatg cggcatgcct gcgacctcgt cgaggccttc 360
gtggcctgcg gcttcaccaa gattcacctg gacgccagca tgcccctggg ggaggaacgg 420
gcaggcggtg cgctttcgaa acgggtggtg gccgaacgga ccgcccagct ctgcgaggcg 480
gccgaggcgg ccttcaggaa gcggtcccag gcggaggggg cgtcggcgcc tccgctctac 540
gtcatcggct ccgacgtgcc tccgcccggc ggcgagacct ccgggagcca ggggcccaag 600
gtgaccacgc cggaggagtt cgaggagacg gtcgcgctga cgcgggcgac ctttcacgat 660
cggggcctgg acgacgcctg gggacgggtg atcgccgtgg tggtccagcc gggggtggac 720
ttcggcgagt ggcaggttca cccctacgat cgggccgccg cggcgagcct tacccgagcc 780
ttgacgcagc atccggggct ggccttcgaa gggcactcca ccgactacca gacgccgggg 840
cggcttcgcc agatggcgga agacggcatc gccatcctga aggtggggcc ggccctcacc 900
ttcgccaagc gggaagcgct cttcgccctg aacgccctgg agtccgaagt gctggggacg 960
gacggccgag cacggcgctc caacgtcgaa gccgccctcg aagaggcgat gctcgccgat 1020
ccccgtcact ggagcgccta ctacagcggg gacgagcacg agctccgtct caagcggaag 1080
tacggcctct ccgaccggtg tcgctactac tggcccgtcc cttcggtgca ggaggccgtc 1140
cagcgcctcc ttggcaacct gcgcgaggcg gggatcccct tgcccctgct gagccagttc 1200
ctgccgcgcc agtacgagcg ggtgcgggag ggcgtcctgc gcaacgaccc ggaggagctg 1260
gtcctggacc ggattcgtga cgtgttgcgg ggatatgcgg cggccgtggg gacgggcgct 1320
aggcgggcgg agccatcacc cgcgtga 1347
<210> 17
<211> 453
<212> PRT
<213> Unknown
<220>
<223> Caldithrix abyssi
<220>
<221> PEPTIDE
<222> (1)..(453)
<223> Tagatose-biphosphate aldolase
<400> 17
Met Ser Leu His Pro Leu Asn Lys Leu Ile Glu Arg His Lys Lys Gly
1 5 10 15
Thr Pro Val Gly Ile Tyr Ser Val Cys Ser Ala Asn Pro Phe Val Leu
20 25 30
Lys Ala Ala Met Leu Gln Ala Gln Lys Asp Gln Ser Leu Leu Leu Ile
35 40 45
Glu Ala Thr Ser Asn Gln Val Asp Gln Phe Gly Gly Tyr Thr Gly Met
50 55 60
Arg Pro Glu Asp Phe Lys Thr Met Thr Leu Glu Leu Ala Ala Glu Asn
65 70 75 80
Asn Tyr Asp Pro Gln Gly Leu Ile Leu Gly Gly Asp His Leu Gly Pro
85 90 95
Asn Arg Trp Thr Lys Leu Ser Ala Ser Arg Ala Met Asp Tyr Ala Arg
100 105 110
Glu Gln Ile Ala Ala Tyr Val Lys Ala Gly Phe Ser Lys Ile His Leu
115 120 125
Asp Ala Thr Met Pro Leu Gln Asn Asp Ala Thr Asp Ser Ala Gly Arg
130 135 140
Leu Pro Val Glu Thr Ile Ala Gln Arg Thr Ala Glu Leu Cys Ala Val
145 150 155 160
Ala Glu Gln Thr Tyr Arg Gln Ser Asp Gln Leu Phe Pro Pro Pro Val
165 170 175
Tyr Ile Val Gly Ser Asp Val Pro Ile Pro Gly Gly Ala Gln Glu Ala
180 185 190
Leu Asn Gln Ile His Ile Thr Glu Val Lys Glu Val Gln Gln Thr Ile
195 200 205
Asp His Val Arg Arg Ala Phe Glu Lys Asn Gly Leu Glu Ala Ala Tyr
210 215 220
Glu Arg Val Cys Ala Val Val Val Gln Pro Gly Val Glu Phe Ala Asp
225 230 235 240
Gln Ile Val Phe Glu Tyr Ala Pro Asp Arg Ala Ala Ala Leu Lys Asp
245 250 255
Phe Ile Glu Ser His Ser Gln Leu Val Tyr Glu Ala His Ser Thr Asp
260 265 270
Tyr Gln Thr Ala Pro Leu Leu Arg Gln Met Val Lys Asp His Phe Ala
275 280 285
Ile Leu Lys Val Gly Pro Ala Leu Thr Phe Ala Leu Arg Glu Ala Ile
290 295 300
Phe Ala Leu Ala Phe Met Glu Lys Glu Leu Leu Pro Leu His Arg Ala
305 310 315 320
Leu Lys Pro Ser Ala Ile Leu Glu Thr Leu Asp Gln Thr Met Asp Lys
325 330 335
Asn Pro Ala Tyr Trp Gln Lys His Tyr Gly Gly Thr Lys Glu Glu Val
340 345 350
Arg Phe Ala Gln Arg Phe Ser Leu Ser Asp Arg Ile Arg Tyr Tyr Trp
355 360 365
Pro Phe Pro Lys Val Gln Lys Ala Leu Arg Gln Leu Leu Lys Asn Leu
370 375 380
Gln Gln Ile Ser Ile Pro Leu Thr Leu Val Ser Gln Phe Met Pro Glu
385 390 395 400
Glu Tyr Gln Arg Ile Arg Gln Gly Thr Leu Thr Asn Asp Pro Gln Ala
405 410 415
Leu Ile Leu Asn Lys Ile Gln Ser Val Leu Lys Gln Tyr Ala Glu Ala
420 425 430
Thr Gln Ile Gln Asn Ser Leu Thr Phe Thr Gln Asn Gln Asn Ser Leu
435 440 445
Ala Met Glu Arg Leu
450
<210> 18
<211> 1362
<212> DNA
<213> Unknown
<220>
<223> Caldithrix abyssi
<220>
<221> gene
<222> (1)..(1362)
<223> Tagatose-biphosphate aldolase
<400> 18
atgagtctgc atcctttaaa taaattaatc gagcgacaca aaaaaggaac gccggtcggt 60
atttattccg tctgttcggc caatcccttt gttttgaaag cggccatgct acaggcgcaa 120
aaggatcagt ctttgctact tattgaggcc acttccaacc aggtagatca attcggcggt 180
tacaccggca tgcggcccga agattttaaa acaatgacgc ttgaactggc agccgaaaac 240
aattacgatc cacagggatt aatcctgggc ggcgaccatc tggggcccaa ccgctggaca 300
aaactgagcg cctcccgggc catggactac gccagagagc agattgccgc ttatgttaaa 360
gccggctttt ccaaaatcca cttagacgcc accatgccct tgcaaaacga tgccacagat 420
tccgccggcc gccttccagt cgaaacaatc gctcaacgta ccgcagaatt atgcgccgtg 480
gccgaacaaa cttaccggca gagcgaccaa ctctttccgc cgcctgttta cattgtcggc 540
agcgacgtgc ccatcccggg cggcgcgcaa gaagcgctga accagatcca tattacggag 600
gtaaaagagg ttcaacagac cattgatcac gtgcggcggg cctttgaaaa aaacggcctg 660
gaagcggctt acgaaagagt ttgcgccgtt gtcgtgcagc caggcgttga attcgccgat 720
caaatcgttt ttgaatacgc tcccgacaga gcggcggcct taaaagattt tattgaaagc 780
cattcgcagc tggtttatga agcgcactct actgattacc agaccgcacc tcttttgcgc 840
cagatggtaa aagatcactt tgccatttta aaggtcgggc ctgcgctcac ctttgccctg 900
cgcgaagcca tttttgctct ggcctttatg gaaaaagagc ttttgccatt gcacagagcg 960
ctcaaacctt ctgccattct ggaaacgctg gaccaaacga tggacaaaaa ccctgcttac 1020
tggcaaaagc attacggcgg aacaaaggaa gaagtacgct ttgcgcagcg gtttagcctg 1080
agcgaccgca ttcgttacta ctggccgttt ccaaaggttc aaaaggccct gcgccaattg 1140
ctaaaaaact tgcaacaaat ttccattcct ctaactttgg taagccagtt catgccagag 1200
gaataccaac gtattcgcca aggaacgtta accaacgatc cgcaggcgct gattttgaac 1260
aaaattcaaa gcgtattaaa gcaatacgcg gaggcgacgc aaattcaaaa ctctttgaca 1320
ttcacgcaaa atcaaaattc attagcaatg gagcgactat ga 1362
<210> 19
<211> 429
<212> PRT
<213> Unknown
<220>
<223> Caldicellulosiruptor kronotskyensis
<220>
<221> PEPTIDE
<222> (1)..(429)
<223> Tagatose-biphosphate aldolase
<400> 19
Met Ser Pro Gln Asn Pro Leu Ile Gly Leu Phe Lys Asn Arg Glu Lys
1 5 10 15
Glu Phe Lys Gly Ile Ile Ser Val Cys Ser Ser Asn Glu Ile Val Leu
20 25 30
Glu Ala Val Leu Lys Arg Met Lys Asp Thr Asn Leu Pro Ile Ile Ile
35 40 45
Glu Ala Thr Ala Asn Gln Val Asn Gln Phe Gly Gly Tyr Ser Gly Leu
50 55 60
Thr Pro Ser Gln Phe Lys Glu Arg Val Ile Lys Ile Ala Gln Lys Val
65 70 75 80
Asp Phe Pro Leu Glu Arg Ile Ile Leu Gly Gly Asp His Leu Gly Pro
85 90 95
Phe Val Trp Arg Asp Gln Glu Pro Glu Ile Ala Met Glu Tyr Ala Lys
100 105 110
Gln Met Ile Lys Glu Tyr Ile Lys Ala Gly Phe Thr Lys Ile His Ile
115 120 125
Asp Thr Ser Met Pro Leu Lys Gly Glu Asn Ser Ile Asp Asp Glu Ile
130 135 140
Ile Ala Lys Arg Thr Ala Val Leu Cys Arg Ile Ala Glu Glu Cys Phe
145 150 155 160
Glu Lys Ile Ser Ile Asn Asn Pro Tyr Ile Thr Arg Pro Val Tyr Val
165 170 175
Ile Gly Ala Asp Val Pro Pro Pro Gly Gly Glu Ser Ser Ile Cys Gln
180 185 190
Thr Ile Thr Thr Lys Asp Glu Leu Glu Arg Ser Leu Glu Tyr Phe Lys
195 200 205
Glu Ala Phe Lys Lys Glu Gly Ile Glu His Val Phe Asp Tyr Val Val
210 215 220
Ala Val Val Ala Asn Phe Gly Val Glu Phe Gly Ser Asp Glu Ile Val
225 230 235 240
Asp Phe Asp Met Glu Lys Val Lys Pro Leu Lys Glu Leu Leu Ala Lys
245 250 255
Tyr Asn Ile Val Phe Glu Gly His Ser Thr Asp Tyr Gln Thr Lys Glu
260 265 270
Asn Leu Lys Arg Met Val Glu Cys Gly Ile Ala Ile Leu Lys Val Gly
275 280 285
Pro Ala Leu Thr Phe Thr Leu Arg Glu Ala Leu Val Ala Leu Ser His
290 295 300
Ile Glu Glu Glu Ile Tyr Ser Asn Glu Lys Glu Lys Leu Ser Arg Phe
305 310 315 320
Arg Glu Val Leu Leu Asn Thr Met Leu Thr Cys Lys Asp His Trp Ser
325 330 335
Lys Tyr Phe Asp Glu Asn Asp Lys Leu Ile Lys Ser Lys Leu Leu Tyr
340 345 350
Ser Tyr Leu Asp Arg Trp Arg Tyr Tyr Phe Glu Asn Glu Ser Val Lys
355 360 365
Ser Ala Val Tyr Ser Leu Ile Gly Asn Leu Glu Asn Val Lys Ile Pro
370 375 380
Pro Trp Leu Val Ser Gln Tyr Phe Pro Ser Gln Tyr Gln Lys Met Arg
385 390 395 400
Lys Lys Asp Leu Lys Asn Gly Ala Ala Asp Leu Ile Leu Asp Lys Ile
405 410 415
Gly Glu Val Ile Asp His Tyr Val Tyr Ala Val Lys Glu
420 425
<210> 20
<211> 1290
<212> DNA
<213> Unknown
<220>
<223> Caldicellulosiruptor kronotskyensis
<220>
<221> gene
<222> (1)..(1290)
<223> Tagatose-biphosphate aldolase
<400> 20
atgagtcctc aaaatccatt gattggttta tttaagaata gagaaaaaga gtttaagggt 60
attatttcag tttgttcttc aaatgaaata gtcttagaag cagttttaaa aagaatgaaa 120
gatacaaacc taccaattat tattgaagcc acagcgaacc aggtaaatca atttggcggg 180
tattctgggt tgacaccgtc tcagttcaaa gaacgagtta taaaaattgc tcaaaaagtt 240
gattttccac ttgagagaat aattcttggt ggggaccatc ttggaccatt tgtgtggcgt 300
gaccaggaac cagaaattgc tatggagtat gctaagcaaa tgataaaaga atacataaaa 360
gcaggtttta ccaaaattca catcgacacg agtatgcctt taaaagggga gaacagcata 420
gatgatgaaa taattgctaa aagaactgct gtgctctgca ggattgcgga ggagtgtttt 480
gagaagattt ctataaacaa tccctatatt acaaggccag tttatgtgat aggagctgat 540
gtgccacctc ccggcggaga gtcttctatt tgtcaaacaa ttactactaa agatgaatta 600
gaaagaagtt tagaatattt caaagaagca tttaaaaagg aaggaattga gcatgtattc 660
gattatgtag ttgctgttgt tgcaaatttt ggagttgaat ttgggagcga tgaaattgtt 720
gattttgata tggaaaaagt aaagccgcta aaagaacttt tggcaaagta caatatagta 780
tttgaaggcc attctacaga ttatcaaaca aaagaaaact taaaaagaat ggtcgaatgt 840
ggtattgcaa ttttaaaggt tggtcctgct ctaacattta cattgcgcga agcgttagta 900
gcacttagtc atattgaaga agaaatttat agcaatgaaa aggagaaact gtcaagattt 960
agagaagttt tattgaatac tatgctaaca tgcaaagatc actggagtaa atattttgat 1020
gagaatgata agttaattaa gtcaaagctc ctatatagct atcttgacag atggagatac 1080
tattttgaaa acgagagtgt gaaaagtgct gtttattctc ttattggaaa tttagagaat 1140
gttaaaattc caccttggct tgtaagtcag tattttcctt ctcagtacca aaagatgaga 1200
aaaaaagatt taaaaaacgg tgctgccgac ctaatattgg ataaaatagg ggaagtcatt 1260
gaccattatg tttatgcggt aaaagaataa 1290
<210> 21
<211> 408
<212> PRT
<213> Unknown
<220>
<223> Caldilinea aerophila
<220>
<221> PEPTIDE
<222> (1)..(408)
<223> Tagatose-biphosphate aldolase
<400> 21
Met Ser Thr Leu Arg His Ile Ile Leu Arg Leu Ile Glu Leu Arg Glu
1 5 10 15
Arg Glu Gln Ile His Leu Thr Leu Leu Ala Val Cys Pro Asn Ser Ala
20 25 30
Ala Val Leu Glu Ala Ala Val Lys Val Ala Ala Arg Cys His Thr Pro
35 40 45
Met Leu Phe Ala Ala Thr Leu Asn Gln Val Asp Arg Asp Gly Gly Tyr
50 55 60
Thr Gly Trp Thr Pro Ala Gln Phe Val Ala Glu Met Arg Arg Tyr Ala
65 70 75 80
Val Arg Tyr Gly Cys Thr Thr Pro Leu Tyr Pro Cys Leu Asp His Gly
85 90 95
Gly Pro Trp Leu Lys Asp Arg His Ala Gln Glu Lys Leu Pro Leu Asp
100 105 110
Gln Ala Met His Glu Val Lys Leu Ser Leu Thr Ala Cys Leu Glu Ala
115 120 125
Gly Tyr Ala Leu Leu His Ile Asp Pro Thr Val Asp Arg Thr Leu Pro
130 135 140
Pro Gly Glu Ala Pro Leu Val Pro Ile Val Val Glu Arg Thr Val Glu
145 150 155 160
Leu Ile Glu His Ala Glu Gln Glu Arg Gln Arg Leu Asn Leu Pro Ala
165 170 175
Val Ala Tyr Glu Val Gly Thr Glu Glu Val His Gly Gly Leu Val Asn
180 185 190
Phe Asp Asn Phe Val Ala Phe Leu Asp Leu Leu Lys Ala Arg Leu Glu
195 200 205
Gln Arg Ala Leu Met His Ala Trp Pro Ala Phe Val Val Ala Gln Val
210 215 220
Gly Thr Asp Leu His Thr Thr Tyr Phe Asp Pro Ser Ala Ala Gln Arg
225 230 235 240
Leu Thr Glu Ile Val Arg Pro Thr Gly Ala Leu Leu Lys Gly His Tyr
245 250 255
Thr Asp Trp Val Glu Asn Pro Ala Asp Tyr Pro Arg Val Gly Met Gly
260 265 270
Gly Ala Asn Val Gly Pro Glu Phe Thr Ala Ala Glu Phe Glu Ala Leu
275 280 285
Glu Ala Leu Glu Arg Arg Glu Gln Arg Leu Cys Ala Asn Arg Lys Leu
290 295 300
Gln Pro Ala Cys Phe Leu Ala Ala Leu Glu Glu Ala Val Val Ala Ser
305 310 315 320
Asp Arg Trp Arg Lys Trp Leu Gln Pro Asp Glu Ile Gly Lys Pro Phe
325 330 335
Ala Glu Leu Thr Pro Ala Arg Arg Arg Trp Leu Val Gln Thr Gly Ala
340 345 350
Arg Tyr Val Trp Thr Ala Pro Lys Val Ile Ala Ala Arg Glu Gln Leu
355 360 365
Tyr Ala His Leu Ser Leu Val Gln Ala Asp Pro His Ala Tyr Val Val
370 375 380
Glu Ser Val Ala Arg Ser Ile Glu Arg Tyr Ile Asp Ala Phe Asn Leu
385 390 395 400
Tyr Asp Ala Ala Thr Leu Leu Gly
405
<210> 22
<211> 1227
<212> DNA
<213> Unknown
<220>
<223> Caldilinea aerophila
<220>
<221> gene
<222> (1)..(1227)
<223> Tagatose-biphosphate aldolase
<400> 22
atgtcaacac ttcgccacat cattttgcga ctgatcgagc tgcgtgaacg agaacagatc 60
catctcacgc tgctggccgt ctgtcccaac tcggcggcgg tgctggaggc agcggtgaag 120
gtcgccgcgc gctgccacac gccgatgctc ttcgctgcca cgctcaatca agtcgatcgc 180
gacggcggct acaccggttg gacgcctgcg caattcgtcg ccgagatgcg tcgctatgcc 240
gtccgctatg gctgcaccac cccgctctat ccttgcctgg atcacggcgg gccgtggctc 300
aaagatcgcc atgcacagga aaagctaccg ctcgaccagg cgatgcatga ggtcaagctg 360
agcctcaccg cctgtctgga ggccggctac gcgctgctgc acatcgaccc cacggtcgat 420
cgcacgctcc cgcccggaga agcgccgctc gtgccgatcg tcgtcgagcg cacggtcgag 480
ctgatcgaac atgccgaaca ggagcgacag cggctgaacc tgccggcggt cgcctatgaa 540
gtcggcaccg aagaagtaca tggcgggctg gtgaatttcg acaattttgt cgccttcttg 600
gatttgctca aggcaaggct tgaacaacgt gccctgatgc acgcctggcc cgccttcgtg 660
gtggcgcagg tcggcactga cctgcataca acgtattttg accccagtgc ggcgcaacgg 720
ctgactgaga tcgtgcgccc taccggtgca ctgttgaagg ggcactacac cgactgggtc 780
gaaaatcccg ccgactatcc gagggtaggc atgggaggcg ccaacgttgg tccagagttt 840
acggcggccg agttcgaggc gctggaagcg ctggaacggc gggaacaacg gctgtgcgcc 900
aaccggaaat tgcagcccgc ctgttttttg gctgcactgg aagaggcagt agtcgcttca 960
gatcgttggc ggaagtggct ccagcccgat gagatcggca agccctttgc agaattaacg 1020
cccgcacgcc ggcgctggct cgtgcagacc ggggcacgct acgtctggac tgcgccgaaa 1080
gttatcgccg cacgcgaaca gctctatgcg cacctctccc ttgtgcaggc ggatccacat 1140
gcctacgtgg tagagtcagt cgcccggtca atcgagcgct atatcgatgc cttcaactta 1200
tacgacgccg ctacattgct tggatga 1227
<210> 23
<211> 446
<212> PRT
<213> Unknown
<220>
<223> Thermoanaerobacter thermohydrosulfuricus
<220>
<221> PEPTIDE
<222> (1)..(446)
<223> Tagatose-biphosphate aldolase
<400> 23
Met Asn Thr Glu His Pro Leu Lys Asn Val Val Lys Leu Gln Lys Lys
1 5 10 15
Gly Ile Pro Ile Gly Ile Tyr Ser Val Cys Ser Ala Asn Glu Ile Val
20 25 30
Ile Gln Val Ala Met Glu Lys Ala Leu Ser Met Asp Ser Tyr Val Leu
35 40 45
Ile Glu Ala Thr Ala Asn Gln Val Asn Gln Tyr Gly Gly Tyr Thr Asn
50 55 60
Met Lys Pro Ile Asp Phe Arg Asp Phe Val Tyr Ser Ile Ala Lys Arg
65 70 75 80
Ile Asn Phe Pro Glu Asn Arg Ile Ile Leu Gly Gly Asp His Leu Gly
85 90 95
Pro Leu Pro Trp Lys Asn Gln Gln Ala Lys Lys Ala Met Glu Glu Ala
100 105 110
Lys Glu Leu Val Lys Gln Phe Val Met Ala Gly Phe Thr Lys Ile His
115 120 125
Val Asp Thr Ser Met Leu Leu Gly Asp Asp Asn Ile Asn Ile Lys Leu
130 135 140
Asp Thr Glu Thr Ile Ala Glu Arg Gly Ala Ile Leu Val Ser Val Ala
145 150 155 160
Glu Arg Ala Phe Glu Glu Leu Lys Lys Phe Asn Pro Tyr Ala Leu His
165 170 175
Pro Val Tyr Val Ile Gly Ser Glu Val Pro Val Pro Gly Gly Ser Gln
180 185 190
Lys Glu Asn Asn Asn Glu Ile Gln Val Thr Lys Pro Thr Asp Phe Glu
195 200 205
Glu Thr Val Glu Val Tyr Lys Ser Thr Phe Tyr Lys Tyr Gly Leu Gly
210 215 220
Asn Ala Trp Glu Asp Val Val Ala Val Val Val Gln Ala Gly Val Glu
225 230 235 240
Phe Gly Val Glu Asp Ile His Glu Tyr Asp His Gln Gln Ala Glu Asn
245 250 255
Leu Val Ser Ala Leu Lys Lys Tyr Pro Asn Leu Val Phe Glu Ala His
260 265 270
Ser Thr Asp Tyr Gln Pro Ala Lys Leu Leu Lys Glu Met Val Arg Asp
275 280 285
Gly Phe Ala Ile Leu Lys Val Gly Pro Glu Leu Thr Phe Ala Leu Arg
290 295 300
Glu Gly Leu Phe Ala Leu Asn Ile Ile Glu Lys Glu Leu Phe Lys Asp
305 310 315 320
Asn His Asp Ile Glu Met Ser Asn Phe Ile Asp Ile Leu Asp Thr Ala
325 330 335
Met Leu Asn Asn Pro Lys Tyr Trp Glu Gln Tyr Tyr Tyr Gly Asp Asp
340 345 350
Asn Lys Ile Arg Ile Ala Arg Lys Tyr Ser Tyr Ser Asp Arg Cys Arg
355 360 365
Tyr Tyr Leu Ile Glu Asn Glu Val Arg Ala Ser Met Ser Arg Leu Phe
370 375 380
Lys Asn Leu Thr Asn Val Glu Ile Pro Leu Thr Leu Ile Ser Gln Tyr
385 390 395 400
Met Pro Ile Gln Tyr Glu Lys Ile Arg Met Gly Leu Leu Lys Asn Asp
405 410 415
Pro Glu Asn Leu Val Lys Asp Lys Ile Gly Asn Cys Ile Asp Lys Tyr
420 425 430
Leu Tyr Ala Thr Asn Pro Thr Ser Gly Glu Phe Lys Leu Ile
435 440 445
<210> 24
<211> 1341
<212> DNA
<213> Unknown
<220>
<223> Thermoanaerobacter thermohydrosulfuricus
<220>
<221> gene
<222> (1)..(1341)
<223> Tagatose-biphosphate aldolase
<400> 24
atgaatacag aacatccttt gaaaaacgtt gttaaactac aaaaaaaggg aattccaata 60
ggtatttatt cagtttgtag tgcaaatgaa atagttattc aagttgcaat ggagaaggca 120
ttgagtatgg atagttatgt tttaattgaa gcaacggcta atcaagtaaa tcaatatggt 180
ggctatacga atatgaaacc tattgatttt agagattttg tgtattctat agccaaaagg 240
ataaacttcc cagaaaatag aataatcctt ggcggggacc acttaggacc tttgccatgg 300
aaaaatcaac aagcgaaaaa agcaatggaa gaagcaaaag aacttgttaa acaatttgtg 360
atggctggct ttacgaaaat tcatgtagat acaagtatgc ttcttggaga tgataacata 420
aatatcaaac tagatactga aactattgcg gagagaggag cgatacttgt atcagtagca 480
gaaagagctt ttgaggagtt aaaaaagttt aatccttatg ctcttcatcc agtttatgta 540
ataggtagtg aagttcctgt tccaggaggt tctcaaaaag aaaataataa tgaaatacaa 600
gtaacaaagc cgacggattt tgaagaaact gtggaagtgt ataaaagcac tttctataaa 660
tatggtttag gaaacgcatg ggaagatgtt gtagcagtgg ttgtgcaggc tggggtggaa 720
tttggagttg aagatattca tgaatatgat caccaacagg ctgaaaattt agtaagtgct 780
ttaaaaaagt atcctaattt agtatttgaa gcccactcta cggattatca acctgcaaaa 840
ctactaaaag aaatggtgag agatggattt gctatactta aagttggacc tgaattgact 900
tttgcattaa gggaaggatt gtttgctctg aatattatag aaaaagaatt atttaaagat 960
aatcatgata ttgagatgtc aaattttatt gatatccttg atacagcaat gttaaataat 1020
ccgaagtatt gggaacagta ttattacggt gatgataata aaattagaat tgctagaaaa 1080
tacagctatt ctgatagatg taggtattat ctaatcgaaa atgaagttag agcatctatg 1140
tctaggttgt ttaaaaattt aacaaatgtt gagataccat taaccttgat aagtcagtat 1200
atgcctattc aatatgaaaa aattagaatg ggactattaa aaaatgatcc tgagaattta 1260
gtaaaagata aaattggaaa ttgcattgat aagtatttgt atgctactaa tccgacaagt 1320
ggagaattta aactaatata a 1341
Claims (9)
- 서열번호 1의 아미노산 서열을 포함하는 과당-4-에피머화 효소에서 하나 이상의 아미노산 잔기가 치환된, 과당-4-에피머화 효소 변이체로서,
상기 서열번호 1의 아미노산 서열의 N-말단으로부터 8번째, 20번째, 23번째, 25번째, 26번째, 29번째, 45번째, 51번째, 53번째, 63번째, 86번째, 91번째, 97번째, 110번째, 133번째, 144번째, 146번째, 151번째, 155번째, 167번째, 172번째, 173번째, 174번째, 181번째, 191번째, 239번째, 263번째, 266번째, 285번째, 294번째, 298번째, 308번째, 315번째, 316번째, 317번째, 323번째, 336번째, 347번째, 359번째, 367번째, 385번째, 386번째, 388번째, 389번째, 410번째, 414번째, 및 417번째로 이루어진 군에서 선택되는 하나의 이상의 위치에 상응하는 아미노산이, 하기 표에 나타낸 각 변이 위치별 치환 아미노산 중의 어느 하나로 치환된 것을 특징으로 하는, 과당-4-에피머화 효소 변이체:
.
- 삭제
- 삭제
- 제1항에 따른 과당-4-에피머화 효소 변이체를 코딩하는 폴리뉴클레오티드.
- 제4항의 폴리뉴클레오티드를 포함하는 벡터.
- 제1항에 따른 과당-4-에피머화 효소 변이체; 상기 과당-4-에피머화 효소 변이체를 코딩하는 폴리뉴클레오티드; 또는 상기 폴리뉴클레오티드를 포함하는 벡터를 포함하는 미생물.
- 제1항에 따른 과당-4-에피머화 효소 변이체; 이를 포함하는 미생물; 또는 상기 미생물의 배양물을 포함하는 타가토스 생산용 조성물.
- 제7항에 있어서, 상기 조성물은 과당을 추가로 포함하는 것인, 타가토스 생산용 조성물.
- 제1항에 따른 과당-4-에피머화 효소 변이체; 이를 포함하는 미생물; 또는 상기 미생물의 배양물을 과당과 접촉시켜, 과당을 타가토스로 전환시키는 단계를 포함하는 타가토스 제조방법.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/252,705 US11753646B2 (en) | 2018-09-28 | 2019-09-27 | Fructose-4-epimerase and method of producing tagatose using the same |
EP19864869.3A EP3798312A4 (en) | 2018-09-28 | 2019-09-27 | NEW FRUCTOSE-4-EPIMERASE AND PROCESS FOR THE PRODUCTION OF TAGATOSE USING IT |
PCT/KR2019/012618 WO2020067786A1 (ko) | 2018-09-28 | 2019-09-27 | 신규 과당-4-에피머화 효소 및 이를 이용한 타가토스의 제조 방법 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20180116609 | 2018-09-28 | ||
KR1020180116609 | 2018-09-28 | ||
KR20180117237 | 2018-10-01 | ||
KR1020180117237 | 2018-10-01 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200037069A KR20200037069A (ko) | 2020-04-08 |
KR102308173B1 true KR102308173B1 (ko) | 2021-10-06 |
Family
ID=70275629
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190099827A KR102308173B1 (ko) | 2018-09-28 | 2019-08-14 | 신규 과당-4-에피머화 효소 및 이를 이용한 타가토스의 제조 방법 |
KR1020190099826A KR102409878B1 (ko) | 2018-09-28 | 2019-08-14 | 신규 과당-4-에피머화 효소 및 이를 이용한 타가토스의 제조 방법 |
KR1020190099828A KR102329311B1 (ko) | 2018-09-28 | 2019-08-14 | 신규 과당-4-에피머화 효소 및 이를 이용한 타가토스의 제조 방법 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190099826A KR102409878B1 (ko) | 2018-09-28 | 2019-08-14 | 신규 과당-4-에피머화 효소 및 이를 이용한 타가토스의 제조 방법 |
KR1020190099828A KR102329311B1 (ko) | 2018-09-28 | 2019-08-14 | 신규 과당-4-에피머화 효소 및 이를 이용한 타가토스의 제조 방법 |
Country Status (4)
Country | Link |
---|---|
US (2) | US11753646B2 (ko) |
EP (3) | EP3859002A4 (ko) |
KR (3) | KR102308173B1 (ko) |
CN (1) | CN113272439B (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021060751A1 (ko) | 2019-09-25 | 2021-04-01 | 주식회사 사피엔반도체 | 픽셀 및 이를 포함하는 표시장치 |
KR102328650B1 (ko) * | 2018-09-27 | 2021-11-19 | 씨제이제일제당 주식회사 | 신규 과당-4-에피머화 효소 및 이를 이용한 타가토스의 제조 방법 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2002315938A1 (en) * | 2002-07-12 | 2004-02-02 | Tongyang Confectionery Co. | Optimization method for preparation of tagatose by thermostable isomerase isomerase |
AU2003902253A0 (en) * | 2003-05-12 | 2003-05-29 | The University Of Queensland | Method for increasing product yield |
WO2009029554A2 (en) * | 2007-08-24 | 2009-03-05 | Codexis, Inc. | Improved ketoreductase polypeptides for the stereoselective production of (r)-3-hydroxythiolane |
KR100964091B1 (ko) | 2008-01-28 | 2010-06-16 | 씨제이제일제당 (주) | 대두 올리고당을 이용한 타가토스의 제조 방법 |
US9914919B2 (en) * | 2013-07-29 | 2018-03-13 | Samyang Corporation | Aldolase, aldolase mutant, and method and composition for producing tagatose by using same |
KR101627921B1 (ko) * | 2014-07-23 | 2016-06-13 | 건국대학교 산학협력단 | 알돌레이즈 돌연변이체 및 이를 이용한 타가토스 생산 방법 |
KR101480422B1 (ko) | 2013-07-29 | 2015-01-13 | 건국대학교 산학협력단 | 효소조합 반응에 의한 과당으로부터 타가토스 생산 방법 및 그 조성물 |
KR101636058B1 (ko) * | 2013-08-30 | 2016-07-05 | (주)케비젠 | 기질 및 효소 컴비네이션 반응을 이용한 프럭토스로부터 타가토스 생산용 조성물 및 이의 용도 |
KR101620904B1 (ko) | 2013-10-11 | 2016-05-23 | (주)케비젠 | 기질 및 효소 컴비네이션 반응을 이용한 프럭토스로부터 타가토스 생산용 조성물 및 이의 용도 |
KR101638024B1 (ko) * | 2014-10-22 | 2016-07-20 | 씨제이제일제당(주) | 타가토스 제조용 조성물 및 과당으로부터 타가토스를 제조하는 방법 |
US10196626B2 (en) * | 2015-07-29 | 2019-02-05 | Cj Cheiljedang Corporation | Hexuronate C4-epimerase mutant with improved conversion activity, and method for producing D-tagatose by using same |
KR101978464B1 (ko) * | 2016-09-07 | 2019-05-14 | 주식회사 삼양사 | 프럭토스 4-에피머화 효소 및 이를 이용한 타가토스 제조 |
CA3058415A1 (en) | 2017-03-31 | 2018-10-04 | Cj Cheiljedang Corporation | Composition for producing tagatose and method of producing tagatose using the same |
KR20180111667A (ko) | 2017-03-31 | 2018-10-11 | 씨제이제일제당 (주) | 타가토스 생산용 조성물 및 이를 이용한 타가토스 제조방법 |
EP3818156A4 (en) * | 2018-07-03 | 2022-05-11 | Arzeda Corp. | METHODS AND COMPOSITIONS FOR PREPARING TAGATOSE FROM FRUCTOSE |
WO2020067786A1 (ko) * | 2018-09-28 | 2020-04-02 | 씨제이제일제당 (주) | 신규 과당-4-에피머화 효소 및 이를 이용한 타가토스의 제조 방법 |
-
2019
- 2019-08-14 KR KR1020190099827A patent/KR102308173B1/ko active IP Right Grant
- 2019-08-14 KR KR1020190099826A patent/KR102409878B1/ko active IP Right Grant
- 2019-08-14 KR KR1020190099828A patent/KR102329311B1/ko active IP Right Grant
- 2019-09-27 EP EP19864983.2A patent/EP3859002A4/en active Pending
- 2019-09-27 EP EP19864455.1A patent/EP3798311A4/en active Pending
- 2019-09-27 CN CN201980075297.9A patent/CN113272439B/zh active Active
- 2019-09-27 US US17/252,705 patent/US11753646B2/en active Active
- 2019-09-27 US US17/252,706 patent/US11884923B2/en active Active
- 2019-09-27 EP EP19864869.3A patent/EP3798312A4/en active Pending
Non-Patent Citations (3)
Title |
---|
Arch. Microbiol., Vol. 177, pp. 410-419 (2002.03.16.)* |
GenBank Accession No. WP_015868068 (2017.07.23.)* |
Scientific Reports, Vol. 7, pp. 1934 (1-8) (2017.05.16.)* |
Also Published As
Publication number | Publication date |
---|---|
EP3859002A4 (en) | 2022-09-28 |
EP3859002A1 (en) | 2021-08-04 |
EP3798311A1 (en) | 2021-03-31 |
US11753646B2 (en) | 2023-09-12 |
EP3798312A4 (en) | 2021-07-28 |
CN113272439A (zh) | 2021-08-17 |
US20210363533A1 (en) | 2021-11-25 |
KR20200037070A (ko) | 2020-04-08 |
KR20200037068A (ko) | 2020-04-08 |
KR102409878B1 (ko) | 2022-06-20 |
US11884923B2 (en) | 2024-01-30 |
EP3798311A4 (en) | 2021-07-21 |
CN113272439B (zh) | 2023-10-20 |
US20210363532A1 (en) | 2021-11-25 |
KR102329311B1 (ko) | 2021-11-23 |
KR20200037069A (ko) | 2020-04-08 |
EP3798312A1 (en) | 2021-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6789436B2 (ja) | Atpホスホリボシル転移酵素変異体及びそれを用いたl−ヒスチジンの生産方法 | |
CN111094563B (zh) | 用于制备塔格糖的组合物和利用其制备塔格糖的方法 | |
KR101987586B1 (ko) | 타가토스 생산용 조성물 및 이를 이용한 타가토스 제조방법 | |
KR102558526B1 (ko) | 신규 과당-4-에피머화 효소 및 이를 이용한 타가토스의 제조 방법 | |
US11408017B2 (en) | Composition for producing tagatose and method of producing tagatose using the same | |
KR102086494B1 (ko) | 신규한 싸이코스-6-인산 탈인산효소, 상기 효소를 포함하는 사이코스 생산용 조성물, 상기 효소를 이용하여 사이코스를 제조하는 방법 | |
AU2019226146B2 (en) | Variant phosphoribosylpyrophosphate amidotransferase and method of preparing purine nucleotide using the same | |
KR102308173B1 (ko) | 신규 과당-4-에피머화 효소 및 이를 이용한 타가토스의 제조 방법 | |
KR102328650B1 (ko) | 신규 과당-4-에피머화 효소 및 이를 이용한 타가토스의 제조 방법 | |
KR102219195B1 (ko) | 신규 과당-4-에피머화 효소 및 이를 이용한 타가토스의 제조 방법 | |
WO2020067786A1 (ko) | 신규 과당-4-에피머화 효소 및 이를 이용한 타가토스의 제조 방법 | |
KR102399441B1 (ko) | 타가토스 생산용 조성물 및 이를 이용한 타가토스 제조 방법 | |
KR102078272B1 (ko) | 과당-4-에피머화 효소 및 이를 이용한 타가토스의 제조 방법 | |
WO2020067788A1 (ko) | 신규 과당-4-에피머화 효소 및 이를 이용한 타가토스의 제조 방법 | |
CN112867793A (zh) | 新型果糖-4-差向异构酶及使用其制备塔格糖的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |