KR102308173B1

KR102308173B1 - 신규 과당-4-에피머화 효소 및 이를 이용한 타가토스의 제조 방법

Info

Publication number: KR102308173B1
Application number: KR1020190099827A
Authority: KR
Inventors: 이영미; 박을수; 박일향; 신선미; 양성재; 윤란영; 최은정; 김성보; 박승원
Original assignee: 씨제이제일제당 주식회사
Priority date: 2018-09-28
Filing date: 2019-08-14
Publication date: 2021-10-06
Also published as: EP3859002A4; EP3859002A1; EP3798311A1; US11753646B2; EP3798312A4; CN113272439A; US20210363533A1; KR20200037070A; KR20200037068A; KR102409878B1; US11884923B2; EP3798311A4; CN113272439B; US20210363532A1; KR102329311B1; KR20200037069A; EP3798312A1

Abstract

본 출원은 타가토스 전환 활성을 갖는 타가토스-이인산 알돌레이즈 변이체 및 이를 이용하여 타가토스를 제조하는 방법에 관한 것이다.

Description

신규 과당-4-에피머화 효소 및 이를 이용한 타가토스의 제조 방법{A Novel Fructose C4 epimerases and Preparation Method for producing Tagatose using the same}

본 출원은 전환 활성 또는 안정성이 향상된 과당-4-에피머화 효소 변이체 및 이를 이용하여 타가토스를 제조하는 방법에 관한 것이다.

타가토스는 설탕과 거의 구별할 수 없는 천연의 단맛을 가지고 있으며, 물리적 성질 또한 설탕과 비슷하다. 타가토스는 우유, 치즈, 카카오 등의 식품, 사과와 귤과 같은 단맛이 나는 천연과일에 소량 존재하는 천연감미료로, 칼로리는 1.5 kcal/g으로 설탕의 1/3 수준이며 GI(Glycemic index, 혈당지수)는 3으로 설탕의 5% 수준인데 반해, 설탕의 맛과 유사한 단맛을 내면서 다양한 건강 기능성을 가지고 있기 때문에 여러 제품 적용 시 건강과 맛을 동시에 만족시킬 수 있는 대체감미료로 이용될 수 있다.

종래 알려진 타가토스의 생산 방법으로는 주로 갈락토스를 원료로 한 화학적(촉매 반응)방법과 생물학적(이성화 효소반응) 방법이 있다(대한민국 등록특허 제10-0964091호 참조). 상기 반응들의 원료인 갈락토스를 경제적으로 수득하기 위하여 갈락토스를 함유하는 다양한 기초 원료 및 이로부터 갈락토스를 수득하여 타가토스를 제조하는 방법에 대한 연구가 선행되어 왔다. 갈락토스를 얻기 위한 대표적인 기초 원료는 유당이나, 국제 시장에서의 원유(原乳) 및 유당의 생산량, 수요 및 공급량 등에 따라 유당 또는 유당을 함유하는 제품의 가격의 불안정성이 존재하여, 타가토스 생산 원료의 안정적 수급에 한계가 있다. 따라서, 보편화된 일반당(설탕, 포도당, 과당 등)을 사용하여 타가토스를 제조할 수 있는 새로운 방법이 필요하다.

이러한 배경하에, 본 발명자들은 서열번호 1의 아미노산 서열에서 하나 이상의 아미노산 치환을 포함하는 신규한 변이형 단백질을 발굴하고, 상기 변이형 단백질이 서열번호 1의 야생형과 같이 전환활성을 가지거나, 야생형 대비 전환 활성 또는 안정성이 향상되고, 타가토스의 생산능을 증가시킴을 확인함으로써, 본 출원을 완성하였다.

본 출원의 하나의 목적은 서열번호 1의 아미노산 서열을 포함하는 과당-4-에피머화 효소에서 하나 이상의 아미노산 잔기가 치환된, 과당-4-에피머화 효소 변이체를 제공하는 것이다.

본 출원의 다른 하나의 목적은 상기 과당-4-에피머화 효소 변이체를 코딩하는 폴리뉴클레오티드를 제공하는 것이다.

본 출원의 또 다른 목적은 상기 폴리뉴클레오티드를 포함하는 벡터를 제공하는 것이다.

본 출원의 또 다른 목적은 상기 변이체를 포함하는 미생물을 제공하는 것이다.

본 출원의 다른 하나의 목적은 과당-4-에피머화 효소 또는 과당-4-에피머화 효소 변이체; 이를 포함하는 미생물; 또는 상기 미생물의 배양물을 하나 이상 포함하는 타가토스 생산용 조성물을 제공하는 것이다.

본 출원의 또 다른 목적은 과당-4-에피머화 효소 또는 과당-4-에피머화 효소 변이체; 이를 발현하는 미생물; 상기 미생물의 배양물, 또는 이들로부터 유래한 과당-4-에피머화 효소 존재하에, 과당을 반응시키는 단계를 포함하는 타가토스 제조방법을 제공하는 것이다.

이를 구체적으로 설명하면 다음과 같다. 한편, 본 출원에서 개시된 각각의 설명 및 실시형태는 각각의 다른 설명 및 실시 형태에도 적용될 수 있다. 즉, 본 출원에서 개시된 다양한 요소들의 모든 조합이 본 출원의 범주에 속한다. 또한, 하기 기술된 구체적인 서술에 의하여 본 출원의 범주가 제한된다고 볼 수 없다.

상기 목적을 달성하기 위한 본 출원의 하나의 양태는 과당-4-에피머화 효소의 아미노산 서열에서 하나 이상의 아미노산 치환을 포함하는, 과당-4-에피머화 효소 변이체를 제공한다.

상기 목적을 달성하기 위한 본 출원의 하나의 양태는 서열번호 1의 아미노산 서열에서 하나 이상의 아미노산 치환을 포함하는, 과당-4-에피머화 효소 변이체를 제공한다.

본 출원에서 용어, "과당-4-에피머화 효소"는 과당의 4번 탄소 위치를 에피머화하여 과당을 타가토스로 전환시키는 과당-4-에피머화 활성을 갖는 효소이다. 본 출원의 목적상 과당을 기질로 하여 타가토스를 생산할 수 있다면 제한없이 포함될 수 있으며, 'D-과당 C4-에피머화 효소'와 혼용되어 사용될 수 있다. 일례로 공지의 데이터 베이스인 KEGG(Kyoto Encyclopedia of Genes and Genomes)에서 EC 4.1.2.40 인 타가토스 이인산 알돌레이즈 또는 타가토스-이인산 알돌레이즈 class II 악세서리 단백질(Tagatose-bisphosphate aldolase or tagatose- bisphosphate class II accessory protein)이 과당을 기질로 타가토스로 전환하는 활성을 가진다면 과당-4-에피머화 효소로 포함될 수 있다. 상기 타가토스-이인산 알돌레이즈는 기존에 하기 [반응식 1]과 같이 D-타가토스 1,6-이인산(D-tagatose 1,6-bisphosphate)를 기질로 하여 글리세론 포스페이트(glycerone phosphate)와 D-글리세랄데하이드 3-포스페이트(D-glyceraldehyde 3-phosphate)를 생산하는 효소로 공지되어 있다.

[반응식 1]

D-타가토스 1,6-이인산 <=> 글리세론 포스페이트 + D-글리세랄데하이드 3-포스페이트

일례로 타가토스-6-인산 키나아제 (Tagatose 6 phosphate kinase; EC 2.7.1.144)가 과당을 기질로 타가토스로 전환하는 활성을 가진다면 과당-4-에피머화 효소로 포함될 수 있다. 상기 타가토스-6-인산 키나아제는 기존에 하기 [반응식 2]와 같이 ATP와 D-타가토스 6-인산(D-tagatose 6-phosphate)를 기질로 하여 ADP와 D-타가토스 1,6-이인산(D-tagatose 1,6-bisphosphate)를 생산하는 효소로 공지되어 있다.

[반응식 2]

ATP + D-타가토스 6-인산 <=> ADP + D-타가토스 1,6-이인산

상기 과당-4-에피머화 효소의 활성은 기질인 과당으로부터 타가토스로의 전환율(전환율=타가토스 중량/초기 과당 중량 *100)이 0.01% 이상, 구체적으로 0.1% 이상, 더욱 구체적으로 0.3% 이상인 것일 수 있다. 보다 구체적으로 전환율은 0.01% 내지 100%의 범위, 0.1% 내지 50%의 범위일 수 있다.

본 출원의 과당-4-에피머화 효소, 타가토스-이인산 알돌레이즈, 타가토스-6-인산 키나아제는 내열성 미생물 유래 효소 또는 그 변이체일 수 있으며, 예를 들어, 코스모토가 오엘리아(Kosmotoga olearia), 썸언에어로드릭스 데센시스(Thermanaerothrix daxensis), 로도써무스 프로펀디(Rhodothermus profundi), 로도써무스 마리너스(Rhodothermus marinus), 림노초르다 필오사(Limnochorda pilosa), 칼디스리스 아비시 (Caldithrix abyssi), 칼디리네 에로필라 (Caldilinea aerophila) 써모언에로박터, 써모하이드로썰퓨리쿠스(Thermoanaerobacter thermohydrosulfuricus), 에시도박테리알레스 박테리움(Acidobacteriales bacterium), 칼디셀룰로시럽터 크로노스키엔시스(Caldicellulosiruptor kronotskyensis), 써모언에어로박테리움 써모사카롤리티쿰(Thermoanaerobacterium thermosaccharolyticum), 또는 슈도알테로모나스 sp. H103, 유래 효소 또는 그 변이체일 수 있으나, 이에 제한되지 않는다. 구체적으로, 코스모토가 오엘리아(Kosmotoga olearia)(서열번호 1), 써모사카롤리티쿰(Thermoanaerobacterium thermosaccharolyticum)(서열번호 3), 슈도알테로모나스 sp. H103(서열번호 5), 썸언에어로드릭스 데센시스(Thermanaerothrix daxensis)(서열번호 7), 에시도박테리알레스 박테리움(Acidobacteriales bacterium)(서열번호 9), 로도써무스 프로펀디(Rhodothermus profundi)(서열번호 11), 로도써무스 마리너스(Rhodothermus marinus)(서열번호 13), 림노초르다 필오사(Limnochorda pilosa)(서열번호 15), 칼디스리스 아비시 (Caldithrix abyssi)(서열번호 17), 칼디셀룰로시럽터 크로노스키엔시스(Caldicellulosiruptor kronotskyensis)(서열번호 19), 칼디리네 에로필라 (Caldilinea aerophila)(서열번호 21), 또는 써모언에로박터 써모하이드로썰퓨리쿠스(Thermoanaerobacter thermohydrosulfuricus)(서열번호 23) 유래 효소 또는 그 변이체일 수 있으나, 이에 제한되지 않는다.

구체적으로, 상기 과당-4-에피머화 효소, 타가토스-이인산 알돌레이즈, 또는 타가토스-6-인산 키나아제는 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23의 아미노산 서열 또는 이와 70% 이상의 상동성 또는 동일성을 갖는 아미노산 서열을 포함할 수 있으나, 이에 제한되지 않는다. 더욱 구체적으로, 본 출원의 과당-4-에피머화 효소는 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23의 아미노산 서열과 적어도 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 상동성 또는 동일성을 가지는 폴리펩티드를 포함할 수 있다. 또한, 이러한 상동성 또는 동일성을 가지며 상기 단백질에 상응하는 효능을 나타내는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 갖는 보조 단백질도 본 출원의 범위 내에 포함됨은 자명하다.

본 출원에서 상기 서열번호 1은 과당-4-에피머화 효소 활성을 갖는 아미노산 서열을 의미한다. 상기 서열번호 1은 공지의 데이터 베이스인 NCBI의 GenBank또는 KEGG(Kyoto Encyclopedia of Genes and Genomes)에서 그 서열을 얻을 수 있다. 일 예로, 코스모토가 오엘리아 (Kosmotoga olearia) 유래일 수 있으며, 더욱 구체적으로는 서열번호 1로 기재된 아미노산 서열을 포함하는 폴리펩티드/단백질일 수 있으나, 이에 제한되지 않는다. 또한 상기 아미노산 서열과 동일한 활성을 갖는 서열은 제한없이 포함될 수 있다. 또한, 서열번호 1의 아미노산 서열 또는 이와 70% 이상의 상동성(homology) 또는 동일성(identity)을 갖는 아미노산 서열을 포함할 수 있으나, 이에 제한되는 것은 아니다. 구체적으로 상기 아미노산 서열은 서열번호 1 및 상기 서열번호 1와 적어도 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 가지는 아미노산 서열을 포함할 수 있다. 또한, 이러한 상동성 또는 동일성을 가지며 상기 단백질에 상응하는 효능을 나타내는 아미노산 서열이라면, 일부 서열이 결실, 변형, 치환 또는 부가된 아미노산 서열을 갖는 단백질도 본 출원의 범위내에 포함됨은 자명하다.

즉, 본 출원에서 '특정 서열번호로 기재된 아미노산 서열을 갖는 단백질 '이라고 기재되어 있다 하더라도, 해당 서열번호의 아미노산 서열로 이루어진 단백질과 동일 혹은 상응하는 활성을 가지는 경우라면, 일부 서열이 결실, 변형, 치환, 보존적 치환 또는 부가된 아미노산 서열을 갖는 단백질도 본 출원에서 사용될 수 있음은 자명하다. 예를 들어, 상기 단백질과 동일 혹은 상응하는 활성을 가지는 경우라면 상기 아미노산 서열 앞뒤에 단백질의 기능을 변경하지 않는 서열 추가, 자연적으로 발생할 수 있는 돌연변이, 이의 잠재성 돌연변이 (silent mutation) 또는 보존적 치환을 제외하는 것이 아니며, 이러한 서열 추가 혹은 돌연변이를 가지는 경우에도 본원의 범위 내에 속하는 것이 자명하다.

본 출원에서 용어, "타가토스"는 단당류 중 케토헥소스의 일종으로 "D-타가토스"와 혼용되어 사용된다.

본 출원에서 용어, "과당-4-에피머화 효소 변이체"는 과당-4-에피머화 효소 활성을 갖는 폴리펩티드의 아미노산 서열에서 하나 이상의 아미노산 치환을 포함하는 과당-4-에피머화 효소 변이체를 의미한다.

구체적으로 상기 아미노산 치환은 N-말단으로부터 8번째, 20번째, 23번째, 25번째, 26번째, 29번째, 45번째, 51번째, 53번째, 63번째, 86번째, 91번째, 97번째, 110번째, 133번째, 144번째, 146번째, 151번째, 155번째, 167번째, 172번째, 173번째, 174번째, 181번째, 191번째, 239번째, 263번째, 266번째, 285번째, 294번째, 298번째, 308번째, 315번째, 316번째, 317번째, 323번째, 336번째, 347번째, 359번째, 367번째, 385번째, 386번째, 388번째, 389번째, 410번째, 414번째, 및 417번째로 이루어진 군에서 선택되는 하나의 이상의 위치의 아미노산이 다른 아미노산으로 치환된 것을 포함하는 것일 수 있으나, 이에 제한되지 않는다.

본 출원의 'N번 위치'은 N번 위치 및 N번 위치와 상응(Correspoding)하는 아미노산 위치를 포함할 수 있다. 구체적으로 특정 아미노산 서열에 개시된 성숙 폴리펩티드(mature polypeptide)에서 임의의 아미노산 잔기에 상응하는 아미노산 위치를 포함할 수 있다. 상기 특정 아미노산 서열은 서열번호 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23의 아미노산 서열 중 어느 하나일 수 있다.

상기 N번 위치와 상응하는 아미노산 위치 또는 상기 특정 아미노산 서열에 개시된 성숙 폴리펩티드에서의 임의의 아미노산 잔기에 상응하는 아미노산 위치는 EMBOSS 패키지의 Needle 프로그램(EMBOSS: The European Molecular Biology Open Software Suite, 문헌[Rice et al., 2000, Trends Genet. 16:276-277])에서 구현되는 바와 같이 Needleman-Wunsch 알고리즘(문헌[Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453]), 구체적으로 버전 5.0.0 또는 그 이후를 사용하여 결정될 수 있다. 사용되는 파라미터는 10의 갭 오픈 페널티, 0.5의 갭 연장 페널티 및 EBLOSUM62(BLOSUM62의 EMBOSS 버전) 치환 매트릭스일 수 있다.

상기 N번 위치와 상응하는 아미노산 위치 또는 상기 특정 아미노산 서열에 개시된 성숙 폴리펩티드에서의 임의의 아미노산 잔기에 상응하는 아미노산 위치의 아미노산 잔기의 확인은 비제한적으로 그들 각각의 디폴트 파라미터를 사용하는 MUSCLE(multiple sequence comparison by log-expectation; 버전 3.5 또는 그 이후; 문헌[Edgar, 2004, Nucleic Acids Research 32: 1792-1797]), MAFFT(버전 6.857 또는 그 이후; 문헌[Katoh and Kuma, 2002, Nucleic Acids Research 30: 3059-3066]; 문헌[Katoh et al., 2005, Nucleic Acids Research 33: 511-518]; 문헌[Katoh and Toh, 2007, Bioinformatics 23: 372-374]; 문헌[Katoh et al., 2009, Methods in Molecular Biology 537: 39-64]; 문헌[Katoh and Toh, 2010, Bioinformatics 26: 1899-1900]) 및 ClustalW를 사용하는 EMBOSS EMMA(1.83 또는 그 이후; 문헌[Thompson et al., 1994, Nucleic Acids Research 22: 4673-4680])를 포함하는 몇몇 컴퓨터 프로그램을 사용한 다중 폴리펩티드 서열의 정렬에 의해 결정될 수 있다.

그 밖의 폴리펩티드가 특정 아미노산 서열의 성숙 폴리펩티드로부터 벗어나서, 종래의 서열 기반의 비교로 그들의 관계를 검출하지 못하게 되는 경우(문헌[Lindahl and Elofsson, 2000, J. Mol. Biol. 295: 613-615]), 그 밖의 쌍별 서열 비교 알고리즘이 사용될 수 있다. 서열 기반의 검색에서 보다 큰 감수성은 데이터베이스를 검색하기 위한 폴리펩티드 패밀리(프로파일)의 확률론적 표시를 이용하는 검색 프로그램을 사용하여 얻어질 수 있다. 예를 들어, PSI-BLAST 프로그램은 반복적인 데이터베이스 검색 과정을 통하여 프로파일을 산출하고 원거리 상동체를 검출할 수 있다(문헌[Atschul et al., 1997, Nucleic Acids Res. 25: 3389-3402]). 폴리펩티드에 대한 패밀리 또는 슈퍼패밀리가 단백질 구조 데이터베이스에서 1개 이상의 표시를 가진다면 훨씬 더 큰 민감성이 달성될 수 있다. GenTHREADER(문헌[Jones, 1999, J. Mol. Biol. 287: 797-815]; 문헌[McGuffin and Jones, 2003, Bioinformatics 19: 874-881])와 같은 프로그램은 질의 서열(query sequence)에 대한 구조적 폴딩을 예측하는 신경망에 대한 입력으로서 다양한 공급원(PSI-BLAST, 2차 구조 예측, 구조정렬 프로파일 및 용매화 포텐셜)으로부터의 정보를 이용한다. 유사하게는 문헌[Gough et al., 2000, J. Mol. Biol. 313: 903-919]의 방법은 알려지지 않은 구조의 서열과 SCOP 데이터베이스에 존재 하는 슈퍼패밀리 모델을 정렬하기 위해 사용될 수 있다. 이들 정렬은 폴리펩티드에 대한 상동성, 유사성, 또는 동일성 모델을 생성하기 위해 차례로 사용될 수 있고, 이러한 모델은 그 목적을 위해 개발된 다양한 툴을 사용하여 정확성에 대해 평가될 수 있다.

상기 '다른 아미노산'은 각 위치에 해당되는 아미노산을 제외한 다른 아미노산이면 제한되지 않는다. '아미노산'은 곁사슬의 성질에 따라 산성, 염기성, 극성(친수성), 비극성(소수성)의 네 가지 종류로 구분된다.

상기 변이체는 서열번호 1의 아미노산 서열에서 각 위치의 아미노산이 비극성 아미노산인 글리신(G), 알라닌(A), 발린(V), 류신(L), 이소류신(I), 메티오닌(M), 페닐알라닌(F), 트립토판(W), 및 프롤린(P); 극성 아미노산인 세린(S), 쓰레오닌(T), 시스테인(C), 티로신(Y), 아스팔트산(D), 및 글루타민(Q); 산성 아미노산인 아스파라긴(N), 및 글루탐산(E); 염기성 아미노산인 라이신(K), 아르기닌(R), 및 히스티딘(H)으로 이루어진 군으로부터 선택되는 하나 이상의 아미노산으로 치환된 단백질일 수 있으나, 이에 제한되지 않는다.

구체적으로, 8번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 글루탐산(E), 히스티딘(H), 류신(L), 프롤린(P), 글루타민(Q) 또는 발린(V)으로 치환되는 것일 수 있다. 20번째 위치의 아미노산은 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 아르기닌(R)으로 치환되는 것일 수 있다. 23번째 위치의 아미노산은 극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 시스테인(C)으로 치환되는 것일 수 있다. 25번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 발린(V), 세린(S), 아스팔트산(D), 히스티딘(H), 페닐알라닌(F), 류신(L), 글리신(G), 아스파라긴(N), 메티오닌(M), 글루탐산(E), 글루타민(Q), 프롤린(P), 라이신(K), 티로신(Y), 아르기닌(R), 트립토판(W), 이소류신(I), 또는 쓰레오닌(T)으로 치환되는 것일 수 있다. 26번째 위치의 아미노산은 비극성 아미노산, 또는 극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 쓰레오닌(T) 또는 발린(V)을 치환되는 것일 수 있다. 29번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 트립토판(W), 시스테인(C), 라이신(K), 알라닌(A), 글루탐산(E), 류신(L), 프롤린(P), 글루타민(Q), 세린(S) 또는 발린(V)을 치환되는 것일 수 있다. 45번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 글루타민(Q), 발린(V), 라이신(K), 글루탐산(E), 또는 메티오닌(M)으로 치환되는 것일 수 있다. 51번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 알라닌(A), 발린(V), 류신(L), 이소류신(I), 메티오닌(M), 페닐알라닌(F), 트립토판(W), 프롤린(P), 세린(S), 시스테인(C), 티로신(Y), 아스팔트산(D), 글루타민(Q), 아스파라긴(N), 글루탐산(E), 라이신(K), 아르기닌(R), 또는 히스티딘(H)으로 치환되는 것일 수 있다. 53번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 트립토판(W), 페닐알라닌(F), 시스테인(C), 라이신(K), 아르기닌(R), 글리신(G), 세린(S), 류신(L), 쓰레오닌(T), 또는 프롤린(P)으로 치환되는 것일 수 있다. 63번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 산성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 프롤린(P), 알라닌(A), 메티오닌(M), 발린(V), 글루탐산(E), 또는 류신(L)으로 치환되는 것일 수 있으며, 86번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 아르기닌(R), 발린(V), 메티오닌(M), 알라닌(A), 류신(L), 또는 글리신(G)으로 치환되는 것일 수 있다. 91번째 위치의 아미노산은 비극성 아미노산, 또는 극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 페닐알라닌(F), 트립토판(W), 또는 티로신(Y)으로 치환되는 것일 수 있다. 97번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 류신(L), 프롤린(P), 티로신(Y), 글루탐산(E), 라이신(K)으로 치환되는 것일 수 있다. 110번째 위치의 아미노산은 극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 티로신(Y)으로 치환되는 것일 수 있다. 133번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 발린(V), 류신(L), 프롤린(P), 글루타민(Q), 아스파라긴(N), 또는 글루탐산(E)으로 치환되는 것일 수 있다. 144번째 위치의 아미노산은 비극성 아미노산, 또는 극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 발린(V), 이소류신(I), 페닐알라닌(F), 또는 세린(S)으로 치환되는 것일 수 있다. 146번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 류신(L), 이소류신(I), 프롤린(P), 글루타민(Q), 또는 히스티딘(H)으로 치환되는 것일 수 있다. 151번째 위치의 아미노산은 비극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G)으로 치환되는 것일 수 있다. 155번째 위치의 아미노산은 비극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G)으로 치환되는 것일 수 있다. 167번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 발린(V), 글리신(G), 알라닌(A), 아르기닌(R), 류신(L), 쓰레오닌(T), 아스팔트산(D)으로 치환되는 것일 수 있다. 172번째 위치의 아미노산은 비극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 또는 쓰레오닌(T)으로 치환되는 것일 수 있다. 173번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 산성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 발린(V), 쓰레오닌(T), 글루탐산(E) 또는 아스팔트산(D)으로 치환되는 것일 수 있다. 174번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 발린(V), 류신(L), 메티오닌(M), 페닐알라닌(F), 트립토판(W), 세린(S), 티로신(Y), 아스팔트산(D), 라이신(K), 또는 아르기닌(R)으로 치환되는 것일 수 있다. 181번째 위치의 아미노산은 비극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 알라닌(A), 류신(L), 이소류신(I), 프롤린(P), 라이신(K), 또는 아르기닌(R)으로 치환되는 것일 수 있다. 191번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 알라닌(A), 발린(V), 류신(L), 이소류신(I), 세린(S), 쓰레오닌(T) 또는 아르기닌(R)으로 치환되는 것일 수 있다. 239번째 위치의 아미노산은 비극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 알라닌(A), 발린(V), 류신(L), 트립토판(W), 프롤린(P), 글루탐산(E), 또는 라이신(K)으로 치환되는 것일 수 있다. 263번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 류신(L), 글루타민(Q), 글루탐산(E), 또는 라이신(K)으로 치환되는 것일 수 있다. 266번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 알라닌(A), 발린(V), 류신(L), 이소류신(I), 트립토판(W), 프롤린(P), 시스테인(C), 티로신(Y), 아스팔트산(D), 또는 아르기닌(R)으로 치환되는 것일 수 있다. 285번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 산성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 발린(V), 류신(L), 메티오닌(M), 티로신(Y), 아스팔트산(D), 글루타민(Q), 또는 글루탐산(E)으로 치환되는 것일 수 있다. 294번째 위치의 아미노산은 비극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G)으로 치환되는 것일 수 있다. 298번째 위치의 아미노산은 비극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G)으로 치환되는 것일 수 있다. 308번째 위치의 아미노산은 비극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 발린(V), 류신(L), 이소류신(I), 트립토판(W), 아르기닌(R), 또는 히스티딘(H)으로 치환되는 것일 수 있다. 315번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 발린(V), 류신(L), 프롤린(P), 아스팔트산(D), 또는 히스티딘(H)으로 치환되는 것일 수 있다. 316번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 발린(V), 류신(L), 메티오닌(M), 프롤린(P), 쓰레오닌(T), 아스파라긴(N), 라이신(K), 또는 아르기닌(R)으로 치환되는 것일 수 있다. 317번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 발린(V), 이소류신(I), 세린(S), 아스팔트산(D), 아르기닌(R), 또는 히스티딘(H)으로 치환되는 것일 수 있다. 323번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 발린(V), 류신(L), 메티오닌(M), 아스팔트산(D), 아르기닌(R), 또는 히스티딘(H)으로 치환되는 것일 수 있다. 336번째 위치의 아미노산은 비극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 알라닌(A), 또는 아르기닌(R)으로 치환되는 것일 수 있다. 347번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 산성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 프롤린(P), 세린(S), 티로신(Y), 아스팔트산(D), 아스파라긴(N), 또는 페닐알라닌(F)으로 치환되는 것일 수 있다. 359번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 알라닌(A), 발린(V), 아스팔트산(D), 아스파라긴(N), 또는 아르기닌(R)으로 치환되는 것일 수 있다. 367번째 위치의 아미노산은 비극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 알라닌(A), 발린(V), 류신(L), 이소류신(I), 또는 아르기닌(R)으로 치환되는 것일 수 있다. 385번째 위치의 아미노산은 비극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 또는 아르기닌(R)으로 치환되는 것일 수 있다. 386번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 발린(V), 류신(L), 이소류신(I), 세린(S), 쓰레오닌(T), 아스팔트산(D), 아르기닌(R), 또는 히스티딘(H)으로 치환되는 것일 수 있다. 388번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 발린(V), 이소류신(I), 세린(S), 쓰레오닌(T), 아스팔트산(D), 또는 아르기닌(R)으로 치환되는 것일 수 있다. 389번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 산성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 발린(V), 메티오닌(M), 세린(S), 아스팔트산(D), 글루탐산(E), 라이신(K), 또는 아르기닌(R)으로 치환되는 것일 수 있다. 410번째 위치의 아미노산은 비극성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 알라닌(A), 발린(V), 류신(L), 또는 쓰레오닌(T)으로 치환되는 것일 수 있다. 414번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 산성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 프롤린(P), 글루타민(Q), 또는 글루탐산(E)으로 치환되는 것일 수 있다. 417번째 위치의 아미노산은 비극성 아미노산, 극성 아미노산, 또는 염기성 아미노산으로 치환되는 것일 수 있으며, 더욱 구체적으로, 글리신(G), 알라닌(A), 발린(V), 류신(L), 메티오닌(M), 프롤린(P), 세린(S), 아스팔트산(D), 또는 아르기닌(R)으로 치환되는 것일 수 있으나, 이에 제한되지 않는다.

상기 과당-4-에피머화 효소 변이체는 특정 위치의 아미노산이 다른 아미노산으로 치환된 것 이외의 하나 이상의 아미노산이 보존적 치환(conservative substitution) 및/또는 변형(modification)에 있어서 상기 열거된 서열 (the recited sequence)과 상이하나, 상기 단백질의 기능(functions) 또는 특성(properties)이 유지되는 폴리펩티드를 포함할 수 있다.

본 출원에서 용어 "보존적 치환(conservative substitution)"은 한 아미노산을 유사한 구조적 및/또는 화학적 성질을 갖는 또 다른 아미노산으로 치환시키는 것을 의미한다. 상기 변이형은 하나 이상의 생물학적 활성을 여전히 보유하면서, 예를 들어 하나 이상의 보존적 치환을 가질 수 있다. 보존적 치환은 생성된 폴리펩티드의 활성에 거의 영향을 미치지 않거나 또는 영향을 미치지 않는다.

또한, 전술한 특정 위치의 아미노산 이외의 하나 이상의 아미노산이 변이된 변이형은 폴리펩티드의 특성과 2차 구조에 최소한의 영향을 갖는 아미노산들의 결실 또는 부가를 포함할 수 있다. 예를 들면 폴리펩티드는 번역-동시에(co-translationally) 또는 번역-후에(post-translationally) 단백질의 전이 (transfer)에 관여하는 단백질 N-말단의 시그널 (또는 리더)서열과 컨쥬게이트 할 수 있다. 또한 상기 폴리펩티드는 폴리펩티드를 확인, 정제, 또는 합성할 수 있도록 다른 서열 또는 링커와 컨쥬게이트 될 수 있다.

또한 상기 변이체는 위에서 설명한 서열번호 1의 변이 및/또는 상기 서열번호 1의 변이와 변이 위치 외 적어도 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 이상의 상동성 또는 동일성을 가지는 아미노산을 포함한다. 상기 서열번호 1의 변이는 전술한 바와 같으며, 이의 상동성 또는 동일성은 전술한 변이 외의 위치에서 상동성 또는 동일성을 가지는 것일 수 있다.

본 출원의 목적상 상기 과당-4-에피머화 효소 변이체는 전환 활성 또는 안정성이 야생형에 비하여 향상된 것을 특징으로 한다.

상기 용어 "전환 활성"은 D-프럭토스(과당)의 4번 탄소 위치를 에피머화하여 타가토스로 전환시키는 것을 의미하며, 상기 용어 "안정성"은 내열성이 높은 효소로서 열 안정성을 갖는 것을 의미한다.

구체적으로, 서열번호 1의 야생형에 비하여 D-프럭토스(과당)의 4번 탄소 위치를 에피머화하여 타가토스로 전환하는 활성 및/또는 안정성이 향상되는 것을 특징으로 한다.

일 예로, 본 출원의 과당-4-에피머화 효소 변이체는 내열성이 높은 효소일 수 있다. 구체적으로, 본 출원의 과당-4-에피머화 효소 변이체는 50℃내지 70℃에서 최대 활성의 50% 내지 100%, 60% 내지 100%, 70% 내지 100% 또는 75% 내지 100%의 활성을 나타낼 수 있다. 보다 구체적으로, 본 출원의 과당-4-에피머화 효소 변이체는 55℃ 내지 60℃, 60℃ 내지 70℃, 55℃, 60℃, 또는 70℃에서 최대 활성의 80% 내지 100% 또는 85% 내지 100%의 활성을 나타낼 수 있다.

상기 변이체의 변이 위치와 변이된 아미노산은 그 예로 표 1 내지 표 6에 기재된 바와 같으나, 이에 제한되지 않는다.

본 출원의 다른 하나의 양태는 상기 과당-4-에피머화 효소 변이체를 코딩하는 폴리뉴클레오티드, 또는 상기 폴리뉴클레오티드를 포함하는 벡터를 제공하는 것이다.

본 출원에서 용어, "폴리뉴클레오티드"는 뉴클레오티드 단위체(monomer)가 공유결합에 의해 길게 사슬모양으로 이어진 뉴클레오티드의 중합체(polymer)로 일정한 길이 이상의 DNA 또는 RNA 가닥으로서, 보다 구체적으로는 상기 변이형 단백질을 코딩하는 폴리뉴클레오티드 단편을 의미한다.

본 출원의 과당-4-에피머화 효소 변이체를 코딩하는 폴리뉴클레오티드는, 본 출원의 과당-4-에피머화 효소 변이체를 코딩하는 폴리뉴클레오티드 서열이라면 제한없이 포함될 수 있다. 일 예로, 본 출원의 과당-4-에피머화 효소 변이체를 코딩하는 폴리뉴클레오티드는 상기 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열일 수 있으나, 이에 제한되는 것은 아니다. 상기 폴리뉴클레오티드는 코돈의 축퇴성(degeneracy)으로 인하여 또는 상기 단백질을 발현시키고자 하는 생물에서 선호되는 코돈을 고려하여, 단백질의 아미노산 서열을 변화시키지 않는 범위 내에서 코딩 영역에 다양한 변형이 이루어질 수 있다. 따라서, 코돈 축퇴성 (codon degeneracy)에 의해 상기 아미노산 서열로 이루어진 폴리펩타이드 또는 이와 상동성 또는 동일성을 가지는 폴리펩타이드로 번역될 수 있는 폴리뉴클레오티드 역시 포함될 수 있음은 자명하다.

또한 공지의 유전자 서열로부터 조제될 수 있는 프로브, 예를 들면, 상기 염기 서열의 전체 또는 일부에 대한 상보 서열과 엄격한 조건 하에 하이브리드화하여, 상기 과당-4-에피머화 효소 변이체를 코딩하는 서열이라면 제한없이 포함될 수 있다.

상기 "엄격한 조건(stringent condition)"이란 폴리뉴클레오티드 간의 특이적 혼성화를 가능하게 하는 조건을 의미한다. 이러한 조건은 문헌 (예컨대, J. Sambrook et al., 상동)에 구체적으로 기재되어 있다. 예를 들어, 상동성(homology) 또는 동일성(identity)이 높은 유전자끼리, 70% 이상, 80% 이상, 85% 이상, 구체적으로는 90% 이상, 보다 구체적으로는 95% 이상, 더욱 구체적으로는 97% 이상, 특히 구체적으로는 99% 이상의 상동성 또는 동일성을 갖는 유전자끼리 하이브리드화하고, 그보다 상동성 또는 동일성이 낮은 유전자끼리 하이브리드화하지 않는 조건, 또는 통상의 써던 하이브리드화(southern hybridization)의 세척 조건인 60℃, 1 X SSC, 0.1% SDS, 구체적으로는 60℃, 0.1 X SSC, 0.1% SDS, 보다 구체적으로는 68℃, 0.1 X SSC, 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 구체적으로는 2회 내지 3회 세정하는 조건을 열거할 수 있다.

혼성화는 비록 혼성화의 엄격도에 따라 염기 간의 미스매치 (mismatch)가 가능할지라도, 두 개의 핵산이 상보적 서열을 가질 것을 요구한다. 용어, "상보적"은 서로 혼성화가 가능한 뉴클레오티드 염기 간의 관계를 기술하는데 사용된다. 예를 들면, DNA에 관하여, 아데노신은 티민에 상보적이며 시토신은 구아닌에 상보적이다. 따라서, 본 출원은 또한 실질적으로 유사한 핵산 서열뿐만 아니라 전체 서열에 상보적인 단리된 핵산 단편을 포함할 수 있다.

구체적으로, 상동성 또는 동일성을 가지는 폴리뉴클레오티드는 55 ℃의 Tm 값에서 혼성화 단계를 포함하는 혼성화 조건을 사용하고 상술한 조건을 사용하여 탐지할 수 있다. 또한, 상기 Tm 값은 60 ℃, 63 ℃ 또는 65 ℃일 수 있으나, 이에 제한되는 것은 아니고 그 목적에 따라 당업자에 의해 적절히 조절될 수 있다.

폴리뉴클레오티드를 혼성화하는 적절한 엄격도는 폴리뉴클레오티드의 길이 및 상보성 정도에 의존하고 변수는 해당기술분야에 잘 알려져 있다(Sambrook et al., supra, 9.50-9.51, 11.7-11.8 참조).

본 출원에서 용어, '상동성(homology)' 또는 '동일성(identity)'은 두 개의 주어진 아미노산 서열 또는 염기 서열과 서로 관련된 정도를 의미하며 백분율로 표시될 수 있다.

용어 상동성 및 동일성은 종종 상호교환적으로 이용될 수 있다.

보존된 (conserved) 폴리뉴클레오티드 또는 폴리펩티드의 서열 상동성 또는 동일성은 표준 배열 알고리즘에 의해 결정되며, 사용되는 프로그램에 의해 확립된 디폴트 갭 페널티가 함께 이용될 수 있다. 실질적으로, 상동성을 갖거나 (homologous) 또는 동일한 (identical) 서열은 중간 또는 높은 엄격한 조건(stringent conditions)에서 일반적으로 서열 전체 또는 전체-길이의 적어도 약 50%, 60%, 70%, 80% 또는 90% 이상으로 하이브리드화할 수 있다. 하이브리드화는 폴리뉴클레오티드에서 코돈 대신 축퇴 코돈을 함유하는 폴리뉴클레오티드 또한 고려된다.

임의의 두 폴리뉴클레오티드 또는 폴리펩티드 서열이 상동성, 유사성 또는 동일성을 갖는지 여부는 예를 들어, Pearson et al (1988)[Proc. Natl. Acad. Sci. USA 85: 2444]에서와 같은 디폴트 파라미터를 이용하여 "FASTA" 프로그램과 같은 공지의 컴퓨터 알고리즘을 이용하여 결정될 수 있다. 또는, EMBOSS 패키지의 니들만 프로그램(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277)(버전 5.0.0 또는 이후 버전)에서 수행되는 바와 같은, 니들만-운치(Needleman-Wunsch) 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)이 사용되어 결정될 수 있다. (GCG 프로그램 패키지 (Devereux, J., et al, Nucleic Acids Research 12: 387 (1984)), BLASTP, BLASTN, FASTA (Atschul, [S.] [F.,] [ET AL, J MOLEC BIOL 215]: 403 (1990); Guide to Huge Computers, Martin J. Bishop, [ED.,] Academic Press, San Diego,1994, 및 [CARILLO ETA/.](1988) SIAM J Applied Math 48: 1073을 포함한다). 예를 들어, 국립 생물공학 정보 데이터베이스 센터의 BLAST, 또는 ClustalW를 이용하여 상동성, 유사성 또는 동일성을 결정할 수 있다.

폴리뉴클레오티드 또는 폴리펩티드의 상동성, 유사성 또는 동일성은 예를 들어, Smith and Waterman, Adv. Appl. Math (1981) 2:482에 공지된 대로, 예를 들면, Needleman et al. (1970), J Mol Biol.48 : 443과 같은 GAP 컴퓨터 프로그램을 이용하여 서열 정보를 비교함으로써 결정될 수 있다. 요약하면, GAP 프로그램은 두 서열 중 더 짧은 것에서의 기호의 전체 수로, 유사한 배열된 기호(즉, 뉴클레오티드 또는 아미노산)의 수를 나눈 값으로 정의한다. GAP 프로그램을 위한 디폴트 파라미터는 (1) 이진법 비교 매트릭스(동일성을 위해 1 그리고 비-동일성을 위해 0의 값을 함유함) 및 Schwartz and Dayhoff, eds., Atlas Of Protein Sequence And Structure, National Biomedical Research Foundation, pp. 353-358 (1979)에 의해 개시된 대로, Gribskov et al(1986) Nucl. Acids Res. 14: 6745의 가중된 비교 매트릭스 (또는 EDNAFULL(NCBI NUC4.4의 EMBOSS 버전) 치환 매트릭스); (2) 각 갭을 위한 3.0의 페널티 및 각 갭에서 각 기호를 위한 추가의 0.10 페널티 (또는 갭 개방 패널티 10, 갭 연장 패널티 0.5); 및 (3) 말단 갭을 위한 무 페널티를 포함할 수 있다. 따라서, 본원에서 사용된 것으로서, 용어 "상동성" 또는 "동일성"은 서열들간의 관련성(relevance)를 나타낸다.

본 출원에서 사용된 용어, "벡터"는 적합한 숙주 내에서 목적 변이형 단백질을 발현시킬 수 있도록 적합한 조절 서열에 작동 가능하게 연결된 상기 목적 변이형 단백질을 코딩하는 폴리뉴클레오티드의 염기서열을 함유하는 DNA 제조물을 의미한다. 상기 조절 서열은 전사를 개시할 수 있는 프로모터, 그러한 전사를 조절하기 위한 임의의 오퍼레이터 서열, 적합한 mRNA 리보좀 결합부위 서열, 및 전사 및 해독의 종결을 조절하는 서열을 포함할 수 있다. 벡터는 적당한 숙주세포 내로 형질전환된 후, 숙주 게놈과 무관하게 복제되거나 기능할 수 있으며, 게놈 그 자체에 통합될 수 있다.

본 출원에서 사용되는 벡터는 숙주세포 내에서 복제 가능한 것이면 특별히 한정되지 않으며, 당업계에 알려진 임의의 벡터를 이용할 수 있다. 통상 사용되는 벡터의 예로는 천연 상태이거나 재조합된 상태의 플라스미드, 코스미드, 바이러스 및 박테리오파지를 들 수 있다. 예를 들어, 파지 벡터 또는 코스미드 벡터로서 pWE15, M13, MBL3, MBL4, IXII, ASHII, APII, t10, t11, Charon4A, 및 Charon21A 등을 사용할 수 있으며, 플라스미드 벡터로서 pBR계, pUC계, pBluescriptII계, pGEM계, pTZ계, pCL계 및 pET계 등을 사용할 수 있다. 구체적으로는 pDZ, pACYC177, pACYC184, pCL, pECCG117, pUC19, pBR322, pMW118, pCC1BAC 벡터 등을 사용할 수 있다.

일례로 세포 내 염색체 삽입용 벡터를 통해 염색체 내에 목적 변이형 단백질을 코딩하는 폴리뉴클레오티드를 변이된 폴리뉴클레오티드로 교체시킬 수 있다. 상기 폴리뉴클레오티드의 염색체 내로의 삽입은 당업계에 알려진 임의의 방법, 예를 들면, 상동 재조합(homologous recombination)에 의하여 이루어질 수 있으나, 이에 한정되지는 않는다. 상기 염색체 삽입 여부를 확인하기 위한 선별 마커(selection marker)를 추가로 포함할 수 있다. 선별 마커는 벡터로 형질전환된 세포를 선별, 즉 목적 핵산 분자의 삽입 여부를 확인하기 위한 것으로, 약물 내성, 영양 요구성, 세포 독성제에 대한 내성 또는 표면 변이형 단백질의 발현과 같은 선택가능 표현형을 부여하는 마커들이 사용될 수 있다. 선택제(selective agent)가 처리된 환경에서는 선별 마커를 발현하는 세포만 생존하거나 다른 표현 형질을 나타내므로, 형질전환된 세포를 선별할 수 있다.

본 출원의 또 하나의 양태로서, 본 출원은 상기 변이형 단백질을 포함하거나, 상기 변이형 단백질을 코딩하는 폴리뉴클레오티드를 포함하여, 타가토스를 생산하는 미생물을 제공하는 것이다. 구체적으로 변이형 단백질 및/또는 상기 변이형 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 미생물은 변이형 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 벡터로 형질전환에 의해 제조되는 미생물일 수 있으나, 이에 제한되지 않는다.

본 출원에서 용어 "형질전환"은 표적 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 벡터를 숙주세포 내에 도입하여 숙주세포 내에서 상기 폴리뉴클레오티드가 코딩하는 단백질이 발현할 수 있도록 하는 것을 의미한다. 형질전환된 폴리뉴클레오티드는 숙주세포 내에서 발현될 수 있기만 한다면, 숙주세포의 염색체 내에 삽입되어 위치하거나 염색체 외에 위치하거나 상관없이 이들 모두를 포함할 수 있다. 또한, 상기 폴리뉴클레오티드는 표적 단백질을 코딩하는 DNA 및 RNA를 포함한다. 상기 폴리뉴클레오티드는 숙주세포 내로 도입되어 발현될 수 있는 것이면, 어떠한 형태로 도입되는 것이든 상관없다. 예를 들면, 상기 폴리뉴클레오티드는 자체적으로 발현되는데 필요한 모든 요소를 포함하는 유전자 구조체인 발현 카세트 (expression cassette)의 형태로 숙주세포에 도입될 수 있다. 상기 발현 카세트는 통상 상기 폴리뉴클레오티드에 작동 가능하게 연결되어 있는 프로모터 (promoter), 전사 종결신호, 리보좀 결합부위 및 번역 종결신호를 포함할 수 있다. 상기 발현 카세트는 자체 복제가 가능한 발현 벡터 형태일 수 있다. 또한, 상기 폴리뉴클레오티드는 그 자체의 형태로 숙주세포에 도입되어 숙주세포에서 발현에 필요한 서열과 작동 가능하게 연결되어 있는 것일 수도 있으며, 이에 한정되지 않는다.

또한, 상기에서 용어 "작동 가능하게 연결"된 것이란 본 출원의 목적 변이형 단백질을 코딩하는 폴리뉴클레오티드의 전사를 개시 및 매개하도록 하는 프로모터 서열과 상기 유전자 서열이 기능적으로 연결되어 있는 것을 의미한다.

본 출원의 다른 하나의 과당-4-에피머화 효소 변이체, 상기 과당-4-에피머화 효소 변이체를 코딩하는 폴리뉴클레오티드, 또는 상기 폴리뉴클레오티드를 포함하는 벡터를 포함하는 미생물을 제공하는 것이다.

상기 미생물은 상기 과당-4-에피머화 효소 변이체 또는 타가토스를 생산하는 미생물일 수 있다.

본 출원에서 사용되는 용어 "과당-4-에피머화 효소 변이체를 포함하는 미생물"이란, 본 출원의 과당-4-에피머화 효소 변이체가 발현되도록 재조합된 미생물을 의미할 수 있다. 예를 들어 과당-4-에피머화 효소 변이체를 코딩하는 폴리뉴클레오티드를 포함하거나, 또는 과당-4-에피머화 효소 변이체를 코딩하는 폴리뉴클레오티드를 포함하는 벡터로 형질전환되어 상기 변이체를 발현할 수 있는 숙주세포 또는 미생물을 의미한다. 본 출원의 목적상 구체적으로 상기 미생물은 서열번호 1의 아미노산 서열 내 하나 이상의 아미노산 치환을 포함하는 과당-4-에피머화 효소 변이체를 발현하는 미생물로서, 상기 아미노산 치환은 N-말단으로부터 하나 이상의 위치에서 하나 이상의 아미노산이 치환되어, 과당-4-에피머화 효소 활성을 갖는, 변이형 단백질을 발현하는 미생물일 수 있으나 이에 제한되지 않는다.

본 출원의 과당-4-에피머화 효소 변이체는 본 출원의 상기 효소 또는 이의 변이체를 발현하는 DNA를 E. coli 등의 균주에 형질전환시킨 다음, 이를 배양하여 배양물을 수득하고, 상기 배양물을 파쇄하여, 컬럼 등을 통해 정제하여 수득한 것일 수 있다. 상기 형질전환용 균주는 대장균(Escherichia coli) 외에도 코리네박테리움 글루타미쿰(Corynebacterum glutamicum), 아스퍼질러스 오리제(Aspergillus oryzae), 또는 바실러스 섭틸리스(Bacillus subtilis) 등이 있으나, 이에 제한되지 않는다.

본 출원의 미생물은 본 출원의 핵산 또는 본 출원의 재조합 벡터를 포함하여 본 출원의 과당-4-에피머화 효소를 생산할 수 있는 미생물이라면, 원핵 미생물 및 진핵 미생물 어느 것이나 포함될 수 있다. 예를 들면 에스케리키아(Escherichia) 속, 어위니아(Erwinia) 속, 세라티아(Serratia) 속, 프로비덴시아(Providencia) 속, 코리네박테리움(Corynebacterium) 속 및 브레비박테리움(Brevibacterium) 속에 속하는 미생물 균주가 포함될 수 있으나, 이에 제한되지 않는다.

본 출원의 미생물은 상기 핵산 또는 벡터 도입 이외에도 다양한 공지의 방법에 의해 본 출원의 과당-4-에피머화 효소를 발현할 수 있는 미생물을 모두 포함할 수 있다.

본 출원의 미생물의 배양물은 본 출원의 과당-4-에피머화 효소를 발현하는 미생물을 배지에서 배양하여 제조된 것일 수 있다.

상기 방법에 있어서, "배양"은 상기 미생물을 적당히 조절된 환경 조건에서 생육시키는 것을 의미한다. 상기 미생물을 배양하는 과정은 특별히 제한되지 않으나, 공지된 회분식 배양방법, 연속식 배양방법, 유가식 배양방법 등에 의해 수행될 수 있다. 이때, 배양조건은, 특별히 이에 제한되지 않으나, 염기성 화합물 (예: 수산화나트륨, 수산화칼륨 또는 암모니아) 또는 산성 화합물 (예: 인산 또는 황산)을 사용하여 적정 pH (예컨대, pH 5 내지 9, 구체적으로는 pH 6 내지 8, 가장 구체적으로는 pH 6.8)를 조절할 수 있고, 산소 또는 산소-함유 가스 혼합물을 배양물에 도입시켜 호기성 조건을 유지할 수 있다. 배양온도는 20 내지 45℃ 구체적으로는 25 내지 40 ℃를 유지할 수 있고, 약 10 내지 160 시간 동안 배양할 수 있으나, 이에 제한 되는 것은 아니다.

아울러, 사용되는 배양용 배지는 탄소 공급원으로는 당 및 탄수화물 (예: 글루코오스, 슈크로오스, 락토오스, 프럭토오스, 말토오스, 몰라세, 전분 및 셀룰로오스), 유지 및 지방 (예: 대두유, 해바라기씨유, 땅콩유 및 코코넛유), 지방산 (예: 팔미트산, 스테아르산 및 리놀레산), 알코올 (예: 글리세롤 및 에탄올) 및 유기산 (예: 아세트산) 등을 개별적으로 사용하거나 또는 혼합하여 사용할 수 있으나, 이에 제한되지 않는다. 질소 공급원으로는 질소-함유 유기 화합물 (예: 펩톤, 효모 추출액, 육즙, 맥아 추출액, 옥수수 침지액, 대두 박분 및 우레아), 또는 무기 화합물 (예: 황산암모늄, 염화암모늄, 인산암모늄, 탄산암모늄 및 질산암모늄) 등을 개별적으로 사용하거나 또는 혼합하여 사용할 수 있으나, 이에 제한되지 않는다. 인 공급원으로 인산 이수소칼륨, 인산수소이칼륨, 이에 상응하는 나트륨 함유 염 등을 개별적으로 사용하거나 또는 혼합하여 사용할 수 있으나, 이에 제한되지 않는다. 또한, 배지에는 기타 금속염 (예: 황산마그네슘 또는 황산철), 아미노산 및 비타민과 같은 필수성장-촉진 물질을 포함할 수 있다.

본 출원의 또 하나의 양태로서, 서열번호 1의 아미노산 서열을 포함하는 과당-4-에피머화 효소 또는 상기 과당-4-에피머화 효소 변이체; 이를 포함하는 미생물; 또는 상기 미생물의 배양물을 포함하는 타가토스 생산용 조성물을 제공한다.

본 출원의 타가토스 생산용 조성물은 추가로 과당을 포함할 수 있다.

또한, 본 출원의 타가토스 생산용 조성물은 당해 타가토스 생산용 조성물에 통상 사용되는 임의의 적합한 부형제를 추가로 포함할 수 있다. 이러한 부형제로는, 예를 들어, 보존제, 습윤제, 분산제, 현탁화제, 완충제, 안정화제 또는 등장화제 등일 수 있으나, 이에 한정되는 것은 아니다.

본 출원의 타가토스 생산용 조성물은 금속이온 또는 금속염을 추가로 포함할 수 있다. 일 구현예에서, 상기 금속이온 또는 금속염의 금속은 2가 양이온을 포함하는 금속일 수 있다. 구체적으로 본 출원의 금속은 니켈(Ni), 철(Fe), 코발트(Co), 마그네슘(Mg) 또는 망간(Mn)일 수 있다. 보다 구체적으로, 상기 금속염은MgSO₄, FeSO₄, NiSO₄, NiCl₂, CoSO₄, MgCl₂,MnCl₂ 또는 MnSO₄일 수 있다.

본 출원의 또 하나의 양태로서, 서열번호 1의 아미노산 서열을 포함하는 과당-4-에피머화 효소 또는 상기 과당-4-에피머화 효소 변이체를 포함하는 미생물; 또는 이의 배양물을 과당과 접촉시켜, 과당을 타가토스로 전환시키는 단계를 포함하는 타가토스 제조방법을 제공한다.

일 예로, 본 출원의 접촉은 pH 5.0 내지 pH 9.0 조건에서, 30℃내지 80℃온도 조건에서, 및/또는 0.5시간 내지 48시간 동안 수행할 수 있다.

구체적으로, 본 출원의 접촉은 pH 6.0 내지 pH 9.0 조건 또는 pH 7.0 내지 pH 9.0 조건에서 수행할 수 있다. 또한, 본 출원의 접촉은 35℃내지 80℃, 40℃ 내지 80℃, 45℃ 내지 80℃, 50℃ 내지 80℃, 55℃ 내지 80℃, 60℃ 내지 80℃, 30℃ 내지 70℃, 35℃ 내지 70℃, 40℃ 내지 70℃, 45℃ 내지 70℃, 50℃ 내지 70℃, 55℃ 내지 70℃, 60℃ 내지 70℃, 30℃ 내지 65℃, 35℃ 내지 65℃, 40℃ 내지 65℃, 45℃ 내지 65℃, 50℃ 내지 65℃, 55℃ 내지 65℃, 30℃ 내지 60℃, 35℃ 내지 60℃, 40℃ 내지 60℃, 45℃ 내지 60℃, 50℃ 내지 60℃ 또는 55℃ 내지 60℃ 온도 조건에서 수행할 수 있다. 더불어, 본 출원의 접촉은 0.5시간 내지 36시간 동안, 0.5시간 내지 24시간 동안, 0.5시간 내지 12시간 동안, 0.5시간 내지 6시간 동안, 1시간 내지 48시간 동안, 1시간 내지 36시간 동안, 1시간 내지 24시간 동안, 1시간 내지 12시간 동안, 1시간 내지 6시간 동안, 3시간 내지 48시간 동안, 3시간 내지 36시간 동안, 3시간 내지 24시간 동안, 3시간 내지 12시간 동안, 3시간 내지 6시간 동안, 6시간 내지 48시간 동안, 6시간 내지 36시간 동안, 6시간 내지 24시간 동안, 6시간 내지 12시간 동안, 12시간 내지 48시간 동안, 12시간 내지 36시간 동안, 12시간 내지 24시간 동안, 18시간 내지 48시간 동안, 18시간 내지 36시간 동안 또는 18시간 내지 30시간 동안 수행할 수 있다.

또한, 본 출원의 접촉은 금속이온 또는 금속염 존재하에서 수행할 수 있다. 사용될 수 있는 금속이온 또는 금속염은 전술한 양태에서와 같다.

본 출원의 제조방법은 제조된 타가토스를 분리 및/또는 정제하는 단계를 추가로 포함할 수 있다. 상기 분리 및/또는 정제는 본 출원의 기술 분야에서 통상적으로 사용하는 방법을 사용할 수 있으며. 비제한적인 예로, 투석, 침전, 흡착, 전기영동, 이온교환 크로마토그래피 및 분별 결정 등을 사용할 수 있다. 상기 정제는 하나의 방법만 실시될 수도 있으며, 두 가지 이상의 방법을 함께 실시할 수도 있다.

또한, 본 출원의 제조방법은 상기 분리 및/또는 정제하는 단계 이전 또는 이후에 탈색 및/또는 탈염을 수행하는 단계를 추가로 포함할 수 있다. 상기 탈색 및/또는 탈염을 실시함으로써, 보다 품질이 우수한 타가토스를 얻을 수 있다.

다른 예로, 본 출원의 제조방법은 본 출원의 타가토스로 전환하는 단계, 분리 및/또는 정제하는 단계, 또는 탈색 및/또는 탈염하는 단계 이후 타가토스를 결정화하는 단계를 추가로 포함할 수 있다. 상기 결정화는 통상적으로 사용하는 결정화 방법을 사용하여 수행할 수 있다. 예를 들어, 냉각결정화 방법을 사용하여 결정화를 수행할 수 있다.

또한, 본 출원의 제조 방법은 상기 결정화하는 단계 이전에 타가토스를 농축하는 단계를 추가로 포함할 수 있다. 상기 농축은 결정화 효율을 높일 수 있다.

다른 예로, 본 출원의 제조방법은 본 출원의 분리 및/또는 정제하는 단계 이후 미반응된 과당을 본 출원의 효소, 상기 효소를 발현하는 미생물 또는 상기 미생물의 배양물과 접촉시키는 단계, 본 출원의 결정화하는 단계 이후 결정이 분리된 모액을 상기 분리 및/또는 정제 단계에 재사용하는 단계, 또는 이의 조합을 추가로 포함할 수 있다. 상기 추가 단계를 통해 타가토스를 더욱 고수율로 수득할 수 있으며 버려지는 과당의 양을 절감할 수 있어 경제적 이점이 있다.

본 출원의 과당-4-에피머화 효소 변이체는 특성이 우수한 타가토스 생산이 산업적으로 가능하고, 보편화된 당인 과당을 타가토스로 전환하는 바 경제성이 높은 효과가 있다.

도 1은 본 출원의 일 실시예들에서 제조된 타가토스-이인산 알돌레이즈 효소 (CJ_KO_F4E)이 과당-4-에피머화 효소 활성을 가짐을 보여주는 HPLC 크로마토그래피 결과이다.
도 2 및 도 3은 변이체들의 열안정성을 평가하기 위해 60℃ 온도조건에서의 시간 변화에 따른 잔존활성을 상대적인 수치로 나타낸 그래프이다.

실시예 1. 과당-4-에피머화 효소 유전자를 포함하는 재조합 발현벡터 및 형질전환체의 제조

실시예 1-1. 야생형 과당-4-에피머화 효소 제조

과당-4-에피머화 효소를 제조하기 위해 코스모토가 오엘리아 (Kosmotoga olearia)에서 유래한 아미노산 서열(서열번호 1) 및 유전자 정보를 확보하여 대장균 발현 가능 벡터 및 형질전환 미생물(형질전환체)을 제조하였다. 상기 서열이 과당으로부터 타가토스로 전환하는 과당-4-에피머화 효소로 이용될 수 있음을 확인하였다(도 1).

구체적으로, 상기 유전자를 KEGG(Kyoto Encyclopedia of Genes and Genomes)에 등록된 코스모토가 오엘리아 유전자 서열을 대상으로 타가토스-이인산 알돌레이즈 유전자 서열을 선발하였고, 코스모토가 오엘리아의 타가토스-이인산 알돌레이즈 class II accessory protein AgaZ인 아미노산 서열 (서열번호 1)과 염기 서열 (서열번호 2)를 바탕으로 대장균 발현 가능 벡터인 pBT7-C-His에 삽입하여 재조합 발현벡터 pBT7-C-His-KO를 바이오니아에 합성 의뢰하여 제작하였다.

단백질 발현을 유도하고자 대장균 발현용 균주인 BL21(DE3)에 형질 전환하였고, E.coli BL21(DE3)/CJ_KO_F4E로 명명하였다. 부다페스트 조약 하에 상기 E.coli BL21(DE3)/CJ_KO_F4E는 2017년 3월 24일에 기탁번호 KCCM11999P로 기탁되었다.

재조합 효소를 제조하기 위해, 상기 E.coli BL21(DE3)/CJ_KO_F4E 를 앰피실린 (ampicillin)이 포함된 LB 액체배지 5ml를 포함하는 배양 튜브에 접종하고, 600nm에서 흡광도가 2.0이 될 때까지 37℃ 진탕 배양기에서 종균 배양을 하였다. 본 종균 배양된 배양액을 LB와 단백질 발현 조절인자인 유당이 함유된 액체배지를 포함하는 배양 플라스크에 접종하여 본 배양을 진행하였다. 상기 배양 과정 중의 교반속도는 180rpm이며, 배양 온도는 37℃가 유지되도록 하였다. 배양액은 8,000rpm으로 4℃에서 20분 동안 원심분리 후 균체를 회수하였다. 회수된 균체는 50 mM Tris-HCl(pH8.0) 완충용액으로 2회 세척하였고, 10mM 이미다졸(imidazole)과 300mM NaCl이 포함되어 있는 50mM NaH2PO4(pH 8.0) 완충용액에 재현탁하였다. 상기 현탁된 균체를 세포파쇄기(sonicator)를 이용하여 파쇄하였으며, 세포 파쇄물은 13,000rpm으로 4℃에서 20분 동안 원심분리 후 상등액만을 취하였다. 상기 상등액은 His-taq 친화 크로마토그래피를 사용하여 정제되었고, 20mM 이미다졸 및 300mM NaCl을 함유하는 50mM NaH2PO4(pH 8.0) 완충용액을 충진제의 10배의 액량으로 흘려주어 비특이적 결합 가능 단백질을 제거하였다. 최종 250mM 이미다졸 및 300mM NaCl을 함유하는 50mM NaH2PO4(pH8.0) 완충용액을 흘려주어 용출 정제하였으며, 50mM Tris-HCl(pH 8.0) 완충용액으로 투석 후 효소 특성 분석을 위한 효소를 확보하였다.

실시예 1-2. 과당으로부터 타가토스로의 전환 활성 평가

상기 실시예 1-1에서 얻어진 효소들의 활성을 측정하기 위하여, 30 중량% 과당을 사용하였고, 여기에 50mM Tris-HCl (pH 8.0), 1mM CoSO₄, 상기 실시예 2에서 분리된 20mg/ml 정제효소를 첨가하여 온도 60℃에서 2시간 반응하였다. CJ_KO_F4E 에 의해 전환된 타가토스의 농도 및 과당으로부터 타가토스로 전환된 전환율은 16.0 %였다.

상기 전환율은 다음 식으로 산출되었다: 전환율=타가토스 중량/초기과당 중량 X 100

실시예 2. 변이체 라이브러리 제조 및 라이브러리를 이용한 활성이 개량된 변이체의 스크리닝

실시예 1에서 코스모토가 오엘리아 (Kosmotoga olearia)에서 유래한 과당-4-에피머화 효소 유전자를 주형으로 하여 에러-프론 중합효소연쇄반응법(error-prone PCR)을 통하여 과당-4-에피머화 효소의 변이체 라이브러리를 구성하였다. 구체적으로는, Diversify random mutagenesis kit(ClonTech사)을 이용하여 과당-4-에피머화 효소 유전자를 1000개의 염기쌍 당 2 내지 3개의 변이가 일어나게 하는 무작위 돌연변이를 유도하였고, PCR 반응 조건은 아래 표 1 및 2에 나타냈다. 과당-4-에피머화 효소의 변이체를 코딩하는 유전자 라이브러리를 구성한 다음, 이를 E.coli BL21(DE3)에 삽입하였다.

반응용액 조성	첨가량 (μl)
PCR Grade Water	36
10X TITANIUM Taq Buffer	5
MnSO4 (8 mM)	4
dGTP (2 mM)	1
50X Diversify dNTP Mix	1
Primer mix	1
Template DNA	1
TITANIUM Taq Polym.	1

단계	온도 (℃)	시간(초)	사이클
Initial Denaturation	94	30	1
Denaturation	94	30	25
Annealing/ Extension	68	60	25
Final Extension	68	60	1

상기 과당-4-에피머화 효소의 변이체 유전자를 포함하고 있는 pBT7-C-His 플라스미드를 가지고 있는 E.coli BL21(DE3)을, 앰피실린(ampicillin) 항생제가 포함된 LB 액체배지 0.2 mL를 포함하는 deep well rack에 접종하고, 37℃진탕 배양기에서 16시간 이상 종균 배양을 하였다. 상기 종균 배양결과 얻은 배양액을 LB와 단백질 발현조절인자인 유당이 함유된 액체배지를 포함하는 배양 deep well rack에 접종하여 본 배양을 진행하였다. 상기 종균 배양 및 본 배양은 교반속도 180 rpm 및 37℃조건에서 실시하였다. 다음, 상기 배양액을 4,000 rpm으로 4℃에서 20분 동안 원심분리 후 균체를 회수하였다.

제작된 무작위돌연변이 라이브러리에서 활성개량 변이효소를 대량으로 고속 스크리닝 하기 위해 D-과당을 특이적으로 정량화 할 수 있는 발색 측정법을 이용하였다. 구체적으로, 70% 폴린-치오칼토 용액(folin-ciocalteu reagent, SIGMA-ALDRICH)과 기질반응 완료액을 15: 1 비율로 혼합한 후 80도에서 5분간 반응하여 900nm에서 측정하여 OD 값으로 비교 분석하였다.

야생효소 및 활성이 개량된 효소간 균체 시료를 사용한 반응액(기질 D-과당) 분석결과, 상기 발색 측정법은 유효성이 있는 것으로 평가되어, 제작된 라이브러리의 개량활성 스크리닝에 사용하였다.

상기 라이브러리를 활성이 개량된 변이체 스크리닝에 사용하였으며, 구체적으로, 야생형 효소(서열번호 1)와 상대활성 비교 시 활성(D-과당으로부터 D-타가토스 전환)이 있는 변이체들을 선발하였다. 해당 유전자들은 염기서열 분석 후 아미노산 변이 정보를 분석하였다.

이중 가장 활성이 높게 측정된 50개의 콜로니를 선별하여 이들을 시퀀싱하여 염기서열을 확인한 결과, 총 47개 부위, 구체적으로는, 8번째, 20번째, 23번째, 25번째, 26번째, 29번째, 45번째, 51번째, 53번째, 63번째, 86번째, 91번째, 97번째, 110번째, 133번째, 144번째, 146번째, 151번째, 155번째, 167번째, 172번째, 173번째, 174번째, 181번째, 191번째, 239번째, 263번째, 266번째, 285번째, 294번째, 298번째, 308번째, 315번째, 316번째, 317번째, 323번째, 336번째, 347번째, 359번째, 367번째, 385번째, 386번째, 388번째, 389번째, 410번째, 414번째, 또는 417번째가 변이되어 있음을 확인하였다.

실시예 3. 추가 특성이 개량된 제작 및 변이효소 선별

선발된 개량 부위의 정보들을 통합하여 변이효소를 제작 후 과당-4-에피머화 전환반응의 단위활성이 향상된 변이효소를 개발하였다.

실시예 3-1. 포화 돌연변이 (saturation mutagenesis)

야생형 효소 유전자 의 대장균 BL21(DE3) 발현을 위해 제작된 재조합발현벡터 pBT7-C-His-KO (야생형의 C-말단에 6xHis-tag이 결합한 재조합효소를 발현함)를 실시예 2에서 선별된 활성 개량 부위 47곳의 추가 변이주 라이브러리 제작을 위한 포화돌연변이법의 주형(template)으로 사용하였다. 변이분포 다양성 및 변이체 수율 등을 고려하여 역 (inverse) PCR 기반 포화 돌연변이법을 사용하였고(2014. Anal. Biochem. 449:90-98), 제작된 변이주 라이브러리의 스크리닝 규모를 최소화(포화돌연변이 시 도입되는 코돈 수를 최소화함)하기 위해 종결코돈을 배제하고, 대장균의 희귀코돈(rare codons)이 최소화된 NDT/VMA/ATG/TGG 혼합 프라이머를(2012. Biotechniques 52:149-158) 디자인하여 사용하였다. 구체적으로, 각각의 부위의 앞쪽염기 15bp와 치환염기3bp, 뒤쪽염기 15bp로 총 길이는 33bp로 하여 프라이머를 제작 이용하였다. PCR 조건은 94 ℃에서 2분간 변성 후, 94℃ 30초 변성, 60℃ 30초 어닐링, 72℃ 10분 신장을 30회 반복한 후, 72℃에서 60분간 신장반응을 수행하였다. 선정 아미노산 부위별로 포화돌연변이 라이브러리를 제작 후 라이브러리별 변이주를 무작위 선발(<변이 11개)하고 염기서열을 분석하여 아미노산 변이분포를 평가하였다. 이의 분석결과를 기반으로 라이브러리별 서열 범위(sequence coverage) 90% 이상의 스크리닝 규모를 설정하였다(2003. Nucleic Acids Res. 15;31:e30)

상기 47곳의 단일부위 포화돌연변이를 통하여 고 활성 보유 후보 변이주를 제작하고 염기서열 분석하여 변이부위를 확인하였다. 이를 통해 총 288개의 변이체를 확보하였다(표 3).

변이위치	기존서열	변이서열
8	D	A,E,H,L,P,Q,V,
20	C	R
23	S	C
25	C	A,V,S,D,H,F,L,G,N,M,E,Q,P,K,Y,R,W,I,T
26	S	A,T,V
29	R	W,C,K,E,Q,A,S,V,L,P
45	T	A,Q,V,K,E,M
51	T	V,P,I,N,F,D,H,W,Q,E,L,A,G,C,M,K,Y,S,R
53	N	W,F,C,K,R,G,S,L,T,P
63	G	P,A,M,V,E,L
86	K	R,V,A,M,L,G
91	G	F,W,Y
97	N	K,L,E,Y,P
110	N	Y
133	R	P,N,E,V,Q,L
144	P	A,I,V,F,S
146	N	L,P,H,G
151	A	G
155	A	G
167	E	V,R,A,G,T,L,D
172	L	T,A
173	R	A,T,E,V,D
174	P	K,G,L,R,D, M,V,F,S,Y,W
181	D	I,A,L,K,R,P,G,M
191	E	T,R,G,V,S,L,I,A
239	N	V,G,A,E,K,W,L,P
263	I	A,Q,L,K,E
266	E	L,R,W,D,G,A,T,P,C,V,Y,I
285	G	M,V,E,H,D,Q,Y,L
294	A	G
298	A	G
308	S	V,A,D,I, H,L,R,W
315	Y	D,V,A,P,H,L
316	D	L,V,N,K,P,R,M,T
317	T	V,I,D,H,R,S
323	N	M,K,G,V,L,H,D,I,R
336	P	A,R,G
347	E	D,G,N,P,S
359	L	V,R,G,A,D,N,T
367	N	A,G,L,R,I,V
385	K	R,A
386	E	T,I,V,A,L,D,H,S
388	P	V,D,S,R,I,G,T
389	L	K,G,R,V,D,S,E,M
410	K	V,L,A,T
414	S	P,Q
417	K	G,V,S,P,R,D,L,A,M

실시예 3-2. 변이효소 제작

단위활성이 개량된 단일부위에 대한 변이효소 및 이들이 조합된 다중부위에 대한 변이효소에 대해 과당-4-에피머화의 상대활성을 평가하기 위하여, 상기 3-1에서 제조한 포화돌연변이 라이브러리 유전자를 E. coli BL21(DE3) 에 형질전환한 후 각각의 형질전환 미생물을 앰피실린(ampicillin) 항생제가 포함된 LB 액체배지 5 mL를 포함하는 배양 튜브에 접종하고, 600 nm에서 흡광도가 2.0이 될 때까지 37℃진탕 배양기에서 종균 배양을 하였다. 상기 종균 배양결과 얻은 배양액을 LB와 단백질 발현조절인자인 유당이 함유된 액체배지를 포함하는 배양 플라스크에 접종하여 본 배양을 진행하였다. 상기 종균 배양 및 본 배양은 교반속도 180 rpm 및 37℃조건에서 실시하였다. 다음, 상기 배양액을 8,000 rpm으로 4℃에서 20분 동안 원심분리 후 균체를 회수하였다. 상기 회수된 균체를 50 mM Tris-HCl(pH8.0) 완충용액으로 2회 세척하고, 10 mM 이미다졸(imidazole)과 300 mM NaCl이 포함되어 있는 50 mM NaH2PO4(pH 8.0) 완충용액에 재현탁하였다. 상기 재현탁된 균체를 세포파쇄기(sonicator)를 이용하여 파쇄하고, 13,000 rpm으로 4℃에서 20분 동안 원심분리 후 상등액만을 취하였다. 상기 상등액을 His-taq 친화 크로마토그래피를 사용하여 정제하고, 20 mM 이미다졸 및 300 mM NaCl을 함유하는 50 mM NaH₂PO₄(pH 8.0) 완충용액을 충진제의 10배의 액량으로 흘려주어 비특이적 결합 가능 단백질을 제거하였다. 이어서, 250 mM 이미다졸 및 300 mM NaCl을 함유하는 50 mM NaH₂PO₄(pH8.0) 완충용액을 추가로 흘려주어 용출 정제한 다음, 50 mM Tris-HCl(pH 8.0)완충용액으로 투석하여 효소 특성 분석을 위하여 각각의 정제효소를 확보하였다.

실시예 4. 변이효소 특성 비교 평가

상기 실시예 3-2에서 확보한 재조합 변이효소들의 과당-4-에피머화 활성을 측정하기 위하여, 30 중량% 과당에 50 mM Tris-HCl(pH 8.0), 3 mM MnSO₄ 및 각 5 mg/mL 를 첨가하여 60℃에서 2시간 동안 반응시켰다.

그 결과, 야생형(KO)의 전환활성이 4.7%로, 본 출원의 변이주의 모두 과당-4-에피머화 활성이 있으며 특히 야생형 보다 활성이 증가하였으며, 구체적인 결과는 하기 표 4와 같다.

변이위치	기존서열	변이서열	상대활성(%)
20	C	R	193
23	S	C	207
26	S	A	100
		T	173
		V	100
45	T	A	141
		Q	185
		V	179
		K	197
		E	203
		M	241
51	T	V	163
51	T	P	163
53	N	W	141
		F	188
		C	108
		G	163
		S	200
		T	238
		P	217
63	G	A	126
63	G	E	100
86	K	R	147
		V	127
		M	297
		L	161
		G	111
91	G	Y	136
91	G	W	131
133	R	P	133
		N	143
		Q	178
		L	285
144	P	A	108
		I	113
		V	117
		F	248
		S	222
151	A	G	140
172	L	T	142
172	L	A	120
173	R	A	193
		T	169
		E	183
		V	129
		D	163
174	P	K	239
		R	132
		D	171
		V	130
		F	130
181	D	R	108
		A	115
		K	112
191	E	T	159
		R	140
		G	129
		V	175
		S	152
		L	187
		I	179
		A	159
266	E	Y	116
294	A	G	116
298	A	G	200
316	D	L	157
		V	152
		N	194
		P	193
		R	133
		M	137
		T	129
317	T	V	122
		I	272
		D	136
		H	159
		R	182
		S	166
323	N	G	190
323	N	L	181
336	P	A	107
336	P	R	366
347	E	S	106
		G	131
		N	134
		P	123
359	L	V	153
385	K	R	133
386	E	I	175
		V	142
		L	134
		D	133
		H	137
		S	94
388	P	V	120
		D	206
		S	219
		R	277
		I	205
		G	324
		T	120
389	L	K	336
		G	282
		R	288
		V	212
		D	263
		S	222
		E	291
		M	261
410	K	V	163
		L	223
		A	152
		T	130
414	S	P	142
414	S	Q	250
KO			100

상기와 같은 결과를 통해, 본 출원의 변이주는 과당-4-에피머화 활성이 야생형보다 증가함을 알 수 있었다.

실시예 5. 변이효소 제작 및 활성, 안정성 개량 변이효소 선별

상기 실시예 3-2에서 확보한 타겟 부위(8, 25, 29, 97, 110, 146, 155, 167, 239, 263, 285, 308, 315, 367, 417번 위치) 15곳의 단일부위 포화 돌연변이 유전체 및 효소를 제작하였다.

실시예 5-1. 포화 돌연변이 (saturation mutagenesis)

야생형 효소 유전자의 대장균 BL21(DE3) 발현을 위해 제작된 재조합발현벡터 pBT7-C-His-KO (야생형의 C-말단에 6xHis-tag이 결합한 재조합효소를 발현함)를 변이주 라이브러리 제작을 위한 포화돌연변이법의 주형(template)으로 사용하였다. 변이분포 다양성 및 변이체 수율 등을 고려하여 역방향(inversed) PCR 기반 포화 돌연변이법을 사용하였고(2014. Anal. Biochem. 449:90-98), 제작된 변이주 라이브러리의 스크리닝 규모를 최소화(포화돌연변이 시 도입되는 코돈 수를 최소화함)하기 위해 종결코돈을 배제하고, 대장균의 희귀코돈(rare codons)이 최소화된 NDT/VMA/ATG/TGG 혼합 프라이머를(2012. Biotechniques 52:149-158) 디자인하여 사용하였다. 구체적으로, 각각의 부위의 앞쪽염기 15bp와 치환염기3bp, 뒤쪽염기 15bp로 총 길이는 33bp로 하여 프라이머를 제작 이용하였다. PCR 조건은 94 ℃에서 2분간 변성 후, 94℃ 30초 변성, 60℃ 30초 어닐링, 72℃ 10분 신장을 30회 반복한 후, 72℃에서 60분간 신장반응을 수행하였다. 선정 아미노산 부위별로 포화돌연변이 라이브러리를 제작 후 라이브러리별 변이주를 무작위 선발(<변이 11개)하고 염기서열을 분석하여 아미노산 변이분포를 평가하였다(표 5). 이의 분석결과를 기반으로 라이브러리별 서열 범위(sequence coverage) 90% 이상의 스크리닝 규모를 설정하였다(2003. Nucleic Acids Res. 15;31:e30)

변이위치

D8

A

E

H

L

P

Q

V

P

C25

A

V

S

D

H

F

L

G

N

M

E

Q

P

K

Y

R

W

I

T

R29

W

C

K

E

Q

A

S

V

L

P

N97

K

L

E

Y

P

N110

Y

N146

L

P

H

G

A155

G

E167

V

R

A

G

T

D

N239

V

G

A

E

K

W

L

P

I263

A

Q

L

K

E

G285

M

V

E

H

D

Q

Y

L

S308

V

A

D

I

V

H

L

R

W

Y315

D

V

A

P

H

L

N367

A

G

L

R

I

V

K417

G

V

S

P

R

D

L

A

M

P

실시예 5-2. 활성 및 열안정성 개량 변이효소 제작

단위활성 및 열안정성이 개량된 단일부위에 대한 변이효소 및 이들이 조합된 다중부위에 대한 변이효소에 대해 과당-4-에피머화의 상대활성을 평가하기 위하여, 상기 2-1에서 제조한 포화돌연변이 라이브러리 유전자를 E. coli BL21(DE3) 에 형질전환한 후 각각의 형질전환 미생물을 앰피실린(ampicillin) 항생제가 포함된 LB 액체배지 5 mL를 포함하는 배양 튜브에 접종하고, 600 nm에서 흡광도가 2.0이 될 때까지 37℃진탕 배양기에서 종균 배양을 하였다. 상기 종균 배양결과 얻은 배양액을 LB와 단백질 발현조절인자인 유당이 함유된 액체배지를 포함하는 배양 플라스크에 접종하여 본 배양을 진행하였다. 상기 종균 배양 및 본 배양은 교반속도 180 rpm 및 37℃조건에서 실시하였다. 다음, 상기 배양액을 8,000 rpm으로 4℃에서 20분 동안 원심분리 후 균체를 회수하였다. 상기 회수된 균체를 50 mM Tris-HCl(pH8.0) 완충용액으로 2회 세척하고, 10 mM 이미다졸(imidazole)과 300 mM NaCl이 포함되어 있는 50 mM NaH2PO4(pH 8.0) 완충용액에 재현탁하였다. 상기 재현탁된 균체를 세포파쇄기(sonicator)를 이용하여 파쇄하고, 13,000 rpm으로 4℃에서 20분 동안 원심분리 후 상등액만을 취하였다. 상기 상등액을 His-taq 친화 크로마토그래피를 사용하여 정제하고, 20 mM 이미다졸 및 300 mM NaCl을 함유하는 50 mM NaH₂PO₄(pH 8.0) 완충용액을 충진제의 10배의 액량으로 흘려주어 비특이적 결합 가능 단백질을 제거하였다. 이어서, 250 mM 이미다졸 및 300 mM NaCl을 함유하는 50 mM NaH₂PO₄(pH8.0) 완충용액을 추가로 흘려주어 용출 정제한 다음, 50 mM Tris-HCl(pH 8.0)완충용액으로 투석하여 효소 특성 분석을 위하여 각각의 정제효소를 확보하였다.

실시예 6. 활성, 안정성 개량 변이효소 특성 비교 평가

상기 실시예 5-2에서 확보한 재조합 변이효소들의 과당-4-에피머화 활성 측정하기 위하여, 30 중량% 과당에 50 mM Tris-HCl(pH 8.0), 3 mM MnSO4 및 각 5 mg/mL 를 첨가하여 60℃에서 2시간 동안 반응시켰다. 아울러 확보한 재조합 변이효소들의 과당-4-에피머화 안정성 측정하기 위하여, 각 5 mg/mL 를 60℃에서 최소 19시간에서 최대 90시간 동안 놓아둔 후, ice에 5분간 방치한 후, 30 중량% 과당에 50 mM Tris-HCl(pH 8.0), 3 mM MnSO4 를 첨가하여 반응시켰다.

그 결과, 본 출원의 변이주 모두 과당-4-에피머화 전환 활성 및 안정성이 야생형 보다 증가하였으며, 구체적인 결과로서, 활성 결과는 하기 표 6과 같으며, 안정성 결과는 도 2 및 도 3과 같다.

변이위치	기존서열	변이서열	상대활성(%)
8	D	A	360
		E	357
		H	379
		L	364
		P	484
		Q	340
		V	263
25	C	A	152
		V	142
		S	165
29	R	W	399
		C	330
		K	273
		E	264
		Q	279
		A	267
		S	383
		V	333
		L	331
		P	287
97	N	K	110
		L	458
		E	165
		Y	528
		P	110
110	N	Y	303
146	N	L	433
		P	439
		H	461
		G	456
155	A	G	156
167	E	V	261
		R	253
		A	346
		G	322
		T	193
		D	490
239	N	V	112
		G	242
		A	226
		E	132
		K	215
		W	102
		L	169
		P	139
263	I	A	289
		Q	328
		L	211
		K	244
		E	189
285	G	M	170
		V	170
		E	141
		H	304
		D	259
		Q	181
		Y	204
		L	200
308	S	V	211
		A	172
		D	206
		I	206
		H	206
		L	222
		R	211
		W	228
315	Y	D	137
		V	133
		A	149
		P	153
		H	137
		L	133
367	N	A	234
		G	285
		L	238
		R	255
		I	300
		V	234
417	K	G	236
		V	274
		S	309
		P	258
		R	244
		D	287
		L	288
		A	321
		M	206
		P	236
KO(WT)			100

본 발명자들은 E.coil BL21(DE3) 균주에 형질전환하여 E.coil BL21(DE3)/CJ_KO_F4E_M1(C25S), E.coil BL21(DE3)/CJ_KO_F4E_M2(T51V), E.coil BL21(DE3)/CJ_KO_F4E_M5(T317Y)이라 명명된 형질전환체(형질전환 미생물)을 각각 제조하고, 상기 형질전환체를 부다페스트 조약 하에 국제기탁기관인 한국미생물보존센터 (KCCM)에 2018년 9월 19일자에 기탁하여 수탁번호 KCCM12320P(E.coil BL21(DE3)/CJ_KO_F4E_M1), KCCM12321P(E.coil BL21(DE3)/CJ_KO_F4E_M2), KCCM12324P(E.coil BL21(DE3)/CJ_KO_F4E_M5)로 각각 기탁하였다.

이상의 설명으로부터, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

한국미생물보존센터(국외)

KCCM12320P

20180919

한국미생물보존센터(국외)

KCCM12321P

20180919

한국미생물보존센터(국외)

KCCM12324P

20180919

<110> CJ CHEILJEDANG CORPORATION <120> A Novel Fructose C4 epimerases and Preparation Method for producing Tagatose using the same <130> KPA181088-KR-P3 <150> KR 10-2018-0116609 <151> 2018-09-28 <150> KR 10-2018-0117237 <151> 2018-10-01 <160> 24 <170> KoPatentIn 3.0 <210> 1 <211> 435 <212> PRT <213> Unknown <220> <223> Kosmotoga olearia <220> <221> PEPTIDE <222> (1)..(435) <223> Tagatose-bisphosphate aldolase <400> 1 Met Lys Lys His Pro Leu Gln Asp Ile Val Ser Leu Gln Lys Gln Gly 1 5 10 15 Ile Pro Lys Gly Val Phe Ser Val Cys Ser Ala Asn Arg Phe Val Ile 20 25 30 Glu Thr Thr Leu Glu Tyr Ala Lys Met Lys Gly Thr Thr Val Leu Ile 35 40 45 Glu Ala Thr Cys Asn Gln Val Asn Gln Phe Gly Gly Tyr Thr Gly Met 50 55 60 Thr Pro Ala Asp Phe Arg Glu Met Val Phe Ser Ile Ala Glu Asp Ile 65 70 75 80 Gly Leu Pro Lys Asn Lys Ile Ile Leu Gly Gly Asp His Leu Gly Pro 85 90 95 Asn Pro Trp Lys Gly Gln Pro Ser Asp Gln Ala Met Arg Asn Ala Ile 100 105 110 Glu Met Ile Arg Glu Tyr Ala Lys Ala Gly Phe Thr Lys Leu His Leu 115 120 125 Asp Ala Ser Met Arg Leu Ala Asp Asp Pro Gly Asn Glu Asn Glu Pro 130 135 140 Leu Asn Pro Glu Val Ile Ala Glu Arg Thr Ala Leu Leu Cys Leu Glu 145 150 155 160 Ala Glu Arg Ala Phe Lys Glu Ser Ala Gly Ser Leu Arg Pro Val Tyr 165 170 175 Val Ile Gly Thr Asp Val Pro Pro Pro Gly Gly Ala Gln Asn Glu Gly 180 185 190 Lys Ser Ile His Val Thr Ser Val Gln Asp Phe Glu Arg Thr Val Glu 195 200 205 Leu Thr Lys Lys Ala Phe Phe Asp His Gly Leu Tyr Glu Ala Trp Gly 210 215 220 Arg Val Ile Ala Val Val Val Gln Pro Gly Val Glu Phe Gly Asn Glu 225 230 235 240 His Ile Phe Glu Tyr Asp Arg Asn Arg Ala Arg Glu Leu Thr Glu Ala 245 250 255 Ile Lys Lys His Pro Asn Ile Val Phe Glu Gly His Ser Thr Asp Tyr 260 265 270 Gln Thr Ala Lys Ala Leu Lys Glu Met Val Glu Asp Gly Val Ala Ile 275 280 285 Leu Lys Val Gly Pro Ala Leu Thr Phe Ala Leu Arg Glu Ala Phe Phe 290 295 300 Ala Leu Ser Ser Ile Glu Lys Glu Leu Phe Tyr Asp Thr Pro Gly Leu 305 310 315 320 Cys Ser Asn Phe Val Glu Val Val Glu Arg Ala Met Leu Asp Asn Pro 325 330 335 Lys His Trp Glu Lys Tyr Tyr Gln Gly Glu Glu Arg Glu Asn Arg Leu 340 345 350 Ala Arg Lys Tyr Ser Phe Leu Asp Arg Leu Arg Tyr Tyr Trp Asn Leu 355 360 365 Pro Glu Val Arg Thr Ala Val Asn Lys Leu Ile Thr Asn Leu Glu Thr 370 375 380 Lys Glu Ile Pro Leu Thr Leu Ile Ser Gln Phe Met Pro Met Gln Tyr 385 390 395 400 Gln Lys Ile Arg Asn Gly Leu Leu Arg Lys Asp Pro Ile Ser Leu Ile 405 410 415 Lys Asp Arg Ile Thr Leu Val Leu Asp Asp Tyr Tyr Phe Ala Thr His 420 425 430 Pro Glu Cys 435 <210> 2 <211> 1308 <212> DNA <213> Unknown <220> <223> Kosmotoga olearia <220> <221> gene <222> (1)..(1308) <223> Tagatose-bisphosphate aldolase <400> 2 atgaaaaaac atcctcttca ggacattgtt tcattgcaaa aacagggaat acccaaaggg 60 gttttctctg tatgtagtgc caatagattt gttattgaaa ccactctgga atatgcgaag 120 atgaaaggga caacggttct tatagaggcc acctgcaatc aggtaaacca gttcggtggc 180 tacaccggta tgactcctgc tgatttcaga gaaatggttt tttctatcgc tgaggatatt 240 ggacttccca aaaataaaat catccttggt ggcgaccatc ttggcccaaa tccctggaag 300 ggtcagccgt cagatcaggc tatgcgtaac gccattgaaa tgattcgaga atacgctaaa 360 gctgggttta ccaagcttca tctggatgcc agcatgcgtc ttgcagacga tccggggaac 420 gaaaacgagc cgctgaaccc ggaagttata gcggaaagaa cagctcttct ctgtcttgaa 480 gccgagaggg cttttaaaga atccgccggt tctctccggc ctgtttacgt tattggtacg 540 gatgttccgc caccgggtgg agcgcaaaac gaaggtaaat cgattcatgt aaccagtgtt 600 caggattttg agcgtaccgt tgagttgacc aaaaaggcat ttttcgacca tggtttgtat 660 gaagcctggg gaagggtgat tgcggttgtt gtgcaaccgg gagtagaatt cgggaatgaa 720 catatattcg aatatgatag aaatcgagcg agagaactta ctgaggcgat aaaaaagcat 780 ccaaatatag tttttgaagg tcactcgaca gattatcaaa cggcaaaagc attgaaagaa 840 atggtagaag acggtgtagc catactcaag gttgggccag ctctaacatt tgcgctcaga 900 gaggcttttt ttgcgttgag cagcattgaa aaagagttat tttatgatac acccgggctt 960 tgttcaaact ttgttgaagt tgtcgagaga gcgatgcttg acaatccaaa acattgggaa 1020 aaatattacc agggagaaga gagagaaaat agattagccc gtaaatacag ctttctcgat 1080 cgcttgaggt attactggaa tcttcctgag gttagaacag cggtgaataa gctgataacc 1140 aaccttgaaa caaaagaaat cccgttaacg cttataagcc agttcatgcc gatgcagtac 1200 caaaaaatca gaaacggttt gctaagaaag gatccaataa gccttataaa agatcgaatt 1260 acccttgttc ttgatgacta ctatttcgca actcaccctg aatgttga 1308 <210> 3 <211> 434 <212> PRT <213> Unknown <220> <223> Thermoanaerobacterium thermosaccharolyticum <220> <221> PEPTIDE <222> (1)..(434) <223> Tagatose-bisphosphate aldolase <400> 3 Met Ala Lys Glu His Pro Leu Lys Glu Leu Val Asn Lys Gln Lys Ser 1 5 10 15 Gly Ile Ser Glu Gly Ile Val Ser Ile Cys Ser Ser Asn Glu Phe Val 20 25 30 Ile Glu Ala Ser Met Glu Arg Ala Leu Thr Asn Gly Asp Tyr Val Leu 35 40 45 Ile Glu Ser Thr Ala Asn Gln Val Asn Gln Tyr Gly Gly Tyr Ile Gly 50 55 60 Met Thr Pro Ile Glu Phe Lys Lys Phe Val Phe Ser Ile Ala Lys Lys 65 70 75 80 Val Asp Phe Pro Leu Asp Lys Leu Ile Leu Gly Gly Asp His Leu Gly 85 90 95 Pro Leu Ile Trp Lys Asn Glu Ser Ser Asn Leu Ala Leu Ala Lys Ala 100 105 110 Ser Glu Leu Ile Lys Glu Tyr Val Leu Ala Gly Tyr Thr Lys Ile His 115 120 125 Ile Asp Thr Ser Met Arg Leu Lys Asp Asp Thr Asp Phe Asn Thr Glu 130 135 140 Ile Ile Ala Gln Arg Ser Ala Val Leu Leu Lys Ala Ala Glu Asn Ala 145 150 155 160 Tyr Met Glu Leu Asn Lys Asn Asn Lys Asn Val Leu His Pro Val Tyr 165 170 175 Val Ile Gly Ser Glu Val Pro Ile Pro Gly Gly Ser Gln Gly Ser Asp 180 185 190 Glu Ser Leu Gln Ile Thr Asp Ala Lys Asp Phe Glu Asn Thr Val Glu 195 200 205 Ile Phe Lys Asp Val Phe Ser Lys Tyr Gly Leu Ile Asn Glu Trp Glu 210 215 220 Asn Ile Val Ala Phe Val Val Gln Pro Gly Val Glu Phe Gly Asn Asp 225 230 235 240 Phe Val His Glu Tyr Lys Arg Asp Glu Ala Lys Glu Leu Thr Asp Ala 245 250 255 Leu Lys Asn Tyr Lys Thr Phe Val Phe Glu Gly His Ser Thr Asp Tyr 260 265 270 Gln Thr Arg Glu Ser Leu Lys Gln Met Val Glu Asp Gly Ile Ala Ile 275 280 285 Leu Lys Val Gly Pro Ala Leu Thr Phe Ala Leu Arg Glu Ala Leu Ile 290 295 300 Ala Leu Asn Asn Ile Glu Asn Glu Leu Leu Asn Asn Val Asp Ser Ile 305 310 315 320 Lys Leu Ser Asn Phe Thr Asn Val Leu Val Ser Glu Met Ile Asn Asn 325 330 335 Pro Glu His Trp Lys Asn His Tyr Phe Gly Asp Asp Ala Arg Lys Lys 340 345 350 Phe Leu Cys Lys Tyr Ser Tyr Ser Asp Arg Cys Arg Tyr Tyr Leu Pro 355 360 365 Thr Arg Asn Val Lys Asn Ser Leu Asn Leu Leu Ile Arg Asn Leu Glu 370 375 380 Asn Val Lys Ile Pro Met Thr Leu Ile Ser Gln Phe Met Pro Leu Gln 385 390 395 400 Tyr Asp Asn Ile Arg Arg Gly Leu Ile Lys Asn Glu Pro Ile Ser Leu 405 410 415 Ile Lys Asn Ala Ile Met Asn Arg Leu Asn Asp Tyr Tyr Tyr Ala Ile 420 425 430 Lys Pro <210> 4 <211> 1305 <212> DNA <213> Unknown <220> <223> Thermoanaerobacterium thermosaccharolyticum <220> <221> gene <222> (1)..(1305) <223> Tagatose-bisphosphate aldolase <400> 4 atggctaaag aacatccatt aaaggaatta gtaaataaac aaaaaagtgg tatatccgag 60 ggtatagttt ctatttgtag ttcaaatgaa tttgttattg aagcatctat ggagcgtgca 120 ttaacaaatg gtgattatgt tttaattgaa tcaacagcaa atcaggtgaa tcaatatggt 180 ggatatattg gtatgacacc tattgagttt aaaaaatttg tattttcaat agctaaaaaa 240 gtagattttc cattagataa attgattctt ggtggggatc atttaggccc attaatatgg 300 aaaaatgaat ctagtaattt ggcgttagca aaagcatccg agcttattaa agaatatgta 360 ttagccggat atactaaaat tcatatagac actagtatgc ggctaaaaga tgatactgat 420 tttaatacag aaattattgc tcaaagaagt gcagtattgt taaaggcagc ggaaaatgca 480 tatatggaat tgaataaaaa taataaaaat gttttacatc ctgtctatgt tataggaagt 540 gaagtcccaa tacctggggg cagccaaggc agtgatgaat cgctccaaat tactgatgct 600 aaggattttg aaaatacagt tgaaatattt aaagatgttt tttcaaaata tggattaatt 660 aatgagtggg aaaacatagt agcatttgtt gttcaaccag gagttgagtt tggaaatgat 720 tttgtacatg aatataaacg tgatgaagca aaagaattaa cagatgcact taaaaattat 780 aaaacatttg tttttgaagg acattctact gattatcaaa cacgtgaatc attaaaacaa 840 atggtggaag atggcattgc aattttaaaa gttggacctg cattaacatt tgcactacgt 900 gaagccttaa tagcactaaa taatatagaa aatgagttgc ttaataatgt agatagtata 960 aaattatcaa attttactaa tgtactcgta agtgaaatga tcaataaccc cgaacattgg 1020 aaaaatcatt attttggtga tgatgcaagg aaaaagtttc tatgtaaata tagttattcg 1080 gatagatgta ggtactattt accaactaga aatgtaaaaa actcattaaa tcttcttatt 1140 agaaatctag aaaatgtgaa aataccaatg acattaataa gtcaatttat gcctttgcaa 1200 tatgataata ttagaagagg actcataaaa aatgaaccaa tttctttaat taaaaatgca 1260 ataatgaacc gacttaatga ctattattat gctataaagc cgtaa 1305 <210> 5 <211> 434 <212> PRT <213> Unknown <220> <223> Pseudoalteromonas sp. H103 <220> <221> PEPTIDE <222> (1)..(434) <223> Tagatose-bisphosphate aldolase <400> 5 Met Arg Gly Asp Lys Arg Val Thr Thr Asp Phe Leu Lys Glu Ile Val 1 5 10 15 Gln Gln Asn Arg Ala Gly Gly Ser Arg Gly Ile Tyr Ser Val Cys Ser 20 25 30 Ala His Arg Leu Val Ile Glu Ala Ser Met Gln Gln Ala Lys Ser Asp 35 40 45 Gly Ser Pro Leu Leu Val Glu Ala Thr Cys Asn Gln Val Asn His Glu 50 55 60 Gly Gly Tyr Thr Gly Met Thr Pro Ser Asp Phe Cys Lys Tyr Val Leu 65 70 75 80 Asp Ile Ala Lys Glu Val Gly Phe Ser Gln Glu Gln Leu Ile Leu Gly 85 90 95 Gly Asp His Leu Gly Pro Asn Pro Trp Thr Asp Leu Pro Ala Ala Gln 100 105 110 Ala Met Glu Ala Ala Lys Lys Met Val Ala Asp Tyr Val Ser Ala Gly 115 120 125 Phe Ser Lys Ile His Leu Asp Ala Ser Met Ala Cys Ala Asp Asp Val 130 135 140 Glu Pro Leu Ala Asp Glu Val Ile Ala Gln Arg Ala Thr Ile Leu Cys 145 150 155 160 Ala Ala Gly Glu Ala Ala Val Ser Asp Lys Asn Ala Ala Pro Met Tyr 165 170 175 Ile Ile Gly Thr Glu Val Pro Val Pro Gly Gly Ala Gln Glu Asp Leu 180 185 190 His Glu Leu Ala Thr Thr Asn Ile Asp Asp Leu Lys Gln Thr Ile Lys 195 200 205 Thr His Lys Ala Lys Phe Ser Glu Asn Gly Leu Gln Asp Ala Trp Asp 210 215 220 Arg Val Ile Gly Val Val Val Gln Pro Gly Val Glu Phe Asp His Ala 225 230 235 240 Met Val Ile Gly Tyr Gln Ser Glu Lys Ala Gln Thr Leu Ser Lys Thr 245 250 255 Ile Leu Asp Phe Asp Asn Leu Val Tyr Glu Ala His Ser Thr Asp Tyr 260 265 270 Gln Thr Glu Thr Ala Leu Thr Asn Leu Val Asn Asp His Phe Ala Ile 275 280 285 Leu Lys Val Gly Pro Gly Leu Thr Tyr Ala Ala Arg Glu Ala Leu Phe 290 295 300 Ala Leu Ser Tyr Ile Glu Gln Glu Trp Ile Thr Asn Lys Pro Leu Ser 305 310 315 320 Asn Leu Arg Gln Val Leu Glu Glu Arg Met Leu Glu Asn Pro Lys Asn 325 330 335 Trp Ala Lys Tyr Tyr Thr Gly Thr Glu Gln Glu Gln Ala Phe Ala Arg 340 345 350 Lys Tyr Ser Phe Ser Asp Arg Ser Arg Tyr Tyr Trp Ala Asp Pro Ile 355 360 365 Val Asp Gln Ser Val Gln Thr Leu Ile Asn Asn Leu Thr Glu Gln Pro 370 375 380 Ala Pro Met Thr Leu Leu Ser Gln Phe Met Pro Leu Gln Tyr Ala Ala 385 390 395 400 Phe Arg Ala Gly Gln Leu Asn Asn Asp Pro Leu Ser Leu Ile Arg His 405 410 415 Trp Ile Gln Glu Val Val Ser Thr Tyr Ala Arg Ala Ser Gly Leu Ala 420 425 430 Val Lys <210> 6 <211> 1305 <212> DNA <213> Unknown <220> <223> Pseudoalteromonas sp. H103 <220> <221> gene <222> (1)..(1305) <223> Tagatose-bisphosphate aldolase <400> 6 atcagaggag ataaaagggt gactacagat tttctgaaag aaattgttca acaaaacaga 60 gccggtggta gcagaggtat ttactctgtt tgttctgcgc atcgccttgt tattgaagcg 120 tctatgcagc aagccaaaag cgatggctca ccactgttag tagaggcaac atgtaatcag 180 gttaatcacg aaggtggtta taccggtatg accccaagcg acttttgcaa atacgtgtta 240 gatattgcaa aagaagtggg cttttcccaa gagcaactta ttttaggggg cgaccactta 300 gggcctaacc cgtggactga cctaccagct gcacaggcaa tggaagcggc caaaaaaatg 360 gttgctgatt acgtaagtgc gggcttttca aaaatacatt tagatgcaag catggcatgt 420 gcagatgatg tagagccgct tgctgatgag gttatagcgc agcgcgccac tattttatgt 480 gctgccggcg aagctgctgt tagcgataaa aatgcagccc caatgtatat tattggtacc 540 gaagtgccgg taccaggtgg cgcacaagaa gatttacacg aacttgctac aaccaatatt 600 gatgatttaa aacaaaccat taaaacccat aaagcaaaat ttagcgaaaa cggtttgcaa 660 gacgcatggg atagagtaat tggtgtagta gtgcagcctg gtgttgagtt tgaccacgcg 720 atggtaattg gctatcaaag cgaaaaagca caaacactaa gtaaaactat tttagatttt 780 gataatttgg tttatgaagc gcattcaacc gattatcaaa ccgaaacagc gttaactaac 840 ttggttaacg accactttgc tattttaaaa gtgggcccag ggcttactta tgcagcgcgc 900 gaagcgttgt ttgcacttag ttatattgag caagagtgga taaccaataa gcctctttct 960 aatttgcgcc aagtgcttga agagcgcatg ctcgaaaacc ctaaaaactg ggctaagtat 1020 tacacaggta cagagcaaga gcaggccttt gcacgaaaat atagctttag cgatagatcg 1080 cgttactatt gggccgatcc tattgttgat caaagtgttc aaacactcat taataactta 1140 actgagcagc cagcgccaat gaccttgctg agtcaattta tgccacttca atatgcggca 1200 tttcgtgcag gacaattaaa taacgatccg ctttctttga tcagacactg gatccaagaa 1260 gttgtatcaa cctacgcccg cgctagcgga cttgcagtaa aatag 1305 <210> 7 <211> 426 <212> PRT <213> Unknown <220> <223> Thermanaerothrix daxensis <220> <221> PEPTIDE <222> (1)..(426) <223> Tagatose-biphosphate aldolase <400> 7 Met Val Thr Tyr Leu Asp Phe Val Val Leu Ser His Arg Phe Arg Arg 1 5 10 15 Pro Leu Gly Ile Thr Ser Val Cys Ser Ala His Pro Tyr Val Ile Glu 20 25 30 Ala Ala Leu Arg Asn Gly Met Met Thr His Thr Pro Val Leu Ile Glu 35 40 45 Ala Thr Cys Asn Gln Val Asn Gln Tyr Gly Gly Tyr Thr Gly Met Thr 50 55 60 Pro Ala Asp Phe Val Arg Tyr Val Glu Asn Ile Ala Ala Arg Val Gly 65 70 75 80 Ser Pro Arg Glu Asn Leu Leu Leu Gly Gly Asp His Leu Gly Pro Leu 85 90 95 Val Trp Ala His Glu Pro Ala Glu Ser Ala Met Glu Lys Ala Arg Ala 100 105 110 Leu Val Lys Ala Tyr Val Glu Ala Gly Phe Arg Lys Ile His Leu Asp 115 120 125 Cys Ser Met Pro Cys Ala Asp Asp Arg Asp Phe Ser Pro Lys Val Ile 130 135 140 Ala Glu Arg Ala Ala Glu Leu Ala Gln Val Ala Glu Ser Thr Cys Asp 145 150 155 160 Val Met Gly Leu Pro Leu Pro Asn Tyr Val Ile Gly Thr Glu Val Pro 165 170 175 Pro Ala Gly Gly Ala Lys Ala Glu Ala Glu Thr Leu Arg Val Thr Arg 180 185 190 Pro Glu Asp Ala Ala Glu Thr Ile Ala Leu Thr Arg Ala Ala Phe Phe 195 200 205 Lys Arg Gly Leu Glu Ser Ala Trp Glu Arg Val Val Ala Leu Val Val 210 215 220 Gln Pro Gly Val Glu Phe Gly Asp His Gln Ile His Val Tyr Arg Arg 225 230 235 240 Glu Glu Ala Gln Ala Leu Ser Arg Phe Ile Glu Ser Gln Pro Gly Leu 245 250 255 Val Tyr Glu Ala His Ser Thr Asp Tyr Gln Pro Arg Asp Ala Leu Arg 260 265 270 Ala Leu Val Glu Asp His Phe Ala Ile Leu Lys Val Gly Pro Ala Leu 275 280 285 Thr Phe Ala Phe Arg Glu Ala Val Phe Ala Leu Ala Ser Ile Glu Asp 290 295 300 Trp Val Cys Asp Ser Pro Ser Arg Ile Leu Glu Val Leu Glu Thr Thr 305 310 315 320 Met Leu Ala Asn Pro Val Tyr Trp Gln Lys Tyr Tyr Leu Gly Asp Glu 325 330 335 Arg Ala Arg Arg Ile Ala Arg Gly Tyr Ser Phe Ser Asp Arg Ile Arg 340 345 350 Tyr Tyr Trp Ser Ala Pro Ala Val Glu Gln Ala Phe Glu Arg Leu Arg 355 360 365 Ala Asn Leu Asn Arg Val Ser Ile Pro Leu Val Leu Leu Ser Gln Tyr 370 375 380 Leu Pro Asp Gln Tyr Arg Lys Val Arg Asp Gly Arg Leu Pro Asn Gln 385 390 395 400 Phe Asp Ala Leu Ile Leu Asp Lys Ile Gln Ala Val Leu Glu Asp Tyr 405 410 415 Asn Val Ala Cys Gly Val Arg Ile Gly Glu 420 425 <210> 8 <211> 1281 <212> DNA <213> Unknown <220> <223> Thermanaerothrix daxensis <220> <221> gene <222> (1)..(1281) <223> Tagatose-biphosphate aldolase <400> 8 atggttacct atttggattt tgtggtgctt tctcatcgtt ttaggcgccc cctgggcatt 60 acctcagtgt gttcggcgca tccgtatgtc attgaggcgg cgctgcgtaa tgggatgatg 120 acccatacac cggtcctaat cgaggccact tgcaatcaag tcaatcagta tgggggatat 180 acggggatga ccccggcaga tttcgtgcgg tatgtggaga atattgctgc acgggtaggc 240 tctccacgtg aaaacctcct tttgggtggc gatcatttgg gacccctggt ctgggctcat 300 gaacctgctg agagtgccat ggaaaaagct cgagctctgg tcaaagccta tgtagaggct 360 ggttttcgca aaattcatct ggattgctca atgccctgtg cggatgatcg cgatttttct 420 ccaaaggtca ttgctgagcg ggcagccgaa ttggctcagg tggcagagtc aacttgtgat 480 gttatgggct tgcccttgcc caactacgtc attggaaccg aggtgccccc agcaggtggc 540 gccaaggctg aagccgaaac tttgagggta acccgtccgg aggatgcagc ggagaccatt 600 gcactgacca gagcggcttt tttcaagcga ggtttagagt ctgcctggga acgtgtagtg 660 gcgttagtag tgcaacccgg tgttgaattc ggagatcatc agattcatgt ttaccgccgt 720 gaggaagcgc aggctctttc ccgcttcatt gaaagccagc ccggcttagt ctatgaggct 780 cactccaccg actatcagcc ccgtgatgcg ctgcgggctt tggttgagga tcatttcgca 840 atcctgaagg tgggtccggc gctaaccttt gcttttcgtg aggcagtttt tgccctggcc 900 agtatcgagg attgggtatg cgattcaccc agtcgcatcc tggaagtttt ggaaacaacc 960 atgctggcca acccggtcta ctggcaaaag tattacttgg gcgatgagcg agcgcgtcgg 1020 attgccagag ggtatagttt cagcgatcgc attcgttatt attggagtgc accagcggtt 1080 gaacaggcct ttgaacgctt gcgggcaaat ctgaatcgtg tttcgatccc ccttgtcctt 1140 ctcagtcagt atttgccgga tcaatatcgc aaagtgcggg atggacggct gcctaaccag 1200 tttgatgctt tgattctgga taaaatccaa gccgtactgg aagactacaa tgtggcgtgt 1260 ggtgtgagga taggggagtg a 1281 <210> 9 <211> 431 <212> PRT <213> Unknown <220> <223> Acidobacteriales bacterium <220> <221> PEPTIDE <222> (1)..(431) <223> Tagatose-biphosphate aldolase <400> 9 Met Ser Asp Asn Leu Gln Val Phe Leu Arg Glu Ser Arg Gly Arg Arg 1 5 10 15 Gly Ile Tyr Ser Val Cys Ser Ala His Pro Arg Val Ile Glu Ala Ala 20 25 30 Met Arg Gln Ala Gly Ala Asp Gly Thr His Leu Leu Leu Glu Ala Thr 35 40 45 Ser Asn Gln Val Asn Gln Ala Gly Gly Tyr Thr Gly Met Thr Pro Ala 50 55 60 Met Phe Arg Asp Tyr Val Tyr Asp Ile Ala Gln Glu Ile Gly Phe Asp 65 70 75 80 Arg Ser Arg Leu Ile Leu Gly Gly Asp His Leu Gly Pro Asn Pro Trp 85 90 95 Gln Gln Leu Asp Ala Ser Thr Ala Met Gln Tyr Ala Glu Glu Met Val 100 105 110 Arg Leu Tyr Ile Glu Ala Gly Phe Thr Lys Ile His Leu Asp Ala Ser 115 120 125 Met Arg Cys Ala Asp Asp Ala Ala Ile Val Pro Asp Glu Val Met Ala 130 135 140 Gly Arg Ala Ala Ala Leu Cys Ser Ala Ala Glu Ser Ala Arg Ala Arg 145 150 155 160 Leu Gly Leu Ala Pro Val Val Tyr Val Ile Gly Thr Glu Val Pro Thr 165 170 175 Pro Gly Gly Ala Ser His Ala Leu Asn Thr Leu Glu Val Thr Thr Arg 180 185 190 Glu Ala Val Glu His Thr Leu Ser Val His Arg Lys Ala Phe His Asp 195 200 205 Ala Gly Leu Asp Ala Ala Trp Gln Arg Val Ile Ala Val Val Val Gln 210 215 220 Pro Gly Val Glu Phe Asp His Asp Ser Val Val Asp Tyr Asp Ala Ala 225 230 235 240 Lys Ala Gly His Leu Gln Glu Phe Leu Gln Ala His Pro Glu Leu Val 245 250 255 Met Glu Ala His Ser Ser Asp Tyr Gln Lys Pro Gln Ala Tyr Lys Glu 260 265 270 Leu Val Arg Asp Gly Phe Ala Ile Leu Lys Val Gly Pro Ala Leu Thr 275 280 285 Phe Ala Leu Arg Glu Met Leu Tyr Ala Leu Ala Ala Ile Glu Arg Glu 290 295 300 Leu Val Pro Glu Ala Glu Gln Ser His Leu Val Glu Thr Met Glu Glu 305 310 315 320 Ile Met Leu Ala His Pro Glu Asn Trp Gln Lys Tyr Tyr Arg Gly Ser 325 330 335 Ala Glu Gln Gln Arg Leu Leu Arg Val Tyr Ser Tyr Ser Asp Arg Ile 340 345 350 Arg Tyr Tyr Trp Gly Arg Pro Glu Ala Glu Ala Ala Val Thr Arg Leu 355 360 365 Met Arg Asn Leu His Gln Thr Thr Ile Pro Glu Thr Leu Leu Ser Gln 370 375 380 Tyr Cys Pro Arg Glu Tyr Glu Ala Met Arg Glu Gly Arg Leu Arg Asn 385 390 395 400 Asp Pro Ala Glu Leu Thr Ile Ala Ser Ile Arg Thr Val Leu Glu Ser 405 410 415 Tyr Ser Ser Ala Cys Arg Gly Asp Gly Ser Asn Ser Gly Lys Gln 420 425 430 <210> 10 <211> 1296 <212> DNA <213> Unknown <220> <223> Acidobacteriales bacterium <220> <221> gene <222> (1)..(1296) <223> Tagatose-biphosphate aldolase <400> 10 atgtccgaca atttgcaggt gtttcttcgt gagtcccgag gccggcgcgg catctattcg 60 gtatgctccg cgcatccccg ggtgatcgag gccgccatgc ggcaagctgg cgcagacggc 120 acgcatctgc tgctggaagc gacgtcgaat caggtgaacc aagccggagg ctacaccggc 180 atgactcccg cgatgtttcg cgattacgtt tatgacattg cacaggagat cggcttcgac 240 cgcagccgtt tgattcttgg cggagatcat ttgggcccca atccctggca gcagctcgac 300 gccagcacag cgatgcagta tgcagaggag atggttcgac tgtacatcga ggcaggattc 360 accaagattc atctcgacgc cagcatgcgt tgtgccgacg atgcggcaat cgttcccgat 420 gaagtgatgg caggacgcgc cgccgcattg tgcagcgcgg ctgagtcggc gcgagcacgg 480 ctgggactgg cgccggtggt ctacgtgatc ggaaccgagg ttccaacgcc gggtggagca 540 agccatgctc tcaacacgct ggaggtaaca acgcgggagg cagtcgagca tacgctgtcg 600 gttcatcgca aagccttcca cgatgcggga ttggacgctg catggcagcg cgtgatcgcg 660 gtggtcgtgc agccgggcgt ggagttcgat cacgatagcg ttgtcgacta tgacgccgca 720 aaagcgggcc atttgcaaga atttctacaa gcccacccgg aactggtgat ggaggcacac 780 tccagcgatt accagaagcc gcaagcctac aaggaactgg tccgtgatgg cttcgcgatc 840 ctgaaggtcg ggcctgcgtt gacgtttgcg ctgcgggaga tgctctacgc gctggccgcc 900 atcgagcggg aactggtgcc ggaggcggag cagtcccatc tggtagagac gatggaagag 960 atcatgctgg ctcatcccga gaactggcag aagtactatc gcggaagcgc agagcagcag 1020 cgattgctgc gcgtctatag ctacagcgac cgcattcgct attactgggg acgtccggag 1080 gccgaagctg ccgtcacgcg cctgatgcga aatctgcatc agacgacgat tcccgagact 1140 ctcctaagcc agtattgtcc gcgcgaatat gaggcaatgc gcgaaggaag actgcgaaac 1200 gatccggctg agttgacgat cgcgagcatt cgaactgtgc tggagtccta cagcagcgct 1260 tgtcgcggtg acggctcgaa ctccggtaaa cagtaa 1296 <210> 11 <211> 420 <212> PRT <213> Unknown <220> <223> Rhodothermus profundi <220> <221> PEPTIDE <222> (1)..(420) <223> Tagatose-biphosphate aldolase <400> 11 Met Gln Ala His Val Leu Leu Ala Pro Ser Phe Glu Gln Leu Ala Asp 1 5 10 15 His Arg His Gly Phe Val Gly Trp Leu Val Asp Leu Leu Arg Gly Pro 20 25 30 Leu Ala Tyr Arg His Thr Leu Leu Ala Val Cys Pro Asn Ser Glu Ala 35 40 45 Val Thr Arg Ala Ala Leu Glu Ala Ala Arg Glu Ala Asn Ala Pro Leu 50 55 60 Phe Phe Ala Ala Thr Leu Asn Gln Val Asp Leu Asp Gly Gly Tyr Thr 65 70 75 80 Gly Trp Thr Pro Ala Thr Leu Ala Arg Phe Val Ala Asp Glu Arg Ile 85 90 95 Arg Leu Gly Leu Arg Ala Pro Val Val Leu Gly Leu Asp His Gly Gly 100 105 110 Pro Trp Lys Lys Asp Trp His Val Arg Asn Arg Leu Pro Tyr Glu Ala 115 120 125 Thr Leu Gln Ala Val Leu Arg Ala Ile Glu Ala Cys Leu Asp Ala Gly 130 135 140 Tyr Gly Leu Leu His Leu Asp Pro Thr Val Asp Leu Glu Leu Pro Pro 145 150 155 160 Gly Thr Pro Val Pro Ile Pro Arg Ile Val Glu Arg Thr Val Ala Leu 165 170 175 Leu Gln His Ala Glu Thr Tyr Arg Gln Gln Arg Arg Leu Pro Pro Val 180 185 190 Ala Tyr Glu Val Gly Thr Glu Glu Val Gly Gly Gly Leu Gln Ala Glu 195 200 205 Ala Arg Met Ala Glu Phe Leu Asp Arg Leu Trp Thr Val Leu Asp Arg 210 215 220 Glu Gly Leu Pro Arg Pro Val Phe Val Val Gly Asp Ile Gly Thr Arg 225 230 235 240 Leu Asp Thr His Thr Phe Asp Phe Glu Arg Ala Arg Arg Leu Asp Ala 245 250 255 Leu Val Arg Arg Tyr Gly Ala Leu Ile Lys Gly His Tyr Thr Asp Gly 260 265 270 Val Asp Arg Leu Asp Leu Tyr Pro Gln Ala Gly Ile Gly Gly Ala Asn 275 280 285 Val Gly Pro Gly Leu Ala Ala Ile Glu Phe Glu Ala Leu Glu Ala Leu 290 295 300 Val Ala Glu Ala His Arg Arg Lys Leu Pro Val Thr Phe Asp Arg Thr 305 310 315 320 Ile Arg Gln Ala Val Ile Glu Ser Gly Arg Trp Gln Lys Trp Leu Arg 325 330 335 Pro Glu Glu Lys Gly Arg Pro Phe Glu Ala Leu Pro Pro Glu Arg Gln 340 345 350 Arg Trp Leu Val Ala Thr Gly Ser Arg Tyr Val Trp Thr His Pro Ala 355 360 365 Val Arg Gln Ala Arg His Gln Leu Tyr Gln Val Leu Ala Pro Trp Leu 370 375 380 Asp Ala Asp Ala Phe Val Arg Ala Arg Ile Lys Ala Arg Leu Met Asp 385 390 395 400 Tyr Phe Arg Ala Phe Asn Leu Ile Gly Phe Asn Glu Arg Leu Gln Ala 405 410 415 Phe Leu Pro Asn 420 <210> 12 <211> 1263 <212> DNA <213> Unknown <220> <223> Rhodothermus profundi <220> <221> gene <222> (1)..(1263) <223> Tagatose-biphosphate aldolase <400> 12 atgcaggcgc acgtcctgct tgccccttcg ttcgagcagc tagcagacca caggcacgga 60 tttgttggct ggttggtcga tttgctgcgc ggaccgctgg cttaccggca cacgctgctg 120 gccgtatgtc ccaattccga agccgtaacg cgcgccgccc tggaagctgc gcgcgaagcc 180 aacgccccgc tattttttgc ggctaccctg aaccaggtcg acctggatgg cggatatacc 240 ggctggaccc cggccacgct ggctcgtttt gttgccgacg agcgcatccg cctgggcctt 300 cgcgcccctg tcgtacttgg tctggatcac ggtggcccct ggaaaaagga ttggcatgtc 360 cgcaaccgtc ttccgtacga ggcaacgctc caggcggtgc ttcgcgcgat tgaggcctgc 420 ctcgacgcag gttatgggct gcttcatctg gacccgacgg tagatctgga attgccgccc 480 ggcacacccg tccccatccc acgtattgtc gaacgaacgg tagcgctttt acaacatgct 540 gaaacgtatc gccaacagcg tcgcctgccc ccggtcgcct acgaggtagg cacggaggag 600 gttggcggcg gcctgcaggc tgaggcgcga atggcagaat ttctggatcg actctggacc 660 gtcctggatc gggaagggct accccgtccg gtgtttgtgg tgggtgacat tggcacccgg 720 cttgacacgc acaccttcga ctttgaacgc gcccgtcgcc tggatgccct ggtgcgccgc 780 tacggtgccc tgatcaaggg gcactacacc gatggagtag accgcctgga tctatatcca 840 caggcgggta tcggtggagc aaacgtgggg cctggcctgg ctgctatcga gtttgaagcg 900 ctggaggccc tggtggccga agcgcaccgc cgcaagctgc ccgttacctt tgaccggacc 960 atccgccagg ctgtcattga aagtggacgc tggcaaaaat ggctgcgccc tgaagagaaa 1020 ggacgtccct ttgaagcatt acctccagaa cgccagcggt ggctggtcgc tacaggcagc 1080 cgctacgtgt ggacgcaccc ggctgtccgg caggcgcgcc atcaattgta tcaggtgctc 1140 gctccctggc tcgatgccga tgcttttgtg cgcgcgcgca tcaaggcccg cctgatggac 1200 tacttccgcg ctttcaacct gataggcttc aatgaacggc tgcaggcctt tttacctaat 1260 tga 1263 <210> 13 <211> 420 <212> PRT <213> Unknown <220> <223> Rhodothermus marinus <220> <221> PEPTIDE <222> (1)..(420) <223> Tagatose-biphosphate aldolase <400> 13 Met Gln Ala Gln Ala Leu Leu Thr Val Pro Phe Asp Arg Val Ala Thr 1 5 10 15 His Ala Arg Gly Phe Val Gly Trp Val Ala Glu Leu Leu Gln Gly Pro 20 25 30 Leu Ala Tyr Gln His Thr Leu Leu Ala Val Cys Pro Asn Ser Glu Ala 35 40 45 Val Thr Arg Ala Ala Leu Glu Ala Ala Ala Glu Ala Asn Ala Pro Leu 50 55 60 Leu Phe Ala Ala Thr Leu Asn Gln Val Asp Leu Asp Gly Gly Tyr Thr 65 70 75 80 Gly Trp Thr Pro Ala Thr Leu Ala Arg Phe Val Ala Asp Glu Leu Ala 85 90 95 Arg Leu Asp Leu His Ile Pro Val Val Leu Gly Leu Asp His Gly Gly 100 105 110 Pro Trp Lys Lys Asp Leu His Ala Arg Asn Arg Leu Ser Phe Glu Glu 115 120 125 Thr Phe Gln Ala Val Leu Arg Ala Ile Glu Ala Cys Leu Asp Ala Gly 130 135 140 Tyr Gly Leu Leu His Leu Asp Pro Thr Val Asp Leu Glu Leu Ser Pro 145 150 155 160 Gly Thr Pro Val Pro Ile Pro Arg Ile Val Glu Arg Ser Val Ala Leu 165 170 175 Leu Arg His Ala Glu Thr Tyr Arg Leu Arg Arg Asn Leu Pro Pro Val 180 185 190 Ala Tyr Glu Val Gly Thr Glu Glu Val Gly Gly Gly Leu Gln Ala Glu 195 200 205 Ala Arg Met Ala Glu Phe Leu Asp Arg Leu Trp Thr Ala Leu Asp Arg 210 215 220 Glu Gly Leu Pro His Pro Val Phe Val Val Gly Asp Ile Gly Thr Arg 225 230 235 240 Leu Asp Thr Arg Thr Phe Asp Phe Glu Arg Ala Arg Arg Leu Asp Ala 245 250 255 Leu Val Arg Arg Tyr Gly Ala Leu Ile Lys Gly His Tyr Thr Asp Asp 260 265 270 Val Asp Arg Leu Asp Leu Tyr Pro Lys Ala Gly Ile Gly Gly Ala Asn 275 280 285 Val Gly Pro Gly Leu Ala Ala Ile Glu Phe Glu Ala Leu Glu Ala Leu 290 295 300 Val Glu Glu Ala Arg Arg Arg Gly Leu Ser Val Thr Phe Asp Gln Ala 305 310 315 320 Ile Arg Arg Ala Val Val Glu Ser Gly Arg Trp Thr Lys Trp Leu Gln 325 330 335 Pro Glu Glu Lys Gly Gln Pro Phe Asp Ala Leu Asp Pro Glu Arg Gln 340 345 350 Arg Trp Leu Val Ala Thr Gly Ser Arg Tyr Val Trp Thr His Pro Ala 355 360 365 Val Leu Gln Ala Arg Arg Glu Leu Tyr Glu Ala Leu Ala Pro Trp Leu 370 375 380 Asp Ala Asp Ala Phe Val Arg Thr Arg Ile Lys Ala Arg Leu Met Asp 385 390 395 400 Tyr Phe Arg Ala Phe Asn Leu Ile His Phe Asn Glu Arg Leu Gln Ala 405 410 415 Phe Leu Pro Glu 420 <210> 14 <211> 1263 <212> DNA <213> Unknown <220> <223> Rhodothermus marinus <220> <221> gene <222> (1)..(1263) <223> Tagatose-biphosphate aldolase <400> 14 atgcaggcgc aggccctgct gaccgttcca tttgatcggg tggcgaccca cgcacgcggg 60 tttgtgggct gggtggccga actgctgcag gggcccctgg cctatcagca tacgctgctg 120 gctgtctgtc ccaattcgga agcggtaaca cgggccgcgc tggaggccgc cgccgaggcc 180 aacgccccgc tgctttttgc cgccacgctg aaccaggtgg acctcgacgg cggctacacc 240 ggctggacgc ccgccacgct ggcccggttc gtggcggacg aactggcccg cctggacctg 300 cacatccccg tcgtgctcgg cctggaccac ggcggcccct ggaaaaagga tctgcacgcc 360 cgcaaccgat tgtcctttga ggaaaccttc caggccgtgc tgcgggccat cgaggcctgt 420 ctggatgccg gctacggcct gctgcacctg gatccgacgg tcgatctgga gctatcgccc 480 ggcacgccgg tgcccatccc gcgcattgtc gaacgctcgg tagcgctttt gcgtcatgcc 540 gaaacctatc gacttcgacg taacctgccg ccggtcgcct acgaggtggg caccgaagaa 600 gtcggcggcg gcctgcaggc cgaagcgcgc atggcggagt ttctggatcg cctctggacc 660 gcactggacc gggaaggcct gccccatcca gtcttcgtgg tgggcgacat cggcacccgg 720 ctcgacacgc gcacgttcga cttcgagcgg gcccgacggc tggacgcgct ggtgcgccgc 780 tacggtgccc tcatcaaagg gcactacacc gacgacgtgg atcgcctcga tctgtacccg 840 aaggcgggca tcggcggggc caacgtgggc ccgggcctgg ccgccatcga gtttgaagcg 900 ctggaggcgc tggtggagga agcccgtcgc cgcggtcttt cggtgacgtt cgatcaggcc 960 atccgccggg ccgtcgtcga aagcggacgc tggacgaagt ggctccaacc ggaagagaaa 1020 ggccagccgt tcgatgcgct ggatcccgag cggcaacgct ggctggtggc caccggcagc 1080 cgctacgtgt ggacgcatcc ggccgtcctg caggcccgcc gcgaactcta cgaggcgctc 1140 gccccctggc tcgatgccga cgctttcgtg cgcacgcgca tcaaagcacg cctgatggac 1200 tactttcgtg ccttcaacct gatccatttc aacgagcggc tgcaggcctt tctccccgaa 1260 tga 1263 <210> 15 <211> 448 <212> PRT <213> Unknown <220> <223> Limnochorda pilosa <220> <221> PEPTIDE <222> (1)..(448) <223> Tagatose-biphosphate aldolase <400> 15 Met Gln Thr Ser Thr Ala Tyr Val Arg Gln Val Ile Trp Gly Gln Gly 1 5 10 15 Thr Arg Asp Pro Arg Gly Ile Tyr Ser Val Cys Thr Ala Asp Pro Leu 20 25 30 Val Leu Arg Ala Ala Leu Lys Gln Ala Val Glu Asp Gly Ser Pro Ala 35 40 45 Leu Ile Glu Ala Thr Ser Asn Gln Val Asn Gln Phe Gly Gly Tyr Thr 50 55 60 Gly Met Glu Pro Pro Ala Phe Val Glu Phe Val Leu Gly Leu Ala Arg 65 70 75 80 Glu Met Gly Leu Pro Pro Glu Arg Leu Ile Leu Gly Gly Asp His Leu 85 90 95 Gly Pro Asn Pro Trp Gln Arg Leu Ala Ala Glu Glu Ala Met Arg His 100 105 110 Ala Cys Asp Leu Val Glu Ala Phe Val Ala Cys Gly Phe Thr Lys Ile 115 120 125 His Leu Asp Ala Ser Met Pro Leu Gly Glu Glu Arg Ala Gly Gly Ala 130 135 140 Leu Ser Lys Arg Val Val Ala Glu Arg Thr Ala Gln Leu Cys Glu Ala 145 150 155 160 Ala Glu Ala Ala Phe Arg Lys Arg Ser Gln Ala Glu Gly Ala Ser Ala 165 170 175 Pro Pro Leu Tyr Val Ile Gly Ser Asp Val Pro Pro Pro Gly Gly Glu 180 185 190 Thr Ser Gly Ser Gln Gly Pro Lys Val Thr Thr Pro Glu Glu Phe Glu 195 200 205 Glu Thr Val Ala Leu Thr Arg Ala Thr Phe His Asp Arg Gly Leu Asp 210 215 220 Asp Ala Trp Gly Arg Val Ile Ala Val Val Val Gln Pro Gly Val Asp 225 230 235 240 Phe Gly Glu Trp Gln Val His Pro Tyr Asp Arg Ala Ala Ala Ala Ser 245 250 255 Leu Thr Arg Ala Leu Thr Gln His Pro Gly Leu Ala Phe Glu Gly His 260 265 270 Ser Thr Asp Tyr Gln Thr Pro Gly Arg Leu Arg Gln Met Ala Glu Asp 275 280 285 Gly Ile Ala Ile Leu Lys Val Gly Pro Ala Leu Thr Phe Ala Lys Arg 290 295 300 Glu Ala Leu Phe Ala Leu Asn Ala Leu Glu Ser Glu Val Leu Gly Thr 305 310 315 320 Asp Gly Arg Ala Arg Arg Ser Asn Val Glu Ala Ala Leu Glu Glu Ala 325 330 335 Met Leu Ala Asp Pro Arg His Trp Ser Ala Tyr Tyr Ser Gly Asp Glu 340 345 350 His Glu Leu Arg Leu Lys Arg Lys Tyr Gly Leu Ser Asp Arg Cys Arg 355 360 365 Tyr Tyr Trp Pro Val Pro Ser Val Gln Glu Ala Val Gln Arg Leu Leu 370 375 380 Gly Asn Leu Arg Glu Ala Gly Ile Pro Leu Pro Leu Leu Ser Gln Phe 385 390 395 400 Leu Pro Arg Gln Tyr Glu Arg Val Arg Glu Gly Val Leu Arg Asn Asp 405 410 415 Pro Glu Glu Leu Val Leu Asp Arg Ile Arg Asp Val Leu Arg Gly Tyr 420 425 430 Ala Ala Ala Val Gly Thr Gly Ala Arg Arg Ala Glu Pro Ser Pro Ala 435 440 445 <210> 16 <211> 1347 <212> DNA <213> Unknown <220> <223> Limnochorda pilosa <220> <221> gene <222> (1)..(1347) <223> Tagatose-biphosphate aldolase <400> 16 atgcaaacct cgacggcgta cgtgaggcag gtcatttggg gtcaagggac gagggacccc 60 cgcggcatct actcggtctg taccgcagac cccctcgtcc ttcgggccgc cctcaagcag 120 gcggtggagg atggctcccc cgcgctgatc gaggcgacgt ccaaccaggt gaaccagttc 180 ggcgggtata cggggatgga gcccccggcg ttcgtggagt tcgtgctggg acttgcccgc 240 gagatgggac tcccgcccga gcggctgatc ctcgggggcg atcacctcgg ccccaaccca 300 tggcagcggc tggcggccga agaggccatg cggcatgcct gcgacctcgt cgaggccttc 360 gtggcctgcg gcttcaccaa gattcacctg gacgccagca tgcccctggg ggaggaacgg 420 gcaggcggtg cgctttcgaa acgggtggtg gccgaacgga ccgcccagct ctgcgaggcg 480 gccgaggcgg ccttcaggaa gcggtcccag gcggaggggg cgtcggcgcc tccgctctac 540 gtcatcggct ccgacgtgcc tccgcccggc ggcgagacct ccgggagcca ggggcccaag 600 gtgaccacgc cggaggagtt cgaggagacg gtcgcgctga cgcgggcgac ctttcacgat 660 cggggcctgg acgacgcctg gggacgggtg atcgccgtgg tggtccagcc gggggtggac 720 ttcggcgagt ggcaggttca cccctacgat cgggccgccg cggcgagcct tacccgagcc 780 ttgacgcagc atccggggct ggccttcgaa gggcactcca ccgactacca gacgccgggg 840 cggcttcgcc agatggcgga agacggcatc gccatcctga aggtggggcc ggccctcacc 900 ttcgccaagc gggaagcgct cttcgccctg aacgccctgg agtccgaagt gctggggacg 960 gacggccgag cacggcgctc caacgtcgaa gccgccctcg aagaggcgat gctcgccgat 1020 ccccgtcact ggagcgccta ctacagcggg gacgagcacg agctccgtct caagcggaag 1080 tacggcctct ccgaccggtg tcgctactac tggcccgtcc cttcggtgca ggaggccgtc 1140 cagcgcctcc ttggcaacct gcgcgaggcg gggatcccct tgcccctgct gagccagttc 1200 ctgccgcgcc agtacgagcg ggtgcgggag ggcgtcctgc gcaacgaccc ggaggagctg 1260 gtcctggacc ggattcgtga cgtgttgcgg ggatatgcgg cggccgtggg gacgggcgct 1320 aggcgggcgg agccatcacc cgcgtga 1347 <210> 17 <211> 453 <212> PRT <213> Unknown <220> <223> Caldithrix abyssi <220> <221> PEPTIDE <222> (1)..(453) <223> Tagatose-biphosphate aldolase <400> 17 Met Ser Leu His Pro Leu Asn Lys Leu Ile Glu Arg His Lys Lys Gly 1 5 10 15 Thr Pro Val Gly Ile Tyr Ser Val Cys Ser Ala Asn Pro Phe Val Leu 20 25 30 Lys Ala Ala Met Leu Gln Ala Gln Lys Asp Gln Ser Leu Leu Leu Ile 35 40 45 Glu Ala Thr Ser Asn Gln Val Asp Gln Phe Gly Gly Tyr Thr Gly Met 50 55 60 Arg Pro Glu Asp Phe Lys Thr Met Thr Leu Glu Leu Ala Ala Glu Asn 65 70 75 80 Asn Tyr Asp Pro Gln Gly Leu Ile Leu Gly Gly Asp His Leu Gly Pro 85 90 95 Asn Arg Trp Thr Lys Leu Ser Ala Ser Arg Ala Met Asp Tyr Ala Arg 100 105 110 Glu Gln Ile Ala Ala Tyr Val Lys Ala Gly Phe Ser Lys Ile His Leu 115 120 125 Asp Ala Thr Met Pro Leu Gln Asn Asp Ala Thr Asp Ser Ala Gly Arg 130 135 140 Leu Pro Val Glu Thr Ile Ala Gln Arg Thr Ala Glu Leu Cys Ala Val 145 150 155 160 Ala Glu Gln Thr Tyr Arg Gln Ser Asp Gln Leu Phe Pro Pro Pro Val 165 170 175 Tyr Ile Val Gly Ser Asp Val Pro Ile Pro Gly Gly Ala Gln Glu Ala 180 185 190 Leu Asn Gln Ile His Ile Thr Glu Val Lys Glu Val Gln Gln Thr Ile 195 200 205 Asp His Val Arg Arg Ala Phe Glu Lys Asn Gly Leu Glu Ala Ala Tyr 210 215 220 Glu Arg Val Cys Ala Val Val Val Gln Pro Gly Val Glu Phe Ala Asp 225 230 235 240 Gln Ile Val Phe Glu Tyr Ala Pro Asp Arg Ala Ala Ala Leu Lys Asp 245 250 255 Phe Ile Glu Ser His Ser Gln Leu Val Tyr Glu Ala His Ser Thr Asp 260 265 270 Tyr Gln Thr Ala Pro Leu Leu Arg Gln Met Val Lys Asp His Phe Ala 275 280 285 Ile Leu Lys Val Gly Pro Ala Leu Thr Phe Ala Leu Arg Glu Ala Ile 290 295 300 Phe Ala Leu Ala Phe Met Glu Lys Glu Leu Leu Pro Leu His Arg Ala 305 310 315 320 Leu Lys Pro Ser Ala Ile Leu Glu Thr Leu Asp Gln Thr Met Asp Lys 325 330 335 Asn Pro Ala Tyr Trp Gln Lys His Tyr Gly Gly Thr Lys Glu Glu Val 340 345 350 Arg Phe Ala Gln Arg Phe Ser Leu Ser Asp Arg Ile Arg Tyr Tyr Trp 355 360 365 Pro Phe Pro Lys Val Gln Lys Ala Leu Arg Gln Leu Leu Lys Asn Leu 370 375 380 Gln Gln Ile Ser Ile Pro Leu Thr Leu Val Ser Gln Phe Met Pro Glu 385 390 395 400 Glu Tyr Gln Arg Ile Arg Gln Gly Thr Leu Thr Asn Asp Pro Gln Ala 405 410 415 Leu Ile Leu Asn Lys Ile Gln Ser Val Leu Lys Gln Tyr Ala Glu Ala 420 425 430 Thr Gln Ile Gln Asn Ser Leu Thr Phe Thr Gln Asn Gln Asn Ser Leu 435 440 445 Ala Met Glu Arg Leu 450 <210> 18 <211> 1362 <212> DNA <213> Unknown <220> <223> Caldithrix abyssi <220> <221> gene <222> (1)..(1362) <223> Tagatose-biphosphate aldolase <400> 18 atgagtctgc atcctttaaa taaattaatc gagcgacaca aaaaaggaac gccggtcggt 60 atttattccg tctgttcggc caatcccttt gttttgaaag cggccatgct acaggcgcaa 120 aaggatcagt ctttgctact tattgaggcc acttccaacc aggtagatca attcggcggt 180 tacaccggca tgcggcccga agattttaaa acaatgacgc ttgaactggc agccgaaaac 240 aattacgatc cacagggatt aatcctgggc ggcgaccatc tggggcccaa ccgctggaca 300 aaactgagcg cctcccgggc catggactac gccagagagc agattgccgc ttatgttaaa 360 gccggctttt ccaaaatcca cttagacgcc accatgccct tgcaaaacga tgccacagat 420 tccgccggcc gccttccagt cgaaacaatc gctcaacgta ccgcagaatt atgcgccgtg 480 gccgaacaaa cttaccggca gagcgaccaa ctctttccgc cgcctgttta cattgtcggc 540 agcgacgtgc ccatcccggg cggcgcgcaa gaagcgctga accagatcca tattacggag 600 gtaaaagagg ttcaacagac cattgatcac gtgcggcggg cctttgaaaa aaacggcctg 660 gaagcggctt acgaaagagt ttgcgccgtt gtcgtgcagc caggcgttga attcgccgat 720 caaatcgttt ttgaatacgc tcccgacaga gcggcggcct taaaagattt tattgaaagc 780 cattcgcagc tggtttatga agcgcactct actgattacc agaccgcacc tcttttgcgc 840 cagatggtaa aagatcactt tgccatttta aaggtcgggc ctgcgctcac ctttgccctg 900 cgcgaagcca tttttgctct ggcctttatg gaaaaagagc ttttgccatt gcacagagcg 960 ctcaaacctt ctgccattct ggaaacgctg gaccaaacga tggacaaaaa ccctgcttac 1020 tggcaaaagc attacggcgg aacaaaggaa gaagtacgct ttgcgcagcg gtttagcctg 1080 agcgaccgca ttcgttacta ctggccgttt ccaaaggttc aaaaggccct gcgccaattg 1140 ctaaaaaact tgcaacaaat ttccattcct ctaactttgg taagccagtt catgccagag 1200 gaataccaac gtattcgcca aggaacgtta accaacgatc cgcaggcgct gattttgaac 1260 aaaattcaaa gcgtattaaa gcaatacgcg gaggcgacgc aaattcaaaa ctctttgaca 1320 ttcacgcaaa atcaaaattc attagcaatg gagcgactat ga 1362 <210> 19 <211> 429 <212> PRT <213> Unknown <220> <223> Caldicellulosiruptor kronotskyensis <220> <221> PEPTIDE <222> (1)..(429) <223> Tagatose-biphosphate aldolase <400> 19 Met Ser Pro Gln Asn Pro Leu Ile Gly Leu Phe Lys Asn Arg Glu Lys 1 5 10 15 Glu Phe Lys Gly Ile Ile Ser Val Cys Ser Ser Asn Glu Ile Val Leu 20 25 30 Glu Ala Val Leu Lys Arg Met Lys Asp Thr Asn Leu Pro Ile Ile Ile 35 40 45 Glu Ala Thr Ala Asn Gln Val Asn Gln Phe Gly Gly Tyr Ser Gly Leu 50 55 60 Thr Pro Ser Gln Phe Lys Glu Arg Val Ile Lys Ile Ala Gln Lys Val 65 70 75 80 Asp Phe Pro Leu Glu Arg Ile Ile Leu Gly Gly Asp His Leu Gly Pro 85 90 95 Phe Val Trp Arg Asp Gln Glu Pro Glu Ile Ala Met Glu Tyr Ala Lys 100 105 110 Gln Met Ile Lys Glu Tyr Ile Lys Ala Gly Phe Thr Lys Ile His Ile 115 120 125 Asp Thr Ser Met Pro Leu Lys Gly Glu Asn Ser Ile Asp Asp Glu Ile 130 135 140 Ile Ala Lys Arg Thr Ala Val Leu Cys Arg Ile Ala Glu Glu Cys Phe 145 150 155 160 Glu Lys Ile Ser Ile Asn Asn Pro Tyr Ile Thr Arg Pro Val Tyr Val 165 170 175 Ile Gly Ala Asp Val Pro Pro Pro Gly Gly Glu Ser Ser Ile Cys Gln 180 185 190 Thr Ile Thr Thr Lys Asp Glu Leu Glu Arg Ser Leu Glu Tyr Phe Lys 195 200 205 Glu Ala Phe Lys Lys Glu Gly Ile Glu His Val Phe Asp Tyr Val Val 210 215 220 Ala Val Val Ala Asn Phe Gly Val Glu Phe Gly Ser Asp Glu Ile Val 225 230 235 240 Asp Phe Asp Met Glu Lys Val Lys Pro Leu Lys Glu Leu Leu Ala Lys 245 250 255 Tyr Asn Ile Val Phe Glu Gly His Ser Thr Asp Tyr Gln Thr Lys Glu 260 265 270 Asn Leu Lys Arg Met Val Glu Cys Gly Ile Ala Ile Leu Lys Val Gly 275 280 285 Pro Ala Leu Thr Phe Thr Leu Arg Glu Ala Leu Val Ala Leu Ser His 290 295 300 Ile Glu Glu Glu Ile Tyr Ser Asn Glu Lys Glu Lys Leu Ser Arg Phe 305 310 315 320 Arg Glu Val Leu Leu Asn Thr Met Leu Thr Cys Lys Asp His Trp Ser 325 330 335 Lys Tyr Phe Asp Glu Asn Asp Lys Leu Ile Lys Ser Lys Leu Leu Tyr 340 345 350 Ser Tyr Leu Asp Arg Trp Arg Tyr Tyr Phe Glu Asn Glu Ser Val Lys 355 360 365 Ser Ala Val Tyr Ser Leu Ile Gly Asn Leu Glu Asn Val Lys Ile Pro 370 375 380 Pro Trp Leu Val Ser Gln Tyr Phe Pro Ser Gln Tyr Gln Lys Met Arg 385 390 395 400 Lys Lys Asp Leu Lys Asn Gly Ala Ala Asp Leu Ile Leu Asp Lys Ile 405 410 415 Gly Glu Val Ile Asp His Tyr Val Tyr Ala Val Lys Glu 420 425 <210> 20 <211> 1290 <212> DNA <213> Unknown <220> <223> Caldicellulosiruptor kronotskyensis <220> <221> gene <222> (1)..(1290) <223> Tagatose-biphosphate aldolase <400> 20 atgagtcctc aaaatccatt gattggttta tttaagaata gagaaaaaga gtttaagggt 60 attatttcag tttgttcttc aaatgaaata gtcttagaag cagttttaaa aagaatgaaa 120 gatacaaacc taccaattat tattgaagcc acagcgaacc aggtaaatca atttggcggg 180 tattctgggt tgacaccgtc tcagttcaaa gaacgagtta taaaaattgc tcaaaaagtt 240 gattttccac ttgagagaat aattcttggt ggggaccatc ttggaccatt tgtgtggcgt 300 gaccaggaac cagaaattgc tatggagtat gctaagcaaa tgataaaaga atacataaaa 360 gcaggtttta ccaaaattca catcgacacg agtatgcctt taaaagggga gaacagcata 420 gatgatgaaa taattgctaa aagaactgct gtgctctgca ggattgcgga ggagtgtttt 480 gagaagattt ctataaacaa tccctatatt acaaggccag tttatgtgat aggagctgat 540 gtgccacctc ccggcggaga gtcttctatt tgtcaaacaa ttactactaa agatgaatta 600 gaaagaagtt tagaatattt caaagaagca tttaaaaagg aaggaattga gcatgtattc 660 gattatgtag ttgctgttgt tgcaaatttt ggagttgaat ttgggagcga tgaaattgtt 720 gattttgata tggaaaaagt aaagccgcta aaagaacttt tggcaaagta caatatagta 780 tttgaaggcc attctacaga ttatcaaaca aaagaaaact taaaaagaat ggtcgaatgt 840 ggtattgcaa ttttaaaggt tggtcctgct ctaacattta cattgcgcga agcgttagta 900 gcacttagtc atattgaaga agaaatttat agcaatgaaa aggagaaact gtcaagattt 960 agagaagttt tattgaatac tatgctaaca tgcaaagatc actggagtaa atattttgat 1020 gagaatgata agttaattaa gtcaaagctc ctatatagct atcttgacag atggagatac 1080 tattttgaaa acgagagtgt gaaaagtgct gtttattctc ttattggaaa tttagagaat 1140 gttaaaattc caccttggct tgtaagtcag tattttcctt ctcagtacca aaagatgaga 1200 aaaaaagatt taaaaaacgg tgctgccgac ctaatattgg ataaaatagg ggaagtcatt 1260 gaccattatg tttatgcggt aaaagaataa 1290 <210> 21 <211> 408 <212> PRT <213> Unknown <220> <223> Caldilinea aerophila <220> <221> PEPTIDE <222> (1)..(408) <223> Tagatose-biphosphate aldolase <400> 21 Met Ser Thr Leu Arg His Ile Ile Leu Arg Leu Ile Glu Leu Arg Glu 1 5 10 15 Arg Glu Gln Ile His Leu Thr Leu Leu Ala Val Cys Pro Asn Ser Ala 20 25 30 Ala Val Leu Glu Ala Ala Val Lys Val Ala Ala Arg Cys His Thr Pro 35 40 45 Met Leu Phe Ala Ala Thr Leu Asn Gln Val Asp Arg Asp Gly Gly Tyr 50 55 60 Thr Gly Trp Thr Pro Ala Gln Phe Val Ala Glu Met Arg Arg Tyr Ala 65 70 75 80 Val Arg Tyr Gly Cys Thr Thr Pro Leu Tyr Pro Cys Leu Asp His Gly 85 90 95 Gly Pro Trp Leu Lys Asp Arg His Ala Gln Glu Lys Leu Pro Leu Asp 100 105 110 Gln Ala Met His Glu Val Lys Leu Ser Leu Thr Ala Cys Leu Glu Ala 115 120 125 Gly Tyr Ala Leu Leu His Ile Asp Pro Thr Val Asp Arg Thr Leu Pro 130 135 140 Pro Gly Glu Ala Pro Leu Val Pro Ile Val Val Glu Arg Thr Val Glu 145 150 155 160 Leu Ile Glu His Ala Glu Gln Glu Arg Gln Arg Leu Asn Leu Pro Ala 165 170 175 Val Ala Tyr Glu Val Gly Thr Glu Glu Val His Gly Gly Leu Val Asn 180 185 190 Phe Asp Asn Phe Val Ala Phe Leu Asp Leu Leu Lys Ala Arg Leu Glu 195 200 205 Gln Arg Ala Leu Met His Ala Trp Pro Ala Phe Val Val Ala Gln Val 210 215 220 Gly Thr Asp Leu His Thr Thr Tyr Phe Asp Pro Ser Ala Ala Gln Arg 225 230 235 240 Leu Thr Glu Ile Val Arg Pro Thr Gly Ala Leu Leu Lys Gly His Tyr 245 250 255 Thr Asp Trp Val Glu Asn Pro Ala Asp Tyr Pro Arg Val Gly Met Gly 260 265 270 Gly Ala Asn Val Gly Pro Glu Phe Thr Ala Ala Glu Phe Glu Ala Leu 275 280 285 Glu Ala Leu Glu Arg Arg Glu Gln Arg Leu Cys Ala Asn Arg Lys Leu 290 295 300 Gln Pro Ala Cys Phe Leu Ala Ala Leu Glu Glu Ala Val Val Ala Ser 305 310 315 320 Asp Arg Trp Arg Lys Trp Leu Gln Pro Asp Glu Ile Gly Lys Pro Phe 325 330 335 Ala Glu Leu Thr Pro Ala Arg Arg Arg Trp Leu Val Gln Thr Gly Ala 340 345 350 Arg Tyr Val Trp Thr Ala Pro Lys Val Ile Ala Ala Arg Glu Gln Leu 355 360 365 Tyr Ala His Leu Ser Leu Val Gln Ala Asp Pro His Ala Tyr Val Val 370 375 380 Glu Ser Val Ala Arg Ser Ile Glu Arg Tyr Ile Asp Ala Phe Asn Leu 385 390 395 400 Tyr Asp Ala Ala Thr Leu Leu Gly 405 <210> 22 <211> 1227 <212> DNA <213> Unknown <220> <223> Caldilinea aerophila <220> <221> gene <222> (1)..(1227) <223> Tagatose-biphosphate aldolase <400> 22 atgtcaacac ttcgccacat cattttgcga ctgatcgagc tgcgtgaacg agaacagatc 60 catctcacgc tgctggccgt ctgtcccaac tcggcggcgg tgctggaggc agcggtgaag 120 gtcgccgcgc gctgccacac gccgatgctc ttcgctgcca cgctcaatca agtcgatcgc 180 gacggcggct acaccggttg gacgcctgcg caattcgtcg ccgagatgcg tcgctatgcc 240 gtccgctatg gctgcaccac cccgctctat ccttgcctgg atcacggcgg gccgtggctc 300 aaagatcgcc atgcacagga aaagctaccg ctcgaccagg cgatgcatga ggtcaagctg 360 agcctcaccg cctgtctgga ggccggctac gcgctgctgc acatcgaccc cacggtcgat 420 cgcacgctcc cgcccggaga agcgccgctc gtgccgatcg tcgtcgagcg cacggtcgag 480 ctgatcgaac atgccgaaca ggagcgacag cggctgaacc tgccggcggt cgcctatgaa 540 gtcggcaccg aagaagtaca tggcgggctg gtgaatttcg acaattttgt cgccttcttg 600 gatttgctca aggcaaggct tgaacaacgt gccctgatgc acgcctggcc cgccttcgtg 660 gtggcgcagg tcggcactga cctgcataca acgtattttg accccagtgc ggcgcaacgg 720 ctgactgaga tcgtgcgccc taccggtgca ctgttgaagg ggcactacac cgactgggtc 780 gaaaatcccg ccgactatcc gagggtaggc atgggaggcg ccaacgttgg tccagagttt 840 acggcggccg agttcgaggc gctggaagcg ctggaacggc gggaacaacg gctgtgcgcc 900 aaccggaaat tgcagcccgc ctgttttttg gctgcactgg aagaggcagt agtcgcttca 960 gatcgttggc ggaagtggct ccagcccgat gagatcggca agccctttgc agaattaacg 1020 cccgcacgcc ggcgctggct cgtgcagacc ggggcacgct acgtctggac tgcgccgaaa 1080 gttatcgccg cacgcgaaca gctctatgcg cacctctccc ttgtgcaggc ggatccacat 1140 gcctacgtgg tagagtcagt cgcccggtca atcgagcgct atatcgatgc cttcaactta 1200 tacgacgccg ctacattgct tggatga 1227 <210> 23 <211> 446 <212> PRT <213> Unknown <220> <223> Thermoanaerobacter thermohydrosulfuricus <220> <221> PEPTIDE <222> (1)..(446) <223> Tagatose-biphosphate aldolase <400> 23 Met Asn Thr Glu His Pro Leu Lys Asn Val Val Lys Leu Gln Lys Lys 1 5 10 15 Gly Ile Pro Ile Gly Ile Tyr Ser Val Cys Ser Ala Asn Glu Ile Val 20 25 30 Ile Gln Val Ala Met Glu Lys Ala Leu Ser Met Asp Ser Tyr Val Leu 35 40 45 Ile Glu Ala Thr Ala Asn Gln Val Asn Gln Tyr Gly Gly Tyr Thr Asn 50 55 60 Met Lys Pro Ile Asp Phe Arg Asp Phe Val Tyr Ser Ile Ala Lys Arg 65 70 75 80 Ile Asn Phe Pro Glu Asn Arg Ile Ile Leu Gly Gly Asp His Leu Gly 85 90 95 Pro Leu Pro Trp Lys Asn Gln Gln Ala Lys Lys Ala Met Glu Glu Ala 100 105 110 Lys Glu Leu Val Lys Gln Phe Val Met Ala Gly Phe Thr Lys Ile His 115 120 125 Val Asp Thr Ser Met Leu Leu Gly Asp Asp Asn Ile Asn Ile Lys Leu 130 135 140 Asp Thr Glu Thr Ile Ala Glu Arg Gly Ala Ile Leu Val Ser Val Ala 145 150 155 160 Glu Arg Ala Phe Glu Glu Leu Lys Lys Phe Asn Pro Tyr Ala Leu His 165 170 175 Pro Val Tyr Val Ile Gly Ser Glu Val Pro Val Pro Gly Gly Ser Gln 180 185 190 Lys Glu Asn Asn Asn Glu Ile Gln Val Thr Lys Pro Thr Asp Phe Glu 195 200 205 Glu Thr Val Glu Val Tyr Lys Ser Thr Phe Tyr Lys Tyr Gly Leu Gly 210 215 220 Asn Ala Trp Glu Asp Val Val Ala Val Val Val Gln Ala Gly Val Glu 225 230 235 240 Phe Gly Val Glu Asp Ile His Glu Tyr Asp His Gln Gln Ala Glu Asn 245 250 255 Leu Val Ser Ala Leu Lys Lys Tyr Pro Asn Leu Val Phe Glu Ala His 260 265 270 Ser Thr Asp Tyr Gln Pro Ala Lys Leu Leu Lys Glu Met Val Arg Asp 275 280 285 Gly Phe Ala Ile Leu Lys Val Gly Pro Glu Leu Thr Phe Ala Leu Arg 290 295 300 Glu Gly Leu Phe Ala Leu Asn Ile Ile Glu Lys Glu Leu Phe Lys Asp 305 310 315 320 Asn His Asp Ile Glu Met Ser Asn Phe Ile Asp Ile Leu Asp Thr Ala 325 330 335 Met Leu Asn Asn Pro Lys Tyr Trp Glu Gln Tyr Tyr Tyr Gly Asp Asp 340 345 350 Asn Lys Ile Arg Ile Ala Arg Lys Tyr Ser Tyr Ser Asp Arg Cys Arg 355 360 365 Tyr Tyr Leu Ile Glu Asn Glu Val Arg Ala Ser Met Ser Arg Leu Phe 370 375 380 Lys Asn Leu Thr Asn Val Glu Ile Pro Leu Thr Leu Ile Ser Gln Tyr 385 390 395 400 Met Pro Ile Gln Tyr Glu Lys Ile Arg Met Gly Leu Leu Lys Asn Asp 405 410 415 Pro Glu Asn Leu Val Lys Asp Lys Ile Gly Asn Cys Ile Asp Lys Tyr 420 425 430 Leu Tyr Ala Thr Asn Pro Thr Ser Gly Glu Phe Lys Leu Ile 435 440 445 <210> 24 <211> 1341 <212> DNA <213> Unknown <220> <223> Thermoanaerobacter thermohydrosulfuricus <220> <221> gene <222> (1)..(1341) <223> Tagatose-biphosphate aldolase <400> 24 atgaatacag aacatccttt gaaaaacgtt gttaaactac aaaaaaaggg aattccaata 60 ggtatttatt cagtttgtag tgcaaatgaa atagttattc aagttgcaat ggagaaggca 120 ttgagtatgg atagttatgt tttaattgaa gcaacggcta atcaagtaaa tcaatatggt 180 ggctatacga atatgaaacc tattgatttt agagattttg tgtattctat agccaaaagg 240 ataaacttcc cagaaaatag aataatcctt ggcggggacc acttaggacc tttgccatgg 300 aaaaatcaac aagcgaaaaa agcaatggaa gaagcaaaag aacttgttaa acaatttgtg 360 atggctggct ttacgaaaat tcatgtagat acaagtatgc ttcttggaga tgataacata 420 aatatcaaac tagatactga aactattgcg gagagaggag cgatacttgt atcagtagca 480 gaaagagctt ttgaggagtt aaaaaagttt aatccttatg ctcttcatcc agtttatgta 540 ataggtagtg aagttcctgt tccaggaggt tctcaaaaag aaaataataa tgaaatacaa 600 gtaacaaagc cgacggattt tgaagaaact gtggaagtgt ataaaagcac tttctataaa 660 tatggtttag gaaacgcatg ggaagatgtt gtagcagtgg ttgtgcaggc tggggtggaa 720 tttggagttg aagatattca tgaatatgat caccaacagg ctgaaaattt agtaagtgct 780 ttaaaaaagt atcctaattt agtatttgaa gcccactcta cggattatca acctgcaaaa 840 ctactaaaag aaatggtgag agatggattt gctatactta aagttggacc tgaattgact 900 tttgcattaa gggaaggatt gtttgctctg aatattatag aaaaagaatt atttaaagat 960 aatcatgata ttgagatgtc aaattttatt gatatccttg atacagcaat gttaaataat 1020 ccgaagtatt gggaacagta ttattacggt gatgataata aaattagaat tgctagaaaa 1080 tacagctatt ctgatagatg taggtattat ctaatcgaaa atgaagttag agcatctatg 1140 tctaggttgt ttaaaaattt aacaaatgtt gagataccat taaccttgat aagtcagtat 1200 atgcctattc aatatgaaaa aattagaatg ggactattaa aaaatgatcc tgagaattta 1260 gtaaaagata aaattggaaa ttgcattgat aagtatttgt atgctactaa tccgacaagt 1320 ggagaattta aactaatata a 1341

Claims

서열번호 1의 아미노산 서열을 포함하는 과당-4-에피머화 효소에서 하나 이상의 아미노산 잔기가 치환된, 과당-4-에피머화 효소 변이체로서,
상기 서열번호 1의 아미노산 서열의 N-말단으로부터 8번째, 20번째, 23번째, 25번째, 26번째, 29번째, 45번째, 51번째, 53번째, 63번째, 86번째, 91번째, 97번째, 110번째, 133번째, 144번째, 146번째, 151번째, 155번째, 167번째, 172번째, 173번째, 174번째, 181번째, 191번째, 239번째, 263번째, 266번째, 285번째, 294번째, 298번째, 308번째, 315번째, 316번째, 317번째, 323번째, 336번째, 347번째, 359번째, 367번째, 385번째, 386번째, 388번째, 389번째, 410번째, 414번째, 및 417번째로 이루어진 군에서 선택되는 하나의 이상의 위치에 상응하는 아미노산이, 하기 표에 나타낸 각 변이 위치별 치환 아미노산 중의 어느 하나로 치환된 것을 특징으로 하는, 과당-4-에피머화 효소 변이체:

.
삭제
삭제
제1항에 따른 과당-4-에피머화 효소 변이체를 코딩하는 폴리뉴클레오티드.
제4항의 폴리뉴클레오티드를 포함하는 벡터.
제1항에 따른 과당-4-에피머화 효소 변이체; 상기 과당-4-에피머화 효소 변이체를 코딩하는 폴리뉴클레오티드; 또는 상기 폴리뉴클레오티드를 포함하는 벡터를 포함하는 미생물.
제1항에 따른 과당-4-에피머화 효소 변이체; 이를 포함하는 미생물; 또는 상기 미생물의 배양물을 포함하는 타가토스 생산용 조성물.
제7항에 있어서, 상기 조성물은 과당을 추가로 포함하는 것인, 타가토스 생산용 조성물.
제1항에 따른 과당-4-에피머화 효소 변이체; 이를 포함하는 미생물; 또는 상기 미생물의 배양물을 과당과 접촉시켜, 과당을 타가토스로 전환시키는 단계를 포함하는 타가토스 제조방법.