KR20100061571A - 케토리덕타제 폴리펩티드 및 이의 용도 - Google Patents

케토리덕타제 폴리펩티드 및 이의 용도 Download PDF

Info

Publication number
KR20100061571A
KR20100061571A KR1020107009238A KR20107009238A KR20100061571A KR 20100061571 A KR20100061571 A KR 20100061571A KR 1020107009238 A KR1020107009238 A KR 1020107009238A KR 20107009238 A KR20107009238 A KR 20107009238A KR 20100061571 A KR20100061571 A KR 20100061571A
Authority
KR
South Korea
Prior art keywords
residue
residue corresponding
nonpolar
aliphatic
amino acid
Prior art date
Application number
KR1020107009238A
Other languages
English (en)
Inventor
잭 리앙
벌스 보럽
베스나 미첼
에밀리 문돌프
제임스 라론드
잘트 휘스만
Original Assignee
코덱시스, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=40042831&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR20100061571(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 코덱시스, 인코포레이티드 filed Critical 코덱시스, 인코포레이티드
Publication of KR20100061571A publication Critical patent/KR20100061571A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom
    • C12P17/12Nitrogen as only ring hetero atom containing a six-membered hetero ring

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

본 개시내용은 천연 야생형 케토리덕타제 효소와 비교하여 향상된 특징을 갖는 조작된 케토리덕타제 효소를 제공한다. 또한, 본 발명은 상기 조작된 케토리덕타제 효소를 코딩하는 폴리뉴클레오티드, 상기 조작된 케토리덕타제 효소를 발현할 수 있는 숙주 세포 및 각종 키랄 화합물을 합성하기 위한 상기 조작된 케토리덕타제 효소의 사용 방법을 제공한다.

Description

케토리덕타제 폴리펩티드 및 이의 용도{KETOREDUCTASE POLYPEPTIDES AND USES THEREOF}
1. 관련 출원에 대한 상호 참조
본 출원은 35 U.S.C. §119(e) 하에 그 내용이 본원에 참조문헌으로 포함되는 2007년 9월 28일에 출원된 미국 출원 일련 번호 제60/976,345호의 이익을 주장한다.
2. 서열 목록, 표 또는 컴퓨터 프로그램에 대한 참조
파일명 376247-018.txt로서 EFS-웹(EFS-Web)을 통해 컴퓨터 판독형 형태(CRF)로 37 C.F.R. 1.821 하에 본원과 함께 동시 제출된 서열 목록이 본원에 참조로 포함된다. 서열 목록의 전자 사본은 254 킬로바이트의 파일 크기로 2008년 9월 28일에 작성되었다.
3. 배경기술
케토리덕타제(KRED) 또는 카르보닐 리덕타제 부류(EC1.1.1.184)에 속하는 효소는 상응하는 전입체이성체 케톤 기질 및 상응하는 라세미 알데히드 기질로부터 광학 활성 알콜을 합성하는 데 유용하다. KRED는 전형적으로 케톤 또는 알데히드를 상응하는 알콜 생성물로 전환시키나, 역반응, 즉 알콜 기질의 상응하는 케톤/알데히드 생성물로의 산화를 촉매할 수도 있다. KRED와 같은 효소에 의한 케톤 및 알데히드의 환원 및 알콜의 산화는 산화 반응을 위해 보조인자, 가장 통상적으로는 환원된 니코틴아미드 아데닌 디뉴클레오티드(NADH) 또는 환원된 니코틴아미드 아데닌 디뉴클레오티드 포스페이트(NADPH) 및 니코틴아미드 아데닌 디뉴클레오티드(NAD) 또는 니코틴아미드 아데닌 디뉴클레오티드 포스페이트(NADP)를 필요로 한다. NADH 및 NADPH는 전자 공여체로서 작용하는 한편, NAD 및 NADP는 전자 수용체로서 작용한다. 케토리덕타제 및 알콜 탈수소효소가 인산화 또는 비인산화 보조인자 중 하나를 (그것의 산화 및 환원 상태로) 수용하는 것이 빈번히 관찰된다.
KRED 효소는 광범위한 세균 및 효모에서 발견될 수 있다(검토를 위해, 문헌[Kraus and Waldman, 1995, Enzyme catalysis in organic synthesis, Vols. 1 & 2, VCH Weinheim]; 문헌[Faber, K., Biotransformations in organic chemistry, 4th Ed. Springer, Berlin Heidelberg New York. 2000]; 문헌[Hummel and Kula, 1989, Eur. J. Biochem. 184:1-13] 참조). 수가지 KRED 유전자 및 효소 서열, 예컨대 칸디다 마그놀리아(Candida magnoliae)(유전자은행 등록 번호 JC7338; GI:11360538), 칸디다 파라프실로시스(Candida parapsilosis)(유전자은행 등록 번호 BAA24528.1; GI:2815409), 스포로볼로마이세스 살모니콜로르(Sporobolomyces salmonicolor)(유전자은행 등록 번호 AF160799; GI:6539734)가 보고되어 있다.
핵심 화합물의 제조를 위한 다수의 화학적 합성 절차를 피하기 위해, 상이한 케토 및 알데히드 기질을 키랄 알콜 생성물로 효소에 의해 전환시키기 위해 케토리덕타제의 이용이 점차 증가하고 있다. 이러한 용도는 생촉매성 케톤 환원을 위해 케토리덕타제를 발현하는 전체 세포를 사용할 수 있거나, 전체 세포 내 다수의 케토리덕타제의 존재가 원하는 생성물의 입체순도 및 수율에 영향을 미치는 경우에는 정제 효소를 사용할 수 있다. 시험관내 용도에 대해, 글루코스 탈수소효소(GDH), 포르메이트 탈수소효소 등과 같은 보조인자(NADH 또는 NADPH) 재생 효소를 케토리덕타제와 함께 사용한다. 유용한 화학 화합물을 생성시키는 케토리덕타제를 사용하는 예로는 4-클로로아세토아세테이트 에스테르의 비대칭 환원(문헌[Zhou, 1983 J. Am. Chem. Soc. 105:5925-5926]; 문헌[Santaniello, J. Chem. Res. (S) 1984:132-133]; 미국 특허 제5,559,030호; 미국 특허 제5,700,670호 및 미국 특허 제5,891,685호, 디옥소카르복실산의 환원(예를 들면, 미국 특허 제6,399,339호, tert-부틸(S) 클로로-5-히드록시-3-옥소헥사노에이트의 환원(예를 들면, 미국 특허 제6,645,746호 및 WO 제01/40450호, 피롤로트리아진계 화합물의 환원(예를 들면, 미국 출원 제2006/0286646호, 치환 아세토페논의 환원(예를 들면, 미국 특허 제6,800,477호); 및 케토티올란의 환원(WO 제2005/054491호)을 들 수 있다.
각종 케토 및 알데히드 기질을 그것의 상응하는 키랄 알콜 생성물로 전환시키기 위해 사용될 수 있는 기타 케토리덕타제를 동정하는 것이 바람직하다.
4. 개요
일 양태에서, 본 개시내용은 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]벤조산 메틸 에스테르("기질")를 케토리덕타제 폴리펩티드를 코딩하는 폴리뉴클레오티드인 (S,E)-메틸 2-(3-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-하이드록시프로필)벤조에이트("생성물")로 환원 또는 전환시킬 수 있는 케토리덕타제 폴리펩티드 및 상기 폴리펩티드의 사용 방법을 제공한다. 비교하자면, 천연 케토리덕타제는 특정 케톤 기질을 상응하는 알콜 생성물로 환원 또는 전환시키는 데 있어서 유의적 활성을 나타내지 않는다.
본 개시내용의 조작된 케토리덕타제 폴리펩티드는 락토바실루스 종 케토리덕타제로부터 유래한다. 그 자체로, 몇몇 실시양태에서, 본 개시내용의 조작된 케토리덕타제 폴리펩티드는 락토바실루스 종(Lactobacillus sp .), 예를 들면 락토바실루스 케피르(Lactobacillus kefir)("엘. 케피르"; 서열 번호 4), 락토바실루스 브레비스(Lactobacillus brevis)("엘. 브레비스"; 서열 번호 2) 및 락토바실루스 미노르(Lactobacillus minor)("엘. 미노르", 서열 번호 114)로부터 입수한 천연 야생형 케토리덕타제 효소와 비교하여 특정 케톤 기질을 상응하는 알콜 생성물로 전환시키는 데 있어서 활성이 증가된다. 몇몇 실시양태에서, 상기 조작된 케토리덕타제는 서열 번호 2, 4 또는 114의 서열과 비교하여 적어도 (1) 190번 위치(즉, X190)에 해당하는 잔기가 구속성 잔기인 특징 및 (2) 위치 202번 위치(즉, X202)에 해당하는 잔기가 방향족 잔기인 특징을 갖는다. 몇몇 실시양태에서, 본 개시내용의 케토리덕타제는 서열 번호 2, 4 또는 114의 서열과 비교하여 적어도 (1) 190번 위치(즉, X190)에 해당하는 잔기가 구속성 잔기인 특징, (2) 195번 위치(즉, X195)에 해당하는 잔기가 염기성, 산성, 비극성 또는 극성 잔기인 특징 및 (3) 202번 위치(X202)에 해당하는 잔기가 방향족 잔기인 특징을 갖는다.
상기 기재된 특징 이외에, 상기 케토리덕타제는 다른 잔기 위치에서 서열 번호 2, 4 또는 114의 서열과 비교하여 하나 이상의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 본원에서 상기 케토리덕타제 폴리펩티드는 X190에 해당하는 잔기가 구속성 잔기, 특히 프롤린인 특징 및 X202에 해당하는 잔기가 방향족 잔기, 특히 트립토판인 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 약 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제 폴리펩티드는 적어도 상술한 특징, 즉 X190에 해당하는 잔기가 구속성 잔기인 특징 및 X202에 해당하는 잔기가 방향족 잔기인 특징을 갖는다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 적어도 X190에 해당하는 잔기가 프롤린인 특징 및 X202에 해당하는 잔기가 트립토판인 특징을 갖는다.
몇몇 실시양태에서, 본원의 케토리덕타제 폴리펩티드는 X190에 해당하는 잔기가 구속성 잔기, 특히 프롤린인 특징, X195에 해당하는 잔기가 염기성, 산성, 비극성 또는 극성 잔기, 특히 프롤린, 아르기닌, 리신, 아스파르트산 또는 아스파라긴인 특징 및 X202에 해당하는 잔기가 방향족 잔기, 특히 트립토판인 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 약 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제 폴리펩티드는 적어도 상술한 특징, 즉 X190에 해당하는 잔기가 구속성 잔기인 특징, X195에 해당하는 잔기가 염기성, 산성, 비극성 또는 극성 잔기인 특징 및 X202에 해당하는 잔기가 방향족 잔기인 특징을 갖는다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 적어도 X190에 해당하는 잔기가 프롤린인 특징, X195에 해당하는 잔기가 프롤린, 아르기닌, 리신, 아스파르트산 또는 아스파라긴인 특징 및 X202에 해당하는 잔기가 트립토판인 특징을 갖는다.
몇몇 실시양태에서, 예컨대 개선된 특성이 단일 잔기 차이 또는 특정 조합의 잔기 차이로부터 얻어지는 경우, 상기 조작된 케토리덕타제는 임의로 다른 위치에서 상기 폴리펩티드 기준 서열과 비교하여 하나 이상의 보존적 잔기 차이를 포함할 수 있다. 몇몇 실시양태에서, 다른 잔기 위치에서의 추가의 잔기 차이는 효소 특성에서 추가 개선을 생성하도록 도입될 수 있다. 이러한 개선은 추가로 정의된 기질에 대한 효소 활성 증가일 수 있지만, 또한 입체선택성, 열 안정성, 용매 안정성 증가 및/또는 생성물 억제 감소를 들 수 있다. 하나 이상의 개선된 효소 특성을 생성시킬 수 있는 각종 잔기 차이는 상세한 설명에 기재되어 있다. 몇몇 실시양태에서, 상기 조작된 케토리덕타제 폴리펩티드는 서열 번호 111, 112 및 139에 놓인 서열 구조 또는 이의 영역, 예컨대 90번 내지 211번 잔기에 해당하는 잔기에 기초한다. 서열 번호 112는 엘. 케피르 케토리덕타제의 야생형 아미노산 서열(서열 번호 4)에 기초하고, 서열 번호 111은 엘. 브레비스 케토리덕타제의 야생형 아미노산 서열(서열 번호 2)에 기초하며, 서열 번호 139는 엘. 미노르 케토리덕타제의 야생형 아미노산 서열(서열 번호 114)에 기초한다. 상기 서열 구조는 X190에 해당하는 잔기가 구속성 잔기이고, X195에 해당하는 잔기가 염기성, 산성, 비극성 또는 극성 잔기이며, X202에 해당하는 잔기가 방향족 잔기인 것을 특정하고 있다. 또한, 상기 서열 구조는 상세한 설명에 기재된 바대로 다른 잔기 위치에서의 특징을 특정하고 있다.
몇몇 실시양태에서, 본 개시내용의 케토리덕타제 폴리펩티드는 효소 활성의 속도, 즉 상기 기질을 상기 생성물로 전환시키는 속도와 관련하여 서열 번호 2, 4 또는 114와 비교하여 향상된다. 향상량은 상응하는 야생형 또는 기준 케토리덕타제 효소의 효소 활성의 1.5배(또는 배수)로부터 2배, 5배, 10배, 20배, 25배, 50배, 75배, 100배 또는 그 이상의 범위일 수 있다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 서열 번호 4 또는 서열 번호 90의 폴리펩티드에 의해 나타나는 전환율에 비해 적어도 5배, 10배, 25배, 50배, 75배, 100배, 150배, 200배, 250배, 300배, 500배 또는 1000배의 전환율로 상기 기질을 상기 생성물로 전환시킬 수 있다.
몇몇 실시양태에서, 상기 조작된 케토리덕타제 폴리펩티드는 서열 번호 90의 아미노산 서열을 갖는 기준 폴리펩티드에 비해 향상된 전환율로 기질 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]벤조산 메틸 에스테르를 상기 생성물 (S,E)-메틸 2-(3-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-하이드록시프로필)벤조에이트로 전환시킬 수 있고, 상기 기질을 적어도 약 95%의 입체이성체 잉여율(percent stereomeric excess)로 상기 생성물로 전환시킬 수 있다. 상기 특징을 갖는 폴리펩티드의 예로는 서열 번호 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 92, 94, 96, 98, 100, 102, 104, 106, 108 및 110에 해당하는 아미노산 서열을 포함하는 폴리펩티드를 들 수 있지만, 이들로 제한되지는 않는다.
몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 또한 상기 기질을 적어도 약 99%의 입체이성체 잉여율로 상기 생성물로 전환시킬 수 있다. 상기 특징을 갖는 폴리펩티드의 예로는 서열 번호 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 92, 94, 96, 98, 100, 102, 104, 106, 108 및 110에 해당하는 아미노산 서열을 포함하는 폴리펩티드를 들 수 있지만, 이들로 제한되지는 않는다. 서열 번호 90의 아미노산 서열을 갖는 기준 폴리펩티드가 일정한 전환율(예를 들면, 24시간 내에 1 g/L 기질의 10∼20%가 약 10 g/L의 KRED에 의해 생성물로 전환됨)로 및 야생형(서열 번호 4)에 비해 개선된 입체선택성(99% 입체이성체 잉여율)으로 상기 기질을 상기 생성물로 전환시킬 수 있으므로, 서열 번호 90에 비해 향상된 본원의 폴리펩티드는 또한 야생형에 비해 향상된다.
몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 적어도 약 99%의 입체이성체 잉여율로 및 서열 번호 90의 아미노산 서열을 갖는 기준 폴리펩티드에 비해 적어도 1∼50배 향상된 전환율로 기질 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]벤조산 메틸 에스테르를 생성물 (S,E)-메틸 2-(3-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-하이드록시프로필)벤조에이트로 전환시킬 수 있다. 상기 특징을 갖는 폴리펩티드의 예로는 서열 번호 42, 44, 46, 48, 86, 88, 92, 94, 96, 100 또는 102에 해당하는 아미노산 서열을 포함하는 폴리펩티드를 들 수 있지만, 이들로 제한되지는 않는다.
몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 적어도 약 99%의 입체이성체 잉여율로 및 서열 번호 90의 아미노산 서열을 갖는 기준 폴리펩티드에 비해 적어도 50∼250배 향상된 전환율로 기질 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]벤조산 메틸 에스테르를 생성물 (S,E)-메틸 2-(3-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-하이드록시프로필)벤조에이트로 전환시킬 수 있다. 상기 특징을 갖는 폴리펩티드의 예로는 서열 번호 10, 32, 34, 36, 50, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 98, 104, 106 및 108에 해당하는 아미노산 서열을 포함하는 폴리펩티드를 들 수 있지만, 이들로 제한되지는 않는다.
몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 적어도 약 99%의 입체이성체 잉여율로 및 서열 번호 90의 아미노산 서열을 갖는 기준 폴리펩티드에 비해 적어도 250∼1000배 향상된 전환율로 기질 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]벤조산 메틸 에스테르를 생성물 (S,E)-메틸 2-(3-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-하이드록시프로필)벤조에이트로 전환시킬 수 있다. 상기 특징을 갖는 폴리펩티드의 예로는 서열 번호 12, 18, 22, 24, 26, 28, 30, 38, 40, 52, 54, 56, 58, 60, 62 및 110에 해당하는 아미노산 서열을 포함하는 폴리펩티드를 들 수 있지만, 이들로 제한되지는 않는다.
몇몇 실시양태에서, 본 발명은 적어도 약 99%의 입체이성체 잉여율로 및 서열 번호 90의 아미노산 서열을 갖는 기준 폴리펩티드에 비해 적어도 1000배 향상된 전환율로 기질 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]벤조산 메틸 에스테르를 생성물 (S,E)-메틸 2-(3-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-하이드록시프로필)벤조에이트로 전환시킬 수 있는 케토리덕타제 폴리펩티드를 제공한다. 상기 특징을 갖는 폴리펩티드의 예로는 서열 번호 6, 8, 14, 16 및 20에 해당하는 아미노산 서열을 포함하는 폴리펩티드를 들 수 있지만, 이들로 제한되지는 않는다.
몇몇 실시양태에서, 본 개시내용의 향상된 케토리덕타제 폴리펩티드는 또한 서열 번호 90의 아미노산 서열을 갖는 기준 폴리펩티드에 비해 상기 기질의 상기 생성물로의 전환에 대한 경쟁적 억제제로서의 아세톤에 대한 내성이 향상된다. 이러한 향상된 아세톤 내성을 갖는 폴리펩티드의 예로는 서열 번호 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 98, 104, 106, 108 및 110에 해당하는 아미노산 서열을 포함하는 폴리펩티드를 들 수 있지만, 이들로 제한되지는 않는다.
몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는, 약 100 g/L 초과의 기질 및 약 5 g/L 미만의 폴리펩티드를 사용하여 수행할 때, 약 24시간 미만 내에 상기 기질의 약 95% 이상을 상기 생성물로 전환시킬 수 있다. 이러한 능력을 갖는 폴리펩티드의 예로는 서열 번호 6, 8, 14, 16 및 20에 해당하는 아미노산 서열을 포함하는 폴리펩티드를 들 수 있지만, 이들로 제한되지는 않는다.
몇몇 실시양태에서, 본 개시내용의 케토리덕타제 고도로 입체선택적이어서, 약 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8% 또는 99.9% 초과의 입체이성체 잉여율로 상기 기질을 상기 생성물로 환원시킬 수 있다. 이러한 높은 입체선택성을 갖는 케토리덕타제 폴리펩티드의 예로는 서열 번호 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108 및 110에 해당하는 아미노산 서열을 포함하는 폴리펩티드를 들 수 있지만, 이들로 제한되지는 않는다.
다른 양태에서, 본 개시내용은 고도로 엄격한 조건하에 본원에 기재된 조작된 케토리덕타제를 코딩하는 폴리뉴클레오티드 또는 상기 폴리뉴클레오티드로 하이브리드화하는 폴리뉴클레오티드를 제공한다. 상기 폴리뉴클레오티드는 코딩되는 조작된 케토리덕타제의 발현에 유용한 프로모터 및 다른 조절 요소를 포함할 수 있고, 특정 원하는 발현 시스템에 최적화된 코돈을 이용할 수 있다. 폴리뉴클레오티드의 예로는 서열 번호 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107 또는 109를 들 수 있지만, 이들로 제한되지는 않는다. 폴리뉴클레오티드의 예로는 또한 서열 번호 111, 112 및 139의 서열 구조에 해당하는 폴리펩티드를 코딩하는 폴리뉴클레오티드를 들 수 있다.
다른 양태에서, 본 개시내용은 상기 폴리뉴클레오티드 및/또는 본원에 기재된 발현 벡터를 포함하는 숙주 세포를 제공한다. 상기 숙주 세포는 엘. 케피르 또는 엘. 브레비스 또는 엘. 미노르일 수 있거나, 상기 숙주 세포는 상이한 유기체일 수 있다. 상기 숙주 세포는 본원에 기재된 조작된 케토리덕타제 효소의 발현 및 단리에 사용될 수 있거나, 대안적으로 상기 숙주 세포는 상기 기질의 상기 입체이성체 생성물의 전환에 직접 사용될 수 있다.
전체 세포, 세포 추출물 또는 정제된 케토리덕타제 효소에 의해 본 방법을 수행하든지 간에, 단일 케토리덕타제 효소를 사용할 수 있거나, 대안적으로 2종 이상의 케토리덕타제 효소의 혼합물을 사용할 수 있다.
본원에 기재된 케토리덕타제 효소는 하기 구조식 I의 화합물, 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]벤조산 메틸 에스테르("기질") 내 케토 기의 하기 구조식 II의 상응하는 입체이성체 알콜 생성물, (S,E)-메틸 2-(3-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-하이드록시프로필)벤조에이트("생성물")로의 환원 반응을 촉매할 수 있다:
구조식 I
Figure pct00001
구조식 II
Figure pct00002
몇몇 실시양태에서, 본원에 기재된 케토리덕타제 효소는 하기 구조식 III의 화합물, 2-[2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]페닐]-2-프로판올(또한 "기질") 내 케토 기의 하기 구조식 IV의 상응하는 입체이성체 알콜 생성물, (S,E)-1-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-(2-(2-하이드록시프로판-2-일)페닐)프로판-1-올(구조식 III의 기질과 관련하여 "생성물"이라고도 함)로의 환원 반응을 촉매할 수 있다:
구조식 III
Figure pct00003
구조식 IV
Figure pct00004
따라서, 몇몇 실시양태에서, 본원은 구조식 I 또는 구조식 III의 기질을 구조식 II 또는 구조식 IV의 생성물로 각각 환원 또는 전환시키기에 적합한 반응 조건하에 상기 기질을 본 개시내용의 케토리덕타제 폴리펩티드와 접촉시키거나 항온처리하는 것을 포함하는 구조식 I 또는 구조식 III의 기질을 상응하는 알콜 생성물로 환원시키는 방법을 제공한다.
몇몇 실시양태에서, 본원에 제공된 케토리덕타제 폴리펩티드는 하기 구조식 V의 화합물 2-[1-[[(1R)-1-[3-[(E)-2-(7-클로로퀴놀린-2-일)에테닐]페닐]-3-[2-(2-하이드록시프로판-2-일)페닐]프로필]설파닐메틸]사이클로프로필]아세트산(이의 용매화물, 수화물 및 약학적으로 허용되는 염 포함)의 합성을 위한 중간체의 제조에 사용될 수 있다:
구조식 V
Figure pct00005
몇몇 실시양태에서, 구조식 V의 화합물의 합성을 위한 방법에서, 상기 방법에서의 단계는 구조식 I의 기질을 구조식 II의 생성물로 환원 또는 전환시키기에 적합한 반응 조건하에 본 개시내용의 케토리덕타제 폴리펩티드를 사용하여 상기 기질을 구조식 II의 생성물로 환원 또는 전환시키는 것을 포함할 수 있다.
몇몇 실시양태에서, 구조식 IV의 중간체가 또한 구조식 V의 화합물의 합성에서 사용될 수 있다. 따라서, 몇몇 실시양태에서, 구조식 V의 화합물의 합성을 위한 방법에서, 상기 방법에서의 단계는 구조식 III의 기질을 구조식 IV의 생성물로 환원 또는 전환시키기에 적합한 반응 조건하에 상기 기질을 본원에 개시된 케토리덕타제와 접촉시켜 상기 기질을 구조식 IV의 생성물로 환원 또는 전환시키는 것을 포함할 수 있다.
상기 기질을 상기 생성물로 환원시키는 방법의 몇몇 실시양태에서, 상기 기질은 약 99% 초과의 입체이성체 잉여율로 상기 생성물로 환원되고, 상기 케토리덕타제 폴리펩티드는 서열 번호 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 111 또는 112에 해당하는 서열을 포함한다.
상기 기질을 상기 생성물로 환원시키는 방법의 몇몇 실시양태에서, 약 100 g/L 초과의 기질 및 약 5 g/L 미만의 폴리펩티드를 사용하여 수행할 때, 상기 기질의 약 95% 이상은 약 24시간 미만 내에 상기 생성물로 전환되고, 여기서 상기 폴리펩티드는 서열 번호 6, 8, 14, 16 또는 20에 해당하는 아미노산 서열을 포함한다.
상기 기질을 상기 생성물로 환원시키는 방법의 몇몇 실시양태에서, 1 g/L 기질의 적어도 약 10∼20%는 약 24시간 미만 내에 약 10 g/L의 폴리펩티드에 의해 상기 생성물로 전환되고, 여기서 상기 폴리펩티드는 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 111 또는 112에 해당하는 아미노산 서열을 포함한다.
5. 도면의 간단한 설명
도 1은 구조식 I의 기질 화합물의 구조식 II의 상응하는 생성물로의 전환에 있어서 케토리덕타제(KRED)의 역할을 도시한 것이다. 이러한 환원은 본원에 기재된 KRED 및 보조인자, 예컨대 NADPH를 이용한다. 글루코스 탈수소효소(GDH)가 사용되어 NAD(P)+가 NAD(P)H로 전환/순환된다. 글루코스가 글루콘산으로 전환되고, 이는 다시 수산화나트륨의 첨가에 의해 이의 나트륨염(글루콘산 나트륨)으로 전환된다. 대안적으로, 2차 알콜 탈수소효소(예를 들면, KRED)가 사용되어 이소프로판올이 아세톤으로 전환되고 NAD(P)+가 NAD(P)H로 전환/순환될 수 있다.
6. 상세한 설명
6.1 정의
본원에 사용된 하기 용어들은 하기 의미를 가지는 것으로 의도된다.
"케토리덕타제" 및 "KRED"는 카르보닐 기를 그것의 상응하는 알콜로 환원시키는 효소 능력을 갖는 폴리펩티드를 의미하기 위해 본원에서 상호혼용된다. 더 구체적으로, 본 발명의 케토리덕타제 폴리펩티드는 구조식 I의 화합물을 구조식 II의 상응하는 생성물로 입체선택적으로 환원시킬 수 있다. 상기 폴리펩티드는 통상적으로 보조인자 환원된 니코틴아미드 아데닌 디뉴클레오티드(NADH) 또는 환원된 니코틴아미드 아데닌 디뉴클레오티드 포스페이트(NADPH)를 환원제로서 사용한다. 본원에 사용된 케토리덕타제는 천연(야생형) 케토리덕타제 및 인간 조작에 의해 생성된 비천연 조작된 폴리펩티드를 포함한다.
"코딩 서열"은 단백질의 아미노산 서열을 코딩하는 핵산의 부분(예를 들면, 유전자)을 의미한다.
"천연" 또는 "야생형"은 자연에서 발견되는 형태를 의미한다. 예를 들면, 천연 또는 야생형 폴리펩티드 또는 폴리뉴클레오티드 서열은 자연에서의 공급원으로부터 단리될 수 있고 인간 조작에 의해 의도적으로 변형되지 않은 유기체에 존재하는 서열이다.
"재조합"은 예를 들면 세포, 핵산 또는 폴리펩티드와 관련하여 사용될 때 자연에 존재하지 않는 방식으로 변형되거나, 이와 동일하지만 합성 물질로부터 및/또는 재조합 기술을 이용한 조작에 의해 제조되거나 유래되는 물질 또는 천연 또는 본연 형태의 물질에 상응하는 물질을 의미한다. 이의 비제한적인 예로는 무엇보다 본연(비재조합) 형태의 세포에서는 발견되지 않거나 다른 방식으로는 상이한 수준으로 발현되는 본연의 유전자를 발현하는 재조합 세포를 들 수 있다.
"서열 동일성(%)" 및 "상동성(%)"은 폴리뉴클레오티드 및 폴리펩티드 간의 비교를 의미하기 위해 본원에서 상호혼용되고, 2개의 최적 정렬된 서열을 비교창과 비교함으로써 측정하고, 여기서 비교창 내 폴리뉴클레오티드 또는 폴리펩티드 서열의 일부는 2개의 서열의 최적 정렬에 대해 (부가 또는 결실을 포함하지 않는) 기준 서열과 비교하여 부가 또는 결실(즉, 간격)을 포함할 수 있다. 백분율은 동일한 핵산 염기 또는 아미노산 잔기가 서열 둘 다에 존재하는 위치의 수를 측정하여 일치된 위치의 수를 얻고, 그 일치된 위치의 수를 비교창 내 위치의 총 수로 나눈 후, 그 결과에 100을 곱하여 서열 동일성(%)을 얻음으로써 계산할 수 있다. 대안적으로, 백분율은 동일한 핵산 염기 또는 아미노산 잔기가 서열 둘 다에 존재하거나, 핵산 염기 또는 아미노산 잔기가 간격으로 정렬되는 위치의 수를 측정하여 일치된 위치의 수를 얻고, 그 일치된 위치의 수를 비교창 내 위치의 총 수로 나눈 후, 그 결과에 100을 곱하여 서열 동일성(%)을 얻음으로써 계산할 수 있다. 당업자라면 2개의 서열을 정렬하는 데 이용가능한 다수의 확립된 알고리즘이 있다는 것을 명확히 알 것이다. 비교를 위한 서열의 최적 정렬은 예를 들면 문헌[Smith and Waterman, 1981, Adv. Appl. Math. 2:482]의 국소적 상동성 알고리즘에 의해, 문헌[Needleman and Wunsch, 1970, J. Mol. Biol. 48:443]의 상동성 정렬 알고리즘에 의해, 문헌[Pearson and Lipman, 1988, Proc. Natl. Acad. Sci. USA 85:2444]의 유사성 방법을 조사하여, 이들 알고리즘의 컴퓨터화(GCG 위스콘신 소프트웨어 팩키지(GCG Wisconsin Software Package)의 GAP, BESTFIT, FASTA 및 TFASTA)를 수행하여 또는 영상 조사(일반적으로 문헌[Current Protocols in Molecular Biology, F. M. Ausubel et al., eds., Current Protocols, a joint venture between Greene Publishing Associates, Inc. and John Wiley & Sons, Inc.,(1995 추록)(Ausubel)] 참조)에 의해 수행할 수 있다. 서열 동일성 및 서열 유사성(%)을 결정하는 데 적절한 알고리즘의 예로는 각각 문헌[Altschul et al., 1990, J. Mol. Biol. 215: 403-410] 및 문헌[Altschul et al., 1977, Nucleic Acids Res. 3389-3402]에 기재된 BLAST 및 BLAST 2.0 알고리즘이 있다. BLAST 분석을 수행하기 위한 소프트웨어는 국립 생명과학 정보센터(National Center for Biotechnology Information) 웹사이트를 통해 공개적으로 입수가능하다. 이 알고리즘은 데이터베이스 서열에서 동일한 길이의 단어로 정렬될 때 일부의 양의 값 임계 점수 T에 일치하거나 이를 만족시키는 쿼리(query) 서열 내 길이 W의 짧은 단어를 확인함으로써 고 점수 서열 쌍(high scoring sequence pair, HSP)을 먼저 확인하는 것을 수반한다. T는 이웃 단어 점수 임계치(neighborhood word score threshold)로 지칭된다(문헌[Altschul et al., 이하 상기와 동일]). 이러한 초기 이웃 단어 히트(hit)는 이를 포함하는 더 긴 HSP를 찾기 위한 조사를 개시하기 위한 근원으로서 작용한다. 이후, 누적 정렬 점수가 증가할 수 있는 만큼 각각의 서열을 따른 양 방향으로 단어 히트를 연장시킨다. 누적 점수는 뉴클레오티드 서열에 대해 변수 M(일치 잔기의 쌍에 대한 보상 점수; 항상 > 0) 및 N(불일치 잔기에 대한 페널티 점수; 항상 < 0)을 사용하여 계산한다. 아미노산 서열에 대해, 점수 매김 행렬을 사용하여 누적 점수를 계산한다. 누적 정렬 점수가 이의 최대 달성치로부터 X 양만큼 떨어질 경우, 누적 점수가 1 이상의 음의 점수 매김 잔기 정렬의 축적으로 인해 0 이하로 내려갈 경우 또는 어느 한쪽 서열 말단에 도달할 경우, 각각의 방향으로의 단어 히트의 연장을 정지시킨다. BLAST 알고리즘 변수 W, T 및 X는 정렬의 민감도 및 속도를 결정짓는다. (뉴클레오티드 서열에 대한) BLASTN 프로그램은 디폴트로서 11의 단어 길이(W), 10의 기대값(E), M=5, N=-4 및 양 가닥의 비교를 이용한다. 아미노산 서열에 대해, BLASTP 프로그램은 디폴트로서 3의 단어 길이(W), 10의 기대치(E) 및 BLOSUM62 점수 매김 행렬을 이용한다(문헌[Henikoff and Henikoff, 1989, Proc Natl Acad Sci USA 89:10915] 참조). 서열 정렬 및 서열 동일성(%)의 결정의 예로는 제공된 디폴트 변수를 이용하여 GCG 위스콘신 소프트웨어 팩키지(아썰리즈(Accelrys), 미국 위스콘신주 매디슨 소재)의 BESTFIT 또는 GAP 프로그램을 사용할 수 있다.
"기준 서열"은 서열 비교를 위한 기초로서 사용되는 소정의 서열을 의미한다. 기준 서열은 더 큰 서열의 부분 집합, 예컨대 전장 유전자 또는 폴리펩티드 서열의 분절일 수 있다. 일반적으로, 기준 서열은 적어도 20개의 뉴클레오티드 또는 아미노산 잔기의 길이, 적어도 25개의 잔기의 길이, 적어도 50개의 잔기의 길이 또는 핵산 또는 폴리펩티드의 전체 길이이다. 2개의 폴리뉴클레오티드 또는 폴리펩티드는 각각 (1) 2개의 서열 사이에 유사한 서열(즉, 완전 서열의 부분)을 포함할 수 있고, (2) 2개의 서열 사이에 분기하는 서열을 더 포함할 수 있는데, 2개(또는 그 이상)의 폴리뉴클레오티드 또는 폴리펩티드 사이의 서열 비교는 통상적으로 서열이 유사한 국소 영역을 확인하고 비교하기 위해 "비교창"에 대해 2개의 폴리뉴클레오티드의 서열을 비교하여 수행한다.
몇몇 실시양태에서, "기준 서열"은 일차 아미노산 서열에 기초할 수 있고, 여기서 기준 서열은 일차 서열에 하나 이상의 변화를 가질 수 있는 서열이다. 예를 들면, "X190에 해당하는 잔기에 프롤린을 갖는 서열 번호 4에 기초한 기준 서열"은 서열 번호 4에서 X190에 해당하는 잔기를 프롤린으로 변화시킨 기준 서열을 의미한다.
"비교창"은 서열을 적어도 20개의 인접 뉴클레오티드 또는 아미노산의 기준 서열과 비교할 수 있고 비교창 내 서열의 일부가 2개 서열의 최적 정렬을 위한 (부가 또는 결실을 포함하지 않는) 기준 서열과 비교하여 20% 이하의 부가 또는 결실(즉, 간격)을 포함할 수 있는, 적어도 약 20개의 인접 뉴클레오티드 위치 또는 아미노산 잔기의 개념적인 분절을 의미한다. 비교창은 20개의 인접 잔기보다 더 길 수 있으며, 이로는 임의로 30개, 40개, 50개, 100개 또는 그 이상의 길이의 창을 들 수 있다.
"실질적 동일성"은 적어도 20개의 잔기 위치의 비교창에서, 흔히 적어도 30개∼50개의 잔기의 비교창에서 기준 서열과 비교하여 적어도 80%의 서열 동일성, 적어도 85%의 서열 동일성 및 89 내지 95%의 서열 동일성, 더 일반적으로는 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드 또는 폴리펩티드 서열을 의미하고, 여기서 서열 동일성(%)은 기준 서열을 비교창에서 기준 서열의 총 20% 이하의 결실 또는 부가를 포함하는 서열과 비교하여 계산한다. 폴리펩티드에 적용되는 특정 실시양태에서, "실질적 동일성"이란 용어는 디폴트 간격 중량(default gap weight)을 이용하여 예컨대 프로그램 GAP 또는 BESTFIT에 의해 최적 정렬시킬 경우의 2개의 폴리펩티드 서열이 적어도 80%의 서열 동일성, 바람직하게는 적어도 89%의 서열 동일성, 적어도 95%의 서열 동일성 또는 그 이상(예를 들면, 99%의 서열 동일성)을 공유한다는 것을 의미한다. 바람직하게, 동일하지 않은 잔기 위치는 보존적 아미노산 치환과 상이하다.
소정 아미노산 또는 폴리뉴클레오티드 서열의 번호 매김에 있어서 사용될 때 "∼에 해당하는", "∼과 관련하여" 또는 "∼에 대한"은 소정의 아미노산 또는 폴리뉴클레오티드 서열을 기준 서열과 대비할 때의 특정 기준 서열의 잔기의 번호 매김을 지칭한다. 즉, 소정의 중합체의 잔기 수 또는 잔기 위치를 소정의 아미노산 또는 폴리뉴클레오티드 서열 내 잔기의 실제의 수 위치보다는 기준 서열에 대해 지정한다. 예를 들면, 조작된 케토리덕타제의 아미노산 서열과 같은 소정의 아미노산 서열은 2개의 서열 사이의 잔기 일치를 최적화하기 위해 간격을 도입함으로써 기준 서열로 정렬될 수 있다. 이 경우, 간격이 존재할지라도, 소정의 아미노산 또는 폴리뉴클레오티드 서열 내의 잔기를 그것의 정렬되는 기준 서열에 대해 번호 매긴다.
"입체선택성"은 화학 반응 또는 효소 반응에서 하나의 입체이성체가 다른 입체이성체에 비해 우선적으로 형성되는 것을 의미한다. 하나의 입체이성체의 형성이 다른 입체이성체에 비해 선호되는 경우에 입체선택성은 부분적일 수 있거나, 하나의 입체이성체만이 형성되는 경우에 입체선택성은 완전할 수 있다. 입체이성체가 거울상 이성체일 경우, 입체선택성은 거울상선택성, 즉 거울상 이성체 둘 다의 합에서 하나의 거울상 이성체의 분율(통상적으로 (%)로 기재)을 의미한다. 대안적으로, 이는 당업계에서 [주 거울상 이성체-부 거울상 이성체]/[주 거울상 이성체+부 거울상 이성체]의 식에 따라 이로부터 계산된 거울상 이성체 잉여율(e.e.)(통상적으로 (%)로 기재)로 기재한다. 입체이성체가 부분입체이성체일 경우, 입체선택성은 부분 입체선택성, 즉 2개의 부분입체이성체의 혼합물에서 하나의 부분입체이성체의 분율(통상적으로 대안적으로 부분입체이성체 잉여율(d.e.)로 기재)을 의미한다. 거울상 이성체 잉여 및 부분입체이성체 잉여는 입체이성체 잉여의 종류이다.
"고도로 입체선택성"은 상기 기질을 상응하는 (S) 생성물로 적어도 약 99% 입체이성체 잉여율로 전환 또는 환원시킬 수 있는 케토리덕타제 폴리펩티드를 의미한다.
"입체특이성"은 화학 반응 또는 효소 반응에서 하나의 입체이성체가 다른 입체이성체에 비해 우선적으로 전환되는 것을 의미한다. 하나의 입체이성체의 전환이 다른 입체이성체에 비해 선호되는 경우에 입체특이성은 부분적일 수 있거나, 하나의 입체이성체만이 전환되는 경우에 입체특이성은 완전할 수 있다.
"화학선택성"은 화학 반응 또는 효소 반응에서 하나의 생성물이 다른 생성물에 비해 우선적으로 형성되는 것을 의미한다.
"향상된 효소 특성"은 케토리덕타제 폴리펩티드가 기준 케토리덕타제와 비교하여 임의의 효소 특성에 있어서 향상을 나타내는 케토리덕타제 폴리펩티드를 의미한다. 본원에 기재된 조작된 케토리덕타제 폴리펩티드의 경우, 몇몇 실시양태에서 기준 케토리덕타제가 다른 향상된 조작된 케토리덕타제일 수도 있지만, 일반적으로 야생형 케토리덕타제에 대해 비교한다. 향상이 바람직한 효소 특성으로는 효소 활성(이는 기질의 전환율로 표시함), 열 안정성, 용매 안정성, pH 활성 프로파일, 보조인자 요건, 억제제에 대한 불응도(예를 들면, 생성물 억제), 입체특이성 및 입체선택성(입체이성체 선택성 포함)을 들 수 있지만, 이들로 제한되지는 않는다.
"효소 활성 증가"는 기준 케토리덕타제 효소와 비교하여 특정 활성(예를 들면, 제조된 생성물/시간/단백질 중량) 증가 또는 기질의 생성물로의 전환율(%)(예를 들면, 특정량의 KRED를 사용하여 특정 기간 동안에 출발량의 기질이 생성물로 전환되는 백분율) 증가로 표시될 수 있는, 조작된 케토리덕타제 폴리펩티드의 향상된 특성을 의미한다. 효소 활성을 측정하기 위한 방법의 예는 실시예에 기재되어 있다. 효소 활성을 증가시킬 수 있는 변화인 Km, Vmax 또는 kcat의 전통적인 효소 특징을 비롯한, 효소 활성과 관련된 임의의 특성이 영향을 받을 수 있다. 효소 활성 향상은 상응하는 야생형 케토리덕타제 효소의 효소 활성보다 약 1.5배 내지 천연 케토리덕타제 또는 케토리덕타제 폴리펩티드가 유래되는 기타 조작된 케토리덕타제보다 2배, 5배, 10배, 20배, 25배, 50배, 75배, 100배 또는 그 이상 더 클 수 있다. 특정 실시양태에서, 조작된 케토리덕타제 효소는 모 케토리덕타제 효소보다 1.5배 내지 50배, 1.5배 내지 100배를 초과하는 범위의 향상된 효소 활성을 나타낸다. 당업자라면 임의의 효소의 활성이 촉매 전환 속도가 임의의 필요한 보조인자를 포함하는 기질의 확산 속도를 초과할 수 없도록 확산에 한계가 있다는 것을 이해할 것이다. 확산 한계의 이론적 최대치 또는 kcat/Km은 일반적으로 약 108 내지 109(M-1s-1)이다. 따라서, 상기 케토리덕타제의 임의의 효소 활성 향상은 케토리덕타제 효소에 의해 작용하는 기질의 확산 속도와 관련하여 상한을 가질 수 있다. 케토리덕타제 활성은 산화와 함께 케톤의 알콜로의 동시 환원으로 인한 NADPH의 흡수도 또는 형광의 감소와 같은 케토리덕타제의 측정에 이용되는 표준 분석 중 어느 하나에 의해 또는 연결 분석에서 생성되는 생성물에 의해 측정할 수 있다. 본원에 상세히 추가 설명된 바와 같이, 효소의 소정의 제조, 설정 조건 하에서의 소정의 분석 및 하나 이상의 소정의 기질을 사용하여 효소 활성을 비교한다. 일반적으로, 용해물을 비교할 때, 분석되는 단백질의 양 및 세포의 수를 측정할 뿐만 아니라, 숙주 세포에 의해 생성되고 용해물에 존재하는 효소의 양의 편차를 최소화하기 위해 동일한 발현 시스템 및 동일한 숙주 세포를 사용한다.
"전환"은 기질의 상응하는 생성물로의 효소에 의한 환원을 의미한다. "전환율(%)"은 특정 조건하에 일정 기간 내에 생성물로 환원되는 기질의 백분율을 의미한다. 따라서, 케토리덕타제 폴리펩티드의 "효소 활성" 또는 "활성"은 기질의 생성물로의 "전환율(%)"로 표시할 수 있다.
"열 안정성"은 케토리덕타제 폴리펩티드가 미처리 효소와 비교하여 일정 기간(예를 들면, 0.5 내지 24시간) 동안 고온(예를 들면, 40 내지 80℃)에 노출된 후 유사한 활성(예를 들면, 60 내지 80% 초과)을 유지하는 것을 의미한다.
"용매 안정성"은 케토리덕타제 폴리펩티드가 미처리 효소와 비교하여 일정 기간(예를 들면, 0.5 내지 24시간) 동안 각종 농도(예를 들면, 5 내지 99%)의 용매(이소프로필알콜, 테트라하이드로푸란, 2-메틸테트라하이드로푸란, 아세톤, 톨루엔, 부틸아세테이트, 메틸 tert-부틸에테르 등)에 노출된 후 유사한 활성(예를 들면, 60 내지 80% 초과)을 유지하는 것을 의미한다.
"pH 안정성"은 케토리덕타제 폴리펩티드가 미처리 효소와 대비하여 일정 기간(예를 들면, 0.5 내지 24시간) 동안 높거나 낮은 pH(예를 들면, 4.5∼6 또는 8∼12)에 노출된 후 유사한 활성(예를 들면, 60 내지 80% 초과)을 유지하는 것을 의미한다.
"열 안정성 및 용매 안정성"은 케토리덕타제 폴리펩티드가 열에 안정하면서 용매에도 안정하다는 것을 의미한다.
조작된 케토리덕타제 효소와 관련하여 본원에 사용된 "∼로부터 유래한"은 유래 케토리덕타제 효소 및/또는 조작의 기초가 되는 상기 케토리덕타제를 코딩하는 유전자를 지칭한다. 예를 들면, 서열 번호 90의 조작된 케토리덕타제 효소는 서열 번호 4의 락토바실러스 케피르 케토리덕타제 효소를 코딩하는 유전자를 다수 세대에 걸쳐 인공적으로 진화시켜 얻는다. 따라서, 이러한 조작된 케토리덕타제 효소는 서열 번호 4의 야생형 케토리덕타제"로부터 유래한다".
"친수성 아미노산 또는 잔기"는 문헌[Eisenberg et al., 1984, J. Mol. Biol. 179:125-142]의 정규화 공통 소수성 척도에 따라 0 미만의 소수성을 나타내는 측쇄를 갖는 아미노산 또는 잔기를 의미한다. 유전적으로 코딩된 친수성 아미노산으로는 L-Thr(T), L-Ser(S), L-His(H), L-Glu(E), L-Asn(N), L-Gln(Q), L-Asp(D), L-Lys(K) 및 L-Arg(R)을 들 수 있다.
"산성 아미노산 또는 잔기"는 아미노산이 펩티드 또는 폴리펩티드에 포함될 때 약 6 미만의 pK 값을 나타내는 측쇄를 갖는 친수성 아미노산 또는 잔기를 의미한다. 산성 아미노산은 통상적으로 수소 이온의 손실로 인해 생리학적 pH에서 음으로 하전된 측쇄를 갖는다. 유전적으로 코딩된 산성 아미노산으로는 L-Glu(E) 및 L-Asp(D)를 들 수 있다.
"염기성 아미노산 또는 잔기"는 아미노산이 펩티드 또는 폴리펩티드에 포함될 때 약 6 초과의 pK 값을 나타내는 측쇄를 갖는 친수성 아미노산 또는 잔기를 의미한다. 염기성 아미노산은 통상적으로 히드로늄 이온과의 회합으로 인해 생리학적 pH에서 양으로 하전된 측쇄를 갖는다. 유전적으로 코딩된 염기성 아미노산으로는 L-Arg(R) 및 L-Lys(K)를 들 수 있다.
"극성 아미노산 또는 잔기"는 생리학적 pH에서 하전되어 있지 않지만 2개의 원자에 의해 공통으로 공유하는 한 쌍의 전자가 그 원자 중 1개에 의해 더 가까이 고정되는 적어도 하나의 결합을 갖는 측쇄를 갖는 친수성 아미노산 또는 잔기를 의미한다. 유전적으로 코딩된 극성 아미노산으로는 L-Asn(N), L-Gln(Q), L-Ser(S) 및 L-Thr(T)를 들 수 있다.
"소수성 아미노산 또는 잔기"는 문헌[Eisenberg et al., 1984, J. Mol. Biol. 179:125-142]의 정규화 공통 소수성 척도에 따라 0 초과의 소수성을 나타내는 측쇄를 갖는 아미노산 또는 잔기를 의미한다. 유전적으로 코딩된 소수성 아미노산으로는 L-Pro(P), L-Ile(I), L-Phe(F), L-Val(V), L-Leu(L), L-Trp(W), L-Met(M), L-Ala(A) 및 L-Tyr(Y)를 들 수 있다.
"방향족 아미노산 또는 잔기"는 하나 이상의 방향족 또는 이종방향족 고리를 포함하는 측쇄를 갖는 친수성 또는 소수성 아미노산 또는 잔기를 의미한다. 유전적으로 코딩된 방향족 아미노산으로는 L-Phe(F), L-Tyr(Y) 및 L-Trp(W)를 들 수 있다. 이종방향족 질소 원자 L-His(H)의 pKa로 인해 이를 종종 염기성 잔기로 분류하거나, 이의 측쇄가 이종방향족 고리를 포함하기 때문에 방향족 잔기로 분류하지만, 본원에서는 히스티딘을 친수성 잔기 또는 "구속형 잔기"로 분류한다(하기 참조).
"구속형(constrained) 아미노산 또는 잔기"는 구속형 기하형태를 갖는 아미노산 또는 잔기를 의미한다. 본원에서 구속형 잔기로는 L-pro(P) 및 L-his(H)를 들 수 있다. 히스티딘은 구속형 기하형태를 갖는데, 이는 이것이 비교적 작은 이미다졸 고리를 갖기 때문이다. 프롤린은 구속형 기하형태를 가지는데, 이는 이것이 또한 5원 고리를 갖기 때문이다.
"비극성 아미노산 또는 잔기"는 생리학적 pH에서 하전되어 있지 않고 2개 원자에 의해 공통으로 공유하는 한 쌍의 전자가 일반적으로 2개 원자 각각에 의해 동일하게 고정되는 결합을 갖는 측쇄를 갖는 (즉, 측쇄는 극성이 아님) 소수성 아미노산 또는 잔기를 의미한다. 유전적으로 코딩된 비극성 아미노산으로는 L-Gly(G), L-Leu(L), L-Val(V), L-Ile(I), L-Met(M) 및 L-Ala(A)를 들 수 있다.
"지방족 아미노산 또는 잔기"는 지방족 탄화수소 측쇄를 갖는 소수성 아미노산 또는 잔기를 의미한다. 유전적으로 코딩된 지방족 아미노산으로는 L-Ala(A), L-Val(V), L-Leu(L) 및 L-Ile(I)를 들 수 있다.
"시스테인" 또는 L-Cys(C)는 이것이 다른 L-Cys(C) 아미노산 또는 다른 설파닐 또는 설프히드릴 함유 아미노산과 디설파이드 가교를 형성할 수 있다는 점에서 특이하다. "시스테인 유사 잔기"로는 시스테인 및 디설파이드 가교의 형성에 이용할 수 있는 설프히드릴 부분을 함유하는 다른 아미노산을 들 수 있다. L-Cys(C)(및 -SH 함유 측쇄를 갖는 다른 아미노산)이 환원된 유리 -SH 또는 산화된 디설파이드 가교 형태의 펩티드에 존재하는 능력은, L-Cys(C)가 펩티드에 대한 전체 소수성 또는 친수성 특성에 기여하는지의 여부에 영향을 미친다. L-Cys(C)가 아인스베르크(Eisenberg)의 정규화 공통 척도(문헌[Eisenberg et al., 1984, 이하 상기와 동일])에 따라 0.29의 소수도를 나타내지만, 본 개시내용에 있어서 L-Cys(C)는 그것의 고유의 독특한 기로 분류되는 것으로 이해되어야 한다.
"소형 아미노산 또는 소형 잔기"는 총 3개 이하의 탄소 및/또는 이종원자(α-탄소 및 수소 제외)로 이루어진 측쇄를 갖는 아미노산 또는 잔기를 의미한다. 소형 아미노산 또는 소형 잔기는 상기 정의에 따라 지방족, 비극성, 극성 또는 산성 소형 아미노산 또는 소형 잔기로 추가로 분류될 수 있다. 유전적으로 코딩된 소형 아미노산으로는 L-Ala(A), L-Val(V), L-Cys(C), L-Asn(N), L-Ser(S), L-Thr(T) 및 L-Asp(D)를 들 수 있다.
"히드록실 함유 아미노산 또는 잔기"는 히드록실(-OH) 부분을 포함하는 아미노산을 의미한다. 유전적으로 코딩된 히드록실 함유 아미노산으로는 L-Ser(S), L-Thr(T) 및 L-Tyr(Y)를 들 수 있다.
"보존적" 아미노산 치환 또는 돌연변이는 유사한 측쇄를 갖는 잔기의 상호 교환성을 의미하고, 따라서 통상적으로 폴리펩티드 내 아미노산이 동일 또는 유사한 소정의 부류의 아미노산 내 아미노산으로 치환되는 것을 수반한다. 그러나, 몇몇 실시양태에서, 본원에 사용되는 보존적 돌연변이는 친수성 잔기로부터 친수성 잔기로의 치환, 소수성 잔기로부터 소수성 잔기로의 치환, 히드록실 함유 잔기로부터 히드록실 함유 잔기로의 치환 또는 소형 잔기로부터 소형 잔기로의 치환을 포함하지 않으며, 그보다는 보존적 돌연변이는 지방족으로부터 지방족으로의 치환, 비극성으로부터 비극성으로의 치환, 극성으로부터 극성으로의 치환, 산성으로부터 산성으로의 치환, 염기성으로부터 염기성으로의 치환, 방향족으로부터 방향족으로의 치환 또는 구속형 잔기로부터 구속형 잔기로의 치환일 수 있다. 또한, 본원에 사용되는 A, V, L 또는 I는 다른 지방족 잔기 또는 다른 비극성 잔기로 보존적 돌연변이될 수 있다. 하기 표 1은 보존적 치환의 예를 나타낸 것이다.
[표 1] 보존적 치환
Figure pct00006
"비보존적 치환"은 폴리펩티드 내 아미노산의 상당히 상이한 측쇄 특성을 갖는 아미노산으로의 치환 또는 돌연변이를 의미한다. 비보존적 치환은 상기 기재된 소정의 기들 내의 아미노산보다는 소정의 기들 사이의 아미노산을 사용할 수 있다. 일 실시양태에서, 비보존적 돌연변이는 (a) 치환(예를 들면, 글리신 대신 프롤린) 영역 내 펩티드 주쇄의 구조, (b) 전하 또는 소수성 또는 (c) 측쇄의 벌크에 영향을 미친다.
"결실"은 기준 폴리펩티드에서 하나 이상의 아미노산을 제거함으로써 폴리펩티드가 변형되는 것을 의미한다. 결실은 효소 활성을 보유하고/하거나 조작된 케토리덕타제 효소의 향상된 특성을 보유하면서 폴리펩티드를 구성하는 아미노산의 총 수의 10% 이하로, 20% 이하로 또는 30% 이하로 1개 이상의 아미노산, 2개 이상의 아미노산, 5개 이상의 아미노산, 10개 이상의 아미노산, 15개 이상의 아미노산 또는 20개 이상의 아미노산을 제거하는 것을 포함할 수 있다. 결실은 폴리펩티드의 내부 부분 및/또는 말단 부분에 관한 것일 수 있다. 다양한 실시양태에서, 결실 부분은 연속적 분절을 포함할 수 있거나, 비연속적 분절일 수 있다.
"삽입"은 기준 폴리펩티드로부터 하나 이상의 아미노산을 추가하여 폴리펩티드를 변형하는 것을 의미한다. 몇몇 실시양태에서, 향상된 조작된 케토리덕타제 효소는 천연 케토리덕타제 폴리펩티드에 하나 이상의 아미노산을 삽입하는 것뿐만 아니라, 다른 향상된 케토리덕타제 폴리펩티드에 하나 이상의 아미노산을 삽입하는 것을 포함한다. 폴리펩티드의 내부 부분에 또는 카르복시 또는 아미노 말단에 삽입할 수 있다. 본원에 사용되는 삽입은 당업계에 공지된 바대로 융합 단백질을 포함한다. 삽입 부분은 아미노산의 인접 분절일 수 있거나, 천연 폴리펩티드 내 하나 이상의 아미노산에 의해 분리될 수 있다.
본원에 사용되는 "단편"은 아미노 말단 및/또는 카르복시 말단은 결실되어 있지만 나머지 아미노산 서열은 서열 내 해당하는 위치와 동일한 폴리펩티드를 의미한다. 단편은 적어도 14개의 아미노산의 길이, 적어도 20개의 아미노산의 길이, 적어도 50개의 아미노산의 길이 또는 그 이상의 아미노산의 길이 및 서열 번호 2 또는 서열 번호 4 또는 서열 번호 114의 전장 천연 케토리덕타제 폴리펩티드의 70%, 80%, 90%, 95%, 98% 및 99% 이하일 수 있다.
"단리된 폴리펩티드"는 자연적으로 동반되는 다른 오염물, 예를 들면 단백질, 지질 및 폴리뉴클레오티드로부터 실질적으로 분리된 폴리펩티드를 의미한다. 상기 용어는 이의 천연 환경 또는 발현 시스템(예를 들면, 숙주 세포 또는 시험관내 합성)으로부터 제거 또는 정제된 폴리펩티드를 포함한다. 향상된 케토리덕타제 효소는 세포 내에 존재할 수 있거나, 세포 매질에 존재할 수 있거나, 용해물 또는 단리된 조제물과 같은 각종 형태로 제조될 수 있다. 이와 같이, 몇몇 실시양태에서, 향상된 케토리덕타제 효소는 단리된 폴리펩티드일 수 있다.
"실질적으로 순수한 폴리펩티드"는 폴리펩티드 종이 존재하는 우세한 종(즉, 몰 또는 중량 기준으로 이것이 조성물 내 임의의 다른 각각의 거대분자 종보다 더욱 풍부한)인 조성물을 의미하며, 이는 일반적으로 대상 종이 몰 또는 중량%로 존재하는 거대분자 종의 적어도 약 50%를 포함할 경우 실질적으로 정제된 조성물이다. 일반적으로, 실질적으로 순수한 케토리덕타제 조성물은 몰 또는 중량%로 조성물에 존재하는 모든 거대분자 종의 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 95% 이상 및 약 98% 이상을 포함한다. 몇몇 실시양태에서, 대상 종은 실질적 동질성으로 정제되어 실질적으로 조성물이 단일 거대분자 종으로 구성된다(즉, 오염물 종은 종래 검출 방법에 의해 조성물에서 검출될 수 없다). 용매 종, 소분자(< 500 달톤) 및 원소 이온 종은 거대분자 종으로 고려되지 않는다. 몇몇 실시양태에서, 단리된 향상된 케토리덕타제 폴리펩티드는 실질적으로 순수한 폴리펩티드 조성물이다.
"엄격한 하이브리드화"는 본원에서 핵산 하이브리드가 안정한 조건을 의미하는 데 사용된다. 당업자에게 공지된 바와 같이, 하이브리드의 안정성은 하이브리드의 용융 온도(Tm)에 반영된다. 일반적으로, 하이브리드의 안정성은 이온 강도, 온도, G/C 함량 및 무질서 유발제(chaotropic agent)의 존재의 함수이다. 폴리뉴클레오티드에 대한 Tm 값은 예상된 용융 온도에 대해 공지된 방법을 이용하여 계산할 수 있다(예를 들면, 문헌[Baldino et al., Methods Enzymology 168:761-777]; 문헌[Bolton et al., 1962, Proc. Natl. Acad. Sci. USA 48: 1390]; 문헌[Bresslauer et al., 1986, Proc. Natl. Acad. Sci USA 83:8893-8897]; 문헌[Freier et al., 1986, Proc. Natl. Acad. Sci USA 83:9373-9377]; 문헌[Kierzek et al., Biochemistry 25:7840-7846]; 문헌[Rychlik et al., 1990, Nucleic Acids Res 18:6409-6412(erratum, 1991, Nucleic Acids Res 19:698)]; 문헌[Sambrook et al., 이하 상기와 동일]; 문헌[Suggs et al., 1981, In Developmental Biology Using Purified Genes(Brown et al., eds.), pp. 683-693, Academic Press]; 및 문헌[Wetmur, 1991, Crit Rev Biochem Mol Biol 26:227-259] 참조). 모든 간행물은 본원에 참조문헌으로 포함된다. 몇몇 실시양태에서, 상기 폴리뉴클레오티드는 본원에 개시된 폴리펩티드를 코딩하고, 본 개시내용의 조작된 케토리덕타제 효소를 코딩하는 서열의 보체에 적절히 엄격한 조건 또는 매우 엄격한 조건과 같은 소정의 조건 하에서 하이브리드화한다.
"하이브리드화 엄격성"은 핵산의 하이브리드화에 있어서 세정 조건과 같은 하이브리드화 조건에 관한 것이다. 일반적으로, 더 낮은 엄격한 조건하에 하이브리드화 반응을 수행한 후, 다양하나 더욱 엄격한 조건 하의 세정을 수행한다. "적당히 엄격한 하이브리드화"란 용어는 표적 DNA가 표적 DNA에 대해 약 60%의 서열 동일성, 약 75%의 서열 동일성, 약 85%의 서열 동일성, 약 90% 초과의 서열 동일성을 갖는 상보 핵산에 결합하도록 하는 조건을 의미한다. 적절히 엄격한 조건의 예로는 42℃에서 50% 포름아미드, 5×덴하르트 용액, 5×SSPE, 0.2% SDS 중의 하이브리드화 후 42℃에서 0.2×SSPE, 0.2% SDS 중의 세정과 균등한 조건이다. "높은 엄격성 하이브리드화"는 일반적으로 소정의 폴리뉴클레오티드 서열에 대한 용액 조건하에 결정할 때 열 용융 온도 Tm보다 약 10℃ 이하 더 낮은 조건을 의미한다. 몇몇 실시양태에서, 높은 엄격성 조건은 65℃에서 0.018 M NaCl 중에 안정한 하이브리드를 형성하는 핵산 서열만을 하이브리드화하는 조건(즉, 하이브리드가 65℃에서 0.018 M NaCl 중에 안정하지 않을 경우, 이는 본원에서 고려되는 바와 같이 높은 엄격성 조건하에 안정하지 않을 것임)을 의미한다. 높은 엄격성 조건은 예를 들면 42℃에서 50% 포름아미드, 5×덴하르트 용액, 5×SSPE, 0.2% SDS와 균등한 조건에서 하이브리드화한 후, 65℃에서 0.1×SSPE 및 0.1% SDS 중에서 세정하여 제공될 수 있다. 또 다른 높은 엄격성 조건은 65℃에서 0.1%(w:v) SDS를 함유하는 5×SSC에서 하이브리드화하고, 65℃에서 0.1% SDS를 함유하는 0.1×SSC 중에 세정하는 것과 균등한 조건에서 하이브리드화하는 것이다. 보통 정도의 엄격성 조건뿐만 아니라 다른 높은 엄격성 하이브리드화 조건이 상기 인용된 참고 문헌에 기재되어 있다.
"이종(heterologous)" 폴리뉴클레오티드는 실험실 기법에 의해 숙주 세포에 도입되는 임의의 폴리뉴클레오티드를 의미하며, 숙주 세포로부터 제거되어 실험실 조작을 실시한 후, 숙주 세포로 재도입되는 폴리뉴클레오티드를 포함한다.
"코돈 최적화"는 코딩된 단백질이 관심 있는 유기체에서 효율적으로 발현되도록, 단백질을 코딩하는 폴리뉴클레오티드의 코돈이 특정 유기체에 우선적으로 사용되도록 변화시키는 것을 의미한다. 유전자 코드는 대부분의 아미노산이 "동의" 또는 "동의적" 코돈으로 불리는 수개의 코돈에 의해 나타나는 축퇴성이지만, 특정 유기체에 의한 코돈 사용법은 무작위적이지 않으며 특정 코돈 트리플릿에 대해 편중되는 것으로 알려져 있다. 이러한 코돈 사용 편중은 소정의 유전자와 관련하여 공통 기능 또는 조상 기원의 유전자, 낮은 복제 수 단백질에 비해 고도로 발현되는 단백질 및 유기체의 게놈의 응집 단백질 코딩 영역에서 더 높을 수 있다. 몇몇 실시양태에서, 케토리덕타제 효소를 코딩하는 폴리뉴클레오티드는 발현에 대해 선택된 숙주 유기체로부터 최적으로 생성시키기 위해 코돈 최적화될 수 있다.
"바람직한", "최적의" 또는 "높은 코돈 사용 편중 코돈"은 동일한 아미노산을 코딩하는 다른 코돈보다 단백질 코딩 영역에서 더 높은 빈도로 사용되는 코돈을 상호 교환적으로 의미한다. 바람직한 코돈은 단일 유전자, 공통 기능 또는 기원의 유전자 집합, 고발현 유전자, 전체 유기체의 응집 단백질 코딩 영역에서의 코돈 빈도, 관련 유기체의 응집 단백질 코딩 영역에서의 코돈 빈도 또는 이의 조합에서 코돈 사용과 관련하여 결정될 수 있다. 유전자 발현 수준에 따라 빈도가 증가하는 코돈은 통상적으로 발현에 최적인 코돈이다. 예를 들면, 클러스터 분석 또는 상응 분석을 이용한 다변량 분석 및 유전자에 사용되는 코돈의 유효 수를 비롯하여, 특정 유기체 내 코돈 빈도(예를 들면, 코돈 사용, 상대적인 동의 코돈 사용) 및 코돈 선호를 결정하는 각종 방법이 알려져 있다(문헌[GCG CodonPreference, Genetics Computer Group Wisconsin Package]; 문헌[Codon W, John Peden, University of Nottingham]; 문헌[McInerney, J. O, 1998, Bioinformatics 14:372-73]; 문헌[Stenico et al., 1994, Nucleic Acids Res. 222437-46]; 문헌[Wright, F., 1990, Gene 87:23-29] 참조]. 코돈 사용 표는 늘어나는 유기체 목록에 이용가능하다[예를 들면, 문헌[Wada et al., 1992, Nucleic Acids Res. 20:2111-2118]; 문헌[Nakamura et al., 2000, Nucl. Acids Res. 28:292]; 문헌[Duret, et al., 이하 상기와 동일]; 문헌[Henaut and Danchin, "Escherichia coli and Salmonella", 1996, Neidhardt, et al. Eds., ASM Press, Washington D.C., p. 2047-2066] 참조). 코돈 사용을 얻기 위한 데이터원은 단백질을 코딩할 수 있는 임의의 입수가능한 뉴클레오티드 서열에 따라 달라질 수 있다. 이러한 데이터 집합은 발현 단백질(예를 들면, 완전한 단백질 코딩 서열-CDS), 발현 서열 태그(ESTS) 또는 게놈 서열의 예상된 코딩 영역)을 코딩하는 것으로 실질적으로 공지된 핵산 서열을 포함한다(예를 들면, 문헌[Mount, D., Bioinformatics: Sequence and Genome Analysis, Chapter 8, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 2001]; 문헌[Uberbacher, E. C., 1996, Methods Enzymol. 266:259-281]; 문헌[Tiwari et al., 1997, Comput. Appl. Biosci. 13:263-270] 참조).
"조절 서열"은 관심 있는 폴리뉴클레오티드 및/또는 폴리펩티드의 발현에 필요하거나 유리한 모든 성분을 포함하는 것으로 본원에서 정의된다. 각 조절 서열은 폴리펩티드를 코딩하는 핵산 서열에 천연적이거나 또는 외래적일 수 있다. 이러한 조절 서열로는 리더, 폴리아데닐화 서열, 프로펩티드 서열, 프로모터, 신호 펩티드 서열 및 전사 종결자를 들 수 있으나, 이들로 제한되지는 않는다. 조절 서열은 최소한 프로모터 및 전사 및 번역 정지 신호를 포함한다. 조절 서열은 예를 들면 폴리펩티드를 코딩하는 핵산 서열의 코딩 영역과 조절 서열의 결찰을 촉진하는 특정 제한 부위를 도입할 목적으로 링커와 함께 제공될 수 있다.
"작동가능하게 연결된"은 조절 서열이 관심 있는 폴리뉴클레오티드 및/또는 폴리펩티드의 발현을 지정 또는 조절하도록 조절 서열이 관심 있는 폴리뉴클레오티드에 대한 위치에 적절히 배치된 (즉, 작동 관계에서의) 구성으로 본원에서 정의된다.
"프로모터 서열"은 코딩 서열과 같은 관심 있는 폴리뉴클레오티드의 발현을 위해 숙주 세포에 의해 인식되는 핵산 서열이다. 조절 서열은 적절한 프로모터 서열을 포함할 수 있다. 프로모터 서열은 관심 있는 폴리뉴클레오티드의 발현을 매개하는 전사 조절 서열을 포함한다. 프로모터는 돌연변이체, 절단형(truncated) 및 하이브리드 프로모터를 비롯한 선택된 숙주 세포에서 전사 활성을 나타내는 임의의 핵산 서열일 수 있으며, 숙주 세포에 대해 동종 또는 이종인 세포외 또는 세포내 폴리펩티드를 코딩하는 유전자로부터 입수할 수 있다.
6.2 케토리덕타제 효소
본 개시내용은 기질 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]벤조산 메틸 에스테르를 입체선택적으로 생성물 (S,E)-메틸 2-(3-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-하이드록시프로필)벤조에이트로 환원 또는 전환시킬 수 있고, 엘. 케피르(서열 번호 4), 엘. 브레비스(서열 번호 2) 또는 엘. 미노르(서열 번호 114)로부터 얻은 천연 야생형 KRED 효소와 비교하여 또는 다른 조작된 케토리덕타제 효소와 비교하여 향상된 특성을 갖는 조작된 케토리덕타제("KRED") 효소를 제공한다. 상기 생성물 화합물은 알레르기 치료용 치료제로서 및 천식 조절에서 사용되는 류코트리엔 수용체 길항제인 몬테루카스트(명칭 Singulair®로도 알려됨)의 합성에 유용하다. 본원에 기재된 바대로, 엘. 케피르로부터 얻은 야생형 효소는 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]벤조산 메틸 에스테르를 굉장히 상당한 전환율로 생성물 (S,E)-메틸 2-(3-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-하이드록시프로필)벤조에이트로 환원 또는 전환시키지 않는다. 대조적으로, 본 개시내용의 케토리덕타제는 상기 특정 기질을 상당한 수준으로 상기 생성물로 환원 또는 전환시킬 수 있다. 몇몇 실시양태에서, 본 개시내용의 케토리덕타제 폴리펩티드는 (1) 서열 번호 2, 4 또는 114의 190번(즉, X190)에 해당하는 잔기가 구속성 잔기인 요건 및 (2) 서열 번호 2, 4 또는 114의 202번(즉, X202)에 해당하는 잔기가 방향족 잔기인 요건을 갖는다. 몇몇 실시양태에서, 상기 향상된 케토리덕타제 폴리펩티드는 (1) 서열 번호 2, 4 또는 114의 190번(즉, X190)에 해당하는 잔기가 구속성 잔기인 요건, (2) 서열 번호 2, 4 또는 114의 195번(즉, X195)에 해당하는 잔기가 염기성, 산성, 비극성 또는 극성 잔기인 요건 및 (3) 서열 번호 2, 4 또는 114의 202번(즉, X202)에 해당하는 잔기가 방향족 잔기인 요건을 갖는다.
상기 기재된 바대로, 본 개시내용의 케토리덕타제는 락토바실루스 케피르, 락토바실루스 브레비스 또는 락토바실루스 미노르의 천연 케토리덕타제("ADH" 또는 "알콜 탈수소효소"라고도 칭함) 또는 다른 조작된 케토리덕타제의 아미노산 서열과 관련하여 기재할 수 있다. 아미노산 잔기 위치는 그 자체로 개시 메티오닌(M) 잔기로부터 시작하여 (즉, M은 1번 잔기를 나타냄) 케토리덕타제 내에서 결정되나, 당업자라면 숙주 세포 또는 시험관내 번역 시스템과 같은 생물학적 처리 기작에 의해 이 개시 메티오닌 잔기를 제거하여 개시 메티오닌 잔기가 결여된 성숙 단백질을 생성시킬 수 있다는 것을 이해할 것이다. 아미노산 서열에 특정 아미노산 또는 아미노산 변경이 존재하는 아미노산 잔기 위치는 종종 용어 "Xn" 또는 "n번"(여기서, n은 잔기 위치를 의미함)으로 본원에서 기재한다. 케토리덕타제 사이에 동일한 잔기 위치에서의 아미노산 잔기가 상이한 경우, 그 상이한 잔기를 "케피르 잔기/브레비스 잔기/미노르 잔기"의 순서로 "/"로 나타낼 수 있다. 기준 서열, 예를 들면 서열 번호 2, 서열 번호 4 및 서열 번호 114의 야생형 케토리덕타제 내 아미노산 잔기가 상이한 아미노산 잔기로 치환되는 치환 돌연변이는 "→"부호로 나타낼 수 있다. 여기서, 돌연변이는 종종 한 유형의 아미노산"으로의" 돌연변이로 기재한다. 예를 들면, 서열 번호 4의 96번 잔기는 지방족 잔기"로" 돌연변이할 수 있다. 그러나, "∼로"란 어구의 사용은 한 계열의 한 아미노산이 동일한 계열의 다른 아미노산으로 돌연변이하는 것을 배제하지 않는다. 예를 들면, 서열 번호 4의 96번 잔기는 극성 잔기 세린이나, 그것은 상이한 극성 잔기로 돌연변이할 수 있다. 예를 들면, 돌연변이가 "S96T"(96→T) 돌연변이일 수 있다. 락토바실러스 케피르, 락토바실러스 브레비스 또는 락토바실러스 미노르의 천연 케토리덕타제("ADH" 또는 "알콜 탈수소효소"라고도 칭함)의 아미노산 서열은 케토리덕타제 활성을 코딩하는 것으로 알려진 폴리뉴클레오티드로부터 얻을 수 있다(예를 들면, 락토바실러스 케피르의 경우 유전자은행 등록 번호 AAP94029 GI:33112056 또는 서열 번호 3, 락토바실러스 브레비스의 경우 유전자은행 등록 번호 CAD66648 GI:28400789 또는 서열 번호 1, 및 락토바실러스 미노르의 경우 서열 번호 113).
몇몇 실시양태에서, 야생형 폴리펩티드 또는 다른 조작된 폴리펩티드와 비교하여 상기 케토리덕타제 폴리펩티드의 향상된 특성은 구조식 I의 기질, 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]벤조산 메틸 에스테르의, 이의 상응하는 구조식 II의 (S) 알콜 생성물, (S,E)-메틸 2-(3-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-하이드록시프로필)벤조에이트로의 환원 또는 전환에 대한 이의 활성 증가와 관련한다. 몇몇 실시양태에서, 상기 효소 활성 증가는 동량의 생성물을 환원 또는 전환시키는 야생형 기준 서열 또는 다른 기준 서열(예를 들면, 서열 번호 90)과 비교하여 기질의 생성물로의 전환 속도 증가에 의해 나타날 수 있거나, 향상된 폴리펩티드를 덜 사용하는 능력에 의해 나타날 수 있다. 몇몇 실시양태에서, 상기 케토리덕타제 특성의 향상된 특성은 기질의 생성물로의 환원에 있어서의 입체선택성 증가, 즉 본원에서는 상기 생성물의 입체이성체 잉여율 증가와 관련한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드의 향상된 특성은 이의 안정성 또는 열 안정성과 관련한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 활성 증가 및 입체선택성 증가와 같은 하나 이상의 향상된 특성을 를 갖는다.
몇몇 실시양태에서, 본원의 케토리덕타제 폴리펩티드는 기준 서열(예를 들면, 천연 폴리펩티드 또는 조작된 폴리펩티드)에 대한 다수의 변형을 가질 수 있고, 이는 몇몇 실시양태에서 향상된 케토리덕타제 특성을 발생시킬 수 있다. 본원에 사용되는 "변형"으로는 아미노산 치환, 결실 및 삽입을 들 수 있다. 임의의 하나의 변형 또는 변형 조합을 천연 폴리펩티드 또는 조작된 폴리펩티드에 도입하여 조작된 효소를 생성시킬 수 있다. 이러한 실시양태에서, 아미노산 서열에 대한 변형 수는 상기 기준 폴리펩티드 서열의 아미노산의 총 수의 10% 이하, 10% 이하, 15% 이하, 20% 이하 또는 30% 이하로 1개 이상의 아미노산, 2개 이상의 아미노산, 3개 이상의 아미노산, 4개 이상의 아미노산, 5개 이상의 아미노산, 6개 이상의 아미노산, 8개 이상의 아미노산, 10개 이상의 아미노산, 15개 이상의 아미노산 또는 20개 이상의 아미노산을 포함할 수 있다. 몇몇 실시양태에서, 향상된 케토리덕타제 특성을 발생시키는 천연 폴리펩티드 또는 조작된 폴리펩티드에 대한 변형 수는 상기 기준 서열의 약 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개, 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 변형을 포함할 수 있다. 몇몇 실시양태에서, 상기 변형 수는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 아미노산 잔기일 수 있다. 상기 변형은 삽입, 결실, 치환 또는 이들의 조합을 포함할 수 있다.
몇몇 실시양태에서, 상기 변형은 상기 기준 서열에 대한 아미노산 치환을 포함한다. 향상된 케토리덕타제 특성을 발생시킬 수 있는 치환은 상기 기준 효소 서열의 아미노산의 총 수의 10% 이하, 10% 이하, 20% 이하 또는 30% 이하로 1개 이상의 아미노산, 2개 이상의 아미노산, 3개 이상의 아미노산, 4개 이상의 아미노산, 5개 이상의 아미노산, 6개 이상의 아미노산, 8개 이상의 아미노산, 10개 이상의 아미노산, 15개 이상의 아미노산 또는 20개 이상의 아미노산에서 일어날 수 있다. 몇몇 실시양태에서, 향상된 케토리덕타제 특성을 발생시키는 천연 폴리펩티드 또는 조작된 폴리펩티드에 대한 치환 수는 상기 기준 서열의 약 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개, 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 아미노산 치환을 포함할 수 있다. 몇몇 실시양태에서, 상기 치환 수는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 아미노산 잔기일 수 있다.
몇몇 실시양태에서, 본원의 케토리덕타제 폴리펩티드는 X190번에 해당하는 잔기가 구속성 잔기, 특히 프롤린인 특징 및 X202에 해당하는 잔기가 방향족 잔기, 특히 트립토판인 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 약 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제 폴리펩티드는 X190에 해당하는 잔기가 구속성 잔기이고, X202에 해당하는 잔기가 방향족 잔기인 아미노 서열을 갖는다. 몇몇 실시양태에서, X190에 해당하는 잔기는 프롤린이다. 몇몇 실시양태에서, X202에 해당하는 잔기는 트립토판이다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 X190에 해당하는 잔기가 프롤린이고, X202에 해당하는 잔기가 트립토판인 아미노산 서열을 갖는다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 다른 잔기 위치에서 상기 기준 아미노산 서열과 비교하여 하나 이상의 잔기 차이를 가질 수 있다. 이러한 차이는 치환, 결실 및 삽입과 같은 다양한 변형을 포함할 수 있다. 상기 치환은 비보존적 치환, 보존적 치환 또는 비보존적 치환과 보존적 치환의 조합일 수 있다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 임의로 다른 아미노산 잔기 위치에서 상기 기준 서열과 비교하여 약 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개, 1∼40개, 1∼45개 또는 약 1∼50개의 잔기 차이를 가질 수 있다.
몇몇 실시양태에서, 본원의 케토리덕타제 폴리펩티드는 X190번에 해당하는 잔기가 구속성 잔기, 특히 프롤린인 특징, X195에 해당하는 잔기가 염기성, 산성, 비극성 또는 극성 잔기, 특히 프롤린, 아르기닌, 리신, 아스파르트산 또는 아스파라긴인 특징 및 X202에 해당하는 잔기가 방향족 잔기, 특히 트립토판인 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 약 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제 폴리펩티드는 적어도 상술한 특징, 즉 X190번에 해당하는 잔기가 구속성 잔기인 특징, X195에 해당하는 잔기가 염기성, 산성, 비극성 또는 극성 잔기인 특징 및 X202에 해당하는 잔기가 방향족 잔기인 특징을 갖는 아미노산 서열을 포함한다. 몇몇 실시양태에서, X190에 해당하는 잔기는 프롤린이다. 몇몇 실시양태에서, X195에 해당하는 잔기는 아르기닌이다. 몇몇 실시양태에서, X202에 해당하는 잔기는 트립토판이다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 X190에 해당하는 잔기가 프롤린이고, X195에 해당하는 잔기가 프롤린, 아르기닌, 리신, 아스파르트산 또는 아스파라긴, 특히 아르기닌이고, X202에 해당하는 잔기가 트립토판인 아미노산 서열을 갖는다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 다른 잔기 위치에서 상기 기준 아미노산 서열과 비교하여 하나 이상의 잔기 차이를 가질 수 있다. 이러한 차이는 치환, 결실 및 삽입과 같은 다양한 변형을 포함할 수 있다. 상기 치환은 비보존적 치환, 보존적 치환 또는 비보존적 치환과 보존적 치환의 조합일 수 있다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 임의로 다른 아미노산 잔기 위치에서 상기 기준 서열과 비교하여 약 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개, 1∼40개, 1∼45개 또는 약 1∼50개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기 위치에서 상기 기준 서열과 비교하여 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개, 40개, 45개 또는 50개의 잔기 차이일 수 있다.
몇몇 실시양태에서, 향상된 케토리덕타제 폴리펩티드는 서열 번호 111 또는 서열 번호 112 또는 서열 번호 139에 나타난 서열 구조 또는 이의 영역, 예컨대 90∼211에 해당하는 잔기에 기초한 아미노산 서열을 포함한다. 서열 번호 112는 락토바실루스 케피르 케토리덕타제의 야생형 아미노산 서열(서열 번호 4)에 기초하고, 서열 번호 111은 락토바실루스 브레비스 케토리덕타제의 야생형 아미노산 서열(서열 번호 2)에 기초하며, 서열 번호 139는 락토바실루스 미노르 케토리덕타제의 야생형 아미노산 서열(서열 번호 114)에 기초한다. 서열 번호 111, 112 또는 139의 서열 구조에 기초한 케토리덕타제는 X190에 해당하는 잔기가 구속성 잔기이고, X195에 해당하는 잔기가 염기성, 산성, 비극성 또는 극성 잔기이며, X202에 해당하는 잔기가 방향족 잔기라는 것을 명시하고 있다. 서열 번호 111, 112 또는 139의 서열 구조의 몇몇 실시양태에서, X190에 해당하는 잔기는 프롤린이고, X202에 해당하는 잔기는 트립토판이다. 서열 번호 111, 112 또는 139의 서열 구조의 몇몇 실시양태에서, X190에 해당하는 잔기는 프롤린이고, X195에 해당하는 잔기는 프롤린, 아르기닌, 리신, 아스파르트산 또는 아스파라긴, 특히 아르기닌이며, X202에 해당하는 잔기는 트립토판이다. 또한, 상기 서열 구조는 다양한 잔기 위치에 대해 하기 기재된 특징을 명시하고 있다.
몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하고, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 대해 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 대해 특정된 특징을 갖는 케토리덕타제 폴리펩티드는 상기 서열 구조에 제공되는 바대로 X7에 해당하는 잔기가 구속성 또는 비극성 잔기인 특징, X17에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징, X25에 해당하는 잔기가 극성 또는 산성 잔기인 특징, X27에 해당하는 잔기가 방향족 잔기인 특징, X41에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기인 특징, X53에 해당하는 잔기가 극성, 비극성 또는 산성 잔기인 특징, X57에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징, X64에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기인 특징, X66에 해당하는 잔기가 산성 잔기인 특징, X68에 해당하는 잔기가 극성, 산성, 지방족 또는 비극성 잔기인 특징, X72에 해당하는 잔기가 염기성 잔기인 특징, X76에 해당하는 잔기가 지방족, 비극성 또는 극성 잔기인 특징, X80에 해당하는 잔기가 지방족, 비극성 또는 극성 잔기인 특징, X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기인 특징, X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기인 특징, X95에 해당하는 잔기가 지방족, 비극성 또는 산성 잔기인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기인 특징, X97에 해당하는 잔기가 염기성, 구속성 또는 극성 잔기인 특징, X100에 해당하는 잔기가 염기성, 산성, 극성, 지방족 또는 비극성 잔기인 특징, X108에 해당하는 잔기가 염기성 또는 구속성 잔기인 특징, X111에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징, X139에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징, X145에 해당하는 잔기가 산성, 지방족 또는 비극성 잔기인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기인 특징, X148에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징, X151에 해당하는 잔기가 구속성, 비극성 또는 지방족 잔기인 특징, X152에 해당하는 잔기가 극성, 방향족, 지방족 또는 비극성 잔기인 특징, X163에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징, X165에 해당하는 잔기가 극성, 비극성 또는 지방족 잔기인 특징, X173에 해당하는 잔기가 산성, 비극성 또는 지방족 잔기인 특징, X179에 해당하는 잔기가 방향족, 염기성, 지방족 또는 비극성 잔기인 특징, X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기인 특징, X196에 해당하는 잔기가 비극성 또는 지방족 잔기이고, X197에 해당하는 잔기가 산성 잔기인 특징, X198에 해당하는 잔기가 산성 또는 극성 잔기인 특징, X210에 해당하는 잔기가 극성 또는 염기성 잔기인 특징, X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기인 특징, X212에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기인 특징, X216에 해당하는 잔기가 구속성 또는 염기성 잔기인 특징, X223에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징, X226에 해당하는 잔기가 비극성 또는 극성 잔기인 특징, X233에 해당하는 잔기가 극성 또는 산성 잔기인 특징, X235에 해당하는 잔기가 극성 또는 방향족 잔기인 특징, X248에 해당하는 잔기가 비극성 또는 방향족 잔기인 특징 및 X249에 해당하는 잔기가 방향족 잔기인 특징으로부터 선택된 특징 중 하나 이상을 더 포함할 수 있다. 몇몇 실시양태에서, 상기 아미노산 서열은 상술한 특징 중 적어도 2개, 3개, 4개, 5개, 6개 또는 그 이상의 특징을 가질 수 있다. 몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조(또는 이의 영역)에 기초한 아미노산 서열을 포함하는 폴리펩티드는 추가로 상기 X로 표시되지 않은 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 하나 이상의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이는 상기 X로 표시되지 않은 다른 아미노산 잔기 위치에서 1-2, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기 위치에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함할 수 있다.
몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 폴리펩티드는 서열 번호 2, 4 또는 114의 아미노산 서열과 비교하여 하나 이상의 보존적 돌연변이를 가질 수 있다. 보존적 돌연변이의 예로는 아미노산 치환, 예컨대 X27에 해당하는 잔기 페닐알라닌(F)의 다른 방향족 잔기, 예를 들면 티로신에 의한 치환, X57에 해당하는 잔기 이소루신(I)의 다른 비극성 또는 지방족 잔기, 예를 들면 발린에 의한 치환, X64에 해당하는 잔기 알라닌(A)의 다른 비극성 또는 지방족 잔기, 예를 들면 발린에 의한 치환, X66에 해당하는 잔기 아스파르트산(D)의 다른 산성 잔기, 예를 들면 글루탐산에 의한 치환, 잔기 X72 리신(K)의 다른 염기성 잔기, 예를 들면 아르기닌에 의한 치환, X80에 해당하는 잔기 알라닌(V)의 다른 비극성 또는 지방족 잔기, 예를 들면 발린에 의한 치환, X93에 해당하는 잔기 이소루신(I)의 다른 극성 잔기, 예를 들면 세린에 의한 치환, X94에 해당하는 잔기 알라닌(A)의 다른 비극성 잔기, 예를 들면 글리신에 의한 치환, X95에 해당하는 잔기 발린(V)의 다른 비극성 또는 지방족 잔기, 예를 들면 루신에 의한 치환, X96에 해당하는 잔기 세린(S)의 다른 극성 잔기, 예를 들면 트레오닌에 의한 치환, X148에 해당하는 잔기 발린(V)의 다른 비극성 또는 지방족 잔기, 예를 들면 이소루신에 의한 치환, X152에 해당하는 잔기 트레오닌의 다른 극성 잔기, 예를 들면 세린에 의한 치환, X163에 해당하는 잔기 발린(V)의 다른 비극성 또는 지방족 잔기, 예를 들면 이소루신에 의한 치환, X179에 해당하는 잔기 티로신(Y)의 다른 방향족 잔기, 예를 들면 페닐알라닌에 의한 치환, 잔기 X196 발린(V)의 다른 지방족 잔기, 예를 들면 루신에 의한 치환, 잔기 X198 아스파르트산(D)의 다른 산성 잔기, 예를 들면 글루탐산에 의한 치환, 잔기 X223 이소루신(I)의 다른 비극성 또는 지방족 잔기, 예를 들면 발린에 의한 치환 및 X249에 해당하는 잔기 티로신(Y)의 다른 방향족 잔기, 예를 들면 트립토판에 의한 치환을 들 수 있으나, 이들로 제한되지는 않는다.
몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하고, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 케토리덕타제 폴리펩티드는 X7에 해당하는 잔기가 히스티딘, 프롤린, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 글리신 또는 히스티딘인 특징, X17에 해당하는 잔기가 글리신, 메티오닌, 알라닌, 발린, 루신, 이소루신, 특히 메티오닌인 특징, X25에 해당하는 잔기가 글루탐산, 아스파르트산, 세린, 트레오닌, 글루타민 또는 아스파라긴, 특히 트레오닌 또는 아스파르트산인 특징, X27에 해당하는 잔기가 티로신, 페닐알라닌, 트립토판, 특히 티로신인 특징, X41에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 세린 또는 알라닌인 특징, X53에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 메티오닌, 알라닌, 발린, 루신, 이소루신, 아스파르트산 또는 글루탐산, 특히 트레오닌, 글리신 또는 아스파르트산인 특징, X57에 해당하는 잔기가 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 발린인 특징, X64에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 세린, 알라닌 또는 발린인 특징, X66에 해당하는 잔기가 아스파르트산 또는 글루탐산인 특징, X68에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 아스파르트산, 글루탐산, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 트레오닌, 아스파르트산, 알라닌, 발린 또는 글루탐산인 특징, X72에 해당하는 잔기가 리신 또는 아르기닌, 특히 아르기닌이고, X76에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 알라닌, 발린, 루신 또는 이소루신, 특히 알라닌 또는 트레오닌인 특징, X80에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 알라닌, 트레오닌 또는 발린인 특징, X93에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 이소루신, 세린, 알라닌 또는 글리신인 특징, X94에 해당하는 잔기가 시스테인, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 시스테인, 글리신 또는 알라닌인 특징, X95에 해당하는 잔기가 아스파르트산, 글루탐산, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 발린, 루신 또는 글루탐산인 특징, X96에 해당하는 잔기가 시스테인, 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 아스파라긴, 세린, 발린, 루신, 이소루신 또는 트레오닌인 특징, X97에 해당하는 잔기가 리신, 아르기닌, 히스티딘, 프롤린, 세린, 트레오닌, 글루타민 또는 아스파라긴, 특히 리신, 히스티딘 또는 세린인 특징, X100에 해당하는 잔기가 리신, 아르기닌, 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 알라닌, 발린, 루신 또는 이소루신, 특히 글루탐산, 리신, 글루타민 또는 알라닌인 특징, X108에 해당하는 잔기가 아르기닌, 리신, 히스티딘 또는 프롤린, 특히 아르기닌 또는 히스티딘인 특징, X111에 해당하는 잔기가 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 메티오닌인 특징, X139에 해당하는 잔기가 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 루신인 특징, X145에 해당하는 잔기가 아스파르트산, 글루탐산, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 글루탐산 또는 루신인 특징, X147에 해당하는 잔기가 티로신, 페닐알라닌, 트립토판, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 페닐알라닌 또는 루신인 특징, X148에 해당하는 잔기가 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 이소루신인 특징, X151에 해당하는 잔기가 프롤린, 히스티딘, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 알라닌인 특징, X152에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 티로신, 페닐알라닌, 트립토판, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 트레오닌, 트립토판, 알라닌 또는 세린인 특징, X163에 해당하는 잔기가 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 이소루신인 특징, X165에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 아스파라긴인 특징, X173에 해당하는 잔기가 아스파르트산, 글루탐산, 글리신, 메티오닌, 알라닌, 발린, 루신, 이소루신, 특히 발린인 특징, X179에 해당하는 잔기가 티로신, 페닐알라닌, 트립토판, 아르기닌, 리신, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 티로신, 페닐알라닌, 리신 또는 루신인 특징, X194에 해당하는 잔기가 프롤린, 히스티딘, 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 프롤린, 글루타민, 세린 또는 루신인 특징, X196에 해당하는 잔기가 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 루신인 특징, X197에 해당하는 잔기가 아스파르트산 또는 글루탐산, 특히 글루탐산인 특징, X198에 해당하는 잔기가 아스파르트산, 글루탐산, 세린, 트레오닌, 글루타민 또는 아스파라긴, 특히 아스파르트산, 글루탐산 또는 글루타민인 특징, X210에 해당하는 잔기가 아르기닌, 리신, 세린, 트레오닌, 글루타민 또는 아스파라긴, 특히 트레오닌 또는 아르기닌인 특징, X211에 해당하는 잔기가 리신, 아르기닌, 아스파르트산, 글루탐산, 글리신, 메티오닌, 알라닌, 발린, 루신, 이소루신, 세린, 트레오닌, 글루타민 또는 아스파라긴, 특히 리신, 발린, 루신, 아르기닌, 트레오닌, 아스파르트산 또는 이소루신인 특징, X212에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 트레오닌, 세린 또는 발린인 특징, X216에 해당하는 잔기가 프롤린, 히스티딘, 아르기닌 또는 리신, 특히 히스티딘 또는 아르기닌인 특징, X223에 해당하는 잔기가 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 발린인 특징, X226에 해당하는 잔기가 글리신, 메티오닌, 알라닌, 발린, 루신, 이소루신, 세린, 트레오닌, 글루타민 또는 아스파라긴, 특히 트레오닌인 특징, X233에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 아스파르트산, 글루탐산, 특히 아스파라긴 또는 아스파르트산인 특징, X235에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 티로신, 페닐알라닌, 트립토판, 특히 세린 또는 트립토판인 특징, X248에 해당하는 잔기가 글리신, 메티오닌, 알라닌, 발린, 루신, 이소루신, 티로신, 페닐알라닌 또는 트립토판, 특히 글리신 또는 트립토판인 특징 및 X249에 해당하는 잔기가 티로신, 페닐알라닌 또는 트립토판, 특히 트립토판인 특징으로부터 선택된 특징 중 하나 이상을 더 포함할 수 있다. 몇몇 실시양태에서, 상기 아미노산 서열은 상기 X로 표시되는 추가 특징 중 적어도 2개, 3개, 4개, 5개, 6개 또는 그 이상의 특징을 가질 수 있다. 몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조(또는 이의 영역)에 기초한 아미노산 서열을 포함하는 케토리덕타제 폴리펩티드는 추가로 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 상기 X로 표시되지 않은 잔기 위치에서 하나 이상의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이는 상기 X로 표시되지 않은 다른 아미노산 잔기 위치에서 1-2, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기 위치에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 추가로 X7에 해당하는 잔기가 구속성 또는 비극성 잔기, 특히 히스티딘인 특징, X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기, 특히 시스테인 또는 글리신인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 트레오닌, 시스테인, 발린, 루신 또는 이소루신인 특징 및 X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 루신인 특징 중 하나 이상 또는 적어도 전부를 가질 수 있다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징 이외에 X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 세린인 특징, X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기, 특히 루신, 세린 또는 글루타민인 특징, X196에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 루신인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 발린, 루신, 이소루신 또는 트레오닌인 특징 중 하나 이상을 가질 수 있다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징 이외에 X17에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 메티오닌인 특징, X27에 해당하는 잔기가 방향족 잔기, 특히 티로신인 특징, X64에 해당하는 잔기가 극성, 비극성 또는 지방족 잔기, 특히 발린인 특징, X80에 해당하는 잔기가 지방족, 비극성 또는 극성 잔기, 특히 트레오닌인 특징, X100에 해당하는 잔기가 염기성, 산성, 극성, 지방족 또는 비극성 잔기, 특히 리신인 특징, X198에 해당하는 잔기가 산성 또는 극성 잔기, 특히 글루탐산인 특징 및 X216에 해당하는 잔기가 구속성 또는 염기성 잔기, 특히 아르기닌인 특징 중 하나 이상을 가질 수 있다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징 이외에 X25에 해당하는 잔기가 극성 또는 산성 잔기, 특히 트레오닌인 특징, X41에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 세린 또는 알라닌인 특징, X53에 해당하는 잔기가 극성, 비극성 또는 산성 잔기, 특히 아스파르트산인 특징, X57에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 발린인 특징, X66에 해당하는 잔기가 산성 잔기, 특히 글루탐산인 특징, X68에 해당하는 잔기가 극성, 산성, 지방족 또는 비극성 잔기, 특히 발린인 특징, X72에 해당하는 잔기가 염기성 잔기, 특히 아르기닌인 특징, X76에 해당하는 잔기가 지방족, 비극성 또는 극성 잔기, 특히 알라닌인 특징, X95에 해당하는 잔기가 지방족, 비극성 또는 산성 잔기, 특히 루신 또는 글루탐산인 특징, X97에 해당하는 잔기가 염기성, 구속성 또는 극성 잔기, 특히 히스티딘인 특징, X108에 해당하는 잔기가 염기성 또는 구속성 잔기, 특히 히스티딘인 특징, X111에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 메티오닌인 특징, X139에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 루신인 특징, X145에 해당하는 잔기가 산성, 지방족 또는 비극성 잔기, 특히 루신 또는 글루타민인 특징, X148에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 이소루신인 특징, X151에 해당하는 잔기가 구속성, 비극성 또는 지방족 잔기, 특히 알라닌인 특징, X152에 해당하는 잔기가 극성, 방향족, 지방족 또는 비극성 잔기, 특히 세린인 특징, X163에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 이소루신인 특징, X165에 해당하는 잔기가 극성, 비극성 또는 지방족 잔기, 특히 아스파라긴인 특징, X173에 해당하는 잔기가 산성, 비극성 또는 지방족 잔기, 특히 발린인 특징, X179에 해당하는 잔기가 방향족, 염기성, 지방족 또는 비극성 잔기, 특히 페닐알라닌인 특징, X197에 해당하는 잔기가 산성 잔기, 특히 글루탐산인 특징, X210에 해당하는 잔기가 극성 또는 염기성 잔기, 특히 아르기닌인 특징, X212에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 발린 또는 세린인 특징, X223에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 발린인 특징, X226에 해당하는 잔기가 비극성 또는 극성 잔기, 특히 트레오닌인 특징, X233에 해당하는 잔기가 극성 또는 산성 잔기, 특히 아스파라긴 또는 아스파르트산인 특징, X235에 해당하는 잔기가 극성 또는 방향족 잔기, 특히 트립토판인 특징, X248에 해당하는 잔기가 비극성 또는 방향족 잔기, 특히 글리신 또는 트립토판인 특징 및 X249에 해당하는 잔기가 방향족 잔기, 특히 트립토판인 특징 중 하나 이상을 가질 수 있다. 당업자라면 본 개시내용의 케토리덕타제를 형성하는 데 상술한 군의 다양한 특징 조합을 사용할 수 있다는 것을 명확히 알 것이다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기, 특히 시스테인 또는 글리신인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 트레오닌, 시스테인, 발린, 루신 또는 이소루신인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 발린, 루신, 이소루신 또는 트레오닌인 특징의 추가 특징 중 하나 이상 또는 적어도 전부를 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기, 특히 시스테인 또는 글리신인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 트레오닌, 시스테인, 발린, 루신 또는 이소루신인 특징 및 X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 루신인 특징의 추가 특징 중 하나 이상 또는 적어도 전부를 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기, 특히 시스테인 또는 글리신인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 트레오닌, 시스테인, 발린, 루신 또는 이소루신인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 루신인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 발린, 루신, 이소루신 또는 트레오닌인 특징의 추가 특징 중 하나 이상 또는 적어도 전부를 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기, 특히 시스테인 또는 글리신인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 트레오닌, 시스테인, 발린, 루신 또는 이소루신인 특징, X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기, 특히 루신, 세린 또는 글루타민인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 발린인 특징의 추가 특징 중 하나 이상 또는 적어도 전부를 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기, 특히 시스테인 또는 글리신인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 트레오닌, 시스테인, 발린, 루신 또는 이소루신인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 루신인 특징, X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기, 특히 루신, 세린 또는 글루타민인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 발린, 루신, 이소루신 또는 트레오닌인 특징의 추가 특징 중 하나 이상 또는 적어도 전부를 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 세린인 특징, X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기, 특히 시스테인 또는 글리신인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 트레오닌 또는 루신인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 트레오닌, 이소루신, 루신 또는 발린인 특징의 추가 특징 중 하나 이상 또는 적어도 전부를 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 세린인 특징, X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기, 특히 시스테인 또는 글리신인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 시스테인, 트레오닌, 발린, 루신 또는 이소루신인 특징, X100에 해당하는 잔기가 염기성, 산성, 극성, 지방족 또는 비극성 잔기, 특히 리신인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 루신인 특징, X152에 해당하는 잔기가 극성, 방향족, 지방족 또는 비극성 잔기, 특히 세린인 특징, X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기, 특히 루신, 세린 또는 글루타민인 특징, X196에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 루신인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 발린, 루신, 이소루신 또는 트레오닌 특징의 추가 특징 중 하나 이상 또는 적어도 전부를 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 X7에 해당하는 잔기가 구속성 또는 비극성 잔기, 특히 히스티딘인 특징, X66에 해당하는 잔기가 산성 잔기, 특히 글루탐산인 특징, X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 세린 또는 글리신인 특징, X94에 해당하는 잔기가 시스테인, 비극성 또는 지방족 잔기, 특히 시스테인인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 이소루신, 루신 또는 트레오닌인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 루신인 특징, X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기, 특히 루신, 세린 또는 글루타민인 특징, X196에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 루신인 특징, X198에 해당하는 잔기가 산성 또는 극성 잔기, 특히 글루탐산인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 트레오닌, 발린, 루신 또는 이소루신인 특징의 추가 특징 중 하나 이상 또는 적어도 전부를 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 X7에 해당하는 잔기가 구속성 또는 비극성 잔기, 특히 히스티딘인 특징, X17에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 메티오닌인 특징, X27에 해당하는 잔기가 방향족 잔기, 특히 티로신인 특징, X64에 해당하는 잔기가 극성, 비극성 또는 지방족 잔기, 특히 발린인 특징, X66에 해당하는 잔기가 산성 잔기, 특히 글루탐산인 특징, X80에 해당하는 잔기가 지방족, 비극성 또는 극성 잔기, 특히 트레오닌인 특징, X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 세린 또는 글리신인 특징, X94에 해당하는 잔기가 시스테인, 비극성 또는 지방족 잔기, 특히 시스테인인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 이소루신, 루신 또는 트레오닌인 특징, X100에 해당하는 잔기가 염기성, 산성, 극성, 지방족, 비극성 잔기 또는 구속성 잔기, 특히 리신인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 루신인 특징, X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기, 특히 루신, 세린 또는 글루타민인 특징, X196에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 루신인 특징, X198에 해당하는 잔기가 산성 또는 극성 잔기, 특히 글루탐산인 특징, X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 트레오닌, 발린, 루신 또는 이소루신인 특징 및 X216에 해당하는 잔기가 구속성 또는 염기성 잔기, 특히 아르기닌인 특징의 추가 특징 중 하나 이상 또는 적어도 전부를 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X7에 해당하는 잔기가 구속성 또는 비극성 잔기, 특히 글리신 또는 히스티딘인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X17에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 메티오닌인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X25에 해당하는 잔기가 극성 또는 산성 잔기, 특히 트레오닌인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 다른 아미노산 잔기에서 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X27에 해당하는 잔기가 방향족 잔기, 특히 티로신인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X53에 해당하는 잔기가 극성, 비극성 또는 산성 잔기, 특히 아스파르트산인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X64에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 발린인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X80에 해당하는 잔기가 지방족, 비극성 또는 극성 잔기, 특히 발린 또는 트레오닌인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 세린인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기, 특히 글리신 또는 시스테인인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 발린, 루신, 이소루신, 트레오닌 또는 시스테인인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X100에 해당하는 잔기가 염기성, 산성, 극성, 지방족 또는 비극성 잔기, 특히 리신인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X108에 해당하는 잔기가 염기성 또는 구속성 잔기, 특히 히스티딘인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 추가로 X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 루신인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X151에 해당하는 잔기가 구속성, 비극성 또는 지방족 잔기, 특히 알라닌인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X165에 해당하는 잔기가 극성, 비극성 또는 지방족 잔기, 특히 아스파라긴인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X173에 해당하는 잔기가 산성, 비극성 또는 지방족 잔기, 특히 발린인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기, 특히 세린, 글루타민 또는 루신인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X196에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 루신인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X198에 해당하는 잔기가 산성 또는 극성 잔기, 특히 글루탐산 또는 글루타민인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X210에 해당하는 잔기가 극성 또는 염기성 잔기, 특히 아르기닌인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 발린, 루신, 이소루신 또는 트레오닌인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X212에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 발린 또는 세린인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X216에 해당하는 잔기가 구속성 또는 염기성 잔기, 특히 아르기닌인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X223에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 발린인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X226에 해당하는 잔기가 비극성 또는 극성 잔기, 특히 트레오닌인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X7에 해당하는 잔기가 구속성 또는 비극성 잔기, 특히 히스티딘인 특징, X94에 해당하는 잔기가 시스테인, 비극성 또는 지방족 잔기, 특히 시스테인 또는 글리신인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 페닐알라닌 또는 루신인 특징 및 X196에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 루신인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열(예, 서열 번호 48)과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열(예, 서열 번호 48)과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X7에 해당하는 잔기가 구속성 또는 비극성 잔기, 특히 히스티딘인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 아스파라긴, 세린, 발린, 루신, 이소루신 또는 트레오닌인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 페닐알라닌 또는 루신인 특징 및 X196에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 루신인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 상술한 특징을 갖는 서열 번호 2, 4 또는 114의 기준 서열(예, 서열 번호 42, 44, 46 또는 90)과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열(예, 서열 번호 42, 44, 46 또는 90)과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X7에 해당하는 잔기가 구속성 또는 비극성 잔기, 특히 히스티딘인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 아스파라긴, 세린, 발린, 루신, 이소루신 또는 트레오닌인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 페닐알라닌 또는 루신인 특징, X196에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 루신인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 발린, 루신, 이소루신 또는 트레오닌인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 상술한 특징을 갖는 서열 번호 2, 4 또는 114의 기준 서열(예, 서열 번호 88, 94 또는 102)과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열(예, 서열 번호 88, 94 또는 102)과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X7에 해당하는 잔기가 구속성 또는 비극성 잔기, 특히 히스티딘인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 아스파라긴, 세린, 발린, 루신, 이소루신 또는 트레오닌인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 페닐알라닌 또는 루신인 특징, X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기, 특히 루신, 글루타민 또는 세린인 특징, X196에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 루신인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 발린, 루신, 이소루신 또는 트레오닌인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 상술한 특징을 갖는 서열 번호 2, 4 또는 114의 기준 서열(예, 서열 번호 98)과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열(예, 서열 번호 98)과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X7에 해당하는 잔기가 구속성 또는 비극성 잔기, 특히 히스티딘인 특징, X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 세린인 특징, X94에 해당하는 잔기가 시스테인, 비극성 또는 지방족 잔기, 특히 시스테인 또는 글리신인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 아스파라긴, 세린, 발린, 루신, 이소루신 또는 트레오닌인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 페닐알라닌 또는 루신인 특징, X196에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 루신인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 발린, 루신, 이소루신 또는 트레오닌인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 상술한 특징을 갖는 서열 번호 2, 4 또는 114의 기준 서열(예, 서열 번호 84)과 비교하여 1-2개, 1-3개, 1-4개, 1-5개, 1-6개, 1-7개, 1-8개, 1-9개, 1-10개, 1-11개, 1-12개, 1-14개, 1-15개, 1-16개, 1-18개, 1-20개, 1-22개, 1-24개, 1-26개, 1-30개, 1-35개 또는 약 1-40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열(예, 서열 번호 84)과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X7에 해당하는 잔기가 구속성 또는 비극성 잔기, 특히 히스티딘인 특징, X66에 해당하는 잔기가 산성 잔기, 특히 글루탐산인 특징, X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 세린인 특징, X94에 해당하는 잔기가 시스테인, 비극성 또는 지방족 잔기, 특히 시스테인 또는 글리신인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 아스파라긴, 세린, 발린, 루신, 이소루신 또는 트레오닌인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 페닐알라닌 또는 루신인 특징, X196에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 루신인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 발린, 루신, 이소루신 또는 트레오닌인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 상술한 특징을 갖는 서열 번호 2, 4 또는 114의 기준 서열(예, 서열 번호 64)과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열(예, 서열 번호 64)과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X7에 해당하는 잔기가 구속성 또는 비극성 잔기, 특히 히스티딘인 특징, X17에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 메티오닌인 특징, X27에 해당하는 잔기가 방향족 잔기, 특히 티로신인 특징, X64에 해당하는 잔기가 극성, 비극성 또는 지방족 잔기, 특히 발린인 특징, X80에 해당하는 잔기가 지방족, 비극성 또는 극성 잔기, 특히 트레오닌 또는 발린인 특징, X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 세린인 특징, X94에 해당하는 잔기가 시스테인, 비극성 또는 지방족 잔기, 특히 시스테인 또는 글리신인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 아스파라긴, 세린, 발린, 루신, 이소루신 또는 트레오닌인 특징, X100에 해당하는 잔기가 염기성, 산성, 극성 또는 지방족, 특히 리신인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 페닐알라닌 또는 루신인 특징, X196에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 루신인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 발린, 루신, 이소루신 또는 트레오닌인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 상술한 특징을 갖는 서열 번호 2, 4 또는 114의 기준 서열(예, 서열 번호 22 또는 24)과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열(예, 서열 번호 22 또는 24)과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 추가로 X7에 해당하는 잔기가 구속성 또는 비극성 잔기, 특히 히스티딘인 특징, X66에 해당하는 잔기가 산성 잔기, 특히 글루탐산인 특징, X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 세린인 특징, X94에 해당하는 잔기가 시스테인, 비극성 또는 지방족 잔기, 특히 시스테인 또는 글리신인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 아스파라긴, 세린, 발린, 루신, 이소루신 또는 트레오닌인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 페닐알라닌 또는 루신인 특징, X194에 해당하는 잔기가 구속성, 극성 또는 비극성 잔기, 특히 아스파라긴 또는 루신인 특징, X196에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 루신인 특징, X198에 해당하는 잔기가 산성 또는 극성 잔기, 특히 글루탐산 또는 아스파라긴인 특징, X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 발린, 루신, 이소루신 또는 트레오닌인 특징 및 X216에 해당하는 잔기가 구속성 또는 염기성 잔기, 특히 아르기닌인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 상술한 특징을 갖는 서열 번호 2, 4 또는 114의 기준 서열(예, 서열 번호 58)과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열(예, 서열 번호 58)과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X7에 해당하는 잔기가 구속성 또는 비극성 잔기, 특히 히스티딘인 특징, X66에 해당하는 잔기가 산성 잔기, 특히 글루탐산인 특징, X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 세린인 특징, X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기, 특히 시스테인인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 시스테인, 트레오닌, 발린, 루신 또는 이소루신인 특징, X147에 해당하는 잔기가 방향족 또는 지방족 잔기, 특히 루신인 특징, X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기, 특히 글루타민인 특징, X196에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 루신인 특징, X198에 해당하는 잔기가 산성 또는 극성 잔기, 특히 글루탐산인 특징 및 X211에 해당하는 잔기가 염기성, 지방족 또는 비극성 잔기, 특히 발린발린, 루신, 이소루신 또는 트레오닌인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 상술한 특징을 갖는 서열 번호 2, 4 또는 114의 기준 서열(예, 서열 번호 40)과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열(예, 서열 번호 40)과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X7에 해당하는 잔기가 구속성 또는 비극성 잔기, 특히 히스티딘인 특징, X17에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 메티오닌인 특징, X27에 해당하는 잔기가 방향족 잔기, 특히 티로신인 특징, X64에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 발린인 특징, X80에 해당하는 잔기가 지방족, 비극성 또는 극성 잔기, 특히 트레오닌 또는 발린인 특징, X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 세린인 특징, X94에 해당하는 잔기가 시스테인, 비극성 또는 지방족 잔기, 특히 시스테인 또는 글리신인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 아스파라긴, 세린, 발린, 루신, 이소루신 또는 트레오닌인 특징, X100에 해당하는 잔기가 염기성, 산성, 극성, 비극성 또는 지방족 잔기, 특히 리신인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 페닐알라닌 또는 루신인 특징, X194에 해당하는 잔기가 구속성, 극성 또는 비극성 잔기, 특히 아스파라긴 또는 루신인 특징, X196에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 루신인 특징, X198에 해당하는 잔기가 산성 또는 극성 잔기, 특히 글루탐산 또는 아스파라긴인 특징, X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 발린, 루신, 이소루신 또는 트레오닌인 특징 및 X216에 해당하는 잔기가 구속성 또는 염기성 잔기, 특히 아르기닌인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 상술한 특징을 갖는 서열 번호 2, 4 또는 114의 기준 서열(예, 서열 번호 14 또는 16)과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열(예, 서열 번호 14 또는 16)과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X7에 해당하는 잔기가 구속성 또는 비극성 잔기, 특히 히스티딘인 특징, X17에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 메티오닌인 특징, X25에 해당하는 잔기가 극성 또는 산성 잔기, 특히 트레오닌인 특징, X27에 해당하는 잔기가 방향족 잔기, 특히 티로신인 특징, X53에 해당하는 잔기가 극성, 비극성 또는 산성 잔기, 특히 아스파르트산인 특징, X64에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 발린인 특징, X80에 해당하는 잔기가 지방족, 비극성 또는 극성 잔기, 특히 트레오닌 또는 발린인 특징, X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 세린인 특징, X94에 해당하는 잔기가 시스테인, 비극성 또는 지방족 잔기, 특히 시스테인 또는 글리신인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 아스파라긴, 세린, 발린, 루신, 이소루신 또는 트레오닌인 특징, X100에 해당하는 잔기가 염기성, 산성, 극성, 비극성 또는 지방족 잔기, 특히 리신인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 페닐알라닌 또는 루신인 특징, X194에 해당하는 잔기가 구속성, 극성 또는 비극성 잔기, 특히 아스파라긴 또는 루신인 특징, X196에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 루신인 특징, X198에 해당하는 잔기가 산성 또는 극성 잔기, 특히 글루탐산 또는 아스파라긴인 특징, X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 발린, 루신, 이소루신 또는 트레오닌인 특징 및 X216에 해당하는 잔기가 구속성 또는 염기성 잔기, 특히 아르기닌인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 상술한 특징을 갖는 서열 번호 2, 4 또는 114의 기준 서열(예, 서열 번호 6)과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열(예, 서열 번호 6)과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 서열 번호 111, 112 또는 139의 서열 구조 또는 이의 영역, 예컨대 잔기 90∼211에 기초한 아미노산 서열을 포함하는 향상된 케토리덕타제는 적어도 X7에 해당하는 잔기가 구속성 또는 비극성 잔기, 특히 히스티딘인 특징, X17에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 메티오닌인 특징, X25에 해당하는 잔기가 극성 또는 산성 잔기, 특히 트레오닌인 특징, X27에 해당하는 잔기가 방향족 잔기, 특히 티로신인 특징, X53에 해당하는 잔기가 극성, 비극성 또는 산성 잔기, 특히 아스파르트산인 특징, X64에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 발린인 특징, X76에 해당하는 잔기가 지방족, 비극성 또는 극성 잔기, 특히 알라닌인 특징, X80에 해당하는 잔기가 지방족, 비극성 또는 극성 잔기, 특히 트레오닌 또는 발린인 특징, X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 세린인 특징, X94에 해당하는 잔기가 시스테인, 비극성 또는 지방족 잔기, 특히 시스테인 또는 글리신인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 아스파라긴, 세린, 발린, 루신, 이소루신 또는 트레오닌인 특징, X100에 해당하는 잔기가 염기성, 산성, 극성, 비극성 또는 지방족 잔기, 특히 리신인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 페닐알라닌 또는 루신인 특징, X194에 해당하는 잔기가 구속성, 극성 또는 비극성 잔기, 특히 아스파라긴 또는 루신인 특징, X196에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 루신인 특징, X198에 해당하는 잔기가 산성 또는 극성 잔기, 특히 글루탐산 또는 아스파라긴인 특징, X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 발린, 루신, 이소루신 또는 트레오닌인 특징 및 X216에 해당하는 잔기가 구속성 또는 염기성 잔기, 특히 아르기닌인 특징의 추가 특징을 더 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 상술한 특징을 갖는 서열 번호 2, 4 또는 114의 기준 서열(예, 서열 번호 8)과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 1∼20개, 1∼22개, 1∼24개, 1∼26개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열(예, 서열 번호 8)과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함하며, 단 상기 케토리덕타제는 적어도 상술한 특징을 갖는 아미노산 서열을 갖는다.
몇몇 실시양태에서, 본 개시내용의 향상된 케토리덕타제는 X190에 해당하는 잔기가 구속성 잔기이고, X202에 해당하는 잔기가 방향족 잔기인 서열 번호 111, 112 또는 139의 서열 구조의 잔기 90∼211에 해당하는 영역 또는 도메인을 갖는 아미노산 서열을 포함한다. 몇몇 실시양태에서, 잔기 90∼211에 해당하는 도메인 또는 영역은 X190에 해당하는 잔기가 프롤린이고, X202에 해당하는 잔기가 트립토판인 아미노산 서열을 포함한다. 몇몇 실시양태에서, 잔기 90∼211에 해당하는 영역 또는 도메인은 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114에 기초한 기준 서열의 대응하는 도메인과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 또는 1∼20개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 상기 도메인 내 다른 아미노산 잔기 위치에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개 또는 약 20개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 X190 및 X202에 해당하는 잔기에서 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열의 대응하는 도메인과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 도메인 또는 영역을 갖는 아미노산 서열을 포함하며, 단 상기 케토리덕타제 도메인 또는 영역은 적어도 상술한 특징을 갖는 아미노산 서열을 포함한다.
몇몇 실시양태에서, 본 개시내용의 향상된 케토리덕타제는 X190에 해당하는 잔기가 구속성 잔기이고, X195에 해당하는 잔기가 염기성, 산성, 비극성 또는 극성 잔기이고, X202에 해당하는 잔기가 방향족 잔기인 서열 번호 111, 112 또는 139의 서열 구조의 잔기 90∼211에 해당하는 영역 또는 도메인을 갖는 아미노산 서열을 포함한다. 몇몇 실시양태에서, 잔기 90∼211에 해당하는 도메인 또는 영역은 X190에 해당하는 잔기가 프롤린이고, X195에 해당하는 잔기가 프롤린, 아르기닌, 리신, 아스파르트산 또는 아스파라긴, 특히 아르기닌이고, X202에 해당하는 잔기가 트립토판인 아미노산 서열을 포함한다. 몇몇 실시양태에서, 잔기 90∼211에 해당하는 영역 또는 도메인은 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114에 기초한 기준 서열의 대응하는 도메인과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 또는 1∼20개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 상기 도메인 내 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개 또는 약 20개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 X190, X195 및 X202에 해당하는 잔기에서 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열의 대응하는 도메인과 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 도메인 또는 영역을 갖는 아미노산 서열을 포함하며, 단 상기 케토리덕타제 도메인 또는 영역은 적어도 상술한 특징을 갖는 아미노산 서열을 포함한다.
몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조의 잔기 90∼211에 해당하는 도메인 또는 영역을 갖고 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 케토리덕타제 폴리펩티드는 상기 영역 또는 도메인에서 X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기인 특징, X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기인 특징, X95에 해당하는 잔기가 지방족, 비극성 또는 산성 잔기인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기인 특징, X97에 해당하는 잔기가 염기성, 구속성 또는 극성 잔기인 특징, X100에 해당하는 잔기가 염기성, 산성, 극성, 지방족 또는 비극성 잔기인 특징, X108에 해당하는 잔기가 염기성 또는 구속성 잔기인 특징, X111에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징, X139에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징, X145에 해당하는 잔기가 산성, 지방족 또는 비극성 잔기인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기인 특징, X148에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징, X151에 해당하는 잔기가 구속성, 비극성 또는 지방족 잔기인 특징, X152에 해당하는 잔기가 극성, 방향족, 지방족 또는 비극성 잔기인 특징, X163에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징, X165에 해당하는 잔기가 극성, 비극성 또는 지방족 잔기인 특징, X173에 해당하는 잔기가 산성, 비극성 또는 지방족 잔기인 특징, X179에 해당하는 잔기가 방향족, 염기성, 지방족 또는 비극성 잔기인 특징, X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기인 특징, X196에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징, X197에 해당하는 잔기가 산성 잔기인 특징, X198에 해당하는 잔기가 산성 또는 극성 잔기인 특징, X210에 해당하는 잔기가 극성 또는 염기성 잔기인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기인 특징으로부터 선택된 특징 중 하나 이상을 더 포함할 수 있다. 몇몇 실시양태에서, 잔기 90∼211에 해당하는 영역 또는 도메인은 추가로 상기 X로 표시되지 않은 다른 아미노산 잔기에서 서열 번호 2, 4 또는 114에 기초한 기준 서열의 대응하는 도메인과 비교하여 약 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 또는 1∼20개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 상기 도메인 내 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개 또는 약 20개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다.
몇몇 실시양태에서, 상기 기재된 바대로 서열 번호 111, 112 또는 139의 서열 구조의 잔기 90∼211에 해당하는 아미노산 서열을 갖는 도메인 또는 영역을 갖는 케토리덕타제 폴리펩티드는 서열 번호 2, 4 또는 114의 대응하는 도메인의 아미노산 서열과 비교하여 상기 도메인 또는 영역에서 하나 이상의 보존적 돌연변이를 가질 수 있다. 이러한 보존적 돌연변이의 예로는 아미노산 치환, 예컨대 X93에 해당하는 잔기 이소루신(I)의 다른 극성 잔기, 예를 들면 세린에 의한 치환, X94에 해당하는 잔기 알라닌(A)의 다른 비극성 잔기, 예를 들면 글리신에 의한 치환, X95에 해당하는 잔기 발린(V)의 다른 비극성 또는 지방족 잔기, 예를 들면 루신에 의한 치환, X96에 해당하는 잔기 세린(S)의 다른 극성 잔기, 예를 들면 트레오닌에 의한 치환, X148에 해당하는 잔기 발린(V)의 다른 비극성 또는 지방족 잔기, 예를 들면 이소루신에 의한 치환, X152에 해당하는 잔기 트레오닌의 다른 극성 잔기, 예를 들면 세린에 의한 치환, X163에 해당하는 잔기 발린(V)의 다른 비극성 또는 지방족 잔기, 예를 들면 이소루신에 의한 치환, X179에 해당하는 잔기 티로신(Y)의 다른 방향족 잔기, 예를 들면 페닐알라닌에 의한 치환, 잔기 X196 발린(V)의 다른 지방족 잔기, 예를 들면 루신에 의한 치환 및 잔기 X198 아스파르트산(D)의 다른 산성 잔기, 예를 들면 글루탐산에 의한 치환을 들 수 있으나, 이들로 제한되지는 않는다.
몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조의 잔기 90∼211에 해당하는 도메인 또는 영역을 갖고 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 케토리덕타제 폴리펩티드는 상기 영역 또는 도메인에서 X93에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 이소루신, 세린, 알라닌 또는 글리신인 특징, X94에 해당하는 잔기가 시스테인, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 시스테인, 글리신 또는 알라닌인 특징, X95에 해당하는 잔기가 아스파르트산, 글루탐산, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 발린, 루신 또는 글루탐산인 특징, X96에 해당하는 잔기가 시스테인, 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 아스파라긴, 세린, 발린, 루신, 이소루신 또는 트레오닌인 특징, X97에 해당하는 잔기가 리신, 아르기닌, 히스티딘, 프롤린, 세린, 트레오닌, 글루타민 또는 아스파라긴, 특히 리신, 히스티딘 또는 세린인 특징, X100에 해당하는 잔기가 리신, 아르기닌, 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 알라닌, 발린, 루신 또는 이소루신, 특히 글루탐산, 리신, 글루타민 또는 알라닌인 특징, X108에 해당하는 잔기가 아르기닌, 리신, 히스티딘 또는 프롤린, 특히 아르기닌 또는 히스티딘인 특징, X111에 해당하는 잔기가 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 메티오닌인 특징, X139에 해당하는 잔기가 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 루신인 특징, X145에 해당하는 잔기가 아스파르트산, 글루탐산, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 글루탐산 또는 루신인 특징, X147에 해당하는 잔기가 티로신, 페닐알라닌, 트립토판, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 페닐알라닌 또는 루신인 특징, X151에 해당하는 잔기가 프롤린, 히스티딘, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 알라닌인 특징, X152에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 티로신, 페닐알라닌, 트립토판, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 트레오닌, 트립토판, 알라닌 또는 세린인 특징, X163에 해당하는 잔기가 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 이소루신인 특징, X165에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 아스파라긴인 특징, X173에 해당하는 잔기가 아스파르트산, 글루탐산, 글리신, 메티오닌, 알라닌, 발린, 루신, 이소루신, 특히 발린인 특징, X179에 해당하는 잔기가 티로신, 페닐알라닌, 트립토판, 아르기닌, 리신, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 티로신, 페닐알라닌, 리신 또는 루신인 특징, X194에 해당하는 잔기가 프롤린, 히스티딘, 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 프롤린, 글루타민, 세린 또는 루신인 특징, X196에 해당하는 잔기가 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 루신인 특징, X197에 해당하는 잔기가 아스파르트산 또는 글루탐산, 특히 글루탐산인 특징, X198에 해당하는 잔기가 아스파르트산, 글루탐산, 세린, 트레오닌, 글루타민 또는 아스파라긴, 특히 아스파르트산, 글루탐산 또는 글루타민인 특징, X210에 해당하는 잔기가 아르기닌, 리신, 세린, 트레오닌, 글루타민 또는 아스파라긴, 특히 트레오닌 또는 아르기닌인 특징 및 X211에 해당하는 잔기가 리신, 아르기닌, 아스파르트산, 글루탐산, 글리신, 메티오닌, 알라닌, 발린, 루신, 이소루신, 세린, 트레오닌, 글루타민 또는 아스파라긴, 특히 발린, 루신, 트레오닌 또는 이소루신인 특징으로부터 선택된 특징 중 하나 이상을 더 포함할 수 있다. 몇몇 실시양태에서, 잔기 90∼211에 해당하는 영역 또는 도메인은 추가로 상기 X로 표시되지 않은 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114에 기초한 기준 서열의 대응하는 도메인과 비교하여 약 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 또는 1∼20개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 상기 도메인 내 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개 또는 약 20개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다.
몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조의 잔기 90∼211에 해당하는 도메인 또는 영역 및 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 케토리덕타제 폴리펩티드는 상기 영역 또는 도메인에서 X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기, 특히 시스테인 또는 글리신인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 트레오닌, 시스테인, 발린, 루신 또는 이소루신인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 발린, 루신, 트레오닌 또는 이소루신인 특징으로부터 선택된 특징 중 하나 이상 또는 전부를 더 포함할 수 있다. 몇몇 실시양태에서, 잔기 90∼211에 해당하는 영역 또는 도메인은 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114에 기초한 기준 서열의 상기 도메인과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 또는 1∼20개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 상기 도메인 내 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개 또는 약 20개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 영역 또는 도메인은 적어도 상술한 특징을 갖는 아미노산 서열을 포함하고, 상기 아미노산 서열은 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열의 잔기 90∼211에 해당하는 아미노산 서열과 비교하여 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는다.
몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조의 잔기 90∼211에 해당하는 도메인 또는 영역 및 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 케토리덕타제 폴리펩티드는 상기 영역 또는 도메인에서 X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기, 특히 시스테인 또는 글리신인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 트레오닌, 시스테인, 발린, 루신 또는 이소루신인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 루신인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 발린, 루신, 트레오닌 또는 이소루신인 특징으로부터 선택된 특징 중 하나 이상 또는 전부를 더 포함할 수 있다. 몇몇 실시양태에서, 잔기 90∼211에 해당하는 영역 또는 도메인은 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114에 기초한 기준 서열의 상기 도메인과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 또는 1∼20개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 상기 도메인 내 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개 또는 약 20개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 영역 또는 도메인은 적어도 상술한 특징을 갖는 아미노산 서열을 포함하고, 상기 아미노산 서열은 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열의 잔기 90∼211에 해당하는 아미노산 서열과 비교하여 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는다.
몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조의 잔기 90∼211에 해당하는 도메인 또는 영역 및 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 케토리덕타제 폴리펩티드는 상기 영역 또는 도메인에서 X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기, 특히 시스테인 또는 글리신인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 트레오닌, 시스테인, 발린, 루신 또는 이소루신인 특징, X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기, 특히 세린 또는 글루타민인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 발린, 루신, 트레오닌 또는 이소루신인 특징으로부터 선택된 특징 중 하나 이상 또는 전부를 더 포함할 수 있다. 몇몇 실시양태에서, 잔기 90∼211에 해당하는 영역 또는 도메인은 추가로 다른 아미노산 잔기에서 서열 번호 2, 4 또는 114에 기초한 기준 서열의 상기 도메인과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 또는 1∼20개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 상기 도메인 내 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개 또는 약 20개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 영역 또는 도메인은 적어도 상술한 특징을 갖는 아미노산 서열을 포함하고, 상기 아미노산 서열은 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열의 잔기 90∼211에 해당하는 아미노산 서열과 비교하여 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는다.
몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조의 잔기 90∼211에 해당하는 도메인 또는 영역 및 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 케토리덕타제 폴리펩티드는 상기 영역 또는 도메인에서 X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기, 특히 시스테인 또는 글리신인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 트레오닌, 시스테인, 발린, 루신 또는 이소루신인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 루신인 특징, X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기, 특히 루신, 세린 또는 글루타민인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 발린, 루신, 이소루신 또는 트레오닌인 특징으로부터 선택된 특징 중 하나 이상 또는 전부를 더 포함할 수 있다. 몇몇 실시양태에서, 잔기 90∼211에 해당하는 영역 또는 도메인은 추가로 다른 아미노산 잔기에서 서열 번호 2, 4 또는 114에 기초한 기준 서열의 상기 도메인과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 또는 1∼20개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 상기 도메인 내 다른 아미노산 잔기에서1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개 또는 약 20개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 영역 또는 도메인은 적어도 상술한 특징을 갖는 아미노산 서열을 포함하고, 상기 아미노산 서열은 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열의 잔기 90∼211에 해당하는 아미노산 서열과 비교하여 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는다.
몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조의 잔기 90∼211에 해당하는 도메인 또는 영역 및 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 케토리덕타제 폴리펩티드는 상기 영역 또는 도메인에서 X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 세린인 특징, X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기, 특히 시스테인 또는 글리신인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 트레오닌 또는 루신인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 트레오닌, 이소루신, 루신 또는 발린인 특징으로부터 선택된 특징 중 하나 이상 또는 전부를 더 포함할 수 있다. 몇몇 실시양태에서, 잔기 90∼211에 해당하는 영역 또는 도메인은 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114에 기초한 기준 서열의 상기 도메인과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 또는 1∼20개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 상기 도메인 내 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개 또는 약 20개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 영역 또는 도메인은 적어도 상술한 특징을 갖는 아미노산 서열을 포함하고, 상기 아미노산 서열은 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열의 잔기 90∼211에 해당하는 아미노산 서열과 비교하여 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는다.
몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조의 잔기 90∼211에 해당하는 도메인 또는 영역 및 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 케토리덕타제 폴리펩티드는 상기 영역 또는 도메인에서 X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 세린인 특징, X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기, 특히 시스테인 또는 글리신인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 시스테인, 트레오닌, 발린, 루신 또는 이소루신인 특징, X100에 해당하는 잔기가 염기성, 산성, 극성, 지방족 또는 비극성 잔기, 특히 리신인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 루신인 특징, X152에 해당하는 잔기가 극성, 방향족, 지방족 또는 비극성 잔기, 특히 세린인 특징, X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기, 특히 세린 또는 글루타민인 특징, X196에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 루신인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 발린인 특징으로부터 선택된 특징 중 하나 이상 또는 전부를 더 포함할 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 상기 도메인 내 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개 또는 약 20개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 잔기 90∼211에 해당하는 영역 또는 도메인은 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114에 기초한 기준 서열의 상기 도메인과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 또는 1∼20개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 상기 도메인 내 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개 또는 약 20개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 영역 또는 도메인은 적어도 상술한 특징을 갖는 아미노산 서열을 포함하고, 상기 아미노산 서열은 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열의 잔기 90∼211에 해당하는 아미노산 서열과 비교하여 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는다.
몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조의 잔기 90∼211에 해당하는 도메인 또는 영역 및 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 케토리덕타제 폴리펩티드는 상기 영역 또는 도메인에서 X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 세린 또는 글리신인 특징, X94에 해당하는 잔기가 시스테인, 비극성 또는 지방족 잔기, 특히 시스테인인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 이소루신, 루신 또는 트레오닌인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 루신인 특징, X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기, 특히 글루타민 또는 세린인 특징, X196에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 루신인 특징, X198에 해당하는 잔기가 산성 또는 극성 잔기, 특히 글루탐산인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 트레오닌, 발린, 루신 또는 이소루신인 특징으로부터 선택된 특징 중 하나 이상 또는 전부를 더 포함할 수 있다. 몇몇 실시양태에서, 잔기 90∼211에 해당하는 영역 또는 도메인은 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114에 기초한 기준 서열의 상기 도메인과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 또는 1∼20개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 상기 도메인 내 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개 또는 약 20개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 영역 또는 도메인은 적어도 상술한 특징을 갖는 아미노산 서열을 포함하고, 상기 아미노산 서열은 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열의 잔기 90∼211에 해당하는 아미노산 서열과 비교하여 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는다.
몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조의 잔기 90∼211에 해당하는 도메인 또는 영역 및 본원에 기재된 바대로 X190 및 X202에 해당하는 잔기에 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 특정된 특징을 갖는 케토리덕타제 폴리펩티드는 상기 영역 또는 도메인에서 X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 세린 또는 글리신인 특징, X94에 해당하는 잔기가 시스테인, 비극성 또는 지방족 잔기, 특히 시스테인인 특징, X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기, 특히 이소루신, 루신 또는 트레오닌인 특징, X100에 해당하는 잔기가 염기성, 산성, 극성, 지방족, 비극성 잔기 또는 구속성 잔기, 특히 리신인 특징, X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기, 특히 루신인 특징, X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기, 특히 글루타민 또는 세린인 특징, X196에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 루신인 특징, X198에 해당하는 잔기가 산성 또는 극성 잔기, 특히 글루탐산인 특징 및 X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기, 특히 트레오닌, 발린, 루신 또는 이소루신인 특징으로부터 선택된 특징 중 하나 이상 또는 전부를 더 포함할 수 있다. 몇몇 실시양태에서, 잔기 90∼211에 해당하는 영역 또는 도메인은 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114에 기초한 기준 서열의 상기 도메인과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개 또는 1∼20개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 상기 도메인 내 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개 또는 약 20개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 영역 또는 도메인은 적어도 상술한 특징을 갖는 아미노산 서열을 포함하고, 상기 아미노산 서열은 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열의 잔기 90∼211에 해당하는 아미노산 서열과 비교하여 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는다.
몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 서열 번호 111, 112 또는 139의 서열 구조의 잔기 1∼89에 해당하는 도메인 또는 영역을 더 포함할 수 있고, 상기 도메인 또는 영역은 X7에 해당하는 잔기가 구속성 또는 비극성 잔기인 특징, X17에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징, X25에 해당하는 잔기가 극성 또는 산성 잔기인 특징, X27에 해당하는 잔기가 방향족 잔기인 특징, X41에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기인 특징, X53에 해당하는 잔기가 극성, 비극성 또는 산성 잔기인 특징, X57에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징, X64에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기인 특징, X66에 해당하는 잔기가 산성 잔기인 특징, X68에 해당하는 잔기가 극성, 산성, 지방족 또는 비극성 잔기인 특징, X72에 해당하는 잔기가 염기성 잔기인 특징, X76에 해당하는 잔기가 지방족, 비극성 또는 극성 잔기인 특징 및 X80에 해당하는 잔기가 지방족, 비극성 또는 극성 잔기인 특징 중 하나 이상을 가질 수 있다. 몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조의 잔기 1∼89에 해당하는 영역 또는 도메인을 포함하는 폴리펩티드는 추가로 상기 X로 표시되지 않은 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 하나 이상의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이는 상기 X로 표시되지 않은 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개 또는 1∼16개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기 위치에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개 또는 16개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다.
몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 서열 번호 111, 112 또는 139의 서열 구조의 잔기 1∼89에 해당하는 도메인 또는 영역을 더 포함할 수 있고, 상기 도메인 또는 영역은 X7에 해당하는 잔기가 히스티딘, 프롤린, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 글리신 또는 히스티딘인 특징, X17에 해당하는 잔기가 글리신, 메티오닌, 알라닌, 발린, 루신, 이소루신, 특히 메티오닌인 특징, X25에 해당하는 잔기가 글루탐산, 아스파르트산, 세린, 트레오닌, 글루타민 또는 아스파라긴, 특히 트레오닌 또는 아스파르트산인 특징, X27에 해당하는 잔기가 티로신, 페닐알라닌, 트립토판, 특히 티로신인 특징, X41에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 세린 또는 알라닌인 특징, X53에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 메티오닌, 알라닌, 발린, 루신, 이소루신, 아스파르트산 또는 글루탐산, 특히 트레오닌, 글리신 또는 아스파르트산인 특징, X57에 해당하는 잔기가 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 발린인 특징, X64에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 세린, 알라닌 또는 발린인 특징, X66에 해당하는 잔기가 아스파르트산 또는 글루탐산인 특징, X68에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 아스파르트산, 글루탐산, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 트레오닌, 아스파르트산, 알라닌, 발린 또는 글루탐산인 특징, X72에 해당하는 잔기가 리신 또는 아르기닌, 특히 아르기닌인 특징, X76에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 알라닌, 발린, 루신 또는 이소루신, 특히 알라닌 또는 트레오닌인 특징 및 X80에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 알라닌, 트레오닌 또는 발린인 특징 중 하나 이상을 가질 수 있다. 몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조의 잔기 1∼89에 해당하는 영역 또는 도메인을 포함하는 폴리펩티드는 추가로 상기 X로 표시되지 않은 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 하나 이상의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이는 상기 X로 표시되지 않은 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개 또는 1∼16개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기 위치에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개 또는 16개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다.
몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 서열 번호 111, 112 또는 139의 서열 구조의 잔기 1∼89에 해당하는 도메인 또는 영역을 더 포함할 수 있고, 상기 도메인 또는 영역은 적어도 X7에 해당하는 잔기가 구속성 또는 비극성 잔기, 특히 히스티딘인 특징을 가질 수 있다. 몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조의 잔기 1∼89에 해당하는 영역 또는 도메인을 포함하는 폴리펩티드는 추가로 다른 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 하나 이상의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 잔기 1∼89에 해당하는 영역 또는 도메인은 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114에 기초한 기준 서열의 해당하는 도메인 또는 영역과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개 또는 1∼16개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 상기 도메인 내 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개 또는 약 16개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 영역 또는 도메인은 적어도 상술한 특징을 갖는 아미노산 서열을 포함하고, 상기 아미노산 서열은 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열의 잔기 1∼89에 해당하는 아미노산 서열과 비교하여 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는다.
몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 서열 번호 111, 112 또는 139의 서열 구조의 잔기 1∼89에 해당하는 도메인 또는 영역을 더 포함할 수 있고, 상기 도메인 또는 영역은 X7에 해당하는 잔기가 구속성 또는 비극성 잔기, 특히 히스티딘인 특징 및 X66에 해당하는 잔기가 산성 잔기, 특히 글루탐산인 특징 중 하나 이상 또는 적어도 전부를 가질 수 있다. 몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조의 잔기 1∼89에 해당하는 영역 또는 도메인을 포함하는 폴리펩티드는 추가로 다른 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 하나 이상의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 잔기 1∼89에 해당하는 영역 또는 도메인은 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114에 기초한 기준 서열의 해당하는 도메인과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개 또는 1∼16개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 상기 도메인 내 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개 또는 약 16개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 영역 또는 도메인은 적어도 상술한 특징을 갖는 아미노산 서열을 포함하고, 상기 아미노산 서열은 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열의 잔기 1∼89에 해당하는 아미노산 서열과 비교하여 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는다.
몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 서열 번호 111, 112 또는 139의 서열 구조의 잔기 1∼89에 해당하는 도메인 또는 영역을 더 포함할 수 있고, 상기 도메인 또는 영역은 X7에 해당하는 잔기가 구속성 또는 비극성 잔기, 특히 히스티딘인 특징, X17에 해당하는 잔기가 비극성 또는 지방족 잔기, 특히 메티오닌인 특징, X27에 해당하는 잔기가 방향족 잔기, 특히 티로신인 특징, X64에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 발린인 특징 및 X80에 해당하는 잔기가 지방족, 비극성 또는 극성 잔기, 특히 트레오닌 또는 발린인 특징 중 하나 이상 또는 적어도 전부를 가질 수 있다. 몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조의 잔기 1∼89에 해당하는 영역 또는 도메인을 포함하는 폴리펩티드는 추가로 다른 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 하나 이상의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 잔기 1∼89에 해당하는 영역 또는 도메인은 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114에 기초한 기준 서열의 해당하는 도메인과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개 또는 1∼16개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 상기 도메인 내 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개 또는 약 16개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 영역 또는 도메인은 적어도 상술한 특징을 갖는 아미노산 서열을 포함하고, 상기 아미노산 서열은 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열의 잔기 1∼89에 해당하는 아미노산 서열과 비교하여 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는다.
몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 서열 번호 111, 112 또는 139의 서열 구조의 잔기 212∼252에 해당하는 도메인 또는 영역을 더 포함할 수 있고, 상기 도메인 또는 영역은 X212에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기인 특징, X216에 해당하는 잔기가 구속성 또는 염기성 잔기인 특징, X223에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징, X226에 해당하는 잔기가 비극성 또는 극성 잔기인 특징, X233에 해당하는 잔기가 극성 또는 산성 잔기인 특징, X235에 해당하는 잔기가 극성 또는 방향족 잔기인 특징, X248에 해당하는 잔기가 비극성 또는 방향족 잔기인 특징 및 X249에 해당하는 잔기가 방향족 잔기인 특징 중 하나 이상을 가질 수 있다. 몇몇 실시양태에서, 상기 아미노산 서열은 상기 X로 표시되는 추가 특징 중 적어도 2개, 3개, 4개, 5개, 6개 또는 그 이상의 특징을 가질 수 있다. 몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조(또는 이의 영역)에 기초한 아미노산 서열을 포함하는 폴리펩티드는 추가로 상기 X로 표시되지 않은 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 하나 이상의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이는 상기 X로 표시되지 않은 다른 아미노산 잔기 위치에서 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개 또는 1∼10개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기 위치에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 약 10개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다.
몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 서열 번호 111, 112 또는 139의 서열 구조의 잔기 212∼252에 해당하는 도메인 또는 영역을 더 포함할 수 있고, 상기 도메인 또는 영역은 X212에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 트레오닌, 세린 또는 발린인 특징, X216에 해당하는 잔기가 프롤린, 히스티딘, 아르기닌 또는 리신, 특히 히스티딘 또는 아르기닌인 특징, X223에 해당하는 잔기가 글리신, 메티오닌, 알라닌, 발린, 루신 또는 이소루신, 특히 발린인 특징, X226에 해당하는 잔기가 글리신, 메티오닌, 알라닌, 발린, 루신, 이소루신, 세린, 트레오닌, 글루타민 또는 아스파라긴, 특히 트레오닌인 특징, X233에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 아스파르트산, 글루탐산, 특히 아스파라긴 또는 아스파르트산인 특징, X235에 해당하는 잔기가 세린, 트레오닌, 글루타민, 아스파라긴, 티로신, 페닐알라닌, 트립토판, 특히 세린 또는 트립토판인 특징, X248에 해당하는 잔기가 글리신, 메티오닌, 알라닌, 발린, 루신, 이소루신, 티로신, 페닐알라닌 또는 트립토판, 특히 글리신 또는 트립토판인 특징 및 X249에 해당하는 잔기가 티로신, 페닐알라닌 또는 트립토판, 특히 트립토판인 특징 중 하나 이상을 가질 수 있다. 몇몇 실시양태에서, 상기 아미노산 서열은 상기 X로 표시되는 추가 특징 중 적어도 2개, 3개, 4개, 5개, 6개 또는 그 이상의 특징을 가질 수 있다. 몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조(또는 이의 영역)에 기초한 아미노산 서열을 포함하는 폴리펩티드는 추가로 상기 X로 표시되지 않은 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 하나 이상의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이는 상기 X로 표시되지 않은 다른 아미노산 잔기 위치에서 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개 또는 1∼10개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기 위치에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 약 10개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다.
몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 서열 번호 111, 112 또는 139의 서열 구조의 잔기 212∼252에 해당하는 도메인 또는 영역을 더 포함할 수 있고, 상기 도메인 또는 영역은 적어도 X216에 해당하는 잔기가 구속성 또는 염기성 잔기, 특히 아르기닌인 특징을 갖는다. 몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조의 잔기 212∼252에 해당하는 영역 또는 도메인을 포함하는 폴리펩티드는 추가로 다른 잔기 위치에서 상술한 특징을 갖는 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 하나 이상의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 잔기 212∼252에 해당하는 영역 또는 도메인은 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114에 기초한 기준 서열의 해당하는 도메인과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개 또는 1∼10개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 상기 도메인 내 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 약 10개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 영역 또는 도메인은 적어도 상술한 특징을 갖는 아미노산 서열을 포함하고, 상기 아미노산 서열은 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열의 잔기 212∼252에 해당하는 아미노산 서열과 비교할 때 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는다.
몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 서열 번호 111, 112 또는 139의 서열 구조의 잔기 212∼252에 해당하는 도메인 또는 영역을 더 포함할 수 있고, 상기 도메인 또는 영역은 X212에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기, 특히 트레오닌, 세린 또는 발린인 특징, X216에 해당하는 잔기가 구속성 또는 염기성 잔기, 특히 히스티딘 또는 아르기닌인 특징, X223에 해당하는 잔기가 극성, 지방족 또는 비극성, 특히 발린인 특징, X233에 해당하는 잔기가 극성 또는 산성 잔기, 특히 아스파라긴 또는 아스파르트산인 특징, X235에 해당하는 잔기가 극성 또는 방향족 잔기, 특히 세린 또는 트립토판인 특징, X248에 해당하는 잔기가 비극성 또는 방향족 잔기, 특히 글리신 또는 트립토판인 특징 및 X249에 해당하는 잔기가 방향족 잔기, 특히 트립토판인 특징 중 하나 이상 또는 적어도 전부를 가질 수 있다. 몇몇 실시양태에서, 서열 번호 111, 112 또는 139의 서열 구조의 잔기 212∼252에 해당하는 영역 또는 도메인을 포함하는 폴리펩티드는 추가로 다른 잔기 위치에서 서열 번호 2, 4 또는 114의 기준 서열과 비교하여 하나 이상의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 잔기 212∼252에 해당하는 영역 또는 도메인은 추가로 다른 아미노산 잔기 위치에서 서열 번호 2, 4 또는 114에 기초한 기준 서열의 해당하는 도메인과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개 또는 1∼10개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 상기 도메인 내 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개 또는 약 10개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 영역 또는 도메인은 적어도 상술한 특징을 갖는 아미노산 서열을 포함하고, 상기 아미노산 서열은 상술한 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열의 잔기 212∼252에 해당하는 아미노산 서열과 비교할 때 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는다.
하기 표 2는 본원에 개시된 특정 서열 번호의 목록을 관련 활성과 함께 기재한 것이다. 달리 기재되지 않는 한, 하기 서열은 야생형 엘. 케피르 케토리덕타제 서열(서열 번호 3 및 4)로부터 유래한다. 하기 표 2에서, 각 열에 2개의 서열 번호를 기재하였는데, 여기서 홀수는 짝수로 제공된 아미노산 서열을 코딩하는 뉴클레오티드 서열을 의미한다. 돌연변이 수를 기재한 행은 서열 번호 4의 엘. 케피르 KRED 아미노산 서열과 비교한 아미노산 치환 수와 관련한다. 활성 행에서, 1개의 "+"는 약 24시간 내에 10 g/L 효소를 1 g/L 기질의 10∼20%로 전환시키는 능력에 해당한다. 2개의 플러스 부호 "++"는 상기 폴리펩티드가 서열 번호 90보다 약 1 내지 50배 활성이라는 것을 나타낸다. 3개의 플러스 부호 "+++"는 상기 폴리펩티드가 서열 번호 90보다 약 50 내지 250배 활성이라는 것을 나타낸다. 4개의 플러스 부호 "++++"는 상기 폴리펩티드가 서열 번호 90보다 약 250 내지 1000배 활성이라는 것을 나타내고, 5개의 플러스 부호 "+++++"는 상기 폴리펩티드가 서열 번호 90보다 1000배 초과 활성이라는 것을 나타낸다.
[표 2] 서열 및 상응하는 활성 향상의 목록
Figure pct00007
Figure pct00008
Figure pct00009
몇몇 실시양태에서, 상기 폴리펩티드는 서열 번호 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 92, 94, 96, 98, 100, 102, 104, 106, 108 또는 110에 기초한 폴리펩티드 기준 서열에 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 가지며, 단 상기 케토리덕타제 폴리펩티드 아미노산 서열은 서열 번호 4와 비교하여 표 2에 기재된 임의의 하나의 치환 조합 세트를 포함한다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 추가로 다른 아미노산 잔기 위치에서 상기 기준 서열과 비교하여 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개, 1∼20개, 1∼22개, 1∼24개, 1∼25개, 1∼30개, 1∼35개 또는 약 1∼40개의 잔기 차이를 가질 수 있다. 몇몇 실시양태에서, 이러한 차이 수는 다른 아미노산 잔기에서 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 잔기 차이일 수 있다. 몇몇 실시양태에서, 이러한 차이는 보존적 돌연변이를 포함한다.
몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 적어도 약 99%의 입체이성체 잉여율로 및 서열 번호 90의 아미노산 서열을 갖는 기준 폴리펩티드에 비해 향상된 전환율로 기질 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]벤조산 메틸 에스테르를 생성물 (S,E)-메틸 2-(3-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-하이드록시프로필)벤조에이트로 전환시킬 수 있다. 이러한 특징을 갖는 폴리펩티드의 예로는 서열 번호 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 92, 94, 96, 98, 100, 102, 104, 106, 108 및 110에 해당하는 아미노산 서열을 포함하는 폴리펩티드를 들 수 있지만, 이들로 제한되지는 않는다. 서열 번호 90의 아미노산 서열을 갖는 기준 폴리펩티드가 야생형(서열 번호 4)에 비해 향상된 전환율(예를 들면, 24시간 내에 1 g/L 기질의 10∼20%가 약 10 g/L KRED에 의해 생성물로 전환됨)로 및 입체선택성(99% 입체이성체 잉여율)으로 상기 기질을 상기 생성물로 전환시킬 수 있으므로, 서열 번호 90에 비해 향상된 본원의 폴리펩티드도 또한 야생형에 비해 향상된다.
몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 적어도 약 99%의 입체이성체 잉여율로 및 서열 번호 90의 아미노산 서열을 갖는 기준 폴리펩티드에 비해 적어도 1∼50배 향상된 전환율로 기질 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]벤조산 메틸 에스테르를 생성물 (S,E)-메틸 2-(3-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-하이드록시프로필)벤조에이트로 전환시킬 수 있다. 이러한 특징을 갖는 폴리펩티드의 예로는 서열 번호 42, 44, 46, 48, 86, 88, 92, 94, 96, 100 및 102에 해당하는 아미노산 서열을 포함하는 폴리펩티드를 들 수 있으나, 이들로 제한되지는 않는다.
몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 적어도 약 99%의 입체이성체 잉여율로 및 서열 번호 90의 아미노산 서열을 갖는 기준 폴리펩티드에 비해 적어도 50∼250배 향상된 전환율로 기질 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]벤조산 메틸 에스테르를 생성물 (S,E)-메틸 2-(3-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-하이드록시프로필)벤조에이트로 전환시킬 수 있다. 이러한 특징을 갖는 폴리펩티드의 예로는 서열 번호 10, 32, 34, 36, 50, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 98, 104, 106 및 108에 해당하는 아미노산 서열을 포함하는 폴리펩티드를 들 수 있으나, 이들로 제한되지는 않는다.
몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 적어도 약 99%의 입체이성체 잉여율로 및 서열 번호 90의 아미노산 서열을 갖는 기준 폴리펩티드에 비해 적어도 250∼1000배 향상된 전환율로 기질 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]벤조산 메틸 에스테르를 생성물 (S,E)-메틸 2-(3-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-하이드록시프로필)벤조에이트로 전환시킬 수 있다. 이러한 특징을 갖는 폴리펩티드의 예로는 서열 번호 12, 18, 22, 24, 26, 28, 30, 38, 40, 52, 54, 56, 58, 60, 62 및 110에 해당하는 아미노산 서열을 포함하는 폴리펩티드를 들 수 있으나, 이들로 제한되지는 않는다.
몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 적어도 약 99%의 입체이성체 잉여율로 및 서열 번호 90의 아미노산 서열을 갖는 기준 폴리펩티드에 비해 적어도 1000배 향상된 전환율로 기질 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]벤조산 메틸 에스테르를 생성물 (S,E)-메틸 2-(3-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-하이드록시프로필)벤조에이트로 전환시킬 수 있다. 이러한 특징을 갖는 폴리펩티드의 예로는 서열 번호 6, 8, 14, 16 및 20에 해당하는 아미노산 서열을 포함하는 폴리펩티드를 들 수 있으나, 이들로 제한되지는 않는다
몇몇 실시양태에서, 상기 향상된 케토리덕타제 폴리펩티드는 서열 번호 90의 아미노산 서열을 갖는 기준 폴리펩티드와 비교하여 상기 기질의 상기 생성물로의 전환에 대한 경쟁적 억제제로서의 아세톤에 대해 내성 향상을 가질 수 있다. 이러한 내성 향상을 갖는 폴리펩티드의 예로는 서열 번호 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 98, 104, 106, 108 및 110에 해당하는 아미노산 서열을 포함하는 폴리펩티드를 들 수 있으나, 이들로 제한되지는 않는다.
몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는, 약 100 g/L 초과의 기질 및 약 5 g/L 미만의 폴리펩티드를 사용하여 수행할 때, 약 24시간 미만 내에 상기 기질의 약 95% 이상을 상기 생성물로 전환시킬 수 있다. 이러한 능력을 갖는 폴리펩티드의 예로는 서열 번호 6, 8, 14, 16 및 20에 해당하는 아미노산 서열을 포함하는 폴리펩티드를 들 수 있으나, 이들로 제한되지는 않는다.
몇몇 실시양태에서, 본 개시내용의 케토리덕타제 폴리펩티드는 약 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8% 또는 99.9% 초과의 입체이성체 잉여율로 상기 기질을 상기 생성물로 환원시킬 수 있도록 고도로 입체선택적이다. 이러한 높은 입체선택성을 갖는 케토리덕타제 폴리펩티드의 예로는 서열 번호 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108 및 110에 해당하는 아미노산 서열을 포함하는 폴리펩티드를 들 수 있으나, 이들로 제한되지는 않는다.
몇몇 실시양태에서, 상기 향상된 케토리덕타제 폴리펩티드는 서열 번호 2 또는 서열 번호 4 서열 번호 114 또는 이의 영역 또는 도메인, 예컨대 잔기 90∼211과 적어도 약 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함할 수 있으며, 단 서열 번호 2, 4 또는 114의 잔기 190에 해당하는 잔기는 프롤린이고, 서열 번호 2, 4 또는 114의 잔기 195에 해당하는 잔기는 아르기닌이고, 서열 번호 2, 4 또는 114의 잔기 202에 해당하는 잔기는 트립토판이고, 추가로 상기 폴리펩티드가 야생형 케피르 케토리덕타제 또는 다른 조작된 케토리덕타제(예컨대, 서열 번호 90)에 비해 (예를 들면, 입체선택성, 효소 활성 및/또는 열 안정성과 관련하여) 더 향상되도록 7→H; 17→M; 25→T; 27→Y; 41→S; 53→D; 57→V; 64→V; 66→E; 68→V, E; 72→R; 76→A; 80→T, V; 93→S, A, G; 94→C, G; 95→L, E; 96→V, L, I, T; 97→H, S; 100→K, Q, A; 108→H; 111→M; 139→L; 145→L; 147→L; 152→W, A, S; 163→I; 179→F, K, L; 194→Q, S, L; 196→L; 197→E; 198→E, Q; 210→R; 211→V, L, R, T, D, I; 212→S, V; 216→R; 223→V; 233→N; 235→W; 248→W; 및 249→W의 치환 중 하나 이상을 갖는다.
몇몇 실시양태에서, 상기 향상된 케토리덕타제 폴리펩티드는 서열 번호 2, 4 또는 114(또는 이의 영역 또는 도메인, 예컨대 잔기 90∼211)와 적어도 약 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일한 아미노산 서열을 포함할 수 있으며, 단 서열 번호 2, 4 또는 114의 잔기 190에 해당하는 잔기는 프롤린이고, 서열 번호 2, 4 또는 114의 잔기 195에 해당하는 잔기는 아르기닌이고, 서열 번호 2, 4 또는 114의 잔기 202에 해당하는 잔기는 트립토판이고, 추가로 상기 폴리펩티드가 야생형 케피르 케토리덕타제 또는 다른 조작된 케토리덕타제(예컨대, 서열 번호 90)에 비해 (예를 들면, 입체선택성, 효소 활성 및/또는 열 안정성과 관련하여) 더 향상되도록 적어도 17→M; 27→Y; 64→V; 80→T; 93→S; 94→C; 96→L; 100→K; 147→L; 152→S; 194→Q; 및 211→V의 치환 중 하나 이상을 갖는다.
당업자라면, 달리 기재되지 않는 한, 상기 한정된 범주의 아미노산 중 몇몇은 상호 배제되지 않는다는 것을 이해할 것이다. 따라서, 2가지 이상의 물리화학적 특성을 나타내는 측쇄를 갖는 아미노산이 다수의 범주에 포함될 수 있다. 당업자라면 임의의 아미노산 또는 잔기의 적절한 분류를 특히 본원에 제공된 상세한 개시내용의 관점에서 명확히 알 것이다.
몇몇 실시양태에서, 상기 향상되는 조작된 케토리덕타제 효소는 천연 케토리덕타제 폴리펩티드의 결실 또는 다른 조작된 케토리덕타제 폴리펩티드의 결실을 포함한다. 몇몇 실시양태에서, 본원에 기재되어 있는 상기 향상되는 조작된 케토리덕타제 효소의 각각은 본원에 기재된 폴리펩티드의 결실을 포함할 수 있다. 따라서, 본 개시내용의 케토리덕타제 폴리펩티드의 각각의 실시양태 및 모든 실시양태에 있어서, 상기 결실은, 상기 케토리덕타제 활성의 기능적 활성이 유지되는 한, 상기 케토리덕타제 폴리펩티드의 아미노산의 총 수의 10% 이하, 10% 이하, 20% 이하 또는 30% 이하로 1개 이상의 아미노산, 2개 이상의 아미노산, 3개 이상의 아미노산, 4개 이상의 아미노산, 5개 이상의 아미노산, 6개 이상의 아미노산, 8개 이상의 아미노산, 10개 이상의 아미노산, 15개 이상의 아미노산 또는 20개 이상의 아미노산을 포함할 수 있다. 몇몇 실시양태에서, 상기 결실은 1∼2개, 1∼3개, 1∼4개, 1∼5개, 1∼6개, 1∼7개, 1∼8개, 1∼9개, 1∼10개, 1∼11개, 1∼12개, 1∼14개, 1∼15개, 1∼16개, 1∼18개, 1∼20개, 1∼22개, 1∼24개, 1∼25개, 1∼30개, 1∼35개 또는 약 1∼40개의 아미노산 잔기를 포함할 수 있다. 몇몇 실시양태에서, 상기 결실의 수는 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 14개, 15개, 16개, 18개, 20개, 22개, 24개, 26개, 30개, 35개 또는 약 40개의 아미노산일 수 있다. 몇몇 실시양태에서, 상기 결실은 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 18개 또는 20개의 아미노산 잔기의 결실을 포함할 수 있다.
본원에 기재된 바와 같이, 본 개시내용의 케토리덕타제 폴리펩티드는 본 케토리덕타제 폴리펩티드가 다른 폴리펩티드, 예컨대 예의 방식으로 항체 태그(예를 들면, myc 에피토프), 정제 서열(예를 들면, His 태그) 및 세포 편재 신호(예를 들면, 분비 신호)에 융합된 융합 펩티드의 형태(이들로 제한되지는 않음)일 수 있다. 따라서, 상기 케토리덕타제 폴리펩티드는 다른 폴리펩티드에 융합된 채 또는 다른 폴리펩티드에 융합되지 않은 채 사용될 수 있다.
본원에 기재된 폴리펩티드는 유전적으로 코딩된 아미노산으로 제한되지 않는다. 본원에 기재된 폴리펩티드는, 상기 유전적으로 코딩된 아미노산 이외에, 천연 및/또는 합성 비코딩된 아미노산의 전체 또는 부분 중 어느 하나에 포함될 수 있다. 본원에 기재된 폴리펩티드가 포함될 수 있는 몇몇의 통상적으로 발견되는 비코딩된 아미노산으로는 하기의 것들을 들 수 있으나, 이들로 제한되지는 않는다: 유전적으로 코딩된 아미노산의 D-입체이성질체; 2,3-디아미노프로피온산(Dpr); α-아미노이소부티르산(Aib); ε-아미노헥산산(Aha); δ-아미노발레르산(Ava); N-메틸글리신 또는 사르코신(MeGly 또는 Sar); 오르니틴(Orn); 시트룰린(Cit); t-부틸알라닌(Bua); t-부틸글리신(Bug); N-메틸이소루신(MeIle); 페닐글리신(Phg); 시클로헥실알라닌(Cha); 노르루신(Nle); 나프틸알라닌(Nal); 2-클로로페닐알라닌(Ocf); 3-클로로페닐알라닌(Mcf); 4-클로로페닐알라닌(Pcf); 2-플루오로페닐알라닌(Off); 3-플루오로페닐알라닌(Mff); 4-플루오로페닐알라닌(Pff); 2-브로모페닐알라닌(Obf); 3-브로모페닐알라닌(Mbf); 4-브로모페닐알라닌(Pbf); 2-메틸페닐알라닌(Omf); 3-메틸페닐알라닌(Mmf); 4-메틸페닐알라닌(Pmf); 2-니트로페닐알라닌(Onf); 3-니트로페닐알라닌(Mnf); 4-니트로페닐알라닌(Pnf); 2-시아노페닐알라닌(Ocf); 3-시아노페닐알라닌(Mcf); 4-시아노페닐알라닌(Pcf); 2-트리플루오로메틸페닐알라닌(Otf); 3-트리플루오로메틸페닐알라닌(Mtf); 4-트리플루오로메틸페닐알라닌(Ptf); 4-아미노페닐알라닌(Paf); 4-요오도페닐알라닌(Pif); 4-아미노메틸페닐알라닌(Pamf); 2,4-디클로로페닐알라닌(Opef); 3,4-디클로로페닐알라닌(Mpcf); 2,4-디플루오로페닐알라닌(Opff); 3,4-디플루오로페닐알라닌(Mpff); 피리드-2-일알라닌(2pAla); 피리드-3-일알라닌(3pAla); 피리드-4-일알라닌(4pAla); 나프트-1-일알라닌(InAla); 나프트-2-일알라닌(2nAla); 티아졸릴알라닌(taAla); 벤조티에닐알라닌(bAla); 티에닐알라닌(tAla); 푸릴알라닌(fAla); 호모페닐알라닌(hPhe); 호모티로신(hTyr); 호모트립토판(hTrp); 펜타플루오로페닐알라닌(5ff); 스티릴칼라닌(sAla); 안트릴알라닌(aAla); 3,3-디페닐알라닌(Dfa); 3-아미노-5-페니펜탄산(Afp); 페니실라민(Pen); l,2,3,4-테트라히드로이소퀴놀린-3-카르복실산(Tic); β-2-티에닐알라닌(Thi); 메티오닌 술폭시드(Mso); N(w)-니트로아르기닌(nArg); 호모리신(hLys); 포스포노메틸페닐알라닌(pmPhe); 포스포세린(pSer); 포스포트레오닌(pThr); 호모아스파르트산(hAsp); 호모글루탐산(hGlu); 1-아미노시클로펜트-(2 또는 3)-엔-4 카르복실산; 피페콜산(PA), 아제티딘-3-카르복실산(ACA); 1-아미노시클로펜탄-3-카르복실산; 알릴글리신(aOly); 프로파르길글리신(pgGly); 호모알라닌(hAla); 노르발린(nVal); 호모루신(hLeu), 호모발린(hVal); 호모이소루신(hIle); 호모아르기닌(hArg); N-아세틸리신(AcLys); 2,4-디아미노부티르산(Dbu); 2,3-디아미노부티르산(Dab); N-메틸발린(MeVal); 호모시스테인(hCys); 호모세린(hSer); 히드록시프롤린(Hyp) 및 호모프롤린(hPro). 당업자라면 본원에 기재된 폴리펩티드가 포함될 수 있는 부가적인 비코딩된 아미노산을 명확히 알 것이다(예를 들면, 전문이 참조문헌으로 포함되는 문헌[Fasman, 1989, CRC Practical Handbook of Biochemistry and Molecular Biology, CRC Press, Boca Raton, FL, 3-70 페이지] 및 이 문헌에 인용된 참조문헌에 제공된 각종 아미노산들을 참조한다). 이 아미노산은 L 구성 또는 D 구성일 수 있다.
당업자라면 측쇄 보호기를 갖는 아미노산 또는 잔기가 본원에 기재된 폴리펩티드도 포함할 수 있다는 것을 이해할 것이다. 이 경우에 방향족 범주에 속하는 상기 보호된 아미노산의 비제한적 예로는 하기의 것(괄호 안에 열거된 보호기)을 들 수 있으나, 이들로 제한되지는 않는다: Arg(tos), Cys(메틸벤질), Cys(니트로피리딘술페닐), Glu(δ-벤질에스테르), Gln(잔틸), Asn(N-δ-잔틸), His(bom), His(벤질), His(tos), Lys(fmoc), Lys(tos), Ser(O-벤질), Thr(O-벤질) 및 Tyr(O-벤질).
본원에 기재된 폴리펩티드가 포함될 수 있는 구속성으로 배치되는 비코딩된 아미노산으로는 N-메틸 아미노산(L 구성); 1-아미노시클로펜트-(2 또는 3)-엔-4-카르복실산; 피페콜산; 아제티딘-3-카르복실산; 호모프롤린(hPro); 및 1-아미노시클로펜탄-3-카르복실산을 들 수 있으나, 이들로 제한되지는 않는다.
상기 기재된 바와 같이, 조작된 케토리덕타제 효소를 생성시키기 위해 천연 폴리펩티드에 도입된 각종 변형은 효소의 특정 특성에 표적화될 수 있다.
6.3 조작된 케토리덕타제를 코딩하는 폴리뉴클레오티드
다른 양태에서, 본 개시내용은 상기 조작된 케토리덕타제 효소를 코딩하는 폴리뉴클레오티드를 개시한다. 상기 폴리뉴클레오티드는 폴리펩티드를 발현할 수 있는 재조합 폴리뉴클레오티드를 생성시키기 위해 유전자 발현을 조절하는 하나 이상의 이종 조절 서열에 작동가능하게 연결될 수 있다. 상기 조작된 케토리덕타제를 코딩하는 이종 폴리뉴클레오티드를 포함하는 발현 구성체를 적절한 숙주 세포에 도입하여 상응하는 케토리덕타제 폴리펩티드를 발현시킬 수 있다.
각종 아미노산에 상응하는 코돈을 알고 있으므로, 단백질 서열을 이용하여 그 대상을 코딩할 수 있는 모든 폴리뉴클레오티드의 설명을 얻을 수 있다. 대안 코돈 또는 동의 코돈에 의해 동일한 아미노산이 코딩되는 유전자 코드의 변성에 의해 상당히 많은 수의 핵산이 제조될 수 있고, 이들 모두는 본원에 개시된 향상된 케토리덕타제 효소를 코딩한다. 따라서, 특정 아미노산 서열이 동정되면, 당업자는 단백질의 아미노산 서열을 변화시키지 않는 방식으로 하나 이상의 코돈의 서열을 간단히 변형시켜 임의의 수의 상이한 핵산을 만들 수 있다. 이와 관련하여, 본 개시내용은 가능한 코돈 선택에 기초하여 조합을 선택하여 만들 수 있는 폴리뉴클레오티드의 각각의 가능한 변형 및 모든 가능한 변형을 구체적으로 고려하며, 모든 그러한 변형은 표 2에 제시된 아미노산 서열을 비롯하여 본원에 개시된 임의의 폴리펩티드에 대해 구체적으로 개시되어 있는 것으로 간주되어야 한다. 몇몇 실시양태에서, 코돈은 바람직하게는 단백질이 생성되는 숙주 세포에 맞도록 선택된다. 예를 들면, 박테리아에 사용되는 바람직한 코돈은 박테리아 내 유전자 발현에 사용되고, 효모에 사용되는 바람직한 코돈은 효모 내 발현에 사용되며, 포유동물에 사용되는 바람직한 코돈은 포유동물 세포 내 발현에 사용된다. 예로서, 서열 번호 3의 폴리뉴클레오티드는 이. 콜라이(E. coli) 내 발현을 위해 최적화된 코돈이지만, 그렇지 않을 경우 락토바실러스 케피르의 천연 케토리덕타제를 코딩한다.
몇몇 실시양태에서, 천연 서열이 바람직한 코돈을 포함하고 바람직한 코돈의 사용이 모든 아미노산 잔기에 필요하지 않을 수 있으므로 모든 코돈이 케토리덕타제의 코돈 사용을 최적화되도록 치환될 필요는 없다. 결과적으로, 케토리덕타제 효소를 코딩하는 코돈 최적화된 폴리뉴클레오티드는 전장 코딩 영역의 코돈 위치의 약 40%, 50%, 60%, 70%, 80% 또는 90% 초과에서 바람직한 코돈을 포함할 수 있다.
몇몇 실시양태에서, 상기 폴리뉴클레오티드는 본원에 기재된 기준 조작된 케토리덕타제 폴리펩티드에 적어도 약 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 또는 그 이상의 서열 동일성을 갖는 아미노산 서열을 갖는 케토리덕타제 폴리펩티드를 코딩하는 뉴클레오티드 서열을 포함한다. 따라서, 몇몇 실시양태에서, 상기 폴리뉴클레오티드는 X190번에 해당하는 잔기가 구속성 잔기, 특히 프롤린인 특징 및 X202에 해당하는 잔기가 방향족 잔기, 특히 트립토판인 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 약 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상 동일한 아미노산 서열을 코딩하며, 단 상기 코딩된 케토리덕타제 폴리펩티드는 X190에 해당하는 잔기가 구속성 잔기이고, X202에 해당하는 잔기가 방향족 잔기인 아미노 서열을 갖는다. 몇몇 실시양태에서, 상기 폴리뉴클레오티드는 X190에 해당하는 잔기가 프롤린이고, X202에 해당하는 잔기가 트립토판인 아미노산 서열을 갖는 케토리덕타제를 코딩한다.
몇몇 실시양태에서, 상기 폴리뉴클레오티드는 X190번에 해당하는 잔기가 구속성 잔기, 특히 프롤린인 특징, X195에 해당하는 잔기가 염기성, 산성, 비극성 또는 극성 잔기, 특히 프롤린, 아르기닌, 리신, 아스파르트산 또는 아스파라긴인 특징 및 X202에 해당하는 잔기가 방향족 잔기, 특히 트립토판인 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 적어도 약 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상 동일한 아미노산 서열을 포함하는 케토리덕타제 폴리펩티드를 코딩하며, 단 상기 코딩된 케토리덕타제 폴리펩티드는 적어도 상술한 특징(즉, X190번에 해당하는 잔기가 구속성 잔기인 특징, X195에 해당하는 잔기가 염기성, 산성, 비극성 또는 극성 잔기인 특징 및 X202에 해당하는 잔기가 방향족 잔기인 특징)을 갖는 아미노산 서열을 포함한다. 몇몇 실시양태에서, 상기 코딩된 케토리덕타제는 X190에 해당하는 잔기가 프롤린이고, X195에 해당하는 잔기가 프롤린, 아르기닌, 리신, 아스파르트산 또는 아스파라긴이고, X202에 해당하는 잔기가 트립토판인 아미노산 서열을 갖는다. 몇몇 실시양태에서, 상기 폴리뉴클레오티드는 서열 번호 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 92, 94, 96, 98, 100, 102, 104, 106, 108 및 110으로부터 선택된 아미노산 서열을 포함하는 조작된 케토리덕타제 폴리펩티드를 코딩한다.
몇몇 실시양태에서, 상기 폴리뉴클레오티드는 서열 번호 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 92, 94, 96, 98, 100, 102, 104, 106, 108 및 110으로부터 선택된 기준 서열과 적어도 약 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상 동일한 아미노산 서열을 포함하는 케토리덕타제 폴리펩티드를 코딩하며, 상기 코딩된 폴리펩티드는 X190 및 X202에 해당하는 잔기에 대해 본원에 특정된 특징 또는 잔기 X190, X195 및 X202에 대해 본원에 특정된 특징을 갖는다.
몇몇 실시양태에서, 상기 조작된 케토리덕타제를 코딩하는 폴리뉴클레오티드는 서열 번호 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107 및 109로부터 선택된다. 몇몇 실시양태에서, 상기 폴리뉴클레오티드는 서열 번호 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107 또는 109를 포함하는 폴리뉴클레오티드에 고도로 엄격한 조건하에 하이브리드화할 수 있으며, 고도로 엄격한 조건하에 하이브리드화하는 폴리뉴클레오티드는 구조식 I의 기질을 구조식 II의 생성물로 환원 또는 전환시킬 수 있는 케토리덕타제 폴리펩티드를 코딩한다. 몇몇 실시양태에서, 엄격하게 하이브리드화하는 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드는 구조식 III의 기질을 구조식 IV의 생성물로 환원 또는 전환시킬 수 있다. 몇몇 실시양태에서, 엄격하게 하이브리드화하는 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드는 특정 효소 활성 및 X190 및 X202에 해당하는 잔기에 대해 특정된 특징 또는 X190, X195 및 X202에 해당하는 잔기에 대해 특정된 특징을 갖는다.
몇몇 실시양태에서, 상기 폴리뉴클레오티드는 본원에 기재된 폴리펩티드를 코딩하지만, 뉴클레오티드 수준에서 조작된 케토리덕타제를 코딩하는 기준 폴리뉴클레오티드에 약 80% 또는 그 이상의 서열 동일성, 약 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 또는 그 이상의 서열 동일성을 갖는다. 몇몇 실시양태에서, 상기 기준 폴리뉴클레오티드는 서열 번호 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107 및 109로부터 선택된다.
향상된 케토리덕타제 폴리펩티드를 코딩하는 단리된 폴리뉴클레오티드는 폴리펩티드의 발현을 제공하기 위해 각종 방식으로 조작될 수 있다. 벡터에 삽입하기 전에 단리된 폴리펩티드를 조작하는 것이 발현 벡터에 따라 바람직하거나 필요할 수 있다. 재조합 DNA 방법을 이용하여 폴리뉴클레오티드 및 핵산 서열을 변형시키는 기술이 당업계에 공지되어 있다. 가이드라인이 문헌[Sambrook et al., 2001, Molecular Cloning: A Laboratory Manual, 3rd Ed., Cold Spring Harbor Laboratory Press]; 및 문헌[Current Protocols in Molecular Biology, Ausubel. F. ed., Greene Pub. Associates, 1998, 2006 업데이트]에 기재되어 있다.
박테리아 숙주 세포에 있어서, 본 개시내용의 핵산 구성체의 전사를 지시하기 위한 적절한 프로모터로는 이. 콜라이 lac 오페론, 이. 콜라이 trp 오페론, 스트렙토마이세스 코엘리콜로르(Streptomyces coelicolor) 아가라제 유전자(dagA), 바실러스 섭틸리스(Bacillus subtilis) 레반수크라세 유전자(sacB), 바실러스 리체니포르미스(Bacillus licheniformis) 알파-아밀라제 유전자(amyL), 바실러스 스테아로써모필러스(Bacillus stearothermophilus) 말토제닉 아밀라제 유전자(amyM), 바실러스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens) 알파-아밀라제 유전자(amyQ), 바실러스 리체니포르미스 페니실리나제 유전자(penP), 바실러스 섭틸리스 xylA 및 xylB 유전자 및 원핵 베타-락타마제 유전자로부터 얻어진 프로모터(문헌[Villa-Kamaroff et al., 1978, Proc. Natl Acad. Sci. USA 75: 3727-3731]) 및 tac 프로모터(문헌[DeBoer et al., 1983, Proc. Natl Acad. Sci. USA 80: 21-25])를 들 수 있다.
필라멘트형 진균 숙주 세포에 있어서, 본 개시내용의 핵산 구성체의 전사를 지시하기 위한 적절한 프로모터로는 아스퍼질러스 오리자(Aspergillus oryzae) TAKA 아밀라제, 리조무코르 미에헤이(Rhizomucor miehei) 아스파르트산 프로테인아제, 아스퍼질러스 니게르(Aspergillus niger) 중성 알파-아밀라제, 아스퍼질러스 니게르 산 안정성 알파-아밀라제, 아스퍼질러스 니게르 또는 아스퍼질러스 아와모리(Aspergillus awamori) 글루코아밀라제(glaA), 리조무코르 미에헤이 리파아제, 아스퍼질러스 오리자 알칼리 프로테아제, 아스퍼질러스 오리자 트리오스 포스페이트 이소머라제, 아스퍼질러스 니둘란스(Aspergillus nidulans) 아세트아미다제 및 푸사리움 옥시스포룸(Fusarium oxysporum) 트립신 유사 프로테아제(WO 제96/00787호)에 대한 유전자로부터 얻은 프로모터 및 NA2-tpi 프로모터(아스퍼질러스 니게르 중성 알파-아밀라제 및 아스퍼질러스 오리자 트리오스 포스페이트 이소머라제에 대한 유전자로부터 얻은 프로모터의 하이브리드) 및 이들의 돌연변이체, 절단형 및 하이브리드 프로모터를 들 수 있다.
효모 숙주에서, 유용한 프로모터는 사카로마이세스 세레비지아(Saccharomyces cerevisiae) 에놀라제(ENO-1), 사카로마이세스 세레비지아 갈락토키나아제(GAL1), 사카로마이세스 세레비지아 알콜 탈수소효소/글리세르알데히드-3-포스페이트 탈수소효소(ADH2/GAP) 및 사카로마이세스 세레비지아 3-포스포글리세레이트 키나아제에 대한 유전자로부터 얻을 수 있다. 효모 숙주 세포에 대한 다른 유용한 프로모터가 문헌[Romanos et al., 1992, Yeast 8:423-488]에 기재되어 있다.
또한, 조절 서열은 전사를 종료시키기 위해 숙주 세포에 의해 인식되는 서열인 적절한 전사 종결자 서열일 수 있다. 종결자 서열은 폴리펩티드를 코딩하는 핵산 서열의 3' 말단에 작동가능하게 연결된다. 선택된 숙주 세포에서 작용하는 임의의 종결자가 본 발명에서 사용될 수 있다.
예를 들면, 필라멘트형 진균 숙주 세포에 대한 전사 종결자의 예로는 아스퍼질러스 오리자 TAKA 아밀라제, 아스퍼질러스 니게르 글루코아밀라제, 아스퍼질러스 니둘란스 안트라닐레이트 신타제, 아스퍼질러스 니게르 알파-글루코시다제 및 푸사리움 옥시스포룸 트립신 유사 프로테아제에 대한 유전자로부터 얻을 수 있다.
효모 숙주 세포에 대한 종결자의 예로는 사카로마이세스 세레비지아 에놀라제, 사카로마이세스 세레비지아 사이토크롬 C(CYC1) 및 사카로마이세스 세레비지아 글리세르알데히드-3-포스페이트 탈수소효소에 대한 유전자로부터 얻을 수 있다. 효모 숙주 세포에 대한 다른 유용한 종결자는 문헌[Romanos et al., 1992, 이하 상기와 동일]에 기재되어 있다.
또한, 조절 서열은 숙주 세포에 의한 번역에 중요한 mRNA의 비번역 영역인 적절한 리더 서열일 수 있다. 상기 리더 서열은 폴리펩티드를 코딩하는 핵산 서열의 5' 말단에 작동가능하게 연결된다. 선택된 숙주 세포에서 작용하는 임의의 리더 서열이 사용될 수 있다. 리더의 예로는 M13 파아지 pIII 리더 서열, 이. 콜라이 말토스 결합 단백질 리더 서열 및 이. 콜라이. pelB 리더 서열을 들 수 있다. 필라멘트형 진균 숙주 세포에 대한 리더의 예로는 아스퍼질러스 오리자 TAKA 아밀라제 및 아스퍼질러스 니둘란스 트리오스 포스페이트 이소머라제에 대한 유전자로부터 얻을 수 있다. 효모 숙주 세포에 대한 적절한 리더는 사카로마이세스 세레비지아 에놀라제(ENO-1), 사카로마이세스 세레비지아 3-포스포글리세레이트 키나아제, 사카로마이세스 세레비지아 알파 인자 및 사카로마이세스 세레비지아 알콜 탈수소효소/글리세르알데히드-3-포스페이트 탈수소효소(ADH2/GAP)에 대한 유전자로부터 얻는다.
또한, 조절 서열은 핵산 서열의 3' 말단에 작동가능하게 연결되고, 전사시 전사된 mRNA에 폴리아데노신 잔기를 부가하기 위한 신호로서 숙주 세포에 의해 인식되는 서열인 폴리아데닐화 서열일 수 있다. 선택된 숙주 세포에서 작용하는 임의의 폴리아데닐화 서열이 본 발명에서 사용될 수 있다. 필라멘트형 진균 숙주 세포에 대한 폴리아데닐화 서열의 예로는 아스퍼질러스 오리자 TAKA 아밀라제, 아스퍼질러스 니게르 글루코아밀라제, 아스퍼질러스 니둘란스 안트라닐레이트 신타제, 푸사리움 옥시스포룸 트립신 유사 프로테아제 및 아스퍼질러스 니게르 알파-글루코시다제에 대한 유전자로부터 얻을 수 있다. 효모 숙주 세포에 대한 유용한 폴리아데닐화 서열은 문헌[Guo and Sherman, 1995, Mol Cell Bio 15:5983-5990]에 기재되어 있다.
또한, 조절 서열은 폴리펩티드의 아미노 말단에 연결된 아미노산 서열을 코딩하며 그 코딩된 폴리펩티드를 세포의 분비 경로로 지시하는 신호 펩티드 코딩 영역일 수 있다. 핵산 서열의 코딩 서열의 5' 말단은 분비된 폴리펩티드를 코딩하는 코딩 영역의 분절을 갖는 번역 판독 프레임에 자연 연결된 신호 펩티드 코딩 영역을 원래 포함할 수 있다. 대안적으로, 코딩 서열의 5' 말단은 코딩 서열에 외래인 신호 펩티드 코딩 영역을 포함할 수 있다. 외래 신호 펩티드 코딩 영역은 코딩 서열이 신호 펩티드 코딩 영역을 본래 포함하지 않는 경우 필요할 수 있다.
대안적으로, 외래 신호 펩티드 코딩 영역은 폴리펩티드의 분비를 향상시키기 위해 자연 신호 펩티드 코딩 영역을 간단히 대체할 수 있다. 그러나, 발현된 폴리펩티드를 선택된 숙주 세포의 분비 경로로 지시하는 임의의 신호 펩티드 코딩 영역이 본 발명에서 사용될 수 있다.
박테리아 숙주 세포에 효과적인 신호 펩티드 코딩 영역은 바실러스 NClB 11837 말토제닉 아밀라제, 바실러스 스테아로써모필러스 알파-아밀라제, 바실러스 리체니포르미스 섭틸리신, 바실러스 리체니포르미스 베타-락타마제, 바실러스 스테아로써모필러스 중성 프로테아제(nprT, nprS, nprM) 및 바실러스 섭틸리스 prsA에 대한 유전자로부터 얻은 신호 펩티드 코딩 영역이다. 추가의 신호 펩티드는 문헌[Simonen and Palva, 1993, Microbiol Rev 57: 109-137]에 기재되어 있다.
필라멘트형 진균 숙주 세포에 효과적인 신호 펩티드 코딩 영역은 아스퍼질러스 오리자 TAKA 아밀라제, 아스퍼질러스 니게르 중성 아밀라제, 아스퍼질러스 니게르 글루코아밀라제, 리조무코르 미에헤이 아스파르트산 프로테인아제, 후미콜라 인솔렌스(Humicola insolens) 셀룰라제 및 후미콜라 라누기노사(Humicola lanuginosa) 리파아제에 대한 유전자로부터 얻은 신호 펩티드 코딩 영역일 수 있다.
효모 숙주 세포에 유용한 신호 펩티드는 사카로마이세스 세레비지아 알파 인자 및 사카로마이세스 세레비지아 인버타제에 대한 유전자로부터 얻을 수 있다. 다른 유용한 신호 펩티드 코딩 영역은 문헌[Romanos et al., 1992, 이하 상기와 동일]에 기재되어 있다.
또한, 조절 서열은 폴리펩티드의 아미노 말단에 위치한 아미노산 서열을 코딩하는 프로펩티드 코딩 영역일 수 있다. 생성된 폴리펩티드는 효소 전구체 또는 프로폴리펩티드(propolypeptide)(또는 몇몇 경우, 지모겐)로 알려져 있다. 프로폴리펩티드는 일반적으로 불활성이며, 프로폴리펩티드로부터 프로펩티드를 촉매 또는 자가 촉매 분해하여 성숙한 활성 폴리펩티드로 전환시킬 수 있다. 프로펩티드 코딩 영역은 바실러스 섭틸리스 알칼리 프로테아제(aprE), 바실러스 섭틸리스 중성 프로테아제(nprT), 사카로마이세스 세레비지아 알파 인자, 리조무코르 미에헤이 아스파르트산 프로테인아제 및 마이셀리오프소라 써모필라(Myceliophthora thermophila) 락타제에 대한 유전자로부터 얻을 수 있다(WO 제95/33836호).
신호 펩티드 및 프로펩티드 영역 둘 다가 폴리펩티드의 아미노 말단에 존재하는 경우, 프로펩티드 영역은 폴리펩티드의 아미노 말단 옆에 위치하며, 신호 펩티드 영역은 프로펩티드 영역의 아미노 말단 옆에 위치한다.
또한, 숙주 세포의 성장에 대해 폴리펩티드의 발현의 제어를 가능하게 하는 조절 서열을 부가하는 것이 바람직할 수 있다. 제어 시스템의 예로는 조절 화합물의 존재를 비롯한 화학적 또는 물리적 자극에 반응하여 유전자의 발현을 개시 및 정지시키는 것들이다. 원핵 숙주 세포에서, 적절한 조절 서열로는 lac, tac 및 trp 오퍼레이터(operator) 시스템을 들 수 있다. 효모 숙주 세포에서, 적절한 조절 시스템으로는 예컨대 ADH2 시스템 또는 GAL1 시스템을 들 수 있다. 필라멘트형 진균에서, 적절한 조절 서열로는 TAKA 알파-아밀라제 프로모터, 아스퍼질러스 니게르 글루코아밀라제 프로모터 및 아스퍼질러스 오리자 글루코아밀라제 프로모터를 들 수 있다.
조절 서열의 다른 예로는 유전자 증폭을 가능하게 하는 것이다. 진핵 시스템에서, 이것으로 메톡트렉세이트의 존재하에 증폭되는 디히드로폴레이트 환원효소 유전자 및 중금속으로 증폭되는 메탈로티오네인(metallothionein) 유전자를 들 수 있다. 이러한 경우, 본 발명의 KRED 폴리펩티드를 코딩하는 핵산 서열은 조절 서열과 작동가능하게 연결될 것이다.
따라서, 다른 실시양태에서, 본 개시내용은 또한 도입되는 숙주의 유형에 따라, 조작된 케토리덕타제 폴리펩티드 또는 이의 변이체를 코딩하는 폴리뉴클레오티드를 포함하는 재조합 발현 벡터 및 프로모터 및 종결자와 같은 하나 이상의 발현 조절 영역, 복제 기점 등에 관한 것이다. 상기 기재된 각종 핵산 및 조절 서열은 서로 결합하여 하나 이상의 편리한 제한 부위에서 폴리펩티드를 코딩하는 핵산 서열의 삽입 또는 치환을 가능하게 하는 이러한 위치를 포함할 수 있는 재조합 발현 벡터를 생성시킬 수 있다. 대안적으로, 본 개시내용의 핵산 서열은 발현에 적절한 벡터에 서열을 포함하는 핵산 서열 또는 핵산 구성체를 삽입하여 발현될 수 있다. 발현 벡터를 생성시킬 때, 코딩 서열은 그 코딩 서열이 발현에 적절한 조절 서열에 작동가능하게 연결되도록 벡터 내에 위치한다.
재조합 발현 벡터는 편리하게는 재조합 DNA 절차를 실시할 수 있고 폴리뉴클레오티드 서열의 발현을 발생시킬 수 있는 임의의 벡터(예를 들면, 플라스미드 또는 바이러스)일 수 있다. 벡터의 선택은 통상적으로 벡터가 도입되는 숙주 세포와의 벡터의 적합성에 따라 달라질 수 있다. 벡터는 선형 또는 고리형의 원형 플라스미드일 수 있다.
발현 벡터는 자가 복제 벡터, 즉 그 복제가 염색체 복제와는 독립적인 염색체외 실체로서 존재하는 벡터, 예를 들면 플라스미드, 염색체외 요소, 미니 염색체 또는 인공 염색체일 수 있다. 상기 벡터는 자기 복제를 보장하는 임의의 수단을 포함할 수 있다. 대안적으로, 상기 벡터는 숙주 세포에 도입시 게놈에 통합되고 통합되는 염색체(들)와 함께 복제될 수 있다. 또한, 숙주 세포의 게놈에 도입하고자 하는 전체 DNA를 함께 포함하는 단일 벡터 또는 플라스미드 또는 2개 이상의 벡터 또는 플라스미드 또는 전이 인자(transposon)를 사용할 수 있다.
본 발명의 발현 벡터는 바람직하게는 형질전환된 세포의 용이한 선별을 가능하게 하는 하나 이상의 선별가능한 마커를 포함한다. 선별가능한 마커는 살생제 또는 바이러스 내성, 중금속에 대한 내성, 영양요구주에 대한 원영양성(prototrophy) 등을 제공하는 생성물인 유전자이다. 박테리아 선별가능한 마커의 예로는 바실러스 섭틸리스 또는 바실러스 리체니포르미스로부터 얻은 dal 유전자 또는 암피실린, 카나마이신, 클로람페니콜(실시예 1) 또는 테트라시클린 내성과 같은 항생제 내성을 부여하는 마커를 들 수 있다. 효모 숙주 세포에 적절한 마커는 ADE2, HIS3, LEU2, LYS2, MET3, TRP1 및 URA3이다.
필라멘트형 진균 숙주 세포에 사용하기 위한 선별가능한 마커로는 amdS(아세트아미다제), argB(오르니틴 카르바모일 전이효소), bar(포스피노트리신 아세틸 전이효소), hph(하이그로마이신 인 전이효소), niaD(질산염 환원효소), pyrG(오로티딘-5'-인산염 디카르복실라제), sC(황산염 아데닐 전이효소) 및 trpC(안트라닐레이트 신타제) 및 이의 등가물을 들 수 있으나, 이들로 제한되지 않는다. 아스퍼질러스 세포에 사용하기 위한 실시양태는 아스퍼질러스 니둘란스 또는 아스퍼질러스 오리자의 amdS 및 pyrG 유전자 및 스트렙토마이세스 하이그로스코피쿠스(Streptomyces hygroscopicus)의 bar 유전자를 포함한다.
본 발명의 발현 벡터는 바람직하게는 벡터를 숙주 세포의 게놈에 통합시커거나 또는 게놈과 독립적으로 세포 내에서 벡터가 자가 복제하도록 하는 요소(들)를 포함한다. 숙주 세포 게놈로의 통합에 있어서, 벡터는 폴리펩티드를 코딩하는 핵산 서열 또는 동종 또는 비동종 재조합에 의해 벡터를 게놈에 통합시키기 위한 벡터의 임의의 다른 요소에 따라 달라질 수 있다.
대안적으로, 발현 벡터는 동종 재조합에 의해 숙주 세포의 게놈으로 통합을 지시하기 위한 추가의 핵산 서열을 포함할 수 있다. 추가의 핵산 서열에 의해 벡터가 염색체(들) 내 정확한 위치(들)에서 숙주 세포 게놈으로 통합된다. 정확한 위치에서의 통합의 가능성을 증가시키기 위해, 통합 요소는 바람직하게는 동종 재조합의 가능성을 향상시키도록 상응하는 표적 서열과 상당히 동종인 100개 내지 10,000개의 염기 쌍, 바람직하게는 400개 내지 10,000개의 염기 쌍, 가장 바람직하게는 800개 내지 10,000개의 염기 쌍과 같은 충분한 수의 핵산을 포함해야 한다. 통합 요소는 숙주 세포의 게놈 내 표적 서열과 동종인 임의의 서열일 수 있다. 또한, 통합 요소는 비코딩 또는 코딩 핵산 서열일 수 있다. 한편, 벡터는 비동종 재조합에 의해 숙주 세포의 게놈으로 통합될 수 있다.
자가 복제를 위해, 벡터는 벡터가 당해 숙주 세포에서 자가 복제되도록 하는 복제 기점을 더 포함할 수 있다. 박테리아의 복제 기점의 예로는 (도 5의 플라즈미드에 도시된 바의) P15A ori 또는 이. 콜라이에서의 복제를 가능하게 하는 플라스미드 pBR322, pUC19, pACYC177(플라스미드는 P15A ori를 가짐) 또는 pACYC184의 복제 기점 및 바실러스에서의 복제를 가능하게 하는 pUB110, pE194, pTA1060 또는 pAMβ1의 복제 기점을 들 수 있다. 효모 숙주 세포에서 사용하기 위한 복제 기점의 예로는 2 마이크론의 복제 기점, ARS1, ARS4, ARS1과 CEN3의 조합 및 ARS4와 CEN6의 조합을 들 수 있다. 복제 기점은 숙주 세포 내에서 온도에 민감하게 기능하도록 하는 돌연변이를 갖는 것일 수 있다(예를 들면, 문헌[Ehrlich, 1978, Proc Natl Acad Sci. USA 75:1433] 참조).
본 발명의 핵산 서열의 1개 초과의 카피를 숙주 세포에 삽입하여 유전자 생성물의 생성을 증가시킬 수 있다. 핵산 서열의 1개 이상의 추가 카피를 숙주 세포 게놈에으로 통합하거나, 증폭 가능한 선별가능한 마커 유전자를 핵산 서열과 함께 포함시켜 핵산 서열의 카피수를 증가시킬 수 있고, 여기서 적절한 선별가능한 제제의 존재하에 세포를 배양하여 선별가능한 마커 유전자의 증폭 카피 및 이에 따른 핵산 서열의 추가 카피를 포함하는 세포를 선별할 수 있다.
본 발명에 사용하기 위한 다수의 발현 벡터들은 상업적으로 입수가능하다. 적절한 상업적인 발현 벡터로는 포유동물 숙주 세포에서의 발현을 위한 CMV 프로모터 및 hGH 폴리아데닐화 부위 및 pBR322의 복제 기점 및 이. 콜라이에서의 증폭을 위한 암피실린 내성 마커를 포함하는, 시그마 알드리히 케미컬즈(Sigma-Aldrich Chemicals; 미국 미주리주 세인트 루이스 소재)로부터 입수가능한 p3xFLAGTM™ 발현 벡터를 들 수 있다. 다른 적합한 발현 벡터는 스트라타젠(Stratagene; 미국 캘리포니아주 라졸라 소재)으로부터 상업적으로 입수가능한 pBluescriptII SK(-) 및 pBK-CMV 및 pBR322(Gibco BRL), pUC(Gibco BRL), pREP4, pCEPA(Invitrogen) 또는 pPoly로부터 얻은 플라스미드(문헌[Lathe et al., 1987, Gene 57:193-201])이다.
6.4 케토리덕타제 폴리펩티드의 발현을 위한 숙주 세포
또 다른 양태에서, 본 개시내용은 본 개시내용의 향상된 케토리덕타제 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 숙주 세포를 제공하고, 상기 폴리뉴클레오티드는 숙주 세포에서의 케토리덕타제 효소의 발현을 위한 하나 이상의 조절 서열에 작동가능하게 연결된다. 본 발명의 발현 벡터에 의해 코딩되는 케토리덕타제 폴리펩티드를 발현시키는 데 사용하기 위한 숙주 세포는 당업계에 공지되어 있고, 이로는 이. 콜라이, 락토바실러스 케피르, 락토바실러스 브레비스, 락토바실루스 미노르, 스트렙토마이세스 및 살모넬라 티피무륨(Salmonella typhimurium) 세포와 같은 박테리아 세포; 효모 세포[예컨대, 사카로마이세스 세레비지아 또는 피치아 파스토리스(Pichia pastoris)(ATCC 등록 번호 201178)]와 같은 진균 세포; 드로소필라(Drosophila) S2 및 스포도프테라(Spodoptera) Sf9 세포와 같은 곤충 세포; CHO, COS, BHK, 293 및 보웨스(Bowes) 흑색종 세포와 같은 동물 세포; 및 식물 세포를 들 수 있으나, 이들로 제한되지는 않는다. 상기 기재한 숙주 세포에 적절한 배양 배지 및 성장 조건은 당업계에 공지되어 있다.
케토리덕타제의 발현을 위한 폴리뉴클레오티드는 당업계에 공지된 각종 방법에 의해 세포로 도입될 수 있다. 상기 기술로는 무엇보다도 전기 천공, 바이오리스틱 입자 충격(biolistic particle bombardment), 리포솜 매개 형질감염, 염화칼슘 형질감염 및 원형질체 융합을 들 수 있다. 당업자라면 폴리뉴클레오티드를 세포에 도입하기 위한 각종 방법을 명확히 알 것이다.
숙주 세포의 예로 에쉐리키아 콜라이(Escherichia coli) W3110이 있다. 발현 벡터는 lacI 억제자(repressor)의 제어하에 향상된 케토리덕타제를 코딩하는 폴리뉴클레오티드를 lac 프로모터에 작동가능하게 연결된 플라스미드 pCK110900에 작동가능하게 연결시켜 생성시킨다. 또한, 발현 벡터는 P15a의 복제 기점 및 클로람페니콜 내성 유전자를 포함한다. 에쉐리키아 콜라이 W3110 내에 대상 폴리뉴클레오티드를 포함하는 세포는 그 세포를 클로람페니콜 선별 처리하여 단리시킬 수 있다.
6.5 조작된 케토리덕타제 폴리펩티드의 생성 방법
몇몇 실시양태에서, 본 개시내용의 향상된 KRED 폴리뉴클레오티드 및 폴리펩티드를 제조하기 위해, 환원 반응을 촉매하는 천연 케토리덕타제 효소를 락토바실러스 케피르 또는 락토바실러스 브레비스 또는 락토바실러스 미노르로부터 얻는다(또는 유래한다). 몇몇 실시양태에서, 모 폴리뉴클레오티드 서열은 특정 숙주 세포에서 케토리덕타제의 발현을 향상시키기 위해 코돈 최적화된다. 예시로서, 락토바실러스 케피르의 야생형 KRED 폴리펩티드를 코딩하는 모 폴리뉴클레오티드 서열은 유전자은행 데이타베이스(유전자은행 등록 번호 AAP94029 GI:33112056)에서 입수가능한 락토바실러스 케피르 KRED 서열의 공지된 폴리펩티드 서열에 기초하여 제조된 올리고뉴클레오티드로부터 구성한다. 서열 번호 1로 표시되는 모 폴리뉴클레오티드 서열은 이. 콜라이에서의 발현을 위해 코돈 최적화되고 그 코돈 최적화된 폴리뉴클레오티드를 발현 벡터로 클로닝하여 lac 프로모터 및 lacI 억제자 유전자의 제어하에 케토리덕타제 유전자를 발현시킨다. 이. 콜라이 내에서 활성 케토리덕타제를 발현하는 클론을 동정하고, 유전자를 서열분석하여 이의 동일성을 확인한다. 지정된 서열(서열 번호 1)은 락토바실러스 케피르 케토리덕타제로부터 유래한 진화된 케토리덕타제의 대부분의 실험 및 라이브러리 구성을 위한 출발점으로서 사용되는 모 서열이다.
상기 조작된 케토리덕타제는 천연 케토리덕타제를 코딩하는 폴리뉴클레오티드를 상기 기재된 바와 같이 돌연변이 유발 및/또는 방향성 진화 방법으로 처리하여 얻을 수 있다. 방향성 진화 기술의 예로는 문헌[Stemmer, 1994, Proc Natl Acad Sci USA 91:10747-10751]; WO 제95/22625호; WO 제97/0078호; WO 제97/35966호; WO 제98/27230호; WO 제00/42651호; WO 제01/75767호 및 미국 특허 제6,537,746호에 기재된 바와 같은 돌연변이 유발 및/또는 DNA 셔플링(shuffling)이다. 이용할 수 있는 다른 방향성 진화 절차는 무엇보다도 StEP(staggered extension process), 시험관내 재조합(문헌[Zhao et al., 1998, Nat. Biotechnol. 16:258-261]), 돌연변이 유발 PCR(문헌[Caldwell et al., 1994, PCR Methods Appl. 3:S136-S140]) 및 카세트 돌연변이 유발(문헌[Black et al., 1996, Proc Natl Acad Sci USA 93:3525-3529])을 들 수 있다. 본원의 목적에 유용한 추가의 돌연변이 유발 및 방향성 진화 기술은 하기 참조문헌에서 확인할 수 있다: 문헌[Ling, et al., 1997, "Approaches 내지 DNA mutagenesis: an overview," Anal. Biochem. 254(2):157-78]; 문헌[Dale et al., 1996, "Oligonucleotide-directed random mutagenesis using phosphorothioate method," Methods Mol. Biol. 57:369-74]; 문헌[Smith, 1985, "In vitro mutagenesis," Ann. Rev. Genet. 19:423-462]; 문헌[Botstein et al., 1985, "Strategies and applications of in vitro mutagenesis," Science 229:1193-1201]; 문헌[Carter, 1986, "Site-directed mutagenesis," Biochem. J. 237:1-7]; 문헌[Kramer et al., 1984, "Point Mismatch Repair," Cell, 38:879-887]; 문헌[Wells et al., 1985, "Cassette mutagenesis: an efficient method for generation of multiple mutations at defined sites," Gene 34:315-323]; 문헌[Minshull et al., 1999, "Protein evolution by molecular breeding," Curr Opin Chem Biol 3:284-290]; 문헌[Christians et al., 1999, "Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shuffling," Nature Biotech 17:259-264]; 문헌[Crameri et al., 1998, "DNA shuffling of family of genes from diverse species accelerates directed evolution," Nature 391:288-291]; 문헌[Crameri et al., 1997, "Molecular evolution of arsenate detoxification pathway by DNA shuffling," Nature Biotech 15:436-438]; 문헌[Zhang et al., 1997, "Directed evolution of an effective fructosidase from a galactosidase by DNA shuffling and screening," Proc Natl Acad Sci USA 94:45-4-4509]; 문헌[Crameri et al., 1996, "Improved green fluorescent protein by molecular evolution using DNA shuffling", Nature Biotech 14:315-319]; 및 문헌[Stemmer, 1994, "Rapid evolution of protein in vitro by DNA shuffling," Nature 370:389-391]. 모든 간행물은 본원에 참조문헌으로 포함된다.
돌연변이 유발 처리 후 얻어진 클론을 원하는 향상된 효소 특성을 갖는 조작된 케토리덕타제에 대해 스크리닝한다. (흡광도 또는 형광성 감소를 통해) NADH 또는 NADPH가 NAD+ 또는 NADP+ 로 전환되면서 이의 농도가 감소하는 속도를 모니터링하는 표준 생화학 기술을 이용하여 발현 라이브러리로부터 효소 활성을 측정할 수 있다. 이 반응에서, 케토리덕타제가 케톤 기질을 상응하는 히드록실 기로 환원시키면서 NADH 또는 NADPH가 케토리덕타제에 의해 소모(산화)된다. 단위 시간당 흡광도 또는 형광성의 감소에 의해 측정되는 NADH 또는 NADPH 농도의 감소율은 고정량의 용해물(또는 이로부터 제조된 동결 건조 분말) 내 KRED 폴리펩티드의 상대(효소) 활성을 가리킨다. 원하는 향상된 효소 특성이 열 안정성인 경우, 효소 제제를 소정의 온도로 처리하고 열 처리 후 남은 효소 활성의 양을 측정한 후 효소 활성을 측정할 수 있다. 이후, 케토리덕타제를 코딩하는 폴리뉴클레오티드를 포함하는 클론을 단리하고 (존재하는 경우) 뉴클레오티드 서열 변화를 확인하기 위해 서열분석하여 숙주 세포 내 효소를 발현시키는 데 사용한다.
상기 조작된 폴리펩티드의 서열이 공지되어 있는 경우, 효소를 코딩하는 폴리뉴클레오티드는 공지된 합성 방법에 따라 표준 고상법에 의해 제조할 수 있다. 몇몇 실시양태에서, 약 100개 이하의 염기의 단편을 개별적으로 합성한 후, (예를 들면, 효소 또는 화학 결찰 방법 또는 중합효소 매개법에 의해) 결합시켜 임의의 원하는 연속 서열을 형성할 수 있다. 예를 들면, 본 발명의 폴리뉴클레오티드 및 올리고뉴클레오티드는 예컨대 문헌[Beaucage et al., 1981, Tet Lett 22:1859-69]에 기재된 종래의 포스포르아미다이트(phosphoramidite) 방법 또는 예컨대 통상적으로 자가 합성 방법으로 실시되는 문헌[Matthes et al., 1984, EMBO J. 3:801-05]에 기재된 방법을 이용하여 화학 합성에 의해 제조할 수 있다. 포스포르아미다이트 방법에 따르면, 올리고뉴클레오티드를 예컨대 자가 DNA 합성기에서 합성하고 정제하고 어닐링하고 결찰하고 적절한 벡터에서 클로닝한다. 또한, 실질적으로 임의의 핵산은 더 미들랜드 서티파이드 리에이전트 컴퍼니(The Midland Certified Reagent Company; 미국 텍사스주 미들랜드 소재), 익스프레스진 인코오포레이티드(The Great American Gene Company; 미국 일리노이스주 시카고 소재), 오페론 테크놀로지즈 인코오포레이티드(Operon Technologies Inc.; 미국 캘리포니아주 알라메다 소재) 및 다수의 다른 구입처와 같은 각종 상업적 구입처 중 임의의 구입처로부터 입수할 수 있다.
숙주 세포에서 발현되는 조작된 케토리덕타제 효소는 무엇보다도 리소자임 처리, 초음파 처리, 여과, 염석, 초원심분리 및 크로마토그래피를 비롯하여 단백질 정제에 대해 널리 공지된 기술 중 임의의 하나 이상을 이용하여 세포 및/또는 배양 배지로부터 회수할 수 있다. 이. 콜라이와 같은 박테리아로부터 단백질을 용해시키고 고효율로 추출하기에 적절한 용액은 시그마-알드리히(미국 미저리주 세인트 루이스 소재)로부터 셀라이틱 B(CelLytic B)™이라는 상표명으로 상업적으로 입수가능하다.
상기 케토리덕타제 폴리펩티드를 단리하기 위한 크로마토그래피 기술로는 무엇보다도 역상 크로마토그래피, 고성능 액상 크로마토그래피, 이온 교환 크로마토그래피, 겔 전기 영동 및 친화성 크로마토그래피를 들 수 있다. 특정 효소를 정제하기 위한 조건은 부분적으로 총 전하, 소수성, 친수성, 분자량, 분자 형상 등과 같은 인자들에 따라 달라질 수 있으며, 당업자라면 이를 명확히 알 것이다.
몇몇 실시양태에서, 친화 기술을 이용하여 향상된 케토리덕타제 효소를 단리시킬 수 있다. 친화성 크로마토그래피 정제를 위해, 케토리덕타제 폴리펩티드에 특이적으로 결합하는 임의의 항체를 사용할 수 있다. 항체의 제조를 위해, 래빗, 마우스, 래트 등을 포함하나 이들로 제한되지 않는 각종 숙주 동물을 케토리덕타제 폴리펩티드와 함께 주입하여 면역화할 수 있다. 상기 폴리펩티드는 측쇄 작용기 또는 측쇄 작용기에 부착된 링커를 이용하여 BSA와 같은 적합한 담체에 부착시킬 수 있다. (완전 및 불완전) 프로인트, 미네랄 겔(mineral gel), 예컨대 수산화알루미눔, 계면 활성 물질, 예컨대 리소레시틴, 플루론계 폴리올(pluronic polyol), 다중 음이온, 펩티드, 유성 에멀션, 키홀 림펫 헤모시아닌(keyhole limpet hemocyanin), 디니트로페놀 및 BCG(바실러스 칼멧 게랑(bacilli Calmette Guerin)) 및 코린박테리움 파르붐(Corynebacterium parvum)과 같은 잠재적으로 유용한 인간 아쥬반트를 포함하나 이들로 제한되지 않는 각종 아쥬반트를 사용하여 숙주 종에 따라 면역 반응을 증가시킬 수 있다.
몇몇 실시양태에서, 상기 케토리덕타제는 효소 발현 세포의 형태로, 미정제 추출물로서 또는 단리되거나 정제된 제제로서 제조되어 사용될 수 있다. 상기 케토리덕타제는 동결 건조물로서, 분말 형태(예를 들면, 아세톤 분말)로 제조될 수 있거나 효소 용액으로 제조될 수 있다. 몇몇 실시양태에서, 상기 케토리덕타제는 실질적으로 순수한 제제의 형태일 수 있다.
몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는 고상 기질에 부착될 수 있다. 상기 기질은 고상, 표면 및/또는 막일 수 있다. 고상 지지체는 유기 중합체, 예컨대 폴리스티렌, 폴리에틸렌, 폴리프로필렌, 폴리플루오로에틸렌, 폴리에틸렌옥시 및 폴리아크릴아미드 및 이들의 공중합체 및 그라프트로 이루어질 수 있다. 또한, 고상 지지체는 무기, 예컨대 유리, 실리카, 조절 다공성 유리(CPG), 역상 실리카 또는 금속, 예컨대 금 또는 백금일 수 있다. 기질의 구성은 비드, 구, 입자, 과립, 겔, 막 또는 표면의 형태일 수 있다. 표면은 평면, 실질적으로 평면 또는 비평면일 수 있다. 고상 지지체는 다공성 또는 비다공성일 수 있고, 팽윤 특성 또는 비팽윤 특성을 가질 수 있다. 고상 지지체는 웰, 오목부(depression) 또는 기타 용기, 그릇, 피처 또는 위치의 형태로 구성될 수 있다. 복수의 지지체가 각종 위치에서 어레이에 구성될 수 있는데, 이는 시약의 로봇식 전달을 위해 또는 검출 방법 및/또는 기기에 의해 해결가능하다.
6.6 조작된 케토리덕타제 효소 및 이를 사용하여 제조된 화합물의 사용 방법
본원에 기재된 케토리덕타제 효소는 하기 구조식 I의 기질, 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]벤조산 메틸 에스테르를 상응하는 하기 구조식 II의 입체이성체 생성물, (S,E)-메틸 2-(3-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-하이드록시프로필)벤조에이트("생성물")로의 환원을 촉매할 수 있다:
구조식 I
Figure pct00010
구조식 II
Figure pct00011
다른 실시양태에서, 본원에 기재된 케토리덕타제 효소는 하기 구조식 III의 화합물, 2-[2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]페닐]-2-프로판올(또한 "기질")을 상응하는 하기 구조식 IV의 입체이성체 생성물, (S,E)-1-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-(2-(2-하이드록시프로판-2-일)페닐)프로판-1-올(구조식 III의 기질과 관련하여 "생성물"이라고도 칭함)로의 환원 반응을 촉매할 수 있다:
구조식 III
Figure pct00012
구조식 IV
Figure pct00013
몇몇 실시양태에서, 본 개시내용의 케토리덕타제를 구조식 I 또는 구조식 III을 갖는 기질을 상응하는 생성물로 환원시키는 방법에서 사용할 수 있고, 이 방법은 상기 기질을 구조식 II 또는 구조식 IV의 생성물로 각각 환원 또는 전환시키기에 적합한 환원 조건하에 상기 기질을 본원에 기재된 케토리덕타제 폴리펩티드 중 임의의 하나(또는 그 이상)와 접촉 또는 항온처리하는 단계를 포함한다.
상기 기질을 상기 생성물로 환원시키는 방법의 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는, 서열 번호 4, 2 및 114의 야생형 엘. 케피르 또는 엘. 브레비스 또는 엘. 미노르 KRED 서열과 비교하여, 적어도 (1) X190에 해당하는 잔기가 구속성 잔기인 특징 및 (2) X202에 해당하는 잔기가 방향족 잔기인 특징을 갖는다. 몇몇 실시양태에서, 상기 케토리덕타제 폴리펩티드는, 서열 번호 4, 2 및 114의 야생형 엘. 케피르 또는 엘. 브레비스 또는 엘. 미노르 KRED 서열과 비교하여, 적어도 (1) X190에 해당하는 잔기가 구속성 잔기인 특징, (2) 195에 해당하는 잔기가 염기성, 산성 또는 극성 잔기인 특징 및 (3) X202에 해당하는 잔기가 방향족 잔기인 특징을 갖는다.
상기 기질을 상기 생성물로 환원시키는 방법의 몇몇 실시양태에서, 상기 기질은 약 99% 초과의 입체이성체 잉여율로 상기 생성물로 환원되고, 여기서 상기 케토리덕타제 폴리펩티드는 서열 번호 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 111 또는 112에 해당하는 서열을 포함한다.
상기 기질을 상기 생성물로 환원시키는 방법의 몇몇 실시양태에서, 약 100 g/L 초과의 기질 및 약 5 g/L 미만의 폴리펩티드를 사용하여 수행할 때, 약 24시간 미만 내에 상기 기질의 적어도 약 95%가 상기 생성물로 전환될 수 있고, 여기서 상기 폴리펩티드는 서열 번호 6, 8, 14, 16 및 20에 해당하는 아미노산 서열을 포함한다.
상기 기질을 상기 생성물로 환원시키는 방법의 몇몇 실시양태에서, 약 24시간 미만 내에 1 g/L 기질의 적어도 약 10∼20%가 약 10 g/L의 폴리펩티드에 의해 상기 생성물로 전환될 수 있고, 여기서 상기 폴리펩티드는 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 111 또는 112에 해당하는 아미노산 서열을 포함한다.
몇몇 실시양태에서, 본원에서 제공되는 상기 케토리덕타제 폴리펩티드는 하기 구조식 V의 화합물(이의 용매화물, 수화물 및 약학적으로 허용되는 염 포함)의 합성을 위한 중간체의 제조에 사용될 수 있다:
구조식 V
Figure pct00014
구조식 V의 화합물, 2-[1-[[(1R)-1-[3-[(E)-2-(7-클로로퀴놀린-2-일)에테닐]페닐]-3-[2-(2-하이드록시프로판-2-일)페닐]프로필]설파닐메틸]사이클로프로필]아세트산(몬테루카스트라고도 알려짐)은 하기 구조식 Va에 도시된 나트륨염 형태(즉, 나트륨 (R,E)-2-(1-((1-(3-(2(7-클로로퀴놀린-2-일)비닐)페닐)-3-(2-(2-하이드록시프로판-2-일)페닐)프로필티오)메틸)사이클로프로필)아세테이트)로 상업적으로 입수가능하다:
구조식 Va
Figure pct00015
상기 기재된 바대로, 이론에 구속됨이 없이, 몬테루카스트는 류코트리엔 수용체 길항제(LTRA)이고 시스테이닐 류코트리엔 수용체 CysLT1에서 류코트리엔 D4의 작용을 차단하는 것으로 보인다. 이는 알레르기의 치료 및 천식의 유지 치료에 처방되고 있다(예를 들면, 미국 특허 제5,565,473호 참조). 몬테루카스트 합성의 몇몇 실시양태에서, 중요한 중간체는 구조식 II의 화합물이다. 따라서, 구조식 V의 화합물의 합성을 위한 방법에서, 이 방법에서의 단계는 구조식 I의 기질을 구조식 II의 생성물로 환원 또는 전환시키기에 적합한 조건하에 상기 기질을 본 개시내용의 케토리덕타제 폴리펩티드와 반응 또는 접촉시키는 것을 포함한다.
몇몇 실시양태에서, 구조식 V의 화합물은 하기 반응식 I에 도시된 바대로 및 US 출원 공보 제20070135480호 및 제20050245568호에 기재된 바대로 구조식 II의 화합물로부터 합성할 수 있다.
[반응식 I]
Figure pct00016
따라서, 몇몇 실시양태에서, 구조식 V의 화합물의 합성 방법은 (a) 구조식 I의 화합물을 본 개시내용의 케토리덕타제에 의해 구조식 II의 화합물로 환원 또는 전환시키는 단계, (b) 구조식 II의 화합물을 메틸설포닐 클로라이드와 반응시켜 구조식 VI의 화합물을 형성하는 단계, (c) 구조식 VI의 화합물을 구조식 VII의 티오 화합물로 전환시킨 후, 구조식 VIIa의 화합물로 전환시키는 단계, (d) 구조식 VIIa의 티오 화합물을 구조식 X의 화합물과 반응시켜 구조식 IX의 화합물(여기서, R'는 이탈 기이고, R은 H 또는 C1-C4 알킬이다)을 형성하는 단계, 및 (e) 구조식 IX의 화합물을 구조식 Vb의 화합물 또는 이의 염, 예를 들면 구조식 Va의 화합물로 전환시키는 단계를 포함할 수 있다. 몇몇 실시양태에서, 메틸설포닐 클로라이드 대신에 다른 알킬설포닐 할라이드 또는 아릴설포닐 할라이드를 사용할 수 있다. 구조식 IX의 화합물을 구조식 Vb의 화합물로 전환시키는 데 CH3Li를 사용할 수 있지만, 이 단계는 또한 그리나드(Grignard) 시약, 예를 들면 메틸마그네슘 할라이드(US 출원 공보 제20070135480호 참조)를 사용하여 수행할 수 있다. 몇몇 실시양태에서, 상기 단계(c) 이후에 대안적인 방법은 (d) 구조식 VII의 화합물을 구조식 VIII의 화합물로 전환시킨 후, 구조식 VIIb의 화합물로 전환시키는 단계, 및 (e) 구조식 X의 티오 화합물을 구조식 VIIb의 화합물과 반응시켜 구조식 Vb의 화합물 또는 이의 염을 형성하는 단계를 포함할 수 있다. 각각의 단계에 대한 상세한 사항 및 조건은 US 출원 공보 제070135480호 및 제20050245568호에 기재되어 있다.
몇몇 실시양태에서, 몬테루카스트의 합성은 구조식 IV의 중간체를 사용할 수 있다. 따라서, 몇몇 실시양태에서, 구조식 V의 화합물을 합성하는 방법에서, 이 방법에서의 단계는 구조식 III의 기질을 구조식 VI의 생성물로 환원 또는 전환시키기에 적합한 반응 조건하에 상기 기질을 본원에 개시된 케토리덕타제와 접촉시켜 상기 기질을 구조식 IV의 생성물로 환원 또는 전환시키는 것을 포함할 수 있다.
몇몇 실시양태에서, 몬테루카스트 화합물은 하기 반응식 II에 도시된 바대로 및 US 출원 공보 제05/0234241호 및 미국 특허 제7,189,853호에 기재된 바대로 구조식 IV의 생성물로부터 합성할 수 있다:
[반응식 II]
Figure pct00017
따라서, 몇몇 실시양태에서, 구조식 V의 화합물의 합성 방법은 (a) 구조식 I의 화합물을 본 개시내용의 케토리덕타제에 의해 구조식 II의 화합물로 환원 또는 전환시키는 단계, (b) 구조식 IV의 화합물을 메틸설포닐클로라이드와 반응시켜 구조식 VI의 화합물을 형성하는 단계, (c) 구조식 XIII의 티올 화합물을 구조식 IV의 화합물과 커플링시켜 구조식 VII의 화합물(여기서, X는 -CN 또는 CONH2 이다)을 형성하는 단계, 및 (d) 구조식 VII의 화합물을 구조식 V의 화합물 또는 이의 염으로 전환시키는 단계를 포함할 수 있다.
몇몇 실시양태에서, 몬테루카스트 화합물은 또한 하기 반응식 III에 도시된 바대로 및 미국 특허 제5,614632호(이의 개시내용은 본원에 참조문헌으로 포함됨)에 기재된 바대로 구조식 II의 생성물로부터 합성할 수 있다(US 제5,614,632호의 실시예 5∼8 참조). 반응식 III에서, 구조식 I의 기질을 본 개시내용의 케토리덕타제를 사용하여 구조식 II의 생성물로 환원시킨 후, 예를 들면 그리나드 시약(메틸 마그네슘 클로라이드)을 사용하여 구조식 IV의 화합물로 전환시킨다. 구조식 IV의 화합물을 메틸설포닐클로라이드와 반응시켜 구조식 XIII의 메실레이트 화합물을 형성할 수 있지만, 다른 알킬설포닐 할라이드 또는 아릴설포닐 할라이드를 사용할 수 있다. 구조식 XIII의 화합물과 구조식 XIII의 티올 화합물과의 반응에 의해 구조식 V의 화합물이 생성되고, 이는 나트륨염 염으로 전환될 수 있다.
[반응식 III]
Figure pct00018
구조식 XIII의 티올 화합물은 하기 반응식 4에 따라 합성될 수 있다(예를 들면 미국 특허 제5,614,632호 참조):
[반응식 4]
Figure pct00019
반응식 4 내 R 기는 저급 알킬, 바람직하게는 C1-C4 알킬일 수 있다. 구조식 II 또는 구조식 IV의 화합물로부터 몬테루카스트의 합성 방법의 변형은 또한 미국 특허 제5,565,473호; US 공보 제20050107612호; US 공보 제20050245569호; US 공보 제20060004204호; 및 US 공보 제20060194839호에 기재되어 있고, 참조문헌 모두 본원에 참조문헌으로 포함된다.
구조식 VI 및 구조식 XII의 메실레이트 화합물의 중요성의 견지에서, 본 개시내용의 케토리덕타제는 하기 구조식 XX의 화합물 또는 구조식 XXI의 화합물의 합성에 사용될 수 있다:
구조식 XX
Figure pct00020
구조식 XXI
Figure pct00021
[상기 식 중, R1은 알킬설포닐, (퍼)플루오로알킬설포닐 또는 아릴설포닐이다].
몇몇 실시양태에서, 알킬은 저급 알킬, 예를 들면 C1-C4 알킬이고, 아릴은 벤질이다. 몇몇 실시양태에서, R1은 톨루엔설포닐 또는 메틸설포닐이다.
몇몇 실시양태에서, 구조식 XX의 화합물의 합성 방법은 (a) 구조식 I의 화합물을 구조식 II의 화합물로 환원시키기에 적합한 반응 조건하에 구조식 I의 화합물을 본원에 기재된 케토리덕타제와 접촉시키는 단계, 및 (b) 구조식 II의 화합물을 알킬설포닐, (퍼)플루오로알킬설포닐, 아릴설포닐 할라이드 또는 무수물과 반응시켜 구조식 XX의 화합물을 형성하는 단계를 포함할 수 있다. 몇몇 실시양태에서, 화합물 XX 내 R1이 메틸설포닐이어서 단계(b)에서 사용된 알킬설포닐 할라이드는 메틸설포닐 클로라이드이다.
몇몇 실시양태에서, 구조식 XXI의 화합물의 합성 방법은 (a) 구조식 III의 화합물을 구조식 IV의 화합물로 환원시키기에 적합한 반응 조건하에 구조식 III의 화합물을 본원에 기재된 케토리덕타제와 접촉시키는 단계, 및 (b) 구조식 VI의 화합물을 알킬설포닐 또는 아릴설포닐 할라이드 또는 무수물과 반응시켜 구조식 XXI의 화합물을 형성하는 단계를 포함할 수 있다. 몇몇 실시양태에서, 화합물 XXI 내 R1이 메틸설포닐이어서 단계(b)에서 사용된 알킬설포닐 할라이드는 메틸설포닐 클로라이드이다.
대안적으로, 몇몇 실시양태에서, 구조식 XXI의 화합물의 합성 방법은 반응식 3에 도시된 공정을 사용할 수 있고, 이 방법은 (a) 구조식 I의 화합물을 구조식 II의 화합물로 환원시키기에 적합한 반응 조건하에 구조식 I의 화합물을 본원에 기재된 케토리덕타제와 접촉시키는 단계, (b) 구조식 II의 화합물을 구조식 IV의 화합물로 전환시키는 단계, 및 (c) 구조식 IV의 화합물을 알킬설포닐, (퍼)플루오로알킬설포닐, 아릴설포닐 할라이드와 반응시켜 XXI의 화합물을 형성하는 단계를 포함한다. 상기 기재된 바대로, 단계(b)에서 구조식 II의 화합물의 구조식 IV의 화합물로의 전환은 그리나드 시약 또는 CH3Li를 사용한다.
몇몇 실시양태에서, 본 개시내용의 케토리덕타제는 상기 케토리덕타제에 의해 작용하는 기질에 의해 및/또는 상기 케토리덕타제 반응에 의해 생성된 생성물에 의해 조성물, 예를 들면 반응 조성물로서 존재할 수 있다. 따라서, 몇몇 실시양태에서, 조성물은 본 개시내용의 케토리덕타제 및 구조식 I의 기질 또는 구조식 III의 기질을 포함할 수 있다. 몇몇 실시양태에서, 조성물은 본 개시내용의 케토리덕타제 및 구조식 II의 생성물 또는 구조식 IV의 생성물을 포함할 수 있다. 몇몇 실시양태에서, 상기 조성물은 본 개시내용의 케토리덕타제, 구조식 I의 기질 및 구조식 II의 생성물을 포함할 수 있다. 몇몇 실시양태에서, 상기 조성물은 본 개시내용의 케토리덕타제, 구조식 III의 기질 및 구조식 IV의 생성물을 포함할 수 있다.
상기 케토리덕타제 반응은 보조인자(NADH 또는 NADPH) 재생 시스템의 존재하에 수행될 수 있으므로, 상기 반응 조건은 보조인자 재생 시스템의 요소를 더 포함할 수 있고, 이는 하기 더 자세히 기재되어 있다. 따라서, 몇몇 실시양태에서, 상술한 케토리덕타제 조성물은 글루코스 탈수소효소 및 글루코스; 포르메이트 탈수소효소 및 포르메이트; 또는 이소프로판올 및 2차 알콜 탈수소효소를 포함하는 보조인자 재생 시스템을 더 포함할 수 있다. 몇몇 실시양태에서, 2차 알콜 탈수소효소는 조작된 케토리덕타제이다. 당업자라면 보조인자 재생에 사용될 수 있는 다른 효소 및 기질을 잘 알고 있을 것이다.
당업자에게 공지된 바와 같이, 케토리덕타제 촉매 환원 반응은 통상적으로 보조인자를 필요로 한다. 또한, 본원에 기재된 조작된 케토리덕타제 효소에 의해 촉매되는 환원 반응은 통상적으로 보조인자를 필요로 하지만, 상기 조작된 케토리덕타제의 다수의 실시양태는 야생형 케토리덕타제 효소로 촉매된 반응보다 보조인자를 훨씬 적게 필요로 한다. 본원에 사용되는 용어 "보조인자"는 케토리덕타제 효소와 조합되어 작용하는 비단백질 화합물을 의미한다. 본원에 기재된 조작된 케토리덕타제 효소와 함께 사용하기에 적합한 보조인자로는 NADP+(니코틴아미드 아데닌 디뉴클레오티드 포스페이트), NADPH(NADP+의 환원 형태), NAD+(니코틴아미드 아데닌 디뉴클레오티드) 및 NADH(NAD+의 환원 형태)를 들 수 있으나, 이들로 제한되지 않는다. 일반적으로, 보조인자의 환원 형태를 반응 혼합물에 첨가한다. 환원된 NAD(P)H 형태는 보조인자 재생 시스템을 사용하여 산화된 NAD(P)+ 형태로부터 임의로 재생할 수 있다.
용어 "보조인자 재생 시스템"은 보조인자의 산화 형태를 환원시키는 반응(예를 들면, NADP+에서 NADPH로의 반응)에 참여하는 반응물의 집합을 의미한다. 케토 기질의 케토리덕타제 촉매 환원에 의해 산화되는 보조인자는 보조인자 재생 시스템에 의해 환원 형태로 재생된다. 보조인자 재생 시스템은 수소 등가물을 환원시키는 공급원이며 보조인자의 산화 형태를 환원시킬 수 있는 화학량론적 환원제를 포함한다. 보조인자 재생 시스템은 환원제에 의해 보조인자의 산화 형태의 환원을 촉매하는 촉매, 예컨대 효소 촉매를 더 포함할 수 있다. NAD+ 또는 NADP+로부터 NADH 또는 NADPH를 각각 재생하기 위한 보조인자 재생 시스템은 당업계에 공지되어 있고, 본원에 기재된 방법에서 사용될 수 있다.
사용될 수 있는 적합한 보조인자 재생 시스템의 예로는 글루코스 및 글루코스 탈수소효소, 포르메이트 및 포르메이트 탈수소효소, 글루코스-6-포스페이트 및 글루코스-6-포스페이트 탈수소효소, 2차 알콜(예를 들면, 이소프로판올) 및 2차 알콜 탈수소효소, 포스파이트 및 포스파이트 탈수소효소, 분자 수소 및 하이드로게나제 등을 들 수 있으나, 이들로 제한되지 않는다. 이러한 시스템은 보조인자로서 NADP+/NADPH 또는 NAD+/NADH와 조합하여 사용될 수 있다. 또한, 하이드로게나제를 사용한 전기화학적 재생도 보조인자 재생 시스템으로 사용할 수 있다. 예를 들면, 미국 특허 제5,538,867호 및 제6,495,023호(이들 둘 다 본원에 참조문헌으로 포함됨)를 참조한다. 또한, 금속 촉매 및 환원제(예를 들면, 분자 수소 또는 포르메이트)를 포함하는 화학적 보조인자 재생 시스템도 적절하다. 예를 들면, PCT 공개 WO 제2000/053731호(본원에 참조문헌으로 포함됨)를 참조한다.
용어 "글루코스 탈수소효소" 및 "GDH"는 D-글루코스 및 NAD+ 또는 NADP+가 글루콘산 및 NADH 또는 NADPH으로 전환되는 것을 각각 촉매하는 NAD+ 또는 NADP+ 의존성 효소를 의미하기 위해 본원에 상호혼용된다. 하기 식 1은 글루코스에 의한 NAD+ 또는 NADP+의 글루코스 탈수소효소 촉매 환원을 설명한다.
(1)
Figure pct00022
본원에 기재된 방법의 실시에 사용하기에 적합한 글루코스 탈수소효소는 천연 글루코스 탈수소효소 및 비천연 글루코스 탈수소효소 둘 다를 포함한다. 천연 글루코스 탈수소효소 코딩 유전자는 문헌에 보고되어 있다. 예를 들면, 바실러스 섭틸리스 61297 GDH 유전자는 이. 콜라이에서 발현되며, 본연의 숙주에서 생성되는 효소와 동일한 물리화학적 특성을 나타내는 것으로 보고되어 있다(문헌[Vasantha et al., 1983, Proc. Natl. Acad. Sci. USA 80:785]). 유전자은행 등록 번호 M12276에 해당하는 바실러스 섭틸리스 GDH 유전자의 유전자 서열이 문헌[Lampel et al., 1986, J. Bacteriol. 166:238-243]에 의해 보고되어 있으며, 문헌[Yamane et al., 1996, Microbiology 142:3047-3056]에 의해 수정된 형태가 유전자은행 등록 번호 D50453으로서 보고되어 있다. 또한, 천연 GDH 유전자는 바실러스 세레우스(B. cereus) ATCC 14579(문헌[Nature, 2003, 423:87-91; 유전자은행 등록 번호 AE017013]) 및 바실러스 메가테리움(B. megaterium)(문헌[Eur. J. Biochem., 1988, 174:485-490], 유전자은행 등록 번호 X12370; 문헌[J. Ferment. Bioeng., 1990, 70:363-369], 유전자은행 등록 번호 GI216270)으로부터 GDH를 코딩하는 것을 포함한다. 바실러스 종(Bacillus sp .)으로부터 얻은 글루코스 탈수소효소는 PCT 공개 WO 제2005/018579호(개시내용이 본원에 참조문헌으로 포함됨)에 서열 번호 10 및 12(PCT 공개의 서열 번호 9 및 11에 각각 폴리뉴클레오티드 서열에 의해 코딩됨)로 기재되어 있다.
비천연 글루코스 탈수소효소는 예를 들면 돌연변이 유발, 방향성 진화 등과 같은 공지된 방법을 이용하여 생성할 수 있다. 천연 또는 비천연인가와 무관하게, 적합한 활성을 갖는 GDH 효소는 PCT 공개 WO 제2005/018579호(개시내용이 본원에 참조문헌으로 포함됨)의 실시예 4에 기재된 분석을 이용하여 용이하게 동정할 수 있다. 비천연 글루코스 탈수소효소의 예로는 PCT 공개 WO 제2005/018579호에서 서열 번호 62, 64, 66, 68, 122, 124 및 126으로 기재되어 있다. 이들을 코딩하는 폴리뉴클레오티드 서열은 PCT 공개 WO 제2005/018579호에서 서열 번호 61, 63, 65, 67, 121, 123 및 125로 각각 기재되어 있다. 이들 서열 모두는 본원에 참조문헌으로 포함된다. 본원에 개시된 케토리덕타제 촉매 환원 반응에 사용하기에 적합한 추가의 비천연 글루코스 탈수소효소는 미국 출원 공개 제2005/0095619호 및 제2005/0153417호(개시내용이 본원에 참조문헌으로 포함됨)에 기재되어 있다.
본원에 기재된 케토리덕타제 촉매 환원 반응에 사용되는 글루코스 탈수소효소는 PCT 공개 WO 제2005/018579호의 실시예 4에 기재된 분석에서 적어도 약 10 μmol/분/mg, 종종 적어도 약 102 μmol/분/mg 또는 약 103 μmol/분/mg, 약 104 μmol/분/mg 이하 또는 그 이상의 활성을 나타낼 수 있다.
본원에 기재된 케토리덕타제 촉매 환원 반응은 일반적으로 용매 중에서 수행된다. 적합한 용매로는 물, 유기 용매(예를 들면, 에틸 아세테이트, 부틸 아세테이트, 1-옥탄올, 헵탄, 옥탄, 메틸 t-부틸 에테르(MTBE), 톨루엔 등), 이온성 액체(예를 들면, 1-에틸-4-메틸이미다졸륨 테트라플루오로보레이트, 1-부틸-3-메틸이미다졸륨 테트라플루오로보레이트, 1-부틸-3-메틸이미다졸륨 헥사플루오로포스페이트 등)을 들 수 있다. 몇몇 실시양태에서, 물 및 수성 공용매 시스템을 비롯한 수성 용매를 사용한다.
수성 공용매 시스템의 예로는 물 및 하나 이상의 유기 용매를 들 수 있다. 일반적으로, 수성 공용매 시스템의 유기 용매 성분은 이것이 케토리덕타제 효소를 완전히 불활성시키지 않도록 선택된다. 적절한 공용매 시스템은 본원에 기재된 것과 같은 효소 활성 분석을 이용하여 후보 용매 시스템에서 소정의 관심 있는 기질에 의해 특정의 조작된 케토리덕타제 효소의 효소 활성을 측정함으로써 용이하게 확인할 수 있다.
수성 공용매 시스템의 유기 용매 성분은 수성 성분과 혼화성이어서 단일 액상을 제공할 수 있거나, 수성 성분과 부분적으로 혼화성 또는 비혼화성이어서 2개의 액상을 제공할 수 있다. 일반적으로, 수성 공용매 시스템을 사용하는 경우, 물을 유기 용매에 분산시키거나 또는 그 반대로 하여 2개 상이 되도록 선택된다. 일반적으로, 수성 공용매 시스템을 사용하는 경우, 수상으로부터 용이하게 분리될 수 있는 유기 용매를 선택하는 것이 바람직하다. 일반적으로, 공용매 시스템 중 물 대 유기 용매의 비는 통상적으로 약 90:10 내지 10:90(v/v)의 유기 용매 대 물 및 80:20 내지 20:80(v/v)의 유기 용매 대 물의 범위이다. 상기 공용매 시스템은 반응 혼합물에 첨가하기 전에 미리 형성할 수 있거나, 반응 용기 내에서 동일계에서 형성할 수 있다.
수성 용매(물 또는 수성 공용매 시스템)는 pH 완충되거나 비완충될 수 있다. 일반적으로, 환원은 pH 약 10 이하, 보통 약 5 내지 약 10의 범위에서 수행할 수 있다. 몇몇 실시양태에서, 환원은 pH 약 9 이하, 보통 약 5 내지 약 9의 범위에서 수행한다. 몇몇 실시양태에서, 환원은 pH 약 8 이하, 종종 약 5 내지 약 8의 범위, 보통 약 6 내지 약 8의 범위에서 수행한다. 또한, 환원은 pH 약 7.8 이하 또는 7.5 이하에서 수행할 수 있다. 대안적으로, 환원은 중성 pH, 즉 약 7에서 수행할 수 있다.
환원 반응 과정 동안, 반응 혼합물의 pH는 변할 수 있다. 반응 혼합물의 pH는 반응 과정 동안 산 또는 염기를 첨가하여 원하는 pH로 또는 원하는 pH 범위 내로 유지할 수 있다. 대안적으로, pH는 완충액을 포함하는 수성 용매를 사용하여 조정할 수 있다. 원하는 pH 범위를 유지하기 위한 적합한 완충액은 당업계에 공지되어 있고, 예를 들면 인산염 완충액, 트리에탄올아민 완충액 등을 들 수 있다. 완충과 산 또는 염기 첨가의 조합도 이용할 수 있다.
글루코스/글루코스 탈수소효소 보조인자 재생 시스템을 사용할 경우, 생성된 수성 글루콘산이 달리 중화되지 않으면, 식 1로 표시되는 바대로 글루콘산의 공동 생성(pKa=3.6)에 의해 반응 혼합물의 pH가 하강한다. 반응 혼합물의 pH는 표준 완충 기술에 의해(여기서, 완충액은 제공된 완충능 이하로 글루콘산을 중화시킴) 또는 전환 과정과 동시에 염기를 첨가함으로써 소정의 수준에서 유지할 수 있다. 또한, 완충 및 염기 첨가의 조합도 이용될 수 있다. 원하는 pH 범위를 유지하기에 적합한 완충액은 상기 기재되어 있다. 글루콘산의 중화에 적합한 염기는 유기 염기, 예를 들면 아민, 알콕시드 등 및 무기 염기, 예를 들면 수산염(예를 들면, NaOH), 탄산염(예를 들면, NaHCO3), 중탄산염(예를 들면, K2CO3), 염기성 인산염(예를 들면, K2HPO4, Na3PO4) 등이다. 반응 혼합물의 pH를 모니터링하면서 또는 더 편리하게는 pH 측정기로서 자가 적정기를 이용함으로써 전환 과정과 동시에 염기를 수동으로 첨가할 수 있다. 또한, 부분 완충능 및 염기 첨가의 조합을 공정 제어에 이용할 수 있다.
케토리덕타제 촉매 환원 반응 동안 염기 첨가를 이용하여 방출되는 글루콘산을 중화시킬 때, pH를 유지하기 위해 첨가되는 염기의 양에 의해 전환의 진행을 모니터링할 수 있다. 통상적으로, 환원 과정에 걸쳐 비완충 또는 부분 완충 반응 혼합물에 첨가되는 염기를 수용액으로 첨가한다.
몇몇 실시양태에서, 보조인자 재생 시스템은 포르메이트 탈수소효소를 포함할 수 있다. 용어 "포르메이트 탈수소효소" 및 "FDH"는 포르메이트 및 NAD+ 또는 NADP+가 이산화탄소 및 NADH 또는 NADPH로 전환되는 것을 각각 촉매하는 NAD+ 또는 NADP+ 의존성 효소를 의미하기 위해 본원에 상호혼용된다. 본원에 기재된 케토리덕타제 촉매 환원 반응에서 보조인자 재생 시스템으로 사용하기에 적합한 포르메이트 탈수소효소는 천연 포르메이트 탈수소효소 및 비천연 포르메이트 탈수소효소 둘 다를 포함한다. 포르메이트 탈수소효소로는 PCT 공개 WO 제2005/018579호(개시내용이 본원에 참조문헌으로 포함됨)의 서열 번호 69 및 71에 각각 해당하는 폴리뉴클레오티드에 의해 코딩되는, PCT 공개 WO 제2005/018579호의 서열 번호 70[슈도모나스(Pseudomonas) 종] 및 72[칸디다 보이디니이(Candida boidinii)]에 해당하는 것을 들 수 있다. 본원에 기재된 방법에서 사용되는 포르메이트 탈수소효소는 천연 또는 비천연인가와 무관하게, 적어도 약 1 μmol/분/mg, 종종 적어도 약 10 μmol/분/mg 또는 적어도 약 102 μmol/분/mg, 약 103 μmol/분/mg 이하 또는 그 이상의 활성을 나타낼 수 있고, PCT 공개 WO 제2005/018579호의 실시예 4에 기재된 분석으로 활성에 대해 용이하게 스크리닝할 수 있다.
본원에 사용되는 용어 "포르메이트"는 포르메이트 음이온(HCO2 -), 포름산(HCO2H) 및 이들의 혼합물을 의미한다. 포르메이트는 염, 통상적으로 알칼리 또는 암모늄염(예를 들면, HCO2Na, KHCO2NH4 등)의 형태, 포름산, 통상적으로 수성 포름산 또는 이의 혼합물의 형태로 제공될 수 있다. 포름산은 온화한(moderate) 산이다. pKa가 수 pH 단위인 수용액(수 중 pKa = 3.7)에서, 포르메이트는 평형 농도에서 HCO2 - 및 HCO2H 둘 다로서 존재한다. 약 pH 4 초과의 pH 값에서, 포르메이트는 주로 HCO2 -로서 존재한다. 포르메이트가 포름산으로서 제공되는 경우, 원하는 pH, 통상적으로 약 pH 5 이상을 제공하도록 염기를 첨가함으로써 통상적으로 반응 혼합물을 완충시키거나 덜 산성으로 만든다. 포름산을 중화시키는 데 적합한 염기로는 유기 염기, 예를 들면 아민, 알콕시드 등 및 무기 염기, 예를 들면 수산염(예를 들면, NaOH), 탄산염(예를 들면, NaHCO3), 중탄산염(예를 들면, K2CO3), 염기성 인산염(예를 들면, K2HPO4, Na3PO4) 등을 들 수 있으나, 이들로 제한되지 않는다.
포르메이트가 주로 HCO2 -로서 존재하는 약 pH 5 초과의 pH 값에 대해, 하기 식 2는 포르메이트에 의한 NAD+ 또는 NADP+의 포르메이트 탈수소효소-촉매 환원을 설명한다.
(2)
Figure pct00023
포르메이트 및 포르메이트 탈수소효소를 보조인자 재생 시스템으로서 사용할 때, 반응 혼합물의 pH는 표준 완충 기술에 의해(여기서, 완충액은 제공된 완충능 이하로 양성자를 방출함) 또는 전환 과정과 동시에 산을 첨가함으로써 원하는 수준으로 유지할 수 있다. pH를 유지하기 위해 반응 과정 동안 첨가하기에 적합한 산으로는 유기 산, 예를 들면 카르복실산, 술폰산, 포스폰산 등, 무기산, 예를 들면 할로겐수소산(hydrohalic acid)(예컨대, 염산), 황산, 인산 등, 산성 염, 예를 들면 이수소인산염(예를 들면, KH2PO4), 중황산염(예를 들면, NaHSO4) 등을 들 수 있다. 몇몇 실시양태는 포름산을 사용하며, 이로써 포르메이트 농도 및 용액의 pH 둘 다가 유지된다.
포르메이트/포르메이트 탈수소효소 보조인자 재생 시스템을 사용하는 환원 반응 동안 산 첨가를 이용하여 pH를 유지하는 경우, pH를 유지하기 위해 첨가되는 산의 양에 의해 전환의 진행을 모니터링할 수 있다. 통상적으로, 전환의 과정에 걸쳐 비완충 또는 부분 완충 반응 혼합물에 첨가되는 산을 수용액으로 첨가한다.
용어 "2차 알콜 탈수소효소" 및 "sADH"는 2차 알콜 및 NAD+ 또는 NADP+가 케톤 및 NADH 또는 NADPH로 전환되는 것을 각각 촉매하는 NAD+ 또는 NADP+ 의존성 효소를 의미하기 위해 본원에 상호혼용된다. 하기 식 3은 이소프로판올로 예시되는 2차 알콜에 의한 NAD+ 또는 NADP+의 환원을 설명한다.
(3)
Figure pct00024
본원에 기재된 케토리덕타제 촉매 환원 반응에서 보조인자 재생 시스템으로서 사용하기에 적합한 2차 알콜 탈수소효소는 천연 2차 알콜 탈수소효소 및 비천연 2차 알콜 탈수소효소 둘 다를 포함한다. 천연 2차 알콜 탈수소효소로는 써모아네로븀 브록키이(Thermoanerobium brockii), 로도코쿠스 에리트로폴리스(Rhodococcus erythropolis), 락토바실러스 케피르, 락토바실루스 미노르 및 락토바실러스 브레비스로부터 얻은 공지된 알콜 탈수소효소를 들 수 있으며, 비천연 2차 알콜 탈수소효소로는 이들로부터 유래한 조작된 알콜 탈수소효소를 들 수 있다. 본원에 기재된 방법에 사용되는 2차 알콜 탈수소효소는 천연 또는 비천연인지와 무관하게 적어도 약 1 μmol/분/mg, 종종 적어도 약 10 μmol/분/mg 또는 적어도 약 102 μmol/분/mg, 약 103 μmol/분/mg 이하 또는 그 이상의 활성을 나타낼 수 있다.
적합한 2차 알콜로는 저급 2차 알칸올 및 아릴-알킬 카르비놀을 들 수 있다. 저급 2차 알콜의 예로는 이소프로판올, 2-부탄올, 3-메틸-2-부탄올, 2-펜탄올, 3-펜탄올, 3,3-디메틸-2-부탄올 등을 들 수 있다. 일 실시양태에서, 2차 알콜은 이소프로판올이다. 적합한 아릴-알킬 카르비놀로는 비치환 및 치환 1-아릴에틴올을 들 수 있다.
2차 알콜 및 2차 알콜 탈수소효소를 보조인자 재생 시스템으로서 사용할 경우, 생성된 NAD+ 또는 NADP+는 2차 알콜 탈수소효소에 의한 2차 알콜의 케톤으로의 커플링 산화에 의해 환원된다. 또한, 일부 조작된 케토리덕타제는 2차 알콜 환원제를 탈수소화시키는 활성을 갖는다. 환원제로서 2차 알콜을 사용하는 몇몇 실시양태에서, 조작된 케토리덕타제 및 2차 알콜 탈수소효소는 동일한 효소이다.
보조인자 재생 시스템을 사용하여 본원에 기재된 케토리덕타제 촉매 환원 반응의 실시양태를 수행함에 있어서, 보조인자의 산화 또는 환원 형태를 우선 제공할 수 있다. 상기 기재된 바와 같이, 보조인자 재생 시스템은 산화된 보조인자를 이의 환원 형태로 전환시킨 후, 케토리덕타제 기질의 환원에 사용한다.
몇몇 실시양태에서, 보조인자 재생 시스템을 사용하지 않는다. 보조인자 재생 시스템을 사용하지 않고 수행되는 환원 반응에 있어서, 보조인자를 환원 형태로 반응 혼합물에 첨가한다.
몇몇 실시양태에서, 숙주 유기체의 전체 세포를 사용하여 공정을 수행하는 경우, 전체 세포는 본래 보조인자를 제공할 수 있다. 대안적으로 또는 조합하여, 상기 세포는 본래 또는 재조합에 의해 글루코스 탈수소효소를 제공할 수 있다.
본원에 기재된 입체 선택적 환원 반응을 수행함에 있어서, 조작된 케토리덕타제 효소 및 임의의 보조인자 재생 시스템을 포함하는 임의의 효소를 정제된 효소, 효소를 코딩하는 유전자(들)로 형질전환된 전체 세포 및/또는 이러한 세포의 세포 추출물 및/또는 용해물의 형태로 반응 혼합물에 첨가할 수 있다. 조작된 케토리덕타제 효소를 코딩하는 유전자(들) 및 임의의 보조인자 재생 효소를 숙주 세포로 따로 또는 동일한 숙주 세포로 함께 형질전환시킬 수 있다. 예를 들면, 몇몇 실시양태에서, 한 집합의 숙주 세포는 조작된 케토리덕타제 효소를 코딩하는 유전자(들)를 사용하여 형질전환시킬 수 있고, 다른 집합은 보조인자 재생 효소를 코딩하는 유전자(들)를 사용하여 형질전환시킬 수 있다. 양 집합의 형질전환된 세포를 전체 세포의 형태로 또는 이로부터 유래한 용해물 또는 추출물의 형태로 반응 혼합물에 함께 사용할 수 있다. 다른 실시양태에서, 숙주 세포는 조작된 케토리덕타제 효소 및 보조인자 재생 효소 둘 다를 코딩하는 유전자(들)를 사용하여 형질전환될 수 있다.
조작된 케토리덕타제 효소 및/또는 임의의 보조인자 재생 효소를 코딩하는 유전자(들)에 의해 형질전환된 전체 세포 또는 이의 세포 추출물 및/또는 용해물은 고상(예를 들면, 동결 건조형, 분무 건조형 등) 또는 반고상(예를 들면, 미정제 페이스트)를 비롯한 각종 상이한 형태로 사용될 수 있다.
세포 추출물 또는 세포 용해물은 침전(황산암모늄, 폴리에틸렌이민, 열 처리 등) 및 이에 이은 동결 건조 전 탈염 절차(예를 들면, 한외 여과, 투석 등)에 의해 부분 정제할 수 있다. 세포 제제 내 임의의 물질은 예를 들면 글루타르알데히드와 같은 공지된 가교제를 사용하는 가교결합에 의해 또는 고상(예를 들면, 유퍼지트(Eupergit) C 등)으로의 부동화에 의해 안정화될 수 있다.
고상 반응물(예를 들면, 효소, 염 등)을 분말(예를 들면, 동결 건조 분말, 분무 건조 분말 등), 용액, 에멀션, 현탁액 등을 비롯한 각종 상이한 형태로 반응에 제공할 수 있다. 반응물은 당업자에게 공지된 방법 및 장비를 이용하여 용이하게 동결 건조 또는 분무 건조시킬 수 있다. 예를 들면, 단백질 용액을 적은 분취량으로 -80℃에서 동결시킨 후, 예비 냉각된 동결 건조 챔버에 첨가한 후, 진공을 인가할 수 있다. 샘플로부터 물을 제거한 후, 온도를 통상적으로 2 시간 동안 4℃로 승온시킨 후, 진공을 배출하고 동결 건조된 샘플을 복구하였다.
환원 반응에 사용되는 반응물의 분량은 일반적으로 원하는 생성물의 분량 및 이와 동시에 사용되는 케토리덕타제 기질의 양에 따라 달라질 수 있다. 사용되는 케토리덕타제, 보조인자 및 선택적 보조인자 재생 시스템의 양을 결정하는 데 하기 가이드라인을 이용할 수 있다. 일반적으로, 케토 기질은, 약 50 mg 내지 약 5 g의 케토리덕타제 및 약 10 mg 내지 약 150 mg의 보조인자를 사용하여, 약 20 내지 300 g/ℓ의 농도로 사용할 수 있다. 당업자라면 원하는 수준의 생산성 및 생산 규모에 맞게 조정하기 위해 상기 분량을 변화시키는 방법을 용이하게 이해할 것이다. 임의의 보조인자 재생 시스템의 적절한 분량은 사용되는 보조인자 및/또는 케토리덕타제의 양에 기초하여 일상적인 실험에 의해 용이하게 결정할 수 있다. 일반적으로, 환원제(예를 들면, 글루코스, 포르메이트, 이소프로판올 등)는 케토리덕타제 기질의 실질적으로 완전한 또는 거의 완전한 전환을 달성하기 위해 케토리덕타제 기질과 동몰 수준 이상의 수준으로 사용한다.
반응물의 첨가 순서는 중요하지 않다. 반응물은 용매(예를 들면, 1상 용매, 2상 수성 공용매 시스템 등)에 동시에 첨가할 수 있거나, 대안적으로 반응물의 일부를 따로 그리고 일부를 상이한 시점에서 함께 첨가할 수 있다. 예를 들면, 보조인자 재생 시스템, 보조인자, 케토리덕타제 및 케토리덕타제 기질을 먼저 용매에 첨가할 수 있다.
수성 공용매 시스템을 사용할 경우 혼합 효율의 향상을 위해, 먼저 보조인자 재생 시스템, 케토리덕타제 및 보조인자를 수상에 첨가하여 혼합할 수 있다. 이후, 유기상을 첨가하여 혼합한 후, 케토리덕타제 기질을 첨가할 수 있다. 대안적으로, 수상을 첨가하기 전에 케토리덕타제 기질을 유기 상에 예비 혼합할 수 있다.
본원에 기재된 케토리덕타제 촉매 환원 반응을 수행하는 데 적합한 조건으로는 실험 pH 및 온도에서 조작된 케토리덕타제 효소 및 기질을 접촉시키는 것 및 예를 들면 본원에 제시된 실시예에 기재된 방법을 이용하여 생성물을 검출하는 것을 포함하나 이들로 제한되지 않는 통상의 실험에 의해 용이하게 최적화할 수 있는 매우 다양한 조건을 들 수 있다.
케토리덕타제 촉매 환원은 통상적으로 약 15 내지 약 75℃ 범위의 온도에서 수행한다. 몇몇 실시양태의 경우, 상기 반응은 약 20 내지 약 55℃ 범위의 온도에서 수행한다. 또 다른 실시양태에서, 상기 반응은 약 20 내지 약 45℃ 범위의 온도에서 수행한다. 또한, 상기 반응은 주위 조건하에 수행할 수 있다.
환원 반응은 일반적으로 기질의 실질적으로 완전한 또는 거의 완전한 환원이 얻어질 때까지 진행시킨다. 기질의 생성물로의 환원은 기질 및/또는 생성물을 검출함으로써 공지된 방법을 이용하여 모니터링할 수 있다. 적절한 방법으로는 가스 크로마토그래피, HPLC 등을 들 수 있다. 반응 혼합물에서 생성되는 알콜 환원 생성물의 전환 수율은 일반적으로 약 50%를 초과하며, 약 60%를 초과할 수도 있고, 약 70%를 초과할 수도 있으며, 약 80%를 초과할 수도 있고, 90%를 초과할 수도 있으며, 종종 약 97%를 초과한다.
7. 실시예
본 개시내용의 각종 특성 및 실시양태가 하기 대표적인 실시예에서 예시되어 있으며, 이들은 예시적이며 제한적되지 않는 것으로 이해되어야 한다.
하기 설명에서, 글루코스 탈수소효소(GDH)를 사용하는 경우마다, 이는 율리히 키랄 솔루션즈(Julich Chiral Solutions; 독일 율리히 소재)로부터 입수한 GDH CDX901이다.
실시예 1: 야생형 케토리덕타제 유전자 획득 및 발현 벡터의 구성
케토리덕타제(KRED) 코딩 유전자를 본원에 참조문헌으로 포함되는 미국 가출원 번호 제660/848,950호의 실시예 1에 기재된 바와 같이, 보고된 케토리덕타제의 아미노산 서열 및 코돈 최적화 알고리즘에 기초하여 이. 콜라이 내 발현에 대해 설계하였다. lac 프로모터의 조절 하에 42개의 뉴클레오티드로 이루어진 올리고뉴클레오티드를 사용하여 유전자를 합성하여 발현 벡터 pCK110900 내로 클로닝하였다(미국 특허 출원 공개 제2006195947호의 도 3에 도시됨). 또한, 발현 벡터는 P15a 복제 기점 및 클로람페니콜 내성 유전자를 포함하였다. 생성된 플라스미드를 표준 방법을 이용하여 이. 콜라이 W3110으로 형질전환시켰다. 또한, 코돈 최적화 유전자 및 코딩 폴리펩티드를 표 3에 기재하였다. 야생형 케토리덕타제의 활성을 미국 가출원 일련 번호 제60/848,950호에 기재된 바와 같이 확인하였다.
[표 3] 사용된 케토리덕타제에 대한 약어, 출처 및 참조문헌
Figure pct00025
본 발명의 조작된 케토리덕타제를 코딩하는 폴리뉴클레오티드를 마찬가지로 이. 콜라이 W3110 내 발현을 위해 벡터 pCK110900 내로 클로닝하였다.
실시예 2: 케토리덕타제 분말의 생성; 진탕 플라스크 절차
관심 있는 케토리덕타제 유전자를 가지는 플라스미드를 포함하는 이. 콜라이의 단일 미생물 콜로니를 30 ㎍/㎖ 클로람페니콜 및 1% 글루코스를 함유하는 50 ㎖ 테리픽(Terrific) 브로쓰에 접종시켰다. 상기 세포를 250 rpm에서 진탕하면서 30℃에서 인큐베이터에서 밤새(적어도 16시간) 배양하였다. 배양물을 0.2의 600 ㎚에서의 흡광도(OD600)로 1 L 플라스크에서 250 ㎖ 테리픽 브로쓰(12 g/L 박토-트립톤(bacto-tryptone), 24 g/L 효모 추출물, 4 ㎖/L 글리세롤, 65 mM 인산칼륨(pH 7.0), 1 mM MgSO4, 30 ㎍/㎖ 클로람페니콜)에 희석시키고 30℃에서 배양하였다. 배양물의 OD600이 0.6 내지 0.8일 때 1 mM IPTG로 케토리덕타제 유전자의 발현을 유도하고 밤새(적어도 16시간) 항온처리하였다. 원심분리(5000 rpm, 15분, 4℃)에 의해 세포를 수확하고 상청액을 버렸다. 세포 펠릿을 동일 부피의 냉(4℃) 100 mM 트리에탄올아민(염화물) 완충액(pH 7.0)(ADH-LK 및 ADH-LB 및 이로부터 유래된 조작된 케토리덕타제의 경우 2 mM MgSO4 포함)에 재현탁시키고 상기와 같이 원심분리에 의해 수확하였다. 세정된 세포를 2배 부피의 냉 트리에탄올아민(염화물) 완충액에 재현탁시키고, 4℃에서 유지하면서 12000 psi에서 2회 프렌치 프레스(French Press)를 통해 통과시켰다. 원심분리(9000 rpm, 45분, 4℃)에 의해 세포 찌꺼기를 제거하였다. 투명한 용해물 상청액을 수집하여 -20℃에서 보관하였다. 냉동된 투명한 용해물을 동결 건조시켜 미정제 케토리덕타제 효소의 건조 분말을 얻었다.
실시예 3: 케토리덕타제의 생성; 발효 절차
통기되는 교반 15 L 발효기에서, 0.88 g/L 황산암모늄, 0.98 g/L 시트르산나트륨, 12.5 g/L 인산수소이칼륨 3수화물, 6.25 g/L 인산이수소칼륨, 6.2 g/L 타스톤(Tastone)-154 효모 추출물, 0.083 g/L 시트르산철암모늄 및 2 g/L 염화칼륨 2수화물, 2.2 g/L 황산아연 7수화물, 0.5 g/L 황산망간 1수화물, 1 g/L 황산 제1구리 7수화물, 0.1 g/L 몰리브덴암모늄 4수화물 및 0.02 g/L 사붕산나트륨 10수화물을 함유하는 8.3 ㎖/L 미량 원소 용액을 함유하는 6.0 L 성장 배지를 30℃의 온도로 만들었다. 상기 발효기를 실시예 3에 기재된 바와 같이 진탕 플라스크에서 배양된 관심 있는 케토리덕타제 유전자를 포함하는 플라스미드를 포함하는 이. 콜라이 W3110의 후기 지수로 성장하는 배양물에 의해 0.5 내지 2.0의 출발 OD600으로 접종시켰다. 상기 발효기를 500 내지 1500 rpm에서 교반하고 1.0∼15.0 L/분으로 발효 용기에 공기를 공급하여 30% 포화 이상의 용존 산소 수준을 유지하였다. 20% v/v 수산화암모늄을 첨가하여 배양물의 pH를 7.0으로 제어하였다. 500 g/L 세렐로스(cerelose), 12 g/L 염화암모늄 및 10.4 g/L 황산마그네슘 7수화물을 함유하는 공급액을 첨가하여 배양물의 배양을 유지시켰다. 배양물이 50의 OD600에 도달한 후, 이소프로필-b-D-티오갈락토시드(IPTG)를 첨가하여 1 mM의 최종 농도로 만들어 케토리덕타제의 발현을 유도하였다. 배양물을 추가로 14 시간 동안 성장시켰다. 이후, 배양물을 4℃로 냉각시키고 수확할 때까지 4℃에서 유지시켰다. 4℃에서 소르발(Sorval) RC12BP 원심분리기에서 40분 동안 5000G에서 원심분리하여 세포를 수확하였다. 수확한 세포를 이후의 다운스트림 회수 공정에 직접 사용하거나, 사용하기 전까지 4℃에서 보관하였다.
세포 펠릿을 4℃에서 각각의 부피의 습윤 세포 페이스트에 대해 2 부피의 100 mM 트리에탄올아민(염화물) 완충액(pH 6.8)에 재현탁시켰다. 12000 psig의 압력을 이용하여 현탁액을 2단계 균질화 밸브 어셈블리를 구비한 균질화기에 통해 통과시켜 세포내 케토리덕타제를 세포로부터 방출시켰다. 세포 균질물을 파열 직후 4℃로 냉각시켰다. 10% w/v 폴리에틸렌이민(pH 7.2)의 용액을 용해물에 첨가하여 0.5% w/v의 최종 농도로 만들고 30분 동안 교반하였다. 생성된 현탁액을 30분 동안 표준 실험실 원심분리기에서 5000G에서 원심분리하여 맑게 만들었다. 투명한 상청액을 경사 여과시키고 분자량 컷오프가 30 Kd인 셀룰로스 한외 여과 막을 이용하여 10 배로 농축시켰다. 최종 농축물을 얕은 용기에 분배하고 -20℃에서 냉동시키고 분말로 동결 건조시켰다. 케토리덕타제 분말을 -80℃에서 보관하였다.
실시예 4: 2-[3-[3-[2-(7- 클로로 -2- 퀴놀리닐 ) 에테닐 ] 페닐 ]-3- 케토프로필 ]벤조산 메틸 에스테르의 (S)-2-[3-[3-[2-(7- 클로로 -2- 퀴놀리닐 ) 에테닐 ] 페닐 ]-3- 하이 드록시프로필]벤조산 메틸 에스테르로의 전환에 대한 분석 방법
2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-케토프로필]벤조산 메틸 에스테르의 환원 및 알콜 생성물의 키랄 순도를 역상 HPLC(2.1×50 mm Zorbax XDB 칼럼(가드 카트리지 있음); 30℃에서 0.6 mL/분으로 H2O 중 90:10 ACN/0.25% AcOH; 다음의 체류 시간에 의해 287 nm에서 검출함: 거울상 이성체 알콜 0.55 분; 케톤 0.72 분) 또는 정상, 키랄 HPLC(2.1×150 mm 키랄팩(Chiralpak) AS-H 칼럼(가드 카트리지 있음), 40℃에서 0.5 mL/분으로 10:90 이소프로필알콜/헵탄; 다음의 체류 시간에 의해 287 nm에서 검출함: (S)-알콜 7.1 분; (R)-알콜 5.7 분; 케톤 4.5 분)로 측정하였다.
실시예 5: 2-[3-[3-[2-(7- 클로로 -2- 퀴놀리닐 ) 에테닐 ] 페닐 ]-3- 케토프로필 ]- 페닐 ]-1- 메틸 -1-에탄올의 (S)-2-[3-[3-[2-(7- 클로로 -2- 퀴놀리닐 ) 에테닐 ] 페닐 ]-3- 하이 드록시프로필]- 페닐 ]-1- 메틸 -1-에탄올로의 전환에 대한 분석 방법
(상응하는 알콜의 산화에 의해 제조된) 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-케토프로필]-페닐]-1-메틸-1-에탄올의 환원 및 알콜 생성물의 순도를 HPLC(다음의 용리 프로파일로 4.6×50 mm Phenomix Gemini C18, 110A 칼럼: 4 분 동안 물 중의 40% 내지 80%/0.1% TFA 구배, 1.5 분 유지, 1 분 내에 0.5 mL/분의 유속으로 40% 아세토니트릴/0.1% TFA로 바꿈; 상온; 다음의 체류 시간에 의해 254 nm에서 검출함: 알콜 4.4 분, 케톤 5.7 분)로 측정하였다.
키랄 순도를 HPLC(2.1×150 mm 키랄팩 AD-H 칼럼; 용매: 40:60 이소프로필 알콜:헵탄; 40℃에서 유속 = 0.5 mL/분; 다음의 체류 시간에 의해 280 nm에서 검출함:(S)-알콜 12.0 분; (R)-알콜 11.2 분; 케톤 10.3 분)으로 평가하였다.
실시예 6: 2-[3-[3-[2-(7- 클로로 -2- 퀴놀리닐 ) 에테닐 ] 페닐 ]-3- 케토프로필 ]벤조산 메틸 에스테르의 환원에 대한 야생형 케토리덕타제의 평가
실시예 1의 표 3에 기재된 KRED를 보조인자로서의 NADH 및 NADPH 및 보조인자 재생 시스템으로서의 글루코스 탈수소효소/글루코스 또는 이소프로필알콜을 사용하여 스크리닝하였다. 96 딥 웰 플레이트 내 웰에 THF 중에 1.0 g/L NAD(P), 30∼50 g/L KRED 변이체, 200 ㎕ IPA 및 10∼20 g/L 케톤 기질 50 ㎕를 함유하는 100 mM 트리에탄올아민(염화물) 완충액(pH 7.0) 250 ㎕를 첨가하였다. 대안적으로, 96 딥 웰 플레이트 내 각 웰에 1.0 g/L NAD(P), 30∼50 g/L KRED, 10∼20 g/L GDH 및 10% 글루코스를 함유하는 100 mM 트리에탄올아민(염화물) 완충제(pH 7.0) 250 ㎕를 CaCO3 10∼20 mg과 함께 미리 넣었다. 상기 플레이트를 알루미늄/폴리프로필렌 라미네이트 열 밀봉 테이프(Velocity 11(미국 캘리포니아주 멘로 파크 소재), 카탈로그 제06643-001호)에 의해 밀봉하고 실온에서 밤새 진탕시켰다. 상기 반응물을 1000 ㎕ EtOAc를 첨가하여 켄칭하였다. 원심분리(22℃에서 10 분 동안 4000 rpm)한 후, 유기 상을 실시예 4에서의 정상 HPLC 방법을 이용하여 전환에 대해 평가하였다. 이들 효소 중 어떤 것도 시험된 어느 조건에서도 어떠한 활성도 보이지 않았다(검출 한계 ∼0.5% 전환).
이 실시예는 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-케토프로필]벤조산 메틸 에스테르에 대해 활성이 있다 하더라도 매우 적게 갖는다는 것을 증명한다.
실시예 7: 2-[3-[3-[2-(7- 클로로 -2- 퀴놀리닐 ) 에테닐 ] 페닐 ]-3- 케토프로필 ]벤조산 메틸 에스테르의 환원에 대한 ADH - LK 변이체의 평가
생성된 몇몇 ADH-LK 변이체를 평가하였고, 실시예 6에 기재된 조건하에 및 표 4에 기재된 바대로 평가할 때 서열 번호 90을 갖는 ADH-LK 변이체가 상기 기질을 키랄 (S)-2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-하이드록시프로필]벤조산 메틸 에스테르로 전환되는 것으로 밝혀졌다.
[표 4] ADH-LK 변이체의 활성
Figure pct00026
이 실시예는 G7H, S96T, F147L, Y190P, V196L, A202W 돌연변이를 함유하는 ADH-LK 변이체가 높은 입체선택성(>99% 입체이성체 잉여율)으로 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-케토프로필]벤조산 메틸 에스테르를 (S)-2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-하이드록시프로필]벤조산 메틸 에스테르로 전환시킨다는 것을 보여준다.
실시예 8: 보조인자 재생에 대한 이소프로필알콜을 사용한 2-[3-[3-[2-(7- 클로로 -2- 퀴놀리닐 ) 에테닐 ] 페닐 ]-3- 케토프로필 ]벤조산 메틸 에스테르에 미치는 케토 리덕타제 활성에 대한 고효율 HPLC 분석
방향성 진화에 의해 얻어지고 진화된 케토리덕타제 유전자를 함유하는 플라즈미드 라이브러리를 이. 콜라이에 형질전환시키고 1% 글루코스 및 30 ㎍/mL 클로람페니콜(CAM)을 함유하는 루리아-베르타니(Luria-Bertani)(LB) 브로쓰에 플레이팅하였다. 30℃에서 16시간 이상 항온처리한 후, 콜로니를 Q-보트(Q-bot)
Figure pct00027
로봇식 콜로니 픽커(미국 제니틱스 인코포레이티드(Genetix USA, Inc.), 미국 오레곤주 베아베르톤 소재)를 이용하여 180 ㎕ 테리픽 브로쓰(TB), 1% 글루코스, 30 ㎍/mL 클로람페니콜(CAM) 및 2 mM MgSO4를 함유하는 96 웰 얕은 웰 미량적정 플레이트 내로 넣었다. 상기 세포를 200 rpm에서 진탕하면서 30℃에서 밤새 배양하였다. 이후, 상기 배양물 20 ㎕를 350 ㎕ 테리픽 브로쓰(TB), 2 mM MgSO4 및 30 ㎍/mL CAM을 함유하는 96 딥 웰 플레이트로 옮겼다. 250 rpm에서 2.5 내지 3시간 동안 진탕하면서 30℃에서 딥 웰을 항온처리한 후(OD600 0.6∼0.8), 세포 배양에 의한 재조합 유전자 발현을 이소프로필 티오갈락토시드(IPTG)에 의해 유도하여 최종 농도를 1 mM로 만들었다. 이후, 상기 플레이트를 250 rpm에서 15∼23시간 동안 진탕하면서 30℃에서 항온처리하였다.
96 웰 미량적정 플레이트 웰에 0.2 mM Na-NADP 및 2 mM MgSO4 및 최고의 공지된 효소가 임의의 시점에 제때에(예를 들면 진화의 제1 회전에서 서열 번호 90) 케톤의 (S)-알콜로의 10∼20% 전환을 생성하기에 충분한 부피의 세포 배양물을 함유하는 100 mM 트리에탄올아민(염화물) 완충제(pH 7.0) 100 ㎕를 첨가하였다. IPA 및 THF 중에 1.67 내지 16.7 g/L의 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-케토프로필]벤조산 메틸 에스테르를 함유하는 용액을 웰에 첨가하여 100mM 트리에탄올아민(염화물) 완충제(pH 7.0), THF 및 IPA(4:1:5 부피비)의 최종 조성물(1 내지 10 g/L의 최종 기질 농도)을 만들었다. 아세톤을 첨가하여 원하는 바대로 (통상적으로 IPA 또는 THF 중의 용액으로서) 0 내지 2%의 최종 농도를 만들었다. 상기 플레이트를 실시예 6에 기재된 바대로 열 밀봉하고 실온 또는 40℃에서 진탕시키면서 4 또는 24시간 동안 항온처리하였다. 반응 종료시, 상기 기질 및 상기 생성물을 1:4 THF:아세토니트릴 1000 ㎕로 켄칭하였다. 실온에서 원심분리한 후, 상청액을 실시예 4에 기재된 역상 HPLC 방법을 이용하여 전환에 대해 분석하였다. 입체이성체 선택성에 대해 평가하고자 하는 반응의 경우, 반응물을 EtOAc 1 mL로 켄칭하고, 원심분리하고 유기 상을 실시예 4에 기재된 정상 HPLC 방법을 통해 키랄 분석 처리하였다.
이 실시예는 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-케토프로필]벤조산 메틸 에스테르 환원에 대해 향상된 KRED 변이체를 확인하기 위해 사용되는 방법을 설명한다.
실시예 9: ADH - LK 로부터 유래하는 조작된 케토리덕타제에 의한 2-[3-[3-[2-(7-클로로-2- 퀴놀리닐 ) 에테닐 ] 페닐 ]-3- 케토프로필 ]벤조산 메틸 에스테르의 환원
교반 바를 구비한 황색 바이알에 공기하에 50∼500 mg 기질, 1.5 mL 100 mM 트리에탄올아민(염화물) 완충제(pH 7.0 또는 8.0)(0.33 g/L NADP-Na 및 10.0∼33.3 g/L KRED 변이체 함유), 2 mM MgSO4, 2.5 mL IPA 및 0.5 mL 공용매(THF 또는 톨루엔)를 차례대로 첨가하였다. 상기 바이알을 밀폐시키고 원하는 온도로 조절되는 오일 욕 중에 액침시켰다. 2개의 50 ㎕ 분액을 1시간, 2시간, 4시간 및 8시간에 취하고 4개의 50 ㎕ 분액을 t=24h에서 취하였다. 상기 분액을 1000 ㎕ THF로 희석하고 원심분리(22℃에서 10 분 동안 4000 rpm)하여 찌꺼기를 제거하였다. 상청액을 아세토니트릴로 9회 희석하고 실시예 4에 기재된 바대로 전환을 측정하였다. 키랄 분석을 24시간 샘플에서 수행하였다. 염수 0.5 부피 및 THF 2 부피를 첨가하여 깨끗한 사구간을 달성하고 유기 상을 MgSO4로 건조시켰다. 상기 유기 상을 EtOAc로 10회 희석하고 실시예 4에 기재된 바대로 분석하였다. 표 5는 상기 케토리덕타제에 해당하는 서열 번호, 야생형 ADH-LK로부터 얻은 아미노산 돌연변이의 수 및 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-케토프로필]벤조산 메틸 에스테르의 (S)-2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-하이드록시프로필]벤조산 메틸 에스테르로의 전환을 기재하고 있다. 시험된 모든 변이체는 (S)-2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-하이드록시프로필]벤조산 메틸 에스테르를 >99.2% 입체이성체 잉여율로 생성시켰다(기준 표준은 99.2% ee였고, 바람직하지 않은 입체이성체는 검출가능하지 않음).
[표 5] 표시된 온도에서 ADH-LK 변이체의 활성
Figure pct00028
+: L/효소(g)/일당 <0.03 g 생성물; ++: L/효소(g)/일당 0.03∼1 g 생성물; +++: L/효소(g)/일당 1∼5 g 생성물; ++++: L/효소(g)/일당 5∼20 g 생성물; +++++ L/효소(g)/일당 >20 g 생성물.
실시예 10: ADH - LK 로부터 유래한 조작된 케토리덕타제에 의한 2-[2-[3-[3-[2-(7-클로로-2- 퀴놀리닐 ) 에테닐 ] 페닐 ]-3- 옥소프로필 ] 페닐 ]-2- 프로판올의 환원
교반 바를 구비한 황색 바이알에 공기하에 500 mg 2-[2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]페닐]-2-프로판올, 1.5 mL 100 mM 트리에탄올아민(염화물) 완충제(pH 7.0)(0.89 g/L NADP-Na 및 13.3 g/L KRED 변이체 서열 번호 20 함유), 2 mM MgSO4, 2.5 mL IPA 및 0.5 mL 공용매(THF 또는 톨루엔)를 차례대로 첨가하였다. 상기 바이알을 밀폐시키고 40℃로 조절되는 오일 욕 중에 액침시켰다. 6시간, 24시간 및 29시간에 샘플(30 ㎕)을 취하고 THF 1500 ㎕로 희석하고 희석 샘플 30 ㎕를 건조 농축시키고 1000 ㎕ 아세토니트릴에 용해시킨 후, 실시예 5에 기재된 바대로 화학 전환에 대해 HPLC로 분석하였다.
29시간에서 전체 반응 혼합물을 후처리한 후 키랄 분석을 다음과 같이 수행하였다: 샘플을 염수 2 mL 및 THF 6 mL로 희석하여 깨끗한 사구간을 얻었다. 상기 수성 상을 에틸 아세테이트(3×10 mL)로 추출하고 합한 유기 층을 MgSO4로 건조시켰다. 유기 용액을 셀라이트(Celite) 층을 통해 여과시키고 건조 농축시켰다. 아세토니트릴 1 ml 중에 잔사 1 mg을 용해시켜 분석용 샘플을 제조하고 실시예 5에 기재된 바대로 분석하였다. (S)-1-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-(2-(2-하이드록시프로판-2-일)페닐)프로판-1-올을 >99% 입체이성체 잉여율로 얻었다. 전환율은 약 67%를 초과하였다.
실시예 11: (S)-2-[3-[3-[2-(7- 클로로 -2- 퀴놀리닐 ) 에테닐 ] 페닐 ]-3- 하이드록시프로필 ]벤조산 메틸 에스테르의 분취 규모 제조
질소하에 외부 열 교환기를 통해 51℃의 자켓 온도를 갖고 250 rpm에서 내부 온도계 및 기계 교반기를 구비한 자켓팅된 2 L 3목 플라스크에 100 mM 트리에탄올아민*HCl(pH 8.0) 300 mL, 1 M MgSO4 0.6 mL, 실시예 3에서 제조된 서열 번호 20 촉매 3.0 g, NADP-Na2 0.1 g을 첨가하여 담황색 용액을 얻었다. 10 분 동안 교반한 후, 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-케토프로필]벤조산 메틸 에스테르 100 g을 일부분씩 약 5 분에 걸쳐 첨가하였다. 슬러리에 IPA 500 mL(390 g) 및 톨루엔 100 mL(85 g)를 첨가하였다. 반응 진행을 실시예 4 및 실시예 6에 기재된 바대로 아키랄 HPLC로 모니터링하였다. 샘플링 및 샘플 제조를 위해 실시예 9에 기재된 절차를 사용하였다.
45℃에서 24시간 동안 교반한 후, 아키랄 HPLC 분석에 따라 반응을 종결시켰다. 반응 혼합물을 공기 구동 진공 펌프를 통해 3층의 150 mm 직경 Whatman#2 필터 종이로 여과시켰다. 여과를 종결하여 갈색의 페이스트를 얻는데 대략 10 분이 걸렸다. 상기 갈색의 페이스트를 물 2×500 mL로 세척하였다. 상기 갈색의 페이스트를 밤새 공기 건조시켜 (S)-2-[3-2[-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-하이드록시프로필]벤조산 메틸 에스테르 1수화물(100% 수율; 생성물은 1수화물임)의 갈색의 고체 104 g을 98.5 HPLC 면적(%)의 화학 순도(주요 불순물은 출발 물질의 0.3∼0.4 HPLC 면적(%)임)로 얻었다. (R)-입체이성체는 검출 가능하지 않았다.
본 출원에 인용된 모든 간행물, 특허, 특허 출원 및 기타 문헌은, 각각의 개별적인 간행물, 특허, 특허 출원 또는 기타 문헌이 모든 목적을 위해 참조문헌으로 포함되는 것으로 개별적으로 나타낸 바와 같은 정도로 모든 목적을 위해 전문이 본원에 참조문헌으로 포함된다.
SEQUENCE LISTING <110> LIANG, Jack BORUP, Birthe MITCHELL, Vesna MUNDORFF, Emily LALONDE, James HUISMAN, Gjalt <120> KETOREDUCTASE POLYPEPTIDES AND USES THEREOF <130> 376247-018 <141> 2008-09-26 <150> 60/976,345 <150> 2007-09-28 <160> 139 <210> 1 <211> 762 <212> DNA <213> Artificial Sequence <220> <223> Codon Optimized L. Brevis Sequence <400> 1 atgtctaacc gtctggatgg caaagtagcc atcattaccg gcgggactct gggtatcggt 60 ttggcaatcg ccacgaaatt tgtagaggag ggtgcgaaag taatgattac tggtcgtcac 120 tccgatgtag gtgaaaaggc cgccaaatca gtaggcactc cggatcagat tcagtttttt 180 cagcacgatt catccgatga agatggctgg acgaaactgt tcgacgccac cgagaaagca 240 ttcggcccgg ttagcacctt agtgaacaat gcagggattg cagttaacaa aagcgttgaa 300 gaaactacca cggccgaatg gcgtaaactg ctggccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggtt cgtaggcgat ccgagcctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctgccg 600 ggtgctgagg aagcgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catatatctg tgtgtacctg gcatctaatg aatcgaaatt tgcgacgggt 720 tccgaatttg tggtcgacgg cgggtatacc gcacagtaat ga 762 <210> 2 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Translation of Codon Optimized L. Brevis Sequence <400> 2 Met Ser Asn Arg Leu Asp Gly Lys Val Ala Ile Ile Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Thr Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Met Ile Thr Gly Arg His Ser Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Val Gly Thr Pro Asp Gln Ile Gln Phe Phe Gln His Asp Ser 50 55 60 Ser Asp Glu Asp Gly Trp Thr Lys Leu Phe Asp Ala Thr Glu Lys Ala 65 70 75 80 Phe Gly Pro Val Ser Thr Leu Val Asn Asn Ala Gly Ile Ala Val Asn 85 90 95 Lys Ser Val Glu Glu Thr Thr Thr Ala Glu Trp Arg Lys Leu Leu Ala 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Phe Val Gly Asp Pro Ser Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys 180 185 190 Thr Pro Leu Val Asp Asp Leu Pro Gly Ala Glu Glu Ala Met Ser Gln 195 200 205 Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Tyr Ile Cys Val Tyr Leu Ala Ser Asn Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ser Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 3 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Codon Optimized L. Kefir Sequence <400> 3 atgaccgatc gtctgaaggg caaagtagcc atcgtaaccg gcgggactct gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagtttccaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggtt cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggctat atcaagaccc cgctggtcga tgatctggaa 600 ggtgctgagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 4 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Translation of Codon Optimized L. kefir Sequence <400> 4 Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Phe Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys 180 185 190 Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 5 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 5 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacaat gggtatcggt 60 ttggcaatcg ccaccaaata cgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcgaca ctgatgttat tcgctttgtc 180 cagcacgatg tctccgatga agcaggctgg acgaaactgt tcgacaccac cgaggagacc 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttaaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgcc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc agcggctcga tgagctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccgcat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg tgggtatacc gcacagtga 759 <210> 6 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 6 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Met Gly Ile Gly Leu Ala Ile Ala Thr Lys Tyr Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Asp Thr Asp Val Ile Arg Phe Val Gln His Asp Val 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Thr 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Lys Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Gln Arg Leu Asp Glu Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly Arg Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 7 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 7 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacaat gggtatcggt 60 ttggcaatcg ccaccaaata cgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcgaca ctgatgttat tcgctttgtc 180 cagcacgatg tctccgatga agcaggctgg acgaaactgt tcgacgccac cgaggagacc 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttaaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgcc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc agcggctcga tgagctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccgcat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg tgggtatacc gcacagtga 759 <210> 8 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 8 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Met Gly Ile Gly Leu Ala Ile Ala Thr Lys Tyr Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Asp Thr Asp Val Ile Arg Phe Val Gln His Asp Val 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Ala Thr Glu Glu Thr 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Lys Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Gln Arg Leu Asp Glu Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly Arg Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 9 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 9 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacaat gggtatcggt 60 ttggcaatcg ccgataaata cgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgatga agcaggctgg acgaaactgt tcgacaccac cgaggagacc 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtctttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggtt ggttggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtatctccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 10 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 10 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Met Gly Ile Gly Leu Ala Ile Ala Asp Lys Tyr Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Thr 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Ser Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 11 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 11 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacaat gggtatcggt 60 ttggcaatcg ccgataaata cgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg tctccgatga agcaggctgg acgaaactgt tcgacaccac cgaggagacc 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttaaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg cgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtagg gtaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 12 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 12 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Met Gly Ile Gly Leu Ala Ile Ala Asp Lys Tyr Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Val 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Thr 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Lys Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Arg Val Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 13 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 13 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacaat gggtatcggt 60 ttggcaatcg ccgataaata cgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg tctccgatga agcaggctgg acgaaactgt tcgacaccac cgaggagacc 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttaaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgcc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc agcggctcga tcagctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccgcat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg tgggtatacc gcacagtga 759 <210> 14 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 14 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Met Gly Ile Gly Leu Ala Ile Ala Asp Lys Tyr Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Val 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Thr 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Lys Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Gln Arg Leu Asp Gln Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly Arg Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 15 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 15 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacaat gggtatcggt 60 ttggcaatcg ccgataaata cgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg tctccgatga agcaggctgg acgaaactgt tcgacaccac cgaggagacc 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttaaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgcc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc agcggctcga tgagctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccgcat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg tgggtatacc gcacagtga 759 <210> 16 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 16 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Met Gly Ile Gly Leu Ala Ile Ala Asp Lys Tyr Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Val 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Thr 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Lys Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Gln Arg Leu Asp Glu Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly Arg Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 17 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 17 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacaat gggtatcggt 60 ttggcaatcg ccgataaata cgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg tctccgatga agcaggctgg acgaaactgt tcgacaccac cgaggagacc 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttaaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgcc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc agcggctcga tgagctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtagtgccta tgggccgcat tggcgaaccg 660 aatgacgtcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg tgggtatacc gcacagtga 759 <210> 18 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 18 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Met Gly Ile Gly Leu Ala Ile Ala Asp Lys Tyr Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Val 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Thr 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Lys Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Gln Arg Leu Asp Glu Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Val Pro Met Gly Arg Ile Gly Glu Pro Asn Asp Val Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 19 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 19 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacaat gggtatcggt 60 ttggcaatcg ccgataaata cgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg tctccgatga agcaggctgg acgaaactgt tcgacaccac cgaggagacc 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttaaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgcc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgtccctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc agcggctcga tcagctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccgcat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg tgggtatacc gcacagtga 759 <210> 20 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 20 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Met Gly Ile Gly Leu Ala Ile Ala Asp Lys Tyr Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Val 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Thr 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Lys Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Ser Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Gln Arg Leu Asp Gln Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly Arg Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 21 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 21 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacaat gggtatcggt 60 ttggcaatcg ccgataaata cgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg tctccgatga agcaggctgg acgaaactgt tcgacaccac cgaggagacc 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttaaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcataca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 22 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 22 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Met Gly Ile Gly Leu Ala Ile Ala Asp Lys Tyr Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Val 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Thr 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Lys Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 23 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 23 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacaat gggtatcggt 60 ttggcaatcg ccgataaata cgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg tctccgatga agcaggctgg acgaaactgt tcgacaccac cgaggagacc 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttaaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 24 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 24 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Met Gly Ile Gly Leu Ala Ile Ala Asp Lys Tyr Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Val 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Thr 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Lys Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 25 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 25 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacaat gggtatcggt 60 ttggcaatcg ccgataaata cgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg tctccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttaaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc agcggctcga tgagctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccgcat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg tgggtatacc gcacagtga 759 <210> 26 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 26 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Met Gly Ile Gly Leu Ala Ile Ala Asp Lys Tyr Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Val 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Lys Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Gln Arg Leu Asp Glu Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly Arg Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 27 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 27 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacaat gggtatcggt 60 ttggcaatcg ccgataaata cgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg tctccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgcc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc agcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccgcat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 28 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 28 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Met Gly Ile Gly Leu Ala Ile Ala Asp Lys Tyr Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Val 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Gln Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly Arg Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 29 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 29 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacaat gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg tctccgatga agcaggctgg acgaaactgt tcgacaccac cgaggagacc 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttaaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccgcat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg tgggtatacc gcacagtga 759 <210> 30 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 30 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Met Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Val 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Thr 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Lys Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly Arg Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 31 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 31 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacaat gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttgt gcgctttgtc 180 cagcacgatg cgtccgatga agcaggctgg acgaaactgt tcgacaccac cgaggagacc 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcgattc gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaattcg tggtcgacgg cgggtatacc gcacagtga 759 <210> 32 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 32 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Met Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Val Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Thr 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Ile Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 33 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 33 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacaat gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttgt gcgctttgtc 180 cagcacgatg cgtccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggtt gattggcgat ccgacgctgg gggcgtacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggttt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg ttaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 34 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 34 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Met Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Val Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Ile Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Val Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Leu Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 35 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 35 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacaat gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttgt gcgctttgtc 180 cagcacgatg cgtccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggtt ggttggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 36 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 36 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Met Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Val Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 37 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 37 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttatcac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgaaga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttattaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaacta ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgcc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc agcggctcga tgagctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccgcat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg tgggtatacc gcacagtga 759 <210> 38 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 38 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Glu Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Ile 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Gln Arg Leu Asp Glu Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly Arg Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 39 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 39 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgtcat tcgctttgtc 180 cagcacgatg cgtccgaaga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttattaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggtccc atcaagaccc agcggctcga tgagctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcaacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 40 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 40 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Glu Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Ile 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Gln Arg Leu Asp Glu Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 41 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 41 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagttattaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgctgctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 42 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 42 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ile 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Leu Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 43 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 43 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagttgtgaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgctgctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 44 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 44 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Val 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Leu Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 45 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 45 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagttttaaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgctgctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 46 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 46 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Leu 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Leu Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 47 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 47 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg catccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg gagtttccaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgctgctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 48 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 48 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Gly Val Ser 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Leu Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 49 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 49 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg catccgatga agtgggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttgaa 300 gacactacca cggaggaatg gcataaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtaacatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagacct ctcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg atcaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaattcg tggtcgacgg cgggtatacc gcacagtga 759 <210> 50 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 50 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Val Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Asn Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Ser Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Ile Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 51 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 51 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgaaga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgagattaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgcc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc agcggctcga tgagctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccgcat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg tgggtatacc gcacagtga 759 <210> 52 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 52 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Glu Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Glu Ile 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Gln Arg Leu Asp Glu Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly Arg Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 53 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 53 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgaaga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttattaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctatccgtta atctggatgg tgtttttttc 360 ggcacccgcc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat gcgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc agcggctcga tgagctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccgcat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg tgggtatacc gcacagtga 759 <210> 54 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 54 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Glu Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Ile 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Ala Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Gln Arg Leu Asp Glu Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly Arg Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 55 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 55 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgaaga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttattaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgcc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc agcggctcga tcagctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccgcat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg tgggtatacc gcacagtga 759 <210> 56 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 56 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Glu Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Ile 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Gln Arg Leu Asp Gln Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly Arg Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 57 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 57 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgaaga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttattaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgcc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc agcggctcga tgagctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccgcat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg tgggtatacc gcacagtga 759 <210> 58 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 58 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Glu Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Ile 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Gln Arg Leu Asp Glu Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly Arg Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 59 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 59 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgaaga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttattaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgcc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgtctctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc agcggctcga tgagctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccgcat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg tgggtatacc gcacagtga 759 <210> 60 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 60 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Glu Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Ile 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Ser Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Gln Arg Leu Asp Glu Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly Arg Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 61 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 61 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgaaga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttattca tagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgcc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc agcggctcga tgagctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccgcat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg tgggtatacc gcacagtga 759 <210> 62 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 62 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Glu Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Ile 85 90 95 His Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Gln Arg Leu Asp Glu Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly Arg Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 63 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 63 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgaaga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttcaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 64 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 64 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Glu Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Gln Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 65 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 65 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgaaga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg ggcttgtgaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag tatcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 66 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 66 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Glu Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Gly Leu Val 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 67 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 67 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgaaga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg gggttattaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg ttaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 68 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 68 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Glu Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Gly Val Ile 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Leu Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 69 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 69 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgaaga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg gggttgtgaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 70 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 70 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Glu Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Gly Val Val 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 71 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 71 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgaaga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg gggttgtgaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgtcgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatggaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 72 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 72 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Glu Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Gly Val Val 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Ser Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Trp Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 73 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 73 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgaaga agcaggctgg acgaaactgt tcgacaccac cgaggaggtt 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttgtgaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg acaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 74 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 74 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Glu Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Val 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Val 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Thr Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 75 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 75 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgaaga agcaggctgg acgaaactgt tcgacaccac cgaggaggtt 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggattt gcgttttgaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg ttaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 76 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 76 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Glu Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Val 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Cys Val Leu 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Leu Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 77 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 77 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttgaa 300 gacactacca cggaggaatg gcataaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtaacatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc agcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc gcagcgtacg gtaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 78 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 78 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Asn Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Gln Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 79 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 79 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc agcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggacctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 80 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 80 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Gln Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Thr Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 81 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 81 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc agcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 82 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 82 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Gln Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 83 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 83 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 84 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 84 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 85 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 85 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagttacaaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 86 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 86 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Thr 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 87 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 87 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagttacaaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg ataaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 88 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 88 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Thr 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Ile Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 89 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 89 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagttacaaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgctgctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 90 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 90 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Thr 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Leu Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 91 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 91 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagttacaaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgctgctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtggacc gcacagtga 759 <210> 92 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 92 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Thr 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Leu Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Trp Thr Ala Gln 245 250 <210> 93 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 93 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagttacaaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgctgctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gttaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 94 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 94 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Thr 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Leu Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 95 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 95 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagttacaaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cggatctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 96 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 96 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Thr 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Asp Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 97 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 97 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagttacaaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc tgcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 98 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 98 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Thr 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Leu Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 99 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 99 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagttacaaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttttggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgctgctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg aaaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 100 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 100 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Thr 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Leu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Leu Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 101 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 101 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cagttacaaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggtgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgctgctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg attaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 102 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 102 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Thr 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Leu Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Ile Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 103 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 103 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggattt gcgttattaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgcggctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg acaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 104 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 104 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Cys Val Ile 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Thr Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 105 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 105 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgatga agcaggctgg acgaaactgt tcgacaccac cgaggaggtt 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggattg cggtgtgtaa aagcgttgaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgcgtctcga tgatctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 106 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 106 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Val 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Cys 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Arg Leu Asp Asp Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 107 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 107 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg cgtccgatga agtgggctgg acgaaactgt tcgacaccac cgaggaggca 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttaaa aagcgttgaa 300 gacactacca cggaggaatg gcataaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct tgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactttgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc cgcggctcga tgagctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccacat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg cgggtatacc gcacagtga 759 <210> 108 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 108 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Val Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp His Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Phe Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Pro Arg Leu Asp Glu Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 109 <211> 759 <212> DNA <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 109 atgaccgatc gtctgaagca taaagtagcc atcgtaaccg gcgggacact gggtatcggt 60 ttggcaatcg ccgataaatt tgtagaggag ggtgcgaaag tagttattac tggtcgtcac 120 gcggatgtag gtgaaaaggc cgccaaatca atcggcggca ctgatgttat tcgctttgtc 180 cagcacgatg tctccgatga agcaggctgg acgaaactgt tcgacaccac cgaggagacc 240 ttcggcccgg ttacgaccgt cgtgaacaat gcagggagtt gcgttttgaa aagcgttaaa 300 gacactacca cggaggaatg gcgtaaactg ctgtccgtta atctggatgg tgtttttttc 360 ggcacccgtc tgggcattca gcgcatgaaa aataaaggct tgggcgctag catcatcaat 420 atgagcagta ttgaggggct cgtaggcgat ccgacgctgg gggcatacaa cgcttccaag 480 ggggcggtac gtatcatgtc gaaaagcgca gcgctggatt gcgcactgaa ggactacgat 540 gtgcgtgtca acacagtaca tccgggcccc atcaagaccc agcggctcga tgagctggaa 600 ggttgggagg aaatgatgtc acagcgtacg gtaaccccta tgggccgcat tggcgaaccg 660 aatgacatcg catggatctg tgtgtacctg gcatctgacg aatcgaaatt tgcgacgggt 720 gcagaatttg tggtcgacgg tgggtatacc gcacagtga 759 <210> 110 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Variant of L. kefir <400> 110 Met Thr Asp Arg Leu Lys His Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Val 50 55 60 Ser Asp Glu Ala Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Thr 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ser Cys Val Leu 85 90 95 Lys Ser Val Lys Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Leu Val Gly Asp Pro Thr Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Pro Ile Lys 180 185 190 Thr Gln Arg Leu Asp Glu Leu Glu Gly Trp Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Val Thr Pro Met Gly Arg Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 111 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Engineered Ketoreductase Sequence Formula with L. brevis backbone <223> Synthetic Construct <220> <221> MISC_FEATURE <222>(7)..(7) <223> Xaa is a constrained or non-polar residue <220> <221> MISC_FEATURE <222>(17)..(17) <223> Xaa is a non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(25)..(25) <223> Xaa is a polar or acidic residue <220> <221> MISC_FEATURE <222>(27)..(27) <223> Xaa is an aromatic residue <220> <221> MISC_FEATURE <222>(41)..(41) <223> Xaa is a polar, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(53)..(53) <223> Xaa is a polar, non-polar, or acidic residue <220> <221> MISC_FEATURE <222>(57)..(57) <223> Xaa is a non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(64)..(64) <223> Xaa is a polar, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(66)..(66) <223> Xaa is an acidic residue <220> <221> MISC_FEATURE <222>(68)..(68) <223> Xaa is a polar, acidic, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(72)..(72) <223> Xaa is a basic residue <220> <221> MISC_FEATURE <222>(76)..(76) <223> Xaa is an aliphatic, non-polar, or polar residue <220> <221> MISC_FEATURE <222>(80)..(80) <223> Xaa is an aliphatic, non-polar, or polar residue <220> <221> MISC_FEATURE <222>(93)..(93) <223> Xaa is is a polar, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(94)..(94) <223> Xaa is a cysteine, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(95)..(95) <223> Xaa is an aliphatic, non-polar, or acidic residue <220> <221> MISC_FEATURE <222>(96)..(96) <223> Xaa is is a cyteine, polar, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(97)..(97) <223> Xaa is a constrained or polar residue <220> <221> MISC_FEATURE <222>(100)..(100) <223> Xaa is a basic, acidic, polar, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(108)..(108) <223> Xaa is a basic or constrained residue <220> <221> MISC_FEATURE <222>(111)..(111) <223> Xaa is a non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(139)..(139) <223> Xaa is a non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(145)..(145) <223> Xaa is an acidic, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(147)..(147) <223> Xaa is an aromatic, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(151)..(151) <223> Xaa is a constrained, non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(152)..(152) <223> Xaa is a polar, aromatic, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(163)..(163) <223> Xaa is a non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(165)..(165) <223> Xaa is a polar, non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(173)..(173) <223> Xaa is an acidic, non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(179)..(179) <223> Xaa is an aromatic, basic, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(190)..(190) <223> Xaa is a constrained residue <220> <221> MISC_FEATURE <222>(194)..(194) <223> Xaa is a constrained, polar, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(195)..(195) <223> Xaa is a basic, acidic, non-polar, or polar residue <220> <221> MISC_FEATURE <222>(196)..(196) <223> Xaa is a non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(197)..(197) <223> Xaa is an acidic residue <220> <221> MISC_FEATURE <222>(198)..(198) <223> Xaa is an acidic or polar residue <220> <221> MISC_FEATURE <222>(202)..(202) <223> Xaa is an aromatic residue <220> <221> MISC_FEATURE <222>(210)..(210) <223> Xaa is a polar or basic residue <220> <221> MISC_FEATURE <222>(211)..(211) <223> Xaa is is a basic, aliphatic, non-polar, acidic, or polar residue <220> <221> MISC_FEATURE <222>(212)..(212) <223> Xaa is a polar, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(216)..(216) <223> Xaa is a constrained or basic residue <220> <221> MISC_FEATURE <222>(223)..(223) <223> Xaa is a non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(226)..(226) <223> Xaa is a non-polar or polar residue <220> <221> MISC_FEATURE <222>(233)..(233) <223> Xaa is a polar or acidic residue <220> <221> MISC_FEATURE <222>(235)..(235) <223> Xaa is a polar or aromatic residue <220> <221> MISC_FEATURE <222>(248)..(248) <223> Xaa is a non-polar or aromatic residue <220> <221> MISC_FEATURE <222>(249)..(249) <223> Xaa is an aromatic residue <400> 111 Met Ser Asn Arg Leu Asp Xaa Lys Val Ala Ile Ile Thr Gly Gly Thr 1 5 10 15 Xaa Gly Ile Gly Leu Ala Ile Ala Xaa Lys Xaa Val Glu Glu Gly Ala 20 25 30 Lys Val Met Ile Thr Gly Arg His Xaa Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Val Gly Xaa Pro Asp Gln Xaa Gln Phe Phe Gln His Asp Xaa 50 55 60 Ser Xaa Glu Xaa Gly Trp Thr Xaa Leu Phe Asp Xaa Thr Glu Lys Xaa 65 70 75 80 Phe Gly Pro Val Ser Thr Leu Val Asn Asn Ala Gly Xaa Xaa Xaa Xaa 85 90 95 Xaa Ser Val Xaa Glu Thr Thr Thr Ala Glu Trp Xaa Lys Leu Xaa Ala 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Xaa Asn Met Ser Ser Ile 130 135 140 Xaa Gly Xaa Xaa Gly Asp Xaa Xaa Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Xaa Arg Xaa Met Ser Lys Ser Ala Ala Leu Xaa Cys Ala Leu 165 170 175 Lys Asp Xaa Asp Val Arg Val Asn Thr Val His Pro Gly Xaa Ile Lys 180 185 190 Thr Xaa Xaa Xaa Asp Xaa Leu Pro Gly Xaa Glu Glu Ala Met Ser Gln 195 200 205 Arg Xaa Xaa Xaa Pro Met Gly Xaa Ile Gly Glu Pro Asn Asp Xaa Ala 210 215 220 Tyr Xaa Cys Val Tyr Leu Ala Ser Xaa Glu Xaa Lys Phe Ala Thr Gly 225 230 235 240 Ser Glu Phe Val Val Asp Gly Xaa Xaa Thr Ala Gln 245 250 <210> 112 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Engineered Ketoreductase Sequence Formula with L. kefir backbone <223> Synthetic Construct <220> <221> MISC_FEATURE <222>(7)..(7) <223> Xaa is a constrained or non-polar residue <220> <221> MISC_FEATURE <222>(17)..(17) <223> Xaa is a non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(25)..(25) <223> Xaa is a polar or acidic residue <220> <221> MISC_FEATURE <222>(27)..(27) <223> Xaa is an aromatic residue <220> <221> MISC_FEATURE <222>(41)..(41) <223> Xaa is a polar, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(53)..(53) <223> Xaa is a polar, non-polar, or acidic residue <220> <221> MISC_FEATURE <222>(57)..(57) <223> Xaa is a non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(64)..(64) <223> Xaa is a polar, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(66)..(66) <223> Xaa is an acidic residue <220> <221> MISC_FEATURE <222>(68)..(68) <223> Xaa is a polar, acidic, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(72)..(72) <223> Xaa is a basic residue <220> <221> MISC_FEATURE <222>(76)..(76) <223> Xaa is an aliphatic, non-polar, or polar residue <220> <221> MISC_FEATURE <222>(80)..(80) <223> Xaa is an aliphatic, non-polar, or polar residue <220> <221> MISC_FEATURE <222>(93)..(93) <223> Xaa is is a polar, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(94)..(94) <223> Xaa is a cysteine, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(95)..(95) <223> Xaa is an aliphatic, non-polar, or acidic residue <220> <221> MISC_FEATURE <222>(96)..(96) <223> Xaa is is a cyteine, polar, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(97)..(97) <223> Xaa is a constrained or polar residue <220> <221> MISC_FEATURE <222>(100)..(100) <223> Xaa is a basic, acidic, polar, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(108)..(108) <223> Xaa is a basic or constrained residue <220> <221> MISC_FEATURE <222>(111)..(111) <223> Xaa is a non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(139)..(139) <223> Xaa is a non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(145)..(145) <223> Xaa is an acidic, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(147)..(147) <223> Xaa is an aromatic, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(151)..(151) <223> Xaa is a constrained, non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(152)..(152) <223> Xaa is a polar, aromatic, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(163)..(163) <223> Xaa is a non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(165)..(165) <223> Xaa is a polar, non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(173)..(173) <223> Xaa is an acidic, non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(179)..(179) <223> Xaa is an aromatic, basic, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(190)..(190) <223> Xaa is a constrained residue <220> <221> MISC_FEATURE <222>(194)..(194) <223> Xaa is a constrained, polar, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(195)..(195) <223> Xaa is a basic, acidic, non-polar, or polar residue <220> <221> MISC_FEATURE <222>(196)..(196) <223> Xaa is a non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(197)..(197) <223> Xaa is an acidic residue <220> <221> MISC_FEATURE <222>(198)..(198) <223> Xaa is an acidic or polar residue <220> <221> MISC_FEATURE <222>(202)..(202) <223> Xaa is an aromatic residue <220> <221> MISC_FEATURE <222>(210)..(210) <223> Xaa is a polar or basic residue <220> <221> MISC_FEATURE <222>(211)..(211) <223> Xaa is is a basic, aliphatic, non-polar, acidic, or polar residue <220> <221> MISC_FEATURE <222>(212)..(212) <223> Xaa is a polar, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(216)..(216) <223> Xaa is a constrained or basic residue <220> <221> MISC_FEATURE <222>(223)..(223) <223> Xaa is a non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(226)..(226) <223> Xaa is a non-polar or polar residue <220> <221> MISC_FEATURE <222>(233)..(233) <223> Xaa is a polar or acidic residue <220> <221> MISC_FEATURE <222>(235)..(235) <223> Xaa is a polar or aromatic residue <220> <221> MISC_FEATURE <222>(248)..(248) <223> Xaa is a non-polar or aromatic residue <220> <221> MISC_FEATURE <222>(249)..(249) <223> Xaa is an aromatic residue <400> 112 Met Thr Asp Arg Leu Lys Xaa Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Xaa Gly Ile Gly Leu Ala Ile Ala Xaa Lys Xaa Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Xaa Asp Val Gly Glu Lys Ala Ala 35 40 45 Lys Ser Ile Gly Xaa Thr Asp Val Xaa Arg Phe Val Gln His Asp Xaa 50 55 60 Ser Xaa Glu Xaa Gly Trp Thr Xaa Leu Phe Asp Xaa Thr Glu Glu Xaa 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Xaa Xaa Xaa Xaa 85 90 95 Xaa Ser Val Xaa Asp Thr Thr Thr Glu Glu Trp Xaa Lys Leu Xaa Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Xaa Asn Met Ser Ser Ile 130 135 140 Xaa Gly Xaa Xaa Gly Asp Xaa Xaa Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Xaa Arg Xaa Met Ser Lys Ser Ala Ala Leu Xaa Cys Ala Leu 165 170 175 Lys Asp Xaa Asp Val Arg Val Asn Thr Val His Pro Gly Xaa Ile Lys 180 185 190 Thr Xaa Xaa Xaa Xaa Xaa Leu Glu Gly Xaa Glu Glu Met Met Ser Gln 195 200 205 Arg Xaa Xaa Xaa Pro Met Gly Xaa Ile Gly Glu Pro Asn Asp Xaa Ala 210 215 220 Trp Xaa Cys Val Tyr Leu Ala Ser Xaa Glu Xaa Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Xaa Xaa Thr Ala Gln 245 250 <210> 113 <211> 759 <212> DNA <213> Lactobacillus Minor <400> 113 atgaccgatc ggttgaaggg gaaagtagca attgtaactg gcggtacctt gggaattggc 60 ttggcaatcg ctgataagtt tgttgaagaa ggcgcaaagg ttgttattac cggccgtcac 120 gctgatgtag gtgaaaaagc tgccagatca atcggcggca cagacgttat ccgttttgtc 180 caacacgatg cttctgatga aaccggctgg actaagttgt ttgatacgac tgaagaagca 240 tttggcccag ttaccacggt tgtcaacaat gccggaattg cggtcagcaa gagtgttgaa 300 gataccacaa ctgaagaatg gcgcaagctg ctctcagtta acttggatgg tgtcttcttc 360 ggtacccgtc ttggaatcca acgtatgaag aataaaggac tcggagcatc aatcatcaat 420 atgtcatcta tcgaaggttt tgttggtgat ccagctctgg gtgcatacaa cgcttcaaaa 480 ggtgctgtca gaattatgtc taaatcagct gccttggatt gcgctttgaa ggactacgat 540 gttcgggtta acactgttca tccaggttat atcaagacac cattggttga cgatcttgaa 600 ggggcagaag aaatgatgtc acagcggacc aagacaccaa tgggtcatat cggtgaacct 660 aacgatatcg cttggatctg tgtttacctg gcatctgacg aatctaaatt tgccactggt 720 gcagaattcg ttgtcgacgg agggtacacc gcccaatag 759 <210> 114 <211> 252 <212> PRT <213> Lactobacillus Minor <400> 114 Met Thr Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Ala Asp Val Gly Glu Lys Ala Ala 35 40 45 Arg Ser Ile Gly Gly Thr Asp Val Ile Arg Phe Val Gln His Asp Ala 50 55 60 Ser Asp Glu Thr Gly Trp Thr Lys Leu Phe Asp Thr Thr Glu Glu Ala 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Ile Ala Val Ser 85 90 95 Lys Ser Val Glu Asp Thr Thr Thr Glu Glu Trp Arg Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Glu Gly Phe Val Gly Asp Pro Ala Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Tyr Asp Val Arg Val Asn Thr Val His Pro Gly Tyr Ile Lys 180 185 190 Thr Pro Leu Val Asp Asp Leu Glu Gly Ala Glu Glu Met Met Ser Gln 195 200 205 Arg Thr Lys Thr Pro Met Gly His Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Asp Glu Ser Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Gly Tyr Thr Ala Gln 245 250 <210> 115 <211> 1050 <212> DNA <213> Artificial Sequence <220> <223> Codon optimized version of the adh gene from Aspergillus flavus <400> 115 atgtctattc cggaaatgca atgggctcaa gtagcggagc agaaaggcgg tccgctgatt 60 tacaaacaga ttccggttcc gaaaccgggc ccggacgaaa tcctggtaaa agtgcgttac 120 tctggtgtgt gccacacgga tctgcacgcg ctgaaaggtg actggccact gcctgtgaaa 180 atgccactgg tgggtggcca tgagggcgcg ggtgttgtcg tcgctcgtgg cgatctggtt 240 actgagttcg aaattggtga ccatgctggc ctgaaatggc tgaacggtag ctgcctggca 300 tgcgagttct gtaaacaggc tgacgaaccg ctgtgcccta acgcgagcct gtctggttat 360 actgtagatg gtactttcca gcagtatgcc attggcaaag ccacccatgc gagcaagctg 420 ccgaaaaacg tgcctctgga tgccgtggca ccggttctgt gcgcgggcat taccgtatac 480 aagggcctga aagaaagcgg tgttcgtcct ggccaaaccg ttgcgatcgt aggtgcgggt 540 ggtggtctgg gctccctggc gctgcagtac gcgaaagcta tgggtattcg cgtggtggcg 600 attgatggcg gtgaagagaa acaagcgatg tgtgaacagc tgggcgcaga agcctacgtt 660 gactttacca aaacgcaaga tctggtagca gatgttaagg ccgccacccc tgaaggtctg 720 ggcgcgcatg cggtaattct gctggcggtc gccgaaaaac catttcagca ggcggccgaa 780 tatgtcagcc gtggtacggt ggttgccatt ggtctgccgg cgggcgcatt cctgcgcgcg 840 ccggtgttta acactgtggt tcgtatgatt aacattaagg gtagctacgt tggcaaccgc 900 caggacggcg ttgaggcagt ggacttcttc gcgcgcggcc tgatcaaagc gccgttcaaa 960 accgctcctc tgcaagatct gccgaaaatc ttcgaactga tggaacaagg taagattgca 1020 ggtcgctacg ttctggaaat cccggaatga 1050 <210> 116 <211> 349 <212> PRT <213> Artificial Sequence <220> <223> The adh from Aspergillus flavus <400> 116 Met Ser Ile Pro Glu Met Gln Trp Ala Gln Val Ala Glu Gln Lys Gly 1 5 10 15 Gly Pro Leu Ile Tyr Lys Gln Ile Pro Val Pro Lys Pro Gly Pro Asp 20 25 30 Glu Ile Leu Val Lys Val Arg Tyr Ser Gly Val Cys His Thr Asp Leu 35 40 45 His Ala Leu Lys Gly Asp Trp Pro Leu Pro Val Lys Met Pro Leu Val 50 55 60 Gly Gly His Glu Gly Ala Gly Val Val Val Ala Arg Gly Asp Leu Val 65 70 75 80 Thr Glu Phe Glu Ile Gly Asp His Ala Gly Leu Lys Trp Leu Asn Gly 85 90 95 Ser Cys Leu Ala Cys Glu Phe Cys Lys Gln Ala Asp Glu Pro Leu Cys 100 105 110 Pro Asn Ala Ser Leu Ser Gly Tyr Thr Val Asp Gly Thr Phe Gln Gln 115 120 125 Tyr Ala Ile Gly Lys Ala Thr His Ala Ser Lys Leu Pro Lys Asn Val 130 135 140 Pro Leu Asp Ala Val Ala Pro Val Leu Cys Ala Gly Ile Thr Val Tyr 145 150 155 160 Lys Gly Leu Lys Glu Ser Gly Val Arg Pro Gly Gln Thr Val Ala Ile 165 170 175 Val Gly Ala Gly Gly Gly Leu Gly Ser Leu Ala Leu Gln Tyr Ala Lys 180 185 190 Ala Met Gly Ile Arg Val Val Ala Ile Asp Gly Gly Glu Glu Lys Gln 195 200 205 Ala Met Cys Glu Gln Leu Gly Ala Glu Ala Tyr Val Asp Phe Thr Lys 210 215 220 Thr Gln Asp Leu Val Ala Asp Val Lys Ala Ala Thr Pro Glu Gly Leu 225 230 235 240 Gly Ala His Ala Val Ile Leu Leu Ala Val Ala Glu Lys Pro Phe Gln 245 250 255 Gln Ala Ala Glu Tyr Val Ser Arg Gly Thr Val Val Ala Ile Gly Leu 260 265 270 Pro Ala Gly Ala Phe Leu Arg Ala Pro Val Phe Asn Thr Val Val Arg 275 280 285 Met Ile Asn Ile Lys Gly Ser Tyr Val Gly Asn Arg Gln Asp Gly Val 290 295 300 Glu Ala Val Asp Phe Phe Ala Arg Gly Leu Ile Lys Ala Pro Phe Lys 305 310 315 320 Thr Ala Pro Leu Gln Asp Leu Pro Lys Ile Phe Glu Leu Met Glu Gln 325 330 335 Gly Lys Ile Ala Gly Arg Tyr Val Leu Glu Ile Pro Glu 340 345 <210> 117 <211> 729 <212> DNA <213> Artificial Sequence <220> <223> Codon optimized version of the adh gene from Oenococcus oeni <400> 117 atgtttgatc gcctgaaggg taaggtggcg atcgtcaccg gcggtaatag cggtattggt 60 aaggcaatcg cggcagactt catcgccgag ggcgcgaaag tagtgattac cggtcgcaac 120 caagagaagg gtcgccagac tgcgctggaa atcgccggtg acattctgtt cattcagcag 180 gacgtgagcc aggaggcgga ctggcagaaa gttatctcca aaaccatcga gaagttcggt 240 aagtttgata ttctggttaa caacgctggc gtcggcggcg tgggtaagcc actggcagaa 300 atgtccctgt ctgaattcaa ttggacccaa tccattaatc tgtccggtaa cttcctgggt 360 attcacttcg cgctgaacaa aatgaccgaa cctggtagca ttattgacgt aagcagcgcg 420 gctggcctgc gtggttttcc gggcgcagcc gattatagcg cttccaaagg tggtacgcgt 480 ctgctgacgc gcgccgcggc gctggaagcg ctgcaaatgg gtaaaaagat ccgtgtaaac 540 tctattcacc caggttggat tgataccgat atcgtaccaa aagatatgcg tgagcaggtt 600 atcgcgatga cccctatgca tcacctgggc caaccgaaag atattgccaa gctggcgacg 660 tatctggcat ctgacgagtc cgagtatact acgggctccg aactggcagc cgacggcggt 720 ctgatggca 729 <210> 118 <211> 243 <212> PRT <213> Artificial Sequence <220> <223> The adh from Oenococcus oeni <400> 118 Met Phe Asp Arg Leu Lys Gly Lys Val Ala Ile Val Thr Gly Gly Asn 1 5 10 15 Ser Gly Ile Gly Lys Ala Ile Ala Ala Asp Phe Ile Ala Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg Asn Gln Glu Lys Gly Arg Gln Thr Ala 35 40 45 Leu Glu Ile Ala Gly Asp Ile Leu Phe Ile Gln Gln Asp Val Ser Gln 50 55 60 Glu Ala Asp Trp Gln Lys Val Ile Ser Lys Thr Ile Glu Lys Phe Gly 65 70 75 80 Lys Phe Asp Ile Leu Val Asn Asn Ala Gly Val Gly Gly Val Gly Lys 85 90 95 Pro Leu Ala Glu Met Ser Leu Ser Glu Phe Asn Trp Thr Gln Ser Ile 100 105 110 Asn Leu Ser Gly Asn Phe Leu Gly Ile His Phe Ala Leu Asn Lys Met 115 120 125 Thr Glu Pro Gly Ser Ile Ile Asp Val Ser Ser Ala Ala Gly Leu Arg 130 135 140 Gly Phe Pro Gly Ala Ala Asp Tyr Ser Ala Ser Lys Gly Gly Thr Arg 145 150 155 160 Leu Leu Thr Arg Ala Ala Ala Leu Glu Ala Leu Gln Met Gly Lys Lys 165 170 175 Ile Arg Val Asn Ser Ile His Pro Gly Trp Ile Asp Thr Asp Ile Val 180 185 190 Pro Lys Asp Met Arg Glu Gln Val Ile Ala Met Thr Pro Met His His 195 200 205 Leu Gly Gln Pro Lys Asp Ile Ala Lys Leu Ala Thr Tyr Leu Ala Ser 210 215 220 Asp Glu Ser Glu Tyr Thr Thr Gly Ser Glu Leu Ala Ala Asp Gly Gly 225 230 235 240 Leu Met Ala <210> 119 <211> 768 <212> DNA <213> Artificial Sequence <220> <223> Codon optimized version of the adh gene from Ralstonia eutropha <400> 119 atgcagggca aaattgcact ggttacgggc ggtgcgtctg gtatgggtct ggccttcacc 60 cgtcgcctgg cccaagaagg cgcacgtgtt tacttcaccg acattaacgg cgccgcgggt 120 cacgcgacgg aaagcgagct gcagggtgct ggtctggcgg tcgtattcct gcgtcatgac 180 gtgacccagg aaaacgactg gctgcgcgtc ctggaacata ttggcgctgt tgacggtcgc 240 ctggatgtac tggtgaataa tgccggcatt gcgatttctc acaacattga gacttgtact 300 actgaggatt ttgatcgcac gctgaatgtt aacctgaagt ccgtgtttct gggctgcaaa 360 cacggtctgg ctctgatgaa acagaagggt ggcagcatca ttaacgttag ctctatcacc 420 gcgatttgcg gcgaacctgt ggcgctggcg tatagcgcta gcaaagccgg cgtccgtttt 480 ctgagcaagt ctgttgccct gcattgtgcg gagaagggct acgccatccg tgttaacagc 540 ctgcacccgg gttacattga taccccgctg ctggcaggca gcaacgcggg tggctccctg 600 accgctgacg aggtaaccgc gagccgtgta cgtattggcg gtgaaattcc gctgaaacgt 660 cgcggcaccc cggacgaagt tgcaggcgcg gttctgtacc tggctagcga tgaatccacc 720 tatgttactg gtactgagct ggtaattgat ggcggctacg catgtcat 768 <210> 120 <211> 256 <212> PRT <213> Artificial Sequence <220> <223> The adh from Ralstonia eutropha <400> 120 Met Gln Gly Lys Ile Ala Leu Val Thr Gly Gly Ala Ser Gly Met Gly 1 5 10 15 Leu Ala Phe Thr Arg Arg Leu Ala Gln Glu Gly Ala Arg Val Tyr Phe 20 25 30 Thr Asp Ile Asn Gly Ala Ala Gly His Ala Thr Glu Ser Glu Leu Gln 35 40 45 Gly Ala Gly Leu Ala Val Val Phe Leu Arg His Asp Val Thr Gln Glu 50 55 60 Asn Asp Trp Leu Arg Val Leu Glu His Ile Gly Ala Val Asp Gly Arg 65 70 75 80 Leu Asp Val Leu Val Asn Asn Ala Gly Ile Ala Ile Ser His Asn Ile 85 90 95 Glu Thr Cys Thr Thr Glu Asp Phe Asp Arg Thr Leu Asn Val Asn Leu 100 105 110 Lys Ser Val Phe Leu Gly Cys Lys His Gly Leu Ala Leu Met Lys Gln 115 120 125 Lys Gly Gly Ser Ile Ile Asn Val Ser Ser Ile Thr Ala Ile Cys Gly 130 135 140 Glu Pro Val Ala Leu Ala Tyr Ser Ala Ser Lys Ala Gly Val Arg Phe 145 150 155 160 Leu Ser Lys Ser Val Ala Leu His Cys Ala Glu Lys Gly Tyr Ala Ile 165 170 175 Arg Val Asn Ser Leu His Pro Gly Tyr Ile Asp Thr Pro Leu Leu Ala 180 185 190 Gly Ser Asn Ala Gly Gly Ser Leu Thr Ala Asp Glu Val Thr Ala Ser 195 200 205 Arg Val Arg Ile Gly Gly Glu Ile Pro Leu Lys Arg Arg Gly Thr Pro 210 215 220 Asp Glu Val Ala Gly Ala Val Leu Tyr Leu Ala Ser Asp Glu Ser Thr 225 230 235 240 Tyr Val Thr Gly Thr Glu Leu Val Ile Asp Gly Gly Tyr Ala Cys His 245 250 255 <210> 121 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> YDL ADH from Saccharomyces cervisiae <400> 121 atgtcttttc accaacagtt tttcacgctg aacaacggca ataaaatccc ggcgattgcc 60 atcatcggca ctggtacacg ttggtataaa aatgaagaaa ctgacgcgac cttctccaat 120 agtctggttg aacaaatcgt gtatgcgttg aaactgccgg ggattatcca catcgacgcc 180 gcggagattt atcgcaccta cccggaagtg ggtaaagcac tgtccctgac cgaaaagcct 240 cgtaacgcga tttttctgac ggataaatat tctccgcaga ttaaaatgag tgactcccct 300 gcggacggtc tggatttagc attgaagaaa atgggtacag attatgttga tttatatctg 360 ttacattccc cgtttgtttc gaaggaagtg aatggcttaa gcttagaaga ggcttggaaa 420 gatatggagc agttatacaa aagtggtaaa gctaaaaaca tcggggtttc caatttcgca 480 gtggaagacc tgcaacgtat cctgaaagtc gctgaagtta aacctcaggt caaccagatt 540 gagttctctc cgttcctgca aaaccaaaca ccaggcattt ataaattctg tcaggagcac 600 gatatcctgg tggaagcata ttctccgctg ggcccgctgc agaagaaaac cgcgcaggat 660 gacagccaac cattttttga gtacgtcaaa gaattgagcg aaaaatacat caaatccgag 720 gcccagatca tcctgcgctg ggtcactaaa cgcggtgtgc tgccagttac cacctcttca 780 aagcctcagc gcattagcga tgctcagaac ctgttttcct tcgacctgac agcggaagag 840 gttgataaaa tcacggagct gggtctggaa catgaaccgc tgcgcctgta ctggaataaa 900 ttgtatggca aatataacta cgccgcccag aaagtgtaa 939 <210> 122 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> YDL ADH from Saccharomyces cervisiae <400> 122 Met Ser Phe His Gln Gln Phe Phe Thr Leu Asn Asn Gly Asn Lys Ile 1 5 10 15 Pro Ala Ile Ala Ile Ile Gly Thr Gly Thr Arg Trp Tyr Lys Asn Glu 20 25 30 Glu Thr Asp Ala Thr Phe Ser Asn Ser Leu Val Glu Gln Ile Val Tyr 35 40 45 Ala Leu Lys Leu Pro Gly Ile Ile His Ile Asp Ala Ala Glu Ile Tyr 50 55 60 Arg Thr Tyr Pro Glu Val Gly Lys Ala Leu Ser Leu Thr Glu Lys Pro 65 70 75 80 Arg Asn Ala Ile Phe Leu Thr Asp Lys Tyr Ser Pro Gln Ile Lys Met 85 90 95 Ser Asp Ser Pro Ala Asp Gly Leu Asp Leu Ala Leu Lys Lys Met Gly 100 105 110 Thr Asp Tyr Val Asp Leu Tyr Leu Leu His Ser Pro Phe Val Ser Lys 115 120 125 Glu Val Asn Gly Leu Ser Leu Glu Glu Ala Trp Lys Asp Met Glu Gln 130 135 140 Leu Tyr Lys Ser Gly Lys Ala Lys Asn Ile Gly Val Ser Asn Phe Ala 145 150 155 160 Val Glu Asp Leu Gln Arg Ile Leu Lys Val Ala Glu Val Lys Pro Gln 165 170 175 Val Asn Gln Ile Glu Phe Ser Pro Phe Leu Gln Asn Gln Thr Pro Gly 180 185 190 Ile Tyr Lys Phe Cys Gln Glu His Asp Ile Leu Val Glu Ala Tyr Ser 195 200 205 Pro Leu Gly Pro Leu Gln Lys Lys Thr Ala Gln Asp Asp Ser Gln Pro 210 215 220 Phe Phe Glu Tyr Val Lys Glu Leu Ser Glu Lys Tyr Ile Lys Ser Glu 225 230 235 240 Ala Gln Ile Ile Leu Arg Trp Val Thr Lys Arg Gly Val Leu Pro Val 245 250 255 Thr Thr Ser Ser Lys Pro Gln Arg Ile Ser Asp Ala Gln Asn Leu Phe 260 265 270 Ser Phe Asp Leu Thr Ala Glu Glu Val Asp Lys Ile Thr Glu Leu Gly 275 280 285 Leu Glu His Glu Pro Leu Arg Leu Tyr Trp Asn Lys Leu Tyr Gly Lys 290 295 300 Tyr Asn Tyr Ala Ala Gln Lys Val 305 310 <210> 123 <211> 1047 <212> DNA <213> Artificial Sequence <220> <223> ADH from Rhodococcus erythropolis <400> 123 atgaaagcca ttcagtacac tcgtatcggt gcggaaccag aactgactga aatcccgaag 60 ccggaaccgg gcccgggcga agtactgctg gaagtcacgg cagctggcgt gtgccattcc 120 gatgatttca ttatgtctct gccggaagaa cagtacacct acggcctgcc gctgaccctg 180 ggtcatgaag gtgctggtaa agttgccgca gttggcgaag gtgttgaagg gttggatatt 240 ggcaccaatg tggttgtgta cggcccatgg ggttgtggca actgttggca ttgcagtcag 300 ggcctggaga actattgctc ccgtgcgcag gaactgggta ttaacccgcc tggtctgggt 360 gctccggggg ctttggcaga atttatgatt gtcgactcac cacgtcattt ggtcccgatt 420 ggcgatttag accctgttaa aactgttccg ttgactgatg cgggcctgac cccataccat 480 gcaatcaaac gctccctgcc gaaactgcgc ggcggctctt atgcagtagt gatcggtacg 540 ggtggcctgg gccacgtggc tatccaactg ctgcgtcatt tatctgctgc aacggtgatc 600 gccttggacg tttctgccga taaactggaa ctggctacca aagtcggcgc acatgaagta 660 gtcctgtctg ataaagatgc agcggagaat gtgcgtaaaa ttactggtag ccaaggtgca 720 gctttggtgt tggattttgt gggctatcag cctaccattg acaccgccat ggcagtggcg 780 ggcgtgggct ctgacgtcac cattgttggt atcggtgatg gccaggcaca tgcgaaagtt 840 ggtttcttcc agagtcctta tgaggcatcg gttacggtac cttattgggg cgctcgtaat 900 gaactgatcg aattgatcga tctggcgcat gctggtattt tcgacattgc cgttgagacc 960 ttctctttgg ataatggtgc agaggcctat cgtcgcctgg ctgcgggcac actgtcaggc 1020 cgtgcggtag tcgtcccggg cctgtaa 1047 <210> 124 <211> 348 <212> PRT <213> Artificial Sequence <220> <223> ADH from Rhodococcus erythropolis <400> 124 Met Lys Ala Ile Gln Tyr Thr Arg Ile Gly Ala Glu Pro Glu Leu Thr 1 5 10 15 Glu Ile Pro Lys Pro Glu Pro Gly Pro Gly Glu Val Leu Leu Glu Val 20 25 30 Thr Ala Ala Gly Val Cys His Ser Asp Asp Phe Ile Met Ser Leu Pro 35 40 45 Glu Glu Gln Tyr Thr Tyr Gly Leu Pro Leu Thr Leu Gly His Glu Gly 50 55 60 Ala Gly Lys Val Ala Ala Val Gly Glu Gly Val Glu Gly Leu Asp Ile 65 70 75 80 Gly Thr Asn Val Val Val Tyr Gly Pro Trp Gly Cys Gly Asn Cys Trp 85 90 95 His Cys Ser Gln Gly Leu Glu Asn Tyr Cys Ser Arg Ala Gln Glu Leu 100 105 110 Gly Ile Asn Pro Pro Gly Leu Gly Ala Pro Gly Ala Leu Ala Glu Phe 115 120 125 Met Ile Val Asp Ser Pro Arg His Leu Val Pro Ile Gly Asp Leu Asp 130 135 140 Pro Val Lys Thr Val Pro Leu Thr Asp Ala Gly Leu Thr Pro Tyr His 145 150 155 160 Ala Ile Lys Arg Ser Leu Pro Lys Leu Arg Gly Gly Ser Tyr Ala Val 165 170 175 Val Ile Gly Thr Gly Gly Leu Gly His Val Ala Ile Gln Leu Leu Arg 180 185 190 His Leu Ser Ala Ala Thr Val Ile Ala Leu Asp Val Ser Ala Asp Lys 195 200 205 Leu Glu Leu Ala Thr Lys Val Gly Ala His Glu Val Val Leu Ser Asp 210 215 220 Lys Asp Ala Ala Glu Asn Val Arg Lys Ile Thr Gly Ser Gln Gly Ala 225 230 235 240 Ala Leu Val Leu Asp Phe Val Gly Tyr Gln Pro Thr Ile Asp Thr Ala 245 250 255 Met Ala Val Ala Gly Val Gly Ser Asp Val Thr Ile Val Gly Ile Gly 260 265 270 Asp Gly Gln Ala His Ala Lys Val Gly Phe Phe Gln Ser Pro Tyr Glu 275 280 285 Ala Ser Val Thr Val Pro Tyr Trp Gly Ala Arg Asn Glu Leu Ile Glu 290 295 300 Leu Ile Asp Leu Ala His Ala Gly Ile Phe Asp Ile Ala Val Glu Thr 305 310 315 320 Phe Ser Leu Asp Asn Gly Ala Glu Ala Tyr Arg Arg Leu Ala Ala Gly 325 330 335 Thr Leu Ser Gly Arg Ala Val Val Val Pro Gly Leu 340 345 <210> 125 <211> 1047 <212> DNA <213> Artificial Sequence <220> <223> YGL ADH from Saccharomyces cervisiae <400> 125 atgaccacgg aaaaaaccgt agtgttcgtg tcaggcgcga ccggttttat tgctctgcac 60 gtggtagatg acctgctgaa aactggttac aaagtaattg gttccggtcg ttctcaggaa 120 aaaaatgacg gtttgctgaa gaagttcaag tccaacccga atctgagcat ggaaattgtg 180 gaagatattg cggcaccaaa cgccttcgat aaagtattcc agaaacatgg taaagaaatt 240 aaagtggtcc tgcatatcgc gtccccggtc catttcaaca ctaccgattt cgaaaaagac 300 ttactgatcc cggcggtaaa cggtaccaaa tctattttgg aagcaattaa gaactatgcc 360 gcagacaccg tggaaaaagt ggttattact tcatctgttg ccgcgttggc ctctccgggt 420 gatatgaaag ataccagctt cgtggttaac gaagaatcct ggaataaaga cacctgggaa 480 tcgtgtcagg cgaatgctgt gtccgcttat tgcggttcta aaaaattcgc agagaaaacg 540 gcgtgggact tcttggaaga aaaccagagc agcattaaat ttactctgtc cacgattaac 600 ccaggcttcg tttttggtcc gcagctgttc gccgactcct tgcgcaatgg tattaactct 660 agcagtgcga ttattgcgaa cctggtgtcg tataaattag gggataactt ctacaattat 720 agcggcccgt ttatcgacgt ccgtgacgtt tccaaagctc atctgctggc atttgagaaa 780 cctgaatgcg ccggtcagcg cctgtttctg tgcgaggata tgttctgttc ccaggaagcc 840 ctggacattc tgaacgaaga atttccacag ctgaagggca agatcgcaac gggcgaacct 900 ggcagcggct cgaccttcct gactaaaaat tgttgcaaat gcgacaatcg taaaactaaa 960 aacttgctgg gcttccagtt caacaaattc cgcgactgca ttgtcgatac tgcgtcccag 1020 ttgctggaag tgcaaagcaa aagctaa 1047 <210> 126 <211> 348 <212> PRT <213> Artificial Sequence <220> <223> YGL ADH from Saccharomyces cervisiae <400> 126 Met Thr Thr Glu Lys Thr Val Val Phe Val Ser Gly Ala Thr Gly Phe 1 5 10 15 Ile Ala Leu His Val Val Asp Asp Leu Leu Lys Thr Gly Tyr Lys Val 20 25 30 Ile Gly Ser Gly Arg Ser Gln Glu Lys Asn Asp Gly Leu Leu Lys Lys 35 40 45 Phe Lys Ser Asn Pro Asn Leu Ser Met Glu Ile Val Glu Asp Ile Ala 50 55 60 Ala Pro Asn Ala Phe Asp Lys Val Phe Gln Lys His Gly Lys Glu Ile 65 70 75 80 Lys Val Val Leu His Ile Ala Ser Pro Val His Phe Asn Thr Thr Asp 85 90 95 Phe Glu Lys Asp Leu Leu Ile Pro Ala Val Asn Gly Thr Lys Ser Ile 100 105 110 Leu Glu Ala Ile Lys Asn Tyr Ala Ala Asp Thr Val Glu Lys Val Val 115 120 125 Ile Thr Ser Ser Val Ala Ala Leu Ala Ser Pro Gly Asp Met Lys Asp 130 135 140 Thr Ser Phe Val Val Asn Glu Glu Ser Trp Asn Lys Asp Thr Trp Glu 145 150 155 160 Ser Cys Gln Ala Asn Ala Val Ser Ala Tyr Cys Gly Ser Lys Lys Phe 165 170 175 Ala Glu Lys Thr Ala Trp Asp Phe Leu Glu Glu Asn Gln Ser Ser Ile 180 185 190 Lys Phe Thr Leu Ser Thr Ile Asn Pro Gly Phe Val Phe Gly Pro Gln 195 200 205 Leu Phe Ala Asp Ser Leu Arg Asn Gly Ile Asn Ser Ser Ser Ala Ile 210 215 220 Ile Ala Asn Leu Val Ser Tyr Lys Leu Gly Asp Asn Phe Tyr Asn Tyr 225 230 235 240 Ser Gly Pro Phe Ile Asp Val Arg Asp Val Ser Lys Ala His Leu Leu 245 250 255 Ala Phe Glu Lys Pro Glu Cys Ala Gly Gln Arg Leu Phe Leu Cys Glu 260 265 270 Asp Met Phe Cys Ser Gln Glu Ala Leu Asp Ile Leu Asn Glu Glu Phe 275 280 285 Pro Gln Leu Lys Gly Lys Ile Ala Thr Gly Glu Pro Gly Ser Gly Ser 290 295 300 Thr Phe Leu Thr Lys Asn Cys Cys Lys Cys Asp Asn Arg Lys Thr Lys 305 310 315 320 Asn Leu Leu Gly Phe Gln Phe Asn Lys Phe Arg Asp Cys Ile Val Asp 325 330 335 Thr Ala Ser Gln Leu Leu Glu Val Gln Ser Lys Ser 340 345 <210> 127 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> YPR ADH from Saccharomyces cervisiae <400> 127 atgccggcaa cgttaaaaaa cagcagtgct accttaaaat taaacacagg tgcgagcatt 60 cctgtcctgg ggttcggcac ctggcgctct gtcgataaca acggctatca tagtgtaatt 120 gcggcgctga aagcggggta ccgtcatatc gatgctgcgg ccatctatct gaatgaagaa 180 gaagtcggcc gtgcgatcaa ggactccggt gttcctcgtg aagaaatttt tattaccacc 240 aaactgtggg gcaccgaaca acgcgatcca gaagcagccc tgaacaaatc tctgaaacgt 300 ctgggtctgg actatgtgga cctgtatctg atgcactggc cggtccctct gaaaacagac 360 cgtgtaactg acggtaacgt cctgtgcatc ccgaccctgg aagatggcac cgtggacatc 420 gataccaaag agtggaattt tattaaaacc tgggaactga tgcaggaatt gccgaaaact 480 ggtaagacca aagccgtcgg tgtgtccaat ttttccatca acaatatcaa agaactgctg 540 gaatcgccaa ataacaaggt cgttccagca accaatcaga tcgagattca tccgttgctg 600 ccgcaggatg aattaatcgc cttttgtaaa gaaaaaggca ttgtggtcga agcatatagc 660 ccattcggct ccgctaacgc cccgctgctg aaagaacagg cgattatcga tatggccaaa 720 aagcacggcg tcgaaccggc gcaactgatt atcagctggt cgattcagcg cggttatgtg 780 gtattggcca agtccgtaaa tccggagcgt atcgtgtcga actttaagat ttttaccctg 840 ccagaggatg atttcaaaac catctctaac ctgagcaaag tgcacggtac caaacgtgtc 900 gttgacatga aatggggctc atttccgatt tttcaataa 939 <210> 128 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> YPR ADH from Saccharomyces cervisiae <400> 128 Met Pro Ala Thr Leu Lys Asn Ser Ser Ala Thr Leu Lys Leu Asn Thr 1 5 10 15 Gly Ala Ser Ile Pro Val Leu Gly Phe Gly Thr Trp Arg Ser Val Asp 20 25 30 Asn Asn Gly Tyr His Ser Val Ile Ala Ala Leu Lys Ala Gly Tyr Arg 35 40 45 His Ile Asp Ala Ala Ala Ile Tyr Leu Asn Glu Glu Glu Val Gly Arg 50 55 60 Ala Ile Lys Asp Ser Gly Val Pro Arg Glu Glu Ile Phe Ile Thr Thr 65 70 75 80 Lys Leu Trp Gly Thr Glu Gln Arg Asp Pro Glu Ala Ala Leu Asn Lys 85 90 95 Ser Leu Lys Arg Leu Gly Leu Asp Tyr Val Asp Leu Tyr Leu Met His 100 105 110 Trp Pro Val Pro Leu Lys Thr Asp Arg Val Thr Asp Gly Asn Val Leu 115 120 125 Cys Ile Pro Thr Leu Glu Asp Gly Thr Val Asp Ile Asp Thr Lys Glu 130 135 140 Trp Asn Phe Ile Lys Thr Trp Glu Leu Met Gln Glu Leu Pro Lys Thr 145 150 155 160 Gly Lys Thr Lys Ala Val Gly Val Ser Asn Phe Ser Ile Asn Asn Ile 165 170 175 Lys Glu Leu Leu Glu Ser Pro Asn Asn Lys Val Val Pro Ala Thr Asn 180 185 190 Gln Ile Glu Ile His Pro Leu Leu Pro Gln Asp Glu Leu Ile Ala Phe 195 200 205 Cys Lys Glu Lys Gly Ile Val Val Glu Ala Tyr Ser Pro Phe Gly Ser 210 215 220 Ala Asn Ala Pro Leu Leu Lys Glu Gln Ala Ile Ile Asp Met Ala Lys 225 230 235 240 Lys His Gly Val Glu Pro Ala Gln Leu Ile Ile Ser Trp Ser Ile Gln 245 250 255 Arg Gly Tyr Val Val Leu Ala Lys Ser Val Asn Pro Glu Arg Ile Val 260 265 270 Ser Asn Phe Lys Ile Phe Thr Leu Pro Glu Asp Asp Phe Lys Thr Ile 275 280 285 Ser Asn Leu Ser Lys Val His Gly Thr Lys Arg Val Val Asp Met Lys 290 295 300 Trp Gly Ser Phe Pro Ile Phe Gln 305 310 <210> 129 <211> 1029 <212> DNA <213> Artificial Sequence <220> <223> GRE ADH from Saccharomyces cervisiae <400> 129 atgtctgtgt tcgtgtcagg cgcgaatggt tttattgctc agcacatcgt agatctgctg 60 ctgaaagaag attacaaagt aattggttcc gcacgttctc aggaaaaagc tgaaaatttg 120 accgaagcct tcggtaacaa cccgaaattt agcatggaag tggtgcctga tattagcaaa 180 ctggatgcct tcgatcatgt attccagaaa catggtaaag atattaaaat cgtcctgcat 240 accgcgtccc cgttttgttt cgatattacc gattccgaac gtgacttact gatcccggcg 300 gtaaacggtg tcaaaggtat tttgcacagt attaagaaat atgccgcaga cagcgtggaa 360 cgcgtggttc tgacttcatc ttacgccgcg gtatttgata tggcgaagga aaacgataag 420 agcctgacct tcaacgaaga atcctggaat ccggcgacct gggaatcgtg tcagagtgat 480 ccggtgaacg cttattgcgg ttctaaaaaa ttcgcagaga aagcagcgtg ggaattcttg 540 gaagaaaacc gtgatagcgt gaaatttgag ctgacagcgg tcaacccagt ttacgttttt 600 ggtccgcaga tgttcgataa agatgttaaa aaacacttga acaccagctg cgaactggtg 660 aactctctga tgcatctgag ccctgaagat aaaattccgg aactgtttgg cggttacatc 720 gacgtccgtg acgttgcgaa agctcatctg gttgcatttc agaaacgtga aacaatcggt 780 cagcgcctga tcgtgtcgga ggcacgtttc acgatgcagg acgttctgga cattctgaac 840 gaagactttc cagtactgaa gggcaatatc ccggtcggca agcctggcag cggcgccacc 900 cataatactc tgggcgccac cctggacaat aaaaaaagca aaaaattgct gggcttcaaa 960 ttccgtaatc tgaaagagac tattgacgat actgcgtccc agatcctgaa attcgaaggt 1020 cgcatttaa 1029 <210> 130 <211> 342 <212> PRT <213> Artificial Sequence <220> <223> GRE ADH from Saccharomyces cervisiae <400> 130 Met Ser Val Phe Val Ser Gly Ala Asn Gly Phe Ile Ala Gln His Ile 1 5 10 15 Val Asp Leu Leu Leu Lys Glu Asp Tyr Lys Val Ile Gly Ser Ala Arg 20 25 30 Ser Gln Glu Lys Ala Glu Asn Leu Thr Glu Ala Phe Gly Asn Asn Pro 35 40 45 Lys Phe Ser Met Glu Val Val Pro Asp Ile Ser Lys Leu Asp Ala Phe 50 55 60 Asp His Val Phe Gln Lys His Gly Lys Asp Ile Lys Ile Val Leu His 65 70 75 80 Thr Ala Ser Pro Phe Cys Phe Asp Ile Thr Asp Ser Glu Arg Asp Leu 85 90 95 Leu Ile Pro Ala Val Asn Gly Val Lys Gly Ile Leu His Ser Ile Lys 100 105 110 Lys Tyr Ala Ala Asp Ser Val Glu Arg Val Val Leu Thr Ser Ser Tyr 115 120 125 Ala Ala Val Phe Asp Met Ala Lys Glu Asn Asp Lys Ser Leu Thr Phe 130 135 140 Asn Glu Glu Ser Trp Asn Pro Ala Thr Trp Glu Ser Cys Gln Ser Asp 145 150 155 160 Pro Val Asn Ala Tyr Cys Gly Ser Lys Lys Phe Ala Glu Lys Ala Ala 165 170 175 Trp Glu Phe Leu Glu Glu Asn Arg Asp Ser Val Lys Phe Glu Leu Thr 180 185 190 Ala Val Asn Pro Val Tyr Val Phe Gly Pro Gln Met Phe Asp Lys Asp 195 200 205 Val Lys Lys His Leu Asn Thr Ser Cys Glu Leu Val Asn Ser Leu Met 210 215 220 His Leu Ser Pro Glu Asp Lys Ile Pro Glu Leu Phe Gly Gly Tyr Ile 225 230 235 240 Asp Val Arg Asp Val Ala Lys Ala His Leu Val Ala Phe Gln Lys Arg 245 250 255 Glu Thr Ile Gly Gln Arg Leu Ile Val Ser Glu Ala Arg Phe Thr Met 260 265 270 Gln Asp Val Leu Asp Ile Leu Asn Glu Asp Phe Pro Val Leu Lys Gly 275 280 285 Asn Ile Pro Val Gly Lys Pro Gly Ser Gly Ala Thr His Asn Thr Leu 290 295 300 Gly Ala Thr Leu Asp Asn Lys Lys Ser Lys Lys Leu Leu Gly Phe Lys 305 310 315 320 Phe Arg Asn Leu Lys Glu Thr Ile Asp Asp Thr Ala Ser Gln Ile Leu 325 330 335 Lys Phe Glu Gly Arg Ile 340 <210> 131 <211> 1032 <212> DNA <213> Artificial Sequence <220> <223> Codon optimized ADH from S. salmonicolor <400> 131 atggcaaaga tcgacaacgc agttctgccg gagggttctc tggtgctggt caccggcgcg 60 aacggctttg tcgctagcca tgtggtcgaa caactgctgg aacacggcta taaggtgcgc 120 ggcactgctc gctctgcctc caaactggcg aacctgcaga aacgttggga cgccaaatac 180 cctggtcgtt tcgagactgc cgttgttgaa gacatgctga agcagggtgc atatgatgaa 240 gttattaaag gcgcggcagg tgtcgcccac atcgcgtccg tggtcagctt ttctaacaaa 300 tatgatgagg tggtaactcc tgcgatcggt ggcacgctga atgccctgcg tgccgcagct 360 gctacgcctt ccgtgaaacg ttttgtgctg accagcagca ctgtttctgc actgattcca 420 aaacctaacg tcgaaggtat ttatctggat gagaagagct ggaacctgga aagcattgat 480 aaggctaaaa ccctgcctga atctgatccg cagaaaagcc tgtgggtcta cgccgcaagc 540 aaaacggaag cggaactggc tgcctggaaa ttcatggacg aaaacaaacc gcactttact 600 ctgaatgccg ttctgccaaa ctacactatc ggtaccattt ttgacccaga aacccaatcc 660 ggttccactt ccggctggat gatgtctctg ttcaatggcg aagtatctcc ggcactggcg 720 ctgatgccgc cgcagtacta tgtctctgca gttgatatcg gtctgctgca cctgggttgt 780 ctggttctgc cgcaaatcga acgccgtcgt gtttacggca ccgcaggcac ctttgattgg 840 aacaccgttc tggcgacctt ccgtaaactg tatccgtcca agacgttccc ggctgacttt 900 ccggatcagg gccaggatct gtccaaattt gataccgccc cgagcctgga gattctgaaa 960 tccctgggcc gccctggctg gcgtagcatc gaggaatcta tcaaagatct ggtgggttcc 1020 gagaccgcct aa 1032 <210> 132 <211> 343 <212> PRT <213> Artificial Sequence <220> <223> ADH from S. salmonicolor <400> 132 Met Ala Lys Ile Asp Asn Ala Val Leu Pro Glu Gly Ser Leu Val Leu 1 5 10 15 Val Thr Gly Ala Asn Gly Phe Val Ala Ser His Val Val Glu Gln Leu 20 25 30 Leu Glu His Gly Tyr Lys Val Arg Gly Thr Ala Arg Ser Ala Ser Lys 35 40 45 Leu Ala Asn Leu Gln Lys Arg Trp Asp Ala Lys Tyr Pro Gly Arg Phe 50 55 60 Glu Thr Ala Val Val Glu Asp Met Leu Lys Gln Gly Ala Tyr Asp Glu 65 70 75 80 Val Ile Lys Gly Ala Ala Gly Val Ala His Ile Ala Ser Val Val Ser 85 90 95 Phe Ser Asn Lys Tyr Asp Glu Val Val Thr Pro Ala Ile Gly Gly Thr 100 105 110 Leu Asn Ala Leu Arg Ala Ala Ala Ala Thr Pro Ser Val Lys Arg Phe 115 120 125 Val Leu Thr Ser Ser Thr Val Ser Ala Leu Ile Pro Lys Pro Asn Val 130 135 140 Glu Gly Ile Tyr Leu Asp Glu Lys Ser Trp Asn Leu Glu Ser Ile Asp 145 150 155 160 Lys Ala Lys Thr Leu Pro Glu Ser Asp Pro Gln Lys Ser Leu Trp Val 165 170 175 Tyr Ala Ala Ser Lys Thr Glu Ala Glu Leu Ala Ala Trp Lys Phe Met 180 185 190 Asp Glu Asn Lys Pro His Phe Thr Leu Asn Ala Val Leu Pro Asn Tyr 195 200 205 Thr Ile Gly Thr Ile Phe Asp Pro Glu Thr Gln Ser Gly Ser Thr Ser 210 215 220 Gly Trp Met Met Ser Leu Phe Asn Gly Glu Val Ser Pro Ala Leu Ala 225 230 235 240 Leu Met Pro Pro Gln Tyr Tyr Val Ser Ala Val Asp Ile Gly Leu Leu 245 250 255 His Leu Gly Cys Leu Val Leu Pro Gln Ile Glu Arg Arg Arg Val Tyr 260 265 270 Gly Thr Ala Gly Thr Phe Asp Trp Asn Thr Val Leu Ala Thr Phe Arg 275 280 285 Lys Leu Tyr Pro Ser Lys Thr Phe Pro Ala Asp Phe Pro Asp Gln Gly 290 295 300 Gln Asp Leu Ser Lys Phe Asp Thr Ala Pro Ser Leu Glu Ile Leu Lys 305 310 315 320 Ser Leu Gly Arg Pro Gly Trp Arg Ser Ile Glu Glu Ser Ile Lys Asp 325 330 335 Leu Val Gly Ser Glu Thr Ala 340 <210> 133 <211> 1041 <212> DNA <213> Artificial Sequence <220> <223> Codon optimized ADH from S. coelicolor <400> 133 atgaaggcac tgcagtaccg caccatcggc gccccgcccg aggtcgtcac cgtcccggac 60 ccggagccgg gccccggcca ggtgctgttg aaggtgaccg cggccggagt ctgccactcc 120 gacatcgcgg tgatgagctg gcccgccgag ggcttcccgt acgagctgcc gctcaccctc 180 ggccacgagg gcgtcggcac cgtggccgcg ctcggcgccg gggtgacggg gctcgccgag 240 ggcgacgcgg tcgccgtgta cgggccctgg ggctgcggca cctgcgccaa gtgcgcggag 300 ggcaaggaga actactgcct gcgcgccgac gagctgggca tccgtccgcc ggggctcggg 360 cgtccggggt ccatggccga gtacctgctg atcgacgacc cccggcacct ggtcccgctg 420 gacgggctcg acccggtcgc ggcggtgccg ctcaccgacg ccggactgac gccgtaccac 480 gcgatcaagc ggtcgctgcc caagctggtc cccggctcca ccgcggtggt catcggcacc 540 ggtggtctcg gccacgtcgc catccagctg ctgcgcgccc tgacgtccgc ccgggtggtc 600 gccctggacg tcagcgagga gaagctgcgc ctcgcccgtg cggtgggcgc gcacgaggcg 660 gtgctgtcgg acgcgaaggc cgcggacgcg gtgcgcgaga tcaccggcgg tctcggtgcc 720 gaggccgtgt tcgacttcgt cggcgtggcg cccaccgtgc agaccgccgg agccgtcgcg 780 gccgtcgagg gcgatgtcac cctggtcggc atcggcggcg gatcgctgcc cgtcggcttc 840 ggcatgctgc cgttcgaggt gtcggtcaac gccccctact ggggcagccg cagcgagctg 900 accgaggtgc tgaacctggc ccgctccggt gccgtgtcgg tgcacaccga gacgtactcc 960 ctggacgacg ccccgctcgc ctacgagcgg ctgcacgagg gcagggtcaa cggccgcgcg 1020 gtgatcctgc cccacggctg a 1041 <210> 134 <211> 346 <212> PRT <213> Artificial Sequence <220> <223> ADH from S. coelicolor <400> 134 Met Lys Ala Leu Gln Tyr Arg Thr Ile Gly Ala Pro Pro Glu Val Val 1 5 10 15 Thr Val Pro Asp Pro Glu Pro Gly Pro Gly Gln Val Leu Leu Lys Val 20 25 30 Thr Ala Ala Gly Val Cys His Ser Asp Ile Ala Val Met Ser Trp Pro 35 40 45 Ala Glu Gly Phe Pro Tyr Glu Leu Pro Leu Thr Leu Gly His Glu Gly 50 55 60 Val Gly Thr Val Ala Ala Leu Gly Ala Gly Val Thr Gly Leu Ala Glu 65 70 75 80 Gly Asp Ala Val Ala Val Tyr Gly Pro Trp Gly Cys Gly Thr Cys Ala 85 90 95 Lys Cys Ala Glu Gly Lys Glu Asn Tyr Cys Leu Arg Ala Asp Glu Leu 100 105 110 Gly Ile Arg Pro Pro Gly Leu Gly Arg Pro Gly Ser Met Ala Glu Tyr 115 120 125 Leu Leu Ile Asp Asp Pro Arg His Leu Val Pro Leu Asp Gly Leu Asp 130 135 140 Pro Val Ala Ala Val Pro Leu Thr Asp Ala Gly Leu Thr Pro Tyr His 145 150 155 160 Ala Ile Lys Arg Ser Leu Pro Lys Leu Val Pro Gly Ser Thr Ala Val 165 170 175 Val Ile Gly Thr Gly Gly Leu Gly His Val Ala Ile Gln Leu Leu Arg 180 185 190 Ala Leu Thr Ser Ala Arg Val Val Ala Leu Asp Val Ser Glu Glu Lys 195 200 205 Leu Arg Leu Ala Arg Ala Val Gly Ala His Glu Ala Val Leu Ser Asp 210 215 220 Ala Lys Ala Ala Asp Ala Val Arg Glu Ile Thr Gly Gly Leu Gly Ala 225 230 235 240 Glu Ala Val Phe Asp Phe Val Gly Val Ala Pro Thr Val Gln Thr Ala 245 250 255 Gly Ala Val Ala Ala Val Glu Gly Asp Val Thr Leu Val Gly Ile Gly 260 265 270 Gly Gly Ser Leu Pro Val Gly Phe Gly Met Leu Pro Phe Glu Val Ser 275 280 285 Val Asn Ala Pro Tyr Trp Gly Ser Arg Ser Glu Leu Thr Glu Val Leu 290 295 300 Asn Leu Ala Arg Ser Gly Ala Val Ser Val His Thr Glu Thr Tyr Ser 305 310 315 320 Leu Asp Asp Ala Pro Leu Ala Tyr Glu Arg Leu His Glu Gly Arg Val 325 330 335 Asn Gly Arg Ala Val Ile Leu Pro His Gly 340 345 <210> 135 <211> 1056 <212> DNA <213> Artificial Sequence <220> <223> Codon optimized ADH-TB from T brockii <400> 135 atgaaaggct tcgccatgct gagcatcggc aaagtgggtt ggattgaaaa agaaaaaccg 60 gcgccaggcc cgttcgatgc aattgtgcgc cctctggcag tagcgccgtg taccagcgat 120 attcatactg tgtttgaagg tgccattggc gagcgtcaca atatgattct gggccatgaa 180 gccgttggtg aagttgttga ggttggcagc gaagtgaagg atttcaaacc gggcgatcgc 240 gttgtcgttc cagcgattac cccggattgg cgcaccagcg aagtccagcg cggctaccat 300 cagcactctg gcggcatgct ggccggctgg aaattcagca atgtaaagga tggtgtgttc 360 ggtgaatttt ttcacgttaa cgacgcagac atgaatctgg cgcacctgcc gaaagaaatc 420 ccgctggaag cagcggttat gattccggat atgatgacca cgggttttca cggcgcagag 480 ctggcggaca ttgaactggg cgctacggta gccgtactgg gcatcggtcc ggtgggcctg 540 atggcagttg caggcgctaa gctgcgcggc gcaggtcgta ttattgccgt tggttctcgc 600 ccggtgtgtg tggacgccgc taagtattat ggtgcaacgg acattgtcaa ttacaaggac 660 ggcccaattg aatctcagat catgaacctg acggaaggta aaggcgttga cgccgcgatt 720 atcgctggcg gcaacgccga catcatggcg accgcagtta aaatcgtcaa gccaggtggt 780 actattgcta acgtcaacta cttcggcgaa ggtgaggtcc tgcctgtccc acgtctggaa 840 tggggttgcg gtatggcaca taaaaccatt aaaggtggcc tgtgcccagg cggccgtctg 900 cgtatggaac gcctgatcga tctggtcttc tacaaacgcg tggatcctag caaactggtg 960 actcacgttt tccgcggctt tgataacatc gaaaaagctt ttatgctgat gaaagataaa 1020 ccgaaagatc tgattaaacc ggttgtcatc ctggct 1056 <210> 136 <211> 352 <212> PRT <213> Artificial Sequence <220> <223> ADH-TB from T brockii <400> 136 Met Lys Gly Phe Ala Met Leu Ser Ile Gly Lys Val Gly Trp Ile Glu 1 5 10 15 Lys Glu Lys Pro Ala Pro Gly Pro Phe Asp Ala Ile Val Arg Pro Leu 20 25 30 Ala Val Ala Pro Cys Thr Ser Asp Ile His Thr Val Phe Glu Gly Ala 35 40 45 Ile Gly Glu Arg His Asn Met Ile Leu Gly His Glu Ala Val Gly Glu 50 55 60 Val Val Glu Val Gly Ser Glu Val Lys Asp Phe Lys Pro Gly Asp Arg 65 70 75 80 Val Val Val Pro Ala Ile Thr Pro Asp Trp Arg Thr Ser Glu Val Gln 85 90 95 Arg Gly Tyr His Gln His Ser Gly Gly Met Leu Ala Gly Trp Lys Phe 100 105 110 Ser Asn Val Lys Asp Gly Val Phe Gly Glu Phe Phe His Val Asn Asp 115 120 125 Ala Asp Met Asn Leu Ala His Leu Pro Lys Glu Ile Pro Leu Glu Ala 130 135 140 Ala Val Met Ile Pro Asp Met Met Thr Thr Gly Phe His Gly Ala Glu 145 150 155 160 Leu Ala Asp Ile Glu Leu Gly Ala Thr Val Ala Val Leu Gly Ile Gly 165 170 175 Pro Val Gly Leu Met Ala Val Ala Gly Ala Lys Leu Arg Gly Ala Gly 180 185 190 Arg Ile Ile Ala Val Gly Ser Arg Pro Val Cys Val Asp Ala Ala Lys 195 200 205 Tyr Tyr Gly Ala Thr Asp Ile Val Asn Tyr Lys Asp Gly Pro Ile Glu 210 215 220 Ser Gln Ile Met Asn Leu Thr Glu Gly Lys Gly Val Asp Ala Ala Ile 225 230 235 240 Ile Ala Gly Gly Asn Ala Asp Ile Met Ala Thr Ala Val Lys Ile Val 245 250 255 Lys Pro Gly Gly Thr Ile Ala Asn Val Asn Tyr Phe Gly Glu Gly Glu 260 265 270 Val Leu Pro Val Pro Arg Leu Glu Trp Gly Cys Gly Met Ala His Lys 275 280 285 Thr Ile Lys Gly Gly Leu Cys Pro Gly Gly Arg Leu Arg Met Glu Arg 290 295 300 Leu Ile Asp Leu Val Phe Tyr Lys Arg Val Asp Pro Ser Lys Leu Val 305 310 315 320 Thr His Val Phe Arg Gly Phe Asp Asn Ile Glu Lys Ala Phe Met Leu 325 330 335 Met Lys Asp Lys Pro Lys Asp Leu Ile Lys Pro Val Val Ile Leu Ala 340 345 350 <210> 137 <211> 1125 <212> DNA <213> Artificial Sequence <220> <223> Codon optimized ADH from Horse Liver, E form <400> 137 atgagcacag cagggaaagt aattaaatgc aaagcagctg tgctgtggga ggaaaagaaa 60 ccattttcca ttgaggaggt ggaggtcgca cctccgaagg cccatgaagt ccgtattaag 120 atggtggcca cagggatctg tcgctcagat gaccacgtgg ttagtgggac cctggtcaca 180 cctctgcctg tgatcgcagg ccatgaggca gctggcattg tggagagcat cggggaaggc 240 gtcactacag tacgtccagg tgataaagtc atcccactgt ttactcctca gtgtgggaaa 300 tgccgtgttt gtaaacaccc tgaaggcaac ttctgcttga aaaatgatct gagcatgcct 360 cgtgggacca tgcaggatgg taccagccgt ttcacctgcc gtgggaagcc tatccaccac 420 ttcctgggca ccagcacctt ctcccagtac accgtggtgg acgagatctc agtggccaag 480 atcgatgcgg cctcaccgct ggagaaagtc tgtctgattg gctgtgggtt ttctactggt 540 tatgggtctg cagtcaaggt tgccaaggtc acccagggct ccacctgtgc cgtgtttggc 600 ctgggggggg tgggcctgtc tgttatcatg ggctgtaaag cagccggggc ggcccgtatc 660 attggggtgg acatcaacaa agacaagttt gcaaaggcca aagaagtggg tgccactgag 720 tgtgtcaacc ctcaggacta caagaaacct atccaggagg tgctgacaga aatgagcaat 780 gggggcgtgg atttttcatt tgaagtcatt ggtcgtctgg acaccatggt gactgccttg 840 tcatgctgtc aagaagcata tggtgtgagc gtcatcgtag gggtacctcc tgattcccaa 900 aatctgtcta tgaatcctat gttgctgctg agtgggcgta cctggaaagg ggctattttt 960 ggtggtttta agagtaaaga ttctgtccct aaactggtgg ccgattttat ggctaaaaag 1020 tttgcactgg atcctttaat cacccatgtt ttaccttttg aaaaaattaa tgaagggttt 1080 gacctgctgc gctctgggga gagtatccgt accatcctga cgttt 1125 <210> 138 <211> 375 <212> PRT <213> Artificial Sequence <220> <223> ADH from Horse Liver, E form <400> 138 Met Ser Thr Ala Gly Lys Val Ile Lys Cys Lys Ala Ala Val Leu Trp 1 5 10 15 Glu Glu Lys Lys Pro Phe Ser Ile Glu Glu Val Glu Val Ala Pro Pro 20 25 30 Lys Ala His Glu Val Arg Ile Lys Met Val Ala Thr Gly Ile Cys Arg 35 40 45 Ser Asp Asp His Val Val Ser Gly Thr Leu Val Thr Pro Leu Pro Val 50 55 60 Ile Ala Gly His Glu Ala Ala Gly Ile Val Glu Ser Ile Gly Glu Gly 65 70 75 80 Val Thr Thr Val Arg Pro Gly Asp Lys Val Ile Pro Leu Phe Thr Pro 85 90 95 Gln Cys Gly Lys Cys Arg Val Cys Lys His Pro Glu Gly Asn Phe Cys 100 105 110 Leu Lys Asn Asp Leu Ser Met Pro Arg Gly Thr Met Gln Asp Gly Thr 115 120 125 Ser Arg Phe Thr Cys Arg Gly Lys Pro Ile His His Phe Leu Gly Thr 130 135 140 Ser Thr Phe Ser Gln Tyr Thr Val Val Asp Glu Ile Ser Val Ala Lys 145 150 155 160 Ile Asp Ala Ala Ser Pro Leu Glu Lys Val Cys Leu Ile Gly Cys Gly 165 170 175 Phe Ser Thr Gly Tyr Gly Ser Ala Val Lys Val Ala Lys Val Thr Gln 180 185 190 Gly Ser Thr Cys Ala Val Phe Gly Leu Gly Gly Val Gly Leu Ser Val 195 200 205 Ile Met Gly Cys Lys Ala Ala Gly Ala Ala Arg Ile Ile Gly Val Asp 210 215 220 Ile Asn Lys Asp Lys Phe Ala Lys Ala Lys Glu Val Gly Ala Thr Glu 225 230 235 240 Cys Val Asn Pro Gln Asp Tyr Lys Lys Pro Ile Gln Glu Val Leu Thr 245 250 255 Glu Met Ser Asn Gly Gly Val Asp Phe Ser Phe Glu Val Ile Gly Arg 260 265 270 Leu Asp Thr Met Val Thr Ala Leu Ser Cys Cys Gln Glu Ala Tyr Gly 275 280 285 Val Ser Val Ile Val Gly Val Pro Pro Asp Ser Gln Asn Leu Ser Met 290 295 300 Asn Pro Met Leu Leu Leu Ser Gly Arg Thr Trp Lys Gly Ala Ile Phe 305 310 315 320 Gly Gly Phe Lys Ser Lys Asp Ser Val Pro Lys Leu Val Ala Asp Phe 325 330 335 Met Ala Lys Lys Phe Ala Leu Asp Pro Leu Ile Thr His Val Leu Pro 340 345 350 Phe Glu Lys Ile Asn Glu Gly Phe Asp Leu Leu Arg Ser Gly Glu Ser 355 360 365 Ile Arg Thr Ile Leu Thr Phe 370 375 <210> 139 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> Engineered Ketoreductase Sequence Formula with L. minor backbone <223> Synthetic Construct <220> <221> MISC_FEATURE <222>(7)..(7) <223> Xaa is a constrained or non-polar residue <220> <221> MISC_FEATURE <222>(17)..(17) <223> Xaa is a non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(25)..(25) <223> Xaa is a polar or acidic residue <220> <221> MISC_FEATURE <222>(27)..(27) <223> Xaa is an aromatic residue <220> <221> MISC_FEATURE <222>(41)..(41) <223> Xaa is a polar, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(53)..(53) <223> Xaa is a polar, non-polar, or acidic residue <220> <221> MISC_FEATURE <222>(57)..(57) <223> Xaa is a non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(64)..(64) <223> Xaa is a polar, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(66)..(66) <223> Xaa is an acidic residue <220> <221> MISC_FEATURE <222>(68)..(68) <223> Xaa is a polar, acidic, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(72)..(72) <223> Xaa is a basic residue <220> <221> MISC_FEATURE <222>(76)..(76) <223> Xaa is an aliphatic, non-polar, or polar residue <220> <221> MISC_FEATURE <222>(80)..(80) <223> Xaa is an aliphatic, non-polar, or polar residue <220> <221> MISC_FEATURE <222>(93)..(93) <223> Xaa is is a polar, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(94)..(94) <223> Xaa is a cysteine, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(95)..(95) <223> Xaa is an aliphatic, non-polar, or acidic residue <220> <221> MISC_FEATURE <222>(96)..(96) <223> Xaa is is a cyteine, polar, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(97)..(97) <223> Xaa is a constrained or polar residue <220> <221> MISC_FEATURE <222>(100)..(100) <223> Xaa is a basic, acidic, polar, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(108)..(108) <223> Xaa is a basic or constrained residue <220> <221> MISC_FEATURE <222>(111)..(111) <223> Xaa is a non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(139)..(139) <223> Xaa is a non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(145)..(145) <223> Xaa is an acidic, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(147)..(147) <223> Xaa is an aromatic, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(151)..(151) <223> Xaa is a constrained, non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(152)..(152) <223> Xaa is a polar, aromatic, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(163)..(163) <223> Xaa is a non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(165)..(165) <223> Xaa is a polar, non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(173)..(173) <223> Xaa is an acidic, non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(179)..(179) <223> Xaa is an aromatic, basic, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(190)..(190) <223> Xaa is a constrained residue <220> <221> MISC_FEATURE <222>(194)..(194) <223> Xaa is a constrained, polar, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(195)..(195) <223> Xaa is a basic, acidic, non-polar, or polar residue <220> <221> MISC_FEATURE <222>(196)..(196) <223> Xaa is a non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(197)..(197) <223> Xaa is an acidic residue <220> <221> MISC_FEATURE <222>(198)..(198) <223> Xaa is an acidic or polar residue <220> <221> MISC_FEATURE <222>(202)..(202) <223> Xaa is an aromatic residue <220> <221> MISC_FEATURE <222>(210)..(210) <223> Xaa is a polar or basic residue <220> <221> MISC_FEATURE <222>(211)..(211) <223> Xaa is is a basic, aliphatic, non-polar, acidic, or polar residue <220> <221> MISC_FEATURE <222>(212)..(212) <223> Xaa is a polar, aliphatic, or non-polar residue <220> <221> MISC_FEATURE <222>(216)..(216) <223> Xaa is a constrained or basic residue <220> <221> MISC_FEATURE <222>(223)..(223) <223> Xaa is a non-polar or aliphatic residue <220> <221> MISC_FEATURE <222>(226)..(226) <223> Xaa is a non-polar or polar residue <220> <221> MISC_FEATURE <222>(233)..(233) <223> Xaa is a polar or acidic residue <220> <221> MISC_FEATURE <222>(235)..(235) <223> Xaa is a polar or aromatic residue <220> <221> MISC_FEATURE <222>(248)..(248) <223> Xaa is a non-polar or aromatic residue <220> <221> MISC_FEATURE <222>(249)..(249) <223> Xaa is an aromatic residue <400> 139 Met Thr Asp Arg Leu Lys Xaa Lys Val Ala Ile Val Thr Gly Gly Thr 1 5 10 15 Leu Gly Ile Gly Leu Ala Ile Ala Asp Lys Phe Val Glu Glu Gly Ala 20 25 30 Lys Val Val Ile Thr Gly Arg His Xaa Asp Val Gly Glu Lys Ala Ala 35 40 45 Arg Ser Ile Gly Xaa Thr Asp Val Ile Arg Phe Val Gln His Asp Xaa 50 55 60 Ser Asp Glu Xaa Gly Trp Thr Lys Leu Phe Asp Xaa Thr Glu Glu Xaa 65 70 75 80 Phe Gly Pro Val Thr Thr Val Val Asn Asn Ala Gly Xaa Xaa Xaa Xaa 85 90 95 Xaa Ser Val Xaa Asp Thr Thr Thr Glu Glu Trp Xaa Lys Leu Leu Ser 100 105 110 Val Asn Leu Asp Gly Val Phe Phe Gly Thr Arg Leu Gly Ile Gln Arg 115 120 125 Met Lys Asn Lys Gly Leu Gly Ala Ser Ile Ile Asn Met Ser Ser Ile 130 135 140 Xaa Gly Xaa Val Gly Asp Pro Xaa Leu Gly Ala Tyr Asn Ala Ser Lys 145 150 155 160 Gly Ala Val Arg Ile Met Ser Lys Ser Ala Ala Leu Asp Cys Ala Leu 165 170 175 Lys Asp Xaa Asp Val Arg Val Asn Thr Val His Pro Gly Xaa Ile Lys 180 185 190 Thr Xaa Xaa Val Asp Xaa Leu Glu Gly Xaa Glu Glu Met Met Ser Gln 195 200 205 Arg Xaa Xaa Xaa Pro Met Gly Xaa Ile Gly Glu Pro Asn Asp Ile Ala 210 215 220 Trp Ile Cys Val Tyr Leu Ala Ser Xaa Glu Xaa Lys Phe Ala Thr Gly 225 230 235 240 Ala Glu Phe Val Val Asp Gly Xaa Tyr Thr Ala Gln 245 250

Claims (80)

  1. 서열 번호 4의 폴리펩티드의 전환율의 1.5 배 이상의 전환율로 기질 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]벤조산 메틸 에스테르를 생성물 (S,E)-메틸 2-(3-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-히드록시프로필)벤조에이트로 전환시킬 수 있는 케토리덕타제 폴리펩티드.
  2. 제1항에 있어서, 상기 기질을 약 95% 이상의 입체이성체 잉여율(percent stereomeric excess)로 상기 생성물로 전환시킬 수 있는 케토리덕타제 폴리펩티드.
  3. 제1항에 있어서, 상기 기질을 약 99% 이상의 입체이성체 잉여율로 상기 생성물로 전환시킬 수 있는 케토리덕타제 폴리펩티드.
  4. 제1항에 있어서, X190에 해당하는 잔기가 프롤린인 특징 및 X202에 해당하는 잔기가 트립토판인 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 약 85% 이상 동일한 아미노산 서열을 포함하며, 단 X190에 해당하는 잔기가 구속성 잔기(constrained residue)이고, X202에 해당하는 잔기가 방향족 잔기인 아미노산 서열을 갖는 케토리덕타제 폴리펩티드.
  5. 제1항에 있어서, X190에 해당하는 잔기가 프롤린인 특징, X195에 해당하는 잔기가 아르기닌인 특징 및 X202에 해당하는 잔기가 트립토판인 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열과 약 85% 이상 동일한 아미노산 서열을 포함하며, 단 X190에 해당하는 잔기가 구속성 잔기이고, X195에 해당하는 잔기가 염기성, 산성, 비극성 또는 극성 잔기이고, X202에 해당하는 잔기가 방향족 잔기인 아미노산 서열을 갖는 케토리덕타제 폴리펩티드.
  6. 제4항에 있어서, X190에 해당하는 잔기가 프롤린이고, X202에 해당하는 잔기가 트립토판인 아미노산 서열을 포함하는 케토리덕타제 폴리펩티드.
  7. 제5항에 있어서, X190에 해당하는 잔기가 프롤린이고, X195에 해당하는 잔기가 아르기닌이고, X202에 해당하는 잔기가 트립토판인 아미노산 서열을 포함하는 케토리덕타제 폴리펩티드.
  8. 제4항 내지 제7항 중 어느 한 항에 있어서, 상기 케토리덕타제 아미노산 서열은 추가로 다음의 특징:
    X7에 해당하는 잔기가 구속성 또는 비극성 잔기인 특징,
    X17에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징,
    X25에 해당하는 잔기가 극성 또는 산성 잔기인 특징,
    X27에 해당하는 잔기가 방향족 잔기인 특징,
    X41에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기인 특징,
    X53에 해당하는 잔기가 극성, 비극성 또는 산성 잔기인 특징,
    X57에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징,
    X64에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기인 특징,
    X66에 해당하는 잔기가 산성 잔기인 특징,
    X68에 해당하는 잔기가 극성, 산성, 지방족 또는 비극성 잔기인 특징,
    X72에 해당하는 잔기가 염기성 잔기인 특징,
    X76에 해당하는 잔기가 지방족, 비극성 또는 극성 잔기인 특징,
    X80에 해당하는 잔기가 지방족, 비극성 또는 극성 잔기인 특징,
    X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기인 특징,
    X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기인 특징,
    X95에 해당하는 잔기가 지방족, 비극성 또는 산성 잔기인 특징,
    X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기인 특징,
    X97에 해당하는 잔기가 염기성, 구속성 또는 극성 잔기인 특징,
    X100에 해당하는 잔기가 염기성, 산성, 극성, 지방족 또는 비극성 잔기인 특징,
    X108에 해당하는 잔기가 염기성 또는 구속성 잔기인 특징,
    X111에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징,
    X139에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징,
    X145에 해당하는 잔기가 산성, 지방족 또는 비극성 잔기인 특징,
    X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기인 특징,
    X148에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징,
    X151에 해당하는 잔기가 구속성, 비극성 또는 지방족 잔기인 특징,
    X152에 해당하는 잔기가 극성, 방향족, 지방족 또는 비극성 잔기인 특징,
    X163에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징,
    X165에 해당하는 잔기가 극성, 비극성 또는 지방족 잔기인 특징,
    X173에 해당하는 잔기가 산성, 비극성 또는 지방족 잔기인 특징,
    X179에 해당하는 잔기가 방향족, 염기성, 지방족 또는 비극성 잔기인 특징,
    X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기인 특징,
    X196에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징,
    X197에 해당하는 잔기가 산성 잔기인 특징,
    X198에 해당하는 잔기가 산성 또는 극성 잔기인 특징,
    X210에 해당하는 잔기가 극성 또는 염기성 잔기인 특징,
    X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기인 특징,
    X212에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기인 특징,
    X216에 해당하는 잔기가 구속성 또는 염기성 잔기인 특징,
    X223에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징,
    X226에 해당하는 잔기가 비극성 또는 극성 잔기인 특징,
    X233에 해당하는 잔기가 극성 또는 산성 잔기인 특징,
    X235에 해당하는 잔기가 극성 또는 방향족 잔기인 특징,
    X248에 해당하는 잔기가 비극성 또는 방향족 잔기인 특징, 및
    X249에 해당하는 잔기가 방향족 잔기인 특징
    중 하나 이상을 가지며, 경우에 따라 상기 아미노산 서열은 다른 아미노산 잔기 위치에서 상기 기준 서열과 비교하여 하나 이상의 잔기 차이를 갖는 것인 케토리덕타제 폴리펩티드.
  9. 제4항 내지 제7항 중 어느 한 항에 있어서, 상기 케토리덕타제 아미노산 서열은 추가로 다음의 특징:
    X7에 해당하는 잔기가 히스티딘인 특징,
    X17에 해당하는 잔기가 메티오닌인 특징,
    X25에 해당하는 잔기가 아스파르트산인 특징,
    X27에 해당하는 잔기가 티로신인 특징,
    X41에 해당하는 잔기가 세린 또는 알라닌인 특징,
    X53에 해당하는 잔기가 아스파르트산인 특징,
    X57에 해당하는 잔기가 발린인 특징,
    X64에 해당하는 잔기가 발린인 특징,
    X66에 해당하는 잔기가 글루탐산인 특징,
    X68에 해당하는 잔기가 발린인 특징,
    X72에 해당하는 잔기가 아르기닌인 특징,
    X76에 해당하는 잔기가 알라닌인 특징,
    X80에 해당하는 잔기가 트레오닌 또는 발린인 특징,
    X93에 해당하는 잔기가 세린인 특징,
    X94에 해당하는 잔기가 시스테인 또는 글리신인 특징,
    X95에 해당하는 잔기가 루신 또는 글루탐산인 특징,
    X96에 해당하는 잔기가 시스테인, 아스파라긴, 발린, 루신, 이소루신 또는 트레오닌인 특징,
    X97에 해당하는 잔기가 히스티딘 또는 세린인 특징,
    X100에 해당하는 잔기가 리신인 특징,
    X108에 해당하는 잔기가 히스티딘인 특징,
    X111에 해당하는 잔기가 메티오닌인 특징,
    X139에 해당하는 잔기가 루신인 특징,
    X145에 해당하는 잔기가 글루타민 또는 루신인 특징,
    X147에 해당하는 잔기가 루신인 특징,
    X148에 해당하는 잔기가 발린인 특징,
    X151에 해당하는 잔기가 알라닌인 특징,
    X152에 해당하는 잔기가 세린인 특징,
    X163에 해당하는 잔기가 이소루신인 특징,
    X165에 해당하는 잔기가 아스파라긴인 특징,
    X173에 해당하는 잔기가 발린인 특징,
    X179에 해당하는 잔기가 페닐알라닌, 리신 또는 루신인 특징,
    X194에 해당하는 잔기가 글루타민, 세린 또는 루신인 특징,
    X196에 해당하는 잔기가 루신인 특징,
    X197에 해당하는 잔기가 글루탐산인 특징,
    X198에 해당하는 잔기가 글루탐산 또는 글루타민인 특징,
    X210에 해당하는 잔기가 아르기닌인 특징,
    X211에 해당하는 잔기가 발린, 루신, 트레오닌 또는 이소루신인 특징,
    X212에 해당하는 잔기가 세린 또는 발린인 특징,
    X216에 해당하는 잔기가 아르기닌인 특징,
    X223에 해당하는 잔기가 발린인 특징,
    X226에 해당하는 잔기가 트레오닌인 특징,
    X233에 해당하는 잔기가 아스파라긴 또는 아스파르트산인 특징,
    X235에 해당하는 잔기가 트립토판인 특징,
    X248에 해당하는 잔기가 글리신 또는 트립토판인 특징, 및
    X249에 해당하는 잔기가 트립토판인 특징
    중 하나 이상을 가지며, 경우에 따라 상기 아미노산 서열은 다른 아미노산 잔기 위치에서 상기 기준 서열과 비교하여 하나 이상의 잔기 차이를 갖는 것인 케토리덕타제 폴리펩티드.
  10. 제4항에 있어서, 상기 케토리덕타제 아미노산 서열은 추가로 다음의 특징:
    X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기인 특징,
    X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기인 특징, 및
    X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기인 특징
    중 하나 이상 또는 적어도 전부를 가지며, 경우에 따라 상기 아미노산 서열은 다른 아미노산 잔기 위치에서 상기 기준 서열과 비교하여 하나 이상의 잔기 차이를 갖는 것인 케토리덕타제 폴리펩티드.
  11. 제4항에 있어서, 상기 케토리덕타제 아미노산 서열은 추가로 다음의 특징:
    X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기인 특징,
    X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기인 특징, 및
    X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기인 특징
    중 하나 이상 또는 적어도 전부를 가지며, 경우에 따라 상기 아미노산 서열은 다른 아미노산 잔기 위치에서 상기 기준 서열과 비교하여 하나 이상의 잔기 차이를 갖는 것인 케토리덕타제 폴리펩티드.
  12. 제4항에 있어서, 상기 케토리덕타제 아미노산 서열은 추가로 다음의 특징:
    X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기인 특징,
    X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기인 특징,
    X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기인 특징, 및
    X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기인 특징
    중 하나 이상 또는 적어도 전부를 가지며, 경우에 따라 상기 아미노산 서열은 다른 아미노산 잔기 위치에서 상기 기준 서열과 비교하여 하나 이상의 잔기 차이를 갖는 것인 케토리덕타제 폴리펩티드.
  13. 제4항에 있어서, 상기 케토리덕타제 아미노산 서열은 추가로 다음의 특징:
    X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기인 특징,
    X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기인 특징,
    X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기인 특징, 및
    X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기인 특징
    중 하나 이상 또는 적어도 전부를 가지며, 경우에 따라 상기 아미노산 서열은 다른 아미노산 잔기 위치에서 상기 기준 서열과 비교하여 하나 이상의 잔기 차이를 갖는 것인 케토리덕타제 폴리펩티드.
  14. 제4항에 있어서, 상기 케토리덕타제 아미노산 서열은 추가로 다음의 특징:
    X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기인 특징,
    X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기인 특징,
    X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기인 특징,
    X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기인 특징, 및
    X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기인 특징
    중 하나 이상 또는 적어도 전부를 가지며, 경우에 따라 상기 아미노산 서열은 다른 아미노산 잔기 위치에서 상기 기준 서열과 비교하여 하나 이상의 잔기 차이를 갖는 것인 케토리덕타제 폴리펩티드.
  15. 제4항에 있어서, 상기 케토리덕타제 아미노산 서열은 추가로 다음의 특징:
    X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기인 특징,
    X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기인 특징,
    X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기인 특징, 및
    X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기인 특징
    중 하나 이상 또는 적어도 전부를 가지며, 경우에 따라 상기 아미노산 서열은 다른 아미노산 잔기 위치에서 상기 기준 서열과 비교하여 하나 이상의 잔기 차이를 갖는 것인 케토리덕타제 폴리펩티드.
  16. 제4항에 있어서, 상기 케토리덕타제 아미노산 서열은 추가로 다음의 특징:
    X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기인 특징,
    X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기인 특징,
    X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기인 특징,
    X100에 해당하는 잔기가 염기성, 산성, 극성, 지방족 또는 비극성 잔기인 특징,
    X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기인 특징,
    X152에 해당하는 잔기가 극성, 방향족, 지방족 또는 비극성 잔기인 특징,
    X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기인 특징,
    X196에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징, 및
    X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기인 특징
    중 하나 이상 또는 적어도 전부를 가지며, 경우에 따라 상기 아미노산 서열은 다른 아미노산 잔기 위치에서 상기 기준 서열과 비교하여 하나 이상의 잔기 차이를 갖는 것인 케토리덕타제 폴리펩티드.
  17. 제4항에 있어서, 상기 케토리덕타제 아미노산 서열은 추가로 다음의 특징:
    X7에 해당하는 잔기가 구속성 또는 비극성 잔기인 특징,
    X66에 해당하는 잔기가 산성 잔기인 특징,
    X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기인 특징,
    X94에 해당하는 잔기가 시스테인, 비극성 또는 지방족 잔기인 특징,
    X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기인 특징,
    X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기인 특징,
    X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기인 특징,
    X196에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징,
    X198에 해당하는 잔기가 산성 또는 극성 잔기인 특징, 및
    X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기인 특징
    중 하나 이상 또는 적어도 전부를 가지며, 경우에 따라 상기 아미노산 서열은 다른 아미노산 잔기 위치에서 상기 기준 서열과 비교하여 하나 이상의 잔기 차이를 갖는 것인 케토리덕타제 폴리펩티드.
  18. 제4항에 있어서, 상기 케토리덕타제 아미노산 서열은 추가로 다음의 특징:
    X7에 해당하는 잔기가 구속성 또는 비극성 잔기인 특징,
    X17에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징,
    X27에 해당하는 잔기가 방향족 잔기인 특징,
    X64에 해당하는 잔기가 극성, 비극성 또는 지방족 잔기인 특징,
    X66에 해당하는 잔기가 산성 잔기인 특징,
    X80에 해당하는 잔기가 지방족, 비극성 또는 극성 잔기인 특징,
    X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기인 특징,
    X94에 해당하는 잔기가 시스테인, 비극성 또는 지방족 잔기인 특징,
    X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기인 특징,
    X100에 해당하는 잔기가 염기성 또는 구속성 잔기인 특징,
    X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기인 특징,
    X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기인 특징,
    X196에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징,
    X198에 해당하는 잔기가 산성 또는 극성 잔기인 특징,
    X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기인 특징, 및
    X216에 해당하는 잔기가 구속성 또는 염기성 잔기인 특징
    중 하나 이상 또는 적어도 전부를 가지며, 경우에 따라 상기 아미노산 서열은 다른 아미노산 잔기 위치에서 상기 기준 서열과 비교하여 하나 이상의 잔기 차이를 갖는 것인 케토리덕타제 폴리펩티드.
  19. 제4항에 있어서, 상기 케토리덕타제 아미노산 서열은 추가로 다음의 특징:
    X7에 해당하는 잔기가 구속성 또는 비극성 잔기인 특징,
    X17에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징,
    X27에 해당하는 잔기가 방향족 잔기인 특징,
    X64에 해당하는 잔기가 극성, 비극성 또는 지방족 잔기인 특징,
    X80에 해당하는 잔기가 지방족, 비극성 또는 극성 잔기인 특징,
    X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기인 특징,
    X94에 해당하는 잔기가 시스테인, 비극성 또는 지방족 잔기인 특징,
    X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기인 특징,
    X100에 해당하는 잔기가 염기성 또는 구속성 잔기인 특징,
    X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기인 특징,
    X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기인 특징,
    X196에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징,
    X198에 해당하는 잔기가 산성 또는 극성 잔기인 특징,
    X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기인 특징, 및
    X216에 해당하는 잔기가 구속성 또는 염기성 잔기인 특징
    전부를 가지며, 경우에 따라 상기 아미노산 서열은 다른 아미노산 잔기 위치에서 상기 기준 서열과 비교하여 하나 이상의 잔기 차이를 갖는 것인 케토리덕타제 폴리펩티드.
  20. 제4항에 있어서, 상기 케토리덕타제 아미노산 서열은 추가로 다음의 특징:
    X7에 해당하는 잔기가 히스티딘인 특징,
    X17에 해당하는 잔기가 메티오닌인 특징,
    X27에 해당하는 잔기가 방향족 잔기인 특징,
    X64에 해당하는 잔기가 티로신인 특징,
    X80에 해당하는 잔기가 트레오닌인 특징,
    X93에 해당하는 잔기가 세린인 특징,
    X94에 해당하는 잔기가 시스테인인 특징,
    X96에 해당하는 잔기가 발린, 루신 또는 이소루신인 특징,
    X100에 해당하는 잔기가 리신인 특징,
    X147에 해당하는 잔기가 루신인 특징,
    X194에 해당하는 잔기가 글루타민인 특징,
    X196에 해당하는 잔기가 루신인 특징,
    X198에 해당하는 잔기가 글루탐산인 특징,
    X211에 해당하는 잔기가 발린인 특징, 및
    X216에 해당하는 잔기가 아르기닌인 특징
    전부를 가지며, 경우에 따라 상기 아미노산 서열은 다른 아미노산 잔기 위치에서 상기 기준 서열과 비교하여 하나 이상의 잔기 차이를 갖는 것인 케토리덕타제 폴리펩티드.
  21. 제8항에 있어서, 상기 케토리덕타제 아미노산 서열은 X7에 해당하는 잔기가 히스티딘인 특징, X96에 해당하는 잔기가 트레오닌인 특징, X147에 해당하는 잔기가 루신인 특징 및 X196에 해당하는 잔기가 루신인 특징을 갖는 것인 케토리덕타제 폴리펩티드.
  22. 제21항에 있어서, 상기 케토리덕타제 아미노산 서열은 추가로 X93에 해당하는 잔기가 세린인 특징, X94에 해당하는 잔기가 시스테인인 특징, X96에 해당하는 잔기가 루신인 특징 및 X211에 해당하는 잔기가 발린인 특징을 갖는 것인 케토리덕타제 폴리펩티드.
  23. 제22항에 있어서, 상기 케토리덕타제 아미노산 서열은 추가로 X17에 해당하는 잔기가 메티오닌인 특징, X27에 해당하는 잔기가 티로신인 특징, X64에 해당하는 잔기가 발린인 특징, X80에 해당하는 잔기가 트레오닌인 특징 및 X100에 해당하는 잔기가 리신인 특징을 갖는 것인 케토리덕타제 폴리펩티드.
  24. 제22항에 있어서, 상기 케토리덕타제 아미노산 서열은 추가로 X66에 해당하는 잔기가 글루탐산인 특징, X96에 해당하는 잔기가 이소루신인 특징, X194에 해당하는 잔기가 글루타민인 특징, X198에 해당하는 잔기가 글루탐산인 특징 및 X216에 해당하는 잔기가 아르기닌인 특징을 갖는 것인 케토리덕타제 폴리펩티드.
  25. 제22항에 있어서, 상기 케토리덕타제 아미노산 서열은 추가로 X66에 해당하는 잔기가 글루탐산인 특징, X96에 해당하는 잔기가 이소루신인 특징, X194에 해당하는 잔기가 글루타민인 특징 및 X198에 해당하는 잔기가 글루탐산인 특징을 갖는 것인 케토리덕타제 폴리펩티드.
  26. 제23항에 있어서, 상기 케토리덕타제 아미노산 서열은 추가로 X194에 해당하는 잔기가 글루타민인 특징, X198에 해당하는 잔기가 글루탐산인 특징 및 X216에 해당하는 잔기가 아르기닌인 특징을 갖는 것인 케토리덕타제 폴리펩티드.
  27. 제24항에 있어서, 상기 케토리덕타제 아미노산 서열은 추가로 X17에 해당하는 잔기가 메티오닌인 특징, X27에 해당하는 잔기가 티로신인 특징, X64에 해당하는 잔기가 발린인 특징, X66에 해당하는 잔기가 아스파르트산인 특징, X80에 해당하는 잔기가 트레오닌인 특징, X96에 해당하는 잔기가 이소루신 또는 루신인 특징 및 X100에 해당하는 잔기가 리신인 특징을 갖는 것인 케토리덕타제 폴리펩티드.
  28. 제1항에 있어서, 상기 케토리덕타제 폴리펩티드는 X190에 해당하는 잔기가 프롤린인 특징 및 X202에 해당하는 잔기가 트립토판인 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열의 90번 내지 211번 잔기와 85% 이상 동일한 아미노산 서열을 갖는 영역 또는 도메인을 포함하며, 단 상기 케토리덕타제 도메인 또는 영역은 X190에 해당하는 잔기가 구속성 잔기이고, X202에 해당하는 잔기가 방향족 잔기인 아미노산 서열을 갖는 것인 케토리덕타제 폴리펩티드.
  29. 제1항에 있어서, 상기 케토리덕타제 폴리펩티드는 X190에 해당하는 잔기가 프롤린인 특징, X195에 해당하는 잔기가 아르기닌인 특징 및 X202에 해당하는 잔기가 트립토판인 특징을 갖는 서열 번호 2, 4 또는 114에 기초한 기준 서열의 90번 내지 211번 잔기와 85% 이상 동일한 아미노산 서열을 갖는 영역 또는 도메인을 포함하며, 단 상기 케토리덕타제 도메인 또는 영역은 X190에 해당하는 잔기가 구속성 잔기이고, X195에 해당하는 잔기가 염기성, 산성, 비극성 또는 극성 잔기이고, X202에 해당하는 잔기가 방향족 잔기인 아미노산 서열을 갖는 것인 케토리덕타제 폴리펩티드.
  30. 제28항에 있어서, 상기 케토리덕타제 도메인 또는 영역은 X190에 해당하는 잔기가 프롤린이고, X202에 해당하는 잔기가 트립토판인 아미노산 서열을 포함하는 것인 케토리덕타제 폴리펩티드.
  31. 제29항에 있어서, 상기 케토리덕타제 도메인 또는 영역은 X190에 해당하는 잔기가 프롤린이고, X195에 해당하는 잔기가 아르기닌이고, X202에 해당하는 잔기가 트립토판인 아미노산 서열을 포함하는 것인 케토리덕타제 폴리펩티드.
  32. 제28항 내지 제31항 중 어느 한 항에 있어서, 상기 케토리덕타제 도메인 또는 영역은 추가로 다음의 특징:
    X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기인 특징,
    X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기인 특징,
    X95에 해당하는 잔기가 지방족, 비극성 또는 산성 잔기인 특징,
    X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기인 특징,
    X97에 해당하는 잔기가 염기성, 구속성 또는 극성 잔기인 특징,
    X100에 해당하는 잔기가 염기성, 산성, 극성, 지방족 또는 비극성 잔기인 특징,
    X108에 해당하는 잔기가 염기성 또는 구속성 잔기인 특징,
    X111에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징,
    X139에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징,
    X145에 해당하는 잔기가 산성, 지방족 또는 비극성 잔기인 특징,
    X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기인 특징,
    X148에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징,
    X151에 해당하는 잔기가 구속성, 비극성 또는 지방족 잔기인 특징,
    X152에 해당하는 잔기가 극성, 방향족, 지방족 또는 비극성 잔기인 특징,
    X163에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징,
    X165에 해당하는 잔기가 극성, 비극성 또는 지방족 잔기인 특징,
    X173에 해당하는 잔기가 산성, 비극성 또는 지방족 잔기인 특징,
    X179에 해당하는 잔기가 방향족, 염기성, 지방족 또는 비극성 잔기인 특징,
    X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기인 특징,
    X196에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징,
    X197에 해당하는 잔기가 산성 잔기인 특징,
    X198에 해당하는 잔기가 산성 또는 극성 잔기인 특징,
    X210에 해당하는 잔기가 극성 또는 염기성 잔기인 특징, 및
    X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기인 특징
    중 하나 이상을 가지며, 경우에 따라 상기 아미노산 서열은 90번∼211번 잔기에 해당하는 도메인 내 다른 아미노산 잔기 위치에서 상기 기준 서열과 비교하여 하나 이상의 차이를 가질 수 있는 것인 케토리덕타제 폴리펩티드.
  33. 제28항 내지 제31항 중 어느 한 항에 있어서, 상기 케토리덕타제 도메인 또는 영역은 추가로 다음의 특징:
    X93에 해당하는 잔기가 세린인 특징,
    X94에 해당하는 잔기가 시스테인 또는 글리신인 특징,
    X95에 해당하는 잔기가 루신 또는 글루탐산인 특징,
    X96에 해당하는 잔기가 시스테인, 아스파라긴, 발린, 루신, 이소루신 또는 트레오닌인 특징,
    X97에 해당하는 잔기가 히스티딘 또는 세린인 특징,
    X100에 해당하는 잔기가 리신인 특징,
    X108에 해당하는 잔기가 히스티딘인 특징,
    X111에 해당하는 잔기가 메티오닌인 특징,
    X139에 해당하는 잔기가 루신인 특징,
    X145에 해당하는 잔기가 글루타민 또는 루신인 특징,
    X147에 해당하는 잔기가 루신인 특징,
    X151에 해당하는 잔기가 알라닌인 특징,
    X152에 해당하는 잔기가 세린인 특징,
    X163에 해당하는 잔기가 이소루신인 특징,
    X165에 해당하는 잔기가 아스파라긴인 특징,
    X173에 해당하는 잔기가 발린인 특징,
    X179에 해당하는 잔기가 페닐알라닌, 리신 또는 루신인 특징,
    X194에 해당하는 잔기가 글루타민, 세린 또는 루신인 특징,
    X196에 해당하는 잔기가 루신인 특징,
    X197에 해당하는 잔기가 글루탐산인 특징,
    X198에 해당하는 잔기가 글루탐산 또는 글루타민인 특징,
    X210에 해당하는 잔기가 아르기닌인 특징, 및
    X211에 해당하는 잔기가 발린, 루신, 아르기닌, 트레오닌 또는 이소루신인 특징
    중 하나 이상을 가지며, 경우에 따라 상기 아미노산 서열은 90번∼211번 잔기에 해당하는 도메인 내 다른 아미노산 잔기 위치에서 상기 기준 서열과 비교하여 하나 이상의 차이를 가질 수 있는 것인 케토리덕타제 폴리펩티드.
  34. 제28항 내지 제31항 중 어느 한 항에 있어서, 상기 케토리덕타제 도메인 또는 영역은 추가로 다음의 특징:
    X93에 해당하는 잔기가 극성, 지방족 또는 비극성 잔기인 특징,
    X94에 해당하는 잔기가 시스테인, 지방족 또는 비극성 잔기인 특징,
    X96에 해당하는 잔기가 시스테인, 극성, 지방족 또는 비극성 잔기인 특징,
    X100에 해당하는 잔기가 염기성, 산성, 극성, 지방족 또는 비극성 잔기인 특징,
    X147에 해당하는 잔기가 방향족, 지방족 또는 비극성 잔기인 특징,
    X194에 해당하는 잔기가 구속성, 극성, 지방족 또는 비극성 잔기인 특징,
    X196에 해당하는 잔기가 비극성 또는 지방족 잔기인 특징,
    X198에 해당하는 잔기가 산성 또는 극성 잔기인 특징, 및
    X211에 해당하는 잔기가 염기성, 지방족, 비극성, 산성 또는 극성 잔기인 특징
    전부를 가지며, 경우에 따라 상기 아미노산 서열은 90번∼211번 잔기에 해당하는 도메인 내 다른 아미노산 잔기 위치에서 상기 기준 서열과 비교하여 하나 이상의 차이를 가질 수 있는 것인 케토리덕타제 폴리펩티드.
  35. 제1항에 있어서, 서열 번호 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 92, 94, 96, 98, 100, 102, 104, 106, 108 및 110으로부터 선택된 아미노산 서열을 포함하는 케토리덕타제 폴리펩티드.
  36. 제1항에 있어서, 기준 폴리펩티드보다 적어도 1∼50 배를 초과하는 전환율로 상기 기질을 상기 생성물로 전환시킬 수 있는 케토리덕타제 폴리펩티드.
  37. 제36항에 있어서, 서열 번호 42, 44, 46, 48, 86, 88, 92, 94, 96, 100 또는 102에 해당하는 아미노산 서열을 포함하는 케토리덕타제 폴리펩티드.
  38. 제1항에 있어서, 기준 폴리펩티드보다 적어도 50∼250 배를 초과하는 전환율로 상기 기질을 상기 생성물로 전환시킬 수 있는 케토리덕타제 폴리펩티드.
  39. 제38항에 있어서, 서열 번호 10, 32, 34, 36, 50, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 98, 104, 106 및 108에 해당하는 아미노산 서열을 포함하는 케토리덕타제 폴리펩티드.
  40. 제1항에 있어서, 기준 폴리펩티드보다 적어도 250∼1,000 배를 초과하는 전환율로 상기 기질을 상기 생성물로 전환시킬 수 있는 케토리덕타제 폴리펩티드.
  41. 제40항에 있어서, 서열 번호 12, 18, 22, 24, 26, 28, 30, 38, 40, 52, 54, 56, 58, 60, 62 및 110에 해당하는 아미노산 서열을 포함하는 케토리덕타제 폴리펩티드.
  42. 제1항에 있어서, 기준 폴리펩티드보다 적어도 1,000 배를 초과하는 전환율로 상기 기질을 상기 생성물로 전환시킬 수 있는 케토리덕타제 폴리펩티드.
  43. 제42항에 있어서, 서열 번호 6, 8, 14, 16 및 20에 해당하는 아미노산 서열을 포함하는 케토리덕타제 폴리펩티드.
  44. 제1항에 있어서, 약 100 g/L 초과의 기질 및 약 5 g/L 미만의 폴리펩티드를 사용하여 수행할 때, 약 24시간 미만 내에 상기 기질의 약 95% 이상을 상기 생성물로 전환시킬 수 있는 케토리덕타제 폴리펩티드.
  45. 제44항에 있어서, 서열 번호 6, 8, 14, 16 및 20에 해당하는 아미노산 서열을 포함하는 케토리덕타제 폴리펩티드.
  46. 제1항에 있어서, 기준 폴리펩티드에 비해 상기 기질의 상기 생성물로의 전환에 대한 경쟁적 억제제로서의 아세톤에 대한 내성이 향상된 케토리덕타제 폴리펩티드.
  47. 제46항에 있어서, 서열 번호 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 98, 104, 106, 108 및 110으로부터 선택된 아미노산 서열을 포함하는 케토리덕타제 폴리펩티드.
  48. 제1항 내지 제46항 중 어느 한 항에 따른 케토리덕타제 폴리펩티드를 코딩하는 폴리뉴클레오티드.
  49. 제48항에 있어서, 서열 번호 에 해당하는 서열로부터 선택되는 폴리뉴클레오티드.
  50. 숙주 세포에서 발현을 지시하기에 적합한 조절 서열에 작동가능하게 연결된 제48항의 폴리뉴클레오티드를 포함하는 발현 벡터.
  51. 제50항에 있어서, 상기 조절 서열은 프로모터를 포함하는 것인 발현 벡터.
  52. 제51항에 있어서, 상기 프로모터는 이. 콜라이(E. coli) 프로모터를 포함하는 것인 발현 벡터.
  53. 제50항의 발현 벡터를 포함하는 숙주 세포.
  54. 제53항에 있어서, 이. 콜라이인 숙주 세포.
  55. 제53항에 있어서, 상기 폴리펩티드를 코딩하는 발현 벡터의 코돈은 숙주 세포에서의 발현을 위해 최적화된 것인 숙주 세포.
  56. 제1항 내지 제46항 중 어느 한 항에 따른 케토리덕타제 및 구조식 I의 기질 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]벤조산 메틸 에스테르; 구조식 II의 생성물 (S,E)-메틸 2-(3-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-히드록시프로필)벤조에이트; 구조식 III의 기질 2-[2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]페닐]-2-프로판올; 또는 구조식 IV의 생성물 (S,E)-1-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-(2-(2-히드록시프로판-2-일)페닐)프로판-1-올을 포함하는 조성물.
  57. 제56항에 있어서, 상기 기질은 구조식 I의 기질이고, 상기 조성물은 구조식 II의 생성물을 더 포함하는 것인 조성물.
  58. 제56항에 있어서, 상기 기질은 구조식 II의 기질이고, 상기 조성물은 구조식 IV의 생성물을 더 포함하는 것인 조성물.
  59. 제56항에 있어서, 보조인자 재생 시스템을 더 포함하는 조성물.
  60. 제59항에 있어서, 상기 보조인자 재생 시스템은 글루코스 탈수소효소 및 글루코스; 포르메이트 탈수소효소 및 포르메이트; 또는 이소프로판올 및 2차 알콜 탈수소효소를 포함하는 것인 조성물.
  61. 구조식 I의 기질 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]벤조산 메틸 에스테르를 구조식 II의 생성물 (S,E)-메틸 2-(3-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-히드록시프로필)벤조에이트로 환원시키는 방법으로서, 상기 구조식 I의 기질을 상기 구조식 II의 생성물로 환원 또는 전환시키기에 적합한 반응 조건하에 상기 구조식 I의 기질을 제1항 내지 제46항 중 어느 한 항에 따른 케토리덕타제 폴리펩티드와 접촉시키는 단계를 포함하는 방법.
  62. 제61항에 있어서, 상기 생성물은 약 99%를 초과하는 입체이성체 잉여율로 존재하는 것인 방법.
  63. 제63항에 있어서, 약 24시간 미만 내에 상기 기질의 약 95% 이상이 상기 생성물로 환원되고, 상기 기질의 농도는 100 g/L 이상이고, 상기 폴리펩티드의 농도는 약 5 g/L 미만이며, 상기 폴리펩티드는 서열 번호 6, 8, 14, 16 및 20에 해당하는 아미노산 서열을 포함하는 것인 방법.
  64. 제61항에 있어서, 상기 케토리덕타제 효소를 발현하는 전체 세포 또는 상기 세포의 추출물 또는 용해물을 사용하여 수행하는 것인 방법.
  65. 제61항에 있어서, 상기 케토리덕타제를 단리 및/또는 정제하고, 환원 반응을 상기 케토리덕타제에 대한 보조인자 및 경우에 따라 상기 보조인자에 대한 재생 시스템의 존재하에 수행하는 것인 방법.
  66. 제65항에 있어서, 상기 보조인자 재생 시스템은 글루코스 탈수소효소 및 글루코스; 포르메이트 탈수소효소 및 포르메이트; 또는 이소프로판올 및 2차 알콜 탈수소효소를 포함하는 것인 방법.
  67. 제66항에 있어서, 상기 2차 알콜 탈수소효소는 상기 케토리덕타제인 방법.
  68. 구조식 III의 기질 2-[2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]페닐]-2-프로판올을 생성물 (S,E)-1-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-(2-(2-히드록시프로판-2-일)페닐)프로판-1-올로 환원시키는 방법으로서, 상기 구조식 III의 기질을 구조식 IV의 생성물로 환원시키기에 적합한 반응 조건하에 상기 구조식 III의 기질을 제1항 내지 제46항 중 어느 한 항에 따른 케토리덕타제 폴리펩티드와 접촉시키는 단계를 포함하는 방법.
  69. 제68항에 있어서, 상기 생성물은 약 99%를 초과하는 입체이성체 잉여율로 존재하는 것인 방법.
  70. 제68항에 있어서, 약 24시간 미만 내에 상기 기질의 약 95% 이상이 상기 생성물로 환원되고, 상기 기질의 농도는 100 g/L 이상이고, 상기 폴리펩티드의 농도는 약 5 g/L 미만이며, 상기 폴리펩티드는 서열 번호 6, 8, 14, 16 및 20에 해당하는 아미노산 서열을 포함하는 것인 방법.
  71. 제68항에 있어서, 상기 케토리덕타제 효소를 발현하는 전체 세포 또는 상기 세포의 추출물 또는 용해물을 사용하여 수행하는 것인 방법.
  72. 제68항에 있어서, 상기 케토리덕타제를 단리 및/또는 정제하고, 환원 반응을 상기 케토리덕타제에 대한 보조인자 및 경우에 따라 상기 보조인자에 대한 재생 시스템의 존재하에 수행하는 것인 방법.
  73. 제72항에 있어서, 상기 보조인자 재생 시스템은 글루코스 탈수소효소 및 글루코스; 포르메이트 탈수소효소 및 포르메이트; 또는 이소프로판올 및 2차 알콜 탈수소효소를 포함하는 것인 방법.
  74. 제73항에 있어서, 상기 2차 알콜 탈수소효소는 상기 케토리덕타제인 방법.
  75. 하기 구조식 XX의 화합물의 합성 방법으로서,
    (a) 구조식 I의 기질 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]벤조산 메틸 에스테르를 구조식 II의 생성물 (S,E)-메틸 2-(3-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-히드록시프로필)벤조에이트로 환원 또는 전환시키기에 적합한 반응 조건하에 상기 구조식 I의 기질을 제1항 내지 제46항 중 어느 한 항에 따른 케토리덕타제 폴리펩티드와 접촉시켜 상기 구조식 I의 기질을 상기 구조식 II의 생성물로 환원시키는 단계, 및
    (b) 하기 구조식 XX의 화합물을 형성하기에 적합한 조건하에 상기 구조식 II의 화합물을 알킬설포닐 할라이드 또는 아릴설포닐 할라이드와 반응시키는 단계
    를 포함하는 방법:
    구조식 XX
    Figure pct00029

    [상기 식 중, R1은 알킬설포닐 또는 아릴설포닐이다].
  76. 제75항에 있어서, 상기 알킬설포닐 할라이드는 메틸설포닐 클로라이드인 방법.
  77. 하기 구조식 XXI의 화합물의 합성 방법으로서,
    (a) 구조식 III의 기질 2-[2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]페닐]-2-프로판올을 구조식 IV의 생성물 (S,E)-1-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-(2-(2-히드록시프로판-2-일)페닐)프로판-1-올로 환원 또는 전환시키기에 적합한 반응 조건하에 상기 구조식 III의 기질을 제1항 내지 제46항 중 어느 한 항에 따른 케토리덕타제 폴리펩티드와 접촉시켜 상기 구조식 III의 기질을 상기 구조식 IV의 생성물로 환원시키는 단계, 및
    (b) 하기 구조식 XXI의 화합물을 형성하기에 적합한 조건하에 상기 구조식 IV의 화합물을 알킬설포닐 할라이드 또는 아릴설포닐 할라이드와 반응시키는 단계
    를 포함하는 방법:
    구조식 XXI
    Figure pct00030

    [상기 식 중, R1은 알킬설포닐 또는 아릴설포닐이다].
  78. 제75항에 있어서, 상기 알킬설포닐 할라이드는 메틸설포닐 클로라이드인 방법.
  79. 하기 구조식 V의 화합물 또는 이의 염, 수화물 또는 용매화물의 합성 방법으로서, 이 방법에서의 단계가 구조식 I의 기질 2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]벤조산 메틸 에스테르를 구조식 II의 생성물 (S,E)-메틸 2-(3-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-히드록시프로필)벤조에이트로 환원 또는 전환시키기에 적합한 반응 조건하에 상기 구조식 I의 기질을 제1항 내지 제46항 중 어느 한 항에 따른 케토리덕타제 폴리펩티드와 접촉시켜 상기 구조식 I의 기질을 상기 구조식 II의 생성물로 환원시키는 것을 포함하는 방법:
    구조식 V
    Figure pct00031
    .
  80. 하기 구조식 V의 화합물 또는 이의 염, 수화물 또는 용매화물의 합성 방법으로서, 이 방법에서의 단계가 구조식 III의 기질 2-[2-[3-[3-[2-(7-클로로-2-퀴놀리닐)에테닐]페닐]-3-옥소프로필]페닐]-2-프로판올을 구조식 IV의 생성물 (S,E)-1-(3-(2-(7-클로로퀴놀린-2-일)비닐)페닐)-3-(2-(2-히드록시프로판-2-일)페닐)프로판-1-올로 환원시키기에 적합한 반응 조건하에 상기 구조식 III의 기질을 제1항 내지 제46항 중 어느 한 항에 따른 케토리덕타제 폴리펩티드와 접촉시켜 상기 구조식 III의 기질을 상기 구조식 IV의 생성물로 환원시키는 것을 포함하는 방법:
    구조식 V
    Figure pct00032
    .
KR1020107009238A 2007-09-28 2008-09-28 케토리덕타제 폴리펩티드 및 이의 용도 KR20100061571A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US97634507P 2007-09-28 2007-09-28
US60/976,345 2007-09-28

Publications (1)

Publication Number Publication Date
KR20100061571A true KR20100061571A (ko) 2010-06-07

Family

ID=40042831

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020107009238A KR20100061571A (ko) 2007-09-28 2008-09-28 케토리덕타제 폴리펩티드 및 이의 용도

Country Status (8)

Country Link
US (2) US8088610B2 (ko)
EP (1) EP2203557B1 (ko)
JP (1) JP2010539948A (ko)
KR (1) KR20100061571A (ko)
CN (1) CN101889081B (ko)
AT (1) ATE547513T1 (ko)
IL (1) IL204331A (ko)
WO (1) WO2009042984A1 (ko)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008103248A1 (en) 2007-02-08 2008-08-28 Codexis, Inc. Ketoreductases and uses thereof
WO2009029554A2 (en) * 2007-08-24 2009-03-05 Codexis, Inc. Improved ketoreductase polypeptides for the stereoselective production of (r)-3-hydroxythiolane
WO2009036404A2 (en) * 2007-09-13 2009-03-19 Codexis, Inc. Ketoreductase polypeptides for the reduction of acetophenones
CN101883846A (zh) 2007-10-01 2010-11-10 科德克希思公司 用于生成氮杂环丁酮的还原酶多肽
ES2560459T3 (es) 2008-08-27 2016-02-19 Codexis, Inc. Polipéptidos cetorreductasa para la producción de una 3-aril-3-hidroxipropanamina a partir de una 3-aril-3-cetopropanamina
US8288141B2 (en) 2008-08-27 2012-10-16 Codexis, Inc. Ketoreductase polypeptides for the production of 3-aryl-3-hydroxypropanamine from a 3-aryl-3-ketopropanamine
US8288131B2 (en) * 2008-08-27 2012-10-16 Codexis, Inc. Ketoreductase polypeptides and uses thereof
EP2329014B1 (en) 2008-08-29 2014-10-22 Codexis, Inc. Ketoreductase polypeptides for the stereoselective production of (4s)-3[(5s)-5(4-fluorophenyl)-5-hydroxypentanoyl]-4-phenyl-1,3-oxazolidin-2-one
CA2738574A1 (en) 2008-09-26 2010-04-01 Kesen Ma Thermostable alcohol dehydrogenase derived from thermococcus guaymasensis
CN102482648B (zh) * 2009-06-22 2014-12-10 科德克希思公司 酮还原酶介导的产生α氯代醇的立体选择性途径
ES2575560T3 (es) 2009-08-19 2016-06-29 Codexis, Inc. Polipéptidos cetorreductasa para preparar fenilefrina
CN101638381B (zh) * 2009-09-02 2012-08-29 鲁南制药集团股份有限公司 孟鲁司特钠中间体的合成方法
SG181535A1 (en) 2009-12-08 2012-07-30 Codexis Inc Synthesis of prazole compounds
US9080192B2 (en) 2010-02-10 2015-07-14 Codexis, Inc. Processes using amino acid dehydrogenases and ketoreductase-based cofactor regenerating system
US9040262B2 (en) 2010-05-04 2015-05-26 Codexis, Inc. Biocatalysts for ezetimibe synthesis
US9267159B2 (en) 2010-12-08 2016-02-23 Codexis, Inc. Biocatalysts and methods for the synthesis of armodafinil
WO2012142302A2 (en) 2011-04-13 2012-10-18 Codexis, Inc. Biocatalytic process for preparing eslicarbazepine and analogs thereof
US20140308717A1 (en) * 2011-08-05 2014-10-16 Evonik Degussa Gmbh Oxidation and amination of secondary alcohols
CN104053771B (zh) 2011-11-18 2016-11-09 科德克希思公司 用于制备羟基取代的氨基甲酸酯的生物催化剂
EP2847214B1 (en) 2012-05-11 2017-12-27 Codexis, Inc. Engineered imine reductases and methods for the reductive amination of ketone and amine compounds
CN102776157B (zh) * 2012-08-21 2013-09-04 尚科生物医药(上海)有限公司 改进的酮还原酶多肽、其编码基因以及表达该多肽的细胞
CN102827851B (zh) * 2012-09-06 2013-11-13 江苏阿尔法药业有限公司 一种酮还原酶基因及其应用
WO2014081616A1 (en) * 2012-11-21 2014-05-30 Merck Sharp & Dohme Corp. Preparation of precursors for leukotriene antagonists
US10150959B2 (en) 2013-03-15 2018-12-11 Merck Sharp & Dohme Corp. Immobilized ketoreductases and process for making and using immobilized ketoreductase
CN103421854A (zh) * 2013-07-30 2013-12-04 苏州汉酶生物技术有限公司 一种(s)-3-(二甲胺基)-1-(噻吩-2-基)-1-丙醇的生物制备方法
CN105765592B (zh) 2013-09-27 2019-12-17 科德克希思公司 用于酶变体的自动筛选的方法、装置和系统
CN106232619B (zh) 2013-11-13 2022-09-09 科德克希思公司 工程化的亚胺还原酶和用于酮和胺化合物的还原胺化的方法
CN103710405A (zh) * 2013-12-31 2014-04-09 苏州汉酶生物技术有限公司 一种生物法制备孟鲁斯特中间体的方法
CN104928265B (zh) * 2014-03-17 2018-01-02 江苏阿尔法药业有限公司 一种酮还原酶突变体及其制备和应用
EP3134519B1 (en) 2014-04-22 2018-06-06 c-LEcta GmbH Ketoreductases
HUE053363T2 (hu) 2014-11-25 2021-06-28 Codexis Inc Módosított iminreduktázok és eljárások keton- és aminvegyületek reduktív aminálására
CN104561052A (zh) * 2014-12-22 2015-04-29 江苏阿尔法药业有限公司 一种重组甲酸脱氢酶及其制备方法和应用
CN104745652A (zh) * 2015-03-25 2015-07-01 苏州汉酶生物技术有限公司 一种孟鲁斯特中间体的制备方法
US10406345B2 (en) 2015-10-16 2019-09-10 Zoll Medical Corporation Dual sensor electrodes for providing enhanced resuscitation feedback
EP3652328A1 (en) 2017-07-14 2020-05-20 c-LEcta GmbH Ketoreductases
CN109182410B (zh) * 2018-09-29 2020-10-02 台州学院 一种(S)-N-Boc-3-羟基哌啶的酶催化制备方法
CN109371067A (zh) * 2018-11-30 2019-02-22 上海合全药业股份有限公司 生物催化制备(r)-4-癸醇的方法
CN109486866A (zh) * 2018-11-30 2019-03-19 上海合全药业股份有限公司 生物催化制备(s)-4-癸醇的方法
MX2022003684A (es) * 2019-09-26 2022-04-25 Codexis Inc Polipeptidos y polinucleotidos de ceto-reductasa.
CN111718965A (zh) * 2020-06-17 2020-09-29 宁波酶赛生物工程有限公司 一种(2s,3s)-2,3-丁二醇的制备方法
CN111676201A (zh) * 2020-06-30 2020-09-18 宁波酶赛生物工程有限公司 具有立体选择性的酮还原酶与(s)-3-羟基丁酸乙酯的不对称合成方法

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4014573C1 (ko) * 1990-05-07 1991-10-10 Forschungszentrum Juelich Gmbh, 5170 Juelich, De
US5565473A (en) * 1990-10-12 1996-10-15 Merck Frosst Canada, Inc. Unsaturated hydroxyalkylquinoline acids as leukotriene antagonists
US5225339A (en) * 1992-02-26 1993-07-06 The Scripps Research Institute Lactobacillus kefir alcohol dehydrogenase
JP3155107B2 (ja) * 1993-01-12 2001-04-09 ダイセル化学工業株式会社 光学活性4−ハロ−3−ヒドロキシ酪酸エステルの製造方法
US5427933A (en) * 1994-07-20 1995-06-27 Merck & Co., Inc. Reduction of phenylalkyl ketones to the corresponding (S)-hydroxy derivatives using mucor hiemalis IFO 5834
US5491077A (en) * 1994-07-20 1996-02-13 Merck & Co., Inc. Microbial method
US5545758A (en) * 1994-08-11 1996-08-13 Merck & Co., Inc. Process for the preparation of diisopinocampheylchloroborane
JPH08336393A (ja) * 1995-04-13 1996-12-24 Mitsubishi Chem Corp 光学活性なγ−置換−β−ヒドロキシ酪酸エステルの製造法
DE19610984A1 (de) * 1996-03-21 1997-09-25 Boehringer Mannheim Gmbh Alkohol-Dehydrogenase und deren Verwendung zur enzymatischen Herstellung chiraler Hydroxyverbindungen
US5891685A (en) * 1996-06-03 1999-04-06 Mitsubishi Chemical Corporation Method for producing ester of (S)-γ-halogenated-β-hydroxybutyric acid
US5952347A (en) * 1997-03-13 1999-09-14 Merck & Co., Inc. Quinoline leukotriene antagonists
DE19812004A1 (de) * 1998-03-19 1999-09-30 Forschungszentrum Juelich Gmbh Dehydrogenasen mit verbesserter NAD-Abhängigkeit, deren Herstellung und Verwendung
DE19857302C2 (de) * 1998-12-14 2000-10-26 Forschungszentrum Juelich Gmbh Verfahren zur enantioselektiven Reduktion von 3,5-Dioxocarbonsäuren, deren Salze und Ester
WO2001004336A1 (de) * 1999-07-09 2001-01-18 Forschungszentrum Jülich GmbH Verfahren zur reduktion von keto-carbonsäuren und deren estern
US6645746B1 (en) * 1999-12-03 2003-11-11 Kaneka Corporation Carbonyl reductase, gene thereof and method of using the same
CN1300833A (zh) * 1999-12-23 2001-06-27 复旦大学 一种新的多肽-醛/酮还原酶5和编码这种多肽的多核苷酸
DE10037101A1 (de) * 2000-07-27 2002-02-07 Degussa Rekombinant hergestellte Enzyme mit verbesserter NAD(H)-Akzeptanz
US7202070B2 (en) * 2000-10-31 2007-04-10 Biocatalytics, Inc. Method for reductive amination of a ketone using a mutated enzyme
BR0208265A (pt) * 2001-03-22 2004-03-02 Bristol Myers Squibb Co Redução estereosseletiva de acetofenona substituìda
DE10119274A1 (de) 2001-04-20 2002-10-31 Juelich Enzyme Products Gmbh Enzymatisches Verfahren zur enantioselektiven Reduktion von Ketoverbindungen
JP4213524B2 (ja) * 2003-04-17 2009-01-21 ダイセル化学工業株式会社 新規なカルボニル還元酵素、その酵素をコードするdnaを含むポリヌクレオチド、その製造方法、およびこれを利用した光学活性アルコールの製造方法
CA2533838A1 (en) * 2003-08-11 2005-02-24 Codexis, Inc. Improved ketoreductase polypeptides and related polynucleotides
DE10345772A1 (de) 2003-10-01 2005-04-21 Basf Ag Verfahren zur Herstellung von 3-Methylamino-1-(thien-2-yl)-propan-1-ol
JP4394647B2 (ja) 2003-12-02 2010-01-06 メルシャン株式会社 光学活性テトラヒドロチオフェン誘導体の製造方法、および、光学活性テトラヒドロチオフェン−3−オールの晶析方法
US7189853B2 (en) * 2004-04-15 2007-03-13 Dr. Reddy's Laboratories Limited Process for the preparation of [R-(E)-1-[[[1-[3-[2-[7-chloro-2-quinolinyl]ethenyl]phenyl]-3-[2-(1-hydroxy-1-methylethyl)phenyl]propyl]thio]methyl]cyclopropaneacetic acid (Montelukast) and its pharmaceutically acceptable salts
MXPA06012220A (es) 2004-04-21 2007-07-18 Teva Pharma Procesos para preparar sodio de montelukast.
US7501517B2 (en) 2004-04-30 2009-03-10 Synthon Ip, Inc. Process for making montelukast and intermediates therefor
US7829716B2 (en) 2004-04-30 2010-11-09 Synthon Pharmaceuticals, Inc. Process for making montelukast and intermediates therefor
DE602004031678D1 (de) 2004-07-19 2011-04-14 Matrix Lab Ltd Verfahren zur herstellung von montelukast und salzen davon
WO2006008562A1 (en) 2004-07-23 2006-01-26 Pliva-Istrazivanje I Razvoj D.O.O. Process
WO2006021974A1 (en) 2004-08-23 2006-03-02 Morepen Laboratories Limited A process for synthesizing diol (viii)-an intermediate of montelukast sodium
CA2589936A1 (en) 2004-11-30 2006-06-08 Medichem S.A. New process for the preparation of a leukotriene antagonist
WO2006130657A2 (en) * 2005-05-31 2006-12-07 Bristol-Myers Squibb Company Stereoselective reduction process for the preparation of pyrrolotriazine compounds
EP1940793A4 (en) 2005-07-05 2011-03-23 Matrix Lab Ltd METHOD FOR PRODUCING MONTELUCASTS
CA2616129A1 (en) 2005-07-20 2007-01-25 Dr. Reddy's Laboratories Ltd. Preparation of montelukast
AT502395B1 (de) 2005-07-27 2007-03-15 Iep Gmbh Oxidoreduktasen zur stereoselektiven reduktion von ketoverbindungen
US20060223999A1 (en) * 2006-05-10 2006-10-05 Chemagis Ltd. Process for preparing montelukast and precursors thereof
WO2008042876A2 (en) 2006-10-02 2008-04-10 Codexis, Inc. Compositions and methods for producing stereoisomerically pure statins and synthetic intermediates therefor
WO2008103248A1 (en) * 2007-02-08 2008-08-28 Codexis, Inc. Ketoreductases and uses thereof
WO2009029554A2 (en) * 2007-08-24 2009-03-05 Codexis, Inc. Improved ketoreductase polypeptides for the stereoselective production of (r)-3-hydroxythiolane
WO2009036404A2 (en) * 2007-09-13 2009-03-19 Codexis, Inc. Ketoreductase polypeptides for the reduction of acetophenones
CN101883846A (zh) * 2007-10-01 2010-11-10 科德克希思公司 用于生成氮杂环丁酮的还原酶多肽

Also Published As

Publication number Publication date
CN101889081A (zh) 2010-11-17
JP2010539948A (ja) 2010-12-24
US20120184000A1 (en) 2012-07-19
US8617853B2 (en) 2013-12-31
IL204331A (en) 2013-04-30
WO2009042984A1 (en) 2009-04-02
ATE547513T1 (de) 2012-03-15
EP2203557B1 (en) 2012-02-29
EP2203557A1 (en) 2010-07-07
US8088610B2 (en) 2012-01-03
CN101889081B (zh) 2014-06-18
US20090155863A1 (en) 2009-06-18

Similar Documents

Publication Publication Date Title
US11479756B2 (en) Ketoreductase polypeptides for the reduction of acetophenones
EP2203557B1 (en) Ketoreductase polypeptides and uses thereof
US9932615B2 (en) Ketoreductase polypeptides for the production of (R)-3-hydroxythiolane
EP2205727B1 (en) Ketoreductase polypeptides for the production of azetidinone

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid