KR20190017045A - 글루코스-1-포스페이트에 의한 스테비올 글리코시드 및 다른 화합물의 효소 글리코실화 - Google Patents
글루코스-1-포스페이트에 의한 스테비올 글리코시드 및 다른 화합물의 효소 글리코실화 Download PDFInfo
- Publication number
- KR20190017045A KR20190017045A KR1020197001208A KR20197001208A KR20190017045A KR 20190017045 A KR20190017045 A KR 20190017045A KR 1020197001208 A KR1020197001208 A KR 1020197001208A KR 20197001208 A KR20197001208 A KR 20197001208A KR 20190017045 A KR20190017045 A KR 20190017045A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- ala
- asp
- val
- gly
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/18—Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/02—Monosaccharides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/44—Preparation of O-glycosides, e.g. glucosides
- C12P19/56—Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P33/00—Preparation of steroids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
- C12Y204/01007—Sucrose phosphorylase (2.4.1.7)
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 글리코실 트랜스퍼라제(GT) 효소, GT 활성을 갖는 폴리펩티드, 및 상기 효소를 코딩하는 폴리뉴클레오티드, 그리고 이러한 폴리뉴클레오티드 및 폴리펩티드를 포함하는 벡터 및 숙주 세포를 제공한다. 본 발명은 또한 β-글루코스 연결을 갖는 산물을 생산하기 위해 이러한 GT 효소를 사용하는 방법을 제공한다.
Description
본 출원은 미국 가특허 출원 일련 번호 62/350,450(2016년 6월 15일 출원)에 대한 우선권을 주장하며, 이로써 사실상 이의 전문을 전고 인용한다.
본 발명의 분야
본 발명은 글리코실트랜스퍼라제(GT) 효소, GT 활성을 갖는 폴리펩티드, 및 상기 효소를 코딩하는 폴리뉴클레오티드, 그리고 상기 폴리뉴클레오티드 및 폴리펩티드를 포함한 벡터 및 숙주 세포를 제공한다. 본 발명은 또한 β-글루코스 연결을 갖는 산물을 생산하기 위해 상기 GT 효소를 사용하는 방법을 제공한다.
ASCII 텍스트 파일로서 제출된 "서열 목록", 표, 또는 컴퓨터 프로그램 목록 부록에 대한 참조
서열 목록의 공식 사본은, 파일명 "CX8-155USP1_ST25.txt", 생성 일자 2016년 6월 14일, 및 크기 98,304 바이트로 하여, EFS-웹을 통해 ASCII 포멧 텍스트 파일로서 명세서와 동시에 제출된다. EFS-웹을 통해 제출된 서열 목록은 명세서의 일부이며 본원에 그 전문이 참고 인용된다.
글리코실트랜스퍼라제(GT)는 활성화된 뉴클레오티드 당으로부터 단량체 및 중합체 수용체 분자(예, 다른 당, 단백질, 지질, 및 다른 유기 기질)로 글리코실 잔기를 번역후 전달하는 효소이다. 이러한 글리코실화된 분자는 다양한 대사 경로 및 과정에 관여한다. 글루코실 모이어티의 전달은 수용체의 생물활성, 용해성, 및 세포 내 수송 특성을 변화시킬 수 있다.
본 발명은 글리코실트랜스퍼라제 효소, GT 활성을 갖는 폴리펩티드, 및 상기 효소를 코딩하는 폴리뉴클레오티드, 그리고 상기 폴리뉴클레오티드 및 폴리펩티드를 포함한 벡터 및 숙주 세포를 제공한다. 본 발명은 또한 β-글루코스 연결을 갖는 산물을 생산하기 위해 상기 GT 효소를 사용하는 방법을 제공한다.
본 발명은 베타-글리코실화된 산물을 생산하기 위해 기질을 글리코실화시키는 방법으로서, 적어도 하나의 글리코실기 공여체, 적어도 하나의 글리코실기 수용체 및 적어도 하나의 글리코실트랜스퍼라제 효소를 제공하는 단계; 베타-글루코스 연결을 갖는 적어도 하나의 산물을 생산하기 위해 글리코실기 수용체가 글리코실화되도록 하는 조건 하에서 글리코실트랜스퍼라제 효소와, 글리코실기 공여체 및 글리코실기 수용체를 접촉시키는 단계를 포함하는 방법을 제공한다. 상기 방법의 일부 실시양태에서, 글리코실기 공여체는 글리코실포스페이트이다. 상기 방법의 일부 추가 실시양태에서, 글리코실기 공여체는 글루코스-1-포스페이트이다. 상기 방법의 일부 추가 실시양태에서, 글리코실기 수용체는 글리코실, 알콕시, 카르복시, 아미노카르보닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카르복시알킬, 아미노알킬, 할로알킬, 알킬티오알킬, 헤테로시클로알킬, 헤테로아릴 및 헤테로아릴알킬 기에서 선택된다. 상기 방법의 일부 추가 실시양태에서, 베타-글루코스 연결을 갖는 산물은 스테비올 글리코시드이다. 상기 방법의 일부 추가 실시양태에서, 글리코실기 수용체는 스테비오시드이고, 상기 글리코실기 공여체는 알파-글루코스-1-포스페이트이고, 베타-글루코스 연결을 갖는 상기 산물은 레바우디오시드 A이다. 상기 방법의 일부 추가 실시양태에서, 글리코실트랜스퍼라제는 서열번호 2, 4, 6, 8, 10, 12 및 14로 제시된 폴리펩티드에서 선택된다.
본 발명은 또한 글루코스-1-포스페이트를 생산하는 방법으로서, 포스포릴라제, 무기 포스페이트, 및 포스포릴라제의 이당류, 삼당류 또는 올리고당류 기질을 제공하는 단계; 단당류 및 글루코스-1-포스페이트를 생산하기 위해 상기 당류가 분해되도록 하는 조건 하에 상기 포스포릴라제, 무기 포스페이트 및 당류를 접촉시키는 단계를 포함하는 방법을 제공한다. 상기 방법의 일부 실시양태에서, 상기 방법은 앞서 기술된 방법과 조합된다. 상기 방법의 일부 추가 실시양태에서, 글루코실기 수용체는 글리코실, 알콕시, 카르복시, 아미노카르보닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카르복시알킬, 아미노알킬, 할로알킬, 알킬티오알킬, 헤테로시클로알킬, 헤테로아릴 및 헤테로아릴알킬 기에서 선택된다. 상기 방법의 일부 추가 실시양태에서, 포스포릴라제는 수크로스 포스포릴라제이고, 상기 당류는 수크로스이고, 상기 생산된 단당류는 수크로스이고, 상기 생산된 글루코스-1-포스페이트는 α-글루코스-1-포스페이트이다. 상기 방법의 일부 추가 실시양태에서, 포스포릴라제는 서열번호 16, 18, 20, 22, 24,26, 28, 30 및 32에서 선택된 폴리펩티드 서열을 포함한다.
도 1에는 글리코실트랜스퍼라제가 글리코실포스페이트, 예컨대 글루코스-1-포스페이트로부터 수용체, 예컨대 R-OH로의 글리코실기의 전달을 촉진하고, 이때 R은 임의의 글리코실, 알콕시, 카르복시, 아미노카르보닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카르복시알킬, 아미노알킬, 할로알킬, 알킬티오알킬, 헤테로시클로알킬, 헤테로아릴 또는 헤테로아릴알킬 기인 효소 반응 도식을 제공한다.
도 2에는 도 1에 기술된 효소 반응이 기질 스테비오시드에 적용되고, 글리코실포스페이트가 α-글루코스-1-포스페이트이며 β-글루코스 연결의 형성을 촉진하여 산물 레바우디오시드 A를 생산하는 본 발명의 실시양태의 개략도를 제공한다.
도 3에는 글루코스-1-포스페이트의 계내 형성을 위해 두 효소 반응이 쌍을 이루는 본 발명의 실시양태의 개략도를 제공한다. 한 반응에서, 수크로스 포스포릴라제가 무기 포스페이트를 사용하여 수크로스를 분해함으로써, α-글루코스-1-포스페이트 및 프룩토스를 제공하고, 다른 반응에서, α-글루코스-1-포스페이트로부터의 글리코실기가 수용체로 전달된다. R은 임의의 글리코실, 알콕시, 카르복시, 아미노카르보닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카르복시알킬, 아미노알킬, 할로알킬, 알킬티오알킬, 헤테로시클로알킬, 헤테로아릴 또는 헤테로아릴알킬 기이다.
도 2에는 도 1에 기술된 효소 반응이 기질 스테비오시드에 적용되고, 글리코실포스페이트가 α-글루코스-1-포스페이트이며 β-글루코스 연결의 형성을 촉진하여 산물 레바우디오시드 A를 생산하는 본 발명의 실시양태의 개략도를 제공한다.
도 3에는 글루코스-1-포스페이트의 계내 형성을 위해 두 효소 반응이 쌍을 이루는 본 발명의 실시양태의 개략도를 제공한다. 한 반응에서, 수크로스 포스포릴라제가 무기 포스페이트를 사용하여 수크로스를 분해함으로써, α-글루코스-1-포스페이트 및 프룩토스를 제공하고, 다른 반응에서, α-글루코스-1-포스페이트로부터의 글리코실기가 수용체로 전달된다. R은 임의의 글리코실, 알콕시, 카르복시, 아미노카르보닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카르복시알킬, 아미노알킬, 할로알킬, 알킬티오알킬, 헤테로시클로알킬, 헤테로아릴 또는 헤테로아릴알킬 기이다.
본 발명의 설명
본 발명은 글리코실트랜스퍼라제(GT) 효소, GT 활성을 갖는 폴리펩티드, 및 상기 효소를 코딩하는 폴리뉴클레오티드, 그리고 상기 폴리뉴클레오티드 및 폴리펩티드를 포함한 벡터 및 숙주 세포를 제공한다. 본 발명은 또한 β-글루코스 연결을 갖는 산물을 생산하기 위해 상기 GT 효소를 사용하는 방법을 제공한다.
달리 정의되지 않는 한, 본원에 사용되는 모든 기술적 및 과학적 용어는 일반적으로 본 발명이 속하는 업계의 당업자에 의해 공통적으로 이해되는 바와 동일한 의미를 갖는다. 일반적으로, 본원에 사용된 명명법 및 하기 기술되는 세포 배양, 분자 유전학, 미생물학, 유기 화학, 분석 화학 및 핵산 화학의 실험 절차는 당업계에서 잘 공지되어 있고 공통적으로 사용되는 것이다. 이러한 기법은 잘 공지되어 있고 당업자에게 잘 공지된 많은 문헌 및 참고문헌에 기재되어 있다. 표준 기법 또는 이의 변법은 화학 합성 및 화학 분석에 사용된다. 본원에 언급되는 모든 특허, 특허 출원, 규약 및 간행물은 상기 및 하기 모두에서 명시적으로 본원에 참고 인용된다.
본원에 기술된 것과 유사하거나 동등한 임의의 적당한 방법 및 재료가 본 발명의 실시에 사용되지만, 일부 방법 및 재료가 본원에 기술된다. 본 발명은 기술된 특정 방법, 프로토콜 및 시약이 당업자에 의해 사용되는 상황에 따라 달라질 수 있기 때문에 제한되지 않는다는 것을 이해하여야 한다. 따라서, 하기 바로 정의된 용어는 본 발명 전체를 참조하여 더욱 완전하게 기술된다.
전술된 일반 설명 및 다음의 상세 설명 모두는 단지 예시적이며 설명적인 것이고 본 발명을 제한하지 않는다는 것을 이해하여야 한다. 본원에 사용된 섹션 제목은 단지 구성 목적을 위한 것이며 기술된 청구 대상을 제한하는 것으로 이해해서는 안된다. 수치 범위는 범위를 정의하는 숫자를 포함한다. 따라서, 본원에 개시된 모든 수치 범위는 그러한 더 좁은 수치 범위가 모두 본원에 명시적으로 기재되는 것처럼 더 넓은 수치 범위 내에 속하는 모든 더 좁은 수치 범위를 포함하도록 의도된다. 또한, 본원에 개시된 모든 최대 (또는 최소) 수치 한계는 그러한 더 낮은 (또는 더 높은) 수치 한계가 명시적으로 기재되는 것처럼 모든 더 낮은 (또는 더 높은) 수치 한계를 포함하는 것으로 의도된다.
약어
유전적으로 코딩된 아미노산에 사용되는 약어는 일반적이며 다음과 같다:
3자 약어가 사용되는 경우, "L" 또는 "D"로 명확하게 표시되거나 약어가 사용된 문맥에서 명확하지 않는 한, 아미노산은 α-탄소(Cα)에 대한 L- 또는 D-배열일 수 있다. 예를 들면, "Ala"는 α-탄소에 대한 배열이 구체화되지 않고 알라닌을 지정하지만, "D-Ala" 및 "L-Ala"는 각각 D-알라닌 및 L-알라닌을 지정한다. 1자 약어가 사용되는 경우, 대문자는 α-탄소에 대한 L-배열의 아미노산을 지정하고, 소문자는 α-탄소에 대한 D-배열의 아미노산을 지정한다. 예를 들면, "A"는 L-알라닌을 지정하고 "a"는 D-알라닌을 지정한다. 폴리펩티드 서열이 1자 또는 3자 약어 (또는 이의 혼합)의 문자열로 제시되는 경우, 그 서열은 일반 규정에 따라 아미노(N)에서 카르복시(C) 방향으로 제시된다.
뉴클레오시드를 유전적으로 코딩하는 데 사용되는 약어는 일반적이며 다음과 같다: 아데노신(A); 구아노신(G); 시티딘(C); 티미딘(T); 및 우리딘(U). 구체적으로 설명되지 않는 한, 약기된 뉴클레오시드는 리보뉴클레오시드 또는 2'-데옥시리보뉴클레오시드일 수 있다. 뉴클레오시드는 개개의 기초 하에 또는 총체적 기초 하에 리보뉴클레오시드 또는 2'-데옥시리보뉴클레오시드로 구체화될 수 있다. 핵산 서열이 1자 약어 문자열로서 제시되는 경우, 서열은 일반 규정에 따라 5'에서 3' 방향으로 제시되고, 포스페이트는 제시되지 않는다.
정의
본 발명과 관련하여, 본원에의 설명에 사용된 기술적 및 과학적 용어는 달리 구체적으로 정의되지 않는 한 당업자에게 공통적으로 이해되는 의미를 갖는다. 따라서, 하기 용어는 하기 의미를 갖는 것으로 의도된다.
본원에 사용된 바와 같이, 단수 형태("a", "an" 및 "the")는 문맥상 명확하게 달리 제시되지 않는 한 복수 형태를 포함한다. 따라서, 예를 들어, "폴리펩티드"에 대한 언급은 하나 이상의 폴리펩티드를 포함한다.
유사하게, "포함하다", "포함하는", "함유하다", 및 "함유하는"은 상호혼용가능하고 제한하려는 의도가 아니다. 따라서, 본원에 사용된 바와 같이, 용어 "포함하는" 및 이의 유사어는 이의 포괄적 의미(즉, 용어 "함유하는" 및 이의 상응하는 유사어와 동등)로 사용된다.
다양한 실시양태의 설명이 용어 "포함하는"을 사용하는 경우, 당업자는 일부 특정 예시에서 실시양태가 용어 "본질적으로 이루어지는" 또는 "이루어지는"를 사용하여 대안적으로 기술될 수 있다는 것을 이해할 것으로 추가로 이해되어야 한다.
용어 "약"은 특정 값에 대한 허용 오차를 의미한다. 일부 예시에서, "약"은 제시된 값 범위의 0.05%, 0.5%, 1.0% 또는 2.0% 이내를 의미한다. 일부 예시에서, "약"은 제시된 값의 1, 2, 3 또는 4 표준 편차 이내를 의미한다.
"EC" 번호는 생화학 및 분자생물학 국제 연합 명명 위원회(NC-IUBMB)의 효소 명명법을 나타낸다. IUBMB 생화학 분류는 촉매 작용을 하는 화학 반응을 기초로 하는 효소의 수치 분류 체계이다.
"ATCC"는 생물저장소 수집에 유전자 및 균주가 포함되는 미국 유형 배양 수집소를 지칭한다.
"NCBI"는 국립 생물 정보 센터 및 여기 제공된 서열 데이타베이스를 지칭한다.
"단백질", "폴리펩티드" 및 "펩티드"는 본원에서 상호혼용되며 길이 또는 번역후 변형(예, 글리코실화 또는 인산화)과 관계없이 아미드 결합에 의해 공유 결합되는 적어도 2개의 아미노산의 중합체를 의미한다. 본 정의에는 D- 및 L-아미노산, 및 D- 및 L-아미노산의 혼합물, 그리고 D- 및 L-아미노산을 포함한 중합체, 그리고 D- 및 L-아미노산의 혼합물이 포함된다.
"아미노산"은 공통적으로 공지된 3자 심볼 또는 IUPAC-IUB 생화학 명명 위원에서 권장한 1자 심볼로 본원에 지칭된다. 뉴클레오티드는, 마찬가지로, 공통적으로 허용된 단일 문자 코드로 지칭될 수 있다.
본원에 사용된 바와 같이, "폴리뉴클레오티드" 및 "핵산"은 함께 공유 결합 연결되는 둘 이상의 뉴클레오시드를 지칭한다. 폴리뉴클레오티드는 리보뉴클레오티드(즉, RNA)를 완전히 포함하거나, 2'-데옥시리보뉴클레오티드(즉, DNA)를 완전히 포함하거나, 또는 리보- 및 2'-데옥시리보뉴클레오티드의 혼합물을 포함할 수 있다. 뉴클레오시드가 통상 표준 포스포디에스테르 연결을 통해 함께 연결되지만, 폴리뉴클레오티드는 하나 이상의 비-표준 연결을 포함할 수 있다. 폴리뉴클레오티드는 단일 가닥 또는 이중 가닥일 수 있거나, 또는 단일 가닥 영역 및 이중 가닥 영역을 모두 포함할 수 있다. 또한, 폴리뉴클레오티드가 통상 천연 발생 코딩 핵염기(즉, 아데닌, 구아닌, 우라실, 티민 및 시토신)으로 구성되어 있지만, 하나 이상의 변성 및/또는 합성 핵염기, 예컨대 이노신, 크산틴, 히포크산틴 등을 포함할 수 있다. 일부 실시양태에서, 그러한 변성 또는 합성 핵염기는 아미노산 서열을 코딩하는 핵염기이다.
"코딩 서열"은 단백질의 아미노산 서열을 코딩하는 핵산(예, 유전자)의 일부를 지칭한다.
본원에 사용된 바와 같이, 용어 "생체촉매작용", "생체촉매", "생물변형" 및 "생합성"은 유기 화합물 화합물 상 화학 반응을 수행하기 위한 효소의 사용을 지칭한다.
"글리코실트랜스퍼라제"는 활성화된 당, 예컨대 뉴클레오티드 디포스페이트 당류 또는 인당으로부터 단량체 및 중합체 수용체 분자로 글리코실 잔기를 전달하는 효소능을 갖는 폴리펩티드을 지칭한다.
"포스포릴라제"는 무기 포스페이트를 사용하여 글리코시드 결합을 분해함으로써, 포스포글리코시드 및 단량체 또는 중합체 산물을 방출하는 효소능을 갖는 폴리펩티드를 지칭한다. 역방향에서, 포스포릴라제는 포스포글리코시드, 예컨대 글루코스-1-포스페이트로부터 단량체 및 중합체 수용체로 글리코실 잔기를 전달하는 글리코실트랜스퍼라제로서 작용할 수 있다.
본원에 사용된 바와 같이, "글리코실화"는 글리코실 잔기와 수용체 분자 사이의 글리코시드 연결의 형성을 지칭한다.
본원에 사용된 바와 같이, "글루코실화"는 글루코스 잔기와 수용체 분자 사이의 글리코시드 연결의 형성을 지칭한다.
본원에 사용된 바와 같이, "글리코실"은 단당류, 저급 올리고당류 또는 올리고당류 유도체의 시클릭 형태로부터 헤미아세탈 히드록실 기를 제거함으로써 수득되는 1가 자유 라디칼 또는 치환기 구조인 유기 기를 지칭한다. 글리코실기는 무기 산(예, 인산)과 반응하여 에스테르(예, 글루코스 1-포스페이트)를 형성한다.
본원에 사용된 바와 같이, "글리코시드"는 글리코시드 결합에 의해 탄수화물(예, 당류)이 또다른 작용 기에 결합되는 분자를 지칭한다. 글리코시드는 당류 및 비-당류(즉, 아글리콘) 성분을 형성하기 위해 가수분해될 수 있다.
본원에 사용된 바와 같이, 용어 "스테비올 글리코시드"는, 제한없이 천연 발생 스테비올 글리코시드(예, 스테비오시드, 스테비올모노시드, 스테비올비오시드, 루부소시드, 둘코시드 B, 둘코시드 A, 레바우디오시드 B, 레바우디오시드 G, 레바우디오시드 C, 레바우디오시드 F, 레바우디오시드 A, 레바우디오시드 I, 레바우디오시드 E, 레바우디오시드 H, 레바우디오시드 L, 레바우디오시드 K, 레바우디오시드 J, 레바우디오시드 M(레바우디오시드 X로도 공지됨), 레바우디오시드 D, 레바우디오시드 N, 레바우디오시드 O), 및 합성 스테비올 글리코시드(예, 효소적으로 글루코실화된 스테비올 글리코시드), 및 이의 조합을 포함하는 스테비올의 글리코시드를 지칭한다. 스테비올의 화학 구조 및 이의 글리코시드가 하기 제시된다(WO 2013/176738 참조).
본원에 사용된 바와 같이, "야생형" 및 "천연 발생"은 자연적으로 발견되는 형태를 지칭한다. 예를 들면, 야생형 폴리펩티드 또는 폴리뉴클레오티드 서열은 자연적으로 공급원으로부터 단리될 수 있고 인간 조작에 의해 의도적으로 변성되지 않은 유기체에 존재하는 서열이다.
본원에 사용된 바와 같이, "재조합", "조작된" 및 "비-천연 발생"은, 세포, 핵산 또는 폴리펩티드와 관련하여 사용되었을 때, 자연적으로 존재하지 않는 방식으로 변형된, 물질 또는 물질의 자연 또는 천연 형태에 해당하는 물질을 지칭한다. 일부 실시양태에서, 세포, 핵산 또는 폴리펩티드는 천연 발생 세포, 핵산 또는 폴리펩티드와 동일하지만, 합성 물질로부터 및/또는 재조합 기법을 사용하여 조작에 의해 생산되거나 유도된다. 비제한적 예는, 그 중에서도, 세포의 천연(비-재조합) 형태에서 발견되지 않고 그외 상이한 수준으로 발현되는 천연 유전자를 발현하는 재조합 세포를 포함한다.
용어 "서열 동일성 백분율(%)"은 본원에서 폴리뉴클레오티드 또는 폴리펩티드 간 비교를 지칭하기 위해 사용되며, 비교 창에서 2개의 최적으로 정렬된 서열을 비교함으로써 결정되고, 비교 창에서 폴리뉴클레오티드 또는 폴리펩티드 서열 부분은 2개의 서열의 최적 정렬을 위한 참고 서열과 비교하여 추가 또는 결실(즉, 갭)을 포함할 수 있다. 백분율은 동일한 핵산 염기 또는 아미노산 잔기가 양 서열에서 발생하는 위치의 갯수를 결정하여 대응된 위치의 갯수를 산출하여, 대응된 위치의 갯수를 비교 창의 위치의 총 갯수로 나누고 서열 동일성의 백분율을 산출하기 위해 결과값에 100을 곱함으로써 계산될 수 있다. 대안적으로, 백분율은 동일한 핵산 염기 또는 아미노산 잔기가 양 서열에서 발생하거나 또는 핵산 염기 또는 아미노산 잔기가 갭과 정렬되는 위치의 갯수를 결정하여 대응된 위치의 갯수를 산출하여, 대응된 위치의 갯수를 비교 창의 위치의 총 갯수로 나누고 서열 동일성의 백분율을 산출하기 위해 결과값에 100을 곱함으로써 계산될 수 있다. 당업자는 2개의 서열을 정렬하는데 이용할 수 있는 많은 확립된 알고리즘이 존재함을 이해한다. 비교를 위한 서열의 최적 정렬은 제한없이 Smith 및 Waterman(Smith and Waterman, Adv. Appl. Math., 2:482 [1981])의 국소 상동성 알고리즘, Needleman 및 Wunsch(Needleman and Wunsch, J. Mol. Biol., 48:443 [1970])의 상동성 정렬 알고리즘, Pearson 및 Lipman(Pearson and Lipman, Proc. Natl. Acad. Sci. USA 85:2444 [1988])의 유사성 방법을 위한 조사, 이들 알고리즘의 컴퓨터 실행(예, GCG 위스콘신 소프트웨어 패키지의 GAP, BESTFIT, FASTA 및 TFASTA), 또는 당업계에 공지된 육안 검사를 비롯한 임의의 적당한 방법에 의해 실시될 수 있다. 서열 동일성 및 서열 유사성 백분율을 결정하는 데 적당한 알고리즘의 예는 제한없이 BLAST 및 BLAST 2.0 알고리즘을 포함하고, 이는 Altschul 등(각각 Altschul et al., J. Mol. Biol., 215: 403-410 [1990]; 및 Altschul et al., Nucl. Acids Res., 3389-3402 [1977] 참조)에 의해 기술되어 있다. BLAST 분석을 수행하기 위한 소프트웨어는 생명공학 정보 웹사이트에 대한 미국립 센터를 통해 공개적으로 입수할 수 있다. 이러한 알고리즘은 데이타베이스 서열에서 동일 길이의 단어와 정렬시, 일부 양성값의 한계 점수 T와 대응하거나 또는 만족하는, 문의 서열 중 길이 W의 짧은 단어를 식별하여 높은 점수의 서열쌍(HSP)을 식별하는 것을 포함한다. T는 이웃 단어 점수 한계치(Altschul et al 참조, 상술)를 지칭한다. 이들 초기 이웃 단어 히트는 그들을 함유하는 보다 긴 HSP를 찾기 위해 검색을 개시하기 위한 씨드로서 작용한다. 다음으로 단어 히트는 누적 정렬 점수가 증가될 수 있는 한 각 서열을 따라 양 방향으로 확장된다. 누적 점수는 뉴클레오티드 서열의 경우, 변수 M(대응 잔기 쌍에 대한 보상 점수; 항상 > 0) 및 N(미대응 잔기에 대한 패널티 점수; 항상 < 0)을 사용해 계산된다. 아미노산 서열의 경우, 점수 매트릭스를 사용해서 누적 점수를 계산한다. 각 방향으로의 단어 히트의 확장은 누적 정렬 점수가 그 최대 획득값으로부터 X의 양 만큼 줄면 중지하고; 누적 점수는, 1 이상의 음성 점수화 잔기 정렬의 축적에 기인하거나, 또는 양 서열의 말단에 도달하면, 0 이하가 된다. BLAST 알고리즘 변수 W, T 및 X는 정렬 속도 및 민감도를 결정한다. BLASTN 프로그램(뉴클레오티드 서열의 경우)은 디폴트로서 11의 단어 길이(W), 10의 기대치(E), M=5, N=-4 및 양 가닥의 비교를 사용한다. 아미노산 서열의 경우, BLASTP 프로그램은 디폴트로서 3의 단어 길이(W), 10의 기대치(E), 및 BLOSUM62 점수 매트릭스(예를 들면, Henikoff and Henikoff, Proc. Natl. Acad. Sci. USA 89:10915 [1989] 참조)를 사용한다. 서열 정렬 및 서열 동일성(%)의 예시적인 결정법은 제공된 디폴트 변수를 사용하는, GCG 위스콘신 소프트웨어 패키지(Accelrys, 미국 위스콘신주 매디슨 소재)의 BESTFIT 또는 GAP 프로그램을 채택할 수 있다.
본원에 사용된 바와 같이, "기준 서열"은 서열 및/또는 활성 비교를 위한 기초로서 사용되는 규정된 서열을 지칭한다. 기준 서열은 더 큰 서열의 서브세트, 예컨대 전장 유전자 또는 폴리펩티드 서열의 절편일 수 있다. 일반적으로, 기준 서열은 적어도 20 뉴클레오티드 또는 아미노산 잔기 길이, 적어도 25 잔기 길이, 적어도 50 잔기 길이, 적어도 100 잔기 길이 또는 핵산 또는 폴리펩티드의 전체 길이이다. 2개의 폴리뉴클레오티드 또는 폴리펩티드는 각각 (1) 2개의 서열 사이의 유사한 서열(즉, 완전한 서열의 일부)을 포함할 수 있고, (2) 2개의 서열 간 분기성인 서열을 추가로 포함할 수 있기 때문에, 2개 (또는 그 이상)의 폴리뉴클레오티드 또는 폴리펩티드 간 서열 비교는 통상 서열 유사성의 국소 영역을 식별하고 비교하기 위한 "비교 창"에서 2개의 폴리뉴클레오티드 또는 폴리펩티드의 서열을 비교함으로써 수행된다. 일부 실시양태에서, "기준 서열"은 주요 아미노산 서열을 기초로 할 수 있고, 기준 서열은 주요 서열에서 하나 이상의 변화를 가질 수 있는 서열이다.
본원에 사용된 바와 같이, "비교 창"은 적어도 약 20개의 인접하는 뉴클레오티드 부분 또는 아미노산 잔기의 개념적 절편을 지칭하고, 서열은 적어도 20개의 인접하는 뉴클레오티드 또는 아미노산의 기준 서열과 비교될 수 있고, 비교 창 내 서열의 일부분은 2개의 서열의 최적 정렬을 위해 (추가 또는 결실을 포함하지 않는) 기준 서열과 비교하여 20% 이하의 추가 또는 결실(즉, 갭)을 포함할 수 있다. 비교 창은 20보다 긴 인접하는 잔기일 수 있고, 경우에 따라 30, 40, 50, 100 이상의 창을 포함한다.
본원에 사용된 바와 같이, "~에 상응하는", "~를 참조하여" 및 "~에 대하여"는, 소정 아미노산 또는 폴리뉴클레오티드 서열의 넘버링 내용에서 사용되었을때, 소정 아미노산 또는 폴리뉴클레오티드 서열이 기준 서열과 비교시 구체화된 기준 서열의 잔기의 넘버링을 지칭한다. 달리 말하면, 소정 중합체의 잔기 번호 또는 잔기 위치는 소정 아미노산 또는 폴리뉴클레오티드 서열 내 잔기의 실제 숫자 위치라기 보다는 기준 서열과 관련하여 지정된다. 예를 들면, 소정 아미노산 서열, 예컨대 조작된 글리코실트랜스퍼라제의 경우, 2개의 서열 간 잔기 대응을 최적화하도록 갭을 도입함으로써 기준 서열에 정렬시킬 수 있다. 이러한 경우, 갭이 존재하더라도, 소정 아미노산 또는 폴리뉴클레오티드 서열 내 잔기의 넘버링은 정렬되는 기준 서열과 관련하여 이루어진다.
본원에 사용된 바와 같이, "실질적 동일성"은 적어도 20 잔기 위치의 비교 창, 빈번하게는 적어도 30-50 잔기의 비교 창에 대하여 기준 서열과 비교함으로써 적어도 80%의 서열 동일성, 적어도 85%의 동일성, 적어도 89-95%의 서열 동일성, 또는 더욱 일반적으로, 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드 또는 폴리펩티드 서열을 지칭하고, 서열 동일성 백분율은 비교 창에 대해 기준 서열의 총 20% 이하인 결실 또는 추가를 포함하는 서열에 기준 서열을 비교함으로써 계산된다. 폴리펩티드에 적용되는 일부 특정 실시양태에서, 용어 "실질적 동일성"은 2개의 폴리펩티드 서열이, 디폴트 갭 웨이트를 사용한 프로그램 GAP 또는 BESTFIT 등에 의해 최적으로 정렬시, 적어도 80% 서열 동일성, 바람직하게는 적어도 89% 서열 동일성, 적어도 95% 서열 동일성 또는 그 이상(예, 99% 서열 동일성)을 공유하는 것을 의미한다. 일부 실시양태에서, 비교하고자 하는 서열에서 동일하지 않은 잔기 위치는 보존성 아미노산 치환과 상이하다.
본원에 사용된 바와 같이, "아미노산 차이" 및 "잔기 차이"는 기준 서열 내 상응하는 위치의 아미노산 잔기에 대한 폴리펩티드 서열의 위치에서 아미노산 잔기의 차이를 지칭한다. 아미노산 차이의 위치는 일반적으로 본원에서 "Xn"이라고 하고, 여기서 n은 잔기 차이를 기초로 하는 기준 서열 내 상응하는 위치를 의미한다. 예를 들면, "서열번호 4와 비교시 위치 X93에서의 잔기 차이"는 서열번호 4의 위치 93에 상응하는 폴리펩티드 위치에서의 아미노산 잔기의 차이를 의미한다. 따라서, 서열번호 4의 기준 폴리펩티드가 위치 93에 세린을 가지면, "서열번호 4와 비교시 위치 X93에서 잔기 차이"는 서열번호 4의 위치 93에 상응하는 폴리펩티드의 위치에서 세린 이외의 임의 잔기의 아미노산 치환을 의미한다. 본원의 대부분의 예에서, 일정 위치에서 특정 아미노산 잔기 차이는 "XnY"로 표시되고 여기서 "Xn"은 상기 기술된 상응하는 위치를 특정하고, "Y"는 조작된 폴리펩티드에서 발견되는 아미노산의 단일 문자 식별자(즉, 기준 폴리펩티드에서와는 다른 잔기)이다. 일부 예에서, 본 발명은 또한 통상적인 표기법 "AnB"로 표시된 특정한 아미노산 차이를 제공하며, 여기서 A는 기준 서열 내 잔기의 단일 문자 식별자이고, "n"은 기준 서열 내 잔기 위치의 번호이며, B는 조작된 폴리펩티드의 서열 내 잔기 치환의 단일 문자 식별자이다. 일부 예에서, 본 발명의 폴리펩티드는, 잔기 차이가 기준 서열에 대해 존재하는 특정 위치의 목록으로 표시되는 기준 서열에 대한 하나 이상의 아미노산 잔기 차이를 포함할 수 있다. 일부 실시양태에서, 하나 이상의 아미노산이 폴리펩티드의 특정 잔기 위치에서 사용될 수 있는 경우, 사용될 수 있는 다양한 아미노산 잔기는 "/"에 의해 구분된다(예, X307H/X307P 또는 X307H/P). 슬래시는 또한 소정 변이체 내 다중 치환을 가리키는 데 사용될 수도 있다(즉, 소정 서열에 하나 이상의 치환이 존재함). 일부 실시양태에서, 본 발명은 보존성 또는 비보존성 아미노산 치환을 포함하는 하나 이상의 아미노산 차이를 포함하는 조작된 폴리펩티드 서열을 포함한다. 일부 추가 실시양태에서, 본 발명은 보존성 및 비보존성 아미노산 치환을 둘다 포함하는 조작된 폴리펩티드 서열을 제공한다.
본원에 사용된 바와 같이, "보존성 아미노산 치환"은 유사한 측쇄를 갖는 상이한 잔기로 잔기를 치환하는 것을 의미하고, 따라서 통상 같거나 유사하게 정의된 아미노산 부류 내 아미노산으로 폴리펩티드의 아미노산 치환을 포함한다. 제한없이 예로서, 지방족 측쇄를 갖는 아미노산은 다른 지방족 아미노산(예, 알라닌, 발린, 류신, 및 이소류신)으로 치환되고, 히드록실 측쇄를 갖는 아미노산은 히드록실 측쇄를 갖는 다른 아미노산(예, 세린 및 트레오닌)으로 치환되며, 방향족 측쇄를 갖는 아미노산은 방향족 측쇄를 갖는 다른 아미노산(예, 페닐알라닌, 티로신, 트립토판 및 히스티딘)으로 치환되고, 염기성 측쇄를 갖는 아미노산은 염기성 측쇄를 갖는 다른 아미노산(예, 리신 및 아르기닌)으로 치환되며, 산성 측쇄를 갖는 아미노산은 산성 측쇄를 갖는 다른 아미노산(예, 아스파르트산 또는 글루탐산)으로 치환되고, 및/또는 소수성 또는 친수성 아미노산은 각각 다른 소수성 또는 친수성 아미노산으로 치환된다.
본원에 사용된 바와 같이, "비보존성 치환"은 유의하게 다른 측쇄 특성을 갖는 아미노산으로 폴리펩티드의 아미노산 치환을 의미한다. 비보존성 치환은 정의된 군에 속하기 보다는, 그들 사이의 아미노산을 사용할 수 있고, (a) 치환 영역 내 펩티드 골격의 구조(예, 글리신 대신 프롤린); (b) 전하 또는 소수성; 또는 (c) 측쇄의 규모에 영향을 미칠 수 있다. 제한없이 예로서, 예시적인 비보존성 치환은 염기성 또는 지방족 아미노산으로 치환된 산성 아미노산; 소형 아미노산으로 치환된 방향족 아미노산; 및 소수성 아미노산으로 치환된 친수성 아미노산일 수 있다.
본원에 사용된 바와 같이, "결실"은 기준 폴리펩티드로부터 하나 이상의 아미노산의 제거에 의한 폴리펩티드 개질을 의미한다. 결실은 조작된 글리코실트랜스퍼라제 효소의 개선된 특성을 유지하고/하거나 효소 활성을 유지하면서 기준 효소를 구성하는 아미노산의 총 갯수의 1개 이상의 아미노산, 2개 이상의 아미노산, 5개 이상의 아미노산, 10개 이상의 아미노산, 15개 이상의 아미노산, 또는 20개 이상의 아미노산, 총 아미노산 갯수의 최대 10%, 또는 총 아미노산 갯수의 최대 20%의 제거를 포함할 수 있다. 결실은 폴리펩티드의 내부 영역 및/또는 말단 영역에 대한 것일 수 있다. 다양한 실시양태에서, 결실은 연속되는 절편을 포함하거나 비연속적일 수 있다.
본원에 사용된 바와 같이, "삽입"은 기준 폴리펩티드로부터 하나 이상의 아미노산의 추가에 의한 폴리펩티드의 개질을 의미한다. 삽입은 폴리펩티드의 내부 영역에 있거나, 또는 카르복시 또는 아미노 말단에 있을 수 있다. 본원에서 사용되는 삽입은 당업계에 공지된 바와 같은 융합 단백질을 포함한다. 삽입은 아미노산의 인접하는 절편이거나 또는 천연 발생 폴리펩티드 내 하나 이상의 아미노산에 의해 이격될 수 있다.
"기능적 단편" 및 "생물학적 활성 단편"은 본원에서 상호혼용되고, 아미노 말단 및/또는 카르복시 말단 결실(들) 및/또는 내부 결실을 갖지만, 나머지 아미노산 서열이 비교되는 서열(즉, 본 발명의 전장 조작된 글리코실트랜스퍼라제)의 상응하는 위치와 동일하고 전장 폴리펩티드의 실질적으로 전체 활성을 보유하는 폴리펩티드를 의미한다.
본원에 사용된 바와 같이, "단리된 폴리펩티드"는 천연적으로 이와 수반되는 다른 오염물(예, 단백질, 지질 및 폴리뉴클레오티드)로부터 실질적으로 분리된 폴리펩티드를 의미한다. 이 용어는 그들의 천연 발생 환경 또는 발현계(예, 숙주 세포 또는 시험관내 합성)로부터 분리되거나 또는 정제된 폴리펩티드를 포함한다. 재조합 글리코실트랜스퍼라제 폴리펩티드는 세포 내에 존재하거나, 세포 배지에 존재하거나, 또는 다양한 형태, 예컨대 용해물 또는 단리된 조제물로서 생산될 수 있다. 이처럼, 일부 실시양태에서, 재조합 글리코실트랜스퍼라제 폴리펩티드는 단리된 폴리펩티드일 수 있다.
본원에 사용된 바와 같이, "실질적으로 순수한 폴리펩티드"는 그 폴리펩티드 종이 존재하는 우세한 종(즉, 몰 또는 중량 기준으로 조성물 내 임의의 다른 개별 거대 분자 종 보다 더 풍부함)인 조성물을 의미하고, 일반적으로 대상 종이 몰 또는 중량% 기준으로 존재하는 거대 분자 종의 적어도 약 50%를 포함하는 경우 실질적으로 순수한 조성물이다. 하지만, 일부 실시양태에서, 글리코실트랜스퍼라제를 포함하는 조성물은 50% 미만(예, 약 10%, 약 20%, 약 30%, 약 40% 또는 약 50%)으로 순수한 글리코실트랜스퍼라제를 포함한다. 일반적으로, 실질적으로 순수한 글리코실트랜스퍼라제 조성물은 몰 또는 중량% 기준으로 조성물에 존재하는 모든 존재하는 거대분자 종 중 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 95% 이상, 및 약 98% 이상을 포함한다. 일부 실시양태에서, 대상 종은 본질적으로 균질하게 정제되고(즉, 오염 종이 기존의 검출 방법으로는 조성물에서 검출될 수 없음), 여기서 조성물은 본질적으로 단일한 거대분자 종으로 이루어진다. 용매 종, 소형 분자(< 500 달톤), 및 원소 이온 종은 거대분자 종으로 고려하지 않는다. 일부 실시양태에서, 단리된 재조합 글리코실트랜스퍼라제 폴리펩티드는 실질적으로 순수한 폴리펩티드 조성물이다.
본원에 사용된 바와 같이, "개선된 효소 특성"은 효소의 적어도 하나의 개선된 특성을 나타낸다. 일부 실시양태에서, 본 발명은 기준 글리코실트랜스퍼라제 폴리펩티드 및/또는 야생형 글리코실트랜스퍼라제 폴리펩티드, 및/또는 다른 조작된 글리코실트랜스퍼라제 폴리펩티드와 비교시 임의의 효소 특성의 개선을 나타내는 조작된 글리코실트랜스퍼라제 폴리펩티드를 제공한다. 따라서, "개선" 수준은 야생형, 그리고 조작된 글리코실트랜스퍼라제를 포함한 다양한 글리코실트랜스퍼라제 폴리펩티드를 결정하고 비교할 수 있다. 개선된 특성은 제한없이 증가된 단백질 발현, 증가된 열활성, 증가된 열안정성, 증가된 pH 활성, 증가된 안정성, 증가된 효소 활성, 증가된 기질 특이성 또는 친화성, 증가된 비활성, 증가된 기질에 대한 내성 또는 최종 산물 억제성, 증가된 화학적 안정성, 증가된 화학선택성, 개선된 용매 안정성, 산성 pH에 대한 증가된 내성, 단백질분해 활성에 대한 증가된 내성(즉, 단백질분해에 대한 감소된 감응성), 감소된 응집성, 증가된 용해성, 및 변경된 온도 프로파일 등과 같은 특성을 포함한다.
본원에 사용된 바와 같이, "증가된 효소 활성" 및 "향상된 촉매 활성"은 기준 글리코실트랜스퍼라제 효소와 비교시 비활성(예, 생산된 산물/시간/중량 단백질)의 증가 또는 기질의 산물로의 전환율(예, 특정량의 글리코실트랜스퍼라제를 사용하여 특정 기간에 기질의 출발량에서 산물로의 전환되는 비율)의 증가로 대표될 수 있는 조작된 글리코실트랜스퍼라제 폴리펩티드의 개선된 특성을 의미한다. 효소 활성을 측정하는 예시적인 방법은 실시예에 제공한다. 효소 활성과 관련된 임의의 특성은 그 변화가 증가된 효소 활성을 일으킬 수 있는, K m , V max 또는 k cat 의 고전적인 효소 특성을 포함하여, 영향받을 수 있다. 효소 활성의 개선은 상응하는 야생형 효소의 효소 활성의 약 1.1배부터, 천연 발생 글리코실트랜스퍼라제 또는 글리코실트랜스퍼라제 폴리펩티드가 유도된 다른 조작된 글리코실트랜스퍼라제 보다 2배, 5배, 10배, 20배, 25배, 50배, 75배, 100배, 150배, 200배 또는 그 이상의 효소 활성일 수 있다.
본원에 사용된 바와 같이, "전환"은 상응하는 산물(들)로 기질(들)의 효소적 전환 (또는 생물변환)을 의미한다. "전환율"은 특정 조건 하에서 일정 기간 내에 산물로 전환되는 기질의 백분율을 의미한다. 따라서, 글리코실트랜스퍼라제 폴리펩티드의 "효소적 활성" 또는 "활성"은 특정 기간 내 산물로의 기질의 "전환율"로서 표현될 수 있다.
"일반종 특성"을 가진 효소 (또는 "일반종 효소")는 모 서열과 비교시 광범위한 범위의 기질에 개선된 활성을 나타내는 효소를 의미한다. 일반종 효소는 모든 가능한 기질에 개선된 활성을 반드시 입증하는 것은 아니다. 일부 실시양태에서, 본 발명은 일반종 특성을 가진 글리코실트랜스퍼라제 변이체를 제공하고, 즉 이는 광범위한 범위의 입체적 및 전자적 다양한 기질에 대해 모 유전자와 관련하여 유사하거나 개선된 활성을 입증한다. 또한, 본원에 제공된 일반종 효소는 대사산물/산물의 형성을 증가시키기 위해 광범위한 범위의 다양한 분자에 걸쳐 개선되도록 조작되었다.
본원에 사용된 용어 "혼성화 엄격 조건"은 핵산 하이브리드가 안정한 조건을 의미한다. 당업자에게 공지된 바와 같이, 하이브리드의 안정성은 하이브리드의 용융 온도(T m )에서 반영된다. 일반적으로, 하이브리드의 안정성은 이온 강도, 온도, G/C 함량 및 카오트로픽제의 함수이다. 폴리뉴클레오티드의 T m 값은 용융 온도를 예측하기 위한 공지된 방법을 사용하여 계산될 수 있다(예, Baldino et al., Meth. Enzymol., 168:761-777 [1989]; Bolton et al., Proc. Natl. Acad. Sci. USA 48:1390 [1962]; Bresslauer et al., Proc. Natl. Acad. Sci. USA 83:8893-8897 [1986]; Freier et al., Proc. Natl. Acad. Sci. USA 83:9373-9377 [1986]; Kierzek et al., Biochem., 25:7840-7846 [1986]; Rychlik et al., 1990, Nucl. Acids Res., 18:6409-6412 [1990] (erratum, Nucl. Acids Res., 19:698 [1991]); Sambrook et al., 상술); Suggs et al., 1981, in Developmental Biology Using Purified Genes, Brown et al. [eds.], pp. 683-693, Academic Press, Cambridge, MA [1981]; 및 Wetmur, Crit. Rev. Biochem. Mol. Biol., 26:227-259 [1991] 참조). 일부 실시양태에서, 폴리뉴클레오티드는 본원에 개시된 폴리펩티드를 코딩하고, 규정된 조건, 예컨대 적당히 엄격하거나 고도로 엄격한 조건 하에서, 본 발명의 조작된 글리코실트랜스퍼라제 효소를 코딩하는 서열의 상보체와 혼성화된다.
본원에 사용된 바와 같이, "혼성화 엄격성"은 핵산의 혼성화 시, 세척 조건 등과 같은 혼성화 조건과 관련된다. 일반적으로, 혼성화 반응은 낮은 엄격성 조건 하에서 수행된 후 다양하지만 높은 엄격성의 세척이 후속된다. 용어 "중간 엄격 혼성화"는 표적 DNA와 약 60% 동일성, 바람직하게는 약 75% 동일성, 약 85% 동일성을 갖고, 표적 폴리뉴클레오티드에 대해 약 90% 넘는 동일성을 갖는, 상보적 핵산에 표적 DNA가 결합할 수 있게 하는 조건을 의미한다. 예시적인 중간 엄격 조건은 42℃에서 50% 포름아미드, 5× 덴하르트 용액, 5×SSPE, 0.2% SDS에서의 혼성화에 이어서, 42℃에서 0.2×SSPE, 0.2% SDS 중 세척이 후속되는 것과 균등한 조건이다. "고엄격 혼성화"는 일반적으로 정의된 폴리뉴클레오티드 서열에 대한 용액 조건 하에서 결정된 열 용융 온도(T m )로부터 약 10℃ 이하인 조건을 의미한다. 일부 실시양태에서, 고엄격 조건은 65℃에 0.018 M NaCl에서 안정한 하이브리드를 형성하는 핵산 서열만의 혼성화를 가능케하는 조건을 의미한다(즉, 하이브리드가 65℃에 0.018 M NaCl에서 안정하지 않으면, 본원에서 고려되는 고엄격 조건 하에서 안정하지 않음). 고엄격 조건은, 예를 들면 42℃에 50% 포름아미드, 5× 덴하르트 용액, 5×SSPE, 0.2% SDS와 균등한 조건에서의 혼성화에 이어서, 65℃에서 0.1×SSPE, 및 0.1% SDS 중에서의 세척이 후속되는 것에 의해 제공될 수 있다. 다른 고엄격 조건은 65℃에서 0.1%(w:v) SDS를 포함하는 5X SSC에서의 혼성화 및 65℃에서 0.1% SDS를 포함하는 0.1x SSC로 세척하는 것과 균등한 조건에서의 혼성화이다. 중간 엄격 조건을 비롯하여, 다른 고엄격 혼성화는 상기 인용된 참조문헌에 기술되어 있다.
본원에 사용된 바와 같이, "코돈 최적화"는 코딩된 단백질이 관심 유기체에서 효율적으로 발현되도록 특정 유기체에서 우선적으로 사용되는 것으로 단백질을 코딩하는 폴리뉴클레오티드의 코돈을 변화시키는 것을 의미한다. 대부분의 아미노산이 "동의어" 또는 "동의" 코돈이라고 하는, 몇몇 코돈에 의해 표시된다는 점에서, 유전자 코드가 축퇴적이지만, 특정 유기체에 의한 코돈 용법은 임의적이지 않고 특정 코돈 트리플렛에 편향적인 것으로 잘 공지되어 있다. 이러한 코돈 용법 편향성은 소정 유전자, 공통 기능 또는 조상 기원의 유전자, 고도로 발현되는 단백질 대 낮은 복제수 단백질, 및 유기체 게놈의 집합적 단백질 코딩 영역과 관련하여 더 높을 수 있다. 일부 실시양태에서, 글리코실트랜스퍼라제 효소를 코딩하는 폴리뉴클레오티드는 발현을 위해 선택된 숙주 유기체로부터 최적 생산을 위해 코돈 최적화될 수 있다.
본원에 사용된 바와 같이, "바람직한", "최적의" 및 "고 코돈 용법 편향성" 코돈은 단독으로 또는 조합하여 사용시 단백질 코딩 영역에 있어서 동일 아미노산을 코딩하는 다른 코돈보다 더 높은 빈도로 사용되는 코돈을 상호교환적으로 의미한다. 바람직한 코돈은 단일 유전자에서의 코돈 용법, 공통 기능 또는 기원의 유전자 세트, 고도로 발현된 유전자, 전체 유기체의 집합적 단백질 코딩 영역에서의 코돈 빈도, 관련 유기체의 집합적 단백질 코딩 영역에서의 코돈 빈도, 또는 이의 조합과 관련하여 결정될 수 있다. 유전자 발현 수준에 따라 빈도가 증가하는 코돈은 통상 발현에 최적의 코돈이다. 특정 유기체에서의 코돈 빈도(예, 코돈 용법, 관련 동의 코돈 용법) 및 코돈 선호도를 측정하기 위해, 클러스터 분석 또는 대응 분석 등을 사용하는 다변량 분석, 및 유전자에 사용된 효과적인 코돈 갯수를 비롯한 다양한 방법이 공지되어 있다(예, GCG CodonPreference, Genetics Computer Group Wisconsin Package; CodonW, Peden, University of Nottingham; McInerney, Bioinform., 14:372-73 [1998]; Stenico et al., Nucl. Acids Res., 222437-46 [1994]; Wright, Gene 87:23-29 [1990] 참조). 다수의 상이한 유기체에 코돈 용법 표를 이용할 수 있다(예, Wada et al., Nucl. Acids Res., 20:2111-2118 [1992]; Nakamura et al., Nucl. Acids Res., 28:292 [2000]; Duret, et al., supra; Henaut and Danchin, in Escherichia coli and Salmonella , Neidhardt, et al. (eds.), ASM Press, Washington D.C., p. 2047-2066 [1996] 참조). 코돈 용법을 수득하기 위한 데이타 공급원은 단백질을 코딩할 수 있는 임의의 이용가능한 뉴클레오티드 서열에 의존할 수 있다. 이러한 데이타 세트는 발현된 단백질을 코딩하는 것으로 실제 공지된 핵산 서열(예, 완전한 단백질 코딩 서열-CDS), 발현된 서열 태그(ESTS), 또는 게놈 서열의 예측된 코딩 영역(예, Mount, Bioinformatics: Sequence and Genome Analysis, Chapter 8, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. [ 2001]; Uberbacher, Meth. Enzymol., 266:259-281 [1996]; and Tiwari et al., Comput. Appl. Biosci., 13:263-270 [1997] 참조)을 포함한다.
본원에 사용된 바와 같이, "제어 서열"은 본 발명의 폴리뉴클레오티드 및/또는 폴리펩티드의 발현에 필수적이거나 또는 유리한 모든 성분을 포함한다. 각각의 제어 서열은 폴리펩티드를 코딩하는 핵산 서열에 대해 내생적이거나 또는 외생적일 수 있다. 이러한 제어 서열은 제한없이, 리더, 폴리아데닐화 서열, 프로펩티드 서열, 프로모터 서열, 신호 펩티드 서열, 개시 서열, 및 전사 종결부를 포함한다. 최소한으로, 제어 서열은 프로모터, 및 전사 및 번역 중지 신호를 포함한다. 제어 서열은 폴리펩티드를 코딩하는 핵산 서열의 코딩 영역과 제어 서열의 결찰을 용이하게 하는 특정 제한효소 부위를 도입하려는 목적의 링커가 제공될 수 있다.
"작동가능하게 연결된"은 제어 서열이 관심 폴리뉴클레오티드 및/또는 폴리펩티드의 발현을 지정하거나 또는 조절하도록 관심 폴리뉴클레오티드에 대한 위치에 적절하게 위치(즉, 기능적 관련성으로)된 구성으로 본원에 정의된다.
"프로모터 서열"은 관심 폴리뉴클레오티드, 예컨대 코딩 서열의 발현을 위해 숙주 세포에 의해 인식되는 핵산 서열을 의미한다. 프로모터 서열은 관심 폴리뉴클레오티드의 발현을 매개하는 전사 제어 서열을 함유한다. 프로모터는 숙주 세포에 대해 동종성이거나 또는 이종성인 세포외 또는 세포내 폴리펩티드를 코딩하는 유전자로부터 얻을 수 있고, 돌연변이체, 절두형 및 하이브리드 프로모터를 포함하여 선택 숙주 세포에서 전사 활성을 보이는 임의의 핵산 서열일 수 있다.
용어 "적합한 반응 조건"은 본 발명의 글리코실트랜스퍼라제 폴리펩티드가 기질에서 바람직한 생성 화합물로 전환될 수 있는 효소 전환 반응 용액의 조건(예, 효소 적재, 기질 적재, 온도, pH, 완충액, 공용매 등의 범위)을 의미한다. 일부 예시적인 "적합한 반응 조건"은 본원에서 제공한다.
본원에 사용된 바와 같이, "적재(loading)" 예컨대 "화합물 적재" 또는 "효소 적재"는 반응의 출발시 반응 혼합물 중 성분의 농도 또는 양을 의미한다.
본원에 사용된 바와 같이, 효소 전환 반응 과정에서 "기질"은 글리코실트랜스퍼라제 폴리펩티드가 작용하는 화합물 또는 분자를 의미한다.
본원에 사용된 바와 같이, 효소 전환 과정에서 "산물"은 기질에 대한 글리코실트랜스퍼라제 폴리펩티드의 작용 결과로 생성된 화합물 또는 분자를 의미한다.
본원에 사용된 바와 같이, 용어 "배양하는"은 (예, 액체, 겔 또는 고체 배지를 사용하는) 임의의 적합한 조건 하에서 미생물 세포 개체군의 성장을 의미한다.
재조합 폴리펩티드는 당업계에 공지된 임의의 적합한 방법을 사용하여 형성될 수 있다. 야생형 관심 폴리펩티드를 코딩하는 유전자는 벡터, 예컨대 플라스미드에서 클로닝되고, 바람직한 호스트, 예컨대 이. 콜라이(E. coli)에서 발현될 수 있다. 재조합 폴리펩티드의 변이체는 당업계에 공지된 다양한 방법에 의해 생성될 수 있다. 실제로, 광범위하게 다양한 상이한 돌연변이유발 기법이 당업계에 잘 공지되어 있다. 추가로, 돌연변이유발 키트 또한 수많은 상업적 분자 생물 공급자로부터 입수할 수 있다. 정해진 아미노산에서 특정 치환(부위-지정), 유전자의 국소 영역내 특이적 또는 무작위 돌연변이(위치 특이적), 또는 전체 유전자에 대한 무작위 돌연변이유발(예, 포화 돌연변이유발)을 실시할 수 있는 방법이 이용가능하다. 제한없이, PCR을 사용한 단일 가닥 DNA 또는 이중 가닥 DNA의 부위 지정 돌연변이유발법, 카세트 돌연변이유발법, 유전자 합성법, 에러-프론 PCR, 셔플링, 및 화학적 포화 돌연변이 유발법, 또는 당분야에 공지된 임의의 다른 적합한 방법을 포함하여, 효소 변이체를 생성하기 위한 수많은 적합한 방법들이 당분야에 알려져 있다. DNA 및 단백질 조작에 사용되는 방법들의 비제한적인 예들이 다음의 특허에 제공되어 있다: 미국 특허 번호 6,117,679; 미국 특허 번호 6,420,175; 미국 특허 번호 6,376,246; 미국 특허 번호 6,586,182; 미국 특허 번호 7,747,391; 미국 특허 번호 7,747,393; 미국 특허 번호 7,783,428; 및 미국 특허 번호 8,383,346. 변이체를 생산한 후, 그들은 임의의 바람직한 특성(예, 높거나 증가된 활성, 또는 낮거나 감소된 활성, 증가된 열적 활성, 증가된 열 안정성, 및/또는 산성 pH 안정성 등)에 대해 스크리닝될 수 있다. 일부 실시양태에서, "재조합 글리코실트랜스퍼라제 폴리펩티드"(본원에서 또한 "조작된 글리코실트랜스퍼라제 폴리펩티드", "변이체 글리코실트랜스퍼라제 효소", 및 "글리코실트랜스퍼라제 변이체")가 사용된다.
본원에 사용된 바와 같이, "벡터"는 DNA 서열을 세포로 도입시키기 위한 DNA 구성체이다. 일부 실시양태에서, 벡터는 적합한 숙주에서 DNA 서열에서 코딩되는 폴리펩티드의 발현을 실시할 수 있는 적합한 제어 서열에 작동가능하게 연결된 발현 벡터이다. 일부 실시양태에서, "발현 벡터"는 숙주 세포에서 발현을 구동하기 위한 DNA 서열(예를 들면, 이식유전자)에 작동가능하게 연결된 프로모터 서열을 갖고, 일부 실시양태에서, 또한 전사 종결 서열을 포함한다.
본원에 사용된 바와 같이, 용어 "발현"은 제한없이, 전사, 전사후 개질, 번역, 및 번역후 개질을 포함한 폴리펩티드의 생산에 관여되는 임의의 단계를 포함한다. 일부 실시양태에서, 이 용어는 또한 세포로부터 폴리펩티드의 분비를 포함한다.
본원에 사용된 바와 같이, 용어 "생산하다"는 세포에 의한 단백질 및/또는 다른 화합물의 생산을 의미한다. 이 용어는 제한없이, 전사, 전사후 개질, 번역, 및 번역후 개질을 포함한, 폴리펩티드의 생산에 관여되는 임의의 단계를 포함하고자 한다. 일부 실시양태에서, 이 용어는 또한 세포로부터 폴리펩티드의 분비를 포함한다.
본원에 사용된 바와 같이, 아미노산 또는 뉴클레오티드 서열(예, 프로모터 서열, 신호 펩티드, 종결 서열 등)은 2개의 서열이 자연계에서 회합되지 않았으면 작동가능하게 연결된 다른 서열에 대해 "이종성"이다. 예를 들면, "이종성 폴리뉴클레오티드"는 실험실 기법에 의해 숙주 세포로 도입되는 임의의 폴리뉴클레오티드이고, 실험실 조작이 실시된 숙주 세포로부터 제거된 후, 숙주 세포로 재도입되는 폴리뉴클레오티드를 포함한다.
본원에 사용된 바와 같이, 용어 "숙주 세포" 및 "숙주 균주"는 본원에서 제공하는 DNA(예, 글리코실트랜스퍼라제 변이체를 코딩하는 폴리뉴클레오티드)를 포함하는 발현 벡터에 적합한 숙주를 의미한다. 일부 실시양태에서, 숙주 세포는 당업계에 공지된 재조합 DNA 기법을 사용해 제작된 벡터로 형질전환 또는 형질감염된 원핵생물 또는 진핵생물 세포이다.
용어 "유사체"는 기준 폴리펩티드에 대해 70%를 넘는 서열 동일성이지만 100% 보다 낮은 서열 동일성(예, 75%, 78%, 80%, 83%, 85%, 88%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%를 넘는 서열 동일성)을 갖는 폴리펩티드를 의미한다. 일부 실시양태에서, 유사체는 천연 발생 아미노산을 비롯하여 제한없이 호모아르기닌, 오리니틴 및 노르발린을 포함한 하나 이상의 비천연 발생 아미노산을 함유하는 폴리펩티드를 의미한다. 일부 실시양태에서, 유사체는 또한 둘 이상의 아미노산 잔기 사이에 하나 이상의 D-아미노산 잔기 및 비펩티드 연결부를 포함한다.
용어 "유효량"은 바람직한 결과를 생성하기에 충분한 양을 의미한다. 당업자는 통상적인 실험법을 사용해 유효량이 무엇인지 결정할 수 있다.
용어 "단리된" 및 "정제된"은 천연적으로 회합된 하나 이상의 다른 성분이 제거된 분자(예, 단리된 핵산, 폴리펩티드 등) 또는 다른 성분을 의미하는 것으로 사용된다. 용어 "정제된은 절대 순도를 요구하지 않으며, 그 보다는 상대적 정의를 의도하는 것이다.
"입체선택성"은 하나의 입체이성질체가 다른 것보다 화학적 또는 효소 반응에서 우선적으로 형성되는 것을 의미한다. 입체선택성은 하나의 입체이성질체의 형성이 나머지보다 선호되는 경우 부분적일 수 있거나, 단 하나의 입체이성질체가 형성되는 경우 완전할 수 있다. 입체이성질체가 거울상이성질체인 경우, 입체선택성은 거울상선택성으로서, 두 거울상이성질체의 합에서 하나의 거울상이성질체의 분율(통상, 백분율로 보고됨)로 지칭된다. 당업계에는 (통상, 백분율로서) 공통적으로 대안적으로 거울상이성질체 과잉(e.e.)이 식 [주 거울상이성질체 - 부 거울상이성질체]/[주 거울상이성질체 + 부 거울상이성질체]에 따라 계산되는 것으로 보고된다. 입체이성질체가 부분입체이성질체인 경우, 입체선택성은 부분입체선택성으로서, 부분입체이성질체 과잉(d.e.)으로 공통적으로 대안적으로 보고되는, 두 부분입체이성질체의 혼합물에서 하나의 부분입체이성질체의 분율(통상, 백분율로 보고됨)로 지칭된다. 거울상이성질체 과잉 및 부분입체이성질체 과잉은 입체이성질체 과잉의 유형이다.
본원에 사용된 바와 같이, 용어 "위치선택성" 및 "위치선택적 반응"은 결합 생성 및 분해의 한 방향이 다른 가능한 모든 방향보다 우선적으로 발생하는 반응을 의미한다. 식별이 완전한 경우 반응은 완전하게(100%) 위치선택적일 수 있고, 산물 화합물(2)(즉, 불필요한 산물 (2S,5S)-히드록시피페콜산보다 2S,3S0-히드록시피페콜산)의 우선 형성 등의 한 부위에서의 반응 산물이 다른 부위에서의 반응 산물보다 우세한 경우, 실질적으로 위치선택적이거나(적어도 75%), 또는 부분적으로 위치선택적이다(x%, 백분율은 관심 반응에 따라 설정됨).
본원에 사용된 바와 같이, "열안정성"은 소정 시간(예, 0.5-24 h) 동안 고온(예, 40-80℃)에 노출시킨 후 동일 고온에 노출된 야생형 효소와 비교하여 유사 활성(예, 60% 이상 내지 80%)을 유지하는 글리코실트랜스퍼라제 폴리펩티드를 의미한다.
본원에 사용된 바와 같이, "용매 안정성"은 소정 시간(예, 0.5-24 h) 동안 가변 농도(예, 5-99%)의 용매(에탄올, 이소프로필 알콜, 디메틸설폭시드(DMSO), 테트라히드로푸란, 2-메틸테트라히드로푸란, 아세톤, 톨루엔, 부틸 아세테이트, 메틸 tert-부틸 에테르 등)에 노출시킨 후 동일 농도의 동일 용매에 노출된 야생형 효소와 비교하여 유사 활성(예, 60% 이상 내지 80%)을 유지하는 글리코실트랜스퍼라제 폴리펩티드를 의미한다.
본원에 사용된 바와 같이, "열 및 용매 안정성"은 열안정성 및 용매 안정성인 글리코실트랜스퍼라제 폴리펩티드를 의미한다.
본원에 사용된 바와 같이, "환원제"는 Fe+3을 Fe+2로 전환시킬 수 있는 화합물 또는 제제를 의미한다. 예시적인 환원제는 아스코르브산이며, 이는 일반적으로 L-아스코르브산 형태이다.
"알킬"은 총 1-18개의 탄소 원자, 더욱 바람직하게는 총 1-8개의 탄소 원자, 가장 바람직하게는 총 1-6개의 탄소 원자의 직쇄 또는 분지쇄인 포화 탄화수소 기를 의미한다. 특정 갯수의 탄소 원자를 갖는 알킬은 괄호 안을 나타낸다(예, (C1-C6)알킬은 1-6개의 탄소 원자의 알킬을 의미함).
"알케닐"은 적어도 하나의 이중 결합을 함유하지만 경우에 따라 하나보다 많은 이중 결합을 함유하는 직쇄 또는 분지쇄인 총 2-12개의 탄소 원자의 탄화수소 기를 나타낸다.
"알키닐"은 적어도 하나의 삼중 결합을 함유하지만 경우에 따라 하나보다 많은 삼중 결합을 함유하고, 또한 경우에 따라 하나 이상의 이중 결합 모이어티를 함유하는 직쇄 또는 분지쇄인 총 2-12개의 탄소 원자의 탄화수소 기를 나타낸다.
"알킬렌"은 하나 이상의 적당한 치환기로 임의 치환되는, 총 1-18개의 탄소 원자, 더욱 바람직하게는 총 1-8개의 탄소 원자, 가장 바람직하게는 총 1-6개의 탄소 원자를 갖는 직쇄 또는 분지쇄 2가 탄화수소 라디칼을 나타낸다. 예시적인 "알킬렌"은, 제한없이, 메틸렌, 에틸렌, 프로필렌, 부틸렌 등을 포함한다.
"알케닐렌"은 하나 이상의 적당한 치환기로 임의 치환되는, 총 2-12개의 탄소 원자 및 하나 이상의 탄소-탄소 이중 결합, 더욱 바람직하게는 총 2-8개의 탄소 원자, 가장 바람직하게는 총 2-6개의 탄소 원자를 갖는 직쇄 또는 분지쇄 2가 탄화수소 라디칼을 나타낸다.
본원에서 정의된 "헤테로알킬", "헤테로알케닐" 및 헤테로알키닐"은 각각 하나 이상의 탄소 원자가 각각 독립적으로 동일하거나 상이한 헤테로원자 또는 헤테로원자 기로 치환된 알킬, 알케닐 및 알키닐을 나타낸다. 탄소 원자를 치환할 수 있는 헤테로원자 및/또는 헤테로원자 기는, 제한없이 -O-, -S-, -S-O-, -NRγ-, -PH-, -S(O)-, -S(O)2-, -S(O)NRγ-, -S(O)2NRγ- 등 및 이의 조합을 포함하고, 각 Rγ은 독립적으로 수소, 알킬, 시클로알킬, 헤테로시클로알킬, 아릴 및 헤테로아릴에서 선택된다.
"아릴"은 단일 고리(예, 페닐) 또는 다중 축합 고리(예, 나프틸 또는 안트릴)를 갖는 총 6-12개의 탄소 원자의 불포화된 방향족 카르보시클릭 기를 의미한다. 예시적인 아릴은 페닐, 피리딜, 나프틸 등을 포함한다.
"아릴알킬"은 바람직하게는 알킬 모이어티에서 총 1-6개의 탄소 원자를 갖고 아릴 모이어티에서 총 6-12개의 탄소 원자를 갖는 아릴로 치환된 알킬(즉, 아릴-알킬-기)을 의미한다. 이러한 아릴알킬 기는 벤질, 페네틸 등으로 예시된다.
"아릴옥시"는 -ORλ 기를 나타내고, Rλ은 임의 치환될 수 있는 아릴 기이다.
"시클로알킬"은 1-3개의 알킬기로 임의 치환될 수 있는 단일 시클릭 고리 또는 다중 축합 고리를 갖는 총 3-12개의 탄소 원자의 시클릭 알킬기를 나타낸다. 예시적인 시클로알킬 기는, 제한없이, 단일 고리 구조, 예컨대 시클로프로필, 시클로부틸, 시클로펜틸, 시클로옥틸, 1-메틸시클로프로필, 2-메틸시클로펜틸, 2-메틸시클로옥틸 등, 또는 브릿지 고리계를 비롯한 다중 고리 구조, 예컨대 아다만틸 등을 포함한다.
"시클로알킬알킬"은 바람직하게는 알킬 모이어티에서 총 1-6개의 탄소 원자 및 시클로알킬 모이어티에서 총 3-12개의 탄소 원자를 갖는 시클로알킬로 치환된 알킬(즉, 시클로알킬-알킬-기)를 의미한다. 이러한 시클로알킬알킬 기는 시클로프로필메틸, 시클로헥실에틸 등으로 예시된다.
"아미노"는 -NH2 기를 의미한다. 치환된 아미노는 -NHRη, NRηRη, 및 NRηRηRη 기를 의미하고, 각 Rη은 독립적으로 치환 또는 비치환된 알킬, 시클로알킬, 시클로헤테로알킬, 알콕시, 아릴, 헤테로아릴, 헤테로아릴알킬, 아실, 알콕시카르보닐, 설파닐, 설피닐, 설포닐 등에서 선택된다. 통상의 아미노 기는, 제한없이, 디메틸아미노, 디에틸아미노, 트리메틸암모늄, 트리에틸암모늄, 메틸설포닐아미노, 푸라닐-옥시-설파미노 등을 포함한다.
"아미노알킬"은 치환된 아미노 기를 포함한 하나 이상의 수소 원자가 하나 이상의 아미노 기로 치환되는 알킬 기를 의미한다.
"아미노카르보닐"은 -C(O)NH2를 의미한다. 치환된 아미노카르보닐은 -C(O)NRηRη을 의미하고, 아미노 기 NRηRη은 본원에 정의된 바와 같다.
"옥시"는 에테르 및 에스테르를 비롯한 상이한 옥시 기를 형성하기 위해 다양한 치환기를 가질 수 있는 2가 기 -O-를 나타낸다.
"알콕시" 또는 "알킬옥시"는 본원에서 혼용되며, -ORζ 기를 의미하고, Rζ는 임의 치환된 알킬 기를 포함한 알킬 기이다.
"카르복시"는 -COOH를 의미한다.
"카르보닐"은 산, 산 할라이드, 알데히드, 아미드, 에스테르 및 케톤을 포함한 상이한 카르보닐 기를 형성하기 위한 다양한 치환기를 가질 수 있는 -C(O)-를 의미한다.
"카르복시알킬"은 하나 이상의 수소 원자가 하나 이상의 카르복시 기로 치환되는 알킬을 의미한다.
"아미노카르보닐알킬"은 본원에 정의된 바와 같이 아미노카르보닐 기로 치환된 알킬을 의미한다.
"할로겐" 또는 "할로"는 플루오로, 클로로, 브로모 및 요오도를 의미한다.
"할로알킬"은 하나 이상의 수소 원자가 할로겐으로 치환되는 알킬 기를 의미한다. 따라서, 용어 "할로알킬"은 모노할로알킬, 디할로알킬, 트리할로알킬 등 최대 퍼할로알킬을 포함하는 것을 의미한다. 예를 들면, 용어 "(C1-C2) 할로알킬"은 1-플루오로메틸, 디플루오로메틸, 트리플루오로메틸, 1-플루오로에틸, 1,1-디플루오로에틸, 1,2-디플루오로에틸, 1,1,1 트리플루오로에틸, 퍼플루오로에틸 등을 포함한다.
"히드록시"는 -OH를 의미한다.
"히드록시알킬"은 하나 이상의 수소 원자가 하나 이상의 히드록시 기로 치환되는 알킬 기를 의미한다.
"티올" 또는 "설파닐"은 -SH를 의미한다. 치환된 티올 또는 설파닐은 -S-Rη을 의미하고, Rη은 알킬, 아릴 또는 다른 적당한 치환기이다.
"알킬티오"는 -SRζ를 의미하고, Rζ은 임의 치환될 수 있는 알킬이다. 통상 알킬티오 기는 제한없이 메틸티오, 에틸티오, n-프로필티오 등을 포함한다.
"알킬티오알킬"은 알킬티오 기로 치환된 알킬, -SRζ을 의미하고, Rζ은 임의 치환될 수 있는 알킬이다.
"설포닐"은 -SO2-를 의미한다. 치환된 설포닐은 -SO2-Rη을 의미하고, Rη은 알킬, 아릴 또는 다른 적당한 치환기이다.
"알킬설포닐"은 -SO2-Rζ을 의미하고, Rζ은 임의 치환될 수 있는 알킬이다. 통상의 알킬설포닐 기는 제한없이 메틸설포닐, 에틸설포닐, n-프로필설포닐 등을 포함한다.
"알킬설포닐알킬"은 알킬설포닐 기로 치환된 알킬, -SO2-Rζ을 의미하고, Rζ은 임의 치환될 수 있는 알킬이다.
"헤테로아릴"은 총 1-10개의 탄소 원자 및 고리 내 산소, 질소 및 황에서 선택된 총 1-4개의 헤테로원자의 방향족 헤테로시클릭 기를 의미한다. 이러한 헤테로아릴 기는 단일 고리(예, 피리딜 또는 푸릴) 또는 다중 축합 고리(예, 인돌리지닐 또는 벤조티에닐)를 가질 수 있다.
"헤테로아릴알킬"은 바람직하게는 알킬 모이어티에서 총 1-6개의 탄소 원자 및 헤테로아릴 모이어티에서 총 5-12개의 고리 원자를 갖는 헤테로아릴로 치환된 알킬(즉, 헤테로아릴-알킬-기)를 의미한다. 이러한 헤테로아릴알킬 기는 피리딜메틸 등으로 예시된다.
"헤테로사이클", "헤테로시클릭" 및 상호교환적으로 "헤테로시클로알킬"은 총 2-10개의 탄소 고리 원자 및 고리 내 질소, 황 또는 산소에서 선택되는 총 1-4개의 헤테로 고리 원자의 단일 고리 또는 다중 축합 고리를 갖는 포화 또는 불포화된 기를 의미한다. 이러한 헤테로시클릭 기는 단일 고리(예, 피페리디닐 또는 테트라히드로푸릴) 또는 다중 축합 고리(예, 인돌리닐, 디히드로벤조푸란 또는 퀴누클리디닐)를 가질 수 있다. 헤테로사이클의 예는 제한없이 푸란, 티오펜, 티아졸, 옥사졸, 피롤, 이미다졸, 피라졸, 피리딘, 피라진, 피리미딘, 피리다진, 인돌리진, 이소인돌, 인돌, 인다졸, 푸린, 퀴놀리진, 이소퀴놀린, 퀴놀린, 프탈라진, 나프틸피리딘, 퀴녹살린, 퀴나졸린, 신놀린, 프테리딘, 카르바졸, 카르볼린, 페난트리딘, 아크리딘, 페난트롤린, 이소티아졸, 페나진, 이속사졸, 페녹사진, 페노티아진, 이미다졸리딘, 이미다졸린, 피페리딘, 피페라진, 피롤리딘, 인돌린 등을 포함한다.
"헤테로시클로알킬알킬"은 바람직하게는 알킬 모이어티에서 총 1-6개의 탄소 원자 및 헤테로시클로알킬 모이어티에서 총 3-12개의 고리 원자를 갖는 헤테로시클로알킬로 치환된 알킬(즉, 헤테로시클로알킬-알킬-기)을 의미한다.
"원 고리"는 임의의 시클릭 구조를 포괄하는 것을 의미한다. 숫자에 후속하는 용어 "~원"은 고리를 구성하는 골격 원자의 갯수를 나타낸다. 따라서, 예를 들면, 시클로헥실, 피리딘, 피람 및 티오피란은 6원 고리이고, 시클로펜틸, 피롤, 푸란 및 티오펜은 5원 고리이다.
본원에 사용된 "융합된 바이시클릭 고리"는 각 고리에서 5-8개의 원자를 갖고, 고리가 2개의 공통 원자를 갖는 비치환 및 치환된 카르보시클릭 및/또는 헤테로시클릭 고리 모이어티를 의미한다.
달리 특정하지 않는 한, 상기 기에서 수소로 점유된 위치는, 제한없이, 히드록시, 옥소, 니트로, 메톡시, 에톡시, 알콕시, 치환된 알콕시, 트리플루오로메톡시, 할로알콕시, 플루오로, 클로로, 브로모, 요오도, 할로, 메틸, 에틸, 프로필, 부틸, 알킬, 알케닐, 알키닐, 치환된 알킬, 트리플루오로메틸, 할로알킬, 히드록시알킬, 알콕시알킬, 티오, 알킬티오, 아실, 카르복시, 알콕시카르보닐, 카르복사미도, 치환된 카르복사미도, 알킬설포닐, 알킬설피닐, 알킬설포닐아미노, 설폰아미도, 치환된 설폰아미도, 시아노, 아미노, 치환된 아미노, 알킬아미노, 디알킬아미노, 아미노알킬, 아실아미노, 아미디노, 아미독시모, 히드록사모일, 페닐, 아릴, 치환된 아릴, 아릴옥시, 아릴알킬, 아릴알케닐, 아릴알키닐, 피리딜, 이미다졸릴, 헤테로아릴, 치환된 헤테로아릴, 헤테로아릴옥시, 헤테로아릴알킬, 헤테로아릴알케닐, 헤테로아릴알키닐, 시클로프로필, 시클로부틸, 시클로펜틸, 시클로헥실, 시클로알킬, 시클로알케닐, 시클로알킬알킬, 치환된 시클로알킬, 시클로알킬옥시, 피롤리디닐, 피페리디닐, 모르폴리노, 헤테로사이클, (헤테로사이클)옥시, 및 (헤테로사이클)알킬에 의해 예시되는 치환기로 추가 치환될 수 있고; 바람직한 헤테로원자는 산소, 질소 및 황이다. 개방 원자가가 이러한 치환기 상에 존재하는 경우, 이들은 알킬, 시클로알킬, 아릴, 헤테로아릴, 및/또는 헤테로사이클 기로 추가 치환될 수 있고, 이러한 개방 원자가가 탄소 상에 존재하는 경우 이들은 할로겐으로 그리고 산소-, 질소-, 또는 황-결합된 치환기로 추가 치환될 수 있고, 복수의 그러한 개방 원자가가 존재하는 경우, 그러한 기는 결합의 직접 형성에 의해 또는 새로운 헤테로원자, 바람직하게는 산소, 질소 또는 황에 대한 결합의 형성에 의해 고리를 형성하기 위해 연결될 수 있다는 것을 이해하여야 한다. 상기 치환은 수소를 치환기로 치환하는 것이 본 발명의 분자에 용인할 수 없는 불안정성을 도입시키지 않고 그외 화학적으로 합리적인 조건 하에서 제공될 수 있다는 것을 추가로 이해하여야 한다.
본원에 사용된 바와 같이, "임의로" 및 "경우에 따라"는 추후 기술되는 사건 또는 상황이 일어나거나 일어나지 않을 수 있고, 설명은 사건 또는 상황이 일어나는 경우 및 사건 또는 상황이 일어나지 않는 경우를 포함하는 것을 의미한다. 당업자는 하나 이상의 임의 치환기를 함유하는 것으로 기술되는 임의의 분자와 관련하여 입체적으로 실질적인 및/또는 합성적으로 실현가능한 화합물만이 포함되는 것을 의미한다는 것을 이해하여야 한다. "임의 치환된"은 용어 또는 일련의 화학 기에 있는 모든 후속 개질체를 의미한다. 예를 들면, 용어 "임의 치환된 아릴알킬"에서, 분자에서 "알킬" 부분 및 "아릴" 부분은 치환되거나 치환될 수 없고, 일련의 "임의 치환된 알킬, 시클로알킬, 아릴 및 헤테로아릴"에서, 알킬, 시클로알킬, 아릴 및 헤테로아릴 기는, 나머지와 독립적으로, 치환되거나 치환될 수 없다.
글리코실화
글리코실화는 안정성, 약력학, 용해성 및 막 수송을 비롯한 천연 및 합성 산물의 많은 특성을 변경시킬 수 있다. 항균, 항종양, 천연 감미 특성 등을 가진 많은 이차 대사산물을 비롯한 많은 분자는 β-글리코시드 연결로 개질된 비-리보솜 펩피드, 폴리케티드 또는 테르페노이드 골격을 포함한다. 식물로부터 추출된 다수의 디테르펜 글리코시드, 즉 스테비아 레바우디아나 베르토니(Stevia rebaudiana Bertoni)는 β-연결된 글루코스 분자를 함유한다. 자연스럽게, 이러한 분자는 UDP-글루코스 의존 글리코실 트랜스퍼라제 효소를 사용하여 생체 내에서 글리코실화된다. 하지만, 시험관 내에서 사용되는 경우, UDP-글루코스는 엄청나게 고가이고/이거나 입수가 불가능할 수 있다. 본 발명에서, 신규 반응 도식(도 2 참조)이 제공되며, 여기서 2종의 상이한 효소 부류는 α-글루코스-1-포스페이트로부터 샘플 기질(예, 스테비오시드)로 글루코스 모이어티를 전달하는 데 사용되어, 하나 이상의 β-글루코스 연결 산물을 형성한다. 일부 실시양태에서, 천연 스테비오시드 UDP-글루코스 의존 글리코실트랜스퍼라제는, 레바우디오시드 A를 형성하기 위해 α-글루코스-1-포스페이트를 사용하여 활성을 갖는 것으로 보여진다(도 1 참조). 일부 추가 실시양태에서, 라미나리비오스 포스포릴라제는 역방향으로 작용하여 β-글루코스 연결된 스테비오시드 화합물과, α-글루코스-1-포스페이트 및 스테비오시드로부터의 무기 포스페이트를 형성한다.
따라서, 글리코실화는 천연 감미제, 예컨대 달콤한 허브인, 스테비아 레바우디아나 베르토니로부터 유도된 것의 형성에 사용된다. 상기 제시된 바와 같이, 이러한 식물은 많은 다른 고 효능 감미제의 것보다 우수한 고강도 감미제 및 감각 특성을 특징으로 하는 다수의 디테르펜 글리코시드를 생성한다. 상기 언급된 달콤한 글리코시드는 공통의 아글리콘(즉, 스테비올)을 갖고, C13 및 C19 위치에서 탄수화물 잔기의 숫자 및 유형이 상이하다. 스테비올 글리코시드는 분자 구조뿐만 아니라 또한 그 맛 특성도 서로 상이하다. 통상, 스테비오시드는 수크로스보다 110-270배 더 달콤한 것으로 보고되었지만, 레바우디오시드 A는 수크로스보다 150-320배 더 달콤한 것으로 보고되어 있고, 레바우디오시드 C는 수크로스보다 40-60배 더 달콤한 것으로 보고되어 있다. 공통의 이러한 화합물 중, 레바우디오시드 A는 최소의 톡쏘는 맛, 최소의 쓴 맛 그리고 최소의 지속되는 뒷맛을 갖는다. 따라서, 이는 주요 스테비올 글리코시드 중 가장 유리한 감각 속성을 갖는다. 하지만, 레바우디오시드 A는 스테비아 레바우디아나 베르토니로부터 단리된 전체 글리코시드 중 소량(2-10%)만을 구성하며, 스테비오시드(2-10%) 및 레바우디오시드 C(1-2%)를 포함한 다른 화합물이 그 나머지를 구성한다.
일부 기질의 글리코실화 패턴을 변화시키는 것은 정제를 단순화시키고/시키거나 덜 바람직한 분자(예, 스테비오시드)를 더욱 바람직한 화합물(예, 레바우디오시드 A)로 전환시키는 데 사용된다. 일부 경우에, 글리코실화는 화학 합성 방법을 통해 실현된다. 하지만, 이러한 방법은 통상 바람직하지 않은 화학물질 및 공정을 갖는 복수의 합성 단계를 필요로 하고 혼합된 산물을 형성할 수 있다(예, 부정확한 위치에서의 연결 및/또는 바람직하지 않은 아노머 배열).
대조적으로, 글리코실화 효소는 온화한 조건 하에 활성일 수 있고, 단일 단계에서 높은 위치 선택성 및 입체특이성을 부여할 수 있다. 많은 천연 유도된 글리코실화된 대사산물은 다양한 당류 뉴클레오티드로부터 당류 모이어티를 전달하는 글리코실트랜스퍼라제(GT) 효소를 사용하여 생체 내에서 발생된다. 하지만, 시험관 내 공정에서 사용되는 경우, 그러한 효소가 필요한 당류 뉴클레오티드 공여체는 엄청나게 고가일 수 있고 규모에 있어서 이용가능하지 않을 수 있다. 따라서, 덜 비싸고/비싸거나 더욱 편리한 당류 공여체를 사용하여 글리코실화된 분자를 형성할 수 있는 효소가 필요한 실정이다.
조작된 글리코실트랜스퍼라제 폴리펩티드
본 발명은 글리코실트랜스퍼라제 활성을 갖는 폴리펩티드, 폴리펩티드를 코딩하는 폴리뉴클레오티드, 폴리펩티드의 생산 방법, 및 폴리펩티드의 사용 방법을 제공한다. 설명이 폴리펩티드에 관한 것인 경우, 이는 또한 폴리펩티드를 코딩하는 폴리뉴클레오티드를 기술하는 것으로 이해하여야 한다.
조작된 폴리펩티드의 상기 기술된 개선된 특성이 트랜스퍼라제 반응을 수행하기에 적합한 반응 조건은 하기 추가 기술되는 바 그리고 하기 실시예에서 폴리펩티드의 농도 또는 양, 기질, 보조기질, 전이 금속 보조인자, 환원제, 완충액, 공용매, pH, 온도 및 반응 시간을 포함한 조건, 및/또는 고체 지지체 상에 고정된 폴리펩티드를 갖는 조건과 관련하여 결정될 수 있다.
일부 실시양태에서, 특히 스테비올 글리코시드의 나아가 글리코실화된 스테비올 글리코시드로의 전환에 있어서 개선된 특성을 갖는 글리코실트랜스퍼라제 활성을 갖는 예시적인 조작된 폴리펩티드는, 서열번호 2, 4, 6 및/또는 8과 비교하여 하나 이상의 잔기 차이를 갖는 아미노산 서열을 포함한다.
이러한 다른 잔기 위치에서의 잔기 차이는 트랜스퍼라제 반응을 수행하는 폴리펩티드의 능력에 악영향을 미치는 일 없이 아미노산 서열에 있어서 추가 변이를 제공할 수 있다. 일부 실시양태에서, 서열은 추가로 서열번호 2, 4, 6 및/또는 8과 비교하여 다른 아미노산 잔기 위치에서 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45 또는 1-50 잔기 차이를 포함한다. 일부 실시양태에서, 기준 서열과 비교하여 아미노산 잔기 차이의 갯수는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 30, 35, 40, 45 또는 50 잔기 위치일 수 있다. 일부 실시양태에서, 기준 서열과 비교하여 아미노산 잔기 차이의 갯수는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 21, 22, 23, 24 또는 25 잔기 위치일 수 있다. 이러한 다른 위치에서의 잔기 차이는 보존성 변화 또는 비보존성 변화일 수 있다. 일부 실시양태에서, 잔기 차이는 서열번호 2, 4, 6 및/또는 8의 천연 발생 글리코실트랜스퍼라제 폴리펩티드와 비교하여 보존성 치환 및 비보존성 치환을 포함할 수 있다.
일부 실시양태에서, 본 발명은 또한 조작된 글리코실트랜스퍼라제의 기능적 활성 및/또는 개선된 특징을 유지하는 본원에 기술된 임의의 조작된 글리코실트랜스퍼라제 폴리펩티드 단편을 포함하는 조작된 폴리펩티드를 제공한다. 따라서, 일부 실시양태에서, 본 발명은 적합한 반응 조건 하에서 트랜스퍼라제 반응을 할 수 있는 폴리펩티드 단편을 제공하고, 단편은 본 발명의 글리코실트랜스퍼라제 폴리펩티드, 예컨대 서열번호 2, 4, 6 및/또는 8의 천연 발생 글리코실트랜스퍼라제 폴리펩티드의 전장 아미노산 서열의 적어도 약 80%, 90%, 95%, 96%, 97%, 98% 또는 99%를 포함한다.
일부 실시양태에서, 조작된 글리코실트랜스퍼라제 폴리펩티드는 본원에 기술된 글리코실트랜스퍼라제 폴리펩티드, 예컨대 서열번호 2, 4, 6 및/또는 8의 천연 발생 글리코실트랜스퍼라제 폴리펩티드 중 임의의 하나의 결실을 포함하는 아미노산 서열을 가질 수 있다.
따라서, 본 발명의 조작된 글리코실트랜스퍼라제 폴리펩티드의 각 그리고 모든 실시양태의 경우, 아미노산 서열은 1 이상의 아미노산, 2 이상의 아미노산, 3 이상의 아미노산, 4 이상의 아미노산, 5 이상의 아미노산, 6 이상의 아미노산, 8 이상의 아미노산, 10 이상의 아미노산, 15 이상의 아미노산, 또는 20 이상의 아미노산, 글리코실트랜스퍼라제 폴리펩티드의 아미노산의 총 갯수의 최대 10%, 아미노산 총 갯수의 최대 10%, 아미노산의 총 갯수의 최대 20%, 또는 아미노산의 총 갯수의 최대 30%의 결실을 포함할 수 있고, 본원에 기술된 조작된 글리코실트랜스퍼라제의 회합된 기능 활성 및/또는 개선된 특성이 유지된다. 일부 실시양태에서, 결실은 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-15, 1-20, 1-21, 1-22, 1-23, 1-24, 1-25, 1-30, 1-35, 1-40, 1-45 또는 1-50 아미노산 잔기를 포함할 수 있다. 일부 실시양태에서, 결실의 갯수는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 30, 35, 40, 45 또는 50 아미노산 잔기일 수 있다. 일부 실시양태에서, 결실은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 21, 22, 23, 24 또는 25 아미노산 잔기의 결실을 포함할 수 있다.
일부 실시양태에서, 본원에서 조작된 글리코실트랜스퍼라제 폴리펩티드는 본원에 기술된 글리코실트랜스퍼라제 폴리펩티드, 예컨대 서열번호 2, 4, 6 및/또는 8의 천연 발생 글리코실트랜스퍼라제 폴리펩티드 중 임의의 하나와 비교하여 삽입을 포함하는 아미노산 서열을 가질 수 있다. 따라서, 본 발명의 글리코실트랜스퍼라제 폴리펩티드의 일부 실시양태에서, 삽입은 1 이상의 아미노산, 2 이상의 아미노산, 3 이상의 아미노산, 4 이상의 아미노산, 5 이상의 아미노산, 6 이상의 아미노산, 8 이상의 아미노산, 10 이상의 아미노산, 15 이상의 아미노산, 20 이상의 아미노산, 30 이상의 아미노산, 40 이상의 아미노산, 또는 50 이상의 아미노산을 포함할 수 있고, 본원에 기술된 조작된 글리코실트랜스퍼라제의 회합된 기능 활성 및/또는 개선된 특성이 유지된다. 삽입은 아미노 또는 카르복시 말단, 또는 글리코실트랜스퍼라제 폴리펩티드의 내부 영역에 있을 수 있다.
일부 실시양태에서, 아미노산 서열은 경우에 따라 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-15, 1-20, 1-21, 1-22, 1-23, 1-24, 1-25, 1-30, 1-35, 1-40, 1-45 또는 1-50 아미노산 잔기 결실, 삽입 및/또는 치환을 갖는다. 일부 실시양태에서, 아미노산 서열의 갯수는 경우에 따라 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 30, 35, 40, 45, or 50 아미노산 잔기 결실, 삽입 및/또는 치환을 갖는다. 일부 실시양태에서, 아미노산 서열은 경우에 따라 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 21, 22, 23, 24 또는 25 아미노산 잔기 결실, 삽입 및/또는 치환을 갖는다. 일부 실시양태에서, 치환은 보존성 또는 비보존성 치환일 수 있다.
상기 실시양태에서, 조작된 폴리펩티드에 적합한 반응 조건은 하기 실시예에 제공된다.
일부 실시양태에서, 본 발명의 폴리펩티드는 융합 폴리펩티드이고, 조작된 폴리펩티드는 다른 폴리펩티드, 예로서 제한없이, 항체 태그(예, myc 에피토프), 정제 서열(예, 금속에 결합하기 위한 His 태그), 및 세포 국소화 신호(예, 분비 신호) 등에 융합된다. 따라서, 본원에 기술된 조작된 폴리펩티드는 다른 폴리펩티드에 융합하거나 하지 않고 사용될 수 있다.
본원에 기술된 폴리펩티드는 유전적으로 코딩된 아미노산으로 제한되지 않는다는 것을 이해하여야 한다. 유전적으로 코딩된 아미노산 이외에, 본원에 기술된 폴리펩티드는 전체적으로 또는 부분적으로 천연 발생 및/또는 합성 비코딩된 아미노산을 포함할 수 있다. 본원에 기술된 폴리펩티드가 포함될 수 있는 일반적으로 직면하는 특정 비코딩된 아미노산은, 제한없이, 유전적으로 코딩된 아미노산의 D-입체이성질체; 2,3-디아미노프로피온산(Dpr); α-아미노이소부티르산(Aib); ε-아미노헥산산(Aha); δ-아미노발레르산(Ava); N-메틸글리신 또는 사르코신(MeGly 또는 Sar); 오르니틴(Orn); 시트룰린(Cit); t-부틸알라닌(Bua); t-부틸글리신(Bug); N-메틸이소류신(MeIle); 페닐글리신(Phg); 시클로헥실알라닌(Cha); 노르류신(Nle); 나프틸알라닌(Nal); 2-클로로페닐알라닌(Ocf); 3-클로로페닐알라닌(Mcf); 4-클로로페닐알라닌(Pcf); 2-플루오로페닐알라닌(Off); 3-플루오로페닐알라닌(Mff); 4-플루오로페닐알라닌(Pff); 2-브로모페닐알라닌(Obf); 3-브로모페닐알라닌(Mbf); 4-브로모페닐알라닌(Pbf); 2-메틸페닐알라닌(Omf); 3-메틸페닐알라닌(Mmf); 4-메틸페닐알라닌(Pmf); 2-니트로페닐알라닌(Onf); 3-니트로페닐알라닌(Mnf); 4-니트로페닐알라닌(Pnf); 2-시아노페닐알라닌(Ocf); 3-시아노페닐알라닌(Mcf); 4-시아노페닐알라닌(Pcf); 2-트리플루오로메틸페닐알라닌(Otf); 3-트리플루오로메틸페닐알라닌(Mtf); 4-트리플루오로메틸페닐알라닌(Ptf); 4-아미노페닐알라닌(Paf); 4-요오도페닐알라닌(Pif); 4-아미노메틸페닐알라닌(Pamf); 2,4-디클로로페닐알라닌(Opef); 3,4-디클로로페닐알라닌(Mpcf); 2,4-디플루오로페닐알라닌(Opff); 3,4-디플루오로페닐알라닌(Mpff); 피리드-2-일알라닌(2pAla); 피리드-3-일알라닌(3pAla); 피리드-4-일알라닌(4pAla); 나프트-1-일알라닌(1nAla); 나프트-2-일알라닌(2nAla); 티아졸릴알라닌(taAla); 벤조티에닐알라닌(bAla); 티에닐알라닌(tAla); 푸릴알라닌(fAla); 호모페닐알라닌(hPhe); 호모티로신(hTyr); 호모트립토판(hTrp); 펜타플루오로페닐알라닌(5ff); 스티릴크알라닌(sAla); 아루트릴알라닌(aAla); 3,3-디페닐알라닌(Dfa); 3-아미노-5-페닐펜탄산(Afp); 페니실라민(Pen); 1,2,3,4-테트라히드로이소퀴놀린-3-카르복실산(Tic); β-2-티에닐알라닌(Thi); 메티오닌 설폭시드(Mso); N(w)-니트로아르기닌(nArg); 호모리신(hLys); 포스포노메틸페닐알라닌(pmPhe); 포스포세린(pSer); 포스포트레오닌(pThr); 호모아스파르트산(hAsp); 호모글루탄산(hGlu); 1-아미노시클로펜트-(2 또는 3)-엔-4 카르복실산; 피페콜산(PA), 아제티딘-3-카르복실산(ACA); 1-아미노시클로펜탄-3-카르복실산; 알릴글리신(aGly); 프로파르길글리신(pgGly); 호모알라닌(hAla); 노르발린(nVal); 호모류신(hLeu), 호모발린(hVal); 호모이소류신(hIle); 호모아르기닌(hArg); N-아세틸 리신(AcLys); 2,4-디아미노부티르산(Dbu); 2,3-디아미노부티르산(Dab); N-메틸발린(MeVal); 호모시스테인(hCys); 호모세린(hSer); 히드록시프롤린(Hyp) 및 호모프롤린(hPro)을 포함한다. 본원에 기술된 폴리펩티드가 포함될 수 있는 추가의 비코딩된 아미노산은 당업자에게 자명하다(예, Fasman에서 제공된 다양한 아미노산, CRC Practical Handbook of Biochemistry and Molecular Biology, CRC Press, Boca Raton, FL, pp. 3-70 [1989], 및 본원에 인용된 참고문헌 참조, 이의 전부는 본원에 참고 인용됨). 이러한 아미노산은 L 또는 D 배열일 수 있다.
당업자는 아미노산 또는 잔기 보유 측쇄 보호 기가 또한 본원에 기술된 폴리펩티드를 포함할 수 있다는 것을 인지한다. 이 경우 방향족 카테고리에 속하는 이러한 보호된 아미노산의 비제한적 예는, (괄호에 나열된 보호기), 제한없이, Arg(tos), Cys(메틸벤질), Cys(니트로피리딘설페닐), Glu(δ-벤질에스테르), Gln(크산틸), Asn(N-δ-크산틸), His(bom), His(벤질), His(tos), Lys(fmoc), Lys(tos), Ser(O-벤질), Thr (O-벤질) 및 Tyr(O-벤질)를 포함한다.
본원에 기술된 폴리펩티드가 포함될 수 있는 배좌 구속된 비코딩된 아미노산은, 제한없이, N-메틸 아미노산(L-배열); 1-아미노시클로펜트-(2 또는 3)-엔-4-카르복실산; 피페콜산; 아제티딘-3-카르복실산; 호모프롤린(hPro); 및 1-아미노시클로펜탄-3-카르복실산을 포함한다.
일부 실시양태에서, 조작된 폴리펩티드는 다양한 형태, 예컨대 단리된 제제, 실질적으로 정제된 효소, 효소를 코딩하는 유전자(들)로 형질전화된 전체 세포, 및/또는 세포 추출물, 및/또는 그러한 세포의 용해물이다. 효소는 추가로 후술되는 바와 같이 동결건조, 분무 건조, 침전 또는 미정제 페이스트 형태일 수 있다.
일부 실시양태에서, 조작된 폴리펩티드는 고체 지지체, 예컨대 멤브레인, 수지, 고체 담체, 또는 다른 고체 상 재료에 제공된다. 고체 지지체는 유기 중합체, 예컨대 폴리스티렌, 폴리에틸렌, 폴리프로필렌, 폴리플루오로에틸렌, 폴리에틸렌옥시 및 폴리아크릴아미드, 그리고 이의 공중합체 및 그래프트로 구성될 수 있다. 고체 지지체는 또한 무기, 예컨대 글래스, 실리카, 제어 기공 글래스(CPG), 역상 실리카 또는 금속, 예컨대 금 또는 백금일 수 있다. 고체 지지체의 구성은 비드, 스피어, 입자, 과립, 겔, 멤브레인 또는 표면의 형태일 수 있다. 표면은 평면, 실질적으로 평면 또는 비평면일 수 있다. 고체 지지체는 다공성 또는 비다공성일 수 있고, 팽창 또는 비팽창 특징을 가질 수 있다. 고체 지지체는 웰, 함몰부, 또는 다른 컨테이너, 용기, 특징부 또는 장소의 형태로 설정될 수 있다.
일부 실시양태에서, 본 발명의 글리코실트랜스퍼라제 활성을 갖는 조작된 폴리펩티드는 서열번호 2, 4, 6 및/또는 8의 기준 폴리펩티드에 비해 개선된 활성, 입체선택성, 및/또는 다른 개선된 특성을 보유하도록 고체 지지체 상에 고정될 수 있다. 이러한 실시양태에서, 고정된 폴리펩티드는 기질 화합물 또는 다른 적당한 기질의 산물로의 생체촉매 전환을 용이하게 할 수 있고 반응 완료 후 (예, 폴리펩티드가 고정된 비드를 보유함으로써) 쉽게 유지되고, 후속 반응에서 재사용되거나 재순환된다. 그러한 고정된 효소 공정은 추가의 효율 및 비용 절감을 가능하게 한다. 따라서, 본 발명의 글리코실트랜스퍼라제 폴리펩티드를 사용하는 임의의 방법은 고체 지지체 상에 결합 또는 고정된 동일한 글리코실트랜스퍼라제 폴리펩티드를 사용하여 수행될 수 있다는 것이 추가로 고려된다.
효소 고정 방법은 당업계에 잘 공지되어 있다. 조작된 폴리펩티드는 비공유 또는 공유 결합될 수 있다. 효소의 고체 지지체(예, 수지, 멤브레인, 비드, 글래스 등)로의 컨쥬게이션 및 고정을 위한 다양한 방법은 당업계에 잘 공지되어 있다(예, Yi et al., Proc. Biochem., 42(5): 895-898 [2007]; Martin et al., Appl. Microbiol. Biotechnol., 76(4): 843-851 [2007]; Koszelewski et al., J. Mol. Cat. B: Enzymatic, 63: 39-44 [2010]; Truppo et al., Org. Proc. Res. Dev., published online: dx.doi.org/10.1021/op200157c; Hermanson, Bioconjugate Techniques, 2nd ed., Academic Press, Cambridge, MA [2008]; Mateo et al., Biotechnol. Prog., 18(3):629-34 [2002]; and "Bioconjugation Protocols: Strategies and Methods," In Methods in Molecular Biology, Niemeyer (ed.), Humana Press, New York, NY [2004] 참조; 각각의 개시내용은 본원에 참고 인용됨). 본 발명의 조작된 글리코실트랜스퍼라제를 고정시키기에 유용한 고체 지지체는 제한없이 에폭시드 작용 기를 갖는 폴리메타크릴레이트, 아미노 에폭시드 작용 기를 갖는 폴리메타크릴레이트, 스티렌/DVB 공중합체 또는 옥타데실 작용 기를 갖는 폴리메타크릴레이트를 포함한 비드 또는 수지를 포함한다. 본 발명의 조작된 글리코실트랜스퍼라제 폴리펩티드를 고정하기에 유용한 예시적인 고체 지지체는 제한없이 키토산 비드, Eupergit C 및 SEPABEAD(Mitsubishi)와 하기 상이한 유형의 SEPABEAD: EC-EP, EC-HFA/S, EXA252, EXE119 및 EXE120을 포함한다.
일부 실시양태에서, 본원에 기술된 폴리펩티드는 키트의 형태로 제공된다. 키트 내 효소는 개별적으로 또는 복수의 효소로서 존재할 수 있다. 키트는 효소 반응을 수행하기 위한 시약, 효소의 활성을 평가하기 위한 기질, 및 산물을 검출하기 위한 시약을 추가로 포함할 수 있다. 키트는 또한 시약 디스펜서 및 키트 사용을 위한 설명서를 포함할 수 있다.
일부 실시양태에서, 본 발명의 키트는 상이한 어드레스가능한 위치에서 복수의 상이한 글리코실트랜스퍼라제 폴리펩티드를 포함한 어레이를 포함하고, 상이한 폴리펩티드는 적어도 하나의 상이한 개선된 효소 특성을 각각 갖는 기준 서열의 상이한 변이체이다. 일부 실시양태에서, 고체 지지체 상에 고정된 복수의 폴리펩티드는 시약의 자동 전달로 어드레스 가능한, 또는 검출 방법 및/또는 기기에 의해 다양한 위치에서 어레이 상에 형성된다. 어레이는 폴리펩티드에 의해 전환을 위한 다양한 기질 화합물을 테스트하는 데 사용될 수 있다. 복수의 조작된 폴리펩티드를 포함하는 어레이 및 이의 사용 방법은 당업계에 공지되어 있다(예, WO2009/008908A2 참조).
조작된 글리코실트랜스퍼라제를 코딩하는 폴리뉴클레오티드, 발현 벡터 및 숙주 세포
또다른 양태에서, 본 발명은 본원에 기술된 조작된 글리코실트랜스퍼라제 폴리펩티드를 코딩하는 폴리뉴클레오티드를 제공한다. 폴리뉴클레오티드는 폴리펩티드를 발현할 수 있는 재조합 폴리뉴클레오티드를 형성하기 위해 유전자 발현을 조절하는 하나 이상의 이종성 조절 서열에 작동가능하게 연결될 수 있다. 조작된 글리코실트랜스퍼라제를 코딩하는 이종성 폴리뉴클레오티드를 함유하는 발현 구성체는 적절한 숙주 세포 내에 도입되어 해당 글리코실트랜스퍼라제 폴리펩티드를 발현한다.
당업자에게 확인되는 바와 같이, 다양한 아미노산에 상응하는 코돈의 지식 및 단백질 서열의 이용가능성은 대상 폴리펩티드를 코딩할 수 있는 모든 폴리뉴클레오티드의 설명을 제공한다. 동일 아미노산이 대안적이거나 동의적인 코돈에 의해 코딩되는 유전자 코드의 축퇴성은 모두 개선된 글리코실트랜스퍼라제 효소를 코딩하는 극도로 많은 수의 핵산을 만들 수 있도록 한다. 따라서, 특정 아미노산 서열의 지식을 가졌지만, 당업자는 단백질의 아미노산 서열을 변화시키지 않는 방식으로 하나 이상의 코돈의 서열을 간단히 개질시킴으로써 임의의 수의 상이한 핵산을 만들 수 있다. 이와 관련하여, 본 발명은 가능한 코돈 선택을 기반으로 한 조합을 선택함으로써 본원에 기술된 폴리펩티드를 코딩하도록 할 수 있는 각각의 모든 가능한 폴리뉴클레오티드 변이를 특별히 고려하고, 모든 그러한 변이는 서열번호 1-32의 짝수 서열로 본원에 참고 인용된 서열 목록에 개시된 아미노산 서열을 비롯하여 본원에 기술된 임의의 폴리펩티드에 특별히 개시되는 것으로 간주된다.
다양한 실시양태에서, 코돈은 바람직하게는 단백질이 생산되는 숙주 세포에 맞도록 선택된다. 예를 들면, 박테리아에 사용되는 바람직한 코돈은 박테리아에서 유전자를 발현하는 데 사용되고; 효모에서 사용되는 바람직한 코돈은 효모에서 발현하는 데 사용되고; 포유동물에서 사용되는 바람직한 코돈은 포유동물 세포에서 발현하는 데 사용된다. 일부 실시양태에서, 천연 서열이 바람직한 코돈을 포함하고 바람직한 코돈의 사용이 모든 아미노산 잔기에 필요하지 않을 수 있기 때문에 모든 코돈이 글리코실트랜스퍼라제의 코돈 용법을 최적화하도록 대체될 필요는 없다. 결과적으로, 글리코실트랜스퍼라제 효소를 코딩하는 코돈 최적화된 폴리뉴클레오티드는 전장 코딩 영역 내 코돈 위치의 약 40%, 50%, 60%, 70%, 80%, 90% 또는 그 이상에서 바람직한 코돈을 함유할 수 있다.
일부 실시양태에서, 폴리뉴클레오티드는 서열번호 2, 4, 6 및/또는 8로 표시되는 천연 발생 글리코실트랜스퍼라제 폴리펩티드 아미노산 서열을 코딩하는 코돈 최적화된 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 폴리뉴클레오티드는 서열번호 1-32의 짝수 서열을 코딩하는 코돈 최적화된 핵산 서열에 대해 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 동일성을 포함하는 핵산 서열을 갖는다. 일부 실시양태에서, 폴리뉴클레오티드는 서열번호 1-32의 홀수 서열로 코돈 최적화된 핵산 서열에 대해 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 동일성을 포함하는 핵산 서열을 갖는다. 서열번호 1-32의 홀수 서열의 코돈 최적화된 서열은, 코딩된 야생형 글리코실트랜스퍼라제의 발현을 증진시키고, 본원에 기술된 트랜스퍼라제 활성이 가능한 효소의 제제를 제공한다. 일부 실시양태에서, 코돈 최적화된 폴리뉴클레오티드 서열은 스테비아 레바우디아나, 스트렙토마이세스 레지스토마이시피쿠스(Streptomyces resistomycificus), 스트렙토마이세스 안티바이오티쿠스(Streptomyces antibioticus) 및/또는 파에니바실루스(Paenibacillus) 종 YM1 유래의 천연 발생 폴리뉴클레오티드 서열과 비교하여 적어도 1.2배, 1.5배 또는 2배 또는 그 이상까지 글리코실트랜스퍼라제의 발현을 증진시킨다.
일부 실시양태에서, 폴리뉴클레오티드는 서열번호 1-32의 홀수 서열에서 선택된 기준 서열, 또는 이의 상보체에 대해 상당히 엄격한 조건 하에서 혼성화시킬 수 있고, 글리코실트랜스퍼라제 활성을 갖는 폴리펩티드를 코딩한다.
일부 실시양태에서, 상기 기술된 바와 같이, 폴리뉴클레오티드는 서열번호 2, 4, 6 및/또는 8에 비해 개선된 특성을 갖는 글리코실트랜스퍼라제 활성을 가진 조작된 폴리펩티드를 코딩하고, 폴리펩티드는 기준 서열에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 동일성, 및 서열번호 1-32의 짝수 서열에서 선택된 서열에 비해 하나 이상의 잔기 차이를 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 기준 아미노산 서열은 서열번호 1-32의 짝수 서열에서 선택된다. 일부 실시양태에서, 기준 아미노산 서열은 서열번호 2이다. 일부 실시양태에서, 기준 아미노산 서열은 서열번호 4이다. 일부 추가 실시양태에서, 기준 아미노산 서열은 서열번호 8이다.
일부 실시양태에서, 폴리뉴클레오티드는 서열번호 2, 4, 6 및/또는 8에 비해 개선된 특성을 갖는 본원에 제공된 트랜스퍼라제 반응이 가능한 글리코실트랜스퍼라제 폴리펩티드를 코딩하고, 폴리펩티드는 기준 서열 서열번호 2, 4, 6 및/또는 8에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성, 및 서열번호 2, 4, 6 및/또는 8에 비해 하나 이상의 잔기 차이를 갖는 아미노산 서열을 포함한다.
일부 실시양태에서, 폴리뉴클레오티드는 서열번호 2, 4, 6 및/또는 8에 비해 개선된 특성을 갖는 본원에 제공된 트랜스퍼라제 반응이 가능한 글리코실트랜스퍼라제 폴리펩티드를 코딩하고, 폴리펩티드는 기준 서열 서열번호 2, 4, 6 및/또는 8에 대한 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성, 및 서열번호 2, 4, 6 및/또는 8에 비해 하나 이상의 잔기 차이를 갖는 아미노산 서열을 포함한다.
일부 실시양태에서, 폴리뉴클레오티드는 서열번호 2, 4, 6 및/또는 8에 비해 개선된 특성을 갖는 본원에 제공된 트랜스퍼라제 반응이 가능한 글리코실트랜스퍼라제 폴리펩티드를 코딩하고, 폴리펩티드는 기준 서열 서열번호 2, 4, 6 및/또는 8에 대한 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성, 및 서열번호 2, 4, 6 및/또는 8에 비해 하나 이상의 잔기 차이를 갖는 아미노산 서열을 포함한다.
일부 실시양태에서, 조작된 글리코실트랜스퍼라제를 코딩하는 폴리뉴클레오티드는 서열번호 1-32의 홀수 서열에서 선택된 폴리뉴클레오티드 서열을 포함한다.
일부 실시양태에서, 폴리뉴클레오티드는 서열번호 1-32의 홀수 서열에서 선택된 기준 폴리뉴클레오티드 서열, 또는 이의 상보체에 대해 상당히 엄격한 조건 하에서 혼성화시킬 수 있고, 하나 이상의 본원에 기술된 개선된 특성을 갖는 글리코실트랜스퍼라제 활성을 갖는 폴리펩티드를 코딩한다. 일부 실시양태에서, 상당히 엄격한 조건 하에서 혼성화될 수 있는 폴리뉴클레오티드는 서열번호 2, 4, 6 및/또는 8에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 동일성을 갖는 아미노산 서열을 포함하고, 서열번호 2, 4, 6 및/또는 8에 비해 하나 이상의 잔기 차이를 포함하는 아미노산 서열을 갖는 글리코실트랜스퍼라제 폴리펩티드를 코딩한다.
일부 실시양태에서, 본원에 제공된 임의의 조작된 글리코실트랜스퍼라제 폴리펩티드를 코딩하는 단리된 폴리뉴클레오티드는 폴리펩티드의 발현을 제공하기 위해 다양한 방식으로 조작된다. 일부 실시양태에서, 폴리펩티드를 코딩하는 폴리뉴클레오티드는, 폴리뉴클레오티드 및/또는 폴리펩티드의 발현을 조절하기 위해 하나 이상의 제어 서열이 존재하는 발현 벡터로서 제공된다. 벡터에 삽입 전 단리된 폴리뉴클레오티드를 조작하는 것은 발현 벡터에 따라 바람직하거나 필요할 수 있다. 재조합 DNA 방법을 이용하여 폴리뉴클레오티드 및 핵산 서열을 개질하는 기법은 당업계에 잘 공지되어 있다.
일부 실시양태에서, 제어 서열은 무엇보다 프로모터, 리더 서열, 폴리아데닐화 서열, 프로펩티드 서열, 신호 펩티드 서열, 및 전사 종결부를 포함한다. 당업계에 공지된 바와 같이, 적당한 프로모터는 사용된 숙주 세포를 기초로 선택될 수 있다. 박테리아 숙주 세포의 경우, 본 출원의 핵산 구성체의 전사를 지정하기에 적당한 프로모터는 제한없이 이. 콜라이 lac 오페론, 스트렙토마이세스 코엘리콜러(Streptomyces coelicolor) 아가라아제 유전자(dagA), 바실러스 서브틸리스(Bacillus subtilis) 레반수크라아제 유전자(sacB), 바실러스 리체니포르미스(Bacillus licheniformis) 알파-아밀라아제 유전자(amyL), 바실러스 스테아로써모필러스(Bacillus stearothermophilus) 말토스형성성 아밀라아제 유전자(amyM), 바실러스 아밀로리커파시엔스(Bacillus amyloliquefaciens) 알파-아밀라아제 유전자(amyQ), 바실러스 리체니포르미스 페니실리나아제 유전자(penP), 바실러스 서브틸리스 xylA 및 xylB 유전자, 및 원핵생물 베타-락타마아제 유전자(예, Villa-Kamaroff et al., Proc. Natl Acad. Sci. USA 75: 3727-3731 [1978] 참조), 그리고 tac 프로모터(예, DeBoer et al., Proc. Natl Acad. Sci. USA 80: 21-25 [1983] 참조)에서 수득되는 프로모터를 포함한다. 사상균 숙주 세포에 대한 예시적인 프로모터는, 아스퍼질러스 오리자에(Aspergillus oryzae) TAKA 아밀라아제, 리조무코어 미에헤이(Rhizomucor miehei) 아스파르트산 프로테나제, 아스퍼질러스 나이거(Aspergillus niger) 중성 알파-아밀라아제, 아스퍼질러스 나이거 산 안정성 알파-아밀라아제, 아스퍼질러스 나이거 또는 아스퍼질러스 아와모리(Aspergillus awamori) 글루코아밀라알제(glaA), 리조무코어 미에헤이 리파아제, 아스퍼질러스 오리자에 알칼리 프로테아제, 아스퍼질러스 오리자에 트리오스 포스페이트 이소머라아제, 아스퍼질러스 니둘란스(Aspergillus nidulans) 아세타미다아제, 및 푸사리움 옥시스포럼(Fusarium oxysporum) 트립신 유사 프로테아제(예, WO 96/00787)에 대한 유전자로부터 수득한 프로모터, 그리고 NA2-tpi 프로모터(아스퍼질러스 나이거 중성 알파-아밀라아제 및 아스퍼질러스 오리자에 트리오스 포스페이트 이소머라아제에 대한 유전자 유래 프로모터의 하이브리드), 및 이의 돌연변이, 절두형, 및 하이브리드 프로모터를 포함한다. 예시적인 효모 세포 프로모터는 임의의 적당한 수크로스 유래일 수 있다. 일부 실시양태에서, 유전자는 사카로마이세스 세레비지아(Saccharomyces cerevisiae) 에놀라아제(ENO-1), 사카로마이세스 세레비지아 갈락토키나아제(GAL1), 사카로마이세스 세레비지아 알콜 디히드로게나아제/글리세르알데히드-3-포스페이트 디히드로게나아제(ADH2/GAP), 및 사카로마이세스 세레비지아 3-포스포글리세레이트 키나아제에 대한 유전자를 포함한다. 효모 숙주 세포에 대한 다른 유용한 프로모터는 당업계에 공지되어 있다(예, Romanos et al., Yeast 8:423-488 [1992] 참조).
일부 실시양태에서, 제어 서열은 적절한 전사 종결 서열, 즉 전사 종결을 위해 숙주 세포가 인식하는 서열이다. 종결부 서열은 폴리펩티드를 코딩하는 핵산 서열의 3' 말단에 작동가능하게 연결된다. 선택한 숙주 세포에서 기능하는 임의의 종결부가 본 발명에서 사용된다. 예를 들면, 사상균 숙주 세포에 대한 예시적인 전사 종결부는 아스퍼질러스 오리자에 TAKA 아밀라아제, 아스퍼질러스 나이거 글루코아밀라알제, 아스퍼질러스 니둘란스 안트라닐레이트 신타아제, 아스퍼질러스 나이거 알파-글루코시다아제, 및 푸사리움 옥시스포럼 트립신 유사 프로테아제에 대한 유전자로부터 수득될 수 있다. 효모 숙주 세포에 대한 예시적인 종결부는 사카로마이세스 세레비지아 에놀라아제, 사카로마이세스 세레비지아 사이토크롬 C(CYC1), 및 사카로마이세스 세레비지아 글리세르알데히드-3-포스페이트 디히드로게나아제에 대한 유전자로부터 수득될 수 있다. 효모 숙주 세포에 대해 유용한 다른 다양한 종결부는 당업계에 공지되어 있다(예, Romanos et al. 참조, 상술).
일부 실시양태에서, 제어 서열은 적당한 리더 서열, 즉 숙주 세포에 의한 번역에 중요한 mRNA의 비번역 영역이다. 리더 서열은 폴리펩티드를 코딩하는 핵산 서열의 5' 말단에 작동가능하게 연결된다. 선택한 숙주 세포에서 기능하는 임의의 리더 서열이 사용될 수 있다. 사상균 숙주 세포에 대한 예시적인 리더는 아스퍼질러스 오리자에 TAKA 아밀라아제 및 아스퍼질러스 니둘란스 트리오스 포스페이트 이소머라아제에 대한 유전자로부터 수득된다. 효모 숙주 세포에 적당한 리더는 제한없이 사카로마이세스 세레비지아 에놀라아제(ENO-1), 사카로마이세스 세레비지아 3-포스포글리세레이트 키나아제, 사카로마이세스 세레비지아 알파-인자, 및 사카로마이세스 세레비지아 알콜 디히드로게나아제/글리세르알데히드-3-포스페이트 디히드로게나아제(ADH2/GAP)에 대한 유전자로부터 수득된 것을 포함한다.
제어 서열은 또한 폴리아데닐화 서열, 즉 핵산 서열의 3' 말단에 작동가능하게 연결되고, 전사시, 전사된 mRNA에 폴리아데노신 잔기를 첨가하는 신호로서 숙주 세포에 의해 인식되는 서열일 수 있다. 선택한 숙주 세포에서 기능하는 임의의 폴리아데닐화 서열은 본 발명에 사용될 수 있다. 사상균 숙주 세포에 대한 예시적인 폴리아데닐화 서열은 제한없이 아스퍼질러스 오리자에 TAKA 아밀라아제, 아스퍼질러스 나이거 글루코아밀라알제, 아스퍼질러스 니둘란스 안트라닐레이트 신타아제, 푸사리움 옥시스포럼 트립신 유사 프로테아제, 및 아스퍼질러스 나이거 알파-글루코시다아제에 대한 유전자로부터 수득된 것을 포함한다. 효모 숙주 세포에 유용한 폴리아데닐화 서열은 또한 당업계에 공지되어 있다(예, Guo and Sherman, Mol. Cell. Bio., 15:5983-5990 [1995] 참조).
일부 실시양태에서, 제어 서열은 폴리펩티드의 아미노 말단에 연결된 아미노산 서열을 코딩하고 세포의 분비 경로로 코딩된 폴리펩티드를 지정하는 신호 펩티드 코딩 영역이다. 핵산 서열의 코딩 서열의 5' 말단은 분비된 폴리펩티드를 코딩하는 코딩 영역의 절편과 번역 리딩 프레임에 천연적으로 연결된 신호 펩티드 코딩 영역을 고유하게 함유할 수 있다. 대안적으로, 코딩 서열의 5' 말단은 코딩 서열에 외생성인 신호 펩티드 코딩 영역을 함유할 수 있다. 선택한 숙주 세포의 분비 경로로 발현된 폴리펩티드를 지정하는 임의의 신호 펩티드 코딩 영역은 본원에 제공된 조작된 글리코실트랜스퍼라제 폴리펩티드의 발현에 사용된다. 박테리아 숙주 세포에 효과적인 신호 펩티드 코딩 영역은 제한없이 바실러스 NClB 11837 말토스형성성 아밀라아제, 바실러스 스테아로써모필러스 알파-아밀라아제, 바실러스 리체니포르미스 서브틸리신, 바실러스 리체니포르미스 베타-락타마아제, 바실러스 스테아로써모필러스 중성 프로테아제(nprT, nprS, nprM), 및 바실러스 서브틸리스 prsA에 대한 유전자로부터 수득된 신호 펩티드 코딩 영역을 포함한다. 추가의 신호 펩티드가 당업계에 공지되어 있다(예, Simonen and Palva, Microbiol. Rev., 57:109-137 [1993] 참조). 사상균 숙주 세포에 효과적인 신호 펩티드 코딩 영역은 제한없이 아스퍼질러스 오리자에 TAKA 아밀라아제, 아스퍼질러스 나이거 중성 아밀라아제, 아스퍼질러스 나이거 글루코아밀라알제, 리조무코어 미에헤이 아스파르트산 프로테나제, 후미콜라 인솔렌스(Humicola insolens) 셀룰라아제, 및 후미콜라 라누기노사(Humicola lanuginosa) 리파아제에 대한 유전자로부터 수득된 신호 펩티드 코딩 영역을 포함한다. 효모 숙주 세포에 유용한 신호 펩티드는 제한없이 사카로마이세스 세레비지아 알파-인자 및 사카로마이세스 세레비지아 인버타아제에 대한 유전자로부터의 것을 포함한다.
일부 실시양태에서, 제어 서열은 폴리펩티드의 아미노 말단에 위치된 아미노산 서열을 코딩하는 프로펩티드 코딩 영역이다. 최종 폴리펩티드는 일부 경우에 "프로효소", "프로폴리펩티드" 또는 "자이모겐"이라고 한다. 프로폴리펩티드는 프로폴리펩티드로부터 프로펩티드의 촉매적 또는 자가촉매적 절단에 의해 성숙한 활성 폴리펩티드로 전환될 수 있다. 프로펩티드 코딩 영역은 제한없이 바실러스 서브틸리스 알칼리 프로테아제(aprE), 바실러스 서브틸리스 중성 프로테아제(nprT), 사카로마이세스 세레비지아 알파-인자, 리조무코어 미에헤이 아스파르트산 프로테나제, 및 바이셀리오프토라 써모필라(Myceliophthora thermophila) 락타아제(예, WO 95/33836 참조)에 대한 유전자를 포함한다. 신호 펩티드 및 프로펩티드 영역이 모두 폴리펩티드의 아미노 말단에 존재하는 경우, 프로펩티드 영역은 폴리펩티드의 아미노 말단 옆에 위치하고 신호 펩티드 영역은 프로펩티드 영역의 아미노 말단 옆예 위치한다.
일부 실시양태에서, 조절 서열이 또한 이용된다. 이러한 서열은 숙주 세포의 성장에 대해 폴리펩티드의 발현의 조절을 촉진한다. 조절 시스템의 예는 조절 화합물의 존재를 포함하여, 화학적 또는 물리적 자극에 대한 반응으로 유전자 발현의 켜짐 또는 꺼짐을 일으키는 것들이다. 원핵생물 숙주 세포에서, 적당한 조절 서열은 제한없이, lac, tac, 및 trp 오퍼레이터 시스템을 포함한다. 효모 숙주 세포에서, 적당한 조절 시스템은 제한없이 ADH2 시스템 또는 GAL1 시스템을 포함한다. 사상균에서, 적당한 조절 서열은 제한없이 TAKA 알파-아밀라아제 프로모터, 아스퍼질러스 나이거 글루코아밀라아제 프로모터, 및 아스퍼질러스 오리자에 글루코아밀라아제 프로모터를 포함한다.
또다른 양태에서, 본 발명은 또한 조작된 글리코실트랜스퍼라제 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및 도입되는 호스트 유형에 따른 하나 이상의 발현 조절 영역, 예컨대 프로모터 및 종결부, 복제 기원 등을 포함하는 재조합 발현 벡터를 제공한다. 일부 실시양태에서, 상기 기술된 다양한 핵산 및 제어 서열은 하나 이상의 편리한 제한효소 부위를 포함하여 그러한 부위에 변이체 글리코실트랜스퍼라제 폴리펩티드를 코딩하는 핵산 서열의 삽입 또는 치환을 가능케하는 재조합 발현 벡터를 생산하도록 함께 연결된다. 대안적으로, 본 발명의 폴리뉴클레오티드 서열(들)은 발현에 적당한 벡터 내로 폴리뉴클레오티드 서열을 포함하는 폴리뉴클레오티드 서열 또는 핵산 구성체를 삽입함으로써 발현된다. 발현 벡터의 형성에 있어서, 코딩 서열은 이 코딩 서열이 발현을 위해 적절한 제어 서열과 작동가능하게 연결되도록 벡터 내에 위치된다.
재조합 발현 벡터는 재조합 DNA 절차를 편리하게 실시할 수 있고 변이체 글리코실트랜스퍼라제 폴리뉴클레오티드 서열의 발현을 일으킬 수 있는 임의의 벡터(예, 플라스미드 또는 바이러스)일 수 있다. 벡터의 선택은 통상 벡터가 도입되는 숙주 세포와 벡터의 상용성에 좌우된다. 벡터는 선형이거나 폐쇄된 환형 플라스미드일 수 있다.
일부 실시양태에서, 발현 벡터는 자가 복제 벡터(즉, 염색체외 독립체로서 존재하고, 그 복제가 염색체 복제와 독립적인 벡터, 예컨대 플라스미드, 염색체외 요소, 미니염색체, 또는 인공 염색체)이다. 벡터는 자가 복제를 보장하는 임의의 수단을 함유할 수 있다. 일부 대안적인 실시양태에서, 벡터는 숙주 세포에 도입되는 경우, 게놈에 통합되고 그것이 통합된 염색체(들)와 함께 복제되는 것일 수 있다. 또한, 숙주 세포의 게놈에 도입되는 전체 DNA를 함께 함유하는 단일 벡터 또는 플라스미드, 또는 2 이상의 벡터 또는 플라스미드, 또는 트랜스포존이 이용될 수 있다.
일부 실시양태에서, 발현 벡터는 바람직하게는 형질전환된 세포의 용이한 선별을 허용하는 하나 이상의 선별 마커를 함유한다. "선별 마커"는 그 산물이 살생물제 또는 바이러스 내성, 중금속 내성, 영양요구체에 대한 원영양성 등을 제공하는 유전자이다. 박테리아 선별 마커의 예에는 제한없이 바실러스 서브틸리스 또는 바실러스 리체니포르미스 유래된 dal 유전자, 또는 항생제 내성, 예컨대 암피실린, 카나마이신, 클로람페니콜 또는 테트라사이클린 내성을 부여하는 마커가 포함된다. 효모 숙주 세포의 적당한 마커는 제한없이 ADE2, HIS3, LEU2, LYS2, MET3, TRP1 및 URA3을 포함한다. 사상균 숙주 세포에 하용하기 위한 선별 마커는 제한없이 amdS(아세타미다아제), argB(오르니틴 카르바모일트랜스퍼라제), bar(포스피노트리신 아세틸트랜스퍼라제), hph(히그로마이신 포스포트랜스퍼라제), niaD(나이트레이트 리덕타아제), pyrG(오로티딘-5'-포스페이트 디카르복실라아제), sC(설페이트 아데닐트랜스퍼라제), 및 trpC(안트라닐레이트 신타아제)와 이들의 균등물을 포함한다. 또다른 양태에서, 본 발명은 본 출원의 하나 이상의 조작된 글리코실트랜스퍼라제 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 숙주 세포를 제공하고, 이러한 폴리뉴클레오티드는 숙주 세포에서 조작된 글리코실트랜스퍼라제 효소(들)의 발현을 위한 하나 이상의 제어 서열에 작동가능하게 연결된다. 본 발명의 발현 벡터에 의해 코딩되는 폴리펩티드를 발현하는데 사용하기 위한 숙주 세포는 당업계에 공지되어 있고, 제한없이, 박테리아 세포, 예컨대 이. 콜라이, 비브리오 플루비알리스(Vibrio fluvialis), 스트렙토마이세스 및 살모넬라 티피뮤리움(Salmonella typhimurium) 세포; 진균 세포, 예컨대 효모 세포(예, 사카로마이세스 세레비지아 및 피키아 파스토리스(Pichia pastoris)[ATCC 수탁 No. 201178]); 곤충 세포, 예컨대 드로소필라(Drosophila) S2 및 스포돕테라(Spodoptera) Sf9 세포; 동물 세포, 예컨대 CHO, COS, BHK, 293, 및 바우스 흑색종 세포; 및 식물 세포를 포함한다. 예시적인 숙주 세포는 에스케리치아 콜라이(Escherichia coli) 균주(예, W3110(ΔfhuA) 및 BL21)이다.
따라서, 또다른 양태에서, 본 발명은 조작된 글리코실트랜스퍼라제 폴리펩티드를 생산하는 방법을 제공하고, 그 방법은 폴리펩티드의 발현에 적합한 조건 하에서 조작된 글리코실트랜스퍼라제 폴리펩티드를 코딩하는 폴리뉴클레오티드를 발현할 수 있는 숙주 세포를 배양하는 단계를 포함한다. 일부 실시양태에서, 상기 방법은 본원에 기술된 바와 같이 글리코실트랜스퍼라제 폴리펩티드를 단리 및/또는 정제하는 단계를 추가로 포함한다.
상기 기술된 숙주 세포에 적절한 배양 배지 및 성장 조건은 당업계에 잘 공지되어 있다. 글리코실트랜스퍼라제 폴리펩티드의 발현을 위한 폴리뉴클레오티드는 당업계에 공지된 다양한 방법에 의해 세포 내로 도입될 수 있다. 기법은 무엇보다 전기천공, 생체탄도 입자 충돌법, 리포솜 매개 형질감염법, 염화칼슘 형질감염법, 및 원형질 융합법이 포함된다.
본원에 개시된 특성을 갖는 조작된 글리코실트랜스퍼라제는 천연 발생 또는 조작된 글리코실트랜스퍼라제 폴리펩티드를 코딩하는 폴리뉴클레오티드에 대해 당업계에 공지되어 있고 본원에 기술되는 돌연변이유발 및/또는 지정 진화 방법을 실시하여 수득될 수 있다. 예시적인 지정 진화 기법은 돌연변이유발법 및/또는 DNA 서플링법(예, Stemmer, Proc. Natl. Acad. Sci. USA 91:10747-10751 [1994]; WO 95/22625; WO 97/0078; WO 97/35966; WO 98/27230; WO 00/42651; WO 01/75767 및 미국 특허 6,537,746 참조)이다. 사용될 수 있는 다른 지정 진화 절차는 무엇보다 스태거드 연장법(StEP), 시험관내 재조합법(예, Zhao et al., Nat. Biotechnol., 16:258-261 [1998] 참조), 돌연변이유발 PCR법(예, Caldwell et al., PCR Methods Appl., 3:S136-S140 [1994] 참조), 및 카세트 돌연변이유발법(예, Black et al., Proc. Natl. Acad. Sci. USA 93:3525-3529 [1996] 참조)을 포함한다.
예를 들면, 돌연변이유발 및 지정 진화 방법은 발현, 스크리닝 및 어세이할 수 있는 변이체 라이브러리를 생성하기 위해 폴리뉴클레오티드에 쉽게 적용될 수 있다. 돌연변이유발 및 지정 진화 방법은 당업계에 잘 공지되어 있다(예, 미국 특허 번호 5,605,793, 5,830,721, 6,132,970, 6,420,175, 6,277,638, 6,365,408, 6,602,986, 7,288,375, 6,287,861, 6,297,053, 6,576,467, 6,444,468, 5,811238, 6,117,679, 6,165,793, 6,180,406, 6,291,242, 6,995,017, 6,395,547, 6,506,602, 6,519,065, 6,506,603, 6,413,774, 6,573,098, 6,323,030, 6,344,356, 6,372,497, 7,868,138, 5,834,252, 5,928,905, 6,489,146, 6,096,548, 6,387,702, 6,391,552, 6,358,742, 6,482,647, 6,335,160, 6,653,072, 6,355,484, 6,303,344, 6,319,713, 6,613,514, 6,455,253, 6,579,678, 6,586,182, 6,406,855, 6,946,296, 7,534,564, 7,776,598, 5,837,458, 6,391,640, 6,309,883, 7,105,297, 7,795,030, 6,326,204, 6,251,674, 6,716,631, 6,528,311, 6,287,862, 6,335,198, 6,352,859, 6,379,964, 7,148,054, 7,629,170, 7,620,500, 6,365,377, 6,358,740, 6,406,910, 6,413,745, 6,436,675, 6,961,664, 6,537,746, 7,430,477, 7,873,499, 7,702,464, 7,783,428, 7,747,391, 7,747,393, 7,751,986, 6,376,246, 6,426,224, 6,423,542, 6,479,652, 6,319,714, 6,521,453, 6,368,861, 7,421,347, 7,058,515, 7,024,312, 7,620,502, 7,853,410, 7,957,912, 7,904,249, 8,383,346, 8,504,498, 8,768,871, 8,762,066, 8,849,575, 및 모든 관련 비US 대응물; Ling et al., Anal. Biochem., 254:157-78 [1997]; Dale et al., Meth. Mol. Biol., 57:369-74 [1996]; Smith, Ann. Rev. Genet., 19:423-462 [1985]; Botstein et al., Science, 229:1193-1201 [1985]; Carter, Biochem. J., 237:1-7 [1986]; Kramer et al., Cell, 38:879-887 [1984]; Wells et al., Gene, 34:315-323 [1985]; Minshull et al., Curr. Op. Chem. Biol., 3:284-290 [1999]; Christians et al., Nat. Biotechnol., 17:259-264 [1999]; Crameri et al., Nature, 391:288-291 [1998]; Crameri, et al., Nat. Biotechnol., 15:436-438 [1997]; Zhang et al., Proc. Nat. Acad. Sci. U.S.A., 94:4504-4509 [1997]; Crameri et al., Nat. Biotechnol., 14:315-319 [1996]; Stemmer, Nature, 370:389-391 [1994]; Stemmer, Proc. Nat. Acad. Sci. USA, 91:10747-10751 [1994]; WO 95/22625; WO 97/0078; WO 97/35966; WO 98/27230; WO 00/42651; WO 01/75767; WO 2009/152336, WO 2009/102901, WO 2009/102899, WO 2011/035105, WO 2013/138339, WO 2013/003290, WO 2014/120819, WO 2014/120821, WO 2015/0134315, 및 WO 2015/048573 참조, 이들 전부는 본원에 참고 인용됨).
일부 실시양태에서, 돌연변이유발 처리 후 수득한 효소 클론은 효소에 대해 소정 온도(또는 다른 어세이 조건, 예컨대 광범위한 범위의 기질에 대해 효소 활성을 테스트함)를 가하고 열처리 또는 다른 어세이 조건 후 남은 효소 활성량을 측정함으로써 스크리닝된다. 글리코실트랜스퍼라제 폴리펩티드를 코딩하는 폴리뉴클레오티드를 함유하는 클론을 이어서 시퀀싱하여 뉴클레오티드 변화(있다면)를 확인하며, 숙주 세포에서 효소 발현을 위해 사용한다. 발현 라이브러리로부터 효소 활성을 측정하는 것은 당업계에 공지된 임의의 적당한 방법(예, 표준 생화학 기법, 예컨대 HPLC 분석법)을 사용해 수행할 수 있다.
일부 실시양태에서, 돌연변이유발 처리 후 수득된 클론은 하나 이상의 바람직한 개선된 효소 특성(예, 개선된 트랜스퍼라제 활성)을 갖는 조작된 글리코실트랜스퍼라제에 대해 스크리닝될 수 있다. 발현 라이브러리로부터 효소 활성을 측정하는 것은, 당업계에 공지된 바와 같이(예, 단실 클로라이드 또는 OPA를 사용; 예, Yaegaki et al., J Chromatogr. 356(1):163-70 [1986] 참조), 표준 생화학 기법, 예컨대 HPLC 분석, LC-MS/MS 분석, 및/또는 산물의 유도체화(분리 전 또는 후)를 사용하여 수행될 수 있다.
공지된 서열의 조작된 폴리펩티드의 경우, 효소를 코딩하는 폴리뉴클레오티드는 공지된 합성 방법에 따라 표준 고체상 방법에 의해 생산될 수 있다. 일부 실시양태에서, 최대 약 100 염기의 단편을 개별적으로 합성한 후, 연결(예, 효소 또는 화학 결찰 방법, 또는 폴리머라아제 매개 방법의 의함)하여 임의의 바람직한 연속 서열을 형성시킬 수 있다. 예를 들면, 본원에 개시된 폴리뉴클레오티드 및 올리고뉴클레오티드는 전형적으로 자동화된 합성 방법을 실시함으로써, 고전적인 포스포라미다이트 방법을 사용하여 화학 합성에 의해 생산될 수 있다(예, Beaucage et al., Tetra. Lett., 22:1859-69 [1981]; and Matthes et al., EMBO J., 3:801-05 [1984] 참조). 포스포라미다이트 방법에 따라, 올리고뉴클레오티드를 합성(예, 자동 DNA 합성기에서), 정제, 어닐링, 결찰 및 적절한 벡터에 클로닝한다.
조작된 폴리펩티드의 서열이 공지되어 있는 경우, 효소를 코딩하는 폴리뉴클레오티드는 공지된 합성 방법에 따라 표준 고체상 방법에 의해 생산될 수 있다. 일부 실시양태에서, 최대 약 100 염기의 단편을 개별적으로 합성한 후, 연결(예, 효소 또는 화학 결찰 방법, 또는 폴리머라아제 매개 방법에 의함)하여 임의의 바람직한 연속 서열을 형성시킬 수 있다. 예를 들면, 글리코실트랜스퍼라제의 일부를 코딩하는 폴리뉴클레오티드 및 올리고뉴클레오티드는 전형적으로 자동화된 합성 방법을 실시함으로써, 당업계에 공지된 화학 합성에 의해 생산될 수 있다(예, Beaucage et al., Tet. Lett. 22:1859-69 [1981]의 고전적인 포스포라미다이트 방법, 또는 Matthes et al., EMBO J. 3:801-05 [1984]에 기술된 방법). 포스포라미다이트 방법에 따라, 올리고뉴클레오티드를 합성(예, 자동 DNA 합성기에서), 정제, 어닐링, 결찰 및 적절한 벡터에 클로닝한다. 또한, 본질적으로 임의의 핵산을 다양한 임의의 상업처로부터 수득할 수 있다. 일부 실시양태에서, 추가 변이체는 결실, 삽입, 및/또는 치환을 함유하는 올리고뉴클레오티드를 합성하고, 개선된 특성을 갖는 조작된 글리코실트랜스퍼라제를 형성하기 위해 다양한 순열(permutation) 내 올리고뉴클레오티드를 조합함으로써 형성될 수 있다.
따라서, 일부 실시양태에서, 조작된 글리코실트랜스퍼라제 폴리펩티드를 생산하는 방법은 (a) 서열번호 2, 4, 6 및/또는 8 유래의 아미노산 서열에 대해 적어도 약 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 또는 그 이상의 서열 동일성을 갖고, 서열번호 2, 4, 6 및/또는 8에 비해 하나 이상의 잔기 차이를 갖는 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 폴리뉴클레오티드를 합성하는 단계; 및 (b) 폴리뉴클레오티드에 의해 코딩된 글리코실트랜스퍼라제 폴리펩티드를 발현하는 단계를 포함한다.
따라서, 일부 실시양태에서, 조작된 글리코실트랜스퍼라제 폴리펩티드를 생산하는 방법은 (a) 서열번호 2, 4, 6 및/또는 8 유래의 아미노산 서열에 대해 적어도 약 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 또는 그 이상의 서열 동일성을 갖고, 서열번호 2, 4, 6 및/또는 8에 비해 하나 이상의 잔기 차이를 갖는 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 폴리뉴클레오티드를 합성하는 단계; 및 (b) 폴리뉴클레오티드에 의해 코딩된 글리코실트랜스퍼라제 폴리펩티드를 발현하는 단계를 포함한다.
이 방법의 일부 실시양태에서, 폴리뉴클레오티드는 경우에 따라 하나 또는 몇몇(예, 최대 3, 4, 5, 또는 최대 10) 아미노산 잔기 결실, 삽입 및/또는 치환을 갖는 조작된 글리코실트랜스퍼라제를 코딩한다. 일부 실시양태에서, 아미노산 서열은 경우에 따라 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-15, 1-20, 1-21, 1-22, 1-23, 1-24, 1-25, 1-30, 1-35, 1-40, 1-45, 또는 1-50 아미노산 잔기 결실, 삽입 및/또는 치환을 갖는다. 일부 실시양태에서, 아미노산 서열은 경우에 따라 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 30, 35, 40, 45, 또는 50 아미노산 잔기 결실, 삽입 및/또는 치환을 갖는다. 일부 실시양태에서, 아미노산 서열 경우에 따라 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 21, 22, 23, 24, 또는 25 아미노산 잔기 결실, 삽입 및/또는 치환을 갖는다. 일부 실시양태에서, 치환은 보존성 또는 비보존성 치환일 수 있다.
일부 실시양태에서, 숙주 세포에서 발현된 임의의 조작된 글리코실트랜스퍼라제 효소는 하나 이상의 임의의 잘 공지된 단백질 정제 기법, 무엇보다 리소자임 처리, 초음파처리, 여과, 염석, 초원심분리 및 크로마토그래피를 포함하는 기법을 사용함으로써 세포 및/또는 배양 배지로부터 회수될 수 있다. 박테리아, 예컨대 이. 콜라이 유래의 단백질의 고효율 추출 및 용해를 위한 적당한 용액은 구입 가능하다(예, CelLytic BTM, Sigma-Aldrich, 미국 미주리주 세인트 루이스 소재).
글리코실트랜스퍼라제 폴리펩티드의 단리를 위한 크로마토그래피 기법은 무엇보다 역상 크로마토그래피 고성능 액체 크로마토그래피, 이온 교환 크로마토그래피, 겔 전기영동, 및 친화성 크로마토그래피를 포함한다. 특정 효소를 정제하기 위한 조건은 부분적으로 예컨대 순전하, 소수성, 친수성, 분자량, 분자 형상 등의 인자에 의존하고, 당업자에게 자명하다.
일부 실시양태에서, 친화성 기법은 개선된 글리코실트랜스퍼라제 효소를 단리시키는 데 사용될 수 있다. 친화성 크로마토그래피 정제의 경우, 글리코실트랜스퍼라제 폴리펩티드에 특이적으로 결합하는 임의의 항체가 사용될 수 있다. 항체 생산의 경우, 제한없이 토끼, 마우스, 래트 등을 비롯한 다양한 호스트 동물에 글리코실트랜스퍼라제 폴리펩티드, 또는 이의 단편을 주입함으로써 면역화될 수 있다. 글리코실트랜스퍼라제 폴리펩티드 또는 단편은 측쇄 작용 기 또는 측쇄 작용 기에 결합되는 링커에 의해 BSA 등의 적당한 담체에 결합될 수 있다. 일부 실시양태에서, 친화성 정제는 글리코실트랜스퍼라제, 예컨대 폴리(L-프롤린) 또는 다이 친화성 컬럼에 의해 결합된 특이적 리간드를 사용할 수 있다(예, EP0641862; Stellwagen, "Dye Affinity Chromatography," In Current Protocols in Protein Science, Unit 9.2-9.2.16 [2001] 참조).
관심 β-글리코실레이트 화합물에 대하여 글리코실트랜스퍼라제를 사용하는 방법
일부 실시양태에서, 본원에 제공된 방법, 공정 및 시스템은 기질을 β-글리코실화된 산물로 전환시키기 용이하다. 일부 실시양태에서, 기질 스테비오시드를 β-글루코실화된 산물 레바우디오시드 A로 전환시킨다. 일부 실시양태에서, 이러한 글리코실화 반응은 효소에 의해 촉진된다. 일부 실시양태에서, 효소는 글리코실트랜스퍼라제이지만, 일부 대안적인 실시양태에서 효소는 포스포릴라제이다. 일부 추가 실시양태에서, 글리코실트랜스퍼라제 또는 포스포릴라제는 글루코스-1-포스페이트(예, α-글루코스-1-포스페이트)를 글루코실 공여체로서 이용한다. 일부 추가 실시양태에서, 기질의 특정 모이어티(예, 히드록실 기)는 글리코실(예, 글루코실) 수용체로서 작용한다. 본 발명에 사용하는 글리코실트랜스퍼라제의 일부 비제한적 예시는 무차별(promiscuous) 박테리아 UDP-글루코스-의존 글리코실트랜스퍼라제(예, 서열번호 4, 6 또는 12의 글리코실트랜스퍼라제), 및 α-글루코스-1-포스페이트(예, 서열번호 8 또는 14의 라미나리비오스 포스포릴라제)를 생산하기 위해 β-글리코실 분해 활성을 보유하는 포스포릴라제를 포함한다. 일부 실시양태에서, 효소는 시험관내에서 기질과 접촉하지만, 일부 대안적인 실시양태에서, 효소는 생체내에서 기질과 접촉한다. 일부 추가의 실시양태에서, 기질 및 효소는 조작된 숙주 세포 내에서 생산되고 접촉된다.
폴리펩티드가 전환을 실시하기에 적합한 반응 조건은 당업자에 의해 결정될 수 있다. 하기 실시예는 폴리펩티드의 농도 또는 양, 기질, 보조기질(예, 글루코스-1-포스페이트), 완충액, 공용매, pH, 온도 및 반응 시간을 비롯한 예시적 반응 조건을 제공한다. 예를 들면, 일부 실시양태에서, 기질 농도 최대 5 mM 또는 기질의 용해성 한계, 최대 5 mM 보조기질, 또는 보조기질의 용해성 한계로, 0-20% 에탄올을 갖는 25-100 mM 완충액 중, pH 5-8, 30-65℃에서 5 m-18 h 동안 반응을 수행한다. 일부 실시양태에서, 더욱 저렴한 방식으로 반응을 수행하기에 유용한 계내 글루코스-1-포스페이트를 재생하기 위해 보조효소 및 제2 보조기질로 추가적으로 반응을 수행할 수 있다. 예를 들면, 보조효소는 유지되는 포스포릴라제, 예컨대 수크로스 포스포릴라제(예, 짝수의 서열번호 16-32)일 수 있고, 추가의 보조기질은 적절한 α-연결된 이당류, 삼당류 또는 올리고당류 효소 기질, 예컨대 수크로스일 수 있다. 보조효소는 역위 포스포릴라제, 예컨대 셀로비오스 포스포릴라제(E.C. 2.4.1.20)일 수 있고, 추가의 보조기질은 적절한 β-연결된 이당류, 삼당류 또는 올리고당류 효소 기질, 예컨대 셀로비오스일 수 있다. 하지만, 본 발명은 하기 실시예에 제시된 특정 반응 및 조건으로 제한되는 것을 의도하지 않는다. 본 발명의 다양한 특징부 및 실시양태는 하기 대표 실시예에 예시되어 있으며 이는 예시적인 것으로 의도된 것이지 제한하고자 하는 것이 아니다.
실험예
실현된 실험 및 결과를 비롯한 하기 실시예는 단지 예시 목적으로 제공되며 본 발명을 제한하는 것으로 이해하여서는 안된다.
하기 실험 개시내용에서, 하기 약어가 적용된다: M(몰); mM (밀리몰), uM 및 μΜ(마이크로몰); nM(나노몰); mol(몰); gm 및 g(그램); mg(밀리그램); ug 및 μg(마이크로그램); L 및 l(리터); ml 및 mL(밀리리터); cm(센티미터); mm(밀리미터); um 및 μm(마이크로미터); sec.(초); min(분); h 및 hr(시간); U(유닛); MW(분자량); rpm(분당 회전수); psi 및 PSI(평방 인치당 파운드); ℃(섭씨도); RT 및 rt(실온); CAM 및 cam(클로람페니콜); PMBS(폴리마이신 B 설페이트); IPTG(이소프로필 β-D-l-티오갈락토피라노시드); UGT(우리딘 5'-디포스포글루코스 글리코실트랜스퍼라제); LB(루리아 브로쓰); TB(테리픽 브로쓰); SFP(쉐이크 플라스크 파우더); CDS(코딩 서열); DNA(데옥시리보핵산); RNA(리보핵산); 이. 콜라이 W3110(미국 코네티컷 뉴헤븐 소재 콜라이 유전자 스톡 센터([CGSC]에서 입수한 통용되는 실험실 이. 콜라이 균주); HTP(고수율); HPLC(고성능 액체 크로마토그래피); MS(질량 분광법); FIOPC(양성 대조군 대비 배수 향상); Sigma-Aldrich(Sigma-Aldrich, 미국 미주리주 세인트 루이스 소재; Difco(Difco Laboratories, BD Diagnostic Systems, 미국 미시간주 디트로이트 소재); Microfluidics(Microfluidics, 미국 메사추세츠주 웨스트우드 소재); ChromaDex(ChromaDex, Inc., 미국 캘리포니아주 어바인 소재); 및 Thermotron(Thermotron, 미국 미시간주 홀랜드 소재).
실시예 1
글루코실화 활성을 갖는 UGT 효소의 합성, 최적화 및 어세이
본 실시예에는, 글루코실화 활성을 갖는 UGT 효소의 합성, 최적화 및 어세이에 사용되는 방법이 기술된다.
유전자 합성 및 최적화:
스테비올비오시드를 레바우디오시드 B로 글루코실화시키고 스테비오시드를 레바우디오시드 A로 글루코실화시키는 것으로 보고된, 야생형 스테비아 레바우디아나 폴리펩티드(서열번호 2)를 코딩하는 폴리뉴클레오티드 서열(서열번호 1)을, 코돈 최적화시키고 서열번호 9의 유전자로서 합성하였다. 야생형 스트렙토마이세스 레지스토마이시피쿠스 글리코실트랜스퍼라제 폴리펩티드(서열번호 4)를 코딩하는 폴리뉴클레오티드 서열(서열번호 3)은, 올레안도마이신을 글루코실화하고 다른 뉴클레오티드 당류 공여체와 다른 기질에 대하여 무차별 활성을 갖는 것으로 보고된 야생형 스트렙토마이세스 안티바이오티쿠스 올레안도마이신 글리코실트랜스퍼라제(서열번호 5) 서열의 동족체(82% 서열 동일성을 가짐)이고, 유사하게 코돈 최적화되고 합성되었다(서열번호 11). 이러한 합성 유전자(서열번호 9 및 11)를 개별적으로 pCK110900 벡터 시스템 내에 클로닝하고(예, 미국 특허 출원 공개 번호 2006/0195947 참조, 이는 본원에 참고 인용됨), 이. 콜라이 W3110(ΔfhuA)에서 후속 발현시켰다. 이. 콜라이 균주 W3110은 lac 프로모터의 제어 하에 UGT 효소를 발현하였다.
쉐이크 플라스크 파우더(SFP)의 제조:
본원에 기술된 생체촉매 공정에 사용된 특성화 어세이를 위한 글리코실트랜스퍼라제 폴리펩티드 쉐이크 플라스크 파우더(SFP)를 생성하는 데 쉐이크 플라스크 절차를 사용하였다. 효소의 쉐이크 플라스크 파우더(SFP) 제제는 HTP 어세이에 사용된 세포 용해물에 비해 효소의 더욱 정제된 제제(예, 총 단백질의 최대 > 30%)를 제공하고 또한 더욱 농축된 효소 용액의 사용을 허용한다. 조작된 관심 폴리펩티드를 코딩하는 플라스미드를 함유하는 이. 콜라이의 단일 콜로니를, 30 μg/ml 클로람페니콜 및 1% 글루코스를 함유하는 5 mL 루리아 베타니 브로쓰에 접종하였다. 250 rpm에서 진탕하면서 30℃ 인큐베이터에서 세포를 밤새(적어도 16시간) 성장시켰다. 1 L 플라스크 중 30 μg/ml CAM을 함유하는 250 mL 테리픽 브로쓰(12 g/L 박토-트립톤, 24 g/L 효모 추출물, 4 mL/L 글리세롤, 65 mM 칼륨 포스페이트, pH 7.0, 1 mM MgS04) 내에서 배양물을 600 nm 광학 밀도(OD600) 0.2로 희석하고 30℃에서 성장을 허용하였다. 배양물의 OD600이 0.6-0.8인 경우 1 mM의 최종 농도로 IPTG를 첨가함으로써 글리코실트랜스퍼라제 유전자의 발현을 유도하였다. 이후 인큐베이션을 밤새(적어도 16시간) 계속하였다. 원심분리(5000 rpm, 15 min, 4℃)에 의해 세포를 수확하고 상청액을 따라버렸다. 세포 펠렛을 2 부피의 25 mM 트리에탄올아민 완충액, pH 7.5 중에 재현탁시키고, 표준 이. 콜라이 용해 셋팅을 갖는 MICROFLUIDIZER® 고압 호모게나이저(Microfluidics)에 통과시키고 4℃에서 유지하였다. 세포 잔사물을 원심분리(10,000 rpm, 45분, 4℃)에 의해 제거하였다. 투명해진 용해물 상청액을 수집하고 -80℃에서 냉동시킨 후 동결 건조하여 미정제 폴리펩티드의 건조 쉐이크 플라스크 파우더를 제조하였다.
스테비오시드 글루코실화를 위한 SFP 어세이:
20 g/L 파우더를 제공하기 위해 SFP를 재구성하였다. 이후, 5 mM α-글루코스-1-포스페이트 유무 하에, 3 mM MgSO4 및 1 mM 스테비오시드(ChromaDex, > 94% 순도)를 갖는 50 mM Tris-HCl 완충액, pH 7.5의 200 μL 총 반응 부피 중에 50 μL의 상기 스톡을 희석시켰다. 16-18h 동안 300 RPM 진탕 하에 Thermotron 역가-플레이트 쉐이커 중에서 30℃에서 반응을 수행하였다.
HPLC-MS/MS 분석:
2% 포름산을 갖는 0.5 부피/부피 아세토니트릴로 상기 기술된 반응을 켄칭하고 원심분리로 침전시켰다. 하기 기기 및 파라미터로 LC-MS/MS에 의해 상청액에서 글리코실화된 스테비오시드 산물을 검출하였다:
서열번호 9 및 11에 의해 코딩된 폴리펩티드에 대해 신규 활성을 검출하였다. 서열번호 9에 의해 코딩된 글루코실트랜스퍼라제 폴리펩티드의 경우, 2개의 산물이 검출되었는데, 하나는 레바우디오시드 A와 공용출되고 하나는 2.22 m에 용출되었다. 이러한 산물은 α-글루코스-1-포스페이트의 존재 하에서는 검출되지만, α-글루코스-1-포스페이트의 부재 하에서는 검출되지 않았다. 이러한 산물은 음성 대조군 샘플에 존재하지 않았다. 서열번호 11에 의해 코딩된 글루코실트랜스퍼라제 폴리펩티드의 경우, 2개의 산물이 체류 시간 1.76 및 2.18 m에 검출되었다. 이러한 산물은 α-글루코스-1-포스페이트의 존재 하에 검출되었고, α-글루코스-1-포스페이트의 부재 하에서는 감소된 수준으로 검출되었다. 이러한 산물은 음성 대조군 샘플에 존재하지 않았다. 따라서, 본 발명은 스테비올 글리코시드 기질을 글루코실화하는 신규 공정을 제공한다. 추가로, 본 발명은 스테비올 기질을 글리코실화하기 위해 우리딘 5'-디포스포글루코스 대신에 α-글루코스-1-포스페이트와 사용되는 서열번호 2 및 4에 의해 코딩되는 야생형 효소를 비롯한 이러한 부류 내 제1 효소를 제공한다.
실시예 2
글루코스-1-포스페이트의 계내 형성
본 실시예에는 기질의 UDP-글루코스-무관 글루코실화를 위한 글루코스-1-포스페이트의 계내 형성을 평가하는 실험(도 3 참조)이 기술된다. 유전자 합성 및 최적화, 그리고 쉐이크 플라스크 파우더의 제조를 실시예 1에 기술된 바대로 수행하였다.
SFP의 어세이:
20 g/L 파우더로 SFP를 재구성하였다. 그리고나서, 서열번호 9 또는 11을 발현하는 이. 콜라이 유래의 20 μL의 SFP 및 홀수 서열번호 15-31을 발현하는 이. 콜라이 유래의 10 μL의 SFP 또는 또다른 이당류 포스포릴라제 또는 음성 대조군을, 0-5 mM α-글루코스-1-포스페이트 하에, 3 mM MgSO4, 0.3 M 수크로스 (또는 이당류 포스포릴라제에 상응하는 이당류), 5 mM 무기 포스페이트, 및 1 mM 스테비오시드(ChromaDex, > 94% 순도)를 갖는 50 mM Tris-HCl 완충액, pH 7.5의 200 μL 총 반응 부피 중에 희석시켰다. 16-18h 동안 300 RPM 진탕 하에 Thermotron 역가-플레이트 쉐이커 중에서 30℃에서 반응을 수행하였다.
HPLC-MS/MS 분석:
반응을 켄칭하고, 실시예 1에 기술된 바와 같이 LC-MS/MS에 의해 분석하였다. 음성 대조군을 발현하는 이. 콜라이 유래의 SFP의 존재 하에 동일한 샘플에 비해 홀수 서열번호 15-31을 발현하는 이. 콜라이 유래의 SFP 또는 또다른 이당류 포스포릴라제의 존재 하에 체류 시간 1.76, 2.18, 2.22 및 2.35 m에서 스테비오시드의 글루코실화된 산물로의 증가된 전환에 의해 α-글루코스-1-포스페이트의 계내 형성을 입증하였다.
실시예 3
변이체의 진화 및 스크리닝
본 실시예는 α-글루코스-1-포스페이트를 사용하여 개선된 기질 글루코실화를 위해 서열번호 9 및 11로부터 유래된 조작된 폴리펩티드의 진화 및 스크리닝 동안 실시된 실험이 기술된다.
지정 진화는 출발 "골격" 유전자 서열로서 각각 서열번호 10 또는 12의 폴리펩티드를 코딩하는 서열번호 9 또는 11의 폴리뉴클레오티드로 시작한다. 조작된 폴리펩티드의 라이브러리는 잘 공지된 다양한 기법(예, 포화 돌연변이유발, 앞서 식별된 이득 아미노산 차이의 재조합)을 사용하여 생성되고 글루코스-1-포스페이트, 또는 실시예 1 및 2에 기술된 바와 같이 저렴한 이당류, 무기 포스페이트, 및 야생형 또는 조작된 이당류 포스포릴라제로 이루어진 글루코스-1-포스페이트를 위한 재생 시스템을 사용하여 원하는 기질의 글루코실화를 수행하는 조작된 폴리펩티드의 능력을 측정하는 HTP 어세이 및 분석 방법을 사용하여 스크리닝된다.
스크리닝 후, 출발 골격 서열에 비해 가장 개선점을 보이는 조작된 폴리펩티드가 추가 라이브러리의 구성을 위한 골격 서열로서 사용되며, 스크리닝 공정은 원하는 활성을 위한 폴리펩티드를 진화시키기 위해 반복된다. 다양한 기질을 위한 효소의 무차별혼합(promiscuity)으로 인해, 이 공정은 수많은 관심 기질의 글루코실화를 위해 저렴한 보조기질을 사용하는 생촉매를 개발하도록 반복될 수 있다.
실시예 4
글루코실화 활성을 갖는 포스포릴라제 효소의 합성, 최적화 및 어세이
본 실시예에는 글루코실화 활성을 갖는 포스포릴라제 효소에 합성, 최적화 및 어세이를 실시하는 실험이 기술된다.
유전자 합성 및 최적화:
라미나리비오스를 가인산분해시켜 글루코스를 방출하고 α-글루코스-1-포스페이트를 형성하는 것으로 보고된, 야생형 파에니바실루스 종 YM1 라미나리비오스 포스포릴라제 폴리펩티드(서열번호 8)를 코딩하는 폴리뉴클레오티드 서열(서열번호 7)을 코돈 최적화시키고, 서열번호 13의 유전자로서 합성하였다. 서열번호 13의 합성 유전자를 pCK110900 벡터 시스템 내에 클로닝하고(예, 미국 특허 출원 공개 번호 20060195947 참조, 이는 본원에 참고 인용됨), 이. 콜라이 W3110(ΔfhuA)에서 후속 발현시켰다. 이. 콜라이 균주 W3110은 lac 프로모터의 제어 하에 효소를 발현하였다.
고수율(HTP) 용해물의 제조:
관심 폴리펩티드 유전자를 발현하는 이. 콜라이 세포를 성장시키고 96웰 플레이트에서 유도하고, 펠렛화하고, 실온에서 역가-플레이트 쉐이커 상에서 2 h 동안 저속 진탕으로 250 μL 용해 완충액(20 mM Tris-HCl 완충액 중 0.5 g/L 리소자임 및 0.5 g/L PMBS, pH 7.5) 중에서 용해시켰다. 그리고나서 플레이트를 4000 rpm 및 4℃에서 20 m 동안 원심분리하고 본원에 기술된 어세이 반응에 투명해진 용해물 상청액을 사용하였다.
스테비오시드의 글루코실화를 위한 어세이:
이 어세이에서, 50 μL의 투명해진 용해물을, 1.65 mM α-글루코스-1-포스페이트 및 0.5 mM 스테비오시드(ChromaDex, > 94% 순도)를 갖는 50 mM 나트륨 아세테이트 완충액, pH 5.5의 200 μL 총 반응 부피 중에 용해시켰다. 18h 동안 300 RPM 진탕 하에 Thermotron 역가-플레이트 쉐이커 중에서 40℃에서 반응을 수행하였다.
HPLC-MS/MS 분석:
반응을 켄칭하고, 실시예 1에 기술된 바와 같이 LC-MS/MS에 의해 분석하였다. 체류 시간 2.18 m으로 글루코실화된 스테비오시드 산물은 라미나리비오스 포스포릴라제의 존재 하에서 관찰되지만 음성 대조군 샘플에서는 아니었다. 이러한 결과는 라미나리비오스 포스포릴라제가 스테비오시드 및 다른 기질의 α-글루코시드화를 위한 신규 방법으로서 α-글루코스-1-포스페이트와 사용될 수 있다는 것을 나타낸다. 실시예 3에 기술된 바와 같이, α-글루코스-1-포스페이트는 저렴한 이당류, 무기 포스페이트 및 이당류 포스포릴라제를 사용하여 재생될 수 있다.
SEQUENCE LISTING
<110> CODEXIS, INC.
Vroom, Jonathan
Galanie, Stephanie Sue
Alvizo, Oscar
<120> ENZYMATIC GLYCOSYLATION OF STEVIOL GLYCOSIDES AND OTHER COMPOUNDS WITH GLUCOSE-1-PHOSPHATE
<130> CX8-155USP1
<140> NOT YET ASSIGNED
<141> 2016-06-15
<160> 32
<210> 1
<211> 1326
<212> DNA
<213> Artificial Sequence
<220>
<223> Wild type UDP-glycosyltransferase 76G1 from Stevia
<400> 1
atggaaaata aaacggagac caccgttcgc cggcgccgga gaataatatt attcccggta 60
ccatttcaag gccacattaa cccaattctt cagctagcca atgtgttgta ctctaaagga 120
ttcagtatca ccatctttca caccaacttc aacaaaccca aaacatctaa ttaccctcac 180
ttcactttca gattcatcct cgacaacgac ccacaagacg aacgcatttc caatctaccg 240
actcatggtc cgctcgctgg tatgcggatt ccgattatca acgaacacgg agctgacgaa 300
ttacgacgcg aactggaact gttgatgtta gcttctgaag aagatgaaga ggtatcgtgt 360
ttaatcacgg atgctctttg gtacttcgcg caatctgttg ctgacagtct taacctccga 420
cggcttgttt tgatgacaag cagcttgttt aattttcatg cacatgtttc acttcctcag 480
tttgatgagc ttggttacct cgatcctgat gacaaaaccc gtttggaaga acaagcgagt 540
gggtttccta tgctaaaagt gaaagacatc aagtctgcgt attcgaactg gcaaatactc 600
aaagagatat tagggaagat gataaaacaa acaagagcat cttcaggagt catctggaac 660
tcatttaagg aactcgaaga gtctgagctc gaaactgtta tccgtgagat cccggctcca 720
agtttcttga taccactccc caagcatttg acagcctctt ccagcagctt actagaccac 780
gatcgaaccg tttttcaatg gttagaccaa caaccgccaa gttcggtact gtatgttagt 840
tttggtagta ctagtgaagt ggatgagaaa gatttcttgg aaatagctcg tgggttggtt 900
gatagcaagc agtcgttttt atgggtggtt cgacctgggt ttgtcaaggg ttcgacgtgg 960
gtcgaaccgt tgccagatgg gttcttgggt gaaagaggac gtattgtgaa atgggttcca 1020
cagcaagaag tgctagctca tggagcaata ggcgcattct ggactcatag cggatggaac 1080
tctacgttgg aaagcgtttg tgaaggtgtt cctatgattt tctcggattt tgggctcgat 1140
caaccgttga atgctagata catgagtgat gttttgaagg taggggtgta tttggaaaat 1200
gggtgggaaa gaggagagat agcaaatgca ataagaagag ttatggtgga tgaagaagga 1260
gaatacatta gacagaatgc aagagttttg aaacaaaagg cagatgtttc tttgatgaag 1320
ggtggt 1326
<210> 2
<211> 442
<212> PRT
<213> Artificial Sequence
<220>
<223> Wild type UDP-glycosyltransferase 76G1 from Stevia
<400> 2
Met Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile
1 5 10 15
Leu Phe Pro Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln Leu
20 25 30
Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr
35 40 45
Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg
50 55 60
Phe Ile Leu Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro
65 70 75 80
Thr His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His
85 90 95
Gly Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala Ser
100 105 110
Glu Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr
115 120 125
Phe Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val Leu
130 135 140
Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln
145 150 155 160
Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu
165 170 175
Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser
180 185 190
Ala Tyr Ser Asn Trp Gln Ile Leu Lys Glu Ile Leu Gly Lys Met Ile
195 200 205
Lys Gln Thr Arg Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu
210 215 220
Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro
225 230 235 240
Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser
245 250 255
Leu Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro
260 265 270
Pro Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp
275 280 285
Glu Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln
290 295 300
Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp
305 310 315 320
Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val
325 330 335
Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala
340 345 350
Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu
355 360 365
Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn
370 375 380
Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn
385 390 395 400
Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val
405 410 415
Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln
420 425 430
Lys Ala Asp Val Ser Leu Met Lys Gly Gly
435 440
<210> 3
<211> 1203
<212> DNA
<213> Artificial Sequence
<220>
<223> Wild type macrolide glycosyltransferase from Streptomyces
<400> 3
atgaccagtc gctcgcacat cgccatgttc tccatcgccg cccacgggca cgtgaacccg 60
agcctcgagg tgatccgcga gctcgtcgcg cgcgggcacc gggtgacgta cgcgattccg 120
cccgtcttcg ccgggaaggt cgccgaggcc ggcgccgagg tgaagctctg gaactccacc 180
ctgccctcgc ccgacgacga cccacaggca tggggcacga ccctgctgga caacgtggag 240
ccgttcctgg ccgacgcgat ccaggcgctc ccgcagctga tcgaggcgta cgaaggggac 300
gagcccgacc tcgtgctgca cgacatcacc tcctacccgg cccgcgtcct ggcccaccgc 360
tggggcgtgc ccgcggtctc cctgtcgccg aacctcgtcg cctgggaggg ctacgagaag 420
gaggtggccg agccgatgtg ggcggagccg aagcggaccg agcgcgggcg ggcctactac 480
gcccgcttcc acgcctggct ggaggagaac ggcgtcaccc tgcacccgga cgacttcgtg 540
ggccgccccg cccgctgtct cgtcctgatc ccgaaggcgc tgcagcccaa cgccgaccgg 600
gtggacgagg gcgtgtactc cttcgtgggc gcctgccagg gtgaccgcgg cgcggagggg 660
gagtggcggc ggcccgccgg cgccgagaag gtcgccctgg tctcgctcgg gtcctccttc 720
accaagcagc cggacttcta ccgggagtgc gtcagggcgt tcggcgagct gccgggctgg 780
cacctggtgc tccagatcgg caggcacgtc gacccggccg acctggggga cgtaccggag 840
aacgtcgaag tgcgctcctg ggtaccccag ttggcgatcc tcaaggaggc cgatctgttc 900
gtcacgcacg ccggcgcggg cggcagccag gagggtctgg ccacggccac gccgatgatc 960
gccgtaccgc aggccgtgga ccagttcggc aacgcggaca tgctccaggg gctcggtgtc 1020
gcccgccgcc tcgacaccga ggaggcgacc gccgaggccc tcagggcggc cgccctcgct 1080
ctcgtcgacg accccgaagt ggcccgtcgg gcgcgggaca tccaggctca gatggcgggg 1140
gagggcggca cgcgccgggc ggccgacctg atcgaggccg agctgccggt acggcaggcg 1200
tag 1203
<210> 4
<211> 400
<212> PRT
<213> Artificial Sequence
<220>
<223> Wild type macrolide glycosyltransferase from Streptomyces
<400> 4
Met Thr Ser Arg Ser His Ile Ala Met Phe Ser Ile Ala Ala His Gly
1 5 10 15
His Val Asn Pro Ser Leu Glu Val Ile Arg Glu Leu Val Ala Arg Gly
20 25 30
His Arg Val Thr Tyr Ala Ile Pro Pro Val Phe Ala Gly Lys Val Ala
35 40 45
Glu Ala Gly Ala Glu Val Lys Leu Trp Asn Ser Thr Leu Pro Ser Pro
50 55 60
Asp Asp Asp Pro Gln Ala Trp Gly Thr Thr Leu Leu Asp Asn Val Glu
65 70 75 80
Pro Phe Leu Ala Asp Ala Ile Gln Ala Leu Pro Gln Leu Ile Glu Ala
85 90 95
Tyr Glu Gly Asp Glu Pro Asp Leu Val Leu His Asp Ile Thr Ser Tyr
100 105 110
Pro Ala Arg Val Leu Ala His Arg Trp Gly Val Pro Ala Val Ser Leu
115 120 125
Ser Pro Asn Leu Val Ala Trp Glu Gly Tyr Glu Lys Glu Val Ala Glu
130 135 140
Pro Met Trp Ala Glu Pro Lys Arg Thr Glu Arg Gly Arg Ala Tyr Tyr
145 150 155 160
Ala Arg Phe His Ala Trp Leu Glu Glu Asn Gly Val Thr Leu His Pro
165 170 175
Asp Asp Phe Val Gly Arg Pro Ala Arg Cys Leu Val Leu Ile Pro Lys
180 185 190
Ala Leu Gln Pro Asn Ala Asp Arg Val Asp Glu Gly Val Tyr Ser Phe
195 200 205
Val Gly Ala Cys Gln Gly Asp Arg Gly Ala Glu Gly Glu Trp Arg Arg
210 215 220
Pro Ala Gly Ala Glu Lys Val Ala Leu Val Ser Leu Gly Ser Ser Phe
225 230 235 240
Thr Lys Gln Pro Asp Phe Tyr Arg Glu Cys Val Arg Ala Phe Gly Glu
245 250 255
Leu Pro Gly Trp His Leu Val Leu Gln Ile Gly Arg His Val Asp Pro
260 265 270
Ala Asp Leu Gly Asp Val Pro Glu Asn Val Glu Val Arg Ser Trp Val
275 280 285
Pro Gln Leu Ala Ile Leu Lys Glu Ala Asp Leu Phe Val Thr His Ala
290 295 300
Gly Ala Gly Gly Ser Gln Glu Gly Leu Ala Thr Ala Thr Pro Met Ile
305 310 315 320
Ala Val Pro Gln Ala Val Asp Gln Phe Gly Asn Ala Asp Met Leu Gln
325 330 335
Gly Leu Gly Val Ala Arg Arg Leu Asp Thr Glu Glu Ala Thr Ala Glu
340 345 350
Ala Leu Arg Ala Ala Ala Leu Ala Leu Val Asp Asp Pro Glu Val Ala
355 360 365
Arg Arg Ala Arg Asp Ile Gln Ala Gln Met Ala Gly Glu Gly Gly Thr
370 375 380
Arg Arg Ala Ala Asp Leu Ile Glu Ala Glu Leu Pro Val Arg Gln Ala
385 390 395 400
<210> 5
<211> 1248
<212> DNA
<213> Artificial Sequence
<220>
<223> Wild type macrolide glycosyltransferase from Streptomyces
<400> 5
atgaccaccc agaccactcc cgcccacatc gccatgttct ccatcgccgc ccacggccat 60
gtgaacccca gcctggaggt gatccgtgaa ctcgtcgccc gcggccaccg ggtcacgtac 120
gccattccgc ccgtcttcgc cgacaaggtg gccgccaccg gcgcccggcc cgtcctctac 180
cactccaccc tgcccggccc cgacgccgac ccggaggcat ggggaagcac cctgctggac 240
aacgtcgaac cgttcctgaa cgacgcgatc caggcgctcc cgcagctcgc cgatgcctac 300
gccgacgaca tccccgatct cgtcctgcac gacatcacct cctacccggc ccgcgtcctg 360
gcccgccgct ggggcgtccc ggcggtctcc ctctccccga acctcgtcgc ctggaagggt 420
tacgaggagg aggtcgccga gccgatgtgg cgcgaacccc ggcagaccga gcgcggacgg 480
gcctactacg cccggttcga ggcatggctg aaggagaacg ggatcaccga gcacccggac 540
acgttcgcca gtcatccgcc gcgctccctg gtgctcatcc cgaaggcgct ccagccgcac 600
gccgaccggg tggacgaaga cgtgtacacc ttcgtcggcg cctgccaggg agaccgcgcc 660
gaggaaggcg gctggcagcg gcccgccggc gcggagaagg tcgtcctggt gtcgctcggc 720
tcggcgttca ccaagcagcc cgccttctac cgggagtgcg tgcgcgcctt cgggaacctg 780
cccggctggc acctcgtcct ccagatcggc cggaaggtga cccccgccga actgggggag 840
ctgccggaca acgtggaggt gcacgactgg gtgccgcagc tcgcgatcct gcgccaggcc 900
gatctgttcg tcacccacgc gggcgccggc ggcagccagg aggggctggc caccgcgacg 960
cccatgatcg ccgtaccgca ggccgtcgac cagttcggca acgccgacat gctccaaggg 1020
ctcggcgtcg cccggaagct ggcgaccgag gaggccaccg ccgacctgct ccgcgagacc 1080
gccctcgctc tggtggacga cccggaggtc gcgcgccggc tccggcggat ccaggcggag 1140
atggcccagg agggcggcac ccggcgggcg gccgacctca tcgaggccga actgcccgcg 1200
cgccacgagc ggcaggagcc ggtgggcgac cgacccaacg gtgggtga 1248
<210> 6
<211> 415
<212> PRT
<213> Artificial Sequence
<220>
<223> Wild type macrolide glycosyltransferase from Streptomyces
<400> 6
Met Thr Thr Gln Thr Thr Pro Ala His Ile Ala Met Phe Ser Ile Ala
1 5 10 15
Ala His Gly His Val Asn Pro Ser Leu Glu Val Ile Arg Glu Leu Val
20 25 30
Ala Arg Gly His Arg Val Thr Tyr Ala Ile Pro Pro Val Phe Ala Asp
35 40 45
Lys Val Ala Ala Thr Gly Ala Arg Pro Val Leu Tyr His Ser Thr Leu
50 55 60
Pro Gly Pro Asp Ala Asp Pro Glu Ala Trp Gly Ser Thr Leu Leu Asp
65 70 75 80
Asn Val Glu Pro Phe Leu Asn Asp Ala Ile Gln Ala Leu Pro Gln Leu
85 90 95
Ala Asp Ala Tyr Ala Asp Asp Ile Pro Asp Leu Val Leu His Asp Ile
100 105 110
Thr Ser Tyr Pro Ala Arg Val Leu Ala Arg Arg Trp Gly Val Pro Ala
115 120 125
Val Ser Leu Ser Pro Asn Leu Val Ala Trp Lys Gly Tyr Glu Glu Glu
130 135 140
Val Ala Glu Pro Met Trp Arg Glu Pro Arg Gln Thr Glu Arg Gly Arg
145 150 155 160
Ala Tyr Tyr Ala Arg Phe Glu Ala Trp Leu Lys Glu Asn Gly Ile Thr
165 170 175
Glu His Pro Asp Thr Phe Ala Ser His Pro Pro Arg Ser Leu Val Leu
180 185 190
Ile Pro Lys Ala Leu Gln Pro His Ala Asp Arg Val Asp Glu Asp Val
195 200 205
Tyr Thr Phe Val Gly Ala Cys Gln Gly Asp Arg Ala Glu Glu Gly Gly
210 215 220
Trp Gln Arg Pro Ala Gly Ala Glu Lys Val Val Leu Val Ser Leu Gly
225 230 235 240
Ser Ala Phe Thr Lys Gln Pro Ala Phe Tyr Arg Glu Cys Val Arg Ala
245 250 255
Phe Gly Asn Leu Pro Gly Trp His Leu Val Leu Gln Ile Gly Arg Lys
260 265 270
Val Thr Pro Ala Glu Leu Gly Glu Leu Pro Asp Asn Val Glu Val His
275 280 285
Asp Trp Val Pro Gln Leu Ala Ile Leu Arg Gln Ala Asp Leu Phe Val
290 295 300
Thr His Ala Gly Ala Gly Gly Ser Gln Glu Gly Leu Ala Thr Ala Thr
305 310 315 320
Pro Met Ile Ala Val Pro Gln Ala Val Asp Gln Phe Gly Asn Ala Asp
325 330 335
Met Leu Gln Gly Leu Gly Val Ala Arg Lys Leu Ala Thr Glu Glu Ala
340 345 350
Thr Ala Asp Leu Leu Arg Glu Thr Ala Leu Ala Leu Val Asp Asp Pro
355 360 365
Glu Val Ala Arg Arg Leu Arg Arg Ile Gln Ala Glu Met Ala Gln Glu
370 375 380
Gly Gly Thr Arg Arg Ala Ala Asp Leu Ile Glu Ala Glu Leu Pro Ala
385 390 395 400
Arg His Glu Arg Gln Glu Pro Val Gly Asp Arg Pro Asn Gly Gly
405 410 415
<210> 7
<211> 894
<212> DNA
<213> Artificial Sequence
<220>
<223> Wild type laminaribiose phosphorylase from Paenibacillus
<400> 7
atgtacccat ttggaaaagg ctttgcccgt tacgttcctt ttctgctgct gttgattccg 60
ctggcgttat acgtcgtttt ttatttcgga ccatcggtgt tgaccgtgat ttattcgttt 120
acggatgtga aaaacatccc cggcagctcc atgaacttcg tcgggctcga taattataaa 180
gacttgtttt ttgccggaaa ttccggggaa cgctgggttt ccatcaaaaa cacgttaatt 240
ttcatgttta tcgtcaccat cgtgcagaac ggagtggcgt tgtttgtggc tgtgctgatc 300
aaccaacggc tgcgcggcga ttatttttac cgggccgtat tttttcttcc ggtcgtgctt 360
ggggtggccg ttgttgcgct cgtttggggc atgatgttcg atccgatgag cgggccggtt 420
aacatgctgt atcaatcgct gttcggatat aaagacatgt ttttctccag ctttacgcat 480
gcgttcggct acattatttt cgttcaaatc tggatgtaca tgggctattc aatgctgatt 540
tttctcgccg gcctacaatc cgtgccaaaa gatctgtacg aagcggggta catcgacggt 600
acgaaccgct ggcaatcgtt caagaatatt acgttcccgc tgatcgcccc gtcttttacg 660
gtcaatatgc tgctttcgat catcggggcg atgtccacgt tcgatattat cctcgccacg 720
acggacggca agttcaacac cagaacgatg gcttacgacg tatataagga aacgttccgc 780
ggcagtctgg aaatgggctt gccttcggcg ctgtccgtgg tccagttcct gatcattttg 840
gtgtttgtta tcgtggccgt cagacagacg cgtaagagag aggtggaata ttaa 894
<210> 8
<211> 297
<212> PRT
<213> Artificial Sequence
<220>
<223> Wild type laminaribiose phosphorylase from Paenibacillus
<400> 8
Met Tyr Pro Phe Gly Lys Gly Phe Ala Arg Tyr Val Pro Phe Leu Leu
1 5 10 15
Leu Leu Ile Pro Leu Ala Leu Tyr Val Val Phe Tyr Phe Gly Pro Ser
20 25 30
Val Leu Thr Val Ile Tyr Ser Phe Thr Asp Val Lys Asn Ile Pro Gly
35 40 45
Ser Ser Met Asn Phe Val Gly Leu Asp Asn Tyr Lys Asp Leu Phe Phe
50 55 60
Ala Gly Asn Ser Gly Glu Arg Trp Val Ser Ile Lys Asn Thr Leu Ile
65 70 75 80
Phe Met Phe Ile Val Thr Ile Val Gln Asn Gly Val Ala Leu Phe Val
85 90 95
Ala Val Leu Ile Asn Gln Arg Leu Arg Gly Asp Tyr Phe Tyr Arg Ala
100 105 110
Val Phe Phe Leu Pro Val Val Leu Gly Val Ala Val Val Ala Leu Val
115 120 125
Trp Gly Met Met Phe Asp Pro Met Ser Gly Pro Val Asn Met Leu Tyr
130 135 140
Gln Ser Leu Phe Gly Tyr Lys Asp Met Phe Phe Ser Ser Phe Thr His
145 150 155 160
Ala Phe Gly Tyr Ile Ile Phe Val Gln Ile Trp Met Tyr Met Gly Tyr
165 170 175
Ser Met Leu Ile Phe Leu Ala Gly Leu Gln Ser Val Pro Lys Asp Leu
180 185 190
Tyr Glu Ala Gly Tyr Ile Asp Gly Thr Asn Arg Trp Gln Ser Phe Lys
195 200 205
Asn Ile Thr Phe Pro Leu Ile Ala Pro Ser Phe Thr Val Asn Met Leu
210 215 220
Leu Ser Ile Ile Gly Ala Met Ser Thr Phe Asp Ile Ile Leu Ala Thr
225 230 235 240
Thr Asp Gly Lys Phe Asn Thr Arg Thr Met Ala Tyr Asp Val Tyr Lys
245 250 255
Glu Thr Phe Arg Gly Ser Leu Glu Met Gly Leu Pro Ser Ala Leu Ser
260 265 270
Val Val Gln Phe Leu Ile Ile Leu Val Phe Val Ile Val Ala Val Arg
275 280 285
Gln Thr Arg Lys Arg Glu Val Glu Tyr
290 295
<210> 9
<211> 1374
<212> DNA
<213> Artificial Sequence
<220>
<223> Variant of UDP-glycosyltransferase 76G1 from Stevia
<400> 9
atggagaaca aaaccgaaac caccgtgcgt cgtcgtcgtc gtatcattct gtttccggtt 60
ccgttccagg gccacatcaa cccgattctg caactggcga acgtgctgta cagcaagggt 120
tttagcatca ccatttttca caccaacttc aacaagccga aaaccagcaa ctatccgcac 180
ttcacctttc gtttcatcct ggacaacgat ccgcaggacg agcgtattag caacctgccg 240
acccatggtc cgctggcggg tatgcgtatc ccgatcatta acgagcacgg cgcggatgaa 300
ctgcgtcgtg agctggaact gctgatgctg gcgagcgagg aagacgagga agttagctgc 360
ctgattaccg atgcgctgtg gtacttcgcg caaagcgtgg cggacagcct gaacctgcgt 420
cgtctggttc tgatgaccag cagcctgttt aacttccacg cgcacgtgag cctgccgcag 480
tttgacgagc tgggctacct ggatccggac gataaaaccc gtctggagga acaagcgagc 540
ggtttcccga tgctgaaggt taaagatatc aagagcgcgt atagcaactg gcagatcctg 600
aaagaaattc tgggcaagat gatcaagcag acccgtgcga gcagcggtgt gatttggaac 660
agctttaaag agctggagga aagcgagctg gaaaccgtta tccgtgaaat tccggcgccg 720
agcttcctga ttccgctgcc gaagcacctg accgcgagca gcagcagcct gctggaccac 780
gatcgtaccg tgttccagtg gctggaccag caaccgccga gcagcgtgct gtacgttagc 840
tttggcagca ccagcgaggt ggacgaaaag gatttcctgg agattgcgcg tggtctggtt 900
gacagcaaac aaagctttct gtgggtggtt cgtccgggct tcgtgaaggg tagcacctgg 960
gttgagccgc tgccggatgg ttttctgggc gaacgtggtc gtatcgtgaa gtgggttccg 1020
caacaagaag tgctggcgca cggcgcgatt ggtgcgttct ggacccacag cggttggaac 1080
agcaccctgg agagcgtgtg cgaaggcgtt ccgatgatct ttagcgactt cggtctggat 1140
cagccgctga acgcgcgtta catgagcgat gttctgaaag tgggcgttta tctggagaac 1200
ggctgggagc gtggtgaaat cgcgaacgcg attcgtcgtg tgatggttga cgaggaaggt 1260
gagtacatcc gtcagaacgc gcgtgttctg aagcaaaaag cggatgttag cctgatgaag 1320
ggtggcagca gctacgagag cctggaaagc ctggttagct atattagcag cctg 1374
<210> 10
<211> 458
<212> PRT
<213> Artificial Sequence
<220>
<223> Variant of UDP-glycosyltransferase 76G1 from Stevia
<400> 10
Met Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile
1 5 10 15
Leu Phe Pro Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln Leu
20 25 30
Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr
35 40 45
Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg
50 55 60
Phe Ile Leu Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro
65 70 75 80
Thr His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His
85 90 95
Gly Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala Ser
100 105 110
Glu Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr
115 120 125
Phe Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val Leu
130 135 140
Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln
145 150 155 160
Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu
165 170 175
Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser
180 185 190
Ala Tyr Ser Asn Trp Gln Ile Leu Lys Glu Ile Leu Gly Lys Met Ile
195 200 205
Lys Gln Thr Arg Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu
210 215 220
Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro
225 230 235 240
Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser
245 250 255
Leu Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro
260 265 270
Pro Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp
275 280 285
Glu Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln
290 295 300
Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp
305 310 315 320
Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val
325 330 335
Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala
340 345 350
Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu
355 360 365
Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn
370 375 380
Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn
385 390 395 400
Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val
405 410 415
Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln
420 425 430
Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu
435 440 445
Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu
450 455
<210> 11
<211> 1203
<212> DNA
<213> Artificial Sequence
<220>
<223> Variant of macrolide glycosyltransferase from Streptomyces
<400> 11
atgaccagtc gttcccatat tgccatgttt agtatcgcgg cccatggtca cgtgaacccg 60
tccctggaag tcattcgtga actggtggcg cgtggtcacc gtgttaccta tgccatcccg 120
ccggttttcg ccggtaaagt tgctgaagcg ggcgccgaag tgaaactgtg gaacagcacg 180
ctgccgtctc cggatgacga tccgcaggcg tggggtacca cgctgctgga taatgttgaa 240
ccgtttctgg cagacgctat tcaggctctg ccgcaactga tcgaagcgta tgaaggcgac 300
gaaccggatc tggtcctgca tgatatcacc tcatatccgg ctcgtgttct ggcccatcgc 360
tggggtgtcc cggccgtgtc actgtcgccg aatctggttg cctgggaagg ctacgaaaaa 420
gaagtcgctg aaccgatgtg ggcggaaccg aaacgtaccg aacgtggtcg cgcctattac 480
gcacgctttc atgcctggct ggaagaaaac ggtgttacgc tgcatccgga tgattttgtt 540
ggtcgtccgg cacgttgcct ggtgctgatt ccgaaagccc tgcagccgaa tgcagaccgt 600
gtggatgaag gtgtttatag ctttgtcggc gcctgtcaag gcgatcgcgg tgcagagggt 660
gaatggcgtc gcccggcggg tgcagaaaaa gttgccctgg tctctctggg cagctctttt 720
accaaacagc cggatttcta ccgtgaatgc gtgcgcgcct tcggtgaatt accgggctgg 780
catctggtcc tgcaaattgg tcgccatgtg gacccggccg atctgggtga tgtgccggaa 840
aacgtggaag ttcgctcatg ggttccgcag ctggctatcc tgaaagaagc ggacctgttt 900
gtgacgcatg caggtgctgg cggttcgcaa gaaggcctgg ccaccgcaac gccgatgatt 960
gcagtgccgc aggcagttga tcaattcggt aatgcagaca tgctgcaggg tctgggtgtt 1020
gcccgtcgcc tggataccga agaagcaacc gctgaagcgc tgcgtgcagc ggcgctggcg 1080
ctggttgatg atccggaagt tgctcgtcgc gcgcgcgata ttcaggcgca gatggcgggt 1140
gaaggcggta cccgtcgcgc agcagacctg atcgaagctg aactgccggt gcgtcaggca 1200
taa 1203
<210> 12
<211> 400
<212> PRT
<213> Artificial Sequence
<220>
<223> Variant of macrolide glycosyltransferase from Streptomyces
<400> 12
Met Thr Ser Arg Ser His Ile Ala Met Phe Ser Ile Ala Ala His Gly
1 5 10 15
His Val Asn Pro Ser Leu Glu Val Ile Arg Glu Leu Val Ala Arg Gly
20 25 30
His Arg Val Thr Tyr Ala Ile Pro Pro Val Phe Ala Gly Lys Val Ala
35 40 45
Glu Ala Gly Ala Glu Val Lys Leu Trp Asn Ser Thr Leu Pro Ser Pro
50 55 60
Asp Asp Asp Pro Gln Ala Trp Gly Thr Thr Leu Leu Asp Asn Val Glu
65 70 75 80
Pro Phe Leu Ala Asp Ala Ile Gln Ala Leu Pro Gln Leu Ile Glu Ala
85 90 95
Tyr Glu Gly Asp Glu Pro Asp Leu Val Leu His Asp Ile Thr Ser Tyr
100 105 110
Pro Ala Arg Val Leu Ala His Arg Trp Gly Val Pro Ala Val Ser Leu
115 120 125
Ser Pro Asn Leu Val Ala Trp Glu Gly Tyr Glu Lys Glu Val Ala Glu
130 135 140
Pro Met Trp Ala Glu Pro Lys Arg Thr Glu Arg Gly Arg Ala Tyr Tyr
145 150 155 160
Ala Arg Phe His Ala Trp Leu Glu Glu Asn Gly Val Thr Leu His Pro
165 170 175
Asp Asp Phe Val Gly Arg Pro Ala Arg Cys Leu Val Leu Ile Pro Lys
180 185 190
Ala Leu Gln Pro Asn Ala Asp Arg Val Asp Glu Gly Val Tyr Ser Phe
195 200 205
Val Gly Ala Cys Gln Gly Asp Arg Gly Ala Glu Gly Glu Trp Arg Arg
210 215 220
Pro Ala Gly Ala Glu Lys Val Ala Leu Val Ser Leu Gly Ser Ser Phe
225 230 235 240
Thr Lys Gln Pro Asp Phe Tyr Arg Glu Cys Val Arg Ala Phe Gly Glu
245 250 255
Leu Pro Gly Trp His Leu Val Leu Gln Ile Gly Arg His Val Asp Pro
260 265 270
Ala Asp Leu Gly Asp Val Pro Glu Asn Val Glu Val Arg Ser Trp Val
275 280 285
Pro Gln Leu Ala Ile Leu Lys Glu Ala Asp Leu Phe Val Thr His Ala
290 295 300
Gly Ala Gly Gly Ser Gln Glu Gly Leu Ala Thr Ala Thr Pro Met Ile
305 310 315 320
Ala Val Pro Gln Ala Val Asp Gln Phe Gly Asn Ala Asp Met Leu Gln
325 330 335
Gly Leu Gly Val Ala Arg Arg Leu Asp Thr Glu Glu Ala Thr Ala Glu
340 345 350
Ala Leu Arg Ala Ala Ala Leu Ala Leu Val Asp Asp Pro Glu Val Ala
355 360 365
Arg Arg Ala Arg Asp Ile Gln Ala Gln Met Ala Gly Glu Gly Gly Thr
370 375 380
Arg Arg Ala Ala Asp Leu Ile Glu Ala Glu Leu Pro Val Arg Gln Ala
385 390 395 400
<210> 13
<211> 2733
<212> DNA
<213> Artificial Sequence
<220>
<223> Variant of laminaribiose phosphorylase from Paenibacillus
<400> 13
atgggccaga agggttggaa atttcagggc gaacaaggcg agttccgtct ggaacaaccg 60
gagcacaaca gctacctgta ttttccgctg gtgaacgaag cgggtatgat gagcgcggtt 120
accccgaacc tgcacggcga gatcaccagc ggtcacaaca ccttcctgat ggaaccggtg 180
agcgcggaga gcctgcacaa cagcaaggcg agccgtaact tttgggtgtt cattgaaggt 240
tatggtgcgt ggagcgttag cggcaacagc gcgcgtcaga acgcggcgcg ttttaccggt 300
gaggaagagc gtagcgcggt ggaggcgggt ttcctgtggc acgcggttac ccgtgaaaac 360
gagaaggcgg gtctgaaagc gcgtaccgtg agcttcgtgc cggttaccga cgataagatc 420
gaactgatgc gtgttaccct gaccaacacc ggcaacgcgc cgctgaaact gaccccgacc 480
gcggcgattc cgctgtatgg tcgtagcgcg gacgatctgc gtgatcaccg tcacgtgacc 540
agcctgctgc accgtatctt taccagcgaa tacggcattg aggttcagcc ggcgctgagc 600
ttcgacgaac gtggtcaccg tgtgaacaag gttacctatg gcgtgtttgg tgcggaggcg 660
ggtggcaccg cgccggcggg cttctttccg gttaccgaag atttcattgg cgagggtggc 720
gcgctggact ggccggaagc ggtggttgcg aaccgtgagc cggatgcgca ggcgggcacc 780
gcggtggaag gttatgaggc ggttggcgcg ctgcgttttg cgccggtgga gctggcgccg 840
ggcaaaagcg tgagctatgt ggttgcgatg gttatcagcg gcgaccgtat tgatgttggt 900
cgttacgcgg cggattatct ggcggcgggt cgttttgacg cgctgctgga gcagaaccgt 960
gcgtactggc gtgacaagct ggataccgtg cgtttcagca gcggtgatgg cgagcaggac 1020
ctgtggatga aatgggttac cctgcaaccg attctgcgtc gtctgtatgg taacagcttc 1080
ctgccgtacc acgattatgg tcgtggtggc cgtggctggc gtgatctgtg gcaagactgc 1140
ctggcgctga tggtgatgga accggcggaa gtgcgtcacc tgctgctgaa caactacgcg 1200
ggtgtgcgta tggacggcag caacgcgacc atcattggtg cgggcccggg tgaatttgtg 1260
gcggatcgta acaacatccc gcgtgtttgg atggaccatg gtgcgtggcc gctgatgacc 1320
accctgctgt acctgcacca gagcggtgac ctggatctgc tgttccagcc gcaaagctat 1380
tttcgtgatg tgttcgttaa gcgttgccgt gagcgtgatg cgagctggac cccggagcag 1440
ggtaacaaac tgctgaccgc ggacggtcaa atttacgaag gcaccatcct ggagcacatt 1500
ctgctgcaaa acatcgtgcc gttctttaac gttggcgaac acggtaacat taaactggag 1560
ggcgcggact ggaacgatgg tctggacctg gcgccggaac gtggtgagag cgttgcgttt 1620
accgcgttct acgcgagcaa cctgatggaa ctgagcgagc tgctgctgga gctgcagaag 1680
cgtaccggca aagatagcct ggacatcgcg gaagagatgg cgctgctgct ggataccctg 1740
ggcaagccga tcagctatga cagcattcaa gaaaaacgta gcctgctgga tcgttactat 1800
gacgcggtga ccccgcgtgt tagcggcaag aaactgctgc tggatatccg taaggtggcg 1860
gaggatctga agcgtaaagc ggactgggcg gttgcgcacc tgcgtggtag cgaatggatt 1920
cagagcaaag agggctacgc gtggtttaac ggttactata acaacgacgg tgaacgtgtg 1980
gagggcgatc acccggacgg tgttcgtatg accctgaccg gtcaagtgtt cgcgatcatg 2040
ggtggcgttg cgaccgatga acagaccgag aagattagcc aagcggtgaa ccgttacctg 2100
aaagacgaac gtatcggcta tcgtctgaac agccgttttg gtggcattca gcaaaacctg 2160
ggtcgtgcgt tcggctttgc gttcggtcac aaggagaacg gtgcgatgtt cagccacatg 2220
accgtgatgt acgcgaacgc gctgtataaa cgtggctttg tgcaggaagg tttcgaggtt 2280
ctggatagca tctaccgtct gagcgcggac tttgaaaaca gccgtatcta cccgggcgtt 2340
ccggaatata ttaacgagcg tggccgtggc atgtacacct atctgaccgg tagcgcgagc 2400
tggctgctgc tgacccaact gaccgaagtg tatggcgtta agggtcgttt cggcgatctg 2460
cgtctggagc cgaaactggt gcaggcgcaa tttgacggca gcggtgaagc ggcggttgag 2520
accctgttcg cgggtcgtat gctgcgtgtg gtttatcgta acccgcaggc ggcggagcat 2580
ggtcaatatc gtgtggatag cgttagcctg aacggtcaga gcgttgattg ccaaaacgac 2640
ggcgcgggtt gcctgatcgg tcgtagcctg attgaagcgc tgccggcgga tggtgtgcat 2700
gagctgatcg ttaccctggg tcgtaacatt agc 2733
<210> 14
<211> 911
<212> PRT
<213> Artificial Sequence
<220>
<223> Variant of laminaribiose phosphorylase from Paenibacillus
<400> 14
Met Gly Gln Lys Gly Trp Lys Phe Gln Gly Glu Gln Gly Glu Phe Arg
1 5 10 15
Leu Glu Gln Pro Glu His Asn Ser Tyr Leu Tyr Phe Pro Leu Val Asn
20 25 30
Glu Ala Gly Met Met Ser Ala Val Thr Pro Asn Leu His Gly Glu Ile
35 40 45
Thr Ser Gly His Asn Thr Phe Leu Met Glu Pro Val Ser Ala Glu Ser
50 55 60
Leu His Asn Ser Lys Ala Ser Arg Asn Phe Trp Val Phe Ile Glu Gly
65 70 75 80
Tyr Gly Ala Trp Ser Val Ser Gly Asn Ser Ala Arg Gln Asn Ala Ala
85 90 95
Arg Phe Thr Gly Glu Glu Glu Arg Ser Ala Val Glu Ala Gly Phe Leu
100 105 110
Trp His Ala Val Thr Arg Glu Asn Glu Lys Ala Gly Leu Lys Ala Arg
115 120 125
Thr Val Ser Phe Val Pro Val Thr Asp Asp Lys Ile Glu Leu Met Arg
130 135 140
Val Thr Leu Thr Asn Thr Gly Asn Ala Pro Leu Lys Leu Thr Pro Thr
145 150 155 160
Ala Ala Ile Pro Leu Tyr Gly Arg Ser Ala Asp Asp Leu Arg Asp His
165 170 175
Arg His Val Thr Ser Leu Leu His Arg Ile Phe Thr Ser Glu Tyr Gly
180 185 190
Ile Glu Val Gln Pro Ala Leu Ser Phe Asp Glu Arg Gly His Arg Val
195 200 205
Asn Lys Val Thr Tyr Gly Val Phe Gly Ala Glu Ala Gly Gly Thr Ala
210 215 220
Pro Ala Gly Phe Phe Pro Val Thr Glu Asp Phe Ile Gly Glu Gly Gly
225 230 235 240
Ala Leu Asp Trp Pro Glu Ala Val Val Ala Asn Arg Glu Pro Asp Ala
245 250 255
Gln Ala Gly Thr Ala Val Glu Gly Tyr Glu Ala Val Gly Ala Leu Arg
260 265 270
Phe Ala Pro Val Glu Leu Ala Pro Gly Lys Ser Val Ser Tyr Val Val
275 280 285
Ala Met Val Ile Ser Gly Asp Arg Ile Asp Val Gly Arg Tyr Ala Ala
290 295 300
Asp Tyr Leu Ala Ala Gly Arg Phe Asp Ala Leu Leu Glu Gln Asn Arg
305 310 315 320
Ala Tyr Trp Arg Asp Lys Leu Asp Thr Val Arg Phe Ser Ser Gly Asp
325 330 335
Gly Glu Gln Asp Leu Trp Met Lys Trp Val Thr Leu Gln Pro Ile Leu
340 345 350
Arg Arg Leu Tyr Gly Asn Ser Phe Leu Pro Tyr His Asp Tyr Gly Arg
355 360 365
Gly Gly Arg Gly Trp Arg Asp Leu Trp Gln Asp Cys Leu Ala Leu Met
370 375 380
Val Met Glu Pro Ala Glu Val Arg His Leu Leu Leu Asn Asn Tyr Ala
385 390 395 400
Gly Val Arg Met Asp Gly Ser Asn Ala Thr Ile Ile Gly Ala Gly Pro
405 410 415
Gly Glu Phe Val Ala Asp Arg Asn Asn Ile Pro Arg Val Trp Met Asp
420 425 430
His Gly Ala Trp Pro Leu Met Thr Thr Leu Leu Tyr Leu His Gln Ser
435 440 445
Gly Asp Leu Asp Leu Leu Phe Gln Pro Gln Ser Tyr Phe Arg Asp Val
450 455 460
Phe Val Lys Arg Cys Arg Glu Arg Asp Ala Ser Trp Thr Pro Glu Gln
465 470 475 480
Gly Asn Lys Leu Leu Thr Ala Asp Gly Gln Ile Tyr Glu Gly Thr Ile
485 490 495
Leu Glu His Ile Leu Leu Gln Asn Ile Val Pro Phe Phe Asn Val Gly
500 505 510
Glu His Gly Asn Ile Lys Leu Glu Gly Ala Asp Trp Asn Asp Gly Leu
515 520 525
Asp Leu Ala Pro Glu Arg Gly Glu Ser Val Ala Phe Thr Ala Phe Tyr
530 535 540
Ala Ser Asn Leu Met Glu Leu Ser Glu Leu Leu Leu Glu Leu Gln Lys
545 550 555 560
Arg Thr Gly Lys Asp Ser Leu Asp Ile Ala Glu Glu Met Ala Leu Leu
565 570 575
Leu Asp Thr Leu Gly Lys Pro Ile Ser Tyr Asp Ser Ile Gln Glu Lys
580 585 590
Arg Ser Leu Leu Asp Arg Tyr Tyr Asp Ala Val Thr Pro Arg Val Ser
595 600 605
Gly Lys Lys Leu Leu Leu Asp Ile Arg Lys Val Ala Glu Asp Leu Lys
610 615 620
Arg Lys Ala Asp Trp Ala Val Ala His Leu Arg Gly Ser Glu Trp Ile
625 630 635 640
Gln Ser Lys Glu Gly Tyr Ala Trp Phe Asn Gly Tyr Tyr Asn Asn Asp
645 650 655
Gly Glu Arg Val Glu Gly Asp His Pro Asp Gly Val Arg Met Thr Leu
660 665 670
Thr Gly Gln Val Phe Ala Ile Met Gly Gly Val Ala Thr Asp Glu Gln
675 680 685
Thr Glu Lys Ile Ser Gln Ala Val Asn Arg Tyr Leu Lys Asp Glu Arg
690 695 700
Ile Gly Tyr Arg Leu Asn Ser Arg Phe Gly Gly Ile Gln Gln Asn Leu
705 710 715 720
Gly Arg Ala Phe Gly Phe Ala Phe Gly His Lys Glu Asn Gly Ala Met
725 730 735
Phe Ser His Met Thr Val Met Tyr Ala Asn Ala Leu Tyr Lys Arg Gly
740 745 750
Phe Val Gln Glu Gly Phe Glu Val Leu Asp Ser Ile Tyr Arg Leu Ser
755 760 765
Ala Asp Phe Glu Asn Ser Arg Ile Tyr Pro Gly Val Pro Glu Tyr Ile
770 775 780
Asn Glu Arg Gly Arg Gly Met Tyr Thr Tyr Leu Thr Gly Ser Ala Ser
785 790 795 800
Trp Leu Leu Leu Thr Gln Leu Thr Glu Val Tyr Gly Val Lys Gly Arg
805 810 815
Phe Gly Asp Leu Arg Leu Glu Pro Lys Leu Val Gln Ala Gln Phe Asp
820 825 830
Gly Ser Gly Glu Ala Ala Val Glu Thr Leu Phe Ala Gly Arg Met Leu
835 840 845
Arg Val Val Tyr Arg Asn Pro Gln Ala Ala Glu His Gly Gln Tyr Arg
850 855 860
Val Asp Ser Val Ser Leu Asn Gly Gln Ser Val Asp Cys Gln Asn Asp
865 870 875 880
Gly Ala Gly Cys Leu Ile Gly Arg Ser Leu Ile Glu Ala Leu Pro Ala
885 890 895
Asp Gly Val His Glu Leu Ile Val Thr Leu Gly Arg Asn Ile Ser
900 905 910
<210> 15
<211> 1476
<212> DNA
<213> Artificial Sequence
<220>
<223> Sucrose phosphorylase from Leuconostoc
<400> 15
atggaaatcc agaacaaagc gatgttcatt acctacgcgg atagcctggg taaaaacctg 60
aaggacgttc gtaaagtgct gaaagaggac atcggcgatg cgattggtgg cgttcacctg 120
ctgccgttct ttccgagcac cggtgatcgt ggcttcgcgc cgagcgacta cacccgtgtt 180
gatagcgcgt ttggtgactg gagcgatgtg gaagcgctgg gcgaggaata ctatctgatg 240
ttcgacttta tgatcaacca cattagccgt gaaagcgtta tgtaccagga cttcaagaaa 300
aaccacgatg agagcaagta taaagacttc tttatccgtt gggagaaatt ttgggcgaaa 360
gcgggtgaaa accgtccgac ccaggcggac gtggatctga tctacaagcg taaagataag 420
gcgccgaccc aagagattac cttcgacgat ggtaccaccg aaaacctgtg gaacaccttt 480
ggcgacgagc aaatcgacat tgatgttaac agcgcgatcg cgaaagagtt cattaagacc 540
accctggaag atatggtgaa acacggtgcg aacctgatcc gtctggacgc gtttgcgtac 600
gcggttaaga aagtggacac caacgatttc tttgttgagc cggaaatctg ggacaccctg 660
aacgaagtgc gtgaaattct gaccccgctg aaggcggaga tcctgccgga gattcacgaa 720
cactatagca tcccgaagaa aattaacgat cacggttact tcacctatga ctttgcgctg 780
ccgatgacca ccctgtacac cctgtatagc ggcaaaacca accagctggc gaaatggctg 840
aagatgagcc cgatgaagca attcaccacc ctggacaccc acgatggtat cggcgtggtt 900
gacgcgcgtg atgtgctgac cgacgaggaa attgattacg cgagcgagga actgtataag 960
gttggcgcga acgtgaagaa aacctacagc agcgcgagct ataacgacct ggatatctac 1020
caaattaaca gcacctacta tagcgcgctg ggtaacgacg atgcggcgta tctgctgagc 1080
cgtatcttcc aggtttttgc gccgggcatc ccgcaaattt actatgtggg tctgctggcg 1140
ggcgaaagcg atatcgagct gctggaaagc agcaaagagg gtcgtaacat taaccgtcac 1200
tactatagcg ttgacgaagt gaaagaggaa gttaagcgtc cggtggttgc gaaactgctg 1260
aagctgctga gctggcgtaa caacttcgcg gcgtttgacc tggatggtag cattgatgtg 1320
gaaaccccga gcgacaccac catcaagatt acccgtaaag ataagagcgg cgagaacgtg 1380
gcggttctgg tggcgaacgc ggcggacaaa acctttacca tcaccgcgaa cggcgaggaa 1440
attctggcga acaccgaggc ggacaagcag caactg 1476
<210> 16
<211> 492
<212> PRT
<213> Artificial Sequence
<220>
<223> Sucrose phosphorylase from Leuconostoc
<400> 16
Met Glu Ile Gln Asn Lys Ala Met Phe Ile Thr Tyr Ala Asp Ser Leu
1 5 10 15
Gly Lys Asn Leu Lys Asp Val Arg Lys Val Leu Lys Glu Asp Ile Gly
20 25 30
Asp Ala Ile Gly Gly Val His Leu Leu Pro Phe Phe Pro Ser Thr Gly
35 40 45
Asp Arg Gly Phe Ala Pro Ser Asp Tyr Thr Arg Val Asp Ser Ala Phe
50 55 60
Gly Asp Trp Ser Asp Val Glu Ala Leu Gly Glu Glu Tyr Tyr Leu Met
65 70 75 80
Phe Asp Phe Met Ile Asn His Ile Ser Arg Glu Ser Val Met Tyr Gln
85 90 95
Asp Phe Lys Lys Asn His Asp Glu Ser Lys Tyr Lys Asp Phe Phe Ile
100 105 110
Arg Trp Glu Lys Phe Trp Ala Lys Ala Gly Glu Asn Arg Pro Thr Gln
115 120 125
Ala Asp Val Asp Leu Ile Tyr Lys Arg Lys Asp Lys Ala Pro Thr Gln
130 135 140
Glu Ile Thr Phe Asp Asp Gly Thr Thr Glu Asn Leu Trp Asn Thr Phe
145 150 155 160
Gly Asp Glu Gln Ile Asp Ile Asp Val Asn Ser Ala Ile Ala Lys Glu
165 170 175
Phe Ile Lys Thr Thr Leu Glu Asp Met Val Lys His Gly Ala Asn Leu
180 185 190
Ile Arg Leu Asp Ala Phe Ala Tyr Ala Val Lys Lys Val Asp Thr Asn
195 200 205
Asp Phe Phe Val Glu Pro Glu Ile Trp Asp Thr Leu Asn Glu Val Arg
210 215 220
Glu Ile Leu Thr Pro Leu Lys Ala Glu Ile Leu Pro Glu Ile His Glu
225 230 235 240
His Tyr Ser Ile Pro Lys Lys Ile Asn Asp His Gly Tyr Phe Thr Tyr
245 250 255
Asp Phe Ala Leu Pro Met Thr Thr Leu Tyr Thr Leu Tyr Ser Gly Lys
260 265 270
Thr Asn Gln Leu Ala Lys Trp Leu Lys Met Ser Pro Met Lys Gln Phe
275 280 285
Thr Thr Leu Asp Thr His Asp Gly Ile Gly Val Val Asp Ala Arg Asp
290 295 300
Val Leu Thr Asp Glu Glu Ile Asp Tyr Ala Ser Glu Glu Leu Tyr Lys
305 310 315 320
Val Gly Ala Asn Val Lys Lys Thr Tyr Ser Ser Ala Ser Tyr Asn Asp
325 330 335
Leu Asp Ile Tyr Gln Ile Asn Ser Thr Tyr Tyr Ser Ala Leu Gly Asn
340 345 350
Asp Asp Ala Ala Tyr Leu Leu Ser Arg Ile Phe Gln Val Phe Ala Pro
355 360 365
Gly Ile Pro Gln Ile Tyr Tyr Val Gly Leu Leu Ala Gly Glu Ser Asp
370 375 380
Ile Glu Leu Leu Glu Ser Ser Lys Glu Gly Arg Asn Ile Asn Arg His
385 390 395 400
Tyr Tyr Ser Val Asp Glu Val Lys Glu Glu Val Lys Arg Pro Val Val
405 410 415
Ala Lys Leu Leu Lys Leu Leu Ser Trp Arg Asn Asn Phe Ala Ala Phe
420 425 430
Asp Leu Asp Gly Ser Ile Asp Val Glu Thr Pro Ser Asp Thr Thr Ile
435 440 445
Lys Ile Thr Arg Lys Asp Lys Ser Gly Glu Asn Val Ala Val Leu Val
450 455 460
Ala Asn Ala Ala Asp Lys Thr Phe Thr Ile Thr Ala Asn Gly Glu Glu
465 470 475 480
Ile Leu Ala Asn Thr Glu Ala Asp Lys Gln Gln Leu
485 490
<210> 17
<211> 1512
<212> DNA
<213> Artificial Sequence
<220>
<223> Sucrose phosphorylase from Bifidobacterium
<400> 17
atgaagaaca aagttcaact gatcacctac gcggaccgtc tgggtgatgg caccatcaag 60
agcatgaccg atattctgcg tacccgtttc gacggtgttt atgatggcgt gcacatcctg 120
ccgttcttta ccccgttcga cggtgcggat gcgggctttg acccgattga tcacaccaag 180
gttgacgagc gtctgggtag ctgggacgat gtggcggaac tgagcaaaac ccacaacatc 240
atggttgatg cgattgtgaa ccacatgagc tgggagagca agcagtttca agacgttctg 300
gcgaaaggcg aggaaagcga atactatccg atgttcctga ccatgagcag cgtgtttccg 360
aacggtgcga ccgaggaaga cctggcgggt atctatcgtc cgcgtccggg tctgccgttc 420
acccactata agtttgcggg taaaacccgt ctggtgtggg ttagcttcac cccgcagcaa 480
gttgatattg acaccgatag cgacaagggc tgggagtacc tgatgagcat ctttgatcaa 540
atggcggcga gccacgttag ctacattcgt ctggacgcgg tgggttatgg cgcgaaagaa 600
gcgggtacca gctgcttcat gaccccgaag acctttaaac tgatcagccg tctgcgtgag 660
gaaggtgtga agcgtggcct ggagatcctg attgaagttc acagctacta taagaaacag 720
gtggagattg cgagcaaagt ggaccgtgtt tatgattttg cgctgccgcc gctgctgctg 780
catgcgctga gcaccggtca tgtggaaccg gttgcgcact ggaccgatat ccgtccgaac 840
aacgcggtga ccgttctgga cacccacgat ggtattggcg ttatcgacat tggtagcgac 900
caactggatc gtagcctgaa gggtctggtg ccggatgagg acgttgataa cctggtgaac 960
accatccacg cgaacaccca cggtgaaagc caagcggcga ccggcgcggc ggcgagcaac 1020
ctggatctgt accaagttaa cagcacctac tatagcgcgc tgggttgcaa cgaccagcac 1080
tatattgcgg cgcgtgcggt gcagttcttt ctgccgggcg tgccgcaagt ttactatgtg 1140
ggtgcgctgg cgggcaagaa cgacatggag ctgctgcgta aaaccaacaa cggtcgtgat 1200
atcaaccgtc actactatag caccgcggag attgacgaaa acctgaagcg tccggtggtt 1260
aaagcgctga acgcgctggc gaagttccgt aacgaactgg acgcgttcga tggtaccttt 1320
agctacacca ccgacgatga caccagcatc agcttcacct ggcgtggcga gaccagccag 1380
gcgaccctga cctttgaacc gaaacgtggt ctgggcgttg acaacaccac cccggtggcg 1440
atgctggagt gggaagacag cgcgggtgat caccgtagcg atgacctgat tgcgaacccg 1500
ccggtggttg cg 1512
<210> 18
<211> 504
<212> PRT
<213> Artificial Sequence
<220>
<223> Sucrose phosphorylase from Bifidobacterium
<400> 18
Met Lys Asn Lys Val Gln Leu Ile Thr Tyr Ala Asp Arg Leu Gly Asp
1 5 10 15
Gly Thr Ile Lys Ser Met Thr Asp Ile Leu Arg Thr Arg Phe Asp Gly
20 25 30
Val Tyr Asp Gly Val His Ile Leu Pro Phe Phe Thr Pro Phe Asp Gly
35 40 45
Ala Asp Ala Gly Phe Asp Pro Ile Asp His Thr Lys Val Asp Glu Arg
50 55 60
Leu Gly Ser Trp Asp Asp Val Ala Glu Leu Ser Lys Thr His Asn Ile
65 70 75 80
Met Val Asp Ala Ile Val Asn His Met Ser Trp Glu Ser Lys Gln Phe
85 90 95
Gln Asp Val Leu Ala Lys Gly Glu Glu Ser Glu Tyr Tyr Pro Met Phe
100 105 110
Leu Thr Met Ser Ser Val Phe Pro Asn Gly Ala Thr Glu Glu Asp Leu
115 120 125
Ala Gly Ile Tyr Arg Pro Arg Pro Gly Leu Pro Phe Thr His Tyr Lys
130 135 140
Phe Ala Gly Lys Thr Arg Leu Val Trp Val Ser Phe Thr Pro Gln Gln
145 150 155 160
Val Asp Ile Asp Thr Asp Ser Asp Lys Gly Trp Glu Tyr Leu Met Ser
165 170 175
Ile Phe Asp Gln Met Ala Ala Ser His Val Ser Tyr Ile Arg Leu Asp
180 185 190
Ala Val Gly Tyr Gly Ala Lys Glu Ala Gly Thr Ser Cys Phe Met Thr
195 200 205
Pro Lys Thr Phe Lys Leu Ile Ser Arg Leu Arg Glu Glu Gly Val Lys
210 215 220
Arg Gly Leu Glu Ile Leu Ile Glu Val His Ser Tyr Tyr Lys Lys Gln
225 230 235 240
Val Glu Ile Ala Ser Lys Val Asp Arg Val Tyr Asp Phe Ala Leu Pro
245 250 255
Pro Leu Leu Leu His Ala Leu Ser Thr Gly His Val Glu Pro Val Ala
260 265 270
His Trp Thr Asp Ile Arg Pro Asn Asn Ala Val Thr Val Leu Asp Thr
275 280 285
His Asp Gly Ile Gly Val Ile Asp Ile Gly Ser Asp Gln Leu Asp Arg
290 295 300
Ser Leu Lys Gly Leu Val Pro Asp Glu Asp Val Asp Asn Leu Val Asn
305 310 315 320
Thr Ile His Ala Asn Thr His Gly Glu Ser Gln Ala Ala Thr Gly Ala
325 330 335
Ala Ala Ser Asn Leu Asp Leu Tyr Gln Val Asn Ser Thr Tyr Tyr Ser
340 345 350
Ala Leu Gly Cys Asn Asp Gln His Tyr Ile Ala Ala Arg Ala Val Gln
355 360 365
Phe Phe Leu Pro Gly Val Pro Gln Val Tyr Tyr Val Gly Ala Leu Ala
370 375 380
Gly Lys Asn Asp Met Glu Leu Leu Arg Lys Thr Asn Asn Gly Arg Asp
385 390 395 400
Ile Asn Arg His Tyr Tyr Ser Thr Ala Glu Ile Asp Glu Asn Leu Lys
405 410 415
Arg Pro Val Val Lys Ala Leu Asn Ala Leu Ala Lys Phe Arg Asn Glu
420 425 430
Leu Asp Ala Phe Asp Gly Thr Phe Ser Tyr Thr Thr Asp Asp Asp Thr
435 440 445
Ser Ile Ser Phe Thr Trp Arg Gly Glu Thr Ser Gln Ala Thr Leu Thr
450 455 460
Phe Glu Pro Lys Arg Gly Leu Gly Val Asp Asn Thr Thr Pro Val Ala
465 470 475 480
Met Leu Glu Trp Glu Asp Ser Ala Gly Asp His Arg Ser Asp Asp Leu
485 490 495
Ile Ala Asn Pro Pro Val Val Ala
500
<210> 19
<211> 1479
<212> DNA
<213> Artificial Sequence
<220>
<223> Sucrose phosphorylase from uncultured bacterium
<400> 19
atgaagaaca aagtgcagct gattgcgtac gttgaccgta tcagcggtgg cggtttccgt 60
aagctgcatg cgctgctgac cggtccgctg gcggagattt ttggcggtgc gcacctgctg 120
ccgttcttta ccccgattga tggtgcggat gcgggttttg atccgagcga tcacacccaa 180
gtggacccgc gtctgggtac ctgggacgat gttcgtatcc tgggcggtgc gattgaactg 240
gtggcggatc tgattgtgaa ccacgttagc agcagcagcc cgcaatttat cgactacagc 300
aagaaaggca gcgatagcct gtacgcgggc atgttcctga cctatgaccg tgtttttccg 360
gagggtgcgc gtgaagcgga tatcctgcgt atttatcgtc cgcgtccgac cctgccgttt 420
agcccggtga ccctgagcag ccgtgagcgt aaactgctgt ggaccacctt taacccggaa 480
caggtggaca ttgatgttcg tcacccggag gcggaagcgt acctgcacag catcctgaag 540
aaattccaag cggcgggcat ccgtatgatt cgtctggacg cggttggcta tgcgatcaag 600
aaaccgggtg cgagctgctt tatgattccg gagaccttcg attttatcgc ggagctgacc 660
gaaaaggcgc gtgcgctggg tattgaggtg ctggttgaaa tccacagcca ctaccgtaaa 720
cagatcgaaa ttgcgcgtca agtggactgg gtttatgatt ttgcgctgcc gccgctggtg 780
ctgcatgcgc tgtttgcgag cgacccgcac ccgctggcgc agtggctgag catcagcccg 840
cgtaacgcgg tgaccgttct ggacacccac gatggcatcg gtgtgattga tgttggtgcg 900
gatgcggaag gtaacccggg tctgctgagc ccggcggcga ttgacagcct ggttgagacc 960
atccacagcc gtagccaagg tcaaagccgt gaagcgaccg gtgcggcggc gaacaacctg 1020
gatctgtacc aagtgaactg caccttcctg gatgcgctgg gcggtcgtga accggattat 1080
ctgattgcgc gtgcgctgca gttctttgcg ccgggcatcc cgcaagtgta ctatgttggt 1140
ctgctgggcg gtaccaacga catggatctg ctgggtcgta gcggtgtggg tcgtgacatt 1200
aaccgtcact actataccga cgcggagatt gatgcggcgc tggcgcgtcc gctggtgcgt 1260
accctgatcg cgctgattcg tctgcgtaac acccacccgg cgttcgcggg tgaatttgat 1320
gtgagcgttc cggcggcgac ccagattcgt ctgcgttggc agcgtcaaga gcactggatc 1380
gaactgcacg ttgacctgag catcccgaag gcgagcatta ccggcaccgg tatccacccg 1440
atcaccattc cgggtgcggc ggatgcgggt gcgccgagc 1479
<210> 20
<211> 493
<212> PRT
<213> Artificial Sequence
<220>
<223> Sucrose phosphorylase from uncultured bacterium
<400> 20
Met Lys Asn Lys Val Gln Leu Ile Ala Tyr Val Asp Arg Ile Ser Gly
1 5 10 15
Gly Gly Phe Arg Lys Leu His Ala Leu Leu Thr Gly Pro Leu Ala Glu
20 25 30
Ile Phe Gly Gly Ala His Leu Leu Pro Phe Phe Thr Pro Ile Asp Gly
35 40 45
Ala Asp Ala Gly Phe Asp Pro Ser Asp His Thr Gln Val Asp Pro Arg
50 55 60
Leu Gly Thr Trp Asp Asp Val Arg Ile Leu Gly Gly Ala Ile Glu Leu
65 70 75 80
Val Ala Asp Leu Ile Val Asn His Val Ser Ser Ser Ser Pro Gln Phe
85 90 95
Ile Asp Tyr Ser Lys Lys Gly Ser Asp Ser Leu Tyr Ala Gly Met Phe
100 105 110
Leu Thr Tyr Asp Arg Val Phe Pro Glu Gly Ala Arg Glu Ala Asp Ile
115 120 125
Leu Arg Ile Tyr Arg Pro Arg Pro Thr Leu Pro Phe Ser Pro Val Thr
130 135 140
Leu Ser Ser Arg Glu Arg Lys Leu Leu Trp Thr Thr Phe Asn Pro Glu
145 150 155 160
Gln Val Asp Ile Asp Val Arg His Pro Glu Ala Glu Ala Tyr Leu His
165 170 175
Ser Ile Leu Lys Lys Phe Gln Ala Ala Gly Ile Arg Met Ile Arg Leu
180 185 190
Asp Ala Val Gly Tyr Ala Ile Lys Lys Pro Gly Ala Ser Cys Phe Met
195 200 205
Ile Pro Glu Thr Phe Asp Phe Ile Ala Glu Leu Thr Glu Lys Ala Arg
210 215 220
Ala Leu Gly Ile Glu Val Leu Val Glu Ile His Ser His Tyr Arg Lys
225 230 235 240
Gln Ile Glu Ile Ala Arg Gln Val Asp Trp Val Tyr Asp Phe Ala Leu
245 250 255
Pro Pro Leu Val Leu His Ala Leu Phe Ala Ser Asp Pro His Pro Leu
260 265 270
Ala Gln Trp Leu Ser Ile Ser Pro Arg Asn Ala Val Thr Val Leu Asp
275 280 285
Thr His Asp Gly Ile Gly Val Ile Asp Val Gly Ala Asp Ala Glu Gly
290 295 300
Asn Pro Gly Leu Leu Ser Pro Ala Ala Ile Asp Ser Leu Val Glu Thr
305 310 315 320
Ile His Ser Arg Ser Gln Gly Gln Ser Arg Glu Ala Thr Gly Ala Ala
325 330 335
Ala Asn Asn Leu Asp Leu Tyr Gln Val Asn Cys Thr Phe Leu Asp Ala
340 345 350
Leu Gly Gly Arg Glu Pro Asp Tyr Leu Ile Ala Arg Ala Leu Gln Phe
355 360 365
Phe Ala Pro Gly Ile Pro Gln Val Tyr Tyr Val Gly Leu Leu Gly Gly
370 375 380
Thr Asn Asp Met Asp Leu Leu Gly Arg Ser Gly Val Gly Arg Asp Ile
385 390 395 400
Asn Arg His Tyr Tyr Thr Asp Ala Glu Ile Asp Ala Ala Leu Ala Arg
405 410 415
Pro Leu Val Arg Thr Leu Ile Ala Leu Ile Arg Leu Arg Asn Thr His
420 425 430
Pro Ala Phe Ala Gly Glu Phe Asp Val Ser Val Pro Ala Ala Thr Gln
435 440 445
Ile Arg Leu Arg Trp Gln Arg Gln Glu His Trp Ile Glu Leu His Val
450 455 460
Asp Leu Ser Ile Pro Lys Ala Ser Ile Thr Gly Thr Gly Ile His Pro
465 470 475 480
Ile Thr Ile Pro Gly Ala Ala Asp Ala Gly Ala Pro Ser
485 490
<210> 21
<211> 1467
<212> DNA
<213> Artificial Sequence
<220>
<223> Sucrose phosphorylase from Oenococcus
<400> 21
atgccggtga agaacaaagc gatgctgatc acctacagcg atagcatggg taaaaacatc 60
aaggaactgc agtacattct ggacaaatat atcggcgatg cgattggtgg cgttcacctg 120
ctgccgttct ttccgagcac cggtgatcgt ggcttcgcgc cgagcgacta tacccgtgtg 180
aacccggact ttggtgattg ggaggacgtt gaggaactgg gcaagaaata ctatctgatg 240
ttcgacttta tgatcaacca cattagccgt gaaagcatta tgtaccagga cttcaaagag 300
aagaaagatg cgagcagcta taaggacttc tttatccgtt gggaaaaatt ttggccgaag 360
ggtcgtccga ccaaggcgga catcgatctg atttacaagc gtaaagataa ggcgccgatc 420
cagggtatta ccttcgcgga cggcagccaa gaacacctgt ggaacacctt tggtgacgag 480
caaatcgata ttaacgtgaa aagcaaggtt gcgcaggagt tctttaaaga taccctgcaa 540
agcatggtga agcacggcgc ggacctgatt cgtctggatg cgttcgcgta cgcgatcaag 600
aaaattgata ccaacgactt ctttatcgaa ccggagattt gggatctgct ggaaagcgtt 660
cgtaaaattc tggacccgct gcatgcggag atcctgccgg aaatttacga gcactatacc 720
atcccggcga agattaacga atacggttat ttcacctacg actttgtgct gccgctggtt 780
atcctgtaca ccctgtatag cggcaacccg aaacagctgg cgaaatggct gaagatgagc 840
ccgaagaaac aattcaccac cctggatacc cacgacggta tcggcgtggt tgatgcgcgt 900
gacatcctga ccgacgagga aattgattac accagcagcg agctgtataa agtgggtgcg 960
aacgttaagc gtacctacag cagcgcggcg tataacaacc tggacatcta ccagattaac 1020
agcacctact atagcgcgct gggtaacgac gataaagcgt atctgctggc gcgtgcgatc 1080
cagatttttg cgccgggcat cccgcaaatt tactatgcgg gtctgctggc gggcgaaaac 1140
gacctggatc tgctggaaaa aaccaaagag ggtcgtaaca ttaaccgtca ctactatagc 1200
gaggaagagg tggcgaacga ggttcaacgt ccgatcgttg cgtgcctgct gaagctgctg 1260
gcgtggcgta accgtagcgc ggcgttcgac ctgcagggtg atattcaagt tagcgcgacc 1320
gataaaaacg aaatcaagat cattcgtacc agcaccaacg gtcaagacac cgcggagctg 1380
accgcgaacg tggcgctgaa aacctttacc atcaaagaaa acgacaagat cattctgatt 1440
gaggatcaaa ccgacaccaa ggatatc 1467
<210> 22
<211> 489
<212> PRT
<213> Artificial Sequence
<220>
<223> Sucrose phosphorylase from Oenococcus
<400> 22
Met Pro Val Lys Asn Lys Ala Met Leu Ile Thr Tyr Ser Asp Ser Met
1 5 10 15
Gly Lys Asn Ile Lys Glu Leu Gln Tyr Ile Leu Asp Lys Tyr Ile Gly
20 25 30
Asp Ala Ile Gly Gly Val His Leu Leu Pro Phe Phe Pro Ser Thr Gly
35 40 45
Asp Arg Gly Phe Ala Pro Ser Asp Tyr Thr Arg Val Asn Pro Asp Phe
50 55 60
Gly Asp Trp Glu Asp Val Glu Glu Leu Gly Lys Lys Tyr Tyr Leu Met
65 70 75 80
Phe Asp Phe Met Ile Asn His Ile Ser Arg Glu Ser Ile Met Tyr Gln
85 90 95
Asp Phe Lys Glu Lys Lys Asp Ala Ser Ser Tyr Lys Asp Phe Phe Ile
100 105 110
Arg Trp Glu Lys Phe Trp Pro Lys Gly Arg Pro Thr Lys Ala Asp Ile
115 120 125
Asp Leu Ile Tyr Lys Arg Lys Asp Lys Ala Pro Ile Gln Gly Ile Thr
130 135 140
Phe Ala Asp Gly Ser Gln Glu His Leu Trp Asn Thr Phe Gly Asp Glu
145 150 155 160
Gln Ile Asp Ile Asn Val Lys Ser Lys Val Ala Gln Glu Phe Phe Lys
165 170 175
Asp Thr Leu Gln Ser Met Val Lys His Gly Ala Asp Leu Ile Arg Leu
180 185 190
Asp Ala Phe Ala Tyr Ala Ile Lys Lys Ile Asp Thr Asn Asp Phe Phe
195 200 205
Ile Glu Pro Glu Ile Trp Asp Leu Leu Glu Ser Val Arg Lys Ile Leu
210 215 220
Asp Pro Leu His Ala Glu Ile Leu Pro Glu Ile Tyr Glu His Tyr Thr
225 230 235 240
Ile Pro Ala Lys Ile Asn Glu Tyr Gly Tyr Phe Thr Tyr Asp Phe Val
245 250 255
Leu Pro Leu Val Ile Leu Tyr Thr Leu Tyr Ser Gly Asn Pro Lys Gln
260 265 270
Leu Ala Lys Trp Leu Lys Met Ser Pro Lys Lys Gln Phe Thr Thr Leu
275 280 285
Asp Thr His Asp Gly Ile Gly Val Val Asp Ala Arg Asp Ile Leu Thr
290 295 300
Asp Glu Glu Ile Asp Tyr Thr Ser Ser Glu Leu Tyr Lys Val Gly Ala
305 310 315 320
Asn Val Lys Arg Thr Tyr Ser Ser Ala Ala Tyr Asn Asn Leu Asp Ile
325 330 335
Tyr Gln Ile Asn Ser Thr Tyr Tyr Ser Ala Leu Gly Asn Asp Asp Lys
340 345 350
Ala Tyr Leu Leu Ala Arg Ala Ile Gln Ile Phe Ala Pro Gly Ile Pro
355 360 365
Gln Ile Tyr Tyr Ala Gly Leu Leu Ala Gly Glu Asn Asp Leu Asp Leu
370 375 380
Leu Glu Lys Thr Lys Glu Gly Arg Asn Ile Asn Arg His Tyr Tyr Ser
385 390 395 400
Glu Glu Glu Val Ala Asn Glu Val Gln Arg Pro Ile Val Ala Cys Leu
405 410 415
Leu Lys Leu Leu Ala Trp Arg Asn Arg Ser Ala Ala Phe Asp Leu Gln
420 425 430
Gly Asp Ile Gln Val Ser Ala Thr Asp Lys Asn Glu Ile Lys Ile Ile
435 440 445
Arg Thr Ser Thr Asn Gly Gln Asp Thr Ala Glu Leu Thr Ala Asn Val
450 455 460
Ala Leu Lys Thr Phe Thr Ile Lys Glu Asn Asp Lys Ile Ile Leu Ile
465 470 475 480
Glu Asp Gln Thr Asp Thr Lys Asp Ile
485
<210> 23
<211> 1446
<212> DNA
<213> Artificial Sequence
<220>
<223> Sucrose phosphorylase from Enterococcus
<400> 23
atgaagatta aaaacgaggc gatgctgatc acctactgcg acagcctggg taacaacctg 60
aaagacctga accaggtgct ggatcagcac ctgcaaggcg tggttggtgg catccacctg 120
ctgccgttct ttccgagcac cggtgatcgt ggcttcgcgc cgagcgacta taccgtggtt 180
gatagcgcgt ttggtacctg gcaagaggtt gaagcgctgg gcgagaagta ctacctgatg 240
ttcgacttca tgatcaacca catcagccgt gaaagcaaat tctttcagga tttcaagcaa 300
aaccacgagg cgagcccgta caaggaaatg tttattcgta tccacgagtt ctttccggaa 360
aaccgtccga ccccggagga cattgatctg atctataagc gtaaagacaa ggcgccgttc 420
caggaagtga cctttgcgga tggtaccacc gaacaggttt ggaacacctt cggcgaggaa 480
caaattgacc tggatgtgaa caaagaagtt accaagcaat tcatcaagga caccctgaag 540
gatatggcga gccacggttg cagcctgatt cgtctggacg cgttcgcgta cgcgatcaag 600
aaactggaca ccaacgattt ctttgtggag ccggaaattt gggacctgct ggatgaggtt 660
cgtgaggaag cggcgaaata caactgcgaa ctgctgccgg agatccacga acactatacc 720
attcagatga agatcgcgga ccacgattac tatgtgtacg acttcgcgct gccgatgatc 780
accctgtaca gcctgtatag cggtaaaacc aaccgtctgg cgaactggct gaaaatgagc 840
ccgatgaagc aatttaccac cctggacacc cacgatggta ttggcgtggt tgacgcgaaa 900
gatctgctga ccgacgagga actggattac accagcgagg aactgtataa agtgggcgcg 960
aacgttaaga aaatctacag cagcgcgagc tataacaacc tggacattta ccagatcaac 1020
agcacctact atagcgcgct gggtgacaac gatcgtagct atctgctggc gcgtgcgatt 1080
cagtgctttg cgccgggcat tccgcaaatc tactatgtgg gtctgctggc gggcaaaaac 1140
gacctggagc tgctggaaag caccaaagag ggtcgtaaca ttaaccgtca ctactatagc 1200
ctgaccgaaa tcgatgagga agttaaccgt ccggtggtta aggcgctgtt cgacctgctg 1260
cgttttcgta accgtgcggc ggcgtttgat ctggcgggcg agatcaccgt ggaaaccccg 1320
agcgaggaaa ccatcattat cacccgtaaa gacgcgaacg gtgatcgtgc ggttctgacc 1380
gcgaacctgc agaccaagga ctttaccgtg acccacaacg gcgaactggt tctgcagcaa 1440
ctggat 1446
<210> 24
<211> 482
<212> PRT
<213> Artificial Sequence
<220>
<223> Sucrose phosphorylase from Enterococcus
<400> 24
Met Lys Ile Lys Asn Glu Ala Met Leu Ile Thr Tyr Cys Asp Ser Leu
1 5 10 15
Gly Asn Asn Leu Lys Asp Leu Asn Gln Val Leu Asp Gln His Leu Gln
20 25 30
Gly Val Val Gly Gly Ile His Leu Leu Pro Phe Phe Pro Ser Thr Gly
35 40 45
Asp Arg Gly Phe Ala Pro Ser Asp Tyr Thr Val Val Asp Ser Ala Phe
50 55 60
Gly Thr Trp Gln Glu Val Glu Ala Leu Gly Glu Lys Tyr Tyr Leu Met
65 70 75 80
Phe Asp Phe Met Ile Asn His Ile Ser Arg Glu Ser Lys Phe Phe Gln
85 90 95
Asp Phe Lys Gln Asn His Glu Ala Ser Pro Tyr Lys Glu Met Phe Ile
100 105 110
Arg Ile His Glu Phe Phe Pro Glu Asn Arg Pro Thr Pro Glu Asp Ile
115 120 125
Asp Leu Ile Tyr Lys Arg Lys Asp Lys Ala Pro Phe Gln Glu Val Thr
130 135 140
Phe Ala Asp Gly Thr Thr Glu Gln Val Trp Asn Thr Phe Gly Glu Glu
145 150 155 160
Gln Ile Asp Leu Asp Val Asn Lys Glu Val Thr Lys Gln Phe Ile Lys
165 170 175
Asp Thr Leu Lys Asp Met Ala Ser His Gly Cys Ser Leu Ile Arg Leu
180 185 190
Asp Ala Phe Ala Tyr Ala Ile Lys Lys Leu Asp Thr Asn Asp Phe Phe
195 200 205
Val Glu Pro Glu Ile Trp Asp Leu Leu Asp Glu Val Arg Glu Glu Ala
210 215 220
Ala Lys Tyr Asn Cys Glu Leu Leu Pro Glu Ile His Glu His Tyr Thr
225 230 235 240
Ile Gln Met Lys Ile Ala Asp His Asp Tyr Tyr Val Tyr Asp Phe Ala
245 250 255
Leu Pro Met Ile Thr Leu Tyr Ser Leu Tyr Ser Gly Lys Thr Asn Arg
260 265 270
Leu Ala Asn Trp Leu Lys Met Ser Pro Met Lys Gln Phe Thr Thr Leu
275 280 285
Asp Thr His Asp Gly Ile Gly Val Val Asp Ala Lys Asp Leu Leu Thr
290 295 300
Asp Glu Glu Leu Asp Tyr Thr Ser Glu Glu Leu Tyr Lys Val Gly Ala
305 310 315 320
Asn Val Lys Lys Ile Tyr Ser Ser Ala Ser Tyr Asn Asn Leu Asp Ile
325 330 335
Tyr Gln Ile Asn Ser Thr Tyr Tyr Ser Ala Leu Gly Asp Asn Asp Arg
340 345 350
Ser Tyr Leu Leu Ala Arg Ala Ile Gln Cys Phe Ala Pro Gly Ile Pro
355 360 365
Gln Ile Tyr Tyr Val Gly Leu Leu Ala Gly Lys Asn Asp Leu Glu Leu
370 375 380
Leu Glu Ser Thr Lys Glu Gly Arg Asn Ile Asn Arg His Tyr Tyr Ser
385 390 395 400
Leu Thr Glu Ile Asp Glu Glu Val Asn Arg Pro Val Val Lys Ala Leu
405 410 415
Phe Asp Leu Leu Arg Phe Arg Asn Arg Ala Ala Ala Phe Asp Leu Ala
420 425 430
Gly Glu Ile Thr Val Glu Thr Pro Ser Glu Glu Thr Ile Ile Ile Thr
435 440 445
Arg Lys Asp Ala Asn Gly Asp Arg Ala Val Leu Thr Ala Asn Leu Gln
450 455 460
Thr Lys Asp Phe Thr Val Thr His Asn Gly Glu Leu Val Leu Gln Gln
465 470 475 480
Leu Asp
<210> 25
<211> 1440
<212> DNA
<213> Artificial Sequence
<220>
<223> Sucrose phosphorylase from Streptococcus
<400> 25
atgagcatcc agaacaagac catgctgatt acctacagcg atagcctggg taacaacctg 60
aaggacctgt acgagaacct ggaaaaatat ttcggcgatg cggtgggtgg cgttcacctg 120
ctgccgttct ttccgagcac cggtgatcgt ggcttcgcgc cggtggatta tgaccaggtt 180
gacccggcgt ttggtgattg ggaggacgtg aagcgtctgg gcgataagta ctacctgatg 240
ttcgacttca tgatcaacca cattagccgt caaagcaagt actataaaaa ctaccaggag 300
aagcacgacc aaagcgcgta taaagacctg ttcctgaact gggacaagtt ttggccggaa 360
aaccgtccga cccaggcgga tgttgacctg atctacaagc gtaaagatcg tgcgccgaaa 420
caagagatta ccttcgcgga cggtaccacc gaacacctgt ggaacacctt tggcgaggaa 480
caaatcgatc tggacgtgac caaagaggtg accatggact tcatccgtaa aaccattgaa 540
cacctggtta gcaacggttg cgacctgatt cgtctggatg cgtttgcgta cgcggtgaag 600
aaactggata ccaacgactt ctttgttgag ccggatatct gggacctgct ggataaggtt 660
cgtgatatgg cggcgagcta cggcgcggaa ctgctgccgg agattcacga acactatagc 720
atccagttca aaattgcgga tcacgactac tatgtgtacg actttgcgct gccgatggtt 780
accctgtaca ccctgtatag cagcaaggtg gagcgtctgg cgaagtggct gaaaatgagc 840
ccgatgaaac aattcaccac cctggacacc cacgatggta tcggcgtggt tgacgttaag 900
gatatcctga ccgacgagga aattgattac gcgagcaacg agctgtataa agtgggtgcg 960
aacgttaagc gtaaatacag caccgcggaa tataacaacc tggatatcta ccagattaac 1020
agcacctact atagcgcgct gggtgacgat gacagcaagt atttcctggc gcgtctgatc 1080
caggcgtttg cgccgggcat tccgcaagtg tactatgttg gttttctggc gggcaagaac 1140
gacctggagc tgctggaaaa caccaaagaa ggtcgtaaca tcaaccgtca ctactatagc 1200
aacgaggaaa ttgcgcagga agtggaacgt ccggtggtta agagcctgct gaaactgttc 1260
agctttcgta acaacagcca agcgttcgat ctggagggca gcatcgaggt ggaaaccccg 1320
gacgaacaca ccatcgttat tacccgtcag aacaaagacc aaaccgcgac cgcggtggcg 1380
cgtatcaacc tggcggatgg tacctaccag gttaccgaga acggccaaga cattgaattt 1440
<210> 26
<211> 480
<212> PRT
<213> Artificial Sequence
<220>
<223> Sucrose phosphorylase from Streptococcus
<400> 26
Met Ser Ile Gln Asn Lys Thr Met Leu Ile Thr Tyr Ser Asp Ser Leu
1 5 10 15
Gly Asn Asn Leu Lys Asp Leu Tyr Glu Asn Leu Glu Lys Tyr Phe Gly
20 25 30
Asp Ala Val Gly Gly Val His Leu Leu Pro Phe Phe Pro Ser Thr Gly
35 40 45
Asp Arg Gly Phe Ala Pro Val Asp Tyr Asp Gln Val Asp Pro Ala Phe
50 55 60
Gly Asp Trp Glu Asp Val Lys Arg Leu Gly Asp Lys Tyr Tyr Leu Met
65 70 75 80
Phe Asp Phe Met Ile Asn His Ile Ser Arg Gln Ser Lys Tyr Tyr Lys
85 90 95
Asn Tyr Gln Glu Lys His Asp Gln Ser Ala Tyr Lys Asp Leu Phe Leu
100 105 110
Asn Trp Asp Lys Phe Trp Pro Glu Asn Arg Pro Thr Gln Ala Asp Val
115 120 125
Asp Leu Ile Tyr Lys Arg Lys Asp Arg Ala Pro Lys Gln Glu Ile Thr
130 135 140
Phe Ala Asp Gly Thr Thr Glu His Leu Trp Asn Thr Phe Gly Glu Glu
145 150 155 160
Gln Ile Asp Leu Asp Val Thr Lys Glu Val Thr Met Asp Phe Ile Arg
165 170 175
Lys Thr Ile Glu His Leu Val Ser Asn Gly Cys Asp Leu Ile Arg Leu
180 185 190
Asp Ala Phe Ala Tyr Ala Val Lys Lys Leu Asp Thr Asn Asp Phe Phe
195 200 205
Val Glu Pro Asp Ile Trp Asp Leu Leu Asp Lys Val Arg Asp Met Ala
210 215 220
Ala Ser Tyr Gly Ala Glu Leu Leu Pro Glu Ile His Glu His Tyr Ser
225 230 235 240
Ile Gln Phe Lys Ile Ala Asp His Asp Tyr Tyr Val Tyr Asp Phe Ala
245 250 255
Leu Pro Met Val Thr Leu Tyr Thr Leu Tyr Ser Ser Lys Val Glu Arg
260 265 270
Leu Ala Lys Trp Leu Lys Met Ser Pro Met Lys Gln Phe Thr Thr Leu
275 280 285
Asp Thr His Asp Gly Ile Gly Val Val Asp Val Lys Asp Ile Leu Thr
290 295 300
Asp Glu Glu Ile Asp Tyr Ala Ser Asn Glu Leu Tyr Lys Val Gly Ala
305 310 315 320
Asn Val Lys Arg Lys Tyr Ser Thr Ala Glu Tyr Asn Asn Leu Asp Ile
325 330 335
Tyr Gln Ile Asn Ser Thr Tyr Tyr Ser Ala Leu Gly Asp Asp Asp Ser
340 345 350
Lys Tyr Phe Leu Ala Arg Leu Ile Gln Ala Phe Ala Pro Gly Ile Pro
355 360 365
Gln Val Tyr Tyr Val Gly Phe Leu Ala Gly Lys Asn Asp Leu Glu Leu
370 375 380
Leu Glu Asn Thr Lys Glu Gly Arg Asn Ile Asn Arg His Tyr Tyr Ser
385 390 395 400
Asn Glu Glu Ile Ala Gln Glu Val Glu Arg Pro Val Val Lys Ser Leu
405 410 415
Leu Lys Leu Phe Ser Phe Arg Asn Asn Ser Gln Ala Phe Asp Leu Glu
420 425 430
Gly Ser Ile Glu Val Glu Thr Pro Asp Glu His Thr Ile Val Ile Thr
435 440 445
Arg Gln Asn Lys Asp Gln Thr Ala Thr Ala Val Ala Arg Ile Asn Leu
450 455 460
Ala Asp Gly Thr Tyr Gln Val Thr Glu Asn Gly Gln Asp Ile Glu Phe
465 470 475 480
<210> 27
<211> 1509
<212> DNA
<213> Artificial Sequence
<220>
<223> Sucrose phosphorylase from Scardovia
<400> 27
atgaagaaca aagttcagct gattacctac gcggatcgtc tgggtgaagg taccctggcg 60
agcctgaccg atgtgctgcg tacccgtttc gatggcgttt atgaaggtgt gcacattctg 120
ccgttcttta ccccgttcga cggcgcggat gcgggttttg acccgatcga tcacaccaag 180
gttgacccgc gtctgggtag ctgggacgat gtggcggagc tgagcaaaac ccacgacatc 240
atggttgatg cgattgtgaa ccacatgagc tggcaaagcg aacagtttca agatgttatg 300
aagaaaggtg aaggcagcga atactatccg atgttcctga ccatgagcgc ggtgtttccg 360
gagggtgcga ccgaggaaga cctggcgggt atttatcgtc cgcgtccggg tctgccgttc 420
acccactata cctggggtgg caagacccgt ctggtttgga ccacctttac cccgcagcaa 480
gtggacatcg ataccgcgag cgacgaaggt tgggcgtacc tgatgagcat cctggatcag 540
atgagcaaaa gccacgttag cttcattcgt ctggacgcgg tgggttatgg cgcgaagcgt 600
gcgaaaacca gctgcttcat gaccccggac acctttgatc tgatcagccg tattaaagag 660
gagagcgcgc gtcgtggcat ggagaccctg atcgaagttc acagctacta taagaaacaa 720
gtggagattg cgaacaaggt ggaccgtgtt tacgattttg cgatcccggc gctgctgctg 780
catgcgctga gcaccggtaa aaccggtccg ctggcgcact ggctgggtgt gcgtccggtt 840
aacgcggtga acgttctgga cacccacgat ggtatcggcg tgattgatgt tggcagcgac 900
cagatggatc gtagcctgaa gggtctggtt ccggacgatg aagttgacca actggtggag 960
accattaaag aaaacagcca tggtgaaagc gcggaagcga ccggtgcggc ggcgagcaac 1020
ctggatctgt accaggttaa ctgcacctac tatagcgcgc tgggctgcga cgatcaaaaa 1080
tacatcgcga gccgtgcggt gcagttctat atgccgggtg tgccgcaagt ttactatgtg 1140
ggcgcgctgg cgggcaagaa cgacatggag ctgctgaaac gtaccaacgt tggtcgtgat 1200
atcaaccgtc actactatac cgtggcggag attgacgaaa acctgcgtcg tccggtggtt 1260
caggcgctga acgcgctggg ccgtttccgt aacaccctgg aggcgtttga cggtgatttc 1320
agctttaccg aaaacggtgg cagcctggcg atgacctgga ccggtcaaag caccagcacc 1380
accctgacct ttgcgccggg caagggtgcg ggtagcagcg gcgtgccggt ttgcaccatc 1440
gcgtggaaag acgcgagcgg tgaacacgtg accgacgata tcattgcgaa cccgccggcg 1500
gcggcgcag 1509
<210> 28
<211> 503
<212> PRT
<213> Artificial Sequence
<220>
<223> Sucrose phosphorylase from Scardovia
<400> 28
Met Lys Asn Lys Val Gln Leu Ile Thr Tyr Ala Asp Arg Leu Gly Glu
1 5 10 15
Gly Thr Leu Ala Ser Leu Thr Asp Val Leu Arg Thr Arg Phe Asp Gly
20 25 30
Val Tyr Glu Gly Val His Ile Leu Pro Phe Phe Thr Pro Phe Asp Gly
35 40 45
Ala Asp Ala Gly Phe Asp Pro Ile Asp His Thr Lys Val Asp Pro Arg
50 55 60
Leu Gly Ser Trp Asp Asp Val Ala Glu Leu Ser Lys Thr His Asp Ile
65 70 75 80
Met Val Asp Ala Ile Val Asn His Met Ser Trp Gln Ser Glu Gln Phe
85 90 95
Gln Asp Val Met Lys Lys Gly Glu Gly Ser Glu Tyr Tyr Pro Met Phe
100 105 110
Leu Thr Met Ser Ala Val Phe Pro Glu Gly Ala Thr Glu Glu Asp Leu
115 120 125
Ala Gly Ile Tyr Arg Pro Arg Pro Gly Leu Pro Phe Thr His Tyr Thr
130 135 140
Trp Gly Gly Lys Thr Arg Leu Val Trp Thr Thr Phe Thr Pro Gln Gln
145 150 155 160
Val Asp Ile Asp Thr Ala Ser Asp Glu Gly Trp Ala Tyr Leu Met Ser
165 170 175
Ile Leu Asp Gln Met Ser Lys Ser His Val Ser Phe Ile Arg Leu Asp
180 185 190
Ala Val Gly Tyr Gly Ala Lys Arg Ala Lys Thr Ser Cys Phe Met Thr
195 200 205
Pro Asp Thr Phe Asp Leu Ile Ser Arg Ile Lys Glu Glu Ser Ala Arg
210 215 220
Arg Gly Met Glu Thr Leu Ile Glu Val His Ser Tyr Tyr Lys Lys Gln
225 230 235 240
Val Glu Ile Ala Asn Lys Val Asp Arg Val Tyr Asp Phe Ala Ile Pro
245 250 255
Ala Leu Leu Leu His Ala Leu Ser Thr Gly Lys Thr Gly Pro Leu Ala
260 265 270
His Trp Leu Gly Val Arg Pro Val Asn Ala Val Asn Val Leu Asp Thr
275 280 285
His Asp Gly Ile Gly Val Ile Asp Val Gly Ser Asp Gln Met Asp Arg
290 295 300
Ser Leu Lys Gly Leu Val Pro Asp Asp Glu Val Asp Gln Leu Val Glu
305 310 315 320
Thr Ile Lys Glu Asn Ser His Gly Glu Ser Ala Glu Ala Thr Gly Ala
325 330 335
Ala Ala Ser Asn Leu Asp Leu Tyr Gln Val Asn Cys Thr Tyr Tyr Ser
340 345 350
Ala Leu Gly Cys Asp Asp Gln Lys Tyr Ile Ala Ser Arg Ala Val Gln
355 360 365
Phe Tyr Met Pro Gly Val Pro Gln Val Tyr Tyr Val Gly Ala Leu Ala
370 375 380
Gly Lys Asn Asp Met Glu Leu Leu Lys Arg Thr Asn Val Gly Arg Asp
385 390 395 400
Ile Asn Arg His Tyr Tyr Thr Val Ala Glu Ile Asp Glu Asn Leu Arg
405 410 415
Arg Pro Val Val Gln Ala Leu Asn Ala Leu Gly Arg Phe Arg Asn Thr
420 425 430
Leu Glu Ala Phe Asp Gly Asp Phe Ser Phe Thr Glu Asn Gly Gly Ser
435 440 445
Leu Ala Met Thr Trp Thr Gly Gln Ser Thr Ser Thr Thr Leu Thr Phe
450 455 460
Ala Pro Gly Lys Gly Ala Gly Ser Ser Gly Val Pro Val Cys Thr Ile
465 470 475 480
Ala Trp Lys Asp Ala Ser Gly Glu His Val Thr Asp Asp Ile Ile Ala
485 490 495
Asn Pro Pro Ala Ala Ala Gln
500
<210> 29
<211> 1506
<212> DNA
<213> Artificial Sequence
<220>
<223> Sucrose phosphorylase from Parascardovia
<400> 29
atgaagaaca aagttcagct gatcacctac gcgaaccgtt tcggcgaggg caccattcgt 60
agcctgaccg acgtgctgcg tacccgtttt gatggtgttt acgaaggcgt gcacattctg 120
ccgttcttta ccccgttcga cggtgcggat gcgggctttg acccgattga tcacaccaag 180
gttgatccgc gtctgggtac ctgggacgat atcgcggagc tgagcaaaac ccacgacatc 240
atggttgatg cgattgtgaa ccacatgagc tgggagagca agcagttcca agacgttatg 300
aaaaacggtg aagcgagccc gtactatggc atgttcctga ccatgagcgc ggtgtttccg 360
gatggtgcga ccgaggaaga tctggcgggt atctatcgtc cgcgtccggg tctgccgttc 420
acccactata actggggtgg caagacccgt ctggtttgga ccacctttac cccgcagcaa 480
gtggacatca acaccgatag cattgaaggc tgggactacc tgatgagcat cctggatcag 540
atgagccaaa gccacgttag cttcattcgt ctggacgcgg tgggttatgg cgcgaagcag 600
gcgaaaacca cctgcttcat gaccccgaag acctttgagc tgatcggtcg tattaaagag 660
gagagcgcga aacgtggcat ggagaccctg atcgaagttc acagccacta catgaagcaa 720
gtggaaattg cgggtaaagt ggaccgtgtt tatgattttg cgattccggg tctgctgctg 780
catgcgctga ccaccggtaa aaccggtccg ctggcgcgtt ggatggaagt gcgtccgggt 840
aacgcggtga acgttctgga cacccacgat ggtattggcg ttatcgatat tggtagcgac 900
cagatggatc gtagcctgaa gggtctggtg ccggacgagg aagttgatca actggtggag 960
accatcaaag aaaacagcca cggtgaaagc gcggcggcga ccggcgcggc ggcgagcaac 1020
ctggacctgt accaggttaa ctgcacctac tatagcgcgc tgggttgcga cgatcaaaaa 1080
tatattgcgg cgcgtgcggt gcagttcttt atgccgggcg tgccgcaagt ttactatgtg 1140
ggtgcgctgg cgggcgagaa cgacatgcag ctgctgaagg aaaccaacgt tggtcgtgat 1200
atcaaccgtc actactatag cctggaggaa attgaccaaa acctggagcg tccggtggtt 1260
aaagcgctga acgcgctgtg ccgtttccgt aacggtctgg aagcgtttga cggcgatttc 1320
agctttgcgc agaacggtga tagcctgacc ttcgcgtgga ccggcaagga gaccgaagcg 1380
accctgacct ttaccccggc gcaaggtgtt ggcaaagatg aggcgccggt gtgcagcctg 1440
cgttggaagg acagcgcggg tgatcacaaa accgatgatc tgattgcgga accgccggcg 1500
gtggcg 1506
<210> 30
<211> 502
<212> PRT
<213> Artificial Sequence
<220>
<223> Sucrose phosphorylase from Parascardovia
<400> 30
Met Lys Asn Lys Val Gln Leu Ile Thr Tyr Ala Asn Arg Phe Gly Glu
1 5 10 15
Gly Thr Ile Arg Ser Leu Thr Asp Val Leu Arg Thr Arg Phe Asp Gly
20 25 30
Val Tyr Glu Gly Val His Ile Leu Pro Phe Phe Thr Pro Phe Asp Gly
35 40 45
Ala Asp Ala Gly Phe Asp Pro Ile Asp His Thr Lys Val Asp Pro Arg
50 55 60
Leu Gly Thr Trp Asp Asp Ile Ala Glu Leu Ser Lys Thr His Asp Ile
65 70 75 80
Met Val Asp Ala Ile Val Asn His Met Ser Trp Glu Ser Lys Gln Phe
85 90 95
Gln Asp Val Met Lys Asn Gly Glu Ala Ser Pro Tyr Tyr Gly Met Phe
100 105 110
Leu Thr Met Ser Ala Val Phe Pro Asp Gly Ala Thr Glu Glu Asp Leu
115 120 125
Ala Gly Ile Tyr Arg Pro Arg Pro Gly Leu Pro Phe Thr His Tyr Asn
130 135 140
Trp Gly Gly Lys Thr Arg Leu Val Trp Thr Thr Phe Thr Pro Gln Gln
145 150 155 160
Val Asp Ile Asn Thr Asp Ser Ile Glu Gly Trp Asp Tyr Leu Met Ser
165 170 175
Ile Leu Asp Gln Met Ser Gln Ser His Val Ser Phe Ile Arg Leu Asp
180 185 190
Ala Val Gly Tyr Gly Ala Lys Gln Ala Lys Thr Thr Cys Phe Met Thr
195 200 205
Pro Lys Thr Phe Glu Leu Ile Gly Arg Ile Lys Glu Glu Ser Ala Lys
210 215 220
Arg Gly Met Glu Thr Leu Ile Glu Val His Ser His Tyr Met Lys Gln
225 230 235 240
Val Glu Ile Ala Gly Lys Val Asp Arg Val Tyr Asp Phe Ala Ile Pro
245 250 255
Gly Leu Leu Leu His Ala Leu Thr Thr Gly Lys Thr Gly Pro Leu Ala
260 265 270
Arg Trp Met Glu Val Arg Pro Gly Asn Ala Val Asn Val Leu Asp Thr
275 280 285
His Asp Gly Ile Gly Val Ile Asp Ile Gly Ser Asp Gln Met Asp Arg
290 295 300
Ser Leu Lys Gly Leu Val Pro Asp Glu Glu Val Asp Gln Leu Val Glu
305 310 315 320
Thr Ile Lys Glu Asn Ser His Gly Glu Ser Ala Ala Ala Thr Gly Ala
325 330 335
Ala Ala Ser Asn Leu Asp Leu Tyr Gln Val Asn Cys Thr Tyr Tyr Ser
340 345 350
Ala Leu Gly Cys Asp Asp Gln Lys Tyr Ile Ala Ala Arg Ala Val Gln
355 360 365
Phe Phe Met Pro Gly Val Pro Gln Val Tyr Tyr Val Gly Ala Leu Ala
370 375 380
Gly Glu Asn Asp Met Gln Leu Leu Lys Glu Thr Asn Val Gly Arg Asp
385 390 395 400
Ile Asn Arg His Tyr Tyr Ser Leu Glu Glu Ile Asp Gln Asn Leu Glu
405 410 415
Arg Pro Val Val Lys Ala Leu Asn Ala Leu Cys Arg Phe Arg Asn Gly
420 425 430
Leu Glu Ala Phe Asp Gly Asp Phe Ser Phe Ala Gln Asn Gly Asp Ser
435 440 445
Leu Thr Phe Ala Trp Thr Gly Lys Glu Thr Glu Ala Thr Leu Thr Phe
450 455 460
Thr Pro Ala Gln Gly Val Gly Lys Asp Glu Ala Pro Val Cys Ser Leu
465 470 475 480
Arg Trp Lys Asp Ser Ala Gly Asp His Lys Thr Asp Asp Leu Ile Ala
485 490 495
Glu Pro Pro Ala Val Ala
500
<210> 31
<211> 1500
<212> DNA
<213> Artificial Sequence
<220>
<223> Sucrose phosphorylase from Alloscardovia
<400> 31
atgaagaaca aagttcaact gattacctac gcggatcgtc tgggtgacgg caccctgaag 60
agcatgaccg agaccctgcg taaacacttc gagggtgttt atgaaggcgt gcacatcctg 120
ccgttcttta ccccgttcga tggtgcggac gcgggctttg atccggttga ccacaccaaa 180
gtggacccgc gtctgggtag ctgggacgat gtggcggaac tgagcaccac ccacgatatc 240
atggttgaca ccattgtgaa ccacatgagc tgggagagcg aacagttcca agatgttatg 300
gcgaagggcg aggacagcga atactatccg atgttcctga ccatgagcag catttttccg 360
gatggtgtga ccgaggaaga cctgaccgcg atctatcgtc cgcgtccggg tctgccgttc 420
acccactata actggggtgg caaaacccgt ctggtttgga ccacctttac cccgcagcaa 480
gtggacattg ataccgacag cgagatgggt tggaactacc tgctgagcat cctggatcag 540
ctgagccaaa gccacgttag ccaaattcgt ctggacgcgg tgggttatgg cgcgaaggag 600
aaaaacagca gctgcttcat gaccccgaag acctttaaac tgatcgaacg tattaaggcg 660
gagggtgaaa aacgtggcct ggagaccctg atcgaagttc acagctacta taagaaacag 720
gtggagattg cgagcaaggt ggatcgtgtt tacgactttg cgatcccggg tctgctgctg 780
catgcgctgg aatttggcaa aaccgatgcg ctggcgcaat ggattgacgt tcgtccgaac 840
aacgcggtga acgttctgga tacccacgac ggtatcggcg ttatcgatat tggtagcgat 900
cagatggacc gtagcctggc gggtctggtg ccggatgagg aagttgacgc gctggttgag 960
agcatccacc gtaacagcaa gggtgaaagc caggaagcga ccggcgcggc ggcgagcaac 1020
ctggacctgt accaagttaa ctgcacctac tatgcggcgc tgggtagcga cgatcagaaa 1080
tatattgcgg cgcgtgcggt gcagttcttt atgccgggcg tgccgcaagt ttactatgtg 1140
ggtgcgctgg cgggcagcaa cgatatggac ctgctgaagc gtaccaacgt gggtcgtgat 1200
atcaaccgtc actactatag cgcggcggaa gtggcgagcg aggtggaacg tccggtggtt 1260
caggcgctga acgcgctggg ccgtttccgt aacaccctga gcgcgttcga tggtgaattt 1320
agctacagca acgcggacgg cgttctgacc atgacctggg cggatgatgc gacccgtgcg 1380
accctgacct ttgcgccgaa ggcgaacagc aacggtgcga gcgtggcgcg tctggagtgg 1440
accgatgcgg cgggtgaaca tgcgaccgac gatctgatcg cgaacccgcc ggtggttgcg 1500
<210> 32
<211> 500
<212> PRT
<213> Artificial Sequence
<220>
<223> Sucrose phosphorylase from Alloscardovia
<400> 32
Met Lys Asn Lys Val Gln Leu Ile Thr Tyr Ala Asp Arg Leu Gly Asp
1 5 10 15
Gly Thr Leu Lys Ser Met Thr Glu Thr Leu Arg Lys His Phe Glu Gly
20 25 30
Val Tyr Glu Gly Val His Ile Leu Pro Phe Phe Thr Pro Phe Asp Gly
35 40 45
Ala Asp Ala Gly Phe Asp Pro Val Asp His Thr Lys Val Asp Pro Arg
50 55 60
Leu Gly Ser Trp Asp Asp Val Ala Glu Leu Ser Thr Thr His Asp Ile
65 70 75 80
Met Val Asp Thr Ile Val Asn His Met Ser Trp Glu Ser Glu Gln Phe
85 90 95
Gln Asp Val Met Ala Lys Gly Glu Asp Ser Glu Tyr Tyr Pro Met Phe
100 105 110
Leu Thr Met Ser Ser Ile Phe Pro Asp Gly Val Thr Glu Glu Asp Leu
115 120 125
Thr Ala Ile Tyr Arg Pro Arg Pro Gly Leu Pro Phe Thr His Tyr Asn
130 135 140
Trp Gly Gly Lys Thr Arg Leu Val Trp Thr Thr Phe Thr Pro Gln Gln
145 150 155 160
Val Asp Ile Asp Thr Asp Ser Glu Met Gly Trp Asn Tyr Leu Leu Ser
165 170 175
Ile Leu Asp Gln Leu Ser Gln Ser His Val Ser Gln Ile Arg Leu Asp
180 185 190
Ala Val Gly Tyr Gly Ala Lys Glu Lys Asn Ser Ser Cys Phe Met Thr
195 200 205
Pro Lys Thr Phe Lys Leu Ile Glu Arg Ile Lys Ala Glu Gly Glu Lys
210 215 220
Arg Gly Leu Glu Thr Leu Ile Glu Val His Ser Tyr Tyr Lys Lys Gln
225 230 235 240
Val Glu Ile Ala Ser Lys Val Asp Arg Val Tyr Asp Phe Ala Ile Pro
245 250 255
Gly Leu Leu Leu His Ala Leu Glu Phe Gly Lys Thr Asp Ala Leu Ala
260 265 270
Gln Trp Ile Asp Val Arg Pro Asn Asn Ala Val Asn Val Leu Asp Thr
275 280 285
His Asp Gly Ile Gly Val Ile Asp Ile Gly Ser Asp Gln Met Asp Arg
290 295 300
Ser Leu Ala Gly Leu Val Pro Asp Glu Glu Val Asp Ala Leu Val Glu
305 310 315 320
Ser Ile His Arg Asn Ser Lys Gly Glu Ser Gln Glu Ala Thr Gly Ala
325 330 335
Ala Ala Ser Asn Leu Asp Leu Tyr Gln Val Asn Cys Thr Tyr Tyr Ala
340 345 350
Ala Leu Gly Ser Asp Asp Gln Lys Tyr Ile Ala Ala Arg Ala Val Gln
355 360 365
Phe Phe Met Pro Gly Val Pro Gln Val Tyr Tyr Val Gly Ala Leu Ala
370 375 380
Gly Ser Asn Asp Met Asp Leu Leu Lys Arg Thr Asn Val Gly Arg Asp
385 390 395 400
Ile Asn Arg His Tyr Tyr Ser Ala Ala Glu Val Ala Ser Glu Val Glu
405 410 415
Arg Pro Val Val Gln Ala Leu Asn Ala Leu Gly Arg Phe Arg Asn Thr
420 425 430
Leu Ser Ala Phe Asp Gly Glu Phe Ser Tyr Ser Asn Ala Asp Gly Val
435 440 445
Leu Thr Met Thr Trp Ala Asp Asp Ala Thr Arg Ala Thr Leu Thr Phe
450 455 460
Ala Pro Lys Ala Asn Ser Asn Gly Ala Ser Val Ala Arg Leu Glu Trp
465 470 475 480
Thr Asp Ala Ala Gly Glu His Ala Thr Asp Asp Leu Ile Ala Asn Pro
485 490 495
Pro Val Val Ala
500
Claims (12)
- 베타-글리코실화된 산물을 생산하기 위해 기질을 글리코실화시키는 방법으로서, 적어도 하나의 글리코실기 공여체, 적어도 하나의 글리코실기 수용체 및 적어도 하나의 글리코실트랜스퍼라제 효소를 제공하는 단계; 베타-글루코스 연결을 갖는 적어도 하나의 산물을 생산하기 위해 글리코실기 수용체가 글리코실화되도록 하는 조건 하에서 글리코실트랜스퍼라제 효소와, 글리코실기 공여체 및 글리코실기 수용체를 접촉시키는 단계를 포함하는 방법.
- 제1항에 있어서, 상기 글리코실기 공여체는 글리코실포스페이트인 방법.
- 제2항에 있어서, 상기 글리코실기 공여체는 글루코스-1-포스페이트인 방법.
- 제1항에 있어서, 상기 글리코실기 수용체는 글리코실, 알콕시, 카르복시, 아미노카르보닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카르복시알킬, 아미노알킬, 할로알킬, 알킬티오알킬, 헤테로시클로알킬, 헤테로아릴 및 헤테로아릴알킬 기에서 선택되는 것인 방법.
- 제1항에 있어서, 상기 베타-글루코스 연결을 갖는 산물은 스테비올 글리코시드인 방법.
- 제1항에 있어서, 상기 글리코실기 수용체는 스테비오시드이고, 상기 글리코실기 공여체는 알파-글루코스-1-포스페이트이고, 상기 베타-글루코스 연결을 갖는 산물은 레바우디오시드 A인 방법.
- 제1항 내지 제6항 중 어느 하나의 항에 있어서, 상기 글리코실트랜스퍼라제는 서열번호 2, 4, 6, 8, 10, 12 및 14로 제시된 폴리펩티드에서 선택되는 것인 방법.
- 글루코스-1-포스페이트를 생산하는 방법으로서, 포스포릴라제, 무기 포스페이트, 및 포스포릴라제의 이당류, 삼당류 또는 올리고당류 기질을 제공하는 단계; 단당류 및 글루코스-1-포스페이트를 생산하기 위해 상기 당류가 분해되도록 하는 조건 하에서 상기 포스포릴라제, 무기 포스페이트 및 당류를 접촉시키는 단계를 포함하는 방법.
- 제8항에 있어서, 제8항의 방법은 제1항의 방법과 조합되는 것인 방법.
- 제9항에 있어서, 상기 글루코실기 수용체는 글리코실, 알콕시, 카르복시, 아미노카르보닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카르복시알킬, 아미노알킬, 할로알킬, 알킬티오알킬, 헤테로시클로알킬, 헤테로아릴 및 헤테로아릴알킬 기에서 선택되는 것인 방법.
- 제9항에 있어서, 상기 포스포릴라제는 수크로스 포스포릴라제이고, 상기 당류는 수크로스이고, 상기 생산된 단당류는 수크로스이고, 상기 생산된 글루코스-1-포스페이트는 α-글루코스-1-포스페이트인 방법.
- 제8항 내지 제11항 중 어느 하나의 항에 있어서, 상기 포스포릴라제는 서열번호 16, 18, 20, 22, 24, 26, 28, 30 및 32에서 선택된 폴리펩티드 서열을 포함하는 것인 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662350450P | 2016-06-15 | 2016-06-15 | |
US62/350,450 | 2016-06-15 | ||
PCT/US2017/036701 WO2017218324A1 (en) | 2016-06-15 | 2017-06-09 | Enzymatic glycosylation of steviol glycosides and other compounds with glucose-1-phosphate |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20190017045A true KR20190017045A (ko) | 2019-02-19 |
Family
ID=60664213
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197001208A KR20190017045A (ko) | 2016-06-15 | 2017-06-09 | 글루코스-1-포스페이트에 의한 스테비올 글리코시드 및 다른 화합물의 효소 글리코실화 |
Country Status (14)
Country | Link |
---|---|
US (1) | US20190127772A1 (ko) |
EP (1) | EP3472308A4 (ko) |
JP (1) | JP2019517807A (ko) |
KR (1) | KR20190017045A (ko) |
CN (1) | CN109563493A (ko) |
AU (1) | AU2017284103B2 (ko) |
BR (1) | BR112018075816A2 (ko) |
CA (1) | CA3027180A1 (ko) |
EA (1) | EA201990034A1 (ko) |
IL (1) | IL263596A (ko) |
MX (1) | MX2018015517A (ko) |
PH (1) | PH12018502655A1 (ko) |
SG (1) | SG11201810864QA (ko) |
WO (1) | WO2017218324A1 (ko) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020028039A1 (en) * | 2018-07-30 | 2020-02-06 | Codexis, Inc. | Engineered glycosyltransferases and steviol glycoside glucosylation methods |
KR20220028053A (ko) * | 2019-07-02 | 2022-03-08 | 코덱시스, 인코포레이티드 | 조작된 수크로스 포스포릴라제 변이체 효소 |
KR102546737B1 (ko) * | 2020-11-25 | 2023-06-22 | 씨제이제일제당 주식회사 | 포도당 전이 스테비아를 포함하는 감미질이 개선된 조성물 |
CN114317477B (zh) * | 2021-12-30 | 2023-07-14 | 南京诺云生物科技有限公司 | 一种蔗糖磷酸化酶及葡萄糖-1-磷酸生产工艺 |
CN114317476B (zh) * | 2021-12-30 | 2023-07-14 | 南京诺云生物科技有限公司 | 葡萄糖基甘油的生物催化生产工艺及其蔗糖磷酸化酶 |
CN114231509B (zh) * | 2021-12-31 | 2023-07-25 | 南京诺云生物科技有限公司 | 一种蔗糖磷酸化酶及葡萄糖基甘油生产工艺 |
CN114350737B (zh) * | 2022-01-14 | 2023-09-15 | 台州仙琚药业有限公司 | 5α,6α-环氧-11β,17α-二羟基孕甾-3,20-二乙二醇缩酮的制备方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2815023B2 (ja) * | 1989-10-17 | 1998-10-27 | 農林水産省食品総合研究所長 | セロビオースの製造方法 |
US8093028B2 (en) * | 2007-07-24 | 2012-01-10 | Wisconsin Alumni Research Foundation | Engineered glycosyltransferases with expanded substrate specificity |
US20130004979A1 (en) * | 2010-06-11 | 2013-01-03 | Wisconsin Alumni Research Foundation | Glycosyltransferase reversibility for sugar nucleotide synthesis and microscale scanning |
WO2013176738A1 (en) * | 2012-05-22 | 2013-11-28 | Purecircle Sdn Bhd | High-purity steviol glycosides |
JP6033632B2 (ja) * | 2012-10-15 | 2016-11-30 | 国立大学法人 新潟大学 | セロビオン酸ホスホリラーゼを用いた酸性βグルコシル二糖の製造方法 |
AU2014213918B2 (en) * | 2013-02-11 | 2017-11-09 | Danstar Ferment Ag | Efficient production of steviol glycosides in recombinant hosts |
KR101404728B1 (ko) * | 2013-02-28 | 2014-06-09 | 씨제이제일제당 (주) | 스테비오사이드로부터 리바우디오사이드 a를 제조하는 방법 |
-
2017
- 2017-06-09 CA CA3027180A patent/CA3027180A1/en not_active Abandoned
- 2017-06-09 AU AU2017284103A patent/AU2017284103B2/en not_active Ceased
- 2017-06-09 US US16/306,015 patent/US20190127772A1/en not_active Abandoned
- 2017-06-09 EA EA201990034A patent/EA201990034A1/ru unknown
- 2017-06-09 KR KR1020197001208A patent/KR20190017045A/ko not_active Application Discontinuation
- 2017-06-09 BR BR112018075816-7A patent/BR112018075816A2/pt not_active IP Right Cessation
- 2017-06-09 MX MX2018015517A patent/MX2018015517A/es unknown
- 2017-06-09 JP JP2018565413A patent/JP2019517807A/ja active Pending
- 2017-06-09 EP EP17813832.7A patent/EP3472308A4/en not_active Withdrawn
- 2017-06-09 SG SG11201810864QA patent/SG11201810864QA/en unknown
- 2017-06-09 WO PCT/US2017/036701 patent/WO2017218324A1/en unknown
- 2017-06-09 CN CN201780050203.3A patent/CN109563493A/zh active Pending
-
2018
- 2018-12-09 IL IL263596A patent/IL263596A/en unknown
- 2018-12-14 PH PH12018502655A patent/PH12018502655A1/en unknown
Also Published As
Publication number | Publication date |
---|---|
US20190127772A1 (en) | 2019-05-02 |
SG11201810864QA (en) | 2019-01-30 |
CN109563493A (zh) | 2019-04-02 |
PH12018502655A1 (en) | 2019-10-07 |
BR112018075816A2 (pt) | 2019-04-02 |
CA3027180A1 (en) | 2017-12-21 |
EA201990034A1 (ru) | 2019-06-28 |
EP3472308A4 (en) | 2020-07-29 |
EP3472308A1 (en) | 2019-04-24 |
WO2017218324A1 (en) | 2017-12-21 |
JP2019517807A (ja) | 2019-06-27 |
MX2018015517A (es) | 2019-03-18 |
AU2017284103B2 (en) | 2019-07-11 |
AU2017284103A1 (en) | 2018-12-13 |
IL263596A (en) | 2019-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20190017045A (ko) | 글루코스-1-포스페이트에 의한 스테비올 글리코시드 및 다른 화합물의 효소 글리코실화 | |
JP2022065092A (ja) | 操作されたイミンレダクターゼ、ならびにケトン化合物およびアミン化合物の還元的アミノ化のための方法 | |
KR20210032417A (ko) | 조작된 데옥시리보스-포스페이트 알돌라아제 | |
US20220213518A1 (en) | Engineered imine reductases and methods for the reductive amination of ketone and amine compounds | |
JP2023521972A (ja) | 速度論的光学分割のためのカルボキシエステラーゼポリペプチド | |
JP2023502779A (ja) | 化合物のヒドロキシル化のための生体触媒および方法 | |
US20240209408A1 (en) | Engineered 3-o-kinase variants and methods of use | |
US11913037B2 (en) | Engineered adenylate kinase variant enzymes | |
US20230183663A1 (en) | Engineered terminal deoxynucleotidyl transferase variants | |
US20240182876A1 (en) | Engineered Terminal Deoxynucleotidyl Transferase Variants | |
CA3214975A1 (en) | Engineered cyclic gmp-amp synthase (cgas) variant enzymes | |
CA3214973A1 (en) | Engineered guanylate kinase variant enzymes | |
CA3215105A1 (en) | Engineered acetate kinase variant enzymes | |
CA3137734A1 (en) | Engineered glucose dehydrogenases and methods for the reductive amination of ketone and amine compounds | |
CA3229280A1 (en) | Engineered nucleoside deoxyribosyltransferase variant enzymes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |