KR20190017045A

KR20190017045A - 글루코스-1-포스페이트에 의한 스테비올 글리코시드 및 다른 화합물의 효소 글리코실화

Info

Publication number: KR20190017045A
Application number: KR1020197001208A
Authority: KR
Inventors: 조나단 브룸; 스테파니 수 갈라니; 오스카 알비조
Original assignee: 코덱시스, 인코포레이티드
Priority date: 2016-06-15
Filing date: 2017-06-09
Publication date: 2019-02-19
Also published as: US20190127772A1; SG11201810864QA; CN109563493A; PH12018502655A1; BR112018075816A2; CA3027180A1; EA201990034A1; EP3472308A4; EP3472308A1; WO2017218324A1; JP2019517807A; MX2018015517A; AU2017284103B2; AU2017284103A1; IL263596A

Abstract

본 발명은 글리코실 트랜스퍼라제(GT) 효소, GT 활성을 갖는 폴리펩티드, 및 상기 효소를 코딩하는 폴리뉴클레오티드, 그리고 이러한 폴리뉴클레오티드 및 폴리펩티드를 포함하는 벡터 및 숙주 세포를 제공한다. 본 발명은 또한 β-글루코스 연결을 갖는 산물을 생산하기 위해 이러한 GT 효소를 사용하는 방법을 제공한다.

Description

글루코스-1-포스페이트에 의한 스테비올 글리코시드 및 다른 화합물의 효소 글리코실화

본 출원은 미국 가특허 출원 일련 번호 62/350,450(2016년 6월 15일 출원)에 대한 우선권을 주장하며, 이로써 사실상 이의 전문을 전고 인용한다.

본 발명의 분야

본 발명은 글리코실트랜스퍼라제(GT) 효소, GT 활성을 갖는 폴리펩티드, 및 상기 효소를 코딩하는 폴리뉴클레오티드, 그리고 상기 폴리뉴클레오티드 및 폴리펩티드를 포함한 벡터 및 숙주 세포를 제공한다. 본 발명은 또한 β-글루코스 연결을 갖는 산물을 생산하기 위해 상기 GT 효소를 사용하는 방법을 제공한다.

ASCII 텍스트 파일로서 제출된 "서열 목록", 표, 또는 컴퓨터 프로그램 목록 부록에 대한 참조

서열 목록의 공식 사본은, 파일명 "CX8-155USP1_ST25.txt", 생성 일자 2016년 6월 14일, 및 크기 98,304 바이트로 하여, EFS-웹을 통해 ASCII 포멧 텍스트 파일로서 명세서와 동시에 제출된다. EFS-웹을 통해 제출된 서열 목록은 명세서의 일부이며 본원에 그 전문이 참고 인용된다.

글리코실트랜스퍼라제(GT)는 활성화된 뉴클레오티드 당으로부터 단량체 및 중합체 수용체 분자(예, 다른 당, 단백질, 지질, 및 다른 유기 기질)로 글리코실 잔기를 번역후 전달하는 효소이다. 이러한 글리코실화된 분자는 다양한 대사 경로 및 과정에 관여한다. 글루코실 모이어티의 전달은 수용체의 생물활성, 용해성, 및 세포 내 수송 특성을 변화시킬 수 있다.

본 발명은 글리코실트랜스퍼라제 효소, GT 활성을 갖는 폴리펩티드, 및 상기 효소를 코딩하는 폴리뉴클레오티드, 그리고 상기 폴리뉴클레오티드 및 폴리펩티드를 포함한 벡터 및 숙주 세포를 제공한다. 본 발명은 또한 β-글루코스 연결을 갖는 산물을 생산하기 위해 상기 GT 효소를 사용하는 방법을 제공한다.

본 발명은 베타-글리코실화된 산물을 생산하기 위해 기질을 글리코실화시키는 방법으로서, 적어도 하나의 글리코실기 공여체, 적어도 하나의 글리코실기 수용체 및 적어도 하나의 글리코실트랜스퍼라제 효소를 제공하는 단계; 베타-글루코스 연결을 갖는 적어도 하나의 산물을 생산하기 위해 글리코실기 수용체가 글리코실화되도록 하는 조건 하에서 글리코실트랜스퍼라제 효소와, 글리코실기 공여체 및 글리코실기 수용체를 접촉시키는 단계를 포함하는 방법을 제공한다. 상기 방법의 일부 실시양태에서, 글리코실기 공여체는 글리코실포스페이트이다. 상기 방법의 일부 추가 실시양태에서, 글리코실기 공여체는 글루코스-1-포스페이트이다. 상기 방법의 일부 추가 실시양태에서, 글리코실기 수용체는 글리코실, 알콕시, 카르복시, 아미노카르보닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카르복시알킬, 아미노알킬, 할로알킬, 알킬티오알킬, 헤테로시클로알킬, 헤테로아릴 및 헤테로아릴알킬 기에서 선택된다. 상기 방법의 일부 추가 실시양태에서, 베타-글루코스 연결을 갖는 산물은 스테비올 글리코시드이다. 상기 방법의 일부 추가 실시양태에서, 글리코실기 수용체는 스테비오시드이고, 상기 글리코실기 공여체는 알파-글루코스-1-포스페이트이고, 베타-글루코스 연결을 갖는 상기 산물은 레바우디오시드 A이다. 상기 방법의 일부 추가 실시양태에서, 글리코실트랜스퍼라제는 서열번호 2, 4, 6, 8, 10, 12 및 14로 제시된 폴리펩티드에서 선택된다.

본 발명은 또한 글루코스-1-포스페이트를 생산하는 방법으로서, 포스포릴라제, 무기 포스페이트, 및 포스포릴라제의 이당류, 삼당류 또는 올리고당류 기질을 제공하는 단계; 단당류 및 글루코스-1-포스페이트를 생산하기 위해 상기 당류가 분해되도록 하는 조건 하에 상기 포스포릴라제, 무기 포스페이트 및 당류를 접촉시키는 단계를 포함하는 방법을 제공한다. 상기 방법의 일부 실시양태에서, 상기 방법은 앞서 기술된 방법과 조합된다. 상기 방법의 일부 추가 실시양태에서, 글루코실기 수용체는 글리코실, 알콕시, 카르복시, 아미노카르보닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카르복시알킬, 아미노알킬, 할로알킬, 알킬티오알킬, 헤테로시클로알킬, 헤테로아릴 및 헤테로아릴알킬 기에서 선택된다. 상기 방법의 일부 추가 실시양태에서, 포스포릴라제는 수크로스 포스포릴라제이고, 상기 당류는 수크로스이고, 상기 생산된 단당류는 수크로스이고, 상기 생산된 글루코스-1-포스페이트는 α-글루코스-1-포스페이트이다. 상기 방법의 일부 추가 실시양태에서, 포스포릴라제는 서열번호 16, 18, 20, 22, 24,26, 28, 30 및 32에서 선택된 폴리펩티드 서열을 포함한다.

도 1에는 글리코실트랜스퍼라제가 글리코실포스페이트, 예컨대 글루코스-1-포스페이트로부터 수용체, 예컨대 R-OH로의 글리코실기의 전달을 촉진하고, 이때 R은 임의의 글리코실, 알콕시, 카르복시, 아미노카르보닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카르복시알킬, 아미노알킬, 할로알킬, 알킬티오알킬, 헤테로시클로알킬, 헤테로아릴 또는 헤테로아릴알킬 기인 효소 반응 도식을 제공한다.
도 2에는 도 1에 기술된 효소 반응이 기질 스테비오시드에 적용되고, 글리코실포스페이트가 α-글루코스-1-포스페이트이며 β-글루코스 연결의 형성을 촉진하여 산물 레바우디오시드 A를 생산하는 본 발명의 실시양태의 개략도를 제공한다.
도 3에는 글루코스-1-포스페이트의 계내 형성을 위해 두 효소 반응이 쌍을 이루는 본 발명의 실시양태의 개략도를 제공한다. 한 반응에서, 수크로스 포스포릴라제가 무기 포스페이트를 사용하여 수크로스를 분해함으로써, α-글루코스-1-포스페이트 및 프룩토스를 제공하고, 다른 반응에서, α-글루코스-1-포스페이트로부터의 글리코실기가 수용체로 전달된다. R은 임의의 글리코실, 알콕시, 카르복시, 아미노카르보닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카르복시알킬, 아미노알킬, 할로알킬, 알킬티오알킬, 헤테로시클로알킬, 헤테로아릴 또는 헤테로아릴알킬 기이다.

본 발명의 설명

달리 정의되지 않는 한, 본원에 사용되는 모든 기술적 및 과학적 용어는 일반적으로 본 발명이 속하는 업계의 당업자에 의해 공통적으로 이해되는 바와 동일한 의미를 갖는다. 일반적으로, 본원에 사용된 명명법 및 하기 기술되는 세포 배양, 분자 유전학, 미생물학, 유기 화학, 분석 화학 및 핵산 화학의 실험 절차는 당업계에서 잘 공지되어 있고 공통적으로 사용되는 것이다. 이러한 기법은 잘 공지되어 있고 당업자에게 잘 공지된 많은 문헌 및 참고문헌에 기재되어 있다. 표준 기법 또는 이의 변법은 화학 합성 및 화학 분석에 사용된다. 본원에 언급되는 모든 특허, 특허 출원, 규약 및 간행물은 상기 및 하기 모두에서 명시적으로 본원에 참고 인용된다.

본원에 기술된 것과 유사하거나 동등한 임의의 적당한 방법 및 재료가 본 발명의 실시에 사용되지만, 일부 방법 및 재료가 본원에 기술된다. 본 발명은 기술된 특정 방법, 프로토콜 및 시약이 당업자에 의해 사용되는 상황에 따라 달라질 수 있기 때문에 제한되지 않는다는 것을 이해하여야 한다. 따라서, 하기 바로 정의된 용어는 본 발명 전체를 참조하여 더욱 완전하게 기술된다.

전술된 일반 설명 및 다음의 상세 설명 모두는 단지 예시적이며 설명적인 것이고 본 발명을 제한하지 않는다는 것을 이해하여야 한다. 본원에 사용된 섹션 제목은 단지 구성 목적을 위한 것이며 기술된 청구 대상을 제한하는 것으로 이해해서는 안된다. 수치 범위는 범위를 정의하는 숫자를 포함한다. 따라서, 본원에 개시된 모든 수치 범위는 그러한 더 좁은 수치 범위가 모두 본원에 명시적으로 기재되는 것처럼 더 넓은 수치 범위 내에 속하는 모든 더 좁은 수치 범위를 포함하도록 의도된다. 또한, 본원에 개시된 모든 최대 (또는 최소) 수치 한계는 그러한 더 낮은 (또는 더 높은) 수치 한계가 명시적으로 기재되는 것처럼 모든 더 낮은 (또는 더 높은) 수치 한계를 포함하는 것으로 의도된다.

약어

유전적으로 코딩된 아미노산에 사용되는 약어는 일반적이며 다음과 같다:

3자 약어가 사용되는 경우, "L" 또는 "D"로 명확하게 표시되거나 약어가 사용된 문맥에서 명확하지 않는 한, 아미노산은 α-탄소(C_α)에 대한 L- 또는 D-배열일 수 있다. 예를 들면, "Ala"는 α-탄소에 대한 배열이 구체화되지 않고 알라닌을 지정하지만, "D-Ala" 및 "L-Ala"는 각각 D-알라닌 및 L-알라닌을 지정한다. 1자 약어가 사용되는 경우, 대문자는 α-탄소에 대한 L-배열의 아미노산을 지정하고, 소문자는 α-탄소에 대한 D-배열의 아미노산을 지정한다. 예를 들면, "A"는 L-알라닌을 지정하고 "a"는 D-알라닌을 지정한다. 폴리펩티드 서열이 1자 또는 3자 약어 (또는 이의 혼합)의 문자열로 제시되는 경우, 그 서열은 일반 규정에 따라 아미노(N)에서 카르복시(C) 방향으로 제시된다.

뉴클레오시드를 유전적으로 코딩하는 데 사용되는 약어는 일반적이며 다음과 같다: 아데노신(A); 구아노신(G); 시티딘(C); 티미딘(T); 및 우리딘(U). 구체적으로 설명되지 않는 한, 약기된 뉴클레오시드는 리보뉴클레오시드 또는 2'-데옥시리보뉴클레오시드일 수 있다. 뉴클레오시드는 개개의 기초 하에 또는 총체적 기초 하에 리보뉴클레오시드 또는 2'-데옥시리보뉴클레오시드로 구체화될 수 있다. 핵산 서열이 1자 약어 문자열로서 제시되는 경우, 서열은 일반 규정에 따라 5'에서 3' 방향으로 제시되고, 포스페이트는 제시되지 않는다.

정의

본 발명과 관련하여, 본원에의 설명에 사용된 기술적 및 과학적 용어는 달리 구체적으로 정의되지 않는 한 당업자에게 공통적으로 이해되는 의미를 갖는다. 따라서, 하기 용어는 하기 의미를 갖는 것으로 의도된다.

본원에 사용된 바와 같이, 단수 형태("a", "an" 및 "the")는 문맥상 명확하게 달리 제시되지 않는 한 복수 형태를 포함한다. 따라서, 예를 들어, "폴리펩티드"에 대한 언급은 하나 이상의 폴리펩티드를 포함한다.

유사하게, "포함하다", "포함하는", "함유하다", 및 "함유하는"은 상호혼용가능하고 제한하려는 의도가 아니다. 따라서, 본원에 사용된 바와 같이, 용어 "포함하는" 및 이의 유사어는 이의 포괄적 의미(즉, 용어 "함유하는" 및 이의 상응하는 유사어와 동등)로 사용된다.

다양한 실시양태의 설명이 용어 "포함하는"을 사용하는 경우, 당업자는 일부 특정 예시에서 실시양태가 용어 "본질적으로 이루어지는" 또는 "이루어지는"를 사용하여 대안적으로 기술될 수 있다는 것을 이해할 것으로 추가로 이해되어야 한다.

용어 "약"은 특정 값에 대한 허용 오차를 의미한다. 일부 예시에서, "약"은 제시된 값 범위의 0.05%, 0.5%, 1.0% 또는 2.0% 이내를 의미한다. 일부 예시에서, "약"은 제시된 값의 1, 2, 3 또는 4 표준 편차 이내를 의미한다.

"EC" 번호는 생화학 및 분자생물학 국제 연합 명명 위원회(NC-IUBMB)의 효소 명명법을 나타낸다. IUBMB 생화학 분류는 촉매 작용을 하는 화학 반응을 기초로 하는 효소의 수치 분류 체계이다.

"ATCC"는 생물저장소 수집에 유전자 및 균주가 포함되는 미국 유형 배양 수집소를 지칭한다.

"NCBI"는 국립 생물 정보 센터 및 여기 제공된 서열 데이타베이스를 지칭한다.

"단백질", "폴리펩티드" 및 "펩티드"는 본원에서 상호혼용되며 길이 또는 번역후 변형(예, 글리코실화 또는 인산화)과 관계없이 아미드 결합에 의해 공유 결합되는 적어도 2개의 아미노산의 중합체를 의미한다. 본 정의에는 D- 및 L-아미노산, 및 D- 및 L-아미노산의 혼합물, 그리고 D- 및 L-아미노산을 포함한 중합체, 그리고 D- 및 L-아미노산의 혼합물이 포함된다.

"아미노산"은 공통적으로 공지된 3자 심볼 또는 IUPAC-IUB 생화학 명명 위원에서 권장한 1자 심볼로 본원에 지칭된다. 뉴클레오티드는, 마찬가지로, 공통적으로 허용된 단일 문자 코드로 지칭될 수 있다.

본원에 사용된 바와 같이, "폴리뉴클레오티드" 및 "핵산"은 함께 공유 결합 연결되는 둘 이상의 뉴클레오시드를 지칭한다. 폴리뉴클레오티드는 리보뉴클레오티드(즉, RNA)를 완전히 포함하거나, 2'-데옥시리보뉴클레오티드(즉, DNA)를 완전히 포함하거나, 또는 리보- 및 2'-데옥시리보뉴클레오티드의 혼합물을 포함할 수 있다. 뉴클레오시드가 통상 표준 포스포디에스테르 연결을 통해 함께 연결되지만, 폴리뉴클레오티드는 하나 이상의 비-표준 연결을 포함할 수 있다. 폴리뉴클레오티드는 단일 가닥 또는 이중 가닥일 수 있거나, 또는 단일 가닥 영역 및 이중 가닥 영역을 모두 포함할 수 있다. 또한, 폴리뉴클레오티드가 통상 천연 발생 코딩 핵염기(즉, 아데닌, 구아닌, 우라실, 티민 및 시토신)으로 구성되어 있지만, 하나 이상의 변성 및/또는 합성 핵염기, 예컨대 이노신, 크산틴, 히포크산틴 등을 포함할 수 있다. 일부 실시양태에서, 그러한 변성 또는 합성 핵염기는 아미노산 서열을 코딩하는 핵염기이다.

"코딩 서열"은 단백질의 아미노산 서열을 코딩하는 핵산(예, 유전자)의 일부를 지칭한다.

본원에 사용된 바와 같이, 용어 "생체촉매작용", "생체촉매", "생물변형" 및 "생합성"은 유기 화합물 화합물 상 화학 반응을 수행하기 위한 효소의 사용을 지칭한다.

"글리코실트랜스퍼라제"는 활성화된 당, 예컨대 뉴클레오티드 디포스페이트 당류 또는 인당으로부터 단량체 및 중합체 수용체 분자로 글리코실 잔기를 전달하는 효소능을 갖는 폴리펩티드을 지칭한다.

"포스포릴라제"는 무기 포스페이트를 사용하여 글리코시드 결합을 분해함으로써, 포스포글리코시드 및 단량체 또는 중합체 산물을 방출하는 효소능을 갖는 폴리펩티드를 지칭한다. 역방향에서, 포스포릴라제는 포스포글리코시드, 예컨대 글루코스-1-포스페이트로부터 단량체 및 중합체 수용체로 글리코실 잔기를 전달하는 글리코실트랜스퍼라제로서 작용할 수 있다.

본원에 사용된 바와 같이, "글리코실화"는 글리코실 잔기와 수용체 분자 사이의 글리코시드 연결의 형성을 지칭한다.

본원에 사용된 바와 같이, "글루코실화"는 글루코스 잔기와 수용체 분자 사이의 글리코시드 연결의 형성을 지칭한다.

본원에 사용된 바와 같이, "글리코실"은 단당류, 저급 올리고당류 또는 올리고당류 유도체의 시클릭 형태로부터 헤미아세탈 히드록실 기를 제거함으로써 수득되는 1가 자유 라디칼 또는 치환기 구조인 유기 기를 지칭한다. 글리코실기는 무기 산(예, 인산)과 반응하여 에스테르(예, 글루코스 1-포스페이트)를 형성한다.

본원에 사용된 바와 같이, "글리코시드"는 글리코시드 결합에 의해 탄수화물(예, 당류)이 또다른 작용 기에 결합되는 분자를 지칭한다. 글리코시드는 당류 및 비-당류(즉, 아글리콘) 성분을 형성하기 위해 가수분해될 수 있다.

본원에 사용된 바와 같이, 용어 "스테비올 글리코시드"는, 제한없이 천연 발생 스테비올 글리코시드(예, 스테비오시드, 스테비올모노시드, 스테비올비오시드, 루부소시드, 둘코시드 B, 둘코시드 A, 레바우디오시드 B, 레바우디오시드 G, 레바우디오시드 C, 레바우디오시드 F, 레바우디오시드 A, 레바우디오시드 I, 레바우디오시드 E, 레바우디오시드 H, 레바우디오시드 L, 레바우디오시드 K, 레바우디오시드 J, 레바우디오시드 M(레바우디오시드 X로도 공지됨), 레바우디오시드 D, 레바우디오시드 N, 레바우디오시드 O), 및 합성 스테비올 글리코시드(예, 효소적으로 글루코실화된 스테비올 글리코시드), 및 이의 조합을 포함하는 스테비올의 글리코시드를 지칭한다. 스테비올의 화학 구조 및 이의 글리코시드가 하기 제시된다(WO 2013/176738 참조).

본원에 사용된 바와 같이, "야생형" 및 "천연 발생"은 자연적으로 발견되는 형태를 지칭한다. 예를 들면, 야생형 폴리펩티드 또는 폴리뉴클레오티드 서열은 자연적으로 공급원으로부터 단리될 수 있고 인간 조작에 의해 의도적으로 변성되지 않은 유기체에 존재하는 서열이다.

본원에 사용된 바와 같이, "재조합", "조작된" 및 "비-천연 발생"은, 세포, 핵산 또는 폴리펩티드와 관련하여 사용되었을 때, 자연적으로 존재하지 않는 방식으로 변형된, 물질 또는 물질의 자연 또는 천연 형태에 해당하는 물질을 지칭한다. 일부 실시양태에서, 세포, 핵산 또는 폴리펩티드는 천연 발생 세포, 핵산 또는 폴리펩티드와 동일하지만, 합성 물질로부터 및/또는 재조합 기법을 사용하여 조작에 의해 생산되거나 유도된다. 비제한적 예는, 그 중에서도, 세포의 천연(비-재조합) 형태에서 발견되지 않고 그외 상이한 수준으로 발현되는 천연 유전자를 발현하는 재조합 세포를 포함한다.

용어 "서열 동일성 백분율(%)"은 본원에서 폴리뉴클레오티드 또는 폴리펩티드 간 비교를 지칭하기 위해 사용되며, 비교 창에서 2개의 최적으로 정렬된 서열을 비교함으로써 결정되고, 비교 창에서 폴리뉴클레오티드 또는 폴리펩티드 서열 부분은 2개의 서열의 최적 정렬을 위한 참고 서열과 비교하여 추가 또는 결실(즉, 갭)을 포함할 수 있다. 백분율은 동일한 핵산 염기 또는 아미노산 잔기가 양 서열에서 발생하는 위치의 갯수를 결정하여 대응된 위치의 갯수를 산출하여, 대응된 위치의 갯수를 비교 창의 위치의 총 갯수로 나누고 서열 동일성의 백분율을 산출하기 위해 결과값에 100을 곱함으로써 계산될 수 있다. 대안적으로, 백분율은 동일한 핵산 염기 또는 아미노산 잔기가 양 서열에서 발생하거나 또는 핵산 염기 또는 아미노산 잔기가 갭과 정렬되는 위치의 갯수를 결정하여 대응된 위치의 갯수를 산출하여, 대응된 위치의 갯수를 비교 창의 위치의 총 갯수로 나누고 서열 동일성의 백분율을 산출하기 위해 결과값에 100을 곱함으로써 계산될 수 있다. 당업자는 2개의 서열을 정렬하는데 이용할 수 있는 많은 확립된 알고리즘이 존재함을 이해한다. 비교를 위한 서열의 최적 정렬은 제한없이 Smith 및 Waterman(Smith and Waterman, Adv. Appl. Math., 2:482 [1981])의 국소 상동성 알고리즘, Needleman 및 Wunsch(Needleman and Wunsch, J. Mol. Biol., 48:443 [1970])의 상동성 정렬 알고리즘, Pearson 및 Lipman(Pearson and Lipman, Proc. Natl. Acad. Sci. USA 85:2444 [1988])의 유사성 방법을 위한 조사, 이들 알고리즘의 컴퓨터 실행(예, GCG 위스콘신 소프트웨어 패키지의 GAP, BESTFIT, FASTA 및 TFASTA), 또는 당업계에 공지된 육안 검사를 비롯한 임의의 적당한 방법에 의해 실시될 수 있다. 서열 동일성 및 서열 유사성 백분율을 결정하는 데 적당한 알고리즘의 예는 제한없이 BLAST 및 BLAST 2.0 알고리즘을 포함하고, 이는 Altschul 등(각각 Altschul et al., J. Mol. Biol., 215: 403-410 [1990]; 및 Altschul et al., Nucl. Acids Res., 3389-3402 [1977] 참조)에 의해 기술되어 있다. BLAST 분석을 수행하기 위한 소프트웨어는 생명공학 정보 웹사이트에 대한 미국립 센터를 통해 공개적으로 입수할 수 있다. 이러한 알고리즘은 데이타베이스 서열에서 동일 길이의 단어와 정렬시, 일부 양성값의 한계 점수 T와 대응하거나 또는 만족하는, 문의 서열 중 길이 W의 짧은 단어를 식별하여 높은 점수의 서열쌍(HSP)을 식별하는 것을 포함한다. T는 이웃 단어 점수 한계치(Altschul et al 참조, 상술)를 지칭한다. 이들 초기 이웃 단어 히트는 그들을 함유하는 보다 긴 HSP를 찾기 위해 검색을 개시하기 위한 씨드로서 작용한다. 다음으로 단어 히트는 누적 정렬 점수가 증가될 수 있는 한 각 서열을 따라 양 방향으로 확장된다. 누적 점수는 뉴클레오티드 서열의 경우, 변수 M(대응 잔기 쌍에 대한 보상 점수; 항상 > 0) 및 N(미대응 잔기에 대한 패널티 점수; 항상 < 0)을 사용해 계산된다. 아미노산 서열의 경우, 점수 매트릭스를 사용해서 누적 점수를 계산한다. 각 방향으로의 단어 히트의 확장은 누적 정렬 점수가 그 최대 획득값으로부터 X의 양 만큼 줄면 중지하고; 누적 점수는, 1 이상의 음성 점수화 잔기 정렬의 축적에 기인하거나, 또는 양 서열의 말단에 도달하면, 0 이하가 된다. BLAST 알고리즘 변수 W, T 및 X는 정렬 속도 및 민감도를 결정한다. BLASTN 프로그램(뉴클레오티드 서열의 경우)은 디폴트로서 11의 단어 길이(W), 10의 기대치(E), M=5, N=-4 및 양 가닥의 비교를 사용한다. 아미노산 서열의 경우, BLASTP 프로그램은 디폴트로서 3의 단어 길이(W), 10의 기대치(E), 및 BLOSUM62 점수 매트릭스(예를 들면, Henikoff and Henikoff, Proc. Natl. Acad. Sci. USA 89:10915 [1989] 참조)를 사용한다. 서열 정렬 및 서열 동일성(%)의 예시적인 결정법은 제공된 디폴트 변수를 사용하는, GCG 위스콘신 소프트웨어 패키지(Accelrys, 미국 위스콘신주 매디슨 소재)의 BESTFIT 또는 GAP 프로그램을 채택할 수 있다.

본원에 사용된 바와 같이, "기준 서열"은 서열 및/또는 활성 비교를 위한 기초로서 사용되는 규정된 서열을 지칭한다. 기준 서열은 더 큰 서열의 서브세트, 예컨대 전장 유전자 또는 폴리펩티드 서열의 절편일 수 있다. 일반적으로, 기준 서열은 적어도 20 뉴클레오티드 또는 아미노산 잔기 길이, 적어도 25 잔기 길이, 적어도 50 잔기 길이, 적어도 100 잔기 길이 또는 핵산 또는 폴리펩티드의 전체 길이이다. 2개의 폴리뉴클레오티드 또는 폴리펩티드는 각각 (1) 2개의 서열 사이의 유사한 서열(즉, 완전한 서열의 일부)을 포함할 수 있고, (2) 2개의 서열 간 분기성인 서열을 추가로 포함할 수 있기 때문에, 2개 (또는 그 이상)의 폴리뉴클레오티드 또는 폴리펩티드 간 서열 비교는 통상 서열 유사성의 국소 영역을 식별하고 비교하기 위한 "비교 창"에서 2개의 폴리뉴클레오티드 또는 폴리펩티드의 서열을 비교함으로써 수행된다. 일부 실시양태에서, "기준 서열"은 주요 아미노산 서열을 기초로 할 수 있고, 기준 서열은 주요 서열에서 하나 이상의 변화를 가질 수 있는 서열이다.

본원에 사용된 바와 같이, "비교 창"은 적어도 약 20개의 인접하는 뉴클레오티드 부분 또는 아미노산 잔기의 개념적 절편을 지칭하고, 서열은 적어도 20개의 인접하는 뉴클레오티드 또는 아미노산의 기준 서열과 비교될 수 있고, 비교 창 내 서열의 일부분은 2개의 서열의 최적 정렬을 위해 (추가 또는 결실을 포함하지 않는) 기준 서열과 비교하여 20% 이하의 추가 또는 결실(즉, 갭)을 포함할 수 있다. 비교 창은 20보다 긴 인접하는 잔기일 수 있고, 경우에 따라 30, 40, 50, 100 이상의 창을 포함한다.

본원에 사용된 바와 같이, "~에 상응하는", "~를 참조하여" 및 "~에 대하여"는, 소정 아미노산 또는 폴리뉴클레오티드 서열의 넘버링 내용에서 사용되었을때, 소정 아미노산 또는 폴리뉴클레오티드 서열이 기준 서열과 비교시 구체화된 기준 서열의 잔기의 넘버링을 지칭한다. 달리 말하면, 소정 중합체의 잔기 번호 또는 잔기 위치는 소정 아미노산 또는 폴리뉴클레오티드 서열 내 잔기의 실제 숫자 위치라기 보다는 기준 서열과 관련하여 지정된다. 예를 들면, 소정 아미노산 서열, 예컨대 조작된 글리코실트랜스퍼라제의 경우, 2개의 서열 간 잔기 대응을 최적화하도록 갭을 도입함으로써 기준 서열에 정렬시킬 수 있다. 이러한 경우, 갭이 존재하더라도, 소정 아미노산 또는 폴리뉴클레오티드 서열 내 잔기의 넘버링은 정렬되는 기준 서열과 관련하여 이루어진다.

본원에 사용된 바와 같이, "실질적 동일성"은 적어도 20 잔기 위치의 비교 창, 빈번하게는 적어도 30-50 잔기의 비교 창에 대하여 기준 서열과 비교함으로써 적어도 80%의 서열 동일성, 적어도 85%의 동일성, 적어도 89-95%의 서열 동일성, 또는 더욱 일반적으로, 적어도 99%의 서열 동일성을 갖는 폴리뉴클레오티드 또는 폴리펩티드 서열을 지칭하고, 서열 동일성 백분율은 비교 창에 대해 기준 서열의 총 20% 이하인 결실 또는 추가를 포함하는 서열에 기준 서열을 비교함으로써 계산된다. 폴리펩티드에 적용되는 일부 특정 실시양태에서, 용어 "실질적 동일성"은 2개의 폴리펩티드 서열이, 디폴트 갭 웨이트를 사용한 프로그램 GAP 또는 BESTFIT 등에 의해 최적으로 정렬시, 적어도 80% 서열 동일성, 바람직하게는 적어도 89% 서열 동일성, 적어도 95% 서열 동일성 또는 그 이상(예, 99% 서열 동일성)을 공유하는 것을 의미한다. 일부 실시양태에서, 비교하고자 하는 서열에서 동일하지 않은 잔기 위치는 보존성 아미노산 치환과 상이하다.

본원에 사용된 바와 같이, "아미노산 차이" 및 "잔기 차이"는 기준 서열 내 상응하는 위치의 아미노산 잔기에 대한 폴리펩티드 서열의 위치에서 아미노산 잔기의 차이를 지칭한다. 아미노산 차이의 위치는 일반적으로 본원에서 "Xn"이라고 하고, 여기서 n은 잔기 차이를 기초로 하는 기준 서열 내 상응하는 위치를 의미한다. 예를 들면, "서열번호 4와 비교시 위치 X93에서의 잔기 차이"는 서열번호 4의 위치 93에 상응하는 폴리펩티드 위치에서의 아미노산 잔기의 차이를 의미한다. 따라서, 서열번호 4의 기준 폴리펩티드가 위치 93에 세린을 가지면, "서열번호 4와 비교시 위치 X93에서 잔기 차이"는 서열번호 4의 위치 93에 상응하는 폴리펩티드의 위치에서 세린 이외의 임의 잔기의 아미노산 치환을 의미한다. 본원의 대부분의 예에서, 일정 위치에서 특정 아미노산 잔기 차이는 "XnY"로 표시되고 여기서 "Xn"은 상기 기술된 상응하는 위치를 특정하고, "Y"는 조작된 폴리펩티드에서 발견되는 아미노산의 단일 문자 식별자(즉, 기준 폴리펩티드에서와는 다른 잔기)이다. 일부 예에서, 본 발명은 또한 통상적인 표기법 "AnB"로 표시된 특정한 아미노산 차이를 제공하며, 여기서 A는 기준 서열 내 잔기의 단일 문자 식별자이고, "n"은 기준 서열 내 잔기 위치의 번호이며, B는 조작된 폴리펩티드의 서열 내 잔기 치환의 단일 문자 식별자이다. 일부 예에서, 본 발명의 폴리펩티드는, 잔기 차이가 기준 서열에 대해 존재하는 특정 위치의 목록으로 표시되는 기준 서열에 대한 하나 이상의 아미노산 잔기 차이를 포함할 수 있다. 일부 실시양태에서, 하나 이상의 아미노산이 폴리펩티드의 특정 잔기 위치에서 사용될 수 있는 경우, 사용될 수 있는 다양한 아미노산 잔기는 "/"에 의해 구분된다(예, X307H/X307P 또는 X307H/P). 슬래시는 또한 소정 변이체 내 다중 치환을 가리키는 데 사용될 수도 있다(즉, 소정 서열에 하나 이상의 치환이 존재함). 일부 실시양태에서, 본 발명은 보존성 또는 비보존성 아미노산 치환을 포함하는 하나 이상의 아미노산 차이를 포함하는 조작된 폴리펩티드 서열을 포함한다. 일부 추가 실시양태에서, 본 발명은 보존성 및 비보존성 아미노산 치환을 둘다 포함하는 조작된 폴리펩티드 서열을 제공한다.

본원에 사용된 바와 같이, "보존성 아미노산 치환"은 유사한 측쇄를 갖는 상이한 잔기로 잔기를 치환하는 것을 의미하고, 따라서 통상 같거나 유사하게 정의된 아미노산 부류 내 아미노산으로 폴리펩티드의 아미노산 치환을 포함한다. 제한없이 예로서, 지방족 측쇄를 갖는 아미노산은 다른 지방족 아미노산(예, 알라닌, 발린, 류신, 및 이소류신)으로 치환되고, 히드록실 측쇄를 갖는 아미노산은 히드록실 측쇄를 갖는 다른 아미노산(예, 세린 및 트레오닌)으로 치환되며, 방향족 측쇄를 갖는 아미노산은 방향족 측쇄를 갖는 다른 아미노산(예, 페닐알라닌, 티로신, 트립토판 및 히스티딘)으로 치환되고, 염기성 측쇄를 갖는 아미노산은 염기성 측쇄를 갖는 다른 아미노산(예, 리신 및 아르기닌)으로 치환되며, 산성 측쇄를 갖는 아미노산은 산성 측쇄를 갖는 다른 아미노산(예, 아스파르트산 또는 글루탐산)으로 치환되고, 및/또는 소수성 또는 친수성 아미노산은 각각 다른 소수성 또는 친수성 아미노산으로 치환된다.

본원에 사용된 바와 같이, "비보존성 치환"은 유의하게 다른 측쇄 특성을 갖는 아미노산으로 폴리펩티드의 아미노산 치환을 의미한다. 비보존성 치환은 정의된 군에 속하기 보다는, 그들 사이의 아미노산을 사용할 수 있고, (a) 치환 영역 내 펩티드 골격의 구조(예, 글리신 대신 프롤린); (b) 전하 또는 소수성; 또는 (c) 측쇄의 규모에 영향을 미칠 수 있다. 제한없이 예로서, 예시적인 비보존성 치환은 염기성 또는 지방족 아미노산으로 치환된 산성 아미노산; 소형 아미노산으로 치환된 방향족 아미노산; 및 소수성 아미노산으로 치환된 친수성 아미노산일 수 있다.

본원에 사용된 바와 같이, "결실"은 기준 폴리펩티드로부터 하나 이상의 아미노산의 제거에 의한 폴리펩티드 개질을 의미한다. 결실은 조작된 글리코실트랜스퍼라제 효소의 개선된 특성을 유지하고/하거나 효소 활성을 유지하면서 기준 효소를 구성하는 아미노산의 총 갯수의 1개 이상의 아미노산, 2개 이상의 아미노산, 5개 이상의 아미노산, 10개 이상의 아미노산, 15개 이상의 아미노산, 또는 20개 이상의 아미노산, 총 아미노산 갯수의 최대 10%, 또는 총 아미노산 갯수의 최대 20%의 제거를 포함할 수 있다. 결실은 폴리펩티드의 내부 영역 및/또는 말단 영역에 대한 것일 수 있다. 다양한 실시양태에서, 결실은 연속되는 절편을 포함하거나 비연속적일 수 있다.

본원에 사용된 바와 같이, "삽입"은 기준 폴리펩티드로부터 하나 이상의 아미노산의 추가에 의한 폴리펩티드의 개질을 의미한다. 삽입은 폴리펩티드의 내부 영역에 있거나, 또는 카르복시 또는 아미노 말단에 있을 수 있다. 본원에서 사용되는 삽입은 당업계에 공지된 바와 같은 융합 단백질을 포함한다. 삽입은 아미노산의 인접하는 절편이거나 또는 천연 발생 폴리펩티드 내 하나 이상의 아미노산에 의해 이격될 수 있다.

"기능적 단편" 및 "생물학적 활성 단편"은 본원에서 상호혼용되고, 아미노 말단 및/또는 카르복시 말단 결실(들) 및/또는 내부 결실을 갖지만, 나머지 아미노산 서열이 비교되는 서열(즉, 본 발명의 전장 조작된 글리코실트랜스퍼라제)의 상응하는 위치와 동일하고 전장 폴리펩티드의 실질적으로 전체 활성을 보유하는 폴리펩티드를 의미한다.

본원에 사용된 바와 같이, "단리된 폴리펩티드"는 천연적으로 이와 수반되는 다른 오염물(예, 단백질, 지질 및 폴리뉴클레오티드)로부터 실질적으로 분리된 폴리펩티드를 의미한다. 이 용어는 그들의 천연 발생 환경 또는 발현계(예, 숙주 세포 또는 시험관내 합성)로부터 분리되거나 또는 정제된 폴리펩티드를 포함한다. 재조합 글리코실트랜스퍼라제 폴리펩티드는 세포 내에 존재하거나, 세포 배지에 존재하거나, 또는 다양한 형태, 예컨대 용해물 또는 단리된 조제물로서 생산될 수 있다. 이처럼, 일부 실시양태에서, 재조합 글리코실트랜스퍼라제 폴리펩티드는 단리된 폴리펩티드일 수 있다.

본원에 사용된 바와 같이, "실질적으로 순수한 폴리펩티드"는 그 폴리펩티드 종이 존재하는 우세한 종(즉, 몰 또는 중량 기준으로 조성물 내 임의의 다른 개별 거대 분자 종 보다 더 풍부함)인 조성물을 의미하고, 일반적으로 대상 종이 몰 또는 중량% 기준으로 존재하는 거대 분자 종의 적어도 약 50%를 포함하는 경우 실질적으로 순수한 조성물이다. 하지만, 일부 실시양태에서, 글리코실트랜스퍼라제를 포함하는 조성물은 50% 미만(예, 약 10%, 약 20%, 약 30%, 약 40% 또는 약 50%)으로 순수한 글리코실트랜스퍼라제를 포함한다. 일반적으로, 실질적으로 순수한 글리코실트랜스퍼라제 조성물은 몰 또는 중량% 기준으로 조성물에 존재하는 모든 존재하는 거대분자 종 중 약 60% 이상, 약 70% 이상, 약 80% 이상, 약 90% 이상, 약 95% 이상, 및 약 98% 이상을 포함한다. 일부 실시양태에서, 대상 종은 본질적으로 균질하게 정제되고(즉, 오염 종이 기존의 검출 방법으로는 조성물에서 검출될 수 없음), 여기서 조성물은 본질적으로 단일한 거대분자 종으로 이루어진다. 용매 종, 소형 분자(< 500 달톤), 및 원소 이온 종은 거대분자 종으로 고려하지 않는다. 일부 실시양태에서, 단리된 재조합 글리코실트랜스퍼라제 폴리펩티드는 실질적으로 순수한 폴리펩티드 조성물이다.

본원에 사용된 바와 같이, "개선된 효소 특성"은 효소의 적어도 하나의 개선된 특성을 나타낸다. 일부 실시양태에서, 본 발명은 기준 글리코실트랜스퍼라제 폴리펩티드 및/또는 야생형 글리코실트랜스퍼라제 폴리펩티드, 및/또는 다른 조작된 글리코실트랜스퍼라제 폴리펩티드와 비교시 임의의 효소 특성의 개선을 나타내는 조작된 글리코실트랜스퍼라제 폴리펩티드를 제공한다. 따라서, "개선" 수준은 야생형, 그리고 조작된 글리코실트랜스퍼라제를 포함한 다양한 글리코실트랜스퍼라제 폴리펩티드를 결정하고 비교할 수 있다. 개선된 특성은 제한없이 증가된 단백질 발현, 증가된 열활성, 증가된 열안정성, 증가된 pH 활성, 증가된 안정성, 증가된 효소 활성, 증가된 기질 특이성 또는 친화성, 증가된 비활성, 증가된 기질에 대한 내성 또는 최종 산물 억제성, 증가된 화학적 안정성, 증가된 화학선택성, 개선된 용매 안정성, 산성 pH에 대한 증가된 내성, 단백질분해 활성에 대한 증가된 내성(즉, 단백질분해에 대한 감소된 감응성), 감소된 응집성, 증가된 용해성, 및 변경된 온도 프로파일 등과 같은 특성을 포함한다.

본원에 사용된 바와 같이, "증가된 효소 활성" 및 "향상된 촉매 활성"은 기준 글리코실트랜스퍼라제 효소와 비교시 비활성(예, 생산된 산물/시간/중량 단백질)의 증가 또는 기질의 산물로의 전환율(예, 특정량의 글리코실트랜스퍼라제를 사용하여 특정 기간에 기질의 출발량에서 산물로의 전환되는 비율)의 증가로 대표될 수 있는 조작된 글리코실트랜스퍼라제 폴리펩티드의 개선된 특성을 의미한다. 효소 활성을 측정하는 예시적인 방법은 실시예에 제공한다. 효소 활성과 관련된 임의의 특성은 그 변화가 증가된 효소 활성을 일으킬 수 있는, K _m , V _max 또는 k _cat 의 고전적인 효소 특성을 포함하여, 영향받을 수 있다. 효소 활성의 개선은 상응하는 야생형 효소의 효소 활성의 약 1.1배부터, 천연 발생 글리코실트랜스퍼라제 또는 글리코실트랜스퍼라제 폴리펩티드가 유도된 다른 조작된 글리코실트랜스퍼라제 보다 2배, 5배, 10배, 20배, 25배, 50배, 75배, 100배, 150배, 200배 또는 그 이상의 효소 활성일 수 있다.

본원에 사용된 바와 같이, "전환"은 상응하는 산물(들)로 기질(들)의 효소적 전환 (또는 생물변환)을 의미한다. "전환율"은 특정 조건 하에서 일정 기간 내에 산물로 전환되는 기질의 백분율을 의미한다. 따라서, 글리코실트랜스퍼라제 폴리펩티드의 "효소적 활성" 또는 "활성"은 특정 기간 내 산물로의 기질의 "전환율"로서 표현될 수 있다.

"일반종 특성"을 가진 효소 (또는 "일반종 효소")는 모 서열과 비교시 광범위한 범위의 기질에 개선된 활성을 나타내는 효소를 의미한다. 일반종 효소는 모든 가능한 기질에 개선된 활성을 반드시 입증하는 것은 아니다. 일부 실시양태에서, 본 발명은 일반종 특성을 가진 글리코실트랜스퍼라제 변이체를 제공하고, 즉 이는 광범위한 범위의 입체적 및 전자적 다양한 기질에 대해 모 유전자와 관련하여 유사하거나 개선된 활성을 입증한다. 또한, 본원에 제공된 일반종 효소는 대사산물/산물의 형성을 증가시키기 위해 광범위한 범위의 다양한 분자에 걸쳐 개선되도록 조작되었다.

본원에 사용된 용어 "혼성화 엄격 조건"은 핵산 하이브리드가 안정한 조건을 의미한다. 당업자에게 공지된 바와 같이, 하이브리드의 안정성은 하이브리드의 용융 온도(T _m )에서 반영된다. 일반적으로, 하이브리드의 안정성은 이온 강도, 온도, G/C 함량 및 카오트로픽제의 함수이다. 폴리뉴클레오티드의 T _m 값은 용융 온도를 예측하기 위한 공지된 방법을 사용하여 계산될 수 있다(예, Baldino et al., Meth. Enzymol., 168:761-777 [1989]; Bolton et al., Proc. Natl. Acad. Sci. USA 48:1390 [1962]; Bresslauer et al., Proc. Natl. Acad. Sci. USA 83:8893-8897 [1986]; Freier et al., Proc. Natl. Acad. Sci. USA 83:9373-9377 [1986]; Kierzek et al., Biochem., 25:7840-7846 [1986]; Rychlik et al., 1990, Nucl. Acids Res., 18:6409-6412 [1990] (erratum, Nucl. Acids Res., 19:698 [1991]); Sambrook et al., 상술); Suggs et al., 1981, in Developmental Biology Using Purified Genes, Brown et al. [eds.], pp. 683-693, Academic Press, Cambridge, MA [1981]; 및 Wetmur, Crit. Rev. Biochem. Mol. Biol., 26:227-259 [1991] 참조). 일부 실시양태에서, 폴리뉴클레오티드는 본원에 개시된 폴리펩티드를 코딩하고, 규정된 조건, 예컨대 적당히 엄격하거나 고도로 엄격한 조건 하에서, 본 발명의 조작된 글리코실트랜스퍼라제 효소를 코딩하는 서열의 상보체와 혼성화된다.

본원에 사용된 바와 같이, "혼성화 엄격성"은 핵산의 혼성화 시, 세척 조건 등과 같은 혼성화 조건과 관련된다. 일반적으로, 혼성화 반응은 낮은 엄격성 조건 하에서 수행된 후 다양하지만 높은 엄격성의 세척이 후속된다. 용어 "중간 엄격 혼성화"는 표적 DNA와 약 60% 동일성, 바람직하게는 약 75% 동일성, 약 85% 동일성을 갖고, 표적 폴리뉴클레오티드에 대해 약 90% 넘는 동일성을 갖는, 상보적 핵산에 표적 DNA가 결합할 수 있게 하는 조건을 의미한다. 예시적인 중간 엄격 조건은 42℃에서 50% 포름아미드, 5× 덴하르트 용액, 5×SSPE, 0.2% SDS에서의 혼성화에 이어서, 42℃에서 0.2×SSPE, 0.2% SDS 중 세척이 후속되는 것과 균등한 조건이다. "고엄격 혼성화"는 일반적으로 정의된 폴리뉴클레오티드 서열에 대한 용액 조건 하에서 결정된 열 용융 온도(T _m )로부터 약 10℃ 이하인 조건을 의미한다. 일부 실시양태에서, 고엄격 조건은 65℃에 0.018 M NaCl에서 안정한 하이브리드를 형성하는 핵산 서열만의 혼성화를 가능케하는 조건을 의미한다(즉, 하이브리드가 65℃에 0.018 M NaCl에서 안정하지 않으면, 본원에서 고려되는 고엄격 조건 하에서 안정하지 않음). 고엄격 조건은, 예를 들면 42℃에 50% 포름아미드, 5× 덴하르트 용액, 5×SSPE, 0.2% SDS와 균등한 조건에서의 혼성화에 이어서, 65℃에서 0.1×SSPE, 및 0.1% SDS 중에서의 세척이 후속되는 것에 의해 제공될 수 있다. 다른 고엄격 조건은 65℃에서 0.1%(w:v) SDS를 포함하는 5X SSC에서의 혼성화 및 65℃에서 0.1% SDS를 포함하는 0.1x SSC로 세척하는 것과 균등한 조건에서의 혼성화이다. 중간 엄격 조건을 비롯하여, 다른 고엄격 혼성화는 상기 인용된 참조문헌에 기술되어 있다.

본원에 사용된 바와 같이, "코돈 최적화"는 코딩된 단백질이 관심 유기체에서 효율적으로 발현되도록 특정 유기체에서 우선적으로 사용되는 것으로 단백질을 코딩하는 폴리뉴클레오티드의 코돈을 변화시키는 것을 의미한다. 대부분의 아미노산이 "동의어" 또는 "동의" 코돈이라고 하는, 몇몇 코돈에 의해 표시된다는 점에서, 유전자 코드가 축퇴적이지만, 특정 유기체에 의한 코돈 용법은 임의적이지 않고 특정 코돈 트리플렛에 편향적인 것으로 잘 공지되어 있다. 이러한 코돈 용법 편향성은 소정 유전자, 공통 기능 또는 조상 기원의 유전자, 고도로 발현되는 단백질 대 낮은 복제수 단백질, 및 유기체 게놈의 집합적 단백질 코딩 영역과 관련하여 더 높을 수 있다. 일부 실시양태에서, 글리코실트랜스퍼라제 효소를 코딩하는 폴리뉴클레오티드는 발현을 위해 선택된 숙주 유기체로부터 최적 생산을 위해 코돈 최적화될 수 있다.

본원에 사용된 바와 같이, "바람직한", "최적의" 및 "고 코돈 용법 편향성" 코돈은 단독으로 또는 조합하여 사용시 단백질 코딩 영역에 있어서 동일 아미노산을 코딩하는 다른 코돈보다 더 높은 빈도로 사용되는 코돈을 상호교환적으로 의미한다. 바람직한 코돈은 단일 유전자에서의 코돈 용법, 공통 기능 또는 기원의 유전자 세트, 고도로 발현된 유전자, 전체 유기체의 집합적 단백질 코딩 영역에서의 코돈 빈도, 관련 유기체의 집합적 단백질 코딩 영역에서의 코돈 빈도, 또는 이의 조합과 관련하여 결정될 수 있다. 유전자 발현 수준에 따라 빈도가 증가하는 코돈은 통상 발현에 최적의 코돈이다. 특정 유기체에서의 코돈 빈도(예, 코돈 용법, 관련 동의 코돈 용법) 및 코돈 선호도를 측정하기 위해, 클러스터 분석 또는 대응 분석 등을 사용하는 다변량 분석, 및 유전자에 사용된 효과적인 코돈 갯수를 비롯한 다양한 방법이 공지되어 있다(예, GCG CodonPreference, Genetics Computer Group Wisconsin Package; CodonW, Peden, University of Nottingham; McInerney, Bioinform., 14:372-73 [1998]; Stenico et al., Nucl. Acids Res., 222437-46 [1994]; Wright, Gene 87:23-29 [1990] 참조). 다수의 상이한 유기체에 코돈 용법 표를 이용할 수 있다(예, Wada et al., Nucl. Acids Res., 20:2111-2118 [1992]; Nakamura et al., Nucl. Acids Res., 28:292 [2000]; Duret, et al., supra; Henaut and Danchin, in Escherichia coli and Salmonella , Neidhardt, et al. (eds.), ASM Press, Washington D.C., p. 2047-2066 [1996] 참조). 코돈 용법을 수득하기 위한 데이타 공급원은 단백질을 코딩할 수 있는 임의의 이용가능한 뉴클레오티드 서열에 의존할 수 있다. 이러한 데이타 세트는 발현된 단백질을 코딩하는 것으로 실제 공지된 핵산 서열(예, 완전한 단백질 코딩 서열-CDS), 발현된 서열 태그(ESTS), 또는 게놈 서열의 예측된 코딩 영역(예, Mount, Bioinformatics: Sequence and Genome Analysis, Chapter 8, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. [ 2001]; Uberbacher, Meth. Enzymol., 266:259-281 [1996]; and Tiwari et al., Comput. Appl. Biosci., 13:263-270 [1997] 참조)을 포함한다.

본원에 사용된 바와 같이, "제어 서열"은 본 발명의 폴리뉴클레오티드 및/또는 폴리펩티드의 발현에 필수적이거나 또는 유리한 모든 성분을 포함한다. 각각의 제어 서열은 폴리펩티드를 코딩하는 핵산 서열에 대해 내생적이거나 또는 외생적일 수 있다. 이러한 제어 서열은 제한없이, 리더, 폴리아데닐화 서열, 프로펩티드 서열, 프로모터 서열, 신호 펩티드 서열, 개시 서열, 및 전사 종결부를 포함한다. 최소한으로, 제어 서열은 프로모터, 및 전사 및 번역 중지 신호를 포함한다. 제어 서열은 폴리펩티드를 코딩하는 핵산 서열의 코딩 영역과 제어 서열의 결찰을 용이하게 하는 특정 제한효소 부위를 도입하려는 목적의 링커가 제공될 수 있다.

"작동가능하게 연결된"은 제어 서열이 관심 폴리뉴클레오티드 및/또는 폴리펩티드의 발현을 지정하거나 또는 조절하도록 관심 폴리뉴클레오티드에 대한 위치에 적절하게 위치(즉, 기능적 관련성으로)된 구성으로 본원에 정의된다.

"프로모터 서열"은 관심 폴리뉴클레오티드, 예컨대 코딩 서열의 발현을 위해 숙주 세포에 의해 인식되는 핵산 서열을 의미한다. 프로모터 서열은 관심 폴리뉴클레오티드의 발현을 매개하는 전사 제어 서열을 함유한다. 프로모터는 숙주 세포에 대해 동종성이거나 또는 이종성인 세포외 또는 세포내 폴리펩티드를 코딩하는 유전자로부터 얻을 수 있고, 돌연변이체, 절두형 및 하이브리드 프로모터를 포함하여 선택 숙주 세포에서 전사 활성을 보이는 임의의 핵산 서열일 수 있다.

용어 "적합한 반응 조건"은 본 발명의 글리코실트랜스퍼라제 폴리펩티드가 기질에서 바람직한 생성 화합물로 전환될 수 있는 효소 전환 반응 용액의 조건(예, 효소 적재, 기질 적재, 온도, pH, 완충액, 공용매 등의 범위)을 의미한다. 일부 예시적인 "적합한 반응 조건"은 본원에서 제공한다.

본원에 사용된 바와 같이, "적재(loading)" 예컨대 "화합물 적재" 또는 "효소 적재"는 반응의 출발시 반응 혼합물 중 성분의 농도 또는 양을 의미한다.

본원에 사용된 바와 같이, 효소 전환 반응 과정에서 "기질"은 글리코실트랜스퍼라제 폴리펩티드가 작용하는 화합물 또는 분자를 의미한다.

본원에 사용된 바와 같이, 효소 전환 과정에서 "산물"은 기질에 대한 글리코실트랜스퍼라제 폴리펩티드의 작용 결과로 생성된 화합물 또는 분자를 의미한다.

본원에 사용된 바와 같이, 용어 "배양하는"은 (예, 액체, 겔 또는 고체 배지를 사용하는) 임의의 적합한 조건 하에서 미생물 세포 개체군의 성장을 의미한다.

재조합 폴리펩티드는 당업계에 공지된 임의의 적합한 방법을 사용하여 형성될 수 있다. 야생형 관심 폴리펩티드를 코딩하는 유전자는 벡터, 예컨대 플라스미드에서 클로닝되고, 바람직한 호스트, 예컨대 이. 콜라이(E. coli)에서 발현될 수 있다. 재조합 폴리펩티드의 변이체는 당업계에 공지된 다양한 방법에 의해 생성될 수 있다. 실제로, 광범위하게 다양한 상이한 돌연변이유발 기법이 당업계에 잘 공지되어 있다. 추가로, 돌연변이유발 키트 또한 수많은 상업적 분자 생물 공급자로부터 입수할 수 있다. 정해진 아미노산에서 특정 치환(부위-지정), 유전자의 국소 영역내 특이적 또는 무작위 돌연변이(위치 특이적), 또는 전체 유전자에 대한 무작위 돌연변이유발(예, 포화 돌연변이유발)을 실시할 수 있는 방법이 이용가능하다. 제한없이, PCR을 사용한 단일 가닥 DNA 또는 이중 가닥 DNA의 부위 지정 돌연변이유발법, 카세트 돌연변이유발법, 유전자 합성법, 에러-프론 PCR, 셔플링, 및 화학적 포화 돌연변이 유발법, 또는 당분야에 공지된 임의의 다른 적합한 방법을 포함하여, 효소 변이체를 생성하기 위한 수많은 적합한 방법들이 당분야에 알려져 있다. DNA 및 단백질 조작에 사용되는 방법들의 비제한적인 예들이 다음의 특허에 제공되어 있다: 미국 특허 번호 6,117,679; 미국 특허 번호 6,420,175; 미국 특허 번호 6,376,246; 미국 특허 번호 6,586,182; 미국 특허 번호 7,747,391; 미국 특허 번호 7,747,393; 미국 특허 번호 7,783,428; 및 미국 특허 번호 8,383,346. 변이체를 생산한 후, 그들은 임의의 바람직한 특성(예, 높거나 증가된 활성, 또는 낮거나 감소된 활성, 증가된 열적 활성, 증가된 열 안정성, 및/또는 산성 pH 안정성 등)에 대해 스크리닝될 수 있다. 일부 실시양태에서, "재조합 글리코실트랜스퍼라제 폴리펩티드"(본원에서 또한 "조작된 글리코실트랜스퍼라제 폴리펩티드", "변이체 글리코실트랜스퍼라제 효소", 및 "글리코실트랜스퍼라제 변이체")가 사용된다.

본원에 사용된 바와 같이, "벡터"는 DNA 서열을 세포로 도입시키기 위한 DNA 구성체이다. 일부 실시양태에서, 벡터는 적합한 숙주에서 DNA 서열에서 코딩되는 폴리펩티드의 발현을 실시할 수 있는 적합한 제어 서열에 작동가능하게 연결된 발현 벡터이다. 일부 실시양태에서, "발현 벡터"는 숙주 세포에서 발현을 구동하기 위한 DNA 서열(예를 들면, 이식유전자)에 작동가능하게 연결된 프로모터 서열을 갖고, 일부 실시양태에서, 또한 전사 종결 서열을 포함한다.

본원에 사용된 바와 같이, 용어 "발현"은 제한없이, 전사, 전사후 개질, 번역, 및 번역후 개질을 포함한 폴리펩티드의 생산에 관여되는 임의의 단계를 포함한다. 일부 실시양태에서, 이 용어는 또한 세포로부터 폴리펩티드의 분비를 포함한다.

본원에 사용된 바와 같이, 용어 "생산하다"는 세포에 의한 단백질 및/또는 다른 화합물의 생산을 의미한다. 이 용어는 제한없이, 전사, 전사후 개질, 번역, 및 번역후 개질을 포함한, 폴리펩티드의 생산에 관여되는 임의의 단계를 포함하고자 한다. 일부 실시양태에서, 이 용어는 또한 세포로부터 폴리펩티드의 분비를 포함한다.

본원에 사용된 바와 같이, 아미노산 또는 뉴클레오티드 서열(예, 프로모터 서열, 신호 펩티드, 종결 서열 등)은 2개의 서열이 자연계에서 회합되지 않았으면 작동가능하게 연결된 다른 서열에 대해 "이종성"이다. 예를 들면, "이종성 폴리뉴클레오티드"는 실험실 기법에 의해 숙주 세포로 도입되는 임의의 폴리뉴클레오티드이고, 실험실 조작이 실시된 숙주 세포로부터 제거된 후, 숙주 세포로 재도입되는 폴리뉴클레오티드를 포함한다.

본원에 사용된 바와 같이, 용어 "숙주 세포" 및 "숙주 균주"는 본원에서 제공하는 DNA(예, 글리코실트랜스퍼라제 변이체를 코딩하는 폴리뉴클레오티드)를 포함하는 발현 벡터에 적합한 숙주를 의미한다. 일부 실시양태에서, 숙주 세포는 당업계에 공지된 재조합 DNA 기법을 사용해 제작된 벡터로 형질전환 또는 형질감염된 원핵생물 또는 진핵생물 세포이다.

용어 "유사체"는 기준 폴리펩티드에 대해 70%를 넘는 서열 동일성이지만 100% 보다 낮은 서열 동일성(예, 75%, 78%, 80%, 83%, 85%, 88%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%를 넘는 서열 동일성)을 갖는 폴리펩티드를 의미한다. 일부 실시양태에서, 유사체는 천연 발생 아미노산을 비롯하여 제한없이 호모아르기닌, 오리니틴 및 노르발린을 포함한 하나 이상의 비천연 발생 아미노산을 함유하는 폴리펩티드를 의미한다. 일부 실시양태에서, 유사체는 또한 둘 이상의 아미노산 잔기 사이에 하나 이상의 D-아미노산 잔기 및 비펩티드 연결부를 포함한다.

용어 "유효량"은 바람직한 결과를 생성하기에 충분한 양을 의미한다. 당업자는 통상적인 실험법을 사용해 유효량이 무엇인지 결정할 수 있다.

용어 "단리된" 및 "정제된"은 천연적으로 회합된 하나 이상의 다른 성분이 제거된 분자(예, 단리된 핵산, 폴리펩티드 등) 또는 다른 성분을 의미하는 것으로 사용된다. 용어 "정제된은 절대 순도를 요구하지 않으며, 그 보다는 상대적 정의를 의도하는 것이다.

"입체선택성"은 하나의 입체이성질체가 다른 것보다 화학적 또는 효소 반응에서 우선적으로 형성되는 것을 의미한다. 입체선택성은 하나의 입체이성질체의 형성이 나머지보다 선호되는 경우 부분적일 수 있거나, 단 하나의 입체이성질체가 형성되는 경우 완전할 수 있다. 입체이성질체가 거울상이성질체인 경우, 입체선택성은 거울상선택성으로서, 두 거울상이성질체의 합에서 하나의 거울상이성질체의 분율(통상, 백분율로 보고됨)로 지칭된다. 당업계에는 (통상, 백분율로서) 공통적으로 대안적으로 거울상이성질체 과잉(e.e.)이 식 [주 거울상이성질체 - 부 거울상이성질체]/[주 거울상이성질체 + 부 거울상이성질체]에 따라 계산되는 것으로 보고된다. 입체이성질체가 부분입체이성질체인 경우, 입체선택성은 부분입체선택성으로서, 부분입체이성질체 과잉(d.e.)으로 공통적으로 대안적으로 보고되는, 두 부분입체이성질체의 혼합물에서 하나의 부분입체이성질체의 분율(통상, 백분율로 보고됨)로 지칭된다. 거울상이성질체 과잉 및 부분입체이성질체 과잉은 입체이성질체 과잉의 유형이다.

본원에 사용된 바와 같이, 용어 "위치선택성" 및 "위치선택적 반응"은 결합 생성 및 분해의 한 방향이 다른 가능한 모든 방향보다 우선적으로 발생하는 반응을 의미한다. 식별이 완전한 경우 반응은 완전하게(100%) 위치선택적일 수 있고, 산물 화합물(2)(즉, 불필요한 산물 (2S,5S)-히드록시피페콜산보다 2S,3S0-히드록시피페콜산)의 우선 형성 등의 한 부위에서의 반응 산물이 다른 부위에서의 반응 산물보다 우세한 경우, 실질적으로 위치선택적이거나(적어도 75%), 또는 부분적으로 위치선택적이다(x%, 백분율은 관심 반응에 따라 설정됨).

본원에 사용된 바와 같이, "열안정성"은 소정 시간(예, 0.5-24 h) 동안 고온(예, 40-80℃)에 노출시킨 후 동일 고온에 노출된 야생형 효소와 비교하여 유사 활성(예, 60% 이상 내지 80%)을 유지하는 글리코실트랜스퍼라제 폴리펩티드를 의미한다.

본원에 사용된 바와 같이, "용매 안정성"은 소정 시간(예, 0.5-24 h) 동안 가변 농도(예, 5-99%)의 용매(에탄올, 이소프로필 알콜, 디메틸설폭시드(DMSO), 테트라히드로푸란, 2-메틸테트라히드로푸란, 아세톤, 톨루엔, 부틸 아세테이트, 메틸 tert-부틸 에테르 등)에 노출시킨 후 동일 농도의 동일 용매에 노출된 야생형 효소와 비교하여 유사 활성(예, 60% 이상 내지 80%)을 유지하는 글리코실트랜스퍼라제 폴리펩티드를 의미한다.

본원에 사용된 바와 같이, "열 및 용매 안정성"은 열안정성 및 용매 안정성인 글리코실트랜스퍼라제 폴리펩티드를 의미한다.

본원에 사용된 바와 같이, "환원제"는 Fe⁺³을 Fe⁺²로 전환시킬 수 있는 화합물 또는 제제를 의미한다. 예시적인 환원제는 아스코르브산이며, 이는 일반적으로 L-아스코르브산 형태이다.

"알킬"은 총 1-18개의 탄소 원자, 더욱 바람직하게는 총 1-8개의 탄소 원자, 가장 바람직하게는 총 1-6개의 탄소 원자의 직쇄 또는 분지쇄인 포화 탄화수소 기를 의미한다. 특정 갯수의 탄소 원자를 갖는 알킬은 괄호 안을 나타낸다(예, (C₁-C₆)알킬은 1-6개의 탄소 원자의 알킬을 의미함).

"알케닐"은 적어도 하나의 이중 결합을 함유하지만 경우에 따라 하나보다 많은 이중 결합을 함유하는 직쇄 또는 분지쇄인 총 2-12개의 탄소 원자의 탄화수소 기를 나타낸다.

"알키닐"은 적어도 하나의 삼중 결합을 함유하지만 경우에 따라 하나보다 많은 삼중 결합을 함유하고, 또한 경우에 따라 하나 이상의 이중 결합 모이어티를 함유하는 직쇄 또는 분지쇄인 총 2-12개의 탄소 원자의 탄화수소 기를 나타낸다.

"알킬렌"은 하나 이상의 적당한 치환기로 임의 치환되는, 총 1-18개의 탄소 원자, 더욱 바람직하게는 총 1-8개의 탄소 원자, 가장 바람직하게는 총 1-6개의 탄소 원자를 갖는 직쇄 또는 분지쇄 2가 탄화수소 라디칼을 나타낸다. 예시적인 "알킬렌"은, 제한없이, 메틸렌, 에틸렌, 프로필렌, 부틸렌 등을 포함한다.

"알케닐렌"은 하나 이상의 적당한 치환기로 임의 치환되는, 총 2-12개의 탄소 원자 및 하나 이상의 탄소-탄소 이중 결합, 더욱 바람직하게는 총 2-8개의 탄소 원자, 가장 바람직하게는 총 2-6개의 탄소 원자를 갖는 직쇄 또는 분지쇄 2가 탄화수소 라디칼을 나타낸다.

본원에서 정의된 "헤테로알킬", "헤테로알케닐" 및 헤테로알키닐"은 각각 하나 이상의 탄소 원자가 각각 독립적으로 동일하거나 상이한 헤테로원자 또는 헤테로원자 기로 치환된 알킬, 알케닐 및 알키닐을 나타낸다. 탄소 원자를 치환할 수 있는 헤테로원자 및/또는 헤테로원자 기는, 제한없이 -O-, -S-, -S-O-, -NR^γ-, -PH-, -S(O)-, -S(O)₂-, -S(O)NR^γ-, -S(O)₂NR^γ- 등 및 이의 조합을 포함하고, 각 R^γ은 독립적으로 수소, 알킬, 시클로알킬, 헤테로시클로알킬, 아릴 및 헤테로아릴에서 선택된다.

"아릴"은 단일 고리(예, 페닐) 또는 다중 축합 고리(예, 나프틸 또는 안트릴)를 갖는 총 6-12개의 탄소 원자의 불포화된 방향족 카르보시클릭 기를 의미한다. 예시적인 아릴은 페닐, 피리딜, 나프틸 등을 포함한다.

"아릴알킬"은 바람직하게는 알킬 모이어티에서 총 1-6개의 탄소 원자를 갖고 아릴 모이어티에서 총 6-12개의 탄소 원자를 갖는 아릴로 치환된 알킬(즉, 아릴-알킬-기)을 의미한다. 이러한 아릴알킬 기는 벤질, 페네틸 등으로 예시된다.

"아릴옥시"는 -OR^λ 기를 나타내고, R^λ은 임의 치환될 수 있는 아릴 기이다.

"시클로알킬"은 1-3개의 알킬기로 임의 치환될 수 있는 단일 시클릭 고리 또는 다중 축합 고리를 갖는 총 3-12개의 탄소 원자의 시클릭 알킬기를 나타낸다. 예시적인 시클로알킬 기는, 제한없이, 단일 고리 구조, 예컨대 시클로프로필, 시클로부틸, 시클로펜틸, 시클로옥틸, 1-메틸시클로프로필, 2-메틸시클로펜틸, 2-메틸시클로옥틸 등, 또는 브릿지 고리계를 비롯한 다중 고리 구조, 예컨대 아다만틸 등을 포함한다.

"시클로알킬알킬"은 바람직하게는 알킬 모이어티에서 총 1-6개의 탄소 원자 및 시클로알킬 모이어티에서 총 3-12개의 탄소 원자를 갖는 시클로알킬로 치환된 알킬(즉, 시클로알킬-알킬-기)를 의미한다. 이러한 시클로알킬알킬 기는 시클로프로필메틸, 시클로헥실에틸 등으로 예시된다.

"아미노"는 -NH₂ 기를 의미한다. 치환된 아미노는 -NHR^η, NR^ηR^η, 및 NR^ηR^ηR^η 기를 의미하고, 각 R^η은 독립적으로 치환 또는 비치환된 알킬, 시클로알킬, 시클로헤테로알킬, 알콕시, 아릴, 헤테로아릴, 헤테로아릴알킬, 아실, 알콕시카르보닐, 설파닐, 설피닐, 설포닐 등에서 선택된다. 통상의 아미노 기는, 제한없이, 디메틸아미노, 디에틸아미노, 트리메틸암모늄, 트리에틸암모늄, 메틸설포닐아미노, 푸라닐-옥시-설파미노 등을 포함한다.

"아미노알킬"은 치환된 아미노 기를 포함한 하나 이상의 수소 원자가 하나 이상의 아미노 기로 치환되는 알킬 기를 의미한다.

"아미노카르보닐"은 -C(O)NH₂를 의미한다. 치환된 아미노카르보닐은 -C(O)NR^ηR^η을 의미하고, 아미노 기 NR^ηR^η은 본원에 정의된 바와 같다.

"옥시"는 에테르 및 에스테르를 비롯한 상이한 옥시 기를 형성하기 위해 다양한 치환기를 가질 수 있는 2가 기 -O-를 나타낸다.

"알콕시" 또는 "알킬옥시"는 본원에서 혼용되며, -OR^ζ 기를 의미하고, R^ζ는 임의 치환된 알킬 기를 포함한 알킬 기이다.

"카르복시"는 -COOH를 의미한다.

"카르보닐"은 산, 산 할라이드, 알데히드, 아미드, 에스테르 및 케톤을 포함한 상이한 카르보닐 기를 형성하기 위한 다양한 치환기를 가질 수 있는 -C(O)-를 의미한다.

"카르복시알킬"은 하나 이상의 수소 원자가 하나 이상의 카르복시 기로 치환되는 알킬을 의미한다.

"아미노카르보닐알킬"은 본원에 정의된 바와 같이 아미노카르보닐 기로 치환된 알킬을 의미한다.

"할로겐" 또는 "할로"는 플루오로, 클로로, 브로모 및 요오도를 의미한다.

"할로알킬"은 하나 이상의 수소 원자가 할로겐으로 치환되는 알킬 기를 의미한다. 따라서, 용어 "할로알킬"은 모노할로알킬, 디할로알킬, 트리할로알킬 등 최대 퍼할로알킬을 포함하는 것을 의미한다. 예를 들면, 용어 "(C₁-C₂) 할로알킬"은 1-플루오로메틸, 디플루오로메틸, 트리플루오로메틸, 1-플루오로에틸, 1,1-디플루오로에틸, 1,2-디플루오로에틸, 1,1,1 트리플루오로에틸, 퍼플루오로에틸 등을 포함한다.

"히드록시"는 -OH를 의미한다.

"히드록시알킬"은 하나 이상의 수소 원자가 하나 이상의 히드록시 기로 치환되는 알킬 기를 의미한다.

"티올" 또는 "설파닐"은 -SH를 의미한다. 치환된 티올 또는 설파닐은 -S-R^η을 의미하고, R^η은 알킬, 아릴 또는 다른 적당한 치환기이다.

"알킬티오"는 -SR^ζ를 의미하고, R^ζ은 임의 치환될 수 있는 알킬이다. 통상 알킬티오 기는 제한없이 메틸티오, 에틸티오, n-프로필티오 등을 포함한다.

"알킬티오알킬"은 알킬티오 기로 치환된 알킬, -SR^ζ을 의미하고, R^ζ은 임의 치환될 수 있는 알킬이다.

"설포닐"은 -SO₂-를 의미한다. 치환된 설포닐은 -SO₂-R^η을 의미하고, R^η은 알킬, 아릴 또는 다른 적당한 치환기이다.

"알킬설포닐"은 -SO₂-R^ζ을 의미하고, R^ζ은 임의 치환될 수 있는 알킬이다. 통상의 알킬설포닐 기는 제한없이 메틸설포닐, 에틸설포닐, n-프로필설포닐 등을 포함한다.

"알킬설포닐알킬"은 알킬설포닐 기로 치환된 알킬, -SO₂-R^ζ을 의미하고, R^ζ은 임의 치환될 수 있는 알킬이다.

"헤테로아릴"은 총 1-10개의 탄소 원자 및 고리 내 산소, 질소 및 황에서 선택된 총 1-4개의 헤테로원자의 방향족 헤테로시클릭 기를 의미한다. 이러한 헤테로아릴 기는 단일 고리(예, 피리딜 또는 푸릴) 또는 다중 축합 고리(예, 인돌리지닐 또는 벤조티에닐)를 가질 수 있다.

"헤테로아릴알킬"은 바람직하게는 알킬 모이어티에서 총 1-6개의 탄소 원자 및 헤테로아릴 모이어티에서 총 5-12개의 고리 원자를 갖는 헤테로아릴로 치환된 알킬(즉, 헤테로아릴-알킬-기)를 의미한다. 이러한 헤테로아릴알킬 기는 피리딜메틸 등으로 예시된다.

"헤테로사이클", "헤테로시클릭" 및 상호교환적으로 "헤테로시클로알킬"은 총 2-10개의 탄소 고리 원자 및 고리 내 질소, 황 또는 산소에서 선택되는 총 1-4개의 헤테로 고리 원자의 단일 고리 또는 다중 축합 고리를 갖는 포화 또는 불포화된 기를 의미한다. 이러한 헤테로시클릭 기는 단일 고리(예, 피페리디닐 또는 테트라히드로푸릴) 또는 다중 축합 고리(예, 인돌리닐, 디히드로벤조푸란 또는 퀴누클리디닐)를 가질 수 있다. 헤테로사이클의 예는 제한없이 푸란, 티오펜, 티아졸, 옥사졸, 피롤, 이미다졸, 피라졸, 피리딘, 피라진, 피리미딘, 피리다진, 인돌리진, 이소인돌, 인돌, 인다졸, 푸린, 퀴놀리진, 이소퀴놀린, 퀴놀린, 프탈라진, 나프틸피리딘, 퀴녹살린, 퀴나졸린, 신놀린, 프테리딘, 카르바졸, 카르볼린, 페난트리딘, 아크리딘, 페난트롤린, 이소티아졸, 페나진, 이속사졸, 페녹사진, 페노티아진, 이미다졸리딘, 이미다졸린, 피페리딘, 피페라진, 피롤리딘, 인돌린 등을 포함한다.

"헤테로시클로알킬알킬"은 바람직하게는 알킬 모이어티에서 총 1-6개의 탄소 원자 및 헤테로시클로알킬 모이어티에서 총 3-12개의 고리 원자를 갖는 헤테로시클로알킬로 치환된 알킬(즉, 헤테로시클로알킬-알킬-기)을 의미한다.

"원 고리"는 임의의 시클릭 구조를 포괄하는 것을 의미한다. 숫자에 후속하는 용어 "~원"은 고리를 구성하는 골격 원자의 갯수를 나타낸다. 따라서, 예를 들면, 시클로헥실, 피리딘, 피람 및 티오피란은 6원 고리이고, 시클로펜틸, 피롤, 푸란 및 티오펜은 5원 고리이다.

본원에 사용된 "융합된 바이시클릭 고리"는 각 고리에서 5-8개의 원자를 갖고, 고리가 2개의 공통 원자를 갖는 비치환 및 치환된 카르보시클릭 및/또는 헤테로시클릭 고리 모이어티를 의미한다.

달리 특정하지 않는 한, 상기 기에서 수소로 점유된 위치는, 제한없이, 히드록시, 옥소, 니트로, 메톡시, 에톡시, 알콕시, 치환된 알콕시, 트리플루오로메톡시, 할로알콕시, 플루오로, 클로로, 브로모, 요오도, 할로, 메틸, 에틸, 프로필, 부틸, 알킬, 알케닐, 알키닐, 치환된 알킬, 트리플루오로메틸, 할로알킬, 히드록시알킬, 알콕시알킬, 티오, 알킬티오, 아실, 카르복시, 알콕시카르보닐, 카르복사미도, 치환된 카르복사미도, 알킬설포닐, 알킬설피닐, 알킬설포닐아미노, 설폰아미도, 치환된 설폰아미도, 시아노, 아미노, 치환된 아미노, 알킬아미노, 디알킬아미노, 아미노알킬, 아실아미노, 아미디노, 아미독시모, 히드록사모일, 페닐, 아릴, 치환된 아릴, 아릴옥시, 아릴알킬, 아릴알케닐, 아릴알키닐, 피리딜, 이미다졸릴, 헤테로아릴, 치환된 헤테로아릴, 헤테로아릴옥시, 헤테로아릴알킬, 헤테로아릴알케닐, 헤테로아릴알키닐, 시클로프로필, 시클로부틸, 시클로펜틸, 시클로헥실, 시클로알킬, 시클로알케닐, 시클로알킬알킬, 치환된 시클로알킬, 시클로알킬옥시, 피롤리디닐, 피페리디닐, 모르폴리노, 헤테로사이클, (헤테로사이클)옥시, 및 (헤테로사이클)알킬에 의해 예시되는 치환기로 추가 치환될 수 있고; 바람직한 헤테로원자는 산소, 질소 및 황이다. 개방 원자가가 이러한 치환기 상에 존재하는 경우, 이들은 알킬, 시클로알킬, 아릴, 헤테로아릴, 및/또는 헤테로사이클 기로 추가 치환될 수 있고, 이러한 개방 원자가가 탄소 상에 존재하는 경우 이들은 할로겐으로 그리고 산소-, 질소-, 또는 황-결합된 치환기로 추가 치환될 수 있고, 복수의 그러한 개방 원자가가 존재하는 경우, 그러한 기는 결합의 직접 형성에 의해 또는 새로운 헤테로원자, 바람직하게는 산소, 질소 또는 황에 대한 결합의 형성에 의해 고리를 형성하기 위해 연결될 수 있다는 것을 이해하여야 한다. 상기 치환은 수소를 치환기로 치환하는 것이 본 발명의 분자에 용인할 수 없는 불안정성을 도입시키지 않고 그외 화학적으로 합리적인 조건 하에서 제공될 수 있다는 것을 추가로 이해하여야 한다.

본원에 사용된 바와 같이, "임의로" 및 "경우에 따라"는 추후 기술되는 사건 또는 상황이 일어나거나 일어나지 않을 수 있고, 설명은 사건 또는 상황이 일어나는 경우 및 사건 또는 상황이 일어나지 않는 경우를 포함하는 것을 의미한다. 당업자는 하나 이상의 임의 치환기를 함유하는 것으로 기술되는 임의의 분자와 관련하여 입체적으로 실질적인 및/또는 합성적으로 실현가능한 화합물만이 포함되는 것을 의미한다는 것을 이해하여야 한다. "임의 치환된"은 용어 또는 일련의 화학 기에 있는 모든 후속 개질체를 의미한다. 예를 들면, 용어 "임의 치환된 아릴알킬"에서, 분자에서 "알킬" 부분 및 "아릴" 부분은 치환되거나 치환될 수 없고, 일련의 "임의 치환된 알킬, 시클로알킬, 아릴 및 헤테로아릴"에서, 알킬, 시클로알킬, 아릴 및 헤테로아릴 기는, 나머지와 독립적으로, 치환되거나 치환될 수 없다.

글리코실화

글리코실화는 안정성, 약력학, 용해성 및 막 수송을 비롯한 천연 및 합성 산물의 많은 특성을 변경시킬 수 있다. 항균, 항종양, 천연 감미 특성 등을 가진 많은 이차 대사산물을 비롯한 많은 분자는 β-글리코시드 연결로 개질된 비-리보솜 펩피드, 폴리케티드 또는 테르페노이드 골격을 포함한다. 식물로부터 추출된 다수의 디테르펜 글리코시드, 즉 스테비아 레바우디아나 베르토니(Stevia rebaudiana Bertoni)는 β-연결된 글루코스 분자를 함유한다. 자연스럽게, 이러한 분자는 UDP-글루코스 의존 글리코실 트랜스퍼라제 효소를 사용하여 생체 내에서 글리코실화된다. 하지만, 시험관 내에서 사용되는 경우, UDP-글루코스는 엄청나게 고가이고/이거나 입수가 불가능할 수 있다. 본 발명에서, 신규 반응 도식(도 2 참조)이 제공되며, 여기서 2종의 상이한 효소 부류는 α-글루코스-1-포스페이트로부터 샘플 기질(예, 스테비오시드)로 글루코스 모이어티를 전달하는 데 사용되어, 하나 이상의 β-글루코스 연결 산물을 형성한다. 일부 실시양태에서, 천연 스테비오시드 UDP-글루코스 의존 글리코실트랜스퍼라제는, 레바우디오시드 A를 형성하기 위해 α-글루코스-1-포스페이트를 사용하여 활성을 갖는 것으로 보여진다(도 1 참조). 일부 추가 실시양태에서, 라미나리비오스 포스포릴라제는 역방향으로 작용하여 β-글루코스 연결된 스테비오시드 화합물과, α-글루코스-1-포스페이트 및 스테비오시드로부터의 무기 포스페이트를 형성한다.

따라서, 글리코실화는 천연 감미제, 예컨대 달콤한 허브인, 스테비아 레바우디아나 베르토니로부터 유도된 것의 형성에 사용된다. 상기 제시된 바와 같이, 이러한 식물은 많은 다른 고 효능 감미제의 것보다 우수한 고강도 감미제 및 감각 특성을 특징으로 하는 다수의 디테르펜 글리코시드를 생성한다. 상기 언급된 달콤한 글리코시드는 공통의 아글리콘(즉, 스테비올)을 갖고, C13 및 C19 위치에서 탄수화물 잔기의 숫자 및 유형이 상이하다. 스테비올 글리코시드는 분자 구조뿐만 아니라 또한 그 맛 특성도 서로 상이하다. 통상, 스테비오시드는 수크로스보다 110-270배 더 달콤한 것으로 보고되었지만, 레바우디오시드 A는 수크로스보다 150-320배 더 달콤한 것으로 보고되어 있고, 레바우디오시드 C는 수크로스보다 40-60배 더 달콤한 것으로 보고되어 있다. 공통의 이러한 화합물 중, 레바우디오시드 A는 최소의 톡쏘는 맛, 최소의 쓴 맛 그리고 최소의 지속되는 뒷맛을 갖는다. 따라서, 이는 주요 스테비올 글리코시드 중 가장 유리한 감각 속성을 갖는다. 하지만, 레바우디오시드 A는 스테비아 레바우디아나 베르토니로부터 단리된 전체 글리코시드 중 소량(2-10%)만을 구성하며, 스테비오시드(2-10%) 및 레바우디오시드 C(1-2%)를 포함한 다른 화합물이 그 나머지를 구성한다.

일부 기질의 글리코실화 패턴을 변화시키는 것은 정제를 단순화시키고/시키거나 덜 바람직한 분자(예, 스테비오시드)를 더욱 바람직한 화합물(예, 레바우디오시드 A)로 전환시키는 데 사용된다. 일부 경우에, 글리코실화는 화학 합성 방법을 통해 실현된다. 하지만, 이러한 방법은 통상 바람직하지 않은 화학물질 및 공정을 갖는 복수의 합성 단계를 필요로 하고 혼합된 산물을 형성할 수 있다(예, 부정확한 위치에서의 연결 및/또는 바람직하지 않은 아노머 배열).

대조적으로, 글리코실화 효소는 온화한 조건 하에 활성일 수 있고, 단일 단계에서 높은 위치 선택성 및 입체특이성을 부여할 수 있다. 많은 천연 유도된 글리코실화된 대사산물은 다양한 당류 뉴클레오티드로부터 당류 모이어티를 전달하는 글리코실트랜스퍼라제(GT) 효소를 사용하여 생체 내에서 발생된다. 하지만, 시험관 내 공정에서 사용되는 경우, 그러한 효소가 필요한 당류 뉴클레오티드 공여체는 엄청나게 고가일 수 있고 규모에 있어서 이용가능하지 않을 수 있다. 따라서, 덜 비싸고/비싸거나 더욱 편리한 당류 공여체를 사용하여 글리코실화된 분자를 형성할 수 있는 효소가 필요한 실정이다.

조작된 글리코실트랜스퍼라제 폴리펩티드

본 발명은 글리코실트랜스퍼라제 활성을 갖는 폴리펩티드, 폴리펩티드를 코딩하는 폴리뉴클레오티드, 폴리펩티드의 생산 방법, 및 폴리펩티드의 사용 방법을 제공한다. 설명이 폴리펩티드에 관한 것인 경우, 이는 또한 폴리펩티드를 코딩하는 폴리뉴클레오티드를 기술하는 것으로 이해하여야 한다.

조작된 폴리펩티드의 상기 기술된 개선된 특성이 트랜스퍼라제 반응을 수행하기에 적합한 반응 조건은 하기 추가 기술되는 바 그리고 하기 실시예에서 폴리펩티드의 농도 또는 양, 기질, 보조기질, 전이 금속 보조인자, 환원제, 완충액, 공용매, pH, 온도 및 반응 시간을 포함한 조건, 및/또는 고체 지지체 상에 고정된 폴리펩티드를 갖는 조건과 관련하여 결정될 수 있다.

일부 실시양태에서, 특히 스테비올 글리코시드의 나아가 글리코실화된 스테비올 글리코시드로의 전환에 있어서 개선된 특성을 갖는 글리코실트랜스퍼라제 활성을 갖는 예시적인 조작된 폴리펩티드는, 서열번호 2, 4, 6 및/또는 8과 비교하여 하나 이상의 잔기 차이를 갖는 아미노산 서열을 포함한다.

이러한 다른 잔기 위치에서의 잔기 차이는 트랜스퍼라제 반응을 수행하는 폴리펩티드의 능력에 악영향을 미치는 일 없이 아미노산 서열에 있어서 추가 변이를 제공할 수 있다. 일부 실시양태에서, 서열은 추가로 서열번호 2, 4, 6 및/또는 8과 비교하여 다른 아미노산 잔기 위치에서 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1-12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-26, 1-30, 1-35, 1-40, 1-45 또는 1-50 잔기 차이를 포함한다. 일부 실시양태에서, 기준 서열과 비교하여 아미노산 잔기 차이의 갯수는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 30, 35, 40, 45 또는 50 잔기 위치일 수 있다. 일부 실시양태에서, 기준 서열과 비교하여 아미노산 잔기 차이의 갯수는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 21, 22, 23, 24 또는 25 잔기 위치일 수 있다. 이러한 다른 위치에서의 잔기 차이는 보존성 변화 또는 비보존성 변화일 수 있다. 일부 실시양태에서, 잔기 차이는 서열번호 2, 4, 6 및/또는 8의 천연 발생 글리코실트랜스퍼라제 폴리펩티드와 비교하여 보존성 치환 및 비보존성 치환을 포함할 수 있다.

일부 실시양태에서, 본 발명은 또한 조작된 글리코실트랜스퍼라제의 기능적 활성 및/또는 개선된 특징을 유지하는 본원에 기술된 임의의 조작된 글리코실트랜스퍼라제 폴리펩티드 단편을 포함하는 조작된 폴리펩티드를 제공한다. 따라서, 일부 실시양태에서, 본 발명은 적합한 반응 조건 하에서 트랜스퍼라제 반응을 할 수 있는 폴리펩티드 단편을 제공하고, 단편은 본 발명의 글리코실트랜스퍼라제 폴리펩티드, 예컨대 서열번호 2, 4, 6 및/또는 8의 천연 발생 글리코실트랜스퍼라제 폴리펩티드의 전장 아미노산 서열의 적어도 약 80%, 90%, 95%, 96%, 97%, 98% 또는 99%를 포함한다.

일부 실시양태에서, 조작된 글리코실트랜스퍼라제 폴리펩티드는 본원에 기술된 글리코실트랜스퍼라제 폴리펩티드, 예컨대 서열번호 2, 4, 6 및/또는 8의 천연 발생 글리코실트랜스퍼라제 폴리펩티드 중 임의의 하나의 결실을 포함하는 아미노산 서열을 가질 수 있다.

따라서, 본 발명의 조작된 글리코실트랜스퍼라제 폴리펩티드의 각 그리고 모든 실시양태의 경우, 아미노산 서열은 1 이상의 아미노산, 2 이상의 아미노산, 3 이상의 아미노산, 4 이상의 아미노산, 5 이상의 아미노산, 6 이상의 아미노산, 8 이상의 아미노산, 10 이상의 아미노산, 15 이상의 아미노산, 또는 20 이상의 아미노산, 글리코실트랜스퍼라제 폴리펩티드의 아미노산의 총 갯수의 최대 10%, 아미노산 총 갯수의 최대 10%, 아미노산의 총 갯수의 최대 20%, 또는 아미노산의 총 갯수의 최대 30%의 결실을 포함할 수 있고, 본원에 기술된 조작된 글리코실트랜스퍼라제의 회합된 기능 활성 및/또는 개선된 특성이 유지된다. 일부 실시양태에서, 결실은 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-15, 1-20, 1-21, 1-22, 1-23, 1-24, 1-25, 1-30, 1-35, 1-40, 1-45 또는 1-50 아미노산 잔기를 포함할 수 있다. 일부 실시양태에서, 결실의 갯수는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 30, 35, 40, 45 또는 50 아미노산 잔기일 수 있다. 일부 실시양태에서, 결실은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 21, 22, 23, 24 또는 25 아미노산 잔기의 결실을 포함할 수 있다.

일부 실시양태에서, 본원에서 조작된 글리코실트랜스퍼라제 폴리펩티드는 본원에 기술된 글리코실트랜스퍼라제 폴리펩티드, 예컨대 서열번호 2, 4, 6 및/또는 8의 천연 발생 글리코실트랜스퍼라제 폴리펩티드 중 임의의 하나와 비교하여 삽입을 포함하는 아미노산 서열을 가질 수 있다. 따라서, 본 발명의 글리코실트랜스퍼라제 폴리펩티드의 일부 실시양태에서, 삽입은 1 이상의 아미노산, 2 이상의 아미노산, 3 이상의 아미노산, 4 이상의 아미노산, 5 이상의 아미노산, 6 이상의 아미노산, 8 이상의 아미노산, 10 이상의 아미노산, 15 이상의 아미노산, 20 이상의 아미노산, 30 이상의 아미노산, 40 이상의 아미노산, 또는 50 이상의 아미노산을 포함할 수 있고, 본원에 기술된 조작된 글리코실트랜스퍼라제의 회합된 기능 활성 및/또는 개선된 특성이 유지된다. 삽입은 아미노 또는 카르복시 말단, 또는 글리코실트랜스퍼라제 폴리펩티드의 내부 영역에 있을 수 있다.

일부 실시양태에서, 아미노산 서열은 경우에 따라 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-15, 1-20, 1-21, 1-22, 1-23, 1-24, 1-25, 1-30, 1-35, 1-40, 1-45 또는 1-50 아미노산 잔기 결실, 삽입 및/또는 치환을 갖는다. 일부 실시양태에서, 아미노산 서열의 갯수는 경우에 따라 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 30, 35, 40, 45, or 50 아미노산 잔기 결실, 삽입 및/또는 치환을 갖는다. 일부 실시양태에서, 아미노산 서열은 경우에 따라 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 21, 22, 23, 24 또는 25 아미노산 잔기 결실, 삽입 및/또는 치환을 갖는다. 일부 실시양태에서, 치환은 보존성 또는 비보존성 치환일 수 있다.

상기 실시양태에서, 조작된 폴리펩티드에 적합한 반응 조건은 하기 실시예에 제공된다.

일부 실시양태에서, 본 발명의 폴리펩티드는 융합 폴리펩티드이고, 조작된 폴리펩티드는 다른 폴리펩티드, 예로서 제한없이, 항체 태그(예, myc 에피토프), 정제 서열(예, 금속에 결합하기 위한 His 태그), 및 세포 국소화 신호(예, 분비 신호) 등에 융합된다. 따라서, 본원에 기술된 조작된 폴리펩티드는 다른 폴리펩티드에 융합하거나 하지 않고 사용될 수 있다.

본원에 기술된 폴리펩티드는 유전적으로 코딩된 아미노산으로 제한되지 않는다는 것을 이해하여야 한다. 유전적으로 코딩된 아미노산 이외에, 본원에 기술된 폴리펩티드는 전체적으로 또는 부분적으로 천연 발생 및/또는 합성 비코딩된 아미노산을 포함할 수 있다. 본원에 기술된 폴리펩티드가 포함될 수 있는 일반적으로 직면하는 특정 비코딩된 아미노산은, 제한없이, 유전적으로 코딩된 아미노산의 D-입체이성질체; 2,3-디아미노프로피온산(Dpr); α-아미노이소부티르산(Aib); ε-아미노헥산산(Aha); δ-아미노발레르산(Ava); N-메틸글리신 또는 사르코신(MeGly 또는 Sar); 오르니틴(Orn); 시트룰린(Cit); t-부틸알라닌(Bua); t-부틸글리신(Bug); N-메틸이소류신(MeIle); 페닐글리신(Phg); 시클로헥실알라닌(Cha); 노르류신(Nle); 나프틸알라닌(Nal); 2-클로로페닐알라닌(Ocf); 3-클로로페닐알라닌(Mcf); 4-클로로페닐알라닌(Pcf); 2-플루오로페닐알라닌(Off); 3-플루오로페닐알라닌(Mff); 4-플루오로페닐알라닌(Pff); 2-브로모페닐알라닌(Obf); 3-브로모페닐알라닌(Mbf); 4-브로모페닐알라닌(Pbf); 2-메틸페닐알라닌(Omf); 3-메틸페닐알라닌(Mmf); 4-메틸페닐알라닌(Pmf); 2-니트로페닐알라닌(Onf); 3-니트로페닐알라닌(Mnf); 4-니트로페닐알라닌(Pnf); 2-시아노페닐알라닌(Ocf); 3-시아노페닐알라닌(Mcf); 4-시아노페닐알라닌(Pcf); 2-트리플루오로메틸페닐알라닌(Otf); 3-트리플루오로메틸페닐알라닌(Mtf); 4-트리플루오로메틸페닐알라닌(Ptf); 4-아미노페닐알라닌(Paf); 4-요오도페닐알라닌(Pif); 4-아미노메틸페닐알라닌(Pamf); 2,4-디클로로페닐알라닌(Opef); 3,4-디클로로페닐알라닌(Mpcf); 2,4-디플루오로페닐알라닌(Opff); 3,4-디플루오로페닐알라닌(Mpff); 피리드-2-일알라닌(2pAla); 피리드-3-일알라닌(3pAla); 피리드-4-일알라닌(4pAla); 나프트-1-일알라닌(1nAla); 나프트-2-일알라닌(2nAla); 티아졸릴알라닌(taAla); 벤조티에닐알라닌(bAla); 티에닐알라닌(tAla); 푸릴알라닌(fAla); 호모페닐알라닌(hPhe); 호모티로신(hTyr); 호모트립토판(hTrp); 펜타플루오로페닐알라닌(5ff); 스티릴크알라닌(sAla); 아루트릴알라닌(aAla); 3,3-디페닐알라닌(Dfa); 3-아미노-5-페닐펜탄산(Afp); 페니실라민(Pen); 1,2,3,4-테트라히드로이소퀴놀린-3-카르복실산(Tic); β-2-티에닐알라닌(Thi); 메티오닌 설폭시드(Mso); N(w)-니트로아르기닌(nArg); 호모리신(hLys); 포스포노메틸페닐알라닌(pmPhe); 포스포세린(pSer); 포스포트레오닌(pThr); 호모아스파르트산(hAsp); 호모글루탄산(hGlu); 1-아미노시클로펜트-(2 또는 3)-엔-4 카르복실산; 피페콜산(PA), 아제티딘-3-카르복실산(ACA); 1-아미노시클로펜탄-3-카르복실산; 알릴글리신(aGly); 프로파르길글리신(pgGly); 호모알라닌(hAla); 노르발린(nVal); 호모류신(hLeu), 호모발린(hVal); 호모이소류신(hIle); 호모아르기닌(hArg); N-아세틸 리신(AcLys); 2,4-디아미노부티르산(Dbu); 2,3-디아미노부티르산(Dab); N-메틸발린(MeVal); 호모시스테인(hCys); 호모세린(hSer); 히드록시프롤린(Hyp) 및 호모프롤린(hPro)을 포함한다. 본원에 기술된 폴리펩티드가 포함될 수 있는 추가의 비코딩된 아미노산은 당업자에게 자명하다(예, Fasman에서 제공된 다양한 아미노산, CRC Practical Handbook of Biochemistry and Molecular Biology, CRC Press, Boca Raton, FL, pp. 3-70 [1989], 및 본원에 인용된 참고문헌 참조, 이의 전부는 본원에 참고 인용됨). 이러한 아미노산은 L 또는 D 배열일 수 있다.

당업자는 아미노산 또는 잔기 보유 측쇄 보호 기가 또한 본원에 기술된 폴리펩티드를 포함할 수 있다는 것을 인지한다. 이 경우 방향족 카테고리에 속하는 이러한 보호된 아미노산의 비제한적 예는, (괄호에 나열된 보호기), 제한없이, Arg(tos), Cys(메틸벤질), Cys(니트로피리딘설페닐), Glu(δ-벤질에스테르), Gln(크산틸), Asn(N-δ-크산틸), His(bom), His(벤질), His(tos), Lys(fmoc), Lys(tos), Ser(O-벤질), Thr (O-벤질) 및 Tyr(O-벤질)를 포함한다.

본원에 기술된 폴리펩티드가 포함될 수 있는 배좌 구속된 비코딩된 아미노산은, 제한없이, N-메틸 아미노산(L-배열); 1-아미노시클로펜트-(2 또는 3)-엔-4-카르복실산; 피페콜산; 아제티딘-3-카르복실산; 호모프롤린(hPro); 및 1-아미노시클로펜탄-3-카르복실산을 포함한다.

일부 실시양태에서, 조작된 폴리펩티드는 다양한 형태, 예컨대 단리된 제제, 실질적으로 정제된 효소, 효소를 코딩하는 유전자(들)로 형질전화된 전체 세포, 및/또는 세포 추출물, 및/또는 그러한 세포의 용해물이다. 효소는 추가로 후술되는 바와 같이 동결건조, 분무 건조, 침전 또는 미정제 페이스트 형태일 수 있다.

일부 실시양태에서, 조작된 폴리펩티드는 고체 지지체, 예컨대 멤브레인, 수지, 고체 담체, 또는 다른 고체 상 재료에 제공된다. 고체 지지체는 유기 중합체, 예컨대 폴리스티렌, 폴리에틸렌, 폴리프로필렌, 폴리플루오로에틸렌, 폴리에틸렌옥시 및 폴리아크릴아미드, 그리고 이의 공중합체 및 그래프트로 구성될 수 있다. 고체 지지체는 또한 무기, 예컨대 글래스, 실리카, 제어 기공 글래스(CPG), 역상 실리카 또는 금속, 예컨대 금 또는 백금일 수 있다. 고체 지지체의 구성은 비드, 스피어, 입자, 과립, 겔, 멤브레인 또는 표면의 형태일 수 있다. 표면은 평면, 실질적으로 평면 또는 비평면일 수 있다. 고체 지지체는 다공성 또는 비다공성일 수 있고, 팽창 또는 비팽창 특징을 가질 수 있다. 고체 지지체는 웰, 함몰부, 또는 다른 컨테이너, 용기, 특징부 또는 장소의 형태로 설정될 수 있다.

일부 실시양태에서, 본 발명의 글리코실트랜스퍼라제 활성을 갖는 조작된 폴리펩티드는 서열번호 2, 4, 6 및/또는 8의 기준 폴리펩티드에 비해 개선된 활성, 입체선택성, 및/또는 다른 개선된 특성을 보유하도록 고체 지지체 상에 고정될 수 있다. 이러한 실시양태에서, 고정된 폴리펩티드는 기질 화합물 또는 다른 적당한 기질의 산물로의 생체촉매 전환을 용이하게 할 수 있고 반응 완료 후 (예, 폴리펩티드가 고정된 비드를 보유함으로써) 쉽게 유지되고, 후속 반응에서 재사용되거나 재순환된다. 그러한 고정된 효소 공정은 추가의 효율 및 비용 절감을 가능하게 한다. 따라서, 본 발명의 글리코실트랜스퍼라제 폴리펩티드를 사용하는 임의의 방법은 고체 지지체 상에 결합 또는 고정된 동일한 글리코실트랜스퍼라제 폴리펩티드를 사용하여 수행될 수 있다는 것이 추가로 고려된다.

효소 고정 방법은 당업계에 잘 공지되어 있다. 조작된 폴리펩티드는 비공유 또는 공유 결합될 수 있다. 효소의 고체 지지체(예, 수지, 멤브레인, 비드, 글래스 등)로의 컨쥬게이션 및 고정을 위한 다양한 방법은 당업계에 잘 공지되어 있다(예, Yi et al., Proc. Biochem., 42(5): 895-898 [2007]; Martin et al., Appl. Microbiol. Biotechnol., 76(4): 843-851 [2007]; Koszelewski et al., J. Mol. Cat. B: Enzymatic, 63: 39-44 [2010]; Truppo et al., Org. Proc. Res. Dev., published online: dx.doi.org/10.1021/op200157c; Hermanson, Bioconjugate Techniques, 2nd ed., Academic Press, Cambridge, MA [2008]; Mateo et al., Biotechnol. Prog., 18(3):629-34 [2002]; and "Bioconjugation Protocols: Strategies and Methods," In Methods in Molecular Biology, Niemeyer (ed.), Humana Press, New York, NY [2004] 참조; 각각의 개시내용은 본원에 참고 인용됨). 본 발명의 조작된 글리코실트랜스퍼라제를 고정시키기에 유용한 고체 지지체는 제한없이 에폭시드 작용 기를 갖는 폴리메타크릴레이트, 아미노 에폭시드 작용 기를 갖는 폴리메타크릴레이트, 스티렌/DVB 공중합체 또는 옥타데실 작용 기를 갖는 폴리메타크릴레이트를 포함한 비드 또는 수지를 포함한다. 본 발명의 조작된 글리코실트랜스퍼라제 폴리펩티드를 고정하기에 유용한 예시적인 고체 지지체는 제한없이 키토산 비드, Eupergit C 및 SEPABEAD(Mitsubishi)와 하기 상이한 유형의 SEPABEAD: EC-EP, EC-HFA/S, EXA252, EXE119 및 EXE120을 포함한다.

일부 실시양태에서, 본원에 기술된 폴리펩티드는 키트의 형태로 제공된다. 키트 내 효소는 개별적으로 또는 복수의 효소로서 존재할 수 있다. 키트는 효소 반응을 수행하기 위한 시약, 효소의 활성을 평가하기 위한 기질, 및 산물을 검출하기 위한 시약을 추가로 포함할 수 있다. 키트는 또한 시약 디스펜서 및 키트 사용을 위한 설명서를 포함할 수 있다.

일부 실시양태에서, 본 발명의 키트는 상이한 어드레스가능한 위치에서 복수의 상이한 글리코실트랜스퍼라제 폴리펩티드를 포함한 어레이를 포함하고, 상이한 폴리펩티드는 적어도 하나의 상이한 개선된 효소 특성을 각각 갖는 기준 서열의 상이한 변이체이다. 일부 실시양태에서, 고체 지지체 상에 고정된 복수의 폴리펩티드는 시약의 자동 전달로 어드레스 가능한, 또는 검출 방법 및/또는 기기에 의해 다양한 위치에서 어레이 상에 형성된다. 어레이는 폴리펩티드에 의해 전환을 위한 다양한 기질 화합물을 테스트하는 데 사용될 수 있다. 복수의 조작된 폴리펩티드를 포함하는 어레이 및 이의 사용 방법은 당업계에 공지되어 있다(예, WO2009/008908A2 참조).

조작된 글리코실트랜스퍼라제를 코딩하는 폴리뉴클레오티드, 발현 벡터 및 숙주 세포

또다른 양태에서, 본 발명은 본원에 기술된 조작된 글리코실트랜스퍼라제 폴리펩티드를 코딩하는 폴리뉴클레오티드를 제공한다. 폴리뉴클레오티드는 폴리펩티드를 발현할 수 있는 재조합 폴리뉴클레오티드를 형성하기 위해 유전자 발현을 조절하는 하나 이상의 이종성 조절 서열에 작동가능하게 연결될 수 있다. 조작된 글리코실트랜스퍼라제를 코딩하는 이종성 폴리뉴클레오티드를 함유하는 발현 구성체는 적절한 숙주 세포 내에 도입되어 해당 글리코실트랜스퍼라제 폴리펩티드를 발현한다.

당업자에게 확인되는 바와 같이, 다양한 아미노산에 상응하는 코돈의 지식 및 단백질 서열의 이용가능성은 대상 폴리펩티드를 코딩할 수 있는 모든 폴리뉴클레오티드의 설명을 제공한다. 동일 아미노산이 대안적이거나 동의적인 코돈에 의해 코딩되는 유전자 코드의 축퇴성은 모두 개선된 글리코실트랜스퍼라제 효소를 코딩하는 극도로 많은 수의 핵산을 만들 수 있도록 한다. 따라서, 특정 아미노산 서열의 지식을 가졌지만, 당업자는 단백질의 아미노산 서열을 변화시키지 않는 방식으로 하나 이상의 코돈의 서열을 간단히 개질시킴으로써 임의의 수의 상이한 핵산을 만들 수 있다. 이와 관련하여, 본 발명은 가능한 코돈 선택을 기반으로 한 조합을 선택함으로써 본원에 기술된 폴리펩티드를 코딩하도록 할 수 있는 각각의 모든 가능한 폴리뉴클레오티드 변이를 특별히 고려하고, 모든 그러한 변이는 서열번호 1-32의 짝수 서열로 본원에 참고 인용된 서열 목록에 개시된 아미노산 서열을 비롯하여 본원에 기술된 임의의 폴리펩티드에 특별히 개시되는 것으로 간주된다.

다양한 실시양태에서, 코돈은 바람직하게는 단백질이 생산되는 숙주 세포에 맞도록 선택된다. 예를 들면, 박테리아에 사용되는 바람직한 코돈은 박테리아에서 유전자를 발현하는 데 사용되고; 효모에서 사용되는 바람직한 코돈은 효모에서 발현하는 데 사용되고; 포유동물에서 사용되는 바람직한 코돈은 포유동물 세포에서 발현하는 데 사용된다. 일부 실시양태에서, 천연 서열이 바람직한 코돈을 포함하고 바람직한 코돈의 사용이 모든 아미노산 잔기에 필요하지 않을 수 있기 때문에 모든 코돈이 글리코실트랜스퍼라제의 코돈 용법을 최적화하도록 대체될 필요는 없다. 결과적으로, 글리코실트랜스퍼라제 효소를 코딩하는 코돈 최적화된 폴리뉴클레오티드는 전장 코딩 영역 내 코돈 위치의 약 40%, 50%, 60%, 70%, 80%, 90% 또는 그 이상에서 바람직한 코돈을 함유할 수 있다.

일부 실시양태에서, 폴리뉴클레오티드는 서열번호 2, 4, 6 및/또는 8로 표시되는 천연 발생 글리코실트랜스퍼라제 폴리펩티드 아미노산 서열을 코딩하는 코돈 최적화된 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 폴리뉴클레오티드는 서열번호 1-32의 짝수 서열을 코딩하는 코돈 최적화된 핵산 서열에 대해 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 동일성을 포함하는 핵산 서열을 갖는다. 일부 실시양태에서, 폴리뉴클레오티드는 서열번호 1-32의 홀수 서열로 코돈 최적화된 핵산 서열에 대해 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 동일성을 포함하는 핵산 서열을 갖는다. 서열번호 1-32의 홀수 서열의 코돈 최적화된 서열은, 코딩된 야생형 글리코실트랜스퍼라제의 발현을 증진시키고, 본원에 기술된 트랜스퍼라제 활성이 가능한 효소의 제제를 제공한다. 일부 실시양태에서, 코돈 최적화된 폴리뉴클레오티드 서열은 스테비아 레바우디아나, 스트렙토마이세스 레지스토마이시피쿠스(Streptomyces resistomycificus), 스트렙토마이세스 안티바이오티쿠스(Streptomyces antibioticus) 및/또는 파에니바실루스(Paenibacillus) 종 YM1 유래의 천연 발생 폴리뉴클레오티드 서열과 비교하여 적어도 1.2배, 1.5배 또는 2배 또는 그 이상까지 글리코실트랜스퍼라제의 발현을 증진시킨다.

일부 실시양태에서, 폴리뉴클레오티드는 서열번호 1-32의 홀수 서열에서 선택된 기준 서열, 또는 이의 상보체에 대해 상당히 엄격한 조건 하에서 혼성화시킬 수 있고, 글리코실트랜스퍼라제 활성을 갖는 폴리펩티드를 코딩한다.

일부 실시양태에서, 상기 기술된 바와 같이, 폴리뉴클레오티드는 서열번호 2, 4, 6 및/또는 8에 비해 개선된 특성을 갖는 글리코실트랜스퍼라제 활성을 가진 조작된 폴리펩티드를 코딩하고, 폴리펩티드는 기준 서열에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 동일성, 및 서열번호 1-32의 짝수 서열에서 선택된 서열에 비해 하나 이상의 잔기 차이를 갖는 아미노산 서열을 포함한다. 일부 실시양태에서, 기준 아미노산 서열은 서열번호 1-32의 짝수 서열에서 선택된다. 일부 실시양태에서, 기준 아미노산 서열은 서열번호 2이다. 일부 실시양태에서, 기준 아미노산 서열은 서열번호 4이다. 일부 추가 실시양태에서, 기준 아미노산 서열은 서열번호 8이다.

일부 실시양태에서, 폴리뉴클레오티드는 서열번호 2, 4, 6 및/또는 8에 비해 개선된 특성을 갖는 본원에 제공된 트랜스퍼라제 반응이 가능한 글리코실트랜스퍼라제 폴리펩티드를 코딩하고, 폴리펩티드는 기준 서열 서열번호 2, 4, 6 및/또는 8에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성, 및 서열번호 2, 4, 6 및/또는 8에 비해 하나 이상의 잔기 차이를 갖는 아미노산 서열을 포함한다.

일부 실시양태에서, 폴리뉴클레오티드는 서열번호 2, 4, 6 및/또는 8에 비해 개선된 특성을 갖는 본원에 제공된 트랜스퍼라제 반응이 가능한 글리코실트랜스퍼라제 폴리펩티드를 코딩하고, 폴리펩티드는 기준 서열 서열번호 2, 4, 6 및/또는 8에 대한 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성, 및 서열번호 2, 4, 6 및/또는 8에 비해 하나 이상의 잔기 차이를 갖는 아미노산 서열을 포함한다.

일부 실시양태에서, 조작된 글리코실트랜스퍼라제를 코딩하는 폴리뉴클레오티드는 서열번호 1-32의 홀수 서열에서 선택된 폴리뉴클레오티드 서열을 포함한다.

일부 실시양태에서, 폴리뉴클레오티드는 서열번호 1-32의 홀수 서열에서 선택된 기준 폴리뉴클레오티드 서열, 또는 이의 상보체에 대해 상당히 엄격한 조건 하에서 혼성화시킬 수 있고, 하나 이상의 본원에 기술된 개선된 특성을 갖는 글리코실트랜스퍼라제 활성을 갖는 폴리펩티드를 코딩한다. 일부 실시양태에서, 상당히 엄격한 조건 하에서 혼성화될 수 있는 폴리뉴클레오티드는 서열번호 2, 4, 6 및/또는 8에 대해 적어도 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 동일성을 갖는 아미노산 서열을 포함하고, 서열번호 2, 4, 6 및/또는 8에 비해 하나 이상의 잔기 차이를 포함하는 아미노산 서열을 갖는 글리코실트랜스퍼라제 폴리펩티드를 코딩한다.

일부 실시양태에서, 본원에 제공된 임의의 조작된 글리코실트랜스퍼라제 폴리펩티드를 코딩하는 단리된 폴리뉴클레오티드는 폴리펩티드의 발현을 제공하기 위해 다양한 방식으로 조작된다. 일부 실시양태에서, 폴리펩티드를 코딩하는 폴리뉴클레오티드는, 폴리뉴클레오티드 및/또는 폴리펩티드의 발현을 조절하기 위해 하나 이상의 제어 서열이 존재하는 발현 벡터로서 제공된다. 벡터에 삽입 전 단리된 폴리뉴클레오티드를 조작하는 것은 발현 벡터에 따라 바람직하거나 필요할 수 있다. 재조합 DNA 방법을 이용하여 폴리뉴클레오티드 및 핵산 서열을 개질하는 기법은 당업계에 잘 공지되어 있다.

일부 실시양태에서, 제어 서열은 무엇보다 프로모터, 리더 서열, 폴리아데닐화 서열, 프로펩티드 서열, 신호 펩티드 서열, 및 전사 종결부를 포함한다. 당업계에 공지된 바와 같이, 적당한 프로모터는 사용된 숙주 세포를 기초로 선택될 수 있다. 박테리아 숙주 세포의 경우, 본 출원의 핵산 구성체의 전사를 지정하기에 적당한 프로모터는 제한없이 이. 콜라이 lac 오페론, 스트렙토마이세스 코엘리콜러(Streptomyces coelicolor) 아가라아제 유전자(dagA), 바실러스 서브틸리스(Bacillus subtilis) 레반수크라아제 유전자(sacB), 바실러스 리체니포르미스(Bacillus licheniformis) 알파-아밀라아제 유전자(amyL), 바실러스 스테아로써모필러스(Bacillus stearothermophilus) 말토스형성성 아밀라아제 유전자(amyM), 바실러스 아밀로리커파시엔스(Bacillus amyloliquefaciens) 알파-아밀라아제 유전자(amyQ), 바실러스 리체니포르미스 페니실리나아제 유전자(penP), 바실러스 서브틸리스 xylA 및 xylB 유전자, 및 원핵생물 베타-락타마아제 유전자(예, Villa-Kamaroff et al., Proc. Natl Acad. Sci. USA 75: 3727-3731 [1978] 참조), 그리고 tac 프로모터(예, DeBoer et al., Proc. Natl Acad. Sci. USA 80: 21-25 [1983] 참조)에서 수득되는 프로모터를 포함한다. 사상균 숙주 세포에 대한 예시적인 프로모터는, 아스퍼질러스 오리자에(Aspergillus oryzae) TAKA 아밀라아제, 리조무코어 미에헤이(Rhizomucor miehei) 아스파르트산 프로테나제, 아스퍼질러스 나이거(Aspergillus niger) 중성 알파-아밀라아제, 아스퍼질러스 나이거 산 안정성 알파-아밀라아제, 아스퍼질러스 나이거 또는 아스퍼질러스 아와모리(Aspergillus awamori) 글루코아밀라알제(glaA), 리조무코어 미에헤이 리파아제, 아스퍼질러스 오리자에 알칼리 프로테아제, 아스퍼질러스 오리자에 트리오스 포스페이트 이소머라아제, 아스퍼질러스 니둘란스(Aspergillus nidulans) 아세타미다아제, 및 푸사리움 옥시스포럼(Fusarium oxysporum) 트립신 유사 프로테아제(예, WO 96/00787)에 대한 유전자로부터 수득한 프로모터, 그리고 NA2-tpi 프로모터(아스퍼질러스 나이거 중성 알파-아밀라아제 및 아스퍼질러스 오리자에 트리오스 포스페이트 이소머라아제에 대한 유전자 유래 프로모터의 하이브리드), 및 이의 돌연변이, 절두형, 및 하이브리드 프로모터를 포함한다. 예시적인 효모 세포 프로모터는 임의의 적당한 수크로스 유래일 수 있다. 일부 실시양태에서, 유전자는 사카로마이세스 세레비지아(Saccharomyces cerevisiae) 에놀라아제(ENO-1), 사카로마이세스 세레비지아 갈락토키나아제(GAL1), 사카로마이세스 세레비지아 알콜 디히드로게나아제/글리세르알데히드-3-포스페이트 디히드로게나아제(ADH2/GAP), 및 사카로마이세스 세레비지아 3-포스포글리세레이트 키나아제에 대한 유전자를 포함한다. 효모 숙주 세포에 대한 다른 유용한 프로모터는 당업계에 공지되어 있다(예, Romanos et al., Yeast 8:423-488 [1992] 참조).

일부 실시양태에서, 제어 서열은 적절한 전사 종결 서열, 즉 전사 종결을 위해 숙주 세포가 인식하는 서열이다. 종결부 서열은 폴리펩티드를 코딩하는 핵산 서열의 3' 말단에 작동가능하게 연결된다. 선택한 숙주 세포에서 기능하는 임의의 종결부가 본 발명에서 사용된다. 예를 들면, 사상균 숙주 세포에 대한 예시적인 전사 종결부는 아스퍼질러스 오리자에 TAKA 아밀라아제, 아스퍼질러스 나이거 글루코아밀라알제, 아스퍼질러스 니둘란스 안트라닐레이트 신타아제, 아스퍼질러스 나이거 알파-글루코시다아제, 및 푸사리움 옥시스포럼 트립신 유사 프로테아제에 대한 유전자로부터 수득될 수 있다. 효모 숙주 세포에 대한 예시적인 종결부는 사카로마이세스 세레비지아 에놀라아제, 사카로마이세스 세레비지아 사이토크롬 C(CYC1), 및 사카로마이세스 세레비지아 글리세르알데히드-3-포스페이트 디히드로게나아제에 대한 유전자로부터 수득될 수 있다. 효모 숙주 세포에 대해 유용한 다른 다양한 종결부는 당업계에 공지되어 있다(예, Romanos et al. 참조, 상술).

일부 실시양태에서, 제어 서열은 적당한 리더 서열, 즉 숙주 세포에 의한 번역에 중요한 mRNA의 비번역 영역이다. 리더 서열은 폴리펩티드를 코딩하는 핵산 서열의 5' 말단에 작동가능하게 연결된다. 선택한 숙주 세포에서 기능하는 임의의 리더 서열이 사용될 수 있다. 사상균 숙주 세포에 대한 예시적인 리더는 아스퍼질러스 오리자에 TAKA 아밀라아제 및 아스퍼질러스 니둘란스 트리오스 포스페이트 이소머라아제에 대한 유전자로부터 수득된다. 효모 숙주 세포에 적당한 리더는 제한없이 사카로마이세스 세레비지아 에놀라아제(ENO-1), 사카로마이세스 세레비지아 3-포스포글리세레이트 키나아제, 사카로마이세스 세레비지아 알파-인자, 및 사카로마이세스 세레비지아 알콜 디히드로게나아제/글리세르알데히드-3-포스페이트 디히드로게나아제(ADH2/GAP)에 대한 유전자로부터 수득된 것을 포함한다.

제어 서열은 또한 폴리아데닐화 서열, 즉 핵산 서열의 3' 말단에 작동가능하게 연결되고, 전사시, 전사된 mRNA에 폴리아데노신 잔기를 첨가하는 신호로서 숙주 세포에 의해 인식되는 서열일 수 있다. 선택한 숙주 세포에서 기능하는 임의의 폴리아데닐화 서열은 본 발명에 사용될 수 있다. 사상균 숙주 세포에 대한 예시적인 폴리아데닐화 서열은 제한없이 아스퍼질러스 오리자에 TAKA 아밀라아제, 아스퍼질러스 나이거 글루코아밀라알제, 아스퍼질러스 니둘란스 안트라닐레이트 신타아제, 푸사리움 옥시스포럼 트립신 유사 프로테아제, 및 아스퍼질러스 나이거 알파-글루코시다아제에 대한 유전자로부터 수득된 것을 포함한다. 효모 숙주 세포에 유용한 폴리아데닐화 서열은 또한 당업계에 공지되어 있다(예, Guo and Sherman, Mol. Cell. Bio., 15:5983-5990 [1995] 참조).

일부 실시양태에서, 제어 서열은 폴리펩티드의 아미노 말단에 연결된 아미노산 서열을 코딩하고 세포의 분비 경로로 코딩된 폴리펩티드를 지정하는 신호 펩티드 코딩 영역이다. 핵산 서열의 코딩 서열의 5' 말단은 분비된 폴리펩티드를 코딩하는 코딩 영역의 절편과 번역 리딩 프레임에 천연적으로 연결된 신호 펩티드 코딩 영역을 고유하게 함유할 수 있다. 대안적으로, 코딩 서열의 5' 말단은 코딩 서열에 외생성인 신호 펩티드 코딩 영역을 함유할 수 있다. 선택한 숙주 세포의 분비 경로로 발현된 폴리펩티드를 지정하는 임의의 신호 펩티드 코딩 영역은 본원에 제공된 조작된 글리코실트랜스퍼라제 폴리펩티드의 발현에 사용된다. 박테리아 숙주 세포에 효과적인 신호 펩티드 코딩 영역은 제한없이 바실러스 NClB 11837 말토스형성성 아밀라아제, 바실러스 스테아로써모필러스 알파-아밀라아제, 바실러스 리체니포르미스 서브틸리신, 바실러스 리체니포르미스 베타-락타마아제, 바실러스 스테아로써모필러스 중성 프로테아제(nprT, nprS, nprM), 및 바실러스 서브틸리스 prsA에 대한 유전자로부터 수득된 신호 펩티드 코딩 영역을 포함한다. 추가의 신호 펩티드가 당업계에 공지되어 있다(예, Simonen and Palva, Microbiol. Rev., 57:109-137 [1993] 참조). 사상균 숙주 세포에 효과적인 신호 펩티드 코딩 영역은 제한없이 아스퍼질러스 오리자에 TAKA 아밀라아제, 아스퍼질러스 나이거 중성 아밀라아제, 아스퍼질러스 나이거 글루코아밀라알제, 리조무코어 미에헤이 아스파르트산 프로테나제, 후미콜라 인솔렌스(Humicola insolens) 셀룰라아제, 및 후미콜라 라누기노사(Humicola lanuginosa) 리파아제에 대한 유전자로부터 수득된 신호 펩티드 코딩 영역을 포함한다. 효모 숙주 세포에 유용한 신호 펩티드는 제한없이 사카로마이세스 세레비지아 알파-인자 및 사카로마이세스 세레비지아 인버타아제에 대한 유전자로부터의 것을 포함한다.

일부 실시양태에서, 제어 서열은 폴리펩티드의 아미노 말단에 위치된 아미노산 서열을 코딩하는 프로펩티드 코딩 영역이다. 최종 폴리펩티드는 일부 경우에 "프로효소", "프로폴리펩티드" 또는 "자이모겐"이라고 한다. 프로폴리펩티드는 프로폴리펩티드로부터 프로펩티드의 촉매적 또는 자가촉매적 절단에 의해 성숙한 활성 폴리펩티드로 전환될 수 있다. 프로펩티드 코딩 영역은 제한없이 바실러스 서브틸리스 알칼리 프로테아제(aprE), 바실러스 서브틸리스 중성 프로테아제(nprT), 사카로마이세스 세레비지아 알파-인자, 리조무코어 미에헤이 아스파르트산 프로테나제, 및 바이셀리오프토라 써모필라(Myceliophthora thermophila) 락타아제(예, WO 95/33836 참조)에 대한 유전자를 포함한다. 신호 펩티드 및 프로펩티드 영역이 모두 폴리펩티드의 아미노 말단에 존재하는 경우, 프로펩티드 영역은 폴리펩티드의 아미노 말단 옆에 위치하고 신호 펩티드 영역은 프로펩티드 영역의 아미노 말단 옆예 위치한다.

일부 실시양태에서, 조절 서열이 또한 이용된다. 이러한 서열은 숙주 세포의 성장에 대해 폴리펩티드의 발현의 조절을 촉진한다. 조절 시스템의 예는 조절 화합물의 존재를 포함하여, 화학적 또는 물리적 자극에 대한 반응으로 유전자 발현의 켜짐 또는 꺼짐을 일으키는 것들이다. 원핵생물 숙주 세포에서, 적당한 조절 서열은 제한없이, lac, tac, 및 trp 오퍼레이터 시스템을 포함한다. 효모 숙주 세포에서, 적당한 조절 시스템은 제한없이 ADH2 시스템 또는 GAL1 시스템을 포함한다. 사상균에서, 적당한 조절 서열은 제한없이 TAKA 알파-아밀라아제 프로모터, 아스퍼질러스 나이거 글루코아밀라아제 프로모터, 및 아스퍼질러스 오리자에 글루코아밀라아제 프로모터를 포함한다.

또다른 양태에서, 본 발명은 또한 조작된 글리코실트랜스퍼라제 폴리펩티드를 코딩하는 폴리뉴클레오티드, 및 도입되는 호스트 유형에 따른 하나 이상의 발현 조절 영역, 예컨대 프로모터 및 종결부, 복제 기원 등을 포함하는 재조합 발현 벡터를 제공한다. 일부 실시양태에서, 상기 기술된 다양한 핵산 및 제어 서열은 하나 이상의 편리한 제한효소 부위를 포함하여 그러한 부위에 변이체 글리코실트랜스퍼라제 폴리펩티드를 코딩하는 핵산 서열의 삽입 또는 치환을 가능케하는 재조합 발현 벡터를 생산하도록 함께 연결된다. 대안적으로, 본 발명의 폴리뉴클레오티드 서열(들)은 발현에 적당한 벡터 내로 폴리뉴클레오티드 서열을 포함하는 폴리뉴클레오티드 서열 또는 핵산 구성체를 삽입함으로써 발현된다. 발현 벡터의 형성에 있어서, 코딩 서열은 이 코딩 서열이 발현을 위해 적절한 제어 서열과 작동가능하게 연결되도록 벡터 내에 위치된다.

재조합 발현 벡터는 재조합 DNA 절차를 편리하게 실시할 수 있고 변이체 글리코실트랜스퍼라제 폴리뉴클레오티드 서열의 발현을 일으킬 수 있는 임의의 벡터(예, 플라스미드 또는 바이러스)일 수 있다. 벡터의 선택은 통상 벡터가 도입되는 숙주 세포와 벡터의 상용성에 좌우된다. 벡터는 선형이거나 폐쇄된 환형 플라스미드일 수 있다.

일부 실시양태에서, 발현 벡터는 자가 복제 벡터(즉, 염색체외 독립체로서 존재하고, 그 복제가 염색체 복제와 독립적인 벡터, 예컨대 플라스미드, 염색체외 요소, 미니염색체, 또는 인공 염색체)이다. 벡터는 자가 복제를 보장하는 임의의 수단을 함유할 수 있다. 일부 대안적인 실시양태에서, 벡터는 숙주 세포에 도입되는 경우, 게놈에 통합되고 그것이 통합된 염색체(들)와 함께 복제되는 것일 수 있다. 또한, 숙주 세포의 게놈에 도입되는 전체 DNA를 함께 함유하는 단일 벡터 또는 플라스미드, 또는 2 이상의 벡터 또는 플라스미드, 또는 트랜스포존이 이용될 수 있다.

일부 실시양태에서, 발현 벡터는 바람직하게는 형질전환된 세포의 용이한 선별을 허용하는 하나 이상의 선별 마커를 함유한다. "선별 마커"는 그 산물이 살생물제 또는 바이러스 내성, 중금속 내성, 영양요구체에 대한 원영양성 등을 제공하는 유전자이다. 박테리아 선별 마커의 예에는 제한없이 바실러스 서브틸리스 또는 바실러스 리체니포르미스 유래된 dal 유전자, 또는 항생제 내성, 예컨대 암피실린, 카나마이신, 클로람페니콜 또는 테트라사이클린 내성을 부여하는 마커가 포함된다. 효모 숙주 세포의 적당한 마커는 제한없이 ADE2, HIS3, LEU2, LYS2, MET3, TRP1 및 URA3을 포함한다. 사상균 숙주 세포에 하용하기 위한 선별 마커는 제한없이 amdS(아세타미다아제), argB(오르니틴 카르바모일트랜스퍼라제), bar(포스피노트리신 아세틸트랜스퍼라제), hph(히그로마이신 포스포트랜스퍼라제), niaD(나이트레이트 리덕타아제), pyrG(오로티딘-5'-포스페이트 디카르복실라아제), sC(설페이트 아데닐트랜스퍼라제), 및 trpC(안트라닐레이트 신타아제)와 이들의 균등물을 포함한다. 또다른 양태에서, 본 발명은 본 출원의 하나 이상의 조작된 글리코실트랜스퍼라제 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 숙주 세포를 제공하고, 이러한 폴리뉴클레오티드는 숙주 세포에서 조작된 글리코실트랜스퍼라제 효소(들)의 발현을 위한 하나 이상의 제어 서열에 작동가능하게 연결된다. 본 발명의 발현 벡터에 의해 코딩되는 폴리펩티드를 발현하는데 사용하기 위한 숙주 세포는 당업계에 공지되어 있고, 제한없이, 박테리아 세포, 예컨대 이. 콜라이, 비브리오 플루비알리스(Vibrio fluvialis), 스트렙토마이세스 및 살모넬라 티피뮤리움(Salmonella typhimurium) 세포; 진균 세포, 예컨대 효모 세포(예, 사카로마이세스 세레비지아 및 피키아 파스토리스(Pichia pastoris)[ATCC 수탁 No. 201178]); 곤충 세포, 예컨대 드로소필라(Drosophila) S2 및 스포돕테라(Spodoptera) Sf9 세포; 동물 세포, 예컨대 CHO, COS, BHK, 293, 및 바우스 흑색종 세포; 및 식물 세포를 포함한다. 예시적인 숙주 세포는 에스케리치아 콜라이(Escherichia coli) 균주(예, W3110(ΔfhuA) 및 BL21)이다.

따라서, 또다른 양태에서, 본 발명은 조작된 글리코실트랜스퍼라제 폴리펩티드를 생산하는 방법을 제공하고, 그 방법은 폴리펩티드의 발현에 적합한 조건 하에서 조작된 글리코실트랜스퍼라제 폴리펩티드를 코딩하는 폴리뉴클레오티드를 발현할 수 있는 숙주 세포를 배양하는 단계를 포함한다. 일부 실시양태에서, 상기 방법은 본원에 기술된 바와 같이 글리코실트랜스퍼라제 폴리펩티드를 단리 및/또는 정제하는 단계를 추가로 포함한다.

상기 기술된 숙주 세포에 적절한 배양 배지 및 성장 조건은 당업계에 잘 공지되어 있다. 글리코실트랜스퍼라제 폴리펩티드의 발현을 위한 폴리뉴클레오티드는 당업계에 공지된 다양한 방법에 의해 세포 내로 도입될 수 있다. 기법은 무엇보다 전기천공, 생체탄도 입자 충돌법, 리포솜 매개 형질감염법, 염화칼슘 형질감염법, 및 원형질 융합법이 포함된다.

본원에 개시된 특성을 갖는 조작된 글리코실트랜스퍼라제는 천연 발생 또는 조작된 글리코실트랜스퍼라제 폴리펩티드를 코딩하는 폴리뉴클레오티드에 대해 당업계에 공지되어 있고 본원에 기술되는 돌연변이유발 및/또는 지정 진화 방법을 실시하여 수득될 수 있다. 예시적인 지정 진화 기법은 돌연변이유발법 및/또는 DNA 서플링법(예, Stemmer, Proc. Natl. Acad. Sci. USA 91:10747-10751 [1994]; WO 95/22625; WO 97/0078; WO 97/35966; WO 98/27230; WO 00/42651; WO 01/75767 및 미국 특허 6,537,746 참조)이다. 사용될 수 있는 다른 지정 진화 절차는 무엇보다 스태거드 연장법(StEP), 시험관내 재조합법(예, Zhao et al., Nat. Biotechnol., 16:258-261 [1998] 참조), 돌연변이유발 PCR법(예, Caldwell et al., PCR Methods Appl., 3:S136-S140 [1994] 참조), 및 카세트 돌연변이유발법(예, Black et al., Proc. Natl. Acad. Sci. USA 93:3525-3529 [1996] 참조)을 포함한다.

예를 들면, 돌연변이유발 및 지정 진화 방법은 발현, 스크리닝 및 어세이할 수 있는 변이체 라이브러리를 생성하기 위해 폴리뉴클레오티드에 쉽게 적용될 수 있다. 돌연변이유발 및 지정 진화 방법은 당업계에 잘 공지되어 있다(예, 미국 특허 번호 5,605,793, 5,830,721, 6,132,970, 6,420,175, 6,277,638, 6,365,408, 6,602,986, 7,288,375, 6,287,861, 6,297,053, 6,576,467, 6,444,468, 5,811238, 6,117,679, 6,165,793, 6,180,406, 6,291,242, 6,995,017, 6,395,547, 6,506,602, 6,519,065, 6,506,603, 6,413,774, 6,573,098, 6,323,030, 6,344,356, 6,372,497, 7,868,138, 5,834,252, 5,928,905, 6,489,146, 6,096,548, 6,387,702, 6,391,552, 6,358,742, 6,482,647, 6,335,160, 6,653,072, 6,355,484, 6,303,344, 6,319,713, 6,613,514, 6,455,253, 6,579,678, 6,586,182, 6,406,855, 6,946,296, 7,534,564, 7,776,598, 5,837,458, 6,391,640, 6,309,883, 7,105,297, 7,795,030, 6,326,204, 6,251,674, 6,716,631, 6,528,311, 6,287,862, 6,335,198, 6,352,859, 6,379,964, 7,148,054, 7,629,170, 7,620,500, 6,365,377, 6,358,740, 6,406,910, 6,413,745, 6,436,675, 6,961,664, 6,537,746, 7,430,477, 7,873,499, 7,702,464, 7,783,428, 7,747,391, 7,747,393, 7,751,986, 6,376,246, 6,426,224, 6,423,542, 6,479,652, 6,319,714, 6,521,453, 6,368,861, 7,421,347, 7,058,515, 7,024,312, 7,620,502, 7,853,410, 7,957,912, 7,904,249, 8,383,346, 8,504,498, 8,768,871, 8,762,066, 8,849,575, 및 모든 관련 비US 대응물; Ling et al., Anal. Biochem., 254:157-78 [1997]; Dale et al., Meth. Mol. Biol., 57:369-74 [1996]; Smith, Ann. Rev. Genet., 19:423-462 [1985]; Botstein et al., Science, 229:1193-1201 [1985]; Carter, Biochem. J., 237:1-7 [1986]; Kramer et al., Cell, 38:879-887 [1984]; Wells et al., Gene, 34:315-323 [1985]; Minshull et al., Curr. Op. Chem. Biol., 3:284-290 [1999]; Christians et al., Nat. Biotechnol., 17:259-264 [1999]; Crameri et al., Nature, 391:288-291 [1998]; Crameri, et al., Nat. Biotechnol., 15:436-438 [1997]; Zhang et al., Proc. Nat. Acad. Sci. U.S.A., 94:4504-4509 [1997]; Crameri et al., Nat. Biotechnol., 14:315-319 [1996]; Stemmer, Nature, 370:389-391 [1994]; Stemmer, Proc. Nat. Acad. Sci. USA, 91:10747-10751 [1994]; WO 95/22625; WO 97/0078; WO 97/35966; WO 98/27230; WO 00/42651; WO 01/75767; WO 2009/152336, WO 2009/102901, WO 2009/102899, WO 2011/035105, WO 2013/138339, WO 2013/003290, WO 2014/120819, WO 2014/120821, WO 2015/0134315, 및 WO 2015/048573 참조, 이들 전부는 본원에 참고 인용됨).

일부 실시양태에서, 돌연변이유발 처리 후 수득한 효소 클론은 효소에 대해 소정 온도(또는 다른 어세이 조건, 예컨대 광범위한 범위의 기질에 대해 효소 활성을 테스트함)를 가하고 열처리 또는 다른 어세이 조건 후 남은 효소 활성량을 측정함으로써 스크리닝된다. 글리코실트랜스퍼라제 폴리펩티드를 코딩하는 폴리뉴클레오티드를 함유하는 클론을 이어서 시퀀싱하여 뉴클레오티드 변화(있다면)를 확인하며, 숙주 세포에서 효소 발현을 위해 사용한다. 발현 라이브러리로부터 효소 활성을 측정하는 것은 당업계에 공지된 임의의 적당한 방법(예, 표준 생화학 기법, 예컨대 HPLC 분석법)을 사용해 수행할 수 있다.

일부 실시양태에서, 돌연변이유발 처리 후 수득된 클론은 하나 이상의 바람직한 개선된 효소 특성(예, 개선된 트랜스퍼라제 활성)을 갖는 조작된 글리코실트랜스퍼라제에 대해 스크리닝될 수 있다. 발현 라이브러리로부터 효소 활성을 측정하는 것은, 당업계에 공지된 바와 같이(예, 단실 클로라이드 또는 OPA를 사용; 예, Yaegaki et al., J Chromatogr. 356(1):163-70 [1986] 참조), 표준 생화학 기법, 예컨대 HPLC 분석, LC-MS/MS 분석, 및/또는 산물의 유도체화(분리 전 또는 후)를 사용하여 수행될 수 있다.

공지된 서열의 조작된 폴리펩티드의 경우, 효소를 코딩하는 폴리뉴클레오티드는 공지된 합성 방법에 따라 표준 고체상 방법에 의해 생산될 수 있다. 일부 실시양태에서, 최대 약 100 염기의 단편을 개별적으로 합성한 후, 연결(예, 효소 또는 화학 결찰 방법, 또는 폴리머라아제 매개 방법의 의함)하여 임의의 바람직한 연속 서열을 형성시킬 수 있다. 예를 들면, 본원에 개시된 폴리뉴클레오티드 및 올리고뉴클레오티드는 전형적으로 자동화된 합성 방법을 실시함으로써, 고전적인 포스포라미다이트 방법을 사용하여 화학 합성에 의해 생산될 수 있다(예, Beaucage et al., Tetra. Lett., 22:1859-69 [1981]; and Matthes et al., EMBO J., 3:801-05 [1984] 참조). 포스포라미다이트 방법에 따라, 올리고뉴클레오티드를 합성(예, 자동 DNA 합성기에서), 정제, 어닐링, 결찰 및 적절한 벡터에 클로닝한다.

조작된 폴리펩티드의 서열이 공지되어 있는 경우, 효소를 코딩하는 폴리뉴클레오티드는 공지된 합성 방법에 따라 표준 고체상 방법에 의해 생산될 수 있다. 일부 실시양태에서, 최대 약 100 염기의 단편을 개별적으로 합성한 후, 연결(예, 효소 또는 화학 결찰 방법, 또는 폴리머라아제 매개 방법에 의함)하여 임의의 바람직한 연속 서열을 형성시킬 수 있다. 예를 들면, 글리코실트랜스퍼라제의 일부를 코딩하는 폴리뉴클레오티드 및 올리고뉴클레오티드는 전형적으로 자동화된 합성 방법을 실시함으로써, 당업계에 공지된 화학 합성에 의해 생산될 수 있다(예, Beaucage et al., Tet. Lett. 22:1859-69 [1981]의 고전적인 포스포라미다이트 방법, 또는 Matthes et al., EMBO J. 3:801-05 [1984]에 기술된 방법). 포스포라미다이트 방법에 따라, 올리고뉴클레오티드를 합성(예, 자동 DNA 합성기에서), 정제, 어닐링, 결찰 및 적절한 벡터에 클로닝한다. 또한, 본질적으로 임의의 핵산을 다양한 임의의 상업처로부터 수득할 수 있다. 일부 실시양태에서, 추가 변이체는 결실, 삽입, 및/또는 치환을 함유하는 올리고뉴클레오티드를 합성하고, 개선된 특성을 갖는 조작된 글리코실트랜스퍼라제를 형성하기 위해 다양한 순열(permutation) 내 올리고뉴클레오티드를 조합함으로써 형성될 수 있다.

따라서, 일부 실시양태에서, 조작된 글리코실트랜스퍼라제 폴리펩티드를 생산하는 방법은 (a) 서열번호 2, 4, 6 및/또는 8 유래의 아미노산 서열에 대해 적어도 약 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 또는 그 이상의 서열 동일성을 갖고, 서열번호 2, 4, 6 및/또는 8에 비해 하나 이상의 잔기 차이를 갖는 아미노산 서열을 포함하는 폴리펩티드를 코딩하는 폴리뉴클레오티드를 합성하는 단계; 및 (b) 폴리뉴클레오티드에 의해 코딩된 글리코실트랜스퍼라제 폴리펩티드를 발현하는 단계를 포함한다.

이 방법의 일부 실시양태에서, 폴리뉴클레오티드는 경우에 따라 하나 또는 몇몇(예, 최대 3, 4, 5, 또는 최대 10) 아미노산 잔기 결실, 삽입 및/또는 치환을 갖는 조작된 글리코실트랜스퍼라제를 코딩한다. 일부 실시양태에서, 아미노산 서열은 경우에 따라 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-15, 1-20, 1-21, 1-22, 1-23, 1-24, 1-25, 1-30, 1-35, 1-40, 1-45, 또는 1-50 아미노산 잔기 결실, 삽입 및/또는 치환을 갖는다. 일부 실시양태에서, 아미노산 서열은 경우에 따라 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 30, 35, 40, 45, 또는 50 아미노산 잔기 결실, 삽입 및/또는 치환을 갖는다. 일부 실시양태에서, 아미노산 서열 경우에 따라 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 21, 22, 23, 24, 또는 25 아미노산 잔기 결실, 삽입 및/또는 치환을 갖는다. 일부 실시양태에서, 치환은 보존성 또는 비보존성 치환일 수 있다.

일부 실시양태에서, 숙주 세포에서 발현된 임의의 조작된 글리코실트랜스퍼라제 효소는 하나 이상의 임의의 잘 공지된 단백질 정제 기법, 무엇보다 리소자임 처리, 초음파처리, 여과, 염석, 초원심분리 및 크로마토그래피를 포함하는 기법을 사용함으로써 세포 및/또는 배양 배지로부터 회수될 수 있다. 박테리아, 예컨대 이. 콜라이 유래의 단백질의 고효율 추출 및 용해를 위한 적당한 용액은 구입 가능하다(예, CelLytic BTM, Sigma-Aldrich, 미국 미주리주 세인트 루이스 소재).

글리코실트랜스퍼라제 폴리펩티드의 단리를 위한 크로마토그래피 기법은 무엇보다 역상 크로마토그래피 고성능 액체 크로마토그래피, 이온 교환 크로마토그래피, 겔 전기영동, 및 친화성 크로마토그래피를 포함한다. 특정 효소를 정제하기 위한 조건은 부분적으로 예컨대 순전하, 소수성, 친수성, 분자량, 분자 형상 등의 인자에 의존하고, 당업자에게 자명하다.

일부 실시양태에서, 친화성 기법은 개선된 글리코실트랜스퍼라제 효소를 단리시키는 데 사용될 수 있다. 친화성 크로마토그래피 정제의 경우, 글리코실트랜스퍼라제 폴리펩티드에 특이적으로 결합하는 임의의 항체가 사용될 수 있다. 항체 생산의 경우, 제한없이 토끼, 마우스, 래트 등을 비롯한 다양한 호스트 동물에 글리코실트랜스퍼라제 폴리펩티드, 또는 이의 단편을 주입함으로써 면역화될 수 있다. 글리코실트랜스퍼라제 폴리펩티드 또는 단편은 측쇄 작용 기 또는 측쇄 작용 기에 결합되는 링커에 의해 BSA 등의 적당한 담체에 결합될 수 있다. 일부 실시양태에서, 친화성 정제는 글리코실트랜스퍼라제, 예컨대 폴리(L-프롤린) 또는 다이 친화성 컬럼에 의해 결합된 특이적 리간드를 사용할 수 있다(예, EP0641862; Stellwagen, "Dye Affinity Chromatography," In Current Protocols in Protein Science, Unit 9.2-9.2.16 [2001] 참조).

관심 β-글리코실레이트 화합물에 대하여 글리코실트랜스퍼라제를 사용하는 방법

일부 실시양태에서, 본원에 제공된 방법, 공정 및 시스템은 기질을 β-글리코실화된 산물로 전환시키기 용이하다. 일부 실시양태에서, 기질 스테비오시드를 β-글루코실화된 산물 레바우디오시드 A로 전환시킨다. 일부 실시양태에서, 이러한 글리코실화 반응은 효소에 의해 촉진된다. 일부 실시양태에서, 효소는 글리코실트랜스퍼라제이지만, 일부 대안적인 실시양태에서 효소는 포스포릴라제이다. 일부 추가 실시양태에서, 글리코실트랜스퍼라제 또는 포스포릴라제는 글루코스-1-포스페이트(예, α-글루코스-1-포스페이트)를 글루코실 공여체로서 이용한다. 일부 추가 실시양태에서, 기질의 특정 모이어티(예, 히드록실 기)는 글리코실(예, 글루코실) 수용체로서 작용한다. 본 발명에 사용하는 글리코실트랜스퍼라제의 일부 비제한적 예시는 무차별(promiscuous) 박테리아 UDP-글루코스-의존 글리코실트랜스퍼라제(예, 서열번호 4, 6 또는 12의 글리코실트랜스퍼라제), 및 α-글루코스-1-포스페이트(예, 서열번호 8 또는 14의 라미나리비오스 포스포릴라제)를 생산하기 위해 β-글리코실 분해 활성을 보유하는 포스포릴라제를 포함한다. 일부 실시양태에서, 효소는 시험관내에서 기질과 접촉하지만, 일부 대안적인 실시양태에서, 효소는 생체내에서 기질과 접촉한다. 일부 추가의 실시양태에서, 기질 및 효소는 조작된 숙주 세포 내에서 생산되고 접촉된다.

폴리펩티드가 전환을 실시하기에 적합한 반응 조건은 당업자에 의해 결정될 수 있다. 하기 실시예는 폴리펩티드의 농도 또는 양, 기질, 보조기질(예, 글루코스-1-포스페이트), 완충액, 공용매, pH, 온도 및 반응 시간을 비롯한 예시적 반응 조건을 제공한다. 예를 들면, 일부 실시양태에서, 기질 농도 최대 5 mM 또는 기질의 용해성 한계, 최대 5 mM 보조기질, 또는 보조기질의 용해성 한계로, 0-20% 에탄올을 갖는 25-100 mM 완충액 중, pH 5-8, 30-65℃에서 5 m-18 h 동안 반응을 수행한다. 일부 실시양태에서, 더욱 저렴한 방식으로 반응을 수행하기에 유용한 계내 글루코스-1-포스페이트를 재생하기 위해 보조효소 및 제2 보조기질로 추가적으로 반응을 수행할 수 있다. 예를 들면, 보조효소는 유지되는 포스포릴라제, 예컨대 수크로스 포스포릴라제(예, 짝수의 서열번호 16-32)일 수 있고, 추가의 보조기질은 적절한 α-연결된 이당류, 삼당류 또는 올리고당류 효소 기질, 예컨대 수크로스일 수 있다. 보조효소는 역위 포스포릴라제, 예컨대 셀로비오스 포스포릴라제(E.C. 2.4.1.20)일 수 있고, 추가의 보조기질은 적절한 β-연결된 이당류, 삼당류 또는 올리고당류 효소 기질, 예컨대 셀로비오스일 수 있다. 하지만, 본 발명은 하기 실시예에 제시된 특정 반응 및 조건으로 제한되는 것을 의도하지 않는다. 본 발명의 다양한 특징부 및 실시양태는 하기 대표 실시예에 예시되어 있으며 이는 예시적인 것으로 의도된 것이지 제한하고자 하는 것이 아니다.

실험예

실현된 실험 및 결과를 비롯한 하기 실시예는 단지 예시 목적으로 제공되며 본 발명을 제한하는 것으로 이해하여서는 안된다.

하기 실험 개시내용에서, 하기 약어가 적용된다: M(몰); mM (밀리몰), uM 및 μΜ(마이크로몰); nM(나노몰); mol(몰); gm 및 g(그램); mg(밀리그램); ug 및 μg(마이크로그램); L 및 l(리터); ml 및 mL(밀리리터); cm(센티미터); mm(밀리미터); um 및 μm(마이크로미터); sec.(초); min(분); h 및 hr(시간); U(유닛); MW(분자량); rpm(분당 회전수); psi 및 PSI(평방 인치당 파운드); ℃(섭씨도); RT 및 rt(실온); CAM 및 cam(클로람페니콜); PMBS(폴리마이신 B 설페이트); IPTG(이소프로필 β-D-l-티오갈락토피라노시드); UGT(우리딘 5'-디포스포글루코스 글리코실트랜스퍼라제); LB(루리아 브로쓰); TB(테리픽 브로쓰); SFP(쉐이크 플라스크 파우더); CDS(코딩 서열); DNA(데옥시리보핵산); RNA(리보핵산); 이. 콜라이 W3110(미국 코네티컷 뉴헤븐 소재 콜라이 유전자 스톡 센터([CGSC]에서 입수한 통용되는 실험실 이. 콜라이 균주); HTP(고수율); HPLC(고성능 액체 크로마토그래피); MS(질량 분광법); FIOPC(양성 대조군 대비 배수 향상); Sigma-Aldrich(Sigma-Aldrich, 미국 미주리주 세인트 루이스 소재; Difco(Difco Laboratories, BD Diagnostic Systems, 미국 미시간주 디트로이트 소재); Microfluidics(Microfluidics, 미국 메사추세츠주 웨스트우드 소재); ChromaDex(ChromaDex, Inc., 미국 캘리포니아주 어바인 소재); 및 Thermotron(Thermotron, 미국 미시간주 홀랜드 소재).

실시예 1

글루코실화 활성을 갖는 UGT 효소의 합성, 최적화 및 어세이

본 실시예에는, 글루코실화 활성을 갖는 UGT 효소의 합성, 최적화 및 어세이에 사용되는 방법이 기술된다.

유전자 합성 및 최적화:

스테비올비오시드를 레바우디오시드 B로 글루코실화시키고 스테비오시드를 레바우디오시드 A로 글루코실화시키는 것으로 보고된, 야생형 스테비아 레바우디아나 폴리펩티드(서열번호 2)를 코딩하는 폴리뉴클레오티드 서열(서열번호 1)을, 코돈 최적화시키고 서열번호 9의 유전자로서 합성하였다. 야생형 스트렙토마이세스 레지스토마이시피쿠스 글리코실트랜스퍼라제 폴리펩티드(서열번호 4)를 코딩하는 폴리뉴클레오티드 서열(서열번호 3)은, 올레안도마이신을 글루코실화하고 다른 뉴클레오티드 당류 공여체와 다른 기질에 대하여 무차별 활성을 갖는 것으로 보고된 야생형 스트렙토마이세스 안티바이오티쿠스 올레안도마이신 글리코실트랜스퍼라제(서열번호 5) 서열의 동족체(82% 서열 동일성을 가짐)이고, 유사하게 코돈 최적화되고 합성되었다(서열번호 11). 이러한 합성 유전자(서열번호 9 및 11)를 개별적으로 pCK110900 벡터 시스템 내에 클로닝하고(예, 미국 특허 출원 공개 번호 2006/0195947 참조, 이는 본원에 참고 인용됨), 이. 콜라이 W3110(ΔfhuA)에서 후속 발현시켰다. 이. 콜라이 균주 W3110은 lac 프로모터의 제어 하에 UGT 효소를 발현하였다.

쉐이크 플라스크 파우더(SFP)의 제조:

본원에 기술된 생체촉매 공정에 사용된 특성화 어세이를 위한 글리코실트랜스퍼라제 폴리펩티드 쉐이크 플라스크 파우더(SFP)를 생성하는 데 쉐이크 플라스크 절차를 사용하였다. 효소의 쉐이크 플라스크 파우더(SFP) 제제는 HTP 어세이에 사용된 세포 용해물에 비해 효소의 더욱 정제된 제제(예, 총 단백질의 최대 > 30%)를 제공하고 또한 더욱 농축된 효소 용액의 사용을 허용한다. 조작된 관심 폴리펩티드를 코딩하는 플라스미드를 함유하는 이. 콜라이의 단일 콜로니를, 30 μg/ml 클로람페니콜 및 1% 글루코스를 함유하는 5 mL 루리아 베타니 브로쓰에 접종하였다. 250 rpm에서 진탕하면서 30℃ 인큐베이터에서 세포를 밤새(적어도 16시간) 성장시켰다. 1 L 플라스크 중 30 μg/ml CAM을 함유하는 250 mL 테리픽 브로쓰(12 g/L 박토-트립톤, 24 g/L 효모 추출물, 4 mL/L 글리세롤, 65 mM 칼륨 포스페이트, pH 7.0, 1 mM MgS0₄) 내에서 배양물을 600 nm 광학 밀도(OD600) 0.2로 희석하고 30℃에서 성장을 허용하였다. 배양물의 OD600이 0.6-0.8인 경우 1 mM의 최종 농도로 IPTG를 첨가함으로써 글리코실트랜스퍼라제 유전자의 발현을 유도하였다. 이후 인큐베이션을 밤새(적어도 16시간) 계속하였다. 원심분리(5000 rpm, 15 min, 4℃)에 의해 세포를 수확하고 상청액을 따라버렸다. 세포 펠렛을 2 부피의 25 mM 트리에탄올아민 완충액, pH 7.5 중에 재현탁시키고, 표준 이. 콜라이 용해 셋팅을 갖는 MICROFLUIDIZER^® 고압 호모게나이저(Microfluidics)에 통과시키고 4℃에서 유지하였다. 세포 잔사물을 원심분리(10,000 rpm, 45분, 4℃)에 의해 제거하였다. 투명해진 용해물 상청액을 수집하고 -80℃에서 냉동시킨 후 동결 건조하여 미정제 폴리펩티드의 건조 쉐이크 플라스크 파우더를 제조하였다.

스테비오시드 글루코실화를 위한 SFP 어세이:

20 g/L 파우더를 제공하기 위해 SFP를 재구성하였다. 이후, 5 mM α-글루코스-1-포스페이트 유무 하에, 3 mM MgSO₄ 및 1 mM 스테비오시드(ChromaDex, > 94% 순도)를 갖는 50 mM Tris-HCl 완충액, pH 7.5의 200 μL 총 반응 부피 중에 50 μL의 상기 스톡을 희석시켰다. 16-18h 동안 300 RPM 진탕 하에 Thermotron 역가-플레이트 쉐이커 중에서 30℃에서 반응을 수행하였다.

HPLC-MS/MS 분석:

2% 포름산을 갖는 0.5 부피/부피 아세토니트릴로 상기 기술된 반응을 켄칭하고 원심분리로 침전시켰다. 하기 기기 및 파라미터로 LC-MS/MS에 의해 상청액에서 글리코실화된 스테비오시드 산물을 검출하였다:

서열번호 9 및 11에 의해 코딩된 폴리펩티드에 대해 신규 활성을 검출하였다. 서열번호 9에 의해 코딩된 글루코실트랜스퍼라제 폴리펩티드의 경우, 2개의 산물이 검출되었는데, 하나는 레바우디오시드 A와 공용출되고 하나는 2.22 m에 용출되었다. 이러한 산물은 α-글루코스-1-포스페이트의 존재 하에서는 검출되지만, α-글루코스-1-포스페이트의 부재 하에서는 검출되지 않았다. 이러한 산물은 음성 대조군 샘플에 존재하지 않았다. 서열번호 11에 의해 코딩된 글루코실트랜스퍼라제 폴리펩티드의 경우, 2개의 산물이 체류 시간 1.76 및 2.18 m에 검출되었다. 이러한 산물은 α-글루코스-1-포스페이트의 존재 하에 검출되었고, α-글루코스-1-포스페이트의 부재 하에서는 감소된 수준으로 검출되었다. 이러한 산물은 음성 대조군 샘플에 존재하지 않았다. 따라서, 본 발명은 스테비올 글리코시드 기질을 글루코실화하는 신규 공정을 제공한다. 추가로, 본 발명은 스테비올 기질을 글리코실화하기 위해 우리딘 5'-디포스포글루코스 대신에 α-글루코스-1-포스페이트와 사용되는 서열번호 2 및 4에 의해 코딩되는 야생형 효소를 비롯한 이러한 부류 내 제1 효소를 제공한다.

실시예 2

글루코스-1-포스페이트의 계내 형성

본 실시예에는 기질의 UDP-글루코스-무관 글루코실화를 위한 글루코스-1-포스페이트의 계내 형성을 평가하는 실험(도 3 참조)이 기술된다. 유전자 합성 및 최적화, 그리고 쉐이크 플라스크 파우더의 제조를 실시예 1에 기술된 바대로 수행하였다.

SFP의 어세이:

20 g/L 파우더로 SFP를 재구성하였다. 그리고나서, 서열번호 9 또는 11을 발현하는 이. 콜라이 유래의 20 μL의 SFP 및 홀수 서열번호 15-31을 발현하는 이. 콜라이 유래의 10 μL의 SFP 또는 또다른 이당류 포스포릴라제 또는 음성 대조군을, 0-5 mM α-글루코스-1-포스페이트 하에, 3 mM MgSO₄, 0.3 M 수크로스 (또는 이당류 포스포릴라제에 상응하는 이당류), 5 mM 무기 포스페이트, 및 1 mM 스테비오시드(ChromaDex, > 94% 순도)를 갖는 50 mM Tris-HCl 완충액, pH 7.5의 200 μL 총 반응 부피 중에 희석시켰다. 16-18h 동안 300 RPM 진탕 하에 Thermotron 역가-플레이트 쉐이커 중에서 30℃에서 반응을 수행하였다.

HPLC-MS/MS 분석:

반응을 켄칭하고, 실시예 1에 기술된 바와 같이 LC-MS/MS에 의해 분석하였다. 음성 대조군을 발현하는 이. 콜라이 유래의 SFP의 존재 하에 동일한 샘플에 비해 홀수 서열번호 15-31을 발현하는 이. 콜라이 유래의 SFP 또는 또다른 이당류 포스포릴라제의 존재 하에 체류 시간 1.76, 2.18, 2.22 및 2.35 m에서 스테비오시드의 글루코실화된 산물로의 증가된 전환에 의해 α-글루코스-1-포스페이트의 계내 형성을 입증하였다.

실시예 3

변이체의 진화 및 스크리닝

본 실시예는 α-글루코스-1-포스페이트를 사용하여 개선된 기질 글루코실화를 위해 서열번호 9 및 11로부터 유래된 조작된 폴리펩티드의 진화 및 스크리닝 동안 실시된 실험이 기술된다.

지정 진화는 출발 "골격" 유전자 서열로서 각각 서열번호 10 또는 12의 폴리펩티드를 코딩하는 서열번호 9 또는 11의 폴리뉴클레오티드로 시작한다. 조작된 폴리펩티드의 라이브러리는 잘 공지된 다양한 기법(예, 포화 돌연변이유발, 앞서 식별된 이득 아미노산 차이의 재조합)을 사용하여 생성되고 글루코스-1-포스페이트, 또는 실시예 1 및 2에 기술된 바와 같이 저렴한 이당류, 무기 포스페이트, 및 야생형 또는 조작된 이당류 포스포릴라제로 이루어진 글루코스-1-포스페이트를 위한 재생 시스템을 사용하여 원하는 기질의 글루코실화를 수행하는 조작된 폴리펩티드의 능력을 측정하는 HTP 어세이 및 분석 방법을 사용하여 스크리닝된다.

스크리닝 후, 출발 골격 서열에 비해 가장 개선점을 보이는 조작된 폴리펩티드가 추가 라이브러리의 구성을 위한 골격 서열로서 사용되며, 스크리닝 공정은 원하는 활성을 위한 폴리펩티드를 진화시키기 위해 반복된다. 다양한 기질을 위한 효소의 무차별혼합(promiscuity)으로 인해, 이 공정은 수많은 관심 기질의 글루코실화를 위해 저렴한 보조기질을 사용하는 생촉매를 개발하도록 반복될 수 있다.

실시예 4

글루코실화 활성을 갖는 포스포릴라제 효소의 합성, 최적화 및 어세이

본 실시예에는 글루코실화 활성을 갖는 포스포릴라제 효소에 합성, 최적화 및 어세이를 실시하는 실험이 기술된다.

유전자 합성 및 최적화:

라미나리비오스를 가인산분해시켜 글루코스를 방출하고 α-글루코스-1-포스페이트를 형성하는 것으로 보고된, 야생형 파에니바실루스 종 YM1 라미나리비오스 포스포릴라제 폴리펩티드(서열번호 8)를 코딩하는 폴리뉴클레오티드 서열(서열번호 7)을 코돈 최적화시키고, 서열번호 13의 유전자로서 합성하였다. 서열번호 13의 합성 유전자를 pCK110900 벡터 시스템 내에 클로닝하고(예, 미국 특허 출원 공개 번호 20060195947 참조, 이는 본원에 참고 인용됨), 이. 콜라이 W3110(ΔfhuA)에서 후속 발현시켰다. 이. 콜라이 균주 W3110은 lac 프로모터의 제어 하에 효소를 발현하였다.

고수율(HTP) 용해물의 제조:

관심 폴리펩티드 유전자를 발현하는 이. 콜라이 세포를 성장시키고 96웰 플레이트에서 유도하고, 펠렛화하고, 실온에서 역가-플레이트 쉐이커 상에서 2 h 동안 저속 진탕으로 250 μL 용해 완충액(20 mM Tris-HCl 완충액 중 0.5 g/L 리소자임 및 0.5 g/L PMBS, pH 7.5) 중에서 용해시켰다. 그리고나서 플레이트를 4000 rpm 및 4℃에서 20 m 동안 원심분리하고 본원에 기술된 어세이 반응에 투명해진 용해물 상청액을 사용하였다.

스테비오시드의 글루코실화를 위한 어세이:

이 어세이에서, 50 μL의 투명해진 용해물을, 1.65 mM α-글루코스-1-포스페이트 및 0.5 mM 스테비오시드(ChromaDex, > 94% 순도)를 갖는 50 mM 나트륨 아세테이트 완충액, pH 5.5의 200 μL 총 반응 부피 중에 용해시켰다. 18h 동안 300 RPM 진탕 하에 Thermotron 역가-플레이트 쉐이커 중에서 40℃에서 반응을 수행하였다.

HPLC-MS/MS 분석:

반응을 켄칭하고, 실시예 1에 기술된 바와 같이 LC-MS/MS에 의해 분석하였다. 체류 시간 2.18 m으로 글루코실화된 스테비오시드 산물은 라미나리비오스 포스포릴라제의 존재 하에서 관찰되지만 음성 대조군 샘플에서는 아니었다. 이러한 결과는 라미나리비오스 포스포릴라제가 스테비오시드 및 다른 기질의 α-글루코시드화를 위한 신규 방법으로서 α-글루코스-1-포스페이트와 사용될 수 있다는 것을 나타낸다. 실시예 3에 기술된 바와 같이, α-글루코스-1-포스페이트는 저렴한 이당류, 무기 포스페이트 및 이당류 포스포릴라제를 사용하여 재생될 수 있다.

SEQUENCE LISTING <110> CODEXIS, INC. Vroom, Jonathan Galanie, Stephanie Sue Alvizo, Oscar <120> ENZYMATIC GLYCOSYLATION OF STEVIOL GLYCOSIDES AND OTHER COMPOUNDS WITH GLUCOSE-1-PHOSPHATE <130> CX8-155USP1 <140> NOT YET ASSIGNED <141> 2016-06-15 <160> 32 <210> 1 <211> 1326 <212> DNA <213> Artificial Sequence <220> <223> Wild type UDP-glycosyltransferase 76G1 from Stevia <400> 1 atggaaaata aaacggagac caccgttcgc cggcgccgga gaataatatt attcccggta 60 ccatttcaag gccacattaa cccaattctt cagctagcca atgtgttgta ctctaaagga 120 ttcagtatca ccatctttca caccaacttc aacaaaccca aaacatctaa ttaccctcac 180 ttcactttca gattcatcct cgacaacgac ccacaagacg aacgcatttc caatctaccg 240 actcatggtc cgctcgctgg tatgcggatt ccgattatca acgaacacgg agctgacgaa 300 ttacgacgcg aactggaact gttgatgtta gcttctgaag aagatgaaga ggtatcgtgt 360 ttaatcacgg atgctctttg gtacttcgcg caatctgttg ctgacagtct taacctccga 420 cggcttgttt tgatgacaag cagcttgttt aattttcatg cacatgtttc acttcctcag 480 tttgatgagc ttggttacct cgatcctgat gacaaaaccc gtttggaaga acaagcgagt 540 gggtttccta tgctaaaagt gaaagacatc aagtctgcgt attcgaactg gcaaatactc 600 aaagagatat tagggaagat gataaaacaa acaagagcat cttcaggagt catctggaac 660 tcatttaagg aactcgaaga gtctgagctc gaaactgtta tccgtgagat cccggctcca 720 agtttcttga taccactccc caagcatttg acagcctctt ccagcagctt actagaccac 780 gatcgaaccg tttttcaatg gttagaccaa caaccgccaa gttcggtact gtatgttagt 840 tttggtagta ctagtgaagt ggatgagaaa gatttcttgg aaatagctcg tgggttggtt 900 gatagcaagc agtcgttttt atgggtggtt cgacctgggt ttgtcaaggg ttcgacgtgg 960 gtcgaaccgt tgccagatgg gttcttgggt gaaagaggac gtattgtgaa atgggttcca 1020 cagcaagaag tgctagctca tggagcaata ggcgcattct ggactcatag cggatggaac 1080 tctacgttgg aaagcgtttg tgaaggtgtt cctatgattt tctcggattt tgggctcgat 1140 caaccgttga atgctagata catgagtgat gttttgaagg taggggtgta tttggaaaat 1200 gggtgggaaa gaggagagat agcaaatgca ataagaagag ttatggtgga tgaagaagga 1260 gaatacatta gacagaatgc aagagttttg aaacaaaagg cagatgtttc tttgatgaag 1320 ggtggt 1326 <210> 2 <211> 442 <212> PRT <213> Artificial Sequence <220> <223> Wild type UDP-glycosyltransferase 76G1 from Stevia <400> 2 Met Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile 1 5 10 15 Leu Phe Pro Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln Leu 20 25 30 Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr 35 40 45 Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg 50 55 60 Phe Ile Leu Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro 65 70 75 80 Thr His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His 85 90 95 Gly Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala Ser 100 105 110 Glu Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr 115 120 125 Phe Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val Leu 130 135 140 Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln 145 150 155 160 Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu 165 170 175 Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser 180 185 190 Ala Tyr Ser Asn Trp Gln Ile Leu Lys Glu Ile Leu Gly Lys Met Ile 195 200 205 Lys Gln Thr Arg Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu 210 215 220 Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro 225 230 235 240 Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser 245 250 255 Leu Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro 260 265 270 Pro Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp 275 280 285 Glu Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln 290 295 300 Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp 305 310 315 320 Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val 325 330 335 Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala 340 345 350 Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu 355 360 365 Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn 370 375 380 Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn 385 390 395 400 Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val 405 410 415 Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln 420 425 430 Lys Ala Asp Val Ser Leu Met Lys Gly Gly 435 440 <210> 3 <211> 1203 <212> DNA <213> Artificial Sequence <220> <223> Wild type macrolide glycosyltransferase from Streptomyces <400> 3 atgaccagtc gctcgcacat cgccatgttc tccatcgccg cccacgggca cgtgaacccg 60 agcctcgagg tgatccgcga gctcgtcgcg cgcgggcacc gggtgacgta cgcgattccg 120 cccgtcttcg ccgggaaggt cgccgaggcc ggcgccgagg tgaagctctg gaactccacc 180 ctgccctcgc ccgacgacga cccacaggca tggggcacga ccctgctgga caacgtggag 240 ccgttcctgg ccgacgcgat ccaggcgctc ccgcagctga tcgaggcgta cgaaggggac 300 gagcccgacc tcgtgctgca cgacatcacc tcctacccgg cccgcgtcct ggcccaccgc 360 tggggcgtgc ccgcggtctc cctgtcgccg aacctcgtcg cctgggaggg ctacgagaag 420 gaggtggccg agccgatgtg ggcggagccg aagcggaccg agcgcgggcg ggcctactac 480 gcccgcttcc acgcctggct ggaggagaac ggcgtcaccc tgcacccgga cgacttcgtg 540 ggccgccccg cccgctgtct cgtcctgatc ccgaaggcgc tgcagcccaa cgccgaccgg 600 gtggacgagg gcgtgtactc cttcgtgggc gcctgccagg gtgaccgcgg cgcggagggg 660 gagtggcggc ggcccgccgg cgccgagaag gtcgccctgg tctcgctcgg gtcctccttc 720 accaagcagc cggacttcta ccgggagtgc gtcagggcgt tcggcgagct gccgggctgg 780 cacctggtgc tccagatcgg caggcacgtc gacccggccg acctggggga cgtaccggag 840 aacgtcgaag tgcgctcctg ggtaccccag ttggcgatcc tcaaggaggc cgatctgttc 900 gtcacgcacg ccggcgcggg cggcagccag gagggtctgg ccacggccac gccgatgatc 960 gccgtaccgc aggccgtgga ccagttcggc aacgcggaca tgctccaggg gctcggtgtc 1020 gcccgccgcc tcgacaccga ggaggcgacc gccgaggccc tcagggcggc cgccctcgct 1080 ctcgtcgacg accccgaagt ggcccgtcgg gcgcgggaca tccaggctca gatggcgggg 1140 gagggcggca cgcgccgggc ggccgacctg atcgaggccg agctgccggt acggcaggcg 1200 tag 1203 <210> 4 <211> 400 <212> PRT <213> Artificial Sequence <220> <223> Wild type macrolide glycosyltransferase from Streptomyces <400> 4 Met Thr Ser Arg Ser His Ile Ala Met Phe Ser Ile Ala Ala His Gly 1 5 10 15 His Val Asn Pro Ser Leu Glu Val Ile Arg Glu Leu Val Ala Arg Gly 20 25 30 His Arg Val Thr Tyr Ala Ile Pro Pro Val Phe Ala Gly Lys Val Ala 35 40 45 Glu Ala Gly Ala Glu Val Lys Leu Trp Asn Ser Thr Leu Pro Ser Pro 50 55 60 Asp Asp Asp Pro Gln Ala Trp Gly Thr Thr Leu Leu Asp Asn Val Glu 65 70 75 80 Pro Phe Leu Ala Asp Ala Ile Gln Ala Leu Pro Gln Leu Ile Glu Ala 85 90 95 Tyr Glu Gly Asp Glu Pro Asp Leu Val Leu His Asp Ile Thr Ser Tyr 100 105 110 Pro Ala Arg Val Leu Ala His Arg Trp Gly Val Pro Ala Val Ser Leu 115 120 125 Ser Pro Asn Leu Val Ala Trp Glu Gly Tyr Glu Lys Glu Val Ala Glu 130 135 140 Pro Met Trp Ala Glu Pro Lys Arg Thr Glu Arg Gly Arg Ala Tyr Tyr 145 150 155 160 Ala Arg Phe His Ala Trp Leu Glu Glu Asn Gly Val Thr Leu His Pro 165 170 175 Asp Asp Phe Val Gly Arg Pro Ala Arg Cys Leu Val Leu Ile Pro Lys 180 185 190 Ala Leu Gln Pro Asn Ala Asp Arg Val Asp Glu Gly Val Tyr Ser Phe 195 200 205 Val Gly Ala Cys Gln Gly Asp Arg Gly Ala Glu Gly Glu Trp Arg Arg 210 215 220 Pro Ala Gly Ala Glu Lys Val Ala Leu Val Ser Leu Gly Ser Ser Phe 225 230 235 240 Thr Lys Gln Pro Asp Phe Tyr Arg Glu Cys Val Arg Ala Phe Gly Glu 245 250 255 Leu Pro Gly Trp His Leu Val Leu Gln Ile Gly Arg His Val Asp Pro 260 265 270 Ala Asp Leu Gly Asp Val Pro Glu Asn Val Glu Val Arg Ser Trp Val 275 280 285 Pro Gln Leu Ala Ile Leu Lys Glu Ala Asp Leu Phe Val Thr His Ala 290 295 300 Gly Ala Gly Gly Ser Gln Glu Gly Leu Ala Thr Ala Thr Pro Met Ile 305 310 315 320 Ala Val Pro Gln Ala Val Asp Gln Phe Gly Asn Ala Asp Met Leu Gln 325 330 335 Gly Leu Gly Val Ala Arg Arg Leu Asp Thr Glu Glu Ala Thr Ala Glu 340 345 350 Ala Leu Arg Ala Ala Ala Leu Ala Leu Val Asp Asp Pro Glu Val Ala 355 360 365 Arg Arg Ala Arg Asp Ile Gln Ala Gln Met Ala Gly Glu Gly Gly Thr 370 375 380 Arg Arg Ala Ala Asp Leu Ile Glu Ala Glu Leu Pro Val Arg Gln Ala 385 390 395 400 <210> 5 <211> 1248 <212> DNA <213> Artificial Sequence <220> <223> Wild type macrolide glycosyltransferase from Streptomyces <400> 5 atgaccaccc agaccactcc cgcccacatc gccatgttct ccatcgccgc ccacggccat 60 gtgaacccca gcctggaggt gatccgtgaa ctcgtcgccc gcggccaccg ggtcacgtac 120 gccattccgc ccgtcttcgc cgacaaggtg gccgccaccg gcgcccggcc cgtcctctac 180 cactccaccc tgcccggccc cgacgccgac ccggaggcat ggggaagcac cctgctggac 240 aacgtcgaac cgttcctgaa cgacgcgatc caggcgctcc cgcagctcgc cgatgcctac 300 gccgacgaca tccccgatct cgtcctgcac gacatcacct cctacccggc ccgcgtcctg 360 gcccgccgct ggggcgtccc ggcggtctcc ctctccccga acctcgtcgc ctggaagggt 420 tacgaggagg aggtcgccga gccgatgtgg cgcgaacccc ggcagaccga gcgcggacgg 480 gcctactacg cccggttcga ggcatggctg aaggagaacg ggatcaccga gcacccggac 540 acgttcgcca gtcatccgcc gcgctccctg gtgctcatcc cgaaggcgct ccagccgcac 600 gccgaccggg tggacgaaga cgtgtacacc ttcgtcggcg cctgccaggg agaccgcgcc 660 gaggaaggcg gctggcagcg gcccgccggc gcggagaagg tcgtcctggt gtcgctcggc 720 tcggcgttca ccaagcagcc cgccttctac cgggagtgcg tgcgcgcctt cgggaacctg 780 cccggctggc acctcgtcct ccagatcggc cggaaggtga cccccgccga actgggggag 840 ctgccggaca acgtggaggt gcacgactgg gtgccgcagc tcgcgatcct gcgccaggcc 900 gatctgttcg tcacccacgc gggcgccggc ggcagccagg aggggctggc caccgcgacg 960 cccatgatcg ccgtaccgca ggccgtcgac cagttcggca acgccgacat gctccaaggg 1020 ctcggcgtcg cccggaagct ggcgaccgag gaggccaccg ccgacctgct ccgcgagacc 1080 gccctcgctc tggtggacga cccggaggtc gcgcgccggc tccggcggat ccaggcggag 1140 atggcccagg agggcggcac ccggcgggcg gccgacctca tcgaggccga actgcccgcg 1200 cgccacgagc ggcaggagcc ggtgggcgac cgacccaacg gtgggtga 1248 <210> 6 <211> 415 <212> PRT <213> Artificial Sequence <220> <223> Wild type macrolide glycosyltransferase from Streptomyces <400> 6 Met Thr Thr Gln Thr Thr Pro Ala His Ile Ala Met Phe Ser Ile Ala 1 5 10 15 Ala His Gly His Val Asn Pro Ser Leu Glu Val Ile Arg Glu Leu Val 20 25 30 Ala Arg Gly His Arg Val Thr Tyr Ala Ile Pro Pro Val Phe Ala Asp 35 40 45 Lys Val Ala Ala Thr Gly Ala Arg Pro Val Leu Tyr His Ser Thr Leu 50 55 60 Pro Gly Pro Asp Ala Asp Pro Glu Ala Trp Gly Ser Thr Leu Leu Asp 65 70 75 80 Asn Val Glu Pro Phe Leu Asn Asp Ala Ile Gln Ala Leu Pro Gln Leu 85 90 95 Ala Asp Ala Tyr Ala Asp Asp Ile Pro Asp Leu Val Leu His Asp Ile 100 105 110 Thr Ser Tyr Pro Ala Arg Val Leu Ala Arg Arg Trp Gly Val Pro Ala 115 120 125 Val Ser Leu Ser Pro Asn Leu Val Ala Trp Lys Gly Tyr Glu Glu Glu 130 135 140 Val Ala Glu Pro Met Trp Arg Glu Pro Arg Gln Thr Glu Arg Gly Arg 145 150 155 160 Ala Tyr Tyr Ala Arg Phe Glu Ala Trp Leu Lys Glu Asn Gly Ile Thr 165 170 175 Glu His Pro Asp Thr Phe Ala Ser His Pro Pro Arg Ser Leu Val Leu 180 185 190 Ile Pro Lys Ala Leu Gln Pro His Ala Asp Arg Val Asp Glu Asp Val 195 200 205 Tyr Thr Phe Val Gly Ala Cys Gln Gly Asp Arg Ala Glu Glu Gly Gly 210 215 220 Trp Gln Arg Pro Ala Gly Ala Glu Lys Val Val Leu Val Ser Leu Gly 225 230 235 240 Ser Ala Phe Thr Lys Gln Pro Ala Phe Tyr Arg Glu Cys Val Arg Ala 245 250 255 Phe Gly Asn Leu Pro Gly Trp His Leu Val Leu Gln Ile Gly Arg Lys 260 265 270 Val Thr Pro Ala Glu Leu Gly Glu Leu Pro Asp Asn Val Glu Val His 275 280 285 Asp Trp Val Pro Gln Leu Ala Ile Leu Arg Gln Ala Asp Leu Phe Val 290 295 300 Thr His Ala Gly Ala Gly Gly Ser Gln Glu Gly Leu Ala Thr Ala Thr 305 310 315 320 Pro Met Ile Ala Val Pro Gln Ala Val Asp Gln Phe Gly Asn Ala Asp 325 330 335 Met Leu Gln Gly Leu Gly Val Ala Arg Lys Leu Ala Thr Glu Glu Ala 340 345 350 Thr Ala Asp Leu Leu Arg Glu Thr Ala Leu Ala Leu Val Asp Asp Pro 355 360 365 Glu Val Ala Arg Arg Leu Arg Arg Ile Gln Ala Glu Met Ala Gln Glu 370 375 380 Gly Gly Thr Arg Arg Ala Ala Asp Leu Ile Glu Ala Glu Leu Pro Ala 385 390 395 400 Arg His Glu Arg Gln Glu Pro Val Gly Asp Arg Pro Asn Gly Gly 405 410 415 <210> 7 <211> 894 <212> DNA <213> Artificial Sequence <220> <223> Wild type laminaribiose phosphorylase from Paenibacillus <400> 7 atgtacccat ttggaaaagg ctttgcccgt tacgttcctt ttctgctgct gttgattccg 60 ctggcgttat acgtcgtttt ttatttcgga ccatcggtgt tgaccgtgat ttattcgttt 120 acggatgtga aaaacatccc cggcagctcc atgaacttcg tcgggctcga taattataaa 180 gacttgtttt ttgccggaaa ttccggggaa cgctgggttt ccatcaaaaa cacgttaatt 240 ttcatgttta tcgtcaccat cgtgcagaac ggagtggcgt tgtttgtggc tgtgctgatc 300 aaccaacggc tgcgcggcga ttatttttac cgggccgtat tttttcttcc ggtcgtgctt 360 ggggtggccg ttgttgcgct cgtttggggc atgatgttcg atccgatgag cgggccggtt 420 aacatgctgt atcaatcgct gttcggatat aaagacatgt ttttctccag ctttacgcat 480 gcgttcggct acattatttt cgttcaaatc tggatgtaca tgggctattc aatgctgatt 540 tttctcgccg gcctacaatc cgtgccaaaa gatctgtacg aagcggggta catcgacggt 600 acgaaccgct ggcaatcgtt caagaatatt acgttcccgc tgatcgcccc gtcttttacg 660 gtcaatatgc tgctttcgat catcggggcg atgtccacgt tcgatattat cctcgccacg 720 acggacggca agttcaacac cagaacgatg gcttacgacg tatataagga aacgttccgc 780 ggcagtctgg aaatgggctt gccttcggcg ctgtccgtgg tccagttcct gatcattttg 840 gtgtttgtta tcgtggccgt cagacagacg cgtaagagag aggtggaata ttaa 894 <210> 8 <211> 297 <212> PRT <213> Artificial Sequence <220> <223> Wild type laminaribiose phosphorylase from Paenibacillus <400> 8 Met Tyr Pro Phe Gly Lys Gly Phe Ala Arg Tyr Val Pro Phe Leu Leu 1 5 10 15 Leu Leu Ile Pro Leu Ala Leu Tyr Val Val Phe Tyr Phe Gly Pro Ser 20 25 30 Val Leu Thr Val Ile Tyr Ser Phe Thr Asp Val Lys Asn Ile Pro Gly 35 40 45 Ser Ser Met Asn Phe Val Gly Leu Asp Asn Tyr Lys Asp Leu Phe Phe 50 55 60 Ala Gly Asn Ser Gly Glu Arg Trp Val Ser Ile Lys Asn Thr Leu Ile 65 70 75 80 Phe Met Phe Ile Val Thr Ile Val Gln Asn Gly Val Ala Leu Phe Val 85 90 95 Ala Val Leu Ile Asn Gln Arg Leu Arg Gly Asp Tyr Phe Tyr Arg Ala 100 105 110 Val Phe Phe Leu Pro Val Val Leu Gly Val Ala Val Val Ala Leu Val 115 120 125 Trp Gly Met Met Phe Asp Pro Met Ser Gly Pro Val Asn Met Leu Tyr 130 135 140 Gln Ser Leu Phe Gly Tyr Lys Asp Met Phe Phe Ser Ser Phe Thr His 145 150 155 160 Ala Phe Gly Tyr Ile Ile Phe Val Gln Ile Trp Met Tyr Met Gly Tyr 165 170 175 Ser Met Leu Ile Phe Leu Ala Gly Leu Gln Ser Val Pro Lys Asp Leu 180 185 190 Tyr Glu Ala Gly Tyr Ile Asp Gly Thr Asn Arg Trp Gln Ser Phe Lys 195 200 205 Asn Ile Thr Phe Pro Leu Ile Ala Pro Ser Phe Thr Val Asn Met Leu 210 215 220 Leu Ser Ile Ile Gly Ala Met Ser Thr Phe Asp Ile Ile Leu Ala Thr 225 230 235 240 Thr Asp Gly Lys Phe Asn Thr Arg Thr Met Ala Tyr Asp Val Tyr Lys 245 250 255 Glu Thr Phe Arg Gly Ser Leu Glu Met Gly Leu Pro Ser Ala Leu Ser 260 265 270 Val Val Gln Phe Leu Ile Ile Leu Val Phe Val Ile Val Ala Val Arg 275 280 285 Gln Thr Arg Lys Arg Glu Val Glu Tyr 290 295 <210> 9 <211> 1374 <212> DNA <213> Artificial Sequence <220> <223> Variant of UDP-glycosyltransferase 76G1 from Stevia <400> 9 atggagaaca aaaccgaaac caccgtgcgt cgtcgtcgtc gtatcattct gtttccggtt 60 ccgttccagg gccacatcaa cccgattctg caactggcga acgtgctgta cagcaagggt 120 tttagcatca ccatttttca caccaacttc aacaagccga aaaccagcaa ctatccgcac 180 ttcacctttc gtttcatcct ggacaacgat ccgcaggacg agcgtattag caacctgccg 240 acccatggtc cgctggcggg tatgcgtatc ccgatcatta acgagcacgg cgcggatgaa 300 ctgcgtcgtg agctggaact gctgatgctg gcgagcgagg aagacgagga agttagctgc 360 ctgattaccg atgcgctgtg gtacttcgcg caaagcgtgg cggacagcct gaacctgcgt 420 cgtctggttc tgatgaccag cagcctgttt aacttccacg cgcacgtgag cctgccgcag 480 tttgacgagc tgggctacct ggatccggac gataaaaccc gtctggagga acaagcgagc 540 ggtttcccga tgctgaaggt taaagatatc aagagcgcgt atagcaactg gcagatcctg 600 aaagaaattc tgggcaagat gatcaagcag acccgtgcga gcagcggtgt gatttggaac 660 agctttaaag agctggagga aagcgagctg gaaaccgtta tccgtgaaat tccggcgccg 720 agcttcctga ttccgctgcc gaagcacctg accgcgagca gcagcagcct gctggaccac 780 gatcgtaccg tgttccagtg gctggaccag caaccgccga gcagcgtgct gtacgttagc 840 tttggcagca ccagcgaggt ggacgaaaag gatttcctgg agattgcgcg tggtctggtt 900 gacagcaaac aaagctttct gtgggtggtt cgtccgggct tcgtgaaggg tagcacctgg 960 gttgagccgc tgccggatgg ttttctgggc gaacgtggtc gtatcgtgaa gtgggttccg 1020 caacaagaag tgctggcgca cggcgcgatt ggtgcgttct ggacccacag cggttggaac 1080 agcaccctgg agagcgtgtg cgaaggcgtt ccgatgatct ttagcgactt cggtctggat 1140 cagccgctga acgcgcgtta catgagcgat gttctgaaag tgggcgttta tctggagaac 1200 ggctgggagc gtggtgaaat cgcgaacgcg attcgtcgtg tgatggttga cgaggaaggt 1260 gagtacatcc gtcagaacgc gcgtgttctg aagcaaaaag cggatgttag cctgatgaag 1320 ggtggcagca gctacgagag cctggaaagc ctggttagct atattagcag cctg 1374 <210> 10 <211> 458 <212> PRT <213> Artificial Sequence <220> <223> Variant of UDP-glycosyltransferase 76G1 from Stevia <400> 10 Met Glu Asn Lys Thr Glu Thr Thr Val Arg Arg Arg Arg Arg Ile Ile 1 5 10 15 Leu Phe Pro Val Pro Phe Gln Gly His Ile Asn Pro Ile Leu Gln Leu 20 25 30 Ala Asn Val Leu Tyr Ser Lys Gly Phe Ser Ile Thr Ile Phe His Thr 35 40 45 Asn Phe Asn Lys Pro Lys Thr Ser Asn Tyr Pro His Phe Thr Phe Arg 50 55 60 Phe Ile Leu Asp Asn Asp Pro Gln Asp Glu Arg Ile Ser Asn Leu Pro 65 70 75 80 Thr His Gly Pro Leu Ala Gly Met Arg Ile Pro Ile Ile Asn Glu His 85 90 95 Gly Ala Asp Glu Leu Arg Arg Glu Leu Glu Leu Leu Met Leu Ala Ser 100 105 110 Glu Glu Asp Glu Glu Val Ser Cys Leu Ile Thr Asp Ala Leu Trp Tyr 115 120 125 Phe Ala Gln Ser Val Ala Asp Ser Leu Asn Leu Arg Arg Leu Val Leu 130 135 140 Met Thr Ser Ser Leu Phe Asn Phe His Ala His Val Ser Leu Pro Gln 145 150 155 160 Phe Asp Glu Leu Gly Tyr Leu Asp Pro Asp Asp Lys Thr Arg Leu Glu 165 170 175 Glu Gln Ala Ser Gly Phe Pro Met Leu Lys Val Lys Asp Ile Lys Ser 180 185 190 Ala Tyr Ser Asn Trp Gln Ile Leu Lys Glu Ile Leu Gly Lys Met Ile 195 200 205 Lys Gln Thr Arg Ala Ser Ser Gly Val Ile Trp Asn Ser Phe Lys Glu 210 215 220 Leu Glu Glu Ser Glu Leu Glu Thr Val Ile Arg Glu Ile Pro Ala Pro 225 230 235 240 Ser Phe Leu Ile Pro Leu Pro Lys His Leu Thr Ala Ser Ser Ser Ser 245 250 255 Leu Leu Asp His Asp Arg Thr Val Phe Gln Trp Leu Asp Gln Gln Pro 260 265 270 Pro Ser Ser Val Leu Tyr Val Ser Phe Gly Ser Thr Ser Glu Val Asp 275 280 285 Glu Lys Asp Phe Leu Glu Ile Ala Arg Gly Leu Val Asp Ser Lys Gln 290 295 300 Ser Phe Leu Trp Val Val Arg Pro Gly Phe Val Lys Gly Ser Thr Trp 305 310 315 320 Val Glu Pro Leu Pro Asp Gly Phe Leu Gly Glu Arg Gly Arg Ile Val 325 330 335 Lys Trp Val Pro Gln Gln Glu Val Leu Ala His Gly Ala Ile Gly Ala 340 345 350 Phe Trp Thr His Ser Gly Trp Asn Ser Thr Leu Glu Ser Val Cys Glu 355 360 365 Gly Val Pro Met Ile Phe Ser Asp Phe Gly Leu Asp Gln Pro Leu Asn 370 375 380 Ala Arg Tyr Met Ser Asp Val Leu Lys Val Gly Val Tyr Leu Glu Asn 385 390 395 400 Gly Trp Glu Arg Gly Glu Ile Ala Asn Ala Ile Arg Arg Val Met Val 405 410 415 Asp Glu Glu Gly Glu Tyr Ile Arg Gln Asn Ala Arg Val Leu Lys Gln 420 425 430 Lys Ala Asp Val Ser Leu Met Lys Gly Gly Ser Ser Tyr Glu Ser Leu 435 440 445 Glu Ser Leu Val Ser Tyr Ile Ser Ser Leu 450 455 <210> 11 <211> 1203 <212> DNA <213> Artificial Sequence <220> <223> Variant of macrolide glycosyltransferase from Streptomyces <400> 11 atgaccagtc gttcccatat tgccatgttt agtatcgcgg cccatggtca cgtgaacccg 60 tccctggaag tcattcgtga actggtggcg cgtggtcacc gtgttaccta tgccatcccg 120 ccggttttcg ccggtaaagt tgctgaagcg ggcgccgaag tgaaactgtg gaacagcacg 180 ctgccgtctc cggatgacga tccgcaggcg tggggtacca cgctgctgga taatgttgaa 240 ccgtttctgg cagacgctat tcaggctctg ccgcaactga tcgaagcgta tgaaggcgac 300 gaaccggatc tggtcctgca tgatatcacc tcatatccgg ctcgtgttct ggcccatcgc 360 tggggtgtcc cggccgtgtc actgtcgccg aatctggttg cctgggaagg ctacgaaaaa 420 gaagtcgctg aaccgatgtg ggcggaaccg aaacgtaccg aacgtggtcg cgcctattac 480 gcacgctttc atgcctggct ggaagaaaac ggtgttacgc tgcatccgga tgattttgtt 540 ggtcgtccgg cacgttgcct ggtgctgatt ccgaaagccc tgcagccgaa tgcagaccgt 600 gtggatgaag gtgtttatag ctttgtcggc gcctgtcaag gcgatcgcgg tgcagagggt 660 gaatggcgtc gcccggcggg tgcagaaaaa gttgccctgg tctctctggg cagctctttt 720 accaaacagc cggatttcta ccgtgaatgc gtgcgcgcct tcggtgaatt accgggctgg 780 catctggtcc tgcaaattgg tcgccatgtg gacccggccg atctgggtga tgtgccggaa 840 aacgtggaag ttcgctcatg ggttccgcag ctggctatcc tgaaagaagc ggacctgttt 900 gtgacgcatg caggtgctgg cggttcgcaa gaaggcctgg ccaccgcaac gccgatgatt 960 gcagtgccgc aggcagttga tcaattcggt aatgcagaca tgctgcaggg tctgggtgtt 1020 gcccgtcgcc tggataccga agaagcaacc gctgaagcgc tgcgtgcagc ggcgctggcg 1080 ctggttgatg atccggaagt tgctcgtcgc gcgcgcgata ttcaggcgca gatggcgggt 1140 gaaggcggta cccgtcgcgc agcagacctg atcgaagctg aactgccggt gcgtcaggca 1200 taa 1203 <210> 12 <211> 400 <212> PRT <213> Artificial Sequence <220> <223> Variant of macrolide glycosyltransferase from Streptomyces <400> 12 Met Thr Ser Arg Ser His Ile Ala Met Phe Ser Ile Ala Ala His Gly 1 5 10 15 His Val Asn Pro Ser Leu Glu Val Ile Arg Glu Leu Val Ala Arg Gly 20 25 30 His Arg Val Thr Tyr Ala Ile Pro Pro Val Phe Ala Gly Lys Val Ala 35 40 45 Glu Ala Gly Ala Glu Val Lys Leu Trp Asn Ser Thr Leu Pro Ser Pro 50 55 60 Asp Asp Asp Pro Gln Ala Trp Gly Thr Thr Leu Leu Asp Asn Val Glu 65 70 75 80 Pro Phe Leu Ala Asp Ala Ile Gln Ala Leu Pro Gln Leu Ile Glu Ala 85 90 95 Tyr Glu Gly Asp Glu Pro Asp Leu Val Leu His Asp Ile Thr Ser Tyr 100 105 110 Pro Ala Arg Val Leu Ala His Arg Trp Gly Val Pro Ala Val Ser Leu 115 120 125 Ser Pro Asn Leu Val Ala Trp Glu Gly Tyr Glu Lys Glu Val Ala Glu 130 135 140 Pro Met Trp Ala Glu Pro Lys Arg Thr Glu Arg Gly Arg Ala Tyr Tyr 145 150 155 160 Ala Arg Phe His Ala Trp Leu Glu Glu Asn Gly Val Thr Leu His Pro 165 170 175 Asp Asp Phe Val Gly Arg Pro Ala Arg Cys Leu Val Leu Ile Pro Lys 180 185 190 Ala Leu Gln Pro Asn Ala Asp Arg Val Asp Glu Gly Val Tyr Ser Phe 195 200 205 Val Gly Ala Cys Gln Gly Asp Arg Gly Ala Glu Gly Glu Trp Arg Arg 210 215 220 Pro Ala Gly Ala Glu Lys Val Ala Leu Val Ser Leu Gly Ser Ser Phe 225 230 235 240 Thr Lys Gln Pro Asp Phe Tyr Arg Glu Cys Val Arg Ala Phe Gly Glu 245 250 255 Leu Pro Gly Trp His Leu Val Leu Gln Ile Gly Arg His Val Asp Pro 260 265 270 Ala Asp Leu Gly Asp Val Pro Glu Asn Val Glu Val Arg Ser Trp Val 275 280 285 Pro Gln Leu Ala Ile Leu Lys Glu Ala Asp Leu Phe Val Thr His Ala 290 295 300 Gly Ala Gly Gly Ser Gln Glu Gly Leu Ala Thr Ala Thr Pro Met Ile 305 310 315 320 Ala Val Pro Gln Ala Val Asp Gln Phe Gly Asn Ala Asp Met Leu Gln 325 330 335 Gly Leu Gly Val Ala Arg Arg Leu Asp Thr Glu Glu Ala Thr Ala Glu 340 345 350 Ala Leu Arg Ala Ala Ala Leu Ala Leu Val Asp Asp Pro Glu Val Ala 355 360 365 Arg Arg Ala Arg Asp Ile Gln Ala Gln Met Ala Gly Glu Gly Gly Thr 370 375 380 Arg Arg Ala Ala Asp Leu Ile Glu Ala Glu Leu Pro Val Arg Gln Ala 385 390 395 400 <210> 13 <211> 2733 <212> DNA <213> Artificial Sequence <220> <223> Variant of laminaribiose phosphorylase from Paenibacillus <400> 13 atgggccaga agggttggaa atttcagggc gaacaaggcg agttccgtct ggaacaaccg 60 gagcacaaca gctacctgta ttttccgctg gtgaacgaag cgggtatgat gagcgcggtt 120 accccgaacc tgcacggcga gatcaccagc ggtcacaaca ccttcctgat ggaaccggtg 180 agcgcggaga gcctgcacaa cagcaaggcg agccgtaact tttgggtgtt cattgaaggt 240 tatggtgcgt ggagcgttag cggcaacagc gcgcgtcaga acgcggcgcg ttttaccggt 300 gaggaagagc gtagcgcggt ggaggcgggt ttcctgtggc acgcggttac ccgtgaaaac 360 gagaaggcgg gtctgaaagc gcgtaccgtg agcttcgtgc cggttaccga cgataagatc 420 gaactgatgc gtgttaccct gaccaacacc ggcaacgcgc cgctgaaact gaccccgacc 480 gcggcgattc cgctgtatgg tcgtagcgcg gacgatctgc gtgatcaccg tcacgtgacc 540 agcctgctgc accgtatctt taccagcgaa tacggcattg aggttcagcc ggcgctgagc 600 ttcgacgaac gtggtcaccg tgtgaacaag gttacctatg gcgtgtttgg tgcggaggcg 660 ggtggcaccg cgccggcggg cttctttccg gttaccgaag atttcattgg cgagggtggc 720 gcgctggact ggccggaagc ggtggttgcg aaccgtgagc cggatgcgca ggcgggcacc 780 gcggtggaag gttatgaggc ggttggcgcg ctgcgttttg cgccggtgga gctggcgccg 840 ggcaaaagcg tgagctatgt ggttgcgatg gttatcagcg gcgaccgtat tgatgttggt 900 cgttacgcgg cggattatct ggcggcgggt cgttttgacg cgctgctgga gcagaaccgt 960 gcgtactggc gtgacaagct ggataccgtg cgtttcagca gcggtgatgg cgagcaggac 1020 ctgtggatga aatgggttac cctgcaaccg attctgcgtc gtctgtatgg taacagcttc 1080 ctgccgtacc acgattatgg tcgtggtggc cgtggctggc gtgatctgtg gcaagactgc 1140 ctggcgctga tggtgatgga accggcggaa gtgcgtcacc tgctgctgaa caactacgcg 1200 ggtgtgcgta tggacggcag caacgcgacc atcattggtg cgggcccggg tgaatttgtg 1260 gcggatcgta acaacatccc gcgtgtttgg atggaccatg gtgcgtggcc gctgatgacc 1320 accctgctgt acctgcacca gagcggtgac ctggatctgc tgttccagcc gcaaagctat 1380 tttcgtgatg tgttcgttaa gcgttgccgt gagcgtgatg cgagctggac cccggagcag 1440 ggtaacaaac tgctgaccgc ggacggtcaa atttacgaag gcaccatcct ggagcacatt 1500 ctgctgcaaa acatcgtgcc gttctttaac gttggcgaac acggtaacat taaactggag 1560 ggcgcggact ggaacgatgg tctggacctg gcgccggaac gtggtgagag cgttgcgttt 1620 accgcgttct acgcgagcaa cctgatggaa ctgagcgagc tgctgctgga gctgcagaag 1680 cgtaccggca aagatagcct ggacatcgcg gaagagatgg cgctgctgct ggataccctg 1740 ggcaagccga tcagctatga cagcattcaa gaaaaacgta gcctgctgga tcgttactat 1800 gacgcggtga ccccgcgtgt tagcggcaag aaactgctgc tggatatccg taaggtggcg 1860 gaggatctga agcgtaaagc ggactgggcg gttgcgcacc tgcgtggtag cgaatggatt 1920 cagagcaaag agggctacgc gtggtttaac ggttactata acaacgacgg tgaacgtgtg 1980 gagggcgatc acccggacgg tgttcgtatg accctgaccg gtcaagtgtt cgcgatcatg 2040 ggtggcgttg cgaccgatga acagaccgag aagattagcc aagcggtgaa ccgttacctg 2100 aaagacgaac gtatcggcta tcgtctgaac agccgttttg gtggcattca gcaaaacctg 2160 ggtcgtgcgt tcggctttgc gttcggtcac aaggagaacg gtgcgatgtt cagccacatg 2220 accgtgatgt acgcgaacgc gctgtataaa cgtggctttg tgcaggaagg tttcgaggtt 2280 ctggatagca tctaccgtct gagcgcggac tttgaaaaca gccgtatcta cccgggcgtt 2340 ccggaatata ttaacgagcg tggccgtggc atgtacacct atctgaccgg tagcgcgagc 2400 tggctgctgc tgacccaact gaccgaagtg tatggcgtta agggtcgttt cggcgatctg 2460 cgtctggagc cgaaactggt gcaggcgcaa tttgacggca gcggtgaagc ggcggttgag 2520 accctgttcg cgggtcgtat gctgcgtgtg gtttatcgta acccgcaggc ggcggagcat 2580 ggtcaatatc gtgtggatag cgttagcctg aacggtcaga gcgttgattg ccaaaacgac 2640 ggcgcgggtt gcctgatcgg tcgtagcctg attgaagcgc tgccggcgga tggtgtgcat 2700 gagctgatcg ttaccctggg tcgtaacatt agc 2733 <210> 14 <211> 911 <212> PRT <213> Artificial Sequence <220> <223> Variant of laminaribiose phosphorylase from Paenibacillus <400> 14 Met Gly Gln Lys Gly Trp Lys Phe Gln Gly Glu Gln Gly Glu Phe Arg 1 5 10 15 Leu Glu Gln Pro Glu His Asn Ser Tyr Leu Tyr Phe Pro Leu Val Asn 20 25 30 Glu Ala Gly Met Met Ser Ala Val Thr Pro Asn Leu His Gly Glu Ile 35 40 45 Thr Ser Gly His Asn Thr Phe Leu Met Glu Pro Val Ser Ala Glu Ser 50 55 60 Leu His Asn Ser Lys Ala Ser Arg Asn Phe Trp Val Phe Ile Glu Gly 65 70 75 80 Tyr Gly Ala Trp Ser Val Ser Gly Asn Ser Ala Arg Gln Asn Ala Ala 85 90 95 Arg Phe Thr Gly Glu Glu Glu Arg Ser Ala Val Glu Ala Gly Phe Leu 100 105 110 Trp His Ala Val Thr Arg Glu Asn Glu Lys Ala Gly Leu Lys Ala Arg 115 120 125 Thr Val Ser Phe Val Pro Val Thr Asp Asp Lys Ile Glu Leu Met Arg 130 135 140 Val Thr Leu Thr Asn Thr Gly Asn Ala Pro Leu Lys Leu Thr Pro Thr 145 150 155 160 Ala Ala Ile Pro Leu Tyr Gly Arg Ser Ala Asp Asp Leu Arg Asp His 165 170 175 Arg His Val Thr Ser Leu Leu His Arg Ile Phe Thr Ser Glu Tyr Gly 180 185 190 Ile Glu Val Gln Pro Ala Leu Ser Phe Asp Glu Arg Gly His Arg Val 195 200 205 Asn Lys Val Thr Tyr Gly Val Phe Gly Ala Glu Ala Gly Gly Thr Ala 210 215 220 Pro Ala Gly Phe Phe Pro Val Thr Glu Asp Phe Ile Gly Glu Gly Gly 225 230 235 240 Ala Leu Asp Trp Pro Glu Ala Val Val Ala Asn Arg Glu Pro Asp Ala 245 250 255 Gln Ala Gly Thr Ala Val Glu Gly Tyr Glu Ala Val Gly Ala Leu Arg 260 265 270 Phe Ala Pro Val Glu Leu Ala Pro Gly Lys Ser Val Ser Tyr Val Val 275 280 285 Ala Met Val Ile Ser Gly Asp Arg Ile Asp Val Gly Arg Tyr Ala Ala 290 295 300 Asp Tyr Leu Ala Ala Gly Arg Phe Asp Ala Leu Leu Glu Gln Asn Arg 305 310 315 320 Ala Tyr Trp Arg Asp Lys Leu Asp Thr Val Arg Phe Ser Ser Gly Asp 325 330 335 Gly Glu Gln Asp Leu Trp Met Lys Trp Val Thr Leu Gln Pro Ile Leu 340 345 350 Arg Arg Leu Tyr Gly Asn Ser Phe Leu Pro Tyr His Asp Tyr Gly Arg 355 360 365 Gly Gly Arg Gly Trp Arg Asp Leu Trp Gln Asp Cys Leu Ala Leu Met 370 375 380 Val Met Glu Pro Ala Glu Val Arg His Leu Leu Leu Asn Asn Tyr Ala 385 390 395 400 Gly Val Arg Met Asp Gly Ser Asn Ala Thr Ile Ile Gly Ala Gly Pro 405 410 415 Gly Glu Phe Val Ala Asp Arg Asn Asn Ile Pro Arg Val Trp Met Asp 420 425 430 His Gly Ala Trp Pro Leu Met Thr Thr Leu Leu Tyr Leu His Gln Ser 435 440 445 Gly Asp Leu Asp Leu Leu Phe Gln Pro Gln Ser Tyr Phe Arg Asp Val 450 455 460 Phe Val Lys Arg Cys Arg Glu Arg Asp Ala Ser Trp Thr Pro Glu Gln 465 470 475 480 Gly Asn Lys Leu Leu Thr Ala Asp Gly Gln Ile Tyr Glu Gly Thr Ile 485 490 495 Leu Glu His Ile Leu Leu Gln Asn Ile Val Pro Phe Phe Asn Val Gly 500 505 510 Glu His Gly Asn Ile Lys Leu Glu Gly Ala Asp Trp Asn Asp Gly Leu 515 520 525 Asp Leu Ala Pro Glu Arg Gly Glu Ser Val Ala Phe Thr Ala Phe Tyr 530 535 540 Ala Ser Asn Leu Met Glu Leu Ser Glu Leu Leu Leu Glu Leu Gln Lys 545 550 555 560 Arg Thr Gly Lys Asp Ser Leu Asp Ile Ala Glu Glu Met Ala Leu Leu 565 570 575 Leu Asp Thr Leu Gly Lys Pro Ile Ser Tyr Asp Ser Ile Gln Glu Lys 580 585 590 Arg Ser Leu Leu Asp Arg Tyr Tyr Asp Ala Val Thr Pro Arg Val Ser 595 600 605 Gly Lys Lys Leu Leu Leu Asp Ile Arg Lys Val Ala Glu Asp Leu Lys 610 615 620 Arg Lys Ala Asp Trp Ala Val Ala His Leu Arg Gly Ser Glu Trp Ile 625 630 635 640 Gln Ser Lys Glu Gly Tyr Ala Trp Phe Asn Gly Tyr Tyr Asn Asn Asp 645 650 655 Gly Glu Arg Val Glu Gly Asp His Pro Asp Gly Val Arg Met Thr Leu 660 665 670 Thr Gly Gln Val Phe Ala Ile Met Gly Gly Val Ala Thr Asp Glu Gln 675 680 685 Thr Glu Lys Ile Ser Gln Ala Val Asn Arg Tyr Leu Lys Asp Glu Arg 690 695 700 Ile Gly Tyr Arg Leu Asn Ser Arg Phe Gly Gly Ile Gln Gln Asn Leu 705 710 715 720 Gly Arg Ala Phe Gly Phe Ala Phe Gly His Lys Glu Asn Gly Ala Met 725 730 735 Phe Ser His Met Thr Val Met Tyr Ala Asn Ala Leu Tyr Lys Arg Gly 740 745 750 Phe Val Gln Glu Gly Phe Glu Val Leu Asp Ser Ile Tyr Arg Leu Ser 755 760 765 Ala Asp Phe Glu Asn Ser Arg Ile Tyr Pro Gly Val Pro Glu Tyr Ile 770 775 780 Asn Glu Arg Gly Arg Gly Met Tyr Thr Tyr Leu Thr Gly Ser Ala Ser 785 790 795 800 Trp Leu Leu Leu Thr Gln Leu Thr Glu Val Tyr Gly Val Lys Gly Arg 805 810 815 Phe Gly Asp Leu Arg Leu Glu Pro Lys Leu Val Gln Ala Gln Phe Asp 820 825 830 Gly Ser Gly Glu Ala Ala Val Glu Thr Leu Phe Ala Gly Arg Met Leu 835 840 845 Arg Val Val Tyr Arg Asn Pro Gln Ala Ala Glu His Gly Gln Tyr Arg 850 855 860 Val Asp Ser Val Ser Leu Asn Gly Gln Ser Val Asp Cys Gln Asn Asp 865 870 875 880 Gly Ala Gly Cys Leu Ile Gly Arg Ser Leu Ile Glu Ala Leu Pro Ala 885 890 895 Asp Gly Val His Glu Leu Ile Val Thr Leu Gly Arg Asn Ile Ser 900 905 910 <210> 15 <211> 1476 <212> DNA <213> Artificial Sequence <220> <223> Sucrose phosphorylase from Leuconostoc <400> 15 atggaaatcc agaacaaagc gatgttcatt acctacgcgg atagcctggg taaaaacctg 60 aaggacgttc gtaaagtgct gaaagaggac atcggcgatg cgattggtgg cgttcacctg 120 ctgccgttct ttccgagcac cggtgatcgt ggcttcgcgc cgagcgacta cacccgtgtt 180 gatagcgcgt ttggtgactg gagcgatgtg gaagcgctgg gcgaggaata ctatctgatg 240 ttcgacttta tgatcaacca cattagccgt gaaagcgtta tgtaccagga cttcaagaaa 300 aaccacgatg agagcaagta taaagacttc tttatccgtt gggagaaatt ttgggcgaaa 360 gcgggtgaaa accgtccgac ccaggcggac gtggatctga tctacaagcg taaagataag 420 gcgccgaccc aagagattac cttcgacgat ggtaccaccg aaaacctgtg gaacaccttt 480 ggcgacgagc aaatcgacat tgatgttaac agcgcgatcg cgaaagagtt cattaagacc 540 accctggaag atatggtgaa acacggtgcg aacctgatcc gtctggacgc gtttgcgtac 600 gcggttaaga aagtggacac caacgatttc tttgttgagc cggaaatctg ggacaccctg 660 aacgaagtgc gtgaaattct gaccccgctg aaggcggaga tcctgccgga gattcacgaa 720 cactatagca tcccgaagaa aattaacgat cacggttact tcacctatga ctttgcgctg 780 ccgatgacca ccctgtacac cctgtatagc ggcaaaacca accagctggc gaaatggctg 840 aagatgagcc cgatgaagca attcaccacc ctggacaccc acgatggtat cggcgtggtt 900 gacgcgcgtg atgtgctgac cgacgaggaa attgattacg cgagcgagga actgtataag 960 gttggcgcga acgtgaagaa aacctacagc agcgcgagct ataacgacct ggatatctac 1020 caaattaaca gcacctacta tagcgcgctg ggtaacgacg atgcggcgta tctgctgagc 1080 cgtatcttcc aggtttttgc gccgggcatc ccgcaaattt actatgtggg tctgctggcg 1140 ggcgaaagcg atatcgagct gctggaaagc agcaaagagg gtcgtaacat taaccgtcac 1200 tactatagcg ttgacgaagt gaaagaggaa gttaagcgtc cggtggttgc gaaactgctg 1260 aagctgctga gctggcgtaa caacttcgcg gcgtttgacc tggatggtag cattgatgtg 1320 gaaaccccga gcgacaccac catcaagatt acccgtaaag ataagagcgg cgagaacgtg 1380 gcggttctgg tggcgaacgc ggcggacaaa acctttacca tcaccgcgaa cggcgaggaa 1440 attctggcga acaccgaggc ggacaagcag caactg 1476 <210> 16 <211> 492 <212> PRT <213> Artificial Sequence <220> <223> Sucrose phosphorylase from Leuconostoc <400> 16 Met Glu Ile Gln Asn Lys Ala Met Phe Ile Thr Tyr Ala Asp Ser Leu 1 5 10 15 Gly Lys Asn Leu Lys Asp Val Arg Lys Val Leu Lys Glu Asp Ile Gly 20 25 30 Asp Ala Ile Gly Gly Val His Leu Leu Pro Phe Phe Pro Ser Thr Gly 35 40 45 Asp Arg Gly Phe Ala Pro Ser Asp Tyr Thr Arg Val Asp Ser Ala Phe 50 55 60 Gly Asp Trp Ser Asp Val Glu Ala Leu Gly Glu Glu Tyr Tyr Leu Met 65 70 75 80 Phe Asp Phe Met Ile Asn His Ile Ser Arg Glu Ser Val Met Tyr Gln 85 90 95 Asp Phe Lys Lys Asn His Asp Glu Ser Lys Tyr Lys Asp Phe Phe Ile 100 105 110 Arg Trp Glu Lys Phe Trp Ala Lys Ala Gly Glu Asn Arg Pro Thr Gln 115 120 125 Ala Asp Val Asp Leu Ile Tyr Lys Arg Lys Asp Lys Ala Pro Thr Gln 130 135 140 Glu Ile Thr Phe Asp Asp Gly Thr Thr Glu Asn Leu Trp Asn Thr Phe 145 150 155 160 Gly Asp Glu Gln Ile Asp Ile Asp Val Asn Ser Ala Ile Ala Lys Glu 165 170 175 Phe Ile Lys Thr Thr Leu Glu Asp Met Val Lys His Gly Ala Asn Leu 180 185 190 Ile Arg Leu Asp Ala Phe Ala Tyr Ala Val Lys Lys Val Asp Thr Asn 195 200 205 Asp Phe Phe Val Glu Pro Glu Ile Trp Asp Thr Leu Asn Glu Val Arg 210 215 220 Glu Ile Leu Thr Pro Leu Lys Ala Glu Ile Leu Pro Glu Ile His Glu 225 230 235 240 His Tyr Ser Ile Pro Lys Lys Ile Asn Asp His Gly Tyr Phe Thr Tyr 245 250 255 Asp Phe Ala Leu Pro Met Thr Thr Leu Tyr Thr Leu Tyr Ser Gly Lys 260 265 270 Thr Asn Gln Leu Ala Lys Trp Leu Lys Met Ser Pro Met Lys Gln Phe 275 280 285 Thr Thr Leu Asp Thr His Asp Gly Ile Gly Val Val Asp Ala Arg Asp 290 295 300 Val Leu Thr Asp Glu Glu Ile Asp Tyr Ala Ser Glu Glu Leu Tyr Lys 305 310 315 320 Val Gly Ala Asn Val Lys Lys Thr Tyr Ser Ser Ala Ser Tyr Asn Asp 325 330 335 Leu Asp Ile Tyr Gln Ile Asn Ser Thr Tyr Tyr Ser Ala Leu Gly Asn 340 345 350 Asp Asp Ala Ala Tyr Leu Leu Ser Arg Ile Phe Gln Val Phe Ala Pro 355 360 365 Gly Ile Pro Gln Ile Tyr Tyr Val Gly Leu Leu Ala Gly Glu Ser Asp 370 375 380 Ile Glu Leu Leu Glu Ser Ser Lys Glu Gly Arg Asn Ile Asn Arg His 385 390 395 400 Tyr Tyr Ser Val Asp Glu Val Lys Glu Glu Val Lys Arg Pro Val Val 405 410 415 Ala Lys Leu Leu Lys Leu Leu Ser Trp Arg Asn Asn Phe Ala Ala Phe 420 425 430 Asp Leu Asp Gly Ser Ile Asp Val Glu Thr Pro Ser Asp Thr Thr Ile 435 440 445 Lys Ile Thr Arg Lys Asp Lys Ser Gly Glu Asn Val Ala Val Leu Val 450 455 460 Ala Asn Ala Ala Asp Lys Thr Phe Thr Ile Thr Ala Asn Gly Glu Glu 465 470 475 480 Ile Leu Ala Asn Thr Glu Ala Asp Lys Gln Gln Leu 485 490 <210> 17 <211> 1512 <212> DNA <213> Artificial Sequence <220> <223> Sucrose phosphorylase from Bifidobacterium <400> 17 atgaagaaca aagttcaact gatcacctac gcggaccgtc tgggtgatgg caccatcaag 60 agcatgaccg atattctgcg tacccgtttc gacggtgttt atgatggcgt gcacatcctg 120 ccgttcttta ccccgttcga cggtgcggat gcgggctttg acccgattga tcacaccaag 180 gttgacgagc gtctgggtag ctgggacgat gtggcggaac tgagcaaaac ccacaacatc 240 atggttgatg cgattgtgaa ccacatgagc tgggagagca agcagtttca agacgttctg 300 gcgaaaggcg aggaaagcga atactatccg atgttcctga ccatgagcag cgtgtttccg 360 aacggtgcga ccgaggaaga cctggcgggt atctatcgtc cgcgtccggg tctgccgttc 420 acccactata agtttgcggg taaaacccgt ctggtgtggg ttagcttcac cccgcagcaa 480 gttgatattg acaccgatag cgacaagggc tgggagtacc tgatgagcat ctttgatcaa 540 atggcggcga gccacgttag ctacattcgt ctggacgcgg tgggttatgg cgcgaaagaa 600 gcgggtacca gctgcttcat gaccccgaag acctttaaac tgatcagccg tctgcgtgag 660 gaaggtgtga agcgtggcct ggagatcctg attgaagttc acagctacta taagaaacag 720 gtggagattg cgagcaaagt ggaccgtgtt tatgattttg cgctgccgcc gctgctgctg 780 catgcgctga gcaccggtca tgtggaaccg gttgcgcact ggaccgatat ccgtccgaac 840 aacgcggtga ccgttctgga cacccacgat ggtattggcg ttatcgacat tggtagcgac 900 caactggatc gtagcctgaa gggtctggtg ccggatgagg acgttgataa cctggtgaac 960 accatccacg cgaacaccca cggtgaaagc caagcggcga ccggcgcggc ggcgagcaac 1020 ctggatctgt accaagttaa cagcacctac tatagcgcgc tgggttgcaa cgaccagcac 1080 tatattgcgg cgcgtgcggt gcagttcttt ctgccgggcg tgccgcaagt ttactatgtg 1140 ggtgcgctgg cgggcaagaa cgacatggag ctgctgcgta aaaccaacaa cggtcgtgat 1200 atcaaccgtc actactatag caccgcggag attgacgaaa acctgaagcg tccggtggtt 1260 aaagcgctga acgcgctggc gaagttccgt aacgaactgg acgcgttcga tggtaccttt 1320 agctacacca ccgacgatga caccagcatc agcttcacct ggcgtggcga gaccagccag 1380 gcgaccctga cctttgaacc gaaacgtggt ctgggcgttg acaacaccac cccggtggcg 1440 atgctggagt gggaagacag cgcgggtgat caccgtagcg atgacctgat tgcgaacccg 1500 ccggtggttg cg 1512 <210> 18 <211> 504 <212> PRT <213> Artificial Sequence <220> <223> Sucrose phosphorylase from Bifidobacterium <400> 18 Met Lys Asn Lys Val Gln Leu Ile Thr Tyr Ala Asp Arg Leu Gly Asp 1 5 10 15 Gly Thr Ile Lys Ser Met Thr Asp Ile Leu Arg Thr Arg Phe Asp Gly 20 25 30 Val Tyr Asp Gly Val His Ile Leu Pro Phe Phe Thr Pro Phe Asp Gly 35 40 45 Ala Asp Ala Gly Phe Asp Pro Ile Asp His Thr Lys Val Asp Glu Arg 50 55 60 Leu Gly Ser Trp Asp Asp Val Ala Glu Leu Ser Lys Thr His Asn Ile 65 70 75 80 Met Val Asp Ala Ile Val Asn His Met Ser Trp Glu Ser Lys Gln Phe 85 90 95 Gln Asp Val Leu Ala Lys Gly Glu Glu Ser Glu Tyr Tyr Pro Met Phe 100 105 110 Leu Thr Met Ser Ser Val Phe Pro Asn Gly Ala Thr Glu Glu Asp Leu 115 120 125 Ala Gly Ile Tyr Arg Pro Arg Pro Gly Leu Pro Phe Thr His Tyr Lys 130 135 140 Phe Ala Gly Lys Thr Arg Leu Val Trp Val Ser Phe Thr Pro Gln Gln 145 150 155 160 Val Asp Ile Asp Thr Asp Ser Asp Lys Gly Trp Glu Tyr Leu Met Ser 165 170 175 Ile Phe Asp Gln Met Ala Ala Ser His Val Ser Tyr Ile Arg Leu Asp 180 185 190 Ala Val Gly Tyr Gly Ala Lys Glu Ala Gly Thr Ser Cys Phe Met Thr 195 200 205 Pro Lys Thr Phe Lys Leu Ile Ser Arg Leu Arg Glu Glu Gly Val Lys 210 215 220 Arg Gly Leu Glu Ile Leu Ile Glu Val His Ser Tyr Tyr Lys Lys Gln 225 230 235 240 Val Glu Ile Ala Ser Lys Val Asp Arg Val Tyr Asp Phe Ala Leu Pro 245 250 255 Pro Leu Leu Leu His Ala Leu Ser Thr Gly His Val Glu Pro Val Ala 260 265 270 His Trp Thr Asp Ile Arg Pro Asn Asn Ala Val Thr Val Leu Asp Thr 275 280 285 His Asp Gly Ile Gly Val Ile Asp Ile Gly Ser Asp Gln Leu Asp Arg 290 295 300 Ser Leu Lys Gly Leu Val Pro Asp Glu Asp Val Asp Asn Leu Val Asn 305 310 315 320 Thr Ile His Ala Asn Thr His Gly Glu Ser Gln Ala Ala Thr Gly Ala 325 330 335 Ala Ala Ser Asn Leu Asp Leu Tyr Gln Val Asn Ser Thr Tyr Tyr Ser 340 345 350 Ala Leu Gly Cys Asn Asp Gln His Tyr Ile Ala Ala Arg Ala Val Gln 355 360 365 Phe Phe Leu Pro Gly Val Pro Gln Val Tyr Tyr Val Gly Ala Leu Ala 370 375 380 Gly Lys Asn Asp Met Glu Leu Leu Arg Lys Thr Asn Asn Gly Arg Asp 385 390 395 400 Ile Asn Arg His Tyr Tyr Ser Thr Ala Glu Ile Asp Glu Asn Leu Lys 405 410 415 Arg Pro Val Val Lys Ala Leu Asn Ala Leu Ala Lys Phe Arg Asn Glu 420 425 430 Leu Asp Ala Phe Asp Gly Thr Phe Ser Tyr Thr Thr Asp Asp Asp Thr 435 440 445 Ser Ile Ser Phe Thr Trp Arg Gly Glu Thr Ser Gln Ala Thr Leu Thr 450 455 460 Phe Glu Pro Lys Arg Gly Leu Gly Val Asp Asn Thr Thr Pro Val Ala 465 470 475 480 Met Leu Glu Trp Glu Asp Ser Ala Gly Asp His Arg Ser Asp Asp Leu 485 490 495 Ile Ala Asn Pro Pro Val Val Ala 500 <210> 19 <211> 1479 <212> DNA <213> Artificial Sequence <220> <223> Sucrose phosphorylase from uncultured bacterium <400> 19 atgaagaaca aagtgcagct gattgcgtac gttgaccgta tcagcggtgg cggtttccgt 60 aagctgcatg cgctgctgac cggtccgctg gcggagattt ttggcggtgc gcacctgctg 120 ccgttcttta ccccgattga tggtgcggat gcgggttttg atccgagcga tcacacccaa 180 gtggacccgc gtctgggtac ctgggacgat gttcgtatcc tgggcggtgc gattgaactg 240 gtggcggatc tgattgtgaa ccacgttagc agcagcagcc cgcaatttat cgactacagc 300 aagaaaggca gcgatagcct gtacgcgggc atgttcctga cctatgaccg tgtttttccg 360 gagggtgcgc gtgaagcgga tatcctgcgt atttatcgtc cgcgtccgac cctgccgttt 420 agcccggtga ccctgagcag ccgtgagcgt aaactgctgt ggaccacctt taacccggaa 480 caggtggaca ttgatgttcg tcacccggag gcggaagcgt acctgcacag catcctgaag 540 aaattccaag cggcgggcat ccgtatgatt cgtctggacg cggttggcta tgcgatcaag 600 aaaccgggtg cgagctgctt tatgattccg gagaccttcg attttatcgc ggagctgacc 660 gaaaaggcgc gtgcgctggg tattgaggtg ctggttgaaa tccacagcca ctaccgtaaa 720 cagatcgaaa ttgcgcgtca agtggactgg gtttatgatt ttgcgctgcc gccgctggtg 780 ctgcatgcgc tgtttgcgag cgacccgcac ccgctggcgc agtggctgag catcagcccg 840 cgtaacgcgg tgaccgttct ggacacccac gatggcatcg gtgtgattga tgttggtgcg 900 gatgcggaag gtaacccggg tctgctgagc ccggcggcga ttgacagcct ggttgagacc 960 atccacagcc gtagccaagg tcaaagccgt gaagcgaccg gtgcggcggc gaacaacctg 1020 gatctgtacc aagtgaactg caccttcctg gatgcgctgg gcggtcgtga accggattat 1080 ctgattgcgc gtgcgctgca gttctttgcg ccgggcatcc cgcaagtgta ctatgttggt 1140 ctgctgggcg gtaccaacga catggatctg ctgggtcgta gcggtgtggg tcgtgacatt 1200 aaccgtcact actataccga cgcggagatt gatgcggcgc tggcgcgtcc gctggtgcgt 1260 accctgatcg cgctgattcg tctgcgtaac acccacccgg cgttcgcggg tgaatttgat 1320 gtgagcgttc cggcggcgac ccagattcgt ctgcgttggc agcgtcaaga gcactggatc 1380 gaactgcacg ttgacctgag catcccgaag gcgagcatta ccggcaccgg tatccacccg 1440 atcaccattc cgggtgcggc ggatgcgggt gcgccgagc 1479 <210> 20 <211> 493 <212> PRT <213> Artificial Sequence <220> <223> Sucrose phosphorylase from uncultured bacterium <400> 20 Met Lys Asn Lys Val Gln Leu Ile Ala Tyr Val Asp Arg Ile Ser Gly 1 5 10 15 Gly Gly Phe Arg Lys Leu His Ala Leu Leu Thr Gly Pro Leu Ala Glu 20 25 30 Ile Phe Gly Gly Ala His Leu Leu Pro Phe Phe Thr Pro Ile Asp Gly 35 40 45 Ala Asp Ala Gly Phe Asp Pro Ser Asp His Thr Gln Val Asp Pro Arg 50 55 60 Leu Gly Thr Trp Asp Asp Val Arg Ile Leu Gly Gly Ala Ile Glu Leu 65 70 75 80 Val Ala Asp Leu Ile Val Asn His Val Ser Ser Ser Ser Pro Gln Phe 85 90 95 Ile Asp Tyr Ser Lys Lys Gly Ser Asp Ser Leu Tyr Ala Gly Met Phe 100 105 110 Leu Thr Tyr Asp Arg Val Phe Pro Glu Gly Ala Arg Glu Ala Asp Ile 115 120 125 Leu Arg Ile Tyr Arg Pro Arg Pro Thr Leu Pro Phe Ser Pro Val Thr 130 135 140 Leu Ser Ser Arg Glu Arg Lys Leu Leu Trp Thr Thr Phe Asn Pro Glu 145 150 155 160 Gln Val Asp Ile Asp Val Arg His Pro Glu Ala Glu Ala Tyr Leu His 165 170 175 Ser Ile Leu Lys Lys Phe Gln Ala Ala Gly Ile Arg Met Ile Arg Leu 180 185 190 Asp Ala Val Gly Tyr Ala Ile Lys Lys Pro Gly Ala Ser Cys Phe Met 195 200 205 Ile Pro Glu Thr Phe Asp Phe Ile Ala Glu Leu Thr Glu Lys Ala Arg 210 215 220 Ala Leu Gly Ile Glu Val Leu Val Glu Ile His Ser His Tyr Arg Lys 225 230 235 240 Gln Ile Glu Ile Ala Arg Gln Val Asp Trp Val Tyr Asp Phe Ala Leu 245 250 255 Pro Pro Leu Val Leu His Ala Leu Phe Ala Ser Asp Pro His Pro Leu 260 265 270 Ala Gln Trp Leu Ser Ile Ser Pro Arg Asn Ala Val Thr Val Leu Asp 275 280 285 Thr His Asp Gly Ile Gly Val Ile Asp Val Gly Ala Asp Ala Glu Gly 290 295 300 Asn Pro Gly Leu Leu Ser Pro Ala Ala Ile Asp Ser Leu Val Glu Thr 305 310 315 320 Ile His Ser Arg Ser Gln Gly Gln Ser Arg Glu Ala Thr Gly Ala Ala 325 330 335 Ala Asn Asn Leu Asp Leu Tyr Gln Val Asn Cys Thr Phe Leu Asp Ala 340 345 350 Leu Gly Gly Arg Glu Pro Asp Tyr Leu Ile Ala Arg Ala Leu Gln Phe 355 360 365 Phe Ala Pro Gly Ile Pro Gln Val Tyr Tyr Val Gly Leu Leu Gly Gly 370 375 380 Thr Asn Asp Met Asp Leu Leu Gly Arg Ser Gly Val Gly Arg Asp Ile 385 390 395 400 Asn Arg His Tyr Tyr Thr Asp Ala Glu Ile Asp Ala Ala Leu Ala Arg 405 410 415 Pro Leu Val Arg Thr Leu Ile Ala Leu Ile Arg Leu Arg Asn Thr His 420 425 430 Pro Ala Phe Ala Gly Glu Phe Asp Val Ser Val Pro Ala Ala Thr Gln 435 440 445 Ile Arg Leu Arg Trp Gln Arg Gln Glu His Trp Ile Glu Leu His Val 450 455 460 Asp Leu Ser Ile Pro Lys Ala Ser Ile Thr Gly Thr Gly Ile His Pro 465 470 475 480 Ile Thr Ile Pro Gly Ala Ala Asp Ala Gly Ala Pro Ser 485 490 <210> 21 <211> 1467 <212> DNA <213> Artificial Sequence <220> <223> Sucrose phosphorylase from Oenococcus <400> 21 atgccggtga agaacaaagc gatgctgatc acctacagcg atagcatggg taaaaacatc 60 aaggaactgc agtacattct ggacaaatat atcggcgatg cgattggtgg cgttcacctg 120 ctgccgttct ttccgagcac cggtgatcgt ggcttcgcgc cgagcgacta tacccgtgtg 180 aacccggact ttggtgattg ggaggacgtt gaggaactgg gcaagaaata ctatctgatg 240 ttcgacttta tgatcaacca cattagccgt gaaagcatta tgtaccagga cttcaaagag 300 aagaaagatg cgagcagcta taaggacttc tttatccgtt gggaaaaatt ttggccgaag 360 ggtcgtccga ccaaggcgga catcgatctg atttacaagc gtaaagataa ggcgccgatc 420 cagggtatta ccttcgcgga cggcagccaa gaacacctgt ggaacacctt tggtgacgag 480 caaatcgata ttaacgtgaa aagcaaggtt gcgcaggagt tctttaaaga taccctgcaa 540 agcatggtga agcacggcgc ggacctgatt cgtctggatg cgttcgcgta cgcgatcaag 600 aaaattgata ccaacgactt ctttatcgaa ccggagattt gggatctgct ggaaagcgtt 660 cgtaaaattc tggacccgct gcatgcggag atcctgccgg aaatttacga gcactatacc 720 atcccggcga agattaacga atacggttat ttcacctacg actttgtgct gccgctggtt 780 atcctgtaca ccctgtatag cggcaacccg aaacagctgg cgaaatggct gaagatgagc 840 ccgaagaaac aattcaccac cctggatacc cacgacggta tcggcgtggt tgatgcgcgt 900 gacatcctga ccgacgagga aattgattac accagcagcg agctgtataa agtgggtgcg 960 aacgttaagc gtacctacag cagcgcggcg tataacaacc tggacatcta ccagattaac 1020 agcacctact atagcgcgct gggtaacgac gataaagcgt atctgctggc gcgtgcgatc 1080 cagatttttg cgccgggcat cccgcaaatt tactatgcgg gtctgctggc gggcgaaaac 1140 gacctggatc tgctggaaaa aaccaaagag ggtcgtaaca ttaaccgtca ctactatagc 1200 gaggaagagg tggcgaacga ggttcaacgt ccgatcgttg cgtgcctgct gaagctgctg 1260 gcgtggcgta accgtagcgc ggcgttcgac ctgcagggtg atattcaagt tagcgcgacc 1320 gataaaaacg aaatcaagat cattcgtacc agcaccaacg gtcaagacac cgcggagctg 1380 accgcgaacg tggcgctgaa aacctttacc atcaaagaaa acgacaagat cattctgatt 1440 gaggatcaaa ccgacaccaa ggatatc 1467 <210> 22 <211> 489 <212> PRT <213> Artificial Sequence <220> <223> Sucrose phosphorylase from Oenococcus <400> 22 Met Pro Val Lys Asn Lys Ala Met Leu Ile Thr Tyr Ser Asp Ser Met 1 5 10 15 Gly Lys Asn Ile Lys Glu Leu Gln Tyr Ile Leu Asp Lys Tyr Ile Gly 20 25 30 Asp Ala Ile Gly Gly Val His Leu Leu Pro Phe Phe Pro Ser Thr Gly 35 40 45 Asp Arg Gly Phe Ala Pro Ser Asp Tyr Thr Arg Val Asn Pro Asp Phe 50 55 60 Gly Asp Trp Glu Asp Val Glu Glu Leu Gly Lys Lys Tyr Tyr Leu Met 65 70 75 80 Phe Asp Phe Met Ile Asn His Ile Ser Arg Glu Ser Ile Met Tyr Gln 85 90 95 Asp Phe Lys Glu Lys Lys Asp Ala Ser Ser Tyr Lys Asp Phe Phe Ile 100 105 110 Arg Trp Glu Lys Phe Trp Pro Lys Gly Arg Pro Thr Lys Ala Asp Ile 115 120 125 Asp Leu Ile Tyr Lys Arg Lys Asp Lys Ala Pro Ile Gln Gly Ile Thr 130 135 140 Phe Ala Asp Gly Ser Gln Glu His Leu Trp Asn Thr Phe Gly Asp Glu 145 150 155 160 Gln Ile Asp Ile Asn Val Lys Ser Lys Val Ala Gln Glu Phe Phe Lys 165 170 175 Asp Thr Leu Gln Ser Met Val Lys His Gly Ala Asp Leu Ile Arg Leu 180 185 190 Asp Ala Phe Ala Tyr Ala Ile Lys Lys Ile Asp Thr Asn Asp Phe Phe 195 200 205 Ile Glu Pro Glu Ile Trp Asp Leu Leu Glu Ser Val Arg Lys Ile Leu 210 215 220 Asp Pro Leu His Ala Glu Ile Leu Pro Glu Ile Tyr Glu His Tyr Thr 225 230 235 240 Ile Pro Ala Lys Ile Asn Glu Tyr Gly Tyr Phe Thr Tyr Asp Phe Val 245 250 255 Leu Pro Leu Val Ile Leu Tyr Thr Leu Tyr Ser Gly Asn Pro Lys Gln 260 265 270 Leu Ala Lys Trp Leu Lys Met Ser Pro Lys Lys Gln Phe Thr Thr Leu 275 280 285 Asp Thr His Asp Gly Ile Gly Val Val Asp Ala Arg Asp Ile Leu Thr 290 295 300 Asp Glu Glu Ile Asp Tyr Thr Ser Ser Glu Leu Tyr Lys Val Gly Ala 305 310 315 320 Asn Val Lys Arg Thr Tyr Ser Ser Ala Ala Tyr Asn Asn Leu Asp Ile 325 330 335 Tyr Gln Ile Asn Ser Thr Tyr Tyr Ser Ala Leu Gly Asn Asp Asp Lys 340 345 350 Ala Tyr Leu Leu Ala Arg Ala Ile Gln Ile Phe Ala Pro Gly Ile Pro 355 360 365 Gln Ile Tyr Tyr Ala Gly Leu Leu Ala Gly Glu Asn Asp Leu Asp Leu 370 375 380 Leu Glu Lys Thr Lys Glu Gly Arg Asn Ile Asn Arg His Tyr Tyr Ser 385 390 395 400 Glu Glu Glu Val Ala Asn Glu Val Gln Arg Pro Ile Val Ala Cys Leu 405 410 415 Leu Lys Leu Leu Ala Trp Arg Asn Arg Ser Ala Ala Phe Asp Leu Gln 420 425 430 Gly Asp Ile Gln Val Ser Ala Thr Asp Lys Asn Glu Ile Lys Ile Ile 435 440 445 Arg Thr Ser Thr Asn Gly Gln Asp Thr Ala Glu Leu Thr Ala Asn Val 450 455 460 Ala Leu Lys Thr Phe Thr Ile Lys Glu Asn Asp Lys Ile Ile Leu Ile 465 470 475 480 Glu Asp Gln Thr Asp Thr Lys Asp Ile 485 <210> 23 <211> 1446 <212> DNA <213> Artificial Sequence <220> <223> Sucrose phosphorylase from Enterococcus <400> 23 atgaagatta aaaacgaggc gatgctgatc acctactgcg acagcctggg taacaacctg 60 aaagacctga accaggtgct ggatcagcac ctgcaaggcg tggttggtgg catccacctg 120 ctgccgttct ttccgagcac cggtgatcgt ggcttcgcgc cgagcgacta taccgtggtt 180 gatagcgcgt ttggtacctg gcaagaggtt gaagcgctgg gcgagaagta ctacctgatg 240 ttcgacttca tgatcaacca catcagccgt gaaagcaaat tctttcagga tttcaagcaa 300 aaccacgagg cgagcccgta caaggaaatg tttattcgta tccacgagtt ctttccggaa 360 aaccgtccga ccccggagga cattgatctg atctataagc gtaaagacaa ggcgccgttc 420 caggaagtga cctttgcgga tggtaccacc gaacaggttt ggaacacctt cggcgaggaa 480 caaattgacc tggatgtgaa caaagaagtt accaagcaat tcatcaagga caccctgaag 540 gatatggcga gccacggttg cagcctgatt cgtctggacg cgttcgcgta cgcgatcaag 600 aaactggaca ccaacgattt ctttgtggag ccggaaattt gggacctgct ggatgaggtt 660 cgtgaggaag cggcgaaata caactgcgaa ctgctgccgg agatccacga acactatacc 720 attcagatga agatcgcgga ccacgattac tatgtgtacg acttcgcgct gccgatgatc 780 accctgtaca gcctgtatag cggtaaaacc aaccgtctgg cgaactggct gaaaatgagc 840 ccgatgaagc aatttaccac cctggacacc cacgatggta ttggcgtggt tgacgcgaaa 900 gatctgctga ccgacgagga actggattac accagcgagg aactgtataa agtgggcgcg 960 aacgttaaga aaatctacag cagcgcgagc tataacaacc tggacattta ccagatcaac 1020 agcacctact atagcgcgct gggtgacaac gatcgtagct atctgctggc gcgtgcgatt 1080 cagtgctttg cgccgggcat tccgcaaatc tactatgtgg gtctgctggc gggcaaaaac 1140 gacctggagc tgctggaaag caccaaagag ggtcgtaaca ttaaccgtca ctactatagc 1200 ctgaccgaaa tcgatgagga agttaaccgt ccggtggtta aggcgctgtt cgacctgctg 1260 cgttttcgta accgtgcggc ggcgtttgat ctggcgggcg agatcaccgt ggaaaccccg 1320 agcgaggaaa ccatcattat cacccgtaaa gacgcgaacg gtgatcgtgc ggttctgacc 1380 gcgaacctgc agaccaagga ctttaccgtg acccacaacg gcgaactggt tctgcagcaa 1440 ctggat 1446 <210> 24 <211> 482 <212> PRT <213> Artificial Sequence <220> <223> Sucrose phosphorylase from Enterococcus <400> 24 Met Lys Ile Lys Asn Glu Ala Met Leu Ile Thr Tyr Cys Asp Ser Leu 1 5 10 15 Gly Asn Asn Leu Lys Asp Leu Asn Gln Val Leu Asp Gln His Leu Gln 20 25 30 Gly Val Val Gly Gly Ile His Leu Leu Pro Phe Phe Pro Ser Thr Gly 35 40 45 Asp Arg Gly Phe Ala Pro Ser Asp Tyr Thr Val Val Asp Ser Ala Phe 50 55 60 Gly Thr Trp Gln Glu Val Glu Ala Leu Gly Glu Lys Tyr Tyr Leu Met 65 70 75 80 Phe Asp Phe Met Ile Asn His Ile Ser Arg Glu Ser Lys Phe Phe Gln 85 90 95 Asp Phe Lys Gln Asn His Glu Ala Ser Pro Tyr Lys Glu Met Phe Ile 100 105 110 Arg Ile His Glu Phe Phe Pro Glu Asn Arg Pro Thr Pro Glu Asp Ile 115 120 125 Asp Leu Ile Tyr Lys Arg Lys Asp Lys Ala Pro Phe Gln Glu Val Thr 130 135 140 Phe Ala Asp Gly Thr Thr Glu Gln Val Trp Asn Thr Phe Gly Glu Glu 145 150 155 160 Gln Ile Asp Leu Asp Val Asn Lys Glu Val Thr Lys Gln Phe Ile Lys 165 170 175 Asp Thr Leu Lys Asp Met Ala Ser His Gly Cys Ser Leu Ile Arg Leu 180 185 190 Asp Ala Phe Ala Tyr Ala Ile Lys Lys Leu Asp Thr Asn Asp Phe Phe 195 200 205 Val Glu Pro Glu Ile Trp Asp Leu Leu Asp Glu Val Arg Glu Glu Ala 210 215 220 Ala Lys Tyr Asn Cys Glu Leu Leu Pro Glu Ile His Glu His Tyr Thr 225 230 235 240 Ile Gln Met Lys Ile Ala Asp His Asp Tyr Tyr Val Tyr Asp Phe Ala 245 250 255 Leu Pro Met Ile Thr Leu Tyr Ser Leu Tyr Ser Gly Lys Thr Asn Arg 260 265 270 Leu Ala Asn Trp Leu Lys Met Ser Pro Met Lys Gln Phe Thr Thr Leu 275 280 285 Asp Thr His Asp Gly Ile Gly Val Val Asp Ala Lys Asp Leu Leu Thr 290 295 300 Asp Glu Glu Leu Asp Tyr Thr Ser Glu Glu Leu Tyr Lys Val Gly Ala 305 310 315 320 Asn Val Lys Lys Ile Tyr Ser Ser Ala Ser Tyr Asn Asn Leu Asp Ile 325 330 335 Tyr Gln Ile Asn Ser Thr Tyr Tyr Ser Ala Leu Gly Asp Asn Asp Arg 340 345 350 Ser Tyr Leu Leu Ala Arg Ala Ile Gln Cys Phe Ala Pro Gly Ile Pro 355 360 365 Gln Ile Tyr Tyr Val Gly Leu Leu Ala Gly Lys Asn Asp Leu Glu Leu 370 375 380 Leu Glu Ser Thr Lys Glu Gly Arg Asn Ile Asn Arg His Tyr Tyr Ser 385 390 395 400 Leu Thr Glu Ile Asp Glu Glu Val Asn Arg Pro Val Val Lys Ala Leu 405 410 415 Phe Asp Leu Leu Arg Phe Arg Asn Arg Ala Ala Ala Phe Asp Leu Ala 420 425 430 Gly Glu Ile Thr Val Glu Thr Pro Ser Glu Glu Thr Ile Ile Ile Thr 435 440 445 Arg Lys Asp Ala Asn Gly Asp Arg Ala Val Leu Thr Ala Asn Leu Gln 450 455 460 Thr Lys Asp Phe Thr Val Thr His Asn Gly Glu Leu Val Leu Gln Gln 465 470 475 480 Leu Asp <210> 25 <211> 1440 <212> DNA <213> Artificial Sequence <220> <223> Sucrose phosphorylase from Streptococcus <400> 25 atgagcatcc agaacaagac catgctgatt acctacagcg atagcctggg taacaacctg 60 aaggacctgt acgagaacct ggaaaaatat ttcggcgatg cggtgggtgg cgttcacctg 120 ctgccgttct ttccgagcac cggtgatcgt ggcttcgcgc cggtggatta tgaccaggtt 180 gacccggcgt ttggtgattg ggaggacgtg aagcgtctgg gcgataagta ctacctgatg 240 ttcgacttca tgatcaacca cattagccgt caaagcaagt actataaaaa ctaccaggag 300 aagcacgacc aaagcgcgta taaagacctg ttcctgaact gggacaagtt ttggccggaa 360 aaccgtccga cccaggcgga tgttgacctg atctacaagc gtaaagatcg tgcgccgaaa 420 caagagatta ccttcgcgga cggtaccacc gaacacctgt ggaacacctt tggcgaggaa 480 caaatcgatc tggacgtgac caaagaggtg accatggact tcatccgtaa aaccattgaa 540 cacctggtta gcaacggttg cgacctgatt cgtctggatg cgtttgcgta cgcggtgaag 600 aaactggata ccaacgactt ctttgttgag ccggatatct gggacctgct ggataaggtt 660 cgtgatatgg cggcgagcta cggcgcggaa ctgctgccgg agattcacga acactatagc 720 atccagttca aaattgcgga tcacgactac tatgtgtacg actttgcgct gccgatggtt 780 accctgtaca ccctgtatag cagcaaggtg gagcgtctgg cgaagtggct gaaaatgagc 840 ccgatgaaac aattcaccac cctggacacc cacgatggta tcggcgtggt tgacgttaag 900 gatatcctga ccgacgagga aattgattac gcgagcaacg agctgtataa agtgggtgcg 960 aacgttaagc gtaaatacag caccgcggaa tataacaacc tggatatcta ccagattaac 1020 agcacctact atagcgcgct gggtgacgat gacagcaagt atttcctggc gcgtctgatc 1080 caggcgtttg cgccgggcat tccgcaagtg tactatgttg gttttctggc gggcaagaac 1140 gacctggagc tgctggaaaa caccaaagaa ggtcgtaaca tcaaccgtca ctactatagc 1200 aacgaggaaa ttgcgcagga agtggaacgt ccggtggtta agagcctgct gaaactgttc 1260 agctttcgta acaacagcca agcgttcgat ctggagggca gcatcgaggt ggaaaccccg 1320 gacgaacaca ccatcgttat tacccgtcag aacaaagacc aaaccgcgac cgcggtggcg 1380 cgtatcaacc tggcggatgg tacctaccag gttaccgaga acggccaaga cattgaattt 1440 <210> 26 <211> 480 <212> PRT <213> Artificial Sequence <220> <223> Sucrose phosphorylase from Streptococcus <400> 26 Met Ser Ile Gln Asn Lys Thr Met Leu Ile Thr Tyr Ser Asp Ser Leu 1 5 10 15 Gly Asn Asn Leu Lys Asp Leu Tyr Glu Asn Leu Glu Lys Tyr Phe Gly 20 25 30 Asp Ala Val Gly Gly Val His Leu Leu Pro Phe Phe Pro Ser Thr Gly 35 40 45 Asp Arg Gly Phe Ala Pro Val Asp Tyr Asp Gln Val Asp Pro Ala Phe 50 55 60 Gly Asp Trp Glu Asp Val Lys Arg Leu Gly Asp Lys Tyr Tyr Leu Met 65 70 75 80 Phe Asp Phe Met Ile Asn His Ile Ser Arg Gln Ser Lys Tyr Tyr Lys 85 90 95 Asn Tyr Gln Glu Lys His Asp Gln Ser Ala Tyr Lys Asp Leu Phe Leu 100 105 110 Asn Trp Asp Lys Phe Trp Pro Glu Asn Arg Pro Thr Gln Ala Asp Val 115 120 125 Asp Leu Ile Tyr Lys Arg Lys Asp Arg Ala Pro Lys Gln Glu Ile Thr 130 135 140 Phe Ala Asp Gly Thr Thr Glu His Leu Trp Asn Thr Phe Gly Glu Glu 145 150 155 160 Gln Ile Asp Leu Asp Val Thr Lys Glu Val Thr Met Asp Phe Ile Arg 165 170 175 Lys Thr Ile Glu His Leu Val Ser Asn Gly Cys Asp Leu Ile Arg Leu 180 185 190 Asp Ala Phe Ala Tyr Ala Val Lys Lys Leu Asp Thr Asn Asp Phe Phe 195 200 205 Val Glu Pro Asp Ile Trp Asp Leu Leu Asp Lys Val Arg Asp Met Ala 210 215 220 Ala Ser Tyr Gly Ala Glu Leu Leu Pro Glu Ile His Glu His Tyr Ser 225 230 235 240 Ile Gln Phe Lys Ile Ala Asp His Asp Tyr Tyr Val Tyr Asp Phe Ala 245 250 255 Leu Pro Met Val Thr Leu Tyr Thr Leu Tyr Ser Ser Lys Val Glu Arg 260 265 270 Leu Ala Lys Trp Leu Lys Met Ser Pro Met Lys Gln Phe Thr Thr Leu 275 280 285 Asp Thr His Asp Gly Ile Gly Val Val Asp Val Lys Asp Ile Leu Thr 290 295 300 Asp Glu Glu Ile Asp Tyr Ala Ser Asn Glu Leu Tyr Lys Val Gly Ala 305 310 315 320 Asn Val Lys Arg Lys Tyr Ser Thr Ala Glu Tyr Asn Asn Leu Asp Ile 325 330 335 Tyr Gln Ile Asn Ser Thr Tyr Tyr Ser Ala Leu Gly Asp Asp Asp Ser 340 345 350 Lys Tyr Phe Leu Ala Arg Leu Ile Gln Ala Phe Ala Pro Gly Ile Pro 355 360 365 Gln Val Tyr Tyr Val Gly Phe Leu Ala Gly Lys Asn Asp Leu Glu Leu 370 375 380 Leu Glu Asn Thr Lys Glu Gly Arg Asn Ile Asn Arg His Tyr Tyr Ser 385 390 395 400 Asn Glu Glu Ile Ala Gln Glu Val Glu Arg Pro Val Val Lys Ser Leu 405 410 415 Leu Lys Leu Phe Ser Phe Arg Asn Asn Ser Gln Ala Phe Asp Leu Glu 420 425 430 Gly Ser Ile Glu Val Glu Thr Pro Asp Glu His Thr Ile Val Ile Thr 435 440 445 Arg Gln Asn Lys Asp Gln Thr Ala Thr Ala Val Ala Arg Ile Asn Leu 450 455 460 Ala Asp Gly Thr Tyr Gln Val Thr Glu Asn Gly Gln Asp Ile Glu Phe 465 470 475 480 <210> 27 <211> 1509 <212> DNA <213> Artificial Sequence <220> <223> Sucrose phosphorylase from Scardovia <400> 27 atgaagaaca aagttcagct gattacctac gcggatcgtc tgggtgaagg taccctggcg 60 agcctgaccg atgtgctgcg tacccgtttc gatggcgttt atgaaggtgt gcacattctg 120 ccgttcttta ccccgttcga cggcgcggat gcgggttttg acccgatcga tcacaccaag 180 gttgacccgc gtctgggtag ctgggacgat gtggcggagc tgagcaaaac ccacgacatc 240 atggttgatg cgattgtgaa ccacatgagc tggcaaagcg aacagtttca agatgttatg 300 aagaaaggtg aaggcagcga atactatccg atgttcctga ccatgagcgc ggtgtttccg 360 gagggtgcga ccgaggaaga cctggcgggt atttatcgtc cgcgtccggg tctgccgttc 420 acccactata cctggggtgg caagacccgt ctggtttgga ccacctttac cccgcagcaa 480 gtggacatcg ataccgcgag cgacgaaggt tgggcgtacc tgatgagcat cctggatcag 540 atgagcaaaa gccacgttag cttcattcgt ctggacgcgg tgggttatgg cgcgaagcgt 600 gcgaaaacca gctgcttcat gaccccggac acctttgatc tgatcagccg tattaaagag 660 gagagcgcgc gtcgtggcat ggagaccctg atcgaagttc acagctacta taagaaacaa 720 gtggagattg cgaacaaggt ggaccgtgtt tacgattttg cgatcccggc gctgctgctg 780 catgcgctga gcaccggtaa aaccggtccg ctggcgcact ggctgggtgt gcgtccggtt 840 aacgcggtga acgttctgga cacccacgat ggtatcggcg tgattgatgt tggcagcgac 900 cagatggatc gtagcctgaa gggtctggtt ccggacgatg aagttgacca actggtggag 960 accattaaag aaaacagcca tggtgaaagc gcggaagcga ccggtgcggc ggcgagcaac 1020 ctggatctgt accaggttaa ctgcacctac tatagcgcgc tgggctgcga cgatcaaaaa 1080 tacatcgcga gccgtgcggt gcagttctat atgccgggtg tgccgcaagt ttactatgtg 1140 ggcgcgctgg cgggcaagaa cgacatggag ctgctgaaac gtaccaacgt tggtcgtgat 1200 atcaaccgtc actactatac cgtggcggag attgacgaaa acctgcgtcg tccggtggtt 1260 caggcgctga acgcgctggg ccgtttccgt aacaccctgg aggcgtttga cggtgatttc 1320 agctttaccg aaaacggtgg cagcctggcg atgacctgga ccggtcaaag caccagcacc 1380 accctgacct ttgcgccggg caagggtgcg ggtagcagcg gcgtgccggt ttgcaccatc 1440 gcgtggaaag acgcgagcgg tgaacacgtg accgacgata tcattgcgaa cccgccggcg 1500 gcggcgcag 1509 <210> 28 <211> 503 <212> PRT <213> Artificial Sequence <220> <223> Sucrose phosphorylase from Scardovia <400> 28 Met Lys Asn Lys Val Gln Leu Ile Thr Tyr Ala Asp Arg Leu Gly Glu 1 5 10 15 Gly Thr Leu Ala Ser Leu Thr Asp Val Leu Arg Thr Arg Phe Asp Gly 20 25 30 Val Tyr Glu Gly Val His Ile Leu Pro Phe Phe Thr Pro Phe Asp Gly 35 40 45 Ala Asp Ala Gly Phe Asp Pro Ile Asp His Thr Lys Val Asp Pro Arg 50 55 60 Leu Gly Ser Trp Asp Asp Val Ala Glu Leu Ser Lys Thr His Asp Ile 65 70 75 80 Met Val Asp Ala Ile Val Asn His Met Ser Trp Gln Ser Glu Gln Phe 85 90 95 Gln Asp Val Met Lys Lys Gly Glu Gly Ser Glu Tyr Tyr Pro Met Phe 100 105 110 Leu Thr Met Ser Ala Val Phe Pro Glu Gly Ala Thr Glu Glu Asp Leu 115 120 125 Ala Gly Ile Tyr Arg Pro Arg Pro Gly Leu Pro Phe Thr His Tyr Thr 130 135 140 Trp Gly Gly Lys Thr Arg Leu Val Trp Thr Thr Phe Thr Pro Gln Gln 145 150 155 160 Val Asp Ile Asp Thr Ala Ser Asp Glu Gly Trp Ala Tyr Leu Met Ser 165 170 175 Ile Leu Asp Gln Met Ser Lys Ser His Val Ser Phe Ile Arg Leu Asp 180 185 190 Ala Val Gly Tyr Gly Ala Lys Arg Ala Lys Thr Ser Cys Phe Met Thr 195 200 205 Pro Asp Thr Phe Asp Leu Ile Ser Arg Ile Lys Glu Glu Ser Ala Arg 210 215 220 Arg Gly Met Glu Thr Leu Ile Glu Val His Ser Tyr Tyr Lys Lys Gln 225 230 235 240 Val Glu Ile Ala Asn Lys Val Asp Arg Val Tyr Asp Phe Ala Ile Pro 245 250 255 Ala Leu Leu Leu His Ala Leu Ser Thr Gly Lys Thr Gly Pro Leu Ala 260 265 270 His Trp Leu Gly Val Arg Pro Val Asn Ala Val Asn Val Leu Asp Thr 275 280 285 His Asp Gly Ile Gly Val Ile Asp Val Gly Ser Asp Gln Met Asp Arg 290 295 300 Ser Leu Lys Gly Leu Val Pro Asp Asp Glu Val Asp Gln Leu Val Glu 305 310 315 320 Thr Ile Lys Glu Asn Ser His Gly Glu Ser Ala Glu Ala Thr Gly Ala 325 330 335 Ala Ala Ser Asn Leu Asp Leu Tyr Gln Val Asn Cys Thr Tyr Tyr Ser 340 345 350 Ala Leu Gly Cys Asp Asp Gln Lys Tyr Ile Ala Ser Arg Ala Val Gln 355 360 365 Phe Tyr Met Pro Gly Val Pro Gln Val Tyr Tyr Val Gly Ala Leu Ala 370 375 380 Gly Lys Asn Asp Met Glu Leu Leu Lys Arg Thr Asn Val Gly Arg Asp 385 390 395 400 Ile Asn Arg His Tyr Tyr Thr Val Ala Glu Ile Asp Glu Asn Leu Arg 405 410 415 Arg Pro Val Val Gln Ala Leu Asn Ala Leu Gly Arg Phe Arg Asn Thr 420 425 430 Leu Glu Ala Phe Asp Gly Asp Phe Ser Phe Thr Glu Asn Gly Gly Ser 435 440 445 Leu Ala Met Thr Trp Thr Gly Gln Ser Thr Ser Thr Thr Leu Thr Phe 450 455 460 Ala Pro Gly Lys Gly Ala Gly Ser Ser Gly Val Pro Val Cys Thr Ile 465 470 475 480 Ala Trp Lys Asp Ala Ser Gly Glu His Val Thr Asp Asp Ile Ile Ala 485 490 495 Asn Pro Pro Ala Ala Ala Gln 500 <210> 29 <211> 1506 <212> DNA <213> Artificial Sequence <220> <223> Sucrose phosphorylase from Parascardovia <400> 29 atgaagaaca aagttcagct gatcacctac gcgaaccgtt tcggcgaggg caccattcgt 60 agcctgaccg acgtgctgcg tacccgtttt gatggtgttt acgaaggcgt gcacattctg 120 ccgttcttta ccccgttcga cggtgcggat gcgggctttg acccgattga tcacaccaag 180 gttgatccgc gtctgggtac ctgggacgat atcgcggagc tgagcaaaac ccacgacatc 240 atggttgatg cgattgtgaa ccacatgagc tgggagagca agcagttcca agacgttatg 300 aaaaacggtg aagcgagccc gtactatggc atgttcctga ccatgagcgc ggtgtttccg 360 gatggtgcga ccgaggaaga tctggcgggt atctatcgtc cgcgtccggg tctgccgttc 420 acccactata actggggtgg caagacccgt ctggtttgga ccacctttac cccgcagcaa 480 gtggacatca acaccgatag cattgaaggc tgggactacc tgatgagcat cctggatcag 540 atgagccaaa gccacgttag cttcattcgt ctggacgcgg tgggttatgg cgcgaagcag 600 gcgaaaacca cctgcttcat gaccccgaag acctttgagc tgatcggtcg tattaaagag 660 gagagcgcga aacgtggcat ggagaccctg atcgaagttc acagccacta catgaagcaa 720 gtggaaattg cgggtaaagt ggaccgtgtt tatgattttg cgattccggg tctgctgctg 780 catgcgctga ccaccggtaa aaccggtccg ctggcgcgtt ggatggaagt gcgtccgggt 840 aacgcggtga acgttctgga cacccacgat ggtattggcg ttatcgatat tggtagcgac 900 cagatggatc gtagcctgaa gggtctggtg ccggacgagg aagttgatca actggtggag 960 accatcaaag aaaacagcca cggtgaaagc gcggcggcga ccggcgcggc ggcgagcaac 1020 ctggacctgt accaggttaa ctgcacctac tatagcgcgc tgggttgcga cgatcaaaaa 1080 tatattgcgg cgcgtgcggt gcagttcttt atgccgggcg tgccgcaagt ttactatgtg 1140 ggtgcgctgg cgggcgagaa cgacatgcag ctgctgaagg aaaccaacgt tggtcgtgat 1200 atcaaccgtc actactatag cctggaggaa attgaccaaa acctggagcg tccggtggtt 1260 aaagcgctga acgcgctgtg ccgtttccgt aacggtctgg aagcgtttga cggcgatttc 1320 agctttgcgc agaacggtga tagcctgacc ttcgcgtgga ccggcaagga gaccgaagcg 1380 accctgacct ttaccccggc gcaaggtgtt ggcaaagatg aggcgccggt gtgcagcctg 1440 cgttggaagg acagcgcggg tgatcacaaa accgatgatc tgattgcgga accgccggcg 1500 gtggcg 1506 <210> 30 <211> 502 <212> PRT <213> Artificial Sequence <220> <223> Sucrose phosphorylase from Parascardovia <400> 30 Met Lys Asn Lys Val Gln Leu Ile Thr Tyr Ala Asn Arg Phe Gly Glu 1 5 10 15 Gly Thr Ile Arg Ser Leu Thr Asp Val Leu Arg Thr Arg Phe Asp Gly 20 25 30 Val Tyr Glu Gly Val His Ile Leu Pro Phe Phe Thr Pro Phe Asp Gly 35 40 45 Ala Asp Ala Gly Phe Asp Pro Ile Asp His Thr Lys Val Asp Pro Arg 50 55 60 Leu Gly Thr Trp Asp Asp Ile Ala Glu Leu Ser Lys Thr His Asp Ile 65 70 75 80 Met Val Asp Ala Ile Val Asn His Met Ser Trp Glu Ser Lys Gln Phe 85 90 95 Gln Asp Val Met Lys Asn Gly Glu Ala Ser Pro Tyr Tyr Gly Met Phe 100 105 110 Leu Thr Met Ser Ala Val Phe Pro Asp Gly Ala Thr Glu Glu Asp Leu 115 120 125 Ala Gly Ile Tyr Arg Pro Arg Pro Gly Leu Pro Phe Thr His Tyr Asn 130 135 140 Trp Gly Gly Lys Thr Arg Leu Val Trp Thr Thr Phe Thr Pro Gln Gln 145 150 155 160 Val Asp Ile Asn Thr Asp Ser Ile Glu Gly Trp Asp Tyr Leu Met Ser 165 170 175 Ile Leu Asp Gln Met Ser Gln Ser His Val Ser Phe Ile Arg Leu Asp 180 185 190 Ala Val Gly Tyr Gly Ala Lys Gln Ala Lys Thr Thr Cys Phe Met Thr 195 200 205 Pro Lys Thr Phe Glu Leu Ile Gly Arg Ile Lys Glu Glu Ser Ala Lys 210 215 220 Arg Gly Met Glu Thr Leu Ile Glu Val His Ser His Tyr Met Lys Gln 225 230 235 240 Val Glu Ile Ala Gly Lys Val Asp Arg Val Tyr Asp Phe Ala Ile Pro 245 250 255 Gly Leu Leu Leu His Ala Leu Thr Thr Gly Lys Thr Gly Pro Leu Ala 260 265 270 Arg Trp Met Glu Val Arg Pro Gly Asn Ala Val Asn Val Leu Asp Thr 275 280 285 His Asp Gly Ile Gly Val Ile Asp Ile Gly Ser Asp Gln Met Asp Arg 290 295 300 Ser Leu Lys Gly Leu Val Pro Asp Glu Glu Val Asp Gln Leu Val Glu 305 310 315 320 Thr Ile Lys Glu Asn Ser His Gly Glu Ser Ala Ala Ala Thr Gly Ala 325 330 335 Ala Ala Ser Asn Leu Asp Leu Tyr Gln Val Asn Cys Thr Tyr Tyr Ser 340 345 350 Ala Leu Gly Cys Asp Asp Gln Lys Tyr Ile Ala Ala Arg Ala Val Gln 355 360 365 Phe Phe Met Pro Gly Val Pro Gln Val Tyr Tyr Val Gly Ala Leu Ala 370 375 380 Gly Glu Asn Asp Met Gln Leu Leu Lys Glu Thr Asn Val Gly Arg Asp 385 390 395 400 Ile Asn Arg His Tyr Tyr Ser Leu Glu Glu Ile Asp Gln Asn Leu Glu 405 410 415 Arg Pro Val Val Lys Ala Leu Asn Ala Leu Cys Arg Phe Arg Asn Gly 420 425 430 Leu Glu Ala Phe Asp Gly Asp Phe Ser Phe Ala Gln Asn Gly Asp Ser 435 440 445 Leu Thr Phe Ala Trp Thr Gly Lys Glu Thr Glu Ala Thr Leu Thr Phe 450 455 460 Thr Pro Ala Gln Gly Val Gly Lys Asp Glu Ala Pro Val Cys Ser Leu 465 470 475 480 Arg Trp Lys Asp Ser Ala Gly Asp His Lys Thr Asp Asp Leu Ile Ala 485 490 495 Glu Pro Pro Ala Val Ala 500 <210> 31 <211> 1500 <212> DNA <213> Artificial Sequence <220> <223> Sucrose phosphorylase from Alloscardovia <400> 31 atgaagaaca aagttcaact gattacctac gcggatcgtc tgggtgacgg caccctgaag 60 agcatgaccg agaccctgcg taaacacttc gagggtgttt atgaaggcgt gcacatcctg 120 ccgttcttta ccccgttcga tggtgcggac gcgggctttg atccggttga ccacaccaaa 180 gtggacccgc gtctgggtag ctgggacgat gtggcggaac tgagcaccac ccacgatatc 240 atggttgaca ccattgtgaa ccacatgagc tgggagagcg aacagttcca agatgttatg 300 gcgaagggcg aggacagcga atactatccg atgttcctga ccatgagcag catttttccg 360 gatggtgtga ccgaggaaga cctgaccgcg atctatcgtc cgcgtccggg tctgccgttc 420 acccactata actggggtgg caaaacccgt ctggtttgga ccacctttac cccgcagcaa 480 gtggacattg ataccgacag cgagatgggt tggaactacc tgctgagcat cctggatcag 540 ctgagccaaa gccacgttag ccaaattcgt ctggacgcgg tgggttatgg cgcgaaggag 600 aaaaacagca gctgcttcat gaccccgaag acctttaaac tgatcgaacg tattaaggcg 660 gagggtgaaa aacgtggcct ggagaccctg atcgaagttc acagctacta taagaaacag 720 gtggagattg cgagcaaggt ggatcgtgtt tacgactttg cgatcccggg tctgctgctg 780 catgcgctgg aatttggcaa aaccgatgcg ctggcgcaat ggattgacgt tcgtccgaac 840 aacgcggtga acgttctgga tacccacgac ggtatcggcg ttatcgatat tggtagcgat 900 cagatggacc gtagcctggc gggtctggtg ccggatgagg aagttgacgc gctggttgag 960 agcatccacc gtaacagcaa gggtgaaagc caggaagcga ccggcgcggc ggcgagcaac 1020 ctggacctgt accaagttaa ctgcacctac tatgcggcgc tgggtagcga cgatcagaaa 1080 tatattgcgg cgcgtgcggt gcagttcttt atgccgggcg tgccgcaagt ttactatgtg 1140 ggtgcgctgg cgggcagcaa cgatatggac ctgctgaagc gtaccaacgt gggtcgtgat 1200 atcaaccgtc actactatag cgcggcggaa gtggcgagcg aggtggaacg tccggtggtt 1260 caggcgctga acgcgctggg ccgtttccgt aacaccctga gcgcgttcga tggtgaattt 1320 agctacagca acgcggacgg cgttctgacc atgacctggg cggatgatgc gacccgtgcg 1380 accctgacct ttgcgccgaa ggcgaacagc aacggtgcga gcgtggcgcg tctggagtgg 1440 accgatgcgg cgggtgaaca tgcgaccgac gatctgatcg cgaacccgcc ggtggttgcg 1500 <210> 32 <211> 500 <212> PRT <213> Artificial Sequence <220> <223> Sucrose phosphorylase from Alloscardovia <400> 32 Met Lys Asn Lys Val Gln Leu Ile Thr Tyr Ala Asp Arg Leu Gly Asp 1 5 10 15 Gly Thr Leu Lys Ser Met Thr Glu Thr Leu Arg Lys His Phe Glu Gly 20 25 30 Val Tyr Glu Gly Val His Ile Leu Pro Phe Phe Thr Pro Phe Asp Gly 35 40 45 Ala Asp Ala Gly Phe Asp Pro Val Asp His Thr Lys Val Asp Pro Arg 50 55 60 Leu Gly Ser Trp Asp Asp Val Ala Glu Leu Ser Thr Thr His Asp Ile 65 70 75 80 Met Val Asp Thr Ile Val Asn His Met Ser Trp Glu Ser Glu Gln Phe 85 90 95 Gln Asp Val Met Ala Lys Gly Glu Asp Ser Glu Tyr Tyr Pro Met Phe 100 105 110 Leu Thr Met Ser Ser Ile Phe Pro Asp Gly Val Thr Glu Glu Asp Leu 115 120 125 Thr Ala Ile Tyr Arg Pro Arg Pro Gly Leu Pro Phe Thr His Tyr Asn 130 135 140 Trp Gly Gly Lys Thr Arg Leu Val Trp Thr Thr Phe Thr Pro Gln Gln 145 150 155 160 Val Asp Ile Asp Thr Asp Ser Glu Met Gly Trp Asn Tyr Leu Leu Ser 165 170 175 Ile Leu Asp Gln Leu Ser Gln Ser His Val Ser Gln Ile Arg Leu Asp 180 185 190 Ala Val Gly Tyr Gly Ala Lys Glu Lys Asn Ser Ser Cys Phe Met Thr 195 200 205 Pro Lys Thr Phe Lys Leu Ile Glu Arg Ile Lys Ala Glu Gly Glu Lys 210 215 220 Arg Gly Leu Glu Thr Leu Ile Glu Val His Ser Tyr Tyr Lys Lys Gln 225 230 235 240 Val Glu Ile Ala Ser Lys Val Asp Arg Val Tyr Asp Phe Ala Ile Pro 245 250 255 Gly Leu Leu Leu His Ala Leu Glu Phe Gly Lys Thr Asp Ala Leu Ala 260 265 270 Gln Trp Ile Asp Val Arg Pro Asn Asn Ala Val Asn Val Leu Asp Thr 275 280 285 His Asp Gly Ile Gly Val Ile Asp Ile Gly Ser Asp Gln Met Asp Arg 290 295 300 Ser Leu Ala Gly Leu Val Pro Asp Glu Glu Val Asp Ala Leu Val Glu 305 310 315 320 Ser Ile His Arg Asn Ser Lys Gly Glu Ser Gln Glu Ala Thr Gly Ala 325 330 335 Ala Ala Ser Asn Leu Asp Leu Tyr Gln Val Asn Cys Thr Tyr Tyr Ala 340 345 350 Ala Leu Gly Ser Asp Asp Gln Lys Tyr Ile Ala Ala Arg Ala Val Gln 355 360 365 Phe Phe Met Pro Gly Val Pro Gln Val Tyr Tyr Val Gly Ala Leu Ala 370 375 380 Gly Ser Asn Asp Met Asp Leu Leu Lys Arg Thr Asn Val Gly Arg Asp 385 390 395 400 Ile Asn Arg His Tyr Tyr Ser Ala Ala Glu Val Ala Ser Glu Val Glu 405 410 415 Arg Pro Val Val Gln Ala Leu Asn Ala Leu Gly Arg Phe Arg Asn Thr 420 425 430 Leu Ser Ala Phe Asp Gly Glu Phe Ser Tyr Ser Asn Ala Asp Gly Val 435 440 445 Leu Thr Met Thr Trp Ala Asp Asp Ala Thr Arg Ala Thr Leu Thr Phe 450 455 460 Ala Pro Lys Ala Asn Ser Asn Gly Ala Ser Val Ala Arg Leu Glu Trp 465 470 475 480 Thr Asp Ala Ala Gly Glu His Ala Thr Asp Asp Leu Ile Ala Asn Pro 485 490 495 Pro Val Val Ala 500

Claims

베타-글리코실화된 산물을 생산하기 위해 기질을 글리코실화시키는 방법으로서, 적어도 하나의 글리코실기 공여체, 적어도 하나의 글리코실기 수용체 및 적어도 하나의 글리코실트랜스퍼라제 효소를 제공하는 단계; 베타-글루코스 연결을 갖는 적어도 하나의 산물을 생산하기 위해 글리코실기 수용체가 글리코실화되도록 하는 조건 하에서 글리코실트랜스퍼라제 효소와, 글리코실기 공여체 및 글리코실기 수용체를 접촉시키는 단계를 포함하는 방법.
제1항에 있어서, 상기 글리코실기 공여체는 글리코실포스페이트인 방법.
제2항에 있어서, 상기 글리코실기 공여체는 글루코스-1-포스페이트인 방법.
제1항에 있어서, 상기 글리코실기 수용체는 글리코실, 알콕시, 카르복시, 아미노카르보닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카르복시알킬, 아미노알킬, 할로알킬, 알킬티오알킬, 헤테로시클로알킬, 헤테로아릴 및 헤테로아릴알킬 기에서 선택되는 것인 방법.
제1항에 있어서, 상기 베타-글루코스 연결을 갖는 산물은 스테비올 글리코시드인 방법.
제1항에 있어서, 상기 글리코실기 수용체는 스테비오시드이고, 상기 글리코실기 공여체는 알파-글루코스-1-포스페이트이고, 상기 베타-글루코스 연결을 갖는 산물은 레바우디오시드 A인 방법.
제1항 내지 제6항 중 어느 하나의 항에 있어서, 상기 글리코실트랜스퍼라제는 서열번호 2, 4, 6, 8, 10, 12 및 14로 제시된 폴리펩티드에서 선택되는 것인 방법.
글루코스-1-포스페이트를 생산하는 방법으로서, 포스포릴라제, 무기 포스페이트, 및 포스포릴라제의 이당류, 삼당류 또는 올리고당류 기질을 제공하는 단계; 단당류 및 글루코스-1-포스페이트를 생산하기 위해 상기 당류가 분해되도록 하는 조건 하에서 상기 포스포릴라제, 무기 포스페이트 및 당류를 접촉시키는 단계를 포함하는 방법.
제8항에 있어서, 제8항의 방법은 제1항의 방법과 조합되는 것인 방법.
제9항에 있어서, 상기 글루코실기 수용체는 글리코실, 알콕시, 카르복시, 아미노카르보닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카르복시알킬, 아미노알킬, 할로알킬, 알킬티오알킬, 헤테로시클로알킬, 헤테로아릴 및 헤테로아릴알킬 기에서 선택되는 것인 방법.
제9항에 있어서, 상기 포스포릴라제는 수크로스 포스포릴라제이고, 상기 당류는 수크로스이고, 상기 생산된 단당류는 수크로스이고, 상기 생산된 글루코스-1-포스페이트는 α-글루코스-1-포스페이트인 방법.
제8항 내지 제11항 중 어느 하나의 항에 있어서, 상기 포스포릴라제는 서열번호 16, 18, 20, 22, 24, 26, 28, 30 및 32에서 선택된 폴리펩티드 서열을 포함하는 것인 방법.