KR20230132539A

KR20230132539A - 글리코실화된 생산물의 세포 생산

Info

Publication number: KR20230132539A
Application number: KR1020237027723A
Authority: KR
Inventors: 유리 보프레; 메세네이러 소피 더; 네이스 야티 더; 톰 데뮐러
Original assignee: 인바이오스 엔.브이.
Priority date: 2021-01-18
Filing date: 2022-01-17
Publication date: 2023-09-15
Also published as: AU2022208430A1; WO2022152914A1; US20240084347A1; CN116783291A; EP4277983A1

Abstract

본 발명은 합성 생물학 및 대사 공학의 기술 분야이다. 보다 특히, 본 발명은 대사적으로 조작된 세포 배양의 기술 분야이다. 본 발명은 UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물을 세포에 의해 제조할 뿐만 아니라 배양으로부터 상기 글리코실화된 생산물의 분리를 위한 방법을 설명한다. 더 나아가서, 본 발명은 UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 대사적으로 조작된 세포를 제공한다. 본 발명은 또한 세포 밖으로 이당 또는 올리고당을 배출하는 세포를 제공한다.

Description

글리코실화된 생산물의 세포 생산

본 발명은 합성 생물학 및 대사 공학의 기술 분야이다. 보다 특히, 본 발명은 대사적으로 조작된 세포 배양의 기술 분야이다. 본 발명은 UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물을 세포를 통해서 제조할뿐만 아니라 배양으로부터 상기 글리코실화된 생산물을 분리하는 방법을 설명한다. 더 나아가서, 본 발명은 UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 대사적으로 조작된 세포를 제공한다. 본 발명은 또한 세포 밖으로 이당 또는 올리고당을 배출하는 세포를 제공한다.

단백질 및 지질에 당-접합된 형태로서 또는 비접합된 글리칸으로서 체액 및 동물 모유에 존재하는, 탄수화물은 분화, 숙주-병원체 상호작용, 및 발생 및 면역학적 반응을 포함하는 많은 생물학적 과정에서 활성이다 (Bode, Early Hum. Dev. 1-4 (2015); Reily et al., Nat. Rev. Nephrol. 15, 346-366 (2019); Varki, Glycobiology 27, 3-49 (2017)). 탄수화물은 각각 1개, 2개 및 3개 이상의 서브유닛으로 구성되는 단당, 이당, 및 올리고당을 포함하는 많은 상이한 구조로 분류된다. 많은 탄수화물은 뉴클레오티드-활성화된 당으로부터 성장하는 글리칸 사슬로 단당의 활성화된 형태를 전달하는 글리코실트랜스퍼라제에 의해 합성된다. 뉴클레오시드라고도 하는, 뉴클레오티드-활성화된 당은 뉴클레오티드로 치환된 각각의 단당에 관한 것이다. 뉴클레오티드 5'-디포스포당 (예를 들어, UDP, GDP, ADP 또는 dTDP에 연결된 당을 포함하는 NDP-당)은 글리코실트랜스퍼라제에 의해 사용되는 당 도너의 가장 일반적인 형태를 나타낸다. 뉴클레오시드는 에피머화/이성체화, 탈카르복실화, 탈수, 탈수소화, 산화 또는 환원 반응을 포함하는 상호전환 반응에 의해서 또는 회수 경로를 통해서, 즉 올리고당의 분해를 통해서, NDP-파이로포스포릴라제로부터 합성될 수 있다 (Field and Naismith, 2003, Biochemistry 42, 7637-7647; Singh et al., 2012, Nat. Prod. Rep. 29(10), 1201-1237).

뉴클레오시드 UDP-N-아세틸글루코사민 (UDP-GlcNAc)은 많은 천연 글리코실화된 생산물의 합성에서 중요한 중간체이다. 이러한 생산물의 예는 N-아세틸글루코사민 (GlcNAc), N-아세틸만노사민 (ManNAc), N-아세틸갈락토사민 (GalNAc), 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산 (MurNAc), N-아세틸-L-퀴노보사민, N-아세틸뉴라민산 (Neu5Ac), 및 N-글리코릴뉴라민산 (Neu5Gc)을 포함하는 단당으로 구성되고, 박테리아, 바이러스, 진균, 효모, 및 고등 유기체 중에 널리 분포된 이당 및 올리고당을 포함한다. UDP-GlcNAc로부터 유래되는 올리고당의 큰 부분은 박테리아의 세포 표면을 코팅하는 다당류 구조 또는 거의 모든 박테리아의 주변세포질 공간의 펩티도글리칸 (또는 뮤레인) 층에서 발견되었다. 지질다당류 (LPS)는 그람-음성 박테리아 외막의 주요 성분이다. LPS가 포유동물 숙주의 소화관에서 마주하게 되는 항생제 및 세제같은 일정 종류의 화학적 공격으로부터 박테리아 막을 보호하지만, 그들은 또한 동물 면역계로부터 강력한 반응을 유도한다. 이들 면역조절 성질 덕분에, 지질다당류는 종종 의학적 또는 수의학적 관심을 받는다 (Bertani and Ruiz, 2018, EcoSal. Plus 8(1), ESP-0001-2018; Caroff and Karibian, 2003, Carb. Res. 338, 2431-2447; Sampath, 2018, Agriculture and Natural Resources 52(2), 115-120). 그람-양성 박테리아 및 고세균은 LPS를 보유하지 않지만, 동일한 단백질 또는 당단백질의 단일 층으로 구성된 표면 층을 갖고, 이들 당단백질은 그람-음성 박테리아의 0-항원을 닮고 종종 유사한 당 빌딩 블록을 함유한다 (Schaffer et al., 2002, J. Biol. Chem. 277(8), 6230-6239). 펩티도글리칸 (또는 뮤레인)은 박테리아의 세포 구조 및 삼투압을 유지하는 짧은 펩티드 가교에 의해서 가교-결합되는 교대식 GlcNAc 및 MurNAc 당으로 구성되는 글리코시드 구조이다 (Vollmer et al., 2008, FEMS Microb. Rev. 32(2), 149-167). 진핵생물은 또한 UDP-GlcNAc로부터 유래되는 다양한 글리코실화된 생산물을 함유한다. 예를 들어, GlcNAc, GalNAc 및/또는 Neu5Ac 빌딩 블록을 포함하는 올리고당은 대부분의 포유동물의 모유에서 빈번하게 확인된다. 인간 모유 중 대부분의 올리고당 (HMO)은 인간 모유에 고유하고, 그들 조성은 건강한 성장 및 발달을 위해 신생아의 영양 요구를 충족하도록 수유 전반에서 일정하게 변화된다. 연구들은 면역 발달을 지원하고, 장 투과성을 완화시키고, 장 세포 반응에 영향을 미치고, 괴사성 장염의 발생을 감소시킨다는 것을 입증하였다 (Walsh et al., 2020, J. Funct. Foods 72, 104052 및 이의 참조).

UDP-GlcNAc로부터 유래되는 글리코실화된 생산물의 합성에 광범위한 관심이 있지만, 그들 산업적 합성은 지금까지 여전히 도전이다. 상기 합성은 뉴클레오시드로부터 성장하는 당류 사슬에 단당 서브유닛을 전달하는 특별한 뉴클레오시드 및 글리코실트랜스퍼라제의 생산을 포함한다. 이들 글리코실화된 생산물의 세포 생산 동안 발생하는 문제는 천연 세포벽 생합성 경로의 방해 및/또는 세포 밖으로 상기 글리코실화된 생산물의 배출이다. 또한, 이들 화합물을 향한 물질대사에서의 탄소 흐름의 최적화가 여전히 생산 준주에서 방해받는다. Deng 및 동료들은 발효 배양을 통해 재조합 이. 콜라이 세포를 사용한 GlcNAc의 성공적인 생산을 보고하였다 (Deng et al., Metab. Eng. 7, 201-214 (2005); EP1576106). 그러나, 미생물 시스템에서, GlcNAc는 이.콜라이 세포의 세포외에서, 보다 특히 후자의 이출 동안 GlcNAc-6-포스페이트의 탈-인산화를 통해서, 이. 콜라이의 주변세포질에서 생산된다. 이와 같이, 수득된 GlcNAc 모이어티는 본 발명에서 UDP-GlcNAc로부터 유래된 글리코실화된 생산물의 생산에 필수적인 UDP-GlcNAc로 세포내 전환에 더 이상 이용가능하지 않다. 또한, Deng 및 동료들이 기술한 방법은 생산 숙주에 대한 억제 효과를 최소화하기 위해 정밀한 제어를 필요로 하는 2-단계 공급 배치 시스템을 요구하여, 이 방법은 고적정가의 UDP-GlcNAc를 생산하기 위한 상업적 흥미를 얻지 못한다.

본 발명의 목적은 UDP-GlcNAc로부터 유래되고, 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물이 세포에 의해 생산될 수 있는 도구 및 방법을 제공하는 것이다. 본 발명에 따라서, 이러한 목적 및 다른 목적은 상기 글리코실화된 생산물을 제조하기 위한 세포 및 방법을 제공하여 달성되고, 세포는 상기 글리코실화된 생산물의 제조를 위해 유전자 변형된다.

본 발명은 대사적으로 조작된 세포, 및 UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당으로 구성된 글리코실화된 생산물의 제조를 위한 방법을 제공한다. 방법은 UDP-GlcNAc를 합성하고 상기 UDP-GlcNAc를 사용하여 상기 글리코실화된 생산물을 생산하는, 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하는 세포를 제공하는 단계, 및 상기 글리코실화된 생산물를 생산하도록 허용하는 조건 하에서 상기 세포를 배양하는 단계를 포함한다. 본 발명은 또한 상기 글리코실화된 생산물을 분리하기 위한 방법을 제공한다. 더 나아가서, 본 발명은 상기 글리코실화된 생산물을 생산하기 위해 대사적으로 조작된 세포를 제공한다. 본 발명은 또한 세포 밖으로 이당 또는 올리고당을 배출하는 세포를 제공한다.

정의

본 발명 및 이의 다양한 구현예를 설명하기 위해서 본 명세서에서 사용되는 단어는 그들의 일반적으로 정의된 뜻의 의미에서 이해되어야 할뿐만 아니라, 본 명세서 구조에서 특별한 정의를 통해서 일반적으로 정의되는 뜻의 범위를 벗어나는 물질 또는 행위를 포함하는 것으로 이해되어야 한다. 따라서, 본 명세서의 상황에서 성분이 하나 초과의 뜻을 포함하는 것으로 이해될 수 있으면, 청구항에서 이의 사용은 명세서 및 단어 그 자체에 의해 뒷받침되는 모든 가능한 뜻에 대해 포괄적인 것으로 이해되어야만 한다.

본 명세서에 개시된 발명의 다양한 구현예 및 구현예의 양태는 본 명세서에 특별히 기술된 순서 및 상황 뿐만 아니라, 또한 임의 순서 및 이의 임의 조합을 포함하는 것으로 이해되어야 한다. 상황에서 요구할 때마다, 단수로 사용되는 모든 단어는 복수를 포함하는 것으로 간주되고 그 반대도 마찬가지이다. 달리 정의하지 않으면, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 일반적으로 본 발명이 속하는 분야의 당업자가 일반적으로 이해하는 바와 동일한 의미를 갖는다. 일반적으로, 본 명세서에서 사용되는 명명법 및 본 명세서에 기술된 세포 배양, 분자 유전학, 유기 화학 및 핵산 화학 및 혼성화에서의 실험 절차는 당분야에서 충분히 공지되어서 일반적으로 적용된다. 핵산 및 펩티드 합성을 위해 표준 기술이 사용된다. 일반적으로, 정제 단계는 제조사의 사양에 따라서 수행된다.

명세서에서, 본 발명의 구현예들이 개시되어 있고, 특정한 용어가 적용되지만, 용어들은 설명적인 의미로만 사용되고 제한의 목적이 아니고, 본 발명의 범주는 하기 청구항에 기재된다. 예시된 구현예는 예의 목적으로만 기재되었고 본 발명을 제한하는 것으로 간주해서는 안된다는 것을 이해해야 한다. 변경, 다른 구현예, 개선, 상세사항, 및 사용은 균등론을 포함하여, 특허법에 따라서 해석되는, 청구항에 의해서만 제한되는, 본 개시의 범주 내에서 본 명세서의 개시의 문자 및 정신과 일관되게 이루어질 수 있다는 것은 당업자에게 자명할 것이다. 하기의 청구항에서, 청구 범위 단계를 지정하는데 사용되는 참조 부호는 단지 설명의 편이를 위해 제공되고, 단계를 수행하기 위한 임의의 특정 순서를 의미하려는 의도가 아니다.

이 문헌 및 이의 청구항에서, 동사 "포함하다" 및 이의 활용형은 단어 뒤에 오는 항목이 포함되지만, 특별히 언급되지 않은 항목을 배제하지 않는다는 것을 의미하는 이의 비제한적인 의미로 사용된다. 본 출원의 전반에서, 동사 "포함하다"는 "이루어지다" 또는 "본질적으로 이루어지다"로 대체될 수 있고, 그 반대도 마찬가지일 수 있다. 또한, 동사 "이루어지다"는 본 명세서에 정의된 바와 같은 조성물이 특별히 확인된 것 이외의 추가적인 성분(들)을 포함할 수 있다는 것을 의미하는 "본질적으로 이루어지다"로 대체될 수 있고, 상기 추가적인 성분(들)은 본 발명의 고유한 특징을 변경시키지 않는다. 또한, 부정 관사 "한" 또는 "하나"에 의한 성분에 대한 참조는 하나 및 오직 하나의 성분이 존재하는 것을 문맥에서 명확하게 요구하지 않으면, 하나 초과의 성분이 존재할 가능성을 배제하지 않는다. 따라서, 부정 관사 "한" 또는 "하나"는 일반적으로 "적어도 하나"를 의미한다.

본 출원 전반에서, 달리 명확하게 명시하지 않으면, 관사 "한" 및 "하나"는 바람직하게 "적어도 2", 보다 바람직하게 "적어도 3", 보다 더 바람직하게 "적어도 4", 보다 더 바람직하게 "적어도 5", 보다 더 바람직하게 "적어도 6", 가장 바람직하게 "적어도 2"로 대체된다.

본 출원 전반에서, 달리 명확하게 명시하지 않으면, "합성하다", "합성된" 및 "합성"의 특성은 각각 "생산하다", "생산된", 및 "생산"의 특성과 상호교환적으로 사용된다.

본 명세서에서 확인되는 각각의 구현예는 달리 표시하지 않으면 함께 조합될 수 있다. 본 명세서에서 언급되는 모든 공개물, 특허, 및 특허 출원은 각각의 개별 공개물, 특허, 또는 특허 출원이 참조로 편입된다고 특별히 개별적으로 표시된 바와 동일한 정도로 참조로 본 명세서에 편입된다.

본 발명에 따라서, 용어 "폴리뉴클레오티드(들)"는 일반적으로 비변형된 RNA 또는 DNA 또는 변형된 RNA 또는 DNA일 수 있는, 임의의 폴리리보뉴클레오티드 또는 폴리데옥시리보뉴클레오티드를 의미한다. "폴리뉴클레오티드(들)"는 제한없이, 단일-가닥 및 이중-가닥 DNA, 단일-가닥 및 이중-가닥 영역 또는 단일-가닥, 이중-가닥 및 삼중-가닥 영역의 혼합물인 DNA, 단일-가닥 및 이중-가닥 RNA, 및 단일-가닥 및 이중-가닥 영역의 혼합물인 RNA, 단일-가닥일 수 있거나, 또는 보다 전형적으로 이중-가닥, 또는 삼중-가닥 영역, 또는 단일-가닥 및 이중-가닥 영역의 혼합물일 수 있는 DNA 및 RNA를 포함하는 하이브리드 분자를 포함한다. 또한, 본 명세서에서 사용되는, "폴리뉴클레오티드"는 RNA 또는 DNA 또는 RNA 및 DNA 둘 모두를 포함하는 삼중-가닥 영역을 의미한다. 이러한 영역에서 가닥은 동일한 분자 또는 상이한 분자 유래일 수 있다. 영역은 하나 이상의 분자 모두를 포함할 수 있지만, 보다 전형적으로 분자 중 일부의 영역만을 포함한다. 삼중-나선 영역의 분자 중 하나는 종종 올리고뉴클레오티드이다. 본 명세서에서 사용되는, 용어 "폴리뉴클레오티드(들)"는 또한 하나 이상의 변형된 염기를 함유하는 상기 기술된 바와 같은 DNA 또는 RNA를 포함한다. 따라서, 안정성 또는 다른 이유로 변형된 골격을 갖는 DNA 또는 RNA는 본 발명에 따른 "폴리뉴클레오티드(들)"이다. 또한, 특정한 염기, 예컨대, 이노신, 또는 변형된 염기, 예컨대 트리틸화된 염기를 포함하는 DNA 또는 RNA는 용어 "폴리뉴클레오티드"에 포괄되는 것으로 이해한다. 매우 다양한 변형이 DNA 및 RNA에 만들어져서 당업자에게 공지된 많은 유용한 목적을 제공한다는 것을 이해할 것이다. 본 명세서에서 적용되는 바와 같은 용어 "폴리뉴클레오티드(들)"는 예를 들어, 단순 및 복합 세포를 포함한, 세포 및 바이러스의 특징적인 DNA 및 RNA의 화학적 형태를 비롯하여, 폴리뉴클레오티드의 화학적, 효소적, 또는 대사적으로 변형된 형태를 포괄한다. 용어 "폴리뉴클레오티드(들)"는 또한 종종 올리고뉴클레오티드(들)라고 하는 짧은 폴리뉴클레오티드를 포괄한다.

"폴리펩티드(들)"는 펩티드 결합 또는 변형된 펩티드 결합을 통해서 서로에게 연결된 둘 이상의 아미노산을 포함하는 임의의 펩티드 또는 단백질을 의미한다. "폴리펩티드(들)"는 일반적으로 펩티드, 올리고펩티드 및 올리고머라고 하는, 짧은 사슬과, 일반적으로 단백질이라고 하는 보다 긴 사슬을 의미한다. 폴리펩티드는 20개 유전자 코딩되는 아미노산 이외의 아미노산을 함유할 수 있다. "폴리펩티드(들)"는 천연 과정, 예컨대 프로세싱 및 다른 번역후 변형에 의해서 뿐만 아니라, 또한 화학적 변형 기술에 의해서 변형된 것들을 포함한다. 이러한 변형은 기초 교재 및 보다 상세한 논문을 비롯하여, 방대한 연구 문헌에서 충분히 설명되고, 당업자에게 충분히 공지되어 있다. 동일 유형의 변형이 소정 폴리펩티드의 몇개 부위에서 동일하거나 또는 다양한 정도로 존재할 수 있다. 더 나아가서, 소정 펩티드는 많은 유형의 변형을 함유할 수 있다. 변형은 펩티드 골격, 아미노산 측쇄, 및 아미노 또는 카르복실 말단을 포함하여, 폴리펩티드의 어느 곳에서도 발생될 수 있다. 변형은 예를 들어, 아세틸화, 아실화, ADP-리보실화, 아미드화, 플라빈의 공유 부착, 헴 모이어티의 공유 부착, 뉴클레오티드 또는 뉴클레오티드 유도체의 공유 부착, 지질 또는 지질 유도체의 공유 부착, 포스파티딜이노시톨의 공유 부착, 가교 결합, 고리화, 디술피드 결합 형성, 탈메틸화, 공유 가교 결합의 형성, 파이로글루타메이트의 형성, 포르밀화, 감마-카르복실화, 글리코실화, GPI 앵커 형성, 히드록실화, 요오드화, 메틸화, 미리스토일화, 산화, 단백질분해 프로세싱, 인산화, 프레닐화, 라세미화, 지질 부착, 술페이트화, 글루탐산 잔기의 감마-카르복실화, 히드록실화 및 ADP-리보실화, 헬레노일화, 단백질에 아미노산의 전달-RNA 매개 첨가, 예컨대, 아르기닐화, 및 유비퀴틴화를 포함한다. 폴리펩티드는 분지되거나 또는 분지되지 않은, 환형 또는 분지형일 수 있다. 환형, 분지형 및 분지된 원형 폴리펩티드는 번역 후 천연 과정에 의할 수 있고, 또한 완전 합성 방법으로도 만들어질 수 있다.

본 명세서에서 사용되는 용어 "폴리펩티드를 코딩하는 폴리뉴클레오티드"는 본 발명의 폴리펩티드를 코딩하는 서열을 포함하는 폴리뉴클레오티드를 포괄한다. 용어는 또한 코딩 및/또는 비-코딩 서열을 함유할 수도 있는 추가 영역과 함께 (예를 들어, 통합된 파지 또는 삽입 서열 또는 편집에 의해 개재됨) 폴리펩티드를 코딩하는 단일 연속 영역 또는 불연속 영역을 포함하는 폴리뉴클레오티드를 포괄한다.

"단리된"은 이의 천연 상태로부터 "인간의 손에 의해" 변경된 것을 의미하는데, 다시 말해서, 자연에서 발생된 경우에, 이의 본래 환경으로부터 변화 또는 제거되었거나, 또는 둘 모두이다. 예를 들어, 살아있는 유기체에 천연적으로 존재하는 폴리뉴클레오티드 또는 폴리펩티드는 "단리된" 것이 아니지만, 본 명세서에서 이 용어가 적용되는 바와 같이, 이의 천연 상태의 공존 물질로부터 분리된 동일한 폴리뉴클레오티드 또는 폴리펩티드는 "단리된" 것이다. 유사하게, "합성"은 본 명세서에서 이 용어가 사용되는 바와 같이, 천연 공급원으로부터 직접적으로 단리된 것이 아니라 합성적으로 생성된 임의 서열을 의미한다. "합성된"은, 본 명세서에서 이 용어가 사용되는 바와 같이, 천연 공급원으로부터 직접적으로 단리된 것이 아니라 임의의 합성적으로 생성된 서열을 의미한다.

세포 또는 숙주 세포에 대해서 본 명세서에서 사용되는 용어 "재조합" 또는 "유전자이식" 또는 "대사적으로 조작된", "유전자 조작된" 또는 "유전자 변형된"은상호교환적으로 사용되고 세포가 이종성 핵산을 복제하거나, 또는 이종성 핵산 (즉, "상기 세포에 대해 외래인" 서열 또는 상기 세포 내 상기 위치 또는 환경에 대해 외래"인 서열)에 의해 코딩되는 펩티드 또는 단백질을 발현하는 것을 의미한다. 이러한 서열은 적어도 하나의 이종성 또는 외생성 유전자로 형질전환된 것으로 설명되거나, 또는 적어도 하나의 이종성 또는 외생성 유전자의 도입을 통해 형질전환된 것으로 설명된다. 대사적으로 조작되거나 또는 재조합 또는 유전자이식되거나 또는 유전자 조작된 세포는 세포의 천연 (비-재조합) 형태 내에서 발견되지 않는 유전자를 함유할 수 있다. 재조합 세포는 또한 세포의 천연 형태에서 발견되는 유전자를 함유하는데, 여기서 유전자는 인공 수단을 통해서 세포에 재-도입된다. 세포의 천연 유전자는 또한 그들이 재조합 세포로 재-도입되기 전에 변형될 수 있다.

이 용어는 또한 변형된 세포에 내생성인 핵산을 함유하거나 또는 이의 발현 또는 활성이 세포로부터 핵산 제거없이 변형된 세포를 포괄하고; 이러한 변형은 유전자 치환, 프로모터의 치환; 부위-특이적 돌연변이; 및 관련 기술을 통해 수득된 것을 포함한다. 따라서, "재조합 폴리펩티드"는 재조합 세포에 의해 생산된 것이다.

이 용어는 또한 당업자에게 일반적으로 충분히 공지된 기술 (예컨대, 예를 들어, 유전자의 녹-아웃)을 통해서 세포에 내생성인 핵산을 제거하여 변형된 세포를 포괄한다.

본 명세서에서 사용되는, "이종성 서열" 또는 "이종성 핵산"은 특정 세포에 외래인 (예를 들어, 상이한 종 유래) 공급원으로부터 기원하거나, 또는 동일한 공급원 유래인 경우에, 게놈 내 이의 본래 형태 또는 위치로부터 변형된 것이다. 따라서, 프로모터에 작동적으로 연결된 이종성 핵산은 프로모터가 유래되는 것과 상이한 공급원 유래이거나, 또는 동일한 공급원인 경우에, 게놈 내 이의 본래 형태 또는 위치로부터 변형된다. 이종성 서열은 숙주 미생물 세포의 게놈으로, 예를 들어, 형질감염, 형질전환, 접합 또는 형질도입을 통해서 안정하게 도입될 수 있고, 기술은 도입시키려는 서열 및 세포에 의존하여서 적용될 수 있다. 다양한 기술들이 당업자에게 공지되어 있는데, 예를 들어, 하기 문헌에 개시되어 있다: Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989). 본 개시의 상황 내에서 사용되는 용어 "돌연변이체" 또는 "조작된" 세포 또는 미생물은 유전자 변형된 세포 또는 미생물을 의미한다.

본 개시의 상황 내에서 용어 "내생성"은 세포의 천연 부분이고 세포 염색체 내 이의 천연 위치에서 발생되는 임의의 폴리뉴클레오티드, 폴리펩티드 또는 단백질 서열을 의미한다. 용어 "외생성"은 연구 중인 세포 밖에서 기원하고, 세포의 천연 일부가 아니거나 또는 세포 염색체 또는 플라스미드 내 이의 천연 위치에서 발생되지 않는 임의의 폴리뉴클레오티드, 폴리펩티드 또는 단백질 서열을 의미한다.

폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드, 또는 효소에 대해서 사용될 때 "이종성"은 공급원 유래이거나 또는 숙주 유기체 이외의 공급원으로부터 유래되는 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드, 또는 효소를 의미한다. 대조적으로, "상동성" 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드, 또는 효소는 숙주 유기체로부터 유래되는 폴리뉴클레오티드, 유전자, 핵산, 폴리펩티드, 또는 효소를 의미하고자 본 명세서에서 사용된다. 유전자 서열을 유지하거나 또는 조작하는데 사용되는 유전자 조절 서열 또는 보조 핵산 서열 (예를 들어, 프로모터, 5' 비번역 영역, 3' 비번역 영역, 폴리A 첨가 서열, 인트론 서열, 스플라이스 부위, 리보솜 결합 부위, 내부 리보솜 진입 서열, 게놈 상동성 영역, 재조합 부위 등)에 대해 언급될 때, "이종성"은 조절 또는 보조 핵산 서열이 구성체, 게놈, 염색체, 또는 에피솜에서 병치되는 유전자와 천연적으로 연관되지 않은 것을 의미한다. 따라서, 이의 천연 상태 (즉, 비-유전자 조작된 유기체의 게놈)에서 작동적으로 연결되지 않은 유전자에 작동적으로 연결된 프로모터는 프로모터가 연결되는 유전자와 동일한 종 (또는 일부 경우에, 동일한 유기체)으로부터 유래될 수 있더라도, 본 명세서에서 "이종성 프로모터"라고 한다.

용어 단백질 또는 효소의 "변형된 활성"은 야생형, 즉 상기 단백질 또는 효소의 천연, 활성과 비교하여 단백질 또는 효소의 활성의 변화에 관한 것이다. 상기 변형된 활성은 단백질 또는 효소의 야생형 활성과 비교하여 상기 단백질 또는 효소의 폐기, 손상, 감소 또는 지연된 활성일 수 있거나 또는 또한 단백질 또는 효소의 야생형 활성과 비교하여 상기 단백질 또는 효소의 가속화되거나 또는 증강된 활성일 수 있다. 단백질 또는 효소의 변형된 활성은 상기 단백질 또는 효소의 변형된 발현에 의해 수득되거나 또는 단백질 또는 효소의 변형된, 즉 돌연변이체 형태의 발현에 의해 수득된다. 효소의 변형된 활성은 또한 효소의 겉보기 미카엘리스 상수 Km 및/또는 겉보기 최대 속도 (Vmax)의 변형과 관련된다.

용어 유전자의 "변형된 발현"은 원하는 화합물의 제조 과정의 임의 단계에서 상기 유전자의 야생형 발현과 비교하여 발현의 변화에 관한 것이다. 상기 변형된 발현은 야생형과 비교하여 더 낮거나 또는 더 높은 발현으로서, 용어 "더 높은 발현"은 또한 내생성 유전자의 경우에 상기 유전자의 "과발현" 또는 야생형 균주에 존재하지 않는 이종성 유전자의 경우에 "발현"으로 정의된다. 더 낮은 발현 또는 감소된 발현은 기능성 최종 생산물을 생산하기 위해 "부족한-능력" (즉, 기능성 야생형 유전자와 비교하여 통계적으로 유의하게 '부족한-능력')이 되거나 또는 완전하게 불능 (예컨대, 유전자 녹-아웃)이 되는 방식으로 유전자를 변화시키는데 사용되는 당업자에게 일반적으로 충분히 공지된 기술 (예컨대, siRNA, CrispR, CrispRi, 리보스위치, 리콤비니어링, 상동성 재조합, ssDNA 돌연변이유발법, RNAi, miRNA, asRNA, 유전자 돌연변이, 유전자 녹-아웃, 트랜스포존 돌연변이유발법 등의 사용)을 통해서 수득된다. 더 낮은 발현이 상기 기술된 바와 같이 수득되는 방식으로 관심 유전자의 변화 다음에, 더 낮은 발현은 또한 전사 단위, 프로모터, 비번역 영역, 리보솜 결합 부위, 샤인 달가르노 서열 또는 전사 종결자를 변화시켜서 수득될 수 있다. 더 낮은 발현 또는 감소된 발현은 예를 들어 프로모터 서열의 하나 이상의 염기쌍을 돌연변이시키거나 또는 프로모터 서열을 야생형과 비교해 더 낮은 발현 강도를 갖는 항상성 프로모터 또는 조절된 발현을 야기하는 유도성 프로모터 또는 조절된 발현을 야기하는 억제성 프로모터로 완전하게 변화시켜서 수득될 수 있다. 과발현 또는 발현은 당업자에게 일반적으로 충분히 공지된 기술을 통해서 수득되며, 상기 유전자는 프로모터 서열, 비번역 영역 서열 (리보솜 결합 서열 또는 샤인 달가르노 서열을 함유), 코딩 서열 및 임의로 전사 종결자가 존재하여 기능성 활성 단백질의 발현을 일으키는 임의 서열과 관련된 "발현 카세트"의 일부이다. 상기 발현은 항상성이거나 또는 조절된다.

용어 "항상성 발현"은 일정 성장 조건 하에서 RNA 폴리머라제의 서브유닛 이외의 전사 인자 (σ⁷⁰, σ⁵⁴, 또는 관련 σ-인자같은 박테리아 시그마 인자 및 RNA 폴리머라제 코어 효소와 공-회합된 효모 미토콘드리아 RNA 폴리머라제 특이성 인자 MTF1을 포함)에 의해 조절되지 않는 발현으로서 정의된다. 이러한 전사 인자의 비제한적인 예는 이.콜라이의 CRP, LacI, ArcA, Cra, IclR, 또는 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae)의 Aft2p, Crz1p, Skn7, 또는 비. 서브틸리스 (B. subtilis)의 DeoR, GntR, Fur이다. RNA 폴리머라제는 DNA 주형으로부터 RNA의 합성을 위한 촉매적 기구이다. RNA 폴리머라제는 특이적 DNA 서열에 결합하여서, 예를 들어 원핵생물 숙주에서 시그마 인자를 통해서, 또는 효모에서 MTF1을 통해 전사를 개시한다. 항상성 발현은 유도 또는 억제 필요없이 일정한 발현 수준을 제공한다.

용어 "비-화학적 유도 또는 억제 시 조건적 발현"은 환경 변화 (예를 들어, 혐기성 또는 호기성 성장, 산화 스트레스, 온도 변화, 예컨대, 예를 들어 열-충격 또는 냉-충격, 삼투압, 빛 조건)에 대한 반응으로서 또는 제한없이 아폽토시스 및 오토파지를 포함한 상기 숙주 세포의 발생 단계 또는 세포 주기의 위치에 의존하여, 숙주의 일정 천연 조건 (예를 들어, 발아 효모의 교배 단계, 박테리아의 정지 단계, 분만 중이거나 또는 수유 중인 유기체)에서만 발현되는 유전자의 선택적 또는 조절적 또는 조율적 발현으로서 정의된다. 조건적 발현은 유전자가 발현되는 때를 제어하도록 허용한다. "비-화학적 유도 또는 억제"는 화학적 화합물의 존재 또는 부재와 관련되지 않은 조율적인 발현으로서 정의된다. 용어 "화학적 화합물"은 탄소 공급원 (글루코스, 알로-락토스, 락토스, 갈락토스, 글리세롤, 아라비노스 포함), 알콜 (메탄올, 에탄올 포함), 산성 화합물 (예컨대, 아세테이트, 포르메이트), IPTG, 금속 이온 (알루미늄, 구리, 아연, 질소 포함), 포스페이트, 방향족 (예컨대, 크실렌)을 포함하는 분자를 의미한다. 기아 및 질소 고갈은 조건적 발현을 일으키는 화학적 억제로서 이해한다.

용어 "제어 서열"은 폴리펩티드로 폴리뉴클레오티드 서열의 전사 및 번역을 허용하는, 세포 전사 및 번역 시스템에 의해 인식되는 서열을 의미한다. 따라서 이러한 DNA 서열은 특정 세포 또는 유기체에서 작동적으로 연결된 코딩 서열의 발현에 필수적이다. 이러한 제어 서열은 프로모터 서열, 리보솜 결합 서열, 샤인 달가르노 서열, 코작 서열, 전사 종결자 서열일 수 있지만, 이에 제한되지 않는다. 예를 들어, 원핵생물에 적합한 제어 서열은 프로모터, 임의로 오퍼레이터 서열, 및 리보솜 결합 부위를 포함한다. 원핵생물 세포는 프로모터, 폴리아데닐화 신호, 및 인핸서를 이용하는 것으로 알려져 있다. 전서열 또는 분비 리더에 대한 DNA는 폴리펩티드의 분비에 관여하는 전단백질로서 발현되는 경우에 폴리펩티드에 대한 DNA에 작동적으로 연결될 수 있고; 프로모터 또는 인핸서는 서열의 전사에 영향을 미치는 경우에 코딩 서열에 작동적으로 연결되거나; 또는 리보솜 결합 부위는 서열의 전사에 미치는 경우에 코딩 서열에 작동적으로 연결되거나; 또는 리보솜 결합 부위는 번역을 촉진하도록 위치되는 경우에 코딩 서열에 작동적으로 연결된다. 상기 제어 서열은 더 나아가서 폴리펩티드로 상기 폴리뉴클레오티드의 전사 또는 변역을 유도하거나 또는 억제하는 유전자 회로를 통해서 또는 유도성 프로모터를 통해서 외부 화학물, 예컨대, 제한없이, IPTG, 아라비노스, 락토스, 알로-락토스, 람노스 또는 푸코스를 사용해 제어될 수 있다.

일반적으로, "작동적으로 연결된"은 연결되는 DNA 서열이 연속적이고, 분비 리더의 경우에, 연속적이고, 판독 상으로 존재한다는 것을 의미한다. 그러나, 인핸서는 연속적일 필요는 없다.

용어 "야생형"은 자연계에서 발생되는 바와 같은 일반적으로 공지된 유전자 또는 표현형 상태를 의미한다.

본 명세서에서 사용되는 용어 "단백질의 변형된 발현"은 i) 내생성 단백질의 더 높은 발현 또는 과발현, ii) 이종성 단백질의 발현, 또는 iii) 야생형 (즉, 천연) 단백질과 비교하여 더 높은 활성을 갖는 변이체 단백질의 발현 및/또는 과발현을 의미한다.

본 명세서에서 사용되는, 용어 "유선 세포(들)"는 일반적으로 유선 상피 세포(들), 유선-상피 내강 세포(들), 또는 포유동물 상피 폐포 세포(들), 또는 이의 임의 조합을 의미한다. 본 명세서에서 사용되는, 용어 "유선-유사 세포(들)"는 일반적으로 천연 유선 세포(들)와 유사한 (또는 실질적으로 유사한) 표현형/유전자형을 갖지만 비-유선 세포 공급원(들)으로부터 유래되는 세포를 의미한다. 이러한 유선-유사 세포(들)는 적어도 하나의 바람직하지 않은 유전자 성분을 제거하고/하거나 유선 세포에 전형적인 적어도 하나의 사전결정된 유전자 구성체를 포함하도록 조작될 수 있다. 유선-유사 세포(들)의 비-제한적인 예는 유선 상피-유사 세포(들), 유선 상피 내강-유사 세포(들), 유선 세포 계통의 세포의 하나 이상의 특징을 나타내는 비-유선 세포(들), 또는 이의 임의 조합을 포함할 수 있다. 유선-유사 세포(들)의 추가적인 비-제한적인 예는 천연 유선 세포(들)와 유사한 (또는 실질적으로 유사한) 표현형을 갖거나, 또는 보다 특히 천연 유선 상피 세포(들)와 유사한 (또는 실질적으로 유사한) 표현형을 갖는 세포(들)를 포함할 수 있다. 천연 유선 세포 또는 유선 상피 세포와 유사한 (또는 실질적으로 유사한) 적어도 하나의 특징을 나타내거나 또는 표현형을 갖는 세포는 적어도 하나의 모유 성분을 발현할 수 있도록 조작되었거나, 또는 천연적으로 나타내는 세포 (예를 들어, 유선 세포 계통 또는 비-유선 세포 계통으로부터 유래됨)를 포함할 수 있다.

본 명세서에서 사용되는, 용어 "비-유선 세포(들)"는 일반적으로 비-유선 계통의 임의 세포를 포함할 수 있다. 본 발명의 상황에서, 비-유선 세포는 적어도 하나의 모유 성분을 발현하도록 조작될 수 있는 임의의 포유동물 세포일 수 있다. 이러한 비-유선 세포(들)의 비제한적인 예는 간세포(들), 혈액 세포(들), 신장 세포(들), 제대혈 세포(들), 상피 세포(들), 표피 세포(들), 근세포(들), 섬유아세포(들), 중간엽 세포(들), 또는 이의 임의 조합을 포함한다. 일부 예에서, 분자 생물학 및 게놈 편집 기술을 조작하여서 무수한 유전자를 동시에 제거하거나, 침묵화시키거나, 또는 약화시킬 수 있다.

출원 전반에서, 달리 명확하게 명시하지 않으면, <동사>할 수 있는" 및 "<동사>하도록 할 수 있는"은 바람직하게 상기 동사의 능동태로 대체되고 그 반대도 마찬가지이다. 예를 들어, "발현할 수 있는"의 표현은 바람직하게 "발현하다"로 대체되고 그 반대도 마찬가지이며, 다시 말해서, "발현하다"는 바람직하게 "발현할 수 있는"으로 대체된다.

본 명세서에서 사용되는 용어로서 "변이체(들)"는 기준 폴리뉴클레오티드 또는 폴리펩티드와 각각 상이하지만 필수 성질은 보유하는 폴리뉴클레오티드 또는 폴리펩티드이다. 폴리뉴클레오티드의 전형적인 변이체는 다른, 기준 폴리뉴클레오티드와 뉴클레오티드 서열이 상이하다. 변이체의 뉴클레오티드 서열에서 변화는 기준 폴리뉴클레오티드에 의해 코딩되는 폴리펩티드의 아미노산 서열은 변경시킬 수 있거나 또는 변경시키지 않을 수 있다. 뉴클레오티드 변화는 하기에 논의되는 바와 같이, 기준 서열에 의해 코딩되는 폴리펩티드에 아미노산 치환, 부가, 결실, 융합 및 절두를 일으킬 수 있다. 폴리펩티드의 전형적인 변이체는 다른, 기준 폴리펩티드와 아미노산 서열이 상이하다. 일반적으로, 차이는 기준 폴리펩티드와 변이체의 서열이 전체적으로 밀접하게 유사하고, 많은 영역에서, 동일하도록 제한적이다. 변이체 및 기준 폴리펩티드는 임의 조합의 하나 이상의 치환, 부가, 결실이 아미노산 서열에서 상이할 수 있다. 치환되거나 또는 삽입된 아미노산 잔기는 유전자 코드에 의해 코딩되는 것일 수 있거나 또는 아닐 수도 있다. 폴리뉴클레오티드 또는 폴리펩티드의 변이체는 천연 발생 예컨대 대립유전자 변이체일 수 있거나, 또는 천연적으로 발생되는 것으로 알려지지 않은 변이체일 수 있다. 폴리뉴클레오티드 및 폴리펩티드의 비천연 발생 변이체는 돌연변이유발법 기술에 의해서, 직접 합성에 의해서, 그리고 당업자에게 공지된 다른 재조합 방법에 의해서 만들어질 수 있다.

본 명세서에서 사용되는 용어 폴리펩티드의 "유도체"는 폴리펩티드의 아미노산 서열 내에 아미노산 잔기의 결실, 부가 또는 치환을 함유할 수 있지만, 침묵화 변화를 일으키므로, 기능적으로 동등한 폴리펩티드를 생산하는 폴리펩티드이다. 아미노산 치환은 관여된 잔기의 극성, 전하, 가용성, 소수성, 친수성, 및/또는 양친매성 성질의 유사성을 기반으로 만들어질 수 있다. 예를 들어, 비극성 (소수성) 아미노산은 알라닌, 류신, 이소류신, 발린, 프롤린, 페닐알라닌, 트립토판, 및 메티오닌을 포함하고; 극성 중성 아미노산은 글리신, 세린, 트레오닌, 시스테인, 티로신, 아스파라긴, 및 글루타민을 포함하고; 양으로 하전된 (염기성) 아미노산은 아르기닌, 리신, 및 히스티딘을 포함하고; 음으로 하전된 (산성) 아미노산은 아스파르트산 및 글루탐산을 포함한다. 본 발명의 상황 내에서, 본 명세서에서 사용되는 유도체 폴리펩티드는 제한없이 효소적 활성을 포함하는, 임의의 다수 기준으로 판단하여 본래 폴리펩티드와 실질적으로 유사한 생체내 활성을 나타낼 수 있고, 번역 동안 또는 그 이후에 차등적으로 변형될 수 있는 폴리펩티드를 의미한다. 더 나아가서, 비-고전적인 아미노산 또는 화학적 아미노산 유사체는 본래 폴리펩티드 서열에 치환 또는 부가로서 도입될 수 있다.

일부 구현예에서, 본 개시는 본 발명에서 사용되는 효소의 구조를 변형시켜서 기능성 변이체를 만드는 것을 고려한다. 변이체는 아미노산 치환, 결실, 부가, 또는 이의 조합에 의해 제조될 수 있다. 예를 들어, 류신을 이소류신 또는 발린으로, 아스파테이트를 글루타메이트로, 트레오닌을 세린으로 단리된 치환, 또는 아미노산을 구조적으로 관련된 아미노산으로의 유사한 치환 (예를 들어, 보존성 돌연변이)은 최종 분자의 생물학적 활성에 대해 주요한 효과를 갖지 않을 것으로 예상하는 것이 타당하다. 보존성 치환은 그들 측쇄와 관련된 아미노산 패밀리 내에서 일어나는 것이다. 본 개시의 폴리펩티드의 아미노산 서열의 변화가 기능성 상동체를 생성시키는지 여부는 야생형 폴리펩티드와 유사한 방식으로 세포에서 반응을 생성시키는 변이체 폴리펩티드의 능력을 평가하여 쉽게 결정될 수 있다.

본 명세서에서 사용되는 용어 "기능성 상동체"는 서열 유사성을 갖고 또한 적어도 하나의 기능적 특징, 예컨대, 생화학적 활성을 공유하는 분자를 설명한다. 기능성 상동체는 전형적으로 유사하지만, 반드시 동일하지는 않은 정도로 동일한 특징을 일으키게 된다. 기능적으로 상동성인 단백질은 한 상동체에 의해 생성되는 정량적 측정이 다른 것의 적어도 10%; 보다 전형적으로, 적어도 20%, 약 30%와 약 40% 사이; 예를 들어, 약 50%와 약 60% 사이; 약 70%와 약 80% 사이; 또는 약 90%와 약 95% 사이; 약 98%와 약 100% 사이, 또는 본래 분자에 의해 생성되는 것의 100% 초과인 동일한 특징을 제공한다. 따라서, 분자가 효소적 활성을 갖는 경우에, 기능성 상동체는 본래 효소와 비교하여 상기-언급된 %의 효소적 활성을 갖게 된다. 분자가 DNA-결합 분자 (예를 들어, 폴리펩티드)인 경우에, 상동체는 본래 분자와 비교하여 결합된 분자의 중량으로 측정하여 상기-언급된 %의 결합 친화성을 갖게 된다.

기능성 상동체 및 기준 폴리펩티드는 천연 발생 폴리펩티드일 수 있고, 서열 유사성은 수렴 또는 분기 진화적 사건에 기인할 수 있다. 때때로 기능성 상동체는 오솔로그라고 하며, 여기서 "오솔로그"는 다른 종에서 기준이 되는 유전자 또는 단백질의 기능적으로 동등한 상동성 유전자 또는 단백질을 의미한다.

기능성 상동체는 뉴클레오티드 및 폴리펩티드 서열 정렬의 분석으로 확인될 수 있다. 예를 들어, 뉴클레오티드 또는 폴리펩티드 서열의 데이터베이스 상에서 조회의 수행은 생물량-조절 폴리펩티드의 상동체를 확인할 수 있다. 서열 분석은 기준 서열로서 생물량-조절 폴리펩티드의 아미노산 서열을 사용하는 비-중복 데이터베이스의 BLAST, 상호 BLAST, 또는 PSI-BLAST 분석을 포함할 수 있다. 아미노산 서열은 일부 예에서, 뉴클레오티드 서열로부터 추론된다. 전형적으로, 40% 초과의 서열 동일성을 갖는 데이터베이스의 폴리펩티드는 생물량-조절 폴리펩티드로서 적합성에 대한 추가 평가를 위한 후보이다. 아미노산 서열 유사성은 보존성 아미노산 치환, 예컨대, 한 소수성 잔기의 다른 것으로의 치환 또는 한 극성 잔기의 다른 것으로의 치환을 허용한다. 원하는 경우에, 이러한 후보의 수동 검사가 추가 평가하려는 후보의 수를 줄이기 위해 수행될 수 있다. 수동 검사는 생산성-조절 폴리펩티드에 존재하는 도메인, 예를 들어, 보존된 기능성 도메인을 갖는 것으로 보이는 후보를 선택하여서 수행될 수 있다.

폴리펩티드에 대한, "단편"은 폴리뉴클레오티드 분자의 클론 또는 임의 부분, 특히 전체 길이 폴리뉴클레오티드 분자의 이용가능한, 기능성 특징을 보유하는 폴리뉴클레오티드의 일부를 의미한다. 유용한 단편은 복제, 전사 또는 번역의 조절에서 또는 혼성화 또는 증폭 기술에서 사용될 수 있는 올리고뉴클레오티드 및 폴리뉴클레오티드를 포함한다. "폴리뉴클레오티드 단편"은 폴리뉴클레오티드 SEQ ID NO, 전형적으로, 본 명세서에서 제공되는 임의의 폴리뉴클레오티드 서열의 적어도 약 9, 10, 11, 12 연속 뉴클레오티드, 예를 들어 적어도 약 30 뉴클레오티드 또는 적어도 약 50 뉴클레오티드의, 임의 하위서열을 의미한다. 예시적인 단편은 추가적으로 또는 대안적으로 폴리펩티드의 보존된 패밀리 도메인을 코딩하는 영역을 포함하거나, 그로 본질적으로 이루어지거나, 또는 그로 이루어지는 단편을 포함할 수 있다. 예시적인 단편은 추가적으로 또는 대안적으로 폴리펩티드의 보존된 도메인을 포함하는 단편을 포함할 수 있다. 이와 같이, 폴리뉴클레오티드 SEQ ID NO의 단편은 바람직하게 상기 폴리뉴클레오티드 SEQ ID NO로서, 200, 150, 100, 50 또는 25개 이하의 연속 뉴클레오티드가 누락되고, 바람직하게 50개 이하의 연속 뉴클레오티드가 누락된 것인 폴리뉴클레오티드 SEQ ID NO를 포함하거나 또는 그로 이루어지고, 통상의 실험을 통해서 당업자가 평가할 수 있는 전체 길이 폴리뉴클레오티드 분자의 사용가능한, 기능적 특징 (예를 들어, 활성)을 보유하는 뉴클레오티드 서열을 의미한다. 대안적으로, 폴리뉴클레오티드 SEQ ID NO의 단편은 바람직하게 상기 폴리뉴클레오티드 SEQ ID NO로부터 연속 뉴클레오티드의 양을 포함하거나 또는 그로 이루어지고, 연속 뉴클레오티드의 상기 양은 상기 폴리뉴클레오티드 SEQ ID NO의 전체 길이의 적어도 50.0%, 60.0%, 70.0%, 80.0%, 81.0%, 82.0%, 83.0%, 84.0%, 85.0%, 86.0%, 87.0%, 88.0%, 89.0%, 90.0%, 91.0%, 92.0%, 93.0%, 94.0%, 95.0%, 95.5%, 96.0%, 96.5%, 97.0%, 97.5%, 98.0%, 98.5%, 99.0%, 99.5%, 100%, 바람직하게 적어도 80.0%, 보다 바람직하게 적어도 87.0%, 보다 더 바람직하게 적어도 90.0%, 보다 더 바람직하게 적어도 95.0%, 가장 바람직하게 적어도 97.0%이고, 전체 길이 폴리뉴클레오티드 분자의 사용가능한, 기능적 특성 (예를 들어, 활성)을 보유하는 뉴클레오티드 서열을 의미한다. 이와 같이, 폴리뉴클레오티드 SEQ ID NO의 단편은 바람직하게 상기 폴리뉴클레오티드 SEQ ID NO를 포함하거나 또는 그로 이루어지고, 연속 뉴클레오티드의 양은 누락되고, 상기 양은 상기 폴리뉴클레오티드 SEQ ID NO의 전체 길이의 50.0%, 40.0%, 30.0% 이하이고, 바람직하게 상기 폴리뉴클레오티드 SEQ ID NO의 전체 길이의 20.0%, 15.0%, 10.0%, 9.0%, 8.0%, 7.0%, 6.0%, 5.0%, 4.5%, 4.0%, 3.5%, 3.0%, 2.5%, 2.0%, 1.5%, 1.0%, 0.5% 이하, 보다 바람직하게 15.0% 이하, 보다 더 바람직하게 10.0% 이하, 보다 더 바람직하게 5.0% 이하, 가장 바람직하게 2.5% 이하인 뉴클레오티드 서열을 의미하고, 상기 단편은 당업자게 통상적으로 평가할 수 있는 전체 길이의 폴리뉴클레오티드 분자의 사용가능한, 기능성 특징 (예를 들어, 활성)을 보유한다.

단편은 추가적으로 또는 대안적으로 폴리펩티드 및 단백질 분자의 하위서열, 또는 폴리펩티드의 하위서열을 포함할 수 있다. 일부 경우에, 단편 또는 도메인은 온전한 폴리펩티드와 실질적으로 동일한 방식으로, 또는 유사한 정도까지, 온전한 폴리펩티드의 적어도 하나의 생물학적 기능을 수행하는 폴리펩티드의 하위서열이다. 본 명세서에 정의된 바와 같은 "폴리펩티드의 하위서열"은 폴리펩티드로부터 유래되는 연속 아미노산 잔기의 서열을 의미한다. 예를 들어, 폴리펩티드 단편은 인식가능한 구조적 모티프 또는 기능적 도메인 예컨대, DNA-결합 부위 또는 DNA 프로모터 영역에 결합하는 도메인, 활성화 도메인, 또는 단백질-단백질 상호작용을 위한 도메인을 포함할 수 있고, 전사를 개시할 수 있다. 단편은 3 아미노산 잔기부터 온전한 폴리펩티드의 전체 길이까지, 예를 들어, 적어도 10 아미노산 잔기 길이, 예를 들어, 적어도 약 20 아미노산 잔기 길이, 예를 들어, 적어도 약 30 아미노산 잔기 길이까지 크기가 다양할 수 있다. 우선적으로, 단편은 유래되는 폴리펩티드의 적어도 하나의 성질 또는 활성을 갖는 기능성 단편이고, 예컨대, 예를 들어, 단편은 폴리펩티드의 기능성 도메인 또는 보존성 도메인을 포함할 수 있다. 이와 같이, 폴리펩티드 SEQ ID NO (또는 UniProt ID)의 단편은 바람직하게 80, 60, 50, 40, 30, 20 또는 15개 이하의 연속 아미노산 잔기가 누락되고, 바람직하게 40 이하의 연속 아미노산 잔기가 누락된 것인 상기 폴리펩티드 SEQ ID NO (또는 UniProt ID)를 포함하거나 또는 그로 이루어지고, 당업자가 통상적으로 평가할 수 있는 온전한 폴리펩티드와 실질적으로 동일한 방식으로, 바람직하게 유사하거나 또는 더 큰 정도까지 온전한 폴리펩티드의 적어도 하나의 생물학적 기능을 수행하는 폴리펩티드 서열을 의미한다. 대안적으로, 폴리펩티드 SEQ ID NO (또는 UniProt ID)의 단편은 바람직하게 상기 폴리펩티드 SEQ ID NO (또는 UniProt ID)로부터 연속 아미노산 잔기의 양을 포함하거나 또는 그로 이루어지고, 연속 아미노산 잔기의 상기 양은 상기 폴리펩티드 SEQ ID NO (또는 UniProt ID)의 전체 길이의 적어도 50.0%, 60.0%, 70.0%, 80.0%, 81.0%, 82.0%, 83.0%, 84.0%, 85.0%, 86.0%, 87.0%, 88.0%, 89.0%, 90.0%, 91.0%, 92.0%, 93.0%, 94.0%, 95.0%, 95.5%, 96.0%, 96.5%, 97.0%, 97.5%, 98.0%, 98.5%, 99.0%, 99.5%, 100%, 바람직하게 적어도 80.0%, 보다 바람직하게 적어도 87.0%, 보다 더 바람직하게 적어도 90.0%, 보다 더 바람직하게 적어도 95.0%, 가장 바람직하게 적어도 97.0%이고, 당업자가 통상적으로 평가할 수 있는 온전한 폴리펩티드와 실질적으로 동일한 방식으로, 바람직하게 유사하거나 또는 더 큰 정도까지 온전한 폴리펩티드의 적어도 하나의 생물학적 기능을 수행하는 폴리펩티드 서열을 의미한다. 이와 같이, 폴리펩티드 SEQ ID NO (또는 UniProt ID)의 단편은 바람직하게 상기 폴리펩티드 SEQ ID NO (또는 UniProt ID)를 포함하거나 또는 그로 이루어지고, 연속 아미노산 잔기의 양이 누락되고, 상기 양은 상기 폴리펩티드 SEQ ID NO (또는 UniProt ID)의 전체 길이의 50.0%, 40.0%, 30.0% 이하, 바람직하게 상기 폴리펩티드 SEQ ID NO (또는 UniProt ID)의 전체 길이의 20.0%, 15.0%, 10.0%, 9.0%, 8.0%, 7.0%, 6.0%, 5.0%, 4.5%, 4.0%, 3.5%, 3.0%, 2.5%, 2.0%, 1.5%, 1.0%, 0.5% 이하, 보다 바람직하게 15.0% 이하, 보다 더 바람직하게 10.0% 이하, 보다 더 바람직하게 5.0% 이하, 가장 바람직하게 2.5% 이하이고, 당업자가 통상적으로 평가할 수 있는 온전한 폴리펩티드와 실질적으로 동일한 방식으로, 바람직하게 유사하거나 또는 더 큰 정도까지 온전한 폴리펩티드의 적어도 하나의 생물학적 기능을 수행하는 폴리펩티드 서열을 의미한다.

출원 전반에서, 폴리펩티드의 서열은 SEQ ID NO 또는 대안적으로 UniProt ID로 표시될 수 있다. 그러므로, 용어 "폴리펩티드 SEQ ID NO" 및 "폴리펩티드 UniProt ID"는 달리 명확하게 명시하지 않으면, 상호교환적으로 사용될 수 있다.

폴리펩티드의 "기능성 단편"은 바람직하게 유사하거나 또는 더 큰 정도까지, 유래되는 폴리펩티드의 적어도 하나의 성질 또는 활성을 갖는다. 기능성 단편은 예를 들어, 폴리펩티드의 기능성 도메인 또는 보존성 도메인을 포함할 수 있다. 폴리펩티드 또는 이의 단편은 폴리펩티드의 활성에 실질적으로 효과를 갖지 않는 보존성 아미노산 치환을 가질 수 있다는 것을 이해한다. 보존성 치환이란 한 소수성 아미노산의 다른 것으로의 치환 또는 한 극성 아미노산의 다른 것으로의 치환 또는 한 산성 아미노산의 다른 것으로의 치환 또는 한 염기성 아미노산의 다른 것으로의 치환 등을 의도한다. 바람직하게, 보존성 치환이란 예컨대, 글리신의 알라닌으로 및 그 반대; 발린, 이소류신 및 류신의 메티오닌으로 및 그 반대; 아스파테이트의 글루타메이트로 및 그 반대; 아스파라긴의 글루타민으로 및 그 반대; 세린의 트레오닌으로 및 그 반대; 리신의 아르기닌으로 및 그 반대; 시스테인의 메티오닌으로 및 그 반대; 및 페닐알라닌 및 티로신의 트립토판으로 및 그 반대와 같은 조합을 의도한다.

본 명세서에서 사용되는 상동성 서열은 서열 유사성을 갖고, 적어도 하나의 기능성 특징, 예컨대, 생화학적 활성을 공유하는 폴리펩티드를 코딩하는 뉴클레오티드 서열을 설명한다. 보다 특히, 본 명세서에서 사용되는 용어 "기능성 상동체"는 서열 유사성 (다른 말로, 상동성)을 갖고, 동시에 적어도 하나의 기능적 유사성 예컨대, 생화학적 활성을 갖는 폴리펩티드를 설명한다 (Altenhoff et al., PLoS Comput. Biol. 8 (2012) e1002514).

상동체는 뉴클레오티드 및 폴리펩티드 서열 정렬의 분석을 통해서 확인될 수 있다. 예를 들어, 뉴클레오티드 또는 폴리펩티드 서열의 데이터베이스 상에서 조회의 수행은 관심 폴리펩티드의 상동체, 예컨대, 예를 들어, 생물량-조절 폴리펩티드, 글리코실트랜스퍼라제, 뉴클레오티드-활성화된 당 합성에 관여되는 단백질 또는 막 수송체 단백질을 확인할 수 있다. 서열 분석은 각각 기준 서열로서, 생물량-조절 폴리펩티드, 글리코실트랜스퍼라제, 뉴클레오티드-활성화된 당 합성에 관여되는 단백질 또는 막 수송체 단백질의 아미노산 서열을 사용하는 비-중복 데이터베이스의 BLAST, 상호 BLAST, 또는 PSI-BLAST 분석을 포함한다. 아미노산 서열은 일부 예에서, 뉴클레오티드 서열로부터 추론된다. 전형적으로, 40% 초과의 서열 동일성을 갖는 데이터베이스의 폴리펩티드는 각각 생물량-조절 폴리펩티드, 글리코실트랜스퍼라제, 뉴클레오티드-활성화된 당 합성에 관여되는 단백질 또는 막 수송체 단백질로서 적합성에 대한 추가 평가를 위한 후보이다. 아미노산 서열 유사성은 보존성 아미노산 치환, 예컨대, 한 소수성 잔기의 다른 것으로의 치환 또는 한 극성 잔기의 다른 것으로의 치환 또는 한 산성 아미노산의 다른 것으로의 치환 또는 한 염기성 아미노산의 다른 것으로의 치환 등을 허용한다. 바람직하게, 보존성 치환이란 예컨대, 글리신의 알라닌으로 및 그 반대; 발린, 이소류신 및 류신의 메티오닌으로 및 그 반대; 아스파테이트의 글루타메이트로 및 그 반대; 아스파라긴의 글루타민으로 및 그 반대; 세린의 트레오닌으로 및 그 반대; 리신의 아르기닌으로 및 그 반대; 시스테인의 메티오닌으로 및 그 반대; 및 페닐알라닌 및 티로신의 트립토판으로 및 그 반대같은 조합을 의도한다. 원하는 경우에, 이러한 후보의 수동 검사는 추가 평가하려는 후보의 수를 줄이기 위해 수행될 수 있다. 수동 검사는 생산성-조절 폴리펩티드에 존재하는 도메인, 예를 들어, 보존된 기능성 도메인을 갖는 것으로 보이는 후보를 선택하여 수행될 수 있다.

도메인은 예를 들어, Pfam (El-Gebali et al., Nucleic Acids Res. 47 (2019) D427-D432), 단백질 핑거프린트 도메인 (PRINTS) (Attwood et al., Nucleic Acids Res. 31 (2003) 400-402), SUBFAM 도메인 (Gough et al., J. Mol. Biol. 313 (2001) 903-919), TIGRFAM 도메인 (Selengut et al., Nucleic Acids Res. 35 (2007) D260-D264), 보존 도메인 데이터베이스 (CDD) (https://www.ncbi.nlm.nih.gov/cdd) (Lu et al., Nucleic Acids Res. 48 (2020) D265-D268) 지정, PTHR 도메인 (http://www.pantherdb.org) (Mi et al., Nucleic Acids. Res. 41 (2013) D377-D386; Thomas et al., Genome Research 13 (2003) 2129-2141), IPR (InterPro 도메인) (Mitchell et al., Nucleic Acids Res. 47 (2019) D351-D360) 또는 PATRIC 식별자 또는 PATRIC DB 글로벌 패밀리 도메인 (https://www.patricbrc.org/) (Davis et al., Nucleic Acids Res. 48(D1) (2020) D606-D612)를 통해서 특징규명될 수 있다.

PANTHER (Protein　ANalysis　THrough　Evolutionary　Relationships) 분류 체계는 고처리량 분석을 용이하게 하기 위해서 단백질 (및 그들 유전자)을 분류하도록 디자인되었다. 단백질은 다음에 따라서 분류되었다: (a) 패밀리 및 서브패밀리: 패밀리는 진화적으로 관련된 단백질의 그룹이고; 서브패밀리는 또한 동일한 기능을 갖는 관련 단백질이다; (b) 분자적 기능: 생화학적 수준에서 직접 상호작용하는 단백질, 예를 들어 단백질 키나제와 함께 또는 단백질 그 자체의 기능; (c) 생물학적 과정: 세포 또는 유기체의 수준에서 과정, 예를 들어 유사분열을 수행하도록 상호작용하는 단백질의 더 큰 네트워크의 상황에서 단백질의 기능; (d) 경로: 생물학적 과정과 유사하지만, 또한 상호작용 분자 간 관계를 명시적으로 지정하는 경로.

InterPro는 그들을 패밀리로 분류하고 도메인 및 중요한 부위를 예측하여 단백질의 기능적 분석을 제공한다. 이러한 방식으로 단백질을 분류하기 위해서, InterPro는 InterPro 컨소시움을 구성하는 몇몇 상이한 데이터베이스 (구성원 데이터베이스라고함)에 의해 제공되는, 서명이라고 알려진 예측 모델을 사용한다. 이들 구성원 데이터베이스로부터의 단백질 서명은 단일한 검색가능한 소스로 결합되어서, 그들의 개별 강도를 활용하여 강력한 통합 데이터베이스 및 진단 도구를 생성한다.

각 데이터베이스의 내용은 각 배포에서 고정되고 변화되지 않는다. 특정 데이터베이스의 내용이 변화되면, 이러한 특정 데이터베이스는 새로운 배포일을 갖는 새로운 배포 형태를 받는다. 그들의 해당 배포일 및 이들 특정 배포일에 주석달린 특정 내용을 갖는 각 데이터베이스에 대한 모든 배포 형태가 입수가능하고 당업자에게 공지되어 있다. 본 명세서에서 사용되는 PANTHER (PTHR) 데이터베이스 (http://www.pantherdb.org)는 2020-09-10에 배포된 PANTHER 15.0이다. 본 명세서에서 사용되는 InterPro 데이터베이스 (http://ebi.ac.uk/interpro)는 2020-10-08에 배포된 InterPro 82.0이다.

단백질 또는 폴리펩티드 서열 정보 및 기능적 정보는 단백질 서열 및 주석 데이터에 대한 종합 리소스 예컨대, 예를 들어 Universal Protein Resource (UniProt) (www.uniprot.org) (Nucleic Acids Res. 2021, 49(D1), D480-D489)에 의해 제공될 수 있다. UniProt는 UniProt Reference Clusters (UniRef) 및 UniProt Archive (UniParc)와 함께, UniProt Knowledgebase (UniProtKB)라고 불리는 전문적이고 풍부하게 선별된 단백질 데이터베이스를 포함한다. UniProt 식별자 (UniProt ID)는 데이터베이스에 존재하는 각 단백질에 대해 고유하다.

둘 이상의 핵산 또는 폴리펩티드 서열의 상황에서 용어 "동일한" 또는 "퍼센트 동일성" 또는 "% 동일성"은 서열 비교 알고리즘을 사용하거나 또는 육안 검사를 통해 측정하여, 최대 상응도를 위해 비교 및 정렬될 때, 동일한 아미노산 잔기 또는 뉴클레오티드의 명시된 %를 갖거나 또는 동일한 둘 이상의 서열 또는 하위서열을 의미한다. 서열 비교를 위해서, 한 서열은 시험 서열이 비교되는 기준 서열로서 작용한다. 서열 비교 알고리즘을 사용할 때, 시험 및 기준 서열은 컴퓨터에 입력되고, 하위서열 좌표가 필요한 경우 지정되고, 서열 알고리즘 프로그램 매개변수가 지정된다. 서열 비교 알고리즘은 지정된 프로그램 매개변수를 기반으로, 기준 서열에 대해서 시험 서열(들)에 대한 서열 동일성%를 계산한다. 서열 동일성의 %는 바람직하게 2개 서열의 정렬 및 더 짧은 서열의 잔기 개수로 나눈 동일한 잔기를 갖는 위치의 개수 x100의 확인에 의해 결정된다. 동일성은 소정 SEQ ID NO, 즉 기준 서열의 전체 길이 서열 상에서 전반적으로 계산되어서, 전체 동일성% 점수를 생성시킬 수 있다. 대안적으로, %동일성은 기준 서열의 부분 서열 상에서 계산되어서, 국소 동일성% 점수를 생성시킬 수 있다. 부분 서열은 바람직하게 전체 길이 기준 서열의 적어도 50%, 60%, 70%, 80%, 90% 또는 95%를 의미한다. 다른 바람직한 구현예에서, 기준 폴리펩티드 서열의 부분 서열은 적어도 200 아미노산 잔기 내지 기준 폴리펩티드 서열의 아미노산 잔기의 총 개수까지 범위를 의미한다. 국소 서열 정렬에서 기준 서열의 전체 길이 사용은 시험 및 기준 서열 간에 전체 동일성% 점수를 생성시킨다. % 동일성은 상이한 알고리즘 예컨대, 예를 들어, BLAST 및 PSI-BLAST (Altschul et al., 1990, J Mol Biol 215:3, 403- 410; Altschul et al., 1997, Nucleic Acid Res 25: 17, 3389-402), Clustal Omega 방법 (Sievers et al., 2011, Mol. Syst. Biol. 7:539), MatGAT 방법 (Campanella et al., 2003, BMC Bioinformatics, 4:29) 또는 EMBOSS Needle (https://galaxy-iuc.github.io/emboss-5.0-docs/needle.html)을 사용해 결정될 수 있다.

BLAST (Basic Local Alignment Search Tool)) 정렬 방법은 디폴트 매개변수를 사용해 서열을 비교하기 위해 NCBI (National Center for Biotechnology Information)가 제공하는 알고리즘이다. 이 프로그램은 뉴클레오티드 또는 단백질 서열을 서열 데이터베이스와 비교하여 통계적 유의성을 계산한다. PSI-BLAST (Position-Specific Iterative Basic Local Alignment Search Tool)는 단백질-단백질 BLAST (BLASTp)를 사용해 상기 소정 점수 한계치 이상에서 검출되는 서열의 다수 서열 정렬로부터 위치-특이적 채점 매트릭스 (PSSM) 또는 프로파일을 유도시킨다. BLAST 방법은 쌍별 또는 다수 서열 정렬에 사용될 수 있다. 쌍별 서열 정렬은 2개 생물학적 서열 (단백질 또는 핵산) 간에 기능적, 구조적 및/또는 진화적 관계를 의미할 수 있는 유사성의 영역을 확인하는데 사용된다. BLAST에 대한 웹 인터페이스는 https://blast.ncbi.nlm.nih.gov/Blast.cgi에서 입수가능하다.

Clustal Omega (Clustal Ω)는 3개 이상의 서열 간에 정렬을 생성시키기 위해서 씨딩된 가이드 트리 및 HMM 프로파일-프로파일 기술을 사용하는 다수 서열 정렬 프로그램이다. 분기 서열의 생물학적으로 의미있는 다수 서열 정렬을 생성시킨다. Clustal Ω에 대한 웹 인터페이스는 https://www.ebi.ac.uk/Tools/msa/clustalo/에서 입수가능하다. Clustal Ω를 사용하는 다수 서열 정렬에 대한 디폴트 매개변수 및 단백질 서열의 % 동일성의 계산은 입력 서열의 탈-정렬 활성화: FALSE; mbed-유사 클러스터링 가이드-트리 활성화: TRUE; mbed-유사 클러스터링 반복 활성화: TRUE; (조합된 가이드-트리/HMM) 반복 횟수: 디폴트(0); 최대 가이드 트리 반복: 디폴트 [-1]; 최대 HMM 반복: 디폴트 [-1]; 순서: 정렬됨.

MatGAT (Matrix Global Alignment Tool)는 데이터의 사전 정렬 필요없이 DNA 또는 단백질 서열에 대한 유사성/동일성 매트릭스를 생성하는 컴퓨터 어플리케이션이다. 프로그램은 Myers 및 Miller 글로벌 정렬 알고리즘을 사용하여 일련의 쌍별 정렬을 수행하고, 유사성 및 동일성을 계산한 다음에, 그 결과를 거리 매트릭스에 배치한다. 사용자는 그들 단백질 서열 검사에 사용하기 위한 정렬 매트릭스 (예를 들어, BLOSUM50, BLOSUM62, 및 PAM250) 유형을 지정할 수 있다.

EMBOSS Needle (https://galaxy-iuc.github.io/emboss-5.0-docs/needle.html)은 그들의 전체 길이를 고려했을 때 2개 서열의 최적 정렬 (갭 포함)를 찾기 위해 Needleman-Wunsch 글로벌 정렬 알고리즘을 사용한다. 최적 정렬은 모든 가능한 정렬을 탐색하고 최상을 선택하여서 동적 프로그래밍 방법으로 보장된다. Needleman-Wunsch 알고리즘은 최상의 점수를 계산하고 mn 단계 (여기서 'n' 및 'm'은 2개 서열의 길이임)의 순서로 정렬할 수 있는 알고리즘 클래스의 구성원이다. 갭 개방 패널티 (디폴트 10.0)는 갭이 생성될 때 제거되는 점수이다. 디폴트 값은 단백질 서열에 대해 EBLOSUM62 매트릭스를 사용하는 것으로 가정한다. 갭 연장 (디폴트 0.5) 패널티는 갭에서 각각의 염기 또는 잔기에 대한 표준 갭 패널티에 첨가된다. 이것은 얼마나 긴 갭이 패널티를 받는가이다.

본 발명의 목적을 위해서, % 동일성은 MatGAT2.01를 사용해 결정된다 (Campanella et al., 2003, BMC Bioinformatics 4:29). 단백질에 대해서 하기 디폴트 매개변수가 적용된다: (1) 갭 비용 존재: 12 및 확장: 2; (2) 적용된 매트릭스는 BLOSUM65였다.

본 명세서에서 사용되는 용어 "글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제"는 D-프룩토스-6-포스페이트 + L-글루타민의 D-글루코사민-6-포스페이트 + L-글루타메이트로의 전환을 촉매하는 효소를 의미한다. 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제는 헥소사민 생합성 경로의 제1 및 속도-제한 효소이다. 헥소사민 경로의 최종 생산물은 UDP-N-아세틸글루코사민 또는 UDP-GlcNAc이다. 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제는 PANTHER 분류 체계 (www.pantherdb.org)에서 주석달린 바와 같은 PTHR10937 도메인의 존재 또는 InterPro 분류 체계 (https://www.ebi.ac.uk/interpro/entry/InterPro/IPR005855/)에서 주석달린 바와 같은 IPR005855 도메인의 존재를 특징으로 한다. 이러한 유형의 효소에 대한 대체 명칭은 글루타민--프룩토스-6-포스페이트 트랜사미나제 (이성질체화), D-프룩토스-6-포스페이트 아미도트랜스퍼라제, GlcN6P 신타제, 글루코사민 6-포스페이트 신타제, 글루코사민-6-포스페이트 이소머라제 (글루타민-형성), 글루코사민포스페이트 이소머라제, 헥소스포스페이트 아미노트랜스퍼라제, 글루코사민-6-포스페이트 신타제, L-글루타민-D-프룩토스-6-포스페이트 아미도트랜스퍼라제 및 L-글루타민:D-프룩토스-6-포스페이트 이소머라제 (탈아미노화)를 포함한다. 본 명세서에서 사용되는 용어 "GFA1" 및 "GFAT"는 상호교환적으로 사용되고 예를 들어, 에스. 세레비지아에 (S. cerevisiae), 칸디다 알비칸스 (Candida albicans), 스키조사카로마이세스 폼베 (Schizosaccharomyces pombe), 및 스포로트릭스 스켄크키 (Sporothrix schenckii)에서 발견되는 바와 같은 효모 및 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 의미한다. 용어 "glmS"는 GFA1의 유사체이고, 예를 들어, 이.콜라이 K-12 균주, 이.콜라이 O6:H1, 이.콜라이 O157:H7, 파스퇴렐라 멀토시다 (Pasteurella multocida) 및 네이세리아 메닌지티디스 (Neisseria meningitidis) 혈청군 B (균주 MC58)에서 발견되는 바와 같은 원핵생물 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 의미한다.

글루코사민 6-포스페이트 N-아세틸트랜스퍼라제는 아세틸-CoA로부터 D-글루코사민-6-포스페이트로 아세틸 기의 전달을 촉매하여서 유리 CoA 및 N-아세틸-D-글루코사민 6-포스페이트를 생성시키는 효소이다. 대체 명칭은 아미노데옥시글루코스포스페이트 아세틸트랜스퍼라제, D-글루코사민-6-P N-아세틸트랜스퍼라제, 글루코사민 6-포스페이트 아세틸라제, 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제, 글루코사민-6-포스페이트 아세틸라제, N-아세틸글루코사민-6-포스페이트 신타제, 포스포글루코사민 아세틸라제, 포스포글루코사민 N-아세틸라제, 포스포글루코사민 트랜스아세틸라제, GNA 및 GNA1을 포함한다. 포스포아세틸글루코사민 뮤타제는 N-아세틸-D-글루코사민 6-포스페이트의 N-아세틸-D-글루코사민-1-포스페이트로의 전환을 촉매하는 효소이다. 대체 명칭은 PAGM, 아세틸글루코사민 포스포뮤타제, N-아세틸글루코사민-포스페이트 뮤타제 및 PGM-보완 단백질 1을 포함한다. UDP-N-아세틸글루코사민 파이로포스포릴라제는 N-아세틸-D-글루코사민 1-포스페이트로부터 UDP-N-아세틸-D-글루코사민의 합성에 관여되는 효소이다. 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제는 베타 1,3 연결로 갈락토스 단위에 UDP-GlcNAc의 전달을 촉매하는 효소이다. UTP--글루코스-1-포스페이트 우리딜릴트랜스퍼라제는 글루코스-1-포스페이트 및 UTP로부터 UDP-글루코스를 합성하는 효소이다. 대체 명칭은 알파-D-글루코실-1-포스페이트 우리딜릴트랜스퍼라제, UDP-글루코스 파이로포스포릴라제, UDPGP 및 우리딘 디포스포글루코스 파이로포스포릴라제를 포함한다. UDP-글루코스 4-에피머라제는 UDP-갈락토스로 UDP-글루코스의 가역적 전환을 촉매하는 효소이다. 대체 명칭은 갈락토발데나제 및 UDP-갈락토스 4-에피머라제를 포함한다. N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제는 베타 1,3-연결로 글리칸 사슬 중 말단 GlcNAc 잔기로 UDP-갈락토스 도너로부터 갈락토스의 전달을 촉매하는 효소이다. N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제는 베타 1,4-연결로 글리칸 사슬 중 말단 GlcNAc 잔기로 UDP-갈락토스 도너로부터 갈락토스의 전달을 촉매하는 효소이다. 락토스 퍼미아제는 락토스의 통과를 촉진하는 막 단백질이다. UDP-N-아세틸글루코사민 2-에피머라제 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스 2-에피머라제는 UDP-N-아세틸만노사민 (UDP-ManNAc)으로 UDP-N-아세틸글루코사민 (UDP-GlcNAc)의 가역적 전환을 촉매하는 효소이다. N-아세틸뉴라미네이트 신타제 또는 N-아세틸뉴라민산 신타제는 N-아세틸뉴라미네이트 (또는 시알산, Neu5Ac)로 N-아세틸만노사민 (ManNAc)의 전환을 촉매하는 효소이다. N-아실뉴라미네이트 시티딜릴트랜스퍼라제는 CMP-N-아세틸뉴라민산 또는 CMP-Neu5Ac로 N-아세틸뉴라미네이트의 전환을 촉매하는 효소이다. 대체 명칭은 CMP-N-아세틸뉴라민산 신타제 및 CMP-NeuNAc 신타제를 포함한다. 글루코스-6-포스페이트 이소머라제는 글루코스-6-포스페이트 및 프룩토스-6-포스페이트의 상호전환을 촉매하는 효소이다. 대체 명칭은 포스포글루코스 이소머라제/포스포글루코이소머라제　(PGI) 및　포스포헥소스 이소머라제　(PHI)를 포함한다.

본 명세서에서 사용되는 용어 "글리코실트랜스퍼라제"는 활성화된 도너 분자로부터 특이적 억셉터 분자로 당 모이어티의 전달을 촉매할 수 있어서, 글리코시드 결합을 형성하는 효소를 의미한다. 이와 같이 합성된 올리고당은 선형 또는 분지형일 수 있고, 다수의 단당 빌딩 블록을 함유할 수 있다. 뉴클레오티드 디포스포-당, 뉴클레오티드 모노포스포-당 및 당 포스페이트를 사용하는 글리코실트랜스퍼라제 및 관련 단백질의 별기 서열-기반 패밀리로의 분류가 기술되어 있고 (Campbell et al., Biochem. J. 326, 929-939 (1997)), CAZy (CArbohydrate-Active EnZymes) 웹사이트 (www.cazy.org)에서 입수가능하다.

본 명세서에서 사용되는 글리코실트랜스퍼라제는 푸코실트랜스퍼라제, 시알릴트랜스퍼라제, 갈락토실트랜스퍼라제, 글루코실트랜스퍼라제, 만노실트랜스퍼라제, N-아세틸글루코사미닐트랜스퍼라제, N-아세틸갈락토사미닐트랜스퍼라제, N-아세틸만노사미닐트랜스퍼라제, 자일로실트랜스퍼라제, 글루쿠로닐트랜스퍼라제, 갈락투로닐트랜스퍼라제, 글루코사미닐트랜스퍼라제, N-글리코릴뉴라미닐트랜스퍼라제, 람노실트랜스퍼라제, N-아세틸람노실트랜스퍼라제, UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제 및 푸코사미닐트랜스퍼라제를 포함하지만 이에 제한되지 않는 목록으로부터 선택될 수 있다.

푸코실트랜스퍼라제는 GDP-푸코스 (GDP-Fuc) 도너로부터 글리칸 억셉터로 푸코스 잔기 (Fuc)를 전달하는 글리코실트랜스퍼라제이다. 푸코실트랜스퍼라제는 알파-글리코시드 결합을 통해서 GDP-Fuc로부터 글리칸 억셉터로 Fuc 잔기의 전달을 촉매하는 알파-1,2-푸코실트랜스퍼라제, 알파-1,3-푸코실트랜스퍼라제, 알파-1,3/4-푸코실트랜스퍼라제, 알파-1,4-푸코실트랜스퍼라제 및 알파-1,6-푸코실트랜스퍼라제를 포함한다. 푸코실트랜스퍼라제는 GT10, GT11, GT23, GT65 및 GT68 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 시알릴트랜스퍼라제는 시알릴 기 (예컨대 Neu5Ac 또는 Neu5Gc)를 도너 (예컨대 CMP-Neu5Ac 또는 CMP-Neu5Gc)로부터 글리칸 억셉터에 전달하는 글리코실트랜스퍼라제이다. 시알릴트랜스퍼라제는 알파-글리코시드 결합을 통해 글리칸 억셉터로 시알릴 기의 전달을 촉매하는 알파-2,3-시알릴트랜스퍼라제, 알파-2,6-시알릴트랜스퍼라제 및 알파-2,8-시알릴트랜스퍼라제를 포함한다. 시알릴트랜스퍼라제는 GT29, GT42, GT80 및 GT97 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 갈락토실트랜스퍼라제는 갈락토실 기 (Gal)를 UDP-갈락토스 (UDP-Gal) 도너로부터 글리칸 억셉터에 전달하는 글리코실트랜스퍼라제이다. 갈락토실트랜스퍼라제는 알파- 또는 베타-글리코시드 결합을 통해 글리칸 억셉터에 UDP-Gal로부터 Gal 잔기를 전달하는 베타-1,3-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제, 베타-1,4-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제, 알파-1,3-갈락토실트랜스퍼라제 및 알파-1,4-갈락토실트랜스퍼라제를 포함한다. 갈락토실트랜스퍼라제는 GT2, GT6, GT8, GT25 및 GT92 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 글루코실트랜스퍼라제는 글루코실 기 (Glc)를 UDP-글루코스 (UDP-Glc) 도너로부터 글리칸 억셉터에 전달하는 글리코실트랜스퍼라제이다. 글루코실트랜스퍼라제는 알파- 또는 베타-글리코시드 결합을 통해 글리칸 억셉터로 UDP-Glc로부터 Glc 잔기를 전달하는 알파-글루코실트랜스퍼라제, 베타-1,2-글루코실트랜스퍼라제, 베타-1,3-글루코실트랜스퍼라제 및 베타-1,4-글루코실트랜스퍼라제를 포함한다. 글루코실트랜스퍼라제는 GT1, GT4 및 GT25 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 만노실트랜스퍼라제는 만노스 기 (Man)를 GDP-만노스 (GDP-Man) 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 만노실트랜스퍼라제는 알파-글리코시드 결합을 통해 글리칸 억셉터로 GDP-Man으로부터 Man 잔기를 전달하는 알파-1,2-만노실트랜스퍼라제, 알파-1,3-만노실트랜스퍼라제 및 알파-1,6-만노실트랜스퍼라제를 포함한다. 만노실트랜스퍼라제는 GT22, GT39, GT62 및 GT69 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. N-아세틸글루코사미닐트랜스퍼라제는 N-아세틸글루코사민 기 (GlcNAc)를 UDP-N-아세틸글루코사민 (UDP-GlcNAc) 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. N-아세틸글루코사미닐트랜스퍼라제는 GT2 및 GT4 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제는 N-아세틸글루코사미닐트랜스퍼라제의 일부이고, 베타-1,3-연결을 통해서 기질에 존재하는 말단 갈락토스 단위로 UDP-GlcNAc 도너로부터 GlcNAc를 전달한다. 베타-1,6-N-아세틸글루코사미닐트랜스퍼라제는 베타-1,6-연결을 통해서 기질에 UDP-GlcNAc 도너로부터 GlcNAc를 전달하는 N-아세틸글루코사미닐트랜스퍼라제이다. N-아세틸갈락토사미닐트랜스퍼라제는 N-아세틸갈락토사민 기 (GalNAc)를 UDP-N-아세틸갈락토사민 (UDP-GalNAc) 도너로부터 글리칸 억셉터에 전달하는 글리코실트랜스퍼라제이다. N-아세틸갈락토사미닐트랜스퍼라제는 GT7, GT12 및 GT27 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 알파-1,3-N-아세틸갈락토사미닐트랜스퍼라제는 N-아세틸갈락토사미닐트랜스퍼라제의 일부이고, 알파-1,3-연결을 통해서 UDP-GalNAc 도너로부터 기질로 GalNAc를 전달한다. N-아세틸만노사미닐트랜스퍼라제는 N-아세틸만노사민 기 (ManNAc)를 UDP-N-아세틸만노사민 (UDP-ManNAc) 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 자일로실트랜스퍼라제는 자일로스 잔기 (Xyl)를 UDP-자일로스 (UDP-Xyl) 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 자일로실트랜스퍼라제는 GT14, GT61 및 GT77 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 글루쿠로닐트랜스퍼라제는 알파- 또는 베타-글리코시드 결합을 통해서 UDP-글루쿠로네이트 도너로부터 글리칸 억셉터로 글루쿠로네이트를 전달하는 글리코실트랜스퍼라제이다. 글루쿠로닐트랜스퍼라제는 GT4, GT43 및 GT93 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. 갈락투로닐트랜스퍼라제는 갈락투로네이트를 UDP-갈락투로네이트 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. N-글리코릴뉴라미닐트랜스퍼라제는 N-글리코릴뉴라민산 기 (Neu5Gc)를 CMP-Neu5Gc 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 람노실트랜스퍼라제는 람노스 잔기를 GDP-람노스 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. 람노실트랜스퍼라제는 GT1, GT2 및 GT102 CAZy 패밀리에서 찾을 수 있지만, 이에 제한되지 않는다. N-아세틸람노실트랜스퍼라제는 N-아세틸람노사민 잔기를 UDP-N-아세틸-L-람노사민 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다. UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제는 플라젤린을 변형시키는데 사용되는 시알산-유사 당인, 슈다민산의 생합성에서 UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스를 사용하는 글리코실트랜스퍼라제이다. UDP-N-아세틸글루코사민 에놀피루빌 트랜스퍼라제 (murA)는 에놀피루빌 기를 포스포에놀피루베이트 (PEP)로부터 UDP-N-아세틸글루코사민 (UDPAG)으로 전달하여 UDP-N-아세틸글루코사민 에놀피루베이트를 형성하는 글리코실트랜스퍼라제이다. 푸코사미닐트랜스퍼라제는 N-아세틸푸코사민 잔기를 dTDP-N-아세틸푸코사민 또는 UDP-N-아세틸푸코사민 도너로부터 글리칸 억셉터로 전달하는 글리코실트랜스퍼라제이다.

용어 "뉴클레오티드-당", "활성화된 당", "뉴클레오시드", "활성화된 단당", "뉴클레오티드-활성화된 당" 또는 "뉴클레오티드 도너"는 본 명세서에서 상호교환적으로 사용되고, 단당의 활성화된 형태를 의미한다. 활성화된 단당의 예는 UDP-N-아세틸글루코사민 (UDP-GlcNAc), UDP-N-아세틸갈락토사민 (UDP-GalNAc), UDP-N-아세틸만노사민 (UDP-ManNAc), UDP-글루코스 (UDP-Glc), UDP-갈락토스 (UDP-Gal), GDP-만노스 (GDP-Man), UDP-글루쿠로네이트, UDP-갈락투로네이트, UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, UDP-2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, UDP-N-아세틸-L-람노사민 (UDP-L-RhaNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-만노스), dTDP-N-아세틸푸코사민, UDP-N-아세틸푸코사민 (UDP-L-FucNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-갈락토스), UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAC 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스), UDP-N-아세틸무람산, UDP-N-아세틸-L-퀴노보사민 (UDP-L-QuiNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-글루코스), GDP-L-퀴노보스, CMP-시알산 (CMP-Neu5Ac 또는 CMP-N-아세틸뉴라민산), CMP-Neu4Ac, CMP-Neu5Ac9N₃, CMP-Neu4,5Ac₂, CMP-Neu5,7Ac₂, CMP-Neu5,9Ac₂, CMP-Neu5,7(8,9)Ac₂, CMP-N-글리코릴뉴라민산 (CMP-Neu5Gc), GDP-푸코스 (GDP-Fuc), GDP-람노스 및 UDP-자일로스를 포함하지만, 이에 제한되지 않는다. 뉴클레오티드-당은 글리코실화 반응에서 글리코실 도너로서 작용한다. 글리코실화 반응은 글리코실트랜스퍼라제에 의해 촉매되는 반응이다.

본 명세서에서 사용되는 용어 "단당"은 가수분해에 의해서 더 단순한 당으로 분해될 수 없고, 알도스 또는 케토스로 분류되며, 분자 당 하나 이상의 히드록실 기를 함유하는 당을 의미한다. 단당은 오직 하나의 단순 당을 함유하는 당류이다. 단당의 예는 헥소스, D-글루코피라노스, D-갈락토푸라노스, D-갈락토피라노스, L-갈락토피라노스, D-만노피라노스, D-알로피라노스, L-알트로피라노스, D-굴로피라노스, L-이도피라노스, D-탈로피라노스, D-리보푸라노스, D-리보피라노스, D-아라비노푸라노스, D-아라비노피라노스, L-아라비노푸라노스, L-아라비노피라노스, D-자일로피라노스, D-릭소피라노스, D-에리트로푸라노스, D-트레오푸라노스, 헵토스, L-글리세로-D-만노-헵토피라노스 (LDmanHep), D-글리세로-D-만노-헵토피라노스 (DDmanHep), 6-데옥시-L-알트로피라노스, 6-데옥시-D-굴로피라노스, 6-데옥시-D-탈로피라노스, 6-데옥시-D-갈락토피라노스, 6-데옥시-L-갈락토피라노스, 6-데옥시-D-만노피라노스, 6-데옥시-L-만노피라노스, 6-데옥시-D-글루코피라노스, 2-데옥시-D-아라비노-헥소스, 2-데옥시-D-에리트로-펜토스, 2,6-디데옥시-D-아라비노-헥소피라노스, 3,6-디데옥시-D-아라비노-헥소피라노스, 3,6-디데옥시-L-아라비노-헥소피라노스, 3,6-디데옥시-D-자일로-헥소피라노스, 3,6-디데옥시-D-리보-헥소피라노스, 2,6-디데옥시-D-리보-헥소피라노스, 3,6-디데옥시-L-자일로-헥소피라노스, 2-아미노-2-데옥시-D-글루코피라노스, 2-아미노-2-데옥시-D-갈락토피라노스, 2-아미노-2-데옥시-D-만노피라노스, 2-아미노-2-데옥시-D-알로피라노스, 2-아미노-2-데옥시-L-알트로피라노스, 2-아미노-2-데옥시-D-굴로피라노스, 2-아미노-2-데옥시-L-이도피라노스, 2-아미노-2-데옥시-D-탈로피라노스, 2-아세타미도-2-데옥시-D-글루코피라노스, 2-아세타미도-2-데옥시-D-갈락토피라노스, 2-아세타미도-2-데옥시-D-만노피라노스, 2-아세타미도-2-데옥시-D-알로피라노스, 2-아세타미도-2-데옥시-L-알트로피라노스, 2-아세타미도-2-데옥시-D-굴로피라노스, 2-아세타미도-2-데옥시-L-이도피라노스, 2-아세타미도-2-데옥시-D-탈로피라노스, 2-아세타미도-2,6-디데옥시-D-갈락토피라노스, 2-아세타미도-2,6-디데옥시-L-갈락토피라노스, 2-아세타미도-2,6-디데옥시-L-만노피라노스, 2-아세타미도-2,6-디데옥시-D-글루코피라노스, 2-아세타미도-2,6-디데옥시-L-알트로피라노스, 2-아세타미도-2,6-디데옥시-D-탈로피라노스, D-글루코피라누론산, D-갈락토피라누론산, D-만노피라누론산, D-알로피라누론산, L-알트로피라누론산, D-굴로피라누론산, L-굴로피라누론산, L-이도피라누론산, D-탈로피라누론산, 시알산, 5-아미노-3,5-디데옥시-D-글리세로-D-갈락토-논-2-울로손산, 5-아세타미도-3,5-디데옥시-D-글리세로-D-갈락토-논-2-울로손산, 5-글리콜릴라미도-3,5-디데옥시-D-글리세로-D-갈락토-논-2-울로손산, 에리트리톨, 아라비니톨, 자일리톨, 리비톨, 글루시톨, 갈락티톨, 만니톨, D-리보-헥스-2-울로피라노스, D-아라비노-헥스-2-울로푸라노스 (D-프룩토푸라노스), D-아라비노-헥스-2-울로피라노스, L-자일로-헥스-2-울로피라노스, D-릭소-헥스-2-울로피라노스, D-트레오-펜트-2-울로피라노스, D-알트로-헵트-2-울로피라노스, 3-C-(히드록시메틸)-D-에리토푸라노스, 2,4,6-트리데옥시-2,4-디아미노-D-글루코피라노스, 6-데옥시-3-O-메틸-D-글루코스, 3-O-메틸-D-람노스, 2,6-디데옥시-3-메틸-D-리보-헥소스, 2-아미노-3-O-[(R)-1-카르복시에틸]-2-데옥시-D-글루코피라노스, 2-아세타미도-3-O-[(R)-카르복시에틸]-2-데옥시-D-글루코피라노스, 2-글리콜릴라미도-3-O-[(R)-1-카르복시에틸]-2-데옥시-D-글루코피라노스, 3-데옥시-D-릭소-헵트-2-울로피라노사르산, 3-데옥시-D-만노-옥트-2-울로피라노손산, 3-데옥시-D-글리세로-D-갈락토-논-2-울로피라노손산, 5,7-디아미노-3,5,7,9-테트라데옥시-L-글리세로-L-만노-논-2-울로피라노손산, 5,7-디아미노-3,5,7,9-테트라데옥시-L-글리세로-L-알트로-논-2-울로피라노손산, 5,7-디아미노-3,5,7,9-테트라데옥시-D-글리세로-D-갈락토-논-2-울로피라노손산, 5,7-디아미노-3,5,7,9-테트라데옥시-D-글리세로-D-탈로-논-2-울로피라노손산, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, 글루코스 (Glc), 갈락토스 (Gal), N-아세틸글루코사민 (GlcNAc), 글루코사민 (Glcn), 만노스 (Man), 자일로스 (Xyl), N-아세틸만노사민 (ManNAc), N-아세틸뉴라민산, N-글리코릴뉴라민산, a 시알산, N-아세틸갈락토사민 (GalNAc), 갈락토사민 (Galn), 푸코스 (Fuc), 람노스 (Rha), 글루쿠론산, 글루콘산, 프룩토스 (Fru) 및 폴리올을 포함한다.

용어 폴리올이란 다수의 히드록실 기를 함유하는 알콜을 의미한다. 예를 들어, 글리세롤, 솔비톨, 또는 만니톨이다.

본 명세서에서 사용되는 용어 "2개의 상이한 단당 서브유닛을 포함하는 이당"은 2개의 상이한 단당 단위로 구성된 당류를 의미하는데, 단당 중 하나는 GlcNAc이거나 또는 하나 또는 양쪽 단당은 GlcNAc로부터 유래된다. 본 명세서에서 사용되는 이당의 예는 락토-N-비오스 (Gal-b1,3-GlcNAc, LNB), 갈락토-N-비오스 (Gal-b1,3-GalNAc, Gal-b1,6-GalNAc), N-아세틸락토사민 (Gal-b1,4-GlcNAc, LacNAc), LacDiNAc (GalNAc-b1,4-GlcNAc), N-아세틸갈락토사미닐글루코스 (GalNAc-b1,4-Glc), N-아세틸글루코사미닐글루코스 (GlcNAc-b1,4-Glc), Fuc-a1,3-GlcNAc, Man-b1,4-GlcNAc 또는 ManNAc-b1,4-GlcNAc를 포함하지만, 이에 제한되지 않는다.

본 명세서에서 사용되고 당분야에서 일반적으로 이해되는 바와 같은 용어 "올리고당"은 작은 개수, 전형적으로 3 내지 20개, 바람직하게 3 내지 15개, 보다 바람직하게 3 내지 13개, 보다 더 바람직하게 3 내지 12개, 보다 더 바람직하게 3 내지 11개, 가장 바람직하게 3 내지 10개의 단순 당, 즉 단당을 함유하는 당류 중합체를 의미한다. 본 발명에서 사용되는 올기고당은 선형 구조일 수 있거나 또는 분지를 포함할 수 있다. 2개 당 단위 사이의 연결 (예를 들어, 글리코시드 연결, 갈락토시드 연결, 글루코시드 연결 등)은 예를 들어, 1,4, 1->4, 또는 (1-4)로서 표현될 수 있고, 본 명세서에서 상호교환적으로 사용된다. 예를 들어, 용어 "Gal-b1,4-Glc", "Gal-β1,4-Glc", "b-Gal-(1->4)-Glc", "β-Gal-(1->4)-Glc", "Galbeta1-4-Glc", "Gal-b(1-4)-Glc" 및 "Gal-β(1-4)-Glc"는 동일한 의미를 가지며, 다시 말해서, 베타-글루코시드 결합은 갈락토스 (Gal)의 탄소-1을 글루코스 (Glc)의 탄소-4와 연결시킨다. 각각의 단당은 환형 형태 (예를 들어, 피라노스 또는 푸라노스 형태)일 수 있다. 개별 단당 단위 사이의 연결은 알파 1->2, 알파 1->3, 알파 1->4, 알파 1->6, 알파 2->1, 알파 2->3, 알파 2->4, 알파 2->6, 베타 1->2, 베타 1->3, 베타 1->4, 베타 1->6, 베타 2->1, 베타 2->3, 베타 2->4, 및 베타 2->6을 포함할 수 있다. 올리고당은 알파- 및 베타-글리코시드 결합 둘 모두를 함유할 수 있거나 또는 오직 베타-글리코시드 결합만을 함유할 수 있다. 용어 "글리칸" 및 "다당류"는 상호교환적으로 사용되고, 글리코시드로 연결된 다수의 단당으로 이루어지는 화합물을 의미한다. 용어 글리칸은 10개 초과의 단당 잔기를 함유하는 화합물에 대해 일반적으로 사용된다.

본 명세서에서 사용되는 "올리고당"은 3개 이상의 단당으로 구성되고, 구성 단당 중 적어도 하나는 나머지 구성 단당과 상이하고, 단당 중 적어도 하나는 GlcNAc이거나 또는 UDP-GlcNAc로부터 유래된다. 바람직하게, 본 명세서에 기술된 바와 같은 올리고당은 상기 본 명세서에서 사용되는 목록으로부터 선택되는 단당을 함유한다. 본 발명의 올리고당의 예는 루이스-유형 항원 올리고당, UDP-GlcNAc로부터 유래되는 단당 및/또는 GlcNAc를 함유하는 포유동물 모유 올리고당 (MMO), O-항원, 엔테로박테리아 공통 항원 (ECA), 캡슐 다당류에 존재하는 올리고당 반복부, 펩티도글리칸 (PG) 및 인간 ABO식 혈액형 체계의 항원을 포함하지만, 이에 제한되지 않는다.

본 명세서에서 사용되는, "포유동물 모유 올리고당"은 UDP-GlcNAc로부터 유리되는 단당 및/또는 GlcNAc를 함유하는 올리고당을 의미한다. 예는 6'-시알릴락토스, 3'-시알릴락토스, 3,6-디시알릴락토스, 6,6'-디시알릴락토스, 8,3-디시알릴락토스, 3,6-디시알릴락토-N-테트라오스, 락토디푸코테트라오스, 락토-N-테트라오스, 락토-N-네오테트라오스, 락토-N-푸코펜타오스 II, 락토-N-푸코펜타오스 I, 락토-N-푸코펜타오스 III, 락토-N-푸코펜타오스 V, 락토-N-푸코펜타오스 VI, 시알릴락토-N-네오테트라오스 d, 시알릴락토-N-네오테트라오스 c, 시알릴락토-N-테트라오스 b, 시알릴락토-N-테트라오스 a, 락토-N-디푸코헥사오스 I, 락토-N-디푸코헥사오스 II, 락토-N-헥사오스, 락토-N-네오헥사오스, 파라-락토-N-헥사오스, 모노푸코실모노시알릴락토-N-네오테트라오스 c, 모노푸코실 파라-락토-N-헥사오스, 모노푸코실락토-N-헥사오스 III, 이성질체 푸코실화 락토-N-헥사오스 III, 이성질체 푸코실화 락토-N-헥사오스 I, 시알릴락토-N-헥사오스, 시알릴락토-N-네오헥사오스 II, 디푸코실-파라-락토-N-헥사오스, 디푸코실락토-N-헥사오스, 디푸코실락토-N-헥사오스 a, 디푸코실락토-N-헥사오스 c를 포함하지만, 이에 제한되지 않는다.

포유동물 모유 올리고당 또는 MMO는 인간 (즉, 인간 모유 올리고당 또는 HMO) 및 소 (보스 타우루스 (Bos Taurus)), 양 (오비스 아리에스 (Ovis aries)), 염소 (카프라 애가그루스 히르쿠스 (Capra aegagrus hircus)), 쌍봉 낙타 (카멜루스 박트리아누스 (Camelus bactrianus)), 말 (에쿠우스 페루스 카발루스 (Equus ferus caballus)), 돼지 (수스 스크로파 (Sus scropha)), 개 (카니스 루푸스 파밀리아리스 (Canis lupus familiaris)), 에조불곰 (우르수스 아르크토스 에소엔시스 (Ursus arctos yesoensis)), 북극곰 (우르수스 마리티무스 (Ursus maritimus)), 일본 흑곰 (우르수스 티베타누스 자포니쿠스 (Ursus thibetanus japonicus)), 등줄무늬 스컹크 (메피티스 메피티스 (Mephitis mephitis)), 두건 물범 (시스토포라 크리스타타 (Cystophora cristata)), 아시아 코끼리 (엘레파스 막시무스 (Elephas maximus)), 아프리카 코끼리 (록소돈타 아프리카나 (Loxodonta africana)), 큰개미핥기 (미르메코파가 트리닥틸라 (Myrmecophaga tridactyla)), 병코돌고래 (투르시옵스 트룬카테스 (Tursiops truncates)), 북방 밍크 고래 (발라에놉테라 아쿠토로스트라타 (Balaenoptera acutorostrata)), 타마 왈라비 (마크로푸스 유게니 (Macropus eugenii)), 붉은 캥거루 (마크로푸스 루푸스 (Macropus rufus)), 주머니 여우 (트리코수루스 불페쿨라 (Trichosurus Vulpecula)), 코알라 (파스콜라르크토스 시네레우스 (Phascolarctos cinereus)), 동부 주머니 고양이 (다시우루스 비베리누스 (Dasyurus viverrinus)), 오리너구리 (오르니토린쿠스 아나티누스 (Ornithorhynchus anatinus))를 포함하지만, 이에 제한되지 않는 포유동물로부터의초유를 포함하여 수유 중 임의 단계에서 발견되는 모유에 존재하는 올리고당을 포함한다. 인간 모유 올리고당은 또한 인간 모유에서 발견되는 인간 모유 올리고당과 화학적으로 동일하지만, 생물공학적으로 생산 (예를 들어, 박테리아, 진균, 효모, 식물, 동물, 또는 원충 세포, 바람직하게 대사적으로 조작된 세포 및 유기체를 포함하는 세포 무함유 시스템 또는 세포 및 유기체를 사용함)되는 인간과 동일한 모유 올리고당으로서도 알려져 있다. 인간과 동일한 모유 올리고당은 HiMO 명칭 하에 판매된다.

본 명세서에서 사용되는, 용어 "O-항원"은 그람-음성 박테리아의 표면 지질다당류 (LPS)의 반복적 글리칸 성분을 의미한다. 용어 "엔테로박테리아 공통 항원" 또는 "ECA"는 엔테로박테리아세아에의 모든 구성원이 공유하고, 외막의 외엽 및 주변세포질에 위치되는, 3개 아미노 당의 반복 단위, 즉, N-아세틸글루코사민, N-아세틸-d-만노사미누론산 및 4-아세타미도-4,6-디데옥시-d-갈락토스로 구축되는 특이적 탄수화물 항원을 의미한다. 용어 "캡슐 다당류"는 박테리아 캡슐에 존재하는 반복-단위 구조를 갖는 장쇄 다당류를 의미하는 것으로서, 후자는 세포 외피 밖에 위치되는 다당류 층이다. 용어 "펩티도글리칸" 또는 "뮤레인"은 당 및 아미노산으로 구성되는, 대부분의 박테리아의 세포백의 필수 구조 성분을 의미하고, 당 성분은 베타-1,4 연결된 GlcNAc 및 N-아세틸무람산의 교대식 잔기로 이루어진다. 본 명세서에서 사용되는, 인간 ABO 혈액형 체계의 항원은 올리고당이다. 인간 ABO 혈액형 체계의 이러한 항원은 인간 구조에 제한되지 않는다. 상기 구조는 Gal-베타1,3-GlcNAc, Gal-베타1,4-GlcNAc, Gal-베타1,3-GalNAc 및 Gal-베타1,4-Glc를 포함하는 이당 코어 구조 상에 존재하는 A 결정자 GalNAc-알파1,3(Fuc-알파1,2)-Gal-, B 결정자 Gal-알파1,3(Fuc-알파1,2)-Gal- 및 H 결정자 Fuc-알파1,2-Gal-를 포함한다.

본 명세서에서 사용되는 용어 "LNT II", "LNT-II", "LN3", "락토-N-트리오스 II", "락토-N-트리오스 II", "락토-N-트리오스", "락토-N-트리오스" 또는 "GlcNAcβ1-3Galβ1-4Glc"는 상호교환적으로 사용된다. 본 명세서에서 사용되는 용어 "LNT", "락토-N-테트라오스", "락토-N-테트라오스" 또는 "Galβ1-3GlcNAcβ1-3Galβ1-4Glc"는 상호교환적으로 사용된다. 본 발명에서 사용되는 용어 "LNnT", "락토-N-네오테트라오스", "락토-N-네오테트라오스", "네오-LNT" 또는 "Galβ1-4GlcNAcβ1-3Galβ1-4Glc"는 상호교환적으로 사용된다.

본 명세서에서 사용되는 용어 "3-시알릴락토스", "3'-시알릴락토스", "알파-2,3-시알릴락토스", "알파 2,3 시알릴락토스", "α-2,3-시알릴락토스", "α2,3 시알릴락토스", "Neu5Aca2-3Galβ1-4Glc", "3SL", "3'SL", "3-SL" 또는 "3'-SL"은 상호교환적으로 사용된다. 본 명세서에서 사용되는 용어 "6-시알릴락토스", "6'-시알릴락토스", "알파-2,6-시알릴락토스", "알파 2,6 시알릴락토스", "α-2,6-시알릴락토스", "α 2,6 시알릴락토스", "Neu5Aca2-6Galβ1-4Glc", "6SL", "6'SL", "6-SL" 또는 "6'-SL"은 상호교환적으로 사용된다.

본 발명에서 사용되는 용어 "LSTa", "LS-사당류 a", "시알릴-락토-N-테트라오스 a", "시알릴락토-N-테트라오스 a" 또는 "Neu5Ac-a2,3-Gal-b1,3-GlcNAc-b1,3-Gal-b1,4-Glc"는 상호교환적으로 사용된다. 용어 "LSTb", "LS-사당류 b", "시알릴-락토-N-테트라오스 b", "시알릴락토-N-테트라오스 b"는 상호교환적으로 사용되고, "Gal-b1,3-(Neu5Ac-a2,6)-GlcNAc-b1,3-Gal-b1,4-Glc"를 의미한한다.

본 발명에서 사용되는 용어 "LSTc", "LS-사당류 c", "시알릴-락토-N-테트라오스 c", "시알릴락토-N-테트라오스 c", "시알릴락토-N-네오테트라오스 c" 또는 "Neu5Ac-a2,6-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc"는 상호교환적으로 사용된다. 용어 "LSTd", "LS-사당류 d", "시알릴-락토-N-테트라오스 d", "시알릴락토-N-테트라오스 d", "시알릴락토-N-네오테트라오스 d" 또는 "Neu5Ac-a2,3-Gal-b1,4-GlcNAc-b1,3-Gal-b1,4-Glc". 용어 "DSLNnT" 및 "디시알릴락토-N-네오테트라오스"는 상호교환적으로 사용되고, Neu5Ac-a2,6-Gal-b1,4-GlcNAc-b1,3-[Neu5Ac-a2,6]-Gal-b1,4-Glc를 의미한다. 용어 "DSLNT", "DS-LNT" 및 "디시알릴락토-N-테트라오스"는 상호교환적으로 사용되고, Neu5Ac-a2,3-Gal-b1,3-[Neu5Ac-a2,6]-GlcNAc-b1,3-Gal-b1,4-Glc를 의미한다.

용어 "정제된"은 생물학적 분자의 활성을 방해하는 성분이 실질적으로 또는 본질적으로 없는 물질을 의미한다. 세포, 당류, 핵산, 및 폴리펩티드 경우에, 용어 "정제된"은 이의 천연 상태에서 발견되는 물질을 정상적으로 수반하는 성분이 실질적으로 또는 본질적으로 없는 물질을 의미한다. 전형적으로, 본 발명의 정제된 당류, 올리고당, 단백질 또는 핵산은 은-염색 겔 상에서 밴드 강도를 통해서 또는 순도 결정을 위한 다른 방법으로 측정하여 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80% 또는 85% 순수하거나, 일반적으로 적어도 약 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 순수하다. 순도 또는 균질성은 당분야에 충분히 공지된 많은 수단, 예컨대, 단백질 또는 핵산 샘플의 폴리아크릴아미드 겔 전기영동에 이어서 염색 시 가시화를 통해서 표시될 수 있다. 일정 목적을 위해서 고해상도가 필요할 것이고 HPLC 또는 정제를 위한 유사한 수단이 이용될 것이다. 올리고당 경우에, 순도는 제한없이, 박층 크로마토그래피, 가스 크로마토그래피, NMR, HPLC, 모세관 전기영동 또는 지량 분광법같은 방법을 사용해 결정된다.

용어 "배양"은 세포가 배양되거나 또는 발효배양되는 배양 배지, 세포 그 자체, 및 전체 액체배지, 즉 세포 내부 (세포내)를 비롯하여 외부 (세포외)에서, 세포에 의해 생산되는 이당 및/또는 올리고당을 의미한다. 본 명세서에서 사용되는, 용어 "세포 생산성 지수 (CPI)"는 배양으로 생산된 세포의 질량으로 나눈 세포에 의해 생산되는 생산물의 질량을 의미한다.

본 명세서에서 사용되는 용어 "배출", "배출된", "배출되다"는 예를 들어, 능동 또는 수동 수송을 통해서, 소포체 (ER) 또는 이로부터 유래된 임의 소포의 사용을 통해서, 임의 방법에 의해 세포 내부에서 세포 밖으로 분자의 전달을 의미한다.

본 명세서에서 사용되는 용어 "세포 밖으로 이당 또는 올리고당을 배출하는 세포"는 시토졸에서 이당 또는 올리고당을 합성하고 예를 들어 능동 또는 수동 수송을 통한 임의 방법을 통해서 상기 세포의 밖으로 상기 이당 또는 올리고당을 전달하는 세포를 의미한다.

본 명세서에서 사용되는 용어 "전구체"는 본 발명에 따른 이당 또는 올리고당의 특별한 생산을 위해 세포가 흡수하거나 또는 합성하는 물질을 의미한다. 이러한 의미에서 전구체는 본 명세서에 정의된 바와 같은 억셉터일 수 있지만, 또한 본 발명의 이당 및/또는 올리고당의 생화학적 합성 경로의 일부로서 세포 내에서 먼저 변형되는 다른 물질, 대사산물, 단당, 이당 또는 올리고당일 수도 있다. 이러한 전구체의 예는 본 명세서에 정의된 바와 같은 억셉터, 및/또는 글루코스, 갈락토스, 프룩토스, 글리세롤, 시알산, N-아세틸뉴라민산, 푸코스, 만노스, 말토스, 수크로스, 락토스, 디히드록시아세톤, 글루코사민, N-아세틸글루코사민, 만노사민, N-아세틸만노사민, 갈락토사민, N-아세틸갈락토사민, 갈락토실락토스, N-아세틸락토사민 (LacNAc), 락토-N-비오스 (LNB), 인산화 당 등 예컨대, 제한없이 글루코스-1-포스페이트, 갈락토스-1-포스페이트, 글루코스-6-포스페이트, 프룩토스-6-포스페이트, 프룩토스-1,6-비스포스페이트, 글리세롤-3-포스페이트, 글리세르알데히드-3-포스페이트, 디히드록시아세톤-포스페이트, 글루코사민-6-포스페이트, N-아세틸-글루코사민-6-포스페이트, N-아세틸만노사민-6-포스페이트, N-아세틸-뉴라민산-9-포스페이트, N-아세틸글루코사민-1-포스페이트, 만노스-6-포스페이트, 만노스-1-포스페이트 및 본 명세서에 정의된 바와 같은 뉴클레오티드-활성화된 당 예컨대, 예를 들어, UDP-글루코스, UDP-갈락토스, UDP-N-아세틸글루코사민, CMP-시알산, GDP-만노스,　GDP-4-데히드로-6-데옥시-α-D-만노스, 및/또는 GDP-푸코스를 포함한다.

임의로, 세포는 락토스 수송체, N-아세틸뉴라민산 수송체, 푸코스 수송체, 뉴클레오티드-활성화된 당을 위한 수송체로 이루어진 군으로부터 선택되는 단백질을 코딩하는 적어도 하나의 핵산 서열을 포함하도록 형질전환되고, 상기 수송체는 이당 및/또는 올리고당 합성을 위한 전구체가 첨가된 배지에 내재화된다.

본 명세서에서 사용되는 용어 "억셉터"는 글리코실트랜스퍼라제에 의해 변형될 수 있는 이당 또는 올리고당을 의미한다. 이러한 억셉터의 예는 락토스, 락토-N-비오스 (LNB), 락토-N-트리오스, 락토-N-테트라오스 (LNT), 락토-N-네오테트라오스 (LNnT), N-아세틸-락토사민 (LacNAc), 락토-N-펜타오스 (LNP), 락토-N-네오펜타오스, 파라 락토-N-펜타오스, 파라 락토-N-네오펜타오스, 락토-N-노보펜타오스 I, 락토-N-헥사오스 (LNH), 락토-N-네오헥사오스 (LNnH), 파라 락토-N-네오헥사오스 (pLNnH), 파라 락토-N-헥사오스 (pLNH), 락토-N-헵타오스, 락토-N-네오헵타오스, 파라 락토-N-네오헵타오스, 파라 락토-N-헵타오스, 락토-N-옥타오스 (LNO), 락토-N-네오옥타오스, 이소 락토-N-옥타오스, 파라 락토-N-옥타오스, 이소 락토-N-네오옥타오스, 노보 락토-N-네오옥타오스, 파라 락토-N-네오옥타오스, 이소 락토-N-노나오스, 노보 락토-N-노나오스, 락토-N-노나오스, 락토-N-데카오스, 이소 락토-N-데카오스, 노보 락토-N-데카오스, 락토-N-네오데카오스, 갈락토실락토스, 1, 2, 3, 4, 5, 또는 다수의 N-아세틸락토사민 단위 및/또는 1, 2, 3, 4, 5, 또는 다수의, 락토-N-비오스 단위로 확장된 락토스, 및 1 또는 다수의 N-아세틸락토사민 단위 및/또는 1 또는 다수의 락토-N-비오스 단위를 함유하는 올리고당 또는 올리고당으로의 중간체, 이의 푸코실화 및 시알릴화 형태를 포함한다.

제1 구현예에 따라서, 본 발명은 UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 대사적으로 조작된 세포를 제공한다. 본 명세서에서, 대사적으로 조작된 세포는 변이체 효모 또는 진균 글루타민―프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현할 수 있고, 바람직하게 발현하고, UDP-GlcNAc를 합성할 수 있고, 바람직하게 합성하고, 글리코실트랜스퍼라제를 발현할 수 있고, 바람직하게 발현하는 것이 제공되고, 상기 UDP-GlcNAc는 상기 글리코실화된 생산물을 생산하도록 세포에 의해 사용된다.

제2 구현예에 따라서, 본 발명은 UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성되는 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 제조를 위한 방법을 제공한다. 방법은 하기의 단계를 포함한다:

(a)(i) 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현할 수 있고, 바람직하게, 발현하고,

(ii) UDP-N-아세틸글루코사민 (UDP-GlcNAc)을 합성할 수 있고, 바람직하게, 합성하고,

(iii) 글리코실트랜스퍼라제를 발현할 수 있고, 바람직하게, 발현하고,

(iv) 상기 UDP-GlcNAc를 사용하여 상기 글리코실화된 생산물을 생산하는,

세포를 제공하는 단계, 및

(b) 상기 글리코실화된 생산물을 생산하도록 허용하는 조건 하에서 상기 세포를 배양하는 단계,

(c) 바람직하게, 상기 배양으로부터 상기 글리코실화된 생산물을 분리하는 단계.

본 발명에 따라서, UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성되는 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 제조를 위한 상기 방법은 본 명세서에 개시된 바와 같은 대사적으로 조작된 세포를 이용한다.

본 발명의 범주에서, 허용하는 조건은 온도, pH, 압력, 삼투압 및 생산물/전구체/억셉터 농도를 포함하지만, 이에 제한되지 않는 물리적 또는 화학적 매개변수에 관한 조건으로 이해한다.

특정 구현예에서, 허용되는 조건은 30 +/- 20 섭씨도의 온도-범위, 2.0 - 10.0의 pH-범위를 포함할 수 있다.

본 발명의 방법의 다른 바람직한 구현예에서, 배양은 상기 글리코실화된 생산물의 합성을 위한 전구체가 공급된다. 방법의 추가의 바람직한 구현예에서, 배양은 상기 글리코실화된 생산물의 합성을 위한 적어도 2종의 전구체가 공급된다.

본 발명의 방법 및/또는 세포의 일 양태에 따라서, 세포는 UDP-GlcNAc를 합성하고 상기 UDP-GlcNAc는 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 이당 또는 올리고당을 포함하는 글리코실화된 생산물을 합성하기 위한 경로에서 사용한다. 방법 및/또는 세포의 바람직한 구현예에서, 세포는 UDP-GlcNAc를 합성하고 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 이당 또는 올리고당을 합성하기 위한 경로에서 상기 UDP-GlcNAc를 사용한다. 본 명세서에서 사용되는, 세포는 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 이당 또는 올리고당; 및/또는 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 이당 또는 올리고당을 포함하는 글리코실화된 생산물을 합성할 수 있다.

본 발명의 방법 및/또는 세포의 바람직한 구현예에서, 세포는 합성된 UDP-GlcNAc를 사용하여서, 본 명세서에 정의된 바와 같지만 GlcNAc는 아닌 단당 억셉터로 세포에서 발현되는 특이적 글리코실트랜스퍼라제에 의해서 상기 UDP-GlcNAc로부터 GlcNAc 모이어티를 전달하여서 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 이당을 합성한다.

본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에서, 세포는 합성된 UDP-GlcNAc를 사용하여, 본 명세서에 정의된 바와 같지만 GlcNAc-GlcNAc는 아닌 이당 억셉터로 특이적 글리코실트랜스퍼라제에 의해서 상기 UDP-GlcNAc로부터 GlcNAc 모이어티를 전달하여서 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 올리고당을 합성한다.

본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에서, 세포는 합성된 UDP-GlcNAc 및 UDP-GlcNAc로부터 유래되지 않은 하나 이상의 다른 뉴클레오티드-활성화된 당(들)을 사용하여 GlcNAc 모이어티 및 단당 빌딩 블록(들)을 상기 UDP-GlcNAc 및 상기 하나 이상의 다른 뉴클레오티드-활성화된 당(들)으로부터, 각각, 특이적글리코실트랜스퍼라제에 의해서, 각각, 본 명세서에 정의된 바와 같은 당류 억셉터로 전달하여서 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 올리고당을 합성한다.

본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에서, 세포는 합성된 UDP-GlcNAc를 사용하여 UDP-GlcNAc 유래된 뉴클레오시드(들)를 생산하고 단당을 상기 UDP-GlcNAc 유래된 뉴클레오시드로부터 특이적 글리코실트랜스퍼라제에 의해서 본 명세서에 정의된 바와 같은 단당 억셉터로 전달하여서 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 이당을 합성한다.

본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에서, 세포는 합성된 UDP-GlcNAc를 사용하여 하나 이상의 UDP-GlcNAc 유래된 뉴클레오시드(들)를 생산하고 하나 이상의 단당을 상기 하나 이상의 UDP-GlcNAc 유래된 뉴클레오시드(들) 및/또는 상기 합성된 UDP-GlcNAc로부터의 GlcNAc를 각각 특이적 글리코실트랜스퍼라제에 의해서, 본 명세서에 정의된 바와 같은 당류 억셉터로 전달하여 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 올리고당을 합성한다.

본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에서, 세포는 합성된 UDP-GlcNAc를 사용하여 하나 이상의 UDP-GlcNAc 유래된 뉴클레오시드(들)를 생산하고 상기 하나 이상의 UDP-GlcNAc 유래된 뉴클레오시드(들)로부터의 하나 이상의 단당, UDP-GlcNAc로부터 유래되지 않은 하나 이상의 뉴클레오티드로부터의 하나 이상의 단당 및/또는 상기 UDP-GlcNAc로부터의 GlcNAc를 각각, 특이적 글리코실트랜스퍼라제에 의해서, 본 명세서에 정의된 바와 같은 당류 억셉터로 전달하여서 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 올리고당을 합성한다.

본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에서, 세포는 합성된 UDP-GlcNAc 및 UDP-GlcNAc로부터 유래되지 않은 하나 이상의 다른 뉴클레오티드-활성화된 당(들)을 사용하여 상기 UDP-GlcNAc로부터의 GlcNAc 모이어티 및 단당 빌딩 블록(들) 및 상기 하나 이상의 다른 뉴클레오티드-활성화된 당(들)을, 각각, 특이적 글리코실트랜스퍼라제에 의해서, 각각, 본 명세서에 정의된 바와 같은 억셉터로 전달하여서 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 올리고당을 포함하는 글리코실화된 생산물을 합성한다.

본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에서, 세포는 합성된 UDP-GlcNAc를 사용하여 하나 이상의 UDP-GlcNAc 유래된 뉴클레오시드(들)를 생산하고 상기 하나 이상의 UDP-GlcNAc 유래된 뉴클레오시드(들)로부터의 하나 이상의 단당 및/또는 상기 합성된 UDP-GlcNAc로부터의 GlcNAc를, 각각, 특이적 글리코실트랜스퍼라제에 의해서, 본 명세서에 정의된 바와 같은 억셉터로 전달하여서 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 올리고당을 포함하는 글리코실화된 생산물을 합성한다.

본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에서, 세포는 합성된 UDP-GlcNAc를 사용하여 하나 이상의 UDP-GlcNAc 유래된 뉴클레오시드(들)를 생산하고 상기 하나 이상의 UDP-GlcNAc 유래된 뉴클레오시드(들)로부터의 하나 이상의 단당, UDP-GlcNAc로부터 유래되지 않은 하나 이상의 뉴클레오시드로부터의 하나 이상의 단당 및/또는 상기 UDP-GlcNAc로부터의 GlcNAc를, 각각, 특이적 글리코실트랜스퍼라제를 통해서, 본 명세서에 정의된 바와 같은 억셉터로 전달하여서 적어도 2종의 상이한 단당 서브유닛으로 구성된 UDP-GlcNAc 유래된 올리고당을 포함하는 글리코실화된 생산물을 합성한다.

본 발명의 방법 및/또는 세포의 바람직한 구현예에서, UDP-GlcNAc로부터 유래되지 않은 뉴클레오시드는 전구체(들)로서 배양에 첨가된다. 본 발명의 방법 및/또는 세포의 보다 바람직한 구현예에서, UDP-GlcNAc로부터 유래되지 않은 뉴클레오시드는 본 발명의 세포에 의해 합성된다.

본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에서, 상기 UDP-GlcNAc 유래된 이당 또는 올리고당의 합성을 위한 억셉터는 전구체로서 배양에 첨가된다. 본 발명의 방법 및/또는 세포의 보다 바람직한 구현예에서, 상기 억셉터는 본 발명의 세포에 의해 합성된다.

본 발명은 대사적으로 조작된 세포를 사용하여 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 상기 생산을 위한 상이한 유형의 세포를 제공한다. 예를 들어, 본 발명은 세포를 제공하고, 상기 세포는 하나의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고, 상기 세포는 상기 세포에 의해 사용되는 UDP-GlcNAc를 합성하여 상기 글리코실화된 생산물을 생산한다. 본 발명은 또한 세포를 제공하고, 상기 세포는 하나의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고 상기 세포는 상기 세포에 의해 사용되는 하나의 UDP-GlcNAc-유래 뉴클레오시드를 합성하여 상기 글리코실화된 생산물을 생산한다. 본 발명은 또한 세포를 제공하고, 상기 세포는 하나의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고 상기 세포는 상기 세포에 의해 사용되는 UDP-GlcNAc 및/또는 하나 이상의 UDP-GlcNAc-유래 뉴클레오시드(들)를 합성하여 상기 글리코실화된 생산물을 생산한다. 본 발명은 또한 세포를 제공하고, 상기 세포는 2종의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고 상기 세포는 상기 세포에 의해 사용되는 UDP-GlcNAc를 합성하여 상기 글리코실화된 생산물을 생산한다. 본 발명은 또한 세포를 제공하고, 상기 세포는 2종의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고, 상기 세포는 상기 세포에 의해 사용되는 하나의 UDP-GlcNAc-유래 뉴클레오시드를 합성하여 상기 글리코실화된 생산물을 생산한다. 본 발명은 또한 세포를 제공하고, 상기 세포는 2종의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고 상기 세포는 상기 세포에 의해 사용되는 UDP-GlcNAc 및/또는 하나 이상의 UDP-GlcNAc-유래 뉴클레오시드(들)를 합성하고 상기 글리코실화된 생산물을 생산한다. 본 발명은 또한 세포를 제공하고, 상기 세포는 3종 이상의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고, 상기 세포는 상기 세포에 의해 사용되는 UDP-GlcNAc 및/또는 하나 이상의 UDP-GlcNAc-유래 뉴클레오시드(들)를 합성하여 상기 글리코실화된 생산물을 생산한다.

본 발명에 따른 방법 및/또는 세포의 바람직한 구현예에 따라서, 대사적으로 조작된 세포는 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 포함하는 적어도 하나의 유전자 발현 모듈에 의해 변형되고, 상기 발현 모듈로부터의 발현은 항상성이거나 또는 비-화학적 유도 또는 억제 시에 조건적이다.

상기 발현 모듈은 또한 전사 유닛으로도 알려져 있고, 코딩 유전자 서열 및 코딩 유전자에 작동적으로 연결된 적절한 전사 및/또는 번역 제어 신호를 포함하는 재조합 유전자의 발현을 위한 폴리뉴클레오티드를 포함한다. 상기 제어 신호는 프로모터 서열, 비번역 영역, 리보솜 결합 부위, 종결자 서열을 포함한다. 상기 발현 모듈은 하나의 단일 재조합 유전자의 발현을 위한 성분을 함유할 수 있고 또한 더 많은 재조합 유전자의 발현을 위한 성분을 함유할 수 있거나 또는 둘 이상의 재조합 유전자의 통합된 발현을 위한 오페론 구조로 구성될 수 있다. 상기 폴리뉴클레오티드는 당분야에 충분히 공지된 기술을 사용하는 재조합 DNA 기술에 의해 생산될 수 있다. 발현 모듈을 구축하기 위한 당업자에게 충분히 공지된 방법은 예를 들어, 시험관내 재조합 DNA 기술, 합성 기술, 및 생체내 유전자 재조합을 포함한다. 예를 들어, 기술들은 하기 문헌에 기술되어 있다: Sambrook et al. (2001) Molecular Cloning: a laboratory manual, 3rd Edition, Cold Spring Harbor Laboratory Press, CSH, New York 또는 Current Protocols in Molecular Biology, John Wiley and Sons, N.Y. (1989 및 연간 업데이트).

본 발명의 바람직한 양태에 따라서, 세포는 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 포함하는 하나 이상의 발현 모듈에 의해 변형된다. 본 명세서에서 사용되는, 세포는 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제에 대한 하나의 발현 모듈에 의해 변형될 수 있다. 세포는 또한 둘 이상의 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제에 대한 하나의 발현 모듈에 의해 변형될 수 있다. 세포는 또한 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제에 대한 하나의 발현 모듈 및 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제와 구별되는 하나 이상의 다른 재조합 유전자에 대한 하나 이상의 발현 모듈에 의해 변형될 수 있다. 세포는 또한 둘 이상의 발현 모듈에 의해 변형될 수 있고, 상기 발현 모듈 중 적어도 하나는 하나 이상의 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제(들)의 발현을 위한 성분을 함유한다.

상기 다른 재조합 유전자는 상기 글리코실화된 생산물의 합성에서 작용하는 폴리펩티드의 발현에 관여될 수 있거나; 또는 상기 재조합 유전자는 상기 글리코실화된 생산물의 합성에 관여되지 않는 상기 대사적으로 조작된 세포에서의 다른 경로에 연결될 수 있다. 상기 재조합 유전자는 변형된 발현 또는 활성을 갖는 내생성 단백질을 코딩하고, 바람직하게 상기 내생성 단백질은 과발현되거나; 또는 상기 재조합 유전자는 이종으로 도입되어 상기 변형된 세포에서 발현되고, 바람직하게 과발현되는 이종성 단백질을 코딩한다. 내생성 단백질은 이종성 단백질을 또한 발현하는 세포에서 변형된 발현을 가질 수 있다.

발현 모듈은 상기 세포의 게놈에 통합될 수 있거나 또는 벡터 상에서 상기 세포에게 제시될 수 있다. 상기 벡터는 상기 대사적으로 조작된 세포로 안정하게 형질전환/형질감염시키려는, 플라스미드, 코스미드, 파지, 리포솜, 또는 바이러스의 형태로 존재할 수 있다. 이러한 벡터는 특히, 염색체, 에피솜 및 바이러스-유래 벡터, 예를 들어, 플라스미드, 박테리오파지, 트랜스포존, 효모 에피솜, 삽입 성분, 효모 염색체 성분, 바이러스로부터 유래되는 벡터, 및 이의 조합으로부터 유래되는 벡터, 예컨대, 플라스미드 및 박테리오파지 유전자 성분으로부터 유래되는 것들, 예컨대, 코스미드 및 파지미드를 포함한다. 이들 벡터는 선택 마커 예컨대, 항생제 마커, 영양요구성 마커, 독소-항독소 마커, RNA 센서/안티센스 마커를 함유할 수 있지만, 이에 제한되지 않는다. 발현 시스템 구성체는 발현을 일으킬뿐만 아니라 조절하는 제어 영역을 함유할 수 있다. 일반적으로, 숙주에서 폴리뉴클레오티드를 유지, 전파 또는 발현시키고/시키거나 폴리펩티드를 발현시키는데 적합한 임의의 시스템 또는 벡터는 이와 관련하여 발현에 사용될 수 있다. 적절한 DNA 서열은 임의의 다양한 충분히 공지된 통상의 기술, 예컨대, 예를 들어, Sambrook et al. 등에 기재된 것들을 통해서 발현 시스템으로 삽입될 수 있고, 상기를 참조한다. 재조합 생산을 위해서, 세포는 본 발명의 발현 시스템 또는 이의 일부 또는 폴리뉴클레오티드를 도입하도록 유전자 조작될 수 있다. 세포로 폴리뉴클레오티드의 도입은 많은 표준 실험실 매뉴얼, 예컨대, [Davis et al., Basic Methods in Molecular Biology, (1986)], 및 [Sambrook et al., 1989, 상동]에 기술된 방법을 통해서 실시될 수 있다.

본 발명의 보다 바람직한 양태에 따라서, 대사적으로 조작된 세포에 존재하는 상기 발현 모듈의 각각으로부터의 발현은 항상성이거나 또는 비-화학적 유도 또는 억제 시에 조건적이다.

본 명세서에서 사용되는, 항상성 발현은 유기체에서 연속적으로 전사되는 유전자의 발현으로서 이해해야 한다. 재조합 숙주 세포에서 종종 사용되는 항상성 프로모터의 예는 박테리아 프로모터 예컨대, 예를 들어, spc 리보솜 단백질 오페론 프로모터 P_spc, β-락타마제 프로모터 P_bla, P_cat 프로모터, rrnB 리보솜 RNA 오페론의 P1 및 P2 프로모터, ompC 및 yfgF의 프로모터; 효모 프로모터 예컨대, 예를 들어 ACT1, CCW12, CYC1, FBA1, HXT7-391, GPD, MFα1, PAB1, PDC1, PGK1, PYK1, TDH3, TEF1 또는 TPI1; 또는 다른 프로모터 예컨대 예를 들어, 파지 람다의 P_L 프로모터 (Da Silva and Srikrishnan, FEMS Yeast Res. (2012) 12: 197-214; Redden et al., FEMS Yeast Res. (2015) 15: 1-10; Shimada et al. 2014, PLOS ONE 9(6): e100908) 또는 예컨대, 예를 들어, Redden and Alper (Nat. Commun. 2015, 6, 7810), Liu et al. (Microb. Cell Fact. 2020, 19, 38), Xu et al. (Microb. Cell Fact.2021, 20, 148) 및 Lee et al. (ACS Synth. Biol. 2015, 4(9), 975-986)에 기술된 바와 같은, 라이브러리로부터 기원하는 프로모터 서열을 포함한다.

본 명세서에서 사용되는, 비-화학적 유도 또는 억제 시 조건적인 발현은 환경 변화 (예를 들어, 혐기성 또는 호기성 성장, 산화 스트레스, 온도 변화, 예컨대, 예를 들어 열-충격 또는 냉-충격, 삼투압, 빛 조건)에 대한 반응으로서 또는 제한없이 아폽토시스 및 오토파지를 포함하는 상기 숙주 세포의 발생 단계 또는 세포 주기의 위치에 의존하여, 숙주의 일정 천연 조건 (예를 들어, 발아 효모의 교배 단계, 박테리아의 정지기, 분만 중이거나 또는 수유 중인 유기체)에서만 발현되는 유전자의 선택적 또는 조절적 발현으로서 이해해야 한다. 비-화학적 유도 또는 억제 시에 조건적 발현을 제공하는 프로모터의 예는 산소-반응성 프로모터 (예컨대, 예를 들어, 에스. 세레비지아에 (S. cerevisiae) 유래 DAN1, 이. 콜라이 유래 nar, 박테리아 글로빈 프로모터), 산화 스트레스-반응성 프로모터 (예컨대, 예를 들어, 효모 유래 CTT1, Skn7, TRX2 또는 Yap1 또는 박테리아 유래 oxyR, soxR, soxS, sodA 또는 ahpC), 열-충격 반응성 프로모터 (예컨대, 예를 들어, 효모 유래 CPR6, HSP26, HSP82, HSP104, SSA1, SSA3, SSA4 또는 YDJ1; 또는 박테리아 유래 ahpF, DnaK, GroEL 또는 HtpG) 및 정지상에서 활성인 프로모터 (예컨대, 예를 들어, 이.콜라이 osmY 프로모터)를 포함한다 (Farr and Kogoma, Microbiol. Rev. 1991, 55(4): 561-585; Imlay J.A., Annu. Rev. Microbiol. 2015, 69: 93-108; Lara et al., J. Biol. Eng. 2017, 11:39; Lee et al., Biotechnol. Bioeng. 2003, 82(3): 271-277; Loprosert et al., Mol. Microbiol. 2000, 37: 1504-1514; Morano et al., Genetics 2012, 190(4): 1157-1195).

본 명세서에서 사용되는, 화학적 유도 또는 억제 시 조건적인 발현은 탄소 공급원 (예컨대, 예를 들어, 글루코스, 알로-락토스, 락토스, 갈락토스, 글리세롤, 아라비노스), 알콜 (예컨대, 예를 들어, 메탄올, 에탄올), 산성 화합물 (예컨대, 예를 들어, 아세테이트, 포르메이트), IPTG, 금속 이온 (예컨대, 예를 들어, 알루미늄, 구리, 아연, 질소), 포스페이트, 방향족 (예컨대, 예를 들어, 크실렌)을 포함하는 일정 화학적 화합물의 존재 또는 부재 시에만 발현되는 유전자의 선택적 또는 조건적 발현으로서 이해해야 한다. 화학적 유도 또는 억제 시에 조건적 발현을 제공하는 프로모터의 예는 이. 콜라이 유래 람노스-유도성 rhaBAD 프로모터, 이.콜라이　araBAD　오페론의 아라비노스-유도성 p_BAD 프로모터, 이.콜라이 유래 IPTG-유도성 lac 프로모터 또는 IPTG/락토스-유도성 T7 프로모터 또는 이.콜라이 염 (NaCl)-유도성 프로모터 proU (Marschall et al. 2016, Appl. Microbiol. Biotechnol. 100, 5719-5728) 또는 효모 유래 ADH1, GAL1-GAL10, MET3, MET25, P_CUP1 및 PHO5 프로모터를 포함한다. 1500 bp 프로모터 P_ADH1 는 글루코스 상에서 성장 동안 활성화되고 글루코스 고갈 이후에 에탄올 소비 동안 하향조절된다. 상류 서열의 1100 bp의 결실을 갖는 프로모터, P_ADH1s 의 짧은 변이체는 발현을 초기 에탄올 성장기로 이동시켜서 후기 에탄올 소비기로 활성이 증가된다. 상류 단편의 300 bp의 복원은 초기 대수 성장에서 활성화되어서 후기 에탄올 소비기로 활성을 유지시키는 중간 ADH1 프로모터 (pADH1m)를 생성시켰다 (Ruohonen et al., 1995, J. Biotechnol. 39: 193-203). ADH2 프로모터는 글루코스 억제에 의해 조밀하게 조절된다. 글루코스의 존재 하에서, GAL 프로모터는 완전하게 꺼지고, 갈락토스의 존재 하에서, 발현의 1000-배 증가는 단지 4시간에 달성될 수 있다. 프로모터 P_CUP1 는 Cu²⁺의 존재 하에서 20-배 발현을 유도할 수 있다. PHO5 프로모터는 무기 포스페이트에 의해 조절되지만, MET3 및 MET25 프로모터는 메티오닌 또는 S-아데노실메티오닌에 의해 억제된다 (Keren et al., Mol. Sys. Biol. (2013) 9:701; Redden et al., FEMS Yeast Res. (2015) 15: 1-10).

본 명세서에서 제공되는 바와 같은 프로모터 서열의 목록은 예시로서 제공되고 제한하려는 의도가 아님을 이해해야 한다.

본 발명의 방법 및/또는 세포의 일 양태에 따라서, 세포는 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고, 상기 변이체는 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제 활성을 갖고, V12L, Q96H, Q157R 및/또는 E343V 돌연변이가 SEQ ID NO 01과 상이한 SEQ ID NO 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53 중 어느 하나에 따른 폴리펩티드 서열을 포함하거나, 또는 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37 또는 38을 갖는 상기 폴리펩티드 중 어느 하나의 전체 길이에 대해 적어도 80% 전체 서열 동일성을 갖는 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37 또는 38 중 어느 하나의 기능성 상동체, 변이체 또는 유도체이거나, 또는 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53을 갖는 상기 폴리펩티드 중 어느 하나의 전체 길이에 대해서 적어도 80% 전체 서열 동일성을 갖고 V12L, Q96H, Q157R 및/또는 E343V 돌연변이가 SEQ ID NO 01과 상이한 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53 중 어느 하나의 기능성 상동체, 변이체 또는 유도체인 단백질이다.

본 명세서에서 사용되는, 열거된 임의의 단백질의 전체 길이 서열에 대해 적어도 80% 서열 동일성을 갖는 아미노산 서열을 갖는 단백질은 서열이 개별 단백질의 아미노산 서열의 전체 길이에 대해서 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 91.50%, 92.00%, 92.50%, 93.00%, 93.50%, 94.00%, 94.50%, 95.00%, 95,50%, 96.00%, 96,50%, 97.00%, 97,50%, 98.00%, 98,50%, 99.00%, 99,50%, 99,60%, 99,70%, 99,80%, 99,90% 서열 동일성을 갖는 것으로 이해해야 한다.

SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53을 갖는 폴리펩티드 중 어느 하나의 전체 길이에 대해서 적어도 80% 전체 서열 동일성은 본 명세서에 제공되는 바와 같이, 각각, SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53을 갖는 폴리펩티드 중 어느 하나에 대해서 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 91.50%, 92.00%, 92.50%, 93.00%, 93.50%, 94.00%, 94.50%, 95.00%, 95,50%, 96.00%, 96,50%, 97.00%, 97,50%, 98.00%, 98,50%, 99.00%, 99,50%, 99,60%, 99,70%, 99,80%, 99,90% 전체 서열 동일성으로서 이해해야 한다.

본 발명의 방법 및/또는 세포의 바람직한 양태에 따라서, 세포는 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고, 상기 변이체는 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제 활성을 갖고 V12L, Q96H, Q157R 및/또는 E343V 돌연변이가 SEQ ID NO 01과 상이한 SEQ ID NO 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53 중 어느 하나에 따른 폴리펩티드 서열을 포함하는 단백질이다.

본 발명의 방법 및/또는 세포의 다른 바람직한 양태에 따라서, 세포는 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고, 상기 변이체는 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제 활성을 갖고, 각각 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53 중 어느 하나의 아미노산 서열에 대해 적어도 200 아미노산 잔기의 범위에 걸쳐서 적어도 80.0% 동일한 서열인 아미노산 서열을 포함하거나 또는 그로 이루어지는 폴리펩티드이고 V12L, Q96H, Q157R 및/또는 E343V 돌연변이가 SEQ ID NO 01과 상이한 단백질이다. 바람직하게, 상기 변이체는 각각, SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53 중 어느 하나의 아미노산 서열에 대해서, 적어도 200, 적어도 210, 적어도 220, 적어도 230, 적어도 240, 적어도 250의 범위에 걸쳐서, 바람직하게 아미노산 잔기의 전체 개수까지의 아미노산 서열과 적어도 80.0%, 적어도 85.0%, 적어도 90.0%, 적어도 95.0%, 적어도 96.0%, 적어도 97.0%, 적어도 98.0%, 적어도 98.5%, 또는 적어도 99% 동일하고, V12L, Q96H, Q157R 및/또는 E343V 돌연변이가 SEQ ID NO 01과 상이한 아미노산 서열을 포함하거나 또는 그로 이루어진다.

본 발명의 방법 및/또는 세포의 다른 바람직한 양태에 따라서, 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제 중 어느 하나의 발현 또는 활성은 세포에서 변형된다. 본 발명의 방법 및/또는 세포의 보다 바람직한 양태에 따라서, 변형된 발현은 본 명세서에 정의된 바와 같이 이해해야 한다. 본 발명의 방법 및/또는 세포의 다른 보다 바람직한 구현예에 따라서, 효소의 변형된 활성은 예를 들어, 효소의 천연 활성과 비교하여, 더 양호한 전환율, 더 빠른 반응 속도, 피드백 억제에 대해 감소된 민감도, 개선된 동역학 및 더 큰 기질 친화성을 포함하는 효소의 증강, 증가 및/또는 개선된 활성으로서 이해해야 한다.

본 명세서에서 사용되는, 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제는 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제 활성을 갖고, D-프룩토스-6-포스페이트 + L-글루타민을 D-글루코사민-6-포스페이트 + L-글루타메이트로 전환시킬 수 있는 단백질이다. D-프룩토스-6-포스페이트 (또는 프룩토스-6-포스페이트)는 헥소스 포스페이트로서 알려진 유기 화합물의 클래스에 속하고, 식별자 PubChem CID 69507로 PubChem에서 기술된다 (National Center for Biotechnology Information (2020). CID 69507, 프룩토스-6-포스페이트에 대한 PubChem 화합물 요약, https://pubchem.ncbi.nlm.nih.gov/compound/Fructose-6-phosphate에서 항목은 2004년 9월 16일 생성되었고, 2020년 10월 10일 수정됨. 2020년 10월 15일 검색됨) 2015년 11월 16일에 생성된 식별자 HMDB0000124를 사용해 Human Metabolome Database version 4.0 (Wishart et al., Nucleic Acids Res. 2007, Jan;35(Database issue):D521-526)을 참조함, 2020년 10월 9일 업데이트되었고, 2020년 10월 16일에 http://www.hmdb.ca/metabolites/HMDB0000124에서 검색됨). 헥소스 포스페이트는 하나 이상의　포스페이트　기로 치환된 헥소스를 함유하는 탄수화물 유도체이다. 프룩토스 6-포스페이트는 효모부터 인간에 이르는, 모든 진핵생물 및 원핵생물에 존재한다. 프룩토스 6-포스페이트는 다수의 효소 반응에 참여한다. 프룩토스 6-포스페이트는 글루코사민 6-포스페이트로부터 생합성될 수 있고, 이것은 효소　글루코사민-6-포스페이트　이소머라제 1에 의해 촉매된다. 프룩토스 6-포스페이트는 효소　글루코스-6-포스페이트　이소머라제의 작용을 통해서 글루코스 6-포스페이트로 전환될 수 있다. 가역적으로, 프룩토스 6-포스페이트는 글루코스-6-포스페이트　이소머라제에 의해 매개되는 베타-D-글루코스 6-포스페이트로부터 생합성될 수 있다. 프룩토스 6-포스페이트는 예를 들어, 펜토스 포스페이트 경로, 글루코스신생합성 경로, 및 해당과정 경로에 관여된다.

L-글루타민은 20개 표준 아미노산 중 하나일뿐만 아니라 또한 다양한 질소-함유 화합물의 합성에서 중요한 중간체이다. 숙주 세포의 글루타민 물질대사와 관련된 가장 중요한 효소는 글루타민 신써타제 및 글루타미나제이다. 글루타민 신써타제는 암모니아를 질소 공급원으로서 사용하여 글루타민으로 글루타메이트의 전환을 촉매한다 (글루타메이트 + NH4⁺ + ATP는 글루타민 + ADP + Pi를 생성시킴). 글루타미나제는 글루타민의 글루타메이트 및 암모늄 이온으로의 가수분해를 촉매하는 효소이다.

본 발명의 다른 양태에 따라서, 방법 및 대사적으로 조작된 세포가 제공되고, 상기 세포는 UDP-N-아세틸글루코사민 (UDP-GlcNAc)을 합성한다. 본 명세서에서 사용되는, 상기 세포는 UDP-GlcNAc를 합성하고 상기 UDP-GlcNAc는 UDP-GlcNAc-유래 뉴클레오시드로 추가로 전환될 수 있다. 본 발명에 따라서, 상기 세포는 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제의 작용을 통해서 상기 세포에서 이용가능하게 만든 D-글루코사민-6-포스페이트의 다단계 전환을 통해서 UDP-GlcNAc를 합성한다. 상이한 다단계 전환이 상기 숙주 세포에 의해 사용되어서 상기 D-글루코사민-6-포스페이트를 UDP-GlcNAc로 전환시킨다. 예를 들어, 제1 전환 반응 세트는 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제 예컨대, 예를 들어 에스. 세레비지아에 유래 GNA1의 작용에 의한 N-아세틸-D-글루코사민-6-포스페이트로 D-글루코사민-6-포스페이트의 제1 전환에 이어서, N-아세틸-D-글루코사민-6-포스페이트가 포스포아세틸글루코사민 뮤타제 예컨대, 예를 들어, 에스. 세레비지아에 유래 PCM1의 작용에 의해 N-아세틸-D-글루코사민-1-포스페이트로 전환되는 제2 반응과, 이어서 UDP-N-아세틸글루코사민 파이로포스포릴라제 예컨대, 예를 들어, 에스. 세레비지아에 유래 QRI1의 작용에 의해 UDP-GlcNAc로 N-아세틸-D-글루코사민-1-포스페이트의 최종 전환을 포함한다. UDP-GlcNAcFH D-글루코사민-6-포스페이트의 다른 다단계 전환은 포스포글루코사민 뮤타제 예컨대, 예를 들어, 이. 콜라이 유래 glmM의 작용에 의한 D-글루코사민-1-포스페이트로 D-글루코사민-6-포스페이트의 제1 전환 및 UDP-N-아세틸글루코사민 파이로포스포릴라제 및 글루코사민-1-포스페이트 N-아세틸트랜스퍼라제의 작용 또는 이기능성 효소 예컨대, 예를 들어, UDP-N-아세틸글루코사민 파이로포스포릴라제 및 글루코사민-1-포스페이트 N-아세틸트랜스퍼라제 활성 둘 모두를 갖는 이. 콜라이의 glmU의 작용에 의해서, UDP-GlcNAc로 D-글루코사민-1-포스페이트의 후속 전환을 포함한다.

본 발명의 바람직한 양태에서, 상기 세포는 UDP-GlcNAc로부터 유래되는 하나 이상의 뉴클레오시드를 합성한다. 예를 들어, UDP-GlcNAc-유래 뉴클레오시드 UDP-N-아세틸갈락토사민 (UDP-GalNAc)은 UDP-N-아세틸글루코사민 4-에피머라제 예컨대, 예를 들어, 플레시오모나스 시겔로이데스 (Plesiomonas shigelloides) 유래 wbgU, 여시니아 엔테로콜리티카 (Yersinia enterocolitica) 유래 gne 또는 슈도모나스 애루지노사 (Pseudomonas aeruginosa)　혈청형 O6 유래 wbpP를 사용한 단일-단계 반응의 작용에 의해서 UDP-GlcNAc로부터 합성될 수 있다. UDP-GlcNAc-유래 뉴클레오시드 CMP-Neu5Ac는 UDP-GlcNAc를 UDP 및 ManNAc로 전환시키는 N-아세틸글루코사민-6-포스페이트 2-에피머라제 또는 UDP-GlcNAc 2'-에피머라제 (예컨대, 예를 들어, 씨. 제주니 (C. jejuni) 또는 아시네토박터 바우만니 (Acinetobacter baumannii) 유래 neuC), 포스포에놀피루베이트 (PEP)를 사용하면서 ManNAc를 Neu5Ac (시알산)로 후속하여 전환시키는 N-아세틸뉴라미네이트 신타제 (예컨대, 예를 들어, 이.콜라이, 씨. 제주니 또는 엔. 메닌지티디스 (N. meningitidis) 유래 neuB), 및 Neu5Ac 및 CTP로부터 CMP-Neu5Ac를 최종적으로 합성하는 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 또는 CMP-시알산 신써타제 (예컨대, 예를 들어, 씨. 제주니 또는 엔. 메닌지티디스 유래 neuA)가 관여되는 잘-정돈된 다단계 반응에 의해서 UDP-GlcNAc로부터 합성될 수 있다. CMP-Neu5Ac는 또한 UDP-GlcNAc를 UDP 및 ManNAc로 전환시키고 ManNAc를 ManNAc-6-포스페이트로 후속 인산화시키는 이기능성 UDP-GlcNAc 2'-에피머라제/ManNAc 키나제 (예컨대, 예를 들어, 엠. 무스쿨루스 (M. musculus) 유래 gne), PEP를 사용하면서 ManNAc-6-포스페이트를 Neu5Ac-9-포스페이트로 전환시키는 Neu5Ac-9-포스페이트 신타제 (예컨대, 예를 들어, 알. 노르베지쿠스 (R. norvegicus) 유래 Neu5Ac-9-포스페이트 신타제), Neu5Ac-9-포스페이트를 Neu5Ac로 탈인산화시키는 Neu5Ac-9-포스페이트 포스파타제 (예컨대, 예를 들어, 알. 노르베지쿠스 유래 Neu5Ac-9-Pase) 및 Neu5Ac 및 CTP로부터 CMP-Neu5Ac를 최종적으로 합성하는 CMP-시알산 신써타제 (예컨대, 예를 들어, 엠. 무스쿨루스 (M. musculus) 유래 Cmas)를 포함하는 대안 경로를 통해서 UDP-GlcNAc로부터 합성될 수 있다. 차례로, CMP-Neu5Ac는 척추동물　CMP-Neu5Ac 히드록실라제 (CMAH) 효소에 의해 수행되는 히드록실화 반응을 통해서 CMP-Neu5Gc로 전환될 수 있다. UDP-ManNAc는 UDP-GlcNAc 2-에피머라제 (예컨대, 예를 들어, 스타필로코쿠스 아우레우스 (Staphylococcus aureus) 유래, 이. 콜라이 유래 RffE, 에스. 뉴모니아에 (S. pneumoniae) 유래 Cps19fK, 및 에스. 엔테리카 (S. enterica) 유래 RfbC)에 의해 수행되는 에피머화 반응을 통해서 UDP-GlcNAc로부터 직접적으로 합성될 수 있다. UDP-D-N-아세틸글루코사민은 또한 글루코- (퀴노보사민), 갈락토-, 만노- (람노사민) 및 탈로-구성으로 2-아세타미도-2,6-디데옥시-L-헥소스의 생산을 위한 공통 전구체이다. 예를 들어, UDP-GlcNAc는 다기능성 효소 예컨대 비브리오 콜레라에 (Vibrio cholerae) 혈청형 O37 유래 WbvB에 의해 UDP-2-아세타미도-2,6-디데옥시-L-릭소-4-헥술로스로 전환될 수 있다. 이러한 UDP-2-아세타미도-2,6-디데옥시-L-릭소-4-헥술로스는 C-4 리덕타제 예컨대, 브이. 콜레라에 혈청형 O37 유래 WbvR에 의해 전환되어서 UDP-2-아세타미도-L-람노스를 산출한다. 이러한 UDP-2-아세타미도-L-람노스는 WbvD, 또한 브이. 콜레라에 혈청형 O37 유래 효소에 의해서 UDP-2-아세타미도-L-퀴노보스로 에피머화될 수 있다. UDP-GlcNAc로부터 UDP-N-아세틸-D-푸코사민 (UDP-FucNAc)의 합성을 위한 병행 경로는 슈도모나스 애루지노사 (Pseudomonas aeruginosa) O11 유래의 3개 효소 WbjB, WbjC, 및 WbjD 또는 스타필로코쿠스 아우레우스 (Staphylococcus aureus) 5형 유래 CapE, CapF, 및 CapG를 사용해 수행될 수 있다. UPD-GlcNAc는 또한 "인버팅" 4,6-데히드라타제 예컨대, 예를 들어, 에이치. 파일로리 (H. pylori) 유래 PseB 또는 피. 애루지노사 (P. aeruginosa) 유래 FlaA1을 사용하여 UDP-2-아세타미도-2,6-디데옥시-β-L-아라비노-4-헥술로스로 전환될 수 있다. 피. 애루지노사 O11 유래 WbjC 및 에스. 아우레우스 5형 유래 CapF를 사용하여 또한 UDP-2-아세타미도-2,6-디데옥시-β-L-아라비노-4-헥술로스를 UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAc)으로 전환될 수 있다.

본 발명의 다른 바람직한 양태에서, 상기 세포는 추가로 UDP-N-아세틸갈락토사민 (UDP-GalNAc), UDP-N-아세틸만노사민 (UDP-ManNAc), UDP-글루코스 (UDP-Glc), UDP-갈락토스 (UDP-Gal), GDP-만노스 (GDP-Man), UDP-글루쿠로네이트, UDP-갈락투로네이트, UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, UDP-2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, UDP-N-아세틸-L-람노사민 (UDP-L-RhaNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-만노스), dTDP-N-아세틸푸코사민, UDP-N-아세틸푸코사민 (UDP-L-FucNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-갈락토스), UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAC 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스), UDP-N-아세틸무람산, UDP-N-아세틸-L-퀴노보사민 (UDP-L-QuiNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-글루코스), CMP-시알산 (CMP-Neu5Ac), CMP-N-글리코릴뉴라민산 (CMP-Neu5Gc), GDP-푸코스 (GDP-Fuc), GDP-람노스 및 UDP-자일로스를 포함하는 목록으로부터 선택되는 뉴클레오티드-당 또는 뉴클레오시드을 합성한다.

본 발명의 다른 양태에 따라서, 상기 세포는 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산에서 상기 UDP-N-아세틸글루코사민 (UDP-GlcNAc)을 사용한다. 본 발명의 바람직한 양태에서, 상기 단당 서브유닛 중 적어도 하나는 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 및 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택된다.

본 발명의 한 양태에서, 상기 이당은 2종의 상이한 단당 서브유닛으로 구성된 글리칸 구조를 포함하고, 상기 단당 서브유닛 중 적어도 하나는 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 및 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택된다. 본 명세서에서 사용되는, 상기 이당로부터의 양쪽 단당 서브유닛은 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 및 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택될 수 있지만 서로 상이해야 한다.

대안적으로, 제1 단당 서브유닛은 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 및 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택되고, 상기 제1 단당 서브유닛과 상이한 제2 단당 서브유닛은 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, N-글리코릴뉴라민산, 글루코스, 갈락토스, 만노스, 푸코스, 람노스, 자일로스, 글루쿠로네이트 및 갈락투로네이트를 포함하는 목록으로부터 선택된다.

상기 이당의 예는 락토-N-비오스 (Gal-b1,3-GlcNAc, LNB), 갈락토-N-비오스 (Gal-b1,3-GalNAc, Gal-b1,6-GalNAc), N-아세틸락토사민 (Gal-b1,4-GlcNAc, LacNAc), LacDiNAc (GalNAc-b1,4-GlcNAc), N-아세틸갈락토사미닐글루코스 (GalNAc-b1,4-Glc), N-아세틸글루코사미닐글루코스 (GlcNAc-b1,4-Glc), Fuc-a1,3-GlcNAc, Man-b1,4-GlcNAc 또는 ManNAc-b1,4-GlcNAc를 포함한다.

본 발명의 다른 양태에서, 상기 올리고당은 3종 이상의 단당 서브유닛으로 구성된 글리칸 구조를 포함하고, 상기 단당 서브유닛 중 적어도 하나는 상기 올리고당의 다른 단당 서브유닛과 상이하고, 올리고당의 단당 서브유닛의 적어도 하나는 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 및 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택된다. 본 명세서에서 사용되는, 상기 올리고당은 3종의 단당 서브유닛으로 구성될 수 있고, 상기 단당 중 하나는 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 및 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택되고, 상기 제1 단당은 상기 올리고당의 다른 2종 단당 서브유닛과 상이하고, 후자의 2종 단당은 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, N-글리코릴뉴라민산, 글루코스, 갈락토스, 만노스, 푸코스, 람노스, 자일로스, 글루쿠로네이트 및 갈락투로네이트를 포함하는 목록으로부터 선택된다. 본 명세서에서 사용되는, 상기 올리고당은 3종 이상의 단당 서브유닛으로 구성된 글리칸 구조를 포함하고, 상기 단당 중 적어도 하나는 올리고당에 존재하는 다른 서브유닛과 상이하고, 상기 단당 서브유닛 중 하나는 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, N-글리코릴뉴라민산을 포함하는 목록으로부터 선택된다.

상기 올리고당의 예는 6'-시알릴락토스, 3'-시알릴락토스, 3,6-디시알릴락토스, 6,6'-디시알릴락토스, 3,6-디시알릴락토-N-테트라오스, 8,3-디시알릴락토스, 락토-N-트리오스, 락토-N-테트라오스, 락토-N-네오테트라오스, 시알릴락토-N-네오테트라오스 d, 시알릴락토-N-네오테트라오스 c, 시알릴락토-N-테트라오스 b, 시알릴락토-N-테트라오스 a, 락토-N-디푸코헥사오스 I, 락토-N-디푸코헥사오스 II, 락토-N-헥사오스, 락토-N-네오헥사오스, 파라-락토-N-헥사오스, 모노푸코실모노시알릴락토-N-네오테트라오스 c, 모노푸코실 파라-락토-N-헥사오스, 모노푸코실락토-N-헥사오스 III, 이성질체 푸코실화 락토-N-헥사오스 III, 이성질체 푸코실화 락토-N-헥사오스 I, 시알릴락토-N-헥사오스, 시알릴락토-N-네오헥사오스 II, 디푸코실-파라-락토-N-헥사오스, 디푸코실락토-N-헥사오스, 디푸코실락토-N-헥사오스 a, 디푸코실락토-N-헥사오스 c 또는 갈락토실화 키토산을 포함한다.

본 발명의 다른 바람직한 양태에서, 상기 글리코실화된 생산물은 UDP-GlcNAc로부터 유래되는 단당 및/또는 GlcNAc를 함유하는 포유동물 모유 이당 또는 올리고당, 바람직하게 GlcNAc 및/또는 UDP-GlcNAc로부터 유래되는 단당을 함유하는 인간 모유 이당 또는 올리고당, O-항원, 엔테로박테리아 공통 항원 (ECA), 캡슐 다당류에 존재하는 올리고당 반복부, 펩티도글리칸 (PG) 및 인간 ABO식 혈액형 체계의 항원을 포함하는 목록으로부터 선택된다.

본 발명의 방법 및/또는 세포의 다른 양태에서, 상기 세포는 본 명세서에서 정의된 바와 같은 푸코실트랜스퍼라제, 시알릴트랜스퍼라제, 갈락토실트랜스퍼라제, 글루코실트랜스퍼라제, 만노실트랜스퍼라제, N-아세틸글루코사미닐트랜스퍼라제, N-아세틸갈락토사미닐트랜스퍼라제, N-아세틸만노사미닐트랜스퍼라제, 자일로실트랜스퍼라제, 글루쿠로닐트랜스퍼라제, 갈락투로닐트랜스퍼라제, 글루코사미닐트랜스퍼라제, N-글리코릴뉴라미닐트랜스퍼라제, 람노실트랜스퍼라제, N-아세틸람노실트랜스퍼라제, UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제 및 푸코사미닐트랜스퍼라제를 포함하는 목록으로부터 선택되는 글리코실트랜스퍼라제를 발현한다.

본 발명의 방법 및/또는 세포의 바람직한 양태에서, 상기 푸코실트랜스퍼라제는 알파-1,2-푸코실트랜스퍼라제, 알파-1,3-푸코실트랜스퍼라제, 알파-1,3/4-푸코실트랜스퍼라제, 알파-1,4-푸코실트랜스퍼라제 및 알파-1,6-푸코실트랜스퍼라제를 포함하는 목록으로부터 선택된다. 본 발명의 방법 및/또는 세포의 다른 바람직한 양태에서, 상기 시알릴트랜스퍼라제는 알파-2,3-시알릴트랜스퍼라제, 알파-2,6-시알릴트랜스퍼라제 및 알파-2,8-시알릴트랜스퍼라제를 포함하는 목록으로부터 선택된다. 본 발명의 방법 및/또는 세포의 다른 바람직한 양태에서, 상기 갈락토실트랜스퍼라제는 베타-1,3-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제, 베타-1,4-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제, 알파-1,3-갈락토실트랜스퍼라제 및 알파-1,4-갈락토실트랜스퍼라제를 포함하는 목록으로부터 선택된다. 본 발명의 방법 및/또는 세포의 다른 바람직한 양태에서, 상기 글루코실트랜스퍼라제는 알파-글루코실트랜스퍼라제, 베타-1,2-글루코실트랜스퍼라제, 베타-1,3-글루코실트랜스퍼라제 및 베타-1,4-글루코실트랜스퍼라제를 포함하는 목록으로부터 선택된다. 본 발명의 방법 및/또는 세포의 다른 바람직한 양태에서, 상기 만노실트랜스퍼라제는 알파-1,2-만노실트랜스퍼라제, 알파-1,3-만노실트랜스퍼라제 및 알파-1,6-만노실트랜스퍼라제를 포함하는 목록으로부터 선택된다. 본 발명의 방법 및/또는 세포의 다른 바람직한 양태에서, 상기 N-아세틸글루코사미닐트랜스퍼라제는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 및 베타-1,6-N-아세틸글루코사미닐트랜스퍼라제를 포함하는 목록으로부터 선택된다. 본 발명의 방법 및/또는 세포의 다른 바람직한 양태에서, 상기 N-아세틸갈락토사미닐트랜스퍼라제는 알파-1,3-N-아세틸갈락토사미닐트랜스퍼라제이다.

본 발명의 방법 및/또는 세포의 다른 양태에서, 상기 세포는 본 명세서에 정의된 바와 같은 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제, 포스포아세틸글루코사민 뮤타제, UDP-N-아세틸글루코사민 파이로포스포릴라제, 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제, UTP--글루코스-1-포스페이트 우리딜릴트랜스퍼라제, UDP-글루코스 4-에피머라제, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제, 락토스 퍼미아제, UDP-N-아세틸글루코사민 2-에피머라제, N-아세틸뉴라미네이트 신타제, N-아실뉴라미네이트 시티딜릴트랜스퍼라제, 글루코스-6-포스페이트 이소머라제 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스 2-에피머라제를 포함하는 목록으로부터 선택되는 효소 중 어느 하나 이상을 추가로 발현한다.

본 발명의 방법 및/또는 세포의 추가 양태에서, 세포는 상기 효소 및/또는 글리코실트랜스퍼라제 중 적어도 하나의 발현 또는 활성이 변형된다. 바람직한 구현예에서, 상기 효소 및/또는 글리코실트랜스퍼라제는 변형된 발현 또는 활성을 갖는 세포의 내생성 단백질이고, 바람직하게 상기 내생성 효소 및/또는 글리코실트랜스퍼라제는 과발현되고; 대안적으로 상기 효소 및/또는 글리코실트랜스퍼라제는 상기 세포에서 이종으로 도입되어서 발현되는, 바람직하게 과발현되는 이종성 단백질이다. 상기 내생성 효소 및/또는 글리코실트랜스퍼라제는 또한 이종성 효소 및/또는 글리코실트랜스퍼라제를 발현하는 세포에서 변형된 발현을 가질 수 있다.

본 발명의 방법 및/또는 세포의 다른 바람직한 구현예에서, 상기 배양 동안, 상기 세포는 세포 밖으로 상기 글리코실화된 생산물을 배출한다. 본 발명의 방법 및/또는 세포의 보다 바람직한 구현예에서, 상기 배양 동안, 상기 세포는 세포 밖으로 이당 또는 올리고당을 배출한다. 본 명세서에서 사용되는, 이당 또는 올리고당을 포함하는 상기 글리코실화된 생산물의 상기 배출은 임의 방법에 의해서, 예를 들어, 능동 또는 수동 수송을 통해서, 소포체 (ER) 또는 이로부터 유래되는 임의 소포의 사용을 통해서 수행된다.

다른 구현예에 따라서, 본 발명은 세포 밖으로 이당 또는 올리고당을 배출하는 효모 또는 진균 세포를 제공한다. 바람직한 구현예에서, 본 발명은 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 또는 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택되는 적어도 하나의 단당 단위를 포함하는 이당 또는 올리고당을 배출하는 효모 또는 진균 세포를 제공한다. 보다 바람직한 구현예에서, N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 또는 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택되는 적어도 하나의 단당 단위를 포함하는 이당 또는 올리고당을 배출하는 상기 효모 또는 진균 세포는 본 명세서에 기술된 바와 같은 대사적으로 조작된 세포이다.

추가 구현예에서, 본 발명은 세포에 의해서 이당 또는 올리고당을 배출하기 위한 방법을 제공한다. 바람직한 추가 구현예에서, 상기 방법은 본 명세서에 기술된 바와 같은 대사적으로 조작된 세포를 사용한다. 보다 바람직한 추가 구현예에서, 상기 방법은 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 또는 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택되는 적어도 하나의 단당 단위를 포함하는 이당 또는 올리고당의 배출에 사용될 수 있다.

본 발명의 방법 및/또는 세포의 다른 구현예에서, 세포는 상기 글리코실화된 생산물의 합성을 위한 적어도 하나의 전구체를 사용한다. 바람직한 구현예에서, 상기 세포는 상기 글리코실화된 생산물의 합성을 위해 2종 이상의 전구체를 사용한다.

본 발명의 방법 및/또는 세포의 다른 구현예에서, 세포는 상기 글리코실화된 생산물의 합성을 위한 전구체를 생산한다. 바람직한 구현예에서, 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 하나 이상의 전구체를 생산한다. 보다 바람직한 구현예에서, 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 상기 전구체 중 어느 하나의 최적 생산을 위해 변형된다.

바람직한 구현예에서, 본 발명은 세포를 사용해 글리코실화된 생산물의 제조를 위한 방법을 제공하고, 상기 세포는 상기 전구체 중 어느 하나를 상기 글리코실화된 생산물을 완전하게 전환시킨다.

용어 "전구체"는 본 명세서에 개시된 바와 같은 정의에서 설명한 바와 같이 이해해야 한다.

본 발명의 다른 양태는 방법 및 세포를 제공하고, UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물은 본 명세서에 기술된 바와 같은 진균, 효모, 박테리아, 곤충, 동물 또는 식물 발현 시스템 또는 세포, 또는 원충 세포에서 및/또는 그에 의해서 생산된다. 발현 시스템 또는 세포는 박테리아, 효모, 또는 진균을 포함하는 목록으로부터 선택되거나, 또는 식물, 동물 또는 원충 세포를 의미한다. 후자의 박테리아는 바람직하게 프로테오박테리아 (Proteobacteria) 문 또는 피르미큐테스 (Firmicutes) 문 또는 시아노박테리아 (Cyanobacteria) 문 또는 데이노코쿠스-써무스 (Deinococcus-Thermus) 문에 속한다. 프로테오박테리아 문에 속하는 후자의 박테리아는 바람직하게 엔테로박테리아세아에 과, 바람직하게 에스케리치아 콜라이 (Escherichia coli) 종에 속한다. 후자의 박테리아는 바람직하게 에스케리치아 콜라이 종에 속하는 임의 균주, 예컨대, 제한없이, 에스케리치아 콜라이 B, 에스케리치아 콜라이 C, 에스케리치아 콜라이 W, 에스케리치아 콜라이 K12, 에스케리치아 콜라이 니슬 (Nissle)에 관한 것이다. 보다 특히, 후자의 용어는 실험실 환경에 잘 적응하고, 야생형 균주와 달리, 장에서 생존하는 그들 능력을 상실한, 배양된 에스케리치아 콜라이 균주 - 이.콜라이 K12 균주로서 지정됨 -에 관한 것이다. 이. 콜라이 K12 균주의 잘 알려진 예는 K12 야생형, W3110, MG1655, M182, MC1000, MC1060, MC1061, MC4100, JM101, NZN111 및 AA200이다. 따라서, 본 발명은 특히 상기 표시된 바와 같은 돌연변이 및/또는 형질전환된 에스케리치아 콜라이 세포 또는 균주에 관한 것이고, 상기 이.콜라이 균주는 K12 균주이다. 보다 바람직하게, 에스케리치아 콜라이 K12 균주는 이.콜라이 MG1655이다. 피르미큐테스 문에 속하는 후자의 박테리아는 바람직하게 바실리 (Bacilli), 바람직하게 락토바실리알레스 (Lactobacilliales)로서, 예컨대, 락토바실러스 락티스 (Lactobacillus lactis), 류코노스톡 메센테로이데스 (Leuconostoc mesenteroides) 구성원, 또는 바실랄레스 (Bacillales)로서, 예컨대 바릴러스 (Bacillus) 속의 구성원, 예컨대, 바실러스 서브틸리스 (Bacillus subtilis), 또는 비. 아밀로리케파시엔스 (B. amyloliquefaciens)에 속한다. 후자의 박테리아는 아시네토박테리아 문에 속하고, 바람직하게 코리네박테리아세아에 (Corynebacteriaceae) 과에 속하는 것으로서, 코리네박테리움 글루타미쿰 (Corynebacterium glutamicum) 또는 씨. 아페르멘탄스 (C. afermentans)가 있거나, 또는 스트렙토마이세타세아에 (Streptomycetaceae) 과에 속하는 것으로서 스트렙토마이세스 그리세우스 (Streptomyces griseus) 또는 에스. 프라디아에 (S. fradiae) 구성원이 있다. 후자의 효모는 바람직하게 아스코마이코타 (Ascomycota) 문 또는 바시디오마이코타 (Basidiomycota) 문 또는 듀테로마이코타 (Deuteromycota) 문 또는 자이고마이세테스 (Zygomycetes) 문에 속한다. 후자의 효모는 바람직하게 사카로마이세스 (Saccharomyces) 속 (예컨대, 예를 들어, 사카로마이세스 세레비지아에 (Saccharomyces cerevisiae), 에스. 바야누스 (S. bayanus), 에스. 보울라르디 (S. boulardii)의 구성원), 자이고사카로마이세스 (Zygosaccharomyces), 피키아 (Pichia) (예컨대, 예를 들어, 피키아 파스토리스 (Pichia pastoris), 피. 아노말라 (P. anomala), 피. 클루이베리 (P. kluyveri)) 구성원), 코마가타엘라 (Komagataella), 한세눌라 (Hansenula), 클루이베로마이세스 (Kluyveromyces) (예컨대, 예를 들어, 클루이베로마이세스 락티스 (Kluyveromyces lactis), 케이. 마르시아누스 (K. marxianus), 케이. 써모톨레란스 (K. thermotolerans) 구성원) 또는 데바로마이세스 (Debaromyces)에 속한다. 후자의 진균은 바람직하게 리조푸스 (Rhizopus), 딕티오스텔리움 (Dictyostelium), 페니실리움 (Penicillium), 무코르 (Mucor) 또는 아스퍼질러스 (Aspergillus) 속에 속한다. 식물 세포는 개화 및 비-개화 식물의 세포를 비롯하여, 조류 세포, 예를 들어, 클라미도모나스 (Chlamydomonas), 클로렐라 (Chlorella) 등을 포함한다. 바람직하게, 상기 식물은 담배, 알파파, 벼, 토마토, 목화, 유채, 대두, 옥수수, 또는 행운목이다. 후자의 동물 세포는 바람직하게 비-인간 포유동물 (예를 들어, 소, 물소, 돼지, 양, 마우스, 래트), 조류 (예를 들어, 닭, 오리, 타조, 칠면조, 꿩), 어류 (예를 들어, 황새치, 연어, 참치, 농어, 송어, 메기), 무척추동물 (예를 들어, 바닷가재, 게, 새우, 조개, 굴, 홍합, 성게), 파충류 (예를 들어, 뱀, 악어, 거북이), 양서류 (예를 들어, 개구리) 또는 곤충 (예를 들어, 파리, 선충)으로부터 유래되거나 또는 배아 줄기 세포를 제외한 인간 세포로부터 유래되는 유전자 조작된 세포주이다. 인간 및 비-인간 포유동물 세포 둘 모두는 바람직하게 WO21067641에 기술된 바와 같이, 상피 세포 예컨대, 예를 들어, 유선 상피 세포, 배아 신장 세포 (예를 들어, HEK293 또는 HEK 293T 세포), 섬유아세포, COS 세포, 중국 햄스터 난소 (CHO) 세포, 쥐 골수종 세포 예컨대, 예를 들어, N20, SP2/0 또는 YB2/0 세포, NIH-3T3 세포, 비-유선 성체 줄기 세포 또는 이의 유도체를 포함하는 목록으로부터 선택된다. 후자의 곤충 세포는 바람직하게 스포돕테라 프루기페르다 (Spodoptera frugiperda) 예컨대, 예를 들어, Sf9 또는 Sf21 세포, 봄빅스 모리 (Bombyx mori), 마메스트라 브라시카에 (Mamestra brassicae), 트리코플루시아 니 (Trichoplusia ni) 예컨대, 예를 들어, BTI-TN-5B1-4 세포 또는 드로소필라 멜라노가스터 (Drosophila melanogaster) 예컨대, 예를 들어, 드로소필라 (Drosophila) S2 세포로부터 유래된다. 후자의 원충 세포는 바람직하게 리슈마니아 타렌톨라에 (Leishmania tarentolae) 세포이다.

본 명세서에서 사용되는 미생물 또는 세포는 주요 탄소 공급원으로서 단당, 이당, 올리고당, 다당류, 폴리올, 당밀, 옥수수 침지액, 펩톤, 트립톤, 효모 추출물 또는 이의 혼합물 예컨대, 예를 들어, 혼합 공급원료, 바람직하게 혼합 단당 공급원료, 예컨대, 예를 들어, 가수분해 수크로스를 포함하는 복합 배지 상에서 성장할 수 있다. 용어 주요는 관심 바이오산물, 생물량 형성, 이산화탄소 및/또는 부산물 형성 (예컨대, 산 및/또는 알콜, 예컨대, 아세테이트, 락테이트, 및/또는 에탄올)을 위해 가장 중요한 탄소 공급원을 의미하는 것으로서, 다시 말해서, 모든 필요한 탄소의 20, 30, 40, 50, 60, 70, 75, 80, 85, 90, 95, 98, 99%가 상기 표시된 탄소 공급원으로부터 유래된다. 본 발명의 일 구현예에서, 상기 탄소 공급원은 상기 유기체에 대한 유일한 탄소 공급원이고, 다시 말해서, 모든 필요한 탄소의 100%는 상기 표시된 탄소 공급원으로부터 유래된다. 일반적인 주요 탄소 공급원은 글루코스, 글리세롤, 프룩토스, 말토스, 락토스, 아라비노스, 말토-올리고당, 말토트리오스, 솔비톨, 자일로스, 람노스, 수크로스, 갈락토스, 만노스, 메탄올, 에탄올, 트레할로스, 전분, 셀룰로스, 헤미-셀룰로스, 당밀, 옥수수 침지액, 고-프룩토스 시럽, 아세테이트, 시트레이트, 락테이트 및 피루베이트를 포함하지만, 이에 제한되지 않는다. 용어 복합 배지는 정확한 구성이 결정되지 않은 배지를 의미하는 것이다. 예는 당밀, 옥수수 침지액, 펩톤, 트립톤 또는 효모 추출물이다.

추가의 바람직한 구현예에서, 본 명세서에 기술된 미생물 또는 세포는 본 명세서에서 참조로 편입되는, WO2012/007481에 기술된 바와 같이 생산 경로 및 생물량 경로를 갖는 분할 물질대사를 사용한다. 상기 유기체는 예를 들어, 포스포글루코이소머라제 유전자, 포스포프룩토키나제 유전자, 프룩토스-6-포스페이트 알돌라제 유전자, 프룩토스 이소머라제 유전자, 및/또는 프룩토스:PEP 포스포트랜스퍼라제 유전자로부터 선택되는 유전자를 변경시켜서, 프룩토스-6-포스페이트를 축적하도록 유전자 변형될 수 있다 .

본 발명에 따라서, 본 명세서에 기술된 바와 같은 방법은 바람직하게 상기 글리코실화된 생산물을 상기 배양으로부터 분리시키는 단계를 포함한다.

용어 "상기 배양으로부터 분리"는 세포 및/또는 이의 성장 배지로부터 상기 글리코실화된 생산물을 수확, 수집, 또는 회수하는 것을 의미한다.

상기 글리코실화된 생산물은 세포가 성장된, 수성 배양 배지로부터 통상의 방식으로 분리될 수 있다. 상기 글리코실화된 생산물이 글리코실화된 생산물을 생산하는 세포에 여전히 존재하는 경우에, 세포 밖으로 상기 글리코실화된 생산물을 배출하거나 또는 유리시키는 통상의 방식은 예컨대, 높은 pH, 열충격, 초음파 처리, 프렌치 프레스, 균질화, 효소적 가수분해, 화학적 가수분해, 용매 가수분해, 세제, 가수분해 등을 사용하는 세포 파괴가 사용될 수 있다. 배양 배지 및/또는 세포 추출물은 함께 및 분리하여 이후 추가로 상기 글리코실화된 생산물을 분리하는데 사용될 수 있다. 이것은 바람직하게 현탁된 미립자 및 오염물, 특히 유전자 조작된 세포를 배양하여서 생산되는 세포, 세포 성분, 불용성 대사산물 및 찌꺼기를 제거하기 위해서 상기 글리코실화된 생산물을 함유하는 혼합물을 청징화시키는 것을 포함한다. 이러한 단계에서, 상기 글리코실화된 생산물을 함유하는 혼합물은 통상의 방식으로 청징화될 수 있다. 바람직하게, 상기 글리코실화된 생산물을 함유하는 혼합물은 원심분리, 응결, 경사법 및/또는 여과에 의해 청징화된다. 상기 글리코실화된 생산물을 함유하는 혼합물로부터 상기 글리코실화된 생산물을 분리시키는 다른 단계는 바람직하게 후속 분리 단계를 방해할 수 있는 펩티드, 아미노산, RNA 및 DNA 및 임의의 내독소 및 당지질을 비롯한, 실질적으로 모든 단백질을 상기 글리코실화된 생산물을 함유하는 혼합물로부터, 바람직하게 청징화된 이후에, 제거하는 것을 포함한다. 이러한 단계에서, 단백질 및 관련 불순물은 통상의 방식으로 상기 글리코실화된 생산물을 함유하는 혼합물로부터 제거될 수 있다. 바람직하게, 단백질, 염, 부산물, 색소, 내독소 및 다른 관련 불순물은 상기 글리코실화된 생산물을 함유하는 혼합물로부터, 한외여과, 나노여과, 2-층 분할법, 역삼투, 미세여과, 활성 차콜 또는 탄소 처리, 비이온성 계면활성제 처리, 효소 분해, 접선 유동 고-성능 여과, 접선 유동 한외여과, 전기영동 (예를 들어, 슬랩-폴리아크릴아미드 또는 소듐 도데실 술페이트-폴리아크릴아미드 겔 전기영동 (PAGE) 사용), 친화성 크로마토그래피 (예를 들어, DEAE-세파로스, 폴리-L-리신 및 폴리믹신-B, 내독소-선택적 흡착제 매트릭스를 포함한 친화성 리간드 사용), 이온 교환 크로마토그래피 (예컨대, 제한없이, 양이온 교환, 음이온 교환, 혼합층 이온 교환, 인사이드-아웃 리간드 부착), 소수성 상호작용 크로마토그래피 및/또는 겔 여과 (즉, 크기 배제 크로마토그래피), 특히 크로마토그래피, 보다 특히 이온 교환 크로마토그래피 또는 소수성 상호작용 크로마토그래피 또는 리간드 교환 크로마토그래피 또는 전기투석을 통해서 제거된다. 크기 배제 크로마토그래피, 단백질 및 관련 불순물이 크로마토그래피 매질 또는 선택된 막에 의해 유지되는 것을 제외하고, 상기 글리코실화된 생산물은 상기 글리코실화된 생산물을 함유하는 혼합물에 잔류한다.

추가의 바람직한 구현예에서, 본 명세서에 기술된 바와 같은 방법은 또한 상기 글리코실화된 생산물의 추가 정제를 위해 제공된다. 상기 글리코실화된 생산물의 추가 정제는 예를 들어, (활성화된) 차콜 또는 탄소, 나노여과, 한외여과, 전기영동, 효소 처리 또는 이온 교환, 온도 조정, pH 조정 또는 알칼리 또는 산성 용액으로 pH 조정의 사용을 통해 수행되어서 임의의 잔존 DNA, 단백질, LPS, 내독소, 또는 다른 불순물을 제거할 수 있다. 알콜, 예컨대, 에탄올, 및 수성 알콜 혼합물이 또한 사용될 수 있다. 다른 정제 단계는 생산물의 결정화, 증발 또는 침전에 의해 수행된다. 다른 정제 단계는 생산된 글리코실화된 생산물을 건조, 예를 들어, 분무 건조, 동결건조, 분무 냉동 건조, 냉동 분무 건조, 밴드 건조, 벨트 건조, 진공 밴드 건조, 진공 벨트 건조, 드럼 건조, 롤러 건조, 진공 드럼 건조 또는 진공 롤러 건조하는 것이다.

예시적인 구현예에서, 생산된 글리코실화된 생산물의 분리 및 정제는 임의 순서로 하기 단계를 포함하는, 방법으로 수행된다:

a) 배양 또는 이의 청징화된 형태를 생산된 글리코실화된 생산물의 체류를 보장하고 단백질, 염, 부산물, 색소 및 다른 관련 불순물의 적어도 일부분은 통과하도록 허용하는 600-3500 Da의 분자량 컷-오프 (MWCO)를 갖는 나노여과막과 접촉시키는 단계,

b) 무기 전해질의 수용액과 상기 막을 사용하여, 단계 a)로부터의 체류물에 대해 투석여과 과정을 수행한 이후에, 과량의 전해질을 제거하기 위해 순수로 임의적인 투과여과를 수행하는 단계,

c) 및 상기 전해질의 양이온으로부터 염의 형태로 글리코실화된 생산물이 농축된 체류물을 수집하는 단계.

대안적인 예시적인 구현예에서, 생산된 글리코실화된 생산물의 분리 및 정제는 임의 순서로 하기 단계를 포함하는, 방법으로 수행된다: 배양 또는 이의 청징화된 형태에 대해서 상이한 막을 사용하여 2개 막 여과 단계를 수행하는 단계로서,

- 하나의 막은 약 300 달톤과 약 500 달톤 사이의 분자량 컷-오프를 갖고,

- 다른 막은 약 600 달톤과 약 800 달톤 사이의 분자량 컷-오프를 갖는다.

대안적인 예시적인 구현예에서, 생산된 글리코실화된 생산물의 분리 및 정제는 배양 또는 이의 청징화된 형태를 한 단계에서 H+-형태의 강한 양이온 교환 수지, 및 다른 단계에서 유리 염기 형태의 약한 음이온 교환 수지로 처리하는 단계를 포함하는 방법으로 수행되고, 상기 단계들은 임의 순서로 수행될 수 있다.

대안적인 예시적인 구현예에서, 생산된 글리코실화된 생산물의 분리 및 정제는 하기 방식으로 수행된다. 생산된 글리코실화된 생산물, 생물량, 배지 성분 및 오염물을 포함하는 배양은 하기 정제 단계에 적용된다:

i) 배양으로부터 생물량의 분리 단계,

ii) 양으로 하전된 물질의 제거를 위해 양이온성 이온 교환기 처리 단계,

iii) 음으로 하전된 물질의 제거를 위해 음이온성 이온 교환기 처리 단계,

iv) 나노여과 단계 및/또는 전기투석 단계,

80% 이상의 순도로 생산된 글리코실화된 생산물을 포함하는 정제된 용액이 제공된다. 임의로 정제된 용액은 분무 건조, 동결건조, 분무 냉동 건조, 냉동 분무 건조, 밴드 건조, 벨트 건조, 진공 밴드 건조, 진공 벨트 건조, 드럼 건조, 롤러 건조, 진공 드럼 건조 및 진공 롤러 건조를 포함하는 목록으로부터 선택되는 어느 하나 이상의 건조 단계에 의해 건조된다.

대안적인 예시적인 구현예에서, 생산된 글리코실화된 생산물의 분리 및 정제는 임의 순서로 하기 단계를 포함하는 방법으로 수행된다: 배양의 효소 처리 단계; 배양으로부터 생물량의 제거 단계; 한외여과; 나노여과; 및 컬럼 크로마토그래피 단계. 바람직하게 이러한 컬럼 크로마토그래피는 단일 컬럼 또는 다수 컬럼이다. 추가로 바람직하게, 컬럼 크로마토그래피 단계는 모의 이동층 크로마토그래피이다. 이러한 모의 이동층 크로마토그래피는 바람직하게 i) 적어도 4개 컬럼으로서, 적어도 하나의 컬럼은 약하거나 또는 강한 양이온 교환 수지를 포함하는 것인 컬럼; 및/또는 ii) 상이한 유속을 갖는 4개 구역 I, II, III 및 IV; 및/또는 iii) 물을 포함하는 용리액; 및/또는 iv) 15℃ 내지 60℃의 작업 온도를 포함한다.

특별한 구현예에서, 본 발명은 분무 건조, 동결건조, 분무 냉동 건조, 냉동 분무 건조, 밴드 건조, 벨트 건조, 진공 밴드 건조, 진공 벨트 건조, 드럼 건조, 롤러 건조, 진공 드럼 건조 및 진공 롤러 건조를 포함하는 목록으로부터 선택되는 어느 하나 이상의 건조 단계에 의해서 분말로 건조되는 생산된 글리코실화된 생산물을 제공하고, 건조된 분말은 < 15% -wt.의 물, 바람직하게 < 10% -wt.의 물, 보다 바람직하게 < 7% -wt.의 물, 가장 바람직하게 < 5% -wt.의 물을 함유한다.

다른 양태에서, 본 발명은 본 명세서에 기술된 바와 같은 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 코딩하는 단리된 핵산 분자를 포함하는 벡터를 제공한다.

다른 양태에서, 본 발명은 본 명세서에 기술된 바와 같은 UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 본 명세서에 기술된 바와 같은 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 코딩하는 단리된 핵산 분자의 용도를 제공한다.

다른 양태에서, 본 발명은 본 명세서에 기술된 바와 같은 글리코실화된 생산물의 생산을 위한 본 명세서에 기술된 바와 같은 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 코딩하는 단리된 핵산 분자를 포함하는 벡터의 용도를 제공한다.

다른 양태에서, 본 발명은 본 명세서에 기술된 바와 같은 글리코실화된 생산물의 생산을 위한 본 명세서에 기술된 바와 같은 대사적으로 조작된 세포의 용도를 제공한다.

본 명세서에 기술된 바와 같은 세포에서 생산된 글리코실화된 생산물의 확인을 위해서, 단량체 빌딩 블록 (예를 들어, 단당 또는 글리칸 단위 조성), 측쇄의 아노머 구성, 치환 기의 존재 및 위치, 중합도/분자량 및 연결 패턴은 당분야에 공지된 표준 방법, 예컨대, 예를 들어, 메틸화 분석, 환원 절단, 가수분해, GC-MS (가스 크로마토그래피-질량 분광법), MALDI-MS (매트릭스-보조 레이저 탈착/이온화-질량 분광법), ESI-MS (전자분무 이온화-질량 분광법), HPLC (자외선 또는 굴절률 검출 동반 고성능 액상 크로마토그래피), HPAEC-PAD (펄스식 전류측정 검출 동반 고성능 음이온-교환 크로마토그래피), CE (모세관 전기영동), IR (적외선)/라만 분광법, 및 NMR (핵 자기 공명) 분광법 기술에 의해 확인될 수 있다. 결정 구조는 예를 들어, 고체 NMR, FT-IR (퓨리에 변환 적외선 분광법), 및 WAXS (광각 X-선 산란)을 사용하여 해석될 수 있다. 중합도 (DP), DP 분포 및 다분산도는 예를 들어, 점도계 및 SEC (SEC-HPLC, 고성능 크기-배제 크로마토그래피)를 통해 결정될 수 있다. 당류의 단량체 성분을 확인하기 위해서, 방법 예컨대, 예를 들어, 산-촉매 가수분해, HPLC (고성능 액상 크로마토그래피) 또는 GLC (기체-액체 크로마토그래피) (알디톨 아세테이트로 전환 이후)가 사용될 수 있다. 글리코시드 연결을 결정하기 위해서, 당류는 DMSO 중 요오드화메틸 및 강염기에 의해 메틸화되고, 가수분해가 수행되고, 부분적으로 메틸화된 알디톨로 환원이 달성되며, 메틸화된 알디톨 아세테이트로의 아세틸화가 수행되며, 분석은 GLC/MS (질량 분광법과 결합된 기체-액체 크로마토그래피)에 의해 수행된다. 올리고당 서열을 결정하기 위해서, 부분 해중합이 산 또는 효소를 사용해 수행되어서 구조가 결정된다. 아노머 구성을 확인하기 위해서, 올리고당에 대해서 효소적 분석을 수행하고, 예를 들어, 특정 유형의 연결에 특이적인 효소, 예를 들어 베타-갈락토시다제, 또는 알파-글루코시다제 등과 접촉되고, NMR을 사용해 생산물을 분석할 수 있다.

글리코실화된 생산물을 포함하는 생산물

일부 구현예에서, 본 명세서에 기술된 바와 같이 생산되는 글리코실화된 생산물은 식품 (예를 들어, 인간 식품 또는 사료), 식이 보충물, 약학 성분, 미용 성분 또는 의약품에 포함된다. 일부 구현예에서, 글리코실화된 생산물은 식품, 사료, 식이 보충물, 약학 성분, 미용 성분, 또는 의약품에 적합한 하나 이상의 성분과 혼합된다.

일부 구현예에서, 식이 보충물은 적어도 하나의 프리바이오틱 성분 및/또는 적어도 하나의 프로바이오틱 성분을 포함한다.

"프리바이오틱"은 숙주에 유익한 미생물, 특히 위장관의 미생물의 성장을 촉진하는 물질이다. 일부 구현예에서, 식이 보충물은 하나 이상의 유익한 미생물의 성장을 촉진하기 위해서, 본 명세서에 개시된 방법을 통해서 생산 및/또는 정제된 프리바이오틱인 글리코실화된 생산물을 포함한, 다수의 프리바이오틱을 제공한다. 식이 보충물을 위한 프리바이오틱 성분의 예는 다른 프리바이오틱 분자 (예컨대, HMO) 및 식물 다당류 (예컨대, 이눌린, 펙틴, b-글루칸 및 자일로올리고당)를 포함한다. "프로바이오틱" 생산물은 전형적으로 수용자의 이익을 위해서, 위장관 미생물총에 첨가되거나 또는 대체되는 살아있는 미생물을 함유한다. 이러한 미생물의 예는 락토바실러스 (Lactobacillus) 종 (예를 들어, 엘. 악시도필루스 (L. acidophilus) 및 엘. 불가리쿠스 (L. bulgaricus)), 비피도박테리움 (Bifidobacterium) 종 (예를 들어, 비. 아니말리스 (B. animalais), 비. 롱검 (B. longum) 및 비. 인판티스 (B. Infantis) (예를 들어, Bi-26)), 및 사카로마이세스 보울라르디 (Saccharomyces boulardii)를 포함한다. 일부 구현예에서, 본 명세서의 방법으로 생산 및/또는 정제된 글리코실화된 생산물은 이러한 미생물과 조합하여 경구로 투여된다.

식이 보충물을 위한 추가 성분의 예는 이당 (예컨대, 락토스), 단당 (예컨대, 글루코스 및 갈락토스), 증점제 (예컨대, 검 아라빅), 산도 조절제 (예컨대, 트리소듐 시트레이트), 물, 탈지유, 및 풍미제를 포함한다.

일부 구현예에서, 글리코실화된 생산물은 인간 이유식 (예를 들어, 영아용 조제식)에 혼입된다. 영아용 조제식은 일반적으로 인간 모유에 대한 완전 또는 부분 대체물로서 영아에게 먹이기 위해 제조된 식품이다. 일부 구현예에서, 영아용 조제식은 분말로서 판매되고, 물과 혼합하여 영아에게 젖병 또는 컵으로 먹이기 위해 제조된다. 영아용 조제식의 조성물은 전형적으로 인간 모유를 대략적으로 모방하기 위해 디자인된다. 일부 구현예에서, 본 명세서의 방법으로 생산 및/또는 정제된 글리코실화된 생산물은 영아용 조제식에 포함되어서 인간 모유의 올리고당에 의해 제공되는 것과 유사한 영양적 이득을 제공한다. 일부 구현예에서, 글리코실화된 생산물은 영아용 조제식의 하나 이상의 성분과 혼합된다. 영아용 조제식 성분의 예는 무지방유, 탄수화물 공급원 (예를 들어, 락토스), 단백질 공급원 (예를 들어, 농축 유청 단백질 및 카세인), 지방 공급원 (예를 들어, 식물성 오일 - 예컨대, 야자유, 고올레산 홍화유, 유채씨유, 코코넛유 및/또는 해바라기유; 및 어유), 비타민 (예컨대, 비타민 A, Bb, Bi2, C 및 D), 미네랄 (예컨대, 포타슘 시트레이트, 칼슘 시트레이트, 마그네슘 클로라이드, 소듐 클로라이드, 소듐 시트레이트 및 칼슘 포스페이트) 및 가능한 인간 모유 올리고당 (HMO)을 포함한다. 이러한 HMO는 예를 들어, DiFL, 락토-N-트리오스 II, LNT, LNnT, 락토-N-푸코펜타오스 I, 락토-N-네오푸코펜타오스, 락토-N-푸코펜타오스 II, 락토-N- 푸코펜타오스 III, 락토-N-푸코펜타오스 V, 락토-N-네오푸코펜타오스 V, 락토-N-디푸코헥사오스 I, 락토-N-디푸코헥사오스 II, 6'-갈락토실락토스, 3'-갈락토실락토스, 락토-N-헥사오스 및 락토- N-네오헥사오스를 포함한다.

일부 구현예에서, 하나 이상의 영아용 조제식 성분은 무지방유, 탄수화물 공급원, 단백질 공급원, 지방 공급원, 및/또는 비타민 및 미네랄을 포함한다.

일부 구현예에서, 하나 이상의 영아용 조제식 성분은 락토스, 농축 유청 단백질 및/또는 고올레산 홍화유를 포함한다.

일부 구현예에서, 영아용 조제식 중 글리코실화된 생산물 농도는 일반적으로 인간 모유에 존재하는 글리코실화된 생산물 농도와 대략 동일한 농도이다.

일부 구현예에서, 글리코실화된 생산물은 사료 조제물에 혼입되고, 상기 사료는 반려동물 사료, 동물 우유 대체제, 수의학 제품, 수의학 사료 보충물, 영양 보충물, 이유후 사료, 또는 이유기 보조 사료를 포함하는 목록으로부터 선택된다.

본 명세서의 실시예에서 확인하게 되는 바와 같이, 본 발명의 방법 및 세포는 바람직하게 본 명세서에 기술된 바와 같은 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제가 결여된 상기 글리코실화된 생산물의 생산을 위한 숙주 및 방법과 비교했을 때, 하기 놀라운 장점 중 적어도 하나를 제공한다:

- 상기 글리코실화된 생산물의 더 높은 적정가 (g/L),

- 더 높은 생산율 r (상기 글리코실화된 생산물의 g/ L/h),

- 더 높은 세포 성능 지수 CPI (상기 글리코실화된 생산물의 g / g X),

- 더 높은 비생산성 Qp (상기 글리코실화된 생산물의 g /g X /h),

- 수크로스에 대한 더 높은 수율 Ys (상기 글리코실화된 생산물의 g / g 수크로스),

- 더 높은 수크로스 흡수/전환율 Qs (g 수크로스 / g X /h),

- 더 높은 락토스 전환/소비율 rs (g 락토스/h),

- 상기 글리코실화된 생산물의 더 높은 배출, 및/또는

- 생산 숙주의 더 높은 성장 속도.

달리 정의하지 않으면, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 일반적으로 본 발명이 속하는 분야의 당업자가 통상적으로 이해하는 바와 동일한 의미를 갖는다. 일반적으로 본 명세서에서 사용되는 명명법 및 상기 및 하기에 기술된 세포 배양, 분자 유전학, 유기 화학 및 핵산 화학 및 혼성화의 실험실 절차는 당분야에서 충분히 공지되어 있고 일반적으로 적용된다. 표준 기술이 핵산 및 펩티드 합성에 사용된다. 일반적으로, 정제 단계는 제조사 사양에 따라서 수행된다.

추가 장점은 특정 구현예 및 실시예에 뒷따른다. 상기 언급된 특성 및 히아 여전히 설명되는 특성은 각각 특정된 조합으로 사용될 수 있을 뿐만 아니라, 또한 본 발명의 범주를 벗어나지 않고, 다른 조합 또는 그들 자체로 사용될 수 있다는 것은 자명하다.

본 발명은 하기 특정 구현예에 관한 것이다:

1. 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 대사적으로 조작된 세포로서, 상기 세포는,

(i) 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현하고,

(ii) UDP-N-아세틸글루코사민 (UDP-GlcNAc)을 합성하고,

(iii) 글리코실트랜스퍼라제를 발현하며,

상기 세포는 상기 UDP-GlcNAc를 사용하여 상기 글리코실화된 생산물을 생산한다.

2. 구현예 1에 따른 세포에 있어서, 상기 세포는 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 포함하는 적어도 하나의 유전자 발현 모듈에 의해 변형된 대사적으로 조작된 세포이고, 바람직하게 상기 발현 모듈로부터의 발현은 항상성이거나 또는 비-화학적 유도 또는 억제 시 조건적이다.

3. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제는 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제 활성을 갖고,

(i) V12L, Q96H, Q157R 및/또는 E343V 돌연변이가 SEQ ID NO 01과 상이한 SEQ ID NO 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53 중 어느 하나에 따른 폴리펩티드 서열을 포함하거나, 또는

(ii) 각각, SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37 또는 38을 갖는 상기 폴리펩티드 중 어느 하나의 전체 길이에 대해 적어도 80% 전체 서열 동일성을 갖는 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37 또는 38 중 어느 하나의 기능성 상동체, 변이체 또는 유도체이거나, 또는

(iii) 각각, SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53을 갖는 상기 폴리펩티드 중 어느 하나의 전체 길이에 대해서 적어도 80% 전체 서열 동일성을 갖고, V12L, Q96H, Q157R 및/또는 E343V 돌연변이가 SEQ ID NO 01과 상이한 SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53 중 어느 하나의 기능성 상동체, 변이체 또는 유도체인, 단백질이다.

4. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 단당 서브유닛 중 적어도 하나는 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 및 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택된다.

5. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 UDP-N-아세틸갈락토사민 (UDP-GalNAc), UDP-N-아세틸만노사민 (UDP-ManNAc), UDP-글루코스 (UDP-Glc), UDP-갈락토스 (UDP-Gal), GDP-만노스 (GDP-Man), UDP-글루쿠로네이트, UDP-갈락투로네이트, UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, UDP-2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, UDP-N-아세틸-L-람노사민 (UDP-L-RhaNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-만노스), dTDP-N-아세틸푸코사민, UDP-N-아세틸푸코사민 (UDP-L-FucNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-갈락토스), UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAC 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스), UDP-N-아세틸무람산, UDP-N-아세틸-L-퀴노보사민 (UDP-L-QuiNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-글루코스), CMP-시알산 (CMP-Neu5Ac), CMP-N-글리코릴뉴라민산 (CMP-Neu5Gc), GDP-푸코스 (GDP-Fuc), GDP-람노스 및 UDP-자일로스를 포함하는 목록으로부터 선택되는 뉴클레오티드-당을 추가로 합성한다.

6. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 글리코실트랜스퍼라제는 푸코실트랜스퍼라제, 시알릴트랜스퍼라제, 갈락토실트랜스퍼라제, 글루코실트랜스퍼라제, 만노실트랜스퍼라제, N-아세틸글루코사미닐트랜스퍼라제, N-아세틸갈락토사미닐트랜스퍼라제, N-아세틸만노사미닐트랜스퍼라제, 자일로실트랜스퍼라제, 글루쿠로닐트랜스퍼라제, 갈락투로닐트랜스퍼라제, 글루코사미닐트랜스퍼라제, N-글리코릴뉴라미닐트랜스퍼라제, 람노실트랜스퍼라제, N-아세틸람노실트랜스퍼라제, UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제, UDP-N-아세틸글루코사민 에놀피루빌 트랜스퍼라제 및 푸코사미닐트랜스퍼라제를 포함하는 목록으로부터 선택되고,

바람직하게, 상기 세포는 상기 글리코실트랜스퍼라제의 발현 또는 활성이 변형된다.

7. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제, 포스포아세틸글루코사민 뮤타제, UDP-N-아세틸글루코사민 파이로포스포릴라제, 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제, UTP--글루코스-1-포스페이트 우리딜릴트랜스퍼라제, UDP-글루코스 4-에피머라제, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제, 락토스 퍼미아제, UDP-N-아세틸글루코사민 2-에피머라제, N-아세틸뉴라미네이트 신타제, N-아실뉴라미네이트 시티딜릴트랜스퍼라제, 글루코스-6-포스페이트 이소머라제 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스 2-에피머라제로부터 선택되는 효소 중 어느 하나 이상을 추가로 발현하고,

바람직하게, 상기 세포는 상기 효소 중 적어도 하나의 발현 또는 활성이 변형된다.

8. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 글리코실화된 생산물은 포유동물 모유 이당 또는 올리고당, O-항원, 엔테로박테리아 공통 항원 (ECA), 캡슐 다당류, 펩티도글리칸 (PG) 및 인간 ABO식 혈액형 체계의 항원을 포함하는 목록으로부터 선택된다.

9. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 적어도 하나의 전구체를 사용하고, 바람직하게 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 둘 이상의 전구체를 사용한다.

10. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 적어도 하나의 전구체를 생산한다.

11. 구현예 9 또는 10 중 어느 하나에 따른 세포에 있어서, 상기 글리코실화된 생산물의 합성을 위한 상기 전구체는 상기 글리코실화된 생산물로 완전하게 전환된다.

12. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 세포질 막에 걸쳐서 적어도 하나의 이당 또는 올리고당을 배출한다.

13. 이전 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 미생물, 식물, 또는 동물 세포로 이루어진 군으로부터 선택되고, 바람직하게 상기 미생물은 박테리아, 진균 또는 효모이고, 바람직하게 상기 식물은 벼, 목화, 유채, 대두, 옥수수 또는 행운목이고, 바람직하게 상기 동물은 곤충, 어류, 조류 또는 비-인간 포유동물이고, 바람직하게 상기 동물 세포은 포유동물 세포주이다.

14. 구현예 13에 따른 세포에 있어서, 상기 세포는 박테리아, 바람직하게 에스케리치아 콜라이 균주, 보다 바람직하게 K-12 균주인 에스케리치아 콜라이 균주의 세포이고, 보다 더 바람직하게 에스케리치아 콜라이 K-12 균주는 이.콜라이 MG1655이다.

15. 구현예 13에 따른 세포에 있어서, 상기 세포는 효모이고, 바람직하게 효모 세포는 사카로마이세스 (Saccharomyces), 자이고사카로마이세스 (Zygosaccharomyces), 피키아 (Pichia), 코마가타엘라 (Komagataella), 한세눌라 (Hansenula), 클루이베로마이세스 (Kluyveromyces) 또는 데바로마이세스 (Debaromyces)를 포함하는 군으로부터 선택되는 속에 속한다.

16. 구현예 13에 따른 세포에 있어서, 상기 세포는 진균이고, 바람직하게 진균은 리조푸스 (Rhizopus), 딕티오스텔리움 (Dictyostelium), 페니실리움 (Penicillium), 무코르 (Mucor) 또는 아스퍼질러스 (Aspergillus) 속에 속한다.

17. 세포에 의한 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물을 제조하기 위한 방법으로서, 방법은 하기 단계를 포함한다:

(a) 구현예 1 내지 16 중 어느 하나에 따른 세포를 제공하는 단계, 및

(c) 바람직하게, 상기 배양으로부터 상기 글리코실화된 생산물을 분리시키는 단계.

18. 구현예 17에 따른 방법에 있어서, 상기 배양 동안, 상기 세포는 세포질 막에 걸쳐서 발효배양 액체배지 중에 상기 글리코실화된 생산물을 배출한다.

19. 구현예 17 또는 18 중 어느 하나에 따른 방법에 있어서, 상기 분리는 하기 단계 중 적어도 하나를 포함한다: 청징화, 한외여과, 나노여과, 역삼투, 미세여과, 활성 차콜 또는 탄소 처리, 접선 유동 고-성능 여과, 접선 유동 한외여과, 친화성 크로마토그래피, 이온 교환 크로마토그래피, 소수성 상호작용 크로마토그래피 및/또는 겔 여과, 리간드 교환 크로마토그래피.

20. 구현예 17 내지 19 중 어느 하나에 따른 방법에 있어서, 상기 세포로부터 상기 글리코실화된 생산물의 정제 단계를 더 포함한다.

21. 구현예 17 내지 20 중 어느 하나에 따른 방법에 있어서, 상기 정제는 하기 단계 중 적어도 하나를 포함한다: 활성 차콜 또는 탄소의 사용, 차콜의 사용, 나노여과, 한외여과 또는 이온 교환, 알콜의 사용, 수성 알콜 혼합물의 사용, 결정화, 증발, 침전, 건조, 분무 건조 또는 동결건조.

22. 세포질 막에 걸쳐서 이당 또는 올리고당을 배출하는 효모 또는 진균 세포.

23. 구현예 22에 따른 효모 또는 진균 세포에 있어서, 상기 이당 또는 올리고당은 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 또는 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택되는 적어도 하나의 단당 단위를 포함한다.

24. 구현예 22 또는 23 중 어느 하나에 따른 효모 또는 진균 세포에 있어서, 상기 세포는 구현예 1 내지 16 중 어느 하나에 따른 대사적으로 조작된 세포이다.

25. 글리코실화된 생산물의 생산을 위한 구현예 1 내지 16 및 22 내지 24 중 어느 하나에 따른 세포의 용도.

26. 글리코실화된 생산물의 생산을 위한 구현예 17 내지 21 중 어느 하나에 따른 방법의 용도.

또한, 본 발명은 하기 바람직한 특정 구현예에 관한 것이다:

1. 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 대사적으로 조작된 세포로서, 상기 세포는

(i) 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현할 수 있고, 바람직하게, 발현하고,

2. 바람직한 구현예 1에 따른 세포에 있어서, 상기 세포는 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 포함하는 적어도 하나의 유전자 발현 모듈에 의해 변형된 대사적으로 조작된 세포이고, 바람직하게 상기 발현 모듈로부터의 발현은 항상성이거나 또는 비-화학적 유도 또는 억제 시 조건적이다.

3. 이전의 바람직한 구현예 중 어느 하나에 따른 세포에 있어서, 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제는 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제 활성을 갖고,

(ii) 각각, SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53 중 어느 하나의 아미노산 서열에 대해 적어도 200 아미노산 잔기 범위에 걸쳐서 적어도 80.0% 동일한 서열인 아미노산 서열을 포함하거나 또는 그로 이루어지고, V12L, Q96H, Q157R 및/또는 E343V 돌연변이가 SEQ ID NO 01와 상이한 폴리펩티드인, 단백질이다.

4. 이전의 바람직한 구현예 중 어느 하나에 따른 세포에 있어서, 상기 단당 서브유닛 중 적어도 하나는 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 및 N-글리코릴뉴라민산으로 이루어진 목록으로부터 선택된다.

5. 이전의 바람직한 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 UDP-N-아세틸갈락토사민 (UDP-GalNAc), UDP-N-아세틸만노사민 (UDP-ManNAc), UDP-글루코스 (UDP-Glc), UDP-갈락토스 (UDP-Gal), GDP-만노스 (GDP-Man), UDP-글루쿠로네이트, UDP-갈락투로네이트, UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, UDP-2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, UDP-N-아세틸-L-람노사민 (UDP-L-RhaNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-만노스), dTDP-N-아세틸푸코사민, UDP-N-아세틸푸코사민 (UDP-L-FucNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-갈락토스), UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAC 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스), UDP-N-아세틸무람산, UDP-N-아세틸-L-퀴노보사민 (UDP-L-QuiNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-글루코스), CMP-시알산 (CMP-Neu5Ac), CMP-N-글리코릴뉴라민산 (CMP-Neu5Gc), GDP-푸코스 (GDP-Fuc), GDP-람노스 및 UDP-자일로스로 이루어진 목록으로부터 선택되는 뉴클레오티드-당을 추가로 합성한다.

6. 이전의 바람직한 구현예 중 어느 하나에 따른 세포에 있어서, 상기 글리코실트랜스퍼라제는 푸코실트랜스퍼라제, 시알릴트랜스퍼라제, 갈락토실트랜스퍼라제, 글루코실트랜스퍼라제, 만노실트랜스퍼라제, N-아세틸글루코사미닐트랜스퍼라제, N-아세틸갈락토사미닐트랜스퍼라제, N-아세틸만노사미닐트랜스퍼라제, 자일로실트랜스퍼라제, 글루쿠로닐트랜스퍼라제, 갈락투로닐트랜스퍼라제, 글루코사미닐트랜스퍼라제, N-글리코릴뉴라미닐트랜스퍼라제, 람노실트랜스퍼라제, N-아세틸람노실트랜스퍼라제, UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제, UDP-N-아세틸글루코사민 에놀피루빌 트랜스퍼라제 및 푸코사미닐트랜스퍼라제로 이루어진 목록으로부터 선택되고,

- 바람직하게, 상기 푸코실트랜스퍼라제는 알파-1,2-푸코실트랜스퍼라제, 알파-1,3-푸코실트랜스퍼라제, 알파-1,3/4-푸코실트랜스퍼라제, 알파-1,4-푸코실트랜스퍼라제 및 알파-1,6-푸코실트랜스퍼라제를 포함하는 목록으로부터 선택되고,

- 바람직하게, 상기 시알릴트랜스퍼라제는 알파-2,3-시알릴트랜스퍼라제, 알파-2,6-시알릴트랜스퍼라제 및 알파-2,8-시알릴트랜스퍼라제를 포함하는 목록으로부터 선택되고,

- 바람직하게, 상기 갈락토실트랜스퍼라제는 베타-1,3-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제, 베타-1,4-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제, 알파-1,3-갈락토실트랜스퍼라제 및 알파-1,4-갈락토실트랜스퍼라제를 포함하는 목록으로부터 선택되고,

- 바람직하게, 상기 글루코실트랜스퍼라제는 알파-글루코실트랜스퍼라제, 베타-1,2-글루코실트랜스퍼라제, 베타-1,3-글루코실트랜스퍼라제 및 베타-1,4-글루코실트랜스퍼라제를 포함하는 목록으로부터 선택되고,

- 바람직하게, 상기 만노실트랜스퍼라제는 알파-1,2-만노실트랜스퍼라제, 알파-1,3-만노실트랜스퍼라제 및 알파-1,6-만노실트랜스퍼라제를 포함하는 목록으로부터 선택되고,

- 바람직하게, 상기 N-아세틸글루코사미닐트랜스퍼라제는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 및 베타-1,6-N-아세틸글루코사미닐트랜스퍼라제를 포함하는 목록으로부터 선택되고,

- 바람직하게, 상기 N-아세틸갈락토사미닐트랜스퍼라제는 알파-1,3-N-아세틸갈락토사미닐트랜스퍼라제이고,

- 바람직하게, 상기 세포는 상기 글리코실트랜스퍼라제의 발현 또는 활성이 변형된다.

7. 이전의 바람직한 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제, 포스포아세틸글루코사민 뮤타제, UDP-N-아세틸글루코사민 파이로포스포릴라제, 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제, UTP--글루코스-1-포스페이트 우리딜릴트랜스퍼라제, UDP-글루코스 4-에피머라제, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제, 락토스 퍼미아제, UDP-N-아세틸글루코사민 2-에피머라제, N-아세틸뉴라미네이트 신타제, N-아실뉴라미네이트 시티딜릴트랜스퍼라제, 글루코스-6-포스페이트 이소머라제 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스 2-에피머라제를 포함하는 목록으로부터 선택되는 효소 중 어느 하나 이상을 추가로 발현하고,

8. 이전의 바람직한 구현예 중 어느 하나에 따른 세포에 있어서, 상기 글리코실화된 생산물은 포유동물 모유 이당 또는 올리고당, 바람직하게 인간 모유 이당 또는 올리고당, O-항원, 엔테로박테리아 공통 항원 (ECA), 캡슐 다당류에 존재하는 올리고당 반복부, 펩티도글리칸 (PG) 및 인간 ABO식 혈액형 체계의 항원을 포함하는 목록으로부터 선택된다.

9. 이전의 바람직한 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 적어도 하나의 전구체를 사용하고, 바람직하게 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 둘 이상의 전구체를 사용한다.

10. 이전의 바람직한 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 적어도 하나의 전구체를 생산한다.

11. 바람직한 구현예 9 또는 10 중 어느 하나에 따른 세포에 있어서, 상기 글리코실화된 생산물의 합성을 위한 상기 전구체는 상기 글리코실화된 생산물로 완전하게 전환된다.

12. 이전의 바람직한 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 세포 밖으로 적어도 하나의 이당 또는 올리고당을 배출한다.

13. 이전의 바람직한 구현예 중 어느 하나에 따른 세포에 있어서, 상기 세포는 박테리아, 진균, 효모, 식물 세포, 동물 세포, 또는 원충 세포이고,

- 바람직하게 상기 박테리아는 에스케리치아 콜라이 균주, 보다 바람직하게 K-12 균주인 에스케리치아 콜라이 균주이고, 보다 더 바람직하게 에스케리치아 콜라이 K-12 균주는 이.콜라이 MG1655이고,

- 바람직하게 상기 진균은 리조푸스, 딕티오스텔리움, 페니실리움, 무코르 또는 아스퍼질러스를 포함하는 군으로부터 선택되는 속에 속하고,

- 바람직하게 상기 효모는 사카로마이세스, 자이고사카로마이세스, 피키아, 코마가타엘라, 한세눌라, 클루이베로마이세스 또는 데바로마이세스를 포함하는 군으로부터 선택되는 속에 속하고,

- 바람직하게 상기 식물 세포는 조류 세포이거나 또는 담배, 알파파, 벼, 토마토, 목화, 유채, 대두, 옥수수, 또는 행운목으로부터 유래되고,

- 바람직하게 상기 동물 세포는 비-인간 포유동물, 조류, 어류, 무척추동물, 파충류, 양서류 또는 곤충으로부터 유래되거나 또는 배아 줄기 세포를 제외한 인간 세포로부터 유래되는 유전자 조작된 세포주이고, 보다 바람직하게 상기 인간 및 비-인간 포유동물 세포는 상피 세포, 배아 신장 세포, 섬유아세포, COS 세포, 중국 햄스터 난소 (CHO) 세포, 쥐 골수종 세포, NIH-3T3 세포, 비-유선 성체 줄기 세포 또는 이의 유도체이고, 보다 바람직하게 상기 곤충 세포는 스포돕테라 프루기페르다, 봄빅스 모리, 마메스트라 브라시카에, 트리코플루시아 니 또는 드로소필라 멜라노가스터이고,

- 바람직하게 상기 원충 세포는 리슈마니아 타렌톨라에 세포이다.

14. 세포에 의해 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물을 제조하기 위한 방법으로서, 방법은 하기 단계를 포함한다:

(a) 바람직한 구현예 1 내지 13 중 어느 하나에 따른 세포를 제공하는 단계, 및

15. 바람직한 구현예 14에 따른 방법에 있어서, 상기 배양 동안 상기 세포는 세포 밖으로 상기 글리코실화된 생산물을 배출한다.

16. 바람직한 구현예 14 또는 15 중 어느 하나에 따른 방법에 있어서, 상기 분리는 하기 단계 중 적어도 하나를 포함한다: 청징화, 한외여과, 나노여과, 2-층 분할법, 역삼투, 미세여과, 활성 차콜 또는 탄소 처리, 비이온성 계면활성제 처리, 효소 분해, 접선 유동 고-성능 여과, 접선 유동 한외여과, 친화성 크로마토그래피, 이온 교환 크로마토그래피, 소수성 상호작용 크로마토그래피 및/또는 겔 여과, 리간드 교환 크로마토그래피, 전기투석.

17. 바람직한 구현예 14 내지 16 중 어느 하나에 따른 방법에 있어서, 상기 세포로부터 상기 글리코실화된 생산물의 정제 단계를 더 포함한다.

18. 바람직한 구현예 17에 따른 방법에 있어서, 상기 정제는 하기 단계 중 적어도 하나를 포함한다: 활성 차콜 또는 탄소의 사용, 차콜의 사용, 나노여과, 한외여과, 전기영동, 효소 처리 또는 이온 교환, 온도 조정, pH 조정, 알칼리 또는 산성 용액으로 pH 조정, 알콜의 사용, 수성 알콜 혼합물의 사용, 결정화, 증발, 침전, 건조, 분무 건조, 동결건조, 분무 냉동 건조, 냉동 분무 건조, 밴드 건조, 벨트 건조, 진공 밴드 건조, 진공 벨트 건조, 드럼 건조, 롤러 건조, 진공 드럼 건조 또는 진공 롤러 건조.

19. 세포 밖으로 이당 또는 올리고당을 배출하는 효모 또는 진균 세포.

20. 바람직한 구현예 19에 따른 효모 또는 진균 세포에 있어서, 상기 이당 또는 올리고당은 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 또는 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택되는 적어도 하나의 단당 단위를 포함한다.

21. 바람직한 구현예 19 또는 20 중 어느 하나에 따른 효모 또는 진균 세포에 있어서, 상기 세포는 바람직한 구현예 1 내지 13 중 어느 하나에 따른 대사적으로 조작된 세포이다.

22. 바람직한 구현예 1 및 3 중 어느 하나의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 코딩하는 단리된 핵산 분자를 포함하는 벡터.

23. UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 바람직한 구현예 1 내지 13 및 19 내지 21 중 어느 하나에 따른 세포의 용도.

24. UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 바람직한 구현예 14 내지 18 중 어느 하나에 따른 방법의 용도.

25. UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 바람직한 구현예 1 및 3 중 어느 하나의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 코딩하는 단리된 핵산 분자의 용도.

26. UDP-GlcNAc로부터 유래되고 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 바람직한 구현예 22에 따른 벡터의 용도.

본 발명은 실시예에서 보다 상세하게 기술될 것이다.

하기 실시예는 본 발명의 추가 예시 및 설명으로서 제공될 것이고 제한하려는 의도가 아니다.

실시예

실시예 1. 재료 및 방법 사카로마이세스 세레비지아에

배지

에스. 세레비지아에 균주는 완전 보충 혼합물이 존재하는 합성 한정 효모 배지 (SD CSM) 또는 아미노산없는 6.7 g/L 효모 질소 베이스 (YNB w/o AA, Difco), 22 g/L 글루코스 일수화물 (Riedel-De Haen) 및 적절한 선택적 아미노산 혼합물 (예를 들어, 0.79 g/L CSM 또는 0.77 g/L CSM-HIS, MP Biomedicals)을 함유하는 CSM drop-out (예를 들어, CSM-HIS 또는 CSM-LEU)에서 배양되었다. 6'-시알릴락토스 (6'SL), 락토-N-트리오스 II (LNT II) 및 락토-N-네오테트라오스 (LNnT)에 대한 생산 실험은 또한 5 g/L 락토스를 함유하였다. 고형 배지는 20 g/L 한천 noble (Difco)을 첨가하여 수득되었다.

발효배양 작업은 또한 완전 보충 혼합물 존재의 합성 한정 효모 배지 (SD CSM) 또는 탄소 공급원으로서 2% 글루코스를 함유하는 CSM drop-out 배지에서 수행되었다.

클로닝 절차 및 플라스미드 유지에 사용된, One Shot TOP10 Chemically competent™ 에스케리치아 콜라이 (C404003, Thermofisher Scientific)는 10 g/L 트립톤 (Difco), 5 g/L 효모 추출물 (Difco) 및 5 g/L 소듐 클로라이드 (VWR)로 이루어진 LB (Lysogeny Broth)를 사용하여 200 rpm에서 진탕하면서 37℃에서 배양되었다. 12 g/L 한천 (Biokar Diagnostics)은 고형 배지가 필요하면 첨가되었다. 필요한 경우에, 필요한 항생제 (100 μg/mL 암피실린 또는 25 μg/mL 클로람페니콜)가 오토클레이빙 이후에 첨가되었다. 소듐 클로라이드가 없고, 50 g/L 수크로스 (0.22 μm PTFE 필터를 사용해 필터 멸균됨)가 보충된 고형 LB는 SacBR에 대한 역선택을 원할 때 사용되었다.

모든 성분은 121℃에서 21분 동안 개별적으로 오토클레이빙되었다.

플라스미드

에스. 세레비지아에 BY4742 유래 천연 GFA1 (SEQ ID NO 01), 이중 돌연변이 Q96H 및 Q157R을 갖는 이의 변이체 (SEQ ID NO 42), 사중 돌연변이 V12L, Q96H, Q157R 및 E343V를 갖는 이의 변이체 (SEQ ID NO 39) 또는 다른 적합화를 갖는 변이체 (SEQ ID NO 40, 41, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53) 및/또는 SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그, 클루이베로마이세스 락티스 (Kluyveromyces lactis) NRRL Y-1140 (UniProt ID P07921) 유래 락토스 퍼미아제 (LAC12), 캄필로박터 제주니 (Campylobacter jejuni) 유래 N-아세틸글루코사민-6-포스페이트 2-에피머라제 (neuC) (UniProt ID AAK91727.1), 이.콜라이 유래 N-아세틸뉴라미네이트 신타제 (neuB) (UniProt ID Q46675), 캄필로박터 제주니 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (neuA) (UniProt ID Q93MP7), 알파-2,6-시알릴트랜스퍼라제 활성을 갖고 포토박테리움 담셀라에 (Photobacterium damselae) 유래 알파-2,6-시알릴트랜스퍼라제 (a26ST)의 아미노산 잔기 108 내지 497로 구성된 폴리펩티드 (UniProt ID O66375), 네이세리아 메닌지티디스 (Neisseria meningitidis) 유래 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 (lgtA) (SEQ ID NO 54) 및 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (lgtB) (UniProt ID Q51116)의 발현을 위한 발현 플라스미드는 골든 게이트 클로닝을 통해서 또는 VErsatile Genetic Assembly System (VEGAS)의 변형된 형태를 통해서 클로닝되었다 (Kuijpers et al., Microb. Cell Fact. 12, 47 (2013); Mitchell et al., Nucleic Acids Res. 43, 6620-6630 (2015)). 표 1은 사용된 단백질의 개요를 표시한다. 효모 프로모터 (pCCW12, pFBA1, pPAB1, pPGK1, pTEF, pTDH3) 및 종결자 (tADH1, tENO1, tGuo1, tSynth14, tSynth17, tSynth18)는 현행 문헌을 기반으로 선택되었다 (Curran et al., ACS Synth. Biol. 4, 824-832 (2015); Lee et al., ACS Synth. Biol. 4, 975-986 (2015)). 영양요구성 마커 HIS5 및 LEU2 는 각각 pUG27 (Euroscarf, P30115) 및 pUG73 (Euroscarf, P30118)으로부터 수득되었다. CEN6/ARS4 (pSH47, Euroscarf, P30119) 또는 2μ (pEX2, BCCM, p2890)는 효모에서 플라스미드를 유지시키기 위한 복제 기원으로서 선택되었다. 모든 부분은 One Shot TOP10 Chemically competent™ 이.콜라이에서 캐리어 벡터 상에 저장되었다. 상이한 항생제 내성 마커는 별개 캐리어 또는 발현 플라스미드 상에서 사용되었다. 올리고뉴클레오티드 및 gBlocks는 Integrated DNA Technologies (IDT)에서 입수하였다. 코돈 용법은 공급사의 도구를 사용하여 발현 숙주 에스 세레비지아에에 대해 적합화되었다. 생체내 조립을 위한 발현 플라스미드 및 선형 DNA 단편은 Gietz 및 Woods의 방법 (Gietz and Woods, Methods Enzymol. 350, 87-96 (2002))에 따라서 에스. 세레비지아에에 형질전환되었다. 별개 실시예에서 사용되는 발현 플라스미드의 개요는 표 2에 제공된다.

효모 균주

에스. 세레비지아에 S288c로부터 유래된, 사카로마이세스 세레비지아에 BY4742 (MATα, his3Δ1, leu2Δ0, lys2Δ0, ura3ΔO)는 Euroscarf 생물자원 센터 (Y10000, Euroscarf, University of Frankfurt, Germany)에서 입수하였고 발현 숙주로서 사용되었다. 모든 에스. 세레비지아에 균주는 1:1 비율 혼합물로 30% 멸균 글리세롤 존재의 저온바이알 중 -80℃에 저장되었다.

배양 조건

효모 배양은 접종 바늘을 사용하여 5 mL의 적절한 배지 중 저온바이알 또는 플레이트로부터 접종하였고 밤새 30℃ 및 200 rpm에서 인큐베이션하였다. 성장 및 생산 실험에 필요한, 단일 콜로니를 수득하기 위해서, 균주를 (선택적) SD CSM에 도말하였고 3일 동안 30℃에서 인큐베이션하였다. 이후에, 복제물을 선택하였고, 전-배양으로서 밤새 5 mL에 배양하였고 0.1의 광학 밀도 (OD)에서 성장 및 생산 실험을 접종하는데 사용되었다. 성장 및 생산 실험은 50 mL (ManNAc, Neu5Ac 및 6'SL 생산)을 함유하는 250 mL 진탕 플라스크 또는 100 mL (LNT II 및 LNnT 생산)의 신선한 예열 (30℃)된 적절한 배지를 함유하는 500 mL 진탕 플라스크에서 수행되었고, 30℃ 및 200 rpm에서 인큐베이션하였다. 샘플은 성장 및 생산을 평가하기 위해 규칙적인 시점에 수집되었다.

16시간 동안 성장된 진탕 플라스크 배양을 또한 생물반응기에 대한 접종원으로서 사용할 수 있다. 발효배양은 MFCS 제어 소프트웨어 (Sartorius Stedim Biotech, Melsungen, Germany)에 의해 제어되는, 4 L 작업 부피의 5 L Biostat Dcu-B에서 수행되었다. 발효기는 4% 접종원이 접종되었다. 발효기의 온도는 30℃로 유지되었고, pH는 전체 발효배양 전반에서 20% 암모늄 히드록시를 사용해 5.5와 6.5 사이로 제어되었다. 발효배양의 초기 시간 동안, 통기는 0.4 L/분으로 제어되었고, 용존 산소는 교반을 통해 20%로 제어되었다. 유가 배양 동안, 통기는 단계식 방식으로 1.5 L/분까지 조정되어서 용존 산소 수준을 유지하였다. 배기 가스는 냉각시켰다. 실리콘 소포제의 10% 용액은 발효배양 동안 기포가 발생될 때 첨가되었다. 유도제의 사용은 모든 유전자가 항상 발현되므로 요구되지 않는다. 발효배양은 글루코스 공급물을 사용해 수행되었고; 부가적인 락토스 공급물이 LNT II, LNnT 또는 6'SL의 생산에 사용되었다. 발효배양 동안 규치적인 샘플을 채취하였다.

세포외 생산을 평가하기 위해서, 0.5 mL 샘플을 원심분리 (11　000 rpm, 10분)하였고, 상청액은 PTFE 필터 (Novolab)를 통해서 여과되었다. 세포내 생산을 평가하기 위해서, 10 mL 샘플을 수집하였고 기술된 바와 같이 처리되었다 (Hollands et al., Metab. Eng. 52, 232-242 (2019). 여기서, 2 mL 샘플을 원심분리하였고, 펠렛은 dH₂O로 세척하였다. 적절한 양의 Cellytic Y 세포 용해 시약 (Sigma Aldrich) 및 산-세척 유리 비드 (425-600 μm; Sigma Aldrich)를 첨가하였고, 그 후에 샘플은 4℃에서 1분 와류의 10회 주기로 와류시킨 다음에, 적어도 30초 동안 얼음에 두었다. 마지막으로, 비드와 세포를 원심분리 (10 000 rpm, 10분)를 통해 펠렛화하였고, 상청액은 PTFE 필터를 통해 여과시켰다.

광학 밀도 및 pH

표모 배양의 세포 밀도는 V-630 Bio 분광광도계 (Jasco)를 사용하여 600 nm에서 광학 밀도를 측정하여 모니터링되었다.

여과된 상청액의 pH는 성장 및 생산 실험 동안 잠재적 변화를 모니터링하기 위해 측정되었다.

분석적 분석

표준물 예컨대, 제한없이 수크로스, 락토스, 시알산, 6'-시알릴락토스, LNT II, LNT 및 LNnT는 Carbosynth (UK), Elicityl (France) 및 IsoSep (Sweden)에서 구매하였다. 다른 화합물은 사내 제조 표준물로 분석하였다. 여과된 상청액 중 N-아세틸만노사민 (ManNAc), 시알산 (Neu5Ac) 및 6'-시알릴락토스 (6'SL) 함량은 UV-검출기에 연결된 Waters Acquity UPLC H-클래스 시스템으로 정량하였다. Rezex ROA-유기산 H+ 컬럼 (100 x 4.6 mm ID, 8%)은 65℃에서 이동층으로서 5 mM 황산과 함께 사용되었다. 유속은 0.1 mL/분으로 설정되었고, ManNAc, Neu5Ac 및 6'SL은 ACQUITY TUV 검출기를 사용하여 200 nm에서 측정되었다. 정량은 정량된 희석 범위의 표준물을 기반으로 수행되었다. 여과된 상층액 중 락토-N-트리오스 II (LNT II) 및 락토-N-네오테트라오스 (LNnT)는 분석 전에 둘 모두 유도체화되었다. 유도체화는 안트라닐아미드 (100 μL, 2.5 M), 2-피콜린 보란 (100 μL, 0.6 M) 및 아세트산 (50 μL)을 250 μL의 샘플에 첨가하여 수행하였고, 그 이후에 40℃에서 3시간의 인큐베이션을 후속하였다. 유도체화된 샘플은 UV-검출기에 연결된 Waters Acquity UPLC H-클래스 시스템으로 정량되었다. Acquity UPLC BEH Amide 1.7 μm 컬럼 (21 x 100 mm)은 표 4에 기록된 농도구배에 따라서, 0.6 mL/분의 유속으로 60℃에서 사용되었다. LNT II 및 LNnT는 254 nm의 빛을 사용하는 ACQUITY TUV 검출기를 사용해 측정되었다. 정량은 정량된 희석 범위의 표준물을 기반으로 수행되었다.

실시예 2. N-아세틸만노사민 (ManNAc)의 생산에 대한 조작된 에스. 세레비지아에 균주의 평가

이의 게놈으로부터 천연 유전자 GFA1 (SEQ ID NO 01), GNA1 (UniProt ID P43577), PCM1 (UniProt ID P38628) 및 QRI1 (UniProt ID P43123)을 발현하는 야생형 에스. 세레비지아에 BY4742 균주는 씨. 제주니 유래 neuC (UniProt ID AAK91727.1) 또는 SEQ ID NO 01을 갖는 에스. 세레비지아에 BY4742 유래 천연 GFA1의 부가적 카피에 대한 항상성 전사 유닛을 포함하거나, 또는 neuC (UniProt ID AAK91727.1) 및 SEQ ID NO 01을 갖는 WT GFA1, SEQ ID NO 42를 갖는 변이체 GFA1 (SEQ ID NO 01과 비교하여 Q96H 및 Q157R에 의해 적합화됨) 또는 SEQ ID NO 39를 갖는 변이체 GFA1 (SEQ ID NO 01과 비교하여 V12L, Q96H, Q157R 및 E343V에 의해 적합화됨)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환되어서, 표 3에 열거된 균주 sMan01 내지 sMan05를 생성시켰다. 신규 균주는 50 mL의 적절한 선택 배지를 함유하는 250 mL 진탕 플라스크를 사용하여 실시예 1에서 제공된 배양 조건에 따라서 7-일 성장 실험에서 평가하였고, 기준 균주 sMan06 (표 3 참조)과 비교하였다.

표 5에 표시된 바와 같이, ManNAc 생산은 neuC를 발현하는 모든 조작된 에스. 세레비지아에 균주 (sMan01, sMan02, sMan03 및 sMan04)에서 확인할 수 있었다. neuC가 결여된 균주 sMan05 및 sMan06은 ManNAc를 생산하지 않았다 (데이터 미도시). 추가로, 표 5는 sMan02 경우 처럼 게놈 상에 존재하는 천연 GFA1에 추가로 발현 플라스미드 상에 존재하는 SEQ ID NO 01을 갖는 WT GFA1의 추가 카피는 조작된 균주에서 ManNAc 생산을 개선시켰고, 이러한 생산은 sMan01의 경우 처럼 부가적인 GFA1이 결여된 균주와 비교하여 약 5배 더 높았다는 것을 보여준다. 또한, sMan03 및 sMan04 경우 처럼 천연 GFA1에 추가로 변이체 GFA1의 발현은 플라스미드 상에 임의 GFA1 유전자가 결여된 sMan01 균주와 비교하여 ManNAc 생산을 개선시켰다. 여기서, V12L, Q96H, Q157R 및 E343V 돌연변이를 갖는 GFA1 변이체는 Q96H 및 Q157R 돌연변이를 갖는 GFA1 변이체와 비교하여 2일, 3일 및 4일에 이 실험에서 생산의 최고 및 유의한 증가를 보였다. WT GFA1 또는 변이체 GFA1 (Q96H 및 Q157R 돌연변이를 갖거나 또는 V12L, Q96H, Q157R 및 E343V 돌연변이를 가짐)의 추가 카피는 또한 표 6에 표시된 ManNAc 생산성에 대해서 유의한 양성 효과를 가졌다.

실시예 3. 시알산 (Neu5Ac)의 생산에 대한 조작된 에스. 세레비지아에 균주의 평가

이의 게놈으로부터 천연 유전자 GFA1 (SEQ ID NO 01), GNA1 (UniProt ID P43577), PCM1 (UniProt ID P38628) 및 QRI1 (UniProt ID P43123)을 발현하는 야생형 에스. 세레비지아에 BY4742 균주는 씨. 제주니 유래 neuC (UniProt ID AAK91727.1) 및 이.콜라이 유래 neuB (UniProt ID Q46675)에 대한 항상성 전사 유전자를 포함하거나, 또는 neuC (UniProt ID AAK91727.1), neuB (UniProt ID Q46675) 및 SEQ ID NO 01을 갖는 에스. 세레비지아에 BY4742 유래 WT GFA1 또는 SEQ ID NO 42를 갖는 변이체 GFA1 (SEQ ID NO 01과 비교하여 Q96H 및 Q157R에 의해 적합화됨) 또는 SEQ ID NO 39를 갖는 변이체 GFA1 (SEQ ID NO 01과 비교하여 V12L, Q96H, Q157R 및 E343V에 의해 적합화됨)의 추가 카피에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환되어서, 균주 sNeu5Ac01 내지 sNeu5Ac04 (표 3 참조)를 생성하였다. 신규 균주는 50 mL의 적절한 선택 배지를 함유하는 250 mL 진탕 플라스크를 사용하여 실시예 1에 제공된 배양 조건에 따라서 3-일 성장 실험에서 평가하였고, neuB 및 부가적 GFA1 카피가 결여된 기준 균주 sMan01과 비교하였다.

표 7에 표시된 바와 같이, 모든 새롭게 생성된 에스. 세레비지아에 균주는 ManNAc를 생산하였는데, 약 4.38 내지 5.65 mg/L의 ManNAc는 세포내 분획에서 검출되었고, 114와 240 mg/L 사이의 ManNAc는 생산 세포로부터 배양으로 배출되었다. GFA1 폴리펩티드 (천연 형태 또는 2개 또는 4개 돌연변이를 함유하는 변이체)의 부가적 카피의 존재는 ManNAc의 세포외 생산을 유의하게 개선시켰는데, sNeu5Ac01 경우 처럼 부가적 GFA1 카피가 결여된 균주와 비교하여 2배 초과로 더 높았다. 또한, 10.41 mg/L과 13.48 mg/L 사이 범위의 Neu5aC의 세포내 생산은 천연 GFA1 또는 변이체 GFA1의 부가적 카피를 갖는 균주에서 측정할 수 있었다. Neu5Ac 생산은 부가적인 야생형 또는 변이체 GFA1이 없는 한 (천연) GFA1 카피만을 발현하는 sNeu5Ac01 균주에서 검출할 수 없었다.

실시예 4. 6'-시알릴락토스 (6'SL)의 생산에 대한 조작된 에스. 세레비지아에 균주의 평가

다음 단계에서, SEQ ID NO 01을 갖는 이의 천연 GFA1에 부가적으로, neuC (UniProt ID AAK91727.1), neuB (UniProt ID Q46675) 및 SEQ ID NO 39를 갖는 GFA1 변이체 (SEQ ID NO 01과 비교하여 V12L, Q96H, Q157R 및 E343V에 의해 적합화됨)를 발현하는 조작된 에스. 세레비지아에 균주 sNeu5Ac04는 씨. 제주니 유래 neuA (UniProt ID Q93MP7), 케이. 락티스 유래 LAC12 (UniProt ID P07921) 및 알파-2,6-시알릴트랜스퍼라제 활성을 갖고 포토박테리움 담셀라에 유래 알파-2,6-시알릴트랜스퍼라제 (a26ST)의 아미노산 잔기 108 내지 497로 구성된 폴리펩티드 (UniProt ID O66375)의 부가적 발현을 위한 항상성 전사 유닛을 갖는 여분의 플라스미드 (pSL6)로 형질전환되어서 균주 sSL06 (표 3 참조)을 생성시켰다. 50 mL의 적절한 선택 배지를 함유하는 250 mL 진탕 플라스크를 사용하여 실시예 1에 제공된 배양 조건에 따라서 3-일 성장 실험에서 평가했을 때, 신규 균주는 72시간 배양 이후에 세포외에서 13.71 ± 0.26 mg/L 6'SL 및 세포내에서 10.19 ± 0.08 mg/L 6'SL을 합성하는 것이 입증되었다.

실시예 5. 락토-N-트리오스 (LNT II) 및/또는 락토-N-네오테트라오스 (LNnT)의 생산에 대한 조작된 에스. 세레비지아에 균주의 평가

이의 게놈으로부터 천연 유전자 GFA1 (SEQ ID NO 01), GNA1 (UniProt ID P43577), PCM1 (UniProt ID P38628) 및 QRI1 (UniProt ID P43123)을 발현하는 야생형 에스. 세레비지아에 BY4742 균주는 SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 lgtA 및 케이. 락티스 유래 LAC12 (UniProt ID P07921)에 대한 항상성 전사 유닛을 포함하거나 또는 SEQ ID NO 54를 갖는 lgtA, LAC12 (UniProt ID P07921) 및 SEQ ID NO 01을 갖는 에스. 세레비지아에 BY4742 유래 WT GFA1 또는 SEQ ID NO 42 (SEQ ID NO 01과 비교하여 Q96H 및 Q157R에 의해 적합화됨) 또는 SEQ ID NO 39 (SEQ ID NO 01과 비교하여 V12L, Q96H, Q157R 및 E343V에 의해 적합화됨)를 갖는 변이체 GFA1의 부가적 카피에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환시켜서, 균주 sLNTII_01 내지 sLNTII_04 (표 3 참조)를 생성시켰다. 대안적인 단계에서, 야생형 에스. 세레비지아에 BY4742 균주는 엔. 메닌지티디스로부터 기원하는 SEQ ID NO 54를 갖는 lgtA 및 lgtB (UniProt ID Q51116), 및 케이. 락티스 유래 LAC12 (UniProt ID P07921)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드 또는 SEQ ID NO 54를 갖는 lgtA, lgtB (UniProt ID Q51116), LAC12 (UniProt ID P07921) 및 SEQ ID NO 01을 갖는 에스. 세레비지아에 BY4742 유래 WT GFA1 또는 SEQ ID NO 42 또는 SEQ ID NO 39를 갖는 변이체 GFA1의 부가적인 카피에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환되어서, 균주 sLNnT01 내지 sLNnT04 (표 3 참조)를 생성시켰다. 이와 같이, 추가적으로 lgtB를 발현하는 sLNnT 균주는 sLNTII 균주와 비교하였다.

모든 신규한 sLNTII_01 내지 sLNTII_04 및 sLNnT01 내지 sLNnT04 균주는 100 mL의 적절한 선택 배지를 함유하는 500 mL 진탕 플라스크를 사용하여 실시예 1에 제공된 배양 조건에 따른 3-일 성장 실험에서 평가하였고 기준 균주 sLNTII_05 (표 3 참조)와 비교하였다.

표 8에 표시된 바와 같이, 모든 새로운 생성된 에스. 세레비지아에 균주를 생성시켰고 LNT II 또는 LNnT를 배출하였다. 놀랍게도, GFA1 폴리펩티드 (천연 또는 2개 또는 4개 돌연변이를 함유하는 변이체)의 부가적 카피의 존재는 LNT II 및 LNnT 둘 모두의 생산을 유의하게 개선시켰다. 여기서, SEQ ID NO 42를 갖는 GFA1 변이체를 발현하는 sLNnT03 균주는 최고의 LNnT 생산을 갖는 것으로 입증되었다.

실시예 6. 조작된 에스. 세레비지아에 균주를 사용한 LNT II, LNnT 및/또는 6'SL의 배출

이의 게놈으로부터 천연 유전자 GFA1 (SEQ ID NO 01), GNA1 (UniProt ID P43577), PCM1 (UniProt ID P38628) 및 QRI1 (UniProt ID P43123)을 발현하는 야생형 에스. 세레비지아에 BY4742 균주는 neuC (UniProt ID AAK91727.1), neuB (UniProt ID Q46675) 및 SEQ ID NO 39를 갖는 변이체 GFA1 (SEQ ID NO 01과 비교하여 V12L, Q96H, Q157R 및 E343V에 의해 적합화됨)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환되어서, 균주 sNeu5Ac04 (표 3)를 생성시켰다. 다음 단계에서, 조작된 에스. 세레비지아에 균주 sNeu5Ac04는 씨. 제주니 유래 neuA (UniProt ID Q93MP7), 케이. 락티스 유래 LAC12 (UniProt ID P07921) 및 알파-2,6-시알릴트랜스퍼라제 활성을 갖고, 포토박테리움 담셀라에 유래 알파-2,6-시알릴트랜스퍼라제 (a26ST)의 아미노산 잔기 108 내지 497을 갖는 폴리펩티드 (UniProt ID O66375)의 부가적 발현에 대한 항상성 전사 유닛을 갖는 여분의 플라스미드 (pSL6)로 형질전환되어서, 균주 sSL06 (표 3 참조)을 생성시켰다.

더 나아가서, 야생형 에스. 세레비지아에 BY4742는 SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 lgtA 및 케이. 락티스 유래 LAC12 (UniProt ID P07921)에 대한 항상성 전사 유닛을 포함하거나 또는 SEQ ID NO 54를 갖는 lgtA, LAC12 (UniProt ID P07921) 및 SEQ ID NO 01을 갖는 에스. 세레비지아에 BY4742 유래 WT GFA1 또는 SEQ ID NO 42를 갖는 변이체 GFA1 (SEQ ID NO 01과 비교하여 Q96H 및 Q157R에 의해 적합화됨) 또는 SEQ ID NO 39를 갖는 변이체 GFA1 (SEQ ID NO 01과 비교하여 V12L, Q96H, Q157R 및 E343V에 의해 적합화됨)의 부가적 카피에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환되어서, 균주 sLNTII_01 내지 sLNTII_04 (표 3 참조)를 생성시켰다. 대안적 단계에서, 야생형 에스. 세레비지아에 BY4742 균주는 엔. 메닌지티디스로부터 기원하는, SEQ ID NO 54를 갖는 lgtA 및 lgtB (UniProt ID Q51116), 및 케이. 락티스 유래 LAC12 (UniProt ID P07921)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드 또는 SEQ ID NO 54를 갖는 lgtA, lgtB (UniProt ID Q51116), LAC12 (UniProt ID P07921) 및 SEQ ID NO 01을 갖는 에스. 세레비지아에 BY4742 유래 WT GFA1 또는 SEQ ID NO 42 또는 SEQ ID NO 39를 갖는 변이체 GFA1의 부가적 카피에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환시켜서, 균주 sLNnT01 내지 sLNnT04 (표 3 참조)를 생성시켰다.

모든 신규 효모 균주는 적절한 선택 배지를 함유하는 진탕 플라스크를 사용하여 실시예 1에 제공되는 배양 조건에 따른 3-일 성장 실험에서 평가되었다.

표 9에 표시된 바와 같은, 모든 새롭게 생성된 에스. 세레비지아에 균주는 6'SL, LNT II 또는 LNnT를 생산하여서 배양 액체배지로 배출하였다. 놀랍게도, GFA1 형태의 부가적 카피의 존재는 세포외 분획에서 유의하게 LNT II 및 LNnT 둘 모두의 생산을 개선시켰다.

실시예 7. 뱃치 발효배양에서 ManNAc, Neu5Ac 및 6'-시알릴락토스의 생산에 대한 조작된 에스. 세레비지아에 균주의 평가

생물반응기 규모의 뱃치 발효배양은 씨. 제주니 유래 neuC (UniProt ID AAK91727.1), 및 SEQ ID NO 42 (SEQ ID NO 01과 비교하여 Q96H 및 Q157R에 의해 적합화됨) 또는 SEQ ID NO 39 (SEQ ID NO 01과 비교하여 V12L, Q96H, Q157R 및 E343V에 의해 적합화됨)로부터 선택되는 변이체 GFA1을 발현하고 ManNAc를 생산하는 조작된 에스. 세레비지아에 균주 예컨대 균주 sManNAc03 및 sManNAc04, 또는 추가적으로 이.콜라이 유래 neuB (UniProt ID Q46675)를 발현하고 ManNAc 및 Neu5Ac를 생산하는 균주 예컨대 균주 sNeu5Ac03 및 sNeu5Ac04, 또는 추가적으로 이.콜라이 유래 neuB (UniProt ID Q46675) 및 씨. 제주니 유래 neuA (UniProt ID Q93MP7), 케이. 락티스 유래 LAC12 (UniProt ID P07921) 및 알파-2,6-시알릴트랜스퍼라제 활성을 갖고 포토박테리움 담셀라에 유래 알파-2,6-시알릴트랜스퍼라제 (a26ST)의 아미노산 잔기 108 내지 497로 구성된 폴리펩티드 (UniProt ID O66375)를 발현하고 ManNAc, Neu5Ac 및 6'SL을 생산하는 균주 예컨대 균주 sSL06를 평가하기 위해 수행되었다. 조작된 균주의 상세 설명은 표 3에 요약된다. 생물반응기 작업은 실시예 1에 기술된 대로 수행된다. 이들 실시예에서, 글루코스가 탄소 공급원으로서 사용된다. 6'SL 생산 균주를 사용한 작업에서 락토스는 6'SL 형성을 위한 전구체로서 50 내지 150 g/L 범위의 농도로 뱃치 배지에 첨가된다. 규칙적으로 샘플을 채취하고 ManNAc, Neu5Ac 및 6'SL의 생산은 실시예 1에 기술된 대로 측정된다.

실시예 8. 뱃치 발효배양으로 LNT II 및 LNnT의 생산에 대한 조작된 에스. 세레비지아에 균주의 평가

다른 실시예에서, 생물반응기 규모의 뱃치 발효배양은 엔. 메닌지티디스 유래 SEQ ID NO 54를 갖는 lgtA, 케이. 락티스 유래 LAC12 (UniProt ID P07921) 및 SEQ ID NO 42 (SEQ ID NO 01과 비교하여 Q96H 및 Q157R에 의해 적합화됨) 또는 SEQ ID NO 39 (SEQ ID NO 01과 비교하여 V12L, Q96H, Q157R 및 E343V에 의해 적합화됨)로부터 선택된 변이체 GFA1을 발현하고 LNT II를 생산하는 조작된 에스. 세레비지아에 균주 예컨대 균주 sLNTII_03 및 sLNTII_04, 또는 추가적으로 엔. 메닌지티디스 유래 lgtB (UniProt ID Q51116)를 발현하고 LNT II 및 LNnT를 생산하는 균주 예컨대 균주 sLNnT03 및 sLNnT04를 평가하기 위해 수행된다. 조작된 균주의 상세설명은 표 3에 요약된다. 생물반응기 작업은 실시예 1에 기술된 대로 수행된다. 이들 실시예에서, 글루코스는 탄소 공급원으로서 사용된다. 락토스는 LNT II 및 LNnT 형성을 위한 전구체로서 50 내지 150 g/L 범위의 농도로 뱃치 배지에 첨가된다. 규칙적인 샘플이 채취되고 LNT II 및 LNnT의 생산은 실시예 1에 기술된 대로 측정된다.

실시예 9. 3'-시알릴락토스 (3'SL)의 생산에 대한 조작된 에스. 세레비지아에 균주의 평가

실시예 4에 대안적으로, SEQ ID NO 01을 갖는 이의 천연 GFA1에 더해서 neuC (UniProt ID AAK91727.1), neuB (UniProt ID Q46675) 및 SEQ ID NO 39를 갖는 GFA1 변이체 (SEQ ID NO 01과 비교하여 V12L, Q96H, Q157R 및 E343V에 의해 적합화됨)를 발현하는 조작된 에스. 세레비지아에 균주 sNeu5Ac04는 씨. 제주니 유래 neuA (UniProt ID Q93MP7), 케이. 락티스 유래 LAC12 (UniProt ID P07921) 및 알파-2,3-시알릴트랜스퍼라제 활성을 갖고 파스퇴렐라 멀토시다 (Pasteurella multocida) 유래 알파-2,3-시알릴트랜스퍼라제 (PmultST3)의 아미노산 잔기 1 내지 268로 구성된 폴리펩티드 (UniProt ID Q9CLP3) 또는 SEQ ID NO 56를 갖는 엔. 메닌지티디스 유래 알파-2,3-시알릴트랜스퍼라제의 부가적 발현을 위한 항상성 전사 유닛을 갖는 여분의 플라스미드로 형질전환된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 1에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가했을 때 3'SL의 생산에 대해 평가된다.

실시예 10. LNT II 및 락토-N-테트라오스 (LNT)의 생산에 대한 조작된 에스. 세레비지아에 균주의 평가

실시예 5에 대안적으로, 이의 게놈으로부터 천연 유전자 GFA1 (SEQ ID NO 01), GNA1 (UniProt ID P43577), PCM1 (UniProt ID P38628) 및 QRI1 (UniProt ID P43123)을 발현하는 야생형 에스. 세레비지아에 BY4742 균주는 SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 lgtA, 이.콜라이 O55:H7 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 wbgO (UniProt ID D3QY14), 케이. 락티스 NRRL Y-1140 유래 락토스 퍼미아제 LAC12 (UniProt ID P07921) 및 SEQ ID NO 39를 갖는 변이체 GFA1 (SEQ ID NO 01과 비교하여 V12L, Q96H, Q157R 및 E343V에 의해 적합화됨)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 1에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가했을 때 LNT II 및 락토-N-테트라오스 (LNT)의 생산에 대해 평가된다.

실시예 11. LNT II, 시알릴화 LNT II, LNT, 3'SL 및 LSTa를 포함하는 올리고당 혼합물의 생산에 대한 조작된 에스. 세레비지아에 균주의 평가

이의 게놈으로부터 천연 유전자 GFA1 (SEQ ID NO 01), GNA1 (UniProt ID P43577), PCM1 (UniProt ID P38628) 및 QRI1 (UniProt ID P43123)를 발현하는 야생형 에스. 세레비지아에 BY4742 균주는 SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 lgtA, 이.콜라이 O55:H7 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 wbgO (UniProt ID D3QY14), 씨. 제주니 유래 N-아세틸글루코사민-6-포스페이트 2-에피머라제 (neuC) (UniProt ID AAK91727.1), 이.콜라이 유래 N-아세틸뉴라미네이트 신타제 (neuB) (UniProt ID Q46675)) 및 SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 변형된다. 다음 단계에서, 조작된 균주는 씨. 제주니 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (neuA) (UniProt ID Q93MP7), 케이. 락티스 유래 락토스 퍼미아제 LAC12 (UniProt ID P07921) 및 알파-2,3-시알릴트랜스퍼라제 활성을 갖고 파스퇴렐라 멀토시다 유래 알파-2,3-시알릴트랜스퍼라제 (PmultST3)의 아미노산 잔기 1 내지 268로 구성된 폴리펩티드 (UniProt ID Q9CLP3) 또는 SEQ ID NO 56를 갖는 엔. 메닌지티디스 유래 알파-2,3-시알릴트랜스퍼라제 (NmeniST3)의 부가적 발현에 대한 항상성 전사 유닛을 갖는 발현 플라스미드로 형질전환되었다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용해 실시예 1에 제공되는 배양 조건에 따른 3-일 성장 실험에서 평가될 때 LNT II, 3'-시알릴화 LNT II (Neu5Ac-α2,3-GlcNAc-β1,3-Gal-β1,4-Glc), LNT, 3'SL 및 LSTa (Neu5Ac-α2,3-Gal-β1,3-GlcNAc-β1,3-Gal-β1,4-Glc)를 포함하는 올리고당 혼합물의 생산에 대해 평가된다

실시예 12. LNT II, 시알릴화 LNT II, LNnT, 6'SL 및 LSTc를 포함하는 올리고당 혼합물의 생산에 대한 조작된 에스. 세레비지아에 균주의 평가

이의 게놈으로부터 천연 유전자 GFA1 (SEQ ID NO 01), GNA1 (UniProt ID P43577), PCM1 (UniProt ID P38628) 및 QRI1 (UniProt ID P43123)을 발현하는 야생형 에스. 세레비지아에 BY4742 균주는 SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 lgtA, 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (lgtB) (UniProt ID Q51116), 씨. 제주니 유래 N-아세틸글루코사민-6-포스페이트 2-에피머라제 (neuC) (UniProt ID AAK91727.1), 이.콜라이 유래 N-아세틸뉴라미네이트 신타제 (neuB) (UniProt ID Q46675) 및 SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 변형된다. 다음 단계에서, 조작된 균주는 씨. 제주니 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (neuA) (UniProt ID Q93MP7), 케이. 락티스 유래 락토스 퍼미아제 LAC12 (UniProt ID P07921) 및 알파-2,6-시알릴트랜스퍼라제 활성을 갖고 포토박테리움 담셀라에 유래 알파-2,6-시알릴트랜스퍼라제 (a26ST)의 아미노산 잔기 108 내지 497로 구성된 폴리펩티드 (UniProt ID O66375) 또는 알파-2,6-시알릴트랜스퍼라제 활성을 갖고 포토박테리움 sp. JT-ISH-224 유래 알파-2,6-시알릴트랜스퍼라제의 아미노산 잔기 18 내지 514 (UniProt ID A8QYL1)로 구성된 폴리펩티드의 부가적 발현을 위한 항상성 전사 유닛을 갖는 발현 플라스미드로 형질전환된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 1에 제공되는 배양 조건에 따른 3-일 성장 실험에서 평가될 때 LNT II, 6'-시알릴화 LNT II (Neu5Ac-α2,6-[GlcNAc-β1,3]-Gal-β1,4-Glc), LNnT, 6'SL 및 LSTc (Neu5Ac-α2,6-Gal-β1,4-GlcNAc-β1,3-Gal-β1,4-Glc)를 포함하는 올리고당 혼합물의 생산에 대해 평가된다.

실시예 13. LNT II, 시알릴화 LNT II, LNnT, 3'SL 및 LSTd를 포함하는 올리고당 혼합물의 생산에 대해 조작된 에스. 세레비지아에 균주의 평가

이의 게놈으로부터 천연 유전자 GFA1 (SEQ ID NO 01), GNA1 (UniProt ID P43577), PCM1 (UniProt ID P38628) 및 QRI1 (UniProt ID P43123)을 발현하는 야생형 에스. 세레비지아에 BY4742 균주는 SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 lgtA, 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (lgtB) (UniProt ID Q51116), 씨. 제주니 유래 N-아세틸글루코사민-6-포스페이트 2-에피머라제 (neuC) (UniProt ID AAK91727.1), 이. 콜라이 유래 N-아세틸뉴라미네이트 신타제 (neuB) (UniProt ID Q46675) 및 SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 변형된다. 다음 단계에서, 조작된 균주는 씨. 제주니 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (neuA) (UniProt ID Q93MP7), 케이. 락티스 유래 락토스 퍼미아제 LAC12 (UniProt ID P07921) 및 알파-2,3-시알릴트랜스퍼라제 활성을 갖고 파스퇴렐라 멀토시다 유래 알파-2,3-시알릴트랜스퍼라제 (PmultST3)의 아미노산 잔기 1 내지 268로 구성된 폴리펩티드 (UniProt ID Q9CLP3) 또는 SEQ ID NO 56를 갖는 엔. 메닌지티디스 유래 알파-2,3-시알릴트랜스퍼라제(NmeniST3)의 부가적 발현을 위한 항상성 전사 유닛을 갖는 발현 플라스미드로 형질전환된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 1에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II, 3'-시알릴화 LNT II (Neu5Ac-α2,3-GlcNAc-β1,3-Gal-β1,4-Glc), LNnT, 3'SL 및 LSTd (Neu5Ac-α2,3-Gal-β1,4-GlcNAc-β1,3-Gal-β1,4-Glc)를 포함하는 올리고당 혼합물의 생산에 대해 평가된다.

실시예 14. 재료 및 방법 에스케리치아 콜라이

배지

2개 배지 즉, LB (Luria Broth) 및 최소 배지가 이. 콜라이를 배양하는데 사용되었다. LB 배지는 1% 트립톤 펩톤 (Difco), 0.5% 효모 추출물 (Difco) 및 0.5% 소듐 클로라이드 (VWR)로 이루어졌다. 96-웰 플레이트 또는 진탕 플라스크의 배양 실험에서 사용되는 최소 배지는 2.00 g/L NH₄Cl, 5.00 g/L (NH₄)₂SO₄, 2.993 g/L KH₂PO₄, 7.315 g/L K₂HPO₄, 8.372 g/L MOPS, 0.5 g/L NaCl, 0.5 g/L MgSO₄.7H₂O, 30 g/L 수크로스 또는 30 g/L 글리세롤, 1 mL/L 비타민 용액, 100 μl/L 몰리브데이트 용액, 및 1 mL/L 셀레늄 용액을 함유하였다. 3'SL, 6'SL, LNT II 및/또는 LNnT의 생산에 대한 각 실시예에 명시된 바와 같이, 20 g/L 락토스가 전구체로서 배지에 추가적으로 첨가되었다. 최소 배지는 1 M KOH를 사용해 7.0의 pH로 설정되었다. 비타민 용액은 3.6 g/L FeCl₂.4H₂O, 5 g/L CaCl₂.2H₂O, 1.3 g/L MnCl₂.2H₂O, 0.38 g/L CuCl₂.2H₂O, 0.5 g/L CoCl₂.6H₂O, 0.94 g/L ZnCl₂, 0.0311 g/L H₃BO₄, 0.4 g/L Na₂EDTA.2H₂O 및 1.01 g/L 티아민.HCl로 이루어졌다. 몰리브데이트 용액은 0.967 g/L NaMoO₄.2H₂O를 함유하였다. 셀레늄 용액은 42 g/L Seo₂를 함유하였다.

발효배양을 위한 최소 배지는 6.75 g/L NH₄Cl, 1.25 g/L (NH₄)₂SO₄, 2.93 g/L KH₂PO₄ 및 7.31 g/L KH₂PO₄, 0.5 g/L NaCl, 0.5 g/L MgSO₄.7H₂O, 30 g/L 수크로스 또는 30 g/L 글리세롤, 1 mL/L 비타민 용액, 100 μL/L 몰리브데이트 용액, 및 상기 기술된 바와 동일한 조성의 1 mL/L 셀레늄 용액을 함유하였다. 각 실시예에 명시된 바와 같이, 0.30 g/L 시알산, 20 g/L 락토스, 20 g/L LacNAc 및/또는 20 g/L LNB가 전구체(들)로서 배지에 추가적으로 첨가되었다.

복합 배지는 오토클레이빙 (121℃, 21분)으로 최소 배지는 여과 (0.22 μm Sartorius)를 통해 멸균되었다. 필요할 때, 배지는 항생제, 예를 들어, 클로람페니콜 (20 mg/L), 카르베니실린 (100 mg/L), 스펙티노마이신 (40 mg/L) 및/또는 카나마이신 (50 mg/L)을 첨가하여 선택적으로 만들었다.

플라스미드

pKD46 (Red 헬퍼 플라스미드, 암피실린 내성), pKD3 (FRT-측접된 클로람페니콜 내성 (cat) 유전 함유자), pKD4 (FRT-측접된 카나마이신 내성 (kan) 유전자 함유), 및 pCP20 (FLP 리콤비나제 활성 발현) 플라스미드는 Prof. R. Cunin (Vrije Universiteit Brussel, Belgium in 2007)로부터 입수하였다. 플라스미드는 Invitrogen에서 구매한 숙주 이.콜라이 DH5알파 (F^-, phi80dlacZΔM15, Δ(lacZYA-argF) U169, deoR, recA1, endA1, hsdR17(rk^-, mk⁺), phoA, supE44, lambda^-, thi-1, gyrA96, relA1)에서 유지시켰다.

균주 및 돌연변이

에스케리치아 콜라이 K12 MG1655 [λ^-, F^-, rph-1] 는 2007년 3월에, 콜라이 유전자 자원 센터 (Coli Genetic Stock Center) (US) (CGSC 균주#: 7740)에서 수득되었다. 유전자 파괴, 유전자 도입 및 유전자 치환은 Datsenko 및 Wanner (PNAS 97 (2000), 6640-6645)가 공개한 기술을 사용해 수행되었다. 이러한 기술은 람다 Red 리콤비나제에 의해 수행된 상동성 재조합 이후에 항생제 선택을 기반으로 한다. 필리파제 리콤비나제의 후속 촉매는 최종 생산 균주에서 항생제 선택 카세트의 제거를 보장한다. Red 헬퍼 플라스미드 pKD46을 보유하는 형질전환체는 암피실린, (100 mg/L) 및 L-아라비노스 (10 mM) 존재의 10 mL LB 배지에 30℃에서 0.6의 OD_600nm 까지 성장되었다. 세포는 50 mL의 빙냉수로 1회 세척하고, 1 ml 빙내수로 2회 세척하여 전기적격하게 만들었다. 다음으로, 세포는 50 μL의 빙냉수에 재현탁되었다. 전기 천공은 50 μL의 세포 및 10-100 ng의 선형 이중 가닥-DNA 생산물과 유전자 Pulser™ (BioRad) (600 Ω, 25 μFD, 및 250 볼트)를 사용하여 수행되었다. 전기천공 후에, 세포는 1시간 동안 37℃에서 인큐베이션된 1 mL LB에 첨가되었고, 최종적으로25 mg/L의 클로람페니콜 또는 50 mg/L의 카나마이신을 함유하는 LB-한천 상에 도말되어서 항생제 내성 형질전환체를 선택하였다. 선택된 조작된 균주는 변형된 영역의 상류 및 하류의 프라이머를 사용하는 PCR을 통해 검증되었고 헬퍼 플라스미드의 상실에 대해 42℃에 LB-한천에서 성장시켰다. 조작된 균주는 암피실린 민감도에 대해 시험되었다. 선형 ds-DNA 앰플리콘은 pKD3, pKD4 및 그들 유도체를 주형으로서 사용하는 PCR을 통해 수득되었다. 사용된 플라스미드는 주형에 상보적인 서열의 일부 및 재조합이 일어나야만 하는 염색체 DNA 상의 면에 상보적인 다른 일부를 가졌다. 게놈 녹아웃 경우, 상동성의 영역은 관심 유전자의 출발 및 중지 코돈의 상류 50-nt 및 하류 50-nt에 디자인하였다. 게놈 녹-인 경우, 전사 출발 지점 (+1)을 준수해야 한다. PCR 생산물은 PCR-정제되었고, Dpnl로 분해되고, 아가로스 겔로부터 재-정제되어서 용리 완충액 (5 mM Tris, pH 8.0)에 재현탁된다. 선택된 조작된 균주는 온도-민감성 복제 및 FLP 합성의 역적 유도를 보이는 암피실린 및 클로람페니콜 내성 플라스미드인, pCP20 플라스미드로 형질전환되었다. 암피실린-내성 형질전환체는 30℃에서 선택되었고, 그 이후에, 몇개를 42℃에 LB에서 콜로니 정제하였고, 모든 항생제 내성 및 FLP 헬퍼 플라스미드의 상실에 대해 시험되었다. 유전자 녹아웃 및 녹인은 대조군 프라이머를 사용해 검토된다.

시알산 (Neu5Ac) 생산에 대한 실시예에서, 조작된 균주는 이.콜라이 nagA 및 nagB 유전자의 녹아웃 및 포스포글루코사민 뮤타제 예컨대, 예를 들어, 이. 콜라이 유래 glmM (UniProt ID P31120), N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제/글루코사민-1-포스페이트 아세틸트랜스퍼라제 예컨대, 예를 들어, 이. 콜라이 유래 glmU (UniProt ID P0ACC7), UDP-N-아세틸글루코사민 2-에피머라제 예컨대, 예를 들어, 씨. 제주니 유래 neuC (UniProt ID AAK91727.1) 및 N-아세틸뉴라미네이트 신타제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 neuB (UniProt ID E0NCD4)를 함유하는 항상성 전사 유닛의 게놈 녹-인을 포함하는 이.콜라이 K12 MG1655로부터 유래되었다. 시알산 생산은 WO18122225에 기술된 바와 같은 nagC, nagD, nagE, nanA, nanE, nanK, manX, manY 및 manZ 를 포함하는 이. 콜라이 유전자의 게놈 녹아웃 및 SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53로부터 선택되는 변이체 GFA1을 포함하는 항상성 전사 유닛의 게놈 녹-인으로 조작된 이. 콜라이 균주에서 추가로 최적화될 수 있다.

시알릴화 올리고당 생산을 위해서, 시알산 생산 균주는 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 예컨대, 예를 들어, SEQ ID NO 55를 갖는 파스퇴렐라 멀토시다 유래 neuA, 및 (i) 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래 PmultST3 (UniProt ID Q9CLP3), 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 UniProt ID Q9CLP3의 아미노산 잔기 1 내지 268로 이루어진 PmultST3-유사 폴리펩티드, 엔. 메닌지티디스 유래 NmeniST3(SEQ ID NO 56) 또는 피. 멀토시다 subsp. 멀토시다 str. Pm70 유래 PmultST2 (SEQ ID NO 57), (ii) 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 예컨대, 예를 들어, 포토박테리움 담셀라에 유래 PdST6 (UniProt ID O66375), 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID O66375의 아미노산 잔기 108 내지 497의 아미노산 잔기로 이루어진 PdST6-유사 폴리펩티드, 포토박테리움 sp. JT-ISH-224 유래 P-JT-ISH-224-ST6 (UniProt ID A8QYL1) 또는 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID A8QYL1의 아미노산 잔기 18 내지 514로 이루어진 P-JT-ISH-224-ST6-유사 폴리펩티드, 및/또는 (iii) 예컨대, 예를 들어, 엠. 무스쿨루스 유래 알파-2,8-시알릴트랜스퍼라제 (UniProt ID Q64689)를 추가로 발현할 필요가 있다. N-아실뉴라미네이트 시티딜릴트랜스퍼라제 및 시알릴트랜스퍼라제의 항상성 전사 유닛은 게놈 녹-인을 통해서 또는 발현 플라스미드를 통해서 조작된 균주로 전달될 수 있다. 시알산 및 CMP-시알산을 생산하는 조작된 균주가 시알릴화 락토스 구조를 만들고자 의도되었다면, 균주는 이.콜라이 LacZ, LacY 및 LacA 유전자의 게놈 녹아웃 및 락토스 퍼미아제 예컨대, 예를 들어, 이.콜라이 유래 LacY (UniProt ID P02920)에 대한 항상성 전사 유닛의 게놈 녹-인으로 추가로 변형시켰다. 시알산, CMP-시알산 및/또는 시알릴화 올리고당을 생산하는 모든 조작된 균주는 임의로 수크로스 수송체 예컨대, 예를 들어, 이.콜라이 W 유래 CscB (UniProt ID E0IXR1), 프룩토스 키나제 예컨대, 예를 들어, 자이모모나스 모빌리스 (Zymomonas mobilis)에서 기원하는 Frk (UniProt ID Q03417) 및 예컨대, 예를 들어, 비피도박테리움 아돌레센티스 (Bifidobacterium adolescentis)로부터 기원하는, 수크로스 포스포릴라제 (UniProt ID A0ZZH6)를 함유하는 항상성 전사 유닛의 게놈 녹-인을 통해서 수크로스 상의 성장을 위해 적합화될 수 있다.

LNT II, 및 락토-N-테트라오스 (LNT) 및 락토-N-네오테트라오스 (LNnT)를 포함하는 이에서 기원된 올리고당을 생산하기 위한 실시예에서, 조작된 균주는 이.콜라이 K12 MG1655로부터 유래되었고, 이.콜라이 LacZ 및 nagB 유전자의 녹아웃 및 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 예컨대, 예를 들어, SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 lgtA에 대한 항상성 전사 유닛의 게놈 녹-인으로 변형되었다. LNT 또는 LNnT 생산을 위해서, 조작된 균주는 각각, 게놈 녹-인을 통해서 또는 발현 플라스미드로부터 균주에게 전달될 수 있는, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 예컨대, 예를 들어, 이.콜라이 O55:H7 유래 wbgO (UniProt ID D3QY14) 또는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtB (UniProt ID Q51116)에 대한 항상성 전사 유닛에 의해 추가로 변형되었다. 임의로, 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 및/또는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 유전자의 다수 카피가 조작된 이. 콜라이 균주에 첨가될 수 있었다. 또한, LNT 및/또는 LNnT 생산은 SEQ ID NO 02 내지 38로부터 선택되는, GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1에 대한 항상성 전사 유닛의 하나 이상의 게놈 녹-인에 의한 균주의 변형을 통해서 개선된 UDP-GlcNAc 생산에 의해 증강될 수 있다. 부가적으로, 균주는 임의로 이.콜라이 ushA 및 galT 유전자의 게놈 녹아웃에 의해서 증강된 UDP-갈락토스 생산을 의해 변형될 수 있다. 조작된 이.콜라이 균주는 또한 임의로 UDP-글루코스-4-에피머라제 예컨대, 예를 들어, 이.콜라이 유래 galE (UniProt ID P09147), 포스포글루코사민 뮤타제 예컨대, 예를 들어, 이.콜라이 유래 glmM (UniProt ID P31120) 및 N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제 / 글루코사민-1-포스페이트 아세틸트랜스퍼라제 예컨대, 예를 들어, 이.콜라이 유래 glmU (UniProt ID P0ACC7)에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 적합화될 수 있다. 조작된 균주는 또한 임의로 수크로스 수송체 예컨대, 예를 들어, 이.콜라이 W 유래 CscB (UniProt ID E0IXR1), 프룩토스 키나제 예컨대, 예를 들어, 지. 모빌리스로부터 기원하는 Frk (UniProt ID Q03417) 및 예컨대, 예를 들어, 비. 아돌레센티스로부터 기원하는 수크로스 포스포릴라제 (UniProt ID A0ZZH6)를 함유하는 항상성 전사 유닛의 게놈 녹-인을 통해서 수크로스 상에서 성장을 위해 적합화될 수 있다.

필수는 아니지만 바람직하게, 뉴클레오티드-활성화된 당 합성에 관여된 단백질 및 글리코실라제트랜스퍼라제 중 어느 하나 이상은 그들 가용성을 증강시키기 위해서 가용성 인핸서 태그 예컨대, 예를 들어, SUMO-태그, MBP-태그, His, FLAG, Strep-II, Halo-태그, NusA, 티오레독신, GST 및/또는 Fh8-태그에 N-말단 및/또는 C-말단에서 융합된다 (Costa et al., Front. Microbiol. 2014, https://doi.org/10.3389/fmicb.2014.00063; Fox et al., Protein Sci. 2001, 10(3), 622-630; Jia and Jeaon, Open Biol. 2016, 6: 160196).

임의로, 조작된 이.콜라이 균주는 샤페론 단백질 예컨대, 예를 들어, DnaK, DnaJ, GrpE 또는 GroEL/ES 샤페로닌 시스템을 코딩하는 항상성 전사 유닛의 게놈 녹-인에 의해 변형되었다 (Baneyx F., Palumbo J.L. (2003) Improving Heterologous Protein Folding via Molecular Chaperone and Foldase Co-Expression. In: Vaillancourt P.E. (eds) E. coli Gene Expression Protocols. Methods in Molecular Biology™, vol 205. Humana Press).

모든 항상성 프로모터, UTR 및 종결자 서열은 Cambray et al. (Nucleic Acids Res. 2013, 41(9), 5139-5148), Dunn et al. (Nucleic Acids Res. 1980, 8, 2119-2132), Edens et al. (Nucleic Acids Res. 1975, 2, 1811-1820), Kim and Lee (FEBS Letters 1997, 407, 353-356) 및 Mutalik et al. (Nat. Methods 2013, No. 10, 354-360)가 기술한 라이브러리로부터 기원하였다. 모든 유전자는 Twist Bioscience (twistbioscience.com) 또는 IDT (eu.idtdna.com)에서 합성으로 주문하였고 코돈 용법은 공급사의 도구를 사용해 적합화되었다.

모든 균주는 저온바이알 중에 -80℃에서 저장되었다 (밤샘 LB 배양을 1:1 비율로 70% 글리세롤과 혼합함).

배양 조건

96-웰 마이크로타이터 플레이트 실험의 전배양은 150 μL LB 중에, 저온바이알로부터 출발하여서 800 rpm에 회전 진탕기에서 밤새 37℃에서 인큐베이션되었다. 이 배양을 400x로 희석하여 400 μL 최소 배지가 있는, 96웰 사각 마이크로타이터 플레이트에 대한 접종원으로서 사용하였다. 이들 최종 96-웰 배양 플레이트를 72시간, 또는 더 짧거나 또는 더 긴 동안 800 rpm에 회전 진탕기 상에서 37℃에서 인큐베이션하였다. 배양 실험의 종료 시에 당 농도를 측정하기 위해서 전체 액체배지 샘플은 세포를 스핀 다운 하기 전에 60℃에서 15분 동안 배양 액체배지를 끓여서 각 웰로부터 채취하였다 (= 세포내 및 세포외 당 농도의 평균).

생물반응기에 대한 전배양은 일정 균주의 전체 1 mL 저온바이알로부터 출발하여서 1 L 또는 2.5 L 진탕 플라스크의 250 mL 또는 500 mL 최소 배지에 접종하였고 200 rpm으로 회전 진탕기 상에서 24시간 동안 37℃에서 인큐베이션하였다. 5 L 생물반응기에 접종하였고 (2 L 뱃치 배지 중 250 mL 접종원); 과정은 MFCS 제어 소프트웨어 (Sartorius Stedim Biotech, Melsungen, Germany)를 통해 제어하였다. 배양 조건은 37℃, 및 최대 교반으로 설정하였고; 압력 가스 유속은 균주 및 생물반응기에 의존하여 달리하였다. pH는 6.8에서 0.5 M H₂S0₄ 및 20% NH₄OH를 사용헤 제어되었다. 배기 가스는 냉각시켰다. 실리콘 소포제의 10% 용액이 발효배양 동안 기포가 생성될 때 첨가되었다.

광학 밀도, pH 및 분석적 분석

박테리아 배양의 광학 밀도 및 pH의 결정을 비롯하여 분석적 분석은 실시예 1에 기술된 대로 수행되었다.

실시예 15. ManNAc 및 Neu5Ac 및 3'-시알릴락토스 (3'SL) 또는 6'-시알릴락토스 (6'SL)의 생산에 대한 조작된 이. 콜라이 균주의 평가

야생형 이.콜라이 K-12 MG1655 균주는 이.콜라이 유전자 nagA, nagB, lacY, lacZ, nanA, nanE 및 nanK 의 게놈 녹아웃과 함께, SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1, 이.콜라이 유래 glmM (UniProt ID P31120), 이.콜라이 유래 glmU (UniProt ID P0ACC7), 씨. 제주니 유래 neuC (UniProt ID AAK91727.1), 엔. 메닌지티디스 유래 neuB (UniProt ID E0NCD4) 및 이.콜라이 유래 락토스 퍼미아제 (lacY) (UniProt ID P02920)에 대한 항상성 전사 유닛의 게놈 녹-인으로 변형된다. 다음 단계에서, 신규 균주는 피. 멀토시다 유래의 SEQ ID NO 55를 갖는 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (neuA) 및 (i) 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래 PmultST3 (UniProt ID Q9CLP3), 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 UniProt ID Q9CLP3의 아미노산 잔기 1 내지 268로 이루어진 PmultST3-유사 폴리펩티드, 엔. 메닌지티디스 유래 NmeniST3 (SEQ ID NO 56) 또는 피. 멀토시다 subsp. 멀토시다 str. Pm70 유래 PmultST2 (SEQ ID NO 57), 또는 (ii) 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 예컨대, 예를 들어, 포토박테리움 담셀라에 유래 PdST6 (UniProt ID O66375), 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID O66375의 아미노산 잔기 108 내지 497로 이루어진 PdST6-유사 폴리펩티드, 포토박테리움 sp. JT-ISH-224 유래 P-JT-ISH-224-ST6 (UniProt ID A8QYL1) 또는 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID A8QYL1의 아미노산 잔기 18 내지 514로 이루어진 P-JT-ISH-224-ST6-유사 폴리펩티드에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환된다. 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 폴리펩티드를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 14에 제공된 배양 조건에 따른 3-일 성장 실험에서 평가될 때 ManNAc, Neu5Ac 및 3'SL의 생산에 대해 평가된다. 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 폴리펩티드를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 14에 제공된 배양 조건에 따른 3-일 성장 실험에서 평가될 때 ManNAc, Neu5Ac 및 6'SL의 생산에 대해 평가된다.

실시예 16. LNT II, LNT 또는 LNnT의 생산에 대한 조작된 이. 콜라이 균주의 평가

야생형 이.콜라이 K-12 MG1655 균주는 이.콜라이 유전자 LacZ 및 nagB 의 게놈 녹아웃과 함께, SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1, 및 SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 lgtA에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 변형되었다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 14에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II의 생산에 대해 평가된다.

LNT 또는 LNnT 생산에 대한 다음 단계에서, LNT II 생산 이.콜라이 균주는 각각 이.콜라이 O55:H7 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 (wbgO) (UniProt ID D3QY14) 또는 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 (lgtB) (UniProt ID Q51116)에 대한 항상성 전사 유닛에 의해 추가로 변형된다. wbgO를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 14에 제공되는 배양 조건에 따라 2-일 성장 실험에서 평가될 때, LNT II 및 LNT의 생산에 대해 평가된다. lgtB를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 14에 제공된 배양 조건에 따라 3-일 성장 실험에서 평가될 때, LNT II 및 LNnT의 생산에 대해 평가된다.

실시예 17. LNT II, 시알릴화 LNT II, LNT, 3'SL 및 LSTa를 포함하는 올리고당 혼합물의 생산에 대한 조작된 이. 콜라이 균주의 평가

야생형 이.콜라이 K-12 MG1655 균주는 이.콜라이 유전자 nagA, nagB, lacY, lacZ, nanA, nanE 및 nanK 의 게놈 녹아웃과 함께, SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1, 이.콜라이 유래 glmM (UniProt ID P31120), 이.콜라이 유래 glmU (UniProt ID P0ACC7), 씨. 제주니 유래 neuC (UniProt ID AAK91727.1), 엔. 메닌지티디스 유래 neuB (UniProt ID E0NCD4), 이.콜라이 유래 락토스 퍼미아제 (lacY) (UniProt ID P02920), SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 lgtA 및 이.콜라이 O55:H7 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 wbgO (UniProt ID D3QY14)에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 변형된다. 다음 단계에서, 신규 균주는 피. 멀토시다 유래의 SEQ ID NO 55를 갖는 neuA 및 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래 PmultST3 (UniProt ID Q9CLP3), 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 UniProt ID Q9CLP3의 아미노산 잔기 1 내지 268로 이루어진 PmultST3-유사 폴리펩티드 또는 엔. 메닌지티디스 유래 NmeniST3 (SEQ ID NO 56)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 14에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II, 3'-시알릴화 LNT II (Neu5Ac-α2,3-GlcNAc-β1,3-Gal-β1,4-Glc), LNT, 3'SL 및 LSTa (Neu5Ac-α2,3-Gal-β1,3-GlcNAc-β1,3-Gal-β1,4-Glc)를 포함하는 올리고당 혼합물의 생산에 대해 평가된다.

실시예 18. LNT II, 시알릴화 LNT II, LNnT, 6'SL 및 LSTc를 포함하는 올리고당 혼합물의 생산에 대한 조작된 이. 콜라이 균주의 평가

야생형 이.콜라이 K-12 MG1655 균주는 이. 콜라이 유전자 nagA, nagB, lacY, lacZ, nanA, nanE 및 nanK 의 게놈 녹아웃과 함께, SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1, 이.콜라이 유래 glmM (UniProt ID P31120), 이.콜라이 유래 glmU (UniProt ID P0ACC7), 씨. 제주니 유래 neuC (UniProt ID AAK91727.1), 엔. 메닌지티디스 유래 neuB (UniProt ID E0NCD4), 이.콜라이 유래 락토스 퍼미아제 (lacY) (UniProt ID P02920), SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 lgtA 및 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 lgtB (UniProt ID Q51116)에 대한 항상성 전사 유닛의 게놈 녹-인 의해 변형된다. 다음 단계에서, 신규 균주는 SEQ ID NO 55를 갖는 피. 멀토시다 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (neuA) 및 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 예컨대, 예를 들어, 포토박테리움 담셀라에 유래 PdST6 (UniProt ID O66375), 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID O66375의 아미노산 잔기 108 내지 497로 이루어진 PdST6-유사 폴리펩티드, 포토박테리움 sp. JT-ISH-224 유래 P-JT-ISH-224-ST6 (UniProt ID A8QYL1) 또는 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는UniProt ID A8QYL1의 아미노산 잔기 18 내지 514로 이루어진 P-JT-ISH-224-ST6-유사 폴리펩티드에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 14에 제공되는 배양 조건에 따른 3-일 성장 실험에서 평가될 때 LNT II, 6'-시알릴화 LNT II (Neu5Ac-α2,6-[GlcNAc-β1,3]-Gal-β1,4-Glc), LNnT, 6'SL 및 LSTc (Neu5Ac-α2,6-Gal-β1,4-GlcNAc-β1,3-Gal-β1,4-Glc)를 포함하는 올리고당 혼합물의 생산에 대해 평가된다.

실시예 19. LNT II, 시알릴화 LNT II, LNnT, 3'SL 및 LSTd를 포함하는 올리고당 혼합물의 생산에 대해 조작된 이. 콜라이 균주의 평가

야생형 이.콜라이 K-12 MG1655 균주는 이. 콜라이 유전자 nagA, nagB, lacY, lacZ, nanA, nanE 및 nanK의 게놈 녹아웃과 함께, SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1, 이.콜라이 유래 glmM (UniProt ID P31120), 이.콜라이 유래 glmU (UniProt ID P0ACC7), 씨. 제주니 유래 neuC (UniProt ID AAK91727.1), 엔. 메닌지티디스 유래 neuB (UniProt ID E0NCD4), 이.콜라이 유래 락토스 퍼미아제 (lacY) (UniProt ID P02920), 엔. 메닌지티디스 유래의 SEQ ID NO 54를 갖는 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 lgtA 및 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 lgtB (UniProt ID Q51116)에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 변형된다. 다음 단계에서, 신규 균주는 SEQ ID NO 55를 갖는 피. 멀토시다 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (neuA) 및 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래 PmultST3 (UniProt ID Q9CLP3), 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 UniProt ID Q9CLP3의 아미노산 잔기 1 내지 268로 이루어진 PmultST3-유사 폴리펩티드 또는 엔. 메닌지티디스 유래 NmeniST3 (SEQ ID NO 56)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 14에 제공된 배양 조건에 따라 2-일 성장 실험에서 평가될 때 LNT II, 3'-시알릴화 LNT II (Neu5Ac-α2,3-GlcNAc-β1,3-Gal-β1,4-Glc), LNnT, 3'SL 및 LSTd (Neu5Ac-α2,3-Gal-β1,4-GlcNAc-β1,3-Gal-β1,4-Glc)를 포함하는 올리고당 혼합물의 생산에 대해 평가된다.

실시예 20. 재료 및 방법 바실러스 서브틸리스

배지

2개 배지, 즉 진탕 플라스크 배양을 위핸 풍부 LB (Luria Broth) 및 최소 배지가 비. 서브틸리스를 배양하는데 사용된다. LB 배지는 1% 트립톤 펩톤 (Difco), 0.5% 효모 추출물 (Difco) 및 0.5% 소듐 클로라이드 (VWR)로 이루어졌다. LBA (Luria Broth agar) 플레이트는 12 g/L 한천 (Difco)이 첨가된, LB 배지로 이루어졌다. 최소 배지는 2.00 g/L (NH₄)₂SO₄, 7.5 g/L KH₂PO₄, 17.5 g/L K₂HPO₄, 1.25 g/L Na-시트레이트, 0.25 g/L MgSO₄.7H₂O, 0.05 g/L 트립토판, 10 내지 30 g/L 글루코스 (또는 프룩토스, 말토스, 수크로스, 글리세롤 및 말토트리오스를 포함하지만, 이에 제한되지 않는 다른 탄소 공급원), 10 mL/L 미량 원소 믹스 및 10 mL/L Fe-시트레이트 용액을 함유하였다. 배지는 1 M KOH를 사용해 7.0의 pH로 설정되었다. 실험에 따라서 락토스가 전구체로 첨가된다. 미량 원소 믹스는 0.735 g/L CaCl₂.2H₂O, 0.1 g/L MnCl₂.2H₂O, 0.033 g/L CuCl₂.2H₂O, 0.06 g/L CoCl₂.6H₂O, 0.17 g/L ZnCl₂, 0.0311 g/L H₃BO₄, 0.4 g/L Na₂EDTA.2H₂O 및 0.06 g/L Na₂MoO₄ 로 이루어졌다. Fe-시트레이트 용액은 0.135 g/L FeCl₃.6H₂O, 1 g/L Na-시트레이트 (Hoch 1973 PMC1212887)를 함유하였다.

복합 배지, 예를 들어, LB는 오토클레이빙 (121℃, 21분) 및 최소 배지는 여과 (0.22 μm Sartorius)에 의해 멸균되었다. 필요한 경우, 배지는 항생제 (예를 들어, 제오신 (20mg/L))를 첨가하여 선택적으로 만들었다.

균주, 플라스미드 및 돌연변이

바실러스 서브틸리스 168은 바실러스 유전자 자원 센터 (Bacillus Genetic Stock Center) (Ohio, USA)에서 입수한 대로 사용된다.

Cre/lox를 통한 유전자 결실용 플라스미드는 Yan et al. (Appl & Environm microbial, Sept 2008, p5556-5562)가 기술한 대로 구축된다. 유전자 파괴는 Xue et al. (J. microb. Meth. 34 (1999) 183-191)에 기술된 바와 같이 선형 DNA를 사용한 상동성 재조합 및 전기천공을 통한 형질전환을 통해서 수행된다. 유전자 녹아웃 방법은 Liu et al. (Metab. Engine. 24 (2014) 61-69)에 의해 기술된다. 이 방법은 표적 유전자의 상류 및 하류 1000 bp 상동체를 사용한다.

Popp et al. (Sci. Rep., 2017, 7, 15158)가 기술한 바와 같은 통합 벡터가 발현 벡터로서 사용되고 필요하면 게놈 통합을 위해 추가로 사용될 수 있다. 발현에 적합한 프로모터는 part repository (iGem): 서열 id: BBa_K143012, BBa_K823000, BBa_K823002 또는 BBa_K823003로부터 유래될 수 있다. 클로닝은 깁슨 조립, 골든 게이트 조립, 클리바 조립, LCR 또는 제한 결찰을 사용해 수행될 수 있다.

시알산 (Neu5Ac) 생산을 위한 실시예에서, 조작된 균주는 비. 서브틸리스 nagA, nagB, glmS 및 gamA 유전자의 녹아웃 및 SEQ ID NO 39 내지 53을 포함하는 목록으로부터 선택되는 하나 이상의 변이체 GFA1 폴리펩티드 및/또는 SEQ ID NO 02 내지 38을 포함하는 목록으로부터 선택되는 GFA1 오솔로그, 포스포글루코사민 뮤타제 예컨대, 예를 들어, 이.콜라이 유래 glmM (UniProt ID P31120), N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제/글루코사민-1-포스페이트 아세틸트랜스퍼라제 예컨대, 예를 들어, 이.콜라이 유래 glmU (UniProt ID P0ACC7), UDP-N-아세틸글루코사민 2-에피머라제 예컨대, 예를 들어, 씨. 제주니 유래 neuC (UniProt ID AAK91727.1) 및 N-아세틸뉴라미네이트 신타제 예컨대, 예를 들어, 이.콜라이 유래 neuB (UniProt ID Q46675)를 함유하는 항상성 전사 유닛의 게놈 녹-인을 포함하는 비. 서브틸리스로부터 유래되었다.

시알릴화 올리고당 생산에 대한 실시예에서, 시알산 생산 균주는 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래의 SEQ ID NO 55를 갖는 neuA, 및 (i) 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래 PmultST3 (UniProt ID Q9CLP3), 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 UniProt ID Q9CLP3의 아미노산 잔기 1 내지 268로 이루어진 PmultST3-유사 폴리펩티드, 엔. 메닌지티디스 유래 NmeniST3 (SEQ ID NO 56) 또는 피. 멀토시다 subsp. 멀토시다 str. Pm70 유래 PmultST2 (SEQ ID NO 57), (ii) 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 예컨대, 예를 들어, 포토박테리움 담셀라에 유래 PdST6 (UniProt ID O66375), 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID O66375의 아미노산 잔기 108 내지 497로 이루어진 PdST6-유사 폴리펩티드, 포토박테리움 sp. JT-ISH-224 유래 알파-2,6-시알릴트랜스퍼라제 (UniProt ID A8QYL1) 또는 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID A8QYL1의 아미노산 잔기 18 내지 514로 이루어진 폴리펩티드, 및/또는 (iii) 예컨대, 예를 들어, 엠. 무스쿨루스 유래 알파-2,8-시알릴트랜스퍼라제 (UniProt ID Q64689)를 추가로 발현시킬 필요가 있다. N-아실뉴라미네이트 시티딜릴트랜스퍼라제 및 시알릴트랜스퍼라제의 항상성 전사 유닛은 게놈 녹-인을 통해서 또는 발현 플라스미드를 통해서 조작된 균주에 전달될 수 있다. 시알산 및 CMP-시알산을 생산하는 조작된 균주가 시알릴화 락토스 구조를 만들도록 의도되었으면, 균주는 락토스 퍼미아제 예컨대, 예를 들어, 이.콜라이 LacY (UniProt ID P02920)에 대한 항상성 전사 유닛의 게놈 녹-인으로 추가로 변형되었다.

LNT II 생산에 대한 실시예에서, 조작된 균주는 비. 서브틸리스 nagB, glmS 및 gamA 유전자의 녹아웃 및 SEQ ID NO 39 내지 53를 포함하는 목록으로부터 선택되는 하나 이상의 변이체 GFA1 폴리펩티드 및/또는 SEQ ID NO 02 내지 38를 포함하는 목록으로부터 선택되는 GFA1 오솔로그, 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 예컨대, 예를 들어, SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 lgtA 및 락토스 퍼미아제 예컨대, 예를 들어, 이.콜라이 유래 LacY (UniProt ID P02920)를 함유하는 항상성 전사 유닛의 게놈 녹-인을 포함하는 비. 서브틸리스로부터 유래되었다. LNT 또는 LNnT 생산 경우에, LNT II 생산 균주는 각각, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 예컨대, 예를 들어, 이.콜라이 O55:H7 유래 wbgO (UniProt ID D3QY14) 또는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtB (UniProt ID Q51116)에 대한 항상성 전사 유닛으로 추가로 형질전환되었다.

이종성 및 상동성 발현

플라스미드로부터 또는 게놈으로부터, 발현되는 것이 필요한 유전자는 하기 회사 중 하나에서 합성적으로 합성되었다; DNA2.0, Gen9, Twist Biosciences 또는 IDT.

발현은 발현 숙주의 코돈 용법에 대해 코돈 용법을 최적화하여 더 촉진시킬 수 있었다. 유전자는 공급사의 도구를 사용하여 최적화되었다.

배양 조건

96-웰 마이크로타이터 플레이트 실험의 전배양은 150 μL LB 중에서, 저온바이알 또는 LB 플레이트의 단일 콜로니로부터 출발하여서, 밤새 37℃에서, 800 rpm의 회전 진탕기에서 인큐베이션하였다. 이 배양은 400x로 희석하여 400 μL 최소 배지가 존재하는, 96-웰 사각 마이크로타이터 플레이트에 대한 접종원으로서 사용되었다. 각 균주는 생물학적 복제물로서 96-웰 플레이트의 다수 웰에서 성장되었다. 이들 최종 96-웰 배양 플레이트는 72시간, 또는 더 짧거나 또는 더 길게, 800 rpm의 회전 진탕기에 37℃에서 인큐베이션되었다. 배양 실험 종료 시에 실험 샘플을 각 웰로부터 채취하여서 상청액 농도 (세포를 5분 스핀 다운 후, 세포외 당 농도)를 측정하거나, 또는 세포 스핀 다운 전에 90℃에서 15분 또는 60℃에서 60분 동안 배양 액체배지를 끓여서 측정하였다 (본 명세서에 정의된 바와 같이, 전체 액채배지 농도, 세포내 및 세포외 당 농도).

또한, 배양을 희석하여 600 nm에서 광학 밀도를 측정하였다. 세포 성능 지수 또는 CPI는 기준 균주와 비교하여 상대 %로, 생물량으로 올리고당 농도를 나누어서 결정하였다. 생물량은 600 nm에서 측정된 광학 밀도의 대략 1/3인 것으로 경험적으로 결정된다.

광학 밀도, pH 및 분석적 분석

박테리아 배양의 광학 밀도 및 pH의 결정을 비롯한 분석적 분석은 실시예 1에 기술된 대로 수행되었다.

실시예 21. ManNAc 및 Neu5Ac 및 3'-시알릴락토스 (3'SL) 또는 6'-시알릴락토스 (6'SL)의 생산에 대한 조작된 비. 서브틸리스 균주의 평가

야생형 비. 서브틸리스 균주는 비. 서브틸리스 유전자 nagA, nagB, glmS 및 gamA 의 게놈 녹아웃과 함께, SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1, 이.콜라이 유래 glmM (UniProt ID P31120), 이.콜라이 유래 glmU (UniProt ID P0ACC7), 씨. 제주니 유래 neuC (UniProt ID AAK91727.1), 이.콜라이 유래 neuB (UniProt ID Q46675) 및 이.콜라이 유래 LacY (UniProt ID P02920)에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 먼저 변형된다. 다음 단계에서, 신규 균주는 SEQ ID NO 55를 갖는 피. 멀토시다 유래 neuA 및 (i) 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래 PmultST3 (UniProt ID Q9CLP3), 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 UniProt ID Q9CLP3의 아미노산 잔기 1 내지 268로 이루어진 PmultST3-유사 폴리펩티드 또는 엔. 메닌지티디스 유래 NmeniST3 (SEQ ID NO 56) 또는 (ii) 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 예컨대, 예를 들어, 포토박테리움 담셀라에 유래 PdST6 (UniProt ID O66375), 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID O66375의 아미노산 잔기 108 내지 497로 이루어진 PdST6-유사 폴리펩티드, 포토박테리움 sp. JT-ISH-224 유래 알파-2,6-시알릴트랜스퍼라제 (UniProt ID A8QYL1) 또는 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID A8QYL1의 아미노산 잔기 18 내지 514로 이루어진 폴리펩티드에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환된다. 신규 균주는 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 폴리펩티드를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용해 실시예 20에 제공된 배양 조건에 따라 3-일 성장 실험에서 평가될 때 ManNAc, Neu5Ac 및 3'SL의 생산에 대해 평가된다. 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 폴리펩티드를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 20에 제공된 배양 조건에 따라 3-일 성장 실험에서 평가될 때 ManNAc, Neu5Ac 및 6'SL의 생산에 대해 평가된다.

실시예 22. LNT II, LNT 또는 LNnT의 생산에 대한 조작된 비. 서브틸리스 균주의 평가

야생형 비. 서브틸리스 균주는 비. 서브틸리스 유전자 nagB, glmS 및 gamA의 게놈 녹아웃과 함께, SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1, 이.콜라이 유래 락토스 퍼미아제 LacY (UniProt ID P02920) 및 엔. 메닌지티디스 유래의 SEQ ID NO 54를 갖는 lgtA에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 먼저 변형된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 20에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II의 생산에 대해 평가된다.

LNT 또는 LNnT 생산에 대한 다음 단계에서, LNT II 생산 비. 서브틸리스 균주는 이.콜라이 O55:H7 유래 wbgO (UniProt ID D3QY14) 또는 엔. 메닌지티디스 유래 lgtB (UniProt ID Q51116)에 대한 항상성 전사 유닛에 의해 추가로 변형된다, 각각. wbgO를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 20에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II 및 LNT의 생산에 대해 평가된다. lgtB를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 20에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II 및 LNnT의 생산에 대해 평가된다.

실시예 23. LNT II, 시알릴화 LNT II, LNnT, 6'SL 및 LSTc를 포함하는 올리고당 혼합물의 생산에 대한 조작된 비. 서브틸리스 균주의 평가

실시예 22에 기술된 바와 같이 LNnT를 생산하는 조작된 비. 서브틸리스 균주는 피. 멀토시다 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (neuA) (SEQ ID NO 55) 및 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 예컨대, 예를 들어, 포토박테리움 담셀라에 유래 PdST6 (UniProt ID O66375), 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID O66375의 아미노산 잔기 108 내지 497로 이루어진 PdST6-유사 폴리펩티드, 포토박테리움 sp. JT-ISH-224 유래 P-JT-ISH-224-ST6 (UniProt ID A8QYL1) 또는 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID A8QYL1의 아미노산 잔기 18 내지 514로 이루어진 P-JT-ISH-224-ST6-유사 폴리펩티드에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 추가로 형질전환된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 20에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II, 6'-시알릴화 LNT II (Neu5Ac-α2,6-[GlcNAc-β1,3]-Gal-β1,4-Glc), LNnT, 6'SL 및 LSTc (Neu5Ac-α2,6-Gal-β1,4-GlcNAc-β1,3-Gal-β1,4-Glc)를 포함하는 올리고당 혼합물의 생산에 대해 평가된다.

실시예 24. 재료 및 방법 코리네박테리움 글루타미쿰

배지

2종의 상이한 배지, 즉 풍부 트립톤-효모 추출물 (TY) 배지 및 최소 배지가 씨. 글루타미쿰을 배양하는데 사용된다. TY 배지는 1.6% 트립톤 (Difco), 1% 효모 추출물 (Difco) 및 0.5% 소듐 클로라이드 (VWR)로 이루어졌다. TY 한천 (TYA) 플레이트는 12 g/L 한천 (Difco)이 첨가된, TY 배지로 이루어졌다. 진탕 플라스크 실험을 위한 최소 배지는 20 g/L (NH₄)₂SO₄, 5 g/L 우레아, 1 g/L KH₂PO₄, 1 g/L K₂HPO₄, 0.25 g/L MgSO₄.7H₂O, 42 g/L MOPS, 10 내지 30 g/L 글루코스 (또는 프룩토스, 말토스, 수크로스, 글리세롤 및 말토트리오스를 포함하지만, 이에 제한되지 않는 다른 탄소 공급원) 및 1 mL/L 미량 원소 믹스를 함유하였다. 실험에 따라서, 락토스가 전구체로서 첨가된다. 미량 원소 믹스는 10 g/L CaCl₂, 10 g/L FeSO₄.7H₂O, 10 g/L MnSO₄.H₂O, 1 g/L ZnSO₄.7H₂O, 0.2 g/L CuSO₄, 0.02 g/L NiCl₂.6H₂O, 0.2 g/L 바이오틴 (pH 7.0) 및 0.03 g/L 프로토카테츄산으로 이루어졌다.

복합 배지, 예를 들어, TY는 오토클레이빙 (121℃, 21분) 및 최소 배지는 여과 (0.22 μm Sartorius)를 통해 멸균되었다. 필요한 경우, 배지는 항생제 (예를 들어, 카나마이신, 암피실린)를 첨가하여 선택적으로 만들었다.

균주 및 돌연변이

코리네박테리움 글루타미쿰 ATCC 13032는 미국 생물자원 센터 (American Type Culture Collection)에서 입수한 대로 사용되었다.

Suzuki et al. (Appl. Microbiol. Biotechnol., 2005 Apr, 67(2):225-33)가 기술한 바와 같은 Cre/loxP 기술 기반 통합 플라스미드 벡터 및 Okibe et al. (J. Microbiol. Meth. 85, 2011, 155-163)가 기술한 바와 같은 온도-감수성 셔틀 벡터가 유전자 결실, 돌연변이 및 삽입을 위해 구축된다. (이종성) 유전자 발현을 의한 적합한 프로모터는 Yim et al. (Biotechnol. Bioeng., 2013 Nov, 110(11):2959-69)로부터 유래될 수 있다. 클로닝은 깁슨 조립, 골든 게이트 조립, 클리바 조립, LCR 또는 제한 결찰을 사용해 수행될 수 있다.

Neu5Ac 생산 경우, 조작된 균주는 씨. 글루타미쿰 ldh, cgl2645, nagB, glmS 및 nanA 유전자의 녹아웃 및 SEQ ID NO 39 내지 53을 포함하는 목록으로부터 선택되는 하나 이상의 변이체 GFA1 폴리펩티드 및/또는 SEQ ID NO 02 내지 38을 포함하는 목록으로부터 선택되는 GFA1 오솔로그, 포스포글루코사민 뮤타제 예컨대, 예를 들어, 이.콜라이 유래 glmM (UniProt ID P31120), N-아세틸글루코사민-1-포스페이트 우리딜트랜스퍼라제/글루코사민-1-포스페이트 아세틸트랜스퍼라제 예컨대, 예를 들어, 이.콜라이 유래 glmU (UniProt ID P0ACC7), UDP-N-아세틸글루코사민 2-에피머라제 예컨대, 예를 들어, 씨. 제주니 유래 neuC (UniProt ID AAK91727.1) 및 N-아세틸뉴라미네이트 신타제 예컨대, 예를 들어, 이.콜라이 유래 neuB (UniProt ID Q46675)를 함유하는 항상성 전사 유닛의 게놈 녹-인을 포함하는 씨. 글루타미쿰으로부터 유래되었다.

시알릴화 올리고당 생산에 대한 실시예에서, 시알산 생산 균주는 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래의 SEQ ID NO 55를 갖는 neuA, 및 (i) 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래 PmultST3 (UniProt ID Q9CLP3), 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 UniProt ID Q9CLP3의 아미노산 잔기 1 내지 268로 이루어진 PmultST3-유사 폴리펩티드, 엔. 메닌지티디스 유래 NmeniST3 (SEQ ID NO 56) 또는 피. 멀토시다 subsp. 멀토시다 str. Pm70 유래 PmultST2 (SEQ ID NO 57), (ii) 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 예컨대, 예를 들어, 포토박테리움 담셀라에 유래 PdST6 (UniProt ID O66375), 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID O66375의 아미노산 잔기 108 내지 497로 이루어진 PdST6-유사 폴리펩티드, 포토박테리움 sp. JT-ISH-224 유래 알파-2,6-시알릴트랜스퍼라제 (UniProt ID A8QYL1) 또는 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID A8QYL1의 아미노산 잔기 18 내지 514로 이루어진 폴리펩티드, 및/또는 (iii) 예컨대, 예를 들어, 엠. 무스쿨루스 유래 알파-2,8-시알릴트랜스퍼라제 (UniProt ID Q64689)를 추가로 발현할 필요가 있다. N-아실뉴라미네이트 시티딜릴트랜스퍼라제 및 시알릴트랜스퍼라제의 항상성 전사 유닛은 게놈 녹-인을 통해서 또는 발현 플라스미드를 통해서 조작된 균주에 전달될 수 있다. 시알산 및 CMP-시알산을 생산하는 조작된 균주가 시알릴화 락토스 구조를 만들도록 의도된 경우, 균주는 락토스 퍼미아제 예컨대, 예를 들어, 이.콜라이 LacY (UniProt ID P02920)에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 추가로 변형되었다.

LNT II 생산에 대한 실시예에서, 조작된 균주는 씨. 글루타미쿰 ldh, cgl2645, nagB 및 glmS 유전자의 녹아웃 및 SEQ ID NO 39 내지 53을 포함하는 목록으로부터 선택되는 하나 이상의 변이체 GFA1 폴리펩티드 및/또는 SEQ ID NO 02 내지 38을 포함하는 목록으로부터 선택되는 GFA1 오솔로그, 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 예컨대, 예를 들어, SEQ ID NO 54를 갖는 엔. 메닌지티디스 유래 lgtA 및 락토스 퍼미아제 예컨대, 예를 들어, 이.콜라이 유래 LacY (UniProt ID P02920)를 함유하는 항상성 전사 유닛의 게놈 녹-인을 포함하는 씨. 글루타미쿰으로부터 유래된다. LNT 또는 LNnT 생산에 대한 실시예에서, LNT II 생산 균주는 각각, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 예컨대, 예를 들어, 이.콜라이 O55:H7 유래 wbgO (UniProt ID D3QY14) 또는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtB (UniProt ID Q51116)에 대한 항상성 전사 유닛으로 추가로 형질전환되었다.

이종성 및 상동성 발현

플라스미드로부터 또는 게놈으로부터, 발현되는 것이 필요한 유전자는 하기 회사 중 하나에서 합성적으로 합성되었다: DNA2.0, Gen9, Twist Biosciences 또는 IDT.

발현은 발현 숙주의 코돈 용법에 대해서 코돈 용법을 최적화하여 추가로 촉진시킬 수 있었다. 유전자는 공급사의 도구를 사용해 최적화되었다.

배양 조건

96-웰 마이크로타이터 플레이트 실험의 전배양은 150 μL TY 중에, TY 플레이트의 단일 콜로니 또는 저온 바이알로부터 출발하였고, 800 rpm의 회전 진탕기에서 밤새 37℃에서 인큐베이션되었다. 이 배양은 400x로 희석하여, 400 μL 최소 배지의 96-웰 사각 마이크로타이터 플레이트에 대한 접종원으로서 사용되었다. 각각의 균주는 생물학적 복제물로서 96-웰 플레이트의 다수 웰에서 성장되었다. 이들 최종 96-웰 배양 플레이트는 72시간, 또는 더 짧거나 또는 더 긴 동안 800 rpm의 회전 진탕기에 37℃에서 인큐베이션되었다. 배양 종료 시 실험 샘플을 각 웰로부터 채취하여서 상청액 농도 (5분 세포 스핀 다운 후 세포외 당 농도)를 측정하거나, 또는 세포 스핀다운 전에 15분 동안 60℃에서 배양 액체배지를 끓여서 측정하였다 (= 본 명세서에 정의된 바와 같이, 전체 액체배지 농도, 세포내 및 세포외 당 농도).

또한, 배양의 희석을 수행하여 600 nm에서 광학 밀도를 측정하였다. 세포 성능 지수 또는 CPI는 기준 균주와 비교하여 상대%로서, 생물량으로 전체 액체 배지 중에서 측정된, 올리고당 농도, 예를 들어, 시알릴락토스 농도를 나누어서 결정되었다. 생물량은 600 nm에서 측정된 광학 밀도의 대략 1/3인 것으로 경험적으로 결정된다.

광학 밀도, pH 및 분석적 분석

실시예 25. ManNAc 및 Neu5Ac 및 3'-시알릴락토스 (3'SL) 또는 6'-시알릴락토스 (6'SL)의 생산에 대한 조작된 씨. 글루타미쿰 균주의 평가

야생형 씨. 글루타미쿰 균주는 씨. 글루타미쿰 유전자 ldh, cgl2645, nagB, glmS 및 nanA의 게놈 녹아웃과 함께, SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1, 이.콜라이 유래 glmM (UniProt ID P31120), 이.콜라이 유래 glmU (UniProt ID P0ACC7), 씨. 제주니 유래 neuC (UniProt ID AAK91727.1), 이.콜라이 유래 neuB (UniProt ID Q46675) 및 이.콜라이 유래 LacY (UniProt ID P02920)에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 먼저 변형된다. 다음 단계에서, 신규 균주는 SEQ ID NO 55를 갖는 피. 멀토시다 유래 neuA 및 (i) 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래 PmultST3 (UniProt ID Q9CLP3), 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 UniProt ID Q9CLP3의 아미노산 잔기 1 내지 268로 이루어진 PmultST3-유사 폴리펩티드 또는 엔. 메닌지티디스 유래 NmeniST3 (SEQ ID NO 56) 또는 (ii) 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 예컨대, 예를 들어, 포토박테리움 담셀라에 유래 PdST6 (UniProt ID O66375), 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID O66375의 아미노산 잔기 108 내지 497로 이루어진 PdST6-유사 폴리펩티드, 포토박테리움 sp. JT-ISH-224 유래 알파-2,6-시알릴트랜스퍼라제 (UniProt ID A8QYL1) 또는 베타-갈락토시드 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 UniProt ID A8QYL1의 아미노산 잔기 18 내지 514로 이루어진 폴리펩티드에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드로 형질전환된다. 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 폴리펩티드를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 24에서 제공하는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 ManNAc, Neu5Ac 및 3'SL의 생산에 대해 평가된다. 알파-2,6-시알릴트랜스퍼라제 활성을 갖는 폴리펩티드를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 24에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 ManNAc, Neu5Ac 및 6'SL의 생산에 대해 평가된다.

실시예 26. LNT II, LNT 또는 LNnT의 생산에 대한 조작된 씨. 글루타미쿰 균주의 평가

야생형 씨. 글루타미쿰 균주는 씨. 글루타미쿰 유전자 ldh, cgl2645, nagB 및 glmS의 게놈 녹아웃과 함께, SEQ ID NO 02 내지 38로부터 선택되는 GFA1 오솔로그 및/또는 SEQ ID NO 39 내지 53으로부터 선택되는 변이체 GFA1, 이.콜라이 유래 락토스 퍼미아제 LacY (UniProt ID P02920) 및 엔. 메닌지티디스 유래의 SEQ ID NO 54를 갖는 lgtA에 대한 항상성 전사 유닛의 게놈 녹-인에 의해 먼저 변형된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 23에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II의 성장에 대해 평가된다.

LNT 또는 LNnT 생산에 대한 다음 단계에서, LNT II 생산 씨. 글루타미쿰 균주는 이.콜라이 O55:H7 유래 wbgO (UniProt ID D3QY14) 또는 엔. 메닌지티디스 유래 lgtB (UniProt ID Q51116)에 대한 항상성 전사 유닛에 의해 추가로 변형된다, 각각. wbgO를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 24에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II 및 LNT의 생산에 대해 평가된다. lgtB를 발현하는 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 24에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II 및 LNnT의 생산에 대해 평가된다.

실시예 27. LNT II, 시알릴화 LNT II, LNT, 3'SL 및 LSTa를 포함하는 올리고당 혼합물의 생산에 대한 조작된 씨. 글루타미굼 균주의 평가

실시예 26에 기술된 바와 같이 LNT를 생산하는 조작된 씨. 글루타미쿰 균주는 피. 멀토시다 유래 neuA (SEQ ID NO 55) 및 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 예컨대, 예를 들어, 피. 멀토시다 유래 PmultST3 (UniProt ID Q9CLP3), 베타-갈락토시드 알파-2,3-시알릴트랜스퍼라제 활성을 갖는 UniProt ID Q9CLP3의 아미노산 잔기 1 내지 268로 이루어지는 PmultST3-유사 폴리펩티드 또는 엔. 메닌지티디스 유래 NmeniST3 (SEQ ID NO 56)에 대한 항상성 전사 유닛을 포함하는 발현 플라스미드에 의해 추가로 형질전환된다. 신규 균주는 락토스를 포함하는 적절한 선택 배지를 사용하여 실시예 24에 제공되는 배양 조건에 따라 3-일 성장 실험에서 평가될 때 LNT II, 3'-시알릴화 LNT II (Neu5Ac-α2,3-GlcNAc-β1,3-Gal-β1,4-Glc), LNT, 3'SL 및 LSTa (Neu5Ac-α2,3-Gal-β1,3-GlcNAc-β1,3-Gal-β1,4-Glc)를 포함하는 올리고당 혼합물의 생산에 대해 평가된다.

실시예 28. 재료 및 방법 클라미도모나스 레이하르드티 (Chlamydomonas reinhardtii)

배지

씨. 레인하르드티 (C. reinhardtii) 세포는 Tris-아세테이트-포스페이트 (TAP) 배지 (pH 7.0)에서 배양되었다. TAP 배지는 1000x 스톡의 Hutner 미량 원소 믹스를 사용한다. Hutner 미량 원소 믹스는 50 g/L Na₂EDTA.H₂O (Titriplex III), 22 g/L ZnSO₄.7H₂O, 11.4 g/L H₃BO₃, 5 g/L MnCl₂.4H₂O, 5 g/L FeSO₄.7H₂O, 1.6 g/L CoCl₂.6H₂O, 1.6 g/L CuSO₄.5H₂O 및 1.1 g/L (NH₄)₆MoO₃으로 이루어졌다.

TAP 배지는 2.42 g/L Tris (트리스(히드록시메틸)아미노메탄), 25 mg/L 염스톡 용액, 0.108 g/L K₂HPO₄, 0.054 g/L KH₂PO₄ 및 1.0 mL/L 빙초산을 함유하였다. 염 스톡 용액은 15 g/L NH₄Cl, 4 g/L MgSO₄.7H₂O 및 2 g/L CaCl₂.2H₂O로 이루어졌다. 당류 합성을 위한 전구체로서, 전구체 예컨대, 예를 들어, 갈락토스, 글루코스, 프룩토스, 푸코스, GlcNAc가 첨가될 수 있다. 오토클레이빙 (121℃, 21분)으로 멸균되었다. 한천 상의 스톡 배양을 위해서, 1% 한천 (정제된 고강도, 1000 g/㎠)을 함유하는 슬랜트 TAP 배지를 사용하였다.

균주, 플라스미드 및 돌연변이

씨. 레인하르드티 야생형 균주 21gr (CC-1690, 야생형, mt+), 6145C (CC-1691, 야생형, mt-), CC-125 (137c, 야생형, mt+), CC-124 (137c, 야생형, mt-)는 클라미도모나스 자원 센터 (Chlamydomonas Resource Center (https://www.chlamycollection.org), University of Minnesota, U.S.A.)에서 입수한 바와 같다.

발현 플라스미드는 클라미도모나스 자원 센터에서 입수한 대로, pSI103으로부터 기원한 것이다. 클로닝은 깁슨 조립, 골든 게이트 조립, 클리바 조립, LCR, 또는 제한 결찰을 사용해 수행되었다. (이종성) 유전자 발현에 적합한 프로모터는 예를 들어, Scranton et al. (Algal Res. 2016, 15: 135-142)로부터 유래되었다. 표적화된 유전자 변형 (예컨대 유전자 녹-아웃 또는 유전자 치환)은 예를 들어, Jiang et al. (Eukaryotic Cell 2014, 13(11): 1465-1469)이 기술한 바와 같이 Crispr-Cas 기술을 사용해 수행될 수 있다.

전기천공을 통한 형질전환은 Wang et al. (Biosci. Rep. 2019, 39: BSR2018210)이 기술한 대로 수행되었다. 세포는 세포 밀도가 1.0-2.0 Х 10⁷ 세포/mL에 도달할 때까지 8000 Lx의 빛 강도의 연속적인 빛 및 일정한 통기 하에 액체 TAP 배지에서 성장되었다. 다음으로, 세포는 1.0 Х 10⁶ 세포/mL의 농도로 신선한 액체 TAP 배지에 접종되었고, 세포 밀도가 4.0 Х 10⁶ 세포/mL에 도달할 때까지 18-20시간 동안 연속적인 빛 아래서 성장되었다. 다음으로, 세포는 실온에서 5분 동안 1250 g의 원심분리를 통해 수집되었고, 세척하고, 60 mM 솔비톨 (Sigma, U.S.A.)을 함유하는 사전 냉각된 액체 TAP 배지에 재현탁시키고, 10분 동안 얼음에 두었다. 다음으로, 250 μL의 세포 현탁물 (5.0 Х 10⁷ 세포에 상응)은 100 ng 플라스미드 DNA (400 ng/mL)가 존재하는 사전 냉각된 0.4 cm 전기천공 큐벳에 넣었다. 전기 천공은 BTX ECM830 전기영동 장치 (1575 Ω, 50 μFD)를 사용하여 4 ms의 펄스 길이 및 100 ms의 펄스 간격 시간을 갖고 각각 500 V의 6회 펄스로 수행되었다. 전기천공 후에, 큐벳을 즉시 얼음에 10분 두었다. 마지막으로, 세포 현탁액은 서서히 진탕하면서 희미한 빛에서 밤샘 회수를 위해서 60 mM 솔비톨이 존재하는 10 mL의 신선한 액체 TAP 배지를 함유하는 50 mL 코니칼 원심분리 튜브로 옮겼다. 밤샘 회수 이후에, 세포를 재수집하였고 암피실린 (100 mg/L) 또는 클로람페니콜 (100 mg/L)를 함유하는 선택적 1.5% (w/v) 한천-TAP 플레이트 상에서 전분 포매 방법으로 도말하였다. 다음으로, 플레이트는 8000 Lx의 빛 강도로 연속 조사 하에 23 +-0.5℃에서 인큐베이션되었다. 세포는 5-7일 이후에 분석되었다.

UDP-갈락토스 생산의 실시예에서, 씨. 레인하르드티 세포는 아라비돕시스 탈리아나 (Arabidopsis thaliana) 유래 갈락토키나제를 코딩하는 유전자 (KIN, UniProt ID Q9SEE5) 및 에이. 탈리아나 유래 UDP-당 파이로포스포릴라제 (USP)를 코딩하는 유전자 (UniProt ID Q9C5I1)를 포함하는 전사 유닛에 의해 변형된다.

UDP-GlcNAc의 증강된 생산에 대한 실시예에서, 씨. 레인하르드티 세포는 SEQ ID NO 39 내지 53를 포함하는 목록으로부터 선택되는 변이체 GFA1 폴리펩티드 및/또는 SEQ ID NO 02 내지 38을 포함하는 목록으로부터 선택되는 GFA1 오솔로그를 코딩하는 유전자를 포함하는 전사 유닛에 의해 변형된다.

LNT II 생산에 대한 실시예에서, 씨. 레인하르드티 세포는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtA (UniProt ID Q9JXQ6)를 포함하는 항상성 전사 유닛에 의해 변형된다. LNT 생산에 대한 실시예에서, LNT II 생산 균주는 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 예컨대, 예를 들어, 이.콜라이 O55:H7 유래 (UniProt ID D3QY14)를 포함하는 항상성 전사 유닛에 의해 추가로 변형된다. LNnT 생산에 대한 실시예에서, LNT II 생산 균주는 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 예컨대, 예를 들어, 엔. 메닌지티디스 유래 lgtB (UniProt ID Q51116)를 포함하는 항상성 전사 유닛에 의해 추가로 변형된다.

CMP-시알산 합성에 대한 실시예에서, 씨. 레인하르드티 세포는 UDP-N-아세틸글루코사민-2-에피머라제/N-아세틸만노사민 키나제 예컨대, 예를 들어, 호모 사피엔스 (Homo sapiens) 유래 GNE (UniProt ID Q9Y223) 또는 R263L 돌연변이를 포함하는 인간 GNE 폴리펩티드의 돌연변이체 형태, N-아실뉴라미네이트-9-포스페이트 신써타제 예컨대, 예를 들어, 호모 사피엔스 유래 NANS (UniProt ID Q9NR45) 및 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 예컨대, 예를 들어, 호모 사피엔스 유래 CMAS (UniProt ID Q8NFW8)에 대한 항상성 전사 유닛에 의해 변형된다. 시알릴화 올리고당의 생산에 대한 실시예에서, 씨. 레인하르드티 세포는 CMP-시알산 수송체 예컨대, 예를 들어, 무스 무스쿨루스 유래 CST (UniProt ID Q61420), 및 예컨대, 예를 들어, 호모 사피엔스, 무스 무스쿨루스, 라투스 노르베지쿠스 (Rattus norvegicus)같은 종으로부터 선택되는 골지체-국재화된 시알릴트랜스퍼라제에 의해 변형된다.

이종성 및 상동성 발현

플라스미드로부터, 또는 게놈으로부터 발현이 필요한 유전자는 하기 히사 중 하나에서 합성적으로 합성되었다: DNA2.0, Gen9, Twist Biosciences 또는 IDT.

발현은 발현 숙주의 코돈 용법에 대해 코돈 용법을 최적화하여 추가로 촉진될 수 있었다. 유전자는 공급사의 도구를 사용해 최적화되었다.

배양 조건

씨. 레인하르드티의 세포는 8000 Lx의 빛 강도로 14/10시간 명암 주기 하에 23 +/- 0.5℃에서 선택적 TAP-한천 플레이트에서 배양되었다. 세포는 5 내지 7일 배양 후에 분석되었다.

고밀도 배양을 위해서, 세포는 밀폐 시스템 예컨대, 예를 들어, Chen et al. (Bioresour. Technol. 2011, 102: 71-81) 및 Johnson et al. (Biotechnol. Prog. 2018, 34: 811-827)에 기술된 바와 같이 수직 또는 수평 광생물반응기, 교반식 탱크 광생물반응기 또는 편평 패널 광생물반응기에서 배양될 수 있다.

실시예 29. 변형된 씨. 레인하르드티 세포에서 LNT II, 시알릴화 LNT II, LNnT, 6'SL 및 LSTc를 포함하는 올리고당 혼합물의 생산

씨. 레인하르드티 세포는 에이. 탈리아나 유래 갈락토키나제 (KIN, UniProt ID Q9SEE5) 및 에이. 탈리아나 유래 UDP-당 파이로포스포릴라제 (USP) (UniProt ID Q9C5I1)를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해서 UDP-Gal의 생산을 위해 실시예 28에 기술된 바와 같이 조작된다. 다음 단계에서, 조작된 세포는 SEQ ID NO 39 내지 53을 포함하는 목록으로부터 선택되는 변이체 GFA1 폴리펩티드 및/또는 SEQ ID NO 02 내지 38을 포함하는 목록으로부터 선택되는 GFA1 오솔로그, R263L 돌연변이가 천연 폴리펩티드와 상이한 호모 사피엔스 유래 UDP-N-아세틸글루코사민-2-에피머라제/N-아세틸만노사민 키나제 GNE의 돌연변이체 형태 (UniProt ID Q9Y223), 호모 사피엔스 유래 N-아실뉴라미네이트-9-포스페이트 신써타제 NANS (UniProt ID Q9NR45), 호모 사피엔스 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 CMAS (UniProt ID Q8NFW8) 및 무스 무스쿨루스 유래 CMP-시알산 수송체 CST (UniProt ID Q61420)를 포함하는 항상성 전사 유닛의 게놈 녹-인에 의해서 CMP-시알산 합성을 위해 변형된다. 마지막 단계에서, 조작된 세포는 라투스 노르베지쿠스 유래 알파-2,6-시알릴트랜스퍼라제 (UniProt ID P13721), 포토박테리움 담셀라에 유래 알파-2,6-시알릴트랜스퍼라제 PdST6 (UniProt ID O66375), 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 lgtA (UniProt ID Q9JXQ6) 및 엔. 메닌지티디스 유래 N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제 lgtB (UniProt ID Q51116)를 포함하는 항상성 전사 유닛을 포함하는 발현 플라스미드에 의해 변형된다. 신규 균주는 실시예 28에 제공된 배양 조건에 따라서 전구체로서 갈락토스, 글루코스 및 GlcNAc를 포함하는 TAP-한천 플레이트 상에서 배양 실험에서 LNT II, 6'-시알릴화 LNT II (Neu5Ac-α2,6-[GlcNAc-β1,3]-Gal-β1,4-Glc), LNnT, 6'SL 및 LSTc (Neu5Ac-α2,6-Gal-β1,4-GlcNAc-β1,3-Gal-β1,4-Glc)를 포함하는 올리고당 혼합물의 생산에 대해 평가된다. 인큐베이션 5일 후에, 세포를 수확하였고, 당류 생산을 UPLC에서 분석한다.

실시예 30. 재료 및 방법 동물 세포

상이한 포유동물의 지방 조직으로부터 중간엽 줄기 세포의 단리

신선한 지방 조직은 도살장 (예를 들어, 소, 돼지, 양, 닭, 오리, 메기, 뱀, 개구리) 또는 지방 흡입술 (예를 들어, 인간 경우, 사전 동의 후)로부터 수득되어서, 항생제가 보충된 포스페이트 완충 염수에 유지된다. 지방 조직의 효소 분해를 수행하고 중간엽 줄기 세포를 단리하기 위해 원심분리한다. 단리된 중간엽 줄기 세포를 세포 배양 플라스크로 옮겼고, 표준 성장 조건, 예컨대 37℃, 5% CO2 하에서 성장시킨다. 초기 배양 배지는 DMEM-F12, RPMI, 및 알파-MEM 배지 (15% 태아 소 혈청 보충), 및 1% 항생제를 포함한다. 배양 배지는 후속하여 제1 계대 이후에 10% FBS (태아 소 혈청)-보충된 배지로 대체된다. 예를 들어, 모든 목적을 위해 그 전문이 참조로 본 명세서에 편입되는, Ahmad 및 Shakoori (2013, Stem Cell Regen. Med. 9(2): 29-36)는 이 실시예에서 본 명세서에 기술된 방버(들)의 일정 별형(들)을 기술한다.

모유로부터 중간엽 줄기 세포의 단리

이 실시예는 본 명세서에 기술된 바와 같이, 인간 또는 임의의 다른 포유동물(들)로부터 무균 조건 하에서 수집된 모유로부터 중간엽 줄기 세포의 단리를 예시한다. 동일 부피의 포스페이트 완충 염수를 희석된 모유에 첨가하고 나서, 20분 동안 원심분리한다. 세포 펠렛을 포스페이트 완충 염수로 3회 세척하고 세포는 표준 배양 조건 하에서 10% 태아 소 혈청 및 1% 항생제가 보충된 DMEM-F12, RPMI, 및 알파-MEM 배지의 세포 배양 플라스크에 파종한다. 예를 들어, 모든 목적을 위해 그 전문이 참조로 본 명세서에 편입되는 Hassiotou et al. (2012, Stem Cell. 30(10): 2164-2174)은 이 실시예에서 본 명세서에 기술된 방법(들)의 일정 별형(들)을 기술한다.

2D 및 3D 배양 시스템을 사용한 줄기 세포의 분화

단리된 중간엽 세포는 2D 및 3D 배양 시스템에서 유선-유사 상피 및 내강 세포로 분화될 수 있다. 예를 들어, 하기 문헌들을 참조하고 이들 각각은 모든 목적을 위해 그들 전문이 참조로 본 명세서에 편입된다: Huynh et al. 1991. Exp Cell Res. 197(2): 191 -199; Gibson et al. 1991, In Vitro Cell Dev Biol Anim. 27(7): 585-594; Blatchford et al. 1999; Animal Cell Technology': Basic & Applied Aspects, Springer, Dordrecht. 141-145; Williams et al. 2009, Breast Cancer Res 11(3): 26-43; 및 Arevalo et al. 2015, Am J Physiol Cell Physiol. 310(5): C348 - C356.

2D 배양 경우, 단리된 세포는 10 ng/mL 상피 성장 인자 및 5 pg/mL 인슐린이 보충된 성장 배지의 배양 플레이트에 초기에 파종되었다. 합류점에서, 세포는 2% 태아 소 혈청, 1% 페니실린-스트렙토마이신 (100 U/mL 페니실린, 100 ug/mL 스트렙토마이신), 및 5 pg/mL 인슐린이 보충된 성장 배지를 48시간 동안 공급받았다. 분화를 유도하기 위해서, 세포는 5 pg/mL 인슐린, 1 pg/mL 히드로코르티손, 0.65 ng/mL 트리아이오도티로닌, 100 nM 덱사메타손, 및 1 pg/mL 프로락틴을 함유하는 완전 성장 배지를 공급받았다. 24시간 후에, 혈청을 완전 유도 배지에서 제거한다.

3D 배양을 위해서, 단리된 세포는 트립신 처리되어, 마트리겔, 히알루론산, 또는 초-저 부착 표면 배양 플레이트에서 6일 동안 배양되었고 10 ng/mL 상피 성장 인자 및 5 pg/mL 인슐린이 보충된 성장 배지를 첨가하여 분화 및 락테이트를 유도하였다. 합류점에서, 세포는 2% 태아 소 혈청, 1% 페니실린-스트렙토마이신 (100 U/mL 페니실린, 100 ug/mL 스트렙토마이신), 및 5 pg/mL 인슐린이 보충된 성장 배지를 48시간 동안 공급받았다. 분화를 유도하기 위해서, 세포는 5 pg/mL 인슐린, 1 pg/mL 히드로코르티손, 0.65 ng/mL 트리아이오도티로닌, 100 nM 덱사메타손, 및 1 pg/mL 프로락틴을 함유하는 완전 성장 배지를 공급받았다. 24시간 후에, 혈청을 완전 유도 배지에서 제거한다.

유선-유사 세포의 제조 방법

포유동물 세포는 Oct4, Sox2, Klf4, 및 c-Myc를 코딩하는 바이러스 벡터에 의한 재프로그래밍을 통해서 유도 만능성이 된다. 최종 재프로그래밍된 세포는 Mammocult 배지 (Stem Cell Technologies에서 입수), 또는 유선 세포 농후화 배지 (DMEM, 3% FBS, 에스트로겐, 프로게스테론, 헤파린, 히드로코르티손, 인슐린, EGF)에서 배양되어서 그들을 유선-유사로 만들고, 이로부터 선택된 모유 성분의 발현을 유도할 수 있다. 대안적으로, 리모델링 시스템 예컨대, CRISPR/Cas9을 사용하여 후생적 리모델링을 수행하여서, 선택된 관심 유전자, 예컨대, 카세인, a-락트알부민을 항상적으로 활성화시켜서, 그들 개별 단백질의 발현을 허용하고/하거나, 모든 목적을 위해 그 전문이 참조로 본 명세서에 편입되는 예를 들어, WO21067641에 기술된 바와 같이 선택된 내생성 유전자를 하향조절 및/또는 녹-아웃시킬 수 있다.

배양

완전 성장 배지는 고 글루코스 DMEM/F12, 10% FBS, 1% NEAA, 1% pen/strep, 1% ITS-X, 1% F-Glu, 10 ng/mL EGF, 및 5 pg/mL 히드로코르티손을 포함한다. 완전 수유 배지는 고 글루코스 DMEM/F12, 1% NEAA, 1% pen/strep, 1% ITS-X, 1% F-Glu, 10 ng/mL EGF, 5 pg/mL 히드로코르티손, 및 1 pg/mL 프로락틴 (Hyunh 1991에서 5ug/mL)을 포함한다. 세포는 완전 성장 배지가 있는 콜라겐 코팅된 플라스크 상에 20,000 세포/㎠의 밀도로 파종되고, 완전 성장 배지에서 48시간 동안 부착 및 확장되도록 정치시키고, 그 이후에 배지를 완전 수유 배지로 바꿔준다. 수유 배지에 노출 후, 세포는 분화를 시작하고 성장을 멈춘다. 약 1주 이내에, 세포는 우유 지질, 락토스, 카세인 및 유장같은 수유 생산물(들)을 배지로 분비하기 시작한다. 수유 배지의 원하는 농도는 한외여과에 의한 희석 또는 농축으로 획득될 수 있다. 수유 배지의 원하는 염 균형은 예를 들어, 배지로부터 원치않는 대사 산물을 제거하기 위해, 투석을 통해 달성될 수 있다. 사용된 호르몬 및 다른 성장 인자는 수지 정제에 의해서, 예를 들어, His-태그화된 성장 인자를 제거하기 위한 니켈 수지의 사용을 통해서 선택적으로 추출되어서, 락테이트화된 생산물 중 오염물의 수준을 추가로 감소시킬 수 있다.

실시예 31. 비-유선 성체 줄기 세포에서 시알릴화 올리고당을 포함하는 올리고당 혼합물의 생산

실시예 30에 기술된 바와 같이 유선-유사 세포로 재프로그래밍된 단리된 중간엽 세포는 SEQ ID NO 39 내지 53을 포함하는 목록으로부터 선택되는 변이체 GFA1 폴리펩티드 및/또는 SEQ ID NO 02 내지 38을 포함하는 목록으로부터 선택되는 GFA1 오솔로그, 호모 사피엔스 유래 GlcN6P 신타제 (UniProt ID Q06210), 호모 사피엔스 유래 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제 (UniProt ID Q96EK6), 호모 사피엔스 유래 포스포아세틸글루코사민 뮤타제 (UniProt ID O95394), UDP-N-아세틸헥소사민 파이로포스포릴라제 (UniProt ID Q16222), 엔. 메닌지티디스 유래 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 LgtA (UniProt ID Q9JXQ6), 이.콜라이 O55:H7 유래 N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제 WbgO (UniProt ID D3QY14), 무스 무스쿨루스 유래 N-아실뉴라미네이트 시티딜릴트랜스퍼라제 (UniProt ID Q99KK2), 호모 사피엔스 유래 CMP-N-아세틸뉴라미네이트-베타-1,4-갈락토시드 알파-2,3-시알릴트랜스퍼라제 ST3GAL3 (UniProt ID Q11203) 및 라투스 노르베지쿠스 유래 알파-2,6-시알릴트랜스퍼라제 (UniProt ID P13721)를 발현하도록 변형된다. 세포는 완전 성장 배지의 콜라겐 코팅된 플라스크에 20,000 세포/㎠의 밀도로 파종되고 완전 성장 배지에서 48시간 동안 부착 및 확장되도록 정치시켰고, 그 이후에 배지를 약 7일 동안 완전 수유 배지로 바꿔준다. 실시예 30에 기술된 바와 같이 배양 후에, 세포에 대해서 LNT, 3'SL, 6'SL, 시알릴화 LNT II 및 LSTa를 포함하는 올리고당 혼합물의 생산을 분석하기 위해 UPLC를 수행한다.

SEQUENCE LISTING <110> Inbiose N.V. <120> Cellular production of glycosylated products <130> 033-PCT <150> EP 21152132.3 <151> 2021-01-18 <160> 57 <170> PatentIn version 3.5 <210> 1 <211> 717 <212> PRT <213> Saccharomyces cerevisiae S288C <400> 1 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 2 <211> 717 <212> PRT <213> Saccharomyces pastorianus strain CBS 1483 <400> 2 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Met Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 3 <211> 717 <212> PRT <213> Saccharomyces cerevisiae YJM693 <400> 3 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Ile Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 4 <211> 717 <212> PRT <213> Saccharomyces cerevisiae YJM1307 <400> 4 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Ala Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 5 <211> 717 <212> PRT <213> Saccharomyces cerevisiae Pf-1 <400> 5 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Met Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 6 <211> 717 <212> PRT <213> Saccharomyces cerevisiae YJM456 <400> 6 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Asn Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 7 <211> 717 <212> PRT <213> Saccharomyces cerevisiae NYR20 <400> 7 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Arg Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 8 <211> 717 <212> PRT <213> Saccharomyces paradoxus CBS432 <400> 8 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Gln Pro Glu Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Ile Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 9 <211> 717 <212> PRT <213> Saccharomyces cerevisiae YJM1311 <400> 9 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Arg Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Ile 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 10 <211> 717 <212> PRT <213> Saccharomyces cerevisiae P-684 <400> 10 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Arg Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Ala Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 11 <211> 716 <212> PRT <213> S.cerevisiae strain S288C <400> 11 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser His Cys Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile Pro 530 535 540 Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys Leu 545 550 555 560 Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly Arg 565 570 575 Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys Glu 580 585 590 Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys His 595 600 605 Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe Gly 610 615 620 Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln Val 625 630 635 640 Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp Glu 645 650 655 Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu Val 660 665 670 Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro Leu 675 680 685 Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val Asp 690 695 700 Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 12 <211> 717 <212> PRT <213> Saccharomyces kudriavzevii IFO 1802 <400> 12 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Asp Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Ala Lys Gln Lys Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Lys 85 90 95 Arg Asn Cys His Pro Gln Arg Ser Asp Pro Glu Gly Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ala Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Asp Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Arg Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Pro Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Asp Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Ile Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Ile Cys Ser Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Glu Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Val Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Glu Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 13 <211> 717 <212> PRT <213> Saccharomyces cerevisiae x Saccharomyces kudriavzevii VIN7 <400> 13 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Asp Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Ala Lys Gln Lys Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Lys 85 90 95 Arg Asn Cys His Pro Gln Arg Ser Asp Pro Glu Gly Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ala Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Asp Asn 210 215 220 Ala Gly Gln Pro Glu Thr Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Arg Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Pro Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Asp Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Ile Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Gly Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Ile Cys Ser Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Glu Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Val Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Glu Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 14 <211> 717 <212> PRT <213> Saccharomyces pastorianus strain CBS 1483 <400> 14 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Val Asp 35 40 45 Ser Thr Leu Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Ala Arg Glu Lys Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Gln Pro Glu Lys 85 90 95 Ile Asn Cys His Pro Gln Arg Ser Asp Pro Glu Ser Gln Phe Val Ile 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Leu Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Asp 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Asp Asn 210 215 220 Ala Gly Gln Pro Glu Thr Pro Leu Arg Ser Asn Asn Arg Pro Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Gly 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Phe Asp Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Gly 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Val Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Met Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Asn Leu Glu Pro Arg Ile Lys Glu 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Glu Lys Ser Lys Thr Ile Lys Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Val Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 15 <211> 724 <212> PRT <213> Naumovozyma castellii CBS 4309 <400> 15 Met Cys Gly Ile Phe Gly Tyr Cys Asn Phe Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Glu Gly Leu Glu Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Leu Asp 35 40 45 Ser Thr Met Ile Phe Arg Gln Ile Gly Lys Val Ala Ala Leu Lys Glu 50 55 60 Glu Ile Lys Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Leu Asn Ser Phe Val Ile 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Arg Thr Leu Leu 115 120 125 Val Asn Lys Gly Phe Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Phe Lys His Leu Tyr Asp Thr Asn Leu Gln Asn Gly Asn 145 150 155 160 Glu Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Ile His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Asp Asn 210 215 220 Asn Leu Gly Lys Pro Glu Thr Pro Leu Gly Ser Ala Thr Asp Ser Thr 225 230 235 240 Val Asp Gly Ile Thr Val Asn Gly Lys Lys His Pro Arg Ser Tyr Gly 245 250 255 Val Asp Glu Ala Gln Ser Ser Asn Leu Leu Pro Ile Ala Ala Asn Glu 260 265 270 Phe Asn Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly 275 280 285 Thr Pro Asn Pro Val Glu Phe Phe Leu Ser Ser Asp Ala Ala Ser Val 290 295 300 Ile Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala 305 310 315 320 His Ile Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg Arg Glu Val 325 330 335 Gly Ala Ser Met Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala 340 345 350 Gln Ile Met Lys Gly Pro Tyr Lys His Phe Met Gln Lys Glu Ile Tyr 355 360 365 Glu Gln Pro Glu Ser Thr Leu Asn Thr Met Arg Gly Arg Ile Asp Phe 370 375 380 Glu Asn Asn Thr Leu Met Leu Gly Gly Leu Lys Ala Trp Leu Pro Ala 385 390 395 400 Ile Arg Arg Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr 405 410 415 His Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser Glu Ile 420 425 430 Pro Val Ser Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys Ser Pro 435 440 445 Val Phe Arg Asp Asp Ile Cys Val Phe Val Ser Gln Ser Gly Glu Thr 450 455 460 Ala Asp Thr Met Leu Ala Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu 465 470 475 480 Thr Val Gly Ile Val Asn Ser Val Gly Ser Ser Leu Ser Arg Ala Thr 485 490 495 His Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser 500 505 510 Thr Lys Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Phe Ala Leu 515 520 525 Ser Leu Ser Asp Asp Arg Leu Ser Lys Leu Glu Arg Arg Lys Asp Ile 530 535 540 Ile Gln Gly Leu Lys Leu Ile Pro Gly Gln Ile Lys Gln Val Leu Gln 545 550 555 560 Leu Glu Lys Lys Ile Lys Lys Leu Cys Glu Asn Glu Leu Lys Asp Gln 565 570 575 Lys Ser Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu 580 585 590 Glu Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly 595 600 605 Val Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu 610 615 620 Asn Leu Pro Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys 625 630 635 640 Val Val Ser Ser Ile Glu Gln Val Thr Ala Arg Lys Gly His Pro Ile 645 650 655 Val Ile Cys Asn Glu Asn Asp Glu Val Trp Ala Lys Lys Ala Glu Ser 660 665 670 Ile His Leu Val Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln 675 680 685 Gly Leu Leu Asn Ile Ile Pro Leu Gln Leu Met Ser Tyr Trp Leu Ala 690 695 700 Val Asn Lys Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser 705 710 715 720 Val Thr Val Glu <210> 16 <211> 723 <212> PRT <213> Candida glabrata strain DSY562 <400> 16 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Lys Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Leu Asp 35 40 45 Ser Thr Phe Ile Phe Arg Gln Ile Gly Lys Val Ser Ser Leu Glu Lys 50 55 60 Glu Ile Ala Leu Gln Lys Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Ser Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln 85 90 95 Ile Asn Cys His Pro Gln Arg Ser Asp Pro Asn Asn Glu Phe Val Ile 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Leu Asn Lys Gly Tyr Gln Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Phe Lys His Leu Tyr Asp Thr Asn Leu Lys Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Asn His Tyr Pro Asn Glu Ile 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Val Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Glu Ser 210 215 220 Met Gly Lys Pro Asp Thr Pro Leu Val Ser Ala Ser Gly Glu Ala Ile 225 230 235 240 Asn Asn Asn Asn Val Thr Val Ser Gly Arg Asn Ala Arg His Val Glu 245 250 255 Ala Asn Ala His Asn Asn Asn Leu Met Pro Ile Ala Ala Asn Asp Phe 260 265 270 Asn Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser 275 280 285 Pro Thr Pro Val Glu Phe Phe Val Ser Ser Asp Ala Ala Ser Val Ile 290 295 300 Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His 305 310 315 320 Ile Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg Lys Glu Val Gly 325 330 335 Ala Ser Met Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln 340 345 350 Ile Met Lys Gly Pro Tyr Lys His Phe Met Gln Lys Glu Ile Tyr Glu 355 360 365 Gln Pro Glu Ser Ser Phe Asn Thr Met Arg Gly Arg Ile Asp Phe Glu 370 375 380 Asn Lys Asn Val Met Leu Gly Gly Leu Lys Ala Trp Leu Pro Val Ile 385 390 395 400 Arg Arg Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr His 405 410 415 Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser Glu Ile Pro 420 425 430 Val Ser Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Arg Ser Pro Val 435 440 445 Phe Arg Glu Asp Val Cys Ile Phe Val Ser Gln Ser Gly Glu Thr Ala 450 455 460 Asp Thr Met Phe Ala Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr 465 470 475 480 Ile Gly Ile Val Asn Thr Val Gly Ser Ser Ile Ser Arg Val Thr His 485 490 495 Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr 500 505 510 Lys Ala Tyr Thr Ser Gln Tyr Val Ala Leu Val Met Val Ala Leu Ser 515 520 525 Leu Ser Asp Asp Arg Val Ser Lys Ile Glu Arg Arg Lys Glu Ile Ile 530 535 540 Asp Gly Leu Lys Leu Ile Pro Gly Gln Ile Lys Gln Val Leu Asn Leu 545 550 555 560 Glu Asp Lys Ile Lys Lys Leu Cys Val Thr Glu Leu Lys Asp Gln Lys 565 570 575 Ser Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu 580 585 590 Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val 595 600 605 Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Asn 610 615 620 Leu Pro Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val 625 630 635 640 Val Ser Ser Ile Glu Gln Val Thr Ala Arg Lys Gly Lys Pro Ile Ile 645 650 655 Ile Cys Asn Glu Asn Asp Asp Val Trp Ala Lys Lys Ala Glu Gln Ile 660 665 670 Asn Leu Val Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln Gly 675 680 685 Leu Leu Asn Ile Ile Pro Leu Gln Leu Met Ser Tyr Trp Leu Ala Val 690 695 700 Asn Lys Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val 705 710 715 720 Thr Val Glu <210> 17 <211> 723 <212> PRT <213> Candida glabrata strain BG2 <400> 17 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Lys Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Leu Asp 35 40 45 Ser Thr Phe Ile Phe Arg Gln Ile Gly Lys Val Ser Ser Leu Glu Lys 50 55 60 Glu Ile Ala Leu Gln Lys Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Ser Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln 85 90 95 Ile Asn Cys His Pro Gln Arg Ser Asp Pro Asn Asn Glu Phe Val Ile 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Leu Asn Lys Gly Tyr Gln Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Phe Lys His Leu Tyr Asp Thr Asn Leu Lys Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Ser His Tyr Pro Asn Glu Ile 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Val Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Glu Ser 210 215 220 Met Gly Lys Pro Asp Thr Pro Leu Val Ser Ala Ser Gly Glu Ala Ile 225 230 235 240 Asn Asn Asn Asn Val Thr Val Ser Gly Arg Asn Ala Arg His Val Glu 245 250 255 Ala Asn Ala His Asn Asn Asn Leu Met Pro Ile Ala Ala Asn Asp Phe 260 265 270 Asn Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser 275 280 285 Pro Thr Pro Val Glu Phe Phe Val Ser Ser Asp Ala Ala Ser Val Ile 290 295 300 Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His 305 310 315 320 Ile Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg Lys Glu Val Gly 325 330 335 Ala Ser Met Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln 340 345 350 Ile Met Lys Gly Pro Tyr Lys His Phe Met Gln Lys Glu Ile Tyr Glu 355 360 365 Gln Pro Glu Ser Ser Phe Asn Thr Met Arg Gly Arg Ile Asp Phe Glu 370 375 380 Asn Lys Asn Val Met Leu Gly Gly Leu Lys Ala Trp Leu Pro Val Ile 385 390 395 400 Arg Arg Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr His 405 410 415 Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser Glu Ile Pro 420 425 430 Val Ser Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Arg Ser Pro Val 435 440 445 Phe Arg Glu Asp Val Cys Ile Phe Val Ser Gln Ser Gly Glu Thr Ala 450 455 460 Asp Thr Met Phe Ala Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr 465 470 475 480 Ile Gly Ile Val Asn Thr Val Gly Ser Ser Ile Ser Arg Val Thr His 485 490 495 Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr 500 505 510 Lys Ala Tyr Thr Ser Gln Tyr Val Ala Leu Val Met Val Ala Leu Ser 515 520 525 Leu Ser Asp Asp Arg Val Ser Lys Ile Glu Arg Arg Lys Glu Ile Ile 530 535 540 Asp Gly Leu Lys Leu Ile Pro Gly Gln Ile Lys Gln Val Leu Asn Leu 545 550 555 560 Glu Asp Lys Ile Lys Lys Leu Cys Val Thr Glu Leu Lys Asp Gln Lys 565 570 575 Ser Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu 580 585 590 Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val 595 600 605 Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Asn 610 615 620 Leu Pro Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val 625 630 635 640 Val Ser Ser Ile Glu Gln Val Thr Ala Arg Lys Gly Lys Pro Ile Ile 645 650 655 Ile Cys Asn Glu Asn Asp Asp Val Trp Ala Lys Lys Ala Glu Gln Ile 660 665 670 Asn Leu Val Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln Gly 675 680 685 Leu Leu Asn Ile Ile Pro Leu Gln Leu Met Ser Tyr Trp Leu Ala Val 690 695 700 Asn Lys Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val 705 710 715 720 Thr Val Glu <210> 18 <211> 727 <212> PRT <213> Naumovozyma dairenensis CBS 421 <400> 18 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Glu Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Leu Ala Ile Asp Gly Asp Glu Pro Asp 35 40 45 Ser Thr Met Ile Phe Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Lys 50 55 60 Glu Ile Lys Arg Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Asn Asn Glu Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Thr Asn Lys Gly Phe Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Phe Lys His Ile Tyr Asp Thr Asn Val Gln Asn Gly Asn 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ser His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Asp Asn 210 215 220 Arg Pro Glu Thr Pro Ile His Asn Gly Thr Ser Asn His Ile Asn Gly 225 230 235 240 Ser Arg Ile Pro Asn Gly Asn Gly Pro Thr Thr Thr Asn Gly Asn Ser 245 250 255 Asn His Ile Asn Gly Leu Lys Lys Ala His Asn Leu Leu Pro Ile Ala 260 265 270 Thr Asn Glu Phe Asn Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser 275 280 285 Glu Asp Gly Thr Pro Asn Pro Val Glu Phe Phe Leu Ser Ser Asp Ala 290 295 300 Ala Ser Val Ile Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asp 305 310 315 320 Asp Leu Ala His Ile Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg 325 330 335 Lys Glu Val Gly Ala Ser Met Thr Arg Ser Ile Gln Thr Leu Glu Met 340 345 350 Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr Lys His Phe Met Gln Lys 355 360 365 Glu Ile Tyr Glu Gln Pro Glu Ser Thr Leu Asn Thr Met Arg Gly Arg 370 375 380 Ile Asp Phe Asp Asn Asn Ser Ile Met Leu Gly Gly Leu Lys Ala Trp 385 390 395 400 Leu Pro Ala Ile Arg Arg Ala Arg Arg Leu Ile Met Val Ala Cys Gly 405 410 415 Thr Ser Tyr His Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu 420 425 430 Ser Glu Ile Pro Val Ser Val Glu Leu Ala Ser Asp Phe Leu Asp Arg 435 440 445 Lys Ser Pro Val Phe Arg Asp Asp Ile Cys Val Phe Val Ser Gln Ser 450 455 460 Gly Glu Thr Ala Asp Thr Met Leu Ala Leu Asn Tyr Cys Leu Glu Arg 465 470 475 480 Gly Ala Leu Thr Val Gly Ile Val Asn Ser Val Gly Ser Ser Leu Ser 485 490 495 Arg Ala Thr His Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly 500 505 510 Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met 515 520 525 Val Ala Leu Ser Leu Ser Asp Asp Arg Val Ser Lys Leu Glu Arg Arg 530 535 540 Lys Asp Ile Ile Gln Gly Leu Lys Leu Ile Pro Gly Gln Ile Lys Gln 545 550 555 560 Val Leu Asn Leu Glu Asp Arg Ile Lys Lys Leu Cys Glu Asn Glu Leu 565 570 575 Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala 580 585 590 Ser Ala Leu Glu Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His 595 600 605 Ser Glu Gly Val Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu 610 615 620 Val Asp Glu Asn Leu Pro Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu 625 630 635 640 Phe Pro Lys Val Val Ser Ser Ile Glu Gln Val Thr Ala Arg Lys Gly 645 650 655 His Pro Ile Val Ile Cys Asn Glu Asn Asp Asp Val Trp Ala Lys Lys 660 665 670 Ala Glu Ser Val His Leu Glu Thr Leu Glu Val Pro Gln Thr Val Asp 675 680 685 Cys Leu Gln Gly Leu Leu Asn Ile Ile Pro Leu Gln Leu Met Ser Tyr 690 695 700 Trp Leu Ala Val Asn Lys Gly Ile Asp Val Asp Phe Pro Arg Asn Leu 705 710 715 720 Ala Lys Ser Val Thr Val Glu 725 <210> 19 <211> 725 <212> PRT <213> Torulaspora delbrueckii CBS 1146 <400> 19 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Pro Asp 35 40 45 Ser Thr Leu Val Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Ala Glu His His Pro Lys Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln 85 90 95 Val Asn Cys His Pro Gln Lys Ser Asp Pro Thr Gly Glu Phe Val Ile 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ser Asn Lys Gly Tyr Ser Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Phe Lys His Leu Tyr Asp Thr Asn Ile Gln Asn Gly Asn 145 150 155 160 Glu Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ser His Tyr Pro Asp Glu Val 180 185 190 Met Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Asp Asn 210 215 220 Ala Gln Pro Glu Thr Pro Leu Val Ser Glu Arg Ser Asn Gly Leu Ala 225 230 235 240 Ser Ser Arg Asn Leu Thr Val Asn Gly Gly Arg Lys Val Arg Leu Phe 245 250 255 Asp His Glu Asp Arg Gly Asn Ser Asn Leu Leu Pro Ile Ala Ala Asn 260 265 270 Glu Phe Asn Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp 275 280 285 Gly Thr Pro Asn Pro Val Glu Phe Phe Leu Ser Ser Asp Ala Ser Ser 290 295 300 Val Ile Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asn Asp Ile 305 310 315 320 Ala His Ile Tyr Asp Gly Glu Ile His Ile His Arg Ser Arg Arg Glu 325 330 335 Val Gly Ala Ser Met Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu 340 345 350 Ala Gln Ile Met Lys Gly Pro Tyr Lys His Phe Met Gln Lys Glu Ile 355 360 365 Phe Glu Gln Pro Glu Ser Thr Leu Asn Thr Met Arg Gly Arg Ile Asp 370 375 380 Phe Glu Asn Asn Ser Val Met Leu Gly Gly Leu Gln Ala Trp Leu Pro 385 390 395 400 Ala Ile Arg Arg Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser 405 410 415 Tyr His Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser Glu 420 425 430 Ile Pro Val Ser Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys Ser 435 440 445 Pro Val Phe Arg Asp Asp Ile Cys Val Phe Val Ser Gln Ser Gly Glu 450 455 460 Thr Ala Asp Thr Met Leu Ala Leu Asn Tyr Cys Leu Glu Arg Gly Ala 465 470 475 480 Leu Thr Val Gly Ile Val Asn Ser Val Gly Ser Ser Ile Ser Arg Ile 485 490 495 Thr His Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala 500 505 510 Ser Thr Lys Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Val Ala 515 520 525 Leu Ser Leu Ser Asp Asp Arg Val Ser Lys Ile Glu Arg Arg Gly Asp 530 535 540 Ile Met Gln Gly Leu Lys Lys Ile Pro Gln Gln Ile Lys Glu Val Leu 545 550 555 560 Gln Leu Glu Gly Lys Ile Lys Gln Leu Cys Glu Lys Asp Leu Lys Asp 565 570 575 Gln Lys Ser Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala 580 585 590 Leu Glu Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu 595 600 605 Gly Val Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp 610 615 620 Glu Asp Leu Pro Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro 625 630 635 640 Lys Val Val Ser Ser Ile Glu Gln Val Thr Ala Arg Lys Gly His Pro 645 650 655 Ile Val Ile Cys Asn Lys Asn Asp Glu Val Trp Glu Lys Lys Ala Ala 660 665 670 Thr Thr Lys Met Val Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu 675 680 685 Gln Gly Leu Leu Asn Ile Ile Pro Leu Gln Leu Ile Ser Tyr Trp Leu 690 695 700 Ala Val Asn Lys Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys 705 710 715 720 Ser Val Thr Val Glu 725 <210> 20 <211> 727 <212> PRT <213> Torulaspora globosa strain CBS764 <400> 20 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Ser Arg 1 5 10 15 Gly Asp Ile Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Leu Asp 35 40 45 Ser Thr Leu Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Arg Glu 50 55 60 Glu Ile Ala Glu His Lys Pro Lys Arg Asp Val Thr Phe Leu Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln 85 90 95 Ile Asn Cys His Pro Gln Lys Ser Asp Pro Asn Cys Glu Phe Val Ile 100 105 110 Val His Asn Gly Ile Ile Thr Asn Tyr Arg Glu Leu Lys Thr Leu Leu 115 120 125 Leu Asn Lys Gly Tyr Thr Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Phe Lys His Leu Tyr Asp Thr Asn Leu Glu Asn Gly His 145 150 155 160 Glu Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ala His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Asp Asn 210 215 220 Ala Gln Pro Glu Thr Pro Leu Val Ser Glu Arg Ala Asn Gly Ala Thr 225 230 235 240 Ala Asn Gly Asn Ser Val Arg Thr Leu Asn Gly Ser Gly Lys Lys Arg 245 250 255 Leu Tyr Asp His Glu Asp Arg Gly Asn Ser Asn Leu Leu Pro Ile Ala 260 265 270 Ala Asn Glu Phe Asn Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser 275 280 285 Glu Asp Gly Thr Pro Asn Pro Val Glu Phe Phe Leu Ser Ser Asp Ala 290 295 300 Ser Ser Val Ile Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asn 305 310 315 320 Asp Ile Ala His Ile Tyr Asp Gly Glu Ile His Ile His Arg Ser Arg 325 330 335 Arg Glu Val Gly Ala Ser Met Thr Arg Ser Ile Gln Thr Leu Glu Met 340 345 350 Glu Leu Ala Gln Ile Met Lys Gly Glu Tyr Asn His Phe Met Gln Lys 355 360 365 Glu Ile Phe Glu Gln Pro Glu Ser Ala Phe Asn Thr Met Arg Gly Arg 370 375 380 Ile Asp Phe Glu Lys Gly Thr Val Met Leu Gly Gly Leu Lys Ala Trp 385 390 395 400 Leu Pro Ala Ile Arg Arg Ala Arg Arg Leu Val Met Ile Ala Cys Gly 405 410 415 Thr Ser Tyr His Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu 420 425 430 Ser Glu Ile Pro Val Ser Val Glu Leu Ala Ser Asp Phe Leu Asp Arg 435 440 445 Lys Ser Pro Ile Phe Arg Asp Asp Ile Cys Val Phe Val Ser Gln Ser 450 455 460 Gly Glu Thr Ala Asp Thr Met Leu Ala Leu Asn Tyr Ser Leu Glu Arg 465 470 475 480 Gly Ala Leu Thr Val Gly Ile Val Asn Ser Val Gly Ser Ser Ile Ser 485 490 495 Arg Ile Thr His Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly 500 505 510 Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met 515 520 525 Phe Ala Leu Ser Leu Ser Asp Asp Arg Val Ser Lys Leu Glu Arg Arg 530 535 540 Gln Asp Ile Ile Arg Gly Leu Lys Met Ile Pro Glu Gln Ile Lys Glu 545 550 555 560 Val Leu Ser Leu Glu Pro Gln Ile Lys Ala Leu Cys Glu Lys Glu Leu 565 570 575 Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala 580 585 590 Ser Ala Leu Glu Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His 595 600 605 Ser Glu Gly Val Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu 610 615 620 Val Asp Glu Asp Leu Pro Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu 625 630 635 640 Phe Pro Lys Val Val Ser Ser Ile Glu Gln Val Thr Ala Arg Lys Gly 645 650 655 Gln Pro Ile Ile Ile Cys Asn Lys Asn Asp Glu Ala Trp Glu Lys Lys 660 665 670 Ser Ala Thr Thr Lys Met Val Thr Leu Glu Val Pro Leu Thr Val Asp 675 680 685 Cys Leu Gln Gly Leu Leu Asn Ile Ile Pro Leu Gln Leu Ile Ser Tyr 690 695 700 Trp Leu Ala Val Asn Lys Gly Ile Asp Val Asp Phe Pro Arg Asn Leu 705 710 715 720 Ala Lys Ser Val Thr Val Glu 725 <210> 21 <211> 721 <212> PRT <213> Zygosaccharomyces rouxii BRC 110957 <400> 21 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Thr Pro Asp 35 40 45 Ser Thr Leu Leu Tyr Lys Gln Ile Gly Lys Val Asp Ala Leu Lys Gln 50 55 60 Glu Ile Ala Gln Asp Ala Pro Glu Arg Asp Ile Thr Phe Ala Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Arg Gln 85 90 95 Ile Asn Cys His Pro Gln Arg Ser Asp Pro Gln Asn Glu Phe Thr Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Arg Thr Leu Leu 115 120 125 Ala Asn Arg Gly Tyr Thr Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Ile Leu Phe Lys His Leu Tyr Asp Glu Asn Leu Ser Asn Gly His 145 150 155 160 Glu Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Thr Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Leu His Tyr Pro Glu Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Asp 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Ile Glu Phe Pro Asp Asp Ser 210 215 220 Ala Gly Lys Pro Asp Thr Pro Leu Gly Ser Arg Ser Gly Thr Pro Asn 225 230 235 240 Ala Ser Ser Arg Asn Leu Leu Asn Gly Asn Arg Arg Thr Arg Pro Tyr 245 250 255 Asp Gly His Asn Leu Leu Pro Leu Ala Ala Asn Glu Phe Asn Leu Arg 260 265 270 His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Thr Pro Asn Pro 275 280 285 Val Glu Phe Phe Val Ser Ser Asp Ala Ala Ser Val Ile Lys His Thr 290 295 300 Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp 305 310 315 320 Gly Glu Leu His Ile His Arg Ser Arg Arg Pro Glu Val Gly Ala Ser 325 330 335 Met Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met 340 345 350 Lys Gly Pro Tyr Lys His Phe Met Gln Lys Glu Ile Phe Glu Gln Pro 355 360 365 Asp Ser Ala Leu Asn Thr Met Arg Gly Arg Ile Asp Phe Glu Asn Gly 370 375 380 Thr Ile Met Leu Gly Gly Leu Lys Ala Trp Leu Pro Ala Val Arg Arg 385 390 395 400 Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys 405 410 415 Leu Ala Thr Arg Ala Met Phe Glu Glu Leu Ser Glu Ile Pro Val Ser 420 425 430 Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg 435 440 445 Asp Asp Val Cys Cys Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr 450 455 460 Met Leu Ala Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Leu Gly 465 470 475 480 Ile Val Asn Ser Val Gly Ser Ser Ile Ser Arg Ala Thr His Cys Gly 485 490 495 Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala 500 505 510 Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser 515 520 525 Asp Asp Arg Val Ser Lys Ile Asp Arg Arg Lys Glu Ile Ile Lys Gly 530 535 540 Leu Gln Lys Ile Pro Asp Gln Ile Arg Glu Val Leu Lys Leu Glu Thr 545 550 555 560 Arg Ile Lys Glu Leu Cys Gln Asn Asp Leu Lys Asp His Lys Ser Leu 565 570 575 Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly Ala 580 585 590 Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala 595 600 605 Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Gln Leu Pro 610 615 620 Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser 625 630 635 640 Ser Ile Glu Gln Val Thr Ala Arg Lys Gly Arg Pro Ile Ile Ile Cys 645 650 655 Asn Thr Asn Asp Glu Val Trp Ala Lys Lys Ala Glu Thr Asn Lys Leu 660 665 670 Leu Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Leu 675 680 685 Asn Ile Ile Pro Leu Gln Leu Ile Ser Tyr Trp Leu Ala Val Asn Arg 690 695 700 Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val 705 710 715 720 Glu <210> 22 <211> 706 <212> PRT <213> Ashbya gossypii FDAG1 <400> 22 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Gly Ala Asp 35 40 45 Glu Thr Phe Ile Phe Lys Gln Ile Gly Lys Val Ser Ala Leu Glu Arg 50 55 60 Glu Ile Ala Glu Arg Ala Pro Ala Arg Asp Val Arg Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Gln Pro Arg Gln 85 90 95 Val Asn Cys His Pro His Arg Ser Asp Ala Arg Asn Glu Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Arg Asn Lys Gly Tyr Glu Phe Glu Ser Asp Thr Asp Thr Glu Val Ile 130 135 140 Ala Lys Leu Phe Lys His Leu Tyr Asp Thr Asn Leu Glu Asn Gly His 145 150 155 160 Glu Leu Asp Phe His Glu Leu Thr Lys Gln Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ser Arg Tyr Pro Cys Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Val Gly Val Lys Ser Glu 195 200 205 Arg Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Asn Glu 210 215 220 Lys Gln Pro Asp Val Pro Ile Pro Ala Val Leu Asn Gly His Lys Ala 225 230 235 240 Gly Ala Asp Cys Glu Lys Leu Leu Pro Ile Ala Ala Ser Glu Thr Gly 245 250 255 Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Val Pro 260 265 270 Asn Pro Val Glu Phe Phe Leu Ser Ser Asp Ala Ala Ser Val Ile Lys 275 280 285 His Thr Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile 290 295 300 Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg Arg Glu Val Gly Ala 305 310 315 320 Ser Ala Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile 325 330 335 Met Lys Gly Pro Tyr Asp His Phe Met Gln Lys Glu Ile Phe Glu Gln 340 345 350 Pro Glu Ser Thr Leu Asn Thr Met Arg Gly Arg Ile Asp Phe Glu Asn 355 360 365 Asn Thr Val Met Leu Gly Gly Leu Lys Ser Trp Leu Pro Ala Ile Arg 370 375 380 Ser Ala Arg Arg Leu Thr Met Ile Ala Cys Gly Thr Ser Tyr His Ser 385 390 395 400 Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser Glu Ile Pro Val 405 410 415 Ser Ile Glu Leu Ala Ser Asp Phe Leu Asp Arg Arg Cys Pro Val Phe 420 425 430 Arg Asp Asp Val Cys Ile Phe Val Ser Gln Ser Gly Glu Thr Ala Asp 435 440 445 Thr Met Leu Ala Leu Asn Tyr Cys Ile Glu Arg Gly Ala Leu Thr Val 450 455 460 Gly Ile Val Asn Ser Val Gly Ser Ser Ile Ser Arg Val Thr His Cys 465 470 475 480 Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys 485 490 495 Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Leu Ala Leu Ser Leu 500 505 510 Ser Asp Asp Arg Val Ser Arg Ile Glu Arg Arg Lys Glu Ile Ile Gln 515 520 525 Gly Leu Lys Glu Ile Pro Arg Gln Ile Lys Gln Val Leu Gln Leu Glu 530 535 540 Lys Gln Ile Lys His Leu Cys Glu Thr Glu Leu Cys Asn Gln Lys Ser 545 550 555 560 Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly 565 570 575 Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu 580 585 590 Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Asn Leu 595 600 605 Pro Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val 610 615 620 Ser Ser Ile Glu Gln Val Thr Ala Arg Lys Gly Arg Pro Ile Ile Ile 625 630 635 640 Cys Asn Glu Asn Asp Glu Val Trp Thr Arg Lys Ala Gln Asn Ser Asn 645 650 655 Leu Leu Thr Leu Glu Val Pro Leu Thr Val Asp Cys Leu Gln Gly Leu 660 665 670 Leu Asn Ile Ile Pro Leu Gln Leu Thr Ala Tyr Trp Leu Ala Val Asn 675 680 685 Asn Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr 690 695 700 Val Glu 705 <210> 23 <211> 701 <212> PRT <213> Lachancea quebecensis LAQU0 <400> 23 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Ser Arg 1 5 10 15 Gly Asp Val Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Pro Asp 35 40 45 Ser Thr Leu Ile Tyr Lys Gln Ile Gly Lys Val Ala Ala Leu Glu Lys 50 55 60 Glu Ile Glu Val Glu Lys Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Trp 85 90 95 Ala Asn Cys His Pro Gln Arg Ser Asn Met Ala Ser Asp Phe Val Ile 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Gln Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Phe Lys His Leu Tyr Asp Thr Asn Leu Lys His Gly Asn 145 150 155 160 Glu Pro Asp Phe His Glu Leu Thr Met Gln Val Leu Leu Glu Leu Asp 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Arg Ser Val His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Arg Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Thr Asp 210 215 220 Glu Ala Gln Pro Asp Ile Pro Leu Asn Ser Ser Arg Gly Glu Ala Arg 225 230 235 240 Asn Phe Leu Pro Ile Ala Ser Asn Glu Ser Ala Leu Arg Arg Ser Gln 245 250 255 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ala Pro Asn Pro Val Glu Phe 260 265 270 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 275 280 285 Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp Gly Glu Leu 290 295 300 His Ile His Arg Ser Arg Arg Glu Ile Gly Ala Ser Ala Thr Arg Ser 305 310 315 320 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Ser Tyr 325 330 335 Lys His Phe Met Gln Lys Glu Ile Phe Glu Gln Pro Asp Ser Thr Phe 340 345 350 Asn Thr Met Arg Gly Arg Ile Asp Phe Glu Ser Asn Ser Val Met Leu 355 360 365 Gly Gly Leu Asn Ser Trp Leu Pro Val Ile Arg Arg Ala Arg Arg Leu 370 375 380 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 385 390 395 400 Ala Ile Phe Glu Glu Leu Ser Glu Ile Pro Val Ser Val Glu Leu Ala 405 410 415 Ser Asp Phe Leu Asp Arg Lys Thr Pro Val Phe Arg Asp Asp Ile Ala 420 425 430 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 435 440 445 Lys Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Asn 450 455 460 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 465 470 475 480 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 485 490 495 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 500 505 510 Ser Lys Val Glu Arg Arg Arg Glu Ile Ile Gln Gly Leu Lys Lys Ile 515 520 525 Pro Glu Gln Ile Arg Lys Val Leu Leu Met Glu Pro Arg Ile Lys Glu 530 535 540 Leu Cys Glu Lys Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 545 550 555 560 Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly Ala Leu Lys Ile Lys 565 570 575 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 580 585 590 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 595 600 605 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 610 615 620 Val Thr Ala Arg Lys Gly Arg Pro Ile Ile Ile Cys Asn Glu Asn Asp 625 630 635 640 Glu Val Trp Ser Ala Lys Ala Ala Asn Ser Asn Leu Ala Thr Leu Glu 645 650 655 Val Pro Leu Thr Val Asp Cys Leu Gln Gly Leu Leu Asn Ile Ile Pro 660 665 670 Leu Gln Leu Thr Ser Tyr Trp Leu Ala Val Asn Lys Asn Ile Asp Val 675 680 685 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 690 695 700 <210> 24 <211> 726 <212> PRT <213> Kazachstania naganishii CBS 8797 <400> 24 Met Cys Gly Ile Phe Gly Tyr Cys Asn Phe Leu Val Glu Lys Ser Arg 1 5 10 15 Gly Glu Ile Leu Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Val Ala Ile Asp Gly Asp Glu Leu Asp 35 40 45 Ser Thr Thr Ile Ile Lys Gln Ile Gly Lys Val Asp Ala Leu Lys Glu 50 55 60 Glu Ile Ala Lys Val Asn Pro Asn Arg Asp Val Thr Phe Ala Ser His 65 70 75 80 Val Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Gln Pro Arg Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Ala Asn Asn Glu Phe Val Ile 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Thr Asn Lys Gly Tyr Lys Phe Glu Ser Glu Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Phe Lys His Ile Tyr Asp Thr Asn Thr Gln Asn Gly Asn 145 150 155 160 Glu Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ser His Tyr Pro Asp Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Met Asp Phe Val Asp Val Glu Phe Pro Asp Asp Thr 210 215 220 Glu Asn Arg Pro Glu Thr Pro Leu Arg Gly Asn Thr Pro Thr Gly Arg 225 230 235 240 Asn Gly Ala Ile Ser Val Thr Ser Asn Lys Lys Asn Pro Asn Ala Phe 245 250 255 Ile Ser Asn Ser His Ser Asp Asn Asp Asn Leu Leu Pro Ile Ala Ala 260 265 270 Asn His Phe Asn Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu 275 280 285 Asp Gly Ser Pro Ala Pro Met Glu Phe Phe Leu Ser Ser Asp Ala Ser 290 295 300 Ser Val Ile Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asp Asp 305 310 315 320 Ile Ala His Ile Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg Arg 325 330 335 Glu Val Gly Ala Ser Met Thr Arg Ser Ile Gln Thr Leu Glu Met Glu 340 345 350 Leu Ala Gln Ile Met Lys Gly Arg Tyr Lys His Phe Met Gln Lys Glu 355 360 365 Ile Tyr Glu Gln Pro Glu Ser Thr Phe Asn Thr Met Arg Gly Arg Ile 370 375 380 Asp Phe Glu Asn Asn Arg Ile Thr Leu Gly Gly Leu Lys Ala Trp Leu 385 390 395 400 Pro Ala Ile Arg Arg Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr 405 410 415 Ser Tyr His Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser 420 425 430 Asp Ile Pro Val Ser Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys 435 440 445 Ser Pro Val Phe Arg Asp Asp Ile Cys Ile Phe Val Ser Gln Ser Gly 450 455 460 Glu Thr Ala Asp Thr Met Leu Ala Leu Asn Tyr Cys Leu Glu Arg Gly 465 470 475 480 Ser Leu Thr Val Gly Ile Val Asn Ser Val Gly Ser Ser Leu Ser Arg 485 490 495 Ala Thr His Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val 500 505 510 Ala Ser Thr Lys Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Val 515 520 525 Ala Leu Ser Leu Ser Asp Asp Arg Val Ser Lys Leu Gln Arg Arg Asn 530 535 540 Asp Ile Ile Gln Gly Leu Lys Gln Ile Pro Gln Gln Ile Lys Lys Val 545 550 555 560 Leu Asp Leu Glu Pro Lys Ile Lys Lys Leu Cys Gln Asn Lys Leu Lys 565 570 575 Asn Gln Lys Ser Leu Leu Ile Leu Gly Arg Gly Tyr Gln Phe Ala Ser 580 585 590 Ala Leu Glu Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser 595 600 605 Glu Gly Val Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val 610 615 620 Asp Glu Asn Leu Pro Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe 625 630 635 640 Pro Lys Val Val Ser Ser Ile Glu Gln Ile Thr Ala Arg Lys Gly His 645 650 655 Pro Ile Ile Ile Cys Asn Asp Asn Asp Glu Val Trp Ser Lys Lys Ala 660 665 670 Glu Gly Thr Lys Leu Glu Thr Leu Asn Val Pro Gln Thr Val Asp Cys 675 680 685 Leu Gln Gly Leu Leu Asn Ile Val Pro Leu Gln Leu Ile Ser Tyr Arg 690 695 700 Leu Ala Val Asp Lys Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala 705 710 715 720 Lys Ser Val Thr Val Glu 725 <210> 25 <211> 707 <212> PRT <213> Saccharomycetaceae sp. 'Ashbya aceri' <400> 25 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Ala Ala Asp 35 40 45 Glu Thr Phe Ile Phe Lys Gln Ile Gly Lys Val Ser Ala Leu Glu Arg 50 55 60 Glu Ile Ala Glu Arg Ala Pro Ala Arg Asp Ala Arg Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Gln Pro Arg Gln 85 90 95 Val Asn Cys His Pro His Arg Ser Asp Ala Gly Asn Glu Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Arg Asn Lys Gly Tyr Gln Phe Glu Ser Asp Thr Asp Thr Glu Val Ile 130 135 140 Ala Lys Leu Phe Lys His Leu Tyr Asp Thr Asn Leu Glu Asn Gly His 145 150 155 160 Glu Leu Asp Phe His Glu Leu Thr Lys Gln Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ser Arg Tyr Pro Ala Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Val Gly Val Lys Ser Glu 195 200 205 Arg Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Asn Asp 210 215 220 Lys Gln Pro Asp Val Pro Ile Pro Ala Val Ser Asn Gly His Lys Ala 225 230 235 240 Gly Ala Asp Gly Arg Asp Lys Leu Leu Pro Ile Ala Ala Ser Glu Thr 245 250 255 Gly Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Val 260 265 270 Pro Asn Pro Val Glu Phe Phe Leu Ser Ser Asp Ala Ala Ser Val Ile 275 280 285 Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His 290 295 300 Ile Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg Arg Glu Val Gly 305 310 315 320 Ala Ser Ala Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln 325 330 335 Ile Met Lys Gly Pro Tyr Asp His Phe Met Gln Lys Glu Ile Phe Glu 340 345 350 Gln Pro Glu Ser Thr Leu Asn Thr Met Arg Gly Arg Ile Asp Phe Glu 355 360 365 Asn Asn Thr Val Met Leu Gly Gly Leu Lys Ser Trp Leu Pro Ala Ile 370 375 380 Arg Ser Ala Arg Arg Leu Thr Met Ile Ala Cys Gly Thr Ser Tyr His 385 390 395 400 Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser Glu Ile Pro 405 410 415 Val Ser Ile Glu Leu Ala Ser Asp Phe Leu Asp Arg Arg Cys Pro Val 420 425 430 Phe Arg Asp Asp Val Cys Ile Phe Val Ser Gln Ser Gly Glu Thr Ala 435 440 445 Asp Thr Met Leu Ala Leu Asn Tyr Cys Ile Glu Arg Gly Ala Leu Thr 450 455 460 Val Gly Ile Val Asn Ser Val Gly Ser Ser Ile Ser Arg Val Thr His 465 470 475 480 Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr 485 490 495 Lys Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Leu Ala Leu Ser 500 505 510 Leu Ser Asp Asp Arg Val Ser Arg Ile Glu Arg Arg Lys Glu Ile Ile 515 520 525 Gln Gly Leu Lys Glu Ile Pro Ser Gln Ile Lys Gln Val Leu Gln Leu 530 535 540 Glu Lys Gln Ile Lys His Leu Cys Glu Thr Glu Leu Cys Asn Gln Lys 545 550 555 560 Ser Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu 565 570 575 Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val 580 585 590 Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Asn 595 600 605 Leu Pro Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val 610 615 620 Val Ser Ser Ile Glu Gln Val Thr Ala Arg Lys Gly Arg Pro Ile Ile 625 630 635 640 Ile Cys Asn Gln Asn Asp Glu Val Trp Thr Lys Lys Ala Gln Asn Ser 645 650 655 Asn Leu Leu Thr Leu Glu Val Pro Leu Thr Val Asp Cys Leu Gln Gly 660 665 670 Leu Leu Asn Ile Ile Pro Leu Gln Leu Thr Ala Tyr Trp Leu Ala Val 675 680 685 Asn Asn Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val 690 695 700 Thr Val Glu 705 <210> 26 <211> 701 <212> PRT <213> Lachancea fermentati <400> 26 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Ser Arg 1 5 10 15 Gly Asp Val Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Pro Asp 35 40 45 Ser Thr Leu Ile Tyr Lys Gln Ile Gly Lys Val Lys Ala Leu Glu Lys 50 55 60 Glu Ile Glu Glu His His Pro Asn Arg Glu Val Thr Phe Val Thr His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Val Gln 85 90 95 Ile Asn Cys His Pro Gln Arg Ser Asp Arg His Asn Glu Phe Val Ile 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Gln Leu Leu 115 120 125 Leu Asn Lys Gly Tyr Thr Phe Glu Ser Glu Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Phe Lys His Met Tyr Asp Thr Asn Leu Lys Asn Gly Val 145 150 155 160 Glu Leu Asp Phe His Asp Leu Thr Lys Gln Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ala His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Arg Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Thr Asp 210 215 220 Asp Val Gln Pro Asp Ile Pro Leu Asn Ser Ala Arg Thr Glu Asp Arg 225 230 235 240 Asn Leu Leu Pro Ile Ala Ala Asn Glu Ser Ala Leu Arg Arg Ser Gln 245 250 255 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ala Pro Asn Pro Val Glu Phe 260 265 270 Phe Val Ser Ser Asp Ala Ala Ser Val Ile Lys His Thr Lys Lys Val 275 280 285 Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp Gly Glu Leu 290 295 300 His Ile His Arg Ser Arg Arg Glu Met Gly Ala Ser Ala Ile Arg Ser 305 310 315 320 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 325 330 335 Lys His Phe Met Gln Lys Glu Ile Phe Glu Gln Pro Glu Ser Thr Leu 340 345 350 Asn Thr Met Arg Gly Arg Ile Asp Phe Glu Asn Asn Thr Val Met Leu 355 360 365 Gly Gly Leu Lys Ser Trp Leu Pro Ile Ile Arg Arg Thr Arg Arg Leu 370 375 380 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 385 390 395 400 Ala Ile Phe Glu Glu Leu Ser Glu Ile Pro Val Ser Val Glu Leu Ala 405 410 415 Ser Asp Phe Leu Asp Arg Lys Thr Pro Val Phe Arg Asp Asp Val Cys 420 425 430 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 435 440 445 Lys Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Asn 450 455 460 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 465 470 475 480 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 485 490 495 Tyr Ile Ala Leu Val Met Leu Ala Leu Ser Leu Ser Asp Asp Lys Val 500 505 510 Ser Arg Val Glu Arg Arg Lys Glu Ile Ile Gln Gly Leu Lys Glu Ile 515 520 525 Pro Glu Gln Ile Lys Gln Val Leu Lys Met Glu Pro Arg Ile Lys Glu 530 535 540 Leu Cys Glu Thr Glu Leu Arg Asp Lys Arg Ser Leu Leu Leu Leu Gly 545 550 555 560 Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly Ala Leu Lys Ile Lys 565 570 575 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 580 585 590 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 595 600 605 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 610 615 620 Val Thr Ala Arg Lys Gly Arg Pro Ile Ile Ile Cys Asn Glu Asn Asp 625 630 635 640 Asp Leu Trp Ser Lys Arg Ala Ser Gln Ser Asn Leu Val Thr Leu Glu 645 650 655 Val Pro Leu Thr Val Asp Cys Leu Gln Gly Leu Leu Asn Ile Ile Pro 660 665 670 Leu Gln Leu Thr Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 675 680 685 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 690 695 700 <210> 27 <211> 718 <212> PRT <213> Tetrapisispora blattae CBS 6284 <400> 27 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Thr Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Glu Gly Leu Glu Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Pro Asp 35 40 45 Ser Ile Asp Ile Phe Arg Glu Ile Gly Lys Val Ser Ser Leu Lys Glu 50 55 60 Gln Ile Lys Lys Ala Asn Pro Asn Arg Asp Val Thr Tyr Leu Thr His 65 70 75 80 Ser Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Gln Pro Lys Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Ala Glu Asn Gln Phe Val Ile 100 105 110 Ile His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Met Asn Lys Gly Tyr Thr Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Phe Leu His Leu Tyr Gln Thr Asn Leu Lys Ser Gly His 145 150 155 160 Glu Leu Asp Phe His Glu Leu Ser Lys Leu Val Leu Met Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Ile His Tyr Pro Gly Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Glu Asn 210 215 220 Ala Ala Gln Pro Glu Thr Pro Met Thr Ile Asn Glu Pro Lys Val Ile 225 230 235 240 Lys Ser Ser Ser Leu Lys Ser Asn Lys Ser Asp Phe His Ser Lys Asp 245 250 255 Gly Leu Met Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ala Pro Asn Pro Ile Glu Phe 275 280 285 Phe Ile Ser Ser Asp Ala Ala Ser Val Ile Lys Tyr Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Lys Asp Val Gly Gly Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Leu Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Lys His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Tyr 355 360 365 Asn Thr Met Arg Gly Arg Leu Asp Phe Asp Asn Asn Leu Val Asn Leu 370 375 380 Gly Gly Leu Gln Gln Phe Ile Pro Thr Ile Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Phe Ser Asp Leu Pro Val Ser Ile Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Phe Ala Leu 450 455 460 Asn Tyr Val Met Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Thr 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Ala Thr Asn Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Val Leu Leu Gly Glu Asp Arg Ile 515 520 525 Ser Lys Thr Glu Arg Arg Lys Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Glu Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Gln 545 550 555 560 Leu Cys Glu Asn Glu Leu Ser Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Glu Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Asn Lys Lys Lys Ser Glu Asn Asp Lys Phe Ile Thr Leu 660 665 670 Glu Val Pro Thr Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile 675 680 685 Pro Leu Gln Leu Met Ser Tyr Trp Leu Ala Ser Asn Lys Gly Ile Asp 690 695 700 Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 28 <211> 724 <212> PRT <213> Zygosaccharomyces parabailii strain ATCC 60483 <400> 28 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Asp Ile Ile Asp Thr Leu Val Glu Gly Leu Glu Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Gln Pro Glu 35 40 45 Ser Thr Leu Leu Tyr Lys Gln Ile Gly Lys Val Ala Ala Leu Lys Glu 50 55 60 Glu Ile Ser His Asp Ala Pro Arg Arg Asp Val Ser Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln 85 90 95 Val Asn Cys His Pro Gln Lys Ser Asp Pro Asn Cys Glu Phe Thr Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Asp Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Thr Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Phe Lys His Leu Tyr Asp Glu Asn Leu Ser Asn Gly His 145 150 155 160 Glu Leu Asp Phe His Val Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ser His Tyr Pro Glu Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Asp Asn 210 215 220 Ala Gly Lys Pro Asp Thr Pro Leu Val Ser Arg Ser Gly Thr Pro Asn 225 230 235 240 Gly Ser Ala Arg Ser Gln Thr Thr Asn Gly Phe Ser Gly Leu Arg Arg 245 250 255 Thr Arg Pro Tyr Asp Ser Asn Asn Leu Leu Pro Ile Thr Pro Asn Glu 260 265 270 Phe Asn Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly 275 280 285 Lys Pro Asn Pro Val Glu Phe Phe Val Ser Ser Asp Ala Ala Ser Val 290 295 300 Ile Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala 305 310 315 320 His Ile Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg Arg Glu Val 325 330 335 Gly Ala Ser Met Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala 340 345 350 Gln Ile Met Lys Gly Pro Tyr Thr His Phe Met Gln Lys Glu Ile Phe 355 360 365 Glu Gln Pro Asp Ser Thr Phe Asn Thr Met Arg Gly Arg Ile Asp Phe 370 375 380 Asp Ser Ser Thr Val Met Leu Gly Gly Leu Gln Ala Trp Leu Pro Ala 385 390 395 400 Val Arg Arg Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr 405 410 415 His Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser Glu Ile 420 425 430 Pro Val Ser Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys Cys Pro 435 440 445 Val Phe Arg Asp Asp Val Cys Cys Phe Val Ser Gln Ser Gly Glu Thr 450 455 460 Ala Asp Thr Met Leu Ala Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu 465 470 475 480 Thr Val Gly Ile Val Asn Ser Val Gly Ser Ser Ile Ser Arg Val Thr 485 490 495 His Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser 500 505 510 Thr Lys Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Phe Ala Leu 515 520 525 Ser Leu Ser Asp Asp Arg Val Ser Lys Met Glu Arg Arg Arg Glu Ile 530 535 540 Met Asn Gly Leu Arg Asn Ile Pro Asp Gln Ile Arg Glu Val Leu Ser 545 550 555 560 Leu Glu Pro Arg Ile Lys Glu Leu Cys Gln Gln Asp Leu Glu Glu His 565 570 575 Lys Ser Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Thr Ala Leu 580 585 590 Glu Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly 595 600 605 Val Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu 610 615 620 Gln Leu Pro Ile Ile Ala Phe Ala Thr Arg Asp Ser Leu Phe Pro Lys 625 630 635 640 Val Val Ser Thr Ile Glu Gln Val Thr Ala Arg Lys Gly His Pro Ile 645 650 655 Ile Ile Cys Asn Lys Asn Asp Asp Val Trp Ala Lys Lys Ala Glu Thr 660 665 670 Lys Gln Leu Val Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln 675 680 685 Gly Leu Leu Asn Ile Ile Pro Leu Gln Leu Ile Ser Tyr Trp Leu Ala 690 695 700 Val Asn Arg Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser 705 710 715 720 Val Thr Val Glu <210> 29 <211> 724 <212> PRT <213> Zygosaccharomyces bailii ISA1307 <400> 29 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Asp Ile Ile Asp Thr Leu Val Glu Gly Leu Glu Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Gln Pro Glu 35 40 45 Ser Thr Leu Leu Tyr Lys Gln Ile Gly Lys Val Ala Ala Leu Lys Glu 50 55 60 Glu Ile Ser His Asp Ala Pro Arg Arg Asp Val Ser Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln 85 90 95 Val Asn Cys His Pro Gln Lys Ser Asp Pro Asn Cys Glu Phe Thr Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Asp Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Thr Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Phe Lys His Leu Tyr Asp Glu Asn Leu Ser Asn Gly His 145 150 155 160 Glu Leu Asp Phe His Val Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ser His Tyr Pro Glu Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Asp Asn 210 215 220 Ala Gly Lys Pro Asp Thr Pro Leu Val Ser Arg Ser Gly Thr Pro Asn 225 230 235 240 Gly Ser Ala Arg Ser Gln Thr Thr Asn Gly Phe Ser Gly Leu Arg Arg 245 250 255 Thr Arg Pro Tyr Asp Ser Asn Asn Leu Leu Pro Ile Thr Pro Asn Glu 260 265 270 Phe Asn Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly 275 280 285 Lys Pro Asn Pro Val Glu Phe Phe Val Ser Ser Asp Ala Ala Ser Val 290 295 300 Ile Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala 305 310 315 320 His Ile Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg Arg Glu Val 325 330 335 Gly Ala Ser Met Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala 340 345 350 Gln Ile Met Lys Gly Pro Tyr Thr His Phe Met Gln Lys Glu Ile Phe 355 360 365 Glu Gln Pro Asp Ser Thr Phe Asn Thr Met Arg Gly Arg Ile Asp Phe 370 375 380 Asp Ser Gly Thr Val Met Leu Gly Gly Leu Gln Ala Trp Leu Pro Ala 385 390 395 400 Val Arg Arg Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr 405 410 415 His Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser Glu Ile 420 425 430 Pro Val Ser Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys Cys Pro 435 440 445 Val Phe Arg Asp Asp Val Cys Cys Phe Val Ser Gln Ser Gly Glu Thr 450 455 460 Ala Asp Thr Met Leu Ala Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu 465 470 475 480 Thr Val Gly Ile Val Asn Ser Val Gly Ser Ser Ile Ser Arg Val Thr 485 490 495 His Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser 500 505 510 Thr Lys Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Phe Ala Leu 515 520 525 Ser Leu Ser Asp Asp Arg Val Ser Lys Met Glu Arg Arg Arg Glu Ile 530 535 540 Met Asn Gly Leu Arg Asn Ile Pro Asp Gln Ile Arg Glu Val Leu Ser 545 550 555 560 Leu Glu Pro Arg Ile Lys Glu Leu Cys Gln Gln Asp Leu Glu Glu His 565 570 575 Lys Ser Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Thr Ala Leu 580 585 590 Glu Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly 595 600 605 Val Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu 610 615 620 Gln Leu Pro Ile Ile Ala Phe Ala Thr Arg Asp Ser Leu Phe Pro Lys 625 630 635 640 Val Val Ser Thr Ile Glu Gln Val Thr Ala Arg Lys Gly His Pro Ile 645 650 655 Ile Ile Cys Asn Lys Asn Asp Asp Val Trp Ala Lys Lys Ala Glu Thr 660 665 670 Lys Gln Leu Val Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln 675 680 685 Gly Leu Leu Asn Ile Ile Pro Leu Gln Leu Ile Ser Tyr Trp Leu Ala 690 695 700 Val Asn Arg Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser 705 710 715 720 Val Thr Val Glu <210> 30 <211> 724 <212> PRT <213> Zygosaccharomyces parabailii strain ATCC 60483 <400> 30 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Asp Ile Ile Asp Thr Leu Val Glu Gly Leu Glu Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Gln Pro Glu 35 40 45 Ser Thr Leu Leu Tyr Lys Gln Ile Gly Lys Val Ala Ala Leu Lys Glu 50 55 60 Glu Ile Ser His Asp Ala Pro Arg Arg Asp Val Ser Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln 85 90 95 Val Asn Cys His Pro Gln Lys Ser Asp Pro Ser Cys Glu Phe Thr Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Asp Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Thr Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Phe Lys His Leu Tyr Asp Glu Asn Leu Ser Asn Gly His 145 150 155 160 Glu Leu Asp Phe His Val Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ser His Tyr Pro Glu Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Asp Asn 210 215 220 Ala Gly Lys Pro Asp Thr Pro Leu Val Ser Arg Ser Gly Thr Pro Asn 225 230 235 240 Gly Ser Ala Arg Ser Gln Thr Thr Asn Gly Phe Ser Gly Leu Arg Arg 245 250 255 Thr Arg Pro Tyr Asp Ser Asn Asn Leu Leu Pro Ile Thr Pro Asn Glu 260 265 270 Phe Asn Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly 275 280 285 Lys Pro Asn Pro Val Glu Phe Phe Val Ser Ser Asp Ala Ala Ser Val 290 295 300 Ile Lys His Thr Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala 305 310 315 320 His Ile Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg Arg Glu Val 325 330 335 Gly Ala Ser Met Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala 340 345 350 Gln Ile Met Lys Gly Pro Tyr Thr His Phe Met Gln Lys Glu Ile Phe 355 360 365 Glu Gln Pro Asp Ser Thr Phe Asn Thr Met Arg Gly Arg Ile Asp Phe 370 375 380 Asp Ser Gly Thr Val Met Leu Gly Gly Leu Gln Ala Trp Leu Pro Ala 385 390 395 400 Val Arg Arg Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr 405 410 415 His Ser Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser Glu Ile 420 425 430 Pro Val Ser Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys Cys Pro 435 440 445 Val Phe Arg Asp Asp Val Cys Cys Phe Val Ser Gln Ser Gly Glu Thr 450 455 460 Ala Asp Thr Met Leu Ala Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu 465 470 475 480 Thr Val Gly Ile Val Asn Ser Val Gly Ser Ser Ile Ser Arg Val Thr 485 490 495 His Cys Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser 500 505 510 Thr Lys Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Phe Ala Leu 515 520 525 Ser Leu Ser Asp Asp Arg Val Ser Lys Met Glu Arg Arg Arg Glu Ile 530 535 540 Met Asn Gly Leu Arg Asn Ile Pro Asp Gln Ile Arg Glu Val Leu Ser 545 550 555 560 Leu Glu Pro Arg Ile Lys Glu Leu Cys Gln Gln Asp Leu Glu Glu His 565 570 575 Lys Ser Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Thr Ala Leu 580 585 590 Glu Gly Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly 595 600 605 Val Leu Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu 610 615 620 Gln Leu Pro Ile Ile Ala Phe Ala Thr Arg Asp Ser Leu Phe Pro Lys 625 630 635 640 Val Val Ser Thr Ile Glu Gln Val Thr Ala Arg Lys Gly His Pro Val 645 650 655 Ile Ile Cys Asn Lys Asn Asp Asp Val Trp Ala Lys Lys Ala Glu Thr 660 665 670 Lys Gln Leu Val Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln 675 680 685 Gly Leu Leu Asn Ile Ile Pro Leu Gln Leu Ile Ser Tyr Trp Leu Ala 690 695 700 Val Asn Arg Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser 705 710 715 720 Val Thr Val Glu <210> 31 <211> 721 <212> PRT <213> Zygosaccharomyces mellis Ca-7 <400> 31 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Thr Pro Asp 35 40 45 Lys Thr Leu Leu Tyr Lys Gln Ile Gly Lys Val Asp Ala Leu Lys Gln 50 55 60 Glu Ile Ala Arg Asp Ala Pro Glu Arg Asp Ile Ala Phe Ala Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Arg Gln 85 90 95 Ile Asn Cys His Pro Gln Arg Ser Asp Ser Gln Asn Ala Phe Thr Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Arg Thr Leu Leu 115 120 125 Ala Asn Arg Gly Tyr Thr Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Ile Leu Phe Lys His Leu Tyr Asp Glu Asn Leu Ser Asn Gly His 145 150 155 160 Glu Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Thr Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Val His Tyr Pro Glu Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Asp 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Ile Glu Phe Pro Asp Asp Thr 210 215 220 Ala Gly Lys Pro Asp Thr Pro Leu Gly Ser Lys Asn Ala Thr Pro Asn 225 230 235 240 Ala Ser Ser Arg Asn Leu Leu Asn Gly Asn Arg Arg Thr Arg Pro Phe 245 250 255 Asp Gly Asn Asn Leu Leu Pro Leu Thr Ala Asn Glu Phe Asn Leu Arg 260 265 270 His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Thr Pro Asn Pro 275 280 285 Val Glu Phe Phe Val Ser Ser Asp Ala Ala Ser Val Ile Lys His Thr 290 295 300 Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp 305 310 315 320 Gly Glu Leu His Ile His Arg Ser Arg Arg Pro Glu Val Gly Ala Ser 325 330 335 Met Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met 340 345 350 Lys Gly Pro Tyr Lys His Phe Met Gln Lys Glu Ile Phe Glu Gln Pro 355 360 365 Asp Ser Ala Leu Asn Thr Met Arg Gly Arg Ile Asp Phe Glu Asn Gly 370 375 380 Ser Ile Met Leu Gly Gly Leu Lys Ala Trp Leu Pro Ala Val Arg Arg 385 390 395 400 Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys 405 410 415 Leu Ala Thr Arg Ala Met Phe Glu Glu Leu Ser Glu Ile Pro Val Ser 420 425 430 Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg 435 440 445 Asp Asp Val Cys Cys Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr 450 455 460 Met Leu Ala Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Leu Gly 465 470 475 480 Ile Val Asn Ser Val Gly Ser Ser Ile Ser Arg Ala Thr His Cys Gly 485 490 495 Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala 500 505 510 Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser 515 520 525 Asp Asp Arg Val Ser Lys Ile Glu Arg Arg Lys Asp Ile Ile Arg Gly 530 535 540 Leu His Asn Ile Pro Asp Gln Ile Arg Glu Val Leu Gln Leu Glu Ser 545 550 555 560 Arg Ile Lys Glu Leu Cys Gln Asn Asp Leu Lys Asp His Lys Ser Leu 565 570 575 Leu Val Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly Ala 580 585 590 Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala 595 600 605 Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Gln Leu Pro 610 615 620 Ile Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser 625 630 635 640 Ser Ile Glu Gln Val Thr Ala Arg Lys Gly Arg Pro Ile Ile Ile Cys 645 650 655 Asn Thr Asn Asp Glu Val Trp Ala Lys Lys Ala Glu Thr Asn Lys Leu 660 665 670 Leu Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Leu 675 680 685 Asn Ile Ile Pro Leu Gln Leu Val Ser Tyr Trp Leu Ala Val Asn Arg 690 695 700 Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val 705 710 715 720 Glu <210> 32 <211> 716 <212> PRT <213> Eremothecium cymbalariae DBVPG#7215 <400> 32 Met Cys Gly Ile Phe Gly Tyr Cys Asn Phe Leu Val Glu Lys Ser Arg 1 5 10 15 Gly Glu Ile Ile Glu Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Glu Thr Phe Ile Phe Lys Gln Ile Gly Lys Val Leu Ala Leu Gln Lys 50 55 60 Glu Ile Asp Asp Met Gln Pro Arg Arg Asp Val Arg Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Gln Pro Arg Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Asp Gly Asn Glu Phe Val Ile 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Val Asn Lys Gly Tyr Glu Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Phe Lys His Leu Tyr His Thr Asn Leu Lys Asn Gly His 145 150 155 160 Glu Leu Asp Phe His Glu Leu Ser Lys Gln Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ser Arg Tyr Pro Gly Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Arg Arg Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Thr Asn 210 215 220 Lys Ala Ala Glu Val Pro Leu Ser Ser Asn Asn Gly Asp Ser Asn Asn 225 230 235 240 Arg His Asn Asp His His Lys Ala Asn Gly Asp Gly His Ala Asn Leu 245 250 255 Phe Pro Leu Thr Thr Gly Asn Glu Ser Gly Leu Arg His Ser Gln Ser 260 265 270 Arg Ala Phe Leu Ser Glu Asp Gly Val Pro Asn Pro Val Glu Phe Phe 275 280 285 Leu Ser Ser Asp Ala Ala Ser Val Ile Lys His Thr Lys Lys Val Leu 290 295 300 Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp Gly Glu Leu His 305 310 315 320 Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Ala Thr Arg Ser Ile 325 330 335 Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr Lys 340 345 350 His Phe Met Gln Lys Glu Ile Phe Glu Gln Pro Glu Ser Thr Leu Asn 355 360 365 Thr Met Arg Gly Arg Ile Asp Phe Glu Asn Asn Thr Val Met Leu Gly 370 375 380 Gly Leu Lys Ser Trp Leu Pro Ala Ile Arg Asn Ala Arg Arg Leu Thr 385 390 395 400 Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg Ala 405 410 415 Ile Phe Glu Glu Leu Ser Glu Ile Pro Val Ser Ile Glu Leu Ala Ser 420 425 430 Asp Phe Met Asp Arg Arg Cys Pro Val Phe Arg Asp Asp Val Cys Ile 435 440 445 Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu Asn 450 455 460 Tyr Cys Ile Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser Val 465 470 475 480 Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn Ala 485 490 495 Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln Tyr 500 505 510 Ile Ala Leu Val Met Leu Ala Leu Ser Leu Ser Asp Asp Arg Val Ser 515 520 525 Arg Ile Glu Arg Arg Lys Glu Ile Ile Gln Gly Leu Lys Lys Ile Pro 530 535 540 Asp Gln Ile Lys Glu Val Leu Gln Leu Glu Arg Gln Ile Lys Gln Leu 545 550 555 560 Cys Glu Asn Glu Leu Cys Asn Gln Lys Ser Leu Leu Leu Leu Gly Arg 565 570 575 Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly Ala Leu Lys Ile Lys Glu 580 585 590 Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys His 595 600 605 Gly Val Leu Ala Leu Val Asp Glu His Leu Pro Ile Ile Ala Phe Gly 610 615 620 Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln Val 625 630 635 640 Thr Ala Arg Lys Gly Arg Pro Ile Ile Ile Cys Asn Glu Asn Asp Asp 645 650 655 Val Trp Thr Lys Lys Ala Ala Ser Ser Asn Leu Val Thr Leu Glu Val 660 665 670 Pro Leu Thr Val Asp Cys Leu Gln Gly Leu Leu Asn Ile Ile Pro Leu 675 680 685 Gln Leu Thr Ala Tyr Trp Leu Ala Val Asn Asn Gly Ile Asp Val Asp 690 695 700 Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 33 <211> 704 <212> PRT <213> Kluyveromyces dobzhanskii CBS 2104 <400> 33 Met Cys Gly Ile Phe Gly Tyr Cys Asn Phe Leu Val Glu Lys Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Arg Glu Asp 35 40 45 Glu Thr Ser Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Lys 50 55 60 Glu Ile Glu Ala His Lys Pro Asn Arg Asp Ala His Phe Val Thr His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln 85 90 95 Val Asn Cys His Pro His Arg Ser Asp Pro Thr Gly Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Asp Leu Arg Gln Leu Leu 115 120 125 Ser Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Phe Lys His Ile Tyr Asp Thr Asn Met Lys Asn Gly His 145 150 155 160 Asp Pro Asp Phe His Glu Leu Thr Met Gln Val Leu Gln Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Thr His Tyr Pro Asn Glu Ile 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Ser Glu 210 215 220 Gln Leu Pro Asp Val Pro Val Asn Asn Glu Cys Asn Leu Leu Asn Glu 225 230 235 240 Ala Glu Arg Ser Leu Leu Pro Ile Ala Gly Asn Glu Ser Thr Leu Arg 245 250 255 Arg Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Ser Pro 260 265 270 Ile Glu Phe Phe Leu Ser Ser Asp Ala Ala Ser Ile Val Lys His Thr 275 280 285 Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp 290 295 300 Gly Glu Leu His Ile His Arg Ser Thr Lys Lys Leu Thr Glu Ser Ala 305 310 315 320 Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys 325 330 335 Gly Pro Tyr Lys His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu 340 345 350 Ser Thr Phe Asn Thr Met Arg Gly Arg Ile Asp Phe Glu His Asn Gln 355 360 365 Val Asn Leu Gly Gly Leu Lys Ser Arg Leu Pro Ala Ile Arg Lys Ala 370 375 380 Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu 385 390 395 400 Ala Thr Arg Ser Ile Phe Glu Glu Leu Thr Glu Ile Pro Val Ser Val 405 410 415 Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys Cys Pro Ile Phe Arg Asp 420 425 430 Asp Val Cys Ile Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met 435 440 445 Leu Ser Leu Asn Tyr Cys Leu Glu Arg Gly Ser Leu Thr Leu Gly Ile 450 455 460 Val Asn Ser Val Gly Ser Ser Ile Ser Arg Ser Thr His Cys Gly Val 465 470 475 480 His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr 485 490 495 Thr Ser Gln Tyr Ile Ala Leu Val Met Val Ala Leu Ser Leu Ser Asp 500 505 510 Asp Arg Leu Ser Lys Val Glu Arg Arg Asn Glu Ile Ile Gln Gly Leu 515 520 525 Lys Leu Ile Pro Gly Gln Ile Lys Ala Val Leu Asn Leu Glu Pro Arg 530 535 540 Val Lys Asp Leu Cys Ala Lys Glu Leu Lys Asn Gln Lys Ser Leu Leu 545 550 555 560 Leu Leu Gly Arg Gly Tyr Gln Phe Ala Thr Ala Leu Glu Gly Ala Leu 565 570 575 Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly 580 585 590 Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile 595 600 605 Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Leu Ser Ser 610 615 620 Ile Glu Gln Val Thr Ala Arg Lys Gly Arg Pro Ile Val Ile Cys Asn 625 630 635 640 Glu Asn Asp Glu Val Trp Gln Ser Lys Val Lys Thr His Asn Leu Val 645 650 655 Thr Leu Glu Val Pro His Thr Val Asp Cys Leu Gln Gly Leu Leu Asn 660 665 670 Val Ile Pro Leu Gln Leu Ile Ser Tyr Trp Leu Ala Val Asn Asn Gly 675 680 685 Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 690 695 700 <210> 34 <211> 704 <212> PRT <213> Kluyveromyces lactis strain NRRL Y-1140 <400> 34 Met Cys Gly Ile Phe Gly Tyr Cys Asn Phe Leu Val Glu Lys Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Arg Glu Asp 35 40 45 Glu Thr Val Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Lys 50 55 60 Glu Ile Glu Ala His Lys Pro Asn Arg Asp Ala His Phe Val Thr His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln 85 90 95 Val Asn Cys His Pro His Arg Ser Asp Pro Ser Gly Thr Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Asp Leu Arg Gln Leu Leu 115 120 125 Thr Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Phe Lys His Ile Tyr Asp Thr Asn Leu Lys Asn Gly His 145 150 155 160 Asp Pro Asp Phe His Glu Leu Thr Met Gln Val Leu Gln Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Thr His Tyr Pro Asn Glu Ile 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Ser Glu 210 215 220 Gln Leu Pro Asp Leu Pro Val Asn Asn Glu Cys Asn Leu Leu Asn Asp 225 230 235 240 Ala Asp Arg Ser Leu Leu Pro Leu Ala Gly Asp Glu Ser Thr Leu Arg 245 250 255 Arg Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Ser Pro 260 265 270 Ile Glu Phe Phe Leu Ser Ser Asp Ala Ala Ser Ile Val Lys His Thr 275 280 285 Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp 290 295 300 Gly Glu Leu His Ile His Arg Ala Asn Lys Lys Leu Thr Glu Ser Ala 305 310 315 320 Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys 325 330 335 Gly Pro Tyr Gln His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu 340 345 350 Ser Thr Leu Asn Thr Met Arg Gly Arg Ile Asp Phe Glu His Asn Leu 355 360 365 Val Asn Leu Gly Gly Leu Lys Ser Arg Leu Ser Ala Ile Arg Lys Ala 370 375 380 Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu 385 390 395 400 Ala Thr Arg Ala Ile Phe Glu Glu Leu Thr Glu Ile Pro Val Ser Val 405 410 415 Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys Cys Pro Ile Phe Arg Asp 420 425 430 Asp Val Cys Ile Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met 435 440 445 Leu Ser Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Leu Gly Ile 450 455 460 Val Asn Ser Val Gly Ser Ser Ile Ser Arg Ser Thr His Cys Gly Val 465 470 475 480 His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr 485 490 495 Thr Ser Gln Tyr Ile Ala Leu Val Met Val Ala Leu Ser Leu Ser Asp 500 505 510 Asp Arg Val Ser Lys Ile Glu Arg Arg Asn Glu Ile Ile Gln Gly Leu 515 520 525 Lys Leu Ile Pro Gly Gln Ile Lys Glu Val Leu Asn Val Glu Pro Arg 530 535 540 Ile Lys Glu Leu Cys Ala Lys Glu Leu Lys Asp Gln Lys Ser Leu Leu 545 550 555 560 Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly Ala Leu 565 570 575 Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly 580 585 590 Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Asp Leu Pro Ile 595 600 605 Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Leu Ser Ser 610 615 620 Ile Glu Gln Val Ile Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn 625 630 635 640 Glu Asn Asp Glu Val Trp Gln Asn Lys Ala Lys Ala Asn Asn Leu Ile 645 650 655 Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Leu Asn 660 665 670 Ile Ile Pro Leu Gln Leu Thr Ser Tyr Trp Leu Ala Val Asn Asn Gly 675 680 685 Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 690 695 700 <210> 35 <211> 703 <212> PRT <213> Eremothecium sinecaudum strain ATCC 58844 <400> 35 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Thr Arg 1 5 10 15 Gly Asp Val Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Asn Ala Gly 35 40 45 Glu Thr Phe Ile Phe Lys Gln Ile Gly Lys Val Ser Ala Leu Gln Lys 50 55 60 Glu Ile Asp Val Cys Lys Pro Asn Arg Asp Val Ser Phe Val Ser His 65 70 75 80 Cys Ala Ile Ala His Thr Arg Trp Ala Thr His Gly Gln Pro Arg Lys 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Glu Asn Asn Glu Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Val Asn Lys Gly Phe Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Phe Lys His Leu Tyr Asp Thr Asn Met Glu Asn Gly His 145 150 155 160 Glu Val Asp Phe His Glu Leu Ser Lys Gln Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Arg Ser Ser Arg Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Arg Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Asn Glu 210 215 220 Asp Lys Arg Glu Val Pro Leu Ala Ala Arg Asn Ser His His Lys Arg 225 230 235 240 Asn Glu Asn Leu Leu Pro Ile Thr Thr Thr Glu Ser His Leu Arg His 245 250 255 Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Ala Pro Asn Pro Val 260 265 270 Glu Phe Tyr Leu Ser Ser Asp Ala Ala Ser Val Ile Lys His Thr Lys 275 280 285 Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp Gly 290 295 300 Glu Leu His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Ala Thr 305 310 315 320 Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly 325 330 335 Pro Tyr Lys His Phe Met Gln Lys Glu Ile Phe Glu Gln Pro Glu Ser 340 345 350 Thr Leu Asn Thr Met Arg Gly Arg Ile Asp Phe Glu Asn Asn Thr Val 355 360 365 Met Leu Gly Gly Leu Lys Ser Trp Leu Pro Ala Ile Arg Asn Ala Arg 370 375 380 Arg Leu Thr Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Met Ala 385 390 395 400 Ala Arg Ala Ile Phe Glu Glu Leu Ser Glu Ile Leu Val Ser Ile Glu 405 410 415 Leu Ala Ser Asp Phe Leu Asp Arg Arg Cys Pro Val Phe Arg Asp Asp 420 425 430 Val Cys Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu 435 440 445 Ala Leu Asn Tyr Cys Ile Glu Arg Gly Ala Leu Thr Val Gly Ile Val 450 455 460 Asn Ser Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His 465 470 475 480 Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr 485 490 495 Ser Gln Tyr Ile Ala Leu Val Met Leu Ala Leu Ser Leu Ser Asp Asp 500 505 510 Arg Val Ser Arg Ile Glu Arg Arg Lys Glu Ile Ile Gln Gly Leu Lys 515 520 525 Lys Ile Pro Glu Gln Ile Lys Gln Val Leu Gln Leu Glu Ala Pro Ile 530 535 540 Lys Lys Leu Cys Glu Thr Glu Leu Val Asn Gln Lys Ser Leu Leu Leu 545 550 555 560 Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly Ala Leu Lys 565 570 575 Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu 580 585 590 Leu Lys His Gly Val Leu Ala Leu Val Asp Glu His Leu Pro Ile Ile 595 600 605 Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile 610 615 620 Glu Gln Ile Ile Ala Arg Lys Gly Arg Pro Ile Ile Ile Cys Asn Glu 625 630 635 640 Asn Asp Glu Val Trp Glu Lys Lys Ala Thr Thr Ala Glu Val Ile Thr 645 650 655 Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Leu Asn Ile 660 665 670 Ile Pro Leu Gln Leu Thr Ala Tyr Trp Leu Ala Val Asn Asn Gly Ile 675 680 685 Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 690 695 700 <210> 36 <211> 704 <212> PRT <213> Kluyveromyces lactis strain CBS 2105 <400> 36 Met Cys Gly Ile Phe Gly Tyr Cys Asn Phe Leu Val Glu Lys Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Arg Glu Asp 35 40 45 Glu Thr Val Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Lys 50 55 60 Glu Ile Glu Ala His Lys Pro Asn Arg Asp Ala His Phe Val Thr His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln 85 90 95 Val Asn Cys His Pro His Arg Ser Asp Pro Ser Gly Thr Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Asp Leu Arg Gln Leu Leu 115 120 125 Thr Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Phe Lys His Ile Tyr Asp Thr Asn Leu Lys Asn Gly His 145 150 155 160 Asp Pro Asp Phe His Glu Leu Thr Met Gln Val Leu Gln Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Thr His Tyr Pro Asn Glu Ile 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Ser Glu 210 215 220 Gln Leu Pro Asp Leu Pro Val Asn Asn Glu Cys Asn Leu Leu Asn Asp 225 230 235 240 Ala Asp Arg Ser Leu Leu Pro Leu Ala Gly Asp Glu Ser Thr Leu Arg 245 250 255 Arg Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Ser Pro 260 265 270 Ile Glu Phe Phe Leu Ser Ser Asp Ala Ala Ser Ile Val Lys His Thr 275 280 285 Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp 290 295 300 Gly Glu Leu His Ile His Arg Ala Asn Lys Lys Leu Thr Glu Ser Ala 305 310 315 320 Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys 325 330 335 Gly Pro Tyr Gln His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu 340 345 350 Ser Thr Leu Asn Thr Met Arg Gly Arg Ile Asp Phe Glu His Asn Leu 355 360 365 Val Asn Leu Gly Gly Leu Lys Ser Arg Leu Ser Ala Ile Arg Lys Ala 370 375 380 Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu 385 390 395 400 Ala Thr Arg Ala Ile Phe Glu Glu Leu Thr Glu Ile Pro Val Ser Val 405 410 415 Glu Leu Ala Ser Asp Phe Leu Asp Arg Lys Cys Pro Ile Phe Arg Asp 420 425 430 Asp Val Cys Ile Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met 435 440 445 Leu Ser Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Leu Gly Ile 450 455 460 Val Asn Ser Val Gly Ser Ser Ile Ser Arg Ser Thr His Cys Gly Val 465 470 475 480 His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr 485 490 495 Thr Ser Gln Tyr Ile Ala Leu Val Met Val Ala Leu Ser Leu Ser Asp 500 505 510 Asp Arg Val Ser Lys Ile Glu Arg Arg Asn Glu Ile Ile Gln Gly Leu 515 520 525 Lys Leu Ile Pro Gly Gln Ile Lys Glu Val Leu Asn Val Glu Pro Arg 530 535 540 Ile Lys Glu Leu Cys Ala Lys Glu Leu Lys Asp Gln Lys Ser Leu Leu 545 550 555 560 Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly Ala Leu 565 570 575 Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly 580 585 590 Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Asp Leu Pro Ile 595 600 605 Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Leu Ser Ser 610 615 620 Ile Glu Gln Val Ile Ala Arg Lys Gly His Pro Ile Val Ile Cys Asn 625 630 635 640 Glu Asn Asp Glu Val Trp Gln Asn Lys Ala Lys Ala Asn Asn Leu Ile 645 650 655 Thr Leu Glu Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Leu Asn 660 665 670 Ile Ile Pro Leu Gln Leu Thr Ser Tyr Trp Leu Ala Val Asn Asn Gly 675 680 685 Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 690 695 700 <210> 37 <211> 706 <212> PRT <213> Kluyveromyces marxianus DMKU3-1042 <400> 37 Met Cys Gly Ile Phe Gly Tyr Cys Asn Phe Leu Val Glu Lys Ser Arg 1 5 10 15 Gly Glu Ile Val Asp Thr Leu Val Glu Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Asp Glu Asp 35 40 45 Glu Thr Leu Ile Phe Lys Gln Ile Gly Lys Val Ser Ala Leu Gln Lys 50 55 60 Glu Ile Glu Lys His Asn Pro Asn Arg Asp Val His Phe Val Thr His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Glu Pro Lys Gln 85 90 95 Val Asn Cys His Pro His Arg Ser Asp Val Thr Cys Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Tyr Arg Asp Leu Arg Gln Leu Leu 115 120 125 Thr Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Phe Met His Ile Tyr Gln Thr Asn Leu Lys Asn Gly His 145 150 155 160 Asp Pro Asp Phe His Glu Leu Thr Lys Gln Val Leu Gln Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Thr His Tyr Pro Asn Glu Ile 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Met Lys Val Asp Phe Val Asp Val Glu Phe Pro Asp Ser Glu 210 215 220 Gln Met Pro Asp Val Pro Val Asn Asn Glu Cys Asn Leu Leu Asn Asp 225 230 235 240 Ala Glu Arg Ser Leu Leu Pro Leu Ala Gly Asn Glu Ser Thr Leu Arg 245 250 255 Arg Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Ser Pro 260 265 270 Ile Glu Phe Phe Leu Ser Ser Asp Ala Ala Ser Ile Val Lys His Thr 275 280 285 Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile Tyr Asp 290 295 300 Gly Glu Leu His Ile His Arg Ala Thr Asn Lys Leu Asn Glu Ser Ala 305 310 315 320 Thr Arg Ser Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys 325 330 335 Gly Pro Tyr Lys His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu 340 345 350 Ser Thr Leu Asn Thr Met Arg Gly Arg Ile Asp Phe Glu Thr Asn Thr 355 360 365 Val Thr Leu Gly Gly Leu Thr Ser Arg Leu Pro Ala Ile Arg Arg Ala 370 375 380 Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu 385 390 395 400 Ala Ala Arg Ala Ile Phe Glu Glu Leu Thr Glu Ile Pro Val Ser Val 405 410 415 Glu Leu Ala Ser Asp Phe Leu Asp Arg Arg Ala Pro Ile Phe Arg Asp 420 425 430 Asp Val Cys Ile Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met 435 440 445 Leu Ser Leu Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Leu Gly Ile 450 455 460 Val Asn Ser Val Gly Ser Ser Ile Ser Arg Gly Thr His Cys Gly Val 465 470 475 480 His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr 485 490 495 Thr Ser Gln Phe Ile Ala Leu Val Met Val Ala Leu Ser Leu Ser Asp 500 505 510 Asp Arg Leu Ser Lys Leu Glu Arg Arg Lys Glu Ile Ile Gln Gly Leu 515 520 525 Lys Leu Ile Pro Glu Gln Ile Lys Gln Val Leu Lys Leu Glu Ser Gln 530 535 540 Val Lys Asp Leu Cys Ser Asn Glu Leu Lys Asp Gln Lys Ser Leu Leu 545 550 555 560 Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly Ala Leu 565 570 575 Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly 580 585 590 Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile 595 600 605 Ile Ala Phe Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Leu Ser Ser 610 615 620 Ile Glu Gln Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn 625 630 635 640 Glu Asn Asp Glu Val Trp Glu Ala Lys Lys Lys Asn Ser Asn Gly Ser 645 650 655 Leu Val Thr Leu Glu Val Pro Arg Thr Val Asp Cys Leu Gln Gly Leu 660 665 670 Leu Asn Ile Ile Pro Leu Gln Leu Thr Ser Tyr Trp Leu Ala Val Asn 675 680 685 Asn Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr 690 695 700 Val Glu 705 <210> 38 <211> 723 <212> PRT <213> Tetrapisispora blattae CBS 6284 <400> 38 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Lys Thr Arg 1 5 10 15 Gly Glu Ile Ile Asp Ile Leu Val Glu Gly Leu Gly Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asn Gly Asp Lys Arg Asn 35 40 45 Ser Ile Asp Val Tyr Arg Ala Ile Gly Lys Val Ser Ala Leu Lys Gln 50 55 60 Glu Ile Asp Asn Ile Asn Pro Asn Arg Asp Val Thr Tyr Ala Ser His 65 70 75 80 Ser Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Gln Pro Lys Gln 85 90 95 Thr Asn Cys His Pro Gln Arg Ser Asp Pro Arg Asn Leu Phe Thr Ile 100 105 110 Ile His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Val Asn Lys Gly Tyr Thr Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Phe Leu His Leu Tyr Gln Thr Asn Ile Lys Met Gly Asn 145 150 155 160 Asp Ile Asp Phe His Glu Leu Thr Lys Leu Val Leu Met Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Val Tyr Phe Pro Gly Glu Ile 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Asn Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Asn Glu Asn 210 215 220 Ala Ile Gln Thr Glu Thr Pro Leu Ser Asn Glu Cys Lys Thr Asp Asn 225 230 235 240 Asn Asp Glu Leu Asn Ser Ser Asn Tyr Pro Thr Val Asp Lys Lys Glu 245 250 255 Phe His Glu Lys Ala Gly Leu Val Pro Ile Thr Ala Asn Glu Phe Asn 260 265 270 Leu Arg His Ser Gln Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro 275 280 285 Ile Pro Ile Glu Phe Phe Ile Ser Ser Asp Ala Ala Ser Val Ile Lys 290 295 300 Tyr Thr Lys Lys Val Leu Phe Leu Glu Asp Asp Asp Ile Ala His Ile 305 310 315 320 Tyr Asp Gly Glu Leu His Ile His Arg Ser Arg Lys Glu Val Gly Lys 325 330 335 Ser Met Ile Arg Ser Ile Gln Thr Leu Glu Leu Glu Leu Ala Gln Ile 340 345 350 Met Lys Gly Pro Tyr Glu His Phe Met Gln Lys Glu Ile Tyr Glu Gln 355 360 365 Pro Val Ser Thr Tyr Asn Thr Met Arg Gly Arg Leu Asp Phe Asp Asn 370 375 380 Asn Leu Val Asn Leu Gly Gly Leu Gln Gln Phe Ile Ser Thr Ile Arg 385 390 395 400 Arg Ala Arg Arg Leu Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser 405 410 415 Cys Leu Ala Thr Arg Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val 420 425 430 Asn Val Asp Leu Ala Ser Asp Phe Leu Asp Arg Lys Cys Pro Ile Phe 435 440 445 Arg Asp Asp Val Cys Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp 450 455 460 Thr Met Phe Ala Leu Asn Tyr Ala Ile Asp Arg Gly Ala Leu Thr Val 465 470 475 480 Gly Ile Val Asn Ser Val Gly Ser Ser Ile Ser Arg Ala Thr Asn Cys 485 490 495 Gly Val His Ile Asn Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys 500 505 510 Ala Tyr Thr Ser Gln Tyr Ile Ala Leu Val Met Phe Ala Val Leu Leu 515 520 525 Gly Glu Asp Arg Ile Ser Lys Asn Glu Arg Arg Arg Glu Ile Ile Gln 530 535 540 Gly Leu Lys Leu Ile Pro Glu Gln Ile Lys Gln Val Leu Lys Leu Glu 545 550 555 560 Pro Lys Ile Lys Gln Leu Cys Glu Asn Glu Leu Ser Asp Gln Lys Ser 565 570 575 Leu Leu Leu Leu Gly Arg Gly Tyr Gln Phe Ala Ser Ala Leu Glu Gly 580 585 590 Ala Leu Lys Ile Lys Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu 595 600 605 Ala Gly Glu Leu Lys His Gly Val Leu Ala Leu Val Asp Glu Glu Leu 610 615 620 Pro Ile Ile Ala Phe Gly Thr Arg Asp Tyr Leu Phe Pro Lys Val Val 625 630 635 640 Ser Ser Ile Glu Gln Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile 645 650 655 Cys Asn Glu Asn Asp Glu Val Trp Ser Lys Lys Lys Leu Glu Asn Asp 660 665 670 Arg Leu Ile Thr Leu Glu Val Pro Thr Thr Val Asp Cys Leu Gln Gly 675 680 685 Leu Ile Asn Ile Ile Pro Leu Gln Leu Met Ser Tyr Trp Leu Ala Ser 690 695 700 Asn Arg Gly Ile Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val 705 710 715 720 Thr Val Glu <210> 39 <211> 717 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 39 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Leu Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu His 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Arg Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Val Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 40 <211> 717 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 40 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu His 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Arg Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Val Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 41 <211> 717 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 41 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Leu Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu His 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Arg Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 42 <211> 717 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 42 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu His 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Arg Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 43 <211> 717 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 43 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Leu Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Arg Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Val Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 44 <211> 717 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 44 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Leu Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu His 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Val Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 45 <211> 717 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 45 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu His 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Val Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 46 <211> 717 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 46 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Arg Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Val Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 47 <211> 717 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 47 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Leu Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu His 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 48 <211> 717 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 48 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Leu Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Arg Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 49 <211> 717 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 49 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Leu Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Val Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 50 <211> 717 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 50 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Leu Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 51 <211> 717 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 51 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu His 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 52 <211> 717 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 52 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Arg Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Glu Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 53 <211> 717 <212> PRT <213> Artificial sequence <220> <223> synthetic sequence <400> 53 Met Cys Gly Ile Phe Gly Tyr Cys Asn Tyr Leu Val Glu Arg Ser Arg 1 5 10 15 Gly Glu Ile Ile Asp Thr Leu Val Asp Gly Leu Gln Arg Leu Glu Tyr 20 25 30 Arg Gly Tyr Asp Ser Thr Gly Ile Ala Ile Asp Gly Asp Glu Ala Asp 35 40 45 Ser Thr Phe Ile Tyr Lys Gln Ile Gly Lys Val Ser Ala Leu Lys Glu 50 55 60 Glu Ile Thr Lys Gln Asn Pro Asn Arg Asp Val Thr Phe Val Ser His 65 70 75 80 Cys Gly Ile Ala His Thr Arg Trp Ala Thr His Gly Arg Pro Glu Gln 85 90 95 Val Asn Cys His Pro Gln Arg Ser Asp Pro Glu Asp Gln Phe Val Val 100 105 110 Val His Asn Gly Ile Ile Thr Asn Phe Arg Glu Leu Lys Thr Leu Leu 115 120 125 Ile Asn Lys Gly Tyr Lys Phe Glu Ser Asp Thr Asp Thr Glu Cys Ile 130 135 140 Ala Lys Leu Tyr Leu His Leu Tyr Asn Thr Asn Leu Gln Asn Gly His 145 150 155 160 Asp Leu Asp Phe His Glu Leu Thr Lys Leu Val Leu Leu Glu Leu Glu 165 170 175 Gly Ser Tyr Gly Leu Leu Cys Lys Ser Cys His Tyr Pro Asn Glu Val 180 185 190 Ile Ala Thr Arg Lys Gly Ser Pro Leu Leu Ile Gly Val Lys Ser Glu 195 200 205 Lys Lys Leu Lys Val Asp Phe Val Asp Val Glu Phe Pro Glu Glu Asn 210 215 220 Ala Gly Gln Pro Glu Ile Pro Leu Lys Ser Asn Asn Lys Ser Phe Gly 225 230 235 240 Leu Gly Pro Lys Lys Ala Arg Glu Phe Glu Ala Gly Ser Gln Asn Ala 245 250 255 Asn Leu Leu Pro Ile Ala Ala Asn Glu Phe Asn Leu Arg His Ser Gln 260 265 270 Ser Arg Ala Phe Leu Ser Glu Asp Gly Ser Pro Thr Pro Val Glu Phe 275 280 285 Phe Val Ser Ser Asp Ala Ala Ser Val Val Lys His Thr Lys Lys Val 290 295 300 Leu Phe Leu Glu Asp Asp Asp Leu Ala His Ile Tyr Asp Gly Glu Leu 305 310 315 320 His Ile His Arg Ser Arg Arg Glu Val Gly Ala Ser Met Thr Arg Ser 325 330 335 Ile Gln Thr Leu Glu Met Val Leu Ala Gln Ile Met Lys Gly Pro Tyr 340 345 350 Asp His Phe Met Gln Lys Glu Ile Tyr Glu Gln Pro Glu Ser Thr Phe 355 360 365 Asn Thr Met Arg Gly Arg Ile Asp Tyr Glu Asn Asn Lys Val Ile Leu 370 375 380 Gly Gly Leu Lys Ala Trp Leu Pro Val Val Arg Arg Ala Arg Arg Leu 385 390 395 400 Ile Met Ile Ala Cys Gly Thr Ser Tyr His Ser Cys Leu Ala Thr Arg 405 410 415 Ala Ile Phe Glu Glu Leu Ser Asp Ile Pro Val Ser Val Glu Leu Ala 420 425 430 Ser Asp Phe Leu Asp Arg Lys Cys Pro Val Phe Arg Asp Asp Val Cys 435 440 445 Val Phe Val Ser Gln Ser Gly Glu Thr Ala Asp Thr Met Leu Ala Leu 450 455 460 Asn Tyr Cys Leu Glu Arg Gly Ala Leu Thr Val Gly Ile Val Asn Ser 465 470 475 480 Val Gly Ser Ser Ile Ser Arg Val Thr His Cys Gly Val His Ile Asn 485 490 495 Ala Gly Pro Glu Ile Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser Gln 500 505 510 Tyr Ile Ala Leu Val Met Phe Ala Leu Ser Leu Ser Asp Asp Arg Val 515 520 525 Ser Lys Ile Asp Arg Arg Ile Glu Ile Ile Gln Gly Leu Lys Leu Ile 530 535 540 Pro Gly Gln Ile Lys Gln Val Leu Lys Leu Glu Pro Arg Ile Lys Lys 545 550 555 560 Leu Cys Ala Thr Glu Leu Lys Asp Gln Lys Ser Leu Leu Leu Leu Gly 565 570 575 Arg Gly Tyr Gln Phe Ala Ala Ala Leu Glu Gly Ala Leu Lys Ile Lys 580 585 590 Glu Ile Ser Tyr Met His Ser Glu Gly Val Leu Ala Gly Glu Leu Lys 595 600 605 His Gly Val Leu Ala Leu Val Asp Glu Asn Leu Pro Ile Ile Ala Phe 610 615 620 Gly Thr Arg Asp Ser Leu Phe Pro Lys Val Val Ser Ser Ile Glu Gln 625 630 635 640 Val Thr Ala Arg Lys Gly His Pro Ile Ile Ile Cys Asn Glu Asn Asp 645 650 655 Glu Val Trp Ala Gln Lys Ser Lys Ser Ile Asp Leu Gln Thr Leu Glu 660 665 670 Val Pro Gln Thr Val Asp Cys Leu Gln Gly Leu Ile Asn Ile Ile Pro 675 680 685 Leu Gln Leu Met Ser Tyr Trp Leu Ala Val Asn Lys Gly Ile Asp Val 690 695 700 Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 705 710 715 <210> 54 <211> 348 <212> PRT <213> Neisseria meningitidis 35E <400> 54 Met Pro Ser Glu Ala Phe Arg Arg His Arg Ala Tyr Arg Glu Asn Lys 1 5 10 15 Leu Gln Pro Leu Val Ser Val Leu Ile Cys Ala Tyr Asn Val Glu Lys 20 25 30 Tyr Phe Ala Gln Ser Leu Ala Ala Val Val Asn Gln Thr Trp Cys Asn 35 40 45 Leu Asp Ile Leu Ile Val Asp Asp Gly Ser Thr Asp Gly Thr Leu Ala 50 55 60 Ile Ala Gln Arg Phe Gln Glu Gln Asp Gly Arg Ile Lys Ile Leu Ala 65 70 75 80 Gln Ala Gln Asn Ser Gly Leu Ile Pro Ser Leu Asn Ile Gly Leu Asp 85 90 95 Glu Leu Ala Lys Ser Gly Met Gly Glu Tyr Ile Ala Arg Thr Asp Ala 100 105 110 Asp Asp Ile Ala Ala Pro Asp Trp Ile Glu Lys Ile Val Gly Glu Met 115 120 125 Glu Lys Asp Arg Ser Ile Ile Ala Met Gly Ala Trp Leu Glu Val Leu 130 135 140 Ser Glu Glu Lys Asp Gly Asn Arg Leu Ala Arg His His Glu His Gly 145 150 155 160 Lys Ile Trp Lys Lys Pro Thr Arg His Glu Asp Ile Ala Asp Phe Phe 165 170 175 Pro Phe Gly Asn Pro Ile His Asn Asn Thr Met Ile Met Arg Arg Ser 180 185 190 Val Ile Asp Gly Gly Leu Arg Tyr Asn Thr Glu Arg Asp Trp Ala Glu 195 200 205 Asp Tyr Gln Phe Trp Tyr Asp Val Ser Lys Leu Gly Arg Leu Ala Tyr 210 215 220 Tyr Pro Glu Ala Leu Val Lys Tyr Arg Leu His Ala Asn Gln Val Ser 225 230 235 240 Ser Lys Tyr Ser Ile Arg Gln His Glu Ile Ala Gln Gly Ile Gln Lys 245 250 255 Thr Ala Arg Asn Asp Phe Leu Gln Ser Met Gly Phe Lys Thr Arg Phe 260 265 270 Asp Ser Leu Glu Tyr Arg Gln Ile Lys Ala Val Ala Tyr Glu Leu Leu 275 280 285 Glu Lys His Leu Pro Glu Glu Asp Phe Glu Arg Ala Arg Arg Phe Leu 290 295 300 Tyr Gln Cys Phe Lys Arg Thr Asp Thr Leu Pro Ala Gly Val Trp Leu 305 310 315 320 Asp Phe Ala Ala Asn Gly Arg Met Arg Arg Leu Phe Thr Leu Arg Gln 325 330 335 Tyr Phe Gly Ile Leu His Arg Leu Leu Lys Asn Arg 340 345 <210> 55 <211> 223 <212> PRT <213> Pasteurella multocida <400> 55 Met Thr Asn Ile Ala Ile Ile Pro Ala Arg Ala Gly Ser Lys Gly Ile 1 5 10 15 Pro Asp Lys Asn Leu Gln Pro Val Gly Gly His Ser Leu Ile Gly Arg 20 25 30 Ala Ile Leu Ala Ala Lys Asn Ala Asp Val Phe Asp Met Ile Val Val 35 40 45 Thr Ser Asp Gly Asp Asn Ile Leu Arg Glu Ala Glu Lys Tyr Gly Ala 50 55 60 Leu Ala Leu Lys Arg Pro Ala Glu Leu Ala Gln Asp Asn Ser Arg Thr 65 70 75 80 Ile Asp Ala Ile Leu His Ala Leu Glu Ser Leu Asn Ile Arg Glu Gly 85 90 95 Thr Cys Thr Leu Leu Gln Pro Thr Ser Pro Leu Arg Asp His Leu Asp 100 105 110 Ile Lys Asn Ala Met Asp Met Tyr Val Asn Gly Gly Val His Ser Val 115 120 125 Val Ser Ala Cys Glu Cys Glu His His Pro Tyr Lys Ala Phe Ala Leu 130 135 140 Ser Lys Asp His Glu Val Leu Pro Val Arg Glu Ile Ala Asp Phe Glu 145 150 155 160 Ala Ala Arg Gln Thr Leu Pro Lys Met Tyr Arg Ala Asn Gly Ala Ile 165 170 175 Tyr Ile Asn Asp Ile Ala Gln Leu Leu Lys Glu Lys Tyr Phe Phe Ile 180 185 190 Pro Pro Leu Lys Phe Tyr Leu Met Pro Thr Tyr Arg Ser Val Asp Ile 195 200 205 Asp Val Lys Gln Asp Leu Glu Leu Ala Glu Ile Leu Ser Asn Lys 210 215 220 <210> 56 <211> 371 <212> PRT <213> Neisseria meningitidis <400> 56 Met Gly Leu Lys Lys Ala Cys Leu Thr Val Leu Cys Leu Ile Val Phe 1 5 10 15 Cys Phe Gly Ile Phe Tyr Thr Phe Asp Arg Val Asn Gln Gly Glu Arg 20 25 30 Asn Ala Val Ser Leu Leu Lys Glu Lys Leu Phe Asn Glu Glu Gly Glu 35 40 45 Pro Val Asn Leu Ile Phe Cys Tyr Thr Ile Leu Gln Met Lys Val Ala 50 55 60 Glu Arg Ile Met Ala Gln His Pro Gly Glu Arg Phe Tyr Val Val Leu 65 70 75 80 Met Ser Glu Asn Arg Asn Glu Lys Tyr Asp Tyr Tyr Phe Asn Gln Ile 85 90 95 Lys Asp Lys Ala Glu Arg Ala Tyr Phe Phe His Leu Pro Tyr Gly Leu 100 105 110 Asn Lys Ser Phe Asn Phe Ile Pro Thr Met Ala Glu Leu Lys Val Lys 115 120 125 Ser Met Leu Leu Pro Lys Val Lys Arg Ile Tyr Leu Ala Ser Leu Glu 130 135 140 Lys Val Ser Ile Ala Ala Phe Leu Ser Thr Tyr Pro Asp Ala Glu Ile 145 150 155 160 Lys Thr Phe Asp Asp Gly Thr Gly Asn Leu Ile Gln Ser Ser Ser Tyr 165 170 175 Leu Gly Asp Glu Phe Ser Val Asn Gly Thr Ile Lys Arg Asn Phe Ala 180 185 190 Arg Met Met Ile Gly Asp Trp Ser Ile Ala Lys Thr Arg Asn Ala Ser 195 200 205 Asp Glu His Tyr Thr Ile Phe Lys Gly Leu Lys Asn Ile Met Asp Asp 210 215 220 Gly Arg Arg Lys Met Thr Tyr Leu Pro Leu Phe Asp Ala Ser Glu Leu 225 230 235 240 Lys Thr Gly Asp Glu Thr Gly Gly Thr Val Arg Ile Leu Leu Gly Ser 245 250 255 Pro Asp Lys Glu Met Lys Glu Ile Ser Glu Lys Ala Ala Lys Asn Phe 260 265 270 Lys Ile Gln Tyr Val Ala Pro His Pro Arg Gln Thr Tyr Gly Leu Ser 275 280 285 Gly Val Thr Thr Leu Asn Ser Pro Tyr Val Ile Glu Asp Tyr Ile Leu 290 295 300 Arg Glu Ile Lys Lys Asn Pro His Thr Arg Tyr Glu Ile Tyr Thr Phe 305 310 315 320 Phe Ser Gly Ala Ala Leu Thr Met Lys Asp Phe Pro Asn Val His Val 325 330 335 Tyr Ala Leu Lys Pro Ala Ser Leu Pro Glu Asp Tyr Trp Leu Lys Pro 340 345 350 Val Tyr Ala Leu Phe Thr Gln Ser Gly Ile Pro Ile Leu Thr Phe Asp 355 360 365 Asp Lys Asn 370 <210> 57 <211> 308 <212> PRT <213> Pasteurella multocida subsp. multocida str. Pm70 <400> 57 Met Asn Leu Ile Ile Cys Cys Thr Pro Leu Gln Val Leu Ile Ala Glu 1 5 10 15 Lys Ile Ile Ala Lys Phe Pro His Met Pro Phe Tyr Gly Val Met Leu 20 25 30 Ser Thr Val Ser Asn Lys Lys Phe Asp Phe Tyr Ala Lys Arg Leu Ala 35 40 45 Gln Gln Cys Gln Gly Phe Phe Ser Met Val Gln His Lys Asp Arg Phe 50 55 60 Asn Leu Leu Lys Glu Ile Leu Tyr Leu Lys Arg Thr Phe Ser Gly Lys 65 70 75 80 His Phe Asp Gln Val Phe Val Ala Asn Ile Asn Asp Leu Gln Ile Gln 85 90 95 Phe Leu Leu Ser Ala Ile Asp Phe Asn Leu Leu Asn Thr Phe Asp Asp 100 105 110 Gly Thr Ile Asn Ile Val Pro Asn Ser Leu Phe Tyr Gln Asp Asp Pro 115 120 125 Ala Thr Leu Gln Arg Lys Leu Ile Asn Val Leu Leu Gly Asn Lys Tyr 130 135 140 Ser Ile Gln Ser Leu Arg Ala Leu Ser His Thr His Tyr Thr Ile Tyr 145 150 155 160 Lys Gly Phe Lys Asn Ile Ile Glu Arg Val Glu Pro Ile Glu Leu Val 165 170 175 Ala Ala Asp Asn Ser Glu Lys Val Thr Ser Ala Val Ile Asn Val Leu 180 185 190 Leu Gly Gln Pro Val Phe Ala Glu Asp Glu Arg Asn Ile Ala Leu Ala 195 200 205 Glu Arg Val Ile Lys Gln Phe Asn Ile His Tyr Tyr Leu Pro His Pro 210 215 220 Arg Glu Lys Tyr Arg Leu Ala Gln Val Asn Tyr Ile Asp Thr Glu Leu 225 230 235 240 Ile Phe Glu Asp Tyr Ile Leu Gln Gln Cys Gln Thr His Lys Tyr Cys 245 250 255 Val Tyr Thr Tyr Phe Ser Ser Ala Ile Ile Asn Ile Met Asn Lys Ser 260 265 270 Asp Asn Ile Glu Val Val Ala Leu Lys Ile Asp Thr Glu Asn Pro Ala 275 280 285 Tyr Asp Ala Cys Tyr Asp Leu Phe Asp Glu Leu Gly Val Asn Val Ile 290 295 300 Asp Ile Arg Glu 305

Claims

적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 대사적으로 조작된 세포로서, 상기 세포는
(i) 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 발현할 수 있고, 바람직하게, 발현하고,
(ii) UDP-N-아세틸글루코사민 (UDP-GlcNAc)을 합성할 수 있고, 바람직하게, 합성하고,
(iii) 글리코실트랜스퍼라제를 발현할 수 있고, 바람직하게, 발현하고,
상기 세포는 상기 UDP-GlcNAc를 사용하여 상기 글리코실화된 생산물을 생산하는 것인, 세포.
제1항에 있어서, 상기 세포는 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 포함하는 적어도 하나의 유전자 발현 모듈에 의해 변형된 대사적으로 조작된 세포이고, 바람직하게 상기 발현 모듈로부터 발현은 항상성이거나 또는 비-화학적 유도 또는 억제 시에 조건적인 것인 세포.
제1항 또는 제2항에 있어서, 상기 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제는 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제 활성을 갖고,
(i) V12L, Q96H, Q157R 및/또는 E343V 돌연변이가 SEQ ID NO 01과 상이한 SEQ ID NO 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53 중 어느 하나에 따른 폴리펩티드 서열을 포함하거나, 또는
(ii) 각각, SEQ ID NO 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52 또는 53 중 어느 하나의 아미노산 서열에 대해서 적어도 200 아미노산 잔기 범위에 걸쳐서 적어도 80.0% 동일한 서열이고, V12L, Q96H, Q157R 및/또는 E343V 돌연변이가 SEQ ID NO 01과 상이한 아미노산 서열을 포함하거나 또는 그로 이루어지는 폴리펩티드인 단백질인, 세포.
제1항 내지 제3항 중 어느 하나의 항에 있어서, 상기 단당 서브유닛 중 적어도 하나는 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 및 N-글리코릴뉴라민산으로 이루어진 목록으로부터 선택되는 것인 세포.
제1항 내지 제4항 중 어느 하나의 항에 있어서, 상기 세포는 UDP-N-아세틸갈락토사민 (UDP-GalNAc), UDP-N-아세틸만노사민 (UDP-ManNAc), UDP-글루코스 (UDP-Glc), UDP-갈락토스 (UDP-Gal), GDP-만노스 (GDP-Man), UDP-글루쿠로네이트, UDP-갈락투로네이트, UDP-2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, UDP-2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, UDP-N-아세틸-L-람노사민 (UDP-L-RhaNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-만노스), dTDP-N-아세틸푸코사민, UDP-N-아세틸푸코사민 (UDP-L-FucNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-갈락토스), UDP-N-아세틸-L-뉴모사민 (UDP-L-PneNAC 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스), UDP-N-아세틸무람산, UDP-N-아세틸-L-퀴노보사민 (UDP-L-QuiNAc 또는 UDP-2-아세타미도-2,6-디데옥시-L-글루코스), CMP-시알산 (CMP-Neu5Ac), CMP-N-글리코릴뉴라민산 (CMP-Neu5Gc), GDP-푸코스 (GDP-Fuc), GDP-람노스 및 UDP-자일로스로 이루어진 목록으로부터 선택되는 뉴클레오티드-당을 추가로 합성하는 것인 세포.
제1항 내지 제5항 중 어느 하나의 항에 있어서, 상기 글리코실트랜스퍼라제는 푸코실트랜스퍼라제, 시알릴트랜스퍼라제, 갈락토실트랜스퍼라제, 글루코실트랜스퍼라제, 만노실트랜스퍼라제, N-아세틸글루코사미닐트랜스퍼라제, N-아세틸갈락토사미닐트랜스퍼라제, N-아세틸만노사미닐트랜스퍼라제, 자일로실트랜스퍼라제, 글루쿠로닐트랜스퍼라제, 갈락투로닐트랜스퍼라제, 글루코사미닐트랜스퍼라제, N-글리코릴뉴라미닐트랜스퍼라제, 람노실트랜스퍼라제, N-아세틸람노실트랜스퍼라제, UDP-4-아미노-4,6-디데옥시-N-아세틸-베타-L-알트로사민 트랜스아미나제, UDP-N-아세틸글루코사민 에놀피루빌 트랜스퍼라제 및 푸코사미닐트랜스퍼라제로 이루어진 목록으로부터 선택되고,
- 바람직하게, 상기 푸코실트랜스퍼라제는 알파-1,2-푸코실트랜스퍼라제, 알파-1,3-푸코실트랜스퍼라제, 알파-1,3/4-푸코실트랜스퍼라제, 알파-1,4-푸코실트랜스퍼라제 및 알파-1,6-푸코실트랜스퍼라제를 포함하는 목록으로부터 선택되고,
- 바람직하게, 상기 시알릴트랜스퍼라제는 알파-2,3-시알릴트랜스퍼라제, 알파-2,6-시알릴트랜스퍼라제 및 알파-2,8-시알릴트랜스퍼라제를 포함하는 목록으로부터 선택되고,
- 바람직하게, 상기 갈락토실트랜스퍼라제는 베타-1,3-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제, 베타-1,4-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제, 알파-1,3-갈락토실트랜스퍼라제 및 알파-1,4-갈락토실트랜스퍼라제를 포함하는 목록으로부터 선택되고,
- 바람직하게, 상기 글루코실트랜스퍼라제는 알파-글루코실트랜스퍼라제, 베타-1,2-글루코실트랜스퍼라제, 베타-1,3-글루코실트랜스퍼라제 및 베타-1,4-글루코실트랜스퍼라제를 포함하는 목록으로부터 선택되고,
- 바람직하게, 상기 만노실트랜스퍼라제는 알파-1,2-만노실트랜스퍼라제, 알파-1,3-만노실트랜스퍼라제 및 알파-1,6-만노실트랜스퍼라제를 포함하는 목록으로부터 선택되고,
- 바람직하게, 상기 N-아세틸글루코사미닐트랜스퍼라제는 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제 및 베타-1,6-N-아세틸글루코사미닐트랜스퍼라제를 포함하는 목록으로부터 선택되고,
- 바람직하게, 상기 N-아세틸갈락토사미닐트랜스퍼라제는 알파-1,3-N-아세틸갈락토사미닐트랜스퍼라제이고,
- 바람직하게, 상기 세포는 상기 글리코실트랜스퍼라제의 발현 또는 활성이 변형된 것인, 세포.
제1항 내지 제6항 중 어느 하나의 항에 있어서, 상기 세포는 글루코사민 6-포스페이트 N-아세틸트랜스퍼라제, 포스포아세틸글루코사민 뮤타제, UDP-N-아세틸글루코사민 파이로포스포릴라제, 갈락토시드 베타-1,3-N-아세틸글루코사미닐트랜스퍼라제, UTP--글루코스-1-포스페이트 우리딜릴트랜스퍼라제, UDP-글루코스 4-에피머라제, N-아세틸글루코사민 베타-1,3-갈락토실트랜스퍼라제, N-아세틸글루코사민 베타-1,4-갈락토실트랜스퍼라제, 락토스 퍼미아제, UDP-N-아세틸글루코사민 2-에피머라제, N-아세틸뉴라미네이트 신타제, N-아실뉴라미네이트 시티딜릴트랜스퍼라제, 글루코스-6-포스페이트 이소머라제 또는 UDP-2-아세타미도-2,6-디데옥시-L-탈로스 2-에피머라제를 포함하는 목록으로부터 선택되는 효소 중 어느 하나 이상을 추가로 발현하고,
바람직하게, 상기 세포는 상기 효소 중 적어도 하나의 발현 또는 활성이 변형된 것인, 세포.
제1항 내지 제7항 중 어느 하나의 항에 있어서, 상기 글리코실화된 생산물은 포유동물 모유 이당 또는 올리고당, 바람직하게 인간 모유 이당 또는 올리고당, O-항원, 엔테로박테리아 공통 항원 (ECA), 캡슐 다당류에 존재하는 올리고당 반복부, 펩티도글리칸 (PG) 및 인간 ABO식 혈액형 체계의 항원을 포함하는 목록으로부터 선택되는 것인 세포.
제1항 내지 제8항 중 어느 하나의 항에 있어서, 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 적어도 하나의 전구체를 사용하고, 바람직하게 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 둘 이상의 전구체를 사용하는 것인 세포.
제1항 내지 제9항 중 어느 하나의 항에 있어서, 상기 세포는 상기 글리코실화된 생산물의 합성을 위한 적어도 하나의 전구체를 생산하는 것인 세포.
제9항 또는 제10항에 있어서, 상기 글리코실화된 생산물의 합성을 위한 상기 전구체는 상기 글리코실화된 생산물로 완전하게 전환되는 것인 세포.
제1항 내지 제11항 중 어느 하나의 항에 있어서, 상기 세포는 세포 밖으로 적어도 하나의 이당 또는 올리고당을 배출하는 것인 세포.
제1항 내지 제12항 중 어느 하나의 항에 있어서, 상기 세포는 박테리아, 진균, 효모, 식물 세포, 동물 세포, 또는 원충 세포이고,
- 바람직하게 상기 박테리아는 에스케리치아 콜라이 (Escherichia coli) 균주, 보다 바람직하게 K-12 균주인 에스케리치아 콜라이 균주이고, 보다 더 바람직하게 에스케리치아 콜라이 K-12 균주는 이.콜라이 MG1655이고,
- 바람직하게 상기 진균은 리조푸스 (Rhizopus), 딕티오스텔리움 (Dictyostelium), 페니실리움 (Penicillium), 무코르 (Mucor) 또는 아스퍼질러스 (Aspergillus)를 포함하는 군으로부터 선택되는 속에 속하고,
- 바람직하게 상기 효모는 사카로마이세스 (Saccharomyces), 자이고사카로마이세스 (Zygosaccharomyces), 피키아 (Pichia), 코마가타엘라 (Komagataella), 한세눌라 (Hansenula), 클루이베로마이세스 (Kluyveromyces) 또는 데바로마이세스 (Debaromyces)를 포함하는 군으로부터 선택되는 속에 속하고,
- 바람직하게 상기 식물 세포는 조류 세포이거나 또는 담배, 알파파, 벼, 토마토, 목화, 유채, 대두, 옥수수, 또는 행운목으로부터 유래되고,
- 바람직하게 상기 동물 세포는 비-인간 포유동물, 조류, 어류, 무척추동물, 파충류, 양서류 또는 곤충으로부터 유래되거나 또는 배아 줄기 세포를 제외한 인간 세포로부터 유래되는 유전자 조작된 세포주이고, 보다 바람직하게 상기 인간 및 비-인간 포유동물 세포는 상피 세포, 배아 신장 세포, 섬유아세포, COS 세포, 중국 햄스터 난소 (CHO) 세포, 쥐 골수종 세포, NIH-3T3 세포, 비-유선 성체 줄기 세포 또는 이의 유도체이고, 보다 바람직하게 상기 곤충 세포는 스포돕테라 프루기페르다 (Spodoptera frugiperda), 봄빅스 모리 (Bombyx mori), 마메스트라 브라시카에 (Mamestra brassicae), 트리코플루시아 니 (Trichoplusia ni), 또는 드로소필라 멜라노가스터 (Drosophila melanogaster)로부터 유래되고,
- 바람직하게 상기 원충 세포는 리슈마니아 타렌톨라에 (Leishmania tarentolae) 세포인, 세포.
세포에 의해서 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물을 제조하는 방법으로서, 방법은
(a) 제1항 내지 제13항 중 어느 하나의 항에 따른 세포를 제공하는 단계, 및
(b) 상기 글리코실화된 생산물을 생산하도록 허용하는 조건 하에서 상기 세포를 배양하는 단계,
(c) 바람직하게, 상기 배양으로부터 상기 글리코실화된 생산물을 분리시키는 단계
를 포함하는 것인 제조 방법.
제14항에 있어서, 상기 배양 동안, 상기 세포는 세포 밖으로 상기 글리코실화된 생산물을 배출하는 것인 제조 방법.
제14항 또는 제15항에 있어서, 상기 분리는 하기 단계 중 적어도 하나를 포함하는 것인 제조 방법: 청징화, 한외여과, 나노여과, 2-층 분할법, 역삼투, 미세여과, 활성 차콜 또는 탄소 처리, 비이온성 계면활성제 처리, 효소 분해, 접선 유동 고-성능 여과, 접선 유동 한외여과, 친화성 크로마토그래피, 이온 교환 크로마토그래피, 소수성 상호작용 크로마토그래피 및/또는 겔 여과, 리간드 교환 크로마토그래피, 전기투석.
제14항 내지 제16항 중 어느 하나의 항에 있어서, 상기 세포로부터 상기 글리코실화된 생산물의 정제 단계를 더 포함하는 것인 제조 방법.
제17항에 있어서, 상기 정제는 하기 단계 중 적어도 하나를 포함하는 것인 제조 방법: 활성 차콜 또는 탄소의 사용, 차콜의 사용, 나노여과, 한외여과, 전기영동, 효소 처리 또는 이온 교환, 온도 조정, pH 조정, 알칼리 또는 산성 용액으로 pH 조정, 알콜의 사용, 수성 알콜 혼합물의 사용, 결정화, 증발, 침전, 건조, 분무 건조, 동결건조, 분무 냉동 건조, 냉동 분무 건조, 밴드 건조, 벨트 건조, 진공 밴드 건조, 진공 벨트 건조, 드럼 건조, 롤러 건조, 진공 드럼 건조 또는 진공 롤러 건조.
세포 밖으로 이당 또는 올리고당을 배출하는 효모 또는 진균 세포.
제19항에 있어서, 상기 이당 또는 올리고당은 N-아세틸글루코사민, N-아세틸만노사민, N-아세틸갈락토사민, 2-아세타미도-2,6-디데옥시--L-아라비노-4-헥술로스, 2-아세타미도-2,6-디데옥시--L-릭소-4-헥술로스, N-아세틸-L-람노사민, N-아세틸-D-푸코사민, N-아세틸-L-뉴모사민, N-아세틸무람산, N-아세틸-L-퀴노보사민, N-아세틸뉴라민산, 또는 N-글리코릴뉴라민산을 포함하는 목록으로부터 선택되는 적어도 하나의 단당 단위를 포함하는 것인 효모 또는 진균 세포.
제19항 또는 제20항에 있어서, 상기 세포는 제1항 내지 제13항 중 어느 하나의 항에 따른 대사적으로 조작된 세포인 효모 또는 진균 세포.
제1항 및 제3항 중 어느 하나의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 코딩하는 단리된 핵산 분자를 포함하는 벡터.
UDP-GlcNAc로부터 유래되고, 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 제1항 내지 제13항 및 제19항 내지 제21항 중 어느 하나의 항에 따른 세포의 용도.
UDP-GlcNAc로부터 유래되고, 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 제14항 내지 제18항 중 어느 하나의 항에 따른 방법의 용도.
UDP-GlcNAc로부터 유래되고, 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 제1항 및 제3항 중 어느 하나의 항의 변이체 효모 또는 진균 글루타민--프룩토스-6-포스페이트 아미노트랜스퍼라제를 코딩하는 단리된 핵산 분자의 용도.
UDP-GlcNAc로부터 유래되고, 적어도 2종의 상이한 단당 서브유닛으로 구성된 이당 또는 올리고당을 포함하는 글리코실화된 생산물의 생산을 위한 제22항에 따른 벡터의 용도.