KR20220158770A

KR20220158770A - 칸나비노이드 및 칸나비노이드 전구체의 생합성

Info

Publication number: KR20220158770A
Application number: KR1020227036684A
Authority: KR
Inventors: 킴 세실리아 앤더슨; 제프리 이안 보우처; 엘레나 브레브노바; 딜런 알렉산더 칼린; 브라이언 카발호; 니콜라스 플로레스; 카트리나 포레스트; 가브리엘 로드리구에즈; 미셸 스펜서
Original assignee: 징코 바이오웍스, 인크.
Priority date: 2020-03-26
Filing date: 2021-03-26
Publication date: 2022-12-01
Also published as: EP4127149A4; IL296717A; EP4127149A1; US20230137139A1; CA3176621A1; AU2021244264A1; WO2021195520A1; JP2023518826A

Abstract

본 개시내용의 양태는 재조합 세포에서 시험관내 칸나비노이드 및 칸나비노이드 전구체의 생합성에 관한 것이다.

Description

칸나비노이드 및 칸나비노이드 전구체의 생합성

관련 출원에 대한 상호 참조

본 출원은 2020년 3월 26일에 출원된 "칸나비노이드 및 칸나비노이드 전구체의 생합성"이라는 명칭의 미국 가출원 번호 63/000,419의 35 U.S.C. § 119(e)에 따른 이익을 주장하며, 그 전체 개시내용은 그 전체가 본원에 참조로 포함된다.

EFS-웹을 통한 텍스트 파일로서 제출된 서열 목록에 관한 참조

본 출원은 EFS-웹을 통해 ASCII 형식으로 제출된 서열 목록을 포함하며, 그 전체가 본원에 참조로 포함된다. 2021년 3월 24일에 생성된 상기 ASCII 파일의 이름은 G091970059WO00-SEQ-OMJ.txt이며, 크기는 526 킬로바이트이다.

발명의 분야

본 개시내용은 재조합 세포에서와 같이 칸나비노이드 및 칸나비노이드 전구체의 생합성에 관한 것이다.

칸나비노이드는 엔도칸나비노이드 수용체에 대한 리간드 역할을 할 수 있는 화합물이며 다양한 의학적 용도를 가지고 있다. 전통적으로, 칸나비노이드는 대마초(Cannabis) 속의 식물로부터 단리되었다. 칸나비노이드를 생성하기 위한 식물의 사용은 비효율적이지만, 다른 칸나비노이드는 전형적으로 대마초 식물에서 매우 낮은 농도로 생성되기 때문에 단리된 생성물은 종종 가장 만연한 2개의 내인성 칸나비노이드인 THC 및 CBD로 제한된다. 또한, 대마초 식물의 재배는 많은 관할 구역(jurisdiction)에서 제한된다. 또한, 일관된 결과를 얻기 위해, 대마초 식물은 종종 창문이 없는 실내 재배실(indoor grow room)과 같은 통제된 환경에서 재배되어 조명, 온도, 습도, 기류 등과 같은 재배 조건을 유연하게 조절한다. 이러한 통제된 환경에서 대마초 식물을 재배하면 특히 식물이 소량만 생성하는 희귀한 칸나비노이드의 경우 생성되는 칸나비노이드 그램당 높은 에너지 사용량을 초래할 수 있다. 예를 들어, 이러한 재배실의 조명은 고출력 나트륨 조명과 같은 인공 광원에 의해 제공된다. 많은 종류의 대마초가 하루에 18시간 이상의 조명을 필요로 하는 식물 주기를 가지고 있기 때문에 이러한 조명에 전력을 공급하면 상당한 에너지 소비를 초래할 수 있다. 건조된 대마초 꽃 형태(예를 들어, 임의의 추출 또는 정제 전)로 1 그램의 THC를 생성하기 위해 0.88 kWh와 1.34 kWh 사이의 에너지가 필요한 것으로 추정된다. 또한, 성장 시즌이 건기와 일치하여 물 사용량이 하천의 연결된 지표수에 영향을 미칠 수 있는 캘리포니아와 같은 특정 관할 구역의 농업 관행에 대한 우려가 제기되었다(Dillis, Christopher, Connor McIntee, Van Butsic, Lance Le, Kason Grady, and Theodore Grantham. "Water storage and Irrigation practices for cannabis drive seasonal patterns of water extraction and use in Northern California." Journal of Environmental Management 272 (2020): 110955).

칸나비노이드는 화학적 합성을 통해 생성될 수 있다(예를 들어, Souza 등의 미국 특허 번호 7,323,576 참조). 그러나 이러한 방법은 낮은 생산량과 높은 비용으로 인해 어려움을 겪고 있다. 조작된 유기체를 사용한 칸나비노이드, 칸나비노이드 유사체 및 칸나비노이드 전구체의 생성은 이러한 화합물에 대한 증가하는 수요를 충족시키기 위한 유리한 접근법을 제공할 수 있다.

요약

본 개시내용의 양태는 유전적으로 변형된 숙주 세포를 사용하여 지방산 기질로부터 칸나비노이드 및 칸나비노이드 전구체의 생성 방법을 제공한다.

본 개시내용의 양태는 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포에 관한 것으로, 여기서 TS는 서열번호 27 또는 25와 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일하거나 100% 동일한 서열을 포함하고, 여기서 숙주 세포는 적어도 하나의 칸나비노이드를 생성할 수 있다.

본 개시내용의 양태는 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포에 관한 것으로, 여기서 TS는 서열번호 27 또는 25와 적어도 90% 동일한 서열을 포함하고, 여기서 숙주 세포는 적어도 하나의 칸나비노이드를 생성할 수 있다.

일부 구현예에서, 서열번호 27의 서열에 비해, TS는 서열번호 27의 위치 33, 39, 55, 57, 61, 62, 63, 71, 112, 122, 126, 129, 131, 180, 183, 202, 256, 257, 260, 287, 295, 341, 386, 392, 394, 398, 410, 423, 426, 450, 및/또는 472에 상응하는 잔기에서 아미노산 치환을 포함한다.

일부 구현예에서, TS는 서열번호 27의 위치 33에 상응하는 잔기에서 아미노산 D; 서열번호 27의 위치 39에 상응하는 잔기에서 아미노산 F; 서열번호 27의 위치 55에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 57에 상응하는 잔기에서 아미노산 Q 또는 E; 서열번호 27의 위치 61에 상응하는 잔기에서 아미노산 A; 서열번호 27의 위치 62에 상응하는 잔기에서 아미노산 I; 서열번호 27의 위치 63에 상응하는 잔기에서 아미노산 I; 서열번호 27의 위치 71에 상응하는 잔기에서 아미노산 I; 서열번호 27의 위치 112에 상응하는 잔기에서 아미노산 V 또는 T; 서열번호 27의 위치 122에 상응하는 잔기에서 아미노산 S, G, A 또는 E; 서열번호 27의 위치 126에 상응하는 잔기에서 아미노산 A, R, T, K, 또는 D; 서열번호 27의 위치 129에 상응하는 잔기에서 아미노산 W; 서열번호 27의 위치 131에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 180에 상응하는 잔기에서 아미노산 T; 서열번호 27의 위치 183에 상응하는 잔기에서 아미노산 T; 서열번호 27의 위치 202에 상응하는 잔기에서 아미노산 S 또는 G; 서열번호 27의 위치 256에 상응하는 잔기에서 아미노산 F 또는 M; 서열번호 27의 위치 257에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 260에 상응하는 잔기에서 아미노산 M 또는 F; 서열번호 27의 위치 287에 상응하는 잔기에서 아미노산 R; 서열번호 27의 위치 295에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 341에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 386에 상응하는 잔기에서 아미노산 A; 서열번호 27의 위치 392에 상응하는 잔기에서 아미노산 H; 서열번호 27의 위치 394에 상응하는 잔기에서 아미노산 T; 서열번호 27의 위치 398에 상응하는 잔기에서 아미노산 F, T, A, 또는 L; 서열번호 27의 위치 410에 상응하는 잔기에서 아미노산 N; 서열번호 27의 위치 423에 상응하는 잔기에서 아미노산 A; 서열번호 27의 위치 426에 상응하는 잔기에서 아미노산 Y; 서열번호 27의 위치 450에 상응하는 잔기에서 아미노산 K; 및/또는 서열번호 27의 위치 472에 상응하는 잔기에서 아미노산 R 또는 A를 포함한다.

일부 구현예에서, TS는 서열번호 27의 서열에 비해 하기 아미노산 치환: T33D; Y39F; T55S; A57Q; A57E; G61A; V62I; V63I; Y71I; E112V; E112T; N122S; N122G; N122A; N122E; I126A; I126R; I126T; I126K; I126D; Y129W; N131S; S180T; R183T; N202S; N202G; Y256F; Y256M; N257S; V260M; V260F; H287R; N295S; A341S; V386A; L392H; M394T; V398F; V398T; V398A; V398L; D410N; S423A; H426Y; R450K; P472R; 및/또는 P472A 중 하나 이상을 포함한다.

일부 구현예에서, 칸나비노이드는 CBC 유형 칸나비노이드이다. 일부 구현예에서, 칸나비노이드는 칸나비크로멘산(CBCA) 및/또는 칸나비크로메바린산(CBCVA)이다. 일부 구현예에서, 숙주 세포는 테트라하이드로칸나비놀산(THCA), 칸나비디올산(CBDA) 및/또는 테트라하이드로칸나비바린산(THCVA) 중 하나 이상을 추가로 생성한다.

일부 구현예에서, TS는 대조군 TS보다 더 높은 비율의 CBCA:CBDA, CBCA:THCA, 및/또는 CBCVA:THCVA를 생성한다. 일부 구현예에서, 대조군 TS는 서열번호 20, 23, 25 또는 27의 서열을 포함하는 TS이다. 일부 구현예에서, TS는 서열번호 27에 비해 하기 아미노산 치환: A57Q 및 G61A; Y71I; 및/또는 V260F 중 하나 이상을 포함한다. 일부 구현예에서, TS는 대조군 TS보다 CBC 유형 칸나비노이드에 대해 더 높은 생성물 특이성을 갖는다. 일부 구현예에서, 대조군 TS는 서열번호 20, 23, 25 또는 27의 서열을 포함하는 TS이다. 일부 구현예에서, TS는 서열번호 27의 서열에 비해 Y39F 및/또는 V63I를 포함한다.

일부 구현예에서, TS는 서열번호 25, 27, 105, 126, 134, 155, 162, 164, 또는 165 중 어느 하나의 서열을 포함하고, 임의로 여기서 서열번호 27의 서열에 비해, TS는 서열번호 27의 위치 33, 39, 55, 57, 61, 62, 63, 71, 112, 122, 126, 129, 131, 180, 183, 202, 256, 257, 260, 287, 295, 341, 386, 392, 394, 398, 410, 423, 426, 450, 및/또는 472에 상응하는 잔기에서 아미노산 치환을 포함한다. 일부 구현예에서, TS의 서열은 하기 모티프 중 하나 이상을 포함한다: KVQARSGGH(서열번호 174); RASNTQNQD[VI][FL]FA[VI]K(서열번호 176); CPTI[KR]TGGH(서열번호 181); WFVTLSLEGGAINDV[AP]EDATAY[AG]H(서열번호 184); P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186); MKHF[TNS]QFSM(서열번호 189); P[EQ][TS]A[EAD][QE]IA[GA][VI]VKC(서열번호 193); RDCL[IV]SA[LV]GGN[SA]A[LH][AV][AV]F[PQ][ND][QE]LL[WY](서열번호 200); RT[EQ][PQ]APGLAVQYSY(서열번호 207); 및/또는 WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211).

본 개시내용의 추가 양태는 칸나비노이드를 생성하기 위한 숙주 세포에 관한 것으로, 여기서 숙주 세포는 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하고, 여기서 TS의 서열은 하기 모티프 중 하나 이상을 포함하고: KVQARSGGH(서열번호 174); RASNTQNQD[VI][FL]FA[VI]K(서열번호 176); CPTI[KR]TGGH(서열번호 181); WFVTLSLEGGAINDV[AP]EDATAY[AG]H(서열번호 184); P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCP DP[RK]M(서열번호 186); MKHF[TNS]QFSM(서열번호 189); P[EQ][TS]A[EAD][QE]IA[GA][VI]VKC(서열번호 193); RDCL[IV]SA[LV]GGN[SA]A[LH][AV][AV]F[PQ][ND][QE]LL[WY](서열번호 200); RT[EQ][PQ]APGLAVQYSY(서열번호 207); 및/또는 WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211), 여기서 숙주 세포는 적어도 하나의 칸나비노이드를 생성할 수 있다.

일부 구현예에서, 모티프 KVQARSGGH(서열번호 174)는 서열번호 27의 잔기 72-80에 상응하는 TS의 잔기에 위치하고; 모티프 RASNTQNQD[VI][FL]FA[VI]K(서열번호 176)는 서열번호 27의 잔기 183-197에 상응하는 TS의 잔기에 위치하고; 모티프 CPTI[KR]TGGH(서열번호 181)는 서열번호 27의 잔기 141-149에 상응하는 TS의 잔기에 위치하고; 모티프 WFVTLSLEGGAINDV[AP]EDATAY[AG]H(서열번호 184)는 서열번호 27의 잔기 360-383에 상응하는 TS의 잔기에 위치하고; 모티프 P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186)은 서열번호 27의 잔기 400-436에 상응하는 TS의 잔기에 위치하고; 모티프 MKHF[TNS]QFSM(서열번호 189)은 서열번호 27의 잔기 98-106에 상응하는 TS의 잔기에 위치하고; 모티프 P[EQ][TS]A[EAD][QE]IA[GA][VI]VKC(서열번호 193)는 서열번호 27의 잔기 53-65에 상응하는 TS의 잔기에 위치하고; 모티프 RDCL[IV]SA[LV]GGN[SA]A[LH][AV][AV]F[PQ][ND][QE]LL[WY](서열번호 200)는 서열번호 27의 잔기 10-32에 상응하는 TS의 잔기에 위치하고; 모티프 RT[EQ][PQ]APGLAVQYSY(서열번호 207)는 서열번호 27의 잔기 212-225에 상응하는 TS의 잔기에 위치하고/하거나; 모티프 WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211)은 서열번호 27의 잔기 242-259에 상응하는 TS의 잔기에 위치한다.

일부 구현예에서, TS는 진균 TS 또는 이의 보존적으로 치환된 버전이다. 일부 구현예에서, TS는 아스페르길루스 TS 또는 이의 보존적으로 치환된 버전이다. 일부 구현예에서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함한다. 일부 구현예에서, 서열번호 27의 서열에 비해, TS는 서열번호 27의 위치 33, 39, 55, 57, 61, 62, 63, 71, 112, 122, 126, 129, 131, 180, 183, 202, 256, 257, 260, 287, 295, 341, 386, 392, 394, 398, 410, 423, 426, 450, 및/또는 472에 상응하는 잔기에서 아미노산 치환을 포함한다. 일부 구현예에서, TS는 서열번호 27의 위치 33에 상응하는 잔기에서 아미노산 D; 서열번호 27의 위치 39에 상응하는 잔기에서 아미노산 F; 서열번호 27의 위치 55에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 57에 상응하는 잔기에서 아미노산 Q 또는 E; 서열번호 27의 위치 61에 상응하는 잔기에서 아미노산 A; 서열번호 27의 위치 62에 상응하는 잔기에서 아미노산 I; 서열번호 27의 위치 63에 상응하는 잔기에서 아미노산 I; 서열번호 27의 위치 71에 상응하는 잔기에서 아미노산 I; 서열번호 27의 위치 112에 상응하는 잔기에서 아미노산 V 또는 T; 서열번호 27의 위치 122에 상응하는 잔기에서 아미노산 S, G, A 또는 E; 서열번호 27의 위치 126에 상응하는 잔기에서 아미노산 A, R, T, K, 또는 D; 서열번호 27의 위치 129에 상응하는 잔기에서 아미노산 W; 서열번호 27의 위치 131에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 180에 상응하는 잔기에서 아미노산 T; 서열번호 27의 위치 183에 상응하는 잔기에서 아미노산 T; 서열번호 27의 위치 202에 상응하는 잔기에서 아미노산 S 또는 G; 서열번호 27의 위치 256에 상응하는 잔기에서 아미노산 F 또는 M; 서열번호 27의 위치 257에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 260에 상응하는 잔기에서 아미노산 M 또는 F; 서열번호 27의 위치 287에 상응하는 잔기에서 아미노산 R; 서열번호 27의 위치 295에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 341에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 386에 상응하는 잔기에서 아미노산 A; 서열번호 27의 위치 392에 상응하는 잔기에서 아미노산 H; 서열번호 27의 위치 394에 상응하는 잔기에서 아미노산 T; 서열번호 27의 위치 398에 상응하는 잔기에서 아미노산 F, T, A, 또는 L; 서열번호 27의 위치 410에 상응하는 잔기에서 아미노산 N; 서열번호 27의 위치 423에 상응하는 잔기에서 아미노산 A; 서열번호 27의 위치 426에 상응하는 잔기에서 아미노산 Y; 서열번호 27의 위치 450에 상응하는 잔기에서 아미노산 K; 및/또는 서열번호 27의 위치 472에 상응하는 잔기에서 아미노산 R 또는 A를 포함한다.

일부 구현예에서, TS는 서열번호 27의 서열에 비해 하기 아미노산 치환: T33D; Y39F; T55S; A57Q; A57E; G61A; V62I; V63I; Y71I; E112V; E112T; N122S; N122G; N122A; N122E; I126A; I126R; I126T; I126K; I126D; Y129W; N131S; S180T; R183T; N202S; N202G; Y256F; Y256M; N257S; V260M; V260F; H287R; N295S; A341S; V386A; L392H; M394T; V398F; V398T; V398A; V398L; D410N; S423A; H426Y; R450K; P472R; 및/또는 P472A 중 하나 이상을 포함한다. 일부 구현예에서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 143, 144, 155, 159, 162-167, 또는 172 중 어느 하나의 서열 또는 이의 보존적으로 치환된 버전을 포함한다.

본 개시내용의 추가 양태는 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포에 관한 것으로, 여기서 TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일하거나 100% 동일한 서열을 포함하고, 여기서 숙주 세포는 적어도 하나의 칸나비노이드를 생성할 수 있다.

본 개시내용의 추가 양태는 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포에 관한 것으로, 여기서 TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함하고, 여기서 숙주 세포는 적어도 하나의 칸나비노이드를 생성할 수 있다.

일부 구현예에서, 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열은 하나 이상의 신호 펩티드에 연결된다. 일부 구현예에서, 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열은 서열번호 16, 또는 서열번호 16의 서열에 비해 2개 이하의 아미노산 치환, 삽입, 부가 또는 결실을 갖는 서열을 포함하는 신호 펩티드에 연결된다. 일부 구현예에서, 신호 펩티드는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열의 N-말단에 연결된다. 일부 구현예에서, N-말단 메티오닌은 서열번호 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172로부터 제거되고, 여기서 메티오닌 잔기는 신호 펩티드의 N-말단에 부가된다. 일부 구현예에서, 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열은 서열번호 17, 또는 서열번호 17의 서열에 비해 1개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드에 연결된다. 일부 구현예에서, 서열번호 17, 또는 서열번호 17의 서열에 비해 1개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열의 C-말단에 연결된다.

일부 구현예에서, 서열번호 27의 서열에 비해, TS는 서열번호 27의 위치 33, 39, 55, 57, 61, 62, 63, 71, 112, 122, 126, 129, 131, 180, 183, 202, 256, 257, 260, 287, 295, 341, 386, 392, 394, 398, 410, 423, 426, 450, 및/또는 472에 상응하는 잔기에서 아미노산 치환을 포함한다. 일부 구현예에서, TS는 서열번호 27의 위치 33에 상응하는 잔기에서 아미노산 D; 서열번호 27의 위치 39에 상응하는 잔기에서 아미노산 F; 서열번호 27의 위치 55에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 57에 상응하는 잔기에서 아미노산 Q 또는 E; 서열번호 27의 위치 61에 상응하는 잔기에서 아미노산 A; 서열번호 27의 위치 62에 상응하는 잔기에서 아미노산 I; 서열번호 27의 위치 63에 상응하는 잔기에서 아미노산 I; 서열번호 27의 위치 71에 상응하는 잔기에서 아미노산 I; 서열번호 27의 위치 112에 상응하는 잔기에서 아미노산 V 또는 T; 서열번호 27의 위치 122에 상응하는 잔기에서 아미노산 S, G, A 또는 E; 서열번호 27의 위치 126에 상응하는 잔기에서 아미노산 A, R, T, K, 또는 D; 서열번호 27의 위치 129에 상응하는 잔기에서 아미노산 W; 서열번호 27의 위치 131에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 180에 상응하는 잔기에서 아미노산 T; 서열번호 27의 위치 183에 상응하는 잔기에서 아미노산 T; 서열번호 27의 위치 202에 상응하는 잔기에서 아미노산 S 또는 G; 서열번호 27의 위치 256에 상응하는 잔기에서 아미노산 F 또는 M; 서열번호 27의 위치 257에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 260에 상응하는 잔기에서 아미노산 M 또는 F; 서열번호 27의 위치 287에 상응하는 잔기에서 아미노산 R; 서열번호 27의 위치 295에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 341에 상응하는 잔기에서 아미노산 S; 서열번호 27의 위치 386에 상응하는 잔기에서 아미노산 A; 서열번호 27의 위치 392에 상응하는 잔기에서 아미노산 H; 서열번호 27의 위치 394에 상응하는 잔기에서 아미노산 T; 서열번호 27의 위치 398에 상응하는 잔기에서 아미노산 F, T, A, 또는 L; 서열번호 27의 위치 410에 상응하는 잔기에서 아미노산 N; 서열번호 27의 위치 423에 상응하는 잔기에서 아미노산 A; 서열번호 27의 위치 426에 상응하는 잔기에서 아미노산 Y; 서열번호 27의 위치 450에 상응하는 잔기에서 아미노산 K; 및/또는 서열번호 27의 위치 472에 상응하는 잔기에서 아미노산 R 또는 A를 포함한다. 일부 구현예에서, TS는 서열번호 27의 서열에 비해 하기 아미노산 치환: T33D; Y39F; T55S; A57Q; A57E; G61A; V62I; V63I; Y71I; E112V; E112T; N122S; N122G; N122A; N122E; I126A; I126R; I126T; I126K; I126D; Y129W; N131S; S180T; R183T; N202S; N202G; Y256F; Y256M; N257S; V260M; V260F; H287R; N295S; A341S; V386A; L392H; M394T; V398F; V398T; V398A; V398L; D410N; S423A; H426Y; R450K; P472R; 및/또는 P472A 중 하나 이상을 포함한다.

일부 구현예에서, 이종 폴리뉴클레오티드는 서열번호 26, 28, 35, 42, 56, 60, 64, 74, 85, 89, 92, 93, 94, 95, 96, 97, 및 102 중 어느 하나와 적어도 90% 동일한 서열을 포함한다. 일부 구현예에서, TS 서열은 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167 및 172 중 어느 하나를 포함한다.

본 개시내용의 추가 양태는 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포에 관한 것으로, 여기서 TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함하거나, 여기서 숙주 세포는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나의 보존적으로 치환된 버전을 포함한다.

본 개시내용의 추가 양태는 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포에 관한 것으로, 여기서 숙주 세포는 적어도 하나의 칸나비노이드를 생성할 수 있고, 여기서 TS는 진균 TS 또는 이의 보존적으로 치환된 버전이다. 일부 구현예에서, 진균 TS는 아스페르길루스 TS 또는 이의 보존적으로 치환된 버전이다. 일부 구현예에서, 칸나비노이드는 CBC 유형 칸나비노이드이다. 일부 구현예에서, 칸나비노이드는 칸나비크로멘산(CBCA) 및/또는 칸나비크로메바린산(CBCVA)이다. 일부 구현예에서, 숙주 세포는 테트라하이드로칸나비놀산(THCA), 칸나비디올산(CBDA) 및/또는 테트라하이드로칸나비바린산(THCVA) 중 하나 이상을 추가로 생성한다.

일부 구현예에서, 숙주 세포는 식물 세포, 조류 세포, 효모 세포, 박테리아 세포, 또는 동물 세포이다. 일부 구현예에서, 숙주 세포는 효모 세포이다. 일부 구현예에서, 효모 세포는 사카로마이세스(Saccharomyces) 세포, 야로위아(Yarrowia) 세포, 코마가타엘라(Komagataella) 세포, 또는 피키아(Pichia) 세포이다. 일부 구현예에서, 사카로마이세스 세포는 사카로마이세스 세레비지아에(Saccharomyces cerevisiae) 세포이다. 일부 구현예에서, 숙주 세포는 박테리아 세포이다. 일부 구현예에서, 박테리아 세포는 이. 콜라이(E. coli) 세포이다. 일부 구현예에서, 숙주 세포는 아실 활성화 효소(AAE), 폴리케타이드 신타제(PKS), 폴리케타이드 사이클라제(PKC), 프레닐트랜스퍼라제(PT), 및/또는 추가 말단 신타제(TS) 중 하나 이상을 코딩하는 하나 이상의 이종 폴리뉴클레오티드를 추가로 포함한다. 일부 구현예에서, PKS는 올리베톨 신타제(OLS) 또는 디바리놀 신타제이다. 본 개시내용의 추가 양태는 본 개시내용과 관련된 임의의 숙주 세포를 배양하는 단계를 포함하는 방법에 관한 것이다.

본 개시내용의 추가 양태는 CBG 유형 칸나비노이드를 말단 신타제(TS)와 접촉시키는 단계를 포함하는, 칸나비노이드를 생성하는 방법에 관한 것으로, 여기서 TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함한다. 일부 구현예에서, CBG 유형 칸나비노이드를 TS와 접촉시키는 단계는 시험관내에서 발생한다. 일부 구현예에서, CBG 유형 칸나비노이드를 TS와 접촉시키는 단계는 생체내에서 발생한다. 일부 구현예에서, CBG 유형 칸나비노이드를 TS와 접촉시키는 단계는 숙주 세포에서 발생한다. 본 개시내용의 추가 양태는 칸나비노이드 생성 방법에 관한 것으로, CBG 유형 칸나비노이드를 CBD 유형 칸나비노이드, THC 유형 칸나비노이드 또는 둘 모두와 비교하여 CBG 유형 칸나비노이드를 CBC 유형 칸나비노이드로 우선적으로 전환하도록 적응된 산화적 고리화 촉매와 생체내에서 접촉시키는 단계를 포함한다.

일부 구현예에서, 칸나비노이드는 CBG 유형 칸나비노이드의 고리화 생성물이다. 일부 구현예에서, 칸나비노이드는 고리화된 프레닐 모이어티를 갖는 칸나비노이드이다. 일부 구현예에서, 칸나비노이드는 CBC 유형 칸나비노이드, CBD 유형 칸나비노이드, 또는 THC 유형 칸나비노이드이다. 일부 구현예에서, 칸나비노이드는 CBC 유형 칸나비노이드이다. 일부 구현예에서, CBG 유형 칸나비노이드는 칸나비게롤산이다. 일부 구현예에서, CBC 유형 칸나비노이드는 CBCA이다. 일부 구현예에서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나의 서열 또는 이의 보존적으로 치환된 버전을 포함한다.

본 개시내용의 추가 양태는 CBG 유형 칸나비노이드, 및 CBG 유형 칸나비노이드, THC 유형 칸나비노이드, 또는 둘 모두와 비교하여 CBG 유형 칸나비노이드를 CBC 유형 칸나비노이드로 우선적으로 전환하도록 CBG 유형 칸나비노이드의 산화적 고리화를 촉매하는 수단을 포함하는 숙주 세포에 관한 것이다. 본 개시내용의 추가 양태는 CBG 유형 칸나비노이드, 및 CBG 유형 칸나비노이드, THC 유형 칸나비노이드, 또는 둘 모두와 비교하여 CBG 유형 칸나비노이드를 CBC 유형 칸나비노이드로 우선적으로 전환되도록 적응된 산화적 고리화 촉매를 포함하는 숙주 세포에 관한 것이다. 일부 구현예에서, CBC 유형 칸나비노이드를 생성하기 위해 CBG 유형 칸나비노이드의 산화적 고리화를 촉매하는 수단은 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드이고, 여기서 TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열 또는 이의 보존적으로 치환된 버전을 포함한다. 일부 구현예에서, TS는 또한 THCA, THCVA 또는 CBDA를 생성할 수 있다.

본 개시내용의 추가 양태는 말단 신타제(TS)를 코딩하는 비-자연 발생 핵산에 관한 것으로, 여기서 비-자연 발생 핵산은 서열번호 26, 28, 35, 42, 56, 60, 64, 74, 85, 89, 92, 93, 94, 95, 96, 97, 및 102 중 어느 하나와 적어도 90% 동일성을 갖는 서열을 포함한다. 본 개시내용의 추가 양태는 본 개시내용과 관련된 비-자연 발생 핵산을 포함하는 벡터에 관한 것이다. 본 개시내용의 추가 양태는 본 개시내용과 관련된 비-자연 발생 핵산을 포함하는 발현 카세트에 관한 것이다. 본 개시내용의 추가 양태는 본 개시내용과 관련된 비-자연 발생 핵산, 벡터, 또는 발현 카세트로 형질전환된 숙주 세포에 관한 것이다.

본 개시내용의 추가 양태는 칸나비노이드를 생성하기 위한 생물반응기에 관한 것으로, 여기서 생물반응기는 CBG 유형 칸나비노이드 및 말단 신타제(TS)를 포함하고, 여기서 TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함하거나, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나의 보존적으로 치환된 버전을 포함한다.

본 개시내용의 추가 양태는 비-자연 발생 말단 신타제(TS)에 관한 것으로, 여기서 TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함한다.

본 개시내용의 추가 양태는 THC 유형 화합물 또는 CBD 유형 화합물과 비교하여 생체내에서 CBG 유형 칸나비노이드를 CBC 유형 화합물로 우선적으로 전환하도록 적응된 산화적 고리화 촉매에 관한 것이다.

본 발명의 각각의 제한은 본 발명의 다양한 구현예를 포함할 수 있다. 따라서, 어느 하나의 요소 또는 요소들의 조합을 포함하는 본 발명의 각각의 제한이 본 발명의 각각의 양태에 포함될 수 있음이 예상된다. 본 개시내용은 하기의 설명에 기재되거나 도면에 도시된 구성의 세부사항 및 구성요소의 배열에 대한 이의 적용에 제한되지 않는다. 본 발명은 다른 구현예가 가능하고 다양한 방식으로 실시되거나 수행될 수 있다. 또한, 본 출원에서 사용되는 어구 및 용어는 설명을 위한 것이며 제한적으로 간주되어서는 안된다. "포함하는(including)", "포함하는(comprising)" 또는 "갖는(having)", "함유하는(containing)", "수반하는(involving)" 및 이들의 변형의 사용은 이후에 나열된 항목 및 이의 등가물뿐만 아니라 추가 항목을 포함하는 것을 의미한다.

첨부된 도면은 축척에 맞추어 그리려고 한 게 아니다. 도면에서, 다양한 도면에 도시된 동일하거나 거의 동일한 구성요소는 유사한 번호로 나타낸다. 명확성을 위해, 모든 구성요소가 모든 도면에서 표시될 수 있는 것은 아니다. 도면에서:
도 1은 (R1a) 아실 활성화 효소(AAE); (R2a) 올리베톨 신타제 효소(OLS); (R3a) 올리베톨산 사이클라제 효소(OAC); (R4a) 프레닐트랜스퍼라제 효소(PT); 및 (R5a) 말단 신타제 효소(TS)에 의해 매개되는 5개의 효소 단계를 포함하는 칸나비노이드 화합물의 생성을 위한 천연 대마초 생합성 경로를 도시하는 개략도이다. 화학식 1a-11a는 헥산산(1a), 헥사노일-CoA(2a), 말로닐-CoA(3a), 3,5,7-트리옥소도데카노일-CoA(4a), 올리베톨(5a), 올리베톨산(6a), 게라닐 피로포스페이트(7a), 칸나비게롤산(8a), 칸나비디올산(9a), 테트라하이드로칸나비놀산(10a), 및 칸나비크로멘산(11a)에 상응한다. 헥산산은 예시적인 카복실산 기질이고; 다른 카복실산도 사용될 수 있다(예를 들어, 부티르산, 이소발레르산, 옥탄산, 데칸산 등; 예를 들어, 하기 도 3 참조). 3,5,7-트리옥소도데카노일-CoA 및 올리베톨산의 합성을 촉매하는 효소는 각각 R2a 및 R3a에 나타내고, 3,5,7-트리옥소도데카노일-CoA 및 올리베톨산의 합성을 촉매하는 다기능 효소를 포함할 수 있다. 칸나비디올산, 테트라하이드로칸나비놀산, 및 칸나비크로멘산의 합성을 각각 촉매하는 효소 칸나비디올산 신타제(CBDAS), 테트라하이드로칸나비놀산 신타제(THCAS), 및 칸나비크로멘산 신타제(CBCAS)를 단계 R5a에 나타낸다. 도 1은 문헌(Carvalho et al. "Designing Microorganisms for Heterologous Biosynthesis of Cannabinoids" (2017) FEMS Yeast Research Jun 1;17(4))으로부터 적응되며 상기 문헌은 그 전체가 참조로 포함된다.
도 2는 (R1) 아실 활성화 효소(AAE); (R2) 폴리케타이드 신타제 효소(PKS) 또는 이기능성 폴리케타이드 신타제-폴리케타이드 사이클라제 효소(PKS-PKC); (R3) 폴리케타이드 사이클라제 효소(PKC) 또는 이기능성 PKS-PKC 효소; (R4) 프레닐트랜스퍼라제 효소(PT); 및 (R5) 말단 신타제 효소(TS)에 의해 매개되는 5개의 효소 단계를 포함하는 칸나비노이드 화합물의 생성을 위한 이종 생합성 경로를 도시하는 개략도이다. 다양한 사슬 길이, 구조(예를 들어, 지방족, 지환족, 또는 방향족) 및 기능화(예를 들어, 하이드록실-, 케토-, 아미노-, 티올-, 아릴-, 또는 알로게노-)의 임의의 카복실산이 또한 전구체 기질(예를 들어, 티오프로피온산, 하이드록시 페닐 아세트산, 노르류신, 브로모데칸산, 부티르산, 이소발레르산, 옥탄산, 데칸산 등)로서 사용될 수 있다.
도 3은 도 2의 칸나비노이드 경로에 대한 선택된 추정 전구체의 비배타적 표현이다.
도 4는 칸나비게롤산(화학식 (8a))의 게라닐 모이어티가 고리화되어 칸나비디올산, 테트라하이드로칸나비놀산, 또는 칸나비크로멘산을 생성하는 TS 효소에 의해 촉매되는 반응을 나타내는 개략도이다.
도 5는 TS를 코딩하는 전사 단위를 보유하는 플라스미드를 나타내는 개략도이다. TS 효소에 대한 코딩 서열("라이브러리 유전자"로 표시됨)은 GAL1 프로모터에 의해 구동되었다. 각각의 TS 효소는 N-말단 융합된 에스. 세레비지아에 교배 인자 알파 2 신호 펩티드("MFα2"로 표시됨) 및 C-말단 융합된 HDEL 신호 펩티드("LDEL"로 표시됨)를 보유했다.
도 6은 에스. 세레비지아에에서 생체내 활성 검정에 기초한 CBCA 생성에 대한 2차 스크리닝 데이터를 나타내는 그래프를 도시한다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는 아스페르길루스 니제르(Aspergillus niger)(에이. 니제르) CBCAS를 발현하는 하나의 라이브러리 균주인 균주 t619896은 CBCA를 생성하는 것으로 관찰되었다. GFP를 발현하는 균주 t616313은 음성 대조군으로 사용되었다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는 씨. 사티바(C. sativa) THCAS를 발현하는 균주 t616315는 THCAS 활성뿐만 아니라 CBCAS 활성을 나타내는 것으로 관찰되었기 때문에 양성 대조군으로서 사용되었다. 데이터는 4개의 생물학적 복제물의 평균 ± 평균에 대한 표준 편차 1을 나타낸다. 이러한 그래프로부터의 균주 ID 및 이들의 상응하는 활성을 표 5에 나타낸다.
도 7은 라이브러리 균주 t619896에 의한 에스. 세레비지아에에서의 생체내 활성 검정에 기초한 CBCVA의 생성을 나타내는 그래프를 도시한다. 데이터는 4개의 생물학적 복제물의 평균 ± 평균에 대한 표준 편차 1을 나타낸다. 이러한 그래프로부터 균주 ID 및 이들의 상응하는 활성을 표 6에 나타낸다.
도 8a-8c는 에스. 세레비지아에에서 생체내 활성 검정에 기초한 CBCA, THCA, 및 CBDA 생성에 대한 TS 변이체의 라이브러리의 2차 스크리닝 데이터를 나타내는 그래프를 도시한다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 씨. 사티바 THCAS를 발현하는 균주 t865843은 THCAS 활성에 대한 양성 대조군으로 사용되었다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 실시예 1에서 확인된 에이. 니제르 CBCAS를 발현하는 균주 t865768은 CBCAS 활성에 대한 양성 대조군으로 사용되었다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 씨. 사티바 CBDAS를 발현하는 균주 t876607은 CBDAS 활성에 대한 양성 대조군으로 사용되었다. GFP를 발현하는 균주 t865842는 음성 대조군으로 사용되었다. 모든 라이브러리 균주는 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하였다. 도 8a는 CBCA 생성을 나타내는 그래프를 도시한다. 도 8b는 THCA 생성을 나타내는 그래프를 도시한다. 도 8c는 CBDA 생성을 나타내는 그래프를 도시한다. 도 8a-8c에 도시된 균주 및 이들의 상응하는 활성을 표 8에 나타낸다.
도 9a-9c는 에스. 세레비지아에에서 생체내 활성 검정에 기초한 칸나비크로메바린산(CBCVA), 테트라하이드로칸나비바린산(THCVA), 및 칸나비디바린산(CBDVA) 생성에 대한 TS 변이체의 라이브러리의 2차 스크리닝 데이터를 나타내는 그래프를 도시한다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 씨. 사티바 THCAS를 발현하는 균주 t865843은 THCVAS 활성에 대한 양성 대조군으로 사용되었다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 실시예 1에서 확인된 에이. 니제르 CBCAS를 발현하는 균주 t865768은 CBCVAS 활성에 대한 양성 대조군으로 사용되었다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 씨. 사티바 CBDAS를 발현하는 균주 t876607은 CBDVAS 활성에 대한 양성 대조군으로 사용되었다. GFP를 발현하는 균주 t865842는 음성 대조군으로 사용되었다. 모든 라이브러리 균주는 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하였다. 도 9a는 CBCVA 생성을 나타내는 그래프를 도시한다. 도 9b는 THCVA 생성을 나타내는 그래프를 도시한다. 도 9c는 CBDVA 생성을 나타내는 그래프를 도시한다. 도 9a-9c에 도시된 균주 및 이들의 상응하는 활성을 표 9에 나타낸다.
도 10a-10c는 에스. 세레비지아에에서 생체내 활성 검정에 기초한 CBCA, THCA, 및 CBDA 생성에 대한 실시예 3에서 확인된 후보 CBCAS 효소의 2차 스크리닝 활성 데이터를 나타내는 그래프를 도시한다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 실시예 1에서 확인된 에이. 니제르 CBCAS를 발현하는 균주 t807925는 CBCAS 활성에 대한 양성 대조군으로 사용되었다. GFP를 발현하는 균주 t616313은 음성 대조군으로 사용되었다. 대마초 CBDAS를 발현하는 균주 t616314는 CBDAS 활성에 대한 양성 대조군으로 사용되었다. 대마초 THCAS를 발현하는 균주 t701870은 THCAS 활성에 대한 양성 대조군으로 사용되었다. 모든 라이브러리 균주 및 양성 대조군 균주는 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함한다. 데이터는 4개의 생물학적 복제물의 평균 ± 평균에 대한 표준 편차 1을 나타낸다. 도 10a는 CBCA 생성을 나타내는 그래프를 도시한다. 도 10b는 THCA 생성을 나타내는 그래프를 도시한다. 도 10c는 CBDA 생성을 나타내는 그래프를 도시한다. 도 10a-10c에 도시된 균주 및 이들의 상응하는 활성을 표 10에 나타낸다.
도 11a-11c는 에스. 세레비지아에에서 생체내 활성 검정에 기초한 CBCVA, THCVA, 및 CBDVA 생성에 대한 실시예 3에서 확인된 후보 CBCAS 효소의 2차 스크리닝 활성 데이터를 나타내는 그래프를 도시한다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 실시예 1에서 확인된 에이. 니제르 CBCAS를 발현하는 균주 t807925는 양성 대조군으로 사용되었다. GFP를 발현하는 균주 t616313은 음성 대조군으로 사용되었다. 대마초 CBDAS를 발현하는 균주 t616314는 양성 대조군으로 사용되었다. 대마초 THCAS를 발현하는 균주 t701870은 양성 대조군으로 사용되었다. 모든 라이브러리 균주 및 양성 대조군 균주는 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하였다. 데이터는 4개의 생물학적 복제물의 평균 ± 평균에 대한 표준 편차 1을 나타낸다. 도 11a는 CBCVA 생성을 나타내는 그래프를 도시한다. 도 11b는 THCVA 생성을 나타내는 그래프를 도시한다. 도 11c는 CBDVA 생성을 나타내는 그래프를 도시한다. 도 11a-11c에 도시된 균주 및 이들의 상응하는 활성을 표 11에 나타낸다.
도 12a-12b는 에스. 세레비지아에에서 생체내 활성 검정에 기초한 실시예 3에서 확인된 후보 CBCAS 효소에 의한 CBGA 및 CBGVA의 기질 이용을 나타내는 그래프를 도시한다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 실시예 1에서 확인된 에이. 니제르 CBCAS를 발현하는 균주 t807925는 양성 대조군으로 사용되었다. GFP를 발현하는 균주 t616313은 음성 대조군으로서 사용되었다. 모든 라이브러리 균주는 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하였다. 데이터는 4개의 생물학적 복제물의 평균 ± 평균에 대한 표준 편차 1을 나타낸다. 도 12a는 CBGA 기질 이용을 나타내는 그래프를 도시한다. 도 12b는 CBGVA 기질 이용을 나타내는 그래프를 도시한다. 도 12a-12b에 도시된 균주 및 이들의 상응하는 활성을 표 12에 나타낸다.
도 13은 실시예 3 및 4에서 확인된 후보 CBCAS 효소의 동일성 매트릭스 백분율을 도시한다. 맨 왼쪽 열과 맨 위 행은 특정 효소에 상응하는 서열 번호를 나열한다. 서열번호 27은 에이. 니제르로부터 UniProt 수탁 번호 A0A254UC34와 관련된 단백질 서열에 상응한다. 서열번호 144는 아마니타 무스카리아(Amanita muscaria)로부터의 UniProt 수탁 번호 A0A0C2SDS1과 관련된 단백질 서열에 상응하고; 서열번호 172는 페니실리움 루벤스(Penicillium rubens)로부터의 UniProt 수탁 번호 B6HV04와 관련된 단백질 서열에 상응하고; 서열번호 166은 아스페르길루스 테레우스(spergillus terreus)로부터의 UniProt 수탁 번호 Q0CYD9와 관련된 단백질 서열에 상응하고; 서열번호 159는 아스페르길루스 투르코수스(Aspergillus turcosus)로부터의 UniProt 수탁 번호 A0A397IKU4와 관련된 단백질 서열에 상응하고; 서열번호 167은 아스페르길루스 우다가와에(Aspergillus udagawae)로부터의 UniProt 수탁 번호 A0A0K8LLN9와 관련된 단백질 서열에 상응하고; 서열번호 163은 아스페르길루스 노보푸미가투스(Aspergillus novofumigatus)로부터의 UniProt 수탁 번호 A0A2I1CBC7과 관련된 단백질 서열에 상응하고; 서열번호 165는 아스페르길루스 니제르로부터의 UniProt 수탁 번호 G3Y7J1과 관련된 단백질 서열에 상응하고; 서열번호 162는 아스페르길루스 락티코페아투스(Aspergillus lacticoffeatus)로부터의 UniProt 수탁 번호 A0A319AGI5와 관련된 단백질 서열에 상응하고; 서열번호 164는 아스페르길루스 웰위치아에(Aspergillus welwitschiae)로부터의 UniProt 수탁 번호 A0A3F3PQ52와 관련된 단백질 서열에 상응하고; 서열번호 134는 아스페르길루스 아와모리(Aspergillus awamori)로부터의 UniProt 수탁 번호 A0A401KY63과 관련된 단백질 서열에 상응하고; 서열번호 105는 아스페르길루스 튜빙겐시스(Aspergillus tubingensis)로부터의 UniProt 수탁 번호 A0A1L9NII2와 관련된 단백질 서열에 상응하고; 서열번호 126은 아스페르길루스 네오니제르(Aspergillus neoniger)로부터의 UniProt 수탁 번호 A0A318Y6S9와 관련된 단백질 서열에 상응하고; 서열번호 155는 아스페르길루스 바덴시스(Aspergillus vadensis)로부터의 UniProt 수탁 번호 A0A319B6X5와 관련된 단백질 서열에 상응하고; 서열번호 112는 아스페르길루스 노미아에(Aspergillus nomiae)로부터의 UniProt 수탁 번호 A0A0L1J4J1과 관련된 단백질 서열에 상응하고; 서열번호 130은 아스페르길루스 오리자에(Aspergillus oryzae)로부터의 UniProt 수탁 번호 Q2UF91과 관련된 단백질 서열에 상응한다. 매트릭스의 각 셀에 있는 값은 상응하는 X 및 Y 축의 효소의 아미노산 서열 간의 동일성 백분율이다. 동일성이 100%인 셀은 흰색 텍스트와 함께 검은색으로 음영처리되고 동일성이 95-99.99%인 셀은 회색으로 음영처리된다.
도 14는 에스. 세레비지아에에서 생체내 활성 검정에 기초한 CBCA 생성에 대한 실시예 3에서 확인된 후보 CBCAS 효소의 2차 스크리닝 활성 데이터를 나타내는 그래프를 도시한다. N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는, 실시예 1에서 확인된 에이. 니제르 CBCAS("AnCBCAS"로 지칭됨)를 발현하는 균주 861555는 양성 대조군으로 사용되었다. 균주 861565는 실시예 1에서 확인된 에이. 니제르 CBCAS("AnCBCAS"로 지칭됨)를 발현하지만 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드는 제외된다. 모든 라이브러리 균주는 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 포함하는 하나의 균주 및 N-말단 융합된 MFα2 신호 펩티드 및 C-말단 융합된 HDEL 신호 펩티드를 제외한 다른 균주와 쌍으로 검정되었다. 데이터는 4개의 생물학적 복제물의 평균 ± 평균에 대한 표준 편차 1을 나타낸다. 도 14에 도시된 균주 및 이들의 상응하는 활성을 표 13에 나타낸다.
도 15는 CBCA를 생성하는 데 효과적인 것으로 밝혀진 후보 비-대마초 CBCAS가 풍부한 것으로 확인된 서열 모티프의 대마초 TS의 3차원 구조 내의 예측된 위치를 도시하는 리본 다이어그램이다. 화살표로 나타낸 서열 모티프 KVQARSGGH(서열번호 174), CPTI[KR]TGGH(서열번호 181), 및 P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186)은 보조인자 결합 부위와 접촉할 것으로 예측된다.
도 16은 CBCA를 생성하는 데 효과적인 것으로 밝혀진 후보 비-대마초 CBCAS가 풍부한 것으로 확인된 서열 모티프의 대마초 TS의 3차원 구조 내의 예측된 위치를 도시하는 리본 다이어그램이다. TS의 활성 부위는 짙은 회색으로 나타낸다. FAD 보조인자는 다이어그램의 오른쪽에 막대로 나타낸다. 도면의 중앙에 나타낸 삼각형 보이드가 기질 결합 부위이다. 화살표로 나타낸 모티프 RT[EQ][PQ]APGLAVQYSY(서열번호 207) 및 WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211)은 기질 결합 포켓 근처에 있을 것으로 예측된다.

상세한 설명

본 개시내용은 유전적으로 변형된 숙주 세포를 사용하여 지방산 기질로부터 칸나비노이드 및 칸나비노이드 전구체를 생성하는 방법을 제공한다. 상기 방법은 칸나비크로멘산 신타제(CBCAS)와 같은 말단 신타제(TS)의 이종 발현을 포함한다. 본 출원에는 에스. 세레비지아에와 같은 숙주 세포에서 기능적으로 발현될 수 있는 TS가 기재되어 있다. 실시예에 입증된 바와 같이, THCA, THCVA 및 CBDA와 같은 다른 TS 생성물뿐만 아니라 숙주 세포에서 칸나비크로멘산(CBCA) 및 칸나비크로메바린산(CBCVA)을 생성할 수 있는 다수의 비-대마초 CBCAS가 확인되었다. 본 개시내용에 기재된 TS는, 예를 들어, 이러한 효소의 활성 및/또는 풍부도를 변경함으로써 칸나비노이드 생성의 효율 및 순도를 증가시키는 데 유용할 수 있다.

정의

하기 용어들은 당업자에 의해 잘 이해되는 것으로 여겨지지만, 하기 정의는 개시된 주제에 대한 설명을 용이하게 하기 위해 기재되어 있다.

용어 "a" 또는 "an"은 하나 이상의 개체를 지칭하는데, 즉, 지시 대상을 복수로 식별할 수 있다. 따라서, 용어 "a" 또는 "an", "하나 이상" 및 "적어도 하나"는 본 출원에서 상호교환적으로 사용된다. 또한, 부정 관사 "a" 또는 "an"에 의한 "요소"에 대한 언급은 문맥상 요소가 하나이거나 하나만이 존재하도록 명확하게 요구하지 않는 한, 하나 초과의 요소가 존재할 가능성을 배제하지 않는다.

용어 "미생물(microorganism)" 또는 "미생물(microbe)"은 널리 받아들여져야 한다. 이러한 용어는 상호교환적으로 사용되며 2개의 원핵생물 도메인인 박테리아 및 고세균뿐만 아니라 특정 진핵생물 진균 및 원생생물을 포함하지만 이에 제한되지 않는다. 일부 구현예에서, 본 개시내용은 본 개시내용에 존재하는 목록/표 및 도면의 "미생물(microorganism)" 또는 "미생물(microbe)"을 지칭할 수 있다. 이러한 특성확인은 표와 도면의 확인된 분류학적 속뿐만 아니라 확인된 분류학적 종뿐만 아니라 표 또는 도면에 있는 임의의 유기체의 신규한 그리고 새로 확인되거나 설계된 다양한 균주를 참조할 수 있다. 동일한 특성확인은 실시예에서와 같이 명세서의 다른 부분에서 이러한 용어를 인용하는 경우에도 마찬가지이다.

용어 "원핵생물"은 당업계에서 인식되고 핵 또는 다른 세포 소기관을 포함하지 않는 세포를 지칭한다. 원핵생물은 일반적으로 박테리아 및 고세균이라는 두 도메인 중 하나로 분류된다.

"박테리아" 또는 "진정박테리아"는 원핵생물 유기체의 도메인을 지칭한다. 박테리아는 다음과 같이 적어도 11개의 별개의 군을 포함한다: (1) 그람-양성 (그람+) 박테리아로, 그 중 2개의 주요 하위분류가 있다: (a) 높은 G+C 군(액티노마이세티스(Actinomycetes), 마이코박테리아(Mycobacteria), 마이크로코커스(Micrococcus) 등) 및 (b) 낮은 G+C 군(바실러스(Bacillus), 클로스트리디아(Clostridia), 락토바실러스(Lactobacillus), 스타필로코시(Staphylococci), 스트렙토코시(Streptococci), 마이코플라스마(Mycoplasmas)); (2) 프로테오박테리아, 예를 들어, 보라색 광합성+비-광합성 그람-음성 박테리아(대부분의 "일반적인" 그람-음성 박테리아 포함); (3) 시아노박테리아, 예를 들어, 산소 광영양체(oxygenic phototroph); (4) 스피로케테스(Spirochetes) 및 관련 종; (5) 플랑토마이세스; (6)　박테로이데스(Bacteroides), 플라보박테리아(Flavobacteria);　(7)　클라미디아(Chlamydia); (8) 녹색 황 박테리아; (9) 녹색 비-황 박테리아(또한 혐기성 광영양체); (10) 방사선저항성 미세구균 및 동족류; 및 (11) 써모토가(Thermotoga) 및 써모시포 써모필레스(Thermosipho thermophiles).

용어 "고세균"은 생리학 및 계통발생학에서 박테리아와 구별되게 만드는 특정 특성을 갖는 원핵생물 유기체의 분류학적 분류를 지칭한다.

용어 "대마초"는 대마초과의 속을 지칭한다. 대마초는 이가(dioecious) 식물이다. 트리콤(trichomes)으로 불리는 대마초의 암꽃에 위치한 선 구조물(glandular structure)은 파이토칸나비노이드(아래에서 더 자세히 기재되어 있음)로 공지된 테르페노-페놀 화합물 부류의 비교적 많은 양을 축적한다. 대마초는 통상적으로 섬유질 및 종자 생산(일반적으로 "대마(hemp) 유형"으로 지칭됨) 또는 취화제(intoxicant) 생산(일반적으로 "약물 유형"으로 지칭됨)을 위해 재배되었다. 약물 유형의 대마초에서, 트리콤은 상대적으로 많은 양의 테트라하이드로칸나비놀산(THCA)을 포함하고 있으며, 이는, 예를 들어, 말린 대마초 꽃의 연소 시 탈카복실화 반응을 통해 테트라하이드로칸나비놀(THC)로 전환되어 중독 효과(intoxicating effect)를 제공할 수 있다. 약물 유형 대마초는 종종 다른 칸나비노이드를 더 적은 양으로 함유한다. 대조적으로, 대마 유형(heme-type) 대마초는 건조 중량 기준으로 THC가 종종 0.3% 미만인 비교적 낮은 농도의 THCA를 함유한다. 대마 유형 대마초는 칸나비디올산(CBDA), 칸나비디올(CBD) 및 기타 칸나비노이드와 같은 비-THC 및 비-THCA 칸나비노이드를 함유할 수 있다. 현재, 속 내의 종의 분류학적 조직에 대한 합의가 부족하다. 문맥에 달리 지시하지 않는 한, 용어 "대마초"는 대마초가 대마 유형 또는 약물 유형인지 여부와 관계없이, 제한 없이 대마초 사티바(Cannabis sativa), 대마초 인디카(Cannabis indica) 및 대마초 루데랄리스(Cannabis ruderalis)와 같은 속 내의 모든 추정 종을 포함하도록 의도된다.

폴리케타이드 신타제(PKS) 효소(예를 들어, 올리베톨 신타제(OLS) 효소) 또는 폴리케타이드 사이클라제(PKC) 효소(예를 들어, 올리베톨산 사이클라제(OAC) 효소)와 관련하여 용어 "사이클라제 활성"은 상응하는 분자내 고리화 생성물(예를 들어, 올리베톨산, 디바린산)에 대한 옥소 지방 아실-CoA(예를 들어, 3,5,7-트리옥소도데카노일-COA, 3,5,7-트리옥소데카노일-COA)의 고리화를 촉매하는 활성을 지칭한다. 일부 구현예에서, PKS 또는 PKC는 3개의 추가 케타이드 모이어티가 이에 부가된 아실-COA의 C₂-C₇ 알돌 축합을 촉매한다.

"세포질" 또는 "가용성" 효소는 숙주 세포의 세포질에 우세하게 국소화된 (또는 국소화될 것으로 예상됨) 효소를 지칭한다.

"진핵생물"은 세포가 막 내에 둘러싸인 핵 및 기타 세포소기관을 포함하는 임의의 유기체이다. 진핵생물(Eukaryotes)은 분류군 진핵생물류(Eukarya) 또는 진핵생물(Eukaryota)에 속한다. 진핵생물 세포를 원핵생물 세포(즉, 박테리아 및 고세균)와 구별하는 정의적인 특징은 그들이 막에 결합된 세포소기관, 특히 유전 물질을 포함하고 핵 외피로 둘러싸여 있는 핵을 갖는다는 것이다.

용어 "숙주 세포"는 칸나비노이드 또는 칸나비노이드 전구체의 생합성에 사용되는 효소를 코딩하는 폴리뉴클레오티드와 같은 폴리뉴클레오티드를 발현하는 데 사용될 수 있는 세포를 지칭한다. 용어 "유전적으로 변형된 숙주 세포", "재조합 숙주 세포" 및 "재조합 균주"는 상호교환적으로 사용되며, 예를 들어, 클로닝 및 형질전환 방법, 또는 당업계에 공지된 다른 방법(예를 들어, CRISPR과 같은 선택적 편집 방법)에 의해 유전적으로 변형된 숙주 세포를 지칭한다. 따라서, 상기 용어는 유전적으로 변경, 변형 또는 조작된 숙주 세포(예를 들어, 박테리아 세포, 효모 세포, 진균 세포, 곤충 세포, 식물 세포, 포유동물 세포, 인간 세포 등)를 포함하여 그것이 유래된 자연 발생 세포와 비교하여 변경, 변형 또는 상이한 유전자형 및/또는 표현형을 나타낸다. 일부 구현예에서, 상기 용어는 해당 특정 재조합 숙주 세포뿐만 아니라 이러한 숙주 세포의 자손 또는 잠재적 자손을 지칭하는 것으로 이해된다.

용어 "대조군 숙주 세포" 또는 숙주 세포와 관련하여 사용될 때 용어 "대조군"은 유전자 변형 또는 실험적 치료의 효과를 결정하기 위한 적절한 대조 숙주 세포를 지칭한다. 일부 구현예에서, 대조군 숙주 세포는 야생형 세포이다. 다른 구현예에서, 대조군 숙주 세포는 유전적으로 변형된 또는 실험적 처리 숙주 세포를 구별하는 유전자 변형(들)을 제외하고는 유전적으로 변형된 숙주 세포와 유전적으로 동일하다. 일부 구현예에서, 대조군 숙주 세포는 다른 시험 숙주 세포에서 활성에 대해 시험되는 효소의 야생형 또는 달리 공지된 변이체를 발현하도록 유전적으로 변형되었다.

유전자를 포함하는 폴리뉴클레오티드와 같은 폴리뉴클레오티드와 관련하여 용어 "이종"은 용어 "외인성" 및 용어 "재조합"과 상호교환적으로 사용되며, 생물학적 시스템에 인위적으로 공급된 폴리뉴클레오티드; 생물학적 시스템 내에서 변형된 폴리뉴클레오티드; 또는 발현 또는 조절이 생물학적 시스템 내에서 조작된 폴리뉴클레오티드를 지칭한다. 숙주 세포에 도입되거나 이에서 발현되는 이종 폴리뉴클레오티드는 숙주 세포와 상이한 유기체 또는 종으로부터 유래된 폴리뉴클레오티드일 수 있거나, 합성 폴리뉴클레오티드일 수 있거나, 또한 숙주 세포와 동일한 유기체 또는 종에서 내인성으로 발현되는 폴리뉴클레오티드 일 수 있다. 예를 들어, 숙주 세포에서 내인성으로 발현되는 폴리뉴클레오티드는 숙주 세포에 비자연적으로 위치되거나; 안정적이거나 일시적으로 숙주 세포에서 재조합적으로 발현되거나; 숙주 세포 내에서 변형되거나; 숙주 세포 내에서 선택적으로 편집되거나; 숙주 세포 내에서 자연적으로 발생하는 카피 수와 상이한 카피 수로 표현되거나; 예컨대 폴리뉴클레오티드의 발현을 제어하는 조절 영역을 조작함으로써 숙주 세포 내에서 비천연 방식으로 발현되는 경우 이종성인 것으로 간주될 수 있다. 일부 구현예에서, 이종 폴리뉴클레오티드는 숙주 세포에서 내인성으로 발현되지만 이의 발현이 폴리뉴클레오티드의 발현을 자연적으로 조절하지 않는 프로모터에 의해 구동되는 폴리뉴클레오티드이다. 다른 구현예에서, 이종 폴리뉴클레오티드는 숙주 세포에서 내인성으로 발현되고 이의 발현이 폴리뉴클레오티드의 발현을 자연적으로 조절하는 프로모터에 의해 구동되지만 프로모터 또는 또 다른 조절 영역이 변형된 폴리뉴클레오티드이다. 일부 구현예에서, 프로모터는 재조합적으로 활성화되거나 억제된다. 예를 들어, 유전자 편집 기반 기술은 내인성 프로모터를 포함하는 프로모터로부터 내인성 폴리뉴클레오티드를 포함하는 폴리뉴클레오티드의 발현을 조절하는 데 사용될 수 있다. 예를 들어, 문헌(Chavez et al., Nat Methods. 2016 Jul; 13(7): 563-567)을 참조한다. 이종 폴리뉴클레오티드는 참조 폴리뉴클레오티드 서열과 비교하여 야생형 서열 또는 돌연변이 서열을 포함할 수 있다.

핵산 또는 폴리펩티드의 "적어도 부분" 또는 "적어도 단편"이라는 용어는 이러한 서열의 최소 크기 특징을 갖는 부분, 또는 전장 분자 이하의 전장 분자의 임의의 더 큰 단편을 의미한다. 본 개시내용의 폴리뉴클레오티드의 단편은 촉매 도메인과 같은 효소의 생물학적 활성 부분을 코딩할 수 있다. 유전자 조절 요소의 생물학적 활성 부분은 전장 유전자 조절 요소의 일부 또는 단편을 포함할 수 있고, 전장 유전자 조절 요소와 동일한 유형의 활성을 갖지만, 유전자 조절 요소의 생물학적 활성 부분의 활성 수준은 전장 유전자 조절 요소의 활성 수준에 비해 다양할 수 있다.

코딩 서열 및 조절 서열은 코딩 서열 및 조절 서열이 공유적으로 연결되어 코딩 서열의 발현 또는 전사가 조절 서열의 영향 또는 제어 하에 있을 때 "작동적으로 연결(joined)" 또는 "작동적으로 연결(linked)"되어 있다고 한다. 코딩 서열이 기능성 단백질로 번역되어야 하는 경우, 코딩 서열 및 조절 서열은 5' 조절 서열에서 프로모터의 유도가 코딩 서열의 전사를 촉진한다면, 그리고 코딩 서열과 조절 서열 간의 연결 성질이 (1) 프레임-시프트 돌연변이의 도입을 초래하지 않거나, (2) 코딩 서열의 전사를 지시하는 프로모터 영역의 능력을 방해하지 않거나, (3) 단백질로 번역되려는 상응하는 RNA 전사체의 능력을 방해하지 않는다면, 코딩 서열과 조절 서열이 작동 가능하게 연결되어 있다고 한다

용어 "연결(link)", "연결된(linked)" 또는 "연결(linkage)"은 2개의 개체(예를 들어, 2개의 폴리뉴클레오티드 또는 2개의 단백질)가 임의의 물리화학적 수단에 의해 서로 결합됨을 의미한다. 공유 또는 비공유의 당업자에게 공지된 임의의 연결이 포함된다. 일부 구현예에서, 본 개시내용의 효소를 코딩하는 핵산 서열은 신호 펩티드를 코딩하는 핵산에 연결된다. 일부 구현예에서, 본 개시내용의 효소는 신호 펩티드에 연결된다. 연결은 직접적이거나 간접적일 수 있다.

숙주 세포와 관련하여 용어 "형질전환된" 또는 "형질전환"은 하나 이상의 핵산이, 예를 들어, 플라스미드 또는 벡터 상에서 또는 게놈으로의 통합에 의해 도입된 숙주 세포를 지칭한다. 하나 이상의 핵산이 플라스미드 또는 벡터 상의 숙주 세포 내로 도입되는 일부 경우에, 하나 이상의 핵산 또는 이의 단편은, 예컨대 세포의 게놈으로의 통합에 의해 세포에 보유될 수 있는 반면, 플라스미드 또는 벡터 자체는 세포로부터 제거될 수 있다. 이러한 경우에, 숙주 세포는 플라스미드 또는 벡터가 세포에 유지되는지 여부에 관계없이 세포에 도입된 핵산으로 형질전환된 것으로 간주된다.

용어 "부피 생산성" 또는 "생산율"은 단위 시간당 매질의 부피당 형성되는 생성물의 양을 지칭한다. 부피 생산성은 시간당 리터당 그램(g/L/h)으로 보고될 수 있다.

생성물의 "비생산성(specific productivity)"이라는 용어는 단위 부피 또는 매쓰 또는 바이오매쓰로 정규화된 생성물의 형성률을 지칭하며, 단위 매쓰 또는 부피당 단위 시간당 물질의 양의 물리적 치수를 갖는다[MㆍT^-1ㆍM^-1 또는 MㆍT^-1ㆍL^-3, 여기서 M은 매쓰 또는 몰이고, T는 시간이고, L은 길이임].

용어 "바이오매쓰 비생산성"은 시간당 세포 건조 중량(CDW) 그램당 생성물 그램(g/g CDW/h) 또는 시간당 세포 건조 중량(CDW) 그램당 생성물 mmol(mmol/g CDW/h)의 비생산성을 지칭한다. 주어진 미생물에 대한 OD600에 대한 CDW의 관계를 사용하여, 비생산성은 시간당 600 nm에서 배양 브로쓰의 광학 밀도(OD)당 배양 배지 리터당 생성물 그램(g/L/h/OD)으로 표시될 수도 있다. 또한, 바이오매쓰의 원소 조성이 공지된 경우, 바이오매쓰 비생산성은 시간당 바이오매쓰의 C-몰(탄소 몰)당 생성물 mmol(mmol/C-mol/h)로 표시될 수 있다.

용어 "수율"은 특정 기질의 단위 중량당 수득되는 생성물의 양을 지칭하며, 기질 g당 생성물 g(g/g) 또는 기질 몰당 생성물 몰(mol/mol)로 표시될 수 있다. 수율은 이론적 수율의 백분율로 표시될 수도 있다. "이론적 수율"은 생성물을 만드는 데 사용되는 대사 경로의 화학량론에 의해 지시되는 바와 같이 기질의 주어진 양당 생성될 수 있는 생성물의 최대량으로 정의되며, 기질 g당 생성물 g(g/g) 또는 기질 몰당 생성물 몰(mol/mol)로 표시될 수 있다.

용어 "역가"는 용액의 강도 또는 용액 중의 물질의 농도를 지칭한다. 예를 들어, 발효 브로쓰 중의 관심 생성물(예를 들어, 소분자, 펩티드, 합성 화합물, 연료, 알코올 등)의 역가는 발효 브로쓰 또는 무세포 브로쓰의 리터당 용액 중의 관심 생성물의 g(g/L)으로 또는 발효 브로쓰 또는 무세포 브로쓰의 kg당 용액 중의 관심 생성물의 g(g/Kg)으로 기재된다.

용어 "총 역가"는, 공정에서의 초기 부피 또는 공정에서의 작동 부피에 비해 용액 중의 관심 생성물, 해당되는 경우 가스상의 관심 생성물, 및 공정으로부터 제거되고 회수되는 임의의 관심 생성물을 포함하지만 이에 제한되지 않는, 공정에서 생성되는 모든 관심 생성물의 합을 지칭한다. 예를 들어, 발효 브로쓰 중의 관심 생성물(예를 들어, 소분자, 펩티드, 합성 화합물, 연료, 알코올 등)의 총 역가는 발효 브로쓰 또는 무세포 브로쓰의 리터당 용액 중의 관심 생성물의 g(g/L)으로 또는 발효 브로쓰 또는 무세포 브로쓰의 kg당 용액 중의 관심 생성물의 g(g/Kg)으로 기재된다.

용어 "아미노산"은 아미노 기인 -NH₂ 및 카복실 기인 -COOH를 포함하는 유기 화합물을 지칭한다. 용어 "아미노산"은 자연 발생 아미노산과 비천연 아미노산 둘 모두를 포함한다. 20개의 일반적인 아미노산에 대한 명명법은 다음과 같다: 알라닌(ala 또는 A); 아르기닌(arg 또는 R); 아스파라긴(asn 또는 N); 아스파르트산(asp 또는 D); 시스테인(cys 또는 C); 글루타민(gln 또는 Q); 글루탐산(glu 또는 E); 글리신(gly 또는 G); 히스티딘(his 또는 H); 이소류신(ile 또는 I); 류신(leu 또는 L); 라이신(lys 또는 K); 메티오닌(met 또는 M); 페닐알라닌(phe 또는 F); 프롤린(pro 또는 P); 세린(ser 또는 S); 트레오닌(thr 또는 T); 트립토판(trp 또는 W); 티로신(tyr 또는 Y); 및 발린(val 또는 V). 비천연 아미노산의 비제한적인 예는 호모-아미노산, 프롤린 및 피루브산 유도체, 3-치환된 알라닌 유도체, 글리신 유도체, 고리-치환된 페닐알라닌 유도체, 고리-치환된 티로신 유도체, 선형 코어 아미노산, Fmoc, Boc, 및 CBz를 포함하는 보호기를 갖는 아미노산, β-아미노산(β3 및 β2), 및 N-메틸 아미노산을 포함한다.

용어 "지방족"은 알킬, 알케닐, 알키닐 및 카보사이클릭 기를 지칭한다. 마찬가지로, 용어 "헤테로지방족"은 헤테로알킬, 헤테로알케닐, 헤테로알키닐 및 헤테로사이클릭 기를 지칭한다.

용어 "알킬"은 1 내지 20개의 탄소 원자를 갖는 직쇄 또는 분지형 포화 탄화수소 기의 라디칼 또는 치환기를 지칭한다("C_1-20 알킬"). 특정 구현예에서, 용어 "알킬"은 1 내지 10개의 탄소 원자를 갖는 직쇄 또는 분지형 포화 탄화수소 기의 라디칼 또는 치환기를 지칭한다("C_1-10 알킬"). 일부 구현예에서, 알킬 기는 1 내지 9개의 탄소 원자를 갖는다("C_1-9 알킬"). 일부 구현예에서, 알킬 기는 1 내지 8개의 탄소 원자를 갖는다("C_1-8 알킬"). 일부 구현예에서, 알킬 기는 1 내지 7개의 탄소 원자를 갖는다("C_1-7 알킬"). 일부 구현예에서, 알킬 기는 2 내지 7개의 탄소 원자를 갖는다("C_2-7 알킬"). 일부 구현예에서, 알킬 기는 3 내지 7개의 탄소 원자를 갖는다("C_3-7 알킬"). 일부 구현예에서, 알킬 기는 1 내지 6개의 탄소 원자를 갖는다("C_1-6 알킬"). 일부 구현예에서, 알킬 기는 2 내지 6개의 탄소 원자를 갖는다("C_2-6 알킬"). 일부 구현예에서, 알킬 기는 3 내지 5개의 탄소 원자를 갖는다("C_3-5 알킬"). 일부 구현예에서, 알킬 기는 5개의 탄소 원자를 갖는다("C₅ 알킬"). 일부 구현예에서, 알킬 기는 3개의 탄소 원자를 갖는다("C₃ 알킬"). 일부 구현예에서, 알킬 기는 7개의 탄소 원자를 갖는다("C₇ 알킬"). 일부 구현예에서, 알킬 기는 1 내지 5개의 탄소 원자를 갖는다("C_1-5 알킬"). 일부 구현예에서, 알킬 기는 1 내지 4개의 탄소 원자를 갖는다("C_1-4 알킬"). 일부 구현예에서, 알킬 기는 1 내지 3개의 탄소 원자를 갖는다("C_1-3 알킬"). 일부 구현예에서, 알킬 기는 1 내지 2개의 탄소 원자를 갖는다("C_1-2 알킬"). 일부 구현예에서, 알킬 기는 1개의 탄소 원자를 갖는다("C₁ 알킬").

C_1-6 알킬 기의 예는 메틸(C₁), 에틸(C₂), 프로필(C₃) (예를 들어, n-프로필, 이소프로필), 부틸(C₄) (예를 들어, n-부틸, tert-부틸, sec-부틸, 이소-부틸), 펜틸(C₅) (예를 들어, n-펜틸, 3-펜타닐, 아밀, 네오펜틸, 3-메틸-2-부타닐, 3차 아밀), 및 헥실(C₆) (예를 들어, n-헥실)을 포함한다. 알킬 기의 추가 예는 n-헵틸(C₇), n-옥틸(C₈) 등을 포함한다. 달리 명시되지 않는 한, 알킬 기의 각 경우는 독립적으로 비치환되거나("비치환된 알킬") 하나 이상의 치환기(예를 들어, 할로겐, 예컨대 F)로 치환된다("치환된 알킬"). 특정 구현예에서, 알킬 기는 비치환된 C_1-10 알킬(예컨대, 비치환된 C_1-6 알킬, 예를 들어, -CH₃(Me), 비치환된 에틸(Et), 비치환된 프로필(Pr, 예를 들어, 비치환된 n-프로필(n-Pr), 비치환된 이소프로필(i-Pr)), 비치환된 부틸(Bu, 예를 들어, 비치환된 n-부틸(n-Bu), 비치환된 tert-부틸(tert-Bu 또는 t-Bu), 비치환된 sec-부틸(sec-Bu), 비치환된 이소부틸(i-Bu))이다. 특정 구현예에서, 알킬 기는 치환된 C_1-10 알킬(예컨대, 치환된 C_1-6 알킬, 예를 들어, -CF₃, 벤질)이다.

용어 "아실"은 일반식 -C(=O)R^X1, -C(=O)OR^X1, -C(=O)-O-C(=O)R^X1, -C(=O)SR^X1, -C(=O)N(R^X1)₂, -C(=S)R^X1, -C(=S)N(R^X1)₂, 및 -C(=S)S(R^X1), -C(=NR^X1)R^X1, -C(=NR^X1)OR^X1, -C(=NR^X1)SR^X1, 및 -C(=NR^X1)N(R^X1)₂를 갖는 기를 지칭하며, 여기서 R^X1은 수소; 할로겐; 치환된 또는 비치환된 하이드록실; 치환된 또는 비치환된 티올; 치환된 또는 비치환된 아미노; 치환된 또는 비치환된 아실, 환형 또는 비환형, 치환된 또는 비치환된, 분지형 또는 비분지형 지방족; 환형 또는 비환형, 치환된 또는 비치환된, 분지형 또는 비분지형 헤테로지방족; 환형 또는 비환형, 치환된 또는 비치환된, 분지형 또는 비분지형 알킬; 환형 또는 비환형, 치환된 또는 비치환된, 분지형 또는 비분지형 알케닐; 치환된 또는 비치환된 알키닐; 치환된 또는 비치환된 아릴, 치환된 또는 비치환된 헤테로아릴, 지방족옥시, 헤테로지방족옥시, 알킬옥시, 헤테로알킬옥시, 아릴옥시, 헤테로아릴옥시, 지방족티옥시, 헤테로지방족티옥시, 알킬티옥시, 헤테로알킬티옥시, 아릴티옥시, 헤테로아릴티옥시, 모노- 또는 디- 지방족아미노, 모노- 또는 디-헤테로지방족아미노, 모노- 또는 디-알킬아미노, 모노- 또는 디-헤테로알킬아미노, 모노- 또는 디-아릴아미노, 또는 모노- 또는 디-헤테로아릴아미노이거나; 2개의 R^X1 기는 함께 취하여 5- 내지 6원 헤테로사이클릭 고리를 형성한다. 예시적인 아실 기는 알데하이드(-CHO), 카복실산(-CO₂H), 케톤, 아실 할라이드, 에스테르, 아미드, 이민, 카보네이트, 카바메이트, 및 우레아를 포함한다. 아실 치환기는 안정한 모이어티(예를 들어, 지방족, 알킬, 알케닐, 알키닐, 헤테로지방족, 헤테로사이클릭, 아릴, 헤테로아릴, 아실, 옥소, 이미노, 티오옥소, 시아노, 이소시아노, 아미노, 아지도, 니트로, 하이드록실, 티올, 할로, 지방족아미노, 헤테로지방족아미노, 알킬아미노, 헤테로알킬아미노, 아릴아미노, 헤테로아릴아미노, 알킬아릴, 아릴알킬, 지방족옥시, 헤테로지방족옥시, 알킬옥시, 헤테로알킬옥시, 아릴옥시, 헤테로아릴옥시, 지방족티옥시, 헤테로지방족티옥시, 알킬티옥시, 헤테로알킬티옥시, 아릴티옥시, 헤테로아릴티옥시, 아실옥시 등으로, 이들 각각은 추가로 치환될 수 있거나 치환되지 않을 수 있음)의 형성을 초래하는 본 출원에 기재된 임의의 치환기를 포함하지만 이에 제한되지 않는다.

"알케닐"은 2 내지 20개의 탄소 원자, 하나 이상의 탄소-탄소 이중 결합을 갖고 삼중 결합이 없는 직쇄 또는 분지형 탄화수소 기의 라디칼 또는 치환기를 지칭한다("C_2-20 알케닐"). 일부 구현예에서, 알케닐 기는 2 내지 10개의 탄소 원자를 갖는다("C_2-10 알케닐"). 일부 구현예에서, 알케닐 기는 2 내지 9개의 탄소 원자를 갖는다("C_2-9 알케닐"). 일부 구현예에서, 알케닐 기는 2 내지 8개의 탄소 원자를 갖는다("C_2-8 알케닐"). 일부 구현예에서, 알케닐 기는 2 내지 7개의 탄소 원자를 갖는다("C_2-7 알케닐"). 일부 구현예에서, 알케닐 기는 2 내지 6개의 탄소 원자를 갖는다("C_2-6 알케닐"). 일부 구현예에서, 알케닐 기는 2 내지 5개의 탄소 원자를 갖는다("C_2-5 알케닐"). 일부 구현예에서, 알케닐 기는 2 내지 4개의 탄소 원자를 갖는다("C_2-4 알케닐"). 일부 구현예에서, 알케닐 기는 2 내지 3개의 탄소 원자를 갖는다("C_2-3 알케닐"). 일부 구현예에서, 알케닐 기는 2개의 탄소 원자를 갖는다("C₂ 알케닐"). 하나 이상의 탄소-탄소 이중 결합은 내부(예컨대, 2-부테닐에서) 또는 말단(예컨대, 1-부테닐에서)일 수 있다. C_2-4 알케닐 기의 예는 에테닐(C₂), 1-프로페닐(C₃), 2-프로페닐(C₃), 1-부테닐(C₄), 2-부테닐(C₄), 부타디에닐(C₄) 등을 포함한다. C_2-6 알케닐 기의 예는 상기 언급된 C_2-4 알케닐 기뿐만 아니라 펜테닐(C₅), 펜타디에닐(C₅), 헥세닐(C₆) 등을 포함한다. 알케닐의 추가 예는 헵테닐(C₇), 옥테닐(C₈), 옥타트리에닐(C₈) 등을 포함한다. 달리 명시되지 않는 한, 알케닐 기의 각 경우는 독립적으로 임의로 치환되는데, 즉, 비치환되거나("비치환된 알케닐") 하나 이상의 치환기로 치환된다("치환된 알케닐"). 특정 구현예에서, 알케닐 기는 비치환된 C_2-10 알케닐이다. 특정 구현예에서, 알케닐 기는 치환된 C_2-10 알케닐이다.

"알키닐"은 2 내지 20개의 탄소 원자, 하나 이상의 탄소-탄소 삼중 결합, 및 임의로 하나 이상의 이중 결합을 갖는 직쇄 또는 분지형 탄화수소 기의 라디칼 또는 치환기를 지칭한다("C_2-20 알키닐"). 일부 구현예에서, 알키닐 기는 2 내지 10개의 탄소 원자를 갖는다("C_2-10 알키닐"). 일부 구현예에서, 알키닐 기는 2 내지 9개의 탄소 원자를 갖는다("C_2-9 알키닐"). 일부 구현예에서, 알키닐 기는 2 내지 8개의 탄소 원자를 갖는다("C_2-8 알키닐"). 일부 구현예에서, 알키닐 기는 2 내지 7개의 탄소 원자를 갖는다("C_2-7 알키닐"). 일부 구현예에서, 알키닐 기는 2 내지 6개의 탄소 원자를 갖는다("C_2-6 알키닐"). 일부 구현예에서, 알키닐 기는 2 내지 5개의 탄소 원자를 갖는다("C_2-5 알키닐"). 일부 구현예에서, 알키닐 기는 2 내지 4개의 탄소 원자를 갖는다("C_2-4 알키닐"). 일부 구현예에서, 알키닐 기는 2 내지 3개의 탄소 원자를 갖는다("C_2-3 알키닐"). 일부 구현예에서, 알키닐 기는 2개의 탄소 원자를 갖는다("C₂ 알키닐"). 하나 이상의 탄소-탄소 삼중 결합은 내부(예컨대, 2-부티닐에서) 또는 말단(예컨대, 1-부티닐에서)일 수 있다. C_2-4 알키닐 기의 예는, 제한 없이, 에티닐(C₂), 1-프로피닐(C₃), 2-프로피닐(C₃), 1-부티닐(C₄), 2-부티닐(C₄) 등을 포함한다. C_2-6 알케닐 기의 예는 상기 언급된 C_2-4 알키닐 기뿐만 아니라 펜티닐(C₅), 헥시닐(C₆) 등을 포함한다. 알키닐의 추가 예는 헵티닐(C₇), 옥티닐(C₈) 등을 포함한다. 달리 명시되지 않는 한, 알키닐 기의 각 경우는 독립적으로 임의로 치환되는데, 즉, 비치환되거나("비치환된 알키닐") 하나 이상의 치환기로 치환된다("치환된 알키닐"). 특정 구현예에서, 알키닐 기는 비치환된 C_2-10 알키닐이다. 특정 구현예에서, 알키닐 기는 치환된 C_2-10 알키닐이다.

"카보사이클릴" 또는 "카보사이클릭"은 비방향족 고리 시스템에서 3 내지 10개의 고리 탄소 원자("C_3-10 카보사이클릴") 및 0개의 헤테로원자를 갖는 비방향족 사이클릭 탄화수소 기의 라디칼을 지칭한다. 일부 구현예에서, 카보사이클릴 기는 3 내지 8개의 고리 탄소 원자를 갖는다("C_3-8 카보사이클릴"). 일부 구현예에서, 카보사이클릴 기는 3 내지 6개의 고리 탄소 원자를 갖는다("C_3-6 카보사이클릴"). 일부 구현예에서, 카보사이클릴 기는 3 내지 6개의 고리 탄소 원자를 갖는다("C_3-6 카보사이클릴"). 일부 구현예에서, 카보사이클릴 기는 5 내지 10개의 고리 탄소 원자를 갖는다("C_5-10 카보사이클릴"). 예시적인 C_3-6 카보사이클릴 기는, 제한 없이, 사이클로프로필(C₃), 사이클로프로페닐(C₃), 사이클로부틸(C₄), 사이클로부테닐(C₄), 사이클로펜틸(C₅), 사이클로펜테닐(C₅), 사이클로헥실(C₆), 사이클로헥세닐(C₆), 사이클로헥사디에닐(C₆) 등을 포함한다. 예시적인 C_3-8 카보사이클릴 기는, 제한 없이, 상기 언급된 C_3-6 카보사이클릴 기뿐만 아니라 사이클로헵틸(C₇), 사이클로헵테닐(C₇), 사이클로헵타디에닐(C₇), 사이클로헵타트리에닐(C₇), 사이클로옥틸(C₈), 사이클로옥테닐(C₈), 바이사이클로[2.2.1]헵타닐(C₇), 바이사이클로[2.2.2]옥타닐(C₈) 등을 포함한다. 예시적인 C_3-10 카보사이클릴 기는, 제한 없이, 상기 언급된 C_3-8 카보사이클릴 기뿐만 아니라 사이클로노닐(C₉), 사이클로노네닐(C₉), 사이클로데실(C₁₀), 사이클로데세닐(C₁₀), 옥타하이드로-1H-인데닐(C₉), 데카하이드로나프탈레닐(C₁₀), 스피로[4.5]데카닐(C₁₀) 등을 포함한다. 상기 실시예가 예시하는 바와 같이, 특정 구현예에서, 카보사이클릴 기는 모노사이클릭("모노사이클릭 카보사이클릴")이거나, 바이사이클릭 시스템("바이사이클릭 카보사이클릴")과 같은 융합, 가교 또는 스피로 고리 시스템을 포함하고, 포화될 수 있거나 부분적으로 불포화될 수 있다. "카보사이클릴"은 또한 상기 정의된 바와 같은 카보사이클릭 고리가 하나 이상의 아릴 또는 헤테로아릴 기와 융합된 고리 시스템을 포함하며, 여기서, 부착점은 카보사이클릭 고리에 있고, 이러한 경우에, 탄소 수는 카보사이클릭 고리 시스템의 탄소 수를 계속 지정한다. 달리 명시되지 않는 한, 카보사이클릴 기의 각 경우는 독립적으로 임의로 치환되는데, 즉, 비치환되거나("비치환된 카보사이클릴") 하나 이상의 치환기로 치환된다("치환된 카보사이클릴"). 특정 구현예에서, 카보사이클릴 기는 비치환된 C_3-10 카보사이클릴이다. 특정 구현예에서, 카보사이클릴 기는 치환된 C_3-10 카보사이클릴이다.

일부 구현예에서, "카보사이클릴"은 3 내지 10개의 고리 탄소 원자를 갖는 모노사이클릭, 포화 카보사이클릴 기이다("C_3-10사이클로알킬"). 일부 구현예에서, 사이클로알킬 기는 3 내지 8개의 고리 탄소 원자를 갖는다("C_3-8 사이클로알킬"). 일부 구현예에서, 사이클로알킬 기는 3 내지 6개의 고리 탄소 원자를 갖는다("C_3-6사이클로알킬"). 일부 구현예에서, 사이클로알킬 기는 5 내지 6개의 고리 탄소 원자를 갖는다("C_5-6 사이클로알킬"). 일부 구현예에서, 사이클로알킬 기는 5 내지 10개의 고리 탄소 원자를 갖는다("C_5-10 사이클로알킬"). C_5-6 사이클로알킬 기의 예는 사이클로펜틸(C₅) 및 사이클로헥실(C₅)을 포함한다. C_3-6 사이클로알킬 기의 예는 상기 언급된 C_5-6 사이클로알킬 기뿐만 아니라 사이클로프로필(C₃) 및 사이클로부틸(C₄)을 포함한다. C_3-8 사이클로알킬 기의 예는 상기 언급된 C_3-6사이클로알킬 기뿐만 아니라 사이클로헵틸(C₇) 및 사이클로옥틸(C₈)을 포함한다. 달리 명시되지 않는 한, 사이클로알킬 기의 각 경우는 독립적으로 비치환되거나("비치환된 사이클로알킬") 하나 이상의 치환기로 치환된다("치환된 사이클로알킬"). 특정 구현예에서, 사이클로알킬 기는 비치환된 C_3-10 사이클로알킬이다. 특정 구현예에서, 사이클로알킬 기는 치환된 C_3-10 사이클로알킬이다.

"아릴"은 방향족 고리 시스템에 제공된 6-14개의 고리 탄소 원자 및 0개의 헤테로원자를 갖는 모노사이클릭 또는 폴리사이클릭(예를 들어, 바이사이클릭 또는 트리사이클릭) 4n+2개의 방향족 고리 시스템(예를 들어, 사이클릭 배열에서 공유되는 6, 10, 또는 14개의 파이 전자를 가짐)의 라디칼을 지칭한다("C_6-14 아릴"). 일부 구현예에서, 아릴 기는 6개의 고리 탄소 원자를 갖는다("C₆ 아릴"; 예를 들어, 페닐). 일부 구현예에서, 아릴 기는 10개의 고리 탄소 원자를 갖는다("C₁₀ 아릴"; 예를 들어, 나프틸, 예컨대 1-나프틸 및 2-나프틸). 일부 구현예에서, 아릴 기는 14개의 고리 탄소 원자를 갖는다("C₁₀ 아릴"; 예를 들어, 안트라실). "아릴"은 또한 상기 정의된 바와 같은 아릴 고리가 하나 이상의 카보사이클릴 또는 헤테로사이클릴 기와 융합된 고리 시스템을 포함하며, 여기서, 라디칼 또는 부착점은 아릴 고리 상에 있고, 이러한 경우에, 탄소 원자의 수는 아릴 고리 시스템에서 탄소 원자의 수를 계속 지정한다. 달리 명시되지 않는 한, 아릴 기의 각 경우는 독립적으로 임의로 치환되는데, 즉 비치환되거나("비치환된 아릴") 하나 이상의 치환기로 치환된다("치환된 아릴"). 특정 구현예에서, 아릴 기는 비치환된 C_6-14 아릴이다. 특정 구현예에서, 아릴 기는 치환된 C_6-14 아릴이다.

"아르알킬"은 알킬 및 아릴의 서브세트이고 임의로 치환된 아릴 기에 의해 치환된 임의로 치환된 알킬 기를 지칭한다. 특정 구현예에서, 아르알킬은 임의로 치환된 벤질이다. 특정 구현예에서, 아르알킬은 벤질이다. 특정 구현예에서, 아르알킬은 임의로 치환된 페네틸이다. 특정 구현예에서, 아르알킬은 페네틸이다. 특정 구현예에서, 아르알킬은 7-페닐헵타닐이다. 특정 구현예에서, 아르알킬은 임의로 치환된 아릴 기(예를 들어, 페닐)에 의해 치환된 C₇ 알킬이다. 특정 구현예에서, 아르알킬은 임의로 치환된 아릴 기(예를 들어, 페닐)에 의해 치환된 C₇-C₁₀ 알킬 기이다.

"부분적으로 불포화된"은 적어도 하나의 이중 또는 삼중 결합을 포함하는 기를 지칭한다. "부분적으로 불포화된" 고리 시스템은 또한 다중 불포화 부위를 갖는 고리를 포함하도록 의도되지만, 본 출원에 정의된 바와 같은 방향족 기(예를 들어, 아릴 또는 헤테로아릴 기)를 포함하는 것으로 의도되지 않는다. 마찬가지로, "포화된"은 이중 또는 삼중 결합을 포함하지 않는, 즉 단일 결합을 모두 포함하는 기를 지칭한다.

용어 "임의로 치환된"은 치환 또는 비치환을 의미한다.

알킬, 알케닐, 알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴 기는 임의로 치환된다(예를 들어, "치환된" 또는 "비치환된" 알킬, "치환된" 또는 "비치환된" 알케닐, "치환된" 또는 "비치환된" 알키닐, "치환된" 또는 "비치환된" 카보사이클릴, "치환된" 또는 "비치환된" 헤테로사이클릴, "치환된" 또는 "비치환된" 아릴 또는 "치환된" 또는 "비치환된" 헤테로아릴 기). 일반적으로, 용어 "임의로"가 앞에 있든 없든, 용어 "치환된"은 기(예를 들어, 탄소 또는 질소 원자)에 존재하는 적어도 하나의 수소가 허용되는 치환기, 예를 들어, 치환 시 안정한 화합물, 예를 들어, 재배열, 고리화, 제거 또는 기타 반응에 의한 것과 같은 자발적으로 변형되지 않는 화합물을 생성하는 치환기로 대체됨을 의미한다. 달리 나타내지 않는 한, "치환된" 기는 기의 하나 이상의 치환 가능한 위치에 치환기를 갖고, 임의의 주어진 구조에서 하나 초과의 위치가 치환되는 경우, 치환기는 각 위치에서 동일하거나 상이하다. 용어 "치환된"은 안정한 화합물의 형성을 초래하는 본 출원에 기재된 임의의 치환기인 유기 화합물의 모든 허용 가능한 치환기로의 치환을 포함하는 것으로 고려된다. 본 발명은 안정한 화합물에 도달하기 위해 이러한 임의의 모든 조합을 고려한다. 본 발명의 목적을 위해, 질소와 같은 헤테로원자는 수소 치환기 및/또는 헤테로원자의 원자가를 만족시키고 안정한 모이어티의 형성을 초래하는 본 출원에 기재된 바와 같은 임의의 적합한 치환기를 가질 수 있다.

예시적인 탄소 원자 치환기는 할로겐, -CN, -NO₂, -N₃, -SO₂H, -SO₃H, -OH, -OR^aa, -ON(R^bb)₂, -N(R^bb)₂, -N(R^bb)₃ ⁺X^-, -N(OR^cc)R^bb, -SH, -SR^aa, -SSR^cc, -C(=O)R^aa, -CO₂H, -CHO, -C(OR^cc)₂, -CO₂R^aa, -OC(=O)R^aa, -OCO₂R^aa, -C(=O)N(R^bb)₂, -OC(=O)N(R^bb)₂, -NR^bbC(=O)R^aa, -NR^bbCO₂R^aa, -NR^bbC(=O)N(R^bb)₂, -C(=NR^bb)R^aa, -C(=NR^bb)OR^aa, -OC(=NR^bb)R^aa, -OC(=NR^bb)OR^aa, -C(=NR^bb)N(R^bb)₂, -OC(=NR^bb)N(R^bb)₂, -NR^bbC(=NR^bb)N(R^bb)₂, -C(=O)NR^bbSO₂R^aa, -NR^bbSO₂R^aa, -SO₂N(R^bb)₂, -SO₂R^aa, -SO₂OR^aa, -OSO₂R^aa, -S(=O)R^aa, -OS(=O)R^aa, -Si(R^aa)₃, -OSi(R^aa)₃ -C(=S)N(R^bb)₂, -C(=O)SR^aa, -C(=S)SR^aa, -SC(=S)SR^aa, -SC(=O)SR^aa, -OC(=O)SR^aa, -SC(=O)OR^aa, -SC(=O)R^aa, -P(=O)(R^aa)₂, -P(=O)(OR^cc)₂,-OP(=O)(R^aa)₂, -OP(=O)(OR^cc)₂, -P(=O)(N(R^bb)₂)₂, -OP(=O)(N(R^bb)₂)₂, -NR^bbP(=O)(R^aa)₂,-NR^bbP(=O)(OR^cc)₂, -NR^bbP(=O)(N(R^bb)₂)₂, -P(R^cc)₂, -P(OR^cc)₂, -P(R^cc)₃ ⁺X^-, -P(OR^cc)₃ ⁺X^-, -P(R^cc)₄, -P(OR^cc)₄,-OP(R^cc)₂, -OP(R^cc)₃ ⁺X^-, -OP(OR^cc)₂, -OP(OR^cc)₃ ⁺X^-, -OP(R^cc)₄, -OP(OR^cc)₄,-B(R^aa)₂, -B(OR^cc)₂, -BR^aa(OR^cc), C_1-10 알킬, C_1-10 퍼할로알킬, C_2-10 알케닐, C_2-10 알키닐, 헤테로C_1-10 알킬, 헤테로C_2-10 알케닐, 헤테로C_2-10 알키닐, C_3-10 카보사이클릴, 3-14원 헤테로사이클릴, C_6-14 아릴, 및 5-14원 헤테로아릴을 포함하지만 이에 제한되지 않으며;

여기서:

R^aa의 각 경우는, 독립적으로 C_1-10 알킬, C_1-10 퍼할로알킬, C_2-10 알케닐, C_2-10 알키닐, 헤테로C_1-10 알킬, 헤테로C_2-10알케닐, 헤테로C_2-10알키닐, C_3-10 카보사이클릴, 3-14원 헤테로사이클릴, C_6-14 아릴, 및 5-14원 헤테로아릴로부터 선택되거나, 2개의 R^aa 기가 연결되어 3-14원 헤테로사이클릴 또는 5-14원 헤테로아릴 고리를 형성하고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 R^dd 기로 독립적으로 치환되고;

R^bb의 각 경우는, 독립적으로 수소, -OH, -OR^aa, -N(R^cc)₂, -CN, -C(=O)R^aa, -C(=O)N(R^cc)₂, -CO₂R^aa, -SO₂R^aa, -C(=NR^cc)OR^aa, -C(=NR^cc)N(R^cc)₂, -SO₂N(R^cc)₂, -SO₂R^cc, -SO₂OR^cc, -SOR^aa, -C(=S)N(R^cc)₂, -C(=O)SR^cc, -C(=S)SR^cc, -P(=O)(R^aa)₂, -P(=O)(OR^cc)₂, -P(=O)(N(R^cc)₂)₂, C_1-10 알킬, C_1-10 퍼할로알킬, C_2-10 알케닐, C_2-10 알키닐, 헤테로C_1-10 알킬, 헤테로C_2-10 알케닐, 헤테로C_2-10알키닐, C_3-10 카보사이클릴, 3-14원 헤테로사이클릴, C_6-14 아릴, 및 5-14원 헤테로아릴로부터 선택되거나, 2개의 R^bb 기가 연결되어 3-14원 헤테로사이클릴 또는 5-14원 헤테로아릴 고리를 형성하고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 R^dd 기로 독립적으로 치환되고; 여기서 X^-는 반대이온이고;

R^cc의 각 경우는, 독립적으로 수소, C_1-10 알킬, C_1-10 퍼할로알킬, C_2-10 알케닐, C_2-10 알키닐, 헤테로C_1-10 알킬, 헤테로C_2-10 알케닐, 헤테로C_2-10 알키닐, C_3-10 카보사이클릴, 3-14원 헤테로사이클릴, C_6-14 아릴, 및 5-14원 헤테로아릴로부터 선택되거나, 2개의 R^cc 기가 연결되어 3-14원 헤테로사이클릴 또는 5-14원 헤테로아릴 고리를 형성하고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 R^dd 기로 독립적으로 치환되고;

R^dd의 각 경우는, 독립적으로 할로겐, -CN, -NO₂, -N₃, -SO₂H, -SO₃H, -OH, -OR^ee, -ON(R^ff)₂, -N(R^ff)₂, -N(R^ff)₃ ⁺X^-, -N(OR^ee)R^ff, -SH, -SR^ee, -SSR^ee, -C(=O)R^ee, -CO₂H, -CO₂R^ee, -OC(=O)R^ee, -OCO₂R^ee, -C(=O)N(R^ff)₂, -OC(=O)N(R^ff)₂, -NR^ffC(=O)R^ee, -NR^ffCO₂R^ee, -NR^ffC(=O)N(R^ff)₂, -C(=NR^ff)OR^ee, -OC(=NR^ff)R^ee, -OC(=NR^ff)OR^ee, -C(=NR^ff)N(R^ff)₂, -OC(=NR^ff)N(R^ff)₂, -NR^ffC(=NR^ff)N(R^ff)₂, -NR^ffSO₂R^ee, -SO₂N(R^ff)₂, -SO₂R^ee, -SO₂OR^ee, -OSO₂R^ee, -S(=O)R^ee, -Si(R^ee)₃, -OSi(R^ee)₃, -C(=S)N(R^ff)₂, -C(=O)SR^ee, -C(=S)SR^ee, -SC(=S)SR^ee, -P(=O)(OR^ee)₂, -P(=O)(R^ee)₂, -OP(=O)(R^ee)₂, -OP(=O)(OR^ee)₂, C_1-6 알킬, C_1-6 퍼할로알킬, C_2-6 알케닐, C_2-6 알키닐, 헤테로C_1-6 알킬, 헤테로C_2-6 알케닐, 헤테로C_2-6 알키닐, C_3-10 카보사이클릴, 3-10원 헤테로사이클릴, C_6-10 아릴, 5-10원 헤테로아릴로부터 선택되고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 R^gg 기로 독립적으로 치환되거나, 2개의 같은 자리(geminal) R^dd 치환기가 연결되어 =O 또는 =S를 형성할 수 있고; 여기서 X^-는 반대이온이고;

R^ee의 각 경우는, 독립적으로 C_1-6 알킬, C_1-6 퍼할로알킬, C_2-6 알케닐, C_2-6 알키닐, 헤테로C_1-6 알킬, 헤테로C_2-6 알케닐, 헤테로C_2-6 알키닐, C_3-10 카보사이클릴, C_6-10 아릴, 3-10원 헤테로사이클릴, 및 3-10원 헤테로아릴로부터 선택되고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 R^gg 기로 독립적으로 치환되고;

R^ff의 각 경우는, 독립적으로 수소, C_1-6 알킬, C_1-6 퍼할로알킬, C_2-6 알케닐, C_2-6 알키닐, 헤테로C_1-6 알킬, 헤테로C_2-6 알케닐, 헤테로C_2-6알키닐, C_3-10 카보사이클릴, 3-10원 헤테로사이클릴, C_6-10 아릴 및 5-10원 헤테로아릴로부터 선택되거나, 2개의 R^ff 기가 연결되어 3-10원 헤테로사이클릴 또는 5-10원 헤테로아릴 고리를 형성하고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 R^gg 기로 독립적으로 치환되고;

R^gg의 각 경우는, 독립적으로 할로겐, -CN, -NO₂, -N₃, -SO₂H, -SO₃H, -OH, -OC_1-6 알킬, -ON(C_1-6 알킬)₂, -N(C_1-6 알킬)₂, -N(C_1-6 알킬)₃ ⁺X^-, -NH(C_1-6 알킬)₂ ⁺X^-, -NH₂(C_1-6 알킬)⁺X^-, -NH₃ ⁺X^-, -N(OC_1-6 알킬)(C_1-6 알킬), -N(OH)(C_1-6 알킬), -NH(OH), -SH, -SC_1-6 알킬, -SS(C_1-6 알킬), -C(=O)(C_1-6 알킬), -CO₂H, -CO₂(C_1-6 알킬), -OC(=O)(C_1-6 알킬), -OCO₂(C_1-6 알킬), -C(=O)NH₂, -C(=O)N(C_1-6 알킬)₂, -OC(=O)NH(C_1-6 알킬), -NHC(=O)(C_1-6 알킬), -N(C_1-6 알킬)C(=O)(C_1-6 알킬), -NHCO₂(C_1-6 알킬), -NHC(=O)N(C_1-6 알킬)₂, -NHC(=O)NH(C_1-6 알킬), -NHC(=O)NH₂, -C(=NH)O(C_1-6 알킬), -OC(=NH)(C_1-6 알킬), -OC(=NH)OC_1-6 알킬, -C(=NH)N(C_1-6 알킬)₂, -C(=NH)NH(C_1-6 알킬), -C(=NH)NH₂, -OC(=NH)N(C_1-6 알킬)₂, -OC(NH)NH(C_1-6 알킬), -OC(NH)NH₂, -NHC(NH)N(C_1-6 알킬)₂, -NHC(=NH)NH₂, -NHSO₂(C_1-6 알킬), -SO₂N(C_1-6 알킬)₂, -SO₂NH(C_1-6 알킬), -SO₂NH₂, -SO₂C_1-6 알킬, -SO₂OC_1-6 알킬, -OSO₂C_1-6 알킬, -SOC_1-6 알킬, -Si(C_1-6 알킬)₃, -OSi(C_1-6 알킬)₃, -C(=S)N(C_1-6 알킬)₂, C(=S)NH(C_1-6 알킬), C(=S)NH₂, -C(=O)S(C_1-6 알킬), -C(=S)SC_1-6 알킬, -SC(=S)SC_1-6 알킬, -P(=O)(OC_1-6 알킬)₂, -P(=O)(C_1-6 알킬)₂, -OP(=O)(C_1-6 알킬)₂, -OP(=O)(OC_1-6 알킬)₂, C_1-6 알킬, C_1-6 퍼할로알킬, C_2-6 알케닐, C_2-6 알키닐, 헤테로C_1-6알킬, 헤테로C_2-6알케닐, 헤테로C_2-6알키닐, C_3-10 카보사이클릴, C_6-10 아릴, 3-10원 헤테로사이클릴, 5-10원 헤테로아릴이거나; 2개의 같은 자리 R^gg 치환기가 연결되어 =O 또는 =S를 형성할 수 있고; 여기서 X^-는 반대이온이다. 대안적으로, 탄소 원자 상의 2개의 같은 자리 수소는 기 =O, =S, =NN(R^bb)₂, =NNR^bbC(=O)R^aa, =NNR^bbC(=O)OR^aa, =NNR^bbS(=O)₂R^aa, =NR^bb, 또는 =NOR^cc로 대체되고; 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 R^dd 기로 독립적으로 치환되고; 여기서 X^-는 반대이온이고;

여기서:

R^aa의 각 경우는, 독립적으로 C_1-10 알킬, C_1-10 퍼할로알킬, C_2-10 알케닐, C_2-10 알키닐, 헤테로C_1-10 알킬, 헤테로C_2-10 알케닐, 헤테로C_2-10 알키닐, C_3-10 카보사이클릴, 3-14원 헤테로사이클릴, C_6-14 아릴, 및 5-14원 헤테로아릴로부터 선택되거나, 2개의 R^aa 기가 연결되어 3-14원 헤테로사이클릴 또는 5-14원 헤테로아릴 고리를 형성하고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 R^dd 기로 독립적으로 치환되고;

R^bb의 각 경우는, 독립적으로 수소, -OH, -OR^aa, -N(R^cc)₂, -CN, -C(=O)R^aa, -C(=O)N(R^cc)₂, -CO₂R^aa, -SO₂R^aa, -C(=NR^cc)OR^aa, -C(=NR^cc)N(R^cc)₂, -SO₂N(R^cc)₂, -SO₂R^cc, -SO₂OR^cc, -SOR^aa, -C(=S)N(R^cc)₂, -C(=O)SR^cc, -C(=S)SR^cc, -P(=O)(R^aa)₂, -P(=O)(OR^cc)₂, -P(=O)(N(R^cc)₂)₂, C_1-10 알킬, C_1-10 퍼할로알킬, C_2-10 알케닐, C_2-10 알키닐, 헤테로C_1-10 알킬, 헤테로C_2-10 알케닐, 헤테로C_2-10 알키닐, C_3-10 카보사이클릴, 3-14원 헤테로사이클릴, C_6-14 아릴, 및 5-14원 헤테로아릴로부터 선택되거나, 2개의 R^bb 기가 연결되어 3-14원 헤테로사이클릴 또는 5-14원 헤테로아릴 고리를 형성하고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 R^dd 기로 독립적으로 치환되고; 여기서 X^-는 반대이온이고;

R^dd의 각 경우는, 독립적으로 할로겐, -CN, -NO₂, -N₃, -SO₂H, -SO₃H, -OH, -OR^ee, -ON(R^ff)₂, -N(R^ff)₂, -N(R^ff)₃ ⁺X^-, -N(OR^ee)R^ff, -SH, -SR^ee, -SSR^ee, -C(=O)R^ee, -CO₂H, -CO₂R^ee, -OC(=O)R^ee, -OCO₂R^ee, -C(=O)N(R^ff)₂, -OC(=O)N(R^ff)₂, -NR^ffC(=O)R^ee, -NR^ffCO₂R^ee, -NR^ffC(=O)N(R^ff)₂, -C(=NR^ff)OR^ee, -OC(=NR^ff)R^ee, -OC(=NR^ff)OR^ee, -C(=NR^ff)N(R^ff)₂, -OC(=NR^ff)N(R^ff)₂, -NR^ffC(=NR^ff)N(R^ff)₂, -NR^ffSO₂R^ee, -SO₂N(R^ff)₂, -SO₂R^ee, -SO₂OR^ee, -OSO₂R^ee, -S(=O)R^ee, -Si(R^ee)₃, -OSi(R^ee)₃, -C(=S)N(R^ff)₂, -C(=O)SR^ee, -C(=S)SR^ee, -SC(=S)SR^ee, -P(=O)(OR^ee)₂, -P(=O)(R^ee)₂, -OP(=O)(R^ee)₂, -OP(=O)(OR^ee)₂, C_1-6 알킬, C_1-6 퍼할로알킬, C_2-6 알케닐, C_2-6 알키닐, 헤테로C_1-6 알킬, 헤테로C_2-6 알케닐, 헤테로C_2-6 알키닐, C_3-10 카보사이클릴, 3-10원 헤테로사이클릴, C_6-10 아릴, 5-10원 헤테로아릴로부터 선택되고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 R^gg 기로 독립적으로 치환되거나, 2개의 같은 자리 R^dd 치환기가 연결되어 =O 또는 =S를 형성할 수 있고; 여기서 X^-는 반대이온이고;

R^ee의 각 경우는, 독립적으로 C_1-6 알킬, C_1-6 퍼할로알킬, C_2-6 알케닐, C_2-6 알키닐, 헤테로C_1-6 알킬, 헤테로C_2-6알케닐, 헤테로C_2-6 알키닐, C_3-10 카보사이클릴, C_6-10 아릴, 3-10원 헤테로사이클릴, 및 3-10원 헤테로아릴로부터 선택되고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 R^gg 기로 독립적으로 치환되고;

R^ff의 각 경우는, 독립적으로 수소, C_1-6 알킬, C_1-6 퍼할로알킬, C_2-6 알케닐, C_2-6 알키닐, 헤테로C_1-6알킬, 헤테로C_2-6 알케닐, 헤테로C_2-6알키닐, C_3-10 카보사이클릴, 3-10원 헤테로사이클릴, C_6-10 아릴 및 5-10원 헤테로아릴로부터 선택되거나, 2개의 R^ff 기가 연결되어 3-10원 헤테로사이클릴 또는 5-10원 헤테로아릴 고리를 형성하고, 여기서 각각의 알킬, 알케닐, 알키닐, 헤테로알킬, 헤테로알케닐, 헤테로알키닐, 카보사이클릴, 헤테로사이클릴, 아릴, 및 헤테로아릴은 0, 1, 2, 3, 4, 또는 5개의 R^gg 기로 독립적으로 치환되고;

R^gg의 각 경우는, 독립적으로 할로겐, -CN, -NO₂, -N₃, -SO₂H, -SO₃H, -OH, -OC_1-6 알킬, -ON(C_1-6 알킬)₂, -N(C_1-6 알킬)₂, -N(C_1-6 알킬)₃ ⁺X^-, -NH(C_1-6 알킬)₂ ⁺X^-, -NH₂(C_1-6 알킬)⁺X^-, -NH₃ ⁺X^-, -N(OC_1-6 알킬)(C_1-6 알킬), -N(OH)(C_1-6 알킬), -NH(OH), -SH, -SC_1-6 알킬, -SS(C_1-6 알킬), -C(=O)(C_1-6 알킬), -CO₂H, -CO₂(C_1-6 알킬), -OC(=O)(C_1-6 알킬), -OCO₂(C_1-6 알킬), -C(=O)NH₂, -C(=O)N(C_1-6 알킬)₂, -OC(=O)NH(C_1-6 알킬), -NHC(=O)(C_1-6 알킬), -N(C_1-6 알킬)C(=O)(C_1-6 알킬), -NHCO₂(C_1-6 알킬), -NHC(=O)N(C_1-6 알킬)₂, -NHC(=O)NH(C_1-6 알킬), -NHC(=O)NH₂, -C(=NH)O(C_1-6 알킬), -OC(=NH)(C_1-6 알킬), -OC(=NH)OC_1-6 알킬, -C(=NH)N(C_1-6 알킬)₂, -C(=NH)NH(C_1-6 알킬), -C(=NH)NH₂, -OC(=NH)N(C_1-6 알킬)₂, -OC(NH)NH(C_1-6 알킬), -OC(NH)NH₂, -NHC(NH)N(C_1-6 알킬)₂, -NHC(=NH)NH₂, -NHSO₂(C_1-6 알킬), -SO₂N(C_1-6 알킬)₂, -SO₂NH(C_1-6 알킬), -SO₂NH₂, -SO₂C_1-6 알킬, -SO₂OC_1-6 알킬, -OSO₂C_1-6 알킬, -SOC_1-6 알킬, -Si(C_1-6 알킬)₃, -OSi(C_1-6 알킬)₃, -C(=S)N(C_1-6 알킬)₂, C(=S)NH(C_1-6 알킬), C(=S)NH₂, -C(=O)S(C_1-6 알킬), -C(=S)SC_1-6 알킬, -SC(=S)SC_1-6 알킬, -P(=O)(OC_1-6 알킬)₂, -P(=O)(C_1-6 알킬)₂, -OP(=O)(C_1-6 알킬)₂, -OP(=O)(OC_1-6 알킬)₂, C_1-6 알킬, C_1-6 퍼할로알킬, C_2-6 알케닐, C_2-6 알키닐, 헤테로C_1-6 알킬, 헤테로C_2-6 알케닐, 헤테로C_2-6 알키닐, C_3-10 카보사이클릴, C_6-10 아릴, 3-10원 헤테로사이클릴, 5-10원 헤테로아릴이거나; 2개의 같은 자리 R^gg 치환기는 연결되어 =O 또는 =S를 형성할 수 있고; 여기서 X^-는 반대이온이다.

"반대이온" 또는 "음이온성 반대이온"은 전자 중성을 유지하기 위해 양으로 하전된 기와 관련된 음으로 하전된 기이다. 음이온성 반대이온은 1가(즉, 하나의 형식 음전하 포함)일 수 있다. 음이온성 반대이온은 또한 2가 또는 3가와 같은 다가(즉, 하나 초과의 형식 음전하 포함)일 수 있다. 예시적인 반대이온은 할로겐화 이온(예를 들어, F^-, Cl^-, Br^-, I^-), NO₃ ^-, ClO₄ ^-, OH^-, H₂PO₄ ^-, HCO₃ ^-, HSO₄ ^-, 설포네이트 이온(예를 들어, 메탄설포네이트, 트리플루오로메탄설포네이트, p-톨루엔설포네이트, 벤젠설포네이트, 10-캄포르 설포네이트, 나프탈렌-2-설포네이트, 나프탈렌-1-설폰산-5-설포네이트, 에탄-1-설폰산-2-설포네이트 등), 카복실레이트 이온(예를 들어, 아세테이트, 프로파노에이트, 벤조에이트, 글리세레이트, 락테이트, 타르트레이트, 글리콜레이트, 글루코네이트 등), BF₄ ^-, PF₄ ^-, PF₆ ^-, AsF₆ ^-, SbF₆ ^-, B[3,5-(CF₃)₂C₆H₃]₄]^-, B(C₆F₅)₄ ^-, BPh₄ ^-, Al(OC(CF₃)₃)₄ ^-, 및 카보란 음이온(예를 들어, CB₁₁H₁₂ ^- 또는 (HCB₁₁Me₅Br₆)^-)을 포함한다. 다가일 수 있는 예시적인 반대이온은 CO₃ ^2-, HPO₄ ^2-, PO₄ ^3- _, B₄O₇ ^2-, SO₄ ^2-, S₂O₃ ^2-, 카복실레이트 음이온(예를 들어, 타르트레이트, 시트레이트, 푸마레이트, 말레에이트, 말레이트, 말로네이트, 글루코네이트, 석시네이트, 글루타레이트, 아디페이트, 피멜레이트, 수베레이트, 아젤레이트, 세바케이트, 살리실레이트, 프탈레이트, 아스파르테이트, 글루타메이트 등), 및 카보란을 포함한다.

용어 "약학적으로 허용되는 염"은 건전한 의학적 판단 범위 내에서 과도한 독성, 자극, 알레르기 반응 등이 없이 인간 및 하등 동물의 조직과 접촉하여 사용하기에 적합하고 합리적인 이득/위험 비율에 부합되는 이러한 염을 지칭한다. 약학적으로 허용되는 염은 당업계에 익히 공지되어 있다. 예를 들어, Berge 등은 문헌(J. Pharmaceutical Sciences, 1977, 66, 1-19)에서 약학적으로 허용되는 염을 상세하게 기재하며, 이 문헌은 참조로 포함된다. 본 출원에 개시된 화합물의 약학적으로 허용되는 염은 적합한 무기 및 유기 산 및 염기로부터 유도된 것들을 포함한다. 약학적으로 허용되는 무독성 산 부가염의 예는 염산, 브롬화수소산, 인산, 황산 및 과염소산과 같은 무기산으로, 또는 아세트산, 옥살산, 말레산, 타르타르산, 시트르산, 석신산 또는 말론산과 같은 유기산으로, 또는 이온 교환과 같은 당업계에 공지된 다른 방법을 사용하여 형성된 아미노 기의 염이다. 다른 약학적으로 허용되는 염은 아디페이트, 알지네이트, 아스코르베이트, 아스파르테이트, 벤젠설포네이트, 벤조에이트, 바이설페이트, 보레이트, 부티레이트, 캄포레이트, 캄포르설포네이트, 시트레이트, 사이클로펜탄프로피오네이트, 디글루코네이트, 도데실설페이트, 에탄설포네이트, 포르메이트, 푸마레이트, 글루코헵토네이트, 글리세로포스페이트, 글루코네이트, 헤미설페이트, 헵타노에이트, 헥사노에이트, 하이드로요오다이드, 2-하이드록시-에탄설포네이트, 락토비오네이트, 락테이트, 라우레이트, 라우릴 설페이트, 말레이트, 말레에이트, 말로네이트, 메탄설포네이트, 2-나프탈렌설포네이트, 니코티네이트, 니트레이트, 올레에이트, 옥살레이트, 팔미테이트, 파모에이트, 펙티네이트, 퍼설페이트, 3-페닐프로피오네이트, 포스페이트, 피크레이트, 피발레이트, 프로피오네이트, 스테아레이트, 석시네이트, 설페이트, 타르트레이트, 티오시아네이트, p-톨루엔설포네이트, 운데카노에이트, 발레레이트 등을 포함한다. 적절한 염기로부터 유래된 염은 알칼리 금속, 알칼리 토금속, 암모늄 및 N⁺(C_1-4 알킬)₄ ^- 염을 포함한다. 대표적인 알칼리 또는 알칼리 토금속 염은 나트륨, 리튬, 칼륨, 칼슘, 마그네슘 등을 포함한다. 추가의 약학적으로 허용되는 염은, 적절한 경우, 할라이드, 하이드록사이드, 카복실레이트, 설페이트, 포스페이트, 니트레이트, 저급 알킬 설포네이트 및 아릴 설포네이트와 같은 반대이온을 사용하여 형성된 무독성 암모늄, 4차 암모늄, 및 아민 양이온을 포함한다.

용어 "용매화물"은 일반적으로 가용매분해 반응에 의해 용매와 회합된 화합물의 형태를 지칭한다. 이러한 물리적 회합은 수소 결합을 포함할 수 있다. 통상적인 용매는 물, 메탄올, 에탄올, 아세트산, DMSO, THF, 디에틸 에테르 등을 포함한다. 화학식 (1), (9), (10), 및 (11)의 화합물은, 예를 들어, 결정질 형태로 제조될 수 있고 용매화될 수 있다. 적합한 용매화물은 약학적으로 허용되는 용매화물을 포함하고, 화학량론적 용매화물과 비화학량론적 용매화물 둘 모두를 추가로 포함한다. 특정 경우에, 용매화물은, 예를 들어, 하나 이상의 용매 분자가 결정질 고체의 결정 격자에 혼입될 때 단리될 수 있을 것이다. "용매화물"은 용액 상(solution-phase) 및 단리 가능한 용매화물 둘 모두를 포함한다. 대표적인 용매화물은 수화물, 에탄올레이트, 및 메탄올레이트를 포함한다.

용어 "수화물"은 물과 회합된 화합물을 지칭한다. 전형적으로, 화합물의 수화물에 함유된 물 분자의 수는 수화물 중 화합물 분자의 수에 대한 일정한 비율이다. 따라서, 화합물의 수화물은, 예를 들어, 일반식 RㆍxH₂O로 표시될 수 있으며, 여기서 R은 화합물이고 x는 0 초과의 수이다. 주어진 화합물은, 예를 들어, 일수화물(x는 1임), 저급 수화물(x는 0 초과 1 미만의 수로, 예를 들어, 반수화물(Rㆍ0.5 H₂O)임) 및 다가수화물(polyhydrate) (x는 1 초과의 수로, 예를 들어, 이수화물(Rㆍ2 H₂O) 및 육수화물(Rㆍ6 H₂O)임)을 포함하는 하나 초과의 유형의 수화물을 형성할 수 있다.

용어 "호변이성질체"는 특정 화합물 구조의 상호교환 가능한 형태이고 수소 원자 및 전자의 변위가 다양한 화합물을 지칭한다. 따라서, 두 구조는 π 전자와 원자(일반적으로 H)의 이동을 통해 평형 상태에 있을 수 있다. 예를 들어, 에놀과 케톤은 산 또는 염기로 처리하여 신속하게 상호 전환되기 때문에 호변이성질체이다. 호변이성질 현상의 또 다른 예는 산 또는 염기로 처리하여 마찬가지로 형성되는 페닐니트로메탄의 산 및 니트로 형태이다. 호변이성질체 형태는 관심 화합물의 최적의 화학 반응성 및 생물학적 활성의 달성과 관련될 수 있다.

또한, 동일한 분자식을 갖지만 원자의 결합 성질 또는 순서 또는 공간에서 원자의 배열이 상이한 화합물은 "이성질체"로 지칭되는 것으로 이해되어야 한다. 공간에서 원자의 배열이 상이한 이성질체는 "입체이성질체"로 지칭된다.

서로의 거울상이 아닌 입체이성질체는 "부분입체이성질체"로 지칭되고, 서로의 거울상이 중첩될 수 없는 것들은 "거울상이성질체"로 지칭된다. 화합물이 비대칭 중심을 갖는 경우, 예를 들어, 4개의 다른 기에 결합되는 경우, 한 쌍의 거울상이성질체가 가능하다. 거울상이성질체는 비대칭 중심의 절대적 구성을 특징으로 할 수 있으며 칸 및 프렐로그(Cahn and Prelog)의 R- 및 S- 순서결정 규칙에 의해 설명된다. 거울상이성질체는 또한 분자가 편광면을 회전시키는 방식을 특징으로 할 수 있으며 우선성 또는 좌선성으로서(즉, 각각 (+) 또는 (-)-이성질체로서) 지정된다. 키랄 화합물은 개별 거울상이성질체 또는 거울상이성질체의 혼합물로서 존재할 수 있다. 동일한 비율의 거울상이성질체를 함유하는 혼합물은 "라세미 혼합물"로 불린다.

용어 "공결정"은 적어도 2개의 상이한 성분(예를 들어, 본 출원에 기재된 화합물 및 산)을 포함하는 결정질 구조를 지칭하며, 여기서 각각의 성분은 독립적으로 원자, 이온 또는 분자이다. 특정 구현예에서, 어떠한 성분도 용매가 아니다. 특정 구현예에서, 성분 중 적어도 하나는 용매이다. 화합물과 산의 공결정은 화합물과 산으로부터 형성된 염과는 상이하다. 염에서, 본 출원에 기재된 화합물은 산으로부터 본 출원에 기재된 화합물로의 양성자 이동(예를 들어, 완전한 양성자 이동)이 실온에서 쉽게 발생하는 방식으로 산과 착물을 형성한다. 그러나, 공결정에서, 본 출원에 기재된 화합물은 산으로부터 본 출원에 기재된 화합물로의 양성자 이동이 실온에서 쉽게 발생하지 않는 방식으로 산과 착물을 형성한다. 특정 구현예에서, 공결정에서, 산으로부터 본 출원에 기재된 화합물로의 양성자 이동이 없다. 특정 구현예에서, 공결정에서, 산으로부터 본 출원에 기재된 화합물로의 부분적인 양성자 이동이 있다. 공결정은 본 출원에 기재된 화합물의 특성(예를 들어, 용해도, 안정성, 및 제형화의 용이성)을 개선하는 데 유용할 수 있다.

용어 "다형체"는 특정 결정 패킹 배열에서 화합물 (또는 이의 염, 수화물 또는 용매화물)의 결정질 형태를 지칭한다. 동일한 화합물의 모든 다형체는 동일한 원소 조성을 갖는다. 상이한 결정질 형태는 일반적으로 X선 회절 패턴, 적외선 스펙트럼, 융점, 밀도, 경도, 결정 형상, 광학 및 전기적 특성, 안정성 및 용해도가 상이하다. 재결정화 용매, 결정화 속도, 보관 온도 및 기타 요인으로 인해 하나의 결정 형태가 지배적일 수 있다. 화합물의 다양한 다형체는 상이한 조건 하에 결정화하여 제조될 수 있다.

용어 "프로드럭"은 절단 가능한 기를 갖고 가용매분해에 의해 또는 생리학적 조건 하에 화학식 (X), (8), (9), (10), 또는 (11)의 화합물이 되고 생체내에서 약학적으로 활성인 화학식 (X), (8), (9), (10), 또는 (11)의 화합물의 유도체를 포함한 화합물을 지칭한다. 프로드럭은, 제한 없이, 용해도, 생체이용률, 조직 적합성, 또는 포유동물 유기체에서의 지연된 방출과 같은 속성을 가질 수 있다. 예는 본 출원에 기재된 화합물의 글리코실화로부터 형성된 유도체(예를 들어, 글리코시드 유도체), 담체-연결된 프로드럭(예를 들어, 에스테르 유도체), 생물전구체 프로드럭(분자 변형에 의해 활성 화합물로 대사되는 프로드럭) 등을 포함하는 본 출원에 기재된 화합물의 유도체를 포함하지만 이에 제한되지 않는다. 글리코시드 유도체의 비제한적인 예는 PCT 공개 번호 WO2018208875 및 미국 특허 공개 번호 2019/0078168에 개시되어 있으며 이로부터 참조로 포함된다. 에스테르 유도체의 비제한적인 예는 미국 특허 공개 번호 US2017/0362195에 개시되어 있으며 이로부터 참조로 포함된다.

본 발명의 화합물의 다른 유도체는 이들의 산 및 산 유도체 형태 둘 모두에서 활성을 갖지만, 산 민감성 형태는 종종 포유동물 유기체에서 용해도, 생체이용률, 조직 적합성 또는 지연된 방출의 이점을 제공한다(문헌(Bundgard, H., Design of Prodrugs, pp. 7-9, 21-24, Elsevier, Amsterdam 1985) 참조). 프로드럭은, 예를 들어, 모산(parent acid)과 적합한 알코올의 반응에 의해 제조된 에스테르, 또는 모산 화합물과 치환 또는 비치환된 아민, 또는 산 무수물, 또는 혼합 무수물의 반응에 의해 제조된 아미드와 같은 당업자에게 익히 공지된 산 유도체를 포함한다. 본 발명의 화합물에 펜던트된 산성 기로부터 유도된 단순 지방족 또는 방향족 에스테르, 아미드 및 무수물이 특정 프로드럭이다. 일부 경우에, (아실옥시)알킬 에스테르 또는 ((알콕시카보닐)옥시)알킬에스테르와 같은 이중 에스테르 유형 프로드럭을 제조하는 것이 바람직하다. 화학식 (X), (8), (9), (10), 또는 (11)의 화합물의 C₁-C₈ 알킬, C₂-C₈ 알케닐, C₂-C₈ 알키닐, 아릴, C₇-C₁₂ 치환된 아릴, 및 C₇-C₁₂ 아릴알킬 에스테르가 바람직할 수 있다.

칸나비노이드

본 출원에서 사용된 바와 같이, 용어 "칸나비노이드"는 하기 화학식 (X)의 화합물 또는 이의 약학적으로 허용되는 염, 공결정, 호변이성질체, 입체이성질체, 용매화물, 수화물, 다형체, 동위원소적으로 농축된 유도체, 또는 프로드럭을 포함한다:

상기 식에서, R1은 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴이고; R2 및 R6은 독립적으로 수소 또는 카복실이고; R3 및 R5는 독립적으로 하이드록실, 할로겐, 또는 알콕시이고; R4는 수소 또는 임의로 치환된 프레닐 모이어티이거나; 임의로 R4 및 R3은 이들의 개재 원자와 함께 취하여 사이클릭 모이어티를 형성하거나, 임의로 R4 및 R5는 이들의 개재 원자와 함께 취하여 사이클릭 모이어티를 형성하거나, 임의로 1) R4 및 R3은 이들의 개재 원자와 함께 취하여 사이클릭 모이어티를 형성할 뿐만 아니라, 2) R4 및 R5는 이들의 개재 원자와 함께 취하여 사이클릭 모이어티도 형성한다. 특정 구현예에서, R4 및 R3은 이들의 개재 원자와 함께 취하여 사이클릭 모이어티를 형성한다. 특정 구현예에서, R4 및 R5는 이들의 개재 원자와 함께 취하여 사이클릭 모이어티를 형성한다. 특정 구현예에서, "칸나비노이드"는 화학식 (X)의 화합물 또는 이의 약학적으로 허용되는 염을 지칭한다. 특정 구현예에서, 1) R4 및 R3은 이들의 개재 원자와 함께 취하여 사이클릭 모이어티를 형성할 뿐만 아니라, 2) R4 및 R5는 이들의 개재 원자와 함께 취하여 사이클릭 모이어티도 형성한다.

일부 구현예에서, 칸나비노이드는 다음 단계를 통해 합성될 수 있다: a) 3개의 추가 케톤 모이어티를 아실-CoA 스캐폴드에 혼입시키기 위한 하나 이상의 반응으로, 여기서 아실-CoA 스캐폴드의 아실 모이어티는 4개와 14개 사이의 탄소를 포함하는 것인, 하나 이상의 반응; b) 단계 (a)의 생성물을 고리화하는 반응; 및 c) 프레닐 모이어티를 단계 (b)의 생성물 또는 단계 (b)의 생성물의 유도체에 혼입시키기 위한 반응. 일부 구현예에서, 단계 (a)에 기재된 아실-CoA 스캐폴드의 비제한적인 예는 헥사노일-CoA 및 부티릴-CoA를 포함한다. 일부 구현예에서, 단계 (b)의 생성물 또는 단계 (b)의 생성물의 유도체의 비제한적인 예는 올리베톨산 디바린산, 및 스패로포롤산을 포함한다.

일부 구현예에서, 화학식 (X)의 칸나비노이드 화합물은 하기 화학식 (X-A), (X-B), 또는 (X-C) 또는 이의 약학적으로 허용되는 염, 용매화물, 수화물, 다형체, 공결정, 호변이성질체, 입체이성질체, 동위원소적으로 표지된 유도체, 또는 프로드럭이다:

상기 식에서,

는 원자가가 허용하는 대로 이중 결합 또는 단일 결합이고;

R은 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴이고;

R^Z1은 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴이고;

R^Z2는 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴이고;

또는 임의로, R^Z1 및 R^Z2는 이들의 개재 원자와 함께 취하여 임의로 치환된 카보사이클릭 고리를 형성하고;

R^3A는 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 또는 임의로 치환된 알키닐이고;

R^3B는 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 또는 임의로 치환된 알키닐이고;

R^Y는 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 또는 임의로 치환된 알키닐이고;

R^Z는 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 또는 임의로 치환된 알키닐이다.

특정 구현예에서, 칸나비노이드 화합물은 하기 화학식 (X-A)의 화합물이다:

.

상기 식에서,

는 이중 결합이고, 각각의 R^Z1 및 R^Z2는 수소이고, R^3A 및 R^3B 중 하나는 임의로 치환된 C_2-6 알케닐이고, R^3A 및 R^3B 중 다른 하나는 임의로 치환된 C_2-6 알킬이다. 일부 구현예에서, 화학식 (X)의 칸나비노이드 화합물은 화학식 (X-A)의 화합물이고, 여기서 각각의 R^Z1 및 R^Z2는 수소이고, R^3A 및 R^3B 중 하나는 프레닐 기이고, R^3A 및 R^3B 중 다른 하나는 임의로 치환된 메틸이다.

특정 구현예에서, 화학식 (X-A)의 화학식 (X)의 칸나비노이드 화합물은 하기 화학식 (11-z)의 화합물이다:

.

상기 식에서,

는 원자가가 허용하는 대로 이중 결합 또는 단일 결합이고; R^3A 및 R^3B 중 하나는 알케닐로 임의로 치환된 C_1-6 알킬이고, R^3A 및 R^3B 중 다른 하나는 임의로 치환된 C_1-6 알킬이다. 특정 구현예에서, 화학식 (11-z)의 화합물에서,

는 단일 결합이고; R^3A 및 R^3B 중 하나는 프레닐로 임의로 치환된 C_1-6 알킬이고; R^3A 및 R^3B 중 다른 하나는 비치환된 메틸이고; R은 본 출원에 기재된 바와 같다. 특정 구현예에서, 화학식 (11-z)의 화합물에서,

는 단일 결합이고; R^3A 및 R^3B 중 하나는

이고; R^3A 및 R^3B 중 다른 하나는 비치환된 메틸이고; R은 본 출원에 기재된 바와 같다. 특정 구현예에서, 화학식 (11-z)의 칸나비노이드 화합물은 하기 화학식 (11a)의 화합물이다:

특정 구현예에서, 화학식 (X-A)의 화학식 (X)의 칸나비노이드 화합물은 하기 화학식 (11a)의 화합물이다:

특정 구현예에서, 화학식 (X-A)의 칸나비노이드 화합물은 하기 화학식 (10-z)의 화합물이다:

.

상기 식에서,

는 원자가가 허용하는 대로 이중 결합 또는 단일 결합이고; R^Y는 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 또는 임의로 치환된 알키닐이고; 각각의 R^3A 및 R^3B는 독립적으로 임의로 치환된 C_1-6 알킬이다. 특정 구현예에서, 화학식 (10-z)의 화합물에서,

는 단일 결합이고; 각각의 R^3A 및 R^3B는 비치환된 메틸이고, R은 본 출원에 기재된 바와 같다. 특정 구현예에서, 화학식 (10-z)의 칸나비노이드 화합물은 하기 화학식 (10a)의 화합물이다:

. 특정 구현예에서, 화학식 (10a)의 화합물(

)은 탄소 10에서 *로 표지된 키랄 원자 및 탄소 6에서 **로 표지된 키랄 원자를 갖는다. 특정 구현예에서, 화학식 (10a)의 화합물(

)에서, 탄소 10에서 *로 표지된 키랄 원자는 R-배열 또는 S-배열이고; 탄소 6에서 **로 표지된 키랄 원자는 R-배열이다. 특정 구현예에서, 화학식 (10a)의 화합물(

)에서, 탄소 10에서 *로 표지된 키랄 원자는 S-배열이고; 탄소 6에서 **로 표지된 키랄 원자는 R-배열 또는 S-배열이다. 특정 구현예에서, 화학식 (10a)의 화합물(

)에서, 탄소 10에서 *로 표지된 키랄 원자는 R-배열이고, 탄소 6에서 **로 표지된 키랄 원자는 R-배열이다. 특정 구현예에서, 화학식 (10a)의 화합물(

)은 하기 화학식의 화합물이다:

특정 구현예에서, 화학식 (10a)의 화합물(

)에서, 탄소 10에서 *로 표지된 키랄 원자는 S-배열이고 탄소 6에서 **로 표지된 키랄 원자는 S-배열이다. 특정 구현예에서, 화학식 (10a)의 화합물(

)은 하기 화학식의 화합물이다:

특정 구현예에서, 칸나비노이드 화합물은 하기 화학식 (X-B)의 화합물이다:

상기 식에서,

는 이중 결합이고; R^Y는 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 또는 임의로 치환된 알키닐이고; 각각의 R^3A 및 R^3B는 독립적으로 임의로 치환된 C_1-6 알킬이다. 특정 구현예에서, 화학식 (X-B)의 화합물에서, R^Y는 임의로 치환된 C_1-6 알킬이고; R^3A 및 R^3B 중 하나는

이고; R^3A 및 R^3B 중 다른 하나는 비치환된 메틸이고, R은 본 출원에 기재된 바와 같다. 특정 구현예에서, 화학식 (X-B)의 화합물은 하기 화학식 (9a)의 화합물이다:

특정 구현예에서, 화학식 (9a)의 화합물(

)은 탄소 3에서 *로 표지된 키랄 원자 및 탄소 4에서 **로 표지된 키랄 원자를 갖는다. 특정 구현예에서, 화학식 (9a)의 화합물(

)에서, 탄소 3에서 *로 표지된 키랄 원자는 R-배열 또는 S-배열이고; 탄소 4에서 **로 표지된 키랄 원자는 R-배열이다. 특정 구현예에서, 화학식 (9a)의 화합물(

)에서, 탄소 3에서 *로 표지된 키랄 원자는 S-배열이고; 탄소 4에서 **로 표지된 키랄 원자는 R-배열 또는 S-배열이다. 특정 구현예에서, 화학식 (9a)의 화합물(

)에서, 탄소 3에서 *로 표지된 키랄 원자는 R-배열이고, 탄소 4에서 **로 표지된 키랄 원자는 R-배열이다. 특정 구현예에서, 화학식 (9a)의 화합물(

)은 하기 화학식의 화합물이다:

특정 구현예에서, 화학식 (9a)의 화합물(

)에서, 탄소 3에서 *로 표지된 키랄 원자는 S-배열이고, 탄소 4에서 **로 표지된 키랄 원자는 S-배열이다. 특정 구현예에서, 화학식 (9a)의 화합물(

)은 하기 화학식의 화합물이다:

특정 구현예에서, 칸나비노이드 화합물은 하기 화학식 (X-C)의 화합물이다:

상기 식에서, R^Z는 임의로 치환된 알킬 또는 임의로 치환된 알케닐이다. 특정 구현예에서, 화학식 (X-C)의 화합물은 하기 화학식의 화합물이다:

상기 식에서, a는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10이다. 특정 구현예에서, a는 1이다. 특정 구현예에서, a는 2이다. 특정 구현예에서, a는 3이다. 특정 구현예에서, a는 화학식 (X-C)의 화합물의 경우, 1, 2, 또는 3이다. 특정 구현예에서, 칸나비노이드 화합물은 화학식 (X-C)의 화합물이고, a는 1, 2, 3, 4, 또는 5이다. 특정 구현예에서, 화학식 (X-C)의 화합물은 하기 화학식 (8a)의 화합물이다:

일부 구현예에서, 본 개시내용의 칸나비노이드는 칸나비노이드 수용체 리간드를 포함한다. 칸나비노이드 수용체는 G 단백질-결합된 수용체 슈퍼패밀리에 있는 세포막 수용체 부류이다. 칸나비노이드 수용체는 CB₁ 수용체 및 CB₂ 수용체를 포함한다. 일부 구현예에서, 칸나비노이드 수용체는 GPR18, GPR55, 및 PPAR을 포함한다(문헌(Bram et al. "Activation of GPR18 by cannabinoid compounds: a tale of biased agonism" Br J Pharmcol v171 (16) (2014); Shi et al. "The novel cannabinoid receptor GPR55 mediates anxiolytic-like effects in the medial orbital cortex of mice with acute stress" Molecular Brain 10, No. 38 (2017); and O'Sullvan, Elizabeth. "An update on PPAR activation by cannabinoids" Br J Pharmcol v. 173(12) (2016)) 참조).

일부 구현예에서, 칸나비노이드는 체내에서 생성되는 물질인 엔도칸나비노이드와 대마초 속의 식물에 의해 자연적으로 생성되는 칸나비노이드인 파이토칸나비노이드로 구성된다. 일부 구현예에서, 파이토칸나비노이드는 자연 발생 식물 유래 칸나비노이드의 산성 및 탈카복실화된 산 형태 및 이들의 합성 및 생합성 등가물로 구성된다.

현재까지 94개 초과의 파이토칸나비노이드가 확인되었다(Berman, Paula, et al. "A new ESI-LC/MS approach for comprehensive metabolic profiling of phytocannabinoids in Cannabis."　Scientific reports　8.1 (2018): 14280; El-Alfy et al., 2010, "Antidepressant-like effect of delta-9-tetrahydrocannabinol and other cannabinoids isolated from Cannabis sativa L", Pharmacology Biochemistry and Behavior 95 (4): 434-42; Rudolf Brenneisen, 2007, Chemistry and Analysis of Phytocannabinoids, Citti, Cinzia, et al. "A novel phytocannabinoid isolated from Cannabis sativa L. with an in vivo cannabimimetic activity higher than △9-tetrahydrocannabinol: △9-Tetrahydrocannabiphorol." Sci Rep 9 (2019): 20335, 이들 각각은 그 전체가 본 출원에 참조로 포함됨). 일부 구현예에서, 칸나비노이드는 △⁹-테트라하이드로칸나비놀(THC) 유형(예를 들어, (-)-트랜스-델타-9-테트라하이드로칸나비놀 또는 드로나비놀, (+)-트랜스-델타-9-테트라하이드로칸나비놀, (-)-시스-델타-9-테트라하이드로칸나비놀, 또는 (+)-시스-델타-9-테트라하이드로칸나비놀), 칸나비디올(CBD) 유형, 칸나비게롤(CBG) 유형, 칸나비크로멘(CBC) 유형, 칸나바이사이클롤(CBL) 유형, 칸나비노디올(CBND) 유형, 또는 칸나비트리올(CBT) 유형 칸나비노이드, 또는 이들의 임의의 조합을 포함한다(예를 들어, 문헌(R Pertwee, ed, Handbook of Cannabis (Oxford, UK: Oxford University Press, 2014) 참조, 이는 그 전체가 본 출원에 참조로 포함됨). 칸나비노이드의 비제한적인 목록은 다음을 포함한다: 칸나비오르콜-C1(CBNO), CBND-C1(CBNDO), △⁹-트랜스-테트라하이드로칸나비오르콜산-C1(△⁹-THCO), 카나비디오르콜-C1(CBDO), 카나비오르크로멘-C1(CBCO), (-)-△⁸-트랜스-(6aR,10aR)-테트라하이드로칸나비오르콜-C1(△⁸-THCO), 칸나비오르사이클롤 C1(CBLO), CBG-C1(CBGO), 칸나비놀-C2(CBN-C2), CBND-C2, △⁹-THC-C2, CBD-C2, CBC-C2, △⁸-THC-C2, CBL-C2, 비스노르-칸나비엘소인-C1(CBEO), CBG-C2, 칸나비바린-C3(CBNV), 칸나비노디바린-C3(CBNDV), (-)-△⁹-트랜스-테트라하이드로칸나비바린-C3(△⁹-THCV), (-)-칸나비디바린-C3(CBDV), (±)-칸나비크로메바린-C3(CBCV), (-)-△⁸-트랜스-THC-C3(△⁸-THCV), (±)-(1aS,3aR,8bR,8cR)-칸나비사이클로바린-C3(CBLV), 2-메틸-2-(4-메틸-2-펜테닐)-7-프로필-2H-1-벤조피란-5-올, △⁷-테트라하이드로칸나비바린-C3(△⁷-THCV), CBE-C2, 칸나비게로바린-C3(CBGV), 칸나비트리올-C1(CBTO), 칸나비놀-C4(CBN-C4), CBND-C4, (-)-△⁹-트랜스-테트라하이드로칸나비놀-C4(△⁹-THC-C4), 칸나비디올-C4(CBD-C4), CBC-C4, (-)-트랜스-△⁸-THC-C4, CBL-C4, 칸나비엘소인-C3(CBEV), CBG-C4, CBT-C2, 칸나비크로마논-C3, 칸나비글렌돌-C3(OH-이소-HHCV-C3), 칸나비옥세판-C5(CBX), 데하이드로칸나비푸란-C5(DCBF), 칸나비놀-C5(CBN), 칸나비노디올-C5(CBND), (-)-△⁹-트랜스-테트라하이드로칸나비놀-C5(△⁹-THC), (-)-△⁸-트랜스-(6aR,10aR)-테트라하이드로칸나비놀-C5(△⁸-THC), (±)-칸나비크로멘-C5(CBC), (-)-칸나비디올-C5(CBD), (±)-(1aS,3aR,8bR,8cR)-칸나비사이클롤C5(CBL), 칸나비시트란-C5(CBR), (-)-△⁹-(6aS,10aR-시스)-테트라하이드로칸나비놀-C5((-)-시스-△⁹-THC), (-)-△⁷-트랜스-(1R,3R,6R)-이소테트라하이드로칸나비놀-C5(트랜스-이소△⁷-THC), CBE-C4, 칸나비게롤-C5(CBG), 칸나비트리올-C3(CBTV), 칸나비놀 메틸 에테르-C5(CBNM), CBNDM-C5, 8-OH-CBN-C5(OH-CBN), OH-CBND-C5(OH-CBND), 10-옥소-△^6a(10a)-테트라하이드로칸나비놀-C5(OTHC), 칸나비크로마논 D-C5, 칸나비쿠마로논-C5(CBCON-C5), 칸나비디올 모노메틸 에테르-C5(CBDM), △⁹-THCM-C5, (±)-3"-하이드록시-△^4"-칸나비크로멘-C5, (5aS,6S,9R,9aR)-칸나비엘소인-C5(CBE), 2-게라닐-5-하이드록시-3-n-펜틸-1,4-벤조퀴논-C5, 5-게라닐 올리베톨산, 5-게라닐 올리베톨레이트, 8α-하이드록시-△⁹-테트라하이드로칸나비놀-C5(8α-OH-△⁹-THC), 8β-하이드록시-△⁹-테트라하이드로칸나비놀-C5(8β-OH-△⁹-THC), 10α-하이드록시-△⁸-테트라하이드로칸나비놀-C5(10α-OH-△⁸-THC), 10β-하이드록시-△⁸-테트라하이드로칸나비놀-C5(10β-OH-△⁸-THC), 10α-하이드록시-△^9,11-헥사하이드로칸나비놀-C5, 9β,10β-에폭시헥사하이드로칸나비놀-C5, OH-CBD-C5(OH-CBD), 칸나비게롤 모노메틸 에테르-C5(CBGM), 칸나비크로마논-C5, CBT-C4, (±)-6,7-시스-에폭시칸나비게롤-C5, (±)-6,7-트랜스-에폭시칸나비게롤-C5, (-)-7-하이드록시칸나비크로만-C5, 칸나비모본-C5, (-)-트랜스-칸나비트리올-C5((-)-트랜스-CBT), (+)-트랜스-칸나비트리올-C5((+)-트랜스-CBT), (±)-시스-칸나비트리올-C5((±)-시스-CBT), (-)-트랜스-10-에톡시-9-하이드록시-△^6a(10a)-테트라하이드로칸나비바린-C3 [(-)-트랜스-CBT-OEt], (-)-(6aR,9S,10S,10aR)-9,10-디하이드록시헥사하이드로칸나비놀-C5 [(-)-칸나비립솔] (CBR), 칸나비크로마논 C-C5, (-)-6a,7,10a-트리하이드록시-△⁹-테트라하이드로칸나비놀-C5[(-)-칸나비테트롤] (CBTT), 칸나비크로마논 B-C5, 8,9-디하이드록시-△^6a(10a)-테트라하이드로칸나비놀-C5(8,9-디-OHCBT), (±)-4-아세톡시칸나비크로멘-C5, 2-아세톡시-6-게라닐-3-n-펜틸-1,4-벤조퀴논-C5, 11-아세톡시-△9-테트라하이드로칸나비놀C5(11-OAc-△9-THC), 5-아세틸-4-하이드록시칸나비게롤-C5, 4-아세톡시-2-게라닐-5-하이드록시-3-펜틸페놀-C5, (-)-트랜스-10-에톡시-9-하이드록시-△^6a(10a)-테트라하이드로칸나비놀-C5((-)-트랜스-CBTOEt), 세스퀴칸나비게롤-C5(SesquiCBG), 카마게롤-C5, 4-테르페닐 칸나비놀레이트-C5, β-펜칠-△⁹-테트라하이드로칸나비놀레이트-C5, α-펜칠-△⁹-테트라하이드로칸나비놀레이트-C5, 에피-보르닐-△⁹-테트라하이드로칸나비놀레이트-C5, 보르닐-△⁹-테트라하이드로칸나비놀레이트-C5, α-테르페닐-△⁹-테트라하이드로칸나비놀레이트-C5, 4-테르페닐-△⁹-테트라하이드로칸나비놀레이트-C5, 6,6,9-트리메틸-3-펜틸-6H-디벤조[b,d]피란-1-올, 3-(1,1-디메틸헵틸)-6,6a,7,8,10,10a-헥사하이드로-1-하이드록시-6,6-디메틸-9H-디벤조[b,d]피란-9-온, (-)-(3S,4S)-7-하이드록시-△⁶-테트라하이드로칸나비놀-1,1-디메틸헵틸, (+)-(3S,4S)-7-하이드록시-△⁶-테트라하이드로칸나비놀-1,1-디메틸헵틸, 11-하이드록시-△⁹-테트라하이드로칸나비놀, 및 △⁸-테트라하이드로칸나비놀-11-오익산)); 특정 피페리딘 유사체(예를 들어, (-)-(6S,6aR,9R,10aR)-5,6,6a,7,8,9,10,10a-옥타하이드로-6-메틸-3-[(R)-1-메틸-4-페닐부톡시]-1,9-페난트리딘디올 1-아세테이트)), 특정 아미노알킬인돌 유사체(예를 들어, (R)-(+)-[2,3-디하이드로-5-메틸-3-(4-모르폴리닐메틸)-피롤로[1,2,3-데]-1,4-벤족사진-6-일]-1-나프탈레닐-메타논), 특정 개방 피란 고리 유사체(예를 들어, 2-[3-메틸-6-(1-메틸에테닐)-2-사이클로헥센-1-일]-5-펜틸-1,3-벤젠디올 및 4-(1,1-디메틸헵틸)-2,3'-디하이드록시-6'알파-(3-하이드록시프로필)-1',2',3',4',5',6'-헥사하이드로비페닐, 테트라하이드로칸나비포롤(THCP), 칸나비디포롤(CBDP), CBGP, CBCP, 이들의 산성 형태, 산성 형태의 염, 상기의 임의의 조합의 이량체, 상기의 임의의 조합의 삼량체, 상기의 임의의 조합의 중합체, 또는 이들의 임의의 조합.

본 출원에 기재된 칸나비노이드는 희귀 칸나비노이드일 수 있다. 예를 들어, 일부 구현예에서, 본 출원에 기재된 칸나비노이드는 암꽃의 건조 중량 기준으로 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 0.9%, 0.8%, 0.7%, 0.6%, 0.5%, 0.25%, 또는 0.1% 미만의 농도로 통상적인 대마초 품종에서 자연적으로 생성되는 칸나비노이드에 상응한다. 일부 구현예에서, 휘귀 칸나비노이드는 CBGA, CBGVA, THCVA, CBDVA, CBCVA, 및 CBCA를 포함한다. 일부 구현예에서, 휘귀 칸나비노이드는 THCA, THC, CBDA 또는 CBD가 아닌 칸나비노이드이다.

본 출원에 기재된 칸나비노이드는 또한 희귀하지 않은 칸나비노이드일 수 있다.

일부 구현예에서, 칸나비노이드는 표 1에 열거된 칸나비노이드로부터 선택된다.

표 1. 본 개시내용에 따른 칸나비노이드의 비제한적인 예.

칸나비노이드는 종종 "유형", 즉 프레닐 모이어티의 위상학적 배열에 의해 분류된다(예를 들어, 문헌(M. A. Elsohly and D. Slade, Life Sci., 2005, 78, 539-548; 및 L.O. Hanus et al. Nat. Prod. Rep., 2016, 33, 1357) 참조). 일반적으로, 칸나비노이드의 각각의 "유형"은 메타 위치에서 2개의 하이드록실 모이어티에 대한 레조르시놀 모이어티의 고리 치환에 대해 가능한 변형을 포함한다. 본원에 사용된 바와 같이, "CBG 유형" 칸나비노이드는 벤조산 모이어티의 6 위치에서 임의로 치환된 3-[(2E)-3,7-디메틸옥타-2,6-디에닐]-2,4-디하이드록시벤조산이다. 본원에 사용된 바와 같이, "CBG 유형" 칸나비노이드는 크로멘 모이어티의 7 위치에서 임의로 치환된 5-하이드록시-2-메틸-2-(4-메틸펜트-3-에닐)-크로멘-6-카복실산을 지칭한다. 본원에 사용된 바와 같이, "THC 유형" 칸나비노이드는 벤조[c]크로멘 모이어티의 3 위치에서 임의로 치환된 (6aR,10aR)-1-하이드록시-6,6,9-트리메틸-6a,7,8,10a-테트라하이드로벤조[c]크로멘-2-카복실산이다. 본원에 사용된 바와 같이, "CBD 유형" 칸나비노이드는 벤조산 모이어티의 6 위치에서 임의로 치환된 2,4-디하이드록시-3-[(1R,6R)-3-메틸-6-프로프-1-엔-2-일사이클로헥스-2-엔-1-일]-벤조산이다. 일부 구현예에서, 각 "유형"에 대한 임의의 고리 치환은 임의로 치환된 C₁-C₁₁ 알킬, 임의로 치환된 C₁-C₁₁ 알케닐, 임의로 치환된 C₁-C₁₁ 알키닐, 또는 임의로 치환된 C₁-C₁₁ 아르알킬이다.

칸나비노이드 및 칸나비노이드 전구체의 생합성

본 개시내용의 양태는 숙주 세포에서 칸나비노이드의 생합성 생성을 위한 도구, 서열 및 방법을 제공한다. 일부 구현예에서, 본 개시내용은 생합성에 의해 칸나비노이드를 생성할 수 있는 효소의 발현을 교시한다.

비제한적인 예로서, 도 2에 도시된 효소 중 하나 이상을 사용하여 관심 칸나비노이드 또는 칸나비노이드 전구체를 생성할 수 있다. 도 1은 대마초에서 발견되는 가장 풍부한 파이토칸나비노이드에 대한 칸나비노이드 생합성 경로를 나타낸다. 또한 문헌(de Meijer et al. I, II, III, and IV (I: 2003, Genetics, 163:335-346; II: 2005, Euphytica, 145:189-198; III: 2009, Euphytica, 165:293-311; and IV: 2009, Euphytica, 168:95-112), 및 Carvalho et al. "Designing Microorganisms for Heterologous Biosynthesis of Cannabinoids" (2017) FEMS Yeast Research Jun 1;17(4))을 참조하며, 이들 각각은 그 전체가 본 출원에 참조로 포함된다.

칸나비노이드 생합성에 사용하기 위한 전구체 기질은 일반적으로 관심 칸나비노이드에 기초하여 선택된다는 것을 인식해야 한다. 칸나비노이드 전구체의 비제한적인 예는 도 2의 화학식 (1)-(8)의 화합물을 포함한다. 일부 구현예에서, 화학식 (5)의 화합물을 포함하는 폴리케타이드는 프레닐화될 수 있다. 특정 구현예에서, 전구체는 도 1, 2, 또는 3에 나타낸 전구체 화합물이다. R이 1-40개의 탄소 원자를 포함하는 기질이 바람직하다. 일부 구현예에서, R이 3-8개의 탄소 원자를 포함하는 기질이 가장 바람직하다.

본 출원에 사용된 바와 같이, 칸나비노이드 또는 칸나비노이드 전구체는 R 기를 포함할 수 있다. 예를 들어, 도 2를 참조한다. 일부 구현예에서, R은 수소일 수 있다. 특정 구현예에서, R은 임의로 치환된 알킬이다. 특정 구현예에서, R은 임의로 치환된 C_1-40 알킬이다. 특정 구현예에서, R은 임의로 치환된 C_2-40 알킬이다. 특정 구현예에서, R은 직쇄 또는 분지형 알킬인 임의로 치환된 C_2-40 알킬이다. 특정 구현예에서, R은 임의로 치환된 C_3-8 알킬이다. 특정 구현예에서, R은 임의로 치환된 C₁-C₄₀ 알킬, C₁-C₂₀ 알킬, C₁-C₁₀ 알킬, C₁-C₈ 알킬, C₁-C₅ 알킬, C₃-C₅ 알킬, C₃ 알킬, 또는 C₅ 알킬이다. 특정 구현예에서, R은 임의로 치환된 C₁-C₂₀ 알킬이다. 특정 구현예에서, R은 임의로 치환된 C₁-C₁₀ 알킬이다. 특정 구현예에서, R은 임의로 치환된 C₁-C₈ 알킬이다. 특정 구현예에서, R은 임의로 치환된 C₁-C₅ 알킬이다. 특정 구현예에서, R은 임의로 치환된 C₁-C₇ 알킬이다. 특정 구현예에서, R은 임의로 치환된 C₃-C₅ 알킬이다. 특정 구현예에서, R은 임의로 치환된 C₃ 알킬이다. 특정 구현예에서, R은 비치환된 C₃ 알킬이다. 특정 구현예에서, R은 n-C₃ 알킬이다. 특정 구현예에서, R은 n-프로필이다. 특정 구현예에서, R은 n-부틸이다. 특정 구현예에서, R은 n-펜틸이다. 특정 구현예에서, R은 n-헥실이다. 특정 구현예에서, R은 n-헵틸이다. 특정 구현예에서, R은 하기 화학식이다:

특정 구현예에서, R은 임의로 치환된 C₄ 알킬이다. 특정 구현예에서, R은 비치환된 C₄ 알킬이다. 특정 구현예에서, R은 임의로 치환된 C₅ 알킬이다. 특정 구현예에서, R은 비치환된 C₅ 알킬이다. 특정 구현예에서, R은 임의로 치환된 C₆ 알킬이다. 특정 구현예에서, R은 비치환된 C₆ 알킬이다. 특정 구현예에서, R은 임의로 치환된 C₇ 알킬이다. 특정 구현예에서, R은 비치환된 C₇ 알킬이다. 특정 구현예에서, R은 하기 화학식이다:

특정 구현예에서, R은 하기 화학식이다:

특정 구현예에서, R은 임의로 치환된 n-프로필이다. 특정 구현예에서, R은 임의로 치환된 아릴로 임의로 치환된 n-프로필이다. 특정 구현예에서, R은 임의로 치환된 페닐로 임의로 치환된 n-프로필이다. 특정 구현예에서, R은 비치환된 페닐로 치환된 n-프로필이다. 특정 구현예에서, R은 임의로 치환된 부틸이다. 특정 구현예에서, R은 임의로 치환된 n-부틸이다. 특정 구현예에서, R은 임의로 치환된 아릴로 임의로 치환된 n-부틸이다. 특정 구현예에서, R은 임의로 치환된 페닐로 임의로 치환된 n-부틸이다. 특정 구현예에서, R은 비치환된 페닐로 치환된 n-부틸이다. 특정 구현예에서, R은 임의로 치환된 펜틸이다. 특정 구현예에서, R은 임의로 치환된 n-펜틸이다. 특정 구현예에서, R은 임의로 치환된 아릴로 임의로 치환된 n-펜틸이다. 특정 구현예에서, R은 임의로 치환된 페닐로 임의로 치환된 n-펜틸이다. 특정 구현예에서, R은 비치환된 페닐로 치환된 n-펜틸이다. 특정 구현예에서, R은 임의로 치환된 헥실이다. 특정 구현예에서, R은 임의로 치환된 n-헥실이다. 특정 구현예에서, R은 임의로 치환된 n-헵틸이다. 특정 구현예에서, R은 임의로 치환된 n-옥틸이다. 특정 구현예에서, R은 아릴(예를 들어, 페닐)로 임의로 치환된 알킬이다. 특정 구현예에서, R은 임의로 치환된 아실(예를 들어, -C(=O)Me)이다.

특정 구현예에서, R은 임의로 치환된 알케닐(예를 들어, 치환된 또는 비치환된 C_2-6 알케닐)이다. 특정 구현예에서, R은 치환된 또는 비치환된 C_2-6 알케닐이다. 특정 구현예에서, R은 치환된 또는 비치환된 C_2-5 알케닐이다. 특정 구현예에서, R은 하기 화학식이다:

특정 구현예에서, R은 임의로 치환된 알키닐(예를 들어, 치환된 또는 비치환된 C_2-6 알키닐)이다. 특정 구현예에서, R은 치환된 또는 비치환된 C_2-6 알키닐이다. 특정 구현예에서, R은 하기 화학식이다:

특정 구현예에서, R은 임의로 치환된 카보사이클릴이다. 특정 구현예에서, R은 임의로 치환된 아릴(예를 들어, 페닐 또는 나프틸)이다.

전구체 기질의 사슬 길이는 C₁-C₄₀일 수 있다. 이들 기질은, 제한 없이, 지방족, 지환족 및 방향족을 포함하는 임의의 정도 및 임의의 종류의 분지화 또는 포화 또는 사슬 구조를 가질 수 있다. 또한, 이들은 하이드록시, 할로겐, 탄수화물, 포스페이트, 메틸-함유 또는 질소-함유 작용기를 포함하는 임의의 작용기를 포함할 수 있다.

예를 들어, 도 3은 칸나비노이드 경로에 대한 추정 전구체의 비배타적인 세트를 나타낸다. 4개 내지 8개의 총 탄소(도 3에서 "C₄"-"C₈") 및 선형 또는 분지형 사슬을 갖는 최대 10-12개의 총 탄소를 포함하는 지방족 카복실산이 이종 경로에 대한 전구체로서 사용될 수 있다. 비제한적인 예는 메탄산, 부티르산, 펜탄산, 헥산산, 헵탄산, 이소발레르산, 옥탄산, 및 데칸산을 포함한다. 추가의 전구체는 에탄산 및 프로판산을 포함할 수 있다. 일부 구현예에서, 산 이외에, 에스테르, 염 및 산 형태가 모두 기질로서 사용될 수 있다. 기질은, 제한 없이, 지방족, 지환족 및 방향족을 포함하는 임의의 정도 및 임의의 종류의 분지화, 포화 및 사슬 구조를 가질 수 있다. 또한, 이들은, 제한 없이, 할로겐화, 하이드록실화, 아민화, 아실화, 알킬화, 페닐화 및/또는 펜던트 탄수화물, 포스페이트, 설페이트, 헤테로사이클 또는 지질, 또는 임의의 다른 작용기의 도입을 포함하는 임의의 기능적 변형 또는 변형의 조합을 포함할 수 있다.

본 출원에 개시된 임의의 효소에 대한 기질은 외인성으로 제공될 수 있거나 숙주 세포에 의해 내인성으로 생성될 수 있다. 일부 구현예에서, 칸나비노이드는 글루코스 기질로부터 생성되어 도 2에 나타낸 화학식 1의 화합물 및 CoA 전구체가 세포에 의해 합성된다. 다른 구현예에서, 전구체는 반응에 공급된다. 일부 구현예에서, 전구체는 도 2의 화학식 1-8로부터 선택된 화합물이다.

본 출원에 개시된 방법에 의해 생성된 칸나비노이드는 희귀 칸나비노이드를 포함한다. 휘귀 칸나비노이드를 포함하여 칸나비노이드가 자연에서 발생하는 낮은 농도로 인해, 대마초 식물로부터 산업적으로 상당한 양의 단리된 또는 정제된 칸나비노이드를 생성하는 것은, 예를 들어, 큰 부피의 대마초 식물과 식물 재료를 재배, 수확 및/또는 처리하기 위한 막대한 양의 공간, 노동, 시간 및 자본 요구사항으로 인해 금지될 수 있다(예를 들어, 문헌(Crandall, K., 2016. A Chronic Problem: Taming Energy Costs and Impacts from Marijuana Cultivation. EQ Research; Mills, E., 2012. The carbon footprint of indoor Cannabis production. Energy Policy, 46, pp.58-67; Jourabchi, M. and M. Lahet. 2014. Electrical Load Impacts of Indoor Commercial Cannabis Production. Presented to the Northwest Power and Conservation Council; O'Hare, M., D. Sanchez, and P. Alstone. 2013. Environmental Risks and Opportunities in Cannabis Cultivation. Washington State Liquor and Cannabis Board; 2018. Comparing Cannabis Cultivation Energy Consumption. New Frontier Data; and Madhusoodanan, J., 2019. Can cannabis go green? Nature Outlook: Cannabis) 참조; 이들 모두는 본 개시내용에 참조로 포함됨). 본 출원에 제공된 개시내용은 희귀 칸나비노이드를 포함하는 칸나비노이드를 고수율로 생성하기 위한 잠재적으로 효율적인 방법을 나타낸다. 본 출원에 제공된 개시내용은 또한 전통적인 칸나비노이드 생성 방법과 관련된 농업 관행 및 물 사용과 관련된 문제를 해결하기 위한 잠재적인 방법을 나타낸다(본 개시내용에 참조로 포함된 문헌(Dillis et al. "Water storage and Irrigation practices for cannabis drive seasonal patterns of water extraction and use in Northern California." Journal of Environmental Management 272 (2020): 110955) 참조).

개시된 방법에 의해 생성된 칸나비노이드는 또한 휘귀하지 않은 칸나비노이드를 포함한다. 특정 이론에 국한되지 않고, 본 출원에 기재된 방법은 희귀하지 않은 칸나비노이드를 생성하기 위한 전통적인 식물 기반 방법과 비교하여 유리할 수 있다. 예를 들어, 본 출원에 제공된 방법은 휘귀하지 않은 칸나비노이드를 일관되고 높은 수율로 생성하기 위한 잠재적으로 효율적인 수단을 나타낸다. 칸나비노이드를 식물로부터 수확하는 전통적인 칸나비노이드 생성 방법으로는 기류, 영양분, 조명, 온도 및 습도를 포함하여 일관되고 균일한 조건을 유지하는 것이 어려울 수 있다. 예를 들어, 식물 기반 방법을 사용하면 분기에 의해 생성된 미기후(microclimate)가 있을 수 있으며, 이것은 일관성 없는 수확량과 부산물 형성을 초래할 수 있다. 일부 구현예에서, 본 출원에 기재된 방법은 식물로부터 칸나비노이드를 수확하는 것과 비교하여 관심 칸나비노이드를 생성하는 데 더 효율적이다. 예를 들어, 식물 기반 방법을 사용하면 종자에서 수확하는 데 최대 반년이 소요될 수 있는 반면, 절단에서 수확하는 데는 일반적으로 약 4개월이 소요된다. 건조, 경화 및 추출을 포함한 추가 단계는 일반적으로 식물 기반 방법에도 필요하다. 대조적으로, 일부 구현예에서, 본 출원에 기재된 발효 기반 방법은 단지 약 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10일이 소요된다. 일부 구현예에서, 본 출원에 기재된 발효 기반 방법은 단지 약 3-5일이 소요된다. 일부 구현예에서, 본 출원에 기재된 발효 기반 방법은 단지 약 5일이 소요된다. 일부 구현예에서, 본 출원에서 제공되는 방법은 규제 표준을 준수하는 데 필요한 보안의 양을 감소시킨다. 예를 들어, 식물 재배와 비교하여 본 출원에 기재된 방법을 실행하기 위해 더 작은 보안 영역을 모니터링하고 보호할 필요가 있을 수 있다. 일부 구현예에서, 본 출원에 기재된 방법은 식물로부터 얻어진 칸나비노이드보다 유리하다.

말단 신타제(TS)

본 출원에 기재된 숙주 세포는 말단 신타제(TS)를 포함할 수 있다. 본 출원에 사용된 바와 같이, "TS"는 프레닐 모이어티(예를 들어, 테르펜)의 산화적 고리화를 촉매하여 고리-함유 생성물(예를 들어, 헤테로사이클릭 고리-함유 생성물)을 생성할 수 있는 효소를 지칭한다. 특정 구현예에서, TS는 프레닐 모이어티(예를 들어, 테르펜)의 산화적 고리화를 촉매하여 카보사이클릭-고리 함유 생성물(예를 들어, 칸나비노이드)을 생성할 수 있다. 특정 구현예에서, TS는 프레닐 모이어티(예를 들어, 테르펜)의 산화적 고리화를 촉매하여 헤테로고리-고리 함유 생성물(예를 들어, 칸나비노이드)을 생성할 수 있다. 특정 구현예에서, TS는 프레닐 모이어티(예를 들어, 테르펜)의 산화적 고리화를 촉매하여 칸나비노이드를 생성할 수 있다.

TS 효소는 FAD-결합 및 BBE(Berberine Bridge Enzyme) 서열 모티프를 포함하는 단량체이다.

일부 구현예에서, TS는 "조상(ancestral)" 말단 신타제이다. 조상 TS는 전사체 데이터 세트를 기반으로 말단 신타제 계통발생에 적용된 돌연변이의 확률 모델로부터 생성될 수 있다. 예를 들어, Hochberg 등은 본 개시내용에 그 전체가 참조로 포함된 문헌(Annu. Rev. Biophys. 2017. 46:247-69)에서 조상 단백질을 재구성하는 과정을 설명한다.

a. 기질

TS는 하나 이상의 기질을 사용할 수 있다. 일부 경우에, 프레닐 기 및/또는 R 기의 위치는 TS 기질 간에 상이하다. 예를 들어, TS는 화학식 (8w), 화학식 (8x), 화학식 (8'), 화학식 (8y), 및/또는 화학식 (8z)의 하나 이상의 화합물 또는 이의 약학적으로 허용되는 염, 용매화물, 수화물, 다형체, 공결정, 호변이성질체, 입체이성질체, 동위원소적으로 표지된 유도체, 또는 프로드럭을 기질로서 사용할 수 있다:

상기 식에서, a는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10이다.

특정 구현예에서, 화학식 (8')의 화합물은 하기 화학식 (8)의 화합물이다:

일부 구현예에서, R은 수소, 임의로 치환된 C₁-C₁₁ 알킬, 임의로 치환된 C₁-C₁₁ 알케닐, 임의로 치환된 C₁-C₁₁ 알키닐, 또는 임의로 치환된 C₁-C₁₁ 아르알킬이다.

일부 구현예에서, TS는 본 출원에 기재되고 도 2에 나타낸 화학식 (8)의 화합물의 프레닐 모이어티(예를 들어, 테르펜)의 산화적 고리화를 촉매한다. 특정 구현예에서, 화학식 (8)의 화합물은 하기 화학식 (8a)의 화합물이다:

일부 구현예에서, 화학식 (11)의 화합물의 생성은 대조군 기질로부터 화학식 (11)의 화합물의 생성과 비교하여 평가될 수 있다. 일부 구현예에서, 특정 기질로부터 화학식 (10)의 화합물의 생성은 대조군 기질로부터 화학식 (10)의 화합물의 생성과 비교하여 평가될 수 있다. 일부 구현예에서, 특정 기질로부터 화학식 (9)의 화합물의 생성은 대조군 기질로부터 화학식 (9)의 화합물의 생성과 비교하여 평가될 수 있다.

b. 생성물

일부 구현예에서, TS 효소는 CBG 유형 칸나비노이드로부터 CBD 유형 칸나비노이드, THC 유형 칸나비노이드 및/또는 CBC 유형 칸나비노이드의 형성을 촉매한다. CBGA가 기질인 구현예에서, TS 효소 CBDAS, THCAS 및 CBCAS는 일반적으로 칸나비디올산(CBDA), △9-테트라하이드로칸나비놀산(THCA) 및 칸나비크로멘산(CBCA)의 형성을 각각 촉매한다. 그러나, 일부 구현예에서, TS는 반응 조건에 따라 2개 초과의 상이한 생성물을 생성할 수 있다. 생성물의 다중기능성(promiscuity)이 대마초 말단 신타제 사이에서 언급되었다(예를 들어, Zirpel et al., J. Biotechnol. 2018 April 20; 272:40-7). 어떠한 이론에도 국한되지 않고, 반응 조건은 TS 효소의 기질 결합 부위를 형성하는 아미노산의 양성자화 상태 및 배향에 영향을 미치며, 이는 기질 및/또는 이들 효소의 생성물의 도킹에 영향을 미칠 수 있다. 예를 들어, 반응 환경의 pH는 THCAS 또는 CBDAS가 각각 THCA 또는 CBDAS보다 더 큰 비율로 CBCA를 생성하도록 할 수 있다(예를 들어, 그 전체가 참조로 포함된 Winnicki 및 Donsky의 미국 특허 번호 9,359,625 참조). 일부 구현예에서, TS는 세포질 조건 또는 세포소기관 조건과 같은 세포내 조건에서 소정의 생성물 특이성을 갖는다. 세포내 조건에 기초하여 소정의 생성물 특이성을 갖는 TS를 발현함으로써, TS를 발현하는 세포에 의해 생성된 생체내 생성물이 보다 예측 가능하게 생성될 수 있다. 일부 구현예에서, TS는 pH 5.5에서 원하는 생성물을 생성한다. 일부 구현예에서, TS는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14의 pH에서 원하는 생성물을 생성한다. 일부 구현예에서, TS는 4.5와 8.0 사이의 pH에서 원하는 생성물을 생성한다. 일부 구현예에서, TS는 5와 6 사이의 pH에서 원하는 생성물을 생성한다. 일부 구현예에서, TS는 그 사이의 모든 값을 포함하여 약 4.5, 4.6, 4.7, 4.8, 4.9, 5.0, 5,1, 5.2, 5.3, 5.4, 5.5, 5.6, 5.7, 5.8, 5.9, 6.0, 6.1, 6.2, 6.3, 6.4, 6.5, 6.6, 6.7, 6.8, 6.9, 7.0, 7.1, 7.2, 7.3, 7.4, 7.5, 7.6, 7.7, 7.8, 7.9, 또는 8.0인 pH에서 원하는 생성물을 생성한다. 일부 구현예에서, 신포 펩티드가 TS에 의해 생성되는 생성물의 유형을 조절하는 특정 세포내 조건(예를 들어, 특정 세포소기관)을 갖는 특정 세포내 위치로 TS를 표적화하기 때문에 TS의 생성물 프로파일은 TS의 신호 펩티드에 의존한다. 예시적인 신호 펩티드는 아래에 더 상세히 논의된다. 세포내 조건의 차이는, 예를 들어, pH의 변화 및/또는 샤페론 단백질의 존재로 인한 TS 효소의 폴딩의 차이로 인해 TS 효소의 활성에 영향을 미칠 수 있다.

TS는 본 출원에 기재된 하나 이상의 기질을 사용하여 하나 이상의 생성물을 생성할 수 있다. TS 생성물의 비제한적인 예를 표 1에 나타낸다. 일부 경우에, TS는 하나의 기질을 사용하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 상이한 생성물을 생성할 수 있다. 일부 구현예에서, TS는 하나 초과의 기질을 사용하여 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 상이한 기질을 생성할 수 있다.

일부 구현예에서, TS는 하기 화학식 (X-A)의 화합물 및/또는 화학식 (X-B)의 화합물 또는 이의 약학적으로 허용되는 염, 용매화물, 수화물, 다형체, 공결정, 호변이성질체, 입체이성질체, 동위원소적으로 표지된 유도체, 또는 프로드럭을 생성할 수 있다:

상기 식에서,

는 원자가가 허용하는 대로 이중 결합 또는 단일 결합이고;

R^3B는 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 또는 임의로 치환된 알키닐이고/이거나;

R^Y는 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 또는 임의로 치환된 알키닐이다.

일부 구현예에서, 화학식 (X-A)의 화합물은 하기 화합물이다:

; 및/또는

(테트라하이드로칸나비놀산(THCA) (10a)).

특정 구현예에서, 화학식 (10)의 화합물(

)에서, 탄소 10에서 *로 표지된 키랄 원자는 R-배열 또는 S-배열이고; 탄소 6에서 **로 표지된 키랄 원자는 R-배열이다. 특정 구현예에서, 화학식 (10)의 화합물(

)에서, 탄소 10에서 *로 표지된 키랄 원자는 S-배열이고; 탄소 6에서 **로 표지된 키랄 원자는 R-배열 또는 S-배열이다. 특정 구현예에서, 화학식 (10)의 화합물(

)에서, 탄소 10에서 *로 표지된 키랄 원자는 R-배열이고, 탄소 6에서 **로 표지된 키랄 원자는 R-배열이다. 특정 구현예에서, 화학식 (10)의 화합물(

)은 하기 화학식의 화합물이다:

특정 구현예에서, 화학식 (10)의 화합물(

)에서, 탄소 10에서 *로 표지된 키랄 원자는 S-배열이고, 탄소 6에서 **로 표지된 키랄 원자는 S-배열이다. 특정 구현예에서, 화학식 (10)의 화합물(

)은 하기 화학식의 화합물이다:

특정 구현예에서, 화학식 (10a)의 화합물(

)에서, 탄소 10에서 *로 표지된 키랄 원자는 R-배열 또는 S-배열이고; 탄소 6 에서 **로 표지된 키랄 원자는 R-배열이다. 특정 구현예에서, 화학식 (10a)의 화합물(

)은 하기 화학식의 화합물이다:

특정 구현예에서, 화학식 (10a)의 화합물(

)에서, 탄소 10에서 *로 표지된 키랄 원자는 S-배열이고, 탄소 6에서 **로 표지된 키랄 원자는 S-배열이다. 특정 구현예에서, 화학식 (10a)의 화합물(

)은 하기 화학식의 화합물이다:

일부 구현예에서, 화학식 (X-A)의 화합물은 하기 화합물이다:

; 및/또는

(칸나비크로멘산(CBCA) (11a)).

일부 구현예에서, 화학식 (X-A)의 화합물은 하기 화합물이다:

; 및/또는

(칸나비크로멘산(CBCA) (11a)).

일부 구현예에서, 화학식 (X-B)의 화합물은 하기 화합물이다:

; 및/또는

(칸나비디올산(CBDA) (9a)).

특정 구현예에서, 화학식 (9)의 화합물(

)은 탄소 3에서 *로 표지된 키랄 원자 및 탄소 4에서 **로 표지된 키랄 원자를 갖는다. 특정 구현예에서, 화학식 (9)의 화합물(

)에서, 탄소 3에서 *로 표지된 키랄 원자는 R-배열 또는 S-배열이고; 탄소 4에서 **로 표지된 키랄 원자는 R-배열이다. 특정 구현예에서, 화학식 (9)의 화합물(

)에서, 탄소 3에서 *로 표지된 키랄 원자는 S-배열이고; 탄소 4에서 **로 표지된 키랄 원자는 R-배열 또는 S-배열이다. 특정 구현예에서, 화학식 (9)의 화합물(

)에서, 탄소 3에서 *로 표지된 키랄 원자는 R-배열이고, 탄소 4에서 **로 표지된 키랄 원자는 R-배열이다. 특정 구현예에서, 화학식 (9)의 화합물의 화합물(

)은 하기 화학식의 화합물이다:

특정 구현예에서, 화학식 (9)의 화합물(

)에서, 탄소 3에서 *로 표지된 키랄 원자는 S-배열이고, 탄소 4에서 **로 표지된 키랄 원자는 S-배열이다. 특정 구현예에서, 화학식 (9)의 화합물(

)은 하기 화학식의 화합물이다:

특정 구현예에서, 화학식 (9a)의 화합물(CBDA) (

)은 하기 화학식의 화합물이다:

특정 구현예에서, 화학식 (9a)의 화합물(

)은 하기 화학식의 화합물이다:

일부 구현예에서, 도 2에 나타낸 바와 같이, TS는, 제한 없이, 임의의 다른 기질을 사용하여 화학식 (8')의 화합물:

(상기 식에서, a는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10이고; R은 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴임)로부터 생성된 화학식 (9), (10) 또는 (11)의 화합물, 또는 이의 약학적으로 허용되는 염, 용매화물, 수화물, 다형체, 공결정, 호변이성질체, 입체이성질체, 동위원소적으로 표지된 유도체, 또는 프로드럭을 생성할 수 있는 효소를 포함하는 PT의 생성물로부터 칸나비노이드를 생성할 수 있다:

상기 식에서, R은 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴이다. 특정 구현예에서, 화학식 (8')의 화합물은 하기 화학식 (8)의 화합물이다:

특정 구현예에서, 화학식 (9), (10), 또는 (11)의 화합물은, 예를 들어, 화학식 (8')의 기질 화합물(예를 들어, 화학식 (8)의 화합물)로부터 TS를 사용하여 생성된다. 화학식 (8')의 기질 화합물의 비제한적인 예는 칸나비게롤산(CBGA), 칸나비게로바린산(CBGVA), 또는 칸나비네롤산을 포함하지만 이에 제한되지 않는다. 특정 구현예에서, 화학식 (9), (10), 또는 (11)의 생성물 화합물의 하이드록실 기 중 적어도 하나는 추가로 메틸화된다. 특정 구현예에서, 화학식 (9)의 화합물은 메틸화되어 하기 화학식 (12)의 화합물 또는 이의 약학적으로 허용되는 염, 용매화물, 수화물, 다형체, 공결정, 호변이성질체, 입체이성질체, 동위원소적으로 표지된 유도체, 또는 프로드럭을 형성한다:

본 출원에 기재된 임의의 효소, 숙주 세포, 및 방법은 표 1에 제공된 것과 같은 칸나비노이드 및 칸나비노이드 전구체의 생성에 사용될 수 있다. 일반적으로, 용어 "생성"은, 예를 들어, 특정 기질 또는 반응물로부터 하나 이상의 생성물(예를 들어, 관심 생성물 및/또는 부산물/오프-산물(off-product))의 생성을 지칭하기 위해 사용된다. 생성량은 당업자에게 친숙한 측정기준을 사용하여 최종 생성물 또는 중간 생성물과 같은 경로의 임의의 하나 이상의 단계에서 평가될 수 있다. 예를 들어, 생성량은 단일 효소 반응(예를 들어, TS에 의한 화학식 (8)의 화합물의 화학식 (11)의 화합물로의 전환)에 대해 평가될 수 있다. 대안적으로 또는 추가로, 생성량은 일련의 효소 반응(예를 들어, 도 1 및/또는 도 2에 나타낸 생합성 경로)에 대해 평가될 수 있다. 생성은, 예를 들어, 부피 생산성, 효소 동역학/반응 속도, 비생산성, 바이오매쓰 특이적 생산성, 역가, 수율, 및 하나 이상의 생성물(예컨대, 관심 생성물 및/또는 부산물/오프-산물)의 총 역가를 평가함으로써 당업계에 공지된 임의의 측정기준에 의해 평가될 수 있다.

일부 구현예에서, 생성을 측정하는 데 사용되는 측정기준은 연속 공정이 모니터링되는지(예를 들어, 여러 칸나비노이드 생합성 단계가 조합되어 사용되는지) 또는 특정 최종 생성물이 측정되는지 여부에 의존할 수 있다. 예를 들어, 일부 구현예에서, 연속 공정에 의해 생성을 모니터링하는 데 사용되는 측정기준은 부피 생산성, 효소 동역학 및 반응 속도를 포함할 수 있다. 일부 구현예에서, 특정 생성물의 생성을 모니터링하는 데 사용되는 측정기준은 비생산성, 바이오매쓰-특이적 생산성, 역가, 수율, 및/또는 하나 이상의 생성물(예를 들어, 관심 생성물 및/또는 부산물/오프-산물)의 총 역가를 포함할 수 있다.

하나 이상의 생성물(예를 들어, 관심 생성물 및/또는 부산물/오프-산물)의 생성은, 예를 들어, 반응/발효 종료 후 남아 있는 기질의 양을 결정함으로써 간접적으로 평가될 수 있다. 예를 들어, 생성물(예를 들어, CBGA를 포함하는 화학식 (8)의 화합물 (화학식 8(a))로부터 칸나비크로멘산(CBCA)을 포함하는 화학식 (11)의 화합물 (화학식 (11a)))의 형성을 촉매하는 TS의 경우, 생성물의 생성은 화학식 (11)의 화합물을 직접 정량하거나 반응 후에 남아 있는 기질의 양(예를 들어, 화학식 (8)의 화합물의 양)을 정량함으로써 평가할 수 있다. 생성물(예를 들어, CBGA를 포함하는 화학식 (8)의 화합물 (화학식 8(a))로부터 테트라하이드로칸나비놀산(THCA)을 포함하는 화학식 (10)의 화합물 (화학식 (10a)))의 형성을 촉매하는 TS의 경우, 생성물의 생성은 화학식 (10)의 화합물을 직접 정량하거나 반응 후에 남아 있는 기질의 양(예를 들어, 화학식 (8)의 화합물의 양)을 정량함으로써 평가할 수 있다. 생성물(예를 들어, CBGA를 포함하는 화학식 (8)의 화합물 (화학식 8(a))로부터 칸나비디올산(CBDA)을 포함하는 화학식 (9)의 화합물 (화학식 (9a)))의 형성을 촉매하는 TS의 경우, 생성물의 생성은 화학식 (9)의 화합물을 직접 정량하거나 반응 후에 남아 있는 기질의 양(예를 들어, 화학식 (8)의 화합물의 양)을 정량함으로써 평가할 수 있다.

일부 구현예에서, 부산물의 생산량은 높지만 원하는 생성물의 생산량은 낮은 TS는, 예를 들어, 하나 이상의 아미노산 치환, 삽입 및/또는 결실이 TS에 도입되어 원하는 생성물로의 생성을 이동하는 경우, 또는 TS가 반응 조건이 원하는 생성물의 생성에 유리한 위치에서 표시될 수 있는 경우 여전히 사용될 수 있다. 일부 구현예에서, TS는 THCAS이거나, THCAS 활성을 갖는다. THCAS의 비제한적인 부산물은 화학식 (9) 및 (11)의 화합물, 및 화학식 (8)의 화합물의 테르펜이 다른 개방 -OH 기(탄소 1에서)로 고리화되어 생성된 생성물을 포함한다. 일부 구현예에서, TS는 CBDAS이거나, CBDAS 활성을 갖는다. CBDAS의 비제한적인 부산물은 화학식 (10) 및 (11)의 화합물, 및 화학식 (8)의 화합물의 테르펜이 다른 개방 -OH 기(탄소 1에서)로 고리화되어 생성된 생성물을 포함한다. 일부 구현예에서, TS는 CBCAS이거나, CBCAS 활성을 갖는다. CBCAS의 비제한적인 부산물은 화학식 (9) 또는 (10)의 화합물, 및 화학식 (8)의 화합물의 테르펜이 다른 개방 -OH 기(탄소 1에서)로 고리화되어 생성된 생성물을 포함한다. 화학식 (8)의 화합물에서 탄소는 다음과 같이 넘버링될 수 있다:

예를 들어, 문헌(Hanus et al., Nat Prod Rep. (2016) Nov 23;33(12):1357-1392)을 참조한다.

일부 구현예에서, 특정 TS에 의한 생성물(예를 들어, 관심 생성물 및/또는 부산물/오프-산물)의 생성은, 예를 들어, 대조군 TS에 대한 상대적 생성으로 평가될 수 있다. 일부 구현예에서, 특정 숙주 세포에 의한 생성물의 생성은 대조군 숙주 세포와 비교하여 평가될 수 있다.

일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군에 비해 더 높은 역가 또는 수율로 생성물을 생성할 수 있을 수 있다. 일부 구현예에서, TS는 대조군에 비해 더 빠른 속도로(예를 들어, 더 높은 생산성) 생성물을 생성할 수 있다. 일부 구현예에서, TS는 또 다른 기질에 비해 하나의 기질에 대해 우선적인 결합 및/또는 활성을 가질 수 있다. 일부 구현예에서, TS는 또 다른 생성물에 비해 하나의 생성물을 우선적으로 생성할 수 있다.

일부 구현예에서, TS는 그 사이의 모든 값을 포함하여 적어도 0.0001 μg/L, 적어도 0.001 μg/L, 적어도 0.01 μg/L, 적어도 0.02 μg/L, 적어도 0.03 μg/L, 적어도 0.04 μg/L, 적어도 0.05 μg/L, 적어도 0.06 μg/L, 적어도 0.07 μg/L, 적어도 0.08 μg/L, 적어도 0.09 μg/L, 적어도 0.1 μg/L, 적어도 0.11 μg/L, 적어도 0.12 μg/L, 적어도 0.13 μg/L, 적어도 0.14 μg/L, 적어도 0.15 μg/L, 적어도 0.16 μg/L, 적어도 0.17 μg/L, 적어도 0.18 μg/L, 적어도 0.19 μg/L, 적어도 0.2 μg/L, 적어도 0.21 μg/L, 적어도 0.22 μg/L, 적어도 0.23 μg/L, 적어도 0.24 μg/L, 적어도 0.25 μg/L, 적어도 0.26 μg/L, 적어도 0.27 μg/L, 적어도 0.28 μg/L, 적어도 0.29 μg/L, 적어도 0.3 μg/L, 적어도 0.31 μg/L, 적어도 0.32 μg/L, 적어도 0.33 μg/L, 적어도 0.34 μg/L, 적어도 0.35 μg/L, 적어도 0.36 μg/L, 적어도 0.37 μg/L, 적어도 0.38 μg/L, 적어도 0.39 μg/L, 적어도 0.4 μg/L, 적어도 0.41 μg/L, 적어도 0.42 μg/L, 적어도 0.43 μg/L, 적어도 0.44 μg/L, 적어도 0.45 μg/L, 적어도 0.46 μg/L, 적어도 0.47 μg/L, 적어도 0.48 μg/L, 적어도 0.49 μg/L, 적어도 0.5 μg/L, 적어도 0.51 μg/L, 적어도 0.52 μg/L, 적어도 0.53 μg/L, 적어도 0.54 μg/L, 적어도 0.55 μg/L, 적어도 0.56 μg/L, 적어도 0.57 μg/L, 적어도 0.58 μg/L, 적어도 0.59 μg/L, 적어도 0.6 μg/L, 적어도 0.61 μg/L, 적어도 0.62 μg/L, 적어도 0.63 μg/L, 적어도 0.64 μg/L, 적어도 0.65 μg/L, 적어도 0.66 μg/L, 적어도 0.67 μg/L, 적어도 0.68 μg/L, 적어도 0.69 μg/L, 적어도 0.7 μg/L, 적어도 0.71 μg/L, 적어도 0.72 μg/L, 적어도 0.73 μg/L, 적어도 0.74 μg/L, 적어도 0.75 μg/L, 적어도 0.76 μg/L, 적어도 0.77 μg/L, 적어도 0.78 μg/L, 적어도 0.79 μg/L, 적어도 0.8 μg/L, 적어도 0.81 μg/L, 적어도 0.82 μg/L, 적어도 0.83 μg/L, 적어도 0.84 μg/L, 적어도 0.85 μg/L, 적어도 0.86 μg/L, 적어도 0.87 μg/L, 적어도 0.88 μg/L, 적어도 0.89 μg/L, 적어도 0.9 μg/L, 적어도 0.91 μg/L, 적어도 0.92 μg/L, 적어도 0.93 μg/L, 적어도 0.94 μg/L, 적어도 0.95 μg/L, 적어도 0.96 μg/L, 적어도 0.97 μg/L, 적어도 0.98 μg/L, 적어도 0.99 μg/L, 적어도 1 μg/L, 적어도 1.1 μg/L, 적어도 1.2 μg/L, 적어도 1.3 μg/L, 적어도 1.4 μg/L, 적어도 1.5 μg/L, 적어도 1.6 μg/L, 적어도 1.7 μg/L, 적어도 1.8 μg/L, 적어도 1.9 μg/L, 적어도 2 μg/L, 적어도 2.1 μg/L, 적어도 2.2 μg/L, 적어도 2.3 μg/L, 적어도 2.4 μg/L, 적어도 2.5 μg/L, 적어도 2.6 μg/L, 적어도 2.7 μg/L, 적어도 2.8 μg/L, 적어도 2.9 μg/L, 적어도 3 μg/L, 적어도 3.1 μg/L, 적어도 3.2 μg/L, 적어도 3.3 μg/L, 적어도 3.4 μg/L, 적어도 3.5 μg/L, 적어도 3.6 μg/L, 적어도 3.7 μg/L, 적어도 3.8 μg/L, 적어도 3.9 μg/L, 적어도 4 μg/L, 적어도 4.1 μg/L, 적어도 4.2 μg/L, 적어도 4.3 μg/L, 적어도 4.4 μg/L, 적어도 4.5 μg/L, 적어도 4.6 μg/L, 적어도 4.7 μg/L, 적어도 4.8 μg/L, 적어도 4.9 μg/L, 적어도 5 μg/L, 적어도 5.1 μg/L, 적어도 5.2 μg/L, 적어도 5.3 μg/L, 적어도 5.4 μg/L, 적어도 5.5 μg/L, 적어도 5.6 μg/L, 적어도 5.7 μg/L, 적어도 5.8 μg/L, 적어도 5.9 μg/L, 적어도 6 μg/L, 적어도 6.1 μg/L, 적어도 6.2 μg/L, 적어도 6.3 μg/L, 적어도 6.4 μg/L, 적어도 6.5 μg/L, 적어도 6.6 μg/L, 적어도 6.7 μg/L, 적어도 6.8 μg/L, 적어도 6.9 μg/L, 적어도 7 μg/L, 적어도 7.1 μg/L, 적어도 7.2 μg/L, 적어도 7.3 μg/L, 적어도 7.4 μg/L, 적어도 7.5 μg/L, 적어도 7.6 μg/L, 적어도 7.7 μg/L, 적어도 7.8 μg/L, 적어도 7.9 μg/L, 적어도 8 μg/L, 적어도 8.1 μg/L, 적어도 8.2 μg/L, 적어도 8.3 μg/L, 적어도 8.4 μg/L, 적어도 8.5 μg/L, 적어도 8.6 μg/L, 적어도 8.7 μg/L, 적어도 8.8 μg/L, 적어도 8.9 μg/L, 적어도 9 μg/L, 적어도 9.1 μg/L, 적어도 9.2 μg/L, 적어도 9.3 μg/L, 적어도 9.4 μg/L, 적어도 9.5 μg/L, 적어도 9.6 μg/L, 적어도 9.7 μg/L, 적어도 9.8 μg/L, 적어도 9.9 μg/L, 적어도 10 μg/L, 적어도 10.1 μg/L, 적어도 10.2 μg/L, 적어도 10.3 μg/L, 적어도 10.4 μg/L, 적어도 10.5 μg/L, 적어도 10.6 μg/L, 적어도 10.7 μg/L, 적어도 10.8 μg/L, 적어도 10.9 μg/L, 적어도 11 μg/L, 적어도 11.1 μg/L, 적어도 11.2 μg/L, 적어도 11.3 μg/L, 적어도 11.4 μg/L, 적어도 11.5 μg/L, 적어도 11.6 μg/L, 적어도 11.7 μg/L, 적어도 11.8 μg/L, 적어도 11.9 μg/L, 적어도 12 μg/L, 적어도 12.1 μg/L, 적어도 12.2 μg/L, 적어도 12.3 μg/L, 적어도 12.4 μg/L, 적어도 12.5 μg/L, 적어도 12.6 μg/L, 적어도 12.7 μg/L, 적어도 12.8 μg/L, 적어도 12.9 μg/L, 적어도 13 μg/L, 적어도 13.1 μg/L, 적어도 13.2 μg/L, 적어도 13.3 μg/L, 적어도 13.4 μg/L, 적어도 13.5 μg/L, 적어도 13.6 μg/L, 적어도 13.7 μg/L, 적어도 13.8 μg/L, 적어도 13.9 μg/L, 적어도 14 μg/L, 적어도 14.1 μg/L, 적어도 14.2 μg/L, 적어도 14.3 μg/L, 적어도 14.4 μg/L, 적어도 14.5 μg/L, 적어도 14.6 μg/L, 적어도 14.7 μg/L, 적어도 14.8 μg/L, 적어도 14.9 μg/L, 적어도 15 μg/L, 적어도 15.1 μg/L, 적어도 15.2 μg/L, 적어도 15.3 μg/L, 적어도 15.4 μg/L, 적어도 15.5 μg/L, 적어도 15.6 μg/L, 적어도 15.7 μg/L, 적어도 15.8 μg/L, 적어도 15.9 μg/L, 적어도 16 μg/L, 적어도 16.1 μg/L, 적어도 16.2 μg/L, 적어도 16.3 μg/L, 적어도 16.4 μg/L, 적어도 16.5 μg/L, 적어도 16.6 μg/L, 적어도 16.7 μg/L, 적어도 16.8 μg/L, 적어도 16.9 μg/L, 적어도 17 μg/L, 적어도 17.1 μg/L, 적어도 17.2 μg/L, 적어도 17.3 μg/L, 적어도 17.4 μg/L, 적어도 17.5 μg/L, 적어도 17.6 μg/L, 적어도 17.7 μg/L, 적어도 17.8 μg/L, 적어도 17.9 μg/L, 적어도 18 μg/L, 적어도 18.1 μg/L, 적어도 18.2 μg/L, 적어도 18.3 μg/L, 적어도 18.4 μg/L, 적어도 18.5 μg/L, 적어도 18.6 μg/L, 적어도 18.7 μg/L, 적어도 18.8 μg/L, 적어도 18.9 μg/L, 적어도 19 μg/L, 적어도 19.1 μg/L, 적어도 19.2 μg/L, 적어도 19.3 μg/L, 적어도 19.4 μg/L, 적어도 19.5 μg/L, 적어도 19.6 μg/L, 적어도 19.7 μg/L, 적어도 19.8 μg/L, 적어도 19.9 μg/L, 적어도 20 μg/L, 적어도 25 μg/L, 적어도 30 μg/L, 적어도 35 μg/L, 적어도 40 μg/L, 적어도 45 μg/L, 적어도 50 μg/L, 적어도 55 μg/L, 적어도 60 μg/L, 적어도 65 μg/L, 적어도 70 μg/L, 적어도 75 μg/L, 적어도 80 μg/L, 적어도 85 μg/L, 적어도 90 μg/L, 적어도 95 μg/L, 적어도 100 μg/L, 적어도 105 μg/L, 적어도 110 μg/L, 적어도 115 μg/L, 적어도 120 μg/L, 적어도 125 μg/L, 적어도 130 μg/L, 적어도 135 μg/L, 적어도 140 μg/L, 적어도 145 μg/L, 적어도 150 μg/L, 적어도 155 μg/L, 적어도 160 μg/L, 적어도 165 μg/L, 적어도 170 μg/L, 적어도 175 μg/L, 적어도 180 μg/L, 적어도 185 μg/L, 적어도 190 μg/L, 적어도 195 μg/L, 적어도 200 μg/L, 적어도 205 μg/L, 적어도 210 μg/L, 적어도 215 μg/L, 적어도 220 μg/L, 적어도 225 μg/L, 적어도 230 μg/L, 적어도 235 μg/L, 적어도 240 μg/L, 적어도 245 μg/L, 적어도 250 μg/L, 적어도 255 μg/L, 적어도 260 μg/L, 적어도 265 μg/L, 적어도 270 μg/L, 적어도 275 μg/L, 적어도 280 μg/L, 적어도 285 μg/L, 적어도 290 μg/L, 적어도 295 μg/L, 적어도 300 μg/L, 적어도 305 μg/L, 적어도 310 μg/L, 적어도 315 μg/L, 적어도 320 μg/L, 적어도 325 μg/L, 적어도 330 μg/L, 적어도 335 μg/L, 적어도 340 μg/L, 적어도 345 μg/L, 적어도 350 μg/L, 적어도 355 μg/L, 적어도 360 μg/L, 적어도 365 μg/L, 적어도 370 μg/L, 적어도 375 μg/L, 적어도 380 μg/L, 적어도 385 μg/L, 적어도 390 μg/L, 적어도 395 μg/L, 적어도 400 μg/L, 적어도 405 μg/L, 적어도 410 μg/L, 적어도 415 μg/L, 적어도 420 μg/L, 적어도 425 μg/L, 적어도 430 μg/L, 적어도 435 μg/L, 적어도 440 μg/L, 적어도 445 μg/L, 적어도 450 μg/L, 적어도 455 μg/L, 적어도 460 μg/L, 적어도 465 μg/L, 적어도 470 μg/L, 적어도 475 μg/L, 적어도 480 μg/L, 적어도 485 μg/L, 적어도 490 μg/L, 적어도 495 μg/L, 적어도 500 μg/L, 적어도 600 μg/L, 적어도 700 μg/L, 적어도 800 μg/L, 적어도 900 μg/L, 적어도 1,000 μg/L, 적어도 2,000 μg/L, 적어도 3,000 μg/L, 적어도 4,000 μg/L, 적어도 5,000 μg/L, 적어도 6,000 μg/L, 적어도 7,000 μg/L, 적어도 8,000 μg/L, 적어도 900 μg/L, 적어도 10,000 μg/L, 적어도 11,000 μg/L, 적어도 12,000 μg/L, 적어도 13,000 μg/L, 적어도 14,000 μg/L, 적어도 15,000 μg/L, 적어도 16,000 μg/L, 적어도 17,000 μg/L, 적어도 18,000 μg/L, 적어도 19,000 μg/L, 적어도 20,000 μg/L, 적어도 21,000 μg/L, 적어도 22,000 μg/L, 적어도 23,000 μg/L, 적어도 24,000 μg/L, 적어도 25,000 μg/L, 적어도 26,000 μg/L, 적어도 27,000 μg/L, 적어도 28,000 μg/L, 적어도 29,000 μg/L, 적어도 30,000 μg/L, 적어도 31,000 μg/L, 적어도 32,000 μg/L, 적어도 33,000 μg/L, 적어도 34,000 μg/L, 적어도 35,000 μg/L, 적어도 36,000 μg/L, 적어도 37,000 μg/L, 적어도 38,000 μg/L, 적어도 39,000 μg/L, 적어도 40,000 μg/L, 적어도 41,000 μg/L, 적어도 42,000 μg/L, 적어도 43,000 μg/L, 적어도 44,000 μg/L, 적어도 45,000 μg/L, 적어도 46,000 μg/L, 적어도 47,000 μg/L, 적어도 48,000 μg/L, 적어도 49,000 μg/L, 적어도 50,000 μg/L, 적어도 51,000 μg/L, 적어도 52,000 μg/L, 적어도 53,000 μg/L, 적어도 54,000 μg/L, 적어도 55,000 μg/L, 적어도 56,000 μg/L, 적어도 57,000 μg/L, 적어도 58,000 μg/L, 적어도 59,000 μg/L, 적어도 60,000 μg/L, 적어도 61,000 μg/L, 적어도 62,000 μg/L, 적어도 63,000 μg/L, 적어도 64,000 μg/L, 적어도 65,000 μg/L, 적어도 66,000 μg/L, 적어도 67,000 μg/L, 적어도 68,000 μg/L, 적어도 69,000 μg/L, 적어도 70,000 μg/L, 적어도 71,000 μg/L, 적어도 72,000 μg/L, 적어도 73,000 μg/L, 적어도 74,000 μg/L, 적어도 75,000 μg/L, 적어도 76,000 μg/L, 적어도 77,000 μg/L, 적어도 78,000 μg/L, 적어도 79,000 μg/L, 적어도 80,000 μg/L, 적어도 81,000 μg/L, 적어도 82,000 μg/L, 적어도 83,000 μg/L, 적어도 84,000 μg/L, 적어도 85,000 μg/L, 적어도 86,000 μg/L, 적어도 87,000 μg/L, 적어도 88,000 μg/L, 적어도 89,000 μg/L, 적어도 90,000 μg/L, 적어도 91,000 μg/L, 적어도 92,000 μg/L, 적어도 93,000 μg/L, 적어도 94,000 μg/L, 적어도 95,000 μg/L, 적어도 96,000 μg/L, 적어도 97,000 μg/L, 적어도 98,000 μg/L, 적어도 99,000 μg/L, 적어도 100,000 μg/L, 적어도 105,000 μg/L, 적어도 110,000 μg/L, 적어도 115,000 μg/L, 적어도 120,000 μg/L, 적어도 125,000 μg/L, 적어도 130,000 μg/L, 적어도 135,000 μg/L, 적어도 140,000 μg/L, 적어도 145,000 μg/L, 적어도 150,000 μg/L, 적어도 155,000 μg/L, 적어도 160,000 μg/L, 적어도 165,000 μg/L, 적어도 170,000 μg/L, 적어도 175,000 μg/L, 적어도 180,000 μg/L, 적어도 185,000 μg/L, 적어도 190,000 μg/L, 적어도 195,000 μg/L, 적어도 200,000 μg/L, 적어도 205,000 μg/L, 적어도 210,000 μg/L, 적어도 215,000 μg/L, 적어도 220,000 μg/L, 적어도 225,000 μg/L, 적어도 230,000 μg/L, 적어도 235,000 μg/L, 적어도 240,000 μg/L, 적어도 245,000 μg/L, 적어도 250,000 μg/L, 적어도 255,000 μg/L, 적어도 260,000 μg/L, 적어도 265,000 μg/L, 적어도 270,000 μg/L, 적어도 275,000 μg/L, 적어도 280,000 μg/L, 적어도 285,000 μg/L, 적어도 290,000 μg/L, 적어도 295,000 μg/L, 적어도 300,000 μg/L, 적어도 305,000 μg/L, 적어도 310,000 μg/L, 적어도 315,000 μg/L, 적어도 320,000 μg/L, 적어도 325,000 μg/L, 적어도 330,000 μg/L, 적어도 335,000 μg/L, 적어도 340,000 μg/L, 적어도 345,000 μg/L, 적어도 350,000 μg/L, 적어도 355,000 μg/L, 적어도 360,000 μg/L, 적어도 365,000 μg/L, 적어도 370,000 μg/L, 적어도 375,000 μg/L, 적어도 380,000 μg/L, 적어도 385,000 μg/L, 적어도 390,000 μg/L, 적어도 395,000 μg/L, 적어도 400,000 μg/L, 적어도 405,000 μg/L, 적어도 410,000 μg/L, 적어도 415,000 μg/L, 적어도 420,000 μg/L, 적어도 425,000 μg/L, 적어도 430,000 μg/L, 적어도 435,000 μg/L, 적어도 440,000 μg/L, 적어도 445,000 μg/L, 적어도 450,000 μg/L, 적어도 455,000 μg/L, 적어도 460,000 μg/L, 적어도 465,000 μg/L, 적어도 470,000 μg/L, 적어도 475,000 μg/L, 적어도 480,000 μg/L, 적어도 485,000 μg/L, 적어도 490,000 μg/L, 적어도 495,000 μg/L, 적어도 500,000 μg/L, 적어도 600,000 μg/L, 적어도 700,000 μg/L, 적어도 800,000 μg/L, 적어도 900,000 μg/L, 또는 적어도 1,000,000 μg/L의 본원에 기재된 생성물을 생성할 수 있다. 일부 구현예에서, 생성물은 화학식 (11)의 화합물(예를 들어, 화학식 (11a)의 화합물)이다. 일부 구현예에서, 생성물은 CBCA 및/또는 CBCVA이다. 일부 구현예에서, 생성물은 화학식 (9)의 화합물(예를 들어, 화학식 (9a)의 화합물)이다. 일부 구현예에서, 생성물은 화학식 (10)의 화합물(예를 들어, 화학식 (10a)의 화합물)이다.

일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군(예를 들어, 양성 대조군)에 의해 생성된 것보다 더 많은 양의 하나 이상의 생성물을 생성할 수 있다. 일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군(예를 들어, 양성 대조군)에 의해 생성된 하나 이상의 생성물의 양의 적어도 0.05%(예를 들어, 적어도 0.075%, 적어도 0.1%, 적어도 0.5%, 적어도 0.75%, 적어도 1%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 100%, 적어도 125%, 적어도 150%, 적어도 175%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 900%, 또는 적어도 1,000%)를 생성할 수 있다. 일부 구현예에서, 생성물은 CBCA 및/또는 CBCVA이다. 일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군(예를 들어, 양성 대조군)에 의해 생성된 하나 초과의 생성물을 적어도 0.05%(예를 들어, 적어도 0.075%, 적어도 0.1%, 적어도 0.5%, 적어도 0.75%, 적어도 1%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 9, 적어도 9, 적어도 100%, 적어도 125%, 적어도 150%, 적어도 175%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 900%, 또는 적어도 1,000%) 더 생성할 수 있다. 일부 구현예에서, 생성물은 화학식 (11)의 화합물(예를 들어, 화학식 (11a)의 화합물)이다. 일부 구현예에서, 생성물은 CBCA 및/또는 CBCVA이다. 일부 구현예에서, 생성물은 화학식 (9)의 화합물(예를 들어, 화학식 (9a)의 화합물)이다. 일부 구현예에서, 생성물은 화학식 (10)의 화합물(예를 들어, 화학식 (10a)의 화합물)이다.

일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군(예를 들어, 양성 대조군)에 의해 생성된 하나 이상의 생성물의 역가 또는 수율의 적어도 0.05%(예를 들어, 적어도 0.075%, 적어도 0.1%, 적어도 0.5%, 적어도 0.75%, 적어도 1%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 100%, 적어도 125%, 적어도 150%, 적어도 175%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 900%, 또는 적어도 1,000%)를 생성할 수 있다. 일부 구현예에서, 생성물은 CBCA 및/또는 CBCVA이다. 일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군과 비교하여 하나 이상의 생성물의 적어도 0.05%(예를 들어, 적어도 0.075%, 적어도 0.1%, 적어도 0.5%, 적어도 0.75%, 적어도 1%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 100%, 적어도 125%, 적어도 150%, 적어도 175%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 900%, 또는 적어도 1,000%) 더 높은 역가 또는 수율을 생성할 수 있다. 일부 구현예에서, 생성물은 화학식 (11)의 화합물(예를 들어, 화학식 (11a)의 화합물)이다. 일부 구현예에서, 생성물은 CBCA 및/또는 CBCVA이다. 일부 구현예에서, 생성물은 화학식 (9)의 화합물(예를 들어, 화학식 (9a)의 화합물)이다. 일부 구현예에서, 생성물은 화학식 (10)의 화합물(예를 들어, 화학식 (10a)의 화합물)이다.

일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군(예를 들어, 양성 대조군)의 속도에 비해 적어도 0.05%(예를 들어, 적어도 0.075%, 적어도 0.1%, 적어도 0.5%, 적어도 0.75%, 적어도 1%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 100%, 적어도 125%, 적어도 150%, 적어도 175%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 900%, 또는 적어도 1,000%)인 속도로 하나 이상의 생성물을 생성할 수 있다. 일부 구현예에서, 생성물은 CBCA 및/또는 CBCVA이다. 일부 구현예에서, TS는 대조군(예를 들어, 양성 대조군)에 비해 적어도 1%(예를 들어, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 100%, 적어도 125%, 적어도 150%, 적어도 175%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 900%, 또는 적어도 1,000%) 더 빠른 속도로 하나 이상의 생성물을 생성할 수 있다. 일부 구현예에서, 생성물은 화학식 (11)의 화합물(예를 들어, 화학식 (11a)의 화합물)이다. 일부 구현예에서, 생성물은 CBCA 및/또는 CBCVA이다. 일부 구현예에서, 생성물은 화학식 (9)의 화합물(예를 들어, 화학식 (9a)의 화합물)이다. 일부 구현예에서, 생성물은 화학식 (10)의 화합물(예를 들어, 화학식 (10a)의 화합물)이다.

일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군(예를 들어, 양성 대조군)에 의해 생성된 것보다 적은 양의 하나 이상의 생성물을 생성할 수 있다. 일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군(예를 들어, 양성 대조군)에 비해 하나 이상의 생성물을 적어도 0.05%(예를 들어, 적어도 0.075%, 적어도 0.1%, 적어도 0.5%, 적어도 0.75%, 적어도 1%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 100%, 적어도 125%, 적어도 150%, 적어도 175%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 900%, 또는 적어도 1,000%) 더 적게 생성할 수 있다. 일부 구현예에서, 생성물은 화학식 (11)의 화합물(예를 들어, 화학식 (11a)의 화합물)이다. 일부 구현예에서, 생성물은 CBCA 및/또는 CBCVA이다. 일부 구현예에서, 생성물은 화학식 (9)의 화합물(예를 들어, 화학식 (9a)의 화합물)이다. 일부 구현예에서, 생성물은 화학식 (10)의 화합물(예를 들어, 화학식 (10a)의 화합물)이다.

일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군(예를 들어, 양성 대조군)에 비해 하나 이상의 생성물을 적어도 0.05%(예를 들어, 적어도 0.075%, 적어도 0.1%, 적어도 0.5%, 적어도 0.75%, 적어도 1%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 100%, 적어도 125%, 적어도 150%, 적어도 175%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 900%, 또는 적어도 1,000%) 더 낮은 역가 또는 수율로 생성할 수 있다. 일부 구현예에서, 생성물은 화학식 (11)의 화합물(예를 들어, 화학식 (11a)의 화합물)이다. 일부 구현예에서, 생성물은 CBCA 및/또는 CBCVA이다. 일부 구현예에서, 생성물은 화학식 (9)의 화합물(예를 들어, 화학식 (9a)의 화합물)이다. 일부 구현예에서, 생성물은 화학식 (10)의 화합물(예를 들어, 화학식 (10a)의 화합물)이다.

일부 구현예에서, 본 개시내용과 관련된 TS 또는 숙주 세포는 대조군(예를 들어, 양성 대조군)에 비해 적어도 0.5%(예를 들어, 적어도 0.075%, 적어도 0.1%, 적어도 0.5%, 적어도 0.75%, 적어도 1%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 100%, 적어도 125%, 적어도 150%, 적어도 175%, 적어도 200%, 적어도 300%, 적어도 400%, 적어도 500%, 적어도 600%, 적어도 700%, 적어도 800%, 적어도 900%, 또는 적어도 1,000%) 더 느린 속도로 하나 이상의 생성물을 생성할 수 있다. 일부 구현예에서, 생성물은 화학식 (11)의 화합물(예를 들어, 화학식 (11a)의 화합물)이다. 일부 구현예에서, 생성물은 CBCA 및/또는 CBCVA이다. 일부 구현예에서, 생성물은 화학식 (9)의 화합물(예를 들어, 화학식 (9a)의 화합물)이다. 일부 구현예에서, 생성물은 화학식 (10)의 화합물(예를 들어, 화학식 (10a)의 화합물)이다.

실험 TS와 대조군의 비교를 포함하는 본원에 기재된 방법의 일부 구현예에서, 대조군은 야생형 참조 TS이다. 일부 구현예에서, 대조군은 야생형 씨. 사티바 THCAS(예를 들어, 서열 21 포함)이다. 일부 구현예에서, 대조군은 THCAS 활성 이외에 CBCAS 활성도 나타내는 야생형 씨. 사티바 THCAS(예를 들어, 서열번호 21 포함)이다. 일부 구현예에서, 대조군 TS는 실험 TS 내에서 하나 이상의 아미노산 치환, 삽입 또는 결실의 존재를 제외하고 실험 TS와 동일하다.

실험 숙주 세포와 대조군 숙주 세포의 비교를 포함하는 본원에 기재된 방법의 일부 구현예에서, 대조군 숙주 세포는 TS를 코딩하는 이종 폴리뉴클레오티드를 포함하지 않는 숙주 세포이다. 일부 구현예에서, 대조군 숙주 세포는 야생형 세포이다. 일부 구현예에서, 대조군 숙주 세포는 야생형 씨. 사티바 THCAS를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포이다. 일부 구현예에서, 대조군은 THCAS 활성 이외에 CBCAS 활성도 나타내는 야생형 씨. 사티바 THCAS이다. 대마초에서, 야생형 CsTHCAS는 선모(glandular trichome)로 분비된다. 그러나, 하기에 더 상세히 기재된 바와 같이, 예를 들어, 특정 세포 구획 및/또는 세포 분비 경로에 대한 재조합 숙주 세포에 의해 생성된 칸나비노이드의 국소화를 제어하는 것이 바람직할 수 있다. 따라서, 일부 구현예에서, 대조군은 CBCAS 활성을 또한 나타내는 야생형 씨. 사티바 THCAS이며, 여기서 천연 신호 서열이 제거되고(예를 들어, 서열 번호 21에 기재된 바와 같음), 임의로 하나 이상의 이종 신호 서열로 대체된다. 일부 구현예에서, 대조군 숙주 세포는 서열번호 22를 포함하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포이다. 일부 구현예에서, 대조군 숙주 세포는 실험 숙주 세포에서 이종 발현되는 TS 내의 하나 이상의 아미노산 치환, 삽입 또는 결실의 존재를 제외하고 실험 숙주 세포와 유전적으로 동일하다.

일부 구현예에서, TS는 생성물의 혼합물을 생성할 수 있다. 예를 들어, 혼합물은 하나 이상의 화학식 (11)의 화합물을 포함할 수 있다. 일부 구현예에서, 혼합물은 화학식 (9), 화학식 (10), 및/또는 화학식 (11)의 화합물을 포함한다. 일부 구현예에서, 생성물 혼합물 내의 화합물의 적어도 약 50-100%, 적어도 약 50-60%, 적어도 약 60-70%, 적어도 약 70-80%, 적어도 약 80-90%, 적어도 약 90-100%는 화학식 (11a)의 화합물이다. 일부 구현예에서, 생성물 혼합물 내의 화합물의 약 50-100%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 또는 적어도 약 90%는 CBCA이다. 일부 구현예에서, 생성물 혼합물 내의 화합물의 약 50-100%, 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 또는 적어도 약 90%는 CBCVA이다.

일부 구현예에서, TS는 화학식 (11)의 또 다른 화합물, 화학식 (10a)의 화합물, 화학식 (9a)의 화합물, 또는 이들의 임의의 조합보다 화학식 (11a)의 화합물을 적어도 1.1배, 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2배, 2.1배, 2.2배, 2.3배, 2.4배, 2.5배, 2.6배, 2.7배, 2.8배, 2.9배, 3배, 3.1배, 3.2배, 3.3배, 3.4배, 3.5배, 3.6배, 3.7배, 3.8배, 3.9배, 4배, 5배, 6배, 8배, 9배, 10배, 20배, 30배, 40배, 50배, 60배, 70배, 80배, 90배, 100배, 200배, 300배, 400배, 500배, 600배, 700배, 800배 또는 1,000배 더 많이 생성할 수 있다. 일부 구현예에서, TS는 화학식 (11)의 또 다른 화합물, 화학식 (10a)의 화합물, 화학식 (9a)의 화합물, 또는 이들의 임의의 조합보다 화학식 (11a)의 화합물을 적어도 1.1배, 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2배, 2.1배, 2.2배, 2.3배, 2.4배, 2.5배, 2.6배, 2.7배, 2.8배, 2.9배, 3배, 3.1배, 3.2배, 3.3배, 3.4배, 3.5배, 3.6배, 3.7배, 3.8배, 3.9배, 4배, 5배, 6배, 8배, 9배, 10배, 20배, 30배, 40배, 50배, 60배, 70배, 80배, 90배, 100배, 200배, 300배, 400배, 500배, 600배, 700배, 800배 또는 1,000배 더 적게 생성할 수 있다.

일부 구현예에서, 생성물 혼합물 내의 화합물의 적어도 약 50-100%, 적어도 약 50-60%, 적어도 약 60-70%, 적어도 약 70-80%, 적어도 약 80-90%, 적어도 약 90-100%는 화학식 (9a)의 화합물이다. 일부 구현예에서, TS는 화학식 (9)의 또 다른 화합물, 화학식 (10a)의 화합물, 화학식 (11a)의 화합물, 또는 이들의 임의의 조합보다 화학식 (9a)의 화합물을 적어도 1.1배, 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2배, 2.1배, 2.2배, 2.3배, 2.4배, 2.5배, 2.6배, 2.7배, 2.8배, 2.9배, 3배, 3.1배, 3.2배, 3.3배, 3.4배, 3.5배, 3.6배, 3.7배, 3.8배, 3.9배, 4배, 5배, 6배, 8배, 9배, 10배, 20배, 30배, 40배, 50배, 60배, 70배, 80배, 90배, 100배, 200배, 300배, 400배, 500배, 600배, 700배, 800배 또는 1,000배 더 많이 생성할 수 있다. 일부 구현예에서, TS는 화학식 (9)의 또 다른 화합물, 화학식 (10a)의 화합물, 화학식 (11a)의 화합물, 또는 이들의 임의의 조합보다 화학식 (9a)의 화합물을 적어도 1.1배, 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2배, 2.1배, 2.2배, 2.3배, 2.4배, 2.5배, 2.6배, 2.7배, 2.8배, 2.9배, 3배, 3.1배, 3.2배, 3.3배, 3.4배, 3.5배, 3.6배, 3.7배, 3.8배, 3.9배, 4배, 5배, 6배, 8배, 9배, 10배, 20배, 30배, 40배, 50배, 60배, 70배, 80배, 90배, 100배, 200배, 300배, 400배, 500배, 600배, 700배, 800배 또는 1,000배 더 적게 생성할 수 있다.

일부 구현예에서, 생성물 혼합물 내의 화합물의 적어도 약 50-100%, 적어도 약 50-60%, 적어도 약 60-70%, 적어도 약 70-80%, 적어도 약 80-90%, 적어도 약 90-100%는 화학식 (10a)의 화합물이다. 일부 구현예에서, TS는 화학식 (10)의 또 다른 화합물, 화학식 (9a)의 화합물, 화학식 (11a)의 화합물, 또는 이들의 임의의 조합보다 화학식 (10a)의 화합물을 적어도 1.1배, 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2배, 2.1배, 2.2배, 2.3배, 2.4배, 2.5배, 2.6배, 2.7배, 2.8배, 2.9배, 3배, 3.1배, 3.2배, 3.3배, 3.4배, 3.5배, 3.6배, 3.7배, 3.8배, 3.9배, 4배, 5배, 6배, 8배, 9배, 10배, 20배, 30배, 40배, 50배, 60배, 70배, 80배, 90배, 100배, 200배, 300배, 400배, 500배, 600배, 700배, 800배 또는 1,000배 더 많이 생성할 수 있다. 일부 구현예에서, TS는 화학식 (10)의 또 다른 화합물, 화학식 (9a)의 화합물, 화학식 (11a)의 화합물, 또는 이들의 임의의 조합보다 화학식 (10a)의 화합물을 적어도 1.1배, 1.2배, 1.3배, 1.4배, 1.5배, 1.6배, 1.7배, 1.8배, 1.9배, 2배, 2.1배, 2.2배, 2.3배, 2.4배, 2.5배, 2.6배, 2.7배, 2.8배, 2.9배, 3배, 3.1배, 3.2배, 3.3배, 3.4배, 3.5배, 3.6배, 3.7배, 3.8배, 3.9배, 4배, 5배, 6배, 8배, 9배, 10배, 20배, 30배, 40배, 50배, 60배, 70배, 80배, 90배, 100배, 200배, 300배, 400배, 500배, 600배, 700배, 800배 또는 1,000배 더 적게 생성할 수 있다.

c. 신호 펩티드

TS를 포함하여 본 출원에 기재된 임의의 효소는 신호 펩티드를 포함할 수 있다. "신호 서열"로도 지칭되는 신호 펩티드는 일반적으로 약 15-30개의 아미노산을 포함하고 새로 번역된 단백질을 특정 세포 구획 및/또는 세포 분비 경로로 이동을 조절하는 데 관여한다.

일부 경우에, 신호 펩티드는 관심 효소의 국소화를 촉진한다. 세포내 공간에서 관심 효소의 국소화를 촉진하는 신호 펩티드의 비제한적인 예는 MF알파2 신호 펩티드이다. 예를 들어, UniProtKB - U3N2M0 (잔기 1-19) 및 문헌(Singh et al., Nucleic Acids Res. (1983) Jun 25; 11(12): 4049-4063)으로부터의 신호 서열을 참조한다. 다른 경우에, 신호 펩티드는 단백질이 소포체(ER)로부터 분비되는 것을 방지할 수 있고/있거나 이러한 단백질이 의도치 않게 내보내진 경우 이러한 단백질의 복귀를 촉진할 수 있다. 이러한 신호 펩티드는 "ER 체류 신호"로 지칭될 수 있다. 단백질이 ER로부터 분비되는 것을 방지할 수 있고/있거나 이러한 단백질이 의도치 않게 내보내진 경우 이러한 단백질의 복귀를 촉진할 수 있는 신호 펩티드의 비제한적인 예는 HDEL 신호 펩티드이다. 예를 들어, 문헌(Pelham et al., EMBO J (1988)7:1757-1762)을 참조한다.

신호 펩티드의 비제한적인 예는 하기 표 2에 열거된 것들을 포함한다. 당업자가 인식할 수 있는 바와 같이, 당업계에 공지된 다른 신호 펩티드도 본 개시내용의 양태와 양립할 수 있을 것이다. 신호 펩티드는 관심 효소를 코딩하는 서열에 대해 N-말단 또는 C-말단에 위치할 수 있다. 관심 효소를 코딩하는 서열은 2개 이상의 신호 펩티드에 연결될 수 있다. 일부 구현예에서, 관심 효소는 N-말단에서 하나 이상의 신호 펩티드 및 C-말단에서 하나 이상의 신호 펩티드에 연결될 수 있다. 예를 들어, 일부 구현예에서, MF알파2 신호 펩티드는 관심 효소를 코딩하는 서열의 N-말단에 위치할 수 있고/있거나 HDEL 신호 펩티드는 관심 효소를 코딩하는 서열의 C-말단에 위치할 수 있다. 다른 구현예에서, HDEL 신호 펩티드는 관심 효소를 코딩하는 서열의 N-말단에 위치할 수 있고/있거나 MF알파2 신호 펩티드는 관심 효소를 코딩하는 서열의 C-말단에 위치할 수 있다.

어떠한 이론에도 국한되지 않고, MF알파2 신호 펩티드 및/또는 HDEL 신호 펩티드에 연결된 TS 효소와 같은 효소는 ER 및/또는 골지체와 같은 분비 경로와 관련된 세포내 위치에 국소화될 것으로 여겨진다. 분비 경로의 조건 중 하나 이상이 씨. 사티바로부터 유래된 TS 효소의 개선된 활성에 기여하는 것으로 여겨진다. 예를 들어, ER 및 골지체는 이황화물 브릿지의 형성을 도울 수 있는 산화적 환경이다. 어떠한 이론에도 국한되지 않고, 신호 펩티드, 및 신호 펩티드를 포함하는 단백질의 결과적인 세포내 국소화는 단백질의 안정성 및/또는 반감기에 차등적으로 영향을 미칠 수 있다.

일부 구현예에서, 신호 펩티드는 서열번호 3, 4, 16-19, 31, 또는 32 중 하나 이상과, 그 사이의 모든 값을 포함하여 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 71%, 적어도 72%, 적어도 73%, 적어도 74%, 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 또는 100% 동일한 핵산 또는 단백질 서열을 포함한다.

일부 구현예에서, 신호 펩티드는 서열번호 3, 4, 16, 또는 31 중 어느 하나와 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 또는 18개 이하의 아미노산이 상이한 서열을 포함한다. 일부 구현예에서, 신호 펩티드는 서열번호 3, 4, 16, 또는 31의 서열에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 또는 18개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 포함한다. 일부 구현예에서, 신호 펩티드는 서열번호 16, 또는 서열번호 16의 서열에 비해 2개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함한다. 일부 구현예에서, 신호 펩티드는 서열번호 17과 1, 2 또는 3개 이하의 아미노산이 상이한 단백질 서열을 포함한다. 일부 구현예에서, 신호 펩티드는 서열번호 17, 또는 서열번호 17의 서열에 비해 1개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함한다.

관심 효소를 코딩하는 서열의 N-말단에 위치한 신호 펩티드는 신호 펩티드의 N-말단에 메티오닌을 포함할 수 있다. 일부 구현예에서, 신호 펩티드가 관심 효소를 코딩하는 서열의 N-말단에 위치할 경우 메티오닌이 신호 펩티드에 첨가된다. 일부 구현예에서, 일반적으로 관심 효소와 관련된 신호 펩티드(예를 들어, 자연 발생 관심 효소에 존재하는 자연 발생 신호 펩티드)는 관심 숙주 세포에서 특정 세포 구획으로 효소를 표적화하기에 적합한 하나 이상의 상이한 신호 펩티드로 제거되거나 대체될 수 있다.

표 2. 신호 펩티드의 비제한적인 예

일부 구현예에서, TS는 테트라하이드로칸나비놀산 신타제(THCAS), 칸나비디올산 신타제(CBDAS), 및/또는 칸나비크로멘산 신타제(CBCAS)이다. 당업자는 TS가 자연 발생 공급원 및 합성 공급원(예를 들어, 비자연 발생 TS)을 포함하는 임의의 공급원으로부터 얻어질 수 있음을 인식할 것이다.

테트라하이드로칸나비놀산 신타제(THCAS)

본 출원에 기재된 숙주 세포는 테트라하이드로칸나비놀산 신타제(THCAS)인 TS를 포함할 수 있다. 본 출원에 사용된 바와 같이, "테트라하이드로칸나비놀산 신타제(THCAS)" 또는 "△¹-테트라하이드로칸나비놀산(THCA) 신타제"는 화학식 (8)의 화합물의 프레닐 모이어티(예를 들어, 테르펜)의 산화적 고리화를 촉매하여 화학식 (10)의 고리-함유 생성물(예를 들어, 헤테로사이클릭 고리-함유 생성물, 카보사이클릭-고리 함유 생성물)을 생성할 수 있는 효소를 지칭한다. 특정 구현예에서, THCAS는 화학식 (8)의 화합물로부터 △9-테트라하이드로칸나비놀산(△-THCA, THCA, △-테트라하이드로-칸나비바린산 A(△-THCVA-C3 A), THCVA, THCPA, 또는 화학식 10(a)의 화합물을 생성할 수 있는 효소를 지칭한다. 특정 구현예에서, THCAS는 △⁹-테트라하이드로칸나비놀산(△⁹-THCA, THCA, 또는 화학식 10(a)의 화합물)을 생성할 수 있다. 특정 구현예에서, THCAS는 △9-테트라하이드로칸나비바린산(△-THCVA, THCVA, 또는 R이 n-프로필인 화학식 10의 화합물)을 생성할 수 있다.

일부 구현예에서, THCAS는 3-프레닐-2,4-디하이드록시-6-알킬벤조산과 같은 기질의 산화적 고리화를 촉매할 수 있다. 일부 구현예에서, THCAS는 칸나비게롤산(CBGA)을 기질로 사용할 수 있다. 일부 구현예에서, THCAS는 CBGA로부터 △9-THCA를 생성한다. 일부 구현예에서, THCAS는 칸나비게로바린산(CBGVA)의 산화적 고리화를 촉매할 수 있다. 일부 구현예에서, THCAS는 다른 기질과 비교하여 CBGA 기질에 대한 특이성을 나타낸다. 일부 구현예에서, THCAS는 R이 C₄ 알킬(예를 들어, n-부틸)이거나 R이 C₇ 알킬(예를 들어, n-헵틸)인 도 2의 화학식 (8)의 화합물을 기질로서 사용할 수 있다. 일부 구현예에서, THCAS는 R이 C₄ 알킬(예를 들어, n-부틸)인 화학식 (8)의 화합물을 기질로서 사용할 수 있다. 일부 구현예에서, THCAS는 R이 C₇ 알킬(예를 들어, n-헵틸)인 도 2의 화학식 (8)의 화합물을 기질로서 사용할 수 있다. 일부 구현예에서, THCAS는 생성물로서 THCP를 생성할 수 있는 기질에 대한 특이성을 나타낸다.

일부 구현예에서, THCAS는 씨. 사티바로부터 유래한다. 씨. 사티바 THCAS는 공유 결합된 플라빈 아데닌 디뉴클레오티드(FAD)를 보조인자로서 사용하고 분자 산소를 최종 전자 수용체로서 사용하여 칸나비게롤산(CBGA)(도 4 구조 8a)의 게라닐 모이어티의 산화적 고리화를 수행하여 테트라하이드로칸나비놀산(도 4 구조 10a)을 형성한다. THCAS는 씨. 사티바의 잎 싹으로부터 효소를 추출하고 CBGA를 기질로 부가할 때 시험관내에서 THCA 신타제 활성을 확인한 후 Taura 등(JACS. 1995)에 의해 처음 발견되고 특성화되었다. Shoyama 등(J Mol Biol. 2012 Oct 12;423(1):96-105)에 의해 발표된 효소의 결정 구조는 효소가 보조인자 FAD의 분자에 공유 결합된다는 것을 보여주었다. 예를 들어, 문헌(Sirikantarams et al., J. Biol. Chem. 2004 Sept 17; 279(38):39767-39774) 또한 참조한다. 씨. 사티바에는 여러 THCAS 동질효소가 있다.

일부 구현예에서, 씨. 사티바 THCAS(Uniprot KB 수탁 번호: I1V0C5)는 하기에 나타낸 아미노산 서열을 포함하며, 여기서 신호 펩티드는 밑줄 치고 볼드체로 표시되어 있다:

일부 구현예에서, THCAS는 하기에 나타낸 서열을 포함한다:

서열번호 21을 코딩하는 뉴클레오티드 서열의 비제한적인 예는 다음과 같다:

일부 구현예에서, THCS는 하기에 나타낸 아미노산 서열을 포함하며, 여기서 신호 펩티드는 밑줄 치고 볼드체로 표시되어 있다:

신호 펩티드를 코딩하는 서열에 밑줄 치고 볼드체로 표시된 서열번호 23을 코딩하는 뉴클레오티드 서열의 비제한적인 예를 하기에 나타낸다:

일부 구현예에서, 씨. 사티바 THCAS는 UniProtKB - Q8GTB6(서열번호 14)에 기재된 아미노산 서열을 포함하며, 여기서 신호 펩티드는 밑줄 치고 볼드체로 표시되어 있다:

일부 구현예에서, THCAS는 하기에 나타낸 서열을 포함한다:

THCAS 효소의 추가의 비제한적인 예는 또한 미국 특허 번호 9,512,391 및 미국 공개 번호 2018/0179564에서 찾을 수 있으며, 이들은 그 전체가 본 출원에 참조로 포함된다.

칸나비디올산 신타제(CBDAS)

본 출원에 기재된 숙주 세포는 칸나비디올산 신타제(CBDAS)인 TS를 포함할 수 있다. 본 출원에 사용된 바와 같이, "CBDAS"는 화학식 (8)의 화합물의 프레닐 모이어티(예를 들어, 테르펜)의 산화적 고리화를 촉매하여 화학식 9의 화합물을 생성할 수 있는 효소를 지칭한다. 일부 구현예에서, 화학식 9의 화합물은 화학식 (9a)의 화합물(칸나비디올산(CBDA)), CBDVA, 또는 CBDP이다. CBDAS는 칸나비게롤산(CBGA) 또는 칸나비네롤산을 기질로서 사용할 수 있다. 일부 구현예에서, 칸나비디올산 신타제는 칸나비게롤산(CBGA)을 산화적 고리화하여 칸나비디올산(CBDA)을 생성할 수 있다. 일부 구현예에서, CBDAS는 칸나비게로바린산(CBVGA)과 같은 3-게라닐-2,4-디하이드로-6-알킬벤조산과 같은 다른 기질의 산화적 고리화를 촉매할 수 있다. 일부 구현예에서, CBDAS는 CBGA 기질에 대한 특이성을 나타낸다.

일부 구현예에서, CBDAS는 대마초로부터 유래된다. 씨. 사티바에서, CBDAS는 CBDAS 유전자에 의해 코딩되며 플라보효소이다. CBDAS를 포함하는 아미노산 서열의 비제한적인 예는 씨. 사티바로부터의 UniProtKB - A6P6V9(서열번호 13)에 의해 제공되며, 여기서 신호 펩티드가 밑줄 치고 볼드체로 표시되어 있다:

일부 구현예에서, CBDAS는 하기에 나타낸 서열을 포함한다:

CBDAS 효소의 추가의 비제한적인 예는 또한 미국 특허 번호 9,512,391 및 미국 공개 번호 2018/0179564에서 찾을 수 있으며, 이들은 그 전체가 본 출원에 참조로 포함된다.

칸나비크로멘산 신타제(CBCAS)

본 출원에 기재된 숙주 세포는 칸나비크로멘산 신타제(CBCAS)인 TS를 포함할 수 있다. 본 출원에 사용된 바와 같이, "CBCAS"는 화학식 (8)의 화합물의 프레닐 모이어티(예를 들어, 테르펜)의 산화적 고리화를 촉매하여 화학식 (11)의 화합물을 생성할 수 있는 효소를 지칭한다. 일부 구현예에서, 화학식 (11)의 화합물은 화학식 (11a)의 화합물(칸나비크로멘산(CBCA)), CBCVA, 또는 C₇ 알킬(헵틸) 기로서 R을 갖는 화학식 (8)의 화합물이다. CBCAS는 칸나비게롤산(CBGA)을 기질로서 사용할 수 있다. 일부 구현예에서, CBCAS는 칸나비게롤산(CBGA)으로부터 칸나비크로멘산(CBCA)을 생성한다. 일부 구현예에서, CBCAS는 칸나비게로바린산(CBVGA)과 같은 3-게라닐-2,4-디하이드로-6-알킬벤조산과 같은 다른 기질, 또는 C₇ 알킬 (헵틸) 기로서 R을 갖는 화학식 (8)의 기질의 산화적 고리화를 촉매할 수 있다. 일부 구현예에서, CBCAS는 CBGA 기질에 대한 특이성을 나타낸다.

일부 구현예에서, CBCAS는 대마초로부터 유래된다. 씨. 사티바 CBCAS는 하기와 같은 아미노산 서열을 가지며, 여기서 신호 펩티드는 밑줄 치고 볼드체로 표시되어 있다:

일부 구현예에서, CBCAS는 하기에 나타낸 서열을 포함한다:

다른 구현예에서, CBCAS는 미국 특허 번호 9359625에 기재된 CBCAS일 수 있으며 상기 특허는 참조로 포함된다.

일부 구현예에서, CBCAS는 Uniprot KB 수탁 번호: I1V0C5에 상응하는 THCAS와 같은 THCAS 활성도 나타내는 씨. 사티바 효소일 수 있다. 일부 구현예에서, CBCAS는 서열번호 20-24 중 어느 하나에 상응하는 씨. 사티바 THCAS일 수 있다.

실시예 섹션에 기재된 바와 같이, 놀랍게도 에이. 니제르(곰팡이)로부터의 효소와 같은 아스페르길루스 과의 효소를 포함하는 다수의 진균 효소가 화학식 (8)의 화합물의 전환을 촉매하여 화학식 (11)의 화합물을 생성하고 일부 경우에, 또한 화학식 (10)의 화합물 및/또는 화학식 (9)의 화합물을 생성할 수 있다는 것을 발견하였다. 대마초 식물은 수 세기 동안 인간의 개입을 통해 칸나비노이드를 생성하기 위해 인위적으로 높은 선택 압력을 받았지만 에이. 니제르 곰팡이와 같은 진균 종은 칸나비노이드 생성을 위한 선택 압력을 받지 않았다. 따라서, 특정 이론에 국한되지 않고, 본 출원에 개시된 에이. 니제르 CBCAS와 같은 진균 CBCAS는 TS의 활성 및/또는 풍부도를 변경하기 위한 조작에 유용할 수 있다(예를 들어, 생성물 프로파일, 기질 프로파일, 및/또는 TS의 동역학(예를 들어, Kcat/Vmax 및/또는 Kd) 변화). 또한 실시에 섹션에 나타낸 바와 같이, 놀랍게도 본 개시내용에서 확인된 에이. 니제르 효소와 같은 아스페르길루스 과의 효소를 포함하는 많은 진균 효소가 CBCAS 활성, CBCVAS 활성, 또는 둘 모두를 나타내는 것으로 밝혀졌다. 이들 효소 중 일부는 추가로 THCAS 활성, THCVAS 활성, CBDAS 활성 또는 이들의 조합을 나타냈다.

일부 구현예에서, 에이. 니제르로부터의 CBCAS는 하기에 나타낸 아미노산 서열을 포함한다:

에스. 세레비지아에에서의 발현을 위한 서열번호 25를 코딩하는 핵산 서열의 비제한적인 예는 다음과 같다:

일부 구현예에서, 에이. 니제르로부터의 CBCAS는 하기에 나타낸 아미노산 서열을 포함한다(UniProt 수탁 번호 A0A254UC34에 상응함):

에스. 세레비지아에에서의 발현을 위한 서열번호 27을 코딩하는 핵산 서열의 비제한적인 예는 다음과 같다:

일부 구현예에서, CBCAS는 각각 서열번호 25; MF알파2 신호 펩티드; 및 HDEL 신호 펩티드를 포함한다. 일부 구현예에서, 이러한 CBCAS는 하기에 나타낸 아미노산 서열을 포함하며, 여기서 신호 펩티드는 밑줄 치고 볼드체로 표시되어 있다:

서열번호 29를 코딩하는 핵산 서열의 비제한적인 예를 하기에 나타내고, 여기서 신호 펩티드를 코딩하는 서열은 밑줄 치고 불드체로 표시되어 있다:

일부 구현예에서, TS는 서열번호 20-30 또는 34-173 중 하나 이상, 표 15의 서열 중 어느 하나, 또는 본 출원에 개시된 임의의 TS와, 그 사이의 모든 값을 포함하여 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 71%, 적어도 72%, 적어도 73%, 적어도 74%, 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 핵산 또는 단백질 서열을 포함한다. 일부 구현예에서, TS는 서열번호 25, 26, 27, 28, 35, 56, 64, 85, 92, 94, 95, 105, 126, 134, 155, 162, 164, 및 165 중 하나 이상과, 그 사이의 모든 값을 포함하여 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 71%, 적어도 72%, 적어도 73%, 적어도 74%, 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 핵산 또는 단백질 서열을 포함한다. 일부 구현예에서, TS는 서열번호 25, 26, 27, 28, 35, 42, 56, 60, 64, 105, 85, 92, 94, 95, 112, 126, 130, 134, 155, 162, 164, 165 중 하나 이상과, 그 사이의 모든 값을 포함하여 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 71%, 적어도 72%, 적어도 73%, 적어도 74%, 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 핵산 또는 단백질 서열을 포함한다. 일부 구현예에서, TS는 서열번호 25, 26, 27, 28, 35, 42, 56, 60, 64, 105, 85, 89, 92, 93, 94, 95, 96, 97, 102, 112, 126, 130, 134, 155, 159, 162, 163, 164, 165, 166, 167, 및 172 중 하나 이상과, 그 사이의 모든 값을 포함하여 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 71%, 적어도 72%, 적어도 73%, 적어도 74%, 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 핵산 또는 단백질 서열을 포함한다.

일부 구현예에서, TS는 서열번호 20-30 또는 34-173 중 하나 이상, 표 15의 서열 중 어느 하나, 또는 본 출원에 개시된 임의의 TS와, 그 사이의 모든 값을 포함하여 최대 5%, 최대 10%, 최대 15%, 최대 20%, 최대 25%, 최대 30%, 최대 35%, 최대 40%, 최대 45%, 최대 50%, 최대 55%, 최대 60%, 최대 65%, 최대 70%, 최대 71%, 최대 72%, 최대 73%, 최대 74%, 최대 75%, 최대 76%, 최대 77%, 최대 78%, 최대 79%, 최대 80%, 최대 81%, 최대 82%, 최대 83%, 최대 84%, 최대 85%, 최대 86%, 최대 87%, 최대 88%, 최대 89%, 최대 90%, 최대 91%, 최대 92%, 최대 93%, 최대 94%, 최대 95%, 최대 96%, 최대 97%, 최대 98%, 최대 99%, 또는 100% 동일한 서열을 포함한다. 일부 구현예에서, TS는 서열번호 20-30 또는 34-173 중 하나 이상, 표 15의 서열 중 어느 하나, 또는 본 출원에 개시된 임의의 TS와, 그 사이의 모든 값을 포함하여 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함한다.

일부 구현예에서, 서열번호 29와 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 TS 서열은 서열번호 16, 또는 서열번호 16의 서열에 비해 2개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드를 포함한다. 일부 구현예에서, 서열번호 16, 또는 서열번호 16의 서열에 비해 2개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드는 TS 서열의 N-말단에 위치한다. 예를 들어, 서열번호 16, 또는 서열번호 16의 서열에 비해 2개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드는 메티오닌 잔기 다음에 오는 TS 서열의 위치 2에서 시작할 수 있다.

일부 구현예에서, 서열번호 29와 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 TS 서열은 서열번호 17, 또는 서열번호 17의 서열에 비해 1개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드를 포함한다. 일부 구현예에서, 서열번호 17, 또는 서열번호 17의 서열에 비해 1개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드는 서열번호 29와 적어도 90% 동일한 서열의 C-말단에 위치한다.

일부 구현예에서, TS는 서열번호 25, 27 또는 104-173 중 어느 하나와 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하고, 여기서 서열은 하나 이상의 신호 펩티드에 연결된다. 일부 구현예에서, 서열번호 16, 또는 서열번호 16의 서열에 비해 2개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드는 서열번호 25, 27 또는 104-173 중 어느 하나와 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열의 N-말단에 연결된다. 일부 구현예에서, 서열번호 27 또는 104-173 중 어느 하나의 N-말단 메티오닌 잔기는 서열이 N-말단 신호 펩티드에 연결되는 경우 포함되지 않는다. 일부 구현예에서, 메티오닌 잔기는 N-말단 신호 펩티드(예를 들어, 서열번호 16)의 N-말단에 부가된다. 일부 구현예에서, 서열번호 17, 또는 서열번호 17의 서열에 비해 1개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드는 서열번호 25, 27 또는 104-173과 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열의 카복실 말단에 연결된다.

일부 구현예에서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 155, 159, 162, 163, 164, 165, 166, 167, 및 172 중 어느 하나와 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열을 포함하고, 여기서 서열은 하나 이상의 신호 펩티드에 연결된다. 일부 구현예에서, 서열번호 16, 또는 서열번호 16의 서열에 비해 2개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드는 서열번호 25, 27, 105, 112, 126, 130, 134, 155, 159, 162, 163, 164, 165, 166, 167, 및 172와 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열의 N-말단에 연결된다. 일부 구현예에서, 서열번호 27, 105, 112, 126, 130, 134, 155, 159, 162, 163, 164, 165, 166, 167, 및 172 중 어느 하나의 N-말단 메티오닌 잔기는 서열이 N-말단 신호 펩티드에 연결되는 경우 포함되지 않는다. 일부 구현예에서, 메티오닌 잔기는 N-말단 신호 펩티드(예를 들어, 서열번호 16)의 N-말단에 부가된다. 일부 구현예에서, 서열번호 17, 또는 서열번호 17의 서열에 비해 1개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드는 서열번호 25, 27, 105, 112, 126, 130, 134, 155, 159, 162, 163, 164, 165, 166, 167, 및 172 중 어느 하나와 적어도 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일한 서열의 카복실 말단에 연결된다.

일부 구현예에서, 서열번호 21에 비해, TS는 서열번호 21의 위치 1, 2, 3, 4, 5, 6, 8, 10, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 26, 27, 28, 29, 30, 31, 33, 34, 35, 37, 39, 41, 48, 49, 51, 55, 58, 60, 61, 62, 70, 72, 74, 75, 76, 81, 88, 89, 91, 94, 97, 100, 101, 102, 104, 105, 106, 108, 110, 111, 112, 113, 114, 115, 116, 117, 119, 122, 123, 125, 127, 130, 132, 133, 135, 137, 138, 139, 140, 141, 142, 145, 147, 149, 150, 164, 165, 168, 169, 172, 173, 175, 176, 177, 180, 181, 183, 184, 185, 187, 193, 201, 208, 209, 212, 214, 215, 217, 222, 225, 226, 227, 229, 231, 233, 235, 236, 238, 239, 241, 242, 243, 244, 245, 246, 247, 250, 251, 253, 254, 255, 256, 257, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 277, 278, 279, 281, 282, 283, 284, 286, 287, 288, 290, 292, 293, 294, 295, 297, 298, 299, 301, 302, 309, 310, 311, 312, 315, 317, 322, 323, 324, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 344, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 357, 361, 362, 365, 366, 368, 369, 370, 371, 372, 373, 374, 376, 377, 379, 380, 381, 382, 383, 384, 385, 386, 387, 389, 394, 396, 401, 402, 411, 412, 414, 415, 416, 418, 419, 420, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 436, 437, 439, 440, 441, 447, 448, 451, 452, 459, 461, 463, 464, 465, 467, 468, 469, 470, 471, 473, 474, 477, 484, 485, 488, 492, 496, 497, 500, 505, 511, 513, 514, 515, 516, 및/또는 517에 상응하는 잔기에서 아미노산 치환, 결실, 또는 삽입을 포함한다. 일부 구현예에서, TS는 서열번호 21의 위치 1, 2, 3, 4, 5, 6, 8, 10, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 26, 27, 28, 29, 30, 31, 33, 34, 35, 37, 39, 41, 48, 49, 51, 55, 58, 60, 61, 62, 70, 72, 74, 75, 76, 81, 88, 89, 91, 94, 97, 100, 101, 102, 104, 105, 106, 108, 110, 111, 112, 113, 114, 115, 116, 117, 119, 122, 123, 125, 127, 130, 132, 133, 135, 137, 138, 139, 140, 141, 142, 145, 147, 149, 150, 164, 165, 168, 169, 172, 173, 175, 176, 177, 180, 181, 183, 184, 185, 187, 193, 201, 208, 209, 212, 214, 215, 217, 222, 225, 226, 227, 229, 231, 233, 235, 236, 238, 239, 241, 242, 243, 244, 245, 246, 247, 250, 251, 253, 254, 255, 256, 257, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 277, 278, 279, 281, 282, 283, 284, 286, 287, 288, 290, 292, 293, 294, 295, 297, 298, 299, 301, 302, 309, 310, 311, 312, 315, 317, 322, 323, 324, 326, 327, 328, 329, 330, 331, 332, 333, 334, 335, 336, 337, 338, 339, 340, 341, 344, 346, 347, 348, 349, 350, 351, 352, 353, 354, 355, 357, 361, 362, 365, 366, 368, 369, 370, 371, 372, 373, 374, 376, 377, 379, 380, 381, 382, 383, 384, 385, 386, 387, 389, 394, 396, 401, 402, 411, 412, 414, 415, 416, 418, 419, 420, 422, 423, 424, 425, 426, 427, 428, 429, 430, 431, 432, 433, 434, 436, 437, 439, 440, 441, 447, 448, 451, 452, 459, 461, 463, 464, 465, 467, 468, 469, 470, 471, 473, 474, 477, 484, 485, 488, 492, 496, 497, 500, 505, 511, 513, 514, 515, 516, 및/또는 517에 상응하는 위치에서 서열번호 25에 존재하는 아미노산 잔기를 포함한다.

실시예 1 및 3은 CBCA를 생성하는데 놀랍게도 효과적인 진균 후보 TS의 확인을 설명한다. 표 14는 CBCA 생성에 효과적인 후보 TS의 서열이 풍부한 것으로 확인된 서열 모티프의 비제한적인 예를 제공한다. 일부 구현예에서, TS는 표 14에 제공된 하기 모티프 중 하나 이상을 포함한다: KVQARSGGH(서열번호 174), RASNTQNQD[VI][FL]FA[VI]K(서열번호 176), CPTI[KR]TGGH(서열번호 181), WFVTLSLEGGAINDV[AP]EDATAY[AG]H(서열번호 184), P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186), MKHF[TNS]QFSM(서열번호 189), P[EQ][TS]A[EAD][QE]IA[GA][VI]VKC(서열번호 193), RDCL[IV]SA[LV]GGN[SA]A[LH][AV][AV]F[PQ][ND][QE]LL[WY](서열번호 200), RT[EQ][PQ]APGLAVQYSY(서열번호 207), 및/또는 WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211). 일부 구현예에서, TS는 서열번호 27의 잔기 72-80에 상응하는 잔기에 모티프 KVQARSGGH(서열번호 174)를 포함한다.

일부 구현예에서, TS는 서열번호 27의 잔기 183-197에 상응하는 잔기에 모티프 RASNTQNQD[VI][FL]FA[VI]K(서열번호 176)를 포함한다. 일부 구현예에서, 모티프 RASNTQNQD[VI][FL]FA[VI]K(서열번호 176)는 RASNTQNQDVFFAVK(서열번호 177), RASNTQNQDILFAVK(서열번호 178), RASNTQNQDILFAIK(서열번호 179), 또는 RASNTQNQDVLFAVK(서열번호 180)이다.

일부 구현예에서, TS는 서열번호 27의 잔기 141-149에 상응하는 잔기에 모티프 CPTI[KR]TGGH(서열번호 181)를 포함한다. 일부 구현예에서, 모티프 CPTI[KR]TGGH(서열번호 181)는 CPTIKTGGH(서열번호 182) 또는 CPTIRTGGH(서열번호 183)이다.

일부 구현예에서, TS는 서열번호 27의 잔기 360-383에 상응하는 잔기에 모티프 WFVTLSLEGGAINDV[AP]EDATAY[AG]H(서열번호 184)를 포함한다. 일부 구현예에서, 모티프 WFVTLSLEGGAINDV[AP]EDATAY[AG]H(서열번호 184)는 WFVTLSLEGGAINDVAEDATAYAH(서열번호 185)이다.

일부 구현예에서, TS는 서열번호 27의 잔기 400-436에 상응하는 잔기에 모티프 P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186)을 포함한다. 일부 구현예에서, 모티프 P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186)은 PISDTTYEFTDGLYDVLARAVPESVGHAYLGCPDPRM(서열번호 187) 또는 PISETTYEFTDGLYDVLARAVPESVGHAYLGCPDPRM(서열번호 188)이다.

일부 구현예에서, TS는 서열번호 27의 잔기 98-106에 상응하는 잔기에 모티프 MKHF[TNS]QFSM(서열번호 189)을 포함한다. 일부 구현예에서, 모티프 MKHF[TNS]QFSM(서열번호 189)은 MKHFTQFSM(서열번호 190), MKHFSQFSM(서열번호 191), 또는 MKHFNQFSM(서열번호 192)이다.

일부 구현예에서, TS는 서열번호 27의 잔기 53-65에 상응하는 잔기에 모티프 P[EQ][TS]A[EAD][QE]IA[GA][VI]VKC(서열번호 193)를 포함한다. 일부 구현예에서, 모티프 P[EQ][TS]A[EAD][QE]IA[GA][VI]VKC(서열번호 193)는 PETAEQIAGIVKC(서열번호 194), PQSADEIAAVVKC(서열번호 195), PETAAQIAGVVKC(서열번호 196), PQSAEEIAAVVKC(서열번호 197), PETAEQIAGVVKC(서열번호 198), 또는 PETAEQIAAVVKC(서열번호 199)이다.

일부 구현예에서, TS는 서열번호 27의 잔기 10-32에 상응하는 잔기에 모티프 RDCL[IV]SA[LV]GGN[SA]A[LH][AV][AV]F[PQ][ND][QE]LL[WY](서열번호 200)을 포함한다. 일부 구현예에서, 모티프 RDCL[IV]SA[LV]GGN[SA]A[LH][AV][AV]F[PQ][ND][QE]LL[WY](서열번호 200)은 RDCLISAVGGNAAHVAFQDQLLY(서열번호 201), RDCLISALGGNSALAVFPNELLW(서열번호 202), RDCLISALGGNSALAAFPNELLW(서열번호 203), RDCLISALGGNSALAVFPNQLLW(서열번호 204), RDCLISALGGNSALAAFPNQLLW(서열번호 205), 또는 RDCLVSALGGNSALAAFPNQLLW (서열번호 206)이다.

일부 구현예에서, TS는 서열번호 27의 잔기 212-225에 상응하는 잔기에 모티프 RT[EQ][PQ]APGLAVQYSY(서열번호 207)를 포함한다. 일부 구현예에서, 모티프 RT[EQ][PQ]APGLAVQYSY(서열번호 207)는 RTEPAPGLAVQYSY(서열번호 208), RTEQAPGLAVQYSY(서열번호 209), 또는 RTQPAPGLAVQYSY(서열번호 210)이다.

일부 구현예에서, TS는 서열번호 27의 잔기 242-259에 상응하는 잔기에 모티프 WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211)을 포함한다. 일부 구현예에서, 모티프 WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211)은 WQSFISAKNLTRQFYNNM(서열번호 212) 또는 WQSFISAKNLTRQFYTNM(서열번호 213)이다.

일부 구현예에서, 상기 기재된 하나 이상의 모티프는 TS의 보조인자(FAD) 결합 부위와 접촉할 수 있다. 예를 들어, 도 15에 화살표로 나타낸 KVQARSGGH(서열번호 174), CPTI[KR]TGGH(서열번호 181), 및 P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186)은 보조인자 결합 부위와 접촉할 것으로 예측되고 따라서 보조인자 결합에 영향을 미칠 수 있다. 어떠한 이론에도 국한되지 않고, 이러한 모티프는 보조인자의 산화환원 전위 조절에 관여할 수 있으며, 예를 들어, 효소 회전율(turnover)을 조절함으로써 효소 활성에 중요할 수 있다.

일부 구현예에서, 상기 기재된 하나 이상의 모티프는 TS의 활성 부위의 공동에 라인을 형성할 수 있다. 예를 들어, 도 16에 화살표로 나타낸 WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211)은 활성 부위의 공동에 라인을 형성할 것으로 예측된다. 일부 구현예에서, 모티프 RT[EQ][PQ]APGLAVQYSY(서열번호 207) 및 WFVTLSLEGGAINDV[AP]EDATAY[AG]H(서열번호 184)는 또한 활성 부위의 공동에 라인을 형성할 수 있고 기질 결합 포켓 근처에 있을 수 있다. 어떠한 이론에도 국한되지 않고, 이러한 모티프는 기질 또는 생성물 특이성에 영향을 미칠 수 있다.

일부 구현예에서, 본 개시내용과 관련된 TS는 본 개시내용에 제공된 임의의 TS의 서열과 관련된 하나 이상의 아미노산 치환, 결실, 부가 또는 삽입을 포함한다. 일부 구현예에서, 서열번호 27의 서열에 비해, TS는 서열번호 27의 위치 25, 33, 35, 39, 43, 55, 57, 61, 62, 63, 71, 102, 112, 114, 122, 126, 129, 131, 161, 180, 183, 202, 256, 257, 260, 262, 280, 287, 295, 341, 353, 386, 392, 394, 398, 410, 423, 426, 446, 450, 456, 458, 466, 469, 및/또는 472에 상응하는 잔기에 아미노산 치환을 포함한다. 일부 구현예에서, 서열번호 27의 서열에 비해, TS는 위치 33, 39, 55, 57, 61, 62, 63, 71, 112, 122, 126, 129, 131, 180, 183, 202, 256, 257, 260, 287, 295, 341, 386, 392, 394, 398, 410, 423, 426, 450, 및/또는 472에 상응하는 잔기에 아미노산 치환을 포함한다.

일부 구현예에서, TS는 서열번호 27의 위치 25에 상응하는 잔기에 아미노산 A; 서열번호 27의 위치 33에 상응하는 잔기에 아미노산 D; 서열번호 27의 위치 35에 상응하는 잔기에 아미노산 A; 서열번호 27의 위치 39에 상응하는 잔기에 아미노산 F; 서열번호 27의 위치 43에 상응하는 잔기에 아미노산 I; 서열번호 27의 위치 55에 상응하는 잔기에 아미노산 S; 서열번호 27의 위치 57에 상응하는 잔기에 아미노산 Q; 서열번호 27의 위치 57에 상응하는 잔기에 아미노산 E; 서열번호 27의 위치 61에 상응하는 잔기에 아미노산 A; 서열번호 27의 위치 62에 상응하는 잔기에 아미노산 I; 서열번호 27의 위치 63에 상응하는 잔기에 아미노산 I; 서열번호 27의 위치 71에 상응하는 잔기에 아미노산 I; 서열번호 27의 위치 102에 상응하는 잔기에 아미노산 N; 서열번호 27의 위치 102에 상응하는 잔기에 아미노산 Q; 서열번호 27의 위치 102에 상응하는 잔기에 아미노산 S; 서열번호 27의 위치 112에 상응하는 잔기에 아미노산 V; 서열번호 27의 위치 112에 상응하는 잔기에 아미노산 T; 서열번호 27의 위치 114에 상응하는 잔기에 아미노산 T; 서열번호 27의 위치 122에 상응하는 잔기에 아미노산 S; 서열번호 27의 위치 122에 상응하는 잔기에 아미노산 G; 서열번호 27의 위치 122에 상응하는 잔기에 아미노산 A; 서열번호 27의 위치 122에 상응하는 잔기에 아미노산 E; 서열번호 27의 위치 126에 상응하는 잔기에 아미노산 A; 서열번호 27의 위치 126에 상응하는 잔기에 아미노산 R; 서열번호 27의 위치 126에 상응하는 잔기에 아미노산 T; 서열번호 27의 위치 126에 상응하는 잔기에 아미노산 K; 서열번호 27의 위치 126에 상응하는 잔기에 아미노산 D; 서열번호 27의 위치 129에 상응하는 잔기에 아미노산 W; 서열번호 27의 위치 131에 상응하는 잔기에 아미노산 S; 서열번호 27의 위치 161에 상응하는 잔기에 아미노산 K; 서열번호 27의 위치 180에 상응하는 잔기에 아미노산 T; 서열번호 27의 위치 183에 상응하는 잔기에 아미노산 T; 서열번호 27의 위치 202에 상응하는 잔기에 아미노산 S; 서열번호 27의 위치 202에 상응하는 잔기에 아미노산 G; 서열번호 27의 위치 202에 상응하는 잔기에 아미노산 S; 서열번호 27의 위치 256에 상응하는 잔기에 아미노산 F; 서열번호 27의 위치 256에 상응하는 잔기에 아미노산 M; 서열번호 27의 위치 257에 상응하는 잔기에 아미노산 S; 서열번호 27의 위치 260에 상응하는 잔기에 아미노산 M; 서열번호 27의 위치 260에 상응하는 잔기에 아미노산 F; 서열번호 27의 위치 262에 상응하는 잔기에 아미노산 I; 서열번호 27의 위치 280에 상응하는 잔기에 아미노산 N; 서열번호 27의 위치 287에 상응하는 잔기에 아미노산 R; 서열번호 27의 위치 295에 상응하는 잔기에 아미노산 S; 서열번호 27의 위치 341에 상응하는 잔기에 아미노산 S; 서열번호 27의 위치 353에 상응하는 잔기에 아미노산 A; 서열번호 27의 위치 386에 상응하는 잔기에 아미노산 A; 서열번호 27의 위치 392에 상응하는 잔기에 아미노산 H; 서열번호 27의 위치 394에 상응하는 잔기에 아미노산 T; 서열번호 27의 위치 398에 상응하는 잔기에 아미노산 F; 서열번호 27의 위치 398에 상응하는 잔기에 아미노산 T; 서열번호 27의 위치 398에 상응하는 잔기에 아미노산 A; 서열번호 27의 위치 398에 상응하는 잔기에 아미노산 L; 서열번호 27의 위치 410에 상응하는 잔기에 아미노산 N; 서열번호 27의 위치 423에 상응하는 잔기에 아미노산 A; 서열번호 27의 위치 426에 상응하는 잔기에 아미노산 Y; 서열번호 27의 위치 446에 상응하는 잔기에 아미노산 P; 서열번호 27의 위치 450에 상응하는 잔기에 아미노산 K; 서열번호 27의 위치 456에 상응하는 잔기에 아미노산 A; 서열번호 27의 위치 458에 상응하는 잔기에 아미노산 W; 서열번호 27의 위치 466에 상응하는 잔기에 아미노산 N; 서열번호 27의 위치 469에 상응하는 잔기에 아미노산 S; 서열번호 27의 위치 472에 상응하는 잔기에 아미노산 R; 서열번호 27의 위치 472에 상응하는 잔기에 아미노산 A; 및/또는 서열번호 27의 위치 450에 상응하는 잔기에 아미노산 K를 포함한다.

일부 구현예에서, TS는 서열번호 27에 비해 하기 아미노산 치환: V25A; T33D; D35A Y39F; L43I; T55S; A57Q; A57E; G61A; V62I; V63I; Y71I; T102N; T102Q; T102S; E112V; E112T; V114T; N122S; N122G; N122A; N122E; I126A; I126R; I126T; I126K; I126D; Y129W; N131S; Q161K; S180T; R183T; N202S; N202G; Y256F; Y256M; N257S; V260M; V260F; F262I; D280N; H287R; N295S; A341S; H353A; V386A; L392H; M394T; V398F; V398T; V398A; V398L; D410N; S423A; H426Y; T446P; R450K; E456A; L458W; H466N; G469S; P472R; P472A; 및/또는 R450K 중 하나 이상을 포함한다.

모두 큰 소수성 아미노산인 서열번호 27의 잔기 Y256, L392, 및 M394는 활성 부위 내에 위치할 것으로 예측된다. 어떠한 이론에도 국한되지 않고, 이러한 위치에서의 돌연변이는 CBDA 합성을 입체적으로 방지하는 방식으로 CBGA의 폴딩을 물리적으로 차단함으로써 적어도 부분적으로 생성물 프로파일을 CBCA 쪽으로 그리고 CBDA로부터 멀리 이동할 수 있다.

일부 구현예에서, 하나 이상의 아미노산 치환은 이러한 치환이 없는 TS와 비교하여 화학식 (11)의 화합물, CBCA, CBCVA 또는 이들의 조합에 대한 특이성과 같은 TS의 생성물 특이성을 증가시킨다. 일부 구현예에서, 하나 이상의 아미노산 치환은 A57Q 및 G61A; V260M; V62I; V386A; V260F; E112V 및 N122S; A57E 및 I126A; T33D 및 N257S; N202S 및 P472A; D410N; R450K; S180T; R183T; N122G 및 I126R; N122A 및 I126T; Y71I; H287R 및 A341S; T55S 및 I126T; N122G 및 V398F; M394T; A57E; N131S; V63I; N122G 및 I126R; P472R; S180T; V398A; R183T; V260M; V386A; H426Y; Y256M; N202S 및 P472A; N122G 및 I126K; V62I; R450K; Y129W; S423A; H287R 및 A341S; N295S; Y39F; V260F; L392H; A57E 및 N131S; E112V 및 N122S; T33D 및 N257S를 포함한다.

일부 구현예에서, 하나 이상의 아미노산 치환은 A57Q 및 G61A; Y71I; 및/또는 V260F를 포함한다.

표 3: 증가된 CBCA 역가를 나타내는 에이. 니제르 CBCAS의 돌연변이

추가 칸나비노이드 경로 효소

칸나비노이드 및 칸나비노이드 전구체의 생성 방법은 아실 활성화 효소(AAE); 폴리케타이드 신타제(PKS) (예를 들어, OLS); 폴리케타이드 사이클라제(PKC); 및 프레닐트랜스퍼라제(PT) 중 하나 이상의 발현을 추가로 포함할 수 있다.

아실 활성화 효소(AAE)

본 개시내용에 기재된 숙주 세포는 AAE를 포함할 수 있다. 본 개시내용에서 사용된 바와 같이, AAE는 티올과, 카복실산 모이어티를 갖는 기질(예를 들어, 임의로 치환된 지방족 또는 아릴 기) 사이의 에스테르화를 촉매할 수 있는 효소를 지칭한다. 일부 구현예에서, AAE는 하기 화학식 (1):

또는 이의 염, 용매화물, 수화물, 다형체, 공결정, 호변이성질체, 입체이성질체, 동위원소적으로 표지된 유도체를 사용하여 화학식 (2)의 생성물을 생성할 수 있다:

R은 본 출원에서 정의된 바와 같다. 특정 구현예에서, R은 수소이다. 특정 구현예에서, R은 임의로 치환된 알킬이다. 특정 구현예에서, R은 임의로 치환된 C_1-40 알킬이다. 특정 구현예에서, R은 임의로 치환된 C_2-40 알킬이다. 특정 구현예에서, R은 직쇄 또는 분지형 알킬인 임의로 치환된 C_2-40 알킬이다. 특정 구현예에서, R은 직쇄 또는 분지형 알킬인 임의로 치환된 C_2-10 알킬, 임의로 치환된 C₁₀-C₂₀ 알킬, 임의로 치환된 C₂₀-C₃₀ 알킬, 임의로 치환된 C₃₀-C₄₀ 알킬, 또는 임의로 치환된 C₄₀-C₅₀ 알킬이다. 특정 구현예에서, R은 임의로 치환된 C_3-8 알킬이다. 특정 구현예에서, R은 임의로 치환된 C₁-C₄₀ 알킬, C₁-C₂₀ 알킬, C₁-C₁₀ 알킬, C₁-C₈ 알킬, C₁-C₅ 알킬, C₃-C₅ 알킬, C₃ 알킬, 또는 C₅ 알킬이다. 특정 구현예에서, R은 임의로 치환된 C₁-C₂₀ 알킬이다. 특정 구현예에서, R은 임의로 치환된 C₁-C₂₀ 분지형 알킬이다. 특정 구현예에서, R은 임의로 치환된 C₁-C₂₀ 알킬, 임의로 치환된 C₁-C₁₀ 알킬, 임의로 치환된 C₁₀-C₂₀ 알킬, 임의로 치환된 C₂₀-C₃₀ 알킬, 임의로 치환된 C₃₀-C₄₀ 알킬, 또는 임의로 치환된 C₄₀-C₅₀ 알킬이다. 특정 구현예에서, R은 임의로 치환된 C₁-C₁₀ 알킬이다. 특정 구현예에서, R은 임의로 치환된 C₃ 알킬이다. 특정 구현예에서, R은 임의로 치환된 n-프로필이다. 특정 구현예에서, R은 비치환된 n-프로필이다. 특정 구현예에서, R은 임의로 치환된 C₁-C₈ 알킬이다. 일부 구현예에서, R은 C₂-C₆ 알킬이다. 특정 구현예에서, R은 임의로 치환된 C₁-C₅ 알킬이다. 특정 구현예에서, R은 임의로 치환된 C₃-C₅ 알킬이다. 특정 구현예에서, R은 임의로 치환된 C₃ 알킬이다. 특정 구현예에서, R은 임의로 치환된 C₅ 알킬이다. 특정 구현예에서, R은 하기 화학식이다:

특정 구현예에서, R은 하기 화학식이다:

특정 구현예에서, R은 임의로 치환된 프로필이다. 특정 구현예에서, R은 임의로 치환된 n-프로필이다. 특정 구현예에서, R은 임의로 치환된 아릴로 임의로 치환된 n-프로필이다. 특정 구현예에서, R은 임의로 치환된 페닐로 임의로 치환된 n-프로필이다. 특정 구현예에서, R은 비치환된 페닐로 치환된 n-프로필이다. 특정 구현예에서, R은 임의로 치환된 부틸이다. 특정 구현예에서, R은 임의로 치환된 n-부틸이다. 특정 구현예에서, R은 임의로 치환된 아릴로 임의로 치환된 n-부틸이다. 특정 구현예에서, R은 임의로 치환된 페닐로 임의로 치환된 n-부틸이다. 특정 구현예에서, R은 비치환된 페닐로 치환된 n-부틸이다. 특정 구현예에서, R은 임의로 치환된 펜틸이다. 특정 구현예에서, R은 임의로 치환된 n-펜틸이다. 특정 구현예에서, R은 임의로 치환된 아릴로 임의로 치환된 n-펜틸이다. 특정 구현예에서, R은 임의로 치환된 페닐로 임의로 치환된 n-펜틸이다. 특정 구현예에서, R은 비치환된 페닐로 치환된 n-펜틸이다. 특정 구현예에서, R은 임의로 치환된 헥실이다. 특정 구현예에서, R은 임의로 치환된 n-헥실이다. 특정 구현예에서, R은 임의로 치환된 n-헵틸이다. 특정 구현예에서, R은 임의로 치환된 n-옥틸이다. 특정 구현예에서, R은 아릴(예를 들어, 페닐)로 임의로 치환된 알킬이다. 특정 구현예에서, R은 임의로 치환된 아실(예를 들어, -C(=O)Me)이다.

일부 구현예에서, AAE에 대한 기질은 숙주 세포 내 지방산 대사에 의해 생성된다. 일부 구현예에서, AAE에 대한 기질은 외인성으로 제공된다.

일부 구현예에서, AAE는 헥산산과 조효소 A(CoA)로부터 헥사노일-조효소 A(헥사노일-CoA)의 형성을 촉매할 수 있다. 일부 구현예에서, AAE는 부탄산과 조효소 A(CoA)로부터 부타노일-조효소 A(부타노일-CoA)의 형성을 촉매할 수 있다.

당업자가 이해할 수 있는 바와 같이, AAE는 자연 발생 공급원 및 합성 공급원(예를 들어, 비-자연 발생 AAE)을 포함하는 임의의 공급원으로부터 얻어질 수 있다. 일부 구현예에서, AAE는 대마초 효소이다. AAE의 비제한적인 예는 미국 특허 번호 9,546,362호에 개시된 바와 같은 씨. 사티바 헥사노일-CoA 신타제 1(CsHCS1) 및 씨. 사티바 헥사노일-CoA 신타제 2(CsHCS2)를 포함하며, 상기 특허는 그 전체가 본 출원에 참조로 포함된다.

CsHCS1은 하기 서열을 갖는다:

CsHCS2는 하기 서열을 갖는다:

폴리케타이드 신타제(PKS)

본 출원에 기재된 숙주 세포는 PKS를 포함할 수 있다. 본 출원에 사용된 바와 같이, "PKS"는 폴리케타이드를 생성할 수 있는 효소를 지칭한다. 특정 구현예에서, PKS는 화학식 (2)의 화합물을 화학식 (4), (5), 및/또는 (6)의 화합물로 전환시킨다. 특정 구현예에서, PKS는 화학식 (2)의 화합물을 화학식 (4)의 화합물로 전환시킨다. 특정 구현예에서, PKS는 화학식 (2)의 화합물을 화학식 (5)의 화합물로 전환시킨다. 특정 구현예에서, PKS는 화학식 (2)의 화합물을 화학식 (4) 및/또는 (5)의 화합물로 전환시킨다. 특정 구현예에서, PKS는 화학식 (2)의 화합물을 화학식 (5) 및/또는 (6)의 화합물로 전환시킨다.

일부 구현예에서, PKS는 테트라케타이드 신타제(TKS)이다. 특정 구현예에서, PKS는 올리베톨 신타제(OLS)이다. 본 출원에 사용된 바와 같이, "OLS"는 도 1에 나타낸 바와 같이 화학식 (2a)의 기질을 사용하여 화학식 (4a), (5a) 또는 (6a)의 화합물을 형성할 수 있는 효소를 지칭한다.

특정 구현예에서, PKS는 디바린산 신타제(DVS)이다.

특정 구현예에서, 폴리케타이드 신타제는 헥사노일-CoA 또는 임의의 아실-CoA 또는 하기 화학식 (2)의 생성물:

및 3개의 말로닐-CoA를 기질로서 사용하여 기질에 따라 3,5,7-트리옥소도데카노일-CoA 또는 기타 3,5,7-트리옥소-아실-CoA 유도체를 형성할 수 있거나; 하기 화학식 (4)의 화합물을 형성할 수 있다:

상기 식에서, R은 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴이다. R은 본 출원에 정의된 바와 같다. 일부 구현예에서, R은 C₂-C₆ 임의로 치환된 알킬이다. 일부 구현예에서, R은 프로필 또는 펜틸이다. 일부 구현예에서, R은 펜틸이다. 일부 구현예에서, R은 프로필이다. PKS는 또한 이소발레릴-CoA, 옥타노일-CoA, 헥사노일-CoA, 및 부티릴-CoA에 결합할 수 있다. 일부 구현예에서, PKS는 3,5,7-트리옥소알카노일-CoA(예를 들어, 3,5,7-트리옥소도데카노일-CoA)의 형성을 촉매할 수 있다. 일부 구현예에서, OLS는 3,5,7-트리옥소알카노일-CoA(예를 들어, 3,5,7-트리옥소도데카노일-CoA)의 형성을 촉매할 수 있다.

일부 구현예에서, PKS는 화학식 (2)의 기질을 사용하여 하기 화학식 (4)의 화합물을 형성한다:

상기 식에서, R은 비치환된 펜틸이다.

당업자는 OLS와 같은 PKS가 자연 발생 공급원 및 합성 공급원(예를 들어, 비-자연 발생 PKS)을 포함하는 임의의 공급원으로부터 얻어질 수 있음을 인식할 것이다. 일부 구현예에서, PKS는 대마초로부터 유래된다. 일부 구현예에서, PKS는 딕티오스텔리움(Dictyostelium)으로부터 유래된다. PKS 효소의 비제한적인 예는 US 6,265,633; WO 2018/148848 A1; WO 2018/148849 A1; 및 US 2018/155748에서 찾을 수 있으며, 상기 특허들은 그 전체가 본 출원에 참조로 포함된다.

OLS의 비제한적인 예는 씨. 사티바로부터 UniProtKB - B1Q2B6에 의해 제공된다. 씨. 사티바에서, 이 OLS는 헥사노일-CoA 및 말로닐-CoA를 기질로서 사용하여 3,5,7-트리옥소도데카노일-CoA를 형성한다. OLS(예를 들어, UniProtKB - B1Q2B6)는 올리베톨산 사이클라제(OAC)와 조합하여 씨. 사티바에서 올리베톨산(OA)을 형성한다.

UniProtKB - B1Q2B6의 아미노산 서열은 다음과 같다:

본 출원에 기재된 PKS 효소는 사이클라제 활성을 가질 수도 있고 갖지 않을 수도 있다. PKS 효소가 사이클라제 활성을 갖지 않는 일부 구현예에서, 폴리케타이드 사이클라제(PKC) 효소를 코딩하는 하나 이상의 외인성 폴리뉴클레오티드는 또한 헥산산 또는 부티르산의 전환 또는 올리베톨산 또는 디바리놀산 또는 칸나비노이드의 다른 전구체로의 다른 지방산 전환을 가능하게 하기 위해 동일한 숙주 세포에서 공동 발현될 수 있다. 일부 구현예에서, PKS 효소 및 PKC 효소는 별도의 개별 효소로서 발현된다. 일부 구현예에서, 사이클라제 활성이 결핍된 PKS 효소 및 PKC는 이기능성 PKS인 융합 폴리펩티드의 일부로서 연결된다. 일부 구현예에서, 이기능성 PKC는 이기능성 PKS-PKC로 지칭된다. 일부 구현예에서, 이기능성 PKC는 이기능성 테트라케타이드 신타제(TKS-TKC)이다. 본 출원에 사용된 바와 같이, 이기능성 PKS는 하기 화학식 (2)의 화합물:

및 하기 화학식 (3)의 화합물:

로부터 화학식 (6)의 화합물을 생성할 수 있는 효소이다:

.

일부 구현예에서, PKS는 하기 화학식 (5)의 화합물:

과 비교하여 하기 화학식 (6)의 화합물을 더 많이 생성한다:

.

비제한적인 예로서, 하기 화학식 (6)의 화합물:

은 하기 올리베톨산(화학식 (6a))이다:

비제한적인 예로서, 하기 화학식 (5)의 화합물:

은 하기 올리베톨(화학식 (5a))이다:

일부 구현예에서, 본 개시내용의 폴리케타이드 신타제는 하기 화학식 (2)의 화합물:

및 하기 화학식 (3)의 화합물:

을 촉매하여 하기 화학식 (4)의 화합물:

을 생성할 수 있고, 또한 화학식 (4)의 화합물:

을 추가로 촉매하여 하기 화학식 (6)의 화합물:

을 생성할 수 있다.

일부 구현예에서, PKS는 융합 단백질이 아니다. 일부 구현예에서, 하기 화학식 (2)의 화합물:

및 하기 화학식 (3)의 화합물:

을 촉매하여 하기 화학식 (4)의 화합물:

을 형성할 수 있고, 또한 하기 화학식 (4)의 화합물:

로부터 하기 화학식 (6)의 화합물의 화합물:

의 생성물을 추가로 촉매할 수 있는 PKS가 바람직한데, 이는 하기 화학식 (6)의 화합물을 생성하기 위해 추가의 폴리케타이드 사이클라제가 필요하지 않기 때문이다:

일부 구현예에서, 이기능성 PKS인 이러한 효소는 폴리케타이드 사이클라제의 추가와 함께 필요한 수송 고려사항을 제거하며, 이에 의해 PKS의 생성물인 화학식 (4)의 화합물은 기질로 사용하기 위해 PKS로 수송되어 화학식 (6)의 화합물로 전환되어야 한다.

일부 구현예에서, PKS는 하기 화학식 (2a)의 화합물:

및 하기 화학식 (3a):

의 존재 하에 올리베톨산을 생성할 수 있다.

일부 구현예에서, OLS는 하기 화학식 (2a)의 화합물:

및 하기 화학식 (3a):

의 존재 하에 올리베톨산을 생성할 수 있다.

폴리케타이드 사이클라제(PKC)

본 개시내용에 기재된 숙주 세포는 PKC를 포함할 수 있다. 본 출원에 사용된 바와 같이, "PKC"는 폴리케타이드를 고리화할 수 있는 효소를 지칭한다.

특정 구현예에서, 폴리케타이드 사이클라제(PKC)는 옥소 지방 아실-CoA(예를 들어, 화학식 (4)의 화합물:

또는 3,5,7-트리옥소도데카노일-COA, 3,5,7-트리옥소데카노일-COA)의 상응하는 분자내 고리화 생성물(예를 들어, 올리베톨산 및 디바린산을 포함하는 화학식 (6)의 화합물)로의 고리화를 촉매한다. 일부 구현예에서, PKC는 PKS의 존재 하에 발생하는 화합물의 형성을 촉매한다. PKC 기질은 트리옥소알칸올-CoA, 예컨대 3,5,7-트리옥소도데카노일-CoA, 또는 하기 화학식 (4)의 화합물을 포함한다:

.

상기 식에서, R은 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴이다. 특정 구현예에서, PKC는 하기 화학식 (4)의 화합물:

(상기 식에서, R은 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴이다)을 촉매하여; 기질로서 하기 화학식 (6)의 화합물을 형성한다:

.

상기 식에서, R은 수소, 임의로 치환된 아실, 임의로 치환된 알킬, 임의로 치환된 알케닐, 임의로 치환된 알키닐, 임의로 치환된 카보사이클릴, 또는 임의로 치환된 아릴이다. R은 본 출원에서 정의된 바와 같다. 일부 구현예에서, R은 C₂-C₆ 임의로 치환된 알킬이다. 일부 구현예에서, R은 프로필 또는 펜틸이다. 일부 구현예에서, R은 펜틸이다. 일부 구현예에서, R은 프로필이다. 특정 구현예에서, PKC는 올리베톨산 사이클라제(OAC)이다. 특정 구현예에서, PKC는 디바린산 사이클라제(DAC)이다.

당업자는 PKC가 자연 발생 공급원 및 합성 공급원(예를 들어, 비-자연 발생 PKC)을 포함하는 임의의 공급원으로부터 얻어질 수 있음을 인식할 것이다. 일부 구현예에서, PKC는 대마초로부터 유래된다. PKC의 비제한적인 예는 미국 특허 번호 9,611,460; US 10,059,971; 및 미국 특허 번호 2019/0169661에 개시된 것들을 포함하며, 상기 특허들은 그 전체가 본 출원에 참조로 포함된다.

일부 구현예에서, PKC는 OAC이다. 본 출원에 사용된 바와 같이, "OAC"는 올리베톨산(OA)의 형성을 촉매할 수 있는 효소를 지칭한다. 일부 구현예에서, OAC는 하기 화학식 (4a)의 기질(3,5,7-트리옥소도데카노일-CoA):

을 사용하여 하기 화학식 (6a)의 화합물(올리베톨산):

을 형성할 수 있는 효소이다.

씨. 사티바로부터의 올리베톨산 사이클라제(CsOAC)는 올리베톨 신타제의 테트라케타이드 생성물(도 4 구조 4a)의 비-데카복실화 고리화를 알돌 축합을 통해 수행하여 올리베톨산(도 4 구조 6a)을 형성하는 101 아미노산 효소이다. CsOAC는 전사체 마이닝을 통해 Gagne 등(PNAS 2012)에 의해 확인되고 특성화되었으며 그 고리화 기능은 CsOAC가 씨. 사티바에서 올리베톨산의 형성에 필요하다는 것을 입증하기 위해 시험관내에서 재점검하였다. 효소의 결정 구조는 Yang 등(FEBS J. 2016 Mar;283(6):1088-106)에 의해 발표되었는데, 이것은 효소가 동종이량체이고 단백질 폴딩의 α+β 배럴(DABB) 슈퍼패밀리에 속한다는 것을 밝혀냈다. CsOAC는 유일하게 알려진 식물 폴리케타이드 사이클라제이다. 폴리케타이드 신타제와 고리화 기능 둘 모두를 수행하는 다수의 진균 유형 III 폴리케타이드 신타제가 확인되었다(Funa et al., J Biol Chem. 2007 May 11;282(19):14476-81); 그러나, 식물에서 그러한 이중 기능 효소는 아직 발견되지 않았다.

씨. 사티바에서 OAC의 아미노산 서열의 비제한적인 예는 3,5,7-트리옥소도데카노일-CoA로부터 올리베톨산(OA)의 형성을 촉매하는 UniProtKB - I6WU39(서열 번호 1)에 의해 제공된다.

UniProtKB - I6WU39의 서열(서열번호 1)은 다음과 같다:

씨. 사티바 OAC를 코딩하는 핵산 서열의 비제한적인 예는 다음과 같다:

프레닐트랜스퍼라제(PT)

본 출원에 기재된 숙주 세포는 프레닐트랜스퍼라제(PT)를 포함할 수 있다. 본 출원에 사용된 바와 같이, "PT"는 프레닐 기를 수용체 분자 기질로 전달할 수 있는 효소를 지칭한다. 프레닐트랜스퍼라제의 비제한적인 예는 PCT 공개 번호 WO2018200888(예를 들어, CsPT4), 미국 특허 번호 8,884,100(예를 들어, CsPT1); 캐나다 특허 번호 CA2718469; 문헌(Valliere et al., Nat Commun. 2019 Feb 4;10(1):565; 및 Luo et al., Nature 2019 Mar;567(7746):123-126)에 기재되어 있으며, 이들은 그 전체가 참조로 포함된다. 일부 구현예에서, PT는 칸나비게롤산(CBGA), 칸나비게로바린산(CBGVA), 또는 기타 칸나비노이드 또는 칸나비노이드 유사 물질을 생성할 수 있다. 일부 구현예에서, PT는 칸나비게롤산 신타제(CBGAS)이다. 일부 구현예에서, PT는 칸나비게로바린산 신타제(CBGVAS)이다.

일부 구현예에서, PT는 NphB 프레닐트랜스퍼라제이다. 예를 들어, 미국 특허 번호 7544498; 및 문헌(Kumano et al., Bioorg Med Chem. 2008 Sep 1; 16(17): 8117-8126)을 참조하고, 이들은 그 전체가 본 출원에 참조로 포함된다. 일부 구현예에서, PT는 스트렙토마이세스 종(Streptomyces sp.)으로부터의 NphB에 상응한다(예를 들어, UniprotKB 수탁 번호 Q4R2T2 참조; 또한 미국 특허 7,361,483의 서열번호 2 참조). UniprotKB 수탁 번호 Q4R2T2에 상응하는 단백질 서열은 서열번호 8에 의해 제공된다:

NphB를 코딩하는 핵산 서열의 비제한적인 예는 다음과 같다:

다른 구현예에서, PT는 미국 특허 번호 8,884,100에서 서열번호 2로서 개시되어 있는 CsPT1에 상응한다(씨. 사티바; 본 출원의 서열 번호 10에 상응함):

일부 구현예에서, PT는 PCT 공개 번호 WO2019071000에서 서열번호 1로 개시되어 있는 CsPT4에 상응하며 이는 본 출원에서 서열번호 11에 상응한다:

일부 구현예에서, PT는 서열번호 12로 제공되는 절단된 CsPT4에 상응한다:

에스. 세레비지아에에서 이원체(paralog) 씨. 사티바 CBGAS 효소의 기능적 발현 및 주요 칸나비노이드 CBGA의 생성이 보고되었다(미국 특허 공개 2012/0144523, 및 Luo et al. Nature, 2019 Mar;567(7746):123-126). Luo 등은 천연 신호 펩티드가 제거된 씨. 사티바 CBGAS, CsPT4의 절단된 버전을 발현함으로써 에스. 세레비지아에에서 CBGA의 생성을 보고하였다. 특정 이론에 국한되지 않고, 씨. 사티바 CBGAS 효소의 내재-막(integral-membrane) 성질은 이종 숙주에서 씨. 사티바 CBGAS 효소의 기능적 발현을 어렵게 만들 수 있다. 막관통 도메인(들) 또는 신호 서열의 제거 또는 막과 연관되지 않고 내재 막 단백질이 아닌 프레닐트랜스퍼라제의 사용은 예를 들어, 세포 세포질 및/또는 국소화를 부여하는 펩티드를 사용하여 표적화될 수 있는 세포소기관에서 효소와 이용 가능한 기질 사이의 증가된 상호작용을 촉진할 수 있다.

일부 구현예에서, PT는 가용성 PT이다. 일부 구현예에서, PT는 세포질 PT이다. 일부 구현예에서, PT는 분비된 단백질이다. 일부 구현예에서, PT는 막-연관된 단백질이 아니다. 일부 구현예에서, PT는 내재 막 단백질이 아니다. 일부 구현예에서, PT는 막관통 도메인 또는 예측된 막관통을 포함하지 않는다. 일부 구현예에서, PT는 주로 세포질에서 검출될 수 있다(예를 들어, 세포막과 관련하여 검출된 것보다 더 큰 정도로 세포질에서 검출됨). 일부 구현예에서, PT는 하나 이상의 막관통 도메인이 제거 및/또는 돌연변이되어(예를 들어, 절단, 결실, 치환, 삽입, 및/또는 부가에 의해) PT가 숙주 세포의 세포질, 또는 숙주 세포 내의 세포질 세포소기관, 또는 박테리아 숙주의 경우 원형질막공간에 위치하거나 위치할 것으로 예상되는 단백질이다. 일부 구현예에서, PT는 하나 이상의 막관통 도메인이 제거되거나 돌연변이되어(예를 들어, 절단, 결실, 치환, 삽입 및/또는 부가에 의해) 막 국소화와 비교하여 PT가 숙주 세포의 세포질, 세포소기관 또는 원형질막공간으로의 국소화를 증가시킨다.

용어 "막관통 도메인"의 범위 내에는 경험적으로 결정된 막관통 도메인 이외에 예측되거나 추정되는 막관통 도메인이 있다. 일반적으로, 막관통 도메인은 세포막으로의 통합을 촉진하는 소수성 영역을 특징으로 한다. 단백질이 막 단백질인지 또는 막-연관된 단백질인지를 예측하는 방법은 당업계에 공지되어 있으며, 예를 들어, 아미노산 서열 분석, 친수도 플롯(hydropathy plot) 및/또는 단백질 국소화 검정을 포함할 수 있다.

일부 구현예에서, PT는 신호 서열이 제거 및/또는 돌연변이되어 PT가 세포 분비 경로로 향하지 않는 단백질이다. 일부 구현예에서, PT는 신호 서열이 제거 및/또는 돌연변이되어 PT가 세포질로 국한되거나 세포질로 국소화가 증가된 단백질이다(예를 들어, 분비 경로와 비교하여).

일부 구현예에서, PT는 분비된 단백질이다. 일부 구현예에서, PT는 신호 서열을 포함한다.

일부 구현예에서, PT는 융합 단백질이다. 예를 들어, PT는 숙주 세포의 대사 경로에서 하나 이상의 유전자에 융합될 수 있다. 특정 구현예에서, PT는 숙주 세포의 대사 경로에서 하나 이상의 유전자의 돌연변이 형태에 융합될 수 있다.

일부 구현예에서, 본 출원에 기재된 PT는 하기에 나타낸 화학식 (6)의 화합물에서 하나 이상의 프레닐 기를 위치 1, 2, 3, 4, 또는 5 중 어느 하나로 전달한다:

일부 구현예에서, PT는 하기에 나타낸 화학식 (6)의 화합물에서 프레닐 기를 위치 1, 2, 3, 4, 또는 5 중 어느 하나로 전달하여:

화학식 (8w), 화학식 (8x), 화학식 (8'), 화학식 (8y), 화학식 (8z) 중 어느 하나의 화합물 또는 이의 약학적으로 허용되는 염, 용매화물, 수화물, 다형체, 공결정, 호변이성질체, 입체이성질체, 동위원소적으로 표지된 유도체, 또는 프로드럭을 형성한다:

상기 식에서, a는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10이다.

변이체

본 개시내용의 양태는 본 출원에 기재된 임의의 폴리펩티드(예를 들어, AAE, PKS, PKC, PT, 또는 TS)를 코딩하는 핵산에 관한 것이다. 일부 구현예에서, 본 개시내용에 포함되는 핵산은 AAE, PKS, PKC, PT, 또는 TS를 코딩하는 핵산에 높은 또는 중간 엄격성(stringency) 조건 하에 혼성화하고 생물학적으로 활성인 핵산이다. 예를 들어, 65℃에서 0.2 내지 1 x SSC의 높은 엄격성 조건에 이어 65℃에서 0.2 x SSC로 세척할 수 있다. 일부 구현예에서, 본 개시내용에 포함되는 핵산은 낮은 엄격성 조건 하에 AAE, PKS, PKC, PT, 또는 TS를 코딩하는 핵산에 혼성화하고 생물학적으로 활성인 핵산이다. 예를 들어, 실온에서 6 x SSC의 낮은 엄격성 조건에 이어 실온에서 2 x SSC로 세척할 수 있다. 다른 혼성화 조건은 40 또는 50℃에서 3 x SSC에 이어 20, 30, 40, 50, 60 또는 65℃에서 1 또는 2 x SSC에서 세척을 포함한다.

혼성화는 포름알데히드, 예를 들어, 10%, 20%, 30% 40% 또는 50%의 존재 하에 수행될 수 있으며, 이는 혼성화의 엄격성을 추가로 증가시킨다. 핵산 혼성화의 이론 및 실제는, 예를 들어, 문헌(S. Agrawal (ed.) Methods in Molecular Biology, volume 20; and Tijssen (1993) Laboratory Techniques in biochemistry and molecular biology-hybridization with nucleic acid probes, e.g., part I chapter 2 "Overview of principles of hybridization and the strategy of nucleic acid probe assays," Elsevier, New York provide a basic guide to nucleic acid hybridization)에 기재되어 있다.

본 출원에 기재된 효소 서열의 변이체(예를 들어, 핵산 또는 아미노산 서열을 포함하는 AAE, PKS, PKC, PT, 또는 TS)도 본 개시내용에 포함된다. 변이체는 참조 서열과, 그 사이의 모든 값을 포함하여 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 71%, 적어도 72%, 적어도 73%, 적어도 74%, 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 100% 서열 동일성을 공유할 수 있다.

달리 언급되지 않는 한, 당업계에 공지된 바와 같이, 용어 "동일성 백분율"과 본 개시내용에서 상호교환적으로 사용되는 용어 "서열 동일성"은 서열 비교(정렬)에 의해 결정된 바와 같은 2개의 폴리펩티드 또는 폴리뉴클레오티드의 서열 사이의 관계를 지칭한다. 일부 구현예에서, 서열 동일성은 서열(예를 들어, AAE, PKS, PKC, PT, 또는 TS 서열)의 전장에 걸쳐 결정된다. 일부 구현예에서, 서열 동일성은 서열(예를 들어, AAE, PKS, PKC, PT, 또는 TS 서열)의 영역(예를 들어, 아미노산 또는 핵산의 스트레치, 예를 들어, 활성 부위를 포괄하는 서열)에 걸쳐 결정된다. 예를 들어, 일부 구현예에서, 서열 동일성은 참조 서열 길이의 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 또는 100% 초과에 상응하는 영역에 걸쳐 결정된다.

동일성은 특정 수학적 모델, 알고리즘 또는 컴퓨터 프로그램에 의해 해결된 (만약 있다면) 갭 정렬에 의한 둘 이상의 서열 중 더 작은 것 사이의 동일한 일치 백분율을 측정한다.

관련된 폴리펩티드 또는 핵산 서열의 동일성은 당업자에게 공지된 임의 방법으로 쉽게 계산될 수 있다. 2개 서열(예를 들어, 핵산 또는 아미노산 서열)의 동일성 백분율은, 예를 들어, 문헌(Karlin and Altschul Proc. Natl. Acad. Sci. USA 90:5873-77, 1993)에서와 같이 변형된, 문헌(Karlin and Altschul Proc. Natl. Acad. Sci. USA 87:2264-68, 1990)의 알고리즘을 사용하여 결정될 수 있다. 이러한 알고리즘은 문헌(Altschul et al., J. Mol. Biol. 215:403-10, 1990)의 NBLAST^® 및 XBLAST^® 프로그램(버전 2.0)에 통합된다. BLAST^® 단백질 검색은 본 출원에 기재된 단백질에 상동성인 아미노산 서열을 수득하기 위해서, 예를 들어, XBLAST 프로그램, 점수 = 50, 단어길이 = 3을 사용하여 수행될 수 있다. 2개 서열 간에 갭이 존재하는 경우, Gapped BLAST®는 예를 들어, 문헌(Altschul et al., Nucleic Acids Res. 25(17):3389-3402, 1997)에 기재된 바와 같이 이용될 수 있다. BLAST^® 및 Gapped BLAST^® 프로그램을 이용하는 경우, 각각의 프로그램(예를 들어, XBLAST^® 및 NBLAST^®)의 디폴트 매개변수가 사용될 수 있거나, 또는 매개변수는 당업자가 이해하게 되는 바와 같이 적절하게 조정될 수 있다.

예를 들어, 사용할 수 있는 또 다른 국소 정렬 기술은 스미스-워터만 (Smith-Waterman) 알고리즘(Smith, T.F. & Waterman, M.S. (1981) "Identification of common molecular subsequences." J. Mol. Biol. 147:195-197)을 기반으로 한다. 예를 들어, 사용할 수 있는 일반적인 전역 정렬 기술은 동적 프로그래밍을 기반으로 하는 니들만-분치(Needleman-Wunsch) 알고리즘(Needleman, S.B. & Wunsch, C.D. (1970) "A general method applicable to the search for similarities in the amino acid sequences of two proteins." J. Mol. Biol. 48:443-453)이다.

보다 최근에, 니들만-분치 알고리즘을 포함하는 다른 최적 전역 정렬 방법보다 더 빠른 핵산 및 아미노산 서열의 전역 정렬을 알려진 대로 생성하는 신속 최적 전역 서열 정렬 알고리즘(Fast Optimal Global Sequence Alignment Algorithm: FOGSAA)이 개발되었다. 일부 구현예에서, 2개 폴리펩티드의 동일성은 2개의 아미노산 서열을 정렬하고 동일한 아미노산의 수를 계산하고 아미노산 서열 중 하나의 길이로 나눔으로써 결정된다. 일부 구현예에서, 2개의 핵산의 동일성은 2개의 뉴클레오티드 서열을 정렬하고 동일한 뉴클레오티드의 수를 계산하고 핵산 중 하나의 길이로 나눔으로써 결정된다.

다중 서열 정렬을 위해, 클러스털 오메가(Clustal Omega)를 포함한 컴퓨터 프로그램(Sievers et al., Mol Syst Biol. 2011 Oct 11;7:539)이 사용될 수 있다.

바람직한 구현예에서, 핵산 또는 아미노산 서열을 포함하는 서열은 서열 동일성이 문헌(Karlin and Altschul Proc. Natl. Acad. Sci. USA 90:5873-77, 1993)에서와 같이 변형된, 문헌(Karlin and Altschul Proc. Natl. Acad. Sci. USA 87:2264-68, 1990)의 알고리즘(예를 들어, 각각의 프로그램의 디폴트 매개변수를 사용하는, BLAST^®, NBLAST®, XBLAST® 또는 Gapped BLAST^® 프로그램)을 사용하여 결정될 때 본 출원에 개시되고/되거나 청구범위에 인용된 서열과 같은 참조 서열과 명시된 동일성 백분율을 갖는 것으로 밝혀졌다.

일부 구현예에서, 핵산 또는 아미노산 서열을 포함하는 서열은 서열 동일성이 디폴트 매개변수를 사용하여 스미스-워터만 알고리즘(Smith, T.F. & Waterman, M.S. (1981) "Identification of common molecular subsequences." J. Mol. Biol. 147:195-197) 또는 니들만-분치 알고리즘(Needleman, S.B. & Wunsch, C.D. (1970) "A general method applicable to the search for similarities in the amino acids of two proteins." J. Mol. Biol. 48:443-453)을 사용하여 결정될 때 본 출원에 개시되고/되거나 청구범위에 인용된 서열과 같은 참조 서열과 명시된 동일성 백분율을 갖는 것으로 밝혀졌다.

일부 구현예에서, 핵산 또는 아미노산 서열을 포함하는 서열은 서열 동일성이 디폴트 매개변수를 사용한 신속 최적 전역 서열 정렬 알고리즘(FOGSAA)을 사용하여 결정될 때 본 출원에 개시되고/되거나 청구범위에 인용된 서열과 같은 참조 서열과 명시된 동일성 백분율을 갖는 것으로 밝혀졌다.

일부 구현예에서, 핵산 또는 아미노산 서열을 포함하는 서열은 서열 동일성이 디폴트 매개변수를 사용한 클러스털 오메가(Sievers et al., Mol Syst Biol. 2011 Oct 11;7:539)를 사용해 결정될 때 본 출원에 개시되고/되거나 청구범위에 인용된 서열과 같은 참조 서열과 명시된 동일성 백분율을 갖는 것으로 밝혀졌다.

본 출원에 사용된 바와 같이, 서열 "X"의 잔기(예컨대 핵산 잔기 또는 아미노산 잔기)는 서열 X 및 Y가 당업계에 공지된 아미노산 서열 정렬 도구를 사용해 정렬될 때 서열 "X"의 잔기가 서열 "Y"의 "Z"의 대응 위치에 있는 경우 상이한 서열 "Y"의 위치 또는 잔기(예컨대 핵산 잔기 또는 아미노산 잔기) "Z"에 상응하는 것으로 지칭된다.

본 출원에 사용된 바와 같이, 변이체 서열은 상동성 서열일 수 있다. 본 출원에 사용된 바와 같이, 상동성 서열은 특정 동일성 백분율(예를 들어, 그 사이의 모든 값을 포함하는 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 71%, 적어도 72%, 적어도 73%, 적어도 74%, 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성)를 공유하는 서열(예를 들어, 핵산 또는 아미노산 서열)이다. 상동성 서열은 파랄로그 또는 오솔로그 서열을 포함하지만, 이에 제한되지 않는다. 파랄로그 서열은 종의 게놈 내 유전자의 중복으로부터 발생되는 반면, 오솔로그 서열은 종분화 사건 이후에 분기된다.

일부 구현예에서, 폴리펩티드 변이체(예를 들어, AAE, PKS, PKC, PT, 또는 TS 효소 변이체)는 참조 폴리펩티드(예를 들어, 참조 AAE, PKS, PKC, PT, 또는 TS 효소)와 2차 구조(예를 들어, 알파 나선, 베타 시트)를 공유하는 도메인을 포함한다. 일부 구현예에서, 폴리펩티드 변이체(예를 들어, AAE, PKS, PKC, PT, 또는 TS 효소 변이체)는 참조 폴리펩티드(예를 들어, 참조 AAE, PKS, PKC, PT, 또는 TS 효소)와 3차 구조를 공유한다. 비제한적인 예로서, 폴리펩티드 변이체(예를 들어, AAE, PKS, PKC, PT, 또는 TS 효소)는 참조 폴리펩티드와 비교하여 낮은 1차 서열 동일성(예를 들어, 80% 미만, 75% 미만, 70% 미만, 65% 미만, 60% 미만, 55% 미만, 50% 미만, 45% 미만, 40% 미만, 35% 미만, 30% 미만, 25% 미만, 20% 미만, 15% 미만, 10% 미만, 또는 5% 미만의 서열 동일성)을 갖지만 하나 이상의 2차 구조(예를 들어, 루프, 알파 나선, 또는 베타 시트를 포함하지만 이에 제한되지 않음)를 공유하거나, 참조 폴리펩티드와 동일한 3차 구조를 가질 수 있다. 예를 들어, 루프는 베타 시트와 알파 나선 사이, 2개의 알파 나선 사이, 또는 2개의 베타 시트 사이에 위치될 수 있다. 상동성 모델링은 2개 이상의 3차 구조를 비교하는 데 사용될 수 있다.

본 출원에 개시된 재조합 AAE, PKS, PKC, PT, 또는 TS 효소의 기능적 변이체는 본 개시내용에 포함된다. 예를 들어, 기능적 변이체는 하나 이상의 동일한 기질에 결합하거나 하나 이상의 동일한 생성물을 생성할 수 있다. 기능적 변이체는 당업계에 공지된 임의의 방법을 사용하여 확인될 수 있다. 예를 들어, 상기 기재된 문헌(Karlin and Altschul Proc. Natl. Acad. Sci. USA 87:2264-68, 1990)의 알고리즘이 공지된 기능을 갖는 상동 단백질을 확인하는 데 사용될 수 있다.

추정의 기능적 변이체는 또한 기능적으로 주석이 달린 도메인을 갖는 폴리펩티드를 검색함으로써 확인될 수 있다. Pfam을 포함하는 데이터베이스(Sonnhammer et al., Proteins. 1997 Jul;28(3):405-20)를 사용하여 특정 도메인을 갖는 폴리펩티드를 확인할 수 있다.

상동성 모델링은 또한 기능에 영향을 미치지 않으면서 돌연변이(예를 들어, 치환, 결실 및/또는 삽입)될 수 있는 아미노산 잔기를 확인하는 데 사용될 수 있다. 이러한 방법의 비제한적인 예는 위치-특이적 스코어링 매트릭스(PSSM) 및 에너지 최소화 프로토콜의 사용을 포함할 수 있다.

위치-특이적 스코어링 매트릭스(PSSM)는 위치 가중치 매트릭스를 사용하여 컨센서스 서열(예컨대, 모티프)을 확인한다. PSSM은 핵산 또는 아미노산 서열에 대해 수행될 수 있다. 서열이 정렬되며 이 방법은 특정 위치에서 특정 잔기(예컨대, 아미노산 또는 뉴클레오티드)의 관찰된 빈도 및 분석된 서열 수를 고려한다. 예를 들어, 문헌(Stormo et al., Nucleic Acids Res. 1982 May 11;10(9):2997-3011)을 참조한다. 주어진 위치에서 특정 잔기를 관찰할 가능성이 계산될 수 있다. 특정 이론에 국한되지 않고, 높은 가변성을 갖는 서열의 위치는 기능적 상동체를 생성하기 위해 돌연변이(예를 들어, 치환, 결실 및/또는 삽입; 예를 들어, PSSM 점수 ≥0) 될 수 있다.

PSSM은 야생형 및 단일-점 돌연변이체 간의 차이를 결정하는 로제타(Rosetta) 에너지 함수의 계산과 쌍을 이룰 수 있다. 로제타 에너지 함수는 이 차이를 (△△G _calc )로 계산한다. 로제타 함수를 사용하여, 돌연변이된 잔기와 주변 원자 간의 결합 상호작용을 사용하여 돌연변이가 단백질 안정성을 증가 또는 감소시키는지 여부를 결정한다. 예를 들어, PSSM 점수(예를 들어, PSSM 점수≥0)에 의해 유리하다고 지정된 돌연변이는 이어서 단백질 안정성에 대한 돌연변이의 잠재적 영향을 결정하기 위해서 로제타 에너지 함수를 사용해 분석될 수 있다. 특정 이론에 국한되지 않고, 잠재적으로 안정한 아미노산 돌연변이가 단백질 조작(예를 들어, 기능적 상동체의 생성)에 바람직하다. 일부 구현예에서, 잠재적으로 안정한 아미노산 돌연변이는 -0.1 미만 (예를 들어, -0.2 미만, -0.3 미만, -0.35 미만, -0.4 미만, -0.45 미만, -0.5 미만, -0.55 미만, -0.6 미만, -0.65 미만, -0.7 미만, -0.75 미만, -0.8 미만, -0.85 미만, -0.9 미만, -0.95 미만, 또는 -1.0 미만)의 로제타 에너지 단위(R.e.u.)의 △△G _calc 값을 갖는다. 예를 들어, 문헌(Goldenzweig et al., Mol Cell. 2016 Jul 21;63(2):337-346. Doi: 10.1016/j.molcel.2016.06.012)을 참조한다.

일부 구현예에서, 코딩 서열은 참조 코딩 서열에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 또는 100 초과 위치에 아미노산 돌연변이를 포함한다. 일부 구현예에서, 코딩 서열은 참조 코딩 서열에 비해 코딩 서열의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 이상의 코돈 중 아미노산 돌연변이를 포함한다. 당업자에 의해 이해되는 바와 같이, 코돈 내의 치환, 삽입 또는 결실은 유전자 코드의 축퇴성에 인해 코돈에 의해 코딩되는 아미노산을 변화시키거나 변화시키지 않을 수 있다. 일부 구현예에서, 코딩 서열의 하나 이상의 치환, 삽입, 또는 결실은 참조 폴리펩티드의 아미노산 서열에 비해 코딩 서열의 아미노산 서열을 변경시키지 않는다.

일부 구현예에서, 서열의 하나 이상의 돌연변이는 참조 폴리펩티드의 아미노산 서열에 비해 상응하는 폴리펩티드의 아미노산 서열을 변경시킨다. 일부 구현예에서, 하나 이상의 돌연변이는 참조 폴리펩티드의 아미노산 서열에 비해 폴리펩티드의 아미노산 서열을 변경시키고 참조 폴리펩티드에 비해 폴리펩티드의 활성을 변경(향상 또는 감소)시킨다.

본 출원에 기재된 임의의 재조합 폴리펩티드(예를 들어, AAE, PKS, PKC, PT, 또는 TS)의 활성(예를 들어, 비활성)은 통상적인 방법을 이용하여 측정될 수 있다. 비제한적인 예로서, 재조합 폴리펩티드의 활성은 기질 특이성, 생성된 생성물(들), 생성된 생성물(들)의 농도, 또는 이들의 임의의 조합을 측정함으로써 결정될 수 있다. 본 출원에서 사용되는 바와 같이, 재조합 폴리펩티드의 "비활성"은 단위 시간당 재조합 폴리펩티드의 주어진 양(예를 들어, 농도)에 대해 생성된 특정 생성물의 양(예를 들어, 농도)을 지칭한다.

당업자는 또한 코딩 서열의 돌연변이가 상기 폴리펩티드의 기능적으로 동등한 변이체, 예를 들어, 폴리펩티드의 활성을 보유하는 변이체를 제공하기 위해 보존적 아미노산 치환을 초래할 수 있음을 인식할 것이다. 본 출원에 사용된 바와 같이, "보존적 아미노산 치환"은 아미노산 치환이 이루어지는 단백질의 상대적 전하 또는 크기 특징 또는 기능적 활성을 변경하지 않는 아미노산 치환을 지칭한다.

일부 경우에, 아미노산은 R 기에 의해 특징지어진다(예를 들어, 표 4 참조). 예를 들어, 아미노산은 비극성 지방족 R 기, 양으로 하전된 R 기, 음으로 하전된 R 기, 비극성 방향족 R 기, 또는 극성의 비하전된 R 기를 포함할 수 있다. 비극성 지방족 R 기를 포함하는 아미노산의 비제한적인 예는 알라닌, 글리신, 발린, 류신, 메티오닌, 및 이소류신을 포함한다. 양으로 하전된 R 기를 포함하는 아미노산의 비제한적인 예는 라이신, 아르기닌, 및 히스티딘을 포함한다. 음으로 하전된 R 기를 포함하는 아미노산의 비제한적인 예는 아스파르테이트 및 글루타메이트를 포함한다. 비극성 방향족 R 기를 포함하는 아미노산의 비제한적인 예는 페닐알라닌, 티로신, 및 트립토판을 포함한다. 극성의 비하전된 R 기를 포함하는 아미노산의 비제한적인 예는 세린, 트레오닌, 시스테인, 프롤린, 아스파라긴, 및 글루타민을 포함한다.

폴리펩티드의 기능적으로 동등한 변이체의 비제한적인 예는 본 출원에 개시된 단백질의 아미노산 서열에서 보존적 아미노산 치환을 포함할 수 있다. 본 출원에서 사용된 바와 같이, "보존적 치환"은 "보존적 아미노산 치환"과 상호교환적으로 사용되며, 표 4에 제공된 아미노산 치환 중 어느 하나를 지칭한다.

일부 구현예에서, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 20개 초과의 잔기가 변이체 폴리펩티드를 제조할 때 변화될 수 있다. 일부 구현예에서, 아미노산은 보존적 아미노산 치환으로 대체된다.

표 4. 보존적 아미노산 치환

원하는 특성 및/또는 활성을 갖는 재조합 폴리펩티드(예를 들어, AAE, PKS, PKC, PT, 또는 TS) 변이체를 생성하기 위한 폴리펩티드의 아미노산 서열에서의 아미노산 치환은 폴리펩티드(예를 들어, AAE, PKS, PKC, PT, 또는 TS)의 코딩 서열의 변경에 의해 이루어질 수 있다. 마찬가지로, 폴리펩티드의 기능적으로 동등한 변이체를 생성하기 위한 폴리펩티드의 아미노산 서열에서의 보존적 아미노산 치환은 전형적으로 재조합 폴리펩티드(예를 들어, AAE, PKS, PKC, PT, 또는 TS)의 코딩 서열의 변경에 의해 이루어진다.

돌연변이(예를 들어, 치환, 삽입, 부가, 또는 결실)는 당업자에게 공지된 다양한 방법에 의해 핵산 서열에서 이루어질 수 있다. 예를 들어, 돌연변이(예를 들어, 치환, 삽입, 부가, 또는 결실)는 PCR 유도된 돌연변이, 쿤켈(Kunkel)의 방법(Kunkel, Proc. Nat. Acad. Sci. U.S.A. 82: 488-492, 1985)에 따른 부위 지정된 돌연변이유발, 폴리펩티드를 코딩하는 유전자의 화학적 합성, CRISPR, 또는 태그(예를 들어, HIS 태그 또는 GFP 태그)의 삽입과 같은 삽입에 의해 이루어질 수 있다. 돌연변이는, 예를 들어, 당업계에 공지된 임의의 방법에 의해 생성된 치환, 삽입, 부가, 결실, 및 전위를 포함할 수 있다. 돌연변이를 생성하는 방법은 문헌(Molecular Cloning: A Laboratory Manual, J. Sambrook, et al., eds., Fourth Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, 2012, or Current Protocols in Molecular Biology, F.M. Ausubel, et al., eds., John Wiley & Sons, Inc., New York, 2010)과 같은 참조문헌에서 찾을 수 있다.

일부 구현예에서, 변이체를 생성하는 방법은 원형 순열을 포함한다(Yu and Lutz, Trends Biotechnol. 2011 Jan;29(1):18-25). 원형 순열에서, 폴리펩티드의 선형 1차 서열은 (예를 들어, 서열의 N-말단 및 C-말단 끝을 연결함으로써) 원형화될 수 있고, 폴리펩티드는 상이한 위치에서 절단("파단")될 수 있다. 따라서, 새로운 폴리펩티드의 선형 1차 서열은 선형 서열 정렬 방법(예를 들어, 클러스털 오메가 또는 BLAST)에 의해 결정 시 낮은 서열 동일성(예를 들어, 그 사이의 모든 값을 포함하여 80% 미만, 75% 미만, 70% 미만, 65% 미만, 60% 미만, 55% 미만, 50% 미만, 45% 미만, 40% 미만, 35% 미만, 30% 미만, 25% 미만, 20% 미만, 15% 미만, 10% 미만, 또는 5% 미만)을 가질 수 있다. 그러나, 2개의 단백질의 위상 분석은 2개의 폴리펩티드의 3차 구조가 유사하거나 유사하지 않다는 것을 밝힐 수 있다. 특정 이론에 국한되지 않고, 참조 폴리펩티드의 원형 순열을 통해 생성되고 참조 폴리펩티드와 유사한 3차 구조를 갖는 변이체 폴리펩티드는 유사한 기능적 특징(예를 들어, 효소 활성, 효소 동역학, 기질 특이성 또는 생성물 특이성)을 공유할 수 있다. 일부 경우에, 원형 순열은 2차 구조, 3차 구조 또는 4차 구조를 변경하고 상이한 기능적 특징(예를 들어, 증가 또는 감소된 효소 활성, 상이한 기질 특이성, 또는 상이한 생성물 특이성)을 갖는 효소를 생성할 수 있다. 예를 들어, 문헌(Yu and Lutz, Trends Biotechnol. 2011 Jan;29(1):18-25)을 참조한다.

원형 순열을 거친 단백질에서 단백질의 선형 아미노산 서열은 원형 순열을 거치지 않은 참조 단백질과 상이할 수 있음을 인식해야 한다. 그러나, 당업자는, 예를 들어, 서열을 정렬하고 보존된 모티프를 검출함으로써 및/또는 단백질의 구조 또는 예측된 구조를, 예를 들어, 상동성 모델링에 의해 비교함으로써 원형 순열을 거친 단백질의 어느 잔기가 원형 순열을 거치지 않은 참조 단백질의 잔기에 상응하는지를 쉽게 결정할 수 있을 것이다.

일부 구현예에서, 관심 서열과 본 출원에 기재된 참조 서열 사이의 동일성 백분율을 결정하는 알고리즘은 서열 사이의 원형 순열의 존재를 설명한다. 원형 순열의 존재는, 예를 들어, RASPODOM(Weiner et al., Bioinformatics. 2005 Apr 1;21(7):932-7)을 포함하는 당업계에 공지된 임의의 방법을 이용하여 검출될 수 있다. 일부 구현예에서, 원형 순열의 존재는 관심 서열과 본 출원에 기재된 서열 간의 동일성 백분율의 계산 전에 교정된다(예를 들어, 적어도 하나의 서열의 도메인이 재배열됨). 본 출원의 청구범위는 서열의 잠재적 원형 순열을 고려한 후에 참조 서열에 대한 동일성 백분율이 계산되는 서열을 포함하는 것으로 이해되어야 한다.

숙주 세포에서 핵산의 발현

본 개시내용의 양태는 재조합 효소, 이의 기능적 변형 및 변이체뿐만 아니라 이들의 용도에 관한 것이다. 예를 들어, 본 출원에 기재된 방법은 칸나비노이드 및/또는 칸나비노이드 전구체를 생성하는 데 사용될 수 있다. 상기 방법은 본 출원에 개시된 효소, 세포 용해물, 단리된 효소, 또는 이들의 임의의 조합을 포함하는 숙주 세포를 사용하는 것을 포함할 수 있다. 숙주 세포에서 본 출원에 개시된 효소를 코딩하는 유전자의 재조합 발현을 포함하는 방법이 본 개시내용에 포함된다. 반응 혼합물에서 하나 이상의 칸나비노이드 전구체 또는 칸나비노이드를 본 출원에 개시된 효소와 반응시키는 것을 포함하는 시험관내 방법이 또한 본 개시내용에 포함된다. 일부 구현예에서, 효소는 TS이다.

본 출원에 기재된 임의의 재조합 폴리펩티드(예를 들어, AAE, PKS, PKC, PT, 또는 TS 효소)를 코딩하는 핵산은 당업계에 공지된 임의의 방법을 통해 임의의 적절한 벡터에 혼입될 수 있다. 예를 들어, 벡터는 바이러스 벡터(예를 들어, 렌티바이러스, 레트로바이러스, 아데노바이러스, 또는 아데노 관련 바이러스 벡터), 일시적 발현에 적합한 임의의 벡터, 항상성 발현에 적합한 임의의 벡터, 또는 유도성 발현에 적합한 임의의 벡터(예를 들어, 갈락토스 유도성 또는 독시사이클린 유도성 벡터)를 포함하지만 이에 제한되지 않는 발현 벡터일 수 있다.

본 출원에 기재된 임의의 재조합 폴리펩티드(예를 들어, AAE, PKS, PKC, PT, 또는 TS 효소)를 코딩하는 벡터는 당업계에 공지된 임의의 방법을 사용하여 적합한 숙주 세포 내로 도입될 수 있다. 효모 형질전환 프로토콜의 비제한적인 예는 그 전체가 본원에 참조로 포함된 문헌(Gietz et al., Yeast transformation can be conducted by the LiAc/SS Carrier DNA/PEG method. Methods Mol Biol. 2006;313:107-20)에 기재되어 있다. 숙주 세포는 당업자에 의해 이해되는 바와 같이 적합한 임의의 조건 하에 배양될 수 있다. 예를 들어, 당업계에 공지된 임의의 배지, 온도 및 인큐베이션 조건이 사용될 수 있다. 유도성 벡터를 보유하는 숙주 세포의 경우, 세포는 발현을 촉진하기 위해 적절한 유도제와 함께 배양될 수 있다.

일부 구현예에서, 벡터는 세포에서 자율적으로 복제된다. 일부 구현예에서, 벡터는 세포 내 염색체에 통합된다. 벡터는 세포에서 복제될 수 있는 재조합 벡터를 생성하기 위해서 본 출원에 기재된 유전자를 함유하는 핵산을 삽입 및 결찰시키도록 제한 엔도뉴클레아제에 의해 절단되는 하나 이상의 엔도뉴클레아제 제한 부위를 함유할 수 있다. 벡터는 전형적으로 DNA로 구성되지만, RNA 벡터도 이용 가능하다. 클로닝 벡터는 플라스미드, 포스미드, 파지미드, 바이러스 게놈, 및 인공 염색체를 포함하지만 이에 제한되지 않는다. 본 출원에 사용된 바와 같이, 용어 "발현 벡터" 또는 "발현 작제물"은 숙주 세포(예를 들어, 미생물), 예컨대 효모 세포에서 특정 핵산의 전사를 허용하는 일련의 명시된 핵산 요소를 갖는, 재조합적으로 또는 합성적으로 생성된, 핵산 작제물을 지칭한다. 일부 구현예에서, 본 출원에 기재된 유전자의 핵산 서열은 조절 서열에 작동적으로 연결되어서, 일부 구현예에서, RNA 전사물로서 발현되도록 클로닝 벡터에 삽입된다. 일부 구현예에서, 벡터는 재조합 벡터로 형질전환되거나 형질감염된 세포를 확인하기 위해서, 본 출원에 기재된 바와 같은 선택 가능한 마커와 같은 하나 이상의 마커를 함유한다. 일부 구현예에서, 숙주 세포는 이미 하나 이상의 벡터로 형질전환되었다. 일부 구현예에서, 하나 이상의 벡터로 형질전환된 숙주 세포는 후속적으로 하나 이상의 벡터로 형질전환된다. 일부 구현예에서, 숙주 세포는 하나 초과의 벡터로 동시에 형질전환된다. 일부 구현예에서, 벡터 또는 발현 카세트로 형질전환된 세포는 벡터 또는 발현 카세트의 전부 또는 일부를 게놈에 통합한다. 일부 구현예에서, 본 출원에 기재된 유전자의 핵산 서열은 재코딩된다. 재코딩은 재코딩되지 않은 참조 서열에 비해 그 사이의 모든 값을 포함하여 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 100%까지 유전자 생성물의 생성을 증가시킬 수 있다.

일부 구현예에서, 본 출원에 기재된 임의의 단백질을 코딩하는 핵산은 조절 서열(예를 들어, 인핸서 서열)의 제어 하에 있다. 일부 구현예에서, 핵산은 프로모터의 제어 하에 발현된다. 프로모터는 천연 프로모터, 예를 들어, 유전자의 발현의 정상 조절을 제공하는, 이의 내인성 환경에서의 유전자의 프로모터일 수 있다. 대안적으로, 프로모터는 유전자의 천연 프로모터와 상이한 프로모터일 수 있고, 예를 들어, 프로모터는 이의 내인성 상황에서의 유전자의 프로모터와 상이하다.

일부 구현예에서, 프로모터는 진핵생물 프로모터이다. 진핵생물 프로모터의 비제한적인 예는 당업자에게 공지된 바와 같은 TDH3, PGK1, PKC1, PDC1, TEF1, TEF2, RPL18B, SSA1, TDH2, PYK1, TPI1, GAL1, GAL10, GAL7, GAL3, GAL2, MET3, MET25, HXT3, HXT7, ACT1, ADH1, ADH2, CUP1-1, ENO2, 및 SOD1을 포함한다(예를 들어, Addgene 웹사이트: blog.addgene.org/plasmids-101-the-promoter-region 참조). 일부 구현예에서, 프로모터는 원핵생물 프로모터(예를 들어, 박테리오파지 또는 박테리아 프로모터)이다. 박테리오파지 프로모터의 비제한적인 예는 Pls1con, T3, T7, SP6, 및 PL을 포함한다. 박테리아 프로모터의 비제한적인 예는 Pbad, PmgrB, Ptrc2, Plac/ara, Ptac, 및 Pm을 포함한다.

일부 구현예에서, 프로모터는 유도성 프로모터이다. 본 출원에 사용된 바와 같이, "유도성 프로모터"는 분자의 존재 또는 부재에 의해 제어되는 프로모터이다. 이것은, 예를 들어, 효소의 발현을 제어 가능하게 유도시키기 위해 사용될 수 있다. 일부 구현예에서, 효소에 연결된 유도성 프로모터는, 예를 들어, 특정 시나리오에서(예를 들어, 특정 관할 구역의 규제 제한을 충족하기 위해 유전적으로 변형된 유기체를 수송하는 동안 또는 칸나비노이드가 배송되지 않을 수 있는 관할 구역 간에) 칸나비노이드 생성을 감소시키기 위해 효소(들)의 발현을 조절하는 데 사용될 수 있다. 일부 구현예에서, 효소에 연결된 유도성 프로모터는, 예를 들어, 특정 시나리오에서(예를 들어, 특정 관할 구역의 규제 제한을 충족하기 위해 유전적으로 변형된 유기체를 수송하는 동안 또는 칸나비노이드가 배송되지 않을 수 있는 관할 구역 간에) 칸나비노이드 생성을 감소시키기 위해 효소(들)의 발현을 조절하는 데 사용될 수 있다. 유도성 프로모터의 비제한적인 예는 화학적으로 조절되는 프로모터 및 물리적으로 조절되는 프로모터를 포함한다. 화학적으로 조절되는 프로모터의 경우, 전사 활성은 하나 이상의 화합물, 예컨대 알코올, 테트라사이클린, 갈락토스, 스테로이드, 금속, 아미노산, 또는 다른 화합물에 의해 조절될 수 있다. 물리적으로 조절되는 프로모터 경우, 전사 활성은 현상, 예컨대 광 또는 온도에 의해 조절될 수 있다. 테트라사이클린-조절된 프로모터의 비제한적인 예는 언하이드로테트라사이클린(aTc)-반응성 프로모터 및 다른 테트라사이클린-반응성 프로모터 시스템(예를 들어, 테트라사이클린 리프레서 단백질(tetR), 테트라사이클린 오퍼레이터 서열(tetO) 및 테트라사이클린 트랜스활성인자 융합 단백질(tTA))을 포함한다. 스테로이드-조절된 프로모터의 비제한적인 예는 래트 글루코코르티코이드 수용체, 인간 에스트로겐 수용체, 나방 엑디손 수용체를 기반으로 하는 프로모터, 및 스테로이드/레티노이드/갑상선 수용체 수퍼패밀리로부터의 프로모터를 포함한다. 금속-조절된 프로모터의 비제한적인 예는 메탈로티오네인(금속 이온에 결합하여 격리시키는 단백질) 유전자로부터 유래된 프로모터를 포함한다. 발병기전-조절된 프로모터의 비제한적인 예는 살리실산, 에틸렌 또는 벤조티아디아졸(BTH)에 의해 유도되는 프로모터를 포함한다. 온도/열-유도성 프로모터의 비제한적인 예는 열충격 프로모터를 포함한다. 광-조절된 프로모터의 비제한적인 예는 식물 세포 유래의 광 반응성 프로모터를 포함한다. 특정 구현예에서, 유도성 프로모터는 갈락토스-유도성 프로모터이다. 특정 구현예에서, 유도성 프로모터는 하나 이상의 생리적 조건(예를 들어, pH, 온도, 방사선, 삼투압, 염수 구배, 세포 표면 결합, 또는 하나 이상의 외인성 또는 내인성 유도제의 농도)에 의해 유도된다. 외인성 유도인자 또는 유도제의 비제한적인 예는 아미노산 및 아미노산 유사체, 사카라이드 및 폴리사카라이드, 핵산, 단백질 전사 활성인자 및 리프레서, 사이토카인, 독소, 석유-기반 화합물, 금속 함유 화합물, 염, 이온, 효소 기질 유사체, 호르몬 또는 임의의 조합을 포함한다.

일부 구현예에서, 프로모터는 항상성 프로모터이다. 본 출원에 사용된 바와 같이, "항상성 프로모터"는 유전자의 연속 전사를 허용하는 비조절된 프로모터를 지칭한다. 항상성 프로모터의 비제한적인 예는 TDH3, PGK1, PKC1, PDC1, TEF1, TEF2, RPL18B, SSA1, TDH2, PYK1, TPI1, HXT3, HXT7, ACT1, ADH1, ADH2, ENO2, 및 SOD1을 포함한다.

당업자에게 공지되어 있을 수 있는 합성 프로모터를 포함하는 다른 유도성 프로모터 또는 항상성 프로모터가 또한 고려된다.

유전자 발현에 필요한 조절 서열의 정확한 성질은 종 또는 세포 유형 간에 다양할 수 있지만, 일반적으로 필요에 따라, 각각 전사 및 번역의 개시에 관여되는 5' 비-전사 및 5' 비-번역 서열, 예컨대 TATA 박스, 캡핑 서열, CAAT 서열 등을 포함한다. 특히, 이러한 5' 비-전사 조절 서열은 작동적으로 연결된 유전자의 전사 제어를 위한 프로모터 서열을 포함하는 프로모터 영역을 포함할 것이다. 조절 서열은 또한 인핸서 서열 또는 상류 활성자 서열을 포함할 수 있다. 개시된 벡터는 5' 리더(leader) 또는 신호 서열을 포함할 수 있다. 조절 서열은 또한 종결자 서열을 포함할 수 있다. 일부 구현예에서, 종결자 서열은 전사 동안 DNA 내 유전자의 끝을 표시한다. 이종 유기체에서 본 출원에 기재된 하나 이상의 유전자의 발현을 유도하는 데 적합한 하나 이상의 적절한 벡터의 선택 및 설계는 당업자의 능력 및 재량 내에 있다.

발현에 필요한 요소를 함유하는 발현 벡터는 상업적으로 입수 가능하고 당업자에게 공지되어 있다(예를 들어, 문헌(Sambrook et al., Molecular Cloning: A Laboratory Manual, Fourth Edition, Cold Spring Harbor Laboratory Press, 2012) 참조).

숙주 세포

개시된 칸나비노이드 생합성 방법 및 숙주 세포는 에스. 세레비지아에로 예시되지만, 당업자에 의해 이해될 수 있는 바와 같이 다른 숙주 세포에도 적용 가능하다.

적합한 숙주 세포는 효모 세포, 박테리아 세포, 조류 세포, 식물 세포, 진균 세포, 곤충 세포, 및 포유동물 세포를 포함한 동물 세포를 포함하지만 이에 제한되지 않는다. 예시적인 일 구현예에서, 적합한 숙주 세포는 이. 콜라이(예를 들어, 매사추세츠주 입스에 위치한 New England BioLabs로부터 입수 가능한 Shuffle^TM 컴피턴트 이. 콜라이)를 포함한다.

본 개시내용의 다른 적합한 숙주 세포는 코리네박테리움(Corynebacterium) 속의 미생물을 포함한다. 일부 구현예에서, 바람직한 코리네박테리움 균주/종은 다음을 포함한다: 기탁형 균주가 DSM44549인 씨 에피시엔스(C. efficiens), 기탁형 균주가 ATCC13032인 씨. 글루타미쿰(C. glutamicum), 및 기탁형 균주가 ATCC6871인 씨. 암모니아게네스(C. ammoniagenes). 일부 구현예에서, 본 개시내용의 바람직한 숙주 세포는 씨. 글루타미쿰이다.

코리네박테리움 속, 특히 코리네박테리움 글루타미쿰 종의 적합한 숙주 세포는 특히 공지된 야생형 균주이다: 코리네박테리움 글루타미쿰 ATCC13032, 코리네박테리움 아세토글루타미쿰(Corynebacterium acetoglutamicum) ATCC15806, 코리네박테리움 아세토아시도필름(Corynebacterium acetoacidophilum) ATCC13870, 코리네박테리움 멜라세콜라(Corynebacterium melassecola) ATCC17965, 코리네박테리움 써모아미노게네스(Corynebacterium thermoaminogenes) FERM BP-1539, 브레비박테리움 플라붐(Brevibacterium flavum) ATCC14067, 브레비박테리움 락토퍼멘툼(revibacterium lactofermentum) ATCC13869, 및 브레비박테리움 디바리카툼(Brevibacterium divaricatum) ATCC14020; 및 L-아미노산-생성 돌연변이체, 또는 이로부터 제조된 균주, 예를 들어, L-리신-생성 균주: 코리네박테리움 글루타미쿰 FERM-P 1709, 브레비박테리움 플라붐 FERM-P 1708, 브레비박테리움 락토퍼멘툼 FERM-P 1712, 코리네박테리움 글루타미쿰 FERM-P 6463, 코리네박테리움 글루타미쿰 FERM-P 6464, 코리네박테리움 글루타미쿰 DM58-1, 코리네박테리움 글루타미쿰 DG52-5, 코리네박테리움 글루타미쿰 DSM5714, 및 코리네박테리움 글루타미쿰 DSM12866.

적합한 효모 숙주 세포는 칸디다(Candida), 한세눌라(Hansenula), 사카로마이세스(Saccharomyces), 스키조사카로마이세스(Schizosaccharomyces), 피키아(Pichia), 클루이베로마이세스(Kluyveromyces), 및 야로위아(Yarrowia)를 포함하지만 이에 제한되지 않는다. 일부 구현예에서, 효모 세포는 한세눌라 폴리모르파(Hansenula polymorpha), 사카로마이세스 세레비지아에(Saccharomyces cerevisiae), 사카로마이세스 칼스베르겐시스(Saccaromyces carlsbergensis), 사카로마이세스 디아스타티커스(Saccharomyces diastaticus), 사카로마이세스 노르벤시스(Saccharomyces norbensis), 사카로마이세스 클루이베리(Saccharomyces kluyveri), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 이전에 피키아 파스토리스(Pichia pastoris), 피키아 핀란디카(Pichia finlandica), 피키아 트레할로필라(Pichia trehalophila), 피키아 코다마에(Pichia kodamae), 피키아 멤브라나에파시엔스(Pichia membranaefaciens), 피키아 오푼티아에(Pichia opuntiae), 피키아 써모톨레란스(Pichia thermotolerans), 피키아 살릭타리아(Pichia salictaria), 피키아 쿠에르쿠움(Pichia quercuum), 피키아 피지페리(Pichia pijperi), 피키아 스티피티스(Pichia stipitis), 피키아 메타놀리카(Pichia methanolica), 피키아 안구스타(Pichia angusta)로 공지된 코마가타엘라 파피(Komagataella phaffii), 클루이베로마이세스 락티스(Kluyveromyces lactis), 칸디다 알비칸스(Candida albicans), 또는　야로위아 리폴리티카(Yarrowia lipolytica)이다.

일부 구현예에서, 효모 균주는 산업용 배수체 효모 균주이다. 진균 세포의 다른 비제한적인 예는 아스페르길루스(Aspergillus) 종, 페니실리움(Penicillium) 종, 푸사리움(Fusarium) 종, 리조푸스(Rhizopus) 종, 아크레모니움(Acremonium) 종, 뉴로스포라(Neurospora) 종, 솔다리아(Sordaria) 종, 마그나포르테(Magnaporthe) 종, 알로마이세스(Allomyces) 종, 우스틸라고(Ustilago) 종, 보트리티스(Botrytis) 종, 및 트리코더마(Trichoderma) 종으로부터 얻어진 세포를 포함한다.

특정 구현예에서, 숙주 세포는 조류 세포, 예컨대 클라미도모나스(Chlamydomonas)　(예를 들어,　씨. 레인하르티이(C. Reinhardtii)) 및 포르미디움(Phormidium)　(피. 종 ATCC29409)이다.

다른 구현예에서, 숙주 세포는 원핵생물 세포이다. 적합한 원핵생물 세포는 그람 양성, 그람 음성, 및 그람-가변성 박테리아 세포를 포함한다. 숙주 세포는 아그로박테리움(Agrobacterium), 알리시클로바실러스(Alicyclobacillus), 아나바에나(Anabaena), 아나시스티스(Anacystis), 아시네토박터(Acinetobacter), 아시도써머스(Acidothermus), 아트로박터(Arthrobacter), 아조박터(Azobacter), 바실러스(Bacillus), 비피도박테리움(Bifidobacterium), 브레비박테리움 (Brevibacterium), 부티리비브리오(Butyrivibrio), 부크네라(Buchnera), 캄페스트리스(Campestris), 캄필로박터(Campylobacter), 클로스트리듐(Clostridium), 코리네박테리움(Corynebacterium), 크로마티움(Chromatium), 코프로코커스(Coprococcus), 에스케리치아(Escherichia), 엔테로코커스(Enterococcus), 엔테로박터(Enterobacter), 어위니아(Erwinia), 푸소박테리움(Fusobacterium), 파에칼리박테리움(Faecalibacterium), 프란시셀라(Francisella), 플라보박테리움 (Flavobacterium), 지오바실러스(Geobacillus), 해모필러스(Haemophilus), 헬리코박터(Helicobacter), 클렙시엘라(Klebsiella), 락토바실러스(Lactobacillus), 락토코커스(Lactococcus), 일리오박터(Ilyobacter), 미크로코커스(Micrococcus), 미크로박테리움(Microbacterium), 메소리조비움(Mesorhizobium), 메틸로박테리움 (Methylobacterium), 메틸로박테리움(Methylobacterium), 미코박테리움 (Mycobacterium), 네이세리아(Neisseria), 판토에아 (Pantoea), 슈도모나스(Pseudomonas), 프로클로로코커스(Prochlorococcus), 로도박터(Rhodobacter), 로도슈도모나스(Rhodopseudomonas), 로도슈도모나스(Rhodopseudomonas), 로세부리아 (Roseburia), 로도스피릴룸(Rhodospirillum), 로도코커스(Rhodococcus), 세네데스머스(Scenedesmus), 스트렙토마이세스(Streptomyces), 스트렙토코커스(Streptococcus), 시네코커스(Synecoccus), 사카로모노스포라(Saccharomonospora), 사카로폴리스포라(Saccharopolyspora), 스타필로코커스(Staphylococcus), 세라티아(Serratia), 살모넬라(Salmonella), 시겔라(Shigella), 써모아나에로박테리움(Thermoanaerobacterium), 트로페리마(Tropheryma), 툴라렌시스(Tularensis), 테머큘라(Temecula), 써모시네코코커스(Thermosynechococcus), 써모코커스(Thermococcus), 우레아플라스마(Ureaplasma), 잔토모나스(Xanthomonas), 자일렐라(Xylella), 여시니아(Yersinia),　및 자이모모나스(Zymomonas)의 종일 수 있지만, 이에 제한되지 않는다.

일부 구현예에서, 박테리아 숙주 균주는 산업용 균주이다. 수많은 박테리아 산업용 균주가 공지되어 있고 본 출원에 기재된 방법 및 조성물에 적합하다.

일부 구현예에서, 박테리아 숙주 세포는 아그로박테리움(Agrobacterium) 종(예를 들어,　에이. 라디오박터(A. radiobacter), 에이. 리조게네스(A. rhizogenes), 에이. 루비(A. rubi)), 아트로박터(Arthrobacter) 종(예를 들어,　에이. 아우레센스(A. aurescens), 에이. 시트레우스(A. citreus), 에이. 글롭포르미스(A. globformis), 에이. 하이드로카르보글루타미커스(A. hydrocarboglutamicus), 에이. 미소렌스(A. mysorens), 에이. 니코티아나에(A. nicotianae), 에이. 파라피네우스(A. paraffineus), 에이. 프로토폰니아에(A. protophonniae), 에이. 로세오파라피너스(A. roseoparaffinus), 에이. 술푸레우스(A. sulfureus), 에이. 우레아파시엔스(A. ureafaciens)), 바실러스(Bacillus) 종(예를 들어,　비. 투린지엔시스(B. thuringiensis), 비. 안트라시스(B. anthracis), 비. 메가테리움(B. megaterium), 비. 서브틸리스(B. subtilis), 비. 렌터스(B. lentus), 비. 서큘라스(B. circulars), 비. 푸밀러스(B. pumilus), 비. 라우터스(B. lautus), 비. 코아굴란스(B. coagulans), 비. 브레비스(B. brevis), 비. 퍼머스(B. firmus), 비. 알카오피우스(B. alkaophius), 비. 리체니포르미스(B. licheniformis), 비. 클라우시이(B. clausii), 비. 스테아로써모필러스(B. stearothermophilus), 비. 할로두란스(B. halodurans) 및 비. 아밀로리케파시엔스(B. amyloliquefaciens)의 것이다. 특정 구현예에서, 숙주 세포는 비. 서브틸리스(B. subtilis), 비. 푸밀러스(B. pumilus), 비. 리체니포르미스(B. licheniformis), 비. 메가테리움(B. megaterium), 비. 클라우시이(B. clausii), 비. 스테아로써모필러스(B. stearothermophilus)　및 비. 아밀로리케파시엔스(B. amyloliquefaciens)를 포함하지만 이에 제한되지 않는 산업용 바실러스 균주일 것이다. 일부 구현예에서, 숙주 세포는 산업용 클로스트리듐 종(예를 들어,　씨. 아세토부틸리컴(C. acetobutylicum), 씨. 테타니(C. tetani)　E88,　씨. 리투세부렌스(C. lituseburense), 씨. 사카로부틸리컴(C. saccharobutylicum), 씨. 퍼프린젠스(C. perfringens), 씨. 베이제린키이(C. beijerinckii))일 것이다. 일부 구현예에서, 숙주 세포는 산업용 코리네박테리움 종(예를 들어,　씨. 글루타미컴(C. glutamicum), 씨. 아세토아시도필럼(C. acetoacidophilum))일 것이다. 일부 구현예에서, 숙주 세포는 산업용 에스케리치아 종(예를 들어,　이. 콜라이)일 것이다. 일부 구현예에서, 숙주 세포는 산업용 어위니아 종(예를 들어, 이. 우레도보라(E. uredovora), 이. 카로토보라(E. carotovora), 이. 아나나스(E. ananas), 이. 허비콜라(E. herbicola), 이. 푼타타(E. punctata), 이. 테레우스(E. terreus))일 것이다. 일부 구현예에서, 숙주 세포는 산업용 판토에아 종(예를 들어, 피. 시트레아 (P. citrea), 피. 아글로머란스(P. agglomerans))일 것이다. 일부 구현예에서, 숙주 세포는 산업용 슈도모나스 종(예를 들어,　피. 푸티다(P. putida), 피. 애루지노사(P. aeruginosa), 피. 메발로니이(P. mevalonii))일 것이다. 일부 구현예에서, 숙주 세포는 산업용 스트렙토코커스 종(예를 들어,　에스. 에퀴시밀레스(S. equisimiles), 에스. 피오게네스(S. pyogenes), 에스. 우베리스(S. uberis))일 것이다. 일부 구현예에서, 숙주 세포는 산업용 스트렙토마이세스 종(예를 들어,　에스. 암보파시엔스(S. ambofaciens), 에스, 아크로모게네스(S. achromogenes), 에스. 아버미틸리스(S. avermitilis), 에스. 코엘리콜러(S. coelicolor), 에스. 아우레오파시엔스(S. aureofaciens), 에스. 아우레우스(S. aureus), 에스. 푼지시디커스(S. fungicidicus), 에스. 그리세우스(S. griseus), 에스. 리비단스(S. lividans))일 것이다. 일부 구현예에서, 숙주 세포는 산업용 자이모모나스 종(예를 들어, 지. 모빌리스(Z. mobilis), 지. 리폴리티카(Z. lipolytica)) 등일 것이다.

본 개시내용은 또한 포유동물 세포, 예를 들어, 인간(293, HeLa, WI38, PER.C6 및 바우스 흑색종 세포 포함), 마우스(3T3,　NS0, NS1, Sp2/0 포함), 햄스터(CHO, BHK), 원숭이(COS, FRhL, Vero), 곤충 세포, 예를 들어, 가을 거미벌레(Sf9 및 Sf21 포함), 누에나방(BmN 포함), 양배추 자벌레(BTI-Tn-5B1-4 포함) 및 일반 초파리(슈나이더(Schneider) 2 포함), 및 하이브리도마 세포주를 포함한 다양한 동물 세포 유형과 함께 사용하기에 적합하다.

다양한 구현예에서, 균주는 원핵생물 및 진핵생물 균주 둘 모두를 포함하여 본 개시내용의 실시에서 사용될 수 있으며 수많은 생물자원 센터, 예컨대 미국 생물자원 센터(American Type Culture Collection) (ATCC), 독일 생물자원 센터(Deutsche Sammlung von Mikroorganismen and Zellkulturen GmbH) (DSM), 네덜란드 곰팡이 자원 센터(Centraalbureau Voor Schimmelcultures) (CBS), 및 농업 특허 자원 센터, 북부 연구소(Agricultural Research Service Patent Culture Collection, Northern Regional Research Center) (NRRL)에서 공공으로 쉽게 접근 가능하다. 본 개시내용은 또한 다양한 식물 세포 유형과 함께 사용하기에 적합하다. 일부 구현예에서, 식물은 대마초과의 대마초 속이다. 특정 구현예에서, 식물은 대마초 사티바, 대마초 인디카, 또는 대마초 루데랄리스 종이다. 다른 구현예에서, 식물은 가지과의 니코티아나 속의 식물이다. 특정 구현예에서, 식물은 니코티아나 루스티카(Nicotiana rustica) 종이다.

본 출원에 사용된 용어 "세포"는 단일 세포, 또는 동일한 세포주 또는 균주에 속하는 세포 집단과 같은 세포 집단을 지칭할 수 있다. 단수 용어 "세포"의 사용은 세포 집단보다 단일 세포를 명시적으로 지칭하는 것으로 해석되어서는 안된다. 숙주 세포는 야생형 대응물에 대한 유전자 변형을 포함할 수 있다. 숙주 세포에서 유전자 발현 및/또는 유전자 불활성화의 감소는 유전자의 결실, 유전자에 점 돌연변이의 도입, 유전자의 선택적 편집 및/또는 유전자의 절단을 포함하지만 이에 제한되지 않는 임의의 적합한 방법을 통해 달성될 수 있다. 예를 들어, 중합효소 연쇄 반응(PCR)-기반 방법이 사용될 수 있다(예를 들어, 문헌(Gardner et al., Methods Mol Biol. 2014;1205:45-78) 참조). 비제한적인 예로서, 유전자는 유전자 교체(예를 들어, 선택 마커를 포함하는 마커로)를 통해 결실될 수 있다. 유전자는 또한 트랜스포존 시스템의 사용을 통해 절단될 수 있다(예를 들어, 문헌(Poussu et al., Nucleic Acids Res. 2005; 33(12): e104) 참조). 유전자는 또한 CRISPR 기반 기술과 같은 당업계에 공지된 유전자 편집 기술의 사용을 통해 편집될 수 있다.

숙주 세포 배양

본 출원에 개시된 임의의 세포는 핵산의 접촉 및/또는 통합 이전, 동안 및/또는 이후에 임의의 유형(풍부 또는 최소) 및 임의의 조성의 배지에서 배양될 수 있다. 배양 또는 배양 공정의 조건은 당업자에 의해 이해되는 바와 같이 통상적인 실험을 통해 최적화될 수 있다. 일부 구현예에서, 선택된 배지는 다양한 성분으로 보충된다. 일부 구현예에서, 보충 성분의 농도 및 양이 최적화된다. 일부 구현예에서, 배지의 다른 양태 및 성장 조건(예를 들어, pH, 온도 등)은 통상적인 실험을 통해 최적화된다. 일부 구현예에서, 하나 이상의 보충 성분이 배지에 보충되는 빈도, 및 세포가 배양되는 시간량이 최적화된다.

본 출원에서 기재된 세포의 배양은 당업계에 공지되어 사용되는 배양 용기에서 수행될 수 있다. 일부 구현예에서, 통기형 반응 용기(예를 들어, 교반식 탱크 반응기)가 세포를 배양하는 데 사용된다. 일부 구현예에서, 생물반응기 또는 발효기를 사용하여 세포를 배양한다. 따라서, 일부 구현예에서, 세포는 발효에 사용된다. 본 출원에 사용된 바와 같이, 용어 "생물반응기" 및 "발효기"는 상호교환적으로 사용되며, 살아있는 유기체, 살아있는 유기체의 일부를 포함하는, 생물학적, 생화학적, 및/또는 화학적 반응이 일어나는, 인클로저 또는 부분 인클로저를 지칭한다. "대규모 생물반응기" 또는 "산업적 규모 생물반응기"는 상업적 또는 준-상업적 규모로 생성물을 생성하는 데 사용되는 생물반응기이다. 대규모 생물반응기는 전형적으로 리터, 수백 리터, 수천 리터 또는 그 초과의 범위의 부피를 갖는다.

생물반응기의 비제한적인 예는 교반식 탱크 발효기, 회전식 혼합 장치, 케모스타트에 의해 교반되는 생물반응기, 진탕 장치로 교반되는 생물반응기, 에어리프트 발효기, 충전층 반응기, 고정층 반응기, 유동층 생물반응기, 파동 유발 교반을 사용한 생물반응기, 원심 생물반응기, 롤러병(roller bottle), 및 중공 섬유 생물반응기, 롤러 장비(예를 들어, 벤치탑, 카트-장착, 및/또는 자동화 버라이어티), 수직-적층 플레이트, 스피너 플라스크, 교반식 또는 진동식 플라스크, 진탕 다중-웰 플레이트, MD 병, T-플라스크, 루(Roux) 병, 다중-표면 조직 배양 전파기, 변형식 발효기, 및 코팅된 비드(예를 들어, 세포 부착을 방지하기 위해 혈청 단백질, 니트로셀룰로오스, 또는 카복시메틸 셀룰로오스로 코팅된 비드)를 포함한다.

일부 구현예에서, 생물반응기는 세포(예를 들어, 효모 세포)가 이동하는 액체 및/또는 가스 버블과 접촉하는 세포 배양 시스템을 포함한다. 일부 구현예에서, 세포 또는 세포 배양물은 현탁 성장된다. 다른 구현예에서, 세포 또는 세포 배양물은 고상(solid phase) 담체에 부착된다. 담체 시스템의 비제한적인 예는 마이크로담체(예를 들어, 다공성 또는 비-다공성일 수 있는 중합체구, 마이크로비드, 및 마이크로디스크), 특별한 화학기(예를 들어, 4차 아민 기)가 충전된 가교결합된 비드(예를 들어, 덱스트란), 비다공성 중합체 섬유에 포획된 세포를 포함하는 2D 마이크로담체, 3D 담체(예를 들어, 캐리어 섬유, 중공 섬유, 다중카트리지 반응기, 및 다공성 섬유를 포함할 수 있는 반투과성막), 이온 교환 능력이 감소된 마이크로담체, 캡슐화 세포, 모세관, 및 응집체를 포함한다. 일부 구현예에서, 담체는 덱스트란, 젤라틴, 유리, 또는 셀룰로오스와 같은 재료로 제작된다.

일부 구현예에서, 산업적 규모의 과정은 연속식, 반-연속식, 또는 비-연속식 방식으로 작업된다. 작업 방식의 비제한적인 예는 배치식, 유가식(fed batch), 확장형 배치식, 반복형 배치식, 추출/충전(draw/fill), 회전-벽, 스피닝 플라스크, 및/또는 관류 작업 방식을 포함한다. 일부 구현예에서, 생물반응기는 기질 스톡, 예를 들어, 탄수화물 공급원의 연속 또는 반연속 보충 및/또는 생물반응기로부터 생성물의 연속 또는 반연속 분리를 허용한다.

일부 구현예에서, 생물반응기 또는 발효기는 반응 매개변수를 측정하고/하거나 조정하기 위한 센서 및/또는 제어 시스템을 포함한다. 반응 매개변수의 비제한적인 예는 생물학적 매개변수(예를 들어, 성장 속도, 세포 크기, 세포 수, 세포 밀도, 세포 유형, 또는 세포 상태 등), 화학적 매개변수(예를 들어, pH, 산화환원 전위, 반응 기질 및/또는 생성물의 농도, 용존 가스의 농도, 예컨대 산소 농도 및 CO₂ 농도, 영양소 농도, 대사산물 농도, 올리고펩티드의 농도, 아미노산의 농도, 비타민의 농도, 호르몬의 농도, 첨가제의 농도, 혈청 농도, 이온 강도, 이온의 농도, 상대 습도, 몰농도, 삼투압 농도, 다른 화학 물질, 예를 들어 완충제, 보강제 또는 반응 부산물의 농도), 물리적/기계적 매개변수(예를 들어, 밀도, 전도도, 교반 정도, 압력, 및 유속, 전단 응력, 전단 속도, 점도, 색상, 탁도, 흡광도, 혼합율, 전환율뿐만 아니라 열역학적 매개변수, 예컨대 온도, 광 강도/품질 등)를 포함한다. 본 출원에 기재된 매개변수를 측정하기 위한 센서는 관련 기계 및 전자 분야의 당업자에게 익히 공지되어 있다. 본 출원에 기재된 센서로부터 투입물 기반으로 생물반응기의 매개변수를 조정하기 위한 제어 시스템은 생물반응기 조작의 당업자에게 익히 공지되어 있다.

일부 구현예에서, 방법은 배치식 발효(예를 들어, 진탕 플라스크 발효)를 포함한다. 배치식 발효(예를 들어, 진탕 플라스크 발효)에 대한 일반 고려사항은 산소 및 글루코스 수준을 포함한다. 예를 들어, 배치식 발효(예를 들어, 진탕 플라스크 발효)는 산소 및 글루코스가 제한될 수 있어서, 일부 구현예에서, 잘-설계된 유가식 발효에서 수행하는 균주의 능력이 과소평가된다. 또한, 최종 생성물(예를 들어, 칸나비노이드 또는 칸나비노이드 전구체)은 가용성, 독성, 세포 축적 및 분비의 관점에서 기질과 일부 편차를 나타낼 수 있고 일부 구현예에서 상이한 발효배양 동역학을 가질 수 있다.

일부 구현예에서, 본 개시내용의 세포는 생체내에서 칸나비노이드 또는 칸나비노이드 전구체를 생성하도록 적응된다. 일부 구현예에서, 세포는 칸나비노이드 합성을 위한 하나 이상의 효소(예를 들어, AAE, PKS, PKC, PT 또는 TS)를 분비하도록 적응된다. 일부 구현예에서, 본 개시내용의 세포는 용해되고, 나머지 용해물은 후속 사용을 위해 회수된다. 이러한 구현예에서, 분비되거나 용해된 효소는 시험관내 또는 생체외 과정에서 생물전환에 의한 칸나비노이드 또는 전구체의 생성을 위한 반응을 촉매할 수 있다. 일부 구현예에서, 본 출원에 기재된 임의의 모든 전환은 시험관내 또는 생체내에서 화학적으로 또는 효소적으로 수행될 수 있다.

일부 구현예에서, 본 개시내용의 숙주 세포는 생체내에서 칸나비노이드 또는 칸나비노이드 전구체를 생성하도록 적응된다. 일부 구현예에서, 숙주 세포는 하나 이상의 칸나비노이드 경로 기질, 중간체 및/또는 말단 생성물(예를 들어, 올리베톨, THCA, THC, CBDA, CBD, CBGA, CBGVA, THCVA, CBDVA, CBCVA, 또는 CBCA)을 분비하도록 적응된다. 일부 구현예에서, 본 개시내용의 숙주 세포는 용해되고, 용해물은 후속 사용을 위해 회수된다. 이러한 구현예에서, 분비된 기질, 중간체 및/또는 말단 생성물은 배양 배지로부터 회수될 수 있다.

정제 및 추가 처리

일부 구현예에서, 본 출원에 기재된 임의의 방법은 생성된(예를 들어, 생물반응기에서 생성된) 칸나비노이드 및/또는 칸나비노이드 전구체의 단리 및/또는 정제를 포함할 수 있다. 예를 들어, 단리 및/또는 정제는 세포 용해, 원심분리, 추출, 컬럼 크로마토그래피, 증류, 결정화 및 동결건조 중 하나 이상을 포함할 수 있다.

본 출원에 기재된 방법은 당업계에 공지된 임의의 칸나비노이드 또는 칸나비노이드 전구체의 생성을 포함한다. 본 출원에 개시된 임의의 재조합 세포, 또는 본 출원에 기재된 임의의 시험관내 방법에 의해 생성되는 칸나비노이드 또는 칸나비노이드 전구체는 당업계에 공지된 임의의 방법을 사용하여 확인 및 추출될 수 있다. 질량 분석법(예를 들어, LC-MS, GC-MS)은 확인 방법의 비제한적인 예이며 관심 화합물을 추출하는 데 사용될 수 있다.

일부 구현예에서, 본 출원에 기재된 임의의 방법은 칸나비노이드 또는 칸나비노이드 전구체의 탈카복실화를 추가로 포함한다. 비제한적인 예로서, 칸나비노이드 또는 칸나비노이드 전구체의 산 형태는 칸나비노이드 또는 칸나비노이드 전구체를 탈카복실화하기 위해 가열(예를 들어, 적어도 90℃)될 수 있다. 예를 들어, 미국 특허 번호 10,159,908, 미국 특허 번호 10,143,706, 미국 특허 번호 9,908,832 및 미국 특허 번호 7,344,736을 참조한다. 또한, 예를 들어, 문헌(Wang et al., Cannabis Cannabinoid Res. 2016; 1(1): 262 - 271)을 참조한다.

조성물, 키트, 및 투여

본 개시내용은 본 출원에 기재된 임의의 방법에 의해 생성된 칸나비노이드 또는 칸나비노이드 전구체, 또는 이의 약학적으로 허용되는 염, 및 임의로 약학적으로 허용되는 부형제를 포함하는 약학 조성물을 포함한 조성물을 제공한다.

특정 구현예에서, 본 출원에 기재된 칸나비노이드 또는 칸나비노이드 전구체는 약학 조성물과 같은 조성물에 유효량으로 제공된다. 특정 구현예에서, 유효량은 치료학적 유효량이다. 특정 구현예에서, 유효량은 예방학적 유효량이다.

본 출원에 기재된 약학 조성물과 같은 조성물은 당업계에 공지된 임의의 방법에 의해 제조될 수 있다. 일반적으로, 이러한 제조 방법은 본 출원에 기재된 화합물(예를 들어, "활성 성분")을 담체 또는 부형제, 및/또는 하나 이상의 다른 보조 성분과 회합되도록 하는 단계, 및 이어서 필요하고/하거나 바람직하다면, 바람직한 단일 용량 단위 또는 다중 용량 단위로 생성물을 성형 및/또는 포장하는 단계를 포함한다.

약학 조성물은 단일 단위 용량 및/또는 복수의 단일 단위 용량으로서 대량으로 제조, 포장 및/또는 판매될 수 있다. "단위 용량"은 소정량의 활성 성분을 포함하는 약학 조성물의 별개의 양이다. 활성 성분의 양은 일반적으로 대상체에게 투여될 활성 성분의 투여량 및/또는 이러한 투여량의 1/2 또는 1/3과 같은 이러한 투여량의 편리한 분획과 동일하다.

본 출원에 기재된 약학 조성물 중 활성 성분, 약학적으로 허용되는 부형제 및/또는 임의의 추가 성분의 상대적인 양은 치료 대상체의 정체, 크기, 및/또는 상태에 따라 그리고 조성물이 투여될 경로에 따라 추가로 달라질 것이다. 조성물은 0.1%와 100% (w/w) 사이의 활성 성분을 포함할 수 있다.

약학 조성물의 제조에 사용되는 약학적으로 허용되는 부형제는 불활성 희석제, 분산제 및/또는 과립화제, 표면 활성제 및/또는 유화제, 붕해제, 결합제, 방부제, 완충제, 윤활제 및/또는 오일을 포함한다. 코코아 버터 및 좌약 왁스와 같은 부형제, 착색제, 코팅제, 감미제, 향미제, 및 방향제가 또한 조성물에 존재할 수 있다. 예시적인 부형제는 본 출원에 개시된 바와 같은 희석제, 분산제 및/또는 과립화제, 표면 활성제 및/또는 유화제, 붕해제, 결합제, 방부제, 완충제, 윤활제, 및/또는 오일(예를 들어, 합성 오일, 반합성 오일)을 포함한다.

예시적인 희석제는 탄산칼슘, 탄산나트륨, 인산칼슘, 인산이칼슘, 황산칼슘, 인산수소칼슘, 인산나트륨 락토스, 수크로스, 셀룰로오스, 미정질 셀룰로오스, 카올린, 만니톨, 소르비톨, 이노시톨, 염화나트륨, 건조 전분, 옥수수 전분, 분말 설탕 및 이들의 혼합물을 포함한다.

예시적인 과립화제 및/또는 분산제는 감자 전분, 옥수수 전분, 타피오카 전분, 나트륨 전분 글리콜레이트, 점토, 알긴산, 구아 검, 감귤 펄프, 한천, 벤토나이트, 셀룰로오스, 및 목제품, 천연 스펀지, 양이온 교환 수지, 탄산칼슘, 규산염, 탄산나트륨, 가교결합된 폴리(비닐-피롤리돈) (크로스포비돈), 나트륨 카복시메틸 전분(나트륨 전분 글리콜레이트), 카복시메틸 셀룰로오스, 가교결합된 나트륨 카복시메틸 셀룰로오스(크로스카르멜로스), 메틸셀룰로오스, 전호화 전분(전분 1500), 미정질 전분, 수불용성 전분, 칼슘 카복시메틸 셀룰로오스, 마그네슘 알루미늄 실리케이트(Veegum), 나트륨 라우릴 설페이트, 4차 암모늄 화합물, 및 이들의 혼합물을 포함한다.

예시적인 표면 활성제 및/또는 유화제는 천연 유화제(예를 들어, 아카시아, 한천, 알긴산, 알긴산나트륨, 트라가칸트, 콘드룩스, 콜레스테롤, 크산탄, 펙틴, 젤라틴, 난황, 카제인, 양모지방, 콜레스테롤, 왁스, 레시틴), 콜로이드 점토(예를 들어, 벤토나이트(규산알루미늄) 및 Veegum(규산알루미늄 마그네슘)), 장쇄 아미노산 유도체, 고분자량 알코올(예를 들어, 스테아릴 알코올, 세틸 알코올, 올레일 알코올, 트리아세틴 모노스테아레이트, 에틸렌 글리콜 디스테아레이트, 글리세릴 모노스테아레이트, 및 프로필렌 글리콜 모노스테아레이트, 폴리비닐 알코올), 카보머(예를 들어, 카복시 폴리메틸렌, 폴리아크릴산, 아크릴산 중합체 및 카복시비닐 중합체), 카라기난, 셀룰로오스 유도체(예를 들어, 카복시메틸셀룰로오스 나트륨, 분말 셀룰로오스, 하이드록시메틸 셀룰로오스, 하이드록시프로필 셀룰로오스, 하이드록시프로필 메틸셀룰로오스, 메틸셀룰로오스), 소르비탄 지방산 에스테르(예를 들어, 폴리옥시에틸렌 소르비탄 모노라우레이트(Tween^® 20), 폴리옥시에틸렌 소르비탄(Tween^® 60), 폴리옥시에틸렌 소르비탄 모노올레에이트(Tween^® 80), 소르비탄 모노팔미테이트(Span^® 40), 소르비탄 모노스테아레이트(Span^® 60), 소르비탄 트리스테아레이트(Span^® 65), 글리세릴 모노올레에이트, 소르비탄 모노올레에이트(Span^® 80), 폴리옥시에틸렌 에스테르(예를 들어, 폴리옥시에틸렌 모노스테아레이트(Myrj^® 45), 폴리옥시에틸렌 경화 피마자유, 폴리에톡실화 피마자유, 폴리옥시메틸렌 스테아레이트, 및 Solutol^®), 수크로스 지방산 에스테르, 폴리에틸렌 글리콜 지방산 에스테르(예를 들어, Cremophor^®), 폴리옥시에틸렌 에테르(예를 들어, 폴리옥시에틸렌 라우릴 에테르(Brij^® 30)), 폴리(비닐-피롤리돈), 디에틸렌 글리콜 모노라우레이트, 트리에탄올아민 올레에이트, 올레산나트륨, 올레산칼륨, 올레산에틸, 올레산, 에틸 라우레이트, 나트륨 라우릴 설페이트, Pluronic^® F-68, 폴록사머 P-188, 브롬화세트리모늄, 염화세틸피리디늄, 염화벤잘코늄, 도쿠세이트 나트륨 및/또는 이들의 혼합물을 포함한다.

예시적인 결합제는 전분(예를 들어, 옥수수 전분 및 전분 페이스트), 젤라틴, 당(예를 들어, 수크로스, 글루코스, 덱스트로스, 덱스트린, 당밀, 락토스, 락티톨, 만니톨 등), 천연 및 합성 검(예를 들어, 아카시아, 알긴산나트륨, 아일랜드 이끼(Irish moss) 추출물, 판와르 검(panwar gum), 가티 검, 이사폴 껌집의 점액질, 카복시메틸셀룰로오스, 메틸셀룰로오스, 에틸셀룰로오스, 하이드록시에틸셀룰로오스, 하이드록시프로필 셀룰로오스, 하이드록시프로필 메틸셀룰로오스, 미정질 셀룰로오스, 셀룰로오스 아세테이트, 폴리(비닐-피롤리돈), 마그네슘 알루미늄 실리케이트(Veegum^®), 및 낙엽송 아라보갈락탄), 알지네이트, 폴리에틸렌 옥사이드, 폴리에틸렌 글리콜, 무기 칼슘 염, 규산, 폴리메타크릴레이트, 왁스, 물, 알코올, 및/또는 이들의 혼합물을 포함한다.

예시적인 방부제는 항산화제, 킬레이트제, 항미생물 방부제, 항진균 방부제, 항원충 방부제, 알코올 방부제, 산성 방부제, 및 기타 방부제를 포함한다. 특정 구현예에서, 방부제는 항산화제이다. 다른 구현예에서, 방부제는 킬레이트제이다.

예시적인 항산화제는 알파 토코페롤, 아스코르브산, 아코르빌 팔미테이트, 부틸화 하이드록시아니솔, 부틸화 하이드록시톨루엔, 모노티오글리세롤, 메타중아황산칼륨, 프로피온산, 프로필 갈레이트, 아스코르브산나트륨, 중아황산나트륨, 메타중아황산나트륨 및 아황산나트륨을 포함한다.

예시적인 킬레이트제는 에틸렌디아민테티라아세트산(EDTA) 및 이의 염 및 수화물(예를 들어, 에데트산나트륨, 에데트산이나트륨, 에데트산삼나트륨, 에데트산칼슘이나트륨, 에데트산이칼륨 등), 시트르산 및 이의 염 및 수화물(예를 들어, 시트르산 일수화물), 푸마르산 및 이의 염 및 수화물, 말산 및 이의 염 및 수화물, 인산 및 이의 염 및 수화물, 및 타르타르산 및 이의 염 및 수화물을 포함한다. 예시적인 항미생물 방부제는 염화벤잘코늄, 염화벤제토늄, 벤질 알코올, 브로노폴, 세트리미드, 세틸피리디늄 클로라이드, 클로르헥시딘, 클로로부탄올, 클로로크레졸, 클로록실레놀, 크레졸, 에틸 알코올, 글리세린, 헥세티딘, 이미두레아, 페놀, 페녹시에탄올, 페닐에틸 알코올, 질산페닐수은, 프로필렌 글리콜 및 티메로살을 포함한다.

예시적인 항진균 방부제는 부틸 파라벤, 메틸 파라벤, 에틸 파라벤, 프로필 파라벤, 벤조산, 하이드록시벤조산, 벤조산칼륨, 소르브산칼륨, 벤조산나트륨, 프로피온산타륨, 및 소르브산을 포함한다.

예시적인 알코올 방부제는 에탄올, 폴리에틸렌 글리콜, 페놀, 페놀 화합물, 비스페놀, 클로로부탄올, 하이드록시벤조에이트, 및 페닐에틸 알코올을 포함한다.

예시적인 산성 방부제는 비타민 A, 비타민 C, 비타민 E, 베타-카로틴, 시트르산, 아세트산, 데하이드로아세트산, 아스코르브산, 소르브산 및 피트산(phytic acid)을 포함한다.

다른 방부제는 토코페롤, 토코페롤 아세테이트, 데테록심 메실레이트, 세트리미드, 부틸화 하이드록시아니솔(BHA), 부틸화 하이드록시톨루엔(BHT), 에틸렌디아민, 나트륨 라우릴 설페이트(SLS), 나트륨 라우릴 에테르 설페이트(SLES), 중아황산나트륨, 메타중아황산나트륨, 아황산칼륨, 메타중아황산칼륨, Glydant^® Plus, Phenonip^®, 메틸파라벤, Germall^® 115, Germaben^® II, Neolone^®, Kathon^®, 및 Euxyl^®을 포함한다.

예시적인 완충제는 시트레이트 완충 용액, 아세테이트 완충 용액, 포스페이트 완충 용액, 염화암모늄, 탄산칼슘, 염화칼슘, 시트르산칼슘, 글루비온산칼슘, 글루셉산칼슘, 글루콘산칼슘, D-글루콘산, 글리세로인산칼슘, 락트산칼슘, 프로판산, 레불린산칼슘, 펜탄산, 이염기성 인산칼슘, 인산, 삼염기성 인산칼슘, 수산화칼슘 인산염, 아세트산칼륨, 염화칼륨, 글루콘산칼륨, 칼륨 혼합물, 이염기성 인산칼륨, 일염기성 인산칼륨, 인산칼륨 혼합물, 아세트산나트륨, 중탄산나트륨, 염화나트륨, 시트르산나트륨, 락트산나트륨, 이염기성 인산나트륨, 일염기성 인산나트륨, 인산나트륨 혼합물, 트로메타민, 수산화마그네슘, 수산화알루미늄, 알긴산, 발열원 없는 물, 등장 식염수, 링거액, 에틸 알코올, 및 이들의 혼합물을 포함한다.

예시적인 윤활제는 마그네슘 스테아레이트, 칼슘 스테아레이트, 스테아르산, 실리카, 활석, 맥아, 글리세릴 베헤네이트, 경화 식물성 오일, 폴리에틸렌 글리콜, 벤조산나트륨, 아세트산나트륨, 염화나트륨, 류신, 마그네슘 라우릴 설페이트, 나트륨 라우릴 설페이트, 및 이들의 혼합물을 포함한다.

예시적인 천연 오일은 아몬드, 살구씨, 아보카도, 바바수야자나무(babassu), 베르가못, 블랙 커런트 씨(black current seed), 서양지치(borage), 케이드(cade), 카밀레(camomile), 캐놀라, 캐러웨이(caraway), 카나우바, 피마자, 계피, 코코아 버터, 코코넛, 대구 간, 커피, 옥수수, 목화씨, 에뮤(emu), 유칼립투스, 달맞이꽃, 생선, 아마씨, 게라니올(geraniol), 박(gourd), 포도씨, 헤이즐넛, 우슬초, 이소프로필 미리스테이트, 호호바, 쿠쿠이넛(kukui nut), 라반딘, 라벤더, 레몬, 리체아 큐베바(litsea cubeba), 마카데미아 넛, 당아욱(mallow), 망고 씨, 메도우폼 씨(meadowfoam seed), 밍크, 육두구(nutmeg), 올리브, 오렌지, 오렌지 러피(orange roughy), 팜, 팜 커널, 복숭아 커널, 땅콩, 양귀비씨, 호박씨, 유채, 쌀겨, 로즈마리, 잇꽃, 백단, 사스콰나(sasquana), 세이버리, 바다 갈매 나무속(sea buckthorn), 참깨, 시어 버터, 실리콘, 대두, 해바라기, 티 트리(tea tree), 엉겅퀴, 츠바키(tsubaki), 베티버, 호두 및 밀 배아 오일을 포함한다. 예시적인 합성 또는 반합성 오일은 부틸 스테아레이트, 중쇄 트리글리세리드(예컨대 카프릴산 트리글리세리드 및 카프르산 트리글리세리드), 사이클로메티콘, 디에틸 세바케이트, 디메티콘 360, 이소프로필 미리스테이트, 미네랄 오일, 옥틸도데칸올, 올레일 알코올, 실리콘 오일 및 이들의 혼합물을 포함하지만 이에 제한되지 않는다. 특정 구현예에서, 예시적인 합성 오일은 중쇄 트리글리세리드(예컨대 카프릴산 트리글리세리드 및 카프릴산 트리글리세리드)를 포함한다.

경구 및 비경구 투여를 위한 액체 투여 형태는 약학적으로 허용되는 에멀젼, 마이크로에멀젼, 용액, 현탁액, 시럽 및 엘릭시르를 포함한다. 활성 성분 이외에, 액체 투여 형태는, 예를 들어, 물 또는 기타 용매, 가용화제 및 유화제, 예컨대 에틸 알코올, 이소프로필 알코올, 에틸 카보네이트, 에틸 아세테이트, 벤질 알코올, 벤질 벤조에이트, 프로필렌 글리콜, 1,3-부틸렌 글리콜, 디메틸포름아미드, 오일(예를 들어, 면실유, 땅콩유, 옥수수유, 배아유, 올리브유, 피마자유 및 참기름), 글리세롤, 테트라하이드로푸르푸릴 알코올, 폴리에틸렌 글리콜 및 소르비탄의 지방산 에스테르, 및 이들의 혼합물과 같은 당업계에 일반적으로 사용되는 불활성 희석제를 포함할 수 있다. 불활성 희석제 이외에, 경구 조성물은 습윤제, 유화제 및 현탁제, 감미제, 향미제 및 방향제와 같은 애쥬번트를 포함할 수 있다. 비경구 투여를 위한 특정 구현예에서, 본 출원에 기재된 접합체는 Cremophor®, 알코올, 오일, 개질된 오일, 글리콜, 폴리소르베이트, 사이클로덱스트린, 중합체 및 이들의 혼합물과 같은 가용화제와 혼합된다.

주사 가능한 제제, 예를 들어, 멸균 주사 가능한 수성 또는 유성 현탁액은 적합한 분산제 또는 습윤제 및 현탁제를 사용하여 공지된 기술에 따라 제형화될 수 있다. 멸균 주사 가능한 제제는 무독성 비경구적으로 허용되는 희석제 또는 용매 중의 멸균 주사 가능한 용액, 현탁액 또는 에멀젼, 예를 들어 1,3-부탄디올 중의 용액일 수 있다. 사용될 수 있는 허용되는 비히클 및 용매 중에는 물, 링거액, USP 및 등장성 염화나트륨 용액이 있다. 또한, 멸균 고정유는 통상적으로 용매 또는 현탁 매질로서 사용된다. 이를 위해, 합성 모노- 또는 디-글리세리드를 포함한 임의의 무자극(bland) 고정유가 사용될 수 있다. 또한, 주사제의 제조에는 올레산과 같은 지방산이 사용된다.

주사 가능한 제형은, 예를 들어, 박테리아-보유 필터를 통한 여과에 의해, 또는 사용 전에 멸균수 또는 다른 멸균 주사 가능한 매질에 용해 또는 분산될 수 있는 멸균 고체 조성물의 형태로 멸균제를 혼입함으로써 멸균될 수 있다.

약물의 효과를 연장하기 위해, 종종 피하 또는 근육내 주사로부터 약물의 흡수를 늦추는 것이 바람직하다. 이는 불량한 수용성의 결정질 또는 무정형 물질의 액체 현탁액을 사용하여 달성될 수 있다. 이어서, 약물의 흡수 속도는 용해 속도에 따라 달라지며, 이는 차례로 결정 크기와 결정질 형태에 따라 달라질 수 있다. 대안적으로, 비경구 투여된 약물 형태의 지연된 흡수는 오일 비히클에 약물을 용해 또는 현탁시킴으로써 달성될 수 있다.

직장 또는 질 투여용 조성물은 전형적으로, 주위 온도에서는 고체이지만 체온에서는 액체이므로 직장 또는 질강에서 용해되어 활성 성분을 방출하는, 본 출원에 기재된 접합체를 적합한 비자극성 부형제 또는 담체, 예컨대 코코아 버터, 폴리에틸렌 글리콜, 또는 좌약 왁스와 혼합하여 제조될 수 있는 좌약이다.

경구 투여용 고체 투여 형태는 캡슐, 정제, 환제, 분말 및 과립을 포함한다. 이러한 고체 투여 형태에서, 활성 성분은 적어도 하나의 불활성, 약학적으로 허용되는 부형제 또는 담체, 예컨대 시트르산나트륨 또는 인산이칼슘 및/또는 (a) 충전제 또는 증량제, 예컨대 전분, 락토스, 수크로스, 글루코스, 만니톨, 및 규산, (b) 결합체, 예를 들어, 카복시메틸셀룰로오스, 알지네이트, 젤라틴, 폴리비닐피롤리디논, 수크로스, 및 아카시아, (c) 보습제, 예컨대 글리세롤, (d) 붕해제, 예컨대 한천, 탄산칼슘, 감자 또는 타피오카 전분, 알긴산, 특정 규산염 및 탄산나트륨, (e) 용액 지연제, 예컨대 파라핀, (f) 흡수 촉진제, 예컨대 4차 암모늄 화합물, (g) 습윤제, 예를 들어, 세틸 알코올 및 글리세롤 모노스테아레이트, (h) 흡수제, 예컨대 카올린 및 벤토나이트 점토, 및 (i) 윤활제, 예컨대 활석, 칼슘 스테아레이트, 마그네슘 스테아레이트, 나트륨 폴리에틸렌 글리콜, 나트륨 라우릴 설페이트, 및 이들의 혼합물과 혼합된다. 캡슐, 정제, 및 환제의 경우, 투여 형태는 완충제를 포함할 수 있다.

유사한 유형의 고체 조성물은 고분자량 폴리에틸렌 글리콜 등뿐만 아니라 락토스 또는 유당과 같은 부형제를 사용하여 연질 및 경질-충전된 젤라틴 캡슐에서 충전제로서 사용될 수 있다. 정제, 당의정, 캡슐, 환제, 및 과립의 고체 투여 형태는 장용 코팅 및 약리학 분야에 익히 공지된 기타 코팅과 같은 코팅 및 쉘로 제조될 수 있다. 이들은 임의로 불투명화제를 포함할 수 있고 활성 성분(들)만을 또는 우선적으로 장관의 특정 부분에서 임의로 지연된 방식으로 방출하는 조성물일 수 있다. 사용될 수 있는 캡슐화 조성물의 예는 중합체 물질 및 왁스를 포함한다. 유사한 유형의 고체 조성물은 고분자량 폴리에틸렌 글리콜 등뿐만 아니라 락토스 또는 유당과 같은 부형제를 사용하여 연질 및 경질-충전된 젤라틴 캡슐에서 충전제로서 사용될 수 있다.

활성 성분은 상기 언급된 바와 같이 하나 이상의 부형제와 함께 마이크로-캡슐화된 형태일 수 있다. 정제, 당의정, 캡슐, 환제, 및 과립의 고체 투여 형태는 장용 코팅, 방출 제어 코팅, 및 제약 제형화 분야에서 익히 공지된 기타 코팅과 같은 코팅 및 쉘로 제조될 수 있다. 이러한 고체 투여 형태에서, 활성 성분은 수크로스, 락토스 또는 전분과 같은 적어도 하나의 불활성 희석제와 혼합될 수 있다. 이러한 투여 형태는 일반적인 관행에서와 같이 불활성 희석제 이외의 추가 물질, 예를 들어, 정제화 윤활제 및 기타 정제화 보조제, 예컨대 마그네슘 스테아레이트 및 미정질 셀룰로오스를 포함할 수 있다. 캡슐, 정제 및 환제의 경우, 투여 형태는 완충제를 포함할 수 있다. 이들은 임의로 불투명화제를 포함할 수 있고 활성 성분(들)만을 또는 우선적으로 장관의 특정 부분에서 임의로 지연된 방식으로 방출하는 조성물일 수 있다. 사용할 수 있는 캡슐화제의 예는 중합체 물질 및 왁스를 포함한다.

본 출원에 기재된 화합물의 국소 및/또는 경피 투여를 위한 투여 형태는 연고, 페이스트, 크림, 로션, 겔, 분말, 용액, 스프레이, 흡입제 및/또는 패치를 포함할 수 있다. 일반적으로, 활성 성분은 멸균 조건 하에 약학적으로 허용되는 담체 또는 부형제 및/또는 요구될 수 있는 임의의 필요한 방부제 및/또는 완충제와 혼합된다. 추가로, 본 개시내용은 종종 신체에 활성 성분의 제어된 전달을 제공하는 추가 이점을 갖는 경피 패치의 사용을 고려한다. 이러한 투여 형태는, 예를 들어, 활성 성분을 적절한 매질에 용해 및/또는 분배함으로써 제조될 수 있다. 대안적으로 또는 추가로, 속도는 속도 조절 막을 제공하고/하거나 활성 성분을 중합체 매트릭스 및/또는 겔에 분산시킴으로써 조절될 수 있다.

본 출원에 기재된 피내 약학 조성물을 전달하는 데 사용하기에 적합한 장치는 짧은 바늘 장치를 포함한다. 피내 조성물은 피부로의 바늘의 유효 침투 길이를 제한하는 장치에 의해 투여될 수 있다. 대안적으로 또는 추가로, 통상적인 주사기는 피내 투여의 고전적인 망투(mantoux) 방법에서 사용될 수 있다. 액체 제트 주입기를 통해 및/또는 각질층을 관통하고 진피에 도달하는 제트를 생성하는 바늘을 통해 액체 제형을 진피에 전달하는 제트 주입 장치가 적합하다. 압축 가스를 사용하여 피부의 외부 층을 통해 진피까지 분말 형태의 화합물을 가속화하는 탄도 분말/입자 전달 장치가 적합하다.

국소 투여에 적합한 제형은 액체 및/또는 반액체 제제, 예컨대 도찰제, 로션, 수중유 및/또는 유중수 에멀젼, 예컨대 크림, 연고, 및/또는 페이스트, 및/또는 용액 및/또는 현탁액을 포함하지만 이에 제한되지 않는다. 국소 투여 가능한 제형은, 예를 들어, 약 1% 내지 약 10% (w/w) 활성 성분을 포함할 수 있지만, 활성 성분의 농도는 용매 중의 활성 성분의 용해도 한계만큼 높을 수 있다. 국소 투여용 제형은 본 출원에 기재된 추가 성분 중 하나 이상을 추가로 포함할 수 있다.

본 출원에 기재된 약학 조성물은 협측강을 통한 폐 투여에 적합한 제형으로 제조, 포장 및/또는 판매될 수 있다. 이러한 제형은 활성 성분을 포함하고 약 0.5 내지 약 7 나노미터, 또는 약 1 내지 약 6 나노미터 범위의 직경을 갖는 건조 입자를 포함할 수 있다. 이러한 조성물은 분말을 분산시키기 위해 추진제의 스트림이 지향될 수 있는 건조 분말 저장소를 포함하는 장치를 사용하고/하거나 밀봉된 용기 내의 저비점 추진제에 용해 및/또는 현탁된 활성 성분을 포함하는 장치와 같은 자체 추진 용매/분말 분배 용기를 사용하여 투여하기 위한 건조 분말 형태로 편리하게 존재한다. 이러한 분말은 중량 기준으로 입자의 적어도 98%가 0.5 나노미터 초과의 직경을 갖고 개수 기준으로 입자의 적어도 95%가 7 나노미터 미만의 직경을 갖는 입자를 포함한다. 대안적으로, 중량 기준으로 입자의 적어도 95%는 1 나노미터 초과의 직경을 갖고, 개수 기준으로 입자의 적어도 90%는 6 나노미터 미만의 직경을 갖는다. 건조 분말 조성물은 당과 같은 고체 미세 분말 희석제를 포함할 수 있고 단위 용량 형태로 편리하게 제공된다.

저비점 추진제는 일반적으로 대기압에서 65°F 미만의 비점을 갖는 액체 추진제를 포함한다. 일반적으로, 추진제는 조성물의 50 내지 99.9% (w/w)를 구성할 수 있고, 활성 성분은 조성물의 0.1 내지 20% (w/w)를 구성할 수 있다. 추진제는 액체 비이온성 및/또는 고체 음이온성 계면활성제 및/또는 고체 희석제(활성 성분을 포함하는 입자와 동일한 차수의 입자 크기를 가질 수 있음)와 같은 추가 성분을 추가로 포함할 수 있다.

본 출원에 제공된 약학 조성물에 대한 설명은 주로 인간에게 투여하기에 적합한 약학 조성물에 관한 것이지만, 이러한 조성물은 일반적으로 모든 종류의 동물에 투여하기에 적합하다는 것이 당업자에 의해 이해될 것이다. 다양한 동물에 대한 투여에 적합한 조성물을 만들기 위한 인간에 대한 투여에 적합한 약학 조성물의 변형은 잘 이해되며, 통상의 숙련된 수의 약리학자는 일반적인 실험을 통해 이러한 변형을 설계 및/또는 수행할 수 있다.

본 출원에서 제공된 화합물은 전형적으로 투여의 용이성과 투여량의 균일성을 위해 투여 단위 형태로 제형화된다. 그러나, 본 출원에 기재된 조성물의 총 1일 사용량은 건전한 의학적 판단의 범위 내에서 의사에 의해 결정될 것임을 이해할 것이다. 임의의 특정 대상체 또는 유기체에 대한 특정 치료적 유효 용량 수준은 치료되는 질환 및 장애의 중증도를 포함하는 다양한 인자; 사용된 특정 활성 성분의 활성; 사용된 특정 조성; 대상체의 연령, 체중, 일반적인 건강, 성별 및 식단; 사용된 특정 활성 성분의 투여 시간, 투여 경로 및 배설 속도; 치료 기간; 사용된 특정 활성 성분과 함께 또는 동시에 사용되는 약물; 및 의학계에서 익히 공지된 유사 인자에 따라 달라질 것이다.

본 출원에서 제공되는 화합물 및 조성물은 장내(예를 들어, 경구), 비경구, 정맥내, 근육내, 동맥내, 골수내, 척수내, 피하, 뇌실내, 경피, 피내, 직장, 질내, 복강내, 국소(분말, 연고, 크림, 및/또는 점적제에 의해), 점막, 비강, 협측, 설하를 포함한 임의의 경로에 의해; 기관내 점적, 기관지 점적 및/또는 흡입에 의해; 및/또는 경구 스프레이, 비강 스프레이, 및/또는 에어로졸에 의해 투여될 수 있다. 구체적으로 고려되는 경로는 경구 투여, 정맥내 투여(예를 들어, 전신 정맥내 주사), 혈액 및/또는 림프 공급을 통한 국소(regional) 투여, 및/또는 환부로의 직접 투여이다. 일반적으로, 가장 적절한 투여 경로는 제제의 성질(예를 들어, 위장관 환경에서의 안정성) 및/또는 대상체의 상태(예를 들어, 대상체가 경구 투여를 견딜 수 있는지 여부)를 포함한 다양한 인자에 따라 달라질 것이다.

일부 구현예에서, 본 출원에 개시된 화합물 또는 조성물은 나노입자로 제형화되고/되거나 투여된다. 나노입자는 나노규모의 입자이다. 일부 구현예에서, 나노입자는 직경이 1 μm 미만이다. 일부 구현예에서, 나노입자는 직경이 약 1 nm와 100 nm 사이이다. 나노입자는 덴드리머, 리포솜 또는 중합체 나노입자와 같은 유기 나노입자를 포함한다. 나노입자는 또한 풀러렌, 양자점 및 금 나노입자와 같은 무기 나노입자를 포함한다. 조성물은 나노입자의 응집체를 포함할 수 있다. 일부 구현예에서, 나노입자의 응집체는 균질한 반면, 다른 구현예에서, 나노입자의 응집체는 이질적이다.

유효량을 달성하는 데 필요한 화합물의 정확한 양은, 예를 들어, 대상체의 종, 연령 및 일반적인 상태, 부작용 또는 장애의 중증도, 특정 화합물의 실체, 투여 방식 등에 따라 대상체마다 다를 것이다. 유효량은 단일 용량(예를 들어, 단일 경구 용량) 또는 다중 용량(예를 들어, 다중 경구 용량)에 포함될 수 있다. 특정 구현예에서, 다중 용량이 대상체에게 투여되거나 조직 또는 세포에 적용되는 경우, 다중 용량의 임의의 2회 용량은 본 출원에 기재된 화합물의 상이하거나 실질적으로 동일한 양을 포함한다. 특정 구현예에서, 다중 용량이 대상체에게 투여되거나 조직 또는 세포에 적용되는 경우, 대상체에게 다중 용량을 투여하거나 조직 또는 세포에 다중 용량을 적용하는 빈도는 1일 3회 용량, 1일 2회 용량, 1일 1회 용량, 격일에 1회 용량, 3일에 1회 용량, 매주 1회 용량, 2주에 1회 용량, 3주에 1회 용량, 또는 4주에 1회 용량이다. 특정 구현예에서, 대상체에게 다중 용량을 투여하거나 조직 또는 세포에 다중 용량을 적용하는 빈도는 1일에 1회 용량이다. 특정 구현예에서, 대상체에게 다중 용량을 투여하거나 조직 또는 세포에 다중 용량을 적용하는 빈도는 1일에 2회 용량이다. 특정 구현예에서, 대상체에게 다중 용량을 투여하거나 조직 또는 세포에 다중 용량을 적용하는 빈도는 1일에 3회 용량이다. 특정 구현예에서, 다중 용량이 대상체에게 투여되거나 조직 또는 세포에 적용되는 경우, 다중 용량의 제1 투여와 마지막 투여 사이의 기간은 1일, 2일, 4일, 1주, 2주, 3주, 1개월, 2개월, 3개월, 4개월, 6개월, 9개월, 1년, 2년, 3년, 4년, 5년, 7년, 10년, 15년, 20년, 또는 대상체, 조직 또는 세포의 수명이다. 특정 구현예에서, 다중 용량의 제1 용량과 마지막 용량 사이의 기간은 3개월, 6개월 또는 1년이다. 특정 구현예에서, 다중 용량의 제1 용량과 마지막 용량 사이의 기간은 대상체, 조직 또는 세포의 수명이다. 특정 구현예에서, 본 출원에 기재된 용량(예를 들어, 단일 용량, 또는 다중 용량의 임의의 용량)은 독립적으로 0.1 μg에서 1 μg까지, 0.001 mg에서 0.01 mg까지, 0.01 mg에서 0.1 mg까지, 0.1 mg에서 1 mg까지, 1 mg에서 3 mg까지, 3 mg에서 10 mg까지, 10 mg에서 30 mg까지, 30 mg에서 100 mg까지, 100 mg에서 300 mg까지, 300 mg에서 1,000 mg까지, 또는 1 g에서 10 g까지의 본 출원에 기재된 화합물을 포함한다. 특정 구현예에서, 본 출원에 기재된 용량은 독립적으로 1 mg에서 3 mg까지의 본 출원에 기재된 화합물을 포함한다. 특정 구현예에서, 본 출원에 기재된 용량은 독립적으로 3 mg에서 10 mg까지의 본 출원에 기재된 화합물을 포함한다. 특정 구현예에서, 본 출원에 기재된 용량은 독립적으로 10 mg에서 30 mg까지의 본 출원에 기재된 화합물을 포함한다. 특정 구현예에서, 본 출원에 기재된 용량은 독립적으로 30 mg에서 100 mg까지의 본 출원에 기재된 화합물을 포함한다.

본 출원에 기재된 용량 범위는 제공된 약학 조성물을 성인에게 투여하기 위한 지침서를 제공한다. 예를 들어, 어린이 또는 청소년에게 투여되는 양은 의료 종사자 또는 당업자에 의해 결정될 수 있고 성인에게 투여되는 양보다 더 낮거나 동일할 수 있다.

본 출원에 기재된 바와 같은 화합물 또는 조성물은 하나 이상의 추가 약제(예를 들어, 치료적 및/또는 예방적 활성제)와 조합하여 투여될 수 있다. 화합물 또는 조성물은 이들의 활성을 개선하고, 생체이용률을 개선하고, 안전성을 개선하고, 약물 내성을 감소시키고, 대사를 감소 및/또는 변형하고, 배설을 억제하고/하거나 대상체 또는 세포에서 분포를 변형시키는 추가 약제와 조합하여 투여될 수 있다. 또한 사용된 요법이 동일한 장애에 대해 원하는 효과를 달성할 수 있고/있거나 상이한 효과를 달성할 수 있음을 인식할 것이다. 특정 구현예에서, 본 출원에 기재된 화합물 및 추가 약제를 포함하는 본 출원에 기재된 약학 조성물은 화합물 및 추가 약제 중 하나를 포함하지만 둘 모두가 아닌 약학 조성물에 없는 상승 효과를 나타낸다.

화합물 또는 조성물은, 예를 들어, 조합 요법으로서 유용할 수 있는 하나 이상의 추가 약제와 동시에, 그 이전에 또는 이후에 투여될 수 있다. 약제는 치료적 활성제를 포함한다. 약제는 또한 예방적 활성제를 포함한다. 약제는 작은 유기 분자, 예컨대 약물 화합물(예를 들어, 연방규정집(Code of Federal Regulations: CFR)에 제공된 바와 같이 미국 식품의약국(U.S. Food and Drug Administration)에 의한 인간 또는 동물용으로 승인된 화합물), 펩티드, 단백질, 탄수화물, 모노사카라이드, 올리고사카라이드, 폴리사카라이드, 핵단백질, 점액단백질, 지단백질, 합성 폴리펩티드 또는 단백질, 단백질에 연결된 소분자, 당단백질, 스테로이드, 핵산, DNA, RNA, 뉴클레오티드, 뉴클레오시드, 올리고뉴클레오티드, 안티센스 올리고뉴클레오티드, 지질, 호르몬, 비타민 및 세포를 포함한다. 특정 구현예에서, 추가 약제는 질환(예를 들어, 증식성 질환, 신경학적 질환, 통증 병태, 정신 장애 또는 대사 장애)을 치료 및/또는 예방하는 데 유용한 약제이다. 각각의 추가 약제는 해당 약제에 대해 결정된 용량 및/또는 시간 스케줄에 따라 투여될 수 있다. 추가 약제는 또한 단일 용량으로 서로 및/또는 본 출원에 기재된 화합물 또는 조성물과 함께 투여되거나 상이한 용량으로 개별적으로 투여될 수 있다. 용법에서 사용하기 위한 특정 조합은 본 출원에 기재된 화합물과 추가 약제(들)의 상용성 및/또는 달성하고자 하는 원하는 치료 및/또는 예방 효과를 고려할 것이다. 일반적으로, 추가 약제(들)를 조합하여 이들의 개별적으로 사용되는 수준을 초과하지 않는 수준으로 사용할 것으로 예상된다. 일부 구현예에서, 조합하여 사용되는 수준은 개별적으로 사용되는 수준보다 더 낮을 것이다.

일부 구현예에서, 본 출원에 기재된 하나 이상의 조성물이 대상체에게 투여된다. 특정 구현예에서, 대상체는 동물이다. 동물은 두 성별 모두일 수 있고 어떠한 발달 단계에도 있을 수 있다. 특정 구현예에서, 대상체는 인간이다. 다른 구현예에서, 대상체는 비인간 동물이다. 특정 구현예에서, 대상체는 포유동물이다. 특정 구현예에서, 대상체는 비인간 포유동물이다. 특정 구현예에서, 대상체는 가축, 예컨대 개, 고양이, 소, 돼지, 말, 양, 닭, 또는 염소이다. 특정 구현예에서, 대상체는 반려 동물, 예컨대 개 또는 고양이이다. 특정 구현예에서, 대상체는 가축, 예컨대 소, 돼지, 말, 양, 닭, 또는 염소이다. 특정 구현예에서, 대상체는 동물원 동물이다. 또 다른 구현예에서, 대상체는 연구 동물, 예컨대 설치류(예를 들어, 마우스, 래트), 개, 돼지, 또는 인간 이외의 영장류이다.

또한 본 개시내용에 포함되는 것은 키트(예를 들어, 약학적 팩)이다. 제공된 키트는 조성물, 예컨대 약학 조성물, 또는 본 출원에 기재된 화합물 및 용기(예를 들어, 바이알, 앰풀, 병, 주사기 및/또는 디스펜서 패키지, 또는 기타 적합한 용기)를 포함할 수 있다. 일부 구현예에서, 제공된 키트는 임의로 본 출원에 기재된 약학 조성물 또는 화합물의 희석 또는 현탁액을 위한 약학적 부형제를 포함하는 제2 용기를 추가로 포함할 수 있다. 일부 구현예에서, 제1 용기 및 제2 용기에 제공된 본 출원에 기재된 약학 조성물 또는 화합물은 조합되어 하나의 단위 투여 형태를 형성한다.

따라서, 한 양태에서, 본 출원에 기재된 화합물 또는 조성물을 포함하는 제1 용기를 포함하는 키트가 제공된다. 특정 구현예에서, 키트는 이를 필요로 하는 대상체에서 질환을 치료하는 데 유용하다. 특정 구현예에서, 키트는 이를 필요로 하는 대상체에서 질환을 예방하는 데 유용하다. 특정 구현예에서, 키트는 이를 필요로 하는 대상체에서 질환이 발병할 위험을 감소시키는 데 유용하다.

특정 구현예에서, 본 출원에 기재된 키트는 키트를 사용하기 위한 지침서를 추가로 포함한다. 본 출원에 기재된 키트는 미국 식품의약국(FDA)과 같은 규제 기관에 의해 요구되는 정보를 포함할 수도 있다. 특정 구현예에서, 키트에 포함된 정보는 처방 정보이다. 특정 구현예에서, 키트 및 지침서는 이를 필요로 하는 대상체에서 질환을 치료하기 위해 제공된다. 특정 구현예에서, 키트 및 지침서는 이를 필요로 하는 대상체에서 질환을 예방하기 위해 제공된다. 특정 구현예에서, 키트 및 지침서는 이를 필요로 하는 대상체에서 질환이 발병할 위험을 감소시키기 위해 제공된다. 본 출원에 기재된 키트는 별도의 조성물로서 본 출원에 기재된 하나 이상의 추가 약제를 포함할 수 있다.

일부 구현예에서, 조성물은 소비재, 예컨대 식료품, 화장품, 세면도구, 음용 가능, 흡입 가능 및 웰빙 제품을 포함한다. 예시적인 소비재는 연고, 왁스, 분말 농축액, 페이스트, 추출물, 팅크제(tincture), 분말, 오일, 캡슐, 피부 패치, 설하 경구 용량 점적제, 점막 경구 스프레이 용량, 메이크업, 향수, 샴푸, 화장품 비누, 화장품 크림, 스킨 로션, 아로마 에센셜 오일, 마사지 오일, 면도용 제제, 세면용 오일, 립밤, 화장품 오일, 세안 워시, 보습 크림, 보습 바디 로션, 보습 페이스 로션, 목욕 소금, 목욕 젤, 액체 형태의 목욕 비누, 샤워 젤, 배스 밤(bath bomb), 헤어 케어 제제, 샴푸, 컨디셔너, 초콜릿 바, 브라우니, 초콜릿, 쿠키, 크래커, 케이크, 컵케이크, 푸딩, 꿀, 초콜릿 과자, 냉동 과자, 과일 기반 과자, 설탕 과자, 젤리 사탕, 당의정, 패스트리, 시리얼 바, 초콜릿, 시리얼 기반 에너지 바, 사탕, 아이스크림, 차 기반 음료, 커피 기반 음료 및 허브 주입물을 포함한다.

본 발명은 하기 실시예에 의해 추가로 예시되며, 이는 결코 제한하는 것으로 해석되어서는 안 된다. 본 출원 전반에 걸쳐 인용된 모든 참조(문헌 참조, 허여된 특허, 공개 특허 출원 및 계류중 특허 출원 포함)의 전체 내용은 본원에 명시적으로 참조로 포함된다. 본 출원에 포함된 참조는 그 정의가 본 개시내용에서 정의된 것과 동일한 용어의 정의와 모순되거나 양립할 수 없는 용어를 포함하는 경우, 본 개시내용의 용어에 부여된 의미가 우선될 것이다. 그러나, 본 출원에 인용된 임의의 참조, 논물, 공개물, 특허, 특허 공보 및 특허 출원에 대한 언급은 이들이 유효한 선행 기술을 구성하거나 전 세계 모든 국가에서 공통 일반 지식의 일부를 형성한다는 제안의 임의의 형태 또는 승인으로서 간주되어서는 안된다.

실시예

실시예 1: 칸나비크로멘산 신타제(CBCAS)의 기능적 발현을 확인하기 위한 1차 고처리량 스크린

숙주 세포에서 기능적으로 발현될 수 있는 CBCAS 유전자를 확인하기 위해, 약 3000개의 후보 CBCAS 유전자의 라이브러리는 내부 코드베이스 및 도메인 지식을 기반으로 설계되었으며, 효소 패밀리, 생태적 지위(ecological niche) 및 구조적 상동성에 걸쳐 샘플링되었다. 단백질 서열은 에스. 세레비지아에에서의 발현을 위해 인 실리코로 기록되었고 도 5에 나타낸 통합 효모 발현 벡터에서 합성되었다. 각각의 후보 효소 발현 작제물은 도 2에서 반응 R4를 촉매할 수 있는 프레닐트랜스퍼라제 효소를 또한 발현하는 에스. 세레비지아에 CEN PK 균주로 형질전환되었다. GFP를 발현하는 균주 t616313은 효소 활성에 대한 음성 대조군으로서 라이브러리 스크린에 포함되었다.

이전에 개시된 추정 씨. 사티바 CBCAS 효소는 활성인 것으로 밝혀지지 않았다. 대신에, 씨. 사티바 THCAS 효소(서열번호 23에 기재됨)는 본 실시예에 기재된 검정을 사용하여 THCAS 활성 이외에 CBCAS 활성을 나타내는 것으로 밝혀졌으며, 따라서 CBCAS 활성에 대한 양성 대조군(균주 t616315)으로서 사용되었다. 라이브러리의 모든 후보 효소뿐만 아니라 양성 대조군 균주 t616315에 의해 발현된 효소는 N-말단 MF알파2 신호 펩티드(서열번호 16), (MF알파2 신호 펩티드의 N-말단에 부가된 메티오닌 잔기 포함), 및 C-말단 HDEL 신호 펩티드(서열번호 17)를 포함하였다.

TS 활성을 검출하기 위한 검정을 다음과 같이 수행하였다: 후보 CBCAS 형질전환체의 해동된 글리세롤 스톡 각각을 YEP + 4% 덱스트로스 배지의 웰에 스탬핑하였다. 샘플을 2일 동안 진탕 인큐베이터에서 30℃에서 인큐베이션하였다. 생성된 배양물 각각의 일부를 YEP + 4% 갈락토스 + 1 mM 올리베톨산의 웰에 스탬핑하였다(도 1 구조 6a). 샘플을 20℃에서 인큐베이션하고 진탕 인큐베이터에서 4일 동안 진탕하였다. 그 4일 동안 24시간마다 2% 갈락토오스와 1 mM 올리베톨산을 배양액에 첨가하였다. pH 5.5로 조정된 시트르산나트륨 완충액을 100 mM의 최종 농도로 각 웰에 첨가하였다. 샘플을 20℃에서 인큐베이션하고 진탕 인큐베이터에서 2일 동안 진탕하였다. 생성된 생성물 배양물 각각의 일부를 인산염 완충 식염수(PBS)의 웰에 스탬핑하였다. 광학 측정은 플레이트 판독기에서 수행되었으며 이때 흡광도는 600 nm에서 측정되었고 485 nm의 여기로 형광은 528 nm에서 측정되었다. 샘플을 2일 동안 진탕 인큐베이터에서 30℃에서 인큐베이션하였다. 100% 메탄올을 절반-높이 딥웰 플레이트에서 생성 배양물에 스탬핑하였다. 플레이트를 열 밀봉하고 동결시켰다. 이어서, 샘플을 30분 동안 해동하고 4℃에서 회전하였다. 상층액의 일부를 절반-영역 96웰 플레이트에 스탬핑하였다. 샘플에서 CBCA, THCA 및 CBDA 생성은 액체 크로마토그래피-질량 분석법(LC-MS)을 통해 정량화되었다.

후보 CBCAS 효소의 라이브러리는 상기 기재된 검정을 사용하여 1차 고처리량 스크린에서 활성에 대해 검정하였다. LC-MS 분석은 측정 가능한 양의 CBCA를 생성하는 단일 "히트" CBCAS(균주 t619896, N-말단 MF알파2 신호 펩티드 (MF알파2 신호 펩티드의 N-말단에 부가된 메티오닌 잔기와 함께) 및 C-말단 HDEL 신호 펩티드에 연결된 서열번호 25의 에이. 니제르 단백질을 발현함)를 밝혀냈다.

놀랍게도, 후보 에이. 니제르 CBCAS 효소는 씨. 사티바 CBCAS 및 THCAS 효소와 매우 낮은 서열 동일성을 갖는다. 에이. 니제르 CBCAS 효소(서열번호 27 (UniProt 수탁 번호 A0A254UC34), 서열번호 25 + N-말단에서 메티오닌 잔기에 상응함)와 추정 씨. 사티바 CBCAS 효소(서열번호 15) 및 씨. 사티바 THCAS 효소(서열번호 20, UniProt 수탁 번호 I1V0C5에 상응함)의 정렬은 디폴트 매개변수를 갖는 BLASTP를 사용하여 각각 21.15% 동일성 및 21.71% 동일성을 나타낸다.

1차 스크린에서 확인된 후보 CBCAS 효소의 활성을 확인하기 위해, 2차 스크리닝을 수행하여 CBCA 생성을 확인하였다. 2차 스크린에 대한 실험 프로토콜은 균주당 추가 생물학적 복제물이 포함되었고 각 균주에 대한 복제물 생산 배양물에 1 mM 올리베톨산 또는 1 mM 디바르산을 별도로 공급했다는 것을 제외하고는 1차 스크리닝과 동일하였다. 모든 균주를 4중으로 스크리닝하였다.

1차 스크린과 일치하게, 2차 스크린은 이 균주에 의해 생성된 CBCA의 역가에 의해 나타난 바와 같이 균주 t619896에 대한 CBCAS 활성을 나타냈다(표 5 및 도 6).

표 5: 에스 . 세레비지아에에서 CBCAS 후보 효소의 2차 스크리닝으로부터의 CBCA 역가

놀랍게도, 균주 t619896은 또한 이 균주에 의해 생성된 CBCVA의 역가에 의해 나타난 바와 같이 CBCVAS 활성을 나타냈다(표 6 및 도 7). 2차 스크린에서 CBCA의 생성을 위한 양성 대조군으로 사용된 균주 t616315는 CBCVAS 활성을 나타내지 않았다(표 6 및 도 7).

표 6: 에스 . 세레비지아에에서 CBCAS 후보 효소의 2차 스크리닝으로부터의 CBCVA 역가

균주 t619896은 또한 89.60% CBCA, 5.67% CBDA, 및 4.73% THCA로 이루어진 말단 칸나비노이드 생성물 프로파일을 생성하는 THCA 및 CBDA의 생성을 나타냈다(표 7).

표 7: 에스. 세레비지아에에서 CBCAS 후보 효소의 2차 스크리닝으로부터의 CBCA, THCA, 및 CBDA 역가

따라서, 약 3000개의 후보 유전자 중에서, 하나의 CBCAS가 에스. 세레비지아에 숙주 세포서 발현될 때 측정 가능한 양의 CBCA 및 CBCVA를 생성할 수 있는 것으로 놀랍게도 확인되었다. 이러한 스크린에서 확인된 CBCAS는 칸나비노이드 생합성에 유용할 수 있다.

실시예 2: 에이. 니제르 CBCAS 의 단백질 조작

실시예 1에서 확인된 에이. 니제르 CBCAS(서열번호 29(신호 펩티드를 가짐); 서열번호 27(신호 펩티드를 갖지 않으며 N-말단 메티오닌(UniProt 수탁 번호 A0A254UC34)를 포함함); 또는 서열번호 25(신호 펩티드를 갖지 않고 N-말단 메티오닌을 갖지 않음)에 상응함)의 조작이 CBCAS 기질 특이성, 생성물 특이성 및/또는 생성된 생성물의 양을 변경할 수 있는지 여부를 결정하기 위해, 점 돌연변이는 에이. 니제르 CBCAS에서 생성되었고 단백질의 돌연변이체 버전은 에스. 세레비지아에에서 발현되었다. 1047개 에이. 니제르 CBCAS 돌연변이체를 포함하는 라이브러리가 생성되었고 스크리닝되었다. 실시예 1에서와 같이, 라이브러리의 각 CBCAS 돌연변이체뿐만 아니라 양성 대조군 균주에 의해 발현된 효소는 N-말단 MF알파2 신호 펩티드(서열번호 16) (MF알파2 신호 펩티드의 N-말단에 부가된 메티오닌 잔기를 가짐) 및 C-말단 HDEL 신호 펩티드(서열번호 17)를 포함하였다.

에이. 니제르 CBCAS의 돌연변이된 버전을 균주 발현함으로써 화학식 (9a), (10a), 및/또는 (11a)의 화합물을 포함한 화학식 (9), (10), 및/또는 (11)의 생성을 정량화하여 야생형 에이. 니제르 CBCAS를 발현하는 균주, 씨. 사티바 THCAS를 발현하는 균주 및 씨. 사티바 CBDAS를 발현하는 균주에 의한 동일한 화합물의 생성과 비교하였다. 균주는 실시예 1에 기재된 것과 동일한 검정을 사용하여 스크리닝하였다. 샘플에서 CBCA, THCA 및/또는 CBDA의 생성은 LC-MS를 통해 정량화하였다.

원래의 1047개의 라이브러리 구성원 중, 55개 균주가 2차 스크리닝으로 상승되어 CBCA 생성을 확인하였다. 2차 스크린에 대한 실험 프로토콜은 균주당 추가 생물학적 복제물이 포함되었고 각 균주에 대한 복제물 생성 배양물에 1 mM 올리베톨산 또는 1 mM 디바르산을 별도로 공급했다는 것을 제외하고는 1차 스크리닝과 동일하였다. 모든 균주를 4중으로 스크리닝하였다.

2차 스크린에서 평가된 55개 균주 중에서, 21개는 다음을 포함하여 에이. 니제르 양성 대조군보다 더 높은 평균 CBCA 역가를 나타냈다: 서열번호 27에 비해 A57Q 및 G61A 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t878470; 서열번호 27에 비해 V260M 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이 변이체를 발현하는 균주 t865743; 서열번호 27에 비해 V62I 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865737; 서열번호 27에 비해 V386A 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865746; 서열번호 27에 비해 V260F 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865744; 서열번호 27에 비해 E112V 및 N122S 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865717; 서열번호 27에 비해 A57E 및 I126A 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865694; 서열번호 27에 비해 T33D 및 N257S 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865726; 서열번호 27에 비해 N202S 및 P472A 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t878465; 서열번호 27에 비해 D410N 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865771; 서열번호 27에 비해 R450K 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865739; 서열번호 27에 비해 S180T 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865750; 서열번호 27에 비해 R183T 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t878464; 서열번호 27에 비해 N122G 및 I126R 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865689; 서열번호 27에 비해 N122A 및 I126T 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865690; 서열번호 27에 비해 Y71I 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865749; 서열번호 27에 비해 H287R 및 A341S 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865728; 서열번호 27에 비해 T55S 및 I126T 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865805; 서열번호 27에 비해 N122G 및 V398F 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865711; 서열번호 27에 비해 M394T 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865714; 및 서열번호 27에 비해 A57E 및 N131S 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865729. (도 8a; 표 8)

놀랍게도, 이러한 21개의 돌연변이체 CBCAS 히트는 또한 CBCA에 대한 향상된 생성물 특이성을 나타냈다. 예를 들어, 에이. 니제르 양성 대조군은 73.74% CBCA, 21.55% CBDA, 및 4.72% THCA로 이루어진 말단 칸나비노이드 생성물 프로파일을 생성하는 반면, 80% 초과(CBCA (80-83% CBCA, 13-14% CBDA 및 3-5% THCA)를 생성하는 특정 CBCAS 돌연변이체가 확인되었다.

2차 스크린에서 평가된 55개 균주 중에서, 24개는 다음을 포함하여 에이. 니제르 양성 대조군보다 더 높은 평균 CBCVA 역가를 나타냈다: 서열번호 27에 비해 V63I 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865745; 서열번호 27에 비해 N122G 및 I126R 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865689; 서열번호 27에 비해 P472R 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865718; 서열번호 27에 비해 S180T 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865750; 서열번호 27에 비해 V398A 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865747; 서열번호 27에 비해 R183T 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t878464; 서열번호 27에 비해 V260M 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865743; 서열번호 27에 비해 V386A 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865746; 서열번호 27에 비해 H426Y 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865732; 서열번호 27에 비해 Y256M 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865741; 서열번호 27에 비해 N202S 및 P472A 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t878465; 서열번호 27에 비해 N122G 및 I126K 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865720; 서열번호 27에 비해 V62I 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865737; 서열번호 27에 비해 R450K 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865739; 서열번호 27에 비해 Y129W 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865723; 서열번호 27에 비해 S423A 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865751; 서열번호 27에 비해 H287R 및 A341S 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865728; 서열번호 27에 비해 N295S 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865736; 서열번호 27에 비해 Y39F 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865748; 서열번호 27에 비해 V260F 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865744; 서열번호 27에 비해 L392H 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865755; 서열번호 27에 비해 A57E 및 N131S 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865729; 서열번호 27에 비해 E112V 및 N122S 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865717; 및 서열번호 27에 비해 T33D 및 N257S 점 돌연변이를 포함하는 에이. 니제르 CBCAS의 돌연변이체 버전을 발현하는 균주 t865726. (도 9a; 표 9) 올리베톨산에서 확인된 히트와는 달리, 디바르산으로부터 생성된 말단 칸나비노이드 사이에서는 생성물 프로파일의 변화가 관찰되지 않았다. 오히려, 이러한 생성물 프로파일은 에이. 니제르 대조군 및 돌연변이체 히트 둘 모두에 대해 67-70% CBCVA 및 30-33% THCVA였다. 놀랍게도, CBDVA는 이 스크린에서 평가된 CBCAS 후보에 의해 생성된 생성물 중에서 관찰되지 않았다.

다중 라이브러리 균주가 THCA 및 THCVA를 생성하는 것으로 관찰되었다. 에이. 니제르 CBCAS를 발현하는 균주 t865768은 양성 대조군 THCAS 균주보다 더 높은 평균 THCA 역가를 생성하였다 (도 8b; 표 8). 추가로, 에이. 니제르 CBCAS 돌연변이체를 발현하는 33개의 라이브러리 균주는 양성 대조군 THCAS 균주보다 더 높은 평균 THCA 역가를 생성하였다 (도 8b; 표 8). 추가로, 에이. 니제르 CBCAS를 발현하는 균주 t865768, 및 에이. 니제르 CBCAS 돌연변이체를 발현하는 대부분의 시험된 라이브러리 균주는 양성 대조군 THCAS 균주보다 더 많은 THCVA를 생성하였다 (도 9b; 표 9).

다중 라이브러리 균주가 CBDA를 생성하는 것으로 관찰되었다. 에이. 니제르 CBCAS를 발현하는 균주 t865768, 및 대마초 CBDAS를 발현하는 에이. 니제르 CBCAS 돌연변이체를 발현하는 대부분의 시험된 라이브러리 균주는 양성 대조군 CBDAS 균주(t876607)보다 더 많은 CBDA를 생성하였다. 이전 보고서(Luo et al. Nature, 2019 Mar;567(7746):123-126)와 일치하게, 대마초 CBDAS는 에스. 세레비지아에 숙주 세포에서 활성이 낮거나 활성이 전혀 없다: (도 8c; 표 8). 시험된 어떠한 라이브러리 균주도 CBDVA를 생성하는 것으로 발견되지 않았다 (도 9c; 표 9).

표 8: 에스 . 세레비지아에에서 CBCAS 후보 효소의 단백질 조작으로부터의 CBCA, THCA, 및 CBDA 역가

표 9: 에스 . 세레비지아에에서 CBCAS 후보 효소의 단백질 조작으로부터의 CBCVA, THCVA, 및 CBDVA 역가

실시예 3: 메타게놈 칸나비크로멘산 신타제(CBCAS)를 확인하기 위한 고처리량 스크린

우리가 아는 한, 실시예 1에서 확인된 에이. 니제르로부터의 CBCAS는 대마초 속 외부에서 발견된 이러한 활성을 가진 제1 효소를 나타낸다. 더 넓은 메타게놈에 다른 추정 CBCAS가 존재할 수 있는지 여부를 조사하기 위해, 1072개의 후보 CBCAS 유전자의 라이브러리는 실시예 1에서 확인된 에이. 니제르 CBCAS 효소를 참조로 사용하여 설계되었다. 단백질 서열은 에스. 세레비지아에에서의 발현을 위해 인 실리코로 기록되었고 도 5에 나타낸 통합 효모 발현 벡터에서 합성되었다. 각각의 후보 효소 발현 작제물을 도 2에서 반응 R4를 촉매할 수 있는 프레닐트랜스퍼라제 효소를 또한 발현하는 에스. 세레비지아에 CEN.PK 균주로 형질전환시켰다. GFP를 발현하는 균주 t616313은 효소 활성에 대한 음성 대조군으로서 라이브러리 스크린에 포함되었다. 실시예 1에서 확인된 에이. 니제르 효소를 발현하는 균주 t807925는 효소 활성에 대한 양성 대조군으로 라이브러리 스크린에 포함되었다. 라이브러리의 모든 후보 효소뿐만 아니라 양성 대조군 균주 t807925에 의해 발현된 효소는 N-말단 MF알파2 신호 펩티드(서열번호 16) (MF알파2 신호 펩티드의 N-말단에 부가된 메티오닌 잔기 포함) 및 C-말단 HDEL 신호 펩티드(서열번호 17)를 포함하였다.

후보 CBCAS 효소의 라이브러리는 실시예 1에 기재된 검정을 사용하여 1차 고처리량 스크린에서 활성에 대해 검정하였다. 샘플에서 CBCA, THCA 및/또는 CBDA의 생성은 LC-MS를 통해 정량화하였다.

1차 스크린의 결과에 기초하여, 70개의 균주를 2차 스크린으로 넘겨 1차 스크린에서 관찰된 활성을 확인하였다. 2차 스크린에 대한 실험 프로토콜은 균주당 추가 기술 복제물이 포함되었고 각 균주에 대한 복제물 생성 배양물에 1 mM 올리베톨산 또는 1 mM 디바르산을 별도로 공급했다는 것을 제외하고는 1차 스크린과 동일하였다. 모든 균주를 4중 스크리닝하였다 (도 10a-10c, 표 10 및 11). 균주 ID 및 이들의 상응하는 서열을 표 15에 나타낸다.

이러한 결과는 놀랍게도 CBCA 및/또는 CBCVA를 생성할 수 있는 다중 균주를 확인하였다. 구체적으로, 17개의 균주는 양성 대조군(균주 t807925의 평균 CBCA 역가의 적어도 표준 편차 1 내에서 평균 CBCA 역가에 상응함)에 의해 생성된 양에 필적하는 양의 CBCA를 생성한 반면, 2개의 균주(t808223 및 t808199)는 균주 t807925의 평균 CBCA 역가의 표준 편차 1 초과의 역가로 CBCA를 생성하였다(도 10a). 28개의 균주는 양성 대조군에 필적하는 CBCVAS 활성을 나타내었다(도 11a). 이러한 17개의 균주 중, t807854 - 서열번호 112, t807933 - 서열번호 130, t808225 - 서열번호 166, t808026 - 서열번호 144, 및 t8082001 - 서열번호 164를 포함하는 다중 균주는 에이. 니제르 양성 대조군보다 CBCA의 백분율이 더 높은 말단 칸나비노이드 생성물 프로파일을 생성했으며, 1개의 균주(t807854 - 서열번호 112)는 97% 초과의 CBCA 프로파일을 갖는 말단 칸나비노이드 생성물을 생성하였다.

실시예 1에서 확인된 에이. 니제르 CBCAS와 > 95% 서열 동일성을 나타내는 후보 CBCAS의 서브세트가 확인되었다 (도 13).

CBCA 및/또는 CBCVA를 생성하는 여러 균주가 이들의 각각의 기질(예를 들어, CBGA 또는 CBGVA)을 완전히 고갈시킨 것으로 관찰되었다 (도 12a-12b, 표 12). 따라서, CBCA 및/또는 CBCVA를 생성할 수 있는 다중 균주가 확인되었지만, 관찰된 기질 고갈은 CBCA의 생성에 기반하여 균주 간의 효과적인 순위를 배제한다.

표 10: 에스 . 세레비지아에에서 CBCAS 후보 효소의 메타게놈 스크리닝으로부터의 CBCA, THCA, 및 CBDA 역가

* 표에 제공된 TS 서열번호는 각 TS의 완전한 단백질 서열에 상응한다. 스크린과 관련하여, 2개의 신호 펩티드가 각각의 TS 서열에 부착되었다. N-말단에서, N-말단 메티오닌이 각각의 TS 서열로부터 제거되고, TS 서열이 서열번호 16에 상응하는 신호 펩티드에 연결되고, 메티오닌 잔기가 서열번호 16의 N-말단에 부가되었다. C-말단에서, 각각의 TS 서열이 서열번호 17에 상응하는 신호 펩티드에 연결되었다.

표 11: 에스. 세레비지아에에서 CBCAS 후보 효소의 메타게놈 스크리닝으로부터의 CBCVA, THCVA, 및 CBDVA 역가

표 12: 에스. 세레비지아에에서 CBCAS 후보 효소의 메타게놈 스크리닝으로부터의 CBGA 및 CBGVA 잔류 기질

실시예 4: CBCAS 활성에 대한 신호 펩티드에 대한 요건 평가

번역 후 변형(예를 들어, 분자내 이황화 브릿지 형성, 번역 후 글리코실화 등)은 대마초 말단 신타제의 활성에 중요한 것으로 공지되어 있다. 말단 신타제 효소 상의 신호 펩티드의 존재는 번역 후 변형을 촉진하는 데 도움이 될 수 있다. 그러나, 실시예 1에서 확인된 에이. 니제르 CBCAS 또는 실시예 3에서 확인된 추가 CBCAS가 신호 펩티드가 활성화되어야 하는지 여부는 공지되어 있지 않았다.

N-말단 MF알파2 신호 펩티드(서열번호 16) 및 C-말단 HDEL 신호 펩티드(서열번호 17)를 갖거나 갖지 않는 CBCAS 효소의 버전을 포함하는, 실시예 1 및 3으로부터 선택된 20개의 CBCAS 효소의 라이브러리가 합성되었다. 각각의 후보 효소 발현 작제물을 도 2에서 반응 R4를 촉매할 수 있는 프레닐트랜스퍼라제 효소를 또한 발현하는 에스. 세레비지아에 CEN.PK 균주로 형질전환시켰다. 실시예 1에서 확인된 에이. 니제르 CBCAS를 발현하는 균주 t861555는 Mf알파2 및 HDEL 신호 펩티드를 둘 모두 보유하고 효소 활성에 대한 양성 대조군으로서 라이브러리 스크린에 포함되었다. 균주 t861565는 Mf알파2 및 HDEL 신호 펩티드를 갖지 않는 동일한 에이. 니제르 CBCAS를 발현하였다.

다음을 제외하고 실시예 1에 기재된 검정을 사용하여 균주를 스크리닝하였다: 4일 차에 샘플을 pH 조정하지 않고 20℃에서 추가로 2일 동안 인큐베이션하였다.

12개의 균주는 t861555 양성 대조군보다 더 큰 평균 CBCAS 활성을 나타내었다(도 14, 표 13). 놀랍게도, 2개의 신호 펩티드의 영향은 CBCAS 후보의 실체에 따라 달라지는 것으로 밝혀졌다: 일부 경우에, 2개의 신호 펩티드의 존재가 CBCAS 활성을 향상시키는 것으로 관찰된 반면, 다른 경우에는 활성을 감소시키는 것으로 관찰되었다. 에이. 니제르 CBCAS로부터의 2개의 신호 펩티드의 부재는 CBCAS 활성에 상당한 긍정적인 영향을 미쳤다. 신호 펩티드 없이 에이. 니제르 CBCAS를 발현하는 t861565 균주는 신호 펩티드를 갖는 에이. 니제르 CBCAS를 발현하는 t861555 균주보다 약 4배 더 높은 CBCA 역가를 나타냈다.

표 13: 에스 . 세레비지아에에서 신호 펩티드를 갖거나 갖지 않는 CBCAS 후보 효소의 스크리닝으로부터의 CBCA 역가

* 표에 제공된 TS 서열번호는 각 TS의 완전한 단백질 서열에 상응한다. 스크린과 관련하여, 신호 펩티드로 TS 서열을 발현하기 위해 "Y"로 표시된 균주의 경우, 2개의 신호 펩티드가 각각의 TS 서열에 부착되었다. N-말단에서, N-말단 메티오닌이 각각의 TS 서열로부터 제거되고, TS 서열이 서열번호 16에 상응하는 신호 펩티드에 연결되고, 메티오닌 잔기가 서열번호 16의 N-말단에 부가되었다. C-말단에서, 각각의 TS 서열이 서열번호 17에 상응하는 신호 펩티드에 연결되었다.

**단일 생체복제, 표준 편차 해당 없음

실시예 5: 실시예 1-4에서 확인된 CBCAS 효소가 풍부한 서열 모티프의 확인

실시예 4로부터의 CBCAS 효소의 분석은 에이. 니제르 CBCAS보다 더 큰 평균 CBCA 역가를 생성하는 CBCAS 효소가 풍부한 다중 서열 모티프를 확인하였다. 표 14는 확인된 모티프에 대한 서열 정보를 제공한다.

TS 효소의 3차원 구조 내에서 서열 모티프가 어디에 위치하는지를 결정하기 위해 관련 단백질로부터의 결정 구조를 사용하여 구조 모델을 생성하였다. 도 15 및 16은 몇몇 확인된 서열 모티프의 예측된 국소화를 나타내는 리본 다이어그램을 도시한다. 도 15에서 화살표로 나타낸 서열 모티프 KVQARSGGH(서열번호 174), CPTI[KR]TGGH(서열번호 181), 및 P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186)은 보조인자 결합 부위와 접촉할 것으로 예측되고 따라서 보조인자 결합에 영향을 미칠 수 있다.

도 16에서 화살표로 나타낸 모티프 RT[EQ][PQ]APGLAVQYSY(서열번호 207)는 기질 결합 포켓 근처에 있을 것으로 예측된다. 도 16에서 화살표로 나타낸 모티프 WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211)은 활성 부위의 공동에 라인을 형성할 것으로 예측되며 잠재적으로 기질 또는 생성물 특이성에 영향을 미칠 수 있다.

표 14. 후보 CBCAS에서 확인된 모티프 서열

* 표는 실시예 4에 제시된 데이터를 기반으로 모든 TS에 대한 2개의 균주를 포함한다. 각각의 TS에 대해, 하나의 균주는 신호 펩티드를 갖는 TS를 발현하고(각 균주에 대한 상단 행), 하나의 균주는 신호 펩티드가 없이 TS를 발현하였다(각 균주에 대한 하단 행).

** 표에 제공된 TS 서열번호는 각 TS의 완전한 단백질 서열에 상응한다. 스크린과 관련하여, 신호 펩티드로 TS를 발현하는 균주(각 균주에 대한 상단 행)에 대해, 2개의 신호 펩티드가 각 TS 서열에 부착되었다. N-말단에서, N-말단 메티오닌이 각각의 TS 서열로부터 제거되고, TS 서열이 서열번호 16에 상응하는 신호 펩티드에 연결되고, 메티오닌 잔기가 서열번호 16의 N-말단에 부가되었다. C-말단에서, 각각의 TS 서열이 서열번호 17에 상응하는 신호 펩티드에 연결되었다.

실시예 6: 조작된 에스. 세레비지아에 숙주 세포에서 칸나비노이드의 생합성

CoA-티오에스테르에 대한 유기산의 활성화, 및 이 티오에스테르와 다수의 말로닐-CoA 분자 또는 기타 유사한 폴리케타이드 증량제 단위의 후속 축합은 공지된 모든 칸나비노이드의 생합성에서 처음 두 단계를 나타낸다. CBGA(도 1, 화학식 8a), CBDA(도 1, 화학식 9a), THCA(도 1, 화학식 10a), 및/또는 CBCA(도 1, 화학식 11a)의 생합성을 입증하기 위해, 도 1 에 나타낸 칸나비노이드 생합성 경로는 원시영양 에스. 세레비지아에 CEN.PK 숙주 세포의 게놈에서 어셈블리되며, 여기서 각각의 효소(R1a-R5a)는 하나 이상의 카피로 존재할 수 있다. 예를 들어, 에스. 세레비지아에 숙주 세포는 AAE, OLS, OAC, PT, 및 TS 중 하나 이상의 하나 이상의 카피를 발현할 수 있다.

사용된 AAE 효소는 헥산산에 대한 활성을 갖는 에스. 세레비지아에 또는 이의 변이체에서 기능적으로 발현되는 자연 발생 또는 합성 AAE일 수 있다. OLS 효소는 에스. 세레비지아에에서 기능적으로 발현되는 자연 발생 또는 합성 OLS일 수 있다. OAC 효소는 에스. 세레비지아에에서 기능적으로 발현되는 자연 발생 또는 합성 OLS일 수 있다. 이기능성 OLS가 사용되는 경우, 별도의 OAC 효소를 생략하거나 생략하지 않을 수 있다. PT 효소는 에스. 세레비지아에에서 기능적으로 발현되는 자연 발생 또는 합성 PT일 수 있다.

TS 효소는 씨. 사티바로부터의 TS, 씨. 사티바로부터의 TS의 변이체 및/또는 비-대마초 종으로부터의 TS를 포함하는, 에스. 세레비지아에 또는 이의 변이체에서 기능적으로 발현되는 자연 발생 또는 합성 TS일 수 있다. TS 효소는 CBCA, CBCVA, THCA, THCVA, CBDA, 및 CBDVA 중 하나 이상을 주요 생성물로 생성하는 TS일 수 있다. TS 효소는 본 개시내용에 제공된 하나 이상의 TS 효소를 포함할 수 있다.

칸나비노이드 발효 절차는 생성 배양물의 인큐베이션을, 예를 들어, 48-144시간 동안 지속할 수 있고 생성 배양물을, 예를 들어, 24시간마다 4% 갈락토스 및 1 mM 헥사노산나트륨으로 보충할 수 있다는 것을 제외하고는 상기 실시예에 기재된 검정과 유사할 수 있다. CBCA, CBCVA, THCA, THCVA, CBDA, 및 CBDVA의 역가는 LC-MS를 통해 정량화된다.

개시내용과 관련된 서열

표 15. 실시예 3* 및 실시예 4**에 기재된 후보 CBCAS의 서열

* 실시예 3의 라이브러리 스크린의 경우, N-말단 MF알파2 신호 펩티드(서열번호 16) 및 C-말단 HDEL 신호 펩티드(서열번호 17)를 갖는 표 15에 제공된 TS 서열이 발현되었다. 메티오닌 잔기는 도 15에 제공된 TS 서열의 N-말단으로부터 제거되었다. 메티오닌 잔기는 서열번호 16의 N-말단에 대신에 부가되었다.

** 실시예 4의 라이브러리 스크린의 경우, N-말단 및 C-말단 신호 펩티드를 갖거나 갖지 않은 TS 서열이 발현되었다. 신호 펩티드를 갖는 TS 서열이 발현되는 경우, 실시예 3에 대해 상기 기재된 것과 동일한 접근법을 사용하였다.

본 출원에 개시된 서열은 신호 서열을 포함하거나 포함하지 않을 수 있음을 인식해야 한다. 본 출원에 개시된 서열은 신호 서열이 있거나 없는 버전을 포함한다. 또한, 본 출원에 개시된 단백질 서열은 개시 코돈(M)이 있거나 없는 것으로 도시될 수 있음을 이해해야 한다. 본 출원에 개시된 서열은 개시 코돈이 있거나 없는 버전을 포함한다. 따라서, 일부 경우에 아미노산 넘버링은 개시 코돈을 포함하는 단백질 서열에 상응할 수 있는 반면, 다른 경우에 아미노산 넘버링은 개시 코돈을 포함하지 않는 단백질 서열에 상응할 수 있다. 또한, 본 출원에 개시된 서열은 정지 코돈이 있거나 없는 것으로 도시될 수 있음을 이해해야 한다. 본 출원에 개시된 서열은 정지 코돈이 있거나 없는 버전을 포함한다. 본 개시내용의 양태는 본 출원에 기재된 임의의 서열 및 이의 단편을 포함하는 숙주 세포를 포함한다.

등가물

당업자는 본원에 기재된 본 발명의 특정 구현예에 대한 많은 등가물을 인식하거나 통상적인 실험만 사용하여 확인할 수 있을 것이다. 이러한 등가물은 하기 청구범위에 의해 포함되도록 의도된다.

특허 문서를 포함한 모든 참조문헌은 그 전체가 참조로 포함된다.

SEQUENCE LISTING <110> Ginkgo Bioworks, Inc. <120> BIOSYNTHESIS OF CANNABINOIDS AND CANNABINOID PRECURSORS <130> G0919.70059WO00 <140> Not Yet Assigned <141> Concurrently Herewith <150> US 63/000,419 <151> 2020-03-26 <160> 215 <170> PatentIn version 3.5 <210> 1 <211> 101 <212> PRT <213> C. sativa <400> 1 Met Ala Val Lys His Leu Ile Val Leu Lys Phe Lys Asp Glu Ile Thr 1 5 10 15 Glu Ala Gln Lys Glu Glu Phe Phe Lys Thr Tyr Val Asn Leu Val Asn 20 25 30 Ile Ile Pro Ala Met Lys Asp Val Tyr Trp Gly Lys Asp Val Thr Gln 35 40 45 Lys Asn Lys Glu Glu Gly Tyr Thr His Ile Val Glu Val Thr Phe Glu 50 55 60 Ser Val Glu Thr Ile Gln Asp Tyr Ile Ile His Pro Ala His Val Gly 65 70 75 80 Phe Gly Asp Val Tyr Arg Ser Phe Trp Glu Lys Leu Leu Ile Phe Asp 85 90 95 Tyr Thr Pro Arg Lys 100 <210> 2 <211> 303 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 2 atggcagtga agcatttgat tgtattgaag ttcaaagatg aaatcacaga agcccaaaag 60 gaagaatttt tcaagacgta tgtgaatctt gtgaatatca tcccagccat gaaagatgta 120 tactggggta aagatgtgac tcaaaagaat aaggaagaag ggtacactca catagttgag 180 gtaacatttg agagtgtgga gactattcag gactacatta ttcatcctgc ccatgttgga 240 tttggagatg tctatcgttc tttctgggaa aaacttctca tttttgacta cacaccacga 300 aag 303 <210> 3 <211> 78 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 3 aattgctcag cattttcctt ttggtttgtt tgcaaaataa tatttttctt tctctcattc 60 aatatccaaa tttcaata 78 <210> 4 <211> 27 <212> PRT <213> C. sativa <400> 4 Asn Cys Ser Ala Phe Ser Phe Trp Phe Val Cys Lys Ile Ile Phe Phe 1 5 10 15 Phe Leu Ser Phe Asn Ile Gln Ile Ser Ile Ala 20 25 <210> 5 <211> 719 <212> PRT <213> C. sativa <400> 5 Met Gly Lys Asn Tyr Lys Ser Leu Asp Ser Val Val Ala Ser Asp Phe 1 5 10 15 Ile Ala Leu Gly Ile Thr Ser Glu Val Ala Glu Thr Leu His Gly Arg 20 25 30 Leu Ala Glu Ile Val Cys Asn Tyr Gly Ala Ala Thr Pro Gln Thr Trp 35 40 45 Ile Asn Ile Ala Asn His Ile Leu Ser Pro Asp Leu Pro Phe Ser Leu 50 55 60 His Gln Met Leu Phe Tyr Gly Cys Tyr Lys Asp Phe Gly Pro Ala Pro 65 70 75 80 Pro Ala Trp Ile Pro Asp Pro Glu Lys Val Lys Ser Thr Asn Leu Gly 85 90 95 Ala Leu Leu Glu Lys Arg Gly Lys Glu Phe Leu Gly Val Lys Tyr Lys 100 105 110 Asp Pro Ile Ser Ser Phe Ser His Phe Gln Glu Phe Ser Val Arg Asn 115 120 125 Pro Glu Val Tyr Trp Arg Thr Val Leu Met Asp Glu Met Lys Ile Ser 130 135 140 Phe Ser Lys Asp Pro Glu Cys Ile Leu Arg Arg Asp Asp Ile Asn Asn 145 150 155 160 Pro Gly Gly Ser Glu Trp Leu Pro Gly Gly Tyr Leu Asn Ser Ala Lys 165 170 175 Asn Cys Leu Asn Val Asn Ser Asn Lys Lys Leu Asn Asp Thr Met Ile 180 185 190 Val Trp Arg Asp Glu Gly Asn Asp Asp Leu Pro Leu Asn Lys Leu Thr 195 200 205 Leu Asp Gln Leu Arg Lys Arg Val Trp Leu Val Gly Tyr Ala Leu Glu 210 215 220 Glu Met Gly Leu Glu Lys Gly Cys Ala Ile Ala Ile Asp Met Pro Met 225 230 235 240 His Val Asp Ala Val Val Ile Tyr Leu Ala Ile Val Leu Ala Gly Tyr 245 250 255 Val Val Val Ser Ile Ala Asp Ser Phe Ser Ala Pro Glu Ile Ser Thr 260 265 270 Arg Leu Arg Leu Ser Lys Ala Lys Ala Ile Phe Thr Gln Asp His Ile 275 280 285 Ile Arg Gly Lys Lys Arg Ile Pro Leu Tyr Ser Arg Val Val Glu Ala 290 295 300 Lys Ser Pro Met Ala Ile Val Ile Pro Cys Ser Gly Ser Asn Ile Gly 305 310 315 320 Ala Glu Leu Arg Asp Gly Asp Ile Ser Trp Asp Tyr Phe Leu Glu Arg 325 330 335 Ala Lys Glu Phe Lys Asn Cys Glu Phe Thr Ala Arg Glu Gln Pro Val 340 345 350 Asp Ala Tyr Thr Asn Ile Leu Phe Ser Ser Gly Thr Thr Gly Glu Pro 355 360 365 Lys Ala Ile Pro Trp Thr Gln Ala Thr Pro Leu Lys Ala Ala Ala Asp 370 375 380 Gly Trp Ser His Leu Asp Ile Arg Lys Gly Asp Val Ile Val Trp Pro 385 390 395 400 Thr Asn Leu Gly Trp Met Met Gly Pro Trp Leu Val Tyr Ala Ser Leu 405 410 415 Leu Asn Gly Ala Ser Ile Ala Leu Tyr Asn Gly Ser Pro Leu Val Ser 420 425 430 Gly Phe Ala Lys Phe Val Gln Asp Ala Lys Val Thr Met Leu Gly Val 435 440 445 Val Pro Ser Ile Val Arg Ser Trp Lys Ser Thr Asn Cys Val Ser Gly 450 455 460 Tyr Asp Trp Ser Thr Ile Arg Cys Phe Ser Ser Ser Gly Glu Ala Ser 465 470 475 480 Asn Val Asp Glu Tyr Leu Trp Leu Met Gly Arg Ala Asn Tyr Lys Pro 485 490 495 Val Ile Glu Met Cys Gly Gly Thr Glu Ile Gly Gly Ala Phe Ser Ala 500 505 510 Gly Ser Phe Leu Gln Ala Gln Ser Leu Ser Ser Phe Ser Ser Gln Cys 515 520 525 Met Gly Cys Thr Leu Tyr Ile Leu Asp Lys Asn Gly Tyr Pro Met Pro 530 535 540 Lys Asn Lys Pro Gly Ile Gly Glu Leu Ala Leu Gly Pro Val Met Phe 545 550 555 560 Gly Ala Ser Lys Thr Leu Leu Asn Gly Asn His His Asp Val Tyr Phe 565 570 575 Lys Gly Met Pro Thr Leu Asn Gly Glu Val Leu Arg Arg His Gly Asp 580 585 590 Ile Phe Glu Leu Thr Ser Asn Gly Tyr Tyr His Ala His Gly Arg Ala 595 600 605 Asp Asp Thr Met Asn Ile Gly Gly Ile Lys Ile Ser Ser Ile Glu Ile 610 615 620 Glu Arg Val Cys Asn Glu Val Asp Asp Arg Val Phe Glu Thr Thr Ala 625 630 635 640 Ile Gly Val Pro Pro Leu Gly Gly Gly Pro Glu Gln Leu Val Ile Phe 645 650 655 Phe Val Leu Lys Asp Ser Asn Asp Thr Thr Ile Asp Leu Asn Gln Leu 660 665 670 Arg Leu Ser Phe Asn Leu Gly Leu Gln Lys Lys Leu Asn Pro Leu Phe 675 680 685 Lys Val Thr Arg Val Val Pro Leu Ser Ser Leu Pro Arg Thr Ala Thr 690 695 700 Asn Lys Ile Met Arg Arg Val Leu Arg Gln Phe Ser His Phe Glu 705 710 715 <210> 6 <211> 543 <212> PRT <213> C. sativa <400> 6 Met Glu Lys Ser Gly Tyr Gly Arg Asp Gly Ile Tyr Arg Ser Leu Arg 1 5 10 15 Pro Pro Leu His Leu Pro Asn Asn Asn Asn Leu Ser Met Val Ser Phe 20 25 30 Leu Phe Arg Asn Ser Ser Ser Tyr Pro Gln Lys Pro Ala Leu Ile Asp 35 40 45 Ser Glu Thr Asn Gln Ile Leu Ser Phe Ser His Phe Lys Ser Thr Val 50 55 60 Ile Lys Val Ser His Gly Phe Leu Asn Leu Gly Ile Lys Lys Asn Asp 65 70 75 80 Val Val Leu Ile Tyr Ala Pro Asn Ser Ile His Phe Pro Val Cys Phe 85 90 95 Leu Gly Ile Ile Ala Ser Gly Ala Ile Ala Thr Thr Ser Asn Pro Leu 100 105 110 Tyr Thr Val Ser Glu Leu Ser Lys Gln Val Lys Asp Ser Asn Pro Lys 115 120 125 Leu Ile Ile Thr Val Pro Gln Leu Leu Glu Lys Val Lys Gly Phe Asn 130 135 140 Leu Pro Thr Ile Leu Ile Gly Pro Asp Ser Glu Gln Glu Ser Ser Ser 145 150 155 160 Asp Lys Val Met Thr Phe Asn Asp Leu Val Asn Leu Gly Gly Ser Ser 165 170 175 Gly Ser Glu Phe Pro Ile Val Asp Asp Phe Lys Gln Ser Asp Thr Ala 180 185 190 Ala Leu Leu Tyr Ser Ser Gly Thr Thr Gly Met Ser Lys Gly Val Val 195 200 205 Leu Thr His Lys Asn Phe Ile Ala Ser Ser Leu Met Val Thr Met Glu 210 215 220 Gln Asp Leu Val Gly Glu Met Asp Asn Val Phe Leu Cys Phe Leu Pro 225 230 235 240 Met Phe His Val Phe Gly Leu Ala Ile Ile Thr Tyr Ala Gln Leu Gln 245 250 255 Arg Gly Asn Thr Val Ile Ser Met Ala Arg Phe Asp Leu Glu Lys Met 260 265 270 Leu Lys Asp Val Glu Lys Tyr Lys Val Thr His Leu Trp Val Val Pro 275 280 285 Pro Val Ile Leu Ala Leu Ser Lys Asn Ser Met Val Lys Lys Phe Asn 290 295 300 Leu Ser Ser Ile Lys Tyr Ile Gly Ser Gly Ala Ala Pro Leu Gly Lys 305 310 315 320 Asp Leu Met Glu Glu Cys Ser Lys Val Val Pro Tyr Gly Ile Val Ala 325 330 335 Gln Gly Tyr Gly Met Thr Glu Thr Cys Gly Ile Val Ser Met Glu Asp 340 345 350 Ile Arg Gly Gly Lys Arg Asn Ser Gly Ser Ala Gly Met Leu Ala Ser 355 360 365 Gly Val Glu Ala Gln Ile Val Ser Val Asp Thr Leu Lys Pro Leu Pro 370 375 380 Pro Asn Gln Leu Gly Glu Ile Trp Val Lys Gly Pro Asn Met Met Gln 385 390 395 400 Gly Tyr Phe Asn Asn Pro Gln Ala Thr Lys Leu Thr Ile Asp Lys Lys 405 410 415 Gly Trp Val His Thr Gly Asp Leu Gly Tyr Phe Asp Glu Asp Gly His 420 425 430 Leu Tyr Val Val Asp Arg Ile Lys Glu Leu Ile Lys Tyr Lys Gly Phe 435 440 445 Gln Val Ala Pro Ala Glu Leu Glu Gly Leu Leu Val Ser His Pro Glu 450 455 460 Ile Leu Asp Ala Val Val Ile Pro Phe Pro Asp Ala Glu Ala Gly Glu 465 470 475 480 Val Pro Val Ala Tyr Val Val Arg Ser Pro Asn Ser Ser Leu Thr Glu 485 490 495 Asn Asp Val Lys Lys Phe Ile Ala Gly Gln Val Ala Ser Phe Lys Arg 500 505 510 Leu Arg Lys Val Thr Phe Ile Asn Ser Val Pro Lys Ser Ala Ser Gly 515 520 525 Lys Ile Leu Arg Arg Glu Leu Ile Gln Lys Val Arg Ser Asn Met 530 535 540 <210> 7 <211> 385 <212> PRT <213> C. sativa <400> 7 Met Asn His Leu Arg Ala Glu Gly Pro Ala Ser Val Leu Ala Ile Gly 1 5 10 15 Thr Ala Asn Pro Glu Asn Ile Leu Leu Gln Asp Glu Phe Pro Asp Tyr 20 25 30 Tyr Phe Arg Val Thr Lys Ser Glu His Met Thr Gln Leu Lys Glu Lys 35 40 45 Phe Arg Lys Ile Cys Asp Lys Ser Met Ile Arg Lys Arg Asn Cys Phe 50 55 60 Leu Asn Glu Glu His Leu Lys Gln Asn Pro Arg Leu Val Glu His Glu 65 70 75 80 Met Gln Thr Leu Asp Ala Arg Gln Asp Met Leu Val Val Glu Val Pro 85 90 95 Lys Leu Gly Lys Asp Ala Cys Ala Lys Ala Ile Lys Glu Trp Gly Gln 100 105 110 Pro Lys Ser Lys Ile Thr His Leu Ile Phe Thr Ser Ala Ser Thr Thr 115 120 125 Asp Met Pro Gly Ala Asp Tyr His Cys Ala Lys Leu Leu Gly Leu Ser 130 135 140 Pro Ser Val Lys Arg Val Met Met Tyr Gln Leu Gly Cys Tyr Gly Gly 145 150 155 160 Gly Thr Val Leu Arg Ile Ala Lys Asp Ile Ala Glu Asn Asn Lys Gly 165 170 175 Ala Arg Val Leu Ala Val Cys Cys Asp Ile Met Ala Cys Leu Phe Arg 180 185 190 Gly Pro Ser Glu Ser Asp Leu Glu Leu Leu Val Gly Gln Ala Ile Phe 195 200 205 Gly Asp Gly Ala Ala Ala Val Ile Val Gly Ala Glu Pro Asp Glu Ser 210 215 220 Val Gly Glu Arg Pro Ile Phe Glu Leu Val Ser Thr Gly Gln Thr Ile 225 230 235 240 Leu Pro Asn Ser Glu Gly Thr Ile Gly Gly His Ile Arg Glu Ala Gly 245 250 255 Leu Ile Phe Asp Leu His Lys Asp Val Pro Met Leu Ile Ser Asn Asn 260 265 270 Ile Glu Lys Cys Leu Ile Glu Ala Phe Thr Pro Ile Gly Ile Ser Asp 275 280 285 Trp Asn Ser Ile Phe Trp Ile Thr His Pro Gly Gly Lys Ala Ile Leu 290 295 300 Asp Lys Val Glu Glu Lys Leu His Leu Lys Ser Asp Lys Phe Val Asp 305 310 315 320 Ser Arg His Val Leu Ser Glu His Gly Asn Met Ser Ser Ser Thr Val 325 330 335 Leu Phe Val Met Asp Glu Leu Arg Lys Arg Ser Leu Glu Glu Gly Lys 340 345 350 Ser Thr Thr Gly Asp Gly Phe Glu Trp Gly Val Leu Phe Gly Phe Gly 355 360 365 Pro Gly Leu Thr Val Glu Arg Val Val Val Arg Ser Val Pro Ile Lys 370 375 380 Tyr 385 <210> 8 <211> 307 <212> PRT <213> Unknown <220> <223> Streptomyces sp. <400> 8 Met Ser Glu Ala Ala Asp Val Glu Arg Val Tyr Ala Ala Met Glu Glu 1 5 10 15 Ala Ala Gly Leu Leu Gly Val Ala Cys Ala Arg Asp Lys Ile Tyr Pro 20 25 30 Leu Leu Ser Thr Phe Gln Asp Thr Leu Val Glu Gly Gly Ser Val Val 35 40 45 Val Phe Ser Met Ala Ser Gly Arg His Ser Thr Glu Leu Asp Phe Ser 50 55 60 Ile Ser Val Pro Thr Ser His Gly Asp Pro Tyr Ala Thr Val Val Glu 65 70 75 80 Lys Gly Leu Phe Pro Ala Thr Gly His Pro Val Asp Asp Leu Leu Ala 85 90 95 Asp Thr Gln Lys His Leu Pro Val Ser Met Phe Ala Ile Asp Gly Glu 100 105 110 Val Thr Gly Gly Phe Lys Lys Thr Tyr Ala Phe Phe Pro Thr Asp Asn 115 120 125 Met Pro Gly Val Ala Glu Leu Ser Ala Ile Pro Ser Met Pro Pro Ala 130 135 140 Val Ala Glu Asn Ala Glu Leu Phe Ala Arg Tyr Gly Leu Asp Lys Val 145 150 155 160 Gln Met Thr Ser Met Asp Tyr Lys Lys Arg Gln Val Asn Leu Tyr Phe 165 170 175 Ser Glu Leu Ser Ala Gln Thr Leu Glu Ala Glu Ser Val Leu Ala Leu 180 185 190 Val Arg Glu Leu Gly Leu His Val Pro Asn Glu Leu Gly Leu Lys Phe 195 200 205 Cys Lys Arg Ser Phe Ser Val Tyr Pro Thr Leu Asn Trp Glu Thr Gly 210 215 220 Lys Ile Asp Arg Leu Cys Phe Ala Val Ile Ser Asn Asp Pro Thr Leu 225 230 235 240 Val Pro Ser Ser Asp Glu Gly Asp Ile Glu Lys Phe His Asn Tyr Ala 245 250 255 Thr Lys Ala Pro Tyr Ala Tyr Val Gly Glu Lys Arg Thr Leu Val Tyr 260 265 270 Gly Leu Thr Leu Ser Pro Lys Glu Glu Tyr Tyr Lys Leu Gly Ala Tyr 275 280 285 Tyr His Ile Thr Asp Val Gln Arg Gly Leu Leu Lys Ala Phe Asp Ser 290 295 300 Leu Glu Asp 305 <210> 9 <211> 924 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 9 atgtcagaag ccgcagatgt cgaaagagtt tacgccgcta tggaagaagc cgccggtttg 60 ttaggtgttg cctgtgccag agataagatc tacccattgt tgtctacttt tcaagataca 120 ttagttgaag gtggttcagt tgttgttttc tctatggctt caggtagaca ttctacagaa 180 ttggatttct ctatctcagt tccaacatca catggtgatc catacgctac tgttgttgaa 240 aaaggtttat ttccagcaac aggtcatcca gttgatgatt tgttggctga tactcaaaag 300 catttgccag tttctatgtt tgcaattgat ggtgaagtta ctggtggttt caagaaaact 360 tacgctttct ttccaactga taacatgcca ggtgttgcag aattatctgc tattccatca 420 atgccaccag ctgttgcaga aaatgcagaa ttatttgcta gatacggttt ggataaggtt 480 caaatgacat ctatggatta caagaaaaga caagttaatt tgtacttttc tgaattatca 540 gcacaaactt tggaagctga atcagttttg gcattagtta gagaattggg tttacatgtt 600 ccaaacgaat tgggtttgaa gttttgtaaa agatctttct cagtttatcc aactttaaac 660 tgggaaacag gcaagatcga tagattatgt ttcgcagtta tctctaacga tccaacattg 720 gttccatctt cagatgaagg tgatatcgaa aagtttcata actacgctac taaagcacca 780 tatgcttacg ttggtgaaaa gagaacatta gtttatggtt tgactttatc accaaaggaa 840 gaatactaca agttgggtgc ttactaccac attaccgacg tacaaagagg tttattgaaa 900 gcattcgata gtttagaaga ctaa 924 <210> 10 <211> 395 <212> PRT <213> C. sativa <400> 10 Met Gly Leu Ser Ser Val Cys Thr Phe Ser Phe Gln Thr Asn Tyr His 1 5 10 15 Thr Leu Leu Asn Pro His Asn Asn Asn Pro Lys Thr Ser Leu Leu Cys 20 25 30 Tyr Arg His Pro Lys Thr Pro Ile Lys Tyr Ser Tyr Asn Asn Phe Pro 35 40 45 Ser Lys His Cys Ser Thr Lys Ser Phe His Leu Gln Asn Lys Cys Ser 50 55 60 Glu Ser Leu Ser Ile Ala Lys Asn Ser Ile Arg Ala Ala Thr Thr Asn 65 70 75 80 Gln Thr Glu Pro Pro Glu Ser Asp Asn His Ser Val Ala Thr Lys Ile 85 90 95 Leu Asn Phe Gly Lys Ala Cys Trp Lys Leu Gln Arg Pro Tyr Thr Ile 100 105 110 Ile Ala Phe Thr Ser Cys Ala Cys Gly Leu Phe Gly Lys Glu Leu Leu 115 120 125 His Asn Thr Asn Leu Ile Ser Trp Ser Leu Met Phe Lys Ala Phe Phe 130 135 140 Phe Leu Val Ala Ile Leu Cys Ile Ala Ser Phe Thr Thr Thr Ile Asn 145 150 155 160 Gln Ile Tyr Asp Leu His Ile Asp Arg Ile Asn Lys Pro Asp Leu Pro 165 170 175 Leu Ala Ser Gly Glu Ile Ser Val Asn Thr Ala Trp Ile Met Ser Ile 180 185 190 Ile Val Ala Leu Phe Gly Leu Ile Ile Thr Ile Lys Met Lys Gly Gly 195 200 205 Pro Leu Tyr Ile Phe Gly Tyr Cys Phe Gly Ile Phe Gly Gly Ile Val 210 215 220 Tyr Ser Val Pro Pro Phe Arg Trp Lys Gln Asn Pro Ser Thr Ala Phe 225 230 235 240 Leu Leu Asn Phe Leu Ala His Ile Ile Thr Asn Phe Thr Phe Tyr Tyr 245 250 255 Ala Ser Arg Ala Ala Leu Gly Leu Pro Phe Glu Leu Arg Pro Ser Phe 260 265 270 Thr Phe Leu Leu Ala Phe Met Lys Ser Met Gly Ser Ala Leu Ala Leu 275 280 285 Ile Lys Asp Ala Ser Asp Val Glu Gly Asp Thr Lys Phe Gly Ile Ser 290 295 300 Thr Leu Ala Ser Lys Tyr Gly Ser Arg Asn Leu Thr Leu Phe Cys Ser 305 310 315 320 Gly Ile Val Leu Leu Ser Tyr Val Ala Ala Ile Leu Ala Gly Ile Ile 325 330 335 Trp Pro Gln Ala Phe Asn Ser Asn Val Met Leu Leu Ser His Ala Ile 340 345 350 Leu Ala Phe Trp Leu Ile Leu Gln Thr Arg Asp Phe Ala Leu Thr Asn 355 360 365 Tyr Asp Pro Glu Ala Gly Arg Arg Phe Tyr Glu Phe Met Trp Lys Leu 370 375 380 Tyr Tyr Ala Glu Tyr Leu Val Tyr Val Phe Ile 385 390 395 <210> 11 <211> 398 <212> PRT <213> C. sativa <400> 11 Met Gly Leu Ser Leu Val Cys Thr Phe Ser Phe Gln Thr Asn Tyr His 1 5 10 15 Thr Leu Leu Asn Pro His Asn Lys Asn Pro Lys Asn Ser Leu Leu Ser 20 25 30 Tyr Gln His Pro Lys Thr Pro Ile Ile Lys Ser Ser Tyr Asp Asn Phe 35 40 45 Pro Ser Lys Tyr Cys Leu Thr Lys Asn Phe His Leu Leu Gly Leu Asn 50 55 60 Ser His Asn Arg Ile Ser Ser Gln Ser Arg Ser Ile Arg Ala Gly Ser 65 70 75 80 Asp Gln Ile Glu Gly Ser Pro His His Glu Ser Asp Asn Ser Ile Ala 85 90 95 Thr Lys Ile Leu Asn Phe Gly His Thr Cys Trp Lys Leu Gln Arg Pro 100 105 110 Tyr Val Val Lys Gly Met Ile Ser Ile Ala Cys Gly Leu Phe Gly Arg 115 120 125 Glu Leu Phe Asn Asn Arg His Leu Phe Ser Trp Gly Leu Met Trp Lys 130 135 140 Ala Phe Phe Ala Leu Val Pro Ile Leu Ser Phe Asn Phe Phe Ala Ala 145 150 155 160 Ile Met Asn Gln Ile Tyr Asp Val Asp Ile Asp Arg Ile Asn Lys Pro 165 170 175 Asp Leu Pro Leu Val Ser Gly Glu Met Ser Ile Glu Thr Ala Trp Ile 180 185 190 Leu Ser Ile Ile Val Ala Leu Thr Gly Leu Ile Val Thr Ile Lys Leu 195 200 205 Lys Ser Ala Pro Leu Phe Val Phe Ile Tyr Ile Phe Gly Ile Phe Ala 210 215 220 Gly Phe Ala Tyr Ser Val Pro Pro Ile Arg Trp Lys Gln Tyr Pro Phe 225 230 235 240 Thr Asn Phe Leu Ile Thr Ile Ser Ser His Val Gly Leu Ala Phe Thr 245 250 255 Ser Tyr Ser Ala Thr Thr Ser Ala Leu Gly Leu Pro Phe Val Trp Arg 260 265 270 Pro Ala Phe Ser Phe Ile Ile Ala Phe Met Thr Val Met Gly Met Thr 275 280 285 Ile Ala Phe Ala Lys Asp Ile Ser Asp Ile Glu Gly Asp Ala Lys Tyr 290 295 300 Gly Val Ser Thr Val Ala Thr Lys Leu Gly Ala Arg Asn Met Thr Phe 305 310 315 320 Val Val Ser Gly Val Leu Leu Leu Asn Tyr Leu Val Ser Ile Ser Ile 325 330 335 Gly Ile Ile Trp Pro Gln Val Phe Lys Ser Asn Ile Met Ile Leu Ser 340 345 350 His Ala Ile Leu Ala Phe Cys Leu Ile Phe Gln Thr Arg Glu Leu Ala 355 360 365 Leu Ala Asn Tyr Ala Ser Ala Pro Ser Arg Gln Phe Phe Glu Phe Ile 370 375 380 Trp Leu Leu Tyr Tyr Ala Glu Tyr Phe Val Tyr Val Phe Ile 385 390 395 <210> 12 <211> 323 <212> PRT <213> C. sativa <400> 12 Met Ser Ala Gly Ser Asp Gln Ile Glu Gly Ser Pro His His Glu Ser 1 5 10 15 Asp Asn Ser Ile Ala Thr Lys Ile Leu Asn Phe Gly His Thr Cys Trp 20 25 30 Lys Leu Gln Arg Pro Tyr Val Val Lys Gly Met Ile Ser Ile Ala Cys 35 40 45 Gly Leu Phe Gly Arg Glu Leu Phe Asn Asn Arg His Leu Phe Ser Trp 50 55 60 Gly Leu Met Trp Lys Ala Phe Phe Ala Leu Val Pro Ile Leu Ser Phe 65 70 75 80 Asn Phe Phe Ala Ala Ile Met Asn Gln Ile Tyr Asp Val Asp Ile Asp 85 90 95 Arg Ile Asn Lys Pro Asp Leu Pro Leu Val Ser Gly Glu Met Ser Ile 100 105 110 Glu Thr Ala Trp Ile Leu Ser Ile Ile Val Ala Leu Thr Gly Leu Ile 115 120 125 Val Thr Ile Lys Leu Lys Ser Ala Pro Leu Phe Val Phe Ile Tyr Ile 130 135 140 Phe Gly Ile Phe Ala Gly Phe Ala Tyr Ser Val Pro Pro Ile Arg Trp 145 150 155 160 Lys Gln Tyr Pro Phe Thr Asn Phe Leu Ile Thr Ile Ser Ser His Val 165 170 175 Gly Leu Ala Phe Thr Ser Tyr Ser Ala Thr Thr Ser Ala Leu Gly Leu 180 185 190 Pro Phe Val Trp Arg Pro Ala Phe Ser Phe Ile Ile Ala Phe Met Thr 195 200 205 Val Met Gly Met Thr Ile Ala Phe Ala Lys Asp Ile Ser Asp Ile Glu 210 215 220 Gly Asp Ala Lys Tyr Gly Val Ser Thr Val Ala Thr Lys Leu Gly Ala 225 230 235 240 Arg Asn Met Thr Phe Val Val Ser Gly Val Leu Leu Leu Asn Tyr Leu 245 250 255 Val Ser Ile Ser Ile Gly Ile Ile Trp Pro Gln Val Phe Lys Ser Asn 260 265 270 Ile Met Ile Leu Ser His Ala Ile Leu Ala Phe Cys Leu Ile Phe Gln 275 280 285 Thr Arg Glu Leu Ala Leu Ala Asn Tyr Ala Ser Ala Pro Ser Arg Gln 290 295 300 Phe Phe Glu Phe Ile Trp Leu Leu Tyr Tyr Ala Glu Tyr Phe Val Tyr 305 310 315 320 Val Phe Ile <210> 13 <211> 544 <212> PRT <213> C. sativa <400> 13 Met Lys Cys Ser Thr Phe Ser Phe Trp Phe Val Cys Lys Ile Ile Phe 1 5 10 15 Phe Phe Phe Ser Phe Asn Ile Gln Thr Ser Ile Ala Asn Pro Arg Glu 20 25 30 Asn Phe Leu Lys Cys Phe Ser Gln Tyr Ile Pro Asn Asn Ala Thr Asn 35 40 45 Leu Lys Leu Val Tyr Thr Gln Asn Asn Pro Leu Tyr Met Ser Val Leu 50 55 60 Asn Ser Thr Ile His Asn Leu Arg Phe Thr Ser Asp Thr Thr Pro Lys 65 70 75 80 Pro Leu Val Ile Val Thr Pro Ser His Val Ser His Ile Gln Gly Thr 85 90 95 Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile Arg Thr Arg Ser Gly 100 105 110 Gly His Asp Ser Glu Gly Met Ser Tyr Ile Ser Gln Val Pro Phe Val 115 120 125 Ile Val Asp Leu Arg Asn Met Arg Ser Ile Lys Ile Asp Val His Ser 130 135 140 Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu Gly Glu Val Tyr Tyr 145 150 155 160 Trp Val Asn Glu Lys Asn Glu Asn Leu Ser Leu Ala Ala Gly Tyr Cys 165 170 175 Pro Thr Val Cys Ala Gly Gly His Phe Gly Gly Gly Gly Tyr Gly Pro 180 185 190 Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn Ile Ile Asp Ala His 195 200 205 Leu Val Asn Val His Gly Lys Val Leu Asp Arg Lys Ser Met Gly Glu 210 215 220 Asp Leu Phe Trp Ala Leu Arg Gly Gly Gly Ala Glu Ser Phe Gly Ile 225 230 235 240 Ile Val Ala Trp Lys Ile Arg Leu Val Ala Val Pro Lys Ser Thr Met 245 250 255 Phe Ser Val Lys Lys Ile Met Glu Ile His Glu Leu Val Lys Leu Val 260 265 270 Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp Lys Asp Leu Leu Leu 275 280 285 Met Thr His Phe Ile Thr Arg Asn Ile Thr Asp Asn Gln Gly Lys Asn 290 295 300 Lys Thr Ala Ile His Thr Tyr Phe Ser Ser Val Phe Leu Gly Gly Val 305 310 315 320 Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe Pro Glu Leu Gly Ile 325 330 335 Lys Lys Thr Asp Cys Arg Gln Leu Ser Trp Ile Asp Thr Ile Ile Phe 340 345 350 Tyr Ser Gly Val Val Asn Tyr Asp Thr Asp Asn Phe Asn Lys Glu Ile 355 360 365 Leu Leu Asp Arg Ser Ala Gly Gln Asn Gly Ala Phe Lys Ile Lys Leu 370 375 380 Asp Tyr Val Lys Lys Pro Ile Pro Glu Ser Val Phe Val Gln Ile Leu 385 390 395 400 Glu Lys Leu Tyr Glu Glu Asp Ile Gly Ala Gly Met Tyr Ala Leu Tyr 405 410 415 Pro Tyr Gly Gly Ile Met Asp Glu Ile Ser Glu Ser Ala Ile Pro Phe 420 425 430 Pro His Arg Ala Gly Ile Leu Tyr Glu Leu Trp Tyr Ile Cys Ser Trp 435 440 445 Glu Lys Gln Glu Asp Asn Glu Lys His Leu Asn Trp Ile Arg Asn Ile 450 455 460 Tyr Asn Phe Met Thr Pro Tyr Val Ser Lys Asn Pro Arg Leu Ala Tyr 465 470 475 480 Leu Asn Tyr Arg Asp Leu Asp Ile Gly Ile Asn Asp Pro Lys Asn Pro 485 490 495 Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu Lys Tyr Phe Gly Lys 500 505 510 Asn Phe Asp Arg Leu Val Lys Val Lys Thr Leu Val Asp Pro Asn Asn 515 520 525 Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu Pro Arg His Arg His 530 535 540 <210> 14 <211> 545 <212> PRT <213> C. sativa <400> 14 Met Asn Cys Ser Ala Phe Ser Phe Trp Phe Val Cys Lys Ile Ile Phe 1 5 10 15 Phe Phe Leu Ser Phe His Ile Gln Ile Ser Ile Ala Asn Pro Arg Glu 20 25 30 Asn Phe Leu Lys Cys Phe Ser Lys His Ile Pro Asn Asn Val Ala Asn 35 40 45 Pro Lys Leu Val Tyr Thr Gln His Asp Gln Leu Tyr Met Ser Ile Leu 50 55 60 Asn Ser Thr Ile Gln Asn Leu Arg Phe Ile Ser Asp Thr Thr Pro Lys 65 70 75 80 Pro Leu Val Ile Val Thr Pro Ser Asn Asn Ser His Ile Gln Ala Thr 85 90 95 Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile Arg Thr Arg Ser Gly 100 105 110 Gly His Asp Ala Glu Gly Met Ser Tyr Ile Ser Gln Val Pro Phe Val 115 120 125 Val Val Asp Leu Arg Asn Met His Ser Ile Lys Ile Asp Val His Ser 130 135 140 Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu Gly Glu Val Tyr Tyr 145 150 155 160 Trp Ile Asn Glu Lys Asn Glu Asn Leu Ser Phe Pro Gly Gly Tyr Cys 165 170 175 Pro Thr Val Gly Val Gly Gly His Phe Ser Gly Gly Gly Tyr Gly Ala 180 185 190 Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn Ile Ile Asp Ala His 195 200 205 Leu Val Asn Val Asp Gly Lys Val Leu Asp Arg Lys Ser Met Gly Glu 210 215 220 Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly Gly Glu Asn Phe Gly Ile 225 230 235 240 Ile Ala Ala Trp Lys Ile Lys Leu Val Ala Val Pro Ser Lys Ser Thr 245 250 255 Ile Phe Ser Val Lys Lys Asn Met Glu Ile His Gly Leu Val Lys Leu 260 265 270 Phe Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp Lys Asp Leu Val 275 280 285 Leu Met Thr His Phe Ile Thr Lys Asn Ile Thr Asp Asn His Gly Lys 290 295 300 Asn Lys Thr Thr Val His Gly Tyr Phe Ser Ser Ile Phe His Gly Gly 305 310 315 320 Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe Pro Glu Leu Gly 325 330 335 Ile Lys Lys Thr Asp Cys Lys Glu Phe Ser Trp Ile Asp Thr Thr Ile 340 345 350 Phe Tyr Ser Gly Val Val Asn Phe Asn Thr Ala Asn Phe Lys Lys Glu 355 360 365 Ile Leu Leu Asp Arg Ser Ala Gly Lys Lys Thr Ala Phe Ser Ile Lys 370 375 380 Leu Asp Tyr Val Lys Lys Pro Ile Pro Glu Thr Ala Met Val Lys Ile 385 390 395 400 Leu Glu Lys Leu Tyr Glu Glu Asp Val Gly Ala Gly Met Tyr Val Leu 405 410 415 Tyr Pro Tyr Gly Gly Ile Met Glu Glu Ile Ser Glu Ser Ala Ile Pro 420 425 430 Phe Pro His Arg Ala Gly Ile Met Tyr Glu Leu Trp Tyr Thr Ala Ser 435 440 445 Trp Glu Lys Gln Glu Asp Asn Glu Lys His Ile Asn Trp Val Arg Ser 450 455 460 Val Tyr Asn Phe Thr Thr Pro Tyr Val Ser Gln Asn Pro Arg Leu Ala 465 470 475 480 Tyr Leu Asn Tyr Arg Asp Leu Asp Leu Gly Lys Thr Asn His Ala Ser 485 490 495 Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu Lys Tyr Phe Gly 500 505 510 Lys Asn Phe Asn Arg Leu Val Lys Val Lys Thr Lys Val Asp Pro Asn 515 520 525 Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu Pro Pro His His 530 535 540 His 545 <210> 15 <211> 545 <212> PRT <213> C. sativa <400> 15 Met Asn Cys Ser Thr Phe Ser Phe Trp Phe Val Cys Lys Ile Ile Phe 1 5 10 15 Phe Phe Leu Ser Phe Asn Ile Gln Ile Ser Ile Ala Asn Pro Gln Glu 20 25 30 Asn Phe Leu Lys Cys Phe Ser Glu Tyr Ile Pro Asn Asn Pro Ala Asn 35 40 45 Pro Lys Phe Ile Tyr Thr Gln His Asp Gln Leu Tyr Met Ser Val Leu 50 55 60 Asn Ser Thr Ile Gln Asn Leu Arg Phe Thr Ser Asp Thr Thr Pro Lys 65 70 75 80 Pro Leu Val Ile Val Thr Pro Ser Asn Val Ser His Ile Gln Ala Ser 85 90 95 Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile Arg Thr Arg Ser Gly 100 105 110 Gly His Asp Ala Glu Gly Leu Ser Tyr Ile Ser Gln Val Pro Phe Ala 115 120 125 Ile Val Asp Leu Arg Asn Met His Thr Val Lys Val Asp Ile His Ser 130 135 140 Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu Gly Glu Val Tyr Tyr 145 150 155 160 Trp Ile Asn Glu Met Asn Glu Asn Phe Ser Phe Pro Gly Gly Tyr Cys 165 170 175 Pro Thr Val Gly Val Gly Gly His Phe Ser Gly Gly Gly Tyr Gly Ala 180 185 190 Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn Ile Ile Asp Ala His 195 200 205 Leu Val Asn Val Asp Gly Lys Val Leu Asp Arg Lys Ser Met Gly Glu 210 215 220 Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly Gly Glu Asn Phe Gly Ile 225 230 235 240 Ile Ala Ala Cys Lys Ile Lys Leu Val Val Val Pro Ser Lys Ala Thr 245 250 255 Ile Phe Ser Val Lys Lys Asn Met Glu Ile His Gly Leu Val Lys Leu 260 265 270 Phe Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp Lys Asp Leu Met 275 280 285 Leu Thr Thr His Phe Arg Thr Arg Asn Ile Thr Asp Asn His Gly Lys 290 295 300 Asn Lys Thr Thr Val His Gly Tyr Phe Ser Ser Ile Phe Leu Gly Gly 305 310 315 320 Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe Pro Glu Leu Gly 325 330 335 Ile Lys Lys Thr Asp Cys Lys Glu Leu Ser Trp Ile Asp Thr Thr Ile 340 345 350 Phe Tyr Ser Gly Val Val Asn Tyr Asn Thr Ala Asn Phe Lys Lys Glu 355 360 365 Ile Leu Leu Asp Arg Ser Ala Gly Lys Lys Thr Ala Phe Ser Ile Lys 370 375 380 Leu Asp Tyr Val Lys Lys Leu Ile Pro Glu Thr Ala Met Val Lys Ile 385 390 395 400 Leu Glu Lys Leu Tyr Glu Glu Glu Val Gly Val Gly Met Tyr Val Leu 405 410 415 Tyr Pro Tyr Gly Gly Ile Met Asp Glu Ile Ser Glu Ser Ala Ile Pro 420 425 430 Phe Pro His Arg Ala Gly Ile Met Tyr Glu Leu Trp Tyr Thr Ala Thr 435 440 445 Trp Glu Lys Gln Glu Asp Asn Glu Lys His Ile Asn Trp Val Arg Ser 450 455 460 Val Tyr Asn Phe Thr Thr Pro Tyr Val Ser Gln Asn Pro Arg Leu Ala 465 470 475 480 Tyr Leu Asn Tyr Arg Asp Leu Asp Leu Gly Lys Thr Asn Pro Glu Ser 485 490 495 Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu Lys Tyr Phe Gly 500 505 510 Lys Asn Phe Asn Arg Leu Val Lys Val Lys Thr Lys Ala Asp Pro Asn 515 520 525 Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu Pro Pro Arg His 530 535 540 His 545 <210> 16 <211> 18 <212> PRT <213> Saccharomyces cerevisiae <400> 16 Lys Phe Ile Ser Thr Phe Leu Thr Phe Ile Leu Ala Ala Val Ser Val 1 5 10 15 Thr Ala <210> 17 <211> 4 <212> PRT <213> Saccharomyces cerevisiae <400> 17 His Asp Glu Leu 1 <210> 18 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 18 aagtttatca gtaccttctt gacctttatc ttggccgctg tctccgtaac cgct 54 <210> 19 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 19 catgatgaat ta 12 <210> 20 <211> 545 <212> PRT <213> C. sativa <400> 20 Met Asn Cys Ser Ala Phe Ser Phe Trp Phe Val Cys Lys Ile Ile Phe 1 5 10 15 Phe Phe Leu Ser Phe Asn Ile Gln Ile Ser Ile Ala Asn Pro Gln Glu 20 25 30 Asn Phe Leu Lys Cys Phe Ser Glu Tyr Ile Pro Asn Asn Pro Ala Asn 35 40 45 Pro Lys Phe Ile Tyr Thr Gln His Asp Gln Leu Tyr Met Ser Val Leu 50 55 60 Asn Ser Thr Ile Gln Asn Leu Arg Phe Thr Ser Asp Thr Thr Pro Lys 65 70 75 80 Pro Leu Val Ile Val Thr Pro Ser Asn Val Ser His Ile Gln Ala Ser 85 90 95 Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile Arg Thr Arg Ser Gly 100 105 110 Gly His Asp Ala Glu Gly Met Ser Tyr Ile Ser Gln Val Pro Phe Val 115 120 125 Val Val Asp Leu Arg Asn Met His Ser Ile Lys Ile Asp Val His Ser 130 135 140 Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu Gly Glu Val Tyr Tyr 145 150 155 160 Trp Ile Asn Glu Lys Asn Glu Asn Phe Ser Phe Pro Gly Gly Tyr Cys 165 170 175 Pro Thr Val Gly Val Gly Gly His Phe Ser Gly Gly Gly Tyr Gly Ala 180 185 190 Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn Ile Ile Asp Ala His 195 200 205 Leu Val Asn Val Asp Gly Lys Val Leu Asp Arg Lys Ser Met Gly Glu 210 215 220 Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly Gly Glu Asn Phe Gly Ile 225 230 235 240 Ile Ala Ala Trp Lys Ile Lys Leu Val Ala Val Pro Ser Lys Ser Thr 245 250 255 Ile Phe Ser Val Lys Lys Asn Met Glu Ile His Gly Leu Val Lys Leu 260 265 270 Phe Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp Lys Asp Leu Val 275 280 285 Leu Met Thr His Phe Ile Thr Lys Asn Ile Thr Asp Asn His Gly Lys 290 295 300 Asn Lys Thr Thr Val His Gly Tyr Phe Ser Ser Ile Phe His Gly Gly 305 310 315 320 Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe Pro Glu Leu Gly 325 330 335 Ile Lys Lys Thr Asp Cys Lys Glu Phe Ser Trp Ile Asp Thr Thr Ile 340 345 350 Phe Tyr Ser Gly Val Val Asn Phe Asn Thr Ala Asn Phe Lys Lys Glu 355 360 365 Ile Leu Leu Asp Arg Ser Ala Gly Lys Lys Thr Ala Phe Ser Ile Lys 370 375 380 Leu Asp Tyr Val Lys Lys Pro Ile Pro Glu Thr Ala Met Val Lys Ile 385 390 395 400 Leu Glu Lys Leu Tyr Glu Glu Asp Val Gly Val Gly Met Tyr Val Leu 405 410 415 Tyr Pro Tyr Gly Gly Ile Met Glu Glu Ile Ser Glu Ser Ala Ile Pro 420 425 430 Phe Pro His Arg Ala Gly Ile Met Tyr Glu Leu Trp Tyr Thr Ala Ser 435 440 445 Trp Glu Lys Gln Glu Asp Asn Glu Lys His Ile Asn Trp Val Arg Ser 450 455 460 Val Tyr Asn Phe Thr Thr Pro Tyr Val Ser Gln Asn Pro Arg Leu Ala 465 470 475 480 Tyr Leu Asn Tyr Arg Asp Leu Asp Leu Gly Lys Thr Asn Pro Glu Ser 485 490 495 Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu Lys Tyr Phe Gly 500 505 510 Lys Asn Phe Asn Arg Leu Val Lys Val Lys Thr Lys Ala Asp Pro Asn 515 520 525 Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu Pro Pro His His 530 535 540 His 545 <210> 21 <211> 517 <212> PRT <213> C. sativa <400> 21 Asn Pro Gln Glu Asn Phe Leu Lys Cys Phe Ser Glu Tyr Ile Pro Asn 1 5 10 15 Asn Pro Ala Asn Pro Lys Phe Ile Tyr Thr Gln His Asp Gln Leu Tyr 20 25 30 Met Ser Val Leu Asn Ser Thr Ile Gln Asn Leu Arg Phe Thr Ser Asp 35 40 45 Thr Thr Pro Lys Pro Leu Val Ile Val Thr Pro Ser Asn Val Ser His 50 55 60 Ile Gln Ala Ser Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile Arg 65 70 75 80 Thr Arg Ser Gly Gly His Asp Ala Glu Gly Met Ser Tyr Ile Ser Gln 85 90 95 Val Pro Phe Val Val Val Asp Leu Arg Asn Met His Ser Ile Lys Ile 100 105 110 Asp Val His Ser Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu Gly 115 120 125 Glu Val Tyr Tyr Trp Ile Asn Glu Lys Asn Glu Asn Phe Ser Phe Pro 130 135 140 Gly Gly Tyr Cys Pro Thr Val Gly Val Gly Gly His Phe Ser Gly Gly 145 150 155 160 Gly Tyr Gly Ala Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn Ile 165 170 175 Ile Asp Ala His Leu Val Asn Val Asp Gly Lys Val Leu Asp Arg Lys 180 185 190 Ser Met Gly Glu Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly Gly Glu 195 200 205 Asn Phe Gly Ile Ile Ala Ala Trp Lys Ile Lys Leu Val Ala Val Pro 210 215 220 Ser Lys Ser Thr Ile Phe Ser Val Lys Lys Asn Met Glu Ile His Gly 225 230 235 240 Leu Val Lys Leu Phe Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp 245 250 255 Lys Asp Leu Val Leu Met Thr His Phe Ile Thr Lys Asn Ile Thr Asp 260 265 270 Asn His Gly Lys Asn Lys Thr Thr Val His Gly Tyr Phe Ser Ser Ile 275 280 285 Phe His Gly Gly Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe 290 295 300 Pro Glu Leu Gly Ile Lys Lys Thr Asp Cys Lys Glu Phe Ser Trp Ile 305 310 315 320 Asp Thr Thr Ile Phe Tyr Ser Gly Val Val Asn Phe Asn Thr Ala Asn 325 330 335 Phe Lys Lys Glu Ile Leu Leu Asp Arg Ser Ala Gly Lys Lys Thr Ala 340 345 350 Phe Ser Ile Lys Leu Asp Tyr Val Lys Lys Pro Ile Pro Glu Thr Ala 355 360 365 Met Val Lys Ile Leu Glu Lys Leu Tyr Glu Glu Asp Val Gly Val Gly 370 375 380 Met Tyr Val Leu Tyr Pro Tyr Gly Gly Ile Met Glu Glu Ile Ser Glu 385 390 395 400 Ser Ala Ile Pro Phe Pro His Arg Ala Gly Ile Met Tyr Glu Leu Trp 405 410 415 Tyr Thr Ala Ser Trp Glu Lys Gln Glu Asp Asn Glu Lys His Ile Asn 420 425 430 Trp Val Arg Ser Val Tyr Asn Phe Thr Thr Pro Tyr Val Ser Gln Asn 435 440 445 Pro Arg Leu Ala Tyr Leu Asn Tyr Arg Asp Leu Asp Leu Gly Lys Thr 450 455 460 Asn Pro Glu Ser Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu 465 470 475 480 Lys Tyr Phe Gly Lys Asn Phe Asn Arg Leu Val Lys Val Lys Thr Lys 485 490 495 Ala Asp Pro Asn Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu 500 505 510 Pro Pro His His His 515 <210> 22 <211> 1551 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 22 aacccgcaag aaaactttct aaaatgcttt tctgaataca ttcctaacaa ccctgccaac 60 ccgaagttta tctacacaca acacgatcaa ttgtatatga gcgtgttgaa tagtacaata 120 cagaacctga ggtttacatc cgacacaacg ccgaaaccgc tagtgatcgt cacaccctcc 180 aacgtaagcc acattcaggc aagcatttta tgcagcaaga aagtcggact gcagataagg 240 acgaggtccg gaggacacga cgccgaaggg atgagctata tctcccaggt accttttgtg 300 gtggtagact tgagaaatat gcactctatc aagatagacg ttcactccca aaccgcttgg 360 gttgaggcgg gagccaccct tggtgaggtc tactactgga tcaacgaaaa gaatgaaaat 420 tttagctttc ctgggggata ttgcccaact gtaggtgttg gcggccactt ctcaggaggc 480 ggttatgggg ccttgatgcg taactacgga cttgcggccg acaacattat agacgcacat 540 ctagtgaatg tagacggcaa agttttagac aggaagagca tgggtgagga tcttttttgg 600 gcaattagag gcggaggggg agaaaatttt ggaattatcg ctgcttggaa aattaagcta 660 gttgcggtac cgagcaaaag cactatattc tctgtaaaaa agaacatgga gatacatggt 720 ttggtgaagc tttttaataa gtggcaaaac atcgcgtaca agtacgacaa agatctggtt 780 ctgatgacgc attttataac gaaaaatatc accgacaacc acggaaaaaa caaaaccaca 840 gtacatggct acttctctag tatatttcat gggggagtcg attctctggt tgatttaatg 900 aacaaatcat tcccagagtt gggtataaag aagacagact gtaaggagtt ctcttggatt 960 gacacaacta tattctattc aggcgtagtc aactttaaca cggcgaattt caaaaaagag 1020 atccttctgg acagatccgc aggtaagaaa actgcgttct ctatcaaatt ggactatgtg 1080 aagaagccta ttcccgaaac cgcgatggtc aagatacttg agaaattata cgaggaagat 1140 gtgggagttg gaatgtacgt actttatccc tatggtggga taatggaaga aatcagcgag 1200 agcgccattc catttcccca tcgtgccggc atcatgtacg agctgtggta tactgcgagt 1260 tgggagaagc aagaagacaa cgaaaagcac attaactggg tcagatcagt ttacaatttc 1320 accaccccat acgtgtccca gaatccgcgt ctggcttact tgaactaccg tgatcttgac 1380 ctgggtaaaa cgaacccgga gtcacccaac aattacactc aagctagaat ctggggagag 1440 aaatactttg ggaagaactt caacaggtta gtaaaggtta aaaccaaggc agatccaaac 1500 aactttttta gaaatgaaca atccattccc ccgctacccc cgcaccatca c 1551 <210> 23 <211> 540 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 23 Met Lys Phe Ile Ser Thr Phe Leu Thr Phe Ile Leu Ala Ala Val Ser 1 5 10 15 Val Thr Ala Asn Pro Gln Glu Asn Phe Leu Lys Cys Phe Ser Glu Tyr 20 25 30 Ile Pro Asn Asn Pro Ala Asn Pro Lys Phe Ile Tyr Thr Gln His Asp 35 40 45 Gln Leu Tyr Met Ser Val Leu Asn Ser Thr Ile Gln Asn Leu Arg Phe 50 55 60 Thr Ser Asp Thr Thr Pro Lys Pro Leu Val Ile Val Thr Pro Ser Asn 65 70 75 80 Val Ser His Ile Gln Ala Ser Ile Leu Cys Ser Lys Lys Val Gly Leu 85 90 95 Gln Ile Arg Thr Arg Ser Gly Gly His Asp Ala Glu Gly Met Ser Tyr 100 105 110 Ile Ser Gln Val Pro Phe Val Val Val Asp Leu Arg Asn Met His Ser 115 120 125 Ile Lys Ile Asp Val His Ser Gln Thr Ala Trp Val Glu Ala Gly Ala 130 135 140 Thr Leu Gly Glu Val Tyr Tyr Trp Ile Asn Glu Lys Asn Glu Asn Phe 145 150 155 160 Ser Phe Pro Gly Gly Tyr Cys Pro Thr Val Gly Val Gly Gly His Phe 165 170 175 Ser Gly Gly Gly Tyr Gly Ala Leu Met Arg Asn Tyr Gly Leu Ala Ala 180 185 190 Asp Asn Ile Ile Asp Ala His Leu Val Asn Val Asp Gly Lys Val Leu 195 200 205 Asp Arg Lys Ser Met Gly Glu Asp Leu Phe Trp Ala Ile Arg Gly Gly 210 215 220 Gly Gly Glu Asn Phe Gly Ile Ile Ala Ala Trp Lys Ile Lys Leu Val 225 230 235 240 Ala Val Pro Ser Lys Ser Thr Ile Phe Ser Val Lys Lys Asn Met Glu 245 250 255 Ile His Gly Leu Val Lys Leu Phe Asn Lys Trp Gln Asn Ile Ala Tyr 260 265 270 Lys Tyr Asp Lys Asp Leu Val Leu Met Thr His Phe Ile Thr Lys Asn 275 280 285 Ile Thr Asp Asn His Gly Lys Asn Lys Thr Thr Val His Gly Tyr Phe 290 295 300 Ser Ser Ile Phe His Gly Gly Val Asp Ser Leu Val Asp Leu Met Asn 305 310 315 320 Lys Ser Phe Pro Glu Leu Gly Ile Lys Lys Thr Asp Cys Lys Glu Phe 325 330 335 Ser Trp Ile Asp Thr Thr Ile Phe Tyr Ser Gly Val Val Asn Phe Asn 340 345 350 Thr Ala Asn Phe Lys Lys Glu Ile Leu Leu Asp Arg Ser Ala Gly Lys 355 360 365 Lys Thr Ala Phe Ser Ile Lys Leu Asp Tyr Val Lys Lys Pro Ile Pro 370 375 380 Glu Thr Ala Met Val Lys Ile Leu Glu Lys Leu Tyr Glu Glu Asp Val 385 390 395 400 Gly Val Gly Met Tyr Val Leu Tyr Pro Tyr Gly Gly Ile Met Glu Glu 405 410 415 Ile Ser Glu Ser Ala Ile Pro Phe Pro His Arg Ala Gly Ile Met Tyr 420 425 430 Glu Leu Trp Tyr Thr Ala Ser Trp Glu Lys Gln Glu Asp Asn Glu Lys 435 440 445 His Ile Asn Trp Val Arg Ser Val Tyr Asn Phe Thr Thr Pro Tyr Val 450 455 460 Ser Gln Asn Pro Arg Leu Ala Tyr Leu Asn Tyr Arg Asp Leu Asp Leu 465 470 475 480 Gly Lys Thr Asn Pro Glu Ser Pro Asn Asn Tyr Thr Gln Ala Arg Ile 485 490 495 Trp Gly Glu Lys Tyr Phe Gly Lys Asn Phe Asn Arg Leu Val Lys Val 500 505 510 Lys Thr Lys Ala Asp Pro Asn Asn Phe Phe Arg Asn Glu Gln Ser Ile 515 520 525 Pro Pro Leu Pro Pro His His His His Asp Glu Leu 530 535 540 <210> 24 <211> 1620 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 24 atgaagttta tcagtacctt cttgaccttt atcttggccg ctgtctccgt aaccgctaac 60 ccgcaagaaa actttctaaa atgcttttct gaatacattc ctaacaaccc tgccaacccg 120 aagtttatct acacacaaca cgatcaattg tatatgagcg tgttgaatag tacaatacag 180 aacctgaggt ttacatccga cacaacgccg aaaccgctag tgatcgtcac accctccaac 240 gtaagccaca ttcaggcaag cattttatgc agcaagaaag tcggactgca gataaggacg 300 aggtccggag gacacgacgc cgaagggatg agctatatct cccaggtacc ttttgtggtg 360 gtagacttga gaaatatgca ctctatcaag atagacgttc actcccaaac cgcttgggtt 420 gaggcgggag ccacccttgg tgaggtctac tactggatca acgaaaagaa tgaaaatttt 480 agctttcctg ggggatattg cccaactgta ggtgttggcg gccacttctc aggaggcggt 540 tatggggcct tgatgcgtaa ctacggactt gcggccgaca acattataga cgcacatcta 600 gtgaatgtag acggcaaagt tttagacagg aagagcatgg gtgaggatct tttttgggca 660 attagaggcg gagggggaga aaattttgga attatcgctg cttggaaaat taagctagtt 720 gcggtaccga gcaaaagcac tatattctct gtaaaaaaga acatggagat acatggtttg 780 gtgaagcttt ttaataagtg gcaaaacatc gcgtacaagt acgacaaaga tctggttctg 840 atgacgcatt ttataacgaa aaatatcacc gacaaccacg gaaaaaacaa aaccacagta 900 catggctact tctctagtat atttcatggg ggagtcgatt ctctggttga tttaatgaac 960 aaatcattcc cagagttggg tataaagaag acagactgta aggagttctc ttggattgac 1020 acaactatat tctattcagg cgtagtcaac tttaacacgg cgaatttcaa aaaagagatc 1080 cttctggaca gatccgcagg taagaaaact gcgttctcta tcaaattgga ctatgtgaag 1140 aagcctattc ccgaaaccgc gatggtcaag atacttgaga aattatacga ggaagatgtg 1200 ggagttggaa tgtacgtact ttatccctat ggtgggataa tggaagaaat cagcgagagc 1260 gccattccat ttccccatcg tgccggcatc atgtacgagc tgtggtatac tgcgagttgg 1320 gagaagcaag aagacaacga aaagcacatt aactgggtca gatcagttta caatttcacc 1380 accccatacg tgtcccagaa tccgcgtctg gcttacttga actaccgtga tcttgacctg 1440 ggtaaaacga acccggagtc acccaacaat tacactcaag ctagaatctg gggagagaaa 1500 tactttggga agaacttcaa caggttagta aaggttaaaa ccaaggcaga tccaaacaac 1560 ttttttagaa atgaacaatc cattcccccg ctacccccgc accatcacca tgatgaatta 1620 <210> 25 <211> 472 <212> PRT <213> Aspergillus niger <400> 25 Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala Leu 1 5 10 15 Gly Gly Asn Ser Ala Leu Ala Val Phe Pro Asn Glu Leu Leu Trp Thr 20 25 30 Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala Ala 35 40 45 Ile Thr Tyr Pro Glu Thr Ala Ala Gln Ile Ala Gly Val Val Lys Cys 50 55 60 Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His Ser 65 70 75 80 Phe Gly Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val Val Val Asp 85 90 95 Met Lys His Phe Thr Gln Phe Ser Met Asp Asp Glu Thr Tyr Glu Ala 100 105 110 Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu Tyr 115 120 125 Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile Lys 130 135 140 Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg Gln 145 150 155 160 Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu Ala 165 170 175 Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val Phe 180 185 190 Phe Ala Val Lys Gly Ala Ala Ala Asn Phe Gly Ile Val Thr Glu Phe 195 200 205 Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser Tyr 210 215 220 Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys Asp 225 230 235 240 Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr Asn 245 250 255 Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe Phe 260 265 270 Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe Ala 275 280 285 Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly Met 290 295 300 Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn Thr 305 310 315 320 Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr Leu 325 330 335 Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Ala Asn His 340 345 350 Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly Gly 355 360 365 Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg Asp 370 375 380 Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Val Gly Pro Ile 385 390 395 400 Ser Asp Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu Ala 405 410 415 Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro Asp 420 425 430 Pro Arg Met Glu Asp Ala Gln Gln Lys Tyr Trp Arg Thr Asn Leu Pro 435 440 445 Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe His 450 455 460 His Pro Gln Gly Val Met Pro Ala 465 470 <210> 26 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 26 ggtaatacga cctctattgc cggcagagat tgtttgatct cagctttagg tggtaactcc 60 gctcttgcag tttttccaaa cgagttgcta tggacagctg acgtacacga atataatctg 120 aacttgcctg tcactcccgc tgctataacc tacccagaaa ccgccgctca gattgccggt 180 gtggttaagt gcgcttctga ttacgactat aaagtccaag caaggtccgg aggtcatagt 240 ttcggtaatt acggcttggg tggagctgac ggtgcagttg tcgttgatat gaagcacttc 300 actcaatttt cgatggacga tgaaacttac gaagctgtta tcggtccagg tacaacttta 360 aacgatgtcg acatcgaatt gtacaacaac ggtaaaagag ccatggctca tggtgtatgt 420 ccaaccatta agactggtgg tcacttcacc atcggtggtc taggacctac ggctcgtcaa 480 tggggtctgg ctttggacca tgtcgaggaa gttgaagttg tgttagctaa ctctagcatt 540 gttagagcct ctaatacaca aaatcaagat gttttctttg cagtcaaggg tgctgctgct 600 aacttcggaa tcgtcactga atttaaagtt agaactgaac cagccccagg tttggctgta 660 cagtactcct ataccttcaa cttgggttca actgccgaga aggctcaatt cgttaaggat 720 tggcaatctt tcatttcggc taagaaccta accagacaat tttataataa catggtcatt 780 tttgatggtg acataatctt ggaaggttta ttcttcggta gcaaggaaca atacgacgcc 840 ttgggccttg aagatcactt cgcaccaaag aatccaggta acatattggt tttaacagat 900 tggctaggca tggtgggtca cgcattggaa gacactattt taaaattggt cggtaatacc 960 ccaacatggt tctatgctaa gtccttgggt tttagacaag acactctgat cccttctgcc 1020 ggtattgacg aatttttcga atacattgct aaccataccg ccggcactcc tgcttggttt 1080 gttactttgt ccttagaggg tggtgctatc aacgatgtcg cagaagatgc tacggcctat 1140 gctcacagag atgttttgtt ctgggtccaa ctattcatgg ttaatccagt cggtcctatc 1200 tctgacacta cctacgagtt tacagacggc ttgtacgatg tgttggcccg tgctgttcca 1260 gaaagcgtgg gacatgctta ccttggttgt ccagatccaa gaatggaaga cgctcaacag 1320 aagtattggc gtaccaattt gccccgtctg caagaactaa aggaagagtt ggatccaaaa 1380 aacaccttcc atcacccaca gggtgttatg ccagcttaa 1419 <210> 27 <211> 473 <212> PRT <213> Aspergillus niger <400> 27 Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala 1 5 10 15 Leu Gly Gly Asn Ser Ala Leu Ala Val Phe Pro Asn Glu Leu Leu Trp 20 25 30 Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala 35 40 45 Ala Ile Thr Tyr Pro Glu Thr Ala Ala Gln Ile Ala Gly Val Val Lys 50 55 60 Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His 65 70 75 80 Ser Phe Gly Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val Val Val 85 90 95 Asp Met Lys His Phe Thr Gln Phe Ser Met Asp Asp Glu Thr Tyr Glu 100 105 110 Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu 115 120 125 Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile 130 135 140 Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg 145 150 155 160 Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu 165 170 175 Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val 180 185 190 Phe Phe Ala Val Lys Gly Ala Ala Ala Asn Phe Gly Ile Val Thr Glu 195 200 205 Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser 210 215 220 Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys 225 230 235 240 Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr 245 250 255 Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe 260 265 270 Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe 275 280 285 Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly 290 295 300 Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn 305 310 315 320 Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr 325 330 335 Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Ala Asn 340 345 350 His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly 355 360 365 Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg 370 375 380 Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Val Gly Pro 385 390 395 400 Ile Ser Asp Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu 405 410 415 Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro 420 425 430 Asp Pro Arg Met Glu Asp Ala Gln Gln Lys Tyr Trp Arg Thr Asn Leu 435 440 445 Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe 450 455 460 His His Pro Gln Gly Val Met Pro Ala 465 470 <210> 28 <211> 1422 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 28 atgggtaata cgacctctat tgccggcaga gattgtttga tctcagcttt aggtggtaac 60 tccgctcttg cagtttttcc aaacgagttg ctatggacag ctgacgtaca cgaatataat 120 ctgaacttgc ctgtcactcc cgctgctata acctacccag aaaccgccgc tcagattgcc 180 ggtgtggtta agtgcgcttc tgattacgac tataaagtcc aagcaaggtc cggaggtcat 240 agtttcggta attacggctt gggtggagct gacggtgcag ttgtcgttga tatgaagcac 300 ttcactcaat tttcgatgga cgatgaaact tacgaagctg ttatcggtcc aggtacaact 360 ttaaacgatg tcgacatcga attgtacaac aacggtaaaa gagccatggc tcatggtgta 420 tgtccaacca ttaagactgg tggtcacttc accatcggtg gtctaggacc tacggctcgt 480 caatggggtc tggctttgga ccatgtcgag gaagttgaag ttgtgttagc taactctagc 540 attgttagag cctctaatac acaaaatcaa gatgttttct ttgcagtcaa gggtgctgct 600 gctaacttcg gaatcgtcac tgaatttaaa gttagaactg aaccagcccc aggtttggct 660 gtacagtact cctatacctt caacttgggt tcaactgccg agaaggctca attcgttaag 720 gattggcaat ctttcatttc ggctaagaac ctaaccagac aattttataa taacatggtc 780 atttttgatg gtgacataat cttggaaggt ttattcttcg gtagcaagga acaatacgac 840 gccttgggcc ttgaagatca cttcgcacca aagaatccag gtaacatatt ggttttaaca 900 gattggctag gcatggtggg tcacgcattg gaagacacta ttttaaaatt ggtcggtaat 960 accccaacat ggttctatgc taagtccttg ggttttagac aagacactct gatcccttct 1020 gccggtattg acgaattttt cgaatacatt gctaaccata ccgccggcac tcctgcttgg 1080 tttgttactt tgtccttaga gggtggtgct atcaacgatg tcgcagaaga tgctacggcc 1140 tatgctcaca gagatgtttt gttctgggtc caactattca tggttaatcc agtcggtcct 1200 atctctgaca ctacctacga gtttacagac ggcttgtacg atgtgttggc ccgtgctgtt 1260 ccagaaagcg tgggacatgc ttaccttggt tgtccagatc caagaatgga agacgctcaa 1320 cagaagtatt ggcgtaccaa tttgccccgt ctgcaagaac taaaggaaga gttggatcca 1380 aaaaacacct tccatcaccc acagggtgtt atgccagctt aa 1422 <210> 29 <211> 495 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 29 Met Lys Phe Ile Ser Thr Phe Leu Thr Phe Ile Leu Ala Ala Val Ser 1 5 10 15 Val Thr Ala Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile 20 25 30 Ser Ala Leu Gly Gly Asn Ser Ala Leu Ala Val Phe Pro Asn Glu Leu 35 40 45 Leu Trp Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr 50 55 60 Pro Ala Ala Ile Thr Tyr Pro Glu Thr Ala Ala Gln Ile Ala Gly Val 65 70 75 80 Val Lys Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly 85 90 95 Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val 100 105 110 Val Val Asp Met Lys His Phe Thr Gln Phe Ser Met Asp Asp Glu Thr 115 120 125 Tyr Glu Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile 130 135 140 Glu Leu Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro 145 150 155 160 Thr Ile Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr 165 170 175 Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val 180 185 190 Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln 195 200 205 Asp Val Phe Phe Ala Val Lys Gly Ala Ala Ala Asn Phe Gly Ile Val 210 215 220 Thr Glu Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln 225 230 235 240 Tyr Ser Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe 245 250 255 Val Lys Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln 260 265 270 Phe Tyr Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly 275 280 285 Leu Phe Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp 290 295 300 His Phe Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp 305 310 315 320 Leu Gly Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val 325 330 335 Gly Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln 340 345 350 Asp Thr Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile 355 360 365 Ala Asn His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu 370 375 380 Glu Gly Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala 385 390 395 400 His Arg Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Val 405 410 415 Gly Pro Ile Ser Asp Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp 420 425 430 Val Leu Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly 435 440 445 Cys Pro Asp Pro Arg Met Glu Asp Ala Gln Gln Lys Tyr Trp Arg Thr 450 455 460 Asn Leu Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn 465 470 475 480 Thr Phe His His Pro Gln Gly Val Met Pro Ala His Asp Glu Leu 485 490 495 <210> 30 <211> 1488 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 30 atgaagttta tcagtacctt cttgaccttt atcttggccg ctgtctccgt aaccgctggt 60 aatacgacct ctattgccgg cagagattgt ttgatctcag ctttaggtgg taactccgct 120 cttgcagttt ttccaaacga gttgctatgg acagctgacg tacacgaata taatctgaac 180 ttgcctgtca ctcccgctgc tataacctac ccagaaaccg ccgctcagat tgccggtgtg 240 gttaagtgcg cttctgatta cgactataaa gtccaagcaa ggtccggagg tcatagtttc 300 ggtaattacg gcttgggtgg agctgacggt gcagttgtcg ttgatatgaa gcacttcact 360 caattttcga tggacgatga aacttacgaa gctgttatcg gtccaggtac aactttaaac 420 gatgtcgaca tcgaattgta caacaacggt aaaagagcca tggctcatgg tgtatgtcca 480 accattaaga ctggtggtca cttcaccatc ggtggtctag gacctacggc tcgtcaatgg 540 ggtctggctt tggaccatgt cgaggaagtt gaagttgtgt tagctaactc tagcattgtt 600 agagcctcta atacacaaaa tcaagatgtt ttctttgcag tcaagggtgc tgctgctaac 660 ttcggaatcg tcactgaatt taaagttaga actgaaccag ccccaggttt ggctgtacag 720 tactcctata ccttcaactt gggttcaact gccgagaagg ctcaattcgt taaggattgg 780 caatctttca tttcggctaa gaacctaacc agacaatttt ataataacat ggtcattttt 840 gatggtgaca taatcttgga aggtttattc ttcggtagca aggaacaata cgacgccttg 900 ggccttgaag atcacttcgc accaaagaat ccaggtaaca tattggtttt aacagattgg 960 ctaggcatgg tgggtcacgc attggaagac actattttaa aattggtcgg taatacccca 1020 acatggttct atgctaagtc cttgggtttt agacaagaca ctctgatccc ttctgccggt 1080 attgacgaat ttttcgaata cattgctaac cataccgccg gcactcctgc ttggtttgtt 1140 actttgtcct tagagggtgg tgctatcaac gatgtcgcag aagatgctac ggcctatgct 1200 cacagagatg ttttgttctg ggtccaacta ttcatggtta atccagtcgg tcctatctct 1260 gacactacct acgagtttac agacggcttg tacgatgtgt tggcccgtgc tgttccagaa 1320 agcgtgggac atgcttacct tggttgtcca gatccaagaa tggaagacgc tcaacagaag 1380 tattggcgta ccaatttgcc ccgtctgcaa gaactaaagg aagagttgga tccaaaaaac 1440 accttccatc acccacaggg tgttatgcca gcttaacatg atgaatta 1488 <210> 31 <211> 27 <212> PRT <213> C. sativa <400> 31 Asn Cys Ser Thr Phe Ser Phe Trp Phe Val Cys Lys Ile Ile Phe Phe 1 5 10 15 Phe Leu Ser Phe Asn Ile Gln Ile Ser Ile Ala 20 25 <210> 32 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 32 aattgctcaa cattctcctt ttggtttgtt tgcaaaataa tatttttctt tctctcattc 60 aatatccaaa tttcaatagc t 81 <210> 33 <211> 517 <212> PRT <213> C. sativa <400> 33 Asn Pro Gln Glu Asn Phe Leu Lys Cys Phe Ser Glu Tyr Ile Pro Asn 1 5 10 15 Asn Pro Ala Asn Pro Lys Phe Ile Tyr Thr Gln His Asp Gln Leu Tyr 20 25 30 Met Ser Val Leu Asn Ser Thr Ile Gln Asn Leu Arg Phe Thr Ser Asp 35 40 45 Thr Thr Pro Lys Pro Leu Val Ile Val Thr Pro Ser Asn Val Ser His 50 55 60 Ile Gln Ala Ser Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile Arg 65 70 75 80 Thr Arg Ser Gly Gly His Asp Ala Glu Gly Leu Ser Tyr Ile Ser Gln 85 90 95 Val Pro Phe Ala Ile Val Asp Leu Arg Asn Met His Thr Val Lys Val 100 105 110 Asp Ile His Ser Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu Gly 115 120 125 Glu Val Tyr Tyr Trp Ile Asn Glu Met Asn Glu Asn Phe Ser Phe Pro 130 135 140 Gly Gly Tyr Cys Pro Thr Val Gly Val Gly Gly His Phe Ser Gly Gly 145 150 155 160 Gly Tyr Gly Ala Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn Ile 165 170 175 Ile Asp Ala His Leu Val Asn Val Asp Gly Lys Val Leu Asp Arg Lys 180 185 190 Ser Met Gly Glu Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly Gly Glu 195 200 205 Asn Phe Gly Ile Ile Ala Ala Cys Lys Ile Lys Leu Val Val Val Pro 210 215 220 Ser Lys Ala Thr Ile Phe Ser Val Lys Lys Asn Met Glu Ile His Gly 225 230 235 240 Leu Val Lys Leu Phe Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp 245 250 255 Lys Asp Leu Met Leu Thr Thr His Phe Arg Thr Arg Asn Ile Thr Asp 260 265 270 Asn His Gly Lys Asn Lys Thr Thr Val His Gly Tyr Phe Ser Ser Ile 275 280 285 Phe Leu Gly Gly Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe 290 295 300 Pro Glu Leu Gly Ile Lys Lys Thr Asp Cys Lys Glu Leu Ser Trp Ile 305 310 315 320 Asp Thr Thr Ile Phe Tyr Ser Gly Val Val Asn Tyr Asn Thr Ala Asn 325 330 335 Phe Lys Lys Glu Ile Leu Leu Asp Arg Ser Ala Gly Lys Lys Thr Ala 340 345 350 Phe Ser Ile Lys Leu Asp Tyr Val Lys Lys Leu Ile Pro Glu Thr Ala 355 360 365 Met Val Lys Ile Leu Glu Lys Leu Tyr Glu Glu Glu Val Gly Val Gly 370 375 380 Met Tyr Val Leu Tyr Pro Tyr Gly Gly Ile Met Asp Glu Ile Ser Glu 385 390 395 400 Ser Ala Ile Pro Phe Pro His Arg Ala Gly Ile Met Tyr Glu Leu Trp 405 410 415 Tyr Thr Ala Thr Trp Glu Lys Gln Glu Asp Asn Glu Lys His Ile Asn 420 425 430 Trp Val Arg Ser Val Tyr Asn Phe Thr Thr Pro Tyr Val Ser Gln Asn 435 440 445 Pro Arg Leu Ala Tyr Leu Asn Tyr Arg Asp Leu Asp Leu Gly Lys Thr 450 455 460 Asn Pro Glu Ser Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu 465 470 475 480 Lys Tyr Phe Gly Lys Asn Phe Asn Arg Leu Val Lys Val Lys Thr Lys 485 490 495 Ala Asp Pro Asn Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu 500 505 510 Pro Pro Arg His His 515 <210> 34 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 34 atgggcaatg gacaatccac cccactgcaa cagtgtttaa acacggtatg caacggtcgt 60 cttggttgtg tcgctttccc ttcggatgca ttgtaccaag ccgcttgggt gaagccatat 120 aatttggacg ttcccgttac tccaatcgct gtctttaaac catcttctac tgaagacgtt 180 gccggtgcta ttaagtgtgc tgtcgcaagc aacgttcatg ttcaagctaa gtcaggtggt 240 cacagttacg ctaacttcgg tttgggtggt caagatggtg agttaatgat agacttggcc 300 aatctacaag attttcacat ggataaaacc tcctggcagg ctaccttcgg cgctggttac 360 aggttgggtg acctagataa gaagttgcaa gcaaacggaa acagagccat tgctcatggt 420 acatgtccag gtgtaggtat cggaggtcac gctactattg gtggtttagg tcctatgtca 480 agaatgtggg gctctgctct ggatcatgtc ttgtccgttc aagtcgttac tgccgacggt 540 tctatcaaaa atgcatcaga atctgaaaat tctgacttgt tctgggcttt gagaggtgct 600 ggtgccagtt ttggtgtcat cacaaagttc actgttaaga cccacccagc cccaggttcc 660 gtggttcaat atacttacaa aatttcgtta ggatctcagg ctcaaatggc tcctgtttat 720 gctgcctggc aagcattagc tggtgacgct aagttggata gaagattctc aacccttttt 780 attgctgaac cattgggagc cttaataaca ggtacttttt acggtacaaa ggccgaatat 840 gaagctaccg gtattgctgc aagacttcca tccggcggta ccttggacct aaagttattg 900 gattggttgg gtagcttggc tcatatcgct gaagttgtcg gtctgacttt aggtgatatt 960 cctacttctt tctacggtaa atcgttggcc ttgagggaag aagacatgtt ggatagaaca 1020 tccatcgacg gtttgtttcg ttacatggga gatgcagatg ctggtacgct attgtggttc 1080 gtgatattca actctgaggg tggcgctatg gccgatactc cagctggtgc cactgcttac 1140 cctcacagag ataagttgat tatgtatcaa tcttatgtga tcggtattcc aacgcttact 1200 aaagcaacta gagactttgc tgacggtgta cacgatagag tccgtatggg agctccagcc 1260 gctaacagta cctacgctgg ttatatcgac agaaccttat caagagaagc cgctcaagag 1320 ttttactggg gcgctcagtt accaagacta agggaagtta agaaggcttg ggaccctaaa 1380 gacgttttcc ataatccaca atccgtcgat ccagctgaa 1419 <210> 35 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 35 atgggaaata caacttcaat tgcaggcaga gattgcttga tcagtgctct aggtggtaac 60 tctgccttag ctgtgtttcc taaccaactt ctgtggacgg ccgacgtcca tgagtataat 120 ttgaacttgc cagttactcc agctgctata acctacccag aaaccgctga acagattgcc 180 ggtatcgtta aatgtgcttc cgattacgac tataaggtcc aagctcgttc tggtggtcac 240 tcgttcggta actacggttt aggaggtact gatggcgcag ttgtagttga catgaagcac 300 ttcaaccaat ttagcatgga cgatcaaacc tacgaagctg tcattggtcc cggtactacc 360 ttgaatgatg tagacatcga attgtataac aatggtaaaa gagctatggc acatggtgtt 420 tgtccaacta taaagacagg tggacacttc acaattggtg gtttaggacc tactgccaga 480 caatggggtc tagctttgga ccacgttgag gaagtcgaag ttgtcttggc taattcctct 540 atcgttaggg cttcaaacac ccagaaccaa gatgtgttct ttgctgtaaa gggtgccgct 600 gctgacttcg gtattgtcac ggaatttaaa gtcagaactg aaccagcccc aggtcttgcc 660 gtccaatact cttacacctt caacctaggt tcgactgctg aaaaggctca attcgttaag 720 gattggcaat ctttcatttc cgccaagaat ttgacgagac aattttataa caacatggtt 780 atctttgacg gtgatattat cttggaaggt ttattctttg gcagtaaaga acaatacgat 840 gcattaggtt tggaagacca tttcgctccc aagaatccag gtaatatctt ggttttaacc 900 gattggctag gtatggtggg acatgcctta gaggacacta tattgaagtt ggttggcaac 960 actccaacat ggttttacgc taaatccttg ggtttcaggc aggatacttt aattccaagt 1020 gctggtatcg atcaattttt cgaatacatt gctaaccaca ccgctggtac tcctgcatgg 1080 ttcgtaacct tgtctctgga gggtggtgcc atcaatgacg ttgctgaaga cgccactgct 1140 tatgctcaca gagatgtcct attctgggtc caacttttca tggttaaccc attgggtcca 1200 atttctgaaa caacttacga atttaccgat ggattgtacg acgtgctagc acgtgcagtt 1260 ccagaaagcg tcggtcacgc ttatttgggt tgtcctgatc caagaatgga gaacgcccct 1320 caaaagtatt ggagaacgaa tcttccaaga cttcaagaac tgaaggaaga gttggatcca 1380 aagaacactt ttcatcatcc tcaaggtgtc atcccagct 1419 <210> 36 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 36 atgggaaaca cgaccagcat agctggtcgt gactgtctga tctctgcctt gggtggcaat 60 tcagcattag ctgctttccc aaaccaacta ttgtggactg ccgatgtcca cgaatacaac 120 cttaatttgc ctgtgacacc agctgctatt acttatcccg agactgccga acagatcgct 180 ggtattgtta agtgcgcctc tgattacgac tacaaagtac aagctagatc gggtggtcat 240 tcctttggta attatggttt gggtggtacc gatggtgctg tcgttgttga catgaagcac 300 ttcaaccaat tttctatgga tgatcaaacc tacgaagcag tcattggacc aggtactacc 360 ttaaacgacg tagatatcga attgtacaat aacggtaaaa gagctatggc ccatggtgtg 420 tgtccaacaa tcaagactgg aggtcacttc accattggcg gcttgggtcc aactgctaga 480 caatggggtt tagctttaga ccatgttgaa gaggttgaag ttgtcttggc caactccagt 540 attgttaggg catctaatac tcaaaaccag gacgttttct ttgctgtcaa gggtgctgct 600 gctgacttcg gtatcgtgac cgaatttaaa gttagaacag aacctgcccc aggtttggcc 660 gtccaatatt cctacacctt caatcttggt tcaactgctg aaaaggcaca attcgtaaag 720 gattggcaat acttcatctc tgctaaaaac ctaacaagac aattttacaa caacatggtt 780 atttttgacg gtgatataat tttggaaggt ctgttcttcg gtagtaagga acaatatgac 840 gccttgggtt tggaggatca ctttgctccc aagaatccag gaaatatttt agtcctaacg 900 gattggttgg gcatggttgg tcacgcatta gaagatacta ttctaaaatt ggtcggtaac 960 acgccaactt ggttctatgc taagtccttg ggttttcgtc aggacaccct tatcccttct 1020 gctggtattg atgaattttt cgagtacatc gctaatcata ccgccggtac tccagcttgg 1080 tttgttactt tatctttgga aggtggagct atcaacgacg tcgctgaaga tgccacagca 1140 tacgcacata gagatgtgtt attctgggtt caattgttca tggttaaccc tcttggtcca 1200 atttcagaaa caacttatga atttaccgat ggattgtacg acgttttagc tagagctgtc 1260 ccagaatctg taggtcacgc ttacttgggt tgtccagacc caagaatgga gaacgcacct 1320 caaaagtatt ggaggacaaa cttgccaaga ctacaggaac tgaaagagga attggacccc 1380 aagaatactt ttcaccatcc acaaggtgtt atcccagct 1419 <210> 37 <211> 1539 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 37 atggatccaa tcgaggacgc cattttgcag tgcttaagcc tacacagtga cccttcgcat 60 ccaatatcag gcgtaacgta tttccccaat acaccatctt acattcctat cctgcactcc 120 tacattcgta accttagatt tacctctcca tccactagaa aaccattgtt catcgttgct 180 ccaactcata tatctcacat ccaagcatca attatctgtt gtaagtcttt tcaattgcaa 240 attaggatta gaagtggagg tcacgattat gatggtttgt cctacgtcag ccaatctccc 300 ttcgctatta tggacatgtt cgctatgaga tccgttgaag tcaacttaga agatgaaacc 360 gtttgggttg actctggttc cactatcggt gaattgtacc atggtattgc cgaaagatct 420 aaggtccatg gtttcccagc tggtgtgtgt cactcagttg gcgtcggtgg acacttttcc 480 ggtggtggtt atggtaatat gatgagaaag ttcggtttgt ctgtggacca tgttctggat 540 gctgttatcg ttgatgcaga aggccgtgtc ttagacagaa aaaagatggg tgaagaccta 600 ttctggggta taagaggtgg tggtggcgct tcgtttggtg ttatcgtcag ttggagaatt 660 aaattggtcc cagtgcctga ggttgtaacc gtcttccgtg ttttgaagac cttggaacaa 720 ggtgccacag atgtcgttca cagatggcaa tacgtcgccg acaacatcca cgatgactta 780 tttattagag ttgttctatc tccagttaag agaaaaggtc agaagactat cagagctaag 840 tttaatgctt tgttcttggg taacgctcaa gaattactgc gtgtcatgtc tgattctttt 900 ccagaattgg gattagtggg tgaagactgt atcgagatga gctggattga ctccgtattg 960 ttctgggata actttccagt aggtacatct gtagatgttt tattgcagcg tcacgacact 1020 cctgaaaaat tcttgaagaa gaaatccgat tacgttcaac aaccaatctc taagactgga 1080 ttagaaggtg tttggaataa aatgatggaa cttgaaaagc cagtgttgac cttgaatcca 1140 tatggtggta gaatgggtga aataagtgaa atggaaattc cttttccaca tagagctggt 1200 aacttgtaca agatccaata ctcggtcaac tggaaggagg aaggtgagga tgttgcaaac 1260 aggtatcttg acctgattag aatgttatac gactacatga ccccatatgt ttcaaagtcc 1320 cccagatcaa gttatttgaa ctacagagat gtcgatatag gagtcaatgg tccaggcaat 1380 gccacttatg ctgaagctag agtctgggga gagaaatact tcaagagaaa ctttgacaga 1440 ttggttgaag tcaaaactag ggttgatcca agtaacttct tcaggtacga acaatctata 1500 ccttccttgg ccgcttcgag cctaggtatt atgtcggaa 1539 <210> 38 <211> 1518 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 38 atggtccaca atatattact acttggtttg atgccactgt tggttcgtgc atcacctttg 60 ccaatttatc ataactaccc cccacaatcg actatcaacg actgcttgca ggccgctgat 120 gttccagcta tcttacaaag ctctgcttcc tttgatgcct tgagtcaacc tctaaattcc 180 agattaaaat ctaagccagc tgtgattaca atccctacga ccgctttgca cgtcagttct 240 gctgttaagt gtgccgcaca attcaagctg aaagtaactc caagaggcgg tggacattct 300 tacaacgcac aatccttagg tgacggtgct gtcgttattg atatgcaaca gttccacgac 360 gttgtctacg actctaagac tcaactagct aggattggtg gtggagctag attgggtaac 420 gttgcccaaa aattgtatga tcaaggtaag agagctatgc cacatggtac ctgtccagat 480 gtcggtattg gcggtcactc cgccggtggt tttggttgga cctcacgtca gtggggtatc 540 actgtagatc acatagacga ggttgaagtg gtaacagctg acggttctat cagaagagct 600 aataaggatc aaaattccga tttgttctgg gcattgagag gagctgcccc atcgttcggt 660 gttattacta acttttggtt ttctaccttg gaagctcctg attctaacgt tatttacagt 720 tataagttca ctggtttatc tttagacgaa atcagtacag ctttgttgga agtgcaaaag 780 ttcggtcaaa ccgctcccaa agaagtcggc atgcttatcc aaatattaga caatggttct 840 ggtttcagat tgtacggtac gtactataac actacccgtc aacaatttga taatttattc 900 ggccaacttt tgcaaagatt gccatcccca ggtaacagcg ctgaggtttc tgtcaagggt 960 tggattgact cgttgatatt tgcctctggc ggtagcaagg gtcttactgt tccagaactg 1020 ggtggaacta accagcattc ttccttttac acaaaatcat tgatgactgc tcaagattac 1080 ccattaaccc tggattcaat taagtccgtg ttcaagtatg ccatgaacca aggtagagcc 1140 gccaccgaaa ggggtctacc atggatggta tttatctctt tgttgggtgg tagatatagc 1200 actctaccaa cgccttccgc tgcttcagat aactctttct acggcagaaa cactttgtgg 1260 gctttttctt tcaccgctta cctaggtaac gtcacagaac aaagcaatag agactcaatt 1320 tacttcttga atggtttcga cacttccgta agaagatccg ttgacaccgc ttacatcaac 1380 ggtcacgata ctgaatattc gagagaagaa gcacatagat tatactacgg tgacaaatat 1440 caaaggttgt ctgtcttaaa gaagcaatgg gatcctgagc aagttttctg gtatccacaa 1500 tccatcgacc ccgccaat 1518 <210> 39 <211> 1428 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 39 atgggtaaca caacttcaat cgcagctggc agggattgct tactgtccgc cgtcggaggt 60 aatcacgctc atgttgcttt tcaggaccaa ttgctatatc aagctaccgc agtggaacca 120 tacaacttga atattcccgt tacgccagcc gctgttacct accctcaatc ggctgatgag 180 gttgccgctg tcgtaaaatg tgcagccgac tatggttaca aggtgcaagc tagaagcggt 240 ggtcacagtt tcggtaacta cggtttaggc ggtgaagacg gtgctatagt cgttgatatg 300 aagcatttcg atcaattttc tatggacgaa tctacttata ctgctactat tggtccaggt 360 atcaccttgg gagacttgga taccgcccta tacaatgctg gccatagagc catggctcac 420 ggtatttgtc caacaattcg tactggtggt caccttacca tcggaggttt gggtccaact 480 gctagacaat ggggtttggc cttagatcac gttgaagaag tcgaagttgt cttggcaaac 540 agctccatcg tcagagcatc agacactcag aaccaagaga tcttgttcgc tgttaagggt 600 gctgctgctt ctttcggtat agtaactgaa tttaaagtta gaacagaaga agctcctggt 660 cttgccgtcc aatactcctt caccttcaac ttaggtacag ctgccgagaa ggctaaattg 720 gttaaggact ggcaagcttt tattgcacaa gaagatttga cgtggaagtt ctactctaac 780 atgaatatta tcgacggtca aattatccta gaaggcatat atttcggttc taaggctgaa 840 tacgatgcct taggtttgga ggaaaagttt ccaaccagtg aaccaggcac tgttttagtc 900 ttgacggact ggctgggtat ggttggtcat ggtttggaag atgttatttt gcgtttagta 960 ggcaatgctc caacttggtt ctatgctaaa tctttaggtt ttgctcccag ggcattgatc 1020 ccagattccg ctattgacga tttcttcgaa tacattcaca agaacaatcc tggtaccgtt 1080 agttggttcg tcacactatc gttggaaggt ggtgcaataa acaaggtgcc agaagatgcc 1140 actgcttacg gacatagaga tgttttgttt tgggttcaaa tctttatgat taacccacta 1200 ggtcctgttt ctcagaccat ttacgacttt gccgacggtc tttatgacgt tctggctaaa 1260 gccgtccccg aatccgcagg tcatgcttat ttgggctgtc cagacccaag aatgccaaat 1320 gctcaacaag cctactggag aaataacttg ccaagactag aggaattgaa gggtgactta 1380 gatccaaagg atatcttcca caacccacag ggtgtcatgg ttgtctct 1428 <210> 40 <211> 1422 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 40 atgggtaaca ctaccagcat tgccggccgt gactgcctag tttccgcttt gggtggtaat 60 gcaggtctgg tggcttttca gtcacaacca ttataccaaa caaccgctgt ccatgagtat 120 aaccttaaca tacccgttac tccagccgct atcgcttacc ctgaaactgc cgaacaaatt 180 gctgctgtcg taaaatgtgc atcggaatat gattacaagg ttcaagcaag atccggtggt 240 cactctttcg gaaattacgg tttgggtggt acggatggtg ctgttgtggt cgacatgaag 300 cacttcaacc aatttagtat ggacgatcaa acctatgaag ctgttatcgg cccaggtact 360 actttgggcg acgtcgatac tgagctatac aataacggta agagagccat ggcccatggt 420 atctgtccaa caatttctac cggtggccac ttcacgatgg gtggtttagg tccaacggct 480 agacagtggg gtttggcatt ggatcacgtt gaagaagtag aagtcgtttt ggctaattct 540 tctatcgtga gggcttccaa cacccaaaac caagaagttt tctttgccgt taaaggagct 600 gctgcttcat ttggtattgt caccgaattt aaggttagaa ctcaaccagc tcctggattg 660 gctgtccaat actcttacac tttcaacttg ggttcgagtg ctgaaaaggc tcaattcgtc 720 aaggattggc aatctttcat ctctgctaaa aacttaacaa gacagtttta taccaatatg 780 gttatattcg acggcgacat tattttggaa ggtctgttct ttggtagcaa ggagcaatac 840 gaagcccttg gtttggaaga acgtttcgtc ccaaagaatc ctggtaacat tcttgtttta 900 actgattggt tgggtatggt tggtcatgct ttggaggaca ctatcttaag attagtcggt 960 aacaccccaa cctggttcta cgcaaaatcc ctaggcttca ccccagatac tttgataccc 1020 tcctcaggta ttgatgaatt tttcgaatat atcgagaata ataaggccgg tacctctaca 1080 tggtttgtaa cattatctct tgaaggtggt gccatcaacg acgttccagc tgatacgaca 1140 gcatacggtc acagagatgt attgttttgg gtccagatat tcatggtttc cccaactggt 1200 ccagtttcct ctacaactta cgattttgct gacggcttgt ataacgtgtt gactaaggca 1260 gttcctgaaa gcgaaggtca tgcttacttg ggatgtcctg accctaagat ggctaacgcc 1320 caacaaaaat attggagaca aaatctacca agactggagg aattgaaagc tactcttgac 1380 ccaaaggata cctttcataa cccccaaggt atcttgccag ta 1422 <210> 41 <211> 1449 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 41 atgaatcctt ctataccctc aagctccatg ggtaacacaa cgtctatcgc tggacgtgac 60 tgtttagtta gtgccctggg tggtaacgct ggtttggtag cattccaaaa tcagccacta 120 taccaaacca ctgctgtgca cgagtataac ttaaacattc cagtcactcc agccgctatt 180 acctacccag aaactgctga acaaatcgcc gctgttgtca aatgcgcatc ccaatatgat 240 tacaaggttc aagctaggtc tggtggccat tcgtttggta actacggtct tggtggcacc 300 gatggtgctg ttgtcgttga catgaagtat ttcaatcaat tttccatgga cgatcagaca 360 tacgaagcag ttattggtcc tggtactacc ttgggagatg tcgatgtcga attgtataac 420 aatggtaaaa gagctatggc ccacggtgtg tgtccaacta tctctaccgg tggccatttc 480 actatgggtg gtttaggtcc aacagctaga caatggggat tggccttgga ccacgttgag 540 gaagttgaag tggttctagc taattcatct atcgtcagag cttcaaacac ccaaaaccaa 600 gaagttttct ttgccgtaaa gggtgctgct gcctcgtttg gtattgtcac cgaatttaag 660 gttagaactc agcctgcacc aggtattgct gtgcaatact cttacacttt caacttgggt 720 tcctccgcag aaaaagctca attcatcaag gactggcaat ctttcgtttc tgctaagaat 780 cttacgagac aattctacac taacatggtc atatttgacg gtgatattat tttggaagga 840 ttgttcttcg gtagtaaaga gcaatatgaa gccttgggtt tagaagaaag gtttgtccct 900 aagaacccag gtaatatcat ggttctaaca gattggttgg gtatggttgg ccatgctctg 960 gaagatacga ttttgagatt ggtaggtaat acgccaactt ggttctacgc taagtccctg 1020 ggttttactc cagacacatt aatccccagc agcggtattg acgaattttt cgaatatata 1080 gaaaacaaca aggcaggaac cagtacttgg ttcgtcaccc tatctttgga gggtggtgct 1140 attaacgatg tgccagcaga tgctaccgct tacggtcaca gagatgtttt attctgggta 1200 cagattttta tggtttctcc cactggtcca gtttcctcca ctacctacga ctttgccgac 1260 ggcttgtaca atgtcttgac taaggctgtt ccagagtctg aaggccacgc ctatttgggc 1320 tgtccagacc ctaaaatggc taacgctcaa caaaagtact ggagacaaaa cttgccacgt 1380 ctggaagagc ttaaggaaac attagatcca aaagacactt tccacaatcc tcaaggtatc 1440 ttgccagca 1449 <210> 42 <211> 1518 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 42 atggcccgtg tccccgcact gttcttgggc ctatcttcag tgtgtttgtt agttttcttt 60 tgcagtttga ttaacccaac cactccttta catcagcacg gtaagcaaac atctatcgct 120 ggtagggatt gtcttgtatc cgctttgggt ggaaatactg gtttagttgc ttttcaagac 180 caattgttgt accaaaccac ggctgtccac gagtataacc tgaacatacc agttactcca 240 gccgctatca cctacccaga aacctcggaa caaattgctg ccgttgttaa atgtgcatct 300 gaatacgatt ataaggtcca ggccagatcc ggtggtcata gcttcggtaa ttacggattg 360 ggtggtgctg acggtgctgt tgtcgttgat atgaagcact tcactcaatt ttctatggac 420 gaacaaacct atgaagctgt aattggccca ggtacaactc taggtgatgt ggataccgag 480 ttgtacaaca acggtaaaag agctatggcc catggtatct gtcctactat ctccactggc 540 ggtcacttca ccatgggtgg tcttggccca acagcaagac aatggggatt ggctcttgac 600 cacgtcgaag aagtggaagt tgttttggct aattcctcta ttgtcagagc atcaaacact 660 caaaatcaag aagttttctt tgctgttaag ggtgctgccg cctccttcgg tatcgtcact 720 gaatttaaag tcagaactca accagcccca ggattagctg ttcaatactc ttatacgttt 780 aacttgggta gctcagctga gaaggctcaa ttcgtcaagg actggcaatc tttcatttct 840 gctaagaatt taaccagaca gttttacaca aacatggtaa ttttcgatgg taacataatc 900 ctagaaggcc tatttttcgg ttccaaagaa caatacgaag ctttgggttt ggaggaccgt 960 tttgttccaa agaatcctgg taatatctta gtcttgacag attggctagg tatggttggc 1020 catgcattgg aggacactat tttgagattg gtcggtaaca cccccacatg gttctacgca 1080 aagagcttgg gtttcactcc agacacgtta atacctagtt caggtattga tgaatttttc 1140 gattatatag aaaacaacaa ggctggtacc ctgacgtggt tcgttacttt gagtttagaa 1200 ggtggtgcca ttaacgatgt gccaaaggat gctactgctt atggtcacag agatgtgctt 1260 ttttgggttc agatcttcat ggcttctcca acaggtcctg tctcttccac tacctacgac 1320 ttcgccgatg gtttgtataa tgtcttgacc aaagccgttc cagaatccga aggacatgct 1380 tacctgggtt gtccagaccc aaagatggct gacgctcaac aaaagtactg gaggcaaaac 1440 ttacctagac ttgaagaatt gaaagcaacc ttagatccaa aagatacttt tcacaatcca 1500 caaggtatct tgccagca 1518 <210> 43 <211> 1281 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 43 atgacaacca agtgtaggca tgcagtggag gctactgctc taggcacgat ggtagcctac 60 ctgattagaa ataacccacg tagacctagt tcaactaacg ctaatgtttt ggacacaggt 120 ttgggtggtg ccgatggtgc tgttgtcgtc gatatgaaac actttactca gttctccatg 180 gacgatgaaa cctatgaagc tgttatcgga ccaggtacca ctttaaacga cgttgatata 240 gaattgtaca acaacggtaa gagagctatg gcacacggtg tctgccccac cattaagact 300 ggtggtcatt tcaccatcgg cggacttggt ccaactgcca gacaatgggg tttggcctta 360 gatcacgttg aagaggttga agtcgtgttg gctaattcgt ctattgtaag agctagcaac 420 acacaaaacc aagacgtttt ctttgcagtt aaaggtgctg ccgctaattt cggaatcgtc 480 actgaattta aggtcagaac cgaaccagct cctggtttgg ctgttcaata ttcctacact 540 ttcaatttag gttctactgc tgaaaaggct caattcgtga aagattggca atcttttatc 600 tctgctaaga atctaacgag acagttctac aacaacatgg ttatttttga cggtgatatc 660 attcttgagg gtttgttttt cggttccaag gaacaatatg acgccttggg cttggaagat 720 catttcgctc caaagaatcc aggtaacatc ttagtcctga cagactggct aggtatggtt 780 ggacacgcct tggaagacac cattttgaag cttgttggta acaccccaac ctggttctac 840 gccaaatcgt tgggttttag acaagataca ttaattccat cagctggtat agacgaattt 900 ttcgaataca tagctaacca cactgctggt actcccgcat ggttcgtcac acttagtttg 960 gaaggtggtg ctattaatga tgtcgcagaa gatgccacgg catatgctca ccgtgacgtc 1020 ttgttctggg tacaactgtt tatggtgaac cctttgggtc ccatctctga cacgacttac 1080 gaatttactg acggtttata tgatgttttg gcaagagctg ttccagagtc cgtgggccat 1140 gcttacttag gttgtccaga tcctagaatg gaagatgctc agcaaaagta ttggcgtacc 1200 aacttgccaa ggttgcaaga gttgaaagaa gaactagacc caaagaacac tttccaccat 1260 ccacaaggtg ttatgccagc c 1281 <210> 44 <211> 1425 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 44 atgggtcatg gacaatccac tcccggtgag aactgtttaa atgcaatatg cggtaacaga 60 acggactgtg tatcataccc attggatcct ctattccaca tcgcttgggc ccgtccatat 120 aaccttcagg tgcctgttac accagctgct gtcctgaggc cagacaatgc tcaagatgtt 180 gctgatgccg ttaaatgtgc caacgaaaat ggcattaagg tccaagctag atctggtggt 240 cactcgtacg gtaactttgg tttgggaggt gacgacggtg cattggtttt ggatctagtc 300 aatttacaag gtttcactat ggacgaagaa aactggcatg ctgctgttgg cgcaggtatt 360 agattgggta agctggatga acacttgcat aaaaatggtg gtagagctat ggctcacggt 420 acctgtccag gcgtaggtat cggtggtcac gccaccatcg gaggtttagg tccaatgagc 480 agaatgtggg gttctgcctt ggatcatgtc gtcgaagttg aagttgttac tgctgacggc 540 tctattcaac gtgctaacga aacagaaaat agtgatttat tttgggcctt gagaggtgct 600 ggtgcttcct tcggtataat cactgagttt gtagttagaa cccacccaga accaggagat 660 gtaattgaat atacctactc tctgaccttc ggttcacaag cagaaatggc tcctatttac 720 caagaatggc aggaatttat tggtgaccca gacttggata gaaggttctc ctctcaattc 780 attgctcaac cattgggtgc tatcatcact ggaaccttct acggtactga agacgaatat 840 agagagagtg gtatccccga taagatacca ggaggtggta gtgatggtgt tggtatttta 900 gttacagact ggttgggttc tctaggccac caagccgaaa gatccggtct tgctatttcg 960 gatcttccaa gcccttttta ttctaagtcg ttggccttca gaaaggaaga cttgttgcca 1020 aaagagggta taactgagtt attccagtac ttgaacgacg ctgaccatgg tacattgatc 1080 tgggtcgtca tctttaactc cgaaggaggt gcaatgggtg atactgccgc aaacgctaca 1140 gcctacccac atcgtgataa gaccatgatg tatcaatcct acgtcattgg tatccccgaa 1200 gtgagtggca ccgcaagaag attcctggag ggtgttcacg ctaagattca agatgctgct 1260 cctggtgcta attcaacgta tgctggttac atcgatacgg aattaggcag agctgaagct 1320 caagaagtgt actggggtag ccagttgcct caattgagaa agatcaaaaa ggactgggac 1380 ccaaaggaca ggttttcaaa cccacaatct gtccaagccg ccaga 1425 <210> 45 <211> 1548 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 45 atgcgtgtcg ttggaaagat gggtgctttg caaagcactc tggagaaatc tatcaaggcc 60 gcattagctg gtgacgatga tctatacgct gtgcccggta aaccatttta tcagatacaa 120 catgtcaagc cttacaactt gtcgattcca atcgaaccag ccgctattac ctatcctaag 180 acaactgctc aagtagccgc aattatcaag tgcgctgttg ctgctaattt gaaggtccaa 240 gccagatcag gtggccactc ctacgctaac tactgtattg gtggtgtttc tggtgctgtt 300 gttatcgacc ttaaacactt ccaaagattc agtatggata gaaccacgtg gcaagcagcc 360 gtcggtgctg gcactttatt gggtaatttg accaagagga tgcatgaagc tggtaacaga 420 gccatggctc acggtacttg tccacaagtg ggaattggtg gtcacgcaac cataggtggc 480 cttggtccat cttcaagatt gtggggtacg gctttagacc atgttgaaga agtcgaaata 540 gtcttggctg attccacaat taagagatgt tctgctactc agaatccaga catcttttgg 600 gccgttaagg gagctggtgc atccttcggt gttgtgactg aatttaaatt aagaaccgag 660 cccgaaccat ctgaagctgt acatttctct tattcgttca ctgttggttc ctacgcaagc 720 ttggctgctg tttttaaatc atggcaatct ttcgtcgctg acccaggtct tactcgtaag 780 ttctcctctg aagtcatcat tacagagatc ggtatgatta tatcaggcac ttattttggt 840 agtcaagctg aatacgatgc cctagatatg aagtctcaat tgagaggtga cagtgttgct 900 aagatcattg tttttaagga ctggttagga ttgttgggtc actgggccga agatgtgggc 960 ctaagaattg ccggtggttt acctgcccct ttgtacgcta aaaccttgac cttcaacggt 1020 gccaacctga tcccagatga agtcatcgat aaattgttcg cctacctgga caaggttgaa 1080 aagggagctt tggtatggtt cgtcattttt gacctggctg gaggtgccgt taatgacata 1140 gctcaagatg ctacatccta tgctcatcgt gatgccttgt tctacttgca gtcatatgca 1200 gtgggtttag gtaacgtttc acaaacaact aaggattttc ttaccggtat aaacacgact 1260 attaccaacg gtatgccaga aggtggtgac ttcggtgctt acccaggcta cgttgacttg 1320 gaattaccaa atggtccaca cgcttactgg agaaccaacc ttccaaggtt ggaacaaatc 1380 aaagccctgg tagatcctaa tgatgtcttc cacaacccac aatcttattt gtgcatccta 1440 tttttgctaa acttgctaaa cagagctttg gcttgggctc cagttggtac tgtccagcca 1500 ttccaagtct taaggtactc cattgacaca ggtcctcttg tgcttttg 1548 <210> 46 <211> 1434 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 46 atgggtcagg gctcgagcgg tgtgcaatct aaccccttag aagattgttt gaaggtagct 60 acaagtccac taggttcata cgccttccat gacaaattgc tgtttcaact taccgatgtt 120 aagccttata atttagacta cccagtcaac ccaatcgctg ttacgtatcc aggttccact 180 aaagaggttg cacaaattat aaagtgcgct accacttacg ataagaaggt ccaagccaga 240 agcggaggtc actcttacgc taatttcgct ttgggtgacg gtgacggtgc aattgttatc 300 gatatgcaaa aatttaagca attctccatg gacacttcta cctggcaggc tacaattggt 360 cctggtactt tgttgggtga tgtctccaag cgtttacacg aaaacggtaa cagggtaatc 420 ccacatggaa cctctccaca aataggtttc ggaggccacg gtactattgg tggtctgggc 480 cctttgtctc gtatgtacgg tttaaccttg gactccatcg aagaagttga agccgtcttg 540 gctaacggtc aaattgttag agctagtaaa actcaaaatg aagatctatt ttttgctatt 600 agaggagccg ccgcttcagt cgcagttgtc acagaattta aggttagaac ctatccagag 660 ccctctagtt ctgtgttata ttcttacact ttacaaggtg gttcagttgc ttccagagct 720 aacgctttca agcagtggca aaaattgacg acagatccat cggtcagcag aaagttcgct 780 tctactttcg ttctatccga agccataacc gtcgtcacgg gtactttctt cggtactcaa 840 gctgagtttg attccttgga catcacctct aggttgcctg ccgacatgat ctccaataat 900 acagaagtta agaactggtt gggtgtcgtt ggccattggg gtgaatcatt ggctttgaga 960 gccggtggtg gtattccagc acacttttac tccaagtctt tgggtttcaa aaaggatgag 1020 atcatggatg atgctactgt ggacaagcta ttcaattata ttgacaaagc tgataaagga 1080 ggtgctgttt ggttcgttat ttgggacctt gaaggaggtg ctatctctga tgttccaacc 1140 actgaaactt cttacggtca tagagatgca atctttttcc aacagtctta tgcaattaac 1200 ttattgggta gagttaagga cgacacccac gaatttttga acagagttaa tagtgtaatt 1260 atggaatcta acccaggtgg ttactggggt gcctacccag gttatgtcga tactgctcta 1320 ggtaattcca gcgctaaggc ctactggggt atcaacagcg aaagattaca aaccataaaa 1380 agttgggtag acgctggtga tgtgtttcac aacccacaat cagttagacc caag 1434 <210> 47 <211> 1578 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 47 atgcagcctt ttacaagcct tactaggtcc cccttccgtt cagcccacgt tatcagttgt 60 ccagtcgctt tggacaatcc accatcggta ccaattataa tgggacaaaa gccttcctct 120 ccattagcta cctgcttgga taaagtttgt aacggtagat ctagttgtgt cggttaccca 180 aacgaccccc tattccaaat caattgggtt aagccatata acttggatat tcctgtccaa 240 ccaattgcag tgactagacc atctaccgct gaggatgttg ccggttttgt taagtgtgct 300 gctgaaaaca atgtcaaagt ccaagcaaag tctggcggtc attcctacgg taacttcgct 360 atcggtggta ctgacggtgc cttagttatt gatctggtga attttcaaaa cttcagcatg 420 gatacaaaca cctggcaggc tacgttcggt ggaggccaca agttgcatga agttactcaa 480 aaactacacg acaatggtaa gagagctatc gcccacggta cctgtccagg tgttggtata 540 ggtggacatg ctactattgg tggtttgggt ccatcttctc gtatgtgggg ctcctgcttg 600 gatcacgtag ttgaagtcga agtcgttacc gcagacggta agatccaaag agctaacgat 660 aagcaaaatt ccgacttgtt ctttgcctta aaaggtgcag gagctggttt tggtgtcatt 720 actgagttcg tgatgagaac ccatccagaa cctggtgacg ttgttcaata ttcttacgct 780 atcacttttg ctaaacacag agacttggtt cctgtattca agcaatggca agaactgatt 840 ttcgatccaa cacttgatag acgtttctca tctgaatttg tcatgcaaga attaggtgtc 900 gctataacgg ccacttttta cggcacggag gatgaattta agaagactgg tattccagac 960 agaatcccca aaggtaaagt ttccgtcgtt ataaacaatt ggttgggtga tgtcgcacag 1020 aaggctcaag atgcagcctt gtggcttagt gatattcaat cagctttcac ctctaagtcc 1080 ttggctttca cccataacga cctaatctcg gaagacggta tccaaactat gatggactat 1140 gttgattcag tcgatagagg cacattaatt tggttcttga ttttggattc tactggagga 1200 gctattaatg acgttccaat gaacgctaca gcctacagac acagggacaa agtgatgttc 1260 ttccaaggtt acggtgttgg tataccaacc ctttctggta agaccaagga ttttatgtcc 1320 ggtgttgctg ataagatccg taaggcctct cctaacgaat tgagcactta cgctggatac 1380 gtagacccaa ctttggacaa tgctcaagaa agatattggg gtccaaactt accagcccta 1440 gaaagaataa aagctacctg ggatcctaag gacttattct caaacccaca gtcagtgagg 1500 ccaaacgctt ccgccaagga tgtcgaacct gccgcatctg gtggttccaa taattcgggt 1560 tctaaaggtg gagacagt 1578 <210> 48 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 48 atgggatccg gtcatagttc tggcttggcc acttgcttag atgcagtgtg taatggtcgt 60 cacgcttgtg tagcttaccc tgaccaccta ctgtatcaag cctcttgggt cgatagatac 120 aaccttgaca tcccagttca tcccatagct gttaccaggc catcaaacgc agacgatgtc 180 agcggttttg ttaaatgtgc tgccgctaat aacgtcagag ttcaggctaa gtctggtggt 240 cactcgtatg ctaattacgg cttgggtggt gaggatggtg aattagttat tgacttgaga 300 catttgcaac acttctcaat ggatacgaac acttggcaag ctaccattgg tgccggtcac 360 agattatggg acgttacaca taagttgcac gaaaacggta agagagcagt cagccacgga 420 acttgcccag gtgttggtat tggcggtcat gccaccatcg gtggtctagg tccatcctct 480 cgtatgtggg gatcgtgttt ggatcacgtg gtcgaagttg aagttgtgac tgctgacggt 540 tctataagaa gagcttccga aagagaaaac gctgatttgt tctttgcttt aaaaggtgcc 600 ggtgctggtt tcggtgtgat caccgaattt gtaatgaaga ctcaccctga accaggatct 660 gttgtcatga ggtacacata ctccgttaat ttcggtagac atgcagacat ggtcgacgta 720 ttcgatcaat ggcaagcttt gatttctgat ccaggtctgg atagaagatt tggaagtgaa 780 attatcatgc acgcattcgg cctagtcatt tccgctacgt tccatggtac cagagatgag 840 tatgaagctt ctggtatccc agacagaatc cctcgtggta acgtgtccgt tttgttggac 900 aattggttag gtgtcgttgg taatcaggcc caagatgctg gattgtgggt ttctgaggtt 960 agatcgagtt tcacttcacg ttcattggct tttagaaggg accaacttct atctcgtgat 1020 gatattgtca gaatgatgga ctttttggac agaactgata agggtacgtt agtctggttt 1080 ttgattttcg acgtcacagg tggtgctatt ggcgacgtta gaactgacgc aaccgcctac 1140 gctcatagag ataagatcat gttctgtcaa ggttacgcag ttggtatacc agctcttacc 1200 agaaaaactc gtgtcttcat ggacggttta atttccacta tcagggaaac cgccaactct 1260 actctaacca cctatcccgg atacgtcgat ccaagtttgc acgacgctca agcttcctac 1320 tggggtccta acttgccaag attaacagaa gttaagacta agtgggatcc acaggatgtt 1380 tttcacaacc cacaatctgt aagaccatct ggtaaagat 1419 <210> 49 <400> 49 000 <210> 50 <211> 1428 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 50 atgggtaaca ctacatcaat agctgccggc cgtgactgcc tattgagcgc tgtgggtgga 60 aatcacgcac atgttgcttt tcaggatcaa cttttatacc aagctaccgc cgtcgaaccc 120 tataacttga atatccctgt aactccagca gctgttacgt acccacaaag tgctgatgag 180 gttgccgctg tcgttaaatg tgccgctgac tacggttata aggttcaagc taggtccggt 240 ggtcactcgt tcggtaacta cggtttggga ggtgaagacg gtgctattgt cgttgatatg 300 aagcatttcg atcagttttc catggacgaa tctacctata ctgcaacgat cggtccaggc 360 attactttag gtgatctgga taccgccttg tacaacgctg gtcacagagc tatggctcat 420 ggtatctgtc caacaattag aactggtggt caccttacca ttggtggatt aggtcctaca 480 gctagacaat ggggcttggc cctggaccac gttgaagaag tggaagtcgt cttggctaac 540 tcgtctatag ttagagcatc tgacacccaa aatcaagaaa tcttgttcgc tgtaaaaggt 600 gctgctgcct cattcggtat tgtgactgaa tttaaggttc gtactgagga agccccaggt 660 ttggccgtcc aatattcttt cacctttaat ttaggtactg ctgctgaaaa ggcaaagctg 720 gttaaagact ggcaagcttt catcgctcag gaggatctta cttggaagtt ctactctaac 780 atgaacatta ttgatggtca aatcatcttg gaaggcatct actttggttc taaggccgaa 840 tatgacgctc taggtttgga ggaaaaattt ccaacctccg aaccaggaac cgtcttggta 900 ttgactgact ggctaggcat ggtgggtcac ggtttggaag atgttatatt aagattggtc 960 ggtaatgccc caacttggtt ctacgccaag tcccttggat ttgcaccaag agcactaatt 1020 cctgattccg caattgatga cttcttcgaa tacatccata agaacaaccc cggtaccgtt 1080 tcttggttcg ttactttgag tttagagggt ggtgctataa ataaggtccc agaagatgct 1140 accgcttatg gtcatagaga tgttctattc tgggtacaaa ttttcatgat caatcctttg 1200 ggtccagtct cacaaactat ttacgacttt gcagacggat tgtacgatgt tttagccaaa 1260 gctgttccag aaagcgctgg tcatgcttac ttgggttgtc ccgacccaag aatgccaaac 1320 gctcaacaag cttactggag gaacaatttg cctagattag aagaacttaa gggtgatttg 1380 gacccaaaag atatattcca caacccacaa ggtgtcatgg ttgtttcc 1428 <210> 51 <211> 1431 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 51 atgggtcaat cccccagttc acttttagcc acttgcctaa ataccgtttg tgacggcaga 60 acagattgtg tagcataccc taacaaccca ttgtatcaga tcagctgggt caaccgttac 120 aatctggatt tgccagttac tcctattgct gtcaccagac cacaaacggt tcaagacgtg 180 tctgcttttg ttaaatgtgc tgccactaac aatataaagg tccaaccaaa gtctggtgga 240 cactcttacg ctaactatgg tggtgaagac ggtgctttag ttattgattt gttgaagttg 300 caagatttct ccatggacgc caaaacctgg caggctacta tcggtggtgg tacaaagttg 360 gctgatgtca ccaagagact gcatgataac ggtaaaaggg caatttctca cggtacttgt 420 ccaggcgttg gtatcggtgg tcatgctacc atcggtggct tgggacctac ttcgagaatg 480 tggggttcct gcttagacca cgtcgtggag gctgaagttg tgactgccga tggtagtatt 540 aagagagcct ctgaaacaga aaatcgtgac ttgttcttcg ctcttaaagg tgcaggagca 600 ggttttggtg ttgtcacgaa gtttgttatg aagacccacc cagaaccagg tagcatggta 660 caatactcct attcactatc tttcggtaaa catactgata tggtaccagt ttttaagcaa 720 tggcaagatt tagtcagtga ccccaatttg gacagaagat tcggcactga atttgttgct 780 catgagttgg gtgctattat caccgctact ttctacggta cagaagctga atgggatgct 840 agcggcatcc cacaaagaat cccaaagggt aagatatccg tcattattga tgattggcta 900 gccgttattt cccagcaagc agaggacgct gccctatatt tgtctgacat tcactccgct 960 ttcaccgtgc gttctttggc cttcaccgct gaagaaacat tgtctgaaca aactatcact 1020 agagttatga agtacatcga cgatacgaac agaggtacct tgttatggtt tttaatattc 1080 gacgcaacgg gtggtgctat aagcgatatt cccatgaatg ctactgccta ctcccacagg 1140 gacaagatca tgtactgtca aggctacggt attggtctac cagtcttaaa ccaacatact 1200 aaagatttcc ttacgggtct taccgacact atccaggctt ctatgagaca aaacttgact 1260 acctacccag gttatgttga tccttcattg gctaatccac aacaatctta ttggggccca 1320 aaccttgcaa tgttggaatc aattaagacc acgtatgacc caaacgattt gttccataac 1380 ccacaatccg ttagaccagg taataaaaag gcttctatga ctcaagagtt t 1431 <210> 52 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 52 atgagtaata acacccttat tcaagcttgc ctgttagccg ctctaggatt caactctact 60 agagtaaaat ttcctgaagc aggtacaatc gacgccgatc catataactt ggacttgccc 120 atagttccag ctgctattac tgtcccacgt tccacggctc aggtggccaa tgtcgttaag 180 tgtgctgcat cgaacggtta caaggttcaa tcaagatctg gcggtcacag ctacggtaat 240 catggtttgg gcggtaccga tggtgctatc gttgtggatt taaaagactt aaagcaattc 300 tctatggatg agtccactta cattgcatct atcggttcag gtatgttgtt ggacgaagtc 360 acccacaagt tgtatgataa cggtaagaga gccatggctc atggagtttg tccacaagtc 420 ggtgtgggtg gtcactttac aattggtggt ttgggaccta ctgctagaca gtggggttcc 480 tctcttgacc atgttgaaga agttgaggtc gttttggcca attctagtat agttagggct 540 tccaacactc aaaaccaaga cgtcctattc gctatcaaag gtgctgctgc ttctttcggt 600 attgtgaccg aatttaaggt tagaaccgaa ccagccccag atgtcgcagt tcaatacact 660 tatgaattaa ttttgggtaa tatcacagaa agagctagga ttatggtcga ttggcaggac 720 ttcatatccg accccgatct ttctcgtaaa tttgcatcga ttatgatcgt cttcgaacac 780 ggtatgttgc tgtccggcga tttctacggt tcgaagaagg aatttgatga cctgggtttg 840 gctgacagat tcccaattag aaagccaggt aacgttgcta ttttgactga ttggttagga 900 atgacaggtc atgctgttga ggaattggct ttaggtatcg taggtggcat ccctttgcac 960 ttttatgcca agagtatggc tttcacccgt gacagtttaa tgtctccatc tacgttcgaa 1020 aaattgtttg attaccttga taacactgat aagggcacct tgctatggct aatttacttc 1080 gatttgcaat caggcgccac ttcagacgta ccaaataatt ctacagcata cgctcacaga 1140 gacactttgt actggctgca atcctacgta gttaacttgg tgggtccagt cagtaacacc 1200 accacagctt ttcttgaagg tataaataac ttgatcgccc aagacgtacc ttccgccaac 1260 actagagctt atccaggtta cgttgatcca ttaatgccca acccacaatg gcgttattgg 1320 ggttcgaatt taccaaagtt ggaaaagata aaagcagcta ttgaccctaa tgacgtcttc 1380 cataacccac aatcagtcaa gcctagaaaa caagcaccc 1419 <210> 53 <211> 1512 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 53 atgggacaga gccaagcatt gtcagccttt aaaaaggacc tagctgctgc tcttaataac 60 gatgatgaat tgttcgctct gccagacgag cctttctaca ttaaggacca cgtcaagcgt 120 tataacttag atatcgaaac cacaccctta gccgtaacgt acccaaaaac taccgcacaa 180 gtttcttcca tagtgaagtt ggctaaggat aacaatttga aagttcaagc taagtgcggt 240 ggtcattctt atgccaattt ttgtgatcca aacggtggca tcattgtcga ccttaaacac 300 ttccaaaagt ttgaaattga cgaaaacact tggagatgta gggtcggtgg tggtactttg 360 ctaggtgatt tgactaagag aatgttcgaa ccacataaga gagctatggc tcacggtacc 420 tgtccaacag ttggtatcgg aggtcatgca accatcggtg gcttgggtcc tagttcgaga 480 ttatggggtg ctgccttaga ccacgtagag gaagtcgaaa tggttgttgc taacggtgac 540 gttattagag ccaacgaaaa cgaaaattcc gatatattct gggctgtcaa aggcgctggt 600 gcctcttttg gtgttattac tgaatttgtt gtaagaactg agccagctcc aggtagattg 660 gttcaatact cttattcctt cacaaccggt tcatggaagg acatggccaa gactttcaag 720 gcttggcaaa cctacgtcag ccaacctgat ttgacgcgta gtttcgcaag tactgctacg 780 atcaccgaac tgggtttgac tatttctgtc acatacttcg gcactgacga agaatttgat 840 aaaataaatt tcgctaaaaa tttcccaggt aaccagaccc caaagaccat cgtttttgat 900 gattacttgg gtgctgtggg acattgggcc gaagatgttg ctttagaaat tatctctcct 960 ttgcccgccc actcctatac aaagactttg acttttaacc actgcaacca aattccagac 1020 tctgtgattg atagaatgtt caaatacttc gaggaagttt cgaagggtac gttagtttgg 1080 tttgccatct tcgatttggc tggtggtaga gtcaatgaca tcccacaaga cgctaccgca 1140 tatgctcata gagatgcttt gttctactta caatcctacg ctgtgaaccc atttggtccc 1200 gtttctaata aaagtaagca atttctgcaa ggccttaaca aggtcatccg tgatggaatg 1260 gctgaagctg gtgaaaatac agacttgggt gcatatgccg gctacgttga tctggaatta 1320 ggtgctggtg ctcagaaggc ctactggaga actaacttgc cacgtttgga gtctattaag 1380 ctaaagtggg acccagagga tgtattccac aatcctcaat ccgtcagacc aggtggtaac 1440 gacgttattt ctaccccaaa ggtagtctac aaaaaggctg gtttcctagc taggttaaaa 1500 ggttgtttca ga 1512 <210> 54 <211> 1422 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 54 atgggtaata caaccagcat tgctggaagg gattgcctag tctctgcatt gggcggtaac 60 gccgacttag ttgcttttca aaaccagttg ctttaccaaa ctactgctgt gcacgagtat 120 aatctgaaca tacccgttac gcctgccgct atcacctacc cagaaactgc tgaacaaatt 180 gctgctgtcg ttaaatgtgc ctccgaatac gattataagg tacaagccag atcaggtggt 240 cattctttcg gtaattacgg tttgggtgga accgacggtg ctgttgtcgt tgatatgaag 300 cacttcaacc aatttagtat ggacgatcaa acttatgaag ctgttttagg tccaggtact 360 accttgggcg acgtcgatac agaattgtac aacaacggta agcgtgctat ggcacatggt 420 atctgtccaa cgatttcaac cggtggtcac ttcactatgg gtggcttggg tccaaccgcc 480 agacaatggg gtttagctct tgaccatgtc gaagaagtcg aggttatcct tgctaattct 540 tccatcgtaa gagcctcgaa cacccagaat caagaagttt tctttgcagt taaaggagct 600 gccgctagtt tcggtattgt cacagagttt aaggtcagaa ctcaaccagc acctggtttg 660 gctgttcagt attcttacac cttcaacttg ggttcttccg ctaagaaagc tcaattcgtt 720 aaggattggc aaagctttat atccgctaaa aatctaacta gacaatttta cactaacatg 780 gtaatcttcg acggtgatat tattttggaa ggcttattct tcggctctaa ggaacaatac 840 gaagcactgg gtttggaaga acgttttgtt ccaaagaatc caggtaacat cttggttcta 900 acagactggt tgggtatggt gggtcacgcc ttggaagaca ctatattgag acttgtcggt 960 aacactccta cctggtttta cgcaaagagc ttgggtttca ctccagatac gttaattcct 1020 tctgctggta ttgatgaatt tttcgaatat atcgaaaaca acaaggctgg cacatccacc 1080 tggtttgtca ccttatcttt agaaggtggt gccattaatg acgtaccagc tgatgctacg 1140 gcatacggtc acagagatgt gttgttctgg gttcagattt tcatggtcag tccaactgga 1200 ccagtttcgt ctaccactta tgacttcgct gatggtctgt acaacgtctt gaccaaagct 1260 gtgccagaga gtgagggtca tgcttacttg ggttgtcccg atccaaaaat ggccaatgct 1320 caacaaaagt attggagaca aaaccttcct agactggaag aattgaaggc tatcttagat 1380 ccaaaggaca cttttcataa cccacaagga attttacccg cc 1422 <210> 55 <211> 1428 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 55 atgggtaata ccacatccat cgccgctgga cgtgattgcc tattgtcggc tgttggcggt 60 aaccacgcac atgtcgcctt ccaggaccaa ttattgtatc aagctactgc tgtggagcca 120 tacaacctta acatacctgt tactccagct gctgtcacgt acccccaaag cgcagacgaa 180 attgccgctg tagttaagtg tgctgctgaa tacggttata aagtccaagc aagatcaggt 240 ggtcactctt ttggcaatta cggtctgggt ggtgaagatg gtgccattgt tgttgaaatg 300 aagcatttca accaattttc tatggacgaa agtacctata ctgctaccat cggcccaggt 360 attactcttg gtgatttgga tacaggtttg tacaacgccg gtcacagggc aatggctcat 420 ggtatctgtc caactattag aaccggaggt cacttgacta tgggtggttt aggtccaaca 480 gctagacagt ggggattagc tttggaccat gttgaagagg tcgaagtggt tttggcaaat 540 tcctctattg tcagagctag cgacacccaa aatcaagata tattcttcgc tgttaagggt 600 gccgctgcct cttttggtat cgtaactgaa tttaaagtca gaaccgaaga agctcctgga 660 ttagctgtcc aatactcctt cactttcaac ttgggtaccg ccgccgaaaa ggctaaactt 720 gttaaggact ggcaagcttt cattgctcaa gaggatttga cctggaagtt ttactccaac 780 atgaacatct tcgatggtca aataatctta gaaggtattt actttggttc taaggaagaa 840 tatgatgcat tgggtttaga agagagattc ccaacctctg aacctggtac tgttctggtg 900 ttgacagact ggttgggtat ggttggacac ggcctagagg atgtcatttt gaggttagtg 960 ggtaatactc caacttggtt ttatgccaaa tcactaggtt tcgccccacg tgccttgatc 1020 ccagacagtg ctattgatga tttcttttct tatatacacg aaaacaaccc aggtactgtt 1080 tcttggttcg taacgcttag cttggaaggt ggcgctatca acaaggttcc cgaagacgct 1140 accgcttacg gtcacagaga tgtgttgttt tgggtacaaa ttttcatgat taatccttta 1200 ggtccagttt cgcagactac ctacggtttc gcagacggat tgtacgacgt cctagctaag 1260 gctgtcccag aatcagctgg tcatgcatac ctgggttgtc ccgacccacg tatgccaaac 1320 gcccaacaag cttattggag atccaacttg ccaagattgg aagaattaaa aggtgaattg 1380 gatccaaagg atatctttca taatccacag ggtgttatgg ttgtttct 1428 <210> 56 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 56 atgggaaata ccactagcat tgcaggtcgt gactgcctaa tatctgcctt aggtggtaac 60 tcagctcttg ctgctttccc taaccaactg ttgtggacgg ccgatgtaca cgaatataat 120 ttaaacttgc cagttacacc agctgctatc acttaccccg agactgccga acagattgca 180 ggcatcgtca agtgtgcttc cgactacgat tacaaagtgc aagctaggtc tggtggtcat 240 agttttggta attatggttt gggcggaacc gacggtgccg tcgttgttga tatgaagcac 300 ttcaaccaat tttcaatgga cgatcaaacc tacgaagctg ttattggtcc aggtacaact 360 ttgaacgatg ttgatataga attatacaat aacggtaaga gagccatggc tcatggcgtc 420 tgtcctacta tcaaaaccgg aggtcacttc actattggtg gtttgggtcc aaccgctaga 480 caatggggtc ttgctttgga ccacgtagaa gaggtcgaag tcgttttggc taactcttcc 540 atcgttagag caagtaatac ccaaaaccaa gatgtcttgt tcgccgttaa gggtgctgcc 600 gctgactttg gaattgtaac cgaatttaag gttagaactg aaccagctcc aggtttggcc 660 gttcagtatt cgtatacgtt caacctaggt tctactgctg aaaaagctca attcgtgaag 720 gactggcaat ctttcatttc cgctaaaaat ttaaccagac aattttacaa caatatggtc 780 atcttcgatg gtgatatcat tctggagggt ttgttctttg gtagcaagga acaatacgat 840 gccctaggtt tggaagacca tttcgcaccc aagaacccag gtaacatcct ggttttaacc 900 gactggcttg gcatggtcgg ccacgctttg gaagatacaa tacttaagtt ggtcggtaat 960 actccaactt ggttttatgc caagtctttg ggtttcagac aagatacttt gattccttcc 1020 gctggtattg atgaattttt cgaatacata gacaaccaca cggctggtac tccagcttgg 1080 ttcgttacat tatcattgga gggtggtgcc atcaatgacg tggccgaaga tgctactgca 1140 tacgcccatc gtgatgtttt attctgggtt cagttgttta tggtcaaccc acttggtcca 1200 atctctgaaa caacctacga atttacggat ggtttgtatg acgttctagc tagagctgtt 1260 cctgagtctg ttggtcatgc ctacttggga tgtccagatc cacgtatgga aaacgcacct 1320 cagaagtact ggagaactaa tttacctaga ttgcaagaac tgaaggaaga attggaccca 1380 aaaaatacat tccaccatcc acaaggtgtt attccagct 1419 <210> 57 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 57 atgggtaata ccacatctat tgccggcaga gactgcctaa tcagcgcttt aggtggagat 60 tccgcactgg ctgtcttccc aaaccagctt ttgtggactg ctgatgtgca cgaatacaac 120 ttaaatcttc ctgtaactcc agccgctata acctatcccg agacagctga acaaattgcc 180 ggtatcgtta aatgtgcttc agactacgat tataaggttc aagcacgtag tggtggtcat 240 tcctttggca actacggttt gggtggtact gacggtgctg ttgtcgtcga catgaagcac 300 ttcaatcaat tttctatgga tgatcaaacc tacgaagcag ttattggtcc aggtactacc 360 ttgaacgacg ttgacatcga attgtacaac aatggaaaga gagctatggc tcatggtgta 420 tgtccaacca taaaaactgg tggtcatttc acgattggtg gtttgggtcc tacggccaga 480 caatggggct tggctttaga tcacgttgaa gaagttgagg tcgtcttggc caactcttcg 540 atcgtcaggg cttctaatac tcaaaaccaa gatgtctttt tcgctgttaa gggcgccgca 600 gctgacttcg gtattgtgac tgaatttaag gttagaacag aaccagctcc aggattggcc 660 gtgcagtata gctatacttt caaccttggt agtaccgctg aaaaagctca attcgttaag 720 gattggcaaa gctttatctc cgccaagaac ttgacgagac aattctacaa taatatggtc 780 attttcgacg gtgatattat cttagagggt ttgttctttg gttcgaagga acaatacgac 840 gctttgggtt tggaagacca ctttgcacca aaaaacccag gtaacattct agttctaacc 900 gattggttag gtatggtagg acacgcttta gaagatacta tcttgaagct agttggtaat 960 acccccactt ggttctatgc aaagtctttg ggttttagac aggacacact gatcccttct 1020 gctggaattg atgaattttt cgaatacatt gctaaccaca ccaccggtac tcctgtttgg 1080 ctggttactt tgtcattaga aggtggtgcc attaatgatg tagctgagga tgcaacagct 1140 tacgctcata gagatgtcct attttgggtt caattgttca tggttaaccc attgggtcct 1200 atttctgaaa caacttatga atttacagac ggattgtacg acgtcttggc ccgtgctgtc 1260 ccagagtccg tcggtcatgc ctacttaggc tgtccagacc caagaatgga agatgctcca 1320 caaaagtact ggcgtaccaa cttgccaaga ttgcaagaat tgaaggaaga attagaccca 1380 aaaaacacgt tccaccatcc acaaggtgtt atacccgcc 1419 <210> 58 <211> 1446 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 58 atgggtaata aagcaagtac cacaacgata atcaccactg ctgtacacaa gtgccttctg 60 tcggccgtga acggcaactc agctcaggtt tccgtccaaa acgacttatt gtacggtgtt 120 accgctgttc atgaatataa tttgaacttt ccaatgactc ccgctgccgt cactttccct 180 gagacttccg aacaagttgc tgcattggtc aagtgtgctg ccgaatacaa gtataaagtg 240 caagctagga gcggaggtca ctctttcggt aaccatggtc taggtggtgc tgatggagct 300 attgttgtcg atatgaagca ctttcaacaa ttctctatgg acaatgaaac ccacgttgcc 360 acaattggcc caggtttgag tctaggtgac atcgatacac ttttgtacaa cgctggtggt 420 agagccatga gccatggtat ttgtccagaa atacgtgccg gaggtcactt aactatcggt 480 ggtttgggtt tgacttctcg tcaatggggt atgtctttag accatatcga agaagtcgag 540 gtagttttgc caaattcctc gatcgttaga gcttctgaaa ccgaaaatgc tgatctatta 600 ttcgctgtta agggcgcagc tgcatctttt ggtgttgtca ctgaatttaa ggtaagaacg 660 caacttgcac ctaaagaagc tattcagtac tcatacagtt tcaaattggg ttccgctgcc 720 caaagagcta gattgttcgc tgattggcaa gacttggcat taaggagaga tttgtctcgt 780 aagttcacat ccgatttcat ttgtttgcaa gactctgtca ttgtgaaggg tgtgtttttc 840 ggttccaaaa aggaatataa cgccctaaga attgaacatc acttaccagg ctctgacagt 900 tctaaggttt tggtcttaga tgactggttg ggtattgtta cccacgttgt cgatgatctg 960 gctgttagat taggtggttc catgtcaact tacttttatg ccaagtcact tggttttacc 1020 agagatactt tgatgccacc atcgacgatc acctctttat tcacttactt ggacaaagct 1080 aagaaaggca caataacttg gttcgtcacc ttcagcttgg tcggtggtgc tatcaatgat 1140 taccctaaga acgccacggc ttatccacac agagatgtta tctactggat gcaatctttt 1200 gctattaacg ctctgggtcc tgttttgaac tccacttacg acttcttgga cggcatcaat 1260 gagctagtcg cacgtgattt accaggttgt gccggacacg cttatttagg ttgcccagat 1320 cccagaatgg agggtgctga aagagcctat tggggttcaa acttaggtag acttgaagac 1380 atgaaaggtg tctttgaccc agttgacgtt ttctggaatc cacaaggcgt cggtgtccct 1440 gttgct 1446 <210> 59 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 59 atgggtaaca ccacttccat agcaggccgt gattgcctaa ttagcgctct tggtggtaat 60 agtgctctgg ccgtgttccc caaccagtta ttgtggacag ctgacgtcca tgaatacaat 120 ttgaacttac ctgttactcc agcagctatc acgtatccag agactgctga acaaatcgct 180 ggaattgtta aatgtgcctc tgattacgac tataaggttc aagctaggtc tggtggtcac 240 tcctttggta actacggttt gggcggtacc gacggtgccg tcgtagtcga tatgaagcac 300 ttcactcaat tttctatgga tgaccaaacc tacgaagcag ttataggtcc aggaacaact 360 ttgaatgacg ttgatattga attgtataac aacggtaaaa gagctatggc tcatggtgtt 420 tgtccaacca tcaagacagg tggtcacttc actattggtg gtttaggtcc aaccgccaga 480 caatggggat tggctttaga ccacgtcgag gaagttgaag tcgttttggc taactcatcg 540 atcgtcagag ccagcaatac ccaaaatcag gatgtctttt tcgctgtaaa gggtgcagct 600 gccgacttcg gcatcgttac tgaatttaaa gttagaaccg aacctgctcc aggtttggcc 660 gtgcaatact cgtatacatt caacctaggt tccacggctg agaaggctca attcgtcaag 720 gattggcaat cttttattag tgcaaagaac ttgactagac aattctacaa caacatggtt 780 attttcgacg gtgatattat cttggaaggt ttgttctttg gctcaaaaga acagtacgat 840 gctcttggtt tggaagatca tttcgctcca aagaatccag gcaacatctt agttttgact 900 gactggctgg gtatggtggg tcacgctctg gaagatacga ttttgaagct tgtcggtaat 960 acccccacct ggttctatgc taagtctcta ggttttagac aagataccct gattcctagt 1020 gctggcatcg atgagttctt tgaatacatc gacaatcaca ctgccggaac tccagcttgg 1080 ttcgtaactt tatccttgga aggaggtgcc ataaatgatg ttgccgaaga cgctactgcc 1140 tatgctcata gagatgtttt attttgggtt caattgttta tggtcaaccc tttgggtcca 1200 atatctgaaa ctacatacga atttactgat ggtttatacg acgtattggc cagagcagta 1260 ccagaatccg ttggtcatgc ttaccttggt tgtccagacc cacgtatgga aaatgcacct 1320 caaaagtact ggaggactaa cttgcccaga cttcaggaat tgaaagaaga gctagaccca 1380 aagaacacct tccaccatcc acaaggtgtc attccagct 1419 <210> 60 <211> 1422 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 60 atgggcaaca ccacatctat cgctggtagg gactgcttgg tatcagccct gggtggtaat 60 gctggtcttg ttgcatttca aaaccagcct ttgtatcaaa ctactgctgt gcacgaatac 120 aatttaaaca taccagttac cccagccgct attacgtacc cagagactgc tgaacaaatt 180 gccgctgtcg tcaagtgtgc atcccaatac gattataaag tccaagctag aagtggaggt 240 catagcttcg gtaattacgg tctaggcggt acagatggtg ctgttgttgt tgacatgaag 300 tacttcaacc aattttctat ggacgatcag acctacgaag ctgtcatcgg tcctggtaca 360 accttgggag atgtcgacgt cgaattatat aacaacggta agcgtgccat ggctcacggt 420 gtttgtccaa ctatttcgac tggaggtcat ttcactatgg gtggtttggg tcccaccgcc 480 agacaatggg gcttagcctt ggaccacgtt gaagaagtag aagtagtttt agcaaactcc 540 tctatcgtga gagctagcaa tacgcaaaat caagaggttt tctttgctgt taaaggcgct 600 gctgcctctt tcggtattgt cactgaattt aaggttagaa ctcagccagc tccaggtata 660 gcagtccaat attcctacac cttcaacttg ggttcgtctg ctgagaaggc tcaattcatc 720 aaagattggc aatcatttgt ctccgctaag aacttgacca gacaattcta caccaatatg 780 gttattttcg atggtgatat tatcctagaa ggtttgtttt tcggttccaa ggaacagtat 840 gaagcattgc gtcttgaaga gagatttgtg ccaaaaaacc caggtaacat cttggttcta 900 actgactggc taggtatggt cggacatgcc ttggaagaca caatcttgag acttgttggt 960 aatactccta cttggtttta cgctaagtct ctgggtttca caccagatac gttgattcca 1020 tcttctggaa ttgatgaatt tttcaagtac atagaaaaca ataaggccgg cacctccact 1080 tggtttgtta cattatcatt ggaaggcggt gctatcaacg atgtacctgc tgacgccacc 1140 gcttatggtc acagagatgt tttattctgg gtccaaattt tcatggtttc accaactggt 1200 ccagtttctt ctaccaccta tgacttcgct gatggtttat acaatgtctt gactaaagct 1260 gtacccgaga gtgaaggcca tgcttacttg ggttgtccag accctaagat ggctaatgca 1320 caacaaaagt actggagaca aaacctacca agacttgaag aattgaaaga aaccctagac 1380 cccaaggata cttttcacaa cccacaaggt atcctaccag cc 1422 <210> 61 <211> 1449 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 61 atgaatccct caattccatc ctctagtatg ggcaacacta cctcgatagc cggtagagac 60 tgtctagtgt ctgcacttgg aggtaacgct ggtttagttg ctttccaaaa ccagccactg 120 tatcaaacaa ctgctgtaca cgaatacaat ttgaataccc ctgttacgcc agccgctatc 180 acttacccag agacagctga acatattgct gccgtcgtta aatgcgcaag ccaatatgat 240 tacaaggtcc aagctcgttc tggtggtcac tcctttggta actacggttt gggtggtacc 300 gatggagctg tcgttgttga catgaagtat ttcaaccaat tttctatgga tgaccaaacc 360 tacgaagctg ttatcggtcc tggtactact ttgggtgatg tggatgtaga attgtataac 420 aacggtaaaa gagccatggc tcatggtgtc tgtccaacta tttccaccgg cggtcacttc 480 acaatgggcg gtttaggtcc aactgctaga caatggggtt tggctcttga ccacgtcgaa 540 gaagttgagg tggttctagc aaatagttct atcgtcaggg cctcgaatac tcagaatcaa 600 gaagttttct ttgcagtaaa gggagctgct gcttcttttg gtatcgttac cgaatttaag 660 gtcagaacgc aaccagctcc aggaattgct gttcaatact catacacctt caacttgggt 720 tccagcgccg aaaaggctca gttcattaag gactggcaat ctttcgtgtc cgctaaaaac 780 ttaaccagac aattctacac aaacatggtt atatttgacg gtgatattat cttggaaggt 840 ctatttttcg gttccaaaga gcaatatgaa gctttgggtt tggaagaaag attcgtccca 900 aagaaccctg gcaatatcct agttttaacg gattggttgg gtatggtcgg acatgcctta 960 gaggatacaa tattgagatt ggttggtaac actcccacct ggttctacgc caagtccctt 1020 ggttttactc cagacacatt gattccttct tctggtatcg atgaattttt cgaatatatt 1080 gaaaacaata aggcaggtac ttctacctgg tttgtcaccc tttcattgga aggtggtgcc 1140 attaacgacg tcccagctga tgctactgca tacggtcatc gtgacgtgct attctgggtt 1200 cagatattta tggtaagtcc cactggccca gtaagttcca cgacttacga tttcgctgac 1260 ggtttatata atgttctgac taaagctgtg ccagaatctg agggtcacgc ctacttagga 1320 tgtccagatc caaagatggc taatgcacaa caaaaatact ggagacaaaa cttgccaaga 1380 ttggaagaac taaaggaaac tttggaccca aaagatacct tccataatcc tcaaggcatc 1440 cttcccgcc 1449 <210> 62 <211> 1848 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 62 atgggtaata ctacctcaat agccggcaga gattgcctag tctccgcttt gggaggtaac 60 gcaggtctgg tggcttttca aaaccagcct ttgtatcaaa cgacagctgt acacgaatac 120 aatcttaaca ttcccgtcac tccagccgct atcacctacc cagagactgc tgaacaaatc 180 gccgcagttg ttaaatgtgc ttcgcaatac gactataagg ttcaagctag gtctggtggt 240 cattccttcg gtaactacgg attaggcggt acagacggtg ccgtcgttgt tgatttgaag 300 tacttcaatc agttttctat ggatgaccaa acctatgaag ctgtcattgg tccaggtact 360 accttgggtg atgtagacgt tgaattatat aacaacggta agcgtgctat ggcccacggt 420 gtatgtccaa ctattagcac gggtggtcat ttcactatgg gtggtcttgg acctacggct 480 agacaatggg gtttagcctt ggatcacgtc gaagaagttg aggtcgtttt ggctaactct 540 agtatcgtta gagctagcaa tacccaaaat caagaagtgt ttttcgctgt taaaggcgca 600 gccgcttcgt tcggtattgt cactgaattt aaggttagaa ctcaaccagc tccaggtatt 660 gctgttcaat actcttacac cttcaatttg ggctcttccg ccgagaaggc acagtttata 720 aaagactggc aatcattcgt ttctgctaag aacttgacaa gacaattcta taccaacatg 780 gtcatctttg acggtgatat tatcctagaa ggtctgtttt tcggtagtaa ggaacaatac 840 gaagctttgc gtttagaaga aagattcgtg cccaagaacc ctggtaacat tttggtttta 900 actgattggc taggtatggt cggtcacgct ttggaggaca caatcctaag attggttgga 960 aataccccaa cttggttcta cgctaagtcc ttgggattta ctccagatac tttgatacca 1020 tcttccggta tcgacgaatt tttcgaatat attgaaaaca ataaagccgg tacctctaca 1080 tggttcgtaa ccctttctct tgagggtgga gccatcaacg acgttccagc tgatgctact 1140 gcatacggtc atagagatgt cttgttttgg gtacagattt tcatggtcag ccctacaggt 1200 ccagtttcct ctacgaccta tgactttgct gatggtttat acaacgtttt gactaaggtg 1260 gttccagaat ccgaaggcca cgcttactta ggttgtccag acccaaaaat ggccaatgct 1320 caacaaaagt attggaggca aaatttgcca agactagaag aactaaaaga aacactggac 1380 cctaaggata cttttcacaa tccacaaggc gtcttgatca ccgaggttgg ttccgccacg 1440 gacttctgga acttagttga agctattatc ttaatctctc agttgcatga atcagtcggc 1500 caaacataca acatggtgcc cgagatgggt gaacaacctg ttagagaaat gactaagatg 1560 ttccgtatgt tggaaaagac tattcaagtc agcttggaag gtcttccata cgaggaatgg 1620 ttgaacagac tgcaagtgga aaacgatgat gatccactga ggccactgtt gccaatgttt 1680 gaagaaaaag tctacgacgg tagatgccaa tgggaaatgt acgagaacat gcctatttcg 1740 gacaccgaaa acttgagaca atacttgcaa gatgttcctg aattagcaac ttgtccattc 1800 ttggatcaag atatatttaa gaagttcctt tcctctcttg gtttggca 1848 <210> 63 <400> 63 000 <210> 64 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 64 atgggcaata caacttcgat agctggtaga gactgcctta tttcagcact gggtggaaac 60 agcgccttag ctgcttttcc caacgagcta ttgtggacgg ccgatgtcca tgaatacaat 120 ttgaacttgc cagtgactcc tgctgctatc acctatccag aaaccgctga acaaattgca 180 ggagtagtta aatgtgcctc tgactacgat tacaaggtcc aggctcgttc cggtggtcac 240 agtttcggta actatggttt aggtggtgca gatggtgctg ttgtcgttga catgaagcac 300 ttcactcaat tttctatgga cgatgaaacc tacgaagctg ttatcggtcc aggcactaca 360 ttgaatgatg ttgacattga attatataac aacggtaaga gagccatggc tcatggtgtg 420 tgtcctacca tcaaaacagg tggtcacttc actattggcg gtttgggtcc aactgctaga 480 caatggggtt tagctttgga tcacgtcgag gaagtcgaag ttgttttggc caactcttcc 540 attgtcaggg catctaatac ccaaaaccaa gacgtgtttt tcgctgttaa gggcgccgct 600 gctaacttcg gaatcgttac cgaatttaag gtcagaactg aaccagcacc aggtttggcc 660 gtccagtact cgtatacttt caatttgggt agtaccgccg aaaaagctca atttgttaag 720 gactggcaat ctttcatttc cgctaagaat cttactagac aattttacaa taacatggta 780 atcttcgatg gtgatatcat tttggaaggt ttgttctttg gttccaaaga acaatacgat 840 gctctgggtc ttgaagatca tttcgctcca aagaaccctg gtaacatatt ggtcctaacc 900 gactggctag gtatggttgg tcatgcctta gaagacacca tcttgaagct tgttggtaat 960 acaccaactt ggttctatgc aaaatctttg ggctttcgtc aagatactct gatcccatca 1020 gctggcattg acgaattttt cgagtacatc gctaaccaca ccgctggtac tccagcctgg 1080 tttgtaacgt tgtctttaga gggtggtgct attaacgata tcgccgaaga tgctacggct 1140 tacgcccata gagatgttct attctgggtc caactgttca tggtcaaccc tttgggtcca 1200 ataagcgaca caacttacga atttactgat ggattatatg acgtattggc aagagcagtt 1260 cccgaatccg ttggtcacgc ttacttaggt tgtccagatc caagaatgga agatgctcaa 1320 caaaagtact ggagaaccaa cctgcctcgt ttgcaagagc ttaaagaaga attggaccca 1380 aagaatactt tccatcaccc acagggtgtc atgccagct 1419 <210> 65 <211> 1428 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 65 atgggtaata cgacatcaat cgcagccgga agagactgcc ttctgtcggc tgtcggtggc 60 aaccacgctc atgtagcctt tcaggatcaa ttattgtacc aagctactgc tgtggagcca 120 tataacctaa acatacctgt tacccccgcc gctgttactt acccacaatc tgctgaagaa 180 attgcagctg tcgttcaatg tgcttccgaa tatggttaca aggttcaagc tcgtagcggt 240 ggtcactcct tcggtaatta cggtttgggc ggtgaagatg gtgccatcgt cgttgaaatg 300 aaacatttca atcaattttc tatggacgaa tctaccaaca ttgctactat tggtccaggt 360 atcaccttgg gtgacttgga tactgcttta tacaacgccg gatatagagc aatggctcac 420 ggtatatgtc caacaatcag aacaggtgga catttgacca tgggtggtct aggtcctact 480 gccaggcagt ggggcttggc cttggatcac gttgaggaag tcgaagttgt gttagctaac 540 tcttccattg ttagagcttc agatactcaa aatcaagaca ttttcttcgc tgtcaagggt 600 gctgccgcta gttttggtat tgttaccgaa tttaaggtca gaactgaaca agctccaggt 660 cttgccgtac aatattcttt cactttcaac ttacagaccc cagcagaaaa agcaaagttg 720 gtaaaagact ggcaagcttt catcgcccaa gaggatttaa catggaagtt ttactcaaat 780 atgaatattt tcgatggtca aatcattctg gaaggaatct acttcggttc caaggctgaa 840 tatgacgctc taggtttgga gaagagattt cccacttctg aaccaggtac cgtcttggtc 900 ttgacagatt ggctaggtat ggtcggtcac ggcttagaag atgttatatt gcgtttagtt 960 ggtaacaccc caacttggtt ttacgccaaa agtttgggct tcacgccaag agctttgatc 1020 ccagactctg ctattgatga ctttttcaac tatatccaca agaataaccc tggtactgtt 1080 agttggttcg ttactttgtc tcttgaaggt ggtgctataa ataaagtccc agaagacgct 1140 accgcctacg gtcatagaga tgtattgttt tgggttcaga tatttatgat taacccatta 1200 ggccccgtca gccaaactac atacggtttc gctgacggtt tgtacgatgt tttggctaag 1260 gcagttccag agtccgcagg tcatgcttac ttgggctgtc ctgacccaag gatgccaaac 1320 gcccaacaag catactggag atccaaccta cctagattgg aagaactgaa gggtgaattg 1380 gatccaaaag acgtttttca taaccctcaa ggtgtaatgg tcgtcagc 1428 <210> 66 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 66 atgggtaaca cgacctctat cgctgccgga cgtgactgtc tgatttcggc agtcggtgct 60 gctaatgttg ccttccagga tcaattattg taccaagcta cagctgtaca accttataac 120 ctaaacatac cagttactcc agccgctgtt acctacccac aaagcgcaga cgaaattgct 180 gccgtggtca agtgcgcttc agagtatggc tacaaagttc aagctaggtc cggtggtcac 240 tcctttggta attacggtct tggtggccaa gatggtgcca tcgttattga aatgaagcat 300 ttctctcagt tttctatgga tgaatcaacc ttcatcgcta ctataggtcc cggtattact 360 ttgggtgact tggatactga cttgtacaac gccggacaca gagctatggc tcatggtatc 420 tgtccaacta ttagaacggg tggtcactta acagtcggtg gactaggtcc taccgctaga 480 caatggggtt tggcattgga tcacgtagaa gaagtcgagg tggttttagc caacagctcc 540 attgtcagag cttctgacac tcaaaatcaa gatttgttct ttgctattaa gggtgcagct 600 gcctctttcg gaatcgttac cgaatttaaa gtcagaactg aacaagctcc aggtatggct 660 gtccaatata gttacacttt ccatctgggc acatccgcag aaaaggctaa gttcgttaaa 720 gattggcagg cattcatcgc tcaagagaac ttaacttgga agttttatac caatttggtt 780 attttcgacg atcaaatcat actagaaggt atctactttg gtacgaagga agaatacgat 840 agtttaggtt tggaacaacg tttcccacct acggacgccg gcactgtttt gattttaacc 900 gattggctag ctatgatcgg tcatggtttg gaggacacca tcttgaagct agtcggtgat 960 acaccaacct ggttttacgc caagtcttta ggttttaccc caagagcttt gattcccgac 1020 agtgctatcg acgaattttt cgattatatc cacgaaaata acccaggaac tttggcatgg 1080 ttcgttactt tgtctttgga aggtggtgcc attaacgctg tccctgaaga tgctacagct 1140 tacggtcata gagatgtgct tttttggttc caacttttcg tgattaaccc attgggtcca 1200 atttcccaaa ccacatacgg atttgctgac ggtctttatg atgttttggc ccaagctgtc 1260 ccagaatctg tgagccacgc atatatgggt tgtccagacc ctagattgcc aaatgcccaa 1320 tacgcttatt ggcgttccaa tttaccaaag ttggaggaat taaaaggtat attagaccca 1380 gaagacatct ttcacaaccc acagggtgtt gttccttca 1419 <210> 67 <211> 1488 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 67 atgttatcaa caatggcctt ctcttttgtt ttgagaattt tgtcccctct attcttgata 60 ctacagctta gcacggctgc ttcgaccagt actttgcgtc aatgcttgct gaccgcagtc 120 caaaacgatc caactttagt agctgtggac ggtgatttgt tgtatcaaac tttagccgtt 180 caagtttaca atcttaactg gccagtcaca cccgctgctg ttgcatttcc aaaatctacc 240 caacaagttg cttctatcgt aaattgtgcc gcttccctag gctacaaggt ccaagccaag 300 tctggaggtc actcctacgg taactatggt ctgggtggta ctaacggtgc tattagcatc 360 aacttaaaga atatgaaatc attctctatg aattacacca actaccaggc tacagtcggt 420 gccggtatgt tgaatggcga attggacgag tatttacata acgctggtgg tagggccgtt 480 gctcacggaa cctctccaca aattggtgtc ggtggtcatg ctactatcgg tggattgggt 540 ccatctgcaa gacaatacgg tatggaactt gaccacgttt tggaagctga agttgttctg 600 gctaacggca cggtagtcag agcaagttca actcaaaact cagatttgtt gttcgccatt 660 aagggtgctg gtgccagctt tggtgttgtc actgagttcg tctttagaac agaacctgaa 720 ccaggtagtg ctgtgcagta taccttcact tttggtttag gctccacgtc tgctagagca 780 gatttgttca agaaatggca atccttcata tcccaaccag acttgactcg taagtttgcc 840 tctatctgta cgctattgga tcatgtactt gtaattagcg gtaccttttt cggtactaag 900 gaagaatacg acgctttggg acttgaagat caattccccg gtcacactaa ttcgaccgtt 960 atcgtgttta ccgattggtt aggcttggtt gctcaatggg ctgagcaatc tatcttggac 1020 ttgactggcg acattccagc tgatttctac gccagatgtc tgtcctttac cgaaaaaacc 1080 ctgattcctt ctaacggtgt cgaccagtta ttcgaatatt tggatagtgc agacactggt 1140 gctttattat ggttcgtcat tttcgacttg gaaggtggtg ctattaacga tgttccaatg 1200 gatgctactg gttacgcaca cagagatacc ttgttttggc tacaatcata cgctatcaca 1260 ttgggttctg tttccgaaac cacttatgat ttcttagatt ctgttaacga aatcataaga 1320 aataataccc ctggtttggg taatggtgtt taccctggtt acgtcgaccc aagattagaa 1380 aacgctagag aagcttattg gggttctaat ttgccacgtt tgatgcaaat aaagtctttg 1440 tatgacccaa cagacttgtt tcataaccca caaggtgtac taccagcc 1488 <210> 68 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 68 atgggcaata ccacatccat tgccggacgt gattgcctga tcagtgcatt gggtggtaac 60 tcggctttag ctgtctttcc taacgaattg ctatggacgg ctgacgtgca tgagtataat 120 ttgaaccttc ccgttactcc agctgccata acttacccag aaaccgctgc tcagattgca 180 ggagttgtca agtgtgccag cgattacgac tataaagttc aagctagatc aggtggtcac 240 tctttcggta actacggttt aggtggtgca gatggagctg tagttgttga catgaagcac 300 ttcactcaat tttctatgga tgacgaaact tacgaagctg tcatcggtcc aggtaccaca 360 ttgaatgacg ttgatattga attgtacaac aatggtaaaa gggccatggc tcatggtgtc 420 tgtcctacca tcaagactgg tggccacttc accattggtg gtttaggccc aactgccaga 480 caatggggtc tggctttaga tcatgttgaa gaggtagaag tcgtgttggc taactcttcc 540 atagtcagag cctctaatac acaaaaccaa gatgtcttct ttgctgttaa gggtgcagct 600 gcaaacttcg gtattgttac cgaatttaag gtgagaactg aaccagctcc aggtttggct 660 gttcaatatt cgtacacttt caatttgggt tctaccgccg aaaaagctca gttcgtcaag 720 gactggcaat cctttatctc cgcaaagaac ttgacgcgtc aattctataa taacatggtt 780 atctttgacg gagacattat ccttgagggt ttgtttttcg gttcaaagga acaatacgat 840 gccctaggtt tagaagatca cttcgctcca aagaaccccg gcaacatctt ggttcttact 900 gactggttag gtatggtagg tcacgctttg gaagatacta ttttgaaact ggttggtaac 960 acaccaacat ggttctacgc taagtctttg ggttttagac aagatacctt gattccttcg 1020 gctggcatag acgagttctt cgaatatatc gctaaccata ccgcaggtac tcctgcctgg 1080 tttgtgaccc ttagtttgga aggaggtgct attaacgacg tcgctgaaga tgctactgct 1140 tacgcacaca gagatgttct attctgggtt caattattta tggttaatcc agtcggtcca 1200 atctctgaca ctacctatga atttactgat ggcttgtacg atgtgctagc tagagctgtt 1260 ccagaatccg tcggtcatgc ttacttgggt tgtccagatc ccaggatgga agacgctcaa 1320 caaaagtact ggagaacaaa tttaccaaga ttgcaagaat taaaagaaga gcttgaccca 1380 aaaaacactt tccatcaccc tcagggagtt atgccagcc 1419 <210> 69 <211> 1476 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 69 atgagatctc agttactaca cggacttatt ggtctggttg ccttggtgtc accttccttc 60 gcagtcccca cgaaacgtga agctgtaacc tcttgcttga caaatgctaa ggtcccaata 120 gacgctaagg gttcgcaaac ttggacccaa gatggtacag cctataactt gaggttacaa 180 tttgagccaa tcgctattgc cgttccaact actgttgctc aaatcagcgc agctgtcgcc 240 tgtggttcta agcatggcgt ttccgtcagt ggtaaatctg gtggtcactc ctacacttct 300 ttgggtttgg gcggtgaaga tggtcatctt gttattgaat tggacagact gtactcagtc 360 aagttggcta aggatggaac cgctaagatc caaccaggtg ctagattagg tcacgttgct 420 actgagttgt ataaccaggg taaaagagca cttagtcatg gtacctgtac tggtgtaggt 480 ttgggtggtc acgctctaca cggcggatac ggtatggttt ccagaaagca tggtttaacc 540 ttggactcta taattggtgc tactgtcgtc ttgtacgacg gaaaagttgt tcactgtagt 600 aagacagaac gttccgattt attctgggcc attagaggtg caggcgcttc ttttggtatc 660 gtggctgaat tagaatttaa caccttccca gcccctgaac aaatgaccta cttcgatatt 720 ggtttgaatt gggaccaaaa cactgccgct caaggtttgt gggaatttca agaatttggt 780 aaaaccatgc cttcagaaat cacgatgcaa attgctatac gtaaggatgg atattctatc 840 gatggtgctt acatcggtga cgaagccggt ttaagaaagg cacttcaacc attgttgagc 900 aagttaaatg ttcaagtctc ggcttcgact gtgagctgga tgggtctggt tacacatttc 960 gccggtactg ctgagattaa cccaacttct gcttcctatg atgcacacga cactttctac 1020 gctacttctt tgacaaccag agaattgtca ttagaacaat tcaagtcatt cgtaaactcc 1080 atcagtacca ccggtaagtc aagttctcat tcttggtggg tccagatgga cattcagggt 1140 ggcaaatact ctgccgttgc taagccaaaa ccaacggata tggcttatgt tcatagagat 1200 gctttgcttt tgtttcaatt ctacgattca gtgccccaag gtcaaaccta cccatctgac 1260 ggtttctcct tactaactac tctgagacaa tccatttcta aatctcttag agccggcaca 1320 tggggtatgt atgcaaatta cccagactcc caattgaagg ctgaccgtgc tgctgaaatg 1380 tactggggta gcaacctgcc tagactacag aagattaagg ctgcctatga tcccaagaat 1440 atctttagaa atccacaaag tgttaagcct aaggcc 1476 <210> 70 <211> 1425 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 70 atgggaaaca ccacatcaac ttctgctggt caatgtctat tgtccgccgt gggtggcaat 60 ccagcattgg tcgcttttca gaacgctcct ttataccaag ccgttgatgt aagaccctat 120 aatctggacg ttccagttac tccagtcgct gttaccacgc cagaaactgt cgatcaagtt 180 gctagtatag tcaaatgcgc tgccgacgct ggttacaagg ttcaacctaa gtctggtggt 240 cactcctacg gtaactatgg tttgggaggt gtagacggtg aggttgtcgt cgatttaaaa 300 aatttccaac aattctctat gaacaacgaa acctggaggg ctactattgg tgcaggtaca 360 ttgcttggtg acgtgaccac tcgtttgtac aacgccggtg gcagagctat ggcacatggt 420 acctgtccac aagttggcat cggaggtcac gccactattg gtggtttagg tccaacgtcg 480 agattgtggg gtgctgccct agatcatatc gaagaagtgc aggttgttct tgctaatagc 540 tctattgtta gagcttcaca aactgagaac cctgacttgt tatttgcttt gaagggtgct 600 ggtgcctcct tcggtatcat aacagaattt actgtccgta ccgaaccagc tccaggcgaa 660 gcagttcaat attcatacac cttcaacttt ggtgataatg cttccaaggc taagactttc 720 aaagattggc aagccttcgt gtctacacca aatttgaaca gaaagttcgc cgctaccatg 780 actgtactgg aagacgcaat tgttgcttct ggtaccttct ttggaactaa ggaagaattt 840 gatgctttcg aattggagtc tcactttcct gaaaatcaag gttccaacgt cacggtcgtt 900 caggattggc tgggtttagt cgctgactgg gcagaagatg cagctttgga aggaggtggt 960 ggtgtcccat ccgctttcta tgccaaaagt ttgaatttca gtccagatac tcttatcccc 1020 aacgacacga ttgatgacat gttcgactac ttttctacca cagaaaagga tgctttgttg 1080 tggttcgcca tttttgacct ttcgggtggt gctgtgtctg atgtccccgt tcactcaact 1140 tcttacactc atagagatac tctgttttgg ttacaatcgt acgcaatatc tgttggccca 1200 gtaagcaaca ctactatcca attcttggac ggtttgtcta atttgctaac ctcttcacaa 1260 cccgaagttc actttggtgc ttatccaggt tacgttgacc caaaattgcc agacggacaa 1320 ttagcttatt ggggttccaa cttgccaaag ctagagcaaa tcaaggccga agtagatcct 1380 aacgacgtgt tccataaccc acaatccgtt aaaccagcta agcaa 1425 <210> 71 <211> 2112 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 71 atggctcagc caccttcctc agcattcgcc acctgtctaa atgatgtctg cggaggtcgt 60 agtggctgtg tgggttaccc atcggacatt ttgtatcaaa tcaactgggt agataggtac 120 aacttagaca taaacttgga gccagctgct gttacaaaac cagaaattac ggaagatgtc 180 gccgctttta tcaagtgtgc tagcgaaaat aacgtcaagg tacaagccag atctggtggt 240 cattcttacg ctaatcacgg tctgggtggc gaagacggtg cattggttat cgatttagag 300 aacttccaac acttttccat gaattgggac aactggcaag ctactattgg agccggccat 360 aagcttcacg acgttactga aaaactacat gataacggtg gtagagctat ctcacacggt 420 acctgtcctg gtgttggatt gggtggtcat gctactattg gtggtttggg tccctcttct 480 cgtatgtggg gttcctgttt agatcacgtc gttgaagtcg aagttgttac tgctgacggt 540 aagattcaaa gagcctctga agatgaaaat tcggacttgt tcttcgcact gaagggtgct 600 ggtgcttcat ttggtataat caccgaattt gtgatgagaa caaacgaaga gccaggcgat 660 gttgtcgaat atacgttctc tttgaccttc tccagacaca gagacttgtc cccagttttt 720 gaagcttggc aaaacttgat aagtgatcca gatttagaca gaagattcgg ttccgagttc 780 gttatgcatg aactaggtgc tattatcact ggtacctttt tcggaactga agaagaattt 840 gaagcaactg gtattcctga tcgtattcca accggtaaaa agtctatcgt tgtcaacgac 900 tggttgggtt ctgtcgctca acaggcccaa gatgccgctc tttggctgag cgacttaagc 960 accgccttca ctgctaaatc tttggctttc accaaggatc aattgttatc gtctgaaagt 1020 attatggacc ttatggatta catcgatgac gctaacagag gtacattgat ctggtttttg 1080 atcttcgatg tgactggagg tagaattaat gatgtaccca tgaacgccac cgcctatagg 1140 cacagagaca aggttatgtt ctgccaaggt tacggcatag gtatcccaac tttgaacggt 1200 aggacaagag agtttattga gggtataaat tccttgatca gaagttctgt gcctaccaat 1260 ttgtccactt acgctggtta cgtcgatgca tctttagaat ctccacagga ctcctattgg 1320 ggtccaaacc tagacgcttt gggacaagtt aaagaagact gggacccatc cgatctgttt 1380 tcaaatccac aatctgttag acccggtcaa aagtccgtag ttgattattt cgataacaga 1440 gcttcgtcta atggttcaga agacagctct ggtggcagta atggaggtac ccgtgatgaa 1500 caaggtggtt gttggtcttg gagaagatcc ggtccagcat ttgctgtctt tgttgcttta 1560 ttcgtaggtt tccctactcc acaaacttct tgggtccaaa agcagaactt gcgtgaccca 1620 gctttagatc tgacagacgc cgaatcacct tccagaacac ctgttgttaa cccaaacacg 1680 ttaacaactg acaccatggc caagttgtct cgtggcgctc caggtggtaa attaaagatg 1740 actttgggtt tgcccgtcgg tgccgttatg aactgcgctg acaattcggg tgcaagaaac 1800 ctttacatta tttcggtcaa aggaatcggt gctagattga acagactacc agctggtggt 1860 gttggtgata tggttatggc tactgttaag aagggtaaac cagagttgag aaagaaggtt 1920 catccagccg tcatagtcag acaaagtaag ccatggaaac gttttgatgg tgttttcttg 1980 tacttcgaag acaatgccgg tgttattgtg aacccaaaag gagaaatgaa gggaagcgct 2040 atcactggtc ctgttggtaa ggaagctgcc gaattgtggc caagaattgc ttctaattca 2100 ggtgtcgtca tg 2112 <210> 72 <211> 1458 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 72 atgggaaatt cggccagcgt ggcaggtaga gcttgttttg tcgctgctgt aggtcatgat 60 cccaacttgg ttacattcag gggtgactta ctatatgagt tccgtattca gccatcatac 120 aaccttgcca taccagttca ccctacggtc gtcacctacc caaaaactac cgctcaagtt 180 gctgaaatcg tttcttgcgc cgctgcacaa aattataaga tgcaagccta cagtggcggt 240 cactcttacg gtaactacgg tttgggtgga gaagatggtc atgttgttgt cgacttgaag 300 aacttccaag actttactat ggatccagat actcacgttg ctaccattgg cgctggtact 360 tccttaggtg atctgcaaga cagattgtgg cacgctggtg gtagagcaat ggcccatggt 420 agttgtcctc aagtgggtgt cggtggtcac ttcaccatcg gtggcttggg catgatgtcc 480 agacagtggg gtatgtctct ggaccatgtc gttgaagctc aagtagtctt ggccaattct 540 tctgtggtta cggcttccga tactcaaaac caagatattt tttgggccat caagggtgct 600 gctgcttcgt ttggtattgt tacaaaattc aaggtaagaa cacacggtgt tccaaaggcc 660 gctatccaat atcagtacac cttctctcaa ggtgacgtat tagacaaagt taagttgttt 720 atggcttggc aaaacattgt cgctaagcca aatttgactc gtaacttcag tactgaattg 780 accatattcc aagatggaat catgattatg ggtagctttt tcggtactag agatgaattt 840 cataagttcg agttagaaaa tgatttaccc cttcaaggcc ttggtaatgt tgcatatatc 900 accaactggc tatccttggt tgctcatacc gctgaagact acttgttgag actgacaggt 960 aacgtcttga cttcttttta cgccaaatct ctatcattca cggctgacga attgttcaac 1020 gagcaaggtc ttgttacttt gttcacttat ttagacgcag ctccaaaagg cacacctacc 1080 tggtgggtta tcttcgattt ggaaggaggt gccactaacg atgtcccagt taacgctact 1140 tcttacgccc acagagatgc tataatgtgg atgcaaagtt acgccgtcgc tggttttgaa 1200 ccaccaggtt ttattattaa gagattccta aacagattgc atggtgttgt aatcggtaat 1260 cgtgcacctg gtgctgtccg ttcctatcct ggttatgtcg acccatactt aagaaatgcc 1320 caggaaacct actggggtcc aaacttggct agattacaag atattaagac agctgttgat 1380 ccagatgacg tttttcacaa tccacaatcc gttaaggtga atagtctttc gccaccagac 1440 cctggaagcc atgatgtc 1458 <210> 73 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 73 atgggtcaaa cgccaagctc tcctctagcc gactgtttaa atgcagtttg caacggaaga 60 gataactgtg tggcttttcc atccgctcca ctgtatcaga tctcttgggt cgacaggtac 120 aatttggata tagaagtaga gcccattgct gttaccagac cagaaactgc cgaagacgtt 180 tcaggtttcg tcaaatgtgc tgccgctcac aacattaagg ttcaagcaaa gtccggcggt 240 cattcttacg ctaactatgg tcttggtggt gaagatggtg aattggtcgt tgatttgaga 300 aatttccaag attttagtat cgatacaaac acttggcaag ccaccttcgg cgctggtcac 360 aagttagacg acgtcactga aaaattgcat aagaacggta agcgtgctat ttcacacggt 420 acttgccctg gtgtcggtat cggtggtcac gctaccattg gcggattagg tcctgagtct 480 cgtatgtggg gttcgtgttt ggatcatgtg atcggtgtag aagtcgttac tgctgacgga 540 agcatagttc atgcctcgga caccgaaaat tccgatttgt tctttgctct taaaggcgca 600 ggagcttctt tcggtattgt aacatctttt gttgttaaga ctagaccaga accaggttcc 660 gttgtccaat acagctactc tgtcacgttc gcaaaacacg ctgacctatc cccagttttc 720 agacaatggc aggaattggt aatggatcca ggtttggaca gaagatttgg taccgaattt 780 accatgcacg agctgggtgt cattatctct ggtactttct atggtactga cgaagagttc 840 caagccacag gtattcctga tagaatccca aagggtaaga tttctgttgt tttcgatgat 900 tggatggctg ttatagcaaa acacgccgaa gaagctgctt tgtcgttaag tagtatctcc 960 tctgctttta ccgcccgttc cttggctttc agaagagaag acaagatctc accagaaact 1020 atcaccaacc tgatgaacta cattgattct gctgatagag gtactttggt ctggttccta 1080 atctttgatg ctaccggtgg tgccatttcc gatgtcccaa caaacgccac agcttactca 1140 catagagaca aggttatgta ctgtcaaggc tacggcgtag gtatacccac tttaaatcaa 1200 cagaccaagg acttcttgtc gggtattatt aacactatac aatctggtgc cggtaatact 1260 ttgactactt atcctggtta tgtcgatcca gctttgacca acccacaaga atcctactgg 1320 ggaccaaaca tcgacacttt aagagctatc aagagtcagt gggatccaaa cgatatcttt 1380 cataatccac aatctgttag gccagctgcc gtggctgcc 1419 <210> 74 <211> 1518 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 74 atgcttaaaa ccatcgctgc cgttgtattc atttgctcgc aggctttttt ggtccgtgca 60 gacctaaagt ccgagctgac tgctttgggc gtgggtgccg tcttccctgg agattcagtt 120 tacacgagcg atgctaagcc atataacttg agatttgact tcaaaccagc tgctataact 180 tttcccaata ccccagccga tgtctctcaa attgttcaaa tcgccggtaa gtacgcacac 240 aaggttgcac caagaggtgg tggtcattcc tacatttcta acggtgttgg tggaatggac 300 aatagtatca ttgctgatat gtctcacttc aagtctattg tagtccatac aaacaatgac 360 actgctacca tcgaaactgg taacagatta ggcgatatag ctttagcttt gttccaatat 420 ggtaggggta tgcctcacgg tgcttgtcca tacgtaggta ttggtggcca cgccaacttt 480 ggtggtttcg gtttcatctc aagatcctgg ggtttgaccc tagatgttgt cgaagctatt 540 gacctggttt tagcaaacgg cactatcacg acagtctctg ctactcaaaa cccagacttg 600 tattgggcca tgagaggtag cggtagttct tttggaatca ccaccgctat ccatgttaga 660 accttctccg caccagcttc tggtattatc gctttggaca cttggtactt gaatcttgaa 720 caagctgtta gagccttgag ttcctttcaa gatttcgctc acaatactgt gactttacca 780 tcttattttg gtggtgaatt tgtcgttaac gccggtcctt ccccaggttt gttgtctatt 840 acattcttct cgggattttg gggtcctcca aatcagtaca actctacgct agcaccatgg 900 aaaaattcca tgccattccc cccaaacaca acttcatact cgcaaggtaa ctacatagaa 960 agcttgtccg cccgtttcgg aggtgctccc ttggatacct ctctaggtcc agataatact 1020 gacacttttt acgtcaagtc attaatagtc ccacaagtta ccatttctga tgaaggtgct 1080 caagtaggta ttagcgataa agcttggaga gctctgttcc aatatttgat aaacgagcag 1140 cctaacctgc ctgttgattg gttcatcgaa gttgaattat ggggtggtca aaatagtgcc 1200 attaacgccg tcccacaagc ttctacagct tttgcttata gagacttgtt gtggactttg 1260 caaatgtact cttacacccc aaaccatcaa ccaccttacc cagacgccgg ttttgcattc 1320 aatgacggca tggctaatag tatcattcat aacatgccaa acggttggaa ttatggtgct 1380 tacactaatt acgttgataa ccgtttagac gattggcaga gattgtacta tgctaaccac 1440 taccccgctt tgcaagcctt gaagtctagg tatgacccta gtgatacatt ttcgttccca 1500 acttccattg aactttta 1518 <210> 75 <211> 2967 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 75 atgactacca acggtataca acccggccat gtcggtaatt taacacagga ccaagaggct 60 aaacttcaac aattgtggtc gattgtacta acgttgttag atgttaagtc cttgcaaggt 120 ggagatactt ctgcccagac ccaaccagac caacgtccaa gtactagctt gtctagggct 180 gacaccgttg tgtcagcaca cggtcaaact gcttttaccg aagatctatc ccaagttttg 240 agagaaaacg gtatgtctaa tccagatatc aagtccgtca gagaatctct gtccaacact 300 tctatcgacg aattgagatc cggtttattg tacacagcca aacacgattc acctgatgtc 360 ttgcttctaa gattcttaag agctcgtaag tgggacgttg gtaaggcttt cggtatgatg 420 ttgagagcat tggtatggag aaaagatcaa catgttgacg acaaggttat tgctaatcca 480 gagctggccg ctttggtcac ttctcagaac accgtcgata cacacgccgc taaggaatgt 540 aaggattttc tggaccaaat gagaatgggt aaatgctata tgcatggtac cgatagggac 600 ggaagacctg ttttagttgt tagagtcaga ttccaccaac catctaagca aagtgaagcc 660 gtgattaacc gttttatctt gcacacgatc gaaacagcta gattgctatt ggctccacca 720 caagaaactg tcactattat tttcgacata tggaccggtt tcggtttgtc taatatggaa 780 tacgcccctg ttaaatttat tatagaatgt ttccaagaaa actatccaga atcgttaggc 840 tacatgctta ttcataatgc tccctgggtt ttttccggta tctggaagat catcaagggt 900 tggatggatc cagtcatagt gtctaaagtg aacttcacta acaaggtttc ggatttagaa 960 aaattcatcg ctccagagca aattgtaaag gaactaaagg gtaaggagga ctggacctac 1020 gaatatgtcg aacccgtagc aggcgagaac gaattgatgg ctgacactga aaccagagat 1080 aggatttacg cagaaagatt gaagatcggt gaagagttgt tgttgagaac cagcgaatgg 1140 gtttccactt cacagcgtaa ggacgctgct gccacgacta cagctagaga acagcgttct 1200 gaaaccatag aaagtttgag acaaaattat tggcaactag acccttacgt tagaggtaga 1260 acttttttgg atagaactgg tgttgtgaag cctggaggta agattgactt ctacccatct 1320 ccagatttgg agccaagtac tgccaaaatg ttagaagtcg aacactttga aagaacccaa 1380 tttgatccat accttttctt attgccacac ggtgctagaa ttgctgttag gcattgtagc 1440 gtcaccgctt taccaaccta tcttaaggct cacccacgtg gtatgctatc tacaatggcc 1500 ttcagtttcc tacgtgtatt gtcttcccta ttgctggtct tgcaattatc aaccgctgct 1560 agtacttcga cgttgagaca atgtcttttg actgctgttc aaaacgaccc aaccctggtt 1620 gccgttgatg gagatttgct tttccaaacc ttggctgttc aagtctacaa cttgaactgg 1680 ccagtcactc ctgctgctgt agcctttccc aaatccgccc agcaagtttc ttctatcgtt 1740 aattgcgcag catcccttgg ttataaagtt caagctaagt cgggtggtca ttcttacggt 1800 aactatggct taggtggtac aaacggcgca atctctataa accttaaaaa tatgaagtca 1860 ttctcaatga attacactaa ctaccaagct acggttggtg ctggtatgtt gaatggagag 1920 ttagacgatt atctgcacaa tgccggtggt agagcaattg ctcatggcac aagcccacaa 1980 attggtgtcg gtggtcacgc aactatcggt ggtttgggtc ctgctgccag acagtacggt 2040 atggaattag atcacgtctt ggaagctgaa gttgtgttag caaatggtac agtcgtcaga 2100 gcttcctcta cccaaaactc ggacttgttg tttgccatca agggagctgg tgcttctttc 2160 ggtgtggtga ctgaatttgt ttttagaaca gagccagaac ctggatctgc tgttcagtac 2220 tccttcactt ttggtttagg ctccacctct tcacgtgccg acctattcaa gaagtggcaa 2280 tcattcattt ctcaaccaga cttgactaga aaattcgcca gcatctgtac catcttggac 2340 catgttttgg tcatttccgg tactttcttt ggtactaaag ctgaatacga cgctttaggt 2400 ttagaagatc aatttccagg tcacaccaat tctactgtga tcgtatttac cgattggttg 2460 ggactggttg ctcaatgggc tgaacaatct attttggatt tgaccggtgg tattccagcc 2520 gatttctact ccagatgttt atcttttact gaaaagactc caattccatc gactggtgtc 2580 gatcaattgt tcgagtatct ggacagtgca gatacgggag ctctattgtg gtttgttatt 2640 ttcgatttgg agggtggtgc cattaacgat gtcccaatgg atgctacagg ttacgctcat 2700 agagacacct tgttttggtt acagtcttat gccataactt taggttctgt ttcccaaact 2760 acctacgact tcctggatcg tgttaacgaa ataattagaa ataacacacc aggtttggga 2820 aacggtgttt acccaggtta cgtcgaccct agacttcaga atgcaagaga agcttattgg 2880 ggttccaatt tgccaagact tatgcaaatt aaaagccttt atgacccatc ggacctgttc 2940 cacaaccccc aaggtgtttt gcctgct 2967 <210> 76 <211> 1437 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 76 atgggccagg gtcaatcctc tgccggtggt ttgcaagact gcttaacgtc agcagtgggt 60 agcggaaatc tagctgtacc ttctaaaccc ttctaccaac aaactgatgt caagccatat 120 aacttggata tccacgtcca tccagttgct gttacatacc cacaaactaa cgaggacgtt 180 gctgctattg tcagatgtgc taaggaacac gaagccaaag tccagccacg ttccggtggt 240 cattcgtacg gtaattttgc caccggtaac ggaaacgata acatgatagt tgttgacttg 300 aagcacttca agcaattctc tatggatgac aatacctgga tcgcaacttt aggttccggc 360 caccttctgg gtgatgtcac aaagaaattg ttagctaacg gtggtagggc tatggctcat 420 ggtacttgtc ctcaagttgg tattggcggt cacgctacca ttggtggtct aggtccaatg 480 tctaggatgt ggggcagttc cttggaccac gttcaagaaa tcactgtggt cttggccaat 540 tctagcatta tcacggcctc tccaacccaa aataaggatg ttttttgggc tatgaagggt 600 gcaggagcct cattcggtat aattactgaa tttaaagtta ttacccatcc agctccaggt 660 gaggctgtta agtatagttt cggtttttcg ggaggttcac acagagatca agctaagaga 720 ttcaaaaagt ggcaatctat gatcgctgac cctggattga gtagaaaact tgcttctcaa 780 gtagttctga gtgaaatcgg tatgattata tcaggtacct ttttcggtac ccaggctgaa 840 tacaaccaat tgaacttaac ttctgtcttc cctgaaatgt cctcccataa gattatcgta 900 tttaacgatt gggctggtct agtgggtcac tgggccgaag acgtgggttt acaattgggt 960 ggtggaatct cttctccatt ctactccaag agcttggctt tcaccccaaa cgacttgatt 1020 cctgctgaag gtattgacag atttttcgaa tatttggatg aagttgataa gggtactttg 1080 atctggtttg gtatattcga tttggaaggt ggcgccacta acgatattcc agcagacgca 1140 actgcatacg gtcatagaga tgcattgttt tatttccagt catatggtgt caatctagga 1200 ttaaaggtta aggatgagac aagagacttt atcaatggta tgaatagcgt ccttgaaggt 1260 tctttgagca accacaaact gggtgcttac gctggttacg ttgatcccgc tctttctttg 1320 gaagccgccc aggttggtta ctggggtgac aacttaccac gtctgagaca aattaagaga 1380 gctgtagatc cagacgacgt tttccataat ttgcaatccg tcagaccagc tgcttcc 1437 <210> 77 <211> 1416 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 77 atgggtaata agccatccac tcctttagcc cattgcttga gagatgtttg tgcaggaagg 60 ggtaactgtg tcgctttccc aaacgagtat ctttaccagg ctaactgggt aaaaccctac 120 aatttggacg tgccagttaa gccaattgct gtctttagac ctgataatgc cgctgacgtc 180 gctgctgctg ttaagtgtgc cggtcaatca tcggttcacg ttcaagcaaa atctggtggc 240 cactcttatg caaacttcgg tctaggtggt ggtgatggtg gtttgatgat cgacctgcaa 300 catttgaaca agtttagcat gaacaacgaa acctggcaag ctacattcgg atccggtttc 360 ctattgggcg atttagacaa gcaactgcac gctaatggta atcgtgccat ggctcatggt 420 acttgcccag gtgttggcat aggtggtcac gccaccatcg gaggtattgg tccatcttcc 480 agaatgtggg gtacggcttt agatcacgta ttggaagtcg aagttgtgac tgctgatggt 540 aaaattcaaa gagccagtaa gacccagaac tctgacttgt tttggggttt gcaaggtgct 600 ggtgcttcat tcggcatcat aactgaattt gttgtccgta ccgaacctga accaggttct 660 gtcgttgagt acgcctactc tctaaatttc ggcaaacaag cagatatggc tccagtgtat 720 aagaagtggc aagaccttgt gggtgaccct aacttagata gaagattcac cagtttgttt 780 attgccgaac cattgggtgt tttgatcact ggtacattct acggtaccct agacgaatac 840 aaggcttccg gaatcccaga caagttgccc gcttcgggtg cctccattac agtcatggat 900 tggttgggta gcttagctca catcgctgaa aaaactggtt tatatttgtc taacgtatct 960 actaaatttg tttccagatc attagcatta agggaagagg accttttgag cgaacagtcc 1020 attgatgatt tgtttaagta catgggctct gctgacgctg acacaccatt gtggttcgtt 1080 attttcgata acgaaggtgg tgccatcgct gatgtccctg ataattctac tgcttatcca 1140 catagagaca agattatact gtaccaaagt tactccgttg gtttgttggg agtttctgac 1200 aagatgataa atttcgtcga tggtattcaa gatcttgtac aaaagggcgc tcctaacgcc 1260 cacacgactt acgctggtta tatcaacgct aacttagaca gaaatgctgc ccaaaaattt 1320 tattggggtg acaagttgcc acagctgcaa caactaaaga agaagttcga cccaacatcg 1380 ttattcagca atccacaatc tattgatcca gccgat 1416 <210> 78 <211> 1422 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 78 atgggtaaca ccacttccat cgcagccggc agagattgtt tggtttcagc tgtcggtcca 60 gctcatgtga catttcaaga cgctctgctt tatcagacga ccgccgttga tccttacaat 120 ttgaacattc ccgtaactcc agctgctgtc acatacccac aatcggccga agagatagct 180 gctgttgtca aatgcgcttc cgactatgat tacaaggttc aagcacgtag tggaggtcac 240 agcttcggta attacggtct aggtggtcaa aacggtgcca tcgtcgttga catgaagcac 300 ttctctcaat tttctatgga tgaatctact ttcgttgcta ccattggtcc aggtactacg 360 ttaggcgact tggataccga actatataat gctggtggta gggccatggc ccatggtatc 420 tgtcctacta ttagaactgg cggtcactta accgtcggtg gattgggtcc aacagccaga 480 cagtggggtc tggctttgga tcatattgaa gaggtagaag ttgttttggc taactcttcc 540 atcgtgagag catcgaacac tcaaaatcaa gacattttat tcgctgtaaa gggtgcagct 600 gcttcttttg gtatagtcac cgaatttaaa gttagaactc aagaagctcc aggtttggct 660 gttcaattct ccttcacctt caacttgggt tctcctgcac aaaaggctaa gctagtcaaa 720 gattggcaag catttattgc tcaggaaaac ttgagctgga agttctactc aaacttggtc 780 atcttcgacg gtcaaataat cttagaaggt attttctttg gatcgaaaga ggaatacgac 840 gaactagatt tggaaaagag atttccaacg tcagagcccg gcactgtttt ggttttaaca 900 gattggctgg gcatgatcgg acacgctttg gaagatacta ttttgaagtt ggtgggtgac 960 accccaacgt ggttttatgc taagtccctg ggtttcactc cagacactct tatcccagat 1020 tctgccattg atgacttctt cgactacatc cacaagacta acgctggtac cttagcttgg 1080 ttcgtaacct tgtcattgga aggtggtgca attaattctg tttcggaaga tgctacagct 1140 tatggtcata gagatgtctt gttttggttt caagttttcg ttgttaatcc tttaggtcct 1200 attagtcaaa ccacgtacga tttcactaac ggcctgtatg acgtccttgc ccaagccgta 1260 ccagaatccg ccggtcacgc ttacctaggt tgtccagacc ctaaaatgcc agacgctcaa 1320 cgtgcctact ggcgtagtaa cttgccaaga cttgaagatt tgaagggtga cttggaccca 1380 aaggatactt tccataatcc acagggtgtt caagttggtc ca 1422 <210> 79 <211> 1488 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 79 atgctgtcaa ccatggcatt cagctttgtc cttagaattt tatctccatt gttcttgatc 60 ctacaattat ctactgccgc tagtacatcc actttgaggc agtgtttgtt aaccgctgtt 120 caaaatgacc ctacgttggt agctgttgat ggtgatttgc tgtaccaaac tcttgccgtg 180 caagtctata acttgaactg gccagttacc cccgctgctg tcgcctttcc aaagtcgact 240 caacaagttg cttctatagt taactgcgct gcatccttgg gatacaaagt gcaagctaag 300 tctggcggtc attcctacgg taattatggt ttgggtggta ccaatggtgc catttcaatc 360 aacttaaaga acatgaaatc gttctctatg aactacacga attaccaagc cacagttggt 420 gctggtatgc ttaacggcga gttagacgaa tatttgcaca acgctggtgg tcgtgctgtc 480 gcacacggaa cttcccctca gattggtgta ggtggtcatg ctactattgg aggactaggt 540 ccatcggcta gacaatacgg tatggaattg gatcacgtct tagaagccga agttgttttg 600 gcaaacggta ccgtagtccg tgcttcttct actcagaata gcgacttgct gttcgccatc 660 aagggtgctg gtgctagttt tggtgtcgtt acagagtttg tgttcagaac agaaccagaa 720 ccaggttctg ctgttcaata taccttcact ttcggcttgg gttccacctc tgccagagcc 780 gatctattta agaaatggca atccttcata tcccaaccag acctgactag aaagtttgca 840 agtatctgta ccttgttaga tcatgttttg gtcatttctg gtactttctt tggtacaaaa 900 gaagaatacg acgctttggg cttggaagat caatttcccg gacacactaa ctctactgtt 960 atcgttttca ccgattggtt gggtttggtg gctcaatggg ctgaacaatc aattttagac 1020 ctgactggtg gtatcccagc tgatttctac gcaagatgtt tgagctttac tgaaaagacc 1080 ctaattcctt ccaatggtgt cgaccaatta ttcgagtacc tagactcagc agatactggt 1140 gctttgttat ggttcgtcat ctttgatctt gaaggtggtg ccattaacga cgtcccaatg 1200 gacgctaccg gctatgctca cagagatacc ttgttttggc tacagtctta cgctattacg 1260 cttggttctg ttagtgagac tacctacgat ttcttggaca atgtaaacga aatcataaga 1320 aacaatacac caggacttgg taacggtgtt taccctggtt atgttgatcc aaggttgcaa 1380 aatgcaagag aagcctattg gggttcaaat cttccacgtt tgatgcaaat taagtctcta 1440 tatgacccaa ccgacttgtt tcataaccca caaggtgttt tgcctgcc 1488 <210> 80 <211> 1404 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 80 atggctccat ccatttcatt ttctttgcta caaatctcgc ttttggccta ttctggtctg 60 gtgagtggag atttctcttt aagacagtgc ttggaatccg ctgttagcag ggtagcattc 120 gagggcgacc ctttttacca attattgtca gtcagaccat acaacttaga tatatccatt 180 gttccagctg ccgtcgcttt ccccgctgac actaatgaag ttgcagctgt cgtaagatgt 240 gctgcccaaa acggttatca agttcaagca aaaagtggtg gtcactcata cgctaatcat 300 ggtttgggtg gtaccaacgg agctgttgtg gttaatctgg aaaacttgca acacttctcc 360 atgaacacga ctacctggga agccacaatc ggtgctggta cattattggg tgatgtcacc 420 aagcgtttgt ctgacgctgg cggtagagca atggcccatg gtacttgtcc tcaggttggt 480 tctggaggtc actttactat tggtggccta ggtccatcta gtagacaatt tggcgccgct 540 ttggatcata tcatagaagc tgaagtcgtt ctagctaact cttctattat cagagcatct 600 gagactgaaa acccagatgt gttcttcgct gtaagaggag ctgcttccgg ttttggtatt 660 gttaccgaat ttaaggttcg taccgaacca gaaccaggtc aagccgtcag atacagttat 720 tctttctcgt tcagcgacac cgctacgcgt gcagacttgt tcaagaaatg gcaagcctac 780 gtcactcaac cagatttgcc tagagaactt gcttctactc tgacaatttt ggaacacggt 840 atgttcatca ctggtacgtt tttcggttca aaggaggagt acaatgctct aaagattgaa 900 accgaatttc ccggtttcgc caagggtgga accttagtct tggatgactg gttgggttta 960 gttagtaatt gggctgaaga cttgcttttg tcggaagaag aaatcgagca aatgttcgaa 1020 tatattgata acgttgacaa aggtacacta ctgtggtttg ccattttcga cctacaaggt 1080 ggtgctgtcg gtgatgtacc agtcgatgcc actgcttacg ctcacagaga taccttgata 1140 tggctacaat cctacgcaat caatctgttt ggtagaataa gcgaaactac tgttgagttt 1200 ttagaacgtt tgaacgaatt gactttgaca tctacagcta agacggttcc atatgcagcc 1260 taccctggtt atgttgaccc aagattgact gatgctcaag ctgcctactg gggatcgaac 1320 ttagctagat tgaacagaat caaagctgaa atcgacccaa acaatgtatt ccacaatccc 1380 caatccgttc gtccagcttc tggt 1404 <210> 81 <211> 1425 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 81 atgggtaata ctacctcgat agccgctggc agagattgcc tggttaacgc tgtcggtggt 60 aaccaggcat tagtagcttt tcaagaccaa ttgctatatc aatccacggc cgtcgaagct 120 tacaacttga atattcctgt tacaccagct gctgtcactt tcccagagtc ttcagaacaa 180 atcgcagccg tggttaaatg tgcttctgaa cacgactaca aggttcaagc tcgtagcggt 240 ggacatagtt tcggtaatta tggtttgggt ggtaccaacg gcgccatcgt ggttgatatg 300 aagaaatttg atcaattctc catggacgaa tcgtcttaca ttgctactat tggtcccggt 360 accactttag gtgatgtcga cacagaattg tacaacgctg gaggtagagc catggctcac 420 ggtatttgtc caaccatcag aactggcggt catcttacga tgggtggttt gggtccaact 480 gccaggcagt ggggcttggc tctggaccac atagaagagg ttgaagtcgt attagctaat 540 tcttccatcg ttagagcatc tcatacccaa aaccaagata ttttgtttgc cgttaagggt 600 gcttccgcat cattcggtat tgtcactgaa tttaaggtta gaactgaacc tgcaccaggt 660 ttggctgtcc aatactctta taccttcaat ttgggtagtg cagcctccaa ggctaaatta 720 gttaaggatt ggcaagagtt catcgctcag gacaacttga catggaaatt ctatagcaat 780 atggtcatta tcgacggaga tataattctg gaaggtatct ttttcggttc taaggaagaa 840 tttgatgctt tagaactaga aaacaggttc ccacccaaga acccaggtaa catacttgtg 900 ttgactgatt ggttgggaat gatttctcac tccttggaag acatcatttt aagagttgct 960 ggtggtgtac caacctactt ttacgctaag tccttaggtt tcacacctca agctttgatc 1020 ccatctagcg ctattgatga cctgttcgat tatatagaaa agactaatcc aggtactcta 1080 gcctggttta tcaccttgtc cttggagggc ggagctatta acaacgttcc agctgacgca 1140 acagcctacg gtcacagaga tgtgcttcat tgggtccaaa tctttgccgc taatcctttg 1200 ggtccaattt ctgaaaccac ttacgacttc actgacggtt tatacaacat ccttgctaaa 1260 gccgttcctg agtctgctga acatgcttat ttaggttgtc ctgatccacg tatgaaagac 1320 gctcaaaagg cttactggag agataacctg ccacgtttgg aagaattaaa ggctgaattg 1380 gatcccaaag atacttttca caatccacaa ggtgtagccg tcgct 1425 <210> 82 <211> 1464 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 82 atgttattga aactattttt cttggccgta gcagcttcag ttgctctggc tgcttccagt 60 gaggccttga agcagtgctt ggaaaacgtc ttcactgacc gtgcaggctt tgctttcgcc 120 ggtgatttat tctatgacag aatagttaat agatacaact tgaatatccc agtcacccct 180 tcggctttgg cttttccaac gagctctcaa caagttgccg atattgtgaa gtgtgcagct 240 gataacggtt accccgttca agctaggtcc ggaggtcatt cttatggtaa ctacggtctt 300 ggtggtgctg acggcgccgt cgctatcgat ttaaaacacc tacaacaatt ctctatggac 360 aagacaactt ggcaggctac cattggtgcc ggatctttgc tatccgatgt tacccaaaga 420 ttgagccacg ctggtggcag agccatgtct catggtattt gtccacaagt cggttcgggt 480 ggtcacttca caatcggtgg tttgggacca acttcaagac aatttggtgc tgccttagac 540 catgttcttg aagtcgaagt cgttttggct aattccagta ttgtccgtgc ttctgatact 600 gaaaacaagg atttgttttg ggctattaag ggtgctgcat ctggatacgg tatcgttacc 660 gaatttaaag tgagaactga acctgaacca ggtaccgctg ttcaatatgc atacagcatg 720 gagttcggta atccaactaa gcaagcaacc cttttcaagt cctggcaggc ttttgtgtct 780 gacccaaaat tgactagaaa gatggcctct acattaacga tgctggaaaa cagtatggct 840 atatccggta ctttcttcgg tactaaggaa gaatacgaca agttgaattt gaccaacaag 900 tttcctggtg ctaatggtga cgctttagtt ttcgaagatt ggctgggcct agtggctcac 960 tgggctgagg atttgatatt gggtttagct gccggtattc caactaactt ctatgccaaa 1020 tcaacgtctt ggactcccca aacattaatc acccccgaaa ccgtagataa aatgtttgac 1080 tacatcgcca ccgttaacaa aggtactctt ggctggttct tattgtttga cttgcaaggt 1140 ggttatacga acgatattcc aaccaacgcc acatcatacg ctcacagaga tgtcttgatt 1200 tggctacaat cttatacagt taactttttg ggtcctatct cccaggctca aattgacttc 1260 ctagatggtt tgaataagat tgtcaccaac aataagttgc catacactgc ttacccaggt 1320 tacgttgatc cattgatgcc aaatgctcca gaagcatact ggggaactaa cttgccaaga 1380 ttacaacaaa tcaaggaatt agtcgaccct aatgatgttt ttcgtaaccc acaatctcca 1440 tccccagcta acaaagagcc actg 1464 <210> 83 <211> 1416 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 83 atgggtaacg gaaatagcac accttttcgt gactgtttag attctatatg cgcaaacaga 60 tccacctgtg tgacgtatcc aggtgaccca ctgttctcgt gttggagtag gcccttcaat 120 ttggagtttc ctgtagtccc agccgctatc attagaccag aaactaccac tgaagttgct 180 gaaactgtta aatgtgctaa gaagtacggt tacaaggttc aggctaaatc aggtggccac 240 tcctacggta accatggttt gggtggtgtc ggaggtgccg tcagtattga tatggtcaac 300 ctaagagatt tctctatgaa caataagacc tggtatgctt ctttcggttc tggtatgaac 360 cttggtgaat tggacgagca cttacatgcc aacggcagaa gagcaatcgc tcacggtaca 420 tgcccaggtg ttggtactgg tggtcatttg accgttggtg gtttgggtcc aatttccaga 480 caatggggct ctgctctgga ccacttgcta gaaatcgaag tcatcactgc tgatggtacg 540 gtgcaaagag cctcatatac taaaaattct ggattatttt gggctttgcg tggtgctggc 600 gcctctttcg gtattgttac aaagtttatg gttaagactc acccagaacc tggtagagta 660 gtgcaatact catacaatat agctttggcc tcccatgctg aaactgctga actatatagg 720 gaatggcaag ccttggttgg agatccaaac atggaccgta gattctcttc cttattcgtc 780 gtccaaccat tgggtgcttt gattaccggt accttctttg gtaccaagtc ccaataccag 840 gcaactggta ttcctgacag actaccaggt gctgataaag gtgctgtctg gcttacagat 900 tgggcaggct tgttattgca cgaagctgag gccgctggtt gtgccttagg tagcatccca 960 accgctttct acggcaagtc gttgtctttg agtgaacaag accttttatc agattctgct 1020 attaccgact tgtttaagta tttagaggat aacagatccg gtttagcccc cgttactatc 1080 ttgtttaata ccgaaggtgg tgctatgatg gatacgcctg ccaacgccac tgcttacccc 1140 cacagaaact ccattatcat gtaccaatct tatggtatag gagttggtaa ggttagtgct 1200 gcaacacgta aactgttgga cggtgttcat gaaagaatcc aaagaagcgc accaggcgct 1260 ctgtctactt acgctggtta tattgacgcc tgggctgacc gtaaggctgc ccaaaagcta 1320 tactgggctg ataatttgcc aagattaaga gaattaaaaa aggtctggga tccagcagat 1380 gttttctcaa acccacagtc tgttgagcca gcagac 1416 <210> 84 <211> 1113 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 84 atggattcta acacttggga ggccacgttc ggctcaggat ttttacttgg tgaactagac 60 aaacatttgc acgctaatgg taacagggct atggcacacg gtacctgtcc aggtgttggt 120 atgggtggtc atgccactat cggaggtatt ggccctagct ccagactgtg gggtacaacc 180 ttagaccacg tattgcaggt cgaagtggtt actgctgatg gtaagataca acgtgcttct 240 aagactcaaa acccagattt gttctgggct ctacaaggtg ctggtgcctc gtttggcatt 300 atcaccgaat ttgtcgttag aaccgaaccc gaaccaggta gtgttgtcga atacacctat 360 tccgtatctt tgggaaagca atctgacatg gctccattgt acaaacaatg gcaagctttg 420 gttggtgatc cttccctgga cagaagattc acaagtttat tcattgccga gccattgggt 480 gttttaatca ctggtacatt ttatggtact atgtacgaat ggcacgcatc aggtatccct 540 gataagttgc caagaggtcc aatttcggtc accgttatgg actctttggg atctttagct 600 catattgccg aaaaaactgg cctgtacttg accaatgtcc caacgtcctt cgctagcaga 660 tctcttgcct tgagacagca agatttgttg tccgagcaat ctatcgatga cttattcgaa 720 tatatgggtt cggctaacgc agacactcca ctttggttcg tgatctttga caacgaaggt 780 ggtgctattg ctgatgtgcc tgataatagc accgcctacc cacatagaga taaggttatt 840 gtttaccaaa gctactccgt cggtttacta ggtgtcactg ataaaatgat aaagttcttg 900 gacggtgttc aagatattgt ccagagggga gctcccaacg cccacacgac ctatgcaggt 960 tacatcaatc cacaattgga ccgtaaggct gctcaacaat tctattgggg tgacaagcta 1020 ccaagattgc aacagattaa gaagcaatat gatcctaaca acgtgttttg caatccacaa 1080 tctatctacc cagctgaaga catgtctgac ggt 1113 <210> 85 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 85 atgggtaaca caacttccat cgcaggcaga gattgcttag tctcagccct tggaggtaat 60 tctgctttgg ctgctttccc aaaccaattg ctgtggaccg ccgacgttca cgagtataat 120 ttgaacctac ctgtaacgcc agctgccata acctaccccg aaactgctga acagattgct 180 ggtatcgtta agtgtgctag tgattacgac tataaagtgc aagctaggtc tggtggtcat 240 tcctttggta attacggttt gggaggtact gatggtgccg ttgtcgtcga catgaagcac 300 ttcaaccaat tctcgatgaa cgatcaaacc tacgaagcag ttattggtcc aggtactacc 360 ttaaacgacg ttgacattga attgtacaac aatggcaaga gagctatggc tcatggtgtt 420 tgtccaacta tcaaaacagg tggtcacttt acaattggcg gtctgggtcc tactgccaga 480 caatggggtt tggctttaga tcacgtcgaa gaagtggaag tagtcttggc caactcttct 540 atcgttcgtg ctagcaatac ccaaaaccag gatgtcttct ttgctgtcaa gggcgcagct 600 gccgacttcg gtatcgttac ggagttcaag gttagaactg agccagcacc tggtttagct 660 gttcaatatt cgtatacctt taatcttggt agtactgctg aaaaagccca atttgtcaag 720 gattggcaaa gcttcatttc cgctaaaaac ttgactcgtc aattctacaa caatatggtt 780 atatttgacg gtgacattat tttagaaggt ttgtttttcg gatcaaagga acaatacgat 840 gccttgggtt tggaagatca ttttgctcca aagaatccag gtaacatcct agtgctgacg 900 gactggttgg gaatggtagg tcatgctttg gaagacacca ttttgaagct agttggaaac 960 acacccactt ggttctacgc taaatctttg ggtttcagac aagataccct aatcccatct 1020 gctggtattg acgaattttt cgaatatata gcaaaccaca ccgctggtac tccagcttgg 1080 ttcgttacct tatctctgga aggcggcgct ataaacgatg tggctgaaga tgccacagca 1140 tacgcacaca gagatgtcct attttgggtt cagttgttca tggtcaatcc actaggtcca 1200 atctcagaaa ctacctacga gttcactgac ggtttatatg acgtcttagc aagagctgtc 1260 cctgaatctg ttggtcatgc ctatttgggt tgtccagacc caagaatgga aaacgctcca 1320 caaaagtact ggcgtactaa tttgcctaga ttacaagaat tgaaagagga attggatcca 1380 aagaacacct tccaccatcc acaaggtgtg attccagct 1419 <210> 86 <211> 1428 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 86 atgggtaaca ctacgtcgat tgccgcaggc agagattgcc ttgtcagtgc tgttggtggt 60 gtggctgctc atgttgcttt tcaggactct ttgttatacc aagccacagc cgtagagctg 120 tataatctaa acatacctgt cacccccgct gctgttactt acccacaaag caccgatgaa 180 atcgccgctg tcgttaaatg tgcttcagac tatgactaca aggttcaagc tcgttccggt 240 ggtcactcct tcggaaacta cggtttgggt ggccaaaatg gtgcaattgt aatcgatatg 300 aagcacttct ctcaattttc tttagataag tctactttca ttgccacctt cggtccaggt 360 actacattgg gaaacttgga caccgaacta tatcatgctg gtaacagagc aatggctcac 420 ggtatctgtc caactattag aaccggaggt catttgacaa tgggcggttt gggtccagct 480 gccaggcagt ggggtttggc attagatcac gttgaagaag tcgaagttgt ccttgctaat 540 tccagcgtgg taagagcctc tgacactcaa aatcaagacg ttttctttgc tgttaaaggt 600 gctgctgctt cttttggtat cgtcactgag ttcaaggttc gtactgaaga agcccctggt 660 ttggctgttc aatacagctt tccattcaac ttgggtaccc cagctgaaaa agctaagtta 720 gttaaggatt ggcaagcatt tatagctcaa gaaaatttat cgtggaagtt ctactcaaac 780 atggtcatct ttgatggtca aattattctg gagggcattt tcttcggctc caaaaaggaa 840 tatgacgaat tggacctgga aaacaagttc cccacctcgg aaccaggtac agtcttggtc 900 ttgaccgatt ggcttggtat gatcggtcac ggtttggaag acactatttt aagattggtg 960 ggtaactccc caacatggtt ctacgccaag tctcttggct ttactccttc tactttaatt 1020 agtgatagtg ctatcgatgg tttgttcgat tatatccaca aaaccaaccc aggtacattg 1080 gcctggtttg ttacgctatc tttggagggt ggagctataa atactgtctc cgaagatgcc 1140 actgcttacg gacatagaga tgttttgttc tgggttcaaa tctttgttgc taaccctttg 1200 ggtccaattt cacagactac ctacgacttc gctgacggat tatacaacgt tctggctcaa 1260 gctgtgccag attctgccgg tcatgcttac ctaggttgtc cagaccctaa attgccagat 1320 gctcagagag catactggag gtctaatcta ccaagactgg aggaacttaa gagagacttg 1380 gatccaaaag acatcttcta taatccacaa ggtgtccaaa ttgtttcc 1428 <210> 87 <211> 1428 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 87 atgggtaaca ccacatcgat cgctgccgga cgtgactgct tactttccgc agtcggtggc 60 aatcatgctc acgtggcttt ccaagatcag ctgctatacc aagccactgc tgttgaacct 120 tataacttga atataccagt aacgcccgct gccgttactt acccacaatc agctgacgag 180 gttgctgccg tcgttaaatg tgcagctgat tacggttata aggtccaagc tagaagtggt 240 ggtcactctt ttggtaacta cggtttgggt ggcgaagatg gtgctattgt tgtggacatg 300 aagcatttcg atcaattttc tatggacgaa tctacctata cagccactat tggtccaggt 360 atcactttgg gcgatttgga caccgcttta tacaatgcag gtcacagagc catggctcac 420 ggtatttgtc caaccatcag gacgggtggt cacttgacta taggaggttt aggtcctact 480 gctagacagt ggggacttgc cttggatcat gtagaagagg ttgaagtcgt tctggctaac 540 agctccattg tcagagcctc tgacacacaa aaccaagaaa tcttgttcgc cgttaagggt 600 gctgctgctt ccttcggaat cgtcaccgaa tttaaagttc gtactgaaga agctccaggt 660 ttggctgtcc aatactcctt cacctttaat ttgggtactg ctgccgagaa ggcaaagtta 720 gttaaagatt ggcaagcctt cattgctcaa gaagatctta cttggaagtt ctattctaac 780 atgaacataa ttgacggtca aatcattctg gaaggtatct atttcggttc aaaagccgaa 840 tacgacgctt taggtttgga agaaaagttt ccaacttctg agccaggcac cgtgttggta 900 ctaactgact ggttgggtat ggttggtcat ggtttggaag atgtaatttt aagattggtc 960 ggtaatgctc ccacctggtt ctacgctaag tcgctaggtt ttgcaccaag agctctaatt 1020 cctgattccg caatagacga ttttttcgaa tacattcaca aaaacaatcc aggtaccgtt 1080 tcatggtttg ttaccttgtc tttggaaggc ggtgccatca acaaggtccc cgaagatgct 1140 actgcttatg gccatagaga tgttctattc tgggtccaga ttttcatgat caacccattg 1200 ggtccagttt ctcaaacaat ttacgatttc gctgacggtc tgtatgacgt cttagctaag 1260 gcagtgccag aaagcgccgg tcacgcatac ttgggttgtc cagatcctcg tatgcctaac 1320 gctcaacaag cctactggag aaacaacttg ccaagactgg aagagttaaa gggtgatctt 1380 gacccaaaag acattttcca taatccacaa ggtgtcatgg ttgtctcc 1428 <210> 88 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 88 atgggtaacg gacagtccac ccccttgcaa caatgtttaa atactgtttg caacggtaga 60 ctaggttgtg tagctttccc aagtgatgca ttgtatcaag ccgcttgggt caagccttac 120 aacctggacg tgccagttac gcctatcgct gtttttaaac caagctctac agaggatgtc 180 gccggtgcta taaagtgtgc tgttgcctcg aatgtgcacg ttcaagcaaa gtccggtggc 240 cattcttacg ctaacttcgg tttgggtggt caagacggag aattaatgat tgacttggct 300 aaccttcagg attttcacat ggacaaaact tcttggcaag ctactttcgg tgctggttat 360 aggttaggcg atttggataa gaagttgcaa gccaatggta atagagccat tgctcatggt 420 acctgtccag gagtcggtat cggtggtcac gccactattg gtggtctagg tccaatgtca 480 cgtatgtggg gcagtgcttt ggaccatgtc ttatctgttc aagtagtgac cgctgatggt 540 tccatcaaaa acgcatccga atctgaaaac tcagatctgt tttgggcttt gagaggagct 600 ggtgccagct tcggtgtcat aaccaagttc acagttaaaa ctcaccctgc tcccggttct 660 gtcgtacaat acacttacaa gatttcgttg ggttctcagg cccaaatggc tccagtttat 720 gcagcttggc aagctttagc tggtgaccca aagcttgaca gacgtttctc tacattgttt 780 atcgctgaac cattgggcgc cttaatcacc ggcacctttt acggaactaa agctgagtac 840 gaagccacgg gtattgctgc aagattgcca tccggtggta ctcttgacct aaagcttttg 900 gattggttgg gttccttggc ccacattgct gaagttgtcg gtcttactct aggtgacata 960 ccaacctctt tctatggtaa gtcattggcc ttgagagaag aagatatgct agatagaacc 1020 tcaatcgatg gtttgttcag atacatgggt gacgctgatg ccggtacctt gttatggttt 1080 gtcattttta attcggaagg tggtgcaatg gcagatacgc cagctggcgc aactgcatat 1140 cctcatagag acaaactaat catgtaccaa tcttatgtta ttggtatccc aactctgaca 1200 aaggctacca gggacttcgc tgatggtgtt cacgacagag ttagaatggg tgctccagct 1260 gctaacagta cttacgctgg atacattgat agaaccttat ctcgtgaagc cgctcaagaa 1320 ttttactggg gtgcacaatt gcctaggttg cgtgaggtca agaaggcttg ggacccaaag 1380 gatgttttcc ataatcccca atccgtagac ccagctgaa 1419 <210> 89 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 89 atgggcaata ctacgtctat tgctgccggt agagactgtc ttatcagcgc agtcggtgct 60 gctaacgtag cctttcaaga tcagctgcta taccaagcta cagctgtgca accctataac 120 ttaaatatac ctgttactcc agctgccgtt acctacccac aaagtgccga cgagatcgct 180 gccgttgtca aatgcgcttc ggaatatggt tacaaggtcc aagctaggtc aggtggacac 240 tccttcggta actacggttt gggtggccaa gatggtgcaa ttgttattga aatgaagcat 300 ttctctcagt tttctatgga cgaatccacc ttcatcgcta ctattggtcc aggaatcacc 360 ttgggtgatt tggatactga tttatataac gccggtcaca gagctatggc tcatggtata 420 tgtccaacca tcagaacggg tggtcaccta acagttggtg gtttgggccc tactgctcgt 480 caatggggct tagcattgga ccatgtagaa gaagtcgaag ttgttctggc taactcttcc 540 attgtccgtg cttctgacac tcaaaatcag gatttgtttt tcgctatcaa gggtgccgcc 600 gcttccttcg gtattgtaac agaatttaaa gttagaaccg agcaagctcc aggtatggca 660 gtccaataca gttacacctt ccaccttggt acttcagctg aaaaggccaa gttcgtcaaa 720 gactggcaag ccttcattgc tcaagaaaac ttgacttgga agttttatac caacttggtt 780 atattcgatg atcaaatcat cttggaggga atatactttg gtactaaaga agaatacgac 840 agcttaggtc ttgaacaaag attcccacca actgacgcag gtactgtgtt aattttgaca 900 gactggttgg caatgattgg tcatggattg gaggatacga ttttaaagtt ggttggtgat 960 acacccacct ggttttatgc caagtctcta ggtttcaccc caagagctct tattccagat 1020 agcgctatcg acgaattttt tgactacata cacgagaata accctggtac tttggcttgg 1080 ttcgtcacgt tatctttgga aggaggtgct atcaacgctg ttccagaaga tgcaaccgct 1140 tatggtcaca gagatgtctt attctggttc caattgttcg ttattaatcc tttgggtcca 1200 atctcgcaga ctacttacgg tttcgccgac ggtctttacg atgtcctggc tcaagcagtt 1260 cccgaatctg cttcgcatgc atacatgggt tgtccagatc caagaatgcc aaacgctcaa 1320 cgtgcttact ggagatccaa cttgcctaaa ctggaagaac taaagggcta tttggaccca 1380 gaagacattt ttcacaatcc acaaggtgtt gtaccctct 1419 <210> 90 <211> 1428 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 90 atgggtaaca ccacatcaat aactgctggc cgtgattgcc tgacttccgc cgtcggtgga 60 gttgctgcac atgtagcttt tcaagacgcc ttactatatc agaccccagc tgtggaccct 120 tacaatttga acattccagt tacgcccgcc gctgttactt acccacaaag cgctgatgaa 180 gtcgccgctg tcgttaagtg tgcttcggat tataattaca aagttcaagc tagatctggt 240 ggtcactcct tcggtaactt cggtttgggt ggacaaaatg gtgcaatcgt cgttgacatg 300 aagcactttt ctcaattctc tatggatgag agtaccttcg tcgccactat tggtccaggc 360 acaacccttg gtaacttgga cactgaaatc tacaacgctg gtaagagggc tatgtctcat 420 ggtatttgtc ctagtatcag aaccggtggt cacttgactg taggcggttt aggtccaaca 480 gctagacaat ggggtttggc tcttgaccac gttgaagaag tcgaagttgt gttggccaac 540 tcatccatta tcagagcttc tgatacccag aaccaagatg tcctatttgc aattaaaggt 600 gctgccgcat ccttcggaat agtaaccgaa tttaaggtta gaactgaaga ggctccaggc 660 ttagctgttc aatactcctt cactttcaat ctgggtacgc cagctgaaaa ggcaaagttg 720 gtgaaagact ggcaagccta tatcgcacag gaaaatttga cctggaagtt ttattctaac 780 cttattatct ttgacggtca aattatcttg gagggtattt tctttggtag caaggaagaa 840 tacgatcaat taaacttaga taagaaattc cctacttccg aaccaggtac agttttggta 900 ttgactgact ggttaggcat gattggtcat ggtttggagg acaccattct gcgtttagtt 960 ggtgattctc caacatggtt ttacgctaag tctttgggtt tcacaccttc taccttgata 1020 tcaggcagtg ctatcgacgg tttgttcgat tacattcaca aaactaatgc aggaactcta 1080 gcttggtttg ttacgttgag tttagaaggt ggtgccataa acgctgtccc aaaggacgct 1140 actgcatatg gtcatagaga tgtcttgttc tgggttcaaa tcttcgtcgc caacccactt 1200 ggtccaattt cgcaaaccac ttacgatttc accgatggtc tttacgacat cctggctcag 1260 gctgttcccg aatctgccgg tcacgcttat ttgggttgtc ccgatccaaa gatgccagac 1320 gctcaaagag cttattggag atccaatctg cctcgtttgg aagaattgaa gggtgatctg 1380 gaccccaagg atattttcca taatccacaa ggagttcaag tagcatca 1428 <210> 91 <211> 1449 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 91 atgaatcctt caattccatc ttcctctatg ggcaacacca cttccatcgc tggtagggat 60 tgtctggtca gcgccttagg aggtaacgct ggtttggtag cattccagaa tcaaccacta 120 taccaaacaa ctgctgtgca cgaatataac ttgaacatac cagtcacccc cgccgctatt 180 acgtacccag agactgctga acaaatcgca gctgttgtta aatgcgccag tcaatatgac 240 tacaaggttc aagctagatc gggtggtcat tcttttggta attacggttt gggcggtaca 300 gacggtgccg ttgtcgttga tatgaagtat ttcaaccaat tttctatgga cgatcagact 360 tacgaagctg tcattggtcc tggtaccact ttaggtgacg tcgatgtaga attgtacaat 420 aacggaaaga gagctatggc ccacggcgtt tgtccaacca tctccactgg tggtcatttc 480 acgatgggtg gtcttggtcc aactgctcgt caatggggtt tggctttgga tcacgtggag 540 gaagttgaag ttgtcttagc aaattcatct attgttagag caagcaacac acagaaccaa 600 gaagtcttct ttgctgtgaa aggcgctgcc gcctcgttcg gtatcgttac tgaatttaag 660 gtaagaaccc aacccgctcc aggaatagct gttcaatatt cttacacctt caacttaggt 720 tcttccgccg aaaaagccca attcattaag gactggcaat ctttcgtatc cgctaagaat 780 ttgaccagac aattttacac aaatatggtt atctttgacg gtgatattat tttggaaggt 840 cttttcttcg gttccaaaga acaatatgag gctctgggtt tggaagaaag atttgtccct 900 aagaacccag gcaacatcct ggtcctgact gattggctag gtatggttgg tcatgcattg 960 gaagacacca tactaagatt agtcggcaac accccaacct ggttttatgc taagtccttg 1020 ggttttactc ctgacacttt gattccaagt agcggtatcg atgaattttt cgaatacata 1080 gaaaataaca aggctggtac ttccacctgg ttcgttactt tgagtcttga aggtggtgct 1140 attaacgacg tcccagccga tgctactgct tacggacacc gtgatgttct attctgggta 1200 cagatcttca tggtttctcc tacaggtcca gttagttcta cgacgtatga ttttgctgat 1260 ggtttgtaca atgtgttgac caaagctgtt ccagaatcag aaggtcacgc ttatttagga 1320 tgtccagacc caaagatggc caacgcccaa caaaagtatt ggagacaaaa cttgccaaga 1380 ttggaggagt taaaggagac attggatcct aaagacactt tccataatcc ccaaggaatc 1440 ctaccagcc 1449 <210> 92 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 92 atgggtaaca caaccagtat agccggacgt gattgcttga tttcagcact tggtggcaat 60 tccgctctag ctgttttccc aaacgagttg ctgtggacgg ctgacgtgca cgaatataac 120 ttaaatttgc ccgtaactcc agccgctatt acctaccctg aaactgctgc acaaatcgct 180 ggtgttgtca aatgtgcttc tgactacgat tataaggttc aggccagatc tggtggtcat 240 tcgtttggta actacggttt gggaggtgca gatggcgctg tcgttgtgga catgaagcac 300 ttcactcaat tctcaatgga tgacgaaacc tacgaagctg ttattggtcc aggtactaca 360 ttaaatgacg tcgatatcga attatataac aacggtaaga gagccatggc tcatggtgtc 420 tgtccaacca tcaaaactgg tggtcacttt accatcggtg gtttgggtcc tactgctagg 480 caatggggcc tagccttgga tcatgtcgaa gaagttgaag ttgttttggc taattcttcc 540 attgttagag cttctaacac tcaaaatcaa gacgtattct ttgccgtcaa gggtgccgct 600 gctaattttg gaattgtaac agagttcaag gtcagaactg aaccagcacc aggtttagct 660 gttcaataca gctacacctt caacttggga tccaccgcag aaaaagctca gttcgtgaag 720 gactggcaat cttttatctc cgctaaaaac cttacgcgtc aattctataa caacatggtc 780 atattcgatg gtgatattat attggagggt ctgttttttg gtagtaaaga acaatacgac 840 gctttgggtt tggaagatca cttcgcacca aagaaccccg gcaatatctt ggttttaact 900 gactggcttg gcatggttgg tcacgcttta gaagacacaa ttttgaagtt ggtcggtaat 960 actccaacct ggttctatgc caagtcttta ggttttagac aagatactct aattcctagt 1020 gccggaatcg atgaattttt cgaatacatt gctaatcata ctgctggtac tccagcatgg 1080 ttcgttacgt tgtccttaga aggtggtgct ataaacgatg tcgccgaaga tgctactgcc 1140 tacgctcaca gggacgtttt gttctgggta caattgttta tggtcaatcc attgggtccc 1200 atctctgaca ccacgtatga gtttaccgac ggtctgtacg atgttctagc tagagctgtg 1260 ccagaatctg ttggtcatgc ctatttgggt tgtccagacc ctagaatgga agatgcccaa 1320 cagaagtact ggagaaccaa ccttccaaga ttacaagaat tgaaggaaga actagatcca 1380 aagaatacat ttcatcaccc tcaaggtgta atgcctgct 1419 <210> 93 <211> 1428 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 93 atgggaaaca caacgtccat agctgccggt agagactgcc tattatcggc agtaggcggt 60 aatcacgctc atgtcgcttt ccaagatcag cttttgtatc aagtgaccgc tgttgagcct 120 tacaacttga atattccagt tacccccgcc gctgttactt acccacaatc agccgacgaa 180 atcgctgccg tcgtcaaatg tgcttctgaa tatggttaca aggttcaagc taggtctggt 240 ggtcactcct ttggtaacta cggtctgggt ggtgaagatg gcgctattgt tgtggaaatg 300 aagcatttca atcaatttag tatggatgaa tctacttata ctgcaactat cggtccagga 360 attaccttgg gtgacttgga caccgcttta tacaacgctg gtcacagagc catggcacat 420 ggtatctgtc caaccatacg tactggtggc cacttgacca tgggtggtct gggtcctaca 480 gctagacaat ggggtttagc attagatcat gtcgaagagg tcgaagttgt tttggctaac 540 agctctattg tcagagccag taacacacag aatcaagata ttttgttcgc tatcaagggt 600 gccgctgctt ccttcggtat tgttactgag tttaaagtaa gaactgaagc cgctccaggt 660 gttgcagtcc aatactcctt cacttttaac ctaggaacgc cagctgaaaa ggcaaagctt 720 gttaaagact ggcaagcctt catcgctcaa gaagatttga cttggaagtt ctattctaac 780 atgaatatat ttgacggcca aatcattttg gaaggtatct acttcggtag taaggaagag 840 tacgatgctt taggtttaga aaagagattt ccctcatctg aagctggtac cgtgttggtt 900 ttgaccgatt ggttgggtat ggtcggccac ggtctggaag atgtgattct aagattggtt 960 ggtaacaccc caacttggtt ctacgcaaaa tcattgggat tcactccaag agctttgata 1020 cctgactcag ctattgacga atttcttaat tacatccacg aaaacacgcc tggtacagta 1080 tcctggttcg tcactctatc tttggaaggt ggtgccatta acaaggtccc aggcgatgct 1140 actgcctatg gccaccgtga tgtgttattc tgggttcaga tttttatgat caacccattg 1200 ggtccagttt ctcaaaccac ttatggtttc gctgacggat tatatgacgt tttggcaaag 1260 gctgtaccaa actcggctgg acacgcctac ttaggttgtc ccgatccaag aatgccaaat 1320 gctcaacaag cttattggag gtctaatttg cccagattgg aggaattgaa gggtgaactg 1380 gatccaaaag acatttttca taacccacaa ggtgttatgg ttgtctcc 1428 <210> 94 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 94 atgggcaata cgacatccat tgcaggtaga gattgtctta taagcgccct aggtggaaac 60 tcggctttgg ctgctttccc taacgagtta ctgtggactg ctgacgtcca tgaatacaat 120 ttgaacttgc ccgttactcc agccgctatc acctatccag aaaccgctga acaaatcgct 180 ggtattgtga aatgcgcctc tgattacgac tataaggttc aggcacgttc tggtggtcac 240 tcatttggta attacggttt gggtggtgcc gatggagctg ttgtagtcga catgaagcac 300 ttcactcaat ttagtatgga tgacgaaacc tacgaagctg tcatcggtcc aggtacaact 360 ttaaacgacg ttgatattga attatataac aatggcaaaa gagccatggc acatggtgtt 420 tgtccaacta tcaagaccgg aggtcacttc accattggtg gtttgggtcc tacagctaga 480 caatggggtt tggctctgga ccacgtcgag gaagtagaag ttgtcttggc aaactcttcc 540 attgtgaggg cctctaacac tcaaaatcaa gatgttttct ttgcagttaa gggtgctgct 600 gctaacttcg gtatagtgac cgagtttaaa gttagaacgg aaccagctcc aggcttagct 660 gtccagtact cctatacttt caacttgggt tcaactgctg aaaaggctca attcgttaag 720 gattggcaat cattcatctc tgctaagaat cttactagac aattttacaa caacatggtc 780 atttttgacg gtgatatcat tttagaaggt ttatttttcg gcagtaagga acaatacgac 840 gccttgggtt tggaagatca ttttgcacca aagaaccctg gtaacatttt ggtactaacc 900 gactggttgg gaatggttgg tcacgcccta gaagatacaa tattgaaatt ggttggcaat 960 actccaacct ggttctacgc taaatctttg ggtttcagac aggatacctt gattccatcc 1020 gctggtatcg acgaattttt cgaatatatt gctaatcata ctgctggtac cccagcttgg 1080 ttcgtcacct taagcctaga gggtggtgcc atcaatgata tcgctgaaga cgctactgcc 1140 tacgcacata gagatgtctt attctgggtc caactgttta tggttaaccc tttgggtccc 1200 atatctgata caacttacga atttacagac ggtctgtatg acgttctagc acgtgctgta 1260 ccagagtctg tcggccacgc ttacttaggc tgtcccgacc caagaatgga agacgcacaa 1320 caaaagtatt ggagaaccaa cctaccaaga ttgcaagaat tgaaggaaga gttggaccca 1380 aagaacacgt ttcaccatcc acagggtgtt atgcctgca 1419 <210> 95 <211> 1419 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 95 atgggtaata cgacttccat agccggaagg gactgcctaa tctctgcttt gggtggtaac 60 tcggctctgg cagtcttccc taacgagtta ttgtggaccg ctgatgttca cgaatacaat 120 ttgaacttgc cagttactcc agccgctatt acctatcccg aaacagctgc acagattgct 180 ggcgtagtca aatgtgcctc agattacgac tacaaggtgc aagctagatc tggtggtcat 240 agctttggta actatggttt aggaggtgct gatggcgcag ttgttgtcga catgaagcac 300 ttcactcaat ttagtatgga tgacgaaact tacgaagctg ttatcggtcc aggtaccacc 360 ctaaatgatg ttgatatcga attgtataac aatggtaaga gagctatggc acatggtgtt 420 tgtccaacaa ttaaaactgg aggtcacttc accattggcg gtttaggtcc tactgccaga 480 caatggggtc ttgctttgga ccatgtcgaa gaagtagagg tcgttcttgc taactcttct 540 atcgttcgtg cttccaacac tcaaaaccaa gatgtgttct ttgccgtcaa gggtgctgct 600 gccaacttcg gtattgtaac agaatttaaa gttagaactg aaccagctcc aggtttagcc 660 gtccagtact cttatacctt caatttgggt tccacggctg aaaaggctca attcgttaag 720 gactggcaat ccttcatatc tgccaagaat ttgaccagac aattttacaa taacatggtt 780 atctttgacg gagatattat attggagggt ctatttttcg gtagtaagga acaatacgac 840 gctctgggct tagaagatca ctttgctcca aaaaacccag gtaatatctt ggtattgacc 900 gattggttgg gtatggtcgg tcatgccctt gaagatacaa ttttgaagct ggttggtaac 960 actccaactt ggttctacgc aaagtcctta ggtttccgtc aagacacgtt aattccttca 1020 gccggcatcg atgaattttt cgaatacatc gctaaccaca ccgctggtac tcctgcttgg 1080 ttcgtcacct tgagcttgga aggcggtgcc attaacgatg tcgccgagga cgcaacggct 1140 tacgctcaca gagatgtttt gttctgggtc caattattca tggtgaatcc agtgggtcct 1200 atatctgaca ctacttatga atttactgat ggtttgtacg acgttctagc tagagcagtc 1260 cctgagagcg tgggtcatgc ttatttgggt tgtccagacc caagaatgga agatgcccaa 1320 cagaaatatt ggaggacaaa tttacccaga ttgcaagaat taaaagagga attggatcca 1380 aagaacacat tccaccatcc acagggtgtt atgcccgct 1419 <210> 96 <211> 1428 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 96 atgggcaata caacgtccat tgccgctggt cgtgactgct tgatcagcgc tgttggaggt 60 aacgcagctc acgtggcctt tcaggatcaa cttttatatc aagctaccgc agtcgatgtt 120 tacaacttga acatacccgt cactccagct gccgtaactt accctcaatc agctgacgag 180 gttgctgctg ttgtcaagtg tgcctcggaa tacgattata aagtccaagc tagatctggt 240 ggtcattctt tcggtaatta cggtctaggt ggtcaaaatg gagctattgt tgtcgacatg 300 aagcacttca gtcaatttag tatggacgaa tcaacctata ctgcaaccat cggcccaggt 360 atcactctgg gtgatttaga taccgaattg tacaacgctg gtcatagagc aatggctcac 420 ggtatttgtc caacaataag aactggtggt cacttgacta tcggtggttt gggtccaaca 480 gccaggcagt ggggtctggc tttagaccat gttgaagagg tagaagttgt gttggctaac 540 tcttccattg ttagagcctc tgaaacgcaa aaccaagatg tcttgttcgc agtaaagggc 600 gctgctgctt cctttggtat tgttaccgaa tttaaagtta gaactgaaca agctcctggc 660 ctagctgtcc agtattccta caccttcaat ttgggtaccc cagctgagaa ggccaagtta 720 ttaaaagact ggcaagcttt catcgcccaa gaagacttga cctggaagtt ctactccaat 780 atggttattt tcgatggtca aatcattttg gaaggaattt tctttggttc taaggaagaa 840 tatgatgccc tggatcttga gaagagattt ccaacttctg aacctggtac tttgttggtt 900 ttaacggact ggcttggtat ggtaggtcat agcctggaag acgtcatatt aaggctagtt 960 ggtaacaccc caacttggtt ttacgctaag tctttgggct tcactccaag aaccttgatc 1020 cctgacagcg ctatagatag attcttcgac tatattcacg aaactaacgc tggtaccttg 1080 gcatggtttg tgacgctttc attggaaggt ggtgctatta atgccgtgcc agaagatgca 1140 accgcctacg gtcatcgtga tgttttgttt tgggttcaaa tcttcatggt caaccccttg 1200 ggaccaattt ctcaaactat ctacgatttc gctgacggac tatacgacgt gttggcacaa 1260 gccgtaccag aatcggctga acacgcttac ttaggatgtc cagatcctaa aatgccagac 1320 gcccaacgtg cttattggag aggtaactta ccaagactgg aggaattgaa aggagagttt 1380 gatcccaagg acacatttca caacccacag ggtgtttctg tcgccgtc 1428 <210> 97 <211> 1428 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 97 atgggcaaca ccacgagcat cgctgccggt agagattgtt taatatctgc tgttggaggt 60 aatgcagctc acgtcgcctt tcaggaccaa ctgctttacc aagctactgc tgtggaacct 120 tataacctaa atattccaat caccccagcc gctattacat acccccaatc ggctgatgag 180 atcgcagcag ttgtaaagtg cgcttcagaa tatggttaca aagtccaagc tcgttccggt 240 ggtcattctt tcggtaacta cggtttaggt ggtgaagacg gtgctattgt tgtcgaaatg 300 aagcacttca gtcaattttc catggatgaa tctacttata ttgccactat cggcccaggt 360 attacattgg gagacttgga taccgaatta tacaatgttg gtcatagagc tatggcccac 420 ggtatctgtc caactattag aaccggtggt catttgactg ttggaggttt gggtcctacc 480 gctaggcaat ggggcctggc cttggatcac gttgaggaag tcgaagtcgt attggctaac 540 tcttccatag ttagagcatc agacactcag aaccaagaca tcttcttcgc tattaaaggt 600 gctgctgcta gctttggtat agtgacagaa tttaaggtta gaaccgagca agccccaggt 660 ctagccgtgc aatactctta cactttcaac ttgggtacac cagctgaaaa ggccaagttg 720 gttaaggact ggcaggcttt cattgctcaa gaaaatctgt catggaaatt ctactctaat 780 atggtcgtat tcgatggcca aatcatctta gaaggtttgt actttggctc caaggaagaa 840 tatgatgctc ttggtcttga acaacgtttc cccccatctg aagctggtaa cgttctagtc 900 ttgactgatt ggttgggtat ggttggtcat gagttagaag atactatttt gagattggta 960 ggtaacaccc ctacttggtt ctacgctaaa agcttgggat ttaccccaag agccctgatt 1020 ccagactccg caatagatga cttattcaac tatattcacg agaataaccc aggtaccttg 1080 gcatggttcg tcacactttc tttagaaggt ggtgcaatca acaccgttcc tgaacacgct 1140 actgcctatg gacatagaga tgttttgttt tgggtccaaa tttttgttat caatccattg 1200 ggtcccgtca gccaaacgac ttacggtttt gctgatggta tgtatgacgt gcttgcccaa 1260 gctgttccag aaagtgctgg tcatgcttac ttgggttgtc cagatccacg tatgccaaac 1320 gcccaacaag cttactggag atctaatttg cctagattag aagaattgaa gggcgaccta 1380 gacccaaaag gtatcttcca caatccacaa ggtgttatgg tagtctcc 1428 <210> 98 <211> 1428 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 98 atgggtaaca ctacgtcgat cgcagctgga cgtgattgcc tattgtccgc tgttggtggc 60 aatcatgccc acgtagcttt ccaggaccaa cttttgtatc aagccacagc tgtcgaacca 120 tacaacttaa acatacctgt gactccagct gccgttacct acccccaatc tgctgatgag 180 gtcgcagctg ttgttaagtg tgctgccgac tatggttaca aagtccaagc tagatcaggt 240 ggtcacagtt ttggtaatta cggtttgggt ggtgaagacg gtgctattgt tgtagatatg 300 aagcatttcg atcaatttag catggatgaa tctacctaca ctgccaccat cggcccaggt 360 attactctgg gcgacttgga taccgcttta tataatgccg gtcacagagc tatggcacat 420 ggtatctgtc caactattag aacaggcggt cacttgacca ttggtggttt gggtcctacg 480 gctaggcaat ggggattggc actagaccac gtcgaagaag ttgaggttgt cctggctaac 540 tcctctatag tcagagcctc tgacactcag aaccaagaaa ttttattcgc tgttaagggt 600 gctgccgctt ccttcggtat cgtcactgaa tttaaagtta gaaccgaaga agctccagga 660 ttggcagtcc aatacagctt caccttcaac cttggtactg ccgctgaaaa ggctaagttg 720 gtgaaagatt ggcaagcttt tatcgcccag gaagacttaa cgtggaagtt ttattctaac 780 atgaacatta tcgatggtca aattattctg gagggtatct acttcggttc gaaagctgaa 840 tacgacgcat tgggattgga agagaagttt ccaacatcag aacccggtac tgtgcttgta 900 ttaactgact ggttgggtat ggttggtcac ggtttagaag atgttatttt gcgtttggtt 960 ggaaatgctc caacttggtt ttatgcaaag tcactaggtt tcgctccaag agctttaata 1020 cctgatagtg caattgatga cttcttcgaa tatatccata agaataaccc aggtacagtc 1080 tcttggttcg tcaccttgtc cttggagggt ggtgccatca ataaagtacc agaagatgcc 1140 actgcttacg gtcatagaga tgttctattc tgggttcaaa tttttatgat caatccatta 1200 ggtccagttt ctcaaacgat ctacgatttc gctgacggct tgtatgacgt tctggctaag 1260 gccgtacctg aatccgctgg tcacgcatac ctaggttgtc ccgacccaag aatgcctaac 1320 gctcaacagg cctactggag gaacaacttg ccaagattgg aagaattgaa gggtgactta 1380 gatccaaaag atattttcca taatcctcaa ggagtgatgg tcgtgagc 1428 <210> 99 <211> 1422 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 99 atgggtaata cgacttccat cgccggccgt gactgcttgg ttagtgcact aggtggaaac 60 gctggtttag tggctttcca agatcagctt ttgtatcaaa ccacagctgt acacgagtac 120 aacttgaaca ttccagtcac ccctgccgca gttacttacc cagaaactgc tgaacaaata 180 gctgccgtcg tgaaatgtgc ttctgaatat gattacaagg tccaagctag atctggtgga 240 cattcgtttg gtaattacgg tctaggtggt gctgacggtg ctgtagttgt tgatatgaag 300 cacttctcac aattttccat ggacgatcag acatatgaag cagttatcgg tcccggtacc 360 actttaggtg acgtcgacac cgaattgtac aacaacggca agagagctat ggcccatggt 420 atttgtccaa caattagtac tggtggacac ttcactatgg gtggtctggg tccaaccgcc 480 agacaatggg gtttggcttt ggatcacgtt gaagaggttg aagtcgtttt ggcaaattct 540 tctatcgtta gggcttccaa cacccaaaat caagaagtct tctttgctgt caaaggtgcc 600 gctgcctcat ttggtatcgt tacagagttc aaggtcagaa ctcaacctgc tccaggctta 660 gcagtacagt acagctatac gtttaatatt ggttcgtctg ctgaaaaggc ccaattcgtt 720 aaagattggc aatcattcat tagtgctaag aaccttacta gacaattcta caccaacatg 780 gtaatcttcg atggtgacat aattttggaa ggattatttt tcggttccca agaacaatat 840 gaagctttgg gtctggaaga cagatttgtt ccaaagaacc ctggaaatat tttggtgttg 900 acggattggc tgggtatggt tggtcatgcc cttgaagaca ctatcttaag attggtcggt 960 aacactccaa cttggtttta cgctaaatct ttgggattca ccccagacac tttaattcca 1020 gcttccggta tcgatgaatt tttcgattac atagaaaacc ataaggcagg caccttgacg 1080 tggttcgtca ctttgtctct ggaaggtggt gctatcaatg atgtcccaga ggacgctaca 1140 gcctacggtc atagagatgt tttgttctgg gttcaaattt ttatggcttc tcccaccggt 1200 cctgtctcct ctaccaccta tgacttcgcc gatggtctat ataatgtttt aactaaggct 1260 gtaccagaga gcgaaggtca cgcttactta ggttgtccag accctaagat ggccgatgct 1320 cagcaaaaat actggcgtca aaacttgcca agattggaag aattgaaggc aactttagac 1380 ccaaaagata ccttccacaa tccccaaggt atcttgccag ct 1422 <210> 100 <211> 2082 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 100 atgtggttgt ctacaatgaa tggttcagcc agtagacgta gcgatcccgt cagcagaaaa 60 atcgtttgcg acggccatgc ttctgcacac gaggtgagga ctgacaacga agctgctaga 120 gatgtacctt cgagaaccgc tgtcaacaag gaaagaaagc agggttccgg tccaccagga 180 gccatgcaaa gaggttttca cgctgcccat aagccaaatg aaatggttcc acaagacggt 240 cctcttggta gaactgctca attattccgt ctggcaccag cttgtcaatc agaaccaacg 300 agagctccag gtcaaccatc tgatctaaga ttgcgtcaaa ttcccttggc aaccgagcaa 360 gctgccagaa ctttggctag gatgcgtcca gcaagattca catttcctta tggaagagcc 420 gctgaagatg attgttactt aaaaaaggaa gacgaaggtc acgaccagtc tcatccaacc 480 tccgtcttgg ttggtgttcc ccctttcact agacgttgtg ctgctgctga aaccttcaaa 540 gatactagag ctagagctcc aggtacacaa ccaactgata ccacttctac aggtgcctcc 600 ccatcatgga ccttatctcc actattgtcc ttgtctgcta ctgacgacag tgttccttcc 660 aagatgggca acggtcaatc taccccactt caacaatgtt tgaatactgt ttgcaacggt 720 aggctgggtt gtgtcgcctt tccatcggat gccttatacc aggctgcttg ggtcaagcca 780 tataacttgg acgtacctgt taccccaata gctgtgttta agcctagttc cacggaggat 840 gttgctggtg ccattaagtg tgctgtcgct tctaacgttc acgtgcaagc caagtctggt 900 ggtcattcgt acgctaactt cggattgggt ggacaagatg gtgaactaat gattgatttg 960 gcaaatttac aggacttcca catggacaaa acatcctggc aagctacttt cggtgccggt 1020 tacagattgg gtgatttaga taaaaagtta caagcaaatg gcaacagagc tatcgcacac 1080 ggcacatgtc caggtgttgg tattggaggt catgccacta tcggcggtct aggcccaatg 1140 agccgtatgt ggggttccgc tttggaccac gtcttgtctg tccaagttgt caccgctgac 1200 ggtagtatca aaaacgcctc tgaatcagaa aactctgatc tgttttgggc cttgagaggt 1260 gctggtgctt catttggagt tattactaag ttcactgtta agacccatcc agctccaggt 1320 tccgttgtac aatatacata caaaatctct ttgggtagcc aggcacaaat ggcccctgtt 1380 tacgctgcct ggcaagcttt agctggtgac cccaagctgg acagaagatt ttccacattg 1440 ttcatcgcag aacctcttgg tgctctgatt accggaactt tctatggtac taaagctgag 1500 tacgaagcta ctggtatagc tgctagattg ccttctggtg gtaccttgga tttgaagctt 1560 ttagattggt tgggtagttt ggctcacata gctgaagtag ttggtttgac cttgggtgac 1620 attccaacgt ccttttacgg taagtcgcta gctttgagag aagaagacat gttagaccgt 1680 acttctattg atggtttgtt caggtatatg ggtgacgccg atgcaggcac cctattatgg 1740 ttcgtcatct tcaattccga gggtggtgcc atggctgata ctccagctgg tgccaccgcc 1800 tacccacata gagataaatt aatcatgtat caatcatacg ttattggtat accaaccctg 1860 actaaggcca ccagagattt tgctgatggt gtccacgacc gtgtgagaat gggtgctcca 1920 tctgctaaca gtacgtatgc aggttacatc gatagaacct tgtccagaga agctgctcaa 1980 gaattttact ggggcgctca actgcctaga ttgagagaag tcaagaaagc atgggaccca 2040 aaggacgtct ttcacaaccc acaatccgtt gatccagcag ag 2082 <210> 101 <211> 1428 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 101 atgggcaata caacttccat tggtgtagtg agggattgtt tgacgtctgc tgtcggtggt 60 gttgcagccc atgtcgcttt ccaggacacc ctattatacc aaacctcagc tgttaaacca 120 tataacctta acgtccctgt tactcccgcc gctgttactt acccacaaag tgctaatgaa 180 gtcgctgcta tcgttaagtg cgcatcggat tatgactaca aggtacaagc tcgttccggt 240 ggacacagct ttggtaactt cggtttaggt ggacaaaacg gtgccatagt tattgacatg 300 aaacactttt ctcaattctc catggatgag tctaccttca tcgccactat tggcccaggc 360 accactttgg gtaatctgga tacagaattg tacaacgctg gtaatagagc tatggctcat 420 ggtatatgtc catcgatcag aactggtggt cacttgaccg ttggaggttt gggtcctacc 480 tctcgtcaat ggggtctagc tctggaccac gtcgaagagg tggaagttgt acttgctaac 540 tcttcagtcg tcagagcctc tgacacgcag aaccaagatg ttttatttgc tatcaagggt 600 gcagccgcat ccttcggtat cgttactgaa tttaaggtca gaacagaaga agctccaggt 660 ttggccgtta gatattccta cagcttcaac ttgggtactc cagctgaaaa agcaaagttg 720 gctaaggatt ggcaagccta cattgcccaa gaaaacttaa cgtggaaatt ctctagtaac 780 ttgattattt tcgacggtca aattatcctt gagggaatat ttttcggtag caaggaagaa 840 tacgacaagt taaatttgga aaagaagttt ccaacttcag aacctggtac cgtcttggtc 900 attacgaatt ggttgggtat gatcggacat gctttggaag ataccatcct aagacttatc 960 ggtgattcac ccacttggtt ctatgctaaa tctttgggtt ttactccaaa cacactaatc 1020 tttgactcta ccattgacga atttttcgat tacatacaca aggctaacgc tggtacatta 1080 gcttggtccg ttatgttgtc tttggaaggt ggtgccataa atgctgttcc aaaaaatgct 1140 actgcatacg gtcatagaga tgtattattc tgggttcaaa ttttcgttgt gaatcctctt 1200 ggaccaattt cccaaaccac ttatggtttt accgatggtt tgtataacat cttggccaga 1260 ggtgttccag agtccgcagg tcatgcttac ttaggttgtc cagatcccaa gatgccagac 1320 gctcaaagag catactggag aaataactat ccacgtctgg aggaattgaa aagagacttg 1380 gatcctaagg acatttttca caacccacag ggcgtcagag tcgcttct 1428 <210> 102 <211> 1422 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 102 atgggcaaca ctacatcaat tgctgccggt agagattgcc tagtaagcgc agtcggtcca 60 gctcatgtta ccttccagga cgcccttctg taccaaacta cggctgtcga tccttataat 120 ttaaacatcc cagtgacccc cgctgctgtt acttacccac aatcggctga agagatagcc 180 gctgttgtca aatgtgcttc tgactatgat tacaaggttc aagctaggtc tggtggacac 240 tcctttggta actacggttt gggtggtcaa aatggagcca ttgtagttga catgaagcac 300 ttctctcaat ttagtatgga tgaatctacc ttcgtcgcaa ctattggtcc aggtacaacc 360 ttgggcgact tggatactga attgtataac gcaggcggta gagctatggc ccatggtatc 420 tgtcctacaa tccgtactgg tggtcactta actgtcggtg gtttgggtcc aaccgctaga 480 caatggggtc tggccttaga tcacattgaa gaagttgaag tggttttggc taattcctcg 540 atagtgagag ctagcaacac tcagaaccaa gacatcttgt tcgccgttaa gggtgctgct 600 gcttcatttg gtattgtcac cgagtttaaa gttagaaccc aagaagcacc aggactagct 660 gttcaataca gtttcacctt caatttgggt tccccagctc agaaagccaa gttggtcaag 720 gactggcaag cattcattgc ccaagaaaac ttatcttgga agttctactc taatttagtc 780 atctttgacg gtcaaattat tttagaaggt atctttttcg gatccaagga ggaatatgat 840 gaattggact tggaaaaaag atttcccact tctgaaccag gtacagttct ggttttaacg 900 gattggttgg gaatgatcgg ccatgcactt gaggatacta ttttgaagtt ggtcggtgac 960 acacctacgt ggttttacgc taagtccctt ggcttcactc cagatacctt gatcccagat 1020 tcggctattg atgatttctt cgactatatt cataagacta acgctggtac tctggcctgg 1080 tttgtgacct tatctttgga aggtggcgct ataaactccg tttcagaaga tgctaccgct 1140 tatggtcaca gagatgtctt gttttggttc caagttttcg ttgtcaatcc tcttggtcca 1200 atctctcaaa caacatacga cttcactaat ggtttgtacg acgtattggc tcaggccgtg 1260 cctgaaagcg ctggtcatgc ttaccttggt tgtccagatc caaaaatgcc agacgctcag 1320 cgtgcttact ggagaagtaa cttacccaga ttggaggatc tgaagggtga tcttgaccca 1380 aaggacacct ttcacaaccc tcaaggtgtt caagtcggtc ca 1422 <210> 103 <211> 1422 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 103 atgggcaata ccacatctat cgctgccggt agagactgtc tggtcagtgc tgttggtcct 60 gcacacgtga cgtttcagga tgctttgctt taccaaacta ctgctgttga tccctataac 120 ttaaacatac cagtaacccc agccgctgtc acttacccac aatccgctga ggaaattgcc 180 gctgttgtga agtgcgcttc agactacgat tataaagtcc aagctaggtc tggaggtcat 240 agcttcggta actacggtct aggtggtcaa aatggtgcaa tcgttgttga aatgaagcac 300 ttctctcaat tttccatgga cgaatcgacc ttcgtcgcca ctattggccc aggtacaaca 360 ttgggtgatt tagataccga attgtataat actggtggcc gtgctatggc ccatggtatt 420 tgtccaacta tcagaaccgg tggtcacttg accgttggtg gattgggtcc tactgcaaga 480 caatggggtt tagctcttga tcatatcgaa gaagttgagg tcgtcttggc taactcttcc 540 attgttagag ctagcaacac tcagaaccaa gacattctat ttgctgttaa aggagccgct 600 gccagcttcg gtatagtcac cgaatttaag gttagaacac aggaagctcc aggtttggct 660 gtacaataca gtttcacctt caatttgggc tcagcagctc aaaaggcaaa gttggtcaaa 720 gactggcaag ccttcatcgc tcaagaaaat ttatcttgga aattttactc taacctagtt 780 atttttgacg gacaaattat cttggaaggt atcttcttcg gttccaagga ggaatacgat 840 gaactagact tagaaaagag attcccaact tctgaaccag gtaccgtgtt ggttttaact 900 gattggttgg gtatgatcgg tcacggtctg gaagacacta tattgaagtt agttggtgat 960 acccctactt ggttctatgc aaagtccttg ggttttacgc cagatacttt gatacccgat 1020 tctgccattg acgatttttt cgattatatt cataagacaa atgctggaac cttggcttgg 1080 tttgtaacgc tatctttgga aggtggtgct ataaactctg tctcggaaga cgcaacagct 1140 tacggtcaca gagatgtcct gttttggttc caagtgtttg tagtcaaccc tttgggtcca 1200 atttcccaga ccacttacga cttcaccaat ggtttatacg atgttcttgc tcaagccgtt 1260 ccagaatcgg ccggccacgc ttatttgggt tgtccagacc ctaaaatgcc cgacgcacaa 1320 cgtgcttact ggaggtccaa cctaccaaga ttggaggact taaagggtga cctagaccca 1380 aaggatactt ttcataaccc acaaggtgtc caagttggac ca 1422 <210> 104 <211> 473 <212> PRT <213> Purpureocillium lilacinum <400> 104 Met Gly Asn Gly Gln Ser Thr Pro Leu Gln Gln Cys Leu Asn Thr Val 1 5 10 15 Cys Asn Gly Arg Leu Gly Cys Val Ala Phe Pro Ser Asp Ala Leu Tyr 20 25 30 Gln Ala Ala Trp Val Lys Pro Tyr Asn Leu Asp Val Pro Val Thr Pro 35 40 45 Ile Ala Val Phe Lys Pro Ser Ser Thr Glu Asp Val Ala Gly Ala Ile 50 55 60 Lys Cys Ala Val Ala Ser Asn Val His Val Gln Ala Lys Ser Gly Gly 65 70 75 80 His Ser Tyr Ala Asn Phe Gly Leu Gly Gly Gln Asp Gly Glu Leu Met 85 90 95 Ile Asp Leu Ala Asn Leu Gln Asp Phe His Met Asp Lys Thr Ser Trp 100 105 110 Gln Ala Thr Phe Gly Ala Gly Tyr Arg Leu Gly Asp Leu Asp Lys Lys 115 120 125 Leu Gln Ala Asn Gly Asn Arg Ala Ile Ala His Gly Thr Cys Pro Gly 130 135 140 Val Gly Ile Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Met Ser 145 150 155 160 Arg Met Trp Gly Ser Ala Leu Asp His Val Leu Ser Val Gln Val Val 165 170 175 Thr Ala Asp Gly Ser Ile Lys Asn Ala Ser Glu Ser Glu Asn Ser Asp 180 185 190 Leu Phe Trp Ala Leu Arg Gly Ala Gly Ala Ser Phe Gly Val Ile Thr 195 200 205 Lys Phe Thr Val Lys Thr His Pro Ala Pro Gly Ser Val Val Gln Tyr 210 215 220 Thr Tyr Lys Ile Ser Leu Gly Ser Gln Ala Gln Met Ala Pro Val Tyr 225 230 235 240 Ala Ala Trp Gln Ala Leu Ala Gly Asp Ala Lys Leu Asp Arg Arg Phe 245 250 255 Ser Thr Leu Phe Ile Ala Glu Pro Leu Gly Ala Leu Ile Thr Gly Thr 260 265 270 Phe Tyr Gly Thr Lys Ala Glu Tyr Glu Ala Thr Gly Ile Ala Ala Arg 275 280 285 Leu Pro Ser Gly Gly Thr Leu Asp Leu Lys Leu Leu Asp Trp Leu Gly 290 295 300 Ser Leu Ala His Ile Ala Glu Val Val Gly Leu Thr Leu Gly Asp Ile 305 310 315 320 Pro Thr Ser Phe Tyr Gly Lys Ser Leu Ala Leu Arg Glu Glu Asp Met 325 330 335 Leu Asp Arg Thr Ser Ile Asp Gly Leu Phe Arg Tyr Met Gly Asp Ala 340 345 350 Asp Ala Gly Thr Leu Leu Trp Phe Val Ile Phe Asn Ser Glu Gly Gly 355 360 365 Ala Met Ala Asp Thr Pro Ala Gly Ala Thr Ala Tyr Pro His Arg Asp 370 375 380 Lys Leu Ile Met Tyr Gln Ser Tyr Val Ile Gly Ile Pro Thr Leu Thr 385 390 395 400 Lys Ala Thr Arg Asp Phe Ala Asp Gly Val His Asp Arg Val Arg Met 405 410 415 Gly Ala Pro Ala Ala Asn Ser Thr Tyr Ala Gly Tyr Ile Asp Arg Thr 420 425 430 Leu Ser Arg Glu Ala Ala Gln Glu Phe Tyr Trp Gly Ala Gln Leu Pro 435 440 445 Arg Leu Arg Glu Val Lys Lys Ala Trp Asp Pro Lys Asp Val Phe His 450 455 460 Asn Pro Gln Ser Val Asp Pro Ala Glu 465 470 <210> 105 <211> 473 <212> PRT <213> Aspergillus tubingensis <400> 105 Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala 1 5 10 15 Leu Gly Gly Asn Ser Ala Leu Ala Val Phe Pro Asn Gln Leu Leu Trp 20 25 30 Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala 35 40 45 Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Gly Ile Val Lys 50 55 60 Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His 65 70 75 80 Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asp Gly Ala Val Val Val 85 90 95 Asp Met Lys His Phe Asn Gln Phe Ser Met Asp Asp Gln Thr Tyr Glu 100 105 110 Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu 115 120 125 Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile 130 135 140 Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg 145 150 155 160 Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu 165 170 175 Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val 180 185 190 Phe Phe Ala Val Lys Gly Ala Ala Ala Asp Phe Gly Ile Val Thr Glu 195 200 205 Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser 210 215 220 Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys 225 230 235 240 Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr 245 250 255 Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe 260 265 270 Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe 275 280 285 Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly 290 295 300 Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn 305 310 315 320 Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr 325 330 335 Leu Ile Pro Ser Ala Gly Ile Asp Gln Phe Phe Glu Tyr Ile Ala Asn 340 345 350 His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly 355 360 365 Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg 370 375 380 Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Leu Gly Pro 385 390 395 400 Ile Ser Glu Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu 405 410 415 Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro 420 425 430 Asp Pro Arg Met Glu Asn Ala Pro Gln Lys Tyr Trp Arg Thr Asn Leu 435 440 445 Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe 450 455 460 His His Pro Gln Gly Val Ile Pro Ala 465 470 <210> 106 <211> 473 <212> PRT <213> Aspergillus niger <400> 106 Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala 1 5 10 15 Leu Gly Gly Asn Ser Ala Leu Ala Ala Phe Pro Asn Gln Leu Leu Trp 20 25 30 Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala 35 40 45 Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Gly Ile Val Lys 50 55 60 Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His 65 70 75 80 Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asp Gly Ala Val Val Val 85 90 95 Asp Met Lys His Phe Asn Gln Phe Ser Met Asp Asp Gln Thr Tyr Glu 100 105 110 Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu 115 120 125 Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile 130 135 140 Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg 145 150 155 160 Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu 165 170 175 Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val 180 185 190 Phe Phe Ala Val Lys Gly Ala Ala Ala Asp Phe Gly Ile Val Thr Glu 195 200 205 Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser 210 215 220 Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys 225 230 235 240 Asp Trp Gln Tyr Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr 245 250 255 Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe 260 265 270 Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe 275 280 285 Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly 290 295 300 Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn 305 310 315 320 Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr 325 330 335 Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Ala Asn 340 345 350 His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly 355 360 365 Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg 370 375 380 Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Leu Gly Pro 385 390 395 400 Ile Ser Glu Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu 405 410 415 Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro 420 425 430 Asp Pro Arg Met Glu Asn Ala Pro Gln Lys Tyr Trp Arg Thr Asn Leu 435 440 445 Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe 450 455 460 His His Pro Gln Gly Val Ile Pro Ala 465 470 <210> 107 <211> 513 <212> PRT <213> Phaseolus vulgaris <400> 107 Met Asp Pro Ile Glu Asp Ala Ile Leu Gln Cys Leu Ser Leu His Ser 1 5 10 15 Asp Pro Ser His Pro Ile Ser Gly Val Thr Tyr Phe Pro Asn Thr Pro 20 25 30 Ser Tyr Ile Pro Ile Leu His Ser Tyr Ile Arg Asn Leu Arg Phe Thr 35 40 45 Ser Pro Ser Thr Arg Lys Pro Leu Phe Ile Val Ala Pro Thr His Ile 50 55 60 Ser His Ile Gln Ala Ser Ile Ile Cys Cys Lys Ser Phe Gln Leu Gln 65 70 75 80 Ile Arg Ile Arg Ser Gly Gly His Asp Tyr Asp Gly Leu Ser Tyr Val 85 90 95 Ser Gln Ser Pro Phe Ala Ile Met Asp Met Phe Ala Met Arg Ser Val 100 105 110 Glu Val Asn Leu Glu Asp Glu Thr Val Trp Val Asp Ser Gly Ser Thr 115 120 125 Ile Gly Glu Leu Tyr His Gly Ile Ala Glu Arg Ser Lys Val His Gly 130 135 140 Phe Pro Ala Gly Val Cys His Ser Val Gly Val Gly Gly His Phe Ser 145 150 155 160 Gly Gly Gly Tyr Gly Asn Met Met Arg Lys Phe Gly Leu Ser Val Asp 165 170 175 His Val Leu Asp Ala Val Ile Val Asp Ala Glu Gly Arg Val Leu Asp 180 185 190 Arg Lys Lys Met Gly Glu Asp Leu Phe Trp Gly Ile Arg Gly Gly Gly 195 200 205 Gly Ala Ser Phe Gly Val Ile Val Ser Trp Arg Ile Lys Leu Val Pro 210 215 220 Val Pro Glu Val Val Thr Val Phe Arg Val Leu Lys Thr Leu Glu Gln 225 230 235 240 Gly Ala Thr Asp Val Val His Arg Trp Gln Tyr Val Ala Asp Asn Ile 245 250 255 His Asp Asp Leu Phe Ile Arg Val Val Leu Ser Pro Val Lys Arg Lys 260 265 270 Gly Gln Lys Thr Ile Arg Ala Lys Phe Asn Ala Leu Phe Leu Gly Asn 275 280 285 Ala Gln Glu Leu Leu Arg Val Met Ser Asp Ser Phe Pro Glu Leu Gly 290 295 300 Leu Val Gly Glu Asp Cys Ile Glu Met Ser Trp Ile Asp Ser Val Leu 305 310 315 320 Phe Trp Asp Asn Phe Pro Val Gly Thr Ser Val Asp Val Leu Leu Gln 325 330 335 Arg His Asp Thr Pro Glu Lys Phe Leu Lys Lys Lys Ser Asp Tyr Val 340 345 350 Gln Gln Pro Ile Ser Lys Thr Gly Leu Glu Gly Val Trp Asn Lys Met 355 360 365 Met Glu Leu Glu Lys Pro Val Leu Thr Leu Asn Pro Tyr Gly Gly Arg 370 375 380 Met Gly Glu Ile Ser Glu Met Glu Ile Pro Phe Pro His Arg Ala Gly 385 390 395 400 Asn Leu Tyr Lys Ile Gln Tyr Ser Val Asn Trp Lys Glu Glu Gly Glu 405 410 415 Asp Val Ala Asn Arg Tyr Leu Asp Leu Ile Arg Met Leu Tyr Asp Tyr 420 425 430 Met Thr Pro Tyr Val Ser Lys Ser Pro Arg Ser Ser Tyr Leu Asn Tyr 435 440 445 Arg Asp Val Asp Ile Gly Val Asn Gly Pro Gly Asn Ala Thr Tyr Ala 450 455 460 Glu Ala Arg Val Trp Gly Glu Lys Tyr Phe Lys Arg Asn Phe Asp Arg 465 470 475 480 Leu Val Glu Val Lys Thr Arg Val Asp Pro Ser Asn Phe Phe Arg Tyr 485 490 495 Glu Gln Ser Ile Pro Ser Leu Ala Ala Ser Ser Leu Gly Ile Met Ser 500 505 510 Glu <210> 108 <211> 506 <212> PRT <213> Dactylellina haptotyla <400> 108 Met Val His Asn Ile Leu Leu Leu Gly Leu Met Pro Leu Leu Val Arg 1 5 10 15 Ala Ser Pro Leu Pro Ile Tyr His Asn Tyr Pro Pro Gln Ser Thr Ile 20 25 30 Asn Asp Cys Leu Gln Ala Ala Asp Val Pro Ala Ile Leu Gln Ser Ser 35 40 45 Ala Ser Phe Asp Ala Leu Ser Gln Pro Leu Asn Ser Arg Leu Lys Ser 50 55 60 Lys Pro Ala Val Ile Thr Ile Pro Thr Thr Ala Leu His Val Ser Ser 65 70 75 80 Ala Val Lys Cys Ala Ala Gln Phe Lys Leu Lys Val Thr Pro Arg Gly 85 90 95 Gly Gly His Ser Tyr Asn Ala Gln Ser Leu Gly Asp Gly Ala Val Val 100 105 110 Ile Asp Met Gln Gln Phe His Asp Val Val Tyr Asp Ser Lys Thr Gln 115 120 125 Leu Ala Arg Ile Gly Gly Gly Ala Arg Leu Gly Asn Val Ala Gln Lys 130 135 140 Leu Tyr Asp Gln Gly Lys Arg Ala Met Pro His Gly Thr Cys Pro Asp 145 150 155 160 Val Gly Ile Gly Gly His Ser Ala Gly Gly Phe Gly Trp Thr Ser Arg 165 170 175 Gln Trp Gly Ile Thr Val Asp His Ile Asp Glu Val Glu Val Val Thr 180 185 190 Ala Asp Gly Ser Ile Arg Arg Ala Asn Lys Asp Gln Asn Ser Asp Leu 195 200 205 Phe Trp Ala Leu Arg Gly Ala Ala Pro Ser Phe Gly Val Ile Thr Asn 210 215 220 Phe Trp Phe Ser Thr Leu Glu Ala Pro Asp Ser Asn Val Ile Tyr Ser 225 230 235 240 Tyr Lys Phe Thr Gly Leu Ser Leu Asp Glu Ile Ser Thr Ala Leu Leu 245 250 255 Glu Val Gln Lys Phe Gly Gln Thr Ala Pro Lys Glu Val Gly Met Leu 260 265 270 Ile Gln Ile Leu Asp Asn Gly Ser Gly Phe Arg Leu Tyr Gly Thr Tyr 275 280 285 Tyr Asn Thr Thr Arg Gln Gln Phe Asp Asn Leu Phe Gly Gln Leu Leu 290 295 300 Gln Arg Leu Pro Ser Pro Gly Asn Ser Ala Glu Val Ser Val Lys Gly 305 310 315 320 Trp Ile Asp Ser Leu Ile Phe Ala Ser Gly Gly Ser Lys Gly Leu Thr 325 330 335 Val Pro Glu Leu Gly Gly Thr Asn Gln His Ser Ser Phe Tyr Thr Lys 340 345 350 Ser Leu Met Thr Ala Gln Asp Tyr Pro Leu Thr Leu Asp Ser Ile Lys 355 360 365 Ser Val Phe Lys Tyr Ala Met Asn Gln Gly Arg Ala Ala Thr Glu Arg 370 375 380 Gly Leu Pro Trp Met Val Phe Ile Ser Leu Leu Gly Gly Arg Tyr Ser 385 390 395 400 Thr Leu Pro Thr Pro Ser Ala Ala Ser Asp Asn Ser Phe Tyr Gly Arg 405 410 415 Asn Thr Leu Trp Ala Phe Ser Phe Thr Ala Tyr Leu Gly Asn Val Thr 420 425 430 Glu Gln Ser Asn Arg Asp Ser Ile Tyr Phe Leu Asn Gly Phe Asp Thr 435 440 445 Ser Val Arg Arg Ser Val Asp Thr Ala Tyr Ile Asn Gly His Asp Thr 450 455 460 Glu Tyr Ser Arg Glu Glu Ala His Arg Leu Tyr Tyr Gly Asp Lys Tyr 465 470 475 480 Gln Arg Leu Ser Val Leu Lys Lys Gln Trp Asp Pro Glu Gln Val Phe 485 490 495 Trp Tyr Pro Gln Ser Ile Asp Pro Ala Asn 500 505 <210> 109 <211> 476 <212> PRT <213> Aspergillus fumigatus <400> 109 Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Leu Ser 1 5 10 15 Ala Val Gly Gly Asn His Ala His Val Ala Phe Gln Asp Gln Leu Leu 20 25 30 Tyr Gln Ala Thr Ala Val Glu Pro Tyr Asn Leu Asn Ile Pro Val Thr 35 40 45 Pro Ala Ala Val Thr Tyr Pro Gln Ser Ala Asp Glu Val Ala Ala Val 50 55 60 Val Lys Cys Ala Ala Asp Tyr Gly Tyr Lys Val Gln Ala Arg Ser Gly 65 70 75 80 Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Glu Asp Gly Ala Ile 85 90 95 Val Val Asp Met Lys His Phe Asp Gln Phe Ser Met Asp Glu Ser Thr 100 105 110 Tyr Thr Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr 115 120 125 Ala Leu Tyr Asn Ala Gly His Arg Ala Met Ala His Gly Ile Cys Pro 130 135 140 Thr Ile Arg Thr Gly Gly His Leu Thr Ile Gly Gly Leu Gly Pro Thr 145 150 155 160 Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val 165 170 175 Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asp Thr Gln Asn Gln 180 185 190 Glu Ile Leu Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val 195 200 205 Thr Glu Phe Lys Val Arg Thr Glu Glu Ala Pro Gly Leu Ala Val Gln 210 215 220 Tyr Ser Phe Thr Phe Asn Leu Gly Thr Ala Ala Glu Lys Ala Lys Leu 225 230 235 240 Val Lys Asp Trp Gln Ala Phe Ile Ala Gln Glu Asp Leu Thr Trp Lys 245 250 255 Phe Tyr Ser Asn Met Asn Ile Ile Asp Gly Gln Ile Ile Leu Glu Gly 260 265 270 Ile Tyr Phe Gly Ser Lys Ala Glu Tyr Asp Ala Leu Gly Leu Glu Glu 275 280 285 Lys Phe Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp 290 295 300 Leu Gly Met Val Gly His Gly Leu Glu Asp Val Ile Leu Arg Leu Val 305 310 315 320 Gly Asn Ala Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Ala Pro 325 330 335 Arg Ala Leu Ile Pro Asp Ser Ala Ile Asp Asp Phe Phe Glu Tyr Ile 340 345 350 His Lys Asn Asn Pro Gly Thr Val Ser Trp Phe Val Thr Leu Ser Leu 355 360 365 Glu Gly Gly Ala Ile Asn Lys Val Pro Glu Asp Ala Thr Ala Tyr Gly 370 375 380 His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Ile Asn Pro Leu 385 390 395 400 Gly Pro Val Ser Gln Thr Ile Tyr Asp Phe Ala Asp Gly Leu Tyr Asp 405 410 415 Val Leu Ala Lys Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly 420 425 430 Cys Pro Asp Pro Arg Met Pro Asn Ala Gln Gln Ala Tyr Trp Arg Asn 435 440 445 Asn Leu Pro Arg Leu Glu Glu Leu Lys Gly Asp Leu Asp Pro Lys Asp 450 455 460 Ile Phe His Asn Pro Gln Gly Val Met Val Val Ser 465 470 475 <210> 110 <211> 474 <212> PRT <213> Aspergillus arachidicola <400> 110 Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Val Ser Ala 1 5 10 15 Leu Gly Gly Asn Ala Gly Leu Val Ala Phe Gln Ser Gln Pro Leu Tyr 20 25 30 Gln Thr Thr Ala Val His Glu Tyr Asn Leu Asn Ile Pro Val Thr Pro 35 40 45 Ala Ala Ile Ala Tyr Pro Glu Thr Ala Glu Gln Ile Ala Ala Val Val 50 55 60 Lys Cys Ala Ser Glu Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly 65 70 75 80 His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asp Gly Ala Val Val 85 90 95 Val Asp Met Lys His Phe Asn Gln Phe Ser Met Asp Asp Gln Thr Tyr 100 105 110 Glu Ala Val Ile Gly Pro Gly Thr Thr Leu Gly Asp Val Asp Thr Glu 115 120 125 Leu Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Ile Cys Pro Thr 130 135 140 Ile Ser Thr Gly Gly His Phe Thr Met Gly Gly Leu Gly Pro Thr Ala 145 150 155 160 Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val 165 170 175 Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Glu 180 185 190 Val Phe Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr 195 200 205 Glu Phe Lys Val Arg Thr Gln Pro Ala Pro Gly Leu Ala Val Gln Tyr 210 215 220 Ser Tyr Thr Phe Asn Leu Gly Ser Ser Ala Glu Lys Ala Gln Phe Val 225 230 235 240 Lys Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe 245 250 255 Tyr Thr Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu 260 265 270 Phe Phe Gly Ser Lys Glu Gln Tyr Glu Ala Leu Gly Leu Glu Glu Arg 275 280 285 Phe Val Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu 290 295 300 Gly Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Arg Leu Val Gly 305 310 315 320 Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Asp 325 330 335 Thr Leu Ile Pro Ser Ser Gly Ile Asp Glu Phe Phe Glu Tyr Ile Glu 340 345 350 Asn Asn Lys Ala Gly Thr Ser Thr Trp Phe Val Thr Leu Ser Leu Glu 355 360 365 Gly Gly Ala Ile Asn Asp Val Pro Ala Asp Thr Thr Ala Tyr Gly His 370 375 380 Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Val Ser Pro Thr Gly 385 390 395 400 Pro Val Ser Ser Thr Thr Tyr Asp Phe Ala Asp Gly Leu Tyr Asn Val 405 410 415 Leu Thr Lys Ala Val Pro Glu Ser Glu Gly His Ala Tyr Leu Gly Cys 420 425 430 Pro Asp Pro Lys Met Ala Asn Ala Gln Gln Lys Tyr Trp Arg Gln Asn 435 440 445 Leu Pro Arg Leu Glu Glu Leu Lys Ala Thr Leu Asp Pro Lys Asp Thr 450 455 460 Phe His Asn Pro Gln Gly Ile Leu Pro Val 465 470 <210> 111 <211> 483 <212> PRT <213> Aspergillus flavus <400> 111 Met Asn Pro Ser Ile Pro Ser Ser Ser Met Gly Asn Thr Thr Ser Ile 1 5 10 15 Ala Gly Arg Asp Cys Leu Val Ser Ala Leu Gly Gly Asn Ala Gly Leu 20 25 30 Val Ala Phe Gln Asn Gln Pro Leu Tyr Gln Thr Thr Ala Val His Glu 35 40 45 Tyr Asn Leu Asn Ile Pro Val Thr Pro Ala Ala Ile Thr Tyr Pro Glu 50 55 60 Thr Ala Glu Gln Ile Ala Ala Val Val Lys Cys Ala Ser Gln Tyr Asp 65 70 75 80 Tyr Lys Val Gln Ala Arg Ser Gly Gly His Ser Phe Gly Asn Tyr Gly 85 90 95 Leu Gly Gly Thr Asp Gly Ala Val Val Val Asp Met Lys Tyr Phe Asn 100 105 110 Gln Phe Ser Met Asp Asp Gln Thr Tyr Glu Ala Val Ile Gly Pro Gly 115 120 125 Thr Thr Leu Gly Asp Val Asp Val Glu Leu Tyr Asn Asn Gly Lys Arg 130 135 140 Ala Met Ala His Gly Val Cys Pro Thr Ile Ser Thr Gly Gly His Phe 145 150 155 160 Thr Met Gly Gly Leu Gly Pro Thr Ala Arg Gln Trp Gly Leu Ala Leu 165 170 175 Asp His Val Glu Glu Val Glu Val Val Leu Ala Asn Ser Ser Ile Val 180 185 190 Arg Ala Ser Asn Thr Gln Asn Gln Glu Val Phe Phe Ala Val Lys Gly 195 200 205 Ala Ala Ala Ser Phe Gly Ile Val Thr Glu Phe Lys Val Arg Thr Gln 210 215 220 Pro Ala Pro Gly Ile Ala Val Gln Tyr Ser Tyr Thr Phe Asn Leu Gly 225 230 235 240 Ser Ser Ala Glu Lys Ala Gln Phe Ile Lys Asp Trp Gln Ser Phe Val 245 250 255 Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr Thr Asn Met Val Ile Phe 260 265 270 Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe Phe Gly Ser Lys Glu Gln 275 280 285 Tyr Glu Ala Leu Gly Leu Glu Glu Arg Phe Val Pro Lys Asn Pro Gly 290 295 300 Asn Ile Met Val Leu Thr Asp Trp Leu Gly Met Val Gly His Ala Leu 305 310 315 320 Glu Asp Thr Ile Leu Arg Leu Val Gly Asn Thr Pro Thr Trp Phe Tyr 325 330 335 Ala Lys Ser Leu Gly Phe Thr Pro Asp Thr Leu Ile Pro Ser Ser Gly 340 345 350 Ile Asp Glu Phe Phe Glu Tyr Ile Glu Asn Asn Lys Ala Gly Thr Ser 355 360 365 Thr Trp Phe Val Thr Leu Ser Leu Glu Gly Gly Ala Ile Asn Asp Val 370 375 380 Pro Ala Asp Ala Thr Ala Tyr Gly His Arg Asp Val Leu Phe Trp Val 385 390 395 400 Gln Ile Phe Met Val Ser Pro Thr Gly Pro Val Ser Ser Thr Thr Tyr 405 410 415 Asp Phe Ala Asp Gly Leu Tyr Asn Val Leu Thr Lys Ala Val Pro Glu 420 425 430 Ser Glu Gly His Ala Tyr Leu Gly Cys Pro Asp Pro Lys Met Ala Asn 435 440 445 Ala Gln Gln Lys Tyr Trp Arg Gln Asn Leu Pro Arg Leu Glu Glu Leu 450 455 460 Lys Glu Thr Leu Asp Pro Lys Asp Thr Phe His Asn Pro Gln Gly Ile 465 470 475 480 Leu Pro Ala <210> 112 <211> 506 <212> PRT <213> Aspergillus nomiae <400> 112 Met Ala Arg Val Pro Ala Leu Phe Leu Gly Leu Ser Ser Val Cys Leu 1 5 10 15 Leu Val Phe Phe Cys Ser Leu Ile Asn Pro Thr Thr Pro Leu His Gln 20 25 30 His Gly Lys Gln Thr Ser Ile Ala Gly Arg Asp Cys Leu Val Ser Ala 35 40 45 Leu Gly Gly Asn Thr Gly Leu Val Ala Phe Gln Asp Gln Leu Leu Tyr 50 55 60 Gln Thr Thr Ala Val His Glu Tyr Asn Leu Asn Ile Pro Val Thr Pro 65 70 75 80 Ala Ala Ile Thr Tyr Pro Glu Thr Ser Glu Gln Ile Ala Ala Val Val 85 90 95 Lys Cys Ala Ser Glu Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly 100 105 110 His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val Val 115 120 125 Val Asp Met Lys His Phe Thr Gln Phe Ser Met Asp Glu Gln Thr Tyr 130 135 140 Glu Ala Val Ile Gly Pro Gly Thr Thr Leu Gly Asp Val Asp Thr Glu 145 150 155 160 Leu Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Ile Cys Pro Thr 165 170 175 Ile Ser Thr Gly Gly His Phe Thr Met Gly Gly Leu Gly Pro Thr Ala 180 185 190 Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val 195 200 205 Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Glu 210 215 220 Val Phe Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr 225 230 235 240 Glu Phe Lys Val Arg Thr Gln Pro Ala Pro Gly Leu Ala Val Gln Tyr 245 250 255 Ser Tyr Thr Phe Asn Leu Gly Ser Ser Ala Glu Lys Ala Gln Phe Val 260 265 270 Lys Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe 275 280 285 Tyr Thr Asn Met Val Ile Phe Asp Gly Asn Ile Ile Leu Glu Gly Leu 290 295 300 Phe Phe Gly Ser Lys Glu Gln Tyr Glu Ala Leu Gly Leu Glu Asp Arg 305 310 315 320 Phe Val Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu 325 330 335 Gly Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Arg Leu Val Gly 340 345 350 Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Asp 355 360 365 Thr Leu Ile Pro Ser Ser Gly Ile Asp Glu Phe Phe Asp Tyr Ile Glu 370 375 380 Asn Asn Lys Ala Gly Thr Leu Thr Trp Phe Val Thr Leu Ser Leu Glu 385 390 395 400 Gly Gly Ala Ile Asn Asp Val Pro Lys Asp Ala Thr Ala Tyr Gly His 405 410 415 Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Ala Ser Pro Thr Gly 420 425 430 Pro Val Ser Ser Thr Thr Tyr Asp Phe Ala Asp Gly Leu Tyr Asn Val 435 440 445 Leu Thr Lys Ala Val Pro Glu Ser Glu Gly His Ala Tyr Leu Gly Cys 450 455 460 Pro Asp Pro Lys Met Ala Asp Ala Gln Gln Lys Tyr Trp Arg Gln Asn 465 470 475 480 Leu Pro Arg Leu Glu Glu Leu Lys Ala Thr Leu Asp Pro Lys Asp Thr 485 490 495 Phe His Asn Pro Gln Gly Ile Leu Pro Ala 500 505 <210> 113 <211> 427 <212> PRT <213> Aspergillus niger <400> 113 Met Thr Thr Lys Cys Arg His Ala Val Glu Ala Thr Ala Leu Gly Thr 1 5 10 15 Met Val Ala Tyr Leu Ile Arg Asn Asn Pro Arg Arg Pro Ser Ser Thr 20 25 30 Asn Ala Asn Val Leu Asp Thr Gly Leu Gly Gly Ala Asp Gly Ala Val 35 40 45 Val Val Asp Met Lys His Phe Thr Gln Phe Ser Met Asp Asp Glu Thr 50 55 60 Tyr Glu Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile 65 70 75 80 Glu Leu Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro 85 90 95 Thr Ile Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr 100 105 110 Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val 115 120 125 Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln 130 135 140 Asp Val Phe Phe Ala Val Lys Gly Ala Ala Ala Asn Phe Gly Ile Val 145 150 155 160 Thr Glu Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln 165 170 175 Tyr Ser Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe 180 185 190 Val Lys Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln 195 200 205 Phe Tyr Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly 210 215 220 Leu Phe Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp 225 230 235 240 His Phe Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp 245 250 255 Leu Gly Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val 260 265 270 Gly Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln 275 280 285 Asp Thr Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile 290 295 300 Ala Asn His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu 305 310 315 320 Glu Gly Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala 325 330 335 His Arg Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Leu 340 345 350 Gly Pro Ile Ser Asp Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp 355 360 365 Val Leu Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly 370 375 380 Cys Pro Asp Pro Arg Met Glu Asp Ala Gln Gln Lys Tyr Trp Arg Thr 385 390 395 400 Asn Leu Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn 405 410 415 Thr Phe His His Pro Gln Gly Val Met Pro Ala 420 425 <210> 114 <211> 475 <212> PRT <213> Neonectria ditissima <400> 114 Met Gly His Gly Gln Ser Thr Pro Gly Glu Asn Cys Leu Asn Ala Ile 1 5 10 15 Cys Gly Asn Arg Thr Asp Cys Val Ser Tyr Pro Leu Asp Pro Leu Phe 20 25 30 His Ile Ala Trp Ala Arg Pro Tyr Asn Leu Gln Val Pro Val Thr Pro 35 40 45 Ala Ala Val Leu Arg Pro Asp Asn Ala Gln Asp Val Ala Asp Ala Val 50 55 60 Lys Cys Ala Asn Glu Asn Gly Ile Lys Val Gln Ala Arg Ser Gly Gly 65 70 75 80 His Ser Tyr Gly Asn Phe Gly Leu Gly Gly Asp Asp Gly Ala Leu Val 85 90 95 Leu Asp Leu Val Asn Leu Gln Gly Phe Thr Met Asp Glu Glu Asn Trp 100 105 110 His Ala Ala Val Gly Ala Gly Ile Arg Leu Gly Lys Leu Asp Glu His 115 120 125 Leu His Lys Asn Gly Gly Arg Ala Met Ala His Gly Thr Cys Pro Gly 130 135 140 Val Gly Ile Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Met Ser 145 150 155 160 Arg Met Trp Gly Ser Ala Leu Asp His Val Val Glu Val Glu Val Val 165 170 175 Thr Ala Asp Gly Ser Ile Gln Arg Ala Asn Glu Thr Glu Asn Ser Asp 180 185 190 Leu Phe Trp Ala Leu Arg Gly Ala Gly Ala Ser Phe Gly Ile Ile Thr 195 200 205 Glu Phe Val Val Arg Thr His Pro Glu Pro Gly Asp Val Ile Glu Tyr 210 215 220 Thr Tyr Ser Leu Thr Phe Gly Ser Gln Ala Glu Met Ala Pro Ile Tyr 225 230 235 240 Gln Glu Trp Gln Glu Phe Ile Gly Asp Pro Asp Leu Asp Arg Arg Phe 245 250 255 Ser Ser Gln Phe Ile Ala Gln Pro Leu Gly Ala Ile Ile Thr Gly Thr 260 265 270 Phe Tyr Gly Thr Glu Asp Glu Tyr Arg Glu Ser Gly Ile Pro Asp Lys 275 280 285 Ile Pro Gly Gly Gly Ser Asp Gly Val Gly Ile Leu Val Thr Asp Trp 290 295 300 Leu Gly Ser Leu Gly His Gln Ala Glu Arg Ser Gly Leu Ala Ile Ser 305 310 315 320 Asp Leu Pro Ser Pro Phe Tyr Ser Lys Ser Leu Ala Phe Arg Lys Glu 325 330 335 Asp Leu Leu Pro Lys Glu Gly Ile Thr Glu Leu Phe Gln Tyr Leu Asn 340 345 350 Asp Ala Asp His Gly Thr Leu Ile Trp Val Val Ile Phe Asn Ser Glu 355 360 365 Gly Gly Ala Met Gly Asp Thr Ala Ala Asn Ala Thr Ala Tyr Pro His 370 375 380 Arg Asp Lys Thr Met Met Tyr Gln Ser Tyr Val Ile Gly Ile Pro Glu 385 390 395 400 Val Ser Gly Thr Ala Arg Arg Phe Leu Glu Gly Val His Ala Lys Ile 405 410 415 Gln Asp Ala Ala Pro Gly Ala Asn Ser Thr Tyr Ala Gly Tyr Ile Asp 420 425 430 Thr Glu Leu Gly Arg Ala Glu Ala Gln Glu Val Tyr Trp Gly Ser Gln 435 440 445 Leu Pro Gln Leu Arg Lys Ile Lys Lys Asp Trp Asp Pro Lys Asp Arg 450 455 460 Phe Ser Asn Pro Gln Ser Val Gln Ala Ala Arg 465 470 475 <210> 115 <211> 516 <212> PRT <213> Unknown <220> <223> Pseudogymnoascus sp. VKM F-4518 <400> 115 Met Arg Val Val Gly Lys Met Gly Ala Leu Gln Ser Thr Leu Glu Lys 1 5 10 15 Ser Ile Lys Ala Ala Leu Ala Gly Asp Asp Asp Leu Tyr Ala Val Pro 20 25 30 Gly Lys Pro Phe Tyr Gln Ile Gln His Val Lys Pro Tyr Asn Leu Ser 35 40 45 Ile Pro Ile Glu Pro Ala Ala Ile Thr Tyr Pro Lys Thr Thr Ala Gln 50 55 60 Val Ala Ala Ile Ile Lys Cys Ala Val Ala Ala Asn Leu Lys Val Gln 65 70 75 80 Ala Arg Ser Gly Gly His Ser Tyr Ala Asn Tyr Cys Ile Gly Gly Val 85 90 95 Ser Gly Ala Val Val Ile Asp Leu Lys His Phe Gln Arg Phe Ser Met 100 105 110 Asp Arg Thr Thr Trp Gln Ala Ala Val Gly Ala Gly Thr Leu Leu Gly 115 120 125 Asn Leu Thr Lys Arg Met His Glu Ala Gly Asn Arg Ala Met Ala His 130 135 140 Gly Thr Cys Pro Gln Val Gly Ile Gly Gly His Ala Thr Ile Gly Gly 145 150 155 160 Leu Gly Pro Ser Ser Arg Leu Trp Gly Thr Ala Leu Asp His Val Glu 165 170 175 Glu Val Glu Ile Val Leu Ala Asp Ser Thr Ile Lys Arg Cys Ser Ala 180 185 190 Thr Gln Asn Pro Asp Ile Phe Trp Ala Val Lys Gly Ala Gly Ala Ser 195 200 205 Phe Gly Val Val Thr Glu Phe Lys Leu Arg Thr Glu Pro Glu Pro Ser 210 215 220 Glu Ala Val His Phe Ser Tyr Ser Phe Thr Val Gly Ser Tyr Ala Ser 225 230 235 240 Leu Ala Ala Val Phe Lys Ser Trp Gln Ser Phe Val Ala Asp Pro Gly 245 250 255 Leu Thr Arg Lys Phe Ser Ser Glu Val Ile Ile Thr Glu Ile Gly Met 260 265 270 Ile Ile Ser Gly Thr Tyr Phe Gly Ser Gln Ala Glu Tyr Asp Ala Leu 275 280 285 Asp Met Lys Ser Gln Leu Arg Gly Asp Ser Val Ala Lys Ile Ile Val 290 295 300 Phe Lys Asp Trp Leu Gly Leu Leu Gly His Trp Ala Glu Asp Val Gly 305 310 315 320 Leu Arg Ile Ala Gly Gly Leu Pro Ala Pro Leu Tyr Ala Lys Thr Leu 325 330 335 Thr Phe Asn Gly Ala Asn Leu Ile Pro Asp Glu Val Ile Asp Lys Leu 340 345 350 Phe Ala Tyr Leu Asp Lys Val Glu Lys Gly Ala Leu Val Trp Phe Val 355 360 365 Ile Phe Asp Leu Ala Gly Gly Ala Val Asn Asp Ile Ala Gln Asp Ala 370 375 380 Thr Ser Tyr Ala His Arg Asp Ala Leu Phe Tyr Leu Gln Ser Tyr Ala 385 390 395 400 Val Gly Leu Gly Asn Val Ser Gln Thr Thr Lys Asp Phe Leu Thr Gly 405 410 415 Ile Asn Thr Thr Ile Thr Asn Gly Met Pro Glu Gly Gly Asp Phe Gly 420 425 430 Ala Tyr Pro Gly Tyr Val Asp Leu Glu Leu Pro Asn Gly Pro His Ala 435 440 445 Tyr Trp Arg Thr Asn Leu Pro Arg Leu Glu Gln Ile Lys Ala Leu Val 450 455 460 Asp Pro Asn Asp Val Phe His Asn Pro Gln Ser Tyr Leu Cys Ile Leu 465 470 475 480 Phe Leu Leu Asn Leu Leu Asn Arg Ala Leu Ala Trp Ala Pro Val Gly 485 490 495 Thr Val Gln Pro Phe Gln Val Leu Arg Tyr Ser Ile Asp Thr Gly Pro 500 505 510 Leu Val Leu Leu 515 <210> 116 <211> 478 <212> PRT <213> Pyrenophora tritici-repentis <400> 116 Met Gly Gln Gly Ser Ser Gly Val Gln Ser Asn Pro Leu Glu Asp Cys 1 5 10 15 Leu Lys Val Ala Thr Ser Pro Leu Gly Ser Tyr Ala Phe His Asp Lys 20 25 30 Leu Leu Phe Gln Leu Thr Asp Val Lys Pro Tyr Asn Leu Asp Tyr Pro 35 40 45 Val Asn Pro Ile Ala Val Thr Tyr Pro Gly Ser Thr Lys Glu Val Ala 50 55 60 Gln Ile Ile Lys Cys Ala Thr Thr Tyr Asp Lys Lys Val Gln Ala Arg 65 70 75 80 Ser Gly Gly His Ser Tyr Ala Asn Phe Ala Leu Gly Asp Gly Asp Gly 85 90 95 Ala Ile Val Ile Asp Met Gln Lys Phe Lys Gln Phe Ser Met Asp Thr 100 105 110 Ser Thr Trp Gln Ala Thr Ile Gly Pro Gly Thr Leu Leu Gly Asp Val 115 120 125 Ser Lys Arg Leu His Glu Asn Gly Asn Arg Val Ile Pro His Gly Thr 130 135 140 Ser Pro Gln Ile Gly Phe Gly Gly His Gly Thr Ile Gly Gly Leu Gly 145 150 155 160 Pro Leu Ser Arg Met Tyr Gly Leu Thr Leu Asp Ser Ile Glu Glu Val 165 170 175 Glu Ala Val Leu Ala Asn Gly Gln Ile Val Arg Ala Ser Lys Thr Gln 180 185 190 Asn Glu Asp Leu Phe Phe Ala Ile Arg Gly Ala Ala Ala Ser Val Ala 195 200 205 Val Val Thr Glu Phe Lys Val Arg Thr Tyr Pro Glu Pro Ser Ser Ser 210 215 220 Val Leu Tyr Ser Tyr Thr Leu Gln Gly Gly Ser Val Ala Ser Arg Ala 225 230 235 240 Asn Ala Phe Lys Gln Trp Gln Lys Leu Thr Thr Asp Pro Ser Val Ser 245 250 255 Arg Lys Phe Ala Ser Thr Phe Val Leu Ser Glu Ala Ile Thr Val Val 260 265 270 Thr Gly Thr Phe Phe Gly Thr Gln Ala Glu Phe Asp Ser Leu Asp Ile 275 280 285 Thr Ser Arg Leu Pro Ala Asp Met Ile Ser Asn Asn Thr Glu Val Lys 290 295 300 Asn Trp Leu Gly Val Val Gly His Trp Gly Glu Ser Leu Ala Leu Arg 305 310 315 320 Ala Gly Gly Gly Ile Pro Ala His Phe Tyr Ser Lys Ser Leu Gly Phe 325 330 335 Lys Lys Asp Glu Ile Met Asp Asp Ala Thr Val Asp Lys Leu Phe Asn 340 345 350 Tyr Ile Asp Lys Ala Asp Lys Gly Gly Ala Val Trp Phe Val Ile Trp 355 360 365 Asp Leu Glu Gly Gly Ala Ile Ser Asp Val Pro Thr Thr Glu Thr Ser 370 375 380 Tyr Gly His Arg Asp Ala Ile Phe Phe Gln Gln Ser Tyr Ala Ile Asn 385 390 395 400 Leu Leu Gly Arg Val Lys Asp Asp Thr His Glu Phe Leu Asn Arg Val 405 410 415 Asn Ser Val Ile Met Glu Ser Asn Pro Gly Gly Tyr Trp Gly Ala Tyr 420 425 430 Pro Gly Tyr Val Asp Thr Ala Leu Gly Asn Ser Ser Ala Lys Ala Tyr 435 440 445 Trp Gly Ile Asn Ser Glu Arg Leu Gln Thr Ile Lys Ser Trp Val Asp 450 455 460 Ala Gly Asp Val Phe His Asn Pro Gln Ser Val Arg Pro Lys 465 470 475 <210> 117 <211> 526 <212> PRT <213> Colletotrichum orchidophilum <400> 117 Met Gln Pro Phe Thr Ser Leu Thr Arg Ser Pro Phe Arg Ser Ala His 1 5 10 15 Val Ile Ser Cys Pro Val Ala Leu Asp Asn Pro Pro Ser Val Pro Ile 20 25 30 Ile Met Gly Gln Lys Pro Ser Ser Pro Leu Ala Thr Cys Leu Asp Lys 35 40 45 Val Cys Asn Gly Arg Ser Ser Cys Val Gly Tyr Pro Asn Asp Pro Leu 50 55 60 Phe Gln Ile Asn Trp Val Lys Pro Tyr Asn Leu Asp Ile Pro Val Gln 65 70 75 80 Pro Ile Ala Val Thr Arg Pro Ser Thr Ala Glu Asp Val Ala Gly Phe 85 90 95 Val Lys Cys Ala Ala Glu Asn Asn Val Lys Val Gln Ala Lys Ser Gly 100 105 110 Gly His Ser Tyr Gly Asn Phe Ala Ile Gly Gly Thr Asp Gly Ala Leu 115 120 125 Val Ile Asp Leu Val Asn Phe Gln Asn Phe Ser Met Asp Thr Asn Thr 130 135 140 Trp Gln Ala Thr Phe Gly Gly Gly His Lys Leu His Glu Val Thr Gln 145 150 155 160 Lys Leu His Asp Asn Gly Lys Arg Ala Ile Ala His Gly Thr Cys Pro 165 170 175 Gly Val Gly Ile Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Ser 180 185 190 Ser Arg Met Trp Gly Ser Cys Leu Asp His Val Val Glu Val Glu Val 195 200 205 Val Thr Ala Asp Gly Lys Ile Gln Arg Ala Asn Asp Lys Gln Asn Ser 210 215 220 Asp Leu Phe Phe Ala Leu Lys Gly Ala Gly Ala Gly Phe Gly Val Ile 225 230 235 240 Thr Glu Phe Val Met Arg Thr His Pro Glu Pro Gly Asp Val Val Gln 245 250 255 Tyr Ser Tyr Ala Ile Thr Phe Ala Lys His Arg Asp Leu Val Pro Val 260 265 270 Phe Lys Gln Trp Gln Glu Leu Ile Phe Asp Pro Thr Leu Asp Arg Arg 275 280 285 Phe Ser Ser Glu Phe Val Met Gln Glu Leu Gly Val Ala Ile Thr Ala 290 295 300 Thr Phe Tyr Gly Thr Glu Asp Glu Phe Lys Lys Thr Gly Ile Pro Asp 305 310 315 320 Arg Ile Pro Lys Gly Lys Val Ser Val Val Ile Asn Asn Trp Leu Gly 325 330 335 Asp Val Ala Gln Lys Ala Gln Asp Ala Ala Leu Trp Leu Ser Asp Ile 340 345 350 Gln Ser Ala Phe Thr Ser Lys Ser Leu Ala Phe Thr His Asn Asp Leu 355 360 365 Ile Ser Glu Asp Gly Ile Gln Thr Met Met Asp Tyr Val Asp Ser Val 370 375 380 Asp Arg Gly Thr Leu Ile Trp Phe Leu Ile Leu Asp Ser Thr Gly Gly 385 390 395 400 Ala Ile Asn Asp Val Pro Met Asn Ala Thr Ala Tyr Arg His Arg Asp 405 410 415 Lys Val Met Phe Phe Gln Gly Tyr Gly Val Gly Ile Pro Thr Leu Ser 420 425 430 Gly Lys Thr Lys Asp Phe Met Ser Gly Val Ala Asp Lys Ile Arg Lys 435 440 445 Ala Ser Pro Asn Glu Leu Ser Thr Tyr Ala Gly Tyr Val Asp Pro Thr 450 455 460 Leu Asp Asn Ala Gln Glu Arg Tyr Trp Gly Pro Asn Leu Pro Ala Leu 465 470 475 480 Glu Arg Ile Lys Ala Thr Trp Asp Pro Lys Asp Leu Phe Ser Asn Pro 485 490 495 Gln Ser Val Arg Pro Asn Ala Ser Ala Lys Asp Val Glu Pro Ala Ala 500 505 510 Ser Gly Gly Ser Asn Asn Ser Gly Ser Lys Gly Gly Asp Ser 515 520 525 <210> 118 <211> 472 <212> PRT <213> Unknown <220> <223> Cordyceps sp. RAO-2017 <400> 118 Met Gly Ser Gly His Ser Ser Gly Leu Ala Thr Cys Leu Asp Ala Val 1 5 10 15 Cys Asn Gly Arg His Ala Cys Val Ala Tyr Pro Asp His Leu Leu Tyr 20 25 30 Gln Ala Ser Trp Val Asp Arg Tyr Asn Leu Asp Ile Pro Val His Pro 35 40 45 Ile Ala Val Thr Arg Pro Ser Asn Ala Asp Asp Val Ser Gly Phe Val 50 55 60 Lys Cys Ala Ala Ala Asn Asn Val Arg Val Gln Ala Lys Ser Gly Gly 65 70 75 80 His Ser Tyr Ala Asn Tyr Gly Leu Gly Gly Glu Asp Gly Glu Leu Val 85 90 95 Ile Asp Leu Arg His Leu Gln His Phe Ser Met Asp Thr Asn Thr Trp 100 105 110 Gln Ala Thr Ile Gly Ala Gly His Arg Leu Trp Asp Val Thr His Lys 115 120 125 Leu His Glu Asn Gly Lys Arg Ala Val Ser His Gly Thr Cys Pro Gly 130 135 140 Val Gly Ile Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Ser Ser 145 150 155 160 Arg Met Trp Gly Ser Cys Leu Asp His Val Val Glu Val Glu Val Val 165 170 175 Thr Ala Asp Gly Ser Ile Arg Arg Ala Ser Glu Arg Glu Asn Ala Asp 180 185 190 Leu Phe Phe Ala Leu Lys Gly Ala Gly Ala Gly Phe Gly Val Ile Thr 195 200 205 Glu Phe Val Met Lys Thr His Pro Glu Pro Gly Ser Val Val Arg Tyr 210 215 220 Thr Tyr Ser Val Asn Phe Gly Arg His Ala Asp Met Val Asp Val Phe 225 230 235 240 Asp Gln Trp Gln Ala Leu Ile Ser Asp Pro Gly Leu Asp Arg Arg Phe 245 250 255 Gly Ser Glu Ile Ile Met His Ala Phe Gly Leu Val Ile Ser Ala Thr 260 265 270 Phe His Gly Thr Arg Asp Glu Tyr Glu Ala Ser Gly Ile Pro Asp Arg 275 280 285 Ile Pro Arg Gly Asn Val Ser Val Leu Leu Asp Asn Trp Leu Gly Val 290 295 300 Val Gly Asn Gln Ala Gln Asp Ala Gly Leu Trp Val Ser Glu Val Arg 305 310 315 320 Ser Ser Phe Thr Ser Arg Ser Leu Ala Phe Arg Arg Asp Gln Leu Leu 325 330 335 Ser Arg Asp Asp Ile Val Arg Met Met Asp Phe Leu Asp Arg Thr Asp 340 345 350 Lys Gly Thr Leu Val Trp Phe Leu Ile Phe Asp Val Thr Gly Gly Ala 355 360 365 Ile Gly Asp Val Arg Thr Asp Ala Thr Ala Tyr Ala His Arg Asp Lys 370 375 380 Ile Met Phe Cys Gln Gly Tyr Ala Val Gly Ile Pro Ala Leu Thr Arg 385 390 395 400 Lys Thr Arg Val Phe Met Asp Gly Leu Ile Ser Thr Ile Arg Glu Thr 405 410 415 Ala Asn Ser Thr Leu Thr Thr Tyr Pro Gly Tyr Val Asp Pro Ser Leu 420 425 430 His Asp Ala Gln Ala Ser Tyr Trp Gly Pro Asn Leu Pro Arg Leu Thr 435 440 445 Glu Val Lys Thr Lys Trp Asp Pro Gln Asp Val Phe His Asn Pro Gln 450 455 460 Ser Val Arg Pro Ser Gly Lys Asp 465 470 <210> 119 <400> 119 000 <210> 120 <211> 476 <212> PRT <213> Aspergillus fumigatus <400> 120 Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Leu Ser 1 5 10 15 Ala Val Gly Gly Asn His Ala His Val Ala Phe Gln Asp Gln Leu Leu 20 25 30 Tyr Gln Ala Thr Ala Val Glu Pro Tyr Asn Leu Asn Ile Pro Val Thr 35 40 45 Pro Ala Ala Val Thr Tyr Pro Gln Ser Ala Asp Glu Val Ala Ala Val 50 55 60 Val Lys Cys Ala Ala Asp Tyr Gly Tyr Lys Val Gln Ala Arg Ser Gly 65 70 75 80 Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Glu Asp Gly Ala Ile 85 90 95 Val Val Asp Met Lys His Phe Asp Gln Phe Ser Met Asp Glu Ser Thr 100 105 110 Tyr Thr Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr 115 120 125 Ala Leu Tyr Asn Ala Gly His Arg Ala Met Ala His Gly Ile Cys Pro 130 135 140 Thr Ile Arg Thr Gly Gly His Leu Thr Ile Gly Gly Leu Gly Pro Thr 145 150 155 160 Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val 165 170 175 Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asp Thr Gln Asn Gln 180 185 190 Glu Ile Leu Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val 195 200 205 Thr Glu Phe Lys Val Arg Thr Glu Glu Ala Pro Gly Leu Ala Val Gln 210 215 220 Tyr Ser Phe Thr Phe Asn Leu Gly Thr Ala Ala Glu Lys Ala Lys Leu 225 230 235 240 Val Lys Asp Trp Gln Ala Phe Ile Ala Gln Glu Asp Leu Thr Trp Lys 245 250 255 Phe Tyr Ser Asn Met Asn Ile Ile Asp Gly Gln Ile Ile Leu Glu Gly 260 265 270 Ile Tyr Phe Gly Ser Lys Ala Glu Tyr Asp Ala Leu Gly Leu Glu Glu 275 280 285 Lys Phe Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp 290 295 300 Leu Gly Met Val Gly His Gly Leu Glu Asp Val Ile Leu Arg Leu Val 305 310 315 320 Gly Asn Ala Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Ala Pro 325 330 335 Arg Ala Leu Ile Pro Asp Ser Ala Ile Asp Asp Phe Phe Glu Tyr Ile 340 345 350 His Lys Asn Asn Pro Gly Thr Val Ser Trp Phe Val Thr Leu Ser Leu 355 360 365 Glu Gly Gly Ala Ile Asn Lys Val Pro Glu Asp Ala Thr Ala Tyr Gly 370 375 380 His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Ile Asn Pro Leu 385 390 395 400 Gly Pro Val Ser Gln Thr Ile Tyr Asp Phe Ala Asp Gly Leu Tyr Asp 405 410 415 Val Leu Ala Lys Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly 420 425 430 Cys Pro Asp Pro Arg Met Pro Asn Ala Gln Gln Ala Tyr Trp Arg Asn 435 440 445 Asn Leu Pro Arg Leu Glu Glu Leu Lys Gly Asp Leu Asp Pro Lys Asp 450 455 460 Ile Phe His Asn Pro Gln Gly Val Met Val Val Ser 465 470 475 <210> 121 <211> 477 <212> PRT <213> Xylaria hypoxylon <400> 121 Met Gly Gln Ser Pro Ser Ser Leu Leu Ala Thr Cys Leu Asn Thr Val 1 5 10 15 Cys Asp Gly Arg Thr Asp Cys Val Ala Tyr Pro Asn Asn Pro Leu Tyr 20 25 30 Gln Ile Ser Trp Val Asn Arg Tyr Asn Leu Asp Leu Pro Val Thr Pro 35 40 45 Ile Ala Val Thr Arg Pro Gln Thr Val Gln Asp Val Ser Ala Phe Val 50 55 60 Lys Cys Ala Ala Thr Asn Asn Ile Lys Val Gln Pro Lys Ser Gly Gly 65 70 75 80 His Ser Tyr Ala Asn Tyr Gly Gly Glu Asp Gly Ala Leu Val Ile Asp 85 90 95 Leu Leu Lys Leu Gln Asp Phe Ser Met Asp Ala Lys Thr Trp Gln Ala 100 105 110 Thr Ile Gly Gly Gly Thr Lys Leu Ala Asp Val Thr Lys Arg Leu His 115 120 125 Asp Asn Gly Lys Arg Ala Ile Ser His Gly Thr Cys Pro Gly Val Gly 130 135 140 Ile Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Thr Ser Arg Met 145 150 155 160 Trp Gly Ser Cys Leu Asp His Val Val Glu Ala Glu Val Val Thr Ala 165 170 175 Asp Gly Ser Ile Lys Arg Ala Ser Glu Thr Glu Asn Arg Asp Leu Phe 180 185 190 Phe Ala Leu Lys Gly Ala Gly Ala Gly Phe Gly Val Val Thr Lys Phe 195 200 205 Val Met Lys Thr His Pro Glu Pro Gly Ser Met Val Gln Tyr Ser Tyr 210 215 220 Ser Leu Ser Phe Gly Lys His Thr Asp Met Val Pro Val Phe Lys Gln 225 230 235 240 Trp Gln Asp Leu Val Ser Asp Pro Asn Leu Asp Arg Arg Phe Gly Thr 245 250 255 Glu Phe Val Ala His Glu Leu Gly Ala Ile Ile Thr Ala Thr Phe Tyr 260 265 270 Gly Thr Glu Ala Glu Trp Asp Ala Ser Gly Ile Pro Gln Arg Ile Pro 275 280 285 Lys Gly Lys Ile Ser Val Ile Ile Asp Asp Trp Leu Ala Val Ile Ser 290 295 300 Gln Gln Ala Glu Asp Ala Ala Leu Tyr Leu Ser Asp Ile His Ser Ala 305 310 315 320 Phe Thr Val Arg Ser Leu Ala Phe Thr Ala Glu Glu Thr Leu Ser Glu 325 330 335 Gln Thr Ile Thr Arg Val Met Lys Tyr Ile Asp Asp Thr Asn Arg Gly 340 345 350 Thr Leu Leu Trp Phe Leu Ile Phe Asp Ala Thr Gly Gly Ala Ile Ser 355 360 365 Asp Ile Pro Met Asn Ala Thr Ala Tyr Ser His Arg Asp Lys Ile Met 370 375 380 Tyr Cys Gln Gly Tyr Gly Ile Gly Leu Pro Val Leu Asn Gln His Thr 385 390 395 400 Lys Asp Phe Leu Thr Gly Leu Thr Asp Thr Ile Gln Ala Ser Met Arg 405 410 415 Gln Asn Leu Thr Thr Tyr Pro Gly Tyr Val Asp Pro Ser Leu Ala Asn 420 425 430 Pro Gln Gln Ser Tyr Trp Gly Pro Asn Leu Ala Met Leu Glu Ser Ile 435 440 445 Lys Thr Thr Tyr Asp Pro Asn Asp Leu Phe His Asn Pro Gln Ser Val 450 455 460 Arg Pro Gly Asn Lys Lys Ala Ser Met Thr Gln Glu Phe 465 470 475 <210> 122 <211> 473 <212> PRT <213> Aspergillus ruber <400> 122 Met Ser Asn Asn Thr Leu Ile Gln Ala Cys Leu Leu Ala Ala Leu Gly 1 5 10 15 Phe Asn Ser Thr Arg Val Lys Phe Pro Glu Ala Gly Thr Ile Asp Ala 20 25 30 Asp Pro Tyr Asn Leu Asp Leu Pro Ile Val Pro Ala Ala Ile Thr Val 35 40 45 Pro Arg Ser Thr Ala Gln Val Ala Asn Val Val Lys Cys Ala Ala Ser 50 55 60 Asn Gly Tyr Lys Val Gln Ser Arg Ser Gly Gly His Ser Tyr Gly Asn 65 70 75 80 His Gly Leu Gly Gly Thr Asp Gly Ala Ile Val Val Asp Leu Lys Asp 85 90 95 Leu Lys Gln Phe Ser Met Asp Glu Ser Thr Tyr Ile Ala Ser Ile Gly 100 105 110 Ser Gly Met Leu Leu Asp Glu Val Thr His Lys Leu Tyr Asp Asn Gly 115 120 125 Lys Arg Ala Met Ala His Gly Val Cys Pro Gln Val Gly Val Gly Gly 130 135 140 His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg Gln Trp Gly Ser 145 150 155 160 Ser Leu Asp His Val Glu Glu Val Glu Val Val Leu Ala Asn Ser Ser 165 170 175 Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val Leu Phe Ala Ile 180 185 190 Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr Glu Phe Lys Val Arg 195 200 205 Thr Glu Pro Ala Pro Asp Val Ala Val Gln Tyr Thr Tyr Glu Leu Ile 210 215 220 Leu Gly Asn Ile Thr Glu Arg Ala Arg Ile Met Val Asp Trp Gln Asp 225 230 235 240 Phe Ile Ser Asp Pro Asp Leu Ser Arg Lys Phe Ala Ser Ile Met Ile 245 250 255 Val Phe Glu His Gly Met Leu Leu Ser Gly Asp Phe Tyr Gly Ser Lys 260 265 270 Lys Glu Phe Asp Asp Leu Gly Leu Ala Asp Arg Phe Pro Ile Arg Lys 275 280 285 Pro Gly Asn Val Ala Ile Leu Thr Asp Trp Leu Gly Met Thr Gly His 290 295 300 Ala Val Glu Glu Leu Ala Leu Gly Ile Val Gly Gly Ile Pro Leu His 305 310 315 320 Phe Tyr Ala Lys Ser Met Ala Phe Thr Arg Asp Ser Leu Met Ser Pro 325 330 335 Ser Thr Phe Glu Lys Leu Phe Asp Tyr Leu Asp Asn Thr Asp Lys Gly 340 345 350 Thr Leu Leu Trp Leu Ile Tyr Phe Asp Leu Gln Ser Gly Ala Thr Ser 355 360 365 Asp Val Pro Asn Asn Ser Thr Ala Tyr Ala His Arg Asp Thr Leu Tyr 370 375 380 Trp Leu Gln Ser Tyr Val Val Asn Leu Val Gly Pro Val Ser Asn Thr 385 390 395 400 Thr Thr Ala Phe Leu Glu Gly Ile Asn Asn Leu Ile Ala Gln Asp Val 405 410 415 Pro Ser Ala Asn Thr Arg Ala Tyr Pro Gly Tyr Val Asp Pro Leu Met 420 425 430 Pro Asn Pro Gln Trp Arg Tyr Trp Gly Ser Asn Leu Pro Lys Leu Glu 435 440 445 Lys Ile Lys Ala Ala Ile Asp Pro Asn Asp Val Phe His Asn Pro Gln 450 455 460 Ser Val Lys Pro Arg Lys Gln Ala Pro 465 470 <210> 123 <211> 504 <212> PRT <213> Verruconis gallopava <400> 123 Met Gly Gln Ser Gln Ala Leu Ser Ala Phe Lys Lys Asp Leu Ala Ala 1 5 10 15 Ala Leu Asn Asn Asp Asp Glu Leu Phe Ala Leu Pro Asp Glu Pro Phe 20 25 30 Tyr Ile Lys Asp His Val Lys Arg Tyr Asn Leu Asp Ile Glu Thr Thr 35 40 45 Pro Leu Ala Val Thr Tyr Pro Lys Thr Thr Ala Gln Val Ser Ser Ile 50 55 60 Val Lys Leu Ala Lys Asp Asn Asn Leu Lys Val Gln Ala Lys Cys Gly 65 70 75 80 Gly His Ser Tyr Ala Asn Phe Cys Asp Pro Asn Gly Gly Ile Ile Val 85 90 95 Asp Leu Lys His Phe Gln Lys Phe Glu Ile Asp Glu Asn Thr Trp Arg 100 105 110 Cys Arg Val Gly Gly Gly Thr Leu Leu Gly Asp Leu Thr Lys Arg Met 115 120 125 Phe Glu Pro His Lys Arg Ala Met Ala His Gly Thr Cys Pro Thr Val 130 135 140 Gly Ile Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Ser Ser Arg 145 150 155 160 Leu Trp Gly Ala Ala Leu Asp His Val Glu Glu Val Glu Met Val Val 165 170 175 Ala Asn Gly Asp Val Ile Arg Ala Asn Glu Asn Glu Asn Ser Asp Ile 180 185 190 Phe Trp Ala Val Lys Gly Ala Gly Ala Ser Phe Gly Val Ile Thr Glu 195 200 205 Phe Val Val Arg Thr Glu Pro Ala Pro Gly Arg Leu Val Gln Tyr Ser 210 215 220 Tyr Ser Phe Thr Thr Gly Ser Trp Lys Asp Met Ala Lys Thr Phe Lys 225 230 235 240 Ala Trp Gln Thr Tyr Val Ser Gln Pro Asp Leu Thr Arg Ser Phe Ala 245 250 255 Ser Thr Ala Thr Ile Thr Glu Leu Gly Leu Thr Ile Ser Val Thr Tyr 260 265 270 Phe Gly Thr Asp Glu Glu Phe Asp Lys Ile Asn Phe Ala Lys Asn Phe 275 280 285 Pro Gly Asn Gln Thr Pro Lys Thr Ile Val Phe Asp Asp Tyr Leu Gly 290 295 300 Ala Val Gly His Trp Ala Glu Asp Val Ala Leu Glu Ile Ile Ser Pro 305 310 315 320 Leu Pro Ala His Ser Tyr Thr Lys Thr Leu Thr Phe Asn His Cys Asn 325 330 335 Gln Ile Pro Asp Ser Val Ile Asp Arg Met Phe Lys Tyr Phe Glu Glu 340 345 350 Val Ser Lys Gly Thr Leu Val Trp Phe Ala Ile Phe Asp Leu Ala Gly 355 360 365 Gly Arg Val Asn Asp Ile Pro Gln Asp Ala Thr Ala Tyr Ala His Arg 370 375 380 Asp Ala Leu Phe Tyr Leu Gln Ser Tyr Ala Val Asn Pro Phe Gly Pro 385 390 395 400 Val Ser Asn Lys Ser Lys Gln Phe Leu Gln Gly Leu Asn Lys Val Ile 405 410 415 Arg Asp Gly Met Ala Glu Ala Gly Glu Asn Thr Asp Leu Gly Ala Tyr 420 425 430 Ala Gly Tyr Val Asp Leu Glu Leu Gly Ala Gly Ala Gln Lys Ala Tyr 435 440 445 Trp Arg Thr Asn Leu Pro Arg Leu Glu Ser Ile Lys Leu Lys Trp Asp 450 455 460 Pro Glu Asp Val Phe His Asn Pro Gln Ser Val Arg Pro Gly Gly Asn 465 470 475 480 Asp Val Ile Ser Thr Pro Lys Val Val Tyr Lys Lys Ala Gly Phe Leu 485 490 495 Ala Arg Leu Lys Gly Cys Phe Arg 500 <210> 124 <211> 474 <212> PRT <213> Aspergillus parasiticus <400> 124 Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Val Ser Ala 1 5 10 15 Leu Gly Gly Asn Ala Asp Leu Val Ala Phe Gln Asn Gln Leu Leu Tyr 20 25 30 Gln Thr Thr Ala Val His Glu Tyr Asn Leu Asn Ile Pro Val Thr Pro 35 40 45 Ala Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Ala Val Val 50 55 60 Lys Cys Ala Ser Glu Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly 65 70 75 80 His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asp Gly Ala Val Val 85 90 95 Val Asp Met Lys His Phe Asn Gln Phe Ser Met Asp Asp Gln Thr Tyr 100 105 110 Glu Ala Val Leu Gly Pro Gly Thr Thr Leu Gly Asp Val Asp Thr Glu 115 120 125 Leu Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Ile Cys Pro Thr 130 135 140 Ile Ser Thr Gly Gly His Phe Thr Met Gly Gly Leu Gly Pro Thr Ala 145 150 155 160 Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Ile 165 170 175 Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Glu 180 185 190 Val Phe Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr 195 200 205 Glu Phe Lys Val Arg Thr Gln Pro Ala Pro Gly Leu Ala Val Gln Tyr 210 215 220 Ser Tyr Thr Phe Asn Leu Gly Ser Ser Ala Lys Lys Ala Gln Phe Val 225 230 235 240 Lys Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe 245 250 255 Tyr Thr Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu 260 265 270 Phe Phe Gly Ser Lys Glu Gln Tyr Glu Ala Leu Gly Leu Glu Glu Arg 275 280 285 Phe Val Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu 290 295 300 Gly Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Arg Leu Val Gly 305 310 315 320 Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Asp 325 330 335 Thr Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Glu 340 345 350 Asn Asn Lys Ala Gly Thr Ser Thr Trp Phe Val Thr Leu Ser Leu Glu 355 360 365 Gly Gly Ala Ile Asn Asp Val Pro Ala Asp Ala Thr Ala Tyr Gly His 370 375 380 Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Val Ser Pro Thr Gly 385 390 395 400 Pro Val Ser Ser Thr Thr Tyr Asp Phe Ala Asp Gly Leu Tyr Asn Val 405 410 415 Leu Thr Lys Ala Val Pro Glu Ser Glu Gly His Ala Tyr Leu Gly Cys 420 425 430 Pro Asp Pro Lys Met Ala Asn Ala Gln Gln Lys Tyr Trp Arg Gln Asn 435 440 445 Leu Pro Arg Leu Glu Glu Leu Lys Ala Ile Leu Asp Pro Lys Asp Thr 450 455 460 Phe His Asn Pro Gln Gly Ile Leu Pro Ala 465 470 <210> 125 <211> 476 <212> PRT <213> Aspergillus fischerianus <400> 125 Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Leu Ser 1 5 10 15 Ala Val Gly Gly Asn His Ala His Val Ala Phe Gln Asp Gln Leu Leu 20 25 30 Tyr Gln Ala Thr Ala Val Glu Pro Tyr Asn Leu Asn Ile Pro Val Thr 35 40 45 Pro Ala Ala Val Thr Tyr Pro Gln Ser Ala Asp Glu Ile Ala Ala Val 50 55 60 Val Lys Cys Ala Ala Glu Tyr Gly Tyr Lys Val Gln Ala Arg Ser Gly 65 70 75 80 Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Glu Asp Gly Ala Ile 85 90 95 Val Val Glu Met Lys His Phe Asn Gln Phe Ser Met Asp Glu Ser Thr 100 105 110 Tyr Thr Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr 115 120 125 Gly Leu Tyr Asn Ala Gly His Arg Ala Met Ala His Gly Ile Cys Pro 130 135 140 Thr Ile Arg Thr Gly Gly His Leu Thr Met Gly Gly Leu Gly Pro Thr 145 150 155 160 Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val 165 170 175 Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asp Thr Gln Asn Gln 180 185 190 Asp Ile Phe Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val 195 200 205 Thr Glu Phe Lys Val Arg Thr Glu Glu Ala Pro Gly Leu Ala Val Gln 210 215 220 Tyr Ser Phe Thr Phe Asn Leu Gly Thr Ala Ala Glu Lys Ala Lys Leu 225 230 235 240 Val Lys Asp Trp Gln Ala Phe Ile Ala Gln Glu Asp Leu Thr Trp Lys 245 250 255 Phe Tyr Ser Asn Met Asn Ile Phe Asp Gly Gln Ile Ile Leu Glu Gly 260 265 270 Ile Tyr Phe Gly Ser Lys Glu Glu Tyr Asp Ala Leu Gly Leu Glu Glu 275 280 285 Arg Phe Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp 290 295 300 Leu Gly Met Val Gly His Gly Leu Glu Asp Val Ile Leu Arg Leu Val 305 310 315 320 Gly Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Ala Pro 325 330 335 Arg Ala Leu Ile Pro Asp Ser Ala Ile Asp Asp Phe Phe Ser Tyr Ile 340 345 350 His Glu Asn Asn Pro Gly Thr Val Ser Trp Phe Val Thr Leu Ser Leu 355 360 365 Glu Gly Gly Ala Ile Asn Lys Val Pro Glu Asp Ala Thr Ala Tyr Gly 370 375 380 His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Ile Asn Pro Leu 385 390 395 400 Gly Pro Val Ser Gln Thr Thr Tyr Gly Phe Ala Asp Gly Leu Tyr Asp 405 410 415 Val Leu Ala Lys Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly 420 425 430 Cys Pro Asp Pro Arg Met Pro Asn Ala Gln Gln Ala Tyr Trp Arg Ser 435 440 445 Asn Leu Pro Arg Leu Glu Glu Leu Lys Gly Glu Leu Asp Pro Lys Asp 450 455 460 Ile Phe His Asn Pro Gln Gly Val Met Val Val Ser 465 470 475 <210> 126 <211> 473 <212> PRT <213> Aspergillus neoniger <400> 126 Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala 1 5 10 15 Leu Gly Gly Asn Ser Ala Leu Ala Ala Phe Pro Asn Gln Leu Leu Trp 20 25 30 Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala 35 40 45 Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Gly Ile Val Lys 50 55 60 Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His 65 70 75 80 Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asp Gly Ala Val Val Val 85 90 95 Asp Met Lys His Phe Asn Gln Phe Ser Met Asp Asp Gln Thr Tyr Glu 100 105 110 Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu 115 120 125 Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile 130 135 140 Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg 145 150 155 160 Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu 165 170 175 Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val 180 185 190 Leu Phe Ala Val Lys Gly Ala Ala Ala Asp Phe Gly Ile Val Thr Glu 195 200 205 Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser 210 215 220 Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys 225 230 235 240 Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr 245 250 255 Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe 260 265 270 Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe 275 280 285 Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly 290 295 300 Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn 305 310 315 320 Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr 325 330 335 Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Asp Asn 340 345 350 His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly 355 360 365 Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg 370 375 380 Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Leu Gly Pro 385 390 395 400 Ile Ser Glu Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu 405 410 415 Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro 420 425 430 Asp Pro Arg Met Glu Asn Ala Pro Gln Lys Tyr Trp Arg Thr Asn Leu 435 440 445 Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe 450 455 460 His His Pro Gln Gly Val Ile Pro Ala 465 470 <210> 127 <211> 473 <212> PRT <213> Aspergillus eucalypticola <400> 127 Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala 1 5 10 15 Leu Gly Gly Asp Ser Ala Leu Ala Val Phe Pro Asn Gln Leu Leu Trp 20 25 30 Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala 35 40 45 Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Gly Ile Val Lys 50 55 60 Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His 65 70 75 80 Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asp Gly Ala Val Val Val 85 90 95 Asp Met Lys His Phe Asn Gln Phe Ser Met Asp Asp Gln Thr Tyr Glu 100 105 110 Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu 115 120 125 Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile 130 135 140 Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg 145 150 155 160 Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu 165 170 175 Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val 180 185 190 Phe Phe Ala Val Lys Gly Ala Ala Ala Asp Phe Gly Ile Val Thr Glu 195 200 205 Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser 210 215 220 Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys 225 230 235 240 Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr 245 250 255 Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe 260 265 270 Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe 275 280 285 Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly 290 295 300 Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn 305 310 315 320 Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr 325 330 335 Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Ala Asn 340 345 350 His Thr Thr Gly Thr Pro Val Trp Leu Val Thr Leu Ser Leu Glu Gly 355 360 365 Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg 370 375 380 Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Leu Gly Pro 385 390 395 400 Ile Ser Glu Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu 405 410 415 Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro 420 425 430 Asp Pro Arg Met Glu Asp Ala Pro Gln Lys Tyr Trp Arg Thr Asn Leu 435 440 445 Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe 450 455 460 His His Pro Gln Gly Val Ile Pro Ala 465 470 <210> 128 <211> 482 <212> PRT <213> Aspergillus ruber <400> 128 Met Gly Asn Lys Ala Ser Thr Thr Thr Ile Ile Thr Thr Ala Val His 1 5 10 15 Lys Cys Leu Leu Ser Ala Val Asn Gly Asn Ser Ala Gln Val Ser Val 20 25 30 Gln Asn Asp Leu Leu Tyr Gly Val Thr Ala Val His Glu Tyr Asn Leu 35 40 45 Asn Phe Pro Met Thr Pro Ala Ala Val Thr Phe Pro Glu Thr Ser Glu 50 55 60 Gln Val Ala Ala Leu Val Lys Cys Ala Ala Glu Tyr Lys Tyr Lys Val 65 70 75 80 Gln Ala Arg Ser Gly Gly His Ser Phe Gly Asn His Gly Leu Gly Gly 85 90 95 Ala Asp Gly Ala Ile Val Val Asp Met Lys His Phe Gln Gln Phe Ser 100 105 110 Met Asp Asn Glu Thr His Val Ala Thr Ile Gly Pro Gly Leu Ser Leu 115 120 125 Gly Asp Ile Asp Thr Leu Leu Tyr Asn Ala Gly Gly Arg Ala Met Ser 130 135 140 His Gly Ile Cys Pro Glu Ile Arg Ala Gly Gly His Leu Thr Ile Gly 145 150 155 160 Gly Leu Gly Leu Thr Ser Arg Gln Trp Gly Met Ser Leu Asp His Ile 165 170 175 Glu Glu Val Glu Val Val Leu Pro Asn Ser Ser Ile Val Arg Ala Ser 180 185 190 Glu Thr Glu Asn Ala Asp Leu Leu Phe Ala Val Lys Gly Ala Ala Ala 195 200 205 Ser Phe Gly Val Val Thr Glu Phe Lys Val Arg Thr Gln Leu Ala Pro 210 215 220 Lys Glu Ala Ile Gln Tyr Ser Tyr Ser Phe Lys Leu Gly Ser Ala Ala 225 230 235 240 Gln Arg Ala Arg Leu Phe Ala Asp Trp Gln Asp Leu Ala Leu Arg Arg 245 250 255 Asp Leu Ser Arg Lys Phe Thr Ser Asp Phe Ile Cys Leu Gln Asp Ser 260 265 270 Val Ile Val Lys Gly Val Phe Phe Gly Ser Lys Lys Glu Tyr Asn Ala 275 280 285 Leu Arg Ile Glu His His Leu Pro Gly Ser Asp Ser Ser Lys Val Leu 290 295 300 Val Leu Asp Asp Trp Leu Gly Ile Val Thr His Val Val Asp Asp Leu 305 310 315 320 Ala Val Arg Leu Gly Gly Ser Met Ser Thr Tyr Phe Tyr Ala Lys Ser 325 330 335 Leu Gly Phe Thr Arg Asp Thr Leu Met Pro Pro Ser Thr Ile Thr Ser 340 345 350 Leu Phe Thr Tyr Leu Asp Lys Ala Lys Lys Gly Thr Ile Thr Trp Phe 355 360 365 Val Thr Phe Ser Leu Val Gly Gly Ala Ile Asn Asp Tyr Pro Lys Asn 370 375 380 Ala Thr Ala Tyr Pro His Arg Asp Val Ile Tyr Trp Met Gln Ser Phe 385 390 395 400 Ala Ile Asn Ala Leu Gly Pro Val Leu Asn Ser Thr Tyr Asp Phe Leu 405 410 415 Asp Gly Ile Asn Glu Leu Val Ala Arg Asp Leu Pro Gly Cys Ala Gly 420 425 430 His Ala Tyr Leu Gly Cys Pro Asp Pro Arg Met Glu Gly Ala Glu Arg 435 440 445 Ala Tyr Trp Gly Ser Asn Leu Gly Arg Leu Glu Asp Met Lys Gly Val 450 455 460 Phe Asp Pro Val Asp Val Phe Trp Asn Pro Gln Gly Val Gly Val Pro 465 470 475 480 Val Ala <210> 129 <211> 473 <212> PRT <213> Aspergillus kawachii <400> 129 Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala 1 5 10 15 Leu Gly Gly Asn Ser Ala Leu Ala Val Phe Pro Asn Gln Leu Leu Trp 20 25 30 Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala 35 40 45 Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Gly Ile Val Lys 50 55 60 Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His 65 70 75 80 Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asp Gly Ala Val Val Val 85 90 95 Asp Met Lys His Phe Thr Gln Phe Ser Met Asp Asp Gln Thr Tyr Glu 100 105 110 Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu 115 120 125 Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile 130 135 140 Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg 145 150 155 160 Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu 165 170 175 Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val 180 185 190 Phe Phe Ala Val Lys Gly Ala Ala Ala Asp Phe Gly Ile Val Thr Glu 195 200 205 Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser 210 215 220 Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys 225 230 235 240 Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr 245 250 255 Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe 260 265 270 Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe 275 280 285 Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly 290 295 300 Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn 305 310 315 320 Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr 325 330 335 Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Asp Asn 340 345 350 His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly 355 360 365 Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg 370 375 380 Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Leu Gly Pro 385 390 395 400 Ile Ser Glu Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu 405 410 415 Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro 420 425 430 Asp Pro Arg Met Glu Asn Ala Pro Gln Lys Tyr Trp Arg Thr Asn Leu 435 440 445 Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe 450 455 460 His His Pro Gln Gly Val Ile Pro Ala 465 470 <210> 130 <211> 474 <212> PRT <213> Aspergillus oryzae <400> 130 Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Val Ser Ala 1 5 10 15 Leu Gly Gly Asn Ala Gly Leu Val Ala Phe Gln Asn Gln Pro Leu Tyr 20 25 30 Gln Thr Thr Ala Val His Glu Tyr Asn Leu Asn Ile Pro Val Thr Pro 35 40 45 Ala Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Ala Val Val 50 55 60 Lys Cys Ala Ser Gln Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly 65 70 75 80 His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asp Gly Ala Val Val 85 90 95 Val Asp Met Lys Tyr Phe Asn Gln Phe Ser Met Asp Asp Gln Thr Tyr 100 105 110 Glu Ala Val Ile Gly Pro Gly Thr Thr Leu Gly Asp Val Asp Val Glu 115 120 125 Leu Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr 130 135 140 Ile Ser Thr Gly Gly His Phe Thr Met Gly Gly Leu Gly Pro Thr Ala 145 150 155 160 Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val 165 170 175 Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Glu 180 185 190 Val Phe Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr 195 200 205 Glu Phe Lys Val Arg Thr Gln Pro Ala Pro Gly Ile Ala Val Gln Tyr 210 215 220 Ser Tyr Thr Phe Asn Leu Gly Ser Ser Ala Glu Lys Ala Gln Phe Ile 225 230 235 240 Lys Asp Trp Gln Ser Phe Val Ser Ala Lys Asn Leu Thr Arg Gln Phe 245 250 255 Tyr Thr Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu 260 265 270 Phe Phe Gly Ser Lys Glu Gln Tyr Glu Ala Leu Arg Leu Glu Glu Arg 275 280 285 Phe Val Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu 290 295 300 Gly Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Arg Leu Val Gly 305 310 315 320 Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Asp 325 330 335 Thr Leu Ile Pro Ser Ser Gly Ile Asp Glu Phe Phe Lys Tyr Ile Glu 340 345 350 Asn Asn Lys Ala Gly Thr Ser Thr Trp Phe Val Thr Leu Ser Leu Glu 355 360 365 Gly Gly Ala Ile Asn Asp Val Pro Ala Asp Ala Thr Ala Tyr Gly His 370 375 380 Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Val Ser Pro Thr Gly 385 390 395 400 Pro Val Ser Ser Thr Thr Tyr Asp Phe Ala Asp Gly Leu Tyr Asn Val 405 410 415 Leu Thr Lys Ala Val Pro Glu Ser Glu Gly His Ala Tyr Leu Gly Cys 420 425 430 Pro Asp Pro Lys Met Ala Asn Ala Gln Gln Lys Tyr Trp Arg Gln Asn 435 440 445 Leu Pro Arg Leu Glu Glu Leu Lys Glu Thr Leu Asp Pro Lys Asp Thr 450 455 460 Phe His Asn Pro Gln Gly Ile Leu Pro Ala 465 470 <210> 131 <211> 483 <212> PRT <213> Aspergillus flavus <400> 131 Met Asn Pro Ser Ile Pro Ser Ser Ser Met Gly Asn Thr Thr Ser Ile 1 5 10 15 Ala Gly Arg Asp Cys Leu Val Ser Ala Leu Gly Gly Asn Ala Gly Leu 20 25 30 Val Ala Phe Gln Asn Gln Pro Leu Tyr Gln Thr Thr Ala Val His Glu 35 40 45 Tyr Asn Leu Asn Thr Pro Val Thr Pro Ala Ala Ile Thr Tyr Pro Glu 50 55 60 Thr Ala Glu His Ile Ala Ala Val Val Lys Cys Ala Ser Gln Tyr Asp 65 70 75 80 Tyr Lys Val Gln Ala Arg Ser Gly Gly His Ser Phe Gly Asn Tyr Gly 85 90 95 Leu Gly Gly Thr Asp Gly Ala Val Val Val Asp Met Lys Tyr Phe Asn 100 105 110 Gln Phe Ser Met Asp Asp Gln Thr Tyr Glu Ala Val Ile Gly Pro Gly 115 120 125 Thr Thr Leu Gly Asp Val Asp Val Glu Leu Tyr Asn Asn Gly Lys Arg 130 135 140 Ala Met Ala His Gly Val Cys Pro Thr Ile Ser Thr Gly Gly His Phe 145 150 155 160 Thr Met Gly Gly Leu Gly Pro Thr Ala Arg Gln Trp Gly Leu Ala Leu 165 170 175 Asp His Val Glu Glu Val Glu Val Val Leu Ala Asn Ser Ser Ile Val 180 185 190 Arg Ala Ser Asn Thr Gln Asn Gln Glu Val Phe Phe Ala Val Lys Gly 195 200 205 Ala Ala Ala Ser Phe Gly Ile Val Thr Glu Phe Lys Val Arg Thr Gln 210 215 220 Pro Ala Pro Gly Ile Ala Val Gln Tyr Ser Tyr Thr Phe Asn Leu Gly 225 230 235 240 Ser Ser Ala Glu Lys Ala Gln Phe Ile Lys Asp Trp Gln Ser Phe Val 245 250 255 Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr Thr Asn Met Val Ile Phe 260 265 270 Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe Phe Gly Ser Lys Glu Gln 275 280 285 Tyr Glu Ala Leu Gly Leu Glu Glu Arg Phe Val Pro Lys Asn Pro Gly 290 295 300 Asn Ile Leu Val Leu Thr Asp Trp Leu Gly Met Val Gly His Ala Leu 305 310 315 320 Glu Asp Thr Ile Leu Arg Leu Val Gly Asn Thr Pro Thr Trp Phe Tyr 325 330 335 Ala Lys Ser Leu Gly Phe Thr Pro Asp Thr Leu Ile Pro Ser Ser Gly 340 345 350 Ile Asp Glu Phe Phe Glu Tyr Ile Glu Asn Asn Lys Ala Gly Thr Ser 355 360 365 Thr Trp Phe Val Thr Leu Ser Leu Glu Gly Gly Ala Ile Asn Asp Val 370 375 380 Pro Ala Asp Ala Thr Ala Tyr Gly His Arg Asp Val Leu Phe Trp Val 385 390 395 400 Gln Ile Phe Met Val Ser Pro Thr Gly Pro Val Ser Ser Thr Thr Tyr 405 410 415 Asp Phe Ala Asp Gly Leu Tyr Asn Val Leu Thr Lys Ala Val Pro Glu 420 425 430 Ser Glu Gly His Ala Tyr Leu Gly Cys Pro Asp Pro Lys Met Ala Asn 435 440 445 Ala Gln Gln Lys Tyr Trp Arg Gln Asn Leu Pro Arg Leu Glu Glu Leu 450 455 460 Lys Glu Thr Leu Asp Pro Lys Asp Thr Phe His Asn Pro Gln Gly Ile 465 470 475 480 Leu Pro Ala <210> 132 <211> 616 <212> PRT <213> Aspergillus oryzae <400> 132 Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Val Ser Ala 1 5 10 15 Leu Gly Gly Asn Ala Gly Leu Val Ala Phe Gln Asn Gln Pro Leu Tyr 20 25 30 Gln Thr Thr Ala Val His Glu Tyr Asn Leu Asn Ile Pro Val Thr Pro 35 40 45 Ala Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Ala Val Val 50 55 60 Lys Cys Ala Ser Gln Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly 65 70 75 80 His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asp Gly Ala Val Val 85 90 95 Val Asp Leu Lys Tyr Phe Asn Gln Phe Ser Met Asp Asp Gln Thr Tyr 100 105 110 Glu Ala Val Ile Gly Pro Gly Thr Thr Leu Gly Asp Val Asp Val Glu 115 120 125 Leu Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr 130 135 140 Ile Ser Thr Gly Gly His Phe Thr Met Gly Gly Leu Gly Pro Thr Ala 145 150 155 160 Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val 165 170 175 Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Glu 180 185 190 Val Phe Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr 195 200 205 Glu Phe Lys Val Arg Thr Gln Pro Ala Pro Gly Ile Ala Val Gln Tyr 210 215 220 Ser Tyr Thr Phe Asn Leu Gly Ser Ser Ala Glu Lys Ala Gln Phe Ile 225 230 235 240 Lys Asp Trp Gln Ser Phe Val Ser Ala Lys Asn Leu Thr Arg Gln Phe 245 250 255 Tyr Thr Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu 260 265 270 Phe Phe Gly Ser Lys Glu Gln Tyr Glu Ala Leu Arg Leu Glu Glu Arg 275 280 285 Phe Val Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu 290 295 300 Gly Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Arg Leu Val Gly 305 310 315 320 Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Asp 325 330 335 Thr Leu Ile Pro Ser Ser Gly Ile Asp Glu Phe Phe Glu Tyr Ile Glu 340 345 350 Asn Asn Lys Ala Gly Thr Ser Thr Trp Phe Val Thr Leu Ser Leu Glu 355 360 365 Gly Gly Ala Ile Asn Asp Val Pro Ala Asp Ala Thr Ala Tyr Gly His 370 375 380 Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Val Ser Pro Thr Gly 385 390 395 400 Pro Val Ser Ser Thr Thr Tyr Asp Phe Ala Asp Gly Leu Tyr Asn Val 405 410 415 Leu Thr Lys Val Val Pro Glu Ser Glu Gly His Ala Tyr Leu Gly Cys 420 425 430 Pro Asp Pro Lys Met Ala Asn Ala Gln Gln Lys Tyr Trp Arg Gln Asn 435 440 445 Leu Pro Arg Leu Glu Glu Leu Lys Glu Thr Leu Asp Pro Lys Asp Thr 450 455 460 Phe His Asn Pro Gln Gly Val Leu Ile Thr Glu Val Gly Ser Ala Thr 465 470 475 480 Asp Phe Trp Asn Leu Val Glu Ala Ile Ile Leu Ile Ser Gln Leu His 485 490 495 Glu Ser Val Gly Gln Thr Tyr Asn Met Val Pro Glu Met Gly Glu Gln 500 505 510 Pro Val Arg Glu Met Thr Lys Met Phe Arg Met Leu Glu Lys Thr Ile 515 520 525 Gln Val Ser Leu Glu Gly Leu Pro Tyr Glu Glu Trp Leu Asn Arg Leu 530 535 540 Gln Val Glu Asn Asp Asp Asp Pro Leu Arg Pro Leu Leu Pro Met Phe 545 550 555 560 Glu Glu Lys Val Tyr Asp Gly Arg Cys Gln Trp Glu Met Tyr Glu Asn 565 570 575 Met Pro Ile Ser Asp Thr Glu Asn Leu Arg Gln Tyr Leu Gln Asp Val 580 585 590 Pro Glu Leu Ala Thr Cys Pro Phe Leu Asp Gln Asp Ile Phe Lys Lys 595 600 605 Phe Leu Ser Ser Leu Gly Leu Ala 610 615 <210> 133 <400> 133 000 <210> 134 <211> 473 <212> PRT <213> Aspergillus awamori <400> 134 Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala 1 5 10 15 Leu Gly Gly Asn Ser Ala Leu Ala Ala Phe Pro Asn Glu Leu Leu Trp 20 25 30 Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala 35 40 45 Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Gly Val Val Lys 50 55 60 Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His 65 70 75 80 Ser Phe Gly Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val Val Val 85 90 95 Asp Met Lys His Phe Thr Gln Phe Ser Met Asp Asp Glu Thr Tyr Glu 100 105 110 Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu 115 120 125 Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile 130 135 140 Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg 145 150 155 160 Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu 165 170 175 Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val 180 185 190 Phe Phe Ala Val Lys Gly Ala Ala Ala Asn Phe Gly Ile Val Thr Glu 195 200 205 Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser 210 215 220 Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys 225 230 235 240 Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr 245 250 255 Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe 260 265 270 Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe 275 280 285 Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly 290 295 300 Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn 305 310 315 320 Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr 325 330 335 Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Ala Asn 340 345 350 His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly 355 360 365 Gly Ala Ile Asn Asp Ile Ala Glu Asp Ala Thr Ala Tyr Ala His Arg 370 375 380 Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Leu Gly Pro 385 390 395 400 Ile Ser Asp Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu 405 410 415 Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro 420 425 430 Asp Pro Arg Met Glu Asp Ala Gln Gln Lys Tyr Trp Arg Thr Asn Leu 435 440 445 Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe 450 455 460 His His Pro Gln Gly Val Met Pro Ala 465 470 <210> 135 <211> 476 <212> PRT <213> Aspergillus lentulus <400> 135 Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Leu Ser 1 5 10 15 Ala Val Gly Gly Asn His Ala His Val Ala Phe Gln Asp Gln Leu Leu 20 25 30 Tyr Gln Ala Thr Ala Val Glu Pro Tyr Asn Leu Asn Ile Pro Val Thr 35 40 45 Pro Ala Ala Val Thr Tyr Pro Gln Ser Ala Glu Glu Ile Ala Ala Val 50 55 60 Val Gln Cys Ala Ser Glu Tyr Gly Tyr Lys Val Gln Ala Arg Ser Gly 65 70 75 80 Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Glu Asp Gly Ala Ile 85 90 95 Val Val Glu Met Lys His Phe Asn Gln Phe Ser Met Asp Glu Ser Thr 100 105 110 Asn Ile Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr 115 120 125 Ala Leu Tyr Asn Ala Gly Tyr Arg Ala Met Ala His Gly Ile Cys Pro 130 135 140 Thr Ile Arg Thr Gly Gly His Leu Thr Met Gly Gly Leu Gly Pro Thr 145 150 155 160 Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val 165 170 175 Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asp Thr Gln Asn Gln 180 185 190 Asp Ile Phe Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val 195 200 205 Thr Glu Phe Lys Val Arg Thr Glu Gln Ala Pro Gly Leu Ala Val Gln 210 215 220 Tyr Ser Phe Thr Phe Asn Leu Gln Thr Pro Ala Glu Lys Ala Lys Leu 225 230 235 240 Val Lys Asp Trp Gln Ala Phe Ile Ala Gln Glu Asp Leu Thr Trp Lys 245 250 255 Phe Tyr Ser Asn Met Asn Ile Phe Asp Gly Gln Ile Ile Leu Glu Gly 260 265 270 Ile Tyr Phe Gly Ser Lys Ala Glu Tyr Asp Ala Leu Gly Leu Glu Lys 275 280 285 Arg Phe Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp 290 295 300 Leu Gly Met Val Gly His Gly Leu Glu Asp Val Ile Leu Arg Leu Val 305 310 315 320 Gly Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro 325 330 335 Arg Ala Leu Ile Pro Asp Ser Ala Ile Asp Asp Phe Phe Asn Tyr Ile 340 345 350 His Lys Asn Asn Pro Gly Thr Val Ser Trp Phe Val Thr Leu Ser Leu 355 360 365 Glu Gly Gly Ala Ile Asn Lys Val Pro Glu Asp Ala Thr Ala Tyr Gly 370 375 380 His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Ile Asn Pro Leu 385 390 395 400 Gly Pro Val Ser Gln Thr Thr Tyr Gly Phe Ala Asp Gly Leu Tyr Asp 405 410 415 Val Leu Ala Lys Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly 420 425 430 Cys Pro Asp Pro Arg Met Pro Asn Ala Gln Gln Ala Tyr Trp Arg Ser 435 440 445 Asn Leu Pro Arg Leu Glu Glu Leu Lys Gly Glu Leu Asp Pro Lys Asp 450 455 460 Val Phe His Asn Pro Gln Gly Val Met Val Val Ser 465 470 475 <210> 136 <211> 473 <212> PRT <213> Aspergillus turcosus <400> 136 Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Ile Ser 1 5 10 15 Ala Val Gly Ala Ala Asn Val Ala Phe Gln Asp Gln Leu Leu Tyr Gln 20 25 30 Ala Thr Ala Val Gln Pro Tyr Asn Leu Asn Ile Pro Val Thr Pro Ala 35 40 45 Ala Val Thr Tyr Pro Gln Ser Ala Asp Glu Ile Ala Ala Val Val Lys 50 55 60 Cys Ala Ser Glu Tyr Gly Tyr Lys Val Gln Ala Arg Ser Gly Gly His 65 70 75 80 Ser Phe Gly Asn Tyr Gly Leu Gly Gly Gln Asp Gly Ala Ile Val Ile 85 90 95 Glu Met Lys His Phe Ser Gln Phe Ser Met Asp Glu Ser Thr Phe Ile 100 105 110 Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr Asp Leu 115 120 125 Tyr Asn Ala Gly His Arg Ala Met Ala His Gly Ile Cys Pro Thr Ile 130 135 140 Arg Thr Gly Gly His Leu Thr Val Gly Gly Leu Gly Pro Thr Ala Arg 145 150 155 160 Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu 165 170 175 Ala Asn Ser Ser Ile Val Arg Ala Ser Asp Thr Gln Asn Gln Asp Leu 180 185 190 Phe Phe Ala Ile Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr Glu 195 200 205 Phe Lys Val Arg Thr Glu Gln Ala Pro Gly Met Ala Val Gln Tyr Ser 210 215 220 Tyr Thr Phe His Leu Gly Thr Ser Ala Glu Lys Ala Lys Phe Val Lys 225 230 235 240 Asp Trp Gln Ala Phe Ile Ala Gln Glu Asn Leu Thr Trp Lys Phe Tyr 245 250 255 Thr Asn Leu Val Ile Phe Asp Asp Gln Ile Ile Leu Glu Gly Ile Tyr 260 265 270 Phe Gly Thr Lys Glu Glu Tyr Asp Ser Leu Gly Leu Glu Gln Arg Phe 275 280 285 Pro Pro Thr Asp Ala Gly Thr Val Leu Ile Leu Thr Asp Trp Leu Ala 290 295 300 Met Ile Gly His Gly Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asp 305 310 315 320 Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Arg Ala 325 330 335 Leu Ile Pro Asp Ser Ala Ile Asp Glu Phe Phe Asp Tyr Ile His Glu 340 345 350 Asn Asn Pro Gly Thr Leu Ala Trp Phe Val Thr Leu Ser Leu Glu Gly 355 360 365 Gly Ala Ile Asn Ala Val Pro Glu Asp Ala Thr Ala Tyr Gly His Arg 370 375 380 Asp Val Leu Phe Trp Phe Gln Leu Phe Val Ile Asn Pro Leu Gly Pro 385 390 395 400 Ile Ser Gln Thr Thr Tyr Gly Phe Ala Asp Gly Leu Tyr Asp Val Leu 405 410 415 Ala Gln Ala Val Pro Glu Ser Val Ser His Ala Tyr Met Gly Cys Pro 420 425 430 Asp Pro Arg Leu Pro Asn Ala Gln Tyr Ala Tyr Trp Arg Ser Asn Leu 435 440 445 Pro Lys Leu Glu Glu Leu Lys Gly Ile Leu Asp Pro Glu Asp Ile Phe 450 455 460 His Asn Pro Gln Gly Val Val Pro Ser 465 470 <210> 137 <211> 496 <212> PRT <213> Aspergillus welwitschiae <400> 137 Met Leu Ser Thr Met Ala Phe Ser Phe Val Leu Arg Ile Leu Ser Pro 1 5 10 15 Leu Phe Leu Ile Leu Gln Leu Ser Thr Ala Ala Ser Thr Ser Thr Leu 20 25 30 Arg Gln Cys Leu Leu Thr Ala Val Gln Asn Asp Pro Thr Leu Val Ala 35 40 45 Val Asp Gly Asp Leu Leu Tyr Gln Thr Leu Ala Val Gln Val Tyr Asn 50 55 60 Leu Asn Trp Pro Val Thr Pro Ala Ala Val Ala Phe Pro Lys Ser Thr 65 70 75 80 Gln Gln Val Ala Ser Ile Val Asn Cys Ala Ala Ser Leu Gly Tyr Lys 85 90 95 Val Gln Ala Lys Ser Gly Gly His Ser Tyr Gly Asn Tyr Gly Leu Gly 100 105 110 Gly Thr Asn Gly Ala Ile Ser Ile Asn Leu Lys Asn Met Lys Ser Phe 115 120 125 Ser Met Asn Tyr Thr Asn Tyr Gln Ala Thr Val Gly Ala Gly Met Leu 130 135 140 Asn Gly Glu Leu Asp Glu Tyr Leu His Asn Ala Gly Gly Arg Ala Val 145 150 155 160 Ala His Gly Thr Ser Pro Gln Ile Gly Val Gly Gly His Ala Thr Ile 165 170 175 Gly Gly Leu Gly Pro Ser Ala Arg Gln Tyr Gly Met Glu Leu Asp His 180 185 190 Val Leu Glu Ala Glu Val Val Leu Ala Asn Gly Thr Val Val Arg Ala 195 200 205 Ser Ser Thr Gln Asn Ser Asp Leu Leu Phe Ala Ile Lys Gly Ala Gly 210 215 220 Ala Ser Phe Gly Val Val Thr Glu Phe Val Phe Arg Thr Glu Pro Glu 225 230 235 240 Pro Gly Ser Ala Val Gln Tyr Thr Phe Thr Phe Gly Leu Gly Ser Thr 245 250 255 Ser Ala Arg Ala Asp Leu Phe Lys Lys Trp Gln Ser Phe Ile Ser Gln 260 265 270 Pro Asp Leu Thr Arg Lys Phe Ala Ser Ile Cys Thr Leu Leu Asp His 275 280 285 Val Leu Val Ile Ser Gly Thr Phe Phe Gly Thr Lys Glu Glu Tyr Asp 290 295 300 Ala Leu Gly Leu Glu Asp Gln Phe Pro Gly His Thr Asn Ser Thr Val 305 310 315 320 Ile Val Phe Thr Asp Trp Leu Gly Leu Val Ala Gln Trp Ala Glu Gln 325 330 335 Ser Ile Leu Asp Leu Thr Gly Asp Ile Pro Ala Asp Phe Tyr Ala Arg 340 345 350 Cys Leu Ser Phe Thr Glu Lys Thr Leu Ile Pro Ser Asn Gly Val Asp 355 360 365 Gln Leu Phe Glu Tyr Leu Asp Ser Ala Asp Thr Gly Ala Leu Leu Trp 370 375 380 Phe Val Ile Phe Asp Leu Glu Gly Gly Ala Ile Asn Asp Val Pro Met 385 390 395 400 Asp Ala Thr Gly Tyr Ala His Arg Asp Thr Leu Phe Trp Leu Gln Ser 405 410 415 Tyr Ala Ile Thr Leu Gly Ser Val Ser Glu Thr Thr Tyr Asp Phe Leu 420 425 430 Asp Ser Val Asn Glu Ile Ile Arg Asn Asn Thr Pro Gly Leu Gly Asn 435 440 445 Gly Val Tyr Pro Gly Tyr Val Asp Pro Arg Leu Glu Asn Ala Arg Glu 450 455 460 Ala Tyr Trp Gly Ser Asn Leu Pro Arg Leu Met Gln Ile Lys Ser Leu 465 470 475 480 Tyr Asp Pro Thr Asp Leu Phe His Asn Pro Gln Gly Val Leu Pro Ala 485 490 495 <210> 138 <211> 473 <212> PRT <213> Aspergillus niger <400> 138 Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala 1 5 10 15 Leu Gly Gly Asn Ser Ala Leu Ala Val Phe Pro Asn Glu Leu Leu Trp 20 25 30 Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala 35 40 45 Ala Ile Thr Tyr Pro Glu Thr Ala Ala Gln Ile Ala Gly Val Val Lys 50 55 60 Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His 65 70 75 80 Ser Phe Gly Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val Val Val 85 90 95 Asp Met Lys His Phe Thr Gln Phe Ser Met Asp Asp Glu Thr Tyr Glu 100 105 110 Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu 115 120 125 Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile 130 135 140 Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg 145 150 155 160 Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu 165 170 175 Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val 180 185 190 Phe Phe Ala Val Lys Gly Ala Ala Ala Asn Phe Gly Ile Val Thr Glu 195 200 205 Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser 210 215 220 Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys 225 230 235 240 Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr 245 250 255 Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe 260 265 270 Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe 275 280 285 Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly 290 295 300 Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn 305 310 315 320 Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr 325 330 335 Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Ala Asn 340 345 350 His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly 355 360 365 Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg 370 375 380 Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Val Gly Pro 385 390 395 400 Ile Ser Asp Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu 405 410 415 Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro 420 425 430 Asp Pro Arg Met Glu Asp Ala Gln Gln Lys Tyr Trp Arg Thr Asn Leu 435 440 445 Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe 450 455 460 His His Pro Gln Gly Val Met Pro Ala 465 470 <210> 139 <211> 492 <212> PRT <213> Fusarium floridanum <400> 139 Met Arg Ser Gln Leu Leu His Gly Leu Ile Gly Leu Val Ala Leu Val 1 5 10 15 Ser Pro Ser Phe Ala Val Pro Thr Lys Arg Glu Ala Val Thr Ser Cys 20 25 30 Leu Thr Asn Ala Lys Val Pro Ile Asp Ala Lys Gly Ser Gln Thr Trp 35 40 45 Thr Gln Asp Gly Thr Ala Tyr Asn Leu Arg Leu Gln Phe Glu Pro Ile 50 55 60 Ala Ile Ala Val Pro Thr Thr Val Ala Gln Ile Ser Ala Ala Val Ala 65 70 75 80 Cys Gly Ser Lys His Gly Val Ser Val Ser Gly Lys Ser Gly Gly His 85 90 95 Ser Tyr Thr Ser Leu Gly Leu Gly Gly Glu Asp Gly His Leu Val Ile 100 105 110 Glu Leu Asp Arg Leu Tyr Ser Val Lys Leu Ala Lys Asp Gly Thr Ala 115 120 125 Lys Ile Gln Pro Gly Ala Arg Leu Gly His Val Ala Thr Glu Leu Tyr 130 135 140 Asn Gln Gly Lys Arg Ala Leu Ser His Gly Thr Cys Thr Gly Val Gly 145 150 155 160 Leu Gly Gly His Ala Leu His Gly Gly Tyr Gly Met Val Ser Arg Lys 165 170 175 His Gly Leu Thr Leu Asp Ser Ile Ile Gly Ala Thr Val Val Leu Tyr 180 185 190 Asp Gly Lys Val Val His Cys Ser Lys Thr Glu Arg Ser Asp Leu Phe 195 200 205 Trp Ala Ile Arg Gly Ala Gly Ala Ser Phe Gly Ile Val Ala Glu Leu 210 215 220 Glu Phe Asn Thr Phe Pro Ala Pro Glu Gln Met Thr Tyr Phe Asp Ile 225 230 235 240 Gly Leu Asn Trp Asp Gln Asn Thr Ala Ala Gln Gly Leu Trp Glu Phe 245 250 255 Gln Glu Phe Gly Lys Thr Met Pro Ser Glu Ile Thr Met Gln Ile Ala 260 265 270 Ile Arg Lys Asp Gly Tyr Ser Ile Asp Gly Ala Tyr Ile Gly Asp Glu 275 280 285 Ala Gly Leu Arg Lys Ala Leu Gln Pro Leu Leu Ser Lys Leu Asn Val 290 295 300 Gln Val Ser Ala Ser Thr Val Ser Trp Met Gly Leu Val Thr His Phe 305 310 315 320 Ala Gly Thr Ala Glu Ile Asn Pro Thr Ser Ala Ser Tyr Asp Ala His 325 330 335 Asp Thr Phe Tyr Ala Thr Ser Leu Thr Thr Arg Glu Leu Ser Leu Glu 340 345 350 Gln Phe Lys Ser Phe Val Asn Ser Ile Ser Thr Thr Gly Lys Ser Ser 355 360 365 Ser His Ser Trp Trp Val Gln Met Asp Ile Gln Gly Gly Lys Tyr Ser 370 375 380 Ala Val Ala Lys Pro Lys Pro Thr Asp Met Ala Tyr Val His Arg Asp 385 390 395 400 Ala Leu Leu Leu Phe Gln Phe Tyr Asp Ser Val Pro Gln Gly Gln Thr 405 410 415 Tyr Pro Ser Asp Gly Phe Ser Leu Leu Thr Thr Leu Arg Gln Ser Ile 420 425 430 Ser Lys Ser Leu Arg Ala Gly Thr Trp Gly Met Tyr Ala Asn Tyr Pro 435 440 445 Asp Ser Gln Leu Lys Ala Asp Arg Ala Ala Glu Met Tyr Trp Gly Ser 450 455 460 Asn Leu Pro Arg Leu Gln Lys Ile Lys Ala Ala Tyr Asp Pro Lys Asn 465 470 475 480 Ile Phe Arg Asn Pro Gln Ser Val Lys Pro Lys Ala 485 490 <210> 140 <211> 475 <212> PRT <213> Paecilomyces variotii <400> 140 Met Gly Asn Thr Thr Ser Thr Ser Ala Gly Gln Cys Leu Leu Ser Ala 1 5 10 15 Val Gly Gly Asn Pro Ala Leu Val Ala Phe Gln Asn Ala Pro Leu Tyr 20 25 30 Gln Ala Val Asp Val Arg Pro Tyr Asn Leu Asp Val Pro Val Thr Pro 35 40 45 Val Ala Val Thr Thr Pro Glu Thr Val Asp Gln Val Ala Ser Ile Val 50 55 60 Lys Cys Ala Ala Asp Ala Gly Tyr Lys Val Gln Pro Lys Ser Gly Gly 65 70 75 80 His Ser Tyr Gly Asn Tyr Gly Leu Gly Gly Val Asp Gly Glu Val Val 85 90 95 Val Asp Leu Lys Asn Phe Gln Gln Phe Ser Met Asn Asn Glu Thr Trp 100 105 110 Arg Ala Thr Ile Gly Ala Gly Thr Leu Leu Gly Asp Val Thr Thr Arg 115 120 125 Leu Tyr Asn Ala Gly Gly Arg Ala Met Ala His Gly Thr Cys Pro Gln 130 135 140 Val Gly Ile Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Thr Ser 145 150 155 160 Arg Leu Trp Gly Ala Ala Leu Asp His Ile Glu Glu Val Gln Val Val 165 170 175 Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Gln Thr Glu Asn Pro Asp 180 185 190 Leu Leu Phe Ala Leu Lys Gly Ala Gly Ala Ser Phe Gly Ile Ile Thr 195 200 205 Glu Phe Thr Val Arg Thr Glu Pro Ala Pro Gly Glu Ala Val Gln Tyr 210 215 220 Ser Tyr Thr Phe Asn Phe Gly Asp Asn Ala Ser Lys Ala Lys Thr Phe 225 230 235 240 Lys Asp Trp Gln Ala Phe Val Ser Thr Pro Asn Leu Asn Arg Lys Phe 245 250 255 Ala Ala Thr Met Thr Val Leu Glu Asp Ala Ile Val Ala Ser Gly Thr 260 265 270 Phe Phe Gly Thr Lys Glu Glu Phe Asp Ala Phe Glu Leu Glu Ser His 275 280 285 Phe Pro Glu Asn Gln Gly Ser Asn Val Thr Val Val Gln Asp Trp Leu 290 295 300 Gly Leu Val Ala Asp Trp Ala Glu Asp Ala Ala Leu Glu Gly Gly Gly 305 310 315 320 Gly Val Pro Ser Ala Phe Tyr Ala Lys Ser Leu Asn Phe Ser Pro Asp 325 330 335 Thr Leu Ile Pro Asn Asp Thr Ile Asp Asp Met Phe Asp Tyr Phe Ser 340 345 350 Thr Thr Glu Lys Asp Ala Leu Leu Trp Phe Ala Ile Phe Asp Leu Ser 355 360 365 Gly Gly Ala Val Ser Asp Val Pro Val His Ser Thr Ser Tyr Thr His 370 375 380 Arg Asp Thr Leu Phe Trp Leu Gln Ser Tyr Ala Ile Ser Val Gly Pro 385 390 395 400 Val Ser Asn Thr Thr Ile Gln Phe Leu Asp Gly Leu Ser Asn Leu Leu 405 410 415 Thr Ser Ser Gln Pro Glu Val His Phe Gly Ala Tyr Pro Gly Tyr Val 420 425 430 Asp Pro Lys Leu Pro Asp Gly Gln Leu Ala Tyr Trp Gly Ser Asn Leu 435 440 445 Pro Lys Leu Glu Gln Ile Lys Ala Glu Val Asp Pro Asn Asp Val Phe 450 455 460 His Asn Pro Gln Ser Val Lys Pro Ala Lys Gln 465 470 475 <210> 141 <211> 704 <212> PRT <213> Verticillium longisporum <400> 141 Met Ala Gln Pro Pro Ser Ser Ala Phe Ala Thr Cys Leu Asn Asp Val 1 5 10 15 Cys Gly Gly Arg Ser Gly Cys Val Gly Tyr Pro Ser Asp Ile Leu Tyr 20 25 30 Gln Ile Asn Trp Val Asp Arg Tyr Asn Leu Asp Ile Asn Leu Glu Pro 35 40 45 Ala Ala Val Thr Lys Pro Glu Ile Thr Glu Asp Val Ala Ala Phe Ile 50 55 60 Lys Cys Ala Ser Glu Asn Asn Val Lys Val Gln Ala Arg Ser Gly Gly 65 70 75 80 His Ser Tyr Ala Asn His Gly Leu Gly Gly Glu Asp Gly Ala Leu Val 85 90 95 Ile Asp Leu Glu Asn Phe Gln His Phe Ser Met Asn Trp Asp Asn Trp 100 105 110 Gln Ala Thr Ile Gly Ala Gly His Lys Leu His Asp Val Thr Glu Lys 115 120 125 Leu His Asp Asn Gly Gly Arg Ala Ile Ser His Gly Thr Cys Pro Gly 130 135 140 Val Gly Leu Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Ser Ser 145 150 155 160 Arg Met Trp Gly Ser Cys Leu Asp His Val Val Glu Val Glu Val Val 165 170 175 Thr Ala Asp Gly Lys Ile Gln Arg Ala Ser Glu Asp Glu Asn Ser Asp 180 185 190 Leu Phe Phe Ala Leu Lys Gly Ala Gly Ala Ser Phe Gly Ile Ile Thr 195 200 205 Glu Phe Val Met Arg Thr Asn Glu Glu Pro Gly Asp Val Val Glu Tyr 210 215 220 Thr Phe Ser Leu Thr Phe Ser Arg His Arg Asp Leu Ser Pro Val Phe 225 230 235 240 Glu Ala Trp Gln Asn Leu Ile Ser Asp Pro Asp Leu Asp Arg Arg Phe 245 250 255 Gly Ser Glu Phe Val Met His Glu Leu Gly Ala Ile Ile Thr Gly Thr 260 265 270 Phe Phe Gly Thr Glu Glu Glu Phe Glu Ala Thr Gly Ile Pro Asp Arg 275 280 285 Ile Pro Thr Gly Lys Lys Ser Ile Val Val Asn Asp Trp Leu Gly Ser 290 295 300 Val Ala Gln Gln Ala Gln Asp Ala Ala Leu Trp Leu Ser Asp Leu Ser 305 310 315 320 Thr Ala Phe Thr Ala Lys Ser Leu Ala Phe Thr Lys Asp Gln Leu Leu 325 330 335 Ser Ser Glu Ser Ile Met Asp Leu Met Asp Tyr Ile Asp Asp Ala Asn 340 345 350 Arg Gly Thr Leu Ile Trp Phe Leu Ile Phe Asp Val Thr Gly Gly Arg 355 360 365 Ile Asn Asp Val Pro Met Asn Ala Thr Ala Tyr Arg His Arg Asp Lys 370 375 380 Val Met Phe Cys Gln Gly Tyr Gly Ile Gly Ile Pro Thr Leu Asn Gly 385 390 395 400 Arg Thr Arg Glu Phe Ile Glu Gly Ile Asn Ser Leu Ile Arg Ser Ser 405 410 415 Val Pro Thr Asn Leu Ser Thr Tyr Ala Gly Tyr Val Asp Ala Ser Leu 420 425 430 Glu Ser Pro Gln Asp Ser Tyr Trp Gly Pro Asn Leu Asp Ala Leu Gly 435 440 445 Gln Val Lys Glu Asp Trp Asp Pro Ser Asp Leu Phe Ser Asn Pro Gln 450 455 460 Ser Val Arg Pro Gly Gln Lys Ser Val Val Asp Tyr Phe Asp Asn Arg 465 470 475 480 Ala Ser Ser Asn Gly Ser Glu Asp Ser Ser Gly Gly Ser Asn Gly Gly 485 490 495 Thr Arg Asp Glu Gln Gly Gly Cys Trp Ser Trp Arg Arg Ser Gly Pro 500 505 510 Ala Phe Ala Val Phe Val Ala Leu Phe Val Gly Phe Pro Thr Pro Gln 515 520 525 Thr Ser Trp Val Gln Lys Gln Asn Leu Arg Asp Pro Ala Leu Asp Leu 530 535 540 Thr Asp Ala Glu Ser Pro Ser Arg Thr Pro Val Val Asn Pro Asn Thr 545 550 555 560 Leu Thr Thr Asp Thr Met Ala Lys Leu Ser Arg Gly Ala Pro Gly Gly 565 570 575 Lys Leu Lys Met Thr Leu Gly Leu Pro Val Gly Ala Val Met Asn Cys 580 585 590 Ala Asp Asn Ser Gly Ala Arg Asn Leu Tyr Ile Ile Ser Val Lys Gly 595 600 605 Ile Gly Ala Arg Leu Asn Arg Leu Pro Ala Gly Gly Val Gly Asp Met 610 615 620 Val Met Ala Thr Val Lys Lys Gly Lys Pro Glu Leu Arg Lys Lys Val 625 630 635 640 His Pro Ala Val Ile Val Arg Gln Ser Lys Pro Trp Lys Arg Phe Asp 645 650 655 Gly Val Phe Leu Tyr Phe Glu Asp Asn Ala Gly Val Ile Val Asn Pro 660 665 670 Lys Gly Glu Met Lys Gly Ser Ala Ile Thr Gly Pro Val Gly Lys Glu 675 680 685 Ala Ala Glu Leu Trp Pro Arg Ile Ala Ser Asn Ser Gly Val Val Met 690 695 700 <210> 142 <211> 486 <212> PRT <213> Penicillium antarcticum <400> 142 Met Gly Asn Ser Ala Ser Val Ala Gly Arg Ala Cys Phe Val Ala Ala 1 5 10 15 Val Gly His Asp Pro Asn Leu Val Thr Phe Arg Gly Asp Leu Leu Tyr 20 25 30 Glu Phe Arg Ile Gln Pro Ser Tyr Asn Leu Ala Ile Pro Val His Pro 35 40 45 Thr Val Val Thr Tyr Pro Lys Thr Thr Ala Gln Val Ala Glu Ile Val 50 55 60 Ser Cys Ala Ala Ala Gln Asn Tyr Lys Met Gln Ala Tyr Ser Gly Gly 65 70 75 80 His Ser Tyr Gly Asn Tyr Gly Leu Gly Gly Glu Asp Gly His Val Val 85 90 95 Val Asp Leu Lys Asn Phe Gln Asp Phe Thr Met Asp Pro Asp Thr His 100 105 110 Val Ala Thr Ile Gly Ala Gly Thr Ser Leu Gly Asp Leu Gln Asp Arg 115 120 125 Leu Trp His Ala Gly Gly Arg Ala Met Ala His Gly Ser Cys Pro Gln 130 135 140 Val Gly Val Gly Gly His Phe Thr Ile Gly Gly Leu Gly Met Met Ser 145 150 155 160 Arg Gln Trp Gly Met Ser Leu Asp His Val Val Glu Ala Gln Val Val 165 170 175 Leu Ala Asn Ser Ser Val Val Thr Ala Ser Asp Thr Gln Asn Gln Asp 180 185 190 Ile Phe Trp Ala Ile Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr 195 200 205 Lys Phe Lys Val Arg Thr His Gly Val Pro Lys Ala Ala Ile Gln Tyr 210 215 220 Gln Tyr Thr Phe Ser Gln Gly Asp Val Leu Asp Lys Val Lys Leu Phe 225 230 235 240 Met Ala Trp Gln Asn Ile Val Ala Lys Pro Asn Leu Thr Arg Asn Phe 245 250 255 Ser Thr Glu Leu Thr Ile Phe Gln Asp Gly Ile Met Ile Met Gly Ser 260 265 270 Phe Phe Gly Thr Arg Asp Glu Phe His Lys Phe Glu Leu Glu Asn Asp 275 280 285 Leu Pro Leu Gln Gly Leu Gly Asn Val Ala Tyr Ile Thr Asn Trp Leu 290 295 300 Ser Leu Val Ala His Thr Ala Glu Asp Tyr Leu Leu Arg Leu Thr Gly 305 310 315 320 Asn Val Leu Thr Ser Phe Tyr Ala Lys Ser Leu Ser Phe Thr Ala Asp 325 330 335 Glu Leu Phe Asn Glu Gln Gly Leu Val Thr Leu Phe Thr Tyr Leu Asp 340 345 350 Ala Ala Pro Lys Gly Thr Pro Thr Trp Trp Val Ile Phe Asp Leu Glu 355 360 365 Gly Gly Ala Thr Asn Asp Val Pro Val Asn Ala Thr Ser Tyr Ala His 370 375 380 Arg Asp Ala Ile Met Trp Met Gln Ser Tyr Ala Val Ala Gly Phe Glu 385 390 395 400 Pro Pro Gly Phe Ile Ile Lys Arg Phe Leu Asn Arg Leu His Gly Val 405 410 415 Val Ile Gly Asn Arg Ala Pro Gly Ala Val Arg Ser Tyr Pro Gly Tyr 420 425 430 Val Asp Pro Tyr Leu Arg Asn Ala Gln Glu Thr Tyr Trp Gly Pro Asn 435 440 445 Leu Ala Arg Leu Gln Asp Ile Lys Thr Ala Val Asp Pro Asp Asp Val 450 455 460 Phe His Asn Pro Gln Ser Val Lys Val Asn Ser Leu Ser Pro Pro Asp 465 470 475 480 Pro Gly Ser His Asp Val 485 <210> 143 <211> 473 <212> PRT <213> Unknown <220> <223> Monosporascus sp. mg162 <400> 143 Met Gly Gln Thr Pro Ser Ser Pro Leu Ala Asp Cys Leu Asn Ala Val 1 5 10 15 Cys Asn Gly Arg Asp Asn Cys Val Ala Phe Pro Ser Ala Pro Leu Tyr 20 25 30 Gln Ile Ser Trp Val Asp Arg Tyr Asn Leu Asp Ile Glu Val Glu Pro 35 40 45 Ile Ala Val Thr Arg Pro Glu Thr Ala Glu Asp Val Ser Gly Phe Val 50 55 60 Lys Cys Ala Ala Ala His Asn Ile Lys Val Gln Ala Lys Ser Gly Gly 65 70 75 80 His Ser Tyr Ala Asn Tyr Gly Leu Gly Gly Glu Asp Gly Glu Leu Val 85 90 95 Val Asp Leu Arg Asn Phe Gln Asp Phe Ser Ile Asp Thr Asn Thr Trp 100 105 110 Gln Ala Thr Phe Gly Ala Gly His Lys Leu Asp Asp Val Thr Glu Lys 115 120 125 Leu His Lys Asn Gly Lys Arg Ala Ile Ser His Gly Thr Cys Pro Gly 130 135 140 Val Gly Ile Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Glu Ser 145 150 155 160 Arg Met Trp Gly Ser Cys Leu Asp His Val Ile Gly Val Glu Val Val 165 170 175 Thr Ala Asp Gly Ser Ile Val His Ala Ser Asp Thr Glu Asn Ser Asp 180 185 190 Leu Phe Phe Ala Leu Lys Gly Ala Gly Ala Ser Phe Gly Ile Val Thr 195 200 205 Ser Phe Val Val Lys Thr Arg Pro Glu Pro Gly Ser Val Val Gln Tyr 210 215 220 Ser Tyr Ser Val Thr Phe Ala Lys His Ala Asp Leu Ser Pro Val Phe 225 230 235 240 Arg Gln Trp Gln Glu Leu Val Met Asp Pro Gly Leu Asp Arg Arg Phe 245 250 255 Gly Thr Glu Phe Thr Met His Glu Leu Gly Val Ile Ile Ser Gly Thr 260 265 270 Phe Tyr Gly Thr Asp Glu Glu Phe Gln Ala Thr Gly Ile Pro Asp Arg 275 280 285 Ile Pro Lys Gly Lys Ile Ser Val Val Phe Asp Asp Trp Met Ala Val 290 295 300 Ile Ala Lys His Ala Glu Glu Ala Ala Leu Ser Leu Ser Ser Ile Ser 305 310 315 320 Ser Ala Phe Thr Ala Arg Ser Leu Ala Phe Arg Arg Glu Asp Lys Ile 325 330 335 Ser Pro Glu Thr Ile Thr Asn Leu Met Asn Tyr Ile Asp Ser Ala Asp 340 345 350 Arg Gly Thr Leu Val Trp Phe Leu Ile Phe Asp Ala Thr Gly Gly Ala 355 360 365 Ile Ser Asp Val Pro Thr Asn Ala Thr Ala Tyr Ser His Arg Asp Lys 370 375 380 Val Met Tyr Cys Gln Gly Tyr Gly Val Gly Ile Pro Thr Leu Asn Gln 385 390 395 400 Gln Thr Lys Asp Phe Leu Ser Gly Ile Ile Asn Thr Ile Gln Ser Gly 405 410 415 Ala Gly Asn Thr Leu Thr Thr Tyr Pro Gly Tyr Val Asp Pro Ala Leu 420 425 430 Thr Asn Pro Gln Glu Ser Tyr Trp Gly Pro Asn Ile Asp Thr Leu Arg 435 440 445 Ala Ile Lys Ser Gln Trp Asp Pro Asn Asp Ile Phe His Asn Pro Gln 450 455 460 Ser Val Arg Pro Ala Ala Val Ala Ala 465 470 <210> 144 <211> 506 <212> PRT <213> Amanita muscaria <400> 144 Met Leu Lys Thr Ile Ala Ala Val Val Phe Ile Cys Ser Gln Ala Phe 1 5 10 15 Leu Val Arg Ala Asp Leu Lys Ser Glu Leu Thr Ala Leu Gly Val Gly 20 25 30 Ala Val Phe Pro Gly Asp Ser Val Tyr Thr Ser Asp Ala Lys Pro Tyr 35 40 45 Asn Leu Arg Phe Asp Phe Lys Pro Ala Ala Ile Thr Phe Pro Asn Thr 50 55 60 Pro Ala Asp Val Ser Gln Ile Val Gln Ile Ala Gly Lys Tyr Ala His 65 70 75 80 Lys Val Ala Pro Arg Gly Gly Gly His Ser Tyr Ile Ser Asn Gly Val 85 90 95 Gly Gly Met Asp Asn Ser Ile Ile Ala Asp Met Ser His Phe Lys Ser 100 105 110 Ile Val Val His Thr Asn Asn Asp Thr Ala Thr Ile Glu Thr Gly Asn 115 120 125 Arg Leu Gly Asp Ile Ala Leu Ala Leu Phe Gln Tyr Gly Arg Gly Met 130 135 140 Pro His Gly Ala Cys Pro Tyr Val Gly Ile Gly Gly His Ala Asn Phe 145 150 155 160 Gly Gly Phe Gly Phe Ile Ser Arg Ser Trp Gly Leu Thr Leu Asp Val 165 170 175 Val Glu Ala Ile Asp Leu Val Leu Ala Asn Gly Thr Ile Thr Thr Val 180 185 190 Ser Ala Thr Gln Asn Pro Asp Leu Tyr Trp Ala Met Arg Gly Ser Gly 195 200 205 Ser Ser Phe Gly Ile Thr Thr Ala Ile His Val Arg Thr Phe Ser Ala 210 215 220 Pro Ala Ser Gly Ile Ile Ala Leu Asp Thr Trp Tyr Leu Asn Leu Glu 225 230 235 240 Gln Ala Val Arg Ala Leu Ser Ser Phe Gln Asp Phe Ala His Asn Thr 245 250 255 Val Thr Leu Pro Ser Tyr Phe Gly Gly Glu Phe Val Val Asn Ala Gly 260 265 270 Pro Ser Pro Gly Leu Leu Ser Ile Thr Phe Phe Ser Gly Phe Trp Gly 275 280 285 Pro Pro Asn Gln Tyr Asn Ser Thr Leu Ala Pro Trp Lys Asn Ser Met 290 295 300 Pro Phe Pro Pro Asn Thr Thr Ser Tyr Ser Gln Gly Asn Tyr Ile Glu 305 310 315 320 Ser Leu Ser Ala Arg Phe Gly Gly Ala Pro Leu Asp Thr Ser Leu Gly 325 330 335 Pro Asp Asn Thr Asp Thr Phe Tyr Val Lys Ser Leu Ile Val Pro Gln 340 345 350 Val Thr Ile Ser Asp Glu Gly Ala Gln Val Gly Ile Ser Asp Lys Ala 355 360 365 Trp Arg Ala Leu Phe Gln Tyr Leu Ile Asn Glu Gln Pro Asn Leu Pro 370 375 380 Val Asp Trp Phe Ile Glu Val Glu Leu Trp Gly Gly Gln Asn Ser Ala 385 390 395 400 Ile Asn Ala Val Pro Gln Ala Ser Thr Ala Phe Ala Tyr Arg Asp Leu 405 410 415 Leu Trp Thr Leu Gln Met Tyr Ser Tyr Thr Pro Asn His Gln Pro Pro 420 425 430 Tyr Pro Asp Ala Gly Phe Ala Phe Asn Asp Gly Met Ala Asn Ser Ile 435 440 445 Ile His Asn Met Pro Asn Gly Trp Asn Tyr Gly Ala Tyr Thr Asn Tyr 450 455 460 Val Asp Asn Arg Leu Asp Asp Trp Gln Arg Leu Tyr Tyr Ala Asn His 465 470 475 480 Tyr Pro Ala Leu Gln Ala Leu Lys Ser Arg Tyr Asp Pro Ser Asp Thr 485 490 495 Phe Ser Phe Pro Thr Ser Ile Glu Leu Leu 500 505 <210> 145 <211> 988 <212> PRT <213> Aspergillus niger <400> 145 Met Thr Thr Asn Gly Ile Gln Pro Gly His Val Gly Asn Leu Thr Gln 1 5 10 15 Asp Gln Glu Ala Lys Leu Gln Gln Leu Trp Ser Ile Val Leu Thr Leu 20 25 30 Leu Asp Val Lys Ser Leu Gln Gly Gly Asp Thr Ser Ala Gln Thr Gln 35 40 45 Pro Asp Gln Arg Pro Ser Thr Ser Leu Ser Arg Ala Asp Thr Val Val 50 55 60 Ser Ala His Gly Gln Thr Ala Phe Thr Glu Asp Leu Ser Gln Val Leu 65 70 75 80 Arg Glu Asn Gly Met Ser Asn Pro Asp Ile Lys Ser Val Arg Glu Ser 85 90 95 Leu Ser Asn Thr Ser Ile Asp Glu Leu Arg Ser Gly Leu Leu Tyr Thr 100 105 110 Ala Lys His Asp Ser Pro Asp Val Leu Leu Leu Arg Phe Leu Arg Ala 115 120 125 Arg Lys Trp Asp Val Gly Lys Ala Phe Gly Met Met Leu Arg Ala Leu 130 135 140 Val Trp Arg Lys Asp Gln His Val Asp Asp Lys Val Ile Ala Asn Pro 145 150 155 160 Glu Leu Ala Ala Leu Val Thr Ser Gln Asn Thr Val Asp Thr His Ala 165 170 175 Ala Lys Glu Cys Lys Asp Phe Leu Asp Gln Met Arg Met Gly Lys Cys 180 185 190 Tyr Met His Gly Thr Asp Arg Asp Gly Arg Pro Val Leu Val Val Arg 195 200 205 Val Arg Phe His Gln Pro Ser Lys Gln Ser Glu Ala Val Ile Asn Arg 210 215 220 Phe Ile Leu His Thr Ile Glu Thr Ala Arg Leu Leu Leu Ala Pro Pro 225 230 235 240 Gln Glu Thr Val Thr Ile Ile Phe Asp Met Thr Gly Phe Gly Leu Ser 245 250 255 Asn Met Glu Tyr Ala Pro Val Lys Phe Ile Ile Glu Cys Phe Gln Glu 260 265 270 Asn Tyr Pro Glu Ser Leu Gly Tyr Met Leu Ile His Asn Ala Pro Trp 275 280 285 Val Phe Ser Gly Ile Trp Lys Ile Ile Lys Gly Trp Met Asp Pro Val 290 295 300 Ile Val Ser Lys Val Asn Phe Thr Asn Lys Val Ser Asp Leu Glu Lys 305 310 315 320 Phe Ile Ala Pro Glu Gln Ile Val Lys Glu Leu Lys Gly Lys Glu Asp 325 330 335 Trp Thr Tyr Glu Tyr Val Glu Pro Val Ala Gly Glu Asn Glu Leu Met 340 345 350 Ala Asp Thr Glu Thr Arg Asp Arg Ile Tyr Ala Glu Arg Leu Lys Ile 355 360 365 Gly Glu Glu Leu Leu Leu Arg Thr Ser Glu Trp Val Ser Thr Ser Gln 370 375 380 Arg Lys Asp Ala Ala Ala Thr Thr Thr Ala Arg Glu Gln Arg Ser Glu 385 390 395 400 Thr Ile Glu Ser Leu Arg Gln Asn Tyr Trp Gln Leu Asp Pro Tyr Val 405 410 415 Arg Gly Arg Thr Phe Leu Asp Arg Thr Gly Val Val Lys Pro Gly Gly 420 425 430 Lys Ile Asp Phe Tyr Pro Ser Pro Asp Leu Glu Pro Ser Thr Ala Lys 435 440 445 Met Leu Glu Val Glu His Phe Glu Arg Thr Gln Phe Asp Pro Tyr Leu 450 455 460 Phe Leu Leu Pro His Gly Ala Arg Ile Ala Val Arg His Cys Ser Val 465 470 475 480 Thr Ala Leu Pro Thr Tyr Leu Lys Ala His Pro Arg Gly Met Leu Ser 485 490 495 Thr Met Ala Phe Ser Phe Leu Arg Val Leu Ser Ser Leu Leu Leu Val 500 505 510 Leu Gln Leu Ser Thr Ala Ala Ser Thr Ser Thr Leu Arg Gln Cys Leu 515 520 525 Leu Thr Ala Val Gln Asn Asp Pro Thr Leu Val Ala Val Asp Gly Asp 530 535 540 Leu Leu Phe Gln Thr Leu Ala Val Gln Val Tyr Asn Leu Asn Trp Pro 545 550 555 560 Val Thr Pro Ala Ala Val Ala Phe Pro Lys Ser Ala Gln Gln Val Ser 565 570 575 Ser Ile Val Asn Cys Ala Ala Ser Leu Gly Tyr Lys Val Gln Ala Lys 580 585 590 Ser Gly Gly His Ser Tyr Gly Asn Tyr Gly Leu Gly Gly Thr Asn Gly 595 600 605 Ala Ile Ser Ile Asn Leu Lys Asn Met Lys Ser Phe Ser Met Asn Tyr 610 615 620 Thr Asn Tyr Gln Ala Thr Val Gly Ala Gly Met Leu Asn Gly Glu Leu 625 630 635 640 Asp Asp Tyr Leu His Asn Ala Gly Gly Arg Ala Ile Ala His Gly Thr 645 650 655 Ser Pro Gln Ile Gly Val Gly Gly His Ala Thr Ile Gly Gly Leu Gly 660 665 670 Pro Ala Ala Arg Gln Tyr Gly Met Glu Leu Asp His Val Leu Glu Ala 675 680 685 Glu Val Val Leu Ala Asn Gly Thr Val Val Arg Ala Ser Ser Thr Gln 690 695 700 Asn Ser Asp Leu Leu Phe Ala Ile Lys Gly Ala Gly Ala Ser Phe Gly 705 710 715 720 Val Val Thr Glu Phe Val Phe Arg Thr Glu Pro Glu Pro Gly Ser Ala 725 730 735 Val Gln Tyr Ser Phe Thr Phe Gly Leu Gly Ser Thr Ser Ser Arg Ala 740 745 750 Asp Leu Phe Lys Lys Trp Gln Ser Phe Ile Ser Gln Pro Asp Leu Thr 755 760 765 Arg Lys Phe Ala Ser Ile Cys Thr Ile Leu Asp His Val Leu Val Ile 770 775 780 Ser Gly Thr Phe Phe Gly Thr Lys Ala Glu Tyr Asp Ala Leu Gly Leu 785 790 795 800 Glu Asp Gln Phe Pro Gly His Thr Asn Ser Thr Val Ile Val Phe Thr 805 810 815 Asp Trp Leu Gly Leu Val Ala Gln Trp Ala Glu Gln Ser Ile Leu Asp 820 825 830 Leu Thr Gly Gly Ile Pro Ala Asp Phe Tyr Ser Arg Cys Leu Ser Phe 835 840 845 Thr Glu Lys Thr Pro Ile Pro Ser Thr Gly Val Asp Gln Leu Phe Glu 850 855 860 Tyr Leu Asp Ser Ala Asp Thr Gly Ala Leu Leu Trp Phe Val Ile Phe 865 870 875 880 Asp Leu Glu Gly Gly Ala Ile Asn Asp Val Pro Met Asp Ala Thr Gly 885 890 895 Tyr Ala His Arg Asp Thr Leu Phe Trp Leu Gln Ser Tyr Ala Ile Thr 900 905 910 Leu Gly Ser Val Ser Gln Thr Thr Tyr Asp Phe Leu Asp Arg Val Asn 915 920 925 Glu Ile Ile Arg Asn Asn Thr Pro Gly Leu Gly Asn Gly Val Tyr Pro 930 935 940 Gly Tyr Val Asp Pro Arg Leu Gln Asn Ala Arg Glu Ala Tyr Trp Gly 945 950 955 960 Ser Asn Leu Pro Arg Leu Met Gln Ile Lys Ser Leu Tyr Asp Pro Ser 965 970 975 Asp Leu Phe His Asn Pro Gln Gly Val Leu Pro Ala 980 985 <210> 146 <211> 479 <212> PRT <213> Venturia effusa <400> 146 Met Gly Gln Gly Gln Ser Ser Ala Gly Gly Leu Gln Asp Cys Leu Thr 1 5 10 15 Ser Ala Val Gly Ser Gly Asn Leu Ala Val Pro Ser Lys Pro Phe Tyr 20 25 30 Gln Gln Thr Asp Val Lys Pro Tyr Asn Leu Asp Ile His Val His Pro 35 40 45 Val Ala Val Thr Tyr Pro Gln Thr Asn Glu Asp Val Ala Ala Ile Val 50 55 60 Arg Cys Ala Lys Glu His Glu Ala Lys Val Gln Pro Arg Ser Gly Gly 65 70 75 80 His Ser Tyr Gly Asn Phe Ala Thr Gly Asn Gly Asn Asp Asn Met Ile 85 90 95 Val Val Asp Leu Lys His Phe Lys Gln Phe Ser Met Asp Asp Asn Thr 100 105 110 Trp Ile Ala Thr Leu Gly Ser Gly His Leu Leu Gly Asp Val Thr Lys 115 120 125 Lys Leu Leu Ala Asn Gly Gly Arg Ala Met Ala His Gly Thr Cys Pro 130 135 140 Gln Val Gly Ile Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Met 145 150 155 160 Ser Arg Met Trp Gly Ser Ser Leu Asp His Val Gln Glu Ile Thr Val 165 170 175 Val Leu Ala Asn Ser Ser Ile Ile Thr Ala Ser Pro Thr Gln Asn Lys 180 185 190 Asp Val Phe Trp Ala Met Lys Gly Ala Gly Ala Ser Phe Gly Ile Ile 195 200 205 Thr Glu Phe Lys Val Ile Thr His Pro Ala Pro Gly Glu Ala Val Lys 210 215 220 Tyr Ser Phe Gly Phe Ser Gly Gly Ser His Arg Asp Gln Ala Lys Arg 225 230 235 240 Phe Lys Lys Trp Gln Ser Met Ile Ala Asp Pro Gly Leu Ser Arg Lys 245 250 255 Leu Ala Ser Gln Val Val Leu Ser Glu Ile Gly Met Ile Ile Ser Gly 260 265 270 Thr Phe Phe Gly Thr Gln Ala Glu Tyr Asn Gln Leu Asn Leu Thr Ser 275 280 285 Val Phe Pro Glu Met Ser Ser His Lys Ile Ile Val Phe Asn Asp Trp 290 295 300 Ala Gly Leu Val Gly His Trp Ala Glu Asp Val Gly Leu Gln Leu Gly 305 310 315 320 Gly Gly Ile Ser Ser Pro Phe Tyr Ser Lys Ser Leu Ala Phe Thr Pro 325 330 335 Asn Asp Leu Ile Pro Ala Glu Gly Ile Asp Arg Phe Phe Glu Tyr Leu 340 345 350 Asp Glu Val Asp Lys Gly Thr Leu Ile Trp Phe Gly Ile Phe Asp Leu 355 360 365 Glu Gly Gly Ala Thr Asn Asp Ile Pro Ala Asp Ala Thr Ala Tyr Gly 370 375 380 His Arg Asp Ala Leu Phe Tyr Phe Gln Ser Tyr Gly Val Asn Leu Gly 385 390 395 400 Leu Lys Val Lys Asp Glu Thr Arg Asp Phe Ile Asn Gly Met Asn Ser 405 410 415 Val Leu Glu Gly Ser Leu Ser Asn His Lys Leu Gly Ala Tyr Ala Gly 420 425 430 Tyr Val Asp Pro Ala Leu Ser Leu Glu Ala Ala Gln Val Gly Tyr Trp 435 440 445 Gly Asp Asn Leu Pro Arg Leu Arg Gln Ile Lys Arg Ala Val Asp Pro 450 455 460 Asp Asp Val Phe His Asn Leu Gln Ser Val Arg Pro Ala Ala Ser 465 470 475 <210> 147 <211> 472 <212> PRT <213> Lecanicillium lecanii <400> 147 Met Gly Asn Lys Pro Ser Thr Pro Leu Ala His Cys Leu Arg Asp Val 1 5 10 15 Cys Ala Gly Arg Gly Asn Cys Val Ala Phe Pro Asn Glu Tyr Leu Tyr 20 25 30 Gln Ala Asn Trp Val Lys Pro Tyr Asn Leu Asp Val Pro Val Lys Pro 35 40 45 Ile Ala Val Phe Arg Pro Asp Asn Ala Ala Asp Val Ala Ala Ala Val 50 55 60 Lys Cys Ala Gly Gln Ser Ser Val His Val Gln Ala Lys Ser Gly Gly 65 70 75 80 His Ser Tyr Ala Asn Phe Gly Leu Gly Gly Gly Asp Gly Gly Leu Met 85 90 95 Ile Asp Leu Gln His Leu Asn Lys Phe Ser Met Asn Asn Glu Thr Trp 100 105 110 Gln Ala Thr Phe Gly Ser Gly Phe Leu Leu Gly Asp Leu Asp Lys Gln 115 120 125 Leu His Ala Asn Gly Asn Arg Ala Met Ala His Gly Thr Cys Pro Gly 130 135 140 Val Gly Ile Gly Gly His Ala Thr Ile Gly Gly Ile Gly Pro Ser Ser 145 150 155 160 Arg Met Trp Gly Thr Ala Leu Asp His Val Leu Glu Val Glu Val Val 165 170 175 Thr Ala Asp Gly Lys Ile Gln Arg Ala Ser Lys Thr Gln Asn Ser Asp 180 185 190 Leu Phe Trp Gly Leu Gln Gly Ala Gly Ala Ser Phe Gly Ile Ile Thr 195 200 205 Glu Phe Val Val Arg Thr Glu Pro Glu Pro Gly Ser Val Val Glu Tyr 210 215 220 Ala Tyr Ser Leu Asn Phe Gly Lys Gln Ala Asp Met Ala Pro Val Tyr 225 230 235 240 Lys Lys Trp Gln Asp Leu Val Gly Asp Pro Asn Leu Asp Arg Arg Phe 245 250 255 Thr Ser Leu Phe Ile Ala Glu Pro Leu Gly Val Leu Ile Thr Gly Thr 260 265 270 Phe Tyr Gly Thr Leu Asp Glu Tyr Lys Ala Ser Gly Ile Pro Asp Lys 275 280 285 Leu Pro Ala Ser Gly Ala Ser Ile Thr Val Met Asp Trp Leu Gly Ser 290 295 300 Leu Ala His Ile Ala Glu Lys Thr Gly Leu Tyr Leu Ser Asn Val Ser 305 310 315 320 Thr Lys Phe Val Ser Arg Ser Leu Ala Leu Arg Glu Glu Asp Leu Leu 325 330 335 Ser Glu Gln Ser Ile Asp Asp Leu Phe Lys Tyr Met Gly Ser Ala Asp 340 345 350 Ala Asp Thr Pro Leu Trp Phe Val Ile Phe Asp Asn Glu Gly Gly Ala 355 360 365 Ile Ala Asp Val Pro Asp Asn Ser Thr Ala Tyr Pro His Arg Asp Lys 370 375 380 Ile Ile Leu Tyr Gln Ser Tyr Ser Val Gly Leu Leu Gly Val Ser Asp 385 390 395 400 Lys Met Ile Asn Phe Val Asp Gly Ile Gln Asp Leu Val Gln Lys Gly 405 410 415 Ala Pro Asn Ala His Thr Thr Tyr Ala Gly Tyr Ile Asn Ala Asn Leu 420 425 430 Asp Arg Asn Ala Ala Gln Lys Phe Tyr Trp Gly Asp Lys Leu Pro Gln 435 440 445 Leu Gln Gln Leu Lys Lys Lys Phe Asp Pro Thr Ser Leu Phe Ser Asn 450 455 460 Pro Gln Ser Ile Asp Pro Ala Asp 465 470 <210> 148 <211> 474 <212> PRT <213> Penicillium chrysogenum <400> 148 Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Val Ser 1 5 10 15 Ala Val Gly Pro Ala His Val Thr Phe Gln Asp Ala Leu Leu Tyr Gln 20 25 30 Thr Thr Ala Val Asp Pro Tyr Asn Leu Asn Ile Pro Val Thr Pro Ala 35 40 45 Ala Val Thr Tyr Pro Gln Ser Ala Glu Glu Ile Ala Ala Val Val Lys 50 55 60 Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His 65 70 75 80 Ser Phe Gly Asn Tyr Gly Leu Gly Gly Gln Asn Gly Ala Ile Val Val 85 90 95 Asp Met Lys His Phe Ser Gln Phe Ser Met Asp Glu Ser Thr Phe Val 100 105 110 Ala Thr Ile Gly Pro Gly Thr Thr Leu Gly Asp Leu Asp Thr Glu Leu 115 120 125 Tyr Asn Ala Gly Gly Arg Ala Met Ala His Gly Ile Cys Pro Thr Ile 130 135 140 Arg Thr Gly Gly His Leu Thr Val Gly Gly Leu Gly Pro Thr Ala Arg 145 150 155 160 Gln Trp Gly Leu Ala Leu Asp His Ile Glu Glu Val Glu Val Val Leu 165 170 175 Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Ile 180 185 190 Leu Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr Glu 195 200 205 Phe Lys Val Arg Thr Gln Glu Ala Pro Gly Leu Ala Val Gln Phe Ser 210 215 220 Phe Thr Phe Asn Leu Gly Ser Pro Ala Gln Lys Ala Lys Leu Val Lys 225 230 235 240 Asp Trp Gln Ala Phe Ile Ala Gln Glu Asn Leu Ser Trp Lys Phe Tyr 245 250 255 Ser Asn Leu Val Ile Phe Asp Gly Gln Ile Ile Leu Glu Gly Ile Phe 260 265 270 Phe Gly Ser Lys Glu Glu Tyr Asp Glu Leu Asp Leu Glu Lys Arg Phe 275 280 285 Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp Leu Gly 290 295 300 Met Ile Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asp 305 310 315 320 Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Asp Thr 325 330 335 Leu Ile Pro Asp Ser Ala Ile Asp Asp Phe Phe Asp Tyr Ile His Lys 340 345 350 Thr Asn Ala Gly Thr Leu Ala Trp Phe Val Thr Leu Ser Leu Glu Gly 355 360 365 Gly Ala Ile Asn Ser Val Ser Glu Asp Ala Thr Ala Tyr Gly His Arg 370 375 380 Asp Val Leu Phe Trp Phe Gln Val Phe Val Val Asn Pro Leu Gly Pro 385 390 395 400 Ile Ser Gln Thr Thr Tyr Asp Phe Thr Asn Gly Leu Tyr Asp Val Leu 405 410 415 Ala Gln Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly Cys Pro 420 425 430 Asp Pro Lys Met Pro Asp Ala Gln Arg Ala Tyr Trp Arg Ser Asn Leu 435 440 445 Pro Arg Leu Glu Asp Leu Lys Gly Asp Leu Asp Pro Lys Asp Thr Phe 450 455 460 His Asn Pro Gln Gly Val Gln Val Gly Pro 465 470 <210> 149 <211> 496 <212> PRT <213> Aspergillus lacticoffeatus <400> 149 Met Leu Ser Thr Met Ala Phe Ser Phe Val Leu Arg Ile Leu Ser Pro 1 5 10 15 Leu Phe Leu Ile Leu Gln Leu Ser Thr Ala Ala Ser Thr Ser Thr Leu 20 25 30 Arg Gln Cys Leu Leu Thr Ala Val Gln Asn Asp Pro Thr Leu Val Ala 35 40 45 Val Asp Gly Asp Leu Leu Tyr Gln Thr Leu Ala Val Gln Val Tyr Asn 50 55 60 Leu Asn Trp Pro Val Thr Pro Ala Ala Val Ala Phe Pro Lys Ser Thr 65 70 75 80 Gln Gln Val Ala Ser Ile Val Asn Cys Ala Ala Ser Leu Gly Tyr Lys 85 90 95 Val Gln Ala Lys Ser Gly Gly His Ser Tyr Gly Asn Tyr Gly Leu Gly 100 105 110 Gly Thr Asn Gly Ala Ile Ser Ile Asn Leu Lys Asn Met Lys Ser Phe 115 120 125 Ser Met Asn Tyr Thr Asn Tyr Gln Ala Thr Val Gly Ala Gly Met Leu 130 135 140 Asn Gly Glu Leu Asp Glu Tyr Leu His Asn Ala Gly Gly Arg Ala Val 145 150 155 160 Ala His Gly Thr Ser Pro Gln Ile Gly Val Gly Gly His Ala Thr Ile 165 170 175 Gly Gly Leu Gly Pro Ser Ala Arg Gln Tyr Gly Met Glu Leu Asp His 180 185 190 Val Leu Glu Ala Glu Val Val Leu Ala Asn Gly Thr Val Val Arg Ala 195 200 205 Ser Ser Thr Gln Asn Ser Asp Leu Leu Phe Ala Ile Lys Gly Ala Gly 210 215 220 Ala Ser Phe Gly Val Val Thr Glu Phe Val Phe Arg Thr Glu Pro Glu 225 230 235 240 Pro Gly Ser Ala Val Gln Tyr Thr Phe Thr Phe Gly Leu Gly Ser Thr 245 250 255 Ser Ala Arg Ala Asp Leu Phe Lys Lys Trp Gln Ser Phe Ile Ser Gln 260 265 270 Pro Asp Leu Thr Arg Lys Phe Ala Ser Ile Cys Thr Leu Leu Asp His 275 280 285 Val Leu Val Ile Ser Gly Thr Phe Phe Gly Thr Lys Glu Glu Tyr Asp 290 295 300 Ala Leu Gly Leu Glu Asp Gln Phe Pro Gly His Thr Asn Ser Thr Val 305 310 315 320 Ile Val Phe Thr Asp Trp Leu Gly Leu Val Ala Gln Trp Ala Glu Gln 325 330 335 Ser Ile Leu Asp Leu Thr Gly Gly Ile Pro Ala Asp Phe Tyr Ala Arg 340 345 350 Cys Leu Ser Phe Thr Glu Lys Thr Leu Ile Pro Ser Asn Gly Val Asp 355 360 365 Gln Leu Phe Glu Tyr Leu Asp Ser Ala Asp Thr Gly Ala Leu Leu Trp 370 375 380 Phe Val Ile Phe Asp Leu Glu Gly Gly Ala Ile Asn Asp Val Pro Met 385 390 395 400 Asp Ala Thr Gly Tyr Ala His Arg Asp Thr Leu Phe Trp Leu Gln Ser 405 410 415 Tyr Ala Ile Thr Leu Gly Ser Val Ser Glu Thr Thr Tyr Asp Phe Leu 420 425 430 Asp Asn Val Asn Glu Ile Ile Arg Asn Asn Thr Pro Gly Leu Gly Asn 435 440 445 Gly Val Tyr Pro Gly Tyr Val Asp Pro Arg Leu Gln Asn Ala Arg Glu 450 455 460 Ala Tyr Trp Gly Ser Asn Leu Pro Arg Leu Met Gln Ile Lys Ser Leu 465 470 475 480 Tyr Asp Pro Thr Asp Leu Phe His Asn Pro Gln Gly Val Leu Pro Ala 485 490 495 <210> 150 <211> 468 <212> PRT <213> Aspergillus ochraceoroseus <400> 150 Met Ala Pro Ser Ile Ser Phe Ser Leu Leu Gln Ile Ser Leu Leu Ala 1 5 10 15 Tyr Ser Gly Leu Val Ser Gly Asp Phe Ser Leu Arg Gln Cys Leu Glu 20 25 30 Ser Ala Val Ser Arg Val Ala Phe Glu Gly Asp Pro Phe Tyr Gln Leu 35 40 45 Leu Ser Val Arg Pro Tyr Asn Leu Asp Ile Ser Ile Val Pro Ala Ala 50 55 60 Val Ala Phe Pro Ala Asp Thr Asn Glu Val Ala Ala Val Val Arg Cys 65 70 75 80 Ala Ala Gln Asn Gly Tyr Gln Val Gln Ala Lys Ser Gly Gly His Ser 85 90 95 Tyr Ala Asn His Gly Leu Gly Gly Thr Asn Gly Ala Val Val Val Asn 100 105 110 Leu Glu Asn Leu Gln His Phe Ser Met Asn Thr Thr Thr Trp Glu Ala 115 120 125 Thr Ile Gly Ala Gly Thr Leu Leu Gly Asp Val Thr Lys Arg Leu Ser 130 135 140 Asp Ala Gly Gly Arg Ala Met Ala His Gly Thr Cys Pro Gln Val Gly 145 150 155 160 Ser Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Ser Ser Arg Gln 165 170 175 Phe Gly Ala Ala Leu Asp His Ile Ile Glu Ala Glu Val Val Leu Ala 180 185 190 Asn Ser Ser Ile Ile Arg Ala Ser Glu Thr Glu Asn Pro Asp Val Phe 195 200 205 Phe Ala Val Arg Gly Ala Ala Ser Gly Phe Gly Ile Val Thr Glu Phe 210 215 220 Lys Val Arg Thr Glu Pro Glu Pro Gly Gln Ala Val Arg Tyr Ser Tyr 225 230 235 240 Ser Phe Ser Phe Ser Asp Thr Ala Thr Arg Ala Asp Leu Phe Lys Lys 245 250 255 Trp Gln Ala Tyr Val Thr Gln Pro Asp Leu Pro Arg Glu Leu Ala Ser 260 265 270 Thr Leu Thr Ile Leu Glu His Gly Met Phe Ile Thr Gly Thr Phe Phe 275 280 285 Gly Ser Lys Glu Glu Tyr Asn Ala Leu Lys Ile Glu Thr Glu Phe Pro 290 295 300 Gly Phe Ala Lys Gly Gly Thr Leu Val Leu Asp Asp Trp Leu Gly Leu 305 310 315 320 Val Ser Asn Trp Ala Glu Asp Leu Leu Leu Ser Glu Glu Glu Ile Glu 325 330 335 Gln Met Phe Glu Tyr Ile Asp Asn Val Asp Lys Gly Thr Leu Leu Trp 340 345 350 Phe Ala Ile Phe Asp Leu Gln Gly Gly Ala Val Gly Asp Val Pro Val 355 360 365 Asp Ala Thr Ala Tyr Ala His Arg Asp Thr Leu Ile Trp Leu Gln Ser 370 375 380 Tyr Ala Ile Asn Leu Phe Gly Arg Ile Ser Glu Thr Thr Val Glu Phe 385 390 395 400 Leu Glu Arg Leu Asn Glu Leu Thr Leu Thr Ser Thr Ala Lys Thr Val 405 410 415 Pro Tyr Ala Ala Tyr Pro Gly Tyr Val Asp Pro Arg Leu Thr Asp Ala 420 425 430 Gln Ala Ala Tyr Trp Gly Ser Asn Leu Ala Arg Leu Asn Arg Ile Lys 435 440 445 Ala Glu Ile Asp Pro Asn Asn Val Phe His Asn Pro Gln Ser Val Arg 450 455 460 Pro Ala Ser Gly 465 <210> 151 <211> 475 <212> PRT <213> Aspergillus cristatus <400> 151 Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Val Asn 1 5 10 15 Ala Val Gly Gly Asn Gln Ala Leu Val Ala Phe Gln Asp Gln Leu Leu 20 25 30 Tyr Gln Ser Thr Ala Val Glu Ala Tyr Asn Leu Asn Ile Pro Val Thr 35 40 45 Pro Ala Ala Val Thr Phe Pro Glu Ser Ser Glu Gln Ile Ala Ala Val 50 55 60 Val Lys Cys Ala Ser Glu His Asp Tyr Lys Val Gln Ala Arg Ser Gly 65 70 75 80 Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asn Gly Ala Ile 85 90 95 Val Val Asp Met Lys Lys Phe Asp Gln Phe Ser Met Asp Glu Ser Ser 100 105 110 Tyr Ile Ala Thr Ile Gly Pro Gly Thr Thr Leu Gly Asp Val Asp Thr 115 120 125 Glu Leu Tyr Asn Ala Gly Gly Arg Ala Met Ala His Gly Ile Cys Pro 130 135 140 Thr Ile Arg Thr Gly Gly His Leu Thr Met Gly Gly Leu Gly Pro Thr 145 150 155 160 Ala Arg Gln Trp Gly Leu Ala Leu Asp His Ile Glu Glu Val Glu Val 165 170 175 Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser His Thr Gln Asn Gln 180 185 190 Asp Ile Leu Phe Ala Val Lys Gly Ala Ser Ala Ser Phe Gly Ile Val 195 200 205 Thr Glu Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln 210 215 220 Tyr Ser Tyr Thr Phe Asn Leu Gly Ser Ala Ala Ser Lys Ala Lys Leu 225 230 235 240 Val Lys Asp Trp Gln Glu Phe Ile Ala Gln Asp Asn Leu Thr Trp Lys 245 250 255 Phe Tyr Ser Asn Met Val Ile Ile Asp Gly Asp Ile Ile Leu Glu Gly 260 265 270 Ile Phe Phe Gly Ser Lys Glu Glu Phe Asp Ala Leu Glu Leu Glu Asn 275 280 285 Arg Phe Pro Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp 290 295 300 Leu Gly Met Ile Ser His Ser Leu Glu Asp Ile Ile Leu Arg Val Ala 305 310 315 320 Gly Gly Val Pro Thr Tyr Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro 325 330 335 Gln Ala Leu Ile Pro Ser Ser Ala Ile Asp Asp Leu Phe Asp Tyr Ile 340 345 350 Glu Lys Thr Asn Pro Gly Thr Leu Ala Trp Phe Ile Thr Leu Ser Leu 355 360 365 Glu Gly Gly Ala Ile Asn Asn Val Pro Ala Asp Ala Thr Ala Tyr Gly 370 375 380 His Arg Asp Val Leu His Trp Val Gln Ile Phe Ala Ala Asn Pro Leu 385 390 395 400 Gly Pro Ile Ser Glu Thr Thr Tyr Asp Phe Thr Asp Gly Leu Tyr Asn 405 410 415 Ile Leu Ala Lys Ala Val Pro Glu Ser Ala Glu His Ala Tyr Leu Gly 420 425 430 Cys Pro Asp Pro Arg Met Lys Asp Ala Gln Lys Ala Tyr Trp Arg Asp 435 440 445 Asn Leu Pro Arg Leu Glu Glu Leu Lys Ala Glu Leu Asp Pro Lys Asp 450 455 460 Thr Phe His Asn Pro Gln Gly Val Ala Val Ala 465 470 475 <210> 152 <211> 488 <212> PRT <213> Penicillium roqueforti <400> 152 Met Leu Leu Lys Leu Phe Phe Leu Ala Val Ala Ala Ser Val Ala Leu 1 5 10 15 Ala Ala Ser Ser Glu Ala Leu Lys Gln Cys Leu Glu Asn Val Phe Thr 20 25 30 Asp Arg Ala Gly Phe Ala Phe Ala Gly Asp Leu Phe Tyr Asp Arg Ile 35 40 45 Val Asn Arg Tyr Asn Leu Asn Ile Pro Val Thr Pro Ser Ala Leu Ala 50 55 60 Phe Pro Thr Ser Ser Gln Gln Val Ala Asp Ile Val Lys Cys Ala Ala 65 70 75 80 Asp Asn Gly Tyr Pro Val Gln Ala Arg Ser Gly Gly His Ser Tyr Gly 85 90 95 Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val Ala Ile Asp Leu Lys 100 105 110 His Leu Gln Gln Phe Ser Met Asp Lys Thr Thr Trp Gln Ala Thr Ile 115 120 125 Gly Ala Gly Ser Leu Leu Ser Asp Val Thr Gln Arg Leu Ser His Ala 130 135 140 Gly Gly Arg Ala Met Ser His Gly Ile Cys Pro Gln Val Gly Ser Gly 145 150 155 160 Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ser Arg Gln Phe Gly 165 170 175 Ala Ala Leu Asp His Val Leu Glu Val Glu Val Val Leu Ala Asn Ser 180 185 190 Ser Ile Val Arg Ala Ser Asp Thr Glu Asn Lys Asp Leu Phe Trp Ala 195 200 205 Ile Lys Gly Ala Ala Ser Gly Tyr Gly Ile Val Thr Glu Phe Lys Val 210 215 220 Arg Thr Glu Pro Glu Pro Gly Thr Ala Val Gln Tyr Ala Tyr Ser Met 225 230 235 240 Glu Phe Gly Asn Pro Thr Lys Gln Ala Thr Leu Phe Lys Ser Trp Gln 245 250 255 Ala Phe Val Ser Asp Pro Lys Leu Thr Arg Lys Met Ala Ser Thr Leu 260 265 270 Thr Met Leu Glu Asn Ser Met Ala Ile Ser Gly Thr Phe Phe Gly Thr 275 280 285 Lys Glu Glu Tyr Asp Lys Leu Asn Leu Thr Asn Lys Phe Pro Gly Ala 290 295 300 Asn Gly Asp Ala Leu Val Phe Glu Asp Trp Leu Gly Leu Val Ala His 305 310 315 320 Trp Ala Glu Asp Leu Ile Leu Gly Leu Ala Ala Gly Ile Pro Thr Asn 325 330 335 Phe Tyr Ala Lys Ser Thr Ser Trp Thr Pro Gln Thr Leu Ile Thr Pro 340 345 350 Glu Thr Val Asp Lys Met Phe Asp Tyr Ile Ala Thr Val Asn Lys Gly 355 360 365 Thr Leu Gly Trp Phe Leu Leu Phe Asp Leu Gln Gly Gly Tyr Thr Asn 370 375 380 Asp Ile Pro Thr Asn Ala Thr Ser Tyr Ala His Arg Asp Val Leu Ile 385 390 395 400 Trp Leu Gln Ser Tyr Thr Val Asn Phe Leu Gly Pro Ile Ser Gln Ala 405 410 415 Gln Ile Asp Phe Leu Asp Gly Leu Asn Lys Ile Val Thr Asn Asn Lys 420 425 430 Leu Pro Tyr Thr Ala Tyr Pro Gly Tyr Val Asp Pro Leu Met Pro Asn 435 440 445 Ala Pro Glu Ala Tyr Trp Gly Thr Asn Leu Pro Arg Leu Gln Gln Ile 450 455 460 Lys Glu Leu Val Asp Pro Asn Asp Val Phe Arg Asn Pro Gln Ser Pro 465 470 475 480 Ser Pro Ala Asn Lys Glu Pro Leu 485 <210> 153 <211> 472 <212> PRT <213> Fusarium sporotrichioides <400> 153 Met Gly Asn Gly Asn Ser Thr Pro Phe Arg Asp Cys Leu Asp Ser Ile 1 5 10 15 Cys Ala Asn Arg Ser Thr Cys Val Thr Tyr Pro Gly Asp Pro Leu Phe 20 25 30 Ser Cys Trp Ser Arg Pro Phe Asn Leu Glu Phe Pro Val Val Pro Ala 35 40 45 Ala Ile Ile Arg Pro Glu Thr Thr Thr Glu Val Ala Glu Thr Val Lys 50 55 60 Cys Ala Lys Lys Tyr Gly Tyr Lys Val Gln Ala Lys Ser Gly Gly His 65 70 75 80 Ser Tyr Gly Asn His Gly Leu Gly Gly Val Gly Gly Ala Val Ser Ile 85 90 95 Asp Met Val Asn Leu Arg Asp Phe Ser Met Asn Asn Lys Thr Trp Tyr 100 105 110 Ala Ser Phe Gly Ser Gly Met Asn Leu Gly Glu Leu Asp Glu His Leu 115 120 125 His Ala Asn Gly Arg Arg Ala Ile Ala His Gly Thr Cys Pro Gly Val 130 135 140 Gly Thr Gly Gly His Leu Thr Val Gly Gly Leu Gly Pro Ile Ser Arg 145 150 155 160 Gln Trp Gly Ser Ala Leu Asp His Leu Leu Glu Ile Glu Val Ile Thr 165 170 175 Ala Asp Gly Thr Val Gln Arg Ala Ser Tyr Thr Lys Asn Ser Gly Leu 180 185 190 Phe Trp Ala Leu Arg Gly Ala Gly Ala Ser Phe Gly Ile Val Thr Lys 195 200 205 Phe Met Val Lys Thr His Pro Glu Pro Gly Arg Val Val Gln Tyr Ser 210 215 220 Tyr Asn Ile Ala Leu Ala Ser His Ala Glu Thr Ala Glu Leu Tyr Arg 225 230 235 240 Glu Trp Gln Ala Leu Val Gly Asp Pro Asn Met Asp Arg Arg Phe Ser 245 250 255 Ser Leu Phe Val Val Gln Pro Leu Gly Ala Leu Ile Thr Gly Thr Phe 260 265 270 Phe Gly Thr Lys Ser Gln Tyr Gln Ala Thr Gly Ile Pro Asp Arg Leu 275 280 285 Pro Gly Ala Asp Lys Gly Ala Val Trp Leu Thr Asp Trp Ala Gly Leu 290 295 300 Leu Leu His Glu Ala Glu Ala Ala Gly Cys Ala Leu Gly Ser Ile Pro 305 310 315 320 Thr Ala Phe Tyr Gly Lys Ser Leu Ser Leu Ser Glu Gln Asp Leu Leu 325 330 335 Ser Asp Ser Ala Ile Thr Asp Leu Phe Lys Tyr Leu Glu Asp Asn Arg 340 345 350 Ser Gly Leu Ala Pro Val Thr Ile Leu Phe Asn Thr Glu Gly Gly Ala 355 360 365 Met Met Asp Thr Pro Ala Asn Ala Thr Ala Tyr Pro His Arg Asn Ser 370 375 380 Ile Ile Met Tyr Gln Ser Tyr Gly Ile Gly Val Gly Lys Val Ser Ala 385 390 395 400 Ala Thr Arg Lys Leu Leu Asp Gly Val His Glu Arg Ile Gln Arg Ser 405 410 415 Ala Pro Gly Ala Leu Ser Thr Tyr Ala Gly Tyr Ile Asp Ala Trp Ala 420 425 430 Asp Arg Lys Ala Ala Gln Lys Leu Tyr Trp Ala Asp Asn Leu Pro Arg 435 440 445 Leu Arg Glu Leu Lys Lys Val Trp Asp Pro Ala Asp Val Phe Ser Asn 450 455 460 Pro Gln Ser Val Glu Pro Ala Asp 465 470 <210> 154 <211> 371 <212> PRT <213> Beauveria bassiana <400> 154 Met Asp Ser Asn Thr Trp Glu Ala Thr Phe Gly Ser Gly Phe Leu Leu 1 5 10 15 Gly Glu Leu Asp Lys His Leu His Ala Asn Gly Asn Arg Ala Met Ala 20 25 30 His Gly Thr Cys Pro Gly Val Gly Met Gly Gly His Ala Thr Ile Gly 35 40 45 Gly Ile Gly Pro Ser Ser Arg Leu Trp Gly Thr Thr Leu Asp His Val 50 55 60 Leu Gln Val Glu Val Val Thr Ala Asp Gly Lys Ile Gln Arg Ala Ser 65 70 75 80 Lys Thr Gln Asn Pro Asp Leu Phe Trp Ala Leu Gln Gly Ala Gly Ala 85 90 95 Ser Phe Gly Ile Ile Thr Glu Phe Val Val Arg Thr Glu Pro Glu Pro 100 105 110 Gly Ser Val Val Glu Tyr Thr Tyr Ser Val Ser Leu Gly Lys Gln Ser 115 120 125 Asp Met Ala Pro Leu Tyr Lys Gln Trp Gln Ala Leu Val Gly Asp Pro 130 135 140 Ser Leu Asp Arg Arg Phe Thr Ser Leu Phe Ile Ala Glu Pro Leu Gly 145 150 155 160 Val Leu Ile Thr Gly Thr Phe Tyr Gly Thr Met Tyr Glu Trp His Ala 165 170 175 Ser Gly Ile Pro Asp Lys Leu Pro Arg Gly Pro Ile Ser Val Thr Val 180 185 190 Met Asp Ser Leu Gly Ser Leu Ala His Ile Ala Glu Lys Thr Gly Leu 195 200 205 Tyr Leu Thr Asn Val Pro Thr Ser Phe Ala Ser Arg Ser Leu Ala Leu 210 215 220 Arg Gln Gln Asp Leu Leu Ser Glu Gln Ser Ile Asp Asp Leu Phe Glu 225 230 235 240 Tyr Met Gly Ser Ala Asn Ala Asp Thr Pro Leu Trp Phe Val Ile Phe 245 250 255 Asp Asn Glu Gly Gly Ala Ile Ala Asp Val Pro Asp Asn Ser Thr Ala 260 265 270 Tyr Pro His Arg Asp Lys Val Ile Val Tyr Gln Ser Tyr Ser Val Gly 275 280 285 Leu Leu Gly Val Thr Asp Lys Met Ile Lys Phe Leu Asp Gly Val Gln 290 295 300 Asp Ile Val Gln Arg Gly Ala Pro Asn Ala His Thr Thr Tyr Ala Gly 305 310 315 320 Tyr Ile Asn Pro Gln Leu Asp Arg Lys Ala Ala Gln Gln Phe Tyr Trp 325 330 335 Gly Asp Lys Leu Pro Arg Leu Gln Gln Ile Lys Lys Gln Tyr Asp Pro 340 345 350 Asn Asn Val Phe Cys Asn Pro Gln Ser Ile Tyr Pro Ala Glu Asp Met 355 360 365 Ser Asp Gly 370 <210> 155 <211> 473 <212> PRT <213> Aspergillus vadensis <400> 155 Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Val Ser Ala 1 5 10 15 Leu Gly Gly Asn Ser Ala Leu Ala Ala Phe Pro Asn Gln Leu Leu Trp 20 25 30 Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala 35 40 45 Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Gly Ile Val Lys 50 55 60 Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His 65 70 75 80 Ser Phe Gly Asn Tyr Gly Leu Gly Gly Thr Asp Gly Ala Val Val Val 85 90 95 Asp Met Lys His Phe Asn Gln Phe Ser Met Asn Asp Gln Thr Tyr Glu 100 105 110 Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu 115 120 125 Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile 130 135 140 Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg 145 150 155 160 Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu 165 170 175 Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val 180 185 190 Phe Phe Ala Val Lys Gly Ala Ala Ala Asp Phe Gly Ile Val Thr Glu 195 200 205 Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser 210 215 220 Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys 225 230 235 240 Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr 245 250 255 Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe 260 265 270 Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe 275 280 285 Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly 290 295 300 Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn 305 310 315 320 Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr 325 330 335 Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Ala Asn 340 345 350 His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly 355 360 365 Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg 370 375 380 Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Leu Gly Pro 385 390 395 400 Ile Ser Glu Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu 405 410 415 Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro 420 425 430 Asp Pro Arg Met Glu Asn Ala Pro Gln Lys Tyr Trp Arg Thr Asn Leu 435 440 445 Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe 450 455 460 His His Pro Gln Gly Val Ile Pro Ala 465 470 <210> 156 <211> 476 <212> PRT <213> Penicillium arizonense <400> 156 Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Val Ser 1 5 10 15 Ala Val Gly Gly Val Ala Ala His Val Ala Phe Gln Asp Ser Leu Leu 20 25 30 Tyr Gln Ala Thr Ala Val Glu Leu Tyr Asn Leu Asn Ile Pro Val Thr 35 40 45 Pro Ala Ala Val Thr Tyr Pro Gln Ser Thr Asp Glu Ile Ala Ala Val 50 55 60 Val Lys Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly 65 70 75 80 Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Gln Asn Gly Ala Ile 85 90 95 Val Ile Asp Met Lys His Phe Ser Gln Phe Ser Leu Asp Lys Ser Thr 100 105 110 Phe Ile Ala Thr Phe Gly Pro Gly Thr Thr Leu Gly Asn Leu Asp Thr 115 120 125 Glu Leu Tyr His Ala Gly Asn Arg Ala Met Ala His Gly Ile Cys Pro 130 135 140 Thr Ile Arg Thr Gly Gly His Leu Thr Met Gly Gly Leu Gly Pro Ala 145 150 155 160 Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val 165 170 175 Val Leu Ala Asn Ser Ser Val Val Arg Ala Ser Asp Thr Gln Asn Gln 180 185 190 Asp Val Phe Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val 195 200 205 Thr Glu Phe Lys Val Arg Thr Glu Glu Ala Pro Gly Leu Ala Val Gln 210 215 220 Tyr Ser Phe Pro Phe Asn Leu Gly Thr Pro Ala Glu Lys Ala Lys Leu 225 230 235 240 Val Lys Asp Trp Gln Ala Phe Ile Ala Gln Glu Asn Leu Ser Trp Lys 245 250 255 Phe Tyr Ser Asn Met Val Ile Phe Asp Gly Gln Ile Ile Leu Glu Gly 260 265 270 Ile Phe Phe Gly Ser Lys Lys Glu Tyr Asp Glu Leu Asp Leu Glu Asn 275 280 285 Lys Phe Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp 290 295 300 Leu Gly Met Ile Gly His Gly Leu Glu Asp Thr Ile Leu Arg Leu Val 305 310 315 320 Gly Asn Ser Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro 325 330 335 Ser Thr Leu Ile Ser Asp Ser Ala Ile Asp Gly Leu Phe Asp Tyr Ile 340 345 350 His Lys Thr Asn Pro Gly Thr Leu Ala Trp Phe Val Thr Leu Ser Leu 355 360 365 Glu Gly Gly Ala Ile Asn Thr Val Ser Glu Asp Ala Thr Ala Tyr Gly 370 375 380 His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Val Ala Asn Pro Leu 385 390 395 400 Gly Pro Ile Ser Gln Thr Thr Tyr Asp Phe Ala Asp Gly Leu Tyr Asn 405 410 415 Val Leu Ala Gln Ala Val Pro Asp Ser Ala Gly His Ala Tyr Leu Gly 420 425 430 Cys Pro Asp Pro Lys Leu Pro Asp Ala Gln Arg Ala Tyr Trp Arg Ser 435 440 445 Asn Leu Pro Arg Leu Glu Glu Leu Lys Arg Asp Leu Asp Pro Lys Asp 450 455 460 Ile Phe Tyr Asn Pro Gln Gly Val Gln Ile Val Ser 465 470 475 <210> 157 <211> 476 <212> PRT <213> Aspergillus fumigatus <400> 157 Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Leu Ser 1 5 10 15 Ala Val Gly Gly Asn His Ala His Val Ala Phe Gln Asp Gln Leu Leu 20 25 30 Tyr Gln Ala Thr Ala Val Glu Pro Tyr Asn Leu Asn Ile Pro Val Thr 35 40 45 Pro Ala Ala Val Thr Tyr Pro Gln Ser Ala Asp Glu Val Ala Ala Val 50 55 60 Val Lys Cys Ala Ala Asp Tyr Gly Tyr Lys Val Gln Ala Arg Ser Gly 65 70 75 80 Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Glu Asp Gly Ala Ile 85 90 95 Val Val Asp Met Lys His Phe Asp Gln Phe Ser Met Asp Glu Ser Thr 100 105 110 Tyr Thr Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr 115 120 125 Ala Leu Tyr Asn Ala Gly His Arg Ala Met Ala His Gly Ile Cys Pro 130 135 140 Thr Ile Arg Thr Gly Gly His Leu Thr Ile Gly Gly Leu Gly Pro Thr 145 150 155 160 Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val 165 170 175 Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asp Thr Gln Asn Gln 180 185 190 Glu Ile Leu Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val 195 200 205 Thr Glu Phe Lys Val Arg Thr Glu Glu Ala Pro Gly Leu Ala Val Gln 210 215 220 Tyr Ser Phe Thr Phe Asn Leu Gly Thr Ala Ala Glu Lys Ala Lys Leu 225 230 235 240 Val Lys Asp Trp Gln Ala Phe Ile Ala Gln Glu Asp Leu Thr Trp Lys 245 250 255 Phe Tyr Ser Asn Met Asn Ile Ile Asp Gly Gln Ile Ile Leu Glu Gly 260 265 270 Ile Tyr Phe Gly Ser Lys Ala Glu Tyr Asp Ala Leu Gly Leu Glu Glu 275 280 285 Lys Phe Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp 290 295 300 Leu Gly Met Val Gly His Gly Leu Glu Asp Val Ile Leu Arg Leu Val 305 310 315 320 Gly Asn Ala Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Ala Pro 325 330 335 Arg Ala Leu Ile Pro Asp Ser Ala Ile Asp Asp Phe Phe Glu Tyr Ile 340 345 350 His Lys Asn Asn Pro Gly Thr Val Ser Trp Phe Val Thr Leu Ser Leu 355 360 365 Glu Gly Gly Ala Ile Asn Lys Val Pro Glu Asp Ala Thr Ala Tyr Gly 370 375 380 His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Ile Asn Pro Leu 385 390 395 400 Gly Pro Val Ser Gln Thr Ile Tyr Asp Phe Ala Asp Gly Leu Tyr Asp 405 410 415 Val Leu Ala Lys Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly 420 425 430 Cys Pro Asp Pro Arg Met Pro Asn Ala Gln Gln Ala Tyr Trp Arg Asn 435 440 445 Asn Leu Pro Arg Leu Glu Glu Leu Lys Gly Asp Leu Asp Pro Lys Asp 450 455 460 Ile Phe His Asn Pro Gln Gly Val Met Val Val Ser 465 470 475 <210> 158 <211> 473 <212> PRT <213> Purpureocillium lilacinum <400> 158 Met Gly Asn Gly Gln Ser Thr Pro Leu Gln Gln Cys Leu Asn Thr Val 1 5 10 15 Cys Asn Gly Arg Leu Gly Cys Val Ala Phe Pro Ser Asp Ala Leu Tyr 20 25 30 Gln Ala Ala Trp Val Lys Pro Tyr Asn Leu Asp Val Pro Val Thr Pro 35 40 45 Ile Ala Val Phe Lys Pro Ser Ser Thr Glu Asp Val Ala Gly Ala Ile 50 55 60 Lys Cys Ala Val Ala Ser Asn Val His Val Gln Ala Lys Ser Gly Gly 65 70 75 80 His Ser Tyr Ala Asn Phe Gly Leu Gly Gly Gln Asp Gly Glu Leu Met 85 90 95 Ile Asp Leu Ala Asn Leu Gln Asp Phe His Met Asp Lys Thr Ser Trp 100 105 110 Gln Ala Thr Phe Gly Ala Gly Tyr Arg Leu Gly Asp Leu Asp Lys Lys 115 120 125 Leu Gln Ala Asn Gly Asn Arg Ala Ile Ala His Gly Thr Cys Pro Gly 130 135 140 Val Gly Ile Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Met Ser 145 150 155 160 Arg Met Trp Gly Ser Ala Leu Asp His Val Leu Ser Val Gln Val Val 165 170 175 Thr Ala Asp Gly Ser Ile Lys Asn Ala Ser Glu Ser Glu Asn Ser Asp 180 185 190 Leu Phe Trp Ala Leu Arg Gly Ala Gly Ala Ser Phe Gly Val Ile Thr 195 200 205 Lys Phe Thr Val Lys Thr His Pro Ala Pro Gly Ser Val Val Gln Tyr 210 215 220 Thr Tyr Lys Ile Ser Leu Gly Ser Gln Ala Gln Met Ala Pro Val Tyr 225 230 235 240 Ala Ala Trp Gln Ala Leu Ala Gly Asp Pro Lys Leu Asp Arg Arg Phe 245 250 255 Ser Thr Leu Phe Ile Ala Glu Pro Leu Gly Ala Leu Ile Thr Gly Thr 260 265 270 Phe Tyr Gly Thr Lys Ala Glu Tyr Glu Ala Thr Gly Ile Ala Ala Arg 275 280 285 Leu Pro Ser Gly Gly Thr Leu Asp Leu Lys Leu Leu Asp Trp Leu Gly 290 295 300 Ser Leu Ala His Ile Ala Glu Val Val Gly Leu Thr Leu Gly Asp Ile 305 310 315 320 Pro Thr Ser Phe Tyr Gly Lys Ser Leu Ala Leu Arg Glu Glu Asp Met 325 330 335 Leu Asp Arg Thr Ser Ile Asp Gly Leu Phe Arg Tyr Met Gly Asp Ala 340 345 350 Asp Ala Gly Thr Leu Leu Trp Phe Val Ile Phe Asn Ser Glu Gly Gly 355 360 365 Ala Met Ala Asp Thr Pro Ala Gly Ala Thr Ala Tyr Pro His Arg Asp 370 375 380 Lys Leu Ile Met Tyr Gln Ser Tyr Val Ile Gly Ile Pro Thr Leu Thr 385 390 395 400 Lys Ala Thr Arg Asp Phe Ala Asp Gly Val His Asp Arg Val Arg Met 405 410 415 Gly Ala Pro Ala Ala Asn Ser Thr Tyr Ala Gly Tyr Ile Asp Arg Thr 420 425 430 Leu Ser Arg Glu Ala Ala Gln Glu Phe Tyr Trp Gly Ala Gln Leu Pro 435 440 445 Arg Leu Arg Glu Val Lys Lys Ala Trp Asp Pro Lys Asp Val Phe His 450 455 460 Asn Pro Gln Ser Val Asp Pro Ala Glu 465 470 <210> 159 <211> 473 <212> PRT <213> Aspergillus turcosus <400> 159 Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Ile Ser 1 5 10 15 Ala Val Gly Ala Ala Asn Val Ala Phe Gln Asp Gln Leu Leu Tyr Gln 20 25 30 Ala Thr Ala Val Gln Pro Tyr Asn Leu Asn Ile Pro Val Thr Pro Ala 35 40 45 Ala Val Thr Tyr Pro Gln Ser Ala Asp Glu Ile Ala Ala Val Val Lys 50 55 60 Cys Ala Ser Glu Tyr Gly Tyr Lys Val Gln Ala Arg Ser Gly Gly His 65 70 75 80 Ser Phe Gly Asn Tyr Gly Leu Gly Gly Gln Asp Gly Ala Ile Val Ile 85 90 95 Glu Met Lys His Phe Ser Gln Phe Ser Met Asp Glu Ser Thr Phe Ile 100 105 110 Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr Asp Leu 115 120 125 Tyr Asn Ala Gly His Arg Ala Met Ala His Gly Ile Cys Pro Thr Ile 130 135 140 Arg Thr Gly Gly His Leu Thr Val Gly Gly Leu Gly Pro Thr Ala Arg 145 150 155 160 Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu 165 170 175 Ala Asn Ser Ser Ile Val Arg Ala Ser Asp Thr Gln Asn Gln Asp Leu 180 185 190 Phe Phe Ala Ile Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr Glu 195 200 205 Phe Lys Val Arg Thr Glu Gln Ala Pro Gly Met Ala Val Gln Tyr Ser 210 215 220 Tyr Thr Phe His Leu Gly Thr Ser Ala Glu Lys Ala Lys Phe Val Lys 225 230 235 240 Asp Trp Gln Ala Phe Ile Ala Gln Glu Asn Leu Thr Trp Lys Phe Tyr 245 250 255 Thr Asn Leu Val Ile Phe Asp Asp Gln Ile Ile Leu Glu Gly Ile Tyr 260 265 270 Phe Gly Thr Lys Glu Glu Tyr Asp Ser Leu Gly Leu Glu Gln Arg Phe 275 280 285 Pro Pro Thr Asp Ala Gly Thr Val Leu Ile Leu Thr Asp Trp Leu Ala 290 295 300 Met Ile Gly His Gly Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asp 305 310 315 320 Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Arg Ala 325 330 335 Leu Ile Pro Asp Ser Ala Ile Asp Glu Phe Phe Asp Tyr Ile His Glu 340 345 350 Asn Asn Pro Gly Thr Leu Ala Trp Phe Val Thr Leu Ser Leu Glu Gly 355 360 365 Gly Ala Ile Asn Ala Val Pro Glu Asp Ala Thr Ala Tyr Gly His Arg 370 375 380 Asp Val Leu Phe Trp Phe Gln Leu Phe Val Ile Asn Pro Leu Gly Pro 385 390 395 400 Ile Ser Gln Thr Thr Tyr Gly Phe Ala Asp Gly Leu Tyr Asp Val Leu 405 410 415 Ala Gln Ala Val Pro Glu Ser Ala Ser His Ala Tyr Met Gly Cys Pro 420 425 430 Asp Pro Arg Met Pro Asn Ala Gln Arg Ala Tyr Trp Arg Ser Asn Leu 435 440 445 Pro Lys Leu Glu Glu Leu Lys Gly Tyr Leu Asp Pro Glu Asp Ile Phe 450 455 460 His Asn Pro Gln Gly Val Val Pro Ser 465 470 <210> 160 <211> 476 <212> PRT <213> Penicillium solitum <400> 160 Met Gly Asn Thr Thr Ser Ile Thr Ala Gly Arg Asp Cys Leu Thr Ser 1 5 10 15 Ala Val Gly Gly Val Ala Ala His Val Ala Phe Gln Asp Ala Leu Leu 20 25 30 Tyr Gln Thr Pro Ala Val Asp Pro Tyr Asn Leu Asn Ile Pro Val Thr 35 40 45 Pro Ala Ala Val Thr Tyr Pro Gln Ser Ala Asp Glu Val Ala Ala Val 50 55 60 Val Lys Cys Ala Ser Asp Tyr Asn Tyr Lys Val Gln Ala Arg Ser Gly 65 70 75 80 Gly His Ser Phe Gly Asn Phe Gly Leu Gly Gly Gln Asn Gly Ala Ile 85 90 95 Val Val Asp Met Lys His Phe Ser Gln Phe Ser Met Asp Glu Ser Thr 100 105 110 Phe Val Ala Thr Ile Gly Pro Gly Thr Thr Leu Gly Asn Leu Asp Thr 115 120 125 Glu Ile Tyr Asn Ala Gly Lys Arg Ala Met Ser His Gly Ile Cys Pro 130 135 140 Ser Ile Arg Thr Gly Gly His Leu Thr Val Gly Gly Leu Gly Pro Thr 145 150 155 160 Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val 165 170 175 Val Leu Ala Asn Ser Ser Ile Ile Arg Ala Ser Asp Thr Gln Asn Gln 180 185 190 Asp Val Leu Phe Ala Ile Lys Gly Ala Ala Ala Ser Phe Gly Ile Val 195 200 205 Thr Glu Phe Lys Val Arg Thr Glu Glu Ala Pro Gly Leu Ala Val Gln 210 215 220 Tyr Ser Phe Thr Phe Asn Leu Gly Thr Pro Ala Glu Lys Ala Lys Leu 225 230 235 240 Val Lys Asp Trp Gln Ala Tyr Ile Ala Gln Glu Asn Leu Thr Trp Lys 245 250 255 Phe Tyr Ser Asn Leu Ile Ile Phe Asp Gly Gln Ile Ile Leu Glu Gly 260 265 270 Ile Phe Phe Gly Ser Lys Glu Glu Tyr Asp Gln Leu Asn Leu Asp Lys 275 280 285 Lys Phe Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp 290 295 300 Leu Gly Met Ile Gly His Gly Leu Glu Asp Thr Ile Leu Arg Leu Val 305 310 315 320 Gly Asp Ser Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro 325 330 335 Ser Thr Leu Ile Ser Gly Ser Ala Ile Asp Gly Leu Phe Asp Tyr Ile 340 345 350 His Lys Thr Asn Ala Gly Thr Leu Ala Trp Phe Val Thr Leu Ser Leu 355 360 365 Glu Gly Gly Ala Ile Asn Ala Val Pro Lys Asp Ala Thr Ala Tyr Gly 370 375 380 His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Val Ala Asn Pro Leu 385 390 395 400 Gly Pro Ile Ser Gln Thr Thr Tyr Asp Phe Thr Asp Gly Leu Tyr Asp 405 410 415 Ile Leu Ala Gln Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly 420 425 430 Cys Pro Asp Pro Lys Met Pro Asp Ala Gln Arg Ala Tyr Trp Arg Ser 435 440 445 Asn Leu Pro Arg Leu Glu Glu Leu Lys Gly Asp Leu Asp Pro Lys Asp 450 455 460 Ile Phe His Asn Pro Gln Gly Val Gln Val Ala Ser 465 470 475 <210> 161 <211> 483 <212> PRT <213> Aspergillus flavus <400> 161 Met Asn Pro Ser Ile Pro Ser Ser Ser Met Gly Asn Thr Thr Ser Ile 1 5 10 15 Ala Gly Arg Asp Cys Leu Val Ser Ala Leu Gly Gly Asn Ala Gly Leu 20 25 30 Val Ala Phe Gln Asn Gln Pro Leu Tyr Gln Thr Thr Ala Val His Glu 35 40 45 Tyr Asn Leu Asn Ile Pro Val Thr Pro Ala Ala Ile Thr Tyr Pro Glu 50 55 60 Thr Ala Glu Gln Ile Ala Ala Val Val Lys Cys Ala Ser Gln Tyr Asp 65 70 75 80 Tyr Lys Val Gln Ala Arg Ser Gly Gly His Ser Phe Gly Asn Tyr Gly 85 90 95 Leu Gly Gly Thr Asp Gly Ala Val Val Val Asp Met Lys Tyr Phe Asn 100 105 110 Gln Phe Ser Met Asp Asp Gln Thr Tyr Glu Ala Val Ile Gly Pro Gly 115 120 125 Thr Thr Leu Gly Asp Val Asp Val Glu Leu Tyr Asn Asn Gly Lys Arg 130 135 140 Ala Met Ala His Gly Val Cys Pro Thr Ile Ser Thr Gly Gly His Phe 145 150 155 160 Thr Met Gly Gly Leu Gly Pro Thr Ala Arg Gln Trp Gly Leu Ala Leu 165 170 175 Asp His Val Glu Glu Val Glu Val Val Leu Ala Asn Ser Ser Ile Val 180 185 190 Arg Ala Ser Asn Thr Gln Asn Gln Glu Val Phe Phe Ala Val Lys Gly 195 200 205 Ala Ala Ala Ser Phe Gly Ile Val Thr Glu Phe Lys Val Arg Thr Gln 210 215 220 Pro Ala Pro Gly Ile Ala Val Gln Tyr Ser Tyr Thr Phe Asn Leu Gly 225 230 235 240 Ser Ser Ala Glu Lys Ala Gln Phe Ile Lys Asp Trp Gln Ser Phe Val 245 250 255 Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr Thr Asn Met Val Ile Phe 260 265 270 Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe Phe Gly Ser Lys Glu Gln 275 280 285 Tyr Glu Ala Leu Gly Leu Glu Glu Arg Phe Val Pro Lys Asn Pro Gly 290 295 300 Asn Ile Leu Val Leu Thr Asp Trp Leu Gly Met Val Gly His Ala Leu 305 310 315 320 Glu Asp Thr Ile Leu Arg Leu Val Gly Asn Thr Pro Thr Trp Phe Tyr 325 330 335 Ala Lys Ser Leu Gly Phe Thr Pro Asp Thr Leu Ile Pro Ser Ser Gly 340 345 350 Ile Asp Glu Phe Phe Glu Tyr Ile Glu Asn Asn Lys Ala Gly Thr Ser 355 360 365 Thr Trp Phe Val Thr Leu Ser Leu Glu Gly Gly Ala Ile Asn Asp Val 370 375 380 Pro Ala Asp Ala Thr Ala Tyr Gly His Arg Asp Val Leu Phe Trp Val 385 390 395 400 Gln Ile Phe Met Val Ser Pro Thr Gly Pro Val Ser Ser Thr Thr Tyr 405 410 415 Asp Phe Ala Asp Gly Leu Tyr Asn Val Leu Thr Lys Ala Val Pro Glu 420 425 430 Ser Glu Gly His Ala Tyr Leu Gly Cys Pro Asp Pro Lys Met Ala Asn 435 440 445 Ala Gln Gln Lys Tyr Trp Arg Gln Asn Leu Pro Arg Leu Glu Glu Leu 450 455 460 Lys Glu Thr Leu Asp Pro Lys Asp Thr Phe His Asn Pro Gln Gly Ile 465 470 475 480 Leu Pro Ala <210> 162 <211> 473 <212> PRT <213> Aspergillus lacticoffeatus <400> 162 Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala 1 5 10 15 Leu Gly Gly Asn Ser Ala Leu Ala Val Phe Pro Asn Glu Leu Leu Trp 20 25 30 Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala 35 40 45 Ala Ile Thr Tyr Pro Glu Thr Ala Ala Gln Ile Ala Gly Val Val Lys 50 55 60 Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His 65 70 75 80 Ser Phe Gly Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val Val Val 85 90 95 Asp Met Lys His Phe Thr Gln Phe Ser Met Asp Asp Glu Thr Tyr Glu 100 105 110 Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu 115 120 125 Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile 130 135 140 Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg 145 150 155 160 Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu 165 170 175 Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val 180 185 190 Phe Phe Ala Val Lys Gly Ala Ala Ala Asn Phe Gly Ile Val Thr Glu 195 200 205 Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser 210 215 220 Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys 225 230 235 240 Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr 245 250 255 Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe 260 265 270 Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe 275 280 285 Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly 290 295 300 Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn 305 310 315 320 Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr 325 330 335 Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Ala Asn 340 345 350 His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly 355 360 365 Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg 370 375 380 Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Leu Gly Pro 385 390 395 400 Ile Ser Asp Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu 405 410 415 Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro 420 425 430 Asp Pro Arg Met Glu Asp Ala Gln Gln Lys Tyr Trp Arg Thr Asn Leu 435 440 445 Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe 450 455 460 His His Pro Gln Gly Val Met Pro Ala 465 470 <210> 163 <211> 476 <212> PRT <213> Aspergillus novofumigatus <400> 163 Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Leu Ser 1 5 10 15 Ala Val Gly Gly Asn His Ala His Val Ala Phe Gln Asp Gln Leu Leu 20 25 30 Tyr Gln Val Thr Ala Val Glu Pro Tyr Asn Leu Asn Ile Pro Val Thr 35 40 45 Pro Ala Ala Val Thr Tyr Pro Gln Ser Ala Asp Glu Ile Ala Ala Val 50 55 60 Val Lys Cys Ala Ser Glu Tyr Gly Tyr Lys Val Gln Ala Arg Ser Gly 65 70 75 80 Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Glu Asp Gly Ala Ile 85 90 95 Val Val Glu Met Lys His Phe Asn Gln Phe Ser Met Asp Glu Ser Thr 100 105 110 Tyr Thr Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr 115 120 125 Ala Leu Tyr Asn Ala Gly His Arg Ala Met Ala His Gly Ile Cys Pro 130 135 140 Thr Ile Arg Thr Gly Gly His Leu Thr Met Gly Gly Leu Gly Pro Thr 145 150 155 160 Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val 165 170 175 Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln 180 185 190 Asp Ile Leu Phe Ala Ile Lys Gly Ala Ala Ala Ser Phe Gly Ile Val 195 200 205 Thr Glu Phe Lys Val Arg Thr Glu Ala Ala Pro Gly Val Ala Val Gln 210 215 220 Tyr Ser Phe Thr Phe Asn Leu Gly Thr Pro Ala Glu Lys Ala Lys Leu 225 230 235 240 Val Lys Asp Trp Gln Ala Phe Ile Ala Gln Glu Asp Leu Thr Trp Lys 245 250 255 Phe Tyr Ser Asn Met Asn Ile Phe Asp Gly Gln Ile Ile Leu Glu Gly 260 265 270 Ile Tyr Phe Gly Ser Lys Glu Glu Tyr Asp Ala Leu Gly Leu Glu Lys 275 280 285 Arg Phe Pro Ser Ser Glu Ala Gly Thr Val Leu Val Leu Thr Asp Trp 290 295 300 Leu Gly Met Val Gly His Gly Leu Glu Asp Val Ile Leu Arg Leu Val 305 310 315 320 Gly Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro 325 330 335 Arg Ala Leu Ile Pro Asp Ser Ala Ile Asp Glu Phe Leu Asn Tyr Ile 340 345 350 His Glu Asn Thr Pro Gly Thr Val Ser Trp Phe Val Thr Leu Ser Leu 355 360 365 Glu Gly Gly Ala Ile Asn Lys Val Pro Gly Asp Ala Thr Ala Tyr Gly 370 375 380 His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Ile Asn Pro Leu 385 390 395 400 Gly Pro Val Ser Gln Thr Thr Tyr Gly Phe Ala Asp Gly Leu Tyr Asp 405 410 415 Val Leu Ala Lys Ala Val Pro Asn Ser Ala Gly His Ala Tyr Leu Gly 420 425 430 Cys Pro Asp Pro Arg Met Pro Asn Ala Gln Gln Ala Tyr Trp Arg Ser 435 440 445 Asn Leu Pro Arg Leu Glu Glu Leu Lys Gly Glu Leu Asp Pro Lys Asp 450 455 460 Ile Phe His Asn Pro Gln Gly Val Met Val Val Ser 465 470 475 <210> 164 <211> 473 <212> PRT <213> Aspergillus welwitschiae <400> 164 Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala 1 5 10 15 Leu Gly Gly Asn Ser Ala Leu Ala Ala Phe Pro Asn Glu Leu Leu Trp 20 25 30 Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala 35 40 45 Ala Ile Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Gly Ile Val Lys 50 55 60 Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His 65 70 75 80 Ser Phe Gly Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val Val Val 85 90 95 Asp Met Lys His Phe Thr Gln Phe Ser Met Asp Asp Glu Thr Tyr Glu 100 105 110 Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu 115 120 125 Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile 130 135 140 Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg 145 150 155 160 Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu 165 170 175 Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val 180 185 190 Phe Phe Ala Val Lys Gly Ala Ala Ala Asn Phe Gly Ile Val Thr Glu 195 200 205 Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser 210 215 220 Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys 225 230 235 240 Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr 245 250 255 Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe 260 265 270 Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe 275 280 285 Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly 290 295 300 Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn 305 310 315 320 Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr 325 330 335 Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Ala Asn 340 345 350 His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly 355 360 365 Gly Ala Ile Asn Asp Ile Ala Glu Asp Ala Thr Ala Tyr Ala His Arg 370 375 380 Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Leu Gly Pro 385 390 395 400 Ile Ser Asp Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu 405 410 415 Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro 420 425 430 Asp Pro Arg Met Glu Asp Ala Gln Gln Lys Tyr Trp Arg Thr Asn Leu 435 440 445 Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe 450 455 460 His His Pro Gln Gly Val Met Pro Ala 465 470 <210> 165 <211> 473 <212> PRT <213> Aspergillus niger <400> 165 Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Ile Ser Ala 1 5 10 15 Leu Gly Gly Asn Ser Ala Leu Ala Val Phe Pro Asn Glu Leu Leu Trp 20 25 30 Thr Ala Asp Val His Glu Tyr Asn Leu Asn Leu Pro Val Thr Pro Ala 35 40 45 Ala Ile Thr Tyr Pro Glu Thr Ala Ala Gln Ile Ala Gly Val Val Lys 50 55 60 Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His 65 70 75 80 Ser Phe Gly Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val Val Val 85 90 95 Asp Met Lys His Phe Thr Gln Phe Ser Met Asp Asp Glu Thr Tyr Glu 100 105 110 Ala Val Ile Gly Pro Gly Thr Thr Leu Asn Asp Val Asp Ile Glu Leu 115 120 125 Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Val Cys Pro Thr Ile 130 135 140 Lys Thr Gly Gly His Phe Thr Ile Gly Gly Leu Gly Pro Thr Ala Arg 145 150 155 160 Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val Leu 165 170 175 Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Val 180 185 190 Phe Phe Ala Val Lys Gly Ala Ala Ala Asn Phe Gly Ile Val Thr Glu 195 200 205 Phe Lys Val Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser 210 215 220 Tyr Thr Phe Asn Leu Gly Ser Thr Ala Glu Lys Ala Gln Phe Val Lys 225 230 235 240 Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr 245 250 255 Asn Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu Phe 260 265 270 Phe Gly Ser Lys Glu Gln Tyr Asp Ala Leu Gly Leu Glu Asp His Phe 275 280 285 Ala Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu Gly 290 295 300 Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asn 305 310 315 320 Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Arg Gln Asp Thr 325 330 335 Leu Ile Pro Ser Ala Gly Ile Asp Glu Phe Phe Glu Tyr Ile Ala Asn 340 345 350 His Thr Ala Gly Thr Pro Ala Trp Phe Val Thr Leu Ser Leu Glu Gly 355 360 365 Gly Ala Ile Asn Asp Val Ala Glu Asp Ala Thr Ala Tyr Ala His Arg 370 375 380 Asp Val Leu Phe Trp Val Gln Leu Phe Met Val Asn Pro Val Gly Pro 385 390 395 400 Ile Ser Asp Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val Leu 405 410 415 Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys Pro 420 425 430 Asp Pro Arg Met Glu Asp Ala Gln Gln Lys Tyr Trp Arg Thr Asn Leu 435 440 445 Pro Arg Leu Gln Glu Leu Lys Glu Glu Leu Asp Pro Lys Asn Thr Phe 450 455 460 His His Pro Gln Gly Val Met Pro Ala 465 470 <210> 166 <211> 476 <212> PRT <213> Aspergillus terreus <400> 166 Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Ile Ser 1 5 10 15 Ala Val Gly Gly Asn Ala Ala His Val Ala Phe Gln Asp Gln Leu Leu 20 25 30 Tyr Gln Ala Thr Ala Val Asp Val Tyr Asn Leu Asn Ile Pro Val Thr 35 40 45 Pro Ala Ala Val Thr Tyr Pro Gln Ser Ala Asp Glu Val Ala Ala Val 50 55 60 Val Lys Cys Ala Ser Glu Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly 65 70 75 80 Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Gln Asn Gly Ala Ile 85 90 95 Val Val Asp Met Lys His Phe Ser Gln Phe Ser Met Asp Glu Ser Thr 100 105 110 Tyr Thr Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr 115 120 125 Glu Leu Tyr Asn Ala Gly His Arg Ala Met Ala His Gly Ile Cys Pro 130 135 140 Thr Ile Arg Thr Gly Gly His Leu Thr Ile Gly Gly Leu Gly Pro Thr 145 150 155 160 Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val 165 170 175 Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Glu Thr Gln Asn Gln 180 185 190 Asp Val Leu Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val 195 200 205 Thr Glu Phe Lys Val Arg Thr Glu Gln Ala Pro Gly Leu Ala Val Gln 210 215 220 Tyr Ser Tyr Thr Phe Asn Leu Gly Thr Pro Ala Glu Lys Ala Lys Leu 225 230 235 240 Leu Lys Asp Trp Gln Ala Phe Ile Ala Gln Glu Asp Leu Thr Trp Lys 245 250 255 Phe Tyr Ser Asn Met Val Ile Phe Asp Gly Gln Ile Ile Leu Glu Gly 260 265 270 Ile Phe Phe Gly Ser Lys Glu Glu Tyr Asp Ala Leu Asp Leu Glu Lys 275 280 285 Arg Phe Pro Thr Ser Glu Pro Gly Thr Leu Leu Val Leu Thr Asp Trp 290 295 300 Leu Gly Met Val Gly His Ser Leu Glu Asp Val Ile Leu Arg Leu Val 305 310 315 320 Gly Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro 325 330 335 Arg Thr Leu Ile Pro Asp Ser Ala Ile Asp Arg Phe Phe Asp Tyr Ile 340 345 350 His Glu Thr Asn Ala Gly Thr Leu Ala Trp Phe Val Thr Leu Ser Leu 355 360 365 Glu Gly Gly Ala Ile Asn Ala Val Pro Glu Asp Ala Thr Ala Tyr Gly 370 375 380 His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Val Asn Pro Leu 385 390 395 400 Gly Pro Ile Ser Gln Thr Ile Tyr Asp Phe Ala Asp Gly Leu Tyr Asp 405 410 415 Val Leu Ala Gln Ala Val Pro Glu Ser Ala Glu His Ala Tyr Leu Gly 420 425 430 Cys Pro Asp Pro Lys Met Pro Asp Ala Gln Arg Ala Tyr Trp Arg Gly 435 440 445 Asn Leu Pro Arg Leu Glu Glu Leu Lys Gly Glu Phe Asp Pro Lys Asp 450 455 460 Thr Phe His Asn Pro Gln Gly Val Ser Val Ala Val 465 470 475 <210> 167 <211> 476 <212> PRT <213> Aspergillus udagawae <400> 167 Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Ile Ser 1 5 10 15 Ala Val Gly Gly Asn Ala Ala His Val Ala Phe Gln Asp Gln Leu Leu 20 25 30 Tyr Gln Ala Thr Ala Val Glu Pro Tyr Asn Leu Asn Ile Pro Ile Thr 35 40 45 Pro Ala Ala Ile Thr Tyr Pro Gln Ser Ala Asp Glu Ile Ala Ala Val 50 55 60 Val Lys Cys Ala Ser Glu Tyr Gly Tyr Lys Val Gln Ala Arg Ser Gly 65 70 75 80 Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Glu Asp Gly Ala Ile 85 90 95 Val Val Glu Met Lys His Phe Ser Gln Phe Ser Met Asp Glu Ser Thr 100 105 110 Tyr Ile Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr 115 120 125 Glu Leu Tyr Asn Val Gly His Arg Ala Met Ala His Gly Ile Cys Pro 130 135 140 Thr Ile Arg Thr Gly Gly His Leu Thr Val Gly Gly Leu Gly Pro Thr 145 150 155 160 Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val 165 170 175 Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asp Thr Gln Asn Gln 180 185 190 Asp Ile Phe Phe Ala Ile Lys Gly Ala Ala Ala Ser Phe Gly Ile Val 195 200 205 Thr Glu Phe Lys Val Arg Thr Glu Gln Ala Pro Gly Leu Ala Val Gln 210 215 220 Tyr Ser Tyr Thr Phe Asn Leu Gly Thr Pro Ala Glu Lys Ala Lys Leu 225 230 235 240 Val Lys Asp Trp Gln Ala Phe Ile Ala Gln Glu Asn Leu Ser Trp Lys 245 250 255 Phe Tyr Ser Asn Met Val Val Phe Asp Gly Gln Ile Ile Leu Glu Gly 260 265 270 Leu Tyr Phe Gly Ser Lys Glu Glu Tyr Asp Ala Leu Gly Leu Glu Gln 275 280 285 Arg Phe Pro Pro Ser Glu Ala Gly Asn Val Leu Val Leu Thr Asp Trp 290 295 300 Leu Gly Met Val Gly His Glu Leu Glu Asp Thr Ile Leu Arg Leu Val 305 310 315 320 Gly Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro 325 330 335 Arg Ala Leu Ile Pro Asp Ser Ala Ile Asp Asp Leu Phe Asn Tyr Ile 340 345 350 His Glu Asn Asn Pro Gly Thr Leu Ala Trp Phe Val Thr Leu Ser Leu 355 360 365 Glu Gly Gly Ala Ile Asn Thr Val Pro Glu His Ala Thr Ala Tyr Gly 370 375 380 His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Val Ile Asn Pro Leu 385 390 395 400 Gly Pro Val Ser Gln Thr Thr Tyr Gly Phe Ala Asp Gly Met Tyr Asp 405 410 415 Val Leu Ala Gln Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly 420 425 430 Cys Pro Asp Pro Arg Met Pro Asn Ala Gln Gln Ala Tyr Trp Arg Ser 435 440 445 Asn Leu Pro Arg Leu Glu Glu Leu Lys Gly Asp Leu Asp Pro Lys Gly 450 455 460 Ile Phe His Asn Pro Gln Gly Val Met Val Val Ser 465 470 475 <210> 168 <211> 476 <212> PRT <213> Aspergillus fumigatus <400> 168 Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Leu Ser 1 5 10 15 Ala Val Gly Gly Asn His Ala His Val Ala Phe Gln Asp Gln Leu Leu 20 25 30 Tyr Gln Ala Thr Ala Val Glu Pro Tyr Asn Leu Asn Ile Pro Val Thr 35 40 45 Pro Ala Ala Val Thr Tyr Pro Gln Ser Ala Asp Glu Val Ala Ala Val 50 55 60 Val Lys Cys Ala Ala Asp Tyr Gly Tyr Lys Val Gln Ala Arg Ser Gly 65 70 75 80 Gly His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Glu Asp Gly Ala Ile 85 90 95 Val Val Asp Met Lys His Phe Asp Gln Phe Ser Met Asp Glu Ser Thr 100 105 110 Tyr Thr Ala Thr Ile Gly Pro Gly Ile Thr Leu Gly Asp Leu Asp Thr 115 120 125 Ala Leu Tyr Asn Ala Gly His Arg Ala Met Ala His Gly Ile Cys Pro 130 135 140 Thr Ile Arg Thr Gly Gly His Leu Thr Ile Gly Gly Leu Gly Pro Thr 145 150 155 160 Ala Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val 165 170 175 Val Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asp Thr Gln Asn Gln 180 185 190 Glu Ile Leu Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val 195 200 205 Thr Glu Phe Lys Val Arg Thr Glu Glu Ala Pro Gly Leu Ala Val Gln 210 215 220 Tyr Ser Phe Thr Phe Asn Leu Gly Thr Ala Ala Glu Lys Ala Lys Leu 225 230 235 240 Val Lys Asp Trp Gln Ala Phe Ile Ala Gln Glu Asp Leu Thr Trp Lys 245 250 255 Phe Tyr Ser Asn Met Asn Ile Ile Asp Gly Gln Ile Ile Leu Glu Gly 260 265 270 Ile Tyr Phe Gly Ser Lys Ala Glu Tyr Asp Ala Leu Gly Leu Glu Glu 275 280 285 Lys Phe Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp 290 295 300 Leu Gly Met Val Gly His Gly Leu Glu Asp Val Ile Leu Arg Leu Val 305 310 315 320 Gly Asn Ala Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Ala Pro 325 330 335 Arg Ala Leu Ile Pro Asp Ser Ala Ile Asp Asp Phe Phe Glu Tyr Ile 340 345 350 His Lys Asn Asn Pro Gly Thr Val Ser Trp Phe Val Thr Leu Ser Leu 355 360 365 Glu Gly Gly Ala Ile Asn Lys Val Pro Glu Asp Ala Thr Ala Tyr Gly 370 375 380 His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Ile Asn Pro Leu 385 390 395 400 Gly Pro Val Ser Gln Thr Ile Tyr Asp Phe Ala Asp Gly Leu Tyr Asp 405 410 415 Val Leu Ala Lys Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly 420 425 430 Cys Pro Asp Pro Arg Met Pro Asn Ala Gln Gln Ala Tyr Trp Arg Asn 435 440 445 Asn Leu Pro Arg Leu Glu Glu Leu Lys Gly Asp Leu Asp Pro Lys Asp 450 455 460 Ile Phe His Asn Pro Gln Gly Val Met Val Val Ser 465 470 475 <210> 169 <211> 474 <212> PRT <213> Aspergillus bombycis <400> 169 Met Gly Asn Thr Thr Ser Ile Ala Gly Arg Asp Cys Leu Val Ser Ala 1 5 10 15 Leu Gly Gly Asn Ala Gly Leu Val Ala Phe Gln Asp Gln Leu Leu Tyr 20 25 30 Gln Thr Thr Ala Val His Glu Tyr Asn Leu Asn Ile Pro Val Thr Pro 35 40 45 Ala Ala Val Thr Tyr Pro Glu Thr Ala Glu Gln Ile Ala Ala Val Val 50 55 60 Lys Cys Ala Ser Glu Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly 65 70 75 80 His Ser Phe Gly Asn Tyr Gly Leu Gly Gly Ala Asp Gly Ala Val Val 85 90 95 Val Asp Met Lys His Phe Ser Gln Phe Ser Met Asp Asp Gln Thr Tyr 100 105 110 Glu Ala Val Ile Gly Pro Gly Thr Thr Leu Gly Asp Val Asp Thr Glu 115 120 125 Leu Tyr Asn Asn Gly Lys Arg Ala Met Ala His Gly Ile Cys Pro Thr 130 135 140 Ile Ser Thr Gly Gly His Phe Thr Met Gly Gly Leu Gly Pro Thr Ala 145 150 155 160 Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val Val 165 170 175 Leu Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Glu 180 185 190 Val Phe Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr 195 200 205 Glu Phe Lys Val Arg Thr Gln Pro Ala Pro Gly Leu Ala Val Gln Tyr 210 215 220 Ser Tyr Thr Phe Asn Ile Gly Ser Ser Ala Glu Lys Ala Gln Phe Val 225 230 235 240 Lys Asp Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe 245 250 255 Tyr Thr Asn Met Val Ile Phe Asp Gly Asp Ile Ile Leu Glu Gly Leu 260 265 270 Phe Phe Gly Ser Gln Glu Gln Tyr Glu Ala Leu Gly Leu Glu Asp Arg 275 280 285 Phe Val Pro Lys Asn Pro Gly Asn Ile Leu Val Leu Thr Asp Trp Leu 290 295 300 Gly Met Val Gly His Ala Leu Glu Asp Thr Ile Leu Arg Leu Val Gly 305 310 315 320 Asn Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Asp 325 330 335 Thr Leu Ile Pro Ala Ser Gly Ile Asp Glu Phe Phe Asp Tyr Ile Glu 340 345 350 Asn His Lys Ala Gly Thr Leu Thr Trp Phe Val Thr Leu Ser Leu Glu 355 360 365 Gly Gly Ala Ile Asn Asp Val Pro Glu Asp Ala Thr Ala Tyr Gly His 370 375 380 Arg Asp Val Leu Phe Trp Val Gln Ile Phe Met Ala Ser Pro Thr Gly 385 390 395 400 Pro Val Ser Ser Thr Thr Tyr Asp Phe Ala Asp Gly Leu Tyr Asn Val 405 410 415 Leu Thr Lys Ala Val Pro Glu Ser Glu Gly His Ala Tyr Leu Gly Cys 420 425 430 Pro Asp Pro Lys Met Ala Asp Ala Gln Gln Lys Tyr Trp Arg Gln Asn 435 440 445 Leu Pro Arg Leu Glu Glu Leu Lys Ala Thr Leu Asp Pro Lys Asp Thr 450 455 460 Phe His Asn Pro Gln Gly Ile Leu Pro Ala 465 470 <210> 170 <211> 694 <212> PRT <213> Purpureocillium lilacinum <400> 170 Met Trp Leu Ser Thr Met Asn Gly Ser Ala Ser Arg Arg Ser Asp Pro 1 5 10 15 Val Ser Arg Lys Ile Val Cys Asp Gly His Ala Ser Ala His Glu Val 20 25 30 Arg Thr Asp Asn Glu Ala Ala Arg Asp Val Pro Ser Arg Thr Ala Val 35 40 45 Asn Lys Glu Arg Lys Gln Gly Ser Gly Pro Pro Gly Ala Met Gln Arg 50 55 60 Gly Phe His Ala Ala His Lys Pro Asn Glu Met Val Pro Gln Asp Gly 65 70 75 80 Pro Leu Gly Arg Thr Ala Gln Leu Phe Arg Leu Ala Pro Ala Cys Gln 85 90 95 Ser Glu Pro Thr Arg Ala Pro Gly Gln Pro Ser Asp Leu Arg Leu Arg 100 105 110 Gln Ile Pro Leu Ala Thr Glu Gln Ala Ala Arg Thr Leu Ala Arg Met 115 120 125 Arg Pro Ala Arg Phe Thr Phe Pro Tyr Gly Arg Ala Ala Glu Asp Asp 130 135 140 Cys Tyr Leu Lys Lys Glu Asp Glu Gly His Asp Gln Ser His Pro Thr 145 150 155 160 Ser Val Leu Val Gly Val Pro Pro Phe Thr Arg Arg Cys Ala Ala Ala 165 170 175 Glu Thr Phe Lys Asp Thr Arg Ala Arg Ala Pro Gly Thr Gln Pro Thr 180 185 190 Asp Thr Thr Ser Thr Gly Ala Ser Pro Ser Trp Thr Leu Ser Pro Leu 195 200 205 Leu Ser Leu Ser Ala Thr Asp Asp Ser Val Pro Ser Lys Met Gly Asn 210 215 220 Gly Gln Ser Thr Pro Leu Gln Gln Cys Leu Asn Thr Val Cys Asn Gly 225 230 235 240 Arg Leu Gly Cys Val Ala Phe Pro Ser Asp Ala Leu Tyr Gln Ala Ala 245 250 255 Trp Val Lys Pro Tyr Asn Leu Asp Val Pro Val Thr Pro Ile Ala Val 260 265 270 Phe Lys Pro Ser Ser Thr Glu Asp Val Ala Gly Ala Ile Lys Cys Ala 275 280 285 Val Ala Ser Asn Val His Val Gln Ala Lys Ser Gly Gly His Ser Tyr 290 295 300 Ala Asn Phe Gly Leu Gly Gly Gln Asp Gly Glu Leu Met Ile Asp Leu 305 310 315 320 Ala Asn Leu Gln Asp Phe His Met Asp Lys Thr Ser Trp Gln Ala Thr 325 330 335 Phe Gly Ala Gly Tyr Arg Leu Gly Asp Leu Asp Lys Lys Leu Gln Ala 340 345 350 Asn Gly Asn Arg Ala Ile Ala His Gly Thr Cys Pro Gly Val Gly Ile 355 360 365 Gly Gly His Ala Thr Ile Gly Gly Leu Gly Pro Met Ser Arg Met Trp 370 375 380 Gly Ser Ala Leu Asp His Val Leu Ser Val Gln Val Val Thr Ala Asp 385 390 395 400 Gly Ser Ile Lys Asn Ala Ser Glu Ser Glu Asn Ser Asp Leu Phe Trp 405 410 415 Ala Leu Arg Gly Ala Gly Ala Ser Phe Gly Val Ile Thr Lys Phe Thr 420 425 430 Val Lys Thr His Pro Ala Pro Gly Ser Val Val Gln Tyr Thr Tyr Lys 435 440 445 Ile Ser Leu Gly Ser Gln Ala Gln Met Ala Pro Val Tyr Ala Ala Trp 450 455 460 Gln Ala Leu Ala Gly Asp Pro Lys Leu Asp Arg Arg Phe Ser Thr Leu 465 470 475 480 Phe Ile Ala Glu Pro Leu Gly Ala Leu Ile Thr Gly Thr Phe Tyr Gly 485 490 495 Thr Lys Ala Glu Tyr Glu Ala Thr Gly Ile Ala Ala Arg Leu Pro Ser 500 505 510 Gly Gly Thr Leu Asp Leu Lys Leu Leu Asp Trp Leu Gly Ser Leu Ala 515 520 525 His Ile Ala Glu Val Val Gly Leu Thr Leu Gly Asp Ile Pro Thr Ser 530 535 540 Phe Tyr Gly Lys Ser Leu Ala Leu Arg Glu Glu Asp Met Leu Asp Arg 545 550 555 560 Thr Ser Ile Asp Gly Leu Phe Arg Tyr Met Gly Asp Ala Asp Ala Gly 565 570 575 Thr Leu Leu Trp Phe Val Ile Phe Asn Ser Glu Gly Gly Ala Met Ala 580 585 590 Asp Thr Pro Ala Gly Ala Thr Ala Tyr Pro His Arg Asp Lys Leu Ile 595 600 605 Met Tyr Gln Ser Tyr Val Ile Gly Ile Pro Thr Leu Thr Lys Ala Thr 610 615 620 Arg Asp Phe Ala Asp Gly Val His Asp Arg Val Arg Met Gly Ala Pro 625 630 635 640 Ser Ala Asn Ser Thr Tyr Ala Gly Tyr Ile Asp Arg Thr Leu Ser Arg 645 650 655 Glu Ala Ala Gln Glu Phe Tyr Trp Gly Ala Gln Leu Pro Arg Leu Arg 660 665 670 Glu Val Lys Lys Ala Trp Asp Pro Lys Asp Val Phe His Asn Pro Gln 675 680 685 Ser Val Asp Pro Ala Glu 690 <210> 171 <211> 476 <212> PRT <213> Penicillium expansum <400> 171 Met Gly Asn Thr Thr Ser Ile Gly Val Val Arg Asp Cys Leu Thr Ser 1 5 10 15 Ala Val Gly Gly Val Ala Ala His Val Ala Phe Gln Asp Thr Leu Leu 20 25 30 Tyr Gln Thr Ser Ala Val Lys Pro Tyr Asn Leu Asn Val Pro Val Thr 35 40 45 Pro Ala Ala Val Thr Tyr Pro Gln Ser Ala Asn Glu Val Ala Ala Ile 50 55 60 Val Lys Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly 65 70 75 80 Gly His Ser Phe Gly Asn Phe Gly Leu Gly Gly Gln Asn Gly Ala Ile 85 90 95 Val Ile Asp Met Lys His Phe Ser Gln Phe Ser Met Asp Glu Ser Thr 100 105 110 Phe Ile Ala Thr Ile Gly Pro Gly Thr Thr Leu Gly Asn Leu Asp Thr 115 120 125 Glu Leu Tyr Asn Ala Gly Asn Arg Ala Met Ala His Gly Ile Cys Pro 130 135 140 Ser Ile Arg Thr Gly Gly His Leu Thr Val Gly Gly Leu Gly Pro Thr 145 150 155 160 Ser Arg Gln Trp Gly Leu Ala Leu Asp His Val Glu Glu Val Glu Val 165 170 175 Val Leu Ala Asn Ser Ser Val Val Arg Ala Ser Asp Thr Gln Asn Gln 180 185 190 Asp Val Leu Phe Ala Ile Lys Gly Ala Ala Ala Ser Phe Gly Ile Val 195 200 205 Thr Glu Phe Lys Val Arg Thr Glu Glu Ala Pro Gly Leu Ala Val Arg 210 215 220 Tyr Ser Tyr Ser Phe Asn Leu Gly Thr Pro Ala Glu Lys Ala Lys Leu 225 230 235 240 Ala Lys Asp Trp Gln Ala Tyr Ile Ala Gln Glu Asn Leu Thr Trp Lys 245 250 255 Phe Ser Ser Asn Leu Ile Ile Phe Asp Gly Gln Ile Ile Leu Glu Gly 260 265 270 Ile Phe Phe Gly Ser Lys Glu Glu Tyr Asp Lys Leu Asn Leu Glu Lys 275 280 285 Lys Phe Pro Thr Ser Glu Pro Gly Thr Val Leu Val Ile Thr Asn Trp 290 295 300 Leu Gly Met Ile Gly His Ala Leu Glu Asp Thr Ile Leu Arg Leu Ile 305 310 315 320 Gly Asp Ser Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro 325 330 335 Asn Thr Leu Ile Phe Asp Ser Thr Ile Asp Glu Phe Phe Asp Tyr Ile 340 345 350 His Lys Ala Asn Ala Gly Thr Leu Ala Trp Ser Val Met Leu Ser Leu 355 360 365 Glu Gly Gly Ala Ile Asn Ala Val Pro Lys Asn Ala Thr Ala Tyr Gly 370 375 380 His Arg Asp Val Leu Phe Trp Val Gln Ile Phe Val Val Asn Pro Leu 385 390 395 400 Gly Pro Ile Ser Gln Thr Thr Tyr Gly Phe Thr Asp Gly Leu Tyr Asn 405 410 415 Ile Leu Ala Arg Gly Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly 420 425 430 Cys Pro Asp Pro Lys Met Pro Asp Ala Gln Arg Ala Tyr Trp Arg Asn 435 440 445 Asn Tyr Pro Arg Leu Glu Glu Leu Lys Arg Asp Leu Asp Pro Lys Asp 450 455 460 Ile Phe His Asn Pro Gln Gly Val Arg Val Ala Ser 465 470 475 <210> 172 <211> 474 <212> PRT <213> Penicillium rubens <400> 172 Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Val Ser 1 5 10 15 Ala Val Gly Pro Ala His Val Thr Phe Gln Asp Ala Leu Leu Tyr Gln 20 25 30 Thr Thr Ala Val Asp Pro Tyr Asn Leu Asn Ile Pro Val Thr Pro Ala 35 40 45 Ala Val Thr Tyr Pro Gln Ser Ala Glu Glu Ile Ala Ala Val Val Lys 50 55 60 Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His 65 70 75 80 Ser Phe Gly Asn Tyr Gly Leu Gly Gly Gln Asn Gly Ala Ile Val Val 85 90 95 Asp Met Lys His Phe Ser Gln Phe Ser Met Asp Glu Ser Thr Phe Val 100 105 110 Ala Thr Ile Gly Pro Gly Thr Thr Leu Gly Asp Leu Asp Thr Glu Leu 115 120 125 Tyr Asn Ala Gly Gly Arg Ala Met Ala His Gly Ile Cys Pro Thr Ile 130 135 140 Arg Thr Gly Gly His Leu Thr Val Gly Gly Leu Gly Pro Thr Ala Arg 145 150 155 160 Gln Trp Gly Leu Ala Leu Asp His Ile Glu Glu Val Glu Val Val Leu 165 170 175 Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Ile 180 185 190 Leu Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr Glu 195 200 205 Phe Lys Val Arg Thr Gln Glu Ala Pro Gly Leu Ala Val Gln Tyr Ser 210 215 220 Phe Thr Phe Asn Leu Gly Ser Pro Ala Gln Lys Ala Lys Leu Val Lys 225 230 235 240 Asp Trp Gln Ala Phe Ile Ala Gln Glu Asn Leu Ser Trp Lys Phe Tyr 245 250 255 Ser Asn Leu Val Ile Phe Asp Gly Gln Ile Ile Leu Glu Gly Ile Phe 260 265 270 Phe Gly Ser Lys Glu Glu Tyr Asp Glu Leu Asp Leu Glu Lys Arg Phe 275 280 285 Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp Leu Gly 290 295 300 Met Ile Gly His Ala Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asp 305 310 315 320 Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Asp Thr 325 330 335 Leu Ile Pro Asp Ser Ala Ile Asp Asp Phe Phe Asp Tyr Ile His Lys 340 345 350 Thr Asn Ala Gly Thr Leu Ala Trp Phe Val Thr Leu Ser Leu Glu Gly 355 360 365 Gly Ala Ile Asn Ser Val Ser Glu Asp Ala Thr Ala Tyr Gly His Arg 370 375 380 Asp Val Leu Phe Trp Phe Gln Val Phe Val Val Asn Pro Leu Gly Pro 385 390 395 400 Ile Ser Gln Thr Thr Tyr Asp Phe Thr Asn Gly Leu Tyr Asp Val Leu 405 410 415 Ala Gln Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly Cys Pro 420 425 430 Asp Pro Lys Met Pro Asp Ala Gln Arg Ala Tyr Trp Arg Ser Asn Leu 435 440 445 Pro Arg Leu Glu Asp Leu Lys Gly Asp Leu Asp Pro Lys Asp Thr Phe 450 455 460 His Asn Pro Gln Gly Val Gln Val Gly Pro 465 470 <210> 173 <211> 474 <212> PRT <213> Penicillium flavigenum <400> 173 Met Gly Asn Thr Thr Ser Ile Ala Ala Gly Arg Asp Cys Leu Val Ser 1 5 10 15 Ala Val Gly Pro Ala His Val Thr Phe Gln Asp Ala Leu Leu Tyr Gln 20 25 30 Thr Thr Ala Val Asp Pro Tyr Asn Leu Asn Ile Pro Val Thr Pro Ala 35 40 45 Ala Val Thr Tyr Pro Gln Ser Ala Glu Glu Ile Ala Ala Val Val Lys 50 55 60 Cys Ala Ser Asp Tyr Asp Tyr Lys Val Gln Ala Arg Ser Gly Gly His 65 70 75 80 Ser Phe Gly Asn Tyr Gly Leu Gly Gly Gln Asn Gly Ala Ile Val Val 85 90 95 Glu Met Lys His Phe Ser Gln Phe Ser Met Asp Glu Ser Thr Phe Val 100 105 110 Ala Thr Ile Gly Pro Gly Thr Thr Leu Gly Asp Leu Asp Thr Glu Leu 115 120 125 Tyr Asn Thr Gly Gly Arg Ala Met Ala His Gly Ile Cys Pro Thr Ile 130 135 140 Arg Thr Gly Gly His Leu Thr Val Gly Gly Leu Gly Pro Thr Ala Arg 145 150 155 160 Gln Trp Gly Leu Ala Leu Asp His Ile Glu Glu Val Glu Val Val Leu 165 170 175 Ala Asn Ser Ser Ile Val Arg Ala Ser Asn Thr Gln Asn Gln Asp Ile 180 185 190 Leu Phe Ala Val Lys Gly Ala Ala Ala Ser Phe Gly Ile Val Thr Glu 195 200 205 Phe Lys Val Arg Thr Gln Glu Ala Pro Gly Leu Ala Val Gln Tyr Ser 210 215 220 Phe Thr Phe Asn Leu Gly Ser Ala Ala Gln Lys Ala Lys Leu Val Lys 225 230 235 240 Asp Trp Gln Ala Phe Ile Ala Gln Glu Asn Leu Ser Trp Lys Phe Tyr 245 250 255 Ser Asn Leu Val Ile Phe Asp Gly Gln Ile Ile Leu Glu Gly Ile Phe 260 265 270 Phe Gly Ser Lys Glu Glu Tyr Asp Glu Leu Asp Leu Glu Lys Arg Phe 275 280 285 Pro Thr Ser Glu Pro Gly Thr Val Leu Val Leu Thr Asp Trp Leu Gly 290 295 300 Met Ile Gly His Gly Leu Glu Asp Thr Ile Leu Lys Leu Val Gly Asp 305 310 315 320 Thr Pro Thr Trp Phe Tyr Ala Lys Ser Leu Gly Phe Thr Pro Asp Thr 325 330 335 Leu Ile Pro Asp Ser Ala Ile Asp Asp Phe Phe Asp Tyr Ile His Lys 340 345 350 Thr Asn Ala Gly Thr Leu Ala Trp Phe Val Thr Leu Ser Leu Glu Gly 355 360 365 Gly Ala Ile Asn Ser Val Ser Glu Asp Ala Thr Ala Tyr Gly His Arg 370 375 380 Asp Val Leu Phe Trp Phe Gln Val Phe Val Val Asn Pro Leu Gly Pro 385 390 395 400 Ile Ser Gln Thr Thr Tyr Asp Phe Thr Asn Gly Leu Tyr Asp Val Leu 405 410 415 Ala Gln Ala Val Pro Glu Ser Ala Gly His Ala Tyr Leu Gly Cys Pro 420 425 430 Asp Pro Lys Met Pro Asp Ala Gln Arg Ala Tyr Trp Arg Ser Asn Leu 435 440 445 Pro Arg Leu Glu Asp Leu Lys Gly Asp Leu Asp Pro Lys Asp Thr Phe 450 455 460 His Asn Pro Gln Gly Val Gln Val Gly Pro 465 470 <210> 174 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 174 Lys Val Gln Ala Arg Ser Gly Gly His 1 5 <210> 175 <400> 175 000 <210> 176 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (10)..(10) <223> Xaa is Val or Ile <220> <221> misc_feature <222> (11)..(11) <223> Xaa is Phe or Leu <220> <221> misc_feature <222> (14)..(14) <223> Xaa is Val or Ile <400> 176 Arg Ala Ser Asn Thr Gln Asn Gln Asp Xaa Xaa Phe Ala Xaa Lys 1 5 10 15 <210> 177 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 177 Arg Ala Ser Asn Thr Gln Asn Gln Asp Val Phe Phe Ala Val Lys 1 5 10 15 <210> 178 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 178 Arg Ala Ser Asn Thr Gln Asn Gln Asp Ile Leu Phe Ala Val Lys 1 5 10 15 <210> 179 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 179 Arg Ala Ser Asn Thr Gln Asn Gln Asp Ile Leu Phe Ala Ile Lys 1 5 10 15 <210> 180 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 180 Arg Ala Ser Asn Thr Gln Asn Gln Asp Val Leu Phe Ala Val Lys 1 5 10 15 <210> 181 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (5)..(5) <223> Xaa is Lys or Arg <400> 181 Cys Pro Thr Ile Xaa Thr Gly Gly His 1 5 <210> 182 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 182 Cys Pro Thr Ile Lys Thr Gly Gly His 1 5 <210> 183 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 183 Cys Pro Thr Ile Arg Thr Gly Gly His 1 5 <210> 184 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (16)..(16) <223> Xaa is Ala or Pro <220> <221> misc_feature <222> (23)..(23) <223> Xaa is Ala or Gly <400> 184 Trp Phe Val Thr Leu Ser Leu Glu Gly Gly Ala Ile Asn Asp Val Xaa 1 5 10 15 Glu Asp Ala Thr Ala Tyr Xaa His 20 <210> 185 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 185 Trp Phe Val Thr Leu Ser Leu Glu Gly Gly Ala Ile Asn Asp Val Ala 1 5 10 15 Glu Asp Ala Thr Ala Tyr Ala His 20 <210> 186 <211> 37 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (2)..(2) <223> Xaa is Ile or Val <220> <221> misc_feature <222> (4)..(4) <223> Xaa is Asp, Gln, or Glu <220> <221> misc_feature <222> (8)..(8) <223> Xaa is Glu, Asp, or Gly <220> <221> misc_feature <222> (10)..(10) <223> Xaa is Thr or Ala <220> <221> misc_feature <222> (19)..(19) <223> Xaa is Arg, Gln, or Lys <220> <221> misc_feature <222> (25)..(25) <223> Xaa is Val or Ala <220> <221> misc_feature <222> (36)..(36) <223> Xaa is Arg or Lys <400> 186 Pro Xaa Ser Xaa Thr Thr Tyr Xaa Phe Xaa Asp Gly Leu Tyr Asp Val 1 5 10 15 Leu Ala Xaa Ala Val Pro Glu Ser Xaa Gly His Ala Tyr Leu Gly Cys 20 25 30 Pro Asp Pro Xaa Met 35 <210> 187 <211> 37 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 187 Pro Ile Ser Asp Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val 1 5 10 15 Leu Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys 20 25 30 Pro Asp Pro Arg Met 35 <210> 188 <211> 37 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 188 Pro Ile Ser Glu Thr Thr Tyr Glu Phe Thr Asp Gly Leu Tyr Asp Val 1 5 10 15 Leu Ala Arg Ala Val Pro Glu Ser Val Gly His Ala Tyr Leu Gly Cys 20 25 30 Pro Asp Pro Arg Met 35 <210> 189 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (5)..(5) <223> Xaa is Thr, Asn, or Ser <400> 189 Met Lys His Phe Xaa Gln Phe Ser Met 1 5 <210> 190 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 190 Met Lys His Phe Thr Gln Phe Ser Met 1 5 <210> 191 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 191 Met Lys His Phe Ser Gln Phe Ser Met 1 5 <210> 192 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 192 Met Lys His Phe Asn Gln Phe Ser Met 1 5 <210> 193 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (2)..(2) <223> Xaa is Glu or Gln <220> <221> misc_feature <222> (3)..(3) <223> Xaa is Thr or Ser <220> <221> misc_feature <222> (5)..(5) <223> Xaa is Glu, Ala, or Asp <220> <221> misc_feature <222> (6)..(6) <223> Xaa is Gln or Glu <220> <221> misc_feature <222> (9)..(9) <223> Xaa is Gly or Ala <220> <221> misc_feature <222> (10)..(10) <223> Xaa is Val or Ile <400> 193 Pro Xaa Xaa Ala Xaa Xaa Ile Ala Xaa Xaa Val Lys Cys 1 5 10 <210> 194 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 194 Pro Glu Thr Ala Glu Gln Ile Ala Gly Ile Val Lys Cys 1 5 10 <210> 195 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 195 Pro Gln Ser Ala Asp Glu Ile Ala Ala Val Val Lys Cys 1 5 10 <210> 196 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 196 Pro Glu Thr Ala Ala Gln Ile Ala Gly Val Val Lys Cys 1 5 10 <210> 197 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 197 Pro Gln Ser Ala Glu Glu Ile Ala Ala Val Val Lys Cys 1 5 10 <210> 198 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 198 Pro Glu Thr Ala Glu Gln Ile Ala Gly Val Val Lys Cys 1 5 10 <210> 199 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 199 Pro Glu Thr Ala Glu Gln Ile Ala Ala Val Val Lys Cys 1 5 10 <210> 200 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (5)..(5) <223> Xaa is Ile or Val <220> <221> misc_feature <222> (8)..(8) <223> Xaa is Leu or Val <220> <221> misc_feature <222> (12)..(12) <223> Xaa is Ser or Ala <220> <221> misc_feature <222> (14)..(14) <223> Xaa is Leu or His <220> <221> misc_feature <222> (15)..(15) <223> Xaa is Ala or Val <220> <221> misc_feature <222> (16)..(16) <223> Xaa is Ala or Val <220> <221> misc_feature <222> (18)..(18) <223> Xaa is Pro or Gln <220> <221> misc_feature <222> (19)..(19) <223> Xaa is Asn or Asp <220> <221> misc_feature <222> (20)..(20) <223> Xaa is Gln or Glu <220> <221> misc_feature <222> (23)..(23) <223> Xaa is Trp or Tyr <400> 200 Arg Asp Cys Leu Xaa Ser Ala Xaa Gly Gly Asn Xaa Ala Xaa Xaa Xaa 1 5 10 15 Phe Xaa Xaa Xaa Leu Leu Xaa 20 <210> 201 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 201 Arg Asp Cys Leu Ile Ser Ala Val Gly Gly Asn Ala Ala His Val Ala 1 5 10 15 Phe Gln Asp Gln Leu Leu Tyr 20 <210> 202 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 202 Arg Asp Cys Leu Ile Ser Ala Leu Gly Gly Asn Ser Ala Leu Ala Val 1 5 10 15 Phe Pro Asn Glu Leu Leu Trp 20 <210> 203 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 203 Arg Asp Cys Leu Ile Ser Ala Leu Gly Gly Asn Ser Ala Leu Ala Ala 1 5 10 15 Phe Pro Asn Glu Leu Leu Trp 20 <210> 204 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 204 Arg Asp Cys Leu Ile Ser Ala Leu Gly Gly Asn Ser Ala Leu Ala Val 1 5 10 15 Phe Pro Asn Gln Leu Leu Trp 20 <210> 205 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 205 Arg Asp Cys Leu Ile Ser Ala Leu Gly Gly Asn Ser Ala Leu Ala Ala 1 5 10 15 Phe Pro Asn Gln Leu Leu Trp 20 <210> 206 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 206 Arg Asp Cys Leu Val Ser Ala Leu Gly Gly Asn Ser Ala Leu Ala Ala 1 5 10 15 Phe Pro Asn Gln Leu Leu Trp 20 <210> 207 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (3)..(3) <223> Xaa is Glu or Gln <220> <221> misc_feature <222> (4)..(4) <223> Xaa is Pro or Gln <400> 207 Arg Thr Xaa Xaa Ala Pro Gly Leu Ala Val Gln Tyr Ser Tyr 1 5 10 <210> 208 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 208 Arg Thr Glu Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser Tyr 1 5 10 <210> 209 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 209 Arg Thr Glu Gln Ala Pro Gly Leu Ala Val Gln Tyr Ser Tyr 1 5 10 <210> 210 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 210 Arg Thr Gln Pro Ala Pro Gly Leu Ala Val Gln Tyr Ser Tyr 1 5 10 <210> 211 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <220> <221> misc_feature <222> (3)..(3) <223> Xaa is Ser or Ala <220> <221> misc_feature <222> (6)..(6) <223> Xaa is Ser or Ala <220> <221> misc_feature <222> (7)..(7) <223> Xaa is Ala or Gln <220> <221> misc_feature <222> (8)..(8) <223> Xaa is Lys or Glu <220> <221> misc_feature <222> (12)..(12) <223> Xaa is Arg or Trp <220> <221> misc_feature <222> (13)..(13) <223> Xaa is Gln or Lys <220> <221> misc_feature <222> (16)..(16) <223> Xaa is Asn, Ser, or Thr <400> 211 Trp Gln Xaa Phe Ile Xaa Xaa Xaa Asn Leu Thr Xaa Xaa Phe Tyr Xaa 1 5 10 15 Asn Met <210> 212 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 212 Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr Asn 1 5 10 15 Asn Met <210> 213 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 213 Trp Gln Ser Phe Ile Ser Ala Lys Asn Leu Thr Arg Gln Phe Tyr Thr 1 5 10 15 Asn Met <210> 214 <211> 517 <212> PRT <213> C. sativa <400> 214 Asn Pro Arg Glu Asn Phe Leu Lys Cys Phe Ser Lys His Ile Pro Asn 1 5 10 15 Asn Val Ala Asn Pro Lys Leu Val Tyr Thr Gln His Asp Gln Leu Tyr 20 25 30 Met Ser Ile Leu Asn Ser Thr Ile Gln Asn Leu Arg Phe Ile Ser Asp 35 40 45 Thr Thr Pro Lys Pro Leu Val Ile Val Thr Pro Ser Asn Asn Ser His 50 55 60 Ile Gln Ala Thr Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile Arg 65 70 75 80 Thr Arg Ser Gly Gly His Asp Ala Glu Gly Met Ser Tyr Ile Ser Gln 85 90 95 Val Pro Phe Val Val Val Asp Leu Arg Asn Met His Ser Ile Lys Ile 100 105 110 Asp Val His Ser Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu Gly 115 120 125 Glu Val Tyr Tyr Trp Ile Asn Glu Lys Asn Glu Asn Leu Ser Phe Pro 130 135 140 Gly Gly Tyr Cys Pro Thr Val Gly Val Gly Gly His Phe Ser Gly Gly 145 150 155 160 Gly Tyr Gly Ala Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn Ile 165 170 175 Ile Asp Ala His Leu Val Asn Val Asp Gly Lys Val Leu Asp Arg Lys 180 185 190 Ser Met Gly Glu Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly Gly Glu 195 200 205 Asn Phe Gly Ile Ile Ala Ala Trp Lys Ile Lys Leu Val Ala Val Pro 210 215 220 Ser Lys Ser Thr Ile Phe Ser Val Lys Lys Asn Met Glu Ile His Gly 225 230 235 240 Leu Val Lys Leu Phe Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp 245 250 255 Lys Asp Leu Val Leu Met Thr His Phe Ile Thr Lys Asn Ile Thr Asp 260 265 270 Asn His Gly Lys Asn Lys Thr Thr Val His Gly Tyr Phe Ser Ser Ile 275 280 285 Phe His Gly Gly Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe 290 295 300 Pro Glu Leu Gly Ile Lys Lys Thr Asp Cys Lys Glu Phe Ser Trp Ile 305 310 315 320 Asp Thr Thr Ile Phe Tyr Ser Gly Val Val Asn Phe Asn Thr Ala Asn 325 330 335 Phe Lys Lys Glu Ile Leu Leu Asp Arg Ser Ala Gly Lys Lys Thr Ala 340 345 350 Phe Ser Ile Lys Leu Asp Tyr Val Lys Lys Pro Ile Pro Glu Thr Ala 355 360 365 Met Val Lys Ile Leu Glu Lys Leu Tyr Glu Glu Asp Val Gly Ala Gly 370 375 380 Met Tyr Val Leu Tyr Pro Tyr Gly Gly Ile Met Glu Glu Ile Ser Glu 385 390 395 400 Ser Ala Ile Pro Phe Pro His Arg Ala Gly Ile Met Tyr Glu Leu Trp 405 410 415 Tyr Thr Ala Ser Trp Glu Lys Gln Glu Asp Asn Glu Lys His Ile Asn 420 425 430 Trp Val Arg Ser Val Tyr Asn Phe Thr Thr Pro Tyr Val Ser Gln Asn 435 440 445 Pro Arg Leu Ala Tyr Leu Asn Tyr Arg Asp Leu Asp Leu Gly Lys Thr 450 455 460 Asn His Ala Ser Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu 465 470 475 480 Lys Tyr Phe Gly Lys Asn Phe Asn Arg Leu Val Lys Val Lys Thr Lys 485 490 495 Val Asp Pro Asn Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu 500 505 510 Pro Pro His His His 515 <210> 215 <211> 516 <212> PRT <213> C. sativa <400> 215 Asn Pro Arg Glu Asn Phe Leu Lys Cys Phe Ser Gln Tyr Ile Pro Asn 1 5 10 15 Asn Ala Thr Asn Leu Lys Leu Val Tyr Thr Gln Asn Asn Pro Leu Tyr 20 25 30 Met Ser Val Leu Asn Ser Thr Ile His Asn Leu Arg Phe Thr Ser Asp 35 40 45 Thr Thr Pro Lys Pro Leu Val Ile Val Thr Pro Ser His Val Ser His 50 55 60 Ile Gln Gly Thr Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile Arg 65 70 75 80 Thr Arg Ser Gly Gly His Asp Ser Glu Gly Met Ser Tyr Ile Ser Gln 85 90 95 Val Pro Phe Val Ile Val Asp Leu Arg Asn Met Arg Ser Ile Lys Ile 100 105 110 Asp Val His Ser Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu Gly 115 120 125 Glu Val Tyr Tyr Trp Val Asn Glu Lys Asn Glu Asn Leu Ser Leu Ala 130 135 140 Ala Gly Tyr Cys Pro Thr Val Cys Ala Gly Gly His Phe Gly Gly Gly 145 150 155 160 Gly Tyr Gly Pro Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn Ile 165 170 175 Ile Asp Ala His Leu Val Asn Val His Gly Lys Val Leu Asp Arg Lys 180 185 190 Ser Met Gly Glu Asp Leu Phe Trp Ala Leu Arg Gly Gly Gly Ala Glu 195 200 205 Ser Phe Gly Ile Ile Val Ala Trp Lys Ile Arg Leu Val Ala Val Pro 210 215 220 Lys Ser Thr Met Phe Ser Val Lys Lys Ile Met Glu Ile His Glu Leu 225 230 235 240 Val Lys Leu Val Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp Lys 245 250 255 Asp Leu Leu Leu Met Thr His Phe Ile Thr Arg Asn Ile Thr Asp Asn 260 265 270 Gln Gly Lys Asn Lys Thr Ala Ile His Thr Tyr Phe Ser Ser Val Phe 275 280 285 Leu Gly Gly Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe Pro 290 295 300 Glu Leu Gly Ile Lys Lys Thr Asp Cys Arg Gln Leu Ser Trp Ile Asp 305 310 315 320 Thr Ile Ile Phe Tyr Ser Gly Val Val Asn Tyr Asp Thr Asp Asn Phe 325 330 335 Asn Lys Glu Ile Leu Leu Asp Arg Ser Ala Gly Gln Asn Gly Ala Phe 340 345 350 Lys Ile Lys Leu Asp Tyr Val Lys Lys Pro Ile Pro Glu Ser Val Phe 355 360 365 Val Gln Ile Leu Glu Lys Leu Tyr Glu Glu Asp Ile Gly Ala Gly Met 370 375 380 Tyr Ala Leu Tyr Pro Tyr Gly Gly Ile Met Asp Glu Ile Ser Glu Ser 385 390 395 400 Ala Ile Pro Phe Pro His Arg Ala Gly Ile Leu Tyr Glu Leu Trp Tyr 405 410 415 Ile Cys Ser Trp Glu Lys Gln Glu Asp Asn Glu Lys His Leu Asn Trp 420 425 430 Ile Arg Asn Ile Tyr Asn Phe Met Thr Pro Tyr Val Ser Lys Asn Pro 435 440 445 Arg Leu Ala Tyr Leu Asn Tyr Arg Asp Leu Asp Ile Gly Ile Asn Asp 450 455 460 Pro Lys Asn Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu Lys 465 470 475 480 Tyr Phe Gly Lys Asn Phe Asp Arg Leu Val Lys Val Lys Thr Leu Val 485 490 495 Asp Pro Asn Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu Pro 500 505 510 Arg His Arg His 515

Claims

말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포로서, TS는 서열번호 27 또는 25와 적어도 90% 동일한 서열을 포함하고, 숙주 세포는 적어도 하나의 칸나비노이드를 생성할 수 있는 것인 숙주 세포.
제1항에 있어서, 서열번호 27의 서열에 비해, TS는 서열번호 27의 위치 33, 39, 55, 57, 61, 62, 63, 71, 112, 122, 126, 129, 131, 180, 183, 202, 256, 257, 260, 287, 295, 341, 386, 392, 394, 398, 410, 423, 426, 450, 및/또는 472에 상응하는 잔기에서 아미노산 치환을 포함하는 것인 숙주 세포.
제2항에 있어서, TS는 다음을 포함하는 것인 숙주 세포:
(i) 서열번호 27의 위치 33에 상응하는 잔기에서 아미노산 D;
(ii) 서열번호 27의 위치 39에 상응하는 잔기에서 아미노산 F;
(iii) 서열번호 27의 위치 55에 상응하는 잔기에서 아미노산 S;
(iv) 서열번호 27의 위치 57에 상응하는 잔기에서 아미노산 Q 또는 E;
(v) 서열번호 27의 위치 61에 상응하는 잔기에서 아미노산 A;
(vi) 서열번호 27의 위치 62에 상응하는 잔기에서 아미노산 I;
(vii) 서열번호 27의 위치 63에 상응하는 잔기에서 아미노산 I;
(viii) 서열번호 27의 위치 71에 상응하는 잔기에서 아미노산 I;
(ix) 서열번호 27의 위치 112에 상응하는 잔기에서 아미노산 V 또는 T;
(x) 서열번호 27의 위치 122에 상응하는 잔기에서 아미노산 S, G, A 또는 E;
(xi) 서열번호 27의 위치 126에 상응하는 잔기에서 아미노산 A, R, T, K, 또는 D;
(xii) 서열번호 27의 위치 129에 상응하는 잔기에서 아미노산 W;
(xiii) 서열번호 27의 위치 131에 상응하는 잔기에서 아미노산 S;
(xiv) 서열번호 27의 위치 180에 상응하는 잔기에서 아미노산 T;
(xv) 서열번호 27의 위치 183에 상응하는 잔기에서 아미노산 T;
(xvi) 서열번호 27의 위치 202에 상응하는 잔기에서 아미노산 S 또는 G;
(xvii) 서열번호 27의 위치 256에 상응하는 잔기에서 아미노산 F 또는 M;
(xviii) 서열번호 27의 위치 257에 상응하는 잔기에서 아미노산 S;
(xix) 서열번호 27의 위치 260에 상응하는 잔기에서 아미노산 M 또는 F;
(xx) 서열번호 27의 위치 287에 상응하는 잔기에서 아미노산 R;
(xxi) 서열번호 27의 위치 295에 상응하는 잔기에서 아미노산 S;
(xxii) 서열번호 27의 위치 341에 상응하는 잔기에서 아미노산 S;
(xxiii) 서열번호 27의 위치 386에 상응하는 잔기에서 아미노산 A;
(xxiv) 서열번호 27의 위치 392에 상응하는 잔기에서 아미노산 H;
(xxv) 서열번호 27의 위치 394에 상응하는 잔기에서 아미노산 T;
(xxvi) 서열번호 27의 위치 398에 상응하는 잔기에서 아미노산 F, T, A, 또는 L;
(xxvii) 서열번호 27의 위치 410에 상응하는 잔기에서 아미노산 N;
(xxviii) 서열번호 27의 위치 423에 상응하는 잔기에서 아미노산 A;
(xxix) 서열번호 27의 위치 426에 상응하는 잔기에서 아미노산 Y;
(xxx) 서열번호 27의 위치 450에 상응하는 잔기에서 아미노산 K; 및/또는
(xxxi) 서열번호 27의 위치 472에 상응하는 잔기에서 아미노산 R 또는 A.
제1항 내지 제3항 중 어느 한 항에 있어서, TS는 서열번호 27의 서열에 비해 하기 아미노산 치환: T33D; Y39F; T55S; A57Q; A57E; G61A; V62I; V63I; Y71I; E112V; E112T; N122S; N122G; N122A; N122E; I126A; I126R; I126T; I126K; I126D; Y129W; N131S; S180T; R183T; N202S; N202G; Y256F; Y256M; N257S; V260M; V260F; H287R; N295S; A341S; V386A; L392H; M394T; V398F; V398T; V398A; V398L; D410N; S423A; H426Y; R450K; P472R; 및/또는 P472A 중 하나 이상을 포함하는 것인 숙주 세포.
제1항 내지 제4항 중 어느 한 항에 있어서, 칸나비노이드는 CBC 유형 칸나비노이드인 숙주 세포.
제5항에 있어서, 칸나비노이드는 칸나비크로멘산(CBCA) 및/또는 칸나비크로메바린산(CBCVA)인 숙주 세포.
제6항에 있어서, 숙주 세포는 테트라하이드로칸나비놀산(THCA), 칸나비디올산(CBDA) 및/또는 테트라하이드로칸나비바린산(THCVA) 중 하나 이상을 추가로 생성하는 것인 숙주 세포.
제2항 내지 제7항 중 어느 한 항에 있어서, TS는 대조군 TS보다 더 높은 비율의 CBCA:CBDA, CBCA:THCA, 및/또는 CBCVA:THCVA를 생성하는 것인 숙주 세포.
제8항에 있어서, 대조군 TS는 서열번호 20, 23, 25 또는 27의 서열을 포함하는 TS인 숙주 세포.
제2항 내지 제9항 중 어느 한 항에 있어서, TS는 서열번호 27에 비해 하기 아미노산 치환: A57Q 및 G61A; Y71I; 및/또는 V260F 중 하나 이상을 포함하는 것인 숙주 세포.
제2항 내지 제10항 중 어느 한 항에 있어서, TS는 대조군 TS보다 CBC 유형 칸나비노이드에 대해 더 높은 생성물 특이성을 갖는 것인 숙주 세포.
제11항에 있어서, 대조군 TS는 서열번호 20, 23, 25 또는 27의 서열을 포함하는 TS인 숙주 세포.
제1항 내지 제7항 중 어느 한 항에 있어서, TS는 서열번호 27의 서열에 비해 Y39F 및/또는 V63I를 포함하는 것인 숙주 세포.
제1항 및 제5항 내지 제7항 중 어느 한 항에 있어서, TS는 서열번호 25, 27, 105, 126, 134, 155, 162, 164, 또는 165 중 어느 하나의 서열을 포함하고, 임의로 서열번호 27의 서열에 비해, TS는 서열번호 27의 위치 33, 39, 55, 57, 61, 62, 63, 71, 112, 122, 126, 129, 131, 180, 183, 202, 256, 257, 260, 287, 295, 341, 386, 392, 394, 398, 410, 423, 426, 450, 및/또는 472에 상응하는 잔기에서 아미노산 치환을 포함하는 것인 숙주 세포.
제1항 내지 제14항 중 어느 한 항에 있어서, TS의 서열은 하기 모티프 중 하나 이상을 포함하는 것인 숙주 세포:
(i) KVQARSGGH(서열번호 174);
(ii) RASNTQNQD[VI][FL]FA[VI]K(서열번호 176);
(iii) CPTI[KR]TGGH(서열번호 181);
(iv) WFVTLSLEGGAINDV[AP]EDATAY[AG]H(서열번호 184);
(v) P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186);
(vi) MKHF[TNS]QFSM(서열번호 189);
(vii) P[EQ][TS]A[EAD][QE]IA[GA][VI]VKC(서열번호 193);
(viii) RDCL[IV]SA[LV]GGN[SA]A[LH][AV][AV]F[PQ][ND][QE]LL[WY](서열번호 200);
(ix) RT[EQ][PQ]APGLAVQYSY(서열번호 207); 및/또는
(x) WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211).
칸나비노이드를 생성하기 위한 숙주 세포로서, 숙주 세포는 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하고, TS의 서열은 하기 모티프 중 하나 이상을 포함하고:
(i) KVQARSGGH(서열번호 174);
(ii) RASNTQNQD[VI][FL]FA[VI]K(서열번호 176);
(iii) CPTI[KR]TGGH(서열번호 181);
(iv) WFVTLSLEGGAINDV[AP]EDATAY[AG]H(서열번호 184);
(v) P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186);
(vi) MKHF[TNS]QFSM(서열번호 189);
(vii) P[EQ][TS]A[EAD][QE]IA[GA][VI]VKC(서열번호 193);
(viii) RDCL[IV]SA[LV]GGN[SA]A[LH][AV][AV]F[PQ][ND][QE]LL[WY](서열번호 200);
(ix) RT[EQ][PQ]APGLAVQYSY(서열번호 207); 및/또는
(x) WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211);
숙주 세포는 적어도 하나의 칸나비노이드를 생성할 수 있는 것인 숙주 세포.
제16항에 있어서,
(i) 모티프 KVQARSGGH(서열번호 174)는 서열번호 27의 잔기 72-80에 상응하는 TS의 잔기에 위치하고;
(ii) 모티프 RASNTQNQD[VI][FL]FA[VI]K(서열번호 176)는 서열번호 27의 잔기 183-197에 상응하는 TS의 잔기에 위치하고;
(iii) 모티프 CPTI[KR]TGGH(서열번호 181)는 서열번호 27의 잔기 141-149에 상응하는 TS의 잔기에 위치하고;
(iv) 모티프 WFVTLSLEGGAINDV[AP]EDATAY[AG]H(서열번호 184)는 서열번호 27의 잔기 360-383에 상응하는 TS의 잔기에 위치하고;
(v) 모티프 P[IV]S[DQE]TTY[EDG]F[TA]DGLYDVLA[RQK]AVPES[VA]GHAYLGCPDP[RK]M(서열번호 186)은 서열번호 27의 잔기 400-436에 상응하는 TS의 잔기에 위치하고;
(vi) 모티프 MKHF[TNS]QFSM(서열번호 189)은 서열번호 27의 잔기 98-106에 상응하는 TS의 잔기에 위치하고;
(vii) 모티프 P[EQ][TS]A[EAD][QE]IA[GA][VI]VKC(서열번호 193)는 서열번호 27의 잔기 53-65에 상응하는 TS의 잔기에 위치하고;
(viii) 모티프 RDCL[IV]SA[LV]GGN[SA]A[LH][AV][AV]F[PQ][ND][QE]LL[WY](서열번호 200)는 서열번호 27의 잔기 10-32에 상응하는 TS의 잔기에 위치하고;
(ix) 모티프 RT[EQ][PQ]APGLAVQYSY(서열번호 207)는 서열번호 27의 잔기 212-225에 상응하는 TS의 잔기에 위치하고/하거나;
(x) 모티프 WQ[SA]FI[SA][AQ][KE]NLT[RW][QK]FY[NST]NM(서열번호 211)은 서열번호 27의 잔기 242-259에 상응하는 TS의 잔기에 위치하는 것인 숙주 세포.
제16항 또는 제17항에 있어서, TS는 진균 TS 또는 이의 보존적으로 치환된 버전인 숙주 세포.
제18항에 있어서, TS는 아스페르길루스 TS 또는 이의 보존적으로 치환된 버전인 숙주 세포.
제16항 내지 제19항 중 어느 한 항에 있어서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함하는 것인 숙주 세포.
제20항에 있어서, 서열번호 27의 서열에 비해, TS는 서열번호 27의 위치 33, 39, 55, 57, 61, 62, 63, 71, 112, 122, 126, 129, 131, 180, 183, 202, 256, 257, 260, 287, 295, 341, 386, 392, 394, 398, 410, 423, 426, 450, 및/또는 472에 상응하는 잔기에서 아미노산 치환을 포함하는 것인 숙주 세포.
제21항에 있어서, TS는 하기를 포함하는 것인 숙주 세포:
(i) 서열번호 27의 위치 33에 상응하는 잔기에서 아미노산 D;
(ii) 서열번호 27의 위치 39에 상응하는 잔기에서 아미노산 F;
(iii) 서열번호 27의 위치 55에 상응하는 잔기에서 아미노산 S;
(iv) 서열번호 27의 위치 57에 상응하는 잔기에서 아미노산 Q 또는 E;
(v) 서열번호 27의 위치 61에 상응하는 잔기에서 아미노산 A;
(vi) 서열번호 27의 위치 62에 상응하는 잔기에서 아미노산 I;
(vii) 서열번호 27의 위치 63에 상응하는 잔기에서 아미노산 I;
(viii) 서열번호 27의 위치 71에 상응하는 잔기에서 아미노산 I;
(ix) 서열번호 27의 위치 112에 상응하는 잔기에서 아미노산 V 또는 T;
(x) 서열번호 27의 위치 122에 상응하는 잔기에서 아미노산 S, G, A 또는 E;
(xi) 서열번호 27의 위치 126에 상응하는 잔기에서 아미노산 A, R, T, K, 또는 D;
(xii) 서열번호 27의 위치 129에 상응하는 잔기에서 아미노산 W;
(xiii) 서열번호 27의 위치 131에 상응하는 잔기에서 아미노산 S;
(xiv) 서열번호 27의 위치 180에 상응하는 잔기에서 아미노산 T;
(xv) 서열번호 27의 위치 183에 상응하는 잔기에서 아미노산 T;
(xvi) 서열번호 27의 위치 202에 상응하는 잔기에서 아미노산 S 또는 G;
(xvii) 서열번호 27의 위치 256에 상응하는 잔기에서 아미노산 F 또는 M;
(xviii) 서열번호 27의 위치 257에 상응하는 잔기에서 아미노산 S;
(xix) 서열번호 27의 위치 260에 상응하는 잔기에서 아미노산 M 또는 F;
(xx) 서열번호 27의 위치 287에 상응하는 잔기에서 아미노산 R;
(xxi) 서열번호 27의 위치 295에 상응하는 잔기에서 아미노산 S;
(xxii) 서열번호 27의 위치 341에 상응하는 잔기에서 아미노산 S;
(xxiii) 서열번호 27의 위치 386에 상응하는 잔기에서 아미노산 A;
(xxiv) 서열번호 27의 위치 392에 상응하는 잔기에서 아미노산 H;
(xxv) 서열번호 27의 위치 394에 상응하는 잔기에서 아미노산 T;
(xxvi) 서열번호 27의 위치 398에 상응하는 잔기에서 아미노산 F, T, A, 또는 L;
(xxvii) 서열번호 27의 위치 410에 상응하는 잔기에서 아미노산 N;
(xxviii) 서열번호 27의 위치 423에 상응하는 잔기에서 아미노산 A;
(xxix) 서열번호 27의 위치 426에 상응하는 잔기에서 아미노산 Y;
(xxx) 서열번호 27의 위치 450에 상응하는 잔기에서 아미노산 K; 및/또는
(xxxi) 서열번호 27의 위치 472에 상응하는 잔기에서 아미노산 R 또는 A.
제20항 내지 제22항 중 어느 한 항에 있어서, TS는 서열번호 27의 서열에 비해 하기 아미노산 치환: T33D; Y39F; T55S; A57Q; A57E; G61A; V62I; V63I; Y71I; E112V; E112T; N122S; N122G; N122A; N122E; I126A; I126R; I126T; I126K; I126D; Y129W; N131S; S180T; R183T; N202S; N202G; Y256F; Y256M; N257S; V260M; V260F; H287R; N295S; A341S; V386A; L392H; M394T; V398F; V398T; V398A; V398L; D410N; S423A; H426Y; R450K; P472R; 및/또는 P472A 중 하나 이상을 포함하는 것인 숙주 세포.
제20항에 있어서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 143, 144, 155, 159, 162-167, 또는 172 중 어느 하나의 서열 또는 이의 보존적으로 치환된 버전을 포함하는 것인 숙주 세포.
말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포로서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함하고, 숙주 세포는 적어도 하나의 칸나비노이드를 생성할 수 있는 것인 숙주 세포.
제25항에 있어서, 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열은 하나 이상의 신호 펩티드에 연결된 것인 숙주 세포.
제26항에 있어서, 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열은 서열번호 16, 또는 서열번호 16의 서열에 비해 2개 이하의 아미노산 치환, 삽입, 부가 또는 결실을 갖는 서열을 포함하는 신호 펩티드에 연결된 것인 숙주 세포.
제26항 또는 제27항에 있어서, 신호 펩티드는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열의 N-말단에 연결된 것인 숙주 세포.
제28항에 있어서, N-말단 메티오닌이 서열번호 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172로부터 제거되고, 메티오닌 잔기가 신호 펩티드의 N-말단에 부가된 것인 숙주 세포.
제25항 내지 제29항 중 어느 한 항에 있어서, 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열은 서열번호 17, 또는 서열번호 17의 서열에 비해 1개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드에 연결된 것인 숙주 세포.
제30항에 있어서, 서열번호 17, 또는 서열번호 17의 서열에 비해 1개 이하의 아미노산 치환, 삽입, 부가, 또는 결실을 갖는 서열을 포함하는 신호 펩티드는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열의 C-말단에 연결된 것인 숙주 세포.
제25항 내지 제31항 중 어느 한 항에 있어서, 서열번호 27의 서열에 비해, TS는 서열번호 27의 위치 33, 39, 55, 57, 61, 62, 63, 71, 112, 122, 126, 129, 131, 180, 183, 202, 256, 257, 260, 287, 295, 341, 386, 392, 394, 398, 410, 423, 426, 450, 및/또는 472에 상응하는 잔기에서 아미노산 치환을 포함하는 것인 숙주 세포.
제32항에 있어서, TS는 다음을 포함하는 것인 숙주 세포:
(i) 서열번호 27의 위치 33에 상응하는 잔기에서 아미노산 D;
(ii) 서열번호 27의 위치 39에 상응하는 잔기에서 아미노산 F;
(iii) 서열번호 27의 위치 55에 상응하는 잔기에서 아미노산 S;
(iv) 서열번호 27의 위치 57에 상응하는 잔기에서 아미노산 Q 또는 E;
(v) 서열번호 27의 위치 61에 상응하는 잔기에서 아미노산 A;
(vi) 서열번호 27의 위치 62에 상응하는 잔기에서 아미노산 I;
(vii) 서열번호 27의 위치 63에 상응하는 잔기에서 아미노산 I;
(viii) 서열번호 27의 위치 71에 상응하는 잔기에서 아미노산 I;
(ix) 서열번호 27의 위치 112에 상응하는 잔기에서 아미노산 V 또는 T;
(x) 서열번호 27의 위치 122에 상응하는 잔기에서 아미노산 S, G, A 또는 E;
(xi) 서열번호 27의 위치 126에 상응하는 잔기에서 아미노산 A, R, T, K, 또는 D;
(xii) 서열번호 27의 위치 129에 상응하는 잔기에서 아미노산 W;
(xiii) 서열번호 27의 위치 131에 상응하는 잔기에서 아미노산 S;
(xiv) 서열번호 27의 위치 180에 상응하는 잔기에서 아미노산 T;
(xv) 서열번호 27의 위치 183에 상응하는 잔기에서 아미노산 T;
(xvi) 서열번호 27의 위치 202에 상응하는 잔기에서 아미노산 S 또는 G;
(xvii) 서열번호 27의 위치 256에 상응하는 잔기에서 아미노산 F 또는 M;
(xviii) 서열번호 27의 위치 257에 상응하는 잔기에서 아미노산 S;
(xix) 서열번호 27의 위치 260에 상응하는 잔기에서 아미노산 M 또는 F;
(xx) 서열번호 27의 위치 287에 상응하는 잔기에서 아미노산 R;
(xxi) 서열번호 27의 위치 295에 상응하는 잔기에서 아미노산 S;
(xxii) 서열번호 27의 위치 341에 상응하는 잔기에서 아미노산 S;
(xxiii) 서열번호 27의 위치 386에 상응하는 잔기에서 아미노산 A;
(xxiv) 서열번호 27의 위치 392에 상응하는 잔기에서 아미노산 H;
(xxv) 서열번호 27의 위치 394에 상응하는 잔기에서 아미노산 T;
(xxvi) 서열번호 27의 위치 398에 상응하는 잔기에서 아미노산 F, T, A, 또는 L;
(xxvii) 서열번호 27의 위치 410에 상응하는 잔기에서 아미노산 N;
(xxviii) 서열번호 27의 위치 423에 상응하는 잔기에서 아미노산 A;
(xxix) 서열번호 27의 위치 426에 상응하는 잔기에서 아미노산 Y;
(xxx) 서열번호 27의 위치 450에 상응하는 잔기에서 아미노산 K; 및/또는
(xxxi) 서열번호 27의 위치 472에 상응하는 잔기에서 아미노산 R 또는 A.
제25항 내지 제33항 중 어느 한 항에 있어서, TS는 서열번호 27의 서열에 비해 하기 아미노산 치환: T33D; Y39F; T55S; A57Q; A57E; G61A; V62I; V63I; Y71I; E112V; E112T; N122S; N122G; N122A; N122E; I126A; I126R; I126T; I126K; I126D; Y129W; N131S; S180T; R183T; N202S; N202G; Y256F; Y256M; N257S; V260M; V260F; H287R; N295S; A341S; V386A; L392H; M394T; V398F; V398T; V398A; V398L; D410N; S423A; H426Y; R450K; P472R; 및/또는 P472A 중 하나 이상을 포함하는 것인 숙주 세포.
제25항 내지 제34항 중 어느 한 항에 있어서, 이종 폴리뉴클레오티드는 서열번호 26, 28, 35, 42, 56, 60, 64, 74, 85, 89, 92, 93, 94, 95, 96, 97, 및 102 중 어느 하나와 적어도 90% 동일한 서열을 포함하는 것인 숙주 세포.
제25항 내지 제31항 및 제35항 중 어느 한 항에 있어서, TS 서열은 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167 및 172 중 어느 하나를 포함하는 것인 숙주 세포.
말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포로서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함하거나, 숙주 세포는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나의 보존적으로 치환된 버전을 포함하는 것인 숙주 세포.
말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드를 포함하는 숙주 세포로서, 숙주 세포는 적어도 하나의 칸나비노이드를 생성할 수 있고, TS는 진균 TS 또는 이의 보존적으로 치환된 버전인 숙주 세포.
제38항에 있어서, 진균 TS는 아스페르길루스 TS 또는 이의 보존적으로 치환된 버전인 숙주 세포.
제16항 내지 제39항 중 어느 한 항에 있어서, 칸나비노이드는 CBC 유형 칸나비노이드인 숙주 세포.
제40항에 있어서, 칸나비노이드는 칸나비크로멘산(CBCA) 및/또는 칸나비크로메바린산(CBCVA)인 숙주 세포.
제41항에 있어서, 숙주 세포는 테트라하이드로칸나비놀산(THCA), 칸나비디올산(CBDA) 및/또는 테트라하이드로칸나비바린산(THCVA) 중 하나 이상을 추가로 생성하는 것인 숙주 세포.
제1항 내지 제42항 중 어느 한 항에 있어서, 숙주 세포는 식물 세포, 조류 세포, 효모 세포, 박테리아 세포, 또는 동물 세포인 숙주 세포.
제43항에 있어서, 숙주 세포는 효모 세포인 숙주 세포.
제44항에 있어서, 효모 세포는 사카로마이세스(Saccharomyces) 세포, 야로위아(Yarrowia) 세포, 코마가타엘라(Komagataella) 세포, 또는 피키아(Pichia) 세포인 숙주 세포.
제45항에 있어서, 사카로마이세스 세포는 사카로마이세스 세레비지아에(Saccharomyces cerevisiae) 세포인 숙주 세포.
제43항에 있어서, 숙주 세포는 박테리아 세포인 숙주 세포.
제47항에 있어서, 박테리아 세포는 이. 콜라이(E. coli) 세포인 숙주 세포.
제1항 내지 제48항 중 어느 한 항에 있어서, 숙주 세포는 아실 활성화 효소(AAE), 폴리케타이드 신타제(PKS), 폴리케타이드 사이클라제(PKC), 프레닐트랜스퍼라제(PT), 및/또는 추가 말단 신타제(TS) 중 하나 이상을 코딩하는 하나 이상의 이종 폴리뉴클레오티드를 추가로 포함하는 것인 숙주 세포.
제49항에 있어서, PKS는 올리베톨 신타제(OLS) 또는 디바리놀 신타제인 숙주 세포.
제1항 내지 제50항 중 어느 한 항의 숙주 세포를 배양하는 단계를 포함하는 방법.
CBG 유형 칸나비노이드를 말단 신타제(TS)와 접촉시키는 단계를 포함하는 칸나비노이드의 생성 방법으로서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함하는 것인 방법.
제52항에 있어서, CBG 유형 칸나비노이드를 TS와 접촉시키는 단계는 시험관내에서 발생하는 것인 방법.
제52항 또는 제53항에 있어서, CBG 유형 칸나비노이드를 TS와 접촉시키는 단계는 생체내에서 발생하는 것인 방법.
제54항에 있어서, CBG 유형 칸나비노이드를 TS와 접촉시키는 단계는 숙주 세포에서 발생하는 것인 방법.
칸나비노이드의 생성 방법으로서, CBD 유형 칸나비노이드, THC 유형 칸나비노이드 또는 둘 모두와 비교하여 CBG 유형 칸나비노이드를 CBC 유형 칸나비노이드로 우선적으로 전환하도록 적응된 산화적 고리화 촉매와 CBG 유형 칸나비노이드를 생체내에서 접촉시키는 단계를 포함하는 방법.
제52항 내지 제56항 중 어느 한 항에 있어서, 칸나비노이드는 CBG 유형 칸나비노이드의 고리화된 생성물인 방법.
제57항에 있어서, 칸나비노이드는 고리화된 프레닐 모이어티를 갖는 칸나비노이드인 방법.
제58항에 있어서, 칸나비노이드는 CBC 유형 칸나비노이드, CBD 유형 칸나비노이드, 또는 THC 유형 칸나비노이드인 방법.
제59항에 있어서, 칸나비노이드는 CBC 유형 칸나비노이드인 방법.
제52항 내지 제60항 중 어느 한 항에 있어서, CBG 유형 칸나비노이드는 칸나비게롤산인 방법.
제60항에 있어서, CBC 유형 칸나비노이드는 CBCA인 방법.
제52항 내지 제62항 중 어느 한 항에 있어서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나의 서열 또는 이의 보존적으로 치환된 버전을 포함하는 것인 방법.
CBG 유형 칸나비노이드, 및 CBG 유형 칸나비노이드, THC 유형 칸나비노이드, 또는 둘 모두와 비교하여 CBG 유형 칸나비노이드를 CBC 유형 칸나비노이드로 우선적으로 전환시키기 위해 CBG 유형 칸나비노이드의 산화적 고리화를 촉매하는 수단을 포함하는 숙주 세포.
CBG 유형 칸나비노이드, 및 CBG 유형 칸나비노이드, THC 유형 칸나비노이드, 또는 둘 모두와 비교하여 CBG 유형 칸나비노이드를 CBC 유형 칸나비노이드로 우선적으로 전환되도록 적응된 산화적 고리화 촉매를 포함하는 숙주 세포.
제65항에 있어서, CBC 유형 칸나비노이드를 생성하기 위해 CBG 유형 칸나비노이드의 산화적 고리화를 촉매하는 수단은 말단 신타제(TS)를 코딩하는 이종 폴리뉴클레오티드이며, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열 또는 이의 보존적으로 치환된 버전을 포함하는 것인 숙주 세포.
제66항에 있어서, TS는 또한 THCA, THCVA 또는 CBDA를 생성할 수 있는 것인 숙주 세포.
말단 신타제(TS)를 코딩하는 비-자연 발생 핵산으로서, 비-자연 발생 핵산은 서열번호 26, 28, 35, 42, 56, 60, 64, 74, 85, 89, 92, 93, 94, 95, 96, 97, 및 102 중 어느 하나와 적어도 90% 동일성을 갖는 서열을 포함하는 것인 비-자연 발생 핵산.
제68항의 비-자연 발생 핵산을 포함하는 벡터.
제68항의 비-자연 발생 핵산을 포함하는 발현 카세트.
제68항의 비-자연 발생 핵산, 제69항의 벡터, 또는 제70항의 발현 카세트로 형질전환된 숙주 세포.
칸나비노이드를 생성하기 위한 생물반응기로서, 생물반응기는 CBG 유형 칸나비노이드 및 말단 신타제(TS)를 포함하고, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함하거나, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나의 보존적으로 치환된 버전을 포함하는 것인 생물반응기.
비-자연 발생 말단 신타제(TS)로서, TS는 서열번호 25, 27, 105, 112, 126, 130, 134, 144, 155, 159, 162-167, 또는 172 중 어느 하나와 적어도 90% 동일한 서열을 포함하는 것인 비-자연 발생 말단 신타제(TS).
THC 유형 화합물 또는 CBD 유형 화합물과 비교하여 생체내에서 CBG 유형 칸나비노이드를 CBC 유형 화합물로 우선적으로 전환하도록 적응된 산화적 고리화 촉매.