KR20210038591A

KR20210038591A - 향상된 단백질 생산성 표현형을 포함하는 돌연변이체 및 유전자 변형된 사상성 진균 균주 및 이의 방법

Info

Publication number: KR20210038591A
Application number: KR1020217005248A
Authority: KR
Inventors: 2세 로버트 제임스 프랫
Original assignee: 다니스코 유에스 인크.
Priority date: 2018-07-30
Filing date: 2019-07-25
Publication date: 2021-04-07
Also published as: CN112654704A; WO2020028126A1; EP3830257A1; JP2021532775A; US20210301276A1

Abstract

본 발명의 본 균주 및 방법은 향상된 단백질 생산성 표현형을 포함하는 사상성 진균의 변이체 균주를 생성시키는 사상성 진균에서의 유전자 변형에 관한 것이다. 보다 구체적으로는, 본원에 제시되고 기재되고 예시된 것처럼, 향상된 단백질 생산성 표현형을 포함하는 사상성 진균의 이러한 변이체 균주는 상업용 분야에 대해 관심 단백질의 대규모 제조에서와 같은 액침된 배양에서의 성장에 매우 적합하다.

Description

향상된 단백질 생산성 표현형을 포함하는 돌연변이체 및 유전자 변형된 사상성 진균 균주 및 이의 방법

본 발명은 일반적으로 생물학, 유전학, 분자 생물학, 사상성 진균, 산업적 단백질 제조 등의 분야에 관한 것이다. 보다 구체적으로는, 본 발명의 본 균주 및 방법은 향상된 단백질 생산성 표현형을 포함하는 사상성 진균의 변이체 균주를 생성시키는 사상성 진균에서의 유전자 변형에 관한 것이다. 보다 구체적으로는, 본원에 제시되고 기재되고 예시된 것처럼, 향상된 단백질 생산성 표현형을 포함하는 사상성 진균의 이러한 변이체 균주는 상업용 분야에 대해 관심 단백질의 대규모 제조에서와 같은 액침된 배양에서의 성장에 매우 적합하다.

관련 출원에 대한 상호 참조

본 출원은 2018년 7월 30일자로 출원된 미국 특허 가출원 제62/711,846호의 우선권을 주장하며, 본 가출원은 본원에 그 전체가 참고로 포함된다.

서열 목록의 참조

"NB41504-WO-PCT_SequenceListing.txt"로 명명된 서열 목록 텍스트 파일의 전자 제출의 내용은 2019년 7월 24일자로 생성되었으며, 크기가 160 KB이고, 본원에 그 전체가 참조로 포함된다.

사상성 진균(예를 들어, 아스페르길루스 종(Aspergillus sp.), 페니실리움 종(Penicillium sp.), 탈라로마이세스 종(Talaromyces sp.), 푸사륨 종(Fusarium sp.), 마이셀리오프토라 종(Myceliophthora sp.), 뉴로스포라 종(Neurospora sp.), 트리초데르마 종트리초데르마 종(Trichoderma sp.) 및 기타)은 자연적(내인성) 단백질 및 이종성 단백질을 고수준으로 발현할 수 있어서, 이들이 산업적 및/또는 상업적 분야, 예컨대 약제학적 분야, 동물 건강 분야, 식품 분야, 음료 분야 등에 대한 단백질(예를 들어, 효소) 및/또는 대사물질의 대규모 제조에 매우 적합하게 한다. 사상성 진균은 일반적으로 생물반응기(발효기)에서 균사체 액침 배양에서 성장하고, 생물반응기는 산소 및 영양소를 배양 배지(즉, 배양 브로스)로 도입하고 분포시키도록 적응된다. 예를 들어, 사상성 진균 트리초데르마 레세이(T. 레세이; 진균 하이포세라 제코리나(Hypocrea jecorina)의 무성생식)는 셀룰라아제 효소의 효과적인 생산자인 것으로 공지되어 있다(예를 들어, PCT 국제 공보 W01998/15619호, WO2005/028636호, WO2006/074005호, WO 1992/06221호, WO 1992/06209호, WO1992/06183호 및 WO2002/12465호 참조).

그러므로, 사상성 진균은 셀룰로오스 (유래) 에탄올, 텍스타일 가공, 그레인 가공, 세제, 섬유, 식품 첨가제, 사료 첨가제 등과 같은 상품의 제조에서 가치 있는 단백질을 생산하는 이의 능력에 대해 활용되어 왔다. 예를 들어, 이러한 진균 숙주 균주에서의 재조합 유전자 발현은 단백질의 생산에 흔한 방법(즉, 산업적 및 상업적 목적에 대한)이고, 그러므로, 진균 숙주 균주의 단백질 생산성 개선은 단백질 생산 비용의 중요한 경제적 인자이다. 따라서, 당업자에 의해 이해된 것처럼, 사상성 진균 균주에서의 단백질 생산을 향상시키기 위한 이러한 조성물 및 방법은 상당한 상업적 관심이 있다.

본원에 기재된 바대로, 향상된/증가된 단백질 생산성 표현형을 포함하는 유전자 변형된 사상성 진균 균주와 일반적으로 관련된 본 발명은 당해 분야에서의 이러한 진행 중이고 충족되지 않은 필요를 해결한다.

증가된 단백질 생산성 표현형을 갖는 사상성 진균과 관련된 균주, 세포, 방법, 작제물 및 기타가 본원에 기재된다. 따라서, 본 발명의 소정의 구현예는 모 세포로부터 유래된 변형된 자낭균류(Ascomycota) 세포에 관한 것이고, 여기서 변형된 세포는 서열 번호 2, 서열 번호 4, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 변이체 LOV 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함하고, 변형된 세포는 예를 들어 동일한 조건 하에 발효/배양될 때 모 세포에 비해 향상된 단백질 생산성 표현형을 포함한다. 소정의 구현예에서, 모 세포는 서열 번호 2, 서열 번호 4, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 야생형 폴리뉴클레오타이드 서열을 포함한다.

관련된 구현예에서, 진균 세포는 관심 단백질(POI)을 암호화하는 이종성 폴리뉴클레오타이드를 추가로 포함한다. 다른 구현예에서, 세포는 서열 번호 19의 NIK1(M743T) 단백질을 암호화하는 폴리뉴클레오타이드를 추가로 포함한다. 소정의 다른 구현예에서, 변형된 세포는 MPG1 SFB3, SEB1, CRZ1, TSP2, SSB7 및 GAS1로 이루어진 군으로부터 선택된 단백질의 발현/생산을 결실시키거나 파괴하거나 감소시키는 적어도 하나의 유전적 변형을 추가로 포함한다.

다른 구현예에서, 자낭균류 세포는 트리초데르마 종, 아스페르길루스 종, 푸사륨 종, 페니실리움 종, 칸디다 종, 크리소스포륨 종, 세팔로스포륨 종, 탈라로마이세스 종, 뉴로스포라 종 및 마이셀리오프토라 종으로부터 선택된다.

따라서, 소정의 구현예에서, 모 아스페르길루스 종 세포는 서열 번호　11 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.

다른 구현예에서, 모 페니실리움 종 세포는 서열 번호　12 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다. 다른 구현예에서, 모 탈라로마이세스 종 세포는 서열 번호　13 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.

또 다른 구현예에서, 모 푸사륨 종 세포는 서열 번호　14 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.

소정의 다른 구현예에서, 모 마이셀리오프토라 종 세포는 서열 번호　15 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.

다른 구현예에서, 모 뉴로스포라 종 세포는 서열 번호　16 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.

다른 구현예에서, 모 칸디다 종 세포는 서열 번호　17 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.

소정의 다른 구현예에서, 모 트리초데르마 종 세포는 서열 번호　2 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.

다른 구현예에서, 관심 단백질은 본 발명의 변형된 세포에 의해 생산되고 이로부터 정제된다.

또 다른 구현예에서, 본 발명은 엄격한 혼성화 조건 하에 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18의 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 핵산 서열과 혼성화하는 야생형 폴리뉴클레오타이드 서열을 포함하는 모 세포로부터 유래된 변형된 자낭균류 세포에 관한 것이고, 여기서 변형된 세포는 엄격한 혼성화 조건 하에 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18의 LOV 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 아미노산 서열에서 리신(K) 잔기를 포함하는 핵산 서열과 혼성화하는 변형된 폴리뉴클레오타이드 서열을 포함한다. 소정의 구현예에서, 세포는 관심 단백질을 암호화하는 이종성 폴리뉴클레오타이드를 추가로 포함한다. 다른 구현예에서, 세포는 서열 번호 19의 NIK1(M743T) 단백질을 암호화하는 폴리뉴클레오타이드 작제물을 추가로 포함한다. 다른 구현예에서, 세포는 MPG1 SFB3, SEB1, CRZ1, TSP2, SSB7 및 GAS1로 이루어진 군으로부터 선택된 단백질의 발현/생산을 결실시키거나 파괴하거나 감소시키는 적어도 하나의 유전적 변형을 추가로 포함한다.

소정의 다른 구현예에서, 자낭균류 세포는 트리초데르마 종, 아스페르길루스 종, 푸사륨 종, 페니실리움 종, 칸디다 종, 크리소스포륨 종, 세팔로스포륨 종, 탈라로마이세스 종, 뉴로스포라 종 및 마이셀리오프토라 종으로부터 선택된다.

소정의 구현예에서, 모 아스페르길루스 종 세포는 서열 번호　11 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.

다른 구현예에서, 모 페니실리움 종 세포는 서열 번호　12 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.

다른 구현예에서, 모 탈라로마이세스 종 세포는 서열 번호　13 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.

소정의 다른 구현예에서, 모 푸사륨 종 세포는 서열 번호　14 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.

다른 구현예에서, 모 마이셀리오프토라 종 세포는 서열 번호　15 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.

또 다른 구현예에서, 모 뉴로스포라 종 세포는 서열 번호　16 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.

소정의 다른 구현예에서, 모 칸디다 종 세포는 서열 번호　17 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.

다른 구현예에서, 모 트리초데르마 종 세포는 서열 번호　2 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다. 다른 구현예는 본 발명의 변형된 세포에 의해 생산된 관심 단백질에 관한 것이다.

본 발명의 소정의 다른 구현예는 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 변이체 LOV 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 폴리뉴클레오타이드를 포함하는 벡터에 관한 것이다.

다른 구현예에서, 본 발명은 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 변이체 LOV 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 폴리뉴클레오타이드에 관한 것이다.

다른 구현예에서, 본 발명은 변이체 LOV 단백질을 암호화하는 폴리뉴클레오타이드에 관한 것이고, 여기서 변이체 단백질을 암호화하는 폴리뉴클레오타이드는 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18의 LOV 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 핵산 서열과 엄격한 혼성화 조건 하에 혼성화한다.

다른 구현예에서, 본 발명은 모 균주로부터 유래된 돌연변이체 트리초데르마 균주에 관한 것이고, 여기서 돌연변이체 균주는 서열 번호 4 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 LOV 변이체 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 서열 위치에서 리신(K) 잔기를 포함하는 유전자를 포함한다. 소정의 구현예에서, 돌연변이체 균주는 모 균주에 비해 향상된 단백질 생산성 표현형을 포함한다. 다른 구현예에서, 돌연변이체 균주는 서열 번호 19의 NIK1(M743T) 단백질을 암호화하는 폴리뉴클레오타이드 작제물을 추가로 포함한다. 다른 구현예에서, 돌연변이체 균주는 MPG1 SFB3, SEB1, CRZ1, TSP2, SSB7 및 GAS1로 이루어진 군으로부터 선택된 적어도 하나의 단백질을 암호화하는 유전자의 발현/생산을 결실시키거나 파괴하거나 감소시키는 유전적 변형을 추가로 포함한다. 따라서, 소정의 관련된 구현예는 돌연변이체 균주에 의해 생산된 관심 단백질에 관한 것이다.

본 발명의 다른 구현예는 향상된 단백질 생산성 표현형을 포함하는 변형된 자낭균류 세포를 작제하는 방법에 관한 것이고, 상기 방법은 (i) 엄격한 혼성화 조건 하에 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18의 LOV 단백질을 암호화하는 핵산 서열과 혼성화하는 야생형 lov 유전자를 포함하는 모 세포를 수득하는 단계, (ii) 단계 (i)의 모 세포를 변형시켜 서열 번호 2의 813번 위치에 상응하는 서열 위치에서 리신(K) 잔기를 포함하는 LOV (변이체) 단백질을 암호화하는 유전자를 포함하는 변형된 세포를 생산하는 단계, 및 (iii) 단계 (ii)의 변형된 세포를 단리시키는 단계를 포함하고, 여기서 변형된 세포는 모 세포에 비해 향상된 단백질 생산성 표현형을 포함한다.

다른 구현예에서, 본 발명은 향상된 단백질 생산성 표현형을 포함하는 변형된 자낭균류 세포를 작제하는 방법에 관한 것이고, 상기 방법은 (i) 모 자낭균류 세포를 수득하고, 서열 번호 4의 813번 위치에 상응하는 서열 위치에서 리신(K) 잔기를 포함하는 LOV 변이체 단백질을 암호화하는 폴리뉴클레오타이드 작제물을 세포로 도입하는 단계 및 (ii) 단계 (i)의 변형된 세포를 단리시키는 단계를 포함하고, 여기서 변형된 세포는 모 세포에 비해 향상된 단백질 생산성 표현형을 포함한다.

따라서, 본원에 제시되고 기재된 것처럼, 본 발명의 다양한 구현예는 일반적으로 향상된 단백질 생산성 표현형을 포함하는 사상성 진균의 변이체 균주에 관한 것이고, 변이체 균주는 상업용 분야에 대해 관심 단백질의 대규모 제조에서와 같은 액침된 배양에서의 성장에 매우 적합하다.

생물학적 서열의 간단한 설명

서열 번호 1은 서열 번호 2의 (자연적) LOV 단백질을 암호화하는 야생형 트리초데르마 종 lov 유전자의 핵산 서열이다.

서열 번호 2는 서열 번호 1에 의해 암호화된 (자연적) LOV 단백질의 아미노산 서열이다.

서열 번호 3은 서열 번호 4의 (변이체) T813K (치환된) LOV 단백질을 암호화하는 "lov(T813K)"라 명명된 트리초데르마 종 돌연변이체 대립유전자의 핵산 서열이다.

서열 번호 4는 서열 번호 3에 의해 암호화된 (변이체) T813K (치환된) LOV 단백질의 아미노산 서열이다.

서열 번호 5는 트리초데르마 종 MPG1 단백질의 아미노산 서열이다.

서열 번호 6은 트리초데르마 종 SEB1 단백질의 아미노산 서열이다.

서열 번호 7은 트리초데르마 종 SFB3 단백질의 아미노산 서열이다.

서열 번호 8은 트리초데르마 종 CRZ1 단백질의 아미노산 서열이다.

서열 번호 9는 트리초데르마 종 GAS1 단백질의 아미노산 서열이다.

서열 번호 10은 트리초데르마 종 TPS2 단백질의 아미노산 서열이다.

서열 번호 11은 아스페르길루스 종 LOV 단백질 오솔로그의 아미노산 서열이다.

서열 번호 12는 페니실리움 종 LOV 단백질 오솔로그의 아미노산 서열이다.

서열 번호 13은 탈라로마이세스 종 LOV 단백질 오솔로그의 아미노산 서열이다.

서열 번호 14는 푸사륨 종 LOV 단백질 오솔로그의 아미노산 서열이다.

서열 번호 15는 마이셀리오프토라 종 LOV 단백질 오솔로그의 아미노산 서열이다.

서열 번호 16은 뉴로스포라 종 LOV 단백질 오솔로그의 아미노산 서열이다.

서열 번호 17은 칸디다 종 LOV 단백질 오솔로그의 아미노산 서열이다.

서열 번호 18은 트리초데르마 종 (자연적) LOV 단백질(서열 번호 2)의 C 말단 아미노산 잔기 500-894번 위치를 포함한다.

서열 번호 19는 서열 번호　19의 아미노산 (잔기) 743번 위치에서의 메티오닌(M)에서 트레오닌(T) 치환을 포함하는 변이체 트리초데르마 히스티딘 키나제(NIK1)의 아미노산 서열이다. 서열 번호 19의 변이체 NIK1 히스티딘 키나제를 암호화하는 유전자는 "nik1(M743T)"이라 명명된다.

서열 번호 20은 서열 번호 21의 자연적 SSB7 단백질을 암호화하는 야생형 T. 레세이 ssb7 유전자의 핵산 서열이다.

서열 번호 21은 서열 번호 20에 의해 암호화된 자연적 T. 레세이 SSB7 단백질의 아미노산 서열이다.

서열 번호 22는 프레임 쉬프트(fs) 돌연변이 및 ssb7 유전자의 마지막 인트론 전의 조기 종결 코돈을 생성시키는 엑손 2에서의 G의 결실(ΔG)을 포함하는 대립유전자 ssb7(fs)의 핵산 서열이다.

서열 번호 23은 서열 번호 22의 대립유전자 ssb7(fs)에 의해 암호화된 변이체 SSB7 단백질의 아미노산 서열이다.

서열 번호 23은 트리초데르마 하르지아눔 LOV 단백질 오솔로그의 아미노산 서열이다.

도 1은 B7ms1 (모) 균주(도 1, 회색 데이터 점/회색 선) 및 돌연변이체 유래 (딸) B7ms1-SF12 균주(도　1, 검정 데이터 점/검정 선)를 발현하는 글루코아밀라아제에 대한 공급 당에서의 총 단백질 수율의 비교를 보여준다. 따라서, 이 글루코아밀라아제(GA) 발현 균주(mpg1 및 seb1 유전자에서의 점도 감소 돌연변이를 포함)는 발효기에서의 단백질 생산성에 대해 평가되었다. 도면 범례는 각각의 세포주 유형에 대해 균주 명칭(유전자형에 대한 표 1 참조), 이어서 괄호 내의 그 균주에서의 lov 대립유전자를 보여준다. 도 1에 도시된 것처럼 B7ms1-SF12 (딸) 균주(도 1, 검정 선; 즉, 돌연변이체 lov(T813K) 대립유전자를 포함)는 B7ms1 (모) 균주(도 1, 회색 선; 즉, 야생형 lov 유전자를 포함)에 비해 향상된 단백질 생산성 표현형을 갖는다. 예를 들어, 도 1에 제시된 것처럼, 공급 당에서의 단백질 수율은 lov(T813K) 돌연변이가 존재할 때 44% 증가하였다.
도 2는 LOV 단백질의 아미노산 보존을 예시하는 그래프 표시이다. 보다 구체적으로는, 도 2는 육백구십한(691)개의 주발버섯(Pezizomycotina) 동족체의 Geneious 다중 서열 정렬의 그래프 표시이다. 도 2의 하부에 트리초데르마 LOV 단백질의 아미노산 서열을 나타내는 박스가 있고, 여기서 아미노산(잔기)은 정렬된 서열의 99% 초과에서 보존되면 검정(또는 그렇지 않으면 회색임) 음영 박스에 제시된다. LOV 잔기 번호(서열 번호 2)는 서열 표시 위에 제시된다. 도 2에 제시된 것처럼, 트리초데르마 LOV에서 또는 달리 다중 서열 정렬에서의 서열의 2% 초과에 존재하는 아미노산 서열 갭은 회색 음영 선으로 제시된다. LOV(XP_006967324.1)에 대해 공공 GenBank 서열에서의 주석은 회색 박스로서 서열 표시 아래에 도시된다. LOV에 대한 GenBank 목록에 주석화된 추정상 활성 부위 잔기는 검정 박스로서 서열 표시 아래에 도시된다. 균주 B7ms1-SF12에서 리신(K)에 치환된 트레오닌(T) 813 잔기는 밝은 회색 박스로 주석화된다. 평균 소수화도 및 등전점(_PI)은 또한 도 2에 작도되고 제시되어 있다. 정렬에서의 아미노산 동일성은 서열 바로 위에 작도된다. 더 밝은 회색 막대는 정렬에서의 서열의 적어도 30%에서 동일한 잔기를 나타내고, 더 어두운 회색 막대는 30% 미만에서 동일한 잔기를 나타낸다.
도 3은 전체 셀룰라아제 생성 T4ms 균주(회색 선) 및 조작된 lov(T813K) 대립유전자를 포함하는 돌연변이체 유도체 T4mls(검정 선)에 대한 발효기에서의 공급 당에 대한 총 단백질 수율의 비교를 제시한다. 보다 구체적으로는, 도 3은 더 낮은 세포 밀도(LCD, 파선, 원) 및 더 높은 세포 밀도(HCD, 실선, 정사각형) 발효 조건 둘 다 하에 이들 균주에 대한 공급 당에 대한 총 단백질 수율을 제시한다. 도면 범례는 발효 조건(LCD 대 HCD), 이어서 균주 명칭(유전자형에 대해 표 1 참조)을 보여주고, 존재하는 lov 대립유전자는 괄호 내에 기재된다. 따라서, 도 3에 제시된 것처럼, T4mls 균주(도 3, 검정 선; 즉, 돌연변이체 lov(T813K) 대립유전자를 포함)는 LCD(파선, 원) 및 HCD(실선, 정사각형) 발효 조건 둘 다 하에 T4ms 균주(도 3, 회색 선; 즉, 야생형 lov 유전자를 포함)에 비해 향상된 단백질 생산성 표현형을 갖는다. 예를 들어, 도 3에 제시된 것처럼, 공급 당에서의 단백질 수율은 lov(T813K) 돌연변이가 존재할 때 42%(LCD) 및 32%(HCD) 증가하였다.
도 4는 야생형 lov 대립유전자(회색 선) 및 조작된 lov(dis) 대립유전자(검정 선)를 각각 포함하는 이의 돌연변이체 유도체 T4ml+(실선, 정사각형) 및 T4sl+(파선, 원)와의 전체 셀룰라아제 생산 균주 T4m(실선, 정사각형) 및 T4s(파선, 원)에 대한 발효기에서의 공급 당에 대한 총 단백질 수율의 비교를 제시한다. 도면 범례는 각각의 세포주 유형에 대해 균주 명칭(유전자형에 대한 표 1 참조), 이어서 괄호 내에 기재된 그 균주에서의 lov 대립유전자를 보여준다. 도 4에 제시된 것처럼, T4ml+ 및 T4sl+ (딸) 균주(도 4, 검정 선; 즉, 돌연변이체 lov(dis) 대립유전자를 포함)는 이의 T4m 및 T4s (모) 균주(도 4, 회색 선; 즉, 야생형 lov 유전자를 포함)에 비해 향상된 단백질 생산성 표현형을 갖지 않는다.
도 5는 lov(T813K) 대립유전자, lov(dis) 대립유전자, 또는 야생형 lov(+) 대립유전자 중 어느 하나를 갖는 다양한 마커 삽입 부위를 갖는 균주의 진탕 플라스크 발효에서의 상대 총 단백질 역가의 비교를 제시한다. 보다 구체적으로는, 전체 셀룰라아제 생성 균주는 병렬적으로 T4 균주 및 T4m 균주 실행에 대해 총 단백질 역가에 대해 진탕 플라스크에서 평가되었다. 다양한 마커 삽입 부위의 균주는 야생형 lov(+) 대립유전자(도 5, 가장 밝은 회색 막대), 돌연변이체 lov(T813K) 대립유전자(도 5, 중간 회색 막대), 또는 lov(dis) 대립유전자(도 5, 가장 어두운 회색 막대) 중 하나와 발효에서 비교되었다. 따라서, 평가된 모든 마커 삽입 부위에서, 총 단백질 역가는 lov(T813K) 대립유전자가 존재할 때 증가하였다. 그러나, lov 유전자 자체(lov(dis) 대립유전자)에서의 pyr4(도 5, 균주 "41G") 또는 pyr2 마커(균주 T4 및 T4m) 중 어느 하나의 삽입은 상대 역가에서 상당한 개선을 나타내지 않았다.
도 6은 전체 셀룰라아제 생성 T4mp 균주(도 6, 회색 데이터 점/회색 선) 및 lov(T813K) 돌연변이체 T4mlp 균주(도　6, 검정 데이터 점/검정 선)에 대한 공급 당에서의 총 단백질 수율의 비교를 보여준다. 따라서, 이 전체 셀룰라아제 발현 균주는 발효기에서의 단백질 생산성에 대해 평가되었다. 도면 범례는 각각의 세포주 유형에 대해 균주 명칭(유전자형에 대한 표 1 참조), 이어서 괄호 내의 그 균주에서의 lov 대립유전자를 보여준다. 도 6에 도시된 바대로, T4mlp 균주(도 6, 검정 선; 즉, 돌연변이체 lov(T813K) 대립유전자를 포함)는 T4mp (모) 균주(도 6, 회색 선; 즉, 야생형 lov 유전자를 포함)에 비해 향상된 단백질 생산성 표현형을 갖는다. 예를 들어, 도 6에 제시된 것처럼, 공급 당에서의 단백질 수율은 lov(T813K) 돌연변이가 존재할 때 28% 증가하였다.
도 7은 일곱(7)개의 상이한 자낭균류 LOV 오솔로그와 정렬된 트리초데르마 종 (자연적) LOV 단백질(서열 번호 2)의 Clustal W (1.83) 다중 서열 정렬을 제시한다. 예를 들어, Clustal 정렬에 사용된 여덟(8)개의 단백질 서열은 도 7a-도 7b에 도시되어 있고(서열 번호 2 및 서열 번호 11-17), 이의 Clustal 정렬은 도 7c-도 7f에 도시되어 있다. 보다 구체적으로는, 도 7c-도 7f에 제시된 것처럼, 트리초데르마 종 (자연적) LOV 단백질(서열 번호 2; "2"로 표지, 볼드체 대문자 잔기에 도시됨)은 아스페르길루스 종 LOV 단백질 오솔로그(서열 번호 11, "11" 표지), 페니실리움 종 LOV 단백질 오솔로그(서열 번호 12, "12" 표지), 탈라로마이세스 종 LOV 단백질 오솔로그(서열 번호 13, "13" 표지), 푸사륨 종 LOV 단백질 오솔로그(서열 번호 14, "14" 표지), 마이셀리오프토라 종 LOV 단백질 오솔로그(서열 번호 15, "15" 표지), 뉴로스포라 종 LOV 단백질 오솔로그(서열 번호 16, "16" 표지) 및 칸디다 종 LOV 단백질 오솔로그(서열 번호 17, "17" 표지)와 정렬된다. 도 7c-도 7f에 도시된 것처럼(즉, 정렬된 아미노 잔기 아래), 별표 "*"는 단일의 완전히 보호된 잔기를 갖는 위치를 나타내고; 콜론 ":"은 강하게 유사한 특성(즉, Gonnet PAM 250 행렬에서의 0.5 초과의 점수)의 기들 사이의 보존을 나타내고, 마침표 "."는 약하게 유사한 특성(즉, Gonnet PAM 250 행렬에서의 0.5 미만의 점수)의 기들 사이의 보존을 나타낸다. 고도로 보존된 트레오닌(T) 아미노산은 볼드체 밑줄 T 잔기로서 도 7f에 표시된다.
도 8은 (자연적) 트리초데르마 종 LOV 단백질 서열(서열 번호 2)의 C 말단 잔기 500-894번 위치(서열 번호 18)를 사용한 BLAST 단백질 정렬(NCBI; Blastp 스위트)을 통해 수행된 아미노산 서열 정렬을 제시한다. 예를 들어, 도 8a-8g에 제시된 것처럼, 서열 번호 18은 트리초데르마 종 (자연적) LOV 단백질의 C 말단 아미노산 서열(즉, 서열 번호 2의 아미노산 잔기 500-894번 위치에 상응하는 394개의 아미노산 잔기 위치를 포함)을 포함하고, 여기서 813번 위치에서의 잔기에서의 고도로 보존된 트레오닌(T) 아미노산(T₈₁₃)은 볼드체의, 밑줄 표시된 T 로 표시된다. 따라서, 이 394개의 잔기 C 말단 아미노산 서열(서열 번호 18)은 자낭균류 LOV 단백질 오솔로그(예를 들어, 서열 번호 11-17; 도 8a-8g)와 정렬되었다. 도 8a에 도시된 것처럼, 아스페르길루스 종 LOV 단백질 오솔로그(서열 번호 11)는 서열 번호 18과 약 50%의 아미노산 서열 동일성을 포함하고, 여기서 서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 고도로 보존된 트레오닌( T ) 아미노산은 볼드체이고 밑줄 표시되고(도 8a), 페니실리움 종 LOV 단백질 오솔로그(서열 번호 12)는 서열 번호 18과 약 50%의 아미노산 서열 동일성을 포함하고, 여기서 서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 고도로 보존된 트레오닌( T ) 아미노산은 볼드체이고 밑줄 표시되고(도 8b), 탈라로마이세스 종 LOV 단백질 오솔로그(서열 번호 13)는 서열 번호 18과 약 60%의 아미노산 서열 동일성을 포함하고, 여기서 서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 고도로 보존된 트레오닌( T ) 아미노산은 볼드체이고 밑줄 표시되고(도 8c), 푸사륨 종 LOV 단백질 오솔로그(서열 번호 14)는 서열 번호 18과 약 88%의 아미노산 서열 동일성을 포함하고, 여기서 서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 고도로 보존된 트레오닌( T ) 아미노산은 볼드체이고 밑줄 표시되고(도 8d), 마이셀리오프토라 종 LOV 단백질 오솔로그(서열 번호　15)는 서열 번호 18과 약 90%의 아미노산 서열 동일성을 포함하고, 여기서 서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 고도로 보존된 트레오닌( T ) 아미노산은 볼드체이고 밑줄 표시되고(도 8e), 뉴로스포라 종 LOV 단백질 오솔로그(서열 번호 16)는 서열 번호 18과 약 90%의 아미노산 서열 동일성을 포함하고, 여기서 서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 고도로 보존된 트레오닌( T ) 아미노산은 볼드체이고 밑줄 표시되고(도 8f), 칸디다 종 LOV 단백질 오솔로그(서열 번호 17)는 서열 번호 18과 약 50%의 아미노산 서열 동일성을 포함하고, 여기서 서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 고도로 보존된 트레오닌( T ) 아미노산은 볼드체이고 밑줄 표시된다(도 8g).

본원에 제시되고 기재된 것처럼, 비제한적인 예로서 본 발명은 향상된 단백질 생산성 표현형을 포함하는 사상성 진균의 변이체 균주를 생성시키는 사상성 진균에서의 유전적 변형을 포함하는 사상성 진균 단백질 생산 및 이의 방법의 당해 분야에서의 소정의 진행 중이고 충족되지 않은 필요성을 해결한다. 보다 구체적으로는, 본원에 제시되고 기재되고 예시된 것처럼, 향상된 단백질 생산성 표현형을 포함하는 사상성 진균의 이러한 변이체 균주는 상업용 분야에 대해 관심 단백질의 대규모 제조에서와 같은 액침된 배양에서의 성장에 매우 적합하다.

I. 정의

본 발명의 균주 및 방법을 자세히 기술하기 전에, 명확함을 위하여 하기 용어가 정의된다. 정의되지 않은 용어는 관련 분야에서 사용되는 통상적인 의미와 일치되어야 한다. 달리 정의되지 않는 한, 본원에 사용되는 모든 기술 용어 및 과학 용어는 본 발명의 조성물 및 방법이 적용되는 기술 분야의 당업자가 일반적으로 이해하는 것과 동일한 의미를 갖는다.

본원에 기재된 바와 같은 조작, 작제 및 사용을 위한 사상성 진균 세포는 일반적으로 자낭균류 문, 주발버섯 아문, 특히 영양 균사 상태를 갖는 진균에서 유래한다. 이러한 유기체는 비제한적인 예로서 트리코데르마 종, 아스페르길루스 종, 푸사륨 종, 페니실리움 종, 크리소스포륨 종, 세팔로스포륨 종, 탈라로마이세스 종, 게오스미티아 종, 뉴로스포라 종, 마이셀리오프토라 종 등을 포함하는 상업적으로 중요한 산업적 단백질 및 약제학적 단백질의 제조에 사용되는 사상성 진균 세포를 포함한다. 예를 들어, 특정 구현예에서, 사상성 진균 세포 및 이의 균주는 트리코데르마 레세이(이전에 트리코데르마 론기브라치아툼(Trichoderma longibrachiatum) 및 하이포크레아 예코리나(Hypocrea jecorina)로 분류됨), 아스페르길루스 니게르(Aspergillus niger), 아스페르길루스 푸미가투스(Aspergillus fumigatus), 아스페르길루스 이타코니쿠스(Aspergillus itaconicus), 아스페르길루스 오리자에(Aspergillus oryzae), 아스페르길루스 니둘란스(Aspergillus nidulans), 아스페르길루스 테레우스(Aspergillus terreus), 아스페르길루스 소에(Aspergillus sojae), 아스페르길루스 쟈포니쿠스(Aspergillus japonicus), 뉴로스포라 크라사(Neurospora crassa), 페니실리움 푸니쿨로숨(Penicillium funiculosum), 페니실리움 크리소게눔(Penicillium chrysogenum), 탈라로마이세스 (게오스미티아) 에메르소니(Talaromyces (Geosmithia) emersonii), 푸사륨 베네나툼(Fusarium venenatum), 마이셀리오프토라 테르모필라(Myceliophthora thermophila), 크리소스포륨 루크노웬스(Chrysosporium lucknowense)(C1) 등을 포함하지만, 이들로 제한되지는 않는다.

본원에 사용된 바와 같이, "사상성 진균 균주(들)", "사상성 진균성 균주(들)", "진균 균주(들)", "진균성 균주(들)", "사상성 진균 세포(들)", "사상성 진균성 세포(들)", "진균 세포(들)", "진균성 세포(들)" 및 기타와 같은 용어 및 어구는 설명의 편의를 위해 상호교환적으로 사용될 수 있고, 본 발명의 범위를 제한하도록 의도되지 않는다.

소정의 구현예에서, 본원에 기재된 바와 같은 조작, 작제 및 사용을 위한 사상성 진균 세포는 일반적으로 자낭균류 문, 주발버섯 아문, 특히 영양 균사 상태를 갖고 lov 유전자(또는 lov 유전자 동족체(들))를 포함하는 진균에서 유래한다.

본원에 사용된 바와 같이, "모 세포", "모 진균 세포", "모 균주", "모 진균 균주", "사상성 진균 세포의 모 균주", "기준 균주" 등과 같은 어구는 상호교환적으로 사용될 수 있고, "비변형된" 모 사상성 진균 세포를 지칭한다. 예를 들어, "사상성 진균 세포의 모 균주"는 "모" 세포 및 "딸" 세포가 하나의 유전자 변형만이 다르도록 사상성 진균 세포의 변이체 (딸) 균주를 생성하기 위해 "모" 세포의 게놈이 (예를 들어, 모 세포로 도입된 오직 하나의 유전자 변형을 통해) 변형되거나 변형 가능한 사상성 진균의 임의의 세포 또는 균주를 지칭한다.

본원에 사용된 바와 같이, "변이체 세포", "딸 세포", "변이체 균주", "딸 균주", "변이체 또는 딸 진균 균주", "사상성 진균 세포의 변이체 또는 딸 균주" 등과 같은 어구는 상호교환적으로 사용될 수 있고, 사상성 진균 세포의 모 균주(또는 기준 균주)로부터 유래된(즉, 수득되거나 수득 가능한) 사상성 진균 세포의 변이체 균주를 지칭하고, 여기서 변이체 균주는 모 균주에 존재하지 않는 하나의 유전자 변형만을 포함하여서, 비교에 의하면 "모" 균주와 "변이체" 균주 간의 표현형 차이는 하나의 유전자 변형에 기인할 수 있다. 다르게 표현하면, 모 균주 및 변이체 균주는 변이체 균주로 "도입된" 단일 유전자 변형을 제외하고는 달리 동질유전자이다. 따라서, 본 발명에서, 모 균주 및 변이체 균주는 소정의 특징, 예컨대 유전자 변형, 발현 표현형, 형태 표현형 등을 갖는 것으로 기재될 수 있지만, 당업자는 이것이 기술적으로 이러한 특징을 갖는 모 균주 또는 변이체 균주의 세포라는 것을 이해할 것이고, "균주"는 편의를 위해 지칭된다.

소정의 구현예에서, 비변형된 (모) 세포는 특히 이들로부터 유래된 유전자 변형된 (변이체/딸) 세포와 비교할 때(이에 대하여) "대조군 세포" 또는 "기준 세포"라 칭해질 수 있다.

본원에 사용된 바와 같이, 용어 "야생형" 및 "자연적"은 상호교환적으로 사용되고, 자연계에서 발견되는 것과 같은 유전자, 단백질, 단백질 혼합물 또는 균주를 지칭한다.

본원에 사용된 바와 같이, 본 발명의 소정의 트리초데르마 레세이 균주/세포는 하기 표 1에 제시된 바와 같이 명명/약칭된다.

본원에 사용된 바와 같이, 점도 감소 트리초데르마 균주 "B7ms1"은 국제 PCT 공보 WO2012/145584호(본원에 그 전체가 참고로 포함됨)에서 "Morph TrGA 77B7Δmpg1Δseb1"이라 지칭되는 글루코아밀라아제 발현 균주이다.

본원에 사용된 바와 같이, 게놈 코디네이트(예를 들어, 스캐폴드 16에서의 425393) 및 단백질 확인 번호(PID, 예를 들어, PID 50212)는 에너지부 산하 Joint Genome Institute(JGI)에 의해 생성된 트리초데르마 레세이 QM6a 게놈 서열 어셈블리의 버전 2를 참조한다. (The Genome Portal of the Department of Energy Joint Genome Institute, Grigoriev et al., Nucleic Acids Res 2012 Jan;40(Database issue: D26-32. doi: 10.1093/nar/gkr947). JGI 어셈블리된 스캐폴드 서열은 또한 뉴클레오타이드 수탁 번호 GL985056.1 내지 GL985132.1로 GenBank(The National Center for Biotechnology)에 기탁되었다.

본원에 사용된 바와 같이, (B7ms1 모 균주로부터 유래된) "B7ms1-SF12"라 명명된 돌연변이체 (변이체) 트리초데르마 균주는 증가된 단백질 생산성 표현형(즉, B7ms1 (모) 균주에 비해)을 포함한다. 보다 구체적으로는, 트리초데르마 B7ms1-SF12 균주에서의 확인된 돌연변이는 LOV(즉, 예측된 단백질 PID 50212; 서열 번호 2)라 명명된 단백질의 암호화 서열을 변경하고, 여기서 (자연적) LOV 단백질(서열 번호 2)의 잔기 813번 위치(T813)에서의 고도로 보존된 트레오닌(T) 아미노산은 (돌연변이체) B7ms1-SF12 균주에서의 리신으로 치환(T→K813)된다(즉, T813K 치환, 예를 들어, 서열 번호 4 813번 위치에 대해 서열 번호 2 813번 위치 비교). 예를 들어, 하기 실시예 부문에 기재된 바대로, 균주 B7ms1-SF12에서의 lov 돌연변이체 대립유전자는 스캐폴드 16에서 425393에서 G (구아닌)에서 T(티민)의 단일 뉴클레오타이드 변화를 포함하여서, 서열 번호 4의 아미노산 813번 위치에서의 리신(K)을 포함하는 암호화된 LOV (변이체) 단백질(서열 번호　4)에서의 "T813K" 치환을 생성시킨다(아미노산 813번 위치; 서열 번호 2에서 트레오닌(T)을 포함하는 서열 번호 2의 자연적 LOV 단백질과 반대로).

본원에 사용된 바와 같이, "T4"라 명명된 트리초데르마 균주는 국제 PCT 공보 WO2016/130523호(본원에 그 전체가 참고로 포함됨)에 기재된 바대로 nik1(M743T) 돌연변이의 혼입 및 화학적 돌연변이유발에 의해 트리초데르마 균주 RL-P37로부터 유래되었다.

본원에 사용된 바와 같이, "nik1(M743T)"이라 명명된 유전자 대립유전자는 서열 번호 19의 아미노산 (잔기) 743번 위치에서의 메티오닌(M)에서 트레오닌(T) 치환을 포함하는 변이체 히스티딘 키나제(NIK1; 서열 번호 19)를 암호화하는 돌연변이체 히스티딘 키나제 유전자(nik1)를 포함한다.

본원에 사용된 바와 같이, "T4_pyr2"라 명명된 트리초데르마 균주는 pyr2 유전자의 돌연변이 및 기능 손실에 의해 트리초데르마 균주 T4로부터 유래되어서, 이것은 형질전환 선별 마커로서 사용될 수 있다.

본원에 사용된 바와 같이, "T4m"이라 명명된 트리초데르마 균주는 균주 T4로부터 유래되고, 여기서 균주 T4m은 mpg1 유전자의 돌연변이(Δmpg1) 및 nik1(M743T) 유전자를 포함한다. 균주 T4m은 따라서 자연적 lov 단백질(서열 번호 2)을 암호화하는 야생형 lov 대립유전자(즉, 대립유전자 lov(+))를 포함한다.

본원에 사용된 바와 같이, "T4m_pyr2"라 명명된 트리초데르마 균주는 균주 T4m으로부터 유래되고, 여기서 균주 T4m_pyr2는 mpg1 유전자의 돌연변이(Δmpg1), nik1(M743T) 유전자 및 무 기능적 pyr2 유전자를 포함한다.

본원에 사용된 바와 같이, "T4ml+"라 명명된 트리초데르마 균주는 균주 T4m_pyr2로부터 유래되고, 여기서 균주 T4ml+는 mpg1 유전자의 돌연변이(Δmpg1) 및 대립유전자 lov(dis)를 포함한다.

본원에 사용된 바와 같이, "T4ml"이라 명명된 트리초데르마 균주는 균주 T4ml+로부터 유래되고, 여기서 균주 T4ml은 nik1(M743T), mpg1 유전자의 돌연변이(Δmpg1), 대립유전자 lov(T813K) 및 무 기능적 pyr2 유전자를 포함한다.

본원에 사용된 바와 같이, "T4mls+"라 명명된 트리초데르마 균주는 균주 T4ml로부터 유래되고, 여기서 균주 T4mls는 nik1(M743T), mpg1 및 seb1 유전자의 이중 돌연변이(Δmpg1; seb1) 및 대립유전자 lov(T813K)를 포함한다.

본원에 사용된 바와 같이, "T4ms"라 명명된 트리초데르마 균주는 균주 T4m으로부터 유래되고, 여기서 균주 T4ms는 nik1(M743T) 및 mpg1 및 seb1 유전자의 이중 돌연변이(Δmpg1; seb1)를 포함한다.

본원에 사용된 바와 같이, "T4s"라 명명된 트리초데르마 균주는 균주 T4로부터 유래되고, 여기서 균주 T4s는 nik1(M743T) 및 seb1 유전자의 돌연변이(Δseb1)를 포함한다.

본원에 사용된 바와 같이, "T4s_pyr2"라 명명된 트리초데르마 균주는 균주 T4s로부터 유래되고, 여기서 균주 T4s_pyr2는 nik1(M743T), seb1 유전자의 돌연변이(Δseb1) 및 무 기능적 pyr2 유전자를 포함한다.

본원에 사용된 바와 같이, "T4sl+"라 명명된 트리초데르마 균주는 균주 T4s_pyr2로부터 유래되고, 여기서 균주 T4sl+는 nik1(M743T), seb1 유전자의 돌연변이(Δseb1) 및 대립유전자 lov(dis)를 포함한다.

본원에 사용된 바와 같이, "T4sl"이라 명명된 트리초데르마 균주는 균주 T4sl+로부터 유래되고, 여기서 균주 T4sl은 nik1(M743T), seb1 유전자의 돌연변이(Δseb1), 대립유전자 lov(T813K) 및 무 기능적 pyr2 유전자를 포함한다.

본원에 사용된 바와 같이, "T4l+"라 명명된 트리초데르마 균주는 균주 T4_pyr2로부터 유래되고, 여기서 균주 T4l+는 nik1(M743T) 및 대립유전자 lov(dis)를 포함한다.

본원에 사용된 바와 같이, "41G"라 명명된 트리초데르마 균주는 균주 T4로부터 유래되고, 여기서 균주 4lG는 nik1(M743T) 및 (야생형) lov(+) 대립유전자를 포함한다.

본원에 사용된 바와 같이, "41G_pyr4"라 명명된 트리초데르마 균주는 균주 41G로부터 유래되고, 여기서 균주 4lG_pyr4는 nik1(M743T), (야생형) lov(+) 대립유전자 및 pyr4 유전자의 결실을 포함한다.

본원에 사용된 바와 같이, "41Gl+"라 명명된 트리초데르마 균주는 균주 4lG_pyr4로부터 유래되고, 여기서 균주 4lGl+는 nik1(M743T) 및 대립유전자 lov(dis)를 포함한다.

본원에 사용된 바와 같이, "T4mc"라 명명된 트리초데르마 균주는 균주 T4m_pyr2로부터 유래되고, 여기서 균주 T4mc는 nik1(M743T), Δmpg1, 부위 C에서의 pyr2+ 삽입 및 야생형 lov(+) 대립유전자를 포함한다.

본원에 사용된 바와 같이, "T4mlc"라 칭하는 트리초데르마 균주는 균주 T4ml로부터 유래되고, 여기서 균주 T4mlc는 nik1(M743T), Δmpg1, 부위 C에서의 pyr2+ 삽입 및 대립유전자 lov(T813K)를 포함한다.

본원에 사용된 바와 같이, "T4md"라 명명된 트리초데르마 균주는 균주 T4m_pyr2로부터 유래되고, 여기서 균주 T4md는 nik1(M743T), Δmpg1, 부위 B에서의 pyr2+ 삽입 및 야생형 lov(+) 대립유전자를 포함한다.

본원에 사용된 바와 같이, "T4mld"라 명명된 트리초데르마 균주는 균주 T4ml로부터 유래되고, 여기서 균주 T4mld는 nik1(M743T), Δmpg1, 부위 B에서의 pyr2+ 삽입 및 대립유전자 lov(T813K)를 포함한다.

본원에 사용된 바와 같이, "T4mp"라 명명된 트리초데르마 균주는 균주 T4m_pyr2로부터 유래되고, 여기서 균주 T4mp는 nik1(M743T), Δmpg1, 부위 A에서의 pyr2+ 삽입 및 야생형 lov(+) 대립유전자를 포함한다.

본원에 사용된 바와 같이, "T4mlp"라 칭하는 트리초데르마 균주는 균주 T4ml로부터 유래되고, 여기서 균주 T4mlp는 nik1(M743T), Δmpg1, 부위 A에서의 pyr2+ 삽입 및 대립유전자 lov(T813K)를 포함한다.

본원에 사용된 바와 같이, "T4sp"라 명명된 트리초데르마 균주는 균주 T4s_pyr2로부터 유래되고, 여기서 균주 T4sp는 nik1(M743T), Δseb1, 부위 A에서의 pyr2+ 삽입 및 야생형 lov(+) 대립유전자를 포함한다.

본원에 사용된 바와 같이, "T4slp"라 칭하는 트리초데르마 균주는 균주 T4sl로부터 유래되고, 여기서 균주 T4slp는 nik1(M743T), Δseb1, 부위 A에서의 pyr2+ 삽입 및 대립유전자 lov(T813K)를 포함한다.

본원에 사용된 바와 같이, “글루코아밀라아제(GA) 작제물" 또는 "GA 작제물"은 국제 PCT 공보 WO2012/145584호(본원에 그 전체가 참고로 구체적으로 포함됨)에 기재된 글루코아밀라아제를 암호화한다.

본원에 사용된 바와 같이, "대립유전자 lov(+)"는 자연적 LOV 단백질(예를 들어, 서열 번호 2)을 암호화하는 야생형 lov DNA 서열을 포함한다.

본원에 사용된 바와 같이, "대립유전자 lov(T813K)"는 "T813K" 치환(서열 번호　4, 상기 기재됨)을 포함하는 변이체 LOV 단백질을 암호화하는 돌연변이된 (lov) DNA 서열(균주 B7ms1-SF12에서 확인됨, 상기 기재됨)을 포함한다.

본원에 사용된 바와 같이, "대립유전자 lov(dis)"는 lov 유전자의 파괴를 포함하고, 여기서 pyr2 또는 pyr4 중 어느 하나인 선택 가능한 마커는 하기 실시예 3에 더 기재된 바대로 lov 암호화 서열로 통합되었다.

본원에 사용된 바와 같이, "전체 셀룰라아제 균주"는 천연 세크리톰이 주요 셀룰라아제 유전자의 유전자 조작에 의해 변경되지 않는 트리초데르마 균주를 지칭한다.

본원에 사용된 바와 같이, 관심 단백질을 암호화하는 "내인성 (또는 자연적) 사상성 진균 유전자"는 글리코사이드 가수분해효소(GH) 패밀리 효소(예를 들어, EC 번호 3.2.1.1 - 3.2.1.206과 같음)를 암호화하는 내인성 (사상성 진균) 유전자, 당업자에게 알려지고 이해되는 것처럼 프로테아제, 에스테라아제, 리파아제 및 기타를 암호화하는 내인성 유전자를 포함하지만, 이들로 제한되지는 않는다.

따라서, 일반적으로 본원에 기재된 바와 같이, 서열 번호 4의 (변이체) LOV 단백질의 813번 위치에 동등한 아미노산(잔기) 위치에서의 리신(K) 아미노산에 대한 트레오닌(T) 아미노산의 치환(T→K 치환)은 관찰된(증가된) 단백질 생산성 표현형의 원인인 것으로 본원에서 확인된다. 예를 들어, (돌연변이체) B7ms1-SF12 균주 T_813→813K 치환을 암호화하는 도입된 대립유전자(예를 들어, 대립유전자 lov(T813K))를 포함하는 본원에 개시된 바와 같은 사상성 진균 세포는 동일한 조건 하에 발효/배양될 때 이 돌연변이(즉, 자연적 LOV 단백질을 암호화하는 야생형 lov 유전자, 대립유전자 lov(+)를 포함)가 결여된 동질유전자 세포에 비해 향상된 단백질 생산성 표현형을 나타낸다. 보다 구체적으로는 하기 실시예 부문에 제시된 것처럼, 본 발명의 사상성 진균 세포(이러한 향상된 단백질 생산성 표현형을 포함)는 (예를 들어, 상업용 분야에 대해 관심 단백질의 대규모 제조에서와 같은) (호기성) 액침된 배양에서의 성장에 특히 매우 적합하다.

본원에 사용된 바와 같이, "주어진 아미노산 서열"에서의 아미노산 잔기의 "위치"는 서열 번호 2의 천연 트리초데르마 종 LOV 단백질의 아미노산 잔기 넘버링(위치)을 사용하여 본원에서 넘버링된다. 예를 들어, "서열 번호　2의 813번 위치에 상응하는 서열 위치에서의 트레오닌(T) 잔기를 포함" 및 "서열 번호　2의 813번 위치에 상응하는 서열 위치에서의 리신(K) 잔기를 포함"과 같은 어구에서, 자연적 (트리초데르마 종) LOV 단백질의 아미노산 서열(서열 번호 2)은 기준 (모) 단백질 서열로 작용한다.

예를 들어, 도 7c-7f에 도시된 바와 같이, 본원에 기재된 주어진 아미노산 서열은 본원에 기재된 정렬 알고리즘(및/또는 당업자에게 공지된 정렬 알고리즘)을 이용하여 자연적 트리초데르마 종 LOV 단백질 아미노산 서열(서열 번호 2)과 정렬될 수 있고, 자연적 서열에서의 아미노산 잔기와 정렬(바람직하게는, 최적으로 정렬)하는 주어진 아미노산 서열에서의 아미노산 잔기는 LOV 서열에서의 상응하는 아미노산 잔기를 참조하여 편리하게 넘버링될 수 있다. 따라서, 도 7은 다양한 (자낭균류) 사상성 진균, 예컨대 서열 "12" 표지된 아스페르길루스 종(서열 번호 12), 서열 "13" 표지된 페니실리움 종(서열 번호 13), 서열 "14" 표지된 탈라로마이세스 종(서열 번호 14), 서열 "15" 표지된 푸사륨 종(서열 번호 15), 서열 "16" 표지된 마이셀리오프토라 종(서열 번호 16), 서열 "17" 표지된 뉴로스포라 종(서열 번호 17) 및 서열 "18" 표지된 칸디다 종(서열 번호 18)으로부터의 LOV 단백질 오솔로그와 정렬된 서열 "2" 표지된 자연적 트리초데르마 종 LOV 단백질(서열 번호 2)의 다중 서열 정렬을 제시한다.

마찬가지로, 트리초데르마 종 LOV 단백질의 1차 (1°) 서열(서열 번호 2)과 서열 상동성 또는 서열 동일성을 확립하기 위해, 당업자는 당업자에게 공지된 서열 정렬 알고리즘, 소프트웨어 및 이의 방법을 이용하여 서열 번호 2의 1차 서열을 하나 이상의 후보 LOV 단백질 (오솔로그) 서열과 용이하게 비교할 수 있다. 따라서, 정렬을 유지시키기 위해(즉, 임의적인 결실 및 삽입을 통해 보존된 잔기의 제거를 피하기 위해) 필요한 삽입 및 결실을 허용하는, 보존된 잔기를 정렬한 후, 자낭균류 LOV 단백질의 1차 서열에서의 특정 아미노산에 동등한 잔기가 정의된다. 보존된 잔기의 정렬은 바람직하게는 이러한 잔기의 100%를 보존해야 한다. 그러나, 보존된 잔기의 98% 초과, 95%, 90%, 85%, 80%, 75% 70%, 50% 또는 적어도 45%의 정렬은 동등한 잔기를 한정하기에 또한 적절하다.

따라서, 본원에 사용된 바와 같이, 서열 번호 2의 813번 위치에 상응하는(또는 동등한) 아미노산 (잔기) 위치에서의 리신(K) 아미노산에 대한 트레오닌 (T) 아미노산의 치환(T₈₁₃→₈₁₃K 치환)은 임의의 자낭균류 사상성 진균 세포에서 서열 번호 2의 813번 위치에 상응하는 아미노산 (잔기) 위치에서의 임의의 T₈₁₃→₈₁₃K 치환을 포함한다.

본원에 사용된 바와 같이, 용어 "유전자"는 단백질 또는 RNA를 암호화하고 이의 발현을 지시하는 핵산을 지칭한다는 점에서 용어 "대립유전자"와 동의어이다. 사상성 진균의 영양 형태는 일반적으로 반수체이며, 따라서 특정 유전자의 단일 카피(즉, 단일 대립유전자)는 특정 표현형을 부여하기에 충분하다.

본원에 사용된 바와 같이, 용어 "폴리펩타이드" 및 "단백질"(및/또는 이의 각각의 복수 형태)은 펩타이드 결합에 의해 연결된 아미노산 잔기를 포함하는 임의의 길이의 중합체를 지칭하기 위해 상호교환적으로 사용된다. 아미노산 잔기에 대한 통상적인 1문자 또는 3문자 코드가 본원에 사용된다. 중합체는 선형 또는 분지형일 수 있고, 변형된 아미노산을 포함할 수 있고, 비아미노산이 개재될 수 있다. 이 용어는 또한 자연적으로 또는 개입에 의해, 예컨대 디설파이드 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화 또는 표지 성분과의 접합과 같은 임의의 다른 조작 또는 변형에 의해 변형된 아미노산 중합체를 포함한다. 예를 들어, 아미노산의 하나 이상의 유사체(예를 들어, 비천연 아미노산 등을 포함)뿐만 아니라 당업계에 공지된 다른 변형을 함유하는 폴리펩타이드도 정의에 포함된다.

본원에 사용된 바와 같이, 용어 "유도체 폴리펩타이드/단백질"은 N 말단 및 C 말단 중 어느 하나 또는 둘 모두에 대한 하나 이상의 아미노산의 부가, 아미노산 서열에서의 하나의 또는 다수의 상이한 부위에서의 하나 이상의 아미노산의 치환, 단백질의 어느 하나 또는 양 말단에서의 또는 아미노산 서열에서의 하나 이상의 부위에서의 하나 이상의 아미노산의 결실, 및/또는 아미노산 서열에서의 하나 이상의 부위에서의 하나 이상의 아미노산의 삽입에 의해 단백질로부터 유래되거나 유래될 수 있는 단백질을 지칭한다. 단백질 유도체의 제조는 자연적 단백질을 암호화하는 DNA 서열의 변형, 적합한 숙주로 그 DNA 서열을 형질전환시키는 것 및 변형된 DNA 서열을 발현시켜 유도체 단백질을 형성하는 것에 의해 달성될 수 있다.

관련(및 유도체) 단백질은 "변이체 단백질"을 포함한다. 변이체 단백질은 소수의 아미노산 잔기에서의 치환, 결실, 및/또는 삽입에 의해 기준/모 단백질(예를 들어, 야생형 단백질)과 상이하다. 변이체 단백질과 모 단백질 사이에서 차이가 있는 아미노산 잔기의 수는 1개 이상, 예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 15개, 20개, 30개, 40개, 50개 이상의 아미노산 잔기일 수 있다. 변이체 단백질은 기준 단백질과 적어도 약 50%, 적어도 약 60%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 심지어 적어도 약 99%, 또는 그보다 많은 아미노산 서열 동일성을 공유할 수 있다. 변이체 단백질은 또한 선택된 모티프, 도메인, 에피토프, 보존 영역 등에서 기준 단백질과 상이할 수 있다.

본원에 사용된 바와 같이, 용어 "상사 서열"은 관심 단백질(즉, 전형적으로 원래의 관심 단백질)과 유사한 작용, 3차 구조, 및/또는 보존 잔기를 제공하는 단백질 내의 서열을 지칭한다. 예를 들어, α-헬릭스 또는 β-시트 구조를 함유하는 에피토프 영역에서, 상사 서열에서의 대체 아미노산은 바람직하게는 동일한 특정 구조를 유지한다. 이 용어는 또한 뉴클레오타이드 서열, 및 아미노산 서열을 지칭한다. 일부 구현예에서, 아미노산의 대체가 유사한 기능 또는 개선된 기능을 나타내는 변이체 효소를 생성시키도록 상사 서열이 개발된다. 일부 구현예에서, 관심 단백질에서의 아미노산의 3차 구조 및/또는 보존 잔기는 관심 분절 또는 단편에서 또는 그 근처에 위치한다. 따라서, 관심 분절 또는 단편이 예를 들어 α-헬릭스 또는 β-시트 구조를 함유하는 경우, 대체 아미노산은 바람직하게는 그 특정 구조를 유지시킨다.

본원에 사용된 바와 같이, 용어 "상동성 단백질"은 기준 단백질과 비슷한 활성 및/또는 구조를 갖는 단백질을 지칭한다. 상동물은 반드시 진화론상 관련되는 것은 아니다. 따라서, 이 용어는 상이한 유기체로부터 얻은 동일한, 유사한 또는 대응하는 단백질(들)(즉, 구조 및 기능 면에서)을 포함하고자 한 것이다. 일부 구현예에서, 기준 단백질과 유사한 4차, 3차 및/또는 1차 구조를 갖는 상동물을 확인하는 것이 바람직하다.

서열 사이의 상동성의 정도는 당해 분야에 알려진 임의의 적합한 방법을 이용하여 결정될 수 있다(예를 들어, Smith 및 Waterman의1981 문헌; Needleman 및 Wunsch의 1970 문헌; Pearson 및 Lipman의 1988 문헌; Wisconsin Genetics Software Package(Genetics Computer Group, 미국 위스콘신주 매디슨 소재)의 GAP, BESTFIT, FASTA 및 TFASTA와 같은 프로그램; 및 Devereux 등의 1984 문헌 참조).

예를 들어, PILEUP는 서열 상동성 수준을 결정하는 데 유용한 프로그램이다. PILEUP은 진행식 쌍별 정렬(pair-wise alignment)을 이용하여 관련 서열들의 군으로부터 다중 서열 정렬을 생성한다. 이것은 또한 정렬을 생성하는 데 사용된 클러스터링(clustering) 관계를 나타내는 트리(tree)를 작성할 수 있다. PILEUP은 Feng 및 Doolittle의 1987 문헌의 진행식 정렬 방법의 단순화를 이용한다. 상기 방법은 Higgins 및 Sharp의 1989 문헌에 의해 기재된 것과 유사하다. 유용한 PILEUP 매개변수는 3.00의 디폴트 갭 가중치, 0.10의 디폴트 갭 길이 가중치 및 가중 말단 갭을 포함한다. 유용한 알고리즘의 또 다른 예로는 문헌[Altschul et al., 1990 and Karlin et al., 1993]에 의해 기재된 BLAST 알고리즘이다. 하나의 특히 유용한 BLAST 프로그램은 WU-BLAST-2 프로그램이다(예를 들어, Altschul 등의 1996 문헌 참조). 매개변수 "W", "T" 및 "X"는 정렬의 민감도 및 속도를 결정한다. BLAST 프로그램은 디폴트로서 11의 워드길이(W), 50의 BLOSUM62 점수 행렬(예를 들어, Henikoff 및 Henikoff의 1989 문헌 참조) 정렬(B), 10의 기대치(E), M′5, N′-4, 및 스트랜드 둘 다의 비교를 이용한다.

본원에 사용된 바와 같이, 어구 "실질적으로 유사한" 및 "실질적으로 동일한"은, 적어도 2개의 핵산 또는 폴리펩타이드의 맥락에서, 전형적으로 폴리뉴클레오타이드 또는 폴리펩타이드가 기준(즉, 야생형) 서열과 비교하여 적어도 약 70%의 동일성, 적어도 약 75%의 동일성, 적어도 약 80%의 동일성, 적어도 약 85%의 동일성, 적어도 약 90%의 동일성, 적어도 약 91%의 동일성, 적어도 약 92%의 동일성, 적어도 약 93%의 동일성, 적어도 약 94%의 동일성, 적어도 약 95%의 동일성, 적어도 약 96%의 동일성, 적어도 약 97%의 동일성, 적어도 약 98%의 동일성, 또는 심지어 적어도 약 99%의 동일성 이상을 갖는 서열을 포함함을 의미한다. 서열 동일성은 표준 매개변수를 이용하여 BLAST, ALIGN 및 CLUSTAL과 같은 알려진 프로그램을 이용하여 결정될 수 있다. (예를 들어, Altschul 등의 1990 문헌; Henikoff 등의 1989 문헌; Karlin 등의 1993 문헌; 및 Higgins 등의 1988 문헌 참조). BLAST 분석을 수행하기 위한 소프트웨어는 미국 국립 생물공학 정보 센터(National Center for Biotechnology Information)를 통해 공공에게 이용 가능하다. 또한, 데이터베이스는 FASTA(Pearson 등의 1988 문헌)를 이용하여 조사될 수 있다. 2개의 폴리펩타이드가 실질적으로 동일하다는 하나의 표시는 제1 폴리펩타이드가 제2 폴리펩타이드와 면역학적으로 교차반응성이라는 것이다. 전형적으로, 보존적 아미노산 치환이 다른 폴리펩타이드는 면역학적으로 교차반응성이다. 따라서, 예를 들어, 2개의 펩타이드가 보존적 치환만이 다른 경우에 폴리펩타이드는 제2 폴리펩타이드와 실질적으로 동일하다. 2개의 핵산 서열이 실질적으로 동일하다는 다른 표시는 2개의 분자가 엄격한 조건 하에 (예를 들어, 높은 고엄격도로 배지의 범위 내에서) 서로에 혼성화한다는 것이다.

본원에 사용된 바와 같이, "핵산"은 뉴클레오타이드 서열 또는 폴리뉴클레오타이드 서열, 및 이의 단편 또는 일부를 지칭할 뿐만 아니라, 센스 가닥 또는 안티센스 가닥을 나타내는지와 상관없이, 이중 가닥 또는 단일 가닥일 수 있는 게놈 또는 합성 기원의 DNA, cDNA 및 RNA를 지칭한다.

본원에 사용된 바와 같이, 용어 "발현"은 본 발명의 핵산 분자로부터 유래된 센스 RNA(mRNA) 또는 안티센스 RNA의 전사 및 안정한 축적을 지칭한다. 발현은 또한 mRNA가 폴리펩타이드로 번역되는 것을 지칭할 수 있다. 따라서, 용어 "발현"은 비제한적인 예로서 전사, 전사 후 변형, 번역, 번역 후 변형, 분비 등을 포함하는 폴리펩타이드의 생산에 관여된 임의의 단계를 포함한다.

본원에 사용된 바와 같이, "사상성 진균 세포의 변이체 균주가 '증가한' 양의 관심 단백질(POI)을 발현한다/생산한다"(즉, 모 세포에 비해)와 같은 어구에 사용된 바와 같은 조합된 용어 "발현한다/생산한다"에서, 용어 "발현한다/생산한다"는 본 발명의 이러한 변이체 사상성 진균 균주에서 단백질의 발현 및 생산에 관여된 임의의 단계를 포함하고자 한다.

소정의 구현예에서, "실질적인 상동성"을 포함하는 LOV 단백질을 암호화하는 유전자, 폴리뉴클레오타이드 또는 핵산 서열은 (비교가 이루어진) 대응하는 핵산 서열로부터 미미한 서열 변이를 갖고, (비교가 이루어진) 대응하는 핵산 서열과 실질적으로 동일한 생물학적 기능을 보유하는 DNA 또는 RNA (핵산) 서열을 지칭한다. 예를 들어, 소정의 구현예에서, LOV 단백질을 암호화하는 유전자, 폴리뉴클레오타이드 또는 핵산 서열과 실질적인 서열 상동성을 포함하는 핵산 서열은 본원에 기재된 것처럼 암호화된 유전자 산물(LOV 단백질)을 확인함으로써 평가된다.

소정의 다른 구현예에서, LOV 단백질을 암호화하는 유전자, 폴리뉴클레오타이드 또는 핵산과 서열 상동성을 포함하는 유전자, 폴리뉴클레오타이드 또는 핵산 서열은 핵산 혼성화 방법을 이용하여 결정/확인된다. 예를 들어, 소정의 구현예에서, LOV 단백질을 암호화하는 유전자와 실질적인 서열 상동성을 포함하는 DNA/RNA 서열(예를 들어, 서열 번호 2)은 엄격한 조건 하에 본 발명의 특정 핵산 서열과 혼성화하는 이러한 DNA/RNA 서열의 능력에 의해 확인된다.

본원에 사용된 바와 같이, "엄격한 조건 하에 혼성화한다"는 혼성화 및 세척에 대한 조건을 기재하고자 하고, 이 조건 하에서 상당히 서로 동일하거나 상동성인 뉴클레오타이드 서열은 서로 혼성화된다. 이러한 엄격한 조건은 당업자에게 잘 알려져 있다(예를 들어, Ausubel 등의 1995 문헌; Sambrook 등의 1989 문헌 참조). 예를 들어, 소정의 구현예에서, 엄격한 혼성화 조건의 비제한적인 예는 약 65-70℃에서의 4X 염화나트륨/시트르산나트륨(SSC) 중의 혼성화(또는 약 42-50℃에서의 4×SSC와 50% 포름알데하이드 중의 혼성화), 이어서 약 65-70℃에서의 1×SSC 중의 1회 이상의 세척을 포함한다. 마찬가지로, 고도로 엄격한 혼성화 조건의 비제한적인 예는 약 65-70℃에서의 1×SSC 중의 혼성화(또는 약 42-50℃에서의 4×SSC와 50% 포름알데하이드 중의 혼성화), 이어서 약 65-70℃에서의 0.3×SSC 중의 1회 이상의 세척을 포함한다. 따라서, 고도로 엄격한 혼성화는 약 50-60℃에서의 4×SSC 중의 혼성화(또는 대안적으로 약 40-45℃에서의 6×SSC와 50% 포름알데하이드 중의 혼성화), 이어서 약 50-60℃에서의 2×SSC 중의 1회 이상의 세척을 포함한다. 예를 들어, 65-70℃ 또는 42-50℃에서 상기 언급된 값에 중간인 범위는 또한 본 발명에 의해 포함되는 것으로 의도된다. 소정의 구현예에서, SSPE(1xSSPE는 0.15 M NaCl, 10 mM NaH2PO4 및 1.25 mM EDTA, pH 7.4임)는 혼성화 및 세척 완충액에서 SSC(1xSSPE는 0.15 M NaCl 및 15 mM 시트르산나트륨임)를 대신할 수 있고, 세척은 혼성화가 완료된 후 각각 15분 동안 수행된다. 50개 미만의 염기 쌍 길이에 기대되는 하이브리드에 대한 혼성화 온도는 하이브리드의 융점(T_m)보다 5 내지 10℃ 낮아야 하고, 여기서 T_m은 하기 식에 따라 결정된다. 18개 미만의 염기 쌍 길이의 하이브리드에 대해, T_m(℃) = 2(A+T 염기의 수) + 4(G+C 염기의 수). 18개 내지 49개의 염기 쌍 길이의 하이브리드에 대해, T_m(℃) = 81.5 + 16.6(log10[Na+]) + 0.41(% G+C) - (600/N)이고, 여기서 N은 하이브리드에서의 염기의 수이고, [Na+]는 혼성화 완충액 중의 나트륨 이온의 농도(1xSSC에 대한 [Na+] = 0.165 M)이다. 숙련된 실행자는 비제한적인 예로서 차단제(예를 들어, BSA 또는 연어 또는 청어 정자 운반 DNA), 세제(예를 들어, SDS), 킬레이트화제(예를 들어, EDTA), Ficoll, PVP 등을 포함하는 추가의 시약이 니트로셀룰로스 또는 나일론 막과 같은 막에 대한 핵산 분자의 비특이적 혼성화를 감소시키기 위해 혼성화 및/또는 세척 완충액에 첨가될 수 있다는 것을 또한 인식할 것이다. 특히 나일론 막을 사용할 때, 엄격한 혼성화 조건의 추가의 비제한적인 예는 약 65℃에서의 0.25 내지 0.5 M NaH2PO4, 7% SDS에서의 혼성화, 이어서 약 65℃에서의 0.02 M NaH2PO4, 1% SDS 또는 대안적으로 0.2ХSSC, 1% SDS에서의 1회 이상의 세척을 포함한다(예를 들어, Church 및 Gilbert 등의 1984 문헌 참조).

따라서, 일반적으로 상기 기재된 것처럼, 본 발명의 소정의 구현예는 LOV 단백질을 암호화하는 유전자의 유전자 변형을 포함하는 사상성 진균 세포의 변이체 균주에 관한 것이다. 본원에 사용된 바와 같이, 용어 "변형" 및 "유전자 변형"은 상호교환적으로 사용되며, (a) 유전자에서의 하나 이상의 뉴클레오타이드의 도입, 치환 또는 제거, 또는 유전자의 전사 또는 번역에 필요한 조절 요소에서의 하나 이상의 뉴클레오타이드의 도입, 치환 또는 제거, (b) 유전자 파괴, (c) 유전자 전환, (d) 유전자 결실, (e) 유전자(예를 들어, 안티센스 RNA, siRNA, miRNA 등)의 하향조절, (f) 특이적 돌연변이유발(비제한적인 예로서 CRISPR/Cas9 기반 돌연변이유발 포함) 및/또는 (g) 본원에 개시된 임의의 하나 이상의 유전자의 랜덤 돌연변이유발을 포함하지만, 이들로 제한되지는 않는다.

본원에 사용된 바와 같이, 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 본원에 개시된 LOV 단백질을 암호화하는 유전자의 유전자 변형을 포함하지만, 이것으로 제한되지는 않는다. 따라서, 하기 더 자세히 추가로 기재된 것처럼, 다양한 분자 생물학적 방법은 잘 알려져 있고, 사상성 진균 세포의 이러한 변이체 균주를 생성/작제하기 위해 당업자에게 이용 가능하다.

본원에 사용된 바와 같이, "단백질을 암호화하는 유전자에서의 하나 이상의 뉴클레오타이드의 도입, 치환 또는 제거"에서, 이러한 유전자 변형은 유전자의 암호화 서열(즉, 엑손) 및 비암호화 개재(인트론) 서열을 포함한다.

본원에 사용된 바와 같이, "유전자의 파괴", "유전자 파괴", "유전자의 불활성화" 및 "유전자 불활성화"는 상호교환적으로 사용되며, 표적 유전자를 실질적으로 파괴/불활성화하는 임의의 유전자 변형을 광의적으로 지칭한다. 예시적인 유전자 파괴 방법은 폴리펩타이드 암호화 서열(CDS), 프로모터, 인핸서 또는 다른 조절 요소를 포함하는 유전자의 임의의 부분의 전체 또는 부분 결실, 또는 이들의 돌연변이유발을 포함하지만, 이들로 제한되지는 않고, 여기서 돌연변이유발은 표적 유전자(들)를 파괴/불활성화하고 기능적 유전자 산물의 발현/생산을 실질적으로 감소시키거나 방지하는 치환, 삽입, 결실, 역전, 및 임의의 이들의 조합 및 변형을 포괄한다. 본 발명의 소정의 구현예에서, 이러한 유전자 파괴는 숙주 세포가 암호화된 lov 유전자 산물을 발현/생산하는 것을 방지한다.

소정의 구현예에서, LOV 단백질을 암호화하는 유전자, 폴리뉴클레오타이드 또는 핵산 서열은 확립된 유전자 편집 기법, 예컨대 CRISPR/Cas9 유전자 편집, 징크 핑거 뉴클레아제(ZFN: zinc-finger nuclease) 유전자 편집, 전사 활성자 유사 효과기 뉴클레아제 편집(TALEN: transcription activator-like effector nuclease editing), 호밍(mega) 뉴클레아제 편집 등을 사용하여 유전자 변형된다.

다른 구현예에서, 사상성 진균의 변이체 균주는 유전자 전환의 과정에 의해 작제된다(즉, 유전자 변형된다)(예를 들어, Iglesias 및 Trautner의 1983 문헌 참조).

다른 구현예에서, 본 발명의 자낭균류 세포에 의해 발현/생산된 관심 단백질(예를 들어, 내인성 POI 또는 비상동성 POI)은 비제한적인 예로서 단백질 이동/이동도(SDS-PAGE), 질량 분광법, HPLC, 크기 배제, 초원심분리 침강 속도 분석, 전사체학, 단백질체학, 형광 태그, 에피토프 태그, 형광 단백질(GFP, RFP 등) 키메라/하이브리드 등을 포함하는 단백질 정량화 방법, 유전자 전사 방법, mRNA 번역 방법 등에 의해 검출되거나 측정되거나 분석되거나 기타 등등이 된다.

본원에 사용된 바와 같이, 기능적으로 및/또는 구조적으로 유사한 단백질은 "관련 단백질"인 것으로 간주된다. 이러한 관련된 단백질은 상이한 속 및/또는 종의 유기체 또는 심지어 상이한 강의 유기체(예를 들어, 박테리아 및 진균)로부터 유래될 수 있다. 관련 단백질은 또한 1차 서열 분석에 의해 결정되거나, 2차 또는 3차 구조 분석에 의해 결정되거나, 면역학적 교차반응성에 의해 결정된 상동물 및/또는 오솔로그를 포괄한다.

본원에 사용된 바와 같이, 용어 "프로모터"는 암호화 서열 또는 기능적 RNA의 발현을 제어할 수 있는 핵산 서열을 지칭한다. 일반적으로, 암호화 서열은 프로모터 서열에 대해 3'(하류)에 위치한다. 프로모터는 자연적 유전자로부터 그 전체가 유래될 수 있거나, 자연에서 발견되는 상이한 프로모터로부터 유래되는 상이한 요소로 구성될 수 있거나, 심지어 합성 핵산 절편을 포함할 수 있다. 상이한 프로모터가 상이한 세포 유형에서의 유전자 또는 상이한 발달 단계에 있는 유전자의 발현을 지시하거나, 상이한 환경적 또는 생리적 조건에 반응하여 유전자의 발현을 지시할 수 있음을 당업자는 이해할 것이다. 대부분의 세포 유형에서 대부분의 시점에 유전자가 발현되도록 하는 프로모터는 일반적으로 "구성적 프로모터"로 지칭된다. 또한, 대부분의 경우 조절 서열의 정확한 경계가 완전히 정의되지 않았기 때문에, 상이한 길이의 DNA 단편이 동일한 프로모터 활성을 가질 수 있는 것으로 추가로 인식된다.

본원에 사용된 바와 같이, 용어 "작동 가능하게 연결된"은 하나의 기능이 다른 하나에 의해 영향을 받도록 단일 핵산 단편 상에서 핵산 서열들이 회합하는 것을 지칭한다. 예를 들어, 프로모터는 이것이 암호화 서열(예를 들어, ORF)의 발현에 영향을 줄 수 있을 때(즉, 그 암호화 서열은 프로모터의 전사 제어 하에 있음) 그 암호화 서열과 작동 가능하게 연결된다. 암호화 서열은 센스 배향 또는 안티센스 배향으로 조절 서열에 작동 가능하게 연결될 수 있다. 핵산이 다른 핵산 서열과 기능적 관계에 있도록 위치할 때 이 핵산은 "작동 가능하게 연결"된다. 예를 들어, 분비 리더(즉, 신호 펩타이드)를 암호화하는 DNA가 폴리펩타이드의 분비에 참여하는 전단백질(pre-protein)로서 발현되는 경우 이것이 폴리펩타이드용 DNA에 작동 가능하게 연결되거나; 프로모터 또는 인핸서가 서열의 전사에 영향을 미칠 경우 이들이 암호화 서열에 작동 가능하게 연결되거나; 리보솜 결합 부위가 번역을 촉진하도록 위치하는 경우 이것이 암호화 서열에 작동 가능하게 연결된다. 일반적으로 "작동 가능하게 연결된"은 연결되는 DNA 서열들이 인접해 있음을 의미하고, 분비 리더의 경우에는 인접해 있고 판독 단계에 있음을 의미한다. 그러나, 인핸서는 인접해 있을 필요는 없다. 연결은 편리한 제한 부위에서의 결찰에 의해 달성된다. 이러한 부위가 존재하지 않는 경우, 합성 올리고뉴클레오타이드 어댑터 또는 링커가 통상적인 관례에 따라 사용된다.

본원에 정의된 바와 같이, "적합한 조절 서열"은 암호화 서열의 상류(5' 비암호화 서열)에, 암호화 서열 내에 또는 하류(3' 비암호화 서열)에 위치하고, 회합된 암호화 서열의 전사, RNA 가공 또는 안정성, 또는 번역에 영향을 미치는 뉴클레오타이드 서열을 지칭한다. 조절 서열은 프로모터, 번역 리더 서열, RNA 가공 부위, 효과기 결합 부위 및 스템-루프 구조를 포함할 수 있다.

본원에 정의된 바와 같이, 적어도 하나의 폴리뉴클레오타이드 오픈 리딩 프레임(ORF: open reading frame), 또는 이의 유전자 또는 이의 벡터를 "진균 세포 내로 도입하는"과 같은 어구에서 사용될 때 용어 "도입하는"은 비제한적인 예로서 원형질체 융합, 천연 또는 인공 형질전환(예를 들어, 염화칼슘, 전기천공), 형질도입, 형질주입 등을 포함하는 세포로 폴리뉴클레오타이드를 도입하기 위해 당해 분야에 알려진 방법을 포함한다.

본원에 사용된 바와 같이, "형질전환된" 또는 "형질전환"은 세포가 재조합 DNA 기법을 사용하여 형질전환된다는 것을 의미한다. 형질전환은 전형적으로 하나 이상의 뉴클레오타이드 서열(예를 들어, 폴리뉴클레오타이드, ORF 또는 유전자)을 세포로 삽입함으로써 일어난다. 삽입된 뉴클레오타이드 서열은 이종성 뉴클레오타이드 서열(즉, 형질전환되는 세포에 자연 발생하지 않는 서열)일 수 있다.

본원에 사용된 바와 같이, "형질전환"은 DNA가 염색체 통합체 또는 자가 복제성 염색체외 벡터로서 유지되도록 숙주 세포로 외인성 DNA를 도입하는 것을 지칭한다. 본원에 사용된 바와 같이, "형질전환 DNA", "형질전환 서열" 및 "DNA 작제물"은 숙주 세포로 서열을 도입하는 데 사용된 DNA를 지칭한다. DNA는 PCR 또는 임의의 다른 적합한 기법에 의해 시험관내 생성될 수 있다. 일부 구현예에서, 형질전환 DNA는 유입 서열을 포함하는 반면, 다른 구현예에서는 상동성 박스가 측접된 유입 서열을 추가로 포함한다. 더 추가의 구현예에서, 형질전환 DNA는 말단에 추가된 다른 비상동성 서열(즉, 스터퍼 서열 또는 플랭크)을 포함한다. 말단은 형질전환 DNA가 예를 들어 벡터로의 삽입과 같은 폐쇄된 원을 형성하도록 폐쇄될 수 있다.

본원에 사용된 바와 같이, "유입 서열"은 진균 세포 염색체로 도입된 DNA 서열을 지칭한다. 일부 구현예에서, 유입 서열은 DNA 작제물의 일부이다. 다른 구현예에서, 유입 서열은 하나 이상의 관심 단백질을 암호화한다. 일부 구현예에서, 유입 서열은 형질전환되는 세포의 게놈에 이미 존재하거나 존재하지 않을 수 있는 서열을 포함한다(즉, 상동성 서열이거나 이종성 서열일 수 있음). 일부 구현예에서, 유입 서열은 하나 이상의 관심 단백질, 유전자, 및/또는 돌연변이되었거나 변형된 유전자를 암호화한다. 대안적인 구현예에서, 유입 서열은 기능적 야생형 유전자 또는 오페론, 기능적 돌연변이체 유전자 또는 오페론, 또는 비기능적 유전자 또는 오페론을 암호화한다. 일부 구현예에서, 유입 서열은 유전자로 삽입되어 유전자의 기능을 파괴하는 비기능적 서열이다. 다른 구현예에서, 유입 서열은 선택적 마커를 포함한다. 추가의 구현예에서, 유입 서열은 2개의 상동성 박스를 포함한다.

본원에 사용된 바와 같이, "상동성 박스"는 진균 세포 염색체에서의 서열에 상동성인 핵산 서열을 지칭한다. 보다 구체적으로는, 상동성 박스는 본 발명에 따라 결실되거나, 파괴되거나, 비활성화되거나, 하향조절 등이 되는 유전자 또는 유전자의 일부의 바로 측접하는 암호화 영역과 약 80% 내지 100%의 서열 동일성, 약 90% 내지 100%의 서열 동일성, 또는 약 95% 내지 100%의 서열 동일성을 갖는 상류 또는 하류 영역이다. 이러한 서열은 진균 세포 염색체에서 DNA 작제물이 어디에서 통합되는지를 지시하고, 진균 세포 염색체의 어느 부분이 유입 서열에 의해 대체되는지를 지시한다. 본 발명을 한정하고자 하는 것은 아니지만, 상동성 박스는 약 1개 염기쌍(bp) 내지 200개 킬로염기(kb)를 포함할 수 있다. 바람직하게는, 상동성 박스는 약 1 bp 내지 10.0 kb; 1 bp 내지 5.0 kb; 1 bp 내지 2.5 kb; 1 bp 내지 1.0 kb, 및 0.25 kb 내지 2.5 kb를 포함한다. 상동성 박스는 또한 약 10.0 kb, 5.0 kb, 2.5 kb, 2.0 kb, 1.5 kb, 1.0 kb, 0.5 kb, 0.25 kb 및 0.1 kb를 포함할 수 있다. 일부 구현예에서, 선택적 마커의 5’ 및 3’ 말단은 상동성 박스에 의해 측접되고, 상동성 박스는 유전자의 암호화 영역을 바로 측접시키는 핵산 서열을 포함한다.

본원에 사용된 바와 같이, 용어 "선별 마커-암호화 뉴클레오타이드 서열"은 숙주 세포에서 발현할 수 있고 선별 마커의 발현이 발현된 유전자를 함유하는 세포에 상응하는 선택 제제의 존재 또는 필수 영양소의 부재 하에 성장하는 능력을 부여하는 뉴클레오타이드 서열을 지칭한다.

본원에 사용된 바와 같이, 용어 "선별 마커" 및 "선택적 마커"는 벡터를 함유하는 숙주의 선택을 용이하게 하는 이 숙주 세포에서 발현할 수 있는 핵산(예를 들어, 유전자)을 지칭한다. 이러한 선별 마커의 예는 항균제를 포함하지만, 이들로 제한되지는 않는다. 따라서, 용어 "선별 마커"는 숙주 세포가 관심 유입 DNA를 흡수했거나 일부 다른 반응이 일어났다는 표시를 제공하는 유전자를 지칭한다. 전형적으로, 선별 마커는 외인성 DNA를 함유하는 세포가 형질전환 동안 어떠한 외인성 서열도 받지 않은 세포와 구별되게 하기 위해 숙주 세포에 항균 내성 또는 대사 이점을 부여하는 유전자이다.

본원에 정의된 바와 같이, 숙주 세포 "게놈", 진균 세포 "게놈" 또는 사상성 진균 세포 "게놈"은 염색체 유전자 및 염색체외 유전자를 포함한다.

본원에 사용된 바와 같이, 용어 "플라스미드", "벡터" 및 "카세트"는 염색체외 요소를 지칭하며, 이는 대개 전형적으로 세포의 중심 대사의 일부가 아니고 보통 원형 이중 가닥 DNA 분자의 형태인 유전자를 운반한다. 이러한 요소는 임의의 공급원으로부터 유래되는 단일 가닥 또는 이중 가닥 DNA 또는 RNA의, 선형 또는 원형인, 자율 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오타이드 서열일 수 있으며, 여기서 다수의 뉴클레오타이드 서열은 선택된 유전자 산물에 대한 DNA 서열 및 프로모터 단편을 적절한 3' 비번역 서열과 함께 세포로 도입할 수 있는 독특한 작제물로 연결되거나 재조합된다.

본원에 사용된 바와 같이, 용어 "벡터"는 세포에서 복제(증식)될 수 있고, 새로운 유전자 또는 DNA 분절(예를 들어, "유입 서열")을 세포로 운반할 수 있는 임의의 핵산을 지칭한다. 따라서, 이 용어는 상이한 숙주 세포들 간의 전달을 위해 설계된 핵산 작제물을 지칭한다. 벡터는 바이러스, 박테리오파지, 프로-바이러스, 플라스미드, 파지미드, 트랜스포존 및 인공 염색체, 예컨대 YAC(효모 인공 염색체), BAC(박테리아 인공 염색체), PLAC(식물 인공 염색체) 등을 포함하는데, 이들은 "에피좀"(즉, 자율 복제)이거나 숙주 세포의 염색체로 통합될 수 있다.

본원에 사용된 바와 같이, "형질전환 카세트"는 유전자(또는 이의 ORF)를 포함하고 유전자 이외에 특정 숙주 세포의 형질전환을 용이하게 하는 요소를 갖는 특이적 벡터를 지칭한다.

"발현 벡터"는 세포에서 이종성 DNA를 혼입하고 발현시키는 능력을 갖는 벡터를 지칭한다. 많은 원핵 및 진핵 발현 벡터가 상업적으로 이용 가능하고 당업자에게 알려져 있다. 적절한 발현 벡터의 선택은 당업자의 지식 내에 있다.

본원에 사용된 바와 같이, 용어 "발현 카세트" 및 "발현 벡터"는 표적 세포에서 특정 핵산의 전사를 허용하는 일련의 명시된 핵산 요소를 사용하여 재조합으로 또는 합성에 의해 생성된 핵산 작제물을 지칭한다(즉, 이들은 상기에 기술된 바와 같은 벡터 또는 벡터 요소임). 재조합 발현 카세트는 플라스미드, 염색체, 미토콘드리아 DNA, 색소체 DNA, 바이러스 또는 핵산 단편으로 혼입될 수 있다. 전형적으로, 발현 벡터의 재조합 발현 카세트 부분은 다른 서열 중에서도 전사될 핵산 서열 및 프로모터를 포함한다. 일부 구현예에서, DNA 작제물은 또한 표적 세포에서 특정 핵산의 전사를 허용하는 일련의 명시된 핵산 요소를 포함한다. 소정의 구현예에서, 본 발명의 DNA 작제물은 본원에 정의된 바와 같은 선택적 마커 및 비활성화 염색체 또는 유전자 또는 DNA 절편을 포함한다.

본원에 사용된 바와 같이, "표적화 벡터"는 표적화 벡터가 형질전환되는 숙주 세포의 염색체 내 영역에 대해 상동성이고, 그 영역에서 상동성 재조합을 유도할 수 있는 폴리뉴클레오타이드 서열을 포함하는 벡터이다. 예를 들어, 표적화 벡터는 상동성 재조합을 통해 숙주 세포의 염색체로 유전자 변형을 도입하는 데 사용된다. 일부 구현예에서, 표적화 벡터는 예를 들어 말단에 부가된 다른 비상동성 서열(즉, 스터퍼 서열 또는 측접 서열)을 포함한다. 그 말단은 표적화 벡터가 예를 들어 벡터 내로의 삽입과 같이 폐쇄된 원을 형성하도록 폐쇄될 수 있다.

본원에 사용된 바와 같이, "향상된 단백질 생산성 표현형"을 포함하는 변이체 세포(또는 균주)는 향상된/증가된 부피측정 생산성을 포함하는 변이체 세포(또는 균주), 향상된/증가된 탄소 전환 효율을 포함하는 변이체 세포(또는 균주), 향상된/증가된 단백질 수율을 포함하는 변이체 세포(또는 균주), 향상된/증가된 단백질 비생산성을 포함하는 변이체 세포(또는 균주) 등을 포함하지만, 이들로 제한되지는 않는다. 예를 들어, 소정의 구현예에서, 향상된 단백질 생산성 표현형을 포함하는 변이체 세포 또는 균주는 (모 균주에 비해) 공급 당의 g당 적어도 0.1% 이상의 총 단백질(g)을 발현/생산하고, 여기서 공급 당은 제조 단계(즉, 공급-시작 후) 동안 발효기에 첨가된 당의 질량의 면에서 표현될 수 있다.

본원에 정의된 바와 같이, 어구 "향상된 단백질 생산성 표현형" 및 "증가된 단백질 생산성 표현형"은 상호교환적으로 사용될 수 있다.

본원에 사용된 바와 같이, 변형된 (변이체/딸)에 대하여 비변형된 (모) 세포에서 "향상된/증가된 단백질 생산성 표현형"을 기술할 때, "모" 세포 및 "변이체" 세포가 동일한 조건(예를 들어, 배지, 온도, pH 등과 같은 동일한 조건) 하에 성장/배양/발효되는 것으로 이해될 것이다. 유사하게, 변형된 (변이체/딸) 세포에서의 동일한 POI의 "발현/제조"에 대하여 비변형된 (모) 세포에서의 관심 단백질(POI)의 "발현/제조"를 기재할 때, "모" 세포 및 "변이체" 세포가 본질적으로 동일한 조건(예를 들어, 배지, 온도, pH 등과 같은 동일한 조건) 하에 성장/배양/발효된다고 이해될 것이다.

본원에 사용된 바와 같이, "호기성 발효"는 산소의 존재 하에서의 성장을 지칭한다.

본원에 사용된 바와 같이, 용어 "브로스", "세포 브로스", "발효 브로스" 및/또는 "배양 브로스"는 상호교환적으로 사용되고, 총체적으로 액체 (액침) 배양에서 (i) 발효 (배양) 배지 및 (ii) 세포를 지칭한다.

본원에 사용된 바와 같이, 용어 "세포량(cell mass)"은 액체(액침) 배양물에 존재하는 세포 성분(온전한 세포와 용해된 세포를 포함)을 지칭한다. 세포량은 건조 세포 중량(DCW) 또는 습윤 세포 중량 (WCW)으로 표현될 수 있다.

본원에 사용된 바와 같이, 사상성 진균 세포의 "점도 감소" 균주는 모 균주에 의해 생산된 동등한 세포 브로스와 비교하여 점도가 감소한(즉, 전단 스트레스 또는 인장 스트레스에 대한 저항이 감소한) 세포 브로스를 생성하는 변형된 (딸) 균주를 지칭한다. 예를 들어, 동등한 세포 브로스는 필적하는 세포량을 갖는다. 점도 감소 사상성 진균 균주를 작제하는 방법 및 이의 점도를 비교하는 방법은 국제 PCT 공보 WO2012/027580호, WO2012/145596호, WO2012/145596호 및 WO2012/145592호 및 국제 PCT 출원 PCT/US2019/27590호에 자세히 기재되어 있다(각각 구체적으로 본원에 그 전체가 참고로 포함됨).

따라서, 소정의 구현예에서, 본 발명의 변이체 균주(예를 들어, 향상된/증가된 단백질 생산성 표현형을 포함하는 대립유전자 lov(T813K)를 암호화하는 유전자 변형을 포함하는 변이체 균주)에서, 변이체 균주는 MPG1, SFB3, SEB1, CRZ1, GAS1, TPS2 및/또는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 추가로 포함한다.

본원에 사용된 바와 같이, 트리쵸데르마 종 "MPG1 단백질"은 (본원에 그 전체가 참고로 포함된 국제 PCT 공보 WO2012/145584호에 기재된) 서열 번호 5의 아미노산 서열을 포함한다.

본원에 사용된 바와 같이, 트리쵸데르마 종 "SEB1 단백질"은 (본원에 그 전체가 참고로 포함된 국제 PCT 공보 WO2012/145595호에 기재된) 서열 번호 6의 아미노산 서열을 포함한다.

본원에 사용된 바와 같이, 트리쵸데르마 종 "SFB3 단백질"은 (본원에 그 전체가 참고로 포함된 국제 PCT 공보 WO2012/027580호에 기재된) 서열 번호 7의 아미노산 서열을 포함한다.

본원에 사용된 바와 같이, 트리쵸데르마 종 "CRZ1 단백질"은 (본원에 그 전체가 참고로 포함된 국제 PCT 공보 WO2012/145596호에 기재된) 서열 번호 8의 아미노산 서열을 포함한다.

본원에 사용된 바와 같이, 트리쵸데르마 종 "GAS1 단백질"은 (본원에 그 전체가 참고로 포함된 국제 PCT 공보 WO2012/145596호 및 WO2012/145592호에 기재된) 서열 번호 9의 아미노산 서열을 포함한다.

본원에 사용된 바와 같이, 트리쵸데르마 종 "TSP2 단백질"은 (본원에 그 전체가 참고로 포함된 국제 PCT 공보 WO2012/145598호에 기재된) 서열 번호 10의 아미노산 서열을 포함한다.

본원에 사용된 바와 같이, 야생형 "ssb7 유전자"는 2019년 4월 16일에 출원된 국제 PCT 출원 PCT/US2019/27590호에 기재된 자연적 "SSB7 단백질"을 암호화한다. 예를 들어, 야생형 T. 레세이 "ssb7 유전자"(서열 번호 20)는 서열 번호 21의 자연적 "SSB7 단백질"을 암호화한다.

본원에 사용된 바와 같이, "대립유전자 ssb7(fs)"(서열 번호 22)는 국제 PCT 출원 PCT/US2019/27590호(본원에 그 전체가 참고로 구체적으로 포함됨)에 기재된 바와 같은 서열 번호　23의 변이체 SSB7 단백질을 암호화한다.

II. 향상된 단백질 생산성 표현형을 포함하는 사상성 진균 균주

일반적으로 상기 기재되고, 하기 실시예 부문에 추가로 기재된 것처럼, 본 발명의 소정의 구현예는 모 균주로부터 유래된 사상성 진균의 돌연변이체 및 유전자 변형된 (변이체) 균주에 관한 것이다. 보다 구체적으로는, 소정의 구현예는 사상성 진균의 돌연변이체 및 유전자 변형된 (변이체) 균주(및 이의 방법)에 관한 것이고, 여기서 이러한 균주는 향상된 단백질 생산성 표현형, 예컨대 개선된 부피측정 효율, 더 높은 비생산성, 탄소원에 대한 개선된 수율, 감소된 생물반응기(발효기) 작동 비용 및 기타를 포함한다.

보다 구체적으로는, 하기 실시예 1에 더 기재된 것처럼, 돌연변이체(딸) 트리초데르마 균주는 확인되고 단리되고 "B7ms1-SF12"라 명명되고, (돌연변이체) 균주는 이것이 유래된 모 균주(B7ms1)에 비해 발효기에서 공급 당에 대한 40% 더 높은 단백질 수율을 갖는다(예를 들어, 도 1 참조). 게놈 서열 분석 및 유전적 분석은 B7ms1-SF12 (돌연변이체) 균주의 관찰된 (증가된 생산성) 표현형의 원인인 것으로서 내부의 유전자(또는 유전자들)에서의 하나 이상의 돌연변이(들)를 확인하기 위해 돌연변이체 B7ms1-SF12 균주에서 후속적으로 수행되었다. 보다 구체적으로는, 확인된 돌연변이는 서열 번호 2의 (자연적) LOV 단백질의 암호화 서열을 변경하도록 결정되었고, 여기서 (자연적) LOV 단백질(서열 번호 2)의 아미노산 (잔기) 813번 위치에서의 고도로 보존된 트레오닌(T)(T813)은 서열 번호 4의 (변이체) LOV 단백질의 813번 위치에서의 리신(813K)으로 변형(치환)(즉, T813K 치환; 예를 들어, 도 2 참조)되었다.

과학 문헌 및 관련 분야의 검토는 LOV 단백질(서열 번호 2) 및/또는 관련된 LOV 단백질 오솔로그(예를 들어, 서열 번호 11-17)의 기능적 규명이 임의의 유기체에 대해 문헌에 기재되어 있지 않는다는 것을 나타낸다. 그러나, 일반적으로 본 발명의 실시예 1에 기재된 것처럼, 보존된 도메인 분석(NCBI)은 글리코실 전환효소 패밀리 그룹 2(pfam13632, 3.25x10-44의 E-값, 예를 들어, 도 2에서 "글리코 트랜스 2 3" 참조)와 멀리 관련된 (보존된) 영역을 확인하였다. 예를 들어, 원핵생물 단백질의 이 (글리코실 전환효소) 패밀리의 구성원은 박테리아 캡슐 생합성(PFAM)에 관여된 추정상 글루코실전환효소를 포함한다. 보다 구체적으로는, 트리초데르마 PID 79396에 대한 오솔로그(즉, LOV가 아님, PID 50212)인 (글리코실 전환효소) 패밀리 그룹 2 도메인, "ZtGT2"를 갖는 진균 단백질은 고체 표면에서의 균사 성장에 중요하다(King et al., 2017).

보다 놀랍게도, LOV 단백질은 담자균류(Basidiomycete) 및 자낭균류(Ascomycete) 문의 사상성 진균 중에 널리 보존된다. 예를 들어, (자연적) LOV 단백질의 813번 위치에서의 트레오닌(T)(즉, 리신(K)에 대한 돌연변이는 본원에 개시된 바와 같이 유리함)은 트리초데르마 및 가장 산업적으로 관련된 사상성 진균이 속하는 주발버섯 아문 내에 NCBI 비중복 데이터베이스의 상부 BLASTp 검색 결과 중에서 고도로 보존된다(691/691; 100%). 예를 들어, 이 691개의 주발버섯 동족체의 Geneious 다중 서열 정렬(www.geneious.com, Geneious 11.0, Biomatters Ltd.)로부터의 그래프 표시는 도 2에 제시된다. 마찬가지로, 상부 1,000 BLASTp 히트 중에서, 아미노산 잔기 813번 위치는 MUSCLE 다중 서열 정렬(Geneious 소프트웨어 패키지)에서 975/1000(97.5%) 히트(즉, 잔기 T813)에서 확인되었고, 여기서 잔기 813번 위치는 결코 리신(K)으로서 생기지 않는다(즉, 향상된 단백질 생산성을 생성시키는 본원에 기재된 치환은 BLASTp에 의해 확인된 상부 1000 오솔로그에서 발견되지 않았다).

따라서, lov(T813K) 대립유전자가 관찰된 향상된 단백질 생산성 표현형의 원인이라는 것을 추가로 검증하기 위해, lov(T813K) 돌연변이는 "T4"로 명명된 상이한 T. 레세이 균주 계통(예를 들어, 표 1 참조)으로 도입되고, 여기서 B7ms1 및 T4 모 계통은 둘 다 트리초데르마 균주 RL-P37의 상이한 균주 개선 프로그램으로부터 돌연변이된 유도체이다(Sheir-Neiss et al., 1984; Montenecourt, 1987). 예를 들어, T4 균주는 특히 T4 균주가 셀룰라아제의 이의 (내인성) 자연적 칵테일을 발현하고 총 단백질 생산을 증가시키는 nik1(M743T) 돌연변이를 포함한다는 점에서 B7ms1 균주와 다르다(예를 들어, 국제 PCT 공보. WO2016/130523호 참조). 마찬가지로, 실시예 1에 기재된 B7ms1 계통의 관찰된 결과와 유사하게, lov(T813K) 대립유전자를 포함하는 T4 계통(균주)(예를 들어, 실시예 2 및 실시예 4 참조)은 야생형 lov(+) 대립유전자를 포함하는 달리 동질유전자 균주에 비해 공급 당에 대한 평균적으로 34% 더 높은 총 단백질 수율을 갖는다.

부가적으로, 진균 균주 단백질 생산성 표현형의 개선에 대해 lov(T813K) 대립유전자의 이용성을 추가로 입증하기 위해, 출원인은 3개의 다른 편리한 게놈 위치(즉, 부위 A-C라 명명; 실시예 4, 표 1 및 표 2 또한 참조)에서 pyr2 마커를 통합하였다. 예를 들어, 이 상이한 균주에 의한 단백질 생산은 진탕 플라스크에서 평가되었고, 여기서 모든 이러한 경우에 lov(T813K) 돌연변이의 존재는 야생형 lov(+) 대립유전자를 포함하는 달리 동질유전자 (모) 균주에 비해 총 단백질 생산을 개선하였다.

III. 분자 생물학

일반적으로 상기 기재된 바대로, 본 발명의 소정의 구현예는 모 균주로부터 유래된 사상성 진균의 돌연변이체 및 유전자 변형된 (변이체) 균주에 관한 것이다. 보다 구체적으로는, 소정의 구현예는 사상성 진균의 돌연변이체 및 유전자 변형된 (변이체) 균주(및 이의 방법)에 관한 것이고, 여기서 이러한 균주는 향상된 단백질 생산성 표현형, 예컨대 개선된 부피측정 효율, 더 높은 비생산성, 탄소원에 대한 개선된 수율, 감소된 생물반응기(발효기) 작동 비용 및 기타를 포함한다.

따라서, 본 발명의 소정의 구현예는 모 트리초데르마 균주(예를 들어, 모 B7ms1)로부터 유래된 돌연변이체 (딸) 트리초데르마 균주(예를 들어, 돌연변이체 B7ms1-SF12)에 관한 것이고, 여기서 돌연변이체 (딸) 트리초데르마 균주는 서열 번호 4의 아미노산 잔기 813번 위치에 상응하는 아미노산 위치에서 리신(K) 잔기를 포함하는 변이체 LOV 단백질을 암호화하는 돌연변이체 lov 유전자를 포함한다.

본 발명의 소정의 다른 구현예는 따라서 본원에 기재된 모 균주로부터 유래된 사상성 진균의 유전자 변형된 균주(이하, "변이체" 균주)에 관한 것이다. 예를 들어, 소정의 구현예에서, 사상성 진균의 변이체 균주는 서열 번호 2에 상동성인 서열(즉, 자연적 LOV 단백질 서열)을 포함하는 변이체 LOV 단백질을 암호화하는 변형된 lov 유전자(또는 이의 변형된 폴리뉴클레오타이드 서열)를 포함하고, 서열 번호 4의 아미노산 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함한다.

따라서, 소정의 구현예에서, 본 발명의 변이체 균주는 서열 번호 2(또는 서열 번호 4)의 LOV 단백질과 적어도 약 50% 내지 약 100%의 서열 상동성을 포함하는 LOV 단백질을 암호화하고, 서열 번호 4의 아미노산 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 변형된 lov 유전자(또는 이의 변형된 폴리뉴클레오타이드 서열)를 포함한다. 소정의 구현예에서, 본 발명의 변이체 균주는 서열 번호 2(또는 서열 번호 4)의 LOV 단백질과 적어도 약 50% 내지 약 100%의 서열 상동성을 포함하는 LOV 단백질을 암호화하고, 서열 번호　4의 아미노산 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 변형된 lov 유전자(또는 이의 변형된 폴리뉴클레오타이드 서열)를 포함한다.

따라서, 다른 구현예에서, 본 발명의 변이체 균주는 서열 번호 2 또는 서열 번호 4와 적어도 50%의 서열 상동성 또는 동일성, 서열 번호 2 또는 서열 번호 4와 적어도 55%의 서열 상동성 또는 동일성, 서열 번호 2 또는 서열 번호 4와 적어도 60%의 서열 상동성 또는 동일성, 서열 번호 2 또는 서열 번호 4와 적어도 65%의 서열 상동성 또는 동일성, 서열 번호 2 또는 서열 번호 4와 적어도 70%의 서열 상동성 또는 동일성, 서열 번호 2 또는 서열 번호 4와 적어도 75%의 서열 상동성 또는 동일성, 서열 번호 2 또는 서열 번호 4와 적어도 80%의 서열 상동성 또는 동일성, 서열 번호 2 또는 서열 번호 4와 적어도 85%의 서열 상동성 또는 동일성, 서열 번호 2 또는 서열 번호 4와 적어도 90%의 서열 상동성 또는 동일성, 서열 번호 2 또는 서열 번호 4와 적어도 95%의 서열 상동성 또는 동일성, 또는 서열 번호 2 또는 서열 번호 4와 최대 및 약 100%의 서열 상동성 또는 동일성을 포함하는 LOV 단백질을 암호화하고, 서열 번호　4의 아미노산 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 변형된 lov 유전자(또는 이의 변형된 폴리뉴클레오타이드 서열)를 포함한다.

따라서, 소정의 구현예에서, 사상성 진균의 변이체 균주는 대립유전자 lov(T813K)를 균주로 도입하는 적어도 유전자 변형을 포함한다. 예를 들어, 소정의 구현예에서, 사상성 진균의 변이체 균주는 비제한적인 예로서 (a) 유전자(또는 ORF또는 폴리뉴클레오타이드)에서의 하나 이상의 뉴클레오티드의 도입, 치환, 또는 제거, 또는 유전자의 전사 또는 번역에 필요한 조절 요소에서의 하나 이상의 뉴클레오티드의 도입, 치환, 또는 제거, (b) 유전자 손상, (c) 유전자 전환, (d) 유전자 결실, (e) 유전자 하향조절, (f) 특이적 돌연변이화 및/또는 (g) 랜덤 돌연변이화를 포함하는 유전자 변형을 포함할 수 있다. 다른 구현예에서, 대립유전자 lov(T813K)를 포함하는 사상성 진균의 변이체 균주는 본원에 기재된 바와 같은 NIK1 단백질, SSB7 단백질, MPG1 단백질, SFB3 단백질, SEB1 단백질, CRZ1 단백질, TSP2 단백질 및/또는 GAS1 단백질을 암호화하는 유전자의 하나 이상의 유전자 변형을 추가로 포함한다.

따라서, 소정의 구현예에서, 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 주어진 유전자 산물(예를 들어, LOV(+), NIK1, SSB7, MPG1 SFB3, SEB1, CRZ1, TSP2, GAS1, 내인성(배경) 프로테아제, 셀룰라아제 및 기타)의 발현/생산을 제거하도록 유전자 결실에 의해 작제될 수 있다. 다른 구현예에서, 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 주어진 유전자 산물의 발현/생산을 제거(또는 감소)시키도록 부분 유전자 결실에 의해 작제될 수 있다. 예를 들어, 소정의 구현예에서, 변형된 사상성 진균 균주는 유전자의 부분 결실을 포함할 수 있고, 여기서 부분 결실은 유전자의 암호화 서열의 임의의 부분의 부분 결실을 포함한다. 예를 들어, 소정의 구현예에서, 이러한 변이체 균주는 암호화된 단백질을 발현/생산하지 않거나, 이러한 변이체 균주는 (모 균주에 비해) 감소된 양의 암호화된 단백질을 발현/생산하고, 여기서 "감소된" 양의 암호화된 단백질은 본원에 기재된 바와 같이 측정되고 검출되고 평가되고 기타 등등이 될 수 있다.

따라서, 일반적으로 실시예 부문에 제시되고 기재된 것처럼, 당업자는 하기 유전자 변형(및 이 부문에 기재된 이의 분자 생물학적 방법)을 수행할 수 있고, 본 발명의 하나 이상의 아미노산 서열(서열 번호 2, 4, 11-19) 및/또는 핵산 서열(서열 번호 1 및 2)을 참조하여 이러한 이의 (변이체) 사상성 진균 균주를 작제할 수 있다.

예를 들어, 유전자 결실 기법은 유전자의 부분 또는 완전 제거가 가능하게 하여, 단백질의 발현/생산을 제거 또는 감소시키고/시키거나, 암호화된 단백질의 발현/생산을 제거 또는 감소시킨다. 이러한 방법에서, 유전자의 결실은 유전자와 측접하는 5' 및 3' 영역을 인접하여 함유하도록 작제된 통합 플라스미드/벡터를 사용하여 상동성 재조합에 의해 달성될 수 있다. 인접한 5' 및 3' 영역은, 플라스미드가 세포에서 통합되게 하도록, 예를 들어 선별 마커와 공동으로 통합성 플라스미드/벡터 상의 사상성 진균 세포로 도입될 수 있다.

다른 구현예에서, 사상성 진균의 변이체 균주는 본 발명의 단백질을 암호화하는 유전자를 파괴하거나 탈활성화하는 유전자 변형을 포함한다. 예시적인 유전자 파괴/불활성화 방법은 폴리펩타이드 암호화 서열(CDS), 프로모터, 인핸서 또는 다른 조절 요소를 포함하는 유전자의 임의의 부분을 파괴하는 것을 포함하는데, 파괴는 치환, 삽입, 결실, 역위, 및 이들의 조합 및 이들의 변형을 포함한다. 따라서, 소정의 구현예에서, 사상성 진균의 변이체 균주는 유전자 파괴 기법에 의해 작제된다. 유전자 파괴 기법의 비제한적인 예는 유전자에 상동성인 핵산 단편을 함유하는 통합성 플라스미드를 본 발명의 하나 이상의 유전자로 삽입(통합)하는 것을 포함하고, 이는 상동성 영역의 중복을 생성하고 중복된 영역들 간에 (인서트) 벡터 DNA를 혼입할 것이다.

따라서, 특정 다른 비제한적인 예에서, 유전자 파괴 기법은 유전자에 상동성인 핵산 단편을 함유하는 통합성 플라스미드를 유전자로 삽입하는 것을 포함하고, 이는 상동성 영역의 중복을 생성하고 중복된 영역들 간에 (인서트) 벡터 DNA를 혼입할 것이고, 여기서 삽입된 벡터 DNA는 예를 들어 단백질 암호화 영역으로부터 유전자의 프로모터를 분리시키거나 유전자의 암호화 서열 또는 비암호화 서열을 중단(파괴)시킨다. 따라서, 파괴 작제물은 유전자에 상동성인 5' 및 3' 영역이 동반된 선별 마커 유전자(예를 들어, pyr2, 실시예 참조)일 수 있다. 선별 마커는 파괴된 유전자를 함유하는 형질전환체의 확인이 가능하게 한다. 따라서, 소정의 구현예에서, 유전자 파괴는 프로모터, 리보솜 결합 부위(RBS), 비번역 영역(UTR), 코돈 변화 등과 같은 유전자의 제어 요소의 변형을 포함한다.

다른 구현예에서, 사상성 진균의 변이체 균주는 유전자 또는 이의 전사 또는 번역에 필요한 조절 요소에서의 하나 이상의 뉴클레오타이드를 도입하거나 치환하거나 제거함으로써 작제된다(즉, 유전자 변형된다). 예를 들어, 뉴클레오타이드는 정지 코돈이 도입되거나, 시작 코돈이 제거되거나, 오픈 리딩 프레임(ORF)이 프레임 시프트되도록 삽입되거나 제거될 수 있다. 이러한 변형은 당업계에 알려진 방법에 따라 부위 지정 돌연변이유발 또는 PCR에 의해 생성된 돌연변이유발에 의해 달성될 수 있다(예를 들어, Botstein 및 Shortle의 1985 문헌; Lo 등의 1985 문헌; Higuchi 등의 1988 문헌; Shimada의 1996 문헌; Ho 등의 1989 문헌; Horton 등의 1989 문헌 및 Sarkar 및 Sommer의 1990 문헌 참조). 마찬가지로, 본원에 기재된 T813K 치환을 포함하는 대립유전자 lov(T813K)는 대립유전자 lov의 813번 위치 리신을 암호화하는 뉴클레오타이드에 대한 야생형 lov(+) 유전자의 813번 위치 트레오닌을 암호화하는 뉴클레오타이드를 치환(T813K)하여 작제될 수 있다.

다른 실시형태에서, 사상성 진균의 변이체 균주는 유전자 변환의 과정에 의해 작제된다(즉, 유전자 변형된다)(예를 들어, Iglesias 및 Trautner의 1983 문헌 참조). 예를 들어, 유전자 변환 방법에서, 표적 유전자에 대응하는 핵산 서열은 결함 핵산 서열을 생산하도록 시험관내 돌연변이되고, 이후 결함 유전자를 포함하는 변이체 세포를 생산하기 위해 모 세포로 형질전환된다. 상동성 재조합에 의해, 결함 핵산 서열은 내인성 유전자를 대체한다. 결함 유전자 또는 유전자 단편이 결함 유전자를 함유하는 형질전환체의 선택에 사용될 수 있는 마커도 암호화하는 것이 바람직할 수 있다. 예를 들어, 결함 유전자는 선별 마커와 연관되어 비복제 또는 온도 감수성 플라스미드 상에 도입될 수 있다. 플라스미드의 통합에 대한 선택은 플라스미드 복제를 허용하지 않는 조건 하에 마커에 대한 선택에 의해 실행된다. 유전자 대체로 이어지는 제2 재조합 사건에 대한 선택은 선별 마커의 손실 및 돌연변이된 유전자의 획득에 대한 콜로니 검사에 의해 실행된다(Perego의 1993 문헌).

다른 구현예에서, 사상성 진균의 변이체 균주는 유전자의 핵산 서열에 상보성인 뉴클레오티드 서열을 사용하는 확립된 안티센스 (유전자 침묵) 기법에 의해 작제된다(Parish 및 Stoker의 1997 문헌). 보다 구체적으로는, 사상성 진균 균주에 의한 유전자의 발현은 세포에서 전사되고 세포에서 생산된 mRNA에 혼성화할 수 있는 유전자의 핵산 서열에 상보성인 뉴클레오타이드 서열을 도입함으로써 감소(하향조절)되거나 제거될 수 있다. 따라서, 상보성 안티센스 뉴클레오타이드 서열이 mRNA에 혼성화되게 하는 조건 하에 번역된 단백질의 양은 감소되거나 제거된다. 이러한 안티센스 방법은 RNA 간섭(RNAi), 소간섭 RNA(siRNA), 마이크로RNA(miRNA), 안티센스 올리고뉴클레오타이드 등을 포함하지만, 이들로 제한되지는 않으며, 이들 모두는 당업자에게 잘 알려져 있다.

다른 구현예에서, 사상성 진균의 변이체 균주는 비제한적인 예로서 화학 돌연변이유발(예를 들어, Hopwood의 1970 문헌 참조) 및 전좌(예를 들어, Youngman 등의 1983 문헌 참조)를 포함하는 당해 분야에 잘 알려진 방법을 사용하여 랜덤 또는 특이적 돌연변이유발에 의해 작제된다(즉, 유전자 변형된다). 유전자 변형은, 모 세포에서 돌연변이를 유발시키고 유전자의 발현이 감소되거나 제거된 돌연변이체 세포를 스크리닝함으로써 수행될 수 있다. 예를 들어, 당업자는 점도 감소 표현형을 포함하는 사상성 진균 세포의 이러한 (돌연변이유도된) 변이체 균주를 확인하기 위해 본원과 실시예 부문에 기재된 스크리닝 방법을 용이하게 적응하고/하거나 변형시킬 수 있다.

특이적 또는 무작위적일 수 있는 돌연변이유발은 예를 들어 적합한 물리적 또는 화학적 돌연변이 유발제를 사용하거나, 적합한 올리고뉴클레오타이드를 사용하거나, DNA 서열이 PCR 생성된 돌연변이유발되게 함으로써 수행될 수 있다. 더욱이, 돌연변이유발은 이들 돌연변이유발 방법의 임의의 조합을 사용함으로써 수행될 수 있다. 본 목적에 적합한 물리적 또는 화학적 돌연변이 유발제의 예는 자외선(UV) 조사, 하이드록실아민, N-메틸-N'-니트로-N-니트로소구아니딘(MNNG), N-메틸-N'-니트로소구아니딘(NTG), O-메틸 히드록실아민, 아질산, 에틸 메탄 설포네이트(EMS), 아황산수소나트륨, 포름산 및 뉴클레오타이드 유사체를 포함한다. 이러한 유발제가 사용될 때, 돌연변이유발은 일반적으로 적절한 조건 하에 선택된 돌연변이 유발제의 존재 하에 돌연변이유발되는 모 세포를 배양하고, 유전자 발현 감소를 나타내거나 유전자를 발현하지 않는 돌연변이체 세포를 선택함으로써 수행된다.

예를 들어, 본원에 개시된 하나 이상의 유전자에서의 이러한 유전자 변형은 유전자의 프로모터의 효율을 감소시키거나, 인핸서의 효율을 감소시키거나, 유전자의 mRNA의 스플라이싱 또는 편집을 방해하거나, 유전자의 mRNA의 번역을 방해하거나, 전장 단백질의 번역을 방지하도록 유전자의 암호화 서열로 종결 코돈을 도입하거나, 덜 활성이거나 불활성인 단백질을 생산하도록 단백질의 암호화 서열을 변경하거나, 다른 핵 단백질 성분과의 단백질 상호작용을 감소시키거나, 덜 안정한 단백질을 생산하도록 단백질의 암호화 서열을 변경하거나, 파괴를 위해 단백질을 표적화하거나, 단백질이 (예를 들어, 글리코실화에 의해) 미스폴딩되거나 부정확하게 변형되게 하거나, 단백질의 세포 이동을 방해할 수 있다.

소정의 다른 구현예에서, 사상성 진균의 변이체 균주는 부위 특이적 유전자 편집 기법에 의해 작제된다(즉, 유전자 변형된다). 예를 들어, 소정의 구현예에서, 사상성 진균의 변이체 균주는 전사 활성자 유사 엔도뉴클레아제(TALEN), 징크 핑거 엔도뉴클레아제(ZFN), 호밍(mega) 엔도뉴클레아제 등을 사용하여 작제된다(즉, 유전자 변형된다). 보다 구체적으로는, 변형되는 유전자의 부분(예를 들어, 암호화 영역, 비암호화 영역, 리더 서열, 프로-펩타이드 서열, 신호 서열, 전사 종결자, 전사 활성자 또는 암호화 영역의 발현에 필요한 다른 조절 요소)은 ZFN 유전자 편집, TALEN 유전자 편집, 호밍(mega) 엔도뉴클레아제 등에 의해 유전자 변형되고, 변형 방법은 당업자에게 잘 알려져 있고 이용 가능하다.

따라서, 소정의 구현예에서, 사상성 진균의 변이체 균주는 CRISPR/Cas9 편집에 의해 작제된다(즉, 유전자 변형된다). 보다 구체적으로는, CRISPR/Cas9 시스템에 의한 진균 게놈 변형에 대한 조성물 및 방법이 기재되어 있고 당해 분야에 잘 알려져 있다(예를 들어, 국제 PCT 공보 WO2016/100571호, WO2016/100568호, WO2016/100272호, WO2016/100562호 등 참조). 예를 들어, 천연 LOV 단백질을 암호화하는 유전자는 엔도뉴클레아제를 DNA 상의 표적 서열로 동원하는 가이드 RNA(예를 들어, Cas9) 또는 가이드 DNA(예를 들어, NgAgo)에 결합함으로써, 표적 DNA를 찾는, 핵산 가이드된 엔도뉴클레아제에 의해 유전자 변형될 수 있고, 여기서 엔도뉴클레아제는 DNA에서 단일쇄 또는 이중쇄 절단을 생성할 수 있다. 이러한 표적화된 DNA 절단은 DNA 복구를 위한 기질이 되고, 유전자를 파괴하거나 결실시키도록 제공된 편집 주형과 재조합된다. 예를 들어, 핵산 가이드된 엔도뉴클레아제를 암호화하는 유전자(예를 들어, S. 피오게네스 유래의 Cas9 또는 Cas9 뉴클레아제를 암호화하는 코돈 최적화된 유전자)는 사상성 진균 세포에서 활성인 프로모터 및 사상성 진균 세포에서 활성인 종결자에 작동 가능하게 연결되어 사상성 진균 Cas9 발현 카세트를 생성한다. 마찬가지로, 관심 유전자에 대해 고유한 하나 이상의 표적 부위가 당업자에 의해 쉽게 확인된다.

예를 들어, 관심 유전자 내의 표적 부위로 지시된 gRNA를 암호화하는 DNA 작제물을 작제하기 위해, 가변 표적화(VT) 도메인은 (PAM) 프로토-스페이서 인접 모티프(TGG)의 5'인 표적 부위의 뉴클레오타이드를 포함할 것이며, 이 뉴클레오타이드는 S. 피오게네스 Cas9에 대한 Cas9 엔도뉴클레아제 인식 도메인(CER)을 암호화하는 DNA에 융합된다. VT 도메인을 암호화하는 DNA와 CER 도메인을 암호화하는 DNA의 조합에 의해 gRNA를 암호화하는 DNA가 생성된다. 따라서, gRNA를 암호화하는 DNA를 사상성 진균 세포에서 활성인 프로모터 및 사상성 진균 세포에서 활성인 종결자에 작동 가능하게 연결함으로써 gRNA에 대한 사상성 진균 발현 카세트가 생성된다.

소정의 구현예에서, 엔도뉴클레아제에 의해 유도된 DNA 절단은 유입 서열로 복구/대체된다. 예를 들어, 상기 기재된 Cas9 발현 카세트 및 gRNA 발현 카세트에 의해 생성된 DNA 절단을 정밀하게 복구하기 위해, 뉴클레오타이드 편집 주형이 제공되어서 세포의 DNA 복구 기작은 편집 주형을 이용할 수 있다. 예를 들어, 표적화된 유전자의 5'인 약 500 bp가 표적화된 유전자의 3'인 약 500 bp에 융합되어 편집 주형을 생성할 수 있고, 이 주형은 사상성 진균 숙주의 기작에 의해 사용되어 RGEN(RNA-가이드된 엔도뉴클레아제)에 의해 생성된 DNA 절단을 복구한다.

Cas9 발현 카세트, gRNA 발현 카세트 및 편집 주형은 많은 상이한 방법(예를 들어, 원형질체 융합, 전기천공, 자연 유능성 또는 유도 유능성)을 사용하여 사상 진균 세포에 동시전달될 수 있다. 형질전환된 세포는 PCR에 의해, 정방향 프라이머 및 역방향 프라이머로 표적 유전자위를 증폭시킴으로써 스크리닝된다. 이러한 프라이머는 야생형 좌위 또는 RGEN에 의해 편집된 변형된 좌위를 증폭시킬 수 있다. 이후 시퀀싱 프라이머를 사용하여 이들 단편을 시퀀싱하여 편집된 콜로니를 확인한다.

IV. 관심 단백질

상기 부분에 간단히 기재된 것처럼, 본 발명의 균주 및 방법은 사상성 진균의 액침 배양에서 상업적으로 중요한 단백질의 생산에 이용된다. 본 발명의 관심 단백질(POI)은 임의의 내인성 또는 이종성 단백질일 수 있으며, 이는 이러한 POI의 변이체일 수 있다. 단백질은 하나 이상의 디설파이드 브리지를 함유할 수 있거나, 기능적 형태가 단량체 또는 다량체인 단백질이고, 즉 단백질은 4차 구조를 가지며, 복수의 동일한(상동성) 아단위 또는 비동일한(이종성) 아단위로 이루어지며, 여기서 POI 또는 이의 변이체 POI는 바람직하게는 관심 특성을 갖는 것이다.

소정의 구현예에서, 사상성 진균의 변이체 균주는 (비변형된) 모 균주에 비해 증가된 단백질 역가를 나타내고, 여기서 단백질 역가는 부피당 단백질의 양(g/ℓ)으로 정의된다. 예를 들어, 역가는 당해 분야에 공지된 방법(예를 들어, ELISA, HPLC, Bradford 검정, LC/MS 및 기타)에 의해 측정될 수 있다. 따라서, 소정의 구현예에서, 사상성 진균의 변이체 균주는 비변형된 (모) 세포와 비교하여 적어도 약 0.1%, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 단백질 역가 증가를 포함한다.

소정의 구현예에서, 사상성 진균의 변이체 균주는 (비변형된) 모 균주에 비해 증가된 부피측정 생산성을 나타내고, 여기서 부피측정 생산성은 총 발효 시간(h)에 따른 생물반응기의 공칭 부피(ℓ)에 따른 발효 동안 생산된 단백질의 양(g)으로 정의된다. 예를 들어, 부피측정 생산성은 당해 분야에 공지된 방법(예를 들어, ELISA, HPLC, Bradford 검정, LC/MS 및 기타)에 의해 측정될 수 있다. 따라서, 소정의 구현예에서, 사상성 진균의 변이체 균주는 비변형된 (모) 세포와 비교하여 적어도 약 0.1%, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 부피측정 생산성 증가를 포함한다.

소정의 다른 구현예에서, 사상성 진균의 변이체 균주는 증가된 총 단백질 수율을 나타내고, 여기서 총 단백질 수율은 (비변형된) 모 균주에 비해 공급된 탄수화물의 그램당 생산된 단백질(g)의 양으로 정의된다. 따라서, 본원에 사용된 바와 같이, 총 단백질 수율(g/g)은 하기 식을 이용하여 계산될 수 있다:

Y_f = T_p/T_c

여기서, "Y_f"는 총 단백질 수율(g/g)이고, "T_p"는 발효 동안 생산된 총 단백질(g)이고, "T_c"는 발효 (생물반응기) 실행 동안 공급된 총 탄수화물(g)이다. 소정의 구현예에서, 변형된 균주의 총 단백질 수율의 증가(즉, 모 균주에 비해)는 비변형된 (모) 세포와 비교하여 적어도 약 0.1 %, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 증가이다.

총 단백질 수율은 예를 들어 총 단백질에 도입된 공급된 탄소의 백분율(%)에서처럼 탄소 전환 효율/탄소 수율로 또한 기재될 수 있다. 따라서, 소정의 구현예에서, 사상성 진균의 변이체 균주는 (비변형된) 모 균주에 비해 증가된 탄소 전환 효율(예를 들어, 총 단백질로 도입된 공급된 탄소의 백분율(%)의 증가)을 포함한다. 소정의 구현예에서, 변형된 균주의 탄소 전환 효율의 증가(즉, 모 균주에 비해)는 비변형된 (모) 세포와 비교하여 적어도 약 0.1 %, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 증가이다.

소정의 구현예에서, 사상성 진균의 변이체 균주는 (비변형된) 모 균주에 비해 POI의 증가된 비생산성(Qp)을 나타낸다. 예를 들어, 비생산성(Qp)의 검출은 단백질 생산의 속도를 평가하는 데 적합한 방법이다. 비생산성(Qp)은 다음 식을 사용하여 결정될 수 있다:

"Qp = gP/gDCW

hr"

여기서, "gP"는 탱크에서 생산된 단백질의 그램이고, "gDCW"는 탱크 내 건조 세포 중량(DCW)의 그램이고, "hr"은 접종 시점으로부터의 발효 시간 (h)이고, 이는 생산 시간 및 성장 시간을 포함한다. 따라서, 소정의 구현예에서, 사상성 진균의 변이체 균주는 비변형된 (모) 세포와 비교하여 적어도 약 0.1%, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 비생산성(Qp) 증가를 포함한다.

소정의 구현예에서, POI 또는 이의 변이체 POI는 아세틸 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 탄산무수화효소, 카복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 리아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코스 산화효소, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 글리코실 가수분해효소, 헤미셀룰라아제, 헥소스 산화효소, 가수분해효소, 인버타아제, 아이소머라아제, 락카아제, 리가아제(ligase), 리파아제, 리아제, 만나나아제, 만노시다아제, 산화효소, 산화환원효소, 펙테이트 리아제, 펙틴 아세틸 에스테라아제, 펙틴 해중합효소, 펙틴 메틸 에스테라아제, 펙틴분해 효소, 퍼하이드롤라아제, 폴리올 산화효소, 과산화효소, 페놀산화효소, 피타아제, 폴리갈락투로나아제, 프로테아제, 펩티다아제, 람노-갈락투로나아제, 리보뉴클레아제, 전환효소, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소스 산화효소, 및 이들의 조합으로 이루어진 군으로부터 선택된다.

소정의 구현예에서, POI 또는 변이체 POI는 EC 1, EC 2, EC 3, EC 4, EC 5 또는 EC 6으로 이루어진 군으로부터 선택된 효소 위원회(EC: Enzyme Commission) 번호로부터 선택된다.

예를 들어, 소정의 구현예에서, POI는 비제한적인 예로서 EC 1.10.3.2(예를 들어, 락카아제), EC 1.10.3.3(예를 들어, L-아스코르브산 옥시다아제), EC 1.1.1.1(예를 들어, 알코올 탈수소효소), EC 1.11.1.10(예를 들어, 염화물 퍼옥시다아제), EC 1.11.1.17(예를 들어, 퍼옥시다아제), EC 1.1.1.27(예를 들어, L-락테이트 탈수소효소), EC 1.1.1.47(예를 들어, 글루코스 1-탈수소효소), EC 1.1.3.X(예를 들어, 글루코스 옥시다아제), EC 1.1.3.10(예를 들어, 피라노스 옥시다아제), EC 1.13.11.X(예를 들어, 디옥시게나아제), EC 1.13.11.12(예를 들어, 리네올레이트 13S-리폭시게나아제), EC 1.1.3.13(예를 들어, 알코올 옥시다아제), EC 1.14.14.1(예를 들어, 모노옥시게나아제), EC 1.14.18.1(예를 들어, 모노페놀 모노옥시게나아제), EC 1.15.1.1(예를 들어, 수퍼옥사이드 디스무타아제), EC 1.1.5.9(이전 EC 1.1.99.10, 예를 들어, 글루코스 탈수소효소), EC 1.1.99.18(예를 들어, 셀로비오스 탈수소효소), EC 1.1.99.29(예를 들어, 피라노스 탈수소효소), EC 1.2.1.X(예를 들어, 지방산 리덕타아제), EC 1.2.1.10(예를 들어, 아세트알데하이드 탈수소효소), EC 1.5.3.X(예를 들어, 프룩토실 아민 리덕타아제), EC 1.8.1.X(예를 들어, 이황화물 리덕타아제) 및 EC 1.8.3.2(예를 들어, 티올 옥시다아제)로부터 선택된 EC 1(옥시도리덕타아제) 효소를 포함하는 옥시도리덕타아제 효소이다.

소정의 구현예에서, POI는 비제한적인 예로서 EC 2.3.2.13(예를 들어, 트랜스글루타미나아제), EC 2.4.1.X(예를 들어, 헥소실트랜스퍼라아제), EC 2.4.1.40(예를 들어, 알터나수크라아제), EC 2.4.1.18(예를 들어, 1,4 알파-글루칸 분지화 효소), EC 2.4.1.19(예를 들어, 사이클로말토덱스트린 글루카노트랜스퍼라아제), EC 2.4.1.2(예를 들어, 덱스트린 덱스트라나아제), EC 2.4.1.20(예를 들어, 셀로비오스 포스포릴라아제), EC 2.4.1.25(예를 들어, 4-알파-글루카노트랜스퍼라아제), EC 2.4.1.333(예를 들어, 1,2-베티-올리고글루칸 포스포르 트랜스퍼라아제), EC 2.4.1.4(예를 들어, 아밀로수크라아제), EC 2.4.1.5(예를 들어, 덱스트란수크라아제), EC 2.4.1.69(예를 들어, 갈락토시드 2-알파-L-푸코실 트랜스퍼라아제), EC 2.4.1.9(예를 들어, 이눌로수크라아제), EC 2.7.1.17(예를 들어, 자일룰로키나제), EC 2.7.7.89(이전에 EC 3.1.4.15, 예를 들어, [글루타민 합성효소]-아데닐-L-티로신 포스포릴라아제), EC 2.7.9.4(예를 들어, 알파 글루칸 키나제) 및 EC 2.7.9.5(예를 들어, 포스포글루칸 키나제)로부터 선택된 EC 2(트랜스퍼라아제) 효소를 포함하는 트랜스퍼라아제 효소이다.

다른 구현예에서, POI는 비제한적인 예로서 EC 3.1.X.X(예를 들어, 에스테라아제), EC 3.1.1.1(예를 들어, 펙티나아제), EC 3.1.1.14(예를 들어, 클로로필라제), EC 3.1.1.20(예를 들어, 타나아제), EC 3.1.1.23(예를 들어, 글리세롤-에스테르 아실하이드롤라아제), EC 3.1.1.26(예를 들어, 갈락토리파아제), EC 3.1.1.32(예를 들어, 포스포리파아제 A1), EC 3.1.1.4(예를 들어, 포스포리파아제 A2), EC 3.1.1.6(예를 들어, 아세틸에스테라아제), EC 3.1.1.72(예를 들어, 아세틸자일란 에스테라아제), EC 3.1.1.73(예를 들어, 페룰로일 에스테라아제), EC 3.1.1.74(예를 들어, 큐티나아제), EC 3.1.1.86(예를 들어, 람노갈락투로난 아세틸에스테라아제), EC 3.1.1.87(예를 들어, 푸모신 B1 에스테라아제), EC 3.1.26.5(예를 들어, 리보뉴클레아제 P), EC 3.1.3.X(예를 들어, 포스포릭 모노에스테르 하이드롤라아제), EC 3.1.30.1(예를 들어, 아스페르길루스 뉴클레아제 S1), EC 3.1.30.2(예를 들어, 세라티아 마르세센스 뉴클레아제), EC 3.1.3.1(예를 들어, 알칼라인 포스파타제), EC 3.1.3.2(예를 들어, 산 포스파타제), EC 3.1.3.8(예를 들어, 3-피타아제), EC 3.1.4.1(예를 들어, 포스포디에스테라아제 I), EC 3.1.4.11(예를 들어, 포스포이노시티드 포스포리파아제 C), EC 3.1.4.3(예를 들어, 포스포리파아제 C), EC 3.1.4.4(예를 들어, 포스포리파아제 D), EC 3.1.6.1(예를 들어, 아릴설파타제), EC 3.1.8.2(예를 들어, 디이소프로필-플루오로포스파타제), EC 3.2.1.10(예를 들어, 올리고-1,6-글루코시다아제), EC 3.2.1.101(예를 들어, 만난 엔도-1,6-알파-만노시다아제), EC 3.2.1.11(예를 들어, 알파-1,6-글루칸-6-글루카노하이드롤라아제), EC 3.2.1.131(예를 들어, 자일란 알파-1,2-글루쿠로노시다아제), EC 3.2.1.132(예를 들어, 키토산 N-아세틸글루코스아미노하이드롤라아제), EC 3.2.1.139(예를 들어, 알파-글루쿠로니다아제), EC 3.2.1.14(예를 들어, 키티나아제), EC 3.2.1.151(예를 들어, 자일로글루칸-특이적 엔도-베타-1,4-글루카나아제), EC 3.2.1.155(예를 들어, 자일로글루칸-특이적 엑소-베타-1,4-글루카나아제), EC 3.2.1.164(예를 들어, 갈락탄 엔도-1,6-베타-갈락토시다아제), EC 3.2.1.17(예를 들어, 라이소자임), EC 3.2.1.171(예를 들어, 람노갈락투로난 하이드롤라아제), EC 3.2.1.174(예를 들어, 람노갈락투로난 람노하이드롤라아제), EC 3.2.1.2(예를 들어, 베타-아밀라아제), EC 3.2.1.20(예를 들어, 알파-글루코시다아제), EC 3.2.1.22(예를 들어, 알파-갈락토시다아제), EC 3.2.1.25(예를 들어, 베타-만노시다아제), EC 3.2.1.26(예를 들어, 베타-프럭토푸라노시다아제), EC 3.2.1.37(예를 들어, 자일란 1,4-베타-자일로시다아제), EC 3.2.1.39(예를 들어, 글루칸 엔도-1,3-베타-D-글루코시다아제), EC 3.2.1.40(예를 들어, 알파-L-람노시다아제), EC 3.2.1.51(예를 들어, 알파-L-푸코시다아제), EC 3.2.1.52(예를 들어, 베타-N-아세틸헥소스아미니다아제), EC 3.2.1.55(예를 들어, 알파-N-아라비노푸라노시다아제), EC 3.2.1.58(예를 들어, 글루칸 1,3-베타-글루코시다아제), EC 3.2.1.59(예를 들어, 글루칸 엔도-1,3-알파-글루코시다아제), EC 3.2.1.67(예를 들어, 갈락투란 1,4-알파-갈락투로니다제), EC 3.2.1.68(예를 들어, 이소아밀라아제), EC 3.2.1.7(예를 들어, 1-베타-D-프럭탄 프럭타노하이드롤라아제), EC 3.2.1.74(예를 들어, 글루칸 1,4-β-글루코시다아제), EC 3.2.1.75(예를 들어, 글루칸 엔도-1,6-베타-글루코시다아제), EC 3.2.1.77(예를 들어, 만난 1,2-(1,3)-알파-만노시다아제), EC 3.2.1.80(예를 들어, 프럭탄 베타-프럭토시다아제), EC 3.2.1.82(예를 들어, 엑소-폴리-알파-갈락투로노시다아제), EC 3.2.1.83(예를 들어, 카파-카라기나아제), EC 3.2.1.89(예를 들어, 아라비노갈락탄 엔도-1,4-베타-갈락토시다아제), EC 3.2.1.91(예를 들어, 셀룰로스 1,4-베타-셀로비오시다아제), EC 3.2.1.96(예를 들어, 만노실-당단백질 엔도-베타-N-아세틸글루코스아미니다아제), EC 3.2.1.99(예를 들어, 아라비난 엔도-1,5-알파-L-아라비나아제), EC 3.4.X.X(예를 들어, 펩티다아제), EC 3.4.11.X(예를 들어, 아미노펩티다아제), EC 3.4.11.1(예를 들어, 류실 아미노펩티다아제), EC 3.4.11.18(예를 들어, 메티오닐 아미노펩티다아제), EC 3.4.13.9(예를 들어, Xaa-Pro 디펩티다아제), EC 3.4.14.5(예를 들어, 디펩티딜-펩티다아제 IV), EC 3.4.16.X(예를 들어, 세린-유형 카복시펩티다아제), EC 3.4.16.5(예를 들어, 카복시펩티다아제 C), EC 3.4.19.3(예를 들어, 피로글루타밀-펩티다아제 I), EC 3.4.21.X(예를 들어, 세린 엔도펩티다아제), EC 3.4.21.1(예를 들어, 키모트립신), EC 3.4.21.19(예를 들어, 글루타밀 엔도펩티다아제), EC 3.4.21.26(예를 들어, 프롤릴 올리고펩티다아제), EC 3.4.21.4(예를 들어, 트립신), EC 3.4.21.5(예를 들어, 트롬빈), EC 3.4.21.63(예를 들어, 오리진), EC 3.4.21.65(예를 들어, 써모마이콜린), EC 3.4.21.80(예를 들어, 스트렙토그리신 A), EC 3.4.22.X(예를 들어, 시스테인 엔도펩티다아제), EC 3.4.22.14(예를 들어, 악티니딘), EC 3.4.22.2(예를 들어, 파파인), EC 3.4.22.3(예를 들어, 피카인), EC 3.4.22.32(예를 들어, 줄기 브로멜라인), EC 3.4.22.33(예를 들어, 과일 브로멜라인), EC 3.4.22.6(예를 들어, 키모파파인), EC 3.4.23.1(예를 들어, 펩신 A), EC 3.4.23.2(예를 들어, 펩신 B), EC 3.4.23.22(예를 들어, 엔도티아펩신), EC 3.4.23.23(예를 들어, 무코르펩신), EC 3.4.23.3(예를 들어, 가스트릭신), EC 3.4.24.X(예를 들어, 메탈로엔도펩티다아제), EC 3.4.24.39(예를 들어, 듀테로라이신), EC 3.4.24.40(예를 들어, 세랄라이신), EC 3.5.1.1(예를 들어, 아스파라기나아제), EC 3.5.1.11(예를 들어, 페니실린 아미다아제), EC 3.5.1.14(예를 들어, N-아실-지방족-L-아미노산 아미도하이드롤라아제), EC 3.5.1.2(예를 들어, L-글루타민 아미도하이드롤라아제), EC 3.5.1.28(예를 들어, N-아세틸무라모일-L-알라닌 아미다아제), EC 3.5.1.4(예를 들어, 아미다아제), EC 3.5.1.44(예를 들어, 단백질-L-글루타민 아미도하이드롤라아제), EC 3.5.1.5(예를 들어, 우레아제), EC 3.5.1.52(예를 들어, 펩타이드-N(4)-(N-아세틸-베타-글루코스아미닐)아스파라긴 아미다아제), EC 3.5.1.81(예를 들어, N-아실-D-아미노산 데아실라제), EC 3.5.4.6(예를 들어, AMP 탈아미노효소) 및 EC 3.5.5.1(예를 들어, 니트릴라아제)로부터 선택된 EC 3(가수분해효소) 효소를 포함하는 가수분해효소 효소이다.

다른 구현예에서, POI는 비제한적인 예로서 EC 4.1.2.10(예를 들어, 만델로니트릴 리아제), EC 4.1.3.3(예를 들어, N-아세틸뉴라미네이트 리아제), EC 4.2.1.1(예를 들어, 탄산탈수효소), EC 4.2.2.-(예를 들어, 람노갈락투로난 리아제), EC 4.2.2.10(예를 들어, 펙틴 리아제), EC 4.2.2.22(예를 들어, 펙테이트 트리사카라이드-리아제), EC 4.2.2.23(예를 들어, 람노갈락투로난 엔도리아제) 및 EC 4.2.2.3(예를 들어, 만누로네이트-특이적 알기네이트 리아제)로부터 선택된 EC 4(리아제) 효소를 포함하는 리아제 효소이다.

소정의 다른 구현예에서, POI는 비제한적인 예로서 EC 5.1.3.3(예를 들어, 알도오스 1-에피머라아제), EC 5.1.3.30(예를 들어, D-사이코스 3-에피머라아제), EC 5.4.99.11(예를 들어, 이소말툴로스 합상효소) 및 EC 5.4.99.15(예를 들어, (1→4)-α-D-글루칸 1-α-D-글루코실무타아제)로부터 선택된 EC 5(아이소머라아제) 효소를 포함하는 아이소머라아제 효소이다.

또 다른 구현예에서, POI는 비제한적인 예로서 EC 6.2.1.12(예를 들어, 4-쿠마레이트:조효소 A 리가아제) 및 EC 6.3.2.28(예를 들어, L-아미노산 알파-리가아제)로부터 선택된 EC 6(리가아제) 효소를 포함하는 리가아제 효소이다.

본 발명의 균주 및 방법의 이들 및 다른 양태 및 구현예는 본 설명 및 하기 실시예를 고려하여 당업자에게 명확할 것이다.

실시예

본 발명의 소정의 양태는 다음의 실시예를 고려하여 추가로 이해될 수 있는데, 이는 제한하는 것으로 해석되어서는 안된다. 재료 및 방법에 대한 변형은 당업자에게 명백할 것이다.

실시예 1

사상성 진균에서의 단백질 생산 증가의 원인인 것으로서 lov 유전자의 확인

A. 개요

본 실시예에서, 글루코아밀라아제(GA) 작제물을 발현하는 "B7ms1"이라 명명된 점도 감소 트리초데르마 균주는 진탕 플라스크 조건 하에 펠릿에 대한 경향의 감소를 향해 특별히 진화되었다. 보다 구체적으로는, B7ms1의 돌연변이체(균주)는 확인되고 단리되고 "B7ms1-SF12"라 명명되었다. (돌연변이체) B7ms1-SF12 균주는 B7ms1 (모) 균주에 비해 발효기에서 공급 당에 대한 40% 더 높은 단백질 수율을 가졌다(예를 들어, 도 1 참조).

따라서, 본원에 기재된 것처럼, 게놈 서열 분석 및 유전적 분석은 B7ms1-SF12 (돌연변이체) 균주의 관찰된 (증가된 생산성) 표현형의 원인인 것으로서 내부의 유전자(또는 유전자들)에서의 하나 이상의 돌연변이(들)를 확인하기 위해 B7ms1-SF12 (돌연변이체) 균주에서 수행되었다. 본원에 개시된 것처럼, 확인된 돌연변이는 (자연적) LOV 단백질의 암호화 서열을 변경하도록 결정되었고, 여기서 (자연적) LOV 단백질(서열 번호 2)의 아미노산 (잔기) 813번 위치에서의 고도로 보존된 트레오닌(T)(T813)은 (변이체) LOV 단백질의 813번 위치에서의 리신(813K)으로 변경(치환)(서열 번호 4, 즉, T813K 치환)되었다(예를 들어, 도 2 참조).

B. 진화 전략

사상성 진균 종(예를 들어, 트리초데르마 종, 아스페르길루스 종, 푸사륨 종, 페니실리움 종, 크리소스포륨 종, 세팔로스포륨 종, 탈라로마이세스 종, 게오스미티아 종, 뉴로스포라 종, 마이셀리오프토라 종 및 기타)은 상업용/산업용 발효에 사용될 때 두꺼운 점성의 발효 브로스를 일반적으로 생산하는 호기성 진균이다. 높은 발효 (브로스) 점도는 전형적으로 용존 산소(DO) 이동을 감소시켜서 세포량의 양을 제한하고 이러한 호기성 사상성 진균 발효에서 달성될 수 있는 부피측정 생산성을 감소시킨다. 예를 들어, 점도 감소 사상성 진균 돌연변이체의 단리는 더 낮은 점도 발효 브로스를 생산하는 돌연변이체 균주/세포를 생성시키고, 여기서 이러한 점도 감소 균주/세포를 사용한 발효는 더 많은 세포량을 이용할 수 있어서 단백질 생산성을 증가시킨다(예를 들어, 출원인의 국제 PCT 공보 WO2012/145584호, WO2012/027580호, WO2012/145595호, WO2012/145596호 및 WO2012/145592호 참조). 보다 구체적으로는, 출원인이 추가의 이의 점도 감소 균주를 생성하기 위해 소정의 점도 감소 돌연변이를 조합하기 시작하면서, 이의 소정의 점도 (감소) 조합(즉, 돌연변이)이 진탕 플라스크 검정에서 균사 펠릿을 형성하는 더 높은 경향을 갖는 것으로 보였다는 것이 놀랍게도 관찰되었다.

보다 구체적으로는, 본원에 고려되는 것처럼, 진탕 플라스크에서 균사 펠릿을 형성하는 관찰된 증가된 경향이 발효기로 규모확장될 수 있는 경우에, 출원인은 지향된 진화 실험에 의해 상기 언급된 펠릿화 표현형을 완화하도록 추구하였다. 예를 들어, 임의의 특정 이론, 기전 또는 작용 방식에 의해 구속되고자 바라지 않으면서, 균사 펠릿을 형성하는 이러한 경향이 단백질 생산 및/또는 이러한 단백질의 하류 가공에 부정적으로 방해할 수 있다고 본원에 고려된다. 출원인은 따라서 이들 균주의 "진화된" 돌연변이체가 생성되고 스크리닝되고 단리될 수 있다고 합리화하였고, 여기서 이러한 진화된 균주는 진탕 플라스크, 발효기, 생물반응기 등에서 균사 펠릿화에 대한 감소된 경향을 포함한다.

예를 들어, 트리초데르마 균주 B7ms1의 배양물은 완전 복합 배지를 함유하는 진탕 플라스크에서 12-24시간 동안 성장되고, 이후 70 마이크로미터(μm) 체를 통과하였다. 세포 밀도에 따른 통과액은 새로운 배양 배지를 접종하도록 사용되거나, 통과액의 전체는 새로운 진탕 플라스크에 옮겨졌다. 항온처리 후, 가끔 샘플을 취하여 공정을 몇 주 동안 연속 반복하였고, 그 샘플을 이후 가능한 돌연변이체를 단리시키도록 플레이팅하였다. 단리물은 (개별적으로) 진탕 플라스크 형태학에서 총 변화(예를 들어, 비제한적인 예로서 펠릿화 또는 균사 덩어리화를 포함하는 진탕 플라스크 형태학에서의 변화)에 대해 시각적으로 스크리닝되었다. 진탕 플라스크에서 보다 균질한 성장을 갖는 이 단리물을 진탕 플라스크 및 이어서 발효기에서 단백질 생산에 대해 추가로 시험하였다.

C. 트리초데르마 돌연변이체 균주 B7ms1-SF12의 단리 및 규명

상기 기재된 이러한 진화 체계에서, 출원인은 "B7ms1-SF12"로 명명된 돌연변이체 균주를 단리시켰고, 여기서 (돌연변이체) B7ms1-SF12 균주는 (모) B7ms1 균주에 비해 진탕 플라스크에서 더 높은 단백질 생산을 나타냈다(데이터 비기재). 따라서, 상기 언급된 펠릿화 표현형에 대한 임의의 영향과 독립적으로, 숙주 균주의 단백질 생산 표현형을 향상시키는 임의의 돌연변이(들)는 발효/단백질 생산 비용을 감소시키는 이의 가능성에서 특정 가치를 갖는다.

따라서, (모) B7ms1 균주 및 자발적 돌연변이체 (딸) 균주 B7ms1-SF12는 발효기에서 총 단백질 생산에 대해 평가되었다. 이들 균주는 액침된 (액체 배양)에서 동일한 조건 하에 성장되고, 공급 당에 대한 이의 총 단백질 수율은 14 ℓ 발효기에 비교되었다. 도 1에 제시된 것처럼, 돌연변이체 B7ms1-SF12 균주(도 1; 검정 선/검정 정사각형)는 (모) B7ms1 균주에 대하여 공급 당에 대한 수율의 44% 증가된 개선을 나타냈다(도 1; 회색 선/회색 정사각형).

간단히 말하면, 각각의 균주의 포자를 측면 배플 및 하부 배플 둘 다를 갖는 3 ℓ의 플라스크에서 500 ㎖의 배지에 별개로 첨가하였다. 배양물을 진탕 항온처리기에서 34℃에서 48시간 동안 최소 배지에 성장시켰다. 48시간 후, 각각의 플라스크의 내용물을 4.7 g/ℓ의 KHPO, 1.0 g/ℓ의 MgSO₇HO, 4.3 g/ℓ의 (NH)SO 및 2.5 mL/ℓ의 400X 티. 레세이 미량 원소 용액(시트르산(무수), 175 g/ℓ; FeSO₄ · 7 H₂O, 200 g/ℓ, ZnSO₄· 7 H₂O, 16 g/ℓ, CuSO₄ · 5 H₂O, 3.2 g/ℓ; MnSO₄H₂O, 1.4 g/ℓ; H₃BO₃, 0.8 g/ℓ)을 함유하는 9.5 ℓ의 배지를 함유하는 14 ℓ 발효기에 별개로 첨가하였다. 이들 성분들을 121℃에서 30분 동안 함께 열 살균하였다. 60% 글루코스 및 0.48% CaCl₂·2H₂O의 용액을 별개로 오토클레이빙하고, 냉각시키고, 75 g/ℓ의 글루코스 및 0.6 g/ℓ의 CaCl₂·2H₂O의 최종 농도로 발효기에 첨가하였다. 배지를 28% NH로 pH 3.5로 조정하고, 성장 기간 동안 34℃에서 온도를 유지시켰다. 글루코스가 소진되면, 온도는 28℃까지 떨어지고, 배양물은 공급된 글루코스-소포로스였다. 건조 세포 중량(DCW), 총 단백질 농도 및 다른 매개변수를 측정하고, 특이적 총 단백질 생산율 및 공급 당에 대한 수율을 계산하였다.

D. 트리초데르마 돌연변이체 균주 B7ms1-SF12에서의 원인성 lov (T813K) 돌연변이의 확인

출원인은 (모) B7ms1 균주 및 (돌연변이체) B7ms1-SF12 (딸) 균주의 게놈을 시퀀싱하여서, B7ms1-SF12 게놈에서 암호화 서열을 변경하는 것으로 예측된 두(2)개의 새로운 돌연변이의 확인으로 이어지고, 단독의(또는 조합된) 돌연변이 중 어느 하나는 관찰된 단백질 생산성 (개선) 표현형에 필요하였다. 보다 구체적으로는, 이들 돌연변이 중 어느 것이 중요한지를 결정/확인하기 위해, 상보성 분석은 야생형 좌위의 각각을 암호화하는 DNA를 갖는 (돌연변이체) B7ms1-SF12 균주를 형질전환하여 사용되었다. 예를 들어, 형질전환될 때 오직 하나의 좌위는 돌연변이체 표현형을 보충하였고, 이 좌위는 lov라 칭해진다. lov 유전자는 예측된 단백질 PID 50212(서열 번호 2)를 암호화하고, 여기서 (돌연변이체) B7ms1-SF12 균주에서 lov 돌연변이체(대립유전자)는 스캐폴드 16에서 425393에서 G(구아닌)에서 T(티민)의 단일 뉴클레오타이드 변화를 포함하여, 암화화된 LOV (변이체) 단백질(서열 번호 4)에서 아미노산 치환 T813K를 야기하고, 돌연변이체 대립유전자는 본원에서 대립유전자 "lov(T813K)"라 칭해지고, 자연적 (야생형) 대립유전자는 본원에서 "lov(+)"라 칭해진다.

LOV 단백질 또는 LOV 단백질 오솔로그의 기능적 규명은 임의의 유기체에 대해 문헌에 기재되어 있지 않다. 본원에 기재된 바대로, 보존된 도메인 분석(NCBI)은 글리코실 전환효소 패밀리 그룹 2(pfam13632, 3.25x10-44의 E-값, 예를 들어, 도 2에서 "글리코 트랜스 2 3" 참조)와 멀리 관련된 영역을 확인하였다. 예를 들어, 원핵생물 단백질의 이 (글리코실 전환효소) 패밀리의 구성원은 박테리아 캡슐 생합성(PFAM)에 관여된 추정상 글루코실전환효소를 포함한다. 보다 구체적으로는, 트리초데르마 PID 79396에 대한 오솔로그(즉, LOV가 아님, PID 50212)인 (글리코실 전환효소) 패밀리 그룹 2 도메인, "ZtGT2"를 갖는 진균 단백질은 고체 표면에서의 균사 성장에 중요하다(King et al., 2017).

보다 놀랍게도, LOV 단백질은 담자균류 및 자낭균류 문의 사상성 진균 중에 널리 보존된다. 예를 들어, (자연적) LOV 단백질의 813번 위치에서의 트레오닌(T)(즉, 리신(K)에 대한 돌연변이는 본원에 개시된 바와 같이 유리함)은 트리초데르마 및 가장 산업적으로 관련된 사상성 진균이 속하는 주발버섯 아문 내에 NCBI 비중복 데이터베이스의 상부 BLASTp 검색 결과 중에서 고도로 보존된다(691/691; 100%). 이 691개의 주발버섯 동족체의 Geneious 다중 서열 정렬(www.geneious.com, Geneious 11.0, Biomatters Ltd.)로부터의 그래프 표시는 도 2에 제시된다. 마찬가지로, 상부 1,000 BLASTp 히트 중에서, 잔기 813번 위치는 MUSCLE 다중 서열 정렬(Geneious 소프트웨어 패키지)에서 975/1000(97.5%) 히트(즉, T813)에서 확인되었고, 여기서 잔기 813은 결코 리신(K)로서 발생하지 않는다(즉, 향상된 단백질 생산성을 생성시키는 본원에 기재된 치환은 BLASTp에 의해 확인된 상부 1000 오솔로그에서 발견되지 않았다). 보존된 위치 및 돌연변이가 진균 단백질 생산을 개선하는 데 유용하지만, T813 잔기는 Genebank에 이전에 주석화된 임의의 영역 내에 없다(도 2). LOV 단백질은 트리초데르마 게놈에서 단백질의 이 종류의 오직 예측된 구성원인 반면, 많은 게놈은 하나 초과를 갖는다.

실시예 2

점도 감소 균주에서의 lov (T813K) 대립유전자의 표적화된 도입은 발효기에서 단백질 생산성을 증가시킨다

A. 개요

lov(T813K) 대립유전자가 관찰된 단백질 생산성 개선에 대한 원인인지를 추가로 검증하기 위해, lov(T813K) 돌연변이를 상이한 T. 레세이 균주 계통(본원에서 "T4"라 명명)으로 도입하였다. B7ms1(실시예 1) 및 T4 계통은 둘 다 트리초데르마 균주 RL-P37의 상이한 균주 개선 프로그램으로부터 돌연변이된 유도체이다(Sheir-Neiss et al., 1984; Montenecourt, 1987). T4 균주는 특히 T4 균주가 셀룰라아제의 자연적 칵테일을 발현하고, 총 단백질 생산을 증가시키는 nik1(M743T) 돌연변이를 함유한다는 점에서 B7ms1과 다르다(US20180037919). 전에 B7ms1 계통(실시예 1)에 의한 것처럼, 점도 감소 이중 돌연변이체(Δmpg1; Δseb1)는 lov(T813K) 대립유전자의 존재 또는 부재 둘 다 하에 T4 계통에서 발견되었다. 예를 들어, 발효기에서, lov(T813K) 대립유전자를 포함하는 T4 Δmpg1; Δseb1 균주는 공급 당에 대한 평균 37% 더 높은 총 단백질 수율을 가졌다.

B. pyr4 또는 pyr2 선별 마커 중 어느 하나를 갖는 lov 파괴 카세트를 포함하는 플라스미드의 작제

트리초데르마 lov 파괴 카세트 플라스미드는 표준 분자 생물학 절차를 사용하여 제조되었고, 여기서 관련 분야에서의 당업자는 본원에 개시된 정보로부터 이 플라스미드를 용이하게 재생성할 수 있다. 플라스미드는 스캐폴드 16, 426947 내지 425393에 대응하는 DNA 서열에 동일한 1.6 Kb 상동성 박스를 갖는 DNA 서열(왼쪽 플랭크)을 포함하였다. 왼쪽 플랭크의 마지막 뉴클레오타이드는 (돌연변이체) B7ms1-SF12 균주에서 확인된 돌연변이(실시예 1)에 상응하는 단일 뉴클레오타이드 G에서 T 돌연변이를 도입하였다. 스캐폴드 16, 425392 내지 423880과 동일한 DNA 서열에 상응하는 1.5 Kb 상동성 박스를 갖는 DNA 서열(오른쪽 플랭크) 또한 이 플라스미드 내에 포함되었다. 이 서열은 lov 유전자를 표적화하고, 개재하는 카세트 서열로 왼쪽 플랭크와 오른쪽 플랭크(스캐폴드 16, 425393) 사이의 게놈의 뉴클레오타이드를 대체하도록 설계되었다.

이 개재하는 (카세트) 서열은 트리초데르마 레세이(pRATT308)로부터의 pyr4 선별 마커 또는 트리초데르마 아트로비리데(pRATT312)로부터의 pyr2 선별 마커를 포함하였다. 선별 마커의 바로 하류에 왼쪽 플랭크(반복서열)의 3′-가장 0.5 Kb 영역에 상동성인 0.5 Kb 영역을 갖는 DNA 서열이 있다. 이 반복된 서열은 선별 마커의 후속하는 손실을 촉진하도록 의도되어서, 미래의 균주 개발에서 이 마커의 후속하는 사용이 가능하게 하고, 오직 새로 표적화된 게놈 변형으로서 LOV(T813K) 단백질(서열 번호 4)을 암호화하는 lov 유전자에서 단일 뉴클레오타이드 G에서 T 돌연변이(스캐폴드 16, 425393)를 남긴다.

C. lov (T813K) 대립유전자를 갖는 T4 유래 균주의 개발

유전자 mpg1의 점도 감소 파괴(Δmpg1)를 포함하는 본원에서 균주 "T4m" 및 "T4m_pyr2"라 명명된 T4 균주의 유도체는 미국 특허 제9,725,727호에서 본질적으로 개발되었다(본원에 그 전체가 참고로 포함됨). 따라서, T4m_pyr2 균주(Δmpg1; pyr2)는 PEG 매개 형질전환을 이용하여 pRATT312(pyr2 선별 마커)로부터 lov 파괴 카세트로부터 형질전환되고, pyr2 마커에 의해 획득된 우리딘 원영양요구성에 기초하여 후보를 선택하기 위해 1.2 M 소르비톨을 함유하는 Vogel의 최소 배지(Vogel, 1956)에 플레이팅되었다. 트리초데르마 형질전환은 널리 공지되어 있고, 당해 분야에 기재되어 있다(예를 들어, 미국 특허 5,246,853호 참조). 개별 형질전환체는 단리되고 Vogel 최소 배지로 이동시켜 증식되었다. PCR 분석은 형질전환체를 확인하도록 사용되는데, 여기서 lov 파괴 카세트는 하기 지침에 따라 당업자에게 공지된 방법을 이용하여 상동성 재조합에 의해 lov 유전좌위에서 통합되었다.

재조합 세포의 하위집단만이 관심 유전자의 파괴를 정확히 표적화하기 위해 상동성 플랭크를 성공적으로 이용할 수 있어서, 많은 형질전환체는 원하는 사건을 갖는 것을 확인하기 위해 스크리닝될 필요가 있을 수 있다. PCR은 어떠한 재조합 세포가 원하는 표적화된 파괴를 갖는지를 시험하기 위해 이용될 수 있다. 각각의 상동성 박스 영역에 걸쳐 증폭하는 프라이머가 설계되어야 하고, 여기서 하나의 프라이머는 가장 가까운 말단으로부터 100 bp 초과인 선별 마커 내의 위치에서 프라이밍하고, 다른 프라이머는 인접한 게놈 서열 내의 상동성 박스 영역의 말단을 넘어 100 bp 초과인 위치에서 프라이밍한다. 정확한 표적화된 파괴를 아마도 함유하는 세포는 파괴 카세트의 왼쪽 플랭크 및 오른쪽 플랭크에 이르는 PCR 산물을 성공적으로 생성하는 반면, 성공적이지 않은 형질전환 사건은 예상된 크기의 산물을 생성하지 않을 것이다. 이 단계에서 배양물은 형질전환된 세포와 비형질전환된 세포의 혼합물일 수 있고, 그래서 정제 단계가 필요할 수 있다. 배양물의 정제는 파괴 부위에 이르는 짧은 PCR 산물의 손실에 대해서 PCR에 의해 시험될 수 있다.

보다 구체적으로는, lov 유전자의 pyr2 파괴를 포함하는 하나의 이러한 T4m 유래 균주는 확인되고 단리되고 "T4ml+"(즉, 특정 T813K 치환을 포함하는 대립유전자 lov(T813K)와 반대로 대립유전자 lov(dis))라 명명된다. 따라서, 특정 lov(T813K) 대립유전자를 포함하는 균주를 생성하기 위해, 균주 T4ml+(lov(dis) 대립유전자를 포함)의 포자 현탁액은 유도체 균주를 선택하기 위해 5-플루오로-오로트산(FOA)을 함유하는 배지에 플레이팅되고, 여기서 삽입된 선별 마커를 측접시키는 반복된 영역과 게놈으로부터의 선별 마커의 동반 손실 사이의 자발적 재조합이 있다. 우리딘 영양요구체는 선별 마커의 손실을 시험하기 위해 PCR에 의해 그리고 lov(T813K) 대립유전자의 존재를 확인하기 위해 PCR 산물의 시퀀싱에 의해 단리되고 분석되었다. lov(T813K) 대립유전자를 포함하는 하나의 균주는 이러한 방식으로 생성되고, 본원에서 "T4ml"이라 칭해진다. 발효기 평가를 위해 피리미딘 원영양요구성을 복원하기 위해, T4ml 및 T4m_pyr2 균주 둘 다는 본질적으로 미국 특허 9,725,727호에 기재된 바대로 점도 감소 좌위 seb1로 표적화된 pyr2 마커를 가져서, 본원에서 "T4mls"(lov(T813K) 대립유전자를 포함) 및 "T4ms"(lov(+) 대립유전자를 포함)라 칭하는 균주를 생성시킨다.

D. lov (T813K) 대립유전자를 포함하는 T4 유래 균주의 발효기 평가

따라서, 균주 T4mls(lov(T813K) 대립유전자를 포함) 및 T4ms(lov(+) 대립유전자를 포함)는 실시예 1에 기재된 바대로 발효기에서 평가되었다. 부가적으로, T4mls 및 T4ms 균주는 lov(T813K) 대립유전자에 의해 관찰된 단백질 생산 표현형이 더 높은 세포 밀도 발효로 제한되지 않는다는 것을 보장하기 위해 공급 시작 전에 제공된 글루코스의 양을 조정하여 실시예 1에 비해 더 낮은 세포 밀도 발효에서 평가되었다. 도 3에 도시된 바와 같이, 더 낮은 세포 밀도(LCD; 도 3, T4mls, 검정 원/검정 파선; T4ms, 회색 원/회색 파선) 발효 조건 및 더 높은 세포 밀도(HCD; 도 3, T4mls, 검정 정사각형/검정 실선; T4ms, 회색 정사각형/회색 실선) 발효 조건 둘 다 하에, 공급 당에 대한 단백질 수율은 lov(T813K) 대립유전자가 존재할 때 각각 42% 및 32% 증가하였다.

실시예 3

pyr2 선별 마커의 삽입에 의한 lov 유전자의 표적화된 파괴는 발효기에서 생산성을 개선하지 못했다

A. 개요

(자연적) LOV 단백질(서열 번호 2)의 잔기 813번 위치에서의 트레오닌(T) 아미노산의 높은 보존을 고려하여, LOV 단백질의 발현/생산을 차단하는 임의의 방식에서의 좌위의 파괴가 또한 균주 생산성을 개선할 것이라는 개연성이 있을 것 같다. 이 가설을 시험하기 위해, lov(dis) 대립유전자를 갖는 진균 균주 및 갖지 않는 것을 발효기에서 비교하였고, 여기서 pyr2 선별 마커는 LOV 단백질 발현을 파괴시키도록 lov 유전자로 삽입되었다. 놀랍게도, lov(dis) 대립유전자는 발효기에서 생산을 개선하지 못했다.

B. lov (dis) 대립유전자를 갖는 균주의 발효기 평가

T4m 및 T4ml+ 균주의 개발은 상기 실시예 2에 기재되어 있다. 균주 T4ml+는 T4m의 유도체이고, 여기서 pyr2 마커는 균주 T4m_pyr2의 lov 암호화 서열로 삽입되었다. T4m 및 T4ml+ 균주는 공급 시작 전에 제공된 글루코스의 양을 조정하여 더 낮은 세포 밀도 발효에서를 제외하고 실시예 1에 기재된 바와 본질적으로 동일한 14 ℓ 발효기에서 동일한 조건 하에 평가되었다.

"T4s" 및 "T4s_pyr2"(유전자 seb1의 점도 감소 파괴를 포함)라 명명된 T4의 유도체는 미국 특허 제9,725,727호에 기재된 바대로 본질적으로 개발되었다. lov(dis) 대립유전자는 균주 T4sl+를 생성하도록 실시예 2에서 균주 T4m_pyr2에 대해 기재된 바대로 비슷하게 T4s_pyr2로 도입되었다. 따라서, T4s 및 T4sl+ 균주는 2 ℓ 생물반응기에서 동일한 조건 하에 평가되었다. 구체적으로는, 2 ℓ 생물반응기에 대해, 종균 배양물을 생산하기 위해, 각 균주의 포자를 250 ㎖ 플라스크에서 시트레이트 최소 배지 50 ㎖에 개별적으로 첨가하였다. 배양물을 진탕 항온처리기에서 30℃ 및 170 rmp에서 48시간 동안 성장시켰다. 48시간 후에, pH 3.5로 조정된 145.6 ㎖의 50% 글루코스, 및 0.6 g/kg의 CaCl₂에 종균 배양물을 접종하였다. 이후, 온도를 34℃에서 유지시키고 pH를 3.5에서 유지하였다. 회분식 글루코스의 고갈 이후에, 이후 글루코스-소포로스 공급을 도입하고, 온도를 25℃로 떨어뜨리고 pH를 4.8로 증가시켰다. 건조 세포 중량(DCW), 총 단백질 농도 및 다른 매개변수를 측정하고, 특이적 총 단백질 생산율 및 공급 당에 대한 수율을 계산하였다. 도 4에 도시된 것처럼, 공급 당에 대한 단백질 수율은 lov(dis) 돌연변이가 T4m 배경에 존재할 때 17% 감소하였고, T4s 배경에 존재할 때 변하지 않았다.

실시예 4

다른 진균 균주에서의 lov (T813K) 대립유전자의 표적화된 도입은 단백질 생산성을 개선한다

A. 개요

실시예 2에서, 대립유전자 lov(T813K) 생성 및 마커 손실과 수반되어 생성된 pyr2 영양요구성은 seb1 좌위에서 pyr2 마커의 통합에 의해 회복되었다. 따라서, lov(T813K) 대립유전자에 의해 관찰된 단백질 생산의 개선은 mpg1 및 seb1 점도 돌연변이 둘 다를 항상 함유하는 균주에서 실시예 1 및 실시예 2에서 여태까지 예시되어 있다. 균주 생산성의 개선에 대한 lov(T813K) 대립유전자의 보다 일반적인 적용을 입증하기 위해, pyr2 마커는 3개의 다른 편리한 게놈 위치에서 통합되었다: 부위 A, 부위 B 및 부위 C. 이 상이한 균주에 의한 단백질 생산은 진탕 플라스크에서 평가되었고, 여기서 모든 경우에 lov(T813K) 돌연변이의 존재는 야생형 lov(+) 대립유전자를 갖는 동질유전자 균주에 비해 총 단백질 생산을 개선하였다. 이와 반대로, lov(dis) 돌연변이를 포함하는 균주는 진탕 플라스크에서 상당한 단백질 생산 개선을 나타내지 않았다.

B. 상이한 게놈 위치에서의 pyr2 선별 마커의 표적화된 통합에 의한 T4ml 및 T4sl에서의 복원된 피리미딘 영양요구성

lov(T318K) 대립유전자를 갖거나 갖지 않는 균주는 당업자에게 공지된 방법을 사용하여 부위 A-C로 명명된 3개의 편리한 게놈 위치로 pyr2의 통합을 표적화하는 카세트와 독립적으로 형질전환되었다. 간단히, pyr2 카세트에 의한 PEG 매개 형질전환 후에, 프로토플라스트는 pyr2 마커에 의해 획득된 우리딘 원영양요구성에 기초하여 후보를 선택하기 위해 1.2 M 소르비톨을 함유하는 Vogel의 최소 배지에 플레이팅되었다. 개별 형질전환체는 단리되고 Vogel 최소 배지로 이동시켜 증식되었다. PCR 분석은 pyr2 카세트가 의도된 게놈 위치에서 통합된 형질전환체를 확인하도록 사용되었다. 포자 정제 후에, 통합이 정확히 발생하고 형질전환체가 동종핵성이라는 것을 보장하도록 추가의 PCR 분석이 수행되었다.

따라서, pyr2 마커는 실시예 2(표 1 참조)에 기재된 pyr2 돌연변이체 균주 T4m_pyr2(lov(+)) 및 T4ml(Δmpg1; lov(T318K))에서 부위 A, 부위 B 및 부위 C에서 통합되었다. 마찬가지로, pyr2 마커는 실시예 3에 기재된 돌연변이체 균주 T4s_pyr2(Δseb1; lov(+)) 및 T4sl(Δseb1; lov(T318K))에서 부위 A에서 통합되었다. 부가적으로, 파괴 대립유전자 lov(dis)는 실시예 2에 각각 기재된 바대로 플라스미드 pRATT312 및 pRATT308을 사용하여 전체 셀룰라아제 균주 T4_pyr2(pyr2; lov(+)) 및 41G_pyr4(pyr4; lov(+))에 첨가되었다.

C. lov (T813K) 또는 lov (dis) 대립유전자를 갖는 균주 및 갖지 않는 균주의 진탕 플라스크 평가

균주는 이의 단백질 생산에 대해 진탕 플라스크 발효에서 평가되었다. 평가된 균주는 표 1에 기재되어 있다. 시험된 모든 유전적 배경에서, 총 단백질 역가는 lov(T813K) 대립유전자가 존재할 때 증가하였다. 그러나, pyr4 (41G) 또는 pyr2 마커(T4 및 T4m) 중 어느 하나에 의한 lov 유전자의 파괴, lov(dis) 대립유전자는 상대 역가에서 상당한 개선을 나타내지 않았다.

액체 한정(LD) 배양 배지(예를 들어, 미국 특허 8,455,631호 참조)는 하기 성분을 함유하였다. 카사미노산, 9 g/ℓ; (NH₄)₂SO₄, 5 g/ℓ; MgSO₄·7H₂O, 1 g/ℓ; KH₂PO₄, 4.5 g/ℓ; CaCl₂·2H2O, 1 g/ℓ, PIPPS, 33 g/ℓ, 400× T. 레세이 미량 원소, 2.5 ml/ℓ; NaOH에 의해 5.5로 조정된 pH. 살균 후, 락토스 또는 글루코스/소포로스 혼합물을 1.6% w/v의 최종 농도로 첨가하였다.

종균 배양물을 생산하기 위해, 각 균주의 포자를 250 ㎖ 플라스크에서 50 ㎖의 YEG(5 g/ℓ 효모 추출물, 22 g/ℓ 글루코스, H₂O)에 개별적으로 첨가하였다. 배양물을 진탕 인큐베이터에서 28℃ 및 200 rmp에서 36-48시간 동안 성장시켰다. 접종 후, 0.3 ㎖의 종균 배양물을 배플 진탕 플라스크에서 50 ㎖의 LD 배지에 첨가하였다. 이 생산 배양물을 28℃ 및 180 rpm에서 5일 동안 성장시켰다. 분비된 단백질을 펠릿 세포로 원심분리하고, 이후 상청액을 수집하여 수확하였다. 단백질을 동일 부피의 트리클로로아세트산(TCA)을 갖는 상청액으로부터 침전시킨 후, 0.1 N 수산화나트륨(NaOH)에 용해시켰다. 이후, 총 단백질을 제조사 프로토콜에 따라 BCA 단백질 검정(ThermoFisher Scientific, 미국 뉴욕주 그랜드 아일랜드)으로 측정하였다. 모든 진탕 플라스크 실험에서, 원영양요구성 T4 및 T4m 균주는 이중으로 포함되었다. BCA 검정 번호를 이들 대조군의 평균으로 정규화하고, 이것은 총 단백질 생산 효율에서 임의의 주-대-주 변동의 영향을 최소화하도록 동시에 수행되었다.

도 5에 도시된 것처럼, lov(T813K) 돌연변이가 상기 생물반응기(실시예 2)에 예시된 T4ms 배경 이외에 T4mc(부위 C), T4md(부위 B), T4mp(부위 A) 및 T4sp(부위 A) 배경에 존재할 때 단백질 역가는 증가하였다. 이와 반대로, lov 유전자를 파괴하는, 즉 대립유전자 lov(dis)의 pyr2 마커 또는 pyr4 마커의 삽입을 포함하는 유전적 배경 41G, T4 및 T4m은 진탕 플라스크에서 단백질 생산의 상당한 개선을 나타내지 않았다.

D. lov (T813K) 대립유전자를 갖는 균주 T4mp 및 갖지 않는 균주의 발효기 평가

이들 균주, T4mp 및 T4mlp(부위 A에서의 pyr2의 삽입)의 한쌍은 더 낮은 세포 밀도에서를 제외하고 실시예 1에 일반적으로 기재된 바와 같이 14 ℓ 발효기에서 추가로 평가되었다. 도 6에 도시된 바대로, lov(T813K) 대립유전자의 존재 하에, 이 유전적 배경은 공급 당에 대한 총 단백질 수율의 28% 증가를 나타냈다.

참고문헌

<110> DANISCO US INC <120> MUTANT AND GENETICALLY MODIFIED FILAMENTOUS FUNGAL STRAINS COMPRISING ENHANCED PROTEIN PRODUCTIVITY PHENOTYPES AND METHODS THEREOF <130> NB41054-WO-PCT <150> US 62/711,846 <151> 2018-07-30 <160> 24 <170> PatentIn version 3.5 <210> 1 <211> 2765 <212> DNA <213> Hypocrea jecorina <400> 1 atgggtatcg gaagctactt caaggccagt accaaaaatg ctgagcaggc accgccagcg 60 ccgccgccgg ccaagctggc tcctcctcct cggttacagc tggaaggtcg gcagtcggta 120 atgtcggaga agccaccatc gtccacctcg ggcaacgacg tggatcttca gcctcccacc 180 cctaggtttc attcccgacc ccaatccagc tctggcaggt ctaccccttc aacgcagagc 240 tccatgttcc tcgacgacat caagcatgaa gtcatggtca actatctgta ccagcagcag 300 tgttctcagc tctgggtcag cgacgggtct ggggagatcg agggtgtcct gcttcgtaaa 360 gctcgaggcc actacatggc ctgtcccccc cagcttgcca gttctccctt tgcgctggca 420 tgcgctgctc tcaacgtgca gtgcgccatg acagtcaact cgcgtgtcat caagacgttt 480 ctgcaatggt cccctgacgc cgttgacgtg ccgctcatga acggcttgcg cgtgcagatt 540 ctccctacca ttgatgactt gccgcgagct cgcaagtacc agtttgctgc ctttgtcgcg 600 tctgagggcc tcctggttgt ctgggacgat gatgctcttc atttggtggc acgagccaag 660 gctatcgagt ccgagctcat ggagctggtg tggaaggccg gcaacgtaga cgaggaaggc 720 ggcgacgaga agggaggcca acctgtcact gaggttgaaa ttgatgaaga gagcggagag 780 atcaagcccg agaagcggcc cattcatctc caaaacaccg tcctcgtgtc tctgaccctg 840 gccttggtaa ccgtctctct tggcgccgcc tggagacagt tggccattga ggtttccgtg 900 gacagcaact acatccgtct tgccctcgtc gccctggctc cagtccaggt tttcttcacc 960 ctcttcttcg cccaggtcat tatcggctgc ttggctcaaa tctttggtcc catccgtcag 1020 ctcacaatca actccaagtt ctactctgcc cgacccccac cgcgcctgca gagtgccgtt 1080 cttcctcatg taaccatcca gtgccccgtc tacaaggaag gtctgcaggg tgtcatcatg 1140 ccgacggtca agtccatcaa gcaggccatg tccacgtacg agctccaggg cggttccgca 1200 aacatgttca tcaacgacga tggtttgcag ctcatctccg aagaggatcg tcttgctcgc 1260 atcgagttct acgccgacaa cagcatcggc tgggtcgctc gccccaagca cggagagaac 1320 ggcttcaccc gcaagggcaa gttcaagaag gcctccaaca tgaactttgc cctcatgatc 1380 tcatgcaagg tcgaggagaa gctgcaggca attgagcgtc accccggatg gagccagaat 1440 gacgaggcct tggcgtacga ggaagctctc aaggaagttc tcgaggccga tggccgtgcc 1500 tgggctgatg gtaacatccg catgggagac tacatcttgc tcatcgactc cgatacccgt 1560 gtccccgccg attgcctgct cgatgctgtt tccgagatgg agcagtcccc cgacgttggc 1620 atcatgcagt tctcctccgg cgtcatgcag gtcgtccaca cgtactttga gaacggcatc 1680 accttcttca ccaacctcat ttactctgcc atccgataca ccgtctccaa cggtgacgtc 1740 gcgccctttg tcggccacaa cgccatcctc cgctggtctg ccatccagca ggtcgcctac 1800 caggacgagg acggctacga caagttctgg tcggagagcc acgtctcgga agactttgac 1860 atgtcgctgc gtctgcagtg caacggctac atcatccgcc tggctgcctg ggctggagag 1920 ggtttcaagg agggcgtgtc gctgaccgtc tacgacgagc ttgcccggtg ggaaaagtac 1980 gcctacggct gcaacgagct cctgttccac cccattcgca cctggctctg gcgcggtccc 2040 tttacgccct tgttccgccg cttcctcttc tccaacattc gctttacgtc caaggtcacc 2100 gtcatctcct acatcggtac ctactacgcc atcggcgctg cctggatctt gaccgcggtc 2160 aactacttcg tcatgggctg gttcaacggc tacctggata agtactacgt cgactcgtgg 2220 caggtctggt tctccatcat catcgtcttc aacggcctcg gcaacattgc cctagccgtc 2280 atgcggtacc gcgtcggcga gcgcggtctg ctgtacgccc tgtttgagaa ctttatgtgg 2340 actctcatgc tggccatatt cctcggcggc ctgtcactgc acgtcagcca ggctctgctg 2400 gcgcacatgt ttgagattaa catgacatgg ggcgccacaa gcaaggaggc cgagttttcc 2460 aactttttca tcgaggtgcc aaaggtcttg aagaaggtta gtcaccctcg tttcattcat 2520 ccatccatct taccatgctg cgcgaagact tcagtttgct gacaattctg ttgtagttca 2580 aattctccat gctcttctcg ttgatcttca tcgccggcat gattatcctc gcccaggcgc 2640 cctttgtccc ctttgattgg cgcatcaagg actttgtcgc catcctgcct atggccaccg 2700 tcgccgccag ccacttcctg ctgcccctgg ccctgaaccc tgccctcatg acgttctcat 2760 ggtaa 2765 <210> 2 <211> 894 <212> PRT <213> Hypocrea jecorina <400> 2 Met Gly Ile Gly Ser Tyr Phe Lys Ala Ser Thr Lys Asn Ala Glu Gln 1 5 10 15 Ala Pro Pro Ala Pro Pro Pro Ala Lys Leu Ala Pro Pro Pro Arg Leu 20 25 30 Gln Leu Glu Gly Arg Gln Ser Val Met Ser Glu Lys Pro Pro Ser Ser 35 40 45 Thr Ser Gly Asn Asp Val Asp Leu Gln Pro Pro Thr Pro Arg Phe His 50 55 60 Ser Arg Pro Gln Ser Ser Ser Gly Arg Ser Thr Pro Ser Thr Gln Ser 65 70 75 80 Ser Met Phe Leu Asp Asp Ile Lys His Glu Val Met Val Asn Tyr Leu 85 90 95 Tyr Gln Gln Gln Cys Ser Gln Leu Trp Val Ser Asp Gly Ser Gly Glu 100 105 110 Ile Glu Gly Val Leu Leu Arg Lys Ala Arg Gly His Tyr Met Ala Cys 115 120 125 Pro Pro Gln Leu Ala Ser Ser Pro Phe Ala Leu Ala Cys Ala Ala Leu 130 135 140 Asn Val Gln Cys Ala Met Thr Val Asn Ser Arg Val Ile Lys Thr Phe 145 150 155 160 Leu Gln Trp Ser Pro Asp Ala Val Asp Val Pro Leu Met Asn Gly Leu 165 170 175 Arg Val Gln Ile Leu Pro Thr Ile Asp Asp Leu Pro Arg Ala Arg Lys 180 185 190 Tyr Gln Phe Ala Ala Phe Val Ala Ser Glu Gly Leu Leu Val Val Trp 195 200 205 Asp Asp Asp Ala Leu His Leu Val Ala Arg Ala Lys Ala Ile Glu Ser 210 215 220 Glu Leu Met Glu Leu Val Trp Lys Ala Gly Asn Val Asp Glu Glu Gly 225 230 235 240 Gly Asp Glu Lys Gly Gly Gln Pro Val Thr Glu Val Glu Ile Asp Glu 245 250 255 Glu Ser Gly Glu Ile Lys Pro Glu Lys Arg Pro Ile His Leu Gln Asn 260 265 270 Thr Val Leu Val Ser Leu Thr Leu Ala Leu Val Thr Val Ser Leu Gly 275 280 285 Ala Ala Trp Arg Gln Leu Ala Ile Glu Val Ser Val Asp Ser Asn Tyr 290 295 300 Ile Arg Leu Ala Leu Val Ala Leu Ala Pro Val Gln Val Phe Phe Thr 305 310 315 320 Leu Phe Phe Ala Gln Val Ile Ile Gly Cys Leu Ala Gln Ile Phe Gly 325 330 335 Pro Ile Arg Gln Leu Thr Ile Asn Ser Lys Phe Tyr Ser Ala Arg Pro 340 345 350 Pro Pro Arg Leu Gln Ser Ala Val Leu Pro His Val Thr Ile Gln Cys 355 360 365 Pro Val Tyr Lys Glu Gly Leu Gln Gly Val Ile Met Pro Thr Val Lys 370 375 380 Ser Ile Lys Gln Ala Met Ser Thr Tyr Glu Leu Gln Gly Gly Ser Ala 385 390 395 400 Asn Met Phe Ile Asn Asp Asp Gly Leu Gln Leu Ile Ser Glu Glu Asp 405 410 415 Arg Leu Ala Arg Ile Glu Phe Tyr Ala Asp Asn Ser Ile Gly Trp Val 420 425 430 Ala Arg Pro Lys His Gly Glu Asn Gly Phe Thr Arg Lys Gly Lys Phe 435 440 445 Lys Lys Ala Ser Asn Met Asn Phe Ala Leu Met Ile Ser Cys Lys Val 450 455 460 Glu Glu Lys Leu Gln Ala Ile Glu Arg His Pro Gly Trp Ser Gln Asn 465 470 475 480 Asp Glu Ala Leu Ala Tyr Glu Glu Ala Leu Lys Glu Val Leu Glu Ala 485 490 495 Asp Gly Arg Ala Trp Ala Asp Gly Asn Ile Arg Met Gly Asp Tyr Ile 500 505 510 Leu Leu Ile Asp Ser Asp Thr Arg Val Pro Ala Asp Cys Leu Leu Asp 515 520 525 Ala Val Ser Glu Met Glu Gln Ser Pro Asp Val Gly Ile Met Gln Phe 530 535 540 Ser Ser Gly Val Met Gln Val Val His Thr Tyr Phe Glu Asn Gly Ile 545 550 555 560 Thr Phe Phe Thr Asn Leu Ile Tyr Ser Ala Ile Arg Tyr Thr Val Ser 565 570 575 Asn Gly Asp Val Ala Pro Phe Val Gly His Asn Ala Ile Leu Arg Trp 580 585 590 Ser Ala Ile Gln Gln Val Ala Tyr Gln Asp Glu Asp Gly Tyr Asp Lys 595 600 605 Phe Trp Ser Glu Ser His Val Ser Glu Asp Phe Asp Met Ser Leu Arg 610 615 620 Leu Gln Cys Asn Gly Tyr Ile Ile Arg Leu Ala Ala Trp Ala Gly Glu 625 630 635 640 Gly Phe Lys Glu Gly Val Ser Leu Thr Val Tyr Asp Glu Leu Ala Arg 645 650 655 Trp Glu Lys Tyr Ala Tyr Gly Cys Asn Glu Leu Leu Phe His Pro Ile 660 665 670 Arg Thr Trp Leu Trp Arg Gly Pro Phe Thr Pro Leu Phe Arg Arg Phe 675 680 685 Leu Phe Ser Asn Ile Arg Phe Thr Ser Lys Val Thr Val Ile Ser Tyr 690 695 700 Ile Gly Thr Tyr Tyr Ala Ile Gly Ala Ala Trp Ile Leu Thr Ala Val 705 710 715 720 Asn Tyr Phe Val Met Gly Trp Phe Asn Gly Tyr Leu Asp Lys Tyr Tyr 725 730 735 Val Asp Ser Trp Gln Val Trp Phe Ser Ile Ile Ile Val Phe Asn Gly 740 745 750 Leu Gly Asn Ile Ala Leu Ala Val Met Arg Tyr Arg Val Gly Glu Arg 755 760 765 Gly Leu Leu Tyr Ala Leu Phe Glu Asn Phe Met Trp Thr Leu Met Leu 770 775 780 Ala Ile Phe Leu Gly Gly Leu Ser Leu His Val Ser Gln Ala Leu Leu 785 790 795 800 Ala His Met Phe Glu Ile Asn Met Thr Trp Gly Ala Thr Ser Lys Glu 805 810 815 Ala Glu Phe Ser Asn Phe Phe Ile Glu Val Pro Lys Val Leu Lys Lys 820 825 830 Phe Lys Phe Ser Met Leu Phe Ser Leu Ile Phe Ile Ala Gly Met Ile 835 840 845 Ile Leu Ala Gln Ala Pro Phe Val Pro Phe Asp Trp Arg Ile Lys Asp 850 855 860 Phe Val Ala Ile Leu Pro Met Ala Thr Val Ala Ala Ser His Phe Leu 865 870 875 880 Leu Pro Leu Ala Leu Asn Pro Ala Leu Met Thr Phe Ser Trp 885 890 <210> 3 <211> 2765 <212> DNA <213> Hypocrea jecorina <400> 3 atgggtatcg gaagctactt caaggccagt accaaaaatg ctgagcaggc accgccagcg 60 ccgccgccgg ccaagctggc tcctcctcct cggttacagc tggaaggtcg gcagtcggta 120 atgtcggaga agccaccatc gtccacctcg ggcaacgacg tggatcttca gcctcccacc 180 cctaggtttc attcccgacc ccaatccagc tctggcaggt ctaccccttc aacgcagagc 240 tccatgttcc tcgacgacat caagcatgaa gtcatggtca actatctgta ccagcagcag 300 tgttctcagc tctgggtcag cgacgggtct ggggagatcg agggtgtcct gcttcgtaaa 360 gctcgaggcc actacatggc ctgtcccccc cagcttgcca gttctccctt tgcgctggca 420 tgcgctgctc tcaacgtgca gtgcgccatg acagtcaact cgcgtgtcat caagacgttt 480 ctgcaatggt cccctgacgc cgttgacgtg ccgctcatga acggcttgcg cgtgcagatt 540 ctccctacca ttgatgactt gccgcgagct cgcaagtacc agtttgctgc ctttgtcgcg 600 tctgagggcc tcctggttgt ctgggacgat gatgctcttc atttggtggc acgagccaag 660 gctatcgagt ccgagctcat ggagctggtg tggaaggccg gcaacgtaga cgaggaaggc 720 ggcgacgaga agggaggcca acctgtcact gaggttgaaa ttgatgaaga gagcggagag 780 atcaagcccg agaagcggcc cattcatctc caaaacaccg tcctcgtgtc tctgaccctg 840 gccttggtaa ccgtctctct tggcgccgcc tggagacagt tggccattga ggtttccgtg 900 gacagcaact acatccgtct tgccctcgtc gccctggctc cagtccaggt tttcttcacc 960 ctcttcttcg cccaggtcat tatcggctgc ttggctcaaa tctttggtcc catccgtcag 1020 ctcacaatca actccaagtt ctactctgcc cgacccccac cgcgcctgca gagtgccgtt 1080 cttcctcatg taaccatcca gtgccccgtc tacaaggaag gtctgcaggg tgtcatcatg 1140 ccgacggtca agtccatcaa gcaggccatg tccacgtacg agctccaggg cggttccgca 1200 aacatgttca tcaacgacga tggtttgcag ctcatctccg aagaggatcg tcttgctcgc 1260 atcgagttct acgccgacaa cagcatcggc tgggtcgctc gccccaagca cggagagaac 1320 ggcttcaccc gcaagggcaa gttcaagaag gcctccaaca tgaactttgc cctcatgatc 1380 tcatgcaagg tcgaggagaa gctgcaggca attgagcgtc accccggatg gagccagaat 1440 gacgaggcct tggcgtacga ggaagctctc aaggaagttc tcgaggccga tggccgtgcc 1500 tgggctgatg gtaacatccg catgggagac tacatcttgc tcatcgactc cgatacccgt 1560 gtccccgccg attgcctgct cgatgctgtt tccgagatgg agcagtcccc cgacgttggc 1620 atcatgcagt tctcctccgg cgtcatgcag gtcgtccaca cgtactttga gaacggcatc 1680 accttcttca ccaacctcat ttactctgcc atccgataca ccgtctccaa cggtgacgtc 1740 gcgccctttg tcggccacaa cgccatcctc cgctggtctg ccatccagca ggtcgcctac 1800 caggacgagg acggctacga caagttctgg tcggagagcc acgtctcgga agactttgac 1860 atgtcgctgc gtctgcagtg caacggctac atcatccgcc tggctgcctg ggctggagag 1920 ggtttcaagg agggcgtgtc gctgaccgtc tacgacgagc ttgcccggtg ggaaaagtac 1980 gcctacggct gcaacgagct cctgttccac cccattcgca cctggctctg gcgcggtccc 2040 tttacgccct tgttccgccg cttcctcttc tccaacattc gctttacgtc caaggtcacc 2100 gtcatctcct acatcggtac ctactacgcc atcggcgctg cctggatctt gaccgcggtc 2160 aactacttcg tcatgggctg gttcaacggc tacctggata agtactacgt cgactcgtgg 2220 caggtctggt tctccatcat catcgtcttc aacggcctcg gcaacattgc cctagccgtc 2280 atgcggtacc gcgtcggcga gcgcggtctg ctgtacgccc tgtttgagaa ctttatgtgg 2340 actctcatgc tggccatatt cctcggcggc ctgtcactgc acgtcagcca ggctctgctg 2400 gcgcacatgt ttgagattaa catgacatgg ggcgccaaaa gcaaggaggc cgagttttcc 2460 aactttttca tcgaggtgcc aaaggtcttg aagaaggtta gtcaccctcg tttcattcat 2520 ccatccatct taccatgctg cgcgaagact tcagtttgct gacaattctg ttgtagttca 2580 aattctccat gctcttctcg ttgatcttca tcgccggcat gattatcctc gcccaggcgc 2640 cctttgtccc ctttgattgg cgcatcaagg actttgtcgc catcctgcct atggccaccg 2700 tcgccgccag ccacttcctg ctgcccctgg ccctgaaccc tgccctcatg acgttctcat 2760 ggtaa 2765 <210> 4 <211> 894 <212> PRT <213> Hypocrea jecorina <400> 4 Met Gly Ile Gly Ser Tyr Phe Lys Ala Ser Thr Lys Asn Ala Glu Gln 1 5 10 15 Ala Pro Pro Ala Pro Pro Pro Ala Lys Leu Ala Pro Pro Pro Arg Leu 20 25 30 Gln Leu Glu Gly Arg Gln Ser Val Met Ser Glu Lys Pro Pro Ser Ser 35 40 45 Thr Ser Gly Asn Asp Val Asp Leu Gln Pro Pro Thr Pro Arg Phe His 50 55 60 Ser Arg Pro Gln Ser Ser Ser Gly Arg Ser Thr Pro Ser Thr Gln Ser 65 70 75 80 Ser Met Phe Leu Asp Asp Ile Lys His Glu Val Met Val Asn Tyr Leu 85 90 95 Tyr Gln Gln Gln Cys Ser Gln Leu Trp Val Ser Asp Gly Ser Gly Glu 100 105 110 Ile Glu Gly Val Leu Leu Arg Lys Ala Arg Gly His Tyr Met Ala Cys 115 120 125 Pro Pro Gln Leu Ala Ser Ser Pro Phe Ala Leu Ala Cys Ala Ala Leu 130 135 140 Asn Val Gln Cys Ala Met Thr Val Asn Ser Arg Val Ile Lys Thr Phe 145 150 155 160 Leu Gln Trp Ser Pro Asp Ala Val Asp Val Pro Leu Met Asn Gly Leu 165 170 175 Arg Val Gln Ile Leu Pro Thr Ile Asp Asp Leu Pro Arg Ala Arg Lys 180 185 190 Tyr Gln Phe Ala Ala Phe Val Ala Ser Glu Gly Leu Leu Val Val Trp 195 200 205 Asp Asp Asp Ala Leu His Leu Val Ala Arg Ala Lys Ala Ile Glu Ser 210 215 220 Glu Leu Met Glu Leu Val Trp Lys Ala Gly Asn Val Asp Glu Glu Gly 225 230 235 240 Gly Asp Glu Lys Gly Gly Gln Pro Val Thr Glu Val Glu Ile Asp Glu 245 250 255 Glu Ser Gly Glu Ile Lys Pro Glu Lys Arg Pro Ile His Leu Gln Asn 260 265 270 Thr Val Leu Val Ser Leu Thr Leu Ala Leu Val Thr Val Ser Leu Gly 275 280 285 Ala Ala Trp Arg Gln Leu Ala Ile Glu Val Ser Val Asp Ser Asn Tyr 290 295 300 Ile Arg Leu Ala Leu Val Ala Leu Ala Pro Val Gln Val Phe Phe Thr 305 310 315 320 Leu Phe Phe Ala Gln Val Ile Ile Gly Cys Leu Ala Gln Ile Phe Gly 325 330 335 Pro Ile Arg Gln Leu Thr Ile Asn Ser Lys Phe Tyr Ser Ala Arg Pro 340 345 350 Pro Pro Arg Leu Gln Ser Ala Val Leu Pro His Val Thr Ile Gln Cys 355 360 365 Pro Val Tyr Lys Glu Gly Leu Gln Gly Val Ile Met Pro Thr Val Lys 370 375 380 Ser Ile Lys Gln Ala Met Ser Thr Tyr Glu Leu Gln Gly Gly Ser Ala 385 390 395 400 Asn Met Phe Ile Asn Asp Asp Gly Leu Gln Leu Ile Ser Glu Glu Asp 405 410 415 Arg Leu Ala Arg Ile Glu Phe Tyr Ala Asp Asn Ser Ile Gly Trp Val 420 425 430 Ala Arg Pro Lys His Gly Glu Asn Gly Phe Thr Arg Lys Gly Lys Phe 435 440 445 Lys Lys Ala Ser Asn Met Asn Phe Ala Leu Met Ile Ser Cys Lys Val 450 455 460 Glu Glu Lys Leu Gln Ala Ile Glu Arg His Pro Gly Trp Ser Gln Asn 465 470 475 480 Asp Glu Ala Leu Ala Tyr Glu Glu Ala Leu Lys Glu Val Leu Glu Ala 485 490 495 Asp Gly Arg Ala Trp Ala Asp Gly Asn Ile Arg Met Gly Asp Tyr Ile 500 505 510 Leu Leu Ile Asp Ser Asp Thr Arg Val Pro Ala Asp Cys Leu Leu Asp 515 520 525 Ala Val Ser Glu Met Glu Gln Ser Pro Asp Val Gly Ile Met Gln Phe 530 535 540 Ser Ser Gly Val Met Gln Val Val His Thr Tyr Phe Glu Asn Gly Ile 545 550 555 560 Thr Phe Phe Thr Asn Leu Ile Tyr Ser Ala Ile Arg Tyr Thr Val Ser 565 570 575 Asn Gly Asp Val Ala Pro Phe Val Gly His Asn Ala Ile Leu Arg Trp 580 585 590 Ser Ala Ile Gln Gln Val Ala Tyr Gln Asp Glu Asp Gly Tyr Asp Lys 595 600 605 Phe Trp Ser Glu Ser His Val Ser Glu Asp Phe Asp Met Ser Leu Arg 610 615 620 Leu Gln Cys Asn Gly Tyr Ile Ile Arg Leu Ala Ala Trp Ala Gly Glu 625 630 635 640 Gly Phe Lys Glu Gly Val Ser Leu Thr Val Tyr Asp Glu Leu Ala Arg 645 650 655 Trp Glu Lys Tyr Ala Tyr Gly Cys Asn Glu Leu Leu Phe His Pro Ile 660 665 670 Arg Thr Trp Leu Trp Arg Gly Pro Phe Thr Pro Leu Phe Arg Arg Phe 675 680 685 Leu Phe Ser Asn Ile Arg Phe Thr Ser Lys Val Thr Val Ile Ser Tyr 690 695 700 Ile Gly Thr Tyr Tyr Ala Ile Gly Ala Ala Trp Ile Leu Thr Ala Val 705 710 715 720 Asn Tyr Phe Val Met Gly Trp Phe Asn Gly Tyr Leu Asp Lys Tyr Tyr 725 730 735 Val Asp Ser Trp Gln Val Trp Phe Ser Ile Ile Ile Val Phe Asn Gly 740 745 750 Leu Gly Asn Ile Ala Leu Ala Val Met Arg Tyr Arg Val Gly Glu Arg 755 760 765 Gly Leu Leu Tyr Ala Leu Phe Glu Asn Phe Met Trp Thr Leu Met Leu 770 775 780 Ala Ile Phe Leu Gly Gly Leu Ser Leu His Val Ser Gln Ala Leu Leu 785 790 795 800 Ala His Met Phe Glu Ile Asn Met Thr Trp Gly Ala Lys Ser Lys Glu 805 810 815 Ala Glu Phe Ser Asn Phe Phe Ile Glu Val Pro Lys Val Leu Lys Lys 820 825 830 Phe Lys Phe Ser Met Leu Phe Ser Leu Ile Phe Ile Ala Gly Met Ile 835 840 845 Ile Leu Ala Gln Ala Pro Phe Val Pro Phe Asp Trp Arg Ile Lys Asp 850 855 860 Phe Val Ala Ile Leu Pro Met Ala Thr Val Ala Ala Ser His Phe Leu 865 870 875 880 Leu Pro Leu Ala Leu Asn Pro Ala Leu Met Thr Phe Ser Trp 885 890 <210> 5 <211> 364 <212> PRT <213> Hypocrea jecorina <400> 5 Met Lys Gly Leu Ile Leu Val Gly Gly Phe Gly Thr Arg Leu Arg Pro 1 5 10 15 Leu Thr Leu Thr Leu Pro Lys Pro Leu Val Glu Phe Cys Asn Lys Pro 20 25 30 Met Ile Val His Gln Ile Glu Ala Leu Val Ala Ala Gly Val Thr Asp 35 40 45 Ile Val Leu Ala Val Asn Tyr Arg Pro Glu Ile Met Glu Lys Phe Leu 50 55 60 Ala Glu Tyr Glu Glu Lys Tyr Asn Ile Asn Ile Glu Phe Ser Val Glu 65 70 75 80 Ser Glu Pro Leu Asp Thr Ala Gly Pro Leu Lys Leu Ala Glu Arg Ile 85 90 95 Leu Gly Lys Asp Asp Ser Pro Phe Phe Val Leu Asn Ser Asp Val Ile 100 105 110 Cys Asp Tyr Pro Phe Lys Glu Leu Leu Glu Phe His Lys Ala His Gly 115 120 125 Asp Glu Gly Thr Ile Val Val Thr Lys Val Glu Glu Pro Ser Lys Tyr 130 135 140 Gly Val Val Val His Lys Pro Asn His Pro Ser Arg Ile Asp Arg Phe 145 150 155 160 Val Glu Lys Pro Val Glu Phe Val Gly Asn Arg Ile Asn Ala Gly Met 165 170 175 Tyr Ile Phe Asn Pro Ser Val Leu Lys Arg Ile Glu Leu Arg Pro Thr 180 185 190 Ser Ile Glu Lys Glu Thr Phe Pro Ala Met Val Ala Asp Asn Gln Leu 195 200 205 His Ser Phe Asp Leu Glu Gly Phe Trp Met Asp Val Gly Gln Pro Lys 210 215 220 Asp Phe Leu Ser Gly Thr Cys Leu Tyr Leu Ser Ser Leu Thr Lys Lys 225 230 235 240 Gly Ser Lys Glu Leu Thr Pro Pro Thr Glu Pro Tyr Val His Gly Gly 245 250 255 Asn Val Met Ile His Pro Ser Ala Lys Ile Gly Lys Asn Cys Arg Ile 260 265 270 Gly Pro Asn Val Thr Ile Gly Pro Asp Val Val Val Gly Asp Gly Val 275 280 285 Arg Leu Gln Arg Cys Val Leu Leu Lys Gly Ser Lys Val Lys Asp His 290 295 300 Ala Trp Val Lys Ser Thr Ile Val Gly Trp Asn Ser Thr Val Gly Arg 305 310 315 320 Trp Ala Arg Leu Glu Asn Val Thr Val Leu Gly Asp Asp Val Thr Ile 325 330 335 Gly Asp Glu Ile Tyr Val Asn Gly Gly Ser Val Leu Pro His Lys Ser 340 345 350 Ile Lys Ala Asn Val Asp Val Pro Ala Ile Ile Met 355 360 <210> 6 <211> 534 <212> PRT <213> Hypocrea jecorina <400> 6 Met Asp Gly Met Met Ser Gln Pro Met Gly Gln Gln Ala Phe Tyr Phe 1 5 10 15 Tyr Asn His Glu His Lys Met Ser Pro Arg Gln Val Ile Phe Ala Gln 20 25 30 Gln Met Ala Ala Tyr Gln Met Met Pro Ser Leu Pro Pro Thr Pro Met 35 40 45 Tyr Ser Arg Pro Asn Ser Ser Cys Ser Gln Pro Pro Thr Leu Tyr Ser 50 55 60 Asn Gly Pro Ser Val Met Thr Pro Thr Ser Thr Pro Pro Leu Ser Ser 65 70 75 80 Arg Lys Pro Met Leu Val Asp Thr Glu Phe Gly Asp Asn Pro Tyr Phe 85 90 95 Pro Ser Thr Pro Pro Leu Ser Ala Ser Gly Ser Thr Val Gly Ser Pro 100 105 110 Lys Ala Cys Asp Met Leu Gln Thr Pro Met Asn Pro Met Phe Ser Gly 115 120 125 Leu Glu Gly Ile Ala Ile Lys Asp Ser Ile Asp Ala Thr Glu Ser Leu 130 135 140 Val Leu Asp Trp Ala Ser Ile Ala Ser Pro Pro Leu Ser Pro Val Tyr 145 150 155 160 Leu Gln Ser Gln Thr Ser Ser Gly Lys Val Pro Ser Leu Thr Ser Ser 165 170 175 Pro Ser Asp Met Leu Ser Thr Thr Ala Ser Cys Pro Ser Leu Ser Pro 180 185 190 Ser Pro Thr Pro Tyr Ala Arg Ser Val Thr Ser Glu His Asp Val Asp 195 200 205 Phe Cys Asp Pro Arg Asn Leu Thr Val Ser Val Gly Ser Asn Pro Thr 210 215 220 Leu Ala Pro Glu Phe Thr Leu Leu Ala Asp Asp Ile Lys Gly Glu Pro 225 230 235 240 Leu Pro Thr Ala Ala Gln Pro Ser Phe Asp Phe Asn Pro Ala Leu Pro 245 250 255 Ser Gly Leu Pro Thr Phe Glu Asp Phe Ser Asp Leu Glu Ser Glu Ala 260 265 270 Asp Phe Ser Ser Leu Val Asn Leu Gly Glu Ile Asn Pro Val Asp Ile 275 280 285 Ser Arg Pro Arg Ala Cys Thr Gly Ser Ser Val Val Ser Leu Gly His 290 295 300 Gly Ser Phe Ile Gly Asp Glu Asp Leu Ser Phe Asp Asp Glu Ala Phe 305 310 315 320 His Phe Pro Ser Leu Pro Ser Pro Thr Ser Ser Val Asp Phe Cys Asp 325 330 335 Val His Gln Asp Lys Arg Gln Lys Lys Asp Arg Lys Glu Ala Lys Pro 340 345 350 Val Met Asn Ser Ala Ala Gly Gly Ser Gln Ser Gly Asn Glu Gln Ala 355 360 365 Gly Ala Thr Glu Ala Ala Ser Ala Ala Ser Asp Ser Asn Ala Ser Ser 370 375 380 Ala Ser Asp Glu Pro Ser Ser Ser Met Pro Ala Pro Thr Asn Arg Arg 385 390 395 400 Gly Arg Lys Gln Ser Leu Thr Glu Asp Pro Ser Lys Thr Phe Val Cys 405 410 415 Asp Leu Cys Asn Arg Arg Phe Arg Arg Gln Glu His Leu Lys Arg His 420 425 430 Tyr Arg Ser Leu His Thr Gln Glu Lys Pro Phe Glu Cys Asn Glu Cys 435 440 445 Gly Lys Lys Phe Ser Arg Ser Asp Asn Leu Ala Gln His Ala Arg Thr 450 455 460 His Ser Gly Gly Ala Ile Val Met Asn Leu Ile Glu Glu Ser Ser Glu 465 470 475 480 Val Pro Ala Tyr Asp Gly Ser Met Met Ala Gly Pro Val Gly Asp Asp 485 490 495 Tyr Ser Thr Tyr Gly Lys Val Leu Phe Gln Ile Ala Ser Glu Ile Pro 500 505 510 Gly Ser Ala Ser Glu Leu Ser Ser Glu Glu Gly Glu Gln Gly Lys Lys 515 520 525 Lys Arg Lys Arg Ser Asp 530 <210> 7 <211> 1042 <212> PRT <213> Hypocrea jecorina <400> 7 Met Asp Tyr Thr Gln Tyr His Ala Leu Gly His Gly Glu Val Leu Asp 1 5 10 15 Pro Asn Asp Pro Asn Lys Thr Ser Ala Pro Ala Ala Pro Gln Phe Gln 20 25 30 Pro Pro Ser Ser Pro Tyr Val Pro Pro Gly Ser Pro Tyr Gly Ala Pro 35 40 45 Pro Tyr His Gly Gly His Gln Ala Pro Pro Met Ala Met Pro Pro Pro 50 55 60 Ser Thr Pro Gly Tyr Gly Pro Pro Gln Gly Gln Ser Phe Pro Gly Ser 65 70 75 80 Pro Met Pro Ser Gln Asp Ala Gly Leu Ala Ala Gln Phe Gly Gly Met 85 90 95 Ser Leu Gly Ala Asp Ala Gly Gly Ala Ala Ala Arg Lys Lys Lys Lys 100 105 110 Asp Arg His Ala Tyr His Ser Val Glu Pro Thr Gly Ser Ser Gln Ala 115 120 125 Phe Asn Gly Leu Pro Pro Gly Thr Pro Ala Glu Gln Phe Leu Asn Val 130 135 140 Asn Asn Pro Gln Gly Ile Pro Ala Leu Gly Gly Gln Phe Gly Ser Pro 145 150 155 160 Leu Ala Ser Pro Met Gly Thr Pro His Met Ala Asn Pro Gly Gln Phe 165 170 175 Pro Ala Pro Thr Ser Pro Phe Thr Pro Ser Ala Pro Val Ser Pro Ala 180 185 190 Glu Phe Ala Ser Arg Phe Gly Ser Pro Asp Ala Ala Thr Ser Ile Gly 195 200 205 Ser Ala Gly Pro Ser Gln Val Ser Pro Asp Asp Met Pro Ser Ile Pro 210 215 220 Ala Ser Arg Asp Ala Ile Gln Glu His Phe Phe Lys Asn Val Tyr Pro 225 230 235 240 Thr Phe Glu Arg His Val Pro Pro Pro Ala Thr Val Ser Phe Val Ala 245 250 255 Phe Asp Gln Gly Asn Ala Ser Pro Lys Phe Thr Arg Leu Thr Leu Asn 260 265 270 Asn Ile Pro Thr Thr Ala Glu Gly Leu His Ala Thr Gly Leu Pro Leu 275 280 285 Gly Met Leu Ile Gln Pro Leu Ala Pro Leu Gln Ala Gly Glu Ala Glu 290 295 300 Ile Pro Val Leu Asp Phe Gly Asp Ala Gly Pro Pro Arg Cys Arg Arg 305 310 315 320 Cys Arg Ala Tyr Ile Asn Pro Phe Met Met Phe Arg Ser Gly Gly Asn 325 330 335 Lys Phe Val Cys Asn Leu Cys Ser Tyr Pro Asn Glu Thr Pro Pro Glu 340 345 350 Tyr Phe Cys Ala Val Ser Pro Gln Gly Val Arg Leu Asp Arg Asp Gln 355 360 365 Arg Pro Glu Leu His Arg Gly Thr Val Glu Phe Val Val Pro Lys Glu 370 375 380 Tyr Trp Thr Arg Glu Pro Val Gly Leu Arg Trp Leu Phe Val Ile Asp 385 390 395 400 Val Thr Gln Glu Ser Tyr Asn Lys Gly Phe Met Glu Thr Phe Cys Glu 405 410 415 Gly Ile Leu Ala Ala Leu Tyr Gly Gly Asn Asp Glu Glu Asn Asp Glu 420 425 430 Asp Gly Glu Pro Lys Arg Arg Ile Pro Lys Gly Ala Lys Val Gly Phe 435 440 445 Ile Thr Tyr Asp Lys Asp Ile His Phe Tyr Asn Ile Asn Pro His Leu 450 455 460 Asp Gln Ala His Met Met Ile Met Pro Asp Leu Glu Asp Pro Phe Leu 465 470 475 480 Pro Leu Gly Glu Gly Leu Phe Val Asp Pro Tyr Glu Ser Lys Ala Ile 485 490 495 Ile Thr Ser Leu Leu Thr Arg Leu Pro Glu Met Phe Ser Thr Ile Lys 500 505 510 Asn Pro Glu Pro Ala Leu Leu Ala Thr Leu Asn Ala Ala Val Ala Ala 515 520 525 Leu Glu Ala Thr Gly Gly Lys Val Val Cys Ser Cys Ser Thr Leu Pro 530 535 540 Thr Trp Gly Pro Gly Arg Leu Phe Met Arg Asp Asp Gly Asn His Pro 545 550 555 560 Gly Gly Glu Leu Asp Lys Lys Leu Tyr Thr Thr Glu His Pro Ala Trp 565 570 575 Lys Lys Val Ser Glu Lys Met Ala Ser Ser Gly Ile Gly Val Asp Phe 580 585 590 Phe Leu Ala Ala Pro Ser Gly Gly Tyr Leu Asp Ile Ala Thr Ile Gly 595 600 605 His Val Ala Ala Thr Thr Gly Gly Glu Thr Phe Tyr Tyr Pro Asn Phe 610 615 620 Ile Ala Pro Arg Asp Gly Ala Arg Leu Ser Met Glu Ile Thr His Ala 625 630 635 640 Ile Thr Arg Glu Thr Gly Phe Gln Ala Leu Met Lys Val Arg Cys Ser 645 650 655 Thr Gly Leu Gln Val Ala Ala Tyr His Gly Asn Phe Val Gln His Thr 660 665 670 Phe Gly Ala Asp Leu Glu Ile Gly Val Ile Asp Ala Asp Lys Ala Leu 675 680 685 Gly Val Ser Phe Ser His Asp Gly Lys Leu Asp Pro Lys Leu Asp Ala 690 695 700 His Phe Gln Thr Ala Leu Leu Tyr Thr Thr Ala Ser Gly Gln Arg Arg 705 710 715 720 Val Arg Cys Ser Asn Val Ile Ala Ser Val Ser Asp Thr Ser Lys Glu 725 730 735 Ser Asn Thr Lys Glu Leu Ala Ile Arg Gln Cys Leu Lys Phe Val Asp 740 745 750 Gln Asp Ala Val Val Gly Ile Phe Ala Lys Glu Ala Ser Thr Lys Leu 755 760 765 Ala Thr Thr Ser Ala Asn Leu Gln Asp Val Arg Asn Trp Leu Thr Glu 770 775 780 Arg Thr Ile Asp Ile Met Ala Tyr Tyr Lys Lys His Ser Ala Asn Gln 785 790 795 800 Phe Pro Pro Ser Gln Leu Val Met Pro Glu Arg Leu Lys Glu Phe Cys 805 810 815 Met Tyr Met Leu Gly Met Leu Lys Cys Arg Ala Phe Lys Gly Gly Ile 820 825 830 Glu Asn Ser Asp Arg Arg Val His Glu Leu Arg Met Val Arg Ser Met 835 840 845 Gly Pro Leu Glu Leu Ser Leu Tyr Leu Tyr Pro Arg Met Ile Ala Leu 850 855 860 His Asn Leu Gln Pro Glu Glu Gly Phe Ala Asp Pro Glu Thr Gly His 865 870 875 880 Leu Lys Met Pro Pro Ser Val Arg Thr Ser Phe Ser Arg Val Glu Pro 885 890 895 Gly Gly Val Tyr Leu Val Asp Asn Gly Gln Gln Cys Leu Leu Trp Phe 900 905 910 His Ala Gln Thr Ser Pro Asn Leu Ile Thr Asp Leu Phe Gly Glu Gly 915 920 925 His Asp Ser Leu Lys Gly Leu Asp Pro Tyr Thr Ser Thr Leu Pro Val 930 935 940 Leu Glu Thr His Leu Ser Ala Gln Val Arg Asn Ile Ile Glu Phe Leu 945 950 955 960 Lys Ser Met Arg Gly Ser Lys Gly Met Thr Ile Gln Leu Ala Arg Gln 965 970 975 Gly Ile Asp Gly Ala Glu Tyr Glu Phe Ala Arg Met Leu Val Glu Asp 980 985 990 Arg Asn Asn Glu Ala Lys Ser Tyr Val Asp Trp Leu Val His Ile His 995 1000 1005 Arg Gly Val Gln Leu Glu Leu Ser Gly Gln Arg Lys Lys Glu Gly Asp 1010 1015 1020 Gly Glu Ala Thr Ala Val Met Ala Asn Phe Ala Gly Leu Arg Pro Ala 1025 1030 1035 1040 Tyr Trp <210> 8 <211> 668 <212> PRT <213> Hypocrea jecorina <400> 8 Arg Gly Arg Ser Pro Ser Ala Gly Gly Phe Gln Ser Asp Ile Asn Gln 1 5 10 15 Ser His Ser Pro Ala Arg Ser Pro Leu Ala Pro Thr Asn Glu Gln Pro 20 25 30 Ser Ala Gly Leu Gly Val Gly Leu Gly Gln Gln Gln Gln Arg Ala Phe 35 40 45 Ala Ala Pro Leu His Pro Asn Tyr Asp Ser Phe Gly Ala Asn Gly Phe 50 55 60 Leu Gly Ala Gln Ala Asn Ala Val Asp Pro Thr Asn Gly Phe Asp Pro 65 70 75 80 Ser Ala Ser Phe Gly Gln Gln Pro Ala Thr Gly Pro Asp Ser Thr Leu 85 90 95 Ser Leu Asn Ala Gln Ala Gln His Asn Tyr Leu Ser Pro Asn Leu His 100 105 110 Asp Gly Asp Phe Ser Leu Phe Pro Ser Ala Ala Glu Gln Gly Asp Gln 115 120 125 Tyr Asn Ala Pro Leu Phe Glu Gln Pro Pro Leu Gly Asp Leu Asn Ala 130 135 140 Met Thr Ser Pro His Ser His Gln Ser Pro Thr Pro Pro Gln Leu Phe 145 150 155 160 Gln Pro Asp Ser Leu Gln Ser Pro Pro Phe Asn Arg His Gln Phe Ser 165 170 175 Ser Pro Pro Thr His Ser Arg Asn Ala Ser Leu Gly Pro Glu Ala Ala 180 185 190 Leu Leu Pro Ser Gln Ile Gly Asp Trp Thr Gln Pro Gln Phe Gln Gly 195 200 205 His Arg Arg Thr Pro Ser Glu Tyr Ser Asp Val Ser Ser Val Ala Pro 210 215 220 Ser Pro His Leu Val Ser Ser Asp Thr Phe Asp Ala Asp Gln Ser Gly 225 230 235 240 His Ser Pro Leu Gln Arg Pro Ala Asp Val Ser Leu Tyr Gln Glu Val 245 250 255 Leu Gly Ile Gly Ser Phe Ser Leu Ala Asp His Gly Ser Pro Gly Tyr 260 265 270 His Gly Arg Ser Pro Ser His Ser Pro Ala Ile Ser Pro Arg Ile Met 275 280 285 Pro Gln Gln Met Pro Asp Thr Met Gln Pro Ser Phe Asn Leu Ile Pro 290 295 300 Pro Asn Gly Gly Phe Asp Gly Val Ser Gly Tyr Pro Asp Leu Gln Pro 305 310 315 320 Ser His Glu Ser Phe Pro Ser Leu Ser Gly Gly Met Gly Gly Asp Met 325 330 335 His Gln Met Ala Pro Pro Ala Ile Asn Ile Asp Phe Ala Pro Thr Asn 340 345 350 Ser Arg Gln Gly Ser Phe Glu Pro Pro Lys Ser Gln Met Asp Gln Asp 355 360 365 Ser Leu Thr Pro Pro Glu Arg Gly Arg Pro Lys Ser Arg Pro Arg Ala 370 375 380 Val Thr Asp Pro Phe His Pro Gly Ser Gly Ile Leu Pro Pro Gly Asn 385 390 395 400 Leu Gly Ser Ser Leu Gly Val Asp Leu Ala Ala Arg Ser Asp Thr Ala 405 410 415 Ser Arg Ser Leu Ser Pro Leu Asp Arg Ser Gly Thr Ser Ser Pro Ala 420 425 430 Ser Arg Arg Arg Gln Ser Thr Ser Ser Val Pro Asn Asn Val Ile Ala 435 440 445 Leu Arg Leu Ala Asp Pro Glu Tyr Gln Asn Ser Gln Glu Ala Gly Thr 450 455 460 Ser Lys Arg Met Gln Lys His Pro Ala Thr Phe Gln Cys Thr Leu Cys 465 470 475 480 Pro Lys Arg Phe Thr Arg Ala Tyr Asn Leu Arg Ser His Leu Arg Thr 485 490 495 His Thr Asp Glu Arg Pro Phe Val Cys Thr Val Cys Gly Lys Ala Phe 500 505 510 Ala Arg Gln His Asp Arg Lys Arg His Glu Ser Leu His Ser Gly Glu 515 520 525 Lys Lys Phe Val Cys Lys Gly Asp Leu Lys Thr Gly Gly Gln Trp Gly 530 535 540 Cys Gly Arg Arg Phe Ala Arg Ala Asp Ala Leu Gly Arg His Phe Arg 545 550 555 560 Ser Glu Ala Gly Arg Ile Cys Ile Lys Pro Leu Leu Asp Glu Glu Met 565 570 575 Val Glu Arg Gln Arg Gln Trp Gln Glu Gln Arg Met Gln Gln Asn Met 580 585 590 Ala Gln Asn Met Ala Asn Pro Gln Val Met Gly Met Asp Ala Gly Pro 595 600 605 Ala Tyr Pro Met Asp Ala Ser Gly Asn Tyr Thr Leu Pro Gln Ala Leu 610 615 620 Leu Ala Gln Tyr Pro Ala Leu Ala Gln Met Asn Trp Ser Ala Thr Asp 625 630 635 640 Met Gly Gly Gly Leu Asp Asp Glu Leu Ser Gly Arg Ser Ser Phe Asp 645 650 655 Ala Ser Asp Tyr Asp Asp Gly Asp Asp Gly Gly Tyr 660 665 <210> 9 <211> 540 <212> PRT <213> Hypocrea jecorina <400> 9 Met Ser Leu Ser Lys Leu Ser Val Ser Leu Leu Ala Leu Ala Gly Ser 1 5 10 15 Ala Ile Ala Gly Asp Leu Pro Ser Ile Thr Ala Lys Gly Ser Lys Phe 20 25 30 Phe Tyr Pro Asn Gly Thr Gln Phe Phe Ile Lys Gly Val Ala Tyr Gln 35 40 45 Gln Asp Val Gly Gln Ala Gly Ser Thr Asp Ser Ser Thr Ser Thr Phe 50 55 60 Ile Asp Pro Leu Ser Ser Glu Ala Asn Cys Lys Arg Asp Val Pro Leu 65 70 75 80 Leu Lys Gln Leu Gly Thr Asn Val Ile Arg Thr Tyr Ala Ile Asp Pro 85 90 95 Lys Ala Asp His Ser Ala Cys Met Lys Leu Leu Asn Asp Ala Gly Ile 100 105 110 Tyr Val Phe Ser Asp Leu Gly Glu Pro Ser Leu Ser Ile Asn Arg Asp 115 120 125 Thr Pro Ala Trp Asn Thr Glu Leu Phe Asp Arg Tyr Lys Ala Val Val 130 135 140 Asp Glu Met Ser Gln Tyr Pro Asn Val Ile Gly Tyr Phe Ala Gly Asn 145 150 155 160 Glu Val Ser Asn Ala Lys Asn Asn Thr Gly Ala Ser Ala Tyr Val Lys 165 170 175 Ala Ala Val Arg Asp Thr Lys Ala Tyr Ile Lys Ser Lys Lys Tyr Arg 180 185 190 Trp Gln Gly Val Gly Tyr Ala Ala Asn Asp Asp Val Asp Ile Arg Ala 195 200 205 Glu Ile Ala Asp Tyr Phe Asn Cys Gly Asp Gln Asp Glu Ala Ile Asp 210 215 220 Phe Trp Gly Tyr Asn Ile Tyr Ser Trp Cys Gly Gln Ser Ser Met Gln 225 230 235 240 Lys Ser Gly Tyr Asp Glu Gln Thr Thr Phe Phe Ser Asn Tyr Ser Val 245 250 255 Pro Val Phe Phe Ala Glu Tyr Gly Cys Asn Leu Pro Ser Gly Ala Ala 260 265 270 Ala Arg Ile Phe Gln Glu Thr Ala Ala Leu Tyr Ser Asp Glu Met Thr 275 280 285 Lys Val Phe Ser Gly Gly Ile Val Tyr Met Tyr Phe Glu Glu Asp Asn 290 295 300 Asp Tyr Gly Leu Val Lys Val Asn Asn Gly Ala Val Ser Lys Leu Lys 305 310 315 320 Asp Phe Ser Ala Leu Gln Thr Gln Val Thr Lys Ala Asp Pro Lys Gly 325 330 335 Val Asp Ala Asp Asp Tyr Lys Pro Thr Asn Lys Pro Ala Ser Cys Pro 340 345 350 Ala Leu Thr Asp Asp Trp Gln Ala Ile Asn Ser Leu Pro Pro Thr Pro 355 360 365 Asp Ala Ser Leu Cys Thr Cys Met Gln Ser Ser Leu Ser Cys Val His 370 375 380 Ala Asp Asp Leu Asp Thr Lys Asp Phe Gly Asp Ile Phe Gly Phe Ile 385 390 395 400 Cys Gly Lys Ser Pro Glu Val Cys Ala Gly Ile Asn Gly Asp Pro Ser 405 410 415 Thr Gly Val Tyr Gly Ala Tyr Ser Met Cys Glu Asp Ala Ala Lys Leu 420 425 430 Asp Tyr Val Leu Asp Ala Tyr Tyr Gln Ser Gln Lys Lys Ala Ser Thr 435 440 445 Ala Cys Asp Phe Asn Gly Gln Ala Gln Val Val Ser Pro Lys Ala Ala 450 455 460 Ser Thr Cys Ser Ala Ala Leu Ala Ser Ala Ser Ala Ile Asn Lys Gln 465 470 475 480 Ala Ala Thr Ala Thr Ala Pro Val Gly Ala Gly Ser Thr Ser Gly Ser 485 490 495 Lys Gly Ala Ala Thr Ser Thr Asn Ala Ala Val Ala Gly Arg Pro Val 500 505 510 Ser His Leu Leu Ser Met Gly Glu Ile Ser Val Ala Leu Tyr Met Gly 515 520 525 Val Ala Met Leu Ala Gly Gly Ala Met Ile Val Leu 530 535 540 <210> 10 <211> 874 <212> PRT <213> Hypocrea jecorina <400> 10 Met Ala Arg Arg Glu Ser Leu Ser Glu Ile Arg Ala Ala Asn Pro Glu 1 5 10 15 Leu Phe Leu Thr Gly Asn Ile Ile Ser Ala Thr Phe Asn Ile Pro His 20 25 30 Ala Val Thr Tyr His Lys Gly Gly Ala Trp Asp Leu Lys Pro Arg Arg 35 40 45 Gly Gln Ser Ala Leu Ile Asp Ser Phe Ala Tyr Leu Ser Ser Asp Ala 50 55 60 Thr Pro Trp Asn His Thr Val Val Ala Trp Thr Gly Glu Ile Ala Asn 65 70 75 80 Pro Asp Asn Asp Pro Leu Ser Pro Pro Asp Thr Pro Ser Ala Ala Ala 85 90 95 Thr Thr Ile Gly Ala Ala Asn Ser Leu Ser Ala Pro Val Pro Ile Asp 100 105 110 Ala Thr Thr Arg Leu Pro Thr Pro Pro Pro Val Asp Gly Leu Trp Ile 115 120 125 Pro Lys Ala Asp Gln Thr Arg Leu Glu His Gln Leu Ser His Ser Thr 130 135 140 Thr Ile Arg Thr Val Pro Val Trp Leu Ala Asp Gln Ser Glu Ala Thr 145 150 155 160 Asp Asp Gly Ile Met Leu Lys Asp Gln Ala Arg Trp Arg Arg Tyr Ala 165 170 175 Glu His Asp Leu Tyr Thr Leu Phe His Tyr Lys Gln His Glu Pro Thr 180 185 190 Asp Gly Arg Lys Glu Arg Ala Gln Trp Ala Asp Tyr Tyr Arg Met Asn 195 200 205 Gln Lys Phe Ala Asn Lys Ile Ile Glu Ile Tyr Lys Pro Gly Asp Val 210 215 220 Val Ile Val His Asp Tyr Tyr Leu Met Leu Leu Pro Ser Met Leu Arg 225 230 235 240 Gln Arg Ala Pro Lys Met Tyr Ile Ser Phe Phe Leu His Ser Pro Phe 245 250 255 Pro Ser Ser Glu Phe Leu Arg Cys Leu Pro Arg Arg Lys Glu Val Leu 260 265 270 Glu Gly Val Leu Gly Ala Asn Leu Val Gly Phe Gln Ser Tyr Ser Tyr 275 280 285 Ser Arg His Phe Leu Ser Cys Cys Thr Arg Ile Leu Gly Phe Pro Ser 290 295 300 Asp Thr Leu Gly Ile Asp Ala Tyr Gly Ser Arg Val Gln Val Gly Val 305 310 315 320 Phe Pro Ile Gly Ile Asp Ala Ala Lys Val Glu Thr Ala Ala Trp Ala 325 330 335 Asp Thr Val Asn Glu Lys His Ala Ala Val Leu Lys Met Tyr Glu Gly 340 345 350 Lys Lys Ile Ile Val Gly Arg Asp Arg Leu Asp Ser Val Arg Gly Val 355 360 365 Ala Gln Lys Leu Gln Ala Phe Glu Arg Phe Leu Glu Leu Tyr Pro His 370 375 380 Trp Arg Glu Lys Val Val Leu Ile Gln Val Thr Ser Pro Thr Ser Ile 385 390 395 400 Glu Ala Glu Lys Gly Asp Pro Glu Asn Lys Asn Ala Ser Arg Val Asn 405 410 415 Glu Leu Ile Thr Lys Ile Asn Gly Glu Tyr Gly Ser Leu Gly Phe Ser 420 425 430 Pro Val Gln His Tyr Pro Gln Tyr Leu Ser Gln Ala Glu Tyr Phe Ala 435 440 445 Leu Leu Arg Ala Ala Asp Ile Gly Leu Ile Thr Ser Val Arg Asp Gly 450 455 460 Met Asn Thr Thr Ser Leu Glu Tyr Val Val Cys Gln Lys Asp Ser Asn 465 470 475 480 Gly Pro Leu Ile Leu Ser Glu Phe Ser Gly Thr Ala Gly Ser Leu Arg 485 490 495 Asp Ala Ile His Ile Asn Pro Trp Asp Leu Thr Gly Val Ala Glu Lys 500 505 510 Ile Asn Ala Ala Leu Glu Met Ser Glu Glu Glu Arg Val Lys Met Gln 515 520 525 Thr Ser Leu Tyr Thr His Val Thr Thr Gln Asn Val Gln Ser Trp Ile 530 535 540 Thr Lys Phe Ile Arg Lys Phe His Ala Ala Leu Ser Glu Thr Asn Ser 545 550 555 560 Val Thr Ser Thr Pro Leu Leu Asp Arg Ala Leu Leu Leu Ser Arg Tyr 565 570 575 Arg Ala Ala Lys Lys Arg Leu Phe Met Phe Asp Tyr Asp Gly Thr Leu 580 585 590 Thr Pro Ile Val Arg Glu Pro Ser Ala Ala Val Pro Ser Glu Arg Ile 595 600 605 Ile Arg Tyr Leu Gln Ser Leu Ala Ser Asp Pro Arg Asn Ala Val Trp 610 615 620 Ile Ile Ser Gly Arg Asp Gln Glu Phe Leu Gln Gln His Leu Gly His 625 630 635 640 Ile Pro Arg Ile Gly Phe Ser Ala Glu His Gly Ser Phe Met Arg Asp 645 650 655 Pro Gly Ser Asp Glu Trp Val Asn Leu Ala Glu Lys Phe Asp Met Gly 660 665 670 Trp Gln Ala Glu Val Met Glu Val Phe Gln Arg Tyr Thr Asp Lys Val 675 680 685 Pro Gly Ser Phe Ile Glu Arg Lys Arg Cys Ala Leu Thr Trp His Tyr 690 695 700 Arg Leu Ala Glu Pro Glu Gln Gly Leu His Met Ser Arg Glu Cys His 705 710 715 720 Arg Glu Leu Glu Thr Gly Ile Ala Gln Arg Trp Glu Val Glu Val Met 725 730 735 Pro Gly Lys Ala Asn Ile Glu Val Arg Pro Thr Phe Ile Asn Lys Gly 740 745 750 Glu Ile Ala Lys Arg Leu Val Ala Thr Tyr His Asn Pro Gly Ala Ala 755 760 765 Pro Thr Asp Lys Asp Pro Tyr Pro Gly Lys Ile Glu Phe Ala Leu Cys 770 775 780 Ser Gly Asp Asp Phe Thr Asp Glu Asp Met Phe Arg Ser Leu Asn Gly 785 790 795 800 Ala Cys Gly Thr Ile Leu Glu Asp Gln His Val Phe Thr Val Thr Val 805 810 815 Gly Ala Ser Thr Lys Val Thr Leu Ala Lys Trp His Leu Leu Glu Pro 820 825 830 Glu Asp Val Ile Glu Cys Val Gly Leu Leu Ala Gly Ala Gly Asp Pro 835 840 845 Ala Ser Leu Glu Arg Val Gly Glu Val Asn Leu Ala Ala Leu Ser Gln 850 855 860 Val Glu Gly His Ile Pro Ala Glu Glu Leu 865 870 <210> 11 <211> 997 <212> PRT <213> Aspergillus clavatus <400> 11 Met Thr Met Leu Ser Pro Thr Ser Asp His Pro Gln Gly Ala Ser Met 1 5 10 15 Lys Asp Ile Glu Asn Pro Gly Asn Asp Ser Pro Ala Leu Glu Gly Ser 20 25 30 Thr Gln Ala Glu Lys Thr Val Asp Asn Pro Ser Arg Ser Pro Thr Pro 35 40 45 Gln Leu Gln Thr Ala Glu Leu Ala Gln Val Leu Ser Pro Leu Ala Val 50 55 60 Arg Gln Thr Gln Ser Ile Ser Thr Arg Ser Gln His Asn Arg Leu Glu 65 70 75 80 Tyr Leu Cys Leu Pro Asn Ala Thr Asn Arg Gly Lys Leu Ser Arg Ser 85 90 95 Leu Ala Arg Arg Ala Thr Leu Leu Gly Trp Phe Asp Gln Ala Ala Thr 100 105 110 Gln Ser Gly Gln Glu Ser Gln Ser Ser Val Cys Val Ala Val Lys Leu 115 120 125 Pro Asp Asp Gly Tyr Ser Phe Ser Pro Ser Asn Ile Thr Pro Ala Leu 130 135 140 Ser Lys Ala Ile Thr Arg Leu Asn Glu Met Ala Val Val Ala Leu Ser 145 150 155 160 Ser Arg Val Val Asp Lys Gly Leu Ser Gly Ile Leu Pro Gly Gln Lys 165 170 175 Ser Phe Leu Val Glu Ser Thr Ser Thr Arg Ile Pro Ile Val Ala Thr 180 185 190 Leu Asp Asp Val Glu Pro Thr Leu Ala His Tyr Ser Arg Ala Cys Ile 195 200 205 Val Met Glu Gln Lys Ile Val Leu Val Trp Ser His Asp Thr Ala Gly 210 215 220 Ile Leu Asn Val Ala Tyr Asp Val Glu Thr Gln Leu Gly Gly Gln Ser 225 230 235 240 Pro Lys Ile Ser Asn Ala Thr Thr Pro Arg Ile Ser Gly Arg Ser Thr 245 250 255 Pro Met Asp Pro Tyr Arg Thr Asp Asp Leu Gln Lys Pro Ala Asn Val 260 265 270 Leu Gln Pro Val Arg Gly Ala Leu Asp Glu Lys Gln Ala Ile Tyr Ser 275 280 285 Lys Ala Val Ala Leu Glu Glu Gly Glu Asp Asn Glu Val Pro Asp Leu 290 295 300 Glu Arg Asn Ala Ala Pro Arg Pro Val Leu Leu Val His Thr Val Lys 305 310 315 320 Ile Ser Leu Ala Ile Met Leu Val Ile Val Thr Gln Ser Leu Gly Val 325 330 335 Ala Arg Leu Leu Asn Glu Phe Gln Trp Asp Gly Gln Tyr Thr Arg Phe 340 345 350 Ala Leu Val Val Thr Ile Pro Pro Leu Ala Leu Phe Ser Leu Phe Phe 355 360 365 Phe Ile Val Leu Val Thr Ser Val Phe Gln Leu Phe Leu Pro Ala Ser 370 375 380 Phe Cys Leu Lys Asn Ser Lys Phe His Ser Gly Asp Thr Glu Asp Ser 385 390 395 400 Ser Ala Val Lys Pro Asn Pro Lys Ala His Gly Glu Tyr Glu Leu Pro 405 410 415 His Ile Thr Ile Gln Met Pro Val Tyr Lys Glu Gly Leu Lys Gly Val 420 425 430 Ile Val Pro Thr Met Ile Ser Val Leu Ala Ala Val Gln Tyr Tyr Glu 435 440 445 Glu Gln Gly Gly Thr Ala Ser Val Phe Val Asn Asp Asp Gly Met Gln 450 455 460 Val Ile Gln Ser Asp Leu Ala Glu Ala Arg Lys Gln Tyr Tyr Arg Glu 465 470 475 480 Asn Gly Ile Gly Phe Thr Ala Arg Pro Pro Asn Lys Lys Ser Pro Val 485 490 495 Gln Lys Gly Gly Trp Gly Ser Trp Phe Arg Lys Ser Lys Pro Ala Thr 500 505 510 Thr Glu Pro Ala Asp Ser Glu Glu Pro Glu Gly Pro Tyr Thr Pro Gln 515 520 525 Ala Leu Ala Asn Lys Ile Gly Phe Glu Arg Lys Gly Lys Phe Lys Lys 530 535 540 Ala Ser Asn Met Asn Tyr Gly Leu Ala Phe Ser Leu Arg Val Glu Asp 545 550 555 560 Glu Leu Ala Arg Leu Thr Gln Ile Glu Thr Glu Arg Arg Gly Cys Thr 565 570 575 Val Asp Asp Leu Thr Ala Glu Asp Asp Asp Arg Leu Tyr Gln Gln Ala 580 585 590 Leu Asp Asn Met Leu Ala Ala Asp Glu Glu Arg Thr Trp Ala Glu Gly 595 600 605 Asn Ile Arg Ile Gly Glu Leu Ile Leu Leu Ile Asp Cys Asp Thr Arg 610 615 620 Val Pro Val Asp Cys Leu Leu Tyr Gly Ala Leu Glu Met His Glu Ser 625 630 635 640 Pro Glu Val Ala Ile Leu Gln His Gly Ser Gly Val Met Gln Val Val 645 650 655 His Asn Val Phe Glu Asn Gly Ile Thr Tyr Phe Thr Asn Val Val Tyr 660 665 670 Thr Ala Ile Lys Tyr Gly Val Gly Ser Gly Asp Val Ser Pro Phe Val 675 680 685 Gly His Asn Ala Phe Leu Arg Trp Arg Ala Leu Gln Ser Ile Glu Phe 690 695 700 Val Asp Pro Ser Asp Gly Gln Thr Lys Trp Trp Ser Asp Thr His Val 705 710 715 720 Ser Glu Asp Phe Asp Ile Ser Leu Arg Leu Gln Met Gln Gly Met Val 725 730 735 Val Arg Leu Ala Thr Tyr His Asn Gly Glu Phe Lys Glu Gly Val Ser 740 745 750 Leu Thr Leu Tyr Asp Glu Leu Thr Arg Trp Glu Lys Tyr Ala Tyr Gly 755 760 765 Cys Asn Glu Leu Val Phe His Pro Phe Tyr Gln Trp Val Tyr Lys Gly 770 775 780 Pro Val Thr Arg Leu Phe Leu Arg Phe Leu Trp Ser Asn Met Pro Val 785 790 795 800 Thr Ser Lys Val Thr Ile Ile Ala Tyr Ile Phe Thr Tyr Tyr Ala Ile 805 810 815 Gly Ser Gly Met Leu Leu Ala Thr Val Asn Tyr Val Ile Leu Gly Leu 820 825 830 Phe Asp Ser Asp Ile Asp His Leu Tyr Leu Pro Ser Trp Gly Ile Trp 835 840 845 Cys Ser Leu Val Val Val Phe Asn Gly Phe Ser Ser Ile Ala Phe Ser 850 855 860 Met Val Arg His Gln Leu Lys Glu Glu Thr Phe Trp Arg Ala Leu Leu 865 870 875 880 Asp Ala Ile Lys Trp Leu Pro Phe Leu Ile Ile Tyr Phe Gly Gly Ile 885 890 895 Ser Leu Asn Cys Ala Lys Ala Ile Leu Cys His Ala Phe Ser Ile Asn 900 905 910 Leu Glu Trp Ala Ser Thr Ala Lys Glu Met Gly Pro Thr Gly Phe Tyr 915 920 925 Ile Gly Met Asp Lys Met Val Arg Arg Phe Lys Trp Thr Trp Ala Ile 930 935 940 Cys Leu Val Leu Ala Gly Val Met Ile Tyr Phe Ala Val Gly Ala Pro 945 950 955 960 Trp Gly Trp Thr Ile Thr Pro Gly Pro Tyr Ser Thr Ala Asn Val Ala 965 970 975 Ile Ala Pro Leu Ala Ile Gln Ile Cys Ser Ala Ser Phe Leu Pro Phe 980 985 990 Phe Leu Gly Leu Asn 995 <210> 12 <211> 988 <212> PRT <213> Penicillium oxalicum <400> 12 Met Glu Glu Trp Pro Arg Asn Ala Asp Glu Pro Tyr Gly Ser Gln Arg 1 5 10 15 Tyr Gln Glu Asp Val Gln Asp Leu Val Ser Leu Pro Ser Arg Ser Ser 20 25 30 Thr Pro His Leu Asp Arg Ala Glu Ile Gly Arg Val Leu Ser Pro Ser 35 40 45 Val Gln Pro Gly Arg Asn Ser Arg Ser Arg Arg Ser Asn Pro Ser Ile 50 55 60 Ala His Ser Phe Thr Ser Pro Ser Ile Ser Glu Ser Gly Glu Gly Glu 65 70 75 80 Asp Pro Ser Ser Thr Ala Arg Tyr Leu Ala Arg Arg Ala Thr Leu Leu 85 90 95 Gly Trp Phe Asp Glu Val Asp Val Glu Asp Gly Arg Asn Ser Trp Ser 100 105 110 Ser Thr Cys Ile Ser Leu Arg Arg Ala Asp Asn Glu Tyr Thr Phe Phe 115 120 125 Pro Tyr Asn Val Asn Pro Ser Leu Ile Asp Ala Ile Thr Arg Leu Gly 130 135 140 Glu Thr Ala Ala Met Ala Met Ser Ser Arg Phe Thr Ser Met Leu Ile 145 150 155 160 Asp Ser Ile Leu Pro Gly Gln Lys Ser Leu Val Val Glu Ser Thr Ser 165 170 175 Ala Arg Ile Pro Val Val His Ser Leu Asn Asp Val Ser Ser Asn Leu 180 185 190 Val His Phe Ala Arg Ala Cys Ile Val Val Gln Glu Lys Leu Val Leu 195 200 205 Ile Trp Ser His Asn Ala Gly Thr Ile Leu His Val Ala His Asp Val 210 215 220 Glu Arg Gln Leu Gly Lys Lys Ser Pro Arg Ile Ser Thr Ala Thr Thr 225 230 235 240 Pro Arg Ala Ser Gly Arg Ser Ser Pro Phe Asp Val Asp Ala Asp Val 245 250 255 Ala Pro Ser Thr Gln Ile Ser Ile Lys Ala Lys Ile Asp Ser Phe Pro 260 265 270 Val Arg Gly Ala Leu Asp Glu Lys His Glu Val Tyr Ser Lys Ala Val 275 280 285 Ala Leu Glu Glu Gly Thr Val Glu Asp Asp Thr Pro Val Asp Leu Glu 290 295 300 Gly Asn Leu Pro Pro Arg Pro Ala His Arg Ile His Ala Val Lys Ile 305 310 315 320 Ser Leu Ala Ile Met Leu Val Ile Leu Thr Gln Ser Leu Gly Val Ser 325 330 335 Arg Leu Val Asn Glu Phe Ala Trp Asp Gly Ser Phe Thr Arg Phe Ala 340 345 350 Leu Val Val Thr Ile Pro Pro Leu Ala Leu Phe Ser Leu Phe Phe Phe 355 360 365 Ile Val Leu Val Thr Ser Ala Phe Gln Leu Phe Leu Pro Ala Ser Phe 370 375 380 Cys Leu Lys Asn Ser Lys Phe His Ser Ala Ile Lys Pro Asn Pro Arg 385 390 395 400 Phe His Arg Asp Tyr Glu Leu Pro His Ile Thr Val Gln Met Pro Val 405 410 415 Tyr Lys Glu Gly Leu Lys Gly Val Ile Val Pro Thr Met Met Ser Val 420 425 430 Leu Ala Ala Val Gln Tyr Tyr Glu Glu Gln Gly Gly Thr Ala Ser Val 435 440 445 Phe Ile Asn Asp Asp Gly Met Gln Cys Ile Gln Pro Glu Leu Ala Glu 450 455 460 Ala Arg Lys Gln Tyr Tyr Arg Glu Asn Gly Ile Gly Tyr Thr Ala Arg 465 470 475 480 Leu Pro Asn Arg Lys Thr Ala Ser Lys Lys Lys Arg Gly Phe Gly Trp 485 490 495 Phe Arg Lys Ala Lys Ser Ala Glu Gly Asp Ala Glu Thr Glu Ala Glu 500 505 510 Glu Asp Thr Ser Ser Pro Gln Ala Ile Ala Asn Lys Ile Gly Phe Glu 515 520 525 Arg Lys Gly Lys Phe Lys Lys Ala Ser Asn Met Asn Tyr Gly Leu Ala 530 535 540 Phe Ser Asn Arg Val Glu Asp Glu Leu Ala Arg Leu Ala Asp Leu Glu 545 550 555 560 Cys Gln Gln Arg Gly Cys Ser Asn Asp Asp Leu Thr Phe Glu Asp Asp 565 570 575 Asp Arg Leu Tyr Gln Gln Ala Leu Ser Asn Met Leu Ala Glu Asp Glu 580 585 590 Gly Arg Thr Trp Ala Glu Gly Asn Val Arg Ile Gly Glu Ile Ile Leu 595 600 605 Ile Ile Asp Cys Asp Thr Arg Val Pro Val Asp Cys Leu Leu Tyr Gly 610 615 620 Ala Leu Glu Met His Glu Ser Pro Glu Val Ala Ile Val Gln His Gly 625 630 635 640 Ser Gly Val Met Gln Val Val His Asn Met Phe Glu Asn Gly Ile Thr 645 650 655 Tyr Phe Thr Asp Val Val Tyr Thr Ala Ile Lys Tyr Gly Val Gly Ser 660 665 670 Gly Asp Val Ser Pro Phe Val Gly His Asn Ala Phe Leu Arg Trp Lys 675 680 685 Ala Leu Gln Ser Ile Gln Phe Val Asp Pro Ala Asp Gly Gln Thr Lys 690 695 700 Trp Trp Ser Asp Ala His Val Ser Glu Asp Phe Asp Ile Ser Leu Arg 705 710 715 720 Leu Gln Met Gln Gly Met Thr Val Arg Leu Ala Thr Tyr His Asn Gly 725 730 735 Gly Phe Lys Glu Gly Val Ser Leu Thr Leu Tyr Asp Glu Leu Thr Arg 740 745 750 Trp Glu Lys Tyr Ala Tyr Gly Cys Asn Glu Leu Val Phe Asn Pro Phe 755 760 765 Tyr Gln Trp Pro Tyr Lys Gly Pro Val Thr Arg Leu Phe Leu Arg Phe 770 775 780 Leu Trp Ser Asn Met Pro Val Thr Ser Lys Val Thr Ile Ile Ala Tyr 785 790 795 800 Ile Phe Thr Tyr Tyr Ala Ile Ala Ser Gly Met Met Leu Ser Val Val 805 810 815 Asn Tyr Val Ile Val Gly Leu Phe Asn Ser Glu Val Asp His Ile Tyr 820 825 830 Leu Arg Ser Trp Gly Ile Trp Ile Ser Leu Val Val Val Phe Asn Gly 835 840 845 Val Ala Ser Val Ala Phe Ser Met Ala Arg His Gln Leu Lys Glu Met 850 855 860 Val Phe Trp Lys Ala Leu Leu Lys Ser Ala Leu Trp Leu Pro Phe Leu 865 870 875 880 Val Val Phe Phe Gly Gly Ile Ser Leu Asn Cys Ala Lys Ala Ile Leu 885 890 895 Cys His Ala Phe Ser Ile Asn Ile Glu Trp Ala Ser Thr Ala Lys Glu 900 905 910 Pro Gly Pro Ser Gly Phe Phe Ile Gly Leu Asp Lys Met Val Lys Gln 915 920 925 Phe Lys Tyr Thr Trp Ala Ile Cys Leu Phe Leu Ala Ala Val Met Ile 930 935 940 Phe Met Ala Leu Gly Thr Pro Trp Gly Trp Gln Ile Lys Pro Gly Glu 945 950 955 960 Tyr Ser Thr Ala Ser Ile Ala Ile Gly Pro Leu Ala Ile Gln Ile Cys 965 970 975 Asn Ala Ala Ile Leu Pro Leu Ile Leu Gly Leu Asn 980 985 <210> 13 <211> 920 <212> PRT <213> Talaromyces cellulolyticus <400> 13 Met Ser Ser Leu Phe Pro Thr Arg Trp Ser Phe Arg Gly His Lys Thr 1 5 10 15 Pro Lys Gly Asp Gly Thr Pro Thr Glu Thr Ala Ser Gln Arg Asp Ser 20 25 30 Leu Pro Val Ser Glu Ser Gly Arg Ser Ser Arg Gly Gln Gly Tyr Phe 35 40 45 Asp Arg Arg His Val Asn Asn Ser Ile Asp Asp Ala Ser Lys Tyr Lys 50 55 60 Ala Met Ile Lys Phe Phe His Val Arg Leu Thr Ala Tyr Gln Trp Leu 65 70 75 80 Pro Pro Pro Thr His Pro Gln His Ser Ser Thr Gly Val Phe Leu Arg 85 90 95 Arg Ser Arg Gly Ile Tyr Met Ser Glu Pro Glu Asp Ile Asn Pro Leu 100 105 110 Leu Leu Ala Ala Ile Gln Arg Ile Asn Ala Thr Ile Ala Phe Thr Met 115 120 125 Met Thr Glu Thr Thr Ser Ile Ile Thr Ser Gln Leu Ala Pro Gly Gln 130 135 140 Thr Glu Leu Ile Leu Pro Asn Gly Tyr Gln Val Gln Ile Ile Glu Ser 145 150 155 160 Tyr Ala Asp Ile Val Gly Ser His Ser Asn Met Val Lys Lys Tyr Gln 165 170 175 Tyr Ala Ala Leu Ile Arg Glu Glu Gln Leu Leu Leu Val Trp Asn Asp 180 185 190 Asp Leu Asn Ala Ile Leu Asn His Ala Ala Asp Val Glu Gly Lys Leu 195 200 205 Leu Ser Leu Ile Trp Gly Ser Pro Ile Pro Thr Phe Asn Leu Gln Ala 210 215 220 Val Pro Met Met Thr Pro Gly Glu Ser Val Val Ala Ser Pro Asn Asp 225 230 235 240 Ser Leu Tyr His Leu Ala Leu Glu Pro Arg Glu Ser Pro Ala Ala Ala 245 250 255 Glu Asp Ser Gly Thr Ser Arg Asp Ala Ser Pro Arg Arg Met Ile Asn 260 265 270 Glu Glu Val Lys Arg Pro Lys Glu Ser Leu Glu Arg Pro Leu Ala Val 275 280 285 Thr Ser Ala Ile Phe Val Gly Met Ala Gly Met Leu Leu Val Ile Leu 290 295 300 Leu Leu Gly Phe Gly Ile Ser Asn Leu Leu Leu Glu Tyr Ser Val Asp 305 310 315 320 Gly Gly Ala Met Arg Phe Ala Leu Thr Ala Thr Ile Pro Phe Phe Leu 325 330 335 Leu Phe Ser Ile Phe Phe Met Ile Val Ile Phe Thr Asp Ile Phe Gln 340 345 350 Ala Val Gly Pro Val Lys Thr Leu Lys Ser Asn Ser Arg Phe Tyr Ser 355 360 365 Pro Ile Ala Pro Asp Leu Lys Thr Ala Tyr Ser Leu Gly Phe Thr Pro 370 375 380 Pro Arg Val Thr Ile Gln Met Pro Ile Tyr Thr Glu Ser Leu Glu Gly 385 390 395 400 Val Ile Lys Pro Thr Ile Ser Ser Leu Lys Thr Ala Ile Ser His Tyr 405 410 415 Glu Ser His Gly Gly Thr Ala Asn Ile Phe Ile Asn Asp Asp Gly Phe 420 425 430 Ala Leu Leu Ser Glu Glu Gln Gln His Glu Arg Ile Asn Phe Tyr His 435 440 445 Asp Asn Asn Ile Gly Trp Val Ala Arg Pro Lys Asn Asn Glu Asp Gly 450 455 460 Tyr Ile Arg Lys Gly Lys Phe Lys Lys Ala Ser Asn Met Asn Phe Ala 465 470 475 480 Leu Asn Val Ser Asn Lys Val Glu Met Glu Leu Ile Gln Arg Met Ala 485 490 495 Pro Thr Leu Glu Lys Ser Asp Met Val Asp Pro Met Glu Glu Glu Leu 500 505 510 Val Tyr Arg Glu Ala Phe Asp His Val Ile Gln Ser Asp Pro Arg Ile 515 520 525 Arg Gly Ala Gly Gly Asp Ile Arg Val Gly Glu Phe Ile Leu Ile Val 530 535 540 Asp Ser Asp Thr Arg Ile Pro Ala Asp Cys Leu Leu Tyr Gly Ala Ala 545 550 555 560 Glu Met Phe Leu Ser Pro Glu Val Ala Ile Ile Gln His Ser Thr Ser 565 570 575 Val Met Gln Val Ser Gln Asp Tyr Phe Glu Asn Gly Ile Thr Tyr Phe 580 585 590 Thr Asn Leu Ile Tyr Ser Ala Ile Arg Phe Ala Val Gly Ser Gly Glu 595 600 605 Thr Ala Pro Phe Val Gly His Asn Ala Phe Leu Arg Trp Gln Ala Val 610 615 620 Gln Ser Val Gly Arg Pro Asp Asp Gly Tyr Val Ser Phe Trp Ser Glu 625 630 635 640 Ser His Val Ser Glu Asp Phe Asp Ile Ala Leu Arg Leu Gln Ile Gln 645 650 655 Gly Asn Ile Ile Arg Leu Ala Ser Tyr His Asn Asp Glu Phe Lys Glu 660 665 670 Gly Val Ser Leu Thr Ile Tyr Asp Glu Leu Ser Arg Trp Glu Lys Tyr 675 680 685 Ala Tyr Gly Cys Asn Glu Leu Val Phe Asn Pro Val His Thr Trp Phe 690 695 700 Tyr Arg Gly Pro Leu Thr Lys Leu Phe Met Thr Phe Leu Trp Ser Asn 705 710 715 720 Leu Gln Leu Ser Ser Lys Ile Thr Ile Leu Gly Tyr Ile Ser Ser Tyr 725 730 735 Tyr Ala Leu Ala Ser Gly Phe Pro Leu Thr Val Leu Asn Tyr Phe Leu 740 745 750 Val Gly Trp Phe Glu Gly Tyr Leu Asp Lys Phe Tyr Met Glu Ser Trp 755 760 765 Lys Val Phe Leu Ser Leu Leu Val Val Phe Ser Ala Ala Gly Asn Val 770 775 780 Cys Leu Ala Ile Ile Arg Tyr Arg Leu Gly Glu Lys Pro Leu Leu Ala 785 790 795 800 Ser Leu Val Glu Asn Phe Met Trp Met Pro Met Phe Ala Ile Phe Phe 805 810 815 Gly Gly Leu Ser Phe His Leu Ser Leu Ala Ile Leu Ser His Met Phe 820 825 830 Gly Ile Asn Met Ser Trp Gly Thr Thr Ala Lys Glu Lys Asp Asp Ser 835 840 845 Asn Phe Phe Lys Glu Ile Pro Lys Ile Phe Lys Ser Phe Lys Trp Met 850 855 860 Tyr Ala Val Val Leu Pro Phe Phe Pro Ala Met Ile Tyr Leu Ala Cys 865 870 875 880 Phe Ala Pro Asn Gly Trp Thr Ile Thr Glu Val Gly Ala Ile Val Pro 885 890 895 Met Ser Val Thr Leu Ala Ser His Ala Leu Leu Pro Leu Leu Leu Asn 900 905 910 Pro Ser Leu Met Val Phe Asn Tyr 915 920 <210> 14 <211> 884 <212> PRT <213> Fusarium oxysporum <400> 14 Met Gly Ile Gly Ser Tyr Phe Lys Ala Asp Ile Pro Pro Gln Thr Pro 1 5 10 15 Ile Gly Pro Pro Pro Arg Arg Pro Ser His Arg Pro Ser Met Ser Leu 20 25 30 His Ala Pro Ile Ile Glu Glu Lys Ile Pro Pro Ala Ala Val Val Glu 35 40 45 Leu His Ser Ala Ala Gly Pro Lys Phe Thr Ala Gly Pro Pro Ser Ile 50 55 60 Ala Pro Ser Ser Lys Ser Gly Asn Ser Asn Leu Leu Asp Asp Ile Lys 65 70 75 80 His Glu Val Met Val Asn Tyr Leu Tyr Gln Gln Gln Cys Ser Gln Leu 85 90 95 Trp Val Gly Asp Gly Ser Gly Glu Ile Glu Gly Val Leu Leu Arg Lys 100 105 110 Ser Arg Gly Gln Tyr Met Ala Cys Pro Pro Gln Leu Gly Gln Ser Pro 115 120 125 Phe Ala Ile Ala Cys Thr Ala Leu Asn Val Gln Cys Ala Met Thr Val 130 135 140 Asn Ser Arg Val Ile Lys Thr Phe Leu Gln Trp Ser Pro Asp Ala Val 145 150 155 160 Asp Val Pro Leu Met Asn Gly Leu Arg Val Gln Ile Leu Pro Thr Val 165 170 175 Asn Asp Leu Pro Arg Ala Arg Lys His Gln Phe Ala Ala Phe Ile Ala 180 185 190 Ser Asp Gly Leu Leu Val Val Trp Asp Asp Asp Ala Leu Asn Leu Met 195 200 205 Ala Arg Ala Lys Ile Ile Glu Ser Glu Leu Met Glu Leu Val Trp Asn 210 215 220 Ser Gly Gln Ser Val Asp Glu Asp Glu Arg Asp Ser Thr Ile Ala Ala 225 230 235 240 Glu Tyr Glu Ile Asp Glu Glu Ser Gly Glu Ile Lys Pro Glu Ala Arg 245 250 255 Pro Val His Leu Gln Asn Ala Val Leu Val Ser Leu Thr Leu Leu Leu 260 265 270 Val Met Ala Ser Leu Gly Ala Ala Trp Arg Gln Leu Ala Val Glu Ile 275 280 285 Ala Ile Asp Gly Asp Tyr Lys Arg Leu Gly Leu Val Ala Leu Phe Pro 290 295 300 Ile Gln Ile Phe Phe Ser Leu Phe Phe Ala Gln Val Ile Val Gly Cys 305 310 315 320 Leu Ala Gln Ile Phe Gly Pro Ile Arg Gln Leu Thr Ile Asn Ser Lys 325 330 335 Phe Tyr Ser Ala Arg Pro Pro Arg Arg Leu Gln Gly Ala Thr Leu Pro 340 345 350 His Ile Thr Ile Gln Cys Pro Val Tyr Lys Glu Gly Leu Asn Ala Val 355 360 365 Ile Leu Pro Thr Val Lys Ser Ile Lys Gln Ala Met Ser Thr Tyr Glu 370 375 380 Leu Gln Gly Gly Ser Ala Asn Met Phe Ile Asn Asp Asp Gly Leu Gln 385 390 395 400 Leu Leu Ser Glu Glu Glu Arg Asp Ala Arg Ile Asp Phe Tyr Ala Asp 405 410 415 Asn Ser Ile Gly Trp Val Ala Arg Pro Lys His Gly Glu Asp Gly Phe 420 425 430 Ile Arg Lys Gly Lys Phe Lys Lys Ala Ser Asn Met Asn Phe Gly Leu 435 440 445 Met Ile Ser Cys Lys Val Glu Glu Arg Leu Gln Leu Ile Lys Arg Pro 450 455 460 Ala Asp Trp Ser Gln Ser Asp Glu Ala Leu Ala Tyr Glu Gln Ala Leu 465 470 475 480 Lys Asp Val Leu Glu Glu Asn Gly Arg Ala Trp Ala Asp Gly Asn Ile 485 490 495 Arg Val Gly Asp Tyr Ile Leu Leu Ile Asp Ser Asp Thr Arg Val Pro 500 505 510 Thr Asp Cys Leu Leu Asp Ser Val Ser Glu Met Glu Gln Ser Pro Asp 515 520 525 Val Gly Ile Met Gln Phe Ser Ser Gly Val Met Gln Val Val His Thr 530 535 540 Tyr Phe Glu Asn Gly Ile Thr Phe Phe Thr Asp Leu Ile Tyr Thr Ala 545 550 555 560 Ile Arg Phe Thr Val Ser Asn Gly Asp Val Ala Pro Phe Val Gly His 565 570 575 Asn Ala Ile Leu Arg Trp Ser Ala Ile Gln Gln Val Ala Tyr Gln Asp 580 585 590 Glu Asp Gly Tyr Asp Lys Phe Trp Ser Glu Ser His Val Ser Glu Asp 595 600 605 Phe Asp Met Ser Leu Arg Leu Gln Cys Asn Gly Tyr Ile Ile Arg Leu 610 615 620 Ala Ala Trp Ala Gly Asp Gly Phe Lys Glu Gly Val Ser Leu Thr Val 625 630 635 640 Tyr Asp Glu Leu Ala Arg Trp Glu Lys Tyr Ala Phe Gly Cys Asn Glu 645 650 655 Leu Leu Phe Asn Pro Ile Arg Thr Trp Leu Trp Arg Gly Pro Phe Thr 660 665 670 Pro Leu Phe Arg Arg Phe Cys Phe Ser Asn Ile Arg Phe Thr Ser Lys 675 680 685 Ile Thr Val Val Ser Tyr Ile Gly Thr Tyr Tyr Ala Ile Gly Ala Ala 690 695 700 Trp Ile Met Thr Thr Ala Asn Tyr Phe Leu Met Gly Trp Phe Asn Gly 705 710 715 720 Tyr Leu Asp Lys Tyr Tyr Leu Asp Ser Trp Gln Val Trp Phe Ser Ile 725 730 735 Ile Leu Val Phe Asn Gly Leu Gly Asn Leu Ala Leu Ala Ile Met Arg 740 745 750 Tyr Arg Ser Gly Glu Arg Thr Leu Gly Tyr Ala Ile Tyr Glu Asn Phe 755 760 765 Lys Trp Thr Leu Met Leu Ala Val Phe Leu Gly Gly Leu Ser Leu His 770 775 780 Val Ser Gln Ala Leu Leu Ala His Met Phe Glu Ile Asp Met Ser Trp 785 790 795 800 Gly Ser Thr Ser Lys Glu Ala Glu Phe Ser Asn Phe Phe Ile Glu Val 805 810 815 Pro Lys Val Leu Lys Lys Phe Arg Val Ser Met Thr Leu Ser Leu Leu 820 825 830 Ala Ile Val Ala Leu Ile Ile Met Ala Thr Ala Asp Phe Ile Pro His 835 840 845 Tyr Trp Arg Ile Asn Asp Phe Val Ala Ile Leu Pro Met Ala Thr Val 850 855 860 Ala Gly Ser His Leu Leu Leu Pro Leu Ala Leu Asn Pro Ala Leu Met 865 870 875 880 Thr Phe Ser Trp <210> 15 <211> 885 <212> PRT <213> Myceliophthora thermophila <400> 15 Met Gly Ile Gly Asp Tyr Phe Lys Ala Glu Lys Leu Gly Ser Lys Pro 1 5 10 15 Thr Pro Thr Pro Ala Ser Pro Pro Arg Glu His Gly Arg His Gln Gln 20 25 30 Gln Pro Ser Ala Ser Glu Asp His Pro Ala Pro Ser Val Gln Pro Ala 35 40 45 Ser Glu Leu Gln Pro Pro Thr Pro Arg Phe Ser Ser Arg Pro Gln Ser 50 55 60 Ile Ser Gly Arg Ser Val Arg Ser Thr Gly Ser Ser Val Leu Asp Glu 65 70 75 80 Ile Lys His Glu Val Met Val Asn Tyr Leu Tyr Gln Gln Gln Cys Ser 85 90 95 His Leu Trp Ile Ser Asp Gly Ser Gly Glu Ile Glu Gly Val Leu Leu 100 105 110 Arg Lys Ala Arg Gly Gln Tyr Met Ala Cys Pro Pro Gln Leu Val Asn 115 120 125 Ser Pro Leu Ala Ala Ala Cys Thr Ala Leu Asn Val Gln Cys Ala Met 130 135 140 Thr Val Asn Ser Arg Val Ile Lys Thr Phe Leu Gln Trp Ser Pro Asp 145 150 155 160 Ala Val Asp Val Pro Leu Met Asn Gly Met Arg Val Gln Ile Leu Ala 165 170 175 Thr Ile Asp Asp Leu Pro Arg Ala Arg Lys His Gln Phe Ala Ala Phe 180 185 190 Val Ala Ser Glu Gly Leu Leu Ile Val Trp Asp Asp Asp Ala Leu His 195 200 205 Leu Val Gln Arg Ala Lys Ala Ile Glu Ser Glu Leu Met Glu Leu Val 210 215 220 Trp Lys Val Gly Ala Glu Asp Asn Glu Asp Glu Lys Gly Val Ala Ala 225 230 235 240 Val Glu Glu Pro Glu Val Asp Glu Glu Ser Gly Glu Leu Lys Pro Glu 245 250 255 Lys Arg Pro Val His Leu Leu Asn Ala Tyr Leu Val Ser Leu Ser Leu 260 265 270 Ile Leu Val Thr Val Ser Leu Gly Ala Ala Phe Arg Gln Leu Ala Ile 275 280 285 Glu Val Ser Val Asp Gly Asn Tyr Val Arg Leu Ala Leu Val Ala Leu 290 295 300 Phe Pro Val Gln Met Phe Phe Thr Leu Phe Phe Ala Gln Val Ile Val 305 310 315 320 Gly Cys Leu Ala Gln Ile Phe Gly Pro Ile Arg Gln Leu Thr Val Asn 325 330 335 Ser Lys Phe Tyr Ser Ala Arg Pro Pro Pro Arg Leu Arg Ser Ser Val 340 345 350 Leu Pro His Val Thr Val Gln Cys Pro Val Tyr Lys Glu Gly Leu Asn 355 360 365 Ala Val Ile Ala Pro Thr Val Lys Ser Ile Lys Gln Ala Met Ser Thr 370 375 380 Tyr Glu Leu Gln Gly Gly Ser Ala Asn Met Phe Ile Asn Asp Asp Gly 385 390 395 400 Leu Gln Leu Ile Ser Glu Glu Asp Arg Arg Ala Arg Ile Glu Phe Tyr 405 410 415 Ala Asp Asn Ser Ile Gly Trp Val Ala Arg Pro Lys His Gly Glu Asn 420 425 430 Gly Phe Gln Arg Arg Gly Lys Phe Lys Lys Ala Ser Asn Met Asn Phe 435 440 445 Ala Leu Met Ile Ser Cys Lys Val Glu Asp Lys Leu Ala Ala Ile Gln 450 455 460 Arg Thr Pro Asp Trp Thr Gln His Asp Glu Ala Leu Ala Tyr Glu Arg 465 470 475 480 Ala Leu Lys Glu Val Leu Glu Glu Asp Gly Arg Ala Trp Ala Asp Gly 485 490 495 Asn Ile Arg Ile Gly Asp Tyr Ile Leu Leu Val Asp Ser Asp Thr Arg 500 505 510 Val Pro Ala Asp Cys Leu Leu Asp Ala Val Ser Glu Met Glu Leu Ser 515 520 525 Pro Asp Val Gly Ile Met Gln Phe Ser Ser Gly Val Met Gln Val Val 530 535 540 His Thr Tyr Phe Glu Asn Gly Ile Thr Phe Phe Thr Asn Leu Ile Tyr 545 550 555 560 Ser Ala Ile Arg Tyr Thr Val Ser Asn Gly Asp Val Ala Pro Phe Val 565 570 575 Gly His Asn Ala Ile Leu Arg Trp Ser Ala Ile Gln Gln Val Ser Tyr 580 585 590 Glu Asp Glu Asp Gly Tyr Glu Lys Phe Trp Ser Glu Ser His Val Ser 595 600 605 Glu Asp Phe Asp Met Ser Leu Arg Leu Gln Cys Ala Gly Tyr Ile Ile 610 615 620 Arg Leu Ala Ala Trp Ala Gly Asp Gly Phe Lys Glu Gly Val Ser Leu 625 630 635 640 Thr Val Tyr Asp Glu Leu Ala Arg Trp Glu Lys Tyr Ala Tyr Gly Cys 645 650 655 Asn Glu Leu Leu Phe His Pro Ile Arg Lys Trp Ile Tyr Lys Gly Pro 660 665 670 Phe Thr Pro Leu Phe Arg Arg Phe Leu Phe Ser Asn Ile Arg Phe Thr 675 680 685 Ser Lys Val Thr Val Ile Ser Tyr Ile Gly Thr Tyr Tyr Ala Ile Ala 690 695 700 Ala Ala Trp Ile Met Thr Ser Ile Asn Tyr Phe Ile Met Gly Trp Phe 705 710 715 720 Asn Gly Tyr Leu Asp Lys Tyr Tyr Val Asp Ser Trp Gln Val Trp Phe 725 730 735 Ser Ile Ile Leu Val Phe Asn Gly Leu Gly Asn Ile Ala Leu Ala Val 740 745 750 Met Arg Tyr Arg Val Gly Glu Arg Ser Ile Leu Tyr Ala Leu Tyr Glu 755 760 765 Asn Phe Lys Trp Thr Phe Leu Leu Ala Val Phe Leu Gly Gly Leu Ser 770 775 780 Leu His Leu Ser Gln Ala Leu Leu Ala His Met Phe Glu Ile Asp Met 785 790 795 800 Thr Trp Gly Ala Thr Ala Lys Glu Ala Glu Phe Ser Asn Phe Phe Ile 805 810 815 Glu Val Pro Lys Val Leu Lys Lys Phe Lys Ile Ser Met Leu Phe Ala 820 825 830 Thr Ile Phe Ile Ala Gly Met Ile Ile Leu Ala Val Ala Pro Phe Ile 835 840 845 Pro Tyr Ser Trp His Ile Lys Asp Phe Val Ala Ile Leu Pro Met Ala 850 855 860 Thr Val Ala Ala Ser His Leu Leu Leu Pro Leu Val Leu Asn Pro Ala 865 870 875 880 Leu Met Thr Phe Ser 885 <210> 16 <211> 880 <212> PRT <213> Neurospora crassa <400> 16 Met Gly Ile Gly Ser Tyr Phe Lys Ala Lys Lys Pro Glu Pro Ala Gly 1 5 10 15 Gln Gln His Ala Ala Ser Thr Pro Ser Arg Gly Arg Gln Pro Ser Met 20 25 30 Gly Asn Thr Lys Ala Gly Gln Asp Asp Gly Asp Ile Leu Ala Pro Pro 35 40 45 Gln Ile Arg Tyr Gly Ser Arg Ser Arg Ser Ala Thr Arg Ser Met Met 50 55 60 Ser Ser Thr Ser Ser Val Ile Leu Glu Asp Ile Lys His Glu Val Met 65 70 75 80 Val Asn Tyr Leu Tyr Gln Gln Gln Cys Ser Tyr Leu Trp Val Ala Asn 85 90 95 Gly Ser Gly Glu Ile Glu Gly Val Leu Leu Arg Lys Ser Arg Gly Gln 100 105 110 Tyr Met Ala Cys Pro Pro Ala Leu Gly Asn Ser Pro Phe Ala Met Ala 115 120 125 Cys Ala Ala Leu Asn Val Gln Cys Ala Met Thr Val Asn Ser Arg Val 130 135 140 Ile Lys Thr Phe Leu Gln Trp Ser Pro Asp Ala Val Asp Val Pro Leu 145 150 155 160 Leu Asn Gly Leu Arg Val Gln Ile Leu Pro Thr Ile Glu Asp Leu Pro 165 170 175 Arg Ala Arg Lys His Gln Phe Ala Ala Phe Ile Ala Ser Glu Gly Leu 180 185 190 Leu Val Val Trp Asp Asp Asp Ala Leu His Leu Ile Pro Arg Ala Lys 195 200 205 Glu Ile Glu Ser Glu Leu Met Gln Leu Val Trp Lys Thr Gly Glu Pro 210 215 220 Gly Glu Met Asp Glu Lys Ala Asn Pro Ile Val Gly Ala Thr Glu Ile 225 230 235 240 Asp Glu Glu Ser Gly Glu Pro Arg Pro Glu Ala Arg Pro Val His Leu 245 250 255 Leu Asn Thr Tyr Leu Val Ser Ile Thr Met Ala Val Val Thr Val Ser 260 265 270 Leu Gly Ala Ala Trp Arg Gln Leu Ala Ile Glu Val Met Val Asp Gly 275 280 285 Asp Tyr Val Arg Leu Ala Leu Val Ala Leu Ala Pro Val Gln Ile Phe 290 295 300 Phe Thr Leu Phe Phe Ala Gln Val Ile Ile Gly Cys Leu Ala Gln Ile 305 310 315 320 Phe Gly Pro Ile Lys Gln Leu Ser Val Asn Ser Arg Phe Tyr Ser Ala 325 330 335 Lys Pro Pro Pro Arg Leu Gln Thr Ala Val Leu Pro His Val Thr Val 340 345 350 Gln Cys Pro Val Tyr Lys Glu Gly Leu Ser Gly Val Ile Ala Pro Thr 355 360 365 Val Lys Ser Ile Lys His Ala Met Ser Thr Tyr Glu Leu Gln Gly Gly 370 375 380 Ser Ala Asn Met Phe Ile Asn Asp Asp Gly Leu Gln Leu Leu Ser Glu 385 390 395 400 Glu Asp Arg Gln Ala Arg Ile Asp Phe Tyr Ala Asp His Ser Ile Gly 405 410 415 Trp Val Ala Arg Pro Arg His Gly Glu Asn Gly Phe Gln Arg Arg Gly 420 425 430 Lys Phe Lys Lys Ala Ser Asn Met Asn Tyr Ala Leu Met Ile Ser Cys 435 440 445 Lys Val Glu Glu Lys Leu Ala Gln Val Pro Arg His Ser Glu Trp Ser 450 455 460 Gln His Asp Glu Ala Gln Ala Tyr Glu Arg Ala Leu Lys Asp Val Leu 465 470 475 480 Glu Glu Asn Gly Arg Ala Trp Ala Asp Gly Asn Ile Arg Met Gly Asp 485 490 495 Tyr Ile Leu Leu Ile Asp Ser Asp Thr Arg Val Pro Ser Asp Cys Leu 500 505 510 Leu Asp Ala Val Ser Glu Met Glu Gln Ser Pro Asp Val Gly Ile Met 515 520 525 Gln Phe Ser Ser Gly Val Met Gln Val Val His Thr Tyr Phe Glu Asn 530 535 540 Gly Ile Thr Phe Phe Thr Asn Leu Ile Tyr Thr Ala Ile Arg Tyr Thr 545 550 555 560 Val Ser Asn Gly Asp Val Ala Pro Phe Val Gly His Asn Ala Ile Leu 565 570 575 Arg Trp Ser Ala Ile Gln Gln Val Ser Tyr Glu Asp Glu Asp Gly Tyr 580 585 590 Glu Lys Phe Trp Ser Glu Ser His Val Ser Glu Asp Phe Asp Met Ser 595 600 605 Leu Arg Leu Gln Cys Asn Asp Tyr Ile Ile Arg Leu Ala Ala Trp Ala 610 615 620 Gly Asp Gly Phe Lys Glu Gly Val Ser Leu Thr Val Tyr Asp Glu Leu 625 630 635 640 Ala Arg Trp Glu Lys Tyr Ala Tyr Gly Cys Asn Glu Leu Leu Phe Tyr 645 650 655 Pro Ile Arg Lys Trp Ile Trp Lys Gly Pro Phe Thr Pro Leu Phe Arg 660 665 670 Arg Phe Leu Phe Ser Asn Ile Arg Phe Thr Ser Lys Ile Thr Ile Ile 675 680 685 Ser Tyr Ile Gly Thr Tyr Tyr Ala Ile Gly Ala Ala Trp Ile Leu Thr 690 695 700 Ser Val Asn Tyr Phe Leu Met Gly Trp Tyr Asn Gly Phe Leu Asp Lys 705 710 715 720 Tyr Tyr Val Asp Ser Trp Gln Val Trp Phe Ser Ile Ile Leu Val Phe 725 730 735 Asn Gly Leu Gly Asn Val Ala Leu Ala Val Met Arg Tyr Arg Val Gly 740 745 750 Glu Arg Ser Ile Leu Gly Ser Ile Leu Glu Asn Phe Lys Trp Thr Leu 755 760 765 Met Leu Ala Ile Phe Leu Gly Gly Leu Ser Leu His Val Ser Gln Ala 770 775 780 Leu Leu Ala His Met Phe Glu Ile Asp Met Thr Trp Gly Ala Thr Ser 785 790 795 800 Lys Glu Ala Glu Phe Ser Asn Phe Phe Ile Glu Val Pro Lys Val Leu 805 810 815 Lys Lys Phe Lys Phe Ser Met Leu Phe Ser Ile Gly Phe Ile Ile Gly 820 825 830 Met Val Ile Leu Ala Thr Ala Pro Phe Ile Pro His Ser Trp His Ile 835 840 845 Thr Asp Phe Val Ala Ile Leu Pro Met Ala Thr Val Ala Ala Ser His 850 855 860 Leu Leu Leu Pro Leu Ala Leu Asn Pro Ala Leu Met Thr Phe Ser Trp 865 870 875 880 <210> 17 <211> 939 <212> PRT <213> Candida intermedia <400> 17 Met Gly Ile Thr Asp Tyr Phe Val Ser Lys Gly Ala Thr Glu Ala Lys 1 5 10 15 Gln Gly Lys Asn Ser Thr Asp Ile Gln Gln Asn Glu Thr Leu Thr Phe 20 25 30 Pro Glu Met Leu Ala Gly Pro Thr Gly Ala Ser Pro Arg Ala Gln Phe 35 40 45 Thr Ile Gly Glu Thr His Leu Ser Ser Asp Ile Arg Thr Leu Gln Gly 50 55 60 His Asn Glu Met Ile Ser Ala Gly Lys Ser Asp Phe Lys Asp Pro Gln 65 70 75 80 Phe Ile Val Val Asn Tyr Leu His Asp Ile Cys Leu Gly Asn Gly Trp 85 90 95 Leu Lys Leu Val Asp Pro Leu Glu Pro Cys Val Val Lys Met Asn Ser 100 105 110 Lys Lys Gly Asn Glu Ile Gly Tyr Arg Tyr Leu Pro Ala Cys Asp Glu 115 120 125 Ile Ala Pro Tyr Ser Phe Val Asp Cys Ala Ala Arg Phe Leu Arg Ser 130 135 140 Asp Val Cys Val Arg Val Ser Phe Pro Val Ile His Ala Ile Leu Asp 145 150 155 160 Ile Leu Ser Ser Lys Gly Thr Val Ser Leu Asp Ala Asp His Asn Ile 165 170 175 Gln Ile Ile Glu Thr Val Ala Asp Leu Gln Trp Val Arg Lys Ser Gln 180 185 190 Asn Cys Ala Phe Ile Arg Asn Glu Lys Ser Leu Val Cys Trp Ala Asp 195 200 205 Ser Val Gln Glu Val Thr Gly Phe Val Arg Asn Leu Glu Asn Lys Met 210 215 220 Val Asp Tyr Val Trp Lys Lys Gly Asn Ala Val Asp Val Lys Gly Glu 225 230 235 240 Asp Tyr Val Pro Arg Val Thr Phe Ala Ser Val Phe Gln Ser Ser Ser 245 250 255 Glu Ser Asp Val Gly Ser Glu Gly Ala Val Glu Ile Ile Gly Gln Asn 260 265 270 Ala Val Ser Gln Val Ser Ile Ser Glu Lys Ser Ser Asp Ser Ser Thr 275 280 285 His Ser Asp Gly Asn Leu Asn Glu Lys Lys Asn Leu Asp Leu Glu Gln 290 295 300 Gln Ser Ser Glu Arg Pro Val Ile Tyr Ile His Ala Thr Val Ser Ala 305 310 315 320 Phe Ala Ile Thr Leu Val Leu Ala Trp Ala Gly Leu Gln Phe Ala Gln 325 330 335 Val Thr Lys Glu Ile Arg Ala Glu Gly Asn Tyr Leu Ile Leu Leu Ser 340 345 350 Leu Leu Met Val Leu Pro Tyr Phe Leu Phe Thr Ser Phe Phe Ala Ser 355 360 365 Ser Val Met Ser Thr Leu Leu Tyr Val Phe Gly Pro Ile Ser Gln Met 370 375 380 Asn Lys Asn Ser Tyr Ser Tyr Ser Val His Lys Ala Pro Arg Leu Lys 385 390 395 400 Ala Ala His Gly Ser Leu Pro His Val Thr Ile Gln Cys Pro Val Tyr 405 410 415 Lys Glu Lys Leu Glu Ser Val Ile Lys Pro Thr Ile Lys Ser Leu Gln 420 425 430 Ala Ala Ile Arg Thr Tyr Glu Leu Gln Gly Gly Ser Ala Asn Ile Phe 435 440 445 Ile Asn Asp Asp Gly Leu Gln Leu Ile Asp Arg Lys Glu Ala Leu Glu 450 455 460 Arg Ile Glu Tyr Tyr Glu Glu Cys Gly Leu Gly Tyr Val Ala Arg Pro 465 470 475 480 Gly His Gly Val Asn Gly Phe Ile Arg Lys Gly Arg Phe Lys Lys Ala 485 490 495 Ser Asn Met Asn Tyr Cys Leu His Ile Ser Lys Leu Val Asp Thr Arg 500 505 510 Phe His Glu Arg Leu Glu Leu Ile Glu Asn Pro Thr Pro Lys Glu Glu 515 520 525 Ser Gly Leu Tyr Leu Lys Val Leu Glu Glu Val Val Arg Glu Glu Gly 530 535 540 Lys Cys Trp Ala Gly Gly Asp Ile Leu Leu Gly Asp Ile Ile Leu Ile 545 550 555 560 Ile Asp Ser Asp Thr Arg Val Pro Glu Asp Cys Phe Val Asp Ser Val 565 570 575 Ser Glu Met Glu Gln Ser Pro Glu Val Ala Ile Ile Gln His Ala Ser 580 585 590 Gly Val Met Met Val Val Gly Asn Tyr Trp Glu Lys Met Ile Ala Trp 595 600 605 Phe Thr Asn Met Ile Tyr Phe Ser Ile Ser Cys Val Ser Gly Asn Gly 610 615 620 Leu Thr Met Ala Ala Phe Val Gly His Asn Ala Phe Leu Arg Trp Ser 625 630 635 640 Ala Ile Gln Glu Leu Ala Tyr Ile Asp Glu Asp Asp Gly Arg Thr Lys 645 650 655 Tyr Trp Ser Glu Ser His Val Ser Glu Asp Phe Glu Met Thr Leu Lys 660 665 670 Leu Ala Ser Leu Gly Tyr Thr Ile Arg Ile Ala Thr Tyr His Asp Gly 675 680 685 Gly Phe Lys Glu Gly Val Ser Leu Thr Val Tyr Asp Glu Ile Thr Arg 690 695 700 Trp Ser Lys Tyr Ala Phe Gly Cys Ala Glu Ile Met Phe Ser Pro Phe 705 710 715 720 Lys Asp Trp Trp Lys Gly Lys Ile Phe Ala Arg Leu Phe Phe Val Phe 725 730 735 Leu Asn Ser His Ile Ser Leu Pro Cys Lys Phe Ser Ile Leu Gly Tyr 740 745 750 Met Gly Thr Tyr Tyr Ala Ile Ala Thr Ser Leu Ile Met Leu Val Ala 755 760 765 Asn Tyr Phe Ile Val Gly Tyr Tyr Asp Trp Gly Tyr Ser Arg Val Tyr 770 775 780 Ile Asp Ala Met Lys Val Phe Val Ser Val Met Val Val Phe Gly Cys 785 790 795 800 Ala Thr Gln Val Ala Tyr Ile Ile Gly Arg Tyr Arg Ile Tyr Lys His 805 810 815 Ser Ile Tyr Thr Met Val Leu Glu Phe Arg Tyr Ser Ile Leu Phe Ser 820 825 830 Val Phe Leu Gly Gly Leu Ser Trp His Met Ile Val Ser Ile Gly Ser 835 840 845 Tyr Phe Phe Ser Leu Asn Leu Gln Trp Gly Ala Thr Ala Lys Asp Ile 850 855 860 Asp Asp Ser Asn Phe Phe Lys Glu Leu Pro Lys Ala Ile Lys Asn Tyr 865 870 875 880 Lys Phe Met Tyr Ile Leu Cys Ile Phe Leu Ile Ala Gly Met Ile Val 885 890 895 Leu Ala Phe Phe Val Pro Tyr Ala Phe Gln Ile Arg Leu Leu Thr Cys 900 905 910 Ala Leu Pro Leu Gly Trp Ser Val Ala Ser His Phe Leu Ser Pro Ile 915 920 925 Val Leu Asn Pro Gln Leu Met Thr Phe Ala Trp 930 935 <210> 18 <211> 395 <212> PRT <213> Hypocrea jecorina <400> 18 Ala Trp Ala Asp Gly Asn Ile Arg Met Gly Asp Tyr Ile Leu Leu Ile 1 5 10 15 Asp Ser Asp Thr Arg Val Pro Ala Asp Cys Leu Leu Asp Ala Val Ser 20 25 30 Glu Met Glu Gln Ser Pro Asp Val Gly Ile Met Gln Phe Ser Ser Gly 35 40 45 Val Met Gln Val Val His Thr Tyr Phe Glu Asn Gly Ile Thr Phe Phe 50 55 60 Thr Asn Leu Ile Tyr Ser Ala Ile Arg Tyr Thr Val Ser Asn Gly Asp 65 70 75 80 Val Ala Pro Phe Val Gly His Asn Ala Ile Leu Arg Trp Ser Ala Ile 85 90 95 Gln Gln Val Ala Tyr Gln Asp Glu Asp Gly Tyr Asp Lys Phe Trp Ser 100 105 110 Glu Ser His Val Ser Glu Asp Phe Asp Met Ser Leu Arg Leu Gln Cys 115 120 125 Asn Gly Tyr Ile Ile Arg Leu Ala Ala Trp Ala Gly Glu Gly Phe Lys 130 135 140 Glu Gly Val Ser Leu Thr Val Tyr Asp Glu Leu Ala Arg Trp Glu Lys 145 150 155 160 Tyr Ala Tyr Gly Cys Asn Glu Leu Leu Phe His Pro Ile Arg Thr Trp 165 170 175 Leu Trp Arg Gly Pro Phe Thr Pro Leu Phe Arg Arg Phe Leu Phe Ser 180 185 190 Asn Ile Arg Phe Thr Ser Lys Val Thr Val Ile Ser Tyr Ile Gly Thr 195 200 205 Tyr Tyr Ala Ile Gly Ala Ala Trp Ile Leu Thr Ala Val Asn Tyr Phe 210 215 220 Val Met Gly Trp Phe Asn Gly Tyr Leu Asp Lys Tyr Tyr Val Asp Ser 225 230 235 240 Trp Gln Val Trp Phe Ser Ile Ile Ile Val Phe Asn Gly Leu Gly Asn 245 250 255 Ile Ala Leu Ala Val Met Arg Tyr Arg Val Gly Glu Arg Gly Leu Leu 260 265 270 Tyr Ala Leu Phe Glu Asn Phe Met Trp Thr Leu Met Leu Ala Ile Phe 275 280 285 Leu Gly Gly Leu Ser Leu His Val Ser Gln Ala Leu Leu Ala His Met 290 295 300 Phe Glu Ile Asn Met Thr Trp Gly Ala Thr Ser Lys Glu Ala Glu Phe 305 310 315 320 Ser Asn Phe Phe Ile Glu Val Pro Lys Val Leu Lys Lys Phe Lys Phe 325 330 335 Ser Met Leu Phe Ser Leu Ile Phe Ile Ala Gly Met Ile Ile Leu Ala 340 345 350 Gln Ala Pro Phe Val Pro Phe Asp Trp Arg Ile Lys Asp Phe Val Ala 355 360 365 Ile Leu Pro Met Ala Thr Val Ala Ala Ser His Phe Leu Leu Pro Leu 370 375 380 Ala Leu Asn Pro Ala Leu Met Thr Phe Ser Trp 385 390 395 <210> 19 <211> 1343 <212> PRT <213> Hypocrea jecorina <400> 19 Met Ile Glu Asp Thr Ala Ala Leu Ala Ala Ala Ala Glu Leu Ile Ala 1 5 10 15 Ser Leu Ala Cys Asp Pro Ala Ser Ala Ser Ala Ser Ser Ser Leu Val 20 25 30 Ser Val Gly Pro Gly Ser Ser Ile Lys Leu Pro Gly Arg Glu Asn Pro 35 40 45 Ala Lys Arg Thr Leu Glu Ile Glu Leu Glu Lys Leu Val Leu Arg Ile 50 55 60 Ser Gln Leu Glu Ser Arg Ala Ser Ala Ser Ala Asn Ala Ser Val Phe 65 70 75 80 Pro Glu Thr Pro Asn Glu Val Asn Asp Thr Leu Phe Asn Asp Asp Val 85 90 95 Asp Pro Ser Val Asn Gly Arg Pro Pro Val Ala Pro Gln Pro Arg Leu 100 105 110 Ser Gln Ala Gln Gln Gly Ser Leu Asp Ser Pro Ile Phe Val Ser Arg 115 120 125 Gln Leu Thr Lys Glu Ala Leu Gln Gly Leu Arg Asp His Val Asp Asp 130 135 140 Gln Ser Lys Leu Leu Asp Ser Gln Arg Gln Glu Leu Ala Gly Val Asn 145 150 155 160 Ala Gln Leu Leu Glu Gln Lys Gln Leu Gln Glu Arg Ala Leu Ala Met 165 170 175 Leu Glu Gln Glu Arg Val Ala Thr Leu Glu Arg Glu Leu Trp Lys His 180 185 190 Gln Lys Ala Asn Glu Ala Phe Gln Lys Ala Leu Arg Glu Ile Gly Glu 195 200 205 Ile Val Thr Ala Val Ala Arg Gly Asp Leu Thr Met Lys Val Arg Met 210 215 220 Asn Ser Val Glu Met Asp Pro Glu Ile Thr Thr Phe Lys Arg Thr Ile 225 230 235 240 Asn Ala Met Met Asp Gln Leu Gln Thr Phe Ala Ser Glu Val Ser Arg 245 250 255 Val Ala Arg Glu Val Gly Thr Glu Gly Leu Leu Gly Gly Gln Ala Arg 260 265 270 Ile Gly Gly Val Asp Gly Val Trp Lys Glu Leu Thr Asp Asn Val Asn 275 280 285 Ile Met Ala Gln Asn Leu Thr Asp Gln Val Arg Glu Ile Ala Ser Val 290 295 300 Thr Thr Ala Val Ala His Gly Asp Leu Thr Lys Lys Ile Glu Arg Pro 305 310 315 320 Ala Lys Gly Glu Ile Leu Gln Leu Gln Gln Thr Ile Asn Thr Met Val 325 330 335 Asp Gln Leu Arg Thr Phe Ala Ser Glu Val Thr Arg Val Ala Arg Asp 340 345 350 Val Gly Thr Glu Gly Ile Leu Gly Gly Gln Ala Asp Val Gly Gly Val 355 360 365 Lys Gly Met Trp Asn Asp Leu Thr Val Asn Val Asn Ala Met Ala Asn 370 375 380 Asn Leu Thr Thr Gln Val Arg Asp Ile Ile Lys Val Thr Thr Ala Val 385 390 395 400 Ala Lys Gly Asp Leu Thr Gln Lys Val Gln Ala Glu Cys Arg Gly Glu 405 410 415 Met Phe Lys Leu Lys Ser Thr Ile Asn Ser Met Val Asp Gln Leu Gln 420 425 430 Gln Phe Ala Arg Glu Val Thr Lys Ile Ala Arg Glu Val Gly Thr Glu 435 440 445 Gly Arg Leu Gly Gly Gln Ala Thr Val His Asp Val Glu Gly Thr Trp 450 455 460 Arg Asp Leu Thr Glu Asn Val Asn Gly Met Ala Met Asn Leu Thr Thr 465 470 475 480 Gln Val Arg Glu Ile Ala Lys Val Thr Thr Ala Val Ala Arg Gly Asp 485 490 495 Leu Thr Lys Lys Ile Gly Val Glu Val Lys Gly Glu Ile Leu Glu Leu 500 505 510 Lys Asn Thr Ile Asn Gln Met Val Asp Arg Leu Gly Thr Phe Ala Val 515 520 525 Glu Val Ser Lys Val Ala Arg Glu Val Gly Thr Asp Gly Thr Leu Gly 530 535 540 Gly Gln Ala Gln Val Ala Asn Val Glu Gly Lys Trp Lys Asp Leu Thr 545 550 555 560 Glu Asn Val Asn Thr Met Ala Ser Asn Leu Thr Val Gln Val Arg Ser 565 570 575 Ile Ser Ala Val Thr Gln Ala Ile Ala Asn Gly Asp Met Ser Gln Thr 580 585 590 Ile Asp Val Glu Ala Asn Gly Glu Ile Gln Val Leu Lys Glu Thr Ile 595 600 605 Asn Asn Met Val Ser Arg Leu Ser Ser Phe Cys Tyr Glu Val Gln Arg 610 615 620 Val Ala Lys Asp Val Gly Val Asp Gly Lys Met Gly Ala Gln Ala Asp 625 630 635 640 Val Ala Gly Leu Asn Gly Arg Trp Lys Glu Ile Thr Thr Asp Val Asn 645 650 655 Thr Met Ala Ser Asn Leu Thr Thr Gln Val Arg Ala Phe Ser Asp Ile 660 665 670 Thr Asn Leu Ala Thr Asp Gly Asp Phe Thr Lys Leu Val Asp Val Glu 675 680 685 Ala Ser Gly Glu Met Asp Glu Leu Lys Lys Lys Ile Asn Gln Met Ile 690 695 700 Ser Asn Leu Arg Asp Ser Ile Gln Arg Asn Thr Gln Ala Arg Glu Ala 705 710 715 720 Ala Glu Leu Ala Asn Lys Thr Lys Ser Glu Phe Leu Ala Asn Met Ser 725 730 735 His Glu Ile Arg Thr Pro Thr Asn Gly Ile Ile Gly Met Thr Gln Leu 740 745 750 Thr Leu Asp Thr Asp Leu Thr Gln Tyr Gln Arg Glu Met Leu Asn Ile 755 760 765 Val Asn Asp Leu Ala Asn Ser Leu Leu Thr Ile Ile Asp Asp Ile Leu 770 775 780 Asp Leu Ser Lys Ile Glu Ala Arg Arg Met Val Ile Glu Glu Ile Pro 785 790 795 800 Tyr Thr Leu Arg Gly Thr Val Phe Asn Ala Leu Lys Thr Leu Ala Val 805 810 815 Lys Ala Asn Glu Lys Phe Leu Asp Leu Thr Tyr Lys Val Asp Ser Ser 820 825 830 Val Pro Asp Tyr Val Ile Gly Asp Ser Phe Arg Leu Arg Gln Ile Ile 835 840 845 Leu Asn Leu Val Gly Asn Ala Ile Lys Phe Thr Glu His Gly Glu Val 850 855 860 Ser Leu Thr Ile Gln Glu Gln Glu Asp Lys Arg His Val Gly Pro Gly 865 870 875 880 Glu Tyr Ala Ile Glu Phe Ile Val Glu Asp Thr Gly Ile Gly Ile Ala 885 890 895 Lys Asp Lys Leu Asn Leu Ile Phe Asp Thr Phe Gln Gln Ala Asp Gly 900 905 910 Ser Met Thr Arg Lys Phe Gly Gly Thr Gly Leu Gly Leu Ser Ile Ser 915 920 925 Lys Arg Phe Val Asn Leu Met Gly Gly Asp Leu Trp Val Asn Ser Glu 930 935 940 Val Gly Lys Gly Ser Glu Phe His Phe Thr Cys Arg Val Lys Leu Ala 945 950 955 960 Asp Val His Ala Glu Ser Val Gln Gln Gln Leu Lys Pro Tyr Arg Gly 965 970 975 His Gln Val Leu Phe Val Asp Lys Ser Gln Ser Asn Ala Ala Thr His 980 985 990 Ile Gly Glu Met Leu Glu Glu Ile Gly Leu His Pro Val Val Val Asn 995 1000 1005 Ser Glu Lys Ser Ser Ala Leu Thr Arg Leu Lys Glu Gly Gly Ala Leu 1010 1015 1020 Pro Tyr Asp Ala Ile Ile Val Asp Ser Ile Asp Thr Ala Arg Arg Leu 1025 1030 1035 1040 Arg Ala Val Asp Asp Phe Lys Tyr Leu Pro Ile Val Leu Leu Ala Pro 1045 1050 1055 Val Val His Val Ser Leu Lys Ser Cys Leu Asp Leu Gly Ile Thr Ser 1060 1065 1070 Tyr Met Thr Met Pro Cys Lys Leu Ile Asp Leu Ser Asn Gly Met Ile 1075 1080 1085 Pro Ala Leu Glu Asn Arg Ala Thr Pro Ser Leu Ala Asp Val Thr Lys 1090 1095 1100 Ser Phe Glu Ile Leu Leu Ala Glu Asp Asn Thr Val Asn Gln Lys Leu 1105 1110 1115 1120 Ala Val Lys Ile Leu Glu Lys Tyr His His Val Val Thr Val Val Gly 1125 1130 1135 Asn Gly Trp Glu Ala Val Glu Ala Val Lys Gln Lys Lys Phe Asp Val 1140 1145 1150 Ile Leu Met Asp Val Gln Met Pro Ile Met Gly Gly Phe Glu Ala Thr 1155 1160 1165 Gly Lys Ile Arg Glu Tyr Glu Arg Gly Met Gly Thr His Arg Thr Pro 1170 1175 1180 Ile Ile Ala Leu Thr Ala His Ala Met Met Gly Asp Arg Glu Lys Cys 1185 1190 1195 1200 Ile Gln Ala Gln Met Asp Glu Tyr Leu Ser Lys Pro Leu Gln Gln Asn 1205 1210 1215 Gln Leu Ile Gln Thr Ile Leu Lys Cys Ala Thr Leu Gly Gly Ala Leu 1220 1225 1230 Leu Glu Lys Asn Arg Glu Arg Glu Leu Ala Leu Gln Ala Glu Ala Lys 1235 1240 1245 Ala Ser Gly Arg Leu Asp Gly Glu Arg Gly Met Leu Arg Pro Gly Leu 1250 1255 1260 Glu Gly Arg Ser Phe Thr Thr Arg Glu Pro Met Thr Lys Ser Arg Pro 1265 1270 1275 1280 Ser Leu Thr Lys Ala Thr Ser Lys Ala Leu Glu Glu Ala Arg Asn Ala 1285 1290 1295 Ala Ala Ala Asn Ala Gly Leu Arg Phe Ser Glu Leu Thr Gly Phe Ser 1300 1305 1310 Ala Asp Leu Met Glu Glu Leu Asp Asn Met Glu Asp Glu Asp Ser Phe 1315 1320 1325 Thr Lys Ala Arg Glu Asp Leu Ala Asp Arg Arg Ser Leu Ser Ser 1330 1335 1340 <210> 20 <211> 4067 <212> DNA <213> Hypocrea jecorina <400> 20 atgcagcaac cgccctcctt agttggcgac cgcagcatca ccggcctggg agacgcagcc 60 agccgaccaa atctctcttc atcctcgcct accgtcacca gcgcgccctc ggcaccgaca 120 tcgccaccgc cgcggccgcc aatatcgctg aatcccccgt cgcgagagcc tcctggcgtc 180 gagcccgtgc tccgcatcac gccagtcccg cgctccgtct ttgcctctgt ccaccagccg 240 cgcaagtcgt cgctggtcca gacgtcgcac gtcctgccct cgcccaggac cgccgccgca 300 gctcaccatc accatcccgt ctcgcattcc gcctctggca gcagcggcag caacggcagt 360 ggaagcggca gtggcagcgg cagcggcaat ctgctgcgtc aaacgcatcg cgacaccgtg 420 cacccccccg tcaagcggcc atccaccccg tcgtcgcatc ccaccagggg cgccagcacc 480 ggagcatcgc cgcagcaggg cgccagctcc cgaaaccgct cgtcgacgtc gcccgtttcg 540 tccccggcga gtcgcacgcc tccttatgca tctcgtcagg cctcagtttc ccattcccgc 600 cagcagcaca accaccatca tcagcaccaa caccagcatt accactccca caccagctcg 660 actaccagtc gcgccagcat cgaggccgta gtcggtgccg tccccgatcc ctcaggtcac 720 cgagcgccgc cgaaaccccg tcgaccggat cgcaaccact ttggcgcgtc agatcgcagc 780 gcaactccca ccctgtcgca cttcatgagg gcagagtcga gcatgtccat gagacattac 840 gagagcggcc ccttacgctc catgtcgccg aacccctacg gaacccctgc cgccaccacg 900 acgtcgtcca ctgccagaat gccgcacgag cagagccacg atccctacgc ccctcgcggc 960 cactctcgcg atcactcggg gaagagcagc agagacatgg gcaagccccg agctcagaag 1020 aatccctcac agaaggcgat gctctcccgt gccctgcaaa aggccaacac cgcagttcag 1080 ctcgacaatg ctcagaactt cgaaggcgct cgagaagcgt acgccgaggc ttgcgacttg 1140 ttgcagcagg tgcttgaccg aacaccggga gatgaggaca agcggaagct cgaagccatt 1200 gtaagtcacg gcggcaaccg gaatgtcgag cccgttgtct gtcattagta gatcacttgg 1260 aactgacaat ttcaatctgt agcaccaaac ttacaccagc cgcatcgatg agctggatca 1320 gttgggccct tggcaggttg agaccgtcaa ggctctgccg gcgcggccag agagcgagga 1380 gtacagcgcg tccatattca taccccagga ttacgacatg ggcgatgaag ctcccaggat 1440 tgagacggca cgggtggtga gctacatcgc tggagacaac gcgtctccct ttgcagcagc 1500 gcccaaccag tggcagcagt cgggaggtca cacggcatct gaacggctgc agcccaaccg 1560 cggtctggaa ccgggtctgc tacagtcgtc cttctctcgg gccccgaggt cgcccaggcg 1620 gctgcagtcc accgatgatc ttcgcgcaca gcatcaggag ggccagtatg cgcctccccc 1680 actctcgcct cgctcgcagt cgccggtaaa gacgcatgac catgacgacg acatgtttgc 1740 cgaactgcca ccacacgagc cctatcagta ccagcaagag cacgaccatc aagaccacca 1800 tcaagactac catcaacatc accgccatca caaccaccac catcacgaac gacagcccag 1860 cgagactgtc ctatcctcat acgagctcca gggtcatgtg gatggaggaa tccaaaactc 1920 atggctagat ccaattgacg agtcgggagg ctcaacagcg tcgtctgtac actcacgcac 1980 ctcttcgctt ggctaccgtc gacgccatat ccgggccgtg agcgggaaca ccgaggccga 2040 gtttgacacg gcgctggacg ctgctatcga ggctgcctac gacgacggct acgagcccat 2100 ggactctgta gactatggga ccattgatgc tgggggggac aatagcatgg caggcgtatt 2160 gcacaaggtg gagatggcgc gcgaacgagc gagacagacg gagcaggaag cctatgacga 2220 gctggccaac ctccgacagg cgcactcaca gaatccgcag caccagcagg aggaggacag 2280 gtatactgcc gagggattct acgaggacga ctcgtctgaa gaggaggaga gactattgga 2340 cgagattaca cgcgactttg ccattgagga ctttaccatg gaaaacccga atggcacaca 2400 ggtgtcagct aggcagcagg atgcatggaa cgaggacgag acgaggccgg atttcatctc 2460 gggcgtccga tccttttctg ccctgtcgca gaggccaccc attcctcagg cctacgccgc 2520 caacgcctcg cagccagcag ccccccctcc gacatccgca ttgccagacc tgccaccagg 2580 acgccctggt caaaatccaa agcaactcaa gatcgagacg gcaaacattg tacaaaccca 2640 gaagtcggtc tatgacgacg acgaaatctc cccaagcacg caagagccgc cgcccgagac 2700 gctcgtccgg acggcgagcg cgcagcctgt aaggccaccg ataccgacag aaagcttccc 2760 atccgaactc agtgctcccg catcgccaac cgccaagaag aggcttctgg aaggagagaa 2820 tgtgctgaat gcctcgcctt ctatccacag gctacggaag aacttttcgt cttctagctt 2880 gaggagcatg aagaacagga acatgtccgt ctcacatttg gacgacagct cggatgcttc 2940 ccccggcacc cccctgaatg accccttcaa caaggcacct gccgtgcccg tgcccgcgct 3000 gccgaccccc ttgctcgcgt cgttcaaaga tcatatggag gcagcggccg gtgttggctt 3060 ccacctgttt gacgacgagt ttcatgcagc ggcggctgcc ggcccccaaa gcccgcagag 3120 tcccagaagt cccgttgttg tctccatgga cgtccctgtg cctctggaac cctgtccaaa 3180 cgacttcatg ctgcgaccgt tttggctgat gcgatgccta taccagacac ttgtgcatcc 3240 caagggtggc tacatcagta cgaagctatt cgtgccgcga gacgtctggc gggtcaaagg 3300 tgtcaagatc aagaacgtgg aggacaaaat tgccaactgc gactttttga ctgcagccct 3360 gctgaagctg tccaaagtgg acactctgga tgcggatgcc gtgctggagg agatgcaagc 3420 cctcgagggc attctggagc agatacagcc ggtcctggcc cgaaagcttg gaaacgaagt 3480 gggcgttcaa ggttccggtc tgctgttcaa agacgcctcg atgatggaag gagaccccgg 3540 ttcagccgtg ccgcgatcag gaagtgtgtc tggcaaggcg tctgcgtttt cctggcgacg 3600 gcttcggcca aagacgtcgg gcgtcgggct gggagggtcg tacagcagcc gcaacgccag 3660 tgctgagacg aaggaggcct caacgctggc aacggtgccc atgacgccga aaccgacaag 3720 ccgttcggcc aagcgagacg tgagccaggt tcagttcatc gggcccaatg cgagctacat 3780 gggctctctc gcgcgcttgt ttgacgctgc gcaggcagtt ggtaagcata ttgcgatacg 3840 cataccggtt acagtgacgg caagctaacg atgatgcaga tcaaattgca aggcaggtcg 3900 acgaccccgg tttgcggctt gcggacaaga ctcaggtcgg cttggagctc tgcacccggc 3960 acgccgctga gttctttggc ttttacattt gccgattcgt cttggccgac ctcggcctgt 4020 tgctggacaa gttcctcaaa cgaggaagcg aatgggtcat gacatga 4067 <210> 21 <211> 1308 <212> PRT <213> Hypocrea jecorina <400> 21 Met Gln Gln Pro Pro Ser Leu Val Gly Asp Arg Ser Ile Thr Gly Leu 1 5 10 15 Gly Asp Ala Ala Ser Arg Pro Asn Leu Ser Ser Ser Ser Pro Thr Val 20 25 30 Thr Ser Ala Pro Ser Ala Pro Thr Ser Pro Pro Pro Arg Pro Pro Ile 35 40 45 Ser Leu Asn Pro Pro Ser Arg Glu Pro Pro Gly Val Glu Pro Val Leu 50 55 60 Arg Ile Thr Pro Val Pro Arg Ser Val Phe Ala Ser Val His Gln Pro 65 70 75 80 Arg Lys Ser Ser Leu Val Gln Thr Ser His Val Leu Pro Ser Pro Arg 85 90 95 Thr Ala Ala Ala Ala His His His His Pro Val Ser His Ser Ala Ser 100 105 110 Gly Ser Ser Gly Ser Asn Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser 115 120 125 Gly Asn Leu Leu Arg Gln Thr His Arg Asp Thr Val His Pro Pro Val 130 135 140 Lys Arg Pro Ser Thr Pro Ser Ser His Pro Thr Arg Gly Ala Ser Thr 145 150 155 160 Gly Ala Ser Pro Gln Gln Gly Ala Ser Ser Arg Asn Arg Ser Ser Thr 165 170 175 Ser Pro Val Ser Ser Pro Ala Ser Arg Thr Pro Pro Tyr Ala Ser Arg 180 185 190 Gln Ala Ser Val Ser His Ser Arg Gln Gln His Asn His His His Gln 195 200 205 His Gln His Gln His Tyr His Ser His Thr Ser Ser Thr Thr Ser Arg 210 215 220 Ala Ser Ile Glu Ala Val Val Gly Ala Val Pro Asp Pro Ser Gly His 225 230 235 240 Arg Ala Pro Pro Lys Pro Arg Arg Pro Asp Arg Asn His Phe Gly Ala 245 250 255 Ser Asp Arg Ser Ala Thr Pro Thr Leu Ser His Phe Met Arg Ala Glu 260 265 270 Ser Ser Met Ser Met Arg His Tyr Glu Ser Gly Pro Leu Arg Ser Met 275 280 285 Ser Pro Asn Pro Tyr Gly Thr Pro Ala Ala Thr Thr Thr Ser Ser Thr 290 295 300 Ala Arg Met Pro His Glu Gln Ser His Asp Pro Tyr Ala Pro Arg Gly 305 310 315 320 His Ser Arg Asp His Ser Gly Lys Ser Ser Arg Asp Met Gly Lys Pro 325 330 335 Arg Ala Gln Lys Asn Pro Ser Gln Lys Ala Met Leu Ser Arg Ala Leu 340 345 350 Gln Lys Ala Asn Thr Ala Val Gln Leu Asp Asn Ala Gln Asn Phe Glu 355 360 365 Gly Ala Arg Glu Ala Tyr Ala Glu Ala Cys Asp Leu Leu Gln Gln Val 370 375 380 Leu Asp Arg Thr Pro Gly Asp Glu Asp Lys Arg Lys Leu Glu Ala Ile 385 390 395 400 His Gln Thr Tyr Thr Ser Arg Ile Asp Glu Leu Asp Gln Leu Gly Pro 405 410 415 Trp Gln Val Glu Thr Val Lys Ala Leu Pro Ala Arg Pro Glu Ser Glu 420 425 430 Glu Tyr Ser Ala Ser Ile Phe Ile Pro Gln Asp Tyr Asp Met Gly Asp 435 440 445 Glu Ala Pro Arg Ile Glu Thr Ala Arg Val Val Ser Tyr Ile Ala Gly 450 455 460 Asp Asn Ala Ser Pro Phe Ala Ala Ala Pro Asn Gln Trp Gln Gln Ser 465 470 475 480 Gly Gly His Thr Ala Ser Glu Arg Leu Gln Pro Asn Arg Gly Leu Glu 485 490 495 Pro Gly Leu Leu Gln Ser Ser Phe Ser Arg Ala Pro Arg Ser Pro Arg 500 505 510 Arg Leu Gln Ser Thr Asp Asp Leu Arg Ala Gln His Gln Glu Gly Gln 515 520 525 Tyr Ala Pro Pro Pro Leu Ser Pro Arg Ser Gln Ser Pro Val Lys Thr 530 535 540 His Asp His Asp Asp Asp Met Phe Ala Glu Leu Pro Pro His Glu Pro 545 550 555 560 Tyr Gln Tyr Gln Gln Glu His Asp His Gln Asp His His Gln Asp Tyr 565 570 575 His Gln His His Arg His His Asn His His His His Glu Arg Gln Pro 580 585 590 Ser Glu Thr Val Leu Ser Ser Tyr Glu Leu Gln Gly His Val Asp Gly 595 600 605 Gly Ile Gln Asn Ser Trp Leu Asp Pro Ile Asp Glu Ser Gly Gly Ser 610 615 620 Thr Ala Ser Ser Val His Ser Arg Thr Ser Ser Leu Gly Tyr Arg Arg 625 630 635 640 Arg His Ile Arg Ala Val Ser Gly Asn Thr Glu Ala Glu Phe Asp Thr 645 650 655 Ala Leu Asp Ala Ala Ile Glu Ala Ala Tyr Asp Asp Gly Tyr Glu Pro 660 665 670 Met Asp Ser Val Asp Tyr Gly Thr Ile Asp Ala Gly Gly Asp Asn Ser 675 680 685 Met Ala Gly Val Leu His Lys Val Glu Met Ala Arg Glu Arg Ala Arg 690 695 700 Gln Thr Glu Gln Glu Ala Tyr Asp Glu Leu Ala Asn Leu Arg Gln Ala 705 710 715 720 His Ser Gln Asn Pro Gln His Gln Gln Glu Glu Asp Arg Tyr Thr Ala 725 730 735 Glu Gly Phe Tyr Glu Asp Asp Ser Ser Glu Glu Glu Glu Arg Leu Leu 740 745 750 Asp Glu Ile Thr Arg Asp Phe Ala Ile Glu Asp Phe Thr Met Glu Asn 755 760 765 Pro Asn Gly Thr Gln Val Ser Ala Arg Gln Gln Asp Ala Trp Asn Glu 770 775 780 Asp Glu Thr Arg Pro Asp Phe Ile Ser Gly Val Arg Ser Phe Ser Ala 785 790 795 800 Leu Ser Gln Arg Pro Pro Ile Pro Gln Ala Tyr Ala Ala Asn Ala Ser 805 810 815 Gln Pro Ala Ala Pro Pro Pro Thr Ser Ala Leu Pro Asp Leu Pro Pro 820 825 830 Gly Arg Pro Gly Gln Asn Pro Lys Gln Leu Lys Ile Glu Thr Ala Asn 835 840 845 Ile Val Gln Thr Gln Lys Ser Val Tyr Asp Asp Asp Glu Ile Ser Pro 850 855 860 Ser Thr Gln Glu Pro Pro Pro Glu Thr Leu Val Arg Thr Ala Ser Ala 865 870 875 880 Gln Pro Val Arg Pro Pro Ile Pro Thr Glu Ser Phe Pro Ser Glu Leu 885 890 895 Ser Ala Pro Ala Ser Pro Thr Ala Lys Lys Arg Leu Leu Glu Gly Glu 900 905 910 Asn Val Leu Asn Ala Ser Pro Ser Ile His Arg Leu Arg Lys Asn Phe 915 920 925 Ser Ser Ser Ser Leu Arg Ser Met Lys Asn Arg Asn Met Ser Val Ser 930 935 940 His Leu Asp Asp Ser Ser Asp Ala Ser Pro Gly Thr Pro Leu Asn Asp 945 950 955 960 Pro Phe Asn Lys Ala Pro Ala Val Pro Val Pro Ala Leu Pro Thr Pro 965 970 975 Leu Leu Ala Ser Phe Lys Asp His Met Glu Ala Ala Ala Gly Val Gly 980 985 990 Phe His Leu Phe Asp Asp Glu Phe His Ala Ala Ala Ala Ala Gly Pro 995 1000 1005 Gln Ser Pro Gln Ser Pro Arg Ser Pro Val Val Val Ser Met Asp Val 1010 1015 1020 Pro Val Pro Leu Glu Pro Cys Pro Asn Asp Phe Met Leu Arg Pro Phe 1025 1030 1035 1040 Trp Leu Met Arg Cys Leu Tyr Gln Thr Leu Val His Pro Lys Gly Gly 1045 1050 1055 Tyr Ile Ser Thr Lys Leu Phe Val Pro Arg Asp Val Trp Arg Val Lys 1060 1065 1070 Gly Val Lys Ile Lys Asn Val Glu Asp Lys Ile Ala Asn Cys Asp Phe 1075 1080 1085 Leu Thr Ala Ala Leu Leu Lys Leu Ser Lys Val Asp Thr Leu Asp Ala 1090 1095 1100 Asp Ala Val Leu Glu Glu Met Gln Ala Leu Glu Gly Ile Leu Glu Gln 1105 1110 1115 1120 Ile Gln Pro Val Leu Ala Arg Lys Leu Gly Asn Glu Val Gly Val Gln 1125 1130 1135 Gly Ser Gly Leu Leu Phe Lys Asp Ala Ser Met Met Glu Gly Asp Pro 1140 1145 1150 Gly Ser Ala Val Pro Arg Ser Gly Ser Val Ser Gly Lys Ala Ser Ala 1155 1160 1165 Phe Ser Trp Arg Arg Leu Arg Pro Lys Thr Ser Gly Val Gly Leu Gly 1170 1175 1180 Gly Ser Tyr Ser Ser Arg Asn Ala Ser Ala Glu Thr Lys Glu Ala Ser 1185 1190 1195 1200 Thr Leu Ala Thr Val Pro Met Thr Pro Lys Pro Thr Ser Arg Ser Ala 1205 1210 1215 Lys Arg Asp Val Ser Gln Val Gln Phe Ile Gly Pro Asn Ala Ser Tyr 1220 1225 1230 Met Gly Ser Leu Ala Arg Leu Phe Asp Ala Ala Gln Ala Val Asp Gln 1235 1240 1245 Ile Ala Arg Gln Val Asp Asp Pro Gly Leu Arg Leu Ala Asp Lys Thr 1250 1255 1260 Gln Val Gly Leu Glu Leu Cys Thr Arg His Ala Ala Glu Phe Phe Gly 1265 1270 1275 1280 Phe Tyr Ile Cys Arg Phe Val Leu Ala Asp Leu Gly Leu Leu Leu Asp 1285 1290 1295 Lys Phe Leu Lys Arg Gly Ser Glu Trp Val Met Thr 1300 1305 <210> 22 <211> 2731 <212> DNA <213> Hypocrea jecorina <400> 22 atgcagcaac cgccctcctt agttggcgac cgcagcatca ccggcctggg agacgcagcc 60 agccgaccaa atctctcttc atcctcgcct accgtcacca gcgcgccctc ggcaccgaca 120 tcgccaccgc cgcggccgcc aatatcgctg aatcccccgt cgcgagagcc tcctggcgtc 180 gagcccgtgc tccgcatcac gccagtcccg cgctccgtct ttgcctctgt ccaccagccg 240 cgcaagtcgt cgctggtcca gacgtcgcac gtcctgccct cgcccaggac cgccgccgca 300 gctcaccatc accatcccgt ctcgcattcc gcctctggca gcagcggcag caacggcagt 360 ggaagcggca gtggcagcgg cagcggcaat ctgctgcgtc aaacgcatcg cgacaccgtg 420 cacccccccg tcaagcggcc atccaccccg tcgtcgcatc ccaccagggg cgccagcacc 480 ggagcatcgc cgcagcaggg cgccagctcc cgaaaccgct cgtcgacgtc gcccgtttcg 540 tccccggcga gtcgcacgcc tccttatgca tctcgtcagg cctcagtttc ccattcccgc 600 cagcagcaca accaccatca tcagcaccaa caccagcatt accactccca caccagctcg 660 actaccagtc gcgccagcat cgaggccgta gtcggtgccg tccccgatcc ctcaggtcac 720 cgagcgccgc cgaaaccccg tcgaccggat cgcaaccact ttggcgcgtc agatcgcagc 780 gcaactccca ccctgtcgca cttcatgagg gcagagtcga gcatgtccat gagacattac 840 gagagcggcc ccttacgctc catgtcgccg aacccctacg gaacccctgc cgccaccacg 900 acgtcgtcca ctgccagaat gccgcacgag cagagccacg atccctacgc ccctcgcggc 960 cactctcgcg atcactcggg gaagagcagc agagacatgg gcaagccccg agctcagaag 1020 aatccctcac agaaggcgat gctctcccgt gccctgcaaa aggccaacac cgcagttcag 1080 ctcgacaatg ctcagaactt cgaaggcgct cgagaagcgt acgccgaggc ttgcgacttg 1140 ttgcagcagg tgcttgaccg aacaccggga gatgaggaca agcggaagct cgaagccatt 1200 gtaagtcacg gcggcaaccg gaatgtcgag cccgttgtct gtcattagta gatcacttgg 1260 aactgacaat ttcaatctgt agcaccaaac ttacaccagc cgcatcgatg agctggatca 1320 gttgggccct tggcaggttg agaccgtcaa ggctctgccg gcgcggccag agagcgagga 1380 gtacagcgcg tccatattca taccccagga ttacgacatg ggcgatgaag ctcccaggat 1440 tgagacggca cgggtggtga gctacatcgc tggagacaac gcgtctccct ttgcagcagc 1500 gcccaaccag tggcagcagt cgggaggtca cacggcatct gaacggctgc agcccaaccg 1560 cggtctggaa ccgggtctgc tacagtcgtc cttctctcgg gccccgaggt cgcccaggcg 1620 gctgcagtcc accgatgatc ttcgcgcaca gcatcaggag ggccagtatg cgcctccccc 1680 actctcgcct cgctcgcagt cgccggtaaa gacgcatgac catgacgacg acatgtttgc 1740 cgaactgcca ccacacgagc cctatcagta ccagcaagag cacgaccatc aagaccacca 1800 tcaagactac catcaacatc accgccatca caaccaccac catcacgaac gacagcccag 1860 cgagactgtc ctatcctcat acgagctcca gggtcatgtg gatggaggaa tccaaaactc 1920 atggctagat ccaattgacg agtcgggagg ctcaacagcg tcgtctgtac actcacgcac 1980 ctcttcgctt ggctaccgtc gacgccatat ccgggccgtg agcgggaaca ccgaggccga 2040 gtttgacacg gcgctggacg ctgctatcga ggctgcctac gacgacggct acgagcccat 2100 ggactctgta gactatggga ccattgatgc tggggggaca atagcatggc aggcgtattg 2160 cacaaggtgg agatggcgcg cgaacgagcg agacagacgg agcaggaagc ctatgacgag 2220 ctggccaacc tccgacaggc gcactcacag aatccgcagc accagcagga ggaggacagg 2280 tatactgccg agggattcta cgaggacgac tcgtctgaag aggaggagag actattggac 2340 gagattacac gcgactttgc cattgaggac tttaccatgg aaaacccgaa tggcacacag 2400 gtgtcagcta ggcagcagga tgcatggaac gaggacgaga cgaggccgga tttcatctcg 2460 ggcgtccgat ccttttctgc cctgtcgcag aggccaccca ttcctcaggc ctacgccgcc 2520 aacgcctcgc agccagcagc cccccctccg acatccgcat tgccagacct gccaccagga 2580 cgccctggtc aaaatccaaa gcaactcaag atcgagacgg caaacattgt acaaacccag 2640 aagtcggtct atgacgacga cgaaatctcc ccaagcacgc aagagccgcc gcccgagacg 2700 ctcgtccgga cggcgagcgc gcagcctgta a 2731 <210> 23 <211> 882 <212> PRT <213> Hypocrea jecorina <400> 23 Met Gln Gln Pro Pro Ser Leu Val Gly Asp Arg Ser Ile Thr Gly Leu 1 5 10 15 Gly Asp Ala Ala Ser Arg Pro Asn Leu Ser Ser Ser Ser Pro Thr Val 20 25 30 Thr Ser Ala Pro Ser Ala Pro Thr Ser Pro Pro Pro Arg Pro Pro Ile 35 40 45 Ser Leu Asn Pro Pro Ser Arg Glu Pro Pro Gly Val Glu Pro Val Leu 50 55 60 Arg Ile Thr Pro Val Pro Arg Ser Val Phe Ala Ser Val His Gln Pro 65 70 75 80 Arg Lys Ser Ser Leu Val Gln Thr Ser His Val Leu Pro Ser Pro Arg 85 90 95 Thr Ala Ala Ala Ala His His His His Pro Val Ser His Ser Ala Ser 100 105 110 Gly Ser Ser Gly Ser Asn Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser 115 120 125 Gly Asn Leu Leu Arg Gln Thr His Arg Asp Thr Val His Pro Pro Val 130 135 140 Lys Arg Pro Ser Thr Pro Ser Ser His Pro Thr Arg Gly Ala Ser Thr 145 150 155 160 Gly Ala Ser Pro Gln Gln Gly Ala Ser Ser Arg Asn Arg Ser Ser Thr 165 170 175 Ser Pro Val Ser Ser Pro Ala Ser Arg Thr Pro Pro Tyr Ala Ser Arg 180 185 190 Gln Ala Ser Val Ser His Ser Arg Gln Gln His Asn His His His Gln 195 200 205 His Gln His Gln His Tyr His Ser His Thr Ser Ser Thr Thr Ser Arg 210 215 220 Ala Ser Ile Glu Ala Val Val Gly Ala Val Pro Asp Pro Ser Gly His 225 230 235 240 Arg Ala Pro Pro Lys Pro Arg Arg Pro Asp Arg Asn His Phe Gly Ala 245 250 255 Ser Asp Arg Ser Ala Thr Pro Thr Leu Ser His Phe Met Arg Ala Glu 260 265 270 Ser Ser Met Ser Met Arg His Tyr Glu Ser Gly Pro Leu Arg Ser Met 275 280 285 Ser Pro Asn Pro Tyr Gly Thr Pro Ala Ala Thr Thr Thr Ser Ser Thr 290 295 300 Ala Arg Met Pro His Glu Gln Ser His Asp Pro Tyr Ala Pro Arg Gly 305 310 315 320 His Ser Arg Asp His Ser Gly Lys Ser Ser Arg Asp Met Gly Lys Pro 325 330 335 Arg Ala Gln Lys Asn Pro Ser Gln Lys Ala Met Leu Ser Arg Ala Leu 340 345 350 Gln Lys Ala Asn Thr Ala Val Gln Leu Asp Asn Ala Gln Asn Phe Glu 355 360 365 Gly Ala Arg Glu Ala Tyr Ala Glu Ala Cys Asp Leu Leu Gln Gln Val 370 375 380 Leu Asp Arg Thr Pro Gly Asp Glu Asp Lys Arg Lys Leu Glu Ala Ile 385 390 395 400 His Gln Thr Tyr Thr Ser Arg Ile Asp Glu Leu Asp Gln Leu Gly Pro 405 410 415 Trp Gln Val Glu Thr Val Lys Ala Leu Pro Ala Arg Pro Glu Ser Glu 420 425 430 Glu Tyr Ser Ala Ser Ile Phe Ile Pro Gln Asp Tyr Asp Met Gly Asp 435 440 445 Glu Ala Pro Arg Ile Glu Thr Ala Arg Val Val Ser Tyr Ile Ala Gly 450 455 460 Asp Asn Ala Ser Pro Phe Ala Ala Ala Pro Asn Gln Trp Gln Gln Ser 465 470 475 480 Gly Gly His Thr Ala Ser Glu Arg Leu Gln Pro Asn Arg Gly Leu Glu 485 490 495 Pro Gly Leu Leu Gln Ser Ser Phe Ser Arg Ala Pro Arg Ser Pro Arg 500 505 510 Arg Leu Gln Ser Thr Asp Asp Leu Arg Ala Gln His Gln Glu Gly Gln 515 520 525 Tyr Ala Pro Pro Pro Leu Ser Pro Arg Ser Gln Ser Pro Val Lys Thr 530 535 540 His Asp His Asp Asp Asp Met Phe Ala Glu Leu Pro Pro His Glu Pro 545 550 555 560 Tyr Gln Tyr Gln Gln Glu His Asp His Gln Asp His His Gln Asp Tyr 565 570 575 His Gln His His Arg His His Asn His His His His Glu Arg Gln Pro 580 585 590 Ser Glu Thr Val Leu Ser Ser Tyr Glu Leu Gln Gly His Val Asp Gly 595 600 605 Gly Ile Gln Asn Ser Trp Leu Asp Pro Ile Asp Glu Ser Gly Gly Ser 610 615 620 Thr Ala Ser Ser Val His Ser Arg Thr Ser Ser Leu Gly Tyr Arg Arg 625 630 635 640 Arg His Ile Arg Ala Val Ser Gly Asn Thr Glu Ala Glu Phe Asp Thr 645 650 655 Ala Leu Asp Ala Ala Ile Glu Ala Ala Tyr Asp Asp Gly Tyr Glu Pro 660 665 670 Met Asp Ser Val Asp Tyr Gly Thr Ile Asp Ala Gly Gly Thr Ile Ala 675 680 685 Trp Gln Ala Tyr Cys Thr Arg Trp Arg Trp Arg Ala Asn Glu Arg Asp 690 695 700 Arg Arg Ser Arg Lys Pro Met Thr Ser Trp Pro Thr Ser Asp Arg Arg 705 710 715 720 Thr His Arg Ile Arg Ser Thr Ser Arg Arg Arg Thr Gly Ile Leu Pro 725 730 735 Arg Asp Ser Thr Arg Thr Thr Arg Leu Lys Arg Arg Arg Asp Tyr Trp 740 745 750 Thr Arg Leu His Ala Thr Leu Pro Leu Arg Thr Leu Pro Trp Lys Thr 755 760 765 Arg Met Ala His Arg Cys Gln Leu Gly Ser Arg Met His Gly Thr Arg 770 775 780 Thr Arg Arg Gly Arg Ile Ser Ser Arg Ala Ser Asp Pro Phe Leu Pro 785 790 795 800 Cys Arg Arg Gly His Pro Phe Leu Arg Pro Thr Pro Pro Thr Pro Arg 805 810 815 Ser Gln Gln Pro Pro Leu Arg His Pro His Cys Gln Thr Cys His Gln 820 825 830 Asp Ala Leu Val Lys Ile Gln Ser Asn Ser Arg Ser Arg Arg Gln Thr 835 840 845 Leu Tyr Lys Pro Arg Ser Arg Ser Met Thr Thr Thr Lys Ser Pro Gln 850 855 860 Ala Arg Lys Ser Arg Arg Pro Arg Arg Ser Ser Gly Arg Arg Ala Arg 865 870 875 880 Ser Leu <210> 24 <211> 896 <212> PRT <213> Trichoderma harzianum <400> 24 Met Gly Ile Thr Ser Tyr Phe Lys Ala Ser Thr Lys Lys Ala Glu Gln 1 5 10 15 Glu Thr Ala Ala Pro Pro Ala Pro Pro Ala Lys Pro Val Ala Pro Pro 20 25 30 Arg Leu Gln Gln Glu Thr Arg Gln Ser Ile Met Ser Glu Lys Pro Pro 35 40 45 Ser Ser Val Ser Gly Asn Asp Met Asp Leu Gln Pro Pro Thr Pro Arg 50 55 60 Phe His Ser Arg Pro Gln Ser Ser Ser Gly Arg Ser Thr Pro Ser Met 65 70 75 80 Gln Ser Ser Met Phe Leu Asp Asp Ile Lys His Glu Val Met Val Asn 85 90 95 Tyr Leu Tyr Gln Gln Gln Cys Ser Gln Leu Trp Val Ser Asp Gly Ser 100 105 110 Gly Glu Ile Glu Gly Val Leu Leu Arg Lys Ala Arg Gly His Tyr Met 115 120 125 Ala Cys Pro Pro Gln Leu Ala Ser Ser Pro Phe Ala Leu Ala Cys Ala 130 135 140 Ala Leu Asn Val Gln Cys Ala Met Thr Val Asn Ser Arg Val Ile Lys 145 150 155 160 Thr Phe Leu Gln Trp Ser Pro Asp Ala Val Asp Val Pro Leu Met Asn 165 170 175 Gly Leu Arg Val Gln Ile Leu Pro Thr Ile Asp Asp Leu Pro Arg Ala 180 185 190 Arg Lys Tyr Gln Phe Ala Ala Phe Val Ala Ser Glu Gly Leu Leu Ile 195 200 205 Val Trp Asp Asp Asp Ala Leu His Leu Val Ala Arg Ala Lys Ala Ile 210 215 220 Glu Ser Glu Leu Met Glu Leu Val Trp Lys Ala Gly Asn Pro Asp Glu 225 230 235 240 Glu Gly Glu Asp Glu Lys Arg Ala Gln Pro Val Ala Glu Val Glu Ile 245 250 255 Asp Glu Glu Ser Gly Glu Ile Lys Pro Glu Lys Arg Pro Ile His Leu 260 265 270 Gln Asn Thr Val Leu Val Ser Leu Thr Leu Val Leu Val Thr Val Ser 275 280 285 Leu Gly Ala Ala Trp Arg Gln Leu Ala Ile Glu Val Ser Val Asp Asn 290 295 300 Thr Tyr Ile Arg Leu Ala Leu Val Ala Leu Ala Pro Val Gln Ile Phe 305 310 315 320 Phe Thr Leu Phe Phe Ala Gln Val Ile Val Gly Cys Leu Ala Gln Ile 325 330 335 Phe Gly Pro Ile Arg Gln Leu Thr Ile Asn Ser Lys Phe Tyr Ser Ala 340 345 350 Arg Pro Pro Pro Arg Leu Gln Ser Ala Ile Leu Pro His Val Thr Ile 355 360 365 Gln Cys Pro Val Tyr Lys Glu Gly Leu Gln Gly Val Ile Met Pro Thr 370 375 380 Val Lys Ser Ile Lys Gln Ala Met Ser Thr Tyr Glu Leu Gln Gly Gly 385 390 395 400 Ser Ala Asn Met Phe Ile Asn Asp Asp Gly Leu Gln Leu Ile Ser Glu 405 410 415 Glu Asp Arg Leu Ala Arg Ile Glu Phe Tyr Ala Asp Asn Ser Ile Gly 420 425 430 Trp Val Ala Arg Pro Lys His Gly Glu Asn Gly Phe Thr Arg Lys Gly 435 440 445 Lys Phe Lys Lys Ala Ser Asn Met Asn Phe Ala Leu Met Ile Ser Cys 450 455 460 Lys Val Glu Glu Lys Leu Gln Ala Ile Glu Arg Pro Pro Glu Trp Ser 465 470 475 480 Gln Asn Asp Glu Ala Leu Ala Tyr Glu Glu Ala Leu Lys Glu Val Leu 485 490 495 Glu Ala Asp Gly Arg Ala Trp Ala Asp Gly Asn Ile Arg Met Gly Asp 500 505 510 Tyr Ile Leu Leu Ile Asp Ser Asp Thr Arg Val Pro Ala Asp Cys Leu 515 520 525 Leu Asp Ala Val Ser Glu Met Glu Gln Ser Pro Asp Val Gly Ile Met 530 535 540 Gln Phe Ser Ser Gly Val Met Gln Val Val His Thr Tyr Phe Glu Asn 545 550 555 560 Gly Ile Thr Phe Phe Thr Asn Leu Ile Tyr Ser Ala Ile Arg Tyr Thr 565 570 575 Val Ser Asn Gly Asp Val Ala Pro Phe Val Gly His Asn Ala Ile Leu 580 585 590 Arg Trp Ser Ala Ile Gln Gln Val Ala Tyr Gln Asp Glu Asp Gly Tyr 595 600 605 Asp Lys Phe Trp Ser Glu Ser His Val Ser Glu Asp Phe Asp Met Ser 610 615 620 Leu Arg Leu Gln Val Asn Gly Tyr Ile Ile Arg Leu Ala Ala Trp Ala 625 630 635 640 Gly Glu Gly Phe Lys Glu Gly Val Ser Leu Thr Val Tyr Asp Glu Leu 645 650 655 Ala Arg Trp Glu Lys Tyr Ala Tyr Gly Cys Asn Glu Leu Leu Phe His 660 665 670 Pro Ile Arg Thr Trp Leu Trp Arg Gly Pro Phe Thr Pro Leu Phe Arg 675 680 685 Arg Phe Leu Phe Ser Asn Ile Arg Phe Thr Ser Lys Ile Thr Val Ile 690 695 700 Ser Tyr Ile Gly Thr Tyr Tyr Ala Ile Gly Ala Ala Trp Ile Leu Thr 705 710 715 720 Val Val Asn Tyr Phe Val Met Gly Trp Tyr Asn Gly Tyr Leu Asp Lys 725 730 735 Tyr Tyr Ile Asp Ser Trp Gln Val Trp Phe Ser Ile Ile Ile Val Phe 740 745 750 Asn Gly Leu Gly Asn Ile Ala Leu Ala Val Met Arg Tyr Arg Val Gly 755 760 765 Glu Arg Gly Leu Leu Tyr Ala Leu Phe Glu Asn Phe Met Trp Thr Leu 770 775 780 Met Leu Ala Ile Phe Leu Gly Gly Leu Ser Leu His Val Ser Gln Ala 785 790 795 800 Leu Leu Ala His Met Phe Glu Ile Asn Met Thr Trp Gly Ala Thr Ala 805 810 815 Lys Glu Ala Glu Phe Ser Asn Phe Phe Ile Glu Val Pro Lys Val Leu 820 825 830 Lys Lys Phe Lys Phe Ser Met Ile Phe Ser Leu Ile Phe Ile Ile Gly 835 840 845 Met Ile Leu Leu Ala Gln Ala Pro Phe Val Pro Tyr Asp Trp Gln Ile 850 855 860 Lys Asp Phe Val Ala Ile Leu Pro Met Ala Thr Val Ala Ala Ser His 865 870 875 880 Phe Leu Leu Pro Leu Ala Leu Asn Pro Ala Leu Met Thr Phe Ser Trp 885 890 895

Claims

모 세포로부터 유래된 변형된 자낭균류(Ascomycota) 세포로서, 변형된 세포는 서열 번호 2, 서열 번호 4, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 변이체 LOV 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함하고, 변형된 세포는 동일한 조건 하에 발효될 때 모 세포에 비해 향상된 단백질 생산성 표현형을 포함하는, 변형된 자낭균류 세포.
제1항에 있어서, 관심 단백질(POI: protein of interest)을 암호화하는 폴리뉴클레오타이드를 포함하는, 변형된 세포.
제1항에 있어서, 서열 번호 19의 NIK1(M743T) 단백질을 암호화하는 폴리뉴클레오타이드 작제물을 포함하는, 변형된 세포.
제1항 내지 제3항 중 어느 한 항에 있어서, SSB7 MPG1, SFB3, SEB1, CRZ1, TSP2 및/또는 GAS1로 이루어진 군으로부터 선택된 단백질의 발현/생산을 결실시키거나 파괴시키거나 감소시키는 적어도 하나의 유전적 변형을 포함하는, 변형된 세포.
제1항 내지 제4항 중 어느 한 항에 있어서, 자낭균류 세포는 트리초데르마 종(Trichoderma sp.), 아스페르길루스 종(Aspergillus sp.), 푸사륨 종(Fusarium sp.), 페니실리움 종(Penicillium sp.), 칸디다 종(Candida sp.), 크리소스포륨 종(Chrysosporium sp.), 세팔로스포륨 종(Cephalosporium sp.), 탈라로마이세스 종(Talaromyces sp.), 뉴로스포라 종(Neurospora sp.) 및 마이셀리오프토라 종(Myceliophthora sp.)으로부터 선택되는, 변형된 세포.
제5항에 있어서, 모 아스페르길루스 종 세포는 서열 번호　11 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고, 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함하는, 변형된 세포.
제5항에 있어서, 모 페니실리움 종 세포는 서열 번호　12 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고, 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함하는, 변형된 세포.
제5항에 있어서, 모 탈라로마이세스 종 세포는 서열 번호　13 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고, 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함하는, 변형된 세포.
제5항에 있어서, 모 푸사륨 종 세포는 서열 번호　14 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고, 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함하는, 변형된 세포.
제5항에 있어서, 모 마이셀리오프토라 종 세포는 서열 번호　15 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고, 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함하는, 변형된 세포.
제5항에 있어서, 모 뉴로스포라 종 세포는 서열 번호　16 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고, 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함하는, 변형된 세포.
제5항에 있어서, 모 칸디다 종 세포는 서열 번호　17 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고, 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함하는, 변형된 세포.
제5항에 있어서, 모 트리초데르마 종 세포는 서열 번호　2 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고, 서열 번호　2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함하는, 변형된 세포.
제1항 내지 제13항 중 어느 한 항의 변형된 세포에 의해 생산된 POI.
엄격한 혼성화 조건 하에 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18의 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 핵산 서열과 혼성화하는 야생형 폴리뉴클레오타이드 서열을 포함하는 모 세포로부터 유래된 변형된 자낭균류 세포로서, 변형된 세포는 엄격한 혼성화 조건 하에 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18의 LOV 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 아미노산 서열에서의 리신(K) 잔기를 포함하는 핵산 서열과 혼성화하는 변형된 폴리뉴클레오타이드 서열을 포함하는, 변형된 자낭균류 세포.
벡터로서, 서열 번호　2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호　14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 변이체 LOV 단백질을 암호화하고, 서열 번호　4의 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 폴리뉴클레오타이드를 포함하는 벡터.
[청구항 16]
폴리뉴클레오타이드로서, 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 변이체 LOV 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 폴리뉴클레오타이드.
변이체 LOV 단백질을 암호화하는 폴리뉴클레오타이드로서, 변이체 단백질을 암호화하는 폴리뉴클레오타이드는 엄격한 혼성화 조건 하에 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18의 LOV 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 핵산 서열과 혼성화하는, 폴리뉴클레오타이드.
모 균주로부터 유래된 돌연변이체 트리초데르마 균주로서, 돌연변이체 균주는 서열 번호 4 또는 서열 번호 18과 적어도 75%의 서열 동일성을 포함하는 LOV 변이체 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 서열 위치에서 리신(K) 잔기를 포함하는 유전자를 포함하는, 돌연변이체 트리초데르마 균주.
제18항에 있어서, 돌연변이체 균주는 모 균주에 비해 향상된 단백질 생산성 표현형을 포함하는, 돌연변이체 균주.
제18항 또는 제19항에 있어서, 서열 번호 19의 NIK1(M743T) 단백질을 암호화하는 폴리뉴클레오타이드 작제물을 포함하는, 돌연변이체 균주.
제18항 내지 제20항 중 어느 한 항에 있어서, SSB7, MPG1 SFB3, SEB1, CRZ1, TSP2 및 GAS1로 이루어진 군으로부터 선택된 적어도 하나의 단백질을 암호화하는 유전자의 발현/생산을 결실시키거나 파괴하거나 감소시키는 유전적 변형을 포함하는, 돌연변이체 균주.
제18항 내지 제21항 중 어느 한 항의 돌연변이체 균주에 의해 생산된 POI.
향상된 단백질 생산성 표현형을 포함하는 변형된 자낭균류 세포를 작제하는 방법으로서,
(a) 모 자낭균류 세포를 수득하고, 서열 번호 4의 813번 위치에 상응하는 서열 위치에서 리신(K) 잔기를 포함하는 LOV 변이체 단백질을 암호화하는 폴리뉴클레오타이드 작제물을 세포로 도입하는 단계, 및
(b) 단계 (a)의 변형된 세포를 단리시키는 단계를 포함하고,
변형된 세포는 모 세포에 비해 향상된 단백질 생산성 표현형을 포함하는, 방법.
향상된 단백질 생산성 표현형을 포함하는 변형된 자낭균류 세포를 작제하는 방법으로서,
(a) 엄격한 혼성화 조건 하에 서열 번호　2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호　14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18의 LOV 단백질을 암호화하는 핵산 서열과 혼성화하는 야생형 lov 유전자를 포함하는 모 세포를 수득하는 단계,
(b) 단계 (a)의 모 세포를 변형시켜 서열 번호 2의 813번 위치에 상응하는 서열 위치에서 리신(K) 잔기를 포함하는 LOV (변이체) 단백질을 암호화하는 유전자를 포함하는 변형된 세포를 제조하는 단계, 및
(c) 단계 (b)의 변형된 세포를 단리시키는 단계를 포함하고,
변형된 세포는 모 세포에 비해 향상된 단백질 생산성 표현형을 포함하는, 방법.