KR20210038591A - 향상된 단백질 생산성 표현형을 포함하는 돌연변이체 및 유전자 변형된 사상성 진균 균주 및 이의 방법 - Google Patents
향상된 단백질 생산성 표현형을 포함하는 돌연변이체 및 유전자 변형된 사상성 진균 균주 및 이의 방법 Download PDFInfo
- Publication number
- KR20210038591A KR20210038591A KR1020217005248A KR20217005248A KR20210038591A KR 20210038591 A KR20210038591 A KR 20210038591A KR 1020217005248 A KR1020217005248 A KR 1020217005248A KR 20217005248 A KR20217005248 A KR 20217005248A KR 20210038591 A KR20210038591 A KR 20210038591A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- leu
- ser
- seq
- gly
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
- C12N15/815—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2408—Glucanases acting on alpha -1,4-glucosidic bonds
- C12N9/2411—Amylases
- C12N9/2428—Glucan 1,4-alpha-glucosidase (3.2.1.3), i.e. glucoamylase
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/37—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2405—Glucanases
- C12N9/2434—Glucanases acting on beta-1,4-glucosidic bonds
- C12N9/2437—Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01003—Glucan 1,4-alpha-glucosidase (3.2.1.3), i.e. glucoamylase
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Mycology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 발명의 본 균주 및 방법은 향상된 단백질 생산성 표현형을 포함하는 사상성 진균의 변이체 균주를 생성시키는 사상성 진균에서의 유전자 변형에 관한 것이다. 보다 구체적으로는, 본원에 제시되고 기재되고 예시된 것처럼, 향상된 단백질 생산성 표현형을 포함하는 사상성 진균의 이러한 변이체 균주는 상업용 분야에 대해 관심 단백질의 대규모 제조에서와 같은 액침된 배양에서의 성장에 매우 적합하다.
Description
본 발명은 일반적으로 생물학, 유전학, 분자 생물학, 사상성 진균, 산업적 단백질 제조 등의 분야에 관한 것이다. 보다 구체적으로는, 본 발명의 본 균주 및 방법은 향상된 단백질 생산성 표현형을 포함하는 사상성 진균의 변이체 균주를 생성시키는 사상성 진균에서의 유전자 변형에 관한 것이다. 보다 구체적으로는, 본원에 제시되고 기재되고 예시된 것처럼, 향상된 단백질 생산성 표현형을 포함하는 사상성 진균의 이러한 변이체 균주는 상업용 분야에 대해 관심 단백질의 대규모 제조에서와 같은 액침된 배양에서의 성장에 매우 적합하다.
관련 출원에 대한 상호 참조
본 출원은 2018년 7월 30일자로 출원된 미국 특허 가출원 제62/711,846호의 우선권을 주장하며, 본 가출원은 본원에 그 전체가 참고로 포함된다.
서열 목록의 참조
"NB41504-WO-PCT_SequenceListing.txt"로 명명된 서열 목록 텍스트 파일의 전자 제출의 내용은 2019년 7월 24일자로 생성되었으며, 크기가 160 KB이고, 본원에 그 전체가 참조로 포함된다.
사상성 진균(예를 들어, 아스페르길루스 종(Aspergillus sp.), 페니실리움 종(Penicillium sp.), 탈라로마이세스 종(Talaromyces sp.), 푸사륨 종(Fusarium sp.), 마이셀리오프토라 종(Myceliophthora sp.), 뉴로스포라 종(Neurospora sp.), 트리초데르마 종트리초데르마 종(Trichoderma sp.) 및 기타)은 자연적(내인성) 단백질 및 이종성 단백질을 고수준으로 발현할 수 있어서, 이들이 산업적 및/또는 상업적 분야, 예컨대 약제학적 분야, 동물 건강 분야, 식품 분야, 음료 분야 등에 대한 단백질(예를 들어, 효소) 및/또는 대사물질의 대규모 제조에 매우 적합하게 한다. 사상성 진균은 일반적으로 생물반응기(발효기)에서 균사체 액침 배양에서 성장하고, 생물반응기는 산소 및 영양소를 배양 배지(즉, 배양 브로스)로 도입하고 분포시키도록 적응된다. 예를 들어, 사상성 진균 트리초데르마 레세이(T. 레세이; 진균 하이포세라 제코리나(Hypocrea jecorina)의 무성생식)는 셀룰라아제 효소의 효과적인 생산자인 것으로 공지되어 있다(예를 들어, PCT 국제 공보 W01998/15619호, WO2005/028636호, WO2006/074005호, WO 1992/06221호, WO 1992/06209호, WO1992/06183호 및 WO2002/12465호 참조).
그러므로, 사상성 진균은 셀룰로오스 (유래) 에탄올, 텍스타일 가공, 그레인 가공, 세제, 섬유, 식품 첨가제, 사료 첨가제 등과 같은 상품의 제조에서 가치 있는 단백질을 생산하는 이의 능력에 대해 활용되어 왔다. 예를 들어, 이러한 진균 숙주 균주에서의 재조합 유전자 발현은 단백질의 생산에 흔한 방법(즉, 산업적 및 상업적 목적에 대한)이고, 그러므로, 진균 숙주 균주의 단백질 생산성 개선은 단백질 생산 비용의 중요한 경제적 인자이다. 따라서, 당업자에 의해 이해된 것처럼, 사상성 진균 균주에서의 단백질 생산을 향상시키기 위한 이러한 조성물 및 방법은 상당한 상업적 관심이 있다.
본원에 기재된 바대로, 향상된/증가된 단백질 생산성 표현형을 포함하는 유전자 변형된 사상성 진균 균주와 일반적으로 관련된 본 발명은 당해 분야에서의 이러한 진행 중이고 충족되지 않은 필요를 해결한다.
증가된 단백질 생산성 표현형을 갖는 사상성 진균과 관련된 균주, 세포, 방법, 작제물 및 기타가 본원에 기재된다. 따라서, 본 발명의 소정의 구현예는 모 세포로부터 유래된 변형된 자낭균류(Ascomycota) 세포에 관한 것이고, 여기서 변형된 세포는 서열 번호 2, 서열 번호 4, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 변이체 LOV 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함하고, 변형된 세포는 예를 들어 동일한 조건 하에 발효/배양될 때 모 세포에 비해 향상된 단백질 생산성 표현형을 포함한다. 소정의 구현예에서, 모 세포는 서열 번호 2, 서열 번호 4, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 야생형 폴리뉴클레오타이드 서열을 포함한다.
관련된 구현예에서, 진균 세포는 관심 단백질(POI)을 암호화하는 이종성 폴리뉴클레오타이드를 추가로 포함한다. 다른 구현예에서, 세포는 서열 번호 19의 NIK1(M743T) 단백질을 암호화하는 폴리뉴클레오타이드를 추가로 포함한다. 소정의 다른 구현예에서, 변형된 세포는 MPG1 SFB3, SEB1, CRZ1, TSP2, SSB7 및 GAS1로 이루어진 군으로부터 선택된 단백질의 발현/생산을 결실시키거나 파괴하거나 감소시키는 적어도 하나의 유전적 변형을 추가로 포함한다.
다른 구현예에서, 자낭균류 세포는 트리초데르마 종, 아스페르길루스 종, 푸사륨 종, 페니실리움 종, 칸디다 종, 크리소스포륨 종, 세팔로스포륨 종, 탈라로마이세스 종, 뉴로스포라 종 및 마이셀리오프토라 종으로부터 선택된다.
따라서, 소정의 구현예에서, 모 아스페르길루스 종 세포는 서열 번호 11 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.
다른 구현예에서, 모 페니실리움 종 세포는 서열 번호 12 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다. 다른 구현예에서, 모 탈라로마이세스 종 세포는 서열 번호 13 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.
또 다른 구현예에서, 모 푸사륨 종 세포는 서열 번호 14 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.
소정의 다른 구현예에서, 모 마이셀리오프토라 종 세포는 서열 번호 15 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.
다른 구현예에서, 모 뉴로스포라 종 세포는 서열 번호 16 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.
다른 구현예에서, 모 칸디다 종 세포는 서열 번호 17 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.
소정의 다른 구현예에서, 모 트리초데르마 종 세포는 서열 번호 2 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.
다른 구현예에서, 관심 단백질은 본 발명의 변형된 세포에 의해 생산되고 이로부터 정제된다.
또 다른 구현예에서, 본 발명은 엄격한 혼성화 조건 하에 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18의 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 핵산 서열과 혼성화하는 야생형 폴리뉴클레오타이드 서열을 포함하는 모 세포로부터 유래된 변형된 자낭균류 세포에 관한 것이고, 여기서 변형된 세포는 엄격한 혼성화 조건 하에 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18의 LOV 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 아미노산 서열에서 리신(K) 잔기를 포함하는 핵산 서열과 혼성화하는 변형된 폴리뉴클레오타이드 서열을 포함한다. 소정의 구현예에서, 세포는 관심 단백질을 암호화하는 이종성 폴리뉴클레오타이드를 추가로 포함한다. 다른 구현예에서, 세포는 서열 번호 19의 NIK1(M743T) 단백질을 암호화하는 폴리뉴클레오타이드 작제물을 추가로 포함한다. 다른 구현예에서, 세포는 MPG1 SFB3, SEB1, CRZ1, TSP2, SSB7 및 GAS1로 이루어진 군으로부터 선택된 단백질의 발현/생산을 결실시키거나 파괴하거나 감소시키는 적어도 하나의 유전적 변형을 추가로 포함한다.
소정의 다른 구현예에서, 자낭균류 세포는 트리초데르마 종, 아스페르길루스 종, 푸사륨 종, 페니실리움 종, 칸디다 종, 크리소스포륨 종, 세팔로스포륨 종, 탈라로마이세스 종, 뉴로스포라 종 및 마이셀리오프토라 종으로부터 선택된다.
소정의 구현예에서, 모 아스페르길루스 종 세포는 서열 번호 11 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.
다른 구현예에서, 모 페니실리움 종 세포는 서열 번호 12 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.
다른 구현예에서, 모 탈라로마이세스 종 세포는 서열 번호 13 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.
소정의 다른 구현예에서, 모 푸사륨 종 세포는 서열 번호 14 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.
다른 구현예에서, 모 마이셀리오프토라 종 세포는 서열 번호 15 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.
또 다른 구현예에서, 모 뉴로스포라 종 세포는 서열 번호 16 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.
소정의 다른 구현예에서, 모 칸디다 종 세포는 서열 번호 17 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다.
다른 구현예에서, 모 트리초데르마 종 세포는 서열 번호 2 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함한다. 다른 구현예는 본 발명의 변형된 세포에 의해 생산된 관심 단백질에 관한 것이다.
본 발명의 소정의 다른 구현예는 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 변이체 LOV 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 폴리뉴클레오타이드를 포함하는 벡터에 관한 것이다.
다른 구현예에서, 본 발명은 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 변이체 LOV 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 폴리뉴클레오타이드에 관한 것이다.
다른 구현예에서, 본 발명은 변이체 LOV 단백질을 암호화하는 폴리뉴클레오타이드에 관한 것이고, 여기서 변이체 단백질을 암호화하는 폴리뉴클레오타이드는 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18의 LOV 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 핵산 서열과 엄격한 혼성화 조건 하에 혼성화한다.
다른 구현예에서, 본 발명은 모 균주로부터 유래된 돌연변이체 트리초데르마 균주에 관한 것이고, 여기서 돌연변이체 균주는 서열 번호 4 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 LOV 변이체 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 서열 위치에서 리신(K) 잔기를 포함하는 유전자를 포함한다. 소정의 구현예에서, 돌연변이체 균주는 모 균주에 비해 향상된 단백질 생산성 표현형을 포함한다. 다른 구현예에서, 돌연변이체 균주는 서열 번호 19의 NIK1(M743T) 단백질을 암호화하는 폴리뉴클레오타이드 작제물을 추가로 포함한다. 다른 구현예에서, 돌연변이체 균주는 MPG1 SFB3, SEB1, CRZ1, TSP2, SSB7 및 GAS1로 이루어진 군으로부터 선택된 적어도 하나의 단백질을 암호화하는 유전자의 발현/생산을 결실시키거나 파괴하거나 감소시키는 유전적 변형을 추가로 포함한다. 따라서, 소정의 관련된 구현예는 돌연변이체 균주에 의해 생산된 관심 단백질에 관한 것이다.
본 발명의 다른 구현예는 향상된 단백질 생산성 표현형을 포함하는 변형된 자낭균류 세포를 작제하는 방법에 관한 것이고, 상기 방법은 (i) 엄격한 혼성화 조건 하에 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18의 LOV 단백질을 암호화하는 핵산 서열과 혼성화하는 야생형 lov 유전자를 포함하는 모 세포를 수득하는 단계, (ii) 단계 (i)의 모 세포를 변형시켜 서열 번호 2의 813번 위치에 상응하는 서열 위치에서 리신(K) 잔기를 포함하는 LOV (변이체) 단백질을 암호화하는 유전자를 포함하는 변형된 세포를 생산하는 단계, 및 (iii) 단계 (ii)의 변형된 세포를 단리시키는 단계를 포함하고, 여기서 변형된 세포는 모 세포에 비해 향상된 단백질 생산성 표현형을 포함한다.
다른 구현예에서, 본 발명은 향상된 단백질 생산성 표현형을 포함하는 변형된 자낭균류 세포를 작제하는 방법에 관한 것이고, 상기 방법은 (i) 모 자낭균류 세포를 수득하고, 서열 번호 4의 813번 위치에 상응하는 서열 위치에서 리신(K) 잔기를 포함하는 LOV 변이체 단백질을 암호화하는 폴리뉴클레오타이드 작제물을 세포로 도입하는 단계 및 (ii) 단계 (i)의 변형된 세포를 단리시키는 단계를 포함하고, 여기서 변형된 세포는 모 세포에 비해 향상된 단백질 생산성 표현형을 포함한다.
따라서, 본원에 제시되고 기재된 것처럼, 본 발명의 다양한 구현예는 일반적으로 향상된 단백질 생산성 표현형을 포함하는 사상성 진균의 변이체 균주에 관한 것이고, 변이체 균주는 상업용 분야에 대해 관심 단백질의 대규모 제조에서와 같은 액침된 배양에서의 성장에 매우 적합하다.
생물학적 서열의 간단한 설명
서열 번호 1은 서열 번호 2의 (자연적) LOV 단백질을 암호화하는 야생형 트리초데르마 종 lov 유전자의 핵산 서열이다.
서열 번호 2는 서열 번호 1에 의해 암호화된 (자연적) LOV 단백질의 아미노산 서열이다.
서열 번호 3은 서열 번호 4의 (변이체) T813K (치환된) LOV 단백질을 암호화하는 "lov(T813K)"라 명명된 트리초데르마 종 돌연변이체 대립유전자의 핵산 서열이다.
서열 번호 4는 서열 번호 3에 의해 암호화된 (변이체) T813K (치환된) LOV 단백질의 아미노산 서열이다.
서열 번호 5는 트리초데르마 종 MPG1 단백질의 아미노산 서열이다.
서열 번호 6은 트리초데르마 종 SEB1 단백질의 아미노산 서열이다.
서열 번호 7은 트리초데르마 종 SFB3 단백질의 아미노산 서열이다.
서열 번호 8은 트리초데르마 종 CRZ1 단백질의 아미노산 서열이다.
서열 번호 9는 트리초데르마 종 GAS1 단백질의 아미노산 서열이다.
서열 번호 10은 트리초데르마 종 TPS2 단백질의 아미노산 서열이다.
서열 번호 11은 아스페르길루스 종 LOV 단백질 오솔로그의 아미노산 서열이다.
서열 번호 12는 페니실리움 종 LOV 단백질 오솔로그의 아미노산 서열이다.
서열 번호 13은 탈라로마이세스 종 LOV 단백질 오솔로그의 아미노산 서열이다.
서열 번호 14는 푸사륨 종 LOV 단백질 오솔로그의 아미노산 서열이다.
서열 번호 15는 마이셀리오프토라 종 LOV 단백질 오솔로그의 아미노산 서열이다.
서열 번호 16은 뉴로스포라 종 LOV 단백질 오솔로그의 아미노산 서열이다.
서열 번호 17은 칸디다 종 LOV 단백질 오솔로그의 아미노산 서열이다.
서열 번호 18은 트리초데르마 종 (자연적) LOV 단백질(서열 번호 2)의 C 말단 아미노산 잔기 500-894번 위치를 포함한다.
서열 번호 19는 서열 번호 19의 아미노산 (잔기) 743번 위치에서의 메티오닌(M)에서 트레오닌(T) 치환을 포함하는 변이체 트리초데르마 히스티딘 키나제(NIK1)의 아미노산 서열이다. 서열 번호 19의 변이체 NIK1 히스티딘 키나제를 암호화하는 유전자는 "nik1(M743T)"이라 명명된다.
서열 번호 20은 서열 번호 21의 자연적 SSB7 단백질을 암호화하는 야생형 T. 레세이 ssb7 유전자의 핵산 서열이다.
서열 번호 21은 서열 번호 20에 의해 암호화된 자연적 T. 레세이 SSB7 단백질의 아미노산 서열이다.
서열 번호 22는 프레임 쉬프트(fs) 돌연변이 및 ssb7 유전자의 마지막 인트론 전의 조기 종결 코돈을 생성시키는 엑손 2에서의 G의 결실(ΔG)을 포함하는 대립유전자 ssb7(fs)의 핵산 서열이다.
서열 번호 23은 서열 번호 22의 대립유전자 ssb7(fs)에 의해 암호화된 변이체 SSB7 단백질의 아미노산 서열이다.
서열 번호 23은 트리초데르마 하르지아눔 LOV 단백질 오솔로그의 아미노산 서열이다.
도 1은 B7ms1 (모) 균주(도 1, 회색 데이터 점/회색 선) 및 돌연변이체 유래 (딸) B7ms1-SF12 균주(도 1, 검정 데이터 점/검정 선)를 발현하는 글루코아밀라아제에 대한 공급 당에서의 총 단백질 수율의 비교를 보여준다. 따라서, 이 글루코아밀라아제(GA) 발현 균주(mpg1 및 seb1 유전자에서의 점도 감소 돌연변이를 포함)는 발효기에서의 단백질 생산성에 대해 평가되었다. 도면 범례는 각각의 세포주 유형에 대해 균주 명칭(유전자형에 대한 표 1 참조), 이어서 괄호 내의 그 균주에서의 lov 대립유전자를 보여준다. 도 1에 도시된 것처럼 B7ms1-SF12 (딸) 균주(도 1, 검정 선; 즉, 돌연변이체 lov(T813K) 대립유전자를 포함)는 B7ms1 (모) 균주(도 1, 회색 선; 즉, 야생형 lov 유전자를 포함)에 비해 향상된 단백질 생산성 표현형을 갖는다. 예를 들어, 도 1에 제시된 것처럼, 공급 당에서의 단백질 수율은 lov(T813K) 돌연변이가 존재할 때 44% 증가하였다.
도 2는 LOV 단백질의 아미노산 보존을 예시하는 그래프 표시이다. 보다 구체적으로는, 도 2는 육백구십한(691)개의 주발버섯(Pezizomycotina) 동족체의 Geneious 다중 서열 정렬의 그래프 표시이다. 도 2의 하부에 트리초데르마 LOV 단백질의 아미노산 서열을 나타내는 박스가 있고, 여기서 아미노산(잔기)은 정렬된 서열의 99% 초과에서 보존되면 검정(또는 그렇지 않으면 회색임) 음영 박스에 제시된다. LOV 잔기 번호(서열 번호 2)는 서열 표시 위에 제시된다. 도 2에 제시된 것처럼, 트리초데르마 LOV에서 또는 달리 다중 서열 정렬에서의 서열의 2% 초과에 존재하는 아미노산 서열 갭은 회색 음영 선으로 제시된다. LOV(XP_006967324.1)에 대해 공공 GenBank 서열에서의 주석은 회색 박스로서 서열 표시 아래에 도시된다. LOV에 대한 GenBank 목록에 주석화된 추정상 활성 부위 잔기는 검정 박스로서 서열 표시 아래에 도시된다. 균주 B7ms1-SF12에서 리신(K)에 치환된 트레오닌(T) 813 잔기는 밝은 회색 박스로 주석화된다. 평균 소수화도 및 등전점(PI)은 또한 도 2에 작도되고 제시되어 있다. 정렬에서의 아미노산 동일성은 서열 바로 위에 작도된다. 더 밝은 회색 막대는 정렬에서의 서열의 적어도 30%에서 동일한 잔기를 나타내고, 더 어두운 회색 막대는 30% 미만에서 동일한 잔기를 나타낸다.
도 3은 전체 셀룰라아제 생성 T4ms 균주(회색 선) 및 조작된 lov(T813K) 대립유전자를 포함하는 돌연변이체 유도체 T4mls(검정 선)에 대한 발효기에서의 공급 당에 대한 총 단백질 수율의 비교를 제시한다. 보다 구체적으로는, 도 3은 더 낮은 세포 밀도(LCD, 파선, 원) 및 더 높은 세포 밀도(HCD, 실선, 정사각형) 발효 조건 둘 다 하에 이들 균주에 대한 공급 당에 대한 총 단백질 수율을 제시한다. 도면 범례는 발효 조건(LCD 대 HCD), 이어서 균주 명칭(유전자형에 대해 표 1 참조)을 보여주고, 존재하는 lov 대립유전자는 괄호 내에 기재된다. 따라서, 도 3에 제시된 것처럼, T4mls 균주(도 3, 검정 선; 즉, 돌연변이체 lov(T813K) 대립유전자를 포함)는 LCD(파선, 원) 및 HCD(실선, 정사각형) 발효 조건 둘 다 하에 T4ms 균주(도 3, 회색 선; 즉, 야생형 lov 유전자를 포함)에 비해 향상된 단백질 생산성 표현형을 갖는다. 예를 들어, 도 3에 제시된 것처럼, 공급 당에서의 단백질 수율은 lov(T813K) 돌연변이가 존재할 때 42%(LCD) 및 32%(HCD) 증가하였다.
도 4는 야생형 lov 대립유전자(회색 선) 및 조작된 lov(dis) 대립유전자(검정 선)를 각각 포함하는 이의 돌연변이체 유도체 T4ml+(실선, 정사각형) 및 T4sl+(파선, 원)와의 전체 셀룰라아제 생산 균주 T4m(실선, 정사각형) 및 T4s(파선, 원)에 대한 발효기에서의 공급 당에 대한 총 단백질 수율의 비교를 제시한다. 도면 범례는 각각의 세포주 유형에 대해 균주 명칭(유전자형에 대한 표 1 참조), 이어서 괄호 내에 기재된 그 균주에서의 lov 대립유전자를 보여준다. 도 4에 제시된 것처럼, T4ml+ 및 T4sl+ (딸) 균주(도 4, 검정 선; 즉, 돌연변이체 lov(dis) 대립유전자를 포함)는 이의 T4m 및 T4s (모) 균주(도 4, 회색 선; 즉, 야생형 lov 유전자를 포함)에 비해 향상된 단백질 생산성 표현형을 갖지 않는다.
도 5는 lov(T813K) 대립유전자, lov(dis) 대립유전자, 또는 야생형 lov(+) 대립유전자 중 어느 하나를 갖는 다양한 마커 삽입 부위를 갖는 균주의 진탕 플라스크 발효에서의 상대 총 단백질 역가의 비교를 제시한다. 보다 구체적으로는, 전체 셀룰라아제 생성 균주는 병렬적으로 T4 균주 및 T4m 균주 실행에 대해 총 단백질 역가에 대해 진탕 플라스크에서 평가되었다. 다양한 마커 삽입 부위의 균주는 야생형 lov(+) 대립유전자(도 5, 가장 밝은 회색 막대), 돌연변이체 lov(T813K) 대립유전자(도 5, 중간 회색 막대), 또는 lov(dis) 대립유전자(도 5, 가장 어두운 회색 막대) 중 하나와 발효에서 비교되었다. 따라서, 평가된 모든 마커 삽입 부위에서, 총 단백질 역가는 lov(T813K) 대립유전자가 존재할 때 증가하였다. 그러나, lov 유전자 자체(lov(dis) 대립유전자)에서의 pyr4(도 5, 균주 "41G") 또는 pyr2 마커(균주 T4 및 T4m) 중 어느 하나의 삽입은 상대 역가에서 상당한 개선을 나타내지 않았다.
도 6은 전체 셀룰라아제 생성 T4mp 균주(도 6, 회색 데이터 점/회색 선) 및 lov(T813K) 돌연변이체 T4mlp 균주(도 6, 검정 데이터 점/검정 선)에 대한 공급 당에서의 총 단백질 수율의 비교를 보여준다. 따라서, 이 전체 셀룰라아제 발현 균주는 발효기에서의 단백질 생산성에 대해 평가되었다. 도면 범례는 각각의 세포주 유형에 대해 균주 명칭(유전자형에 대한 표 1 참조), 이어서 괄호 내의 그 균주에서의 lov 대립유전자를 보여준다. 도 6에 도시된 바대로, T4mlp 균주(도 6, 검정 선; 즉, 돌연변이체 lov(T813K) 대립유전자를 포함)는 T4mp (모) 균주(도 6, 회색 선; 즉, 야생형 lov 유전자를 포함)에 비해 향상된 단백질 생산성 표현형을 갖는다. 예를 들어, 도 6에 제시된 것처럼, 공급 당에서의 단백질 수율은 lov(T813K) 돌연변이가 존재할 때 28% 증가하였다.
도 7은 일곱(7)개의 상이한 자낭균류 LOV 오솔로그와 정렬된 트리초데르마 종 (자연적) LOV 단백질(서열 번호 2)의 Clustal W (1.83) 다중 서열 정렬을 제시한다. 예를 들어, Clustal 정렬에 사용된 여덟(8)개의 단백질 서열은 도 7a-도 7b에 도시되어 있고(서열 번호 2 및 서열 번호 11-17), 이의 Clustal 정렬은 도 7c-도 7f에 도시되어 있다. 보다 구체적으로는, 도 7c-도 7f에 제시된 것처럼, 트리초데르마 종 (자연적) LOV 단백질(서열 번호 2; "2"로 표지, 볼드체 대문자 잔기에 도시됨)은 아스페르길루스 종 LOV 단백질 오솔로그(서열 번호 11, "11" 표지), 페니실리움 종 LOV 단백질 오솔로그(서열 번호 12, "12" 표지), 탈라로마이세스 종 LOV 단백질 오솔로그(서열 번호 13, "13" 표지), 푸사륨 종 LOV 단백질 오솔로그(서열 번호 14, "14" 표지), 마이셀리오프토라 종 LOV 단백질 오솔로그(서열 번호 15, "15" 표지), 뉴로스포라 종 LOV 단백질 오솔로그(서열 번호 16, "16" 표지) 및 칸디다 종 LOV 단백질 오솔로그(서열 번호 17, "17" 표지)와 정렬된다. 도 7c-도 7f에 도시된 것처럼(즉, 정렬된 아미노 잔기 아래), 별표 "*"는 단일의 완전히 보호된 잔기를 갖는 위치를 나타내고; 콜론 ":"은 강하게 유사한 특성(즉, Gonnet PAM 250 행렬에서의 0.5 초과의 점수)의 기들 사이의 보존을 나타내고, 마침표 "."는 약하게 유사한 특성(즉, Gonnet PAM 250 행렬에서의 0.5 미만의 점수)의 기들 사이의 보존을 나타낸다. 고도로 보존된 트레오닌(T) 아미노산은 볼드체 밑줄 T 잔기로서 도 7f에 표시된다.
도 8은 (자연적) 트리초데르마 종 LOV 단백질 서열(서열 번호 2)의 C 말단 잔기 500-894번 위치(서열 번호 18)를 사용한 BLAST 단백질 정렬(NCBI; Blastp 스위트)을 통해 수행된 아미노산 서열 정렬을 제시한다. 예를 들어, 도 8a-8g에 제시된 것처럼, 서열 번호 18은 트리초데르마 종 (자연적) LOV 단백질의 C 말단 아미노산 서열(즉, 서열 번호 2의 아미노산 잔기 500-894번 위치에 상응하는 394개의 아미노산 잔기 위치를 포함)을 포함하고, 여기서 813번 위치에서의 잔기에서의 고도로 보존된 트레오닌(T) 아미노산(T813)은 볼드체의, 밑줄 표시된 T 로 표시된다. 따라서, 이 394개의 잔기 C 말단 아미노산 서열(서열 번호 18)은 자낭균류 LOV 단백질 오솔로그(예를 들어, 서열 번호 11-17; 도 8a-8g)와 정렬되었다. 도 8a에 도시된 것처럼, 아스페르길루스 종 LOV 단백질 오솔로그(서열 번호 11)는 서열 번호 18과 약 50%의 아미노산 서열 동일성을 포함하고, 여기서 서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 고도로 보존된 트레오닌( T ) 아미노산은 볼드체이고 밑줄 표시되고(도 8a), 페니실리움 종 LOV 단백질 오솔로그(서열 번호 12)는 서열 번호 18과 약 50%의 아미노산 서열 동일성을 포함하고, 여기서 서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 고도로 보존된 트레오닌( T ) 아미노산은 볼드체이고 밑줄 표시되고(도 8b), 탈라로마이세스 종 LOV 단백질 오솔로그(서열 번호 13)는 서열 번호 18과 약 60%의 아미노산 서열 동일성을 포함하고, 여기서 서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 고도로 보존된 트레오닌( T ) 아미노산은 볼드체이고 밑줄 표시되고(도 8c), 푸사륨 종 LOV 단백질 오솔로그(서열 번호 14)는 서열 번호 18과 약 88%의 아미노산 서열 동일성을 포함하고, 여기서 서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 고도로 보존된 트레오닌( T ) 아미노산은 볼드체이고 밑줄 표시되고(도 8d), 마이셀리오프토라 종 LOV 단백질 오솔로그(서열 번호 15)는 서열 번호 18과 약 90%의 아미노산 서열 동일성을 포함하고, 여기서 서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 고도로 보존된 트레오닌( T ) 아미노산은 볼드체이고 밑줄 표시되고(도 8e), 뉴로스포라 종 LOV 단백질 오솔로그(서열 번호 16)는 서열 번호 18과 약 90%의 아미노산 서열 동일성을 포함하고, 여기서 서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 고도로 보존된 트레오닌( T ) 아미노산은 볼드체이고 밑줄 표시되고(도 8f), 칸디다 종 LOV 단백질 오솔로그(서열 번호 17)는 서열 번호 18과 약 50%의 아미노산 서열 동일성을 포함하고, 여기서 서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 고도로 보존된 트레오닌( T ) 아미노산은 볼드체이고 밑줄 표시된다(도 8g).
도 2는 LOV 단백질의 아미노산 보존을 예시하는 그래프 표시이다. 보다 구체적으로는, 도 2는 육백구십한(691)개의 주발버섯(Pezizomycotina) 동족체의 Geneious 다중 서열 정렬의 그래프 표시이다. 도 2의 하부에 트리초데르마 LOV 단백질의 아미노산 서열을 나타내는 박스가 있고, 여기서 아미노산(잔기)은 정렬된 서열의 99% 초과에서 보존되면 검정(또는 그렇지 않으면 회색임) 음영 박스에 제시된다. LOV 잔기 번호(서열 번호 2)는 서열 표시 위에 제시된다. 도 2에 제시된 것처럼, 트리초데르마 LOV에서 또는 달리 다중 서열 정렬에서의 서열의 2% 초과에 존재하는 아미노산 서열 갭은 회색 음영 선으로 제시된다. LOV(XP_006967324.1)에 대해 공공 GenBank 서열에서의 주석은 회색 박스로서 서열 표시 아래에 도시된다. LOV에 대한 GenBank 목록에 주석화된 추정상 활성 부위 잔기는 검정 박스로서 서열 표시 아래에 도시된다. 균주 B7ms1-SF12에서 리신(K)에 치환된 트레오닌(T) 813 잔기는 밝은 회색 박스로 주석화된다. 평균 소수화도 및 등전점(PI)은 또한 도 2에 작도되고 제시되어 있다. 정렬에서의 아미노산 동일성은 서열 바로 위에 작도된다. 더 밝은 회색 막대는 정렬에서의 서열의 적어도 30%에서 동일한 잔기를 나타내고, 더 어두운 회색 막대는 30% 미만에서 동일한 잔기를 나타낸다.
도 3은 전체 셀룰라아제 생성 T4ms 균주(회색 선) 및 조작된 lov(T813K) 대립유전자를 포함하는 돌연변이체 유도체 T4mls(검정 선)에 대한 발효기에서의 공급 당에 대한 총 단백질 수율의 비교를 제시한다. 보다 구체적으로는, 도 3은 더 낮은 세포 밀도(LCD, 파선, 원) 및 더 높은 세포 밀도(HCD, 실선, 정사각형) 발효 조건 둘 다 하에 이들 균주에 대한 공급 당에 대한 총 단백질 수율을 제시한다. 도면 범례는 발효 조건(LCD 대 HCD), 이어서 균주 명칭(유전자형에 대해 표 1 참조)을 보여주고, 존재하는 lov 대립유전자는 괄호 내에 기재된다. 따라서, 도 3에 제시된 것처럼, T4mls 균주(도 3, 검정 선; 즉, 돌연변이체 lov(T813K) 대립유전자를 포함)는 LCD(파선, 원) 및 HCD(실선, 정사각형) 발효 조건 둘 다 하에 T4ms 균주(도 3, 회색 선; 즉, 야생형 lov 유전자를 포함)에 비해 향상된 단백질 생산성 표현형을 갖는다. 예를 들어, 도 3에 제시된 것처럼, 공급 당에서의 단백질 수율은 lov(T813K) 돌연변이가 존재할 때 42%(LCD) 및 32%(HCD) 증가하였다.
도 4는 야생형 lov 대립유전자(회색 선) 및 조작된 lov(dis) 대립유전자(검정 선)를 각각 포함하는 이의 돌연변이체 유도체 T4ml+(실선, 정사각형) 및 T4sl+(파선, 원)와의 전체 셀룰라아제 생산 균주 T4m(실선, 정사각형) 및 T4s(파선, 원)에 대한 발효기에서의 공급 당에 대한 총 단백질 수율의 비교를 제시한다. 도면 범례는 각각의 세포주 유형에 대해 균주 명칭(유전자형에 대한 표 1 참조), 이어서 괄호 내에 기재된 그 균주에서의 lov 대립유전자를 보여준다. 도 4에 제시된 것처럼, T4ml+ 및 T4sl+ (딸) 균주(도 4, 검정 선; 즉, 돌연변이체 lov(dis) 대립유전자를 포함)는 이의 T4m 및 T4s (모) 균주(도 4, 회색 선; 즉, 야생형 lov 유전자를 포함)에 비해 향상된 단백질 생산성 표현형을 갖지 않는다.
도 5는 lov(T813K) 대립유전자, lov(dis) 대립유전자, 또는 야생형 lov(+) 대립유전자 중 어느 하나를 갖는 다양한 마커 삽입 부위를 갖는 균주의 진탕 플라스크 발효에서의 상대 총 단백질 역가의 비교를 제시한다. 보다 구체적으로는, 전체 셀룰라아제 생성 균주는 병렬적으로 T4 균주 및 T4m 균주 실행에 대해 총 단백질 역가에 대해 진탕 플라스크에서 평가되었다. 다양한 마커 삽입 부위의 균주는 야생형 lov(+) 대립유전자(도 5, 가장 밝은 회색 막대), 돌연변이체 lov(T813K) 대립유전자(도 5, 중간 회색 막대), 또는 lov(dis) 대립유전자(도 5, 가장 어두운 회색 막대) 중 하나와 발효에서 비교되었다. 따라서, 평가된 모든 마커 삽입 부위에서, 총 단백질 역가는 lov(T813K) 대립유전자가 존재할 때 증가하였다. 그러나, lov 유전자 자체(lov(dis) 대립유전자)에서의 pyr4(도 5, 균주 "41G") 또는 pyr2 마커(균주 T4 및 T4m) 중 어느 하나의 삽입은 상대 역가에서 상당한 개선을 나타내지 않았다.
도 6은 전체 셀룰라아제 생성 T4mp 균주(도 6, 회색 데이터 점/회색 선) 및 lov(T813K) 돌연변이체 T4mlp 균주(도 6, 검정 데이터 점/검정 선)에 대한 공급 당에서의 총 단백질 수율의 비교를 보여준다. 따라서, 이 전체 셀룰라아제 발현 균주는 발효기에서의 단백질 생산성에 대해 평가되었다. 도면 범례는 각각의 세포주 유형에 대해 균주 명칭(유전자형에 대한 표 1 참조), 이어서 괄호 내의 그 균주에서의 lov 대립유전자를 보여준다. 도 6에 도시된 바대로, T4mlp 균주(도 6, 검정 선; 즉, 돌연변이체 lov(T813K) 대립유전자를 포함)는 T4mp (모) 균주(도 6, 회색 선; 즉, 야생형 lov 유전자를 포함)에 비해 향상된 단백질 생산성 표현형을 갖는다. 예를 들어, 도 6에 제시된 것처럼, 공급 당에서의 단백질 수율은 lov(T813K) 돌연변이가 존재할 때 28% 증가하였다.
도 7은 일곱(7)개의 상이한 자낭균류 LOV 오솔로그와 정렬된 트리초데르마 종 (자연적) LOV 단백질(서열 번호 2)의 Clustal W (1.83) 다중 서열 정렬을 제시한다. 예를 들어, Clustal 정렬에 사용된 여덟(8)개의 단백질 서열은 도 7a-도 7b에 도시되어 있고(서열 번호 2 및 서열 번호 11-17), 이의 Clustal 정렬은 도 7c-도 7f에 도시되어 있다. 보다 구체적으로는, 도 7c-도 7f에 제시된 것처럼, 트리초데르마 종 (자연적) LOV 단백질(서열 번호 2; "2"로 표지, 볼드체 대문자 잔기에 도시됨)은 아스페르길루스 종 LOV 단백질 오솔로그(서열 번호 11, "11" 표지), 페니실리움 종 LOV 단백질 오솔로그(서열 번호 12, "12" 표지), 탈라로마이세스 종 LOV 단백질 오솔로그(서열 번호 13, "13" 표지), 푸사륨 종 LOV 단백질 오솔로그(서열 번호 14, "14" 표지), 마이셀리오프토라 종 LOV 단백질 오솔로그(서열 번호 15, "15" 표지), 뉴로스포라 종 LOV 단백질 오솔로그(서열 번호 16, "16" 표지) 및 칸디다 종 LOV 단백질 오솔로그(서열 번호 17, "17" 표지)와 정렬된다. 도 7c-도 7f에 도시된 것처럼(즉, 정렬된 아미노 잔기 아래), 별표 "*"는 단일의 완전히 보호된 잔기를 갖는 위치를 나타내고; 콜론 ":"은 강하게 유사한 특성(즉, Gonnet PAM 250 행렬에서의 0.5 초과의 점수)의 기들 사이의 보존을 나타내고, 마침표 "."는 약하게 유사한 특성(즉, Gonnet PAM 250 행렬에서의 0.5 미만의 점수)의 기들 사이의 보존을 나타낸다. 고도로 보존된 트레오닌(T) 아미노산은 볼드체 밑줄 T 잔기로서 도 7f에 표시된다.
도 8은 (자연적) 트리초데르마 종 LOV 단백질 서열(서열 번호 2)의 C 말단 잔기 500-894번 위치(서열 번호 18)를 사용한 BLAST 단백질 정렬(NCBI; Blastp 스위트)을 통해 수행된 아미노산 서열 정렬을 제시한다. 예를 들어, 도 8a-8g에 제시된 것처럼, 서열 번호 18은 트리초데르마 종 (자연적) LOV 단백질의 C 말단 아미노산 서열(즉, 서열 번호 2의 아미노산 잔기 500-894번 위치에 상응하는 394개의 아미노산 잔기 위치를 포함)을 포함하고, 여기서 813번 위치에서의 잔기에서의 고도로 보존된 트레오닌(T) 아미노산(T813)은 볼드체의, 밑줄 표시된 T 로 표시된다. 따라서, 이 394개의 잔기 C 말단 아미노산 서열(서열 번호 18)은 자낭균류 LOV 단백질 오솔로그(예를 들어, 서열 번호 11-17; 도 8a-8g)와 정렬되었다. 도 8a에 도시된 것처럼, 아스페르길루스 종 LOV 단백질 오솔로그(서열 번호 11)는 서열 번호 18과 약 50%의 아미노산 서열 동일성을 포함하고, 여기서 서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 고도로 보존된 트레오닌( T ) 아미노산은 볼드체이고 밑줄 표시되고(도 8a), 페니실리움 종 LOV 단백질 오솔로그(서열 번호 12)는 서열 번호 18과 약 50%의 아미노산 서열 동일성을 포함하고, 여기서 서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 고도로 보존된 트레오닌( T ) 아미노산은 볼드체이고 밑줄 표시되고(도 8b), 탈라로마이세스 종 LOV 단백질 오솔로그(서열 번호 13)는 서열 번호 18과 약 60%의 아미노산 서열 동일성을 포함하고, 여기서 서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 고도로 보존된 트레오닌( T ) 아미노산은 볼드체이고 밑줄 표시되고(도 8c), 푸사륨 종 LOV 단백질 오솔로그(서열 번호 14)는 서열 번호 18과 약 88%의 아미노산 서열 동일성을 포함하고, 여기서 서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 고도로 보존된 트레오닌( T ) 아미노산은 볼드체이고 밑줄 표시되고(도 8d), 마이셀리오프토라 종 LOV 단백질 오솔로그(서열 번호 15)는 서열 번호 18과 약 90%의 아미노산 서열 동일성을 포함하고, 여기서 서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 고도로 보존된 트레오닌( T ) 아미노산은 볼드체이고 밑줄 표시되고(도 8e), 뉴로스포라 종 LOV 단백질 오솔로그(서열 번호 16)는 서열 번호 18과 약 90%의 아미노산 서열 동일성을 포함하고, 여기서 서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 고도로 보존된 트레오닌( T ) 아미노산은 볼드체이고 밑줄 표시되고(도 8f), 칸디다 종 LOV 단백질 오솔로그(서열 번호 17)는 서열 번호 18과 약 50%의 아미노산 서열 동일성을 포함하고, 여기서 서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 고도로 보존된 트레오닌( T ) 아미노산은 볼드체이고 밑줄 표시된다(도 8g).
본원에 제시되고 기재된 것처럼, 비제한적인 예로서 본 발명은 향상된 단백질 생산성 표현형을 포함하는 사상성 진균의 변이체 균주를 생성시키는 사상성 진균에서의 유전적 변형을 포함하는 사상성 진균 단백질 생산 및 이의 방법의 당해 분야에서의 소정의 진행 중이고 충족되지 않은 필요성을 해결한다. 보다 구체적으로는, 본원에 제시되고 기재되고 예시된 것처럼, 향상된 단백질 생산성 표현형을 포함하는 사상성 진균의 이러한 변이체 균주는 상업용 분야에 대해 관심 단백질의 대규모 제조에서와 같은 액침된 배양에서의 성장에 매우 적합하다.
I. 정의
본 발명의 균주 및 방법을 자세히 기술하기 전에, 명확함을 위하여 하기 용어가 정의된다. 정의되지 않은 용어는 관련 분야에서 사용되는 통상적인 의미와 일치되어야 한다. 달리 정의되지 않는 한, 본원에 사용되는 모든 기술 용어 및 과학 용어는 본 발명의 조성물 및 방법이 적용되는 기술 분야의 당업자가 일반적으로 이해하는 것과 동일한 의미를 갖는다.
본원에 기재된 바와 같은 조작, 작제 및 사용을 위한 사상성 진균 세포는 일반적으로 자낭균류 문, 주발버섯 아문, 특히 영양 균사 상태를 갖는 진균에서 유래한다. 이러한 유기체는 비제한적인 예로서 트리코데르마 종, 아스페르길루스 종, 푸사륨 종, 페니실리움 종, 크리소스포륨 종, 세팔로스포륨 종, 탈라로마이세스 종, 게오스미티아 종, 뉴로스포라 종, 마이셀리오프토라 종 등을 포함하는 상업적으로 중요한 산업적 단백질 및 약제학적 단백질의 제조에 사용되는 사상성 진균 세포를 포함한다. 예를 들어, 특정 구현예에서, 사상성 진균 세포 및 이의 균주는 트리코데르마 레세이(이전에 트리코데르마 론기브라치아툼(Trichoderma longibrachiatum) 및 하이포크레아 예코리나(Hypocrea jecorina)로 분류됨), 아스페르길루스 니게르(Aspergillus niger), 아스페르길루스 푸미가투스(Aspergillus fumigatus), 아스페르길루스 이타코니쿠스(Aspergillus itaconicus), 아스페르길루스 오리자에(Aspergillus oryzae), 아스페르길루스 니둘란스(Aspergillus nidulans), 아스페르길루스 테레우스(Aspergillus terreus), 아스페르길루스 소에(Aspergillus sojae), 아스페르길루스 쟈포니쿠스(Aspergillus japonicus), 뉴로스포라 크라사(Neurospora crassa), 페니실리움 푸니쿨로숨(Penicillium funiculosum), 페니실리움 크리소게눔(Penicillium chrysogenum), 탈라로마이세스 (게오스미티아) 에메르소니(Talaromyces (Geosmithia) emersonii), 푸사륨 베네나툼(Fusarium venenatum), 마이셀리오프토라 테르모필라(Myceliophthora thermophila), 크리소스포륨 루크노웬스(Chrysosporium lucknowense)(C1) 등을 포함하지만, 이들로 제한되지는 않는다.
본원에 사용된 바와 같이, "사상성 진균 균주(들)", "사상성 진균성 균주(들)", "진균 균주(들)", "진균성 균주(들)", "사상성 진균 세포(들)", "사상성 진균성 세포(들)", "진균 세포(들)", "진균성 세포(들)" 및 기타와 같은 용어 및 어구는 설명의 편의를 위해 상호교환적으로 사용될 수 있고, 본 발명의 범위를 제한하도록 의도되지 않는다.
소정의 구현예에서, 본원에 기재된 바와 같은 조작, 작제 및 사용을 위한 사상성 진균 세포는 일반적으로 자낭균류 문, 주발버섯 아문, 특히 영양 균사 상태를 갖고 lov 유전자(또는 lov 유전자 동족체(들))를 포함하는 진균에서 유래한다.
본원에 사용된 바와 같이, "모 세포", "모 진균 세포", "모 균주", "모 진균 균주", "사상성 진균 세포의 모 균주", "기준 균주" 등과 같은 어구는 상호교환적으로 사용될 수 있고, "비변형된" 모 사상성 진균 세포를 지칭한다. 예를 들어, "사상성 진균 세포의 모 균주"는 "모" 세포 및 "딸" 세포가 하나의 유전자 변형만이 다르도록 사상성 진균 세포의 변이체 (딸) 균주를 생성하기 위해 "모" 세포의 게놈이 (예를 들어, 모 세포로 도입된 오직 하나의 유전자 변형을 통해) 변형되거나 변형 가능한 사상성 진균의 임의의 세포 또는 균주를 지칭한다.
본원에 사용된 바와 같이, "변이체 세포", "딸 세포", "변이체 균주", "딸 균주", "변이체 또는 딸 진균 균주", "사상성 진균 세포의 변이체 또는 딸 균주" 등과 같은 어구는 상호교환적으로 사용될 수 있고, 사상성 진균 세포의 모 균주(또는 기준 균주)로부터 유래된(즉, 수득되거나 수득 가능한) 사상성 진균 세포의 변이체 균주를 지칭하고, 여기서 변이체 균주는 모 균주에 존재하지 않는 하나의 유전자 변형만을 포함하여서, 비교에 의하면 "모" 균주와 "변이체" 균주 간의 표현형 차이는 하나의 유전자 변형에 기인할 수 있다. 다르게 표현하면, 모 균주 및 변이체 균주는 변이체 균주로 "도입된" 단일 유전자 변형을 제외하고는 달리 동질유전자이다. 따라서, 본 발명에서, 모 균주 및 변이체 균주는 소정의 특징, 예컨대 유전자 변형, 발현 표현형, 형태 표현형 등을 갖는 것으로 기재될 수 있지만, 당업자는 이것이 기술적으로 이러한 특징을 갖는 모 균주 또는 변이체 균주의 세포라는 것을 이해할 것이고, "균주"는 편의를 위해 지칭된다.
소정의 구현예에서, 비변형된 (모) 세포는 특히 이들로부터 유래된 유전자 변형된 (변이체/딸) 세포와 비교할 때(이에 대하여) "대조군 세포" 또는 "기준 세포"라 칭해질 수 있다.
본원에 사용된 바와 같이, 용어 "야생형" 및 "자연적"은 상호교환적으로 사용되고, 자연계에서 발견되는 것과 같은 유전자, 단백질, 단백질 혼합물 또는 균주를 지칭한다.
본원에 사용된 바와 같이, 본 발명의 소정의 트리초데르마 레세이 균주/세포는 하기 표 1에 제시된 바와 같이 명명/약칭된다.
본원에 사용된 바와 같이, 점도 감소 트리초데르마 균주 "B7ms1"은 국제 PCT 공보 WO2012/145584호(본원에 그 전체가 참고로 포함됨)에서 "Morph TrGA 77B7Δmpg1Δseb1"이라 지칭되는 글루코아밀라아제 발현 균주이다.
본원에 사용된 바와 같이, 게놈 코디네이트(예를 들어, 스캐폴드 16에서의 425393) 및 단백질 확인 번호(PID, 예를 들어, PID 50212)는 에너지부 산하 Joint Genome Institute(JGI)에 의해 생성된 트리초데르마 레세이 QM6a 게놈 서열 어셈블리의 버전 2를 참조한다. (The Genome Portal of the Department of Energy Joint Genome Institute, Grigoriev et al., Nucleic Acids Res 2012 Jan;40(Database issue: D26-32. doi: 10.1093/nar/gkr947). JGI 어셈블리된 스캐폴드 서열은 또한 뉴클레오타이드 수탁 번호 GL985056.1 내지 GL985132.1로 GenBank(The National Center for Biotechnology)에 기탁되었다.
본원에 사용된 바와 같이, (B7ms1 모 균주로부터 유래된) "B7ms1-SF12"라 명명된 돌연변이체 (변이체) 트리초데르마 균주는 증가된 단백질 생산성 표현형(즉, B7ms1 (모) 균주에 비해)을 포함한다. 보다 구체적으로는, 트리초데르마 B7ms1-SF12 균주에서의 확인된 돌연변이는 LOV(즉, 예측된 단백질 PID 50212; 서열 번호 2)라 명명된 단백질의 암호화 서열을 변경하고, 여기서 (자연적) LOV 단백질(서열 번호 2)의 잔기 813번 위치(T813)에서의 고도로 보존된 트레오닌(T) 아미노산은 (돌연변이체) B7ms1-SF12 균주에서의 리신으로 치환(T→K813)된다(즉, T813K 치환, 예를 들어, 서열 번호 4 813번 위치에 대해 서열 번호 2 813번 위치 비교). 예를 들어, 하기 실시예 부문에 기재된 바대로, 균주 B7ms1-SF12에서의 lov 돌연변이체 대립유전자는 스캐폴드 16에서 425393에서 G (구아닌)에서 T(티민)의 단일 뉴클레오타이드 변화를 포함하여서, 서열 번호 4의 아미노산 813번 위치에서의 리신(K)을 포함하는 암호화된 LOV (변이체) 단백질(서열 번호 4)에서의 "T813K" 치환을 생성시킨다(아미노산 813번 위치; 서열 번호 2에서 트레오닌(T)을 포함하는 서열 번호 2의 자연적 LOV 단백질과 반대로).
본원에 사용된 바와 같이, "T4"라 명명된 트리초데르마 균주는 국제 PCT 공보 WO2016/130523호(본원에 그 전체가 참고로 포함됨)에 기재된 바대로 nik1(M743T) 돌연변이의 혼입 및 화학적 돌연변이유발에 의해 트리초데르마 균주 RL-P37로부터 유래되었다.
본원에 사용된 바와 같이, "nik1(M743T)"이라 명명된 유전자 대립유전자는 서열 번호 19의 아미노산 (잔기) 743번 위치에서의 메티오닌(M)에서 트레오닌(T) 치환을 포함하는 변이체 히스티딘 키나제(NIK1; 서열 번호 19)를 암호화하는 돌연변이체 히스티딘 키나제 유전자(nik1)를 포함한다.
본원에 사용된 바와 같이, "T4_pyr2"라 명명된 트리초데르마 균주는 pyr2 유전자의 돌연변이 및 기능 손실에 의해 트리초데르마 균주 T4로부터 유래되어서, 이것은 형질전환 선별 마커로서 사용될 수 있다.
본원에 사용된 바와 같이, "T4m"이라 명명된 트리초데르마 균주는 균주 T4로부터 유래되고, 여기서 균주 T4m은 mpg1 유전자의 돌연변이(Δmpg1) 및 nik1(M743T) 유전자를 포함한다. 균주 T4m은 따라서 자연적 lov 단백질(서열 번호 2)을 암호화하는 야생형 lov 대립유전자(즉, 대립유전자 lov(+))를 포함한다.
본원에 사용된 바와 같이, "T4m_pyr2"라 명명된 트리초데르마 균주는 균주 T4m으로부터 유래되고, 여기서 균주 T4m_pyr2는 mpg1 유전자의 돌연변이(Δmpg1), nik1(M743T) 유전자 및 무 기능적 pyr2 유전자를 포함한다.
본원에 사용된 바와 같이, "T4ml+"라 명명된 트리초데르마 균주는 균주 T4m_pyr2로부터 유래되고, 여기서 균주 T4ml+는 mpg1 유전자의 돌연변이(Δmpg1) 및 대립유전자 lov(dis)를 포함한다.
본원에 사용된 바와 같이, "T4ml"이라 명명된 트리초데르마 균주는 균주 T4ml+로부터 유래되고, 여기서 균주 T4ml은 nik1(M743T), mpg1 유전자의 돌연변이(Δmpg1), 대립유전자 lov(T813K) 및 무 기능적 pyr2 유전자를 포함한다.
본원에 사용된 바와 같이, "T4mls+"라 명명된 트리초데르마 균주는 균주 T4ml로부터 유래되고, 여기서 균주 T4mls는 nik1(M743T), mpg1 및 seb1 유전자의 이중 돌연변이(Δmpg1; seb1) 및 대립유전자 lov(T813K)를 포함한다.
본원에 사용된 바와 같이, "T4ms"라 명명된 트리초데르마 균주는 균주 T4m으로부터 유래되고, 여기서 균주 T4ms는 nik1(M743T) 및 mpg1 및 seb1 유전자의 이중 돌연변이(Δmpg1; seb1)를 포함한다.
본원에 사용된 바와 같이, "T4s"라 명명된 트리초데르마 균주는 균주 T4로부터 유래되고, 여기서 균주 T4s는 nik1(M743T) 및 seb1 유전자의 돌연변이(Δseb1)를 포함한다.
본원에 사용된 바와 같이, "T4s_pyr2"라 명명된 트리초데르마 균주는 균주 T4s로부터 유래되고, 여기서 균주 T4s_pyr2는 nik1(M743T), seb1 유전자의 돌연변이(Δseb1) 및 무 기능적 pyr2 유전자를 포함한다.
본원에 사용된 바와 같이, "T4sl+"라 명명된 트리초데르마 균주는 균주 T4s_pyr2로부터 유래되고, 여기서 균주 T4sl+는 nik1(M743T), seb1 유전자의 돌연변이(Δseb1) 및 대립유전자 lov(dis)를 포함한다.
본원에 사용된 바와 같이, "T4sl"이라 명명된 트리초데르마 균주는 균주 T4sl+로부터 유래되고, 여기서 균주 T4sl은 nik1(M743T), seb1 유전자의 돌연변이(Δseb1), 대립유전자 lov(T813K) 및 무 기능적 pyr2 유전자를 포함한다.
본원에 사용된 바와 같이, "T4l+"라 명명된 트리초데르마 균주는 균주 T4_pyr2로부터 유래되고, 여기서 균주 T4l+는 nik1(M743T) 및 대립유전자 lov(dis)를 포함한다.
본원에 사용된 바와 같이, "41G"라 명명된 트리초데르마 균주는 균주 T4로부터 유래되고, 여기서 균주 4lG는 nik1(M743T) 및 (야생형) lov(+) 대립유전자를 포함한다.
본원에 사용된 바와 같이, "41G_pyr4"라 명명된 트리초데르마 균주는 균주 41G로부터 유래되고, 여기서 균주 4lG_pyr4는 nik1(M743T), (야생형) lov(+) 대립유전자 및 pyr4 유전자의 결실을 포함한다.
본원에 사용된 바와 같이, "41Gl+"라 명명된 트리초데르마 균주는 균주 4lG_pyr4로부터 유래되고, 여기서 균주 4lGl+는 nik1(M743T) 및 대립유전자 lov(dis)를 포함한다.
본원에 사용된 바와 같이, "T4mc"라 명명된 트리초데르마 균주는 균주 T4m_pyr2로부터 유래되고, 여기서 균주 T4mc는 nik1(M743T), Δmpg1, 부위 C에서의 pyr2+ 삽입 및 야생형 lov(+) 대립유전자를 포함한다.
본원에 사용된 바와 같이, "T4mlc"라 칭하는 트리초데르마 균주는 균주 T4ml로부터 유래되고, 여기서 균주 T4mlc는 nik1(M743T), Δmpg1, 부위 C에서의 pyr2+ 삽입 및 대립유전자 lov(T813K)를 포함한다.
본원에 사용된 바와 같이, "T4md"라 명명된 트리초데르마 균주는 균주 T4m_pyr2로부터 유래되고, 여기서 균주 T4md는 nik1(M743T), Δmpg1, 부위 B에서의 pyr2+ 삽입 및 야생형 lov(+) 대립유전자를 포함한다.
본원에 사용된 바와 같이, "T4mld"라 명명된 트리초데르마 균주는 균주 T4ml로부터 유래되고, 여기서 균주 T4mld는 nik1(M743T), Δmpg1, 부위 B에서의 pyr2+ 삽입 및 대립유전자 lov(T813K)를 포함한다.
본원에 사용된 바와 같이, "T4mp"라 명명된 트리초데르마 균주는 균주 T4m_pyr2로부터 유래되고, 여기서 균주 T4mp는 nik1(M743T), Δmpg1, 부위 A에서의 pyr2+ 삽입 및 야생형 lov(+) 대립유전자를 포함한다.
본원에 사용된 바와 같이, "T4mlp"라 칭하는 트리초데르마 균주는 균주 T4ml로부터 유래되고, 여기서 균주 T4mlp는 nik1(M743T), Δmpg1, 부위 A에서의 pyr2+ 삽입 및 대립유전자 lov(T813K)를 포함한다.
본원에 사용된 바와 같이, "T4sp"라 명명된 트리초데르마 균주는 균주 T4s_pyr2로부터 유래되고, 여기서 균주 T4sp는 nik1(M743T), Δseb1, 부위 A에서의 pyr2+ 삽입 및 야생형 lov(+) 대립유전자를 포함한다.
본원에 사용된 바와 같이, "T4slp"라 칭하는 트리초데르마 균주는 균주 T4sl로부터 유래되고, 여기서 균주 T4slp는 nik1(M743T), Δseb1, 부위 A에서의 pyr2+ 삽입 및 대립유전자 lov(T813K)를 포함한다.
본원에 사용된 바와 같이, “글루코아밀라아제(GA) 작제물" 또는 "GA 작제물"은 국제 PCT 공보 WO2012/145584호(본원에 그 전체가 참고로 구체적으로 포함됨)에 기재된 글루코아밀라아제를 암호화한다.
본원에 사용된 바와 같이, "대립유전자 lov(+)"는 자연적 LOV 단백질(예를 들어, 서열 번호 2)을 암호화하는 야생형 lov DNA 서열을 포함한다.
본원에 사용된 바와 같이, "대립유전자 lov(T813K)"는 "T813K" 치환(서열 번호 4, 상기 기재됨)을 포함하는 변이체 LOV 단백질을 암호화하는 돌연변이된 (lov) DNA 서열(균주 B7ms1-SF12에서 확인됨, 상기 기재됨)을 포함한다.
본원에 사용된 바와 같이, "대립유전자 lov(dis)"는 lov 유전자의 파괴를 포함하고, 여기서 pyr2 또는 pyr4 중 어느 하나인 선택 가능한 마커는 하기 실시예 3에 더 기재된 바대로 lov 암호화 서열로 통합되었다.
본원에 사용된 바와 같이, "전체 셀룰라아제 균주"는 천연 세크리톰이 주요 셀룰라아제 유전자의 유전자 조작에 의해 변경되지 않는 트리초데르마 균주를 지칭한다.
본원에 사용된 바와 같이, 관심 단백질을 암호화하는 "내인성 (또는 자연적) 사상성 진균 유전자"는 글리코사이드 가수분해효소(GH) 패밀리 효소(예를 들어, EC 번호 3.2.1.1 - 3.2.1.206과 같음)를 암호화하는 내인성 (사상성 진균) 유전자, 당업자에게 알려지고 이해되는 것처럼 프로테아제, 에스테라아제, 리파아제 및 기타를 암호화하는 내인성 유전자를 포함하지만, 이들로 제한되지는 않는다.
따라서, 일반적으로 본원에 기재된 바와 같이, 서열 번호 4의 (변이체) LOV 단백질의 813번 위치에 동등한 아미노산(잔기) 위치에서의 리신(K) 아미노산에 대한 트레오닌(T) 아미노산의 치환(T→K 치환)은 관찰된(증가된) 단백질 생산성 표현형의 원인인 것으로 본원에서 확인된다. 예를 들어, (돌연변이체) B7ms1-SF12 균주 T813→813K 치환을 암호화하는 도입된 대립유전자(예를 들어, 대립유전자 lov(T813K))를 포함하는 본원에 개시된 바와 같은 사상성 진균 세포는 동일한 조건 하에 발효/배양될 때 이 돌연변이(즉, 자연적 LOV 단백질을 암호화하는 야생형 lov 유전자, 대립유전자 lov(+)를 포함)가 결여된 동질유전자 세포에 비해 향상된 단백질 생산성 표현형을 나타낸다. 보다 구체적으로는 하기 실시예 부문에 제시된 것처럼, 본 발명의 사상성 진균 세포(이러한 향상된 단백질 생산성 표현형을 포함)는 (예를 들어, 상업용 분야에 대해 관심 단백질의 대규모 제조에서와 같은) (호기성) 액침된 배양에서의 성장에 특히 매우 적합하다.
본원에 사용된 바와 같이, "주어진 아미노산 서열"에서의 아미노산 잔기의 "위치"는 서열 번호 2의 천연 트리초데르마 종 LOV 단백질의 아미노산 잔기 넘버링(위치)을 사용하여 본원에서 넘버링된다. 예를 들어, "서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 트레오닌(T) 잔기를 포함" 및 "서열 번호 2의 813번 위치에 상응하는 서열 위치에서의 리신(K) 잔기를 포함"과 같은 어구에서, 자연적 (트리초데르마 종) LOV 단백질의 아미노산 서열(서열 번호 2)은 기준 (모) 단백질 서열로 작용한다.
예를 들어, 도 7c-7f에 도시된 바와 같이, 본원에 기재된 주어진 아미노산 서열은 본원에 기재된 정렬 알고리즘(및/또는 당업자에게 공지된 정렬 알고리즘)을 이용하여 자연적 트리초데르마 종 LOV 단백질 아미노산 서열(서열 번호 2)과 정렬될 수 있고, 자연적 서열에서의 아미노산 잔기와 정렬(바람직하게는, 최적으로 정렬)하는 주어진 아미노산 서열에서의 아미노산 잔기는 LOV 서열에서의 상응하는 아미노산 잔기를 참조하여 편리하게 넘버링될 수 있다. 따라서, 도 7은 다양한 (자낭균류) 사상성 진균, 예컨대 서열 "12" 표지된 아스페르길루스 종(서열 번호 12), 서열 "13" 표지된 페니실리움 종(서열 번호 13), 서열 "14" 표지된 탈라로마이세스 종(서열 번호 14), 서열 "15" 표지된 푸사륨 종(서열 번호 15), 서열 "16" 표지된 마이셀리오프토라 종(서열 번호 16), 서열 "17" 표지된 뉴로스포라 종(서열 번호 17) 및 서열 "18" 표지된 칸디다 종(서열 번호 18)으로부터의 LOV 단백질 오솔로그와 정렬된 서열 "2" 표지된 자연적 트리초데르마 종 LOV 단백질(서열 번호 2)의 다중 서열 정렬을 제시한다.
마찬가지로, 트리초데르마 종 LOV 단백질의 1차 (1°) 서열(서열 번호 2)과 서열 상동성 또는 서열 동일성을 확립하기 위해, 당업자는 당업자에게 공지된 서열 정렬 알고리즘, 소프트웨어 및 이의 방법을 이용하여 서열 번호 2의 1차 서열을 하나 이상의 후보 LOV 단백질 (오솔로그) 서열과 용이하게 비교할 수 있다. 따라서, 정렬을 유지시키기 위해(즉, 임의적인 결실 및 삽입을 통해 보존된 잔기의 제거를 피하기 위해) 필요한 삽입 및 결실을 허용하는, 보존된 잔기를 정렬한 후, 자낭균류 LOV 단백질의 1차 서열에서의 특정 아미노산에 동등한 잔기가 정의된다. 보존된 잔기의 정렬은 바람직하게는 이러한 잔기의 100%를 보존해야 한다. 그러나, 보존된 잔기의 98% 초과, 95%, 90%, 85%, 80%, 75% 70%, 50% 또는 적어도 45%의 정렬은 동등한 잔기를 한정하기에 또한 적절하다.
따라서, 본원에 사용된 바와 같이, 서열 번호 2의 813번 위치에 상응하는(또는 동등한) 아미노산 (잔기) 위치에서의 리신(K) 아미노산에 대한 트레오닌 (T) 아미노산의 치환(T813→813K 치환)은 임의의 자낭균류 사상성 진균 세포에서 서열 번호 2의 813번 위치에 상응하는 아미노산 (잔기) 위치에서의 임의의 T813→813K 치환을 포함한다.
본원에 사용된 바와 같이, 용어 "유전자"는 단백질 또는 RNA를 암호화하고 이의 발현을 지시하는 핵산을 지칭한다는 점에서 용어 "대립유전자"와 동의어이다. 사상성 진균의 영양 형태는 일반적으로 반수체이며, 따라서 특정 유전자의 단일 카피(즉, 단일 대립유전자)는 특정 표현형을 부여하기에 충분하다.
본원에 사용된 바와 같이, 용어 "폴리펩타이드" 및 "단백질"(및/또는 이의 각각의 복수 형태)은 펩타이드 결합에 의해 연결된 아미노산 잔기를 포함하는 임의의 길이의 중합체를 지칭하기 위해 상호교환적으로 사용된다. 아미노산 잔기에 대한 통상적인 1문자 또는 3문자 코드가 본원에 사용된다. 중합체는 선형 또는 분지형일 수 있고, 변형된 아미노산을 포함할 수 있고, 비아미노산이 개재될 수 있다. 이 용어는 또한 자연적으로 또는 개입에 의해, 예컨대 디설파이드 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화 또는 표지 성분과의 접합과 같은 임의의 다른 조작 또는 변형에 의해 변형된 아미노산 중합체를 포함한다. 예를 들어, 아미노산의 하나 이상의 유사체(예를 들어, 비천연 아미노산 등을 포함)뿐만 아니라 당업계에 공지된 다른 변형을 함유하는 폴리펩타이드도 정의에 포함된다.
본원에 사용된 바와 같이, 용어 "유도체 폴리펩타이드/단백질"은 N 말단 및 C 말단 중 어느 하나 또는 둘 모두에 대한 하나 이상의 아미노산의 부가, 아미노산 서열에서의 하나의 또는 다수의 상이한 부위에서의 하나 이상의 아미노산의 치환, 단백질의 어느 하나 또는 양 말단에서의 또는 아미노산 서열에서의 하나 이상의 부위에서의 하나 이상의 아미노산의 결실, 및/또는 아미노산 서열에서의 하나 이상의 부위에서의 하나 이상의 아미노산의 삽입에 의해 단백질로부터 유래되거나 유래될 수 있는 단백질을 지칭한다. 단백질 유도체의 제조는 자연적 단백질을 암호화하는 DNA 서열의 변형, 적합한 숙주로 그 DNA 서열을 형질전환시키는 것 및 변형된 DNA 서열을 발현시켜 유도체 단백질을 형성하는 것에 의해 달성될 수 있다.
관련(및 유도체) 단백질은 "변이체 단백질"을 포함한다. 변이체 단백질은 소수의 아미노산 잔기에서의 치환, 결실, 및/또는 삽입에 의해 기준/모 단백질(예를 들어, 야생형 단백질)과 상이하다. 변이체 단백질과 모 단백질 사이에서 차이가 있는 아미노산 잔기의 수는 1개 이상, 예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 15개, 20개, 30개, 40개, 50개 이상의 아미노산 잔기일 수 있다. 변이체 단백질은 기준 단백질과 적어도 약 50%, 적어도 약 60%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 심지어 적어도 약 99%, 또는 그보다 많은 아미노산 서열 동일성을 공유할 수 있다. 변이체 단백질은 또한 선택된 모티프, 도메인, 에피토프, 보존 영역 등에서 기준 단백질과 상이할 수 있다.
본원에 사용된 바와 같이, 용어 "상사 서열"은 관심 단백질(즉, 전형적으로 원래의 관심 단백질)과 유사한 작용, 3차 구조, 및/또는 보존 잔기를 제공하는 단백질 내의 서열을 지칭한다. 예를 들어, α-헬릭스 또는 β-시트 구조를 함유하는 에피토프 영역에서, 상사 서열에서의 대체 아미노산은 바람직하게는 동일한 특정 구조를 유지한다. 이 용어는 또한 뉴클레오타이드 서열, 및 아미노산 서열을 지칭한다. 일부 구현예에서, 아미노산의 대체가 유사한 기능 또는 개선된 기능을 나타내는 변이체 효소를 생성시키도록 상사 서열이 개발된다. 일부 구현예에서, 관심 단백질에서의 아미노산의 3차 구조 및/또는 보존 잔기는 관심 분절 또는 단편에서 또는 그 근처에 위치한다. 따라서, 관심 분절 또는 단편이 예를 들어 α-헬릭스 또는 β-시트 구조를 함유하는 경우, 대체 아미노산은 바람직하게는 그 특정 구조를 유지시킨다.
본원에 사용된 바와 같이, 용어 "상동성 단백질"은 기준 단백질과 비슷한 활성 및/또는 구조를 갖는 단백질을 지칭한다. 상동물은 반드시 진화론상 관련되는 것은 아니다. 따라서, 이 용어는 상이한 유기체로부터 얻은 동일한, 유사한 또는 대응하는 단백질(들)(즉, 구조 및 기능 면에서)을 포함하고자 한 것이다. 일부 구현예에서, 기준 단백질과 유사한 4차, 3차 및/또는 1차 구조를 갖는 상동물을 확인하는 것이 바람직하다.
서열 사이의 상동성의 정도는 당해 분야에 알려진 임의의 적합한 방법을 이용하여 결정될 수 있다(예를 들어, Smith 및 Waterman의1981 문헌; Needleman 및 Wunsch의 1970 문헌; Pearson 및 Lipman의 1988 문헌; Wisconsin Genetics Software Package(Genetics Computer Group, 미국 위스콘신주 매디슨 소재)의 GAP, BESTFIT, FASTA 및 TFASTA와 같은 프로그램; 및 Devereux 등의 1984 문헌 참조).
예를 들어, PILEUP는 서열 상동성 수준을 결정하는 데 유용한 프로그램이다. PILEUP은 진행식 쌍별 정렬(pair-wise alignment)을 이용하여 관련 서열들의 군으로부터 다중 서열 정렬을 생성한다. 이것은 또한 정렬을 생성하는 데 사용된 클러스터링(clustering) 관계를 나타내는 트리(tree)를 작성할 수 있다. PILEUP은 Feng 및 Doolittle의 1987 문헌의 진행식 정렬 방법의 단순화를 이용한다. 상기 방법은 Higgins 및 Sharp의 1989 문헌에 의해 기재된 것과 유사하다. 유용한 PILEUP 매개변수는 3.00의 디폴트 갭 가중치, 0.10의 디폴트 갭 길이 가중치 및 가중 말단 갭을 포함한다. 유용한 알고리즘의 또 다른 예로는 문헌[Altschul et al., 1990 and Karlin et al., 1993]에 의해 기재된 BLAST 알고리즘이다. 하나의 특히 유용한 BLAST 프로그램은 WU-BLAST-2 프로그램이다(예를 들어, Altschul 등의 1996 문헌 참조). 매개변수 "W", "T" 및 "X"는 정렬의 민감도 및 속도를 결정한다. BLAST 프로그램은 디폴트로서 11의 워드길이(W), 50의 BLOSUM62 점수 행렬(예를 들어, Henikoff 및 Henikoff의 1989 문헌 참조) 정렬(B), 10의 기대치(E), M′5, N′-4, 및 스트랜드 둘 다의 비교를 이용한다.
본원에 사용된 바와 같이, 어구 "실질적으로 유사한" 및 "실질적으로 동일한"은, 적어도 2개의 핵산 또는 폴리펩타이드의 맥락에서, 전형적으로 폴리뉴클레오타이드 또는 폴리펩타이드가 기준(즉, 야생형) 서열과 비교하여 적어도 약 70%의 동일성, 적어도 약 75%의 동일성, 적어도 약 80%의 동일성, 적어도 약 85%의 동일성, 적어도 약 90%의 동일성, 적어도 약 91%의 동일성, 적어도 약 92%의 동일성, 적어도 약 93%의 동일성, 적어도 약 94%의 동일성, 적어도 약 95%의 동일성, 적어도 약 96%의 동일성, 적어도 약 97%의 동일성, 적어도 약 98%의 동일성, 또는 심지어 적어도 약 99%의 동일성 이상을 갖는 서열을 포함함을 의미한다. 서열 동일성은 표준 매개변수를 이용하여 BLAST, ALIGN 및 CLUSTAL과 같은 알려진 프로그램을 이용하여 결정될 수 있다. (예를 들어, Altschul 등의 1990 문헌; Henikoff 등의 1989 문헌; Karlin 등의 1993 문헌; 및 Higgins 등의 1988 문헌 참조). BLAST 분석을 수행하기 위한 소프트웨어는 미국 국립 생물공학 정보 센터(National Center for Biotechnology Information)를 통해 공공에게 이용 가능하다. 또한, 데이터베이스는 FASTA(Pearson 등의 1988 문헌)를 이용하여 조사될 수 있다. 2개의 폴리펩타이드가 실질적으로 동일하다는 하나의 표시는 제1 폴리펩타이드가 제2 폴리펩타이드와 면역학적으로 교차반응성이라는 것이다. 전형적으로, 보존적 아미노산 치환이 다른 폴리펩타이드는 면역학적으로 교차반응성이다. 따라서, 예를 들어, 2개의 펩타이드가 보존적 치환만이 다른 경우에 폴리펩타이드는 제2 폴리펩타이드와 실질적으로 동일하다. 2개의 핵산 서열이 실질적으로 동일하다는 다른 표시는 2개의 분자가 엄격한 조건 하에 (예를 들어, 높은 고엄격도로 배지의 범위 내에서) 서로에 혼성화한다는 것이다.
본원에 사용된 바와 같이, "핵산"은 뉴클레오타이드 서열 또는 폴리뉴클레오타이드 서열, 및 이의 단편 또는 일부를 지칭할 뿐만 아니라, 센스 가닥 또는 안티센스 가닥을 나타내는지와 상관없이, 이중 가닥 또는 단일 가닥일 수 있는 게놈 또는 합성 기원의 DNA, cDNA 및 RNA를 지칭한다.
본원에 사용된 바와 같이, 용어 "발현"은 본 발명의 핵산 분자로부터 유래된 센스 RNA(mRNA) 또는 안티센스 RNA의 전사 및 안정한 축적을 지칭한다. 발현은 또한 mRNA가 폴리펩타이드로 번역되는 것을 지칭할 수 있다. 따라서, 용어 "발현"은 비제한적인 예로서 전사, 전사 후 변형, 번역, 번역 후 변형, 분비 등을 포함하는 폴리펩타이드의 생산에 관여된 임의의 단계를 포함한다.
본원에 사용된 바와 같이, "사상성 진균 세포의 변이체 균주가 '증가한' 양의 관심 단백질(POI)을 발현한다/생산한다"(즉, 모 세포에 비해)와 같은 어구에 사용된 바와 같은 조합된 용어 "발현한다/생산한다"에서, 용어 "발현한다/생산한다"는 본 발명의 이러한 변이체 사상성 진균 균주에서 단백질의 발현 및 생산에 관여된 임의의 단계를 포함하고자 한다.
소정의 구현예에서, "실질적인 상동성"을 포함하는 LOV 단백질을 암호화하는 유전자, 폴리뉴클레오타이드 또는 핵산 서열은 (비교가 이루어진) 대응하는 핵산 서열로부터 미미한 서열 변이를 갖고, (비교가 이루어진) 대응하는 핵산 서열과 실질적으로 동일한 생물학적 기능을 보유하는 DNA 또는 RNA (핵산) 서열을 지칭한다. 예를 들어, 소정의 구현예에서, LOV 단백질을 암호화하는 유전자, 폴리뉴클레오타이드 또는 핵산 서열과 실질적인 서열 상동성을 포함하는 핵산 서열은 본원에 기재된 것처럼 암호화된 유전자 산물(LOV 단백질)을 확인함으로써 평가된다.
소정의 다른 구현예에서, LOV 단백질을 암호화하는 유전자, 폴리뉴클레오타이드 또는 핵산과 서열 상동성을 포함하는 유전자, 폴리뉴클레오타이드 또는 핵산 서열은 핵산 혼성화 방법을 이용하여 결정/확인된다. 예를 들어, 소정의 구현예에서, LOV 단백질을 암호화하는 유전자와 실질적인 서열 상동성을 포함하는 DNA/RNA 서열(예를 들어, 서열 번호 2)은 엄격한 조건 하에 본 발명의 특정 핵산 서열과 혼성화하는 이러한 DNA/RNA 서열의 능력에 의해 확인된다.
본원에 사용된 바와 같이, "엄격한 조건 하에 혼성화한다"는 혼성화 및 세척에 대한 조건을 기재하고자 하고, 이 조건 하에서 상당히 서로 동일하거나 상동성인 뉴클레오타이드 서열은 서로 혼성화된다. 이러한 엄격한 조건은 당업자에게 잘 알려져 있다(예를 들어, Ausubel 등의 1995 문헌; Sambrook 등의 1989 문헌 참조). 예를 들어, 소정의 구현예에서, 엄격한 혼성화 조건의 비제한적인 예는 약 65-70℃에서의 4X 염화나트륨/시트르산나트륨(SSC) 중의 혼성화(또는 약 42-50℃에서의 4×SSC와 50% 포름알데하이드 중의 혼성화), 이어서 약 65-70℃에서의 1×SSC 중의 1회 이상의 세척을 포함한다. 마찬가지로, 고도로 엄격한 혼성화 조건의 비제한적인 예는 약 65-70℃에서의 1×SSC 중의 혼성화(또는 약 42-50℃에서의 4×SSC와 50% 포름알데하이드 중의 혼성화), 이어서 약 65-70℃에서의 0.3×SSC 중의 1회 이상의 세척을 포함한다. 따라서, 고도로 엄격한 혼성화는 약 50-60℃에서의 4×SSC 중의 혼성화(또는 대안적으로 약 40-45℃에서의 6×SSC와 50% 포름알데하이드 중의 혼성화), 이어서 약 50-60℃에서의 2×SSC 중의 1회 이상의 세척을 포함한다. 예를 들어, 65-70℃ 또는 42-50℃에서 상기 언급된 값에 중간인 범위는 또한 본 발명에 의해 포함되는 것으로 의도된다. 소정의 구현예에서, SSPE(1xSSPE는 0.15 M NaCl, 10 mM NaH2PO4 및 1.25 mM EDTA, pH 7.4임)는 혼성화 및 세척 완충액에서 SSC(1xSSPE는 0.15 M NaCl 및 15 mM 시트르산나트륨임)를 대신할 수 있고, 세척은 혼성화가 완료된 후 각각 15분 동안 수행된다. 50개 미만의 염기 쌍 길이에 기대되는 하이브리드에 대한 혼성화 온도는 하이브리드의 융점(Tm)보다 5 내지 10℃ 낮아야 하고, 여기서 Tm은 하기 식에 따라 결정된다. 18개 미만의 염기 쌍 길이의 하이브리드에 대해, Tm(℃) = 2(A+T 염기의 수) + 4(G+C 염기의 수). 18개 내지 49개의 염기 쌍 길이의 하이브리드에 대해, Tm(℃) = 81.5 + 16.6(log10[Na+]) + 0.41(% G+C) - (600/N)이고, 여기서 N은 하이브리드에서의 염기의 수이고, [Na+]는 혼성화 완충액 중의 나트륨 이온의 농도(1xSSC에 대한 [Na+] = 0.165 M)이다. 숙련된 실행자는 비제한적인 예로서 차단제(예를 들어, BSA 또는 연어 또는 청어 정자 운반 DNA), 세제(예를 들어, SDS), 킬레이트화제(예를 들어, EDTA), Ficoll, PVP 등을 포함하는 추가의 시약이 니트로셀룰로스 또는 나일론 막과 같은 막에 대한 핵산 분자의 비특이적 혼성화를 감소시키기 위해 혼성화 및/또는 세척 완충액에 첨가될 수 있다는 것을 또한 인식할 것이다. 특히 나일론 막을 사용할 때, 엄격한 혼성화 조건의 추가의 비제한적인 예는 약 65℃에서의 0.25 내지 0.5 M NaH2PO4, 7% SDS에서의 혼성화, 이어서 약 65℃에서의 0.02 M NaH2PO4, 1% SDS 또는 대안적으로 0.2ХSSC, 1% SDS에서의 1회 이상의 세척을 포함한다(예를 들어, Church 및 Gilbert 등의 1984 문헌 참조).
따라서, 일반적으로 상기 기재된 것처럼, 본 발명의 소정의 구현예는 LOV 단백질을 암호화하는 유전자의 유전자 변형을 포함하는 사상성 진균 세포의 변이체 균주에 관한 것이다. 본원에 사용된 바와 같이, 용어 "변형" 및 "유전자 변형"은 상호교환적으로 사용되며, (a) 유전자에서의 하나 이상의 뉴클레오타이드의 도입, 치환 또는 제거, 또는 유전자의 전사 또는 번역에 필요한 조절 요소에서의 하나 이상의 뉴클레오타이드의 도입, 치환 또는 제거, (b) 유전자 파괴, (c) 유전자 전환, (d) 유전자 결실, (e) 유전자(예를 들어, 안티센스 RNA, siRNA, miRNA 등)의 하향조절, (f) 특이적 돌연변이유발(비제한적인 예로서 CRISPR/Cas9 기반 돌연변이유발 포함) 및/또는 (g) 본원에 개시된 임의의 하나 이상의 유전자의 랜덤 돌연변이유발을 포함하지만, 이들로 제한되지는 않는다.
본원에 사용된 바와 같이, 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 본원에 개시된 LOV 단백질을 암호화하는 유전자의 유전자 변형을 포함하지만, 이것으로 제한되지는 않는다. 따라서, 하기 더 자세히 추가로 기재된 것처럼, 다양한 분자 생물학적 방법은 잘 알려져 있고, 사상성 진균 세포의 이러한 변이체 균주를 생성/작제하기 위해 당업자에게 이용 가능하다.
본원에 사용된 바와 같이, "단백질을 암호화하는 유전자에서의 하나 이상의 뉴클레오타이드의 도입, 치환 또는 제거"에서, 이러한 유전자 변형은 유전자의 암호화 서열(즉, 엑손) 및 비암호화 개재(인트론) 서열을 포함한다.
본원에 사용된 바와 같이, "유전자의 파괴", "유전자 파괴", "유전자의 불활성화" 및 "유전자 불활성화"는 상호교환적으로 사용되며, 표적 유전자를 실질적으로 파괴/불활성화하는 임의의 유전자 변형을 광의적으로 지칭한다. 예시적인 유전자 파괴 방법은 폴리펩타이드 암호화 서열(CDS), 프로모터, 인핸서 또는 다른 조절 요소를 포함하는 유전자의 임의의 부분의 전체 또는 부분 결실, 또는 이들의 돌연변이유발을 포함하지만, 이들로 제한되지는 않고, 여기서 돌연변이유발은 표적 유전자(들)를 파괴/불활성화하고 기능적 유전자 산물의 발현/생산을 실질적으로 감소시키거나 방지하는 치환, 삽입, 결실, 역전, 및 임의의 이들의 조합 및 변형을 포괄한다. 본 발명의 소정의 구현예에서, 이러한 유전자 파괴는 숙주 세포가 암호화된 lov 유전자 산물을 발현/생산하는 것을 방지한다.
소정의 구현예에서, LOV 단백질을 암호화하는 유전자, 폴리뉴클레오타이드 또는 핵산 서열은 확립된 유전자 편집 기법, 예컨대 CRISPR/Cas9 유전자 편집, 징크 핑거 뉴클레아제(ZFN: zinc-finger nuclease) 유전자 편집, 전사 활성자 유사 효과기 뉴클레아제 편집(TALEN: transcription activator-like effector nuclease editing), 호밍(mega) 뉴클레아제 편집 등을 사용하여 유전자 변형된다.
다른 구현예에서, 사상성 진균의 변이체 균주는 유전자 전환의 과정에 의해 작제된다(즉, 유전자 변형된다)(예를 들어, Iglesias 및 Trautner의 1983 문헌 참조).
다른 구현예에서, 본 발명의 자낭균류 세포에 의해 발현/생산된 관심 단백질(예를 들어, 내인성 POI 또는 비상동성 POI)은 비제한적인 예로서 단백질 이동/이동도(SDS-PAGE), 질량 분광법, HPLC, 크기 배제, 초원심분리 침강 속도 분석, 전사체학, 단백질체학, 형광 태그, 에피토프 태그, 형광 단백질(GFP, RFP 등) 키메라/하이브리드 등을 포함하는 단백질 정량화 방법, 유전자 전사 방법, mRNA 번역 방법 등에 의해 검출되거나 측정되거나 분석되거나 기타 등등이 된다.
본원에 사용된 바와 같이, 기능적으로 및/또는 구조적으로 유사한 단백질은 "관련 단백질"인 것으로 간주된다. 이러한 관련된 단백질은 상이한 속 및/또는 종의 유기체 또는 심지어 상이한 강의 유기체(예를 들어, 박테리아 및 진균)로부터 유래될 수 있다. 관련 단백질은 또한 1차 서열 분석에 의해 결정되거나, 2차 또는 3차 구조 분석에 의해 결정되거나, 면역학적 교차반응성에 의해 결정된 상동물 및/또는 오솔로그를 포괄한다.
본원에 사용된 바와 같이, 용어 "프로모터"는 암호화 서열 또는 기능적 RNA의 발현을 제어할 수 있는 핵산 서열을 지칭한다. 일반적으로, 암호화 서열은 프로모터 서열에 대해 3'(하류)에 위치한다. 프로모터는 자연적 유전자로부터 그 전체가 유래될 수 있거나, 자연에서 발견되는 상이한 프로모터로부터 유래되는 상이한 요소로 구성될 수 있거나, 심지어 합성 핵산 절편을 포함할 수 있다. 상이한 프로모터가 상이한 세포 유형에서의 유전자 또는 상이한 발달 단계에 있는 유전자의 발현을 지시하거나, 상이한 환경적 또는 생리적 조건에 반응하여 유전자의 발현을 지시할 수 있음을 당업자는 이해할 것이다. 대부분의 세포 유형에서 대부분의 시점에 유전자가 발현되도록 하는 프로모터는 일반적으로 "구성적 프로모터"로 지칭된다. 또한, 대부분의 경우 조절 서열의 정확한 경계가 완전히 정의되지 않았기 때문에, 상이한 길이의 DNA 단편이 동일한 프로모터 활성을 가질 수 있는 것으로 추가로 인식된다.
본원에 사용된 바와 같이, 용어 "작동 가능하게 연결된"은 하나의 기능이 다른 하나에 의해 영향을 받도록 단일 핵산 단편 상에서 핵산 서열들이 회합하는 것을 지칭한다. 예를 들어, 프로모터는 이것이 암호화 서열(예를 들어, ORF)의 발현에 영향을 줄 수 있을 때(즉, 그 암호화 서열은 프로모터의 전사 제어 하에 있음) 그 암호화 서열과 작동 가능하게 연결된다. 암호화 서열은 센스 배향 또는 안티센스 배향으로 조절 서열에 작동 가능하게 연결될 수 있다. 핵산이 다른 핵산 서열과 기능적 관계에 있도록 위치할 때 이 핵산은 "작동 가능하게 연결"된다. 예를 들어, 분비 리더(즉, 신호 펩타이드)를 암호화하는 DNA가 폴리펩타이드의 분비에 참여하는 전단백질(pre-protein)로서 발현되는 경우 이것이 폴리펩타이드용 DNA에 작동 가능하게 연결되거나; 프로모터 또는 인핸서가 서열의 전사에 영향을 미칠 경우 이들이 암호화 서열에 작동 가능하게 연결되거나; 리보솜 결합 부위가 번역을 촉진하도록 위치하는 경우 이것이 암호화 서열에 작동 가능하게 연결된다. 일반적으로 "작동 가능하게 연결된"은 연결되는 DNA 서열들이 인접해 있음을 의미하고, 분비 리더의 경우에는 인접해 있고 판독 단계에 있음을 의미한다. 그러나, 인핸서는 인접해 있을 필요는 없다. 연결은 편리한 제한 부위에서의 결찰에 의해 달성된다. 이러한 부위가 존재하지 않는 경우, 합성 올리고뉴클레오타이드 어댑터 또는 링커가 통상적인 관례에 따라 사용된다.
본원에 정의된 바와 같이, "적합한 조절 서열"은 암호화 서열의 상류(5' 비암호화 서열)에, 암호화 서열 내에 또는 하류(3' 비암호화 서열)에 위치하고, 회합된 암호화 서열의 전사, RNA 가공 또는 안정성, 또는 번역에 영향을 미치는 뉴클레오타이드 서열을 지칭한다. 조절 서열은 프로모터, 번역 리더 서열, RNA 가공 부위, 효과기 결합 부위 및 스템-루프 구조를 포함할 수 있다.
본원에 정의된 바와 같이, 적어도 하나의 폴리뉴클레오타이드 오픈 리딩 프레임(ORF: open reading frame), 또는 이의 유전자 또는 이의 벡터를 "진균 세포 내로 도입하는"과 같은 어구에서 사용될 때 용어 "도입하는"은 비제한적인 예로서 원형질체 융합, 천연 또는 인공 형질전환(예를 들어, 염화칼슘, 전기천공), 형질도입, 형질주입 등을 포함하는 세포로 폴리뉴클레오타이드를 도입하기 위해 당해 분야에 알려진 방법을 포함한다.
본원에 사용된 바와 같이, "형질전환된" 또는 "형질전환"은 세포가 재조합 DNA 기법을 사용하여 형질전환된다는 것을 의미한다. 형질전환은 전형적으로 하나 이상의 뉴클레오타이드 서열(예를 들어, 폴리뉴클레오타이드, ORF 또는 유전자)을 세포로 삽입함으로써 일어난다. 삽입된 뉴클레오타이드 서열은 이종성 뉴클레오타이드 서열(즉, 형질전환되는 세포에 자연 발생하지 않는 서열)일 수 있다.
본원에 사용된 바와 같이, "형질전환"은 DNA가 염색체 통합체 또는 자가 복제성 염색체외 벡터로서 유지되도록 숙주 세포로 외인성 DNA를 도입하는 것을 지칭한다. 본원에 사용된 바와 같이, "형질전환 DNA", "형질전환 서열" 및 "DNA 작제물"은 숙주 세포로 서열을 도입하는 데 사용된 DNA를 지칭한다. DNA는 PCR 또는 임의의 다른 적합한 기법에 의해 시험관내 생성될 수 있다. 일부 구현예에서, 형질전환 DNA는 유입 서열을 포함하는 반면, 다른 구현예에서는 상동성 박스가 측접된 유입 서열을 추가로 포함한다. 더 추가의 구현예에서, 형질전환 DNA는 말단에 추가된 다른 비상동성 서열(즉, 스터퍼 서열 또는 플랭크)을 포함한다. 말단은 형질전환 DNA가 예를 들어 벡터로의 삽입과 같은 폐쇄된 원을 형성하도록 폐쇄될 수 있다.
본원에 사용된 바와 같이, "유입 서열"은 진균 세포 염색체로 도입된 DNA 서열을 지칭한다. 일부 구현예에서, 유입 서열은 DNA 작제물의 일부이다. 다른 구현예에서, 유입 서열은 하나 이상의 관심 단백질을 암호화한다. 일부 구현예에서, 유입 서열은 형질전환되는 세포의 게놈에 이미 존재하거나 존재하지 않을 수 있는 서열을 포함한다(즉, 상동성 서열이거나 이종성 서열일 수 있음). 일부 구현예에서, 유입 서열은 하나 이상의 관심 단백질, 유전자, 및/또는 돌연변이되었거나 변형된 유전자를 암호화한다. 대안적인 구현예에서, 유입 서열은 기능적 야생형 유전자 또는 오페론, 기능적 돌연변이체 유전자 또는 오페론, 또는 비기능적 유전자 또는 오페론을 암호화한다. 일부 구현예에서, 유입 서열은 유전자로 삽입되어 유전자의 기능을 파괴하는 비기능적 서열이다. 다른 구현예에서, 유입 서열은 선택적 마커를 포함한다. 추가의 구현예에서, 유입 서열은 2개의 상동성 박스를 포함한다.
본원에 사용된 바와 같이, "상동성 박스"는 진균 세포 염색체에서의 서열에 상동성인 핵산 서열을 지칭한다. 보다 구체적으로는, 상동성 박스는 본 발명에 따라 결실되거나, 파괴되거나, 비활성화되거나, 하향조절 등이 되는 유전자 또는 유전자의 일부의 바로 측접하는 암호화 영역과 약 80% 내지 100%의 서열 동일성, 약 90% 내지 100%의 서열 동일성, 또는 약 95% 내지 100%의 서열 동일성을 갖는 상류 또는 하류 영역이다. 이러한 서열은 진균 세포 염색체에서 DNA 작제물이 어디에서 통합되는지를 지시하고, 진균 세포 염색체의 어느 부분이 유입 서열에 의해 대체되는지를 지시한다. 본 발명을 한정하고자 하는 것은 아니지만, 상동성 박스는 약 1개 염기쌍(bp) 내지 200개 킬로염기(kb)를 포함할 수 있다. 바람직하게는, 상동성 박스는 약 1 bp 내지 10.0 kb; 1 bp 내지 5.0 kb; 1 bp 내지 2.5 kb; 1 bp 내지 1.0 kb, 및 0.25 kb 내지 2.5 kb를 포함한다. 상동성 박스는 또한 약 10.0 kb, 5.0 kb, 2.5 kb, 2.0 kb, 1.5 kb, 1.0 kb, 0.5 kb, 0.25 kb 및 0.1 kb를 포함할 수 있다. 일부 구현예에서, 선택적 마커의 5’ 및 3’ 말단은 상동성 박스에 의해 측접되고, 상동성 박스는 유전자의 암호화 영역을 바로 측접시키는 핵산 서열을 포함한다.
본원에 사용된 바와 같이, 용어 "선별 마커-암호화 뉴클레오타이드 서열"은 숙주 세포에서 발현할 수 있고 선별 마커의 발현이 발현된 유전자를 함유하는 세포에 상응하는 선택 제제의 존재 또는 필수 영양소의 부재 하에 성장하는 능력을 부여하는 뉴클레오타이드 서열을 지칭한다.
본원에 사용된 바와 같이, 용어 "선별 마커" 및 "선택적 마커"는 벡터를 함유하는 숙주의 선택을 용이하게 하는 이 숙주 세포에서 발현할 수 있는 핵산(예를 들어, 유전자)을 지칭한다. 이러한 선별 마커의 예는 항균제를 포함하지만, 이들로 제한되지는 않는다. 따라서, 용어 "선별 마커"는 숙주 세포가 관심 유입 DNA를 흡수했거나 일부 다른 반응이 일어났다는 표시를 제공하는 유전자를 지칭한다. 전형적으로, 선별 마커는 외인성 DNA를 함유하는 세포가 형질전환 동안 어떠한 외인성 서열도 받지 않은 세포와 구별되게 하기 위해 숙주 세포에 항균 내성 또는 대사 이점을 부여하는 유전자이다.
본원에 정의된 바와 같이, 숙주 세포 "게놈", 진균 세포 "게놈" 또는 사상성 진균 세포 "게놈"은 염색체 유전자 및 염색체외 유전자를 포함한다.
본원에 사용된 바와 같이, 용어 "플라스미드", "벡터" 및 "카세트"는 염색체외 요소를 지칭하며, 이는 대개 전형적으로 세포의 중심 대사의 일부가 아니고 보통 원형 이중 가닥 DNA 분자의 형태인 유전자를 운반한다. 이러한 요소는 임의의 공급원으로부터 유래되는 단일 가닥 또는 이중 가닥 DNA 또는 RNA의, 선형 또는 원형인, 자율 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오타이드 서열일 수 있으며, 여기서 다수의 뉴클레오타이드 서열은 선택된 유전자 산물에 대한 DNA 서열 및 프로모터 단편을 적절한 3' 비번역 서열과 함께 세포로 도입할 수 있는 독특한 작제물로 연결되거나 재조합된다.
본원에 사용된 바와 같이, 용어 "벡터"는 세포에서 복제(증식)될 수 있고, 새로운 유전자 또는 DNA 분절(예를 들어, "유입 서열")을 세포로 운반할 수 있는 임의의 핵산을 지칭한다. 따라서, 이 용어는 상이한 숙주 세포들 간의 전달을 위해 설계된 핵산 작제물을 지칭한다. 벡터는 바이러스, 박테리오파지, 프로-바이러스, 플라스미드, 파지미드, 트랜스포존 및 인공 염색체, 예컨대 YAC(효모 인공 염색체), BAC(박테리아 인공 염색체), PLAC(식물 인공 염색체) 등을 포함하는데, 이들은 "에피좀"(즉, 자율 복제)이거나 숙주 세포의 염색체로 통합될 수 있다.
본원에 사용된 바와 같이, "형질전환 카세트"는 유전자(또는 이의 ORF)를 포함하고 유전자 이외에 특정 숙주 세포의 형질전환을 용이하게 하는 요소를 갖는 특이적 벡터를 지칭한다.
"발현 벡터"는 세포에서 이종성 DNA를 혼입하고 발현시키는 능력을 갖는 벡터를 지칭한다. 많은 원핵 및 진핵 발현 벡터가 상업적으로 이용 가능하고 당업자에게 알려져 있다. 적절한 발현 벡터의 선택은 당업자의 지식 내에 있다.
본원에 사용된 바와 같이, 용어 "발현 카세트" 및 "발현 벡터"는 표적 세포에서 특정 핵산의 전사를 허용하는 일련의 명시된 핵산 요소를 사용하여 재조합으로 또는 합성에 의해 생성된 핵산 작제물을 지칭한다(즉, 이들은 상기에 기술된 바와 같은 벡터 또는 벡터 요소임). 재조합 발현 카세트는 플라스미드, 염색체, 미토콘드리아 DNA, 색소체 DNA, 바이러스 또는 핵산 단편으로 혼입될 수 있다. 전형적으로, 발현 벡터의 재조합 발현 카세트 부분은 다른 서열 중에서도 전사될 핵산 서열 및 프로모터를 포함한다. 일부 구현예에서, DNA 작제물은 또한 표적 세포에서 특정 핵산의 전사를 허용하는 일련의 명시된 핵산 요소를 포함한다. 소정의 구현예에서, 본 발명의 DNA 작제물은 본원에 정의된 바와 같은 선택적 마커 및 비활성화 염색체 또는 유전자 또는 DNA 절편을 포함한다.
본원에 사용된 바와 같이, "표적화 벡터"는 표적화 벡터가 형질전환되는 숙주 세포의 염색체 내 영역에 대해 상동성이고, 그 영역에서 상동성 재조합을 유도할 수 있는 폴리뉴클레오타이드 서열을 포함하는 벡터이다. 예를 들어, 표적화 벡터는 상동성 재조합을 통해 숙주 세포의 염색체로 유전자 변형을 도입하는 데 사용된다. 일부 구현예에서, 표적화 벡터는 예를 들어 말단에 부가된 다른 비상동성 서열(즉, 스터퍼 서열 또는 측접 서열)을 포함한다. 그 말단은 표적화 벡터가 예를 들어 벡터 내로의 삽입과 같이 폐쇄된 원을 형성하도록 폐쇄될 수 있다.
본원에 사용된 바와 같이, "향상된 단백질 생산성 표현형"을 포함하는 변이체 세포(또는 균주)는 향상된/증가된 부피측정 생산성을 포함하는 변이체 세포(또는 균주), 향상된/증가된 탄소 전환 효율을 포함하는 변이체 세포(또는 균주), 향상된/증가된 단백질 수율을 포함하는 변이체 세포(또는 균주), 향상된/증가된 단백질 비생산성을 포함하는 변이체 세포(또는 균주) 등을 포함하지만, 이들로 제한되지는 않는다. 예를 들어, 소정의 구현예에서, 향상된 단백질 생산성 표현형을 포함하는 변이체 세포 또는 균주는 (모 균주에 비해) 공급 당의 g당 적어도 0.1% 이상의 총 단백질(g)을 발현/생산하고, 여기서 공급 당은 제조 단계(즉, 공급-시작 후) 동안 발효기에 첨가된 당의 질량의 면에서 표현될 수 있다.
본원에 정의된 바와 같이, 어구 "향상된 단백질 생산성 표현형" 및 "증가된 단백질 생산성 표현형"은 상호교환적으로 사용될 수 있다.
본원에 사용된 바와 같이, 변형된 (변이체/딸)에 대하여 비변형된 (모) 세포에서 "향상된/증가된 단백질 생산성 표현형"을 기술할 때, "모" 세포 및 "변이체" 세포가 동일한 조건(예를 들어, 배지, 온도, pH 등과 같은 동일한 조건) 하에 성장/배양/발효되는 것으로 이해될 것이다. 유사하게, 변형된 (변이체/딸) 세포에서의 동일한 POI의 "발현/제조"에 대하여 비변형된 (모) 세포에서의 관심 단백질(POI)의 "발현/제조"를 기재할 때, "모" 세포 및 "변이체" 세포가 본질적으로 동일한 조건(예를 들어, 배지, 온도, pH 등과 같은 동일한 조건) 하에 성장/배양/발효된다고 이해될 것이다.
본원에 사용된 바와 같이, "호기성 발효"는 산소의 존재 하에서의 성장을 지칭한다.
본원에 사용된 바와 같이, 용어 "브로스", "세포 브로스", "발효 브로스" 및/또는 "배양 브로스"는 상호교환적으로 사용되고, 총체적으로 액체 (액침) 배양에서 (i) 발효 (배양) 배지 및 (ii) 세포를 지칭한다.
본원에 사용된 바와 같이, 용어 "세포량(cell mass)"은 액체(액침) 배양물에 존재하는 세포 성분(온전한 세포와 용해된 세포를 포함)을 지칭한다. 세포량은 건조 세포 중량(DCW) 또는 습윤 세포 중량 (WCW)으로 표현될 수 있다.
본원에 사용된 바와 같이, 사상성 진균 세포의 "점도 감소" 균주는 모 균주에 의해 생산된 동등한 세포 브로스와 비교하여 점도가 감소한(즉, 전단 스트레스 또는 인장 스트레스에 대한 저항이 감소한) 세포 브로스를 생성하는 변형된 (딸) 균주를 지칭한다. 예를 들어, 동등한 세포 브로스는 필적하는 세포량을 갖는다. 점도 감소 사상성 진균 균주를 작제하는 방법 및 이의 점도를 비교하는 방법은 국제 PCT 공보 WO2012/027580호, WO2012/145596호, WO2012/145596호 및 WO2012/145592호 및 국제 PCT 출원 PCT/US2019/27590호에 자세히 기재되어 있다(각각 구체적으로 본원에 그 전체가 참고로 포함됨).
따라서, 소정의 구현예에서, 본 발명의 변이체 균주(예를 들어, 향상된/증가된 단백질 생산성 표현형을 포함하는 대립유전자 lov(T813K)를 암호화하는 유전자 변형을 포함하는 변이체 균주)에서, 변이체 균주는 MPG1, SFB3, SEB1, CRZ1, GAS1, TPS2 및/또는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 추가로 포함한다.
본원에 사용된 바와 같이, 트리쵸데르마 종 "MPG1 단백질"은 (본원에 그 전체가 참고로 포함된 국제 PCT 공보 WO2012/145584호에 기재된) 서열 번호 5의 아미노산 서열을 포함한다.
본원에 사용된 바와 같이, 트리쵸데르마 종 "SEB1 단백질"은 (본원에 그 전체가 참고로 포함된 국제 PCT 공보 WO2012/145595호에 기재된) 서열 번호 6의 아미노산 서열을 포함한다.
본원에 사용된 바와 같이, 트리쵸데르마 종 "SFB3 단백질"은 (본원에 그 전체가 참고로 포함된 국제 PCT 공보 WO2012/027580호에 기재된) 서열 번호 7의 아미노산 서열을 포함한다.
본원에 사용된 바와 같이, 트리쵸데르마 종 "CRZ1 단백질"은 (본원에 그 전체가 참고로 포함된 국제 PCT 공보 WO2012/145596호에 기재된) 서열 번호 8의 아미노산 서열을 포함한다.
본원에 사용된 바와 같이, 트리쵸데르마 종 "GAS1 단백질"은 (본원에 그 전체가 참고로 포함된 국제 PCT 공보 WO2012/145596호 및 WO2012/145592호에 기재된) 서열 번호 9의 아미노산 서열을 포함한다.
본원에 사용된 바와 같이, 트리쵸데르마 종 "TSP2 단백질"은 (본원에 그 전체가 참고로 포함된 국제 PCT 공보 WO2012/145598호에 기재된) 서열 번호 10의 아미노산 서열을 포함한다.
본원에 사용된 바와 같이, 야생형 "ssb7 유전자"는 2019년 4월 16일에 출원된 국제 PCT 출원 PCT/US2019/27590호에 기재된 자연적 "SSB7 단백질"을 암호화한다. 예를 들어, 야생형 T. 레세이 "ssb7 유전자"(서열 번호 20)는 서열 번호 21의 자연적 "SSB7 단백질"을 암호화한다.
본원에 사용된 바와 같이, "대립유전자 ssb7(fs)"(서열 번호 22)는 국제 PCT 출원 PCT/US2019/27590호(본원에 그 전체가 참고로 구체적으로 포함됨)에 기재된 바와 같은 서열 번호 23의 변이체 SSB7 단백질을 암호화한다.
II. 향상된 단백질 생산성 표현형을 포함하는 사상성 진균 균주
일반적으로 상기 기재되고, 하기 실시예 부문에 추가로 기재된 것처럼, 본 발명의 소정의 구현예는 모 균주로부터 유래된 사상성 진균의 돌연변이체 및 유전자 변형된 (변이체) 균주에 관한 것이다. 보다 구체적으로는, 소정의 구현예는 사상성 진균의 돌연변이체 및 유전자 변형된 (변이체) 균주(및 이의 방법)에 관한 것이고, 여기서 이러한 균주는 향상된 단백질 생산성 표현형, 예컨대 개선된 부피측정 효율, 더 높은 비생산성, 탄소원에 대한 개선된 수율, 감소된 생물반응기(발효기) 작동 비용 및 기타를 포함한다.
보다 구체적으로는, 하기 실시예 1에 더 기재된 것처럼, 돌연변이체(딸) 트리초데르마 균주는 확인되고 단리되고 "B7ms1-SF12"라 명명되고, (돌연변이체) 균주는 이것이 유래된 모 균주(B7ms1)에 비해 발효기에서 공급 당에 대한 40% 더 높은 단백질 수율을 갖는다(예를 들어, 도 1 참조). 게놈 서열 분석 및 유전적 분석은 B7ms1-SF12 (돌연변이체) 균주의 관찰된 (증가된 생산성) 표현형의 원인인 것으로서 내부의 유전자(또는 유전자들)에서의 하나 이상의 돌연변이(들)를 확인하기 위해 돌연변이체 B7ms1-SF12 균주에서 후속적으로 수행되었다. 보다 구체적으로는, 확인된 돌연변이는 서열 번호 2의 (자연적) LOV 단백질의 암호화 서열을 변경하도록 결정되었고, 여기서 (자연적) LOV 단백질(서열 번호 2)의 아미노산 (잔기) 813번 위치에서의 고도로 보존된 트레오닌(T)(T813)은 서열 번호 4의 (변이체) LOV 단백질의 813번 위치에서의 리신(813K)으로 변형(치환)(즉, T813K 치환; 예를 들어, 도 2 참조)되었다.
과학 문헌 및 관련 분야의 검토는 LOV 단백질(서열 번호 2) 및/또는 관련된 LOV 단백질 오솔로그(예를 들어, 서열 번호 11-17)의 기능적 규명이 임의의 유기체에 대해 문헌에 기재되어 있지 않는다는 것을 나타낸다. 그러나, 일반적으로 본 발명의 실시예 1에 기재된 것처럼, 보존된 도메인 분석(NCBI)은 글리코실 전환효소 패밀리 그룹 2(pfam13632, 3.25x10-44의 E-값, 예를 들어, 도 2에서 "글리코 트랜스 2 3" 참조)와 멀리 관련된 (보존된) 영역을 확인하였다. 예를 들어, 원핵생물 단백질의 이 (글리코실 전환효소) 패밀리의 구성원은 박테리아 캡슐 생합성(PFAM)에 관여된 추정상 글루코실전환효소를 포함한다. 보다 구체적으로는, 트리초데르마 PID 79396에 대한 오솔로그(즉, LOV가 아님, PID 50212)인 (글리코실 전환효소) 패밀리 그룹 2 도메인, "ZtGT2"를 갖는 진균 단백질은 고체 표면에서의 균사 성장에 중요하다(King et al., 2017).
보다 놀랍게도, LOV 단백질은 담자균류(Basidiomycete) 및 자낭균류(Ascomycete) 문의 사상성 진균 중에 널리 보존된다. 예를 들어, (자연적) LOV 단백질의 813번 위치에서의 트레오닌(T)(즉, 리신(K)에 대한 돌연변이는 본원에 개시된 바와 같이 유리함)은 트리초데르마 및 가장 산업적으로 관련된 사상성 진균이 속하는 주발버섯 아문 내에 NCBI 비중복 데이터베이스의 상부 BLASTp 검색 결과 중에서 고도로 보존된다(691/691; 100%). 예를 들어, 이 691개의 주발버섯 동족체의 Geneious 다중 서열 정렬(www.geneious.com, Geneious 11.0, Biomatters Ltd.)로부터의 그래프 표시는 도 2에 제시된다. 마찬가지로, 상부 1,000 BLASTp 히트 중에서, 아미노산 잔기 813번 위치는 MUSCLE 다중 서열 정렬(Geneious 소프트웨어 패키지)에서 975/1000(97.5%) 히트(즉, 잔기 T813)에서 확인되었고, 여기서 잔기 813번 위치는 결코 리신(K)으로서 생기지 않는다(즉, 향상된 단백질 생산성을 생성시키는 본원에 기재된 치환은 BLASTp에 의해 확인된 상부 1000 오솔로그에서 발견되지 않았다).
따라서, lov(T813K) 대립유전자가 관찰된 향상된 단백질 생산성 표현형의 원인이라는 것을 추가로 검증하기 위해, lov(T813K) 돌연변이는 "T4"로 명명된 상이한 T. 레세이 균주 계통(예를 들어, 표 1 참조)으로 도입되고, 여기서 B7ms1 및 T4 모 계통은 둘 다 트리초데르마 균주 RL-P37의 상이한 균주 개선 프로그램으로부터 돌연변이된 유도체이다(Sheir-Neiss et al., 1984; Montenecourt, 1987). 예를 들어, T4 균주는 특히 T4 균주가 셀룰라아제의 이의 (내인성) 자연적 칵테일을 발현하고 총 단백질 생산을 증가시키는 nik1(M743T) 돌연변이를 포함한다는 점에서 B7ms1 균주와 다르다(예를 들어, 국제 PCT 공보. WO2016/130523호 참조). 마찬가지로, 실시예 1에 기재된 B7ms1 계통의 관찰된 결과와 유사하게, lov(T813K) 대립유전자를 포함하는 T4 계통(균주)(예를 들어, 실시예 2 및 실시예 4 참조)은 야생형 lov(+) 대립유전자를 포함하는 달리 동질유전자 균주에 비해 공급 당에 대한 평균적으로 34% 더 높은 총 단백질 수율을 갖는다.
부가적으로, 진균 균주 단백질 생산성 표현형의 개선에 대해 lov(T813K) 대립유전자의 이용성을 추가로 입증하기 위해, 출원인은 3개의 다른 편리한 게놈 위치(즉, 부위 A-C라 명명; 실시예 4, 표 1 및 표 2 또한 참조)에서 pyr2 마커를 통합하였다. 예를 들어, 이 상이한 균주에 의한 단백질 생산은 진탕 플라스크에서 평가되었고, 여기서 모든 이러한 경우에 lov(T813K) 돌연변이의 존재는 야생형 lov(+) 대립유전자를 포함하는 달리 동질유전자 (모) 균주에 비해 총 단백질 생산을 개선하였다.
III. 분자 생물학
일반적으로 상기 기재된 바대로, 본 발명의 소정의 구현예는 모 균주로부터 유래된 사상성 진균의 돌연변이체 및 유전자 변형된 (변이체) 균주에 관한 것이다. 보다 구체적으로는, 소정의 구현예는 사상성 진균의 돌연변이체 및 유전자 변형된 (변이체) 균주(및 이의 방법)에 관한 것이고, 여기서 이러한 균주는 향상된 단백질 생산성 표현형, 예컨대 개선된 부피측정 효율, 더 높은 비생산성, 탄소원에 대한 개선된 수율, 감소된 생물반응기(발효기) 작동 비용 및 기타를 포함한다.
따라서, 본 발명의 소정의 구현예는 모 트리초데르마 균주(예를 들어, 모 B7ms1)로부터 유래된 돌연변이체 (딸) 트리초데르마 균주(예를 들어, 돌연변이체 B7ms1-SF12)에 관한 것이고, 여기서 돌연변이체 (딸) 트리초데르마 균주는 서열 번호 4의 아미노산 잔기 813번 위치에 상응하는 아미노산 위치에서 리신(K) 잔기를 포함하는 변이체 LOV 단백질을 암호화하는 돌연변이체 lov 유전자를 포함한다.
본 발명의 소정의 다른 구현예는 따라서 본원에 기재된 모 균주로부터 유래된 사상성 진균의 유전자 변형된 균주(이하, "변이체" 균주)에 관한 것이다. 예를 들어, 소정의 구현예에서, 사상성 진균의 변이체 균주는 서열 번호 2에 상동성인 서열(즉, 자연적 LOV 단백질 서열)을 포함하는 변이체 LOV 단백질을 암호화하는 변형된 lov 유전자(또는 이의 변형된 폴리뉴클레오타이드 서열)를 포함하고, 서열 번호 4의 아미노산 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함한다.
따라서, 소정의 구현예에서, 본 발명의 변이체 균주는 서열 번호 2(또는 서열 번호 4)의 LOV 단백질과 적어도 약 50% 내지 약 100%의 서열 상동성을 포함하는 LOV 단백질을 암호화하고, 서열 번호 4의 아미노산 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 변형된 lov 유전자(또는 이의 변형된 폴리뉴클레오타이드 서열)를 포함한다. 소정의 구현예에서, 본 발명의 변이체 균주는 서열 번호 2(또는 서열 번호 4)의 LOV 단백질과 적어도 약 50% 내지 약 100%의 서열 상동성을 포함하는 LOV 단백질을 암호화하고, 서열 번호 4의 아미노산 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 변형된 lov 유전자(또는 이의 변형된 폴리뉴클레오타이드 서열)를 포함한다.
따라서, 다른 구현예에서, 본 발명의 변이체 균주는 서열 번호 2 또는 서열 번호 4와 적어도 50%의 서열 상동성 또는 동일성, 서열 번호 2 또는 서열 번호 4와 적어도 55%의 서열 상동성 또는 동일성, 서열 번호 2 또는 서열 번호 4와 적어도 60%의 서열 상동성 또는 동일성, 서열 번호 2 또는 서열 번호 4와 적어도 65%의 서열 상동성 또는 동일성, 서열 번호 2 또는 서열 번호 4와 적어도 70%의 서열 상동성 또는 동일성, 서열 번호 2 또는 서열 번호 4와 적어도 75%의 서열 상동성 또는 동일성, 서열 번호 2 또는 서열 번호 4와 적어도 80%의 서열 상동성 또는 동일성, 서열 번호 2 또는 서열 번호 4와 적어도 85%의 서열 상동성 또는 동일성, 서열 번호 2 또는 서열 번호 4와 적어도 90%의 서열 상동성 또는 동일성, 서열 번호 2 또는 서열 번호 4와 적어도 95%의 서열 상동성 또는 동일성, 또는 서열 번호 2 또는 서열 번호 4와 최대 및 약 100%의 서열 상동성 또는 동일성을 포함하는 LOV 단백질을 암호화하고, 서열 번호 4의 아미노산 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 변형된 lov 유전자(또는 이의 변형된 폴리뉴클레오타이드 서열)를 포함한다.
따라서, 소정의 구현예에서, 사상성 진균의 변이체 균주는 대립유전자 lov(T813K)를 균주로 도입하는 적어도 유전자 변형을 포함한다. 예를 들어, 소정의 구현예에서, 사상성 진균의 변이체 균주는 비제한적인 예로서 (a) 유전자(또는 ORF또는 폴리뉴클레오타이드)에서의 하나 이상의 뉴클레오티드의 도입, 치환, 또는 제거, 또는 유전자의 전사 또는 번역에 필요한 조절 요소에서의 하나 이상의 뉴클레오티드의 도입, 치환, 또는 제거, (b) 유전자 손상, (c) 유전자 전환, (d) 유전자 결실, (e) 유전자 하향조절, (f) 특이적 돌연변이화 및/또는 (g) 랜덤 돌연변이화를 포함하는 유전자 변형을 포함할 수 있다. 다른 구현예에서, 대립유전자 lov(T813K)를 포함하는 사상성 진균의 변이체 균주는 본원에 기재된 바와 같은 NIK1 단백질, SSB7 단백질, MPG1 단백질, SFB3 단백질, SEB1 단백질, CRZ1 단백질, TSP2 단백질 및/또는 GAS1 단백질을 암호화하는 유전자의 하나 이상의 유전자 변형을 추가로 포함한다.
따라서, 소정의 구현예에서, 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 주어진 유전자 산물(예를 들어, LOV(+), NIK1, SSB7, MPG1 SFB3, SEB1, CRZ1, TSP2, GAS1, 내인성(배경) 프로테아제, 셀룰라아제 및 기타)의 발현/생산을 제거하도록 유전자 결실에 의해 작제될 수 있다. 다른 구현예에서, 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 주어진 유전자 산물의 발현/생산을 제거(또는 감소)시키도록 부분 유전자 결실에 의해 작제될 수 있다. 예를 들어, 소정의 구현예에서, 변형된 사상성 진균 균주는 유전자의 부분 결실을 포함할 수 있고, 여기서 부분 결실은 유전자의 암호화 서열의 임의의 부분의 부분 결실을 포함한다. 예를 들어, 소정의 구현예에서, 이러한 변이체 균주는 암호화된 단백질을 발현/생산하지 않거나, 이러한 변이체 균주는 (모 균주에 비해) 감소된 양의 암호화된 단백질을 발현/생산하고, 여기서 "감소된" 양의 암호화된 단백질은 본원에 기재된 바와 같이 측정되고 검출되고 평가되고 기타 등등이 될 수 있다.
따라서, 일반적으로 실시예 부문에 제시되고 기재된 것처럼, 당업자는 하기 유전자 변형(및 이 부문에 기재된 이의 분자 생물학적 방법)을 수행할 수 있고, 본 발명의 하나 이상의 아미노산 서열(서열 번호 2, 4, 11-19) 및/또는 핵산 서열(서열 번호 1 및 2)을 참조하여 이러한 이의 (변이체) 사상성 진균 균주를 작제할 수 있다.
예를 들어, 유전자 결실 기법은 유전자의 부분 또는 완전 제거가 가능하게 하여, 단백질의 발현/생산을 제거 또는 감소시키고/시키거나, 암호화된 단백질의 발현/생산을 제거 또는 감소시킨다. 이러한 방법에서, 유전자의 결실은 유전자와 측접하는 5' 및 3' 영역을 인접하여 함유하도록 작제된 통합 플라스미드/벡터를 사용하여 상동성 재조합에 의해 달성될 수 있다. 인접한 5' 및 3' 영역은, 플라스미드가 세포에서 통합되게 하도록, 예를 들어 선별 마커와 공동으로 통합성 플라스미드/벡터 상의 사상성 진균 세포로 도입될 수 있다.
다른 구현예에서, 사상성 진균의 변이체 균주는 본 발명의 단백질을 암호화하는 유전자를 파괴하거나 탈활성화하는 유전자 변형을 포함한다. 예시적인 유전자 파괴/불활성화 방법은 폴리펩타이드 암호화 서열(CDS), 프로모터, 인핸서 또는 다른 조절 요소를 포함하는 유전자의 임의의 부분을 파괴하는 것을 포함하는데, 파괴는 치환, 삽입, 결실, 역위, 및 이들의 조합 및 이들의 변형을 포함한다. 따라서, 소정의 구현예에서, 사상성 진균의 변이체 균주는 유전자 파괴 기법에 의해 작제된다. 유전자 파괴 기법의 비제한적인 예는 유전자에 상동성인 핵산 단편을 함유하는 통합성 플라스미드를 본 발명의 하나 이상의 유전자로 삽입(통합)하는 것을 포함하고, 이는 상동성 영역의 중복을 생성하고 중복된 영역들 간에 (인서트) 벡터 DNA를 혼입할 것이다.
따라서, 특정 다른 비제한적인 예에서, 유전자 파괴 기법은 유전자에 상동성인 핵산 단편을 함유하는 통합성 플라스미드를 유전자로 삽입하는 것을 포함하고, 이는 상동성 영역의 중복을 생성하고 중복된 영역들 간에 (인서트) 벡터 DNA를 혼입할 것이고, 여기서 삽입된 벡터 DNA는 예를 들어 단백질 암호화 영역으로부터 유전자의 프로모터를 분리시키거나 유전자의 암호화 서열 또는 비암호화 서열을 중단(파괴)시킨다. 따라서, 파괴 작제물은 유전자에 상동성인 5' 및 3' 영역이 동반된 선별 마커 유전자(예를 들어, pyr2, 실시예 참조)일 수 있다. 선별 마커는 파괴된 유전자를 함유하는 형질전환체의 확인이 가능하게 한다. 따라서, 소정의 구현예에서, 유전자 파괴는 프로모터, 리보솜 결합 부위(RBS), 비번역 영역(UTR), 코돈 변화 등과 같은 유전자의 제어 요소의 변형을 포함한다.
다른 구현예에서, 사상성 진균의 변이체 균주는 유전자 또는 이의 전사 또는 번역에 필요한 조절 요소에서의 하나 이상의 뉴클레오타이드를 도입하거나 치환하거나 제거함으로써 작제된다(즉, 유전자 변형된다). 예를 들어, 뉴클레오타이드는 정지 코돈이 도입되거나, 시작 코돈이 제거되거나, 오픈 리딩 프레임(ORF)이 프레임 시프트되도록 삽입되거나 제거될 수 있다. 이러한 변형은 당업계에 알려진 방법에 따라 부위 지정 돌연변이유발 또는 PCR에 의해 생성된 돌연변이유발에 의해 달성될 수 있다(예를 들어, Botstein 및 Shortle의 1985 문헌; Lo 등의 1985 문헌; Higuchi 등의 1988 문헌; Shimada의 1996 문헌; Ho 등의 1989 문헌; Horton 등의 1989 문헌 및 Sarkar 및 Sommer의 1990 문헌 참조). 마찬가지로, 본원에 기재된 T813K 치환을 포함하는 대립유전자 lov(T813K)는 대립유전자 lov의 813번 위치 리신을 암호화하는 뉴클레오타이드에 대한 야생형 lov(+) 유전자의 813번 위치 트레오닌을 암호화하는 뉴클레오타이드를 치환(T813K)하여 작제될 수 있다.
다른 실시형태에서, 사상성 진균의 변이체 균주는 유전자 변환의 과정에 의해 작제된다(즉, 유전자 변형된다)(예를 들어, Iglesias 및 Trautner의 1983 문헌 참조). 예를 들어, 유전자 변환 방법에서, 표적 유전자에 대응하는 핵산 서열은 결함 핵산 서열을 생산하도록 시험관내 돌연변이되고, 이후 결함 유전자를 포함하는 변이체 세포를 생산하기 위해 모 세포로 형질전환된다. 상동성 재조합에 의해, 결함 핵산 서열은 내인성 유전자를 대체한다. 결함 유전자 또는 유전자 단편이 결함 유전자를 함유하는 형질전환체의 선택에 사용될 수 있는 마커도 암호화하는 것이 바람직할 수 있다. 예를 들어, 결함 유전자는 선별 마커와 연관되어 비복제 또는 온도 감수성 플라스미드 상에 도입될 수 있다. 플라스미드의 통합에 대한 선택은 플라스미드 복제를 허용하지 않는 조건 하에 마커에 대한 선택에 의해 실행된다. 유전자 대체로 이어지는 제2 재조합 사건에 대한 선택은 선별 마커의 손실 및 돌연변이된 유전자의 획득에 대한 콜로니 검사에 의해 실행된다(Perego의 1993 문헌).
다른 구현예에서, 사상성 진균의 변이체 균주는 유전자의 핵산 서열에 상보성인 뉴클레오티드 서열을 사용하는 확립된 안티센스 (유전자 침묵) 기법에 의해 작제된다(Parish 및 Stoker의 1997 문헌). 보다 구체적으로는, 사상성 진균 균주에 의한 유전자의 발현은 세포에서 전사되고 세포에서 생산된 mRNA에 혼성화할 수 있는 유전자의 핵산 서열에 상보성인 뉴클레오타이드 서열을 도입함으로써 감소(하향조절)되거나 제거될 수 있다. 따라서, 상보성 안티센스 뉴클레오타이드 서열이 mRNA에 혼성화되게 하는 조건 하에 번역된 단백질의 양은 감소되거나 제거된다. 이러한 안티센스 방법은 RNA 간섭(RNAi), 소간섭 RNA(siRNA), 마이크로RNA(miRNA), 안티센스 올리고뉴클레오타이드 등을 포함하지만, 이들로 제한되지는 않으며, 이들 모두는 당업자에게 잘 알려져 있다.
다른 구현예에서, 사상성 진균의 변이체 균주는 비제한적인 예로서 화학 돌연변이유발(예를 들어, Hopwood의 1970 문헌 참조) 및 전좌(예를 들어, Youngman 등의 1983 문헌 참조)를 포함하는 당해 분야에 잘 알려진 방법을 사용하여 랜덤 또는 특이적 돌연변이유발에 의해 작제된다(즉, 유전자 변형된다). 유전자 변형은, 모 세포에서 돌연변이를 유발시키고 유전자의 발현이 감소되거나 제거된 돌연변이체 세포를 스크리닝함으로써 수행될 수 있다. 예를 들어, 당업자는 점도 감소 표현형을 포함하는 사상성 진균 세포의 이러한 (돌연변이유도된) 변이체 균주를 확인하기 위해 본원과 실시예 부문에 기재된 스크리닝 방법을 용이하게 적응하고/하거나 변형시킬 수 있다.
특이적 또는 무작위적일 수 있는 돌연변이유발은 예를 들어 적합한 물리적 또는 화학적 돌연변이 유발제를 사용하거나, 적합한 올리고뉴클레오타이드를 사용하거나, DNA 서열이 PCR 생성된 돌연변이유발되게 함으로써 수행될 수 있다. 더욱이, 돌연변이유발은 이들 돌연변이유발 방법의 임의의 조합을 사용함으로써 수행될 수 있다. 본 목적에 적합한 물리적 또는 화학적 돌연변이 유발제의 예는 자외선(UV) 조사, 하이드록실아민, N-메틸-N'-니트로-N-니트로소구아니딘(MNNG), N-메틸-N'-니트로소구아니딘(NTG), O-메틸 히드록실아민, 아질산, 에틸 메탄 설포네이트(EMS), 아황산수소나트륨, 포름산 및 뉴클레오타이드 유사체를 포함한다. 이러한 유발제가 사용될 때, 돌연변이유발은 일반적으로 적절한 조건 하에 선택된 돌연변이 유발제의 존재 하에 돌연변이유발되는 모 세포를 배양하고, 유전자 발현 감소를 나타내거나 유전자를 발현하지 않는 돌연변이체 세포를 선택함으로써 수행된다.
예를 들어, 본원에 개시된 하나 이상의 유전자에서의 이러한 유전자 변형은 유전자의 프로모터의 효율을 감소시키거나, 인핸서의 효율을 감소시키거나, 유전자의 mRNA의 스플라이싱 또는 편집을 방해하거나, 유전자의 mRNA의 번역을 방해하거나, 전장 단백질의 번역을 방지하도록 유전자의 암호화 서열로 종결 코돈을 도입하거나, 덜 활성이거나 불활성인 단백질을 생산하도록 단백질의 암호화 서열을 변경하거나, 다른 핵 단백질 성분과의 단백질 상호작용을 감소시키거나, 덜 안정한 단백질을 생산하도록 단백질의 암호화 서열을 변경하거나, 파괴를 위해 단백질을 표적화하거나, 단백질이 (예를 들어, 글리코실화에 의해) 미스폴딩되거나 부정확하게 변형되게 하거나, 단백질의 세포 이동을 방해할 수 있다.
소정의 다른 구현예에서, 사상성 진균의 변이체 균주는 부위 특이적 유전자 편집 기법에 의해 작제된다(즉, 유전자 변형된다). 예를 들어, 소정의 구현예에서, 사상성 진균의 변이체 균주는 전사 활성자 유사 엔도뉴클레아제(TALEN), 징크 핑거 엔도뉴클레아제(ZFN), 호밍(mega) 엔도뉴클레아제 등을 사용하여 작제된다(즉, 유전자 변형된다). 보다 구체적으로는, 변형되는 유전자의 부분(예를 들어, 암호화 영역, 비암호화 영역, 리더 서열, 프로-펩타이드 서열, 신호 서열, 전사 종결자, 전사 활성자 또는 암호화 영역의 발현에 필요한 다른 조절 요소)은 ZFN 유전자 편집, TALEN 유전자 편집, 호밍(mega) 엔도뉴클레아제 등에 의해 유전자 변형되고, 변형 방법은 당업자에게 잘 알려져 있고 이용 가능하다.
따라서, 소정의 구현예에서, 사상성 진균의 변이체 균주는 CRISPR/Cas9 편집에 의해 작제된다(즉, 유전자 변형된다). 보다 구체적으로는, CRISPR/Cas9 시스템에 의한 진균 게놈 변형에 대한 조성물 및 방법이 기재되어 있고 당해 분야에 잘 알려져 있다(예를 들어, 국제 PCT 공보 WO2016/100571호, WO2016/100568호, WO2016/100272호, WO2016/100562호 등 참조). 예를 들어, 천연 LOV 단백질을 암호화하는 유전자는 엔도뉴클레아제를 DNA 상의 표적 서열로 동원하는 가이드 RNA(예를 들어, Cas9) 또는 가이드 DNA(예를 들어, NgAgo)에 결합함으로써, 표적 DNA를 찾는, 핵산 가이드된 엔도뉴클레아제에 의해 유전자 변형될 수 있고, 여기서 엔도뉴클레아제는 DNA에서 단일쇄 또는 이중쇄 절단을 생성할 수 있다. 이러한 표적화된 DNA 절단은 DNA 복구를 위한 기질이 되고, 유전자를 파괴하거나 결실시키도록 제공된 편집 주형과 재조합된다. 예를 들어, 핵산 가이드된 엔도뉴클레아제를 암호화하는 유전자(예를 들어, S. 피오게네스 유래의 Cas9 또는 Cas9 뉴클레아제를 암호화하는 코돈 최적화된 유전자)는 사상성 진균 세포에서 활성인 프로모터 및 사상성 진균 세포에서 활성인 종결자에 작동 가능하게 연결되어 사상성 진균 Cas9 발현 카세트를 생성한다. 마찬가지로, 관심 유전자에 대해 고유한 하나 이상의 표적 부위가 당업자에 의해 쉽게 확인된다.
예를 들어, 관심 유전자 내의 표적 부위로 지시된 gRNA를 암호화하는 DNA 작제물을 작제하기 위해, 가변 표적화(VT) 도메인은 (PAM) 프로토-스페이서 인접 모티프(TGG)의 5'인 표적 부위의 뉴클레오타이드를 포함할 것이며, 이 뉴클레오타이드는 S. 피오게네스 Cas9에 대한 Cas9 엔도뉴클레아제 인식 도메인(CER)을 암호화하는 DNA에 융합된다. VT 도메인을 암호화하는 DNA와 CER 도메인을 암호화하는 DNA의 조합에 의해 gRNA를 암호화하는 DNA가 생성된다. 따라서, gRNA를 암호화하는 DNA를 사상성 진균 세포에서 활성인 프로모터 및 사상성 진균 세포에서 활성인 종결자에 작동 가능하게 연결함으로써 gRNA에 대한 사상성 진균 발현 카세트가 생성된다.
소정의 구현예에서, 엔도뉴클레아제에 의해 유도된 DNA 절단은 유입 서열로 복구/대체된다. 예를 들어, 상기 기재된 Cas9 발현 카세트 및 gRNA 발현 카세트에 의해 생성된 DNA 절단을 정밀하게 복구하기 위해, 뉴클레오타이드 편집 주형이 제공되어서 세포의 DNA 복구 기작은 편집 주형을 이용할 수 있다. 예를 들어, 표적화된 유전자의 5'인 약 500 bp가 표적화된 유전자의 3'인 약 500 bp에 융합되어 편집 주형을 생성할 수 있고, 이 주형은 사상성 진균 숙주의 기작에 의해 사용되어 RGEN(RNA-가이드된 엔도뉴클레아제)에 의해 생성된 DNA 절단을 복구한다.
Cas9 발현 카세트, gRNA 발현 카세트 및 편집 주형은 많은 상이한 방법(예를 들어, 원형질체 융합, 전기천공, 자연 유능성 또는 유도 유능성)을 사용하여 사상 진균 세포에 동시전달될 수 있다. 형질전환된 세포는 PCR에 의해, 정방향 프라이머 및 역방향 프라이머로 표적 유전자위를 증폭시킴으로써 스크리닝된다. 이러한 프라이머는 야생형 좌위 또는 RGEN에 의해 편집된 변형된 좌위를 증폭시킬 수 있다. 이후 시퀀싱 프라이머를 사용하여 이들 단편을 시퀀싱하여 편집된 콜로니를 확인한다.
IV. 관심 단백질
상기 부분에 간단히 기재된 것처럼, 본 발명의 균주 및 방법은 사상성 진균의 액침 배양에서 상업적으로 중요한 단백질의 생산에 이용된다. 본 발명의 관심 단백질(POI)은 임의의 내인성 또는 이종성 단백질일 수 있으며, 이는 이러한 POI의 변이체일 수 있다. 단백질은 하나 이상의 디설파이드 브리지를 함유할 수 있거나, 기능적 형태가 단량체 또는 다량체인 단백질이고, 즉 단백질은 4차 구조를 가지며, 복수의 동일한(상동성) 아단위 또는 비동일한(이종성) 아단위로 이루어지며, 여기서 POI 또는 이의 변이체 POI는 바람직하게는 관심 특성을 갖는 것이다.
소정의 구현예에서, 사상성 진균의 변이체 균주는 (비변형된) 모 균주에 비해 증가된 단백질 역가를 나타내고, 여기서 단백질 역가는 부피당 단백질의 양(g/ℓ)으로 정의된다. 예를 들어, 역가는 당해 분야에 공지된 방법(예를 들어, ELISA, HPLC, Bradford 검정, LC/MS 및 기타)에 의해 측정될 수 있다. 따라서, 소정의 구현예에서, 사상성 진균의 변이체 균주는 비변형된 (모) 세포와 비교하여 적어도 약 0.1%, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 단백질 역가 증가를 포함한다.
소정의 구현예에서, 사상성 진균의 변이체 균주는 (비변형된) 모 균주에 비해 증가된 부피측정 생산성을 나타내고, 여기서 부피측정 생산성은 총 발효 시간(h)에 따른 생물반응기의 공칭 부피(ℓ)에 따른 발효 동안 생산된 단백질의 양(g)으로 정의된다. 예를 들어, 부피측정 생산성은 당해 분야에 공지된 방법(예를 들어, ELISA, HPLC, Bradford 검정, LC/MS 및 기타)에 의해 측정될 수 있다. 따라서, 소정의 구현예에서, 사상성 진균의 변이체 균주는 비변형된 (모) 세포와 비교하여 적어도 약 0.1%, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 부피측정 생산성 증가를 포함한다.
소정의 다른 구현예에서, 사상성 진균의 변이체 균주는 증가된 총 단백질 수율을 나타내고, 여기서 총 단백질 수율은 (비변형된) 모 균주에 비해 공급된 탄수화물의 그램당 생산된 단백질(g)의 양으로 정의된다. 따라서, 본원에 사용된 바와 같이, 총 단백질 수율(g/g)은 하기 식을 이용하여 계산될 수 있다:
Yf = Tp/Tc
여기서, "Yf"는 총 단백질 수율(g/g)이고, "Tp"는 발효 동안 생산된 총 단백질(g)이고, "Tc"는 발효 (생물반응기) 실행 동안 공급된 총 탄수화물(g)이다. 소정의 구현예에서, 변형된 균주의 총 단백질 수율의 증가(즉, 모 균주에 비해)는 비변형된 (모) 세포와 비교하여 적어도 약 0.1 %, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 증가이다.
총 단백질 수율은 예를 들어 총 단백질에 도입된 공급된 탄소의 백분율(%)에서처럼 탄소 전환 효율/탄소 수율로 또한 기재될 수 있다. 따라서, 소정의 구현예에서, 사상성 진균의 변이체 균주는 (비변형된) 모 균주에 비해 증가된 탄소 전환 효율(예를 들어, 총 단백질로 도입된 공급된 탄소의 백분율(%)의 증가)을 포함한다. 소정의 구현예에서, 변형된 균주의 탄소 전환 효율의 증가(즉, 모 균주에 비해)는 비변형된 (모) 세포와 비교하여 적어도 약 0.1 %, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 증가이다.
소정의 구현예에서, 사상성 진균의 변이체 균주는 (비변형된) 모 균주에 비해 POI의 증가된 비생산성(Qp)을 나타낸다. 예를 들어, 비생산성(Qp)의 검출은 단백질 생산의 속도를 평가하는 데 적합한 방법이다. 비생산성(Qp)은 다음 식을 사용하여 결정될 수 있다:
여기서, "gP"는 탱크에서 생산된 단백질의 그램이고, "gDCW"는 탱크 내 건조 세포 중량(DCW)의 그램이고, "hr"은 접종 시점으로부터의 발효 시간 (h)이고, 이는 생산 시간 및 성장 시간을 포함한다. 따라서, 소정의 구현예에서, 사상성 진균의 변이체 균주는 비변형된 (모) 세포와 비교하여 적어도 약 0.1%, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 비생산성(Qp) 증가를 포함한다.
소정의 구현예에서, POI 또는 이의 변이체 POI는 아세틸 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 탄산무수화효소, 카복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 리아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코스 산화효소, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 글리코실 가수분해효소, 헤미셀룰라아제, 헥소스 산화효소, 가수분해효소, 인버타아제, 아이소머라아제, 락카아제, 리가아제(ligase), 리파아제, 리아제, 만나나아제, 만노시다아제, 산화효소, 산화환원효소, 펙테이트 리아제, 펙틴 아세틸 에스테라아제, 펙틴 해중합효소, 펙틴 메틸 에스테라아제, 펙틴분해 효소, 퍼하이드롤라아제, 폴리올 산화효소, 과산화효소, 페놀산화효소, 피타아제, 폴리갈락투로나아제, 프로테아제, 펩티다아제, 람노-갈락투로나아제, 리보뉴클레아제, 전환효소, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소스 산화효소, 및 이들의 조합으로 이루어진 군으로부터 선택된다.
소정의 구현예에서, POI 또는 변이체 POI는 EC 1, EC 2, EC 3, EC 4, EC 5 또는 EC 6으로 이루어진 군으로부터 선택된 효소 위원회(EC: Enzyme Commission) 번호로부터 선택된다.
예를 들어, 소정의 구현예에서, POI는 비제한적인 예로서 EC 1.10.3.2(예를 들어, 락카아제), EC 1.10.3.3(예를 들어, L-아스코르브산 옥시다아제), EC 1.1.1.1(예를 들어, 알코올 탈수소효소), EC 1.11.1.10(예를 들어, 염화물 퍼옥시다아제), EC 1.11.1.17(예를 들어, 퍼옥시다아제), EC 1.1.1.27(예를 들어, L-락테이트 탈수소효소), EC 1.1.1.47(예를 들어, 글루코스 1-탈수소효소), EC 1.1.3.X(예를 들어, 글루코스 옥시다아제), EC 1.1.3.10(예를 들어, 피라노스 옥시다아제), EC 1.13.11.X(예를 들어, 디옥시게나아제), EC 1.13.11.12(예를 들어, 리네올레이트 13S-리폭시게나아제), EC 1.1.3.13(예를 들어, 알코올 옥시다아제), EC 1.14.14.1(예를 들어, 모노옥시게나아제), EC 1.14.18.1(예를 들어, 모노페놀 모노옥시게나아제), EC 1.15.1.1(예를 들어, 수퍼옥사이드 디스무타아제), EC 1.1.5.9(이전 EC 1.1.99.10, 예를 들어, 글루코스 탈수소효소), EC 1.1.99.18(예를 들어, 셀로비오스 탈수소효소), EC 1.1.99.29(예를 들어, 피라노스 탈수소효소), EC 1.2.1.X(예를 들어, 지방산 리덕타아제), EC 1.2.1.10(예를 들어, 아세트알데하이드 탈수소효소), EC 1.5.3.X(예를 들어, 프룩토실 아민 리덕타아제), EC 1.8.1.X(예를 들어, 이황화물 리덕타아제) 및 EC 1.8.3.2(예를 들어, 티올 옥시다아제)로부터 선택된 EC 1(옥시도리덕타아제) 효소를 포함하는 옥시도리덕타아제 효소이다.
소정의 구현예에서, POI는 비제한적인 예로서 EC 2.3.2.13(예를 들어, 트랜스글루타미나아제), EC 2.4.1.X(예를 들어, 헥소실트랜스퍼라아제), EC 2.4.1.40(예를 들어, 알터나수크라아제), EC 2.4.1.18(예를 들어, 1,4 알파-글루칸 분지화 효소), EC 2.4.1.19(예를 들어, 사이클로말토덱스트린 글루카노트랜스퍼라아제), EC 2.4.1.2(예를 들어, 덱스트린 덱스트라나아제), EC 2.4.1.20(예를 들어, 셀로비오스 포스포릴라아제), EC 2.4.1.25(예를 들어, 4-알파-글루카노트랜스퍼라아제), EC 2.4.1.333(예를 들어, 1,2-베티-올리고글루칸 포스포르 트랜스퍼라아제), EC 2.4.1.4(예를 들어, 아밀로수크라아제), EC 2.4.1.5(예를 들어, 덱스트란수크라아제), EC 2.4.1.69(예를 들어, 갈락토시드 2-알파-L-푸코실 트랜스퍼라아제), EC 2.4.1.9(예를 들어, 이눌로수크라아제), EC 2.7.1.17(예를 들어, 자일룰로키나제), EC 2.7.7.89(이전에 EC 3.1.4.15, 예를 들어, [글루타민 합성효소]-아데닐-L-티로신 포스포릴라아제), EC 2.7.9.4(예를 들어, 알파 글루칸 키나제) 및 EC 2.7.9.5(예를 들어, 포스포글루칸 키나제)로부터 선택된 EC 2(트랜스퍼라아제) 효소를 포함하는 트랜스퍼라아제 효소이다.
다른 구현예에서, POI는 비제한적인 예로서 EC 3.1.X.X(예를 들어, 에스테라아제), EC 3.1.1.1(예를 들어, 펙티나아제), EC 3.1.1.14(예를 들어, 클로로필라제), EC 3.1.1.20(예를 들어, 타나아제), EC 3.1.1.23(예를 들어, 글리세롤-에스테르 아실하이드롤라아제), EC 3.1.1.26(예를 들어, 갈락토리파아제), EC 3.1.1.32(예를 들어, 포스포리파아제 A1), EC 3.1.1.4(예를 들어, 포스포리파아제 A2), EC 3.1.1.6(예를 들어, 아세틸에스테라아제), EC 3.1.1.72(예를 들어, 아세틸자일란 에스테라아제), EC 3.1.1.73(예를 들어, 페룰로일 에스테라아제), EC 3.1.1.74(예를 들어, 큐티나아제), EC 3.1.1.86(예를 들어, 람노갈락투로난 아세틸에스테라아제), EC 3.1.1.87(예를 들어, 푸모신 B1 에스테라아제), EC 3.1.26.5(예를 들어, 리보뉴클레아제 P), EC 3.1.3.X(예를 들어, 포스포릭 모노에스테르 하이드롤라아제), EC 3.1.30.1(예를 들어, 아스페르길루스 뉴클레아제 S1), EC 3.1.30.2(예를 들어, 세라티아 마르세센스 뉴클레아제), EC 3.1.3.1(예를 들어, 알칼라인 포스파타제), EC 3.1.3.2(예를 들어, 산 포스파타제), EC 3.1.3.8(예를 들어, 3-피타아제), EC 3.1.4.1(예를 들어, 포스포디에스테라아제 I), EC 3.1.4.11(예를 들어, 포스포이노시티드 포스포리파아제 C), EC 3.1.4.3(예를 들어, 포스포리파아제 C), EC 3.1.4.4(예를 들어, 포스포리파아제 D), EC 3.1.6.1(예를 들어, 아릴설파타제), EC 3.1.8.2(예를 들어, 디이소프로필-플루오로포스파타제), EC 3.2.1.10(예를 들어, 올리고-1,6-글루코시다아제), EC 3.2.1.101(예를 들어, 만난 엔도-1,6-알파-만노시다아제), EC 3.2.1.11(예를 들어, 알파-1,6-글루칸-6-글루카노하이드롤라아제), EC 3.2.1.131(예를 들어, 자일란 알파-1,2-글루쿠로노시다아제), EC 3.2.1.132(예를 들어, 키토산 N-아세틸글루코스아미노하이드롤라아제), EC 3.2.1.139(예를 들어, 알파-글루쿠로니다아제), EC 3.2.1.14(예를 들어, 키티나아제), EC 3.2.1.151(예를 들어, 자일로글루칸-특이적 엔도-베타-1,4-글루카나아제), EC 3.2.1.155(예를 들어, 자일로글루칸-특이적 엑소-베타-1,4-글루카나아제), EC 3.2.1.164(예를 들어, 갈락탄 엔도-1,6-베타-갈락토시다아제), EC 3.2.1.17(예를 들어, 라이소자임), EC 3.2.1.171(예를 들어, 람노갈락투로난 하이드롤라아제), EC 3.2.1.174(예를 들어, 람노갈락투로난 람노하이드롤라아제), EC 3.2.1.2(예를 들어, 베타-아밀라아제), EC 3.2.1.20(예를 들어, 알파-글루코시다아제), EC 3.2.1.22(예를 들어, 알파-갈락토시다아제), EC 3.2.1.25(예를 들어, 베타-만노시다아제), EC 3.2.1.26(예를 들어, 베타-프럭토푸라노시다아제), EC 3.2.1.37(예를 들어, 자일란 1,4-베타-자일로시다아제), EC 3.2.1.39(예를 들어, 글루칸 엔도-1,3-베타-D-글루코시다아제), EC 3.2.1.40(예를 들어, 알파-L-람노시다아제), EC 3.2.1.51(예를 들어, 알파-L-푸코시다아제), EC 3.2.1.52(예를 들어, 베타-N-아세틸헥소스아미니다아제), EC 3.2.1.55(예를 들어, 알파-N-아라비노푸라노시다아제), EC 3.2.1.58(예를 들어, 글루칸 1,3-베타-글루코시다아제), EC 3.2.1.59(예를 들어, 글루칸 엔도-1,3-알파-글루코시다아제), EC 3.2.1.67(예를 들어, 갈락투란 1,4-알파-갈락투로니다제), EC 3.2.1.68(예를 들어, 이소아밀라아제), EC 3.2.1.7(예를 들어, 1-베타-D-프럭탄 프럭타노하이드롤라아제), EC 3.2.1.74(예를 들어, 글루칸 1,4-β-글루코시다아제), EC 3.2.1.75(예를 들어, 글루칸 엔도-1,6-베타-글루코시다아제), EC 3.2.1.77(예를 들어, 만난 1,2-(1,3)-알파-만노시다아제), EC 3.2.1.80(예를 들어, 프럭탄 베타-프럭토시다아제), EC 3.2.1.82(예를 들어, 엑소-폴리-알파-갈락투로노시다아제), EC 3.2.1.83(예를 들어, 카파-카라기나아제), EC 3.2.1.89(예를 들어, 아라비노갈락탄 엔도-1,4-베타-갈락토시다아제), EC 3.2.1.91(예를 들어, 셀룰로스 1,4-베타-셀로비오시다아제), EC 3.2.1.96(예를 들어, 만노실-당단백질 엔도-베타-N-아세틸글루코스아미니다아제), EC 3.2.1.99(예를 들어, 아라비난 엔도-1,5-알파-L-아라비나아제), EC 3.4.X.X(예를 들어, 펩티다아제), EC 3.4.11.X(예를 들어, 아미노펩티다아제), EC 3.4.11.1(예를 들어, 류실 아미노펩티다아제), EC 3.4.11.18(예를 들어, 메티오닐 아미노펩티다아제), EC 3.4.13.9(예를 들어, Xaa-Pro 디펩티다아제), EC 3.4.14.5(예를 들어, 디펩티딜-펩티다아제 IV), EC 3.4.16.X(예를 들어, 세린-유형 카복시펩티다아제), EC 3.4.16.5(예를 들어, 카복시펩티다아제 C), EC 3.4.19.3(예를 들어, 피로글루타밀-펩티다아제 I), EC 3.4.21.X(예를 들어, 세린 엔도펩티다아제), EC 3.4.21.1(예를 들어, 키모트립신), EC 3.4.21.19(예를 들어, 글루타밀 엔도펩티다아제), EC 3.4.21.26(예를 들어, 프롤릴 올리고펩티다아제), EC 3.4.21.4(예를 들어, 트립신), EC 3.4.21.5(예를 들어, 트롬빈), EC 3.4.21.63(예를 들어, 오리진), EC 3.4.21.65(예를 들어, 써모마이콜린), EC 3.4.21.80(예를 들어, 스트렙토그리신 A), EC 3.4.22.X(예를 들어, 시스테인 엔도펩티다아제), EC 3.4.22.14(예를 들어, 악티니딘), EC 3.4.22.2(예를 들어, 파파인), EC 3.4.22.3(예를 들어, 피카인), EC 3.4.22.32(예를 들어, 줄기 브로멜라인), EC 3.4.22.33(예를 들어, 과일 브로멜라인), EC 3.4.22.6(예를 들어, 키모파파인), EC 3.4.23.1(예를 들어, 펩신 A), EC 3.4.23.2(예를 들어, 펩신 B), EC 3.4.23.22(예를 들어, 엔도티아펩신), EC 3.4.23.23(예를 들어, 무코르펩신), EC 3.4.23.3(예를 들어, 가스트릭신), EC 3.4.24.X(예를 들어, 메탈로엔도펩티다아제), EC 3.4.24.39(예를 들어, 듀테로라이신), EC 3.4.24.40(예를 들어, 세랄라이신), EC 3.5.1.1(예를 들어, 아스파라기나아제), EC 3.5.1.11(예를 들어, 페니실린 아미다아제), EC 3.5.1.14(예를 들어, N-아실-지방족-L-아미노산 아미도하이드롤라아제), EC 3.5.1.2(예를 들어, L-글루타민 아미도하이드롤라아제), EC 3.5.1.28(예를 들어, N-아세틸무라모일-L-알라닌 아미다아제), EC 3.5.1.4(예를 들어, 아미다아제), EC 3.5.1.44(예를 들어, 단백질-L-글루타민 아미도하이드롤라아제), EC 3.5.1.5(예를 들어, 우레아제), EC 3.5.1.52(예를 들어, 펩타이드-N(4)-(N-아세틸-베타-글루코스아미닐)아스파라긴 아미다아제), EC 3.5.1.81(예를 들어, N-아실-D-아미노산 데아실라제), EC 3.5.4.6(예를 들어, AMP 탈아미노효소) 및 EC 3.5.5.1(예를 들어, 니트릴라아제)로부터 선택된 EC 3(가수분해효소) 효소를 포함하는 가수분해효소 효소이다.
다른 구현예에서, POI는 비제한적인 예로서 EC 4.1.2.10(예를 들어, 만델로니트릴 리아제), EC 4.1.3.3(예를 들어, N-아세틸뉴라미네이트 리아제), EC 4.2.1.1(예를 들어, 탄산탈수효소), EC 4.2.2.-(예를 들어, 람노갈락투로난 리아제), EC 4.2.2.10(예를 들어, 펙틴 리아제), EC 4.2.2.22(예를 들어, 펙테이트 트리사카라이드-리아제), EC 4.2.2.23(예를 들어, 람노갈락투로난 엔도리아제) 및 EC 4.2.2.3(예를 들어, 만누로네이트-특이적 알기네이트 리아제)로부터 선택된 EC 4(리아제) 효소를 포함하는 리아제 효소이다.
소정의 다른 구현예에서, POI는 비제한적인 예로서 EC 5.1.3.3(예를 들어, 알도오스 1-에피머라아제), EC 5.1.3.30(예를 들어, D-사이코스 3-에피머라아제), EC 5.4.99.11(예를 들어, 이소말툴로스 합상효소) 및 EC 5.4.99.15(예를 들어, (1→4)-α-D-글루칸 1-α-D-글루코실무타아제)로부터 선택된 EC 5(아이소머라아제) 효소를 포함하는 아이소머라아제 효소이다.
또 다른 구현예에서, POI는 비제한적인 예로서 EC 6.2.1.12(예를 들어, 4-쿠마레이트:조효소 A 리가아제) 및 EC 6.3.2.28(예를 들어, L-아미노산 알파-리가아제)로부터 선택된 EC 6(리가아제) 효소를 포함하는 리가아제 효소이다.
본 발명의 균주 및 방법의 이들 및 다른 양태 및 구현예는 본 설명 및 하기 실시예를 고려하여 당업자에게 명확할 것이다.
실시예
본 발명의 소정의 양태는 다음의 실시예를 고려하여 추가로 이해될 수 있는데, 이는 제한하는 것으로 해석되어서는 안된다. 재료 및 방법에 대한 변형은 당업자에게 명백할 것이다.
실시예 1
사상성 진균에서의 단백질 생산 증가의 원인인 것으로서
lov
유전자의 확인
A. 개요
본 실시예에서, 글루코아밀라아제(GA) 작제물을 발현하는 "B7ms1"이라 명명된 점도 감소 트리초데르마 균주는 진탕 플라스크 조건 하에 펠릿에 대한 경향의 감소를 향해 특별히 진화되었다. 보다 구체적으로는, B7ms1의 돌연변이체(균주)는 확인되고 단리되고 "B7ms1-SF12"라 명명되었다. (돌연변이체) B7ms1-SF12 균주는 B7ms1 (모) 균주에 비해 발효기에서 공급 당에 대한 40% 더 높은 단백질 수율을 가졌다(예를 들어, 도 1 참조).
따라서, 본원에 기재된 것처럼, 게놈 서열 분석 및 유전적 분석은 B7ms1-SF12 (돌연변이체) 균주의 관찰된 (증가된 생산성) 표현형의 원인인 것으로서 내부의 유전자(또는 유전자들)에서의 하나 이상의 돌연변이(들)를 확인하기 위해 B7ms1-SF12 (돌연변이체) 균주에서 수행되었다. 본원에 개시된 것처럼, 확인된 돌연변이는 (자연적) LOV 단백질의 암호화 서열을 변경하도록 결정되었고, 여기서 (자연적) LOV 단백질(서열 번호 2)의 아미노산 (잔기) 813번 위치에서의 고도로 보존된 트레오닌(T)(T813)은 (변이체) LOV 단백질의 813번 위치에서의 리신(813K)으로 변경(치환)(서열 번호 4, 즉, T813K 치환)되었다(예를 들어, 도 2 참조).
B. 진화 전략
사상성 진균 종(예를 들어, 트리초데르마 종, 아스페르길루스 종, 푸사륨 종, 페니실리움 종, 크리소스포륨 종, 세팔로스포륨 종, 탈라로마이세스 종, 게오스미티아 종, 뉴로스포라 종, 마이셀리오프토라 종 및 기타)은 상업용/산업용 발효에 사용될 때 두꺼운 점성의 발효 브로스를 일반적으로 생산하는 호기성 진균이다. 높은 발효 (브로스) 점도는 전형적으로 용존 산소(DO) 이동을 감소시켜서 세포량의 양을 제한하고 이러한 호기성 사상성 진균 발효에서 달성될 수 있는 부피측정 생산성을 감소시킨다. 예를 들어, 점도 감소 사상성 진균 돌연변이체의 단리는 더 낮은 점도 발효 브로스를 생산하는 돌연변이체 균주/세포를 생성시키고, 여기서 이러한 점도 감소 균주/세포를 사용한 발효는 더 많은 세포량을 이용할 수 있어서 단백질 생산성을 증가시킨다(예를 들어, 출원인의 국제 PCT 공보 WO2012/145584호, WO2012/027580호, WO2012/145595호, WO2012/145596호 및 WO2012/145592호 참조). 보다 구체적으로는, 출원인이 추가의 이의 점도 감소 균주를 생성하기 위해 소정의 점도 감소 돌연변이를 조합하기 시작하면서, 이의 소정의 점도 (감소) 조합(즉, 돌연변이)이 진탕 플라스크 검정에서 균사 펠릿을 형성하는 더 높은 경향을 갖는 것으로 보였다는 것이 놀랍게도 관찰되었다.
보다 구체적으로는, 본원에 고려되는 것처럼, 진탕 플라스크에서 균사 펠릿을 형성하는 관찰된 증가된 경향이 발효기로 규모확장될 수 있는 경우에, 출원인은 지향된 진화 실험에 의해 상기 언급된 펠릿화 표현형을 완화하도록 추구하였다. 예를 들어, 임의의 특정 이론, 기전 또는 작용 방식에 의해 구속되고자 바라지 않으면서, 균사 펠릿을 형성하는 이러한 경향이 단백질 생산 및/또는 이러한 단백질의 하류 가공에 부정적으로 방해할 수 있다고 본원에 고려된다. 출원인은 따라서 이들 균주의 "진화된" 돌연변이체가 생성되고 스크리닝되고 단리될 수 있다고 합리화하였고, 여기서 이러한 진화된 균주는 진탕 플라스크, 발효기, 생물반응기 등에서 균사 펠릿화에 대한 감소된 경향을 포함한다.
예를 들어, 트리초데르마 균주 B7ms1의 배양물은 완전 복합 배지를 함유하는 진탕 플라스크에서 12-24시간 동안 성장되고, 이후 70 마이크로미터(μm) 체를 통과하였다. 세포 밀도에 따른 통과액은 새로운 배양 배지를 접종하도록 사용되거나, 통과액의 전체는 새로운 진탕 플라스크에 옮겨졌다. 항온처리 후, 가끔 샘플을 취하여 공정을 몇 주 동안 연속 반복하였고, 그 샘플을 이후 가능한 돌연변이체를 단리시키도록 플레이팅하였다. 단리물은 (개별적으로) 진탕 플라스크 형태학에서 총 변화(예를 들어, 비제한적인 예로서 펠릿화 또는 균사 덩어리화를 포함하는 진탕 플라스크 형태학에서의 변화)에 대해 시각적으로 스크리닝되었다. 진탕 플라스크에서 보다 균질한 성장을 갖는 이 단리물을 진탕 플라스크 및 이어서 발효기에서 단백질 생산에 대해 추가로 시험하였다.
C. 트리초데르마 돌연변이체 균주 B7ms1-SF12의 단리 및 규명
상기 기재된 이러한 진화 체계에서, 출원인은 "B7ms1-SF12"로 명명된 돌연변이체 균주를 단리시켰고, 여기서 (돌연변이체) B7ms1-SF12 균주는 (모) B7ms1 균주에 비해 진탕 플라스크에서 더 높은 단백질 생산을 나타냈다(데이터 비기재). 따라서, 상기 언급된 펠릿화 표현형에 대한 임의의 영향과 독립적으로, 숙주 균주의 단백질 생산 표현형을 향상시키는 임의의 돌연변이(들)는 발효/단백질 생산 비용을 감소시키는 이의 가능성에서 특정 가치를 갖는다.
따라서, (모) B7ms1 균주 및 자발적 돌연변이체 (딸) 균주 B7ms1-SF12는 발효기에서 총 단백질 생산에 대해 평가되었다. 이들 균주는 액침된 (액체 배양)에서 동일한 조건 하에 성장되고, 공급 당에 대한 이의 총 단백질 수율은 14 ℓ 발효기에 비교되었다. 도 1에 제시된 것처럼, 돌연변이체 B7ms1-SF12 균주(도 1; 검정 선/검정 정사각형)는 (모) B7ms1 균주에 대하여 공급 당에 대한 수율의 44% 증가된 개선을 나타냈다(도 1; 회색 선/회색 정사각형).
간단히 말하면, 각각의 균주의 포자를 측면 배플 및 하부 배플 둘 다를 갖는 3 ℓ의 플라스크에서 500 ㎖의 배지에 별개로 첨가하였다. 배양물을 진탕 항온처리기에서 34℃에서 48시간 동안 최소 배지에 성장시켰다. 48시간 후, 각각의 플라스크의 내용물을 4.7 g/ℓ의 KHPO, 1.0 g/ℓ의 MgSO7HO, 4.3 g/ℓ의 (NH)SO 및 2.5 mL/ℓ의 400X 티. 레세이 미량 원소 용액(시트르산(무수), 175 g/ℓ; FeSO4 · 7 H2O, 200 g/ℓ, ZnSO4 · 7 H2O, 16 g/ℓ, CuSO4 · 5 H2O, 3.2 g/ℓ; MnSO4H2O, 1.4 g/ℓ; H3BO3, 0.8 g/ℓ)을 함유하는 9.5 ℓ의 배지를 함유하는 14 ℓ 발효기에 별개로 첨가하였다. 이들 성분들을 121℃에서 30분 동안 함께 열 살균하였다. 60% 글루코스 및 0.48% CaCl2·2H2O의 용액을 별개로 오토클레이빙하고, 냉각시키고, 75 g/ℓ의 글루코스 및 0.6 g/ℓ의 CaCl2·2H2O의 최종 농도로 발효기에 첨가하였다. 배지를 28% NH로 pH 3.5로 조정하고, 성장 기간 동안 34℃에서 온도를 유지시켰다. 글루코스가 소진되면, 온도는 28℃까지 떨어지고, 배양물은 공급된 글루코스-소포로스였다. 건조 세포 중량(DCW), 총 단백질 농도 및 다른 매개변수를 측정하고, 특이적 총 단백질 생산율 및 공급 당에 대한 수율을 계산하였다.
D. 트리초데르마 돌연변이체 균주 B7ms1-SF12에서의 원인성
lov
(T813K) 돌연변이의 확인
출원인은 (모) B7ms1 균주 및 (돌연변이체) B7ms1-SF12 (딸) 균주의 게놈을 시퀀싱하여서, B7ms1-SF12 게놈에서 암호화 서열을 변경하는 것으로 예측된 두(2)개의 새로운 돌연변이의 확인으로 이어지고, 단독의(또는 조합된) 돌연변이 중 어느 하나는 관찰된 단백질 생산성 (개선) 표현형에 필요하였다. 보다 구체적으로는, 이들 돌연변이 중 어느 것이 중요한지를 결정/확인하기 위해, 상보성 분석은 야생형 좌위의 각각을 암호화하는 DNA를 갖는 (돌연변이체) B7ms1-SF12 균주를 형질전환하여 사용되었다. 예를 들어, 형질전환될 때 오직 하나의 좌위는 돌연변이체 표현형을 보충하였고, 이 좌위는 lov라 칭해진다. lov 유전자는 예측된 단백질 PID 50212(서열 번호 2)를 암호화하고, 여기서 (돌연변이체) B7ms1-SF12 균주에서 lov 돌연변이체(대립유전자)는 스캐폴드 16에서 425393에서 G(구아닌)에서 T(티민)의 단일 뉴클레오타이드 변화를 포함하여, 암화화된 LOV (변이체) 단백질(서열 번호 4)에서 아미노산 치환 T813K를 야기하고, 돌연변이체 대립유전자는 본원에서 대립유전자 "lov(T813K)"라 칭해지고, 자연적 (야생형) 대립유전자는 본원에서 "lov(+)"라 칭해진다.
LOV 단백질 또는 LOV 단백질 오솔로그의 기능적 규명은 임의의 유기체에 대해 문헌에 기재되어 있지 않다. 본원에 기재된 바대로, 보존된 도메인 분석(NCBI)은 글리코실 전환효소 패밀리 그룹 2(pfam13632, 3.25x10-44의 E-값, 예를 들어, 도 2에서 "글리코 트랜스 2 3" 참조)와 멀리 관련된 영역을 확인하였다. 예를 들어, 원핵생물 단백질의 이 (글리코실 전환효소) 패밀리의 구성원은 박테리아 캡슐 생합성(PFAM)에 관여된 추정상 글루코실전환효소를 포함한다. 보다 구체적으로는, 트리초데르마 PID 79396에 대한 오솔로그(즉, LOV가 아님, PID 50212)인 (글리코실 전환효소) 패밀리 그룹 2 도메인, "ZtGT2"를 갖는 진균 단백질은 고체 표면에서의 균사 성장에 중요하다(King et al., 2017).
보다 놀랍게도, LOV 단백질은 담자균류 및 자낭균류 문의 사상성 진균 중에 널리 보존된다. 예를 들어, (자연적) LOV 단백질의 813번 위치에서의 트레오닌(T)(즉, 리신(K)에 대한 돌연변이는 본원에 개시된 바와 같이 유리함)은 트리초데르마 및 가장 산업적으로 관련된 사상성 진균이 속하는 주발버섯 아문 내에 NCBI 비중복 데이터베이스의 상부 BLASTp 검색 결과 중에서 고도로 보존된다(691/691; 100%). 이 691개의 주발버섯 동족체의 Geneious 다중 서열 정렬(www.geneious.com, Geneious 11.0, Biomatters Ltd.)로부터의 그래프 표시는 도 2에 제시된다. 마찬가지로, 상부 1,000 BLASTp 히트 중에서, 잔기 813번 위치는 MUSCLE 다중 서열 정렬(Geneious 소프트웨어 패키지)에서 975/1000(97.5%) 히트(즉, T813)에서 확인되었고, 여기서 잔기 813은 결코 리신(K)로서 발생하지 않는다(즉, 향상된 단백질 생산성을 생성시키는 본원에 기재된 치환은 BLASTp에 의해 확인된 상부 1000 오솔로그에서 발견되지 않았다). 보존된 위치 및 돌연변이가 진균 단백질 생산을 개선하는 데 유용하지만, T813 잔기는 Genebank에 이전에 주석화된 임의의 영역 내에 없다(도 2). LOV 단백질은 트리초데르마 게놈에서 단백질의 이 종류의 오직 예측된 구성원인 반면, 많은 게놈은 하나 초과를 갖는다.
실시예 2
점도 감소 균주에서의
lov
(T813K) 대립유전자의 표적화된 도입은 발효기에서 단백질 생산성을 증가시킨다
A. 개요
lov(T813K) 대립유전자가 관찰된 단백질 생산성 개선에 대한 원인인지를 추가로 검증하기 위해, lov(T813K) 돌연변이를 상이한 T. 레세이 균주 계통(본원에서 "T4"라 명명)으로 도입하였다. B7ms1(실시예 1) 및 T4 계통은 둘 다 트리초데르마 균주 RL-P37의 상이한 균주 개선 프로그램으로부터 돌연변이된 유도체이다(Sheir-Neiss et al., 1984; Montenecourt, 1987). T4 균주는 특히 T4 균주가 셀룰라아제의 자연적 칵테일을 발현하고, 총 단백질 생산을 증가시키는 nik1(M743T) 돌연변이를 함유한다는 점에서 B7ms1과 다르다(US20180037919). 전에 B7ms1 계통(실시예 1)에 의한 것처럼, 점도 감소 이중 돌연변이체(Δmpg1; Δseb1)는 lov(T813K) 대립유전자의 존재 또는 부재 둘 다 하에 T4 계통에서 발견되었다. 예를 들어, 발효기에서, lov(T813K) 대립유전자를 포함하는 T4 Δmpg1; Δseb1 균주는 공급 당에 대한 평균 37% 더 높은 총 단백질 수율을 가졌다.
B.
pyr4
또는
pyr2
선별 마커 중 어느 하나를 갖는
lov
파괴 카세트를 포함하는 플라스미드의 작제
트리초데르마 lov 파괴 카세트 플라스미드는 표준 분자 생물학 절차를 사용하여 제조되었고, 여기서 관련 분야에서의 당업자는 본원에 개시된 정보로부터 이 플라스미드를 용이하게 재생성할 수 있다. 플라스미드는 스캐폴드 16, 426947 내지 425393에 대응하는 DNA 서열에 동일한 1.6 Kb 상동성 박스를 갖는 DNA 서열(왼쪽 플랭크)을 포함하였다. 왼쪽 플랭크의 마지막 뉴클레오타이드는 (돌연변이체) B7ms1-SF12 균주에서 확인된 돌연변이(실시예 1)에 상응하는 단일 뉴클레오타이드 G에서 T 돌연변이를 도입하였다. 스캐폴드 16, 425392 내지 423880과 동일한 DNA 서열에 상응하는 1.5 Kb 상동성 박스를 갖는 DNA 서열(오른쪽 플랭크) 또한 이 플라스미드 내에 포함되었다. 이 서열은 lov 유전자를 표적화하고, 개재하는 카세트 서열로 왼쪽 플랭크와 오른쪽 플랭크(스캐폴드 16, 425393) 사이의 게놈의 뉴클레오타이드를 대체하도록 설계되었다.
이 개재하는 (카세트) 서열은 트리초데르마 레세이(pRATT308)로부터의 pyr4 선별 마커 또는 트리초데르마 아트로비리데(pRATT312)로부터의 pyr2 선별 마커를 포함하였다. 선별 마커의 바로 하류에 왼쪽 플랭크(반복서열)의 3′-가장 0.5 Kb 영역에 상동성인 0.5 Kb 영역을 갖는 DNA 서열이 있다. 이 반복된 서열은 선별 마커의 후속하는 손실을 촉진하도록 의도되어서, 미래의 균주 개발에서 이 마커의 후속하는 사용이 가능하게 하고, 오직 새로 표적화된 게놈 변형으로서 LOV(T813K) 단백질(서열 번호 4)을 암호화하는 lov 유전자에서 단일 뉴클레오타이드 G에서 T 돌연변이(스캐폴드 16, 425393)를 남긴다.
C.
lov
(T813K) 대립유전자를 갖는 T4 유래 균주의 개발
유전자 mpg1의 점도 감소 파괴(Δmpg1)를 포함하는 본원에서 균주 "T4m" 및 "T4m_pyr2"라 명명된 T4 균주의 유도체는 미국 특허 제9,725,727호에서 본질적으로 개발되었다(본원에 그 전체가 참고로 포함됨). 따라서, T4m_pyr2 균주(Δmpg1; pyr2)는 PEG 매개 형질전환을 이용하여 pRATT312(pyr2 선별 마커)로부터 lov 파괴 카세트로부터 형질전환되고, pyr2 마커에 의해 획득된 우리딘 원영양요구성에 기초하여 후보를 선택하기 위해 1.2 M 소르비톨을 함유하는 Vogel의 최소 배지(Vogel, 1956)에 플레이팅되었다. 트리초데르마 형질전환은 널리 공지되어 있고, 당해 분야에 기재되어 있다(예를 들어, 미국 특허 5,246,853호 참조). 개별 형질전환체는 단리되고 Vogel 최소 배지로 이동시켜 증식되었다. PCR 분석은 형질전환체를 확인하도록 사용되는데, 여기서 lov 파괴 카세트는 하기 지침에 따라 당업자에게 공지된 방법을 이용하여 상동성 재조합에 의해 lov 유전좌위에서 통합되었다.
재조합 세포의 하위집단만이 관심 유전자의 파괴를 정확히 표적화하기 위해 상동성 플랭크를 성공적으로 이용할 수 있어서, 많은 형질전환체는 원하는 사건을 갖는 것을 확인하기 위해 스크리닝될 필요가 있을 수 있다. PCR은 어떠한 재조합 세포가 원하는 표적화된 파괴를 갖는지를 시험하기 위해 이용될 수 있다. 각각의 상동성 박스 영역에 걸쳐 증폭하는 프라이머가 설계되어야 하고, 여기서 하나의 프라이머는 가장 가까운 말단으로부터 100 bp 초과인 선별 마커 내의 위치에서 프라이밍하고, 다른 프라이머는 인접한 게놈 서열 내의 상동성 박스 영역의 말단을 넘어 100 bp 초과인 위치에서 프라이밍한다. 정확한 표적화된 파괴를 아마도 함유하는 세포는 파괴 카세트의 왼쪽 플랭크 및 오른쪽 플랭크에 이르는 PCR 산물을 성공적으로 생성하는 반면, 성공적이지 않은 형질전환 사건은 예상된 크기의 산물을 생성하지 않을 것이다. 이 단계에서 배양물은 형질전환된 세포와 비형질전환된 세포의 혼합물일 수 있고, 그래서 정제 단계가 필요할 수 있다. 배양물의 정제는 파괴 부위에 이르는 짧은 PCR 산물의 손실에 대해서 PCR에 의해 시험될 수 있다.
보다 구체적으로는, lov 유전자의 pyr2 파괴를 포함하는 하나의 이러한 T4m 유래 균주는 확인되고 단리되고 "T4ml+"(즉, 특정 T813K 치환을 포함하는 대립유전자 lov(T813K)와 반대로 대립유전자 lov(dis))라 명명된다. 따라서, 특정 lov(T813K) 대립유전자를 포함하는 균주를 생성하기 위해, 균주 T4ml+(lov(dis) 대립유전자를 포함)의 포자 현탁액은 유도체 균주를 선택하기 위해 5-플루오로-오로트산(FOA)을 함유하는 배지에 플레이팅되고, 여기서 삽입된 선별 마커를 측접시키는 반복된 영역과 게놈으로부터의 선별 마커의 동반 손실 사이의 자발적 재조합이 있다. 우리딘 영양요구체는 선별 마커의 손실을 시험하기 위해 PCR에 의해 그리고 lov(T813K) 대립유전자의 존재를 확인하기 위해 PCR 산물의 시퀀싱에 의해 단리되고 분석되었다. lov(T813K) 대립유전자를 포함하는 하나의 균주는 이러한 방식으로 생성되고, 본원에서 "T4ml"이라 칭해진다. 발효기 평가를 위해 피리미딘 원영양요구성을 복원하기 위해, T4ml 및 T4m_pyr2 균주 둘 다는 본질적으로 미국 특허 9,725,727호에 기재된 바대로 점도 감소 좌위 seb1로 표적화된 pyr2 마커를 가져서, 본원에서 "T4mls"(lov(T813K) 대립유전자를 포함) 및 "T4ms"(lov(+) 대립유전자를 포함)라 칭하는 균주를 생성시킨다.
D.
lov
(T813K) 대립유전자를 포함하는 T4 유래 균주의 발효기 평가
따라서, 균주 T4mls(lov(T813K) 대립유전자를 포함) 및 T4ms(lov(+) 대립유전자를 포함)는 실시예 1에 기재된 바대로 발효기에서 평가되었다. 부가적으로, T4mls 및 T4ms 균주는 lov(T813K) 대립유전자에 의해 관찰된 단백질 생산 표현형이 더 높은 세포 밀도 발효로 제한되지 않는다는 것을 보장하기 위해 공급 시작 전에 제공된 글루코스의 양을 조정하여 실시예 1에 비해 더 낮은 세포 밀도 발효에서 평가되었다. 도 3에 도시된 바와 같이, 더 낮은 세포 밀도(LCD; 도 3, T4mls, 검정 원/검정 파선; T4ms, 회색 원/회색 파선) 발효 조건 및 더 높은 세포 밀도(HCD; 도 3, T4mls, 검정 정사각형/검정 실선; T4ms, 회색 정사각형/회색 실선) 발효 조건 둘 다 하에, 공급 당에 대한 단백질 수율은 lov(T813K) 대립유전자가 존재할 때 각각 42% 및 32% 증가하였다.
실시예 3
pyr2
선별 마커의 삽입에 의한
lov
유전자의 표적화된 파괴는 발효기에서 생산성을 개선하지 못했다
A. 개요
(자연적) LOV 단백질(서열 번호 2)의 잔기 813번 위치에서의 트레오닌(T) 아미노산의 높은 보존을 고려하여, LOV 단백질의 발현/생산을 차단하는 임의의 방식에서의 좌위의 파괴가 또한 균주 생산성을 개선할 것이라는 개연성이 있을 것 같다. 이 가설을 시험하기 위해, lov(dis) 대립유전자를 갖는 진균 균주 및 갖지 않는 것을 발효기에서 비교하였고, 여기서 pyr2 선별 마커는 LOV 단백질 발현을 파괴시키도록 lov 유전자로 삽입되었다. 놀랍게도, lov(dis) 대립유전자는 발효기에서 생산을 개선하지 못했다.
B.
lov
(dis) 대립유전자를 갖는 균주의 발효기 평가
T4m 및 T4ml+ 균주의 개발은 상기 실시예 2에 기재되어 있다. 균주 T4ml+는 T4m의 유도체이고, 여기서 pyr2 마커는 균주 T4m_pyr2의 lov 암호화 서열로 삽입되었다. T4m 및 T4ml+ 균주는 공급 시작 전에 제공된 글루코스의 양을 조정하여 더 낮은 세포 밀도 발효에서를 제외하고 실시예 1에 기재된 바와 본질적으로 동일한 14 ℓ 발효기에서 동일한 조건 하에 평가되었다.
"T4s" 및 "T4s_pyr2"(유전자 seb1의 점도 감소 파괴를 포함)라 명명된 T4의 유도체는 미국 특허 제9,725,727호에 기재된 바대로 본질적으로 개발되었다. lov(dis) 대립유전자는 균주 T4sl+를 생성하도록 실시예 2에서 균주 T4m_pyr2에 대해 기재된 바대로 비슷하게 T4s_pyr2로 도입되었다. 따라서, T4s 및 T4sl+ 균주는 2 ℓ 생물반응기에서 동일한 조건 하에 평가되었다. 구체적으로는, 2 ℓ 생물반응기에 대해, 종균 배양물을 생산하기 위해, 각 균주의 포자를 250 ㎖ 플라스크에서 시트레이트 최소 배지 50 ㎖에 개별적으로 첨가하였다. 배양물을 진탕 항온처리기에서 30℃ 및 170 rmp에서 48시간 동안 성장시켰다. 48시간 후에, pH 3.5로 조정된 145.6 ㎖의 50% 글루코스, 및 0.6 g/kg의 CaCl2에 종균 배양물을 접종하였다. 이후, 온도를 34℃에서 유지시키고 pH를 3.5에서 유지하였다. 회분식 글루코스의 고갈 이후에, 이후 글루코스-소포로스 공급을 도입하고, 온도를 25℃로 떨어뜨리고 pH를 4.8로 증가시켰다. 건조 세포 중량(DCW), 총 단백질 농도 및 다른 매개변수를 측정하고, 특이적 총 단백질 생산율 및 공급 당에 대한 수율을 계산하였다. 도 4에 도시된 것처럼, 공급 당에 대한 단백질 수율은 lov(dis) 돌연변이가 T4m 배경에 존재할 때 17% 감소하였고, T4s 배경에 존재할 때 변하지 않았다.
실시예 4
다른 진균 균주에서의
lov
(T813K) 대립유전자의 표적화된 도입은 단백질 생산성을 개선한다
A. 개요
실시예 2에서, 대립유전자 lov(T813K) 생성 및 마커 손실과 수반되어 생성된 pyr2 영양요구성은 seb1 좌위에서 pyr2 마커의 통합에 의해 회복되었다. 따라서, lov(T813K) 대립유전자에 의해 관찰된 단백질 생산의 개선은 mpg1 및 seb1 점도 돌연변이 둘 다를 항상 함유하는 균주에서 실시예 1 및 실시예 2에서 여태까지 예시되어 있다. 균주 생산성의 개선에 대한 lov(T813K) 대립유전자의 보다 일반적인 적용을 입증하기 위해, pyr2 마커는 3개의 다른 편리한 게놈 위치에서 통합되었다: 부위 A, 부위 B 및 부위 C. 이 상이한 균주에 의한 단백질 생산은 진탕 플라스크에서 평가되었고, 여기서 모든 경우에 lov(T813K) 돌연변이의 존재는 야생형 lov(+) 대립유전자를 갖는 동질유전자 균주에 비해 총 단백질 생산을 개선하였다. 이와 반대로, lov(dis) 돌연변이를 포함하는 균주는 진탕 플라스크에서 상당한 단백질 생산 개선을 나타내지 않았다.
B. 상이한 게놈 위치에서의
pyr2
선별 마커의 표적화된 통합에 의한 T4ml 및 T4sl에서의 복원된 피리미딘 영양요구성
lov(T318K) 대립유전자를 갖거나 갖지 않는 균주는 당업자에게 공지된 방법을 사용하여 부위 A-C로 명명된 3개의 편리한 게놈 위치로 pyr2의 통합을 표적화하는 카세트와 독립적으로 형질전환되었다. 간단히, pyr2 카세트에 의한 PEG 매개 형질전환 후에, 프로토플라스트는 pyr2 마커에 의해 획득된 우리딘 원영양요구성에 기초하여 후보를 선택하기 위해 1.2 M 소르비톨을 함유하는 Vogel의 최소 배지에 플레이팅되었다. 개별 형질전환체는 단리되고 Vogel 최소 배지로 이동시켜 증식되었다. PCR 분석은 pyr2 카세트가 의도된 게놈 위치에서 통합된 형질전환체를 확인하도록 사용되었다. 포자 정제 후에, 통합이 정확히 발생하고 형질전환체가 동종핵성이라는 것을 보장하도록 추가의 PCR 분석이 수행되었다.
따라서, pyr2 마커는 실시예 2(표 1 참조)에 기재된 pyr2 돌연변이체 균주 T4m_pyr2(lov(+)) 및 T4ml(Δmpg1; lov(T318K))에서 부위 A, 부위 B 및 부위 C에서 통합되었다. 마찬가지로, pyr2 마커는 실시예 3에 기재된 돌연변이체 균주 T4s_pyr2(Δseb1; lov(+)) 및 T4sl(Δseb1; lov(T318K))에서 부위 A에서 통합되었다. 부가적으로, 파괴 대립유전자 lov(dis)는 실시예 2에 각각 기재된 바대로 플라스미드 pRATT312 및 pRATT308을 사용하여 전체 셀룰라아제 균주 T4_pyr2(pyr2; lov(+)) 및 41G_pyr4(pyr4; lov(+))에 첨가되었다.
C.
lov
(T813K) 또는
lov
(dis) 대립유전자를 갖는 균주 및 갖지 않는 균주의 진탕 플라스크 평가
균주는 이의 단백질 생산에 대해 진탕 플라스크 발효에서 평가되었다. 평가된 균주는 표 1에 기재되어 있다. 시험된 모든 유전적 배경에서, 총 단백질 역가는 lov(T813K) 대립유전자가 존재할 때 증가하였다. 그러나, pyr4 (41G) 또는 pyr2 마커(T4 및 T4m) 중 어느 하나에 의한 lov 유전자의 파괴, lov(dis) 대립유전자는 상대 역가에서 상당한 개선을 나타내지 않았다.
액체 한정(LD) 배양 배지(예를 들어, 미국 특허 8,455,631호 참조)는 하기 성분을 함유하였다. 카사미노산, 9 g/ℓ; (NH4)2SO4, 5 g/ℓ; MgSO4·7H2O, 1 g/ℓ; KH2PO4, 4.5 g/ℓ; CaCl2·2H2O, 1 g/ℓ, PIPPS, 33 g/ℓ, 400× T. 레세이 미량 원소, 2.5 ml/ℓ; NaOH에 의해 5.5로 조정된 pH. 살균 후, 락토스 또는 글루코스/소포로스 혼합물을 1.6% w/v의 최종 농도로 첨가하였다.
종균 배양물을 생산하기 위해, 각 균주의 포자를 250 ㎖ 플라스크에서 50 ㎖의 YEG(5 g/ℓ 효모 추출물, 22 g/ℓ 글루코스, H2O)에 개별적으로 첨가하였다. 배양물을 진탕 인큐베이터에서 28℃ 및 200 rmp에서 36-48시간 동안 성장시켰다. 접종 후, 0.3 ㎖의 종균 배양물을 배플 진탕 플라스크에서 50 ㎖의 LD 배지에 첨가하였다. 이 생산 배양물을 28℃ 및 180 rpm에서 5일 동안 성장시켰다. 분비된 단백질을 펠릿 세포로 원심분리하고, 이후 상청액을 수집하여 수확하였다. 단백질을 동일 부피의 트리클로로아세트산(TCA)을 갖는 상청액으로부터 침전시킨 후, 0.1 N 수산화나트륨(NaOH)에 용해시켰다. 이후, 총 단백질을 제조사 프로토콜에 따라 BCA 단백질 검정(ThermoFisher Scientific, 미국 뉴욕주 그랜드 아일랜드)으로 측정하였다. 모든 진탕 플라스크 실험에서, 원영양요구성 T4 및 T4m 균주는 이중으로 포함되었다. BCA 검정 번호를 이들 대조군의 평균으로 정규화하고, 이것은 총 단백질 생산 효율에서 임의의 주-대-주 변동의 영향을 최소화하도록 동시에 수행되었다.
도 5에 도시된 것처럼, lov(T813K) 돌연변이가 상기 생물반응기(실시예 2)에 예시된 T4ms 배경 이외에 T4mc(부위 C), T4md(부위 B), T4mp(부위 A) 및 T4sp(부위 A) 배경에 존재할 때 단백질 역가는 증가하였다. 이와 반대로, lov 유전자를 파괴하는, 즉 대립유전자 lov(dis)의 pyr2 마커 또는 pyr4 마커의 삽입을 포함하는 유전적 배경 41G, T4 및 T4m은 진탕 플라스크에서 단백질 생산의 상당한 개선을 나타내지 않았다.
D.
lov
(T813K) 대립유전자를 갖는 균주 T4mp 및 갖지 않는 균주의 발효기 평가
이들 균주, T4mp 및 T4mlp(부위 A에서의 pyr2의 삽입)의 한쌍은 더 낮은 세포 밀도에서를 제외하고 실시예 1에 일반적으로 기재된 바와 같이 14 ℓ 발효기에서 추가로 평가되었다. 도 6에 도시된 바대로, lov(T813K) 대립유전자의 존재 하에, 이 유전적 배경은 공급 당에 대한 총 단백질 수율의 28% 증가를 나타냈다.
참고문헌
<110> DANISCO US INC
<120> MUTANT AND GENETICALLY MODIFIED FILAMENTOUS FUNGAL STRAINS
COMPRISING ENHANCED PROTEIN PRODUCTIVITY PHENOTYPES AND METHODS
THEREOF
<130> NB41054-WO-PCT
<150> US 62/711,846
<151> 2018-07-30
<160> 24
<170> PatentIn version 3.5
<210> 1
<211> 2765
<212> DNA
<213> Hypocrea jecorina
<400> 1
atgggtatcg gaagctactt caaggccagt accaaaaatg ctgagcaggc accgccagcg 60
ccgccgccgg ccaagctggc tcctcctcct cggttacagc tggaaggtcg gcagtcggta 120
atgtcggaga agccaccatc gtccacctcg ggcaacgacg tggatcttca gcctcccacc 180
cctaggtttc attcccgacc ccaatccagc tctggcaggt ctaccccttc aacgcagagc 240
tccatgttcc tcgacgacat caagcatgaa gtcatggtca actatctgta ccagcagcag 300
tgttctcagc tctgggtcag cgacgggtct ggggagatcg agggtgtcct gcttcgtaaa 360
gctcgaggcc actacatggc ctgtcccccc cagcttgcca gttctccctt tgcgctggca 420
tgcgctgctc tcaacgtgca gtgcgccatg acagtcaact cgcgtgtcat caagacgttt 480
ctgcaatggt cccctgacgc cgttgacgtg ccgctcatga acggcttgcg cgtgcagatt 540
ctccctacca ttgatgactt gccgcgagct cgcaagtacc agtttgctgc ctttgtcgcg 600
tctgagggcc tcctggttgt ctgggacgat gatgctcttc atttggtggc acgagccaag 660
gctatcgagt ccgagctcat ggagctggtg tggaaggccg gcaacgtaga cgaggaaggc 720
ggcgacgaga agggaggcca acctgtcact gaggttgaaa ttgatgaaga gagcggagag 780
atcaagcccg agaagcggcc cattcatctc caaaacaccg tcctcgtgtc tctgaccctg 840
gccttggtaa ccgtctctct tggcgccgcc tggagacagt tggccattga ggtttccgtg 900
gacagcaact acatccgtct tgccctcgtc gccctggctc cagtccaggt tttcttcacc 960
ctcttcttcg cccaggtcat tatcggctgc ttggctcaaa tctttggtcc catccgtcag 1020
ctcacaatca actccaagtt ctactctgcc cgacccccac cgcgcctgca gagtgccgtt 1080
cttcctcatg taaccatcca gtgccccgtc tacaaggaag gtctgcaggg tgtcatcatg 1140
ccgacggtca agtccatcaa gcaggccatg tccacgtacg agctccaggg cggttccgca 1200
aacatgttca tcaacgacga tggtttgcag ctcatctccg aagaggatcg tcttgctcgc 1260
atcgagttct acgccgacaa cagcatcggc tgggtcgctc gccccaagca cggagagaac 1320
ggcttcaccc gcaagggcaa gttcaagaag gcctccaaca tgaactttgc cctcatgatc 1380
tcatgcaagg tcgaggagaa gctgcaggca attgagcgtc accccggatg gagccagaat 1440
gacgaggcct tggcgtacga ggaagctctc aaggaagttc tcgaggccga tggccgtgcc 1500
tgggctgatg gtaacatccg catgggagac tacatcttgc tcatcgactc cgatacccgt 1560
gtccccgccg attgcctgct cgatgctgtt tccgagatgg agcagtcccc cgacgttggc 1620
atcatgcagt tctcctccgg cgtcatgcag gtcgtccaca cgtactttga gaacggcatc 1680
accttcttca ccaacctcat ttactctgcc atccgataca ccgtctccaa cggtgacgtc 1740
gcgccctttg tcggccacaa cgccatcctc cgctggtctg ccatccagca ggtcgcctac 1800
caggacgagg acggctacga caagttctgg tcggagagcc acgtctcgga agactttgac 1860
atgtcgctgc gtctgcagtg caacggctac atcatccgcc tggctgcctg ggctggagag 1920
ggtttcaagg agggcgtgtc gctgaccgtc tacgacgagc ttgcccggtg ggaaaagtac 1980
gcctacggct gcaacgagct cctgttccac cccattcgca cctggctctg gcgcggtccc 2040
tttacgccct tgttccgccg cttcctcttc tccaacattc gctttacgtc caaggtcacc 2100
gtcatctcct acatcggtac ctactacgcc atcggcgctg cctggatctt gaccgcggtc 2160
aactacttcg tcatgggctg gttcaacggc tacctggata agtactacgt cgactcgtgg 2220
caggtctggt tctccatcat catcgtcttc aacggcctcg gcaacattgc cctagccgtc 2280
atgcggtacc gcgtcggcga gcgcggtctg ctgtacgccc tgtttgagaa ctttatgtgg 2340
actctcatgc tggccatatt cctcggcggc ctgtcactgc acgtcagcca ggctctgctg 2400
gcgcacatgt ttgagattaa catgacatgg ggcgccacaa gcaaggaggc cgagttttcc 2460
aactttttca tcgaggtgcc aaaggtcttg aagaaggtta gtcaccctcg tttcattcat 2520
ccatccatct taccatgctg cgcgaagact tcagtttgct gacaattctg ttgtagttca 2580
aattctccat gctcttctcg ttgatcttca tcgccggcat gattatcctc gcccaggcgc 2640
cctttgtccc ctttgattgg cgcatcaagg actttgtcgc catcctgcct atggccaccg 2700
tcgccgccag ccacttcctg ctgcccctgg ccctgaaccc tgccctcatg acgttctcat 2760
ggtaa 2765
<210> 2
<211> 894
<212> PRT
<213> Hypocrea jecorina
<400> 2
Met Gly Ile Gly Ser Tyr Phe Lys Ala Ser Thr Lys Asn Ala Glu Gln
1 5 10 15
Ala Pro Pro Ala Pro Pro Pro Ala Lys Leu Ala Pro Pro Pro Arg Leu
20 25 30
Gln Leu Glu Gly Arg Gln Ser Val Met Ser Glu Lys Pro Pro Ser Ser
35 40 45
Thr Ser Gly Asn Asp Val Asp Leu Gln Pro Pro Thr Pro Arg Phe His
50 55 60
Ser Arg Pro Gln Ser Ser Ser Gly Arg Ser Thr Pro Ser Thr Gln Ser
65 70 75 80
Ser Met Phe Leu Asp Asp Ile Lys His Glu Val Met Val Asn Tyr Leu
85 90 95
Tyr Gln Gln Gln Cys Ser Gln Leu Trp Val Ser Asp Gly Ser Gly Glu
100 105 110
Ile Glu Gly Val Leu Leu Arg Lys Ala Arg Gly His Tyr Met Ala Cys
115 120 125
Pro Pro Gln Leu Ala Ser Ser Pro Phe Ala Leu Ala Cys Ala Ala Leu
130 135 140
Asn Val Gln Cys Ala Met Thr Val Asn Ser Arg Val Ile Lys Thr Phe
145 150 155 160
Leu Gln Trp Ser Pro Asp Ala Val Asp Val Pro Leu Met Asn Gly Leu
165 170 175
Arg Val Gln Ile Leu Pro Thr Ile Asp Asp Leu Pro Arg Ala Arg Lys
180 185 190
Tyr Gln Phe Ala Ala Phe Val Ala Ser Glu Gly Leu Leu Val Val Trp
195 200 205
Asp Asp Asp Ala Leu His Leu Val Ala Arg Ala Lys Ala Ile Glu Ser
210 215 220
Glu Leu Met Glu Leu Val Trp Lys Ala Gly Asn Val Asp Glu Glu Gly
225 230 235 240
Gly Asp Glu Lys Gly Gly Gln Pro Val Thr Glu Val Glu Ile Asp Glu
245 250 255
Glu Ser Gly Glu Ile Lys Pro Glu Lys Arg Pro Ile His Leu Gln Asn
260 265 270
Thr Val Leu Val Ser Leu Thr Leu Ala Leu Val Thr Val Ser Leu Gly
275 280 285
Ala Ala Trp Arg Gln Leu Ala Ile Glu Val Ser Val Asp Ser Asn Tyr
290 295 300
Ile Arg Leu Ala Leu Val Ala Leu Ala Pro Val Gln Val Phe Phe Thr
305 310 315 320
Leu Phe Phe Ala Gln Val Ile Ile Gly Cys Leu Ala Gln Ile Phe Gly
325 330 335
Pro Ile Arg Gln Leu Thr Ile Asn Ser Lys Phe Tyr Ser Ala Arg Pro
340 345 350
Pro Pro Arg Leu Gln Ser Ala Val Leu Pro His Val Thr Ile Gln Cys
355 360 365
Pro Val Tyr Lys Glu Gly Leu Gln Gly Val Ile Met Pro Thr Val Lys
370 375 380
Ser Ile Lys Gln Ala Met Ser Thr Tyr Glu Leu Gln Gly Gly Ser Ala
385 390 395 400
Asn Met Phe Ile Asn Asp Asp Gly Leu Gln Leu Ile Ser Glu Glu Asp
405 410 415
Arg Leu Ala Arg Ile Glu Phe Tyr Ala Asp Asn Ser Ile Gly Trp Val
420 425 430
Ala Arg Pro Lys His Gly Glu Asn Gly Phe Thr Arg Lys Gly Lys Phe
435 440 445
Lys Lys Ala Ser Asn Met Asn Phe Ala Leu Met Ile Ser Cys Lys Val
450 455 460
Glu Glu Lys Leu Gln Ala Ile Glu Arg His Pro Gly Trp Ser Gln Asn
465 470 475 480
Asp Glu Ala Leu Ala Tyr Glu Glu Ala Leu Lys Glu Val Leu Glu Ala
485 490 495
Asp Gly Arg Ala Trp Ala Asp Gly Asn Ile Arg Met Gly Asp Tyr Ile
500 505 510
Leu Leu Ile Asp Ser Asp Thr Arg Val Pro Ala Asp Cys Leu Leu Asp
515 520 525
Ala Val Ser Glu Met Glu Gln Ser Pro Asp Val Gly Ile Met Gln Phe
530 535 540
Ser Ser Gly Val Met Gln Val Val His Thr Tyr Phe Glu Asn Gly Ile
545 550 555 560
Thr Phe Phe Thr Asn Leu Ile Tyr Ser Ala Ile Arg Tyr Thr Val Ser
565 570 575
Asn Gly Asp Val Ala Pro Phe Val Gly His Asn Ala Ile Leu Arg Trp
580 585 590
Ser Ala Ile Gln Gln Val Ala Tyr Gln Asp Glu Asp Gly Tyr Asp Lys
595 600 605
Phe Trp Ser Glu Ser His Val Ser Glu Asp Phe Asp Met Ser Leu Arg
610 615 620
Leu Gln Cys Asn Gly Tyr Ile Ile Arg Leu Ala Ala Trp Ala Gly Glu
625 630 635 640
Gly Phe Lys Glu Gly Val Ser Leu Thr Val Tyr Asp Glu Leu Ala Arg
645 650 655
Trp Glu Lys Tyr Ala Tyr Gly Cys Asn Glu Leu Leu Phe His Pro Ile
660 665 670
Arg Thr Trp Leu Trp Arg Gly Pro Phe Thr Pro Leu Phe Arg Arg Phe
675 680 685
Leu Phe Ser Asn Ile Arg Phe Thr Ser Lys Val Thr Val Ile Ser Tyr
690 695 700
Ile Gly Thr Tyr Tyr Ala Ile Gly Ala Ala Trp Ile Leu Thr Ala Val
705 710 715 720
Asn Tyr Phe Val Met Gly Trp Phe Asn Gly Tyr Leu Asp Lys Tyr Tyr
725 730 735
Val Asp Ser Trp Gln Val Trp Phe Ser Ile Ile Ile Val Phe Asn Gly
740 745 750
Leu Gly Asn Ile Ala Leu Ala Val Met Arg Tyr Arg Val Gly Glu Arg
755 760 765
Gly Leu Leu Tyr Ala Leu Phe Glu Asn Phe Met Trp Thr Leu Met Leu
770 775 780
Ala Ile Phe Leu Gly Gly Leu Ser Leu His Val Ser Gln Ala Leu Leu
785 790 795 800
Ala His Met Phe Glu Ile Asn Met Thr Trp Gly Ala Thr Ser Lys Glu
805 810 815
Ala Glu Phe Ser Asn Phe Phe Ile Glu Val Pro Lys Val Leu Lys Lys
820 825 830
Phe Lys Phe Ser Met Leu Phe Ser Leu Ile Phe Ile Ala Gly Met Ile
835 840 845
Ile Leu Ala Gln Ala Pro Phe Val Pro Phe Asp Trp Arg Ile Lys Asp
850 855 860
Phe Val Ala Ile Leu Pro Met Ala Thr Val Ala Ala Ser His Phe Leu
865 870 875 880
Leu Pro Leu Ala Leu Asn Pro Ala Leu Met Thr Phe Ser Trp
885 890
<210> 3
<211> 2765
<212> DNA
<213> Hypocrea jecorina
<400> 3
atgggtatcg gaagctactt caaggccagt accaaaaatg ctgagcaggc accgccagcg 60
ccgccgccgg ccaagctggc tcctcctcct cggttacagc tggaaggtcg gcagtcggta 120
atgtcggaga agccaccatc gtccacctcg ggcaacgacg tggatcttca gcctcccacc 180
cctaggtttc attcccgacc ccaatccagc tctggcaggt ctaccccttc aacgcagagc 240
tccatgttcc tcgacgacat caagcatgaa gtcatggtca actatctgta ccagcagcag 300
tgttctcagc tctgggtcag cgacgggtct ggggagatcg agggtgtcct gcttcgtaaa 360
gctcgaggcc actacatggc ctgtcccccc cagcttgcca gttctccctt tgcgctggca 420
tgcgctgctc tcaacgtgca gtgcgccatg acagtcaact cgcgtgtcat caagacgttt 480
ctgcaatggt cccctgacgc cgttgacgtg ccgctcatga acggcttgcg cgtgcagatt 540
ctccctacca ttgatgactt gccgcgagct cgcaagtacc agtttgctgc ctttgtcgcg 600
tctgagggcc tcctggttgt ctgggacgat gatgctcttc atttggtggc acgagccaag 660
gctatcgagt ccgagctcat ggagctggtg tggaaggccg gcaacgtaga cgaggaaggc 720
ggcgacgaga agggaggcca acctgtcact gaggttgaaa ttgatgaaga gagcggagag 780
atcaagcccg agaagcggcc cattcatctc caaaacaccg tcctcgtgtc tctgaccctg 840
gccttggtaa ccgtctctct tggcgccgcc tggagacagt tggccattga ggtttccgtg 900
gacagcaact acatccgtct tgccctcgtc gccctggctc cagtccaggt tttcttcacc 960
ctcttcttcg cccaggtcat tatcggctgc ttggctcaaa tctttggtcc catccgtcag 1020
ctcacaatca actccaagtt ctactctgcc cgacccccac cgcgcctgca gagtgccgtt 1080
cttcctcatg taaccatcca gtgccccgtc tacaaggaag gtctgcaggg tgtcatcatg 1140
ccgacggtca agtccatcaa gcaggccatg tccacgtacg agctccaggg cggttccgca 1200
aacatgttca tcaacgacga tggtttgcag ctcatctccg aagaggatcg tcttgctcgc 1260
atcgagttct acgccgacaa cagcatcggc tgggtcgctc gccccaagca cggagagaac 1320
ggcttcaccc gcaagggcaa gttcaagaag gcctccaaca tgaactttgc cctcatgatc 1380
tcatgcaagg tcgaggagaa gctgcaggca attgagcgtc accccggatg gagccagaat 1440
gacgaggcct tggcgtacga ggaagctctc aaggaagttc tcgaggccga tggccgtgcc 1500
tgggctgatg gtaacatccg catgggagac tacatcttgc tcatcgactc cgatacccgt 1560
gtccccgccg attgcctgct cgatgctgtt tccgagatgg agcagtcccc cgacgttggc 1620
atcatgcagt tctcctccgg cgtcatgcag gtcgtccaca cgtactttga gaacggcatc 1680
accttcttca ccaacctcat ttactctgcc atccgataca ccgtctccaa cggtgacgtc 1740
gcgccctttg tcggccacaa cgccatcctc cgctggtctg ccatccagca ggtcgcctac 1800
caggacgagg acggctacga caagttctgg tcggagagcc acgtctcgga agactttgac 1860
atgtcgctgc gtctgcagtg caacggctac atcatccgcc tggctgcctg ggctggagag 1920
ggtttcaagg agggcgtgtc gctgaccgtc tacgacgagc ttgcccggtg ggaaaagtac 1980
gcctacggct gcaacgagct cctgttccac cccattcgca cctggctctg gcgcggtccc 2040
tttacgccct tgttccgccg cttcctcttc tccaacattc gctttacgtc caaggtcacc 2100
gtcatctcct acatcggtac ctactacgcc atcggcgctg cctggatctt gaccgcggtc 2160
aactacttcg tcatgggctg gttcaacggc tacctggata agtactacgt cgactcgtgg 2220
caggtctggt tctccatcat catcgtcttc aacggcctcg gcaacattgc cctagccgtc 2280
atgcggtacc gcgtcggcga gcgcggtctg ctgtacgccc tgtttgagaa ctttatgtgg 2340
actctcatgc tggccatatt cctcggcggc ctgtcactgc acgtcagcca ggctctgctg 2400
gcgcacatgt ttgagattaa catgacatgg ggcgccaaaa gcaaggaggc cgagttttcc 2460
aactttttca tcgaggtgcc aaaggtcttg aagaaggtta gtcaccctcg tttcattcat 2520
ccatccatct taccatgctg cgcgaagact tcagtttgct gacaattctg ttgtagttca 2580
aattctccat gctcttctcg ttgatcttca tcgccggcat gattatcctc gcccaggcgc 2640
cctttgtccc ctttgattgg cgcatcaagg actttgtcgc catcctgcct atggccaccg 2700
tcgccgccag ccacttcctg ctgcccctgg ccctgaaccc tgccctcatg acgttctcat 2760
ggtaa 2765
<210> 4
<211> 894
<212> PRT
<213> Hypocrea jecorina
<400> 4
Met Gly Ile Gly Ser Tyr Phe Lys Ala Ser Thr Lys Asn Ala Glu Gln
1 5 10 15
Ala Pro Pro Ala Pro Pro Pro Ala Lys Leu Ala Pro Pro Pro Arg Leu
20 25 30
Gln Leu Glu Gly Arg Gln Ser Val Met Ser Glu Lys Pro Pro Ser Ser
35 40 45
Thr Ser Gly Asn Asp Val Asp Leu Gln Pro Pro Thr Pro Arg Phe His
50 55 60
Ser Arg Pro Gln Ser Ser Ser Gly Arg Ser Thr Pro Ser Thr Gln Ser
65 70 75 80
Ser Met Phe Leu Asp Asp Ile Lys His Glu Val Met Val Asn Tyr Leu
85 90 95
Tyr Gln Gln Gln Cys Ser Gln Leu Trp Val Ser Asp Gly Ser Gly Glu
100 105 110
Ile Glu Gly Val Leu Leu Arg Lys Ala Arg Gly His Tyr Met Ala Cys
115 120 125
Pro Pro Gln Leu Ala Ser Ser Pro Phe Ala Leu Ala Cys Ala Ala Leu
130 135 140
Asn Val Gln Cys Ala Met Thr Val Asn Ser Arg Val Ile Lys Thr Phe
145 150 155 160
Leu Gln Trp Ser Pro Asp Ala Val Asp Val Pro Leu Met Asn Gly Leu
165 170 175
Arg Val Gln Ile Leu Pro Thr Ile Asp Asp Leu Pro Arg Ala Arg Lys
180 185 190
Tyr Gln Phe Ala Ala Phe Val Ala Ser Glu Gly Leu Leu Val Val Trp
195 200 205
Asp Asp Asp Ala Leu His Leu Val Ala Arg Ala Lys Ala Ile Glu Ser
210 215 220
Glu Leu Met Glu Leu Val Trp Lys Ala Gly Asn Val Asp Glu Glu Gly
225 230 235 240
Gly Asp Glu Lys Gly Gly Gln Pro Val Thr Glu Val Glu Ile Asp Glu
245 250 255
Glu Ser Gly Glu Ile Lys Pro Glu Lys Arg Pro Ile His Leu Gln Asn
260 265 270
Thr Val Leu Val Ser Leu Thr Leu Ala Leu Val Thr Val Ser Leu Gly
275 280 285
Ala Ala Trp Arg Gln Leu Ala Ile Glu Val Ser Val Asp Ser Asn Tyr
290 295 300
Ile Arg Leu Ala Leu Val Ala Leu Ala Pro Val Gln Val Phe Phe Thr
305 310 315 320
Leu Phe Phe Ala Gln Val Ile Ile Gly Cys Leu Ala Gln Ile Phe Gly
325 330 335
Pro Ile Arg Gln Leu Thr Ile Asn Ser Lys Phe Tyr Ser Ala Arg Pro
340 345 350
Pro Pro Arg Leu Gln Ser Ala Val Leu Pro His Val Thr Ile Gln Cys
355 360 365
Pro Val Tyr Lys Glu Gly Leu Gln Gly Val Ile Met Pro Thr Val Lys
370 375 380
Ser Ile Lys Gln Ala Met Ser Thr Tyr Glu Leu Gln Gly Gly Ser Ala
385 390 395 400
Asn Met Phe Ile Asn Asp Asp Gly Leu Gln Leu Ile Ser Glu Glu Asp
405 410 415
Arg Leu Ala Arg Ile Glu Phe Tyr Ala Asp Asn Ser Ile Gly Trp Val
420 425 430
Ala Arg Pro Lys His Gly Glu Asn Gly Phe Thr Arg Lys Gly Lys Phe
435 440 445
Lys Lys Ala Ser Asn Met Asn Phe Ala Leu Met Ile Ser Cys Lys Val
450 455 460
Glu Glu Lys Leu Gln Ala Ile Glu Arg His Pro Gly Trp Ser Gln Asn
465 470 475 480
Asp Glu Ala Leu Ala Tyr Glu Glu Ala Leu Lys Glu Val Leu Glu Ala
485 490 495
Asp Gly Arg Ala Trp Ala Asp Gly Asn Ile Arg Met Gly Asp Tyr Ile
500 505 510
Leu Leu Ile Asp Ser Asp Thr Arg Val Pro Ala Asp Cys Leu Leu Asp
515 520 525
Ala Val Ser Glu Met Glu Gln Ser Pro Asp Val Gly Ile Met Gln Phe
530 535 540
Ser Ser Gly Val Met Gln Val Val His Thr Tyr Phe Glu Asn Gly Ile
545 550 555 560
Thr Phe Phe Thr Asn Leu Ile Tyr Ser Ala Ile Arg Tyr Thr Val Ser
565 570 575
Asn Gly Asp Val Ala Pro Phe Val Gly His Asn Ala Ile Leu Arg Trp
580 585 590
Ser Ala Ile Gln Gln Val Ala Tyr Gln Asp Glu Asp Gly Tyr Asp Lys
595 600 605
Phe Trp Ser Glu Ser His Val Ser Glu Asp Phe Asp Met Ser Leu Arg
610 615 620
Leu Gln Cys Asn Gly Tyr Ile Ile Arg Leu Ala Ala Trp Ala Gly Glu
625 630 635 640
Gly Phe Lys Glu Gly Val Ser Leu Thr Val Tyr Asp Glu Leu Ala Arg
645 650 655
Trp Glu Lys Tyr Ala Tyr Gly Cys Asn Glu Leu Leu Phe His Pro Ile
660 665 670
Arg Thr Trp Leu Trp Arg Gly Pro Phe Thr Pro Leu Phe Arg Arg Phe
675 680 685
Leu Phe Ser Asn Ile Arg Phe Thr Ser Lys Val Thr Val Ile Ser Tyr
690 695 700
Ile Gly Thr Tyr Tyr Ala Ile Gly Ala Ala Trp Ile Leu Thr Ala Val
705 710 715 720
Asn Tyr Phe Val Met Gly Trp Phe Asn Gly Tyr Leu Asp Lys Tyr Tyr
725 730 735
Val Asp Ser Trp Gln Val Trp Phe Ser Ile Ile Ile Val Phe Asn Gly
740 745 750
Leu Gly Asn Ile Ala Leu Ala Val Met Arg Tyr Arg Val Gly Glu Arg
755 760 765
Gly Leu Leu Tyr Ala Leu Phe Glu Asn Phe Met Trp Thr Leu Met Leu
770 775 780
Ala Ile Phe Leu Gly Gly Leu Ser Leu His Val Ser Gln Ala Leu Leu
785 790 795 800
Ala His Met Phe Glu Ile Asn Met Thr Trp Gly Ala Lys Ser Lys Glu
805 810 815
Ala Glu Phe Ser Asn Phe Phe Ile Glu Val Pro Lys Val Leu Lys Lys
820 825 830
Phe Lys Phe Ser Met Leu Phe Ser Leu Ile Phe Ile Ala Gly Met Ile
835 840 845
Ile Leu Ala Gln Ala Pro Phe Val Pro Phe Asp Trp Arg Ile Lys Asp
850 855 860
Phe Val Ala Ile Leu Pro Met Ala Thr Val Ala Ala Ser His Phe Leu
865 870 875 880
Leu Pro Leu Ala Leu Asn Pro Ala Leu Met Thr Phe Ser Trp
885 890
<210> 5
<211> 364
<212> PRT
<213> Hypocrea jecorina
<400> 5
Met Lys Gly Leu Ile Leu Val Gly Gly Phe Gly Thr Arg Leu Arg Pro
1 5 10 15
Leu Thr Leu Thr Leu Pro Lys Pro Leu Val Glu Phe Cys Asn Lys Pro
20 25 30
Met Ile Val His Gln Ile Glu Ala Leu Val Ala Ala Gly Val Thr Asp
35 40 45
Ile Val Leu Ala Val Asn Tyr Arg Pro Glu Ile Met Glu Lys Phe Leu
50 55 60
Ala Glu Tyr Glu Glu Lys Tyr Asn Ile Asn Ile Glu Phe Ser Val Glu
65 70 75 80
Ser Glu Pro Leu Asp Thr Ala Gly Pro Leu Lys Leu Ala Glu Arg Ile
85 90 95
Leu Gly Lys Asp Asp Ser Pro Phe Phe Val Leu Asn Ser Asp Val Ile
100 105 110
Cys Asp Tyr Pro Phe Lys Glu Leu Leu Glu Phe His Lys Ala His Gly
115 120 125
Asp Glu Gly Thr Ile Val Val Thr Lys Val Glu Glu Pro Ser Lys Tyr
130 135 140
Gly Val Val Val His Lys Pro Asn His Pro Ser Arg Ile Asp Arg Phe
145 150 155 160
Val Glu Lys Pro Val Glu Phe Val Gly Asn Arg Ile Asn Ala Gly Met
165 170 175
Tyr Ile Phe Asn Pro Ser Val Leu Lys Arg Ile Glu Leu Arg Pro Thr
180 185 190
Ser Ile Glu Lys Glu Thr Phe Pro Ala Met Val Ala Asp Asn Gln Leu
195 200 205
His Ser Phe Asp Leu Glu Gly Phe Trp Met Asp Val Gly Gln Pro Lys
210 215 220
Asp Phe Leu Ser Gly Thr Cys Leu Tyr Leu Ser Ser Leu Thr Lys Lys
225 230 235 240
Gly Ser Lys Glu Leu Thr Pro Pro Thr Glu Pro Tyr Val His Gly Gly
245 250 255
Asn Val Met Ile His Pro Ser Ala Lys Ile Gly Lys Asn Cys Arg Ile
260 265 270
Gly Pro Asn Val Thr Ile Gly Pro Asp Val Val Val Gly Asp Gly Val
275 280 285
Arg Leu Gln Arg Cys Val Leu Leu Lys Gly Ser Lys Val Lys Asp His
290 295 300
Ala Trp Val Lys Ser Thr Ile Val Gly Trp Asn Ser Thr Val Gly Arg
305 310 315 320
Trp Ala Arg Leu Glu Asn Val Thr Val Leu Gly Asp Asp Val Thr Ile
325 330 335
Gly Asp Glu Ile Tyr Val Asn Gly Gly Ser Val Leu Pro His Lys Ser
340 345 350
Ile Lys Ala Asn Val Asp Val Pro Ala Ile Ile Met
355 360
<210> 6
<211> 534
<212> PRT
<213> Hypocrea jecorina
<400> 6
Met Asp Gly Met Met Ser Gln Pro Met Gly Gln Gln Ala Phe Tyr Phe
1 5 10 15
Tyr Asn His Glu His Lys Met Ser Pro Arg Gln Val Ile Phe Ala Gln
20 25 30
Gln Met Ala Ala Tyr Gln Met Met Pro Ser Leu Pro Pro Thr Pro Met
35 40 45
Tyr Ser Arg Pro Asn Ser Ser Cys Ser Gln Pro Pro Thr Leu Tyr Ser
50 55 60
Asn Gly Pro Ser Val Met Thr Pro Thr Ser Thr Pro Pro Leu Ser Ser
65 70 75 80
Arg Lys Pro Met Leu Val Asp Thr Glu Phe Gly Asp Asn Pro Tyr Phe
85 90 95
Pro Ser Thr Pro Pro Leu Ser Ala Ser Gly Ser Thr Val Gly Ser Pro
100 105 110
Lys Ala Cys Asp Met Leu Gln Thr Pro Met Asn Pro Met Phe Ser Gly
115 120 125
Leu Glu Gly Ile Ala Ile Lys Asp Ser Ile Asp Ala Thr Glu Ser Leu
130 135 140
Val Leu Asp Trp Ala Ser Ile Ala Ser Pro Pro Leu Ser Pro Val Tyr
145 150 155 160
Leu Gln Ser Gln Thr Ser Ser Gly Lys Val Pro Ser Leu Thr Ser Ser
165 170 175
Pro Ser Asp Met Leu Ser Thr Thr Ala Ser Cys Pro Ser Leu Ser Pro
180 185 190
Ser Pro Thr Pro Tyr Ala Arg Ser Val Thr Ser Glu His Asp Val Asp
195 200 205
Phe Cys Asp Pro Arg Asn Leu Thr Val Ser Val Gly Ser Asn Pro Thr
210 215 220
Leu Ala Pro Glu Phe Thr Leu Leu Ala Asp Asp Ile Lys Gly Glu Pro
225 230 235 240
Leu Pro Thr Ala Ala Gln Pro Ser Phe Asp Phe Asn Pro Ala Leu Pro
245 250 255
Ser Gly Leu Pro Thr Phe Glu Asp Phe Ser Asp Leu Glu Ser Glu Ala
260 265 270
Asp Phe Ser Ser Leu Val Asn Leu Gly Glu Ile Asn Pro Val Asp Ile
275 280 285
Ser Arg Pro Arg Ala Cys Thr Gly Ser Ser Val Val Ser Leu Gly His
290 295 300
Gly Ser Phe Ile Gly Asp Glu Asp Leu Ser Phe Asp Asp Glu Ala Phe
305 310 315 320
His Phe Pro Ser Leu Pro Ser Pro Thr Ser Ser Val Asp Phe Cys Asp
325 330 335
Val His Gln Asp Lys Arg Gln Lys Lys Asp Arg Lys Glu Ala Lys Pro
340 345 350
Val Met Asn Ser Ala Ala Gly Gly Ser Gln Ser Gly Asn Glu Gln Ala
355 360 365
Gly Ala Thr Glu Ala Ala Ser Ala Ala Ser Asp Ser Asn Ala Ser Ser
370 375 380
Ala Ser Asp Glu Pro Ser Ser Ser Met Pro Ala Pro Thr Asn Arg Arg
385 390 395 400
Gly Arg Lys Gln Ser Leu Thr Glu Asp Pro Ser Lys Thr Phe Val Cys
405 410 415
Asp Leu Cys Asn Arg Arg Phe Arg Arg Gln Glu His Leu Lys Arg His
420 425 430
Tyr Arg Ser Leu His Thr Gln Glu Lys Pro Phe Glu Cys Asn Glu Cys
435 440 445
Gly Lys Lys Phe Ser Arg Ser Asp Asn Leu Ala Gln His Ala Arg Thr
450 455 460
His Ser Gly Gly Ala Ile Val Met Asn Leu Ile Glu Glu Ser Ser Glu
465 470 475 480
Val Pro Ala Tyr Asp Gly Ser Met Met Ala Gly Pro Val Gly Asp Asp
485 490 495
Tyr Ser Thr Tyr Gly Lys Val Leu Phe Gln Ile Ala Ser Glu Ile Pro
500 505 510
Gly Ser Ala Ser Glu Leu Ser Ser Glu Glu Gly Glu Gln Gly Lys Lys
515 520 525
Lys Arg Lys Arg Ser Asp
530
<210> 7
<211> 1042
<212> PRT
<213> Hypocrea jecorina
<400> 7
Met Asp Tyr Thr Gln Tyr His Ala Leu Gly His Gly Glu Val Leu Asp
1 5 10 15
Pro Asn Asp Pro Asn Lys Thr Ser Ala Pro Ala Ala Pro Gln Phe Gln
20 25 30
Pro Pro Ser Ser Pro Tyr Val Pro Pro Gly Ser Pro Tyr Gly Ala Pro
35 40 45
Pro Tyr His Gly Gly His Gln Ala Pro Pro Met Ala Met Pro Pro Pro
50 55 60
Ser Thr Pro Gly Tyr Gly Pro Pro Gln Gly Gln Ser Phe Pro Gly Ser
65 70 75 80
Pro Met Pro Ser Gln Asp Ala Gly Leu Ala Ala Gln Phe Gly Gly Met
85 90 95
Ser Leu Gly Ala Asp Ala Gly Gly Ala Ala Ala Arg Lys Lys Lys Lys
100 105 110
Asp Arg His Ala Tyr His Ser Val Glu Pro Thr Gly Ser Ser Gln Ala
115 120 125
Phe Asn Gly Leu Pro Pro Gly Thr Pro Ala Glu Gln Phe Leu Asn Val
130 135 140
Asn Asn Pro Gln Gly Ile Pro Ala Leu Gly Gly Gln Phe Gly Ser Pro
145 150 155 160
Leu Ala Ser Pro Met Gly Thr Pro His Met Ala Asn Pro Gly Gln Phe
165 170 175
Pro Ala Pro Thr Ser Pro Phe Thr Pro Ser Ala Pro Val Ser Pro Ala
180 185 190
Glu Phe Ala Ser Arg Phe Gly Ser Pro Asp Ala Ala Thr Ser Ile Gly
195 200 205
Ser Ala Gly Pro Ser Gln Val Ser Pro Asp Asp Met Pro Ser Ile Pro
210 215 220
Ala Ser Arg Asp Ala Ile Gln Glu His Phe Phe Lys Asn Val Tyr Pro
225 230 235 240
Thr Phe Glu Arg His Val Pro Pro Pro Ala Thr Val Ser Phe Val Ala
245 250 255
Phe Asp Gln Gly Asn Ala Ser Pro Lys Phe Thr Arg Leu Thr Leu Asn
260 265 270
Asn Ile Pro Thr Thr Ala Glu Gly Leu His Ala Thr Gly Leu Pro Leu
275 280 285
Gly Met Leu Ile Gln Pro Leu Ala Pro Leu Gln Ala Gly Glu Ala Glu
290 295 300
Ile Pro Val Leu Asp Phe Gly Asp Ala Gly Pro Pro Arg Cys Arg Arg
305 310 315 320
Cys Arg Ala Tyr Ile Asn Pro Phe Met Met Phe Arg Ser Gly Gly Asn
325 330 335
Lys Phe Val Cys Asn Leu Cys Ser Tyr Pro Asn Glu Thr Pro Pro Glu
340 345 350
Tyr Phe Cys Ala Val Ser Pro Gln Gly Val Arg Leu Asp Arg Asp Gln
355 360 365
Arg Pro Glu Leu His Arg Gly Thr Val Glu Phe Val Val Pro Lys Glu
370 375 380
Tyr Trp Thr Arg Glu Pro Val Gly Leu Arg Trp Leu Phe Val Ile Asp
385 390 395 400
Val Thr Gln Glu Ser Tyr Asn Lys Gly Phe Met Glu Thr Phe Cys Glu
405 410 415
Gly Ile Leu Ala Ala Leu Tyr Gly Gly Asn Asp Glu Glu Asn Asp Glu
420 425 430
Asp Gly Glu Pro Lys Arg Arg Ile Pro Lys Gly Ala Lys Val Gly Phe
435 440 445
Ile Thr Tyr Asp Lys Asp Ile His Phe Tyr Asn Ile Asn Pro His Leu
450 455 460
Asp Gln Ala His Met Met Ile Met Pro Asp Leu Glu Asp Pro Phe Leu
465 470 475 480
Pro Leu Gly Glu Gly Leu Phe Val Asp Pro Tyr Glu Ser Lys Ala Ile
485 490 495
Ile Thr Ser Leu Leu Thr Arg Leu Pro Glu Met Phe Ser Thr Ile Lys
500 505 510
Asn Pro Glu Pro Ala Leu Leu Ala Thr Leu Asn Ala Ala Val Ala Ala
515 520 525
Leu Glu Ala Thr Gly Gly Lys Val Val Cys Ser Cys Ser Thr Leu Pro
530 535 540
Thr Trp Gly Pro Gly Arg Leu Phe Met Arg Asp Asp Gly Asn His Pro
545 550 555 560
Gly Gly Glu Leu Asp Lys Lys Leu Tyr Thr Thr Glu His Pro Ala Trp
565 570 575
Lys Lys Val Ser Glu Lys Met Ala Ser Ser Gly Ile Gly Val Asp Phe
580 585 590
Phe Leu Ala Ala Pro Ser Gly Gly Tyr Leu Asp Ile Ala Thr Ile Gly
595 600 605
His Val Ala Ala Thr Thr Gly Gly Glu Thr Phe Tyr Tyr Pro Asn Phe
610 615 620
Ile Ala Pro Arg Asp Gly Ala Arg Leu Ser Met Glu Ile Thr His Ala
625 630 635 640
Ile Thr Arg Glu Thr Gly Phe Gln Ala Leu Met Lys Val Arg Cys Ser
645 650 655
Thr Gly Leu Gln Val Ala Ala Tyr His Gly Asn Phe Val Gln His Thr
660 665 670
Phe Gly Ala Asp Leu Glu Ile Gly Val Ile Asp Ala Asp Lys Ala Leu
675 680 685
Gly Val Ser Phe Ser His Asp Gly Lys Leu Asp Pro Lys Leu Asp Ala
690 695 700
His Phe Gln Thr Ala Leu Leu Tyr Thr Thr Ala Ser Gly Gln Arg Arg
705 710 715 720
Val Arg Cys Ser Asn Val Ile Ala Ser Val Ser Asp Thr Ser Lys Glu
725 730 735
Ser Asn Thr Lys Glu Leu Ala Ile Arg Gln Cys Leu Lys Phe Val Asp
740 745 750
Gln Asp Ala Val Val Gly Ile Phe Ala Lys Glu Ala Ser Thr Lys Leu
755 760 765
Ala Thr Thr Ser Ala Asn Leu Gln Asp Val Arg Asn Trp Leu Thr Glu
770 775 780
Arg Thr Ile Asp Ile Met Ala Tyr Tyr Lys Lys His Ser Ala Asn Gln
785 790 795 800
Phe Pro Pro Ser Gln Leu Val Met Pro Glu Arg Leu Lys Glu Phe Cys
805 810 815
Met Tyr Met Leu Gly Met Leu Lys Cys Arg Ala Phe Lys Gly Gly Ile
820 825 830
Glu Asn Ser Asp Arg Arg Val His Glu Leu Arg Met Val Arg Ser Met
835 840 845
Gly Pro Leu Glu Leu Ser Leu Tyr Leu Tyr Pro Arg Met Ile Ala Leu
850 855 860
His Asn Leu Gln Pro Glu Glu Gly Phe Ala Asp Pro Glu Thr Gly His
865 870 875 880
Leu Lys Met Pro Pro Ser Val Arg Thr Ser Phe Ser Arg Val Glu Pro
885 890 895
Gly Gly Val Tyr Leu Val Asp Asn Gly Gln Gln Cys Leu Leu Trp Phe
900 905 910
His Ala Gln Thr Ser Pro Asn Leu Ile Thr Asp Leu Phe Gly Glu Gly
915 920 925
His Asp Ser Leu Lys Gly Leu Asp Pro Tyr Thr Ser Thr Leu Pro Val
930 935 940
Leu Glu Thr His Leu Ser Ala Gln Val Arg Asn Ile Ile Glu Phe Leu
945 950 955 960
Lys Ser Met Arg Gly Ser Lys Gly Met Thr Ile Gln Leu Ala Arg Gln
965 970 975
Gly Ile Asp Gly Ala Glu Tyr Glu Phe Ala Arg Met Leu Val Glu Asp
980 985 990
Arg Asn Asn Glu Ala Lys Ser Tyr Val Asp Trp Leu Val His Ile His
995 1000 1005
Arg Gly Val Gln Leu Glu Leu Ser Gly Gln Arg Lys Lys Glu Gly Asp
1010 1015 1020
Gly Glu Ala Thr Ala Val Met Ala Asn Phe Ala Gly Leu Arg Pro Ala
1025 1030 1035 1040
Tyr Trp
<210> 8
<211> 668
<212> PRT
<213> Hypocrea jecorina
<400> 8
Arg Gly Arg Ser Pro Ser Ala Gly Gly Phe Gln Ser Asp Ile Asn Gln
1 5 10 15
Ser His Ser Pro Ala Arg Ser Pro Leu Ala Pro Thr Asn Glu Gln Pro
20 25 30
Ser Ala Gly Leu Gly Val Gly Leu Gly Gln Gln Gln Gln Arg Ala Phe
35 40 45
Ala Ala Pro Leu His Pro Asn Tyr Asp Ser Phe Gly Ala Asn Gly Phe
50 55 60
Leu Gly Ala Gln Ala Asn Ala Val Asp Pro Thr Asn Gly Phe Asp Pro
65 70 75 80
Ser Ala Ser Phe Gly Gln Gln Pro Ala Thr Gly Pro Asp Ser Thr Leu
85 90 95
Ser Leu Asn Ala Gln Ala Gln His Asn Tyr Leu Ser Pro Asn Leu His
100 105 110
Asp Gly Asp Phe Ser Leu Phe Pro Ser Ala Ala Glu Gln Gly Asp Gln
115 120 125
Tyr Asn Ala Pro Leu Phe Glu Gln Pro Pro Leu Gly Asp Leu Asn Ala
130 135 140
Met Thr Ser Pro His Ser His Gln Ser Pro Thr Pro Pro Gln Leu Phe
145 150 155 160
Gln Pro Asp Ser Leu Gln Ser Pro Pro Phe Asn Arg His Gln Phe Ser
165 170 175
Ser Pro Pro Thr His Ser Arg Asn Ala Ser Leu Gly Pro Glu Ala Ala
180 185 190
Leu Leu Pro Ser Gln Ile Gly Asp Trp Thr Gln Pro Gln Phe Gln Gly
195 200 205
His Arg Arg Thr Pro Ser Glu Tyr Ser Asp Val Ser Ser Val Ala Pro
210 215 220
Ser Pro His Leu Val Ser Ser Asp Thr Phe Asp Ala Asp Gln Ser Gly
225 230 235 240
His Ser Pro Leu Gln Arg Pro Ala Asp Val Ser Leu Tyr Gln Glu Val
245 250 255
Leu Gly Ile Gly Ser Phe Ser Leu Ala Asp His Gly Ser Pro Gly Tyr
260 265 270
His Gly Arg Ser Pro Ser His Ser Pro Ala Ile Ser Pro Arg Ile Met
275 280 285
Pro Gln Gln Met Pro Asp Thr Met Gln Pro Ser Phe Asn Leu Ile Pro
290 295 300
Pro Asn Gly Gly Phe Asp Gly Val Ser Gly Tyr Pro Asp Leu Gln Pro
305 310 315 320
Ser His Glu Ser Phe Pro Ser Leu Ser Gly Gly Met Gly Gly Asp Met
325 330 335
His Gln Met Ala Pro Pro Ala Ile Asn Ile Asp Phe Ala Pro Thr Asn
340 345 350
Ser Arg Gln Gly Ser Phe Glu Pro Pro Lys Ser Gln Met Asp Gln Asp
355 360 365
Ser Leu Thr Pro Pro Glu Arg Gly Arg Pro Lys Ser Arg Pro Arg Ala
370 375 380
Val Thr Asp Pro Phe His Pro Gly Ser Gly Ile Leu Pro Pro Gly Asn
385 390 395 400
Leu Gly Ser Ser Leu Gly Val Asp Leu Ala Ala Arg Ser Asp Thr Ala
405 410 415
Ser Arg Ser Leu Ser Pro Leu Asp Arg Ser Gly Thr Ser Ser Pro Ala
420 425 430
Ser Arg Arg Arg Gln Ser Thr Ser Ser Val Pro Asn Asn Val Ile Ala
435 440 445
Leu Arg Leu Ala Asp Pro Glu Tyr Gln Asn Ser Gln Glu Ala Gly Thr
450 455 460
Ser Lys Arg Met Gln Lys His Pro Ala Thr Phe Gln Cys Thr Leu Cys
465 470 475 480
Pro Lys Arg Phe Thr Arg Ala Tyr Asn Leu Arg Ser His Leu Arg Thr
485 490 495
His Thr Asp Glu Arg Pro Phe Val Cys Thr Val Cys Gly Lys Ala Phe
500 505 510
Ala Arg Gln His Asp Arg Lys Arg His Glu Ser Leu His Ser Gly Glu
515 520 525
Lys Lys Phe Val Cys Lys Gly Asp Leu Lys Thr Gly Gly Gln Trp Gly
530 535 540
Cys Gly Arg Arg Phe Ala Arg Ala Asp Ala Leu Gly Arg His Phe Arg
545 550 555 560
Ser Glu Ala Gly Arg Ile Cys Ile Lys Pro Leu Leu Asp Glu Glu Met
565 570 575
Val Glu Arg Gln Arg Gln Trp Gln Glu Gln Arg Met Gln Gln Asn Met
580 585 590
Ala Gln Asn Met Ala Asn Pro Gln Val Met Gly Met Asp Ala Gly Pro
595 600 605
Ala Tyr Pro Met Asp Ala Ser Gly Asn Tyr Thr Leu Pro Gln Ala Leu
610 615 620
Leu Ala Gln Tyr Pro Ala Leu Ala Gln Met Asn Trp Ser Ala Thr Asp
625 630 635 640
Met Gly Gly Gly Leu Asp Asp Glu Leu Ser Gly Arg Ser Ser Phe Asp
645 650 655
Ala Ser Asp Tyr Asp Asp Gly Asp Asp Gly Gly Tyr
660 665
<210> 9
<211> 540
<212> PRT
<213> Hypocrea jecorina
<400> 9
Met Ser Leu Ser Lys Leu Ser Val Ser Leu Leu Ala Leu Ala Gly Ser
1 5 10 15
Ala Ile Ala Gly Asp Leu Pro Ser Ile Thr Ala Lys Gly Ser Lys Phe
20 25 30
Phe Tyr Pro Asn Gly Thr Gln Phe Phe Ile Lys Gly Val Ala Tyr Gln
35 40 45
Gln Asp Val Gly Gln Ala Gly Ser Thr Asp Ser Ser Thr Ser Thr Phe
50 55 60
Ile Asp Pro Leu Ser Ser Glu Ala Asn Cys Lys Arg Asp Val Pro Leu
65 70 75 80
Leu Lys Gln Leu Gly Thr Asn Val Ile Arg Thr Tyr Ala Ile Asp Pro
85 90 95
Lys Ala Asp His Ser Ala Cys Met Lys Leu Leu Asn Asp Ala Gly Ile
100 105 110
Tyr Val Phe Ser Asp Leu Gly Glu Pro Ser Leu Ser Ile Asn Arg Asp
115 120 125
Thr Pro Ala Trp Asn Thr Glu Leu Phe Asp Arg Tyr Lys Ala Val Val
130 135 140
Asp Glu Met Ser Gln Tyr Pro Asn Val Ile Gly Tyr Phe Ala Gly Asn
145 150 155 160
Glu Val Ser Asn Ala Lys Asn Asn Thr Gly Ala Ser Ala Tyr Val Lys
165 170 175
Ala Ala Val Arg Asp Thr Lys Ala Tyr Ile Lys Ser Lys Lys Tyr Arg
180 185 190
Trp Gln Gly Val Gly Tyr Ala Ala Asn Asp Asp Val Asp Ile Arg Ala
195 200 205
Glu Ile Ala Asp Tyr Phe Asn Cys Gly Asp Gln Asp Glu Ala Ile Asp
210 215 220
Phe Trp Gly Tyr Asn Ile Tyr Ser Trp Cys Gly Gln Ser Ser Met Gln
225 230 235 240
Lys Ser Gly Tyr Asp Glu Gln Thr Thr Phe Phe Ser Asn Tyr Ser Val
245 250 255
Pro Val Phe Phe Ala Glu Tyr Gly Cys Asn Leu Pro Ser Gly Ala Ala
260 265 270
Ala Arg Ile Phe Gln Glu Thr Ala Ala Leu Tyr Ser Asp Glu Met Thr
275 280 285
Lys Val Phe Ser Gly Gly Ile Val Tyr Met Tyr Phe Glu Glu Asp Asn
290 295 300
Asp Tyr Gly Leu Val Lys Val Asn Asn Gly Ala Val Ser Lys Leu Lys
305 310 315 320
Asp Phe Ser Ala Leu Gln Thr Gln Val Thr Lys Ala Asp Pro Lys Gly
325 330 335
Val Asp Ala Asp Asp Tyr Lys Pro Thr Asn Lys Pro Ala Ser Cys Pro
340 345 350
Ala Leu Thr Asp Asp Trp Gln Ala Ile Asn Ser Leu Pro Pro Thr Pro
355 360 365
Asp Ala Ser Leu Cys Thr Cys Met Gln Ser Ser Leu Ser Cys Val His
370 375 380
Ala Asp Asp Leu Asp Thr Lys Asp Phe Gly Asp Ile Phe Gly Phe Ile
385 390 395 400
Cys Gly Lys Ser Pro Glu Val Cys Ala Gly Ile Asn Gly Asp Pro Ser
405 410 415
Thr Gly Val Tyr Gly Ala Tyr Ser Met Cys Glu Asp Ala Ala Lys Leu
420 425 430
Asp Tyr Val Leu Asp Ala Tyr Tyr Gln Ser Gln Lys Lys Ala Ser Thr
435 440 445
Ala Cys Asp Phe Asn Gly Gln Ala Gln Val Val Ser Pro Lys Ala Ala
450 455 460
Ser Thr Cys Ser Ala Ala Leu Ala Ser Ala Ser Ala Ile Asn Lys Gln
465 470 475 480
Ala Ala Thr Ala Thr Ala Pro Val Gly Ala Gly Ser Thr Ser Gly Ser
485 490 495
Lys Gly Ala Ala Thr Ser Thr Asn Ala Ala Val Ala Gly Arg Pro Val
500 505 510
Ser His Leu Leu Ser Met Gly Glu Ile Ser Val Ala Leu Tyr Met Gly
515 520 525
Val Ala Met Leu Ala Gly Gly Ala Met Ile Val Leu
530 535 540
<210> 10
<211> 874
<212> PRT
<213> Hypocrea jecorina
<400> 10
Met Ala Arg Arg Glu Ser Leu Ser Glu Ile Arg Ala Ala Asn Pro Glu
1 5 10 15
Leu Phe Leu Thr Gly Asn Ile Ile Ser Ala Thr Phe Asn Ile Pro His
20 25 30
Ala Val Thr Tyr His Lys Gly Gly Ala Trp Asp Leu Lys Pro Arg Arg
35 40 45
Gly Gln Ser Ala Leu Ile Asp Ser Phe Ala Tyr Leu Ser Ser Asp Ala
50 55 60
Thr Pro Trp Asn His Thr Val Val Ala Trp Thr Gly Glu Ile Ala Asn
65 70 75 80
Pro Asp Asn Asp Pro Leu Ser Pro Pro Asp Thr Pro Ser Ala Ala Ala
85 90 95
Thr Thr Ile Gly Ala Ala Asn Ser Leu Ser Ala Pro Val Pro Ile Asp
100 105 110
Ala Thr Thr Arg Leu Pro Thr Pro Pro Pro Val Asp Gly Leu Trp Ile
115 120 125
Pro Lys Ala Asp Gln Thr Arg Leu Glu His Gln Leu Ser His Ser Thr
130 135 140
Thr Ile Arg Thr Val Pro Val Trp Leu Ala Asp Gln Ser Glu Ala Thr
145 150 155 160
Asp Asp Gly Ile Met Leu Lys Asp Gln Ala Arg Trp Arg Arg Tyr Ala
165 170 175
Glu His Asp Leu Tyr Thr Leu Phe His Tyr Lys Gln His Glu Pro Thr
180 185 190
Asp Gly Arg Lys Glu Arg Ala Gln Trp Ala Asp Tyr Tyr Arg Met Asn
195 200 205
Gln Lys Phe Ala Asn Lys Ile Ile Glu Ile Tyr Lys Pro Gly Asp Val
210 215 220
Val Ile Val His Asp Tyr Tyr Leu Met Leu Leu Pro Ser Met Leu Arg
225 230 235 240
Gln Arg Ala Pro Lys Met Tyr Ile Ser Phe Phe Leu His Ser Pro Phe
245 250 255
Pro Ser Ser Glu Phe Leu Arg Cys Leu Pro Arg Arg Lys Glu Val Leu
260 265 270
Glu Gly Val Leu Gly Ala Asn Leu Val Gly Phe Gln Ser Tyr Ser Tyr
275 280 285
Ser Arg His Phe Leu Ser Cys Cys Thr Arg Ile Leu Gly Phe Pro Ser
290 295 300
Asp Thr Leu Gly Ile Asp Ala Tyr Gly Ser Arg Val Gln Val Gly Val
305 310 315 320
Phe Pro Ile Gly Ile Asp Ala Ala Lys Val Glu Thr Ala Ala Trp Ala
325 330 335
Asp Thr Val Asn Glu Lys His Ala Ala Val Leu Lys Met Tyr Glu Gly
340 345 350
Lys Lys Ile Ile Val Gly Arg Asp Arg Leu Asp Ser Val Arg Gly Val
355 360 365
Ala Gln Lys Leu Gln Ala Phe Glu Arg Phe Leu Glu Leu Tyr Pro His
370 375 380
Trp Arg Glu Lys Val Val Leu Ile Gln Val Thr Ser Pro Thr Ser Ile
385 390 395 400
Glu Ala Glu Lys Gly Asp Pro Glu Asn Lys Asn Ala Ser Arg Val Asn
405 410 415
Glu Leu Ile Thr Lys Ile Asn Gly Glu Tyr Gly Ser Leu Gly Phe Ser
420 425 430
Pro Val Gln His Tyr Pro Gln Tyr Leu Ser Gln Ala Glu Tyr Phe Ala
435 440 445
Leu Leu Arg Ala Ala Asp Ile Gly Leu Ile Thr Ser Val Arg Asp Gly
450 455 460
Met Asn Thr Thr Ser Leu Glu Tyr Val Val Cys Gln Lys Asp Ser Asn
465 470 475 480
Gly Pro Leu Ile Leu Ser Glu Phe Ser Gly Thr Ala Gly Ser Leu Arg
485 490 495
Asp Ala Ile His Ile Asn Pro Trp Asp Leu Thr Gly Val Ala Glu Lys
500 505 510
Ile Asn Ala Ala Leu Glu Met Ser Glu Glu Glu Arg Val Lys Met Gln
515 520 525
Thr Ser Leu Tyr Thr His Val Thr Thr Gln Asn Val Gln Ser Trp Ile
530 535 540
Thr Lys Phe Ile Arg Lys Phe His Ala Ala Leu Ser Glu Thr Asn Ser
545 550 555 560
Val Thr Ser Thr Pro Leu Leu Asp Arg Ala Leu Leu Leu Ser Arg Tyr
565 570 575
Arg Ala Ala Lys Lys Arg Leu Phe Met Phe Asp Tyr Asp Gly Thr Leu
580 585 590
Thr Pro Ile Val Arg Glu Pro Ser Ala Ala Val Pro Ser Glu Arg Ile
595 600 605
Ile Arg Tyr Leu Gln Ser Leu Ala Ser Asp Pro Arg Asn Ala Val Trp
610 615 620
Ile Ile Ser Gly Arg Asp Gln Glu Phe Leu Gln Gln His Leu Gly His
625 630 635 640
Ile Pro Arg Ile Gly Phe Ser Ala Glu His Gly Ser Phe Met Arg Asp
645 650 655
Pro Gly Ser Asp Glu Trp Val Asn Leu Ala Glu Lys Phe Asp Met Gly
660 665 670
Trp Gln Ala Glu Val Met Glu Val Phe Gln Arg Tyr Thr Asp Lys Val
675 680 685
Pro Gly Ser Phe Ile Glu Arg Lys Arg Cys Ala Leu Thr Trp His Tyr
690 695 700
Arg Leu Ala Glu Pro Glu Gln Gly Leu His Met Ser Arg Glu Cys His
705 710 715 720
Arg Glu Leu Glu Thr Gly Ile Ala Gln Arg Trp Glu Val Glu Val Met
725 730 735
Pro Gly Lys Ala Asn Ile Glu Val Arg Pro Thr Phe Ile Asn Lys Gly
740 745 750
Glu Ile Ala Lys Arg Leu Val Ala Thr Tyr His Asn Pro Gly Ala Ala
755 760 765
Pro Thr Asp Lys Asp Pro Tyr Pro Gly Lys Ile Glu Phe Ala Leu Cys
770 775 780
Ser Gly Asp Asp Phe Thr Asp Glu Asp Met Phe Arg Ser Leu Asn Gly
785 790 795 800
Ala Cys Gly Thr Ile Leu Glu Asp Gln His Val Phe Thr Val Thr Val
805 810 815
Gly Ala Ser Thr Lys Val Thr Leu Ala Lys Trp His Leu Leu Glu Pro
820 825 830
Glu Asp Val Ile Glu Cys Val Gly Leu Leu Ala Gly Ala Gly Asp Pro
835 840 845
Ala Ser Leu Glu Arg Val Gly Glu Val Asn Leu Ala Ala Leu Ser Gln
850 855 860
Val Glu Gly His Ile Pro Ala Glu Glu Leu
865 870
<210> 11
<211> 997
<212> PRT
<213> Aspergillus clavatus
<400> 11
Met Thr Met Leu Ser Pro Thr Ser Asp His Pro Gln Gly Ala Ser Met
1 5 10 15
Lys Asp Ile Glu Asn Pro Gly Asn Asp Ser Pro Ala Leu Glu Gly Ser
20 25 30
Thr Gln Ala Glu Lys Thr Val Asp Asn Pro Ser Arg Ser Pro Thr Pro
35 40 45
Gln Leu Gln Thr Ala Glu Leu Ala Gln Val Leu Ser Pro Leu Ala Val
50 55 60
Arg Gln Thr Gln Ser Ile Ser Thr Arg Ser Gln His Asn Arg Leu Glu
65 70 75 80
Tyr Leu Cys Leu Pro Asn Ala Thr Asn Arg Gly Lys Leu Ser Arg Ser
85 90 95
Leu Ala Arg Arg Ala Thr Leu Leu Gly Trp Phe Asp Gln Ala Ala Thr
100 105 110
Gln Ser Gly Gln Glu Ser Gln Ser Ser Val Cys Val Ala Val Lys Leu
115 120 125
Pro Asp Asp Gly Tyr Ser Phe Ser Pro Ser Asn Ile Thr Pro Ala Leu
130 135 140
Ser Lys Ala Ile Thr Arg Leu Asn Glu Met Ala Val Val Ala Leu Ser
145 150 155 160
Ser Arg Val Val Asp Lys Gly Leu Ser Gly Ile Leu Pro Gly Gln Lys
165 170 175
Ser Phe Leu Val Glu Ser Thr Ser Thr Arg Ile Pro Ile Val Ala Thr
180 185 190
Leu Asp Asp Val Glu Pro Thr Leu Ala His Tyr Ser Arg Ala Cys Ile
195 200 205
Val Met Glu Gln Lys Ile Val Leu Val Trp Ser His Asp Thr Ala Gly
210 215 220
Ile Leu Asn Val Ala Tyr Asp Val Glu Thr Gln Leu Gly Gly Gln Ser
225 230 235 240
Pro Lys Ile Ser Asn Ala Thr Thr Pro Arg Ile Ser Gly Arg Ser Thr
245 250 255
Pro Met Asp Pro Tyr Arg Thr Asp Asp Leu Gln Lys Pro Ala Asn Val
260 265 270
Leu Gln Pro Val Arg Gly Ala Leu Asp Glu Lys Gln Ala Ile Tyr Ser
275 280 285
Lys Ala Val Ala Leu Glu Glu Gly Glu Asp Asn Glu Val Pro Asp Leu
290 295 300
Glu Arg Asn Ala Ala Pro Arg Pro Val Leu Leu Val His Thr Val Lys
305 310 315 320
Ile Ser Leu Ala Ile Met Leu Val Ile Val Thr Gln Ser Leu Gly Val
325 330 335
Ala Arg Leu Leu Asn Glu Phe Gln Trp Asp Gly Gln Tyr Thr Arg Phe
340 345 350
Ala Leu Val Val Thr Ile Pro Pro Leu Ala Leu Phe Ser Leu Phe Phe
355 360 365
Phe Ile Val Leu Val Thr Ser Val Phe Gln Leu Phe Leu Pro Ala Ser
370 375 380
Phe Cys Leu Lys Asn Ser Lys Phe His Ser Gly Asp Thr Glu Asp Ser
385 390 395 400
Ser Ala Val Lys Pro Asn Pro Lys Ala His Gly Glu Tyr Glu Leu Pro
405 410 415
His Ile Thr Ile Gln Met Pro Val Tyr Lys Glu Gly Leu Lys Gly Val
420 425 430
Ile Val Pro Thr Met Ile Ser Val Leu Ala Ala Val Gln Tyr Tyr Glu
435 440 445
Glu Gln Gly Gly Thr Ala Ser Val Phe Val Asn Asp Asp Gly Met Gln
450 455 460
Val Ile Gln Ser Asp Leu Ala Glu Ala Arg Lys Gln Tyr Tyr Arg Glu
465 470 475 480
Asn Gly Ile Gly Phe Thr Ala Arg Pro Pro Asn Lys Lys Ser Pro Val
485 490 495
Gln Lys Gly Gly Trp Gly Ser Trp Phe Arg Lys Ser Lys Pro Ala Thr
500 505 510
Thr Glu Pro Ala Asp Ser Glu Glu Pro Glu Gly Pro Tyr Thr Pro Gln
515 520 525
Ala Leu Ala Asn Lys Ile Gly Phe Glu Arg Lys Gly Lys Phe Lys Lys
530 535 540
Ala Ser Asn Met Asn Tyr Gly Leu Ala Phe Ser Leu Arg Val Glu Asp
545 550 555 560
Glu Leu Ala Arg Leu Thr Gln Ile Glu Thr Glu Arg Arg Gly Cys Thr
565 570 575
Val Asp Asp Leu Thr Ala Glu Asp Asp Asp Arg Leu Tyr Gln Gln Ala
580 585 590
Leu Asp Asn Met Leu Ala Ala Asp Glu Glu Arg Thr Trp Ala Glu Gly
595 600 605
Asn Ile Arg Ile Gly Glu Leu Ile Leu Leu Ile Asp Cys Asp Thr Arg
610 615 620
Val Pro Val Asp Cys Leu Leu Tyr Gly Ala Leu Glu Met His Glu Ser
625 630 635 640
Pro Glu Val Ala Ile Leu Gln His Gly Ser Gly Val Met Gln Val Val
645 650 655
His Asn Val Phe Glu Asn Gly Ile Thr Tyr Phe Thr Asn Val Val Tyr
660 665 670
Thr Ala Ile Lys Tyr Gly Val Gly Ser Gly Asp Val Ser Pro Phe Val
675 680 685
Gly His Asn Ala Phe Leu Arg Trp Arg Ala Leu Gln Ser Ile Glu Phe
690 695 700
Val Asp Pro Ser Asp Gly Gln Thr Lys Trp Trp Ser Asp Thr His Val
705 710 715 720
Ser Glu Asp Phe Asp Ile Ser Leu Arg Leu Gln Met Gln Gly Met Val
725 730 735
Val Arg Leu Ala Thr Tyr His Asn Gly Glu Phe Lys Glu Gly Val Ser
740 745 750
Leu Thr Leu Tyr Asp Glu Leu Thr Arg Trp Glu Lys Tyr Ala Tyr Gly
755 760 765
Cys Asn Glu Leu Val Phe His Pro Phe Tyr Gln Trp Val Tyr Lys Gly
770 775 780
Pro Val Thr Arg Leu Phe Leu Arg Phe Leu Trp Ser Asn Met Pro Val
785 790 795 800
Thr Ser Lys Val Thr Ile Ile Ala Tyr Ile Phe Thr Tyr Tyr Ala Ile
805 810 815
Gly Ser Gly Met Leu Leu Ala Thr Val Asn Tyr Val Ile Leu Gly Leu
820 825 830
Phe Asp Ser Asp Ile Asp His Leu Tyr Leu Pro Ser Trp Gly Ile Trp
835 840 845
Cys Ser Leu Val Val Val Phe Asn Gly Phe Ser Ser Ile Ala Phe Ser
850 855 860
Met Val Arg His Gln Leu Lys Glu Glu Thr Phe Trp Arg Ala Leu Leu
865 870 875 880
Asp Ala Ile Lys Trp Leu Pro Phe Leu Ile Ile Tyr Phe Gly Gly Ile
885 890 895
Ser Leu Asn Cys Ala Lys Ala Ile Leu Cys His Ala Phe Ser Ile Asn
900 905 910
Leu Glu Trp Ala Ser Thr Ala Lys Glu Met Gly Pro Thr Gly Phe Tyr
915 920 925
Ile Gly Met Asp Lys Met Val Arg Arg Phe Lys Trp Thr Trp Ala Ile
930 935 940
Cys Leu Val Leu Ala Gly Val Met Ile Tyr Phe Ala Val Gly Ala Pro
945 950 955 960
Trp Gly Trp Thr Ile Thr Pro Gly Pro Tyr Ser Thr Ala Asn Val Ala
965 970 975
Ile Ala Pro Leu Ala Ile Gln Ile Cys Ser Ala Ser Phe Leu Pro Phe
980 985 990
Phe Leu Gly Leu Asn
995
<210> 12
<211> 988
<212> PRT
<213> Penicillium oxalicum
<400> 12
Met Glu Glu Trp Pro Arg Asn Ala Asp Glu Pro Tyr Gly Ser Gln Arg
1 5 10 15
Tyr Gln Glu Asp Val Gln Asp Leu Val Ser Leu Pro Ser Arg Ser Ser
20 25 30
Thr Pro His Leu Asp Arg Ala Glu Ile Gly Arg Val Leu Ser Pro Ser
35 40 45
Val Gln Pro Gly Arg Asn Ser Arg Ser Arg Arg Ser Asn Pro Ser Ile
50 55 60
Ala His Ser Phe Thr Ser Pro Ser Ile Ser Glu Ser Gly Glu Gly Glu
65 70 75 80
Asp Pro Ser Ser Thr Ala Arg Tyr Leu Ala Arg Arg Ala Thr Leu Leu
85 90 95
Gly Trp Phe Asp Glu Val Asp Val Glu Asp Gly Arg Asn Ser Trp Ser
100 105 110
Ser Thr Cys Ile Ser Leu Arg Arg Ala Asp Asn Glu Tyr Thr Phe Phe
115 120 125
Pro Tyr Asn Val Asn Pro Ser Leu Ile Asp Ala Ile Thr Arg Leu Gly
130 135 140
Glu Thr Ala Ala Met Ala Met Ser Ser Arg Phe Thr Ser Met Leu Ile
145 150 155 160
Asp Ser Ile Leu Pro Gly Gln Lys Ser Leu Val Val Glu Ser Thr Ser
165 170 175
Ala Arg Ile Pro Val Val His Ser Leu Asn Asp Val Ser Ser Asn Leu
180 185 190
Val His Phe Ala Arg Ala Cys Ile Val Val Gln Glu Lys Leu Val Leu
195 200 205
Ile Trp Ser His Asn Ala Gly Thr Ile Leu His Val Ala His Asp Val
210 215 220
Glu Arg Gln Leu Gly Lys Lys Ser Pro Arg Ile Ser Thr Ala Thr Thr
225 230 235 240
Pro Arg Ala Ser Gly Arg Ser Ser Pro Phe Asp Val Asp Ala Asp Val
245 250 255
Ala Pro Ser Thr Gln Ile Ser Ile Lys Ala Lys Ile Asp Ser Phe Pro
260 265 270
Val Arg Gly Ala Leu Asp Glu Lys His Glu Val Tyr Ser Lys Ala Val
275 280 285
Ala Leu Glu Glu Gly Thr Val Glu Asp Asp Thr Pro Val Asp Leu Glu
290 295 300
Gly Asn Leu Pro Pro Arg Pro Ala His Arg Ile His Ala Val Lys Ile
305 310 315 320
Ser Leu Ala Ile Met Leu Val Ile Leu Thr Gln Ser Leu Gly Val Ser
325 330 335
Arg Leu Val Asn Glu Phe Ala Trp Asp Gly Ser Phe Thr Arg Phe Ala
340 345 350
Leu Val Val Thr Ile Pro Pro Leu Ala Leu Phe Ser Leu Phe Phe Phe
355 360 365
Ile Val Leu Val Thr Ser Ala Phe Gln Leu Phe Leu Pro Ala Ser Phe
370 375 380
Cys Leu Lys Asn Ser Lys Phe His Ser Ala Ile Lys Pro Asn Pro Arg
385 390 395 400
Phe His Arg Asp Tyr Glu Leu Pro His Ile Thr Val Gln Met Pro Val
405 410 415
Tyr Lys Glu Gly Leu Lys Gly Val Ile Val Pro Thr Met Met Ser Val
420 425 430
Leu Ala Ala Val Gln Tyr Tyr Glu Glu Gln Gly Gly Thr Ala Ser Val
435 440 445
Phe Ile Asn Asp Asp Gly Met Gln Cys Ile Gln Pro Glu Leu Ala Glu
450 455 460
Ala Arg Lys Gln Tyr Tyr Arg Glu Asn Gly Ile Gly Tyr Thr Ala Arg
465 470 475 480
Leu Pro Asn Arg Lys Thr Ala Ser Lys Lys Lys Arg Gly Phe Gly Trp
485 490 495
Phe Arg Lys Ala Lys Ser Ala Glu Gly Asp Ala Glu Thr Glu Ala Glu
500 505 510
Glu Asp Thr Ser Ser Pro Gln Ala Ile Ala Asn Lys Ile Gly Phe Glu
515 520 525
Arg Lys Gly Lys Phe Lys Lys Ala Ser Asn Met Asn Tyr Gly Leu Ala
530 535 540
Phe Ser Asn Arg Val Glu Asp Glu Leu Ala Arg Leu Ala Asp Leu Glu
545 550 555 560
Cys Gln Gln Arg Gly Cys Ser Asn Asp Asp Leu Thr Phe Glu Asp Asp
565 570 575
Asp Arg Leu Tyr Gln Gln Ala Leu Ser Asn Met Leu Ala Glu Asp Glu
580 585 590
Gly Arg Thr Trp Ala Glu Gly Asn Val Arg Ile Gly Glu Ile Ile Leu
595 600 605
Ile Ile Asp Cys Asp Thr Arg Val Pro Val Asp Cys Leu Leu Tyr Gly
610 615 620
Ala Leu Glu Met His Glu Ser Pro Glu Val Ala Ile Val Gln His Gly
625 630 635 640
Ser Gly Val Met Gln Val Val His Asn Met Phe Glu Asn Gly Ile Thr
645 650 655
Tyr Phe Thr Asp Val Val Tyr Thr Ala Ile Lys Tyr Gly Val Gly Ser
660 665 670
Gly Asp Val Ser Pro Phe Val Gly His Asn Ala Phe Leu Arg Trp Lys
675 680 685
Ala Leu Gln Ser Ile Gln Phe Val Asp Pro Ala Asp Gly Gln Thr Lys
690 695 700
Trp Trp Ser Asp Ala His Val Ser Glu Asp Phe Asp Ile Ser Leu Arg
705 710 715 720
Leu Gln Met Gln Gly Met Thr Val Arg Leu Ala Thr Tyr His Asn Gly
725 730 735
Gly Phe Lys Glu Gly Val Ser Leu Thr Leu Tyr Asp Glu Leu Thr Arg
740 745 750
Trp Glu Lys Tyr Ala Tyr Gly Cys Asn Glu Leu Val Phe Asn Pro Phe
755 760 765
Tyr Gln Trp Pro Tyr Lys Gly Pro Val Thr Arg Leu Phe Leu Arg Phe
770 775 780
Leu Trp Ser Asn Met Pro Val Thr Ser Lys Val Thr Ile Ile Ala Tyr
785 790 795 800
Ile Phe Thr Tyr Tyr Ala Ile Ala Ser Gly Met Met Leu Ser Val Val
805 810 815
Asn Tyr Val Ile Val Gly Leu Phe Asn Ser Glu Val Asp His Ile Tyr
820 825 830
Leu Arg Ser Trp Gly Ile Trp Ile Ser Leu Val Val Val Phe Asn Gly
835 840 845
Val Ala Ser Val Ala Phe Ser Met Ala Arg His Gln Leu Lys Glu Met
850 855 860
Val Phe Trp Lys Ala Leu Leu Lys Ser Ala Leu Trp Leu Pro Phe Leu
865 870 875 880
Val Val Phe Phe Gly Gly Ile Ser Leu Asn Cys Ala Lys Ala Ile Leu
885 890 895
Cys His Ala Phe Ser Ile Asn Ile Glu Trp Ala Ser Thr Ala Lys Glu
900 905 910
Pro Gly Pro Ser Gly Phe Phe Ile Gly Leu Asp Lys Met Val Lys Gln
915 920 925
Phe Lys Tyr Thr Trp Ala Ile Cys Leu Phe Leu Ala Ala Val Met Ile
930 935 940
Phe Met Ala Leu Gly Thr Pro Trp Gly Trp Gln Ile Lys Pro Gly Glu
945 950 955 960
Tyr Ser Thr Ala Ser Ile Ala Ile Gly Pro Leu Ala Ile Gln Ile Cys
965 970 975
Asn Ala Ala Ile Leu Pro Leu Ile Leu Gly Leu Asn
980 985
<210> 13
<211> 920
<212> PRT
<213> Talaromyces cellulolyticus
<400> 13
Met Ser Ser Leu Phe Pro Thr Arg Trp Ser Phe Arg Gly His Lys Thr
1 5 10 15
Pro Lys Gly Asp Gly Thr Pro Thr Glu Thr Ala Ser Gln Arg Asp Ser
20 25 30
Leu Pro Val Ser Glu Ser Gly Arg Ser Ser Arg Gly Gln Gly Tyr Phe
35 40 45
Asp Arg Arg His Val Asn Asn Ser Ile Asp Asp Ala Ser Lys Tyr Lys
50 55 60
Ala Met Ile Lys Phe Phe His Val Arg Leu Thr Ala Tyr Gln Trp Leu
65 70 75 80
Pro Pro Pro Thr His Pro Gln His Ser Ser Thr Gly Val Phe Leu Arg
85 90 95
Arg Ser Arg Gly Ile Tyr Met Ser Glu Pro Glu Asp Ile Asn Pro Leu
100 105 110
Leu Leu Ala Ala Ile Gln Arg Ile Asn Ala Thr Ile Ala Phe Thr Met
115 120 125
Met Thr Glu Thr Thr Ser Ile Ile Thr Ser Gln Leu Ala Pro Gly Gln
130 135 140
Thr Glu Leu Ile Leu Pro Asn Gly Tyr Gln Val Gln Ile Ile Glu Ser
145 150 155 160
Tyr Ala Asp Ile Val Gly Ser His Ser Asn Met Val Lys Lys Tyr Gln
165 170 175
Tyr Ala Ala Leu Ile Arg Glu Glu Gln Leu Leu Leu Val Trp Asn Asp
180 185 190
Asp Leu Asn Ala Ile Leu Asn His Ala Ala Asp Val Glu Gly Lys Leu
195 200 205
Leu Ser Leu Ile Trp Gly Ser Pro Ile Pro Thr Phe Asn Leu Gln Ala
210 215 220
Val Pro Met Met Thr Pro Gly Glu Ser Val Val Ala Ser Pro Asn Asp
225 230 235 240
Ser Leu Tyr His Leu Ala Leu Glu Pro Arg Glu Ser Pro Ala Ala Ala
245 250 255
Glu Asp Ser Gly Thr Ser Arg Asp Ala Ser Pro Arg Arg Met Ile Asn
260 265 270
Glu Glu Val Lys Arg Pro Lys Glu Ser Leu Glu Arg Pro Leu Ala Val
275 280 285
Thr Ser Ala Ile Phe Val Gly Met Ala Gly Met Leu Leu Val Ile Leu
290 295 300
Leu Leu Gly Phe Gly Ile Ser Asn Leu Leu Leu Glu Tyr Ser Val Asp
305 310 315 320
Gly Gly Ala Met Arg Phe Ala Leu Thr Ala Thr Ile Pro Phe Phe Leu
325 330 335
Leu Phe Ser Ile Phe Phe Met Ile Val Ile Phe Thr Asp Ile Phe Gln
340 345 350
Ala Val Gly Pro Val Lys Thr Leu Lys Ser Asn Ser Arg Phe Tyr Ser
355 360 365
Pro Ile Ala Pro Asp Leu Lys Thr Ala Tyr Ser Leu Gly Phe Thr Pro
370 375 380
Pro Arg Val Thr Ile Gln Met Pro Ile Tyr Thr Glu Ser Leu Glu Gly
385 390 395 400
Val Ile Lys Pro Thr Ile Ser Ser Leu Lys Thr Ala Ile Ser His Tyr
405 410 415
Glu Ser His Gly Gly Thr Ala Asn Ile Phe Ile Asn Asp Asp Gly Phe
420 425 430
Ala Leu Leu Ser Glu Glu Gln Gln His Glu Arg Ile Asn Phe Tyr His
435 440 445
Asp Asn Asn Ile Gly Trp Val Ala Arg Pro Lys Asn Asn Glu Asp Gly
450 455 460
Tyr Ile Arg Lys Gly Lys Phe Lys Lys Ala Ser Asn Met Asn Phe Ala
465 470 475 480
Leu Asn Val Ser Asn Lys Val Glu Met Glu Leu Ile Gln Arg Met Ala
485 490 495
Pro Thr Leu Glu Lys Ser Asp Met Val Asp Pro Met Glu Glu Glu Leu
500 505 510
Val Tyr Arg Glu Ala Phe Asp His Val Ile Gln Ser Asp Pro Arg Ile
515 520 525
Arg Gly Ala Gly Gly Asp Ile Arg Val Gly Glu Phe Ile Leu Ile Val
530 535 540
Asp Ser Asp Thr Arg Ile Pro Ala Asp Cys Leu Leu Tyr Gly Ala Ala
545 550 555 560
Glu Met Phe Leu Ser Pro Glu Val Ala Ile Ile Gln His Ser Thr Ser
565 570 575
Val Met Gln Val Ser Gln Asp Tyr Phe Glu Asn Gly Ile Thr Tyr Phe
580 585 590
Thr Asn Leu Ile Tyr Ser Ala Ile Arg Phe Ala Val Gly Ser Gly Glu
595 600 605
Thr Ala Pro Phe Val Gly His Asn Ala Phe Leu Arg Trp Gln Ala Val
610 615 620
Gln Ser Val Gly Arg Pro Asp Asp Gly Tyr Val Ser Phe Trp Ser Glu
625 630 635 640
Ser His Val Ser Glu Asp Phe Asp Ile Ala Leu Arg Leu Gln Ile Gln
645 650 655
Gly Asn Ile Ile Arg Leu Ala Ser Tyr His Asn Asp Glu Phe Lys Glu
660 665 670
Gly Val Ser Leu Thr Ile Tyr Asp Glu Leu Ser Arg Trp Glu Lys Tyr
675 680 685
Ala Tyr Gly Cys Asn Glu Leu Val Phe Asn Pro Val His Thr Trp Phe
690 695 700
Tyr Arg Gly Pro Leu Thr Lys Leu Phe Met Thr Phe Leu Trp Ser Asn
705 710 715 720
Leu Gln Leu Ser Ser Lys Ile Thr Ile Leu Gly Tyr Ile Ser Ser Tyr
725 730 735
Tyr Ala Leu Ala Ser Gly Phe Pro Leu Thr Val Leu Asn Tyr Phe Leu
740 745 750
Val Gly Trp Phe Glu Gly Tyr Leu Asp Lys Phe Tyr Met Glu Ser Trp
755 760 765
Lys Val Phe Leu Ser Leu Leu Val Val Phe Ser Ala Ala Gly Asn Val
770 775 780
Cys Leu Ala Ile Ile Arg Tyr Arg Leu Gly Glu Lys Pro Leu Leu Ala
785 790 795 800
Ser Leu Val Glu Asn Phe Met Trp Met Pro Met Phe Ala Ile Phe Phe
805 810 815
Gly Gly Leu Ser Phe His Leu Ser Leu Ala Ile Leu Ser His Met Phe
820 825 830
Gly Ile Asn Met Ser Trp Gly Thr Thr Ala Lys Glu Lys Asp Asp Ser
835 840 845
Asn Phe Phe Lys Glu Ile Pro Lys Ile Phe Lys Ser Phe Lys Trp Met
850 855 860
Tyr Ala Val Val Leu Pro Phe Phe Pro Ala Met Ile Tyr Leu Ala Cys
865 870 875 880
Phe Ala Pro Asn Gly Trp Thr Ile Thr Glu Val Gly Ala Ile Val Pro
885 890 895
Met Ser Val Thr Leu Ala Ser His Ala Leu Leu Pro Leu Leu Leu Asn
900 905 910
Pro Ser Leu Met Val Phe Asn Tyr
915 920
<210> 14
<211> 884
<212> PRT
<213> Fusarium oxysporum
<400> 14
Met Gly Ile Gly Ser Tyr Phe Lys Ala Asp Ile Pro Pro Gln Thr Pro
1 5 10 15
Ile Gly Pro Pro Pro Arg Arg Pro Ser His Arg Pro Ser Met Ser Leu
20 25 30
His Ala Pro Ile Ile Glu Glu Lys Ile Pro Pro Ala Ala Val Val Glu
35 40 45
Leu His Ser Ala Ala Gly Pro Lys Phe Thr Ala Gly Pro Pro Ser Ile
50 55 60
Ala Pro Ser Ser Lys Ser Gly Asn Ser Asn Leu Leu Asp Asp Ile Lys
65 70 75 80
His Glu Val Met Val Asn Tyr Leu Tyr Gln Gln Gln Cys Ser Gln Leu
85 90 95
Trp Val Gly Asp Gly Ser Gly Glu Ile Glu Gly Val Leu Leu Arg Lys
100 105 110
Ser Arg Gly Gln Tyr Met Ala Cys Pro Pro Gln Leu Gly Gln Ser Pro
115 120 125
Phe Ala Ile Ala Cys Thr Ala Leu Asn Val Gln Cys Ala Met Thr Val
130 135 140
Asn Ser Arg Val Ile Lys Thr Phe Leu Gln Trp Ser Pro Asp Ala Val
145 150 155 160
Asp Val Pro Leu Met Asn Gly Leu Arg Val Gln Ile Leu Pro Thr Val
165 170 175
Asn Asp Leu Pro Arg Ala Arg Lys His Gln Phe Ala Ala Phe Ile Ala
180 185 190
Ser Asp Gly Leu Leu Val Val Trp Asp Asp Asp Ala Leu Asn Leu Met
195 200 205
Ala Arg Ala Lys Ile Ile Glu Ser Glu Leu Met Glu Leu Val Trp Asn
210 215 220
Ser Gly Gln Ser Val Asp Glu Asp Glu Arg Asp Ser Thr Ile Ala Ala
225 230 235 240
Glu Tyr Glu Ile Asp Glu Glu Ser Gly Glu Ile Lys Pro Glu Ala Arg
245 250 255
Pro Val His Leu Gln Asn Ala Val Leu Val Ser Leu Thr Leu Leu Leu
260 265 270
Val Met Ala Ser Leu Gly Ala Ala Trp Arg Gln Leu Ala Val Glu Ile
275 280 285
Ala Ile Asp Gly Asp Tyr Lys Arg Leu Gly Leu Val Ala Leu Phe Pro
290 295 300
Ile Gln Ile Phe Phe Ser Leu Phe Phe Ala Gln Val Ile Val Gly Cys
305 310 315 320
Leu Ala Gln Ile Phe Gly Pro Ile Arg Gln Leu Thr Ile Asn Ser Lys
325 330 335
Phe Tyr Ser Ala Arg Pro Pro Arg Arg Leu Gln Gly Ala Thr Leu Pro
340 345 350
His Ile Thr Ile Gln Cys Pro Val Tyr Lys Glu Gly Leu Asn Ala Val
355 360 365
Ile Leu Pro Thr Val Lys Ser Ile Lys Gln Ala Met Ser Thr Tyr Glu
370 375 380
Leu Gln Gly Gly Ser Ala Asn Met Phe Ile Asn Asp Asp Gly Leu Gln
385 390 395 400
Leu Leu Ser Glu Glu Glu Arg Asp Ala Arg Ile Asp Phe Tyr Ala Asp
405 410 415
Asn Ser Ile Gly Trp Val Ala Arg Pro Lys His Gly Glu Asp Gly Phe
420 425 430
Ile Arg Lys Gly Lys Phe Lys Lys Ala Ser Asn Met Asn Phe Gly Leu
435 440 445
Met Ile Ser Cys Lys Val Glu Glu Arg Leu Gln Leu Ile Lys Arg Pro
450 455 460
Ala Asp Trp Ser Gln Ser Asp Glu Ala Leu Ala Tyr Glu Gln Ala Leu
465 470 475 480
Lys Asp Val Leu Glu Glu Asn Gly Arg Ala Trp Ala Asp Gly Asn Ile
485 490 495
Arg Val Gly Asp Tyr Ile Leu Leu Ile Asp Ser Asp Thr Arg Val Pro
500 505 510
Thr Asp Cys Leu Leu Asp Ser Val Ser Glu Met Glu Gln Ser Pro Asp
515 520 525
Val Gly Ile Met Gln Phe Ser Ser Gly Val Met Gln Val Val His Thr
530 535 540
Tyr Phe Glu Asn Gly Ile Thr Phe Phe Thr Asp Leu Ile Tyr Thr Ala
545 550 555 560
Ile Arg Phe Thr Val Ser Asn Gly Asp Val Ala Pro Phe Val Gly His
565 570 575
Asn Ala Ile Leu Arg Trp Ser Ala Ile Gln Gln Val Ala Tyr Gln Asp
580 585 590
Glu Asp Gly Tyr Asp Lys Phe Trp Ser Glu Ser His Val Ser Glu Asp
595 600 605
Phe Asp Met Ser Leu Arg Leu Gln Cys Asn Gly Tyr Ile Ile Arg Leu
610 615 620
Ala Ala Trp Ala Gly Asp Gly Phe Lys Glu Gly Val Ser Leu Thr Val
625 630 635 640
Tyr Asp Glu Leu Ala Arg Trp Glu Lys Tyr Ala Phe Gly Cys Asn Glu
645 650 655
Leu Leu Phe Asn Pro Ile Arg Thr Trp Leu Trp Arg Gly Pro Phe Thr
660 665 670
Pro Leu Phe Arg Arg Phe Cys Phe Ser Asn Ile Arg Phe Thr Ser Lys
675 680 685
Ile Thr Val Val Ser Tyr Ile Gly Thr Tyr Tyr Ala Ile Gly Ala Ala
690 695 700
Trp Ile Met Thr Thr Ala Asn Tyr Phe Leu Met Gly Trp Phe Asn Gly
705 710 715 720
Tyr Leu Asp Lys Tyr Tyr Leu Asp Ser Trp Gln Val Trp Phe Ser Ile
725 730 735
Ile Leu Val Phe Asn Gly Leu Gly Asn Leu Ala Leu Ala Ile Met Arg
740 745 750
Tyr Arg Ser Gly Glu Arg Thr Leu Gly Tyr Ala Ile Tyr Glu Asn Phe
755 760 765
Lys Trp Thr Leu Met Leu Ala Val Phe Leu Gly Gly Leu Ser Leu His
770 775 780
Val Ser Gln Ala Leu Leu Ala His Met Phe Glu Ile Asp Met Ser Trp
785 790 795 800
Gly Ser Thr Ser Lys Glu Ala Glu Phe Ser Asn Phe Phe Ile Glu Val
805 810 815
Pro Lys Val Leu Lys Lys Phe Arg Val Ser Met Thr Leu Ser Leu Leu
820 825 830
Ala Ile Val Ala Leu Ile Ile Met Ala Thr Ala Asp Phe Ile Pro His
835 840 845
Tyr Trp Arg Ile Asn Asp Phe Val Ala Ile Leu Pro Met Ala Thr Val
850 855 860
Ala Gly Ser His Leu Leu Leu Pro Leu Ala Leu Asn Pro Ala Leu Met
865 870 875 880
Thr Phe Ser Trp
<210> 15
<211> 885
<212> PRT
<213> Myceliophthora thermophila
<400> 15
Met Gly Ile Gly Asp Tyr Phe Lys Ala Glu Lys Leu Gly Ser Lys Pro
1 5 10 15
Thr Pro Thr Pro Ala Ser Pro Pro Arg Glu His Gly Arg His Gln Gln
20 25 30
Gln Pro Ser Ala Ser Glu Asp His Pro Ala Pro Ser Val Gln Pro Ala
35 40 45
Ser Glu Leu Gln Pro Pro Thr Pro Arg Phe Ser Ser Arg Pro Gln Ser
50 55 60
Ile Ser Gly Arg Ser Val Arg Ser Thr Gly Ser Ser Val Leu Asp Glu
65 70 75 80
Ile Lys His Glu Val Met Val Asn Tyr Leu Tyr Gln Gln Gln Cys Ser
85 90 95
His Leu Trp Ile Ser Asp Gly Ser Gly Glu Ile Glu Gly Val Leu Leu
100 105 110
Arg Lys Ala Arg Gly Gln Tyr Met Ala Cys Pro Pro Gln Leu Val Asn
115 120 125
Ser Pro Leu Ala Ala Ala Cys Thr Ala Leu Asn Val Gln Cys Ala Met
130 135 140
Thr Val Asn Ser Arg Val Ile Lys Thr Phe Leu Gln Trp Ser Pro Asp
145 150 155 160
Ala Val Asp Val Pro Leu Met Asn Gly Met Arg Val Gln Ile Leu Ala
165 170 175
Thr Ile Asp Asp Leu Pro Arg Ala Arg Lys His Gln Phe Ala Ala Phe
180 185 190
Val Ala Ser Glu Gly Leu Leu Ile Val Trp Asp Asp Asp Ala Leu His
195 200 205
Leu Val Gln Arg Ala Lys Ala Ile Glu Ser Glu Leu Met Glu Leu Val
210 215 220
Trp Lys Val Gly Ala Glu Asp Asn Glu Asp Glu Lys Gly Val Ala Ala
225 230 235 240
Val Glu Glu Pro Glu Val Asp Glu Glu Ser Gly Glu Leu Lys Pro Glu
245 250 255
Lys Arg Pro Val His Leu Leu Asn Ala Tyr Leu Val Ser Leu Ser Leu
260 265 270
Ile Leu Val Thr Val Ser Leu Gly Ala Ala Phe Arg Gln Leu Ala Ile
275 280 285
Glu Val Ser Val Asp Gly Asn Tyr Val Arg Leu Ala Leu Val Ala Leu
290 295 300
Phe Pro Val Gln Met Phe Phe Thr Leu Phe Phe Ala Gln Val Ile Val
305 310 315 320
Gly Cys Leu Ala Gln Ile Phe Gly Pro Ile Arg Gln Leu Thr Val Asn
325 330 335
Ser Lys Phe Tyr Ser Ala Arg Pro Pro Pro Arg Leu Arg Ser Ser Val
340 345 350
Leu Pro His Val Thr Val Gln Cys Pro Val Tyr Lys Glu Gly Leu Asn
355 360 365
Ala Val Ile Ala Pro Thr Val Lys Ser Ile Lys Gln Ala Met Ser Thr
370 375 380
Tyr Glu Leu Gln Gly Gly Ser Ala Asn Met Phe Ile Asn Asp Asp Gly
385 390 395 400
Leu Gln Leu Ile Ser Glu Glu Asp Arg Arg Ala Arg Ile Glu Phe Tyr
405 410 415
Ala Asp Asn Ser Ile Gly Trp Val Ala Arg Pro Lys His Gly Glu Asn
420 425 430
Gly Phe Gln Arg Arg Gly Lys Phe Lys Lys Ala Ser Asn Met Asn Phe
435 440 445
Ala Leu Met Ile Ser Cys Lys Val Glu Asp Lys Leu Ala Ala Ile Gln
450 455 460
Arg Thr Pro Asp Trp Thr Gln His Asp Glu Ala Leu Ala Tyr Glu Arg
465 470 475 480
Ala Leu Lys Glu Val Leu Glu Glu Asp Gly Arg Ala Trp Ala Asp Gly
485 490 495
Asn Ile Arg Ile Gly Asp Tyr Ile Leu Leu Val Asp Ser Asp Thr Arg
500 505 510
Val Pro Ala Asp Cys Leu Leu Asp Ala Val Ser Glu Met Glu Leu Ser
515 520 525
Pro Asp Val Gly Ile Met Gln Phe Ser Ser Gly Val Met Gln Val Val
530 535 540
His Thr Tyr Phe Glu Asn Gly Ile Thr Phe Phe Thr Asn Leu Ile Tyr
545 550 555 560
Ser Ala Ile Arg Tyr Thr Val Ser Asn Gly Asp Val Ala Pro Phe Val
565 570 575
Gly His Asn Ala Ile Leu Arg Trp Ser Ala Ile Gln Gln Val Ser Tyr
580 585 590
Glu Asp Glu Asp Gly Tyr Glu Lys Phe Trp Ser Glu Ser His Val Ser
595 600 605
Glu Asp Phe Asp Met Ser Leu Arg Leu Gln Cys Ala Gly Tyr Ile Ile
610 615 620
Arg Leu Ala Ala Trp Ala Gly Asp Gly Phe Lys Glu Gly Val Ser Leu
625 630 635 640
Thr Val Tyr Asp Glu Leu Ala Arg Trp Glu Lys Tyr Ala Tyr Gly Cys
645 650 655
Asn Glu Leu Leu Phe His Pro Ile Arg Lys Trp Ile Tyr Lys Gly Pro
660 665 670
Phe Thr Pro Leu Phe Arg Arg Phe Leu Phe Ser Asn Ile Arg Phe Thr
675 680 685
Ser Lys Val Thr Val Ile Ser Tyr Ile Gly Thr Tyr Tyr Ala Ile Ala
690 695 700
Ala Ala Trp Ile Met Thr Ser Ile Asn Tyr Phe Ile Met Gly Trp Phe
705 710 715 720
Asn Gly Tyr Leu Asp Lys Tyr Tyr Val Asp Ser Trp Gln Val Trp Phe
725 730 735
Ser Ile Ile Leu Val Phe Asn Gly Leu Gly Asn Ile Ala Leu Ala Val
740 745 750
Met Arg Tyr Arg Val Gly Glu Arg Ser Ile Leu Tyr Ala Leu Tyr Glu
755 760 765
Asn Phe Lys Trp Thr Phe Leu Leu Ala Val Phe Leu Gly Gly Leu Ser
770 775 780
Leu His Leu Ser Gln Ala Leu Leu Ala His Met Phe Glu Ile Asp Met
785 790 795 800
Thr Trp Gly Ala Thr Ala Lys Glu Ala Glu Phe Ser Asn Phe Phe Ile
805 810 815
Glu Val Pro Lys Val Leu Lys Lys Phe Lys Ile Ser Met Leu Phe Ala
820 825 830
Thr Ile Phe Ile Ala Gly Met Ile Ile Leu Ala Val Ala Pro Phe Ile
835 840 845
Pro Tyr Ser Trp His Ile Lys Asp Phe Val Ala Ile Leu Pro Met Ala
850 855 860
Thr Val Ala Ala Ser His Leu Leu Leu Pro Leu Val Leu Asn Pro Ala
865 870 875 880
Leu Met Thr Phe Ser
885
<210> 16
<211> 880
<212> PRT
<213> Neurospora crassa
<400> 16
Met Gly Ile Gly Ser Tyr Phe Lys Ala Lys Lys Pro Glu Pro Ala Gly
1 5 10 15
Gln Gln His Ala Ala Ser Thr Pro Ser Arg Gly Arg Gln Pro Ser Met
20 25 30
Gly Asn Thr Lys Ala Gly Gln Asp Asp Gly Asp Ile Leu Ala Pro Pro
35 40 45
Gln Ile Arg Tyr Gly Ser Arg Ser Arg Ser Ala Thr Arg Ser Met Met
50 55 60
Ser Ser Thr Ser Ser Val Ile Leu Glu Asp Ile Lys His Glu Val Met
65 70 75 80
Val Asn Tyr Leu Tyr Gln Gln Gln Cys Ser Tyr Leu Trp Val Ala Asn
85 90 95
Gly Ser Gly Glu Ile Glu Gly Val Leu Leu Arg Lys Ser Arg Gly Gln
100 105 110
Tyr Met Ala Cys Pro Pro Ala Leu Gly Asn Ser Pro Phe Ala Met Ala
115 120 125
Cys Ala Ala Leu Asn Val Gln Cys Ala Met Thr Val Asn Ser Arg Val
130 135 140
Ile Lys Thr Phe Leu Gln Trp Ser Pro Asp Ala Val Asp Val Pro Leu
145 150 155 160
Leu Asn Gly Leu Arg Val Gln Ile Leu Pro Thr Ile Glu Asp Leu Pro
165 170 175
Arg Ala Arg Lys His Gln Phe Ala Ala Phe Ile Ala Ser Glu Gly Leu
180 185 190
Leu Val Val Trp Asp Asp Asp Ala Leu His Leu Ile Pro Arg Ala Lys
195 200 205
Glu Ile Glu Ser Glu Leu Met Gln Leu Val Trp Lys Thr Gly Glu Pro
210 215 220
Gly Glu Met Asp Glu Lys Ala Asn Pro Ile Val Gly Ala Thr Glu Ile
225 230 235 240
Asp Glu Glu Ser Gly Glu Pro Arg Pro Glu Ala Arg Pro Val His Leu
245 250 255
Leu Asn Thr Tyr Leu Val Ser Ile Thr Met Ala Val Val Thr Val Ser
260 265 270
Leu Gly Ala Ala Trp Arg Gln Leu Ala Ile Glu Val Met Val Asp Gly
275 280 285
Asp Tyr Val Arg Leu Ala Leu Val Ala Leu Ala Pro Val Gln Ile Phe
290 295 300
Phe Thr Leu Phe Phe Ala Gln Val Ile Ile Gly Cys Leu Ala Gln Ile
305 310 315 320
Phe Gly Pro Ile Lys Gln Leu Ser Val Asn Ser Arg Phe Tyr Ser Ala
325 330 335
Lys Pro Pro Pro Arg Leu Gln Thr Ala Val Leu Pro His Val Thr Val
340 345 350
Gln Cys Pro Val Tyr Lys Glu Gly Leu Ser Gly Val Ile Ala Pro Thr
355 360 365
Val Lys Ser Ile Lys His Ala Met Ser Thr Tyr Glu Leu Gln Gly Gly
370 375 380
Ser Ala Asn Met Phe Ile Asn Asp Asp Gly Leu Gln Leu Leu Ser Glu
385 390 395 400
Glu Asp Arg Gln Ala Arg Ile Asp Phe Tyr Ala Asp His Ser Ile Gly
405 410 415
Trp Val Ala Arg Pro Arg His Gly Glu Asn Gly Phe Gln Arg Arg Gly
420 425 430
Lys Phe Lys Lys Ala Ser Asn Met Asn Tyr Ala Leu Met Ile Ser Cys
435 440 445
Lys Val Glu Glu Lys Leu Ala Gln Val Pro Arg His Ser Glu Trp Ser
450 455 460
Gln His Asp Glu Ala Gln Ala Tyr Glu Arg Ala Leu Lys Asp Val Leu
465 470 475 480
Glu Glu Asn Gly Arg Ala Trp Ala Asp Gly Asn Ile Arg Met Gly Asp
485 490 495
Tyr Ile Leu Leu Ile Asp Ser Asp Thr Arg Val Pro Ser Asp Cys Leu
500 505 510
Leu Asp Ala Val Ser Glu Met Glu Gln Ser Pro Asp Val Gly Ile Met
515 520 525
Gln Phe Ser Ser Gly Val Met Gln Val Val His Thr Tyr Phe Glu Asn
530 535 540
Gly Ile Thr Phe Phe Thr Asn Leu Ile Tyr Thr Ala Ile Arg Tyr Thr
545 550 555 560
Val Ser Asn Gly Asp Val Ala Pro Phe Val Gly His Asn Ala Ile Leu
565 570 575
Arg Trp Ser Ala Ile Gln Gln Val Ser Tyr Glu Asp Glu Asp Gly Tyr
580 585 590
Glu Lys Phe Trp Ser Glu Ser His Val Ser Glu Asp Phe Asp Met Ser
595 600 605
Leu Arg Leu Gln Cys Asn Asp Tyr Ile Ile Arg Leu Ala Ala Trp Ala
610 615 620
Gly Asp Gly Phe Lys Glu Gly Val Ser Leu Thr Val Tyr Asp Glu Leu
625 630 635 640
Ala Arg Trp Glu Lys Tyr Ala Tyr Gly Cys Asn Glu Leu Leu Phe Tyr
645 650 655
Pro Ile Arg Lys Trp Ile Trp Lys Gly Pro Phe Thr Pro Leu Phe Arg
660 665 670
Arg Phe Leu Phe Ser Asn Ile Arg Phe Thr Ser Lys Ile Thr Ile Ile
675 680 685
Ser Tyr Ile Gly Thr Tyr Tyr Ala Ile Gly Ala Ala Trp Ile Leu Thr
690 695 700
Ser Val Asn Tyr Phe Leu Met Gly Trp Tyr Asn Gly Phe Leu Asp Lys
705 710 715 720
Tyr Tyr Val Asp Ser Trp Gln Val Trp Phe Ser Ile Ile Leu Val Phe
725 730 735
Asn Gly Leu Gly Asn Val Ala Leu Ala Val Met Arg Tyr Arg Val Gly
740 745 750
Glu Arg Ser Ile Leu Gly Ser Ile Leu Glu Asn Phe Lys Trp Thr Leu
755 760 765
Met Leu Ala Ile Phe Leu Gly Gly Leu Ser Leu His Val Ser Gln Ala
770 775 780
Leu Leu Ala His Met Phe Glu Ile Asp Met Thr Trp Gly Ala Thr Ser
785 790 795 800
Lys Glu Ala Glu Phe Ser Asn Phe Phe Ile Glu Val Pro Lys Val Leu
805 810 815
Lys Lys Phe Lys Phe Ser Met Leu Phe Ser Ile Gly Phe Ile Ile Gly
820 825 830
Met Val Ile Leu Ala Thr Ala Pro Phe Ile Pro His Ser Trp His Ile
835 840 845
Thr Asp Phe Val Ala Ile Leu Pro Met Ala Thr Val Ala Ala Ser His
850 855 860
Leu Leu Leu Pro Leu Ala Leu Asn Pro Ala Leu Met Thr Phe Ser Trp
865 870 875 880
<210> 17
<211> 939
<212> PRT
<213> Candida intermedia
<400> 17
Met Gly Ile Thr Asp Tyr Phe Val Ser Lys Gly Ala Thr Glu Ala Lys
1 5 10 15
Gln Gly Lys Asn Ser Thr Asp Ile Gln Gln Asn Glu Thr Leu Thr Phe
20 25 30
Pro Glu Met Leu Ala Gly Pro Thr Gly Ala Ser Pro Arg Ala Gln Phe
35 40 45
Thr Ile Gly Glu Thr His Leu Ser Ser Asp Ile Arg Thr Leu Gln Gly
50 55 60
His Asn Glu Met Ile Ser Ala Gly Lys Ser Asp Phe Lys Asp Pro Gln
65 70 75 80
Phe Ile Val Val Asn Tyr Leu His Asp Ile Cys Leu Gly Asn Gly Trp
85 90 95
Leu Lys Leu Val Asp Pro Leu Glu Pro Cys Val Val Lys Met Asn Ser
100 105 110
Lys Lys Gly Asn Glu Ile Gly Tyr Arg Tyr Leu Pro Ala Cys Asp Glu
115 120 125
Ile Ala Pro Tyr Ser Phe Val Asp Cys Ala Ala Arg Phe Leu Arg Ser
130 135 140
Asp Val Cys Val Arg Val Ser Phe Pro Val Ile His Ala Ile Leu Asp
145 150 155 160
Ile Leu Ser Ser Lys Gly Thr Val Ser Leu Asp Ala Asp His Asn Ile
165 170 175
Gln Ile Ile Glu Thr Val Ala Asp Leu Gln Trp Val Arg Lys Ser Gln
180 185 190
Asn Cys Ala Phe Ile Arg Asn Glu Lys Ser Leu Val Cys Trp Ala Asp
195 200 205
Ser Val Gln Glu Val Thr Gly Phe Val Arg Asn Leu Glu Asn Lys Met
210 215 220
Val Asp Tyr Val Trp Lys Lys Gly Asn Ala Val Asp Val Lys Gly Glu
225 230 235 240
Asp Tyr Val Pro Arg Val Thr Phe Ala Ser Val Phe Gln Ser Ser Ser
245 250 255
Glu Ser Asp Val Gly Ser Glu Gly Ala Val Glu Ile Ile Gly Gln Asn
260 265 270
Ala Val Ser Gln Val Ser Ile Ser Glu Lys Ser Ser Asp Ser Ser Thr
275 280 285
His Ser Asp Gly Asn Leu Asn Glu Lys Lys Asn Leu Asp Leu Glu Gln
290 295 300
Gln Ser Ser Glu Arg Pro Val Ile Tyr Ile His Ala Thr Val Ser Ala
305 310 315 320
Phe Ala Ile Thr Leu Val Leu Ala Trp Ala Gly Leu Gln Phe Ala Gln
325 330 335
Val Thr Lys Glu Ile Arg Ala Glu Gly Asn Tyr Leu Ile Leu Leu Ser
340 345 350
Leu Leu Met Val Leu Pro Tyr Phe Leu Phe Thr Ser Phe Phe Ala Ser
355 360 365
Ser Val Met Ser Thr Leu Leu Tyr Val Phe Gly Pro Ile Ser Gln Met
370 375 380
Asn Lys Asn Ser Tyr Ser Tyr Ser Val His Lys Ala Pro Arg Leu Lys
385 390 395 400
Ala Ala His Gly Ser Leu Pro His Val Thr Ile Gln Cys Pro Val Tyr
405 410 415
Lys Glu Lys Leu Glu Ser Val Ile Lys Pro Thr Ile Lys Ser Leu Gln
420 425 430
Ala Ala Ile Arg Thr Tyr Glu Leu Gln Gly Gly Ser Ala Asn Ile Phe
435 440 445
Ile Asn Asp Asp Gly Leu Gln Leu Ile Asp Arg Lys Glu Ala Leu Glu
450 455 460
Arg Ile Glu Tyr Tyr Glu Glu Cys Gly Leu Gly Tyr Val Ala Arg Pro
465 470 475 480
Gly His Gly Val Asn Gly Phe Ile Arg Lys Gly Arg Phe Lys Lys Ala
485 490 495
Ser Asn Met Asn Tyr Cys Leu His Ile Ser Lys Leu Val Asp Thr Arg
500 505 510
Phe His Glu Arg Leu Glu Leu Ile Glu Asn Pro Thr Pro Lys Glu Glu
515 520 525
Ser Gly Leu Tyr Leu Lys Val Leu Glu Glu Val Val Arg Glu Glu Gly
530 535 540
Lys Cys Trp Ala Gly Gly Asp Ile Leu Leu Gly Asp Ile Ile Leu Ile
545 550 555 560
Ile Asp Ser Asp Thr Arg Val Pro Glu Asp Cys Phe Val Asp Ser Val
565 570 575
Ser Glu Met Glu Gln Ser Pro Glu Val Ala Ile Ile Gln His Ala Ser
580 585 590
Gly Val Met Met Val Val Gly Asn Tyr Trp Glu Lys Met Ile Ala Trp
595 600 605
Phe Thr Asn Met Ile Tyr Phe Ser Ile Ser Cys Val Ser Gly Asn Gly
610 615 620
Leu Thr Met Ala Ala Phe Val Gly His Asn Ala Phe Leu Arg Trp Ser
625 630 635 640
Ala Ile Gln Glu Leu Ala Tyr Ile Asp Glu Asp Asp Gly Arg Thr Lys
645 650 655
Tyr Trp Ser Glu Ser His Val Ser Glu Asp Phe Glu Met Thr Leu Lys
660 665 670
Leu Ala Ser Leu Gly Tyr Thr Ile Arg Ile Ala Thr Tyr His Asp Gly
675 680 685
Gly Phe Lys Glu Gly Val Ser Leu Thr Val Tyr Asp Glu Ile Thr Arg
690 695 700
Trp Ser Lys Tyr Ala Phe Gly Cys Ala Glu Ile Met Phe Ser Pro Phe
705 710 715 720
Lys Asp Trp Trp Lys Gly Lys Ile Phe Ala Arg Leu Phe Phe Val Phe
725 730 735
Leu Asn Ser His Ile Ser Leu Pro Cys Lys Phe Ser Ile Leu Gly Tyr
740 745 750
Met Gly Thr Tyr Tyr Ala Ile Ala Thr Ser Leu Ile Met Leu Val Ala
755 760 765
Asn Tyr Phe Ile Val Gly Tyr Tyr Asp Trp Gly Tyr Ser Arg Val Tyr
770 775 780
Ile Asp Ala Met Lys Val Phe Val Ser Val Met Val Val Phe Gly Cys
785 790 795 800
Ala Thr Gln Val Ala Tyr Ile Ile Gly Arg Tyr Arg Ile Tyr Lys His
805 810 815
Ser Ile Tyr Thr Met Val Leu Glu Phe Arg Tyr Ser Ile Leu Phe Ser
820 825 830
Val Phe Leu Gly Gly Leu Ser Trp His Met Ile Val Ser Ile Gly Ser
835 840 845
Tyr Phe Phe Ser Leu Asn Leu Gln Trp Gly Ala Thr Ala Lys Asp Ile
850 855 860
Asp Asp Ser Asn Phe Phe Lys Glu Leu Pro Lys Ala Ile Lys Asn Tyr
865 870 875 880
Lys Phe Met Tyr Ile Leu Cys Ile Phe Leu Ile Ala Gly Met Ile Val
885 890 895
Leu Ala Phe Phe Val Pro Tyr Ala Phe Gln Ile Arg Leu Leu Thr Cys
900 905 910
Ala Leu Pro Leu Gly Trp Ser Val Ala Ser His Phe Leu Ser Pro Ile
915 920 925
Val Leu Asn Pro Gln Leu Met Thr Phe Ala Trp
930 935
<210> 18
<211> 395
<212> PRT
<213> Hypocrea jecorina
<400> 18
Ala Trp Ala Asp Gly Asn Ile Arg Met Gly Asp Tyr Ile Leu Leu Ile
1 5 10 15
Asp Ser Asp Thr Arg Val Pro Ala Asp Cys Leu Leu Asp Ala Val Ser
20 25 30
Glu Met Glu Gln Ser Pro Asp Val Gly Ile Met Gln Phe Ser Ser Gly
35 40 45
Val Met Gln Val Val His Thr Tyr Phe Glu Asn Gly Ile Thr Phe Phe
50 55 60
Thr Asn Leu Ile Tyr Ser Ala Ile Arg Tyr Thr Val Ser Asn Gly Asp
65 70 75 80
Val Ala Pro Phe Val Gly His Asn Ala Ile Leu Arg Trp Ser Ala Ile
85 90 95
Gln Gln Val Ala Tyr Gln Asp Glu Asp Gly Tyr Asp Lys Phe Trp Ser
100 105 110
Glu Ser His Val Ser Glu Asp Phe Asp Met Ser Leu Arg Leu Gln Cys
115 120 125
Asn Gly Tyr Ile Ile Arg Leu Ala Ala Trp Ala Gly Glu Gly Phe Lys
130 135 140
Glu Gly Val Ser Leu Thr Val Tyr Asp Glu Leu Ala Arg Trp Glu Lys
145 150 155 160
Tyr Ala Tyr Gly Cys Asn Glu Leu Leu Phe His Pro Ile Arg Thr Trp
165 170 175
Leu Trp Arg Gly Pro Phe Thr Pro Leu Phe Arg Arg Phe Leu Phe Ser
180 185 190
Asn Ile Arg Phe Thr Ser Lys Val Thr Val Ile Ser Tyr Ile Gly Thr
195 200 205
Tyr Tyr Ala Ile Gly Ala Ala Trp Ile Leu Thr Ala Val Asn Tyr Phe
210 215 220
Val Met Gly Trp Phe Asn Gly Tyr Leu Asp Lys Tyr Tyr Val Asp Ser
225 230 235 240
Trp Gln Val Trp Phe Ser Ile Ile Ile Val Phe Asn Gly Leu Gly Asn
245 250 255
Ile Ala Leu Ala Val Met Arg Tyr Arg Val Gly Glu Arg Gly Leu Leu
260 265 270
Tyr Ala Leu Phe Glu Asn Phe Met Trp Thr Leu Met Leu Ala Ile Phe
275 280 285
Leu Gly Gly Leu Ser Leu His Val Ser Gln Ala Leu Leu Ala His Met
290 295 300
Phe Glu Ile Asn Met Thr Trp Gly Ala Thr Ser Lys Glu Ala Glu Phe
305 310 315 320
Ser Asn Phe Phe Ile Glu Val Pro Lys Val Leu Lys Lys Phe Lys Phe
325 330 335
Ser Met Leu Phe Ser Leu Ile Phe Ile Ala Gly Met Ile Ile Leu Ala
340 345 350
Gln Ala Pro Phe Val Pro Phe Asp Trp Arg Ile Lys Asp Phe Val Ala
355 360 365
Ile Leu Pro Met Ala Thr Val Ala Ala Ser His Phe Leu Leu Pro Leu
370 375 380
Ala Leu Asn Pro Ala Leu Met Thr Phe Ser Trp
385 390 395
<210> 19
<211> 1343
<212> PRT
<213> Hypocrea jecorina
<400> 19
Met Ile Glu Asp Thr Ala Ala Leu Ala Ala Ala Ala Glu Leu Ile Ala
1 5 10 15
Ser Leu Ala Cys Asp Pro Ala Ser Ala Ser Ala Ser Ser Ser Leu Val
20 25 30
Ser Val Gly Pro Gly Ser Ser Ile Lys Leu Pro Gly Arg Glu Asn Pro
35 40 45
Ala Lys Arg Thr Leu Glu Ile Glu Leu Glu Lys Leu Val Leu Arg Ile
50 55 60
Ser Gln Leu Glu Ser Arg Ala Ser Ala Ser Ala Asn Ala Ser Val Phe
65 70 75 80
Pro Glu Thr Pro Asn Glu Val Asn Asp Thr Leu Phe Asn Asp Asp Val
85 90 95
Asp Pro Ser Val Asn Gly Arg Pro Pro Val Ala Pro Gln Pro Arg Leu
100 105 110
Ser Gln Ala Gln Gln Gly Ser Leu Asp Ser Pro Ile Phe Val Ser Arg
115 120 125
Gln Leu Thr Lys Glu Ala Leu Gln Gly Leu Arg Asp His Val Asp Asp
130 135 140
Gln Ser Lys Leu Leu Asp Ser Gln Arg Gln Glu Leu Ala Gly Val Asn
145 150 155 160
Ala Gln Leu Leu Glu Gln Lys Gln Leu Gln Glu Arg Ala Leu Ala Met
165 170 175
Leu Glu Gln Glu Arg Val Ala Thr Leu Glu Arg Glu Leu Trp Lys His
180 185 190
Gln Lys Ala Asn Glu Ala Phe Gln Lys Ala Leu Arg Glu Ile Gly Glu
195 200 205
Ile Val Thr Ala Val Ala Arg Gly Asp Leu Thr Met Lys Val Arg Met
210 215 220
Asn Ser Val Glu Met Asp Pro Glu Ile Thr Thr Phe Lys Arg Thr Ile
225 230 235 240
Asn Ala Met Met Asp Gln Leu Gln Thr Phe Ala Ser Glu Val Ser Arg
245 250 255
Val Ala Arg Glu Val Gly Thr Glu Gly Leu Leu Gly Gly Gln Ala Arg
260 265 270
Ile Gly Gly Val Asp Gly Val Trp Lys Glu Leu Thr Asp Asn Val Asn
275 280 285
Ile Met Ala Gln Asn Leu Thr Asp Gln Val Arg Glu Ile Ala Ser Val
290 295 300
Thr Thr Ala Val Ala His Gly Asp Leu Thr Lys Lys Ile Glu Arg Pro
305 310 315 320
Ala Lys Gly Glu Ile Leu Gln Leu Gln Gln Thr Ile Asn Thr Met Val
325 330 335
Asp Gln Leu Arg Thr Phe Ala Ser Glu Val Thr Arg Val Ala Arg Asp
340 345 350
Val Gly Thr Glu Gly Ile Leu Gly Gly Gln Ala Asp Val Gly Gly Val
355 360 365
Lys Gly Met Trp Asn Asp Leu Thr Val Asn Val Asn Ala Met Ala Asn
370 375 380
Asn Leu Thr Thr Gln Val Arg Asp Ile Ile Lys Val Thr Thr Ala Val
385 390 395 400
Ala Lys Gly Asp Leu Thr Gln Lys Val Gln Ala Glu Cys Arg Gly Glu
405 410 415
Met Phe Lys Leu Lys Ser Thr Ile Asn Ser Met Val Asp Gln Leu Gln
420 425 430
Gln Phe Ala Arg Glu Val Thr Lys Ile Ala Arg Glu Val Gly Thr Glu
435 440 445
Gly Arg Leu Gly Gly Gln Ala Thr Val His Asp Val Glu Gly Thr Trp
450 455 460
Arg Asp Leu Thr Glu Asn Val Asn Gly Met Ala Met Asn Leu Thr Thr
465 470 475 480
Gln Val Arg Glu Ile Ala Lys Val Thr Thr Ala Val Ala Arg Gly Asp
485 490 495
Leu Thr Lys Lys Ile Gly Val Glu Val Lys Gly Glu Ile Leu Glu Leu
500 505 510
Lys Asn Thr Ile Asn Gln Met Val Asp Arg Leu Gly Thr Phe Ala Val
515 520 525
Glu Val Ser Lys Val Ala Arg Glu Val Gly Thr Asp Gly Thr Leu Gly
530 535 540
Gly Gln Ala Gln Val Ala Asn Val Glu Gly Lys Trp Lys Asp Leu Thr
545 550 555 560
Glu Asn Val Asn Thr Met Ala Ser Asn Leu Thr Val Gln Val Arg Ser
565 570 575
Ile Ser Ala Val Thr Gln Ala Ile Ala Asn Gly Asp Met Ser Gln Thr
580 585 590
Ile Asp Val Glu Ala Asn Gly Glu Ile Gln Val Leu Lys Glu Thr Ile
595 600 605
Asn Asn Met Val Ser Arg Leu Ser Ser Phe Cys Tyr Glu Val Gln Arg
610 615 620
Val Ala Lys Asp Val Gly Val Asp Gly Lys Met Gly Ala Gln Ala Asp
625 630 635 640
Val Ala Gly Leu Asn Gly Arg Trp Lys Glu Ile Thr Thr Asp Val Asn
645 650 655
Thr Met Ala Ser Asn Leu Thr Thr Gln Val Arg Ala Phe Ser Asp Ile
660 665 670
Thr Asn Leu Ala Thr Asp Gly Asp Phe Thr Lys Leu Val Asp Val Glu
675 680 685
Ala Ser Gly Glu Met Asp Glu Leu Lys Lys Lys Ile Asn Gln Met Ile
690 695 700
Ser Asn Leu Arg Asp Ser Ile Gln Arg Asn Thr Gln Ala Arg Glu Ala
705 710 715 720
Ala Glu Leu Ala Asn Lys Thr Lys Ser Glu Phe Leu Ala Asn Met Ser
725 730 735
His Glu Ile Arg Thr Pro Thr Asn Gly Ile Ile Gly Met Thr Gln Leu
740 745 750
Thr Leu Asp Thr Asp Leu Thr Gln Tyr Gln Arg Glu Met Leu Asn Ile
755 760 765
Val Asn Asp Leu Ala Asn Ser Leu Leu Thr Ile Ile Asp Asp Ile Leu
770 775 780
Asp Leu Ser Lys Ile Glu Ala Arg Arg Met Val Ile Glu Glu Ile Pro
785 790 795 800
Tyr Thr Leu Arg Gly Thr Val Phe Asn Ala Leu Lys Thr Leu Ala Val
805 810 815
Lys Ala Asn Glu Lys Phe Leu Asp Leu Thr Tyr Lys Val Asp Ser Ser
820 825 830
Val Pro Asp Tyr Val Ile Gly Asp Ser Phe Arg Leu Arg Gln Ile Ile
835 840 845
Leu Asn Leu Val Gly Asn Ala Ile Lys Phe Thr Glu His Gly Glu Val
850 855 860
Ser Leu Thr Ile Gln Glu Gln Glu Asp Lys Arg His Val Gly Pro Gly
865 870 875 880
Glu Tyr Ala Ile Glu Phe Ile Val Glu Asp Thr Gly Ile Gly Ile Ala
885 890 895
Lys Asp Lys Leu Asn Leu Ile Phe Asp Thr Phe Gln Gln Ala Asp Gly
900 905 910
Ser Met Thr Arg Lys Phe Gly Gly Thr Gly Leu Gly Leu Ser Ile Ser
915 920 925
Lys Arg Phe Val Asn Leu Met Gly Gly Asp Leu Trp Val Asn Ser Glu
930 935 940
Val Gly Lys Gly Ser Glu Phe His Phe Thr Cys Arg Val Lys Leu Ala
945 950 955 960
Asp Val His Ala Glu Ser Val Gln Gln Gln Leu Lys Pro Tyr Arg Gly
965 970 975
His Gln Val Leu Phe Val Asp Lys Ser Gln Ser Asn Ala Ala Thr His
980 985 990
Ile Gly Glu Met Leu Glu Glu Ile Gly Leu His Pro Val Val Val Asn
995 1000 1005
Ser Glu Lys Ser Ser Ala Leu Thr Arg Leu Lys Glu Gly Gly Ala Leu
1010 1015 1020
Pro Tyr Asp Ala Ile Ile Val Asp Ser Ile Asp Thr Ala Arg Arg Leu
1025 1030 1035 1040
Arg Ala Val Asp Asp Phe Lys Tyr Leu Pro Ile Val Leu Leu Ala Pro
1045 1050 1055
Val Val His Val Ser Leu Lys Ser Cys Leu Asp Leu Gly Ile Thr Ser
1060 1065 1070
Tyr Met Thr Met Pro Cys Lys Leu Ile Asp Leu Ser Asn Gly Met Ile
1075 1080 1085
Pro Ala Leu Glu Asn Arg Ala Thr Pro Ser Leu Ala Asp Val Thr Lys
1090 1095 1100
Ser Phe Glu Ile Leu Leu Ala Glu Asp Asn Thr Val Asn Gln Lys Leu
1105 1110 1115 1120
Ala Val Lys Ile Leu Glu Lys Tyr His His Val Val Thr Val Val Gly
1125 1130 1135
Asn Gly Trp Glu Ala Val Glu Ala Val Lys Gln Lys Lys Phe Asp Val
1140 1145 1150
Ile Leu Met Asp Val Gln Met Pro Ile Met Gly Gly Phe Glu Ala Thr
1155 1160 1165
Gly Lys Ile Arg Glu Tyr Glu Arg Gly Met Gly Thr His Arg Thr Pro
1170 1175 1180
Ile Ile Ala Leu Thr Ala His Ala Met Met Gly Asp Arg Glu Lys Cys
1185 1190 1195 1200
Ile Gln Ala Gln Met Asp Glu Tyr Leu Ser Lys Pro Leu Gln Gln Asn
1205 1210 1215
Gln Leu Ile Gln Thr Ile Leu Lys Cys Ala Thr Leu Gly Gly Ala Leu
1220 1225 1230
Leu Glu Lys Asn Arg Glu Arg Glu Leu Ala Leu Gln Ala Glu Ala Lys
1235 1240 1245
Ala Ser Gly Arg Leu Asp Gly Glu Arg Gly Met Leu Arg Pro Gly Leu
1250 1255 1260
Glu Gly Arg Ser Phe Thr Thr Arg Glu Pro Met Thr Lys Ser Arg Pro
1265 1270 1275 1280
Ser Leu Thr Lys Ala Thr Ser Lys Ala Leu Glu Glu Ala Arg Asn Ala
1285 1290 1295
Ala Ala Ala Asn Ala Gly Leu Arg Phe Ser Glu Leu Thr Gly Phe Ser
1300 1305 1310
Ala Asp Leu Met Glu Glu Leu Asp Asn Met Glu Asp Glu Asp Ser Phe
1315 1320 1325
Thr Lys Ala Arg Glu Asp Leu Ala Asp Arg Arg Ser Leu Ser Ser
1330 1335 1340
<210> 20
<211> 4067
<212> DNA
<213> Hypocrea jecorina
<400> 20
atgcagcaac cgccctcctt agttggcgac cgcagcatca ccggcctggg agacgcagcc 60
agccgaccaa atctctcttc atcctcgcct accgtcacca gcgcgccctc ggcaccgaca 120
tcgccaccgc cgcggccgcc aatatcgctg aatcccccgt cgcgagagcc tcctggcgtc 180
gagcccgtgc tccgcatcac gccagtcccg cgctccgtct ttgcctctgt ccaccagccg 240
cgcaagtcgt cgctggtcca gacgtcgcac gtcctgccct cgcccaggac cgccgccgca 300
gctcaccatc accatcccgt ctcgcattcc gcctctggca gcagcggcag caacggcagt 360
ggaagcggca gtggcagcgg cagcggcaat ctgctgcgtc aaacgcatcg cgacaccgtg 420
cacccccccg tcaagcggcc atccaccccg tcgtcgcatc ccaccagggg cgccagcacc 480
ggagcatcgc cgcagcaggg cgccagctcc cgaaaccgct cgtcgacgtc gcccgtttcg 540
tccccggcga gtcgcacgcc tccttatgca tctcgtcagg cctcagtttc ccattcccgc 600
cagcagcaca accaccatca tcagcaccaa caccagcatt accactccca caccagctcg 660
actaccagtc gcgccagcat cgaggccgta gtcggtgccg tccccgatcc ctcaggtcac 720
cgagcgccgc cgaaaccccg tcgaccggat cgcaaccact ttggcgcgtc agatcgcagc 780
gcaactccca ccctgtcgca cttcatgagg gcagagtcga gcatgtccat gagacattac 840
gagagcggcc ccttacgctc catgtcgccg aacccctacg gaacccctgc cgccaccacg 900
acgtcgtcca ctgccagaat gccgcacgag cagagccacg atccctacgc ccctcgcggc 960
cactctcgcg atcactcggg gaagagcagc agagacatgg gcaagccccg agctcagaag 1020
aatccctcac agaaggcgat gctctcccgt gccctgcaaa aggccaacac cgcagttcag 1080
ctcgacaatg ctcagaactt cgaaggcgct cgagaagcgt acgccgaggc ttgcgacttg 1140
ttgcagcagg tgcttgaccg aacaccggga gatgaggaca agcggaagct cgaagccatt 1200
gtaagtcacg gcggcaaccg gaatgtcgag cccgttgtct gtcattagta gatcacttgg 1260
aactgacaat ttcaatctgt agcaccaaac ttacaccagc cgcatcgatg agctggatca 1320
gttgggccct tggcaggttg agaccgtcaa ggctctgccg gcgcggccag agagcgagga 1380
gtacagcgcg tccatattca taccccagga ttacgacatg ggcgatgaag ctcccaggat 1440
tgagacggca cgggtggtga gctacatcgc tggagacaac gcgtctccct ttgcagcagc 1500
gcccaaccag tggcagcagt cgggaggtca cacggcatct gaacggctgc agcccaaccg 1560
cggtctggaa ccgggtctgc tacagtcgtc cttctctcgg gccccgaggt cgcccaggcg 1620
gctgcagtcc accgatgatc ttcgcgcaca gcatcaggag ggccagtatg cgcctccccc 1680
actctcgcct cgctcgcagt cgccggtaaa gacgcatgac catgacgacg acatgtttgc 1740
cgaactgcca ccacacgagc cctatcagta ccagcaagag cacgaccatc aagaccacca 1800
tcaagactac catcaacatc accgccatca caaccaccac catcacgaac gacagcccag 1860
cgagactgtc ctatcctcat acgagctcca gggtcatgtg gatggaggaa tccaaaactc 1920
atggctagat ccaattgacg agtcgggagg ctcaacagcg tcgtctgtac actcacgcac 1980
ctcttcgctt ggctaccgtc gacgccatat ccgggccgtg agcgggaaca ccgaggccga 2040
gtttgacacg gcgctggacg ctgctatcga ggctgcctac gacgacggct acgagcccat 2100
ggactctgta gactatggga ccattgatgc tgggggggac aatagcatgg caggcgtatt 2160
gcacaaggtg gagatggcgc gcgaacgagc gagacagacg gagcaggaag cctatgacga 2220
gctggccaac ctccgacagg cgcactcaca gaatccgcag caccagcagg aggaggacag 2280
gtatactgcc gagggattct acgaggacga ctcgtctgaa gaggaggaga gactattgga 2340
cgagattaca cgcgactttg ccattgagga ctttaccatg gaaaacccga atggcacaca 2400
ggtgtcagct aggcagcagg atgcatggaa cgaggacgag acgaggccgg atttcatctc 2460
gggcgtccga tccttttctg ccctgtcgca gaggccaccc attcctcagg cctacgccgc 2520
caacgcctcg cagccagcag ccccccctcc gacatccgca ttgccagacc tgccaccagg 2580
acgccctggt caaaatccaa agcaactcaa gatcgagacg gcaaacattg tacaaaccca 2640
gaagtcggtc tatgacgacg acgaaatctc cccaagcacg caagagccgc cgcccgagac 2700
gctcgtccgg acggcgagcg cgcagcctgt aaggccaccg ataccgacag aaagcttccc 2760
atccgaactc agtgctcccg catcgccaac cgccaagaag aggcttctgg aaggagagaa 2820
tgtgctgaat gcctcgcctt ctatccacag gctacggaag aacttttcgt cttctagctt 2880
gaggagcatg aagaacagga acatgtccgt ctcacatttg gacgacagct cggatgcttc 2940
ccccggcacc cccctgaatg accccttcaa caaggcacct gccgtgcccg tgcccgcgct 3000
gccgaccccc ttgctcgcgt cgttcaaaga tcatatggag gcagcggccg gtgttggctt 3060
ccacctgttt gacgacgagt ttcatgcagc ggcggctgcc ggcccccaaa gcccgcagag 3120
tcccagaagt cccgttgttg tctccatgga cgtccctgtg cctctggaac cctgtccaaa 3180
cgacttcatg ctgcgaccgt tttggctgat gcgatgccta taccagacac ttgtgcatcc 3240
caagggtggc tacatcagta cgaagctatt cgtgccgcga gacgtctggc gggtcaaagg 3300
tgtcaagatc aagaacgtgg aggacaaaat tgccaactgc gactttttga ctgcagccct 3360
gctgaagctg tccaaagtgg acactctgga tgcggatgcc gtgctggagg agatgcaagc 3420
cctcgagggc attctggagc agatacagcc ggtcctggcc cgaaagcttg gaaacgaagt 3480
gggcgttcaa ggttccggtc tgctgttcaa agacgcctcg atgatggaag gagaccccgg 3540
ttcagccgtg ccgcgatcag gaagtgtgtc tggcaaggcg tctgcgtttt cctggcgacg 3600
gcttcggcca aagacgtcgg gcgtcgggct gggagggtcg tacagcagcc gcaacgccag 3660
tgctgagacg aaggaggcct caacgctggc aacggtgccc atgacgccga aaccgacaag 3720
ccgttcggcc aagcgagacg tgagccaggt tcagttcatc gggcccaatg cgagctacat 3780
gggctctctc gcgcgcttgt ttgacgctgc gcaggcagtt ggtaagcata ttgcgatacg 3840
cataccggtt acagtgacgg caagctaacg atgatgcaga tcaaattgca aggcaggtcg 3900
acgaccccgg tttgcggctt gcggacaaga ctcaggtcgg cttggagctc tgcacccggc 3960
acgccgctga gttctttggc ttttacattt gccgattcgt cttggccgac ctcggcctgt 4020
tgctggacaa gttcctcaaa cgaggaagcg aatgggtcat gacatga 4067
<210> 21
<211> 1308
<212> PRT
<213> Hypocrea jecorina
<400> 21
Met Gln Gln Pro Pro Ser Leu Val Gly Asp Arg Ser Ile Thr Gly Leu
1 5 10 15
Gly Asp Ala Ala Ser Arg Pro Asn Leu Ser Ser Ser Ser Pro Thr Val
20 25 30
Thr Ser Ala Pro Ser Ala Pro Thr Ser Pro Pro Pro Arg Pro Pro Ile
35 40 45
Ser Leu Asn Pro Pro Ser Arg Glu Pro Pro Gly Val Glu Pro Val Leu
50 55 60
Arg Ile Thr Pro Val Pro Arg Ser Val Phe Ala Ser Val His Gln Pro
65 70 75 80
Arg Lys Ser Ser Leu Val Gln Thr Ser His Val Leu Pro Ser Pro Arg
85 90 95
Thr Ala Ala Ala Ala His His His His Pro Val Ser His Ser Ala Ser
100 105 110
Gly Ser Ser Gly Ser Asn Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser
115 120 125
Gly Asn Leu Leu Arg Gln Thr His Arg Asp Thr Val His Pro Pro Val
130 135 140
Lys Arg Pro Ser Thr Pro Ser Ser His Pro Thr Arg Gly Ala Ser Thr
145 150 155 160
Gly Ala Ser Pro Gln Gln Gly Ala Ser Ser Arg Asn Arg Ser Ser Thr
165 170 175
Ser Pro Val Ser Ser Pro Ala Ser Arg Thr Pro Pro Tyr Ala Ser Arg
180 185 190
Gln Ala Ser Val Ser His Ser Arg Gln Gln His Asn His His His Gln
195 200 205
His Gln His Gln His Tyr His Ser His Thr Ser Ser Thr Thr Ser Arg
210 215 220
Ala Ser Ile Glu Ala Val Val Gly Ala Val Pro Asp Pro Ser Gly His
225 230 235 240
Arg Ala Pro Pro Lys Pro Arg Arg Pro Asp Arg Asn His Phe Gly Ala
245 250 255
Ser Asp Arg Ser Ala Thr Pro Thr Leu Ser His Phe Met Arg Ala Glu
260 265 270
Ser Ser Met Ser Met Arg His Tyr Glu Ser Gly Pro Leu Arg Ser Met
275 280 285
Ser Pro Asn Pro Tyr Gly Thr Pro Ala Ala Thr Thr Thr Ser Ser Thr
290 295 300
Ala Arg Met Pro His Glu Gln Ser His Asp Pro Tyr Ala Pro Arg Gly
305 310 315 320
His Ser Arg Asp His Ser Gly Lys Ser Ser Arg Asp Met Gly Lys Pro
325 330 335
Arg Ala Gln Lys Asn Pro Ser Gln Lys Ala Met Leu Ser Arg Ala Leu
340 345 350
Gln Lys Ala Asn Thr Ala Val Gln Leu Asp Asn Ala Gln Asn Phe Glu
355 360 365
Gly Ala Arg Glu Ala Tyr Ala Glu Ala Cys Asp Leu Leu Gln Gln Val
370 375 380
Leu Asp Arg Thr Pro Gly Asp Glu Asp Lys Arg Lys Leu Glu Ala Ile
385 390 395 400
His Gln Thr Tyr Thr Ser Arg Ile Asp Glu Leu Asp Gln Leu Gly Pro
405 410 415
Trp Gln Val Glu Thr Val Lys Ala Leu Pro Ala Arg Pro Glu Ser Glu
420 425 430
Glu Tyr Ser Ala Ser Ile Phe Ile Pro Gln Asp Tyr Asp Met Gly Asp
435 440 445
Glu Ala Pro Arg Ile Glu Thr Ala Arg Val Val Ser Tyr Ile Ala Gly
450 455 460
Asp Asn Ala Ser Pro Phe Ala Ala Ala Pro Asn Gln Trp Gln Gln Ser
465 470 475 480
Gly Gly His Thr Ala Ser Glu Arg Leu Gln Pro Asn Arg Gly Leu Glu
485 490 495
Pro Gly Leu Leu Gln Ser Ser Phe Ser Arg Ala Pro Arg Ser Pro Arg
500 505 510
Arg Leu Gln Ser Thr Asp Asp Leu Arg Ala Gln His Gln Glu Gly Gln
515 520 525
Tyr Ala Pro Pro Pro Leu Ser Pro Arg Ser Gln Ser Pro Val Lys Thr
530 535 540
His Asp His Asp Asp Asp Met Phe Ala Glu Leu Pro Pro His Glu Pro
545 550 555 560
Tyr Gln Tyr Gln Gln Glu His Asp His Gln Asp His His Gln Asp Tyr
565 570 575
His Gln His His Arg His His Asn His His His His Glu Arg Gln Pro
580 585 590
Ser Glu Thr Val Leu Ser Ser Tyr Glu Leu Gln Gly His Val Asp Gly
595 600 605
Gly Ile Gln Asn Ser Trp Leu Asp Pro Ile Asp Glu Ser Gly Gly Ser
610 615 620
Thr Ala Ser Ser Val His Ser Arg Thr Ser Ser Leu Gly Tyr Arg Arg
625 630 635 640
Arg His Ile Arg Ala Val Ser Gly Asn Thr Glu Ala Glu Phe Asp Thr
645 650 655
Ala Leu Asp Ala Ala Ile Glu Ala Ala Tyr Asp Asp Gly Tyr Glu Pro
660 665 670
Met Asp Ser Val Asp Tyr Gly Thr Ile Asp Ala Gly Gly Asp Asn Ser
675 680 685
Met Ala Gly Val Leu His Lys Val Glu Met Ala Arg Glu Arg Ala Arg
690 695 700
Gln Thr Glu Gln Glu Ala Tyr Asp Glu Leu Ala Asn Leu Arg Gln Ala
705 710 715 720
His Ser Gln Asn Pro Gln His Gln Gln Glu Glu Asp Arg Tyr Thr Ala
725 730 735
Glu Gly Phe Tyr Glu Asp Asp Ser Ser Glu Glu Glu Glu Arg Leu Leu
740 745 750
Asp Glu Ile Thr Arg Asp Phe Ala Ile Glu Asp Phe Thr Met Glu Asn
755 760 765
Pro Asn Gly Thr Gln Val Ser Ala Arg Gln Gln Asp Ala Trp Asn Glu
770 775 780
Asp Glu Thr Arg Pro Asp Phe Ile Ser Gly Val Arg Ser Phe Ser Ala
785 790 795 800
Leu Ser Gln Arg Pro Pro Ile Pro Gln Ala Tyr Ala Ala Asn Ala Ser
805 810 815
Gln Pro Ala Ala Pro Pro Pro Thr Ser Ala Leu Pro Asp Leu Pro Pro
820 825 830
Gly Arg Pro Gly Gln Asn Pro Lys Gln Leu Lys Ile Glu Thr Ala Asn
835 840 845
Ile Val Gln Thr Gln Lys Ser Val Tyr Asp Asp Asp Glu Ile Ser Pro
850 855 860
Ser Thr Gln Glu Pro Pro Pro Glu Thr Leu Val Arg Thr Ala Ser Ala
865 870 875 880
Gln Pro Val Arg Pro Pro Ile Pro Thr Glu Ser Phe Pro Ser Glu Leu
885 890 895
Ser Ala Pro Ala Ser Pro Thr Ala Lys Lys Arg Leu Leu Glu Gly Glu
900 905 910
Asn Val Leu Asn Ala Ser Pro Ser Ile His Arg Leu Arg Lys Asn Phe
915 920 925
Ser Ser Ser Ser Leu Arg Ser Met Lys Asn Arg Asn Met Ser Val Ser
930 935 940
His Leu Asp Asp Ser Ser Asp Ala Ser Pro Gly Thr Pro Leu Asn Asp
945 950 955 960
Pro Phe Asn Lys Ala Pro Ala Val Pro Val Pro Ala Leu Pro Thr Pro
965 970 975
Leu Leu Ala Ser Phe Lys Asp His Met Glu Ala Ala Ala Gly Val Gly
980 985 990
Phe His Leu Phe Asp Asp Glu Phe His Ala Ala Ala Ala Ala Gly Pro
995 1000 1005
Gln Ser Pro Gln Ser Pro Arg Ser Pro Val Val Val Ser Met Asp Val
1010 1015 1020
Pro Val Pro Leu Glu Pro Cys Pro Asn Asp Phe Met Leu Arg Pro Phe
1025 1030 1035 1040
Trp Leu Met Arg Cys Leu Tyr Gln Thr Leu Val His Pro Lys Gly Gly
1045 1050 1055
Tyr Ile Ser Thr Lys Leu Phe Val Pro Arg Asp Val Trp Arg Val Lys
1060 1065 1070
Gly Val Lys Ile Lys Asn Val Glu Asp Lys Ile Ala Asn Cys Asp Phe
1075 1080 1085
Leu Thr Ala Ala Leu Leu Lys Leu Ser Lys Val Asp Thr Leu Asp Ala
1090 1095 1100
Asp Ala Val Leu Glu Glu Met Gln Ala Leu Glu Gly Ile Leu Glu Gln
1105 1110 1115 1120
Ile Gln Pro Val Leu Ala Arg Lys Leu Gly Asn Glu Val Gly Val Gln
1125 1130 1135
Gly Ser Gly Leu Leu Phe Lys Asp Ala Ser Met Met Glu Gly Asp Pro
1140 1145 1150
Gly Ser Ala Val Pro Arg Ser Gly Ser Val Ser Gly Lys Ala Ser Ala
1155 1160 1165
Phe Ser Trp Arg Arg Leu Arg Pro Lys Thr Ser Gly Val Gly Leu Gly
1170 1175 1180
Gly Ser Tyr Ser Ser Arg Asn Ala Ser Ala Glu Thr Lys Glu Ala Ser
1185 1190 1195 1200
Thr Leu Ala Thr Val Pro Met Thr Pro Lys Pro Thr Ser Arg Ser Ala
1205 1210 1215
Lys Arg Asp Val Ser Gln Val Gln Phe Ile Gly Pro Asn Ala Ser Tyr
1220 1225 1230
Met Gly Ser Leu Ala Arg Leu Phe Asp Ala Ala Gln Ala Val Asp Gln
1235 1240 1245
Ile Ala Arg Gln Val Asp Asp Pro Gly Leu Arg Leu Ala Asp Lys Thr
1250 1255 1260
Gln Val Gly Leu Glu Leu Cys Thr Arg His Ala Ala Glu Phe Phe Gly
1265 1270 1275 1280
Phe Tyr Ile Cys Arg Phe Val Leu Ala Asp Leu Gly Leu Leu Leu Asp
1285 1290 1295
Lys Phe Leu Lys Arg Gly Ser Glu Trp Val Met Thr
1300 1305
<210> 22
<211> 2731
<212> DNA
<213> Hypocrea jecorina
<400> 22
atgcagcaac cgccctcctt agttggcgac cgcagcatca ccggcctggg agacgcagcc 60
agccgaccaa atctctcttc atcctcgcct accgtcacca gcgcgccctc ggcaccgaca 120
tcgccaccgc cgcggccgcc aatatcgctg aatcccccgt cgcgagagcc tcctggcgtc 180
gagcccgtgc tccgcatcac gccagtcccg cgctccgtct ttgcctctgt ccaccagccg 240
cgcaagtcgt cgctggtcca gacgtcgcac gtcctgccct cgcccaggac cgccgccgca 300
gctcaccatc accatcccgt ctcgcattcc gcctctggca gcagcggcag caacggcagt 360
ggaagcggca gtggcagcgg cagcggcaat ctgctgcgtc aaacgcatcg cgacaccgtg 420
cacccccccg tcaagcggcc atccaccccg tcgtcgcatc ccaccagggg cgccagcacc 480
ggagcatcgc cgcagcaggg cgccagctcc cgaaaccgct cgtcgacgtc gcccgtttcg 540
tccccggcga gtcgcacgcc tccttatgca tctcgtcagg cctcagtttc ccattcccgc 600
cagcagcaca accaccatca tcagcaccaa caccagcatt accactccca caccagctcg 660
actaccagtc gcgccagcat cgaggccgta gtcggtgccg tccccgatcc ctcaggtcac 720
cgagcgccgc cgaaaccccg tcgaccggat cgcaaccact ttggcgcgtc agatcgcagc 780
gcaactccca ccctgtcgca cttcatgagg gcagagtcga gcatgtccat gagacattac 840
gagagcggcc ccttacgctc catgtcgccg aacccctacg gaacccctgc cgccaccacg 900
acgtcgtcca ctgccagaat gccgcacgag cagagccacg atccctacgc ccctcgcggc 960
cactctcgcg atcactcggg gaagagcagc agagacatgg gcaagccccg agctcagaag 1020
aatccctcac agaaggcgat gctctcccgt gccctgcaaa aggccaacac cgcagttcag 1080
ctcgacaatg ctcagaactt cgaaggcgct cgagaagcgt acgccgaggc ttgcgacttg 1140
ttgcagcagg tgcttgaccg aacaccggga gatgaggaca agcggaagct cgaagccatt 1200
gtaagtcacg gcggcaaccg gaatgtcgag cccgttgtct gtcattagta gatcacttgg 1260
aactgacaat ttcaatctgt agcaccaaac ttacaccagc cgcatcgatg agctggatca 1320
gttgggccct tggcaggttg agaccgtcaa ggctctgccg gcgcggccag agagcgagga 1380
gtacagcgcg tccatattca taccccagga ttacgacatg ggcgatgaag ctcccaggat 1440
tgagacggca cgggtggtga gctacatcgc tggagacaac gcgtctccct ttgcagcagc 1500
gcccaaccag tggcagcagt cgggaggtca cacggcatct gaacggctgc agcccaaccg 1560
cggtctggaa ccgggtctgc tacagtcgtc cttctctcgg gccccgaggt cgcccaggcg 1620
gctgcagtcc accgatgatc ttcgcgcaca gcatcaggag ggccagtatg cgcctccccc 1680
actctcgcct cgctcgcagt cgccggtaaa gacgcatgac catgacgacg acatgtttgc 1740
cgaactgcca ccacacgagc cctatcagta ccagcaagag cacgaccatc aagaccacca 1800
tcaagactac catcaacatc accgccatca caaccaccac catcacgaac gacagcccag 1860
cgagactgtc ctatcctcat acgagctcca gggtcatgtg gatggaggaa tccaaaactc 1920
atggctagat ccaattgacg agtcgggagg ctcaacagcg tcgtctgtac actcacgcac 1980
ctcttcgctt ggctaccgtc gacgccatat ccgggccgtg agcgggaaca ccgaggccga 2040
gtttgacacg gcgctggacg ctgctatcga ggctgcctac gacgacggct acgagcccat 2100
ggactctgta gactatggga ccattgatgc tggggggaca atagcatggc aggcgtattg 2160
cacaaggtgg agatggcgcg cgaacgagcg agacagacgg agcaggaagc ctatgacgag 2220
ctggccaacc tccgacaggc gcactcacag aatccgcagc accagcagga ggaggacagg 2280
tatactgccg agggattcta cgaggacgac tcgtctgaag aggaggagag actattggac 2340
gagattacac gcgactttgc cattgaggac tttaccatgg aaaacccgaa tggcacacag 2400
gtgtcagcta ggcagcagga tgcatggaac gaggacgaga cgaggccgga tttcatctcg 2460
ggcgtccgat ccttttctgc cctgtcgcag aggccaccca ttcctcaggc ctacgccgcc 2520
aacgcctcgc agccagcagc cccccctccg acatccgcat tgccagacct gccaccagga 2580
cgccctggtc aaaatccaaa gcaactcaag atcgagacgg caaacattgt acaaacccag 2640
aagtcggtct atgacgacga cgaaatctcc ccaagcacgc aagagccgcc gcccgagacg 2700
ctcgtccgga cggcgagcgc gcagcctgta a 2731
<210> 23
<211> 882
<212> PRT
<213> Hypocrea jecorina
<400> 23
Met Gln Gln Pro Pro Ser Leu Val Gly Asp Arg Ser Ile Thr Gly Leu
1 5 10 15
Gly Asp Ala Ala Ser Arg Pro Asn Leu Ser Ser Ser Ser Pro Thr Val
20 25 30
Thr Ser Ala Pro Ser Ala Pro Thr Ser Pro Pro Pro Arg Pro Pro Ile
35 40 45
Ser Leu Asn Pro Pro Ser Arg Glu Pro Pro Gly Val Glu Pro Val Leu
50 55 60
Arg Ile Thr Pro Val Pro Arg Ser Val Phe Ala Ser Val His Gln Pro
65 70 75 80
Arg Lys Ser Ser Leu Val Gln Thr Ser His Val Leu Pro Ser Pro Arg
85 90 95
Thr Ala Ala Ala Ala His His His His Pro Val Ser His Ser Ala Ser
100 105 110
Gly Ser Ser Gly Ser Asn Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser
115 120 125
Gly Asn Leu Leu Arg Gln Thr His Arg Asp Thr Val His Pro Pro Val
130 135 140
Lys Arg Pro Ser Thr Pro Ser Ser His Pro Thr Arg Gly Ala Ser Thr
145 150 155 160
Gly Ala Ser Pro Gln Gln Gly Ala Ser Ser Arg Asn Arg Ser Ser Thr
165 170 175
Ser Pro Val Ser Ser Pro Ala Ser Arg Thr Pro Pro Tyr Ala Ser Arg
180 185 190
Gln Ala Ser Val Ser His Ser Arg Gln Gln His Asn His His His Gln
195 200 205
His Gln His Gln His Tyr His Ser His Thr Ser Ser Thr Thr Ser Arg
210 215 220
Ala Ser Ile Glu Ala Val Val Gly Ala Val Pro Asp Pro Ser Gly His
225 230 235 240
Arg Ala Pro Pro Lys Pro Arg Arg Pro Asp Arg Asn His Phe Gly Ala
245 250 255
Ser Asp Arg Ser Ala Thr Pro Thr Leu Ser His Phe Met Arg Ala Glu
260 265 270
Ser Ser Met Ser Met Arg His Tyr Glu Ser Gly Pro Leu Arg Ser Met
275 280 285
Ser Pro Asn Pro Tyr Gly Thr Pro Ala Ala Thr Thr Thr Ser Ser Thr
290 295 300
Ala Arg Met Pro His Glu Gln Ser His Asp Pro Tyr Ala Pro Arg Gly
305 310 315 320
His Ser Arg Asp His Ser Gly Lys Ser Ser Arg Asp Met Gly Lys Pro
325 330 335
Arg Ala Gln Lys Asn Pro Ser Gln Lys Ala Met Leu Ser Arg Ala Leu
340 345 350
Gln Lys Ala Asn Thr Ala Val Gln Leu Asp Asn Ala Gln Asn Phe Glu
355 360 365
Gly Ala Arg Glu Ala Tyr Ala Glu Ala Cys Asp Leu Leu Gln Gln Val
370 375 380
Leu Asp Arg Thr Pro Gly Asp Glu Asp Lys Arg Lys Leu Glu Ala Ile
385 390 395 400
His Gln Thr Tyr Thr Ser Arg Ile Asp Glu Leu Asp Gln Leu Gly Pro
405 410 415
Trp Gln Val Glu Thr Val Lys Ala Leu Pro Ala Arg Pro Glu Ser Glu
420 425 430
Glu Tyr Ser Ala Ser Ile Phe Ile Pro Gln Asp Tyr Asp Met Gly Asp
435 440 445
Glu Ala Pro Arg Ile Glu Thr Ala Arg Val Val Ser Tyr Ile Ala Gly
450 455 460
Asp Asn Ala Ser Pro Phe Ala Ala Ala Pro Asn Gln Trp Gln Gln Ser
465 470 475 480
Gly Gly His Thr Ala Ser Glu Arg Leu Gln Pro Asn Arg Gly Leu Glu
485 490 495
Pro Gly Leu Leu Gln Ser Ser Phe Ser Arg Ala Pro Arg Ser Pro Arg
500 505 510
Arg Leu Gln Ser Thr Asp Asp Leu Arg Ala Gln His Gln Glu Gly Gln
515 520 525
Tyr Ala Pro Pro Pro Leu Ser Pro Arg Ser Gln Ser Pro Val Lys Thr
530 535 540
His Asp His Asp Asp Asp Met Phe Ala Glu Leu Pro Pro His Glu Pro
545 550 555 560
Tyr Gln Tyr Gln Gln Glu His Asp His Gln Asp His His Gln Asp Tyr
565 570 575
His Gln His His Arg His His Asn His His His His Glu Arg Gln Pro
580 585 590
Ser Glu Thr Val Leu Ser Ser Tyr Glu Leu Gln Gly His Val Asp Gly
595 600 605
Gly Ile Gln Asn Ser Trp Leu Asp Pro Ile Asp Glu Ser Gly Gly Ser
610 615 620
Thr Ala Ser Ser Val His Ser Arg Thr Ser Ser Leu Gly Tyr Arg Arg
625 630 635 640
Arg His Ile Arg Ala Val Ser Gly Asn Thr Glu Ala Glu Phe Asp Thr
645 650 655
Ala Leu Asp Ala Ala Ile Glu Ala Ala Tyr Asp Asp Gly Tyr Glu Pro
660 665 670
Met Asp Ser Val Asp Tyr Gly Thr Ile Asp Ala Gly Gly Thr Ile Ala
675 680 685
Trp Gln Ala Tyr Cys Thr Arg Trp Arg Trp Arg Ala Asn Glu Arg Asp
690 695 700
Arg Arg Ser Arg Lys Pro Met Thr Ser Trp Pro Thr Ser Asp Arg Arg
705 710 715 720
Thr His Arg Ile Arg Ser Thr Ser Arg Arg Arg Thr Gly Ile Leu Pro
725 730 735
Arg Asp Ser Thr Arg Thr Thr Arg Leu Lys Arg Arg Arg Asp Tyr Trp
740 745 750
Thr Arg Leu His Ala Thr Leu Pro Leu Arg Thr Leu Pro Trp Lys Thr
755 760 765
Arg Met Ala His Arg Cys Gln Leu Gly Ser Arg Met His Gly Thr Arg
770 775 780
Thr Arg Arg Gly Arg Ile Ser Ser Arg Ala Ser Asp Pro Phe Leu Pro
785 790 795 800
Cys Arg Arg Gly His Pro Phe Leu Arg Pro Thr Pro Pro Thr Pro Arg
805 810 815
Ser Gln Gln Pro Pro Leu Arg His Pro His Cys Gln Thr Cys His Gln
820 825 830
Asp Ala Leu Val Lys Ile Gln Ser Asn Ser Arg Ser Arg Arg Gln Thr
835 840 845
Leu Tyr Lys Pro Arg Ser Arg Ser Met Thr Thr Thr Lys Ser Pro Gln
850 855 860
Ala Arg Lys Ser Arg Arg Pro Arg Arg Ser Ser Gly Arg Arg Ala Arg
865 870 875 880
Ser Leu
<210> 24
<211> 896
<212> PRT
<213> Trichoderma harzianum
<400> 24
Met Gly Ile Thr Ser Tyr Phe Lys Ala Ser Thr Lys Lys Ala Glu Gln
1 5 10 15
Glu Thr Ala Ala Pro Pro Ala Pro Pro Ala Lys Pro Val Ala Pro Pro
20 25 30
Arg Leu Gln Gln Glu Thr Arg Gln Ser Ile Met Ser Glu Lys Pro Pro
35 40 45
Ser Ser Val Ser Gly Asn Asp Met Asp Leu Gln Pro Pro Thr Pro Arg
50 55 60
Phe His Ser Arg Pro Gln Ser Ser Ser Gly Arg Ser Thr Pro Ser Met
65 70 75 80
Gln Ser Ser Met Phe Leu Asp Asp Ile Lys His Glu Val Met Val Asn
85 90 95
Tyr Leu Tyr Gln Gln Gln Cys Ser Gln Leu Trp Val Ser Asp Gly Ser
100 105 110
Gly Glu Ile Glu Gly Val Leu Leu Arg Lys Ala Arg Gly His Tyr Met
115 120 125
Ala Cys Pro Pro Gln Leu Ala Ser Ser Pro Phe Ala Leu Ala Cys Ala
130 135 140
Ala Leu Asn Val Gln Cys Ala Met Thr Val Asn Ser Arg Val Ile Lys
145 150 155 160
Thr Phe Leu Gln Trp Ser Pro Asp Ala Val Asp Val Pro Leu Met Asn
165 170 175
Gly Leu Arg Val Gln Ile Leu Pro Thr Ile Asp Asp Leu Pro Arg Ala
180 185 190
Arg Lys Tyr Gln Phe Ala Ala Phe Val Ala Ser Glu Gly Leu Leu Ile
195 200 205
Val Trp Asp Asp Asp Ala Leu His Leu Val Ala Arg Ala Lys Ala Ile
210 215 220
Glu Ser Glu Leu Met Glu Leu Val Trp Lys Ala Gly Asn Pro Asp Glu
225 230 235 240
Glu Gly Glu Asp Glu Lys Arg Ala Gln Pro Val Ala Glu Val Glu Ile
245 250 255
Asp Glu Glu Ser Gly Glu Ile Lys Pro Glu Lys Arg Pro Ile His Leu
260 265 270
Gln Asn Thr Val Leu Val Ser Leu Thr Leu Val Leu Val Thr Val Ser
275 280 285
Leu Gly Ala Ala Trp Arg Gln Leu Ala Ile Glu Val Ser Val Asp Asn
290 295 300
Thr Tyr Ile Arg Leu Ala Leu Val Ala Leu Ala Pro Val Gln Ile Phe
305 310 315 320
Phe Thr Leu Phe Phe Ala Gln Val Ile Val Gly Cys Leu Ala Gln Ile
325 330 335
Phe Gly Pro Ile Arg Gln Leu Thr Ile Asn Ser Lys Phe Tyr Ser Ala
340 345 350
Arg Pro Pro Pro Arg Leu Gln Ser Ala Ile Leu Pro His Val Thr Ile
355 360 365
Gln Cys Pro Val Tyr Lys Glu Gly Leu Gln Gly Val Ile Met Pro Thr
370 375 380
Val Lys Ser Ile Lys Gln Ala Met Ser Thr Tyr Glu Leu Gln Gly Gly
385 390 395 400
Ser Ala Asn Met Phe Ile Asn Asp Asp Gly Leu Gln Leu Ile Ser Glu
405 410 415
Glu Asp Arg Leu Ala Arg Ile Glu Phe Tyr Ala Asp Asn Ser Ile Gly
420 425 430
Trp Val Ala Arg Pro Lys His Gly Glu Asn Gly Phe Thr Arg Lys Gly
435 440 445
Lys Phe Lys Lys Ala Ser Asn Met Asn Phe Ala Leu Met Ile Ser Cys
450 455 460
Lys Val Glu Glu Lys Leu Gln Ala Ile Glu Arg Pro Pro Glu Trp Ser
465 470 475 480
Gln Asn Asp Glu Ala Leu Ala Tyr Glu Glu Ala Leu Lys Glu Val Leu
485 490 495
Glu Ala Asp Gly Arg Ala Trp Ala Asp Gly Asn Ile Arg Met Gly Asp
500 505 510
Tyr Ile Leu Leu Ile Asp Ser Asp Thr Arg Val Pro Ala Asp Cys Leu
515 520 525
Leu Asp Ala Val Ser Glu Met Glu Gln Ser Pro Asp Val Gly Ile Met
530 535 540
Gln Phe Ser Ser Gly Val Met Gln Val Val His Thr Tyr Phe Glu Asn
545 550 555 560
Gly Ile Thr Phe Phe Thr Asn Leu Ile Tyr Ser Ala Ile Arg Tyr Thr
565 570 575
Val Ser Asn Gly Asp Val Ala Pro Phe Val Gly His Asn Ala Ile Leu
580 585 590
Arg Trp Ser Ala Ile Gln Gln Val Ala Tyr Gln Asp Glu Asp Gly Tyr
595 600 605
Asp Lys Phe Trp Ser Glu Ser His Val Ser Glu Asp Phe Asp Met Ser
610 615 620
Leu Arg Leu Gln Val Asn Gly Tyr Ile Ile Arg Leu Ala Ala Trp Ala
625 630 635 640
Gly Glu Gly Phe Lys Glu Gly Val Ser Leu Thr Val Tyr Asp Glu Leu
645 650 655
Ala Arg Trp Glu Lys Tyr Ala Tyr Gly Cys Asn Glu Leu Leu Phe His
660 665 670
Pro Ile Arg Thr Trp Leu Trp Arg Gly Pro Phe Thr Pro Leu Phe Arg
675 680 685
Arg Phe Leu Phe Ser Asn Ile Arg Phe Thr Ser Lys Ile Thr Val Ile
690 695 700
Ser Tyr Ile Gly Thr Tyr Tyr Ala Ile Gly Ala Ala Trp Ile Leu Thr
705 710 715 720
Val Val Asn Tyr Phe Val Met Gly Trp Tyr Asn Gly Tyr Leu Asp Lys
725 730 735
Tyr Tyr Ile Asp Ser Trp Gln Val Trp Phe Ser Ile Ile Ile Val Phe
740 745 750
Asn Gly Leu Gly Asn Ile Ala Leu Ala Val Met Arg Tyr Arg Val Gly
755 760 765
Glu Arg Gly Leu Leu Tyr Ala Leu Phe Glu Asn Phe Met Trp Thr Leu
770 775 780
Met Leu Ala Ile Phe Leu Gly Gly Leu Ser Leu His Val Ser Gln Ala
785 790 795 800
Leu Leu Ala His Met Phe Glu Ile Asn Met Thr Trp Gly Ala Thr Ala
805 810 815
Lys Glu Ala Glu Phe Ser Asn Phe Phe Ile Glu Val Pro Lys Val Leu
820 825 830
Lys Lys Phe Lys Phe Ser Met Ile Phe Ser Leu Ile Phe Ile Ile Gly
835 840 845
Met Ile Leu Leu Ala Gln Ala Pro Phe Val Pro Tyr Asp Trp Gln Ile
850 855 860
Lys Asp Phe Val Ala Ile Leu Pro Met Ala Thr Val Ala Ala Ser His
865 870 875 880
Phe Leu Leu Pro Leu Ala Leu Asn Pro Ala Leu Met Thr Phe Ser Trp
885 890 895
Claims (24)
- 모 세포로부터 유래된 변형된 자낭균류(Ascomycota) 세포로서, 변형된 세포는 서열 번호 2, 서열 번호 4, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 변이체 LOV 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함하고, 변형된 세포는 동일한 조건 하에 발효될 때 모 세포에 비해 향상된 단백질 생산성 표현형을 포함하는, 변형된 자낭균류 세포.
- 제1항에 있어서, 관심 단백질(POI: protein of interest)을 암호화하는 폴리뉴클레오타이드를 포함하는, 변형된 세포.
- 제1항에 있어서, 서열 번호 19의 NIK1(M743T) 단백질을 암호화하는 폴리뉴클레오타이드 작제물을 포함하는, 변형된 세포.
- 제1항 내지 제3항 중 어느 한 항에 있어서, SSB7 MPG1, SFB3, SEB1, CRZ1, TSP2 및/또는 GAS1로 이루어진 군으로부터 선택된 단백질의 발현/생산을 결실시키거나 파괴시키거나 감소시키는 적어도 하나의 유전적 변형을 포함하는, 변형된 세포.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 자낭균류 세포는 트리초데르마 종(Trichoderma sp.), 아스페르길루스 종(Aspergillus sp.), 푸사륨 종(Fusarium sp.), 페니실리움 종(Penicillium sp.), 칸디다 종(Candida sp.), 크리소스포륨 종(Chrysosporium sp.), 세팔로스포륨 종(Cephalosporium sp.), 탈라로마이세스 종(Talaromyces sp.), 뉴로스포라 종(Neurospora sp.) 및 마이셀리오프토라 종(Myceliophthora sp.)으로부터 선택되는, 변형된 세포.
- 제5항에 있어서, 모 아스페르길루스 종 세포는 서열 번호 11 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고, 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함하는, 변형된 세포.
- 제5항에 있어서, 모 페니실리움 종 세포는 서열 번호 12 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고, 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함하는, 변형된 세포.
- 제5항에 있어서, 모 탈라로마이세스 종 세포는 서열 번호 13 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고, 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함하는, 변형된 세포.
- 제5항에 있어서, 모 푸사륨 종 세포는 서열 번호 14 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고, 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함하는, 변형된 세포.
- 제5항에 있어서, 모 마이셀리오프토라 종 세포는 서열 번호 15 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고, 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함하는, 변형된 세포.
- 제5항에 있어서, 모 뉴로스포라 종 세포는 서열 번호 16 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고, 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함하는, 변형된 세포.
- 제5항에 있어서, 모 칸디다 종 세포는 서열 번호 17 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고, 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함하는, 변형된 세포.
- 제5항에 있어서, 모 트리초데르마 종 세포는 서열 번호 2 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 자연적 LOV 단백질을 암호화하고, 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 폴리뉴클레오타이드 서열을 포함하는, 변형된 세포.
- 제1항 내지 제13항 중 어느 한 항의 변형된 세포에 의해 생산된 POI.
- 엄격한 혼성화 조건 하에 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18의 자연적 LOV 단백질을 암호화하고 서열 번호 2의 813번 위치에 상응하는 아미노산 서열 위치에서 트레오닌(T) 잔기를 포함하는 핵산 서열과 혼성화하는 야생형 폴리뉴클레오타이드 서열을 포함하는 모 세포로부터 유래된 변형된 자낭균류 세포로서, 변형된 세포는 엄격한 혼성화 조건 하에 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18의 LOV 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 아미노산 서열에서의 리신(K) 잔기를 포함하는 핵산 서열과 혼성화하는 변형된 폴리뉴클레오타이드 서열을 포함하는, 변형된 자낭균류 세포.
- 벡터로서, 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 변이체 LOV 단백질을 암호화하고, 서열 번호 4의 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 폴리뉴클레오타이드를 포함하는 벡터.
[청구항 16]
폴리뉴클레오타이드로서, 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18과 적어도 50%의 서열 동일성을 포함하는 변이체 LOV 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 폴리뉴클레오타이드. - 변이체 LOV 단백질을 암호화하는 폴리뉴클레오타이드로서, 변이체 단백질을 암호화하는 폴리뉴클레오타이드는 엄격한 혼성화 조건 하에 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18의 LOV 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 아미노산 서열 위치에서 리신(K) 잔기를 포함하는 핵산 서열과 혼성화하는, 폴리뉴클레오타이드.
- 모 균주로부터 유래된 돌연변이체 트리초데르마 균주로서, 돌연변이체 균주는 서열 번호 4 또는 서열 번호 18과 적어도 75%의 서열 동일성을 포함하는 LOV 변이체 단백질을 암호화하고 서열 번호 4의 813번 위치에 상응하는 서열 위치에서 리신(K) 잔기를 포함하는 유전자를 포함하는, 돌연변이체 트리초데르마 균주.
- 제18항에 있어서, 돌연변이체 균주는 모 균주에 비해 향상된 단백질 생산성 표현형을 포함하는, 돌연변이체 균주.
- 제18항 또는 제19항에 있어서, 서열 번호 19의 NIK1(M743T) 단백질을 암호화하는 폴리뉴클레오타이드 작제물을 포함하는, 돌연변이체 균주.
- 제18항 내지 제20항 중 어느 한 항에 있어서, SSB7, MPG1 SFB3, SEB1, CRZ1, TSP2 및 GAS1로 이루어진 군으로부터 선택된 적어도 하나의 단백질을 암호화하는 유전자의 발현/생산을 결실시키거나 파괴하거나 감소시키는 유전적 변형을 포함하는, 돌연변이체 균주.
- 제18항 내지 제21항 중 어느 한 항의 돌연변이체 균주에 의해 생산된 POI.
- 향상된 단백질 생산성 표현형을 포함하는 변형된 자낭균류 세포를 작제하는 방법으로서,
(a) 모 자낭균류 세포를 수득하고, 서열 번호 4의 813번 위치에 상응하는 서열 위치에서 리신(K) 잔기를 포함하는 LOV 변이체 단백질을 암호화하는 폴리뉴클레오타이드 작제물을 세포로 도입하는 단계, 및
(b) 단계 (a)의 변형된 세포를 단리시키는 단계를 포함하고,
변형된 세포는 모 세포에 비해 향상된 단백질 생산성 표현형을 포함하는, 방법. - 향상된 단백질 생산성 표현형을 포함하는 변형된 자낭균류 세포를 작제하는 방법으로서,
(a) 엄격한 혼성화 조건 하에 서열 번호 2, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17 또는 서열 번호 18의 LOV 단백질을 암호화하는 핵산 서열과 혼성화하는 야생형 lov 유전자를 포함하는 모 세포를 수득하는 단계,
(b) 단계 (a)의 모 세포를 변형시켜 서열 번호 2의 813번 위치에 상응하는 서열 위치에서 리신(K) 잔기를 포함하는 LOV (변이체) 단백질을 암호화하는 유전자를 포함하는 변형된 세포를 제조하는 단계, 및
(c) 단계 (b)의 변형된 세포를 단리시키는 단계를 포함하고,
변형된 세포는 모 세포에 비해 향상된 단백질 생산성 표현형을 포함하는, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862711846P | 2018-07-30 | 2018-07-30 | |
US62/711,846 | 2018-07-30 | ||
PCT/US2019/043348 WO2020028126A1 (en) | 2018-07-30 | 2019-07-25 | Mutant and genetically modified filamentous fungal strains comprising enhanced protein productivity phenotypes and methods thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210038591A true KR20210038591A (ko) | 2021-04-07 |
Family
ID=67539643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217005248A KR20210038591A (ko) | 2018-07-30 | 2019-07-25 | 향상된 단백질 생산성 표현형을 포함하는 돌연변이체 및 유전자 변형된 사상성 진균 균주 및 이의 방법 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20210301276A1 (ko) |
EP (1) | EP3830257A1 (ko) |
JP (1) | JP2021532775A (ko) |
KR (1) | KR20210038591A (ko) |
CN (1) | CN112654704A (ko) |
WO (1) | WO2020028126A1 (ko) |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1416045A1 (en) | 1990-10-05 | 2004-05-06 | Genencor International, Inc. | Composition containing a fungal cellulase for the treatment of cotton-containing fabrics |
US5246853A (en) | 1990-10-05 | 1993-09-21 | Genencor International, Inc. | Method for treating cotton-containing fabric with a cellulase composition containing endoglucanase components and which composition is free of exo-cellobiohydrolase I |
WO1992006183A1 (en) | 1990-10-05 | 1992-04-16 | Genencor International, Inc. | Methods for treating cotton-containing fabrics with cellulase |
WO1992006221A1 (en) | 1990-10-05 | 1992-04-16 | Genencor International, Inc. | Methods for treating cotton-containing fabrics with cellulase |
US6017870A (en) | 1996-10-09 | 2000-01-25 | Genencor International, Inc. | Purified cellulase and method of producing |
WO2002012465A2 (en) | 2000-08-04 | 2002-02-14 | Genencor International, Inc. | Mutant trichoderma reesei egiii cellulases, dna encoding such egiii compositions and methods for obtaining same |
EP2298876A1 (en) | 2003-03-21 | 2011-03-23 | Genencor International, Inc. | Novel cbh1 homologs and variant cbh1 cellulases |
DK2292747T3 (en) | 2004-12-30 | 2017-04-24 | Danisco Us Inc | CBH2 CELLULASE VARIETIES OF HYPOCREA JECORINA |
CA2699201C (en) | 2007-09-12 | 2017-04-18 | Danisco Us Inc. | Trichoderma promoter |
BR112013004419A2 (pt) | 2010-08-25 | 2016-05-31 | Danisco Us Inc | fungos filamentosos que têm um fenótipo de viscosidade alterada. |
KR101993939B1 (ko) * | 2011-04-22 | 2019-06-27 | 다니스코 유에스 인크. | 변경된 점성 표현형을 갖는 사상균 |
CA2833539C (en) | 2011-04-22 | 2021-04-27 | Danisco Us Inc. | Filamentous fungi having an altered viscosity phenotype |
US10655148B2 (en) | 2014-12-16 | 2020-05-19 | Danisco Us Inc | Compositions and methods for helper strain-mediated fungal genome modification |
EP3234150A1 (en) | 2014-12-16 | 2017-10-25 | Danisco US Inc. | Fungal genome modification systems and methods of use |
DK3256598T3 (da) | 2015-02-09 | 2021-01-11 | Danisco Us Inc | Svampestammer og anvendelsesfremgangsmåder |
-
2019
- 2019-07-25 US US17/264,061 patent/US20210301276A1/en active Pending
- 2019-07-25 JP JP2021505302A patent/JP2021532775A/ja active Pending
- 2019-07-25 WO PCT/US2019/043348 patent/WO2020028126A1/en unknown
- 2019-07-25 EP EP19749547.6A patent/EP3830257A1/en active Pending
- 2019-07-25 CN CN201980049956.1A patent/CN112654704A/zh active Pending
- 2019-07-25 KR KR1020217005248A patent/KR20210038591A/ko active Search and Examination
Also Published As
Publication number | Publication date |
---|---|
CN112654704A (zh) | 2021-04-13 |
WO2020028126A1 (en) | 2020-02-06 |
EP3830257A1 (en) | 2021-06-09 |
JP2021532775A (ja) | 2021-12-02 |
US20210301276A1 (en) | 2021-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019222857B2 (en) | Methods for producing polypeptides in protease-deficient mutants of Trichoderma | |
KR102616331B1 (ko) | 진균 균주 및 사용 방법 | |
JP7376505B2 (ja) | 粘性が低下した表現型を含む糸状菌株 | |
KR20140033046A (ko) | 변경된 점성 표현형을 갖는 사상균 | |
DK2733210T3 (en) | Process for improved protein production | |
JP2021510070A (ja) | タンパク質の産生増加のための変異及び遺伝子改変バチルス属(bacillus)細胞、並びにその方法 | |
US20230174998A1 (en) | Compositions and methods for enhanced protein production in filamentous fungal cells | |
US20240102070A1 (en) | Fungal strains comprising enhanced protein productivity phenotypes and methods thereof | |
KR20210038591A (ko) | 향상된 단백질 생산성 표현형을 포함하는 돌연변이체 및 유전자 변형된 사상성 진균 균주 및 이의 방법 | |
WO2024102556A1 (en) | Filamentous fungal strains comprising enhanced protein productivity phenotypes and methods thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |