KR20210005054A - 점도 감소 표현형을 포함하는 사상성 진균 균주 - Google Patents

점도 감소 표현형을 포함하는 사상성 진균 균주 Download PDF

Info

Publication number
KR20210005054A
KR20210005054A KR1020207032226A KR20207032226A KR20210005054A KR 20210005054 A KR20210005054 A KR 20210005054A KR 1020207032226 A KR1020207032226 A KR 1020207032226A KR 20207032226 A KR20207032226 A KR 20207032226A KR 20210005054 A KR20210005054 A KR 20210005054A
Authority
KR
South Korea
Prior art keywords
ser
pro
ala
leu
arg
Prior art date
Application number
KR1020207032226A
Other languages
English (en)
Inventor
엘리자베스 에이 보디
2세 로버트 제임스 프랫
마이클 워드
조나단 엠 팔머
Original Assignee
다니스코 유에스 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 다니스코 유에스 인크. filed Critical 다니스코 유에스 인크.
Publication of KR20210005054A publication Critical patent/KR20210005054A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/01Preparation of mutants without inserting foreign genetic material therein; Screening processes therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Mycology (AREA)
  • Biophysics (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Botany (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Toxicology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 발명의 본 균주 및 방법은 변경된 표현형, 변경된 형태, 변경된 성장 특징 등을 갖는 변이체 균주를 생성시키는 사상성 진균에서의 유전자 변형에 관한 것이다. 보다 구체적으로는, 본원에 제시되고 기재된 것처럼, 점도 감소 표현형을 포함하는 사상성 진균의 이러한 변이체 균주는 액침 배양에서의 성장(예를 들어, 상업적 분야에 대한 효소 및 다른 단백질 또는 대사물질의 대규모 제조)에 잘 맞는다.

Description

점도 감소 표현형을 포함하는 사상성 진균 균주
본 발명은 일반적으로 생물학, 분자 생물학, 레올로지, 사상성 진균, 산업적 단백질 제조 등의 분야에 관한 것이다. 보다 구체적으로는, 본 발명의 본 균주 및 방법은 변경된 표현형, 변경된 형태, 변경된 성장 특징 등을 갖는 변이체 균주를 생성시키는 사상성 진균에서의 유전자 변형에 관한 것이다. 보다 구체적으로는, 본원에 제시되고 기재된 것처럼, 사상성 진균의 이러한 변이체 균주는 액침 배양(submerged culture)에서의 성장(예를 들어, 상업적 분야에 대한 효소 및 다른 단백질 또는 대사물질의 대규모 제조)에 잘 맞는다.
관련 출원의 상호 참조
본 출원은 2018년 4월 24일자로 출원된 미국 특허 가출원 62/661,658호의 우선권을 주장하며, 본 가출원은 본원에 그 전체가 참고로 포함된다.
서열 목록의 언급
"NB40808-WO-PCT_SequenceListing.txt"로 명명된 서열 목록 텍스트 파일의 전자 제출 내용은 2019년 4월 05일자로 생성되었으며, 크기가 184 KB이고, 본원에 그 전체가 참고로 포함된다.
사상성 진균은 자연적 단백질 및 이종성 단백질을 높은 수준으로 발현할 수 있어서, 이것이 산업, 제약, 동물 건강, 식품 및 음료 분야 등에 대해 효소 및 다른 단백질 및/또는 대사물질의 대규모 제조에 매우 적합하다. 사상성 진균은 일반적으로 생물반응기(발효기)에서 균사체 액침 배양에서 성장하고, 생물반응기는 산소 및 영양소를 배양 배지(즉, 배양 브로스)로 도입하고 분포시키도록 적응된다. 균사체의 형태학적 특징은 배양 배지(브로스)의 레올로지 특성에 영향을 미쳐 생물반응기 성능에 영향을 미친다.
예를 들어, 사상성 진균 숙주 트리코데르마 레세이에서, 많은 자연적 단백질 및 이종성 단백질은 효과적으로 분비되어 글루코스의 비생산성(specific productivity)(Qp) 및 수율이 높다. 그러나, 트리코데르마 과정(즉, 일반적으로 사상성 진균)에 대한 용량 요건은 낮은 부피 생산성으로 인해 매우 높다. 예를 들어, 낮은 부피 생산성은 높은 배양 브로스 점도 및 산소 이동 제한으로 인해 바이오매스 수준의 제한의 필요성에 의해 생긴다.
일반적으로, 브로스의 점도가 더 높을수록, 산소 및 영양소의 분포가 덜 균일하고, 배양물을 교반하기 위해 필요한 에너지가 더 많다. 예를 들어, 일부 경우에, 배양 브로스의 점도는 산소 및 영양소의 용해를 상당히 방해하기에 충분히 높아져서, 진균의 성장 및/또는 진균에 의한 생성물 생성에 부정적으로 영향을 미친다. 추가로, 생물반응기에서 점성인 브로스를 혼합하고 에어레이션화하기 위한 파워는 제조 비용을 상당히 증가시키고, 모터 및 전원 공급기구의 면에서 더 높은 자본 비용을 초래할 수 있다. 따라서, 일반적으로 상기 기재된 것처럼, 비제한적인 예로서 부피 효율의 개선, 향상된/균일한 산소 분포, 세포 브로스 점도의 감소, 높은 비생산성, 탄소원에 대한 수율의 개선, 생물반응기 작동 비용의 감소, (세포) 표현형의 변경, (세포) 형태의 변경, (세포) 성장 특징의 변경 등을 포함하는 많은 진행 중이고 충족되지 않은 필요성이 당해 분야에 남아 있다.
변경된 표현형, 변경된 형태, 변경된 성장 특징 등을 갖는 변이체 균주를 생성시키는 유전자 변형을 갖는 사상성 진균과 관련된 균주, 방법, 작제물 등이 본원에 기재되어 있다. 예를 들어, 본 발명의 특정 구현예는 모 균주로부터 유래된 사상성 진균의 변이체 균주에 관한 것이고, 여기서 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함한다.
따라서, 특정 구현예에서, 본 발명은 모 균주로부터 유래된 사상성 진균의 변이체 균주에 관한 것이고, 여기서 변이체 균주는 서열 번호 2, 서열 번호 8, 서열 번호 9, 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 31, 서열 번호 33 및 서열 번호 35와 약 50%의 서열 동일성을 포함하는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 변이체 균주의 세포는 모 세포에 비해 점도 감소 표현형을 포함한다. 따라서, 특정 다른 구현예에서, 점도 감소 표현형을 포함하는 이러한 변이체 균주는 (a) 액침 배양에서의 호기성 발효 동안 모 균주의 세포에 비해 미리 선택된 용존 산소 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스를 생성하고/하거나, (b) 모 균주의 세포에 비해 미리 선택된 양의 교반에서 증가한 용존 산소 함량을 유지시키는 세포 브로스를 생성한다.
따라서, 다른 구현예에서, SSB7 단백질을 암호화하는 유전자의 유전자 변형은 SSB7 단백질을 암호화하는 유전자의 적어도 3' 영역을 결실시키거나 파괴시키는 것을 포함한다. 다른 구현예에서, 그 유전자에 의해 암호화된 SSB7 단백질은 SSB7 C 말단의 적어도 마지막 400번 아미노산 위치의 결실, SSB7 C 말단의 적어도 마지막 600번 아미노산 위치의 결실, SSB7 C 말단의 적어도 마지막 800번 아미노산 위치의 결실 또는 SSB7 C 말단의 적어도 마지막 1,000번 아미노산 위치의 결실을 포함한다. 다른 구현예에서, 그 유전자에 의해 암호화된 SSB7 단백질은 완전히 결실된다.
따라서, 특정 다른 구현예에서, ssb7 유전자는 SSB7 C 말단의 마지막 400번 아미노산 위치를 암호화하는 3' 영역에서 파괴되거나, ssb7 유전자는 SSB7 C 말단의 마지막 600번 아미노산 위치를 암호화하는 3' 영역에서 파괴되거나, ssb7 유전자는 SSB7 C 말단의 마지막 800번 아미노산 위치를 암호화하는 3' 영역에서 파괴되거나, ssb7 유전자는 SSB7 C 말단의 마지막 1,000번 아미노산 위치를 암호화하는 3' 영역에서 파괴된다.
관련 구현예에서, 모 균주 및 변이체 균주는 동일한 관심 단백질(POI: protein of interest)을 암호화하는 유전자를 포함한다. 다른 구현예에서, 변이체 균주는 바이오매스의 단위량당 모 균주와 실질적으로 동일한 양의 관심 단백질을 생산한다. 다른 구현예에서, 변이체 균주는 바이오매스의 단위량당 모 균주보다 더 많은 관심 단백질을 생산한다.
다른 구현예에서, 사상성 진균은 자낭균류(Ascomycota) 문이다. 다른 구현예에서, 사상성 진균은 트리코데르마 종(Trichoderma sp.) 진균, 푸사륨 종(Fusarium sp.) 진균, 뉴로스포라 종(Neurospora sp.) 진균, 마이셀리오프토라 종(Myceliophthora sp.) 진균, 탈라로마이세스 종(Talaromyces sp.) 진균, 아스페르길루스 종(Aspergillus sp.) 진균 및 페니실륨 종(Penicillium sp.) 진균으로 이루어진 군으로부터 선택된다.
따라서, 특정 다른 구현예에서, 본 발명은 본 발명의 점도 감소 변이체에 의해 생산된 하나 이상의 관심 단백질에 관한 것이다.
특정 다른 구현예에서, 변이체 균주는 MPG1 단백질, SFB3 단백질, SEB1 단백질, CRZ1 단백질 및/또는 GAS1 단백질을 암호화하는 하나 이상의 유전자의 유전자 변형을 추가로 포함한다.
다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 1의 ssb7 유전자 또는 이의 상보성 서열과 혼성화한다. 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 19의 ssb7 엑손 또는 이의 상보성 서열과 혼성화한다. 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 20의 ssb7 엑손 또는 이의 상보성 서열과 혼성화한다. 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 21의 ssb7 엑손 또는 이의 상보성 서열과 혼성화한다.
또 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 22의 영역 A를 암호화하는 핵산 서열과 혼성화한다. 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 23의 영역 B를 암호화하는 핵산 서열과 혼성화한다. 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 24의 영역 C를 암호화하는 핵산 서열과 혼성화한다. 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 25의 영역 D를 암호화하는 핵산 서열과 혼성화한다.
다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 SSB7 단백질의 보존된 아미노산 서열을 암호화하는 핵산 서열과 혼성화하고, 엄격한 혼성화 조건 하에 보존된 서열은 서열 번호 26 내지 30으로 이루어진 군으로부터 선택된다.
특정 다른 구현예에서, 본 발명은 사상성 진균 세포의 점도 감소 균주를 작제하는 방법에 관한 것이고, 이러한 방법은 (a) 사상성 진균 세포의 모 균주를 수득하고, 서열 번호 2, 서열 번호 8, 서열 번호 9, 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 31, 서열 번호 33 또는 서열 번호 35와 적어도 50%의 서열 동일성을 포함하는 SSB7 단백질을 암호화하는 유전자를 유전자 변형시키는 단계, 및 (b) 단계 (a)에서 변형된 변이체 균주를 단리시키는 단계(여기서, 변이체 균주의 세포는 모 세포에 비해 점도 감소 표현형을 포함함)를 포함한다. 따라서, 관련 구현예에서, 변이체 균주는 액침 배양에서의 호기성 발효 동안 (a) 모 균주의 세포에 비해 미리 선택된 용존 산소 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스를 생성하고/하거나, (b) 모 균주의 세포에 비해 미리 선택된 양의 교반에서 증가한 용존 산소 함량을 유지시키는 세포 브로스를 생성한다.
따라서, 상기 방법의 다른 구현예에서, SSB7 단백질을 암호화하는 유전자의 유전자 변형은 SSB7 단백질을 암호화하는 유전자의 적어도 3' 영역을 결실시키거나 파괴시키는 것을 포함한다.
특정 다른 구현예에서, 그 유전자에 의해 암호화된 SSB7 단백질은 SSB7 C 말단의 적어도 마지막 400번 아미노산 위치의 결실, SSB7 C 말단의 적어도 마지막 600번 아미노산 위치의 결실, SSB7 C 말단의 적어도 마지막 800번 아미노산 위치의 결실, SSB7 C 말단의 적어도 마지막 1,000번 아미노산 위치의 결실 등을 포함한다. 상기 방법의 다른 구현예에서, 그 유전자에 의해 암호화된 SSB7 단백질은 완전히 결실된다.
상기 방법의 특정 다른 구현예에서, ssb7 유전자는 SSB7 C 말단의 마지막 400번 아미노산 위치를 암호화하는 3' 영역에서 파괴되거나, ssb7 유전자는 SSB7 C 말단의 마지막 600번 아미노산 위치를 암호화하는 3' 영역에서 파괴되거나, ssb7 유전자는 SSB7 C 말단의 마지막 800번 아미노산 위치를 암호화하는 3' 영역에서 파괴되거나, ssb7 유전자는 SSB7 C 말단의 마지막 1,000번 아미노산 위치를 암호화하는 3' 영역에서 파괴되고, 기타 등등이다.
따라서, 특정 다른 구현예에서, 이러한 진균 세포는 관심 단백질을 암호화하는 유전자를 포함한다. 다른 구현예에서, 변이체 균주는 바이오매스의 단위량당 모 균주와 실질적으로 동일한 양의 관심 단백질을 생산한다. 다른 구현예에서, 변이체 균주는 바이오매스의 단위량당 모 균주보다 더 많은 관심 단백질을 생산한다. 따라서, 특정 다른 구현예에서, 본 발명은 본 발명의 변이체 균주에 의해 생산된 관심 단백질에 관한 것이다.
상기 방법의 특정 다른 구현예에서, 사상성 진균은 자낭균류 문이다. 다른 구현예에서, 사상성 진균은 트리코데르마 종 진균, 푸사륨 종 진균, 뉴로스포라 종 진균, 마이셀리오프토라 종 진균, 탈라로마이세스 종 진균, 아스페르길루스 종 진균 및 페니실륨 종 진균으로 이루어진 군으로부터 선택된다.
상기 방법의 다른 구현예에서, 변이체 균주는 MPG1 단백질, SFB3 단백질, SEB1 단백질, CRZ1 단백질 및/또는 GAS1 단백질을 암호화하는 하나 이상의 유전자의 유전자 변형을 추가로 포함한다.
상기 방법의 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 1의 ssb7 유전자 또는 이의 상보성 서열과 혼성화한다. 특정 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 19의 ssb7 엑손 또는 이의 상보성 서열과 혼성화한다. 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 20의 ssb7 엑손 또는 이의 상보성 서열과 혼성화한다. 또 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 21의 ssb7 엑손 또는 이의 상보성 서열과 혼성화한다.
상기 방법의 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 22의 영역 A를 암호화하는 핵산 서열과 혼성화한다. 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 23의 영역 B를 암호화하는 핵산 서열과 혼성화한다. 또 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 24의 영역 C를 암호화하는 핵산 서열과 혼성화한다. 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 25의 영역 D를 암호화하는 핵산 서열과 혼성화한다. 상기 방법의 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 SSB7 단백질의 보존된 아미노산 서열을 암호화하는 핵산 서열과 혼성화하고, 보존된 서열은 서열 번호 26 내지 30으로 이루어진 군으로부터 선택된다.
특정 다른 구현예에서, 본 발명은 점도 감소 표현형을 포함하는 사상성 진균 세포의 변이체 균주를 스크리닝하고 단리시키는 방법에 관한 것이고, 상기 방법은 (a) 서열 번호 2, 서열 번호 8, 서열 번호 9, 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 31, 서열 번호 33 또는 서열 번호 35와 적어도 50%의 서열 동일성을 포함하는 SSB7 단백질을 암호화하는 모 진균 균주에서의 유전자를 유전자 변형시키는 단계, (b) 모 균주의 세포 형태에 대하여 점도 감소 표현형을 위해 단계 (a)의 변형된 변이체 균주의 세포 형태를 스크리닝하는 단계, 및 (c) 점도 감소 표현형을 포함하는 단계 (b)의 변형된 변이체 균주를 단리시키는 단계를 포함하고, 여기서 변이체 균주는 액침 배양에서의 호기성 발효 동안 (a) 모 균주의 세포에 비해 미리 선택된 용존 산소 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스를 생성하고/하거나, (b) 모 균주의 세포에 비해 미리 선택된 양의 교반에서 증가한 용존 산소 함량을 유지시키는 세포 브로스를 생성한다. 다른 구현예에서, 단계 (c)의 변이체 균주는 이것이 유래된 모 균주에 비해 더 짧은 균사 필라멘트와 관련된 점도 감소 표현형을 포함한다(도 2).
생물학적 서열의 간단한 설명
서열 번호 1은 서열 번호 2의 자연적 SSB7 단백질을 암호화하는 야생형 T. 레세이 ssb7 유전자의 핵산 서열이다.
서열 번호 2는 서열 번호 1에 의해 암호화된 자연적 T. 레세이 SSB7 단백질의 아미노산 서열이다.
서열 번호 3은 프레임 쉬프트(fs) 돌연변이 및 ssb7 유전자의 마지막 인트론 전의 조기 종결 코돈을 생성시키는 엑손 2에서의 G의 결실(Δ)을 포함하는 대립유전자 ssb7(fs)의 핵산 서열이다.
서열 번호 4는 서열 번호 3의 대립유전자 ssb7(fs)에 의해 암호화된 변이체 SSB7 단백질의 아미노산 서열이다.
서열 번호 5는 도 6a에 제시된 합성 gBlock 핵산 서열이다.
서열 번호 6은 도 6b에 제시된 ssb7 유전자의 합성 gBlock 단일-가이드 RNA(sgRNA) 발현 카세트 표적화 TS1이다.
서열 번호 7은 도 6c에 제시된 ssb7 유전자의 합성 gBlock 단일-가이드 RNA(sgRNA) 발현 카세트 표적화 TS2이다.
서열 번호 8은 푸사륨 종 SSB7 단백질 오솔로그의 아미노산 서열이다.
서열 번호 9는 뉴로스포라 종 SSB7 단백질 오솔로그의 아미노산 서열이다.
서열 번호 10은 마이셀리오프토라 종 SSB7 단백질 오솔로그의 아미노산 서열이다.
서열 번호 11은 탈라로마이세스 종 SSB7 단백질 오솔로그의 아미노산 서열이다.
서열 번호 12는 아스페르길루스 종 SSB7 단백질 오솔로그의 아미노산 서열이다.
서열 번호 13은 페니실륨 종 SSB7 단백질 오솔로그의 아미노산 서열이다.
서열 번호 14는 T. 레세이 MPG1 단백질의 아미노산 서열이다.
서열 번호 15는 T. 레세이 SFB3 단백질의 아미노산 서열이다.
서열 번호 16은 T. 레세이 SEB1 단백질의 아미노산 서열이다.
서열 번호 17은 T. 레세이 CRZ1 단백질의 아미노산 서열이다.
서열 번호 18은 T. 레세이 GAS1 단백질의 아미노산 서열이다.
서열 번호 19는 야생형 T. 레세이 ssb7 유전자 엑손 1의 핵산 서열이다.
서열 번호 20은 야생형 T. 레세이 ssb7 유전자 엑손 2의 핵산 서열이다.
서열 번호 21은 야생형 T. 레세이 ssb7 유전자 엑손 3의 핵산 서열이다.
서열 번호 22는 SSB7 단백질 영역 A를 암호화하는 T. 레세이 핵산 서열이다.
서열 번호 23은 SSB7 단백질 영역 B를 암호화하는 T. 레세이 핵산 서열이다.
서열 번호 24는 SSB7 단백질 영역 C를 암호화하는 T. 레세이 핵산 서열이다.
서열 번호 25는 SSB7 단백질 영역 D를 암호화하는 T. 레세이 핵산 서열이다.
서열 번호 26은 도 9c에 도시된 바와 같은 보존된 SSB7 아미노산 서열이다.
서열 번호 27은 도 9c에 도시된 바와 같은 보존된 SSB7 아미노산 서열이다.
서열 번호 28은 도 9d에 도시된 바와 같은 보존된 SSB7 아미노산 서열이다.
서열 번호 29는 도 9d에 도시된 바와 같은 보존된 SSB7 아미노산 서열이다.
서열 번호 30은 도 9e에 도시된 바와 같은 보존된 SSB7 아미노산 서열이다.
서열 번호 31은 T. 아트로비리데(atroviride) SSB7 단백질의 아미노산 서열이다.
서열 번호 32는 서열 번호 33의 예측된 SSB7 단백질을 암호화하는 T. 레세이(QM6a 균주) ssb7 유전자의 핵산 서열 예측이다.
서열 번호 33은 서열 번호 32에 의해 암호화된 T. 레세이(QM6a 균주) 예측된 SSB7 단백질의 아미노산 서열이다.
서열 번호 34는 서열 번호 35의 예측된 SSB7 단백질을 암호화하는 T. 레세이(RUT-C30 균주) ssb7 유전자의 핵산 서열 예측이다.
서열 번호 35는 서열 번호 34에 의해 암호화된 T. 레세이(RUT-C30 균주) 예측된 SSB7 단백질의 아미노산 서열이다.
서열 번호 36은 T. 레세이 ssb7 유전자 전사체의 5'-UTR(비번역 영역)이다.
서열 번호 37은 T. 레세이 ssb7 유전자 전사체의 3'-UTR(비번역 영역)이다.
서열 번호 38은 자연적 T. 레세이 Nik1 단백질의 아미노산 서열이다.
도 1은 본원에 개시되고 예시된 ssb7 대립유전자를 예시하는 ssb7 유전좌위의 도시적 다이어그램이다.  보다 구체적으로는, 실시예 부문에 제시되고 기재된 것처럼, 사상성 진균의 이러한 변이체 균주(즉, 돌연변이된 ssb7 대립유전자를 포함)는 야생형 ssb7 대립유전자를 포함하는 모 (대조군) 균주에 비해 점도 감소 표현형/형태(즉, 점도가 감소한 발효 브로스를 생성)를 포함한다.  따라서, 도 1a에 제시된 것처럼, ssb7 유전자에 대한 예측된 SSB7 단백질 암호화 서열에 대응하는 영역(즉, 엑손)은 화살표로 표시되고, 엑손 사이의 선은 인트론의 위치를 나타낸다.  상이한 버전의 ssb7에 대한 유전자 예측, 및 본원에 기재된 예측("SSB7 CDS(푸나노테이트(funannotate))")은 이의 표지(예를 들어, "QM6a JGI ssb7 PID 108712" 및 "RUT-C30 PID 82397")에 의해 표시된다. 이 유전좌위로 맵핑된 RNA-서열분석 판독의 요약은 커버리지 맵(RNA 판독 커버리지)에 도시되어 있다. 푸나노테이트에 의해 예측된 5'-비번역 영역 및 3'-비번역 영역(UTR)은 또한 그렇게 표시되고 표지된다. 서열 밑의 각각의 트랙은 본원에 개시되고 예시된 다섯(5)개의 상이한 대립유전자(예를 들어, 대립유전자 ssb7(fs), 대립유전자 ssb7(311), 대립유전자 ssb7(TS1), 대립유전자 ssb7(TS2) 및 대립유전자 ssb7(339fs))를 예시한다.  박스(예를 들어, "pRATT311 왼쪽 플랭크", "pRATT311 오른쪽 플랭크", "pRATT339 왼쪽 플랭크" 및 "pRATT339 오른쪽 플랭크" 표지됨)는 ssb7 유전좌위에서의 마커(예를 들어, pyr2)의 통합을 목표로 하도록 사용된 상동성 박스를 보여주고; 박스(예를 들어, "TS1" 및 "TS2" 표지됨)는 cas9 매개된 유전자 편집에 사용된 표적 서열(TS: Target Sequence)을 보여준다. 대립유전자에 존재하는 다형성(즉, 돌연변이 및 삽입-결실)은 작은 비표지된 박스로(즉, 이 해상도에서 가능한 최고로) 제시된다. 더욱이, 대립유전자 주석 아래에 박스로 표지된 A-D가 있는데, 하기 실시예 1에 추가로 기재된 것처럼 내부의 아미노산 보존의 네(4)개의 영역(즉, 도 1a, 영역 A-D)의 암호화 서열에서의 위치를 나타낸다.  명확성을 위해, 더 높은 서열 해상도에서, 도 1b는 모두 각각의 대립유전자(ssb7(fs), ssb7(311), ssb7(TS1), ssb7(TS2)ssb7(399fs))에 대해 균주 Morph 77B7에서 확인된 프레임 쉬프트(fs) 부위 주위의 유전자 변형을 제시한다.
도 2는 DNA 단편 1 및 6에 의한 형질전환에 의한 T. 레세이 돌연변이체 균주 Morph 77B7 균사 표현형의 상보성을 보여준다. 도 2에 도시된 것처럼, DNA 단편 1(도 2, 패널 1A 및 패널 1B) 및 DNA 단편 6(도 2, 패널 6A 및 패널 6B)은 각각의 DNA 단편(즉, DNA 단편 1 및 단편 6)에 대한 독립적인 형질전환체를 나타낸다. 대부분의 DNA 단편을 보유하는 형질전환체는 돌연변이체 균주인 Morph 77B7에 대해 관찰된 과분지하고 두꺼운 균사 표현형을 보유하였다. 예를 들어, 도 2, 패널 1A 및 패널 1B에 도시된 것처럼, DNA 단편 1을 포함(균주 Morph 77B7에서의 다른 돌연변이체 유전좌위(즉, PID 112328) 중 하나를 암호화)하는 형질전환체는 이 과분지하고 두꺼운 균사 표현형을 예시한다. 반대로, 도 2, 패널 6A 및 패널 6B에 도시된 것처럼, DNA 단편 6을 포함(즉, PID 108712/SSB7을 암호화)하는 형질전환체만이 적어도 부분적으로 더 얇고 덜 분지된 균사로 이 표현형을 반전시켰다.
도 3은 자연적 SSB7 단백질(도 3b, 서열 번호 2)을 암호화하는 T. 레세이 야생형 ssb7 유전자(도 3a, 서열 번호 1)의 핵산 서열 및 변이체 SSB7 단백질(즉, C 말단 절두된 SSB7 단백질)을 암호화하는 T. 레세이 돌연변이체 ssb7 대립유전자(ssb7(fs), 도 3c, 서열 번호 3)의 핵산 서열을 제시하고, 여기서 암호화 서열 영역은 대문자로 제시하고, 인트론은 이탤릭 소문자로 제시한다. 도 3c에 도시된 것처럼, 돌연변이체 ssb7 대립유전자의 핵산 서열에서의 (ΔG) 프레임 쉬프트 돌연변이의 부위에 인접한 뉴클레오타이드는 볼드체 대문자 및 밑줄 표시된 문자 GA 로 제시된다.
도 4는 엑손 1(도 4a, 서열 번호 19), 엑손 2(도 4b, 서열 번호 20) 및 엑손 3(도 4c, 서열 번호 21)으로서 T. 레세이 ssb7 유전자 (ORF) 암호화 서열을 제시한다.
도 5는 SSB7 단백질의 아미노산 보존을 예시하는 그래프 표시이다. 보다 구체적으로는, 도 5N 말단 MIT 도메인에 걸친 아미노산이 결여된 짧은 단백질 예측을 제외하고 삼백오십삼(353)개의 자냥균 동족체의 MUSCLE 정렬의 그래프 표시이다. 도 5의 하부에 T. 레세이 SSB7 단백질의 아미노산 서열을 나타내는 박스가 있고, 여기서 아미노산(잔기)은 85% 초과의 정렬된 서열에서 보존되면 흑색(또는 그렇지 않으면 밝은 회색임) 박스에 제시된다. 도 5에 제시된 것처럼, 서열 정렬에서의 아미노산 서열 갭은 잔기들 간의 회색 음영 선으로 제시된다. 잔기 아래의 단일 회색 박스는 PID 108712/SSB7에 대해 다운로드된 GeneBank EGR47392 서열에 주석이 첨가된 MIT 도메인을 나타낸다. 평균 소수화도 및 등전점(PI)이 또한 작도되어 도 5에 제시된다. 정렬에서의 아미노산 동일성은 잔기 바로 위에 작도된다. 막대 높이는 아미노산 동일성에 비례한다. 회색 막대는 정렬에서 서열의 적어도 30%에서 동일한 잔기를 나타내고, 흑색 막대는 30% 미만에서 동일한 잔기를 나타낸다. 정렬은 SSB7 동족체에서의, 박스 표지된 A 내지 D로 표시된, 네(4)개의 보존 영역인 영역 A 내지 D를 밝혀냈다. 영역 A는 MIT 도메인에 대응한다.
도 6ssb7 유전좌위에서의 cas9 매개된 게놈 편집에 대한 pTrex2g MoCas에 첨가된 합성 DNA 서열을 제시한다.  예를 들어, 서열 번호 5(도 6a)는 ssb7 유전좌위를 편집하기 위한 서열 정보를 갖는 IDT gBlock 핵산 서열이고, 서열 번호 6(도 6b)은 77B7 TS1 sgRNA의 발현을 위한 IDT gBlock이고, 서열 번호 7(도 6c)은 77B7 TS2 sgRNA의 발현을 위한 IDT gBlock이다.  도 6a에 제시된 것처럼, 단일 밑줄 표시된 뉴클레오타이드는 시험관내 플라스미드 어셈블리에 사용된 pTrex2gHyg MoCas와의 서열 동일성의 영역을 보여주고, 이중 밑줄 표시된 뉴클레오타이드는 가이드 RNA 서열에 대응하는 20-nt 표적 부위를 나타내고, 대문자 볼드체 잔기는 표적 부위에 인접한 프로토스페이서 인접 모티프(PAM: protospacer adjacent motif) 부위를 변경시키는 G→C 뉴클레오타이드 변화를 나타내고, 회색 음영 뉴클레오타이드는 야생형 유전자에서는 일곱(7)개의 G인 여섯(6)개의 G 잔기를 보여준다. 도 6b도 6c에 제시된 것처럼, 단일 밑줄 표시된 뉴클레오타이드는 시험관내 플라스미드 어셈블리에 사용된 pTrex2gHyg MoCas와의 서열 동일성의 영역을 보여주고, 소문자 뉴클레오타이드는 T. 레세이 게놈에서의 표적 부위를 보여주고, 이중 밑줄 표시된 뉴클레오타이드는 sgRNA의 서열을 나타내고, 회색 음영 뉴클레오타이드는 인트론 서열을 보여준다.
도 7은 대립유전자 ssb7(311) 및 대립유전자 ssb7(TS1)에 의한 발효 브로스 점도 감소를 보여주는 데이터를 제시한다. 보다 구체적으로는, 도 7은 (모) TrGA 29-9 및 (딸) ssb7 돌연변이체 유래 균주의 생물반응기 발효에 대한 "교반" 및 "용존 산소 (DO)" 프로필을 보여준다. 교반(도 7, 'x'로 표시된 왼쪽 y축(RPM); t=0 전에 위로의 경향) 및 용존 산소(도 7, '|'로 표시된 오른쪽 y축(DO%); t=0 전에 아래로의 경향)의 양은 교반-추가 및 DO-제한 측정을 계산하기 위해 사용된 시간 범위(플러스 및 마이너스 10시간)에 대하여 공급 시작 조정된 발효 시간(x축)에 대해 작도되었다. 모 TrGA 29-9("29-9": 흑색) 및 2개의 ssb7 돌연변이체 (딸) 균주 (TrGA 29-9 ssb7(311): 회색) 및 (TrGA 29-9 ssb7(TS1): 흰색)의 프로필이 작도되었다.
도 8은 일반적으로 야생형 T. 레세이 SSB7 단백질(서열 번호 2)의 아미노산 조성 및 관련 특성을 보여준다. 도 8a는 서열 번호 2의 PEPSTATS 분석을 보여주고, 여기서 SSB7 단백질은 1,308개의 잔기, 142,540(Da)의 추정된 (이론적) 분자량, 대략 6.8의 등전점 및 +10의 근사 순 전하를 포함한다. SSB7 단백질은, 도 8a에 제시된 것처럼, 몰 백분율(%)에 기초하여 대략 12.0%(157)의 세린(S) 잔기, 9.6%(126)의 알라닌(A) 잔기, 9.6%(126)의 프롤린(P) 잔기, 6.8%(89)의 류신(L) 잔기, 5.8%(76)의 글루타민(Q) 등을 포함한다. 도 8b는 (문헌[Kyte-Doolittle Hydropathy Index, 9-residue window, Kyte and Doolittle, 1982]에 따라) 서열 번호 2의 1번 내지 1,308번 잔기 위치를 포함하는 자연적 (전장) SSB7 단백질의 소수성 도표이다. 예를 들어, 도 8c-도 8f는 서열 번호 2의 N 말단(1번 잔기)에서 시작하고 C 말단(1,308번 잔기)에서 끝나는 대략 320개의 잔기 범위에서 SSB7 단백질의 서열(서열 번호 2)의 1,308개의 잔기에 걸친 SSB7 단백질의 소수성 도표를 제시하고, 여기서 도 8c는 SSB7 단백질 1번 내지 320번 잔기(서열 번호 2)의 소수성 도표를 보여주고, 도 8d는 SSB7 단백질 321번 내지 640번 잔기(서열 번호 2)의 소수성 도표를 보여주고, 도 8e는 SSB7 단백질 641번 내지 961번 잔기(서열 번호 2)의 소수성 도표를 보여주고, 도 8f는 SSB7 단백질 962번 내지 1,308번 잔기(서열 번호 2)의 소수성 도표를 보여준다. 도 8g도 8b-도 8f에 사용된 Kyle-Doolittle 아미노산 소수성 점수를 보여준다. 따라서, 도 8b-도 8g에 제시된 것처럼, SSB7 단백질 서열의 소수성 영역은 0 초과의 점수 값으로 표시되고, SSB7 단백질 서열의 친수성 영역은 0 미만의 점수 값으로 표시된다(예를 들어, 잔기 값 도 8g 참조). 예를 들어, 도 8c는 SSB7 단백질(N 말단 1번 내지 320번 잔기)의 소수성 도표를 제시하고, 여기서 1번 내지 320번 잔기의 단일 문자 아미노산 서열은 소수성 도표 바로 위에 도시된다.
도 9는 여섯(6)개의 상이한 자낭균류 SSB7 단백질 오솔로그와 정렬된 야생형 트리코데르마 레세이 SSB7 단백질("SID_2"로 축약; 볼드체 대문자 아미노산 잔기로 제시됨) 및 야생형 트리코데르마 아트로비리데 SSB7 단백질("SID_31"로 축약)의 CLUSTAL W (1.83) 다중 서열 정렬을 제시한다. 보다 구체적으로는, 도 9a-도 9e에 제시된 것처럼, 푸사륨 종 SSB7 단백질(서열 번호 8; "SID_8"로 축약), 뉴로스포라 종 SSB7 단백질(서열 번호 9; "SID_9"로 축약), 마이셀리오프토라 종 SSB7 단백질(서열 번호 10; "SID_10"으로 축약), 탈라로마이세스 종 SSB7 단백질(서열 번호 11; "SID_11"로 축약), 아스페르길루스 종 SSB7 단백질(서열 번호 12; "SID_12"로 축약), 페니실륨 종 SSB7 단백질(서열 번호 13; "SID_13"으로 축약) 및 야생형 트리코데르마 아트로비리데 SSB7 단백질(서열 번호 31)은 T. 레세이 SSB7 단백질(서열 번호 2)과 정렬되었다. 도 9a-도 9e에(즉, 정렬된 아미노 잔기 아래에) 제시된 것처럼, 별표(*)는 단일의 완전히 보존된 잔기를 갖는 위치를 나타내고, 콜론(:)은 강하게 유사한 특성의 그룹 간의 보존(즉, Gonnet PAM 250 행렬에서 0.5 초과의 점수)을 나타내고, 마침표(.)는 약하게 유사한 특성의 그룹 간의 보존(즉, Gonnet PAM 250 행렬에서 0.5 미만의 점수)을 나타낸다.
본원에 제시되고 기재된 것처럼, 본 발명은 비제한적인 예로서 부피 효율의 개선, 향상된/균일한 산소 분포, 세포 브로스 점도의 감소, 높은 비생산성, 탄소원에 대한 수율의 개선, 생물반응기(발효기) 작동 비용의 감소, (세포) 표현형의 변경, (세포) 형태의 변경, (세포) 성장 특징의 변경 등을 포함하는 사상성 진균 단백질 제조 및 이의 방법의 당해 분야에서의 소정의 계속되는 충족되지 않은 필요성을 해결한다. 따라서, 본 발명의 본 균주 및 방법은 일반적으로 이러한 변경된 표현형, 변경된 형태, 변경된 성장 특징 등을 갖는 변이체 균주를 생성시키는 사상성 진균에서의 유전자 변형에 관한 것이다. 보다 구체적으로는, 본원에 제시되고 기재된 것처럼, 사상성 진균의 이러한 변이체 균주는 효소 및 다른 단백질 또는 대사물질의 대규모 제조에 대해 액침 배양에서의 성장에 잘 맞는다.
따라서, 특정 구현예에서, 본 발명은 본원에 기재된 모 균주로부터 유래된 사상성 진균의 변이체 균주에 관한 것이다. 특정 구현예에서, 이러한 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함한다. 보다 구체적으로는, 특정 다른 구현예에서, 본 발명의 변이체 균주(즉, SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함)는 모 균주의 세포에 비해 미리 선택된 용존 산소(DO) 함량을 유지시키기 위해 감소한 양의 교반을 요하는(즉, 액침 배양에서의 호기성 발효 동안) 세포 브로스를 생성하고/하거나, 미리 선택된 양의 교반에서 증가한 DO 함량을 유지시키는(즉, 액침 배양에서의 호기성 발효 동안) 세포량을 생성한다.
예를 들어, 특정 구현예에서, 본원에서 작제되고 기재된 사상성 진균의 이러한 변이체 균주는 특히 본원에서 "점도 감소" 표현형이라 칭하는 변경된 세포 형태 표현형(예를 들어, 실시예 1 내지 실시예 3 및 도 2 참조)을 포함한다. 보다 구체적으로는, 실시예 1에 제시된 것처럼, "Morph 77B7"이라 명명된 T. 레세이 돌연변이체는 액침 액체 배양에서 특히 모체보다 더 짧고 더 두꺼운 필라멘트를 갖는 변경된 형태(표현형)를 갖는 것으로 관찰되었고, 여기서 Morph 77B7 돌연변이체는 또한 모체를 함유하는 배양물과 비교하여 성장 동안 더 높은 수준의 용존 산소(DO)을 나타냈다(실시예 1, 표 1 참조).
더욱이, 실시예 1에 기재된 것처럼, 오직 하나의 야생형 유전좌위는 본원에서 "ssb7"이라 명명된 돌연변이체(Morph 77B7) 표현형을 보완하고, 여기서 ssb7 유전자는 동일한 DNA 서열에서의 다른 단백질 예측과 부분적으로 중첩하는 새로 예측된 단백질인 SSB7, 예를 들어 트리코데르마 레세이 QM6a 단백질 ID(PID) 108712를 암호화한다(The Genome Portal of the Department of Energy Joint Genome Institute, Grigoriev et al., Nucleic Acids Res., 2011). 마찬가지로, 확인된 ssb7 돌연변이체 대립유전자는 엑손 2(T. 레세이 QM6a 스캐폴드 13, 167404)에서 단일 구아닌(G) 뉴클레오타이드 결실(ΔG)을 포함하고, 여기서 (ssb7 돌연변이체 대립유전자의) 엑손 2에서의 G의 결실은 프레임 쉬프트(fs) 돌연변이 및 ssb7 유전자의 마지막 인트론(인트론 2) 전의 조기 종결 코돈을 생성시키는데, 돌연변이체 대립유전자는 "ssb7(fs)"라 명명된다.
본 발명의 실시예 2는 ssb7 돌연변이가 발효(배양) 브로스 점도 감소(즉, 변경된 형태/표현형)의 원인인지를 추가로 검증하고, 여기서 ssb7 유전좌위는 모 T. 레세이 균주에서 특이적으로 돌연변이된다. 예를 들어, 두(2) 가지의 상이한 방법이 상동성 재조합에 의해 ssb7 돌연변이유발을 표적화하도록 사용되어서 본원에서 "ssb7(311)" 및 "ssb7(TS1)"이라 명명된 대립유전자를 생성시키고, 여기서 ssb7의 대립유전자 둘 다는 점도 감소 표현형을 나타냈다.
본 발명의 실시예 3은 추가로 시험되고, 이러한 ssb7 돌연변이체의 이용성을 확인하였고, 여기서 "ssb7(311)", "ssb7(339fs)" 및 "ssb7(TS2)"이라 명명된 ssb7의 세(3) 가지의 돌연변이체 대립유전자는 셀룰라아제의 자연적 칵테일을 발현하는 상이한 트리코데르마 레세이 계통("T4abc"라 명명)에서 또한 평가되었다. 이 배경에서 유래된 이 돌연변이체는 또한 본원에 기재된 점도 감소 표현형을 나타냈다.
따라서, 본원에 추가로 예시되고 기재된 것처럼, 본 발명의 점도 감소 표현형을 포함하는 사상성 진균의 이러한 변이체 균주는 모 균주의 세포에 비해 액침 배양에서의 호기성 발효 동안 미리 선택된 용존 산소(DO) 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스를 생성하고/하거나, 액침 배양에서의 호기성 발효 동안 미리 선택된 양의 교반에서 증가한 DO 함량을 유지시키는 세포량을 생성한다. 예를 들어, 사상성 진균 세포의 이러한 변이체 (딸) 균주의 세포량은 (비변형된) 모 균주의 세포량과 비교하여 점도 감소 표현형을 나타내고, 점도 감소는 하기 실시예 부문에 추가로 기재된 것처럼 용존 산소(DO) 함량 및 부가된 교반과 관련한 관찰을 설명한다.
따라서, 본 발명의 특정 다른 구현예는 사상성 진균 세포의 이러한 변이체 균주를 작제하는 방법, 이러한 변이체 균주를 스크리닝하는 방법, 이러한 변이체 균주를 사용하여 관심 단백질을 제조하는 방법 등에 관한 것이고, 여기서 변이체 균주는 모 균주의 세포에 비해 액침 배양에서의 호기성 발효 동안 미리 선택된 용존 산소(DO) 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스를 생성하고/하거나, 미리 선택된 양의 교반에서 증가한 DO 함량을 유지시키는 세포량을 생성한다.
I. 정의
본 발명의 균주 및 방법을 상세하게 기술하기 전에, 하기 용어가 명확함을 위하여 정의된다. 정의되지 않은 용어는 관련 분야에서 사용되는 통상적인 의미를 따라야 한다. 달리 정의되지 않는 한, 본원에 사용되는 모든 기술 용어 및 과학 용어는 본 발명의 조성물 및 방법이 적용되는 기술 분야의 당업자가 일반적으로 이해하는 것과 동일한 의미를 갖는다.
본원에 기재되는 것과 유사하거나 동등한 임의의 방법 및 물질이 본 발명의 조성물 및 방법의 실시 또는 시험에 또한 사용될 수 있지만, 대표적인 예시적인 방법 및 물질이 이제 기재된다. 본원에 인용된 모든 공보 및 특허는 그 전체가 참고로 포함된다.
본원에 사용된 바와 같이, 단수 관사("a", "an" 및 "the")는, 문맥상 명백하게 달리 기술하지 않는 한, 복수 지시어를 포괄한다.
청구범위는 임의의 선택적 요소를 제외하도록 작성될 수 있다는 것에 또한 유의한다. 따라서, 이러한 서술은 청구항 요소의 설명과 관련하여 "오로지(solely)", "단지(only)", "제외하는(excluding)", "포함하지 않는(not including)" 등과 같은 배타적인 용어를 사용하거나, "부정적" 한정 또는 이의 단서를 사용하는 것에 대한 선행적 근거로서 역할을 하기 위한 것이다.
본 발명을 읽을 때 당업자에게 명백해지는 것과 같이, 본원에 기술되고 예시된 개별적인 구현예의 각각은 본원에 기술된 본 발명의 조성물 및 방법의 범위 또는 사상으로부터 벗어나지 않고도 다른 몇몇 구현예들 중 임의의 구현예의 특징으로부터 쉽게 분리되거나 이 특징과 쉽게 조합될 수 있는 별개의 구성요소 및 특징을 갖는다. 임의의 언급된 방법은 언급된 사건의 순서로 또는 논리적으로 가능한 임의의 다른 순서로 수행될 수 있다.
본원에 기재된 바와 같은 조작, 작제 및 사용을 위한 사상성 진균 세포는 일반적으로 자낭균류 문(phylum Ascomycota), 주발버섯 아문(subphylum Pezizomycotina), 특히 영양 균사 상태를 갖는 진균에서 유래한다. 이러한 유기체는 비제한적인 예로서 트리코데르마 종, 아스페르길루스 종, 푸사륨 종, 페니실륨 종, 크리소스포륨 종, 세팔로스포륨 종, 탈라로마이세스 종, 게오스미티아 종, 뉴로스포라 종, 마이셀리오프토라 종 등을 포함하는 상업적으로 중요한 산업적 단백질 및 약학적 단백질의 제조에 사용되는 사상성 진균 세포를 포함한다. 예를 들어, 특정 구현예에서, 사상성 진균 세포 및 이의 균주는 트리코데르마 레세이(이전에 트리코데르마 론기브라치아툼(Trichoderma longibrachiatum) 및 하이포크레아 예코리나(Hypocrea jecorina)로 분류됨), 아스페르길루스 니게르(Aspergillus niger), 아스페르길루스 푸미가투스(Aspergillus fumigatus), 아스페르길루스 이타코니쿠스(Aspergillus itaconicus), 아스페르길루스 오리자에(Aspergillus oryzae), 아스페르길루스 니둘란스(Aspergillus nidulans), 아스페르길루스 테레우스(Aspergillus terreus), 아스페르길루스 소에(Aspergillus sojae), 아스페르길루스 쟈포니쿠스(Aspergillus japonicus), 뉴로스포라 크라사(Neurospora crassa), 페니실륨 푸니쿨로숨(Penicillium funiculosum), 페니실륨 크리소게눔(Penicillium chrysogenum), 탈라로마이세스 (게오스미티아) 에메르소니(Talaromyces (Geosmithia) emersonii), 푸사륨 베네나툼(Fusarium venenatum), 마이셀리오프토라 테르모필라(Myceliophthora thermophila), 크리소스포륨 루크노웬스(Chrysosporium lucknowense)(C1) 등을 포함하지만, 이들로 제한되지는 않는다.
본원에 사용된 바와 같이, 게놈 코디네이트(예를 들어, 스캐폴드 13, 167404)는 에너지부 산하 Joint Genome Institute(JGI)에 의해 생성된 트리코데르마 레세이 QM6a 게놈 서열 어셈블리의 버전 2를 참조한다. (The Genome Portal of the Department of Energy Joint Genome Institute, Grigoriev et al., Nucleic Acids Res 2012 Jan;40(Database issue): D26-32. doi: 10.1093/nar/gkr947). JGI 어셈블리된 스캐폴드 서열은 또한 뉴클레오타이드 수탁 번호 GL985056.1 내지 GL985132.1로 GeneBank(The National Center for Biotechnology)에 기탁되었다.
특정 구현예에서, 본원에 기재된 바와 같은 조작, 작제 및 사용을 위한 사상성 진균 세포는 일반적으로 자낭균류 문, 주발버섯 아문, 특히 영양 균사 상태를 갖고 ssb7 유전자(서열 번호 1)의 유전자(또는 유전자 동족체)를 포함하는 진균에서 유래한다.
다른 구현예에서, 본 발명의 변이체 균주(즉, SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함)는 MPG1, SFB3, SEB1, CRZ1 및/또는 GAS1 단백질을 암호화하는 유전자의 유전자 변형을 추가로 포함한다.
본원에 사용된 바와 같이, T. 레세이 MPG1 단백질은 국제 PCT 공보 WO2012/145584호(본원에 그 전체가 참고로 포함됨)에 기재된 바대로 서열 번호 14의 아미노산 서열을 포함한다.
본원에 사용된 바와 같이, T. 레세이 SFB3 단백질은 국제 PCT 공보 WO2012/027580호(본원에 그 전체가 참고로 포함됨)에 기재된 바대로 서열 번호 15의 아미노산 서열을 포함한다.
본원에 사용된 바와 같이, T. 레세이 SEB1 단백질은 국제 PCT 공보 WO2012/145595호(본원에 그 전체가 참고로 포함됨)에 기재된 바대로 서열 번호 16의 아미노산 서열을 포함한다.
본원에 사용된 바와 같이, T. 레세이 CRZ1 단백질은 국제 PCT 공보 WO2012/145596호(본원에 그 전체가 참고로 포함됨)에 기재된 바대로 서열 번호 17의 아미노산 서열을 포함한다.
본원에 사용된 바와 같이, T. 레세이 GAS1 단백질은 국제 PCT 공보 WO2012/145596호 및 WO2012/145592호(본원에 그 전체가 참고로 포함됨)에 기재된 바대로 서열 번호 18의 아미노산 서열을 포함한다.
다른 구현예에서, 본 발명의 트리코데르마 종 균주는 국제 PCT 공보 WO2016/130523호에 기재된 Nik1M743 돌연변이를 포함하고, Nik1M743 단백질은 서열 번호 38의 743번 위치에서의 메티오닌 치환을 포함한다.
특정 다른 구현예에서, 본 발명의 아스페르길루스 종 균주는 Nik1M786 돌연변이를 포함하고, Nik1M776 단백질은 국제 PCT 공보 WO2016/130523호(본원에 그 전체가 참고로 포함됨)에 기재된 바와 같은 786번 위치에서의 메티오닌 치환을 포함한다. 본원에 사용된 바와 같이, "모 세포", "모 진균 세포", "모 균주", "모 진균 균주", "사상성 진균 세포의 모 균주", "기준 균주" 등과 같은 어구는 상호 교환적으로 사용될 수 있고, "비변형된" 모 사상성 진균 세포를 지칭한다. 예를 들어, "사상성 진균 세포의 모 균주"는 "모" 세포 및 "딸" 세포가 하나의 유전자 변형만이 다르도록 사상성 진균 세포의 변이체 (딸) 균주를 생성하기 위해 "모" 세포의 게놈이 (예를 들어, 모 세포로 도입된 오직 하나의 유전자 변형을 통해) 변형되거나 변형 가능한 사상성 진균의 임의의 세포 또는 균주를 지칭한다.
본원에 사용된 바와 같이, "변이체 세포", "딸 세포", "변이체 균주", "딸 균주", "변이체 또는 딸 진균 균주", "사상성 진균 세포의 변이체 또는 딸 균주" 등과 같은 어구는 상호 교환적으로 사용될 수 있고, 사상성 진균 세포의 모 균주(또는 기준 균주)로부터 유래된(즉, 수득되거나 수득 가능한) 사상성 진균 세포의 변이체 균주를 지칭하고, 여기서 변이체 균주는 모 균주에 존재하지 않는 하나의 유전자 변형만을 포함하여서, 비교에 의하면 "모" 균주와 "변이체" 균주 간의 표현형 차이는 하나의 유전자 변형에 기인할 수 있다. 다르게 표현하면, 모 균주 및 변이체 균주는 변이체 균주로 "도입된" 단일 유전자 변형을 제외하고는 달리 동질유전자이다. 따라서, 본 발명에서, 모 균주 및 변이체 균주는 소정의 특징, 예컨대 유전자 변형, 발현 표현형, 형태 표현형 등을 갖는 것으로 기재될 수 있지만, 당업자는 이것이 기술적으로 이러한 특징을 갖는 모 균주 또는 변이체 균주의 세포라는 것을 이해할 것이고, "균주"는 편의를 위해 지칭된다.
특정 구현예에서, 비변형된 (모) 세포는 특히 이들로부터 유래된 유전자 변형된 (변이체/딸) 세포와 비교할 때(이에 대하여) "대조군 세포" 또는 "기준 세포"라 칭해질 수 있다.
본원에 사용된 바와 같이, (비변형된) 모 세포(즉, 대조군 세포)의 표현형/형태가 변이체 (딸) 세포의 표현형/형태와 비교될 때, "모" (비변형된) 세포 및 "딸" (변형된) 세포가 동일한 조건(예를 들어, 배지, 온도, pH 등과 같은 동일한 조건) 하에 성장/배양/발효된다고 이해될 것이다.
마찬가지로, 변이체 (변형된) 딸 세포에서의 동일한 POI의 제조에 대하여 (비변형된) 모 세포(즉, 대조군 세포)에서의 관심 단백질(POI)의 제조를 기재할 때, "모" 세포 및 "변이체" 세포가 본질적으로 동일한 조건(예를 들어, 배지, 온도, pH 등과 같은 동일한 조건) 하에 성장/배양/발효된다고 이해될 것이다.
본원에 사용된 바와 같이, "관심 단백질" 또는 "POI"는 사상성 진균 세포의 액침 배양에서 생산될 것이 요망되는 단백질이다. 이러한 단백질(POI)은 효소, 기질 결합 단백질, 표면 활성 단백질, 구조 단백질, 항체 등일 수 있고, 높은 수준으로 발현될 수 있다. 따라서, POI는 변이체 세포 및/또는 모 균주에 대해 내인성 유전자 또는 이종성 유전자에 의해 암호화될 수 있다. (POI를 암호화하는) 이종성 유전자는 (예를 들어, 본 발명의 하나 이상의 유전자 변형을 수행하기 전에, 동안에 또는 후에) 모 진균 균주 및/또는 변이체 진균 균주로 도입(예를 들어, 형질전환)될 수 있다. POI는 세포내로 발현될 수 있거나 분비된 단백질로서 발현될 수 있다. 일반적으로, POI는 산업, 제약, 동물 건강, 식품 및 음료 용도를 위해 상업적으로 중요하므로, 대규모로 생산하는 것이 바람직하다.
본원에 사용된 바와 같이, "호기성 발효"는 산소의 존재 하에서의 성장을 지칭한다.
본원에 사용된 바와 같이, 용어 "브로스", "세포 브로스", "발효 브로스" 및/또는 "배양 브로스"는 상호 교환적으로 사용되고, 총체적으로 액체 (액침) 배양에서 (i) 발효 (배양) 배지 및 (ii) 세포를 지칭한다.
본원에 사용된 바와 같이, 용어 "세포량(cell mass)"은 액체(액침) 배양물에 존재하는 세포 성분(온전한 세포와 용해된 세포를 포함)을 지칭한다. 세포량은 건조 세포 중량 또는 습윤 세포 중량으로 표현될 수 있다.
본원에 사용된 바와 같이, "점도"는 기계적 스트레스(예를 들어, 전단 스트레스 또는 인장 스트레스 등)에 의한 변형에 대한 유체의 저항의 측정치이다.
본 발명의 맥락에서, 점도는 또한 기계적 스트레스에 의한 변형에 대한 "세포 브로스"(상기 정의됨)의 저항을 지칭한다. 따라서, 특정 구현예에서, "점도"는 (예를 들어, 회전자/임펠러에 의해 제공/유도된 것처럼) 이러한 기계적 스트레스에 대한 "세포 브로스의 저항의 측정치"로서 본원에 정의된다. 그러나, 세포 브로스의 점도가 직접 측정하기 어려울 수 있으므로, 미리 선택된 양의 교반에서의 배양 브로스의 용존 산소(DO) 함량, 미리 선택된 DO 함량을 유지시키는 데 필요한 교반의 양, 미리 선택된 DO 함량을 유지시키기 위해 세포 브로스를 교반하는 데 필요한 파워의 양 또는 심지어 균사 형태와 같은 점도의 간접 측정치를 이용할 수 있다.
본원에 사용된 바와 같이, 사상성 진균 세포의 "점도 감소" 변이체 균주는 모 균주에 의해 생산된 동등한 세포 브로스와 비교하여 점도가 감소한(즉, 전단 스트레스 또는 인장 스트레스에 대한 저항이 감소한) 세포 브로스를 생성하는 변이체 균주를 지칭한다. 일반적으로, 동등한 세포 브로스는 필적하는 세포량을 갖는다. 특정 구현예에서, 점도의 임의의 직접 측정치 또는 간접 측정치와 관련하여 변이체 '점도 감소' 균주와 모 균주 사이의 차이는 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 또는 심지어 적어도 50% 이상이다. 사상성 진균 세포 브로스의 점도를 비교하는 방법이 본원에 기재되어 있다.
본원에 사용된 바와 같이, "용존 산소"(DO)는 부피/부피 단위로 측정된 바대로 액체 배지에 존재하는 산소(O2)의 양을 지칭한다. DO 수준은 발효에 걸쳐 높은 수준, 예를 들어 170%~100% 내지 20%, 100%~80% 내지 20%, 70% 내지 20%, 65% 내지 20%, 60% 내지 20%, 55% 내지 20%, 50% 내지 20%, 45% 내지 20%, 44% 내지 20%, 43% 내지 20%, 42% 내지 20%, 41% 내지 20%, 40% 내지 20%, 35% 내지 20%, 30% 내지 20%, 및 25% 내지 20%에서 유지될 수 있다. 특히, DO는 발효의 시작시 높을 수 있고, 발효가 진행하면서 줄어들도록 허용될 것이다. DO 수준은 발효 배지가 교반되는 속도에 의해(예를 들어, 젓는 속도에 의해, 및/또는 공기 또는 산소의 첨가 속도에 의해) 제어될 수 있다.  배양은 교반될 수 있고(예를 들어, 400 내지 700 RPM에서 저어짐), DO 수준은 공기 또는 산소 유속 및 임펠러 속도를 변경함으로써 20% 초과, 25% 초과, 30% 초과, 35% 초과, 40% 초과, 45% 초과, 50% 초과 및 55% 초과 또는 이보다 높게 유지된다.
본원에 사용된 바와 같이, 용어 "야생형" 및 "천연형"은 상호 교환적으로 사용되고, 자연계에서 발견되는 유전자, 단백질 또는 균주를 지칭한다.
본원에 사용된 바와 같이, "1차 유전자 결정부위"는 다른 유전자 또는 이의 유전자 조작의 부재 하에 특정 표현형을 부여하기에 필요하고 충분한 유전자 또는 이의 유전자 조작을 지칭한다. 보다 구체적으로는, 본 발명의 실시예 부문에 기재된 것처럼, 본원에서 "ssb7"이라 칭하는 사상성 진균 유전자는 본원에 기재된 "감소한" 점도 표현형을 부여하기에 필요하고 충분한 "1차 유전자 결정부위"이다.
본원에 사용된 바와 같이, 용어 "유전자"는 단백질 또는 RNA를 암호화하고 이의 발현을 유도하는 핵산을 지칭한다는 점에서 용어 "대립유전자"와 동의어이다. 사상성 진균의 발육 형태는 일반적으로 반수체이며, 따라서 특정 유전자의 단일 카피(즉, 단일 대립유전자)는 특정 표현형을 부여하기에 충분하다.
본원에 사용된 바와 같이, 용어 "폴리펩타이드" 및 "단백질"(및/또는 이의 각각의 복수 형태)은 펩타이드 결합에 의해 연결된 아미노산 잔기를 포함하는 임의의 길이의 중합체를 지칭하기 위해 상호 교환적으로 사용된다. 아미노산 잔기에 대한 통상적인 1문자 또는 3문자 코드가 본원에 사용된다. 중합체는 선형 또는 분지형일 수 있고, 변형된 아미노산을 포함할 수 있고, 비아미노산이 개재될 수 있다. 이 용어는 또한 자연적으로 또는 개입에 의해, 예컨대 이황화 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화 또는 표지 성분과의 접합과 같은 임의의 다른 조작 또는 변형에 의해 변형된 아미노산 중합체를 포함한다. 예를 들어, 아미노산의 하나 이상의 유사체(예를 들어, 비천연 아미노산 등을 포함)뿐만 아니라 당업계에 공지된 다른 변형을 함유하는 폴리펩타이드도 정의에 포함된다.
본원에 사용된 바와 같이, 용어 "유도체 폴리펩타이드/단백질"은 N 말단 및 C 말단 중 어느 하나 또는 둘 모두에 대한 하나 이상의 아미노산의 부가, 아미노산 서열에서의 하나의 또는 다수의 상이한 부위에서의 하나 이상의 아미노산의 치환, 단백질의 어느 하나 또는 양 말단에서의 또는 아미노산 서열에서의 하나 이상의 부위에서의 하나 이상의 아미노산의 결실, 및/또는 아미노산 서열에서의 하나 이상의 부위에서의 하나 이상의 아미노산의 삽입에 의해 단백질로부터 유래되거나 유래될 수 있는 단백질을 지칭한다. 단백질 유도체의 제조는 자연적 단백질을 암호화하는 DNA 서열의 변형, 적합한 숙주로 그 DNA 서열을 형질전환시키는 것 및 변형된 DNA 서열을 발현시켜 유도체 단백질을 형성하는 것에 의해 달성될 수 있다.
관련(및 유도체) 단백질은 "변이체 단백질"을 포함한다. 변이체 단백질은 소수의 아미노산 잔기에서의 치환, 결실, 및/또는 삽입에 의해 기준/모 단백질(예를 들어, 야생형 단백질)과 상이하다. 변이체 단백질과 모 단백질 사이에서 차이가 있는 아미노산 잔기의 수는 1개 이상, 예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 15개, 20개, 30개, 40개, 50개 이상의 아미노산 잔기일 수 있다. 변이체 단백질은 기준 단백질과 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 심지어 적어도 약 99% 이상의 아미노산 서열 동일성을 공유할 수 있다. 변이체 단백질은 또한 선택된 모티프, 도메인, 에피토프, 보존 영역 등에서 기준 단백질과 상이할 수 있다.
본원에 사용된 바와 같이, 용어 "상사 서열"은 관심 단백질(즉, 일반적으로 원래의 관심 단백질)과 유사한 작용, 3차 구조, 및/또는 보존 잔기를 제공하는 단백질 내의 서열을 지칭한다. 예를 들어, α-헬릭스 또는 β-시트 구조를 함유하는 에피토프 영역에서, 상사 서열에서의 대체 아미노산은 바람직하게는 동일한 특정 구조를 유지한다. 이 용어는 또한 뉴클레오타이드 서열, 및 아미노산 서열을 지칭한다. 일부 구현예에서, 아미노산의 대체가 유사한 기능 또는 개선된 기능을 나타내는 변이체 효소를 생성시키도록 상사 서열이 개발된다. 일부 구현예에서, 관심 단백질에서의 아미노산의 3차 구조 및/또는 보존 잔기는 관심 분절 또는 관심 단편에서 또는 그 근처에 위치한다. 따라서, 관심 분절 또는 관심 단편이 예를 들어 α-헬릭스 또는 β-시트 구조를 함유하는 경우, 대체 아미노산은 바람직하게는 그 특정 구조를 유지시킨다.
본원에 사용된 바와 같이, 용어 "상동성 단백질"은 기준 단백질과 비슷한 활성 및/또는 구조를 갖는 단백질을 지칭한다. 상동물은 반드시 진화론상으로 관련되는 것은 아니다. 따라서, 이 용어는 상이한 유기체로부터 얻은 동일한, 유사한 또는 대응하는 단백질(들)(즉, 구조 및 기능 면에서)을 포함하고자 한 것이다. 특정 구현예에서, 상동물은 기준 단백질과 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 심지어 적어도 약 99% 이상의 아미노산 서열 동일성을 공유할 수 있다. 일부 구현예에서, 기준 단백질과 유사한 4차, 3차 및/또는 1차 구조를 갖는 상동물을 확인하는 것이 바람직하다. 일부 구현예에서, 상동성 단백질은 기준 단백질과 유사한 면역학적 반응(들)을 유도한다. 일부 구현예에서, 상동성 단백질은 원하는 활성(들)을 갖는 효소를 생산하도록 조작된다.
서열 사이의 아미노산 동일성의 정도는 당해 분야에 알려진 임의의 적합한 방법을 이용하여 결정될 수 있다(예를 들어, Smith and Waterman,1981; Needleman and Wunsch, 1970; Pearson and Lipman, 1988; Wisconsin Genetics Software Package(제네틱스 컴퓨터 그룹(Genetics Computer Group), 미국 위스콘신주 매디슨 소재)의 GAP, BESTFIT, FASTA 및 TFASTA와 같은 프로그램; 및 Devereux et al., 1984 참조).
예를 들어, PILEUP는 서열 상동성 수준을 결정하는 데 유용한 프로그램이다. PILEUP은 진행식 쌍별 정렬(pair-wise alignment)을 이용하여 관련 서열들의 군으로부터 다중 서열 정렬을 생성한다. 이것은 또한 정렬을 생성하는 데 사용된 클러스터링(clustering) 관계를 나타내는 트리(tree)를 작성할 수 있다. PILEUP은 Feng 및 Doolittle의 1987 문헌의 진행식 정렬 방법의 단순화를 이용한다. 상기 방법은 Higgins 및 Sharp의 1989 문헌에 의해 기재된 것과 유사하다. 유용한 PILEUP 매개변수는 3.00의 디폴트 갭 가중치, 0.10의 디폴트 갭 길이 가중치 및 가중 말단 갭을 포함한다. 유용한 알고리즘의 또 다른 예로는 Altschul 등의 1990 문헌 및 Karlin 등의 1993 문헌에 의해 기재된 BLAST 알고리즘이다. 하나의 특히 유용한 BLAST 프로그램은 WU-BLAST-2 프로그램이다(예를 들어, Altschul 등의 1996 문헌 참조). 매개변수 "W", "T" 및 "X"는 정렬의 민감도 및 속도를 결정한다. BLAST 프로그램은 디폴트로서 11의 워드길이(W), 50의 BLOSUM62 점수 행렬(예를 들어, Henikoff 및 Henikoff의 1989 문헌 참조) 정렬(B), 10의 기대치(E), M′5, N′-4, 및 스트랜드 둘 다의 비교를 이용한다.
본원에 사용된 바와 같이, 어구 "실질적으로 유사한" 및 "실질적으로 동일한"은, 적어도 2개의 핵산 또는 폴리펩타이드의 맥락에서, 전형적으로 폴리뉴클레오타이드 또는 폴리펩타이드가 기준(즉, 야생형) 서열과 비교하여 적어도 약 70%의 동일성, 적어도 약 75%의 동일성, 적어도 약 80%의 동일성, 적어도 약 85%의 동일성, 적어도 약 90%의 동일성, 적어도 약 91%의 동일성, 적어도 약 92%의 동일성, 적어도 약 93%의 동일성, 적어도 약 94%의 동일성, 적어도 약 95%의 동일성, 적어도 약 96%의 동일성, 적어도 약 97%의 동일성, 적어도 약 98%의 동일성, 또는 심지어 적어도 약 99%의 동일성 이상을 갖는 서열을 포함함을 의미한다. 서열 동일성은 표준 매개변수를 이용하여 BLAST, ALIGN 및 CLUSTAL과 같은 알려진 프로그램을 이용하여 결정될 수 있다. (예를 들어, Altschul 등의 1990 문헌; Henikoff 등의 1989 문헌; Karlin 등의 1993 문헌; 및 Higgins 등의 1988 문헌 참조). BLAST 분석을 수행하기 위한 소프트웨어는 미국 국립 생물공학 정보 센터(National Center for Biotechnology Information)를 통해 공공에게 이용 가능하다. 또한, 데이터베이스는 FASTA(Pearson 등의 1988 문헌)를 이용하여 조사될 수 있다. 2개의 폴리펩타이드가 실질적으로 동일하다는 하나의 표시는 제1 폴리펩타이드가 제2 폴리펩타이드와 면역학적으로 교차반응성이라는 것이다. 일반적으로, 보존적 아미노산 치환이 다른 폴리펩타이드는 면역학적으로 교차반응성이다. 따라서, 예를 들어, 2개의 펩타이드가 보존적 치환만이 다른 경우에 폴리펩타이드는 제2 폴리펩타이드와 실질적으로 동일하다. 2개의 핵산 서열이 실질적으로 동일하다는 다른 표시는 2개의 분자가 엄격한 조건 하에 (예를 들어, 높은 고엄격도로 배지의 범위 내에서) 서로에 혼성화한다는 것이다.
본원에 사용된 바와 같이, "핵산"은 뉴클레오타이드 서열 또는 폴리뉴클레오타이드 서열, 및 이의 단편 또는 일부를 지칭할 뿐만 아니라, 센스 가닥 또는 안티센스 가닥을 나타내는지와 상관 없이, 이중 가닥 또는 단일 가닥일 수 있는 게놈 또는 합성 기원의 DNA, cDNA 및 RNA를 지칭한다.
본원에 사용된 바와 같이, 용어 "발현"은 본 발명의 핵산 분자로부터 유래된 센스 RNA(mRNA) 또는 안티센스 RNA의 전사 및 안정한 축적을 지칭한다. 발현은 또한 mRNA가 폴리펩타이드로 번역되는 것을 지칭할 수 있다. 따라서, 용어 "발현"은 비제한적인 예로서 전사, 전사 후 변형, 번역, 번역 후 변형, 분비 등을 포함하는 폴리펩타이드의 생산에 관여된 임의의 단계를 포함한다.
본원에 사용된 바와 같이, (i) "사상성 진균 세포의 변이체 균주가 '증가한' 양의 관심 단백질(POI)을 발현한다/생산한다" 및 (ii) "사상성 진균 세포의 변이체 균주가 '감소한' 양의 자연적 SSB7 단백질을 발현한다/생산한다"와 같은 어구에 사용된 바와 같은 조합 용어 "발현한다/생산한다"에서, 용어 "발현한다/생산한다"는 본 발명의 이러한 변이체 사상성 진균 균주에서 단백질의 발현 및 생산에 관여된 임의의 단계를 포함하고자 한다. 예를 들어, '감소한' 양의 자연적 SSB7 단백질을 발현하는/생산하는 사상성 진균 세포의 변이체 균주를 생성하는 수단은 ssb7 유전자의 단백질 암호화 서열, 프로모터 서열, 5'-UTR 서열, 3'-UTR 서열, 이들의 조합 등의 유전자 변형(예를 들어, 돌연변이, 파괴, 절두, 결실 등)을 포함하지만, 이들로 제한되지는 않는다.
본원에 사용된 바와 같이, 어구 "전장 SSB7 단백질" 및 "자연적 SSB7 단백질"은 상호 교환적으로 사용될 수 있고, 특히 본 발명의 모 진균 세포로부터 유래되거나 수득된 SSB7 단백질 서열을 지칭한다. 예를 들어, 특정 구현예에서, 자연적 SSB7 단백질은 서열 번호 2의 1번 내지 1,308번 아미노산 위치를 포함한다. 다른 구현예에서, 자연적 SSB7 단백질은 서열 번호 31의 1번 내지 1,235번 아미노산 위치를 포함한다. 다른 구현예에서, 자연적 SSB7 단백질은 서열 번호 33의 1번 내지 1,465번 아미노산 위치를 포함한다. 다른 구현예에서, 자연적 SSB7 단백질은 서열 번호 35의 1번 내지 1,285번 아미노산 위치를 포함한다. 다른 구현예에서, 자연적 SSB7 단백질은 서열 번호 8의 1번 내지 1,310번 아미노산 위치를 포함한다. 다른 구현예에서, 자연적 SSB7 단백질은 서열 번호 9의 1번 내지 1,370번 아미노산 위치를 포함한다. 다른 구현예에서, 자연적 SSB7 단백질은 서열 번호 10의 1번 내지 805번 아미노산 위치를 포함한다. 다른 구현예에서, 자연적 SSB7 단백질은 서열 번호 11의 1번 내지 1,004번 아미노산 위치를 포함한다. 다른 구현예에서, 자연적 SSB7 단백질은 서열 번호 12의 1번 내지 1,215번 아미노산 위치를 포함한다. 다른 구현예에서, 자연적 SSB7 단백질은 서열 번호 13의 1번 내지 1,098번 아미노산 위치를 포함한다.
따라서, 특정 다른 구현예에서, 사상성 진균 세포의 변이체 균주는 모 균주에 비해 감소한 양의 자연적 SSB7 단백질을 발현한다/생산한다.
특정 다른 구현예에서, 본 발명은 서열 번호 2 또는 서열 번호 31과 적어도 약 50%의 서열 동일성을 포함하는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하는 트리코데르마 종 진균 세포의 변이체 균주에 관한 것이고, 여기서 변이체 균주는 액침 배양에서 호기성 발효 동안 미리 선택된 용존 산소(DO) 함량을 유지시키도록 감소한 양의 교반을 필요로 하는 세포 브로스를 생산하고/하거나, 미리 선택된 양의 교반에서 증가한 DO 함량을 유지시키는 세포량을 생산한다. 특정 구현예에서, SSB7 단백질을 암호화하는 트리코데르마 종 유전자는 서열 번호 1, 서열 번호 32 또는 서열 번호 34와 적어도 약 55% 내지 99%의 서열 동일성을 포함한다. 다른 구현예에서, 트리코데르마 종 ssb7 유전자는 서열 번호 1, 서열 번호 32 또는 서열 번호 34의 핵산 서열을 포함한다. 특정 다른 구현예에서, 본 발명의 점도 감소 표현형을 포함하는 변이체 트리코데르마 종 균주는 ssb7(fs), ssb7(311), ssb7(339fs), ssb7(TS1) 및 ssb7(TS2)로부터 선택된 대립유전자를 포함한다.
따라서, 상기 기재되고 하기 실시예 부문에 추가로 기재된 것처럼, ssb7 유전자는 본원에 기재된 점도 감소 표현형을 부여하기에 필요하고 충분한 1차 유전자 결정부위이다. 따라서, 본 발명의 특정 구현예는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하는 변이체 트리코데르마 종 균주에 관한 것이고, 변이체 균주는 점도 감소 표현형을 포함한다.
따라서, 특정 구현예에서, 본 발명의 점도 감소 표현형을 포함하는 변이체 진균 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 유전자 변형은 서열 번호 1의 ssb7 유전자의 엑손 1 내지 3 중 어느 하나(1) 내에서 발생한다.
특정 다른 구현예에서, 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 유전자 변형은 서열 번호 1의 ssb7 유전자의 엑손 1 내지 3 중 어느 둘(2) 내에서 발생한다.
특정 다른 구현예에서, 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 유전자 변형은 서열 번호 1의 ssb7 유전자의 엑손 1 내지 3 중 모든 셋(3) 내에서 발생한다.
또 다른 구현예에서, 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 유전자 변형은 서열 번호 1의 ssb7 유전자의 엑손 2 내에서 발생한다.
다른 구현예에서, 본 발명의 점도 감소 표현형을 포함하는 변이체 진균 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 유전자 변형은 도 1a에 도시된 것처럼 SSB7 단백질의 보존된 영역 A, 영역 B, 영역 C 및/또는 영역 D 내에서 발생하거나 이들을 파괴한다. 또 다른 구현예에서, 본 발명의 점도 감소 표현형을 포함하는 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 유전자 변형은 도 1a에 도시된 것처럼 SSB7 단백질의 보존된 영역 A 내에서 발생하거나 이것을 파괴한다. 또 다른 구현예에서, 본 발명의 점도 감소 표현형을 포함하는 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 유전자 변형은 도 1a에 도시된 것처럼 SSB7 단백질의 보존된 영역 B 내에서 발생하거나 이것을 파괴한다. 또 다른 구현예에서, 본 발명의 점도 감소 표현형을 포함하는 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 유전자 변형은 도 1a에 도시된 것처럼 SSB7 단백질의 보존된 영역 C 내에서 발생하거나 이것을 파괴한다. 또 다른 구현예에서, 본 발명의 점도 감소 표현형을 포함하는 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 유전자 변형은 도 1a에 도시된 것처럼 SSB7 단백질의 보존된 영역 D 내에서 발생하거나 이것을 파괴한다.
특정 다른 구현예에서, "실질적인 서열 상동성"을 포함하는 SSB7 단백질을 암호화하는 유전자는 (비교가 이루어진) 대응하는 핵산 서열로부터 미미한 서열 변이를 갖고, (비교가 이루어진) 대응하는 핵산 서열과 실질적으로 동일한 생물학적 기능을 보유하는 DNA 또는 RNA (핵산) 서열을 지칭한다. 예를 들어, 특정 구현예에서, SSB7 단백질을 암호화하는 유전자(또는 ORF)와 실질적인 서열 상동성을 포함하는 핵산 서열은 본원에 기재된 것처럼 암호화된 유전자 산물(SSB7 단백질)을 확인함으로써 평가된다.
특정 다른 구현예에서, SSB7 단백질을 암호화하는 유전자(또는 ORF)와 실질적인 서열 상동성을 포함하는 핵산 서열은 핵산 혼성화 방법을 이용하여 결정/확인된다. 예를 들어, 특정 구현예에서, SSB7 단백질을 암호화하는 본 발명의 유전자 또는 폴리뉴클레오타이드와 실질적인 서열 상동성을 포함하는 DNA/RNA 서열(예를 들어, 서열 번호 1)은 엄격한 조건 하에 본 발명의 특정 핵산 서열과 혼성화하는 이러한 DNA/RNA 서열의 능력에 의해 확인된다.
본원에 사용된 바와 같이, "엄격한 조건 하에 혼성화한다"는 혼성화 및 세척에 대한 조건을 기재하고자 하고, 이 조건 하에서 상당히 서로 동일하거나 상동성인 뉴클레오타이드 서열은 서로 혼성화되어 있다. 이러한 엄격한 조건은 당업자에게 잘 알려져 있다(예를 들어, Ausubel 등의 1995 문헌; Sambrook 등의 1989 문헌 참조). 예를 들어, 특정 구현예에서, 엄격한 혼성화 조건의 비제한적인 예는 약 65 내지 70℃에서의 4X 염화나트륨/시트르산나트륨(SSC)에서의 혼성화(또는 약 42 내지 50℃에서의 4xSSC와 50% 포름아미드에서의 혼성화), 이어서 약 65 내지 70℃에서의 1xSSC에서의 1회 이상의 세척을 포함한다. 마찬가지로, 고도로 엄격한 혼성화 조건의 비제한적인 예는 약 65 내지 70℃에서의 1xSSC에서의 혼성화(또는 약 42 내지 50℃에서의 4xSSC와 50% 포름아미드에서의 혼성화), 이어서 약 65 내지 70℃에서의 0.3×SSC에서의 1회 이상의 세척을 포함한다. 따라서, 고도로 엄격한 혼성화 조건은 약 50 내지 60℃에서의 4xSSC에서의 혼성화(또는 대안적으로 약 40 내지 45℃에서의 6xSSC와 50% 포름아미드에서의 혼성화), 이어서 약 50 내지 60℃에서의 2xSSC에서의 1회 이상의 세척을 포함한다. 예를 들어, 65 내지 70℃ 또는 42 내지 50℃에서의 상기 언급된 값에 중간인 범위는 또한 본 발명에 의해 포함되도록 의도된다. 특정 구현예에서, SSPE(1xSSPE는 0.15 M NaCl, 10 mM NaH2PO4 및 1.25 mM EDTA, pH 7.4임)는 혼성화 및 세척 완충액에서 SSC(1xSSPE는 0.15 M NaCl 및 15 mM 시트르산나트륨임)를 대신할 수 있고, 세척은 혼성화가 완료된 후 각각 15분 동안 수행된다. 50개 미만의 염기 쌍 길이에 기대되는 하이브리드에 대한 혼성화 온도는 하이브리드의 융점(Tm)보다 5 내지 10℃ 낮아야 하고, 여기서 Tm은 하기 식에 따라 결정된다. 18개 미만의 염기 쌍 길이의 하이브리드에 대해, Tm(℃) = 2(A+T 염기의 수) + 4(G+C 염기의 수). 18개 내지 49개의 염기 쌍 길이의 하이브리드에 대해, Tm(℃) = 81.5 + 16.6(log10[Na+]) + 0.41(% G+C) - (600/N)이고, 여기서 N은 하이브리드에서의 염기의 수이고, [Na+]는 혼성화 완충액 중의 나트륨 이온의 농도(1xSSC에 대한 [Na+] = 0.165 M)이다. 숙련된 실행자는 비제한적인 예로서 차단제(예를 들어, BSA 또는 연어 또는 청어 정자 운반 DNA), 세제(예를 들어, SDS), 킬레이트화제(예를 들어, EDTA), Ficoll, PVP 등을 포함하는 추가의 시약이 니트로셀룰로스 또는 나일론 막과 같은 막에 대한 핵산 분자의 비특이적 혼성화를 감소시키기 위해 혼성화 및/또는 세척 완충액에 첨가될 수 있다는 것을 또한 인식할 것이다. 특히 나일론 막을 사용할 때, 엄격한 혼성화 조건의 추가의 비제한적인 예는 약 65℃에서의 0.25 내지 0.5 M NaH2PO4, 7% SDS에서의 혼성화, 이어서 약 65℃에서의 0.02 M NaH2PO4, 1% SDS 또는 대안적으로 0.2xSSC, 1% SDS에서의 1회 이상의 세척을 포함한다(예를 들어, Church 및 Gilbert 등의 1984 문헌 참조).
따라서, 본 발명의 특정 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 서열 번호 1의 ssb7 유전자 또는 이의 상보성 서열과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 특정 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 서열 번호 31의 ssb7 유전자 또는 이의 상보성 서열과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 특정 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 서열 번호 32의 ssb7 유전자 또는 이의 상보성 서열과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 서열 번호 34의 ssb7 유전자 또는 이의 상보성 서열과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 서열 번호 1, 서열 번호 32, 서열 번호 34의 ssb7 유전자 또는 이의 상보성 서열의 오픈 리딩 프레임(ORF)과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다.
특정 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 서열 번호 19의 엑손 1 또는 이의 상보성 서열과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 또 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 서열 번호 20의 엑손 2 또는 이의 상보성 서열과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 또 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 서열 번호 21의 엑손 3 또는 이의 상보성 서열과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다.
특정 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 SSB7 단백질의 보존 영역 A를 암호화하는 핵산 서열(서열 번호 22)과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 SSB7 단백질의 보존 영역 B를 암호화하는 핵산 서열(서열 번호 23)과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 SSB7 단백질의 보존 영역 C를 암호화하는 핵산 서열(서열 번호 24)과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 또 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 SSB7 단백질의 보존 영역 D를 암호화하는 핵산 서열(서열 번호 25)과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다.
특정 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 SSB7 단백질의 보존 서열 1을 암호화하는 핵산 서열(서열 번호 22)과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 SSB7 단백질의 보존 서열 2를 암호화하는 핵산 서열(서열 번호 27)과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 SSB7 단백질의 보존 서열 3을 암호화하는 핵산 서열(서열 번호 28)과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 특정 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 SSB7 단백질의 보존 서열 4를 암호화하는 핵산 서열(서열 번호 29)과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다. 또 다른 구현예에서, SSB7 단백질을 암호화하는 자낭균류 진균 유전자는 SSB7 단백질의 보존 서열 5를 암호화하는 핵산 서열(서열 번호 30)과 높은 엄격도 조건 하에 혼성화하는 핵산 서열을 포함한다.
따라서, 상기 일반적으로 기재된 것처럼, 사상성 진균 세포의 변이체 균주는 SSB7을 암호화하는 유전자의 "유전자 변형"을 포함하고, 여기서 유전자 변형은 (비변형된) 모 세포에 대비된다.
본원에 사용된 바와 같이, 용어 "변형" 및 "유전자 변형"은 상호 교환적으로 사용되며, (a) 유전자에서의 하나 이상의 뉴클레오타이드의 도입, 치환 또는 제거, 또는 유전자의 전사 또는 번역에 필요한 조절 요소에서의 하나 이상의 뉴클레오타이드의 도입, 치환 또는 제거, (b) 유전자 파괴, (c) 유전자 전환, (d) 유전자 결실, (e) 유전자(예를 들어, 안티센스 RNA, siRNA, miRNA 등)의 하향조절, (f) 특이적 돌연변이유발(비제한적인 예로서 CRISPR/Cas9 기반 돌연변이유발 포함) 및/또는 (g) 본원에 개시된 임의의 하나 이상의 유전자의 랜덤 돌연변이유발을 포함하지만, 이들로 제한되지는 않는다. 예를 들어, 본원에 사용된 바와 같이, 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 본원에 개시된 ssb7 유전자의 유전자 변형을 포함하지만, 이것으로 제한되지는 않는다. 따라서, 하기 더 자세히 추가로 기재된 것처럼, 다양한 분자 생물학적 방법은 잘 알려져 있고, SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하는 사상성 진균 세포의 이러한 변이체 균주를 생성/작제하기 위해 당업자에게 이용 가능하다.
본원에 사용된 바와 같이, "SSB7 단백질을 암호화하는 유전자에서의 하나 이상의 뉴클레오타이드의 도입, 치환 또는 제거"에서, 이러한 유전자 변형은 유전자의 암호화 서열(즉, 엑손), 비암호화 개재(인트론) 서열, 프로모터 서열, 5'-UTR 서열, 3'-UTR 서열 등을 포함하지만, 이들로 제한되지는 않는다.
따라서, 특정 구현예에서, 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 SSB7 단백질을 암호화하는 내인성 유전자를 제거하도록 유전자 결실 기법에 의해 작제된다. 본원에 사용된 바와 같이, "유전자의 결실" 또는 "유전자 결실"은 숙주 세포의 게놈으로부터의 유전자의 암호화 서열의 완전 제거를 지칭한다. 유전자가 유전자의 암호화 서열에 바로 인접하게 위치하지 않은 제어 요소(예를 들어, 인핸서 요소)를 포함하는 경우, 유전자의 결실은 암호화 서열 및 선택적으로 예를 들어 비제한적인 예로서 프로모터 및/또는 종결자 서열을 포함하는 인접한 인핸서 요소의 결실을 지칭한다.
본원에 사용된 바와 같이, "유전자의 부분 결실" 또는 "부분적으로 결실된 유전자"는 숙주 세포의 게놈으로부터의 유전자의 암호화 서열의 부분 제거를 지칭한다. 예를 들어, 서열 번호 2의 트리코데르마 레세이 SSB7 단백질을 암호화하는 서열 번호 1의 ssb7 유전자는 엑손 1 내지 3의 암호화 서열(CDS: coding sequence)(각각 서열 번호 19 내지 23)을 포함한다. 예를 들어, 하기 기재된 특정 구현예에서, ssb7 유전자의 "부분 결실"은 ssb7 유전자의 엑손 1 내지 3 중 어느 하나(또는 하나 초과)의 결실을 포함하지만, 이것으로 제한되지는 않는다.
표적 유전자가 유전자의 암호화 서열에 바로 인접하게 위치하지 않은 제어 요소(예를 들어, 인핸서 요소)를 포함하는 경우, 유전자의 "부분 결실"은 암호화 서열 및 선택적으로 예를 들어 비제한적인 예로서 프로모터 및/또는 종결자 서열을 포함하는 인접한 인핸서 요소의 부분 결실을 지칭한다.
본원에 사용된 바와 같이, "유전자의 파괴", "유전자 파괴", "유전자의 불활성화" 및 "유전자 불활성화"는 상호 교환적으로 사용되며, 표적 유전자를 실질적으로 파괴/불활성화하는 임의의 유전자 변형을 광의적으로 지칭한다. 예시적인 유전자 파괴 방법은 폴리펩타이드 암호화 서열(CDS), 프로모터, 인핸서 또는 다른 조절 요소를 포함하는 유전자의 임의의 부분의 전체 또는 부분 결실, 또는 이의 돌연변이유발을 포함하지만, 이들로 제한되지는 않고, 여기서 돌연변이유발은 표적 유전자(들)를 파괴/불활성화하고 기능적 유전자 산물의 발현/생산을 실질적으로 감소시키거나 방지하는 치환, 삽입, 결실, 역전, 및 임의의 이들의 조합 및 변형을 포괄한다. 본 발명의 특정 구현예에서, 이러한 유전자 파괴는 숙주 세포가 암호화된 ssb7 유전자 산물을 발현/생산하는 것을 방지한다.
다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 확립된 안티센스(유전자 침묵) 기법을 사용하여, 즉 유전자(예를 들어, RNAi, siRNA, miRNA 등)의 핵산 서열에 상보성인 뉴클레오타이드 서열을 사용하여 하향조절된다.
특정 다른 구현예에서, SSB7 단백질을 암호화하는 유전자는 확립된 유전자 편집 기법, 예컨대 CRISPR/Cas9 유전자 편집, 징크 핑거 뉴클레아제(ZFN: zinc-finger nuclease) 유전자 편집, 전사 활성자 유사 효과기 뉴클레아제 편집(TALEN: transcription activator-like effector nuclease editing), 호밍(mega) 뉴클레아제 편집 등을 사용하여 유전자 변형된다.
특정 다른 구현예에서, 사상성 진균의 변이체 균주는 유전자 전환의 과정에 의해 작제된다(즉, 유전자 변형된다)(예를 들어, Iglesias 및 Trautner의 1983 문헌 참조).
다른 구현예에서, 사상성 진균의 변이체 균주는 비제한적인 예로서 화학 돌연변이유발(예를 들어, Hopwood의 1970 문헌 참조) 및 전좌(예를 들어, Youngman 등의 1983 문헌 참조)를 포함하는 당해 분야에 잘 알려진 방법을 사용하여 랜덤 돌연변이유발 또는 특이적 돌연변이유발에 의해 작제된다(즉, 유전자 변형된다).
예를 들어, 본원에 개시된 하나 이상의 유전자의 이러한 유전자 변형은 유전자의 프로모터의 효율을 감소시키거나, 인핸서의 효율을 감소시키거나, 유전자의 mRNA의 스플라이싱 또는 편집을 방해하거나, 유전자의 mRNA의 번역을 방해하거나, 전장 단백질의 번역을 방지하도록 유전자의 암호화 서열로 종결 코돈을 도입하거나, 덜 활성이거나 불활성인 단백질을 생산하도록 단백질의 암호화 서열을 변경하거나, 다른 핵 단백질 성분과의 단백질 상호작용을 감소시키거나, 덜 안정한 단백질을 생산하도록 단백질의 암호화 서열을 변경하거나, 파괴를 위해 단백질을 표적화하거나, 단백질이 (예를 들어, 글리코실화에 의해) 미스폴딩되거나 부정확하게 변형되거나, 단백질의 세포 이동을 방해하게 한다.
특정 구현예에서, SSB7 단백질을 암호화하는 유전자의 유전자 변형은 변이체 숙주 세포에 의해 발현/생산된 자연적 SSB7의 양을 감소시키고, 여기서 발현/생산된 자연적 SSB7 단백질의 감소한 양은 당업자에게 알려진 방법을 사용하여 검출되거나 측정되거나 분석되거나 기타 등등이 된다. 따라서, 당업자는 본 발명의 점도 감소 표현형을 포함하는 사상성 진균 세포의 이러한 (돌연변이유도된) 변이체 균주를 확인하기 위해 본원에 의해 실시예 부문에 기재된 스크리닝 방법을 용이하게 적응하고/하거나 변형시킬 수 있다. 예를 들어, 특정 구현예에서, 발현/생산된 자연적 SSB7의 감소한 양은 본원에 개시된 점도 감소 표현형과 용이하게 상관되고, 여기서 당업자는 모 균주와 이로부터 유래된 변이체 균주 간의 형태 차이를 스크리닝함으로써 점도 감소 표현형을 포함하는 이러한 변이체 숙주 균주를 용이하게 확인할 수 있다. 따라서, 당업자는, 비제한적인 예로서 (모 균주에 비해) 액침 배양에서의 호기성 발효 동안 미리 선택된 용존 산소(DO) 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스를 생성하는 변이체 균주를 확인하는 것 및/또는 (ii) (모 균주에 비해) 액침 배양에서의 호기성 발효 동안 미리 선택된 양의 교반에서 증가한 DO 함량을 유지시키는 세포량을 생성하는 변이체 균주를 확인하는 것을 포함하여, 점도 감소 표현형에 대한 모 균주 및 변이체 균주를 스크리닝함으로써 점도 감소 표현형을 포함하는 이러한 변이체 균주를 용이하게 확인할 수 있다.
다른 구현예에서, 발현/생산된 자연적 SSB7의 감소한 양은 비제한적인 예로서 단백질 이동/이동도(SDS-PAGE), 질량 분광법, HPLC, 크기 배제, 초원심분리 침강 속도 분석, 전사체학, 단백질체학, 형광 태그, 에피토프 태그, 형광 단백질 (GFP, RFP 등) 키메라/하이브리드 등을 포함하는 단백질 정량화 방법, 유전자 전사 방법, mRNA 번역 방법 등에 의해 검출되거나 확인되거나 측정되거나 분석되거나 기타 등등이 된다.
본원에 사용된 바와 같이, 기능적으로 및/또는 구조적으로 유사한 단백질은 "관련 단백질"인 것으로 간주된다. 이러한 관련된 단백질은 상이한 속 및/또는 종의 유기체 또는 심지어 상이한 강의 유기체(예를 들어, 박테리아 및 진균)로부터 유래될 수 있다. 관련 단백질은 또한 1차 서열 분석에 의해 결정되거나, 2차 또는 3차 구조 분석에 의해 결정되거나, 면역학적 교차반응성에 의해 결정된 상동물(homologue) 및/또는 오솔로그를 포괄한다.
본원에 사용된 바와 같이, 용어 "프로모터"는 암호화 서열 또는 기능적 RNA의 발현을 제어할 수 있는 핵산 서열을 지칭한다. 일반적으로, 암호화 서열은 프로모터 서열에 대해 3'(하류)에 위치한다. 프로모터는 자연적 유전자로부터 그 전체가 유래될 수 있거나, 자연에서 발견되는 상이한 프로모터로부터 유래되는 상이한 요소로 구성될 수 있거나, 심지어 합성 핵산 절편을 포함할 수 있다. 상이한 프로모터가 상이한 세포 유형에서의 유전자 또는 상이한 발달 단계에 있는 유전자의 발현을 지시하거나, 상이한 환경적 또는 생리적 조건에 반응하여 유전자의 발현을 지시할 수 있음을 당업자는 이해할 것이다. 대부분의 세포 유형에서 대부분의 시점에 유전자가 발현되도록 하는 프로모터는 일반적으로 "구성적 프로모터"로 지칭된다. 또한, 대부분의 경우 조절 서열의 정확한 경계가 완전히 정의되지 않았기 때문에, 상이한 길이의 DNA 단편이 동일한 프로모터 활성을 가질 수 있는 것으로 추가로 인식된다.
본원에 사용된 바와 같이, 용어 "작동 가능하게 연결된(operably linked)"은 하나의 기능이 다른 하나에 의해 영향을 받도록 단일 핵산 단편 상에서 핵산 서열들이 회합하는 것을 지칭한다. 예를 들어, 프로모터는 이것이 암호화 서열(예를 들어, ORF)의 발현에 영향을 줄 수 있을 때(즉, 그 암호화 서열은 프로모터의 전사 제어 하에 있음) 그 암호화 서열과 작동 가능하게 연결된다. 암호화 서열은 센스 배향 또는 안티센스 배향으로 조절 서열에 작동 가능하게 연결될 수 있다. 핵산이 또 다른 핵산 서열과 기능적 관계에 있도록 위치할 때 이 핵산은 "작동 가능하게 연결"된다. 예를 들어, 분비 리더(즉, 신호 펩타이드)를 암호화하는 DNA가 폴리펩타이드의 분비에 참여하는 전단백질(pre-protein)로서 발현되는 경우 이것이 폴리펩타이드용 DNA에 작동 가능하게 연결되거나; 프로모터 또는 인핸서가 서열의 전사에 영향을 미칠 경우 이들이 암호화 서열에 작동 가능하게 연결되거나; 리보솜 결합 부위가 번역을 촉진하도록 위치하는 경우 이것이 암호화 서열에 작동 가능하게 연결된다. 일반적으로 "작동 가능하게 연결된"은 연결되는 DNA 서열들이 인접해 있음을 의미하고, 분비 리더의 경우에는 인접해 있고 판독 단계(reading phase)에 있음을 의미한다. 그러나, 인핸서는 인접해 있을 필요는 없다. 연결은 편리한 제한 부위에서의 결찰에 의해 달성된다. 이러한 부위가 존재하지 않는 경우, 합성 올리고뉴클레오타이드 어댑터 또는 링커가 통상적인 관례에 따라 사용된다.
본원에 정의된 바와 같이, "적합한 조절 서열"은 암호화 서열의 상류(5' 비암호화 서열)에, 암호화 서열 내에 또는 하류(3' 비암호화 서열)에 위치하고, 회합된 암호화 서열의 전사, RNA 프로세싱 또는 안정성, 또는 번역에 영향을 미치는 뉴클레오타이드 서열을 지칭한다. 조절 서열은 프로모터, 번역 리더 서열, RNA 프로세싱 부위, 효과기 결합 부위 및 스템-루프 구조를 포함할 수 있다.
본원에 정의된 바와 같이, 적어도 하나의 폴리뉴클레오타이드 오픈 리딩 프레임(ORF), 또는 이의 유전자 또는 이의 벡터를 "진균 세포 내로 도입하는"과 같은 어구에서 사용될 때 용어 "도입하는"은 비제한적인 예로서 원형질체 융합, 천연 또는 인공 형질전환(예를 들어, 염화칼슘, 전기천공), 형질도입, 형질주입 등을 포함하는 세포로 폴리뉴클레오타이드를 도입하기 위해 당해 분야에 알려진 방법을 포함한다.
본원에 사용된 바와 같이, "형질전환된" 또는 "형질전환"은 세포가 재조합 DNA 기법을 사용하여 형질전환된다는 것을 의미한다. 형질전환은 전형적으로 하나 이상의 뉴클레오타이드 서열(예를 들어, 폴리뉴클레오타이드, ORF 또는 유전자)을 세포로 삽입함으로써 일어난다. 삽입된 뉴클레오타이드 서열은 이종성 뉴클레오타이드 서열(즉, 형질전환되는 세포에 자연 발생하지 않는 서열)일 수 있다.
본원에 사용된 바와 같이, "형질전환"은 DNA가 염색체 통합체 또는 자가 복제성 염색체외 벡터로서 유지되도록 숙주 세포로 외인성 DNA를 도입하는 것을 지칭한다. 본원에 사용된 바와 같이, "형질전환 DNA", "형질전환 서열" 및 "DNA 작제물"은 숙주 세포로 서열을 도입하는 데 사용된 DNA를 지칭한다. DNA는 PCR 또는 임의의 다른 적합한 기법에 의해 시험관내 생성될 수 있다. 일부 구현예에서, 형질전환 DNA는 유입 서열(incoming sequence)을 포함하는 반면, 다른 구현예에서는 상동성 박스(homology box)가 측접된 유입 서열을 추가로 포함한다. 더 추가의 구현예에서, 형질전환 DNA는 말단에 추가된 다른 비상동성 서열(즉, 스터퍼 서열 또는 플랭크)을 포함한다. 말단은 형질전환 DNA가 예를 들어 벡터로의 삽입과 같은 폐쇄된 원을 형성하도록 폐쇄될 수 있다.
본원에 사용된 바와 같이, "유입 서열"은 진균 세포 염색체로 도입된 DNA 서열을 지칭한다. 일부 구현예에서, 유입 서열은 DNA 작제물의 일부이다. 다른 구현예에서, 유입 서열은 하나 이상의 관심 단백질을 암호화한다. 일부 구현예에서, 유입 서열은 형질전환되는 세포의 게놈에 이미 존재하거나 존재하지 않을 수 있는 서열을 포함한다(즉, 상동성 서열이거나 이종성 서열일 수 있음). 일부 구현예에서, 유입 서열은 하나 이상의 관심 단백질, 유전자, 및/또는 돌연변이되었거나 변형된 유전자를 암호화한다. 대안적인 구현예에서, 유입 서열은 기능적 야생형 유전자 또는 오페론, 기능적 돌연변이체 유전자 또는 오페론, 또는 비기능적 유전자 또는 오페론을 암호화한다. 일부 구현예에서, 유입 서열은 유전자로 삽입되어 유전자의 기능을 파괴하는 비기능적 서열이다. 또 다른 구현예에서, 유입 서열은 선택적 마커를 포함한다. 다른 구현예에서, 유입 서열은 2개의 상동성 박스를 포함한다.
본원에 사용된 바와 같이, "상동성 박스"는 진균 세포 염색체에서의 서열에 상동성인 핵산 서열을 지칭한다. 보다 구체적으로는, 상동성 박스는 본 발명에 따라 결실되거나, 파괴되거나, 비활성화되거나, 하향조절 등이 되는 유전자 또는 유전자의 일부의 바로 측접하는 암호화 영역과 약 80% 내지 100%의 서열 동일성, 약 90% 내지 100%의 서열 동일성, 또는 약 95% 내지 100%의 서열 동일성을 갖는 상류 또는 하류 영역이다. 이러한 서열은 진균 세포 염색체에서 DNA 작제물이 어디에서 통합되는지를 지시하고, 진균 세포 염색체의 어느 부분이 유입 서열에 의해 대체되는지를 지시한다. 본 발명을 한정하고자 하는 것은 아니지만, 상동성 박스는 약 1개 염기쌍(bp) 내지 200개 킬로염기(kb)를 포함할 수 있다. 바람직하게는, 상동성 박스는 약 1 bp 내지 10.0 kb; 1 bp 내지 5.0 kb; 1 bp 내지 2.5 kb; 1 bp 내지 1.0 kb, 및 0.25 kb 내지 2.5 kb를 포함한다. 상동성 박스는 또한 약 10.0 kb, 5.0 kb, 2.5 kb, 2.0 kb, 1.5 kb, 1.0 kb, 0.5 kb, 0.25 kb 및 0.1 kb를 포함할 수 있다. 일부 구현예에서, 선택적 마커의 5’ 및 3’ 말단은 상동성 박스에 의해 측접되고, 상동성 박스는 유전자의 암호화 영역을 바로 측접시키는 핵산 서열을 포함한다.
본원에 사용된 바와 같이, 용어 "선별 마커-암호화 뉴클레오타이드 서열"은 숙주 세포에서 발현할 수 있고 선별 마커의 발현이 발현된 유전자를 함유하는 세포에 해당 선택 제제의 존재 또는 필수 영양소의 부재 하에 성장하는 능력을 부여하는 뉴클레오타이드 서열을 지칭한다.
본원에 사용된 바와 같이, 용어 "선별 마커" 및 "선택적 마커"는 벡터를 함유하는 숙주의 선택을 용이하게 하는 이 숙주 세포에서 발현할 수 있는 핵산(예를 들어, 유전자)을 지칭한다. 이러한 선별 마커의 예는 항균제를 포함하지만, 이들로 제한되지는 않는다. 따라서, 용어 "선별 마커"는 숙주 세포가 관심 유입 DNA를 흡수했거나 일부 다른 반응이 일어났다는 표시를 제공하는 유전자를 지칭한다. 전형적으로, 선별 마커는 외인성 DNA를 함유하는 세포가 형질전환 동안 어떠한 외인성 서열도 받지 않은 세포와 구별되게 하기 위해 숙주 세포에 항균 내성 또는 대사 이점을 부여하는 유전자이다.
본원에 정의된 바와 같이, 숙주 세포 "게놈", 진균 세포 "게놈" 또는 사상성 진균 세포 "게놈"은 염색체 유전자 및 염색체외 유전자를 포함한다.
본원에 사용된 바와 같이, 용어 "플라스미드", "벡터" 및 "카세트"는 염색체외 요소를 지칭하며, 이는 대개 전형적으로 세포의 중심 대사의 일부가 아니고 보통 원형 이중 가닥 DNA 분자의 형태인 유전자를 운반한다. 이러한 요소는 임의의 공급원으로부터 유래되는 단일 가닥 또는 이중 가닥 DNA 또는 RNA의, 선형 또는 원형인, 자율 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오타이드 서열일 수 있으며, 여기서 다수의 뉴클레오타이드 서열은 선택된 유전자 산물에 대한 DNA 서열 및 프로모터 단편을 적절한 3' 비번역 서열과 함께 세포로 도입할 수 있는 독특한 작제물로 연결되거나 재조합된다.
본원에 사용된 바와 같이, 용어 "벡터"는 세포에서 복제(증식)될 수 있고, 새로운 유전자 또는 DNA 분절(예를 들어, "유입 서열")을 세포로 운반할 수 있는 임의의 핵산을 지칭한다. 따라서, 이 용어는 상이한 숙주 세포들 간의 전달을 위해 설계된 핵산 작제물을 지칭한다. 벡터는 바이러스, 박테리오파지, 프로-바이러스, 플라스미드, 파지미드, 트랜스포존 및 인공 염색체, 예컨대 YAC(효모 인공 염색체), BAC(박테리아 인공 염색체), PLAC(식물 인공 염색체) 등을 포함하는데, 이들은 "에피좀"(즉, 자율 복제)이거나 숙주 세포의 염색체로 통합될 수 있다.
본원에 사용된 바와 같이, "형질전환 카세트"는 유전자(또는 이의 ORF)를 포함하고 유전자 이외에 특정 숙주 세포의 형질전환을 용이하게 하는 요소를 갖는 특이적 벡터를 지칭한다.
"발현 벡터"는 세포에서 이종성 DNA를 혼입하고 발현시키는 능력을 갖는 벡터를 지칭한다. 많은 원핵 및 진핵 발현 벡터가 상업적으로 이용 가능하고 당업자에게 알려져 있다. 적절한 발현 벡터의 선택은 당업자의 지식 내에 있다.
본원에 사용된 바와 같이, 용어 "발현 카세트" 및 "발현 벡터"는 표적 세포에서 특정 핵산의 전사를 허용하는 일련의 명시된 핵산 요소를 사용하여 재조합으로 또는 합성에 의해 생성된 핵산 작제물을 지칭한다(즉, 이들은 상기에 기술된 바와 같은 벡터 또는 벡터 요소임). 재조합 발현 카세트는 플라스미드, 염색체, 미토콘드리아 DNA, 색소체 DNA, 바이러스 또는 핵산 단편으로 혼입될 수 있다. 전형적으로, 발현 벡터의 재조합 발현 카세트 부분은 다른 서열 중에서도 전사될 핵산 서열 및 프로모터를 포함한다. 일부 구현예에서, DNA 작제물은 또한 표적 세포에서 특정 핵산의 전사를 허용하는 일련의 명시된 핵산 요소를 포함한다. 특정 구현예에서, 본 발명의 DNA 작제물은 본원에 정의된 바와 같은 선택적 마커 및 비활성화 염색체 또는 유전자 또는 DNA 절편을 포함한다.
본원에 사용된 바와 같이, "표적화 벡터"는 표적화 벡터가 형질전환되는 숙주 세포의 염색체 내 영역에 대해 상동성이고, 해당 영역에서 상동성 재조합을 유도할 수 있는 폴리뉴클레오타이드 서열을 포함하는 벡터이다. 예를 들어, 표적화 벡터는 상동성 재조합을 통해 숙주 세포의 염색체로 유전자 변형을 도입하는 데 사용된다. 일부 구현예에서, 표적화 벡터는 예를 들어 말단에 부가된 다른 비상동성 서열(즉, 스터퍼 서열 또는 플랭킹 서열)을 포함한다. 그 말단은 표적화 벡터가 예를 들어 벡터 내로의 삽입과 같이 폐쇄된 원을 형성하도록 폐쇄될 수 있다.
본원에 사용된 바와 같이, 변이체 균주에 의해 생산된 단백질의 양이 모 균주에 의해 생산된 단백질의 양과 비교하여 20% 이하 감소, 15% 이하 감소, 10% 이하 감소, 심지어 5% 이하 감소하면 변이체 균주는 바이오매스 단위량당 모 균주와 "실질적으로 동일한 양"의 단백질을 생산하고, 여기서 단백질의 양은 단백질 생산이 측정되는 세포의 총 바이오매스량에 대해 정규화되며, 바이오매스는 습윤 중량(예를 들어, 세포 펠릿의 습윤 중량) 또는 건조 중량의 면으로 표현될 수 있다.
본원에 사용된 바와 같이, 변이체 세포에 의해 생산된 단백질의 양이 모 균주와 비교하여 적어도 5% 증가, 적어도 10% 증가, 적어도 15% 증가, 또는 그보다 많이 증가하면 변이체 균주는 모 균주보다 "바이오매스 단위량당 실질적으로 더 많은 단백질"을 생산하고, 여기서 단백질의 양은 단백질 생산이 측정되는 세포의 총 바이오매스량에 대해 정규화되며, 바이오매스는 습윤 중량(예를 들어, 세포 펠릿의 습윤 중량) 또는 건조 중량의 면으로 표현될 수 있다.
본원에 사용된 바와 같이, "형광색소"는 형광 염료이다. 바람직한 형광색소는 진균의 세포벽에서 셀룰로스 및/또는 키틴에 결합한다.
II. 점도 감소 표현형을 포함하는 트리코데르마 균주
일반적으로 상기 기재되고, 하기 실시예 부문에 추가로 기재된 것처럼, 본 발명의 특정 구현예는 모 균주로부터 유래된 사상성 진균의 변이체 균주에 관한 것이다. 보다 구체적으로는, 특정 구현예는 사상성 진균의 변이체 균주 및 이의 방법에 관한 것이고, 여기서 이러한 변이체 균주는 부피 효율의 개선, 향상된/균일한 산소 분포, 세포 브로스 점도의 감소, 높은 비생산성, 탄소원에 대한 수율의 개선, 생물반응기(발효기) 작동 비용의 감소, (세포) 표현형의 변경, (세포) 형태의 변경, (세포) 성장 특징의 변경 등을 포함한다.
예를 들어, 본원에 기재되고 제시된 것처럼, 본 발명의 이러한 변이체 균주(즉, SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함)는 모 균주의 세포에 비해 미리 선택된 용존 산소(DO) 함량을 유지시키기 위해 감소한 양의 교반을 요하는(즉, 액침 배양에서의 호기성 발효 동안) 세포 브로스를 생성하고/하거나, 미리 선택된 양의 교반에서 증가한 DO 함량을 유지시키는(즉, 액침 배양에서의 호기성 발효 동안) 세포량을 생성한다. 보다 구체적으로는, 본원에서 작제되고 기재된 사상성 진균의 변이체 균주는 특히 본원에서 "점도 감소" 표현형이라 칭하는 변경된 세포 형태 표현형(예를 들어, 실시예 1 내지 실시예 3 및 도 2 참조)을 포함한다.
따라서, 실시예 1에 기재된 것처럼, "Morph 77B7"이라 명명된 T. 레세이 돌연변이체는 특히 모체보다 더 짧고 더 두꺼운 필라멘트를 갖는 액침 액체 배양에서 변경된 형태(표현형)를 갖는 것으로 관찰되었고, 여기서 Morph 77B7 돌연변이체는 또한 모체를 함유하는 배양물과 비교하여 성장 동안 더 높은 수준의 용존 산소(DO)를 나타냈고(실시예 1, 표 1 참조), 여기서 오직 하나의 유전좌위는 돌연변이체 (Morph 77B7) 표현형("ssb7"이라 명명됨)을 보완하였다. ssb7 유전자는 동일한 DNA 서열에서의 다른 단백질 예측과 부분적으로 중첩하는 새로 예측된 단백질인 SSB7, 예를 들어 트리코데르마 레세이 QM6a 단백질 ID(PID) 108712를 암호화한다(The Genome Portal of the Department of Energy Joint Genome Institute, Grigoriev et al., 2011)(도 1 참조). 균주 Morph 77B7에서 확인된 ssb7 돌연변이체 대립유전자는 엑손 2(T. 레세이 QM6a 스캐폴드 13, 167404; 서열 번호 3)에서 단일 구아닌(G) 뉴클레오타이드 결실(ΔG)을 포함하여 프레임 쉬프트(fs) 돌연변이 및 ssb7 유전자의 마지막 인트론(인트론 2) 전의 조기 종결 코돈을 생성시키는데, 돌연변이체 대립유전자는 "ssb7(fs)"라 명명된다. 실시예 2는 ssb7 돌연변이가 발효(배양) 브로스 점도 감소(변경된 형태/표현형)의 원인인지를 추가로 검증하고, 여기서 ssb7 유전좌위는 모 T. 레세이 균주에서 (2가지 상이한 방법을 통해) 특이적으로 돌연변이되고, ssb7의 대립유전자 둘 다는 점도 감소 표현형을 나타냈다. 마찬가지로, 실시예 3은 추가로 시험되고 이러한 ssb7 돌연변이체의 이용성을 확인하였고, 여기서 ssb7의 세(3) 가지의 돌연변이체 대립유전자는 셀룰라아제의 자연적 칵테일을 발현하는 상이한 트리코데르마 레세이 계통("T4abc"라 명명)에서 또한 평가되었고, 각각의 이들 돌연변이체 대립유전자는 본원에 기재된 점도 감소 표현형을 나타냈다.
따라서, 본 발명의 특정 구현예는 점도 감소 표현형을 포함하는 사상성 진균의 변이체 균주에 관한 것이다. 특정 다른 구현예는 사상성 진균 세포의 이러한 변이체 균주의 작제, 사상성 진균 세포의 이러한 변이체 균주의 스크리닝, 사상성 진균 세포의 이러한 변이체 균주를 사용한 관심 단백질의 생산 등을 위한 조성물 및 방법에 관한 것이다.
III. 점도 감소 표현형을 포함하는 변이체 사상성 진균 균주의 작제
특정 구현예에서, 사상성 진균의 변이체 균주(세포)는 사상성 진균의 모 균주(세포)로부터 유래되고, 여기서 변이체 균주는 SSB7 단백질/SSB7 오솔로그를 암호화하는 유전자의 적어도 하나의 유전자 변형(즉, 모 균주에 대한 것)을 포함하고, 이러한 변이체 균주는 모 균주에 비해 점도 감소 표현형을 포함한다. 보다 구체적으로는, 본 발명의 특정 다른 구현예는 SSB7 단백질/SSB7 오솔로그를 암호화하는 유전자의 유전자 변형을 포함하는 사상성 진균의 이러한 변이체 균주(세포)에 관한 것이고, 여기서 변이체 균주는 액침 배양에서의 호기성 발효 동안 즉 모 균주에 비해 (i) 미리 선택된 용존 산소(DO) 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스 및/또는 (ii) 미리 선택된 양의 교반에서 증가한 DO 함량을 유지시키는 세포 브로스를 생산한다.
III.A . 점도 감소 표현형을 포함하는 변이체 트리코데르마 균주의 작제
일반적으로 상기 기재된 것처럼, 본 발명의 특정 구현예는 모 트리코데르마 종 균주로부터 유래된 변이체 트리코데르마 종 균주에 관한 것이고, 여기서 변이체 균주는 점도 감소 표현형을 포함한다. 특정 구현예에서, 변이체 트리코데르마 종 균주는 서열 번호 2 또는 서열 번호 31의 SSB7 단백질과 적어도 약 50%의 서열 동일성을 포함하는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 변이체 균주는 점도 감소 표현형을 포함한다. 특정 다른 구현예에서, 변이체 트리코데르마 종 균주는 서열 번호 1의 ssb7 유전자와 적어도 약 50%의 서열 동일성을 포함하는 ssb7 유전자의 유전자 변형을 포함하고, 여기서 변이체 균주는 점도 감소 표현형을 포함한다. 특정 다른 구현예에서, 변이체 트리코데르마 종 균주는 서열 번호 32의 ssb7 유전자와 적어도 약 50%의 서열 동일성을 포함하는 ssb7 유전자의 유전자 변형을 포함하고, 여기서 변이체 균주는 점도 감소 표현형을 포함한다. 특정 다른 구현예에서, 변이체 트리코데르마 종 균주는 서열 번호 34의 ssb7 유전자와 적어도 약 50%의 서열 동일성을 포함하는 ssb7 유전자의 유전자 변형을 포함하고, 여기서 변이체 균주는 점도 감소 표현형을 포함한다.
다른 구현예에서, 변이체 트리코데르마 종 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 변형은 SSB7 단백질의 보존 영역 A 내지 D 내에서 생긴다(도 1a 및 서열 번호 22 내지 25 참조). 특정 다른 구현예에서, 변이체 트리코데르마 종 균주는 엑손 1(서열 번호 19), 엑손 2(서열 번호 20) 및 엑손 3(서열 번호 21)으로 이루어진 군으로부터 선택된 적어도 하나(1)의 엑손의 유전자 변형을 포함하고, 여기서 변이체 균주는 점도 감소 표현형을 포함한다. 다른 구현예에서, 변이체 트리코데르마 종 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 변형은 SSB7 단백질을 암호화하는 유전자의 프로모터 서열에서 생기고/생기거나, SSB7 단백질을 암호화하는 유전자의 비번역 영역(UTR)에서 생기고, 변이체 균주는 점도 감소 표현형을 포함한다.
특정 다른 구현예에서, 변이체 트리코데르마 종 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 SSB7 단백질을 암호화하는 유전자의 변형은 도 8b-도 8f에 제시된 바와 같은 하나 이상의 암호화된 SSB7 단백질 소수성 서열 영역을 이의 친수성 서열 영역으로 전환시키거나, 그 반대도 같으며, 변이체 균주는 점도 감소 표현형을 포함한다. 예를 들어, (도 8b-도 8f에 도시된) 서열 번호 2의 SSB7 단백질 서열의 (Kyte-Doolittle(KD) 지표에 따른) 소수성 도표는 SSB7 단백질 서열 내의 특정 아미노산의 소수화도 또는 친수화도의 정량적 분석을 제공한다. 따라서, 도 8b-도 8f에 도시된 소수성 도표는 x축에서 SSB7 단백질의 (1차) 아미노산 서열을 제시하고, y축에서 소수화도(0 초과) 및 친수화도(0 미만)의 정도(점수)를 제시하고, 여기서 KD 지표를 이용한 아미노산 소수성 점수가 도 8g에 도시되어 있다. 예를 들어, 이 도표의 형상을 분석하는 것이 단백질의 부분 구조에 관하여 특히 관련된 정보를 제공하는 것으로 당업자에 의해 일반적으로 이해된다. 예를 들어, 아미노산의 스트레치(즉, 구형 단백질(막에 닿아 있지 않은 단백질)에 대해 대략 10개 잔기 범위)가 소수화도에 대해 양수의 점수(0 초과)를 나타내면, 이 아미노산은 아마도 SSB7 단백질 3차 구조 내에 묻힌다(즉, 표면이 수성 용매에 노출되지 않음). 그에 반해서, 높은 친수화도 점수(0 미만)를 갖는 아미노산 서열 영역은 이 아미노산 잔기가 수성 용매와 접촉하고, 그러므로, 이 잔기가 주로 SSB7 단백질의 외부 표면에 위치한다는 것을 나타낸다.
따라서, 본원에 기재된 것처럼, 이러한 친수성 또는 소수성 SSB7 단백질 서열 영역을 암호화하는 ssb7 유전자(또는 이의 하위서열)가 이의 반대의 서열 영역을 암호화하도록 용이하게 변형될 수 있다(예를 들어, 소수성 서열을 친수성 서열과 바꾸거나 또는 그 반대). 당해 분야에서 알려진 것처럼, 이러한 유전자 변형의 도입(예를 들어, 적어도 하나(1)의 친수성 아미노산 잔기를 소수성 잔기로 전환시키거나 또는 그 반대, 바람직하게는 적어도 2개 내지 3개의 연속 친수성 잔기를 소수성 잔기로 전환시키거나 또는 그 반대)은 감소한 양의 자연적 SSB7 단백질을 발현/생산하는 변이체 트리코데르마 종 균주를 작제하는 데 특히 유용하다. 예를 들어, 상기 기재된 변형된 ssb7 유전자(또는 이의 하위서열)에 의해 암호화된 (비자연적) SSB7 단백질은 미스폴딩 및/또는 비폴딩에 대한 높은 경향을 가져서 단백질 응집, 침전, 단백분해 절단, 분해 등을 야기할 것이다. 따라서, 당업자는 본 발명의 점도 감소 표현형에 대한 모체 및 딸체를 분석하여 감소한 양의 자연적 SSB7 단백질을 발현/생산하는 변형된 (딸) 균주에 대하여 자연적 SSB7 단백질을 암호화하는 야생형 유전자를 포함하는 모 균주를 분석할 수 있다.
따라서, 서열 번호 1의 ssb7 유전자, 서열 번호 2의 SSB7 단백질, 서열 번호 31의 SSB7 단백질, 소수성 도표(도 8b-도 8g), SSB7 단백질의 아미노산 조성(도 8a) 등을 참조하여, 당업자는 자연적 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하는 이러한 변이체 트리코데르마 종 균주를 용이하게 작제할 수 있고, 여기서 이러한 변이체 균주는 점도 감소 표현형을 포함한다. 예를 들어, 당업자는 당해 분야에 알려진 일상적인 및 전통적인 분자 생물학 방법을 이용하여 ssb7 유전자 서열을 유전자 변형시키고, 본 발명의 점도 감소 표현형을 포함하는 이의 변이체 균주를 용이하게 확인할 수 있다.
III.B . 점도 감소 표현형을 포함하는 변이체 자낭균류 균주의 작제
상기 기재된 것처럼, 특정 구현예는 사상성 진균의 모 균주(세포)로부터 유래된 사상성 진균의 변이체 균주(세포)에 관한 것이고, 여기서 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 변이체 균주는 점도 감소 표현형을 포함한다. 보다 구체적으로는, 특정 구현예는 비제한적인 예로서 트리코데르마 종, 아스페르길루스 종, 푸사륨 종, 페니실륨 종, 크리소스포륨 종, 세팔로스포륨 종, 탈라로마이세스 종, 게오스미티아 종, 뉴로스포라 종, 마이셀리오프토라 종 등을 포함하는 사상성 진균의 변이체 균주에 관한 것이다. 따라서, 특정 구현예에서, 본 발명은 서열 번호 8의 SSB7 단백질 오솔로그를 암호화하는 유전자의 유전자 변형을 포함하는 변이체 푸사륨 종 균주에 관한 것이다. 다른 구현예에서, 본 발명은 서열 번호 9의 SSB7 단백질 오솔로그를 암호화하는 유전자의 유전자 변형을 포함하는 변이체 뉴로스포라 종 균주에 관한 것이다. 다른 구현예에서, 본 발명은 서열 번호 10의 SSB7 단백질 오솔로그를 암호화하는 유전자의 유전자 변형을 포함하는 변이체 마이셀리오프토라 종 균주에 관한 것이다. 다른 구현예에서, 본 발명은 서열 번호 11의 SSB7 단백질 오솔로그를 암호화하는 유전자의 유전자 변형을 포함하는 변이체 탈라로마이세스 종 균주에 관한 것이다. 다른 구현예에서, 본 발명은 서열 번호 12의 SSB7 단백질 오솔로그를 암호화하는 유전자의 유전자 변형을 포함하는 변이체 아스페르길루스 종 균주에 관한 것이다. 다른 구현예에서, 본 발명은 서열 번호 13의 SSB7 단백질 오솔로그를 암호화하는 유전자의 유전자 변형을 포함하는 변이체 페니실륨 종 균주에 관한 것이다.
보다 구체적으로는, 일반적으로 상기 기재된 것처럼, 서열 번호 1의 야생형 트리코데르마 종 ssb7 유전자는 서열 번호 2의 새로 예측된 단백질인 SSB7(이 단백질은 문헌에서 비규명됨)을 암호화한다. Joint Genome Institute(JGI) 트리코데르마 레세이 v2.0 데이터베이스(균주 QM6a)는 PID 108712로서 이 동일한 DNA 서열에 대해 상이한 유전자 구조를 예측한다. 보다 구체적으로는, 본원에 기재된 ssb7 단백질 서열의 분석은 미세소관 상호작용 및 수송(MIT: microtubule interacting and trafficking) 도메인을 함유한다. 마찬가지로, BLAST 검색은 SSB7 단백질 오솔로그가 사카로미세테스(Saccharomycetes)가 아니라 푸사륨 종(서열 번호 8), 뉴로스포라 종(서열 번호 9), 마이셀리오프토라 종(서열 번호 10), 탈라로마이세스 종(서열 번호 11), 아스페르길루스 종(서열 번호 12) 및 페니실륨 종(서열 번호 13) 진균 균주에 존재한다는 것을 나타낸다. 예를 들어, 도 5에 제시되고 기재된 것처럼, SSB7 단백질은 단백질 서열 보존의 여러 영역을 포함한다. 도 5는 N 말단 MIT 도메인에 걸친 아미노산이 결여된 짧은 단백질 예측을 제외하고 삼백오십삼(353)개의 자낭균 동족체의 MUSCLE 정렬의 그래프 표시이다. 보다 구체적으로는, 정렬은 본원에서 "영역 A"(서열 번호 22), "영역 B"(서열 번호 23), "영역 C"(서열 번호 24) 및 "영역 D"(서열 번호 25)로 정의된 SSB7 동족체/오솔로그에서 네(4)가지의 보존 영역을 밝혀냈다. 도 5에 제시된 것처럼, 영역 A는 상기 언급된 MIT 도메인에 대응한다.
또한, 이러한 SSB7 오솔로그(서열 번호 8 내지 13)와 야생형 트리코데르마 레세이 SSB7 단백질(서열 번호 2) 및 야생형 트리코데르마 아트로비리데 SSB7 단백질(서열 번호 31)과의 CLUSTAL 정렬은 도 9a-도 9e에 제시되어 있는데, 이는 여러 아미노산 서열 보존 영역을 보여준다.
따라서, 특정 다른 구현예에서, 본 발명의 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 유전자는 서열 번호 26의 "보존 1" SSB7 단백질 아미노산을 암호화하는 핵산 서열 영역에서 변형된다. 다른 구현예에서, 본 발명의 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 유전자는 서열 번호 27의 "보존 2" SSB7 단백질 아미노산을 암호화하는 핵산 서열 영역에서 변형된다. 또 다른 구현예에서, 본 발명의 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 유전자는 서열 번호 28의 "보존 3" SSB7 단백질 아미노산을 암호화하는 핵산 서열 영역에서 변형된다. 다른 구현예에서, 본 발명의 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 유전자는 서열 번호 29의 "보존 4" SSB7 단백질 아미노산을 암호화하는 핵산 서열 영역에서 변형된다. 또 다른 구현예에서, 본 발명의 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 유전자는 서열 번호 30의 "보존 5" SSB7 단백질 아미노산을 암호화하는 핵산 서열 영역에서 변형된다.
따라서, 상기 III 부문에 기재된 지침, 하기 제시된 실시예에 대하여, 그리고 본원에 개시된 아미노산 서열(예를 들어, 서열 번호 2, 4, 8 내지 13, 22 내지 31, 33 및 35) 및 핵산 서열(예를 들어, 서열 번호 1, 3, 5 내지 7, 19 내지 21, 32 또는 34)을 참조하여, 당업자는 본 발명의 점도 감소 표현형을 포함하는 사상성 진균의 이러한 변이체 균주를 용이하게 작제할 수 있다.
IV. MPG1, SFB3, SEB1, CRZ1 및/또는 GAS1 단백질을 암호화하는 유전자를 추가로 포함하는 변이체 진균 균주
특정 구현예에서, 본 발명은 SSB7 단백질을 암호화하는 유전자의 유전자 변형, 및 MPG1 단백질(서열 번호 14), SFB3 단백질(서열 번호 15), SEB1 단백질(서열 번호 16), CRZ1 단백질(서열 번호 17) 및/또는 GAS1 단백질(서열 번호 18)을 암호화하는 유전자의 하나 이상의 유전자 변형을 포함하는 사상성 진균의 변이체 균주에 관한 것이다.
예를 들어, MPG1 단백질, SFB3 단백질, SEB1 단백질, CRZ1 단백질 및/또는 GAS1 단백질을 암호화하는 유전자의 유전자 변형을 포함하는 변이체 사상성 진균 균주는 이것이 유래된 모 균주에 비해 점도 감소 표현형을 포함한다(예를 들어, 상기 언급된 점도 감소 표현형을 기재하는 국제 PCT 공보 WO2012/145584호, WO2012/027580호, WO2012/145595호, WO2012/145596호, WO2012/145596호 및 WO2012/145592호 참조).
따라서, 특정 구현예에서, 사상성 진균의 변이체 균주는 SSB7을 암호화하는 유전자의 유전자 변형 및 MPG1, SFB3, SEB1, CRZ1 및/또는 GAS1로부터 선택된 단백질을 암호화하는 유전자의 하나 이상의 유전자 변형을 포함한다.
특정 구현예에서, ssb7 유전자의 유전자 변형 및 mpg1, sfb3, seb1, crz1 및/또는 gas1 유전자의 적어도 하나의 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 ssb7 유전자 단독의 유전자 변형만을 포함하는 사상성 진균의 변이체 균주에 비해 점도 감소 표현형을 추가로 포함한다. 보다 구체적으로는, 사상성 진균의 이러한 변이체 균주는 액침 배양에서의 호기성 발효 동안 (ssb7 단독의 유전자 변형을 포함하는 모 균주 및/또는 이의 변이체 균주의 세포에 비해) (i) 미리 선택된 용존 산소(DO) 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스, 및/또는 (ii) 미리 선택된 양의 교반에서 증가한 DO 함량을 유지시키는 세포 브로스를 생산한다.
V. 분자 생물학
일반적으로 상기 기재된 것처럼, 본 발명의 특정 구현예는 사상성 진균의 모 균주로부터 유래된 사상성 진균의 변이체 균주에 관한 것이다. 이 변이체 균주의 세포는 후속하여 액침 배양에서의 호기성 발효 동안 모 균주의 세포와 비교하여 미리 선택된 용존 산소(DO) 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스, 및/또는 미리 선택된 양의 교반에서 증가한 DO 함량을 유지시키는 세포 브로스를 생산한다. 따라서, 특정 구현예에서, 점도 감소 표현형을 포함하는 본 발명의 변이체 균주는 SSB7을 암호화하는 유전자의 유전자 변형(즉, 모 균주의 세포에 대한 것)을 포함한다.
따라서, 본원에 기재된 사상성 진균의 변이체 균주는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 유전자 변형은 본원에 개시된 SSB7 단백질의 (a) 유전자(또는 ORF)에서 하나 이상의 뉴클레오티드의 도입, 치환 또는 제거, 또는 유전자(또는 이의 ORF)의 전사 또는 번역에 필요한 조절 요소에서의 하나 이상의 뉴클레오티드의 도입, 치환 또는 제거, (b) 유전자 파괴, (c) 유전자 전환, (d) 유전자 결실, (e) 유전자 하향조절, (f) 특이적 돌연변이유발 및/또는 (g) 랜덤 돌연변이유발을 포함하지만, 이들로 제한되지는 않는다. 다른 구현예에서, SSB7을 암호화하는 유전자의 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 MPG1, SFB3, SEB1, CRZ1 및/또는 GAS1 단백질을 암호화하는 하나 이상의 유전자의 유전자 변형을 추가로 포함한다.
따라서, 특정 구현예에서, SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 자연적 SSB7 단백질의 발현/생산을 제거하도록 유전자 결실에 의해 작제된다. 다른 구현예에서, 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 자연적 SSB7 단백질의 발현/생산을 제거하도록 부분 유전자 결실에 의해 작제된다. 예를 들어, 특정 구현예에서, 변형된 사상성 진균 균주는 ssb7 유전자의 부분 결실을 포함하고, 여기서 부분 결실은 ssb7 유전자의 암호화 서열의 임의의 부분의 부분 결실을 포함한다. 따라서, 점도 감소 표현형을 포함하는 이러한 변이체 균주는 자연적 SSB7 단백질을 발현/생산하지 않는다. 예를 들어, 유전자 결실 기법은 유전자의 부분 제거 또는 완전 제거가 가능하게 하여 자연적 단백질의 발현/생산을 제거한다. 이러한 방법에서, 유전자의 결실은 유전자와 측접하는 5' 및 3' 영역을 인접하여 함유하도록 작제된 통합 플라스미드/벡터를 사용하여 상동성 재조합에 의해 달성될 수 있다. 인접한 5' 및 3' 영역은, 플라스미드가 세포에서 통합되게 하도록, 예를 들어 선별 마커와 공동으로 통합 플라스미드/벡터 상의 사상성 진균 세포로 도입될 수 있다.
다른 구현예에서, 사상성 진균의 변이체 균주는 단백질(예를 들어, SSB7)을 암호화하는 유전자를 파괴하거나 불활성화하는 유전자 변형을 포함한다. 예시적인 유전자 파괴/불활성화 방법은 폴리펩타이드 암호화 서열(CDS), 프로모터, 인핸서 또는 다른 조절 요소를 포함하는 유전자의 임의의 부분을 파괴하는 것을 포함하는데, 파괴는 치환, 삽입, 결실, 역위, 및 이들의 조합 및 이들의 변형을 포함한다.
따라서, 특정 구현예에서, 사상성 진균의 변이체 균주는 유전자 파괴 기법에 의해 작제된다. 유전자 파괴 기법의 비제한적인 예는 (예를 들어, ssb7) 유전자에 상동성인 핵산 단편을 함유하는 통합 플라스미드를 본 발명의 하나 이상의 유전자로 삽입(통합)하는 것을 포함하고, 이는 상동성 영역의 중복을 생성하고 중복된 영역들 간에 (인서트) 벡터 DNA를 혼입할 것이다. 예를 들어, 실시예 부문에 기재된 것처럼, 사상성 진균의 이러한 변이체 균주(즉, ssb7 유전자 파괴를 포함)는 본 발명의 점도 감소 표현형을 포함한다.
따라서, 특정 다른 비제한적인 예에서, 유전자 파괴 기법은 (예를 들어, ssb7) 유전자에 상동성인 핵산 단편을 함유하는 통합 플라스미드를 유전자(예를 들어, SSB7 단백질을 암호화하는 유전자)로 삽입하는 것을 포함하고, 이는 상동성 영역의 중복을 생성하고 중복된 영역들 간에 (인서트) 벡터 DNA를 혼입할 것이고, 여기서 삽입된 벡터 DNA는 예를 들어 SSB7 단백질 암호화 영역으로부터 ssb7 유전자의 프로모터를 분리시키거나 ssb7 유전자의 암호화 서열 또는 비암호화 서열을 중단(파괴)시켜서, 이의 점도 감소 표현형 균주를 생성시킨다. 따라서, 파괴 작제물은 ssb7 유전자에 상동성인 5' 및 3' 영역이 동반된 선별 마커 유전자(예를 들어, pyr2)일 수 있다. 선별 마커는 파괴된 유전자를 함유하는 형질전환체의 확인이 가능하게 한다. 따라서, 특정 구현예에서, 유전자 파괴는 유전자의 제어 요소의 변형, 예컨대 프로모터, 비번역 영역(UTR), 코돈 변경 등을 포함한다.
다른 구현예에서, 사상성 진균의 변이체 균주는 유전자 또는 이의 전사 또는 번역에 필요한 조절 요소에서의 하나 이상의 뉴클레오타이드를 도입하거나 치환하거나 제거함으로써 작제된다(즉, 유전자 변형된다). 예를 들어, 뉴클레오타이드는 종결 코돈이 도입되거나, 시작 코돈이 제거되거나, 오픈 리딩 프레임(ORF)이 프레임 시프트되도록 삽입되거나 제거될 수 있고, 예를 들어 대립유전자 ssb7(fs)을 참조한다. 이러한 변형은 당업계에 알려진 방법에 따라 부위 지정 돌연변이유발 또는 PCR에 의해 생성된 돌연변이유발에 의해 달성될 수 있다(예를 들어, Botstein 및 Shortle의 1985 문헌; Lo 등의 1985 문헌; Higuchi 등의 1988 문헌; Shimada의 1996 문헌; Ho 등의 1989 문헌; Horton 등의 1989 문헌 및 Sarkar 및 Sommer의 1990 문헌 참조).
다른 실시형태에서, 사상성 진균의 변이체 균주는 유전자 변환의 과정에 의해 작제된다(즉, 유전자 변형된다)(예를 들어, Iglesias 및 Trautner의 1983 문헌 참조). 예를 들어, 유전자 변환 방법에서, 표적 유전자에 대응하는 핵산 서열은 결함 핵산 서열을 생산하도록 시험관내 돌연변이되고, 이후 결함 유전자를 포함하는 변이체 세포를 생산하기 위해 모 세포로 형질전환된다. 상동 재조합에 의해, 결함 핵산 서열은 내인성 유전자를 대체한다. 결함 유전자 또는 유전자 단편이 결함 유전자를 함유하는 형질전환체의 선택에 사용될 수 있는 마커도 암호화하는 것이 바람직할 수 있다. 예를 들어, 결함 유전자는 선별 마커와 연관되어 비복제 또는 온도 감수성 플라스미드 상에 도입될 수 있다. 플라스미드의 통합에 대한 선택은 플라스미드 복제를 허용하지 않는 조건 하에 마커에 대한 선택에 의해 실행된다. 유전자 대체로 이어지는 제2 재조합 사건에 대한 선택은 선별 마커의 손실 및 돌연변이된 유전자의 획득에 대한 콜로니 검사에 의해 실행된다(Perego의 1993 문헌).
다른 구현예에서, 사상성 진균의 변이체 균주는 ssb7 유전자의 핵산 서열에 상보성인 뉴클레오티드 서열을 사용하는 확립된 안티센스 (유전자 침묵) 기법에 의해 작제된다(Parish 및 Stoker의 1997 문헌). 보다 구체적으로는, 사상성 진균 균주에 의한 유전자의 발현은 세포에서 전사되고 세포에서 생산된 mRNA에 혼성화할 수 있는 유전자의 핵산 서열에 상보성인 뉴클레오타이드 서열을 도입함으로써 감소(하향조절)되거나 제거될 수 있다. 따라서, 상보성인 안티센스 뉴클레오타이드 서열이 mRNA에 혼성화되게 하는 조건 하에 번역된 단백질의 양은 감소되거나 제거된다. 이러한 안티센스 방법은 RNA 간섭(RNAi), 소간섭 RNA(siRNA), 마이크로RNA(miRNA), 안티센스 올리고뉴클레오타이드 등을 포함하지만, 이들로 제한되지는 않으며, 이들 모두는 당업자에게 잘 알려져 있다.
다른 구현예에서, 사상성 진균의 변이체 균주는 비제한적인 예로서 화학 돌연변이유발(예를 들어, Hopwood의 1970 문헌 참조) 및 전좌(예를 들어, Youngman 등의 1983 문헌 참조)를 포함하는 당해 분야에 잘 알려진 방법을 사용하여 랜덤 또는 특이적 돌연변이유발에 의해 작제된다(즉, 유전자 변형된다). 유전자 변형은, 모 세포에서 돌연변이를 유발시키고 유전자의 발현이 감소되거나 제거된 돌연변이체 세포를 스크리닝함으로써 수행될 수 있다. 예를 들어, 당업자는 점도 감소 표현형을 포함하는 사상성 진균 세포의 이러한 (돌연변이유도된) 변이체 균주를 확인하기 위해 본원과 실시예 부문에 기재된 스크리닝 방법을 용이하게 적응하고/하거나 변형시킬 수 있다.
특이적 또는 무작위적일 수 있는 돌연변이 유발은 예를 들어 적합한 물리적 또는 화학적 돌연변이 유발제를 사용하거나, 적합한 올리고뉴클레오타이드를 사용하거나, DNA 서열이 PCR에 의한 돌연변이를 유발하게 함으로써 수행될 수 있다. 더욱이, 돌연변이 유발은 이들 돌연변이유발 방법의 임의의 조합을 사용함으로써 수행될 수 있다. 본 목적에 적합한 물리적 또는 화학적 돌연변이 유발제의 예는 자외선(UV) 조사, 하이드록실아민, N-메틸-N'-니트로-N-니트로소구아니딘(MNNG), N-메틸-N'-니트로소구아니딘(NTG), O-메틸 히드록실아민, 아질산, 에틸 메탄 설포네이트(EMS), 아황산수소나트륨, 포름산 및 뉴클레오타이드 유사체를 포함한다. 이러한 유발제가 사용될 때, 돌연변이유발은 일반적으로 적절한 조건 하에 선택된 돌연변이 유발제의 존재 하에 돌연변이유발되는 모 세포를 배양하고, 유전자 발현 감소를 나타내거나 유전자를 발현하지 않는 돌연변이체 세포를 선택함으로써 수행된다.
예를 들어, 본원에 개시된 하나 이상의 유전자에서의 이러한 유전자 변형은 유전자의 프로모터의 효율을 감소시키거나, 인핸서의 효율을 감소시키거나, 유전자의 mRNA의 스플라이싱 또는 편집을 방해하거나, 유전자의 mRNA의 번역을 방해하거나, 전장 단백질의 번역을 방지하도록 유전자의 암호화 서열로 종결 코돈을 도입하거나, 덜 활성이거나 불활성인 단백질을 생산하도록 단백질의 암호화 서열을 변경하거나, 다른 핵 단백질 성분과의 단백질 상호작용을 감소시키거나, 덜 안정한 단백질을 생산하도록 단백질의 암호화 서열을 변경하거나, 파괴를 위해 단백질을 표적화하거나, 단백질이 (예를 들어, 글리코실화에 의해) 미스폴딩되거나 부정확하게 변형되게 하거나, 단백질의 세포 이동을 방해할 수 있다.
특정 다른 구현예에서, 사상성 진균의 변이체 균주는 부위 특이적 유전자 편집 기법에 의해 작제된다(즉, 유전자 변형된다). 예를 들어, 특정 구현예에서, 사상성 진균의 변이체 균주는 전사 활성자 유사 엔도뉴클레아제(TALEN), 징크 핑거 엔도뉴클레아제(ZFN), 호밍(mega) 엔도뉴클레아제 등을 사용하여 작제된다(즉, 유전자 변형된다). 보다 구체적으로는, 변형될 유전자의 부분(예를 들어, 암호화 영역, 비암호화 영역, 리더 서열, 프로-펩타이드 서열, 신호 서열, 전사 종결자, 전사 활성자 또는 암호화 영역의 발현에 필요한 다른 조절 요소)은 ZFN 유전자 편집, TALEN 유전자 편집, 호밍(mega) 엔도뉴클레아제 등에 의해 유전자 변형되고, 변형 방법은 당업자에게 잘 알려져 있고 이용 가능하다.
따라서, 특정 구현예에서, 사상성 진균의 변이체 균주는 CRISPR/Cas9 편집에 의해 작제된다(즉, 유전자 변형된다)(예를 들어, 본원의 실시예 참조). 보다 구체적으로는, CRISPR/Cas9 시스템에 의한 진균 게놈 변형에 대한 조성물 및 방법이 기재되어 있고 당해 분야에 잘 알려져 있다(예를 들어, 국제 PCT 공보 WO2016/100571호, WO2016/100568호, WO2016/100272호, WO2016/100562호 등 참조). 따라서, SSB7 단백질을 암호화하는 유전자는 엔도뉴클레아제를 DNA 상의 표적 서열로 동원하는 가이드 RNA(예를 들어, Cas9) 또는 가이드 DNA(예를 들어, NgAgo)에 결합함으로써, 표적 DNA를 찾는, 핵산 가이드된 엔도뉴클레아제에 의해 파괴되거나 결실되거나 돌연변이되거나, 달리 유전자 변형될 수 있고, 여기서 엔도뉴클레아제는 DNA에서 단일쇄 또는 이중쇄 절단을 생성할 수 있다. 이러한 표적화된 DNA 절단은 DNA 복구를 위한 기질이 되고, 유전자를 파괴하거나 결실시키도록 제공된 편집 주형과 재조합된다. 예를 들어, 핵산 가이드된 엔도뉴클레아제를 암호화하는 유전자(예를 들어, S. 피오게네스 유래의 Cas9 또는 Cas9 뉴클레아제를 암호화하는 코돈 최적화된 유전자)는 사상성 진균 세포에서 활성인 프로모터 및 사상성 진균 세포에서 활성인 종결자에 작동 가능하게 연결되어 사상성 진균 Cas9 발현 카세트를 생성한다. 마찬가지로, 관심 유전자에 대해 고유한 하나 이상의 표적 부위가 당업자에 의해 쉽게 확인된다.
예를 들어, 관심 유전자 내의 표적 부위로 지시된 gRNA를 암호화하는 DNA 작제물을 작제하기 위해, 가변 표적화(VT) 도메인은 (PAM) 프로토-스페이서 인접 모티프(TGG)의 5'인 표적 부위의 뉴클레오타이드를 포함할 것이며, 이 뉴클레오타이드는 S. 피오게네스 Cas9에 대한 Cas9 엔도뉴클레아제 인식 도메인(CER)을 암호화하는 DNA에 융합된다. VT 도메인을 암호화하는 DNA와 CER 도메인을 암호화하는 DNA의 조합에 의해 gRNA를 암호화하는 DNA가 생성된다. 따라서, gRNA를 암호화하는 DNA를 사상성 진균 세포에서 활성인 프로모터 및 사상성 진균 세포에서 활성인 종결자에 작동 가능하게 연결함으로써 gRNA에 대한 사상성 진균 발현 카세트가 생성된다.
특정 구현예에서, 엔도뉴클레아제에 의해 유도된 DNA 절단은 유입 서열로 복구/대체된다. 예를 들어, 상기 기재된 Cas9 발현 카세트 및 gRNA 발현 카세트에 의해 생성된 DNA 절단을 정밀하게 복구하기 위해, 뉴클레오타이드 편집 주형이 제공되어서 세포의 DNA 복구 기작은 편집 주형을 이용할 수 있다. 예를 들어, 표적화된 유전자의 5'인 약 500 bp가 표적화된 유전자의 3'인 약 500 bp에 융합되어 편집 주형을 생성할 수 있고, 이 주형은 사상성 진균 숙주의 기작에 의해 사용되어 RGEN(RNA-가이드된 엔도뉴클레아제)에 의해 생성된 DNA 절단을 복구한다.
Cas9 발현 카세트, gRNA 발현 카세트 및 편집 주형은 많은 상이한 방법(예를 들어, 원형질체 융합, 전기천공, 자연 유능성 또는 유도 유능성)을 사용하여 사상 진균 세포에 동시전달될 수 있다. 형질전환된 세포는 PCR에 의해, 정방향 프라이머 및 역방향 프라이머로 표적 유전자위를 증폭시킴으로써 스크리닝된다. 이러한 프라이머는 야생형 유전자위 또는 RGEN에 의해 편집된 변형된 유전자위를 증폭시킬 수 있다. 이후 시퀀싱 프라이머를 사용하여 이들 단편을 시퀀싱하여 편집된 콜로니를 확인한다.
본 발명의 SSB7 단백질을 암호화하는 유전자가 유전자 변형될 수 있는 다른 방식은 관심 유전자의 발현 수준을 변경하는 것에 의한다. 예를 들어, 이러한 뉴클레오타이드-가이드된 엔도뉴클레아제의 뉴클레아제-결함 변이체(예를 들어, Cas9 D10A, N863A 또는 Cas9 D10A, H840A)는 표적 유전자의 전사를 향상시키거나 길항시킴으로써 유전자 발현 수준을 조절하도록 사용될 수 있다. 이 Cas9 변이체는 단백질 서열에 존재하는 모든 뉴클레아제 도메인에 대해 불활성이지만, RNA-가이드된 DNA 결합 활성을 보유한다(즉, 이 Cas9 변이체는 동족 표적 부위에 결합할 때 DNA의 어느 한 가닥을 절단할 수 없음).
따라서, 뉴클레아제-결함 단백질(즉, Cas9 변이체)은 사상성 진균 발현 카세트로서 발현될 수 있어서, Cas9 변이체 단백질은 사상성 진균 gRNA 발현 카세트와 조합될 때 세포 내에 특이적 표적 서열에 지향된다. 특이적 유전자 표적 부위에 대한 Cas9 (변이체) 단백질의 결합은 세포의 DNA 상에서 전사 기작의 결합 또는 이동을 차단하여 유전자 산물의 생산량을 감소시킬 수 있다. 따라서, 본원에 개시된 임의의 유전자는 이 방법을 사용하여 감소한 유전자 발현에 대해 표적화될 수 있다. 유전자 침묵은 뉴클레아제-결함 Cas9 발현 카세트 및 gRNA 발현 카세트(들)를 함유하는 세포에서 RNAseq와 같은 방법을 사용함으로써 모니터링될 수 있다.
VI. 유용성
일반적으로 상기 기재되고, 하기 실시예 부문에 추가로 기재된 것처럼, 본원에 개시된 사상성 진균의 점도 감소 균주의 사용은 액침 배양에서의 산소 및 영양소의 분포를 개선하고, 액침 배양물을 교반하는 데 필요한 에너지의 양을 감소시키고, 증가한 세포량 농도가 배양물에 존재하게 하여서, 단백질 생산을 증가시킨다. 게다가, 본원에 개시된 사상성 진균의 변이체 균주는 완전히 한정된 게놈을 포함하여, 이것이 후속하는 유전자 조작, 보완, 짝짓기(mating) 등에 매우 적합하게 한다. 마찬가지로, 본 발명의 균주는 예를 들어 점도 감소를 수반하는 조작(들)에 의해 단백질 생산에서 불리하게 영향을 받지 않는다. 더욱이, 본원에 개시된 사상성 진균의 이들 변이체 균주(즉, 점도 감소 균주)는 높은 수준 발현에 의도되는 단백질(즉, 내인성 관심 단백질 또는 이종성 관심 단백질)을 이미 생산하거나, 선별 마커를 이미 암호화하거나, 제조 숙주에서 바람직한 다른 특징을 이미 포함하는 모 균주를 포함하여 본질적으로 임의의 모 균주로부터 생산될 수 있다. 따라서, 본 발명의 균주 및 방법은 관심 단백질을 암호화하는 유전자를 이미 존재하는 점도 감소 생성 균주로 운반할 필요성을 제거한다.
따라서, 본 발명의 균주 및 방법은 사상성 진균의 액침 배양에서 상업적으로 중요한 단백질의 생산에서 이용된다. 예를 들어, 상업적으로 중요한 단백질은 셀룰라아제, 자일라나제, 만나아제, 헤미셀룰라아제, 펙티나아제, 리아제, 프로테아제, 키나제, 아밀라아제, 풀룰라나아제, 리파아제, 에스터라제, 퍼하이드롤라제, 트랜스퍼라제, 라카아제, 카탈라아제, 옥시다제, 리덕타제, 클로로필라아제, 하이드로포빈, 키모신, 탄산무수화효소, 티미딜레이트 신타아제, 디하이드로폴레이트 리덕타제, 티로신 키나제, 다중 약물 내성 단백질(예를 들어, ABC P-gp 단백질), CAD(카바밀-P 신타아제, 아스파르테이트 트랜스카바밀라아제, 디하이드로오로타제), 토포아이소머라제, 리보뉴클레오타이드 리덕타제, 항체, 및 사상성 진균에서 발현될 수 있는 다른 효소 및 비효소 단백질을 포함하지만, 이들로 제한되지는 않는다. 이러한 단백질은 산업, 제약, 동물 건강, 식품 및 음료 사용 등에 적합하다.
VII. 관심 단백질
상기 부분에 간단히 기재된 것처럼, 본 발명의 균주 및 방법은 사상성 진균의 액침 배양에서 상업적으로 중요한 단백질의 생산에 이용된다. 본 발명의 관심 단백질(POI)은 임의의 내인성 또는 이종성 단백질일 수 있으며, 이는 이러한 POI의 변이체일 수 있다. 단백질은 하나 이상의 이황화 가교를 함유할 수 있거나, 기능적 형태가 단량체 또는 다량체인 단백질이고, 즉 단백질은 4차 구조를 가지며, 복수의 동일한(상동성) 아단위 또는 비동일한(이종성) 아단위로 이루어지며, 여기서 POI 또는 이의 변이체 POI는 바람직하게는 관심 특성을 갖는 것이다.
특정 구현예에서, POI 또는 변이체 POI는 아세틸 에스테라아제, 아미노펩티다아제, 아밀라아제, 아라비나아제, 아라비노푸라노시다아제, 탄산무수화효소, 카복시펩티다아제, 카탈라아제, 셀룰라아제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라아제, 에스테라아제, α-갈락토시다아제, β-갈락토시다아제, α-글루카나아제, 글루칸 리아제, 엔도-β-글루카나아제, 글루코아밀라아제, 글루코스 산화효소, α-글루코시다아제, β-글루코시다아제, 글루쿠로니다아제, 글리코실 가수분해효소, 헤미셀룰라아제, 헥소스 산화효소, 가수분해효소, 인버타아제, 아이소머라아제, 락카아제, 리가아제(ligase), 리파아제, 리아제, 만나나아제, 만노시다아제, 산화효소, 산화환원효소, 펙테이트 리아제, 펙틴 아세틸 에스테라아제, 펙틴 해중합효소, 펙틴 메틸 에스테라아제, 펙틴분해 효소, 퍼하이드롤라아제, 폴리올 산화효소, 과산화효소, 페놀산화효소, 피타아제, 폴리갈락투로나아제, 프로테아제, 펩티다아제, 람노-갈락투로나아제, 리보뉴클레아제, 전환효소, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소스 산화효소, 및 이들의 조합으로 이루어진 군으로부터 선택된다.
특정 구현예에서, POI 또는 변이체 POI는 EC 1, EC 2, EC 3, EC 4, EC 5 또는 EC 6으로 이루어진 군으로부터 선택된 효소 위원회(EC: Enzyme Commission) 번호로부터 선택된다.
예를 들어, 특정 구현예에서, POI는 비제한적인 예로서 EC 1.10.3.2(예를 들어, 락카아제), EC 1.10.3.3(예를 들어, L-아스코르브산 옥시다아제), EC 1.1.1.1(예를 들어, 알코올 탈수소효소), EC 1.11.1.10(예를 들어, 염화물 퍼옥시다아제), EC 1.11.1.17(예를 들어, 퍼옥시다아제), EC 1.1.1.27(예를 들어, L-락테이트 탈수소효소), EC 1.1.1.47(예를 들어, 글루코스 1-탈수소효소), EC 1.1.3.X(예를 들어, 글루코스 옥시다아제), EC 1.1.3.10(예를 들어, 피라노스 옥시다아제), EC 1.13.11.X(예를 들어, 디옥시게나아제), EC 1.13.11.12(예를 들어, 리네올레이트 13S-리폭시게나아제), EC 1.1.3.13(예를 들어, 알코올 옥시다아제), EC 1.14.14.1(예를 들어, 모노옥시게나아제), EC 1.14.18.1(예를 들어, 모노페놀 모노옥시게나아제), EC 1.15.1.1(예를 들어, 수퍼옥사이드 디스무타아제), EC 1.1.5.9(이전 EC 1.1.99.10, 예를 들어, 글루코스 탈수소효소), EC 1.1.99.18(예를 들어, 셀로비오스 탈수소효소), EC 1.1.99.29(예를 들어, 피라노스 탈수소효소), EC 1.2.1.X(예를 들어, 지방산 리덕타아제), EC 1.2.1.10(예를 들어, 아세트알데하이드 탈수소효소), EC 1.5.3.X(예를 들어, 프룩토실 아민 리덕타아제), EC 1.8.1.X(예를 들어, 이황화물 리덕타아제) 및 EC 1.8.3.2(예를 들어, 티올 옥시다아제)로부터 선택된 EC 1(옥시도리덕타아제) 효소를 포함하나 이에 한정되지 않는 옥시도리덕타아제 효소이다.
특정 구현예에서, POI는 비제한적인 예로서 EC 2.3.2.13(예를 들어, 트랜스글루타미나아제), EC 2.4.1.X(예를 들어, 헥소실트랜스퍼라아제), EC 2.4.1.40(예를 들어, 알터나수크라아제), EC 2.4.1.18(예를 들어, 1,4 알파-글루칸 분지화 효소), EC 2.4.1.19(예를 들어, 사이클로말토덱스트린 글루카노트랜스퍼라아제), EC 2.4.1.2(예를 들어, 덱스트린 덱스트라나아제), EC 2.4.1.20(예를 들어, 셀로비오스 포스포릴라아제), EC 2.4.1.25(예를 들어, 4-알파-글루카노트랜스퍼라아제), EC 2.4.1.333(예를 들어, 1,2-베티-올리고글루칸 포스포르 트랜스퍼라아제), EC 2.4.1.4(예를 들어, 아밀로수크라아제), EC 2.4.1.5(예를 들어, 덱스트란수크라아제), EC 2.4.1.69(예를 들어, 갈락토시드 2-알파-L-푸코실 트랜스퍼라아제), EC 2.4.1.9(예를 들어, 이눌로수크라아제), EC 2.7.1.17(예를 들어, 자일룰로키나제), EC 2.7.7.89(이전에 EC 3.1.4.15, 예를 들어, [글루타민 합성효소]-아데닐-L-티로신 포스포릴라아제), EC 2.7.9.4(예를 들어, 알파 글루칸 키나제) 및 EC 2.7.9.5(예를 들어, 포스포글루칸 키나제)로부터 선택된 EC 2(트랜스퍼라아제) 효소를 포함하는 트랜스퍼라아제 효소이다.
다른 구현예에서, POI는 비제한적인 예로서 EC 3.1.X.X(예를 들어, 에스테라아제), EC 3.1.1.1(예를 들어, 펙티나아제), EC 3.1.1.14(예를 들어, 클로로필라제), EC 3.1.1.20(예를 들어, 타나아제), EC 3.1.1.23(예를 들어, 글리세롤-에스테르 아실하이드롤라아제), EC 3.1.1.26(예를 들어, 갈락토리파아제), EC 3.1.1.32(예를 들어, 포스포리파아제 A1), EC 3.1.1.4(예를 들어, 포스포리파아제 A2), EC 3.1.1.6(예를 들어, 아세틸에스테라아제), EC 3.1.1.72(예를 들어, 아세틸자일란 에스테라아제), EC 3.1.1.73(예를 들어, 페룰로일 에스테라아제), EC 3.1.1.74(예를 들어, 큐티나아제), EC 3.1.1.86(예를 들어, 람노갈락투로난 아세틸에스테라아제), EC 3.1.1.87(예를 들어, 푸모신 B1 에스테라아제), EC 3.1.26.5(예를 들어, 리보뉴클레아제 P), EC 3.1.3.X(예를 들어, 포스포릭 모노에스테르 하이드롤라아제), EC 3.1.30.1(예를 들어, 아스페르길루스 뉴클레아제 S1), EC 3.1.30.2(예를 들어, 세라티아 마르세센스 뉴클레아제), EC 3.1.3.1(예를 들어, 알칼라인 포스파타제), EC 3.1.3.2(예를 들어, 산 포스파타제), EC 3.1.3.8(예를 들어, 3-피타아제), EC 3.1.4.1(예를 들어, 포스포디에스테라아제 I), EC 3.1.4.11(예를 들어, 포스포이노시티드 포스포리파아제 C), EC 3.1.4.3(예를 들어, 포스포리파아제 C), EC 3.1.4.4(예를 들어, 포스포리파아제 D), EC 3.1.6.1(예를 들어, 아릴설파타제), EC 3.1.8.2(예를 들어, 디이소프로필-플루오로포스파타제), EC 3.2.1.10(예를 들어, 올리고-1,6-글루코시다아제), EC 3.2.1.101(예를 들어, 만난 엔도-1,6-알파-만노시다아제), EC 3.2.1.11(예를 들어, 알파-1,6-글루칸-6-글루카노하이드롤라아제), EC 3.2.1.131(예를 들어, 자일란 알파-1,2-글루쿠로노시다아제), EC 3.2.1.132(예를 들어, 키토산 N-아세틸글루코스아미노하이드롤라아제), EC 3.2.1.139(예를 들어, 알파-글루쿠로니다아제), EC 3.2.1.14(예를 들어, 키티나아제), EC 3.2.1.151(예를 들어, 자일로글루칸-특이적 엔도-베타-1,4-글루카나아제), EC 3.2.1.155(예를 들어, 자일로글루칸-특이적 엑소-베타-1,4-글루카나아제), EC 3.2.1.164(예를 들어, 갈락탄 엔도-1,6-베타-갈락토시다아제), EC 3.2.1.17(예를 들어, 라이소자임), EC 3.2.1.171(예를 들어, 람노갈락투로난 하이드롤라아제), EC 3.2.1.174(예를 들어, 람노갈락투로난 람노하이드롤라아제), EC 3.2.1.2(예를 들어, 베타-아밀라아제), EC 3.2.1.20(예를 들어, 알파-글루코시다아제), EC 3.2.1.22(예를 들어, 알파-갈락토시다아제), EC 3.2.1.25(예를 들어, 베타-만노시다아제), EC 3.2.1.26(예를 들어, 베타-프럭토푸라노시다아제), EC 3.2.1.37(예를 들어, 자일란 1,4-베타-자일로시다아제), EC 3.2.1.39(예를 들어, 글루칸 엔도-1,3-베타-D-글루코시다아제), EC 3.2.1.40(예를 들어, 알파-L-람노시다아제), EC 3.2.1.51(예를 들어, 알파-L-푸코시다아제), EC 3.2.1.52(예를 들어, 베타-N-아세틸헥소스아미니다아제), EC 3.2.1.55(예를 들어, 알파-N-아라비노푸라노시다아제), EC 3.2.1.58(예를 들어, 글루칸 1,3-베타-글루코시다아제), EC 3.2.1.59(예를 들어, 글루칸 엔도-1,3-알파-글루코시다아제), EC 3.2.1.67(예를 들어, 갈락투란 1,4-알파-갈락투로니다제), EC 3.2.1.68(예를 들어, 이소아밀라아제), EC 3.2.1.7(예를 들어, 1-베타-D-프럭탄 프럭타노하이드롤라아제), EC 3.2.1.74(예를 들어, 글루칸 1,4-β-글루코시다아제), EC 3.2.1.75(예를 들어, 글루칸 엔도-1,6-베타-글루코시다아제), EC 3.2.1.77(예를 들어, 만난 1,2-(1,3)-알파-만노시다아제), EC 3.2.1.80(예를 들어, 프럭탄 베타-프럭토시다아제), EC 3.2.1.82(예를 들어, 엑소-폴리-알파-갈락투로노시다아제), EC 3.2.1.83(예를 들어, 카파-카라기나아제), EC 3.2.1.89(예를 들어, 아라비노갈락탄 엔도-1,4-베타-갈락토시다아제), EC 3.2.1.91(예를 들어, 셀룰로스 1,4-베타-셀로비오시다아제), EC 3.2.1.96(예를 들어, 만노실-당단백질 엔도-베타-N-아세틸글루코스아미니다아제), EC 3.2.1.99(예를 들어, 아라비난 엔도-1,5-알파-L-아라비나아제), EC 3.4.X.X(예를 들어, 펩티다아제), EC 3.4.11.X(예를 들어, 아미노펩티다아제), EC 3.4.11.1(예를 들어, 류실 아미노펩티다아제), EC 3.4.11.18(예를 들어, 메티오닐 아미노펩티다아제), EC 3.4.13.9(예를 들어, Xaa-Pro 디펩티다아제), EC 3.4.14.5(예를 들어, 디펩티딜-펩티다아제 IV), EC 3.4.16.X(예를 들어, 세린-유형 카복시펩티다아제), EC 3.4.16.5(예를 들어, 카복시펩티다아제 C), EC 3.4.19.3(예를 들어, 피로글루타밀-펩티다아제 I), EC 3.4.21.X(예를 들어, 세린 엔도펩티다아제), EC 3.4.21.1(예를 들어, 키모트립신), EC 3.4.21.19(예를 들어, 글루타밀 엔도펩티다아제), EC 3.4.21.26(예를 들어, 프롤릴 올리고펩티다아제), EC 3.4.21.4(예를 들어, 트립신), EC 3.4.21.5(예를 들어, 트롬빈), EC 3.4.21.63(예를 들어, 오리진), EC 3.4.21.65(예를 들어, 써모마이콜린), EC 3.4.21.80(예를 들어, 스트렙토그리신 A), EC 3.4.22.X(예를 들어, 시스테인 엔도펩티다아제), EC 3.4.22.14(예를 들어, 악티니딘), EC 3.4.22.2(예를 들어, 파파인), EC 3.4.22.3(예를 들어, 피카인), EC 3.4.22.32(예를 들어, 줄기 브로멜라인), EC 3.4.22.33(예를 들어, 과일 브로멜라인), EC 3.4.22.6(예를 들어, 키모파파인), EC 3.4.23.1(예를 들어, 펩신 A), EC 3.4.23.2(예를 들어, 펩신 B), EC 3.4.23.22(예를 들어, 엔도티아펩신), EC 3.4.23.23(예를 들어, 무코르펩신), EC 3.4.23.3(예를 들어, 가스트릭신), EC 3.4.24.X(예를 들어, 메탈로엔도펩티다아제), EC 3.4.24.39(예를 들어, 듀테로라이신), EC 3.4.24.40(예를 들어, 세랄라이신), EC 3.5.1.1(예를 들어, 아스파라기나아제), EC 3.5.1.11(예를 들어, 페니실린 아미다아제), EC 3.5.1.14(예를 들어, N-아실-지방족-L-아미노산 아미도하이드롤라아제), EC 3.5.1.2(예를 들어, L-글루타민 아미도하이드롤라아제), EC 3.5.1.28(예를 들어, N-아세틸무라모일-L-알라닌 아미다아제), EC 3.5.1.4(예를 들어, 아미다아제), EC 3.5.1.44(예를 들어, 단백질-L-글루타민 아미도하이드롤라아제), EC 3.5.1.5(예를 들어, 우레아제), EC 3.5.1.52(예를 들어, 펩타이드-N(4)-(N-아세틸-베타-글루코스아미닐)아스파라긴 아미다아제), EC 3.5.1.81(예를 들어, N-아실-D-아미노산 데아실라제), EC 3.5.4.6(예를 들어, AMP 탈아미노효소) 및 EC 3.5.5.1(예를 들어, 니트릴라아제)로부터 선택된 EC 3(가수분해효소) 효소를 포함하는 가수분해효소 효소이다.
다른 구현예에서, POI는 비제한적인 예로서 EC 4.1.2.10(예를 들어, 만델로니트릴 리아제), EC 4.1.3.3(예를 들어, N-아세틸뉴라미네이트 리아제), EC 4.2.1.1(예를 들어, 탄산탈수효소), EC 4.2.2.-(예를 들어, 람노갈락투로난 리아제), EC 4.2.2.10(예를 들어, 펙틴 리아제), EC 4.2.2.22(예를 들어, 펙테이트 트리사카라이드-리아제), EC 4.2.2.23(예를 들어, 람노갈락투로난 엔도리아제) 및 EC 4.2.2.3(예를 들어, 만누로네이트-특이적 알기네이트 리아제)로부터 선택된 EC 4(리아제) 효소를 포함하는 리아제 효소이다.
특정 다른 구현예에서, POI는 비제한적인 예로서 EC 5.1.3.3(예를 들어, 알도오스 1-에피머라아제), EC 5.1.3.30(예를 들어, D-사이코스 3-에피머라아제), EC 5.4.99.11(예를 들어, 이소말툴로스 합상효소) 및 EC 5.4.99.15(예를 들어, (1→4)-α-D-글루칸 1-α-D-글루코실무타아제)로부터 선택된 EC 5(아이소머라아제) 효소를 포함하는 아이소머라아제 효소이다.
또 다른 구현예에서, POI는 비제한적인 예로서 EC 6.2.1.12(예를 들어, 4-쿠마레이트:조효소 A 리가아제) 및 EC 6.3.2.28(예를 들어, L-아미노산 알파-리가아제)로부터 선택된 EC 6(리가아제) 효소를 포함하는 리가아제 효소이다.
본 발명의 균주 및 방법의 이들 및 다른 양태 및 구현예는 본 설명 및 하기 실시예를 고려하여 당업자에게 명확할 것이다.
실시예
본 발명의 특정 양태는 다음의 실시예를 고려하여 추가로 이해될 수 있는데, 이는 제한하는 것으로 해석되어서는 안된다. 재료 및 방법의 변형은 당업자에게 명백할 것이다.
실시예 1
사상성 진균에서 형태 변화의 원인인 것으로서의 ssb7 유전자의 확인
A. 개요
트리코데르마 레세이는 상업적 발효에서 사용될 때 두꺼운 점성의 발효 브로스를 생성하는 호기성 사상성 진균이다. 예를 들어, 이러한 발효 브로스의 높은 점도는 특히 산소 이동을 감소시켜 세포량의 양을 제한하고, 이는 부수적으로 T. 레세이 상업적 발효에서 달성되는 부피 생산성을 감소시킨다. 점도 감소 돌연변이체의 단리는 더 낮은 점도의 발효 브로스를 생성하는 돌연변이체 균주를 생성시킬 수 있다. 이러한 돌연변이체 균주에 의해서, 발효는 더 많은 세포량을 이용하여, 부피 생산성을 증가시킬 수 있다. 보다 구체적으로는, 하나의 이러한 돌연변이체인 Morph 77B7은 유전적 검색으로부터 단리되었고, 여기서 원인성 돌연변이는 이전에 규명되지 않은 MIT 도메인 함유 단백질을 암호화하는 유전자인 ssb7에서 프레임 쉬프트 돌연변이로서 확인되었다. 본 실시예(및 하기 실시예 2 및 실시예 3)에서, ssb7의 상이한 돌연변이체 대립유전자가 개시되어 있는데, 이는 ssb7의 돌연변이가 발효 브로스 점도를 감소시킨다는 것을 예시한다. 본원에 개시된 ssb7 유전좌위 및 돌연변이체 ssb7 대립유전자는 도 1에 제시되어 있다.
B. 형태 돌연변이체에 대한 스크리닝
"TrGA 29-9"라 명명된 트리코데르마 균주를 발현하는 글루코아밀라아제(GA)(미국 특허 제9,725,727호(구체적으로 본원에 그 전체가 참고로 포함됨) 참조)는 10% 사멸이 얻어질 때까지 NTG(N-메틸-N'-니트로-N-니트로소구아니딘)로 돌연변이되었다. 살아 있는 세포를 PDA(감자 덱스트로스 한천)에 평판도말하고 포자를 형성하게 하였다. 포자를 물에 현탁한 후에 플레이트로부터 긁어냈다. 포자를 48시간 내지 72시간 동안 YEG(효모 추출물 글루코스 브로스)에서 성장시키고, 생성된 균사를 200 마이크로미터(㎛) 필터를 통해 체질하고, 이것을 후속하여 엄청난 양의 물로 세척하였다. 여과액을 스핀 다운하고, 균사를 수집하고, YEG로 재접종하였다. 균사를 매회 더 작은 필터를 통해 체질함을 제외하고는 이 정확한 절차를 수회 반복하였다. 최종 단계에서, 균사를 YEG에서 성장시킨 후에 40 ㎛ 필터를 통해 통과시키고, 균사를 여과액으로부터 회수하고, PDA에 평판도말하였다.
포자 라이브러리를 만들고, 콜로니 피커(picker)를 사용하여 구십육(96)웰 라이브러리를 준비하였다. 현미경관찰을 이용하여 라이브러리를 액체 배양에서 스크리닝하고, 형태(즉, 표현형) 변경을 나타낸 돌연변이체를 회수하였다. 이 스크린으로부터의 돌연변이체를 높은 세포 밀도 진탕 플라스크에서 추가로 평가하였다. 낮은 점도 브로스를 갖는 돌연변이체를 표준 세포 밀도 및 높은 세포 밀도 조건 하에 감소한 점도(표현형), 산소 이동 특성 및 단백질 생산에 대해 14 ℓ 발효기에서 추가로 평가하였다.
C. T. 레세이 Morph 77B7의 단리 및 규명
"Morph 77B7"로 명명된 T. 레세이 돌연변이체(즉, 상기 실시예 1B에 기재된 바대로 얻음)는 액침 액체 배양에서 특히 모체보다 더 짧고 더 두꺼운 필라멘트를 갖는 변경된 형태(표현형)를 갖는 것으로 관찰되었다. 예를 들어, 액체 배지에서, Morph 77B7 돌연변이체를 함유하는 배양물은 또한 모체를 함유하는 배양물과 비교하여 성장 동안 더 높은 수준의 용존 산소(DO)를 나타냈다(표 1 참조).
보다 구체적으로는, T. 레세이 균주인 TrGA 29-9 및 Morph 77B7을 액침 (액체) 배양에서 유사한 조건 하에 성장시키고, 이의 성장 표현형을 비교하였다. 간단히 말하면, 각각의 균주의 포자를 측면 배플 및 하부 배플 둘 다를 갖는 3 ℓ 플라스크에서 500 mL의 최소 배지에 별개로 첨가하고, 60% 글루코스를 27.5 g/ℓ의 최종 농도로 첨가하였다. 배양물을 진탕 항온처리기에서 34℃에서 48시간 동안 성장시켰다.
48시간 후, 각각의 플라스크의 내용물을 9.5 ℓ의 배지(4.7 g/ℓ의 KH2PO4, 1.0 g/ℓ의 MgSO4·7·H2O, 4.3 g/ℓ의 (NH4)2SO4 및 175 g/ℓ의 시트르산, 200 g/ℓ의 FeSO4·7·H2O, 16 g/ℓ의 ZnSO4·7·H2O, 3.2 g/ℓ의 CuSO4·5·H2O, 1.4 g/ℓ의 MnSO4·H2O 및 0.8 g/ℓ의 H3BO3을 함유하는 2.5 mL/ℓ의 400X 미량 원소 용액을 함유)를 함유하는 14 ℓ 발효기에 별개로 첨가하였다. 이들 성분들을 121℃에서 30분 동안 함께 열 멸균하였다. 60% 글루코스 및 0.48% CaCl2·2·H2O의 용액을 별개로 오토클레이빙하고, 냉각시키고, 75 g/ℓ의 글루코스 및 0.6 g/ℓ의 CaCl2·2·H2O의 최종 농도로 발효기에 첨가하였다. 배지를 28% NH3으로 pH 3.5로 조정하고, 전체 성장 기간 동안 34℃에서 온도를 유지시켰다.
헤드스페이스에서 압력이 추가되지 않을 때(즉, 0 bar 게이지, 1 bar 절대), 용존 산소(DO) 프로브는 100%로 보정되었다. 이후, 헤드스페이스에서의 압력은 0.7 bar(게이지)로 설정되고, 이후 시드 배양물이 첨가되기 전에 산소 프로브는 170% 판독되었다. 발효기는 초기에 500 RPM에서 설정된 가변 속도를 통해 혼합이 제공되는 2개의 4-블레이드 터빈을 함유하였다.
배양물이 성장하면서, 적어도 부분적으로 사상성 진균 균사의 증식으로 인한 발효 브로스의 점도 증가의 결과로서 DO 함량 수준이 떨어졌다. DO 함량 수준이 40% 아래로 떨어질 때, 교반 속도를 증가시켜 40%에서 용존 산소를 유지시켰다. DO 함량 수준은 750 RPM 교반에 도달할 시에 40% 아래로 떨어지게 될 것이다. DO 함량이 40% 아래로 떨어지지 않으면, 발효 실행 동안 교반 속도를 증가시킬 필요가 없고, 초기 교반 속도는 필요한 것보다 더 높았다. 글루코스가 완전히 소모될 때, 각각의 발효기에서 생성된 바이오매스의 양이 측정되고, 균주 둘 다에 대해 실질적으로 동일한 것으로 발견되었다.
따라서, 주어진 교반 수준에서의 각각의 발효기에서의 DO 함량 수준 및 주어진 DO 함량 수준을 유지시키는 데 필요한 교반의 양은 상이한 브로스의 점도(즉, 상이한 균주 성장 표현형으로 인함)의 간접 측정치이다. 오직 하나의 변수(즉, DO 또는 교반)를 변경하고 다른 변수를 측정하는 것이 이상적일 것이지만, 각각의 발효기에서의 충분한 바이오매스를 보장하여 상이한 균주의 성장 간의 더 의미 있는 비교를 허용하도록 DO가 40% 아래로 떨어지는 것을 방지하는 것이 바람직하다.
표 1에 기재된 것처럼, 균주 Morph 77B7은 (모) TrGA 29-9 균주와 비교하여 발효 브로스 점도가 감소하였다. 예를 들어, 배치 성장 단계의 종료시(즉, 모든 글루코스가 소모될 때), 균주 둘 다는 유사한 바이오매스 농도 및 유사한 피크 탄소 발생 속도(CER: carbon evolution rate)를 달성하였다. 거기까지, 대조군 균주는 750 RPM의 최대 세트포인트까지의 교반 증가를 겪고, DO는 15%까지의 최소 세트포인트 아래로 떨어졌다. 그에 반해서, Morph 7B77 돌연변이체 균주는 동일한 바이오매스 농도를 달성하기 위해 그렇게 많은 교반을 요하지 않고, 교반 속도는 오직 40% 세트포인트에서 DO를 유지시키기 위해 616 RPM까지 증가하였다.
Figure pct00001
D. T. 레세이 Morph 77B7에서의 원인성 ssb7 (fs) 돌연변이체 대립유전자의 확인
T. 레세이 TrGA 29-9 모체 및 Morph 77B7 돌연변이체 균주의 게놈을 (일반적으로 PCT 공보 WO2012/027580호에 기재된 바와 같이) 서열분석하여, Morph 77B7 게놈에서의 암호화 서열을 변경시키는 것으로 예측된 여덟(8)개의 새로운 돌연변이를 확인하였고, 이들 돌연변이 중 어느 것은 단독으로 또는 조합되어 본원에 기재된 관찰된 변경된 형태 표현형 및 점도 감소에 필요할 것이다. 따라서, 이들 돌연변이 중 어느 것이 중요한지를 결정하기 위해, 보완 분석을 수행하였다.
보다 구체적으로는, 오직 하나의 유전좌위는 본원에서 "ssb7"로 명명된 돌연변이체 표현형을 보완하였다. 따라서, 서열 번호 1의 ssb7 유전자는 동일한 DNA 서열에서의 다른 단백질 예측과 부분적으로 중첩하는 새로 예측된 단백질인 SSB7, 예를 들어 트리코데르마 레세이 QM6a 단백질 ID(PID) 108712를 암호화한다(The Genome Portal of the Department of Energy Joint Genome Institute, Grigoriev et al., 2011, 이하 "JGI 포탈"로 축약). 돌연변이체 균주 Morph 77B7에서, ssb7 돌연변이체 대립유전자는 엑손 2(T. 레세이 QM6a 스캐폴드 13, 167404)에서 단일 구아닌(G) 뉴클레오타이드 결실(ΔG)을 포함한다. 예를 들어, 엑손 2(즉, ssb7 돌연변이체 대립유전자)에서의 G의 결실은 프레임 쉬프트 돌연변이 및 ssb7 유전자의 마지막 인트론 전의 조기 중단을 발생시킨다. 이 대립유전자는 본원에서 "ssb7(fs)"이라 지칭된다.
DNA 단편에 의한 형질전환에 의한 T. 레세이 돌연변이체 균주 Morph 77B7 균사 표현형의 보완이 하기와 같이 수행되었다. 돌연변이체 Morph 77B7에서 관찰된 각각의 여덟(8)개의 돌연변이체 유전좌위에 대해, 형질전환 선택 마커 및 발현을 보장하기에 충분한 플랭킹 서열을 갖는 야생형 유전좌위 서열에 대응하는 DNA 단편을 함유하는 플라스미드가 개발되었다. 돌연변이체 균주 Morph 77B7 원형질체는 각각의 이들 플라스미드로 별개로 형질전환되었다. 각각의 플라스미드로부터의 두(2)개의 형질전환체를 선택적 액체 배지를 갖는 진탕 플라스크로 옮기고, 33℃에서 3일 동안 성장시켰다. 대부분의 DNA 단편을 보유하는 형질전환체는 Morph 77B7 돌연변이체 균주에 대해 관찰된 과분지하고 두꺼운 균사 표현형을 보유하였다. DNA 단편 1에 대한 형질전환체(Morph 77B7에서의 다른 돌연변이체 유전좌위 중 하나를 암호화함, 즉 PID 112328을 암호화하는 유전자)는 이 돌연변이체 표현형을 예시한다. 그에 반해서, DNA 단편 6을 포함하는 형질전환체(즉, PID 108712/SSB7을 암호화함)만이 적어도 부분적으로 더 얇고 덜 분지된 균사로 이 표현형을 반전시켰다. 도 2에 도시된 것처럼, DNA 단편 1(도 2, 패널 1A 및 패널 1B) 및 DNA 단편 6(도 2, 패널 6A 및 패널 6B)은 각각의 DNA 단편 1 및 6에 대한 독립적인 형질전환체를 나타낸다. 서열 번호 4의 변이체 SSB7 단백질을 암호화하는 돌연변이체 ssb7(fs) 대립유전자의 핵산 서열(서열 번호 3)은 도 3에 제시되어 있다.
따라서, 일반적으로 상기 기재된 것처럼, 야생형 T. 레세이 ssb7 유전자의 핵산 서열(서열 번호 1)은 본 문헌에 규명되지 않은 SSB7(서열 번호 2)을 암호화한다. 예를 들어, SSB7에 대한 JGI 포탈 T. 레세이 QM6a v2.0 데이터베이스 PID는 108712(http://genome.jgi-psf.org/cgi-bin/dispGeneModel?db=Trire2&id=108712; 서열 번호 33)이지만, SSB7에 대한 JGI T. 레세이 RUT-C30 데이터베이스 PID는 82397(Jourdier et al., 2017; 서열 번호 35)이다. 따라서, DNA 서열은 두(2)개의 T. 레세이 균주 사이에 이 유전좌위에서 동일하지만, 암호화 서열은 약간 상이한 것으로 예측된다(도 1a 참조; "QM6a JGI ssb7 PID 108712" 및 "RUT-C30 PID 82397"). 구체적으로는, 균주 QM6a 유전자 모델(PID 108712/서열 번호 33을 암호화하는 서열 번호 32)의 N 말단은 균주 RUT-C30 유전자 모델(PID 82397/서열 번호 35를 암호화하는 서열 번호 34)보다 두(2)개의 추가의 엑손을 보유하는 반면, 균주 RUT-C30 유전자 모델은 추가의 인트론을 함유한다. 이 유전좌위에서의 유전자 모델 예측을 분석하기 위해, 본 발명자들은 푸나노테이트 진균 게놈 주석 파이프라인과 커플링된 T. 레세이로부터의 RNA-서열분석 데이터를 이용하였다(JM Palmer. 2019. Funannotate genome annotation pipeline. Zenodo. http://doi.org/10.5281/zenodo.1134477). 푸나노테이트는 RNA-서열분석 판독 맵핑에 의해 지지된 유전자 모델을 예측하였지만, QM6a 및 RUT-C30에서의 JGI로부터의 모델 예측 둘 다는 RNA-서열분석 데이터와 비호환성인 인트론-엑손 경계를 가졌다(도 1a 참조). SSB7 유전자 예측은 3개의 엑손(서열 번호 19, 서열 번호 20 및 서열 번호 21), 462 bp 5' UTR(서열 번호 36) 및 373 bp 3' UTR(서열 번호 37)을 함유하는 4762 bp 전사체로부터 번역된 1308개의 아미노산의 번역된 단백질을 생성시킨다. 본원에서 출원인은 푸나노테이트 소프트웨어로부터 도출된 예측을 이용하여 ssb7 유전자 및 SSB7 단백질의 좌표를 참조할 것이다. 본원에서 출원인은 푸나노테이트 소프트웨어로부터 도출된 예측을 이용하여 ssb7 유전자(서열 번호 1) 및 SSB7 단백질(서열 번호 2)의 좌표를 참조하는 한편, 게놈 좌표는 여전히 JGI QM6a v2 어셈블리를 참조할 것이다.
E. 상동성에 기초한 기능
본원에서 수행된 BLAST 검색은 SSB7 단백질 오솔로그가 사카로미세테스가 아니라 푸사륨 종(서열 번호 8), 뉴로스포라 종(서열 번호 9), 마이셀리오프토라 종(서열 번호 10), 탈라로마이세스 종(서열 번호 11), 아스페르길루스 종(서열 번호 12), 및 페니실륨 종(서열 번호 13)에 존재한다는 것을 나타냈다. 예를 들어, T. 레세이 ssb7 유전자는 예측된 미세소관 상호작용 및 수송(MIT) 도메인(표 2, 영역 A도 5 참조) 및 표 2영역 B, 영역 C 및 영역 D로 기재된 미공지 SSB7 단백질 도메인을 포함하는 미확인되었지만 고도로 보존된 SSB7 단백질을 암호화한다. 보다 구체적으로는, 삼백오십삼(353)개의 자낭균 동족체(N 말단 MIT 도메인에 걸친 아미노산이 결여된 짧은 단백질 예측을 배제)는 소프트웨어 패키지 Geneious에서 MUSCLE 방법을 이용하여 정렬되었다(Edgar RC (2004). "MUSCLE: multiple sequence alignment with high accuracy and high throughput". Nucleic Acids Research. 32 (5): 1792-97. doi:10.1093/nar/gkh340). 그래프 출력은 도 5에 제시되어 있고, 여기서 네(4)개의 아미노산 보존 영역(A 내지 D)은 정렬로부터 확인되었다. 영역 A는 MIT 도메인과 중첩하였다. 보존은 현재의 과학 지식에 기초하여 정확한 효소적 기능 또는 구조적 기능이 아미노산 서열에 의해 제시되지 않지만 이 4개의 영역이 SSB7 기능에 중요하다는 것을 암시한다.
Figure pct00002
실시예 2
모 균주 TrGA 29-9에서의 ssb7 의 파괴에 의한 MORPH 77B7-표현형의 재생성
A. 개요
ssb7 돌연변이가 점도 감소의 원인이라는 것을 추가로 검증하기 위해, ssb7 유전좌위는 모 균주 TrGA 29-9에서 특이적으로 돌연변이되었다. 따라서, 두(2)가지 방법은 상동성 재조합에 의해 ssb7 돌연변이유발을 표적화하기 위해 이용되었다. 플라스미드 pRATT311로부터의 선형 DNA 카세트를 사용한 한가지 방법은 균주 Morph 77B7(대립유전자 "ssb7(311)")에서 확인된 ΔG의 부위에서 파괴적 DNA의 삽입을 표적화하였다.
원형 플라스미드 pTrex2g MoCas 77b7-HR1을 사용한 두번째 방법은 프레임 쉬프트 돌연변이(대립유전자 "ssb7(TS1)"; 대립유전자의 비교에 대해 도 1을 참조)의 하류에서 (원래의 프레임에 비해) 하나의 동의 코돈 변경과 함께 균주 Morph 77B7에서 확인된 ΔG 돌연변이를 도입하였다. 따라서, ssb7의 대립유전자 둘 다는 감소한 점도를 나타냈고, 여기서 프레임 쉬프트 대립유전자인 ssb7(TS1)은 더 양호한 점도 감소를 가졌다.
B. 균주 TrGA 29-9에서의 대립유전자 ssb7 ( 311 )
T. 레세이 ssb7 파괴 카세트 플라스미드 pRATT311은 표준 분자 생물학 절차를 이용하여 준비되었다. 따라서, 당업자는 개시된 관련 DNA 부분으로부터 이 플라스미드를 용이하게 재생성할 수 있다. 이 플라스미드는 스캐폴드 13, 164849 내지 167403에 대응하는 DNA 서열에 상동성인 2.6 Kb 상동성 박스를 갖는 DNA 서열(왼쪽 플랭크)을 포함하였다. 스캐폴드 13, 167405 내지 169218에 대응하는 DNA 서열에 상동성인 1.8 Kb 상동성 박스를 갖는 DNA 서열(오른쪽 플랭크)은 이 플라스미드 내에 포함되었다. 이 서열은 ssb7 유전자를 표적화하고, 개재하는 카세트 서열로 왼쪽 플랭크와 오른쪽 플랭크(스캐폴드 13, 167404) 사이의 게놈의 뉴클레오타이드를 대체하도록 설계되었다. 이 개재하는 카세트 서열은 트리코데르마 아트로비리데로부터의 pyr2 선택 마커를 포함하였다. 왼쪽 플랭크(반복서열)의 가장 3'인 영역에 상동성인 스캐폴드 13, 167403 내지 166833에 대응하는 0.6 Kb 영역을 갖는 DNA 서열이 pyr2 선택 마커의 바로 하류에 있다. 이 반복된 서열은 pyr2 마커의 후속하는 손실을 촉진하여 오직 새로 표적화된 게놈 변형으로서 ssb7 유전자에서 단일 뉴클레오타이드 G 결실 돌연변이(스캐폴드 13, 167404)를 남기면서 미래의 균주 개발에서 이의 마커의 사용을 가능하게 한다. 본원과 제시된 데이터가 pyr2 마커를 함유하는 pRATT311 형질전환체 및 ssb7 암호화 서열을 파괴시키는 반복서열로부터 유래함에 유의한다(도 1).
균주 TrGA 29-9의 자발적인 pyr2 돌연변이체 유도체는 5-플루오로-오로트산(FOA) 선택에 의해 단리되었다. 이 TrGA 29-9 pyr2 균주는 PEG 매개 원형질체 형질전환을 이용하여 pRATT311로부터의 ssb7 파괴 카세트로 형질전환되고, pyr2 마커에 의해 획득된 우리딘 프로토트로프(prototrophy)에 기초하여 후보를 선택하기 위해 소르비톨을 함유하는 Vogel 최소 배지에 평판도말되었다. 개별 형질전환체는 단리되고 Vogel 최소 배지로 이동시켜 증식되었다. PCR 분석은 형질전환체를 확인하도록 사용되는데, 여기서 ssb7 파괴 카세트는 하기 지침에 따라 당업자가 수행할 수 있는 것처럼 상동성 재조합에 의해 ssb7 유전좌위에서 통합되었다.
재조합 세포의 하위집단만이 관심 유전자의 파괴를 정확히 표적화하기 위해 상동성 플랭크를 성공적으로 이용할 수 있어서, 많은 형질전환체는 원하는 사건을 갖는 것을 확인하기 위해 스크리닝될 필요가 있을 수 있다. PCR은 어떠한 재조합 세포가 원하는 표적화된 파괴를 갖는지를 시험하기 위해 이용될 수 있다. 각각의 상동성 박스 영역에 걸쳐 증폭하는 프라이머가 설계되어야 하고, 여기서 하나의 프라이머는 가장 가까운 말단으로부터 100 bp 초과인 선별 마커 내의 위치에서 프라이밍하고, 다른 프라이머는 인접한 게놈 서열 내의 상동성 박스 영역의 말단을 넘어 100 bp 초과인 위치에서 프라이밍한다. 정확한 표적화된 파괴를 아마도 함유하는 세포는 파괴 카세트의 왼쪽 플랭크 및 오른쪽 플랭크에 이르는 PCR 산물을 성공적으로 생성하는 반면, 성공적이지 않은 형질전환 사건은 예상된 크기의 산물을 생성하지 않을 것이다. 이 단계에서 배양물은 형질전환된 세포와 비형질전환된 세포의 혼합물일 수 있고, 그래서 정제 단계가 필요할 수 있다. 배양물의 정제는 파괴 부위에 이르는 짧은 PCR 산물의 손실에 대해서 PCR에 의해 시험될 수 있다. ssb7 파괴 카세트의 확인된 상동성 통합을 갖는 생성된 균주는 "TrGA 29-9 ssb7(311)"로 명명된다.
C. 균주 TrGA 29-9에서의 대립유전자 ssb7 ( TS1 )
본원에 기재된 균주 TrGA 29-9에서 ssb7의 cas9 매개 편집에 사용된 벡터 및 균주 개발을 위한 방법은 본질적으로 PCT 공보 PCT/US2015/65693호 및 WO2016/100272호에 기재된 바대로 수행될 수 있고, 여기서 이 공보 내의 실시예 3 및 실시예 4는 pTrex2gHyg MoCas를 구축하는 것을 기술하고; 실시예 5는 이 벡터로 가이드 RNA(gRNA) 발현 카세트를 부가하는 것을 기술하고; 실시예 8은 HR-지시된 게놈 편집, 형질전환 및 스크리닝을 위한 상동성 영역에서의 부가를 추가로 기술한다.
도 6a에 도시된 gBlock DNA 서열(서열 번호 5)을 Integrated DNA Technologies, Inc.(IDT, 아이오와주 코럴빌)로부터 주문하였고, 여기서 EcoRV에 의한 분해 후에 pTrex2gHyg MoCas와의 Gibson 어셈블리를 허용하도록 5'-말단 또는 3'-말단에서 밑줄 표시된 서열이 부가되었다. 이들 밑줄 표시된 서열들 사이는 ssb7 유전자 내의 T. 레세이 게놈으로부터 1,098 bp이다. 회색 하이라이팅은 야생형 ssb7 유전자에서는 일곱(7)개의 G 잔기인 돌연변이체 ssb7(fs) 대립유전자의 여섯(6)개의 G 잔기를 보여준다. 내부 이중 밑줄 표시된 서열은 가이드 RNA(gRNA) 서열에 대응하는 20-뉴클레오타이드(nt) 표적 부위이다. 처음의 20-nt 표적은 "TS1"이라 칭해지고, 두번째의 20-nt 표적은 "TS2"라 칭해지고, 여기서 볼드 서체 c 잔기는 그 표적 부위에 인접한 PAM 부위를 변경시키는 G→C 변경을 나타낸다.
ssb7 유전자에서의 1개의 표적화 TS1(서열 번호 6, 도 6b) 및 ssb7 유전자에서의 1개의 표적화 TS2(서열 번호 7, 도 6c)인 2개의 상이한 단일 가이드 RNA(sgRNA)에 대한 발현 카세트를 암호화하는 2개의 gBlock을 IDT로부터 주문하였다. 따라서, SfiI 및 AflII에 의한 분해 후 pTrex2gHyg MoCas와의 Gibson 어셈블리를 허용하도록 2개의 gBlock의 말단 중 어느 하나에서 밑줄 표시된 서열이 부가되었다.
따라서, 2개의 최종 벡터가 작제되었다. 하나의, pTrex2g MoCas 77b7-HR1은 ssb7 상동성 영역 및 TS1 sgRNA 카세트를 가졌다. 두 번째의, pTrex2g MoCas 77b7-HR2는 ssb7 상동성 영역 및 TS2 sgRNA 카세트를 가졌다. DNA 서열분석은 gBlock의 원하는 삽입을 검증하였다.
따라서, "ssb7(TS1)" 및 "ssb7(TS2)"인 본원에 개시된 ssb7 대립유전자 중 두(2)개는 이들 플라스미드에 의해 생성되었다. 대립유전자 ssb7(TS1)은 표적 서열 1(TS1)로부터 생성되었고, TS1 인식 서열을 불활성화하기 위해 스캐폴드 13, 167404에서의 원래의 프레임 쉬프트 돌연변이 및 스캐폴드 13, 167436에서의 G→C 돌연변이를 함유한다(도 1 참조). ssb7 유전자위의 확인된 상동성 조작을 갖는 생성된 균주는 “TrGA 29-9 ssb7(TS1)"로 명명된다. 예를 들어, PCT 공보 WO2016/100272호(PCT 출원 번호 PCT/US2015/065693호)는 CAS 엔도뉴클레아제를 포함/발현하는 재조합 진균 세포(예를 들어, 재조합 DNA 작제물을 통해 발현됨), 가이드 RNA(gRNA)를 포함/발현하는 재조합 진균 세포, 비기능적 활성 또는 감소한 활성의, 비상동성 말단 연결(NHEJ: non-homologous end joining) 경로를 포함하는 재조합 진균 세포, 사상성 진균 세포를 형질전환시키기 위한 방법 및 조성물, 이러한 형질전환된 진균 세포를 스크리닝하기 위한 방법 및 조성물 등을 기재한다. 따라서, 당업자는 PCT 공보 WO2016/100272호를 참조하여 본 발명의 임의의 사상성 진균 균주에서 대립유전자 ssb7(TS1), 또는 본원에 개시된 임의의 다른 변형된 대립유전자를 유사하게 작제할 수 있다.
D. 생물반응기에서의 점도 감소
트리코데르마 레세이 균주를 액침 (액체) 배양에서 유사한 조건 하에 성장시키고, 이의 성장 표현형을 비교하였다. 간단히 말하면, 각각의 균주의 포자를 측면 배플 및 하부 배플 둘 다를 갖는 250 mL의 플라스크에서 50 mL의 시트레이트 최소 배지에 별개로 첨가하였다. 배양물을 5 cm 쓰로우(throw)로 진탕 항온처리기에서 170 RPM에서 30℃에서 48시간 동안 성장시켰다. 48시간 후에, 각각의 플라스크의 내용물을 접종을 위해 2 ℓ 발효기(생물반응기)에 별개로 첨가하였다. 접종 전에, 4.7 g/ℓ의 KH2PO4, 1.0 g/ℓ의 MgSO4·7·H2O, 9 g/ℓ의 (NH4)2SO4 및 2.5 mL/ℓ의 미량 원소 용액을 함유하는 0.95 kg의 배지를 2 ℓ 생물반응기에 첨가하고, 이후 121℃에서 30분 동안 함께 열 멸균하였다. 탱크에 접종하기 전에 멸균된 4.8 mL의 50% 글루코스 및 0.96 mL의 0.48% CaCl2·2·H2O인 후멸균 첨가물을 첨가하였다. 배지는 14% NH3으로 pH 3.5로 조정되고, 전체 성장 기간 동안 온도는 30℃에서 유지되고, pH는 3.5에서 유지되었다.
헤드스페이스에서 압력이 추가되지 않을 때(즉, 0 bar 게이지, 1 bar 절대), 용존 산소(DO) 프로브를 100%로 보정하였다. 생물반응기는 초기에 800 RPM에서 설정된 가변 속도 모터를 통해 혼합이 제공되는 2개의 침수 임펠러 사이에 4-블레이드 Rushton 임펠러를 함유하였다.
배양물이 성장하면서, 적어도 부분적으로 사상성 진균 균사의 증식으로 인한 발효 브로스의 점도 증가의 결과로서 DO 수준이 떨어졌다. 생물반응기 내의 용존 산소의 제어는 여러 세트포인트를 조정하는 제어 루프에 기초하였다. DO가 30% 아래로 떨어질 때, 교반 속도는 1,200 RPM의 최대 교반 세트포인트로 30%에서 용존 산소를 유지시키도록 증가하였다. DO가 30%에서 유지되지 않으면, 산소 풍부도는 21%에서 40% 이하까지 증가하였다. DO가 여전히 유지되지 않으면, 가스 흐름을 60 sL/h에서 80 sL/h 이하까지 증가시켰다. 글루코스가 완전히 소모될 때, 각각의 생물반응기에서 생성된 바이오매스의 양이 측정되고, 모든 균주에 대해 실질적으로 동일한 것으로 발견되었다(약 50 g/kg 건조 세포 중량). 배치에 있는 글루코스의 소진 후에, 글루코스 제한 상태에서 세포를 유지시키고 단백질 생산을 장려하도록 글루코스 및 혼합 이당류의 느린 공급을 시작하였다. 생물반응기에서 모 TrGA 29-9 균주 및 2개의 ssb7 돌연변이체 (유래) 균주 TrGA 29-9 ssb7(311) 및 TrGA 29-9 ssb7(TS1)에 대한 교반 및 DO 프로필은 명확성을 위해 도 7에 제시된다.
예를 들어, 도 7에 도시된 것처럼, 소정의 교반 수준에서의 각각의 생물반응기에서의 DO 수준 및 소정의 DO 수준을 유지시키는 데 필요한 교반의 양은 발효 브로스 점도의 간접적인 측정치이고, 이 측정은 본원에 기재된 관찰된 진균 균주 성장 표현형과 상관된다(예를 들어, 도 2 참조). 오직 하나의 변수(즉, DO 또는 교반)를 변경하고 다른 변수를 측정하는 것이 이상적일 것이지만, 각각의 생물반응기에서의 충분한 바이오매스의 생산을 보장하고 높은 생산성을 달성하여 상이한 진균 균주의 성장 간의 더 의미 있는 비교를 허용하도록 DO가 30% 아래로 떨어지는 것을 방지하는 것이 바람직하다.
따라서, 상기 기재된 점도 감소의 이(2)회 측정치는 각각의 생물반응기 실행, DO-제한 및 교반-추가로부터 정량화되었다. 균주가 배치에 있는 글루코스를 소진할 때 다르고 그러므로 공급-시작을 촉발하므로, 이들은 또한 발효 동안 DO가 가장 제한될 때에 다르다. 따라서, 이 측정은 공급-시작 전 이십(20)시간에 그리고 이후 사십(40)시간에 이르는 발효 시간의 범위를 이용하여 계산되었다.
도 7은 이 범위의 플러스 및 마이너스 열(10)시간을 보여준다. DO-제한은 DO 수준이 최소 DO 세트포인트(즉, 36% 미만의 DO)보다 20% 미만 높은 샘플링 시점의 비율로서 정의되었다. 교반-추가는 중앙 루프에 의해 촉발되는 것처럼 800 RPM 세트포인트 초과의 추가의 교반의 평균으로 정의되었다. 점도가 세포 밀도에 따라 증가하며 발효 브로스 점도가 세포 밀도의 함수이므로, 돌연변이체와 모 균주 사이의 비교는 유사한 세포량 농도에서 오직 유효하다. 따라서, 이들 간접적인 측정치가 계산되는 범위 동안 피크 건조 세포 중량(DCW)은 실시예에 포함된다.
따라서, 점도 평가는 모 TrGA 29-9 균주 및 ssb7 돌연변이체 (딸) 균주 TrGA 29-9 ssb7(311 ) 및 TrGA 29-9 ssb7(TS1)에 대해 생물반응기에서 수행되었다. 배치 성장 단계의 종료시, 모든 글루코스가 소모될 때, 모든 균주는 유사한 바이오매스 농도를 달성하였다(표 3). 더욱이, ssb7(311) ssb7(TS1)인 ssb7 대립유전자 둘 다는 생물반응기 발효 브로스 점도(즉, TrGA 29-9 모체에 비해)를 감소시켰다. 또한, DO는 더 짧은 발효 기간 동안 낮았다. 따라서, 표 3은 DO를 세트포인트 초과로 유지시키는 데 필요한 감소한 양의 교반 및 DO가 세트포인트 20% 초과 또는 그 이하에 있는 감소한 시간 부분의 정량화된 측정치를 제공한다. 표 3에 기재된 것처럼, 점도 감소는 마커 삽입 ssb7(311)에 비해 프레임 쉬프트 대립유전자 ssb7(TS1)에 대해 더 높았다.
Figure pct00003
표 3에 제시된 점도 정량화 없이도, 교반이 돌연변이체 ssb7 대립유전자를 함유하는 딸 균주에 대해 감소한다는 것이 도 7에서 시각적으로 명확하다. 당업자는 최소 용존 산소, 초기 교반 및 최대 교반에 대한 최적 세트포인트 값이 사상성 진균 및 발효기 용기마다 다를 수 있음을 인식할 것이다. 모 균주의 용존 산소 제한 및 교반-추가 측정이 돌연변이체 딸 세포의 발효 동안 브로스 점도 변경의 검출을 가능하게 하는 범위에 있다는 것을 보장하도록 발효 매개변수가 설정되어야 함이 인식되어야 한다. 도 7에서의 모체 프로필은 이러한 정보제공 프로필을 예시한다.
실시예 3
전체 셀룰라아제 균주 T4abc에서의 ssb7 의 표적화된 돌연변이.
A. 개요
ssb7 돌연변이체의 유용성을 추가로 시험하기 위해, ssb7의 세(3)개의 돌연변이체 대립유전자는 또한 Nik1(M743T) 돌연변이(서열 번호 36)를 포함하고 셀룰라아제의 자연적 칵테일을 발현하는 "T4abc"라 명명된 상이한 T. 레세이 계통에서 평가되었다. 이 돌연변이체는 또한 점도 감소 표현형을 나타냈다.
B. 균주 T4abc에서의 대립유전자 ssb7 ( 311 ), ssb7 ( TS2 ) 및 ssb7 ( 339fs )
ssb7(311) 대립유전자는 균주 "T4abc ssb7(311)"을 생성하기 위해 상기 실시예 2에 기재된 것처럼 균주 T4abc pyr2에서 생성되었다. ssb7(TS2) 대립유전자는 표적 서열 2(Ts2)를 함유하는 플라스미드를 사용함을 제외하고는 실시예 2에서 ssb7(TS1)에서처럼 균주 T4abc에서 생성되었다. 따라서, 이것은 각각 TS1 및 TS2 인식 서열을 불활성화하도록 스캐폴드 13, 167404에서의 Morph 77B7 프레임 쉬프트 돌연변이, 및 스캐폴드 13, 167436 및 스캐폴드 13, 167466에서의 2개의 추가의 G → C 돌연변이를 함유하였다(도 1). 이 균주는 "T4abc ssb7(TS2)"로 명명되었다.
ssb7(339fs) 대립유전자가 플라스미드 pRATT339로 생성되는데, 이는 당업자가 개시된 관련 DNA 부분으로부터 이 플라스미드를 용이하게 재생성할 수 있도록 표준 분자 생물학 절차를 이용하여 준비되었다. 이 플라스미드는 스캐폴드 13, 165839 내지 169218에 대응하는 DNA 서열에 상동성인 3.4 Kb 상동성 박스를 갖는 DNA 서열(왼쪽 플랭크)을 포함하였다. 엑손 2에서의 프레임 쉬프트 돌연변이를 야기하는 단일 G 결실이 이 플랭크 내에 있다. 스캐폴드 13, 169273 내지 171458에 대응하는 DNA 서열에 상동성인 2.2 Kb 상동성 박스를 갖는 DNA 서열(오른쪽 플랭크) 또한 이 플라스미드 내에 포함되었다. 이 서열은 ssb7 유전자를 표적화하고, 개재하는 카세트 서열로 왼쪽 플랭크와 오른쪽 플랭크 사이의 게놈의 영역(스캐폴드 13, 169219 내지 169272)을 대체하도록 설계되었다.
이 개재하는 카세트 서열은 형질전환될 균주의 게놈에서 내인성 T. 레세이 pyr2에 대한 상동성을 최소화하도록 의도된 트리코데르마 아트로비리데로부터의 pyr2 선택 마커를 포함하였다. pyr2 선택 마커의 바로 상류에 마커의 3′-말단의 바로 반복된 중복(반복서열)이 있는데, 이는 후속하는 마커 손실 및 형질전환체/파괴체의 유용한 pyr2 돌연변이체 유도체의 단리를 촉진한다. 정확히 표적화된 개재하는 카세트 서열을 갖는 형질전환체의 하위집단에서, 왼쪽 플랭크에서의 프레임 쉬프트 돌연변이는 또한 게놈으로 혼입되어 엑손 2(스캐폴드 13, 167404)에서의 단일 G 뉴클레오타이드를 결실시킬 것이다. 본원에 개시된 ssb7(339fs) 대립유전자는 스캐폴드 13, 167404에서의 뉴클레오타이드 결실 및 스캐폴드 13, 169219 내지 169272 간의 반복-측접된 pyr2 마커의 삽입 둘 다를 함유한다(도 1).
따라서, 균주 T4abc pyr2는 PEG 매개 형질전환을 이용하여 pRATT339로부터의 ssb7 파괴 카세트로 형질전환되고, pyr2 마커에 의해 획득된 우리딘 프로토트로프에 기초하여 후보를 선택하기 위해 소르비톨을 함유하는 Vogel 최소 배지에 평판도말되었다. 개별 형질전환체는 단리되고 Vogel 최소 배지로 이동시켜 증식되었다. PCR 분석은 형질전환체를 확인하도록 사용되는데, ssb7 파괴 카세트는 상기 실시예 2-B에 기재된 것처럼 상동성 재조합에 의해 ssb7 유전좌위에서 통합되었다. 포자 정제 후에, 추가의 PCR 분석이 수행되어 통합이 정확히 발생하고 형질전환체가 동종핵성이라는 것을 보장하였다. 이후, 프레임 쉬프트 돌연변이에 이르는 ssb7 유전자의 부분은 PCR 증폭되고, 왼쪽 플랭크에서의 이 돌연변이가 통합 사건 동안 혼입되는지를 결정하도록 서열분석되었다. 엑손 3에서의 ssb7 파괴 카세트 및 엑손 2에서의 프레임 쉬프트 돌연변이의 확인된 상동성 통합을 갖는 생성된 균주는 "T4abc ssb7(339fs)"로 명명되었다.
C. 생물반응기에서의 점도 감소
점도 평가는 실시예 2에 기재된 바대로 T4abc 및 ssb7 돌연변이체 균주에 대해 생물반응기에서 수행되었다. 표 4에 기재된 것처럼, 배치 성장 단계의 종료시, 모든 글루코스가 소모될 때, 모든 균주는 유사한 바이오매스 농도(건조 세포 중량)을 달성하였다. 모든 세(3)개의 ssb7 대립유전자는 DO를 세트포인트 초과로 유지시키는 데 필요한 감소한 양의 교반(교반-추가) 및 DO가 세트포인트 20% 초과 또는 그 이하에 있는 감소한 시간 부분(DO 제한)에 의해 입증된 것처럼 T4abc 모체에 비해 생물반응기 브로스 점도를 감소시켰다.
Figure pct00004
참고문헌
국제 PCT 공개 PCT/US2015/65693호
국제 PCT 공개 WO2012/027580호
국제 PCT 공개 WO2012/145584호
국제 PCT 공개 WO2012/145592호
국제 PCT 공개 WO2012/145595호
국제 PCT 공개 WO2012/145596호
국제 PCT 공개 WO2016/100272호
국제 PCT 공개 WO2016/100568호
국제 PCT 공개 WO2016/100571호
국제 PCT 공개 WO2016/130523호
국제 PCT 공개 WO20161/00562호
미국 특허 제9,725,727호
Altschul et al., J. Mol. Biol. 215:403-10, 1990.
Altschul et al., Meth. Enzymol. 266:460-80, 1996.
Ausubel et al., “Current Protocols in Molecular Biology”, Eds., John Wiley & Sons, Inc., 1995, sections 2, 4 and 6.
Botstein and Shortle, Science 229: 4719, 1985.
Devereux et al., Nucleic Acids Res. 12:387-95, 1984.
Henikoff and Henikoff, Proc. Natl. Acad. Sci. USA 89:10915, 1989.
Higgins and Sharp, CABIOS 5:151-53, 1989.
Higgins et al., Gene 73:237-244, 1998.
Higuchi et al., Nucleic Acids Research 16: 7351, 1988.
Ho et al., Gene 77: 61, 1989.
Hopwood, The Isolation of Mutants in Methods in Microbiology (J. R. Norris and D. W. Ribbons, eds.) pp 363-433, Academic Press, New York, 1970.
Horton et al., Gene 77: 61, 1989.
Iglesias and Trautner, Molecular General Genetics 189: 73-76, 1983.
Jourdier et al., “Proximity ligation scaffolding and comparison of two Trichoderma reesei strains genomes”, Biotechnology for Biofuels, 10:151; 2017. 
Karlin et al., Proc. Natl. Acad. Sci. USA 90:5873-87, 1993.
Kyte and Doolittle, “A simple method for displaying the hydropathic character of a protein”, J. Mol. Biol. 157, 105-132, 1982.
Lo et al., Proceedings of the National Academy of Sciences USA 81: 2285, 1985.
Majoros et al., “TigrScan and GlimmerHMM: two open-source ab initio eukaryotic gene-finders”, Bioinformatics, 2878-2879, 2004.
Needleman and Wunsch, J. Mol. Biol., 48:443, 1970.
Parish and Stoker, FEMS Microbiology Letters 154: 151-157, 1997.
Perego, 1993, In A. L. Sonneshein, J. A. Hoch, and R. Losick, editors, Bacillus subtilis and Other Gram-Positive Bacteria, Chapter 42, American Society of Microbiology, Washington, D.C.
Sambrook et al., “Molecular Cloning: A Laboratory Manual”, Cold Spring Harbor Press, Cold Spring Harbor, N.Y. (1989), chapters 7, 9 and 11.
Sarkar and Sommer, BioTechniques 8: 404, 1990.
Shimada, Meth. Mol. Biol. 57: 157; 1996.
Smith and Waterman, Adv. Appl. Math. 2:482, 1981.
Stanke et al., “AUGUSTUS: a web server for gene prediction in eukaryotes that allows user-defined constraints” Nucleic acids research, Vol. 33, Web Server issue: W465-7, 2005.
The Genome Portal of the Department of Energy Joint Genome Institute, I. V. Grigoriev, H. Nordberg, I. Shabalov, A. Aerts, M. Cantor, D. Goodstein, A. Kuo, S. Minovitsky, R. Nikitin, R. A. Ohm, R. Otillar, A. Poliakov, I. Ratnere, R. Riley, T. Smirnova, D. Rokhsar, and I. Dubchak, Nucleic Acids Res., 2011, 0: gkr947v1-gkr947; http://genome.jgi-psf.org/
Youngman et al., Proc. Natl. Acad. Sci. USA 80: 2305-2309, 1983.
<110> Danisco <120> FILAMENTOUS FUNGAL STRAINS COMPRISING REDUCED VISCOSITY PHENOTYPES <130> NB40808-WO-PCT <150> US 62/661,658 <151> 2018-04-24 <160> 38 <170> PatentIn version 3.5 <210> 1 <211> 4067 <212> DNA <213> Hypocrea jecorina <400> 1 atgcagcaac cgccctcctt agttggcgac cgcagcatca ccggcctggg agacgcagcc 60 agccgaccaa atctctcttc atcctcgcct accgtcacca gcgcgccctc ggcaccgaca 120 tcgccaccgc cgcggccgcc aatatcgctg aatcccccgt cgcgagagcc tcctggcgtc 180 gagcccgtgc tccgcatcac gccagtcccg cgctccgtct ttgcctctgt ccaccagccg 240 cgcaagtcgt cgctggtcca gacgtcgcac gtcctgccct cgcccaggac cgccgccgca 300 gctcaccatc accatcccgt ctcgcattcc gcctctggca gcagcggcag caacggcagt 360 ggaagcggca gtggcagcgg cagcggcaat ctgctgcgtc aaacgcatcg cgacaccgtg 420 cacccccccg tcaagcggcc atccaccccg tcgtcgcatc ccaccagggg cgccagcacc 480 ggagcatcgc cgcagcaggg cgccagctcc cgaaaccgct cgtcgacgtc gcccgtttcg 540 tccccggcga gtcgcacgcc tccttatgca tctcgtcagg cctcagtttc ccattcccgc 600 cagcagcaca accaccatca tcagcaccaa caccagcatt accactccca caccagctcg 660 actaccagtc gcgccagcat cgaggccgta gtcggtgccg tccccgatcc ctcaggtcac 720 cgagcgccgc cgaaaccccg tcgaccggat cgcaaccact ttggcgcgtc agatcgcagc 780 gcaactccca ccctgtcgca cttcatgagg gcagagtcga gcatgtccat gagacattac 840 gagagcggcc ccttacgctc catgtcgccg aacccctacg gaacccctgc cgccaccacg 900 acgtcgtcca ctgccagaat gccgcacgag cagagccacg atccctacgc ccctcgcggc 960 cactctcgcg atcactcggg gaagagcagc agagacatgg gcaagccccg agctcagaag 1020 aatccctcac agaaggcgat gctctcccgt gccctgcaaa aggccaacac cgcagttcag 1080 ctcgacaatg ctcagaactt cgaaggcgct cgagaagcgt acgccgaggc ttgcgacttg 1140 ttgcagcagg tgcttgaccg aacaccggga gatgaggaca agcggaagct cgaagccatt 1200 gtaagtcacg gcggcaaccg gaatgtcgag cccgttgtct gtcattagta gatcacttgg 1260 aactgacaat ttcaatctgt agcaccaaac ttacaccagc cgcatcgatg agctggatca 1320 gttgggccct tggcaggttg agaccgtcaa ggctctgccg gcgcggccag agagcgagga 1380 gtacagcgcg tccatattca taccccagga ttacgacatg ggcgatgaag ctcccaggat 1440 tgagacggca cgggtggtga gctacatcgc tggagacaac gcgtctccct ttgcagcagc 1500 gcccaaccag tggcagcagt cgggaggtca cacggcatct gaacggctgc agcccaaccg 1560 cggtctggaa ccgggtctgc tacagtcgtc cttctctcgg gccccgaggt cgcccaggcg 1620 gctgcagtcc accgatgatc ttcgcgcaca gcatcaggag ggccagtatg cgcctccccc 1680 actctcgcct cgctcgcagt cgccggtaaa gacgcatgac catgacgacg acatgtttgc 1740 cgaactgcca ccacacgagc cctatcagta ccagcaagag cacgaccatc aagaccacca 1800 tcaagactac catcaacatc accgccatca caaccaccac catcacgaac gacagcccag 1860 cgagactgtc ctatcctcat acgagctcca gggtcatgtg gatggaggaa tccaaaactc 1920 atggctagat ccaattgacg agtcgggagg ctcaacagcg tcgtctgtac actcacgcac 1980 ctcttcgctt ggctaccgtc gacgccatat ccgggccgtg agcgggaaca ccgaggccga 2040 gtttgacacg gcgctggacg ctgctatcga ggctgcctac gacgacggct acgagcccat 2100 ggactctgta gactatggga ccattgatgc tgggggggac aatagcatgg caggcgtatt 2160 gcacaaggtg gagatggcgc gcgaacgagc gagacagacg gagcaggaag cctatgacga 2220 gctggccaac ctccgacagg cgcactcaca gaatccgcag caccagcagg aggaggacag 2280 gtatactgcc gagggattct acgaggacga ctcgtctgaa gaggaggaga gactattgga 2340 cgagattaca cgcgactttg ccattgagga ctttaccatg gaaaacccga atggcacaca 2400 ggtgtcagct aggcagcagg atgcatggaa cgaggacgag acgaggccgg atttcatctc 2460 gggcgtccga tccttttctg ccctgtcgca gaggccaccc attcctcagg cctacgccgc 2520 caacgcctcg cagccagcag ccccccctcc gacatccgca ttgccagacc tgccaccagg 2580 acgccctggt caaaatccaa agcaactcaa gatcgagacg gcaaacattg tacaaaccca 2640 gaagtcggtc tatgacgacg acgaaatctc cccaagcacg caagagccgc cgcccgagac 2700 gctcgtccgg acggcgagcg cgcagcctgt aaggccaccg ataccgacag aaagcttccc 2760 atccgaactc agtgctcccg catcgccaac cgccaagaag aggcttctgg aaggagagaa 2820 tgtgctgaat gcctcgcctt ctatccacag gctacggaag aacttttcgt cttctagctt 2880 gaggagcatg aagaacagga acatgtccgt ctcacatttg gacgacagct cggatgcttc 2940 ccccggcacc cccctgaatg accccttcaa caaggcacct gccgtgcccg tgcccgcgct 3000 gccgaccccc ttgctcgcgt cgttcaaaga tcatatggag gcagcggccg gtgttggctt 3060 ccacctgttt gacgacgagt ttcatgcagc ggcggctgcc ggcccccaaa gcccgcagag 3120 tcccagaagt cccgttgttg tctccatgga cgtccctgtg cctctggaac cctgtccaaa 3180 cgacttcatg ctgcgaccgt tttggctgat gcgatgccta taccagacac ttgtgcatcc 3240 caagggtggc tacatcagta cgaagctatt cgtgccgcga gacgtctggc gggtcaaagg 3300 tgtcaagatc aagaacgtgg aggacaaaat tgccaactgc gactttttga ctgcagccct 3360 gctgaagctg tccaaagtgg acactctgga tgcggatgcc gtgctggagg agatgcaagc 3420 cctcgagggc attctggagc agatacagcc ggtcctggcc cgaaagcttg gaaacgaagt 3480 gggcgttcaa ggttccggtc tgctgttcaa agacgcctcg atgatggaag gagaccccgg 3540 ttcagccgtg ccgcgatcag gaagtgtgtc tggcaaggcg tctgcgtttt cctggcgacg 3600 gcttcggcca aagacgtcgg gcgtcgggct gggagggtcg tacagcagcc gcaacgccag 3660 tgctgagacg aaggaggcct caacgctggc aacggtgccc atgacgccga aaccgacaag 3720 ccgttcggcc aagcgagacg tgagccaggt tcagttcatc gggcccaatg cgagctacat 3780 gggctctctc gcgcgcttgt ttgacgctgc gcaggcagtt ggtaagcata ttgcgatacg 3840 cataccggtt acagtgacgg caagctaacg atgatgcaga tcaaattgca aggcaggtcg 3900 acgaccccgg tttgcggctt gcggacaaga ctcaggtcgg cttggagctc tgcacccggc 3960 acgccgctga gttctttggc ttttacattt gccgattcgt cttggccgac ctcggcctgt 4020 tgctggacaa gttcctcaaa cgaggaagcg aatgggtcat gacatga 4067 <210> 2 <211> 1308 <212> PRT <213> Hypocrea jecorina <400> 2 Met Gln Gln Pro Pro Ser Leu Val Gly Asp Arg Ser Ile Thr Gly Leu 1 5 10 15 Gly Asp Ala Ala Ser Arg Pro Asn Leu Ser Ser Ser Ser Pro Thr Val 20 25 30 Thr Ser Ala Pro Ser Ala Pro Thr Ser Pro Pro Pro Arg Pro Pro Ile 35 40 45 Ser Leu Asn Pro Pro Ser Arg Glu Pro Pro Gly Val Glu Pro Val Leu 50 55 60 Arg Ile Thr Pro Val Pro Arg Ser Val Phe Ala Ser Val His Gln Pro 65 70 75 80 Arg Lys Ser Ser Leu Val Gln Thr Ser His Val Leu Pro Ser Pro Arg 85 90 95 Thr Ala Ala Ala Ala His His His His Pro Val Ser His Ser Ala Ser 100 105 110 Gly Ser Ser Gly Ser Asn Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser 115 120 125 Gly Asn Leu Leu Arg Gln Thr His Arg Asp Thr Val His Pro Pro Val 130 135 140 Lys Arg Pro Ser Thr Pro Ser Ser His Pro Thr Arg Gly Ala Ser Thr 145 150 155 160 Gly Ala Ser Pro Gln Gln Gly Ala Ser Ser Arg Asn Arg Ser Ser Thr 165 170 175 Ser Pro Val Ser Ser Pro Ala Ser Arg Thr Pro Pro Tyr Ala Ser Arg 180 185 190 Gln Ala Ser Val Ser His Ser Arg Gln Gln His Asn His His His Gln 195 200 205 His Gln His Gln His Tyr His Ser His Thr Ser Ser Thr Thr Ser Arg 210 215 220 Ala Ser Ile Glu Ala Val Val Gly Ala Val Pro Asp Pro Ser Gly His 225 230 235 240 Arg Ala Pro Pro Lys Pro Arg Arg Pro Asp Arg Asn His Phe Gly Ala 245 250 255 Ser Asp Arg Ser Ala Thr Pro Thr Leu Ser His Phe Met Arg Ala Glu 260 265 270 Ser Ser Met Ser Met Arg His Tyr Glu Ser Gly Pro Leu Arg Ser Met 275 280 285 Ser Pro Asn Pro Tyr Gly Thr Pro Ala Ala Thr Thr Thr Ser Ser Thr 290 295 300 Ala Arg Met Pro His Glu Gln Ser His Asp Pro Tyr Ala Pro Arg Gly 305 310 315 320 His Ser Arg Asp His Ser Gly Lys Ser Ser Arg Asp Met Gly Lys Pro 325 330 335 Arg Ala Gln Lys Asn Pro Ser Gln Lys Ala Met Leu Ser Arg Ala Leu 340 345 350 Gln Lys Ala Asn Thr Ala Val Gln Leu Asp Asn Ala Gln Asn Phe Glu 355 360 365 Gly Ala Arg Glu Ala Tyr Ala Glu Ala Cys Asp Leu Leu Gln Gln Val 370 375 380 Leu Asp Arg Thr Pro Gly Asp Glu Asp Lys Arg Lys Leu Glu Ala Ile 385 390 395 400 His Gln Thr Tyr Thr Ser Arg Ile Asp Glu Leu Asp Gln Leu Gly Pro 405 410 415 Trp Gln Val Glu Thr Val Lys Ala Leu Pro Ala Arg Pro Glu Ser Glu 420 425 430 Glu Tyr Ser Ala Ser Ile Phe Ile Pro Gln Asp Tyr Asp Met Gly Asp 435 440 445 Glu Ala Pro Arg Ile Glu Thr Ala Arg Val Val Ser Tyr Ile Ala Gly 450 455 460 Asp Asn Ala Ser Pro Phe Ala Ala Ala Pro Asn Gln Trp Gln Gln Ser 465 470 475 480 Gly Gly His Thr Ala Ser Glu Arg Leu Gln Pro Asn Arg Gly Leu Glu 485 490 495 Pro Gly Leu Leu Gln Ser Ser Phe Ser Arg Ala Pro Arg Ser Pro Arg 500 505 510 Arg Leu Gln Ser Thr Asp Asp Leu Arg Ala Gln His Gln Glu Gly Gln 515 520 525 Tyr Ala Pro Pro Pro Leu Ser Pro Arg Ser Gln Ser Pro Val Lys Thr 530 535 540 His Asp His Asp Asp Asp Met Phe Ala Glu Leu Pro Pro His Glu Pro 545 550 555 560 Tyr Gln Tyr Gln Gln Glu His Asp His Gln Asp His His Gln Asp Tyr 565 570 575 His Gln His His Arg His His Asn His His His His Glu Arg Gln Pro 580 585 590 Ser Glu Thr Val Leu Ser Ser Tyr Glu Leu Gln Gly His Val Asp Gly 595 600 605 Gly Ile Gln Asn Ser Trp Leu Asp Pro Ile Asp Glu Ser Gly Gly Ser 610 615 620 Thr Ala Ser Ser Val His Ser Arg Thr Ser Ser Leu Gly Tyr Arg Arg 625 630 635 640 Arg His Ile Arg Ala Val Ser Gly Asn Thr Glu Ala Glu Phe Asp Thr 645 650 655 Ala Leu Asp Ala Ala Ile Glu Ala Ala Tyr Asp Asp Gly Tyr Glu Pro 660 665 670 Met Asp Ser Val Asp Tyr Gly Thr Ile Asp Ala Gly Gly Asp Asn Ser 675 680 685 Met Ala Gly Val Leu His Lys Val Glu Met Ala Arg Glu Arg Ala Arg 690 695 700 Gln Thr Glu Gln Glu Ala Tyr Asp Glu Leu Ala Asn Leu Arg Gln Ala 705 710 715 720 His Ser Gln Asn Pro Gln His Gln Gln Glu Glu Asp Arg Tyr Thr Ala 725 730 735 Glu Gly Phe Tyr Glu Asp Asp Ser Ser Glu Glu Glu Glu Arg Leu Leu 740 745 750 Asp Glu Ile Thr Arg Asp Phe Ala Ile Glu Asp Phe Thr Met Glu Asn 755 760 765 Pro Asn Gly Thr Gln Val Ser Ala Arg Gln Gln Asp Ala Trp Asn Glu 770 775 780 Asp Glu Thr Arg Pro Asp Phe Ile Ser Gly Val Arg Ser Phe Ser Ala 785 790 795 800 Leu Ser Gln Arg Pro Pro Ile Pro Gln Ala Tyr Ala Ala Asn Ala Ser 805 810 815 Gln Pro Ala Ala Pro Pro Pro Thr Ser Ala Leu Pro Asp Leu Pro Pro 820 825 830 Gly Arg Pro Gly Gln Asn Pro Lys Gln Leu Lys Ile Glu Thr Ala Asn 835 840 845 Ile Val Gln Thr Gln Lys Ser Val Tyr Asp Asp Asp Glu Ile Ser Pro 850 855 860 Ser Thr Gln Glu Pro Pro Pro Glu Thr Leu Val Arg Thr Ala Ser Ala 865 870 875 880 Gln Pro Val Arg Pro Pro Ile Pro Thr Glu Ser Phe Pro Ser Glu Leu 885 890 895 Ser Ala Pro Ala Ser Pro Thr Ala Lys Lys Arg Leu Leu Glu Gly Glu 900 905 910 Asn Val Leu Asn Ala Ser Pro Ser Ile His Arg Leu Arg Lys Asn Phe 915 920 925 Ser Ser Ser Ser Leu Arg Ser Met Lys Asn Arg Asn Met Ser Val Ser 930 935 940 His Leu Asp Asp Ser Ser Asp Ala Ser Pro Gly Thr Pro Leu Asn Asp 945 950 955 960 Pro Phe Asn Lys Ala Pro Ala Val Pro Val Pro Ala Leu Pro Thr Pro 965 970 975 Leu Leu Ala Ser Phe Lys Asp His Met Glu Ala Ala Ala Gly Val Gly 980 985 990 Phe His Leu Phe Asp Asp Glu Phe His Ala Ala Ala Ala Ala Gly Pro 995 1000 1005 Gln Ser Pro Gln Ser Pro Arg Ser Pro Val Val Val Ser Met Asp Val 1010 1015 1020 Pro Val Pro Leu Glu Pro Cys Pro Asn Asp Phe Met Leu Arg Pro Phe 1025 1030 1035 1040 Trp Leu Met Arg Cys Leu Tyr Gln Thr Leu Val His Pro Lys Gly Gly 1045 1050 1055 Tyr Ile Ser Thr Lys Leu Phe Val Pro Arg Asp Val Trp Arg Val Lys 1060 1065 1070 Gly Val Lys Ile Lys Asn Val Glu Asp Lys Ile Ala Asn Cys Asp Phe 1075 1080 1085 Leu Thr Ala Ala Leu Leu Lys Leu Ser Lys Val Asp Thr Leu Asp Ala 1090 1095 1100 Asp Ala Val Leu Glu Glu Met Gln Ala Leu Glu Gly Ile Leu Glu Gln 1105 1110 1115 1120 Ile Gln Pro Val Leu Ala Arg Lys Leu Gly Asn Glu Val Gly Val Gln 1125 1130 1135 Gly Ser Gly Leu Leu Phe Lys Asp Ala Ser Met Met Glu Gly Asp Pro 1140 1145 1150 Gly Ser Ala Val Pro Arg Ser Gly Ser Val Ser Gly Lys Ala Ser Ala 1155 1160 1165 Phe Ser Trp Arg Arg Leu Arg Pro Lys Thr Ser Gly Val Gly Leu Gly 1170 1175 1180 Gly Ser Tyr Ser Ser Arg Asn Ala Ser Ala Glu Thr Lys Glu Ala Ser 1185 1190 1195 1200 Thr Leu Ala Thr Val Pro Met Thr Pro Lys Pro Thr Ser Arg Ser Ala 1205 1210 1215 Lys Arg Asp Val Ser Gln Val Gln Phe Ile Gly Pro Asn Ala Ser Tyr 1220 1225 1230 Met Gly Ser Leu Ala Arg Leu Phe Asp Ala Ala Gln Ala Val Asp Gln 1235 1240 1245 Ile Ala Arg Gln Val Asp Asp Pro Gly Leu Arg Leu Ala Asp Lys Thr 1250 1255 1260 Gln Val Gly Leu Glu Leu Cys Thr Arg His Ala Ala Glu Phe Phe Gly 1265 1270 1275 1280 Phe Tyr Ile Cys Arg Phe Val Leu Ala Asp Leu Gly Leu Leu Leu Asp 1285 1290 1295 Lys Phe Leu Lys Arg Gly Ser Glu Trp Val Met Thr 1300 1305 <210> 3 <211> 2731 <212> DNA <213> Hypocrea jecorina <400> 3 atgcagcaac cgccctcctt agttggcgac cgcagcatca ccggcctggg agacgcagcc 60 agccgaccaa atctctcttc atcctcgcct accgtcacca gcgcgccctc ggcaccgaca 120 tcgccaccgc cgcggccgcc aatatcgctg aatcccccgt cgcgagagcc tcctggcgtc 180 gagcccgtgc tccgcatcac gccagtcccg cgctccgtct ttgcctctgt ccaccagccg 240 cgcaagtcgt cgctggtcca gacgtcgcac gtcctgccct cgcccaggac cgccgccgca 300 gctcaccatc accatcccgt ctcgcattcc gcctctggca gcagcggcag caacggcagt 360 ggaagcggca gtggcagcgg cagcggcaat ctgctgcgtc aaacgcatcg cgacaccgtg 420 cacccccccg tcaagcggcc atccaccccg tcgtcgcatc ccaccagggg cgccagcacc 480 ggagcatcgc cgcagcaggg cgccagctcc cgaaaccgct cgtcgacgtc gcccgtttcg 540 tccccggcga gtcgcacgcc tccttatgca tctcgtcagg cctcagtttc ccattcccgc 600 cagcagcaca accaccatca tcagcaccaa caccagcatt accactccca caccagctcg 660 actaccagtc gcgccagcat cgaggccgta gtcggtgccg tccccgatcc ctcaggtcac 720 cgagcgccgc cgaaaccccg tcgaccggat cgcaaccact ttggcgcgtc agatcgcagc 780 gcaactccca ccctgtcgca cttcatgagg gcagagtcga gcatgtccat gagacattac 840 gagagcggcc ccttacgctc catgtcgccg aacccctacg gaacccctgc cgccaccacg 900 acgtcgtcca ctgccagaat gccgcacgag cagagccacg atccctacgc ccctcgcggc 960 cactctcgcg atcactcggg gaagagcagc agagacatgg gcaagccccg agctcagaag 1020 aatccctcac agaaggcgat gctctcccgt gccctgcaaa aggccaacac cgcagttcag 1080 ctcgacaatg ctcagaactt cgaaggcgct cgagaagcgt acgccgaggc ttgcgacttg 1140 ttgcagcagg tgcttgaccg aacaccggga gatgaggaca agcggaagct cgaagccatt 1200 gtaagtcacg gcggcaaccg gaatgtcgag cccgttgtct gtcattagta gatcacttgg 1260 aactgacaat ttcaatctgt agcaccaaac ttacaccagc cgcatcgatg agctggatca 1320 gttgggccct tggcaggttg agaccgtcaa ggctctgccg gcgcggccag agagcgagga 1380 gtacagcgcg tccatattca taccccagga ttacgacatg ggcgatgaag ctcccaggat 1440 tgagacggca cgggtggtga gctacatcgc tggagacaac gcgtctccct ttgcagcagc 1500 gcccaaccag tggcagcagt cgggaggtca cacggcatct gaacggctgc agcccaaccg 1560 cggtctggaa ccgggtctgc tacagtcgtc cttctctcgg gccccgaggt cgcccaggcg 1620 gctgcagtcc accgatgatc ttcgcgcaca gcatcaggag ggccagtatg cgcctccccc 1680 actctcgcct cgctcgcagt cgccggtaaa gacgcatgac catgacgacg acatgtttgc 1740 cgaactgcca ccacacgagc cctatcagta ccagcaagag cacgaccatc aagaccacca 1800 tcaagactac catcaacatc accgccatca caaccaccac catcacgaac gacagcccag 1860 cgagactgtc ctatcctcat acgagctcca gggtcatgtg gatggaggaa tccaaaactc 1920 atggctagat ccaattgacg agtcgggagg ctcaacagcg tcgtctgtac actcacgcac 1980 ctcttcgctt ggctaccgtc gacgccatat ccgggccgtg agcgggaaca ccgaggccga 2040 gtttgacacg gcgctggacg ctgctatcga ggctgcctac gacgacggct acgagcccat 2100 ggactctgta gactatggga ccattgatgc tggggggaca atagcatggc aggcgtattg 2160 cacaaggtgg agatggcgcg cgaacgagcg agacagacgg agcaggaagc ctatgacgag 2220 ctggccaacc tccgacaggc gcactcacag aatccgcagc accagcagga ggaggacagg 2280 tatactgccg agggattcta cgaggacgac tcgtctgaag aggaggagag actattggac 2340 gagattacac gcgactttgc cattgaggac tttaccatgg aaaacccgaa tggcacacag 2400 gtgtcagcta ggcagcagga tgcatggaac gaggacgaga cgaggccgga tttcatctcg 2460 ggcgtccgat ccttttctgc cctgtcgcag aggccaccca ttcctcaggc ctacgccgcc 2520 aacgcctcgc agccagcagc cccccctccg acatccgcat tgccagacct gccaccagga 2580 cgccctggtc aaaatccaaa gcaactcaag atcgagacgg caaacattgt acaaacccag 2640 aagtcggtct atgacgacga cgaaatctcc ccaagcacgc aagagccgcc gcccgagacg 2700 ctcgtccgga cggcgagcgc gcagcctgta a 2731 <210> 4 <211> 882 <212> PRT <213> Hypocrea jecorina <400> 4 Met Gln Gln Pro Pro Ser Leu Val Gly Asp Arg Ser Ile Thr Gly Leu 1 5 10 15 Gly Asp Ala Ala Ser Arg Pro Asn Leu Ser Ser Ser Ser Pro Thr Val 20 25 30 Thr Ser Ala Pro Ser Ala Pro Thr Ser Pro Pro Pro Arg Pro Pro Ile 35 40 45 Ser Leu Asn Pro Pro Ser Arg Glu Pro Pro Gly Val Glu Pro Val Leu 50 55 60 Arg Ile Thr Pro Val Pro Arg Ser Val Phe Ala Ser Val His Gln Pro 65 70 75 80 Arg Lys Ser Ser Leu Val Gln Thr Ser His Val Leu Pro Ser Pro Arg 85 90 95 Thr Ala Ala Ala Ala His His His His Pro Val Ser His Ser Ala Ser 100 105 110 Gly Ser Ser Gly Ser Asn Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser 115 120 125 Gly Asn Leu Leu Arg Gln Thr His Arg Asp Thr Val His Pro Pro Val 130 135 140 Lys Arg Pro Ser Thr Pro Ser Ser His Pro Thr Arg Gly Ala Ser Thr 145 150 155 160 Gly Ala Ser Pro Gln Gln Gly Ala Ser Ser Arg Asn Arg Ser Ser Thr 165 170 175 Ser Pro Val Ser Ser Pro Ala Ser Arg Thr Pro Pro Tyr Ala Ser Arg 180 185 190 Gln Ala Ser Val Ser His Ser Arg Gln Gln His Asn His His His Gln 195 200 205 His Gln His Gln His Tyr His Ser His Thr Ser Ser Thr Thr Ser Arg 210 215 220 Ala Ser Ile Glu Ala Val Val Gly Ala Val Pro Asp Pro Ser Gly His 225 230 235 240 Arg Ala Pro Pro Lys Pro Arg Arg Pro Asp Arg Asn His Phe Gly Ala 245 250 255 Ser Asp Arg Ser Ala Thr Pro Thr Leu Ser His Phe Met Arg Ala Glu 260 265 270 Ser Ser Met Ser Met Arg His Tyr Glu Ser Gly Pro Leu Arg Ser Met 275 280 285 Ser Pro Asn Pro Tyr Gly Thr Pro Ala Ala Thr Thr Thr Ser Ser Thr 290 295 300 Ala Arg Met Pro His Glu Gln Ser His Asp Pro Tyr Ala Pro Arg Gly 305 310 315 320 His Ser Arg Asp His Ser Gly Lys Ser Ser Arg Asp Met Gly Lys Pro 325 330 335 Arg Ala Gln Lys Asn Pro Ser Gln Lys Ala Met Leu Ser Arg Ala Leu 340 345 350 Gln Lys Ala Asn Thr Ala Val Gln Leu Asp Asn Ala Gln Asn Phe Glu 355 360 365 Gly Ala Arg Glu Ala Tyr Ala Glu Ala Cys Asp Leu Leu Gln Gln Val 370 375 380 Leu Asp Arg Thr Pro Gly Asp Glu Asp Lys Arg Lys Leu Glu Ala Ile 385 390 395 400 His Gln Thr Tyr Thr Ser Arg Ile Asp Glu Leu Asp Gln Leu Gly Pro 405 410 415 Trp Gln Val Glu Thr Val Lys Ala Leu Pro Ala Arg Pro Glu Ser Glu 420 425 430 Glu Tyr Ser Ala Ser Ile Phe Ile Pro Gln Asp Tyr Asp Met Gly Asp 435 440 445 Glu Ala Pro Arg Ile Glu Thr Ala Arg Val Val Ser Tyr Ile Ala Gly 450 455 460 Asp Asn Ala Ser Pro Phe Ala Ala Ala Pro Asn Gln Trp Gln Gln Ser 465 470 475 480 Gly Gly His Thr Ala Ser Glu Arg Leu Gln Pro Asn Arg Gly Leu Glu 485 490 495 Pro Gly Leu Leu Gln Ser Ser Phe Ser Arg Ala Pro Arg Ser Pro Arg 500 505 510 Arg Leu Gln Ser Thr Asp Asp Leu Arg Ala Gln His Gln Glu Gly Gln 515 520 525 Tyr Ala Pro Pro Pro Leu Ser Pro Arg Ser Gln Ser Pro Val Lys Thr 530 535 540 His Asp His Asp Asp Asp Met Phe Ala Glu Leu Pro Pro His Glu Pro 545 550 555 560 Tyr Gln Tyr Gln Gln Glu His Asp His Gln Asp His His Gln Asp Tyr 565 570 575 His Gln His His Arg His His Asn His His His His Glu Arg Gln Pro 580 585 590 Ser Glu Thr Val Leu Ser Ser Tyr Glu Leu Gln Gly His Val Asp Gly 595 600 605 Gly Ile Gln Asn Ser Trp Leu Asp Pro Ile Asp Glu Ser Gly Gly Ser 610 615 620 Thr Ala Ser Ser Val His Ser Arg Thr Ser Ser Leu Gly Tyr Arg Arg 625 630 635 640 Arg His Ile Arg Ala Val Ser Gly Asn Thr Glu Ala Glu Phe Asp Thr 645 650 655 Ala Leu Asp Ala Ala Ile Glu Ala Ala Tyr Asp Asp Gly Tyr Glu Pro 660 665 670 Met Asp Ser Val Asp Tyr Gly Thr Ile Asp Ala Gly Gly Thr Ile Ala 675 680 685 Trp Gln Ala Tyr Cys Thr Arg Trp Arg Trp Arg Ala Asn Glu Arg Asp 690 695 700 Arg Arg Ser Arg Lys Pro Met Thr Ser Trp Pro Thr Ser Asp Arg Arg 705 710 715 720 Thr His Arg Ile Arg Ser Thr Ser Arg Arg Arg Thr Gly Ile Leu Pro 725 730 735 Arg Asp Ser Thr Arg Thr Thr Arg Leu Lys Arg Arg Arg Asp Tyr Trp 740 745 750 Thr Arg Leu His Ala Thr Leu Pro Leu Arg Thr Leu Pro Trp Lys Thr 755 760 765 Arg Met Ala His Arg Cys Gln Leu Gly Ser Arg Met His Gly Thr Arg 770 775 780 Thr Arg Arg Gly Arg Ile Ser Ser Arg Ala Ser Asp Pro Phe Leu Pro 785 790 795 800 Cys Arg Arg Gly His Pro Phe Leu Arg Pro Thr Pro Pro Thr Pro Arg 805 810 815 Ser Gln Gln Pro Pro Leu Arg His Pro His Cys Gln Thr Cys His Gln 820 825 830 Asp Ala Leu Val Lys Ile Gln Ser Asn Ser Arg Ser Arg Arg Gln Thr 835 840 845 Leu Tyr Lys Pro Arg Ser Arg Ser Met Thr Thr Thr Lys Ser Pro Gln 850 855 860 Ala Arg Lys Ser Arg Arg Pro Arg Arg Ser Ser Gly Arg Arg Ala Arg 865 870 875 880 Ser Leu <210> 5 <211> 1158 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 5 ctagtgcatg cgcaaattta aagcgctgat gaggtcgccc aggcggctgc agtccaccga 60 tgatcttcgc gcacagcatc aggagggcca gtatgcgcct cccccactct cgcctcgctc 120 gcagtcgccg gtaaagacgc atgaccatga cgacgacatg tttgccgaac tgccaccaca 180 cgagccctat cagtaccagc aagagcacga ccatcaagac caccatcaag actaccatca 240 acatcaccgc catcacaacc accaccatca cgaacgacag cccagcgaga ctgtcctatc 300 ctcatacgag ctccagggtc atgtggatgg aggaatccaa aactcatggc tagatccaat 360 tgacgagtcg ggaggctcaa cagcgtcgtc tgtacactca cgcacctctt cgcttggcta 420 ccgtcgacgc catatccggg ccgtgagcgg gaacaccgag gccgagtttg acacggcgct 480 ggacgctgct atcgaggctg cctacgacga cggctacgag cccatggact ctgtagacta 540 tgggaccatt gatgctgggg ggacaatagc atggcaggcg tattgcacaa ggtcgagatg 600 gcgcgcgaac gagcgagaca gaccgagcag gaagcctatg acgagctggc caacctccga 660 caggcgcact cacagaatcc gcagcaccag caggaggagg acaggtatac tgccgaggga 720 ttctacgagg acgactcgtc tgaagaggag gagagactat tggacgagat tacacgcgac 780 tttgccattg aggactttac catggaaaac ccgaatggca cacaggtgtc agctaggcag 840 caggatgcat ggaacgagga cgagacgagg ccggatttca tctcgggcgt ccgatccttt 900 tctgccctgt cgcagaggcc acccattcct caggcctacg ccgccaacgc ctcgcagcca 960 gcagcccccc ctccgacatc cgcattgcca gacctgccac caggacgccc tggtcaaaat 1020 ccaaagcaac tcaagatcga gacggcaaac attgtacaaa cccagaagtc ggtctatgac 1080 gacgacgaaa tctccccaag cacgcaagag ccgccgcccg agacgctcat cgatcgcgcg 1140 cagatccata tatagggc 1158 <210> 6 <211> 408 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 6 gaccggccgc tagtctcccg ttatctcact agtggcccac gtggccaatt cctaaagaaa 60 cagcatgaaa tggtattatg taagagctat agtctaaagg cactctgctg gataaaaata 120 gtggctataa gtctgctgca aaactacccc caacctcgta ggtatataag tactgtttga 180 tggtagtcta tcggcaggcg tattgcacaa gggttttaga gctagagttc gtttcggctt 240 ttcctcggaa cccccagagg tcatcagttc gaatcgctaa cagaatagca agttaaaata 300 aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt ttttttctct 360 taagcttggc actggccgtc gttttacaac gtcgtgactg ggaaaacc 408 <210> 7 <211> 408 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 7 gaccggccgc tagtctcccg ttatctcact agtggcccac gtggccaatt cctaaagaaa 60 cagcatgaaa tggtattatg taagagctat agtctaaagg cactctgctg gataaaaata 120 gtggctataa gtctgctgca aaactacccc caacctcgta ggtatataag tactgtttga 180 tggtagtcta tcgcgcgaac gagcgagaca gagttttaga gctagagttc gtttcggctt 240 ttcctcggaa cccccagagg tcatcagttc gaatcgctaa cagaatagca agttaaaata 300 aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtggtgctt ttttttctct 360 taagcttggc actggccgtc gttttacaac gtcgtgactg ggaaaacc 408 <210> 8 <211> 1310 <212> PRT <213> Fusarium sp. <400> 8 Met His Asp Gly Gln Ile Ser Ser Ser Pro Arg Gln Phe Leu Asn His 1 5 10 15 Asn His Asn His His His Asn Gln Arg Pro Ser Ala Ser Pro Ser Ser 20 25 30 Ala Val Thr Ala Thr Val Pro Pro Pro Trp Ala Leu Pro Ala Tyr Ala 35 40 45 Ser Ser Ala Ser Val Ser Thr Asp Ser Arg Pro Ala Thr Ala Thr Gly 50 55 60 Arg Ser His Tyr Tyr Pro His Arg Asp Pro Ser Arg Ser Ala Leu Ser 65 70 75 80 Pro Ser Ala Ser Pro Ser Leu Asn Thr His Pro His His Lys Gly Pro 85 90 95 Gly Pro Arg Leu Pro Arg Thr Ser Ser Leu Leu Pro Pro Pro His Ile 100 105 110 Glu Pro Ser Pro Arg Ala Val Thr Phe Gln Arg Ser Asp Arg Leu Ser 115 120 125 Pro Thr Pro Thr Pro Thr Pro Gly Ser Ser Ser Asn Gly Asn Gly Asn 130 135 140 Gly Asn Gly Asn Gly Ile Pro His Asn Ala Ala Glu Ser Ser Trp Leu 145 150 155 160 Leu Asn Arg Leu Ser Ser Ser Thr Val Ser Thr Asn Phe Ser Arg Val 165 170 175 Ser Ala Leu Pro Pro Arg Ala Asn His Thr Ser Ser Arg Leu Gly Lys 180 185 190 Ser Pro Ser Ile Asp Ala Thr Thr Phe Ile Asp Asn Ser Pro Pro Pro 195 200 205 Ser Lys Pro Ser Pro Arg Lys Leu Gln Lys Asn His Arg Pro Ser Thr 210 215 220 Ser Val Ser Asn Pro Asp Thr Phe Ile Phe Arg Pro Ser Glu Asp Arg 225 230 235 240 Thr Gln Leu Pro Gln Ser Leu Pro Leu Ile Val Thr Leu Ser Pro Leu 245 250 255 Glu Ala Pro Ala Ala Leu Ser Asp Ile Leu Asn Val Lys Ser Glu Gly 260 265 270 Ala Gly Pro Gly Ser Gly Thr Ser Glu Pro Gly Gln Ser Thr Gly Ala 275 280 285 Arg Gln Gly Gly Gln Ser Leu Lys Gln Phe Asp Asn Ser Asp Ser Pro 290 295 300 Ala Arg Ser Val Thr Ser Thr Pro Gly Ser Ala Arg Ser Met Ala Ala 305 310 315 320 Tyr Arg Pro Asn Met Gln Tyr Asp Gln Asp Gln Glu Ala Tyr Pro Pro 325 330 335 Gln Arg Gly His Ser Arg Ser Arg Ser Gly Lys Gly Ser Asn Asp Lys 340 345 350 Gly Arg Ala Lys Pro Pro Ser Gln Lys Ala Met Leu His Arg Ala Leu 355 360 365 Gln Lys Ala Asn Thr Ala Val Gln Leu Asp Asn Ala Gln Asn Phe Lys 370 375 380 Gly Ala Arg Glu Ala Tyr Ala Glu Ala Cys Asp Leu Leu Gln Gln Val 385 390 395 400 Leu Gln Lys Thr Thr Ala Asp Glu Asp Lys Arg Lys Leu Glu Ala Ile 405 410 415 Arg Arg Thr Tyr Thr Ser Arg Ile Asp Glu Leu Asp Gln Met Ala Pro 420 425 430 Trp Gln Glu Glu Glu Thr Lys Ala Leu Pro Ala Arg Pro Glu Ser Leu 435 440 445 Ala Gln His Ser Glu Ser Glu Ser Val Leu Arg Leu Asp Asp Asp Asp 450 455 460 Asp Asp Glu Pro Asn Asp Thr Ala Val Phe Asp Thr Ala Thr Ala Ala 465 470 475 480 Arg Ile Asp Gly His Ser Pro Gln Pro Arg Ile Val Asn Ser Pro Pro 485 490 495 Arg Asp Asp Ser Gln Gly Tyr Arg Arg Arg Ser Ala Gln Asn Lys Pro 500 505 510 Lys Pro Ile Val Thr Ser Leu Thr Pro Glu Pro Gly Leu Leu Gln Ser 515 520 525 Ser Phe Ser Arg Ser Pro Val Arg Leu Arg Thr Pro Glu His Phe Leu 530 535 540 Pro Gln Arg Pro Ala Asp Pro Tyr Met Pro Ala Pro Leu Ser Pro Arg 545 550 555 560 Arg Pro Leu Ser Pro Ala Lys Glu Val Asp Asp Met Asp Glu Pro Val 565 570 575 Arg Thr Asp Phe Ser Met Ser His Asp Gln Gln Asn Asp His Ala Gln 580 585 590 Glu His Asn Val Pro Gln Thr His Phe Arg Glu Asp Ser Met Asn Ser 595 600 605 Trp Leu Asp Pro Ile Asp Glu Ser Gly Gly Ser Thr Ala Ser Ser Val 610 615 620 His Ser Arg Thr Ser Ser Leu Gly Phe Arg Arg Lys His Ile Arg Ser 625 630 635 640 Val Ser Gly Glu Thr Glu Ala Glu Phe Asp Thr Ala Leu Asp Ala Ala 645 650 655 Ile Glu Ala Ala Tyr Asp Asp Gly Tyr Glu Pro Met Ser Pro Ile Asp 660 665 670 Gln Arg Arg Thr Val Ser Val Asp Ala Gly Glu Glu Val Ile Ala Asn 675 680 685 Ala Met Arg Lys Val Glu Leu Ala Arg Gln Lys Val Arg Glu Thr Glu 690 695 700 Gln Glu Leu Tyr Glu Met Glu Arg Asp Asn Arg Ser Gln Pro Gln Tyr 705 710 715 720 Gln Ser Tyr Glu Tyr Gln Gly Thr Pro Asn Asp Phe Tyr Asn Asp Asn 725 730 735 Ser Ser Asp Glu Glu Glu Arg Ile Leu Asp Glu Ile Ala Arg Asp Tyr 740 745 750 Gly Leu Glu Ser Tyr Arg His Arg Pro Pro Pro Pro Arg Glu Ser Asp 755 760 765 Ser Ser Gly Val Thr Ser Arg Thr Trp His Ser Ser Gln Gly Ser Asn 770 775 780 Pro Pro Thr Gly Ala Thr Ser Leu Ser Thr Val Thr Glu Leu Pro Pro 785 790 795 800 Pro Leu Thr His Leu Thr His Gly Pro Ala Ala Pro Pro Pro Thr Gln 805 810 815 Ser Leu Pro Glu Leu Pro Gln Arg Pro Gly Ser Ser Ala Gln Ser Val 820 825 830 Arg Asn Arg Arg Leu Ser Gly Gln Asn Pro Lys Gln Leu Lys Ile Glu 835 840 845 Thr Ser Lys Leu Ala Leu Pro Met Gln Ser Tyr Ala Asp Ala Asn Gln 850 855 860 Ala Lys Ser Ala Pro Leu Ser Ser Gln Asn Val Asp Ala Thr Val Glu 865 870 875 880 Pro Asp Thr Lys Ala Ala Ser Ala Lys His Arg Gln Pro Ser Pro Pro 885 890 895 Leu Phe Glu Ala Ser Pro Thr Asp Met Thr Gly Ser Arg Pro Thr Pro 900 905 910 Ser Pro Phe Gly Gln Leu Gly Ser Glu Lys Gly Asp Asp Asp Ile Thr 915 920 925 Gly Ser Pro Asn Thr Arg Lys Leu Arg Lys Asn Phe Ser Ser Ser Ser 930 935 940 Leu Arg Ser Met Lys Ser Arg Asn Met Ser Leu Thr His Leu Glu Glu 945 950 955 960 Gly Ser Asp Leu Ser Pro Gly Thr Pro Gly Ser Asn Pro Phe Gly Ser 965 970 975 Leu Asn Ala Pro Ser Val Pro Ala Leu Pro Thr Pro Leu Ala Thr Ser 980 985 990 Phe Arg Asp Arg Ser Glu Thr Asn Ala Ala Gly Leu Ser Leu Phe Asp 995 1000 1005 Asp His Phe Tyr Ser Pro Thr Ser Pro Gly Ser Pro Asn Pro Leu Ile 1010 1015 1020 Ser Asp Pro Pro Ala Pro Leu Glu Pro Cys Pro Thr Asp Phe Met Leu 1025 1030 1035 1040 Arg Pro Phe Trp Leu Met Arg Cys Leu Tyr Gln Thr Leu Ala His Pro 1045 1050 1055 Arg Gly Gly Tyr Ile Ser Ser Lys Leu Phe Val Ser Arg Asp Val Trp 1060 1065 1070 Arg Val Lys Gly Val Lys Leu Lys Asn Ile Glu Asp Lys Val Ala Asn 1075 1080 1085 Cys Asp Phe Leu Thr Ala Ala Leu Leu Lys Ile Ala Arg Val Asp Thr 1090 1095 1100 Tyr Asp Ala Asp Ala Val Leu Glu Glu Met Gln Ser Leu Glu Gly Ile 1105 1110 1115 1120 Leu Glu Gln Val Gln Thr Ala Leu Ser Arg Lys Leu Gly Asn Glu Val 1125 1130 1135 Gly Val His Gly Ser Gly Ala Leu Phe Lys Asp Ala Ser Thr Gly Asp 1140 1145 1150 Gly Asp Ala Ala Thr Gly Met Pro Arg Ser Ala Ser Val Ser Gly Lys 1155 1160 1165 Ser Ser Phe Ser Trp Arg Arg Leu Arg Ser Lys Asn Ser Ala Val Gly 1170 1175 1180 Leu Gly Gly Ser Tyr Met Ser Arg Ile Asn Thr Glu Thr Ser Lys Glu 1185 1190 1195 1200 Ile Pro Ser Ile Ala Ser Leu Pro Met Thr Pro Thr Pro Thr Asn Arg 1205 1210 1215 Pro Pro Lys Arg Asp Leu Ala Gln Val Gln Phe Thr Gly Pro Asn Ala 1220 1225 1230 Met Tyr Met Ser Ser Leu Ala Arg Leu Phe Asp Ala Ala Gln Ala Ile 1235 1240 1245 Asp Gln Ile Ala Arg Gln Val Glu Asp Pro Gly Leu Arg His Ala Asp 1250 1255 1260 Lys Thr Gln Val Gly Leu Glu Leu Cys Thr Arg His Ala Ala Glu Phe 1265 1270 1275 1280 Phe Gly Phe Tyr Val Cys Arg Phe Val Leu Ser Asp Leu Gly Leu Leu 1285 1290 1295 Leu Asp Lys Tyr Leu Lys Arg Gly Ser Glu Trp Val Leu Thr 1300 1305 1310 <210> 9 <211> 1370 <212> PRT <213> Neurospora sp. <400> 9 Met Pro Leu Pro His Phe Thr Ile Ala Pro Pro Pro Pro Ala Pro Pro 1 5 10 15 Ala Pro Ala Thr Ser Thr Ser Thr Ser Ser Lys Ile Pro Thr Ser Ser 20 25 30 Asn Asn Pro Gly Ser Ser Ala Ser Ala Thr Asp Leu Ser Ser Ala Arg 35 40 45 Thr Pro Pro Ala Thr Val Thr Thr Phe Ala Gly Ser Ala Ser Tyr Ala 50 55 60 Ser Ser Pro Ser Pro Arg Thr Arg Leu Pro Asp Arg Asp Phe Ile Ser 65 70 75 80 Pro Gly Leu Arg Asn Pro Tyr Pro Gln Gly Gln Gln Arg Pro Ser Arg 85 90 95 Pro Pro Pro Pro Pro Pro Arg Gln Arg Gln Gln Gln Gln Gln Gln Pro 100 105 110 Gln Gln His Ser Glu Arg Phe Gly Thr Val Thr Val Pro Thr Ala Ala 115 120 125 Glu His Asn Gln Ser Thr Phe Ser Pro Phe Pro Pro Asp Arg Leu Pro 130 135 140 Pro Lys Val Pro Thr Asp Ser Arg Pro Ser Gln Asp Leu Leu Glu Ser 145 150 155 160 Phe Asn Glu Pro Leu Leu His Gly Pro Ala Thr Pro Asp Ser Thr Lys 165 170 175 Gly Leu Lys Pro Pro Ser His Lys Arg Gly His Ser Arg Ser Gly Ser 180 185 190 Ser Ser Ser Ile Gly Asp Arg Leu Arg Asn Phe Asn Arg Trp Ser Val 195 200 205 Ser Ser Ala Ser Ser Lys Gly Ser Asn Gly Gly Gly Ser Ser Trp Arg 210 215 220 Ile Gly Trp Asp Ser Gly Lys Glu Arg Glu Asp Ser Pro Gly Gln Lys 225 230 235 240 Ser His Lys Arg Arg Pro Ser Thr Ser Glu Ile Ser Pro Arg Ser Val 245 250 255 Ser His Leu Arg Gly Arg Ser Asp Ser Pro Leu Arg His Pro Ile Pro 260 265 270 Pro Leu Pro Ser Leu Pro Arg Ile Ser Thr Gly Pro Ser Leu Val Glu 275 280 285 Ala Phe Arg His Gln Ala Ser Glu Ile Gly Lys Gln Ser Pro Ala Pro 290 295 300 Pro Arg Arg Tyr Tyr Leu Arg Pro Pro Pro Asp Asp Asn Ala Ala Phe 305 310 315 320 Trp Asp Gly Ala Pro Gln Ile Pro Glu Asp Thr Pro Gly Ser Leu Pro 325 330 335 Arg Ser His Gln Ala Ala Gly Leu Leu Leu Pro Pro Ala Glu Leu Ala 340 345 350 Pro Asp His Met Met Pro Gln Tyr Thr Gln Asn Gly Asp Pro Arg Gly 355 360 365 Gln Ser Arg Gly Arg Ser His Gly Ala Lys Ser Ser Thr Asp Ser Thr 370 375 380 Ala Ser Thr Arg Asn Arg Asp Arg Gln Arg His Arg Ser Asp Lys Lys 385 390 395 400 Ala Met Leu Ser Glu Ala Leu Ser Lys Ala Asn Thr Ala Val Gln Leu 405 410 415 Asp Asn Gly Gln Asp Phe Glu Ala Ala Arg Arg Ala Tyr Thr Glu Ala 420 425 430 Cys His Leu Leu Gln Glu Val Leu Gln Arg Thr Ser Val Glu Val Asp 435 440 445 Arg Arg Lys Leu Glu Ala Ile His Gln Thr Tyr Val Gly Arg Ile Asp 450 455 460 Glu Leu Asp Glu Met Leu Gly Asp Ser Leu Asp Glu Lys Ala Leu Pro 465 470 475 480 Glu Glu Pro Glu Ser Tyr Asp Glu Arg Gly Tyr Met Arg Thr Gln Ala 485 490 495 Tyr Asn Gly Glu Val Ser Asp Asp Glu Pro Met Leu Ser Thr Tyr Thr 500 505 510 Arg Glu Arg Ser Arg Thr Arg Glu Pro Ser Leu Ser Val Gln Thr Gln 515 520 525 Phe Arg Arg Gln Pro Pro Ser Gly Arg Pro Pro Ala Pro Pro Thr Leu 530 535 540 Thr Leu Gln Thr Pro Gly Gly Ser Asn Gly Pro Thr Ser Tyr Leu Ser 545 550 555 560 Glu Gln Tyr Ser Leu Gln Ser Ser Phe Ser Lys Ala Arg Phe Glu Lys 565 570 575 Ala Pro Met Asp Asn Ala Tyr Met Pro Pro Pro Leu Leu Pro Arg Arg 580 585 590 Pro Leu Ser Pro Ala Gln Pro Pro Pro Pro Pro Pro Ala Pro Glu Lys 595 600 605 Asp Ala Pro Arg Gln Gln Val Phe Arg Pro Asp Tyr Ser Met Ser Gly 610 615 620 Ala Gln Ala Thr Ser Arg Asn Tyr Lys Thr Asn Gly Gly His Gln Arg 625 630 635 640 Asp Pro Ser His Glu Ser Ile Ser Trp Leu Asp Pro Ile Glu Glu Ser 645 650 655 Gly Gly Ser Ser Ala Ser Ser Val His Ser Arg Ser Ser Ser Thr Gly 660 665 670 Ile Arg Arg Lys His Ile Arg Ala Ala Ser Gly Asp Thr Glu Ala Glu 675 680 685 Phe Asp Ala Ala Leu Asp Asp Ala Ile Glu Ala Ala Tyr Asp Glu Gly 690 695 700 Phe Glu Pro Glu Asp Gln Tyr Tyr Thr Asp Gly His Asp Ala Val Thr 705 710 715 720 Gly Ser Ser Tyr Pro Arg Asp Gln Val Pro Asp Glu Gly Met Asp Ala 725 730 735 Leu Glu Leu Ala Asn Glu Arg Glu Arg Lys Leu Arg Leu Gln Gln His 740 745 750 Leu Glu Asp Glu Glu Tyr Arg Lys Arg Gly Trp Thr Gly His Asp Asp 755 760 765 Phe Tyr Asp Glu Gly His Asp Ser Glu Glu Glu Glu Arg Phe Leu Glu 770 775 780 Glu Met Thr Lys Gly Tyr Gln Ile Glu Asp Phe Ala Phe Gly Pro Asn 785 790 795 800 Asn Lys Gln Ser Ile Pro Arg Glu Ser Asp Ser Ser Gly Val Thr Asn 805 810 815 Arg Thr Trp Asn Ser Ser Thr Gly Ser Asn Gln Asn Thr Ser Thr Thr 820 825 830 Leu Leu Ser Thr Val Ser Glu Ser Pro Thr His Pro Glu Pro Lys Gly 835 840 845 Pro Leu Pro Pro Leu Pro Pro Pro Pro Ala Gly Ala Leu Pro Gln Leu 850 855 860 Pro Asp Arg Pro Pro Gly Thr Ser Gly Ser Gly Ala Ser Asn Arg Ser 865 870 875 880 Val Arg Gln Arg Arg Leu Ser Gly Gln Asn Leu Lys Gln Leu Lys Ile 885 890 895 Glu Thr Thr Lys Leu Ala Gln Pro Gly Pro Thr Thr Ala Gly Pro Ala 900 905 910 Phe Pro Pro Gln Pro Ala Arg Ser His Asn Tyr Ile Ala Gln Gln Arg 915 920 925 Gln Ala Leu Ser Ala Gly Pro His Arg Asn Ala Asn Pro Leu Ala Ala 930 935 940 Arg Arg Val Val Ser Pro Ser Met Gly Glu Gly Gly Ala Pro Pro Leu 945 950 955 960 Pro Ala His Leu Gln Asp Asp Tyr Pro Pro Arg Ala Gly Ser Pro Ser 965 970 975 Val Gly Arg Pro Ser Leu Lys Lys Thr Phe Ser Ser Ser Ser Leu Arg 980 985 990 Ser Ala His Arg Lys Leu Ser Val Ser His Asn Asp Asp Val Phe Asp 995 1000 1005 Met Ser Pro Gly Thr Pro Val Ser Asn Gln Phe Gly Ile Ser Gly Ser 1010 1015 1020 Thr Thr Arg Leu Pro Ser Ile Pro Ser Met Pro Thr Pro Ile Ala Gly 1025 1030 1035 1040 Ser Phe Arg Glu Arg Ala Asp Thr Val Val Gly Thr Ala Gly Met Tyr 1045 1050 1055 Leu Phe Asp Ala Glu Phe His Ser Ala Asn Asp Pro Gly Ser Pro Asn 1060 1065 1070 Gly Thr Leu Thr Asp Ala Pro Ala Pro Leu Glu Pro Cys Pro Ser Asp 1075 1080 1085 Val Leu Leu Arg Pro Phe Trp Leu Met Arg Cys Leu Tyr Gln Thr Leu 1090 1095 1100 Cys His Pro Arg Gly Gly Tyr Ile Ser Asn Lys Leu Phe Val Pro Arg 1105 1110 1115 1120 Asp Val Trp Arg Val Lys Gly Val Lys Leu Lys Tyr Val Glu Glu Lys 1125 1130 1135 Ile Ser Gln Cys Asp Leu Met Thr Ala Ala Leu Gln Lys Leu Ala Arg 1140 1145 1150 Val Asp Thr Cys Asp Ala Asp Ala Val Leu Glu Glu Met Gln Ala Leu 1155 1160 1165 Glu Thr Val Ile Glu Ser Val Glu Lys Phe Leu Val Lys Lys Leu Gly 1170 1175 1180 Ala Ser Glu Val Gly Pro His Ala Thr Ser Phe Lys Asp Pro Val His 1185 1190 1195 1200 Ala Glu Asp Gly Ser Leu Pro Arg Ser Ala Ser Val Ser Ala Lys Thr 1205 1210 1215 Ser Ala Phe Ser Trp Arg Arg Leu Arg Ser Lys Asn Ser Ser Ala Asn 1220 1225 1230 Leu Thr Ser Ala Gly Lys Gly Ser Ser Ser Ala Gly Gly Thr Ser Gly 1235 1240 1245 Asn Val Ala Ser Thr Pro Ile Glu Gly Ala Gly Lys Asp Ile Ile Cys 1250 1255 1260 Pro Ser Leu Pro Met Thr Thr His Pro Thr Asn Arg Pro Met Lys Arg 1265 1270 1275 1280 Asp Val Gly Asn Val Leu Phe Gln Gly Pro Asn Ala Asn Tyr Met Ser 1285 1290 1295 Ser Leu Ala Arg Leu Phe Asp Ala Ala Gln Leu Val Asp Gln Ile Ala 1300 1305 1310 Arg Gln Val Glu Asp Pro Gly Leu Arg His Ala Asp Lys Thr Gln Val 1315 1320 1325 Gly Leu Glu Leu Ser Thr Arg His Ala Ala Glu Phe Phe Ala Leu Tyr 1330 1335 1340 Ile Cys Arg Phe Val Leu Ser Asp Leu Thr Leu Met Leu Asp Lys Phe 1345 1350 1355 1360 Leu Lys Arg Gly Ser Glu Trp Val Leu Val 1365 1370 <210> 10 <211> 805 <212> PRT <213> Myceliophthora sp. <400> 10 Met Asp Asn Ala Tyr Met Pro Pro Pro Leu Ser Pro Arg Arg Pro Gly 1 5 10 15 Ser Pro Ala Arg Pro Ser Ser Pro Pro Val Glu Tyr Glu Ser Pro Arg 20 25 30 Arg Pro Pro Pro Asp Arg Pro Asn Ala Gln Thr Glu Ala Pro Ala Ser 35 40 45 Ser Ser Gly His Gln Arg Ala Asn Ser His Glu Ser Val Ser Trp Leu 50 55 60 Asp Pro Ile Asp Glu Ser Asp Arg Ser Ser Val Thr Ser Val His Ser 65 70 75 80 Arg Ser Ser Ser Arg Val Val Arg Lys His Ile Arg Ala Pro Ser Gly 85 90 95 Ala Thr Glu Ala Glu Phe Asp Ala Ala Leu Asp Asp Ala Ile Glu Ala 100 105 110 Ala Tyr Asp Asp Gly Tyr Glu Pro Glu Ser His Tyr Pro Gly His Ser 115 120 125 Tyr His Asp Ala Gln Val Asp Pro Ile Ala Asp Lys Leu Arg Arg Val 130 135 140 Glu Met Ala Arg Glu Leu Val Arg Glu Ser Glu Arg Glu Ala Leu Glu 145 150 155 160 Leu Ala Thr Glu Arg Glu Gln Arg Leu Arg Leu Gln Gln Gln Leu Glu 165 170 175 Asp Glu Glu Tyr Arg Lys Arg Val Thr Ala Gly Glu Asp Phe Tyr Asp 180 185 190 Gly Asn Asp Ser Glu Glu Glu Glu Arg Leu Leu Glu Glu Ala Pro Arg 195 200 205 Thr Asp Gly Met Asp Asp Phe Ala Phe Gly Val Gln Gln Arg Pro Pro 210 215 220 Val Pro Arg Glu Ser Asp Ser Ser Gly Met Thr Gly Arg Thr Trp His 225 230 235 240 Ser Ser Met Gly Ser Asn Pro Ala Thr Gly Ala Thr Leu Thr Pro Val 245 250 255 Ser Glu Asp Gly Thr His Pro His Arg Ser Gly Pro Leu Pro Pro Leu 260 265 270 Pro Pro Gln Ala Ala Ala Gln Val Pro Pro Gln Pro Gly Ser Ala Gly 275 280 285 Ser Gln Ser Ser Gly Gln Ser Val Arg Asn Trp Arg Leu Ser Gly Gln 290 295 300 Asn Pro Lys Gly Leu Lys Ile Glu Thr Asn Lys Leu Ala Ala Thr Ala 305 310 315 320 Ala Pro Ala Thr Ala Gly Pro Thr Phe Pro Ser Gln Pro Lys Thr Gly 325 330 335 Ser Tyr Ile Val Gln Gln Arg Gln Ala Leu Ser Ala Gly Pro Asn Arg 340 345 350 Ala Leu Gly Pro Pro Thr Ser Arg Pro Gly Pro Ser Pro Val Pro Gly 355 360 365 Thr Leu Asp Glu Glu Pro Glu Asp Ala Pro Pro Arg Pro Thr Ala Leu 370 375 380 Ser His Asp Glu Tyr Pro Arg Val Gly Thr Pro Ser Val Val Arg Ala 385 390 395 400 Pro Asn Leu Arg Lys Asn Tyr Ser Ser Ser Ser Leu Lys Ser Leu Lys 405 410 415 Thr Arg Asn Leu Ser Ile Ser His Leu Asp Glu Gly Met Ser Asp His 420 425 430 Ser Pro Gly Thr Pro Leu Ser Ser Gln Phe Gly Ala Arg Leu Pro Ala 435 440 445 Val Pro Ser Leu Pro Ala Gly Ile Leu Ser Asn His Leu Lys Asp Arg 450 455 460 Ala Asn Ser Thr Thr Pro Gly Gly Leu His Leu Phe Glu Asn Asp Phe 465 470 475 480 His Ser Ser Glu Arg Pro Gly Ser Pro Asp Pro Leu Thr Ala Asp Ala 485 490 495 Pro Ala Pro Leu Glu Pro Cys Pro Thr Asp Val Met Leu Arg Pro Phe 500 505 510 Trp Leu Met Arg Ala Leu Tyr Gln Thr Leu Cys His Pro Arg Gly Gly 515 520 525 Tyr Leu Ser Asn Arg Leu Phe Val Pro Arg Asp Val Trp Arg Val Lys 530 535 540 Gly Val Lys Leu Lys Ala Val Glu Asp Lys Ile Ala Asn Cys Asp Leu 545 550 555 560 Leu Thr Ala Ala Leu Gln Lys Leu Ala Arg Val Asp Thr Cys Asp Ala 565 570 575 Asp Ala Val Leu Glu Glu Met Gln Ala Leu Glu Gly Val Leu Glu His 580 585 590 Val Gln Ala Thr Leu Ser Arg Lys Leu Gly Ser Glu Val Gly Val Gln 595 600 605 Gly Ala Ser Ser Met Phe Lys Asp Ala Ala Ala Ala Ala Ala Ala Ala 610 615 620 Ala Ala Gly Asp Ala Ala Ala Ala Gly Gly Asp Ala Ala Ala Met Pro 625 630 635 640 Arg Ser Ala Ser Val Ala Gly Lys Ala Ser Ser Phe Ser Trp Arg Arg 645 650 655 Leu Arg Ser Lys Asn Ser Ser Ala Asn Leu Pro Ala Leu Ala Ala Ser 660 665 670 Gly Tyr Gly Asn Lys Gly Gly Asn Gly Ala Ala Ala Ser Thr Thr Asn 675 680 685 Leu Ser Glu Gly Leu Gly Lys Asp Ala Thr Leu Ala Ser Leu Pro Met 690 695 700 Thr Thr His Pro Thr Ser Arg Pro Thr Lys Arg Asp Ile Asn Ser Val 705 710 715 720 Ser Phe Thr Gly Pro Asn Ala Asn Tyr Met Ser Ser Leu Ala Arg Leu 725 730 735 Phe Asp Ala Ala Gln Thr Val Asp Gln Ile Ala Arg Gln Val Glu Asp 740 745 750 Pro Gly Leu Arg His Ala Asp Lys Thr Gln Val Gly Leu Glu Leu Cys 755 760 765 Ala Arg His Ala Ala Glu Phe Phe Ala Phe Tyr Ile Cys Arg Phe Ala 770 775 780 Leu Ser Asp Leu Thr Leu Leu Met Asp Lys Phe Val Lys Arg Gly Ser 785 790 795 800 Glu Trp Val Leu Ala 805 <210> 11 <211> 1004 <212> PRT <213> Talaroymyces sp. <400> 11 Met Glu Asp Pro Val Asn Ile Ser Ser Ser Tyr Ser Gly Glu His Ser 1 5 10 15 Ala Arg His Asp His Glu Arg Thr Glu Ser Gly Ser Thr Ser Pro Gln 20 25 30 Arg Arg Arg Pro Arg Gly Ser Ser Gln Lys Ala Met Leu Ser Lys Ala 35 40 45 Leu Ala Lys Ala Asn Thr Ala Val Leu Leu Asp Asn Ala Glu Asn Phe 50 55 60 Glu Gly Ala Ile Glu Ala Tyr Gln Asp Ala Cys Glu Leu Leu Gln His 65 70 75 80 Val Met Leu Arg Ser Asn Gly Gly Asp Val Glu Lys Tyr Lys Leu Leu 85 90 95 Glu Ile Arg Lys Thr Tyr Leu Asn Arg Ile Gln Glu Leu Leu Arg Ile 100 105 110 Gln Leu Pro Ser Asn Leu Lys Lys Asp Lys Ala Leu Pro Glu Arg Pro 115 120 125 Pro Ser Gly Arg Ser Ala Thr Pro Gln Glu Asp Glu Pro Pro Ile Glu 130 135 140 Gln Asp Tyr Thr Asp Glu Asp Gly Ala Glu Glu Tyr Phe Ala Arg Gln 145 150 155 160 Asn Ala Glu Asp Asp Val Pro Pro Val Pro Ser Leu Asn Thr Val Arg 165 170 175 Leu Pro Ser Ile Ser Gly Gln Asp Leu Asn Phe Ser Phe Glu Ala Ser 180 185 190 Lys Thr Asp Ile Gly Gly Ala Asn Ser Arg Glu Ser Glu Ala Val Ala 195 200 205 Gln Gly His Ser Ser Pro Ser Pro Thr Leu Gln Phe Val Ser Asp Ser 210 215 220 Ala Asp His Gln Gly Asp Thr Glu Thr Arg Ser Ser Thr Ala His Ala 225 230 235 240 Ser His Ser Ser Asp Gly Gln Val Pro Val Asn Asp Asn Gln Ser Thr 245 250 255 Ser Trp Leu Asp Thr Ile Asp Glu Ser Gly Ala Ser Ser Pro Val Ser 260 265 270 Thr Asn Thr Lys Leu Ser Leu Tyr Leu Gly Gly Thr His Ser His His 275 280 285 Ala Ser Asn Gly Thr Glu Ala Glu Phe Asp Ala Ala Leu Asp Ala Ala 290 295 300 Val Glu Ala Ala Tyr Asp Glu Gly Leu Glu Pro Ala Leu Asn Glu Gln 305 310 315 320 Glu Gly Phe Tyr Asp Asp Asp Asp Asp Asp Tyr Glu Asp His Arg Asp 325 330 335 Asp Asp Tyr Asp His Asp Asp Val Val Ser Asn Ala Arg Arg Asn Ile 340 345 350 Glu Ile Ala Lys Gln Arg Val Arg Glu Ala Glu Arg Glu Ala Gln Ala 355 360 365 Val Met Ala Arg Gly Leu Gln Gln Arg Leu Met Met Gln Asp Glu Asn 370 375 380 Val Ala Val Ser Thr Tyr Asn Val Asp Ala Asp Tyr Ile Asp Glu Glu 385 390 395 400 Ala Glu Glu Glu Glu Arg Leu Leu Glu Glu Met Thr Lys Gly Tyr Val 405 410 415 Met Asp Asp Phe Glu Phe Asn Leu His Thr Lys Thr Ala Leu Pro Arg 420 425 430 Gln Ser Asp Ser Ser Thr Val Ser Gly Arg Thr Trp Gly Ser Ser Ile 435 440 445 Thr Ser Thr Ser Ala Asn Ser Ala Thr Ala Gly Thr Ser Leu Ser Thr 450 455 460 Leu Ala Glu Glu Gly Ile Leu Thr Asp Ala Thr Met Pro Ser Lys Arg 465 470 475 480 Leu Pro Pro Val Pro Lys Ile Pro Thr Gly Ser Thr Gln Gln Pro Ile 485 490 495 Pro Pro Asn Met Ser Pro Ser Ala Gly Val Arg Ala Arg Arg Phe Ser 500 505 510 Gly Ser Asn Thr Lys Gln Leu Lys Ile Asp Thr Lys Arg Val Ala Ala 515 520 525 Gly Tyr Glu Pro Thr Lys Lys Glu Pro Phe Ser Ala Gln Pro Ala Gly 530 535 540 Pro Pro Ser Pro Val Leu Leu Pro Glu Pro Lys Thr Ser Leu Pro Ile 545 550 555 560 Leu Thr Ser Ser Met Ser Lys Pro Leu Pro Thr Gly Pro Ser Glu Lys 565 570 575 Lys Gly Ser Phe Asp Val Ser Ala Leu Gly Gln Arg Ser Ser Ser Leu 580 585 590 Thr Arg Ile Pro Thr Leu Glu Gly Asp Ser Val Ala Arg Ser Ala Gln 595 600 605 Ser Ser Pro Pro Arg Thr Ile Ser Lys Ile Thr Ser Ala Pro Gly Met 610 615 620 Leu Arg Lys Asn Thr Ser Ser Ser Ser Leu Ala Gly Met Arg Ala Arg 625 630 635 640 Asn Met Ser Met Ser Thr Pro Asp Ile Asn Glu Ser Pro Asn Thr Pro 645 650 655 Ser Ser Ser Val Phe Pro Ala Phe Asp Phe Gln Arg Gln Leu Ala Asn 660 665 670 Gly Leu Val Pro Ala Met Pro Thr Pro Ser Gly Ala Ser Phe Pro Leu 675 680 685 Met Thr Ser Lys Ser Leu His Leu Phe Asp Asn Asp Ile His Ser Pro 690 695 700 Thr Thr Pro Gly Ser Pro Ser Ser Thr Val Thr Asn Ala Pro Ile Pro 705 710 715 720 Leu Glu Pro Cys Pro Glu Ser Phe Leu Leu Arg Pro Phe Trp Leu Met 725 730 735 Arg Cys Leu Tyr Gln Thr Ile Ala His Pro Arg Gly Gly Tyr Leu Ser 740 745 750 Thr Lys Leu Phe Ile Pro Arg Glu Val Trp His Val Lys Asn Val Arg 755 760 765 Ile Lys Ala Met Glu Asp Lys Ile Ser Leu Cys Asp Leu Leu Thr Ala 770 775 780 Ala Leu Leu Lys Val Ala Gln Val Asp Thr Tyr Asp Ala Asp Ala Val 785 790 795 800 Leu Glu Glu Met Gln Thr Phe Glu Asn Ile Leu Asp Gln Ala Gln Thr 805 810 815 Thr Phe Ala Lys Lys Leu Gly Asn Glu Val Gly Val Gln Gly Ala Leu 820 825 830 Pro Leu Phe Lys Asn Ala Asn Asn Ser Asp Glu Ser Pro Ile Ser Thr 835 840 845 Glu Asn Met Ala Ser Arg Ser Ser Ser Gln Ser Ser Arg Ser Val Leu 850 855 860 Thr Ser Trp Arg Lys Leu Arg Ser Lys Ser Ser Ala Ala Pro Ser Thr 865 870 875 880 Ser Thr Ala Pro Ser Thr Tyr Arg Asp Ser Gly Lys Gly Gly Leu Ser 885 890 895 Met Ser Thr Leu Pro Met Thr Ala Ser Pro Pro Ser Gly Arg Phe Thr 900 905 910 Lys Arg Asp Val Met Gln Leu Gln Leu Ser Gly Pro Asn Ala Asn Tyr 915 920 925 Met Gly Ala Leu Ala Arg Leu Phe Asp Ala Ala Gln Val Leu Asp Gln 930 935 940 Ile Ala Arg Gln Val Glu Asp Pro Gly Leu Lys His Ser Ser Pro Thr 945 950 955 960 His Val Gly Leu Glu Leu Ser Thr Arg His Ala Ala Glu Phe Phe Gly 965 970 975 Phe Tyr Ile Cys Arg Phe Ala Leu Asn Asp Val Gly Leu Leu Leu Asp 980 985 990 Lys Tyr Ile Lys Arg Gly Thr Glu Trp Val Leu Val 995 1000 <210> 12 <211> 1215 <212> PRT <213> Aspergillus sp. <400> 12 Met Ala His Asn Leu Thr Ser Glu Gly His Gly Arg Ser Ser Arg Pro 1 5 10 15 Met Ser Pro Glu Tyr Pro Phe Thr Ala Asp Thr Ala Ala Pro Arg Leu 20 25 30 Ser Arg Ala Asn Ser Trp Asn Arg Phe Lys Lys Lys Gly Ser Asp Ser 35 40 45 Thr Glu Leu Ala Ser Arg Phe Gly Ala Val Thr Pro Thr Arg Pro Glu 50 55 60 Leu Val Ser Glu Leu Ile Thr Gly Ser Pro Ser Thr Ser Pro Gly Asp 65 70 75 80 His Ile Gln Glu Gly Leu Gly Ser Leu Asn Arg Trp Ser Gln Ser Thr 85 90 95 Ser Ser Ser Lys Gly Ser Pro Lys Tyr Asp Ser Tyr His Lys Gly Ile 100 105 110 Pro Phe Lys Ala Ser Val Asp His Asp Tyr Thr Ser Pro Lys Ala Arg 115 120 125 Ala Ser Pro Glu Arg Asn Ala Ile Ser Gly Leu Ser Pro Leu Val Ala 130 135 140 Ala Pro Thr Asn Asn Glu Ser Pro Leu Gln Gly His His Ser Ser Asp 145 150 155 160 Ser Ile Ala Thr Gly His Tyr Met Arg Val Leu Glu Leu Gly Asp His 165 170 175 Ser Asn Phe Ser Ala Ser Ser Thr Asn Ala Val Asp Pro Ala Ser Ser 180 185 190 His Gln Asp His Leu Pro Leu Gly Ser Ser Ser Ile Ala Ala Ser Leu 195 200 205 Phe Gln Asn Pro Trp Ser Arg Ser Gly Ala Asp Ala Gln Ala Val Asn 210 215 220 Gln Asn Ser Gln Met Leu Thr Gly Arg Glu Gln His His Gly Lys Arg 225 230 235 240 Arg Arg Gly His Ser Gln Lys Ala Met Leu Ser Lys Ala Leu Gln Lys 245 250 255 Ala Asn Thr Ala Val Leu Leu Asp Asn Ala Ala Asn Phe Glu Gly Ala 260 265 270 Met Glu Ala Tyr Asn Asp Ala Cys Gln Leu Leu Gln Leu Val Met Leu 275 280 285 Arg Ser Ser Gly Gly Glu Asp Glu Lys Ser Lys Leu Gln Glu Ile Arg 290 295 300 Asp Thr Tyr Met Ile Arg Val Thr Glu Leu Gln Arg Met Asp Phe Ser 305 310 315 320 Phe Thr Glu Pro Asn Ser Lys Ala Leu Pro Glu Arg Pro Leu Ser Gln 325 330 335 Glu Ser Tyr Ser Glu Met Phe Gln Ser Ile Glu Glu Asp Glu Asn Glu 340 345 350 Pro Ser Leu Asn Glu Ser Val Asn Ser Leu Arg Arg Ser Ser Asp Asp 355 360 365 His Gln Pro Val Leu Asn Glu Ala Asn Val Leu Ala Ser Asp Arg Val 370 375 380 Pro Val Arg Arg Gln Ser Leu Leu Pro Ser Ala Ile Asp Asp Asp Leu 385 390 395 400 Cys Cys Leu Thr Leu Ser Thr Ser Thr Thr Lys Gln Asn Ser Leu Ser 405 410 415 Gln Thr Glu Ser Phe Thr Ala Ser Arg Asp Gly His Leu Glu Met Ala 420 425 430 Met His Ser Glu Ser Gly Gln Ala Ser Thr Ala Leu Ser Leu Asp Asp 435 440 445 Asp Ser Ala His His Leu Arg Tyr Asn Asp Trp Ala Leu Leu Ser Thr 450 455 460 His Ala Lys Asp Ala Tyr Glu Ser Thr Ser Trp Leu Asp Thr Ile Asp 465 470 475 480 Glu Ser Gly Ala Ser Ser Pro Ala Ser Thr Arg Ser Lys Val Ser Ser 485 490 495 Leu Tyr Leu Arg His Gly Gly Ser His His Leu Ser His Gly Thr Glu 500 505 510 Ala Glu Phe Asp Ala Ala Leu Asp Ala Ala Val Glu Ala Ala Tyr Asp 515 520 525 Glu Gly Phe Glu Pro Val Thr Glu Pro Asn Glu Gln Tyr Asn Gly Gly 530 535 540 Ile Asp Asn Asp Asp Asp Ile Val Ala Asn Ala Arg Arg Asn Ile Glu 545 550 555 560 Leu Ala Lys Gln Lys Val Arg Glu Ala Glu Arg Glu Ala Gln Val Ala 565 570 575 Met Ala Arg Gly Arg Glu Val Arg Asn Leu Gln Gln Pro Ser Ile Ile 580 585 590 Asp His Ser His Gly Val Gly Leu Asp Tyr Leu Asp Glu Glu Ala Glu 595 600 605 Glu Glu Glu Arg Leu Leu Glu Glu Met Thr Arg Gly Tyr Ile Met Asp 610 615 620 Asp Phe Asn Phe Asp Leu Gln Ser Lys Ser Ala Leu Pro Arg Gln Ser 625 630 635 640 Asp Ser Ser Ser Phe Ser Gly Arg Ala Trp Glu Ser Ser Ala Val Ser 645 650 655 Asn Thr Thr Thr Thr Gly Val Met Leu Ser Pro Leu Val Glu Ala Ser 660 665 670 Ala Leu Pro Glu Val Ser Ala Met Thr Lys Gln Val Ala Glu Pro Leu 675 680 685 Pro Thr Gln Ala Asn Gly Pro Ala Val Leu Pro Lys Gln Asn Pro Ala 690 695 700 Pro Thr Pro Gly Pro Ser Val Arg Ala Arg Arg Met Ser Gly Gln Arg 705 710 715 720 Thr Thr Glu Leu Lys Ile Glu Thr Lys Pro Arg Leu Gly Ala Asp Ser 725 730 735 Asp Ile Ser Ser Gln Gly Gln Ser Ser Glu Pro Ala Ala Leu Ser Pro 740 745 750 Pro Pro Pro Leu Pro Lys Asp Glu Pro Ser Met Asn Phe Pro Met Arg 755 760 765 Thr Ser Lys Thr Leu Ala Pro Thr Pro Val Leu Arg Ser Gly Val Arg 770 775 780 Leu Asn Lys Arg Asn Ala Ser Ile Gly Ser Phe Ser Glu Asp Thr Trp 785 790 795 800 Ala Asn Ala Ser Leu Asp Lys Pro Thr Thr Gln Glu Glu Asp Asn Asn 805 810 815 Leu Glu Ile Ser Arg Leu Pro Ser Leu Ala Arg Pro Ile Gly Lys Val 820 825 830 Pro Ser Ala Pro Asp Asn Leu Gly Lys Leu Asn Ser Gly Pro Lys Ser 835 840 845 Phe Arg Ala Arg Asn Val Ser Val Pro Gly Pro Asp Thr Leu Ile Asp 850 855 860 Ser Pro Asp Thr Pro Ser Ser Ala Phe Pro Pro Phe Asp Ile Gln Lys 865 870 875 880 Gly Thr Gly Ser Ala Ala Gly Pro Val Leu Pro Thr Pro Thr Gly Ala 885 890 895 Thr Phe Ala Pro Asn Gly Leu Pro Ser Gly Gly Leu Tyr Leu Phe Asp 900 905 910 Ser His Ile His Ser Pro Thr Asn Leu Gly Ser Pro Asn Ala Thr Ala 915 920 925 Thr Asn Ala Pro Ala Pro Leu Glu His Cys Pro Glu Ser Phe Leu Leu 930 935 940 Arg Pro Phe Trp Leu Met Arg Cys Ile Tyr Gln Thr Ile Ala His Pro 945 950 955 960 Ser Gly Gly Tyr Leu Thr Thr Lys Leu Phe Val Pro Arg Asp Val Trp 965 970 975 Arg Val Lys Asn Val Lys Ile Lys Ala Val Glu Glu Lys Val Ser Asn 980 985 990 Cys Asp Leu Leu Thr Ala Ala Leu Leu Lys Leu Ala Lys Val Asp Thr 995 1000 1005 Tyr Asp Ala Asp Ala Val Leu Glu Glu Met Gln Ser Phe Glu Thr Val 1010 1015 1020 Leu Asp Gln Val Gln Ser Ser Leu Ser Lys Lys Leu Gly Gly Glu Val 1025 1030 1035 1040 Gly Val Gln Gly Ala Met Ala Leu Phe Lys Ala Ser Gln Ser Ser Asp 1045 1050 1055 Asp Ala Ala Ala Val Asp Thr Leu Pro Ser Lys Thr Ser Gly Gly Ala 1060 1065 1070 Ser Lys Ser Tyr Leu Thr Ser Trp Arg Lys Leu Arg Ser Lys Asn Ser 1075 1080 1085 Gly Phe Gly Gly Thr Thr Ser Gln Ser Ser Val Lys Glu Thr Thr Lys 1090 1095 1100 Asp Asn Leu Ile Ile Asn Ser Leu Pro Met Ser Ser Thr Pro Asn Ser 1105 1110 1115 1120 Gln Pro Val Lys Arg Asn Thr Thr Gln Leu Gln Phe Asn Gly Pro Asn 1125 1130 1135 Ala Asn Tyr Met Ser Ala Leu Ala Arg Leu Cys Asp Ala Ala Gln Val 1140 1145 1150 Leu Asp Gln Ile Ala Gln Gln Val Glu Asp Pro Gly Leu Lys His Ser 1155 1160 1165 Ser Pro Thr Leu Val Gly Leu Glu Leu Ser Thr Arg His Ala Ala Glu 1170 1175 1180 Phe Phe Gly Phe Tyr Ile Cys Arg Phe Ala Leu Asn Asp Ile Ala Met 1185 1190 1195 1200 Met Val Asp Lys Phe Ile Lys Arg Gly Ser Glu Trp Val Leu Ile 1205 1210 1215 <210> 13 <211> 1098 <212> PRT <213> Penicillium sp. <400> 13 Met Leu Tyr Arg Ala Ala Val Glu Asp Glu Pro Arg Ser Phe His Pro 1 5 10 15 Arg Arg Pro Ser Gly Pro Leu Thr Glu Pro Pro Ser Gly Pro Leu Pro 20 25 30 His Arg Pro Ser Ser Arg Ile Ser Arg Ser Ala Ser Arg Asn Arg Leu 35 40 45 Ala His Pro Ala Gly Gly Gly Ala Arg Ile Ala Ser Thr Ser Pro Asp 50 55 60 Pro Leu Ala Asp Leu Thr Pro Ser Ser Pro Ile Lys Glu Gly Leu Gly 65 70 75 80 Asn Leu Asn Arg Cys Pro Ser Arg Thr Pro Ala Arg Ala Glu Leu Pro 85 90 95 Glu Val Ser Val Pro Glu Leu Arg Ala Ser Glu Met Phe Met Ala Asp 100 105 110 Ala Asn Ile Leu Tyr Ile Asp Pro Pro Phe Ala Ala Gly Asn His Asp 115 120 125 Ser Met Thr Leu Gly His Leu Pro Pro His Gln Glu Ser Ala Ser Thr 130 135 140 Tyr Pro Gly Glu Gly Gly Ile Phe Met Asp Gly Glu Gly Glu Ala Asp 145 150 155 160 Phe Arg Gln His Gly Ala Thr Gln Lys Ala Met Leu Ser Lys Ala Leu 165 170 175 Gln Lys Ala Asn Thr Ala Val Leu Leu Asp Asn Ala Ala Asn Phe Glu 180 185 190 Gly Ala Met Glu Ala Tyr Thr Asp Ala Cys Gln Leu Leu Gln Leu Val 195 200 205 Met Leu Arg Ser Asn Gly Gly Asp Glu Glu Arg Ile Lys Leu Gln Glu 210 215 220 Ile Arg Asp Thr Tyr Met Ala Arg Ile Thr Glu Leu Gln Arg Met Asp 225 230 235 240 Phe Ser Ile Met Glu Ser Asp Gly Lys Ala Leu Pro Glu Arg Pro Leu 245 250 255 Ser Gln Glu Ser Phe Gly Glu Leu Leu His Ala Val Ala Ser Val Gln 260 265 270 Asp Asp Pro Tyr Leu Asp Ser Gln His Ser Ala Ala His Ser Gly Leu 275 280 285 Arg Leu Gln Ala Ala Phe Asp Glu Ser Arg Pro Leu Pro Ser Glu Ala 290 295 300 Ile Pro Pro Arg Arg Gln Ser Leu Arg Pro Ser Ala Gln Ser Asp Arg 305 310 315 320 Thr Thr Pro Ala Gly Leu Gly Asn Asn Leu Ala Ala Tyr His His Gly 325 330 335 Ala Phe Leu Asp Pro Thr Pro Val Leu Asp Ser Asn Glu Thr Thr Ser 340 345 350 Trp Leu Asp Thr Ile Asp Glu Ser Gly Ala Ser Ser Pro Ser Ser Ala 355 360 365 Asn Ser Lys Ala Ser Ser Val Tyr Leu Arg Arg Arg Thr Ser Arg Arg 370 375 380 Leu Ser Thr Asp Thr Glu Ala Glu Phe Asp Ala Ala Leu Asp Ala Ala 385 390 395 400 Val Glu Ala Ala Tyr Asp Asp Gly Leu Glu Pro Val Glu Glu Tyr Gln 405 410 415 Asp Glu Glu Gly Asp Ser Val Val Ala Asn Ala Arg Arg Asn Ile Glu 420 425 430 Leu Ala Lys Gln Arg Val Arg Glu Ala Glu Leu Glu Ala Glu Ala Ala 435 440 445 Met Ser Arg Gly Arg Asp Leu Arg Pro Val Gln Glu Gln Tyr Leu Leu 450 455 460 Asp Asp Ala Gly Gly Gln Thr Leu Glu Tyr Leu Asp Glu Glu Ala Glu 465 470 475 480 Glu Glu Glu Arg Leu Leu Glu Glu Met Thr Lys Gly Tyr Val Met Asp 485 490 495 Glu Phe Glu Phe Gly Leu Gln Thr Lys Ser Ala Leu Pro Arg Glu Ser 500 505 510 Asp Ser Ser Asn Met Ser Gly His Thr Trp Glu Ser Ser Leu Ala Ser 515 520 525 Asn Ala Thr Gly Pro Gly Ser Leu Ala Leu Ser Thr Leu Ala Glu Asp 530 535 540 Asp Asp Ser Val Leu Pro Leu Asp Phe Leu Asp Gln Thr Leu Leu Pro 545 550 555 560 Thr Ala Pro Pro Thr Ala Ala Leu Pro Pro Ile Pro Val Ser Ser Asp 565 570 575 Phe Pro Ser Leu Pro Leu Pro Arg Ala Ser Val Ser Ser Pro Ala Pro 580 585 590 Pro Pro Pro Pro Met Gly Pro Pro Pro Ile Pro Gly Val Arg Ala Arg 595 600 605 Arg Leu Ser Gly Gln Ala Ser Thr Glu Leu Lys Ile Glu Thr Gly Ser 610 615 620 His Ala Arg Ser Ser Ser Thr Val Ser Asn Val Asp Pro Phe Met Ile 625 630 635 640 Pro Pro Thr Gln Pro Ala Pro Ala Ala Ser Lys Asp Glu Ala Ser Gln 645 650 655 Glu Pro Ser Arg Ser Ala Thr Pro Ser Phe Arg Ala Asn Leu His Pro 660 665 670 Thr Ser Arg Arg Asn Pro Ser Thr Gly Ser Phe Val Asp His Ile Asn 675 680 685 Leu Ile Lys Thr Arg Thr Gln Glu Asp Glu Glu Gly Gly Leu Pro Val 690 695 700 Leu Pro Ala Ala Ile Arg Pro Met Gly Lys Val Pro Ser Ala Pro Asp 705 710 715 720 Gly Leu Asp Lys Val Gly Ala Thr Thr Lys Ser Phe Arg Asn Arg Asn 725 730 735 Val Ser Val Pro Ile Pro Asp Thr Val Pro Val Ser Pro Thr Thr Pro 740 745 750 Trp Ser Gly Ser Phe Ser Ser Gln Glu Thr Gln Lys Ala Ser Gly Ile 755 760 765 Pro His Met Pro Val Leu Pro Thr Pro Thr Ala Pro Leu Phe Thr Gln 770 775 780 Asn Gly Leu Pro Thr Gly Gly Leu Asp Leu Phe Asp Cys Glu Ile His 785 790 795 800 Ser Pro Thr Ser Leu Gly Arg Pro Asn Met Leu Val His Asn Ala Pro 805 810 815 Leu Pro Leu Glu Pro Cys Pro Glu Ser Phe Leu Leu Arg Pro Phe Trp 820 825 830 Leu Met Arg Cys Leu Tyr Gln Thr Leu Ser His Pro Gln Gly Gly Tyr 835 840 845 Leu Ser Glu Lys Leu Phe Ile Pro Arg Asp Val Trp Arg Val Lys Asn 850 855 860 Val Lys Ile Lys Ala Leu Glu Asp Lys Ile Ser Asn Cys Asp Leu Leu 865 870 875 880 Thr Ala Ala Leu Leu Lys Leu Ala Gln Val Asp Met Phe Asp Ala Asp 885 890 895 Ala Val Leu Asp Glu Met Gln Ser Phe Glu Ser Ile Leu Asp Gln Ala 900 905 910 Gln Met Val Leu Ser Lys Lys Leu Gly Asn Glu Val Gly Val His Ala 915 920 925 Ala Ile Pro Gln Leu Arg Gln His Ala Ser Phe Asp Asp Ala Ala Gln 930 935 940 Phe Glu Thr Ser Val Val Lys Ser Ser Ser Thr Ser Asn Lys Ser Tyr 945 950 955 960 Arg Pro Thr Trp Lys Arg Leu Arg Ser Lys Thr Ser Gly Ile Thr Thr 965 970 975 Val Ser Ser Phe Ser Ser Val Arg Glu Thr Ser Lys Glu Gln Leu Thr 980 985 990 Met Thr Ser Val Pro Met Thr Thr Ala Pro Ser Asn Gln Ala Arg Arg 995 1000 1005 Ser Val Thr Ser Leu Asp Phe Ser Gly Pro Asn Ser His Tyr Met Gly 1010 1015 1020 Ala Leu Ala Arg Leu Phe Asp Ala Ala Gln Val Leu Asp Gln Val Ala 1025 1030 1035 1040 Gln Gln Val Glu Asp Pro Gly Leu Lys His Ser Ser Pro Thr His Val 1045 1050 1055 Gly Leu Glu Leu Ser Thr Arg His Ala Ala Glu Phe Phe Gly Phe Tyr 1060 1065 1070 Ile Cys Arg Phe Ala Leu Ala Asp Val Gly Leu Met Leu Asp Lys Phe 1075 1080 1085 Ile Lys Arg Gly Ser Glu Trp Val Leu Ile 1090 1095 <210> 14 <211> 364 <212> PRT <213> Hypocrea jecorina <400> 14 Met Lys Gly Leu Ile Leu Val Gly Gly Phe Gly Thr Arg Leu Arg Pro 1 5 10 15 Leu Thr Leu Thr Leu Pro Lys Pro Leu Val Glu Phe Cys Asn Lys Pro 20 25 30 Met Ile Val His Gln Ile Glu Ala Leu Val Ala Ala Gly Val Thr Asp 35 40 45 Ile Val Leu Ala Val Asn Tyr Arg Pro Glu Ile Met Glu Lys Phe Leu 50 55 60 Ala Glu Tyr Glu Glu Lys Tyr Asn Ile Asn Ile Glu Phe Ser Val Glu 65 70 75 80 Ser Glu Pro Leu Asp Thr Ala Gly Pro Leu Lys Leu Ala Glu Arg Ile 85 90 95 Leu Gly Lys Asp Asp Ser Pro Phe Phe Val Leu Asn Ser Asp Val Ile 100 105 110 Cys Asp Tyr Pro Phe Lys Glu Leu Leu Glu Phe His Lys Ala His Gly 115 120 125 Asp Glu Gly Thr Ile Val Val Thr Lys Val Glu Glu Pro Ser Lys Tyr 130 135 140 Gly Val Val Val His Lys Pro Asn His Pro Ser Arg Ile Asp Arg Phe 145 150 155 160 Val Glu Lys Pro Val Glu Phe Val Gly Asn Arg Ile Asn Ala Gly Met 165 170 175 Tyr Ile Phe Asn Pro Ser Val Leu Lys Arg Ile Glu Leu Arg Pro Thr 180 185 190 Ser Ile Glu Lys Glu Thr Phe Pro Ala Met Val Ala Asp Asn Gln Leu 195 200 205 His Ser Phe Asp Leu Glu Gly Phe Trp Met Asp Val Gly Gln Pro Lys 210 215 220 Asp Phe Leu Ser Gly Thr Cys Leu Tyr Leu Ser Ser Leu Thr Lys Lys 225 230 235 240 Gly Ser Lys Glu Leu Thr Pro Pro Thr Glu Pro Tyr Val His Gly Gly 245 250 255 Asn Val Met Ile His Pro Ser Ala Lys Ile Gly Lys Asn Cys Arg Ile 260 265 270 Gly Pro Asn Val Thr Ile Gly Pro Asp Val Val Val Gly Asp Gly Val 275 280 285 Arg Leu Gln Arg Cys Val Leu Leu Lys Gly Ser Lys Val Lys Asp His 290 295 300 Ala Trp Val Lys Ser Thr Ile Val Gly Trp Asn Ser Thr Val Gly Arg 305 310 315 320 Trp Ala Arg Leu Glu Asn Val Thr Val Leu Gly Asp Asp Val Thr Ile 325 330 335 Gly Asp Glu Ile Tyr Val Asn Gly Gly Ser Val Leu Pro His Lys Ser 340 345 350 Ile Lys Ala Asn Val Asp Val Pro Ala Ile Ile Met 355 360 <210> 15 <211> 1042 <212> PRT <213> Hypocrea jecorina <400> 15 Met Asp Tyr Thr Gln Tyr His Ala Leu Gly His Gly Glu Val Leu Asp 1 5 10 15 Pro Asn Asp Pro Asn Lys Thr Ser Ala Pro Ala Ala Pro Gln Phe Gln 20 25 30 Pro Pro Ser Ser Pro Tyr Val Pro Pro Gly Ser Pro Tyr Gly Ala Pro 35 40 45 Pro Tyr His Gly Gly His Gln Ala Pro Pro Met Ala Met Pro Pro Pro 50 55 60 Ser Thr Pro Gly Tyr Gly Pro Pro Gln Gly Gln Ser Phe Pro Gly Ser 65 70 75 80 Pro Met Pro Ser Gln Asp Ala Gly Leu Ala Ala Gln Phe Gly Gly Met 85 90 95 Ser Leu Gly Ala Asp Ala Gly Gly Ala Ala Ala Arg Lys Lys Lys Lys 100 105 110 Asp Arg His Ala Tyr His Ser Val Glu Pro Thr Gly Ser Ser Gln Ala 115 120 125 Phe Asn Gly Leu Pro Pro Gly Thr Pro Ala Glu Gln Phe Leu Asn Val 130 135 140 Asn Asn Pro Gln Gly Ile Pro Ala Leu Gly Gly Gln Phe Gly Ser Pro 145 150 155 160 Leu Ala Ser Pro Met Gly Thr Pro His Met Ala Asn Pro Gly Gln Phe 165 170 175 Pro Ala Pro Thr Ser Pro Phe Thr Pro Ser Ala Pro Val Ser Pro Ala 180 185 190 Glu Phe Ala Ser Arg Phe Gly Ser Pro Asp Ala Ala Thr Ser Ile Gly 195 200 205 Ser Ala Gly Pro Ser Gln Val Ser Pro Asp Asp Met Pro Ser Ile Pro 210 215 220 Ala Ser Arg Asp Ala Ile Gln Glu His Phe Phe Lys Asn Val Tyr Pro 225 230 235 240 Thr Phe Glu Arg His Val Pro Pro Pro Ala Thr Val Ser Phe Val Ala 245 250 255 Phe Asp Gln Gly Asn Ala Ser Pro Lys Phe Thr Arg Leu Thr Leu Asn 260 265 270 Asn Ile Pro Thr Thr Ala Glu Gly Leu His Ala Thr Gly Leu Pro Leu 275 280 285 Gly Met Leu Ile Gln Pro Leu Ala Pro Leu Gln Ala Gly Glu Ala Glu 290 295 300 Ile Pro Val Leu Asp Phe Gly Asp Ala Gly Pro Pro Arg Cys Arg Arg 305 310 315 320 Cys Arg Ala Tyr Ile Asn Pro Phe Met Met Phe Arg Ser Gly Gly Asn 325 330 335 Lys Phe Val Cys Asn Leu Cys Ser Tyr Pro Asn Glu Thr Pro Pro Glu 340 345 350 Tyr Phe Cys Ala Val Ser Pro Gln Gly Val Arg Leu Asp Arg Asp Gln 355 360 365 Arg Pro Glu Leu His Arg Gly Thr Val Glu Phe Val Val Pro Lys Glu 370 375 380 Tyr Trp Thr Arg Glu Pro Val Gly Leu Arg Trp Leu Phe Val Ile Asp 385 390 395 400 Val Thr Gln Glu Ser Tyr Asn Lys Gly Phe Met Glu Thr Phe Cys Glu 405 410 415 Gly Ile Leu Ala Ala Leu Tyr Gly Gly Asn Asp Glu Glu Asn Asp Glu 420 425 430 Asp Gly Glu Pro Lys Arg Arg Ile Pro Lys Gly Ala Lys Val Gly Phe 435 440 445 Ile Thr Tyr Asp Lys Asp Ile His Phe Tyr Asn Ile Asn Pro His Leu 450 455 460 Asp Gln Ala His Met Met Ile Met Pro Asp Leu Glu Asp Pro Phe Leu 465 470 475 480 Pro Leu Gly Glu Gly Leu Phe Val Asp Pro Tyr Glu Ser Lys Ala Ile 485 490 495 Ile Thr Ser Leu Leu Thr Arg Leu Pro Glu Met Phe Ser Thr Ile Lys 500 505 510 Asn Pro Glu Pro Ala Leu Leu Ala Thr Leu Asn Ala Ala Val Ala Ala 515 520 525 Leu Glu Ala Thr Gly Gly Lys Val Val Cys Ser Cys Ser Thr Leu Pro 530 535 540 Thr Trp Gly Pro Gly Arg Leu Phe Met Arg Asp Asp Gly Asn His Pro 545 550 555 560 Gly Gly Glu Leu Asp Lys Lys Leu Tyr Thr Thr Glu His Pro Ala Trp 565 570 575 Lys Lys Val Ser Glu Lys Met Ala Ser Ser Gly Ile Gly Val Asp Phe 580 585 590 Phe Leu Ala Ala Pro Ser Gly Gly Tyr Leu Asp Ile Ala Thr Ile Gly 595 600 605 His Val Ala Ala Thr Thr Gly Gly Glu Thr Phe Tyr Tyr Pro Asn Phe 610 615 620 Ile Ala Pro Arg Asp Gly Ala Arg Leu Ser Met Glu Ile Thr His Ala 625 630 635 640 Ile Thr Arg Glu Thr Gly Phe Gln Ala Leu Met Lys Val Arg Cys Ser 645 650 655 Thr Gly Leu Gln Val Ala Ala Tyr His Gly Asn Phe Val Gln His Thr 660 665 670 Phe Gly Ala Asp Leu Glu Ile Gly Val Ile Asp Ala Asp Lys Ala Leu 675 680 685 Gly Val Ser Phe Ser His Asp Gly Lys Leu Asp Pro Lys Leu Asp Ala 690 695 700 His Phe Gln Thr Ala Leu Leu Tyr Thr Thr Ala Ser Gly Gln Arg Arg 705 710 715 720 Val Arg Cys Ser Asn Val Ile Ala Ser Val Ser Asp Thr Ser Lys Glu 725 730 735 Ser Asn Thr Lys Glu Leu Ala Ile Arg Gln Cys Leu Lys Phe Val Asp 740 745 750 Gln Asp Ala Val Val Gly Ile Phe Ala Lys Glu Ala Ser Thr Lys Leu 755 760 765 Ala Thr Thr Ser Ala Asn Leu Gln Asp Val Arg Asn Trp Leu Thr Glu 770 775 780 Arg Thr Ile Asp Ile Met Ala Tyr Tyr Lys Lys His Ser Ala Asn Gln 785 790 795 800 Phe Pro Pro Ser Gln Leu Val Met Pro Glu Arg Leu Lys Glu Phe Cys 805 810 815 Met Tyr Met Leu Gly Met Leu Lys Cys Arg Ala Phe Lys Gly Gly Ile 820 825 830 Glu Asn Ser Asp Arg Arg Val His Glu Leu Arg Met Val Arg Ser Met 835 840 845 Gly Pro Leu Glu Leu Ser Leu Tyr Leu Tyr Pro Arg Met Ile Ala Leu 850 855 860 His Asn Leu Gln Pro Glu Glu Gly Phe Ala Asp Pro Glu Thr Gly His 865 870 875 880 Leu Lys Met Pro Pro Ser Val Arg Thr Ser Phe Ser Arg Val Glu Pro 885 890 895 Gly Gly Val Tyr Leu Val Asp Asn Gly Gln Gln Cys Leu Leu Trp Phe 900 905 910 His Ala Gln Thr Ser Pro Asn Leu Ile Thr Asp Leu Phe Gly Glu Gly 915 920 925 His Asp Ser Leu Lys Gly Leu Asp Pro Tyr Thr Ser Thr Leu Pro Val 930 935 940 Leu Glu Thr His Leu Ser Ala Gln Val Arg Asn Ile Ile Glu Phe Leu 945 950 955 960 Lys Ser Met Arg Gly Ser Lys Gly Met Thr Ile Gln Leu Ala Arg Gln 965 970 975 Gly Ile Asp Gly Ala Glu Tyr Glu Phe Ala Arg Met Leu Val Glu Asp 980 985 990 Arg Asn Asn Glu Ala Lys Ser Tyr Val Asp Trp Leu Val His Ile His 995 1000 1005 Arg Gly Val Gln Leu Glu Leu Ser Gly Gln Arg Lys Lys Glu Gly Asp 1010 1015 1020 Gly Glu Ala Thr Ala Val Met Ala Asn Phe Ala Gly Leu Arg Pro Ala 1025 1030 1035 1040 Tyr Trp <210> 16 <211> 534 <212> PRT <213> Hypocrea jecorina <400> 16 Met Asp Gly Met Met Ser Gln Pro Met Gly Gln Gln Ala Phe Tyr Phe 1 5 10 15 Tyr Asn His Glu His Lys Met Ser Pro Arg Gln Val Ile Phe Ala Gln 20 25 30 Gln Met Ala Ala Tyr Gln Met Met Pro Ser Leu Pro Pro Thr Pro Met 35 40 45 Tyr Ser Arg Pro Asn Ser Ser Cys Ser Gln Pro Pro Thr Leu Tyr Ser 50 55 60 Asn Gly Pro Ser Val Met Thr Pro Thr Ser Thr Pro Pro Leu Ser Ser 65 70 75 80 Arg Lys Pro Met Leu Val Asp Thr Glu Phe Gly Asp Asn Pro Tyr Phe 85 90 95 Pro Ser Thr Pro Pro Leu Ser Ala Ser Gly Ser Thr Val Gly Ser Pro 100 105 110 Lys Ala Cys Asp Met Leu Gln Thr Pro Met Asn Pro Met Phe Ser Gly 115 120 125 Leu Glu Gly Ile Ala Ile Lys Asp Ser Ile Asp Ala Thr Glu Ser Leu 130 135 140 Val Leu Asp Trp Ala Ser Ile Ala Ser Pro Pro Leu Ser Pro Val Tyr 145 150 155 160 Leu Gln Ser Gln Thr Ser Ser Gly Lys Val Pro Ser Leu Thr Ser Ser 165 170 175 Pro Ser Asp Met Leu Ser Thr Thr Ala Ser Cys Pro Ser Leu Ser Pro 180 185 190 Ser Pro Thr Pro Tyr Ala Arg Ser Val Thr Ser Glu His Asp Val Asp 195 200 205 Phe Cys Asp Pro Arg Asn Leu Thr Val Ser Val Gly Ser Asn Pro Thr 210 215 220 Leu Ala Pro Glu Phe Thr Leu Leu Ala Asp Asp Ile Lys Gly Glu Pro 225 230 235 240 Leu Pro Thr Ala Ala Gln Pro Ser Phe Asp Phe Asn Pro Ala Leu Pro 245 250 255 Ser Gly Leu Pro Thr Phe Glu Asp Phe Ser Asp Leu Glu Ser Glu Ala 260 265 270 Asp Phe Ser Ser Leu Val Asn Leu Gly Glu Ile Asn Pro Val Asp Ile 275 280 285 Ser Arg Pro Arg Ala Cys Thr Gly Ser Ser Val Val Ser Leu Gly His 290 295 300 Gly Ser Phe Ile Gly Asp Glu Asp Leu Ser Phe Asp Asp Glu Ala Phe 305 310 315 320 His Phe Pro Ser Leu Pro Ser Pro Thr Ser Ser Val Asp Phe Cys Asp 325 330 335 Val His Gln Asp Lys Arg Gln Lys Lys Asp Arg Lys Glu Ala Lys Pro 340 345 350 Val Met Asn Ser Ala Ala Gly Gly Ser Gln Ser Gly Asn Glu Gln Ala 355 360 365 Gly Ala Thr Glu Ala Ala Ser Ala Ala Ser Asp Ser Asn Ala Ser Ser 370 375 380 Ala Ser Asp Glu Pro Ser Ser Ser Met Pro Ala Pro Thr Asn Arg Arg 385 390 395 400 Gly Arg Lys Gln Ser Leu Thr Glu Asp Pro Ser Lys Thr Phe Val Cys 405 410 415 Asp Leu Cys Asn Arg Arg Phe Arg Arg Gln Glu His Leu Lys Arg His 420 425 430 Tyr Arg Ser Leu His Thr Gln Glu Lys Pro Phe Glu Cys Asn Glu Cys 435 440 445 Gly Lys Lys Phe Ser Arg Ser Asp Asn Leu Ala Gln His Ala Arg Thr 450 455 460 His Ser Gly Gly Ala Ile Val Met Asn Leu Ile Glu Glu Ser Ser Glu 465 470 475 480 Val Pro Ala Tyr Asp Gly Ser Met Met Ala Gly Pro Val Gly Asp Asp 485 490 495 Tyr Ser Thr Tyr Gly Lys Val Leu Phe Gln Ile Ala Ser Glu Ile Pro 500 505 510 Gly Ser Ala Ser Glu Leu Ser Ser Glu Glu Gly Glu Gln Gly Lys Lys 515 520 525 Lys Arg Lys Arg Ser Asp 530 <210> 17 <211> 668 <212> PRT <213> Hypocrea jecorina <400> 17 Arg Gly Arg Ser Pro Ser Ala Gly Gly Phe Gln Ser Asp Ile Asn Gln 1 5 10 15 Ser His Ser Pro Ala Arg Ser Pro Leu Ala Pro Thr Asn Glu Gln Pro 20 25 30 Ser Ala Gly Leu Gly Val Gly Leu Gly Gln Gln Gln Gln Arg Ala Phe 35 40 45 Ala Ala Pro Leu His Pro Asn Tyr Asp Ser Phe Gly Ala Asn Gly Phe 50 55 60 Leu Gly Ala Gln Ala Asn Ala Val Asp Pro Thr Asn Gly Phe Asp Pro 65 70 75 80 Ser Ala Ser Phe Gly Gln Gln Pro Ala Thr Gly Pro Asp Ser Thr Leu 85 90 95 Ser Leu Asn Ala Gln Ala Gln His Asn Tyr Leu Ser Pro Asn Leu His 100 105 110 Asp Gly Asp Phe Ser Leu Phe Pro Ser Ala Ala Glu Gln Gly Asp Gln 115 120 125 Tyr Asn Ala Pro Leu Phe Glu Gln Pro Pro Leu Gly Asp Leu Asn Ala 130 135 140 Met Thr Ser Pro His Ser His Gln Ser Pro Thr Pro Pro Gln Leu Phe 145 150 155 160 Gln Pro Asp Ser Leu Gln Ser Pro Pro Phe Asn Arg His Gln Phe Ser 165 170 175 Ser Pro Pro Thr His Ser Arg Asn Ala Ser Leu Gly Pro Glu Ala Ala 180 185 190 Leu Leu Pro Ser Gln Ile Gly Asp Trp Thr Gln Pro Gln Phe Gln Gly 195 200 205 His Arg Arg Thr Pro Ser Glu Tyr Ser Asp Val Ser Ser Val Ala Pro 210 215 220 Ser Pro His Leu Val Ser Ser Asp Thr Phe Asp Ala Asp Gln Ser Gly 225 230 235 240 His Ser Pro Leu Gln Arg Pro Ala Asp Val Ser Leu Tyr Gln Glu Val 245 250 255 Leu Gly Ile Gly Ser Phe Ser Leu Ala Asp His Gly Ser Pro Gly Tyr 260 265 270 His Gly Arg Ser Pro Ser His Ser Pro Ala Ile Ser Pro Arg Ile Met 275 280 285 Pro Gln Gln Met Pro Asp Thr Met Gln Pro Ser Phe Asn Leu Ile Pro 290 295 300 Pro Asn Gly Gly Phe Asp Gly Val Ser Gly Tyr Pro Asp Leu Gln Pro 305 310 315 320 Ser His Glu Ser Phe Pro Ser Leu Ser Gly Gly Met Gly Gly Asp Met 325 330 335 His Gln Met Ala Pro Pro Ala Ile Asn Ile Asp Phe Ala Pro Thr Asn 340 345 350 Ser Arg Gln Gly Ser Phe Glu Pro Pro Lys Ser Gln Met Asp Gln Asp 355 360 365 Ser Leu Thr Pro Pro Glu Arg Gly Arg Pro Lys Ser Arg Pro Arg Ala 370 375 380 Val Thr Asp Pro Phe His Pro Gly Ser Gly Ile Leu Pro Pro Gly Asn 385 390 395 400 Leu Gly Ser Ser Leu Gly Val Asp Leu Ala Ala Arg Ser Asp Thr Ala 405 410 415 Ser Arg Ser Leu Ser Pro Leu Asp Arg Ser Gly Thr Ser Ser Pro Ala 420 425 430 Ser Arg Arg Arg Gln Ser Thr Ser Ser Val Pro Asn Asn Val Ile Ala 435 440 445 Leu Arg Leu Ala Asp Pro Glu Tyr Gln Asn Ser Gln Glu Ala Gly Thr 450 455 460 Ser Lys Arg Met Gln Lys His Pro Ala Thr Phe Gln Cys Thr Leu Cys 465 470 475 480 Pro Lys Arg Phe Thr Arg Ala Tyr Asn Leu Arg Ser His Leu Arg Thr 485 490 495 His Thr Asp Glu Arg Pro Phe Val Cys Thr Val Cys Gly Lys Ala Phe 500 505 510 Ala Arg Gln His Asp Arg Lys Arg His Glu Ser Leu His Ser Gly Glu 515 520 525 Lys Lys Phe Val Cys Lys Gly Asp Leu Lys Thr Gly Gly Gln Trp Gly 530 535 540 Cys Gly Arg Arg Phe Ala Arg Ala Asp Ala Leu Gly Arg His Phe Arg 545 550 555 560 Ser Glu Ala Gly Arg Ile Cys Ile Lys Pro Leu Leu Asp Glu Glu Met 565 570 575 Val Glu Arg Gln Arg Gln Trp Gln Glu Gln Arg Met Gln Gln Asn Met 580 585 590 Ala Gln Asn Met Ala Asn Pro Gln Val Met Gly Met Asp Ala Gly Pro 595 600 605 Ala Tyr Pro Met Asp Ala Ser Gly Asn Tyr Thr Leu Pro Gln Ala Leu 610 615 620 Leu Ala Gln Tyr Pro Ala Leu Ala Gln Met Asn Trp Ser Ala Thr Asp 625 630 635 640 Met Gly Gly Gly Leu Asp Asp Glu Leu Ser Gly Arg Ser Ser Phe Asp 645 650 655 Ala Ser Asp Tyr Asp Asp Gly Asp Asp Gly Gly Tyr 660 665 <210> 18 <211> 540 <212> PRT <213> Hypocrea jecorina <400> 18 Met Ser Leu Ser Lys Leu Ser Val Ser Leu Leu Ala Leu Ala Gly Ser 1 5 10 15 Ala Ile Ala Gly Asp Leu Pro Ser Ile Thr Ala Lys Gly Ser Lys Phe 20 25 30 Phe Tyr Pro Asn Gly Thr Gln Phe Phe Ile Lys Gly Val Ala Tyr Gln 35 40 45 Gln Asp Val Gly Gln Ala Gly Ser Thr Asp Ser Ser Thr Ser Thr Phe 50 55 60 Ile Asp Pro Leu Ser Ser Glu Ala Asn Cys Lys Arg Asp Val Pro Leu 65 70 75 80 Leu Lys Gln Leu Gly Thr Asn Val Ile Arg Thr Tyr Ala Ile Asp Pro 85 90 95 Lys Ala Asp His Ser Ala Cys Met Lys Leu Leu Asn Asp Ala Gly Ile 100 105 110 Tyr Val Phe Ser Asp Leu Gly Glu Pro Ser Leu Ser Ile Asn Arg Asp 115 120 125 Thr Pro Ala Trp Asn Thr Glu Leu Phe Asp Arg Tyr Lys Ala Val Val 130 135 140 Asp Glu Met Ser Gln Tyr Pro Asn Val Ile Gly Tyr Phe Ala Gly Asn 145 150 155 160 Glu Val Ser Asn Ala Lys Asn Asn Thr Gly Ala Ser Ala Tyr Val Lys 165 170 175 Ala Ala Val Arg Asp Thr Lys Ala Tyr Ile Lys Ser Lys Lys Tyr Arg 180 185 190 Trp Gln Gly Val Gly Tyr Ala Ala Asn Asp Asp Val Asp Ile Arg Ala 195 200 205 Glu Ile Ala Asp Tyr Phe Asn Cys Gly Asp Gln Asp Glu Ala Ile Asp 210 215 220 Phe Trp Gly Tyr Asn Ile Tyr Ser Trp Cys Gly Gln Ser Ser Met Gln 225 230 235 240 Lys Ser Gly Tyr Asp Glu Gln Thr Thr Phe Phe Ser Asn Tyr Ser Val 245 250 255 Pro Val Phe Phe Ala Glu Tyr Gly Cys Asn Leu Pro Ser Gly Ala Ala 260 265 270 Ala Arg Ile Phe Gln Glu Thr Ala Ala Leu Tyr Ser Asp Glu Met Thr 275 280 285 Lys Val Phe Ser Gly Gly Ile Val Tyr Met Tyr Phe Glu Glu Asp Asn 290 295 300 Asp Tyr Gly Leu Val Lys Val Asn Asn Gly Ala Val Ser Lys Leu Lys 305 310 315 320 Asp Phe Ser Ala Leu Gln Thr Gln Val Thr Lys Ala Asp Pro Lys Gly 325 330 335 Val Asp Ala Asp Asp Tyr Lys Pro Thr Asn Lys Pro Ala Ser Cys Pro 340 345 350 Ala Leu Thr Asp Asp Trp Gln Ala Ile Asn Ser Leu Pro Pro Thr Pro 355 360 365 Asp Ala Ser Leu Cys Thr Cys Met Gln Ser Ser Leu Ser Cys Val His 370 375 380 Ala Asp Asp Leu Asp Thr Lys Asp Phe Gly Asp Ile Phe Gly Phe Ile 385 390 395 400 Cys Gly Lys Ser Pro Glu Val Cys Ala Gly Ile Asn Gly Asp Pro Ser 405 410 415 Thr Gly Val Tyr Gly Ala Tyr Ser Met Cys Glu Asp Ala Ala Lys Leu 420 425 430 Asp Tyr Val Leu Asp Ala Tyr Tyr Gln Ser Gln Lys Lys Ala Ser Thr 435 440 445 Ala Cys Asp Phe Asn Gly Gln Ala Gln Val Val Ser Pro Lys Ala Ala 450 455 460 Ser Thr Cys Ser Ala Ala Leu Ala Ser Ala Ser Ala Ile Asn Lys Gln 465 470 475 480 Ala Ala Thr Ala Thr Ala Pro Val Gly Ala Gly Ser Thr Ser Gly Ser 485 490 495 Lys Gly Ala Ala Thr Ser Thr Asn Ala Ala Val Ala Gly Arg Pro Val 500 505 510 Ser His Leu Leu Ser Met Gly Glu Ile Ser Val Ala Leu Tyr Met Gly 515 520 525 Val Ala Met Leu Ala Gly Gly Ala Met Ile Val Leu 530 535 540 <210> 19 <211> 1200 <212> DNA <213> Hypocrea jecorina <400> 19 atgcagcaac cgccctcctt agttggcgac cgcagcatca ccggcctggg agacgcagcc 60 agccgaccaa atctctcttc atcctcgcct accgtcacca gcgcgccctc ggcaccgaca 120 tcgccaccgc cgcggccgcc aatatcgctg aatcccccgt cgcgagagcc tcctggcgtc 180 gagcccgtgc tccgcatcac gccagtcccg cgctccgtct ttgcctctgt ccaccagccg 240 cgcaagtcgt cgctggtcca gacgtcgcac gtcctgccct cgcccaggac cgccgccgca 300 gctcaccatc accatcccgt ctcgcattcc gcctctggca gcagcggcag caacggcagt 360 ggaagcggca gtggcagcgg cagcggcaat ctgctgcgtc aaacgcatcg cgacaccgtg 420 cacccccccg tcaagcggcc atccaccccg tcgtcgcatc ccaccagggg cgccagcacc 480 ggagcatcgc cgcagcaggg cgccagctcc cgaaaccgct cgtcgacgtc gcccgtttcg 540 tccccggcga gtcgcacgcc tccttatgca tctcgtcagg cctcagtttc ccattcccgc 600 cagcagcaca accaccatca tcagcaccaa caccagcatt accactccca caccagctcg 660 actaccagtc gcgccagcat cgaggccgta gtcggtgccg tccccgatcc ctcaggtcac 720 cgagcgccgc cgaaaccccg tcgaccggat cgcaaccact ttggcgcgtc agatcgcagc 780 gcaactccca ccctgtcgca cttcatgagg gcagagtcga gcatgtccat gagacattac 840 gagagcggcc ccttacgctc catgtcgccg aacccctacg gaacccctgc cgccaccacg 900 acgtcgtcca ctgccagaat gccgcacgag cagagccacg atccctacgc ccctcgcggc 960 cactctcgcg atcactcggg gaagagcagc agagacatgg gcaagccccg agctcagaag 1020 aatccctcac agaaggcgat gctctcccgt gccctgcaaa aggccaacac cgcagttcag 1080 ctcgacaatg ctcagaactt cgaaggcgct cgagaagcgt acgccgaggc ttgcgacttg 1140 ttgcagcagg tgcttgaccg aacaccggga gatgaggaca agcggaagct cgaagccatt 1200 1200 <210> 20 <211> 2539 <212> DNA <213> Hypocrea jecorina <400> 20 caccaaactt acaccagccg catcgatgag ctggatcagt tgggcccttg gcaggttgag 60 accgtcaagg ctctgccggc gcggccagag agcgaggagt acagcgcgtc catattcata 120 ccccaggatt acgacatggg cgatgaagct cccaggattg agacggcacg ggtggtgagc 180 tacatcgctg gagacaacgc gtctcccttt gcagcagcgc ccaaccagtg gcagcagtcg 240 ggaggtcaca cggcatctga acggctgcag cccaaccgcg gtctggaacc gggtctgcta 300 cagtcgtcct tctctcgggc cccgaggtcg cccaggcggc tgcagtccac cgatgatctt 360 cgcgcacagc atcaggaggg ccagtatgcg cctcccccac tctcgcctcg ctcgcagtcg 420 ccggtaaaga cgcatgacca tgacgacgac atgtttgccg aactgccacc acacgagccc 480 tatcagtacc agcaagagca cgaccatcaa gaccaccatc aagactacca tcaacatcac 540 cgccatcaca accaccacca tcacgaacga cagcccagcg agactgtcct atcctcatac 600 gagctccagg gtcatgtgga tggaggaatc caaaactcat ggctagatcc aattgacgag 660 tcgggaggct caacagcgtc gtctgtacac tcacgcacct cttcgcttgg ctaccgtcga 720 cgccatatcc gggccgtgag cgggaacacc gaggccgagt ttgacacggc gctggacgct 780 gctatcgagg ctgcctacga cgacggctac gagcccatgg actctgtaga ctatgggacc 840 attgatgctg ggggggacaa tagcatggca ggcgtattgc acaaggtgga gatggcgcgc 900 gaacgagcga gacagacgga gcaggaagcc tatgacgagc tggccaacct ccgacaggcg 960 cactcacaga atccgcagca ccagcaggag gaggacaggt atactgccga gggattctac 1020 gaggacgact cgtctgaaga ggaggagaga ctattggacg agattacacg cgactttgcc 1080 attgaggact ttaccatgga aaacccgaat ggcacacagg tgtcagctag gcagcaggat 1140 gcatggaacg aggacgagac gaggccggat ttcatctcgg gcgtccgatc cttttctgcc 1200 ctgtcgcaga ggccacccat tcctcaggcc tacgccgcca acgcctcgca gccagcagcc 1260 ccccctccga catccgcatt gccagacctg ccaccaggac gccctggtca aaatccaaag 1320 caactcaaga tcgagacggc aaacattgta caaacccaga agtcggtcta tgacgacgac 1380 gaaatctccc caagcacgca agagccgccg cccgagacgc tcgtccggac ggcgagcgcg 1440 cagcctgtaa ggccaccgat accgacagaa agcttcccat ccgaactcag tgctcccgca 1500 tcgccaaccg ccaagaagag gcttctggaa ggagagaatg tgctgaatgc ctcgccttct 1560 atccacaggc tacggaagaa cttttcgtct tctagcttga ggagcatgaa gaacaggaac 1620 atgtccgtct cacatttgga cgacagctcg gatgcttccc ccggcacccc cctgaatgac 1680 cccttcaaca aggcacctgc cgtgcccgtg cccgcgctgc cgaccccctt gctcgcgtcg 1740 ttcaaagatc atatggaggc agcggccggt gttggcttcc acctgtttga cgacgagttt 1800 catgcagcgg cggctgccgg cccccaaagc ccgcagagtc ccagaagtcc cgttgttgtc 1860 tccatggacg tccctgtgcc tctggaaccc tgtccaaacg acttcatgct gcgaccgttt 1920 tggctgatgc gatgcctata ccagacactt gtgcatccca agggtggcta catcagtacg 1980 aagctattcg tgccgcgaga cgtctggcgg gtcaaaggtg tcaagatcaa gaacgtggag 2040 gacaaaattg ccaactgcga ctttttgact gcagccctgc tgaagctgtc caaagtggac 2100 actctggatg cggatgccgt gctggaggag atgcaagccc tcgagggcat tctggagcag 2160 atacagccgg tcctggcccg aaagcttgga aacgaagtgg gcgttcaagg ttccggtctg 2220 ctgttcaaag acgcctcgat gatggaagga gaccccggtt cagccgtgcc gcgatcagga 2280 agtgtgtctg gcaaggcgtc tgcgttttcc tggcgacggc ttcggccaaa gacgtcgggc 2340 gtcgggctgg gagggtcgta cagcagccgc aacgccagtg ctgagacgaa ggaggcctca 2400 acgctggcaa cggtgcccat gacgccgaaa ccgacaagcc gttcggccaa gcgagacgtg 2460 agccaggttc agttcatcgg gcccaatgcg agctacatgg gctctctcgc gcgcttgttt 2520 gacgctgcgc aggcagttg 2539 <210> 21 <211> 188 <212> DNA <213> Hypocrea jecorina <400> 21 atcaaattgc aaggcaggtc gacgaccccg gtttgcggct tgcggacaag actcaggtcg 60 gcttggagct ctgcacccgg cacgccgctg agttctttgg cttttacatt tgccgattcg 120 tcttggccga cctcggcctg ttgctggaca agttcctcaa acgaggaagc gaatgggtca 180 tgacatga 188 <210> 22 <211> 87 <212> PRT <213> Hypocrea jecorina <400> 22 Ser Gln Lys Ala Met Leu Ser Arg Ala Leu Gln Lys Ala Asn Thr Ala 1 5 10 15 Val Gln Leu Asp Asn Ala Gln Asn Phe Glu Gly Ala Arg Glu Ala Tyr 20 25 30 Ala Glu Ala Cys Asp Leu Leu Gln Gln Val Leu Asp Arg Thr Pro Gly 35 40 45 Asp Glu Asp Lys Arg Lys Leu Glu Ala Ile His Gln Thr Tyr Thr Ser 50 55 60 Arg Ile Asp Glu Leu Asp Gln Leu Gly Pro Trp Gln Val Glu Thr Val 65 70 75 80 Lys Ala Leu Pro Ala Arg Pro 85 <210> 23 <211> 60 <212> PRT <213> Hypocrea jecorina <400> 23 Ser Trp Leu Asp Pro Ile Asp Glu Ser Gly Gly Ser Thr Ala Ser Ser 1 5 10 15 Val His Ser Arg Thr Ser Ser Leu Gly Tyr Arg Arg Arg His Ile Arg 20 25 30 Ala Val Ser Gly Asn Thr Glu Ala Glu Phe Asp Thr Ala Leu Asp Ala 35 40 45 Ala Ile Glu Ala Ala Tyr Asp Asp Gly Tyr Glu Pro 50 55 60 <210> 24 <211> 118 <212> PRT <213> Hypocrea jecorina <400> 24 Leu Glu Pro Cys Pro Asn Asp Phe Met Leu Arg Pro Phe Trp Leu Met 1 5 10 15 Arg Cys Leu Tyr Gln Thr Leu Val His Pro Lys Gly Gly Tyr Ile Ser 20 25 30 Thr Lys Leu Phe Val Pro Arg Asp Val Trp Arg Val Lys Gly Val Lys 35 40 45 Ile Lys Asn Val Glu Asp Lys Ile Ala Asn Cys Asp Phe Leu Thr Ala 50 55 60 Ala Leu Leu Lys Leu Ser Lys Val Asp Thr Leu Asp Ala Asp Ala Val 65 70 75 80 Leu Glu Glu Met Gln Ala Leu Glu Gly Ile Leu Glu Gln Ile Gln Pro 85 90 95 Val Leu Ala Arg Lys Leu Gly Asn Glu Val Gly Val Gln Gly Ser Gly 100 105 110 Leu Leu Phe Lys Asp Ala 115 <210> 25 <211> 84 <212> PRT <213> Hypocrea jecorina <400> 25 Thr Val Pro Met Thr Pro Lys Pro Thr Ser Arg Ser Ala Lys Arg Asp 1 5 10 15 Val Ser Gln Val Gln Phe Ile Gly Pro Asn Ala Ser Tyr Met Gly Ser 20 25 30 Leu Ala Arg Leu Phe Asp Ala Ala Gln Ala Val Asp Gln Ile Ala Arg 35 40 45 Gln Val Asp Asp Pro Gly Leu Arg Leu Ala Asp Lys Thr Gln Val Gly 50 55 60 Leu Glu Leu Cys Thr Arg His Ala Ala Glu Phe Phe Gly Phe Tyr Ile 65 70 75 80 Cys Arg Phe Val <210> 26 <211> 60 <212> PRT <213> Hypocrea jecorina <400> 26 Ser Trp Leu Asp Pro Ile Asp Glu Ser Gly Gly Ser Thr Ala Ser Ser 1 5 10 15 Val His Ser Arg Thr Ser Ser Leu Gly Tyr Arg Arg Arg His Ile Arg 20 25 30 Ala Val Ser Gly Asn Thr Glu Ala Glu Phe Asp Thr Ala Leu Asp Ala 35 40 45 Ala Ile Glu Ala Ala Tyr Asp Asp Gly Tyr Glu Pro 50 55 60 <210> 27 <211> 22 <212> PRT <213> Hypocrea jecorina <400> 27 Asp Ser Ser Glu Glu Glu Glu Arg Leu Leu Asp Glu Ile Thr Arg Asp 1 5 10 15 Phe Ala Ile Glu Asp Phe 20 <210> 28 <211> 119 <212> PRT <213> Hypocrea jecorina <400> 28 Pro Val Pro Leu Glu Pro Cys Pro Asn Asp Phe Met Leu Arg Pro Phe 1 5 10 15 Trp Leu Met Arg Cys Leu Tyr Gln Thr Leu Val His Pro Lys Gly Gly 20 25 30 Tyr Ile Ser Thr Lys Leu Phe Val Pro Arg Asp Val Trp Arg Val Lys 35 40 45 Gly Val Lys Ile Lys Asn Val Glu Asp Lys Ile Ala Asn Cys Asp Phe 50 55 60 Leu Thr Ala Ala Leu Leu Lys Leu Ser Lys Val Asp Thr Leu Asp Ala 65 70 75 80 Asp Ala Val Leu Glu Glu Met Gln Ala Leu Glu Gly Ile Leu Glu Gln 85 90 95 Ile Gln Pro Val Leu Ala Arg Lys Leu Gly Asn Glu Val Gly Val Gln 100 105 110 Gly Ser Gly Leu Leu Phe Lys 115 <210> 29 <211> 24 <212> PRT <213> Hypocrea jecorina <400> 29 Val Pro Arg Ser Gly Ser Val Ser Gly Lys Ala Ser Ala Phe Ser Trp 1 5 10 15 Arg Arg Leu Arg Pro Lys Thr Ser 20 <210> 30 <211> 96 <212> PRT <213> Hypocrea jecorina <400> 30 Thr Ser Arg Ser Ala Lys Arg Asp Val Ser Gln Val Gln Phe Ile Gly 1 5 10 15 Pro Asn Ala Ser Tyr Met Gly Ser Leu Ala Arg Leu Phe Asp Ala Ala 20 25 30 Gln Ala Val Asp Gln Ile Ala Arg Gln Val Asp Asp Pro Gly Leu Arg 35 40 45 Leu Ala Asp Lys Thr Gln Val Gly Leu Glu Leu Cys Thr Arg His Ala 50 55 60 Ala Glu Phe Phe Gly Phe Tyr Ile Cys Arg Phe Val Leu Ala Asp Leu 65 70 75 80 Gly Leu Leu Leu Asp Lys Phe Leu Lys Arg Gly Ser Glu Trp Val Met 85 90 95 <210> 31 <211> 1235 <212> PRT <213> Trichoderma atraviride <400> 31 Met Gln Gln Ser His Pro Phe Asp Asp Asn Ile Ile Ser Arg Arg Ala 1 5 10 15 Thr Arg Ala Pro Ile Glu Pro Ser Ser Pro Pro Pro Pro Pro Pro Gln 20 25 30 Ala Ser Ser Arg Glu Ala Pro Gly Ile Glu Ala Val Leu Ser Ser Pro 35 40 45 Lys Thr Pro Val Leu Arg Ser Val Phe Ser Ser Ala Arg Leu Pro Arg 50 55 60 Ser Ser Ser Leu Ile Pro Pro Leu His Gly Ser Pro Pro Ser Ala Ser 65 70 75 80 Thr Ala Ala Ala Ile Asn Thr Asn Ser Pro Pro His His Ala Asn Ala 85 90 95 Ser Gln His Thr His Arg Gly Pro Val His Pro Pro Val Ser Leu Lys 100 105 110 Arg Pro Ser Thr Pro Ser Ser Gln Leu Asn Arg Gly Ala Ser Ser Gly 115 120 125 Ala Ser Pro Gln Glu Ala Ser Arg Thr Arg Asn Arg Trp Ser Thr Ser 130 135 140 Ser Ile Ser Ser Ala Ser Ser Arg Thr Ser Pro Tyr Ala Ser Arg Gln 145 150 155 160 Ala Ser Ile Ser Asn Ser Arg Ile Arg Arg Ala Ser Leu Glu Ala Ala 165 170 175 Leu Ser Pro Pro Ser Val Pro Pro Pro Pro Leu Pro Pro Ala Gln Ala 180 185 190 Pro Pro Arg Lys Pro Ser Tyr Thr Val Arg Ser Arg Phe Asn Ser Ser 195 200 205 Asp Ser Gly Val Thr Pro Thr Ser Val His Pro Met Arg Ser Glu Ser 210 215 220 Ser Met Ser Met Arg His Tyr Glu Asn Gly Gln Leu Arg Ser Val Ser 225 230 235 240 Pro Asn Pro Tyr Ala Asn Pro Thr Thr Thr Thr Ser Ser Thr Ala Arg 245 250 255 Met Pro His Glu His Ser His Asp Pro Tyr Ala Pro Arg Gly His Ser 260 265 270 Arg Asp His Ser Gly Lys Ser Ser Arg Asp Leu Gly Lys Pro Arg Ala 275 280 285 Gln Lys Asn Pro Ser Gln Lys Ala Met Leu Ser Arg Ala Leu Gln Lys 290 295 300 Ala Asn Thr Ala Val Gln Leu Asp Asn Ala Gln Asn Phe Glu Gly Ala 305 310 315 320 Arg Glu Ser Tyr Ala Glu Ala Cys Asp Leu Leu Gln Gln Val Leu Asp 325 330 335 Arg Thr Ser Gly Asp Glu Asp Lys Arg Lys Leu Glu Thr Ile Arg Ala 340 345 350 Thr Tyr Thr Ser Arg Ile Asp Glu Leu Asp Gln Met Gly Pro Trp Gln 355 360 365 Asp Glu Asn Val Lys Ala Leu Pro Ala Arg Pro Glu Ser Glu Asp Tyr 370 375 380 Gly Ala Ser Ile Tyr Met His Gln Asp Tyr Glu Met Met Glu Glu Ala 385 390 395 400 Pro Arg Ile Glu Thr Ala Arg Val Val Ser Ile Ile Gly Asp Gly Ser 405 410 415 Ser Pro Val Ala His Gln Trp Gln Gln Asp Tyr Thr Thr Thr Asp Arg 420 425 430 Gln Gln Pro Ala Arg Thr Leu Glu Pro Gly Met Leu Gln Ser Ser Phe 435 440 445 Ser Arg Ser Pro Arg Arg Leu Arg Ser Thr Asp Asn Leu Arg Ala Gln 450 455 460 Ser Gln Gln Glu Ala Leu Tyr Ala Pro Ala Pro Leu Ser Pro Arg Ser 465 470 475 480 Pro Ser Pro Met Lys Met His Pro Glu Glu Tyr Thr Glu Met Val Gln 485 490 495 Glu His His Glu Pro His His Gln His Tyr His Gln Arg Gln Pro Ser 500 505 510 Asp Ser Val Leu Pro Tyr Asp Met Gln Asp Phe Thr Glu Gly Thr Gln 515 520 525 Asn Ser Trp Leu Asp Pro Ile Asp Glu Ser Gly Ala Ser Thr Val Ser 530 535 540 Ser Val His Ser Arg Thr Ser Ser Leu Gly Tyr Arg Arg Arg His Ile 545 550 555 560 Arg Ala Ala Ser Gly Asn Thr Glu Ala Glu Phe Asp Thr Ala Leu Asp 565 570 575 Ala Ala Ile Glu Ala Ala Tyr Asp Asp Gly Phe Glu Pro Met Glu Thr 580 585 590 Glu Asp Tyr Asp Ala Met Asp Pro Arg Glu Asp Val Val Ala Ser Val 595 600 605 Met Gln Arg Val Glu Lys Ala Arg Glu Gln Val Arg Gln Thr Glu Gln 610 615 620 Glu Ala Tyr Asp Asp Leu Ala Met Leu Arg Gln Ala His Gln Gln Asn 625 630 635 640 Gln His Tyr Leu Gln Glu Glu Glu Asp Lys Tyr Thr Pro Asp Gly Phe 645 650 655 Tyr Glu Asp Asp Ser Ser Glu Asp Glu Glu Arg Leu Leu Asp Glu Ile 660 665 670 Thr Arg Asp Phe Ala Ile Glu Asp Phe Thr Met Thr Gln Pro Gln Ser 675 680 685 Asn Thr Ala Thr Val Ser Ala Ser Gln Gln Glu Ala Trp Asn Glu Asp 690 695 700 Glu Thr Arg Pro Asp Phe Ile Ser Gly Val Arg Ser Phe Ser Ala Leu 705 710 715 720 Ser Gln Arg Pro Pro Ile Pro Gln Thr Ser Asn Ile Met Gln Pro Ala 725 730 735 Ala Pro Pro Pro Thr Thr Thr Leu Pro Pro Pro Pro Thr Thr Thr Leu 740 745 750 Pro Glu Val Pro Lys Gly Ser Asp Ser Pro Ser His Gly Val Arg Asn 755 760 765 Arg Arg Met Ser Gly Gln Asn Pro Lys Gln Leu Lys Ile Glu Thr Thr 770 775 780 Asn Leu Gly Gln Ser Asn Thr Arg Thr Val Tyr Asp Asp Asp Glu Ile 785 790 795 800 Ser Pro Ser Thr Val Asp Arg Asp Leu Val Glu Ala Leu Val Arg Gly 805 810 815 Ala Ser Ala His Pro Val Lys Gln Leu Asn Ala Ala Asp Asn Glu Ser 820 825 830 Lys Ile Pro Gly Ser Pro Ser Ala Lys Lys Lys Leu Ile Asp Gly Glu 835 840 845 Asp Ala Thr Ala Ala Asn Ala Ser Pro Ser Ile His Arg Leu Lys Lys 850 855 860 Asn Phe Ser Ser Ser Ser Leu Arg Ser Met Lys Asn Arg Asn Met Ser 865 870 875 880 Val Ser His Leu Asp Asp Asn Ser Asp Val Ser Pro Gly Thr Pro Asn 885 890 895 Gly Asn Pro Phe Gly Lys Thr Pro Ala Val Pro Ala Leu Pro Thr Pro 900 905 910 Leu Ile Thr Ser Phe Arg Asp Asn Gly Glu Ala Gly Gly Gly Ala Gly 915 920 925 Leu His Leu Phe Asp Asp Asn Phe His Ala Ala Ala Thr Pro Gly Pro 930 935 940 Gln Ser Pro Val Val Ser Met Glu Val Pro Ala Pro Leu Glu Pro Cys 945 950 955 960 Pro Asn Asp Phe Met Leu Arg Pro Phe Trp Leu Met Arg Cys Leu Tyr 965 970 975 Gln Thr Leu Val His Pro Lys Gly Gly Tyr Val Ser Thr Lys Leu Phe 980 985 990 Val Pro Arg Asp Val Trp Arg Val Lys Gly Val Lys Ile Lys Asn Val 995 1000 1005 Glu Asp Lys Val Ala Asn Cys Asp Phe Leu Thr Ala Ala Leu Leu Lys 1010 1015 1020 Leu Ala Lys Val Asp Thr Phe Asp Ala Asp Ala Val Leu Glu Glu Met 1025 1030 1035 1040 Gln Ser Leu Glu Gly Val Leu Glu Gln Val Gln Ser Ser Leu Ala Arg 1045 1050 1055 Lys Leu Gly Ser Glu Val Gly Val Gln Gly Gly His Ile Phe Lys Asp 1060 1065 1070 Ala Ser Val Asp Gly Glu Gly Gly Ser Asn Val Pro Arg Ser Gly Ser 1075 1080 1085 Val Ser Gly Lys Ala Ser Ala Phe Ser Trp Arg Arg Leu Arg Pro Lys 1090 1095 1100 Thr Ser Gly Val Gly Leu Gly Gly Ser Tyr Ser Asn Arg Ser Ala Ser 1105 1110 1115 1120 Met Glu Thr Lys Glu Val Thr Thr Leu Ala Thr Leu Pro Met Thr Pro 1125 1130 1135 Lys Pro Thr Ser Arg Pro Pro Lys Arg Asp Val Ser Gln Ala Gln Phe 1140 1145 1150 Ile Gly Pro Asn Ala Met Tyr Met Gly Ser Leu Ala Arg Leu Phe Asp 1155 1160 1165 Ala Ala Gln Ala Ile Asp Gln Ile Ala Arg Gln Val Glu Asp Pro Gly 1170 1175 1180 Leu Arg His Ala Asp Lys Thr Gln Val Gly Leu Glu Leu Cys Thr Arg 1185 1190 1195 1200 His Ala Ala Glu Phe Phe Gly Phe Tyr Ile Cys Arg Phe Val Leu Ala 1205 1210 1215 Asp Leu Ser Leu Leu Leu Asp Lys Phe Leu Lys Arg Gly Ser Glu Trp 1220 1225 1230 Val Leu Thr 1235 <210> 32 <211> 4694 <212> DNA <213> Hypocrea jecorina <400> 32 atggatcagc gctgtgggcg gttcgttcag ggccatcgcc aggcacaggc acaggcacag 60 gcacagaggc tcaggcacga ggtaccggta cctgggccgg gccaattgga tgcaccacca 120 cggcctgacc tgcgtttccg caactcccac gcttgcctcc ccacgatcca cagcgccagg 180 gacgtccaaa tccccgatag tattcccagt cgaggaccag cagcgattga gtgagtgagt 240 gactgactga gggacgactg aggtactgac ggatcccaga ggacagcacg acaccgcacc 300 gcaccgctca gcacaggccc gttgctggga gtgctgtcga tccgctgagt ggcctctctc 360 tctctctctg tctctcctcc ttcgcatcag cctcgtgagc accgcaaaga cagaagaacc 420 cgccattgtc tcgaggtcat ggccggctgc cacacgcgcg caatacatcc aatcccacga 480 ctgcgacccc cgacccacgc tgtacgagta agattggccg gaagaggcga ccattggctg 540 agacggcagc ccgcaccagt ccagcaaccg caactgcaag tgctgcacgt cgtacgaacc 600 tgatttggcc atagccagcg ccagagcatg cagcaaccgc cctccttagt tggcgaccgc 660 agcatcaccg gcctgggaga cgcagccagc cgaccaaatc tctcttcatc ctcgcctacc 720 gtcaccagcg cgccctcggc accgacatcg ccaccgccgc ggccgccaat atcgctgaat 780 cccccgtcgc gagagcctcc tggcgtcgag cccgtgctcc gcatcacgcc agtcccgcgc 840 tccgtctttg cctctgtcca ccagccgcgc aagtcgtcgc tggtccagac gtcgcacgtc 900 ctgccctcgc ccaggaccgc cgccgcagct caccatcacc atcccgtctc gcattccgcc 960 tctggcagca gcggcagcaa cggcagtgga agcggcagtg gcagcggcag cggcaatctg 1020 ctgcgtcaaa cgcatcgcga caccgtgcac ccccccgtca agcggccatc caccccgtcg 1080 tcgcatccca ccaggggcgc cagcaccgga gcatcgccgc agcagggcgc cagctcccga 1140 aaccgctcgt cgacgtcgcc cgtttcgtcc ccggcgagtc gcacgcctcc ttatgcatct 1200 cgtcaggcct cagtttccca ttcccgccag cagcacaacc accatcatca gcaccaacac 1260 cagcattacc actcccacac cagctcgact accagtcgcg ccagcatcga ggccgtagtc 1320 ggtgccgtcc ccgatccctc aggtcaccga gcgccgccga aaccccgtcg accggatcgc 1380 aaccactttg gcgcgtcaga tcgcagcgca actcccaccc tgtcgcactt catgagggca 1440 gagtcgagca tgtccatgag acattacgag agcggcccct tacgctccat gtcgccgaac 1500 ccctacggaa cccctgccgc caccacgacg tcgtccactg ccagaatgcc gcacgagcag 1560 agccacgatc cctacgcccc tcgcggccac tctcgcgatc actcggggaa gagcagcaga 1620 gacatgggca agccccgagc tcagaagaat ccctcacaga aggcgatgct ctcccgtgcc 1680 ctgcaaaagg ccaacaccgc agttcagctc gacaatgctc agaacttcga aggcgctcga 1740 gaagcgtacg ccgaggcttg cgacttgttg cagcaggtgc ttgaccgaac accgggagat 1800 gaggacaagc ggaagctcga agccattgta agtcacggcg gcaaccggaa tgtcgagccc 1860 gttgtctgtc attagtagat cacttggaac tgacaatttc aatctgtagc accaaactta 1920 caccagccgc atcgatgagc tggatcagtt gggcccttgg caggttgaga ccgtcaaggc 1980 tctgccggcg cggccagaga gcgaggagta cagcgcgtcc atattcatac cccaggatta 2040 cgacatgggc gatgaagctc ccaggattga gacggcacgg gtggtgagct acatcgctgg 2100 agacaacgcg tctccctttg cagcagcgcc caaccagtgg cagcagtcgg gaggtcacac 2160 ggcatctgaa cggctgcagc ccaaccgcgg tctggaaccg ggtctgctac agtcgtcctt 2220 ctctcgggcc ccgaggtcgc ccaggcggct gcagtccacc gatgatcttc gcgcacagca 2280 tcaggagggc cagtatgcgc ctcccccact ctcgcctcgc tcgcagtcgc cggtaaagac 2340 gcatgaccat gacgacgaca tgtttgccga actgccacca cacgagccct atcagtacca 2400 gcaagagcac gaccatcaag accaccatca agactaccat caacatcacc gccatcacaa 2460 ccaccaccat cacgaacgac agcccagcga gactgtccta tcctcatacg agctccaggg 2520 tcatgtggat ggaggaatcc aaaactcatg gctagatcca attgacgagt cgggaggctc 2580 aacagcgtcg tctgtacact cacgcacctc ttcgcttggc taccgtcgac gccatatccg 2640 ggccgtgagc gggaacaccg aggccgagtt tgacacggcg ctggacgctg ctatcgaggc 2700 tgcctacgac gacggctacg agcccatgga ctctgtagac tatgggacca ttgatgctgg 2760 gggggacaat agcatggcag gcgtattgca caaggtggag atggcgcgcg aacgagcgag 2820 acagacggag caggaagcct atgacgagct ggccaacctc cgacaggcgc actcacagaa 2880 tccgcagcac cagcaggagg aggacaggta tactgccgag ggattctacg aggacgactc 2940 gtctgaagag gaggagagac tattggacga gattacacgc gactttgcca ttgaggactt 3000 taccatggaa aacccgaatg gcacacaggt gtcagctagg cagcaggatg catggaacga 3060 ggacgagacg aggccggatt tcatctcggg cgtccgatcc ttttctgccc tgtcgcagag 3120 gccacccatt cctcaggcct acgccgccaa cgcctcgcag ccagcagccc cccctccgac 3180 atccgcattg ccagacctgc caccaggacg ccctggtcaa aatccaaagc aactcaagat 3240 cgagacggca aacattgtac aaacccagaa gtcggtctat gacgacgacg aaatctcccc 3300 aagcacgcaa gagccgccgc ccgagacgct cgtccggacg gcgagcgcgc agcctgtaag 3360 gccaccgata ccgacagaaa gcttcccatc cgaactcagt gctcccgcat cgccaaccgc 3420 caagaagagg cttctggaag gagagaatgt gctgaatgcc tcgccttcta tccacaggct 3480 acggaagaac ttttcgtctt ctagcttgag gagcatgaag aacaggaaca tgtccgtctc 3540 acatttggac gacagctcgg atgcttcccc cggcaccccc ctgaatgacc ccttcaacaa 3600 ggcacctgcc gtgcccgtgc ccgcgctgcc gacccccttg ctcgcgtcgt tcaaagatca 3660 tatggaggca gcggccggtg ttggcttcca cctgtttgac gacgagtttc atgcagcggc 3720 ggctgccggc ccccaaagcc cgcagagtcc cagaagtccc gttgttgtct ccatggacgt 3780 ccctgtgcct ctggaaccct gtccaaacga cttcatgctg cgaccgtttt ggctgatgcg 3840 atgcctatac cagacacttg tgcatcccaa gggtggctac atcagtacga agctattcgt 3900 gccgcgagac gtctggcggg tcaaaggtgt caagatcaag aacgtggagg acaaaattgc 3960 caactgcgac tttttgactg cagccctgct gaagctgtcc aaagtggaca ctctggatgc 4020 ggatgccgtg ctggaggaga tgcaagccct cgagggcatt ctggagcaga tacagccggt 4080 cctggcccga aagcttggaa acgaagtggg cgttcaaggt tccggtctgc tgttcaaaga 4140 cgcctcgatg atggaaggag accccggttc agccgtgccg cgatcaggaa gtgtgtctgg 4200 caaggcgtct gcgttttcct ggcgacggct tcggccaaag acgtcgggcg tcgggctggg 4260 agggtcgtac agcagccgca acgccagtgc tgagacgaag gaggcctcaa cgctggcaac 4320 ggtgcccatg acgccgaaac cgacaagccg ttcggccaag cgagacgtga gccaggttca 4380 gttcatcggg cccaatgcga gctacatggg ctctctcgcg cgcttgtttg acgctgcgca 4440 ggcagttggt aagcatattg cgatacgcat accggttaca gtgacggcaa gctaacgatg 4500 atgcagatca aattgcaagg caggtcgacg accccggttt gcggcttgcg gacaagactc 4560 aggtcggctt ggagctctgc acccggcacg ccgctgagtt ctttggcttt tacatttgcc 4620 gattcgtctt ggccgacctc ggcctgttgc tggacaagtt cctcaaacga ggaagcgaat 4680 gggtcatgac atga 4694 <210> 33 <211> 1465 <212> PRT <213> Hypocrea jecorina <400> 33 Met Asp Gln Arg Cys Gly Arg Phe Val Gln Gly His Arg Gln Ala Gln 1 5 10 15 Ala Gln Ala Gln Ala Gln Arg Leu Arg His Glu Val Pro Val Pro Gly 20 25 30 Pro Gly Gln Leu Asp Ala Pro Pro Arg Pro Asp Leu Arg Phe Arg Asn 35 40 45 Ser His Ala Cys Leu Pro Thr Ile His Ser Ala Arg Asp Val Gln Ile 50 55 60 Pro Asp Ser Ile Pro Ser Arg Gly Pro Ala Ala Ile Glu Gly Gln His 65 70 75 80 Asp Thr Ala Pro His Arg Ser Ala Gln Ala Arg Cys Trp Glu Cys Cys 85 90 95 Arg Ser Ala Glu Trp Pro Leu Ser Leu Ser Leu Ser Leu Leu Leu Arg 100 105 110 Ile Ser Leu Val Ser Thr Ala Lys Thr Glu Glu Pro Ala Ile Val Ser 115 120 125 Arg Ser Trp Pro Ala Ala Thr Arg Ala Gln Tyr Ile Gln Ser His Asp 130 135 140 Cys Asp Pro Arg Pro Thr Leu Tyr Asp Gln Arg Gln Ser Met Gln Gln 145 150 155 160 Pro Pro Ser Leu Val Gly Asp Arg Ser Ile Thr Gly Leu Gly Asp Ala 165 170 175 Ala Ser Arg Pro Asn Leu Ser Ser Ser Ser Pro Thr Val Thr Ser Ala 180 185 190 Pro Ser Ala Pro Thr Ser Pro Pro Pro Arg Pro Pro Ile Ser Leu Asn 195 200 205 Pro Pro Ser Arg Glu Pro Pro Gly Val Glu Pro Val Leu Arg Ile Thr 210 215 220 Pro Val Pro Arg Ser Val Phe Ala Ser Val His Gln Pro Arg Lys Ser 225 230 235 240 Ser Leu Val Gln Thr Ser His Val Leu Pro Ser Pro Arg Thr Ala Ala 245 250 255 Ala Ala His His His His Pro Val Ser His Ser Ala Ser Gly Ser Ser 260 265 270 Gly Ser Asn Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser Gly Asn Leu 275 280 285 Leu Arg Gln Thr His Arg Asp Thr Val His Pro Pro Val Lys Arg Pro 290 295 300 Ser Thr Pro Ser Ser His Pro Thr Arg Gly Ala Ser Thr Gly Ala Ser 305 310 315 320 Pro Gln Gln Gly Ala Ser Ser Arg Asn Arg Ser Ser Thr Ser Pro Val 325 330 335 Ser Ser Pro Ala Ser Arg Thr Pro Pro Tyr Ala Ser Arg Gln Ala Ser 340 345 350 Val Ser His Ser Arg Gln Gln His Asn His His His Gln His Gln His 355 360 365 Gln His Tyr His Ser His Thr Ser Ser Thr Thr Ser Arg Ala Ser Ile 370 375 380 Glu Ala Val Val Gly Ala Val Pro Asp Pro Ser Gly His Arg Ala Pro 385 390 395 400 Pro Lys Pro Arg Arg Pro Asp Arg Asn His Phe Gly Ala Ser Asp Arg 405 410 415 Ser Ala Thr Pro Thr Leu Ser His Phe Met Arg Ala Glu Ser Ser Met 420 425 430 Ser Met Arg His Tyr Glu Ser Gly Pro Leu Arg Ser Met Ser Pro Asn 435 440 445 Pro Tyr Gly Thr Pro Ala Ala Thr Thr Thr Ser Ser Thr Ala Arg Met 450 455 460 Pro His Glu Gln Ser His Asp Pro Tyr Ala Pro Arg Gly His Ser Arg 465 470 475 480 Asp His Ser Gly Lys Ser Ser Arg Asp Met Gly Lys Pro Arg Ala Gln 485 490 495 Lys Asn Pro Ser Gln Lys Ala Met Leu Ser Arg Ala Leu Gln Lys Ala 500 505 510 Asn Thr Ala Val Gln Leu Asp Asn Ala Gln Asn Phe Glu Gly Ala Arg 515 520 525 Glu Ala Tyr Ala Glu Ala Cys Asp Leu Leu Gln Gln Val Leu Asp Arg 530 535 540 Thr Pro Gly Asp Glu Asp Lys Arg Lys Leu Glu Ala Ile His Gln Thr 545 550 555 560 Tyr Thr Ser Arg Ile Asp Glu Leu Asp Gln Leu Gly Pro Trp Gln Val 565 570 575 Glu Thr Val Lys Ala Leu Pro Ala Arg Pro Glu Ser Glu Glu Tyr Ser 580 585 590 Ala Ser Ile Phe Ile Pro Gln Asp Tyr Asp Met Gly Asp Glu Ala Pro 595 600 605 Arg Ile Glu Thr Ala Arg Val Val Ser Tyr Ile Ala Gly Asp Asn Ala 610 615 620 Ser Pro Phe Ala Ala Ala Pro Asn Gln Trp Gln Gln Ser Gly Gly His 625 630 635 640 Thr Ala Ser Glu Arg Leu Gln Pro Asn Arg Gly Leu Glu Pro Gly Leu 645 650 655 Leu Gln Ser Ser Phe Ser Arg Ala Pro Arg Ser Pro Arg Arg Leu Gln 660 665 670 Ser Thr Asp Asp Leu Arg Ala Gln His Gln Glu Gly Gln Tyr Ala Pro 675 680 685 Pro Pro Leu Ser Pro Arg Ser Gln Ser Pro Val Lys Thr His Asp His 690 695 700 Asp Asp Asp Met Phe Ala Glu Leu Pro Pro His Glu Pro Tyr Gln Tyr 705 710 715 720 Gln Gln Glu His Asp His Gln Asp His His Gln Asp Tyr His Gln His 725 730 735 His Arg His His Asn His His His His Glu Arg Gln Pro Ser Glu Thr 740 745 750 Val Leu Ser Ser Tyr Glu Leu Gln Gly His Val Asp Gly Gly Ile Gln 755 760 765 Asn Ser Trp Leu Asp Pro Ile Asp Glu Ser Gly Gly Ser Thr Ala Ser 770 775 780 Ser Val His Ser Arg Thr Ser Ser Leu Gly Tyr Arg Arg Arg His Ile 785 790 795 800 Arg Ala Val Ser Gly Asn Thr Glu Ala Glu Phe Asp Thr Ala Leu Asp 805 810 815 Ala Ala Ile Glu Ala Ala Tyr Asp Asp Gly Tyr Glu Pro Met Asp Ser 820 825 830 Val Asp Tyr Gly Thr Ile Asp Ala Gly Gly Asp Asn Ser Met Ala Gly 835 840 845 Val Leu His Lys Val Glu Met Ala Arg Glu Arg Ala Arg Gln Thr Glu 850 855 860 Gln Glu Ala Tyr Asp Glu Leu Ala Asn Leu Arg Gln Ala His Ser Gln 865 870 875 880 Asn Pro Gln His Gln Gln Glu Glu Asp Arg Tyr Thr Ala Glu Gly Phe 885 890 895 Tyr Glu Asp Asp Ser Ser Glu Glu Glu Glu Arg Leu Leu Asp Glu Ile 900 905 910 Thr Arg Asp Phe Ala Ile Glu Asp Phe Thr Met Glu Asn Pro Asn Gly 915 920 925 Thr Gln Val Ser Ala Arg Gln Gln Asp Ala Trp Asn Glu Asp Glu Thr 930 935 940 Arg Pro Asp Phe Ile Ser Gly Val Arg Ser Phe Ser Ala Leu Ser Gln 945 950 955 960 Arg Pro Pro Ile Pro Gln Ala Tyr Ala Ala Asn Ala Ser Gln Pro Ala 965 970 975 Ala Pro Pro Pro Thr Ser Ala Leu Pro Asp Leu Pro Pro Gly Arg Pro 980 985 990 Gly Gln Asn Pro Lys Gln Leu Lys Ile Glu Thr Ala Asn Ile Val Gln 995 1000 1005 Thr Gln Lys Ser Val Tyr Asp Asp Asp Glu Ile Ser Pro Ser Thr Gln 1010 1015 1020 Glu Pro Pro Pro Glu Thr Leu Val Arg Thr Ala Ser Ala Gln Pro Val 1025 1030 1035 1040 Arg Pro Pro Ile Pro Thr Glu Ser Phe Pro Ser Glu Leu Ser Ala Pro 1045 1050 1055 Ala Ser Pro Thr Ala Lys Lys Arg Leu Leu Glu Gly Glu Asn Val Leu 1060 1065 1070 Asn Ala Ser Pro Ser Ile His Arg Leu Arg Lys Asn Phe Ser Ser Ser 1075 1080 1085 Ser Leu Arg Ser Met Lys Asn Arg Asn Met Ser Val Ser His Leu Asp 1090 1095 1100 Asp Ser Ser Asp Ala Ser Pro Gly Thr Pro Leu Asn Asp Pro Phe Asn 1105 1110 1115 1120 Lys Ala Pro Ala Val Pro Val Pro Ala Leu Pro Thr Pro Leu Leu Ala 1125 1130 1135 Ser Phe Lys Asp His Met Glu Ala Ala Ala Gly Val Gly Phe His Leu 1140 1145 1150 Phe Asp Asp Glu Phe His Ala Ala Ala Ala Ala Gly Pro Gln Ser Pro 1155 1160 1165 Gln Ser Pro Arg Ser Pro Val Val Val Ser Met Asp Val Pro Val Pro 1170 1175 1180 Leu Glu Pro Cys Pro Asn Asp Phe Met Leu Arg Pro Phe Trp Leu Met 1185 1190 1195 1200 Arg Cys Leu Tyr Gln Thr Leu Val His Pro Lys Gly Gly Tyr Ile Ser 1205 1210 1215 Thr Lys Leu Phe Val Pro Arg Asp Val Trp Arg Val Lys Gly Val Lys 1220 1225 1230 Ile Lys Asn Val Glu Asp Lys Ile Ala Asn Cys Asp Phe Leu Thr Ala 1235 1240 1245 Ala Leu Leu Lys Leu Ser Lys Val Asp Thr Leu Asp Ala Asp Ala Val 1250 1255 1260 Leu Glu Glu Met Gln Ala Leu Glu Gly Ile Leu Glu Gln Ile Gln Pro 1265 1270 1275 1280 Val Leu Ala Arg Lys Leu Gly Asn Glu Val Gly Val Gln Gly Ser Gly 1285 1290 1295 Leu Leu Phe Lys Asp Ala Ser Met Met Glu Gly Asp Pro Gly Ser Ala 1300 1305 1310 Val Pro Arg Ser Gly Ser Val Ser Gly Lys Ala Ser Ala Phe Ser Trp 1315 1320 1325 Arg Arg Leu Arg Pro Lys Thr Ser Gly Val Gly Leu Gly Gly Ser Tyr 1330 1335 1340 Ser Ser Arg Asn Ala Ser Ala Glu Thr Lys Glu Ala Ser Thr Leu Ala 1345 1350 1355 1360 Thr Val Pro Met Thr Pro Lys Pro Thr Ser Arg Ser Ala Lys Arg Asp 1365 1370 1375 Val Ser Gln Val Gln Phe Ile Gly Pro Asn Ala Ser Tyr Met Gly Ser 1380 1385 1390 Leu Ala Arg Leu Phe Asp Ala Ala Gln Ala Val Asp Gln Ile Ala Arg 1395 1400 1405 Gln Val Asp Asp Pro Gly Leu Arg Leu Ala Asp Lys Thr Gln Val Gly 1410 1415 1420 Leu Glu Leu Cys Thr Arg His Ala Ala Glu Phe Phe Gly Phe Tyr Ile 1425 1430 1435 1440 Cys Arg Phe Val Leu Ala Asp Leu Gly Leu Leu Leu Asp Lys Phe Leu 1445 1450 1455 Lys Arg Gly Ser Glu Trp Val Met Thr 1460 1465 <210> 34 <211> 4067 <212> DNA <213> Hypocrea jecorina <400> 34 atgcagcaac cgccctcctt agttggcgac cgcagcatca ccggcctggg agacgcagcc 60 agccgaccaa atctctcttc atcctcgcct accgtcacca gcgcgccctc ggcaccgaca 120 tcgccaccgc cgcggccgcc aatatcgctg aatcccccgt cgcgagagcc tcctggcgtc 180 gagcccgtgc tccgcatcac gccagtcccg cgctccgtct ttgcctctgt ccaccagccg 240 cgcaagtcgt cgctggtcca gacgtcgcac gtcctgccct cgcccaggac cgccgccgca 300 gctcaccatc accatcccgt ctcgcattcc gcctctggca gcagcggcag caacggcagt 360 ggaagcggca gtggcagcgg cagcggcaat ctgctgcgtc aaacgcatcg cgacaccgtg 420 cacccccccg tcaagcggcc atccaccccg tcgtcgcatc ccaccagggg cgccagcacc 480 ggagcatcgc cgcagcaggg cgccagctcc cgaaaccgct cgtcgacgtc gcccgtttcg 540 tccccggcga gtcgcacgcc tccttatgca tctcgtcagg cctcagtttc ccattcccgc 600 cagcagcaca accaccatca tcagcaccaa caccagcatt accactccca caccagctcg 660 actaccagtc gcgccagcat cgaggccgta gtcggtgccg tccccgatcc ctcaggtcac 720 cgagcgccgc cgaaaccccg tcgaccggat cgcaaccact ttggcgcgtc agatcgcagc 780 gcaactccca ccctgtcgca cttcatgagg gcagagtcga gcatgtccat gagacattac 840 gagagcggcc ccttacgctc catgtcgccg aacccctacg gaacccctgc cgccaccacg 900 acgtcgtcca ctgccagaat gccgcacgag cagagccacg atccctacgc ccctcgcggc 960 cactctcgcg atcactcggg gaagagcagc agagacatgg gcaagccccg agctcagaag 1020 aatccctcac agaaggcgat gctctcccgt gccctgcaaa aggccaacac cgcagttcag 1080 ctcgacaatg ctcagaactt cgaaggcgct cgagaagcgt acgccgaggc ttgcgacttg 1140 ttgcagcagg tgcttgaccg aacaccggga gatgaggaca agcggaagct cgaagccatt 1200 gtaagtcacg gcggcaaccg gaatgtcgag cccgttgtct gtcattagta gatcacttgg 1260 aactgacaat ttcaatctgt agcaccaaac ttacaccagc cgcatcgatg agctggatca 1320 gttgggccct tggcaggttg agaccgtcaa ggctctgccg gcgcggccag agagcgagga 1380 gtacagcgcg tccatattca taccccagga ttacgacatg ggcgatgaag ctcccaggat 1440 tgagacggca cgggtggtga gctacatcgc tggagacaac gcgtctccct ttgcagcagc 1500 gcccaaccag tggcagcagt cgggaggtca cacggcatct gaacggctgc agcccaaccg 1560 cggtctggaa ccgggtctgc tacagtcgtc cttctctcgg gccccgaggt cgcccaggcg 1620 gctgcagtcc accgatgatc ttcgcgcaca gcatcaggag ggccagtatg cgcctccccc 1680 actctcgcct cgctcgcagt cgccggtaaa gacgcatgac catgacgacg acatgtttgc 1740 cgaactgcca ccacacgagc cctatcagta ccagcaagag cacgaccatc aagaccacca 1800 tcaagactac catcaacatc accgccatca caaccaccac catcacgaac gacagcccag 1860 cgagactgtc ctatcctcat acgagctcca gggtcatgtg gatggaggaa tccaaaactc 1920 atggctagat ccaattgacg agtcgggagg ctcaacagcg tcgtctgtac actcacgcac 1980 ctcttcgctt ggctaccgtc gacgccatat ccgggccgtg agcgggaaca ccgaggccga 2040 gtttgacacg gcgctggacg ctgctatcga ggctgcctac gacgacggct acgagcccat 2100 ggactctgta gactatggga ccattgatgc tgggggggac aatagcatgg caggcgtatt 2160 gcacaaggtg gagatggcgc gcgaacgagc gagacagacg gagcaggaag cctatgacga 2220 gctggccaac ctccgacagg cgcactcaca gaatccgcag caccagcagg aggaggacag 2280 gtatactgcc gagggattct acgaggacga ctcgtctgaa gaggaggaga gactattgga 2340 cgagattaca cgcgactttg ccattgagga ctttaccatg gaaaacccga atggcacaca 2400 ggtgtcagct aggcagcagg atgcatggaa cgaggacgag acgaggccgg atttcatctc 2460 gggcgtccga tccttttctg ccctgtcgca gaggccaccc attcctcagg cctacgccgc 2520 caacgcctcg cagccagcag ccccccctcc gacatccgca ttgccagacc tgccaccagg 2580 acgccctggt caaaatccaa agcaactcaa gatcgagacg gcaaacattg tacaaaccca 2640 gaagtcggtc tatgacgacg acgaaatctc cccaagcacg caagagccgc cgcccgagac 2700 gctcgtccgg acggcgagcg cgcagcctgt aaggccaccg ataccgacag aaagcttccc 2760 atccgaactc agtgctcccg catcgccaac cgccaagaag aggcttctgg aaggagagaa 2820 tgtgctgaat gcctcgcctt ctatccacag gctacggaag aacttttcgt cttctagctt 2880 gaggagcatg aagaacagga acatgtccgt ctcacatttg gacgacagct cggatgcttc 2940 ccccggcacc cccctgaatg accccttcaa caaggcacct gccgtgcccg tgcccgcgct 3000 gccgaccccc ttgctcgcgt cgttcaaaga tcatatggag gcagcggccg gtgttggctt 3060 ccacctgttt gacgacgagt ttcatgcagc ggcggctgcc ggcccccaaa gcccgcagag 3120 tcccagaagt cccgttgttg tctccatgga cgtccctgtg cctctggaac cctgtccaaa 3180 cgacttcatg ctgcgaccgt tttggctgat gcgatgccta taccagacac ttgtgcatcc 3240 caagggtggc tacatcagta cgaagctatt cgtgccgcga gacgtctggc gggtcaaagg 3300 tgtcaagatc aagaacgtgg aggacaaaat tgccaactgc gactttttga ctgcagccct 3360 gctgaagctg tccaaagtgg acactctgga tgcggatgcc gtgctggagg agatgcaagc 3420 cctcgagggc attctggagc agatacagcc ggtcctggcc cgaaagcttg gaaacgaagt 3480 gggcgttcaa ggttccggtc tgctgttcaa agacgcctcg atgatggaag gagaccccgg 3540 ttcagccgtg ccgcgatcag gaagtgtgtc tggcaaggcg tctgcgtttt cctggcgacg 3600 gcttcggcca aagacgtcgg gcgtcgggct gggagggtcg tacagcagcc gcaacgccag 3660 tgctgagacg aaggaggcct caacgctggc aacggtgccc atgacgccga aaccgacaag 3720 ccgttcggcc aagcgagacg tgagccaggt tcagttcatc gggcccaatg cgagctacat 3780 gggctctctc gcgcgcttgt ttgacgctgc gcaggcagtt ggtaagcata ttgcgatacg 3840 cataccggtt acagtgacgg caagctaacg atgatgcaga tcaaattgca aggcaggtcg 3900 acgaccccgg tttgcggctt gcggacaaga ctcaggtcgg cttggagctc tgcacccggc 3960 acgccgctga gttctttggc ttttacattt gccgattcgt cttggccgac ctcggcctgt 4020 tgctggacaa gttcctcaaa cgaggaagcg aatgggtcat gacatga 4067 <210> 35 <211> 1285 <212> PRT <213> Hypocrea jecorina <400> 35 Met Gln Gln Pro Pro Ser Leu Val Gly Asp Arg Ser Ile Thr Gly Leu 1 5 10 15 Gly Asp Ala Ala Ser Arg Pro Asn Leu Ser Ser Ser Ser Pro Thr Val 20 25 30 Thr Ser Ala Pro Ser Ala Pro Thr Ser Pro Pro Pro Arg Pro Pro Ile 35 40 45 Ser Leu Asn Pro Pro Ser Arg Glu Pro Pro Gly Val Glu Pro Val Leu 50 55 60 Arg Ile Thr Pro Val Pro Arg Ser Val Phe Ala Ser Val His Gln Pro 65 70 75 80 Arg Lys Ser Ser Leu Val Gln Thr Ser His Val Leu Pro Ser Pro Arg 85 90 95 Thr Ala Ala Ala Ala His His His His Pro Val Ser His Ser Ala Ser 100 105 110 Gly Ser Ser Gly Ser Asn Gly Ser Gly Ser Gly Ser Gly Ser Gly Ser 115 120 125 Gly Asn Leu Leu Arg Gln Thr His Arg Asp Thr Val His Pro Pro Val 130 135 140 Lys Arg Pro Ser Thr Pro Ser Ser His Pro Thr Arg Gly Ala Ser Thr 145 150 155 160 Gly Ala Ser Pro Gln Gln Gly Ala Ser Ser Arg Asn Arg Ser Ser Thr 165 170 175 Ser Pro Val Ser Ser Pro Ala Ser Arg Thr Pro Pro Tyr Ala Ser Arg 180 185 190 Gln Ala Ser Val Ser His Ser Arg Gln Gln His Asn His His His Gln 195 200 205 His Gln His Gln His Tyr His Ser His Thr Ser Ser Thr Thr Ser Arg 210 215 220 Ala Ser Ile Glu Ala Val Val Gly Ala Val Pro Asp Pro Ser Gly His 225 230 235 240 Arg Ala Pro Pro Lys Pro Arg Arg Pro Asp Arg Asn His Phe Gly Ala 245 250 255 Ser Asp Arg Ser Ala Thr Pro Thr Leu Ser His Phe Met Arg Ala Glu 260 265 270 Ser Ser Met Ser Met Arg His Tyr Glu Ser Gly Pro Leu Arg Ser Met 275 280 285 Ser Pro Asn Pro Tyr Gly Thr Pro Ala Ala Thr Thr Thr Ser Ser Thr 290 295 300 Ala Arg Met Pro His Glu Gln Ser His Asp Pro Tyr Ala Pro Arg Gly 305 310 315 320 His Ser Arg Asp His Ser Gly Lys Ser Ser Arg Asp Met Gly Lys Pro 325 330 335 Arg Ala Gln Lys Asn Pro Ser Gln Lys Ala Met Leu Ser Arg Ala Leu 340 345 350 Gln Lys Ala Asn Thr Ala Val Gln Leu Asp Asn Ala Gln Asn Phe Glu 355 360 365 Gly Ala Arg Glu Ala Tyr Ala Glu Ala Cys Asp Leu Leu Gln Gln Val 370 375 380 Leu Asp Arg Thr Pro Gly Asp Glu Asp Lys Arg Lys Leu Glu Ala Ile 385 390 395 400 His Gln Thr Tyr Thr Ser Arg Ile Asp Glu Leu Asp Gln Leu Gly Pro 405 410 415 Trp Gln Val Glu Thr Val Lys Ala Leu Pro Ala Arg Pro Glu Ser Glu 420 425 430 Glu Tyr Ser Ala Ser Ile Phe Ile Pro Gln Asp Tyr Asp Met Gly Asp 435 440 445 Glu Ala Pro Arg Ile Glu Thr Ala Arg Val Val Ser Tyr Ile Ala Gly 450 455 460 Asp Asn Ala Ser Pro Phe Ala Ala Ala Pro Asn Gln Trp Gln Gln Ser 465 470 475 480 Gly Gly His Thr Ala Ser Glu Arg Leu Gln Pro Asn Arg Gly Leu Glu 485 490 495 Pro Gly Leu Leu Gln Ser Ser Phe Ser Arg Ala Pro Arg Ser Pro Arg 500 505 510 Arg Leu Gln Ser Thr Asp Asp Leu Arg Ala Gln His Gln Glu Gly Gln 515 520 525 Tyr Ala Pro Pro Pro Leu Ser Pro Arg Ser Gln Ser Pro Gln Glu His 530 535 540 Asp His Gln Asp His His Gln Asp Tyr His Gln His His Arg His His 545 550 555 560 Asn His His His His Glu Arg Gln Pro Ser Glu Thr Val Leu Ser Ser 565 570 575 Tyr Glu Leu Gln Gly His Val Asp Gly Gly Ile Gln Asn Ser Trp Leu 580 585 590 Asp Pro Ile Asp Glu Ser Gly Gly Ser Thr Ala Ser Ser Val His Ser 595 600 605 Arg Thr Ser Ser Leu Gly Tyr Arg Arg Arg His Ile Arg Ala Val Ser 610 615 620 Gly Asn Thr Glu Ala Glu Phe Asp Thr Ala Leu Asp Ala Ala Ile Glu 625 630 635 640 Ala Ala Tyr Asp Asp Gly Tyr Glu Pro Met Asp Ser Val Asp Tyr Gly 645 650 655 Thr Ile Asp Ala Gly Gly Asp Asn Ser Met Ala Gly Val Leu His Lys 660 665 670 Val Glu Met Ala Arg Glu Arg Ala Arg Gln Thr Glu Gln Glu Ala Tyr 675 680 685 Asp Glu Leu Ala Asn Leu Arg Gln Ala His Ser Gln Asn Pro Gln His 690 695 700 Gln Gln Glu Glu Asp Arg Tyr Thr Ala Glu Gly Phe Tyr Glu Asp Asp 705 710 715 720 Ser Ser Glu Glu Glu Glu Arg Leu Leu Asp Glu Ile Thr Arg Asp Phe 725 730 735 Ala Ile Glu Asp Phe Thr Met Glu Asn Pro Asn Gly Thr Gln Val Ser 740 745 750 Ala Arg Gln Gln Asp Ala Trp Asn Glu Asp Glu Thr Arg Pro Asp Phe 755 760 765 Ile Ser Gly Val Arg Ser Phe Ser Ala Leu Ser Gln Arg Pro Pro Ile 770 775 780 Pro Gln Ala Tyr Ala Ala Asn Ala Ser Gln Pro Ala Ala Pro Pro Pro 785 790 795 800 Thr Ser Ala Leu Pro Asp Leu Pro Pro Gly Arg Pro Gly Gln Asn Pro 805 810 815 Lys Gln Leu Lys Ile Glu Thr Ala Asn Ile Val Gln Thr Gln Lys Ser 820 825 830 Val Tyr Asp Asp Asp Glu Ile Ser Pro Ser Thr Gln Glu Pro Pro Pro 835 840 845 Glu Thr Leu Val Arg Thr Ala Ser Ala Gln Pro Val Arg Pro Pro Ile 850 855 860 Pro Thr Glu Ser Phe Pro Ser Glu Leu Ser Ala Pro Ala Ser Pro Thr 865 870 875 880 Ala Lys Lys Arg Leu Leu Glu Gly Glu Asn Val Leu Asn Ala Ser Pro 885 890 895 Ser Ile His Arg Leu Arg Lys Asn Phe Ser Ser Ser Ser Leu Arg Ser 900 905 910 Met Lys Asn Arg Asn Met Ser Val Ser His Leu Asp Asp Ser Ser Asp 915 920 925 Ala Ser Pro Gly Thr Pro Leu Asn Asp Pro Phe Asn Lys Ala Pro Ala 930 935 940 Val Pro Val Pro Ala Leu Pro Thr Pro Leu Leu Ala Ser Phe Lys Asp 945 950 955 960 His Met Glu Ala Ala Ala Gly Val Gly Phe His Leu Phe Asp Asp Glu 965 970 975 Phe His Ala Ala Ala Ala Ala Gly Pro Gln Ser Pro Gln Ser Pro Arg 980 985 990 Ser Pro Val Val Val Ser Met Asp Val Pro Val Pro Leu Glu Pro Cys 995 1000 1005 Pro Asn Asp Phe Met Leu Arg Pro Phe Trp Leu Met Arg Cys Leu Tyr 1010 1015 1020 Gln Thr Leu Val His Pro Lys Gly Gly Tyr Ile Ser Thr Lys Leu Phe 1025 1030 1035 1040 Val Pro Arg Asp Val Trp Arg Val Lys Gly Val Lys Ile Lys Asn Val 1045 1050 1055 Glu Asp Lys Ile Ala Asn Cys Asp Phe Leu Thr Ala Ala Leu Leu Lys 1060 1065 1070 Leu Ser Lys Val Asp Thr Leu Asp Ala Asp Ala Val Leu Glu Glu Met 1075 1080 1085 Gln Ala Leu Glu Gly Ile Leu Glu Gln Ile Gln Pro Val Leu Ala Arg 1090 1095 1100 Lys Leu Gly Asn Glu Val Gly Val Gln Gly Ser Gly Leu Leu Phe Lys 1105 1110 1115 1120 Asp Ala Ser Met Met Glu Gly Asp Pro Gly Ser Ala Val Pro Arg Ser 1125 1130 1135 Gly Ser Val Ser Gly Lys Ala Ser Ala Phe Ser Trp Arg Arg Leu Arg 1140 1145 1150 Pro Lys Thr Ser Gly Val Gly Leu Gly Gly Ser Tyr Ser Ser Arg Asn 1155 1160 1165 Ala Ser Ala Glu Thr Lys Glu Ala Ser Thr Leu Ala Thr Val Pro Met 1170 1175 1180 Thr Pro Lys Pro Thr Ser Arg Ser Ala Lys Arg Asp Val Ser Gln Val 1185 1190 1195 1200 Gln Phe Ile Gly Pro Asn Ala Ser Tyr Met Gly Ser Leu Ala Arg Leu 1205 1210 1215 Phe Asp Ala Ala Gln Ala Val Asp Gln Ile Ala Arg Gln Val Asp Asp 1220 1225 1230 Pro Gly Leu Arg Leu Ala Asp Lys Thr Gln Val Gly Leu Glu Leu Cys 1235 1240 1245 Thr Arg His Ala Ala Glu Phe Phe Gly Phe Tyr Ile Cys Arg Phe Val 1250 1255 1260 Leu Ala Asp Leu Gly Leu Leu Leu Asp Lys Phe Leu Lys Arg Gly Ser 1265 1270 1275 1280 Glu Trp Val Met Thr 1285 <210> 36 <211> 462 <212> DNA <213> Hypocrea jecorina <400> 36 atccacagcg ccagggacgt ccaaatcccc gatagtattc ccagtcgagg accagcagcg 60 attgagtgag tgagtgactg actgagggac gactgaggta ctgacggatc ccagaggaca 120 gcacgacacc gcaccgcacc gctcagcaca ggcccgttgc tgggagtgct gtcgatccgc 180 tgagtggcct ctctctctct ctctgtctct cctccttcgc atcagcctcg tgagcaccgc 240 aaagacagaa gaacccgcca ttgtctcgag gtcatggccg gctgccacac gcgcgcaata 300 catccaatcc cacgactgcg acccccgacc cacgctgtac gagtaagatt ggccggaaga 360 ggcgaccatt ggctgagacg gcagcccgca ccagtccagc aaccgcaact gcaagtgctg 420 cacgtcgtac gaacctgatt tggccatagc cagcgccaga gc 462 <210> 37 <211> 373 <212> DNA <213> Hypocrea jecorina <400> 37 agaaagagaa ggagaccgtt tttttgtcat tgaaagcaag cttgtgtgtt ttatcctatg 60 cgatacctaa tgagcaagag gcgggataat tgatctgaga ttttggtata acgttcatga 120 cgacggaacg atgagaagca gcaaaaggcg cgtttgttcg gaattcagtt gcggacatgc 180 ggcagcctgc tatatatcaa gaggaggttg gctgctttgg tgatccagac atcgaaaggc 240 atacatgtgt gtattttata gtatatatat ctctctcttt cctgaagcgt cttttctctg 300 gaagagacgg gatacatgat cgaacagcaa gcgagaagac atctgaaaga tttaatctga 360 agaaatggtc atg 373 <210> 38 <211> 1343 <212> PRT <213> Hypocrea jecorina <400> 38 Met Ile Glu Asp Thr Ala Ala Leu Ala Ala Ala Ala Glu Leu Ile Ala 1 5 10 15 Ser Leu Ala Cys Asp Pro Ala Ser Ala Ser Ala Ser Ser Ser Leu Val 20 25 30 Ser Val Gly Pro Gly Ser Ser Ile Lys Leu Pro Gly Arg Glu Asn Pro 35 40 45 Ala Lys Arg Thr Leu Glu Ile Glu Leu Glu Lys Leu Val Leu Arg Ile 50 55 60 Ser Gln Leu Glu Ser Arg Ala Ser Ala Ser Ala Asn Ala Ser Val Phe 65 70 75 80 Pro Glu Thr Pro Asn Glu Val Asn Asp Thr Leu Phe Asn Asp Asp Val 85 90 95 Asp Pro Ser Val Asn Gly Arg Pro Pro Val Ala Pro Gln Pro Arg Leu 100 105 110 Ser Gln Ala Gln Gln Gly Ser Leu Asp Ser Pro Ile Phe Val Ser Arg 115 120 125 Gln Leu Thr Lys Glu Ala Leu Gln Gly Leu Arg Asp His Val Asp Asp 130 135 140 Gln Ser Lys Leu Leu Asp Ser Gln Arg Gln Glu Leu Ala Gly Val Asn 145 150 155 160 Ala Gln Leu Leu Glu Gln Lys Gln Leu Gln Glu Arg Ala Leu Ala Met 165 170 175 Leu Glu Gln Glu Arg Val Ala Thr Leu Glu Arg Glu Leu Trp Lys His 180 185 190 Gln Lys Ala Asn Glu Ala Phe Gln Lys Ala Leu Arg Glu Ile Gly Glu 195 200 205 Ile Val Thr Ala Val Ala Arg Gly Asp Leu Thr Met Lys Val Arg Met 210 215 220 Asn Ser Val Glu Met Asp Pro Glu Ile Thr Thr Phe Lys Arg Thr Ile 225 230 235 240 Asn Ala Met Met Asp Gln Leu Gln Thr Phe Ala Ser Glu Val Ser Arg 245 250 255 Val Ala Arg Glu Val Gly Thr Glu Gly Leu Leu Gly Gly Gln Ala Arg 260 265 270 Ile Gly Gly Val Asp Gly Val Trp Lys Glu Leu Thr Asp Asn Val Asn 275 280 285 Ile Met Ala Gln Asn Leu Thr Asp Gln Val Arg Glu Ile Ala Ser Val 290 295 300 Thr Thr Ala Val Ala His Gly Asp Leu Thr Lys Lys Ile Glu Arg Pro 305 310 315 320 Ala Lys Gly Glu Ile Leu Gln Leu Gln Gln Thr Ile Asn Thr Met Val 325 330 335 Asp Gln Leu Arg Thr Phe Ala Ser Glu Val Thr Arg Val Ala Arg Asp 340 345 350 Val Gly Thr Glu Gly Ile Leu Gly Gly Gln Ala Asp Val Gly Gly Val 355 360 365 Lys Gly Met Trp Asn Asp Leu Thr Val Asn Val Asn Ala Met Ala Asn 370 375 380 Asn Leu Thr Thr Gln Val Arg Asp Ile Ile Lys Val Thr Thr Ala Val 385 390 395 400 Ala Lys Gly Asp Leu Thr Gln Lys Val Gln Ala Glu Cys Arg Gly Glu 405 410 415 Met Phe Lys Leu Lys Ser Thr Ile Asn Ser Met Val Asp Gln Leu Gln 420 425 430 Gln Phe Ala Arg Glu Val Thr Lys Ile Ala Arg Glu Val Gly Thr Glu 435 440 445 Gly Arg Leu Gly Gly Gln Ala Thr Val His Asp Val Glu Gly Thr Trp 450 455 460 Arg Asp Leu Thr Glu Asn Val Asn Gly Met Ala Met Asn Leu Thr Thr 465 470 475 480 Gln Val Arg Glu Ile Ala Lys Val Thr Thr Ala Val Ala Arg Gly Asp 485 490 495 Leu Thr Lys Lys Ile Gly Val Glu Val Lys Gly Glu Ile Leu Glu Leu 500 505 510 Lys Asn Thr Ile Asn Gln Met Val Asp Arg Leu Gly Thr Phe Ala Val 515 520 525 Glu Val Ser Lys Val Ala Arg Glu Val Gly Thr Asp Gly Thr Leu Gly 530 535 540 Gly Gln Ala Gln Val Ala Asn Val Glu Gly Lys Trp Lys Asp Leu Thr 545 550 555 560 Glu Asn Val Asn Thr Met Ala Ser Asn Leu Thr Val Gln Val Arg Ser 565 570 575 Ile Ser Ala Val Thr Gln Ala Ile Ala Asn Gly Asp Met Ser Gln Thr 580 585 590 Ile Asp Val Glu Ala Asn Gly Glu Ile Gln Val Leu Lys Glu Thr Ile 595 600 605 Asn Asn Met Val Ser Arg Leu Ser Ser Phe Cys Tyr Glu Val Gln Arg 610 615 620 Val Ala Lys Asp Val Gly Val Asp Gly Lys Met Gly Ala Gln Ala Asp 625 630 635 640 Val Ala Gly Leu Asn Gly Arg Trp Lys Glu Ile Thr Thr Asp Val Asn 645 650 655 Thr Met Ala Ser Asn Leu Thr Thr Gln Val Arg Ala Phe Ser Asp Ile 660 665 670 Thr Asn Leu Ala Thr Asp Gly Asp Phe Thr Lys Leu Val Asp Val Glu 675 680 685 Ala Ser Gly Glu Met Asp Glu Leu Lys Lys Lys Ile Asn Gln Met Ile 690 695 700 Ser Asn Leu Arg Asp Ser Ile Gln Arg Asn Thr Gln Ala Arg Glu Ala 705 710 715 720 Ala Glu Leu Ala Asn Lys Thr Lys Ser Glu Phe Leu Ala Asn Met Ser 725 730 735 His Glu Ile Arg Thr Pro Met Asn Gly Ile Ile Gly Met Thr Gln Leu 740 745 750 Thr Leu Asp Thr Asp Leu Thr Gln Tyr Gln Arg Glu Met Leu Asn Ile 755 760 765 Val Asn Asp Leu Ala Asn Ser Leu Leu Thr Ile Ile Asp Asp Ile Leu 770 775 780 Asp Leu Ser Lys Ile Glu Ala Arg Arg Met Val Ile Glu Glu Ile Pro 785 790 795 800 Tyr Thr Leu Arg Gly Thr Val Phe Asn Ala Leu Lys Thr Leu Ala Val 805 810 815 Lys Ala Asn Glu Lys Phe Leu Asp Leu Thr Tyr Lys Val Asp Ser Ser 820 825 830 Val Pro Asp Tyr Val Ile Gly Asp Ser Phe Arg Leu Arg Gln Ile Ile 835 840 845 Leu Asn Leu Val Gly Asn Ala Ile Lys Phe Thr Glu His Gly Glu Val 850 855 860 Ser Leu Thr Ile Gln Glu Gln Glu Asp Lys Arg His Val Gly Pro Gly 865 870 875 880 Glu Tyr Ala Ile Glu Phe Ile Val Glu Asp Thr Gly Ile Gly Ile Ala 885 890 895 Lys Asp Lys Leu Asn Leu Ile Phe Asp Thr Phe Gln Gln Ala Asp Gly 900 905 910 Ser Met Thr Arg Lys Phe Gly Gly Thr Gly Leu Gly Leu Ser Ile Ser 915 920 925 Lys Arg Phe Val Asn Leu Met Gly Gly Asp Leu Trp Val Asn Ser Glu 930 935 940 Val Gly Lys Gly Ser Glu Phe His Phe Thr Cys Arg Val Lys Leu Ala 945 950 955 960 Asp Val His Ala Glu Ser Val Gln Gln Gln Leu Lys Pro Tyr Arg Gly 965 970 975 His Gln Val Leu Phe Val Asp Lys Ser Gln Ser Asn Ala Ala Thr His 980 985 990 Ile Gly Glu Met Leu Glu Glu Ile Gly Leu His Pro Val Val Val Asn 995 1000 1005 Ser Glu Lys Ser Ser Ala Leu Thr Arg Leu Lys Glu Gly Gly Ala Leu 1010 1015 1020 Pro Tyr Asp Ala Ile Ile Val Asp Ser Ile Asp Thr Ala Arg Arg Leu 1025 1030 1035 1040 Arg Ala Val Asp Asp Phe Lys Tyr Leu Pro Ile Val Leu Leu Ala Pro 1045 1050 1055 Val Val His Val Ser Leu Lys Ser Cys Leu Asp Leu Gly Ile Thr Ser 1060 1065 1070 Tyr Met Thr Met Pro Cys Lys Leu Ile Asp Leu Ser Asn Gly Met Ile 1075 1080 1085 Pro Ala Leu Glu Asn Arg Ala Thr Pro Ser Leu Ala Asp Val Thr Lys 1090 1095 1100 Ser Phe Glu Ile Leu Leu Ala Glu Asp Asn Thr Val Asn Gln Lys Leu 1105 1110 1115 1120 Ala Val Lys Ile Leu Glu Lys Tyr His His Val Val Thr Val Val Gly 1125 1130 1135 Asn Gly Trp Glu Ala Val Glu Ala Val Lys Gln Lys Lys Phe Asp Val 1140 1145 1150 Ile Leu Met Asp Val Gln Met Pro Ile Met Gly Gly Phe Glu Ala Thr 1155 1160 1165 Gly Lys Ile Arg Glu Tyr Glu Arg Gly Met Gly Thr His Arg Thr Pro 1170 1175 1180 Ile Ile Ala Leu Thr Ala His Ala Met Met Gly Asp Arg Glu Lys Cys 1185 1190 1195 1200 Ile Gln Ala Gln Met Asp Glu Tyr Leu Ser Lys Pro Leu Gln Gln Asn 1205 1210 1215 Gln Leu Ile Gln Thr Ile Leu Lys Cys Ala Thr Leu Gly Gly Ala Leu 1220 1225 1230 Leu Glu Lys Asn Arg Glu Arg Glu Leu Ala Leu Gln Ala Glu Ala Lys 1235 1240 1245 Ala Ser Gly Arg Leu Asp Gly Glu Arg Gly Met Leu Arg Pro Gly Leu 1250 1255 1260 Glu Gly Arg Ser Phe Thr Thr Arg Glu Pro Met Thr Lys Ser Arg Pro 1265 1270 1275 1280 Ser Leu Thr Lys Ala Thr Ser Lys Ala Leu Glu Glu Ala Arg Asn Ala 1285 1290 1295 Ala Ala Ala Asn Ala Gly Leu Arg Phe Ser Glu Leu Thr Gly Phe Ser 1300 1305 1310 Ala Asp Leu Met Glu Glu Leu Asp Asn Met Glu Asp Glu Asp Ser Phe 1315 1320 1325 Thr Lys Ala Arg Glu Asp Leu Ala Asp Arg Arg Ser Leu Ser Ser 1330 1335 1340

Claims (31)

  1. 모 균주로부터 유래된 사상성 진균(filamentous fungus)의 변이체 균주로서, 변이체 균주는 서열 번호 2, 서열 번호 8, 서열 번호 9, 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 31, 서열 번호 33 또는 서열 번호 35와 약 50%의 서열 동일성을 포함하는 SSB7 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 변이체 균주의 세포는 모 세포에 비해 점도 감소 표현형을 포함하는, 변이체 균주.
  2. 제1항에 있어서, 변이체 균주는 액침 배양(submerged culture)에서의 호기성 발효 동안 (i) 모 균주의 세포에 비해 미리 선택된 용존 산소 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스를 생성하고/하거나, (ii) 모 균주의 세포에 비해 미리 선택된 양의 교반에서 증가한 용존 산소 함량을 유지시키는 세포 브로스를 생성하는, 변이체 균주.
  3. 제1항에 있어서, SSB7 단백질을 암호화하는 유전자의 유전자 변형은 SSB7 단백질을 암호화하는 유전자의 적어도 3' 영역을 결실시키거나 파괴시키는 것을 포함하는, 변이체 균주.
  4. 제1항에 있어서, 관심 단백질을 암호화하는 유전자를 추가로 포함하는, 변이체 균주.
  5. 제4항에 있어서, 변이체 균주는 바이오매스의 단위량당 모 균주와 실질적으로 동일한 양의 관심 단백질을 생산하는, 변이체 균주.
  6. 제4항에 있어서, 변이체 균주는 바이오매스의 단위량당 모 균주보다 더 많은 관심 단백질을 생산하는, 변이체 균주.
  7. 제1항에 있어서, 사상성 진균은 자낭균류(Ascomycota) 문인, 변이체 균주.
  8. 제1항에 있어서, 사상성 진균은 트리코데르마 종(Trichoderma sp.) 진균, 푸사륨 종(Fusarium sp.) 진균, 뉴로스포라 종(Neurospora sp.) 진균, 마이셀리오프토라 종(Myceliophthora sp.) 진균, 탈라로마이세스 종(Talaromyces sp.) 진균, 아스페르길루스 종(Aspergillus sp.) 진균 및 페니실륨 종(Penicillium sp.) 진균으로 이루어진 군으로부터 선택되는, 변이체 균주.
  9. 제4항의 변이체 균주에 의해 생산된 관심 단백질.
  10. 제1항에 있어서, MPG1 단백질, SFB3 단백질, SEB1 단백질, CRZ1 단백질 및/또는 GAS1 단백질을 암호화하는 하나 이상의 유전자의 유전자 변형을 추가로 포함하는, 변이체 균주.
  11. 제1항에 있어서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 1의 ssb7 유전자 또는 이의 상보성 서열과 혼성화하는, 변이체 균주.
  12. 제1항에 있어서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 19, 서열 번호 20 또는 서열 번호 21의 ssb7 엑손 또는 이의 상보성 서열과 혼성화하는, 변이체 균주.
  13. 제1항에 있어서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 22의 영역 A, 서열 번호 23의 영역 B, 서열 번호 24의 영역 C 또는 서열 번호 25의 영역 D를 암호화하는 핵산 서열 또는 이의 상보성 서열과 혼성화하는, 변이체 균주.
  14. 제1항에 있어서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 SSB7 단백질의 보존된 아미노산 서열을 암호화하는 핵산 서열 또는 이의 상보성 서열과 혼성화하고, 보존된 서열은 서열 번호 26 내지 30으로 이루어진 군으로부터 선택되는, 변이체 균주.
  15. 사상성 진균 세포의 점도 감소 균주를 작제하는 방법으로서,
    (a) 사상성 진균 세포의 모 균주를 수득하고, 서열 번호 2, 서열 번호 8, 서열 번호 9, 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 31, 서열 번호 33 또는 서열 번호 35와 적어도 50%의 서열 동일성을 포함하는 SSB7 단백질을 암호화하는 유전자를 유전자 변형시키는 단계, 및
    (b) 단계 (a)에서 생산된 변이체 균주를 단리시키는 단계이되, 변이체 균주의 세포는 모 세포에 비해 점도 감소 표현형을 포함하는 단계를 포함하는, 방법.
  16. 제15항에 있어서, 변이체 균주는 액침 배양에서의 호기성 발효 동안 (a) 모 균주의 세포에 비해 미리 선택된 용존 산소 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스를 생성하고/하거나, (b) 모 균주의 세포에 비해 미리 선택된 양의 교반에서 증가한 용존 산소 함량을 유지시키는 세포 브로스를 생성하는, 방법.
  17. 제15항에 있어서, SSB7 단백질을 암호화하는 유전자의 유전자 변형은 SSB7 단백질을 암호화하는 유전자의 적어도 3' 영역을 결실시키거나 파괴시키는 것을 포함하는, 방법.
  18. 제15항에 있어서, 진균 세포는 관심 단백질을 암호화하는 유전자를 추가로 포함하는, 방법.
  19. 제18항에 있어서, 변이체 균주는 바이오매스의 단위량당 모 균주와 실질적으로 동일한 양의 관심 단백질을 생산하는, 방법.
  20. 제18항에 있어서, 변이체 균주는 바이오매스의 단위량당 모 균주보다 더 많은 관심 단백질을 생산하는, 방법.
  21. 제18항에 있어서, 사상성 진균은 자낭균류 문인, 방법.
  22. 제18항에 있어서, 사상성 진균은 트리코데르마 종 진균, 푸사륨 종 진균, 뉴로스포라 종 진균, 마이셀리오프토라 종 진균, 탈라로마이세스 종 진균, 아스페르길루스 종 진균 및 페니실륨 종 진균으로 이루어진 군으로부터 선택되는, 방법.
  23. 제18항의 방법에 따라 생산된 관심 단백질.
  24. 제15항에 있어서, MPG1 단백질, SFB3 단백질, SEB1 단백질, CRZ1 단백질 및/또는 GAS1 단백질을 암호화하는 하나 이상의 유전자의 유전자 변형을 추가로 포함하는, 방법.
  25. 제15항에 있어서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 1의 ssb7 유전자 또는 이의 상보성 서열과 혼성화하는, 방법.
  26. 제15항에 있어서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 19, 서열 번호 20 또는 서열 번호 21의 ssb7 엑손 또는 이의 상보성 서열과 혼성화하는, 방법.
  27. 제15항에 있어서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 서열 번호 22의 영역 A, 서열 번호 23의 영역 B, 서열 번호 24의 영역 C 또는 서열 번호 25의 영역 D를 암호화하는 핵산 서열 또는 이의 상보성 서열과 혼성화하는, 방법.
  28. 제15항에 있어서, SSB7 단백질을 암호화하는 유전자는 엄격한 혼성화 조건 하에 SSB7 단백질의 보존된 아미노산 서열을 암호화하는 핵산 서열 또는 이의 상보성 서열과 혼성화하고, 보존된 서열은 서열 번호 26 내지 30으로 이루어진 군으로부터 선택되는, 방법.
  29. 점도 감소 표현형을 포함하는 사상성 진균 세포의 변이체 균주를 스크리닝하고 단리시키는 방법으로서,
    (a) 서열 번호 2, 서열 번호 8, 서열 번호 9, 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 31, 서열 번호 33 또는 서열 번호 35와 적어도 50%의 서열 동일성을 포함하는 SSB7 단백질을 암호화하는 모 진균 균주에서의 유전자를 유전자 변형시키는 단계,
    (b) 모 균주의 세포 형태에 대하여 점도 감소 표현형을 위해 단계 (a)의 변형된 변이체 균주의 세포 형태를 스크리닝하는 단계, 및
    (c) 점도 감소 표현형을 포함하는 단계 (b)의 변형된 변이체 균주를 단리시키는 단계를 포함하는, 방법.
  30. 제29항에 있어서, 변이체 균주는 액침 배양에서의 호기성 발효 동안 (a) 모 균주의 세포에 비해 미리 선택된 용존 산소 함량을 유지시키기 위해 감소한 양의 교반을 요하는 세포 브로스를 생성하고/하거나, (b) 모 균주의 세포에 비해 미리 선택된 양의 교반에서 증가한 용존 산소 함량을 유지시키는 세포 브로스를 생성하는, 방법.
  31. 제29항에 있어서, 점도 감소 표현형을 포함하는 단계 (c)의 변이체 균주는 모 균주에 비해 더 짧은 균사 필라멘트를 포함하는, 방법.

KR1020207032226A 2018-04-24 2019-04-16 점도 감소 표현형을 포함하는 사상성 진균 균주 KR20210005054A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862661658P 2018-04-24 2018-04-24
US62/661,658 2018-04-24
PCT/US2019/027590 WO2019209576A1 (en) 2018-04-24 2019-04-16 Filamentous fungal strains comprising reduced viscosity phenotypes

Publications (1)

Publication Number Publication Date
KR20210005054A true KR20210005054A (ko) 2021-01-13

Family

ID=66647442

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207032226A KR20210005054A (ko) 2018-04-24 2019-04-16 점도 감소 표현형을 포함하는 사상성 진균 균주

Country Status (6)

Country Link
US (1) US11976266B2 (ko)
EP (1) EP3755710A1 (ko)
JP (1) JP7376505B2 (ko)
KR (1) KR20210005054A (ko)
CN (1) CN112074530A (ko)
WO (1) WO2019209576A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220057464A (ko) * 2020-10-29 2022-05-09 씨제이제일제당 (주) 점액질 생성능이 저감된 미생물 및 이를 이용한 대두 발효물
EP4015642A1 (en) * 2020-12-16 2022-06-22 Clariant Produkte (Deutschland) GmbH Process for the production of a filamentous fungus whole broth enzyme composition with low biomass formation and high protein yield
EP4015641A1 (en) * 2020-12-16 2022-06-22 Clariant Produkte (Deutschland) GmbH Process for the production of a filamentous fungus whole broth enzyme composition with low biomass formation and high protein yield
EP4015640A1 (en) * 2020-12-16 2022-06-22 Clariant Produkte (Deutschland) GmbH Process for the production of a filamentous fungus whole broth enzyme composition with low viscosity
CN112592941B (zh) * 2020-12-31 2023-06-27 河南巨龙生物工程股份有限公司 一种降低l-组氨酸发酵液粘度的方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1380905A (zh) 2000-04-13 2002-11-20 马克·阿龙·埃马尔法尔布 丝状真菌中dna表达文库的高通量筛选
KR102004003B1 (ko) 2010-08-25 2019-07-25 다니스코 유에스 인크. 변경된 점성 표현형을 갖는 사상균
US9587242B2 (en) 2011-04-22 2017-03-07 Danisco Us Inc. Filamentous fungi having an altered viscosity phenotype
BR112013025430A2 (pt) 2011-04-22 2016-11-29 Danisco Us Inc "cepas variantes de fundos filamentosos tendo modificação genética para maior produção de proteína mpg1 e crescimento alterado e seu método de produção".
CN107223157B (zh) 2014-12-16 2021-01-08 丹尼斯科美国公司 用于辅助菌株介导的真菌基因组修饰的组合物和方法
AU2015362784B2 (en) 2014-12-16 2021-05-13 Danisco Us Inc Fungal genome modification systems and methods of use
CN108064267A (zh) 2015-02-09 2018-05-22 丹尼斯科美国公司 真菌菌株及使用方法

Also Published As

Publication number Publication date
JP2021521821A (ja) 2021-08-30
EP3755710A1 (en) 2020-12-30
US20210017487A1 (en) 2021-01-21
JP7376505B2 (ja) 2023-11-08
US11976266B2 (en) 2024-05-07
WO2019209576A1 (en) 2019-10-31
CN112074530A (zh) 2020-12-11

Similar Documents

Publication Publication Date Title
KR20210005054A (ko) 점도 감소 표현형을 포함하는 사상성 진균 균주
JP6725513B2 (ja) ヘルパー株媒介型真菌ゲノム改変用の組成物および方法
KR20170087521A (ko) 진균 게놈 변형 시스템 및 사용 방법
KR101952469B1 (ko) 변경된 점성 표현형을 갖는 사상균
JP2018525983A (ja) ゲノム編集システムおよび使用方法
CN113366108A (zh) 新颖启动子序列及其增强芽孢杆菌属细胞蛋白生产的方法
KR20140033053A (ko) 변경된 점성 표현형을 갖는 사상균
RU2608639C2 (ru) Мицелиальные грибы, имеющие фенотип измененной вязкости
KR20220097451A (ko) 향상된 단백질 생산성 표현형을 포함하는 진균 균주 및 이의 방법
JP2021510070A (ja) タンパク質の産生増加のための変異及び遺伝子改変バチルス属(bacillus)細胞、並びにその方法
US20230174998A1 (en) Compositions and methods for enhanced protein production in filamentous fungal cells
US12116605B2 (en) Mutant and genetically modified filamentous fungal strains comprising enhanced protein productivity phenotypes and methods thereof
WO2024102556A1 (en) Filamentous fungal strains comprising enhanced protein productivity phenotypes and methods thereof
KR20240110854A (ko) 진균 세포에서의 향상된 단백질 생산을 위한 조성물 및 방법
US9765322B2 (en) Pectin degrading enzymes from macrophomina phaseolina and uses thereof

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal