KR20230023751A

KR20230023751A - 단백질의 제조법

Info

Publication number: KR20230023751A
Application number: KR1020237001139A
Authority: KR
Inventors: 노부히사 니타; 히로아키 후카다; 가즈타카 심보; 아키코 마쓰다이라; 도시키 와타나베; 요시히로 우스다
Original assignee: 아지노모토 가부시키가이샤
Priority date: 2020-06-11
Filing date: 2021-06-08
Publication date: 2023-02-17
Also published as: US20230212503A1; CN115836127A; EP4166647A1; JPWO2021251383A1; AU2021289499A1; WO2021251383A1

Abstract

단백질의 제조법을 제공한다. Pep4 단백질의 활성이 저하되도록 개변된, 목적 단백질 생산능을 갖는 탈라로마이세스 셀룰롤리티쿠스(Talaromyces cellulolyticus)를 배지에서 배양함으로써, 목적 단백질을 제조한다.

Description

단백질의 제조법

본 발명은, 단백질의 제조법에 관한 것이다.

단백질의 제조법으로서는, 코리네형 세균, 바실루스속 세균, 효모, 사상균 등의 각종 미생물을 사용한 것이 보고되어 있다.

예를 들면, 비특허문헌 1에는, 사상균 탈라로마이세스 셀룰롤리티쿠스(Talaromyces cellulolyticus)(구명(舊名): 아크레모늄 셀룰롤리티쿠스(Acremonium cellulolyticus))를 사용한 숙주 유래의 셀룰라아제의 생산이 개시되어 있다. 또한, 특허문헌 1에는, 사상균을 사용한 항체의 생산이 개시되어 있다. 또한, 특허문헌 2에는, 탈라로마이세스 셀룰롤리티쿠스 등의 사상균을 사용한 내강을 갖는 다량체 단백질의 생산이 개시되어 있다.

또한, 특허문헌 3 내지 4에는, 내재성 프로테아제의 활성이 약화된 사상균을 사용한 이종 단백질의 생산이 개시되어 있다. 또한, 특허문헌 5에는, 내재성 알칼리 프로테아제의 활성이 약화된 사상균을 사용한 이종 단백질의 생산이 개시되어 있다.

또한, 특허문헌 6에는, 카복시펩티다아제 yscα 활성이 결여된 효모를 사용한 이종 단백질의 생산이 개시되어 있다. 이 문헌에는, 이 효모는, 또한, yscA, yscB, yscY, 및 yscS로부터 선택되는 펩티다아제 활성이 결여되어 있어도 좋다는 취지의 기재가 있다.

또한, 특허문헌 7에는, 프로테아제 YscB의 활성이 저하되도록 개변(改變)된 탈라로마이세스 셀룰롤리티쿠스를 사용한 단백질의 생산이 개시되어 있다.

그러나, 탈라로마이세스 셀룰롤리티쿠스에서의 Pep4 단백질과 단백질 생산과의 관계는 알려져 있지 않다.

특허문헌 1: 일본 공표특허공보 특표2006-512891호 특허문헌 2: 일본 공개특허공보 특개2016-158599호 특허문헌 3: 일본 공표특허공보 특표2015-512611호 특허문헌 4: 일본 공표특허공보 특표2016-523552호 특허문헌 5: 일본 공표특허공보 특표2000-507106호 특허문헌 6: 일본 공개특허공보 특개1990-104279호 특허문헌 7: WO2019/073954호

비특허문헌 1: Inoue H, et al., Construction of a starch-inducible homologous expression system to produce cellulolytic enzymes from Acremonium cellulolyticus. J Ind Microbiol Biotechnol. 2013 Aug; 40(8): 823-30.

본 발명은, 단백질의 제조법을 제공하는 것을 목적으로 한다.

본 발명자들은, 상기 과제를 해결하기 위해 예의 연구를 행한 결과, Pep4 단백질의 활성이 저하되도록 탈라로마이세스 셀룰롤리티쿠스를 개변함으로써, 탈라로마이세스 셀룰롤리티쿠스의 단백질 생산능이 향상되는 것을 발견하고, 본 발명을 완성시켰다.

즉, 본 발명은 이하와 같이 예시할 수 있다.

[1]

목적 단백질의 제조 방법으로서,

목적 단백질의 생산능을 갖는 탈라로마이세스 셀룰롤리티쿠스(Talaromyces cellulolyticus)를 배지에서 배양하는 것,

을 포함하고,

상기 탈라로마이세스 셀룰롤리티쿠스가, 비개변주(非改變株)와 비교하여 Pep4 단백질의 활성이 저하되도록 개변되어 있는, 방법.

[2]

상기 Pep4 단백질의 활성이, pep4 유전자의 발현을 저하시킴으로써, 또는 pep4 유전자를 파괴함으로써, 저하된, 상기 방법.

[3]

상기 Pep4 단백질의 활성이, pep4 유전자의 결실에 의해 저하된, 상기 방법.

[4]

상기 Pep4 단백질이, 하기 (a), (b), 또는 (c)에 기재된 단백질인, 상기 방법:

(a) 서열번호 71에 나타내는 아미노산 서열을 포함하는 단백질;

(b) 서열번호 71에 나타내는 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입, 및/또는 부가를 포함하는 아미노산 서열을 포함하고, 또한, 프로테아제 활성을 갖는 단백질;

(c) 서열번호 71에 나타내는 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, 또한, 프로테아제 활성을 갖는 단백질.

[5]

상기 탈라로마이세스 셀룰롤리티쿠스가, 추가로, 비개변주와 비교하여 YscB 단백질 및/또는 CreA 단백질의 활성이 저하되도록 개변되어 있는, 상기 방법.

[6]

상기 YscB 단백질 및/또는 상기 CreA 단백질의 활성이, yscB 유전자 및/또는 creA 유전자의 발현을 저하시킴으로써, 또는 yscB 유전자 및/또는 creA 유전자를 파괴함으로써, 저하된, 상기 방법.

[7]

상기 YscB 단백질 및/또는 상기 CreA 단백질의 활성이, yscB 유전자 및/또는 creA 유전자의 결실에 의해 저하된, 상기 방법.

[8]

상기 탈라로마이세스 셀룰롤리티쿠스가, 탈라로마이세스 셀룰롤리티쿠스 S6-25주(NITE BP-01685)로부터 유래하는 개변주인, 상기 방법.

[9]

추가로, 목적 단백질을 회수하는 것을 포함하는, 상기 방법.

[10]

상기 배양에 의해 목적 단백질이 상기 배지 중에 축적되는, 상기 방법.

[11]

목적 단백질이, 탈라로마이세스 셀룰롤리티쿠스에서 기능하는 시그널 펩티드와의 융합 단백질로서 발현되는, 상기 방법.

[12]

목적 단백질이, 이종 단백질인, 상기 방법.

[13]

목적 단백질이, 인간 유래 단백질인, 상기 방법.

[14]

목적 단백질이, 항체 관련 분자인, 상기 방법.

[도 1] T. cellulolyticus 대조주 및 Δpep4주의 배양액 상청에 의한 트라스투주맙(Trastuzumab) 분해의 결과를 나타내는 도면(사진).
[도 2] T. cellulolyticus F09 ΔyscB주 유래 트라스투주맙 발현주 및 그 pep4 유전자 파괴주에 의한 트라스투주맙 생산의 결과를 나타내는 도면(사진).

이하, 본 발명을 상세하게 설명한다.

본 발명의 방법은, 탈라로마이세스 셀룰롤리티쿠스(Talaromyces cellulolyticus)를 이용한 목적 단백질의 제조 방법이다. 이 방법에 이용되는 탈라로마이세스 셀룰롤리티쿠스를 「본 발명의 미생물」이라고도 한다.

<1> 본 발명의 미생물

본 발명의 미생물은, Pep4 단백질의 활성이 저하되도록 개변된, 목적 단백질 생산능을 갖는 탈라로마이세스 셀룰롤리티쿠스이다. 또한, 본 발명의 미생물의 설명에 있어서, 본 발명의 미생물 또는 이것을 구축하기 위해 사용되는 탈라로마이세스 셀룰롤리티쿠스를 「숙주」라고 하는 경우가 있다.

<1-1> 탈라로마이세스 셀룰롤리티쿠스

본 발명의 미생물은, 탈라로마이세스 셀룰롤리티쿠스이다. 탈라로마이세스 셀룰롤리티쿠스의 구명은, 아크레모늄 셀룰롤리티쿠스(Acremonium cellulolyticus)이다. 즉, 아크레모늄 셀룰롤리티쿠스는, 계통 분류의 개정(改訂)에 의해, 탈라로마이세스 셀룰롤리티쿠스로 재분류되었다(FEMS Microbiol. Lett., 2014, 351:32-41). 탈라로마이세스 셀룰롤리티쿠스로서, 구체적으로는, C1주(특개2003-135052), CF-2612주(특개2008-271927), TN주(FERM BP-685), S6-25주(NITE BP-01685), Y-94주(FERM BP-5826, CBS 136886), 및 이들의 파생주를 들 수 있다. 또한, 「탈라로마이세스 셀룰롤리티쿠스」란, 본원의 출원 전, 출원시, 및 출원 후 중 적어도 어느 시점에서 탈라로마이세스 셀룰롤리티쿠스로 분류되는 진균을 총칭한다. 즉, 예를 들면, 상기 예시한 균주 등의 탈라로마이세스 셀룰롤리티쿠스로 일단 분류된 균주는, 만일 장래적으로 계통 분류가 변경된 경우에도, 탈라로마이세스 셀룰롤리티쿠스에 속하는 것으로서 취급하는 것으로 한다.

S6-25주는, 2013년 8월 8일에, 독립행정법인 제품평가기술기반기구 특허 미생물 기탁 센터(우편번호 292-0818, 일본국 치바켄 키사라즈 카즈사카마타리 2-5-8 122호실)에 원기탁되어, 2013년 11월 15일에, 부다페스트 조약에 기초한 국제 기탁으로 이관되어, 수탁 번호 NITE BP-01685가 부여되어 있다. S6-25주는, TN주(FERM BP-685)로부터 얻어진 주이며, 높은 셀룰라아제 생산능을 갖는다. TN주는, Y-94주(FERM BP-5826, CBS 136886)로부터 얻어진 주이다(특개2011-193773).

이러한 균주는, 예를 들면, 각 균주가 기탁된 기탁 기관으로부터 입수할 수 있다. 또한, Y-94주는, 예를 들어, CBS-KNAW Collections(Netherlands)로부터 입수할 수 있다.

본 발명의 미생물은, 상기 예시한 균주 등의 탈라로마이세스 셀룰롤리티쿠스를 개변함으로써 취득할 수 있다. 즉, 본 발명의 미생물은, 예를 들면, 상기 예시한 균주로부터 유래하는 개변주라도 좋다. 본 발명의 미생물은, 구체적으로는, 예를 들면, S6-25주 또는 Y-94주로부터 유래하는 개변주라도 좋다. 본 발명의 미생물은, 보다 구체적으로는, 예를 들면, S6-25주로부터 유래하는 개변주라도 좋다. 본 발명의 미생물을 구축하기 위한 개변의 실시 순서는 특별히 제한되지 않는다.

<1-2> 목적 단백질 생산능

본 발명의 미생물은, 목적 단백질 생산능을 갖는다. 「목적 단백질 생산능을 갖는 미생물」이란, 목적 단백질을 생산하는 능력을 갖는 미생물을 말한다. 「목적 단백질 생산능을 갖는 미생물」이란, 구체적으로는, 배지에서 배양했을 때에, 목적 단백질을 발현하고, 회수할 수 있는 정도로 배양물 중에 축적하는 능력을 갖는 미생물이라도 좋다. 「배양물 중으로의 축적」이란, 구체적으로는, 배지 중, 균체 표층, 균체 내, 또는 이들의 조합으로의 축적이라도 좋다. 또한, 목적 단백질이 균체 외(예를 들면, 배지 중이나 세포 표층)에 축적되는 경우를, 목적 단백질의 「분비」 또는 「분비 생산」이라고도 한다. 즉, 본 발명의 미생물은, 목적 단백질의 분비 생산능(목적 단백질을 분비 생산하는 능력)을 갖고 있어도 좋다. 목적 단백질은, 특히, 배지 중에 축적되어도 좋다. 목적 단백질의 축적량은, 예를 들면, 배양물 중으로의 축적량으로서, 10㎍/L 이상, 1mg/L 이상, 100mg/L 이상, 또는 1g/L 이상이라도 좋다. 본 발명의 미생물은, 1종의 목적 단백질의 생산능을 갖고 있어도 좋고, 2종 또는 그 이상의 목적 단백질의 생산능을 갖고 있어도 좋다.

본 발명의 미생물은, 본래적으로 목적 단백질 생산능을 갖는 것이라도 좋고, 목적 단백질 생산능을 갖도록 개변된 것이라도 좋다. 본 발명의 미생물은, 전형적으로는, 본래적으로 셀룰라아제 생산능(셀룰라아제를 생산하는 능력)을 갖는 것일 수 있다. 또한, 본 발명의 미생물은, 본래적으로 갖는 목적 단백질 생산능이 증강되도록 개변된 것이라도 좋다. 목적 단백질 생산능을 갖는 미생물은, 예를 들면, 상기와 같은 탈라로마이세스 셀룰롤리티쿠스에 목적 단백질 생산능을 부여함으로써, 또는, 상기와 같은 탈라로마이세스 셀룰롤리티쿠스의 목적 단백질 생산능을 증강함으로써, 취득할 수 있다. 목적 단백질 생산능은, 예를 들어, 목적 단백질의 발현용 유전자 구축물의 도입, 기타 목적 단백질 생산능이 향상되는 개변의 도입, 또는 이들의 조합에 의해, 부여 또는 증강할 수 있다.

본 발명의 미생물은, 적어도 목적 단백질의 발현용 유전자 구축물을 갖는 것에 의거하여, 목적 단백질 생산능을 갖는다. 본 발명의 미생물은, 구체적으로는, 목적 단백질의 발현용 유전자 구축물을 가짐으로써, 혹은 목적 단백질의 발현용 유전자 구축물을 갖는 것과 다른 성질의 조합에 의해, 목적 단백질 생산능을 갖고 있어도 좋다. 즉, 본 발명의 미생물은, 목적 단백질의 발현용 유전자 구축물을 갖는다. 본 발명의 미생물은, 1카피의 목적 단백질의 발현용 유전자 구축물을 갖고 있어도 좋고, 2카피 또는 그 이상의 목적 단백질의 발현용 유전자 구축물을 갖고 있어도 좋다. 본 발명의 미생물은, 1종의 목적 단백질의 발현용 유전자 구축물을 갖고 있어도 좋고, 2종 또는 그 이상의 목적 단백질의 발현용 유전자 구축물을 갖고 있어도 좋다. 목적 단백질의 발현용 유전자 구축물의 카피수 및 종류수는, 각각, 목적 단백질 유전자의 카피수 및 종류수로 바꿔 읽어도 좋다.

본 발명의 미생물에 있어서, 목적 단백질의 발현용 유전자 구축물은, 플라스미드와 같이 염색체 외에서 자율 복제하는 벡터 위에 존재하고 있어도 좋고, 염색체 위에 편입되어 있어도 좋다. 즉, 본 발명의 미생물은, 예를 들면, 벡터 위에 목적 단백질의 발현용 유전자 구축물을 갖고 있어도 좋고, 바꿔 말하면, 목적 단백질의 발현용 유전자 구축물을 포함하는 벡터를 갖고 있어도 좋다. 또한, 본 발명의 미생물은, 예를 들어, 염색체 위에 목적 단백질의 발현용 유전자 구축물을 갖고 있어도 좋다. 본 발명의 미생물이 둘 또는 그 이상의 목적 단백질의 발현용 유전자 구축물을 갖는 경우, 이들 유전자 구축물은, 목적 단백질을 제조할 수 있도록 본 발명의 미생물에 보유되어 있으면 좋다. 예를 들어, 이들 유전자 구축물은, 전체가 단일의 발현 벡터 위에 보유되어 있어도 좋고, 전체가 염색체 위에 보유되어 있어도 좋다. 또한, 이들 유전자 구축물은, 복수의 발현 벡터 위에 따로따로 보유되어 있어도 좋고, 단일 또는 복수의 발현 벡터 위와 염색체 위에 따로따로 보유되어 있어도 좋다.

본 발명의 미생물은, 본래적으로 목적 단백질의 발현용 유전자 구축물을 갖는 것이라도 좋고, 목적 단백질의 발현용 유전자 구축물을 갖도록 개변된 것이라도 좋다. 본 발명의 미생물은, 전형적으로는, 본래적으로 셀룰라아제의 발현용 유전자 구축물을 갖는 것일 수 있다. 또한, 본 발명의 미생물은, 본래적으로 갖는 목적 단백질의 발현용 유전자 구축물 대신에, 혹은 더해서, 목적 단백질의 발현용 유전자 구축물이 도입된 것이라도 좋다. 목적 단백질의 발현용 유전자 구축물을 갖는 미생물은, 상기한 바와 같은 탈라로마이세스 셀룰롤리티쿠스에 목적 단백질의 발현용 유전자 구축물을 도입함으로써 취득할 수 있다.

「목적 단백질의 발현용 유전자 구축물」이란, 목적 단백질을 발현할 수 있도록 구성된 유전자 발현계를 말한다. 목적 단백질의 발현용 유전자 구축물을 「목적 단백질의 발현계」, 「목적 단백질의 발현 유닛」, 또는 「목적 단백질의 발현 카세트」라고도 한다. 목적 단백질의 발현용 유전자 구축물은, 5'에서 3' 방향으로, 프로모터 서열 및 목적 단백질을 코드하는 염기 서열을 포함한다. 프로모터 서열을 단순히 「프로모터」라고도 한다. 아미노산 서열을 코드하는 염기 서열을 「유전자」라고도 한다. 예를 들어, 목적 단백질을 코드하는 염기 서열을 「목적 단백질을 코드하는 유전자」 또는 「목적 단백질 유전자」라고도 한다. 목적 단백질 유전자는, 프로모터의 하류에, 이 프로모터에 의한 제어를 받아 목적 단백질이 발현되도록 연결되어 있으면 좋다. 또한, 목적 단백질의 발현용 유전자 구축물은, 목적 단백질을 발현시키기 위해 유효한 제어 서열(오퍼레이터나 터미네이터 등)을, 그들이 기능할 수 있도록 적절한 위치에 갖고 있어도 좋다. 또한, 본 발명에 있어서, 「목적 단백질 유전자의 발현」, 「목적 단백질의 발현」, 「목적 단백질의 생성」, 「목적 단백질의 생산」은, 특기하지 않는 한, 서로 동의(同義)로 사용할 수 있다. 목적 단백질의 발현용 유전자 구축물은, 목적 단백질의 종류 등의 여러 조건에 따라 적절히 설계할 수 있다.

프로모터는, 탈라로마이세스 셀룰롤리티쿠스에서 기능하는 것이면 특별히 제한되지 않는다. 「탈라로마이세스 셀룰롤리티쿠스에 있어서 기능하는 프로모터」란, 탈라로마이세스 셀룰롤리티쿠스에 있어서 프로모터 활성, 즉 유전자의 전사 활성을 갖는 프로모터를 말한다.

프로모터는, 숙주 유래의 프로모터라도 좋고, 이종 유래의 프로모터라도 좋다. 프로모터는, 목적 단백질 유전자의 고유 프로모터라도 좋고, 다른 유전자의 프로모터라도 좋다. 또한, 프로모터는, 유도성 프로모터라도 좋고, 구성적(constitutive)인 프로모터라도 좋다. 프로모터로서는, 미생물 셀룰라아제 유전자의 프로모터를 들 수 있다. 프로모터로서, 구체적으로는, 탈라로마이세스 셀룰롤리티쿠스의 셀룰라아제 유전자의 프로모터를 들 수 있다. 셀룰라아제 유전자로서는, cbhI 유전자(cbh1 유전자라고도 함)나 cbhII 유전자(cbh2 유전자라고도 함)를 들 수 있다. 즉, 프로모터로서는, cbhI 유전자의 프로모터나 cbhII 유전자의 프로모터를 들 수 있다. cbhI 유전자의 프로모터를 「cbhI 프로모터」 또는 「cbh1 프로모터」라고도 한다. cbhII 유전자의 프로모터를 「cbhII 프로모터」 또는 「cbh2 프로모터」라고도 한다. 탈라로마이세스 셀룰롤리티쿠스의 cbhII 프로모터의 염기 서열을, 서열번호 63에 나타낸다. 즉, 프로모터는, 예를 들면, 상기 예시한 프로모터의 염기 서열(예를 들면 서열번호 63의 염기 서열)을 갖는 프로모터라도 좋다. 또한, 프로모터는, 상기 예시한 프로모터(예를 들어 서열번호 63의 염기 서열을 갖는 프로모터)의 보존적 변이체라도 좋다. 즉, 예를 들면, 상기 예시한 프로모터는, 그대로, 혹은 적절히 개변하여 사용할 수 있다. 「cbhI 프로모터」 및 「cbhII 프로모터」라는 용어는, 상기 예시한 cbhI 프로모터 및 cbhII 프로모터에 더해서, 그들의 보존적 변이체를 포함하는 것으로 한다. 프로모터의 보존적 변이체에 대해서는, 후술하는 pep4 유전자의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들어, 프로모터는, 원래의 기능이 유지되고 있는 한, 서열번호 63의 염기 서열에 대하여, 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 더욱 바람직하게는 97% 이상, 특히 바람직하게는 99% 이상의 동일성을 갖는 염기 서열을 갖는 DNA라도 좋다. 또한, 프로모터에 대한 「원래의 기능」이란, 직하류에 연결된 유전자를 발현하는 (예를 들면, 유도적 혹은 구성적으로 발현하는) 기능을 말한다. 프로모터의 기능은, 예를 들면, 유전자의 발현을 확인함으로써, 확인할 수 있다. 유전자의 발현은, 예를 들면, 리포터 유전자를 사용하여 확인할 수 있다.

목적 단백질은 특별히 제한되지 않는다. 목적 단백질은, 숙주 유래의 단백질이라도 좋고, 이종 유래의 단백질(이종 단백질)이라도 좋다. 본 발명에 있어서, 「이종 단백질」(heterologous protein)이란, 이 단백질을 생산하는 탈라로마이세스 셀룰롤리티쿠스에게 있어 외래성(exogenous)인 단백질을 말한다. 목적 단백질은, 예를 들면, 미생물 유래의 단백질이라도 좋고, 식물 유래의 단백질이라도 좋고, 동물 유래의 단백질이라도 좋고, 바이러스 유래의 단백질이라도 좋고, 인공적으로 아미노산 서열을 디자인한 단백질이라도 좋다. 목적 단백질은, 특히, 인간 유래의 단백질이라도 좋다. 목적 단백질은, 단량체 단백질이라도 좋고, 다량체 단백질이라도 좋다. 다량체 단백질이란, 2 또는 그 이상의 서브유닛으로 이루어진 다량체로서 존재할 수 있는 단백질을 말한다. 다량체에 있어서, 각 서브유닛은, 디술피드 결합 등의 공유 결합으로 연결되어 있어도 좋고, 수소 결합이나 소수성 상호 작용 등의 비공유 결합으로 연결되어 있어도 좋고, 그것들의 조합에 의해 연결되어 있어도 좋다. 다량체에 있어서는, 1 또는 그 이상의 분자간 디술피드 결합이 포함되는 것이 바람직하다. 다량체는, 단일 종류의 서브유닛으로 이루어진 호모 다량체라도 좋고, 2 또는 그 이상의 종류의 서브유닛으로 이루어진 헤테로 다량체라도 좋다. 또한, 「목적 단백질이 이종 단백질이다」란, 목적 단백질이 헤테로 다량체 단백질인 경우에 있어서는, 다량체를 구성하는 서브유닛 중, 적어도 하나의 서브유닛이 이종 단백질이면 좋다. 즉, 모든 서브유닛이 이종 유래라도 좋고, 일부의 서브유닛만이 이종 유래라도 좋다. 목적 단백질은, 분비성 단백질이라도 좋고, 비분비성 단백질이라도 좋다. 분비성 단백질은, 천연에서 분비성인 단백질이라도 좋고, 천연에서는 비분비성인 단백질이라도 좋지만, 천연에서 분비성인 단백질인 것이 바람직하다. 또한, 「단백질」에는, 올리고펩티드나 폴리펩티드 등의, 펩티드라고 불리는 것도 포함된다.

목적 단백질로서는, 예를 들어, 효소, 생리 활성 단백질, 리셉터 단백질, 항원 단백질, 기타 임의의 단백질을 들 수 있다.

효소로서는, 예를 들면, 셀룰라아제, 자일라나아제, 트랜스글루타미나아제, 프로테인글루타미나아제, 프로테인아스파라기나아제, 이소말토덱스트라나아제, 프로테아제, 엔도펩티다아제, 엑소펩티다아제, 아미노펩티다아제, 카복시펩티다아제, 콜라게나아제, 키티나아제, γ-글루타밀발린 합성 효소, 글루탐산-시스테인리가아제, 글루타티온 합성 효소 등을 들 수 있다.

본 발명에 있어서, 「셀룰라아제」란, 셀룰로오스에 포함되는 글리코시드 결합을 가수분해하는 반응을 촉매하는 효소의 총칭이다. 셀룰라아제로서는, 엔도형 셀룰라아제(엔도글루카나아제; EC 3.2.1.4), 엑소형 셀룰라아제(셀로비오하이드롤라아제; EC 3.2.1.91), 셀로비아제(β-글루코시다아제; EC 3.2.1.21)를 들 수 있다. 또한, 셀룰라아제는, 활성 측정에 사용되는 기질에 따라, 아비셀라아제, 필터 페이퍼 셀룰라아제(FP아제), 카복시메틸셀룰라아제(CMC아제) 등으로도 불린다. 셀룰라아제로서는, 예를 들면, 트리코더마 레에세이(Trichoderma reesei)나 탈라로마이세스 셀룰로리티쿠스(Talaromyces cellulolyticus) 등의 진균이나 클로스트리디움 써모셀룸(Clostridium thermocellum) 등의 세균의 셀룰라아제를 들 수 있다.

트랜스글루타미나아제로서는, 예를 들면, 스트렙토버티실리움 모바라엔스(Streptoverticillium mobaraense) IFO 13819(WO01/23591), 스트렙토버티실리움 신나모늄(Streptoverticillium cinnamoneum) IFO 12852, 스트렙토버티실리움 그리세오카늄(Streptoverticillium griseocarneum) IFO 12776, 스트렙토마이세스 리디쿠스(Streptomyces lydicus)(WO9606931) 등의 방선균이나, 오마이세테스(Oomycetes)(WO9622366) 등의 사상균의 분비형의 트랜스글루타미나아제를 들 수 있다. 프로테인글루타미나아제로서는, 예를 들어, 크리세오박테리움 프로테오리티쿰(Chryseobacterium proteolyticum)의 프로테인글루타미나아제를 들 수 있다(WO2005/103278). 이소말토덱스트라나아제로서는, 예를 들어, 아쓰로박터 글로비포미스(Arthrobacter globiformis)의 이소말토덱스트라나아제를 들 수 있다(WO2005/103278).

생리 활성 단백질로서는, 예를 들면, 성장 인자(증식 인자), 호르몬, 사이토카인, 항체 관련 분자를 들 수 있다.

성장 인자(증식 인자)로서, 구체적으로는, 예를 들면, 상피 성장 인자(Epidermal growth factor; EGF), 인슐린양(樣) 성장 인자-1(Insulin-like growth factor-1; IGF-1), 트랜스포밍 성장 인자(Transforming growth factor; TGF), 신경 성장 인자(Nerve growth factor; NGF), 뇌 유래 신경 영양 인자(Brain-derived neurotrophic factor; BDNF), 혈관 내피 세포 증식 인자(Vascular endothelial growth factor; VEGF), 과립구 콜로니 자극 인자(Granulocyte-colony stimulating factor; G-CSF), 과립구 마크로파지 콜로니 자극 인자(Granulocyte-macrophage-colony stimulating factor; GM-CSF), 혈소판 유래 성장 인자(Platelet-derived growth factor; PDGF), 에리스로포이에틴(Erythropoietin; EPO), 트롬보포이에틴(Thrombopoietin; TPO), 산성 섬유아세포 증식 인자(acidic fibroblast growth factor; aFGF 또는 FGF1), 염기성 섬유아세포 증식 인자(basic fibroblast growth factor; bFGF 또는 FGF2), 각질 세포 증식 인자(keratinocyte growth factor; KGF-1 또는 FGF7, KGF-2 또는 FGF10), 간세포 증식 인자(Hepatocyte growth factor; HGF), 줄기 세포 인자(Stem Cell Factor; SCF), 액티빈(Activin)을 들 수 있다. 액티빈으로서는, 액티빈 A, C, E를 들 수 있다.

호르몬으로서, 구체적으로는, 예를 들면, 인슐린, 글루카곤, 소마토스타틴(somatostatin), 인간 성장 호르몬(human growth hormone; hGH), 부갑상선 호르몬(parathyroid hormone; PTH), 칼시토닌(calcitonin), 엑세나티드(exenatide)를 들 수 있다.

사이토카인으로서, 구체적으로는, 예를 들면, 인터루킨, 인터페론, 종양 괴사 인자(Tumor Necrosis Factor; TNF)를 들 수 있다.

또한, 성장 인자(증식 인자), 호르몬, 및 사이토카인은 서로 엄밀하게 구별되지 않아도 좋다. 예를 들어, 생리 활성 단백질은, 성장 인자(증식 인자), 호르몬, 및 사이토카인으로부터 선택되는 어느 하나의 그룹에 속하는 것이라도 좋고, 그것들로부터 선택되는 복수의 그룹에 속하는 것이라도 좋다.

또한, 생리 활성 단백질은, 단백질 전체라도 좋고, 그 일부라도 좋다. 단백질의 일부로서는, 예를 들면, 생리 활성을 갖는 부분을 들 수 있다. 생리 활성을 갖는 부분으로서, 구체적으로는, 예를 들면, 부갑상선 호르몬(parathyroid hormone; PTH)의 성숙체의 N 말단 34 아미노산 잔기로 이루어진 생리 활성 펩티드 Teriparatide를 들 수 있다.

「항체 관련 분자」란, 완전 항체를 구성하는 도메인으로부터 선택되는 단일 도메인 또는 2 혹은 그 이상의 도메인의 조합으로 이루어진 분자종을 포함하는 단백질을 말한다. 완전 항체를 구성하는 도메인으로서는, 중쇄의 도메인인 VH, CH1, CH2, 및 CH3, 및 경쇄의 도메인인 VL 및 CL을 들 수 있다. 항체 관련 분자는, 상술한 분자종을 포함하는 한, 단량체 단백질이라도 좋고, 다량체 단백질이라도 좋다. 또한, 항체 관련 분자가 다량체 단백질인 경우에는, 단일 종류의 서브유닛으로 이루어진 호모 다량체라도 좋고, 2 또는 그 이상의 종류의 서브유닛으로 이루어진 헤테로 다량체라도 좋다. 항체 관련 분자로서, 구체적으로는, 예를 들면, 완전 항체, Fab, F(ab'), F(ab')₂, Fc, 중쇄(H쇄)와 경쇄(L쇄)로 이루어지는 이량체 , Fc 융합 단백질, 중쇄(H쇄), 경쇄(L쇄), 단쇄 Fv(scFv), sc(Fv)₂, 디술피드 결합 Fv(sdFv), 디아바디(diabody), VHH 프래그먼트(nanobody(등록상표))를 들 수 있다. 항체 관련 분자로서, 보다 구체적으로는, 예를 들면, 트라스투주맙(Trastuzumab), 아달리무맙(Adalimumab), 니볼루맙(Nivolumab), VHH 항체 N15를 들 수 있다.

리셉터 단백질로서는, 예를 들면, 생리 활성 단백질이나 기타 생리 활성 물질에 대한 리셉터 단백질을 들 수 있다. 기타 생리 활성 물질로서는, 예를 들면, 도파민 등의 신경 전달 물질을 들 수 있다. 또한, 리셉터 단백질은, 대응하는 리간드가 알려져 있지 않은 오펀 수용체라도 좋다.

항원 단백질은, 면역 응답을 야기할 수 있는 것이면 특별히 제한되지 않는다. 항원 단백질은, 예를 들면, 상정하는 면역 응답의 대상에 따라 적절히 선택할 수 있다. 항원 단백질은, 예를 들어, 백신으로서 사용할 수 있다.

또한, 기타 단백질로서, 간형 지방산 결합 단백질(Liver-type fatty acid-binding protein)(LFABP), 형광 단백질, 이뮤노글로불린 결합 단백질, 알부민, 피브로인양(樣) 단백질, 세포외 단백질을 들 수 있다. 형광 단백질로서는, 녹색 형광 단백질(Green Fluorescent Protein)(GFP)이나 단량체 적색 형광성 단백질(monomeric red fluorescent protein(mRFP))을 들 수 있다. 이뮤노글로불린 결합 단백질로서는, 단백질 A, 단백질 G, 단백질 L을 들 수 있다. 알부민으로서는, 인간 혈청 알부민을 들 수 있다. 피브로인양 단백질로서는, WO2017/090665나 WO2017/171001에 개시된 것을 들 수 있다.

세포외 단백질로서는, 피브로넥틴, 비트로넥틴, 콜라겐, 오스테오폰틴, 라미닌, 이들의 부분 서열을 들 수 있다. 라미닌은, α쇄, β쇄, 및 γ쇄로 이루어진 헤테로 삼량체 구조를 갖는 단백질이다. 라미닌으로서는, 포유류의 라미닌을 들 수 있다. 포유류로서는, 인간, 원숭이, 침팬지 등의 영장류, 생쥐, 쥐, 햄스터, 모르모트 등의 설치류, 토끼, 말, 소, 양, 염소, 돼지, 개, 고양이 등의 기타 각종 포유류를 들 수 있다. 포유류로서는, 특히, 인간을 들 수 있다. 라미닌의 서브유닛쇄(즉, α쇄, β쇄, 및 γ쇄)로서는, 5종의 α쇄(α1 내지 α5), 3종의 β쇄(β1 내지 β3), 3종의 γ쇄(γ1 내지 γ3)를 들 수 있다. 라미닌은, 이들 서브유닛쇄의 조합에 의해 다양한 아이소폼을 구성한다. 라미닌으로서, 구체적으로는, 예를 들면, 라미닌 111, 라미닌 121, 라미닌 211, 라미닌 213, 라미닌 221, 라미닌 311, 라미닌 321, 라미닌 332, 라미닌 411, 라미닌 421, 라미닌 423, 라미닌 511, 라미닌 521, 라미닌 523을 들 수 있다. 라미닌의 부분 서열로서는, 라미닌의 E8 단편인 라미닌 E8을 들 수 있다. 라미닌 E8은, 구체적으로는, α쇄의 E8 단편(α쇄 E8), β쇄의 E8 단편(β쇄 E8), 및 γ쇄의 E8 단편(γ쇄 E8)으로 이루어진 헤테로삼량체 구조를 갖는 단백질이다. 라미닌 E8의 서브유닛쇄(즉, α쇄 E8, β쇄 E8, 및 γ쇄 E8)를 총칭하여, 「E8 서브유닛쇄」라고도 한다. E8 서브유닛쇄로서는, 상기 예시한 라미닌 서브유닛쇄의 E8 단편을 들 수 있다. 라미닌 E8은, 이들 E8 서브유닛쇄의 조합에 의해 다양한 아이소폼을 구성한다. 라미닌 E8로서, 구체적으로는, 예를 들면, 라미닌 111E8, 라미닌 121E8, 라미닌 211E8, 라미닌 221E8, 라미닌 332E8, 라미닌 421E8, 라미닌 411E8, 라미닌 511E8, 라미닌 521E8을 들 수 있다.

목적 단백질 유전자는, 그대로, 혹은 적절히 개변하여, 이용할 수 있다. 목적 단백질 유전자는, 예를 들어, 원하는 활성을 얻기 위해 개변할 수 있다. 목적 단백질 유전자 및 목적 단백질의 변이체에 대해서는, 후술하는 Pep4 유전자 및 Pep4 단백질의 보존적 변이체에 대한 기재를 준용할 수 있다. 예를 들어, 목적 단백질 유전자는, 코드되는 목적 단백질의 아미노산 서열에 1 또는 수개의 아미노산의 치환, 결실, 삽입 및/또는 부가가 포함되도록 개변되어도 좋다. 또한, 유래하는 생물종으로 특정되는 단백질은, 당해 생물종에 있어서 발견되는 단백질 그 자체에 한정되지 않고, 당해 생물종에 있어서 발견되는 단백질의 아미노산 서열을 갖는 단백질 및 그것들의 변이체를 포함하는 것으로 한다. 이들 변이체는, 당해 생물종에 있어서 발견되어도 좋고, 발견되지 않아도 좋다. 즉, 예를 들면, 「인간 유래 단백질」이란, 인간에 있어서 발견되는 단백질 그 자체에 한정되지 않고, 인간에 있어서 발견되는 단백질의 아미노산 서열을 갖는 단백질 및 그것들의 변이체를 포함하는 것으로 한다. 또한, 목적 단백질 유전자는, 임의의 코돈을 그것과 등가의 코돈으로 치환한 것이라도 좋다. 예를 들어, 목적 단백질 유전자는, 사용하는 숙주의 코돈 사용 빈도에 따라 최적인 코돈을 갖도록 개변되어도 좋다.

목적 단백질은, 상기 예시한 바와 같은 목적 단백질의 아미노산 서열에 더해, 다른 아미노산 서열을 포함하고 있어도 좋다. 즉, 목적 단백질은, 다른 아미노산 서열과의 융합 단백질이라도 좋다. 「다른 아미노산 서열」은, 원하는 성질의 목적 단백질이 얻어지는 한, 특별히 제한되지 않는다. 「다른 아미노산 서열」은, 그 이용 목적 등의 여러 조건에 따라 적절히 선택할 수 있다. 「다른 아미노산 서열」로서는, 예를 들면, 시그널 펩티드(시그널 서열이라고도 함), 펩티드 태그, 프로테아제의 인식 서열을 들 수 있다. 「다른 아미노산 서열」은, 예를 들어, 목적 단백질의 N 말단, 혹은 C 말단, 또는 그 양쪽에 연결되어도 좋다. 「다른 아미노산 서열」로서는, 1종의 아미노산 서열을 사용해도 좋고, 2종 또는 그 이상의 아미노산 서열을 조합하여 사용해도 좋다.

시그널 펩티드는, 예를 들어, 목적 단백질의 분비 생산에 이용할 수 있다. 시그널 펩티드는, 목적 단백질의 N 말단에 연결되어도 좋다. 즉, 일 형태에 있어서, 목적 단백질의 발현용 유전자 구축물은, 5'에서 3' 방향으로, 프로모터 서열, 시그널 펩티드를 코드하는 염기 서열, 및 목적 단백질을 코드하는 염기 서열을 포함하고 있어도 좋다. 그 경우, 목적 단백질을 코드하는 핵산 서열은, 시그널 펩티드를 코드하는 핵산 서열의 하류에, 이 시그널 펩티드와의 융합 단백질로서 목적 단백질이 발현되도록 연결되어 있으면 좋다. 또한, 그러한 융합 단백질에 있어서, 시그널 펩티드와 목적 단백질은 인접하고 있어도 좋고, 하고 있지 않아도 좋다. 즉, 「목적 단백질이 시그널 펩티드와의 융합 단백질로서 발현된다」란, 목적 단백질이 시그널 펩티드에 인접하여 이 시그널 펩티드와의 융합 단백질로서 발현되는 경우에 한정되지 않고, 목적 단백질이 다른 아미노산 서열을 통해 시그널 펩티드와의 융합 단백질로서 발현되는 경우도 포함된다. 시그널 펩티드를 이용하여 목적 단백질을 분비 생산하는 경우, 통상, 분비시에 시그널 펩티드가 절단되고, 시그널 펩티드를 갖지 않는 목적 단백질이 균체 밖으로 분비될 수 있다. 즉, 「목적 단백질이 시그널 펩티드와의 융합 단백질로서 발현된다」 또는 「목적 단백질이 시그널 펩티드를 포함한다」란, 목적 단백질이 발현시에 시그널 펩티드와의 융합 단백질을 구성하고 있으면 충분하고, 최종적으로 얻어지는 목적 단백질이 시그널 펩티드와의 융합 단백질을 구성하고 있는 것을 요하지 않는다.

시그널 펩티드는, 탈라로마이세스 셀룰롤리티쿠스에서 기능하는 것이면 특별히 제한되지 않는다. 「탈라로마이세스 셀룰롤리티쿠스에서 기능하는 시그널 펩티드」란, 목적 단백질의 N 말단에 연결되었을 때에 탈라로마이세스 셀룰롤리티쿠스에서 목적 단백질의 분비를 초래하는 펩티드를 말한다.

시그널 펩티드는, 숙주 유래의 시그널 펩티드라도 좋고, 이종 유래의 시그널 펩티드라도 좋다. 시그널 펩티드는, 목적 단백질 고유의 시그널 펩티드라도 좋고, 다른 단백질의 시그널 펩티드라도 좋다. 시그널 펩티드로서는, 미생물의 분비성 셀룰라아제의 시그널 펩티드를 들 수 있다. 시그널 펩티드로서, 구체적으로는, 탈라로마이세스 셀룰롤리티쿠스의 분비성 셀룰라아제의 시그널 펩티드를 들 수 있다. 분비성 셀룰라아제로서는, cbhI 유전자에 코드되는 CbhI 단백질(Cbh1 단백질이라고도 함)이나 cbhII 유전자에 코드되는 CbhII 단백질(Cbh2 단백질이라고도 함)을 들 수 있다. 즉, 시그널 펩티드로서는, CbhI 단백질의 시그널 펩티드나 CbhII 단백질의 시그널 펩티드를 들 수 있다. CbhI 단백질의 시그널 펩티드를 「CbhI 시그널 펩티드」 또는 「Cbh1 시그널 펩티드」라고도 한다. CbhII 단백질의 시그널 펩티드를 「CbhII 시그널 펩티드」 또는 「Cbh2 시그널 펩티드」라고도 한다. 탈라로마이세스 셀룰롤리티쿠스의 CbhI 시그널 펩티드의 아미노산 서열을, 서열번호 72에 나타낸다. 즉, 시그널 펩티드는, 예를 들면, 상기 예시한 시그널 펩티드의 아미노산 서열(예를 들면 서열번호 72의 아미노산 서열)을 갖는 시그널 펩티드라도 좋다. 또한, 시그널 펩티드는, 상기 예시한 시그널 펩티드(예를 들어 서열번호 72의 아미노산 서열을 갖는 시그널 펩티드)의 보존적 변이체라도 좋다. 즉, 예를 들면, 상기 예시한 시그널 펩티드는, 그대로, 혹은 적절히 개변하여 사용할 수 있다. 「CbhI 시그널 펩티드」 및 「CbhII 시그널 펩티드」라는 용어는, 상기 예시한 CbhI 시그널 펩티드 및 CbhII 시그널 펩티드에 더해서, 그것들의 보존적 변이체를 포함하는 것으로 한다. 시그널 펩티드의 보존적 변이체에 대해서는, 후술하는 Pep4 단백질의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들어, 시그널 펩티드는, 원래의 기능이 유지되어 있는 한, 서열번호 72의 아미노산 서열에 있어서, 1 혹은 수개의 위치에서의 1 또는 수개의 아미노산이 치환, 결실, 삽입, 및/또는 부가된 아미노산 서열을 갖는 펩티드라도 좋다. 또한, 시그널 펩티드의 변이체에서의 상기 「1 또는 수개」란, 구체적으로는, 바람직하게는 1 내지 7개, 보다 바람직하게는 1 내지 5개, 더욱 바람직하게는 1 내지 3개, 특히 바람직하게는 1 내지 2개를 의미한다. 또한, 예를 들어, 시그널 펩티드는, 원래의 기능이 유지되어 있는 한, 서열번호 72의 아미노산 서열에 대하여, 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 더욱 바람직하게는 97% 이상, 특히 바람직하게는 99% 이상의 동일성을 갖는 아미노산 서열을 갖는 펩티드라도 좋다. 또한, 시그널 펩티드에 대한 「원래 기능」이란, 목적 단백질의 N 말단에 연결되었을 때에 목적 단백질의 분비를 초래하는 기능이라도 좋다. 시그널 펩티드의 기능은, 예를 들어, 단백질의 N 말단으로의 연결에 의한 이 단백질의 분비를 확인함으로써, 확인할 수 있다.

펩티드 태그로서, 구체적으로는, His 태그, FLAG 태그, GST 태그, Myc 태그, MBP(말토스 결합 단백질(maltose binding protein)), CBP(셀룰로스 결합 단백질(cellulose binding protein)), TRX(티오레독신(Thioredoxin)), GFP(녹색 형광성 단백질(green fluorescent protein)), HRP(서양고추냉이 퍼옥시다제 (horseradish peroxidase)), ALP(알칼린 포스파타제(Alkaline Phosphatase)), 항체의 Fc 영역을 들 수 있다. 펩티드 태그는, 예를 들어, 발현된 목적 단백질의 검출이나 정제에 이용할 수 있다.

프로테아제의 인식 서열로서, 구체적으로는, HRV3C 프로테아제 인식 서열, 인자 Xa 프로테아제 인식 서열, proTEV 프로테아제 인식 서열을 들 수 있다. 프로테아제의 인식 서열은, 예를 들어, 발현된 목적 단백질의 절단에 이용할 수 있다. 구체적으로는, 예를 들면, 목적 단백질을 펩티드 태그와의 융합 단백질로서 발현시키는 경우, 목적 단백질과 펩티드 태그의 연결부에 프로테아제의 인식 서열을 도입함으로써, 발현된 목적 단백질로부터 프로테아제를 이용하여 펩티드 태그를 절단하여, 펩티드 태그를 갖지 않는 목적 단백질을 얻을 수 있다.

최종적으로 얻어지는 목적 단백질의 N 말단 영역은, 천연 단백질과 동일해도 좋고, 천연 단백질과 동일하지 않아도 좋다. 예를 들어, 최종적으로 얻어지는 목적 단백질의 N 말단 영역은, 천연 단백질과 비교하여, 1 또는 수개의 아미노산을 여분으로 부가되거나, 혹은 결실된 것이라도 좋다. 또한 상기 「1 또는 수개」란, 목적의 목적 단백질의 전장(全長)이나 구조 등에 따라서도 상이하지만, 구체적으로는, 바람직하게는 1 내지 20개, 보다 바람직하게는 1 내지 10개, 더욱 바람직하게는 1 내지 5개, 특히 바람직하게는 1 내지 3개를 의미한다.

또한, 목적 단백질은, 프로 구조부가 부가된 단백질(프로단백질)로서 발현되어도 좋다. 목적 단백질이 프로단백질로서 발현되는 경우, 최종적으로 얻어지는 목적 단백질은 프로단백질이라도 좋고, 그렇지 않아도 좋다. 즉, 프로단백질은 프로 구조부가 절단되어 성숙 단백질로 되어도 좋다. 절단은, 예를 들어, 프로테아제에 의해 행할 수 있다. 프로테아제를 사용하는 경우는, 최종적으로 얻어지는 단백질의 활성이라는 관점에서, 프로단백질은 일반적으로는 천연 단백질과 거의 동일한 위치에서 절단되는 것이 바람직하고, 천연 단백질과 완전히 동일한 위치에서 절단되어 천연의 것과 동일한 성숙 단백질이 얻어지는 것이 보다 바람직하다. 따라서, 일반적으로는, 천연으로 생성되는 성숙 단백질과 동일한 단백질을 생성하는 위치에서 프로단백질을 절단하는 특이적 프로테아제가 가장 바람직하다. 그러나, 상술한 바와 같이, 최종적으로 얻어지는 목적 단백질의 N 말단 영역은, 천연 단백질과 동일하지 않아도 좋다. 예를 들어, 생산되는 목적 단백질의 종류나 사용 목적 등에 따라서는, 천연 단백질과 비교하여 N 말단이 아미노산 1 내지 수개만큼 길거나 혹은 짧은 단백질이 보다 적절한 활성을 갖는 경우가 있다. 본 발명에 있어서 사용할 수 있는 프로테아제에는, 디스파제(Dispase)(베링거만하임사 제조)와 같은 상업적으로 입수할 수 있는 것 외, 미생물의 배양액, 예를 들면 방선균의 배양액 등으로부터 얻어지는 것이 포함된다. 그러한 프로테아제는 미정제 상태에서 사용할 수도 있고, 필요에 따라 적절한 순도까지 정제한 후에 사용해도 좋다.

목적 단백질 유전자는, 예를 들면, 클로닝에 의해 취득할 수 있다. 클로닝에는, 예를 들면, 목적 단백질 유전자를 포함하는 게놈 DNA나 cDNA 등의 핵산을 이용할 수 있다. 또한, 목적 단백질 유전자는, 예를 들어, 그 염기 서열에 기초하여 전체 합성함으로써도 취득할 수 있다(Gene, 60(1), 115-127 (1987)). 취득한 목적 단백질 유전자는, 그대로, 혹은 적절히 개변하여, 이용할 수 있다. 즉, 목적 단백질 유전자를 개변함으로써, 그 변이체를 취득할 수 있다. 유전자의 개변은 공지의 수법에 의해 행할 수 있다. 예를 들어, 부위 특이적 변이법에 의해, DNA의 목적 부위에 목적의 변이를 도입할 수 있다. 부위 특이적 변이법으로서는, PCR을 사용하는 방법(Higuchi, R., 61, in PCR technology, Erlich, H.A. Eds., Stockton press (1989); Carter, P., Meth. in Enzymol., 154, 382 (1987))이나, 파지를 사용하는 방법(Kramer, W. and Frits, H.J., Meth. in Enzymol., 154, 350 (1987); Kunkel, T.A. et al., Meth. in Enzymol., 154, 367 (1987))을 들 수 있다. 혹은, 목적 단백질 유전자의 변이체를 전체 합성해도 좋다. 또한, 취득한 목적 단백질 유전자에 대해서, 적절히, 프로모터 서열의 도입 등의 개변을 행하여, 목적 단백질의 발현용 유전자 구축물을 취득할 수 있다. 또한, 목적 단백질의 발현용 유전자 구축물의 다른 구성 요소(예를 들어, 프로모터 서열)나 목적 단백질의 발현용 유전자 구축물도, 목적 단백질 유전자와 동일하게 취득할 수 있다.

유전자의 개변은 공지의 수법에 의해 행할 수 있다. 예를 들어, 부위 특이적 변이법에 의해, DNA의 목적 부위에 목적의 변이를 도입할 수 있다. 부위 특이적 변이법으로서는, PCR을 사용하는 방법(Higuchi, R., 61, in PCR technology, Erlich, H.A. Eds., Stockton press (1989); Carter, P., Meth. in Enzymol., 154, 382 (1987))이나, 파지를 사용하는 방법(Kramer, W. and Frits, H.J., Meth. in Enzymol., 154, 350 (1987); Kunkel, T.A. et al., Meth. in Enzymol., 154, 367 1987))을 들 수 있다.

목적 단백질의 발현용의 유전자 구축물을 탈라로마이세스 셀룰롤리티쿠스에 도입하는 수법은 특별히 제한되지 않는다. 「목적 단백질의 발현용 유전자 구축물의 도입」이란, 목적 단백질의 발현용 유전자 구축물을 숙주에 보유시키는 것을 말하고, 구체적으로는, 목적 단백질 유전자를 발현 가능하게 숙주에 도입하는 것이라도 좋다. 「목적 단백질의 발현용 유전자 구축물의 도입」에는, 특기하지 않는 한, 미리 구축한 목적 단백질의 발현용 유전자 구축물을 숙주에 일괄하여 도입하는 경우에 한정되지 않고, 목적 단백질의 발현용 유전자 구축물의 일부가 숙주에 도입되고, 또한 숙주 내에서 목적 단백질의 발현용 유전자 구축물이 구축되는 경우도 포함된다. 예를 들어, 숙주가 본질적으로 갖는 프로모터의 하류에 목적 단백질 유전자를 도입함으로써, 염색체 상에서 목적 단백질의 발현용 유전자 구축물을 구축해도 좋다.

목적 단백질의 발현용 유전자 구축물은, 예를 들어, 목적 단백질의 발현용 유전자 구축물을 포함하는 벡터를 사용하여 숙주에 도입할 수 있다. 목적 단백질의 발현용 유전자 구축물을 포함하는 벡터를 「목적 단백질의 발현 벡터」라고도 한다. 목적 단백질의 발현 벡터는, 예를 들면, 목적 단백질의 발현용 유전자 구축물을 벡터와 연결함으로써, 구축할 수 있다. 또한, 예를 들어, 벡터가 프로모터를 구비하는 경우, 목적 단백질의 발현 벡터는, 당해 프로모터의 하류에 목적 단백질 유전자를 연결함으로써도, 구축할 수 있다. 목적 단백질의 발현 벡터로 숙주를 형질 전환함으로써, 동일 벡터가 도입된 형질 전환체가 얻어지는. 즉, 목적 단백질의 발현용 유전자 구축물을 숙주에 도입할 수 있다. 벡터는, 숙주의 세포 내에서 자율 복제가 가능한 것이면 특별히 제한되지 않는다. 벡터는, 1카피 벡터라도 좋고, 저(低)카피 벡터라도 좋고, 다(多)카피 벡터라도 좋다. 벡터는, 형질 전환체를 선택하기 위한 마커 유전자를 구비하고 있어도 좋다. 벡터는, 목적 단백질 유전자를 발현하기 위한 프로모터나 터미네이터를 구비하고 있어도 좋다.

또한, 목적 단백질의 발현용 유전자 구축물은, 숙주의 염색체에 도입되어도 좋다. 염색체로의 유전자의 도입은, 상동 재조합을 이용하여 행할 수 있다. 구체적으로는, 목적 단백질의 발현용 유전자 구축물을 포함하는 재조합 DNA로 숙주를 형질 전환하고, 숙주의 염색체 상의 목적 부위와 상동 재조합을 일으킴으로써, 목적 단백질의 발현용 유전자 구축물을 숙주의 염색체 상에 도입할 수 있다. 상동 재조합에 사용하는 재조합 DNA의 구조는, 원하는 형태로 상동 재조합이 일어나는 것이면 특별히 제한되지 않는다. 예를 들어, 목적 단백질의 발현용 유전자 구축물을 포함하는 선상 DNA로서, 목적 단백질의 발현용 유전자 구축물의 양 끝에 염색체상의 치환 대상 부위의 상류 및 하류의 서열을 각각 구비하는 선상 DNA로 숙주를 형질 전환하고, 치환 대상 부위의 상류 및 하류에서 각각 상동 재조합을 일으키게 함으로써, 치환 대상 부위를 목적 단백질의 발현용 유전자 구축물로 치환할 수 있다. 상동 재조합에 사용하는 재조합 DNA는, 형질 전환체를 선택하기 위한 마커 유전자를 구비하고 있어도 좋다. 또한, 목적 단백질 유전자나 프로모터 등의, 목적 단백질의 발현용 유전자 구축물의 일부의 염색체로의 도입도, 목적 단백질의 발현용 유전자 구축물 전체의 염색체로의 도입과 동일하게 행할 수 있다.

마커 유전자는, 숙주의 영양 요구성 등의 형질에 따라 적절히 선택할 수 있다. 예를 들어, 숙주가 pyrF 유전자 또는 pyrG 유전자의 변이에 의해 Uracil 요구성을 나타내는 경우, pyrF 유전자 또는 pyrG 유전자를 마커 유전자로서 사용함으로써, Uracil 요구성의 상보(즉 Uracil 비요구성)를 지표로서, 목적의 개변이 도입된 주를 선발할 수 있다. 또한, 마커 유전자로서는, 하이그로마이신 내성 유전자 등의 약제 내성 유전자를 사용할 수 있다.

형질 전환은, 예를 들면, 곰팡이나 효모 등의 진핵 미생물의 형질 전환에 통상 사용되는 수법에 의해 행할 수 있다. 그러한 수법으로서는, 프로토플라스트법을 들 수 있다.

<1-3> Pep4 단백질의 활성 저하

본 발명의 미생물은, Pep4 단백질의 활성이 저하되도록 개변되어 있다. 본 발명의 미생물은, 구체적으로는, 비개변주와 비교하여, Pep4 단백질의 활성이 저하되도록 개변되어 있다. 본 발명의 미생물은, 보다 구체적으로는, 예를 들면, pep4 유전자의 발현이 저하되도록 개변되어 있어도 좋고, pep4 유전자가 파괴되도록 개변되어 있어도 좋다. Pep4 단백질의 활성이 저하되도록 탈라로마이세스 셀룰롤리티쿠스를 개변함으로써, 이 미생물의 목적 단백질 생산능을 향상시킬 수 있다, 즉, 이 미생물에 의한 목적 단백질의 생산을 증대시킬 수 있다.

이하, Pep4 단백질 및 그것을 코드하는 pep4 유전자에 대하여 설명한다.

Pep4 단백질은, 프로테아제이다. 「프로테아제」란, 단백질을 가수분해하는 반응을 촉매하는 활성을 갖는 단백질을 말한다. 또한, 이 활성을 「프로테아제 활성」이라고도 한다.

Talaromyces cellulolyticusY-94주(FERM BP-5826, CBS 136886)의 pep4 유전자(인트론을 포함함)는, NCBI에 NCBI ACCESSION DF933830.1로서 등록된 게놈 서열의 2810881 내지 2812244 위치의 상보 서열에 상당한다. Talaromyces cellulolyticus Y-94주의 Pep4 단백질은, NCBI에 NCBI ACCESSION GAM39722.1로서 등록되어 있다. Talaromyces cellulolyticus Y-94주의 pep4 유전자(인트론을 포함함)의 염기 서열, 및 이 유전자가 코드하는 Pep4 단백질의 아미노산 서열을, 각각 서열번호 70 및 71에 나타낸다. 즉, pep4 유전자는, 예를 들면, 서열번호 70에 나타내는 염기 서열을 갖는 유전자라도 좋다. 또한, Pep4 단백질은, 예를 들면, 서열번호 71에 나타내는 아미노산 서열을 갖는 단백질이라도 좋다. 또한, 「유전자 또는 단백질이 염기 서열 또는 아미노산 서열을 갖는다」라는 표현은, 특기하지 않는 한, 유전자 또는 단백질이 당해 염기 서열 또는 아미노산 서열을 포함하는 것을 의미해도 좋고, 유전자 또는 단백질이 당해 염기 서열 또는 아미노산 서열로 이루어진 경우도 포함해도 좋다.

pep4 유전자는, 원래의 기능이 유지되고 있는 한, 상기 예시한 pep4 유전자(예를 들어 서열번호 70에 나타내는 염기 서열을 갖는 유전자)의 변이체라도 좋다. 마찬가지로, Pep4 단백질은, 원래의 기능이 유지되고 있는 한, 상기 예시한 Pep4 단백질(예를 들어 서열번호 71에 나타내는 아미노산 서열을 갖는 단백질)의 변이체라도 좋다. 그러한 원래의 기능이 유지된 변이체를 「보존적 변이체」라고 하는 경우가 있다. 본 발명에 있어서, 「pep4 유전자」라는 용어는, 상기 예시한 pep4 유전자에 한정되지 않고, 그 보존적 변이체를 포함하는 것으로 한다. 마찬가지로, 「Pep4 단백질」이라는 용어는, 상기 예시한 Pep4 단백질에 한정되지 않고, 그 보존적 변이체를 포함하는 것으로 한다. 보존적 변이체로서는, 예를 들어, 상기 예시한 pep4 유전자나 Pep4 단백질의 호모로그나 인위적인 개변체를 들 수 있다.

「원래의 기능이 유지되고 있다」란, 유전자 또는 단백질의 변이체가, 원래의 유전자 또는 단백질의 기능(활성이나 성질)에 대응하는 기능(활성이나 성질)을 갖는 것을 말한다. 즉, 「원래의 기능이 유지되고 있다」란, pep4 유전자에 있어서는, 유전자의 변이체가, 원래의 기능이 유지된 단백질을 코드하는 것을 말한다. 또한, 「원래의 기능이 유지되고 있다」란, Pep4 단백질에 있어서는, 단백질의 변이체가, 프로테아제 활성을 갖는 것을 말한다.

프로테아제 활성은, 효소를 기질(단백질)과 인큐베이트하고, 효소 의존적인 기질의 분해를 측정함으로써, 측정할 수 있다. 또한, 프로테아제 활성은, 시판의 프로테아제 활성 측정 키트를 사용하여 측정할 수 있다.

이하, 보존적 변이체에 대하여 예시한다.

pep4 유전자의 호모로그 또는 Pep4 단백질의 호모로그는, 예를 들면, 상기 예시한 pep4 유전자의 염기 서열 또는 상기 예시한 Pep4 단백질의 아미노산 서열을 쿼리 서열로서 사용한 BLAST 검색이나 FASTA 검색에 의해 공개 데이터베이스로부터 용이하게 취득할 수 있다. 또한, pep4 유전자의 호모로그는, 예를 들면, 탈라로마이세스 셀룰롤리티쿠스의 염색체를 주형으로 하여, 이들 공지의 pep4 유전자의 염기 서열에 기초하여 제작한 올리고뉴클레오티드를 프라이머로서 사용한 PCR에 의해 취득할 수 있다.

pep4 유전자는, 원래의 기능이 유지되고 있는 한, 상기 예시한 Pep4 단백질의 아미노산 서열(예를 들어, 서열번호 71에 나타내는 아미노산 서열)에 있어서, 1 혹은 수개의 위치에서의 1 또는 수개의 아미노산이 치환, 결실, 삽입, 및/또는 부가된 아미노산 서열을 갖는 단백질을 코드하는 유전자라도 좋다. 또한 상기 「1 또는 수개」란, 아미노산 잔기의 단백질의 입체 구조에서의 위치나 아미노산 잔기의 종류에 따라서도 상이하지만, 구체적으로는, 예를 들면, 1 내지 50개, 1 내지 40개, 1 내지 30개, 바람직하게는 1 내지 20개, 보다 바람직하게는 1 내지 10개, 더욱 바람직하게는 1 내지 5개, 특히 바람직하게는 1 내지 3개를 의미한다.

상기의 1 혹은 수개의 아미노산의 치환, 결실, 삽입, 및/또는 부가는, 단백질의 기능이 정상으로 유지되는 보존적 변이이다. 보존적 변이의 대표적인 것은, 보존적 치환이다. 보존적 치환이란, 치환 부위가 방향족 아미노산인 경우에는, Phe, Trp, Tyr 사이에서, 치환 부위가 소수성 아미노산인 경우에는, Leu, Ile, Val 사이에서, 극성 아미노산인 경우에는, Gln, Asn 사이에서, 염기성 아미노산인 경우에는, Lys, Arg, His 사이에서, 산성 아미노산인 경우에는, Asp, Glu 사이에서, 하이드록실기를 갖는 아미노산인 경우에는, Ser, Thr 사이에서 서로 치환하는 변이이다. 보존적 치환으로 간주되는 치환으로서는, 구체적으로는, Ala에서 Ser 또는 Thr로의 치환, Arg에서 Gln, His 또는 Lys로의 치환, Asn에서 Glu, Gln, Lys, His 또는 Asp로의 치환, Asp에서 Asn, Glu 또는 Gln으로의 치환, Cys에서 Ser 또는 Ala로의 치환, Gln에서 Asn, Glu, Lys, His, Asp 또는 Arg로의 치환, Glu에서 Gly, Asn, Gln, Lys 또는 Asp로의 치환, Gly에서 Pro로의 치환, His에서 Asn, Lys, Gln, Arg 또는 Tyr로의 치환, Ile에서 Leu, Met, Val 또는 Phe로의 치환, Leu에서 Ile, Met, Val 또는 Phe로의 치환, Lys에서 Asn, Glu, Gln, His 또는 Arg로의 치환, Met에서 Ile, Leu, Val 또는 Phe로의 치환, Phe에서 Trp, Tyr, Met, Ile 또는 Leu로의 치환, Ser에서 Thr 또는 Ala로의 치환, Thr에서 Ser 또는 Ala로의 치환, Trp에서 Phe 또는 Tyr로의 치환, Tyr에서 His, Phe 또는 Trp로의 치환, 및, Val에서 Met, Ile 또는 Leu로의 치환을 들 수 있다. 또한, 상기와 같은 아미노산의 치환, 결실, 삽입, 또는 부가에는, 유전자가 유래하는 생물의 개체차, 종의 차이에 기초한 경우 등의 천연으로 발생하는 변이(돌연변이체(mutant) 또는 변이체(variant))에 의해 발생하는 것도 포함된다.

또한, pep4 유전자는, 원래의 기능이 유지되고 있는 한, 상기 예시한 Pep4 단백질의 아미노산 서열(예를 들어, 서열번호 71에 나타내는 아미노산 서열) 전체에 대하여, 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 더욱 바람직하게는 97% 이상, 특히 바람직하게는 99% 이상의 동일성을 갖는 아미노산 서열을 갖는 단백질을 코드하는 유전자라도 좋다.

또한, pep4 유전자는, 원래의 기능이 유지되어 있는 한, 상기 예시한 pep4 유전자의 염기 서열(예를 들면, 서열번호 70에 나타내는 염기 서열)의 상보 서열 또는 이 상보 서열로부터 조제될 수 있는 프로브와 스트린젠트한 조건 하에서 하이브리다이즈하는 DNA라도 좋다. 「스트린젠트한 조건」이란, 소위 특이적인 하이브리드가 형성되고, 비특이적인 하이브리드가 형성되지 않는 조건을 말한다. 일례를 나타내면, 동일성이 높은 DNA끼리, 예를 들면, 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 더욱 바람직하게는 97% 이상, 특히 바람직하게는 99% 이상의 동일성을 갖는 DNA끼리가 하이브리다이즈하고, 그보다 동일성이 낮은 DNA끼리가 하이브리다이즈하지 않는 조건, 혹은 통상의 서던 하이브리디제이션의 세정 조건인 60℃, 1×SSC, 0.1% SDS, 바람직하게는 60℃, 0.1×SSC, 0.1% SDS, 보다 바람직하게는 68℃, 0.1×SSC, 0.1% SDS에 상당하는 염 농도 및 온도에서, 1회, 바람직하게는 2 내지 3회 세정하는 조건을 들 수 있다.

상기 프로브는, 예를 들어, 유전자의 상보 서열의 일부라도 좋다. 그러한 프로브는, 공지의 유전자의 염기 서열에 기초하여 제작한 올리고뉴클레오티드를 프라이머로 하고, 이들 염기 서열을 포함하는 DNA 단편을 주형으로 하는 PCR에 의해 제작할 수 있다. 프로브로서는, 예를 들면, 300bp 정도의 길이의 DNA 단편을 사용할 수 있다. 이러한 경우, 하이브리디제이션의 세정 조건으로서는, 50℃, 2×SSC, 0.1% SDS를 들 수 있다.

또한, pep4 유전자는, 임의의 코돈을 그것과 등가의 코돈으로 치환한 것이라도 좋다. 즉, pep4 유전자는, 코돈의 축중(縮重)에 의한 상기 예시한 pep4 유전자의 변이체라도 좋다.

또한, 아미노산 서열간의 「동일성」이란, blastp에 의해 디폴트 설정의 스코어링 파라미터(Scoring Parameters)(Matrix:BLOSUM62;Gap Costs:Existence=11, Extension=1; Compositional Adjustments:Conditional compositional score matrix adjustment)를 사용하여 산출되는 아미노산 서열간의 동일성을 의미한다. 또한, 염기 서열간의 「동일성」이란, blastn에 의해 디폴트 설정의 스코어링 파라미터(Match/Mismatch Scores=1,-2;Gap Costs=Linear)를 사용하여 산출되는 염기 서열간의 동일성을 의미한다.

또한, 상기 유전자나 단백질의 변이체에 관한 기재는, 목적 단백질 등의 임의의 단백질 및 그것들을 코드하는 유전자에도 준용할 수 있다.

<1-4> 기타 성질

본 발명의 미생물은, 목적 단백질 생산능이 손상되지 않는 한, 기타 원하는 성질(예를 들면 개변)을 갖고 있어도 좋다. 개변으로서는, 탈라로마이세스 셀룰롤리티쿠스의 목적 단백질 생산능이 향상되는 개변을 들 수 있다. 개변으로서, 구체적으로는, YscB 단백질의 활성이 저하되는 개변이나 CreA 단백질의 활성이 저하되는 개변을 들 수 있다. 이러한 성질이나 개변은, 단독으로, 혹은 적절히 조합하여, 이용할 수 있다.

즉, 본 발명의 미생물은, 예를 들면, YscB 단백질의 활성이 저하되도록 개변되어 있어도 좋다. 본 발명의 미생물은, 구체적으로는, 비개변주와 비교하여, YscB 단백질의 활성이 저하되도록 개변되어 있어도 좋다. 본 발명의 미생물은, 보다 구체적으로는, 예를 들면, yscB 유전자의 발현이 저하되도록 개변되어 있어도 좋고, yscB 유전자가 파괴되도록 개변되어 있어도 좋다. YscB 단백질은, 프로테아제이다.

Talaromyces cellulolyticus S6-25주의 yscB 유전자(인트론을 포함함)의 염기 서열, 및 이 유전자가 코드하는 YscB 단백질의 아미노산 서열을, 각각 서열번호 60 및 73에 나타낸다. 즉, yscB 유전자는, 예를 들면, 서열번호 60에 나타내는 염기 서열을 갖는 유전자라도 좋다. 또한, YscB 단백질은, 예를 들면, 서열번호 73에 나타내는 아미노산 서열을 갖는 단백질이라도 좋다. yscB 유전자 및 YscB 단백질은, 각각, 상기 예시한 yscB 유전자 및 YscB 단백질의 보존적 변이체라도 좋다. yscB 유전자 및 YscB 단백질의 보존적 변이체에 대해서는, pep4 유전자 및 Pep4 단백질의 보존적 변이체에 대한 기재를 준용할 수 있다. 또한, 「원래 기능이 유지되고 있다」란, YscB 단백질에 있어서는, 단백질의 변이체가, 프로테아제 활성을 갖는 것이라도 좋다. 프로테아제 활성은, 예를 들면, 상술한 바와 같이 측정할 수 있다.

또한, 본 발명의 미생물은, 예를 들면, CreA 단백질의 활성이 저하되도록 개변되어 있어도 좋다. 본 발명의 미생물은, 구체적으로는, 비개변주와 비교하여, CreA 단백질의 활성이 저하되도록 개변되어 있어도 좋다. 본 발명의 미생물은, 보다 구체적으로는, 예를 들면, creA 유전자의 발현이 저하되도록 개변되어 있어도 좋고, creA 유전자가 파괴되도록 개변되어 있어도 좋다. creA 유전자는, 카타볼라이트 리프레션에 관여하는 전사 인자를 코드하는 유전자이다. creA 유전자는, 사상균에 있어서, 셀룰라아제의 발현에 관여하고 있는 것이 알려져 있다(Mol Gen Genet. 1996 Jun 24;251(4):451-60, Biosci Biotechnol Biochem. 1998 Dec;62(12):2364-70).

Talaromyces cellulolyticus S6-25주의 creA 유전자의 염기 서열을 서열번호 74에 나타낸다. 즉, creA 유전자는, 예를 들면, 서열번호 74에 나타내는 염기 서열을 갖는 유전자라도 좋다. 또한, CreA 단백질은, 예를 들면, 서열번호 74에 나타내는 염기 서열에 의해 코드되는 아미노산 서열을 갖는 단백질이라도 좋다. creA 유전자 및 CreA 단백질은, 각각, 상기 예시한 creA 유전자 및 CreA 단백질의 보존적 변이체라도 좋다. creA 유전자 및 CreA 단백질의 보존적 변이체에 대해서는, pep4 유전자 및 Pep4 단백질의 보존적 변이체에 대한 기재를 준용할 수 있다. 또한, 「원래의 기능이 유지되고 있다」란, CreA 단백질에 있어서는, 단백질의 변이체가, 카타볼라이트 리프레션에 관여하는 전사 인자로서의 기능을 갖는 것이라도 좋다.

<1-5> 단백질의 활성을 저하시키는 수법

이하에, Pep4 단백질, YscB 단백질, CreA 단백질 등의 단백질의 활성을 저하시키는 수법에 대하여 설명한다.

「단백질의 활성이 저하된다」란, 이 단백질의 활성이 비개변주와 비교하여 저하되는 것을 의미한다. 「단백질의 활성이 저하된다」란, 구체적으로는, 이 단백질의 세포당의 활성이 비개변주와 비교하여 저하되는 것을 의미한다. 여기서 말하는 「비개변주」란, 표적 단백질의 활성이 저하되도록 개변되어 있지 않은 대조주를 의미한다. 비개변주로서는, 야생주나 친주(親株)를 들 수 있다. 비개변주로서, 구체적으로는, 탈라로마이세스 셀룰롤리티쿠스의 설명에서 예시한 주를 들 수 있다. 즉, 일 형태에 있어서, 단백질의 활성은, 탈라로마이세스 셀룰로티쿠스 S6-25주와 비교하여 저하되어도 좋다. 또한, 「단백질의 활성이 저하된다」는 것에는, 이 단백질의 활성이 완전히 소실되어 있는 경우도 포함된다. 「단백질의 활성이 저하된다」란, 보다 구체적으로는, 비개변주와 비교하여, 이 단백질의 세포당의 분자수가 저하되어 있는 것, 및/또는, 이 단백질의 분자당의 기능이 저하되어 있는 것을 의미해도 좋다. 즉, 「단백질의 활성이 저하된다」라는 경우의 「활성」이란, 단백질의 촉매 활성에 한정되지 않고, 단백질을 코드하는 유전자의 전사량(mRNA량) 또는 번역량(단백질의 양)을 의미해도 좋다. 「단백질의 세포당의 분자수」란, 이 단백질의 분자수의 세포당의 평균값을 의미해도 좋다. 또한, 「단백질의 세포당의 분자수가 저하되어 있는」 것에는, 이 단백질이 전혀 존재하고 있지 않은 경우도 포함된다. 또한, 「단백질의 분자당의 기능이 저하되고 있는」 것에는, 이 단백질의 분자당의 기능이 완전히 소실되어 있는 경우도 포함된다. 단백질의 활성의 저하 정도는, 단백질의 활성이 비개변주와 비교하여 저하되어 있으면 특별히 제한되지 않는다. 단백질의 활성은, 예를 들어, 비개변주의, 50% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 0%로 저하되어도 좋다.

단백질의 활성이 저하되는 개변은, 예를 들어, 이 단백질을 코드하는 유전자의 발현을 저하시킴으로써 달성할 수 있다. 「유전자의 발현이 저하된다」란, 이 유전자의 발현이 비개변주와 비교하여 저하되는 것을 의미한다. 「유전자의 발현이 저하된다」란, 구체적으로는, 이 유전자의 세포당의 발현량이 비개변주와 비교하여 저하되는 것을 의미한다. 「유전자의 세포당의 발현량」이란, 이 유전자의 발현량의 세포당의 평균값을 의미해도 좋다. 「유전자의 발현이 저하된다」란, 보다 구체적으로는, 유전자의 전사량(mRNA량)이 저하되는 것, 및/또는, 유전자의 번역량(단백질의 양)이 저하되는 것을 의미해도 좋다. 「유전자의 발현이 저하된다」는 것에는, 이 유전자가 전혀 발현되고 있지 않은 경우가 포함된다. 또한, 「유전자의 발현이 저하된다」는 것을, 「유전자의 발현이 약화된다」라고도 한다. 유전자의 발현은, 예를 들어, 비개변주의, 50% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 0%로 저하되어도 좋다.

유전자의 발현의 저하는, 예를 들면, 전사 효율의 저하에 의한 것이라도 좋고, 번역 효율의 저하에 의한 것이라도 좋고, 그들의 조합에 의한 것이라도 좋다. 유전자의 발현의 저하는, 예를 들어, 유전자의 발현 조절 서열을 개변함으로써 달성할 수 있다. 「발현 조절 서열」이란, 프로모터 등의, 유전자의 발현에 영향을 미치는 부위의 총칭이다. 발현 조절 서열은, 예를 들면, 프로모터 검색 벡터나 GENETYX 등의 유전자 해석 소프트를 사용하여 결정할 수 있다. 발현 조절 서열을 개변하는 경우에는, 발현 조절 서열은, 바람직하게는 1염기 이상, 보다 바람직하게는 2염기 이상, 특히 바람직하게는 3염기 이상이 개변된다. 유전자의 전사 효율의 저하는, 예를 들어, 염색체 상의 유전자의 프로모터를 보다 약한 프로모터로 치환함으로써 달성할 수 있다. 「보다 약한 프로모터」란, 유전자의 전사가. 원래 존재하고 있는 야생형의 프로모터보다도 약화되는 프로모터를 의미한다. 보다 약한 프로모터로서는, 예를 들면, 유도형의 프로모터를 들 수 있다. 즉, 유도형 프로모터는, 비유도 조건 하(예를 들어, 유도 물질의 비존재 하)에서 보다 약한 프로모터로서 기능할 수 있다. 또한, 발현 조절 서열의 일부 또는 전부의 영역을 결실(결손)시켜도 좋다. 또한, 유전자의 발현의 저하는, 예를 들면, 발현 제어에 관련된 인자를 조작함으로써도 달성할 수 있다. 발현 제어에 관련된 인자로서는, 전사나 번역 제어에 관련된 저분자(유도 물질, 저해 물질 등), 단백질(전사 인자 등), 핵산(siRNA 등) 등을 들 수 있다. 또한, 유전자의 발현의 저하는, 예를 들면, 유전자의 코드 영역에 유전자의 발현이 저하되는 변이를 도입함으로써도 달성할 수 있다. 예를 들어, 유전자의 코드 영역의 코돈을, 숙주에 있어서 보다 저빈도로 이용되는 동의 코돈으로 치환함으로써, 유전자의 발현을 저하시킬 수 있다. 또한, 예를 들면, 후술하는 유전자의 파괴에 의해, 유전자의 발현 자체가 저하될 수 있다.

또한, 단백질의 활성이 저하되는 개변은, 예를 들면, 이 단백질을 코드하는 유전자를 파괴함으로써 달성할 수 있다. 「유전자가 파괴된다」란, 정상적으로 기능하는 단백질을 생산하지 않도록 이 유전자가 개변되는 것을 의미한다. 「정상적으로 기능하는 단백질을 생산하지 않는」 것에는, 이 유전자로부터 단백질이 전혀 생산되지 않는 경우나, 이 유전자로부터 분자당의 기능(활성이나 성질)이 저하 또는 소실된 단백질이 생산되는 경우가 포함된다.

유전자의 파괴는, 예를 들어, 염색체 상의 유전자를 결실(결손)시킴으로써 달성할 수 있다. 「유전자의 결실」이란, 유전자의 코드 영역의 일부 또는 전부의 영역의 결실을 말한다. 추가로, 염색체 상의 유전자의 코드 영역 전후의 서열을 포함하여, 유전자 전체를 결실시켜도 좋다. 유전자의 코드 영역 전후의 서열에는, 예를 들어, 유전자의 발현 조절 서열이 포함되어도 좋다. 단백질의 활성 저하를 달성할 수 있는 한, 결실시키는 영역은, N 말단 영역(단백질의 N 말단 측을 코드하는 영역), 내부 영역, C 말단 영역(단백질의 C 말단 측을 코드하는 영역) 등의 어느 영역이라도 좋다. 통상, 결실시키는 영역은 긴 쪽이 확실하게 유전자를 불활화할 수 있다. 결실시키는 영역은, 예를 들면, 유전자의 코드 영역 전체 길이의 10% 이상, 20% 이상, 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 또는 95% 이상의 길이의 영역이라도 좋다. 또한, 결실시키는 영역의 전후의 서열은, 리딩 프레임이 일치하지 않는 것이 바람직하다. 리딩 프레임의 불일치에 의해, 결실시키는 영역의 하류에서 프레임시프트가 발생할 수 있다. creA 유전자의 경우, 구체적으로는, 예를 들면, 서열번호 74의 3262 내지 4509 위치에 상당하는 부분을 결실시킴으로써, 이 유전자를 파괴할 수 있다(특개2016-131533).

또한, 유전자의 파괴는, 예를 들면, 염색체 상의 유전자의 코드 영역에 아미노산 치환(미스센스 변이)을 도입하는 것, 종지 코돈(넌센스 변이)을 도입하는 것, 혹은 1 내지 2염기의 부가 또는 결실(프레임시프트 변이)을 도입하는 것 등에 의해서도 달성할 수 있다(Journal of Biological Chemistry 272:8611-8617(1997), Proceedings of the National Academy of Sciences, USA 95 5511-5515(1998), Journal of Biological Chemistry 26 116, 20833-20839(1991)).

또한, 유전자의 파괴는, 예를 들어, 염색체 상의 유전자의 코드 영역에 다른 염기 서열을 삽입함으로써도 달성할 수 있다. 삽입 부위는 유전자 중 어느 영역이라도 좋지만, 삽입하는 염기 서열은 긴 쪽이 확실하게 유전자를 불활화할 수 있다. 또한, 삽입 부위의 전후의 서열은, 리딩 프레임이 일치하지 않는 것이 바람직하다. 리딩 프레임의 불일치에 의해, 삽입 부위의 하류에서 프레임시프트가 발생할 수 있다. 다른 염기 서열로서는, 코드되는 단백질의 활성을 저하 또는 소실시키는 것이면 특별히 제한되지 않지만, 예를 들면, 마커 유전자나 목적 단백질 생산에 유용한 유전자를 들 수 있다.

유전자 파괴는, 특히, 코드되는 단백질의 아미노산 서열이 결실(결손)되도록 실시해도 좋다. 바꿔 말하면, 단백질의 활성이 저하되는 개변은, 예를 들어, 단백질의 아미노산 서열을 결실시킴으로써, 구체적으로는, 아미노산 서열을 결실한 단백질을 코드하도록 유전자를 개변함으로써, 달성할 수 있다. 또한, 「단백질의 아미노산 서열의 결실」이란, 단백질의 아미노산 서열의 일부 또는 전부의 영역의 결실을 말한다. 또한, 「단백질의 아미노산 서열의 결실」이란, 단백질에 있어서 원래의 아미노산 서열이 존재하지 않게 되는 것을 말하고, 원래의 아미노산 서열이 다른 아미노산 서열로 변화하는 경우도 포함된다. 즉, 예를 들어, 프레임시프트에 의해 다른 아미노산 서열로 변화한 영역은, 결실된 영역으로 간주해도 좋다. 단백질의 아미노산 서열의 결실에 의해, 전형적으로는 단백질의 전체 길이가 단축되지만, 단백질의 전체 길이가 변화하지 않거나, 혹은 연장되는 경우도 있을 수 있다. 예를 들어, 유전자의 코드 영역의 일부 또는 전부의 영역의 결실에 의해, 코드되는 단백질의 아미노산 서열에 있어서, 당해 결실된 영역이 코드하는 영역을 결실시킬 수 있다. 또한, 예를 들어, 유전자의 코드 영역으로의 종지 코돈의 도입에 의해, 코드되는 단백질의 아미노산 서열에 있어서, 당해 도입 부위보다 하류의 영역이 코드하는 영역을 결실시킬 수 있다. 또한, 예를 들면, 유전자의 코드 영역에서의 프레임시프트에 의해, 당해 프레임시프트 부위가 코드하는 영역을 결실시킬 수 있다. 아미노산 서열의 결실에서의 결실시키는 영역의 위치 및 길이에 대해서는, 유전자의 결실에서의 결실시키는 영역의 위치 및 길이의 설명을 준용할 수 있다.

염색체 상의 유전자를 상기와 같이 개변하는 것은, 예를 들면, 정상적으로 기능하는 단백질을 생산하지 않도록 개변한 파괴형 유전자를 제작하고, 당해 파괴형 유전자를 포함하는 재조합 DNA로 숙주를 형질 전환하고, 파괴형 유전자와 염색체 상의 야생형 유전자로 상동 재조합을 일으키게 함으로써, 염색체 상의 야생형 유전자를 파괴형 유전자로 치환함으로써 달성할 수 있다. 그때, 재조합 DNA에는, 숙주의 영양 요구성 등의 형질에 따라, 마커 유전자를 포함시켜 두면 조작 하기 쉽다. 파괴형 유전자로서는, 유전자의 코드 영역의 일부 또는 전부의 영역을 결실한 유전자, 미스센스 변이를 도입한 유전자, 넌센스 변이를 도입한 유전자, 프레임시프트 변이를 도입한 유전자, 트랜스포존이나 마커 유전자 등의 삽입 서열을 도입한 유전자를 들 수 있다. 파괴 유전자에 의해 코드되는 단백질은, 생성했다고 해도, 야생형 단백질과는 상이한 입체 구조를 가져, 기능이 저하 또는 소실된다.

상동 재조합에 사용하는 재조합 DNA의 구조는, 원하는 형태로 상동 재조합이 일어나는 것이면 특별히 제한되지 않는다. 예를 들면, 임의의 서열을 포함하는 선상 DNA로서, 당해 임의의 서열의 양 끝에 염색체 상의 치환 대상 부위의 상류 및 하류의 서열을 각각 구비하는 선상 DNA로 숙주를 형질 전환하여, 치환 대상 부위의 상류 및 하류에서 각각 상동 재조합을 일어나게 함으로써, 1스텝으로 치환 대상 부위를 당해 임의의 서열로 치환할 수 있다. 당해 임의의 서열로서는, 예를 들면, 마커 유전자를 포함하는 서열을 사용할 수 있다.

마커 유전자는, 숙주의 영양 요구성 등의 형질에 따라 적절히 선택할 수 있다. 예를 들어, 숙주가 pyrF 유전자 또는 pyrG 유전자의 변이에 의해 Uracil 요구성을 나타내는 경우, pyrF 유전자 또는 pyrG 유전자를 마커 유전자로서 사용함으로써, Uracil 요구성의 상보(즉 Uracil 비요구성)를 지표로 하여, 목적의 개변이 도입된 주를 선발할 수 있다. 또한, 예를 들어, sC 유전자(설페이트 퍼미아제(sulfate permiase) 유전자)의 변이에 의해 메티오닌 요구성을 나타내는 경우, sC 유전자를 마커 유전자로서 사용함으로써, 메티오닌 요구성의 상보(즉 메티오닌 비요구성)를 지표로 하여, 목적의 개변이 도입된 주를 선발할 수 있다. 또한, 마커 유전자로서는, 하이그로마이신 내성 유전자 등의 약제 내성 유전자를 사용할 수 있다.

또한, 단백질의 활성이 저하되는 개변은, 예를 들면, 돌연변이 처리에 의해 행해도 좋다. 돌연변이 처리로서는, X선의 조사, 자외선의 조사, 및 N-메틸-N'-니트로-N-니트로소구아니딘(MNGN), 에틸메탄술포네이트(EMS), 및 메틸메탄술포네이트(MMS) 등의 변이제에 의한 처리를 들 수 있다.

단백질의 활성이 저하된 것은, 이 단백질의 활성을 측정함으로써 확인할 수 있다. Pep4 단백질 및 YscB 단백질의 활성은, 예를 들면, 상술한 바와 같이 측정할 수 있다. CreA 단백질의 활성은, 예를 들어, 카타볼라이트 리프레션의 정도를 측정함으로써, 측정할 수 있다. 카타볼라이트 리프레션의 정도는, 예를 들면, 글루코오스를 탄소원으로서 포함하는 배양 조건에서의 셀룰라아제 생산을 측정함으로써, 측정할 수 있다. 즉, CreA 단백질의 활성이 저하된 것은, 구체적으로는, 예를 들면, 글루코오스를 탄소원으로서 포함하는 배양 조건에서의 셀룰라아제 생산의 향상을 지표로서, 확인할 수 있다.

단백질의 활성이 저하된 것은, 이 단백질을 코드하는 유전자의 발현이 저하된 것을 확인함으로써도, 확인할 수 있다. 유전자의 발현이 저하된 것은, 이 유전자의 전사량이 저하된 것을 확인하는 것이나, 이 유전자로부터 발현되는 단백질의 양이 저하된 것을 확인함으로써 확인할 수 있다.

유전자의 전사량이 저하된 것의 확인은. 이 유전자로부터 전사되는 mRNA의 양을 비개변주와 비교함으로써 행할 수 있다. mRNA의 양을 평가하는 방법으로서는, 노던 하이브리디제이션, RT-PCR 등을 들 수 있다(Molecular cloning(Cold Spring Harbor Laboratory Press, Cold Spring Harbor(USA), 2001)). mRNA의 양(예를 들어, 세포당의 분자수)은, 예를 들어, 비개변주의, 50% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 0%로 저하되어도 좋다.

단백질의 양이 저하된 것의 확인은, 항체를 사용하여 웨스턴 블롯에 의해 행할 수 있다(Molecular cloning(Cold Spring Harbor Laboratory Press, Cold Spring Harbor(USA), 2001)). 단백질의 양(예를 들어, 세포당의 분자수)은, 예를 들어, 비개변주의, 50% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 0%로 저하되어도 좋다.

유전자가 파괴된 것은, 파괴에 사용한 수단에 따라, 이 유전자의 일부 또는 전부의 염기 서열, 제한 효소 지도, 또는 전체 길이 등을 결정함으로써 확인할 수 있다.

형질 전환은, 예를 들면, 곰팡이나 효모 등의 진핵 미생물의 형질 전환에 통상 사용되는 수법에 의해 행할 수 있다. 그러한 수법으로서는, 프로토플래스트법을 들 수 있다.

<2> 본 발명의 방법

본 발명의 미생물을 이용하여, 목적 단백질을 제조할 수 있다. 구체적으로는, 본 발명의 미생물을 배양함으로써, 목적 단백질을 제조할 수 있다. 즉, 본 발명의 방법은, 구체적으로는, 본 발명의 미생물을 배지에서 배양하는 것을 포함하는, 목적 단백질의 제조 방법이라도 좋다.

사용하는 배지는, 본 발명의 미생물을 증식할 수 있고, 목적 단백질이 생산되는 한, 특별히 제한되지 않는다. 배지로서는, 예를 들면, 탄소원, 질소원, 인산원, 황원, 기타 각종 유기 성분이나 무기 성분으로부터 선택되는 성분을 필요에 따라 함유하는 배지를 사용할 수 있다. 배지 성분의 종류나 농도는, 당업자가 적절히 설정할 수 있다. 구체적인 배지 조성에 대해서는, 예를 들면, 탈라로마이세스 셀룰롤리티쿠스에 관한 기보(특개2003-135052, 특개2008-271826, 특개2008-271927 등)에 기재된 배지 조성이나, 트리코더마 레세이 등의 기타 각종 셀룰라아제 생산 미생물용의 배지 조성을 참조할 수 있다.

탄소원은, 본 발명의 미생물이 자화(資化)하여 목적 단백질을 생성할 수 있는 것이면, 특별히 제한되지 않는다. 탄소원으로서는, 예를 들면, 당류나 셀룰로오스계 기질을 들 수 있다. 당류로서는, 구체적으로는, 예를 들면, 글루코오스, 프룩토오스, 갈락토오스, 자일로오스, 아라비노오스, 수크로오스, 락토오스, 셀로비오스, 폐당밀, 전분 가수분해물, 바이오매스 가수분해물을 들 수 있다. 셀룰로오스계 기질로서, 구체적으로는, 예를 들면, 미결정 셀룰로오스(아비셀), 여과지, 고지(古紙), 펄프, 목재, 볏짚, 밀짚, 왕겨, 쌀겨, 밀기울, 사탕수수 버개스, 커피 지게미, 차 지게미를 들 수 있다. 셀룰로오스계 기질은, 수열분해 처리, 산 처리, 알칼리 처리, 증자(蒸煮; steaming), 폭쇄(爆碎; blasting), 분쇄 등의 전처리에 제공하고 나서 탄소원으로서 이용해도 좋다. 시판의 적합한 셀룰로오스계 기질로서는, 솔카플록(International Fiber Corp, North Tonawanda, NY, USA)을 들 수 있다. 탄소원으로서는, 1종의 탄소원을 사용해도 좋고, 2종 또는 그 이상의 탄소원을 조합하여 사용해도 좋다.

질소원으로서, 구체적으로는, 예를 들면, 황산암모늄, 염화암모늄, 인산암모늄 등의 암모늄염, 펩톤, 효모 추출물, 고기 추출물, 옥수수 침지액, 대두 단백질 분해물 등의 유기 질소원, 암모니아, 우레아를 들 수 있다. 질소원으로서는, 1종의 질소원을 사용해도 좋고, 2종 또는 그 이상의 질소원을 조합하여 사용해도 좋다.

인산원으로서, 구체적으로는, 예를 들면, 인산2수소칼륨, 인산수소2칼륨 등의 인산염, 피로인산 등의 인산 폴리머를 들 수 있다. 인산원으로서는, 1종의 인산원을 사용해도 좋고, 2종 또는 그 이상의 인산원을 조합하여 사용해도 좋다.

유황원으로서, 구체적으로는, 예를 들면, 황산염, 티오황산염, 아황산염 등의 무기 유황 화합물, 시스테인, 시스틴, 글루타티온 등의 함황 아미노산을 들 수 있다. 유황원으로서는, 1종의 유황원을 사용해도 좋고, 2종 또는 그 이상의 유황원을 조합하여 사용해도 좋다.

기타 각종 유기 성분이나 무기 성분으로서, 구체적으로는, 예를 들면, 염화나트륨, 염화칼륨 등의 무기염류; 철, 망간, 마그네슘, 칼슘 등의 미량 금속류; 비타민 B1, 비타민 B2, 비타민 B6, 니코틴산, 니코틴산아미드, 비타민 B12 등의 비타민류; 아미노산류; 핵산류; 이들을 함유하는 펩톤, 카사미노산, 효모 추출물, 대두 단백질 분해물 등의 유기 성분을 들 수 있다. 기타 각종 유기 성분이나 무기 성분으로서는, 1종의 성분을 사용해도 좋고, 2종 또는 그 이상의 성분을 조합하여 사용해도 좋다.

배양 조건은, 본 발명의 미생물을 증식할 수 있고, 목적 단백질이 생산되는 한, 특별히 제한되지 않는다. 배양은, 예를 들면, 사상균 등의 미생물의 배양에 사용되는 통상의 조건으로 행할 수 있다. 구체적인 배양 조건에 대해서는, 예를 들면, 탈라로마이세스 셀룰롤리티쿠스에 관한 기보(특개2003-135052, 특개2008-271826, 특개2008-271927 등)에 기재된 배양 조건이나, 트리코더마 레세이 등의 기타 각종 셀룰라아제 생산 미생물용의 배양 조건을 참조할 수 있다.

배양은, 예를 들어, 액체 배지를 사용하여, 호기 조건에서 행할 수 있다. 호기 조건에서의 배양은, 구체적으로는, 통기 배양, 진탕 배양, 교반 배양, 또는 그것들의 조합으로 행할 수 있다. 배양 온도는, 예를 들어, 15 내지 43℃라도 좋고, 특히 약 30℃라도 좋다. 배양 기간은, 예를 들면, 2시간 내지 20일이라도 좋다. 배양은, 회분 배양(batch culture), 유가 배양(Fed-batch culture), 연속 배양(continuous culture), 또는 그것들의 조합에 의해 실시할 수 있다. 또한, 배양 개시시의 배지를, 「초발 배지」라고도 한다. 또한, 유가 배양 또는 연속 배양에 있어서 배양계(발효조)에 공급하는 배지를, 「유가 배지」라고도 한다. 또한, 유가 배양 또는 연속 배양에 있어서 배양계에 유가 배지를 공급하는 것을, 「유가」라고도 한다. 또한, 배양은, 전 배양과 본 배양으로 나누어 실시해도 좋다. 예를 들면, 전 배양을 한천 배지 등의 고체 배지 위에서 행하고, 본 배양을 액체 배지에서 행해도 좋다. 배양은, 예를 들면, 배지 중의 탄소원이 소비될 때까지, 혹은 본 발명의 미생물의 활성이 없어질 때까지, 계속해도 좋다.

본 발명에 있어서, 각 배지 성분은, 초발 배지, 유가 배지, 또는 그 양쪽에 함유되어 있어도 좋다. 초발 배지에 함유되는 성분의 종류는, 유가 배지에 함유되는 성분의 종류와, 동일해도 좋고, 그렇지 않아도 좋다. 또한, 초발 배지에 함유되는 각 성분의 농도는, 유가 배지에 함유되는 각 성분의 농도와, 동일해도 좋고, 그렇지 않아도 좋다. 또한, 함유하는 성분의 종류 및/또는 농도가 상이한 2종 또는 그 이상의 유가 배지를 사용해도 좋다. 예를 들어, 복수회의 유가가 간헐적으로 행해지는 경우, 각 회의 유가 배지에 함유되는 성분의 종류 및/또는 농도는, 동일해도 좋고, 그렇지 않아도 좋다.

각종 성분의 농도는, 가스 크로마토그래피(Hashimoto, K. et al. 1996. Biosci. Biotechnol. Biochem. 70:22-30)나 HPLC(Lin, J. T. et al. 1998. J. Chromatogr. A. 808: 43-49)에 의해 측정할 수 있다.

상기와 같이 하여 본 발명의 미생물을 배양함으로써, 목적 단백질이 발현되고, 목적 단백질을 포함하는 배양물이 얻어진다. 목적 단백질은, 구체적으로는, 배지 중, 균체 표층, 균체 내, 또는 그것들의 조합에 축적되어도 좋다. 목적 단백질은, 특히, 배지 중에 축적되어도 좋다.

목적 단백질이 생산된 것은, 단백질의 검출 또는 동정에 사용되는 공지의 방법에 의해 확인할 수 있다. 그러한 방법으로서는, 예를 들어, SDS-PAGE, 웨스턴 블롯팅(Western blotting), 질량 분석, N말 아미노산 서열 해석, 효소 활성 측정을 들 수 있다. 이들 방법은, 1종을 단독으로 사용해도 좋고, 2종 또는 그 이상을 적절히 조합하여 사용해도 좋다.

생성된 목적 단백질은, 적절하게 회수할 수 있다. 즉, 본 발명의 목적 단백질의 제조 방법은, 생성된 목적 단백질을 회수하는 것을 포함하고 있어도 좋다. 구체적으로는, 목적 단백질은, 목적 단백질을 포함하는 적당한 획분으로서 회수할 수 있다. 그러한 획분으로서는, 예를 들면, 배양물, 배양 상청, 균체, 균체 처리물(파쇄물, 용해물, 추출물(무세포 추출액))을 들 수 있다. 균체는, 예를 들면, 아크릴아미드나 카라기난 등의 담체에 고정화된 고정화 균체의 형태로 제공되어도 좋다.

또한, 목적 단백질은, 원하는 정도로 분리 정제되어도 좋다. 목적 단백질은, 유리 상태로 제공되어도 좋고, 수지 등의 고상으로 고정화된 고정화 효소의 상태로 제공되어도 좋다.

배지 중에 목적 단백질이 축적되는 경우, 목적 단백질은, 예를 들면, 균체 등의 고형분을 원심 분리 등에 의해 배양물로부터 제거한 후, 상청으로부터 분리 정제할 수 있다.

균체 내에 목적 단백질이 축적되는 경우, 목적 단백질은, 예를 들어, 균체를 파쇄, 용해, 또는 추출 등의 처리에 제공한 후, 처리물로부터 분리 정제할 수 있다. 균체는, 원심 분리 등에 의해 배양물로부터 회수할 수 있다. 세포의 파쇄, 용해, 또는 추출 등의 처리는, 공지의 방법에 의해 행할 수 있다. 그러한 방법으로서는, 예를 들면, 초음파 파쇄법, 다이노밀법, 비드 파쇄, 프렌치 프레스 파쇄, 라이소자임 처리를 들 수 있다. 이들 방법은, 1종을 단독으로 사용해도 좋고, 2종 또는 그 이상을 적절히 조합하여 사용해도 좋다.

균체 표층에 목적 단백질이 축적되는 경우, 목적 단백질은, 예를 들면, 가용화한 후, 가용화물로부터 분리 정제할 수 있다. 가용화는, 공지의 방법에 의해 행할 수 있다. 그러한 방법으로서는, 예를 들어, 염 농도의 상승이나 계면활성제의 사용을 들 수 있다. 이들 방법은, 1종을 단독으로 사용해도 좋고, 2종 또는 그 이상을 적절히 조합하여 사용해도 좋다.

목적 단백질의 정제(예를 들어, 상기와 같은 상청, 처리물, 또는 가용화물로부터의 정제)는, 단백질의 정제에 사용되는 공지의 방법에 의해 행할 수 있다. 그러한 방법으로서는, 예를 들어, 유안(硫安) 분획, 이온 교환 크로마토그래피, 소수 크로마토그래피, 어피니티 크로마토그래피, 겔 여과 크로마토그래피, 등전점 침전을 들 수 있다. 이들 방법은, 1종을 단독으로 사용해도 좋고, 2종 또는 그 이상을 적절히 조합하여 사용해도 좋다.

또한, 배양물에는, 목적 단백질과 함께, 다른 효소, 예를 들면, 셀룰라아제나, 자일라나아제, 자일로비아제(β-자일로시다아제), 아라비노푸라노시다아제 등의 헤미셀룰라아제도 생성 축적할 수 있다. 목적 단백질은, 그러한 다른 효소와의 혼합물로서 회수되어도 좋고, 그러한 다른 효소와 분리하여 회수되어도 좋다.

회수한 목적 단백질은, 적절히, 제제화해도 좋다. 제형은 특별히 제한되지 않고, 목적 단백질의 사용 용도 등의 여러 조건에 따라 적절히 설정할 수 있다. 제형으로서는, 예를 들면, 액제, 현탁제, 산제, 정제, 환제, 캡슐제를 들 수 있다. 제제화에 있어서는, 예를 들면, 부형제, 결합제, 붕괴제, 활택제, 안정화제, 교미제, 교취제, 향료, 희석제, 계면활성제 등의 약리학적으로 허용되는 첨가제를 사용할 수 있다.

실시예

이하, 비한정적인 실시예에 의해 본 발명을 더욱 구체적으로 설명한다.

(1) Talaromyces cellulolyticus F09주 유래 yscB 유전자 결손주의 구축

Talaromyces cellulolyticus F09주(특개2016-131533)를 친주로 하여, sC 유전자를 재조합 마커로서 이용할 수 있도록, 이하의 수순에 의해 sC 유전자(서열번호 59)를 파괴하고, T. cellulolyticus F09 ΔsC주를 구축했다. F09주는, T. cellulolyticus S6-25주(NITE BP-01685)를 친주로 하여 얻어진 pyrF 유전자에 변이(일염기 치환)를 갖는 주이다. F09주는, pyrF 유전자의 변이에 의해, 우라실(Uracil) 요구성을 나타낸다.

우선, T. cellulolyticus의 sC 유전자 상류 영역, T. cellulolyticus의 sC 유전자 하류 영역의 순으로 연결된 염기 서열을 갖는 sC 유전자 파괴용 DNA 단편을 이하의 수순에 따라 작성했다. T. cellulolyticus Y-94주(FERM BP-5826, CBS 136886)의 게놈 DNA를 주형으로 하여 프라이머(서열번호 1과 2)를 사용한 PCR에 의해 sC 유전자의 상류 영역을, 프라이머(서열번호 3과 4)를 사용한 PCR에 의해 sC 유전자의 하류 영역을, 각각 증폭했다. PCR 산물은 위자드 SV 겔 및 PCR 클린-업 시스템(Wizard SV Gel and PCR Clean-Up System(Promega))을 사용하여 정제했다. 정제된 PCR 산물을 인-퓨전 HD 클로닝 키트(In-Fusion HD Cloning Kit)(타카라 바이오)에 의해 키트 부속의 pUC 플라스미드에 편입하여 연결했다. 반응물로 에스케리치아 콜라이(Escherichia coli) JM109주를 형질 전환시키고, LB 한천 배지(100mg/L 암피실린을 포함함)에서 37℃ 하룻밤 배양함으로써 콜로니를 형성시켰다. 얻어진 형질 전환체로부터 위자드 플러스 미니프렙 시스템(Wizard Plus Miniprep System)(Promega)을 사용하여 sC 파괴용 DNA 단편이 편입된 pUC-ΔsC 플라스미드를 얻었다. pUC-ΔsC 플라스미드를 주형으로 하여 프라이머(서열번호 1과 4)를 사용한 PCR에 의해 sC 파괴용 DNA 단편을 증폭하고, 에탄올 침전에 의해 농축 및 정제했다.

다음으로, F09주를 12g/L 감자 덱스트로스 브로쓰(Potato Dextrose Broth)(Difco), 20g/L 박토 한천(Bacto Agar)(Difco)을 포함하는 배지에 접종하고, 30℃에서 배양을 행했다. 한천 배지 위에 형성시킨 콜로니의 가장자리 부근을 스트로우로 펀칭하여 얻은 아가 디스크 1개를, 30g/L 글루코스, 20g/L 효모 추출물(Becton, Dickinson and Company), 1g/L 우라실, 1g/L 우리딘을 포함하는 배지에 접종하고 30℃, 120rpm으로 2일간 진탕 배양한 후, 그 전 배양액 2ml를 24g/L 감자 덱스트로스 브로쓰(Potato Dextrose Broth)를 포함하는 배지에 접종하고, 30℃, 220rpm으로 1일간 선회 배양했다. 균체를 원심 분리(5,000rpm, 5분간)로 회수하고, 10g/L Yatalase(타카라 바이오), 10mM KH₂PO₄, 0.8M NaCl을 포함하는 수용액(pH6.0)을 30mL 첨가하여, 진탕하면서 30℃에서 2시간 반응시켜, 세포벽을 소화하여 프로토플라스트화했다. 유리 필터로 잔사를 제거한 후, 원심 분리(2,000rpm, 10분간)로 프로토플라스트를 회수하고, 1.2M 소르비톨, 10mM CaCl₂를 포함하는 Tris-HCl 완충액(pH7.5)으로 1mL에 현탁하여 프로토플라스트 용액을 조제했다. 200μL의 프로토플라스트 용액에, 정제한 sC 파괴용 DNA 단편을 10μg과, 400g/L PEG4000, 10mM CaCl₂를 포함하는 Tris-HCl 완충액(pH7.5)을 50μL 첨가하고, 얼음 위에서 30분간 방치했다. 그 후 추가로 1mL의 400g/L PEG4000, 10mM CaCl₂를 포함하는 Tris-HCl 완충액(pH7.5)을 첨가하여 혼합하고, 실온에서 15분간 방치하여 형질 전환을 행했다. 원심 분리(2,000rpm, 10분간)로 회수한 프로토플라스트를 1M 슈크로스, 1mM 셀렌산나트륨, 30mg/L 메티오닌, 1g/L 우라실, 1g/L 우리딘을 포함하는 최소 배지(10g/L Glucose, 10mM NH₄Cl, 10mM KH₂PO₄, 7mM KCl, 2mM MgSO₄, 0.06mg/L H₃BO₃, 0.26mg/L (NH₄)₆Mo₇O₂₄·4H₂O, 1mg/L FeCl₃·6H₂O, 0.4mg/L CuSO₄·5H₂O, 0.08mg/L MnCl₂, 2mg/L ZnCl₂, 20g/L Bacto Agar)에 파종하고, 30℃에서 7일간 배양함으로써 셀렌산 내성주를 선발했다. sC 유전자가 파괴된 주는 셀렌산 내성 및 메티오닌 요구성을 나타내므로, 메티오닌을 포함하는 셀렌산 함유 배지에서 선발할 수 있다. 출현한 콜로니를 1mM 셀렌산나트륨, 30mg/L 메티오닌, 1g/L 우라실, 1g/L 우리딘을 포함하는 최소 배지에 접종하고, 30℃에서 4일간 배양한 후, sC 유전자가 결락하고 있는 것을 확인하여, F09 유래 sC 파괴주(F09 ΔsC주)를 얻었다.

다음으로, T. cellulolyticus F09 ΔsC주를 친주로 하여, 이하의 수순에 의해 yscB 유전자(서열번호 60)를 파괴하고, T. cellulolyticus F09 ΔyscB주를 구축했다.

우선, T. cellulolyticus의 yscB 유전자 상류 영역, T. cellulolyticus의 sC 유전자 마커(서열번호 61), T. cellulolyticus의 yscB 유전자 하류 영역의 순으로 연결된 염기 서열을 갖는 yscB 유전자 파괴용 DNA 단편을 이하의 수순에 따라 작성했다. T. cellulolyticus Y-94주(FERM BP-5826)의 게놈 DNA를 주형으로 하여 프라이머(서열번호 5와 6)를 사용한 PCR에 의해 yscB 유전자의 상류 영역을, 프라이머(서열번호 7과 8)를 사용한 PCR에 의해 yscB 유전자의 하류 영역을, 프라이머(서열번호 9와 10)를 사용한 PCR에 의해 sC 유전자 마커를, 각각 증폭했다. PCR 산물은 위자드 SV 겔 및 PCR 클린-업 시스템(Wizard SV Gel and PCR Clean-Up System)을 사용하여 정제했다. 정제된 PCR 산물을 인-퓨전 HD 클로닝 키트에 의해 키트 부속의 pUC 플라스미드에 편입하여 연결했다. 반응물로 이. 콜라이(E. coli) JM109주를 형질 전환시키고, LB 한천 배지(100mg/L 암피실린을 포함함)에서 37℃ 하룻밤 배양함으로써 콜로니를 형성시켰다. 얻어진 형질 전환체로부터 위자드 플러스 미니프렙 시스템을 사용하여 yscB 유전자 파괴용 DNA 단편이 편입된 pUC-yscB::sC 플라스미드를 얻었다. pUC-yscB::sC 플라스미드를 주형으로 하여 프라이머(서열번호 5와 8)를 사용한 PCR에 의해 yscB 유전자 파괴용 DNA 단편을 증폭하고, 에탄올 침전에 의해 농축 및 정제했다.

다음으로, F09 ΔsC주를 12g/L 감자 덱스트로스 브로쓰, 20g/L 박토 한천을 포함하는 배지에 접종하고, 30℃에서 배양을 행했다. 한천 배지 위에 형성시킨 콜로니의 가장자리 부근을 스트로우로 펀칭하여 얻은 아가 디스크 1개를, 30g/L 글루코스, 20g/L 효모 추출물, 1g/L 우라실, 1g/L 우리딘을 포함하는 배지에 접종하여 30℃, 120rpm으로 2일간 진탕 배양한 후, 그 전 배양액 2ml를 24g/L 감자 덱스트로스 브로쓰를 포함하는 배지에 접종하고, 30℃, 220rpm으로 1일간 선회 배양했다. 균체를 원심 분리(5,000rpm, 5분간)로 회수하고, 10g/L 야탈라제, 10mM KH₂PO₄, 0.8M NaCl을 포함하는 수용액(pH 6.0)을 30mL 첨가하고, 진탕하면서 30℃에서 2시간 반응시켜, 세포벽을 소화하고 프로토플라스트화했다. 유리 필터로 잔사를 제거한 후, 원심 분리(2,000rpm, 10분간)로 프로토플라스트를 회수하고, 1.2M Sorbitol, 10mM CaCl₂를 포함하는 Tris-HCl 완충액(pH 7.5)으로 1mL에 현탁하여 프로토플라스트 용액을 조제했다. 200μL의 프로토플라스트 용액에, 정제한 yscB 유전자 파괴용 DNA 단편을 10μg과, 400g/L PEG4000, 10mM CaCl₂를 포함하는 Tris-HCl 완충액(pH 7.5)을 50μL 첨가하고, 얼음 위에서 30분간 방치했다. 그 후 추가로 1mL의 400g/L PEG4000, 10mM CaCl₂를 포함하는 Tris-HCl 완충액(pH 7.5)을 첨가하여 혼합하고, 실온에서 15분간 방치하여 형질 전환을 행했다. 원심 분리(2,000rpm, 10분간)로 회수한 프로토플라스트를 1M 슈크로스, 1g/L 우라실, 1g/L 우리딘을 포함하는 최소 배지(10g/L 글루코스, 10mM NH₄Cl, 10mM KH₂PO₄, 7mM KCl, 2mM MgSO₄, 0.06mg/L H₃BO₃, 0.26mg/L (NH₄)₆Mo₇O₂₄·4H₂O, 1mg/L FeCl₃·6H₂O, 0.4mg/L CuSO₄·5H₂O, 0.08mg/L MnCl₂, 2mg/L ZnCl₂, 20g/L Bacto Agar)에 파종하고, 30℃에서 7일간 배양함으로써 메티오닌 요구성이 상보된 주를 선발했다. 출현한 콜로니를 1g/L Uracil, 1g/L Uridine을 포함하는 최소 배지에 접종하고, 30℃에서 4일간 배양한 후, yscB 유전자가 sC 유전자로 치환되어 있는 것을 확인하고, F09주 유래 yscB 유전자 파괴주(F09 ΔyscB주)를 얻었다.

(2) T. cellulolyticus F09주 유래 pep4 유전자 결손주의 구축과 배양

T. cellulolyticus F09 ΔyscB주를 친주로 하여, 이하의 수순에 의해 Pep4 프로테아제(GenBank accession Number: GAM39722.1)를 코드하는 pep4 유전자 파괴주를 구축했다.

우선, T. cellulolyticus의 pep4 유전자 상류 영역, T. cellulolyticus의 pyrF 유전자 마커(서열번호 62), T. cellulolyticus의 pep4 유전자 하류 영역의 순으로 연결된 염기 서열을 갖는 pep4 유전자 파괴용 DNA 단편을 이하의 수순에 따라 작성했다. T. cellulolyticus Y-94주(FERM BP-5826)의 게놈 DNA를 주형으로 하여 프라이머(서열번호 27과 28)를 사용한 PCR에 의해 pep4 유전자의 상류 영역을, 프라이머(서열번호 29와 30)를 사용한 PCR에 의해 pep4 유전자의 하류 영역을, 프라이머(서열번호 31과 32)를 사용한 PCR에 의해 pyrF 유전자 마커를, 각각 증폭했다. PCR 산물은 위자드 SV 겔 및 PCR 클린업 시스템을 사용하여 정제했다. 정제된 PCR 산물을 pep4 유전자의 상류 영역, 하류 영역, pyrF 마커 유전자의 조합으로 인-퓨전 HD 클로닝 키트에 의해 키트 부속의 pUC 플라스미드에 편입했다. 반응물로 이. 콜라이(E. coli) JM109주를 형질 전환시키고, LB 한천 배지(100mg/L 암피실린을 포함함)에서 37℃ 하룻밤 배양함으로써 콜로니를 형성시켰다. 얻어진 형질 전환체로부터 위자드 플러스 미니프렙 시스템을 사용하여 pep4 유전자 파괴용 DNA 단편이 편입된 pUC-pep4::pyrF 플라스미드를 얻었다. pUC-pep4::pyrF 플라스미드를 주형으로 하여 프라이머(서열번호 33과 34)를 사용한 PCR에 의해 Pep4 프로테아제 유전자 파괴용 DNA 단편을 증폭하고, 에탄올 침전에 의해 농축 및 정제했다.

다음으로, F09 ΔyscB주를 (1)과 동일한 수법으로 배양, 프로토플라스트화하고, 정제된 pep4 유전자 파괴용 DNA 단편으로 (1)과 동일하게 형질 전환을 행했다. 원심 분리(2,000rpm, 10분간)로 회수한 프로토플라스트를 1M 슈크로스를 포함하는 최소 배지에 파종하고, 30℃에서 7일간 배양함으로써 Uracil 요구성이 상보된 주를 선발했다. 출현한 콜로니를 최소 배지에 접종하여 30℃에서 4일간 배양한 후, pep4 유전자 영역이 pyrF 유전자 마커로 치환되어 있는 것을 확인하고, F09 ΔyscB주 유래 pep4 유전자 파괴주(이하, 「Δpep4주」 라고도 함)를 취득했다.

또한, 대조로서 영양 요구성을 같게 하기 위해, F09주를 친주로 하여, 이하의 수순에 의해 yscB 유전자 파괴주를 구축했다.

우선, T. cellulolyticus의 yscB 유전자 상류 영역, T. cellulolyticus의 pyrF 유전자 마커(서열번호 62), T. cellulolyticus의 yscB 유전자 하류 영역의 순으로 연결된 염기 서열을 갖는 yscB 유전자 파괴용 DNA 단편을 이하의 수순에 따라 작성했다. T. cellulolyticus Y-94주(FERM BP-5826)의 게놈 DNA를 주형으로 하여 프라이머(서열번호 5와 35)를 사용한 PCR에 의해 yscB 유전자의 상류 영역을, 프라이머(서열번호 36과 8)를 사용한 PCR에 의해 yscB 유전자의 하류 영역을, 프라이머(서열번호 31과 32)를 사용한 PCR에 의해 pyrF 유전자 마커를, 각각 증폭했다. PCR 산물은 위자드 SV 겔 및 PCR 클린업 시스템을 사용하여 정제했다. 정제된 PCR 산물을 인-퓨전 HD 클로닝 키트에 의해 키트 부속의 pUC 플라스미드에 편입했다. 반응물로 이. 콜라이(E. coli) JM109주를 형질 전환시키고, LB 한천 배지(100mg/L 암피실린을 포함함)에서 37℃ 하룻밤 배양함으로써 콜로니를 형성시켰다. 얻어진 형질 전환체로부터 위자드 플러스 미니프렙 시스템을 사용하여 yscB 유전자 파괴용 DNA 단편이 편입된 pUC-yscB::pyrF 플라스미드를 얻었다. pUC-yscB::pyrF 플라스미드를 주형으로서 프라이머(서열번호 5와 8)를 사용한 PCR에 의해 yscB 유전자 파괴용 DNA 단편을 증폭하고, 에탄올 침전에 의해 농축 및 정제했다.

다음으로, F09주를 (1)과 동일한 수법으로 배양, 프로토플라스트화하고, 정제된 yscB 유전자 파괴용 DNA 단편으로 (1)과 동일하게 형질 전환을 행했다. 원심 분리(2,000rpm, 10분간)로 회수한 프로토플라스트를 1M 슈크로스를 포함하는 최소 배지에 파종하고, 30℃에서 7일간 배양함으로써 우라실 요구성이 상보된 주를 선발했다. 출현한 콜로니를 최소 배지에 접종하여 30℃에서 4일간 배양한 후, yscB 유전자 영역이 pyrF 유전자 마커로 치환되어 있는 것을 확인하고, 프로테아제 활성 평가의 대조용 F09주 유래 yscB 유전자 파괴주(이하, 「대조주」라고도 한다)를 얻었다.

대조주 및 Δpep4주를, 12g/L 감자 덱스트로스 브로쓰, 20g/L 박토 한천을 함유하는 배지에 접종하고, 30℃에서 배양을 행했다. 한천 배지 위에 형성시킨 콜로니의 가장자리 부근을 스트로우로 펀칭하여 얻은 아가 디스크 1개를 파쇄한 후, 14mL용(容) 폴리프로필렌 라운드 튜브(Corning)에 옮겨, 2mL의 5g/L 감자 덱스트로스 브로쓰를 포함하는 액체 배지를 첨가한 후, 30℃, 120rpm으로 2일간, 왕복 진탕 배양을 행했다. 배양액 전량을 40g/L Solka Floc(R)(International Fiber Corporation), 1g/L 옥수수 침지액(Corn steep liquor)(Sigma-Aldrich, Lot number: MKBN0183V), 24g/L KH₂PO₄, 5g/L (NH₄)₂SO₄, 4g/L 우레아, 1g/L Tween80, 1.2g/L MgSO₄·7H₂O, 0.01g/L ZnSO₄·7H₂O, 0.01g/L MnSO₄·5H₂O, 0.01g/L CuSO₄·5H₂O를 포함하는 액체 배지 20mL에 접종하고, 300mL용 삼각 플라스크를 사용하여 10일간 선회 진탕 배양을 행했다(30℃, 220rpm). 얻어진 배양액을 15,000rpm으로 5분 원심 분리한 후, 0.22㎛의 필터에 통과시킴으로써 배양액 상청을 취득했다.

(3) 펩스타틴 A의 존재 하 및 비존재 하에서의 T. cellulolyticus 배양액 상청의 프로테아제 활성 측정

각 균주의 배양액 상청의 단백질 농도를 프로틴 어세이 CBB(나카라이 테스크)를 사용하여 측정했다. 카제인에 대한 프로테아제 활성을 확인하기 위해, Amplite(TM) 범용 형광측정 프로테아제 활성 검정 키트(niversal Fluorimetric Protease Activity Assay Kit) *그린(Green)(AAT Bioquest, Inc.)을 사용하여 프로테아제 활성을 측정했다. 동시에, 아스파라긴산 프로테아제 저해제 펩스타틴 A를 첨가한 조건에서도 프로테아제 활성을 측정했다.

키트 부속 프로테아제 기질(녹색 형광 카제인 기질) 0.5μL를 포함하는 키트 부속의 2×어세이 버퍼 50μL를 96웰 플레이트(Greiner, 제품 번호: 655090)에 분주하고, 대조주 및 Δpep4주의 배양액 상청 50μL를 각 웰에 각각 첨가했다. 또한, 펩스타틴 A 첨가 조건에서는, 펩스타틴 A(Sigma-Aldrich, 제품 번호 P2032)를 종농도 10μM가 되도록 첨가했다. 마이크로플레이트 리더 시스템 SpectraMax(R) M2(Molecular Devices)를 사용하여 37℃에서 2분 간격으로 상대적 형광성 단위(Relative Fluorescence Units)(RFU, 여기/방출(excitation/emission)=490/525nm)를 측정함으로써 프로테아제 활성을 측정했다. 얻어진 RFU를 측정에 사용한 총 단백질량과 반응 시간으로 나눔으로써 배양액 상청 총 단백질당 프로테아제 비활성(比活性)을 산출했다.

결과를 표 1에 나타낸다. 표 중, 「상대 활성」은, 펩스타틴 A 비존재 하에서의 대조주의 프로테아제 비활성에 대한, 각 샘플의 프로테아제 비활성의 비율을 나타낸다. 펩스타틴 A의 비존재 하에서는, Δpep4주의 배양액 상청의 프로테아제 비활성은 대조주의 약 36%까지 저하했다. 또한, 대조주의 배양액 상청의 프로테아제 비활성의 대부분(약 88%)이, 펩스타틴 A에 의해 저해되었다. 한편, Δpep4주의 배양액 상청의 프로테아제 비활성은 펩스타틴 A의 존재 하 및 비존재 하에서 거의 변화가 없었다. 이것으로부터, T. cellulolyticus의 세포외 프로테아제 활성의 대부분이 아스파라긴산프로테아제 유래이며, 아스파라긴산프로테아제 유래의 프로테아제 활성의 대부분은 Pep4 프로테아제로부터 유래하는 것으로 나타났다. 이상의 결과로부터, T. cellulolyticus의 배양액 상청 중의 프로테아제 활성의 대부분이 Pep4 프로테아제에 유래하고 있으며, Pep4 프로테아제는 T. cellulolyticus를 숙주로 하여 이종 단백질을 발현시킬 때에 결실시켜야 할 중요한 프로테아제인 것으로 생각되었다.

(4) T. cellulolyticus 배양액 상청에 의한 인간 IgG(트라스투주맙) 분해 활성의 평가

대조주 및 Δpep4주의 배양액 상청에 포함되는 프로테아제에 의한 트라스투주맙 분해 활성을 확인하기 위해, 24g/L KH₂PO₄, 5g/L (NH₄)₂SO₄, 2g/L 우레아, 1g/L Tween80, 1.2g/L MgSO₄·7H₂O, 0.01g/L ZnSO₄·7H₂O, 0.01g/L MnSO₄·5H₂O, 0.01g/L CuSO₄·5H₂O를 포함하는 실제 액체 배양에 사용하는 배지를 모방한 용액(pH 4.3)에 0.5g/L 허셉틴(R)(츄가이 세이야쿠, 트라스투주맙(유전자 재조합))을 용해했다. 이 허셉틴 용액 90μL에 대하여, 총 단백질 농도 0.2g/L가 되도록 물로 희석한 대조주 혹은 Δpep4주의 배양액 상청, 또는 물을, 10μL 첨가했다. 또한, 95℃에서 5분간 처리함으로써 프로테아제 활성을 실활시킨 대조주 및 Δpep4주의 배양액 상청(총 단백질 농도 0.2g/L)을 상기 허셉틴 용액 90μL에 대하여 각각 10uL 첨가했다. 각 혼합액을 37℃에서 3일간 인큐베이트했다.

다음으로, 인큐베이트 후의 각 혼합액을 샘플로 하여 웨스턴 블로팅을 실시했다. 물로 20배 희석한 각각의 샘플 3μL에 대하여 물 2μL 및 Laemmli 버퍼 5μL를 첨가하고, 70℃에서 10분간 가열한 후, 전량을 Any kD(TM) 미니프로티안(R) TGX(TM) 프리캐스트 겔(Bio-rad)에 로드하고, 단백질 분자량 마커인 A Precision Plus Protein Dual Color Standard(Bio-Rad)와 함께 200V로 40분간 영동(泳動)했다. iBind 웨스턴 디바이스(Western Device)(ThermoFisher)를 사용하여 겔 중의 단백질을 PVDF막(Invitrogen)으로 전사하고, 5배 희석한 iBind(TM) FD 용액(Invitrogen)으로 1:20,000으로 희석한 항-사람 IgG F(ab')2, F(ab')2 단편, 염소에서 생성된 고도의 교차 흡수된-퍼옥시다제 항체(highly cross absorbed-Peroxidase antibody produced in goat)(Sigma-Aldrich, 제품 번호: SAB3701242)를 사용하여 프로브했다. ECL 프라임 웨스턴 블롯팅 검출 시약(Prime Western Blotting Detection Reagent)(GE 헬스케어)를 PVDF막에 첨가함으로써 ECL(증진된 화학 발광(Enhanced Chemi Luminescence)) 반응을 행하고, Amersham Imager 600(GE 헬스케어)을 사용하여 그 발광을 검출했다.

결과를 도 1에 나타낸다. 물 또는 프로테아제 활성을 실활시킨 배양액 상청과 허셉틴(R)을 인큐베이트한 샘플에서는, 트라스투주맙 전장을 나타내는 밴드만이 검출되었다. 한편, 대조주의 배양액 상청과 허셉틴(R)을 인큐베이트한 샘플에서는, 트라스투주맙의 분해물을 나타내는 밴드가 저분자량 측(150kD 부근)에 검출되었기 때문에, 트라스투주맙의 일부가 분해되어 있다고 생각되었다. Δpep4주의 배양액 상청과 허셉틴(R)을 인큐베이트한 샘플에서는, 트라스투주맙 분해물을 나타내는 밴드는 거의 검출되지 않았다. 이것으로부터, 대조주의 배양액 상청에 포함되는 Pep4 프로테아제가, 트라스투주맙의 효소 의존적 분해의 대부분에 기여하고 있던 것이 분명해지고, Pep4 프로테아제는, T. cellulolyticus를 숙주로 하여 이종 단백질(예를 들면, 트라스투주맙 등의 IgG)을 분비 발현시킬 때에 결실시켜야 할 중요한 프로테아제인 것으로 생각되었다.

(5) T. cellulolyticus의 트라스투주맙 생산주에서의 Pep4 프로테아제 유전자 파괴 효과의 평가

T. cellulolyticus F09 ΔyscB주를 친주로 하여, 이하의 수순에 의해 트라스투주맙 발현주를 구축했다.

우선, T. cellulolyticus의 creA 유전자 상류 영역, T. cellulolyticus의 cbh2 유전자 상류 영역(프로모터; 서열번호 63), T. cellulolyticus의 CBH1 분비 시그널 서열(서열번호 64), 트라스투주맙 중쇄 유전자(서열번호 65), T. cellulolyticus의 cbh1 유전자 하류 영역(터미네이터; 서열번호 66), T. cellulolyticus의 pyrF 유전자 마커(서열번호 62), T. cellulolyticus의 cbh2 유전자 상류 영역(프로모터; 서열번호 63), T. cellulolyticus의 CBH1 분비 시그널 서열(서열번호 64), 트라스투주맙 경쇄 유전자(서열번호 67), T. cellulolyticus의 cbh2 유전자 하류 영역(터미네이터; 서열번호 68), T. cellulolyticus의 creA 유전자 하류 영역의 순으로 연결된 염기 서열을 갖는 트라스투주맙 발현용 DNA 단편을 이하의 수순에 따라 작성했다. T. cellulolyticus Y-94주(FERM BP-5826)의 게놈 DNA를 주형으로 하여 프라이머(서열번호 37과 38)를 사용한 PCR에 의해 creA 유전자의 상류 영역을, 프라이머(서열번호 39와 40)를 사용한 PCR에 의해 cbh2 유전자의 상류 영역을, 프라이머(서열번호 41과 42)를 사용한 PCR에 의해 CBH1 분비 시그널 서열을, 프라이머(서열번호 43과 44)를 사용한 PCR에 의해 cbh1 유전자의 하류 서열을, 프라이머(서열번호 31과 32)를 사용한 PCR에 의해 pyrF 유전자 마커를, 프라이머(서열번호 45와 40)를 사용한 PCR에 의해 cbh2 유전자의 상류 영역을, 프라이머(서열번호 41과 46)를 사용한 PCR에 의해 CBH1 분비 시그널 서열을, 프라이머(서열번호 47과 48)를 사용한 PCR에 의해 cbh2 유전자의 하류 서열을, 프라이머(서열번호 49와 50)를 사용한 PCR에 의해 creA 유전자 하류 영역을, 각각 증폭시켰다. 또한, 유로핀 가부시키가이샤로부터 구입한 전체 합성 유전자를 주형으로 하여 프라이머(서열번호 51과 52)를 사용한 PCR에 의해 트라스투주맙 중쇄 유전자를, 프라이머(서열번호 53과 54)를 사용한 PCR에 의해 트라스투주맙 경쇄 유전자를 증폭시켰다. PCR 산물은 위자드 SV 겔 및 PCR 클린업 시스템(Wizard SV Gel and PCR Clean-Up System)을 사용하여 정제했다. 정제한 PCR 산물을 2종류씩 혼합한 것을 주형으로 하고, 다시 PCR을 행하여 연결하는 것을 반복한 후, 인-퓨전 HD 클로닝 키트에 의해 키트 부속의 pUC 플라스미드에 편입했다. 반응물로 이. 콜라이(E. coli) JM109주를 형질 전환시키고, LB 한천 배지(100mg/L 암피실린을 포함함)에서 37℃ 하룻밤 배양함으로써 콜로니를 형성시켰다. 얻어진 형질 전환체로부터 위자드 플러스 미니프렙 시스템(Wizard Plus Miniprep System)을 사용하여 트라스투주맙 발현용 DNA 단편이 편입된 pUC-creA:: Pcbh2-Her_H-pyrF-Pcbh2-Her_L 플라스미드를 얻었다. pUC-creA::Pcbh2-Her_H-pyrF-Pcbh2-Her_L 플라스미드를 주형으로 하여 프라이머(서열번호 37과 50)를 사용한 PCR에 의해 트라스투주맙 발현용 DNA 단편을 증폭하고, 에탄올 침전에 의해 농축 및 정제했다. 또한, 트라스투주맙 발현 서열의 양 끝에 creA 유전자의 상류 및 하류 서열을 연결함으로써, 게놈 위의 랜덤한 위치가 아니라 creA 유전자 영역을 노려 트라스투주맙 발현 서열을 삽입하는 것을 가능하게 하고 있다.

다음으로, F09 ΔyscB주를 (1)과 동일한 수법으로 배양, 프로토플라스트화하고, 정제한 트라스투주맙 발현용 DNA 단편으로 (1)과 동일하게 형질 전환을 행했다. 원심 분리(2,000rpm, 10분간)로 회수한 프로토플라스트를 1M 슈크로스를 포함하는 최소 배지에 파종하고, 30℃에서 7일간 배양함으로써 Uracil 요구성이 상보된 주를 선발했다. 출현한 콜로니를 최소 배지에 접종하고 30℃에서 4일간 배양한 후, creA 유전자 영역이 트라스투주맙 발현 서열로 치환되어 있는 것을 확인하고, F09 ΔyscB주 유래 트라스투주맙 발현주를 얻었다.

다음으로, F09 ΔyscB주 유래 트라스투주맙 발현주를 친주로 하여, 이하의 수순에 의해 pep4 유전자 파괴주를 구축했다.

우선, T. cellulolyticus의 pep4 유전자 상류 영역, 하이그로마이신 내성 유전자 마커(서열번호 69), T. cellulolyticus의 pep4 유전자 하류 영역의 순으로 연결된 염기 서열을 갖는 pep4 유전자 파괴용 DNA 단편을 이하의 수순에 따라 작성했다. T. cellulolyticus Y-94주(FERM BP-5826)의 게놈 DNA를 주형으로 하여 프라이머(서열번호 27과 55)를 사용한 PCR에 의해 pep4 유전자의 상류 영역을, 프라이머(서열번호 56과 30)를 사용한 PCR에 의해 pep4 유전자의 하류 영역을, 각각 증폭했다. 또한, 하이그로마이신 내성 유전자가 탑재된 pcDNA3.1/Hygro(+)(LifeTechnologies)를 주형으로 하여 프라이머(서열번호 57과 58)를 사용한 PCR에 의해, 하이그로마이신 내성 유전자(프로모터와 터미네이터를 포함함)를 증폭했다. PCR 산물은 위자드 SV 겔 및 PCR 클린-업 시스템을 사용하여 정제했다. 정제된 PCR 산물을 인-퓨전 HD 클로닝 키트에 의해 키트 부속의 pUC 플라스미드에 편입하여 연결했다. 반응물로 이. 콜라이(E. coli) JM109주를 형질 전환시키고, LB 한천 배지(100mg/L 암피실린을 포함함)에서 37℃ 하룻밤 배양함으로써 콜로니를 형성시켰다. 얻어진 형질 전환체로부터 위자드 플러스 미니프렙 시스템을 사용하여 pep4 유전자 파괴용 DNA 단편이 편입된 pUC-pep4::hyg 플라스미드를 얻었다. pUC-pep4::hyg 플라스미드를 주형으로 하여 프라이머(서열번호 27과 30)를 사용한 PCR에 의해 pep4 유전자 파괴용 DNA 단편을 증폭하고, 에탄올 침전에 의해 농축 및 정제했다.

다음으로, F09 ΔyscB주 유래 트라스투주맙 발현주를 (1)과 동일한 수법으로 배양, 프로토플라스트화하고, 정제된 pep4 유전자 파괴용 DNA 단편으로 (1)과 동일하게 형질 전환을 행했다. 원심 분리(2,000rpm, 10분간)로 회수한 프로토플라스트를 1M 슈크로스를 포함하는 최소 배지에 파종하고, 30℃에서 1일간 배양한 후, 0.5g/L 하이그로마이신 B, 24g/L 감자 덱스트로스 브로쓰, 7g/L 박터 한천을 포함하는 배지를 중층하고, 추가로 30℃에서 3일간 배양함으로써 하이그로마이신 내성주를 선발했다. 출현한 콜로니를 0.5g/L 하이그로마이신 B를 포함하는 최소 배지에 접종하고, 30℃에서 4일간 배양한 후, pep4 유전자가 하이그로마이신 내성 유전자로 치환되어 있는 것을 확인하고, F09 ΔyscB주 유래 트라스투주맙 발현주의 pep4 유전자 파괴주를 얻었다.

F09 ΔyscB주 유래 트라스투주맙 발현주 및 그 pep4 유전자 파괴주를, 12g/L 감자 덱스트로스 브로쓰(Difco), 20g/L 박토 한천(Difco)을 포함하는 배지에 접종하고, 30℃에서 배양을 행했다. 한천 배지 위에 형성시킨 콜로니의 가장자리 부근을 스트로우로 펀칭하여 얻은 아가 디스크 1개를, 30g/L 글루코스, 20g/L 효모 추출물, 1g/L 우라실, 1g/L 우리딘을 포함하는 배지에 접종하여 30℃, 120rpm으로 2일간 진탕 배양한 후, 그 전 배양액 2ml를 20mL의 40g/L Solka Floc, 10g/L Pharmamedia(Archer Daniels Midland Company), 24g/L KH₂PO₄, 5g/L (NH₄)₂SO₄, 4g/L 우레아, 4.7g/L 칼륨 나트륨 (+)-타르트레이트 테트라하이드레이트, 1g/L Tween80, 1.2g/L MgSO₄·7H₂O, 0.01g/L ZnSO₄·7H₂O, 0.01g/L MnSO₄·5H₂O, 0.01g/L CuSO₄·5H₂O를 포함하는 액체 배지에 접종하고, 30℃, 220rpm으로 7일간 배양을 행했다. 얻어진 배양액을 0.22㎛의 필터에 통과시켜, 배양액 상청을 얻었다.

F09 ΔyscB주 유래 트라스투주맙 발현주 및 그 pep4 유전자 파괴주의 트라스투주맙 및 트라스투주맙 분해물의 분비 생산량을 확인하기 위해, (4)와 동일한 수법으로 웨스턴 블로팅을 실시했다.

결과를 도 2에 나타낸다. F09 ΔyscB주 유래 트라스투주맙 발현주와 비교하여 F09 ΔyscB주 유래 트라스투주맙 발현주의 pep4 유전자 파괴주에서는, 전장 트라스투주맙의 양에 대한 트라스투주맙 분해물의 양의 비율이 감소하고 있었다. 이것으로부터, pep4 유전자를 파괴함으로써, 트라스투주맙의 분해가 억제되어 있는 것이 시사되었다. 이상의 결과로부터, Pep4 프로테아제가 T. cellulolyticus를 숙주로 하여 이종 단백질(예를 들어, 트라스투주맙 등의 IgG)을 분비 발현시킬 때에 결실시켜야 할 중요한 프로테아제인 것이 나타났다.

[산업 상의 이용 가능성]

본 발명에 의해, 단백질을 효율적으로 제조할 수 있다.

<서열표의 설명>

서열번호 1 내지 58: 프라이머

서열번호 59: Talaromyces cellulolyticus S6-25주의 sC 유전자의 염기 서열

서열번호 60: Talaromyces cellulolyticus S6-25주의 yscB 유전자의 염기 서열

서열번호 61: sC 유전자 마커의 염기 서열

서열번호 62: pyrF 유전자 마커의 염기 서열

서열번호 63: Talaromyces cellulolyticus의 cbh2 프로모터의 염기 서열

서열번호 64: Talaromyces cellulolyticus의 Cbh1 시그널 펩티드를 코드하는 염기 서열

서열번호 65: 트라스투주맙 중쇄 유전자의 염기 서열

서열번호 66: cbh1 터미네이터의 염기 서열

서열번호 67: 트라스투주맙 경쇄 유전자의 염기 서열

서열번호 68: cbh2 터미네이터의 염기 서열

서열번호 69: 하이그로마이신 내성 유전자 마커의 염기 서열

서열번호 70: Talaromyces cellulolyticus Y-94주의 pep4 유전자의 염기 서열

서열번호 71: Talaromyces cellulolyticus Y-94주의 Pep4 단백질의 아미노산 서열

서열번호 72: Talaromyces cellulolyticus의 Cbh1 시그널 펩티드의 아미노산 서열

서열번호 73: Talaromyces cellulolyticus S6-25주의 YscB 단백질의 아미노산 서열

서열번호 74: Talaromyces cellulolyticus S6-25주의 creA 유전자의 염기 서열

SEQUENCE LISTING <110> Ajinomoto Co., Inc. <120> METHOD FOR PRODUCING PROTEIN <130> H051-210461 <150> JP2020-101310 <151> 2020-06-11 <160> 74 <170> PatentIn version 3.5 <210> 1 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 1 cggtacccgg ggatcccctt cttgccagca cactgctccg 40 <210> 2 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 2 agctgcgagg tcaacggcta agcgccagtt tggtgaatcc 40 <210> 3 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 3 aactggcgct tagccgttga cctcgcagct ggcacgggat 40 <210> 4 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 4 cgactctaga ggatccgcca agggatccgt gagatcgcat 40 <210> 5 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 5 cggtacccgg ggatcttggg gcacagagac aacagggtca 40 <210> 6 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 6 acctgactcg accggagata gcgtgagcac actgagcagg 40 <210> 7 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 7 gcttgttgac ctcgccaaca cgctacctct tccacagtag 40 <210> 8 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 8 cgactctaga ggatcgagct gattgagcat gctaacgcag 40 <210> 9 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 9 ccggtcgagt caggtattca tatca 25 <210> 10 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 10 gcgaggtcaa caagcctcaa accct 25 <210> 11 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 11 cggtacccgg ggatcagcaa ccccaccgta atctcaaggt 40 <210> 12 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 12 ccgatctgaa ttgacattcg gatggacttt ttgaaggcca 40 <210> 13 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 13 tcggcgttca cttatgaggt tgacttgata gtcgatcgct 40 <210> 14 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 14 cgactctaga ggatcgttat tgctgttgct gttgtggttg 40 <210> 15 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 15 cggtacccgg ggatccatag cctcatgacc aatgaccggt 40 <210> 16 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 16 ccgatctgaa ttgacgtcga tgaagtcgtc gggggtatgt 40 <210> 17 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 17 tcggcgttca cttatcggct caatatgcaa taggtgttcc 40 <210> 18 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 18 cgactctaga ggatctaggg ctaaccagca gggtaccgcc 40 <210> 19 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 19 cggtacccgg ggatctagac gttagaactc tccccactgt 40 <210> 20 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 20 ccgatctgaa ttgaccttgc cgcttgaagt tgtatgaaat 40 <210> 21 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 21 tcggcgttca cttatgtgtt gcattcaaag atggctgcct 40 <210> 22 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 22 cgactctaga ggatccggcg tttgagctcc tggagtaaga 40 <210> 23 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 23 cggtacccgg ggatcaattc cgacagtgtc gtgctccagc 40 <210> 24 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 24 ccgatctgaa ttgacggcgg gcgattgata atgatgttgt 40 <210> 25 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 25 tcggcgttca cttatctagc gacgaggtca cgattatgag 40 <210> 26 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 26 cgactctaga ggatcacaag accttcaatc tctccaggag 40 <210> 27 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 27 cggtacccgg ggatctacac gcaagggaag aagtaagagc 40 <210> 28 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 28 ccgatctgaa ttgacgatgg ccaaccaacg ctaatgtatc 40 <210> 29 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 29 tcggcgttca cttatatcgg ttgacgggtt gctgaaatgc 40 <210> 30 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 30 cgactctaga ggatctagtc gcaggacgga atcgaacag 39 <210> 31 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 31 gtcaattcag atcggctgcc gcctg 25 <210> 32 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 32 ataagtgaac gccgagtcag tacta 25 <210> 33 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 33 cccagtcacg acgttgtaaa acgacg 26 <210> 34 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 34 caggaaacag ctatgaccat gattac 26 <210> 35 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 35 ccgatctgaa ttgacagata gcgtgagcac actgagcagg 40 <210> 36 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 36 tcggcgttca cttatcaaca cgctacctct tccacagtag 40 <210> 37 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 37 cggtacccgg ggatcagcgc agaccaatgc cagaggagaa 40 <210> 38 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 38 gcgcgagttg cgcgatgaaa tttat 25 <210> 39 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 39 tcgcgcaact cgcgctgcta tgcagttgat gctactgtgt 40 <210> 40 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 40 agttgctaaa tgatcaagaa gcttcacttt 30 <210> 41 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 41 gttgaagctc agcaaattgg tacttatacc gctgaaaccc 40 <210> 42 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 42 gacgagctgg acttcctgag caccagctgt tgccagcaag 40 <210> 43 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 43 taaattttca cttctttctt cgcctattga 30 <210> 44 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 44 ccgatctgaa ttgacccgaa aacggtaagg cgtagttata gaaat 45 <210> 45 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 45 tcggcgttca cttattgcta tgcagttgat gctactgtgt 40 <210> 46 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 46 tgtcatctgg atgtcctgag caccagctgt tgccagcaag 40 <210> 47 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 47 tagatcagct ttgagtgcag caaaa 25 <210> 48 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 48 gcttgtttga gaatacatga ggttgcc 27 <210> 49 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 49 tattctcaaa caagccctct ttctcgccct ttcttctcaa 40 <210> 50 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 50 cgactctaga ggatcaaccg tcgatcagaa ggagcgcaat 40 <210> 51 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 51 gaagtccagc tcgtcgagtc tggtg 25 <210> 52 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 52 agaagtgaaa atttatttac caggagacaa ggacaga 37 <210> 53 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 53 gacatccaga tgacacagtc ccctt 25 <210> 54 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 54 ctcaaagctg atctaacact caccacggtt gaaggactta 40 <210> 55 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 55 agatagggtt gagtggatgg ccaaccaacg ctaatgtatc 40 <210> 56 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 56 tagctagagc ttggcatcgg ttgacgggtt gctgaaatgc 40 <210> 57 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 57 cactcaaccc tatctcggtc t 21 <210> 58 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 58 gccaagctct agctagaggt cgacg 25 <210> 59 <211> 1988 <212> DNA <213> Talaromyces cellulolyticus <400> 59 atggcaaacc ctcctcacgg tggtatcctc aaggacttgg tggcccgcga tgcccctcgt 60 catgccgagc tcgaggctga agctgccacc ctacctgcta ttcttctcac agaacgccaa 120 ttgtgtgatt tggagttgat tatgaatggt ggtttcagtc ctcttgaagg taagtctttt 180 tgtcgcacgc gatcgagaag attattagct aacatttttc ttctataggt ttcatgaacg 240 agaaagatta cgatgggtat gcaacatatc ttgcgcgcgc agtgaaagga acaattttct 300 gactgactta gtgttgtcgc cgaatctcgc ctcgccgatg gcaacctttt ctccatgccc 360 attactctcg atgcctctgg cgaaaccatt aaagaccttg gcttgaaggc tggatctcgt 420 gtcacattac gcgatttccg tgacgaccgc aaccttgcta ttttgaccat tgatgatatc 480 taccgccctg acaagtgagt cctgcaatca gcttgtgcga cgaaacatgc tgaccccttt 540 taccaggacg aaagaagccc agctcgtctt tggaggtgac gaagagcacc ccgctatcgt 600 atatctcaat accaaggttc aggagttcta cattggagga aaggtcgaag ctgttaacaa 660 acttgcccac tacgactatg tcgctctccg atgtgagtta ctattcaaca gagacaatag 720 tacatagact aaccatgtag acactcccgc tgaattgcgc acacacttcg acaagctcgg 780 ctggacccga gttgttgctt tccagaccag gtatgctaaa agcagacgat aggagttatt 840 tgaatgtcac tgacactagt agaaacccca tgcatcgtgc tcaccgtgaa ttgaccgtcc 900 gcgctgcccg tgctcgtcaa gccaatgtgc tcatccaccc cgtcgtcggt ctcaccaagc 960 ccggtgacat tgaccacttc acccgtgtcc gtgtctacca agcccttctt cctcgttacc 1020 ccaacggcat ggctgtcctc ggtcttttgc ctcttgctat gcgtatgggt ggtcctcgtg 1080 aggccatctg gcacgccatt atccgtaaga accacggtgc cacccacttc attgtcggac 1140 gtgaccacgc cggtcccgga aagaactcca agggtgtcga attttacggt ccttacgatg 1200 ctcagcatgc tgttgagaag tacaggtctg agttgggtat tgaggtggtt gaattccagc 1260 aggttaccta cctgcctgat accgacgagt acaagcctgt taatgaggtt tctgccggtg 1320 taaagactct tgatatctct ggtactgagc tcaggagacg tcttcgctcg ggtgctcaca 1380 tcccagagtg gttctcttac cctgaggtca tcaaggttct ccgcgagtcc aacccccctc 1440 gcaatgctca aggtttcacc gtcttcctca ctggatacca gaactctggc aaggacgcca 1500 ttgcccgcgc tcttcaagtg actctcaacc agcaaggtgg ccggtccgtc tcgctcttgt 1560 tgggagagac cgtccgtcac gagctttcct cagagcttgg tttcagccgc gaagaccgcg 1620 acaaaaacat tcaacgtatt gcctttgtcg ctgccgagct caccaaggcc ggtgctgccg 1680 ttatcgctgc acccatcgct ccttacgaat catcccgaaa ggctgccaaa gacaccatct 1740 ccgcagtcgg cacattcatt ctcgtccacg tcgccacccc tcttgagtac tgcgagaaga 1800 ccgacaagcg cggaatctac gcgaaggccc gccgcggcga gatcaagggc ttcactggtg 1860 tcgatgaccc atacgaggct cccgccaagg ccgacctcgt ggtcgacgtt gagaagcaga 1920 gtgtccgcag tatcgtgcac gagattgtct tgattctcga gagccaggga ttcctcgatc 1980 ggtcttag 1988 <210> 60 <211> 1589 <212> DNA <213> Talaromyces cellulolyticus <400> 60 atgaagggcg tcctcagcct ttcgctgctg ccgttgttga cggttgcgtc accggtgatg 60 ccgcgcacca tccacaacga cgctgctccc attctctctt cgtccaacgc cgttgaggtc 120 ccagattcat atatcattgt ctttaaagac catgtagatt ctgcttctgc cgcagcccat 180 cataactggg tgcaagacat tcacagccaa cacaccgagc tccgaaagcg gtctcaattc 240 ccattcgctg acaatgcctt tgccggtctc aaacacactt ttgacattgc cggcagcttc 300 cttggttact caggacactt cgaagagaat gtcattgagg ccattcgccg acaccccgat 360 gtgagttatc cgcacgtgcc ctactcctaa ggcaatgact aatacgcatc tccacctata 420 ggttgattac atcgagaagg attctcttgt ccacaccatg gaagatcccg cccttgagaa 480 gaacgcccca tggggtttgg ctcgtatttc gcaccgtgag agcttgagct tcggaagctt 540 caacaagtac ttgtacgctg ccgacggcgg tgaaggtgtt gacgtttatg tcattgacac 600 tggtaccaac atcgaccacg tcgacttcga gggtcgtgct tcctggggca agaccatccc 660 cactgacgat gaggatgttg atggcaatgg tcacggtact cactgctccg gaactattgc 720 gggcaagaag tacggtgttg ccaagaaggc caatgtctac gctgtcaagg tcttgaagtc 780 taacggttct ggaaccatgt ccgatgtcgt tcagggtgtc gaatgggctg ctactcagca 840 catcaagaag gtcaaggacg ccaaggccgg aaaagccaag ggcttcaagg gtagcgctgc 900 gaacatgagt ctcggtggtg gcaagtccgt cactcttgac aaggctgtca atgctgctgt 960 tgatgctggt atccacttcg ctgtcgctgc tggcaacgac aacgccgact cctgcaacta 1020 ctcccctgcc gccgctgaga aggccgtcac cgtcggagcc tcgaccttgg ccgatgagcg 1080 tgcttacttc tccaactacg gcaagtgcaa cgacatcttt gctcctggtc tgaacattct 1140 ctctacctgg atcggcagca agtacgccgt caacaccatc tccggtacct ccatggcttc 1200 tcctcacatt gctggtcttt tggcctactt cctctctctc cagcctgcca gtgactccgc 1260 cttcgctgtt gccgagatta ctcccaagaa gttgaaggag aacctcattg ctattggtac 1320 ccagggcgct cttactgatg ttccctctga caccactaac gtaagttgac tctgttagtc 1380 tttcaatgca ttatcaacta acaactgtgt catagattct cgcctggaac ggtggtggct 1440 cagccaacta caccgacatc attgcccaag gtggttacaa gaccaagaca ctcagcaacg 1500 aagttgacga attgatcaac aagttggagg tcgtgaacga ggaactcggt gccatctaca 1560 gccacatcaa ggatgccatt gccgcataa 1589 <210> 61 <211> 3534 <212> DNA <213> Talaromyces cellulolyticus <400> 61 ccggtcgagt caggtattca tatcatccat tcatggattg ttatctgtga acacaacgcc 60 aacgttgcaa aatccggcca tttgatggca cggtttaaat gtcccttgct cattggggat 120 gaaaatattc aacgtaagtt ctacatcctt ggctatcaat gtcgcttgcc gggtcaaatc 180 attcaatact gtcctggaca gtcctctttc caaccggtgg agtaatctag gcaaggttca 240 ttcggcaagt ttcctaggca tcatggttcc aaaaagtgaa aaaagagact gggagaatca 300 tatatccatc tcagcctata tggctacgtc ttgaacagtg accttgccat aaatggcgac 360 atgaagtagg gttagggcta gggcttttct caggttatgg catcataagt cttggcaggg 420 acgttaatgt tagcatgcaa tcacgcaagc cgccaagccg atgtcgtgat tgcttttctg 480 tctggaactg gcagccgcta aactgtaatg ggattcacca aactggcgct tagccagata 540 tagtctagtg tctgatctct tgtttaaaaa tttcgcaatg tattgattgt attcaaatgt 600 agtaagtgta ttgcgattgt atacagattc gaagtaataa attgcgccag tcgactgaat 660 tgttacacat tttcttaaag gcacaaatag ttgaattggc attacttggc gagattgaaa 720 gagacgtttg agctgatgtg gcagtcgtca tggtgtaatt ttgggcgtat tccacgtaat 780 caattccctt ggtcaatgca tatctggcca ataaaattaa cgcgtccacc acggatagtt 840 gattacctta tcgataaaag tgggatgtaa gtaatttaag gaaccgtacc acagtgatac 900 atacagcaac caccatctct tccgacatca gctccgatta tttcttcttc attcctttta 960 ttttgaactc attctttttc tctttcttct tccttgatat atttgtttgt taattctctc 1020 ttcatatcaa taaaaatggc aaaccctcct cacggtggta tcctcaagga cttggtggcc 1080 cgcgatgccc ctcgtcatgc cgagctcgag gctgaagctg ccaccctacc tgctattctt 1140 ctcacagaac gccaattgtg tgatttggag ttgattatga atggtggttt cagtcctctt 1200 gaaggtaagt ctttttgtcg cacgcgatcg agaagattat tagctaacat ttttcttcta 1260 taggtttcat gaacgagaaa gattacgatg ggtatgcaac atatcttgcg cgcgcagtga 1320 aaggaacaat tttctgactg acttagtgtt gtcgccgaat ctcgcctcgc cgatggcaac 1380 cttttctcca tgcccattac tctcgatgcc tctggcgaaa ccattaaaga ccttggcttg 1440 aaggctggat ctcgtgtcac attacgcgat ttccgtgacg accgcaacct tgctattttg 1500 accattgatg atatctaccg ccctgacaag tgagtcctgc aatcagcttg tgcgacgaaa 1560 catgctgacc ccttttacca ggacgaaaga agcccagctc gtctttggag gtgacgaaga 1620 gcaccccgct atcgtatatc tcaataccaa ggttcaggag ttctacattg gaggaaaggt 1680 cgaagctgtt aacaaacttg cccactacga ctatgtcgct ctccgatgtg agttactatt 1740 caacagagac aatagtacat agactaacca tgtagacact cccgctgaat tgcgcacaca 1800 cttcgacaag ctcggctgga cccgagttgt tgctttccag accaggtatg ctaaaagcag 1860 acgataggag ttatttgaat gtcactgaca ctagtagaaa ccccatgcat cgtgctcacc 1920 gtgaattgac cgtccgcgct gcccgtgctc gtcaagccaa tgtgctcatc caccccgtcg 1980 tcggtctcac caagcccggt gacattgacc acttcacccg tgtccgtgtc taccaagccc 2040 ttcttcctcg ttaccccaac ggcatggctg tcctcggtct tttgcctctt gctatgcgta 2100 tgggtggtcc tcgtgaggcc atctggcacg ccattatccg taagaaccac ggtgccaccc 2160 acttcattgt cggacgtgac cacgccggtc ccggaaagaa ctccaagggt gtcgaatttt 2220 acggtcctta cgatgctcag catgctgttg agaagtacag gtctgagttg ggtattgagg 2280 tggttgaatt ccagcaggtt acctacctgc ctgataccga cgagtacaag cctgttaatg 2340 aggtttctgc cggtgtaaag actcttgata tctctggtac tgagctcagg agacgtcttc 2400 gctcgggtgc tcacatccca gagtggttct cttaccctga ggtcatcaag gttctccgcg 2460 agtccaaccc ccctcgcaat gctcaaggtt tcaccgtctt cctcactgga taccagaact 2520 ctggcaagga cgccattgcc cgcgctcttc aagtgactct caaccagcaa ggtggccggt 2580 ccgtctcgct cttgttggga gagaccgtcc gtcacgagct ttcctcagag cttggtttca 2640 gccgcgaaga ccgcgacaaa aacattcaac gtattgcctt tgtcgctgcc gagctcacca 2700 aggccggtgc tgccgttatc gctgcaccca tcgctcctta cgaatcatcc cgaaaggctg 2760 ccaaagacac catctccgca gtcggcacat tcattctcgt ccacgtcgcc acccctcttg 2820 agtactgcga gaagaccgac aagcgcggaa tctacgcgaa ggcccgccgc ggcgagatca 2880 agggcttcac tggtgtcgat gacccatacg aggctcccgc caaggccgac ctcgtggtcg 2940 acgttgagaa gcagagtgtc cgcagtatcg tgcacgagat tgtcttgatt ctcgagagcc 3000 agggattcct cgatcggtct taggtttgct tgtgaacaaa accaaaagaa atgagttatg 3060 caattggttt agggtaatga atgtgcttga tatggaagca atgtgcatac agattaggag 3120 ctacatagag gcgttaatct agttatttgc atcccttttc gccctgtaga tatagtttgt 3180 ggagtatgat caacgtgggg ttgatctgat aaagtcgtcc atatcggaga tttatccgat 3240 atccaatatc cgattatcgc aattggccat tgaactagag tattcgtcat ctactgacga 3300 tttgtacata tgtacttagt ttcaatcccc cttcttcctc caatccatct ggtgcaatta 3360 tagatagaga ggaaagaaaa tgacccaatc aatccaccac atagcccaaa ccggcttctc 3420 agacgcctca tcctacgaca aacacagacc aacctacacc gcgcacgaaa cagatctgat 3480 tctaaaccgc acgaatgtcg cgaaccgtaa gggtttgagg cttgttgacc tcgc 3534 <210> 62 <211> 2858 <212> DNA <213> Talaromyces cellulolyticus <400> 62 gtcaattcag atcggctgcc gcctgcgccc caggtgacgt cgatgaaagc tgggcctagg 60 tcgtgcatgc ggtccatacg gtcgtataag ttctggacac cttgggcggt ctttgggggg 120 aagtattcga aggaaattcc aggtcggccg gtggccgcct gttcttggag cttttgcccg 180 acatgcatgt tgataggtcg gtcaattgtc tgctttttca atatcttctc ggtatgatgt 240 agcttgcaga acccaagtta tgtagttcaa ttgcaaaatc aagtctgatc aagaccgaaa 300 ctcaatcccg gagcactgag gttcgcacta attgatcaag ggtacaagaa tgaggggcac 360 aatgaaagca gtcttgaaaa tgacaggcag agaaattgaa agaaaggaga agagaggacc 420 tccgggacag gagaaatgaa agcaacaaaa ccccgaacaa gctggagaga agttaaaggg 480 agcagcttgg tcaccggcaa tggatgctca tcataaaaaa ggaccctaaa cccgttatcg 540 gagtccggag aaatgacgct aattcggatt tggaagtccc cgccaatcgt gggaaattct 600 cgaagcagac aatttgctcg tgacaatcag ccagcaatga gagggagact gaaaaatatg 660 tatttacact caaagaatcc gatactgcta ttaggatcag tgtttttctt ataagcaaat 720 gagcgttgga cgtggaaaat gaggaatcct cagtccctat actcggtcag cgacggaggg 780 gtgcgtgatc ggccaatcac agcctattat tttatcaaca tctgattggc tacttccgat 840 aagagcgaaa tatgcccctc cttgcaattt ttaccatcaa cgctaacagc aacactcaac 900 aaaccattca atcttgatac tcgctcccat tagtcaccac gcaggacaac acaacacgac 960 atcgcatctc agctttgacc attcccgccg caagcgattc gctgtcacaa acgccagata 1020 ccccaacatg gctgcccctc cctccgccga tcaggactac aagaccaatc tgttgtcttt 1080 gctgatagcc aacgatgcgc tcgcatttgg cacgttcaca ttgaaatctg gtcgccagtc 1140 gccgtatttt ttgacctcga gtcgtcttta tactgcgcct ctgctgcgcc aggtgtcggc 1200 cgcgttcgcg aataccatct cgtccccgcc ttttgtgaat atagctgcag atggcagcat 1260 taccccgaac tttgacattg tttttgggta tgttacccta ttattcgtgc gcctgatatg 1320 cgtgtactga tttacttcaa atagccccgc ctacaaagga atccccgaat gcgtcggtgt 1380 tgtcaacgag ctcgctaccc gggatgcgct cgccggtacc aagacatggg acaacatcag 1440 ctactccttc aaccgcaaag aagccaaaga ccacggcgaa gggggtaaca tcgtcggtgc 1500 gcctctcaag ggaaaacgtg ttttgatcgt tgacgacgtc atcaccgctg gtaccgcgct 1560 gcgtgaagct gtcggcatta ttcaaaagga aggcggaacc gttgccggtg ttgtgttgct 1620 gttcgatcgt caggaacggg tcagtgatac ggagcagaag agtgccattg gagccgcgga 1680 gagggacctt ggaggcgata ttcctatccg tgcggtgttg gtattccagg atttgattga 1740 taagcttgga gataagattg gtcaggagga ggtgcgcagg ttggaagagt accggaacac 1800 gtacaaggct caataaatgg ctgctgtggg atgaaatggg tatattaacg atttatgcta 1860 aaaatggctg ggtggaatac tgcgaaataa atataaatca gcttgaagga tgtattttta 1920 gcgcaaagtg atagaatttt ctatgtaaat agtttgtaca ataggattac tactttatat 1980 gcgttatgcg tatacatttc taaagtgtaa ccagtttagc tgggagtaca attttaacac 2040 tcttccatca atcaggttcc agatcagttt tctatctaca atcatgactc cccagtctct 2100 actcctttca agaatgacgc gttatgttcc aagctcccct ggttgatggc ggtaacccga 2160 tatattctag ccaggtcagg tcctagtgtg aggactaaca caggcacgtc cagtatcgta 2220 gcaaatagaa tatcagcata tataagtccc ctttcccgga ccttgctcga gtcagtgact 2280 agcaggtacg tacgtaccca tcagactatc tactatctac tatgtacgga gtatatagtc 2340 ggtacttgac gcaaggcgag tctgatagag ggacaatatg cagttctgta gccaatcaat 2400 cgcggatggc agaccctcga tcgtcattgt ggatctttag cttccttatg ggcggggcgg 2460 tggttatttc agagccattt agccaatcat acatcgtagt ccgaaagtct aggattatat 2520 aggctagacc aatctactgt caaccggtaa agcgggtctc tagtctttat cccgacctcc 2580 tctctttctc tttctccgat tcgaatgtga cacatacatc tgatcaattg ataagaatac 2640 ggattgccgt gtacgtgggc tgacagagct gagataaaat atcctggatg tgatatgtgg 2700 cgcatccagt accgacactg tgacaggatc cgtgtactac aattcattca tcgatcgttg 2760 gctaggcaaa aagtaggcaa ggtttgcaga tcgatatccc ggtacctggc taaaatcgag 2820 acccatctac atatagtact gactcggcgt tcacttat 2858 <210> 63 <211> 1100 <212> DNA <213> Talaromyces cellulolyticus <400> 63 tgctatgcag ttgatgctac tgtgttctaa aataattgat agggttaggg tcgggtataa 60 ggcgatgcaa tgtatcaatt atcacgagaa ataatgcaga aaaacacaat tccccgtatc 120 tgttgattct taaacaatct gatcaccaat ttgtagaaag aaacgattat aaggtgccat 180 ggtaatgctg gagtttacac aggatactac ttgttctgtt cattacaatg aaccgtaatt 240 gcattctgtt ttgaccactc aacaaatcct acacaaaagt aagtggactt cagtgctcgc 300 tctacgcaag taaatacttg gcatatatgg cctcgtatat tcttacaatg aggtaaattc 360 cgatagatta ctgcccaact agtcaatctt aaatccttaa gagatacagg gggaggcgga 420 agtacctgaa accacgtaat aagacgttca gggtcatgtg aatgtatgta gtatccatgt 480 ccaatacaat tgataatagt atccagtatt atatctcatt caggtaagcg ccacgcgatt 540 cttcagatct acttaactgc cgactcgcca aacgaaacaa cgtttattcg tgaccccaga 600 aaatcaccgc ggagttgcgg aggaccagtt tgtacaatgc accgaaccaa gcgttggtca 660 tttttctgga aatgggccaa acgttagaag tgattggtca gagctacatc tgaaggtgaa 720 gcaatttccg gtatgcatac atgacagcaa gcttacctac caagaccaag ttattcccca 780 gcatttgccc catacttggc tttaatattg tgggatagca aacaatatcc acaacactga 840 tgataactaa actacaaatc tgacgttact tcagactact cacgtgtcaa aagcagttag 900 cgaggatcaa gtcttttagt ctggtcatta acaaacgcaa tttcgcaacc cgataatccg 960 cgatgataat atagcgactc caaggtcgta tttatattca atcaattccc cccaatttgg 1020 aatggatttt tggaatcatc gcatgccagg acaatcagtg aaacagtgac aaagtgaagc 1080 ttcttgatca tttagcaact 1100 <210> 64 <211> 78 <212> DNA <213> Talaromyces cellulolyticus <400> 64 atgtctgcct tgaactcttt caatatgtac aagagcgccc tcatcttggg ctccttgctg 60 gcaacagctg gtgctcag 78 <210> 65 <211> 1356 <212> DNA <213> Homo sapiens <400> 65 gaagtccagc tcgtcgagtc tggtggtggc ttggtccaac ccggtggatc cttacgtctc 60 tcttgtgcag ctagcggttt caacatcaag gacacctaca tccattgggt tcgtcaagct 120 cctggcaaag gtttggaatg ggttgcgcgt atctacccta cgaacggtta cacccgttat 180 gccgacagcg ttaagggccg tttcaccatt tctgccgaca cttccaagaa caccgcctac 240 ttgcagatga actccttgag agccgaggat actgccgtct actactgcag ccgttgggga 300 ggtgatgggt tctacgccat ggactactgg ggtcaaggca cccttgttac cgttagctcc 360 gccagcacaa agggtccctc cgtcttccct ttggctccct cctccaagtc tacttccggt 420 ggtaccgctg cactgggttg cttggtcaag gactacttcc ctgagcccgt cactgtcagc 480 tggaattctg gcgcattgac ttctggtgtc cacacttttc ccgctgttct ccaatcttcc 540 ggcttgtaca gcctaagcag cgttgtcact gtgccctctt cctccttggg cactcagacc 600 tacatctgca acgtcaacca caagccctcc aacacgaagg ttgacaagaa ggtggaacct 660 cccaagtcct gcgataagac ccacacctgt cctccctgtc ctgctcctga actgttgggt 720 ggaccctcag tgttcttgtt ccctcccaag cccaaggaca ctctcatgat cagccgtact 780 cctgaggtta catgcgtcgt cgtcgatgtc tcccatgagg atcctgaggt caagttcaac 840 tggtacgtcg acggtgtcga ggtccacaat gccaagacca agcctcgtga agaacagtac 900 aactccacct accgcgttgt ttcagtcttg accgtgttgc accaggattg gctgaacggc 960 aaggagtaca agtgcaaggt ctccaacaag gccctgcctg ctcccatcga gaaaaccatc 1020 agtaaggcca aaggtcaacc tcgcgaaccc caggtttaca ccctccctcc ttctcgggac 1080 gaactcacca agaaccaggt ctcgttgact tgccttgtta agggattcta ccctagcgat 1140 attgccgttg agtgggagtc caatggtcag cccgagaaca actacaagac tacccctcct 1200 gttctcgact ctgacggatc tttcttcctc tacagcaagt tgaccgtcga caaaagccgt 1260 tggcagcaag gcaacgtttt ctcctgctct gtcatgcacg aggctctcca caaccactac 1320 acacagaagt ctctgtcctt gtctcctggt aaataa 1356 <210> 66 <211> 1680 <212> DNA <213> Talaromyces cellulolyticus <400> 66 attttcactt ctttcttcgc ctattgattg ggctatgaca aaattaggag agataggttg 60 gacgttgtca agtcaaaatg taccgaacac gatgcgttga tatgctgcac atgtgcctag 120 tatccattcg ttcctattta tattaaattg aaattttctt atccaattac tgagctaaaa 180 catacttcag cactgtaagc gccagcctaa gttatgctat gttagactgt ccggattcgg 240 ctggcactgg cttttgtgat ccccagtatc atgtaaaggt atccgcctgt ttgttagggg 300 gtcttaaatg ttgtataaag tttcttgcta ggctgtttat gcttgataga gaatatatat 360 atatatctag ctgctattaa tatccttgtt tcaatgtctt agacttccaa ggttacctac 420 ccgcgtgcgt ggactaatac aaacaatctc actcaagaca atcttataca aactcggatt 480 ctggtcaatc cgttccttgg ttatattgct aaaaaaacta ggtagcccaa aattccatct 540 caagccgtat aagaactttc aaattcacca tggtactctc acgggcgaag catctccgtc 600 ttccatctgc caaaatccat taccaaaatc ggaagtaccc gaatgtagca aatgaacaat 660 aactttcgca ccatctagcg gatcctttgt gccacgatag ttgttgaacg cagttttgca 720 atacccagga ctaactgctt ggatgataac actctcattc gccgggtctt tcccatattc 780 gaccgtgagc atgttaaggg ccgtctttga ggcgcagtac gcgatagtaa cagttggagg 840 cagcttgcca gatgatgata ggcccaaaga accccgtgtg gatgatacgt ttattatgtg 900 gcctcgaggc gactgacgca aaagtggtag gaatagatct atggtcattg cgaccgatgt 960 gacattcaca tcaaaagttc ggttgtaagt agaccgcatt tcggaaaatg aagtctgggt 1020 gaaggcaacg gcagcattgt ttatcagaac tagacatctg ttagagaatt tctaaagccc 1080 gctcactcga gaatgaaata ggcttaccat ccagtctacc atatgttgtc tcgaccgcct 1140 tagcaaaagc aatgaggcta tcgtcgcgag tcacatcaac ctccataacg tcgatcttgg 1200 attgaacagc gagctctctc aaccgcttaa gtgcctgatt tccgtcttcc ttattccggc 1260 atcctaagat gaagtgatcg gatggactat gcagacttaa agcctggagg gtaccaaacc 1320 cgatgcctga caattattag tgatcatata gaatgagtat catggccatc gcaaatctac 1380 ctctgtttgc tccagttata agaattagcc ttgatgacat cttgtgagag aagtaaaaga 1440 taatagcaga tgaatttcga tcgtatactg gttgtattgg caatcttgac gagaatggtt 1500 tcattgtcag accatcagtt ccctttatat acctgccatt ctctccttta taaataatta 1560 ttcggtttta acacggagat actcggattt catcacacaa attgcatttc ttccgatagt 1620 tgttgaagat cggaagtcct tcgaatgatc atttctataa ctacgcctta ccgttttcgg 1680 <210> 67 <211> 645 <212> DNA <213> Homo sapiens <400> 67 gacatccaga tgacacagtc cccttctagc ctttctgcct ctgttggaga tcgtgtcacc 60 atcacttgtc gtgcttctca agacgtcaac acagccgttg cctggtatca gcagaaaccc 120 ggcaaagctc ccaagttgct gatctacagc gctagcttcc tgtacagcgg tgtcccttct 180 cgcttctcag gttcccgttc tggtaccgac ttcaccttga ccatttccag cttgcaaccc 240 gaggatttcg ccacgtacta ctgccagcaa cactacacca ctcctcccac ctttggccaa 300 ggtaccaagg tcgagatcaa gcggactgtt gccgcacctt ccgtcttcat cttccctccc 360 tcggatgagc agctcaagtc tggaactgcg tctgtcgttt gcttgctcaa caacttctac 420 cctcgtgaag ccaaggtcca gtggaaggtc gacaacgctt tgcagtccgg caatagccaa 480 gagtccgtta ccgaacagga cagcaaggac tccacttact ccttgagttc cactctcacc 540 ttgtccaagg ccgattacga gaagcacaag gtctacgctt gcgaagtgac ccatcaaggt 600 ctctctagcc ctgttactaa gtccttcaac cgtggtgagt gttag 645 <210> 68 <211> 497 <212> DNA <213> Talaromyces cellulolyticus <400> 68 atcagctttg agtgcagcaa aaatgcttcc gactgtcttc ttatattgat atcatatttt 60 tcaattcact ttgtctcaag tttcaatata tcgagaaaat agtatcaaag atgaactgta 120 ataattccga tatacctata caggtttata gtaaattact ctatttcata atgcgtccat 180 ccgagaagtc tggcggcctt atcagtagtc caaaacgcct ggtttttaga catgtcacct 240 ctaatctccg cttgaggaaa atgcgtccga gcaagttctt tcgacggggt gtcttgggtc 300 gtagttggag atatgatatt tattacttcg aatcctttga tattctcact cttttcaacc 360 gccaaaaggc aagctcttgc cactgcgcga ggattaaccc atccccagag ttgtcgaacc 420 ccagattcat accatttatc gtggtgtctt tttctaacat ctctcaatgg ggcaacctca 480 tgtattctca aacaagc 497 <210> 69 <211> 1812 <212> DNA <213> Talaromyces cellulolyticus <400> 69 cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct 60 attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattaattc tgtggaatgt 120 gtgtcagtta gggtgtggaa agtccccagg ctccccagca ggcagaagta tgcaaagcat 180 gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca ggctccccag caggcagaag 240 tatgcaaagc atgcatctca attagtcagc aaccatagtc ccgcccctaa ctccgcccat 300 cccgccccta actccgccca gttccgccca ttctccgccc catggctgac taattttttt 360 tatttatgca gaggccgagg ccgcctctgc ctctgagcta ttccagaagt agtgaggagg 420 cttttttgga ggcctaggct tttgcaaaaa gctcccggga gcttgtatat ccattttcgg 480 atctgatcag cacgtgatga aaaagcctga actcaccgcg acgtctgtcg agaagtttct 540 gatcgaaaag ttcgacagcg tctccgacct gatgcagctc tcggagggcg aagaatctcg 600 tgctttcagc ttcgatgtag gagggcgtgg atatgtcctg cgggtaaata gctgcgccga 660 tggtttctac aaagatcgtt atgtttatcg gcactttgca tcggccgcgc tcccgattcc 720 ggaagtgctt gacattgggg aattcagcga gagcctgacc tattgcatct cccgccgtgc 780 acagggtgtc acgttgcaag acctgcctga aaccgaactg cccgctgttc tgcagccggt 840 cgcggaggcc atggatgcga tcgctgcggc cgatcttagc cagacgagcg ggttcggccc 900 attcggaccg caaggaatcg gtcaatacac tacatggcgt gatttcatat gcgcgattgc 960 tgatccccat gtgtatcact ggcaaactgt gatggacgac accgtcagtg cgtccgtcgc 1020 gcaggctctc gatgagctga tgctttgggc cgaggactgc cccgaagtcc ggcacctcgt 1080 gcacgcggat ttcggctcca acaatgtcct gacggacaat ggccgcataa cagcggtcat 1140 tgactggagc gaggcgatgt tcggggattc ccaatacgag gtcgccaaca tcttcttctg 1200 gaggccgtgg ttggcttgta tggagcagca gacgcgctac ttcgagcgga ggcatccgga 1260 gcttgcagga tcgccgcggc tccgggcgta tatgctccgc attggtcttg accaactcta 1320 tcagagcttg gttgacggca atttcgatga tgcagcttgg gcgcagggtc gatgcgacgc 1380 aatcgtccga tccggagccg ggactgtcgg gcgtacacaa atcgcccgca gaagcgcggc 1440 cgtctggacc gatggctgtg tagaagtact cgccgatagt ggaaaccgac gccccagcac 1500 tcgtccgagg gcaaaggaat agcacgtgct acgagatttc gattccaccg ccgccttcta 1560 tgaaaggttg ggcttcggaa tcgttttccg ggacgccggc tggatgatcc tccagcgcgg 1620 ggatctcatg ctggagttct tcgcccaccc caacttgttt attgcagctt ataatggtta 1680 caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag 1740 ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tgtataccgt cgacctctag 1800 ctagagcttg gc 1812 <210> 70 <211> 1364 <212> DNA <213> Talaromyces cellulolyticus <400> 70 atgaagacta cctctgtgct cgcagccgcc gcgctggccg gcgctgctac cgccaaggtc 60 cacaagctca agctggacaa ggtgcctctc tctgagcaat ttgtatgaca ttctcaactc 120 ttcgctttaa tttgtttcta tggtcttgaa ctgatgatga tttgttaaag gataaacgcg 180 gcatgaacga ccacatgcgg tctttgggtc agaagtacat gggcgttgtc cccgagggaa 240 tgtaccagga cacctccatc cgaccggagg gcggccacga tgtgctggtc gataactttt 300 tgaacgctca gtgtatgtga ataccatcgg atgatcttga tgatttgatg ctaactattc 360 gttctagact tctcagagat caccatcggt acacccccac agaacttcaa ggtcgtcctt 420 gataccggga gctcgaactt gtgggttcct tcatcctctt gcaactcgat tgcttgctac 480 ttgcacaaca agtatgactc gtcctcttcc tctacctaca agaagaacgg cagcgacttt 540 gccatccagt atggctcagg tagccttgag ggcttcgttt cccgcgacac tgtcacgatt 600 ggcgaccttt ccattaagga ccaagacttc gccgaagcca caaacgagcc tggcttggct 660 tttgcctttg gccgctttga cggtattttg ggtcttggtt tcgacaccat ctcagtcaac 720 aagattgtcc ctccgttcta taacatgcta aaccagaagt ctcttgatga gcctgtcttt 780 gccttctacc tcggcgatag caacaaggaa ggtgatgatt ctgaggctac ctttggtggt 840 attgacgaga gccactacac tggaaagttg gtcaagatcc ctctccgccg caaggcctac 900 tgggaggtgg actttgatgc cattgctttt ggcgacaacg ttgctgagct tgagaacacc 960 ggagtcatcc ttgacactgg tacttccctc attgctcttc cttccactct tgccgagctc 1020 ttgtaagtca tctattactc gctacacata aaaatatatg ctaatatctt tttaggaaca 1080 aggagattgg tgcctccaag tcatggaacg gtcaatacac tgtcgactgt gccaagcgtg 1140 actctcttcc cgacctcacc gtcaccctga gcggatacaa cttctccatc agcgctttcg 1200 actacgtttt ggaagtccag ggatcttgca tcagcgcttt catgggcatg gacttccctg 1260 agcctgtcgg ccctcttgct atccttggtg atgctttcct ccgcaagtgg tacagcgtct 1320 acgacttggg caacggtgcc gtcggtctcg ccaaggccaa gtaa 1364 <210> 71 <211> 395 <212> PRT <213> Talaromyces cellulolyticus <400> 71 Met Lys Thr Thr Ser Val Leu Ala Ala Ala Ala Leu Ala Gly Ala Ala 1 5 10 15 Thr Ala Lys Val His Lys Leu Lys Leu Asp Lys Val Pro Leu Ser Glu 20 25 30 Gln Phe Asp Lys Arg Gly Met Asn Asp His Met Arg Ser Leu Gly Gln 35 40 45 Lys Tyr Met Gly Val Val Pro Glu Gly Met Tyr Gln Asp Thr Ser Ile 50 55 60 Arg Pro Glu Gly Gly His Asp Val Leu Val Asp Asn Phe Leu Asn Ala 65 70 75 80 Gln Tyr Phe Ser Glu Ile Thr Ile Gly Thr Pro Pro Gln Asn Phe Lys 85 90 95 Val Val Leu Asp Thr Gly Ser Ser Asn Leu Trp Val Pro Ser Ser Ser 100 105 110 Cys Asn Ser Ile Ala Cys Tyr Leu His Asn Lys Tyr Asp Ser Ser Ser 115 120 125 Ser Ser Thr Tyr Lys Lys Asn Gly Ser Asp Phe Ala Ile Gln Tyr Gly 130 135 140 Ser Gly Ser Leu Glu Gly Phe Val Ser Arg Asp Thr Val Thr Ile Gly 145 150 155 160 Asp Leu Ser Ile Lys Asp Gln Asp Phe Ala Glu Ala Thr Asn Glu Pro 165 170 175 Gly Leu Ala Phe Ala Phe Gly Arg Phe Asp Gly Ile Leu Gly Leu Gly 180 185 190 Phe Asp Thr Ile Ser Val Asn Lys Ile Val Pro Pro Phe Tyr Asn Met 195 200 205 Leu Asn Gln Lys Ser Leu Asp Glu Pro Val Phe Ala Phe Tyr Leu Gly 210 215 220 Asp Ser Asn Lys Glu Gly Asp Asp Ser Glu Ala Thr Phe Gly Gly Ile 225 230 235 240 Asp Glu Ser His Tyr Thr Gly Lys Leu Val Lys Ile Pro Leu Arg Arg 245 250 255 Lys Ala Tyr Trp Glu Val Asp Phe Asp Ala Ile Ala Phe Gly Asp Asn 260 265 270 Val Ala Glu Leu Glu Asn Thr Gly Val Ile Leu Asp Thr Gly Thr Ser 275 280 285 Leu Ile Ala Leu Pro Ser Thr Leu Ala Glu Leu Leu Asn Lys Glu Ile 290 295 300 Gly Ala Ser Lys Ser Trp Asn Gly Gln Tyr Thr Val Asp Cys Ala Lys 305 310 315 320 Arg Asp Ser Leu Pro Asp Leu Thr Val Thr Leu Ser Gly Tyr Asn Phe 325 330 335 Ser Ile Ser Ala Phe Asp Tyr Val Leu Glu Val Gln Gly Ser Cys Ile 340 345 350 Ser Ala Phe Met Gly Met Asp Phe Pro Glu Pro Val Gly Pro Leu Ala 355 360 365 Ile Leu Gly Asp Ala Phe Leu Arg Lys Trp Tyr Ser Val Tyr Asp Leu 370 375 380 Gly Asn Gly Ala Val Gly Leu Ala Lys Ala Lys 385 390 395 <210> 72 <211> 26 <212> PRT <213> Talaromyces cellulolyticus <400> 72 Met Ser Ala Leu Asn Ser Phe Asn Met Tyr Lys Ser Ala Leu Ile Leu 1 5 10 15 Gly Ser Leu Leu Ala Thr Ala Gly Ala Gln 20 25 <210> 73 <211> 490 <212> PRT <213> Talaromyces cellulolyticus <400> 73 Met Lys Gly Val Leu Ser Leu Ser Leu Leu Pro Leu Leu Thr Val Ala 1 5 10 15 Ser Pro Val Met Pro Arg Thr Ile His Asn Asp Ala Ala Pro Ile Leu 20 25 30 Ser Ser Ser Asn Ala Val Glu Val Pro Asp Ser Tyr Ile Ile Val Phe 35 40 45 Lys Asp His Val Asp Ser Ala Ser Ala Ala Ala His His Asn Trp Val 50 55 60 Gln Asp Ile His Ser Gln His Thr Glu Leu Arg Lys Arg Ser Gln Phe 65 70 75 80 Pro Phe Ala Asp Asn Ala Phe Ala Gly Leu Lys His Thr Phe Asp Ile 85 90 95 Ala Gly Ser Phe Leu Gly Tyr Ser Gly His Phe Glu Glu Asn Val Ile 100 105 110 Glu Ala Ile Arg Arg His Pro Asp Val Asp Tyr Ile Glu Lys Asp Ser 115 120 125 Leu Val His Thr Met Glu Asp Pro Ala Leu Glu Lys Asn Ala Pro Trp 130 135 140 Gly Leu Ala Arg Ile Ser His Arg Glu Ser Leu Ser Phe Gly Ser Phe 145 150 155 160 Asn Lys Tyr Leu Tyr Ala Ala Asp Gly Gly Glu Gly Val Asp Val Tyr 165 170 175 Val Ile Asp Thr Gly Thr Asn Ile Asp His Val Asp Phe Glu Gly Arg 180 185 190 Ala Ser Trp Gly Lys Thr Ile Pro Thr Asp Asp Glu Asp Val Asp Gly 195 200 205 Asn Gly His Gly Thr His Cys Ser Gly Thr Ile Ala Gly Lys Lys Tyr 210 215 220 Gly Val Ala Lys Lys Ala Asn Val Tyr Ala Val Lys Val Leu Lys Ser 225 230 235 240 Asn Gly Ser Gly Thr Met Ser Asp Val Val Gln Gly Val Glu Trp Ala 245 250 255 Ala Thr Gln His Ile Lys Lys Val Lys Asp Ala Lys Ala Gly Lys Ala 260 265 270 Lys Gly Phe Lys Gly Ser Ala Ala Asn Met Ser Leu Gly Gly Gly Lys 275 280 285 Ser Val Thr Leu Asp Lys Ala Val Asn Ala Ala Val Asp Ala Gly Ile 290 295 300 His Phe Ala Val Ala Ala Gly Asn Asp Asn Ala Asp Ser Cys Asn Tyr 305 310 315 320 Ser Pro Ala Ala Ala Glu Lys Ala Val Thr Val Gly Ala Ser Thr Leu 325 330 335 Ala Asp Glu Arg Ala Tyr Phe Ser Asn Tyr Gly Lys Cys Asn Asp Ile 340 345 350 Phe Ala Pro Gly Leu Asn Ile Leu Ser Thr Trp Ile Gly Ser Lys Tyr 355 360 365 Ala Val Asn Thr Ile Ser Gly Thr Ser Met Ala Ser Pro His Ile Ala 370 375 380 Gly Leu Leu Ala Tyr Phe Leu Ser Leu Gln Pro Ala Ser Asp Ser Ala 385 390 395 400 Phe Ala Val Ala Glu Ile Thr Pro Lys Lys Leu Lys Glu Asn Leu Ile 405 410 415 Ala Ile Gly Thr Gln Gly Ala Leu Thr Asp Val Pro Ser Asp Thr Thr 420 425 430 Asn Ile Leu Ala Trp Asn Gly Gly Gly Ser Ala Asn Tyr Thr Asp Ile 435 440 445 Ile Ala Gln Gly Gly Tyr Lys Thr Lys Thr Leu Ser Asn Glu Val Asp 450 455 460 Glu Leu Ile Asn Lys Leu Glu Val Val Asn Glu Glu Leu Gly Ala Ile 465 470 475 480 Tyr Ser His Ile Lys Asp Ala Ile Ala Ala 485 490 <210> 74 <211> 4509 <212> DNA <213> Talaromyces cellulolyticus <400> 74 atgtcgagaa gaatacggaa ccctgattcc gcaggctcga gtcaaaccct aagtaattca 60 ccggtaccaa tagccgccga atccggcacg gaacctgtgt acctaggtcc gtatcgaata 120 gcgaagtttt ccgtctattc ttcgaatttt gtatacatgc ttaccttggc tcaaaggtac 180 tcacaaagtc cgaagaataa attatagaac cgatgtgaaa cggggacagt ttggcaaccc 240 cttgtactat gtacattgta tggatctcgt ctcgactctc gagacgaggg tttcgtacca 300 accaaagact caaaacttgg ggtaactaag cgatcggctg cgtagtactc catactccat 360 aaataccccg gtgaattcgc ctcttgccca tggaatgagc gagaatttac ccttggagtc 420 atcgcggtaa atgactcaca tatcatgtct gccttcactc tcctcaacct ttgaaattcc 480 ggttaatgtt aaggcgaggt gtcctctacg gaatggcttt gtagatttga gataagacta 540 cgccgtaact taagggatcc acatactcca tattgatagt ctcaggaccg agatagtctg 600 gagtaacccc gtacccaatc aacgtcctca gactcgccac ctggttacaa tatttcggtg 660 cttgtgccga tatacctccg ttgcgtgagc cttgatagcc aacaagaaat gattcaaaat 720 taagatttga gaaaatccgg agtacgcagt gcctgcagtg taaaaaataa tgtatttacc 780 taatgccaat atgtcgatgc caaagtacta ctagcaaaga cactagatat gcagcaaact 840 cgatgtttag gtacatgtaa ccatatcctg gggtcaggta cgaacgccat caattaatct 900 cgtaaactag ctgtcacacg acagtatcat ttgatagttc caatgttcca tgctccccct 960 caaatgtcac tggatgatac gaatttggct gtgacttgaa cagatagacg gaaaacagtc 1020 cgatcattat ccggagtacg catgtacgag atagtctggg gatcctcggc tgccccgatt 1080 ggggttagtg cgggtttcct tatcttgata cgccgtctgg aggcgcaggt gattgttacg 1140 gtgtgttccg tgatagataa gttagacatc cgataataac ctatcttcta gatagacggc 1200 aggtacgtat gtagatagat agatgacaca gtcataagac agttttattt accatacata 1260 gtatagtcat ttgacaaaca cttgatgact atgagcagta agtccagaca agagcataga 1320 ctagaaatga tgtgatcatc aataggtacg gagtcgtacc acccccggat tatcttggct 1380 ggcttagtca cgcccaaaca gacggtgacg gatgagacac aagcaaagag cgacattccg 1440 aagaattctc gtgacggaaa cgagaatgcc gccggcgctg atagggggaa attttatctt 1500 ttccctttct gacattcagt gtttacaata caatacggaa ttacggaacc ccggttttcg 1560 caaccggtgg aattacctaa tgggtgacct gaatttatta gataacgatg aacaatttgt 1620 tggatcttcc gtagatcgat ttggacttga taggtgcttc caaggttgtt gctgctcaca 1680 tggtcgcttg cgttatctgc ctacagaatg aggaagatgt attccgcacg tactccggtc 1740 gcgacagata tgcgacgatt gcaatatgta ctacatagtt agtacataca actctagact 1800 agactctata ttatgtagag tgtaagagaa aaagaaagaa gataacggca gggtctattt 1860 gattgcgcta taatatgcgc cgctgtatgg ttccccagat ctgcgtgaga tatcacctca 1920 tcctatcatc attccaggtc aaagtctcgt catcatgaat tggtattatt acccagtacg 1980 taaaccacgt atcgaggcgt atcggtgtat taaagataga gctactgcat tggctctagt 2040 cctatctttg ccccggaatc cggcccgtgg atgacgatat gatgctgttt gtccttcagc 2100 taaacacgga cgatctctta cagggtgcgg ttaattatta aggatataat tctaatcaac 2160 gactctggct gtgctatatt aacaatgtct tctaagtggt catgatgtgt acgtacttcg 2220 tacacatgct acatgcaatc gagtacgtaa ctccagatct gcgccgtacc cgcgataccc 2280 gggccatcat gcaaatgtaa ccgcttggaa cacgcactgc agtgcataaa agccacagcc 2340 tcgcttccca atccggttta gacgcgtttt gtcttgctgt tttgggagca gccagacccc 2400 acattccact aacccactct ttttcagcgc ttattctcgt aagattcgta cgaaaaatac 2460 atctgcccac actatccacc agctcggcca ctcttcggtg agaacgctgc catgagaaaa 2520 aaatctgcga ctctgcaaca gagtgaggca cggctgaacc gagctgattg tcaccctttg 2580 cccaatgccc agacagccca gacagcccag acagcccaga cagcccagac agcccagaca 2640 gcccagacag ccagtgcttg gttaattttt actaagggta aaaacctaaa aaaaagaaac 2700 gaaaaaaaaa aaaaaaaact tttctttttt gccccccaat cacttggccg acagtcaaag 2760 ggttccccca cacggtactc cgtacttgct acgtacacta actaaagaaa aaatctcctg 2820 attgagtctg tgtctgtctg tcgctgctaa actcggataa ccccccgttc ccgatcaccc 2880 gtcgaaaaga gcagcagcca tttaacattt ttcccctcca ttcctccttc ttggaacttt 2940 ccctccctcc ctcatcctta catctccctg cgtgcgcgcc tgcctgccta cttacactgc 3000 cactccccag attttctttc tcttgtttct tctccagact ttctttcctc ctccacctcg 3060 cctcaccaca ccaccaccac cactcaccac gccaacaaca ccgcactacc actactgctt 3120 caaagatcga tcaggccatt atcaaggagg atcgacgtct tattccatcg accaccctgt 3180 tgatcacctc ggctggagcg ctcgactccc tggcttcctt ccccagctta tttaaacccg 3240 tcacccgcca ggtctcttca catgtcaccg tcatcttcgt cagtgggttt ttccaatctg 3300 ctgaacccac agtcagactc tgtcgagcct acggataaca catcttcacc tgctaccacc 3360 actaccaccg gcacagactc caactcagac aaggaaatgg cgtcctctgt cagtctgctc 3420 ccaccactca tgaagggtgc ccgccccgcc gcggaggaag tgcgacagga cctccctcgt 3480 ccatacaagt gtcctctttg cgatcgtgct ttccatcgtc tagagcacca aactcgtcac 3540 attcgtactc acaccggcga gaaaccccat gcctgccagt ttccaggctg cacgaaacgg 3600 ttcagtcgtt cagatgaatt gactcgtcac tcgcgcattc acaacaaccc caactcgaga 3660 agaagtaaca aagctcagca tattgctgcg gctgcggcgg ccggtcagga ttcgggtatg 3720 cttaacgctg ctgcctcgat gatgcctcct ccaagcaaac ccattactcg ctcggctcca 3780 gtgtctcagg tcggatctcc ggatgtgtct cctccgcact cttacaccaa ctacacctcg 3840 catttgcggg cgggtctggg tccttattca cgcaacagcg accgtgcttc atctggtatg 3900 gatattaatt tgctcgcgac tgctgcttca caagtcgagc gcgatcacta cggaggctcg 3960 tctcgtcatt accctttcag ctctcgatac tcgggtactc ctggacgtct accgtcgctt 4020 tccgcctatg ccatttctca gagcatgagc cggtcgcatt ctcacgagga tgaggacaac 4080 tacggacatc accgggttaa gcgctctcgt cctaactcac caaactcgac tgcgccatcc 4140 tcgcctacat tctctcacga ttcattgtcg cctacccccg atcacactcc tcttgcaacc 4200 ccagcacact cgcctcgttt gcgtccttat ggagccgcag atttgcaatt accttccatc 4260 cgtcatttgt cgttacacca cactcccgca ctcgcaccaa tggagcctca agccgaggga 4320 cctaatgttt acaaccccgg tcagcaccac ggtggaccca gcatcacgga catcatgagc 4380 aggcccgacg gcacccagcg taagcttcct gttccgcaag tacccaaaat cccggtgcag 4440 gacatgttgg caccgaacgg atattcctcc aacactccgt ccgtcaacgg ttccgtgatg 4500 gagttataa 4509

Claims

목적 단백질의 제조 방법으로서,
목적 단백질의 생산능을 갖는 탈라로마이세스 셀룰롤리티쿠스(Talaromyces cellulolyticus)를 배지에서 배양하는 것
을 포함하고,
상기 탈라로마이세스 셀룰롤리티쿠스가, 비개변주와 비교하여 Pep4 단백질의 활성이 저하되도록 개변되어 있는, 방법.
제1항에 있어서, 상기 Pep4 단백질의 활성이, pep4 유전자의 발현을 저하시킴으로써, 또는 pep4 유전자를 파괴함으로써, 저하된, 방법.
제1항 또는 제2항에 있어서, 상기 Pep4 단백질의 활성이, pep4 유전자의 결실에 의해 저하된, 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 Pep4 단백질이, 하기 (a), (b), 또는 (c)에 기재된 단백질인, 방법:
(a) 서열번호 71에 나타내는 아미노산 서열을 포함하는 단백질;
(b) 서열번호 71에 나타내는 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입, 및/또는 부가를 포함하는 아미노산 서열을 포함하고, 또한, 프로테아제 활성을 갖는 단백질;
(c) 서열번호 71에 나타내는 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, 또한, 프로테아제 활성을 갖는 단백질.
제1항 내지 제4항 중 어느 한 항에 있어서, 상기 탈라로마이세스 셀룰롤리티쿠스가, 추가로, 비개변주와 비교하여 YscB 단백질 및/또는 CreA 단백질의 활성이 저하되도록 개변되어 있는, 방법.
제5항에 있어서, 상기 YscB 단백질 및/또는 상기 CreA 단백질의 활성이, yscB 유전자 및/또는 creA 유전자의 발현을 저하시킴으로써, 또는 yscB 유전자 및/또는 creA 유전자를 파괴함으로써, 저하된, 방법.
제5항 또는 제6항에 있어서, 상기 YscB 단백질 및/또는 상기 CreA 단백질의 활성이, yscB 유전자 및/또는 creA 유전자의 결실에 의해 저하된, 방법.
제1항 내지 제7항 중 어느 한 항에 있어서, 상기 탈라로마이세스 셀룰롤리티쿠스가, 탈라로마이세스 셀룰롤리티쿠스 S6-25주(NITE BP-01685)로부터 유래하는 개변주인, 방법.
제1항 내지 제8항 중 어느 한 항에 있어서, 추가로, 목적 단백질을 회수하는 것을 포함하는, 방법.
제1항 내지 제9항 중 어느 한 항에 있어서, 상기 배양에 의해 목적 단백질이 상기 배지 중에 축적되는, 방법.
제1항 내지 제10항 중 어느 한 항에 있어서, 목적 단백질이, 탈라로마이세스 셀룰롤리티쿠스에서 기능하는 시그널 펩티드와의 융합 단백질로서 발현되는, 방법.
제1항 내지 제11항 중 어느 한 항에 있어서, 목적 단백질이, 이종 단백질인, 방법.
제1항 내지 제12항 중 어느 한 항에 있어서, 목적 단백질이, 인간 유래 단백질인, 방법.
제1항 내지 제13항 중 어느 한 항에 있어서, 목적 단백질이, 항체 관련 분자인, 방법.