KR20200066340A - 단백질의 제조 방법 - Google Patents

단백질의 제조 방법 Download PDF

Info

Publication number
KR20200066340A
KR20200066340A KR1020207013023A KR20207013023A KR20200066340A KR 20200066340 A KR20200066340 A KR 20200066340A KR 1020207013023 A KR1020207013023 A KR 1020207013023A KR 20207013023 A KR20207013023 A KR 20207013023A KR 20200066340 A KR20200066340 A KR 20200066340A
Authority
KR
South Korea
Prior art keywords
protein
gene
target protein
seq
yscb
Prior art date
Application number
KR1020207013023A
Other languages
English (en)
Other versions
KR102620914B1 (ko
Inventor
히로아키 후카다
히로카 고구치
미쓰노리 도쿠라
Original Assignee
아지노모토 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아지노모토 가부시키가이샤 filed Critical 아지노모토 가부시키가이샤
Publication of KR20200066340A publication Critical patent/KR20200066340A/ko
Application granted granted Critical
Publication of KR102620914B1 publication Critical patent/KR102620914B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/58Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from fungi
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/475Growth factors; Growth regulators
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/76Albumins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P1/00Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes
    • C12P1/02Preparation of compounds or compositions, not provided for in groups C12P3/00 - C12P39/00, by using microorganisms or enzymes by using fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/21Serine endopeptidases (3.4.21)
    • C12Y304/21048Cerevisin (3.4.21.48)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/50Biochemical production, i.e. in a transformed host cell
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • C40B40/08Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Immunology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

단백질의 제조 방법을 제공한다. YscB 단백질의 활성이 저하되도록 변형된, 목적 단백질 생산능을 갖는 탈라로마이세스 셀룰롤리티쿠스(Talaromyces celluloyticus)를 배양 배지에서 배양함으로써, 목적 단백질을 제조한다.

Description

단백질의 제조 방법
 본 발명은 단백질의 제조 방법에 관한 것이다.
단백질의 제조법으로서는, 코리네형 세균, 바실루스속 세균, 효모, 사상균 등의 각종 미생물을 사용한 것이 보고되어 있다.
예를 들어, 비특허문헌 1에는, 사상균 탈라로마이세스 셀룰롤리티쿠스(Talaromyces cellulolyticus)(구명칭: 아크레모늄 셀룰롤리티쿠스(Acremonium cellulolyticus))를 이용한 숙주 유래의 셀룰라아제 생산이 개시되어 있다. 또한, 특허문헌 1에는, 사상균을 사용한 항체의 생산이 개시되어 있다. 또한, 특허문헌 2에는, 탈라로마이세스 셀룰롤리티쿠스 등의 사상균을 사용한 내강(內腔)을 가진 다량체 단백질의 생산이 개시되어 있다.
또한, 특허문헌 3 내지 4에는, 내인성 프로테아제의 활성이 약화된 사상균을 사용한 이종 단백질의 생산이 개시되어 있다. 또한, 특허문헌 5에는, 내인성 알칼리 프로테아제의 활성이 약화된 사상균을 사용한 이종 단백질의 생산이 개시되어 있다.
또한, 특허문헌 6에는, 카르복시 펩티다아제 yscα 활성이 결여된 효모를 사용한 이종 단백질의 생산이 개시되어 있다. 이 문헌에는, 이 효모는, yscA, yscB, yscY 및 yscS로부터 선택되는 펩티다아제 활성이 결여되어 있어도 좋다는 취지의 기재도 있다.
하지만, 탈라로마이세스 셀룰롤리티쿠스에서의 YscB 단백질과 단백질 생산과의 관계는 알려져 있지 않다. 
특허문헌 1: 일본 공표특허공보 (PCT 출원의 번역문) 특표2006-512891호 특허문헌 2: 일본 공개특허공보 (Kokai) 특개2016-158599호 특허문헌 3: 일본 공표특허공보 (PCT 출원의 번역문) 특표2015-512611호 특허문헌 4: 일본 공표특허공보 (PCT 출원의 번역문) 특표2016-523552호 특허문헌 5: 일본 공표특허공보 (PCT 출원의 번역문) 특표2000-507106호 특허문헌 6: 일본 공개특허공보 (Kokai) 특개1990-104279호
비특허문헌 1: [Inoue H, et al., Construction of a starch-inducible homologous expression system to produce cellulolytic enzymes from Acremonium cellulolyticus. J Ind Microbiol Biotechnol. 2013 Aug; 40(8): 823-30].
본 발명은, 단백질의 제조 방법을 제공하는 것을 목적으로 한다.
본 발명자들은, 상기 과제를 해결하기 위해 예의 연구를 행한 결과, YscB 단백질의 활성이 저하되도록 탈라로마이세스 셀룰롤리티쿠스를 변형시킴으로써, 탈라로마이세스 셀룰롤리티쿠스의 단백질 생산능이 향상되는 것을 발견하여, 본 발명을 완성시켰다.
따라서, 본 발명은 이하와 같이 예시할 수 있다.
[1]
목적 단백질의 제조 방법으로서,
목적 단백질의 생산능을 갖는 탈라로마이세스 셀룰롤리티쿠스(Talraromyces cellulolyticus)를 배지에서 배양하는 단계를 포함하고,
상기 탈라로마이세스 셀룰롤리티쿠스가, 비변형주에 비해 YscB 단백질의 활성이 저하되도록 변형되어 있는, 방법.
[2]
상기 YscB 단백질의 활성이, yscB 유전자의 발현을 저하시키거나 yscB 유전자를 파괴함으로써 저하된, 상기 방법.
[3]
상기 YscB 단백질의 활성이, yscB 유전자의 결실에 의해 저하된, 상기 방법.
[4]
상기 YscB 단백질이, 하기 (a), (b), 또는 (c)에 기재된 단백질인, 상기 방법:
(a) 서열번호 43에 나타내는 아미노산 서열을 포함하는 단백질;
(b) 서열번호 43에 나타내는 아미노산 서열에 있어서, 1 내지 10개의 아미노산 잔기의 치환, 결실, 삽입, 및/또는 부가를 포함하는 아미노산 서열을 포함하고, 프로테아제 활성을 갖는 단백질;
(c) 서열번호 43에 나타내는 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, 프로테아제 활성을 갖는 단백질.
[5]
상기 탈라로마이세스 셀룰롤리티쿠스가, 비변형주에 비해 CreA 단백질의 활성이 저하되도록 변형되어 있는, 상기 방법.
[6]
상기 CreA 단백질의 활성이, creA 유전자의 발현을 저하시키거나 creA 유전자를 파괴함으로써 저하된, 상기 방법.
[7]
상기 CreA 단백질의 활성이, creA 유전자의 결실에 의해 저하된, 상기 방법.
[8]
상기 탈라로마이세스 셀룰롤리티쿠스가, 탈라로마이세스 셀룰롤리티쿠스 S6-25주 (NITE BP-01685)에서 유래하는 변형주인, 상기 방법.
[9]
추가로, 목적 단백질을 회수하는 것을 포함하는, 상기 방법.
[10]
상기 배양에 의해 상기 목적 단백질을 상기 배양 배지 중에 축적하는, 상기 방법.
[11]
목적 단백질이, 탈라로마이세스 셀룰롤리티쿠스에서 기능하는 신호 펩타이드와의 융합 단백질로서 발현하는, 상기 방법.
[12]
목적 단백질이 이종 단백질인, 상기 방법.
[13]
목적 단백질이 인간 유래 단백질인, 상기 방법.
[14]
목적 단백질이 인간 혈청 알부민인, 상기 방법.
[15]
목적 단백질이 항체 관련 분자인, 상기 방법.
[16]
목적 단백질이 성장 인자인, 상기 방법.
[도 1] T. 셀룰롤리티쿠스 F09주와 F09ΔyscB주에 의한 인간 혈청 알부민(HSA) 생산의 결과를 나타내는 도면(사진).
[도 2] T. 셀룰롤리티쿠스 F09주와 F09ΔyscB주에 의한 트라스투주맙(Trastuzumab) 생산의 결과를 나타내는 도면(사진).
[도 3] T. 셀룰롤리티쿠스 F09주와 F09ΔyscB주에 의한 케라틴세포 성장 인자 1(KGF-1) 생산의 결과를 나타내는 도면(사진).
[도 4] T. 셀룰롤리티쿠스 F09주와 F09ΔyscB주에 의한 혈관 내피 성장 인자(VEGF) 생산의 결과를 나타내는 도면(사진).
[도 5] T. 셀룰롤리티쿠스 F09주의 상청액 중에서 프로테아제 활성의 평가 결과를 나타내는 도면(사진).
[도 6] T. 셀룰롤리티쿠스 F09주 및 그 프로테아제 결손주의 상청액 중에서 프로테아제 활성의 평가 결과를 나타내는 도면(사진).
이하, 본 발명을 상세히 설명한다.
본 발명의 방법은, 탈라로마이세스 셀룰롤리티쿠스(Talaromyces cellulolyticus)를 이용한 목적 단백질의 제조 방법이다. 이 방법에 이용되는 탈라로마이세스 셀룰롤리티쿠스를 「본 발명의 미생물」이라고도 한다.
<1> 본 발명의 미생물
본 발명의 미생물은, YscB 단백질의 활성이 저하되도록 변형된, 목적 단백질 생산능을 갖는 탈라로마이세스 셀룰롤리티쿠스이다. 또한, 본 발명의 미생물의 설명에 있어서, 본 발명의 미생물 또는 그것을 구축하기 위해 사용되는 탈라로마이세스 셀룰롤리티쿠스를 「숙주」라고 말하는 경우가 있다.
<1-1> 탈라로마이세스 셀룰롤리티쿠스
본 발명의 미생물은, 탈라로마이세스 셀룰롤리티쿠스이다. 탈라로마이세스 셀룰롤리티쿠스의 구명칭은, 아크레모늄 셀룰롤리티쿠스(Acremonium cellulolyticus)이다. 즉, 아크레모늄 셀룰롤리티쿠스는, 계통 분류의 개정(改訂)에 의해, 탈라로마이세스 셀룰롤리티쿠스로 재분류되었다(FEMS Microbiol. Lett. 2014, 351: 32-41). 탈라로마이세스 셀룰롤리티쿠스로서, 구체적으로는 C1주(일본 공개특허공보 (Kokai) 특개2003-135052호), CF-2612주(일본 공개특허공보 (Kokai) 특개2008-271927호), TN주(FERM BP-685), S6-25주(NITE BP-01685), Y-94주(FERM BP-5826, CBS 136886) 및 그것들의 파생주를 들 수 있다. 또한, 「탈라로마이세스 셀룰롤리티쿠스」란, 본원 출원 전, 출원 시, 및 출원 후 중 적어도 어느 하나의 시점에서 탈라로마이세스 셀룰롤리티쿠스로 분류되는 진균을 총칭한다. 즉, 예를 들어, 상기 예시한 균주 등의 탈라로마이세스 셀룰롤리티쿠스로 일단 분류된 균주는, 만일 장래에 계통 분류가 변경된 경우에도, 탈라로마이세스 셀룰롤리티쿠스에 속하는 것으로 취급하는 것으로 한다.
S6-25주는, 2013년 8월 8일에 독립행정법인 제품평가기술기반기구 특허미생물기탁센터(우편번호 292-0818, 일본국 치바현 기사라즈시 카즈사카마타리 2-5-8 122호실)에 원(原)기탁된 후, 2013년 11월 15일에 부다페스트 조약에 기초하는 국제 기탁으로 이관되어, 수탁번호 NITE BP-01685로 지정되어 있다. 이 주는, TN주(FERM BP-685)로부터 얻어진 주이고, 높은 셀룰라아제 생산능을 갖는다. Y-94주는, 1983년 1월 12일에 통상산업성 공업기술원 생명공학공업기술연구소(현, 독립행정법인 제품평가기술기반기구, 특허미생물기탁센터, 우편번호: 292-0818, 주소: 일본국 치바현 기사라즈시 카즈사카마타리 2-5-8 120호실)에 원기탁된 후, 1997년 2월 19일에 부다페스트 조약에 기초하는 국제 기탁으로 이관되어, 수탁번호 FERM BP-5826로 지정되어 있다.
이들 균주는, 예를 들어, 각 균주가 기탁된 기탁 기관으로부터 입수할 수 있다.
본 발명의 미생물은, 상기 예시한 균주 등의 탈라로마이세스 셀룰롤리티쿠스를 변형시킴으로써 취득할 수 있다. 즉, 본 발명의 미생물은, 예를 들어, 상기 예시한 균주에서 유래하는 변형주라도 좋다. 본 발명의 미생물은, 구체적으로는, 예를 들어, S6-25주 또는 Y-94주에서 유래하는 변형주라도 좋다. 본 발명의 미생물은, 보다 구체적으로는, 예를 들어, S6-25주에서 유래하는 변형주라도 좋다. 본 발명의 미생물을 구축하기 위한 변형의 실시 순서는 특별히 제한되지 않는다.
<1-2> 목적 단백질 생산능
본 발명의 미생물은, 목적 단백질 생산능을 갖는다. 「목적 단백질 생산능을 갖는 미생물」이란, 목적 단백질을 생산하는 능력을 갖는 미생물을 말한다. 「목적 단백질 생산능을 갖는 미생물」이란, 구체적으로는, 배지에서 배양했을 때에, 목적 단백질을 발현하여 회수할 수 있을 정도로 해당 목적 단백질을 배양물 중에 축적하는 능력을 가진 미생물을 말한다. 「배양물 중의 축적」이란, 구체적으로는, 배지 중, 세포 표층, 균체 내, 또는 그것들의 조합에서의 축적을 말한다. 또한, 목적 단백질이 균체 외(예를 들어, 배양 배지 중이나 세포 표층)에 축적되는 경우를, 목적 단백질의 「분비」 또는 「분비 생산」이라고도 한다. 즉, 본 발명의 미생물은, 목적 단백질의 분비 생산능(목적 단백질을 분비 생산하는 능력)을 갖고 있어도 좋다. 목적 단백질은, 특히 배양 배지 중에 축적되어도 좋다. 목적 단백질의 축적량은, 예를 들어, 배양물 중으로의 축적량으로서 10 ㎍/L 이상, 1 mg/L 이상, 100 mg/L 이상, 또는 1 g/L 이상이라도 좋다. 본 발명의 미생물은, 1종의 목적 단백질의 생산능을 가지고 있어도 좋고, 2종 이상의 목적 단백질의 생산능을 갖고 있어도 좋다.
본 발명의 미생물은, 본래 목적 단백질 생산능을 갖는 것이라도 좋고, 목적 단백질 생산능을 가지도록 변형된 것이라도 좋다. 본 발명의 미생물은, 전형적으로는, 본래적으로 셀룰라아제 생산능(셀룰라아제를 생산하는 능력)을 갖는 것일 수 있다. 또한, 본 발명의 미생물은, 본래 갖는 목적 단백질 생산능이 증강되도록 변형된 것이라도 좋다. 목적 단백질 생산능을 갖는 미생물은, 예를 들어, 상기와 같은 탈라로마이세스 셀룰롤리티쿠스에 목적 단백질 생산능을 부여하거나, 또는 상기와 같은 탈라로마이세스 셀룰롤리티쿠스의 목적 단백질 생산능을 증강함으로써 취득할 수 있다. 목적 단백질 생산능은, 예를 들어, 목적 단백질 발현용 유전자 구축물의 도입, 목적 단백질 생산능이 향상되는 다른 변형의 도입, 또는 그것들의 조합에 의해, 부여 또는 증강될 수 있다.
본 발명의 미생물은, 적어도 목적 단백질 발현용 유전자 구축물을 보유함으로써, 목적 단백질 생산능을 갖는다. 본 발명의 미생물은, 구체적으로는, 목적 단백질 발현용 유전자 구축물을 보유함으로써, 혹은 목적 단백질 발현용 유전자 구축물을 보유하는 것과 다른 성질과의 조합에 의해, 목적 단백질 생산능을 갖고 있어도 좋다. 즉, 본 발명의 미생물은, 목적 단백질 발현용 유전자 구축물을 갖는다. 본 발명의 미생물은 목적 단백질의 발현용 유전자 구축물의 1종의 복제수 또는 2종 이상의 복제수를 가지고 있어도 좋다. 본 발명의 미생물은, 1종의 목적 단백질 발현용 유전자 구축물을 갖고 있어도 좋고, 2종 이상의 목적 단백질 발현용 유전자 구축물을 갖고 있어도 좋다. 목적 단백질 발현용 유전자 구축물의 복제수 및 종류수는, 각각, 목적 단백질 유전자의 복제수 및 종류수로 바꿔 읽어도 좋다.
본 발명의 미생물에 있어서, 목적 단백질 발현용 유전자 구축물은, 플라스미드와 같이 염색체 외에서 자율 복제하는 벡터 위에 존재하고 있어도 좋고, 염색체 위에 편입되어 있어도 좋다. 즉, 본 발명의 미생물은, 예를 들어, 벡터 위에 목적 단백질 발현용 유전자 구축물을 갖고 있어도 좋고, 바꿔 말하면, 목적 단백질 발현용 유전자 구축물을 포함하는 벡터를 갖고 있어도 좋다. 또한, 본 발명의 미생물은, 예를 들어, 염색체 위에 목적 단백질 발현용 유전자 구축물을 갖고 있어도 좋다. 본 발명의 미생물이 2개 이상의 목적 단백질 발현용 유전자 구축물을 갖는 경우, 이들 유전자 구축물은, 목적 단백질을 제조할 수 있도록 본 발명의 미생물에 보유되어 있으면 좋다. 예를 들어, 이들 유전자 구축물은, 전체가 단일의 발현 벡터 위에 보유되어 있어도 좋고, 전체가 염색체 위에 보유되어 있어도 좋다. 또한, 이들 유전자 구축물은, 복수의 발현 벡터 위에 따로따로 보유되어 있어도 좋고, 단일 또는 복수의 발현 벡터 위와 염색체 위에 따로따로 보유되어 있어도 좋다.
본 발명의 미생물은, 본래 목적 단백질 발현용 유전자 구축물을 갖는 것이라도 좋고, 목적 단백질 발현용 유전자 구축물을 갖도록 변형된 것이라도 좋다. 본 발명의 미생물은, 전형적으로는, 본래 셀룰라아제의 발현용의 유전자 구축물을 갖는 것일 수 있다. 또한, 본 발명의 미생물은, 본래 갖는 목적 단백질 발현용 유전자 구축물 대신에, 혹은 추가하여, 목적 단백질 발현용 유전자 구축물이 도입된 것이라도 좋다. 목적 단백질 발현용 유전자 구축물을 갖는 미생물은, 상기와 같은 탈라로마이세스 셀룰롤리티쿠스에 목적 단백질 발현용 유전자 구축물을 도입함으로써 취득할 수 있다.
「목적 단백질 발현용 유전자 구축물」이란, 목적 단백질을 발현할 수 있도록 구성된 유전자 발현계를 말한다. 목적 단백질 발현용 유전자 구축물을 「목적 단백질의 발현계」또는 「목적 단백질의 발현 유닛」이라고도 한다. 목적 단백질 발현용 유전자 구축물은, 5'에서 3' 방향으로, 프로모터 서열, 및 목적 단백질을 코딩하는 염기 서열을 포함한다. 프로모터 서열을 단순히 「프로모터」라고도 한다. 아미노산 서열을 코딩하는 염기 서열을 「유전자」라고도 한다. 예를 들어, 목적 단백질을 코딩하는 염기 서열을 「목적 단백질을 코딩하는 유전자」 또는 「목적 단백질 유전자」라고도 한다. 목적 단백질 유전자는, 프로모터의 하류에, 이 프로모터에 의해 제어되어 목적 단백질이 발현하도록 연결되어 있으면 좋다. 또한, 목적 단백질 발현용 유전자 구축물은, 목적 단백질을 발현시키기 위해 유효한 조절 서열(오퍼레이터나 터미네이터 등)을, 그것들이 기능할 수 있도록 적절한 위치에 갖고 있어도 좋다. 또한, 본 발명에 있어서, 「목적 단백질 유전자의 발현」, 「목적 단백질의 발현」, 「목적 단백질의 생성」, 「목적 단백질의 생산」은, 특기하지 않는 한, 서로 같은 뜻으로 사용할 수 있다. 목적 단백질 발현용 유전자 구축물은, 목적 단백질의 종류 등의 제반 조건에 따라서 적절히 설계할 수 있다.
프로모터는, 탈라로마이세스 셀룰롤리티쿠스에서 기능하는 것이면 특별히 제한되지 않는다. 「탈라로마이세스 셀룰롤리티쿠스에서 기능하는 프로모터」란, 탈라로마이세스 셀룰롤리티쿠스에 있어서 프로모터 활성, 즉 유전자의 전사 활성을 갖는 프로모터를 말한다.
프로모터는, 숙주 유래의 프로모터라도 좋고, 이종 유래의 프로모터라도 좋다. 프로모터는, 목적 단백질 유전자의 고유의 프로모터라도 좋고, 다른 유전자의 프로모터라도 좋다. 또한, 프로모터는, 유도성의 프로모터라도 좋고, 구성적인 프로모터라도 좋다. 프로모터로서는, 미생물의 셀룰라아제 유전자의 프로모터를 들 수 있다. 프로모터로서, 구체적으로는 탈라로마이세스 셀룰롤리티쿠스의 셀룰라아제 유전자의 프로모터를 들 수 있다. 셀룰라아제 유전자로서는, cbhI 유전자(cbh1 유전자라고도 함)나 cbhII 유전자(cbh2 유전자라고도 함)를 들 수 있다. 즉, 프로모터로서는, cbhI 유전자의 프로모터나 cbhII 유전자의 프로모터를 들 수 있다. cbhI 유전자의 프로모터를 「cbhI 프로모터」 또는 「cbh1 프로모터」라고도 한다. cbhII 유전자의 프로모터를 「cbhII 프로모터」 또는 「cbh2 프로모터」라고도 한다. 탈라로마이세스 셀룰롤리티쿠스의 cbhI 프로모터 및 cbhII 프로모터의 염기 서열을, 각각 서열번호 41 및 33에 나타낸다. 즉, 프로모터는, 예를 들어, 상기 예시한 프로모터의 염기 서열(예를 들어, 서열번호 41 또는 33의 염기 서열)을 갖는 프로모터라도 좋다. 또한, 프로모터는, 상기 예시한 프로모터(예를 들어, 서열번호 41 또는 33의 염기 서열을 갖는 프로모터)의 보존적 변이체라도 좋다. 즉, 예를 들어, 상기 예시한 프로모터는, 그대로, 혹은 적절히 변형하여 사용할 수 있다. 「cbhI 프로모터」 및 「cbhII 프로모터」란 용어는, 상기 예시한 cbhI 프로모터 및 cbhII 프로모터에 추가하여, 그것들의 보존적 변이체를 포함하는 것으로 한다. 프로모터의 보존적 변이체에 대해서는, 후술하는 yscB 유전자의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들어, 프로모터는, 원래의 기능이 유지되는 한, 서열번호 41 또는 33의 염기 서열에 대하여, 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 더욱 바람직하게는 97% 이상, 특히 바람직하게는 99% 이상의 상 동성을 갖는 염기 서열을 갖는 DNA라도 좋다. 또한, 프로모터에 대한 「원래의 기능」이란, 해당 프로모터의 직하류에 연결된 유전자를 발현하는(예를 들어, 유도적 혹은 구성적으로 발현하는) 기능을 말한다. 프로모터의 기능은, 예를 들어, 유전자의 발현을 확인함으로써 확인될 수 있다. 유전자의 발현은, 예를 들어, 리포터 유전자를 이용하여 확인할 수 있다.
목적 단백질은 특별히 제한되지 않는다. 목적 단백질은, 숙주 유래의 단백질이라도 좋고, 이종 유래의 단백질(이종 단백질)이라도 좋다. 본 발명에 있어서, 「이종 단백질」이란, 그 단백질을 생산하는 탈라로마이세스 셀룰롤리티쿠스에게 있어 외래성인 단백질을 말한다. 목적 단백질은, 예를 들어, 미생물 유래의 단백질이라도 좋고, 식물 유래의 단백질이라도 좋고, 동물 유래의 단백질이라도 좋고, 바이러스 유래의 단백질이라도 좋고, 인공적으로 아미노산 서열을 디자인한 단백질이라도 좋다. 목적 단백질은, 특히, 인간 유래의 단백질이라도 좋다. 목적 단백질은, 단량체 단백질이라도 좋고, 다량체 단백질이라도 좋다. 다량체 단백질이란, 2종 이상의 서브유닛으로 이루어진 다량체로서 존재할 수 있는 단백질을 말한다. 다량체에 있어서, 각 서브유닛은, 이황화 결합 등의 공유 결합으로 연결되어 있어도 좋고, 수소 결합이나 소수성 상호 작용 등의 비공유 결합으로 연결되어 있어도 좋고, 그것들의 조합에 의해 연결되어 있어도 좋다. 다량체에 있어서는, 하나 이상의 분자간 이황화 결합이 포함되는 것이 바람직하다. 다량체는, 단일 종류의 서브유닛으로 이루어진 동종 다량체라도 좋고, 2종 이상의 종류의 서브유닛으로 이루어진 이종 다량체라도 좋다. 또한, 「목적 단백질이 이종 단백질이다」란, 목적 단백질이 이종 다량체 단백질인 경우에 있어서는, 다량체를 구성하는 서브유닛 중, 적어도 하나의 서브유닛이 이종 단백질임을 말한다. 즉, 모든 서브유닛이 이종 유래라도 좋고, 일부의 서브유닛만이 이종 유래라도 좋다. 목적 단백질은, 분비성 단백질이라도 좋고, 비분비성 단백질이라도 좋다. 목적 단백질은, 천연에서 분비성인 단백질이라도 좋고, 천연에서는 비분비성인 단백질이라도 좋지만, 천연에서 분비성인 단백질인 것이 바람직하다. 또한 「단백질」에는, 올리고펩타이드나 폴리펩타이드 등의 펩타이드라고 불리는 물질도 포함된다.
목적 단백질로서는, 예를 들어, 효소, 생리 활성 단백질, 수용체 단백질, 백신으로서 사용되는 항원 단백질, 기타 임의의 단백질을 들 수 있다.
효소로서는, 예를 들어, 셀룰라아제, 트랜스글루타미나아제, 단백질 글루타미나아제, 이소말토덱스트라나아제, 프로테아제, 엔도펩티다아제, 엑소펩티다아제, 아미노펩티다아제, 카복시펩티다아제, 콜라게나아제 및 키티나아제 등을 들 수 있다.
본 발명에 있어서, 「셀룰라아제」란, 셀룰로오스에 포함되는 글리코시드 결합을 가수분해하는 반응을 촉매하는 효소의 총칭이다. 셀룰라아제로서는, 엔도형 셀룰라아제(엔도글루카나아제; EC 3.2.1.4), 엑소형 셀룰라아제(셀로비오하이드롤라아제; EC 3.2.1.91), 셀로비아제(β-글루코시다아제; EC 3.2.1.21)를 들 수 있다. 또한, 셀룰라아제는, 활성 측정에 사용되는 기질에 따라, 아비셀라아제, 필터 페이퍼 셀룰라아제(FPase), 카복시메틸셀룰라아제(CMCase) 등으로도 불린다. 셀룰라아제로서는 예를 들어, 트리코더마 레세이(Trichoderma reesei) 및 탈라로마이세스 셀룰롤리티쿠스 등의 진균이나 클로스트리디움 써모셀럼(Clostridium thermocellum) 등의 세균의 셀룰라아제를 들 수 있다.
트랜스글루타미나아제로서는, 예를 들어, 스트렙토베르티실리움 모바라엔스(Streptoverticillium mobaraense) IFO 13819(WO01/23591호), 스트렙토베르티실리움 신나모네움(cinnamoneum) IFO 12852, 스트렙토베르티실리움 그리세오카르네움(griseocarneum) IFO 12776, 스트렙토마이세스 리디쿠스(Streptomyces lydicus)(WO9606931호) 등의 방선균이나, 오오마이세테스(Oomycetes)(WO9622366호) 등의 사상균의 분비형의 트랜스글루타미나아제를 들 수 있다. 단백질 글루미타미나아제로서는, 예를 들어, 크리세오박테리움 프로테오리티쿰(Chryseobacterium proteolyticum)의 단백질 글루타미나아제를 들 수 있다(WO2005/103278호). 이소말토덱스트라나아제로서는, 예를 들어, 아트로박터 글로비포르미스(Arthrobacter globiformis)의 이소말토덱스트라나아제를 들 수 있다(WO2005/103278호).
생리 활성 단백질로서는, 예를 들어, 성장 인자(증식 인자), 호르몬, 사이토카인, 항체 관련 분자를 들 수 있다.
성장 인자(증식 인자)로서, 구체적으로는, 예를 들어, 상피 성장 인자(EGF), 인슐린 유사 성장 인자-1(IGF-1), 형질전환 성장 인자(TGF), 신경 성장 인자(NGF), 뇌 유래 신경 영양 인자(BDNF), 혈관 내피 세포 증식 인자(VEGF), 과립구 콜로니 자극 인자(G-CSF), 과립구 대식세포 콜로니 자극 인자(GM-CSF), 혈소판 유래 성장 인자(PDGF), 에리스로포이에틴(EPO), 트롬보포이에틴(TPO), 산성 섬유아세포 증식 인자(aFGF 또는 FGF1), 염기성 섬유아세포 증식 인자(bFGF 또는 FGF2), 케라틴세포 성장 인자(KGF-1 또는 FGF7, KGF-2 또는 FGF10), 간세포 증식 인자(HGF)를 들 수 있다.
호르몬으로서, 구체적으로는, 예를 들어, 인슐린, 글루카곤, 소마토스타틴 (somatostatin), 인간 성장 호르몬(hGH), 부갑상선 호르몬(PTH), 칼시토닌, 엑세나타이드(exenatide)를 들 수 있다.
사이토카인으로서, 구체적으로는, 예를 들어, 인터류킨, 인터페론, 종양 괴사 인자(TNF)을 들 수 있다.
또한, 성장 인자(증식 인자), 호르몬 및 사이토카인은 서로 엄밀하게 구별되지 않아도 좋다. 예를 들어, 생리 활성 단백질은, 성장 인자(증식 인자), 호르몬 및 사이토카인으로부터 선택되는 어느 하나의 그룹에 속하는 단백질이라도 좋고, 그것들로부터 선택되는 복수의 그룹에 속하는 단백질이라도 좋다.
또한, 생리 활성 단백질은, 단백질 전체라도 좋고, 그 일부라도 좋다. 단백질의 일부로서는, 예를 들어, 생리 활성을 갖는 부분을 들 수 있다. 생리 활성을 갖는 부분으로서, 구체적으로는, 예를 들어, 부갑상선 호르몬(PTH)의 N-말단의 34개의 아미노산 잔기로 이루어진 생리 활성 펩타이드인 테리파라타이드(Teriparatide)를 들 수 있다.
「항체 관련 분자」란, 완전 항체를 구성하는 도메인으로부터 선택되는 단일 도메인 또는 2종 이상의 도메인들의 조합으로 이루어진 분자종을 포함하는 단백질을 말한다. 완전 항체를 구성하는 도메인으로서는, 중쇄 도메인인 VH, CH1, CH2 및 CH3, 및 경쇄 도메인인 VL 및 CL을 들 수 있다. 항체 관련 분자는, 상술한 분자종을 포함하는 한, 단량체 단백질이라도 좋고, 다량체 단백질이라도 좋다. 또한, 항체 관련 분자가 다량체 단백질인 경우에는, 단일 종류의 서브유닛으로 이루어진 동종 다량체라도 좋고, 2종 이상의 종류의 서브유닛으로 이루어진 이종 다량체라도 좋다. 항체 관련 분자로서, 구체적으로는, 예를 들어, 완전 항체, Fab, F(ab'), F(ab')2, Fc, 중쇄(H쇄)와 경쇄(L쇄)로 이루어진 이량체, Fc 융합 단백질, 중쇄(H쇄), 경쇄(L쇄), 단쇄 Fv(scFv), sc(Fv)2, 이황화 결합 Fv(sdFv), 디아바디, VHH 단편(나노바디(등록상표))를 들 수 있다. 항체 관련 분자로서, 보다 구체적으로는, 예를 들어, 트라스투주맙과 니볼루맙을 들 수 있다.
수용체 단백질은, 특별히 제한되지 않고, 예를 들어, 생리 활성 단백질이나 기타 생리 활성 물질에 대한 수용체 단백질이라도 좋다. 기타 생리 활성 물질로서는, 예를 들어, 도파민 등의 신경 전달 물질을 들 수 있다. 또한, 수용체 단백질은, 대응하는 리간드가 알려져 있지 않은 희귀 수용체(orphan receptor)라도 좋다.
백신으로서 사용되는 항원 단백질은, 면역 반응을 유도할 수 있는 것이면 특별히 제한되지 않고, 의도한 면역 반응의 대상에 따라 적절하게 선택하면 좋다.
또한, 기타 단백질로서, 간유형 지방산 결합 단백질(LFABP), 형광 단백질, 면역글로불린 결합 단백질, 알부민, 세포외 단백질을 들 수 있다. 형광 단백질로서는, 녹색 형광 단백질(GFP)을 들 수 있다. 이 면역글로불린 결합 단백질로서는, 단백질 A, 단백질 G, 단백질 L을 들 수 있다. 알부민으로서는, 인간 혈청 알부민을 들 수 있다.
세포외 단백질로서는, 피브로넥틴, 비트로넥틴, 콜라겐, 오스테오폰틴, 라미닌 및 이들의 부분 서열을 들 수 있다. 라미닌은, α쇄, β쇄 및 γ쇄로 이루어진 이종 삼량체 구조를 갖는 단백질이다. 라미닌으로서는, 포유류의 라미닌을 들 수 있다. 포유류로서는, 인간, 원숭이, 침팬지 등의 영장류; 생쥐, 쥐, 햄스터, 기니피그 등의 설치류; 토끼, 말, 소, 양, 염소, 돼지, 개, 고양이 등의 기타 각종 포유류를 들 수 있다. 포유류로서는, 특히, 인간을 들 수 있다. 라미닌의 서브유닛쇄(즉, α쇄, β쇄 및 γ쇄)로서는, 5종의 α쇄(α1 내지 α5), 3종의 β쇄(β1 내지 β3) 및 3종의 γ쇄(γ1 내지 γ3)을 들 수 있다. 라미닌은, 이들 서브유닛쇄의 조합에 의해 다양한 동형들을 구성한다. 라미닌으로서, 구체적으로는, 예를 들어, 라미닌 111, 라미닌 121, 라미닌 211, 라미닌 213, 라미닌 221, 라미닌 311, 라미닌 321, 라미닌 332, 라미닌 411, 라미닌 421, 라미닌 423, 라미닌 511, 라미닌 521, 라미닌 523을 들 수 있다. 라미닌의 부분 서열로서는, 라미닌의 E8 단편인 라미닌 E8을 들 수 있다. 라미닌 E8은, 구체적으로는, α쇄의 E8 단편(α쇄 E8), β쇄의 E8 단편(β쇄 E8), 및 γ쇄의 E8 단편(γ쇄 E8)으로 이루어진 헤테로 삼량체 구조를 갖는 단백질이다. 라미닌 E8의 서브유닛쇄(즉, α쇄 E8, β쇄 E8, 및 γ쇄 E8)를 총칭하여, 「E8 서브유닛쇄」라고도 한다. E8 서브유닛쇄로서는, 상기 예시한 라미닌 서브유닛쇄의 E8 단편을 들 수 있다. 라미닌 E8은, 이들 E8 서브유닛쇄의 조합에 의해 다양한 동형들을 구성한다. 라미닌 E8로서, 구체적으로는, 예를 들어, 라미닌 111E8, 라미닌 121E8, 라미닌 211E8, 라미닌 221E8, 라미닌 332E8, 라미닌 421E8, 라미닌 411E8, 라미닌 511E8, 라미닌 521E8을 들 수 있다.
목적 단백질 유전자는, 그대로, 또는 적절히 변형하여 이용할 수 있다. 목적 단백질 유전자는, 예를 들어, 원하는 활성을 얻기 위해 변형할 수 있다. 목적 단백질 유전자 및 목적 단백질의 변이체에 대해서는, 후술하는 yscB 유전자 및 YscB 단백질의 보존적 변이체에 대한 기재를 준용할 수 있다. 예를 들어, 목적 단백질 유전자는, 코딩되는 목적 단백질의 아미노산 서열에 1개 또는 수개의 아미노산의 치환, 결실, 삽입 및/또는 부가가 포함되도록 변형되어도 좋다. 또한, 유래하는 생물종으로 특정되는 단백질은, 당해 생물종에서 발견되는 단백질 그 자체에 한정되지 않고, 당해 생물종에서 발견되는 단백질의 아미노산 서열을 갖는 단백질 및 그것들의 변이체를 포함하는 것으로 한다. 이들 변이체는, 당해 생물종에서 발견되어도 좋고, 발견되지 않아도 좋다. 즉, 예를 들어, 「인간 유래 단백질」이란, 인간에게서 발견되는 단백질 자체에 한정되지 않고, 인간에서 발견되는 단백질의 아미노산 서열을 갖는 단백질 및 그것들의 변이체를 포함하는 것으로 한다. 또한, 목적 단백질 유전자에서는, 임의의 코돈을 그것과 등가의 코돈으로 치환한 것이라도 좋다. 예를 들어, 목적 단백질 유전자는, 사용하는 숙주의 코돈 사용 빈도에 따라 최적의 코돈을 갖도록 변형되어도 좋다.
목적 단백질은, 상기 예시한 바와 같은 목적 단백질의 아미노산 서열에 더하여, 다른 아미노산 서열을 포함하고 있어도 좋다. 즉, 목적 단백질은, 다른 아미노산 서열과의 융합 단백질이라도 좋다. 「다른 아미노산 서열」은, 원하는 성질의 목적 단백질이 얻어지는 한, 특별히 제한되지 않는다. 「다른 아미노산 서열」은, 그 이용 목적 등의 조건에 따라 적절히 선택할 수 있다. 「다른 아미노산 서열」로서는, 예를 들어, 신호 펩타이드(신호 서열이라고도 함), 펩타이드 태그, 프로테아제의 인식 서열을 들 수 있다. 「다른 아미노산 서열」은, 예를 들어, 목적 단백질의 N-말단, 혹은 C-말단, 또는 그 양쪽에 연결되어도 좋다. 「다른 아미노산 서열」로서는, 1종의 아미노산 서열을 이용해도 좋고, 2종 이상의 아미노산 서열을 조합하여 사용해도 좋다.
신호 펩타이드는, 예를 들어, 목적 단백질의 분비형 생산에 이용할 수 있다. 신호 펩타이드는, 목적 단백질의 N-말단에 연결되어도 좋다. 즉, 일 형태에 있어서, 목적 단백질 발현용 유전자 구축물은, 5'에서 3'방향으로, 프로모터 서열, 신호 펩타이드를 코딩하는 염기 서열, 및 목적 단백질을 코딩하는 염기 서열을 포함하고 있어도 좋다. 그 경우, 목적 단백질을 코딩하는 핵산 서열은, 신호 펩타이드를 코딩하는 핵산 서열의 하류에, 이 신호 펩타이드와의 융합 단백질로서 목적 단백질이 발현하도록 연결되어 있으면 좋다. 또한, 그러한 융합 단백질에 있어서, 신호 펩타이드와 목적 단백질은 서로 인접하고 있어도 좋고, 인접하고 있지 않아도 좋다. 즉, 「목적 단백질이 신호 펩타이드와의 융합 단백질로서 발현한다」란, 목적 단백질이 신호 펩타이드에 인접해서 이 신호 펩타이드와의 융합 단백질로서 발현하는 경우에 한정되지 않고, 목적 단백질이 다른 아미노산 서열을 통하여 신호 펩타이드와의 융합 단백질로서 발현하는 경우도 포함된다. 신호 펩타이드를 이용하여 목적 단백질을 분비 생산하는 경우, 통상, 분비시에 신호 펩타이드가 절단되고, 신호 펩타이드를 갖지 않는 목적 단백질이 균체 밖으로 분비될 수 있다. 즉, 「목적 단백질이 신호 펩타이드와의 융합 단백질로서 발현한다」 또는 「목적 단백질이 신호 펩타이드를 포함한다」란, 목적 단백질이 발현시에 신호 펩타이드와의 융합 단백질을 구성하고 있으면 충분하고, 최종적으로 얻어지는 목적 단백질이 신호 펩타이드와의 융합 단백질을 구성하고 있는 것을 요하지 않는다.
신호 펩타이드는, 탈라로마이세스 셀룰롤리티쿠스에서 기능하는 것이면 특별히 제한되지 않는다. 「탈라로마이세스 셀룰롤리티쿠스에서 기능하는 신호 펩타이드」란, 목적 단백질의 N-말단에 연결되었을 때에 탈라로마이세스 셀룰롤리티쿠스에서 목적 단백질의 분비를 가져오는 신호 펩타이드를 말한다.
신호 펩타이드는, 숙주 유래의 신호 펩타이드라도 좋고, 이종 유래의 신호 펩타이드라도 좋다. 신호 펩타이드는, 목적 단백질의 고유의 신호 펩타이드라도 좋고, 다른 단백질의 신호 펩타이드라도 좋다. 신호 펩타이드로서는, 미생물의 분비성 셀룰라아제의 신호 펩타이드를 들 수 있다. 신호 펩타이드로서, 구체적으로는 탈라로마이세스 셀룰롤리티쿠스의 분비성 셀룰라아제의 신호 펩타이드를 들 수 있다. 분비성 셀룰라아제로서는, cbhI 유전자에 코딩되는 CbhI 단백질(Cbh1 단백질이라고도 함)이나 cbhII 유전자에 코딩되는 CbhII 단백질(Cbh2 단백질이라고도 함)을 들 수 있다. 즉, 신호 펩타이드로서는, CbhI 단백질의 신호 펩타이드나 CbhII 단백질의 신호 펩타이드를 들 수 있다. CbhI 단백질의 신호 펩타이드를 「CbhI 신호 펩타이드」 또는 「Cbh1 신호 펩타이드」라고도 한다. CbhII 단백질의 신호 펩타이드를 「CbhII 신호 펩타이드」 또는 「Cbh2 신호 펩타이드」라고도 한다. 탈라로마이세스 셀룰롤리티쿠스의 CbhI 신호 펩타이드의 아미노산 서열을 서열번호 42에 나타낸다. 즉, 신호 펩타이드는, 예를 들어, 상기 예시한 신호 펩타이드의 아미노산 서열(예를 들어, 서열번호 42의 아미노산 서열)을 갖는 신호 펩타이드라도 좋다. 또한, 신호 펩타이드는, 상기 예시한 신호 펩타이드(예를 들어, 서열번호 42의 아미노산 서열을 갖는 신호 펩타이드)의 보존적 변이체라도 좋다. 즉, 예를 들어, 상기 예시한 신호 펩타이드는, 그대로, 혹은 적절히 변형하여 사용할 수 있다. 「CbhI 신호 펩타이드」 및 「CbhII 신호 펩타이드」란 용어는, 상기 예시한 CbhI 신호 펩타이드 및 CbhII 신호 펩타이드에 더하여, 그것들의 보존적 변이체를 포함하는 것으로 한다. 신호 펩타이드의 보존적 변이체에 대해서는, 후술하는 YscB 단백질의 보존적 변이체에 관한 기재를 준용할 수 있다. 예를 들어, 신호 펩타이드는, 원래의 기능이 유지되는 한, 서열번호 42의 아미노산 서열에 있어서, 1개 혹은 수개의 위치에서의 1개 또는 수개의 아미노산이 치환, 결실, 삽입, 및/또는 부가된 아미노산 서열을 갖는 펩타이드라도 좋다. 또한, 신호 펩타이드의 변이체에서의 상기 「1개 또는 수개」란, 구체적으로는, 바람직하게는 1개 내지 7개, 보다 바람직하게는 1개 내지 5개, 더욱 바람직하게는 1개 내지 3개, 특히 바람직하게는 1개 내지 2개를 의미한다. 또한, 예를 들어, 신호 펩타이드는, 원래의 기능이 유지되는 한, 서열번호 42의 아미노산 서열에 대하여, 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 더욱 바람직하게는 97% 이상, 특히 바람직하게는 99% 이상의 상동성을 갖는 아미노산 서열을 갖는 펩타이드라도 좋다. 또한, 신호 펩타이드에 대한 「원래 기능」이란, 목적 단백질의 N-말단에 연결되었을 때에 목적 단백질의 분비를 가져오는 기능이라도 좋다. 신호 펩타이드의 기능은, 예를 들어, 단백질의 N-말단으로의 결합에 의한 그 단백질의 분비를 확인함으로써 확인할 수 있다.
펩타이드 태그로서, 구체적으로는, His 태그, FLAG 태그, GST 태그, Myc 태그, MBP(말토스 결합 단백질), CBP(셀룰로스 결합 단백질), TRX(티오레독신), GFP(녹색 형광 단백질), HRP(호스래디쉬 퍼옥시다제), ALP(알칼리 포스파타제), 항체의 Fc 영역을 들 수 있다. 펩타이드 태그는, 예를 들어, 발현한 목적 단백질의 검출이나 정제에 이용할 수 있다.
프로테아제의 인식 서열로서, 구체적으로는, HRV3C 프로테아제 인식 서열, 인자 Xa 프로테아제 인식 서열, proTEV 프로테아제 인식 서열을 들 수 있다. 프로테아제의 인식 서열은, 예를 들어, 발현한 목적 단백질의 절단에 이용할 수 있다. 구체적으로는, 예를 들어, 목적 단백질을 펩타이드 태그와의 융합 단백질로서 발현시키는 경우, 목적 단백질과 펩타이드 태그의 연결부에 프로테아제의 인식 서열을 도입함으로써, 발현한 목적 단백질로부터 프로테아제를 이용하여 펩타이드 태그를 절단하고, 펩타이드 태그를 갖지 않는 목적 단백질을 얻을 수 있다.
최종적으로 얻어지는 목적 단백질의 N-말단 영역은, 천연 단백질의 것과 동일해도 좋고, 천연 단백질의 것과 동일하지 않아도 좋다. 예를 들어, 최종적으로 얻어지는 목적 단백질의 N-말단 영역은, 천연의 단백질과 비교하여, 1개 또는 수개의 아미노산 잔기가 부가, 혹은 결실된 것이라도 좋다. 또한 상기 「1개 또는 수개」란, 목적의 목적 단백질의 전체 길이나 구조 등에 따라 다르지만, 구체적으로는, 바람직하게는 1개 내지 20개, 보다 바람직하게는 1개 내지 10개, 더욱 바람직하게는 1개 내지 5개, 특히 바람직하게는 1개 내지 3개를 의미한다.
또한, 목적 단백질은, 전구 모이어티를 포함하는 단백질(전구 단백질)로서 발현해도 좋다. 목적 단백질이 전구 단백질로서 발현하는 경우, 최종적으로 얻어지는 목적 단백질은 전구 단백질이라도 좋고, 그렇지 않아도 좋다. 즉, 전구 단백질은 전구 모이어티를 절단하여 성숙 단백질이 되어도 좋다. 상기 절단은, 예를 들어, 프로테아제에 의해 행할 수 있다. 프로테아제를 사용하는 경우, 최종적으로 얻어지는 단백질의 활성이라는 관점에서, 전구 단백질은 일반적으로는 천연의 단백질과 거의 같은 위치에서 절단되는 것이 바람직하고, 천연의 단백질과 완전히 같은 위치에서 절단되어 천연의 것과 동일한 성숙 단백질이 얻어지는 것이 보다 바람직하다. 따라서, 일반적으로는, 천연으로 생기는 성숙 단백질과 동일한 단백질을 발생시키는 위치에서 전구 단백질을 절단하는 특이적 프로테아제가 가장 바람직하다. 그러나, 상술한 바와 같이, 최종적으로 얻어지는 목적 단백질의 N-말단 영역은, 천연의 단백질과 동일하지 않아도 좋다. 예를 들어, 생산되는 목적 단백질의 종류나 사용 목적 등에 따라서는, 천연의 단백질과 비교하여 N-말단이 1개 내지 수개분의 아미노산 잔기만큼 길거나 또는 짧은 단백질이 보다 적절한 활성을 가지는 경우가 있다. 본 발명에서 사용할 수 있는 프로테아제에는, Dispase(베링거 맨하임사 제조)와 같은 상업적으로 입수할 수 있는 것 외에, 미생물의 배양액, 예를 들어 방선균의 배양액 등으로부터 얻어지는 것이 포함된다. 그러한 프로테아제는 미정제 상태로 사용할 수도 있고, 필요에 따라서 적당한 순도까지 정제한 후에 사용해도 좋다.
목적 단백질 유전자는, 예를 들어, 클로닝에 의해 취득할 수 있다. 클로닝에는, 예를 들어, 목적 단백질 유전자를 포함하는 게놈 DNA나 cDNA 등의 핵산을 이용할 수 있다. 또한, 목적 단백질 유전자는, 예를 들어, 그 염기 서열에 기초한 전합성으로도 취득할 수 있다(Gene, 60(1), 115-127 (1987)). 취득한 목적 단백질 유전자는, 그대로, 또는 적절히 변형하여, 이용할 수 있다. 즉, 목적 단백질 유전자를 변형시킴으로써, 그 변이체를 취득할 수 있다. 유전자의 변형은 공지의 수법에 의해 행할 수 있다. 예를 들어, 부위 특이적 돌연변이법에 의해, DNA의 목적한 부위에 목적한 변이를 도입할 수 있다. 부위 특이적 돌연변이법으로서는, PCR을 이용하는 방법(문헌 [Higuchi, R., 61, in PCR technology, Erlich, HA Eds., Stockton press(1989)]; [Carter, P., Meth. in Enzymol., 154, 382(1987)])이나, 파지를 이용하는 방법(문헌 [Kramer, W. and Frits, HJ, Meth. in Enzymol., 154, 350(1987)]; [Kunkel, TA et al., Meth. in Enzymol., 154, 367(1987)])을 들 수 있다. 또는, 목적 단백질 유전자의 변이체를 전합성해도 좋다. 다르게는, 취득한 목적 단백질 유전자에 대하여, 적절하게, 프로모터 서열의 도입 등의 변형을 행하여, 목적 단백질 발현용 유전자 구축물을 취득할 수 있다. 또한, 목적 단백질 발현용 유전자 구축물의 다른 구성 요소(예를 들어, 프로모터 서열)나 목적 단백질 발현용 유전자 구축물도, 목적 단백질 유전자와 동일하게 취득할 수 있다.
유전자의 변형은, 공지의 수법에 의해 행할 수 있다. 예를 들어, 부위 특이 적 돌연변이법에 의해, DNA의 목적 부위에 목적한 변이를 도입할 수 있다. 부위 특이적 돌연변이법으로서는, PCR을 이용하는 방법(문헌 [Higuchi, R., 61, in PCR technology, Erlich, HA Eds., Stockton press(1989)]; [Carter, P., Meth. in Enzymol., 154, 382(1987)])이나, 파지를 이용하는 방법(문헌 [Kramer, W. and Frits, HJ, Meth. in Enzymol., 154, 350(1987)]; [Kunkel, TA et al., Meth. in Enzymol., 154, 367(1987)])을 들 수 있다.
목적 단백질 발현용 유전자 구축물을 탈라로마이세스 셀룰롤리티쿠스에 도입하는 수법은 특별히 제한되지 않는다. 「목적 단백질 발현용 유전자 구축물의 도입」이란, 목적 단백질 발현용 유전자 구축물을 숙주에 보유시키는 것을 말하며, 구체적으로는, 목적 단백질 유전자를 발현 가능하게 숙주에 도입하는 것이라도 좋다. 「목적 단백질 발현용 유전자 구축물의 도입」에는, 특기하지 않는 한, 미리 구축한 목적 단백질 발현용 유전자 구축물을 숙주에 일괄적으로 도입하는 경우에 한정되지 않고, 목적 단백질 발현용 유전자 구축물의 일부가 숙주에 도입되고, 또한 숙주 내에서 목적 단백질 발현용 유전자 구축물이 구축되는 경우도 포함된다. 예를 들어, 숙주가 본래 갖는 프로모터의 하류에 목적 단백질 유전자를 도입함으로써 숙주 염색체 상에서 목적 단백질 발현용 유전자 구축물을 구축해도 좋다.
목적 단백질 발현용 유전자 구축물은, 예를 들어, 목적 단백질의 발현 용의 유전자 구축물을 포함하는 벡터를 이용하여 숙주에 도입할 수 있다. 목적 단백질 발현용 유전자 구축물을 포함하는 벡터를 「목적 단백질의 발현 벡터」라고도 한다. 목적 단백질의 발현 벡터는, 예를 들어, 목적 단백질 발현용 유전자 구축물을 벡터와 연결함으로써 구축할 수 있다. 또한, 예를 들어, 벡터가 프로모터를 구비하는 경우, 목적 단백질 발현용 유전자 구축물을 함유하는 벡터는, 당해 프로모터의 하류에 목적 단백질 유전자를 연결함으로써도 구축할 수 있다. 목적 단백질의 발현 벡터로 숙주를 도입함으로써, 이 벡터가 도입된 형질전환체가 얻어지는데, 즉, 목적 단백질 발현용 유전자 구축물을 숙주에 도입할 수 있다. 벡터는, 숙주의 세포 내에서 자율 복제 가능한 것이면 특별히 제한되지 않는다. 벡터는, 단일 복제수 벡터라도 좋고, 저복제수 벡터라도 좋고, 고복제수 벡터라도 좋다. 벡터는, 형질전환체를 선별하기 위한 마커 유전자를 구비하고 있어도 좋다. 벡터는, 목적 단백질 유전자를 발현하기 위한 프로모터나 터미네이터를 구비하고 있어도 좋다.
또한, 목적 단백질 발현용 유전자 구축물은, 숙주의 염색체에 도입되어도 좋다. 염색체로의 유전자의 도입은, 상동성 재조합을 이용하여 행할 수 있다. 구체적으로는, 목적 단백질 발현용 유전자 구축물을 포함하는 재조합 DNA로 숙주를 형질전환시켜, 숙주의 염색체 상의 목적 부위와 상기 유전자 구축물 간의 상동성 재조합을 유도함으로써, 목적 단백질 발현용 유전자 구축물을 숙주의 염색체 위에 도입할 수 있다. 상동성 재조합에 사용하는 재조합 DNA의 구조는, 원하는 형태로 상동성 재조합을 유발하는 것이라면 특별히 제한되지 않는다. 예를 들어, 목적 단백질 발현용 유전자 구축물을 포함하는 선형 DNA로서, 목적 단백질 발현용 유전자 구축물의 양 끝에 염색체 상의 치환 대상 부위의 상류 및 하류의 서열을 각각 구비하는 선형 DNA로 숙주를 형질전환시켜, 상기 치환 대상 부위의 상류 및 하류에서 각각 상동성 재조합을 일으킴으로써, 상기 치환 대상 부위를 목적 단백질 발현용 유전자 구축물로 치환할 수 있다. 상동성 재조합에 사용하는 재조합 DNA는, 형질전환체를 선별하기 위한 마커 유전자를 구비하고 있어도 좋다. 또한, 목적 단백질 유전자나 프로모터 등의 목적 단백질 발현용 유전자 구축물의 일부의 염색체로의 도입도, 목적 단백질 발현용 유전자 구축물 전체의 염색체로의 도입과 동일하게 행할 수 있다.
마커 유전자는, 숙주의 영양요구성 등의 형질에 따라 적절하게 선택할 수 있다. 예를 들어, 숙주가 pyrF 유전자 또는 pyrG 유전자의 변이에 의해 우라실 영양요구성을 나타내는 경우, pyrF 유전자 또는 pyrG 유전자를 마커 유전자로서 이용함으로써, 우라실 영양요구성의 상보성 관계(즉, 우라실 자가영양성)를 지표로 하여, 목적한 변형이 도입된 주(株)를 선별할 수 있다. 또한, 마커 유전자로서는, 하이그로마이신 내성 유전자 등의 약제 내성 유전자를 이용할 수도 있다.
형질전환은, 예를 들어, 곰팡이나 효모 등의 진핵 미생물의 형질전환에 통상 사용되는 수법에 의해 행할 수 있다. 그러한 수법으로서는, 원형질체 배양법을 들 수 있다.
<1-3> YscB 단백질의 활성 저하
본 발명의 미생물은, YscB 단백질의 활성이 저하되도록 변형되어 있다. 본 발명의 미생물은, 구체적으로는, 비변형주에 비해, YscB 단백질의 활성이 저하되도록 변형되어 있다. 본 발명의 미생물은, 보다 구체적으로는, 예를 들어, yscB 유전자의 발현이 저하되도록 변형되어 있어도 좋고, yscB 유전자가 파괴되도록 변형되어 있어도 좋다. YscB 단백질의 활성이 저하되도록 탈라로마이세스 셀룰롤리티쿠스를 변형시킴으로써, 이 미생물의 목적 단백질 생산능을 향상시킬 수 있는데, 즉, 이 미생물에 의한 목적 단백질의 생산을 증대시킬 수 있다.
이하, YscB 단백질 및 그것을 코딩하는 yscB 유전자에 대하여 설명한다.
YscB 단백질은, 프로테아제이다. 「프로테아제」란, 단백질을 가수분해하는 반응을 촉매하는 활성을 갖는 단백질을 말한다. 또한, 이 활성을 「프로테아제 활성」이라고도 한다.
탈라로마이세스 셀룰롤리티쿠스 S6-25주의 yscB 유전자(인트론을 포함함)의 염기 서열, 및 이 유전자가 코딩하는 YscB 단백질의 아미노산 서열을, 각각 서열번호 32 및 43으로 나타낸다. 즉, yscB 유전자는, 예를 들어, 서열번호 32에 나타내는 염기 서열을 갖는 유전자라도 좋다. 또한, YscB 단백질은, 예를 들어, 서열번호 43에 나타내는 아미노산 서열을 갖는 단백질이라도 좋다. 또한 「아미노산 또는 염기 서열을 갖는다」란 표현은, 당해 「 아미노산 또는 염기 서열을 포함하는」 경우 및 당해 「아미노산 또는 염기 서열로 이루어진」 경우를 포함한다.
yscB 유전자는, 원래의 기능이 유지되는 한, 상기 예시한 yscB 유전자(예를 들어, 서열번호 32에 나타내는 염기 서열을 갖는 유전자)의 변이체라도 좋다. 마찬가지로, YscB 단백질은, 원래의 기능이 유지되는 한, 상기 예시한 YscB 단백질(예를 들어, 서열번호 43에 나타내는 아미노산 서열을 갖는 단백질)의 변이체라도 좋다. 그러한 원래의 기능이 유지된 변이체를 「보존적 변이체」라고 하는 경우가 있다. 본 발명에 있어서, 「yscB 유전자」란 용어는, 상기 예시한 yscB 유전자에 한정되지 않고, 그 보존적 변이체를 포함하는 것으로 한다. 마찬가지로, 「YscB 단백질」이란 용어는, 상기 예시한 YscB 단백질에 한정되지 않고, 그 보존적 변이체를 포함하는 것으로 한다. 보존적 변이체로서는, 예를 들어, 상기 예시한 yscB 유전자나 YscB 단백질의 동족체나 인위적인 변형체를 들 수 있다.
「원래의 기능이 유지되고 있다」란, 유전자 또는 단백질의 변이체가, 원래의 유전자 또는 단백질의 기능(활성이나 성질)에 대응하는 기능(활성이나 성질)을 갖는 것을 말한다. 즉, 「원래의 기능이 유지되어 있다」란, yscB 유전자에 있어서는, 유전자의 변이체가, 원래의 기능이 유지된 단백질을 코딩하는 것을 말한다. 또한, 「원래의 기능이 유지되어 있다」란, YscB 단백질에 있어서는, 단백질의 변이체가, 프로테아제 활성을 갖는 것을 말한다.
프로테아제 활성은, 효소를 기질(단백질)과 항온배양하고, 효소 의존적인 기질의 분해를 측정함으로써 측정할 수 있다. 또한, 프로테아제 활성은, 시판의 프로테아제 활성 측정 키트를 사용하여 측정할 수 있다.
이하, 보존적 변형에 대하여 예시한다.
yscB 유전자의 동족체 또는 YscB 단백질의 동족체는, 예를 들어, 상기 예시한 yscB 유전자의 염기 서열 또는 상기 예시한 YscB 단백질의 아미노산 서열을 질의 서열로서 사용한 BLAST 검색이나 FASTA 검색에 의해 공개 데이터베이스로부터 용이하게 취득할 수 있다. 또한, yscB 유전자의 동족체는, 예를 들어, 탈라로마이세스 셀룰롤리티쿠스와 같은 생물종 염색체를 주형으로 하여, 이들 공지의 yscB 유전자의 염기 서열에 기초하여 제작한 올리고뉴클레오티드를 프라이머로서 이용한 PCR에 의해 취득할 수 있다.
yscB 유전자는, 원래의 기능이 유지되는 한, 상기 예시한 YscB 단백질의 아미노산 서열(예를 들어, 서열번호 43에 나타내는 아미노산 서열)에 있어서, 1개 또는 수개의 위치에서의 1개 또는 수개의 아미노산이 치환, 결실, 삽입, 및/또는 부가된 아미노산 서열을 갖는 단백질을 코딩하는 유전자라도 좋다. 또한 상기 「1개 또는 수개」란, 아미노산 잔기의 단백질의 입체 구조에서의 위치나 아미노산 잔기의 종류에 따라서도 다르지만, 구체적으로는, 예를 들어, 1개 내지 50개, 1개 내지 40개, 1개 내지 30개, 바람직하게는 1개 내지 20개, 보다 바람직하게는 1개 내지 10개, 더욱 바람직하게는 1개 내지 5개, 특히 바람직하게는 1개 내지 3개를 의미한다.
상기의 1개 또는 수개의 아미노산의 치환, 결실, 삽입, 및/또는 부가는, 단백질의 기능이 정상으로 유지되는 보존적 변이이다. 보존적 변이의 대표적인 것은, 보존적 치환이다. 보존적 치환이란, 치환 부위가 방향족 아미노산인 경우에는, Phe, Trp, Tyr 간에서; 치환 부위가 소수성 아미노산인 경우에는, Leu, Ile, Val 간에서; 극성 아미노산인 경우에는, Gln, Asn 간에서; 염기성 아미노산인 경우에는, Lys, Arg, His 간에서; 산성 아미노산인 경우, Asp, Glu 간에서; 하이드록실기를 가진 아미노산인 경우에는, Ser, Thr 간에서 서로 치환되는 변이이다. 보존적 치환이라고 간주되는 치환으로서는, 구체적으로는, Ala에서 Ser 또는 Thr로의 치환, Arg에서 Gln, His 또는 Lys로의 치환, Asn에서 Glu, Gln, Lys, His 또는 Asp로의 치환, Asp에서 Asn, Glu 또는 Gln로의 치환, Cys에서 Ser 또는 Ala로의 치환, Gln에서 Asn, Glu, Lys, His, Asp 또는 Arg로의 치환, Glu에서 Gly, Asn, Gln, Lys 또는 Asp로의 치환, Gly에서 Pro로의 치환, His에서 Asn, Lys, Gln, Arg 또는 Tyr로의 치환, Ile에서 Leu, Met, Val 또는 Phe로의 치환, Leu에서 Ile, Met, Val 또는 Phe로의 치환, Lys에서 Asn, Glu, Gln, His 또는 Arg로의 치환, Met에서 Ile, Leu, Val 또는 Phe로의 치환, Phe에서 Trp, Tyr, Met, Ile 또는 Leu로의 치환, Ser에서 Thr 또는 Ala로의 치환, Thr에서 Ser 또는 Ala로의 치환, Trp에서 Phe 또는 Tyr로의 치환, Tyr에서 His, Phe 또는 Trp로의 치환, 및, Val에서 Met, Ile 또는 Leu로의 치환을 들 수 있다. 또한, 상기와 같은 아미노산의 치환, 결실, 삽입, 또는 부가에는, 유전자가 유래하는 생물의 개체 또는 종의 차이에 기초하는 경우 등의 자연적으로 발생하는 변이에 의해 생기는 것도 포함된다.
또한, yscB 유전자는, 원래의 기능이 유지되는 한, 상기 예시한 YscB 단백질의 아미노산 서열(예를 들어, 서열번호 43에 나타내는 아미노산 서열) 전체에 대하여, 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 더욱 바람직하게는 97% 이상, 특히 바람직하게는 99% 이상의 상동성을 갖는 아미노산 서열을 갖는 단백질을 코딩하는 유전자라도 좋다. 또한, 본 명세서에 있어서, 「상동성」(homology)은, 「동일성」(identity)을 의미한다.
또한, yscB 유전자는, 원래의 기능이 유지되고 있는 한, 상기 예시한 yscB 유전자의 염기 서열(예를 들어, 서열번호 32에 나타내는 염기 서열)의 상보 서열 또는 이 상보 서열로부터 제조될 수 있는 프로브와 엄격한 조건 하에서 하이브리드화할 수 있는 DNA라도 좋다. 「엄격한 조건」이란, 소위 특이적인 하이브리드가 형성되고, 비특이적인 하이브리드는 형성되지 않는 조건을 말한다. 일례를 나타내면, 상동성이 높은 DNA끼리, 예를 들어, 80% 이상, 바람직하게는 90% 이상, 보다 바람직하게는 95% 이상, 더욱 바람직하게는 97% 이상, 특히 바람직하게는 99% 이상의 상동성을 갖는 DNA끼리 하이브리드화하고, 그보다 낮은 상동성을 갖는 DNA끼리는 하이브리드화하지 않는 조건, 또는 통상의 서던 하이브리드화의 세정 조건인 60℃, 1×SSC, 0.1% SDS, 바람직하게는 60℃, 0.1×SSC, 0.1% SDS, 보다 바람직하게는 68℃, 0.1×SSC, 0.1% SDS에 상당하는 염농도 및 온도에서, 1회, 바람직하게는 2회 내지 3회 세정하는 조건을 들 수 있다.
상기 프로브는, 예를 들어, 상술한 유전자의 상보 서열의 일부라도 좋다. 그러한 프로브는, 공지의 유전자의 염기 서열에 기초하여 제작한 올리고뉴클레오티드를 프라이머로 하고, 이들 염기 서열을 포함하는 DNA 단편을 주형으로 하는 PCR에 의해 제작할 수 있다. 프로브로서는, 예를 들어, 약 300bp 정도의 길이의 DNA 단편을 사용할 수 있다. 그러한 경우, 하이브리드화의 세정의 조건으로서는, 50℃, 2×SSC, 0.1% SDS를 들 수 있다.
또한, yscB 유전자는, 임의의 코돈을 그것과 등가의 코돈으로 치환한 것이라도 좋다. 즉, yscB 유전자는, 코돈의 축중(縮重; degeneracy)에 의한 상기 예시한 yscB 유전자의 변이체라도 좋다.
2개의 서열 간의 서열 동일성의 백분율은, 예를 들어, 수학적 알고리즘을 이용하여 결정할 수 있다. 이러한 수학적 알고리즘의 한정되지 않은 예로서는, 문헌 [Myers and Miller(1988) CABIOS 4: 11-17]의 알고리즘, 문헌 [Smith et al(1981) Adv. Appl. Math 2: 482]의 국소 상동성 알고리즘, 문헌 [Needleman and Wunsch(1970) J. Mol. Biol. 48: 443-453]의 상동성 얼라이먼트 알고리즘, 문헌 [Pearson and Lipman(1988) Proc. Natl. Acad. Sci. 85: 2444-2448]의 상동성을 검색하는 방법, 문헌 [Karlin and Altschul(1993) Proc. Natl. Acad. Sci. USA 90: 5873-5877]에 기재되어 있는 바와 같은 문헌 [Karlin and Altschul(1990) Proc. Natl. Acad. Sci. USA 87: 2264]의 알고리즘에 비해 개선된 알고리즘을 들 수 있다.
이러한 수학적 알고리즘에 기초하는 프로그램을 이용하여, 서열 동일성을 결정하기 위한 서열 비교(즉, 얼라이먼트)를 행할 수 있다. 프로그램은, 적절히, 컴퓨터에 의해 실행할 수 있다. 이러한 프로그램으로서는, 특별히 한정되지 않지만, PC/Gene 프로그램의 CLUSTAL [미국 캘리포니아주 마운틴 뷰 소재의 인텔리제네틱스(Intelligenetics)], ALIGN 프로그램(버전 2.0) 및 위스콘신 제네틱스(Wisconsin Genetics)의 소프트웨어 패키지, 버전 8 [미국 위스콘신주 매디슨 사이언스 드라이브 575 소재의 제네틱스 컴퓨터 그룹(Genetics Computer Group, GCG)으로부터 입수 가능]의 GAP, BESTFIT, BLAST, FASTA 및 TFASTA를 들 수 있다. 이들 프로그램을 이용한 얼라이먼트는, 예를 들어, 초기 파라미터를 사용하여 행할 수 있다. CLUSTAL 프로그램에 대해서는, 문헌 [Higgins et al.(1988) Gene 73: 237-244], [Higgins et al.(1989) CABIOS 5: 151-153], [Corpet et al.(1988) Nucleic Acids Res. 16: 10881-90], [Huang et al.(1992) CABIOS 8: 155-65] 및 [Pearson et al.(1994) Meth. Mol. Biol. 24: 307-331]에 잘 기재되어 있다.
목표 염기 서열과 상동성이 있는 염기 서열을 얻기 위해, 구체적으로는, 예를 들어, BLAST 뉴클레오티드 검색을, BLASTN 프로그램 (점수=100, 워드 길이=12)으로 행할 수 있다. 대상의 단백질과 상동성이 있는 아미노산 서열을 얻기 위해, 구체적으로는, 예를 들어, BLAST 단백질 검색을, BLASTX 프로그램 (점수=50, 워드 길이=3)으로 행할 수 있다. BLAST 뉴클레오티드 검색이나 BLAST 단백질 검색에 대해서는, http://www.ncbi.nlm.nih.gov를 참조하기 바란다. 또한, 비교를 목적으로 하여 갭(gap)을 더한 얼라이먼트를 얻기 위해, Gapped BLAST(BLAST 2.0)를 이용할 수 있다. 또한, PSI-BLAST(BLAST 2.0)를, 서열 간의 이격 관계를 검출하는 반복 검색을 행하는 데 이용할 수 있다. Gapped BLAST 및 PSI-BLAST에 대해서는, 문헌 [Altschul et al.(1997) Nucleic Acids Res. 25: 3389]를 참조하기 바란다. BLAST, Gapped BLAST, 또는 PSI-BLAST를 이용하는 경우, 예를 들어, 각 프로그램(예를 들어, 염기 서열에 대하여 BLASTN, 아미노산 서열에 대하여 BLASTX)의 초기 파라미터가 사용될 수 있다. 얼라이먼트는, 수동으로 행해져도 좋다.
2개의 서열 간의 서열 동일성은, 2개의 서열을 최대 일치가 되도록 정렬했을 때에 2개의 서열 사이에서 일치하는 잔기의 비율로서 산출된다. 또한, 아미노산 서열 간의 「동일성」이란, 구체적으로는, 특기하지 않는 한, blastp에 의해 디폴트 설정의 점수 파라미터 [행렬: BLOSUM62; 갭 코스트(Gap Cost): 기존(Existence)=11, 연장(Extension)=1; 조합 조정(Compositional Adjustments): 조건부 조합 점수 행렬 조정(Conditional compositional score matrix adjustment)]을 이용하여 산출되는 아미노산 서열 간의 동일성을 의미해도 좋다. 또한, 염기 서열 간의 「동일성」이란, 구체적으로는, 특기하지 않는 한, blastn에 의해 디폴트 설정의 점수 파라미터 [정합/부정합(Match/Mismatch) 점수=1,-2; 갭 코스트=선형(Linear)]을 이용하여 산출되는 염기 서열 간의 동일성을 의미해도 좋다.
또한, 상기의 유전자나 단백질의 변이체에 관한 기재는, 목적 단백질 등의 임의의 단백질 및 그것들을 코딩하는 유전자에도 준용할 수 있다.
<1-4> 기타 성질
본 발명의 미생물은, 목적 단백질 생산능이 손상되지 않는 한, 기타 원하는 성질(예를 들어, 변형된 특성)을 갖고 있어도 좋다. 변형으로서는, 탈라로마이세스 셀룰롤리티쿠스의 목적 단백질 생산능이 향상되는 변형을 들 수 있다. 변형으로서, 구체적으로는, CreA 단백질의 활성이 저하되는 변형을 들 수 있다. 이러한 성질이나 변형은, 단독으로, 또는 적절히 조합하여 이용할 수 있다.
즉, 본 발명의 미생물은, 예를 들어, CreA 단백질의 활성이 저하되도록 변형되어 있어도 좋다. 본 발명의 미생물은, 구체적으로는, 비변형주에 비해, CreA 단백질의 활성이 저하되도록 변형되어 있어도 좋다. 본 발명의 미생물은, 보다 구체적으로는, 예를 들어, creA 유전자의 발현이 저하되도록 변형되어 있어도 좋고, creA 유전자가 파괴되도록 변형되어 있어도 좋다. creA 유전자는, 이화산물 억제에 관여하는 전사 인자를 코딩하는 유전자이다. creA 유전자는, 사상균에 있어서, 셀룰라아제의 발현에 관여하고 있는 것으로 알려져 있다(문헌 [Mol Gen Genet. 1996 Jun 24; 251(4): 451-60], [Biosci Biotechnol Biochem. 1998 Dec; 62(12): 2364-70]).
탈라로마이세스 셀룰롤리티쿠스 S6-25주의 creA 유전자의 염기 서열을 서열번호 44에 나타낸다. 즉, creA 유전자는, 예를 들어, 서열번호 44에 나타내는 염기 서열을 갖는 유전자라도 좋다. 또한, CreA 단백질은, 예를 들어, 서열번호 44에 나타내는 염기 서열에 의해 코딩되는 아미노산 서열을 갖는 단백질이라도 좋다. creA 유전자 및 CreA 단백질은, 각각, 상기 예시한 creA 유전자 및 CreA 단백질의 보존적 변이체라도 좋다. creA 유전자 및 CreA 단백질의 보존적 변이체에 대해서는, yscB 유전자 및 YscB 단백질의 보존적 변이체에 대한 기재를 준용할 수 있다. 또한, 「원래의 기능이 유지되어 있다」란, CreA 단백질에 있어서는, 단백질의 변이체가, 이화산물 억제에 관여하는 전사 인자로서의 기능을 갖는 것이라도 좋다.
<1-5> 단백질의 활성을 저하시키는 수법
이하에, YscB 단백질이나 CreA 단백질 등의 단백질의 활성을 저하시키는 수법에 대하여 설명한다. 이하에 기술된 단백질의 활성을 저하시키는 방법은 야생형 PhoS 단백질의 파괴에도 이용될 수 있다.
「단백질의 활성이 저하된다」란, 이 단백질의 활성이 비변형주에 비해 저하되는 것을 의미한다. 「단백질의 활성이 저하된다」란, 구체적으로는, 이 단백질의 세포당의 활성이 비변형주에 비해 저하되는 것을 의미한다. 여기서 말하는 「비변형주」란, 표적의 단백질의 활성이 저하되도록 변형되어 있지 않은 대조군주를 의미한다. 비변형주로서는, 야생주나 친주(parent strain)를 들 수 있다. 비변형주로서, 구체적으로는, 탈라로마이세스 셀룰롤리티쿠스의 설명에서 예시한 주를 들 수 있다. 즉, 일 형태에 있어서, 단백질의 활성은, 탈라로마이세스 셀룰롤리티쿠스 S6-25주와 비교하여 저하되어도 좋다. 또한, 「단백질의 활성이 저하되는 것」에는, 이 단백질의 활성이 완전히 소실되어 있는 경우도 포함된다. 「단백질의 활성이 저하된다」란, 보다 구체적으로는, 비변형주에 비해, 이 단백질의 세포당의 분자수가 저하되어 있는 것, 및/또는, 이 단백질의 각 분자의 기능이 저하되어 있는 것을 의미해도 좋다. 즉, 「단백질의 활성이 저하된다」란 경우의 「활성」이란, 단백질의 촉매 활성에 한정되지 않고, 단백질을 코딩하는 유전자의 전사량(mRNA량) 또는 번역량(단백질의 양)를 의미해도 좋다. 또한 「단백질의 세포당의 분자수가 저하되어 있는」 것에는, 이 단백질이 전혀 존재하고 있지 않은 경우도 포함된다. 또한 「단백질의 각 분자의 기능이 저하되어 있는」 것에는, 이 단백질의 각 분자의 기능이 완전히 소실되어 있는 경우도 포함된다. 단백질의 활성의 저하의 정도는, 단백질의 활성이 비변형주에 비해 저하되어 있으면 특별히 제한되지 않는다. 단백질의 활성은, 예를 들어, 비변형주의 50% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 0%로 저하되어도 좋다.
단백질의 활성이 저하되도록 하는 변형은, 예를 들어, 이 단백질을 코딩하는 유전자의 발현을 저하시킴으로써 달성할 수 있다. 「유전자의 발현이 저하된다」란, 이 유전자의 발현이 비변형주에 비해 저하되는 것을 의미한다. 「유전자의 발현이 저하된다」란, 구체적으로는, 이 유전자의 세포당의 발현량이 비변형주에 비해 저하되는 것을 의미한다. 「유전자의 발현이 저하된다」란, 보다 구체적으로는, 유전자의 전사량(mRNA량)이 저하되는 것, 및/또는, 유전자의 번역량(유전자로부터 발현된 단백질의 양)이 저하되는 것을 의미해도 좋다. 「유전자의 발현이 저하되는」 것에는, 이 유전자가 전혀 발현되어 있지 않은 경우가 포함된다. 또한, 「유전자의 발현이 저하되는」 것을, 「유전자의 발현이 약화된다」라고도 한다. 유전자의 발현은, 예를 들어, 비변형주의 50% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 0%로 저하되어도 좋다.
유전자의 발현의 저하는, 예를 들어, 전사 효율의 저하에 의한 것이라도 좋고, 번역 효율의 저하에 의한 것이라도 좋고, 그것들의 조합에 의한 것이라도 좋다. 유전자의 발현의 저하는, 예를 들어, 유전자의 발현 조절 서열을 변형시킴으로써 달성할 수 있다. 「발현 조절 서열」이란, 프로모터 등의 유전자의 발현에 영향을 주는 부위의 총칭이다. 발현 조절 서열은, 예를 들어, 프로모터 검색 벡터나 GENETYX 등의 유전자 해석 소프트웨어를 사용하여 결정할 수 있다. 발현 조절 서열을 변형하는 경우에는, 발현 조절 서열은, 바람직하게는 1염기 이상, 보다 바람직하게는 2염기 이상, 특히 바람직하게는 3염기 이상이 변형된다. 유전자의 전사 효율의 저하는, 예를 들어, 염색체 상의 유전자의 프로모터를 보다 약한 프로모터로 치환함으로써 달성할 수 있다. 「보다 약한 프로모터」란, 유전자의 전사가, 원래 존재하고 있는 야생형의 프로모터보다도 약화되는 프로모터를 의미한다. 보다 약한 프로모터로서는, 예를 들어, 유도형의 프로모터를 들 수 있다. 즉, 유도형의 프로모터는, 비유도 조건 하(예를 들어, 유도 물질의 부재 하)에서 보다 약한 프로모터로서 기능할 수 있다. 또한, 발현 조절 서열의 일부 또는 전부의 영역을 결실(결손)시켜도 좋다. 또한, 유전자의 발현의 저하는, 예를 들어, 발현 조절에 관련된 인자를 조작함으로써도 달성할 수 있다. 발현 조절에 관련된 인자로서는, 전사나 번역 제어에 관련된 저분자(유도 물질, 저해 물질 등), 전사나 번역 제어에 관련된 단백질(전사 인자 등), 전사나 번역 제어에 관련된 핵산(siRNA 등) 등을 들 수 있다. 또한, 유전자의 발현의 저하는, 예를 들어, 유전자의 코딩 영역에 유전자의 발현이 저하되도록 하는 변이를 도입함으로써도 달성할 수 있다. 예를 들어, 유전자의 코딩 영역의 코돈을, 숙주에서 보다 저빈도로 이용되는 동의(同義) 코돈으로 치환함으로써, 유전자의 발현을 저하시킬 수 있다. 또한, 예를 들어, 후술하는 바와 같은 유전자의 파괴에 의해, 유전자의 발현 자체가 저하될 수 있다.
또한, 단백질의 활성이 저하되도록 하는 변형은, 예를 들어, 이 단백질을 코딩하는 유전자를 파괴함으로써 달성할 수 있다. 「유전자가 파괴된다」란, 정상적으로 기능하는 단백질을 생산하지 않도록 이 유전자가 변형되는 것을 의미한다. 「정상적으로 기능하는 단백질을 생산하지 않는」 것에는, 이 유전자로부터 단백질이 전혀 생산되지 않는 경우나, 이 유전자로부터 분자당의 기능(활성이나 특성)이 저하 또는 소실된 단백질이 생산되는 경우가 포함된다.
유전자의 파괴는, 예를 들어, 염색체 상의 유전자를 결실(결손)시킴으로써 달성할 수 있다. 「유전자의 결실」이란, 유전자의 코딩 영역의 일부 또는 전부의 영역의 결실을 말한다. 또한, 염색체 상의 유전자의 코딩 영역의 전후의 서열을 포함하여, 유전자 전체를 결실시켜도 좋다. 유전자의 코딩 영역의 전후의 서열에는, 예를 들어, 유전자의 발현 조절 서열이 포함되어도 좋다. 단백질의 활성의 저하를 달성할 수 있는 한, 결실시키는 영역은, N-말단 영역(단백질의 N-말단측을 코딩하는 영역), 내부 영역, C-말단 영역(단백질의 C-말단측을 코딩하는 영역) 등 중 어느 영역이라도 좋다. 통상, 결실시키는 영역은 긴 쪽이 확실히 유전자를 불활화할 수 있다. 결실시키는 영역은, 예를 들어, 유전자의 코딩 영역 전체 길이의 10% 이상, 20% 이상, 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 또는 95% 이상의 길이의 영역이라도 좋다. 또한, 결실시키는 영역의 전후의 서열은, 리딩 프레임이 일치하지 않는 것이 바람직하다. 리딩 프레임의 불일치에 의해, 결실시키는 영역의 하류에서 프레임 시프트(frame shift)가 발생할 수 있다. creA 유전자의 경우, 구체적으로는, 예를 들어, 서열번호 44의 3262 내지 4509 위치에 해당하는 부분을 결실시킴으로써, 이 유전자를 파괴할 수 있다.
또한, 유전자의 파괴는, 예를 들어, 염색체 상의 유전자의 코딩 영역에 아미노산 치환(미스센스 돌연변이)를 도입하는 것, 종결 코돈(넌센스 돌연변이)를 도입하는 것, 혹은 1 내지 2염기의 부가 또는 결실(프레임 시프트 돌연변이)를 도입하는 것 등에 의해서도 달성할 수 있다(문헌 [Journal of Biological Chemistry 272: 8611-8617(1997)], [Proceedings of the National Academy of Sciences, USA 95 5511-5515(1998)], [Journal of Biological Chemistry 26 116, 20833-20839(1991)]).
또한, 유전자의 파괴는, 예를 들어, 염색체 상의 유전자의 코딩 영역에 다른 염기 서열을 삽입함으로써도 달성할 수 있다. 삽입 부위는 유전자의 어느 영역이라도 좋지만, 삽입하는 염기 서열은 긴 쪽이 확실히 유전자를 불활화할 수 있다. 또한, 삽입 부위의 전후의 서열은, 리딩 프레임이 일치하지 않는 것이 바람직하다. 리딩 프레임의 불일치에 의해, 삽입 부위의 하류에서 프레임 시프트가 생길 수 있다. 다른 염기 서열로서는, 코딩되는 단백질의 활성을 저하 또는 소실시키는 것이면 특별히 제한되지 않지만, 예를 들어, 마커 유전자나 목적 단백질 생산에 유용한 유전자를 들 수 있다.
유전자의 파괴는, 특히, 코딩되는 단백질의 아미노산 서열이 결실(결손)하도록 실시해도 좋다. 바꿔 말하면, 단백질의 활성이 저하되도록 하는 변형은, 예를 들어, 단백질의 아미노산 서열(아미노산 서열의 일부 또는 전부의 영역)을 결실시킴으로써, 구체적으로는, 아미노산 서열(아미노산 서열의 일부 또는 전부의 영역)을 결실한 단백질을 코딩하도록 유전자를 변형시킴으로써 달성할 수 있다. 또한, 「단백질의 아미노산 서열의 결실」이란, 단백질의 아미노산 서열의 일부 또는 전부의 영역의 결실을 말한다. 또한, 「단백질의 아미노산 서열의 결실」이란, 단백질에서 원래의 아미노산 서열이 존재하지 않게 되는 것을 말하며, 원래의 아미노산 서열이 다른 아미노산 서열로 변화하는 경우도 포함된다. 즉, 예를 들어, 프레임 시프트에 의해 다른 아미노산 서열로 변화한 영역은, 결실된 영역으로 간주하여도 좋다. 단백질의 아미노산 서열의 결실에 의해, 전형적으로는 단백질의 전체 길이가 단축되는데, 단백질의 전체 길이가 변화되지 않거나, 또는 연장되는 경우도 있을 수 있다. 예를 들어, 유전자의 코딩 영역의 일부 또는 전부의 영역의 결실에 의해, 코딩되는 단백질의 아미노산 서열에 있어서, 당해 결실된 영역이 코딩하는 영역을 결실시킬 수 있다. 또한, 예를 들어, 유전자의 코딩 영역으로의 종결 코돈의 도입에 의해, 코딩되는 단백질의 아미노산 서열에 있어서, 당해 도입 부위보다 하류의 영역이 코딩하는 영역을 결실시킬 수 있다. 또한, 예를 들어, 유전자의 코딩 영역에서의 프레임 쉬프트에 의해, 코딩되는 단백질의 아미노산 서열에 있어서, 당해 프레임 시프트 부위가 코딩하는 영역을 결실시킬 수 있다. 아미노산 서열의 결실에서의 결실시키는 영역의 위치 및 길이에 대해서는, 유전자의 결실에서의 결실시키는 영역의 위치 및 길이의 설명을 준용할 수 있다.
염색체 상의 유전자를 상기와 같이 변형하는 것은, 예를 들어, 정상적으로 기능하는 단백질을 생산하지 않도록 변형한 파괴형 유전자를 제작하고, 당해 파괴형 유전자를 포함하는 재조합 DNA로 숙주를 형질전환하여, 파괴형 유전자와 염색체 상의 야생형 유전자 간에 상동성 재조합을 일으킴으로써, 염색체 상의 야생형 유전자를 파괴형 유전자로 치환함으로써 달성할 수 있다. 그 때, 재조합 DNA에는, 숙주의 영양요구성 등의 형질에 따라서, 마커 유전자를 포함시켜 두면 조작이 쉽다. 파괴형 유전자로서는, 유전자의 코딩 영역의 일부 또는 전부의 영역을 결실한 유전자, 미스센스 돌연변이를 도입한 유전자, 넌센스 돌연변이를 도입한 유전자, 프레임 시프트 돌연변이를 도입한 유전자 및 트랜스포존(transposon)이나 마커 유전자 등의 삽입 서열을 도입한 유전자를 들 수 있다. 파괴형 유전자에 의해 코딩되는 단백질은, 생성했다고 해도, 야생형 단백질과는 다른 입체 구조를 갖고, 기능이 저하 또는 소실된다.
상동성 재조합에 사용하는 재조합 DNA의 구조는, 원하는 형태로 상동성 재조합이 일어나는 것이라면 특별히 제한되지 않는다. 예를 들어, 임의의 서열을 포함하는 선형 DNA로서, 당해 임의의 서열의 양단에 염색체 상의 치환 대상 부위의 상류 및 하류의 서열을 각각 구비하는 선형 DNA로 숙주를 형질전환하여, 치환 대상 부위의 상류 및 하류에서 각각 상동성 재조합을 일으킴으로써, 1스텝에서 치환 대상 부위를 당해 임의의 서열로 치환할 수 있다. 당해 임의의 서열로서는, 예를 들어, 마커 유전자를 포함하는 서열을 사용할 수 있다.
마커 유전자는, 숙주의 영양요구성 등의 형질에 따라 적절히 선택할 수 있다. 예를 들어, 숙주가 pyrF 유전자 또는 pyrG 유전자의 변이에 의해 우라실 영양요구성을 나타내는 경우, pyrF 유전자 또는 pyrG 유전자를 마커 유전자로서 이용함으로써, 우라실 영양요구성의 상보성 관계(즉, 우라실 자가영양성)을 지표로 하여, 목적한 변형이 도입된 주를 선별할 수 있다. 또한, 예를 들어, sC 유전자(설페이트 퍼미아제 유전자)의 변이에 의해 메티오닌 영양요구성을 나타내는 경우, sC 유전자를 마커 유전자로서 사용함으로써, 메티오닌 영양요구성의 상보성 관계(즉, 메티오닌 자가영양성)를 지표로 하여, 목적한 변형이 도입된 주를 선별할 수 있다. 또한, 마커 유전자로서는, 하이그로마이신 내성 유전자 등의 약제 내성 유전자를 이용할 수도 있다.
또한, 단백질의 활성이 저하되도록 하는 변형은, 예를 들어, 돌연변이 처리에 의해 행하여도 좋다. 돌연변이 처리로서는, X선의 조사, 자외선의 조사 및 N-메틸-N'-니트로-N-니트로소구아니딘(MNNG), 에틸메탄설포네이트(EMS) 및 메틸메탄설포네이트(MMS) 등의 변이제에 의한 처리를 들 수 있다.
단백질의 활성이 저하된 것은, 이 단백질의 활성을 측정함으로써 확인할 수있다. YscB 단백질의 활성은, 예를 들어, 상술한 바와 같이 측정할 수 있다. CreA 단백질의 활성은, 예를 들어, 이화산물 억제의 정도를 측정함으로써 측정할 수 있다. 이화산물 억제의 정도는, 예를 들어, 글루코오스를 탄소원으로서 포함하는 배양 조건에서의 셀룰라아제 생산을 측정함으로써 측정할 수 있다. 즉, CreA 단백질의 활성이 저하된 것은, 구체적으로는, 예를 들어, 글루코오스를 탄소원으로서 포함하는 배양 조건에서의 셀룰라아제 생산의 향상을 지표로서 확인할 수 있다.
단백질의 활성이 저하된 것은, 이 단백질을 코딩하는 유전자의 발현이 저하 된 것을 확인함으로써도 확인할 수 있다. 유전자의 발현이 저하된 것은, 이 유전자의 전사량이 저하된 것을 확인하는 것이나, 이 유전자로부터 발현되는 단백질의 양이 저하된 것을 확인함으로써 확인할 수 있다.
유전자의 전사량이 저하된 것의 확인은, 이 유전자로부터 전사되는 mRNA의 양을 비변형주와 비교함으로써 행할 수 있다. mRNA의 양을 평가하는 방법으로서는, 노던 하이브리드화, RT-PCR 등을 들 수 있다(문헌 [Molecular cloning(Cold Spring Harbor Laboratory Press, Cold Spring Harbor (USA), 2001)]). mRNA의 양(예를 들어, 세포당 mRNA의 분자수)은, 예를 들어, 비변형주의 50% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 0%로 저하되어도 좋다.
단백질의 양이 저하된 것의 확인은, 항체를 이용하여 웨스턴 블로팅에 의해 행할 수 있다(문헌 [Molecular cloning(Cold Spring Harbor Laboratory Press, Cold Spring Harbor(USA), 2001)]). 단백질의 양(예를 들어, 세포당 단백질의 분자수)은, 예를 들어, 비변형주의 50% 이하, 20% 이하, 10% 이하, 5% 이하, 또는 0%로 저하해도 좋다.
유전자가 파괴된 것은, 파괴에 사용한 수단에 따라서, 이 유전자의 일부 또는 전부의 염기 서열, 제한 효소 지도, 또는 전체 길이 등을 측정함으로써 확인할 수 있다.
형질전환은, 예를 들어, 곰팡이나 효모 등의 진핵 미생물의 형질전환에 통상 사용되는 수법에 의해 행할 수 있다. 그러한 수법으로서는, 원형질체 배양법을 들 수 있다.
<2> 본 발명의 방법
본 발명의 미생물을 이용하여, 목적 단백질을 제조할 수 있다. 구체적으로는, 본 발명의 미생물을 배양함으로써, 목적 단백질을 제조할 수 있다. 즉, 본 발명의 방법은, 구체적으로는, 본 발명의 미생물을 배지에서 배양하는 것을 포함하는, 목적 단백질의 제조 방법이라도 좋다.
사용하는 배지는, 본 발명의 미생물을 증식할 수 있고, 목적 단백질이 생산되는 한, 특별히 제한되지 않는다. 배지로서는, 예를 들어, 탄소원, 질소원, 인산원, 유황원, 기타 각종 유기 성분이나 무기 성분으로부터 선택되는 성분을 필요에 따라 함유하는 액체 배양 배지를 사용할 수 있다. 배양 배지 성분의 종류나 농도는, 당업자가 적절히 설정할 수 있다. 구체적인 배지 조성에 대해서는, 예를 들어, 탈라로마이세스 셀룰롤리티쿠스에 관한 기보(旣報)(일본 공개특허공보 (Kokai) 특개2003-135052, 특개2008-271826, 특개2008-271927 등)에 기재된 배지 조성이나, 트리코더마 레세이 등의 기타 각종 셀룰라아제 생산 미생물 배양용 배지 조성을 참조할 수 있다.
탄소원은, 본 발명의 미생물이 자화(資化)하여 목적 단백질을 생성할 수 있는 것이면, 특별히 제한되지 않는다. 탄소원으로서는, 예를 들어, 당류나 셀룰로오스계 기질을 들 수 있다. 당류로서, 구체적으로는, 예를 들어, 글루코오스, 프룩토오스, 갈락토오스, 자일로오스, 아라비노오스, 수크로오스, 락토오스, 셀로비오스, 폐당밀, 전분 가수분해물, 바이오매스 가수분해물을 들 수 있다. 셀룰로오스계 기질로서, 구체적으로는, 예를 들어, 미세결정 셀룰로오스(아비셀), 여과지, 폐지, 펄프, 목재, 볏짚, 밀짚, 왕겨, 쌀겨, 밀기울, 사탕수수 찌꺼기, 커피 찌꺼기, 차 찌꺼기를 들 수 있다. 셀룰로오스계 기질은, 수열 분해 처리, 산 처리, 알칼리 처리, 스티밍(steaming), 블라스팅(blasting), 분쇄 등의 전처리를 가한 후 탄소원으로서 이용해도 좋다. 시판되는 적절한 셀룰로오스계 기질로서는, 솔카 플록(Solka-floc)[미국 뉴욕주 노스 토나와다 소재의 인터내셔널 화이버 그룹(International Fiber Corp)]을 들 수 있다. 탄소원으로서는, 1종의 탄소원을 이용해도 좋고, 2종 이상의 탄소원을 조합하여 사용해도 좋다.
질소원으로서, 구체적으로는, 예를 들어, 황산암모늄, 염화암모늄, 인산암모늄 등의 암모늄염; 펩톤, 효모 엑기스, 고기 엑기스, 옥수수 침지액(corn steep liquor), 대두 단백질 분해물 등의 유기 질소원; 암모니아, 우레아를 들 수 있다. 질소원으로서는, 1종의 질소원을 사용해도 좋고, 2종 이상의 질소원을 조합하여 사용해도 좋다.
인산원으로서, 구체적으로는, 예를 들어, 인산 2수소칼륨, 인산 수소 2칼륨 등의 인산염; 피로인산 등의 인산 폴리머를 들 수 있다. 인산원으로서는, 1종의 인산원을 사용해도 좋고, 2종 이상의 인산원을 조합하여 사용해도 좋다.
유황원으로서, 구체적으로는, 예를 들어, 황산염, 티오황산염, 아황산염 등의 무기 유황 화합물; 시스테인, 시스틴, 글루타치온 등의 황함유 아미노산을 들 수 있다. 유황원으로서는, 1종의 유황원을 사용해도 좋고, 2종 이상의 유황원을 조합하여 사용해도 좋다.
기타 각종 유기 성분이나 무기 성분으로서, 구체적으로는, 예를 들어, 염화나트륨, 염화칼륨 등의 무기염류; 철, 망간, 마그네슘, 칼슘 등의 미량 금속류; 비타민 B1, 비타민 B2, 비타민 B6, 니코틴산, 니코틴산 아미드, 비타민 B12 등의 비타민류; 아미노산류; 핵산류; 이것들을 함유하는 펩톤, 카자미노산, 효모 엑기스, 대두 단백질 분해물 등의 유기 성분을 들 수 있다. 그밖의 각종 유기 성분이나 무기 성분으로서는, 1종의 성분을 사용해도 좋고, 2종 이상의 성분을 조합하여 사용해도 좋다.
배양 조건은, 본 발명의 미생물이 증식될 수 있고, 목적 단백질이 생산되는 한, 특별히 제한되지 않는다. 배양은, 예를 들어, 사상균 등의 미생물의 배양에 사용되는 통상의 조건으로 행할 수 있다. 구체적인 배양 조건에 대해서는, 예를 들어, 탈라로마이세스 셀룰롤리티쿠스에 관한 기보(일본 공개특허공보 (Kokai) 특개2003-135052, 특개2008-271826, 특개2008-271927 등)에 기재된 배양 조건이나, 트리코더마 레세이 등의 기타 각종 셀룰라아제 생산 미생물 배양에 사용되는 배양 조건을 참조할 수 있다.
배양은, 예를 들어, 액체 배지를 사용하여, 호기 조건으로 행할 수 있다. 호기 조건에서의 배양은, 구체적으로는, 통기 배양, 진탕 배양, 교반 배양, 또는 그것들의 조합으로 행할 수 있다. 배양 온도는, 예를 들어 15 내지 43℃라도 좋고, 특히 약 30℃라도 좋다. 배양 기간은, 예를 들어, 2시간 내지 20일이라도 좋다. 배양은, 회분식 배양, 유가식 배양, 연속식 배양, 또는 그것들의 조합에 의해 실시할 수 있다. 또한, 배양 개시시의 배지를 「초발 배지」라고도 한다. 또한, 유가 배양 또는 연속 배양에서 배양계(발효조)에 공급하는 배지를 「유가 배지」라고도 한다. 또한, 유가 배양 또는 연속 배양에서 배양계에 유가 배지를 공급하는 것을, 「유가」라고도 한다. 또한, 배양은, 전 배양과 본 배양으로 나누어 실시해도 좋다. 예를 들어, 전 배양을 아가 배지 등의 고체 배지 위에서 행하고, 본 배양을 액체 배지에서 행하여도 좋다. 배양은, 예를 들어, 배지 중의 탄소원이 소비될 때까지, 또는 본 발명의 미생물의 활성이 없어질 때까지 계속해도 좋다.
본 발명에 있어서, 각 배지 성분은, 초발 배지, 유가 배지, 또는 그 양쪽에 함유되어 있어도 좋다. 초발 배지에 함유되는 성분의 종류는, 유가 배지에 함유되는 성분의 종류와 동일해도 좋고, 그렇지 않아도 좋다. 또한, 초발 배지에 함유 되는 각 성분의 농도는, 유가 배지에 함유되는 각 성분의 농도와 동일해도 좋고, 그렇지 않아도 좋다. 또한, 함유하는 성분의 종류 및/또는 농도가 다른 2종 이상의 유가 배지를 사용해도 좋다. 예를 들어, 2회 이상의 유가가 간헐적으로 행해지는 경우, 각 회의 유가 배지에 함유되는 성분의 종류 및/또는 농도는, 동일해도 좋고, 그렇지 않아도 좋다.
각종 성분의 농도는, 가스 크로마토그래피(Hashimoto, K. et al. 1996. Biosci. Biotechnol. Biochem. 70: 22-30)나 HPLC(Lin, JT et al. 1998. J. Chromatogr: A. 808: 43-49)에 의해 측정할 수 있다.
상기와 같이 하여 본 발명의 미생물을 배양함으로써, 목적 단백질이 발현되어, 목적 단백질을 포함하는 배양물을 얻을 수 있다. 목적 단백질은, 구체적으로는, 배지 중, 세포 표층, 균체 내, 또는 그것들의 조합 중에 축적해도 좋다. 목적 단백질은, 특히, 배지 중에 축적해도 좋다.
목적 단백질이 생산된 것은, 단백질의 검출 또는 동정에 사용되는 공지의 방법에 의해 확인할 수 있다. 그러한 방법으로서는, 예를 들어, SDS-PAGE, 웨스턴 블로팅, 질량분광법, N-말단 아미노산 서열 분석법, 효소 활성 측정법을 들 수 있다. 이들 방법은, 1종을 단독으로 사용해도 좋고, 2종 이상을 적절히 조합하여 사용해도 좋다.
생성된 목적 단백질은, 적절하게 회수할 수 있다. 즉, 본 발명의 목적 단백질의 제조 방법은, 생성된 목적 단백질을 회수하는 것을 포함하고 있어도 좋다. 구체적으로는, 목적 단백질은, 목적 단백질을 포함하는 적당한 분획으로서 회수할 수 있다. 그러한 분획으로서는, 예를 들어, 배양물, 배양 상청액, 균체, 균체 처리물[파쇄물, 용해물, 추출물(무세포 추출액]을 들 수 있다. 균체는, 예를 들어, 아크릴아미드나 카라기난 등의 담체에서 고정화시킨 고정화 세포의 형태로 제공되어도 좋다.
또한, 목적 단백질은, 원하는 정도로 분리 정제되어도 좋다. 목적 단백질은, 유리 효소의 상태로 제공되어도 좋고, 수지 등의 고상으로 고정화된 고정화 효소의 상태로 제공되어도 좋다.
배양 배지 중에 목적 단백질이 축적되는 경우, 목적 단백질은, 예를 들어, 균체 등의 고형분을 원심분리 등에 의해 배양물로부터 제거한 후, 배양 상청액으로부터 분리 정제할 수 있다.
균체 내에 목적 단백질이 축적되는 경우, 목적 단백질은, 예를 들어, 균체를 파쇄, 용해, 또는 추출 등의 처리를 가한 후, 처리물로부터 분리 정제할 수 있다. 균체는, 원심분리 등에 의해 배양물로부터 회수할 수 있다. 세포의 파쇄, 용해, 또는 추출 등의 처리는, 공지의 방법에 의해 행할 수 있다. 그러한 방법으로서는, 예를 들어, 초음파 파쇄법, 다이노밀(Dyno-Mill) 파쇄법, 비즈 파쇄법, 프렌치 프레스 파쇄법, 라이소자임 처리법을 들 수 있다. 이들 방법은, 1종을 단독으로 사용해도 좋고, 2종 이상을 적절히 조합하여 사용해도 좋다.
세포 표층에 목적 단백질이 축적되는 경우, 목적 단백질은, 예를 들어, 가용화한 후, 가용화물로부터 분리 정제할 수 있다. 가용화는, 공지의 방법에 의해 행할 수 있다. 그러한 방법으로서는, 예를 들어, 염농도의 상승이나 계면 활성제의 사용을 들 수 있다. 이들 방법은, 1종을 단독으로 사용해도 좋고, 2종 이상을 적절히 조합하여 사용해도 좋다.
목적 단백질의 정제(예를 들어, 상기와 같은 상청액, 처리물, 또는 가용화물로부터의 정제)는, 단백질의 정제에 사용되는 공지의 방법에 의해 행할 수 있다. 그러한 방법으로서는, 예를 들어, 황산암모늄 분획화, 이온 교환 크로마토그래피, 소수 크로마토그래피, 친화성 크로마토그래피, 겔 여과 크로마토그래피, 등전점 침전법을 들 수 있다. 이들 방법은, 1종을 단독으로 사용해도 좋고, 2종 이상을 적절히 조합하여 사용해도 좋다.
또한, 배양물에는, 목적 단백질과 함께, 다른 효소, 예를 들어, 셀룰라아제, 및 자일라나아제, 자일로비아제(β-자일로시다아제), 아라비노퓨라노시다아제 등의 헤미셀룰라아제도 생성 축적될 수 있다. 목적 단백질은, 그러한 다른 효소와의 혼합물로서 회수되어도 좋고, 그러한 다른 효소와 분리하여 회수되어도 좋다.
회수한 목적 단백질은, 적절하게, 제제화해도 좋다. 제제의 제형은 특별히 제한되지 않고, 목적 단백질의 사용 용도 등의 제반 조건에 따라 적절하게 설정할 수 있다. 제형으로서는, 예를 들어, 액제, 현탁제, 산제, 정제, 환제, 캡슐을 들 수 있다. 제제화에 있어서는, 예를 들어, 부형제, 결합제, 붕해제, 활택제, 안정화제, 교미제(corrigent), 방취제, 향료, 희석제, 계면 활성제 등의 약리학적으로 허용되는 첨가제를 사용할 수 있다.
실시예
이하, 비한정적인 실시예에 의해 본 발명을 더욱 구체적으로 설명한다.
(1) 탈라로마이세스 셀룰롤리티쿠스yscB 유전자 결손주 F09ΔyscB의 구축
탈라로마이세스 셀룰롤리티쿠스 F09주(일본 공개특허공보 (Kokai) 특개2016-131533호)를 친주로 하여, 이하의 수순에 의해 yscB 유전자(서열번호 32)를 파괴하고, T. 셀룰롤리티쿠스 F09ΔyscB주를 구축하였다. F09주는, T. 셀룰롤리티쿠스 S6-25주(NITE BP-01685)를 친주로 하여 얻어진 pyrF 유전자에 변이(1 염기 치환)를 갖는 주이다. F09주는, pyrF 유전자의 변이에 의해, 우라실 영양요구성을 나타낸다.
먼저, T. 셀룰롤리티쿠스yscB 유전자 상류 영역, 하이그로마이신 내성 유전자, T. 셀룰롤리티쿠스yscB 유전자 하류 영역의 순으로 연결된 염기 서열을 갖는 yscB 유전자 파괴용 DNA 단편을 이하의 수순에 따라 제조하였다.
T. 셀룰롤리티쿠스 Y-94주(FERM BP-5826)의 게놈 DNA를 주형으로 하여, 프라이머(서열번호 1과 2)를 사용한 PCR에 의해 yscB 유전자의 상류 영역을, 프라이머(서열번호 3과 4)를 사용한 PCR에 의해 yscB 유전자의 하류 영역을, 각각 증폭하였다. 또한, 하이그로마이신 내성 유전자가 탑재된 pcDNA3.1/Hygro(+)(라이프 테크놀로지스)를 주형으로 하여, 프라이머(서열번호 5와 6)를 이용한 PCR에 의해, 하이그로마이신 내성 유전자(프로모터와 터미네이터를 포함)를 증폭하였다. PCR 산물은 위자드 SV 겔 및 PCR 클린업 시스템(Wizard SV Gel and PCR Clean-Up System, 프로메가)을 이용하여 정제하였다. 정제한 PCR 산물을 인-퓨전 HD 클로닝 키트(In-Fusion HD Cloning Kit, 다카라 바이오)에 의해 키트 부속의 pUC 플라스미드에 포함시켜 연결하였다. 반응물로 이.콜라이(E. coli) JM109를 형질전환하고, LB 아가 배지(100 mg/L 암피실린을 포함함)에서 37℃로 하룻밤 배양함으로써 콜로니를 형성시켰다. 얻어진 형질전환체로부터 위자드 플러스 미니프렙 시스템(Wizard Plus Miniprep System, 프로메가)을 이용하여 yscB 유전자 파괴용 DNA 단편이 포함된 pUC-yscB::hyg 플라스미드를 얻었다. pUC-yscB::hyg 플라스미드를 주형으로 하여, 프라이머(서열번호 1과 4)를 사용한 PCR에 의해 yscB 유전자 파괴용 DNA 단편을 증폭하고, 에탄올 침전에 의해 농축 및 정제하였다.
다음으로, F09주를 12 g/L 감자 덱스트로스 배양액(Potato Dextrose Broth, 디프코), 20 g/L 박토 아가(Bacto Agar, 디프코)를 포함하는 배지에 접종하여, 30℃에서 배양을 행하였다. 아가 배지 위에 형성시킨 콜로니의 가장자리 부근을 잘라내어 얻은 아가 디스크(agar disk) 1개를, 24 g/L 감자 덱스트로스 배양액을 포함하는 배지에 접종하여, 30℃, 220 rpm으로 2일간 회전 배양하였다. 균체를 원심분리(5000 rpm, 5분간)로 회수하여, 10 g/L 야탈라아제(Yatalase, 다카라 바이오), 10 mM KH2PO4, 0.8M NaCl을 포함하는 수용액(pH 6.0)을 30 mL 첨가하여, 진탕하면서 30℃에서 2시간 반응시켜, 세포벽을 소화시켜 원형질체를 제조했다. 유리 필터로 잔사를 제거한 후, 원심분리(2000 rpm, 10분간)로 원형질체를 회수하고, 1.2M 소르비톨, 10 mM CaCl2를 포함하는 Tris-HCl 완충액(pH 7.5)으로 1 mL에 현탁하여 원형질체 용액을 제조하였다. 원형질체 용액 중 200μL의 분취액에, 정제한 yscB 파괴용 DNA 단편을 10 ㎍과, 400 g/L PEG4000, 10 mM CaCl2를 포함하는 Tris-HCl 완충액(pH 7.5)을 50μL 첨가하고, 빙상에서 30분간 방치하였다. 그 후, 추가로 1 mL의 400 g/L PEG4000, 10 mM CaCl2를 포함하는 Tris-HCl 완충액(pH 7.5)을 첨가하여 혼합하고, 실온에서 15분간 방치하여 형질전환을 행하였다. 원심분리(2000 rpm, 10분간)로 회수한 원형질체를 1M 수크로스, 1 g/L 우라실, 1 g/L 우리딘을 포함하는 최소 배지(10 g/L 글루코스, 10 mM NH4Cl, 10 mM KH2PO4, 7 mM KCl, 2 mM MgSO4, 0.06 mg/L H3BO3, 0.26 mg/L (NH4)6Mo7O24·4H2O, 1 mg/L FeCl3·6H2O, 0.4 mg/L CuSO4·5H2O, 0.08 mg/L MnCl2, 2 mg/L ZnCl2, 20 g/L 박토 아가)에 접종하여, 30℃에서 1일간 배양한 후, 0.5 g/L 하이그로마이신 B, 24 g/L 감자 덱스트로스 배양액, 7 g/L 박토 아가를 포함하는 배지를 중층하고, 30℃에서 3일간 더 배양함으로써 하이그로마이신 내성주를 선별하였다. 출현한 콜로니를 0.5 g/L 하이그로마이신 B를 포함하는 최소 배지에 접종하여, 30℃에서 4일간 배양한 후, yscB 유전자가 하이그로마이신 내성 유전자로 치환되어 있는 것을 확인하고, F09 유래 yscB 유전자 파괴주인 F09ΔyscB주를 얻었다.
(2) 인간 혈청 알부민(HSA) 발현주의 구축과 배양 평가
T. 셀룰롤리티쿠스 F09주 및 F09ΔyscB주를 친주로 하여, 이하의 수순에 따라 인간 혈청 알부민(HSA) 발현주를 구축하였다.
먼저, T. 셀룰롤리티쿠스creA 유전자 상류 영역, T. 셀룰롤리티쿠스cbh2 유전자 상류 영역(cbh2 프로모터; 서열번호 33), T. 셀룰롤리티쿠스의 cbh1 분비 신호 코딩 서열(서열번호 34), HSA 유전자(서열번호 35), T. 셀룰롤리티쿠스의 cbh2 유전자 하류 영역(cbh2 터미네이터; 서열번호 36), T. 셀룰롤리티쿠스pyrF 유전자 마커(서열번호 37) 및 T. 셀룰롤리티쿠스creA 유전자 하류 영역의 순으로 연결된 염기 서열을 갖는 HSA 발현용 DNA 단편을 이하의 수순에 따라서 제조하였다.
T. 셀룰롤리티쿠스 Y-94주(FERM BP-5826)의 게놈 DNA를 주형으로 하여, 프라이머(서열번호 7과 8)를 이용한 PCR에 의해 creA 유전자의 상류 영역을, 프라이머(서열번호 9와 10)을 이용한 PCR에 의해 cbh2 유전자의 상류 영역을, 프라이머(서열번호 11과 12)를 이용한 PCR에 의해 cbh1 분비 신호 코딩 서열을, 프라이머(서열번호 13과 14)를 이용한 PCR에 의해 cbh2 유전자의 하류 영역을, 프라이머(서열번호 15와 16)를 이용한 PCR에 의해 pyrF 유전자 마커를, 프라이머(서열번호 17과 18)를 이용한 PCR에 의해 creA 유전자 하류 영역을, 각각 증폭하였다. 또한, 유로 핀(Eurofin)으로부터 구입한 전합성 유전자를 주형으로 하여, 프라이머(서열번호 19와 20)를 이용한 PCR에 의해 HSA 유전자를 증폭하였다. PCR 산물은 위자드 SV 겔 및 PCR 클린업 시스템(프로메가)을 이용하여 정제하였다. 정제한 PCR 산물을 2종류씩 혼합한 것을 주형으로 하여 PCR을 행하여 상호 연결하는 것을 반복한 후, 인-퓨전 HD 클로닝 키트(다카라 바이오)에 의해 키트 부속의 pUC 플라스미드에 포함시켰다. 반응물로 이.콜라이 JM109를 형질전환하여, LB 아가 배지(100 mg/L 암피실린을 포함함)에서 37℃로 하룻밤 배양함으로써 콜로니를 형성시켰다. 얻어진 형질전환체로부터 위자드 플러스 미니프렙 시스템(프로메가)을 이용하여 HSA 발현용 DNA 단편이 포함된 pUC-creA::Pcbh2-HSA-pyrF 플라스미드를 얻었다. pUC-creA::Pcbh2-HSA-pyrF 플라스미드를 주형으로 하여, 프라이머(서열번호 7과 18)를 이용한 PCR에 의해 HSA 발현용 DNA 단편을 증폭하고, 에탄올 침전에 의해 농축 및 정제하였다. 또한, HSA 발현 서열의 양단에 creA 유전자의 상류 및 하류 서열을 연결함으로써, 게놈 상의 랜덤한 위치가 아닌 creA 유전자 영역을 표적으로 삼는 HSA 발현 서열을 삽입하는 것이 가능하게 되었다.
다음으로, F09주 및 F09ΔyscB주를 각각 실시예 (1)과 동일한 수법으로 배양하여 원형질체화하여, 정제한 HSA 발현용 DNA 단편으로 실시예 (1)과 동일하게 형질전환을 행하였다. 원심분리(2000 rpm, 10분간)로 회수한 원형질체를 1M 수크로스를 포함하는 최소 배지에 접종하고, 30℃에서 7일간 배양함으로써 우라실 영양요구성이 보충된 주를 선별하였다. 출현한 콜로니를 최소 배지에 접종하여 30℃에서 4일간 배양한 후, creA 유전자 영역이 HSA 발현 서열로 치환되어 있는 것을 확인하고, F09주 및 F09ΔyscB주 유래 HSA 발현주를 얻었다.
F09주 및 F09ΔyscB주 유래 HSA 발현주를, 12 g/L 감자 덱스트로스 배양액 (디프코), 20 g/L 박토 아가(디프코)를 포함하는 배지에 접종하여, 30℃에서 배양을 행하였다. 아가 배지 위에 형성시킨 콜로니의 가장자리 부근을 잘라내어 얻은 아가 디스크 1개를 50 g/L 솔카 플록, 24 g/L KH2PO4, 5 g/L (NH4)2SO4, 3 g/L 우레아, 1 g/L Tween80, 1.2 g/L MgSO4·7H2O, 0.01 g/L ZnSO4·7H2O, 0.01 g/L MnSO4·5H2O 및 0.01 g/L CuSO4·5H2O를 포함하는 20 mL의 액체 배지에 접종하고, 30℃, 220 rpm으로 7일간 배양을 행하였다. 얻어진 배양액을 0.22 ㎛의 필터에 통과시켜, 배양 상청액을 얻었다.
HSA의 분비 생산을 확인하기 위해, 얻어진 배양 상청액을 SDS-PAGE에 제공 한 후, 항HSA 항체(SIGMA, A6684)에 의한 웨스턴 블로팅을 행하였다. 결과를 도 1에 나타낸다. F09주에서는, HSA의 밴드를 확인할 수 있지만 매우 얇고, 또한 분해물로 보이는 밴드가 저분자량측에 확인되었다. 이와는 반대로, F09ΔyscB주에서는, 진하게 HSA의 밴드를 확인할 수 있고, 저분자량측에 밴드는 거의 확인되지 않았다. 이러한 결과로부터, F09주에서는 HSA가 분해되었던 반면, F09ΔyscB주에서는 HSA의 분해가 억제됨으로써 HSA의 분비 생산량이 증가되어 있었음을 알 수 있었다. 이에 따라, 인간 알부민 ELISA 정량 키트[Human Albumin ELISA Quantitation Kit, 베틸 래버러토리즈 인코포레이티드(Bethyl Laboratories, Inc.)]을 이용한 ELISA에 의한 HSA의 정량을 행하였다. 결과를 표 1에 나타낸다. F09주와 비교하여 F09ΔyscB주에서는 HSA 분비 생산량이 증가되어 있는 것이 확인되었으므로, yscB 유전자 결손에 의해 HSA의 분비 생산량이 향상되는 것으로 나타났다.
Figure pct00001
(3) 트라스투주맙 발현주의 구축과 배양 평가
T. 셀룰롤리티쿠스 F09주 및 F09ΔyscB주를 친주로 하여, 이하의 수순에 의해 트라스투주맙 발현주를 구축하였다.
먼저, T. 셀룰롤리티쿠스creA 유전자 상류 영역, T. 셀룰롤리티쿠스cbh2 유전자 상류 영역(cbh2 프로모터; 서열번호 33), T. 셀룰롤리티쿠스의 cbh1 분비 신호 코딩 서열(서열번호 34), 트라스투주맙 중쇄 유전자(서열번호 38), T. 셀룰롤리티쿠스cbh1 유전자 하류 영역(cbh1 터미네이터; 서열번호 39), T. 셀룰롤리티쿠스pyrF 유전자 마커(서열번호 37), T. 셀룰롤리티쿠스cbh2 유전자 상류 영역(cbh2 프로모터; 서열번호 33), T. 셀룰롤리티쿠스의 cbh1 분비 신호 코딩 서열(서열번호 34), 트라스투주맙 경쇄 유전자(서열번호 40), T. 셀룰롤리티쿠스cbh2 유전자 하류 영역(cbh2 터미네이터; 서열번호 36) 및 T. 셀룰롤리티쿠스creA 유전자 하류 영역의 순으로 연결된 염기 서열을 갖는 트라스투주맙 발현용 DNA 단편을 이하의 수순에 따라서 제조하였다.
T. 셀룰롤리티쿠스 Y-94주(FERM BP-5826)의 게놈 DNA를 주형으로 하여, 프라이머(서열번호 7과 8)를 이용한 PCR에 의해 creA 유전자의 상류 영역을, 프라이머(서열번호 9와 10)를 이용한 PCR에 의해 cbh2 유전자의 상류 영역을, 프라이머(서열번호 11과 21)를 이용한 PCR에 의해 cbh1 분비 신호 코딩 서열을, 프라이머(서열번호 22와 23)를 이용한 PCR에 의해 cbh1 유전자의 하류 영역을, 프라이머(서열번호 24와 16)를 이용한 PCR에 의해 pyrF 유전자 마커를, 프라이머(서열번호 25와 10)를 이용한 PCR에 의해 cbh2 유전자의 상류 영역을, 프라이머(서열번호 11과 26)를 이용한 PCR에 의해 cbh1 분비 신호 코딩 서열을, 프라이머(서열번호 13과 14)를 이용한 PCR에 의해 cbh2 유전자의 하류 영역을, 프라이머(서열번호 27과 18)를 이용한 PCR에 의해 creA 유전자 하류 영역을 각각 증폭하였다. 또한, 유로핀으로부터 구입한 전합성 유전자를 주형으로 하여, 프라이머(서열번호 28과 29)를 이용한 PCR에 의해 트라스투주맙 중쇄 유전자를, 프라이머(서열번호 30과 31)를 이용한 PCR에 의해 트라스투주맙 경쇄 유전자를 각각 증폭하였다. PCR 산물은 위자드 SV 겔 및 PCR 클린업 시스템(프로메가)을 이용하여 정제하였다. 정제한 PCR 산물을 2종류씩 혼합한 것을 주형으로 하여 PCR을 행하여 상호 연결하는 것을 반복한 후, 인-퓨전 HD 클로닝 키트(다카라 바이오)에 의해 키트 부속의 pUC 플라스미드에 포함시켰다. 반응물로 이.콜라이 JM109를 형질전환하여, LB 아가 배지(100 mg/L 암피실린을 포함함)에서 37℃로 하룻밤 배양함으로써 콜로니를 형성시켰다. 얻어진 형질전환체로부터 위자드 플러스 미니프렙 시스템(프로메가)을 이용하여 트라스투주맙 발현용 DNA 단편이 포함된 pUC-creA::Pcbh2-Her_H-pyrF-Pcbh2-Her_L 플라스미드를 얻었다. pUC-creA::Pcbh2-Her_H-pyrF-Pcbh2-Her_L 플라스미드를 주형으로 하여, 프라이머(서열번호 7과 18)를 이용한 PCR에 의해 트라스투주맙 발현용 DNA 단편을 증폭하고, 에탄올 침전에 의해 농축 및 정제하였다. 또한, 트라스투주맙 발현 서열의 양단에 creA 유전자의 상류 및 하류 서열을 연결함으로써, 게놈 상의 랜덤한 위치가 아닌 creA 유전자 영역을 표적으로 삼는 트라스투주맙 발현 서열을 삽입하는 것이 가능하게 되었다.
다음으로, F09주 및 F09ΔyscB주를 각각 실시예 (1)과 동일한 수법으로 배양하여 원형질체화하여, 정제한 트라스투주맙 발현용 DNA 단편으로 실시예 (1)과 동일한 수법으로 형질전환을 행하였다. 원심분리(2000 rpm, 10분간)로 회수한 원형질체를 1M 수크로스를 포함하는 최소 배지에 접종하고, 30℃에서 7일간 배양함으로써 우라실 영양요구성이 보충된 주를 선별하였다. 출현한 콜로니를 최소 배지에 접종하여 30℃에서 4일간 배양한 후, creA 유전자 영역이 트라스투주맙 발현 서열로 치환되어 있는 것을 확인하고, F09주 및 F09ΔyscB주 유래 트라스투주맙 발현주를 얻었다.
F09주 및 F09ΔyscB주 유래 트라스투주맙 발현주를 12 g/L 감자 덱스트로스 배양액(디프코), 20 g/L 박토 아가(디프코)를 포함하는 배지에 접종하여, 30℃에서 배양을 행하였다. 아가 배지 위에 형성시킨 콜로니의 가장자리 부근을 잘라내어 얻은 아가 디스크 1개를 50 g/L 솔카 플록, 24 g/L KH2PO4, 5 g/L (NH4)2SO4, 3 g/L 우레아, 1 g/L Tween80, 1.2 g/L MgSO4·7H2O, 0.01 g/L ZnSO4·7H2O, 0.01 g/L MnSO4·5H2O 및 0.01 g/L CuSO4·5H2O를 포함하는 20 mL의 액체 배지에 접종하고, 30℃, 220 rpm으로 7일간 배양을 행하였다. 얻어진 배양액을 0.22 ㎛의 필터에 통과시켜, 배양 상청액을 얻었다.
트라스투주맙의 분비 생산을 확인하기 위해, 얻어진 배양 상청액을 프로테우스 단백질 A 항체 정제 미디 키트[Proteus Protein A Antibody Purification Midi Kit(BIO-RAD)]을 이용하여 단백질 A에 의한 항체 정제에 제공하였다. 동량의 배양 상청액으로부터 얻어진 용출액을 SDS-PAGE에 제공하였다. 결과를 도 2에 나타낸다. 동시에 전기영동한 트라스투주맙 표준품(중외 제약)의 연속 희석액을 대조군으로 하여 영상 분석으로 샘플 중의 트라스투주맙 농도를 계산하였다. 경쇄의 밴드의 결과를 표 2에 나타낸다. 중쇄의 밴드에 대해서도 표 2와 동일한 경향이 확인되었다. F09주와 비교하여 F09ΔyscB주에서는 트라스투주맙 분비 생산량이 증가하고 있는 것이 확인되었으므로, yscB 유전자 결손에 의해 트라스투주맙의 분비 생산량이 향상되는 것으로 나타났다.
Figure pct00002
(4) 니볼루맙 발현주의 구축과 배양 평가
T. 셀룰롤리티쿠스 F09주 및 F09ΔyscB주를 친주로 하여, 이하의 수순에 의해 니볼루맙 발현주를 구축하였다.
먼저, T. 셀룰롤리티쿠스creA 유전자 상류 영역, T. 셀룰롤리티쿠스cbh2 유전자 상류 영역(cbh2 프로모터; 서열번호 33), T. 셀룰롤리티쿠스의 cbh1 분비 신호 코딩 서열(서열번호 34), 니볼루맙 중쇄 유전자(서열번호 45), T. 셀룰롤리티쿠스cbh1 유전자 하류 영역(cbh1 터미네이터; 서열번호 39), T. 셀룰롤리티쿠스pyrF 유전자 마커(서열번호 37), T. 셀룰롤리티쿠스cbh2 유전자 상류 영역(cbh2 프로모터; 서열번호 33), T. 셀룰롤리티쿠스의 cbh1 분비 신호 코딩 서열(서열번호 34), 니볼루맙 경쇄 유전자(서열번호 46), T. 셀룰롤리티쿠스cbh2 유전자 하류 영역(cbh2 터미네이터; 서열번호 36) 및 T. 셀룰롤리티쿠스creA 유전자 하류 영역의 순으로 연결된 염기 서열을 갖는 니볼루맙 발현용 DNA 단편을 이하의 수순에 따라 제조하였다.
T. 셀룰롤리티쿠스 Y-94주(FERM BP-5826)의 게놈 DNA를 주형으로 하여, 프라이머(서열번호 7과 8)를 이용한 PCR에 의해 creA 유전자의 상류 영역을, 프라이머(서열번호 9와 10)를 이용한 PCR에 의해 cbh2 유전자의 상류 영역을, 프라이머(서열번호 11과 21)를 이용한 PCR에 의해 cbh1 분비 신호 코딩 서열을, 프라이머(서열번호 22와 23)를 이용한 PCR에 의해 cbh1 유전자의 하류 영역을, 프라이머(서열번호 24와 16)를 이용한 PCR에 의해 pyrF 유전자 마커를, 프라이머(서열번호 25와 10)를 이용한 PCR에 의해 cbh2 유전자의 상류 영역을, 프라이머(서열번호 11과 26)를 이용한 PCR에 의해 cbh1 분비 신호 코딩 서열을, 프라이머(서열번호 13과 14)를 이용한 PCR에 의해 cbh2 유전자의 하류 영역을, 프라이머(서열번호 27과 18)를 이용한 PCR에 의해 creA 유전자 하류 영역을, 각각 증폭하였다. 또한, 유로핀으로부터 구입한 전합성 유전자를 주형으로 하여, 프라이머(서열번호 47과 48)를 이용한 PCR에 의해 니볼루맙 중쇄 유전자를, 프라이머(서열번호 49와 50)를 이용한 PCR에 의해 니볼루맙 경쇄 유전자를, 각각 증폭하였다. PCR 산물은 위자드 SV 겔 및 PCR 클린업 시스템(프로메가)을 이용하여 정제하였다. 정제한 PCR 산물을 2종류씩 혼합한 것을 주형으로 하여 PCR을 행하여 상호 연결하는 것을 반복한 후, 인-퓨전 HD 클로닝 키트(다카라 바이오)에 의해 키트 부속의 pUC 플라스미드에 포함시켰다. 반응물로 이.콜라이 JM109를 형질전환하여, LB 아가 배지(100 mg/L 암피실린을 포함함)에서 37℃로 하룻밤 배양함으로써 콜로니를 형성시켰다. 얻어진 형질전환체로부타 위자드 플러스 미니프렙 시스템(프로메가)을 이용하여 니볼루맙 발현용 DNA 단편이 포함된 pUC-creA::Pcbh2-Opd_H-pyrF-Pcbh2-Opd_L 플라스미드를 얻었다. pUC-creA::Pcbh2-Opd_H-pyrF-Pcbh2-Opd_L 플라스미드를 주형으로 하여, 프라이머(서열번호 7과 18)를 이용한 PCR에 의해 니볼루맙 발현용 DNA 단편을 증폭하고, 에탄올 침전에 의해 농축 및 정제하였다. 또한, 니볼루맙 발현 서열의 양단에 creA 유전자의 상류 및 하류 서열을 연결함으로써, 게놈 상의 임의의 위치가 아닌 creA 유전자 영역을 표적으로 삼는 니볼루맙 발현 서열을 삽입하는 것이 가능하게 되었다.
다음으로, F09주 및 F09ΔyscB주를 각각 실시예 (1)과 동일한 수법으로 배양하여 원형질체화하고, 정제한 니볼루맙 발현용 DNA 단편으로 실시예 (1)과 동일하게 형질전환을 행하였다. 원심분리(2000 rpm, 10분간)로 회수한 원형질체를 1M 수크로스를 포함하는 최소 배지에 접종하고, 30℃에서 7일간 배양함으로써 우라실 영양요구성이 보충된 주를 선별하였다. 출현한 콜로니를 최소 배지에 접종하여 30℃에서 4일간 배양한 후, creA 유전자 영역이 니볼루맙 발현 서열로 치환되어 있는 것을 확인하고, F09주 및 F09ΔyscB주 유래 니볼루맙 발현주를 얻었다.
F09주 및 F09ΔyscB주 유래 니볼루맙 발현주를, 12 g/L 감자 덱스트로스 배양액(디프코), 20 g/L 박토 아가(디프코)를 포함하는 배지에 접종하여, 30℃에서 배양을 행하였다. 아가 배지 위에 형성시킨 콜로니의 가장자리 부근을 잘라내어 얻은 아가 디스크 1개를 50 g/L 솔카 플록, 24 g/L KH2PO4, 5 g/L (NH4)2SO4, 3 g/L 우레아, 1 g/L Tween80, 1.2 g/L MgSO4·7H2O, 0.01 g/L ZnSO4·7H2O, 0.01 g/L MnSO4·5H2O 및 0.01 g/L CuSO4·5H2O를 포함하는 20 mL의 액체 배지에 접종하고, 30℃, 220 rpm으로 7일간 배양을 행하였다. 얻어진 배양액을 0.22 ㎛의 필터에 통과시켜, 배양 상청액을 얻었다.
니볼루맙의 분비 생산량은, 인간 IgG ELISA 정량 키트[Human IgG ELISA Quantitation Kit(베틸 래버러토리즈, 인코포레이티드)에 의해 배양 상청액 중의 인간 IgG의 양으로서 측정하였다. 결과를 표 3에 나타낸다. F09주와 비교하여 F09ΔyscB주에서는 니볼루맙 분비 생산량이 증가하고 있는 것이 확인되었으므로, yscB 유전자 결손에 의해 니볼루맙의 분비 생산량이 향상되는 것으로 나타났다.
Figure pct00003
(5) 케라틴세포 성장 인자 1(KGF-1) 발현주의 구축과 배양 평가
T. 셀룰롤리티쿠스 F09주 및 F09ΔyscB주를 친주로 하여, 이하의 수순에 의해 케라틴세포 성장 인자 1(KGF-1) 발현주를 구축하였다.
먼저, T. 셀룰롤리티쿠스creA 유전자 상류 영역, T. 셀룰롤리티쿠스cbh2 유전자 상류 영역(cbh2 프로모터; 서열번호 33), T. 셀룰롤리티쿠스의 cbh1 분비 신호 코딩 서열(서열번호 34), His6 태그를 부가한 KGF-1을 코딩하는 유전자(서열번호 51), T. 셀룰롤리티쿠스cbh2 유전자 하류 영역(cbh2 터미네이터; 서열번호 36), T. 셀룰롤리티쿠스pyrF 유전자 마커(서열번호 37) 및 T. 셀룰롤리티쿠스creA 유전자 하류 영역의 순으로 연결된 염기 서열을 갖는 KGF-1 발현용 DNA 단편을 이하의 수순에 따라 제조하였다.
T. 셀룰롤리티쿠스 Y-94주(FERM BP-5826)의 게놈 DNA를 주형으로 하여, 프라이머(서열번호 7과 8)를 이용한 PCR에 의해 creA 유전자의 상류 영역을, 프라이머(서열번호 9와 10)를 이용한 PCR에 의해 cbh2 유전자의 상류 영역을, 프라이머(서열번호 11과 12)를 이용한 PCR에 의해 cbh1 분비 신호 코딩 서열을, 프라이머(서열번호 13과 14)를 이용한 PCR에 의해 cbh2 유전자의 하류 영역을, 프라이머(서열번호 15와 16)를 이용한 PCR에 의해 pyrF 유전자 마커를, 프라이머(서열번호 17과 18)를 이용한 PCR에 의해 creA 유전자 하류 영역을, 각각 증폭하였다. 또한, 유로핀으로부터 구입한 전합성 유전자를 주형으로 하여, 프라이머(서열번호 52와 53)를 이용한 PCR에 의해 His6 태그를 부가한 KGF-1을 코딩하는 유전자를 증폭하였다. PCR 산물은 위자드 SV 겔 및 PCR 클린업 시스템(프로메가)을 이용하여 정제하였다. 정제한 PCR 산물을 2종류씩 혼합한 것을 주형으로 하여 PCR을 행하여 상호 연결하는 것을 반복한 후, 인-퓨전 HD 클로닝 키트(다카라 바이오)에 의해 키트 부속의 pUC 플라스미드에 포함시켰다. 반응물로 이.콜라이 JM109를 형질전환하여, LB 아가 배지(100 mg/L 암피실린을 포함함)에서 37℃로 하룻밤 배양함으로써 콜로니를 형성시켰다. 얻어진 형질전환체로부터 위자드 플러스 미니프렙 시스템(프로메가)을 이용하여 KGF1 발현용 DNA 단편이 포함된 pUC-creA::Pcbh2-KGF1-pyrF 플라스미드를 얻었다. pUC-creA::Pcbh2-KGF1-pyrF 플라스미드를 주형으로 하여, 프라이머(서열번호 7과 18)를 이용한 PCR에 의해 KGF1 발현용 DNA 단편을 증폭하고, 에탄올 침전에 의해 농축 및 정제하였다. 또한, KGF-1 발현 서열의 양단에 creA 유전자의 상류 및 하류 서열을 연결함으로써, 게놈 상의 랜덤한 위치가 아닌 creA 유전자 영역을 표적으로 삼는 KGF-1 발현 서열을 삽입하는 것이 가능하게 되었다.
다음으로, F09주 및 F09ΔyscB주를 실시예 (1)과 동일한 수법으로 배양하여 원형질체화하고, 정제한 KGF-1 발현용 DNA 단편으로 실시예 (1)과 동일하게 형질전환을 행하였다. 원심분리(2000 rpm, 10분간)로 회수한 원형질체를 1M 수크로스를 포함하는 최소 배지에 접종하고, 30℃에서 7일간 배양함으로써 우라실 영양요구성이 보충된 주를 선별하였다. 출현한 콜로니를 최소 배지에 접종하여 30℃에서 4일간 배양한 후, creA 유전자 영역이 KGF-1 발현 서열로 치환되어 있는지 확인하고, F09주 및 F09ΔyscB주 유래 KGF-1 발현주를 취득하였다.
F09주 및 F09ΔyscB주 유래 KGF-1 발현주를, 12 g/L 감자 덱스트로스 배양액(디프코), 20 g/L 박토 아가(디프코)를 포함하는 배지에 접종하여, 30℃에서 배양을 행하였다. 아가 배지 위에 형성시킨 콜로니의 가장자리 부근을 잘라내어 얻은 아가 디스크 1개를 50 g/L 솔카 플록, 24 g/L KH2PO4, 5 g/L (NH4)2SO4, 3 g/L 우레아, 1 g/L Tween80, 1.2 g/L MgSO4·7H2O, 0.01 g/L ZnSO4·7H2O, 0.01 g/L MnSO4·5H2O 및 0.01 g/L CuSO4·5H2O를 포함하는 20 mL의 액체 배지에 접종하고, 30℃, 220 rpm으로 7일간 배양을 행하였다. 얻어진 배양액을 0.22 ㎛의 필터에 통과시켜, 배양 상청액을 얻었다.
KGF-1의 분비 생산을 확인하기 위해, 얻어진 배양 상청액에 Ni-NTA 아가로스(QIAGEN)에 의한 His-태그 정제를 가한 후, 정제물을 SDS-PAGE에 제공하였다. 구체적으로는, pH 8.0으로 조정한 배양 상청에 Ni-NTA 아가로스(QIAGEN)를 첨가하여 1시간 혼합한 후, 50 mM 인산 버퍼(pH 8.0)로 세정하고, SDS-PAGE의 샘플 완충액을 첨가하여 95℃에서 5분간 가열하여, 상청액을 SDS-PAGE에 제공하였다. 결과를 도 3에 나타낸다. F09주와 비교하여 F09ΔyscB주에서는 KGF-1 분비 생산량이 증가하고 있는 것이 확인되었으므로, yscB 유전자 결손에 의해 KGF-1의 분비 생산량이 향상되는 것으로 나타났다.
(6) 혈관 내피 성장 인자(VEGF) 발현주의 구축과 배양 평가
T. 셀룰롤리티쿠스 F09주 및 F09ΔyscB주를 친주로 하여, 이하의 수순에 의해 혈관 내피 성장 인자(VEGF) 발현주를 구축하였다.
먼저, T. 셀룰롤리티쿠스creA 유전자 상류 영역, T. 셀룰롤리티쿠스cbh2 유전자 상류 영역(cbh2 프로모터; 서열번호 33), T. 셀룰롤리티쿠스의 cbh1 분비 신호 코딩 서열(서열번호 34), His6 태그를 부가한 VEGF를 코딩하는 유전자(서열번호 54), T. 셀룰롤리티쿠스cbh2 유전자 하류 영역(cbh2 터미네이터; 서열번호 36), T. 셀룰롤리티쿠스pyrF 유전자 마커(서열번호 37) 및 T. 셀룰롤리티쿠스creA 유전자 하류 영역의 순으로 연결된 염기 서열을 갖는 VEGF 발현용 DNA 단편을 이하의 수순에 따라 제조하였다.
T. 셀룰롤리티쿠스 Y-94주(FERM BP-5826)의 게놈 DNA를 주형으로 하여, 프라이머(서열번호 7과 8)를 이용한 PCR에 의해 creA 유전자의 상류 영역을, 프라이머(서열번호 9와 10)를 이용한 PCR에 의해 cbh2 유전자의 상류 영역을, 프라이머(서열번호 11과 12)를 이용한 PCR에 의해 cbh1 분비 신호 코딩 서열을, 프라이머(서열번호 13과 14)를 이용한 PCR에 의해 cbh2 유전자의 하류 영역을, 프라이머(서열번호 15와 16)를 이용한 PCR에 의해 pyrF 유전자 마커를, 프라이머(서열번호 17과 18)를 이용한 PCR에 의해 creA 유전자 하류 영역을, 각각 증폭하였다. 또한, 유로핀으로부터 구입한 전합성 유전자를 주형으로 하여, 프라이머(서열번호 55와 56)를 이용한 PCR에 의해 His6 태그를 부가한 VEGF를 코딩하는 유전자를 증폭하였다. PCR 산물은 위자드 SV 겔 및 PCR 클린업 시스템(프로메가)을 이용하여 정제하였다. 정제한 PCR 산물을 2종류씩 혼합한 것을 주형으로 하여 PCR을 행하여 상호 연결하는 것을 반복한 후, 인-퓨전 HD 클로닝 키트(다카라 바이오)에 의해 키트 부속의 pUC 플라스미드에 포함시켰다. 반응물로 이.콜라이 JM109를 형질전환하고, LB 아가 배지(100 mg/L 암피실린을 포함함)에서 37℃로 하룻밤 배양함으로써 콜로니를 형성시켰다. 얻어진 형질전환체로부터 위자드 플러스 미니프렙 시스템(프로메가)을 이용하여 VEGF 발현용 DNA 단편이 포함된 pUC-creA::Pcbh2-VEGF-pyrF 플라스미드를 얻었다. pUC-creA::Pcbh2-VEGF-pyrF 플라스미드를 주형으로 하여, 프라이머(서열번호 7과 18)를 이용한 PCR에 의해 VEGF 발현용 DNA 단편을 증폭하고, 에탄올 침전에 의해 농축 및 정제하였다. 또한, VEGF 발현 서열의 양단에 creA 유전자의 상류 및 하류 서열을 연결함으로써, 게놈 상의 랜덤한 위치가 아닌 creA 유전자 영역을 표적으로 삼는 VEGF 발현 서열을 삽입하는 것이 가능하게 되었다.
다음으로, F09주 및 F09ΔyscB주를 실시예 (1)과 동일한 수법으로 배양하여 원형질체화하고, 정제한 VEGF 발현용 DNA 단편으로 실시예 (1)과 동일하게 형질전환을 행하였다. 원심분리(2000 rpm, 10분간)로 회수한 원형질체를 1M 수크로스를 포함하는 최소 배지에 접종하고, 30℃에서 7일간 배양함으로써 우라실 영양요구성이 보충된 주를 선별하였다. 출현한 콜로니를 최소 배지에 접종하여 30℃에서 4일간 배양한 후, creA 유전자 영역이 VEGF 발현 서열로 치환되어 있는 것을 확인하고, F09주 및 F09ΔyscB주 유래 VEGF 발현주를 얻었다.
F09주 및 F09ΔyscB주 유래 VEGF 발현주를, 12 g/L 감자 덱스트로스 배양액(디프코), 20 g/L 박토 아가(디프코)를 포함하는 배지에 접종하여, 30℃에서 배양하였다. 아가 배지 위에 형성시킨 콜로니의 가장자리 부근을 잘라내어 얻은 아가 디스크 1개를 50 g/L 솔카 플록, 24 g/L KH2PO4, 5 g/L (NH4)2SO4, 3 g/L 우레아, 1 g/L Tween80, 1.2 g/L MgSO4·7H2O, 0.01 g/L ZnSO4·7H2O, 0.01 g/L MnSO4·5H2O 및 0.01 g/L CuSO4·5H2O를 포함하는 20 mL의 액체 배지에 접종하고, 30℃, 220 rpm으로 7일간 배양을 행하였다. 얻어진 배양액을 0.22 ㎛의 필터에 통과시켜, 배양 상청액을 얻었다.
VEGF의 분비 생산을 확인하기 위해, 얻어진 배양 상청액에 Ni-NTA 아가로스(QIAGEN)에 의한 His-태그 정제를 가한 후, 정제물을 SDS-PAGE에 제공하였다. 구체적으로는, pH 8.0으로 조정한 배양 상청에 Ni-NTA 아가로스(QIAGEN)를 첨가하여 1시간 혼합한 후, 50 mM 인산 버퍼(pH 8.0)로 세정하고, SDS-PAGE의 샘플 완충액을 첨가하여 95℃에서 5분간 가열하여, 상청액을 SDS-PAGE에 제공하였다. 결과를 도 4에 나타낸다. F09주와 비교하여 F09ΔyscB주에서는 VEGF 분비 생산량이 증가하고있는 것이 확인되었으므로, yscB 유전자 결손에 의해 VEGF의 분비 생산량이 향상되는 것으로 나타났다.
(7) 이종 단백질 분해에 관련된 프로테아제의 분석
(7-1) 이종 단백질 분해에 관련된 프로테아제의 국소편재 분석
상술한 바와 같이, 실시예 (2)에서 탈라로마이세스 셀룰롤리티쿠스 F09주(일본 공개특허공보 (Kokai) 특개2016-131533호)를 숙주로 하여 이종 단백질인 HSA를 분비 생산한 바, HSA의 분해가 확인되었다(도 1). 따라서, 이종 단백질 분해에 관련된 프로테아제의 국소편재를 조사하기 위해, F09주의 배양 상청액을 다음과 같이 하여 제조하였다. 먼저, F09주를, 12 g/L 감자 덱스트로스 배양액(디프코), 20 g/L 박토 아가(디프코)를 포함하는 배지에 접종하여, 30℃에서 배양하였다. 아가 배지 위에 형성시킨 콜로니의 가장자리 부근을 잘라내어 얻은 아가 디스크 1개를 50 g/L 솔카 플록, 24 g/L KH2PO4, 5 g/L (NH4)2SO4, 3 g/L 우레아, 1 g/L Tween80, 1.2 g/L MgSO4·7H2O, 0.01 g/L ZnSO4·7H2O, 0.01 g/L MnSO4·5H2O, 0.01 g/L CuSO4·5H2O, 1 g/L 우라실 및 1 g/L 우리딘을 포함하는 20 mL의 액체 배지에 접종하여, 30℃, 220 rpm으로 7일간 배양을 행하였다. 얻어진 배양액을 0.22 ㎛의 필터에 통과시켜 균체를 제거하여, 배양 상청액을 얻었다. 배양 상청액과 정제된 HSA [압캠(Abcam), ab201876]를 혼합하고, 30℃에서 3일간 정치하였다. 이어서, 혼합액을 SDS-PAGE에 제공하고, 항HSA 항체(SIGMA, A6684)에 의한 웨스턴 블로팅을 행하였다. 결과를 도 5에 나타낸다. HSA보다 분자량이 작은 위치에 분해물의 복수의 밴드가 보이는 것으로부터, HSA의 분해가 확인되었다. 이 결과로부터, F09주의 배양 상청액에 이종 단백질 분해에 관련된 프로테아제가 포함되어 있었음을 알 수 있었다.
(7-2) 이종 단백질 분해에 관련된 프로테아제 후보 유전자의 추출
이종 단백질 분해에 관련된 프로테아제 후보 유전자를 추출하기 위해, 실시예 (7-1)에서 얻어진 배양액으로부터 F09주의 균체를 원심분리(5000 rpm, 5분간)로 회수하고, RNeasy 플랜트 미니 키트[RNeasy Plant Mini Kit(QIAGEN)]을 이용하여 총 RNA의 추출을 행하였다. 얻어진 총 RNA로부터 TruSeq 표준 mRNA 샘플프렙 키트[TruSeq Stranded mRNA SamplePrep Kit(일루미나)]로 라이브러리를 제조하고, 차세대 시퀀서 MiSeq로 MiSeq 시약 키트 v2 500 사이클[MiSeq Reagent Kit v2 500 cycle(일루미나)]을 이용하여 발현 분석을 실시하였다. 프로테아제라고 주석이 달린 유전자를 추출하여, 발현량(즉, 맵핑된 리드수(mapped read number))순으로 재정렬한 것을 표 4에 나타낸다. 가장 발현량이 높았던 cbh1 유전자는 140,000 리드, 두번째로 발현량이 높았던 cbh2 유전자는 80,000 리드였기 때문에, 800 리드 이하의 것은 제외하였다. 표 4에 나타내는 5개의 유전자를 프로테아제 후보 유전자로서 추출하였다. (7-1)에서 배양 상청액에 프로테아제가 포함되어 있는 것이 시사되었지만, 용균(溶菌)에 의한 프로테아제의 용출이나 주석의 오류 등도 생각할 수 있기 때문에, 주석 상의 국소편재는 고려하지 않고, 이들 5개의 유전자 모두를 후보로 하여 이후의 검토를 실시하였다.
Figure pct00004
(7-3) 추출한 프로테아제 후보 유전자 결손주의 구축
탈라로마이세스 셀룰롤리티쿠스 F09주(일본 공개특허공보 (Kokai) 특개2016-131533호)를 친주로 하여, 이하의 수순에 의해 프로테아제 후보 유전자(Pepsin1: 서열번호 57, yscB: 서열번호 32, CPY: 서열번호 58, Pepsin2: 서열번호 59 및 Thermolysin: 서열번호 60)을 파괴하고, T. 셀룰롤리티쿠스 F09 유래 프로테아제 후보 유전자 결손주를 구축하였다. F09주는, T. 셀룰롤리티쿠스 S6-25주(NITE BP-01685)를 친주로 하여 얻어진 pyrF 유전자에 변이(1 염기 치환)를 갖는 주이다. F09주는, pyrF 유전자의 변이에 의해, 우라실 영양요구성을 나타낸다.
먼저, T. 셀룰롤리티쿠스의 프로테아제 후보 유전자 상류 영역, pyrF 유전자 및 T. 셀룰롤리티쿠스의 프로테아제 후보 유전자 하류 영역의 순으로 연결된 염기 서열을 갖는 프로테아제 후보 유전자 파괴용 DNA 단편을 이하의 수순에 따라서 제조하였다.
T. 셀룰롤리티쿠스 Y-94주(FERM BP-5826)의 게놈 DNA를 주형으로 하여, 프라이머(서열번호 61과 62)를 이용한 PCR에 의해 Pepsin1 유전자의 상류 영역을, 프라이머(서열번호 62와 63)를 이용한 PCR에 의해 Pepsin1 유전자의 하류 영역을, 프라이머(서열번호 1과 65)를 이용한 PCR에 의해 yscB 유전자의 상류 영역을, 프라이머(서열번호 66과 4)를 이용한 PCR에 의해 yscB 유전자의 하류 영역을, 프라이머(서열번호 67과 68)를 이용한 PCR에 의해 CPY 유전자의 상류 영역을, 프라이머(서열번호 69와 70)를 이용한 PCR에 의해 CPY 유전자의 하류 영역을, 프라이머(서열번호 71과 72)를 이용한 PCR에 의해 Pepsin2 유전자의 상류 영역을, 프라이머(서열번호 73과 74)를 이용한 PCR에 의해 Pepsin2 유전자의 하류 영역을, 프라이머(서열번호 75와 76)를 이용한 PCR에 의해 Thermolysin 유전자의 상류 영역을, 프라이머(서열번호 77과 78)를 이용한 PCR에 의해 Thermolysin 유전자의 하류 영역을, 각각 증폭하였다. 또한, T. 셀룰롤리티쿠스 Y-94주(FERM BP-5826)의 게놈 DNA를 주형으로 하여, 프라이머(서열번호 79와 80)를 이용한 PCR에 의해, pyrF 유전자(프로모터와 터미네이터를 포함함)를 증폭하였다. PCR 산물은 위자드 SV 겔 및 PCR 클린업 시스템(프로메가)을 이용하여 정제하였다. 정제한 상류 영역, 하류 영역 및 pyrF 유전자의 PCR 산물을 인-퓨전 HD 클로닝 키트(다카라 바이오)에 의해 키트 부속의 pUC 플라스미드에 포함시켜 연결하였다. 반응물로 이.콜라이 JM109를 형질전환하여, LB 아가 배지(100 mg/L 암피실린을 포함함)에서 37℃로 하룻밤 배양함으로써 콜로니를 형성시켰다. 얻어진 형질전환체로부터 위자드 플러스 미니프렙 시스템(프로메가)을 이용하여 프로테아제 후보 유전자 파괴용 DNA 단편이 포함된 플라스미드를 얻었다. 이들 플라스미드를 각각 주형으로 하여, 프라이머(Pepsin1: 서열번호 61과 64, YscB: 서열번호 1과 4, CPY: 서열번호 67과 70, Pepsin2: 서열번호 71과 74, Thermolysin: 서열번호 75와 78)를 이용한 PCR에 의해 프로테아제 후보 유전자 파괴용 DNA 단편을 증폭하고, 에탄올 침전에 의해 농축 및 정제하였다.
다음으로, F09주를 12 g/L 감자 덱스트로스 배양액(디프코), 20 g/L 박토 아가(디프코)를 포함하는 배지에 접종하여, 30℃에서 배양하였다. 아가 배지 위에 형성시킨 콜로니의 가장자리 부근을 잘라내어 얻은 아가 디스크 1개를, 24 g/L 감자 덱스트로스 배양액을 포함하는 배지에 접종하여, 30℃, 220 rpm으로 2일간 회전 배양하였다. 균체를 원심분리(5000 rpm, 5분간)로 회수하여, 10 g/L 야탈라아제(다카라 바이오), 10 mM KH2PO4, 0.8M NaCl을 포함하는 수용액(pH 6.0)을 30 mL 첨가하여, 진탕하면서 30℃에서 2시간 반응시켜, 세포벽을 소화하여 원형질체화했다. 유리 필터로 잔사를 제거한 후, 원심분리(2000 rpm, 10분간)로 원형질체를 회수하고, 1.2M 소르비톨, 10 mM CaCl2를 포함하는 Tris-HCl 완충액(pH 7.5)으로 1mL에 현탁하여 원형질체 용액을 제조하였다. 원형질체 용액 중 200μL 분취액에, 정제한 각 프로테아제 후보 파괴용 DNA 단편을 10㎍과, 400 g/L PEG4000, 10 mM CaCl2를 포함하는 Tris-HCl 완충액(pH 7.5)을 50μL 첨가하고, 빙상에서 30분간 방치하였다. 그 후, 추가로 1 mL의 400 g/L PEG4000 및 10 mM CaCl2를 포함하는 Tris-HCl 완충액(pH 7.5)을 첨가하여 혼합하고, 실온에서 15분간 방치하여 형질전환을 행하였다. 원심분리(2000 rpm, 10분간)로 회수한 원형질체를 1M 수크로스를 포함하는 최소 배지(10 g/L 글루코스, 10 mM NH4Cl, 10 mM KH2PO4, 7 mM KCl, 2 mM MgSO4, 0.06 mg/L H3BO3, 0.26 mg/L (NH4)6Mo7O24·4H2O, 1 mg/L FeCl3·6H2O, 0.4 mg/L CuSO4·5H2O, 0.08 mg/L MnCl2, 2 mg/L ZnCl2 및 20 g/L 박토 아가)에 접종하여, 30℃에서 7일간 배양함으로써 우라실 영양요구성이 보충된 주를 선별하였다. 출현한 콜로니를 최소 배지에 접종하여 30℃에서 4일간 배양한 후, 각 프로테아제 후보 유전자 영역이 pyrF 유전자로 치환되어 있는 것을 확인하고, F09주 유래 프로테아제 후보 유전자 결손주를 얻었다.
(7-4) 프로테아제 후보 유전자 결손주의 배양 상청액의 프로테아제 활성의 평가
각 프로테아제 후보 유전자 결손주를, 12 g/L 감자 덱스트로스 배양액(디프코), 20 g/L 박토 아가(디프코)를 포함하는 배지에 접종하여, 30℃에서 배양을 행하였다. 아가 배지 위에 형성시킨 콜로니의 가장자리 부근을 잘라내어 얻은 아가 디스크 1개를 50 g/L 솔카 플록, 24 g/L KH2PO4, 5 g/L (NH4)2SO4, 3 g/L 우레아, 1 g/L Tween80, 1.2 g/L MgSO4·7H2O, 0.01 g/L ZnSO4·7H2O, 0.01 g/L MnSO4·5H2O 및 0.01 g/L CuSO4·5H2O를 포함하는 20 mL의 액체 배지에 접종하고, 30℃, 220 rpm으로 7일간 배양을 행하였다. 얻어진 배양액을 0.22 ㎛의 필터에 통과시켜, 배양 상청액을 얻었다. 배양 상청액을 (7-1)과 동일하게 정제 HSA와 혼합하여 프로테아제 활성을 평가하였다. 결과를 도 6에 나타낸다. Pepsin1, CPY, Pepsin2 및 Thermolysin 결손주에서는 F09주와 동일하게, HSA보다 분자량이 작은 위치에서 분해물의 복수의 밴드가 보이는 것으로부터, HSA의 분해가 확인되었다. 이와는 반대로, yscB 결손주에서는, 분해물의 밴드가 소실되어 있었다. 이 결과로부터, YscB가 F09주에서 배양 상청에서의 이종 단백질 분해를 담당하고 있는 프로테아제인 것으로 밝혀졌다.
본 발명에 의해, 단백질을 효율적으로 제조할 수 있다.
<서열목록의 설명>
서열번호 1 내지 31: 프라이머
서열번호 32: 탈라로마이세스 셀룰롤리티쿠스 S6-25주의 yscB 유전자의 염기 서열
서열번호 33: 탈라로마이세스 셀룰롤리티쿠스의 cbh2 프로모터의 염기 서열
서열번호 34: 탈라로마이세스 셀룰롤리티쿠스의 Cbh1 신호 펩타이드를 코딩하는 염기 서열
서열번호 35: 인간 혈청 알부민(HSA) 유전자의 아미노산 서열
서열번호 36: cbh2 터미네이터의 염기 서열
서열번호 37: 탈라로마이세스 셀룰롤리티쿠스의 pyrF 유전자 마커의 염기 서열
서열번호 38: 트라스트주맙 중쇄 유전자의 염기 서열
서열번호 39: cbh1 터미네이터의 염기 서열
서열번호 40: 트라스트주맙 경쇄 유전자의 염기 서열
서열번호 41: 탈라로마이세스 셀룰롤리티쿠스의 cbh1 프로모터의 염기 서열
서열번호 42: 탈라로마이세스 셀룰롤리티쿠스의 cbh1 신호 펩타이드의 아미노산 서열
서열번호 43: 탈라로마이세스 셀룰롤리티쿠스 S6-25주의 YscB 단백질의 아미노산 서열
서열번호 44: 탈라로마이세스 셀룰롤리티쿠스 S6-25주의 creA 유전자의 염기 서열
서열번호 45: 니볼루맙 중쇄 유전자의 염기 서열
서열번호 46: 니볼루맙 경쇄 유전자의 염기 서열
서열번호 47 내지 50: 프라이머
서열번호 51: 케라틴세포 성장 인자 1(KGF-1) 유전자의 염기 서열
서열번호 52 내지 53: 프라이머
서열번호 54: 혈관 내피 성장 인자(VEGF) 유전자의 염기 서열
서열번호 55 내지 56: 프라이머
서열번호 57: Pepsin1 유전자의 염기 서열
서열번호 58: CPY 유전자의 염기 서열
서열번호 59: Pepsin2 유전자의 염기 서열
서열번호 60: Thermolysin 유전자의 염기 서열
서열번호 61 내지 80: 프라이머
<110> Ajinomoto Co., Inc. <120> METHOD FOR MANUFACTURING PROTEIN <130> E047-18419 <150> JP2017-196538 <151> 2017-10-10 <160> 80 <170> KoPatentIn 3.0 <210> 1 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 1 cggtacccgg ggatcttggg gcacagagac aacagggtca 40 <210> 2 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 2 agatagggtt gagtgagata gcgtgagcac actgagcagg 40 <210> 3 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 3 aaagtgtaaa gcctgcaaca cgctacctct tccacagtag 40 <210> 4 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 4 cgactctaga ggatcgagct gattgagcat gctaacgcag 40 <210> 5 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 5 cactcaaccc tatctcggtc t 21 <210> 6 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 6 caggctttac actttatgct tccg 24 <210> 7 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 7 cggtacccgg ggatcagcgc agaccaatgc cagaggagaa 40 <210> 8 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 8 gcgcgagttg cgcgatgaaa tttat 25 <210> 9 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 9 tcgcgcaact cgcgctgcta tgcagttgat gctactgtgt 40 <210> 10 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 10 agttgctaaa tgatcaagaa gcttcacttt 30 <210> 11 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 11 acagctggtg ctcagaagtg ggtcaccttc atctctctcc tcttc 45 <210> 12 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 12 ctgagcacca gctgttgcca gcaag 25 <210> 13 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 13 tagatcagct ttgagtgcag caaaa 25 <210> 14 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 14 gcttgtttga gaatacatga ggttgcc 27 <210> 15 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 15 tattctcaaa caagcgtcaa ttcagatcgg ctgccgcctg 40 <210> 16 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 16 ataagtgaac gccgagtcag tacta 25 <210> 17 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 17 tcggcgttca cttatcctct ttctcgccct ttcttctcaa 40 <210> 18 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 18 cgactctaga ggatcaaccg tcgatcagaa ggagcgcaat 40 <210> 19 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 19 acagctggtg ctcagaagtg ggtcaccttc atctctctcc 40 <210> 20 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 20 ctcaaagctg atctacaaac caagagcagc ttgactagcg 40 <210> 21 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 21 gacgagctgg acttcctgag caccagctgt tgccagcaag 40 <210> 22 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 22 taaattttca cttctttctt cgcctattga 30 <210> 23 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 23 ccgatctgaa ttgacccgaa aacggtaagg cgtagttata gaaat 45 <210> 24 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 24 gtcaattcag atcggctgcc gcctg 25 <210> 25 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 25 tcggcgttca cttattgcta tgcagttgat gctactgtgt 40 <210> 26 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 26 tgtcatctgg atgtcctgag caccagctgt tgccagcaag 40 <210> 27 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 27 tattctcaaa caagccctct ttctcgccct ttcttctcaa 40 <210> 28 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 28 gaagtccagc tcgtcgagtc tggtg 25 <210> 29 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 29 agaagtgaaa atttatttac caggagacaa ggacaga 37 <210> 30 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 30 gacatccaga tgacacagtc ccctt 25 <210> 31 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 31 ctcaaagctg atctaacact caccacggtt gaaggactta 40 <210> 32 <211> 1589 <212> DNA <213> Talaromyces cellulolyticus <400> 32 atgaagggcg tcctcagcct ttcgctgctg ccgttgttga cggttgcgtc accggtgatg 60 ccgcgcacca tccacaacga cgctgctccc attctctctt cgtccaacgc cgttgaggtc 120 ccagattcat atatcattgt ctttaaagac catgtagatt ctgcttctgc cgcagcccat 180 cataactggg tgcaagacat tcacagccaa cacaccgagc tccgaaagcg gtctcaattc 240 ccattcgctg acaatgcctt tgccggtctc aaacacactt ttgacattgc cggcagcttc 300 cttggttact caggacactt cgaagagaat gtcattgagg ccattcgccg acaccccgat 360 gtgagttatc cgcacgtgcc ctactcctaa ggcaatgact aatacgcatc tccacctata 420 ggttgattac atcgagaagg attctcttgt ccacaccatg gaagatcccg cccttgagaa 480 gaacgcccca tggggtttgg ctcgtatttc gcaccgtgag agcttgagct tcggaagctt 540 caacaagtac ttgtacgctg ccgacggcgg tgaaggtgtt gacgtttatg tcattgacac 600 tggtaccaac atcgaccacg tcgacttcga gggtcgtgct tcctggggca agaccatccc 660 cactgacgat gaggatgttg atggcaatgg tcacggtact cactgctccg gaactattgc 720 gggcaagaag tacggtgttg ccaagaaggc caatgtctac gctgtcaagg tcttgaagtc 780 taacggttct ggaaccatgt ccgatgtcgt tcagggtgtc gaatgggctg ctactcagca 840 catcaagaag gtcaaggacg ccaaggccgg aaaagccaag ggcttcaagg gtagcgctgc 900 gaacatgagt ctcggtggtg gcaagtccgt cactcttgac aaggctgtca atgctgctgt 960 tgatgctggt atccacttcg ctgtcgctgc tggcaacgac aacgccgact cctgcaacta 1020 ctcccctgcc gccgctgaga aggccgtcac cgtcggagcc tcgaccttgg ccgatgagcg 1080 tgcttacttc tccaactacg gcaagtgcaa cgacatcttt gctcctggtc tgaacattct 1140 ctctacctgg atcggcagca agtacgccgt caacaccatc tccggtacct ccatggcttc 1200 tcctcacatt gctggtcttt tggcctactt cctctctctc cagcctgcca gtgactccgc 1260 cttcgctgtt gccgagatta ctcccaagaa gttgaaggag aacctcattg ctattggtac 1320 ccagggcgct cttactgatg ttccctctga caccactaac gtaagttgac tctgttagtc 1380 tttcaatgca ttatcaacta acaactgtgt catagattct cgcctggaac ggtggtggct 1440 cagccaacta caccgacatc attgcccaag gtggttacaa gaccaagaca ctcagcaacg 1500 aagttgacga attgatcaac aagttggagg tcgtgaacga ggaactcggt gccatctaca 1560 gccacatcaa ggatgccatt gccgcataa 1589 <210> 33 <211> 1100 <212> DNA <213> Talaromyces cellulolyticus <400> 33 tgctatgcag ttgatgctac tgtgttctaa aataattgat agggttaggg tcgggtataa 60 ggcgatgcaa tgtatcaatt atcacgagaa ataatgcaga aaaacacaat tccccgtatc 120 tgttgattct taaacaatct gatcaccaat ttgtagaaag aaacgattat aaggtgccat 180 ggtaatgctg gagtttacac aggatactac ttgttctgtt cattacaatg aaccgtaatt 240 gcattctgtt ttgaccactc aacaaatcct acacaaaagt aagtggactt cagtgctcgc 300 tctacgcaag taaatacttg gcatatatgg cctcgtatat tcttacaatg aggtaaattc 360 cgatagatta ctgcccaact agtcaatctt aaatccttaa gagatacagg gggaggcgga 420 agtacctgaa accacgtaat aagacgttca gggtcatgtg aatgtatgta gtatccatgt 480 ccaatacaat tgataatagt atccagtatt atatctcatt caggtaagcg ccacgcgatt 540 cttcagatct acttaactgc cgactcgcca aacgaaacaa cgtttattcg tgaccccaga 600 aaatcaccgc ggagttgcgg aggaccagtt tgtacaatgc accgaaccaa gcgttggtca 660 tttttctgga aatgggccaa acgttagaag tgattggtca gagctacatc tgaaggtgaa 720 gcaatttccg gtatgcatac atgacagcaa gcttacctac caagaccaag ttattcccca 780 gcatttgccc catacttggc tttaatattg tgggatagca aacaatatcc acaacactga 840 tgataactaa actacaaatc tgacgttact tcagactact cacgtgtcaa aagcagttag 900 cgaggatcaa gtcttttagt ctggtcatta acaaacgcaa tttcgcaacc cgataatccg 960 cgatgataat atagcgactc caaggtcgta tttatattca atcaattccc cccaatttgg 1020 aatggatttt tggaatcatc gcatgccagg acaatcagtg aaacagtgac aaagtgaagc 1080 ttcttgatca tttagcaact 1100 <210> 34 <211> 78 <212> DNA <213> Talaromyces cellulolyticus <400> 34 atgtctgcct tgaactcttt caatatgtac aagagcgccc tcatcttggg ctccttgctg 60 gcaacagctg gtgctcag 78 <210> 35 <211> 1827 <212> DNA <213> Homo sapiens <400> 35 aagtgggtca ccttcatctc tctcctcttc ttgttctcca gcgcctacag ccgtggtgtt 60 ttccgtcgtg acgcacacaa gtccgaagtg gcccatcgct tcaaagacct cggtgaggaa 120 aacttcaagg ctctcgtctt gattgccttc gctcagtact tgcaacagtg ccctttcgag 180 gaccacgtga agctggtcaa cgaagttacc gaattcgcca aaacctgcgt tgctgacgag 240 tctgccgaaa actgcgataa gtctctgcat accttgttcg gcgacaagct ctgtactgtc 300 gctaccctcc gtgagaccta cggagaaatg gccgattgtt gcgccaagca ggagcctgag 360 cgtaatgagt gctttctgca gcacaaggac gacaacccca atttgcctcg gcttgttcgt 420 cctgaggttg acgtcatgtg taccgccttc cacgataacg aggaaacctt cctcaagaag 480 tacctctacg agatcgcaag acgccatccc tacttctacg ctcctgaatt gctgttcttt 540 gccaagcgtt acaaggcagc attcactgag tgttgtcaag ccgctgacaa ggccgcctgc 600 ttgctcccca agttggatga actccgcgat gagggtaagg cctctagcgc caaacagcgc 660 cttaagtgcg cctctttgca gaagttcggt gagagagcct tcaaagcctg ggctgttgct 720 cgtctatccc aacgtttccc taaagccgag tttgctgaag tttccaaact cgtcactgac 780 ctgacaaagg tccatactga gtgctgccac ggtgacttgt tggagtgtgc tgatgatcgt 840 gccgatttgg caaagtacat ctgcgagaac caggacagca tctcctccaa gttgaaggag 900 tgctgcgaaa agcccttgct cgagaagtcc cactgcattg cggaggtcga gaacgacgaa 960 atgcctgccg acttgccttc tttggctgct gacttcgtcg aaagcaagga tgtctgcaag 1020 aactacgctg aagccaaaga cgtgttcttg ggcatgttct tgtacgagta tgctcgtcgc 1080 caccctgact actccgtggt tcttctcctc cgtctcgcca agacatacga gacgactttg 1140 gagaagtgct gtgccgctgc cgaccctcac gagtgctatg ccaaggtctt cgacgaattc 1200 aagcccttag tcgaagaacc tcagaactta atcaagcaga attgtgagct attcgagcaa 1260 ctcggtgagt acaagttcca gaacgcgtta ctggtccggt acaccaagaa ggttccccaa 1320 gtctccactc ctaccttggt tgaggtctct cgtaacttgg gtaaggttgg aagcaagtgc 1380 tgtaagcacc ccgaagccaa gcgtatgcct tgcgctgaag actacctgtc ggtcgtcttg 1440 aaccaattgt gcgtcttgca cgagaagact cccgttagcg atcgtgttac caagtgttgt 1500 accgaaagct tggttaaccg tcgtccctgc ttctccgctt tggaagtcga tgagacttac 1560 gttcctaagg agttcaacgc cgaaaccttc acctttcacg ctgatatctg cactctgtca 1620 gagaaagagc gtcagatcaa gaagcaaacc gcactcgttg agcttgtcaa gcacaaaccc 1680 aaagccacca aggaacagct caaagccgtc atggacgatt tcgctgcctt cgtcgagaaa 1740 tgctgcaaag ccgacgacaa ggagacgtgc ttcgcggaag agggcaagaa gttggtcgcc 1800 gctagtcaag ctgctcttgg tttgtag 1827 <210> 36 <211> 497 <212> DNA <213> Talaromyces cellulolyticus <400> 36 atcagctttg agtgcagcaa aaatgcttcc gactgtcttc ttatattgat atcatatttt 60 tcaattcact ttgtctcaag tttcaatata tcgagaaaat agtatcaaag atgaactgta 120 ataattccga tatacctata caggtttata gtaaattact ctatttcata atgcgtccat 180 ccgagaagtc tggcggcctt atcagtagtc caaaacgcct ggtttttaga catgtcacct 240 ctaatctccg cttgaggaaa atgcgtccga gcaagttctt tcgacggggt gtcttgggtc 300 gtagttggag atatgatatt tattacttcg aatcctttga tattctcact cttttcaacc 360 gccaaaaggc aagctcttgc cactgcgcga ggattaaccc atccccagag ttgtcgaacc 420 ccagattcat accatttatc gtggtgtctt tttctaacat ctctcaatgg ggcaacctca 480 tgtattctca aacaagc 497 <210> 37 <211> 2858 <212> DNA <213> Talaromyces cellulolyticus <400> 37 gtcaattcag atcggctgcc gcctgcgccc caggtgacgt cgatgaaagc tgggcctagg 60 tcgtgcatgc ggtccatacg gtcgtataag ttctggacac cttgggcggt ctttgggggg 120 aagtattcga aggaaattcc aggtcggccg gtggccgcct gttcttggag cttttgcccg 180 acatgcatgt tgataggtcg gtcaattgtc tgctttttca atatcttctc ggtatgatgt 240 agcttgcaga acccaagtta tgtagttcaa ttgcaaaatc aagtctgatc aagaccgaaa 300 ctcaatcccg gagcactgag gttcgcacta attgatcaag ggtacaagaa tgaggggcac 360 aatgaaagca gtcttgaaaa tgacaggcag agaaattgaa agaaaggaga agagaggacc 420 tccgggacag gagaaatgaa agcaacaaaa ccccgaacaa gctggagaga agttaaaggg 480 agcagcttgg tcaccggcaa tggatgctca tcataaaaaa ggaccctaaa cccgttatcg 540 gagtccggag aaatgacgct aattcggatt tggaagtccc cgccaatcgt gggaaattct 600 cgaagcagac aatttgctcg tgacaatcag ccagcaatga gagggagact gaaaaatatg 660 tatttacact caaagaatcc gatactgcta ttaggatcag tgtttttctt ataagcaaat 720 gagcgttgga cgtggaaaat gaggaatcct cagtccctat actcggtcag cgacggaggg 780 gtgcgtgatc ggccaatcac agcctattat tttatcaaca tctgattggc tacttccgat 840 aagagcgaaa tatgcccctc cttgcaattt ttaccatcaa cgctaacagc aacactcaac 900 aaaccattca atcttgatac tcgctcccat tagtcaccac gcaggacaac acaacacgac 960 atcgcatctc agctttgacc attcccgccg caagcgattc gctgtcacaa acgccagata 1020 ccccaacatg gctgcccctc cctccgccga tcaggactac aagaccaatc tgttgtcttt 1080 gctgatagcc aacgatgcgc tcgcatttgg cacgttcaca ttgaaatctg gtcgccagtc 1140 gccgtatttt ttgacctcga gtcgtcttta tactgcgcct ctgctgcgcc aggtgtcggc 1200 cgcgttcgcg aataccatct cgtccccgcc ttttgtgaat atagctgcag atggcagcat 1260 taccccgaac tttgacattg tttttgggta tgttacccta ttattcgtgc gcctgatatg 1320 cgtgtactga tttacttcaa atagccccgc ctacaaagga atccccgaat gcgtcggtgt 1380 tgtcaacgag ctcgctaccc gggatgcgct cgccggtacc aagacatggg acaacatcag 1440 ctactccttc aaccgcaaag aagccaaaga ccacggcgaa gggggtaaca tcgtcggtgc 1500 gcctctcaag ggaaaacgtg ttttgatcgt tgacgacgtc atcaccgctg gtaccgcgct 1560 gcgtgaagct gtcggcatta ttcaaaagga aggcggaacc gttgccggtg ttgtgttgct 1620 gttcgatcgt caggaacggg tcagtgatac ggagcagaag agtgccattg gagccgcgga 1680 gagggacctt ggaggcgata ttcctatccg tgcggtgttg gtattccagg atttgattga 1740 taagcttgga gataagattg gtcaggagga ggtgcgcagg ttggaagagt accggaacac 1800 gtacaaggct caataaatgg ctgctgtggg atgaaatggg tatattaacg atttatgcta 1860 aaaatggctg ggtggaatac tgcgaaataa atataaatca gcttgaagga tgtattttta 1920 gcgcaaagtg atagaatttt ctatgtaaat agtttgtaca ataggattac tactttatat 1980 gcgttatgcg tatacatttc taaagtgtaa ccagtttagc tgggagtaca attttaacac 2040 tcttccatca atcaggttcc agatcagttt tctatctaca atcatgactc cccagtctct 2100 actcctttca agaatgacgc gttatgttcc aagctcccct ggttgatggc ggtaacccga 2160 tatattctag ccaggtcagg tcctagtgtg aggactaaca caggcacgtc cagtatcgta 2220 gcaaatagaa tatcagcata tataagtccc ctttcccgga ccttgctcga gtcagtgact 2280 agcaggtacg tacgtaccca tcagactatc tactatctac tatgtacgga gtatatagtc 2340 ggtacttgac gcaaggcgag tctgatagag ggacaatatg cagttctgta gccaatcaat 2400 cgcggatggc agaccctcga tcgtcattgt ggatctttag cttccttatg ggcggggcgg 2460 tggttatttc agagccattt agccaatcat acatcgtagt ccgaaagtct aggattatat 2520 aggctagacc aatctactgt caaccggtaa agcgggtctc tagtctttat cccgacctcc 2580 tctctttctc tttctccgat tcgaatgtga cacatacatc tgatcaattg ataagaatac 2640 ggattgccgt gtacgtgggc tgacagagct gagataaaat atcctggatg tgatatgtgg 2700 cgcatccagt accgacactg tgacaggatc cgtgtactac aattcattca tcgatcgttg 2760 gctaggcaaa aagtaggcaa ggtttgcaga tcgatatccc ggtacctggc taaaatcgag 2820 acccatctac atatagtact gactcggcgt tcacttat 2858 <210> 38 <211> 1356 <212> DNA <213> Homo sapiens <400> 38 gaagtccagc tcgtcgagtc tggtggtggc ttggtccaac ccggtggatc cttacgtctc 60 tcttgtgcag ctagcggttt caacatcaag gacacctaca tccattgggt tcgtcaagct 120 cctggcaaag gtttggaatg ggttgcgcgt atctacccta cgaacggtta cacccgttat 180 gccgacagcg ttaagggccg tttcaccatt tctgccgaca cttccaagaa caccgcctac 240 ttgcagatga actccttgag agccgaggat actgccgtct actactgcag ccgttgggga 300 ggtgatgggt tctacgccat ggactactgg ggtcaaggca cccttgttac cgttagctcc 360 gccagcacaa agggtccctc cgtcttccct ttggctccct cctccaagtc tacttccggt 420 ggtaccgctg cactgggttg cttggtcaag gactacttcc ctgagcccgt cactgtcagc 480 tggaattctg gcgcattgac ttctggtgtc cacacttttc ccgctgttct ccaatcttcc 540 ggcttgtaca gcctaagcag cgttgtcact gtgccctctt cctccttggg cactcagacc 600 tacatctgca acgtcaacca caagccctcc aacacgaagg ttgacaagaa ggtggaacct 660 cccaagtcct gcgataagac ccacacctgt cctccctgtc ctgctcctga actgttgggt 720 ggaccctcag tgttcttgtt ccctcccaag cccaaggaca ctctcatgat cagccgtact 780 cctgaggtta catgcgtcgt cgtcgatgtc tcccatgagg atcctgaggt caagttcaac 840 tggtacgtcg acggtgtcga ggtccacaat gccaagacca agcctcgtga agaacagtac 900 aactccacct accgcgttgt ttcagtcttg accgtgttgc accaggattg gctgaacggc 960 aaggagtaca agtgcaaggt ctccaacaag gccctgcctg ctcccatcga gaaaaccatc 1020 agtaaggcca aaggtcaacc tcgcgaaccc caggtttaca ccctccctcc ttctcgggac 1080 gaactcacca agaaccaggt ctcgttgact tgccttgtta agggattcta ccctagcgat 1140 attgccgttg agtgggagtc caatggtcag cccgagaaca actacaagac tacccctcct 1200 gttctcgact ctgacggatc tttcttcctc tacagcaagt tgaccgtcga caaaagccgt 1260 tggcagcaag gcaacgtttt ctcctgctct gtcatgcacg aggctctcca caaccactac 1320 acacagaagt ctctgtcctt gtctcctggt aaataa 1356 <210> 39 <211> 1680 <212> DNA <213> Talaromyces cellulolyticus <400> 39 attttcactt ctttcttcgc ctattgattg ggctatgaca aaattaggag agataggttg 60 gacgttgtca agtcaaaatg taccgaacac gatgcgttga tatgctgcac atgtgcctag 120 tatccattcg ttcctattta tattaaattg aaattttctt atccaattac tgagctaaaa 180 catacttcag cactgtaagc gccagcctaa gttatgctat gttagactgt ccggattcgg 240 ctggcactgg cttttgtgat ccccagtatc atgtaaaggt atccgcctgt ttgttagggg 300 gtcttaaatg ttgtataaag tttcttgcta ggctgtttat gcttgataga gaatatatat 360 atatatctag ctgctattaa tatccttgtt tcaatgtctt agacttccaa ggttacctac 420 ccgcgtgcgt ggactaatac aaacaatctc actcaagaca atcttataca aactcggatt 480 ctggtcaatc cgttccttgg ttatattgct aaaaaaacta ggtagcccaa aattccatct 540 caagccgtat aagaactttc aaattcacca tggtactctc acgggcgaag catctccgtc 600 ttccatctgc caaaatccat taccaaaatc ggaagtaccc gaatgtagca aatgaacaat 660 aactttcgca ccatctagcg gatcctttgt gccacgatag ttgttgaacg cagttttgca 720 atacccagga ctaactgctt ggatgataac actctcattc gccgggtctt tcccatattc 780 gaccgtgagc atgttaaggg ccgtctttga ggcgcagtac gcgatagtaa cagttggagg 840 cagcttgcca gatgatgata ggcccaaaga accccgtgtg gatgatacgt ttattatgtg 900 gcctcgaggc gactgacgca aaagtggtag gaatagatct atggtcattg cgaccgatgt 960 gacattcaca tcaaaagttc ggttgtaagt agaccgcatt tcggaaaatg aagtctgggt 1020 gaaggcaacg gcagcattgt ttatcagaac tagacatctg ttagagaatt tctaaagccc 1080 gctcactcga gaatgaaata ggcttaccat ccagtctacc atatgttgtc tcgaccgcct 1140 tagcaaaagc aatgaggcta tcgtcgcgag tcacatcaac ctccataacg tcgatcttgg 1200 attgaacagc gagctctctc aaccgcttaa gtgcctgatt tccgtcttcc ttattccggc 1260 atcctaagat gaagtgatcg gatggactat gcagacttaa agcctggagg gtaccaaacc 1320 cgatgcctga caattattag tgatcatata gaatgagtat catggccatc gcaaatctac 1380 ctctgtttgc tccagttata agaattagcc ttgatgacat cttgtgagag aagtaaaaga 1440 taatagcaga tgaatttcga tcgtatactg gttgtattgg caatcttgac gagaatggtt 1500 tcattgtcag accatcagtt ccctttatat acctgccatt ctctccttta taaataatta 1560 ttcggtttta acacggagat actcggattt catcacacaa attgcatttc ttccgatagt 1620 tgttgaagat cggaagtcct tcgaatgatc atttctataa ctacgcctta ccgttttcgg 1680 <210> 40 <211> 645 <212> DNA <213> Homo sapiens <400> 40 gacatccaga tgacacagtc cccttctagc ctttctgcct ctgttggaga tcgtgtcacc 60 atcacttgtc gtgcttctca agacgtcaac acagccgttg cctggtatca gcagaaaccc 120 ggcaaagctc ccaagttgct gatctacagc gctagcttcc tgtacagcgg tgtcccttct 180 cgcttctcag gttcccgttc tggtaccgac ttcaccttga ccatttccag cttgcaaccc 240 gaggatttcg ccacgtacta ctgccagcaa cactacacca ctcctcccac ctttggccaa 300 ggtaccaagg tcgagatcaa gcggactgtt gccgcacctt ccgtcttcat cttccctccc 360 tcggatgagc agctcaagtc tggaactgcg tctgtcgttt gcttgctcaa caacttctac 420 cctcgtgaag ccaaggtcca gtggaaggtc gacaacgctt tgcagtccgg caatagccaa 480 gagtccgtta ccgaacagga cagcaaggac tccacttact ccttgagttc cactctcacc 540 ttgtccaagg ccgattacga gaagcacaag gtctacgctt gcgaagtgac ccatcaaggt 600 ctctctagcc ctgttactaa gtccttcaac cgtggtgagt gttag 645 <210> 41 <211> 1354 <212> DNA <213> Talaromyces cellulolyticus <400> 41 ctcgtgaaag ctgccctcac aatgatcgtc aagatgacgt agtttgactg ggtcgttcct 60 ggataagggt tagggtaaat agggctcaaa gtaccacgtg agtgtggaaa gataagccct 120 aaccctaagg tcgtgtcgga caaaaattat cacttgacca aaattggaga tccccttaat 180 ggagcttttt ggtaatggtt tgtatagggt tatgtgacgt ccgtatcaca tgatttttat 240 cccaacaggt cgatccccct cttatagtta atggacaaca tataagtacg tagcatctta 300 gatagttcgt cagcgtcaac tgaccaaagt ccccgtgttt cattttaatt tgtcagactg 360 caagagtctc gaaacataaa aagatcgaaa gttttgcctt attaggctat gagcatgaat 420 gtcggaacaa tgccgttgag gctattccca atttcggaaa tatgtatctt cattgctgtc 480 gacttgacga cagtcgataa aaggctcatc cggatagata agccagatca ctcattatgc 540 caatttctcc ggtgtctgaa aacgtatact acatacgtaa ctgatcttcg tggttgaaag 600 agtgtttctt ctcattctca tctgccgatg ccgagccaat tggaacaaac cccgcatatg 660 gtcctgaata tcaatcgcgg agatgcggag agtgagggag caacacaatt ttaaattagt 720 cagttttctc atgttctccg caatcttgca ggcttgggtc tggtaggttt atctctctct 780 tttcacaaca aggttgggcc attgtcagct tagcaagcgc gcagcaaagg gtgtcggtca 840 atgttcatgt cctccgcggt cactacaaaa cagcacgtgg ggaatgttgc tttccctgtt 900 gatgttcatg tgttgtcatt cccggcaaat cgactccaat taatatggta ggctcctgca 960 taatgcaagt ccttgagatg cagcttccgg cagatggacg tatagatcag ggactttgag 1020 gggctaaaac acttacccga gctaaaacat accataattt cgtttaatga ctttcgtctg 1080 gatggcagag gctgaaggtc gattatgagt gaaattggta tgaagccaca tacgccgata 1140 ctgtaacgct gtgccttcat ccgccttcta tcgcgccccg acattccgcg gtaccgcgat 1200 tatgaagaaa aacactcgta atgatgagga gatagttctt agctcttatt atttttgtct 1260 agctatggaa tgcaagttta gcactatata atggtggtgt ttcccttgaa gaattaggca 1320 ctatcaaccg caacagtcag aagcaatcga caca 1354 <210> 42 <211> 26 <212> PRT <213> Talaromyces cellulolyticus <400> 42 Met Ser Ala Leu Asn Ser Phe Asn Met Tyr Lys Ser Ala Leu Ile Leu 1 5 10 15 Gly Ser Leu Leu Ala Thr Ala Gly Ala Gln 20 25 <210> 43 <211> 490 <212> PRT <213> Talaromyces cellulolyticus <400> 43 Met Lys Gly Val Leu Ser Leu Ser Leu Leu Pro Leu Leu Thr Val Ala 1 5 10 15 Ser Pro Val Met Pro Arg Thr Ile His Asn Asp Ala Ala Pro Ile Leu 20 25 30 Ser Ser Ser Asn Ala Val Glu Val Pro Asp Ser Tyr Ile Ile Val Phe 35 40 45 Lys Asp His Val Asp Ser Ala Ser Ala Ala Ala His His Asn Trp Val 50 55 60 Gln Asp Ile His Ser Gln His Thr Glu Leu Arg Lys Arg Ser Gln Phe 65 70 75 80 Pro Phe Ala Asp Asn Ala Phe Ala Gly Leu Lys His Thr Phe Asp Ile 85 90 95 Ala Gly Ser Phe Leu Gly Tyr Ser Gly His Phe Glu Glu Asn Val Ile 100 105 110 Glu Ala Ile Arg Arg His Pro Asp Val Asp Tyr Ile Glu Lys Asp Ser 115 120 125 Leu Val His Thr Met Glu Asp Pro Ala Leu Glu Lys Asn Ala Pro Trp 130 135 140 Gly Leu Ala Arg Ile Ser His Arg Glu Ser Leu Ser Phe Gly Ser Phe 145 150 155 160 Asn Lys Tyr Leu Tyr Ala Ala Asp Gly Gly Glu Gly Val Asp Val Tyr 165 170 175 Val Ile Asp Thr Gly Thr Asn Ile Asp His Val Asp Phe Glu Gly Arg 180 185 190 Ala Ser Trp Gly Lys Thr Ile Pro Thr Asp Asp Glu Asp Val Asp Gly 195 200 205 Asn Gly His Gly Thr His Cys Ser Gly Thr Ile Ala Gly Lys Lys Tyr 210 215 220 Gly Val Ala Lys Lys Ala Asn Val Tyr Ala Val Lys Val Leu Lys Ser 225 230 235 240 Asn Gly Ser Gly Thr Met Ser Asp Val Val Gln Gly Val Glu Trp Ala 245 250 255 Ala Thr Gln His Ile Lys Lys Val Lys Asp Ala Lys Ala Gly Lys Ala 260 265 270 Lys Gly Phe Lys Gly Ser Ala Ala Asn Met Ser Leu Gly Gly Gly Lys 275 280 285 Ser Val Thr Leu Asp Lys Ala Val Asn Ala Ala Val Asp Ala Gly Ile 290 295 300 His Phe Ala Val Ala Ala Gly Asn Asp Asn Ala Asp Ser Cys Asn Tyr 305 310 315 320 Ser Pro Ala Ala Ala Glu Lys Ala Val Thr Val Gly Ala Ser Thr Leu 325 330 335 Ala Asp Glu Arg Ala Tyr Phe Ser Asn Tyr Gly Lys Cys Asn Asp Ile 340 345 350 Phe Ala Pro Gly Leu Asn Ile Leu Ser Thr Trp Ile Gly Ser Lys Tyr 355 360 365 Ala Val Asn Thr Ile Ser Gly Thr Ser Met Ala Ser Pro His Ile Ala 370 375 380 Gly Leu Leu Ala Tyr Phe Leu Ser Leu Gln Pro Ala Ser Asp Ser Ala 385 390 395 400 Phe Ala Val Ala Glu Ile Thr Pro Lys Lys Leu Lys Glu Asn Leu Ile 405 410 415 Ala Ile Gly Thr Gln Gly Ala Leu Thr Asp Val Pro Ser Asp Thr Thr 420 425 430 Asn Ile Leu Ala Trp Asn Gly Gly Gly Ser Ala Asn Tyr Thr Asp Ile 435 440 445 Ile Ala Gln Gly Gly Tyr Lys Thr Lys Thr Leu Ser Asn Glu Val Asp 450 455 460 Glu Leu Ile Asn Lys Leu Glu Val Val Asn Glu Glu Leu Gly Ala Ile 465 470 475 480 Tyr Ser His Ile Lys Asp Ala Ile Ala Ala 485 490 <210> 44 <211> 4509 <212> DNA <213> Talaromyces cellulolyticus <400> 44 atgtcgagaa gaatacggaa ccctgattcc gcaggctcga gtcaaaccct aagtaattca 60 ccggtaccaa tagccgccga atccggcacg gaacctgtgt acctaggtcc gtatcgaata 120 gcgaagtttt ccgtctattc ttcgaatttt gtatacatgc ttaccttggc tcaaaggtac 180 tcacaaagtc cgaagaataa attatagaac cgatgtgaaa cggggacagt ttggcaaccc 240 cttgtactat gtacattgta tggatctcgt ctcgactctc gagacgaggg tttcgtacca 300 accaaagact caaaacttgg ggtaactaag cgatcggctg cgtagtactc catactccat 360 aaataccccg gtgaattcgc ctcttgccca tggaatgagc gagaatttac ccttggagtc 420 atcgcggtaa atgactcaca tatcatgtct gccttcactc tcctcaacct ttgaaattcc 480 ggttaatgtt aaggcgaggt gtcctctacg gaatggcttt gtagatttga gataagacta 540 cgccgtaact taagggatcc acatactcca tattgatagt ctcaggaccg agatagtctg 600 gagtaacccc gtacccaatc aacgtcctca gactcgccac ctggttacaa tatttcggtg 660 cttgtgccga tatacctccg ttgcgtgagc cttgatagcc aacaagaaat gattcaaaat 720 taagatttga gaaaatccgg agtacgcagt gcctgcagtg taaaaaataa tgtatttacc 780 taatgccaat atgtcgatgc caaagtacta ctagcaaaga cactagatat gcagcaaact 840 cgatgtttag gtacatgtaa ccatatcctg gggtcaggta cgaacgccat caattaatct 900 cgtaaactag ctgtcacacg acagtatcat ttgatagttc caatgttcca tgctccccct 960 caaatgtcac tggatgatac gaatttggct gtgacttgaa cagatagacg gaaaacagtc 1020 cgatcattat ccggagtacg catgtacgag atagtctggg gatcctcggc tgccccgatt 1080 ggggttagtg cgggtttcct tatcttgata cgccgtctgg aggcgcaggt gattgttacg 1140 gtgtgttccg tgatagataa gttagacatc cgataataac ctatcttcta gatagacggc 1200 aggtacgtat gtagatagat agatgacaca gtcataagac agttttattt accatacata 1260 gtatagtcat ttgacaaaca cttgatgact atgagcagta agtccagaca agagcataga 1320 ctagaaatga tgtgatcatc aataggtacg gagtcgtacc acccccggat tatcttggct 1380 ggcttagtca cgcccaaaca gacggtgacg gatgagacac aagcaaagag cgacattccg 1440 aagaattctc gtgacggaaa cgagaatgcc gccggcgctg atagggggaa attttatctt 1500 ttccctttct gacattcagt gtttacaata caatacggaa ttacggaacc ccggttttcg 1560 caaccggtgg aattacctaa tgggtgacct gaatttatta gataacgatg aacaatttgt 1620 tggatcttcc gtagatcgat ttggacttga taggtgcttc caaggttgtt gctgctcaca 1680 tggtcgcttg cgttatctgc ctacagaatg aggaagatgt attccgcacg tactccggtc 1740 gcgacagata tgcgacgatt gcaatatgta ctacatagtt agtacataca actctagact 1800 agactctata ttatgtagag tgtaagagaa aaagaaagaa gataacggca gggtctattt 1860 gattgcgcta taatatgcgc cgctgtatgg ttccccagat ctgcgtgaga tatcacctca 1920 tcctatcatc attccaggtc aaagtctcgt catcatgaat tggtattatt acccagtacg 1980 taaaccacgt atcgaggcgt atcggtgtat taaagataga gctactgcat tggctctagt 2040 cctatctttg ccccggaatc cggcccgtgg atgacgatat gatgctgttt gtccttcagc 2100 taaacacgga cgatctctta cagggtgcgg ttaattatta aggatataat tctaatcaac 2160 gactctggct gtgctatatt aacaatgtct tctaagtggt catgatgtgt acgtacttcg 2220 tacacatgct acatgcaatc gagtacgtaa ctccagatct gcgccgtacc cgcgataccc 2280 gggccatcat gcaaatgtaa ccgcttggaa cacgcactgc agtgcataaa agccacagcc 2340 tcgcttccca atccggttta gacgcgtttt gtcttgctgt tttgggagca gccagacccc 2400 acattccact aacccactct ttttcagcgc ttattctcgt aagattcgta cgaaaaatac 2460 atctgcccac actatccacc agctcggcca ctcttcggtg agaacgctgc catgagaaaa 2520 aaatctgcga ctctgcaaca gagtgaggca cggctgaacc gagctgattg tcaccctttg 2580 cccaatgccc agacagccca gacagcccag acagcccaga cagcccagac agcccagaca 2640 gcccagacag ccagtgcttg gttaattttt actaagggta aaaacctaaa aaaaagaaac 2700 gaaaaaaaaa aaaaaaaact tttctttttt gccccccaat cacttggccg acagtcaaag 2760 ggttccccca cacggtactc cgtacttgct acgtacacta actaaagaaa aaatctcctg 2820 attgagtctg tgtctgtctg tcgctgctaa actcggataa ccccccgttc ccgatcaccc 2880 gtcgaaaaga gcagcagcca tttaacattt ttcccctcca ttcctccttc ttggaacttt 2940 ccctccctcc ctcatcctta catctccctg cgtgcgcgcc tgcctgccta cttacactgc 3000 cactccccag attttctttc tcttgtttct tctccagact ttctttcctc ctccacctcg 3060 cctcaccaca ccaccaccac cactcaccac gccaacaaca ccgcactacc actactgctt 3120 caaagatcga tcaggccatt atcaaggagg atcgacgtct tattccatcg accaccctgt 3180 tgatcacctc ggctggagcg ctcgactccc tggcttcctt ccccagctta tttaaacccg 3240 tcacccgcca ggtctcttca catgtcaccg tcatcttcgt cagtgggttt ttccaatctg 3300 ctgaacccac agtcagactc tgtcgagcct acggataaca catcttcacc tgctaccacc 3360 actaccaccg gcacagactc caactcagac aaggaaatgg cgtcctctgt cagtctgctc 3420 ccaccactca tgaagggtgc ccgccccgcc gcggaggaag tgcgacagga cctccctcgt 3480 ccatacaagt gtcctctttg cgatcgtgct ttccatcgtc tagagcacca aactcgtcac 3540 attcgtactc acaccggcga gaaaccccat gcctgccagt ttccaggctg cacgaaacgg 3600 ttcagtcgtt cagatgaatt gactcgtcac tcgcgcattc acaacaaccc caactcgaga 3660 agaagtaaca aagctcagca tattgctgcg gctgcggcgg ccggtcagga ttcgggtatg 3720 cttaacgctg ctgcctcgat gatgcctcct ccaagcaaac ccattactcg ctcggctcca 3780 gtgtctcagg tcggatctcc ggatgtgtct cctccgcact cttacaccaa ctacacctcg 3840 catttgcggg cgggtctggg tccttattca cgcaacagcg accgtgcttc atctggtatg 3900 gatattaatt tgctcgcgac tgctgcttca caagtcgagc gcgatcacta cggaggctcg 3960 tctcgtcatt accctttcag ctctcgatac tcgggtactc ctggacgtct accgtcgctt 4020 tccgcctatg ccatttctca gagcatgagc cggtcgcatt ctcacgagga tgaggacaac 4080 tacggacatc accgggttaa gcgctctcgt cctaactcac caaactcgac tgcgccatcc 4140 tcgcctacat tctctcacga ttcattgtcg cctacccccg atcacactcc tcttgcaacc 4200 ccagcacact cgcctcgttt gcgtccttat ggagccgcag atttgcaatt accttccatc 4260 cgtcatttgt cgttacacca cactcccgca ctcgcaccaa tggagcctca agccgaggga 4320 cctaatgttt acaaccccgg tcagcaccac ggtggaccca gcatcacgga catcatgagc 4380 aggcccgacg gcacccagcg taagcttcct gttccgcaag tacccaaaat cccggtgcag 4440 gacatgttgg caccgaacgg atattcctcc aacactccgt ccgtcaacgg ttccgtgatg 4500 gagttataa 4509 <210> 45 <211> 1323 <212> DNA <213> Homo sapiens <400> 45 caggttcagc tcgttgaaag cggtggtggt gtcgttcaac ccggtcgttc cttgcgtctg 60 gactgcaagg ctagcggtat caccttctct aactctggta tgcattgggt ccgtcaagcc 120 cctggtaagg gccttgagtg ggttgccgtc atttggtacg atggctccaa acgctactat 180 gccgatagcg ttaaaggtcg tttcactatc agccgtgaca actctaagaa caccctcttc 240 ctccagatga actctttgcg tgccgaggat actgcagtct actactgcgc cactaacgac 300 gactactggg gtcagggtac actcgttacg gtcagctctg ccagtacgaa gggtccctcc 360 gtctttccct tggctccctg ttcccgctca acctccgaga gcactgcggc tttgggttgc 420 ttggtgaagg actactttcc cgaacctgtg accgtttcct ggaattccgg tgctttgacc 480 tctggtgtcc acactttccc tgctgttttg cagtctagcg gactctacag cttgtccagc 540 gtcgtcaccg ttccttcctc tagcttgggg accaagacct acacctgcaa cgtcgaccac 600 aagccttcca acacaaaggt tgacaaacgt gtcgagtcca agtacggacc tccttgtccc 660 ccttgtcccg cacctgagtt cttgggaggt ccttctgtgt tcctcttccc tcctaagccc 720 aaagacacct tgatgatctc tcggactcct gaggttactt gcgtcgtcgt tgacgtctct 780 caggaagatc ctgaggtcca gttcaattgg tacgttgatg gcgtcgaggt tcacaacgcc 840 aagactaaac cccgtgaaga gcagttcaac tccacctacc gtgtcgtctc agtcctcacc 900 gtcttgcacc aagactggtt gaacggcaag gagtacaagt gcaaggtcag caacaagggc 960 ttgccttctt ccatcgaaaa gaccatcagc aaggctaagg gccaacctcg tgagccccag 1020 gtgtacactt tacctccctc tcaagaagag atgaccaaga accaggtttc cttgacctgc 1080 ctcgtcaagg gattctaccc ctctgatatt gccgtcgaat gggagtccaa tggccaaccc 1140 gagaacaact acaagacaac tccccctgtt ctggactccg atggtagctt cttcctctac 1200 tcgagactga ccgtcgacaa gtcccgttgg caggaaggca acgttttctc ctgctccgtc 1260 atgcacgaag ccctgcataa ccactacacc caaaagagcc tatccttgtc tcttggtaag 1320 taa 1323 <210> 46 <211> 645 <212> DNA <213> Homo sapiens <400> 46 gaaatcgtcc tcactcagtc ccctgcaacc cttagcttgt ctcccggaga acgtgccact 60 ctcagctgtc gtgccagtca atccgtttcc agctacttgg cttggtacca gcagaaacct 120 ggtcaagcac ctcgtttgct catctacgat gcctccaatc gtgctacagg tattcccgct 180 cgtttctctg gctcaggtag cggtaccgac ttcaccttga ccatcagctc cttagagcct 240 gaggactttg ccgtctacta ctgccaacag tcctctaact ggcctcgcac tttcggtcaa 300 ggcacgaagg tcgagatcaa gcggactgtt gctgctcctt ccgtcttcat cttccccccc 360 tctgatgagc agctgaagtc cggaactgcg tctgtcgtct gtctgctcaa caacttctat 420 ccccgtgaag ccaaggttca gtggaaggtc gacaacgcct tgcagtctgg taactctcag 480 gagagcgtta ccgagcaaga ctccaaggat agcacctact ctttgtcctc cactttgacc 540 ctcagcaaag ccgactacga gaagcacaag gtctacgctt gcgaagttac ccaccaaggc 600 ttgtcttccc ctgtgaccaa gtcgttcaac cgtggtgaat gctag 645 <210> 47 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 47 caggttcagc tcgttgaaag cggtg 25 <210> 48 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 48 agaagtgaaa atttacttac caagagacaa ggatagg 37 <210> 49 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 49 gaaatcgtcc tcactcagtc ccctg 25 <210> 50 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 50 ctcaaagctg atctagcatt caccacggtt gaacgac 37 <210> 51 <211> 507 <212> DNA <213> Homo sapiens <400> 51 tgcaacgaca tgacccctga gcaaatggct acgaatgtca actgttcctc tcctgaacgt 60 catacccgtt cctacgacta catggaaggt ggagatatcc gtgtgagacg tctgttctgt 120 cgcactcaat ggtacttgcg catcgataag cgtggcaaag tcaagggtac acaggagatg 180 aagaacaact acaacatcat ggaaatccgg actgttgcag tcggaatcgt tgccatcaag 240 ggtgtcgaaa gcgagttcta cttggccatg aacaaggaag gcaagttgta cgccaagaaa 300 gagtgcaacg aagactgcaa cttcaaggag ctcatcctcg agaaccacta caacacctat 360 gcttctgcga aatggaccca caatggtggt gagatgtttg tcgccttgaa ccagaagggt 420 attcccgttc gtggcaagaa gaccaagaag gagcagaaga ctgctcactt ccttcccatg 480 gccattaccc accaccatca ccatcac 507 <210> 52 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 52 acagctggtg ctcagtgcaa cgacatgacc cctgagcaaa 40 <210> 53 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 53 ctcaaagctg atctagtgat ggtgatggtg gtgggtaatg 40 <210> 54 <211> 513 <212> DNA <213> Homo sapiens <400> 54 gcccctatgg cagaaggagg tggtcagaat caccacgaag tggtcaagtt catggacgtc 60 taccaacgct cctactgcca tcccattgag acactcgtcg acatcttcca ggagtacccc 120 gatgagatcg agtacatctt caagcctagc tgcgttccct tgatgcgttg tggtggctgt 180 tgcaacgacg aaggcttgga gtgcgttcct actgaggagt ccaacatcac catgcagatc 240 atgcggatta agcctcatca gggtcaacac atcggcgaaa tgagctttct ccagcacaac 300 aagtgcgaat gtcgtcccaa gaaggacaga gctcgtcaag agaacccttg cggtccttgc 360 tctgaacgcc gtaagcacct gttcgtccaa gatccccaga cctgcaagtg ttcctgcaag 420 aacaccgatt ctcgctgtaa agcccgtcag ttggagctta acgagcgtac ttgccgttgc 480 gacaaacctc gtcgtcacca ccatcaccat cac 513 <210> 55 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 55 acagctggtg ctcaggcccc tatggcagaa ggaggtggtc 40 <210> 56 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 56 ctcaaagctg atctagtgat ggtgatggtg gtgacgacga 40 <210> 57 <211> 1587 <212> DNA <213> Talaromyces cellulolyticus <400> 57 atgcgtatgt cagcttcgtt accgctcatc gtcttgtcga tggtgtcggc cagcaatgcg 60 ctctctcttc atagacgtga tgagccagca gttctagcag caccgttaca acgcagacat 120 gtggatggga ttttgggcaa aagagatacg tcgccagttg atgtatcgat cttcaatcac 180 gtacgtacga ggatttcgaa tgcaatattt cctgggacct aacgactgca tagcaaaata 240 caagctactg gctgaacttg actctgggat cacctgcgca gaatttcaca ctcgccttgg 300 acacgggcag cagcgatcta tgggttattg agggatcgaa aaaggcagct aatgtttacg 360 tctcggatga ttcgtcctct ttcaaatctc tggatcttcc atacaacgca acatacgcgg 420 atggcaccac ggctctcggt gtctacgcga ctgacatatt gagcttggga ggtgcaactg 480 tcaaggactt tgagtttatt gttgtgaacc aaacttcatc tgatggtgag atctgacctt 540 atgaaaatat cattgtatct tctgcaaact ttagtggcgt gtgcattcat tctaattcat 600 gattgattgt atacagtggg cattgccggt gtcggctaca acatctcaac atatgcatct 660 tcaggcctga acaaaacata caacaaccta ccttatgcct tggctgccag cggcgtcacc 720 aaatctgctg cttacagcct gtggatggac gatgccgcag caacttcagg cacgattatg 780 tttggtggtg tcaacaaggc aaagtacatc ggtgaactcc aaactctccc agtcgtgcca 840 gtctataaca ggtattactc acttgcactc gccttgaccg aagtcactgt gcaaactggg 900 gactccaaga gtactacgac gaaccttccg ctcgcagttt ctctggatac gggctcaact 960 tccactttgc tgccccaaga cctttttaat gacattctcg gcgctctgaa tggaacctac 1020 gacgagaaga gcggcttcgc ctatgtgagc tgcgacctca tagaaaccga ttacaatgtg 1080 acattcagtt tctctggagc taagatcgac gtgggtctta gtcaactggt atttttcggg 1140 gccgtggctg ggtggcccaa gaacagctgt gttattgatc ttactcccag cgaacctgga 1200 gtgaacatcc ttggagacag tttcctgcgc agtgcgtacg tcgtctatga ccttgagaac 1260 aatgaaattt cccttgccaa caccaacttc aaccccggta aggacgacat tctggaaatc 1320 ggtaccggcg ccgatggggt gccaggtgcc actcttgttc cctcggctgt ctctactgct 1380 acaggaaacg gcgttcagac agcgactacc ggtgtggtgg gtgctaccgg ggtcactgtc 1440 accgctggta ctactgctac cggcagcgca agcaccggcg gttctgcaaa atctactggc 1500 acatcttctg gcatggcagc gttgcccacc ggcaatgcca aacttctttc tggtctggca 1560 ggcgctggtc ttctccttat gatctaa 1587 <210> 58 <211> 2025 <212> DNA <213> Talaromyces cellulolyticus <400> 58 atggaactgt ccccgccggg cttagcgccg aacaggtatc gcatcaccat cggaccaagg 60 taactcccag tcgtgtggcc atccacccat ctgccccaac ttcatctctt catcttcatc 120 ttcatctcat tccggattcc cccagagagg tgtactgtat ctgggataca ctgttcaagg 180 ctttgtgtgc atcagacaca acaattatct tgtaagttgg ttcgtctctg actctccagc 240 tatcgttgag tcaccactga tactgataac gacgtcatct ccagattcga ctgctcgagc 300 catcaacatg aaaggtttgg ctaccacgct cctcgtaggg gctgcggctg ctttttctcc 360 tgctcagcag gtgcttaaag ccccagagga cgttgttgag aacacccaca aggcctcctc 420 tccctctcta gccgagacgc tcgcccagcc tctccatgag ctcaatgaag agctcaagtc 480 gttcactcac gaagccgagg aggtctggga acaagtctca aacatgttcc caggtgctct 540 agataacatc cctttcttct cctcacccaa gaagcacact cgtcgccctg actcacactg 600 ggaccacatc gttcgtggtg ccgacgtcca gaacatctgg gttgagaacg ccaatggcga 660 gaaggaacgt gaagtcggtg gtaggctcga ggcctttgac cttcgtgtca agtctgttga 720 ccccagctcg cttggaatcg atcccgatgt caagcagtac agtgggtacc ttgacgacaa 780 cgagaatgat aagcatttgt tttactgtat gtgcacactt ctatctatcg aaagtatcac 840 tgataactaa caattatagg gttctttgag tcccgaaatg accccaagac tgaccctgtc 900 gtcctctggt tgaacggtgg accaggatgc tcgtccttga ccggtctttt cttcgagctc 960 ggacccagct ctatcggcaa gaacatcaag cccatctaca acccctactc ctggaactcc 1020 aacgcctctg ttatcttcct tgaccagccc gtcaatgtcg gtttctccta cagcggtaac 1080 tccgtcagtg agacgagcgc tgctgcaaag gatgtctatg ctcttcttac tcttttcttc 1140 aagcaattcc ccgaatatgc cactcaggat ttccacattg caggtgaatc ctacgccggc 1200 cactacattc cttcatttgc ctctgagatc ctttctcaca agaagcgcaa catcaacctg 1260 aagtctgttt tgatcggaaa cggtcttact gatggtctca ctcagtacga atactaccgc 1320 cccatggctt gcggtgatgg tggttatcct gctgttctcg atgagagcac ttgccgctcc 1380 atggacaacg ctctcggtcg ctgccagtcc atgattcaat cctgctacga cagtgaaagt 1440 gcttggacct gtgttcctgc ttctatctac tgcaacaacg cccttttggg tccctaccag 1500 cgcactggcc agaatgtata tgatgtccgc aagccttgcg agggcggcaa cctctgctac 1560 actgatctcg aatacatcag cacctatctc aaccaggctg aggtcttgaa ggctgtcgga 1620 gccgaagttg acaacttcga ctcttgcaac tttgacatta accgcaactt ccttttcaag 1680 ggtgactgga tgaaaccatt ccacaagctt gtccctggaa tccttgagga aatccctgtt 1740 ctcatctacg ctggtgacgc cgacttcatc tgcaactggc tgggcaacaa ggcctggtct 1800 gatgctcttg agtggagcgg ccacgaagaa tacgccgcta ctgagcttga agatctcgag 1860 atcgttgaca acaagcacaa gggcaagaag attggtcagg tcaagtcctc tggtaatctc 1920 accttcatgc gcctatttgg cggtggccac atggttccct atgaccagcc cgaggccagt 1980 ctcgagttct tcaaccgctg gatcggtggt gagtggactc agtaa 2025 <210> 59 <211> 1657 <212> DNA <213> Talaromyces cellulolyticus <400> 59 atgtcgctac gcagctgcgc cctgctgggt ctagctgcca gcgcccttgc cgctgagccc 60 aaggtgctgc acatgccaat ggcccgcaac ccaaatgcca accctctcgc caaacgagac 120 tctgcctccg tcaccgtcac aaatgccctg agcgagggta tctactttgt gaacgctaca 180 gttggaacac ccggtcagct ggtgcagttg gtcttggata ctggaagcag tgatgtgtgg 240 ttcttcggtc cgaattcgtg cgacgcgaaa acctctgatt gtctgggtgg aacatgtatg 300 ttttctcctt attctcctta cattccgatg ccatgtggtt ggcacgtgga tgtgcaaatc 360 gtttctgtac taatagttga taatagatga cccctcccaa tcttcgagcg tcttaatctc 420 ccaacctaaa ggccaatttt tcattcaata cggcacaccc ggctcgaatg tcactggtaa 480 ctacatcaaa gacgctttca gcgttggcga agccaaagtc acaaacctca ccatggctta 540 tgctacctac gcggcatacg ttcctaccgg tgtgatgggt attggattcg acaccaacga 600 ggccatcaca gcatatggtg gcaagcccta cccgaatttc gtcgatgttc tcaagtcgga 660 gaacgtcatt agcaccaagg catacagtct gtggttgaac gatctcgagt caagcaccgg 720 aagctgtttg tttggtggat acgataccaa gaaattctcc ggcaacctct tggctgtgcc 780 cattcaaccc gacgagtcgt ctggtgaatt gaccagtatg actgtcgcat ggactgcgct 840 tggtattacg acccaatctg gatcgcaaac aatcacttcc tcgtccttca agtcgcctgc 900 gttgctcgac tccggtacca cattgagtat catacctgat gatatctatg aatcattagt 960 cacgttcttc gatgccacac tagaccaagc aggtgatgca attgtcaaat gcaacctact 1020 cgatgactcg ggcactcttg actttacatt tggcggatcc gacggtccag ttatcaaggt 1080 tcctttctcg gagtttgcgc tacctgcaac taccaccaac ggccagcagg ccaccttcaa 1140 cgatggctcg ttggcttgtt atcttggtct tcaaggaaca ggctcggacc cgacatcaca 1200 ggtccccgtc attctcggcg acactttcct tcgctctgcc tatgttgtgt acgatctcga 1260 caacaagcaa atctctctcg cgcaaaccgt cttcaacgcg acagacagca acgtcgttga 1320 aattacgtct gccagccctg ttgccagtgt cgtgagtggc gtcacagtca cccagactgc 1380 ctctggcaac cccaacgagc tcggtgggcc tactgctact gccgacccga ccggttcagg 1440 cagctcgatc ggttcaggca gttcaggcgg ttctgatctt tccggcagca gcctcaccgt 1500 ctctcttacc cctgccacgg caaccggctc tgcatcgtca tcaacttctt ctcacaaatc 1560 gtcggctaac cccgctcctg ggccagactt tatgagcact gcccttattg ctggagcgtc 1620 tatgttgctg ggaggtgttt tcttcgtcct tcattag 1657 <210> 60 <211> 1053 <212> DNA <213> Talaromyces cellulolyticus <400> 60 atgtgtcaat tcatttccca ttatatactt caaaaagttg ctgagtcacc tgaagtgtct 60 cagcatgcac gagaatcagc agcgaggacg ctgagtatcg acacagaggt acgaaataga 120 aggcccgatc tgcatgctgc aatcgttcag aatcccaacc tcggcaactt gcagtcagtg 180 actgcaagct cgggccgcga acaaccaagt atctcagtgt acgactgtag aaacagctcc 240 aaacttccag gagtccgggt ccgaagcgat gaccagagag tcagagatcg agtcgtcaat 300 aatgcatttg acggcttaca gattgcagac aagttttata gcgatgtttt cgcatacaaa 360 gtccctgatg gttcatggaa tgctcttact ggctcagttc attttcgcga gaactacaac 420 aatgctatgt gggatggaca gcagatgatt tttggtgacg gagacggaga aattttcgat 480 tactttgctg attcactaga cgtaatcgtc cacgaaatta cccatggagt tacccaatac 540 acagcaaatc tgcagtacga aggccaaagc ggagcgttga atgaatctat atcagatgtt 600 tttgcatgta tggccgagca atggtatctt gaccagacag ctgaggatgg ggattggttg 660 ttaggccaaa atctgttccc tgttgcacga aagggatccg cgctgcgttc actaaagaag 720 cccggcacag cttacaacaa tgacaaaatc ctcggcaaag atccccaacc tggccatatg 780 cgtgattata acaacacacg tgacgacaac ggtggtgtac atctcaattc cggcatccca 840 aatcatgcat tttatctcgt tgccactact cttggagggc gttcgtggga tcaagccggt 900 catatatggt tcaaaacttt gaccgactcc cggctcaggc ctacagctac tttcagtgcc 960 tttgctggat tgactgtgga taatgcacag agactttacg gtaacaatgt gggtcaagca 1020 gtaaagaaag cgtgggaagg ggttggtgtc tga 1053 <210> 61 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 61 cggtacccgg ggatcagcaa ccccaccgta atctcaaggt 40 <210> 62 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 62 ccgatctgaa ttgacattcg gatggacttt ttgaaggcca 40 <210> 63 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 63 tcggcgttca cttatgaggt tgacttgata gtcgatcgct 40 <210> 64 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 64 cgactctaga ggatcgttat tgctgttgct gttgtggttg 40 <210> 65 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 65 ccgatctgaa ttgacagata gcgtgagcac actgagcagg 40 <210> 66 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 66 tcggcgttca cttatcaaca cgctacctct tccacagtag 40 <210> 67 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 67 cggtacccgg ggatccgtct gtcaaggttg ggttaatcgt 40 <210> 68 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 68 ccgatctgaa ttgaccgagg cagccaacca taagaactgc 40 <210> 69 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 69 tcggcgttca cttatgcgag ccgtacttgg tttgactact 40 <210> 70 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 70 cgactctaga ggatcaattg catttcttcc ccatcgtcga 40 <210> 71 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 71 cggtacccgg ggatccatag cctcatgacc aatgaccggt 40 <210> 72 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 72 ccgatctgaa ttgacgtcga tgaagtcgtc gggggtatgt 40 <210> 73 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 73 tcggcgttca cttatcggct caatatgcaa taggtgttcc 40 <210> 74 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 74 cgactctaga ggatctaggg ctaaccagca gggtaccgcc 40 <210> 75 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 75 cggtacccgg ggatcccaca ttcacagaag gcactataca 40 <210> 76 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 76 ccgatctgaa ttgaccatca acatctacaa tccgacggtg 40 <210> 77 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 77 tcggcgttca cttatgttgt tggccagaag aaagcataca 40 <210> 78 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 78 cgactctaga ggatcctctc ccgaggcaca acccaaagtg 40 <210> 79 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 79 gtcaattcag atcggctgcc gcctg 25 <210> 80 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 80 ataagtgaac gccgagtcag tacta 25

Claims (16)

  1. 목적 단백질의 제조 방법으로서,
    목적 단백질의 생산능을 갖는 탈라로마이세스 셀룰롤리티쿠스(Talaromyces cellulolyticus)를 배양 배지에서 배양하는 단계를 포함하고,
    상기 탈라로마이세스 셀룰롤리티쿠스가, 비변형주에 비해 YscB 단백질의 활성이 저하되도록 변형되어 있는, 방법.
  2. 제1항에 있어서, 상기 YscB 단백질의 활성이, yscB 유전자의 발현을 저하시키거나 yscB 유전자를 파괴함으로써 저하된, 방법.
  3. 제1항 또는 제2항에 있어서, 상기 YscB 단백질의 활성이, yscB 유전자의 결실에 의해 저하된, 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 YscB 단백질이, 하기 (a), (b), 또는 (c)에 기재된 단백질인, 방법:
    (a) 서열번호 43에 나타내는 아미노산 서열을 포함하는 단백질;
    (b) 서열번호 43에 나타내는 아미노산 서열에 있어서, 1개 내지 10개의 아미노산 잔기의 치환, 결실, 삽입, 및/또는 부가를 포함하는 아미노산 서열을 포함하고, 프로테아제 활성을 갖는 단백질;
    (c) 서열번호 43에 나타내는 아미노산 서열에 대하여 90% 이상의 동일성을 갖는 아미노산 서열을 포함하고, 프로테아제 활성을 갖는 단백질.
  5.  제1항 내지 제4항 중 어느 한 항에 있어서, 상기 탈라로마이세스 셀룰롤리티쿠스가, 비변형주에 비해 CreA 단백질의 활성이 저하하도록 변형되어 있는, 방법.
  6. 제5항에 있어서, 상기 CreA 단백질의 활성이, creA 유전자의 발현을 저하시키거나 creA 유전자를 파괴함으로써 저하된, 방법.
  7. 제5항 또는 제6항에 있어서, 상기 CreA 단백질의 활성이, creA 유전자의 결실에 의해 저하된, 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 탈라로마이세스 셀룰롤리티쿠스가, 탈라로마이세스 셀룰롤리티쿠스 S6-25주(NITE BP-01685)에서 유래하는 변형주인, 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 목적 단백질을 회수하는 단계를 추가로 포함하는, 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 배양에 의해 상기 목적 단백질을 상기 배양 배지 중에 축적하는, 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 목적 단백질이, 탈라로마이세스 셀룰롤리티쿠스에서 기능하는 신호 펩타이드와의 융합 단백질로서 발현하는, 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 목적 단백질이 이종 단백질인, 방법.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 목적 단백질이 인간 유래 단백질인, 방법.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 목적 단백질이 인간 혈청 알부민인, 방법.
  15. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 목적 단백질이 항체 관련 분자인, 방법.
  16. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 목적 단백질이 성장 인자인, 방법.
KR1020207013023A 2017-10-10 2018-10-09 단백질의 제조 방법 KR102620914B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JPJP-P-2017-196538 2017-10-10
JP2017196538 2017-10-10
PCT/JP2018/037542 WO2019073954A1 (ja) 2017-10-10 2018-10-09 タンパク質の製造法

Publications (2)

Publication Number Publication Date
KR20200066340A true KR20200066340A (ko) 2020-06-09
KR102620914B1 KR102620914B1 (ko) 2024-01-05

Family

ID=66100897

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207013023A KR102620914B1 (ko) 2017-10-10 2018-10-09 단백질의 제조 방법

Country Status (7)

Country Link
US (1) US11746342B2 (ko)
EP (1) EP3696274A4 (ko)
JP (1) JP7234932B2 (ko)
KR (1) KR102620914B1 (ko)
CN (1) CN111542615B (ko)
AU (1) AU2018348518B2 (ko)
WO (1) WO2019073954A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE543999C2 (en) * 2020-03-17 2021-10-26 Xbrane Biopharma Ab Dna construct for expressing a novel signal peptide
SE543998C2 (en) * 2020-03-17 2021-10-26 Xbrane Biopharma Ab Dna construct for expressing nivolumab
SE544001C2 (en) * 2020-03-17 2021-10-26 Xbrane Biopharma Ab Novel combination of tis sequences, signal peptide sequences and nucleic acid sequences encoding heavy and light chains of an antibody
SE544000C2 (en) * 2020-03-17 2021-10-26 Xbrane Biopharma Ab Novel combination of tis sequence, signal peptide sequence and nucleic acid sequence encoding a recombinant protein
AU2021289499A1 (en) 2020-06-11 2023-02-02 Ajinomoto Co., Inc. Method for producing protein

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02104279A (ja) 1988-05-04 1990-04-17 Ciba Geigy Ag ポリペプチドの製造における改良
JP2000507106A (ja) 1996-03-27 2000-06-13 ノボ ノルディスク アクティーゼルスカブ アルカリプロテアーゼを欠失した糸状真菌
JP2006512891A (ja) 2002-04-18 2006-04-20 ジェネンコー・インターナショナル・インク 糸状菌における機能性抗体の生産
KR20140114860A (ko) * 2012-01-05 2014-09-29 노파르티스 아게 프로테아제 결핍 사상형 진균 세포들 및 그의 이용방법
KR20160035587A (ko) * 2013-07-10 2016-03-31 노파르티스 아게 복수개의 프로테아제 결핍 사상형 진균 세포들 및 그의 이용방법
JP2016131533A (ja) * 2015-01-20 2016-07-25 味の素株式会社 セルラーゼの製造法
JP2016158599A (ja) 2015-03-04 2016-09-05 味の素株式会社 遺伝子組換え糸状菌、およびそれを用いた、内腔を有する多量体の製造方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8907110D0 (en) 1988-05-04 1989-05-10 Ciba Geigy Ag Improvements in the production of polypeptides
NZ291414A (en) 1994-08-26 1998-05-27 Novo Nordisk As Microbial transglutaminases and methods of production using fungi and dna constructs
ATE248219T1 (de) 1995-01-19 2003-09-15 Novozymes As Transglutaminasen aus oomyzeten
JP4257759B2 (ja) * 1999-07-06 2009-04-22 明治製菓株式会社 新規なプロモーター、及びそれを用いたタンパク質の発現方法
JP4025848B2 (ja) 2001-11-02 2007-12-26 独立行政法人産業技術総合研究所 セルロース原料の分解方法
EP1748077B1 (en) 2004-04-20 2013-02-27 Ajinomoto Co., Inc. Method of producing protein
JP4998991B2 (ja) 2007-04-27 2012-08-15 独立行政法人産業技術総合研究所 セルラーゼの製造方法
JP4986038B2 (ja) 2007-05-07 2012-07-25 独立行政法人産業技術総合研究所 高加水分解活性セルラーゼおよびヘミセルラーゼの製造方法
WO2015093467A1 (ja) * 2013-12-16 2015-06-25 味の素株式会社 セルラーゼ生産微生物
BR112020005799A2 (pt) 2017-09-25 2020-09-24 Ajinomoto Co., Inc. métodos para produzir uma proteína alvo e um dissacarídeo.
AU2021289499A1 (en) * 2020-06-11 2023-02-02 Ajinomoto Co., Inc. Method for producing protein

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02104279A (ja) 1988-05-04 1990-04-17 Ciba Geigy Ag ポリペプチドの製造における改良
JP2000507106A (ja) 1996-03-27 2000-06-13 ノボ ノルディスク アクティーゼルスカブ アルカリプロテアーゼを欠失した糸状真菌
JP2006512891A (ja) 2002-04-18 2006-04-20 ジェネンコー・インターナショナル・インク 糸状菌における機能性抗体の生産
KR20140114860A (ko) * 2012-01-05 2014-09-29 노파르티스 아게 프로테아제 결핍 사상형 진균 세포들 및 그의 이용방법
JP2015512611A (ja) 2012-01-05 2015-04-30 ノバルティス アーゲー プロテアーゼ欠損糸状菌細胞及びその使用方法
KR20160035587A (ko) * 2013-07-10 2016-03-31 노파르티스 아게 복수개의 프로테아제 결핍 사상형 진균 세포들 및 그의 이용방법
JP2016523552A (ja) 2013-07-10 2016-08-12 ノバルティス アーゲー 多重プロテアーゼ欠損糸状菌細胞及びその使用方法
JP2016131533A (ja) * 2015-01-20 2016-07-25 味の素株式会社 セルラーゼの製造法
JP2016158599A (ja) 2015-03-04 2016-09-05 味の素株式会社 遺伝子組換え糸状菌、およびそれを用いた、内腔を有する多量体の製造方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
비특허문헌 1: [Inoue H, et al., Construction of a starch-inducible homologous expression system to produce cellulolytic enzymes from Acremonium cellulolyticus. J Ind Microbiol Biotechnol. 2013 Aug; 40(8): 823-30].

Also Published As

Publication number Publication date
AU2018348518B2 (en) 2024-05-16
JPWO2019073954A1 (ja) 2020-11-05
US20200255869A1 (en) 2020-08-13
JP7234932B2 (ja) 2023-03-08
EP3696274A4 (en) 2021-07-28
US11746342B2 (en) 2023-09-05
AU2018348518A1 (en) 2020-04-30
CN111542615B (zh) 2023-11-17
KR102620914B1 (ko) 2024-01-05
EP3696274A1 (en) 2020-08-19
CN111542615A (zh) 2020-08-14
WO2019073954A1 (ja) 2019-04-18

Similar Documents

Publication Publication Date Title
KR102620914B1 (ko) 단백질의 제조 방법
KR20170085129A (ko) 펩티드 생산용 융합 파트너
US11384379B2 (en) Method for producing a protein and disaccharide using a Talaromyces cellulolyticus
US10894809B2 (en) Secretory production method for protein
Bae et al. A novel fusion partner for enhanced secretion of recombinant proteins in Saccharomyces cerevisiae
JP5662363B2 (ja) 難発現性タンパク質の分泌のためのタンパク質融合因子(tfp)を明らかにする方法、タンパク質融合因子(tfp)ライブラリーを製造する方法、及び難発現性タンパク質の組み換え的生産方法
AU2016256579B2 (en) Uncoupling growth and protein production
US20230212503A1 (en) Method for Producing Protein
EP4368722A1 (en) Method for secretory production of unnatural-amino-acid-containing protein
JP2021532775A (ja) タンパク質生産性が強化された表現型を含む突然変異及び遺伝子改変糸状菌株並びにそれらの方法

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right