JP7246102B2 - Modified strain for producing recombinant silk - Google Patents

Modified strain for producing recombinant silk Download PDF

Info

Publication number
JP7246102B2
JP7246102B2 JP2020519030A JP2020519030A JP7246102B2 JP 7246102 B2 JP7246102 B2 JP 7246102B2 JP 2020519030 A JP2020519030 A JP 2020519030A JP 2020519030 A JP2020519030 A JP 2020519030A JP 7246102 B2 JP7246102 B2 JP 7246102B2
Authority
JP
Japan
Prior art keywords
yps1
seq
microorganism
gene
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020519030A
Other languages
Japanese (ja)
Other versions
JP2021503275A (en
Inventor
マシュー スコット ガムボア
ジョシュア タイラー キトルソン
Original Assignee
ボルト スレッズ インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ボルト スレッズ インコーポレイテッド filed Critical ボルト スレッズ インコーポレイテッド
Publication of JP2021503275A publication Critical patent/JP2021503275A/en
Application granted granted Critical
Publication of JP7246102B2 publication Critical patent/JP7246102B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/16Yeasts; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/43504Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
    • C07K14/43513Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae
    • C07K14/43518Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae from spiders
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/58Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/23Aspartic endopeptidases (3.4.23)
    • C12Y304/23041Yapsin 1 (3.4.23.41)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Insects & Arthropods (AREA)
  • Biophysics (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Botany (AREA)
  • Virology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Description

発明の分野
本開示は、細胞からのタンパク質もしくは代謝物を産生させるかまたは産生を増強させるための株最適化の方法に関する。本開示はまた、それらの方法から得られる組成物にも関する。特に、本開示は、酵母細胞により発現された組換えタンパク質の分解が抑制されるよう選択または遺伝子操作された酵母細胞、及び有用な化合物を製造するための酵母細胞培養方法に関する。
FIELD OF THE INVENTION The present disclosure relates to methods of strain optimization for producing or enhancing production of proteins or metabolites from cells. The disclosure also relates to compositions resulting from those methods. In particular, the present disclosure relates to yeast cells selected or genetically engineered to inhibit degradation of recombinant proteins expressed by the yeast cells, and yeast cell culture methods for producing useful compounds.

発明の背景
メチロトローフ酵母ピキア・パストリス(Pichia pastoris)は組換えタンパク質の産生に広く使用されている。P.pastorisは高い細胞密度に生育し、厳密に制御されたメタノール誘導性の導入遺伝子発現を提供し、合成培地中に異種タンパク質を効率的に分泌する。
BACKGROUND OF THE INVENTION The methylotrophic yeast Pichia pastoris is widely used for the production of recombinant proteins. P. pastoris grows to high cell densities, provides tightly regulated methanol-inducible transgene expression, and efficiently secretes heterologous proteins into defined media.

しかしながら、P.pastoris株の培養中、組換えにより発現させたタンパク質は回収可能となる前に分解されることがあり、組換えにより発現させたタンパク質の断片と低収量の完全長組換えタンパク質とが含まれたタンパク質混合物を生じさせる。したがって、P.pastorisにおけるタンパク質分解を減弱させる手段及び人工操作された株が必要とされている。 However, P.I. During cultivation of strains pastoris, the recombinantly expressed protein was sometimes degraded before it could be recovered, and included fragments of the recombinantly expressed protein and low yields of full-length recombinant protein. Form a protein mixture. Therefore, P.I. There is a need for means and engineered strains to attenuate proteolysis in S. pastoris.

いくつかの実施形態では、本明細書では、YPS1-1プロテアーゼ及びYPS1-2プロテアーゼの活性を減弱または消失させてあるPichia pastorisという微生物を提供し、ここで、前記微生物は組換えポリペプチドを発現する。 In some embodiments, provided herein is a microorganism of Pichia pastoris having reduced or eliminated activity of YPS1-1 protease and YPS1-2 protease, wherein said microorganism expresses a recombinant polypeptide. do.

いくつかの実施形態では、YPS1-1プロテアーゼは、SEQ ID NO:67と少なくとも95%同一なポリペプチド配列を含む。いくつかの実施形態では、YPS1-1プロテアーゼはSEQ ID NO:67を含む。いくつかの実施形態では、YPS1-1プロテアーゼはYPS1-1遺伝子によりコードされる。いくつかの実施形態では、YPS1-1遺伝子は、SEQ ID NO:1と少なくとも95%同一なポリヌクレオチド配列を含む。いくつかの実施形態では、YPS1-1遺伝子は、SEQ ID NO:1の少なくとも15、20、25、30、40、または50連続するヌクレオチドを含む。いくつかの実施形態では、YPS1-1遺伝子はSEQ ID NO:1を含む。いくつかの実施形態では、YPS1-1遺伝子は前記微生物の遺伝子座PAS_chr4_0584にある。 In some embodiments, the YPS1-1 protease comprises a polypeptide sequence that is at least 95% identical to SEQ ID NO:67. In some embodiments, the YPS1-1 protease comprises SEQ ID NO:67. In some embodiments, the YPS1-1 protease is encoded by the YPS1-1 gene. In some embodiments, the YPS1-1 gene comprises a polynucleotide sequence that is at least 95% identical to SEQ ID NO:1. In some embodiments, the YPS1-1 gene comprises at least 15, 20, 25, 30, 40, or 50 contiguous nucleotides of SEQ ID NO:1. In some embodiments, the YPS1-1 gene comprises SEQ ID NO:1. In some embodiments, the YPS1-1 gene is at locus PAS_chr4_0584 of said microorganism.

いくつかの実施形態では、YPS1-2プロテアーゼは、SEQ ID NO:68と少なくとも95%同一なポリペプチド配列を含む。いくつかの実施形態では、YPS1-2プロテアーゼはSEQ ID NO:68を含む。いくつかの実施形態では、YPS1-2プロテアーゼはYPS1-2遺伝子によりコードされる。いくつかの実施形態では、YPS1-2遺伝子は、SEQ ID NO:2と少なくとも95%同一なポリヌクレオチド配列を含む。いくつかの実施形態では、YPS1-2遺伝子は、SEQ ID NO:2の少なくとも15、20、25、30、40、または50連続するヌクレオチドを含む。いくつかの実施形態では、YPS1-2遺伝子はSEQ ID NO:2を含む。いくつかの実施形態では、YPS1-2遺伝子は前記微生物の遺伝子座PAS_chr3_1157にある。 In some embodiments, the YPS1-2 protease comprises a polypeptide sequence that is at least 95% identical to SEQ ID NO:68. In some embodiments, the YPS1-2 protease comprises SEQ ID NO:68. In some embodiments, the YPS1-2 protease is encoded by the YPS1-2 gene. In some embodiments, the YPS1-2 gene comprises a polynucleotide sequence that is at least 95% identical to SEQ ID NO:2. In some embodiments, the YPS1-2 gene comprises at least 15, 20, 25, 30, 40, or 50 contiguous nucleotides of SEQ ID NO:2. In some embodiments, the YPS1-2 gene comprises SEQ ID NO:2. In some embodiments, the YPS1-2 gene is at locus PAS_chr3 — 1157 of said microorganism.

いくつかの実施形態では、YPS1-1遺伝子または前記YPS1-2遺伝子、またはその両方を変異またはノックアウトさせてある。 In some embodiments, the YPS1-1 gene or said YPS1-2 gene, or both, have been mutated or knocked out.

いくつかの実施形態では、微生物は組換えタンパク質を発現する。いくつかの実施形態では、組換えタンパク質は、絹タンパク質由来の少なくとも1つのブロックポリペプチド配列を含む。いくつかの実施形態では、組換えタンパク質は絹様ポリペプチドを含む。いくつかの実施形態では、絹様ポリペプチドは、1つ以上の反復配列{GGY-[GPG-Xn1-GPS-(A)n2n3 (SEQ ID NO: 514)を含み、ここで、X=SGGQQ(SEQ ID NO: 515)またはGAGQQ(SEQ ID NO: 516)またはGQGPY(SEQ ID NO: 517)またはAGQQ(SEQ ID NO: 518)またはSQであり、n1は4~8であり、n2は6~20であり、n3は2~20である。いくつかの実施形態では、絹様ポリペプチドは、SEQ ID NO:462によりコードされるポリペプチド配列を含む。
In some embodiments, the microorganism expresses the recombinant protein. In some embodiments, the recombinant protein comprises at least one block polypeptide sequence derived from silk protein. In some embodiments, the recombinant protein comprises a silk-like polypeptide. In some embodiments, the silk-like polypeptide comprises one or more repeat sequences {GGY-[GPG-X 1 ] n1 -GPS-(A) n2 } n3 (SEQ ID NO: 514) , wherein , X 1 = SGGQQ (SEQ ID NO: 515) or GAGQQ (SEQ ID NO: 516) or GQGPY (SEQ ID NO: 517) or AGQQ (SEQ ID NO: 518) or SQ and n1 is 4 to 8 Yes, n2 is 6-20 and n3 is 2-20. In some embodiments, the silk-like polypeptide comprises a polypeptide sequence encoded by SEQ ID NO:462.

いくつかの実施形態では、微生物の1つ以上のさらなるプロテアーゼの活性を減弱または消失させてある。いくつかの実施形態では、1つ以上のさらなるプロテアーゼは、YPS1-5、MCK7、またはYPS1-3を含む。 In some embodiments, the activity of one or more additional proteases of the microorganism is attenuated or eliminated. In some embodiments, the one or more additional proteases comprise YPS1-5, MCK7, or YPS1-3.

いくつかの実施形態では、YPS1-5遺伝子は前記微生物の遺伝子座PAS_chr3_0688にある。 In some embodiments, the YPS1-5 gene is at locus PAS_chr3_0688 of said microorganism.

いくつかの実施形態では、MCK7プロテアーゼは、SEQ ID NO:7と少なくとも95%同一なポリヌクレオチド配列を含むMCK7遺伝子によりコードされる。いくつかの実施形態では、MCK7遺伝子は、SEQ ID NO:7の少なくとも15、20、25、30、40、または50連続するヌクレオチドを含む。いくつかの実施形態では、MCK7遺伝子はSEQ ID NO:7を含む。いくつかの実施形態では、MCK7遺伝子は前記微生物の遺伝子座PAS_chr1-1_0379にある。 In some embodiments, the MCK7 protease is encoded by a MCK7 gene comprising a polynucleotide sequence that is at least 95% identical to SEQ ID NO:7. In some embodiments, the MCK7 gene comprises at least 15, 20, 25, 30, 40, or 50 contiguous nucleotides of SEQ ID NO:7. In some embodiments, the MCK7 gene comprises SEQ ID NO:7. In some embodiments, the MCK7 gene is at locus PAS_chr1-1 — 0379 of said microorganism.

いくつかの実施形態では、YPS1-3プロテアーゼは、SEQ ID NO:3と少なくとも95%同一なポリヌクレオチド配列を含むYPS1-3遺伝子によりコードされる。いくつかの実施形態では、YPS1-3遺伝子は、SEQ ID NO:3の少なくとも15、20、25、30、40、または50連続するヌクレオチドを含む。いくつかの実施形態では、YPS1-3遺伝子はSEQ ID NO:3を含む。いくつかの実施形態では、YPS1-3遺伝子は前記微生物の遺伝子座PAS_chr3_0299にある。 In some embodiments, the YPS1-3 protease is encoded by a YPS1-3 gene comprising a polynucleotide sequence that is at least 95% identical to SEQ ID NO:3. In some embodiments, the YPS1-3 gene comprises at least 15, 20, 25, 30, 40, or 50 contiguous nucleotides of SEQ ID NO:3. In some embodiments, the YPS1-3 gene comprises SEQ ID NO:3. In some embodiments, the YPS1-3 gene is at locus PAS_chr3_0299 of said microorganism.

いくつかの実施形態では、1つ以上のさらなるプロテアーゼは、SEQ ID NO:68~130からなる群から選択されるポリペプチド配列と少なくとも95%同一なポリペプチド配列を含む。いくつかの実施形態では、1つ以上のさらなるプロテアーゼは、SEQ ID NO:68~130からなる群から選択されるポリペプチド配列を含む。いくつかの実施形態では、1つ以上のさらなるプロテアーゼは、SEQ ID NO:3~66からなる群から選択されるポリヌクレオチド配列と少なくとも95%同一なポリヌクレオチド配列によりコードされる。いくつかの実施形態では、1つ以上のさらなるプロテアーゼは、SEQ ID NO:3~66からなる群から選択されるポリヌクレオチド配列の少なくとも15、20、25、30、40、または50連続するヌクレオチドを含むポリヌクレオチド配列によりコードされる。 In some embodiments, the one or more additional proteases comprise a polypeptide sequence that is at least 95% identical to a polypeptide sequence selected from the group consisting of SEQ ID NOs:68-130. In some embodiments, the one or more additional proteases comprise a polypeptide sequence selected from the group consisting of SEQ ID NOs:68-130. In some embodiments, one or more additional proteases are encoded by a polynucleotide sequence that is at least 95% identical to a polynucleotide sequence selected from the group consisting of SEQ ID NOs: 3-66. In some embodiments, the one or more additional proteases comprise at least 15, 20, 25, 30, 40, or 50 contiguous nucleotides of a polynucleotide sequence selected from the group consisting of SEQ ID NOs: 3-66. encoded by a polynucleotide sequence comprising

いくつかの実施形態では、微生物は、3X、4Xまたは5Xのプロテアーゼノックアウトを含む。 In some embodiments, the microorganism comprises a 3X, 4X or 5X protease knockout.

また本明細書では、本発明のいくつかの実施形態に従って、SEQ ID NO:1を含むYPS1-1遺伝子及びSEQ ID NO:2を含むYPS1-2遺伝子を変異または欠失させることによって低下させたYPS1-1とYPS1-2の活性を含む、Pichia pastorisの改変微生物も提供し、ここで、前記微生物はさらに、SEQ ID NO:462によりコードされるポリペプチド配列を含む、組換えにより発現させたタンパク質を含む。 Also herein, according to some embodiments of the present invention, the YPS1-1 gene comprising SEQ ID NO: 1 and the YPS1-2 gene comprising SEQ ID NO:2 were reduced by mutation or deletion. Also provided is a modified microorganism of Pichia pastoris comprising the activity of YPS1-1 and YPS1-2, wherein said microorganism further comprises a recombinantly expressed polypeptide sequence encoded by SEQ ID NO:462. Contains protein.

いくつかの実施形態では、本明細書により、本明細書に記載のように、プロテアーゼが減弱された微生物を含む細胞培養物も提供される。 Also provided herein, in some embodiments, is a cell culture comprising a protease-attenuated microorganism as described herein.

また、本明細書では、いくつかの実施形態に従って、本明細書に記載のようにYPS1-1及びYPS1-2の活性を減弱または消失させてある微生物を含む細胞培養物も提供し、ここで、かかる微生物は組換えによりタンパク質を発現し、前記組換えにより発現させたタンパク質は、YPS1-1及びYPS1-2の活性を減弱または消失させていない点以外は同一なPichia pastoris微生物を含む細胞培養物よりも分解が少ない。 Also provided herein, according to some embodiments, is a cell culture comprising a microorganism having attenuated or abolished activity of YPS1-1 and YPS1-2 as described herein, wherein A cell culture comprising a Pichia pastoris microorganism identical except that said microorganism recombinantly expresses a protein, and said recombinantly expressed protein does not attenuate or eliminate the activity of YPS1-1 and YPS1-2. It decomposes less than material.

いくつかの実施形態では、本明細書により、分解が抑制された組換えタンパク質を生産する方法が提供され、これは、本明細書に記載のようにYPS1-1及びYPS1-2の活性を減弱または消失させてある微生物を、組換え発現タンパク質の発現に好適な条件下、培地中で培養すること、及び微生物または培地から組換えタンパク質を単離することを含む。 In some embodiments, provided herein are methods of producing a recombinant protein with reduced degradation, which attenuates the activity of YPS1-1 and YPS1-2 as described herein. or culturing the inactivated microorganism in culture medium under conditions suitable for expression of the recombinantly expressed protein and isolating the recombinant protein from the microorganism or culture medium.

いくつかの実施形態では、組換えタンパク質は前記微生物から分泌され、ここで、前記組換えタンパク質の単離は、前記分泌された組換えタンパク質を含む培地を回収することを含む。いくつかの実施形態では、組換えタンパク質は、前記YPS1-1及び前記YPS1-2プロテアーゼ活性を減弱または消失させてない点以外は同一な微生物により産生された前記組換えタンパク質と比較して分解レベルが低い。 In some embodiments, the recombinant protein is secreted from said microorganism, wherein isolating said recombinant protein comprises collecting medium containing said secreted recombinant protein. In some embodiments, the recombinant protein has a level of degradation compared to said recombinant protein produced by the same microorganism except that said YPS1-1 and said YPS1-2 protease activities are not attenuated or abolished. is low.

また、本明細書では、組換えにより発現させたタンパク質の分解が抑制されるようPichia pastorisを改変する方法も提供し、これは、YPS1-1タンパク質及びYPS1-2タンパク質をコードする遺伝子をノックアウトまたは変異させることを含む。いくつかの実施形態では、組換えにより発現させたタンパク質の分解が抑制されるようPichia pastorisを改変する方法はさらに、YPS1-3タンパク質、YPS1-5タンパク質、またはMCK7タンパク質をコードする1つ以上のさらなる遺伝子をノックアウトまたは変異させることを含む。いくつかの実施形態では、組換えにより発現させたタンパク質の分解が抑制されるようPichia pastorisを改変する方法はさらに、SEQ ID NO:68~130からなる群から選択されるポリペプチドを含むタンパク質をコードする1つ以上の遺伝子をノックアウトさせることを含む。 Also provided herein are methods of modifying Pichia pastoris to inhibit the degradation of recombinantly expressed proteins by knocking out or modifying the genes encoding the YPS1-1 and YPS1-2 proteins. Including mutating. In some embodiments, the method of modifying Pichia pastoris to inhibit degradation of a recombinantly expressed protein further comprises one or more Including knocking out or mutating additional genes. In some embodiments, the method of modifying Pichia pastoris to inhibit degradation of a recombinantly expressed protein further comprises a protein comprising a polypeptide selected from the group consisting of SEQ ID NOs: 68-130. Including knocking out one or more of the encoding genes.

いくつかの実施形態では、組換えにより発現させたタンパク質は、少なくとも2、3、4、5、6、7、8、9、または10連続するアラニン残基を含むポリA配列(SEQ ID NO: 519)を含む。いくつかの実施形態では、組換えにより発現させたタンパク質は絹様ポリペプチドを含む。いくつかの実施形態では、絹様ポリペプチドは、1つ以上の反復配列{GGY-[GPG-Xn1-GPS-(A)n2n3 (SEQ ID NO: 514)を含み、ここで、X=SGGQQ(SEQ ID NO: 515)またはGAGQQ(SEQ ID NO: 516)またはGQGPY(SEQ ID NO: 517)またはAGQQ(SEQ ID NO: 518)またはSQであり、n1は4~8であり、n2は6~20であり、n3は2~20である。いくつかの実施形態では、組換えにより発現させたタンパク質は、SEQ ID NO:462によりコードされるポリペプチド配列を含む。
[本発明1001]
YPS1-1プロテアーゼ及びYPS1-2プロテアーゼの活性を減弱または消失させてあるピキア・パストリス(Pichia pastoris)微生物であって、組換えポリペプチドを発現する、前記微生物。
[本発明1002]
前記YPS1-1プロテアーゼは、SEQ ID NO:67と少なくとも95%同一なポリペプチド配列を含む、本発明1001の微生物。
[本発明1003]
前記YPS1-1プロテアーゼはSEQ ID NO:67を含む、本発明1001の微生物。
[本発明1004]
前記YPS1-1プロテアーゼはYPS1-1遺伝子によりコードされる、本発明1001または本発明1002の微生物。
[本発明1005]
前記YPS1-1遺伝子は、SEQ ID NO:1と少なくとも95%同一なポリヌクレオチド配列を含む、本発明1004の微生物。
[本発明1006]
前記YPS1-1遺伝子は、SEQ ID NO:1の少なくとも15、20、25、30、40、または50連続するヌクレオチドを含む、本発明1004の微生物。
[本発明1007]
前記YPS1-1遺伝子はSEQ ID NO:1を含む、本発明1004の微生物。
[本発明1008]
前記YPS1-1遺伝子は前記微生物の遺伝子座PAS_chr4_0584にある、本発明1004の微生物。
[本発明1009]
前記YPS1-2プロテアーゼは、SEQ ID NO:68と少なくとも95%同一なポリペプチド配列を含む、先行本発明のいずれかの微生物。
[本発明1010]
前記YPS1-2プロテアーゼはSEQ ID NO:68を含む、本発明1009の微生物。
[本発明1011]
前記YPS1-2プロテアーゼはYPS1-2遺伝子によりコードされる、先行本発明のいずれかの微生物。
[本発明1012]
前記YPS1-2遺伝子は、SEQ ID NO:2と少なくとも95%同一なポリヌクレオチド配列を含む、本発明1011の微生物。
[本発明1013]
前記YPS1-2遺伝子は、SEQ ID NO:2の少なくとも15、20、25、30、40、または50連続するヌクレオチドを含む、本発明1011の微生物。
[本発明1014]
前記YPS1-2遺伝子はSEQ ID NO:2を含む、本発明1011の微生物。
[本発明1015]
前記YPS1-2遺伝子は前記微生物の遺伝子座PAS_chr3_1157にある、本発明1011の微生物。
[本発明1016]
前記YPS1-1遺伝子または前記YPS1-2遺伝子またはその両方を変異またはノックアウトさせてある、先行本発明のいずれかの微生物。
[本発明1017]
組換えタンパク質を発現する、先行本発明のいずれかの微生物。
[本発明1018]
前記組換えタンパク質は、絹タンパク質由来の少なくとも1つのブロックポリペプチド配列を含む、本発明1017の微生物。
[本発明1019]
前記組換えタンパク質は絹様ポリペプチドを含む、本発明1017の微生物。
[本発明1020]
前記絹様ポリペプチドは、1つ以上の反復配列{GGY-[GPG-X 1 n1 -GPS-(A) n2 n3 を含み、ここで、
X1=SGGQQまたはGAGQQまたはGQGPYまたはAGQQまたはSQであり、
n1は4~8であり、
n2は6~20であり、かつ
n3は2~20である、
本発明1019の微生物。
[本発明1021]
前記絹様ポリペプチドは、SEQ ID NO:462によりコードされるポリペプチド配列を含む、本発明1019の微生物。
[本発明1022]
1つ以上のさらなるプロテアーゼの活性を減弱または消失させてある、先行本発明のいずれかの微生物。
[本発明1023]
前記1つ以上のさらなるプロテアーゼは、YPS1-5、MCK7、またはYPS1-3を含む、本発明1022の微生物。
[本発明1024]
前記YPS1-5遺伝子は前記微生物の遺伝子座PAS_chr3_0688にある、本発明1023の微生物。
[本発明1025]
前記MCK7プロテアーゼは、SEQ ID NO:7と少なくとも95%同一なポリヌクレオチド配列を含むMCK7遺伝子によりコードされる、本発明1023の微生物。
[本発明1026]
前記MCK7遺伝子は、SEQ ID NO:7の少なくとも15、20、25、30、40、または50連続するヌクレオチドを含む、本発明1023の微生物。
[本発明1027]
前記MCK7遺伝子はSEQ ID NO:7を含む、本発明1023の微生物。
[本発明1028]
前記MCK7遺伝子は前記微生物の遺伝子座PAS_chr1-1_0379にある、本発明1023の微生物。
[本発明1029]
前記YPS1-3プロテアーゼは、SEQ ID NO:3と少なくとも95%同一なポリヌクレオチド配列を含むYPS1-3遺伝子によりコードされる、本発明1023の微生物。
[本発明1030]
前記YPS1-3遺伝子は、SEQ ID NO:3の少なくとも15、20、25、30、40、または50連続するヌクレオチドを含む、本発明1023の微生物。
[本発明1031]
前記YPS1-3遺伝子はSEQ ID NO:3を含む、本発明1023の微生物。
[本発明1032]
前記YPS1-3遺伝子は前記微生物の遺伝子座PAS_chr3_0299にある、本発明1023の微生物。
[本発明1033]
前記1つ以上のさらなるプロテアーゼは、SEQ ID NO:68~130からなる群から選択されるポリペプチド配列と少なくとも95%同一なポリペプチド配列を含む、本発明1022の微生物。
[本発明1034]
前記1つ以上のさらなるプロテアーゼは、SEQ ID NO:68~130からなる群から選択されるポリペプチド配列を含む、本発明1022の微生物。
[本発明1035]
前記1つ以上のさらなるプロテアーゼは、SEQ ID NO:3~66からなる群から選択されるポリヌクレオチド配列と少なくとも95%同一なポリヌクレオチド配列によりコードされる、本発明1022の微生物。
[本発明1036]
前記1つ以上のさらなるプロテアーゼは、SEQ ID NO:3~66からなる群から選択されるポリヌクレオチド配列の少なくとも15、20、25、30、40、または50連続するヌクレオチドを含むポリヌクレオチド配列によりコードされる、本発明1022の微生物。
[本発明1037]
前記微生物は、3X、4Xまたは5Xのプロテアーゼノックアウトを含む、本発明1022~1036のいずれかの微生物。
[本発明1038]
SEQ ID NO:1を含むYPS1-1遺伝子とSEQ ID NO:2を含むYPS1-2遺伝子とを変異または欠失させることによって低下させた前記YPS1-1及び前記YPS1-2の活性を含む、Pichia pastorisの改変微生物であって、
さらに、SEQ ID NO:462によりコードされるポリペプチド配列を含む組換え発現タンパク質を含む、前記微生物。
[本発明1039]
本発明1001~1038のいずれかの微生物を含む、細胞培養物。
[本発明1040]
本発明1017~1038のいずれかの微生物を含む細胞培養物であって、
前記組換え発現タンパク質は、YPS1-1及びYPS1-2の活性を減弱または消失させていない点以外は同一なPichia pastoris微生物を含む細胞培養よりも、分解が少ない、前記細胞培養物。
[本発明1041]
本発明1017~1037のいずれかの微生物を、前記組換え発現タンパク質の発現に好適な条件下で、培地で培養すること、及び
前記微生物または前記培地から前記組換えタンパク質を単離すること
を含む、分解が抑制された組換えタンパク質を生産する方法。
[本発明1042]
前記組換えタンパク質は前記微生物から分泌され、かつ、前記組換えタンパク質の単離は、前記分泌された組換えタンパク質を含む培地を回収することを含む、本発明1041の方法。
[本発明1043]
前記組換えタンパク質は、前記YPS1-1及び前記YPS1-2プロテアーゼ活性を減弱または消失させてない点以外は同一な微生物により産生された前記組換えタンパク質と比較して、分解レベルが低い、本発明1041の方法。
[本発明1044]
組換え発現タンパク質の分解が抑制されるようにPichia pastorisを改変する方法であって、
YPS1-1タンパク質及びYPS1-2タンパク質をコードする遺伝子をノックアウトまたは変異させることを含む、前記方法。
[本発明1045]
YPS1-3タンパク質、YPS1-5タンパク質、またはMCK7タンパク質をコードする1つ以上のさらなる遺伝子をノックアウトまたは変異させることをさらに含む、本発明1044の方法。
[本発明1046]
SEQ ID NO:68~130からなる群から選択されるポリペプチドを含むタンパク質をコードする1つ以上の遺伝子をノックアウトさせることをさらに含む、本発明1044の方法。
[本発明1047]
前記組換え発現タンパク質は、少なくとも2、3、4、5、6、7、8、9、または10連続するアラニン残基を含むポリA配列を含む、本発明1044の方法。
[本発明1048]
前記組換え発現タンパク質は絹様ポリペプチドを含む、本発明1044の方法。
[本発明1049]
前記絹様ポリペプチドは、1つ以上の反復配列{GGY-[GPG-X 1 n1 -GPS-(A) n2 n3 を含み、ここで、
1 =SGGQQまたはGAGQQまたはGQGPYまたはAGQQまたはSQであり、
n1は4~8であり、
n2は6~20であり、かつ
n3は2~20である、
本発明1048の方法。
[本発明1050]
前記組換え発現タンパク質は、SEQ ID NO:462によりコードされるポリペプチド配列を含む、本発明1044の方法。
In some embodiments, the recombinantly expressed protein comprises a poly A sequence (SEQ ID NO: 519) . In some embodiments, the recombinantly expressed protein comprises a silk-like polypeptide. In some embodiments, the silk-like polypeptide comprises one or more repeat sequences {GGY-[GPG-X 1 ] n1 -GPS-(A) n2 } n3 (SEQ ID NO: 514) , wherein , X 1 = SGGQQ (SEQ ID NO: 515) or GAGQQ (SEQ ID NO: 516) or GQGPY (SEQ ID NO: 517) or AGQQ (SEQ ID NO: 518) or SQ and n1 is 4 to 8 Yes, n2 is 6-20 and n3 is 2-20. In some embodiments, the recombinantly expressed protein comprises a polypeptide sequence encoded by SEQ ID NO:462.
[Invention 1001]
A Pichia pastoris microorganism having reduced or eliminated activity of YPS1-1 protease and YPS1-2 protease, said microorganism expressing a recombinant polypeptide.
[Invention 1002]
1001. The microorganism of the invention 1001, wherein said YPS1-1 protease comprises a polypeptide sequence that is at least 95% identical to SEQ ID NO:67.
[Invention 1003]
1001. The microorganism of the invention 1001, wherein said YPS1-1 protease comprises SEQ ID NO:67.
[Invention 1004]
The microorganism of invention 1001 or invention 1002, wherein said YPS1-1 protease is encoded by the YPS1-1 gene.
[Invention 1005]
1004. The microorganism of the invention 1004, wherein said YPS1-1 gene comprises a polynucleotide sequence that is at least 95% identical to SEQ ID NO:1.
[Invention 1006]
1004. The microorganism of the invention 1004, wherein said YPS1-1 gene comprises at least 15, 20, 25, 30, 40, or 50 contiguous nucleotides of SEQ ID NO:1.
[Invention 1007]
1004. The microorganism of the invention 1004, wherein said YPS1-1 gene comprises SEQ ID NO:1.
[Invention 1008]
1004. The microorganism of the invention 1004, wherein said YPS1-1 gene is at locus PAS_chr4 — 0584 of said microorganism.
[Invention 1009]
The microorganism of any preceding invention, wherein said YPS1-2 protease comprises a polypeptide sequence that is at least 95% identical to SEQ ID NO:68.
[Invention 1010]
1009. The microorganism of the invention 1009, wherein said YPS1-2 protease comprises SEQ ID NO:68.
[Invention 1011]
The microorganism of any preceding invention, wherein said YPS1-2 protease is encoded by the YPS1-2 gene.
[Invention 1012]
1011. The microorganism of the invention 1011, wherein said YPS1-2 gene comprises a polynucleotide sequence that is at least 95% identical to SEQ ID NO:2.
[Invention 1013]
1011. The microorganism of the invention 1011, wherein said YPS1-2 gene comprises at least 15, 20, 25, 30, 40, or 50 contiguous nucleotides of SEQ ID NO:2.
[Invention 1014]
1011. The microorganism of the present invention 1011, wherein said YPS1-2 gene comprises SEQ ID NO:2.
[Invention 1015]
1011. The microorganism of the invention 1011, wherein said YPS1-2 gene is at locus PAS_chr3 — 1157 of said microorganism.
[Invention 1016]
The microorganism of any preceding invention, wherein said YPS1-1 gene or said YPS1-2 gene or both have been mutated or knocked out.
[Invention 1017]
A microorganism of any preceding invention that expresses a recombinant protein.
[Invention 1018]
1017. The microorganism of the invention 1017, wherein said recombinant protein comprises at least one blocked polypeptide sequence derived from silk protein.
[Invention 1019]
1017. The microorganism of the invention 1017, wherein said recombinant protein comprises a silk-like polypeptide.
[Invention 1020]
The silk-like polypeptide comprises one or more repeat sequences {GGY-[GPG-X 1 ] n1 -GPS-(A) n2 } n3 , wherein
X = SGGQQ or GAGQQ or GQGPY or AGQQ or SQ,
n1 is 4 to 8;
n2 is 6 to 20, and
n is 2 to 20;
A microorganism of the invention 1019.
[Invention 1021]
1020. The microorganism of the invention 1019, wherein said silk-like polypeptide comprises a polypeptide sequence encoded by SEQ ID NO:462.
[Invention 1022]
The microorganism of any preceding invention, wherein the activity of one or more additional proteases has been reduced or eliminated.
[Invention 1023]
1022. The microorganism of the invention 1022, wherein said one or more additional proteases comprise YPS1-5, MCK7, or YPS1-3.
[Invention 1024]
1023. The microorganism of the invention 1023, wherein said YPS1-5 gene is at locus PAS_chr3 — 0688 of said microorganism.
[Invention 1025]
1023. The microorganism of the invention 1023, wherein said MCK7 protease is encoded by a MCK7 gene comprising a polynucleotide sequence that is at least 95% identical to SEQ ID NO:7.
[Invention 1026]
1023. The microorganism of the invention 1023, wherein said MCK7 gene comprises at least 15, 20, 25, 30, 40, or 50 contiguous nucleotides of SEQ ID NO:7.
[Invention 1027]
1023. The microorganism of the invention 1023, wherein said MCK7 gene comprises SEQ ID NO:7.
[Invention 1028]
1023. The microorganism of the invention 1023, wherein said MCK7 gene is at locus PAS_chr1-1 — 0379 of said microorganism.
[Invention 1029]
1023. The microorganism of the invention 1023, wherein said YPS1-3 protease is encoded by a YPS1-3 gene comprising a polynucleotide sequence that is at least 95% identical to SEQ ID NO:3.
[Invention 1030]
1023. The microorganism of the invention 1023, wherein said YPS1-3 gene comprises at least 15, 20, 25, 30, 40, or 50 contiguous nucleotides of SEQ ID NO:3.
[Invention 1031]
1023. The microorganism of the invention 1023, wherein said YPS1-3 gene comprises SEQ ID NO:3.
[Invention 1032]
1023. The microorganism of the invention 1023, wherein said YPS1-3 gene is at locus PAS_chr3 — 0299 of said microorganism.
[Invention 1033]
1023. The microorganism of the invention 1022, wherein said one or more additional proteases comprise a polypeptide sequence that is at least 95% identical to a polypeptide sequence selected from the group consisting of SEQ ID NOs: 68-130.
[Invention 1034]
1022. The microorganism of the invention 1022, wherein said one or more additional proteases comprise a polypeptide sequence selected from the group consisting of SEQ ID NOs: 68-130.
[Invention 1035]
1023. The microorganism of the invention 1022, wherein said one or more additional proteases are encoded by a polynucleotide sequence that is at least 95% identical to a polynucleotide sequence selected from the group consisting of SEQ ID NOs: 3-66.
[Invention 1036]
The one or more additional proteases are encoded by a polynucleotide sequence comprising at least 15, 20, 25, 30, 40, or 50 contiguous nucleotides of a polynucleotide sequence selected from the group consisting of SEQ ID NOs: 3-66 1022 of the present invention.
[Invention 1037]
The microorganism of any of Inventions 1022-1036, wherein said microorganism comprises a 3X, 4X or 5X protease knockout.
[Invention 1038]
Pichia comprising the activity of said YPS1-1 and said YPS1-2 reduced by mutation or deletion of the YPS1-1 gene comprising SEQ ID NO: 1 and the YPS1-2 gene comprising SEQ ID NO:2 A modified microorganism of pastoris,
Said microorganism, further comprising a recombinantly expressed protein comprising a polypeptide sequence encoded by SEQ ID NO:462.
[Invention 1039]
A cell culture comprising the microorganism of any of the inventions 1001-1038.
[Invention 1040]
A cell culture comprising the microorganism of any of the inventions 1017-1038,
Said cell culture, wherein said recombinantly expressed protein is less degraded than a cell culture containing the identical Pichia pastoris microorganism, except that it does not attenuate or eliminate the activity of YPS1-1 and YPS1-2.
[Invention 1041]
culturing the microorganism of any of the inventions 1017-1037 in a medium under conditions suitable for expression of said recombinantly expressed protein; and
isolating said recombinant protein from said microorganism or said medium;
A method for producing a recombinant protein with reduced degradation, comprising:
[Invention 1042]
1041. The method of invention 1041, wherein said recombinant protein is secreted from said microorganism, and said isolating said recombinant protein comprises recovering medium containing said secreted recombinant protein.
[Invention 1043]
The present invention, wherein said recombinant protein has a lower level of degradation compared to said recombinant protein produced by the same microorganism except that said YPS1-1 and said YPS1-2 protease activities are not attenuated or eliminated. 1041 ways.
[Invention 1044]
A method of modifying Pichia pastoris to inhibit degradation of a recombinantly expressed protein, comprising:
The above method, comprising knocking out or mutating the genes encoding the YPS1-1 protein and the YPS1-2 protein.
[Invention 1045]
The method of the invention 1044 further comprising knocking out or mutating one or more additional genes encoding YPS1-3 protein, YPS1-5 protein, or MCK7 protein.
[Invention 1046]
1044. The method of the invention 1044, further comprising knocking out one or more genes encoding a protein comprising a polypeptide selected from the group consisting of SEQ ID NO: 68-130.
[Invention 1047]
1044. The method of invention 1044, wherein said recombinantly expressed protein comprises a poly A sequence comprising at least 2, 3, 4, 5, 6, 7, 8, 9, or 10 consecutive alanine residues.
[Invention 1048]
1044. The method of invention 1044, wherein said recombinantly expressed protein comprises a silk-like polypeptide.
[Invention 1049]
The silk-like polypeptide comprises one or more repeat sequences {GGY-[GPG-X 1 ] n1 -GPS-(A) n2 } n3 , wherein
X 1 = SGGQQ or GAGQQ or GQGPY or AGQQ or SQ;
n1 is 4 to 8;
n2 is 6 to 20, and
n is 2 to 20;
The method of the invention 1048.
[Invention 1050]
1044. The method of invention 1044, wherein said recombinantly expressed protein comprises a polypeptide sequence encoded by SEQ ID NO:462.

前述及び他の、課題、特徴及び利点は、異なる図面を通して同種の参照符号が同じ部分を指す添付の図面で例示する、本発明の個々の実施形態に関する以下の説明から明らかとなるであろう。図面は必ずしも一定の縮尺で描かれているわけではなく、代わりに、本発明のさまざまな実施形態の原則を例示することに重点が置かれている。 The foregoing and other objects, features and advantages will become apparent from the following description of specific embodiments of the invention, illustrated in the accompanying drawings in which like reference numerals refer to the same parts throughout the different drawings. The drawings are not necessarily drawn to scale, emphasis instead being placed on illustrating the principles of various embodiments of the invention.

ゼオシン耐性マーカーを有するKU70欠失プラスミドのマップである。KU70 deletion plasmid map with zeocin resistance marker. 標的プロテアーゼ遺伝子欠失のためのホモロジーアームと共に用いるノーセオスリシンマーカーを含むプラスミドのプラスミドマップである。Plasmid map of plasmids containing nourseothricin markers used with homology arms for targeted protease gene deletion. 図3A及び図3Bは、ノーセオスリシン耐性マーカーに隣接する所望のプロテアーゼ遺伝子に指向するホモロジーアームを有するプロテアーゼノックアウト用カセットである。Figures 3A and 3B are protease knockout cassettes with homology arms pointing to the desired protease gene flanked by a nourseothricin resistance marker. 単一KO株から単離されたタンパク質の代表的ウェスタンブロットであり、これらの株からのタンパク質分解を示す。Representative Western blots of proteins isolated from single KO strains, demonstrating proteolysis from these strains. ダブルKO株から単離されたタンパク質の代表的ウェスタンブロットであり、これらの株からのタンパク質分解を示す。Representative Western blots of proteins isolated from double KO strains showing proteolytic degradation from these strains. BMGYまたはYPD中で継代培養したプロテアーゼKOが2X、3X、4X、及び5Xある株から単離されたタンパク質の代表的ウェスタンブロットであり、これらの株におけるタンパク質分解を示す。Representative Western blots of proteins isolated from strains with 2X, 3X, 4X, and 5X protease KO subcultured in BMGY or YPD, showing proteolysis in these strains.

詳細な説明
本発明のさまざまな実施形態の詳細を以下の説明にて記載する。本発明の他の特徴、課題、及び利点は、説明及び図面から、ならびに請求項から明らかとなるであろう。
DETAILED DESCRIPTION The details of various embodiments of the invention are set forth in the description below. Other features, objects, and advantages of the invention will become apparent from the description and drawings, and from the claims.

定義
本明細書中で特に明記しない限り、本発明との関連で使用される科学用語及び技術用語は当業者が共通して理解する意味を持つものとする。さらに、文脈に別段の定めがない限り、単数形の用語には複数形が含まれるものとし、複数形の用語には単数形が含まれるものとする。用語「a」及び「an」には、文脈上他の意味に解すべき場合を除き、複数の指示対象が含まれる。一般に、本明細書に記載する生化学、酵素学、分子細胞生物学、微生物学、遺伝学ならびにタンパク質及び核酸化学ならびにハイブリダイゼーションとの関連で使用される術語及びそれらに関する技術は、当該技術分野で周知の一般的に使用されるものである。
Definitions Unless otherwise specified herein, scientific and technical terms used in connection with the present invention shall have the meanings that are commonly understood by those of ordinary skill in the art. Further, unless otherwise required by context, singular terms shall include pluralities and plural terms shall include the singular. The terms "a" and "an" include plural referents unless the context dictates otherwise. In general terms used in connection with biochemistry, enzymology, molecular and cell biology, microbiology, genetics and protein and nucleic acid chemistry and hybridization as described herein and techniques relating thereto are It is a well-known and generally used one.

特に明記しない限り、以下の用語は以下の意味を持つものと理解されるべきである。 Unless otherwise specified, the following terms should be understood to have the following meanings.

用語「ポリヌクレオチド」または「核酸分子」とは、少なくとも10塩基長ある、ヌクレオチドの重合体形態を指す。かかる用語には、DNA分子(例えば、cDNAまたはゲノムDNAもしくは合成DNA)及びRNA分子(例えば、mRNAまたは合成RNA)、ならびに非天然型ヌクレオチド類似体、非天然ヌクレオシド間結合、またはその両方を含有するDNAもしくはRNAの類似体が含まれる。核酸は、どのような形態学的コンホメーションにあってもよい。例えば、核酸は、一本鎖、二本鎖の、三本鎖、四重鎖、部分的二本鎖、分岐鎖、ヘアピン状、環状、またはパドロックドコンホメーションであり得る。 The term "polynucleotide" or "nucleic acid molecule" refers to a polymeric form of nucleotides that is at least 10 bases long. Such terms include DNA molecules (eg, cDNA or genomic DNA or synthetic DNA) and RNA molecules (eg, mRNA or synthetic RNA), as well as non-naturally occurring nucleotide analogs, non-natural internucleoside linkages, or both. DNA or RNA analogues are included. Nucleic acids can be in any morphological conformation. For example, nucleic acids can be single-stranded, double-stranded, triple-stranded, quadruplex, partially double-stranded, branched, hairpinned, circular, or padlocked conformation.

特に明記しない限り、「SEQ ID NO」という一般形式で本明細書に記載のあらゆる配列についての一例として、「SEQ ID NO:1を含む核酸」とは、少なくとも一部に、(i)SEQ ID NO:1に記載の配列を有するか、または(ii)SEQ ID NO:1に相補的な配列を有する核酸を指す。二者択一は文脈により決定される。例えば、核酸がプローブとして使用されている場合は、プローブは所望の標的に相補的でなければならないという要件により二者択一が決定される。 Unless otherwise specified, as an example for any sequence set forth herein in the general form "SEQ ID NO", "a nucleic acid comprising SEQ ID NO: 1" means, at least in part, (i) SEQ ID NO: Refers to a nucleic acid having the sequence set forth in NO:1 or (ii) having a sequence complementary to SEQ ID NO:1. The alternative is determined by context. For example, when nucleic acids are used as probes, the alternative is determined by the requirement that the probes must be complementary to the desired target.

「単離された」RNA、DNAまたは混合ポリマーとは、その自然宿主細胞において天然ポリヌクレオチドに天然で伴う他の細胞成分、例えば、それが天然で会合しているリボソーム、ポリメラーゼ及びゲノム配列などから実質的に分離されるものを言う。 An "isolated" RNA, DNA or mixed polymer is free from other cellular components that naturally accompany the native polynucleotide in its natural host cell, such as ribosomes, polymerases and genomic sequences with which it is naturally associated. Means something that is substantially separated.

「単離された」有機分子(例えば、絹タンパク質)は、由来している宿主細胞の細胞成分(膜脂質、染色体、タンパク質)、または宿主細胞が培養された培地から実質的に分離されるものを言う。かかる用語により、生体分子が他のあらゆる化学薬品から分離されていることが必ずしも必要とされるわけではないが、特定の単離生体分子はほぼ均一になるまで精製され得る。 An "isolated" organic molecule (e.g., silk protein) is one that is substantially separated from the cellular components (membrane lipids, chromosomes, proteins) of the host cell from which it was derived, or from the medium in which the host cell was cultured. say. Although such terms do not necessarily require that the biomolecule be separated from all other chemicals, a particular isolated biomolecule can be purified to near homogeneity.

用語「組換え型」とは、生体分子、例えば、遺伝子またはタンパク質であって、(1)その天然に生じる環境から除かれているもの、(2)自然界ではその遺伝子が見られるポリヌクレオチドの全部または一部に会合していないもの、(3)自然界では連結していないポリヌクレオチドに機能的に連結されているもの、または(4)自然界では生じないものを指す。「組換え型」という用語は、クローン化DNA分離物、化学合成ポリヌクレオチド類似体、または、異種系により生物学的に合成されたポリヌクレオチド類似体、ならびにそのようなそのような核酸によりコードされるタンパク質及び/またはmRNAに関して使用され得る。 The term "recombinant" refers to a biomolecule, such as a gene or protein, that (1) has been removed from its naturally occurring environment, (2) the entire polynucleotide in which the gene is found in nature. (3) operably linked to a polynucleotide with which it is not linked in nature; or (4) not occurring in nature. The term "recombinant" includes cloned DNA isolates, chemically synthesized polynucleotide analogues, or polynucleotide analogues synthesized biologically by heterologous systems, and any such nucleic acids encoded by such nucleic acids. can be used with respect to proteins and/or mRNAs.

生物ゲノムの内在性核酸配列(またはその配列によりコードされるタンパク質産物)の発現が変化するよう、この内在性核酸配列に隣接して異種配列が置かれている場合、その内在性核酸配列は本明細書では「組換え型」とみなされる。この場合、異種配列は、その異種配列がそれ自体内在性(同一宿主細胞またはその子孫由来)または外因性(異なる宿主細胞またはその子孫由来)であるか否かにかかわらず、天然では内在性核酸配列に隣接していない配列である。例として、プロモーター配列は、宿主細胞のゲノムにある遺伝子の天然プロモーターを(例えば、相同組換えにより)置換して、この遺伝子の発現パターンが変化するようにすることができる。ここで、この遺伝子は、天然ではそれに隣接している配列の少なくともいくつかの配列から分離されているため「組換え型」と考えられるであろう。 An endogenous nucleic acid sequence of an organism's genome (or the protein product encoded by that sequence) is defined as the present invention if a heterologous sequence is placed adjacent to the endogenous nucleic acid sequence (or the protein product encoded by that sequence) so as to alter its expression. It is considered "recombinant" in the specification. In this case, the heterologous sequence is naturally endogenous nucleic acid, whether the heterologous sequence is itself endogenous (from the same host cell or progeny thereof) or exogenous (from a different host cell or progeny thereof). An array that is not adjacent to an array. By way of example, a promoter sequence can replace (eg, by homologous recombination) the native promoter of a gene in the genome of the host cell, such that the expression pattern of this gene is altered. Here, the gene will be considered "recombinant" because it is separated from at least some of the sequences that naturally flank it.

核酸もまた、それが、ゲノム中の対応する核酸に対する、天然では生じない何らかの修飾を含有する場合に「組換え型」とみなされる。例えば、内在性コード配列は、それが人為的に、例えば、人の介入などによって導入された挿入、欠失または点変異を含有する場合は「組換え型」とみなされる。「組換え核酸」には、宿主細胞染色体内の非相同部位に組み込まれた核酸、及びエピソームとして存在する核酸構築体も含まれる。 A nucleic acid is also considered "recombinant" if it contains some non-naturally occurring modification to the corresponding nucleic acid in the genome. For example, an endogenous coding sequence is considered "recombinant" if it contains insertions, deletions or point mutations introduced artificially, such as by human intervention. "Recombinant nucleic acid" also includes nucleic acids that are integrated at non-homologous sites within the host cell chromosome, and nucleic acid constructs that exist as episomes.

本明細書で使用する場合、参照核酸配列の「縮重変異型」という語句は、標準的遺伝暗号に従って翻訳され、参照核酸配列から翻訳されるアミノ酸配列と同一なアミノ酸配列を提供することができる核酸配列を包含する。用語「縮重オリゴヌクレオチド」または「縮重プライマー」は、必ずしも配列は同一ではないが1つ以上の特定セグメント内部で互いに相同な標的核酸配列とハイブリダイズすることができるオリゴヌクレオチドを意味するために使用される。 As used herein, the phrase "degenerate variant" of a reference nucleic acid sequence can be translated according to the standard genetic code to provide an amino acid sequence identical to the amino acid sequence translated from the reference nucleic acid sequence. It includes nucleic acid sequences. The terms "degenerate oligonucleotide" or "degenerate primer" are to mean oligonucleotides that are not necessarily identical in sequence but are capable of hybridizing to target nucleic acid sequences that are homologous to each other within one or more specified segments. used.

核酸配列において「配列同一性パーセント」または「同一な」という用語は、2つの配列中の残基で、一致度が最大となるよう整列させた場合に同じになるものを指す。配列同一性を比較する長さは、少なくとも約9ヌクレオチド、通常は少なくとも約20ヌクレオチド、より一般には少なくとも約24ヌクレオチド、典型的には少なくとも約28ヌクレオチド、より典型的には少なくとも約32ヌクレオチド、好ましくは少なくとも約36以上のヌクレオチドの領域にわたり得る。ヌクレオチド配列同一性を測定するために使用できる当該技術分野で公知の異なるアルゴリズムが多数ある。例えば、ポリヌクレオチド配列は、Wisconsin Package バージョン10.0(Genetics Computer Group(GCG)、Madison、Wis)に同梱のプログラムであるFASTA、GapまたはBestfitを使用して比較することができる。FASTAは、問い合わせ配列と検索配列の間で最も重複している領域のアラインメント及び配列同一性パーセントを提供する。Pearson,Methods Enzymol.183:63-98(1990)(参照によりその全体が本明細書に組み込まれる)。例えば、核酸配列間の配列同一性パーセントは、参照により本明細書に組み込まれるGCG バージョン6.1で提供されるとおり、FASTAをそのデフォルトのパラメータ(文字列サイズは6、またスコア行列のファクターはNOPAM)で使用するか、またはGapをそのデフォルトのパラメータを使用して決定することができる。別法として、配列はコンピュータプログラムのBLAST(Altschul et al.,J.Mol.Biol.215:403-410(1990)、Gish and States,Nature Genet.3:266-272(1993)、Madden et al.,Meth.Enzymol.266:131-141(1996)、Altschul et al.,Nucleic Acids Res.25:3389-3402(1997)、Zhang and Madden,Genome Res.7:649-656(1997))、特にblastpまたはtblastn(Altschul et al.,Nucleic Acids Res.25:3389-3402(1997))を使用して比較することができる。 The term "percent sequence identity" or "identical" in nucleic acid sequences refers to those residues in two sequences that are the same when aligned for maximum correspondence. The length of sequence identity comparison is at least about 9 nucleotides, usually at least about 20 nucleotides, more usually at least about 24 nucleotides, typically at least about 28 nucleotides, more typically at least about 32 nucleotides, preferably can span a region of at least about 36 or more nucleotides. There are many different algorithms known in the art that can be used to measure nucleotide sequence identity. For example, polynucleotide sequences can be compared using FASTA, Gap, or Bestfit, programs provided with the Wisconsin Package version 10.0 (Genetics Computer Group (GCG), Madison, Wis.). FASTA provides alignments and percent sequence identities of the most overlapping regions between the query and search sequences. Pearson, Methods Enzymol. 183:63-98 (1990) (incorporated herein by reference in its entirety). For example, the percent sequence identity between nucleic acid sequences can be determined using FASTA with its default parameters (string size is 6, and scoring matrix factor is NOPAM), or Gap can be determined using its default parameters. Alternatively, sequences can be analyzed using the computer program BLAST (Altschul et al., J. Mol. Biol. 215:403-410 (1990), Gish and States, Nature Genet. 3:266-272 (1993), Madden et al.). 266:131-141 (1996), Altschul et al., Nucleic Acids Res.25:3389-3402 (1997), Zhang and Madden, Genome Res.7:649-656 (1997)), In particular, comparisons can be made using blastp or tblastn (Altschul et al., Nucleic Acids Res. 25:3389-3402 (1997)).

核酸またはその断片に言及した際の「実質的な相同性」または「実質的な類似性」という用語は、ヌクレオチドの適切な挿入または欠失を用いて別の核酸(またはその相補鎖)と至適に整列させた場合に、上述のようなFASTA、BLASTまたはGapなどの周知の配列同一性アルゴリズムのいずれかで測定したヌクレオチド配列同一性が、ヌクレオチド塩基の少なくとも約75%、80%、85%、好ましくは少なくとも約90%、より好ましくは少なくとも約95%、96%、97%、98%または99%においてあることを示す。 The terms "substantial homology" or "substantial similarity" when referring to a nucleic acid or fragment thereof refer to another nucleic acid (or its complementary strand) with appropriate insertions or deletions of nucleotides. When properly aligned, nucleotide sequence identity of at least about 75%, 80%, 85% of the nucleotide bases as measured by any of the well-known sequence identity algorithms such as FASTA, BLAST or Gap as described above , preferably at least about 90%, more preferably at least about 95%, 96%, 97%, 98% or 99%.

別法として、実質的な相同性または類似性は、ストリンジェントなハイブリダイゼーション条件下で核酸またはその断片が別の核酸、別の核酸の鎖、またはその相補鎖とハイブリダイズする場合に存在する。核酸ハイブリダイゼーション実験における「ストリンジェントなハイブリダイゼーション条件」及び「ストリンジェントな洗浄条件」は、多数の異なる物理的パラメータによって決まる。核酸ハイブリダイゼーションは、当業者に容易に理解されるように、塩濃度、温度、溶媒、ハイブリダイズする種の塩基組成、相補的領域の長さ、及びハイブリダイズする核酸間のヌクレオチド塩基のミスマッチ数のような条件による影響を受ける。ハイブリダイゼーションの特定のストリンジェンシーを達成するためにこれらのパラメータをいかに変えるかは、当業者により知られている。 Alternatively, substantial homology or similarity exists when a nucleic acid or fragment thereof will hybridize under stringent hybridization conditions to another nucleic acid, another strand of nucleic acid, or its complementary strand. "Stringent hybridization conditions" and "stringent wash conditions" in nucleic acid hybridization experiments depend on a number of different physical parameters. Nucleic acid hybridization, as will be readily understood by those skilled in the art, is defined by the following conditions: salt concentration, temperature, solvent, base composition of the hybridizing species, length of the complementary region, and number of nucleotide base mismatches between the hybridizing nucleic acids. affected by conditions such as One skilled in the art knows how to vary these parameters to achieve a particular stringency of hybridization.

一般に、「ストリンジェントなハイブリダイゼーション」は、一連の特定条件下、個々のDNAハイブリッドの熱融点(T)より約25℃低い温度にて実施される。「ストリンジェントな洗浄」は、一連の特定条件下、個々のDNAハイブリッドのTよりも約5℃低い温度で実施される。Tは、標的配列の50%が完全一致プローブとハイブリダイズする温度である。参照により本明細書に組み込まれるSambrook et al.,Molecular Cloning:A Laboratory Manual,2d ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(1989),9.51頁を参照のこと。本明細書の目的上、「ストリンジェントな条件」は、液相ハイブリダイゼーションでは、6xSSC(20xSSCは3.0MのNaCl及び0.3Mのクエン酸ナトリウムを含有)、1%SDS中、65℃で8~12時間ハイブリダイズさせ、その後、0.2xSSC、0.1%SDS中、65℃で20分間の洗浄を2回行うという水性ハイブリダイゼーション(すなわち、ホルムアミド不含)として定義される。65℃におけるハイブリダイゼーションは、ハイブリダイズする配列の長さ及び同一性パーセントなど多数の因子に依存して異なる率で生じることを熟練実施者は容易に理解するであろう。 Generally, "stringent hybridization" is performed at about 25°C lower than the thermal melting point ( Tm ) of an individual DNA hybrid under a specified set of conditions. "Stringent washing" is performed at temperatures about 5°C lower than the Tm of individual DNA hybrids under a specified set of conditions. The Tm is the temperature at which 50% of the target sequence hybridizes to a perfectly matched probe. Sambrook et al., incorporated herein by reference. , Molecular Cloning: A Laboratory Manual, 2d ed. , Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.M. Y. (1989), page 9.51. For the purposes of this specification, "stringent conditions" means solution phase hybridizations in 6x SSC (20x SSC contains 3.0 M NaCl and 0.3 M sodium citrate), 1% SDS at 65°C. Defined as aqueous hybridization (ie, no formamide) of 8-12 hours of hybridization followed by two 20 minute washes in 0.2×SSC, 0.1% SDS at 65°C. A skilled practitioner will readily appreciate that hybridization at 65° C. will occur at different rates depending on a number of factors, such as the length and percent identity of the hybridizing sequences.

本発明の核酸(ポリヌクレオチドとも呼ばれる)には、RNA、cDNA、ゲノムDNAのセンス鎖及びアンチセンス鎖の両方、ならびに上記の合成形態及び混合ポリマーが含まれ得る。それらは、当業者に容易に理解されるように、化学的または生化学的に修飾されてよく、また非天然または誘導体化されたヌクレオチド塩基を含有してもよい。そのような修飾には、例えば、標識、メチル化、類似体を用いた1つ以上の天然に生じるヌクレオチドの置換、ヌクレオチド間修飾、例えば、非荷電結合(例えば、メチルホスホナート、ホスホトリエステル、ホスホルアミダート、カルバメート等)、荷電結合(例えば、ホスホロチオアート、ホスホロジチオアート等)、ペンダント部分(例えば、ポリペプチド)、インターカレーター(例えば、アクリジン、プソラレン等)、キレート剤、アルキル化剤、及び修飾結合(例えば、アルファアノマー型核酸等)などが含まれる。また、水素結合及び他の化学的相互作用を介して指定配列に結合する能力においてポリヌクレオチドを模倣する合成分子も含まれる。そのような分子は当該技術分野で公知であり、例えば、分子骨格にあるリン酸結合がペプチド結合で置換されるものなどが含まれる。他の修飾には、例えば、リボース環が架橋部分または他の構造、例えば、「ロックド」核酸に見られる修飾などを含有している類似体が含まれ得る。 Nucleic acids (also called polynucleotides) of the invention can include RNA, cDNA, both sense and antisense strands of genomic DNA, as well as synthetic forms and mixed polymers of the above. They may be chemically or biochemically modified, and may contain non-natural or derivatized nucleotide bases, as will be readily appreciated by those skilled in the art. Such modifications include, for example, labels, methylation, substitution of one or more naturally occurring nucleotides with analogues, internucleotide modifications such as uncharged bonds (e.g. methylphosphonates, phosphotriesters, phosphoramidates, carbamates, etc.), charged bonds (e.g., phosphorothioates, phosphorodithioates, etc.), pendant moieties (e.g., polypeptides), intercalators (e.g., acridine, psoralen, etc.), chelating agents, alkyl agents, modified linkages (eg, alpha anomeric nucleic acids, etc.), and the like. Also included are synthetic molecules that mimic polynucleotides in their ability to bind to a designated sequence via hydrogen bonding and other chemical interactions. Such molecules are known in the art and include, for example, those in which phosphate bonds in the molecular backbone are replaced with peptide bonds. Other modifications can include, for example, analogs in which the ribose ring contains bridging moieties or other structures, such as modifications found in "locked" nucleic acids.

「変異した」という用語は、核酸配列に適用する場合、ある核酸配列内のヌクレオチドが参照核酸配列と比較した場合に挿入、欠失または変更されていることを意味する。ある遺伝子座において単一の変更(点変異)を行ってよく、また複数のヌクレオチドについて単一遺伝子座においける挿入、欠失または変更を行ってもよい。さらに、ある核酸配列内で任意の数の遺伝子座において1つ以上の変更を行ってよい。核酸配列は、当該技術分野で公知の任意の方法で変異させてよく、これには、「エラープローンPCR」(PCR産物の全長にわたり高率の点変異が得られるようDNAポリメラーゼの複製忠実度が低い条件下でPCRを実施する方法であり、例えば、Leung et al.,Technique,1:11-15(1989)及びCaldwell and Joyce,PCR Methods Applic.2:28-33(1992)を参照のこと)、及び「オリゴヌクレオチド指定突然変異」(対象の任意のクローン化DNAセグメントにおいて部位特異的変異の発生を可能にする方法であり、例えば、Reidhaar-Olson and Sauer,Science 241:53-57(1988)を参照のこと)など変異誘発技術が挙げられるが、これに限定されるものではない。 The term "mutated" when applied to nucleic acid sequences means that nucleotides within a nucleic acid sequence have been inserted, deleted or altered when compared to a reference nucleic acid sequence. Single alterations (point mutations) may be made at a locus, and insertions, deletions or alterations of multiple nucleotides may be made at a single locus. Additionally, one or more alterations may be made at any number of loci within a given nucleic acid sequence. Nucleic acid sequences may be mutated by any method known in the art, including "error-prone PCR" (where the replication fidelity of the DNA polymerase is increased to yield a high rate of point mutations over the entire length of the PCR product). A method of performing PCR under reduced conditions, see, for example, Leung et al., Technique, 1:11-15 (1989) and Caldwell and Joyce, PCR Methods Applic.2:28-33 (1992). ), and "oligonucleotide-directed mutagenesis" (a method that allows the generation of site-directed mutations in any cloned DNA segment of interest, see, for example, Reidhaar-Olson and Sauer, Science 241:53-57 (1988). )) and other mutagenesis techniques, but are not limited to these.

本明細書で使用する場合、用語「減弱させる」とは一般に機能的欠失を指し、これには、変異、部分的欠失もしくは完全欠失、挿入、または遺伝子配列、もしくは遺伝子配列の転写を制御する配列に対して行われる他の変更が含まれ、これにより遺伝子産物の産生を低減もしくは阻害するかまたは遺伝子産物を非機能的にする。いくつかの例では、機能的欠失はノックアウト変異として表される。減弱には、核酸配列を変化させること、遺伝子をより活性が低いプロモーターの制御下に置くこと、下方制御させること、対象遺伝子を標的とする干渉RNA、リボザイムもしくはアンチセンスの配列を発現させることによるアミノ酸配列の変更、または当該技術分野で公知の他の任意の技術を介したアミノ酸配列の変更も含まれる。一例では、フィードバック阻害または産物でも反応体でもない組成物によって生じる阻害に対する特定酵素の感受性(経路非特異的フィードバック)を低くして、酵素活性が化合物の存在による影響を受けないようにする。他の場合には、活性が低くなるよう変化させた酵素は減弱していると呼ばれ得る。 As used herein, the term "attenuating" generally refers to functional deletions, including mutations, partial or complete deletions, insertions, or gene sequences or transcription of gene sequences. Other alterations made to the regulatory sequences are included that reduce or inhibit production of the gene product or render the gene product non-functional. In some instances, functional deletions are expressed as knockout mutations. Attenuation may be by altering the nucleic acid sequence, placing the gene under the control of a less active promoter, down-regulating, expressing interfering RNA, ribozyme or antisense sequences that target the gene of interest. Alteration of the amino acid sequence, or alteration of the amino acid sequence through any other technique known in the art, is also included. In one example, the susceptibility of a particular enzyme to feedback inhibition or inhibition caused by a composition that is neither a product nor a reactant (pathway non-specific feedback) is rendered unaffected by the presence of the compound. In other cases, an enzyme that has been altered to have less activity may be referred to as attenuated.

本明細書で使用する場合、用語「欠失」とは、核酸分子から1つ以上のヌクレオチドを、またはタンパク質から1つ以上のアミノ酸を除去し、その両側の領域が互いに連結されていることを指す。 As used herein, the term "deletion" refers to the removal of one or more nucleotides from a nucleic acid molecule or one or more amino acids from a protein, the regions on either side of which are linked together. Point.

本明細書で使用する場合、用語「ノックアウト」とは、発現または活性のレベルがゼロまで低下させられている遺伝子を指すことが意図される。いくつかの例では、遺伝子は、そのコード配列の一部または全部を欠失させることによりノックアウトされる。他の例では、遺伝子は、1つ以上のヌクレオチドをそのオープンリーディングフレーム内に導入し、それによりナンセンスタンパク質産物の翻訳、そうでない場合は非機能性タンパク質産物の翻訳をもたらすことによりノックアウトされる。 As used herein, the term "knockout" is intended to refer to a gene whose level of expression or activity has been reduced to zero. In some examples, a gene is knocked out by deleting part or all of its coding sequence. In other examples, a gene is knocked out by introducing one or more nucleotides into its open reading frame, thereby resulting in translation of a nonsense protein product, or otherwise a non-functional protein product.

本明細書で使用する場合、用語「ベクター」とは、それに連結されている別の核酸を輸送することができる核酸分子を指すことが意図される。ベクターの一種は「プラスミド」であり、これは一般に、環状二本鎖のDNAループで、その中にさらなるDNAセグメントが連結され得るものを指すが、直鎖状二本鎖分子、例えば、ポリメラーゼ連鎖反応(PCR)による増幅から生じるもの、または環状プラスミドの制限酵素での処理から生じるものなども含まれる。他のベクターには、コスミド、細菌人工染色体(BAC)及び酵母人工染色体(YAC)が含まれる。ベクターのもう一種はウイルスベクターであり、その場合、さらなるDNAセグメントがウイルスゲノム内に連結され得る(下記で詳述)。特定のベクターは、それが導入されている宿主細胞での自己複製能がある(例えば、宿主細胞で機能する複製起点を有するベクター)。他のベクターは、宿主細胞内に導入された際にその宿主細胞のゲノムに組み込まれ得るため、宿主ゲノムと共に複製される。さらに、特定の好ましいベクターは、それらが機能的に連結されている遺伝子の発現を導くことができる。そのようなベクターを本明細書では「組換え発現ベクター」(または単に「発現ベクター」)と呼ぶ。 As used herein, the term "vector" is intended to refer to a nucleic acid molecule capable of transporting another nucleic acid to which it has been linked. One type of vector is a "plasmid", which generally refers to a circular double-stranded DNA loop into which additional DNA segments may be ligated, although linear double-stranded molecules such as polymerase chain Also included are those resulting from amplification by reaction (PCR), or from treatment of circular plasmids with restriction enzymes. Other vectors include cosmids, bacterial artificial chromosomes (BAC) and yeast artificial chromosomes (YAC). Another type of vector is a viral vector, wherein additional DNA segments can be ligated into the viral genome (detailed below). Certain vectors are capable of autonomous replication in a host cell into which they are introduced (eg, vectors having an origin of replication that is functional in the host cell). Other vectors, when introduced into a host cell, can integrate into the genome of the host cell and are thus replicated along with the host genome. Moreover, certain preferred vectors are capable of directing the expression of genes to which they are operably linked. Such vectors are referred to herein as "recombinant expression vectors" (or simply "expression vectors").

「機能的に連結された(Operatively linked)」または「機能的に連結された(operably linked)」発現制御配列とは、その発現制御配列が対象遺伝子に隣接して、かかる対象遺伝子を制御する連結、ならびにトランスに作用するかまたは離れて作用して対象遺伝子を制御する発現制御配列を指す。 An “operably linked” or “operably linked” expression control sequence means that the expression control sequence flanks a gene of interest and a linkage that controls such gene of interest. , as well as expression control sequences that act in trans or at a distance to control a gene of interest.

用語「発現制御配列」とは、それが機能的に連結されたコード配列の発現に影響を与えるために必要なポリヌクレオチド配列を指す。発現制御配列は、核酸配列の転写、転写後事象及び翻訳を制御する配列である。発現制御配列には、転写開始、転写終結、プロモーター及びエンハンサーの適切な配列;効率的なRNAプロセシングシグナル、例えば、スプライシング及びポリアデニル化のシグナルなど;細胞質mRNAを安定化させる配列;翻訳効率を高める配列(例えば、リボソーム結合部位);タンパク質安定性を高める配列;及び必要に応じ、タンパク質の分泌を高める配列が含まれる。そのような制御配列の性質は宿主生物に応じて異なり、原核生物では、そのような制御配列には一般にプロモーター、リボソーム結合部位、及び転写終結配列が含まれる。用語「制御配列」には、最低でも、発現にその存在が不可欠とされる全構成成分が含まれることが意図され、存在していると都合がよい追加の構成成分、例えば、リーダー配列及び融合パートナー配列なども含まれ得る。 The term "expression control sequence" refers to polynucleotide sequences necessary to affect the expression of coding sequences to which they are operably linked. Expression control sequences are sequences that control the transcription, post-transcriptional events and translation of nucleic acid sequences. Expression control sequences include appropriate transcription initiation, transcription termination, promoter and enhancer sequences; efficient RNA processing signals, such as splicing and polyadenylation signals; sequences that stabilize cytoplasmic mRNA; sequences that enhance translation efficiency. (eg, ribosome binding sites); sequences that enhance protein stability; and, optionally, sequences that enhance secretion of the protein. The nature of such control sequences varies depending on the host organism, and in prokaryotes such control sequences generally include promoters, ribosome binding sites, and transcription termination sequences. The term "regulatory sequence" is intended to include, at a minimum, all components whose presence is essential for expression, including additional components that are conveniently present, such as leader sequences and fusions. Partner sequences and the like may also be included.

用語「調節エレメント」とは、核酸分子の転写または翻訳に影響を与える任意の要素を指す。これらには、例として、調節タンパク質(例えば、転写因子)、シャペロン、シグナル伝達タンパク質、RNAi分子、アンチセンスRNA分子、マイクロRNA及びRNAアプタマーが含まれるが、これに限定されない。調節エレメントは宿主生物にとって内在性であってよい。調節エレメントは宿主生物にとって外因性であってもよい。調節エレメントは、合成により発生した調節エレメントであってよい。 The term "regulatory element" refers to any element that affects the transcription or translation of a nucleic acid molecule. These include, by way of example and without limitation, regulatory proteins (eg, transcription factors), chaperones, signaling proteins, RNAi molecules, antisense RNA molecules, microRNAs and RNA aptamers. A regulatory element may be endogenous to the host organism. A regulatory element may be exogenous to the host organism. The regulatory element may be a synthetically generated regulatory element.

本明細書で使用する場合、用語「プロモーター」、「プロモーターエレメント」、または「プロモーター配列」とは、対象のヌクレオチド配列に連結させた場合に、その対象ヌクレオチド配列のmRNAへの転写を制御することができるDNA配列を指す。プロモーターは典型的に、必ずその位置というわけではないが、そのプロモーターによってmRNAへの転写が制御される対象ヌクレオチド配列の5’(すなわち、上流)に位置し、RNAポリメラーゼ及び転写開始用の他の転写因子が特異的に結合する部位を提供する。プロモーターは宿主生物にとって内在性であってよい。プロモーターは宿主生物にとって外因性であってもよい。プロモーターは、合成により発生した調節エレメントであってよい。 As used herein, the term "promoter," "promoter element," or "promoter sequence" refers to the ability to control the transcription of a nucleotide sequence of interest into mRNA when linked to that nucleotide sequence of interest. refers to a DNA sequence capable of A promoter is typically, but not necessarily, located 5' (i.e., upstream) to the nucleotide sequence of interest whose transcription into mRNA is controlled by the promoter and provides access to RNA polymerase and other media for transcription initiation. Provides sites for specific binding of transcription factors. The promoter may be endogenous to the host organism. The promoter may be exogenous to the host organism. A promoter may be a synthetically generated regulatory element.

本明細書に記載の組換え遺伝子を発現させるために有用なプロモーターには、構成的プロモーター及び誘導性/抑制性プロモーターの両方が含まれる。本発明の人工的に操作された生物において複数の組換え遺伝子を発現させる場合、かかる異なる遺伝子は、異なるプロモーターによっても、また別々のオペロンにある同一プロモーターによっても制御することができ、また2つ以上の遺伝子の発現を、オペロンの一部としての単一プロモーターにより制御してもよい。 Promoters useful for expressing the recombinant genes described herein include both constitutive promoters and inducible/repressible promoters. When expressing multiple recombinant genes in the artificially engineered organisms of the invention, such different genes can be controlled by different promoters or by the same promoter in separate operons, and two Expression of the above genes may be controlled by a single promoter as part of the operon.

本明細書で使用する場合、用語「組換え宿主細胞」(または単に「宿主細胞」)とは、組換えベクターが導入されている細胞を指すことが意図される。かかる用語により、特定の対象細胞だけではなく、そのような細胞の子孫も指すことが意図されることを理解されるべきである。変異または環境の影響により継代とともに特定の修飾が起こり得るため、そのような子孫は事実、親細胞と同一ではない場合があるが、それでも本明細書で使用する用語「宿主細胞」の範囲内に含まれる。組換え宿主細胞は単離された細胞であっても培養で増殖させた細胞株であってもよく、または生きている組織もしくは生物中に存在している細胞であってもよい。 As used herein, the term "recombinant host cell" (or simply "host cell") is intended to refer to a cell into which a recombinant vector has been introduced. It should be understood that such terms are intended to refer not only to the particular subject cell, but also to the progeny of such a cell. Such progeny may not in fact be identical to the parental cell, as certain modifications may occur with passage due to mutation or environmental influences, but still fall within the term "host cell" as used herein. include. A recombinant host cell may be an isolated cell, a cell line grown in culture, or a cell present in a living tissue or organism.

本明細書で使用する場合、用語「ペプチド」とは、短いポリペプチド、例えば、典型的に約50アミノ酸長より短い、より典型的には約30アミノ酸長より短いものを指す。本明細書で使用する用語は、類似体ならびに構造機能を模倣することで生物学的機能を模倣する模倣物を包含する。 As used herein, the term "peptide" refers to short polypeptides, eg, typically less than about 50 amino acids in length, more typically less than about 30 amino acids in length. The term as used herein includes analogs as well as mimetics that mimic biological function by mimicking structural function.

用語「ポリペプチド」は、天然に生じるタンパク質と天然に生じないタンパク質の両方、ならびにその断片、変異体、誘導体及び類似体を包含する。ポリペプチドはモノマーでもポリマーでもよい。さらに、ポリペプチドは、各々が1つ以上の別個の活性を有する多数の異なるドメインを含んでよい。 The term "polypeptide" encompasses both naturally occurring and non-naturally occurring proteins, as well as fragments, variants, derivatives and analogs thereof. Polypeptides can be monomeric or polymeric. Moreover, a polypeptide may contain a number of different domains, each with one or more distinct activities.

「単離されたタンパク質」または「単離されたポリペプチド」という用語は、その起源または誘導体源という点で、(1)その天然の状態ではそれに付随する天然の会合成分と会合していないタンパク質またはポリペプチド、(2)自然界では見られない純度で存在するタンパク質またはポリペプチドであり、その場合、純度は、他の細胞物質の存在に関して判定可能である(例えば、同一種由来の他のタンパク質を含まない)、(3)異なる種から得た細胞が発現するタンパク質またはポリペプチド、または(4)自然界では生じないタンパク質またはポリペプチド(例えば、自然界に見られるポリペプチドの断片であるか、または自然界では見られないアミノ酸類似体もしくはアミノ酸誘導体または標準ペプチド結合以外の結合が含まれているもの)である。したがって、化学的に合成されたポリペプチド、または天然での起源となる細胞とは異なる細胞系で合成されたポリペプチドは、その天然での会合成分から「単離されている」。ポリペプチドまたはタンパク質は、当該技術分野で周知のタンパク質精製技術を使用して単離することにより、天然での会合成分を実質的に含まないようにしてもよい。このように定義した場合、「単離された」とは、そのように記載されたタンパク質、ポリペプチド、ペプチドまたはオリゴペプチドが必ずしもその天然の環境から物理的に除かれている必要はない。 The terms "isolated protein" or "isolated polypeptide", in terms of their origin or derivation source, are defined as follows: (1) a protein that in its natural state is unassociated with the naturally associated components that accompany it; or polypeptide, (2) a protein or polypeptide that exists in a purity not found in nature, where purity is determinable with respect to the presence of other cellular material (e.g., other proteins from the same species (3) a protein or polypeptide expressed by cells from a different species; or (4) a protein or polypeptide that does not occur in nature (e.g., is a fragment of a polypeptide found in nature, or amino acid analogs or derivatives that are not found in nature or that contain bonds other than standard peptide bonds). Thus, a polypeptide that is chemically synthesized, or that is synthesized in a cellular system other than the cell in which it naturally originates, is "isolated" from its naturally associated components. A polypeptide or protein may be rendered substantially free of naturally associated components by isolation, using protein purification techniques well known in the art. As so defined, "isolated" does not necessarily require that the protein, polypeptide, peptide or oligopeptide so described be physically removed from its natural environment.

用語「ポリペプチド断片」とは、完全長ポリペプチドと比較して欠失を有する、例えば、アミノ末端及び/またはカルボキシ末端などの欠失を有するポリペプチドを指す。好ましい実施形態では、ポリペプチド断片は、その断片のアミノ酸配列が天然に生じる配列での対応する位置と同一な連続配列である。断片は典型的に、少なくとも5、6、7、8、9または10アミノ酸長、好ましくは少なくとも12、14、16または18アミノ酸長、より好ましくは少なくとも20アミノ酸長、より好ましくは少なくとも25、30、35、40または45アミノ酸、よりさらに好ましくは少なくとも50または60アミノ酸長、よりさらに好ましくは少なくとも70アミノ酸長である。 The term "polypeptide fragment" refers to a polypeptide having deletions, eg, amino- and/or carboxy-terminal deletions, as compared to the full-length polypeptide. In preferred embodiments, a polypeptide fragment is a contiguous sequence that is identical to the corresponding position in the sequence in which the amino acid sequence of the fragment occurs in nature. Fragments are typically at least 5, 6, 7, 8, 9 or 10 amino acids long, preferably at least 12, 14, 16 or 18 amino acids long, more preferably at least 20 amino acids long, more preferably at least 25, 30, 35, 40 or 45 amino acids, even more preferably at least 50 or 60 amino acids long, even more preferably at least 70 amino acids long.

あるタンパク質をコードする核酸配列が、第2のタンパク質をコードする核酸配列と類似の配列を有する場合、そのタンパク質は第2のタンパク質に対し「相同性」を有するかまたは「相同」である。あるいは、あるタンパク質が第2のタンパク質に対する相同性を有するのは、その2つのタンパク質が「類似の」アミノ酸配列を有する場合である。(したがって、「相同タンパク質」という用語は、2つのタンパク質が類似のアミノ酸配列を有することを意味すると定義される)。本明細書で使用する場合、2つのアミノ酸配列領域間の相同性(特に、予測される構造類似性に関して)は、機能における類似性を意味すると解釈される。 A protein has "homology" or is "homologous" to a second protein if the nucleic acid sequence encoding the protein has a similar sequence to the nucleic acid sequence encoding the second protein. Alternatively, a protein has homology to a second protein if the two proteins have "similar" amino acid sequences. (Thus, the term "homologous proteins" is defined to mean that two proteins have similar amino acid sequences). As used herein, homology between two amino acid sequence regions (particularly with regard to predicted structural similarity) is taken to mean similarity in function.

タンパク質またはペプチドに関して「相同」を使用する場合、同一ではない残基位置は、保存的アミノ酸置換が異なることが多いと認識される。「保存的アミノ酸置換」は、あるアミノ酸残基が、化学的性質(例えば、電荷または疎水性)が類似する側鎖(R基)を持つ別のアミノ酸残基により置換されているものである。一般に、保存的アミノ酸置換ではタンパク質の機能特性は実質的に変化しない。2つ以上のアミノ酸配列が保存的置換により互いに異なっている場合、配列同一性パーセントまたは相同性の程度を上方修正してその置換の保存的性質について補正してよい。こうした修正を行う手段は当業者に周知である。例えば、Pearson,1994,Methods Mol.Biol.24:307-31及び25:365-89(参照により本明細書に組み込まれる)を参照のこと。 When "homologous" is used in reference to proteins or peptides, it is recognized that residue positions that are not identical often differ by conservative amino acid substitutions. A "conservative amino acid substitution" is one in which one amino acid residue is replaced by another amino acid residue having a side chain (R group) with similar chemical properties (eg, charge or hydrophobicity). In general, conservative amino acid substitutions do not substantially alter the functional properties of proteins. When two or more amino acid sequences differ from each other by conservative substitutions, the percent sequence identity or degree of homology may be adjusted upwards to correct for the conservative nature of the substitutions. Means for making such modifications are well known to those skilled in the art. See, eg, Pearson, 1994, Methods Mol. Biol. 24:307-31 and 25:365-89, incorporated herein by reference.

20種の従来のアミノ酸及びそれらの略語は慣例に従う。参照により本明細書に組み込まれるImmunology-A Synthesis(Golub and Gren eds.,Sinauer Associates,Sunderland,Mass.,2nd ed.1991)を参照のこと。20種の従来のアミノ酸の立体異性体(例えば、D-アミノ酸)、非天然型アミノ酸、例えば、α-,α-二置換アミノ酸、N-アルキルアミノ酸など、及び他の非従来型アミノ酸も本発明のポリペプチドの適切な構成成分であり得る。非従来型アミノ酸の例には、4-ヒドロキシプロリン、γ-カルボキシグルタミン酸、ε-N,N,N-トリメチルリジン、ε-N-アセチルリジン、O-ホスホセリン、N-アセチルセリン、N-ホルミルメチオニン、3-メチルヒスチジン、5-ヒドロキシリジン、N-メチルアルギニン、ならびに他の類似のアミノ酸及びイミノ酸(例えば、4-ヒドロキシプロリン)が含まれる。本明細書で使用するポリペプチド表記では、標準的使用及び慣例に従って左側末端はアミノ末端に対応し、右側末端はカルボキシ末端に対応する。 The twenty conventional amino acids and their abbreviations follow convention. See Immunology-A Synthesis (Golub and Gren eds., Sinauer Associates, Sunderland, Mass., 2nd ed. 1991), incorporated herein by reference. Stereoisomers of the 20 conventional amino acids (eg, D-amino acids), unnatural amino acids such as α-, α-disubstituted amino acids, N-alkyl amino acids, etc., and other unconventional amino acids are also present in the present invention. can be a suitable component of a polypeptide of Examples of non-conventional amino acids include 4-hydroxyproline, γ-carboxyglutamic acid, ε-N,N,N-trimethyllysine, ε-N-acetyllysine, O-phosphoserine, N-acetylserine, N-formylmethionine. , 3-methylhistidine, 5-hydroxylysine, N-methylarginine, and other similar amino acids and imino acids (eg, 4-hydroxyproline). In the polypeptide notation used herein, the left-hand end corresponds to the amino-terminus and the right-hand end corresponds to the carboxy-terminus, in accordance with standard usage and convention.

以下の6群はそれぞれ、互いに保存的置換であるアミノ酸を含有する:1)セリン(S)、スレオニン(T);2)アスパラギン酸(D)、グルタミン酸(E);3)アスパラギン(N)、グルタミン(Q);4)アルギニン(R)、リジン(K);5)イソロイシン(I)、ロイシン(L)、メチオニン(M)、アラニン(A)、バリン(V)、及び6)フェニルアラニン(F)、チロシン(Y)、トリプトファン(W)。 The following six groups each contain amino acids that are conservative substitutions for each other: 1) serine (S), threonine (T); 2) aspartic acid (D), glutamic acid (E); 3) asparagine (N); glutamine (Q); 4) arginine (R), lysine (K); 5) isoleucine (I), leucine (L), methionine (M), alanine (A), valine (V), and 6) phenylalanine (F) ), tyrosine (Y), tryptophan (W).

配列同一性パーセントとも呼ばれることがあるポリペプチドの配列相同性は典型的に、シークエンス解析ソフトウェアを使用して測定される。例えば、Sequence Analysis Software Package of the Genetics Computer Group(GCG)、University of Wisconsin Biotechnology Center,910 University Avenue,Madison,Wis.53705を参照のこと。タンパク質解析ソフトウェアは、保存的アミノ酸置換を含めて、さまざまな置換、欠失及び他の修飾に対して割り当てられた相同性尺度を使用して類似配列を一致させる。例えば、GCGには、「Gap」及び「Bestfit」などのプログラムが同梱されており、それらをデフォルトのパラメータで使用して、密接に関連するポリペプチド同士、例えば、異なる種の生物に由来する相同ポリペプチド同士などの配列相同性または配列同一性を、または野生型タンパク質とその変異タンパク質の間の配列相同性または配列同一性を決定することができる。例えば、GCG バージョン6.1を参照のこと。 Sequence homology for polypeptides, sometimes referred to as percent sequence identity, is typically measured using sequence analysis software. See, for example, Sequence Analysis Software Package of the Genetics Computer Group (GCG), University of Wisconsin Biotechnology Center, 910 University Avenue, Madison, Wis. See 53705. Protein analysis software matches similar sequences using assigned homology measures to various substitutions, deletions and other modifications, including conservative amino acid substitutions. For example, GCG ships with programs such as "Gap" and "Bestfit", which are used with default parameters to match closely related polypeptides, e.g., from different species of organisms. Sequence homology or identity can be determined, such as between homologous polypeptides, or between a wild-type protein and its mutant protein. See, for example, GCG version 6.1.

異なる生物由来の配列を多数含むデータベースと特定のポリペプチド配列とを比較する際に有用なアルゴリズムはBLASTというコンピュータプログラム(Altschul et al.,J.Mol.Biol.215:403-410(1990)、Gish and States,Nature Genet.3:266-272(1993)、Madden et al.,Meth.Enzymol.266:131-141(1996)、Altschul et al.,Nucleic Acids Res.25:3389-3402(1997)、Zhang and Madden,Genome Res.7:649-656(1997))、特に、blastpまたはtblastn(Altschul et al.,Nucleic Acids Res.25:3389-3402(1997))である。 An algorithm useful in comparing a particular polypeptide sequence to databases containing large numbers of sequences from different organisms is the computer program BLAST (Altschul et al., J. Mol. Biol. 215:403-410 (1990); Gish and States, Nature Genet.3:266-272 (1993), Madden et al., Meth.Enzymol.266:131-141 (1996), Altschul et al., Nucleic Acids Res. ), Zhang and Madden, Genome Res. 7:649-656 (1997)), especially blastp or tblastn (Altschul et al., Nucleic Acids Res. 25:3389-3402 (1997)).

BLASTpの好ましいパラメータは、期待値:10(デフォルト);フィルター:seg(デフォルト);ギャップを開くコスト:11(デフォルト);ギャップを伸長するコスト:1(デフォルト);最大アラインメント:100(デフォルト);文字列サイズ:11(デフォルト);表示件数:100(デフォルト);ペナルティー行列:BLOWSUM62である。 Preferred parameters for BLASTp are: Expectation: 10 (default); Filter: seg (default); Cost to open gap: 11 (default); Cost to extend gap: 1 (default); Maximum alignment: 100 (default); String size: 11 (default); Display count: 100 (default); Penalty matrix: BLOWSUM62.

BLASTpの好ましいパラメータは、期待値:10(デフォルト);フィルター:seg(デフォルト);ギャップを開くコスト:11(デフォルト);ギャップを伸長するコスト:1(デフォルト);最大アラインメント:100(デフォルト);文字列サイズ:11(デフォルト);表示件数:100(デフォルト);ペナルティー行列:BLOWSUM62である。相同性を比較するポリペプチド配列の長さは一般に、少なくとも約16アミノ酸残基、通常少なくとも約20残基、より一般には少なくとも約24残基、典型的に少なくとも約28残基、好ましくは約35残基より多くになる。多数の異なる生物に由来する配列を含むデータベースを検索する場合、アミノ酸配列を比較することが好ましい。アミノ酸配列を使用したデータベース検索は、blastp以外の当該技術分野で公知のアルゴリズムにより測定することができる。例えば、ポリペプチド配列は、GCG バージョン6.1のプログラムであるFASTAを使用して比較することができる。FASTAは、問い合わせ配列と検索配列の間で最も重複している領域のアラインメント及び配列同一性パーセントを提供する。Pearson,Methods Enzymol.183:63-98(1990)(参照により本明細書に組み込まれるものとする)。例えば、アミノ酸配列間の配列同一性パーセントは、参照により本明細書に組み込まれるGCG バージョン6.1で提供されるFASTAをそのデフォルトのパラメータで使用して決定することができる(文字列サイズは2、またスコア行列はPAM250)。 Preferred parameters for BLASTp are: Expectation: 10 (default); Filter: seg (default); Cost to open gap: 11 (default); Cost to extend gap: 1 (default); Maximum alignment: 100 (default); String size: 11 (default); Display count: 100 (default); Penalty matrix: BLOWSUM62. The length of the polypeptide sequences to be compared for homology is generally at least about 16 amino acid residues, usually at least about 20 residues, more generally at least about 24 residues, typically at least about 28 residues, preferably about 35 residues. more than residues. When searching a database containing sequences from many different organisms, it is preferable to compare amino acid sequences. Database searches using amino acid sequences can be measured by algorithms known in the art other than blastp. For example, polypeptide sequences can be compared using the GCG version 6.1 program, FASTA. FASTA provides alignments and percent sequence identities of the most overlapping regions between the query and search sequences. Pearson, Methods Enzymol. 183:63-98 (1990) (incorporated herein by reference). For example, percent sequence identity between amino acid sequences can be determined using FASTA provided with GCG version 6.1, which is incorporated herein by reference, with its default parameters (string size is 2 , and the score matrix is PAM250).

本明細書全体及び請求項を通して、「含む(comprise)」という語句、または「含む(comprises)」もしくは「含む(comprising)」などの変形は、記述されている整数または整数群が包含されることを意味し、他のいかなる整数または整数群も除外されないことを意味することを理解されるであろう。 Throughout this specification and claims, the word "comprises" or variations such as "comprises" or "comprising" include the stated integer or group of integers. and no other integers or groups of integers are excluded.

例示的な方法及び材料を以下に記載するが、本明細書に記載の方法及び材料と類似または同等のものも本発明を実施する際に使用可能であり、当業者には明らかとなるであろう。本明細書で言及される刊行物及び他の参考文献はいずれも、参照によりその全体が組み込まれる。矛盾がある場合は、定義も含め、本明細書が優先する。材料、方法、及び例は例示にすぎず、限定的ではないことが意図される。 Although exemplary methods and materials are described below, methods and materials similar or equivalent to those described herein can be used in the practice of the invention and will be apparent to those skilled in the art. deaf. All publications and other references mentioned herein are incorporated by reference in their entirety. In case of conflict, the present specification, including definitions, will control. The materials, methods, and examples are intended to be illustrative only and not limiting.

概要
本明細書は、例えば、プロテアーゼによる分解を低下させることなどにより、標的細胞で完全長の所望産物の産生を増加させるための組換え株及び組換え株の生産方法を提供する。
SUMMARY This document provides recombinant strains and methods of producing recombinant strains for increasing production of full-length desired products in target cells, such as by reducing degradation by proteases.

いくつかの実施形態では、Pichia pastorisのプロテアーゼ活性を減弱させるため、これらの酵素をコードする遺伝子は活性が低下または消失するよう不活性化または変異導入されている。これは、その遺伝子自体への変異もしくは挿入を介して、または遺伝子の調節エレメントの改変を介して行うことができる。これは、標準の酵母遺伝学技術によって達成可能である。そのような技術の例には二重相同組換えによる遺伝子置換が含まれ、そこでは、不活性化するべき遺伝子に隣接する相同領域をベクターにクローニングし、選択マーカー遺伝子(抗生物質耐性遺伝子または酵母菌株の栄養要求性を相補する遺伝子など)を隣接させる。 In some embodiments, to attenuate the protease activity of Pichia pastoris, the genes encoding these enzymes are inactivated or mutated to reduce or eliminate activity. This can be done through mutations or insertions into the gene itself, or through modification of the gene's regulatory elements. This is achievable by standard yeast genetics techniques. Examples of such techniques include gene replacement by double homologous recombination, in which regions of homology flanking the gene to be inactivated are cloned into a vector and a selectable marker gene (antibiotic resistance gene or yeast genes that complement the strain's auxotrophy).

別法として、相同領域をPCRで増幅させ、オーバーラップPCRで選択マーカー遺伝子に連結することができる。その後、当該技術分野で公知の方法、例えば、電気穿孔法などによりかかるDNA断片をPichia pastorisに形質転換する。その後、選択的条件下で増殖させる形質転換体を、標準技術、例えば、ゲノムDNAのPCRまたはサザンブロットなどにより遺伝子破壊事象について解析する。代替的実験では、単一相同組換えにより遺伝子不活性化を達成することができ、その場合、例えば、遺伝子のORFの5’末端を、やはり選択マーカー遺伝子を含有するプロモーター不含ベクター上にクローニングする。そのようなベクターが、標的遺伝子相同断片でのみベクターを切断する制限酵素を用いた消化によって線状になった時点で、かかるベクターをPichia pastorisに形質転換する。標的遺伝子部位への組み込みは、ゲノムDNAのPCRまたはサザンブロットにより確認される。このようにする方法では、ベクター上にクローニングされた遺伝子断片の複製がゲノム内で達成され、標的遺伝子座の2つのコピー、すなわち、ORFが不完全なために(発現したとしても)短縮された不活性タンパク質を発現する第1のコピー、及び転写を誘導するプロモーターがない第2のコピーが生じる。 Alternatively, the homologous region can be amplified by PCR and joined to the selectable marker gene by overlapping PCR. Such DNA fragments are then transformed into Pichia pastoris by methods known in the art, such as electroporation. Transformants grown under selective conditions are then analyzed for gene disruption events by standard techniques, such as PCR or Southern blot of genomic DNA. In an alternative experiment, gene inactivation can be achieved by single homologous recombination, where, for example, the 5' end of the gene's ORF is cloned onto a promoterless vector that also contains a selectable marker gene. do. Once such vectors are linearized by digestion with a restriction enzyme that cuts the vector only at the target gene homology fragment, such vectors are transformed into Pichia pastoris. Integration into the target gene site is confirmed by PCR or Southern blot of genomic DNA. In this way replication of the gene fragment cloned on the vector is achieved in the genome and two copies of the target locus, i.e. the ORF is truncated (if expressed) due to incompleteness. A first copy expressing an inactive protein and a second copy lacking a promoter to drive transcription are produced.

別法として、トランスポゾン変異誘発を使用して標的遺伝子を不活性化する。そのような変異体のライブラリーは、PCRで標的遺伝子内の挿入イベントについてスクリーニングを行うことができる。 Alternatively, transposon mutagenesis is used to inactivate the target gene. Libraries of such mutants can be screened for insertion events within the target gene by PCR.

人工操作/ノックアウトを行った株の機能的表現型(すなわち、欠損)は、当該技術分野で公知の技術を使用して評価することができる。例えば、人工操作株のプロテアーゼ活性の欠損は、当該技術分野で公知の多種多様な方法のいずれを使用しても確認することができ、特に、発色プロテアーゼ基質の加水分解活性アッセイ、選択プロテアーゼに対する基質タンパク質のバンドシフトなどがある。 Functional phenotypes (ie, defects) of engineered/knockout strains can be assessed using techniques known in the art. For example, the lack of protease activity in engineered strains can be confirmed using any of a wide variety of methods known in the art, particularly assays for hydrolytic activity of chromogenic protease substrates, substrates for selected proteases. There is a protein band shift.

本明細書に記載するプロテアーゼ活性の減弱をノックアウト変異以外の機構によって達成することができる。例えば、核酸配列を変化させること、遺伝子をより活性が低いプロモーターの制御下に置くこと、下方制御させること、対象遺伝子を標的とする干渉RNA、リボザイムもしくはアンチセンスの配列を発現させることによるアミノ酸配列の変更、または当該技術分野で公知の他の任意の技術などによるアミノ酸配列の変更によって、所望のプロテアーゼを減弱させることができる。好ましい株では、PAS_chr4_0584(YPS1-1)及びPAS_chr3_1157(YPS1-2)(例えば、SEQ ID NO:66及び67を含むポリペプチド)にてコードされるプロテアーゼのプロテアーゼ活性は、上記方法のいずれかで減弱される。いくつかの態様では、本発明は、メチロトローフ酵母菌株、特にPichia pastoris株に関し、ここで、YPS1-1遺伝子及びYPS1-2遺伝子(例えば、SEQ ID NO:1及びSEQ ID NO:2に記載)は不活性化されている。いくつかの実施形態では、遺伝子をコードするさらなるプロテアーゼを本明細書で提供する方法に従ってノックアウトし、菌株により発現される所望のタンパク質産物のプロテアーゼ活性をさらに低下させてもよい。 Attenuation of protease activity as described herein can be achieved by mechanisms other than knockout mutations. amino acid sequence by, for example, altering the nucleic acid sequence, placing the gene under the control of a less active promoter, down-regulating, expressing an interfering RNA, ribozyme or antisense sequence that targets the gene of interest. A desired protease can be attenuated by altering the amino acid sequence, such as by altering , or any other technique known in the art. In preferred strains, the protease activity of proteases encoded by PAS_chr4_0584 (YPS1-1) and PAS_chr3_1157 (YPS1-2) (e.g., polypeptides comprising SEQ ID NOs: 66 and 67) is attenuated by any of the methods described above. be done. In some aspects, the invention relates to methylotrophic yeast strains, particularly Pichia pastoris strains, wherein the YPS1-1 and YPS1-2 genes (eg, set forth in SEQ ID NO:1 and SEQ ID NO:2) are inactivated. In some embodiments, additional protease encoding genes may be knocked out according to the methods provided herein to further reduce the protease activity of the desired protein product expressed by the strain.

組換え株の作製
本明細書は、例えば、組換え遺伝子を送達するベクターもしくはノックアウトするベクターを使用するかまたは所望の内在性遺伝子を減弱させる他の方法などで、株を形質転換して活性を低下させる方法を提供する。これらのベクターは、複製起点及び選択マーカー(典型的に抗生物質耐性であるが他の多くの方法が可能)を含有するベクター骨格、または標的細胞の染色体内への組み込みを可能にする線状断片という形態をとり得る。ベクターは、選択した生物及び挿入方法に対応していなければならない。
Generating Recombinant Strains This specification describes the transformation of strains into activity by, for example, using vectors to deliver or knock out recombinant genes or other methods to attenuate the desired endogenous gene. provide a way to reduce These vectors are either vector backbones containing an origin of replication and a selectable marker (typically antibiotic resistance, but many others are possible), or linear fragments that allow integration into the chromosome of the target cell. can take the form of The vector should correspond to the chosen organism and method of insertion.

一旦ベクター要素が選択されたら、多くの異なる方法でベクターの構築を実施することができる。一実施形態では、DNA合成サービスを利用しても、全ベクターを個々に作製する方法を使用してもよい。 Once the vector elements have been selected, vector construction can be carried out in many different ways. In one embodiment, a DNA synthesis service may be utilized, or a method for making the entire vector individually may be used.

一旦それぞれのベクターのDNA(挿入及び操作に必要なさらなる要素を含む)が得られたら、それをアセンブルする必要がある。可能なアセンブリ方法は多数あり、これには、制限酵素クローニング、平滑末端ライゲーション、及びオーバーラップアセンブリ[例えば、Gibson,D.G.,et al.,Enzymatic assembly of DNA molecules up to several hundred kilobases.Nature methods,6(5),343-345(2009)、及びGeneArt Kit(http://tools.invitrogen.com/content/sfs/manuals/geneart_seamless_cloning_and_assembly_man.pdf)を参照のこと]が含まれる(が、これに限定されない)。オーバーラップアセンブリは、要素のすべてが正しい位置に確実にアセンブルされ、いかなる望ましくない配列も導入されない方法を提供する。 Once the DNA for each vector (including the additional elements necessary for insertion and manipulation) is obtained, it must be assembled. There are many possible assembly methods, including restriction enzyme cloning, blunt-end ligation, and overlap assembly [eg Gibson, D.; G. , et al. , Enzymatic assembly of DNA molecules up to several hundred kilobases. Nature methods, 6(5), 343-345 (2009), and GeneArt Kit (http://tools.invitrogen.com/content/sfs/manuals/geneart_seamless_cloning_and_assembly_man.pdf)]. but not limited to). Overlap assembly provides a method to ensure that all of the elements are assembled in the correct position and do not introduce any undesired alignment.

上記で作製されたベクターは、標準の分子生物学技術、例えば、分子クローニングなどを使用して標的細胞に挿入することができる。一実施形態では、標的細胞は、所望産物の産生に必要とされる遺伝子をすでに含有するようすでに人工操作されているかまたは選択されているが、これを、以降のベクターの挿入中または挿入後に行ってもよい。 The vectors generated above can be inserted into target cells using standard molecular biology techniques, such as molecular cloning. In one embodiment, the target cell is already engineered or selected to already contain the genes required for production of the desired product, but this is done during or after subsequent insertion of the vector. may

生物及びライブラリー要素の種類(プラスミドまたはゲノムの挿入)に応じて、DNAを含むベクターを挿入して細胞内に組み込むいくつかの公知の方法を使用してよい。これらには、例えば、局所環境からDNAを取り込んで複製することができる微生物の形質転換、電気穿孔法もしくは化学的手段による形質転換、ウイルスもしくはファージを用いた形質導入、2つ以上の細胞の接合(mating)、または異なる細胞からの接合(conjugation)が含まれ得る。 Depending on the organism and the type of library element (plasmid or genomic insert), several known methods of inserting vectors containing DNA for integration into cells may be used. These include, for example, transformation of microorganisms capable of taking up and replicating DNA from the local environment, transformation by electroporation or chemical means, transduction with viruses or phages, conjugation of two or more cells. mating, or conjugation from different cells.

細菌細胞に組換えDNAを導入するいくつかの方法が当該技術分野で公知であり、それらには、形質転換、形質導入、及び電気穿孔法(Sambrook,et al.,Molecular Cloning:A Laboratory Manual(1989),Second Edition,Cold Spring Harbor Press,Plainview,N.Yを参照のこと)が挙げられるが、これに限定されるものではない。形質転換用の市販のキット及び細菌宿主細胞の非限定的な例としては、NovaBlue Singles(商標)(EMD Chemicals Inc.,NJ,USA)、Max Efficiency(登録商標)DH5α(商標)、One Shot(登録商標)BL21(DE3)E.coli細胞、One Shot(登録商標)BL21(DE3)pLys E.coli細胞(Invitrogen Corp.,Carlsbad,Calif.,USA)、XL1-Blueコンピテントセル(Stratagene,CA,USA)が挙げられる。電気穿孔法用の市販のキット及び細菌宿主細胞の非限定的な例としては、Zappers(商標)エレクトロコンピテントセル(EMD Chemicals Inc.,NJ,USA)、XL1-Blueエレクトロポレーション-コンピテントセル(Stratagene,CA,USA)、ElectroMAX(商標)A.tumefaciens LBA4404細胞(Invitrogen Corp.,Carlsbad,Calif.,USA)が挙げられる。 Several methods of introducing recombinant DNA into bacterial cells are known in the art, including transformation, transduction, and electroporation (Sambrook, et al., Molecular Cloning: A Laboratory Manual). 1989), Second Edition, Cold Spring Harbor Press, Plainview, N.Y.). Non-limiting examples of commercially available kits and bacterial host cells for transformation include NovaBlue Singles™ (EMD Chemicals Inc., NJ, USA), Max Efficiency® DH5α™, One Shot ( Registered Trademark) BL21 (DE3)E. coli cells, One Shot® BL21(DE3) pLys E. coli cells. coli cells (Invitrogen Corp., Carlsbad, Calif., USA), XL1-Blue competent cells (Stratagene, CA, USA). Non-limiting examples of commercially available kits and bacterial host cells for electroporation include Zappers™ electrocompetent cells (EMD Chemicals Inc., NJ, USA), XL1-Blue electroporation-competent cells (Stratagene, Calif., USA), ElectroMAX™ A.I. tumefaciens LBA4404 cells (Invitrogen Corp., Carlsbad, Calif., USA).

真核細胞に組換え核酸を導入するいくつかの方法が当該技術分野で公知である。例示的な方法としては、トランスフェクション、電気穿孔法、リポソームによる核酸送達、宿主細胞へのマイクロインジェクション(Sambrook,et al.,Molecular Cloning:A Laboratory Manual(1989),Second Edition,Cold Spring Harbor Press,Plainview,N.Yを参照のこと)が挙げられる。真核細胞に組換え核酸をトランスフェクションするための市販のキット及び試薬の非限定的な例としては、Lipofectamine(商標)2000、Optifect(商標)試薬、リン酸カルシウムトランスフェクションキット(Invitrogen Corp.,Carlsbad,Calif.,USA)、GeneJammer(登録商標)トランスフェクション試薬、LipoTAXI(登録商標)トランスフェクション試薬(Stratagene,CA,USA)が挙げられる。別法として、組換え核酸は、バキュロウイルスベクターの使用により昆虫細胞(例えば、sf9、sf21、High Five(商標))内に導入され得る。 Several methods are known in the art for introducing recombinant nucleic acids into eukaryotic cells. Exemplary methods include transfection, electroporation, nucleic acid delivery by liposomes, microinjection into host cells (Sambrook, et al., Molecular Cloning: A Laboratory Manual (1989), Second Edition, Cold Spring Harbor Press, Plainview, N.Y.). Non-limiting examples of commercially available kits and reagents for transfecting eukaryotic cells with recombinant nucleic acids include Lipofectamine™ 2000, Optifect™ reagent, calcium phosphate transfection kit (Invitrogen Corp., Carlsbad, Calif., USA), GeneJammer® transfection reagent, LipoTAXI® transfection reagent (Stratagene, CA, USA). Alternatively, recombinant nucleic acids can be introduced into insect cells (eg, sf9, sf21, High Five™) through the use of baculovirus vectors.

各クローンを別々に試験できるよう形質転換された細胞を単離する。一実施形態では、これは、形質転換された細胞だけが生き残って再生することを保証する選択薬剤を含有する(または欠いている)培地の1つ以上のプレートで塗抹培養することにより行う。この特定薬剤は、抗生物質(ライブラリーが抗生物質耐性マーカーを含有する場合)、代謝物欠如(栄養要求性の相補用)、または他の選択手段であってよい。細胞は増殖して個々のコロニーとなり、その各々が単一クローンを含有する。 Transformed cells are isolated so that each clone can be tested separately. In one embodiment, this is done by smearing one or more plates of medium containing (or lacking) a selection agent that ensures that only transformed cells survive and regenerate. This specific agent may be an antibiotic (if the library contains antibiotic resistance markers), metabolite deprivation (for complementation of auxotrophy), or other means of selection. The cells grow into individual colonies, each containing a single clone.

タンパク質、代謝物、もしくは他の産物の所望される産生について、またはプロテアーゼ活性の低下について、コロニーのスクリーニングを行う。一実施形態では、産物の産生量または産生効率が最も高い(または十分に高い)組換え細胞がスクリーニングにより特定される。これには、分解産物の比率の低下または細胞培養物から回収される完全長の所望ポリペプチドの総量増大が含まれる。 Colonies are screened for desired production of proteins, metabolites, or other products, or for decreased protease activity. In one embodiment, the screening identifies the recombinant cells that produce the highest (or sufficiently high) yields or production efficiencies of the product. This includes decreasing the proportion of degradation products or increasing the total amount of full-length desired polypeptide recovered from cell culture.

このアッセイは、個々のクローンをマルチウェル培養プレートで1ウェルあたり1クローンにして増殖させることにより実施可能である。一旦細胞が適切なバイオマス密度に達した後、それらをメタノールで誘導する。ある時間の経過後、典型的に24~72時間の誘導後、遠心機で高速回転させて細胞をペレット状にし、上清を除去することによって培養物を採取する。それぞれの培養物の上清は、その後、プロテアーゼ活性及び/またはタンパク質分解について試験され得る。 This assay can be performed by growing individual clones in multiwell culture plates, one clone per well. Once the cells reach an appropriate biomass density, they are induced with methanol. After a period of time, typically 24-72 hours of induction, the culture is harvested by spinning at high speed in a centrifuge to pellet the cells and removing the supernatant. Each culture supernatant can then be tested for protease activity and/or proteolysis.

絹の配列
いくつかの実施形態では、本明細書に記載する低プロテアーゼ活性の改変株は組換えにより絹様ポリペプチド配列を発現する。いくつかの実施形態では、絹様ポリペプチド配列は、1)、絹ポリペプチド配列由来の反復ドメインを混合して一致させることにより生成したブロック共重合体ポリペプチド組成物、及び/または2)、産業用に拡張可能な微生物から分泌させて有用な繊維を形成するのにサイズが十分に大きい(約40kDa)ブロック共重合体ポリペプチドの組換え発現である。公開されているクモ糸ポリペプチドのアミノ酸配列のほぼすべてに由来する配列を含め、絹の反復ドメイン断片を人工的に操作した大きい(約40kDa~約100kDa)ブロック共重合体ポリペプチドは、本明細書に記載の改変微生物で発現させることができる。いくつかの実施形態では、絹ポリペプチド配列は、繊維形成能のある、高発現かつ高分泌のポリペプチドを産生するよう一致させ、設計される。いくつかの実施形態では、宿主改変株におけるプロテアーゼ遺伝子のノックアウトまたはプロテアーゼ活性の低下により、絹様ポリペプチドの分解が抑制される。
Silk Sequences In some embodiments, the low protease activity modified strains described herein recombinantly express silk-like polypeptide sequences. In some embodiments, the silk-like polypeptide sequence is 1) a block copolymer polypeptide composition generated by mixing and matching repeat domains from the silk polypeptide sequence, and/or 2) Recombinant expression of block copolymer polypeptides large enough in size (approximately 40 kDa) to be secreted from industrially scalable microorganisms to form useful fibers. Large (about 40 kDa to about 100 kDa) block copolymer polypeptides engineered from silk repeat domain fragments, including sequences derived from nearly all published spider silk polypeptide amino acid sequences, are described herein. It can be expressed in modified microorganisms described in the literature. In some embodiments, the silk polypeptide sequences are matched and designed to produce a highly expressed and highly secreted polypeptide that is capable of forming fibrils. In some embodiments, knocking out the protease gene or reducing protease activity in the host engineered strain inhibits degradation of the silk-like polypeptide.

本明細書では、いくつかの実施形態において、絹ポリペプチド配列空間全体における絹ポリペプチドドメインを網羅的に組み合わせて混合することにより人工操作したブロック共重合体を発現及び分泌させる組成物を提供し、ここで、かかるブロック共重合体は分解が最小限である。本明細書のいくつかの実施形態では、分解が最小限の拡張可能な生物(例えば、酵母、真菌類、及びグラム陽性菌)においてブロック共重合体を分泌させる方法を提供する。いくつかの実施形態では、ブロック共重合体ポリペプチドは、0または1つ以上のN末端ドメイン(NTD)、1つ以上の反復ドメイン(REP)、及び0または1つ以上のC末端ドメイン(CTD)を含む。かかる実施形態のいくつかの態様では、ブロック共重合体ポリペプチドは、100超のアミノ酸の単鎖ポリペプチドである。いくつかの実施形態では、ブロック共重合体ポリペプチドは、参照によりその全体が組み込まれる国際公開公報第WO/2015/042164号、”Methods and Compositions for Synthesizing Improved Silk Fibers”に開示のブロック共重合体ポリペプチドの配列と少なくとも80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%同一なドメインを含む。 Provided herein, in some embodiments, are compositions for expressing and secreting engineered block copolymers by exhaustively combining and mixing silk polypeptide domains throughout the silk polypeptide sequence space. , wherein such block copolymers undergo minimal degradation. Some embodiments herein provide methods for secreting block copolymers in scalable organisms with minimal degradation (eg, yeast, fungi, and Gram-positive bacteria). In some embodiments, the block copolymer polypeptide comprises zero or more N-terminal domains (NTD), one or more repeat domains (REP), and zero or more C-terminal domains (CTD )including. In some aspects of such embodiments, the block copolymer polypeptide is a single chain polypeptide of greater than 100 amino acids. In some embodiments, the block copolymer polypeptide is a block copolymer disclosed in International Publication No. WO/2015/042164, "Methods and Compositions for Synthesizing Improved Silk Fibers," which is incorporated by reference in its entirety. at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% of the sequence of the polypeptide , 95%, 96%, 97%, 98%, or 99% identical domains.

数種の天然クモ糸がこれまでに同定されている。自然に出糸されたクモ糸の各種の機械的性質は、そのクモ糸の分子組成と密接な関係があると考えられている。例えば、Garb,J.E.,et al.,Untangling spider silk evolution with spidroin terminal domains,BMC Evol.Biol.,10:243(2010)、Bittencourt,D.,et al.,Protein families,natural history and biotechnological aspects of spider silk,Genet.Mol.Res.,11:3(2012)、Rising,A.,et al.,Spider silk proteins:recent advances in recombinant production,structure-function relationships and biomedical applications,Cell.Mol.Life Sci.,68:2,pg.169-184(2011)、及びHumenik,M.,et al.,Spider silk:understanding the structure-function relationship of a natural fiber,Prog.Mol.Biol.Transl.Sci.,103,pg.131-85(2011)を参照のこと。 Several species of natural spider silk have been identified so far. Various mechanical properties of naturally spun spider silk are believed to be closely related to the molecular composition of the spider silk. For example, Garb, J.; E. , et al. , Untangling spider silk evolution with spidroin terminal domains, BMC Evol. Biol. , 10:243 (2010); Bittencourt, D.; , et al. , Protein families, Natural history and biotechnological aspects of spider silk, Genet. Mol. Res. , 11:3 (2012), Rising, A.; , et al. , Spider silk proteins: recent advances in recombinant production, structure-function relationships and biomedical applications, Cell. Mol. Life Sci. , 68:2, pg. 169-184 (2011), and Humenik, M.; , et al. , Spider silk: Understanding the structure-function relationship of a natural fiber, Prog. Mol. Biol. Transl. Sci. , 103, pg. 131-85 (2011).

例示
ブドウ状(AcSp)絹糸は、適度に高い強度と適度に高い伸縮性とが組み合わされた結果、靭性が高い傾向がある。AcSp絹糸は、しばしばポリセリンとGPXのモチーフが組み込まれている大きいブロック(「集合体の反復」)サイズを特徴とする。管状(TuSpまたは円筒状)絹糸は、直径が大きく、中程度の強度と高い伸縮性を有する傾向がある。TuSp絹糸は、そのポリセリンとポリスレオニンの含量、及び短いポリアラニン配列を特徴とする。大瓶状(MaSp)絹糸は、高い強度と中程度の伸縮性を有する傾向がある。MaSp絹糸は、2つのサブタイプであるMaSp1及びMaSp2のいずれか一方であり得る。MaSp1絹糸は一般にMaSp2絹糸より低伸縮性であり、ポリアラニン、GX、及びGGXのモチーフを特徴とする。MaSp2絹糸は、ポリアラニン、GGX、及びGPXのモチーフを特徴とする。小瓶状(MiSp)絹糸は、中程度の強度と中程度の伸縮性を有する傾向がある。MiSp絹糸は、GGX、GA、及びポリAのモチーフを特徴とし、しばしば約100のアミノ酸からなるスペーサーエレメントを含有する。鞭毛状(Flag)絹糸は、非常に高い伸縮性と中程度の強度を有する傾向がある。Flag絹糸は通常、GPG、GGX、及び短いスペーサーのモチーフを特徴とする。
Exemplification Grape-like (AcSp) silk tends to be tough as a result of a combination of moderately high strength and moderately high stretchability. AcSp silks are characterized by large block (“aggregate repeat”) sizes that often incorporate polyserine and GPX motifs. Tubular (TuSp or cylindrical) silk threads tend to have large diameters, moderate strength and high stretchability. TuSp silk is characterized by its polyserine and polythreonine content and short polyalanine sequences. Large bottle (MaSp) silk tends to have high strength and moderate stretchability. MaSp silk can be either one of two subtypes, MaSp1 and MaSp2. MaSp1 silks are generally less stretchable than MaSp2 silks and feature polyalanine, GX, and GGX motifs. MaSp2 silk features polyalanine, GGX, and GPX motifs. Villial (MiSp) silk tends to have moderate strength and moderate stretchability. MiSp silks are characterized by GGX, GA, and polyA motifs and often contain spacer elements of about 100 amino acids. Flag silks tend to have very high stretchability and moderate strength. Flag silks are usually characterized by motifs of GPG, GGX, and short spacers.

それぞれの絹糸種の性質は種ごとに異なり得、ライフスタイルが異なるクモ(例えば、動き回らずに巣を張る造網性のクモと、徘徊して捕食するクモ)または進化的に古い方のクモは、上記説明とは異なる絹を産生する場合がある(クモの多様性及び分類についての記載は(Hormiga,G.,and Griswold,C.E.,Systematics,phylogeny,and evolution of orb-weaving spiders,Annu.Rev.Entomol.59,pg.487-512(2014)、及びBlackedge,T.A.et al.,Reconstructing web evolution and spider diversification in the molecular era,Proc.Natl.Acad.Sci.U.S.A.,106:13,pg.5229-5234(2009)を参照のこと)。しかしながら、天然絹タンパク質の反復ドメインに対する配列類似性及び/またはアミノ酸組成類似性を有する合成ブロック共重合体ポリペプチドを使用して、天然絹繊維に対応する性質を再現する一貫した絹様繊維を商業規模で製造することが可能である。 The properties of each silk species can vary from species to species, and spiders with different lifestyles (e.g., stationary web-building spiders versus wandering and predatory spiders) or evolutionarily older spiders may produce different silk than described above (a description of spider diversity and taxonomy can be found in (Hormiga, G., and Griswold, C. E., Systematics, phylogeny, and evolution of orb-weaving spiders 59, pg.487-512 (2014), and Blackedge, TA et al., Reconstructing web evolution and spider diversification in the molecular era, Proc. S. A., 106:13, pg.5229-5234 (2009)), however, synthetic block copolymer poly(s) with sequence similarity and/or amino acid composition similarity to repeat domains of natural silk proteins. Using peptides, it is possible to produce consistent silk-like fibers on a commercial scale that reproduce properties corresponding to natural silk fibers.

いくつかの実施形態では、推定絹配列の一覧は、例えば、「spidroin」、「fibroin」、「MaSp」などの関連用語をGenBankで検索して収集することができ、それらの配列を、別個に取り組んだ配列決定により得たさらなる配列と一緒にプールすることができる。その後、配列をアミノ酸に翻訳して重複エントリーをフィルタリングし、手作業で各ドメイン(NTD、REP、CTD)に分割する。いくつかの実施形態では、候補アミノ酸配列を、ピキア(コマガテラ)パストリス(Pichia(Komagataella)pastoris)での発現用に最適化されたDNA配列に逆翻訳する。DNA配列をそれぞれ発現ベクターにクローニングし、Pichia(Komagataella)pastorisに形質転換する。いくつかの実施形態では、発現及び分泌の成功を示した各種の絹ドメインはその後、組み合わせ様式でアセンブルされ、繊維形成能のある絹分子が構築される。 In some embodiments, a list of putative silk sequences can be collected, e.g., by searching GenBank for related terms such as "spidroin", "fibroin", "MaSp", etc., and the sequences are collected separately. Can be pooled together with additional sequences obtained from sequencing efforts. The sequence is then translated into amino acids, duplicate entries are filtered, and manually divided into domains (NTD, REP, CTD). In some embodiments, the candidate amino acid sequence is back-translated into a DNA sequence optimized for expression in Pichia (Komagataella) pastoris. Each DNA sequence is cloned into an expression vector and transformed into Pichia (Komagataella) pastoris. In some embodiments, the various silk domains that have demonstrated successful expression and secretion are then assembled in a combinatorial fashion to construct a silk molecule capable of fiber formation.

絹ポリペプチドは特徴的に、反復ドメイン(REP)に非反復領域(例えば、C末端ドメイン及びN末端ドメイン)が隣接して構成される。一実施形態では、C末端ドメイン及びN末端ドメインのいずれも75~350アミノ酸長である。反復ドメインは図1に示すように階層構造を示す。反復ドメインは一連のブロック(反復単位とも呼ばれる)を含む。ブロックは、絹の反復ドメイン全体にわたり、ときに完全に、ときに不完全に(準反復ドメインを構成)繰り返される。ブロックの長さ及び組成は、異なる絹の種類間、また異なる種間で変わってくる。表1は、選択した種及び絹種のブロック配列例の一覧であり、さらなる例が、Rising,A.et al.,Spider silk proteins:recent advances in recombinant production,structure-function relationships and biomedical applications,Cell Mol.Life Sci.,68:2,pg 169-184(2011)、及びGatesy,J.et al.,Extreme diversity,conservation,and convergence of spider silk fibroin sequences,Science,291:5513,pg.2603-2605(2001)に記載されている。場合によっては、ブロックを通常パターンで並べ、絹配列の反復ドメインに複数回(通常2~8回)出現する、より大きなマクロリピートを形成してよい。反復ドメインまたはマクロリピートの内側で繰り返されるブロックと、反復ドメイン内で繰り返されるマクロリピートとを間隔エレメントで分離してよい。いくつかの実施形態では、ブロック配列はグリシンに富む領域と、それに続くポリA領域とを含む。いくつかの実施形態では、短い(約1~10)アミノ酸モチーフがブロック内に複数回出現する。本発明の目的上、円順列とは関係なく、異なる天然絹ポリペプチドに由来するブロックを選択することができる(すなわち、同定されたブロックが他の点で絹ポリペプチド間で類似の場合に円順列のため整列しないことがある)。したがって、例えば、SGAGG(SEQ ID NO:494)という「ブロック」は本発明の目的上、GSGAG(SEQ ID NO:495)と同じであり、またGGSGA(SEQ ID NO:496)と同じであり、それらはいずれも互いに円順列にすぎない。所与の絹配列について選択された特定順列は、他の何よりも利便性により決定され得る(通常、Gで開始)。NCBIデータベースから得た絹配列は、ブロック及び非反復領域に分割することができる。 Silk polypeptides are characteristically composed of repetitive domains (REPs) flanked by non-repetitive regions (eg, C-terminal and N-terminal domains). In one embodiment, both the C-terminal domain and the N-terminal domain are 75-350 amino acids long. Repeat domains exhibit a hierarchical structure as shown in FIG. A repeat domain comprises a series of blocks (also called repeat units). The blocks are sometimes completely and sometimes imperfectly repeated (constituting quasi-repetitive domains) throughout the silk repeat domain. The length and composition of the blocks vary between different silk types and between different species. Table 1 lists example block sequences for selected species and silk species; further examples are found in Rising, A.; et al. , Spider silk proteins: recent advances in recombinant production, structure-function relationships and biomedical applications, Cell Mol. Life Sci. , 68:2, pg 169-184 (2011), and Gatesy, J. et al. et al. , Extreme diversity, conservation, and convergence of spider silk fibroin sequences, Science, 291:5513, pg. 2603-2605 (2001). In some cases, blocks may be arranged in a regular pattern to form larger macrorepeats that occur multiple times (usually 2-8 times) in repeat domains of silk sequences. A spacing element may separate a repeated block within a repeat domain or macrorepeat and a repeated macrorepeat within the repeat domain. In some embodiments, the blocking sequence comprises a glycine-rich region followed by a poly A region. In some embodiments, short (about 1-10) amino acid motifs occur multiple times within a block. For the purposes of the present invention, blocks derived from different natural silk polypeptides can be selected regardless of circular permutation (i.e. circular permutation if identified blocks are otherwise similar among silk polypeptides). may not be sorted due to permutation). Thus, for example, a "block" of SGAGG (SEQ ID NO:494) is for the purposes of the present invention the same as GSGAG (SEQ ID NO:495) and the same as GGSGA (SEQ ID NO:496); They are all just circular permutations of each other. The particular permutation chosen for a given silk sequence may be determined by convenience (usually starting with G), among other things. Silk sequences obtained from the NCBI database can be divided into blocks and non-repetitive regions.

(表1)ブロック配列試料

Figure 0007246102000001
Figure 0007246102000002
(Table 1) Block sequence sample
Figure 0007246102000001
Figure 0007246102000002

本発明特定の実施形態による、ブロック及び/またはマクロリピートドメイン由来の繊維形成ブロック共重合体ポリペプチドは、参照により組み込まれる国際公開公報第WO/2015/042164号に記載されている。GenBankなどのタンパク質データベースから得た天然絹配列、または新規に行った配列決定により得た天然絹配列はドメイン(N末端ドメイン、反復ドメイン、及びC末端ドメイン)により破壊される。合成後に集合させて繊維を構築するために選択されるN末端ドメイン及びC末端ドメインの配列には、天然アミノ酸配列情報及び本明細書に記載の他の修飾が含まれる。反復ドメインを反復配列に分解するが、この反復配列は、重要なアミノ酸情報を獲得する代表的ブロック(通常は1~8で、絹の種類による)を含有する一方で、アミノ酸をコードするDNAの大きさを、容易に合成可能な断片まで縮小する。いくつかの実施形態では、適切に形成されたブロック共重合体ポリペプチドは、少なくとも1つの反復配列を含む少なくとも1つの反復ドメインを含み、任意選択で、N末端ドメイン及び/またはC末端ドメインを隣接させる。 Fibre-forming block copolymer polypeptides derived from block and/or macrorepeat domains, according to certain embodiments of the present invention, are described in International Publication No. WO/2015/042164, which is incorporated by reference. Natural silk sequences obtained from protein databases such as GenBank or from de novo sequencing are disrupted by domains (N-terminal domain, repeat domain, and C-terminal domain). The N-terminal and C-terminal domain sequences selected for post-synthetic assembly into fibers include the native amino acid sequence information and other modifications described herein. Repeat domains are broken down into repetitive sequences, which contain representative blocks (usually 1-8, depending on the type of silk) that capture important amino acid information, while the DNA encoding the amino acids Reduce the size to easily synthesizable fragments. In some embodiments, a suitably formed block copolymer polypeptide comprises at least one repeat domain comprising at least one repeat sequence, optionally flanked by an N-terminal domain and/or a C-terminal domain. Let

いくつかの実施形態では、反復ドメインは少なくとも1つの反復配列を含む。いくつかの実施形態では、反復配列は150~300アミノ酸残基である。いくつかの実施形態では、反復配列は複数のブロックを含む。いくつかの実施形態では、反復配列は複数のマクロリピートを含む。いくつかの実施形態では、ブロックまたはマクロリピートは複数の反復配列全体において分割される。 In some embodiments, the repeat domain comprises at least one repeat sequence. In some embodiments, the repeat sequence is 150-300 amino acid residues. In some embodiments, the repeat sequence comprises multiple blocks. In some embodiments, the repetitive sequence comprises multiple macrorepeats. In some embodiments, blocks or macrorepeats are split across multiple repeat sequences.

いくつかの実施形態では、反復配列は、DNAアセンブリ要件を満たすため、グリシンで開始され、かつ、フェニルアラニン(F)、チロシン(Y)、トリプトファン(W)、システイン(C)、ヒスチジン(H)、アスパラギン(N)、メチオニン(M)、またはアスパラギン酸(D)で終わることはできない。いくつかの実施形態では、いくつかの反復配列は、天然配列と比べて変化させることができる。いくつかの実施形態では、反復配列は、ポリペプチドのC末端へのセリン付加などにより変化させることができる(F、Y、W、C、H、N、M、またはDでの終止を回避するため)。いくつかの実施形態では、反復配列は、不完全ブロックに別のブロック由来の相同配列を充てんして改変することができる。いくつかの実施形態では、反復配列は、ブロックまたはマクロリピートの順序を再構成して改変することができる。 In some embodiments, the repeat sequence begins with a glycine and contains phenylalanine (F), tyrosine (Y), tryptophan (W), cysteine (C), histidine (H), to meet DNA assembly requirements. It cannot end with asparagine (N), methionine (M), or aspartic acid (D). In some embodiments, some repetitive sequences may be altered compared to native sequences. In some embodiments, repetitive sequences can be altered, such as by adding a serine to the C-terminus of the polypeptide (avoiding termination at F, Y, W, C, H, N, M, or D For). In some embodiments, repetitive sequences can be modified by filling incomplete blocks with homologous sequences from another block. In some embodiments, repeat sequences can be altered by rearranging the order of blocks or macrorepeats.

いくつかの実施形態では、非反復のN末端及びC末端のドメインを合成用に選択することができる。いくつかの実施形態では、N末端ドメインは、リーディングシグナル配列、例えば、SignalPにより同定されたものなどの除去によるものであり得る(Peterson,T.N.,et.Al.,SignalP 4.0:discriminating signal peptides from transmembrane regions,Nat.Methods,8:10,pg.785-786(2011)。 In some embodiments, non-repetitive N-terminal and C-terminal domains can be selected for synthesis. In some embodiments, the N-terminal domain may be due to the removal of a leading signal sequence, such as that identified by SignalP (Peterson, TN, et.Al., SignalP 4.0: Discriminating signal peptides from transmembrane regions, Nat. Methods, 8:10, pg.785-786 (2011).

いくつかの実施形態では、N末端ドメイン配列、反復配列、またはC末端ドメイン配列は、アゲレノプシス・アペルタ(Agelenopsis aperta)、アリアチプス・グロサス(Aliatypus gulosus)、アフォノペルマ・シーマニー(Aphonopelma seemanni)、アプトスチチュス種(Aptostichus sp.)AS217、アプトスチチュス種AS220、アラネウス・ディアデマツス(Araneus diadematus)、アラネウス・ゲムモイデス(Araneus gemmoides)、アラネウス・ヴェントリコサス(Araneus ventricosus)、アルギオペ・アモエナ(Argiope amoena)、アルギオペ・アルゲンタタ(Argiope argentata)、アルギオペ・ブルエンニチ(Argiope bruennichi)、アルギオペ・トリファスシアタ(Argiope trifasciata)、アチポイデス・リヴェルシ(Atypoides riversi)、アヴィキュラリア・ジュルエンシス(Avicularia juruensis)、ボスリオシルツム・カリフォルニカム(Bothriocyrtum californicum)、デイノピス・スピノサ(Deinopis Spinosa)、ディグエチア・カニチエス(Diguetia canities)、ドロメデス・テネブロサス(Dolomedes tenebrosus)、エウアグルス・キソセウス(Euagrus chisoseus)、エウプロスセノプス・オーストラリス(Euprosthenops australis)、ガステラキャンタ・マンモサ(Gasteracantha mammosa)、ヒポキルス・トレルリ(Hypochilus thorelli)、ククルカニア・ヒベルナリス(Kukulcania hibernalis)、ラトロデクツス・ヘスペルス(Latrodectus hesperus)、メガヘクスラ・フルヴァ(Megahexura fulva)、メテペイラ・グランディオサ(Metepeira grandiosa)、ネフィラ・アンチポディアナ(Nephila antipodiana)、ネフィラ・クラヴァタ(Nephila clavata)、ネフィラ・クラヴィペス(Nephila clavipes)、ネフィラ・マダガスカリエンシス(Nephila madagascariensis)、ネフィラ・ピリペス(Nephila pilipes)、ネフィレンギス・クルエンタタ(Nephilengys cruentata)、パラウィキシア・ビストリアタ(Parawixia bistriata)、ペウセチア・ヴィリダンス(Peucetia viridans)、プレクトレウリス・トリスチス(Plectreurys tristis)、ポエシロセリア・レガリス(Poecilotheria regalis)、テトラグナタ・カウアイエンシス(Tetragnatha kauaiensis)、またはウロボルス・ディヴェルサス(Uloborus diversus)に由来し得る。 In some embodiments, the N-terminal domain sequence, repeat sequence, or C-terminal domain sequence is derived from Agelenopsis aperta, Aliatypus gulosus, Aphonopelma seemanni, Aptostichus sp. sp.) AS217, Aptostichus sp. AS220, Araneus diadematus, Araneus gemmoides, Araneus ventricosus, Argiope amoena, Argiope amoena (Argoate amoena) 、アルギオペ・ブルエンニチ(Argiope bruennichi)、アルギオペ・トリファスシアタ(Argiope trifasciata)、アチポイデス・リヴェルシ(Atypoides riversi)、アヴィキュラリア・ジュルエンシス(Avicularia juruensis)、ボスリオシルツム・カリフォルニカム(Bothriocyrtum californicum)、デイノピス・スピノサ(Deinopis Spinosa), Diguetia canities, Dolomedes tenebrosus, Euagrus chisoseus, Euprosthenops australis, Gasteracantha mammosacan 、ヒポキルス・トレルリ(Hypochilus thorelli)、ククルカニア・ヒベルナリス(Kukulcania hibernalis)、ラトロデクツス・ヘスペルス(Latrodectus hesperus)、メガヘクスラ・フルヴァ(Megahexura fulva)、メテペイラ・グランディオサ(Metepeira grandiosa)、ネフィラ・アンチポディアナ(Nephila antipodiana ), Nephila clavat a), Nephila clavipes, Nephila madagascariensis, Nephila pilipes, Nephilengys cruentata, Parawixia bistriata, Parawixia vitriata (Peucetia viridans), Plectreurys tristis, Poecilotheria regalis, Tetragnatha kauaiensis, or Uloborus diversus.

いくつかの実施形態では、絹ポリペプチドヌクレオチドコード配列は、アルファ接合因子ヌクレオチドコード配列に機能的に連結され得る。いくつかの実施形態では、絹ポリペプチドヌクレオチドコード配列は、別の内在性または異種の分泌シグナルコード配列に機能的に連結され得る。いくつかの実施形態では、絹ポリペプチドヌクレオチドコード配列は、3X FLAGヌクレオチドコード配列に機能的に連結され得る。いくつかの実施形態では、絹ポリペプチドヌクレオチドコード配列は、6~8のHis残基(SEQ ID NO: 520)などの他のアフィニティータグに機能的に連結される。
In some embodiments, a silk polypeptide nucleotide coding sequence can be operably linked to an alpha mating factor nucleotide coding sequence. In some embodiments, a silk polypeptide nucleotide coding sequence can be operably linked to another endogenous or heterologous secretory signal coding sequence. In some embodiments, a silk polypeptide nucleotide coding sequence can be operably linked to a 3X FLAG nucleotide coding sequence. In some embodiments, the silk polypeptide nucleotide coding sequence is operably linked to other affinity tags such as 6-8 His residues (SEQ ID NO: 520) .

絹様ポリペプチド
いくつかの実施形態では、本明細書に開示するP.pastoris株は絹様ポリペプチドを発現するよう改変されている。絹様ポリペプチドの好ましい実施形態の製造方法は、参照により本明細書に組み込まれるWO2015/042164で、特に、第114段落~第134段落にて提供されている。そこでは、MaSp2、例えば、Argiope bruennichi種などに由来する組換えクモ糸タンパク質断片配列に基づく合成タンパク質性共重合体が開示されている。2~20の反復単位が含まれた絹様ポリペプチドが記載されており、そこでは、各反復単位の分子量は約20kDaより大きい。共重合体の各反復単位内部には、多数の「準反復単位」に組織化されている約60を超えるアミノ酸残基がある。いくつかの実施形態では、本開示に記載するポリペプチドの反復単位は、クモ牽引糸のMaSp2タンパク質配列に対する配列同一性が少なくとも95%である。
Silk-Like Polypeptides In some embodiments, the P. spp. pastoris strains have been modified to express silk-like polypeptides. Methods for producing preferred embodiments of silk-like polypeptides are provided in WO2015/042164, specifically paragraphs 114-134, incorporated herein by reference. There, synthetic proteinaceous copolymers based on recombinant spider silk protein fragment sequences from MaSp2, such as Argiope bruennichi species, are disclosed. Silk-like polypeptides containing 2-20 repeat units have been described, where each repeat unit has a molecular weight greater than about 20 kDa. Within each repeating unit of the copolymer are over about 60 amino acid residues that are organized into a number of "quasi-repeating units." In some embodiments, the repeat units of the polypeptides described in this disclosure have at least 95% sequence identity to the MaSp2 protein sequence of spider silk.

いくつかの実施形態では、絹様ポリペプチドの各「反復単位」は、2~20の「準反復」単位(すなわち、nは2~20である)を含む。準反復は正確な反復である必要はない。各反復は、連鎖状の準反復で構成され得る。方程式1は、本開示及び参照により組み込まれるWO2015/042164に従った反復単位の組成を示す。各絹様ポリペプチドは、方程式1により定義される反復単位を1つ以上有し得る。
{GGY-[GPG-Xn1-GPS-(A)n2n3 (SEQ ID NO: 514)。(方程式1)
In some embodiments, each “repeat unit” of the silk-like polypeptide comprises 2-20 “quasi-repeat” units (ie, n3 is 2-20). A quasi-repetition need not be an exact repetition. Each repeat may consist of concatenated quasi-repeats. Equation 1 shows the repeat unit composition according to this disclosure and WO2015/042164, which is incorporated by reference. Each silk-like polypeptide may have one or more repeating units defined by Equation 1.
{GGY-[GPG-X 1 ] n1 -GPS-(A) n2 } n3 (SEQ ID NO: 514) . (equation 1)

組成の可変要素X(「モチーフ」と呼ばれる)は、以下の方程式2に示すアミノ酸配列のいずれか1つに従い、Xは各準反復単位内で無作為に変動する。
=SGGQQ(SEQ ID NO: 515)またはGAGQQ(SEQ ID NO: 516)またはGQGPY(SEQ ID NO: 517)またはAGQQ(SEQ ID NO: 518)またはSQ
(方程式2)
The compositional variable X 1 (referred to as the “motif”) follows any one of the amino acid sequences shown in Equation 2 below, with X 1 varying randomly within each quasi-repeat unit.
X 1 = SGGQQ (SEQ ID NO: 515) or GAGQQ (SEQ ID NO: 516) or GQGPY (SEQ ID NO: 517) or AGQQ (SEQ ID NO: 518) or SQ
(equation 2)

再び方程式1に言及すると、方程式1で「GGY-[GPG-Xn1-GPS」(SEQ ID NO: 521)で表される準反復単位の組成要素は、「第1の領域」と呼ばれる。準反復単位は、一部は、その準反復単位内で第1の領域が4~8回繰り返されて形成される。すなわち、nの値は、単一の準反復単位内で繰り返される第1領域単位の数を示し、かかるnの値は4、5、6、7または8のいずれか1つである。「(A)n2(SEQ ID NO: 522)で表される組成要素(すなわち、ポリA配列)は「第2の領域」と呼ばれ、それぞれの準反復単位内でアミノ酸配列「A」をn回繰り返すこと(SEQ ID NO: 522)により形成される。すなわち、nの値は、単一準反復単位内で繰り返される第2領域単位の数を示し、かかるnの値は、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20のいずれか1つである。いくつかの実施形態では、本開示のポリペプチドの反復単位は、方程式1及び2に記載の準反復を含有する配列に対する配列同一性が少なくとも95%である。いくつかの実施形態では、本開示のポリペプチドの反復単位は、方程式1及び2に記載の準反復を含有する配列に対する配列同一性が少なくとも80%、または少なくとも90%、または少なくとも95%、または少なくとも99%である。
Referring again to Equation 1, the constituent elements of the quasi-repeat unit represented in Equation 1 by "GGY-[GPG-X 1 ] n1 -GPS" (SEQ ID NO: 521) are referred to as the "first region." . A quasi-repeat unit is formed in part by 4 to 8 repetitions of the first region within the quasi-repeat unit. That is, the value of n1 indicates the number of first region units repeated within a single quasi-repeated unit, such value of n1 being any one of 4, 5, 6, 7 or 8. The building block (i.e., the polyA sequence) designated "(A) n2 " (SEQ ID NO: 522 ) is referred to as the "second region" and contains the amino acid sequence "A" within each quasi-repeat unit. n is formed by repeating twice (SEQ ID NO: 522) . That is, the value of n2 indicates the number of second region units repeated within a single quasi-repeat unit, such values of n2 being 6, 7, 8, 9, 10, 11, 12, 13, 14 , 15, 16, 17, 18, 19, or 20. In some embodiments, the repeat units of the polypeptides of this disclosure have at least 95% sequence identity to the sequences containing the quasi-repeats set forth in Equations 1 and 2. In some embodiments, the repeat units of the polypeptides of the present disclosure have at least 80% sequence identity, or at least 90%, or at least 95% sequence identity to sequences containing quasi-repeats according to Equations 1 and 2, or At least 99%.

さらなる実施形態では、3つの「長い」準反復には、3つの「短い」準反復単位が続く。短い準反復単位は、n=4または5のものである。長い準反復単位は、n=6、7または8のものと定義される。いくつかの実施形態では、短い準反復のいずれも、反復単位の各準反復単位内の同じ位置に同じXモチーフを有する。いくつかの実施形態では、6つの準反復単位のうち3つ以下の準反復単位が同じXモチーフを共有する。 In a further embodiment, three "long" quasi-repeats are followed by three "short" quasi-repeat units. Short quasi-repeat units are those with n 1 =4 or 5. Long quasi-repeat units are defined as those with n 1 =6, 7 or 8. In some embodiments, both short quasi-repeats have the same X 1 motif at the same position within each quasi-repeat of the repeat unit. In some embodiments, no more than 3 of the 6 quasi-repeat units share the same X1 motif.

さらなる実施形態では、反復単位は、反復単位内部で同じXを続けて3回以上出現させて用いない準反復単位で構成される。さらなる実施形態では、反復単位は準反復単位で構成され、ここで、準反復のうち少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19または20の準反復は、反復単位の単一準反復単位内で同じXを続けて3回以上用いない。 In a further embodiment, the repeating unit is composed of quasi-repeating units that do not use the same X 1 three or more times in a row within the repeating unit. In a further embodiment, the repeat unit is composed of quasi-repeat units, wherein at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 of the quasi-repeats , 15, 16, 17, 18, 19 or 20 quasi-repeats do not use the same X 1 more than 3 times consecutively within a single quasi-repeat unit of the repeating unit.

したがって、いくつかの実施形態において、本明細書は、低分解性の絹様ポリペプチドを組換えにより発現して、細胞培養物から単離された産物に存在する完全長ポリペプチドの量を増大させる酵母菌株を提供する。いくつかの実施形態では、絹様ポリペプチドを発現する菌株は、P.pastoris株であり、PAS_chr4_0584ノックアウト及びPAS_chr3_1157ノックアウトを含む。 Thus, in some embodiments, the present disclosure recombinantly expresses a low-degradation silk-like polypeptide to increase the amount of full-length polypeptide present in products isolated from cell culture. Provided is a yeast strain that causes In some embodiments, the strain expressing the silk-like polypeptide is P. pastoris strain and contains the PAS_chr4_0584 knockout and the PAS_chr3_1157 knockout.

同等物及び範囲
当業者は、慣用となっている範囲の実験方法を使用して、ここに記載される本発明に従った具体的な実施形態の多くの同等物を認識する、または確認することができるであろう。本発明の範囲は、上記の「発明を実施するための形態」に限定されることを意図しておらず、むしろその範囲は添付の特許請求の範囲に記載されるものである。
Equivalents and Ranges Those skilled in the art will recognize, or be able to ascertain using no more than routine experimentation, many equivalents to the specific embodiments in accordance with the invention described herein. would be possible. The scope of the invention is not intended to be limited to the above Detailed Description, but rather the scope is set forth in the appended claims.

請求項において、「a」、「an」、及び「the」などの冠詞は、別段の記載があるかまたは文脈から明らかに他の意味に解釈されない限り、1つまたは2つそれ以上を意味し得る。ある群の1つ以上の構成要素の間に「または」が含まれる請求項または記載は、その群の構成要素のうち1つ、2つ以上、もしくは全部が、所与の産物または工程に存在する、使用されている、もしくは他の点で関連していれば、別段の記載があるかまたは文脈から明らかに他の意味に解釈されない限り、要件を満たすものとみなされる。本発明には、所与の産物または工程に、群の構成要素が正確に1つ存在する、使用されている、もしくは他の点で関連している実施形態が含まれる。本発明には、所与の産物または工程に、群の構成要素の2つ以上または全部が存在する、使用されている、もしくは他の点で関連している実施形態が含まれる。 In the claims, articles such as "a," "an," and "the" mean one or more than one unless stated otherwise or construed otherwise clearly from the context. obtain. A claim or statement that includes "or" between one or more members of a group indicates that one, more than one, or all of the members of that group are present in a given product or process. used, or otherwise related, shall be deemed to satisfy the requirement unless stated otherwise or construed otherwise clearly from the context. The invention includes embodiments in which exactly one member of the group is present, used, or otherwise related to a given product or process. The invention includes embodiments in which two or more or all of the group members are present, used, or otherwise associated with a given product or process.

用語「含む(comprising)」は、非限定的で許容されることを意図するが、さらなる要素またはステップを含める必要はないことにも留意する。本明細書で用語「含む(comprising)」を使用する場合、用語「からなる(consisting of)」もそのように包含され開示される。 It is also noted that the term "comprising" is intended to be open-ended and permissive, but need not include additional elements or steps. Where the term "comprising" is used herein, the term "consisting of" is so included and disclosed.

範囲が与えられている場合は端点が含まれる。さらに、別段の定めがなく、文脈及び当業者の理解により他の意味が明らかでもない限り、範囲として表される値は、文脈で特に明確に指示されない限り、本発明の異なる実施形態における記述範囲内のいかなる特定の値もしくは部分的範囲も、その範囲の下限の10分の1の単位までとることができることを理解されるべきである。 The endpoints are included if a range is given. Further, unless otherwise stated and the context and understanding of one of ordinary skill in the art make other senses apparent, values expressed as ranges may vary from the stated range in different embodiments of the invention, unless the context clearly dictates otherwise. It is to be understood that any particular value or subrange within can be taken to tenths of the lower limit of that range.

すべての引用元、例えば、参考文献、刊行物、データベース、データベースエントリー、及び本明細書で引用した技術は、たとえ引用中に明示的記述がない場合でも参照により本出願に組み込まれる。引用元の記述と本出願で矛盾がある場合は、本出願の記述が優先するものとする。 All sources, such as references, publications, databases, database entries, and art cited herein are incorporated by reference into this application even if not explicitly stated in the citation. If there is any discrepancy between the description of the cited source and this application, the description of this application shall prevail.

小見出し及び表のタイトルは限定されることを意図しない。 Subheadings and table titles are not intended to be limiting.

以下は、本発明を実施するための具体的な実施形態例である。それらの例は、あくまで事例を提供するのみであり、本発明の範囲を何ら限定するものではない。使用する数字(例えば、量、温度など)に関して正確さを保証するべく試みがなされたが、実験上の一部の誤差及び偏差は当然のことながら許容されるべきである。 Below are specific example embodiments for carrying out the present invention. These examples are provided for illustration only and are not intended to limit the scope of the invention in any way. Efforts have been made to ensure accuracy with respect to numbers used (eg amounts, temperature, etc.) but some experimental errors and deviations should, of course, be allowed for.

本発明の実施には、特に明記しない限り、当技術分野の技術の範囲内であるタンパク質化学、生化学、組換えDNA技術及び薬理学の従来方法が使用される。そのような技術は文献に十分な記載がある。例えば、T.E.Creighton,Proteins:Structures and Molecular Properties(W.H.Freeman and Company,1993)、A.L.Lehninger,Biochemistry(Worth Publishers,Inc.,current addition)、Sambrook,et al.,Molecular Cloning: A Laboratory Manual(2nd Edition,1989)、Methods In Enzymology(S.Colowick and N.Kaplan eds.,Academic Press,Inc.)、Remington’s Pharmaceutical Sciences,18th Edition(Easton,Pennsylvania:Mack Publishing Company,1990)、Carey and Sundberg Advanced Organic Chemistry 3rd Ed.(Plenum Press) Vols A and B(1992)を参照のこと。 The practice of the present invention employs conventional methods of protein chemistry, biochemistry, recombinant DNA techniques and pharmacology within the skill of the art, unless otherwise indicated. Such techniques are well described in the literature. For example, T. E. Creighton, Proteins: Structures and Molecular Properties (WH Freeman and Company, 1993); L. Lehninger, Biochemistry (Worth Publishers, Inc., current addition), Sambrook, et al. ,Molecular Cloning: A Laboratory Manual(2nd Edition,1989)、Methods In Enzymology(S.Colowick and N.Kaplan eds.,Academic Press,Inc.)、Remington's Pharmaceutical Sciences,18th Edition(Easton,Pennsylvania:Mack Publishing Company, 1990), Carey and Sundberg Advanced Organic Chemistry 3rd Ed. (Plenum Press) Vols A and B (1992).

実施例1:18Bを発現している組換え酵母の作製
最初に、以降の編集及び工学的操作を容易にするため、P.pastorisの菌株を形質転換してKU70機能を抑止した。Pichia pastoris(コマガテラ・ファフィ(Komagataella phaffii))株のHIS+誘導体であるGS115(NRRL Y15851)を、ゼオシン耐性マーカーに隣接させたホモロジーアームからなる、KU70座位を標的にするDNAカセットを用いて電気穿孔した。カセットのマップを図1に示し、配列を表10に記載する。ゼオシンを添加したYPD寒天プレートに形質転換体を播種した。この結果、KU70機能が抑止された。
Example 1 Generation of Recombinant Yeast Expressing 18B Initially, to facilitate subsequent editing and engineering, P. KU70 function was abrogated by transforming strains of S.pastoris. GS115 (NRRL Y15851), a HIS+ derivative of Pichia pastoris (Komagataella phaffii) strain, was electroporated with a DNA cassette targeting the KU70 locus, consisting of homology arms flanked by zeocin resistance markers. . A map of the cassette is shown in FIG. 1 and the sequences are listed in Table 10. Transformants were plated on YPD agar plates supplemented with zeocin. As a result, KU70 function was inhibited.

その後、この株を、絹様ポリペプチドをコードする組換え遺伝子を発現するよう改変した。Pichia pastoris(Komagataella phaffii)株のHIS+誘導体であるGS115(NRRL Y15851)を、絹様ポリペプチド(「18B」)(SEQ ID NO:463)の発現及び分泌が生じるよう組換えベクター(SEQ ID NO:462)を用いて形質転換した。形質転換は、参照により本明細書に組み込まれるPMID15679083に記載の電気穿孔法により達成された。 This strain was then modified to express a recombinant gene encoding a silk-like polypeptide. GS115 (NRRL Y15851), a HIS+ derivative of Pichia pastoris (Komagataella phaffii) strain, was transformed into a recombinant vector (SEQ ID NO: 463) to effect expression and secretion of silk-like polypeptide (“18B”) (SEQ ID NO: 463). 462). Transformation was accomplished by electroporation as described in PMID 15679083, incorporated herein by reference.

各ベクターには、組換えベクターにおいて絹様タンパク質をコードするポリヌクレオチド配列と、それに隣接するプロモーター(pGCW14)及び終結因子(tAOX1 pAシグナル)とを有する18B発現カセットが含まれる。組換えベクターはさらに、細菌及び酵母の形質転換体を選択する優性耐性マーカー、及び細菌の複製起点を含んだ。第1の組換えベクターには、Pichia pastorisゲノムのAOX2座位の3’に隣接するよう18Bポリヌクレオチド配列の組み込みを誘導する指向性領域が含まれた。第1のベクターの耐性マーカーはG418(別名ジェネティシン)に対する耐性を付与した。第2の組換えベクターには、Pichia pastorisゲノムのTEF1座位の3’に隣接するよう18Bポリヌクレオチド配列の組み込みを誘導する指向性領域が含まれた。第2のベクターの耐性マーカーはハイグロマイシンBに対する耐性を付与した。 Each vector contains an 18B expression cassette with a polynucleotide sequence encoding a silk-like protein in a recombinant vector, flanked by a promoter (pGCW14) and a terminator (tAOX1 pA signal). The recombinant vector further contained a dominant resistance marker to select for bacterial and yeast transformants, and a bacterial origin of replication. The first recombinant vector contained a directional region that directs the integration of the 18B polynucleotide sequence into the Pichia pastoris genome 3' adjacent to the AOX2 locus. A resistance marker in the first vector conferred resistance to G418 (aka geneticin). The second recombinant vector contained a directional region that directs the integration of the 18B polynucleotide sequence into the Pichia pastoris genome 3' adjacent to the TEF1 locus. A resistance marker in the second vector conferred resistance to hygromycin B.

実施例2:単一プロテアーゼKO変異体のライブラリーの生成
組換え型Pichia pastoris株において18Bの形質転換及び分泌に成功した後、プロテアーゼをコードする65のオープンリーディングフレーム(ORF)を個別に欠失標的とした(表2)。細胞を、ノーセオスリシン耐性マーカーに隣接して約1150bpのホモロジーアームを有するDNAカセットを含んだベクターで形質転換した。ノーセオスリシン耐性マーカーを含むプラスミドマップを図2に示し、配列を表11に記載する。
Example 2: Generation of a library of single protease KO mutants After successful transformation and secretion of 18B in a recombinant Pichia pastoris strain, 65 open reading frames (ORFs) encoding proteases were individually deleted. targeted (Table 2). Cells were transformed with a vector containing a DNA cassette with approximately 1150 bp of homology arms flanked by a nourseothricin resistance marker. A plasmid map containing the nourseothricin resistance marker is shown in FIG. 2 and the sequences are listed in Table 11.

それぞれの標的に使用されるホモロジーアームを表7に記載のプライマーで増幅させ、ノーセオスリシン耐性プラスミドに挿入した。ホモロジーアームをノーセオスリシンプラスミドに挿入して、図3A及び図3Bに示すように、標的プロテアーゼに対する3’及び5’のホモロジーアームに挟まれたノーセオスリシン耐性マーカーを含むカセットを作製した。図3Aには、ホモロジーアーム(HA1及びHA2)に挟まれた耐性カセット(Nour耐性カセット)を示す。図3Bには、ノーセオスリシンマーカーの詳細を示し、サッカロミセス・セレビシエ(Saccharomyces cerevisiae)(pILV5)のILV5遺伝子由来のプロモーター、ストレプトマイセス・ノウルセイ(Streptomyces noursei)(nat)由来のノーセオスリシンアセチルトランスフェラーゼ遺伝子、及びSaccharomyces cerevisiaeのCYC1遺伝子由来のポリAシグナルが含まれている。 The homology arms used for each target were amplified with the primers listed in Table 7 and inserted into nourseothricin-resistant plasmids. The homology arms were inserted into the nourseothricin plasmid to create a cassette containing a nourseothricin resistance marker flanked by 3' and 5' homology arms to the target protease, as shown in Figures 3A and 3B. FIG. 3A shows the resistance cassette (Nour resistance cassette) flanked by homology arms (HA1 and HA2). FIG. 3B shows the details of the nourseothricin markers, the promoter from the ILV5 gene of Saccharomyces cerevisiae (pILV5), the promoter of the nourseothricin acetyltransferase from Streptomyces noursei (nat). genes and the polyA signal from the CYC1 gene of Saccharomyces cerevisiae.

各ベクターのホモロジーアームは、表2に記載の65の所望プロテアーゼ遺伝子座のうちの1つを標的とした。ノーセオスリシンを添加したYPD寒天プレートに形質転換体を播種し、30℃で48時間インキュベートした。 The homology arms of each vector targeted one of the 65 desired protease loci listed in Table 2. Transformants were plated on YPD agar plates supplemented with nourseothricin and incubated at 30° C. for 48 hours.

(表2)P.Pastoris株で欠失標的とされるプロテアーゼ

Figure 0007246102000003
(Table 2) P.I. Proteases targeted for deletion in Pastoris strains
Figure 0007246102000003

実施例3:タンパク質低分解性に関する単一プロテアーゼノックアウトクローンの試験。
得られたクローンを96ウェルブロックの400μLの緩衝グリセロール複合培地(BMGY)に植菌し、1,000rpmで撹拌しながら30℃で48時間インキュベートした。48時間のインキュベーションの後、各培養物の4μLを使用して96ウェルブロックの400μLのBMGYに接種し、その後、30℃で48時間インキュベートした。組換えタンパク質を抽出するため、細胞培養物にグアニジンチオシアン酸塩を最終濃度が2.5Mになるよう加えた。5分のインキュベーションの後、溶液を遠心分離にかけ、上清を採取してウェスタンブロットで解析した。
Example 3: Testing of single protease knockout clones for low proteolytic degradation.
The resulting clones were inoculated into 400 μL buffered glycerol complex medium (BMGY) in a 96-well block and incubated at 30° C. for 48 hours with agitation at 1,000 rpm. After 48 hours of incubation, 4 μL of each culture was used to inoculate 400 μL of BMGY in a 96-well block, followed by incubation at 30° C. for 48 hours. To extract the recombinant protein, guanidine thiocyanate was added to the cell culture to a final concentration of 2.5M. After 5 minutes of incubation, the solution was centrifuged and the supernatant was collected and analyzed by Western blot.

各プロテアーゼノックアウトの代表的クローンについてのウェスタンブロットデータを図3に示す。単一プロテアーゼ欠失は、ウェスタンブロットで検出された絹断片の分布に識別可能な影響を示さなかった。 Western blot data for representative clones of each protease knockout are shown in FIG. Single protease deletion had no discernible effect on the distribution of silk fragments detected by Western blot.

実施例4:プロテアーゼのダブルノックアウトのライブラリーの生成
個々のKOに加え、ペアの異なるさまざまな組み合わせのプロテアーゼをノックアウトした。これらのプロテアーゼは、一部には、互いに対する代償性機能を有し得るパラログであったことから選択された。
Example 4 Generation of Double Knockout Libraries of Proteases In addition to individual KOs, different combinations of proteases in different pairs were knocked out. These proteases were chosen in part because they were paralogs that could have compensatory functions for each other.

ダブルノックアウトを生じさせるため、実施例2で作製した単一プロテアーゼノックアウト株からノーセオスリシン耐性を消失させ、第2のプロテアーゼは、実施例2に記載の第2のノーセオスリシン耐性カセットでの形質転換により欠失させた。ノーセオスリシンを添加したYPD寒天プレートに形質転換体を播種し、30℃で48時間インキュベートした。試験したダブルプロテアーゼノックアウトを表3に記載する。 To generate a double knockout, nourseothricin resistance was eliminated from the single protease knockout strain generated in Example 2, and the second protease was deleted by transformation with the second nourseothricin resistance cassette described in Example 2. let me Transformants were plated on YPD agar plates supplemented with nourseothricin and incubated at 30° C. for 48 hours. The double protease knockouts tested are listed in Table 3.

(表3)絹様ポリペプチドを発現しているP.PastorisのプロテアーゼダブルKO株

Figure 0007246102000004
(Table 3) P. cerevisiae expressing silk-like polypeptides. Protease double KO strain of Pastoris
Figure 0007246102000004

実施例5:タンパク質低分解性に関するダブルプロテアーゼノックアウトクローンの試験
得られたクローンを96ウェルブロックの400μLの緩衝グリセロール複合培地(BMGY)に植菌し、1,000rpmで撹拌しながら30℃で48時間インキュベートした。48時間のインキュベーションの後、各培養物の4μLを使用して96ウェルブロックの400μLのBMGYに接種し、その後、30℃で48時間インキュベートした。組換えタンパク質を抽出するため、細胞培養物にグアニジンチオシアン酸塩を最終濃度が2.5Mになるよう加えた。5分のインキュベーションの後、溶液を遠心分離にかけ、上清を採取してウェスタンブロットで解析した。
Example 5 Testing Double Protease Knockout Clones for Low Proteolytic Degradability The resulting clones were inoculated into 96-well blocks of 400 μL buffered glycerol complex medium (BMGY) and stirred at 1,000 rpm at 30° C. for 48 hours. incubated. After 48 hours of incubation, 4 μL of each culture was used to inoculate 400 μL of BMGY in a 96-well block, followed by incubation at 30° C. for 48 hours. To extract the recombinant protein, guanidine thiocyanate was added to the cell culture to a final concentration of 2.5M. After 5 minutes of incubation, the solution was centrifuged and the supernatant was collected and analyzed by Western blot.

図4は、異なるプロテアーゼダブルノックアウト株から得た代表的結果を示す。図示されるように、すべての被験単一ノックアウト株ではタンパク質分解が存在していたにもかかわらず、プロテアーゼノックアウトPAS_chr4_0584とPAS_chr3_1157との組み合わせ(表3の株3)では、分解産物のほぼ完全な消失をもたらした。他のどの組み合わせのプロテアーゼでも分解産物の消失はもたらされなかった。 Figure 4 shows representative results from different protease double knockout strains. As shown, the combination of protease knockouts PAS_chr4_0584 and PAS_chr3_1157 (strain 3 in Table 3) resulted in almost complete loss of degradation products, despite the presence of proteolysis in all single knockout strains tested. brought None of the other combinations of proteases resulted in degradation products disappearance.

実施例6:さらなるプロテアーゼノックアウト株
実施例4及び実施例5に示すように、所望タンパク質の分解を減弱させるため、所望タンパク質(例えば、18B)の産生能がある改変Pichia pastoris細胞をPAS_chr4_0584及びPAS_chr3_1157でのプロテアーゼが欠失するよう形質転換した。完全長産物の産生が増強し、分解が最小限に抑えられるよう、1つ以上のさらなるプロテアーゼをさらにノックアウトした。
Example 6: Additional Protease Knockout Strains As shown in Examples 4 and 5, modified Pichia pastoris cells capable of producing a desired protein (e.g., 18B) were transfected with PAS_chr4_0584 and PAS_chr3_1157 to attenuate the degradation of the desired protein. was transformed to lack the protease of One or more additional proteases were additionally knocked out to enhance production of full-length product and minimize degradation.

さらなるノックアウトそれぞれについて、実施例2に記載の所望遺伝子に指向するホモロジーアームを有するノーセオスリシン耐性カセットを用いた形質転換により、さらなるプロテアーゼ遺伝子を単一プロテアーゼKO(1X KO)、ダブルプロテアーゼKO(2X KO)、三重プロテアーゼKO(3X KO)、または四重プロテアーゼKO(4X KO)から欠失させた。各株でノックアウトされたプロテアーゼ遺伝子を表4に示す。 For each additional knockout, the additional protease gene was converted to single protease KO (1X KO), double protease KO (2X KO) by transformation with a nourseothricin resistance cassette with homology arms pointing to the desired gene as described in Example 2. , triple protease KO (3X KO), or quadruple protease KO (4X KO). Table 4 shows the protease gene knocked out in each strain.

(表4)2X~5XのKO株

Figure 0007246102000005
(Table 4) 2X to 5X KO strains
Figure 0007246102000005

得られた細胞を選択培地プレート(栄養要求性または抗生物質耐性マーカーによる)で単離し、個々のクローンを以降の試験用に単離した。個々のクローンを産物タンパク質産生条件下、液体培養アッセイにより以下のとおり試験した。すなわち、各株の単離されたコロニーを96ウェルブロックの400μLの緩衝グリセロール複合培地(BMGY)に植菌し、1,000rpmで撹拌しながら30℃で48時間インキュベートした。48時間のインキュベーションの後、各培養物の4μLを使用して96ウェルブロックの400μLのBMGYまたは400μLのYPD(酵母エキス・ペプトン・デキストロース培地)に接種し、その後、1,000rpmで撹拌しながら30℃で48時間インキュベートした。 The resulting cells were isolated on selective media plates (by auxotrophic or antibiotic resistance markers) and individual clones were isolated for further testing. Individual clones were tested in a liquid culture assay under product protein production conditions as follows. Briefly, isolated colonies of each strain were inoculated into 400 μL of buffered glycerol complex medium (BMGY) in a 96-well block and incubated at 30° C. with agitation at 1,000 rpm for 48 hours. After 48 hours of incubation, 4 μL of each culture was used to inoculate 400 μL of BMGY or 400 μL of YPD (yeast extract-peptone-dextrose medium) in a 96-well block, followed by 30 μL with agitation at 1,000 rpm. °C for 48 hours.

細胞により発現されたタンパク質を以下のとおり単離して分解について解析した。すなわち、組換えタンパク質を抽出するため、細胞培養物にグアニジンチオシアン酸塩を最終濃度が2.5Mになるよう加えた。5分のインキュベーションの後、溶液を遠心分離にかけ、上清を採取してウェスタンブロットで解析した。 Proteins expressed by the cells were isolated and analyzed for degradation as follows. Briefly, to extract the recombinant protein, guanidine thiocyanate was added to the cell culture to a final concentration of 2.5M. After 5 minutes of incubation, the solution was centrifuged and the supernatant was collected and analyzed by Western blot.

図5は、BMGYまたはYPDに植菌した2X KO、3X KO、4X KO及び5X KO株から得た精製タンパク質のウェスタンブロットの結果を示す。図示されるように、PAS_chr4_0584+PAS_chr3_1157のプロテアーゼノックアウトを有する株(表3の株3)からさらなるプロテアーゼ遺伝子を欠失させたところ、分解産物のさらなる消失がもたらされた。 Figure 5 shows Western blot results of purified proteins from 2X KO, 3X KO, 4X KO and 5X KO strains inoculated in BMGY or YPD. As shown, deletion of additional protease genes from the strain with the PAS_chr4_0584+PAS_chr3_1157 protease knockout (strain 3 in Table 3) resulted in further loss of degradation products.

他の実施形態
使用されている語句は限定する語句ではなく説明する語句であり、添付の特許請求の範囲に記載の範囲内で本発明の真の範囲及び趣旨から逸脱することなく、そのより広い態様において変更を行ってよいことを理解されるべきである。
Other Embodiments The words that have been used are words of description rather than of limitation, and the broader scope of the invention is set forth in the appended claims without departing from the true scope and spirit of the invention. It should be understood that changes may be made in aspects.

本発明は、いくつかの記載実施形態に関してかなり長く、かなり詳細に説明されているが、そのような個々の詳細もしくは実施形態の任意のもの、または特定の実施形態の任意のものに限定されるべきであるということを意図するものではなく、逆に、先行技術に照らして添付の特許請求の範囲の可能な限り最も広い解釈を得るため、そのような特許請求の範囲を基準にして解釈されるべきであり、そのため、本発明の意図される範囲が有効に包含されるべきである。 Although the present invention has been described at considerable length and in considerable detail with respect to several described embodiments, it is limited to any such individual details or embodiments or to any specific embodiments. Rather, to obtain the broadest possible interpretation of the appended claims in light of the prior art, any interpretation of such claims may be made on the basis of such claims. and so the intended scope of the invention should be effectively covered.

本明細書で言及されるすべての刊行物、特許出願、特許及び他の参考文献は参照によりその全体が組み込まれる。矛盾がある場合は、定義も含め、本明細書が優先する。さらに、項目見出し、材料、方法、及び例は例示にすぎず、限定的ではないことが意図される。 All publications, patent applications, patents, and other references mentioned herein are incorporated by reference in their entirety. In case of conflict, the present specification, including definitions, will control. Further, the section headings, materials, methods, and examples are intended to be illustrative only and not limiting.

配列表
(表5)P.pastorisで欠失標的とされるプロテアーゼのオープンリーディングフレームのヌクレオチド配列

Figure 0007246102000006
Figure 0007246102000007
Figure 0007246102000008
Figure 0007246102000009
Figure 0007246102000010
Figure 0007246102000011
Figure 0007246102000012
Figure 0007246102000013
Figure 0007246102000014
Figure 0007246102000015
Figure 0007246102000016
Figure 0007246102000017
Figure 0007246102000018
Figure 0007246102000019
Figure 0007246102000020
Figure 0007246102000021
Figure 0007246102000022
Figure 0007246102000023
Figure 0007246102000024
Figure 0007246102000025
Figure 0007246102000026
Figure 0007246102000027
Figure 0007246102000028
Figure 0007246102000029
Figure 0007246102000030
Figure 0007246102000031
Figure 0007246102000032
Figure 0007246102000033
Figure 0007246102000034
Figure 0007246102000035
Figure 0007246102000036
Figure 0007246102000037
Figure 0007246102000038
Figure 0007246102000039
Figure 0007246102000040
Figure 0007246102000041
Figure 0007246102000042
Sequence Listing (Table 5) P.S. Nucleotide sequences of open reading frames of proteases targeted for deletion in pastoris
Figure 0007246102000006
Figure 0007246102000007
Figure 0007246102000008
Figure 0007246102000009
Figure 0007246102000010
Figure 0007246102000011
Figure 0007246102000012
Figure 0007246102000013
Figure 0007246102000014
Figure 0007246102000015
Figure 0007246102000016
Figure 0007246102000017
Figure 0007246102000018
Figure 0007246102000019
Figure 0007246102000020
Figure 0007246102000021
Figure 0007246102000022
Figure 0007246102000023
Figure 0007246102000024
Figure 0007246102000025
Figure 0007246102000026
Figure 0007246102000027
Figure 0007246102000028
Figure 0007246102000029
Figure 0007246102000030
Figure 0007246102000031
Figure 0007246102000032
Figure 0007246102000033
Figure 0007246102000034
Figure 0007246102000035
Figure 0007246102000036
Figure 0007246102000037
Figure 0007246102000038
Figure 0007246102000039
Figure 0007246102000040
Figure 0007246102000041
Figure 0007246102000042

(表6)標的プロテアーゼのポリペプチド配列

Figure 0007246102000043
(Table 6) Polypeptide sequences of target proteases
Figure 0007246102000043

(表7)プロテアーゼORFを標的にする5’及び3’の両ホモロジーアーム(HA)のフォワードプライマー(F)及びリバースプライマー(R)

Figure 0007246102000044
Figure 0007246102000045
Figure 0007246102000046
Figure 0007246102000047
Figure 0007246102000048
Figure 0007246102000049
Figure 0007246102000050
Figure 0007246102000051
Figure 0007246102000052
Figure 0007246102000053
(Table 7) Forward primer (F) and reverse primer (R) for both 5' and 3' homology arms (HA) targeting the protease ORF
Figure 0007246102000044
Figure 0007246102000045
Figure 0007246102000046
Figure 0007246102000047
Figure 0007246102000048
Figure 0007246102000049
Figure 0007246102000050
Figure 0007246102000051
Figure 0007246102000052
Figure 0007246102000053

(表8)改変配列を増幅させるフォワードプライマー及びリバースプライマー

Figure 0007246102000054
Figure 0007246102000055
Figure 0007246102000056
Figure 0007246102000057
(Table 8) Forward and reverse primers that amplify modified sequences
Figure 0007246102000054
Figure 0007246102000055
Figure 0007246102000056
Figure 0007246102000057

(表9)18Bベクター

Figure 0007246102000058
Figure 0007246102000059
(Table 9) 18B vector
Figure 0007246102000058
Figure 0007246102000059

(表10)P.pastorisでのKU70欠失用HAアームを有するゼオシンカセット

Figure 0007246102000060
Figure 0007246102000061
Figure 0007246102000062
(Table 10) P.I. Zeocin cassette with HA arms for KU70 deletion in pastoris
Figure 0007246102000060
Figure 0007246102000061
Figure 0007246102000062

(表11)P.pastorisでのプロテアーゼ欠失用ノーセオスリシンカセット

Figure 0007246102000063
Figure 0007246102000064
(Table 11)P. Noseothricin cassette for protease deletion in pastoris
Figure 0007246102000063
Figure 0007246102000064

(表12)P.pastorisでのプロテアーゼ欠失用HAアームを有する例示的ノーセオスリシンカセット

Figure 0007246102000065
Figure 0007246102000066
Figure 0007246102000067
Figure 0007246102000068
Figure 0007246102000069
Figure 0007246102000070
Figure 0007246102000071
(Table 12) P.I. Exemplary nourseothricin cassettes with HA arms for protease deletion in pastoris
Figure 0007246102000065
Figure 0007246102000066
Figure 0007246102000067
Figure 0007246102000068
Figure 0007246102000069
Figure 0007246102000070
Figure 0007246102000071

Claims (17)

組換えタンパク質を発現する、YPS1-1プロテアーゼ及びYPS1-2プロテアーゼの活性を減弱または消失させてあるピキア・パストリス(Pichia pastoris)微生物であって、前記組換えタンパク質は、絹タンパク質由来の少なくとも1つのブロックポリペプチド配列を含むか、または前記組換えタンパク質は絹様ポリペプチドを含む、前記微生物。 A Pichia pastoris microorganism having attenuated or abolished YPS1-1 protease and YPS1-2 protease activity expressing a recombinant protein, said recombinant protein comprising at least one Said microorganism comprising a blocked polypeptide sequence or wherein said recombinant protein comprises a silk-like polypeptide . 前記YPS1-1プロテアーゼは、SEQ ID NO:67と少なくとも95%同一なポリペプチド配列を含む、請求項1に記載の微生物。 2. The microorganism of claim 1, wherein said YPS1-1 protease comprises a polypeptide sequence that is at least 95% identical to SEQ ID NO:67. 前記YPS1-1プロテアーゼはSEQ ID NO:67を含む、請求項1に記載の微生物。 2. The microorganism of claim 1, wherein said YPS1-1 protease comprises SEQ ID NO:67. 前記YPS1-1プロテアーゼはYPS1-1遺伝子によりコードされ、該YPS1-1遺伝子は、SEQ ID NO:1と少なくとも95%同一なポリヌクレオチド配列を含むか、または該YPS1-1遺伝子は、SEQ ID NO:1の少なくとも15、20、25、30、40、もしくは50連続するヌクレオチドを含むか、または該YPS1-1遺伝子はSEQ ID NO:1を含むか、または該YPS1-1遺伝子は前記微生物の遺伝子座PAS_chr4_0584にある、請求項1または請求項2に記載の微生物。 Said YPS1-1 protease is encoded by the YPS1-1 gene, said YPS1-1 gene comprising a polynucleotide sequence at least 95% identical to SEQ ID NO: 1, or said YPS1-1 gene comprises SEQ ID NO: at least 15, 20, 25, 30, 40, or 50 contiguous nucleotides of: 1, or said YPS1-1 gene comprises SEQ ID NO: 1, or said YPS1-1 gene is a gene of said microorganism 3. A microorganism according to claim 1 or claim 2 at the locus PAS_chr4_0584. 前記YPS1-2プロテアーゼは、SEQ ID NO:68と少なくとも95%同一なポリペプチド配列を含む、請求項1~4のいずれか1項に記載の微生物。 5. The microorganism of any one of claims 1-4, wherein the YPS1-2 protease comprises a polypeptide sequence that is at least 95% identical to SEQ ID NO:68. 前記YPS1-2プロテアーゼはSEQ ID NO:68を含む、請求項5に記載の微生物。 6. The microorganism of claim 5, wherein said YPS1-2 protease comprises SEQ ID NO:68. 前記YPS1-2プロテアーゼはYPS1-2遺伝子によりコードされ、該YPS1-2遺伝子は、SEQ ID NO:2と少なくとも95%同一なポリヌクレオチド配列を含むか、または該YPS1-2遺伝子は、SEQ ID NO:2の少なくとも15、20、25、30、40、もしくは50連続するヌクレオチドを含むか、または該YPS1-2遺伝子はSEQ ID NO:2を含むか、または該YPS1-2遺伝子は前記微生物の遺伝子座PAS_chr3_1157にある、請求項1~6のいずれか1項に記載の微生物。 Said YPS1-2 protease is encoded by the YPS1-2 gene, wherein said YPS1-2 gene comprises a polynucleotide sequence at least 95% identical to SEQ ID NO:2, or said YPS1-2 gene comprises SEQ ID NO: at least 15, 20, 25, 30, 40, or 50 contiguous nucleotides of: 2, or said YPS1-2 gene comprises SEQ ID NO: 2, or said YPS1-2 gene is a gene of said microorganism A microorganism according to any one of claims 1 to 6, at the locus PAS_chr3_1157. 前記YPS1-1遺伝子または前記YPS1-2遺伝子またはその両方を変異またはノックアウトさせてある、請求項1~7のいずれか1項に記載の微生物。 The microorganism according to any one of claims 1 to 7, wherein said YPS1-1 gene or said YPS1-2 gene or both are mutated or knocked out. 前記絹様ポリペプチドは、1つ以上の反復配列{GGY-[GPG-Xn1-GPS-(A)n2n3(SEQ ID NO: 514)を含み、ここで、
X1=SGGQQ(SEQ ID NO: 515)またはGAGQQ(SEQ ID NO: 516)またはGQGPY(SEQ ID NO: 517)またはAGQQ(SEQ ID NO: 518)またはSQであり、
n1は4~8であり、
n2は6~20であり、かつ
n3は2~20である、
請求項に記載の微生物。
said silk-like polypeptide comprises one or more repeat sequences {GGY-[GPG-X 1 ] n1 -GPS-(A) n2 } n3 (SEQ ID NO: 514), wherein
X1 = SGGQQ (SEQ ID NO: 515) or GAGQQ (SEQ ID NO: 516) or GQGPY (SEQ ID NO: 517) or AGQQ (SEQ ID NO: 518) or SQ,
n1 is 4 to 8,
n2 is 6-20, and n3 is 2-20;
The microorganism according to claim 1 .
前記絹様ポリペプチドは、SEQ ID NO:462によりコードされるポリペプチド配列を含む、請求項に記載の微生物。 2. The microorganism of claim 1 , wherein said silk-like polypeptide comprises a polypeptide sequence encoded by SEQ ID NO:462. 1つ以上のさらなるプロテアーゼの活性を減弱または消失させてある、請求項1~10のいずれか1項に記載の微生物。 Microorganism according to any one of claims 1 to 10 , wherein the activity of one or more additional proteases is attenuated or eliminated. 前記1つ以上のさらなるプロテアーゼは、YPS1-5、MCK7、またはYPS1-3を含む、請求項11に記載の微生物。 12. The microorganism of claim 11 , wherein said one or more additional proteases comprise YPS1-5, MCK7, or YPS1-3. SEQ ID NO:1を含むYPS1-1遺伝子とSEQ ID NO:2を含むYPS1-2遺伝子とを変異または欠失させることによって低下させた前記YPS1-1及び前記YPS1-2の活性を含む、Pichia pastorisの改変微生物であって、
さらに、SEQ ID NO:462によりコードされるポリペプチド配列を含む組換え発現タンパク質を含む、前記微生物。
YPS1-1 gene comprising SEQ ID NO: 1 and YPS1-2 gene comprising SEQ ID NO: 2 are mutated or deleted to reduce the activity of said YPS1-1 and said YPS1-2, Pichia A modified microorganism of pastoris,
Said microorganism, further comprising a recombinantly expressed protein comprising a polypeptide sequence encoded by SEQ ID NO:462.
請求項1~13のいずれか1項に記載の微生物を含む、細胞培養物。 A cell culture comprising a microorganism according to any one of claims 1-13 . 請求項13のいずれか1項に記載の微生物を、前記組換え発現タンパク質の発現に好適な条件下で、培地で培養すること、及び
前記微生物または前記培地から前記組換えタンパク質を単離すること
を含む、分解が抑制された組換えタンパク質を生産する方法。
culturing the microorganism of any one of claims 1 to 13 in a medium under conditions suitable for expression of said recombinantly expressed protein; and isolating said recombinant protein from said microorganism or from said medium. A method for producing a recombinant protein with reduced degradation, comprising:
組換え発現絹様ポリペプチドの分解が抑制されるようにPichia pastorisを改変する方法であって、
YPS1-1タンパク質及びYPS1-2タンパク質をコードする遺伝子をノックアウトまたは変異させることを含む、前記方法。
A method of modifying Pichia pastoris such that degradation of a recombinantly expressed silk-like polypeptide is inhibited, comprising:
The above method, comprising knocking out or mutating the genes encoding the YPS1-1 protein and the YPS1-2 protein.
前記絹様ポリペプチドは、1つ以上の反復配列{GGY-[GPG-Xn1-GPS-(A)n2n3(SEQ ID NO: 514)を含み、ここで、
=SGGQQ(SEQ ID NO: 515)もしくはGAGQQ(SEQ ID NO: 516)もしくはGQGPY(SEQ ID NO: 517)もしくはAGQQ(SEQ ID NO: 518)もしくはSQであり、
n1は4~8であり、
n2は6~20であり、かつ
n3は2~20である、または
前記絹様ポリペプチドは、SEQ ID NO:462によりコードされるポリペプチド配列を含む、
請求項16に記載の方法。
said silk-like polypeptide comprises one or more repeat sequences {GGY-[GPG-X 1 ] n1 -GPS-(A) n2 } n3 (SEQ ID NO: 514), wherein
X 1 = SGGQQ (SEQ ID NO: 515) or GAGQQ (SEQ ID NO: 516) or GQGPY (SEQ ID NO: 517) or AGQQ (SEQ ID NO: 518) or SQ,
n1 is 4 to 8,
n2 is 6-20 and n3 is 2-20, or said silk-like polypeptide comprises a polypeptide sequence encoded by SEQ ID NO:462;
17. The method of claim 16 .
JP2020519030A 2017-10-03 2017-10-03 Modified strain for producing recombinant silk Active JP7246102B2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2017/054997 WO2019070246A1 (en) 2017-10-03 2017-10-03 Modified strains for the production of recombinant silk

Publications (2)

Publication Number Publication Date
JP2021503275A JP2021503275A (en) 2021-02-12
JP7246102B2 true JP7246102B2 (en) 2023-03-27

Family

ID=65994932

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020519030A Active JP7246102B2 (en) 2017-10-03 2017-10-03 Modified strain for producing recombinant silk

Country Status (7)

Country Link
EP (1) EP3692054A4 (en)
JP (1) JP7246102B2 (en)
KR (1) KR102558303B1 (en)
CN (1) CN111315763A (en)
AU (2) AU2017434920B2 (en)
MX (1) MX2020003362A (en)
WO (1) WO2019070246A1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112166181B (en) 2018-05-17 2024-03-08 保尔特纺织品公司 SEC modified strains for improving secretion of recombinant proteins
WO2023215221A2 (en) * 2022-05-02 2023-11-09 North Carolina State University Engineered microorganisms with enhanced protein expression and secretion

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016531845A (en) 2013-09-17 2016-10-13 ボルト スレッズ インコーポレイテッド Methods and compositions for synthesizing improved silk fibers

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003091431A1 (en) * 2002-04-26 2003-11-06 Kirin Beer Kabushiki Kaisha Methylotroph producing mammalian type sugar chain
US7262287B2 (en) * 2002-06-29 2007-08-28 Korea Research Institute Of Bioscience And Biotechnology Hansenula polymorpha yapsin deficient mutant strain and process for the preparation of recombinant proteins using the same
WO2004027067A2 (en) * 2002-09-20 2004-04-01 Cym1P A/S Methods for increasing the production of a recombinant polypeptide from a host cell
ES2539378T3 (en) * 2009-02-26 2015-06-30 Glaxosmithkline Llc Host cells and use procedures
US8440456B2 (en) * 2009-05-22 2013-05-14 Vib, Vzw Nucleic acids of Pichia pastoris and use thereof for recombinant production of proteins
EP2798074A1 (en) * 2011-12-30 2014-11-05 Oxyrane UK Limited Methods and materials for reducing degradation of recombinant proteins
CN102676563B (en) * 2012-05-03 2013-09-18 浙江大学 Method for preparing human serum albumin-human parathyroid hormone
CN106701813A (en) * 2016-12-29 2017-05-24 陕西慧康生物科技有限责任公司 Expression vector as well as construction method and application thereof

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016531845A (en) 2013-09-17 2016-10-13 ボルト スレッズ インコーポレイテッド Methods and compositions for synthesizing improved silk fibers

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
WU, M. et al.,Disruption of YPS1 and PEP4 genes reduces proteolytic degradation of secreted HSA/PTH in Pichia pastoris GS115,Journal of Industrial Microbiology & Biotechnology,40(6),2013年03月26日,p589-599,https://doi.org/10.1007/s10295-013-1264-8

Also Published As

Publication number Publication date
WO2019070246A1 (en) 2019-04-11
AU2017434920B2 (en) 2022-02-10
EP3692054A1 (en) 2020-08-12
EP3692054A4 (en) 2021-06-09
AU2017434920A1 (en) 2020-05-07
CN111315763A (en) 2020-06-19
AU2022202534B2 (en) 2024-09-12
AU2022202534A1 (en) 2022-05-12
MX2020003362A (en) 2020-07-29
JP2021503275A (en) 2021-02-12
KR102558303B1 (en) 2023-07-21
KR20200058482A (en) 2020-05-27

Similar Documents

Publication Publication Date Title
US20230192965A1 (en) Methods and compositions for synthesizing improved silk fibers
CN112166181B (en) SEC modified strains for improving secretion of recombinant proteins
CN112424362B (en) Integration of nucleic acid constructs into eukaryotic cells using transposases from medaka genus
JP5374584B2 (en) Improved protein expression system
US20220251533A1 (en) Modified strains for the production of recombinant silk
JP7246102B2 (en) Modified strain for producing recombinant silk
EP1801221A1 (en) Promoter sequences

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200603

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201001

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201001

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20210707

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210730

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210818

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20211116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220705

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20221004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230307

R150 Certificate of patent or registration of utility model

Ref document number: 7246102

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150