CN117098847A - 工程化蛋白酶变体 - Google Patents
工程化蛋白酶变体 Download PDFInfo
- Publication number
- CN117098847A CN117098847A CN202180073590.9A CN202180073590A CN117098847A CN 117098847 A CN117098847 A CN 117098847A CN 202180073590 A CN202180073590 A CN 202180073590A CN 117098847 A CN117098847 A CN 117098847A
- Authority
- CN
- China
- Prior art keywords
- seq
- recombinant protease
- recombinant
- protease
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108091005804 Peptidases Proteins 0.000 title claims abstract description 990
- 239000004365 Protease Substances 0.000 title claims abstract description 990
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 title claims abstract 140
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 526
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 524
- 229920001184 polypeptide Polymers 0.000 claims abstract description 523
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 61
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 60
- 239000002157 polynucleotide Substances 0.000 claims abstract description 60
- 230000002378 acidificating effect Effects 0.000 claims abstract description 54
- 238000000034 method Methods 0.000 claims abstract description 49
- 239000000203 mixture Substances 0.000 claims abstract description 46
- 208000035404 Autolysis Diseases 0.000 claims abstract description 39
- 206010057248 Cell death Diseases 0.000 claims abstract description 39
- 230000028043 self proteolysis Effects 0.000 claims abstract description 39
- 238000006467 substitution reaction Methods 0.000 claims description 411
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 214
- 239000003833 bile salt Substances 0.000 claims description 45
- 230000017854 proteolysis Effects 0.000 claims description 44
- 239000008194 pharmaceutical composition Substances 0.000 claims description 24
- 241000282414 Homo sapiens Species 0.000 claims description 22
- 239000013604 expression vector Substances 0.000 claims description 15
- 208000035467 Pancreatic insufficiency Diseases 0.000 claims description 13
- 208000024891 symptom Diseases 0.000 claims description 13
- 108020004705 Codon Proteins 0.000 claims description 11
- 230000003197 catalytic effect Effects 0.000 claims description 10
- 102000004882 Lipase Human genes 0.000 claims description 8
- 108090001060 Lipase Proteins 0.000 claims description 8
- 239000004367 Lipase Substances 0.000 claims description 8
- 235000019421 lipase Nutrition 0.000 claims description 8
- 230000035772 mutation Effects 0.000 claims description 6
- 235000005911 diet Nutrition 0.000 claims description 5
- 235000015872 dietary supplement Nutrition 0.000 claims description 5
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 5
- 239000004382 Amylase Substances 0.000 claims description 4
- 108010065511 Amylases Proteins 0.000 claims description 4
- 102000013142 Amylases Human genes 0.000 claims description 4
- 235000019418 amylase Nutrition 0.000 claims description 4
- 230000037213 diet Effects 0.000 claims description 4
- 239000003814 drug Substances 0.000 claims description 4
- 239000003937 drug carrier Substances 0.000 claims description 3
- 230000001747 exhibiting effect Effects 0.000 claims description 3
- 238000012258 culturing Methods 0.000 claims description 2
- 239000002702 enteric coating Substances 0.000 claims description 2
- 238000009505 enteric coating Methods 0.000 claims description 2
- 238000001802 infusion Methods 0.000 claims description 2
- 238000002347 injection Methods 0.000 claims description 2
- 239000007924 injection Substances 0.000 claims description 2
- 230000001668 ameliorated effect Effects 0.000 claims 1
- 230000036576 dermal application Effects 0.000 claims 1
- 238000010254 subcutaneous injection Methods 0.000 claims 1
- 239000007929 subcutaneous injection Substances 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 70
- 230000001225 therapeutic effect Effects 0.000 abstract description 4
- 235000016709 nutrition Nutrition 0.000 abstract description 2
- 102000035195 Peptidases Human genes 0.000 description 850
- 235000019419 proteases Nutrition 0.000 description 821
- 235000001014 amino acid Nutrition 0.000 description 236
- 239000012634 fragment Substances 0.000 description 183
- 229940024606 amino acid Drugs 0.000 description 62
- 150000001413 amino acids Chemical class 0.000 description 56
- 108090000623 proteins and genes Proteins 0.000 description 45
- 102000004169 proteins and genes Human genes 0.000 description 37
- 235000018102 proteins Nutrition 0.000 description 35
- 210000004027 cell Anatomy 0.000 description 33
- 102000004190 Enzymes Human genes 0.000 description 26
- 108090000790 Enzymes Proteins 0.000 description 26
- 229940088598 enzyme Drugs 0.000 description 26
- 229910052720 vanadium Inorganic materials 0.000 description 18
- 102220550275 Usher syndrome type-1C protein-binding protein 1_N77Q_mutation Human genes 0.000 description 16
- 230000002255 enzymatic effect Effects 0.000 description 16
- 125000000539 amino acid group Chemical group 0.000 description 15
- 102200012778 rs142794414 Human genes 0.000 description 14
- 229910052717 sulfur Inorganic materials 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 13
- 239000000047 product Substances 0.000 description 13
- 238000011282 treatment Methods 0.000 description 13
- 230000014509 gene expression Effects 0.000 description 12
- 150000007523 nucleic acids Chemical class 0.000 description 12
- 102200057606 rs231775 Human genes 0.000 description 12
- 239000000758 substrate Substances 0.000 description 12
- 102000057297 Pepsin A Human genes 0.000 description 11
- 108090000284 Pepsin A Proteins 0.000 description 11
- 238000012217 deletion Methods 0.000 description 11
- 230000037430 deletion Effects 0.000 description 11
- 229940111202 pepsin Drugs 0.000 description 11
- 230000006870 function Effects 0.000 description 10
- 238000009396 hybridization Methods 0.000 description 10
- 239000000463 material Substances 0.000 description 10
- 230000007935 neutral effect Effects 0.000 description 10
- 230000002797 proteolythic effect Effects 0.000 description 10
- 102220048830 rs587783741 Human genes 0.000 description 10
- 102220244437 rs752960312 Human genes 0.000 description 10
- 229910052721 tungsten Inorganic materials 0.000 description 10
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 9
- 108091028043 Nucleic acid sequence Proteins 0.000 description 9
- 150000001875 compounds Chemical class 0.000 description 9
- 108090000317 Chymotrypsin Proteins 0.000 description 8
- 102220493776 Paired box protein Pax-6_S43P_mutation Human genes 0.000 description 8
- 102220564982 Protein FAM71C_R30G_mutation Human genes 0.000 description 8
- 102220551715 Ras-related protein Rab-7L1_R75S_mutation Human genes 0.000 description 8
- 102220529019 Regulator of nonsense transcripts 2_I32A_mutation Human genes 0.000 description 8
- 108090000631 Trypsin Proteins 0.000 description 8
- 102000004142 Trypsin Human genes 0.000 description 8
- 229960002376 chymotrypsin Drugs 0.000 description 8
- 201000010099 disease Diseases 0.000 description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 8
- 230000006872 improvement Effects 0.000 description 8
- 229910052700 potassium Inorganic materials 0.000 description 8
- 102220137600 rs112862820 Human genes 0.000 description 8
- 102220280621 rs746023147 Human genes 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 239000012588 trypsin Substances 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 7
- 108020004414 DNA Proteins 0.000 description 7
- 235000019197 fats Nutrition 0.000 description 7
- 102000039446 nucleic acids Human genes 0.000 description 7
- 108020004707 nucleic acids Proteins 0.000 description 7
- -1 terpene alcohols Chemical class 0.000 description 7
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 6
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 6
- 150000002632 lipids Chemical class 0.000 description 6
- 239000002773 nucleotide Substances 0.000 description 6
- 125000003729 nucleotide group Chemical group 0.000 description 6
- 239000013589 supplement Substances 0.000 description 6
- 229910052727 yttrium Inorganic materials 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 5
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 5
- 239000004473 Threonine Substances 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 235000013305 food Nutrition 0.000 description 5
- 230000007062 hydrolysis Effects 0.000 description 5
- 238000006460 hydrolysis reaction Methods 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 229940040461 lipase Drugs 0.000 description 5
- 238000011068 loading method Methods 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 229910052757 nitrogen Inorganic materials 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 108091026890 Coding region Proteins 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- 239000004145 Methyl glucoside-coconut oil ester Substances 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 230000002358 autolytic effect Effects 0.000 description 4
- 235000013361 beverage Nutrition 0.000 description 4
- 230000001186 cumulative effect Effects 0.000 description 4
- 235000014113 dietary fatty acids Nutrition 0.000 description 4
- 239000000194 fatty acid Substances 0.000 description 4
- 229930195729 fatty acid Natural products 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 4
- 238000002703 mutagenesis Methods 0.000 description 4
- 231100000350 mutagenesis Toxicity 0.000 description 4
- 229910052698 phosphorus Inorganic materials 0.000 description 4
- 230000004481 post-translational protein modification Effects 0.000 description 4
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 3
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 3
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 3
- 150000004665 fatty acids Chemical class 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 230000002496 gastric effect Effects 0.000 description 3
- 235000013922 glutamic acid Nutrition 0.000 description 3
- 239000004220 glutamic acid Substances 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 230000000968 intestinal effect Effects 0.000 description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 239000002904 solvent Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 239000004474 valine Substances 0.000 description 3
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- 239000004130 Ferrous hexacyanomanganate Substances 0.000 description 2
- 102220471767 Fructose-bisphosphate aldolase B_E35A_mutation Human genes 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 102220560203 Stromal cell-derived factor 1_N50K_mutation Human genes 0.000 description 2
- 238000000692 Student's t-test Methods 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 2
- 239000002671 adjuvant Substances 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 125000003118 aryl group Chemical group 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 229940093761 bile salts Drugs 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 239000000356 contaminant Substances 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000000378 dietary effect Effects 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 238000002641 enzyme replacement therapy Methods 0.000 description 2
- 239000003797 essential amino acid Substances 0.000 description 2
- 235000020776 essential amino acid Nutrition 0.000 description 2
- 210000001035 gastrointestinal tract Anatomy 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 230000003301 hydrolyzing effect Effects 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 235000012054 meals Nutrition 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 238000002638 palliative care Methods 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 230000001124 posttranscriptional effect Effects 0.000 description 2
- 239000000441 potassium aluminium silicate Substances 0.000 description 2
- 230000035935 pregnancy Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 229940024999 proteolytic enzymes for treatment of wounds and ulcers Drugs 0.000 description 2
- 102220251500 rs1555130597 Human genes 0.000 description 2
- 102220105007 rs751721557 Human genes 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000000264 sodium ferrocyanide Substances 0.000 description 2
- 210000002784 stomach Anatomy 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- WBWWGRHZICKQGZ-HZAMXZRMSA-N taurocholic acid Chemical group C([C@H]1C[C@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(=O)NCCS(O)(=O)=O)C)[C@@]2(C)[C@@H](O)C1 WBWWGRHZICKQGZ-HZAMXZRMSA-N 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 150000003626 triacylglycerols Chemical class 0.000 description 2
- 235000013343 vitamin Nutrition 0.000 description 2
- 239000011782 vitamin Substances 0.000 description 2
- 229940088594 vitamin Drugs 0.000 description 2
- 229930003231 vitamin Natural products 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 208000015943 Coeliac disease Diseases 0.000 description 1
- 102000004405 Collectins Human genes 0.000 description 1
- 108090000909 Collectins Proteins 0.000 description 1
- 101710199851 Copy number protein Proteins 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 150000008574 D-amino acids Chemical group 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 208000022559 Inflammatory bowel disease Diseases 0.000 description 1
- SNDPXSYFESPGGJ-BYPYZUCNSA-N L-2-aminopentanoic acid Chemical compound CCC[C@H](N)C(O)=O SNDPXSYFESPGGJ-BYPYZUCNSA-N 0.000 description 1
- QUOGESRFPZDMMT-UHFFFAOYSA-N L-Homoarginine Natural products OC(=O)C(N)CCCCNC(N)=N QUOGESRFPZDMMT-UHFFFAOYSA-N 0.000 description 1
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- QUOGESRFPZDMMT-YFKPBYRVSA-N L-homoarginine Chemical compound OC(=O)[C@@H](N)CCCCNC(N)=N QUOGESRFPZDMMT-YFKPBYRVSA-N 0.000 description 1
- SNDPXSYFESPGGJ-UHFFFAOYSA-N L-norVal-OH Natural products CCCC(N)C(O)=O SNDPXSYFESPGGJ-UHFFFAOYSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 208000002720 Malnutrition Diseases 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 1
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 1
- 102000019280 Pancreatic lipases Human genes 0.000 description 1
- 108050006759 Pancreatic lipases Proteins 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 206010033645 Pancreatitis Diseases 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 229930182558 Sterol Natural products 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 238000012219 cassette mutagenesis Methods 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000005754 cellular signaling Effects 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 229940079919 digestives enzyme preparation Drugs 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 210000001198 duodenum Anatomy 0.000 description 1
- 201000006549 dyspepsia Diseases 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000005802 health problem Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000031891 intestinal absorption Effects 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 208000018773 low birth weight Diseases 0.000 description 1
- 231100000533 low birth weight Toxicity 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 230000001071 malnutrition Effects 0.000 description 1
- 235000000824 malnutrition Nutrition 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 230000007721 medicinal effect Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 244000309715 mini pig Species 0.000 description 1
- 239000008185 minitablet Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 208000015380 nutritional deficiency disease Diseases 0.000 description 1
- 229960003104 ornithine Drugs 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 229940116369 pancreatic lipase Drugs 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 229940126409 proton pump inhibitor Drugs 0.000 description 1
- 239000000612 proton pump inhibitor Substances 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 102220309421 rs199472833 Human genes 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- JAJWGJBVLPIOOH-IZYKLYLVSA-M sodium taurocholate Chemical compound [Na+].C([C@H]1C[C@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(=O)NCCS([O-])(=O)=O)C)[C@@]2(C)[C@@H](O)C1 JAJWGJBVLPIOOH-IZYKLYLVSA-M 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 238000012289 standard assay Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 150000003432 sterols Chemical class 0.000 description 1
- 235000003702 sterols Nutrition 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 229920002994 synthetic fiber Polymers 0.000 description 1
- 239000013077 target material Substances 0.000 description 1
- 239000013076 target substance Substances 0.000 description 1
- 235000007586 terpenes Nutrition 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
- 230000004580 weight loss Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/64—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
- C12N9/6402—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from non-mammals
- C12N9/6405—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from non-mammals not being snakes
- C12N9/6408—Serine endopeptidases (3.4.21)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
- A61K38/48—Hydrolases (3) acting on peptide bonds (3.4)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
- A61P1/18—Drugs for disorders of the alimentary tract or the digestive system for pancreatic disorders, e.g. pancreatic enzymes
-
- C—CHEMISTRY; METALLURGY
- C11—ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
- C11D—DETERGENT COMPOSITIONS; USE OF SINGLE SUBSTANCES AS DETERGENTS; SOAP OR SOAP-MAKING; RESIN SOAPS; RECOVERY OF GLYCEROL
- C11D3/00—Other compounding ingredients of detergent compositions covered in group C11D1/00
- C11D3/16—Organic compounds
- C11D3/38—Products with no well-defined composition, e.g. natural products
- C11D3/386—Preparations containing enzymes, e.g. protease or amylase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y304/00—Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
- C12Y304/21—Serine endopeptidases (3.4.21)
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Medicinal Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Biotechnology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Gastroenterology & Hepatology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Immunology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Epidemiology (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Coloring Foods And Improving Nutritive Qualities (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明提供了工程化蛋白酶多肽及其组合物。该工程化蛋白酶多肽已经过优化,以提供改进的活性、改进的热稳定性、蛋白酶稳定性、自溶稳定性和在一定范围的pH条件包括酸性(pH<7)和碱性(pH>7)条件下的稳定性。本发明还涉及包含该工程化蛋白酶多肽的组合物用于治疗目的和/或营养目的的用途。本发明还提供了编码该工程化蛋白酶多肽的多核苷酸,以及用于制备工程化多核苷酸和蛋白酶多肽的方法。
Description
相关申请的交叉引用
本申请根据35 U.S.C.§119(e)要求2020年8月28日提交的美国临时申请第63/071,625号的权益,该美国临时申请的全部内容通过引用并入本文。
发明领域
本发明提供了工程化蛋白酶多肽及其组合物。该工程化蛋白酶多肽已经过优化,以提供改进的活性、改进的热稳定性、蛋白酶稳定性、自溶稳定性和在一定范围的pH条件包括酸性(pH<7)条件下的稳定性。本发明还涉及包含该工程化蛋白酶多肽的组合物用于治疗目的的用途。本发明还提供了编码该工程化蛋白酶多肽的多核苷酸,以及用于制备工程化多核苷酸和蛋白酶多肽的方法。
对序列表、表格或计算机程序的引用
序列表的正式副本作为ASCII格式的文本文件经由EFS-Web与说明书同时提交,文件名为“CX7-210WO2_ST25.txt”,创建日期为2021年8月27日,且大小为约9.07兆字节。经由EFS-Web提交的序列表为说明书的一部分并且通过引用以其整体并入本文。
发明背景
胰腺酶替代疗法(pancreatic enzyme replacement therapy,PERT)可用于治疗胰腺酶不足(pancreatic enzyme insufficiency,PEI)。各种疾病,包括胰腺炎、囊性纤维化、乳糜泻(celiac disease)、炎性肠病和胰腺癌,都可以导致PEI,作为进入十二指肠的胰腺酶分泌减少的结果。这导致食物消化不良、肠对脂肪、蛋白质、碳水化合物和维生素的吸收不足,其可以导致营养不良。尽管口服施用的PERT治疗目前是可用的,但在一些人中状况可能不会减轻,这是由于PERT在胃肠道中活性不足,和/或由于与当前治疗方案相关的显著药负担(significant pill burden),患者对治疗的依从性不足。在一些情况下,脂肪吸收系数(CFA)和/或氮吸收系数(CNA)不如健康患者,导致体重减轻和其他健康问题。因此,本领域仍然需要改进的PERT治疗。
发明概述
本发明提供了工程化蛋白酶多肽及其组合物。该工程化蛋白酶多肽已经过优化,以提供改进的活性、改进的热稳定性、蛋白酶稳定性、自溶稳定性和在一定范围的pH条件包括酸性(pH<7)条件下的稳定性。本发明还涉及包含该工程化蛋白酶多肽的组合物用于治疗目的和/或营养目的的用途。本发明还提供了编码该工程化蛋白酶多肽的多核苷酸,以及用于制备工程化多核苷酸和蛋白酶多肽的方法。
本发明提供了重组蛋白酶和/或生物活性重组蛋白酶片段,其包含含有与SEQ IDNO:2的至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的氨基酸序列。在一些实施方案中,重组蛋白酶和/或生物活性重组蛋白酶片段包含与SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278具有至少约70%、约75%、约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更多序列同一性的多肽序列。
本发明提供了重组蛋白酶和/或生物活性重组蛋白酶片段,其包含含有与SEQ IDNO:2的至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列。在一些实施方案中,重组蛋白酶和/或生物活性重组蛋白酶片段包含与SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278具有至少70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。
在一些实施方案中,重组蛋白酶包含与SEQ ID NO:2具有至少70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的位置处包含一个或更多个取代:9、17、29、30、32、34、35、36、37、43、47、50、63、75、77、81、85、92、93、107、127、132、133、135、143、145、147、162、168、187、188、189、200、205、207、208、209、210、212、220、221、222、223、225、228、236、237、238、239、241、244、245、247、257、258、260、261、262、263、265、266、283、294、300、301、307、308、318、319、334、336、339、342、344、345、346、347、355、359、361、362、363、366、368、370、373、398、404、405、406、408、412、424、427、429、431、439、441、442、446、448、449、450、454、468、470、480、481、482、485、489、490、495、497、501、504、505、506、508、511、512、514、516、523、526、527、529、533、535、536E、537、538、539、540、541、542、543、544、545、546、547、548、549、552、553、554、555、556、558、559、560、565、566、567、568、570、571、573、575、577、580、581、582、583、586、589、591、592、594、596、599、601、604、609、610、615、616、620、631、632、634、639、643、644、645、646、647、648A、649、650、652、653、654、659、661、662、663、664、665和666,其中多肽序列的氨基酸位置参考SEQ ID NO:2来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:2具有至少70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:236、258、261、339、439、446和454,其中多肽序列的氨基酸位置参考SEQ ID NO:2来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:2具有至少70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:236V、258K、261L、339M、339W、439M、446A、446G、446L、446M、446T和454L,其中多肽序列的氨基酸位置参考SEQ ID NO:2来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:2具有至少70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:M236V、Q258K、E261L、N339M、N339W、S439M、P446A、P446G、P446L、P446M、P446T和A454L,其中多肽序列的氨基酸位置参考SEQ ID NO:2来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:2具有至少70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:107/536、162/408、168/547、208/366/504/591、208/485/526、210/223/258/552、210/241/258/599、223/241/258/599、223/429/481/533、223/481/533/552、225、225/260/263/265/544、225/262、225/362/366/591、225/366、225/482/591、244、258、258/318/429、258/449/481、258/481、261、261/504、318/481、318/533、318/599、339、342、345、362/366/485/591、363、366、366/485、366/497、366/526/591、366/591、408、427、446、448、449、450、481/533/552、482、482/485、482/591、485、485/591、533、533/552、536、544、547、549、565、615和652,其中多肽序列的氨基酸位置参考SEQ IDNO:2来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:2具有至少70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:107T/536D、162I/408R、168N/547V、208T/366G/504P/591L、208T/485D/526L、210D/223R/258K/552N、210D/241P/258K/599L、223R/241P/258K/599L、223R/429L/481S/533K、223R/481S/533K/552N、225A/260D/263H/265R/544R、225A/262L、225A/362T/366G/591L、225A/366G、225A/482V/591L、225K、244K、258K、258K/318D/429L、258K/449V/481S、258K/481S、258R、261G、261G/504V、261L、261R、261S、261V、318D/481S、318D/533K、318D/599L、339F、339W、342R、345W、362T/366G/485D/591L、363E、363W、366A、366G、366G/485D、366G/497R、366G/526L/591L、366G/591L、366L、366Q、408R、427H、427R、446R、446V、448K、448R、448W、449K、450W、481S/533K/552N、482V、482V/485D、482V/591L、485D、485D/591L、533A、533D、533E、533K、533K/552N、533N、536E、536G、536V、544R、547A、547E、549T、565C、565D、615A、615D、615G、615P、615T、615W和652I,其中多肽序列的氨基酸位置参考SEQ ID NO:2来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:2具有至少70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:M107T/Q536D、T162I/A408R、S168N/Q547V、A208T/N366G/Q504P/K591L、A208T/N485D/R526L、N210D/N223R/Q258K/K552N、N210D/E241P/Q258K/D599L、N223R/E241P/Q258K/D599L、N223R/K429L/A481S/M533K、N223R/A481S/M533K/K552N、T225A/N260D/R263H/G265R/T544R、T225A/P262L、T225A/N362T/N366G/K591L、T225A/N366G、T225A/R482V/K591L、T225K、R244K、Q258K、Q258K/Q318D/K429L、Q258K/A449V/A481S、Q258K/A481S、Q258R、E261G、E261G/Q504V、E261L、E261R、E261S、E261V、Q318D/A481S、Q318D/M533K、Q318D/D599L、N339F、N339W、L342R、Q345W、N362T/N366G/N485D/K591L、Q363E、Q363W、N366A、N366G、N366G/N485D、N366G/Q497R、N366G/R526L/K591L、N366G/K591L、N366L、N366Q、A408R、P427H、P427R、P446R、P446V、N448K、N448R、N448W、A449K、N450W、A481S/M533K/K552N、R482V、R482V/N485D、R482V/K591L、N485D、N485D/K591L、M533A、M533D、M533E、M533K、M533K/K552N、M533N、Q536E、Q536G、Q536V、T544R、Q547A、Q547E、V549T、N565C、N565D、K615A、K615D、K615G、K615P、K615T、K615W和K652I,其中多肽序列的氨基酸位置参考SEQ ID NO:2来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:34具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:258、258/261/342/345、258/261/342/504/533、258/261/345/504/549、258/261/482/504/549、258/342、258/342/504/533/536/549、258/345/427、258/408/427/504/549、258/427、258/427/482/504/533/536、258/427/482/536、261/342/345/536、261/342/482/504/533/536、261/342/482/504/549、261/342/482/536、261/342/533、261/482、318/339/362/544/547、318/339/448/544、318/339/547、318/448/544/615、339/362/363/544/547/615、339/362/544、339/448、339/448/547、339/544/547、342、342/408、342/408/536、342/482/536、362/363/544/547、362/448、363/544/547、427/482/504/533/536、427/533/536/549、448、448/544和448/544/547/615,其中多肽序列的氨基酸位置参考SEQ ID NO:34来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:34具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:258K、258K/261L/342R/345W、258K/261L/342R/504P/533D、258K/261L/345W/504P/549T、258K/261R/482V/504P/549T、258K/342R、258K/342R/504P/533K/536E/549T、258K/345W/427R、258K/408R/427R/504P/549T、258K/427R、258K/427R/482V/504P/533K/536E、258K/427R/482V/536E、261L/342R/345W/536E、261L/342R/482V/504P/533K/536E、261L/342R/533D、261R/342R/482V/504P/549T、261R/342R/482V/536E、261R/482V、318D/339W/362T/544R/547E、318D/339W/448R/544R、318D/339W/547E、318D/448R/544R/615A、339W/362T/363E/544R/547E/615A、339W/362T/544R、339W/448K、339W/448R、339W/448R/547E、339W/544R/547E、342R、342R/408R、342R/408R/536E、342R/482V/536E、362T/363E/544R/547E、362T/448R、363E/544R/547E、427R/482V/504P/533D/536E、427R/533K/536E/549T、448R、448R/544R和448R/544R/547E/615A,其中多肽序列的氨基酸位置参考SEQ ID NO:34来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:34具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:Q258K、Q258K/E261L/L342R/Q345W、Q258K/E261L/L342R/Q504P/M533D、Q258K/E261L/Q345W/Q504P/V549T、Q258K/E261R/R482V/Q504P/V549T、Q258K/L342R、Q258K/L342R/Q504P/M533K/Q536E/V549T、Q258K/Q345W/P427R、Q258K/A408R/P427R/Q504P/V549T、Q258K/P427R、Q258K/P427R/R482V/Q504P/M533K/Q536E、Q258K/P427R/R482V/Q536E、E261L/L342R/Q345W/Q536E、E261L/L342R/R482V/Q504P/M533K/Q536E、E261L/L342R/M533D、E261R/L342R/R482V/Q504P/V549T、E261R/L342R/R482V/Q536E、E261R/R482V、Q318D/N339W/N362T/T544R/Q547E、Q318D/N339W/N448R/T544R、Q318D/N339W/Q547E、Q318D/N448R/T544R/K615A、N339W/N362T/Q363E/T544R/Q547E/K615A、N339W/N362T/T544R、N339W/N448K、N339W/N448R、N339W/N448R/Q547E、N339W/T544R/Q547E、L342R、L342R/A408R、L342R/A408R/Q536E、L342R/R482V/Q536E、N362T/Q363E/T544R/Q547E、N362T/N448R、Q363E/T544R/Q547E、P427R/R482V/Q504P/M533D/Q536E、P427R/M533K/Q536E/V549T、N448R、N448R/T544R和N448R/T544R/Q547E/K615A,其中多肽序列的氨基酸位置参考SEQ ID NO:34来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:190具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自205、505、541、556和646的一个或更多个位置处包含至少一个取代或取代集,其中多肽序列的氨基酸位置参考SEQ ID NO:190来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:190具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自205Q、205T、505A、541R、556V、646L和646V的至少一个取代或取代集,其中多肽序列的氨基酸位置参考SEQ ID NO:190来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ IDNO:190具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自S205Q、S205T、Q505A、S541R、T556V、A646L和A646V的至少一个取代或取代集,其中多肽序列的氨基酸位置参考SEQ ID NO:190来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:190具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:205、220、239、261、261/339、261/339/547、261/536、261/536/547、339/427/536、339/427/536/547、339/427/547、405、442、505、539、541、542、545、556、558、594、631、663和665,其中多肽序列的氨基酸位置参考SEQ ID NO:190来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:190具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:205R、220A、239K、261L、261L/339S/547E、261L/339W、261L/536W、261L/536W/547E、339W/427R/536W、339W/427R/536W/547E、339W/427R/547E、405R、442L、442S、505G、539*、541G、541I、542*、545*、545I、545R、556*、558E、594A、631W、663*、663M和665E,其中多肽序列的氨基酸位置参考SEQ ID NO:190来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:190具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:S205R、S220A、D239K、E261L、E261L/N339S/Q547E、E261L/N339W、E261L/Q536W、E261L/Q536W/Q547E、N339W/P427R/Q536W、N339W/P427R/Q536W/Q547E、N339W/P427R/Q547E、V405R、V442L、V442S、Q505G、P539*、S541G、S541I、I542*、A545*、A545I、A545R、T556*、T558E、V594A、G631W、E663*、E663M和P665E,其中多肽序列的氨基酸位置参考SEQ ID NO:190来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:292具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:205/442/505/536/545/620/646、205/505/536/541/545/547/558/646/665、258、263、355/536/545/547、359、366、446、449、505/536/545/558/646、506、555、556、620和650,其中多肽序列的氨基酸位置参考SEQ ID NO:292来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:292具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:205R/442L/505A/536W/545I/620V/646V、205R/505A/536W/541I/545R/547E/558E/646V/665E、258G、263M、263S、355R/536W/545I/547E、359Y、366S、446P、449L、505A/536W/545I/558E/646V、506R、555D、555G、555L、556G、620L、620Q、620S和650T,其中多肽序列的氨基酸位置参考SEQ ID NO:292来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:292具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:S205R/V442L/Q505A/Q536W/A545I/E620V/A646V、S205R/Q505A/Q536W/S541I/A545R/Q547E/T558E/A646V/P665E、K258G、R263M、R263S、L355R/Q536W/A545I/Q547E、F359Y、N366S、R446P、A449L、Q505A/Q536W/A545I/T558E/A646V、G506R、E555D、E555G、E555L、T556G、E620L、E620Q、E620S和I650T,其中多肽序列的氨基酸位置参考SEQ ID NO:292来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:342具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:283/319/359/449/450/506、283/345/359/449/450/553/555、283/449/450/508/541/553/555、449/450、450/508/553/555/558、508和508/541/553,其中多肽序列的氨基酸位置参考SEQ ID NO:342来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:342具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:283H/345C/359Y/449L/450R/553T/555G、283L/319K/359Y/449L/450R/506R、283L/449L/450R/508G/541I/553T/555G、449L/450R、450R/508G/553R/555G/558E、508G和508G/541I/553T,其中多肽序列的氨基酸位置参考SEQ ID NO:342来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ IDNO:342具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:N283H/Q345C/F359Y/A449L/N450R/D553T/E555G、N283L/N319K/F359Y/A449L/N450R/G506R、N283L/A449L/N450R/N508G/S541I/D553T/E555G、A449L/N450R、N450R/N508G/D553R/E555G/T558E、N508G和N508G/S541I/D553T,其中多肽序列的氨基酸位置参考SEQ ID NO:342来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:396或1366具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:205、205/442/449/450、205/450/536/545、205/450/536/545/646、258/442/446、258/442/449/646、258/450/536/545、308、361、439、442/446/536/545/620/646、442/450/536/545、514、535、577、591、592、610、639、643和644,其中多肽序列的氨基酸位置参考SEQ ID NO:396或1366来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:396或1366具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:205S、205S/442V/449A/450N、205S/450N/536Q/545A、205S/450N/536Q/545A/646A、258Q/442V/446P、258Q/442V/449A/646A、258Q/450N/536Q/545A、308E、361V、439M、442V/446P/536Q/545A/620E/646A、442V/450N/536Q/545A、514H、535R、535V、577V、591R、591V、592P、610L、610P、610S、639E、639K、643E、643R和644A,其中多肽序列的氨基酸位置参考SEQ ID NO:396或1366来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:396或1366具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:R205S、R205S/L442V/L449A/R450N、R205S/R450N/W536Q/I545A、R205S/R450N/W536Q/I545A/V646A、K258Q/L442V/R446P、K258Q/L442V/L449A/V646A、K258Q/R450N/W536Q/I545A、A308E、I361V、S439M、L442V/R446P/W536Q/I545A/V620E/V646A、L442V/R450N/W536Q/I545A、R514H、E535R、E535V、D577V、K591R、K591V、A592P、A610L、A610P、A610S、A639E、A639K、A643E、A643R和D644A,其中多肽序列的氨基酸位置参考SEQ ID NO:396或1366来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:400或1370具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:32/490/639、236、236/238/404/480/555/568/592、236/359/404/406/555/639、236/359/490/581/639、236/359/555、236/359/609、236/370/406/568/581、236/370/568/592、236/370/581、236/404/406/480/490、236/404/555/581/609/639、236/568、236/592、236/639、238/359/370/404/490/568/639、245/363/408/512/514/596/666、245/363/512/514/537/560、308/514/535/639/644、359/404、359/404/406/490/546/581、363/408/512/514/537、363/408/601/650、363/639/644、408/512、408/514/537、408/514/560/650、490/568/592/639、512/537/560/601、514/535/546/575/644、514/639/644、514/644、535/575/639/644、535/639/643/644、535/643/644和601/650,其中多肽序列的氨基酸位置参考SEQ ID NO:400或1370来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:400或1370具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:32T/490E/639T、236V、236V/238I/404G/480L/555Q/568P/592P、236V/359Y/404G/406R/555Q/639T、236V/359Y/490E/581T/639T、236V/359Y/555Q、236V/359Y/609G、236V/370C/406R/568P/581T、236V/370C/568P/592P、236V/370C/581T、236V/404G/406R/480L/490E、236V/404G/555Q/581T/609G/639T、236V/568P、236V/592P、236V/639T、238I/359Y/370C/404G/490E/568P/639T、245S/363K/408V/512N/514H/596T/666D、245S/363K/512N/514H/537P/560S、308E/514H/535R/639K/644A、359Y/404G、359Y/404G/406R/490E/546E/581T、363H/639K/644A、363K/408V/512N/514H/537P、363K/408V/601I/650T、408V/512N、408V/514H/537P、408V/514H/560S/650T、490E/568P/592P/639T、512N/537P/560S/601I、514H/535R/546E/575G/644A、514H/639K/644A、514H/644A、535R/575G/639K/644A、535R/639K/643R/644A、535V/643R/644A和601I/650T,其中多肽序列的氨基酸位置参考SEQ ID NO:400或1370来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:400或1370具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:I32T/Q490E/A639T、M236V、M236V/L238I/S404G/I480L/E555Q/L568P/A592P、M236V/F359Y/S404G/K406R/E555Q/A639T、M236V/F359Y/Q490E/S581T/A639T、M236V/F359Y/E555Q、M236V/F359Y/A609G、M236V/S370C/K406R/L568P/S581T、M236V/S370C/L568P/A592P、M236V/S370C/S581T、M236V/S404G/K406R/I480L/Q490E、M236V/S404G/E555Q/S581T/A609G/A639T、M236V/L568P、M236V/A592P、M236V/A639T、L238I/F359Y/S370C/S404G/Q490E/L568P/A639T、T245S/Q363K/A408V/S512N/R514H/M596T/S666D、T245S/Q363K/S512N/R514H/E537P/T560S、A308E/R514H/E535R/A639K/D644A、F359Y/S404G、F359Y/S404G/K406R/Q490E/V546E/S581T、Q363H/A639K/D644A、Q363K/A408V/S512N/R514H/E537P、Q363K/A408V/M601I/I650T、A408V/S512N、A408V/R514H/E537P、A408V/R514H/T560S/I650T、Q490E/L568P/A592P/A639T、S512N/E537P/T560S/M601I、R514H/E535R/V546E/S575G/D644A、R514H/A639K/D644A、R514H/D644A、E535R/S575G/A639K/D644A、E535R/A639K/A643R/D644A、E535V/A643R/D644A和M601I/I650T,其中多肽序列的氨基酸位置参考SEQ ID NO:400或1370来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:454或1424具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:236、236/308/370/548、236/308/490/581/643、236/308/555/560/596、236/370、236/370/490/639、236/555、236/560/581、245/359/363/406/535/650、245/363/406/575/601/666、300、301、308、308/490/560/581/639/643、336、359/363/406/535/601/650、359/404/406/535、359/406/575/650/666、359/535/575/601、363/404/406/535/568、404/406/535、406、406/480/535/568/601、406/535/575、468和480/575/601/650,其中多肽序列的氨基酸位置参考SEQ ID NO:454或1424来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:454或1424具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:236V、236V/308E/370C/548E、236V/308E/490E/581T/643R、236V/308E/555Q/560S/596T、236V/370C、236V/370C/490E/639T、236V/555Q、236V/560S/581T、245S/359Y/363K/406R/535R/650T、245S/363K/406R/575G/601I/666D、300F、301V、308E、308E/490E/560S/581T/639T/643R、336W、359Y/363K/406R/535R/601I/650T、359Y/404G/406R/535R、359Y/406R/575G/650T/666D、359Y/535R/575G/601I、363K/404G/406R/535R/568P、404G/406R/535R、406R、406R/480L/535R/568P/601I、406R/535R/575G、468S和480L/575G/601I/650T,其中多肽序列的氨基酸位置参考SEQ ID NO:454或1424来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:454或1424具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:M236V、M236V/A308E/S370C/D548E、M236V/A308E/Q490E/S581T/A643R、M236V/A308E/E555Q/T560S/M596T、M236V/S370C、M236V/S370C/Q490E/A639T、M236V/E555Q、M236V/T560S/S581T、T245S/F359Y/Q363K/K406R/E535R/I650T、T245S/Q363K/K406R/S575G/M601I/S666D、L300F、A301V、A308E、A308E/Q490E/T560S/S581T/A639T/A643R、Y336W、F359Y/Q363K/K406R/E535R/M601I/I650T、F359Y/S404G/K406R/E535R、F359Y/K406R/S575G/I650T/S666D、F359Y/E535R/S575G/M601I、Q363K/S404G/K406R/E535R/L568P、S404G/K406R/E535R、K406R、K406R/I480L/E535R/L568P/M601I、K406R/E535R/S575G、A468S和I480L/S575G/M601I/I650T,其中多肽序列的氨基酸位置参考SEQ ID NO:454或1424来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:562或1532具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:133/301/346/347/468、205/236/347、205/236/370/490/537/620、205/342/439/442/514/620/639、205/370/537、205/442/505/620、236/258/370/505/545/639、236/339/514、236/370/450/620、236/545、258/339/342/505/537、258/342/370/408/442/537、300/301/308/346/347/468、300/301/347/468、301/308/336/346/406/468/601、301/308/346/406/468、301/308/468/601、301/347/406、308/336/347/468、308/347/468、342、342/408/490/505/514/545/639/646、342/620、370/442、370/537/639、489、539/649、542、543、543/673、558、559、566、634和661,其中多肽序列的氨基酸位置参考SEQ ID NO:562或1532来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQID NO:562或1532具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:133M/301V/346K/347F/468S、205S/236M/347F、205S/236M/370S/490Q/537E/620E、205S/342L/439S/442V/514R/620E/639A、205S/370S/537E、205S/442V/505Q/620E、236M/258Q/370S/505Q/545A/639A、236M/339N/514R、236M/370S/450N/620E、236M/545A、258Q/339N/342L/505Q/537E、258Q/342L/370S/408A/442V/537E、300F/301V/308E/346K/347F/468S、300F/301V/347F/468S、301V/308E/336W/346K/406R/468S/601I、301V/308E/346K/406R/468S、301V/308E/468S/601I、301V/347F/406R、308E/336W/347F/468S、308E/347F/468S、342L、342L/408A/490Q/505Q/514R/545A/639A/646A、342L/620E、370S/442V、370S/537E/639A、489Y、539M/649H、542M、543A、543V/673Y、558R、559H、559S、566G、634C和661D,其中多肽序列的氨基酸位置参考SEQ IDNO:562或1532来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:562或1532具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:L133M/A301V/V346K/V347F/A468S、R205S/V236M/V347F、R205S/V236M/C370S/E490Q/P537E/V620E、R205S/R342L/M439S/L442V/H514R/V620E/T639A、R205S/C370S/P537E、R205S/L442V/A505Q/V620E、V236M/K258Q/C370S/A505Q/I545A/T639A、V236M/W339N/H514R、V236M/C370S/R450N/V620E、V236M/I545A、K258Q/W339N/R342L/A505Q/P537E、K258Q/R342L/C370S/V408A/L442V/P537E、L300F/A301V/A308E/V346K/V347F/A468S、L300F/A301V/V347F/A468S、A301V/A308E/Y336W/V346K/K406R/A468S/M601I、A301V/A308E/V346K/K406R/A468S、A301V/A308E/A468S/M601I、A301V/V347F/K406R、A308E/Y336W/V347F/A468S、A308E/V347F/A468S、R342L、R342L/V408A/E490Q/A505Q/H514R/I545A/T639A/V646A、R342L/V620E、C370S/L442V、C370S/P537E/T639A、D489Y、P539M/D649H、I542M、F543A、F543V/H673Y、T558R、L559H、L559S、T566G、P634C和G661D,其中多肽序列的氨基酸位置参考SEQ ID NO:562或1532来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:562或1532具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:205/236/342/439/505/514/537/545、236/342/505/514/537/545、300/301/308/336/347/468/601、300/301/347/406、301/308/346/347/468、301/336/346/347/406/601和308/336/347/406/468/601,其中多肽序列的氨基酸位置参考SEQ ID NO:562或1532来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQID NO:562或1532具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:205S/236M/342L/439S/505Q/514R/537E/545A、236M/342L/505Q/514R/537E/545A、300F/301V/308E/336W/347F/468S/601I、300F/301V/347F/406R、301V/308E/346K/347F/468S、301V/336W/346K/347F/406R/601I和308E/336W/347F/406R/468S/601I,其中多肽序列的氨基酸位置参考SEQ ID NO:562或1532来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:562或1532具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:R205S/V236M/R342L/M439S/A505Q/H514R/P537E/I545A、V236M/R342L/A505Q/H514R/P537E/I545A、L300F/A301V/A308E/Y336W/V347F/A468S/M601I、L300F/A301V/V347F/K406R、A301V/A308E/V346K/V347F/A468S、A301V/Y336W/V346K/V347F/K406R/M601I和A308E/Y336W/V347F/K406R/A468S/M601I,其中多肽序列的氨基酸位置参考SEQ ID NO:562或1532来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:638或1608具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:346/511/537、346/511/537/541/543、346/511/542/582、346/511/581/582、346/511/583、346/529/571/581/582/583/589、511/537、516/539/568、537/582、539、568/662/663和581/582,其中多肽序列的氨基酸位置参考SEQID NO:638或1608来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:638或1608具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:346V/511S/537E、346V/511S/537E/541I/543G、346V/511S/542S/582R、346V/511S/581L/582R、346V/511S/583R、346V/529G/571I/581C/582V/583V/589A、511S/537E、516M/539E/568R、537E/582R、539E、568R/662W/663W和581L/582R,其中多肽序列的氨基酸位置参考SEQ ID NO:638或1608来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:638或1608具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:K346V/A511S/P537E、K346V/A511S/P537E/S541I/F543G、K346V/A511S/I542S/Y582R、K346V/A511S/S581L/Y582R、K346V/A511S/I583R、K346V/V529G/S571I/S581C/Y582V/I583V/T589A、A511S/P537E、P516M/P539E/L568R、P537E/Y582R、P539E、L568R/F662W/E663W和S581L/Y582R,其中多肽序列的氨基酸位置参考SEQ ID NO:638或1608来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:638或1608具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:346/511/537/582、346/511/543/582、346/511/544、346/537/542/544、346/543/544、346/583、511/537/542/582/583、516、516/539/555、537/543/582、539/568、540、542/544/581、548、549、559、559/568、582、647、650和664,其中多肽序列的氨基酸位置参考SEQ ID NO:638或1608来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:638或1608具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:346V/511S/537E/582V、346V/511S/543G/582R、346V/511S/544L、346V/537E/542S/544L、346V/543G/544L、346V/583R、511S/537E/542S/582R/583R、516M、516M/539E/555G、537E/543G/582R、539E/568R、540G、542S/544L/581R、548R、549G、559S、559S/568R、582V、647L、647W、650G和664R,其中多肽序列的氨基酸位置参考SEQ ID NO:638或1608来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:638或1608具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:K346V/A511S/P537E/Y582V、K346V/A511S/F543G/Y582R、K346V/A511S/T544L、K346V/P537E/I542S/T544L、K346V/F543G/T544L、K346V/I583R、A511S/P537E/I542S/Y582R/I583R、P516M、P516M/P539E/E555G、P537E/F543G/Y582R、P539E/L568R、V540G、I542S/T544L/S581R、D548R、V549G、L559S、L559S/L568R、Y582V、Q647L、Q647W、I650G和Q664R,其中多肽序列的氨基酸位置参考SEQ ID NO:638或1608来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:680或1650具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:261/355/543、261/355/567/568、261/489、261/489/511/568、261/489/539、261/489/567、261/539/543、261/539/543/567、261/542/543/568、511、511/539/543、511/567、543和583,其中多肽序列的氨基酸位置参考SEQ IDNO:680或1650来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:680或1650具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:261D/355C/543A、261D/355C/567R/568R、261D/489E、261D/489E/511D/568R、261D/489E/539L、261D/489E/567R、261D/539L/543A、261D/539L/543D/567R、261D/542L/543A/568R、511D、511D/539L/543A、511D/567R、543A和583E,其中多肽序列的氨基酸位置参考SEQ ID NO:680或1650来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:680或1650具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:L261D/L355C/F543A、L261D/L355C/D567R/L568R、L261D/D489E、L261D/D489E/A511D/L568R、L261D/D489E/P539L、L261D/D489E/D567R、L261D/P539L/F543A、L261D/P539L/F543D/D567R、L261D/I542L/F543A/L568R、A511D、A511D/P539L/F543A、A511D/D567R、F543A和I583E,其中多肽序列的氨基酸位置参考SEQ ID NO:680或1650来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:756或1726具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:9、9/17/34/35/93/554、9/17/50、9/17/93、9/29/35/43/77/542/554、9/32/77/93、9/43/77、9/50/63/93、9/93、17/29/34/35/36/77/93、17/32/34/35、17/77、32/34/93、43、50/77/93、50/93、77/93、93、205/263/470、205/344/470/565、205/345/470/538/664、205/470/545/568/645/647/664、205/470/567/568/645、263/344/664、263/470/645、263/489、263/539/541/568/645、344/355/470/489/645、344/355/470/568/645/647、344/470/489/539/542/645/647/664、344/470/489/567/568、344/470/568、344/470/647、470、470/489、470/541/542/543/565/645/647、470/567/568、470/664和542/543,其中多肽序列的氨基酸位置参考SEQ ID NO:756或1726来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:756或1726具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:9K、9K/17A/34M/35G/93E/554M、9K/17A/50S、9K/17A/93E、9K/29S/35G/43P/77D/542V/554M、9K/32A/77D/93E、9K/43P/77D、9K/50S/63E/93E、9K/93E、9Q/17A/93E、17A/29S/34M/35G/36D/77D/93E、17A/32A/34M/35G、17A/77D、32A/34M/93E、43P、50S/77D/93E、50S/93E、77D/93E、93E、205L/263V/470Q、205L/344V/470Q/565A、205L/345P/470Q/538T/664R、205L/470Q/545L/568R/645S/647W/664R、205L/470Q/567R/568R/645S、263I/344V/664R、263I/470Q/645S、263I/489D、263I/539L/541R/568R/645S、344V/355C/470Q/489D/645S、344V/355C/470Q/568R/645S/647W、344V/470Q/489D/539L/542L/645S/647W/664R、344V/470Q/489D/567R/568R、344V/470Q/568R、344V/470Q/647W、470Q、470Q/489D、470Q/541R/542L/543A/565A/645S/647W、470Q/567R/568R、470Q/664R和542L/543A,其中多肽序列的氨基酸位置参考SEQ ID NO:756或1726来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQID NO:756或1726具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:R9K、R9K/T17A/T34M/E35G/A93E/L554M、R9K/T17A/N50S、R9K/T17A/A93E、R9K/N29S/E35G/S43P/N77D/I542V/L554M、R9K/I32A/N77D/A93E、R9K/S43P/N77D、R9K/N50S/A63E/A93E、R9K/A93E、R9Q/T17A/A93E、T17A/N29S/T34M/E35G/T36D/N77D/A93E、T17A/I32A/T34M/E35G、T17A/N77D、I32A/T34M/A93E、S43P、N50S/N77D/A93E、N50S/A93E、N77D/A93E、A93E、R205L/R263V/P470Q、R205L/N344V/P470Q/N565A、R205L/Q345P/P470Q/S538T/Q664R、R205L/P470Q/I545L/L568R/K645S/Q647W/Q664R、R205L/P470Q/D567R/L568R/K645S、R263I/N344V/Q664R、R263I/P470Q/K645S、R263I/E489D、R263I/P539L/S541R/L568R/K645S、N344V/L355C/P470Q/E489D/K645S、N344V/L355C/P470Q/L568R/K645S/Q647W、N344V/P470Q/E489D/P539L/I542L/K645S/Q647W/Q664R、N344V/P470Q/E489D/D567R/L568R、N344V/P470Q/L568R、N344V/P470Q/Q647W、P470Q、P470Q/E489D、P470Q/S541R/I542L/F543A/N565A/K645S/Q647W、P470Q/D567R/L568R、P470Q/Q664R和I542L/F543A,其中多肽序列的氨基酸位置参考SEQ IDNO:756或1726来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:756或1726具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:9/17/32/34/36/50/77/107/127、9/17/63/77、9/43/93/127、9/63/93/107、17/29/32/34/36/63、29/34/35/77、32/43/93、35/93/145和205/263/489/647,其中多肽序列的氨基酸位置参考SEQ ID NO:756或1726来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:756或1726具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:9K/17A/32A/34M/36D/50S/77D/107K/127S、9K/17A/63E/77D、9K/43P/93E/127S、9K/63E/93E/107K、17A/29S/32A/34M/36D/63E、29S/34M/35G/77D、32A/43P/93E、35G/93E/145E和205L/263V/489D/647W,其中多肽序列的氨基酸位置参考SEQ ID NO:756或1726来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:756或1726具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:R9K/T17A/I32A/T34M/T36D/N50S/N77D/M107K/G127S、R9K/T17A/A63E/N77D、R9K/S43P/A93E/G127S、R9K/A63E/A93E/M107K、T17A/N29S/I32A/T34M/T36D/A63E、N29S/T34M/E35G/N77D、I32A/S43P/A93E、E35G/A93E/G145E和R205L/R263V/E489D/Q647W,其中多肽序列的氨基酸位置参考SEQ ID NO:756或1726来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:188、189、265、266、334、442、454、646和649,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:188W、189A、189P、265R、266E、266G、334I、442V、454L、454M、454S、646I、646M、646R、649T和649Y,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:N188W、K189A、K189P、G265R、N266E、N266G、V334I、L442V、A454L、A454M、A454S、V646I、V646M、V646R、D649T和D649Y,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自189、266、266/283、546、594和646的一个或更多个位置处包含至少一个取代或取代集,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:189I、266A、266L、266L/283K、266M、266S、266V、266W、266Y、546L、594A和646L,其中多肽序列的氨基酸位置参考SEQ IDNO:812或1782来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:K189I、N266A、N266L、N266L/N283K、N266M、N266S、N266V、N266W、N266Y、V546L、V594A和V646L,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:263/470/568、266、470/542/543/664和558/577/594,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:263I/470P/568R、266R、470P/542L/543A/664Q和558E/577V/594A,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自R263I/Q470P/L568R、N266R、Q470P/I542L/F543A/R664Q和T558E/D577V/V594A的至少一个取代或取代集,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:29、29/35、29/35/342/581/582/664、29/50/511/539/581、35、35/50/205/406/511/581、35/205/511、35/342/346/511/539/581、35/346、35/346/406/511/581/582/664、35/511、35/539、50/342、132、133、143、147、187、188、257、258、263、294、294/441/527、308/342/511/581/582、342、346、398、406/664、429/652、441、441/446/526、446/652、482、505、511、526、527、536、545、581、582、615、620、639、645、646、648、652、654和664,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:29F、29G、29S/35G、29S/35G/342L/581S/582Y/664Q、29S/50S/511S/539L/581S、35D/511S、35G、35G/50S/205S/406R/511S/581S、35G/205S/511S、35G/342L/346V/511S/539L/581S、35G/346V、35G/346V/406R/511S/581S/582Y/664Q、35G/511S、35G/539L、50S/342L、132T、133V、143H、147T、187G、188T、257L、258H、258N、263S、294A、294A/441A/527A、308A/342L/511S/581S/582Y、342F、346V、398G、406R/664Q、429L/652T、441A、441A/446P/526L、441V、446P/652T、482V、505F、505M、511S、526V、527D、527R、536H、536R、545V、581A、581S、582G、582S、582Y、615Q、620E、639E、639I、645E、645G、645W、646G、646R、648Q、648V、652L、652Q、652T、652Y、654C、664G、664V和664W,其中多肽序列的氨基酸位置参考SEQ IDNO:812或1782来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:N29F、N29G、N29S/E35G、N29S/E35G/R342L/L581S/R582Y/R664Q、N29S/N50S/A511S/P539L/L581S、E35D/A511S、E35G、E35G/N50S/R205S/K406R/A511S/L581S、E35G/R205S/A511S、E35G/R342L/K346V/A511S/P539L/L581S、E35G/K346V、E35G/K346V/K406R/A511S/L581S/R582Y/R664Q、E35G/A511S、E35G/P539L、N50S/R342L、I132T、L133V、E143H、A147T、I187G、N188T、R257L、K258H、K258N、R263S、R294A、R294A/R441A/K527A、E308A/R342L/A511S/L581S/R582Y、R342F、K346V、A398G、K406R/R664Q、K429L/K652T、R441A、R441A/R446P/R526L、R441V、R446P/K652T、R482V、A505F、A505M、A511S、R526V、K527D、K527R、W536H、W536R、I545V、L581A、L581S、R582G、R582S、R582Y、K615Q、V620E、T639E、T639I、K645E、K645G、K645W、V646G、V646R、R648Q、R648V、K652L、K652Q、K652T、K652Y、R654C、R664G、R664V和R664W,其中多肽序列的氨基酸位置参考SEQ IDNO:812或1782来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:1030或2000具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下一个或更多个位置处包含至少一个取代或取代集:29、29/143/263/266/441/639、29/263/266、29/263/266/441/620、29/266/441、29/441/639、30、37、47/570、75、81、85、92、135、143、143/263/266/639、143/266/441/620/639、168、189/424、237/527、244、258/342/582/648、263、263/266/441、263/266/639、266/441、266/441/620/639、266/620/639、266/639、267、342/526/664、342/545、342/582、429、441、482、495、501、523、526、527、568、570、573、581、582、616、632、648、653和654,其中多肽序列的氨基酸位置参考SEQ ID NO:1030或2000来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:1030或2000具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:29G/143H/263S/266A/441V/639I、29G/263S/266A、29G/263S/266L/441A/620E、29G/266A/441A、29G/441V/639V、29S、30G、37L、47G/570E、75N、75S、81N、85L、92L、135E、143H/263S/266A/639V、143H/266A/441V/620E/639V、143Q、168E、189Q/424G、237E/527V、244S、258H/342F/582S/648Q、263S/266A/441A、263S/266A/441V、263S/266A/639V、263T、266A/441V/620E/639V、266A/620E/639I、266A/639I、266L/441A、267G、342F/526V/664G、342F/545V、342F/582G、429P、441E、482V、495L、501Q、523V、526E、527E、527L、527M、527R、527T、568P、570E、573T、581T、582F、616T、632Q、648A、653I和654V,其中多肽序列的氨基酸位置参考SEQ ID NO:1030或2000来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQID NO:1030或2000具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:N29G/E143H/R263S/N266A/R441V/T639I、N29G/R263S/N266A、N29G/R263S/N266L/R441A/V620E、N29G/N266A/R441A、N29G/R441V/T639V、N29S、R30G、R37L、E47G/K570E、R75N、R75S、R81N、R85L、P92L、R135E、E143H/R263S/N266A/T639V、E143H/N266A/R441V/V620E/T639V、E143Q、S168E、K189Q/D424G、D237E/K527V、R244S、K258H/L342F/R582S/R648Q、R263S/N266A/R441A、R263S/N266A/R441V、R263S/N266A/T639V、R263T、N266A/R441V/V620E/T639V、N266A/V620E/T639I、N266A/T639I、N266L/R441A、R267G、L342F/R526V/R664G、L342F/I545V、L342F/R582G、K429P、R441E、R482V、I495L、R501Q、M523V、R526E、K527E、K527L、K527M、K527R、K527T、L568P、K570E、K573T、S581T、R582F、K616T、K632Q、R648A、M653I和R654V,其中多肽序列的氨基酸位置参考SEQ ID NO:1030或2000来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:1136或2106具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:29、29/30、29/30/143/263/482/646、29/30/263、29/30/616/648、29/75/263/568/570/648、29/168/648、29/263/527/568、75、75/143/168/527、75/168、75/616、143、168/247/482/648、168/263/616、168/482/616、168/495/616、263、263/616、429/545、495和527,其中多肽序列的氨基酸位置参考SEQ ID NO:1136或2106来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:1136或2106具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:29S、29S/30G、29S/30G/143Q/263T/482V/646E、29S/30G/263T、29S/30G/616T/648A、29S/75S/263T/568P/570E/648A、29S/168E/648A、29S/263T/527L/568P、75S、75S/143Q/168E/527L、75S/168E、75S/616T、143Q、168E/247S/482V/648A、168E/263T/616T、168E/482V/616T、168E/495L/616T、263T、263T/616T、429P/545V、495L和527T,其中多肽序列的氨基酸位置参考SEQ ID NO:1136或2106来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:1136或2106具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:N29S、N29S/R30G、N29S/R30G/E143Q/S263T/R482V/V646E、N29S/R30G/S263T、N29S/R30G/K616T/R648A、N29S/R75S/S263T/L568P/K570E/R648A、N29S/S168E/R648A、N29S/S263T/K527L/L568P、R75S、R75S/E143Q/S168E/K527L、R75S/S168E、R75S/K616T、E143Q、S168E/G247S/R482V/R648A、S168E/S263T/K616T、S168E/R482V/K616T、S168E/I495L/K616T、S263T、S263T/K616T、K429P/I545V、I495L和K527T,其中氨基酸位置参考SEQ ID NO:1136或2106来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:1136或2106具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:207、222、266、307、454、535、546、548、580、604和610,其中多肽序列的氨基酸位置参考SEQ ID NO:1136或2106来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:1136或2106具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:207R、222T、266K、307L、454L、535V、546R、548S、580C、604P和610R,其中多肽序列的氨基酸位置参考SEQ ID NO:1136或2106来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQID NO:1136或2106具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:Q207R、S222T、A266K、Q307L、A454L、E535V、V546R、D548S、H580C、H604P和A610R,其中多肽序列的氨基酸位置参考SEQ ID NO:1136或2106来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:1180或2150具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:75/168/207/454/568/586/610/648/659、75/168/266/454/546/570/580、75/207/454/570/659、75/207/546/580/648、75/263/454/548/568/604/648、75/266/454、75/454、75/454/546/548/568/604、75/546/548/610/648、168/207/263/454/568/570/604、168/263/266/546/604、168/454/604、207/604/610、209、212、221、223、228、266/454/568、319、373、412/546/554、431、454、454/546/568/570/580、454/546/570、454/570/580/610、454/580、454/659和506,其中多肽序列的氨基酸位置参考SEQID NO:1180或2150来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:1180或2150具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:75S/168E/207R/454L/568P/586V/610R/648A/659T、75S/168E/266K/454L/546R/570E/580C、75S/207R/454L/570E/659T、75S/207R/546R/580C/648A、75S/263T/454L/548S/568P/604P/648A、75S/266K/454L、75S/454L、75S/454L/546R/548S/568P/604P、75S/546R/548S/610R/648A、168E/207R/263T/454L/568P/570E/604P、168E/263T/266K/546R/604P、168E/454L/604P、207R/604P/610R、209V、212S、221I、223Q、228I、228V、266K/454L/568P、319Q、373F、412Y/546L/554M、431T、454I、454L/546R/568P/570E/580C、454L/546R/570E、454L/570E/580C/610R、454L/580C、454L/659T和506N,其中多肽序列的氨基酸位置参考SEQ ID NO:1180或2150来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:1180或2150具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:R75S/S168E/Q207R/A454L/L568P/L586V/A610R/R648A/E659T、R75S/S168E/A266K/A454L/V546R/K570E/H580C、R75S/Q207R/A454L/K570E/E659T、R75S/Q207R/V546R/H580C/R648A、R75S/S263T/A454L/D548S/L568P/H604P/R648A、R75S/A266K/A454L、R75S/A454L、R75S/A454L/V546R/D548S/L568P/H604P、R75S/V546R/D548S/A610R/R648A、S168E/Q207R/S263T/A454L/L568P/K570E/H604P、S168E/S263T/A266K/V546R/H604P、S168E/A454L/H604P、Q207R/H604P/A610R、I209V、D212S、L221I、N223Q、T228I、T228V、A266K/A454L/L568P、N319Q、L373F、F412Y/V546L/L554M、P431T、A454I、A454L/V546R/L568P/K570E/H580C、A454L/V546R/K570E、A454L/K570E/H580C/A610R、A454L/H580C、A454L/E659T和G506N,其中多肽序列的氨基酸位置参考SEQ ID NO:1180或2150来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:1250或2220具有至少85%、80%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:75/189/373/582、75/200/212/431/482、75/212/373/431/482、75/212/431/482/568/615/664、75/368/582、75/373/431/526/582、75/431/482/570/604/664、75/632、189/212/431/568/570、200/205/373/431、200/431/482/615/664、200/482/664、212/228/431、212/228/568/570/582/664、212/373/446/482/582、368/373/431、373/431/570/604/664、373/568/632、431、431/604/664、482/582、582和615/652/664,其中多肽序列的氨基酸位置参考SEQ ID NO:1250或2220来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:1250或2220具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:75S/189A/373F/582G、75S/200W/212S/431T/482S、75S/212S/373F/431T/482S、75S/212S/431T/482S/568P/615M/664G、75S/368M/582G、75S/373F/431T/526E/582G、75S/431T/482S/570K/604P/664G、75S/632Q、189A/212S/431T/568P/570K、200W/205S/373F/431T、200W/431T/482S/615M/664G、200W/482S/664W、212S/228V/431T、212S/228V/568P/570K/582G/664W、212S/373F/446F/482S/582G、368M/373F/431T、373F/431T/570K/604P/664W、373F/568P/632Q、431T、431T/604P/664G、482S/582G、582G和615M/652V/664G,其中多肽序列的氨基酸位置参考SEQ ID NO:1250或2220来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:1250或2220具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:R75S/K189A/L373F/R582G、R75S/K200W/D212S/P431T/R482S、R75S/D212S/L373F/P431T/R482S、R75S/D212S/P431T/R482S/L568P/K615M/R664G、R75S/K368M/R582G、R75S/L373F/P431T/R526E/R582G、R75S/P431T/R482S/E570K/H604P/R664G、R75S/K632Q、K189A/D212S/P431T/L568P/E570K、K200W/R205S/L373F/P431T、K200W/P431T/R482S/K615M/R664G、K200W/R482S/R664W、D212S/T228V/P431T、D212S/T228V/L568P/E570K/R582G/R664W、D212S/L373F/R446F/R482S/R582G、K368M/L373F/P431T、L373F/P431T/E570K/H604P/R664W、L373F/L568P/K632Q、P431T、P431T/H604P/R664G、R482S/R582G、R582G和K615M/K652V/R664G,其中多肽序列的氨基酸位置参考SEQ ID NO:1250或2220来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:1308或2278具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:408/439、439/514、470、470/667、514、514/537和537,其中多肽序列的氨基酸位置参考SEQ ID NO:1308或2278来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:1308或2278具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:408A/439S、439S/514R、470G、470G/667D、470P、514R、514R/537E和537E,其中多肽序列的氨基酸位置参考SEQ ID NO:1308或2278来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:1308或2278具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:V408A/M439S、M439S/H514R、Q470G、Q470G/G667D、Q470P、H514R、H514R/P537E和P537E,其中多肽序列的氨基酸位置参考SEQ ID NO:1308或2278来编号。
在一些另外的实施方案中,重组蛋白酶包含如表3.1、表3.2、表3.3、表3.4、表3.5、表3.6、表3.7、表3.8、表3.9、表3.10、表3.11、表3.12、表3.13、表3.14、表3.15、表3.16、表3.17、表3.18、表3.19、表3.20、表3.21、表3.22、表3.23、表3.24、表3.25、表3.26和/或表3.27中提供的至少一个位置中的至少一个突变,其中位置参考SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:4-1362和1366-2332中的偶数编号序列中列出的至少一个序列具有至少约80%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更多序列同一性的多肽序列。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:4-1362和1366-2332中的偶数编号序列中列出的至少一个序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。在一些另外的实施方案中,重组蛋白酶包含SEQ ID NO:4-1362和1366-2332中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:396-1362中的偶数编号序列中列出的至少一个序列,其中所述序列不存在组氨酸标签和组氨酸标签之前的四个氨基酸的接头。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:1366-2332中的偶数编号序列中列出的至少一个序列。
在一些另外的实施方案中,与参考序列相比,重组蛋白酶在暴露于高温和/或低温后保留更大的酶活性。在一些实施方案中,参考序列是野生型蛋白酶,而在一些其他实施方案中,参考序列是另一种重组蛋白酶。在一些另外的实施方案中,重组蛋白酶比SEQ ID NO:2的蛋白酶更热稳定。在一些此外的实施方案中,重组蛋白酶比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更热稳定。在一些实施方案中,重组蛋白酶在40℃至50℃是稳定的。在一些实施方案中,重组蛋白酶在25℃、37℃、42℃和/或48℃是稳定的。在一些另外的实施方案中,重组蛋白酶在40℃至50℃比参考序列更稳定。在一些实施方案中,重组蛋白酶在25℃、37℃、42℃和/或48℃比参考序列更稳定。在一些另外的实施方案中,重组蛋白酶比SEQ ID NO:2的蛋白酶更热稳定。在一些此外的实施方案中,重组蛋白酶比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更热稳定。
在一些实施方案中,重组蛋白酶在低pH环境中是稳定的,而在其他实施方案中,重组蛋白酶在高pH环境中是稳定的,并且在仍此外的实施方案中,重组蛋白酶在中性pH环境中是稳定的。在一些实施方案中,重组蛋白酶在低和高pH环境中是稳定的,并且在一些另外的实施方案中,蛋白酶在低、中性和高pH环境中是稳定的。在一些实施方案中,重组蛋白酶在暴露于低、高和/或中性pH环境后保留酶活性。在一些另外的实施方案中,与参考序列相比,重组蛋白酶在高、中性和/或低pH环境更稳定。在一些实施方案中,参考序列是野生型蛋白酶,而在其他实施方案中,参考序列是另一种工程化蛋白酶。在一些另外的实施方案中,重组蛋白酶在低、中性和高pH环境中比SEQ ID NO:2的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在低、中性和高pH环境中比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在大于7的pH比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在大于7的pH比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 7.8比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 7.8比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 7.5比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 7.5比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 7比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 7比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在小于7的pH(即,在酸性pH条件或水平)比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在小于pH 7的pH(即,在酸性pH条件或水平)比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH6.5比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 6.5比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 6比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 6比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在小于5的pH比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 5比SEQ IDNO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 5比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在pH 4比SEQ ID NO:2的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在pH 5比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 3.8比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 3.8比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在pH 3.5比SEQ ID NO:2的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在pH 3.5比SEQ IDNO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在pH 3比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 3.26比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 3.26比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在pH 3比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 2.75比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH2.75比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在pH 2.5比SEQ ID NO:2的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在pH 2.5比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在pH 2比SEQ ID NO:2的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在pH 2比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。
在一些实施方案中,重组蛋白酶在pH 6比pH 7更有活性。在一些实施方案中,关于在pH 6比在pH 7更有活性方面,重组蛋白酶比SEQ ID NO:2的蛋白酶更有活性。在一些另外的实施方案中,关于在pH 6比在pH 7更有活性方面,重组蛋白酶比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更有活性。
在一些实施方案中,重组蛋白酶比SEQ ID NO:2的蛋白酶更抗蛋白水解。在一些实施方案中,重组蛋白酶比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更抗蛋白水解。在一些实施方案中,重组蛋白酶抗胃蛋白酶的蛋白水解。在一些另外的实施方案中,重组蛋白酶比SEQ ID NO:2的蛋白酶更抗胃蛋白酶的蛋白水解。在一些实施方案中,重组蛋白酶比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更抗胃蛋白酶的蛋白水解。在一些另外的实施方案中,重组蛋白酶抗胰蛋白酶的蛋白水解。在一些另外的实施方案中,重组蛋白酶比SEQ ID NO:2的蛋白酶更抗胰蛋白酶的蛋白水解。在一些实施方案中,重组蛋白酶比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更抗胰蛋白酶的蛋白水解。在一些实施方案中,重组蛋白酶抗胰凝乳蛋白酶的蛋白水解。在一些另外的实施方案中,重组蛋白酶比SEQ ID NO:2的蛋白酶更抗胰凝乳蛋白酶的蛋白水解。在一些实施方案中,重组蛋白酶比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更抗胰凝乳蛋白酶的蛋白水解。在一些此外的实施方案中,重组蛋白酶抗胃蛋白酶、胰蛋白酶和/或胰凝乳蛋白酶的蛋白水解。在一些另外的实施方案中,重组蛋白酶比SEQ ID NO:2的蛋白酶更抗胃蛋白酶、胰蛋白酶和/或胰凝乳蛋白酶的蛋白水解。在一些实施方案中,重组蛋白酶比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更抗胃蛋白酶、胰蛋白酶和/或胰凝乳蛋白酶的蛋白水解。
在一些实施方案中,本发明的重组蛋白酶抗自溶(即,重组蛋白酶被重组蛋白酶自身的蛋白水解)。在一些实施方案中,重组蛋白酶比SEQ ID NO:2的蛋白酶更抗自溶。在一些实施方案中,重组蛋白酶比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更抗自溶。
在一些另外的实施方案中,重组蛋白酶在存在至少一种胆盐的情况下是有活性的。在一些另外的实施方案中,重组蛋白酶在存在至少一种胆盐的情况下比SEQ ID NO:2的蛋白酶更有活性。在一些另外的实施方案中,重组蛋白酶在存在至少一种胆盐的情况下比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更有活性。在一些实施方案中,重组蛋白酶在暴露于胆盐后保留酶活性。在一些另外的实施方案中,与参考序列相比,重组蛋白酶在暴露于胆盐后保留更大的酶活性。在一些实施方案中,参考序列是SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶。在一些另外的实施方案中,胆盐是牛磺胆酸盐。
在又一些另外的实施方案中,与野生型蛋白酶或另一种重组蛋白酶相比,重组蛋白酶表现出多于一种改进的特性。在一些实施方案中,与SEQ ID NO:2相比,重组蛋白酶表现出多于一种改进的特性,而在一些另外的实施方案中,重组蛋白酶与SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278相比,表现出多于一种改进的特性。在一些实施方案中,改进的特性选自酸稳定性、碱稳定性、在酸性pH的稳定性、在碱性pH的稳定性、在中性pH的稳定性、热稳定性、蛋白水解抗性、自溶抗性、增加的在酸性pH的活性和增加的在存在至少一种胆盐的情况下的活性。在一些实施方案中,改进的特性选自酸稳定性、在酸性pH的稳定性、热稳定性、蛋白水解抗性、自溶抗性、增加的在酸性pH的活性和增加的在存在至少一种胆盐的情况下的活性。在又一些另外的实施方案中,重组蛋白酶在酸性pH比SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定和/或更有活性、更耐热、更抗蛋白水解和/或在存在至少一种胆盐的情况下更有活性。设想了可将改进的特性的任何组合用于本发明。不意图本发明受限于改进的特性的任何特定组合。此外,在一些实施方案中,有两种改进的特性,而在一些其他实施方案中,有三种改进的特性,在一些另外的实施方案中,有四种改进的特性,并且在一些另外的实施方案中,有五种或更多种改进的特性。还设想了本发明的重组蛋白酶还包括另外的改进。在一些实施方案中,这些另外的改进提供了优于野生型蛋白酶的优势,而在一些其他实施方案中,这些另外的改进将提供优于其他重组蛋白酶的优势。
在一些实施方案中,与SEQ ID NO:2的蛋白酶相比,重组蛋白酶表现出至少一种选自以下的改进的特性:改进的在酸性pH的稳定性和/或活性、改进的热稳定性、改进的对蛋白水解的抗性、在存在至少一种胆盐的情况下改进的稳定性和/或改进的活性。在一些实施方案中,与SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶相比,重组蛋白酶表现出至少一种选自以下的改进的特性:改进的在酸性pH的稳定性和/或活性、改进的热稳定性、改进的对蛋白水解的抗性、在存在至少一种胆盐的情况下改进的稳定性和/或改进的活性。在一些实施方案中,与SEQ ID NO:2的蛋白酶相比,重组蛋白酶表现出至少两种选自以下的改进的特性:改进的在酸性pH的稳定性和/或活性、改进的热稳定性、改进的对自溶的稳定性、改进的对蛋白水解的抗性和/或改进的在存在至少一种胆盐的情况下的活性。在一些实施方案中,与SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶相比,重组蛋白酶表现出至少两种选自以下的改进的特性:改进的在酸性pH的稳定性和/或活性、改进的热稳定性、改进的对蛋白水解的抗性、改进的对自溶的稳定性和/或改进的在存在至少一种胆盐的情况下的活性。在一些实施方案中,与SEQ ID NO:2的蛋白酶相比,重组蛋白酶表现出至少三种选自以下的改进的特性:改进的在酸性pH的稳定性和/或活性、改进的热稳定性、改进的对蛋白水解的抗性、改进的对自溶的稳定性和/或改进的在存在至少一种胆盐的情况下的活性。在一些实施方案中,与SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶相比,重组蛋白酶表现出至少三种选自以下的改进的特性:改进的在酸性pH的稳定性和/或活性、改进的热稳定性、改进的对蛋白水解的抗性、改进的对自溶的稳定性和/或改进的在存在至少一种胆盐的情况下的活性。在一些实施方案中,与SEQ ID NO:2的蛋白酶相比,重组蛋白酶表现出以下的改进的特性:改进的在酸性pH的稳定性和/或活性、改进的热稳定性、改进的对自溶的稳定性、改进的对蛋白水解的抗性和改进的在存在至少一种胆盐的情况下的活性。在一些实施方案中,与SEQ IDNO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶相比,重组蛋白酶表现出以下的改进的特性:改进的在酸性pH的稳定性和/或活性、改进的热稳定性、改进的对蛋白水解的抗性、改进的对自溶的稳定性和/或改进的在存在至少一种胆盐的情况下的活性。在一些实施方案中,与SEQ ID NO:2的蛋白酶相比,重组蛋白酶表现出至少一种选自以下的改进的特性:改进的在酸性pH的稳定性和/或活性、改进的热稳定性、改进的对蛋白水解的抗性、改进的对自溶的稳定性和/或改进的在存在至少一种胆盐的情况下的活性,以及至少一种另外的改进的特性。在一些实施方案中,与SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶相比,重组蛋白酶表现出至少一种选自以下的改进的特性:改进的在酸性pH的稳定性和/或活性、改进的热稳定性、改进的对蛋白水解的抗性、改进的对自溶的稳定性和/或改进的在存在至少一种胆盐的情况下的活性,以及至少一种另外的改进的特性。在一些实施方案中,与参考序列相比,重组蛋白酶表现出至少一种选自以下的改进的特性:i)增强的催化活性;ii)增加的对酸性pH的耐受性;iii)增加的对pH 3.5的耐受性;iv)增加的对pH 3的耐受性;v)增加的对至少一种蛋白酶的耐受性;vi)增加的对至少一种胆盐的耐受性;vii)增加的耐热性;viii)增加的对自溶的稳定性,或i)、ii)、iii)、iv)、v)、vi)、vii)和viii)的任何组合。在一些实施方案中,参考序列是SEQ ID NO:2,而在一些可选的实施方案中,参考序列选自SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278。在一些实施方案中,与至少一个参考序列相比,重组蛋白酶表现出至少一种选自以下的改进的特性:i)增强的催化活性;ii)增加的对酸性pH的耐受性;iii)增加的对pH 3.5的耐受性;iv)增加的对pH 3的耐受性;v)增加的对至少一种蛋白酶的耐受性;vi)增加的对至少一种胆盐的耐受性;vii)增加的耐热性;viii)增加的对自溶的耐受性;或i)、ii)、iii)、iv)、v)、vi)、vii)和viii)的任何组合。在一些实施方案中,参考序列是SEQ ID NO:2,而在一些可选的实施方案中,参考序列选自SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278。在一些实施方案中,与至少两个或更多个参考序列相比,重组蛋白酶表现出至少一种选自以下的改进的特性:i)增强的催化活性;ii)增加的对酸性pH的耐受性;iii)增加的对pH 3.5的耐受性;iv)增加的对pH 3的耐受性;v)增加的对至少一种蛋白酶的耐受性;vi)增加的对至少一种胆盐的耐受性;vii)增加的耐热性;viii)增加的对自溶的耐受性,或i)、ii)、iii)、iv)、v)、vi)、vii)和viii)的任何组合。在一些实施方案中,参考序列选自SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278。在一些此外的实施方案中,重组蛋白酶是纯化的。
在仍一些此外的实施方案中,蛋白酶在食物和/或饮料中是稳定的。在一些另外的实施方案中,蛋白酶在营养补充剂和其他补充剂中是稳定的。在一些实施方案中,补充剂是液体,而在其他实施方案中,它们是乳液、悬浮液或固体。不意图本发明受限于任何特定的食品、饮料和/或补充剂形制(format)或形式。
本发明还提供了编码至少一种本文提供的重组蛋白酶的重组多核苷酸序列。在一些实施方案中,重组多核苷酸序列是密码子优化的。在一些此外的实施方案中,重组多核苷酸包含与SEQ ID NO:3-1361和1365-2331中的奇数编号序列中列出的至少一个序列具有至少约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更多序列同一性的序列。在一些此外的实施方案中,多核苷酸包含与SEQ ID NO:3-1361和1365-2331中的奇数编号序列中列出的至少一个序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的序列。在一些另外的实施方案中,本发明提供了SEQ ID NO:3-1361和1365-2331中的奇数编号序列中列出的至少一个序列。在一些另外的实施方案中,重组多核苷酸序列包含选自SEQ ID NO:3-1361和1365-2331中的奇数编号序列的序列。在一些实施方案中,重组多核苷酸序列包含选自SEQ ID NO:3-1361和1365-2331中的奇数编号序列的序列,其中所述序列编码本文提供的重组多肽。在一些实施方案中,重组多核苷酸序列包含选自SEQ ID NO:3-1361和1365-2331中的奇数编号序列的序列,其中所述序列编码在SEQ ID NO:4-1362和1366-2332中提供的偶数编号序列中提供的重组多肽。在一些此外的实施方案中,编码本文提供的重组蛋白酶的重组多核苷酸包含与SEQ ID NO:3-1361和1365-2331中的奇数编号序列中列出的至少一个序列具有至少约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更多序列同一性的序列。在一些此外的实施方案中,编码本文提供的重组蛋白酶的重组多核苷酸包含与SEQ ID NO:3-1361和1365-2331中的奇数编号序列中列出的至少一个序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的序列。在一些此外的实施方案中,编码本文提供的重组蛋白酶的重组多核苷酸包含与SEQ ID NO:3-1361和1365-2331中的奇数编号序列中列出的至少一个序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的序列,其中重组蛋白酶包含含有SEQ ID NO:4-1362和1366-2332中提供的偶数编号序列的多肽序列。
本发明还提供了表达载体,所述表达载体包含至少一种本文提供的重组多核苷酸序列。本发明还提供了表达载体,所述表达载体包含编码至少一种本文提供的重组蛋白酶的至少一种重组多核苷酸序列。在一些另外的实施方案中,重组多核苷酸序列可操作地连接至控制序列。在一些实施方案中,控制序列是启动子。在一些此外的实施方案中,启动子是异源启动子。
本发明还提供了包含至少一种本文提供的表达载体的宿主细胞。本发明还提供了包含至少一种表达载体的宿主细胞,所述至少一种表达载体包含至少一种编码至少一种本文提供的重组蛋白酶的重组多核苷酸序列。本发明还提供了包含表达载体的宿主细胞,所述表达载体包含至少一种编码至少一种本文提供的重组蛋白酶的重组多核苷酸序列。本发明还提供了包含表达载体的宿主细胞,所述表达载体包含至少一种编码本文提供的重组蛋白酶的重组多核苷酸序列。在一些实施方案中,宿主细胞是真核的,而在一些可选的实施方案中,宿主细胞是原核的。在一些实施方案中,宿主细胞是大肠杆菌(Escherichia coli)。在一些可选的实施方案中,宿主细胞是酿酒酵母(Saccharomyces cerevisiae)。
本发明还提供了产生至少一种重组蛋白酶的方法,该方法包括在产生由重组多核苷酸编码的重组蛋白酶的条件下培养至少一种本文提供的宿主细胞。在一些实施方案中,方法还包括回收蛋白酶的步骤。在又一些另外的实施方案中,方法还包括纯化蛋白酶的步骤。
本发明还提供了包含至少一种本文提供的重组蛋白酶的组合物。在一些实施方案中,包含至少一种重组蛋白酶的组合物包括药物组合物。在一些另外的实施方案中,药物组合物适用于胰功能不全(pancreatic insufficiency)的治疗。在一些另外的实施方案中,药物组合物还包括药学上可接受的载体和/或赋形剂。在一些实施方案中,药物组合物适用于肠胃外注射或输注至人类。在一些实施方案中,药物组合物适用于口服施用至人类。在一些另外的实施方案中,药物组合物还包含至少一种脂肪酶。本发明还提供了包含至少一种本文提供的重组蛋白酶的组合物,其中该组合物适用于其他用途。在一些实施方案中,本发明提供了在体内或体外水解蛋白的方法,该方法包括提供蛋白和至少一种本发明的工程化蛋白酶,以及在蛋白被水解的条件下将蛋白暴露于至少一种工程化蛋白酶。
本发明还提供了用于治疗和/或预防受试者中胰功能不全的症状的方法,该方法包括提供具有胰功能不全的受试者,并向受试者提供本文提供的药物组合物。在一些实施方案中,在向受试者施用包含至少一种重组蛋白酶的组合物后,受试者的胰功能不全的症状得到改善。在一些另外的实施方案中,药物组合物还包含至少一种脂肪酶。在一些此外的实施方案中,药物组合物还包含至少一种淀粉酶。在又一些另外的实施方案中,药物组合物还包含至少一种脂肪酶和至少一种淀粉酶。在一些此外的实施方案中,受试者能够食用比表现出胰功能不全的症状的受试者所需的饮食在蛋白含量方面的限制更少的饮食。在一些另外的实施方案中,受试者是人类患者。在一些实施方案中,人类患者是婴儿,而在一些其他实施方案中,人类患者是儿童。在又一些此外的实施方案中,人类患者是成年人,而在一些可选的实施方案中,人类患者是年轻人。在一些实施方案中,受试者是非人类哺乳动物。本发明还提供了包含至少一种本文提供的重组蛋白酶的药物。本发明还提供了包含至少一种本文提供的重组蛋白酶的组合物的用途。
本发明还提供了用于蛋白水解的方法,该方法包括提供蛋白和至少一种本文提供的工程化蛋白酶;以及在使得蛋白被工程化蛋白酶水解的条件下将蛋白暴露于至少一种这样的工程化蛋白酶。在一些另外的实施方案中,本发明还提供了用于蛋白水解的方法,该方法包括提供蛋白和包含至少一种本文提供的工程化蛋白酶的组合物;以及在使得蛋白被组合物中的工程化蛋白酶水解的条件下将蛋白暴露于组合物。
附图描述
图1提供了示出实施例6中描述的结果的图。如该图中示出的,与给药前[总EAA(-蛋白酶)]相比,在用SEQ ID NO:756给药14天后[总EAA(+蛋白酶)],必需氨基酸(EAA;甲硫氨酸、亮氨酸、缬氨酸、异亮氨酸、苯丙氨酸、组氨酸、赖氨酸、苏氨酸和色氨酸)的总和在餐后显著增加。在时间0向小型猪(miniature swine)提供HPD。餐前基线值在组间没有差异,并且血清EAA水平在24小时后恢复到基线。使用GraphPad Prism 7(GraphPad)中的多重T检验确定给药前(-蛋白酶)和给药后(+蛋白酶)时间点之间的统计显著性。
图2。与给药前[总EAA(-蛋白酶)]相比,在用SEQ ID NO:2332给药14天后[总EAA(+蛋白酶)],给药后8.5小时的血清必需氨基酸(EAA;甲硫氨酸、亮氨酸、缬氨酸、异亮氨酸、苯丙氨酸、组氨酸、赖氨酸、苏氨酸和色氨酸)的总和(A)和曲线下面积(AUC;B)在餐后显著增加。在时间0向小猪(miniswine)提供HPD。餐前基线值在组间没有差异。使用GraphPadPrism 7(GraphPad Software,San Diego,CA)中的多重T检验确定给药前(-蛋白酶)和给药后(+蛋白酶)时间点之间的统计显著性。
发明描述
本发明提供了工程化蛋白酶多肽及其组合物。工程化蛋白酶多肽已经过优化,以提供改进的活性、改进的热稳定性、蛋白酶稳定性、自溶稳定性和在一定范围的pH条件包括酸性(pH<7)条件下的稳定性。本发明还涉及包含工程化蛋白酶多肽的组合物用于治疗目的的用途。在一些实施方案中,本发明的蛋白酶变体可用于PEI状况的PERT治疗。在一些另外的实施方案中,蛋白酶以不需要肠溶包衣和/或质子泵抑制剂(PPI)的形制施用。本发明还提供了编码工程化蛋白酶多肽的多核苷酸,以及用于制备工程化多核苷酸和蛋白酶多肽的方法。
缩写和定义:
除非另外定义,否则本文使用的所有技术术语和科学术语通常具有与本发明所属领域普通技术人员通常理解的相同的含义。通常,本文使用的命名法和下文描述的细胞培养、分子遗传学、微生物学、有机化学、分析化学和核酸化学中的实验程序是本领域熟知的并且普遍地采用的那些。这样的技术是熟知的,并且在本领域技术人员熟知的许多教科书和参考著作中进行了描述。对于化学合成和化学分析使用了标准技术或其修改形式。本文(上文和下文两者)提及的所有专利、专利申请、文章和出版物,在此通过引用明确并入本文。
尽管本发明的实践中可使用类似或等同于本文描述那些的任何合适的方法和材料,本文描述了一些方法和材料。应理解本发明不限于所描述的特定方法、方案和试剂,因为这些可以根据本领域技术人员使用它们的情况而改变。因此,下文即将定义的术语通过参考本申请作为整体而被更充分地描述。本文(上文和下文两者)提及的所有专利、专利申请、文章和出版物,在此通过引用明确并入本文。
如本文使用的,除非上下文另外清楚地指示,否则单数“一(a)”、“一(an)”和“所述/该(the)”包括复数指示物。
数值范围包括限定该范围的数字。因此,本文公开的每个数值范围意图包括落在这样的较宽数值范围内的每一较窄数值范围,如同这样的较窄数值范围在本文中被全部清楚地写出。还意图本文公开的每个最大的(或最小的)数值限制包含每个较低(或较高)的数值限制,如同这样的较低(或较高)数值限制在本文中被清楚地写出。
术语“约”意指特定值的可接受的误差。在一些情况下,“约”意指在给定值范围的0.05%、0.5%、1.0%或2.0%内。在一些情况下,“约”意指在给定值的1、2、3或4个标准差内。
此外,本文所提供的标题不是可以通过参考本申请作为整体而被具有的本发明的各个方面或实施方案的限制。因此,下文即将定义的术语通过参考本申请作为整体而被更充分地描述。尽管如此,为了便于理解本发明,许多术语定义如下。
除非另外指示,否则,分别地,核酸以5’至3’方向从左到右书写;氨基酸序列以氨基至羧基方向从左至右书写。
如本文使用的,术语“包含(comprising)”及其同源词以其包括性含义被使用(即,等同于术语“包括(including)”及其相应的同源词)。
如本文使用的,“EC”编号是指生物化学和分子生物学国际联合命名委员会(Nomenclature Committee of the International Union of Biochemistry andMolecular Biology)(NC-IUBMB)的酶命名法。该IUBMB生化分类是基于酶催化的化学反应的酶数字分类系统。
如本文使用的,“ATCC”是指美国典型培养物保藏中心(American Type CultureCollection),其生物保藏收集物包括基因和菌株。
如本文使用的,“NCBI”是指美国国家生物技术信息中心(National Center forBiological Information)和其中提供的序列数据库。
如本文使用的,术语“蛋白酶(protease)”(以及“蛋白酶(proteinase)”和“肽酶”)是指许多水解蛋白的酶。有许多蛋白酶参与蛋白质分解成较小的多肽单元或单个氨基酸。蛋白酶对许多生物功能,包括摄入的蛋白质的消化、蛋白质分解代谢和细胞信号传导都很重要。
如本文使用的,术语“蛋白水解”是指将蛋白和/或多肽分解(例如,通过水解)成更小的肽和/或氨基酸。
如本文使用的,术语“自溶”是指细胞和/或酶的自我破坏或自我消化。涉及自溶的示例性情况包括蛋白酶通过其自身对其结构的作用而分解(即,蛋白酶降解或破坏其自身)。
如本文使用的,术语“脂肪酶”是指任何通常称为“脂肪酶”的酶,其通过水解甘油三酯的酯键来催化脂肪的水解。胰脂肪酶在分解脂肪为脂肪酸、甘油和其他醇方面是重要的。脂肪酶是大多数生物体中膳食脂质的消化、运输和加工中必不可少的。
如本文使用的,术语“脂质”是指一类不溶于水的大分子,其包括脂肪酸及其酯、固醇、萜醇、某些难溶维生素和其他相关化合物。“脂肪”是由脂肪酸酯(例如,甘油三酯,其由甘油和三个脂肪酸组成)组成的脂质的子集。不意图本发明受限于任何特定的脂质和/或脂肪。考虑上下文,术语“脂肪”和“脂质”在本文中可互换使用。
如本文使用的,术语“蛋白”、“多肽”和“肽”在本文中可互换使用,以表示无论长度或翻译后修饰(例如,糖基化或磷酸化),通过酰胺键共价连接的至少两个氨基酸的聚合物。
如本文使用的,术语“氨基酸”通过其通常已知的三字母符号或通过IUPAC-IUB生物化学命名委员会推荐的单字母符号在本文中被提及。同样地,核苷酸可以通过其通常可接受的单字母代码被提及。
如本文使用的,当提及细胞、多核苷酸或多肽使用时,“工程化”、“重组”、“非天然存在的”和“变体”是指如下材料或与该材料的天然或自然形式对应的材料:已经以自然界中本来不存在的方式被修饰或与其相同但从合成材料产生或衍生和/或通过使用重组技术操作产生或衍生。
重组多肽可以使用本领域已知的任何合适的方法产生。编码感兴趣的野生型多肽的基因可以在载体例如质粒中克隆,并在期望的宿主中表达,例如大肠杆菌(E.coli)、酿酒酵母(S.cerevisiae)等。重组多肽的变体可以通过本领域已知的各种方法产生。实际上,存在本领域技术人员熟知的各种各样不同的诱变技术。另外,诱变试剂盒还可从许多商业分子生物学供应商获得。产生确定的氨基酸(定点)处的特定取代、基因的局部区域中的特异性(区域特异性)或随机突变,或整个基因内的随机诱变(例如,饱和诱变)的方法是可得的。本领域的技术人员已知产生酶变体的许多合适的方法,包括但不限于,使用PCR对单链DNA或双链DNA定点诱变、盒式诱变、基因合成、易错PCR、改组和化学饱和诱变,或本领域已知的任何其他合适的方法。用于DNA和蛋白工程化的方法的非限制性实例在以下专利中提供:美国专利第6,117,679号;美国专利第6,420,175号;美国专利第6,376,246号;美国专利第6,586,182号;美国专利第7,747,391号;美国专利第7,747,393号;美国专利第7,783,428号和美国专利第8,383,346号。在变体产生之后,可以对它们筛选任何期望的特性(例如,高的或增加的活性、或低的或降低的活性、增加的热活性、增加的热稳定性和/或酸性pH稳定性等)。在一些实施方案中,可使用“重组蛋白酶多肽”(在本文中也称为“工程化蛋白酶多肽”、“变体蛋白酶”和“蛋白酶变体”)。
如本文使用的,术语“野生型”和“天然存在的”是指在自然界中发现的形式。例如,野生型多肽或多核苷酸序列为生物体中存在的序列,其可从天然来源分离且未通过人为操纵被有意地修饰。
如本文使用的,术语“编码序列”是指核酸(例如基因)编码蛋白质的氨基酸序列的部分。
如本文使用的,“序列同一性百分比(%)”在本文中用于指多核苷酸和多肽之间的比较,并通过比较比较窗中两条最佳对齐的序列确定,其中多核苷酸或多肽序列在比较窗中的部分与参考序列相比可以包括添加或缺失(即,空位),以用于两个序列的最佳对齐。百分比可以通过如下计算:确定两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目,并将结果乘以100以得到序列同一性百分比。可选地,百分比可以通过如下计算:确定两个序列中出现相同的核酸碱基或氨基酸残基或者核酸碱基或氨基酸残基与空位对齐的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目,并将结果乘以100以得到序列同一性的百分比。本领域技术人员理解,存在许多可用于比对两个序列的已建立的算法。用于比较的序列的最佳比对可以例如通过以下进行:通过Smith和Waterman的局部同源性算法(Smith和Waterman,Adv.Appl.Math.,2:482[1981]),通过Needleman和Wunsch的同源性比对算法(Needleman和Wunsch,J.Mol.Biol.,48:443[1970]),通过Pearson和Lipman的相似性搜索方法(Pearson和Lipman,Proc.Natl.Acad.Sci.USA 85:2444[1988]),通过这些算法的计算机化实现(例如,GCG Wisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA),或者通过目视检查,如本领域已知的。适用于确定序列同一性和序列相似性百分比的算法的实例包括但不限于BLAST和BLAST 2.0算法,由Altschul等人描述(分别参见Altschul等人,J.Mol.Biol.,215:403-410[1990];和Altschul等人,Nucleic Acids Res.,3389-3402[1977])。公众可通过美国国家生物技术信息中心网站获得用于进行BLAST分析的软件。该算法包括首先通过鉴定查询序列中长度W的短字来鉴定高评分序列对(HSP),所述短字在与数据库序列中相同长度的字比对时匹配或满足某一正值的阀值评分T。T被称为邻近字评分阈值(参见,Altschul等人,上文)。这些最初的邻近字击中(word hit)充当启动搜索的种子以找到包含它们的更长HSP。然后字击中沿着每个序列的两个方向延伸直到累积比对评分不能增加的程度。对于核苷酸序列,累积评分使用参数M(用于匹配残基对的奖励评分;总是>0)和N(用于错配残基的惩罚评分;总是<0)计算。对于氨基酸序列,评分矩阵用于计算累积评分。在以下情况时,停止字击中在每一个方向的延伸:累积比对评分从其最大达到值下降了量X;由于累积了一个或更多个负评分残基比对,累积得分达到0或小于0;或到达任一序列末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用以下作为默认值:字长(W)为11、期望值(E)为10、M=5、N=-4、以及两条链的比较。对于氨基酸序列,BLASTP程序使用以下作为默认值:字长(W)为3,期望(E)为10和BLOSUM62评分矩阵(参见,Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA 89:10915[1989])。序列比对与%序列同一性的示例性确定可以使用GCG Wisconsin软件包(Accelrys,Madison WI)中的BESTFIT或GAP程序,使用提供的默认参数。
如本文使用的,术语“参考序列”是指用作序列比较的基础的确定序列。参考序列可以是更大序列的子集,例如,全长基因或多肽序列的区段(segment)。通常,参考序列为至少20个核苷酸或氨基酸残基的长度、至少25个残基的长度、至少50个残基的长度、至少100个残基的长度或核酸或多肽的全长。因为两个多核苷酸或多肽可以各自(1)包含两个序列之间相似的序列(即,完整序列的一部分),和(2)还可以包含两个序列之间不同的(divergent)序列,所以两个(或更多个)多核苷酸或多肽之间的序列比较通常通过比较两个多核苷酸或多肽在“比较窗”中的序列以鉴定和比较局部区域的序列相似性来进行。在一些实施方案中,“参考序列”可以基于一级氨基酸序列(primary amino acid sequence),其中参考序列是可以在一级序列中具有一个或更多个变化的序列。“比较窗”是指至少约20个连续核苷酸位置或氨基酸残基的概念性区段,其中序列可以与至少20个连续核苷酸或氨基酸的参考序列进行比较,并且其中在比较窗口中序列的一部分与用于两个序列的最佳比对的参考序列(其不包含添加或缺失)相比,可包括20%或更少的添加或缺失(即,空位)。比较窗可以比20个连续残基更长,并任选地包括30、40、50、100或更长的窗。
在用于指定的氨基酸或多核苷酸序列的编号的情况下,“对应于”、“参考”或“相对于”指当指定的氨基酸或多核苷酸序列与参考序列相比较时指定的参考序列残基的编号。换言之,给定聚合物的残基编号或残基位置关于参考序列被指定,而不是通过给定氨基酸或多核苷酸序列内残基的实际数字位置被指定。例如,给定氨基酸序列,诸如工程化蛋白酶的氨基酸序列可以通过引入空位以与参考序列对齐,来优化两个序列之间的残基匹配。在这些情况中,尽管存在空位,但对给定氨基酸或多核苷酸序列中残基的编号是关于与其比对的参考序列进行的。
如本文使用的,术语“突变”是指多肽或多核苷酸序列中的任何变化。意图包括序列中存在的任何数量(即,一个或更多个)的取代、插入、缺失和/或重排(即,与起始或参考序列相比)。因此,序列中的突变导致变体多肽(例如,变体或重组蛋白酶)的产生,如本文所提供的。
如本文使用的,“氨基酸差异”或“残基差异”是指多肽序列的一个位置处的氨基酸残基相对于参考序列中对应位置处的氨基酸残基的差异。本文中氨基酸差异的位置通常被称为“Xn”,其中n是指残基差异所基于的参考序列中的对应位置。例如,“与SEQ ID NO:2相比位置X92处的残基差异”是指对应于SEQ ID NO:2的位置92的多肽位置处的氨基酸残基的差异。因此,如果参考多肽SEQ ID NO:2在位置92处具有苏氨酸,那么“与SEQ ID NO:2相比在位置X92处的残基差异”意指在对应于SEQ ID NO:2的位置92的多肽位置处的除了苏氨酸之外的氨基酸残基(例如,T92A)。在本文的大多数情况下,在一个位置处的特定氨基酸残基差异指示为“XnY”,其中“Xn”指定如上文描述的对应位置,并且“Y”是在工程化多肽中发现的氨基酸(即,与参考多肽中的不同的残基)的单字母标识符。在一些情况下(例如,在表3.1、表3.2、表3.3、表3.4、表3.5、表3.6、表3.7、表3.8、表3.9、表3.10、表3.11、表3.12、表3.13、表3.14、表3.15、表3.16、表3.17、表3.18、表3.19、表3.20、表3.21、表3.22、表3.23、表3.24、表3.25、表3.26和/或表3.27中),本公开内容还提供由常规符号“AnB”表示的特定氨基酸差异,其中A是参考序列中的残基的单字母标识符,“n”是在参考序列中的残基位置的编号,并且B是工程化多肽的序列中残基取代的单字母标识符。在一些情况下,本公开内容的多肽可以包含相对于参考序列的一个或更多个氨基酸残基差异,所述氨基酸残基差异由相对于参考序列存在残基差异的指定位置的列表指示。在一些实施方案中,在多于一个氨基酸可以用于多肽的具体残基位置中时,可以使用的各种氨基酸残基由“/”分开(例如,X446A/X446G/X446M或X446A/G/M或P446A/G/M)。在一些实施方案中,酶变体包含多于一个取代。为了便于阅读,这些取代由斜线分开(例如,V408A/M439S)。本申请包括包含一个或更多个氨基酸差异的工程化多肽序列,所述一个或更多个氨基酸差异包括保守氨基酸取代和非保守氨基酸取代的任一种/或两者。
如本文使用的,“保守氨基酸取代”是指用具有相似侧链的不同残基取代残基,并且因此通常包括用相同或相似的氨基酸定义类别中的氨基酸取代多肽中的氨基酸。例如但不限于,具有脂肪族侧链的氨基酸可以被另一种脂肪族氨基酸(例如,丙氨酸、缬氨酸、亮氨酸和异亮氨酸)取代;具有羟基侧链的氨基酸被另一种具有羟基侧链的氨基酸(例如,丝氨酸和苏氨酸)取代;具有芳香族侧链的氨基酸被另一种具有芳香族侧链的氨基酸(例如,苯丙氨酸、酪氨酸、色氨酸和组氨酸)取代;具有碱性侧链的氨基酸被另一种具有碱性侧链的氨基酸(例如,赖氨酸和精氨酸)取代;具有酸性侧链的氨基酸被另一种具有酸性侧链的氨基酸(例如,天冬氨酸或谷氨酸)取代;和/或疏水性氨基酸或亲水性氨基酸分别被另一种疏水性氨基酸或亲水性氨基酸取代。
如本文使用的,“非保守取代”是指用具有显著不同的侧链特性的氨基酸取代多肽中的氨基酸。非保守取代可以使用定义的组之间而不是之内的氨基酸,并且影响:(a)取代区域中的肽主链的结构(例如,脯氨酸取代甘氨酸),(b)电荷或疏水性,或(c)侧链体积。例如但不限于,示例性非保守取代可以是用碱性或脂肪族氨基酸取代酸性氨基酸;用小氨基酸取代芳香族氨基酸;和用疏水性氨基酸取代亲水性氨基酸。
如本文使用的,术语“缺失”是指通过从参考多肽去除一个或更多个氨基酸对多肽进行的修饰。缺失可以包括去除1个或更多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸或者20个或更多个氨基酸、多达组成参考酶的氨基酸总数的10%或多达氨基酸总数的20%,同时保留酶活性和/或保留工程化酶的改进的特性。缺失可以涉及多肽的内部部分和/或末端部分。在各种实施方案中,缺失可以包括连续的区段或可以是不连续的。
如本文使用的,在多核苷酸序列上下文中使用的星号(*)指示多核苷酸序列中终止密码子的存在。在一些实施方案中,由于终止密码子的存在,与起始或参考序列相比,变体蛋白酶是截短的。
如本文使用的,术语“插入”是指通过向参考多肽添加一个或更多个氨基酸对多肽进行的修饰。插入可以处于多肽的内部部分或者到羧基或氨基末端。如本文使用的插入包括如本领域已知的融合蛋白。插入可以是氨基酸的连续区段或由天然存在的多肽中的一个或更多个氨基酸分开。
在本文中可互换使用的“功能片段”和“生物活性片段”是指这样的多肽:所述多肽具有氨基末端缺失和/或羧基末端缺失和/或内部缺失(例如,序列是截短的),但其中剩余的氨基酸序列与和它进行比较的序列(例如,本发明的全长工程化蛋白酶)中的对应位置相同,并且保留全长多肽的基本上全部活性。
如本文使用的,“分离的多肽”是指与天然伴随其的其他污染物(例如蛋白质、脂质和多核苷酸)基本上分开的多肽。该术语包括已经从其天然存在的环境或表达系统(例如,宿主细胞或体外合成)中取出或纯化的多肽。重组蛋白酶多肽可以存在于细胞内、存在于细胞培养基中,或以各种形式(诸如裂解物或分离的制品)制备。因此,在一些实施方案中,重组蛋白酶多肽可以是分离的多肽。
术语“分离的”和“纯化的”用于指分子(例如,分离的核酸、多肽等)或其他组分从与其天然缔合的至少一种其他组分中取出。术语“纯化的”不要求绝对纯度,而是意图作为相对定义。
如本文使用的,“基本上纯的多肽”是指如下组合物,在所述组合物中多肽物质是存在的主要物质(即,在摩尔或重量基础上,它比该组合物中的任何其他单独的大分子物质更丰富),并且当目标物质构成存在的大分子物质的按摩尔或%重量计至少约50%时,通常是基本上纯化的组合物。通常,基本上纯的蛋白酶组合物构成该组合物中存在的所有大分子物质的按摩尔或%重量计约60%或更多、约70%或更多、约80%或更多、约90%或更多、约95%或更多以及约98%或更多。在一些实施方案中,将目标物质从起始制品纯化至基本同质(即,通过常规检测方法不能在组合物中检测出污染物物质),其中该组合物基本上由单一大分子物质组成。溶剂物质、小分子(<500道尔顿)和元素离子物质不被认为是大分子物质。在一些实施方案中,分离的重组蛋白酶多肽是基本上纯的多肽组合物。在一些实施方案中,基本上纯的重组蛋白酶多肽制品被添加到适用于本发明的制剂中(例如,多糖、表面活性剂等)。
如本文使用的,“改进的酶特性”和“改进的特性”是指与参考蛋白酶多肽和/或野生型蛋白酶多肽或另一种工程化蛋白酶多肽相比,工程化蛋白酶多肽的特性包括任何酶特性的改进。改进的特性包括但不限于诸如以下的特性:增加的蛋白表达、增加的热活性(thermoactivity)、增加的热稳定性、增加的pH活性、增加的稳定性、增加的酶活性、增加的底物特异性或亲和力、增加的比活性、增加的对底物或终产物抑制的抗性、增加的化学稳定性、改进的化学选择性、改进的溶剂稳定性、增加的对酸性或碱性pH的耐受性、增加的对蛋白水解活性的耐受性(即,降低的对蛋白水解的敏感性)、降低的聚集、增加的溶解度、降低的免疫原性、改进的翻译后修饰(例如,糖基化)和改变的温度谱(temperature profile)。
如本文使用的,“增加的酶活性”或“增强的催化活性”是指工程化蛋白酶多肽的改进的特性,其可以被表示为与参考蛋白酶相比,比活性(例如,产生的产物/时间/重量蛋白)的增加或底物向产物的转化百分比(例如,使用指定量的蛋白酶,在指定的时间段内,起始量的底物向产物的转化百分比)的增加。在实施例中提供了确定酶活性的示例性方法。与酶活性相关的任何特性都可以被影响,包括经典的酶特性Km、Vmax或kcat,其变化可以导致酶活性的增加。酶活性的改进可以是从对应野生型酶的酶活性的约1.1倍至多达天然存在的蛋白酶或从其衍生蛋白酶多肽的另一种工程化蛋白酶的2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍、150倍、200倍或更多的酶活性。
蛋白酶活性可以通过本领域已知的任何合适的方法来测量(例如,标准测定,诸如监测反应物或产物的分光光度特性的变化)。在一些实施方案中,产生的产物的量可以使用基于荧光的测定诸如ENZCHEKTM蛋白酶测定试剂盒(ThermoFisher)来测量,而在一些其他实施方案中,产物可以使用本领域已知的可选的方法来测量。酶活性的比较使用定义的酶制品、在设定条件下的定义的测定和一种或更多种定义的底物进行,如本文进一步详细描述的。
如本文使用的,术语“蛋白酶稳定的”和“对蛋白水解的稳定性”是指蛋白质(例如,本发明的重组蛋白酶)发挥功能并耐受由任何蛋白水解酶或其他蛋白水解化合物或因子介导的蛋白水解,并在用蛋白酶处理后保留其功能的能力。不意图该术语受限于使用任何特定的蛋白酶来评估蛋白质的稳定性。实际上,本发明的工程化蛋白酶是稳定的,并且在存在各种蛋白酶的情况下保留酶活性。在一些实施方案中,工程化蛋白酶在存在胰蛋白酶、胰凝乳蛋白酶和/或胃蛋白酶的情况下是稳定的。然而,不意图本发明受限于任何特定的蛋白酶或任何特定的评估蛋白水解稳定性的方法。
如本文使用的,术语“pH稳定性”是指蛋白质(例如,本发明的重组蛋白酶)在特定pH孵育后发挥作用的能力。在一些实施方案中,本发明提供了在一定范围的pH(包括但不限于pH 2至pH 7的范围)稳定的重组蛋白酶。在一些实施方案中,重组蛋白酶在不同的pH范围是稳定的,如本文提供的实施例中所示。不意图本发明受限于任何pH稳定性水平或pH范围。
如本文使用的,术语“改进的对酸性pH的耐受性”意指与参考蛋白酶或另一种酶相比,根据本发明的重组蛋白酶将具有增加的稳定性(在暴露于酸性pH指定的时间段[例如,1小时,最多24小时,等]后,在约pH 7、6、5、4、3、2或甚至更低pH保留更高的活性)。
如本文使用的,术语“生理pH”是指通常在受试者(例如,人类)的血液内发现的pH范围(例如,pH 7.2-7.4)。
如本文使用的,术语“碱性pH”(例如,提及改进的对碱性pH条件的稳定性或增加的对碱性pH的耐受性使用的)意指约7至11的pH范围,或者在一些实施方案中,大于pH 11。
如本文使用的,术语“酸性pH”(例如,提及改进的对酸性pH条件的稳定性或增加的对酸性pH的耐受性使用的)意指包括任何pH值小于7的pH范围。在一些实施方案中,酸性pH小于7,而在一些其他实施方案中,pH小于约6、5、4、3、2或更低。在一些可选的实施方案中,本发明的重组蛋白酶在2至4的pH水平是稳定的。然而,不意图本发明受限于任何特定的pH值或值范围。
如本文使用的,措辞“胃挑战(gastric challenge)”是指将本发明的重组蛋白酶暴露于低pH环境和至少一种酶(例如胃蛋白酶)的存在,使得重组蛋白酶暴露于胃(例如,人类的胃)中可能遇到的条件。
如本文使用的,措辞“肠挑战”是指将本发明的重组蛋白酶暴露于中性pH环境和至少一种蛋白酶(例如,肠蛋白酶,诸如胰蛋白酶和/或胰凝乳蛋白酶)和/或至少一种胆盐(例如,牛磺胆酸钠)的存在,使得重组蛋白酶暴露于肠道(例如,人类的肠)中可能遇到的条件。
如本文使用的,措辞“多个顺序挑战”是指将本发明的重组蛋白酶暴露于一系列挑战条件。例如,在一些实施方案中,一小时的热挑战之后是一小时的胃挑战,并且然后是一小时的肠挑战。不意图本发明受限于任何特定的挑战和/或挑战条件或者特定的挑战顺序。
如本文使用的,术语“热稳定性(thermal stability)”和“热稳定性(thermostability)”是指蛋白质(例如,本发明的重组蛋白酶)在特定温度发挥作用的能力。在一些实施方案中,该术语指蛋白质在特定温度孵育后发挥作用的能力。在一些实施方案中,本发明的重组蛋白酶是“耐热的”(即,酶在升高的温度保持其催化活性)。在一些实施方案中,重组蛋白酶在升高的温度耐受失活,并且在一些实施方案中,在升高的温度持续延长的暴露时间保持催化活性。这些术语在本文中可互换使用。不意图本发明受限于任何特定温度和/或暴露时间。这样的稳定性可以通过本领域中已知的任何方法(例如,本文描述的方法)来测量。不意图本发明受限于任何特定的温度稳定性水平或温度范围。在一些实施方案中,在特定温度孵育蛋白质(例如,本发明的重组蛋白酶)后测量热稳定性。
如本文使用的,术语“热稳定性(thermal stability)”是指蛋白质(例如,本发明的重组蛋白酶)在特定温度发挥作用的能力。热稳定性可以通过本领域中已知的任何方法(例如,本文描述的方法)来测量。不意图本发明受限于任何特定的温度稳定性水平或温度范围。在一些实施方案中,在特定温度孵育蛋白质(例如,本发明的重组蛋白酶)后测量热稳定性。因此,在一些实施方案中,该术语是指蛋白(例如,本发明的重组蛋白酶)在特定温度孵育后在特定温度发挥作用的能力。
如本文使用的,术语“化学稳定性”是指蛋白质(例如,本发明的重组蛋白酶)在存在对另一蛋白质的功能产生不利影响的化学物质的情况下发挥作用的能力。不意图本发明受限于任何特定的化学稳定性水平或化学稳定性范围。
如本文使用的,术语“转化”是指底物向对应产物的酶促转化(或生物转化)。“转化百分比”是指在指定条件下在一定时间段内被转化为产物的底物的百分比。因此,蛋白酶多肽的“酶活性”或“活性”可以表示为在特定时间段内底物向产物的“转化百分比”。
如本文使用的,“杂交严格性”是指核酸杂交中的杂交条件,诸如洗涤条件。通常,杂交反应在较低严格性的条件下进行,随后是不同的但较高严格性的洗涤。术语“中度严格杂交”是指允许靶DNA结合以下互补的核酸的条件,所述互补的核酸与靶DNA具有约60%同一性,优选地约75%同一性,约85%同一性,与靶多核苷酸具有大于约90%同一性。示例性中度严格条件是等同于在50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS中在42℃杂交,随后在0.2×SSPE、0.2% SDS中在42℃洗涤的条件。
“高严格性杂交”通常是指与如对限定的多核苷酸序列在溶液条件下确定的热解链温度Tm相差约10℃或更小的条件。在一些实施方案中,高严格性条件是指仅允许在0.018M NaCl中在65℃形成稳定杂交体的那些核酸序列的杂交(即,如果杂交体在0.018MNaCl中在65℃是不稳定的,它在如本文设想的高严格性条件下是不稳定的)的条件。可以提供高严格性条件,例如,通过在等同于在50%甲酰胺、5×Denhart溶液、5×SSPE、0.2% SDS在42℃的条件杂交,然后在0.1×SSPE和0.1% SDS中在65℃洗涤提供。另一种高严格性条件是在等同于在含有0.1%(w:v)SDS的5X SSC中在65℃杂交的条件进行杂交和在含有0.1% SDS的0.1×SSC中在65℃洗涤。其他高严格性杂交条件以及中度严格条件在上文引用的参考文献中描述。
如本文使用的,术语“载体”是指用于将DNA序列引入细胞中的DNA构建体。在一些实施方案中,载体是可操作地连接至能够实现DNA序列中编码的多肽在合适宿主中的表达的合适的控制序列的表达载体。在一些实施方案中,质粒可用作载体。在一些实施方案中,“表达载体”具有可操作地连接至DNA序列(例如,转基因)以驱动在宿主细胞中表达的启动子序列,并且在一些实施方案中,还包含转录终止子序列。
如本文使用的,“密码子优化的”是指编码蛋白的多核苷酸的密码子改变为在特定生物体中优先使用的那些密码子,使得编码的蛋白在感兴趣的生物体中更有效地表达。尽管遗传密码是简并的,即大多数氨基酸由被称为“同义”(“synonyms”)或“同义”(“synonymous”)密码子的若干密码子表示,但熟知的是,特定生物体的密码子使用是非随机的和对于特定的密码子三联体是有偏倚的。就给定基因、具有共同功能或祖先起源的基因、高表达的蛋白对比低拷贝数蛋白和生物体的基因组的聚集蛋白编码区而言,这种密码子使用偏倚可能更高。在一些实施方案中,编码蛋白酶的多核苷酸可以被密码子优化以用于从所选择的用于表达的宿主生物体的最佳产生。
如本文使用的,“控制序列”包括对本申请的多核苷酸和/或多肽的表达是必需或有利的所有组分。每一个控制序列对于编码多肽的核酸序列可以是天然的或外来的。这样的控制序列包括但不限于,前导序列、多腺苷酸化序列、前肽序列、启动子序列、信号肽序列、起始序列和转录终止子。在最小程度上,控制序列包括启动子和转录及翻译终止信号。出于引入特定限制性位点的目的,控制序列可以与接头一起提供,所述特定限制性位点促进控制序列与编码多肽的核酸序列的编码区的连接。
如本文使用的,“可操作地连接的”在本文中被定义为如下配置:在所述配置中控制序列被适当地放置(即,以功能关系)在相对于感兴趣的多核苷酸的位置处,使得控制序列指导或调节感兴趣的多核苷酸和/或多肽的表达。
如本文使用的,“启动子序列”是指被宿主细胞识别用于表达感兴趣的多核苷酸诸如编码序列的核酸序列。启动子序列包含介导感兴趣的多核苷酸的表达的转录控制序列。启动子可以是在选择的宿主细胞中显示出转录活性的任何核酸序列,包括突变体、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
如本文使用的,措辞“合适的反应条件”是指在酶促转化反应溶液中的那些条件(例如,酶载量、底物载量、温度、pH、缓冲液、助溶剂等的范围),在该条件下本申请的蛋白酶多肽能够将底物转化为期望的产物化合物。示例性的“合适的反应条件”被提供于本申请中并且通过实施例来说明。
如本文使用的,诸如在“化合物载量”或“酶载量”中,术语“载量”是指在反应起始时组分在反应混合物中的浓度或量。
如本文使用的,在酶促转化反应过程的上下文中,术语“底物”是指蛋白酶多肽所作用于的化合物或分子。
如本文使用的,在酶促转化过程的上下文中,术语“产物”是指从蛋白酶多肽对底物发挥的作用而产生的化合物或分子。
如本文使用的,术语“表达”包括参与多肽产生的任何步骤,包括但不限于,转录、转录后修饰、翻译和翻译后修饰。在一些实施方案中,该术语还包括多肽从细胞的分泌。
如本文使用,术语“产生”指由细胞产生蛋白和/或其他化合物。意图该术语包括参与多肽产生的任何步骤,包括但不限于转录、转录后修饰、翻译和翻译后修饰。在一些实施方案中,该术语还包括多肽从细胞的分泌。
如本文使用的,如果氨基酸或核苷酸序列(例如,启动子序列、信号肽、终止子序列等)与它可操作地连接至的另一个序列在自然界中未缔合,则这两个序列是“异源的”。
如本文使用的,术语“宿主细胞”和“宿主菌株”是指用于包含本文提供的DNA(例如,编码蛋白酶变体的多核苷酸)的表达载体的合适的宿主。在一些实施方案中,宿主细胞是已经用使用如本领域已知的重组DNA技术构建的载体转化或转染的原核细胞或真核细胞。
如本文使用的,术语“类似物”意指与参考多肽具有多于70%序列同一性,但少于100%序列同一性(例如,多于75%、78%、80%、83%、85%、88%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性)的多肽。在一些实施方案中,“类似物”包括含有一个或更多个非天然存在的氨基酸残基(包括但不限于高精氨酸、鸟氨酸和正缬氨酸)以及天然存在的氨基酸的多肽。在一些实施方案中,类似物还包括一个或更多个D-氨基酸残基和两个或更多个氨基酸残基之间的非肽键。
如本文使用的,术语“培养”是指细胞群体在任何合适的条件(例如,使用液体、凝胶或固体培养基)下的生长。在一些实施方案中,细胞是微生物细胞(例如,细菌),而在一些其他实施方案中,细胞是哺乳动物细胞、昆虫细胞或从另一种动物获得的细胞。不意图本发明受限于任何特定的细胞或细胞类型的培养或者任何特定的培养方法。实际上,意图本发明包括在任何合适的条件下培养的任何合适的细胞类型。
如本文使用的,术语“治疗剂”是指当向显示出病理学迹象或症状的受试者施用时提供有益或期望的效果(包括医学效果)的化合物。
如本文使用的,术语“药物组合物”是指包含药学有效量的由本发明所包括的工程化蛋白酶多肽和可接受的载体的适用于受试者(例如,人类)的药物用途的组合物。
如本文使用的,术语“有效量”意指足以产生期望的结果的量。本领域普通技术人员可以通过使用常规实验确定有效量是多少。
如本文使用的,术语“受试者”包括动物,包括但不限于哺乳动物诸如人类、非人类灵长目动物、家畜、宠物和实验动物(例如,啮齿动物和兔形目动物)。意图该术语包括雌性以及雄性。
如本文使用的,术语“患者”意指正在被评估、治疗或正在经历疾病的任何受试者。
如本文使用的,术语“婴儿”是指在出生之后第一个月至约一(1)岁的时期内的儿童。如本文使用的,术语“新生儿”是指在从出生至生命的第28天的时期内的儿童。术语“早产婴儿”是指妊娠第二十个完整周之后但在妊娠期满之前出生的婴儿,通常在出生时体重~500至~2499克。“极低出生体重婴儿”是在出生时体重少于1500g的婴儿。
如本文使用的,术语“儿童”是指对于同意治疗或研究程序未达到法定年龄的人。在一些实施方案中,该术语是指在出生和青春期的时期之间的人。
如本文使用的,术语“成人”是指对于相关司法权已经达到法定年龄的人(例如,在美国为18岁)。在一些实施方案中,该术语是指任何完全发育成熟的生物体。在一些实施方案中,术语“年轻人”是指小于18岁但已经达到性成熟的人。
如本文使用的,“组合物”和“制剂”包括意图用于任何合适的用途(例如,药物组合物、膳食和/或营养补充剂、饲料等)的包含至少一种本发明的工程化蛋白酶的产物。
如本文使用的,术语“施用(administration)”和“施用(administering)”组合物意指向受试者(例如,遭受胰功能不全的效应的人)提供本发明的组合物。
如本文使用的,当提及药物组合物使用时,术语“载体”意指标准药物载体、缓冲剂和赋形剂诸如稳定剂、防腐剂和佐剂中的任一种。
如本文使用的,术语“药学上可接受的”意指可以向受试者施用而不引起任何不良生物效应或以有害的方式与在其中它被包含的组分的任何一种相互作用并且拥有期望的生物活性的材料。
如本文使用的,术语“赋形剂”是指任何药学上可接受的添加剂、载体、稀释剂、佐剂或其他成分,而不是活性药物成分(API;例如,本发明的工程化蛋白酶多肽)。赋形剂通常被包括以用于配制和/或施用目的。
如本文使用的,当提及疾病/状况的症状使用时,术语“治疗有效量”是指改善、减弱或消除疾病/状况的一种或更多种症状或者预防或延缓症状的发作的化合物(例如,工程化蛋白酶多肽)的量和/或浓度。
如本文使用的,当提及疾病/状况使用时,术语“治疗有效量”是指改善、减弱或消除该疾病/状况的组合物(例如,工程化蛋白酶多肽)的量和/或浓度。在一些实施方案中,该术语被用于指组合物的量,所述组合物的量引发研究者、医师、兽医师或其他临床医师寻求的组织、系统或动物受试者的生物学(例如,医学)响应。
如本文使用的,术语“治疗(treating)”、“治疗(treat)”和“治疗(treatment)”是指给予受试者(例如,人类患者)的医疗护理,包括药物组合物(诸如本文提供的那些)的施用。意图术语“治疗(treating)”、“治疗(treat)”和“治疗(treatment)”包括预防性治疗(例如,预防剂)以及姑息治疗或护理。在一些实施方案中,提供治疗以预防或改善疾病的症状。在一些实施方案中,本发明的药物组合物可用于治疗或预防胰腺酶不足疾病或症状。
工程化蛋白酶多肽
本发明提供了适用于各种用途(包括治疗胰腺酶不足)的工程化蛋白酶。在一些实施方案中,与野生型蛋白酶(例如,SEQ ID NO:2的多肽)相比,工程化蛋白酶表现出至少一种改进的特性。在一些实施方案中,工程化蛋白酶具有与SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250 1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的至少约70%、至少约75%、至少约80%、至少约85%、至少约88%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约100%氨基酸序列同一性,和与SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278相比在一个或更多个氨基酸位置处(诸如与SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278相比的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个或更多个氨基酸位置处)的氨基酸残基差异,或者与SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278具有至少70%、75%、80%、85%、至少88%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或更多氨基酸序列同一性的序列。在一些实施方案中,与SEQ ID NO:2、34、190、292、342、382、400、454、562、638、680、756、812、1030、1136、1180、1250和/或1308相比在一个或更多个位置的残基差异包括至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个或更多个保守氨基酸取代。在一些实施方案中,工程化蛋白酶多肽包括表3.1、表3.2、表3.3、表3.4、表3.5、表3.6、表3.7、表3.8、表3.9、表3.10、表3.11、表3.12、表3.13、表3.14、表3.15、表3.16、表3.17、表3.18、表3.19、表3.20、表3.21、表3.22、表3.23、表3.24、表3.25、表3.26和/或表3.27中列出的多肽。在一些实施方案中,工程化蛋白酶多肽包括表3.8、表3.9、表3.10、表3.11、表3.12、表3.13、表3.14、表3.15、表3.16、表3.17、表3.18、表3.19、表3.20、表3.21、表3.22、表3.23、表3.24、表3.25、表3.26和/或表3.27中列出的多肽,其中工程化蛋白酶在羧基末端不存在(即缺少)组氨酸标签和前面的氨基酸接头。在一些实施方案中,工程化蛋白酶多肽包含SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278。在一些实施方案中,工程化蛋白酶多肽包含SEQ ID NO:34、190、292、342、382、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278。
本发明提供了重组蛋白酶和/或生物活性重组蛋白酶片段,其包含含有与SEQ IDNO:2的至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的氨基酸序列。在一些实施方案中,重组蛋白酶和/或生物活性重组蛋白酶片段包含与SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278具有至少约70%、约75%、约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更多序列同一性的多肽序列。
本发明提供了重组蛋白酶和/或生物活性重组蛋白酶片段,其包含含有与SEQ IDNO:2的至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列。在一些实施方案中,重组蛋白酶包含与SEQ ID NO:2具有至少70%、至少75%、至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含相对于SEQ IDNO:2中的序列的一个或更多个取代。
在一些实施方案中,重组蛋白酶包含与SEQ ID NO:2具有至少70%、至少75%、至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的位置处包含一个或更多个取代:9、17、29、30、32、34、35、36、37、43、47、50、63、75、77、81、85、92、93、107、127、132、133、135、143、145、147、162、168、187、188、189、200、205、207、208、209、210、212、220、221、222、223、225、228、236、237、238、239、241、244、245、247、257、258、260、261、262、263、265、266、283、294、300、301、307、308、318、319、334、336、339、342、344、345、346、347、355、359、361、362、363、366、368、370、373、398、404、405、406、408、412、424、427、429、431、439、441、442、446、448、449、450、454、468、470、480、481、482、485、489、490、495、497、501、504、505、506、508、511、512、514、516、523、526、527、529、533、535、536、537、538、539、540、541、542、543、544、545、546、547、548、549、552、553、554、555、556、558、559、560、565、566、567、568、570、571、573、575、577、580、581、582、583、586、589、591、592、594、596、599、601、604、609、610、615、616、620、631、632、634、639、643、644、645、646、647、648A、649、650、652、653、654、659、661、662、663、664、665、666,其中多肽序列的氨基酸位置参考SEQID NO:2来编号。
在一些实施方案中,一个或更多个取代在选自以下的位置处:35、75、143、205、212、236、258、261、263、266、300、301、308、339、342、346、347、370、408、431、439、441、442、446、449、450、454、468、468、470、482、489、490、505、511、514、536、537、539、545、546、568、570、581、582、615、620、620、639、639、646和664。在一些实施方案中,一个或更多个取代在选自以下的位置处:35、75、143、205、212、236、258、261、263、266、300、301、308、339、347、370、408、431、439、441、442、446、449、450、454、468、470、482、489、490、505、511、514、536、537、539、545、546、568、570、582、615、620、639、646和664。在一些实施方案中,一个或更多个取代在选自以下的位置处:35、143、205、236、258、261、263、266、300、301、308、339、347、370、408、439、441、442、446、449、450、454、468、470、489、490、505、511、514、536、537、539、545、546、570、582、620、639、646和664。在一些实施方案中,一个或更多个取代在选自以下的位置处:35、205、236、258、261、300、301、308、339、347、370、408、439、442、446、449L、450、468、470、489、490、505、511、514、536、537、539、545、582、620、639、646和664。在一些实施方案中,一个或更多个取代在选自以下的位置处:205、236、258、261、300、301、308、339、342、346、347、370、408、439、442、446、449、450、468、490、505、514、536、537、545、620、639和646。在一些实施方案中,一个或更多个取代在选自以下的位置处:205、258、261、339、342、439、442、446、449、450、505、536、545、620和646。在一些实施方案中,一个或更多个取代在选自以下的位置处:205、258、261、339、342、442、446、505、536、545、620和646。在一些实施方案中,一个或更多个取代在选自以下的位置处:258、261、339、342和446。
在一些实施方案中,一个或更多个取代选自9K或Q;17A;29F、G或S;30G;32A或T;34M;35D或G;36D;37L;43P;47G;50S;63E;75N或S;77D;81N;85L;92L;93E;107K或T;127S;132T;133M或V;135E;143H或Q;145E;147T;162I;168N;187G;188T或W;189A、I、P或Q;200W;205R、T、L、Q或R;207R;208T;209V;210D;212S;220A;221I;222T;223Q或R;225A或K;228I或V;236V;237E;238I;239K;241P;244K或S;245S;247S;257L;258G、H、N、K或R;260D;261G、L、R、S、V或D;262L;263T、H、I、M、S、T或V;265R;266E、K、A、G、L、M、R、S、V、W、Y或G;283H、K或L;294A;300F;301V;307L;308E;318D;319K或Q;334I;336W;339N、F、M、S或W;342F、R或L;344V;345W、C或P;346K;347F;355C或R;359Y;361V;362T;363E、H、K、W或Y;366A、G、L、Q或S;368M;370C;373F;398G;404G;405R;406R;408R或V;412Y;424G;427R、H或L;429L或P;431T;439M;441E、A或V;442L或S;446A、G、L、M、R、T、V或F;448K、M、R或W;449K、L、A;450R或W;454I、L、M或S;468S;470G或Q;480L;481S;482S或V;485D;489E或Y;490E;495L;497R;501Q;504P或V;505A、F、G或M;506N或R;508G;511D或S;512N;514H;516M;523V;526E、L或V;527E、A、D、L、M、R、T或V;529G;533E、A、D、K或N;535R或V;536E、D、G、H、R、V或W;537P;538T;539E、L或M;540G;541G、I或R;542L、M、S或V;543A、D、G或V;544L或R;545I、R或V;546E、L或R;547E、A或V;548E、R或S;549G或T;552N;553R或T;554M;555D、G、L或Q;556G或V;558E或R;559H或S;560S;565A、C或D;566G;567R;568P或R;570E;571I;573T;575G;577V;580C;581C、L、R、T或A;582F、G、R、S或V;583E、R或V;586V;589A;591L、R或V;592P;594A;596T;599L;601I;604P;609G;610L、P、R或S;615A、D、G、M、P、Q、T或W;616T;620L、Q、S或V;631W;632Q;634C;639E、I、K、T或V;643E或R;644A;645E、G、S或W;646E、G、I、L、M、R或V;647L或W;648A、Q或V;649H、T或Y;650G或T;652I、L、Q、T、V或Y;653I;654C或V;659T;661D;662W;663M或W;664G、R、V或W;665E;和666D,其中所述多肽序列的氨基酸位置参考SEQ ID NO:2来编号。
在一些实施方案中,重组蛋白酶包含与SEQ ID NO:2具有至少70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的一个或更多个取代:9K或Q;17A;29F、G或S;30G;32A或T;34M;35D或G;36D;37L;43P;47G;50S;63E;75N或S;77D;81N;85L;92L;93E;107K或T;127S;132T;133M或V;135E;143H或Q;145E;147T;162I;168N;187G;188T或W;189A、I、P或Q;200W;205R、T、L、Q或R;207R;208T;209V;210D;212S;220A;221I;222T;223Q或R;225A或K;228I或V;236V;237E;238I;239K;241P;244K或S;245S;247S;257L;258G、H、N、K或R;260D;261G、L、R、S、V或D;262L;263T、H、I、M、S、T或V;265R;266E、K、A、G、L、M、R、S、V、W、Y或G;283H、K或L;294A;300F;301V;307L;308E;318D;319K或Q;334I;336W;339N、F、M、S或W;342F、R或L;344V;345W、C或P;346K;347F;355C或R;359Y;361V;362T;363E、H、K、W或Y;366A、G、L、Q或S;368M;370C;373F;398G;404G;405R;406R;408R或V;412Y;424G;427R、H或L;429L或P;431T;439M;441E、A或V;442L或S;446A、G、L、M、R、T、V或F;448K、M、R或W;449K、L、A;450R或W;454I、L、M或S;468S;470G或Q;480L;481S;482S或V;485D;489E或Y;490E;495L;497R;501Q;504P或V;505A、F、G或M;506N或R;508G;511D或S;512N;514H;516M;523V;526E、L或V;527E、A、D、L、M、R、T或V;529G;533E、A、D、K或N;535R或V;536E、D、G、H、R、V或W;537P;538T;539E、L或M;540G;541G、I或R;542L、M、S或V;543A、D、G或V;544L或R;545I、R或V;546E、L或R;547E、A或V;548E、R或S;549G或T;552N;553R或T;554M;555D、G、L或Q;556G或V;558E或R;559H或S;560S;565A、C或D;566G;567R;568P或R;570E;571I;573T;575G;577V;580C;581C、L、R、T或A;582F、G、R、S或V;583E、R或V;586V;589A;591L、R或V;592P;594A;596T;599L;601I;604P;609G;610L、P、R或S;615A、D、G、M、P、Q、T或W;616T;620L、Q、S或V;631W;632Q;634C;639E、I、K、T或V;643E或R;644A;645E、G、S或W;646E、G、I、L、M、R或V;647L或W;648A、Q或V;649H、T或Y;650G或T;652I、L、Q、T、V或Y;653I;654C或V;659T;661D;662W;663M或W;664G、R、V或W;665E;和666D,其中多肽序列的氨基酸位置参考SEQ ID NO:2来编号。
在一些实施方案中,重组蛋白酶和/或生物活性重组蛋白酶片段包含与SEQ IDNO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278具有至少70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。在一些实施方案中,重组蛋白酶和/或生物活性重组蛋白酶片段包含与SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278具有至少70%、75%、80%、85%、86%、87%、88%、89%、90%、90%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,条件是重组蛋白酶不具有SEQ ID NO:2中的多肽序列。
在一些实施方案中,重组蛋白酶和/或生物活性重组蛋白酶片段包含与SEQ IDNO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278具有至少70%、75%、80%、85%、86%、87%、88%、89%、90%、90%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,并且还包含一个或更多个取代。在一些实施方案中,重组蛋白酶和/或生物活性重组蛋白酶片段包含与SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278具有至少70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,并且还在选自以下的位置处包含一个或更多个取代:9、17、29、30、32、34、35、36、37、43、47、50、63、75、77、81、85、92、93、107、127、132、133、135、143、145、147、162、168、187、188、189、200、205、207、208、209、210、212、220、221、222、223、225、228、236、237、238、239、241、244、245、247、257、258、260、261、262、263、265、266、283、294、300、301、307、308、318、319、334、336、339、342、344、345、346、347、355、359、361、362、363、366、368、370、373、398、404、405、406、408、412、424、427、429、431、439、441、442、446、448、449、450、454、468、470、480、481、482、485、489、490、495、497、501、504、505、506、508、511、512、514、516、523、526、527、529、533、535、536E、537、538、539、540、541、542、543、544、545、546、547、548、549、552、553、554、555、556、558、559、560、565、566、567、568、570、571、573、575、577、580、581、582、583、586、589、591、592、594、596、599、601、604、609、610、615、616、620、631、632、634、639、643、644、645、646、647、648A、649、650、652、653、654、659、661、662、663、664、665或666,其中多肽序列的氨基酸位置参考SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278来编号。在一些实施方案中,可以使用上述位置的氨基酸取代。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:2具有至少70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自236、258、261、339、439、446和454的一个或更多个位置处包含至少一个取代或取代集,其中多肽序列的氨基酸位置参考SEQ ID NO:2来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQID NO:2具有至少70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自236V、258K、261L、339M、339W、439M、446A、446G、446L、446M、446T和454L的至少一个取代或取代集,其中多肽序列的氨基酸位置参考SEQ ID NO:2来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:2具有至少70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自M236V、Q258K、E261L、N339M、N339W、S439M、P446A、P446G、P446L、P446M、P446T和A454L的至少一个取代或取代集,其中多肽序列的氨基酸位置参考SEQ ID NO:2来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:2具有至少70%、75%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:107/536、162/408、168/547、208/366/504/591、208/485/526、210/223/258/552、210/241/258/599、223/241/258/599、223/429/481/533、223/481/533/552、225、225/260/263/265/544、225/262、225/362/366/591、225/366、225/482/591、244、258、258/318/429、258/449/481、258/481、261、261/504、318/481、318/533、318/599、339、342、345、362/366/485/591、363、366、366/485、366/497、366/526/591、366/591、408、427、446、448、449、450、481/533/552、482、482/485、482/591、485、485/591、533、533/552、536、544、547、549、565、615和652,其中多肽序列的氨基酸位置参考SEQ ID NO:2来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:2具有至少70%、75%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:107T/536D、162I/408R、168N/547V、208T/366G/504P/591L、208T/485D/526L、210D/223R/258K/552N、210D/241P/258K/599L、223R/241P/258K/599L、223R/429L/481S/533K、223R/481S/533K/552N、225A/260D/263H/265R/544R、225A/262L、225A/362T/366G/591L、225A/366G、225A/482V/591L、225K、244K、258K、258K/318D/429L、258K/449V/481S、258K/481S、258R、261G、261G/504V、261L、261R、261S、261V、318D/481S、318D/533K、318D/599L、339F、339W、342R、345W、362T/366G/485D/591L、363E、363W、366A、366G、366G/485D、366G/497R、366G/526L/591L、366G/591L、366L、366Q、408R、427H、427R、446R、446V、448K、448R、448W、449K、450W、481S/533K/552N、482V、482V/485D、482V/591L、485D、485D/591L、533A、533D、533E、533K、533K/552N、533N、536E、536G、536V、544R、547A、547E、549T、565C、565D、615A、615D、615G、615P、615T、615W和652I,其中多肽序列的氨基酸位置参考SEQ ID NO:2来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:2具有至少70%、75%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:M107T/Q536D、T162I/A408R、S168N/Q547V、A208T/N366G/Q504P/K591L、A208T/N485D/R526L、N210D/N223R/Q258K/K552N、N210D/E241P/Q258K/D599L、N223R/E241P/Q258K/D599L、N223R/K429L/A481S/M533K、N223R/A481S/M533K/K552N、T225A/N260D/R263H/G265R/T544R、T225A/P262L、T225A/N362T/N366G/K591L、T225A/N366G、T225A/R482V/K591L、T225K、R244K、Q258K、Q258K/Q318D/K429L、Q258K/A449V/A481S、Q258K/A481S、Q258R、E261G、E261G/Q504V、E261L、E261R、E261S、E261V、Q318D/A481S、Q318D/M533K、Q318D/D599L、N339F、N339W、L342R、Q345W、N362T/N366G/N485D/K591L、Q363E、Q363W、N366A、N366G、N366G/N485D、N366G/Q497R、N366G/R526L/K591L、N366G/K591L、N366L、N366Q、A408R、P427H、P427R、P446R、P446V、N448K、N448R、N448W、A449K、N450W、A481S/M533K/K552N、R482V、R482V/N485D、R482V/K591L、N485D、N485D/K591L、M533A、M533D、M533E、M533K、M533K/K552N、M533N、Q536E、Q536G、Q536V、T544R、Q547A、Q547E、V549T、N565C、N565D、K615A、K615D、K615G、K615P、K615T、K615W和K652I,其中多肽序列的氨基酸位置参考SEQ ID NO:2来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:34具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:258、258/261/342/345、258/261/342/504/533、258/261/345/504/549、258/261/482/504/549、258/342、258/342/504/533/536/549、258/345/427、258/408/427/504/549、258/427、258/427/482/504/533/536、258/427/482/536、261/342/345/536、261/342/482/504/533/536、261/342/482/504/549、261/342/482/536、261/342/533、261/482、318/339/362/544/547、318/339/448/544、318/339/547、318/448/544/615、339/362/363/544/547/615、339/362/544、339/448、339/448/547、339/544/547、342、342/408、342/408/536、342/482/536、362/363/544/547、362/448、363/544/547、427/482/504/533/536、427/533/536/549、448、448/544和448/544/547/615,其中多肽序列的氨基酸位置参考SEQ ID NO:34来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:34具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:258K、258K/261L/342R/345W、258K/261L/342R/504P/533D、258K/261L/345W/504P/549T、258K/261R/482V/504P/549T、258K/342R、258K/342R/504P/533K/536E/549T、258K/345W/427R、258K/408R/427R/504P/549T、258K/427R、258K/427R/482V/504P/533K/536E、258K/427R/482V/536E、261L/342R/345W/536E、261L/342R/482V/504P/533K/536E、261L/342R/533D、261R/342R/482V/504P/549T、261R/342R/482V/536E、261R/482V、318D/339W/362T/544R/547E、318D/339W/448R/544R、318D/339W/547E、318D/448R/544R/615A、339W/362T/363E/544R/547E/615A、339W/362T/544R、339W/448K、339W/448R、339W/448R/547E、339W/544R/547E、342R、342R/408R、342R/408R/536E、342R/482V/536E、362T/363E/544R/547E、362T/448R、363E/544R/547E、427R/482V/504P/533D/536E、427R/533K/536E/549T、448R、448R/544R和448R/544R/547E/615A,其中多肽序列的氨基酸位置参考SEQ ID NO:34来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:34具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:Q258K、Q258K/E261L/L342R/Q345W、Q258K/E261L/L342R/Q504P/M533D、Q258K/E261L/Q345W/Q504P/V549T、Q258K/E261R/R482V/Q504P/V549T、Q258K/L342R、Q258K/L342R/Q504P/M533K/Q536E/V549T、Q258K/Q345W/P427R、Q258K/A408R/P427R/Q504P/V549T、Q258K/P427R、Q258K/P427R/R482V/Q504P/M533K/Q536E、Q258K/P427R/R482V/Q536E、E261L/L342R/Q345W/Q536E、E261L/L342R/R482V/Q504P/M533K/Q536E、E261L/L342R/M533D、E261R/L342R/R482V/Q504P/V549T、E261R/L342R/R482V/Q536E、E261R/R482V、Q318D/N339W/N362T/T544R/Q547E、Q318D/N339W/N448R/T544R、Q318D/N339W/Q547E、Q318D/N448R/T544R/K615A、N339W/N362T/Q363E/T544R/Q547E/K615A、N339W/N362T/T544R、N339W/N448K、N339W/N448R、N339W/N448R/Q547E、N339W/T544R/Q547E、L342R、L342R/A408R、L342R/A408R/Q536E、L342R/R482V/Q536E、N362T/Q363E/T544R/Q547E、N362T/N448R、Q363E/T544R/Q547E、P427R/R482V/Q504P/M533D/Q536E、P427R/M533K/Q536E/V549T、N448R、N448R/T544R和N448R/T544R/Q547E/K615A,其中多肽序列的氨基酸位置参考SEQ ID NO:34来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:190具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自205、505、541、556和646的一个或更多个位置处包含至少一个取代或取代集,其中多肽序列的氨基酸位置参考SEQ ID NO:190来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:190具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自205Q、205T、505A、541R、556V、646L和646V的至少一个取代或取代集,其中多肽序列的氨基酸位置参考SEQ ID NO:190来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ IDNO:190具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自S205Q、S205T、Q505A、S541R、T556V、A646L和A646V的至少一个取代或取代集,其中多肽序列的氨基酸位置参考SEQ ID NO:190来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:190具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:205、220、239、261、261/339、261/339/547、261/536、261/536/547、339/427/536、339/427/536/547、339/427/547、405、442、505、539、541、542、545、556、558、594、631、663和665,其中多肽序列的氨基酸位置参考SEQ ID NO:190来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:190具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:205R、220A、239K、261L、261L/339S/547E、261L/339W、261L/536W、261L/536W/547E、339W/427R/536W、339W/427R/536W/547E、339W/427R/547E、405R、442L、442S、505G、539*、541G、541I、542*、545*、545I、545R、556*、558E、594A、631W、663*、663M和665E,其中多肽序列的氨基酸位置参考SEQ ID NO:190来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:190具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:S205R、S220A、D239K、E261L、E261L/N339S/Q547E、E261L/N339W、E261L/Q536W、E261L/Q536W/Q547E、N339W/P427R/Q536W、N339W/P427R/Q536W/Q547E、N339W/P427R/Q547E、V405R、V442L、V442S、Q505G、P539*、S541G、S541I、I542*、A545*、A545I、A545R、T556*、T558E、V594A、G631W、E663*、E663M和P665E,其中多肽序列的氨基酸位置参考SEQ ID NO:190来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:292具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:205/442/505/536/545/620/646、205/505/536/541/545/547/558/646/665、258、263、355/536/545/547、359、366、446、449、505/536/545/558/646、506、555、556、620和650,其中多肽序列的氨基酸位置参考SEQ ID NO:292来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:292具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:205R/442L/505A/536W/545I/620V/646V、205R/505A/536W/541I/545R/547E/558E/646V/665E、258G、263M、263S、355R/536W/545I/547E、359Y、366S、446P、449L、505A/536W/545I/558E/646V、506R、555D、555G、555L、556G、620L、620Q、620S和650T,其中多肽序列的氨基酸位置参考SEQ ID NO:292来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:292具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:S205R/V442L/Q505A/Q536W/A545I/E620V/A646V、S205R/Q505A/Q536W/S541I/A545R/Q547E/T558E/A646V/P665E、K258G、R263M、R263S、L355R/Q536W/A545I/Q547E、F359Y、N366S、R446P、A449L、Q505A/Q536W/A545I/T558E/A646V、G506R、E555D、E555G、E555L、T556G、E620L、E620Q、E620S和I650T,其中多肽序列的氨基酸位置参考SEQ ID NO:292来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:342具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:283/319/359/449/450/506、283/345/359/449/450/553/555、283/449/450/508/541/553/555、449/450、450/508/553/555/558、508和508/541/553,其中多肽序列的氨基酸位置参考SEQ ID NO:342来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:342具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:283H/345C/359Y/449L/450R/553T/555G、283L/319K/359Y/449L/450R/506R、283L/449L/450R/508G/541I/553T/555G、449L/450R、450R/508G/553R/555G/558E、508G和508G/541I/553T,其中多肽序列的氨基酸位置参考SEQ ID NO:342来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ IDNO:342具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:N283H/Q345C/F359Y/A449L/N450R/D553T/E555G、N283L/N319K/F359Y/A449L/N450R/G506R、N283L/A449L/N450R/N508G/S541I/D553T/E555G、A449L/N450R、N450R/N508G/D553R/E555G/T558E、N508G和N508G/S541I/D553T,其中多肽序列的氨基酸位置参考SEQ ID NO:342来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:396或1366具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:205、205/442/449/450、205/450/536/545、205/450/536/545/646、258/442/446、258/442/449/646、258/450/536/545、308、361、439、442/446/536/545/620/646、442/450/536/545、514、535、577、591、592、610、639、643和644,其中多肽序列的氨基酸位置参考SEQ ID NO:396或1366来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:396或1366具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:205S、205S/442V/449A/450N、205S/450N/536Q/545A、205S/450N/536Q/545A/646A、258Q/442V/446P、258Q/442V/449A/646A、258Q/450N/536Q/545A、308E、361V、439M、442V/446P/536Q/545A/620E/646A、442V/450N/536Q/545A、514H、535R、535V、577V、591R、591V、592P、610L、610P、610S、639E、639K、643E、643R和644A,其中多肽序列的氨基酸位置参考SEQ ID NO:396或1366来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:396或1366具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:R205S、R205S/L442V/L449A/R450N、R205S/R450N/W536Q/I545A、R205S/R450N/W536Q/I545A/V646A、K258Q/L442V/R446P、K258Q/L442V/L449A/V646A、K258Q/R450N/W536Q/I545A、A308E、I361V、S439M、L442V/R446P/W536Q/I545A/V620E/V646A、L442V/R450N/W536Q/I545A、R514H、E535R、E535V、D577V、K591R、K591V、A592P、A610L、A610P、A610S、A639E、A639K、A643E、A643R和D644A,其中多肽序列的氨基酸位置参考SEQ ID NO:396或1366来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:400或1370具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:32/490/639、236、236/238/404/480/555/568/592、236/359/404/406/555/639、236/359/490/581/639、236/359/555、236/359/609、236/370/406/568/581、236/370/568/592、236/370/581、236/404/406/480/490、236/404/555/581/609/639、236/568、236/592、236/639、238/359/370/404/490/568/639、245/363/408/512/514/596/666、245/363/512/514/537/560、308/514/535/639/644、359/404、359/404/406/490/546/581、363/408/512/514/537、363/408/601/650、363/639/644、408/512、408/514/537、408/514/560/650、490/568/592/639、512/537/560/601、514/535/546/575/644、514/639/644、514/644、535/575/639/644、535/639/643/644、535/643/644和601/650,其中多肽序列的氨基酸位置参考SEQ ID NO:400或1370来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:400或1370具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:32T/490E/639T、236V、236V/238I/404G/480L/555Q/568P/592P、236V/359Y/404G/406R/555Q/639T、236V/359Y/490E/581T/639T、236V/359Y/555Q、236V/359Y/609G、236V/370C/406R/568P/581T、236V/370C/568P/592P、236V/370C/581T、236V/404G/406R/480L/490E、236V/404G/555Q/581T/609G/639T、236V/568P、236V/592P、236V/639T、238I/359Y/370C/404G/490E/568P/639T、245S/363K/408V/512N/514H/596T/666D、245S/363K/512N/514H/537P/560S、308E/514H/535R/639K/644A、359Y/404G、359Y/404G/406R/490E/546E/581T、363H/639K/644A、363K/408V/512N/514H/537P、363K/408V/601I/650T、408V/512N、408V/514H/537P、408V/514H/560S/650T、490E/568P/592P/639T、512N/537P/560S/601I、514H/535R/546E/575G/644A、514H/639K/644A、514H/644A、535R/575G/639K/644A、535R/639K/643R/644A、535V/643R/644A和601I/650T,其中多肽序列的氨基酸位置参考SEQ ID NO:400或1370来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:400或1370具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:I32T/Q490E/A639T、M236V、M236V/L238I/S404G/I480L/E555Q/L568P/A592P、M236V/F359Y/S404G/K406R/E555Q/A639T、M236V/F359Y/Q490E/S581T/A639T、M236V/F359Y/E555Q、M236V/F359Y/A609G、M236V/S370C/K406R/L568P/S581T、M236V/S370C/L568P/A592P、M236V/S370C/S581T、M236V/S404G/K406R/I480L/Q490E、M236V/S404G/E555Q/S581T/A609G/A639T、M236V/L568P、M236V/A592P、M236V/A639T、L238I/F359Y/S370C/S404G/Q490E/L568P/A639T、T245S/Q363K/A408V/S512N/R514H/M596T/S666D、T245S/Q363K/S512N/R514H/E537P/T560S、A308E/R514H/E535R/A639K/D644A、F359Y/S404G、F359Y/S404G/K406R/Q490E/V546E/S581T、Q363H/A639K/D644A、Q363K/A408V/S512N/R514H/E537P、Q363K/A408V/M601I/I650T、A408V/S512N、A408V/R514H/E537P、A408V/R514H/T560S/I650T、Q490E/L568P/A592P/A639T、S512N/E537P/T560S/M601I、R514H/E535R/V546E/S575G/D644A、R514H/A639K/D644A、R514H/D644A、E535R/S575G/A639K/D644A、E535R/A639K/A643R/D644A、E535V/A643R/D644A和M601I/I650T,其中多肽序列的氨基酸位置参考SEQ ID NO:400或1370来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:454或1424具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:236、236/308/370/548、236/308/490/581/643、236/308/555/560/596、236/370、236/370/490/639、236/555、236/560/581、245/359/363/406/535/650、245/363/406/575/601/666、300、301、308、308/490/560/581/639/643、336、359/363/406/535/601/650、359/404/406/535、359/406/575/650/666、359/535/575/601、363/404/406/535/568、404/406/535、406、406/480/535/568/601、406/535/575、468和480/575/601/650,其中多肽序列的氨基酸位置参考SEQ ID NO:454或1424来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:454或1424具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:236V、236V/308E/370C/548E、236V/308E/490E/581T/643R、236V/308E/555Q/560S/596T、236V/370C、236V/370C/490E/639T、236V/555Q、236V/560S/581T、245S/359Y/363K/406R/535R/650T、245S/363K/406R/575G/601I/666D、300F、301V、308E、308E/490E/560S/581T/639T/643R、336W、359Y/363K/406R/535R/601I/650T、359Y/404G/406R/535R、359Y/406R/575G/650T/666D、359Y/535R/575G/601I、363K/404G/406R/535R/568P、404G/406R/535R、406R、406R/480L/535R/568P/601I、406R/535R/575G、468S和480L/575G/601I/650T,其中多肽序列的氨基酸位置参考SEQ ID NO:454或1424来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:454或1424具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:M236V、M236V/A308E/S370C/D548E、M236V/A308E/Q490E/S581T/A643R、M236V/A308E/E555Q/T560S/M596T、M236V/S370C、M236V/S370C/Q490E/A639T、M236V/E555Q、M236V/T560S/S581T、T245S/F359Y/Q363K/K406R/E535R/I650T、T245S/Q363K/K406R/S575G/M601I/S666D、L300F、A301V、A308E、A308E/Q490E/T560S/S581T/A639T/A643R、Y336W、F359Y/Q363K/K406R/E535R/M601I/I650T、F359Y/S404G/K406R/E535R、F359Y/K406R/S575G/I650T/S666D、F359Y/E535R/S575G/M601I、Q363K/S404G/K406R/E535R/L568P、S404G/K406R/E535R、K406R、K406R/I480L/E535R/L568P/M601I、K406R/E535R/S575G、A468S和I480L/S575G/M601I/I650T,其中多肽序列的氨基酸位置参考SEQ ID NO:454或1424来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:562或1532具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:133/301/346/347/468、205/236/347、205/236/370/490/537/620、205/342/439/442/514/620/639、205/370/537、205/442/505/620、236/258/370/505/545/639、236/339/514、236/370/450/620、236/545、258/339/342/505/537、258/342/370/408/442/537、300/301/308/346/347/468、300/301/347/468、301/308/336/346/406/468/601、301/308/346/406/468、301/308/468/601、301/347/406、308/336/347/468、308/347/468、342、342/408/490/505/514/545/639/646、342/620、370/442、370/537/639、489、539/649、542、543、543/673、558、559、566、634和661,其中多肽序列的氨基酸位置参考SEQ ID NO:562或1532来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQID NO:562或1532具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:133M/301V/346K/347F/468S、205S/236M/347F、205S/236M/370S/490Q/537E/620E、205S/342L/439S/442V/514R/620E/639A、205S/370S/537E、205S/442V/505Q/620E、236M/258Q/370S/505Q/545A/639A、236M/339N/514R、236M/370S/450N/620E、236M/545A、258Q/339N/342L/505Q/537E、258Q/342L/370S/408A/442V/537E、300F/301V/308E/346K/347F/468S、300F/301V/347F/468S、301V/308E/336W/346K/406R/468S/601I、301V/308E/346K/406R/468S、301V/308E/468S/601I、301V/347F/406R、308E/336W/347F/468S、308E/347F/468S、342L、342L/408A/490Q/505Q/514R/545A/639A/646A、342L/620E、370S/442V、370S/537E/639A、489Y、539M/649H、542M、543A、543V/673Y、558R、559H、559S、566G、634C和661D,其中多肽序列的氨基酸位置参考SEQ IDNO:562或1532来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:562或1532具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:L133M/A301V/V346K/V347F/A468S、R205S/V236M/V347F、R205S/V236M/C370S/E490Q/P537E/V620E、R205S/R342L/M439S/L442V/H514R/V620E/T639A、R205S/C370S/P537E、R205S/L442V/A505Q/V620E、V236M/K258Q/C370S/A505Q/I545A/T639A、V236M/W339N/H514R、V236M/C370S/R450N/V620E、V236M/I545A、K258Q/W339N/R342L/A505Q/P537E、K258Q/R342L/C370S/V408A/L442V/P537E、L300F/A301V/A308E/V346K/V347F/A468S、L300F/A301V/V347F/A468S、A301V/A308E/Y336W/V346K/K406R/A468S/M601I、A301V/A308E/V346K/K406R/A468S、A301V/A308E/A468S/M601I、A301V/V347F/K406R、A308E/Y336W/V347F/A468S、A308E/V347F/A468S、R342L、R342L/V408A/E490Q/A505Q/H514R/I545A/T639A/V646A、R342L/V620E、C370S/L442V、C370S/P537E/T639A、D489Y、P539M/D649H、I542M、F543A、F543V/H673Y、T558R、L559H、L559S、T566G、P634C和G661D,其中多肽序列的氨基酸位置参考SEQ ID NO:562或1532来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:562或1532具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:205/236/342/439/505/514/537/545、236/342/505/514/537/545、300/301/308/336/347/468/601、300/301/347/406、301/308/346/347/468、301/336/346/347/406/601和308/336/347/406/468/601,其中多肽序列的氨基酸位置参考SEQ ID NO:562或1532来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQID NO:562或1532具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:205S/236M/342L/439S/505Q/514R/537E/545A、236M/342L/505Q/514R/537E/545A、300F/301V/308E/336W/347F/468S/601I、300F/301V/347F/406R、301V/308E/346K/347F/468S、301V/336W/346K/347F/406R/601I和308E/336W/347F/406R/468S/601I,其中多肽序列的氨基酸位置参考SEQ ID NO:562或1532来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:562或1532具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:R205S/V236M/R342L/M439S/A505Q/H514R/P537E/I545A 、V236M/R342L/A505Q/H514R/P537E/I545A 、L300F/A301V/A308E/Y336W/V347F/A468S/M601I 、L300F/A301V/V347F/K406R、A301V/A308E/V346K/V347F/A468S、A301V/Y336W/V346K/V347F/K406R/M601I和A308E/Y336W/V347F/K406R/A468S/M601I,其中多肽序列的氨基酸位置参考SEQ ID NO:562或1532来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:638或1608具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:346/511/537、346/511/537/541/543、346/511/542/582、346/511/581/582、346/511/583、346/529/571/581/582/583/589、511/537、516/539/568、537/582、539、568/662/663和581/582,其中多肽序列的氨基酸位置参考SEQID NO:638或1608来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:638或1608具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:346V/511S/537E、346V/511S/537E/541I/543G、346V/511S/542S/582R、346V/511S/581L/582R、346V/511S/583R、346V/529G/571I/581C/582V/583V/589A、511S/537E、516M/539E/568R、537E/582R、539E、568R/662W/663W和581L/582R,其中多肽序列的氨基酸位置参考SEQ ID NO:638或1608来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:638或1608具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:K346V/A511S/P537E 、 K346V/A511S/P537E/S541I/F543G 、K346V/A511S/I542S/Y582R、 K346V/A511S/S581L/Y582R、K346V/A511S/I583R、K346V/V529G/S571I/S581C/Y582V/I583V/T589A、A511S/P537E、P516M/P539E/L568R、P537E/Y582R、P539E、L568R/F662W/E663W和S581L/Y582R,其中多肽序列的氨基酸位置参考SEQ ID NO:638或1608来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:638或1608具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:346/511/537/582、346/511/543/582、346/511/544、346/537/542/544、346/543/544、346/583、511/537/542/582/583、516、516/539/555、537/543/582、539/568、540、542/544/581、548、549、559、559/568、582、647、650和664,其中多肽序列的氨基酸位置参考SEQ ID NO:638或1608来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:638或1608具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:346V/511S/537E/582V、346V/511S/543G/582R、346V/511S/544L、346V/537E/542S/544L、346V/543G/544L、346V/583R、511S/537E/542S/582R/583R、516M、516M/539E/555G、537E/543G/582R、539E/568R、540G、542S/544L/581R、548R、549G、559S、559S/568R、582V、647L、647W、650G和664R,其中多肽序列的氨基酸位置参考SEQ ID NO:638或1608来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:638或1608具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:K346V/A511S/P537E/Y582V、K346V/A511S/F543G/Y582R、K346V/A511S/T544L、K346V/P537E/I542S/T544L、K346V/F543G/T544L、K346V/I583R、A511S/P537E/I542S/Y582R/I583R、P516M、P516M/P539E/E555G、P537E/F543G/Y582R、P539E/L568R、V540G、I542S/T544L/S581R、D548R、V549G、L559S、L559S/L568R、Y582V、Q647L、Q647W、I650G和Q664R,其中多肽序列的氨基酸位置参考SEQ ID NO:638或1608来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:680具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:261/355/543、261/355/567/568、261/489、261/489/511/568、261/489/539、261/489/567、261/539/543、261/539/543/567、261/542/543/568、511、511/539/543、511/567、543和583,其中多肽序列的氨基酸位置参考SEQ ID NO:680或1608来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:680或1608具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:261D/355C/543A、261D/355C/567R/568R、261D/489E、261D/489E/511D/568R、261D/489E/539L、261D/489E/567R、261D/539L/543A、261D/539L/543D/567R、261D/542L/543A/568R、511D、511D/539L/543A、511D/567R、543A和583E,其中多肽序列的氨基酸位置参考SEQ ID NO:680或1608来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:680或1608具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:L261D/L355C/F543A、L261D/L355C/D567R/L568R、L261D/D489E、L261D/D489E/A511D/L568R、L261D/D489E/P539L、L261D/D489E/D567R、L261D/P539L/F543A、L261D/P539L/F543D/D567R、L261D/I542L/F543A/L568R、A511D、A511D/P539L/F543A、A511D/D567R、F543A和I583E,其中多肽序列的氨基酸位置参考SEQ ID NO:680或1608来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:756或1726具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:9、9/17/34/35/93/554、9/17/50、9/17/93、9/29/35/43/77/542/554、9/32/77/93、9/43/77、9/50/63/93、9/93、17/29/34/35/36/77/93、17/32/34/35、17/77、32/34/93、43、50/77/93、50/93、77/93、93、205/263/470、205/344/470/565、205/345/470/538/664、205/470/545/568/645/647/664、205/470/567/568/645、263/344/664、263/470/645、263/489、263/539/541/568/645、344/355/470/489/645、344/355/470/568/645/647、344/470/489/539/542/645/647/664、344/470/489/567/568、344/470/568、344/470/647、470、470/489、470/541/542/543/565/645/647、470/567/568、470/664和542/543,其中多肽序列的氨基酸位置参考SEQ ID NO:756或1726来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:756或1726具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:9K、9K/17A/34M/35G/93E/554M、9K/17A/50S、9K/17A/93E、9K/29S/35G/43P/77D/542V/554M、9K/32A/77D/93E、9K/43P/77D、9K/50S/63E/93E、9K/93E、9Q/17A/93E、17A/29S/34M/35G/36D/77D/93E、17A/32A/34M/35G、17A/77D、32A/34M/93E、43P、50S/77D/93E、50S/93E、77D/93E、93E、205L/263V/470Q、205L/344V/470Q/565A、205L/345P/470Q/538T/664R、205L/470Q/545L/568R/645S/647W/664R、205L/470Q/567R/568R/645S、263I/344V/664R、263I/470Q/645S、263I/489D、263I/539L/541R/568R/645S、344V/355C/470Q/489D/645S、344V/355C/470Q/568R/645S/647W、344V/470Q/489D/539L/542L/645S/647W/664R、344V/470Q/489D/567R/568R、344V/470Q/568R、344V/470Q/647W、470Q、470Q/489D、470Q/541R/542L/543A/565A/645S/647W、470Q/567R/568R、470Q/664R和542L/543A,其中多肽序列的氨基酸位置参考SEQ ID NO:756或1726来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQID NO:756或1726具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:R9K、R9K/T17A/T34M/E35G/A93E/L554M、R9K/T17A/N50S、R9K/T17A/A93E、R9K/N29S/E35G/S43P/N77D/I542V/L554M、R9K/I32A/N77D/A93E、R9K/S43P/N77D、R9K/N50S/A63E/A93E、R9K/A93E、R9Q/T17A/A93E、T17A/N29S/T34M/E35G/T36D/N77D/A93E、T17A/I32A/T34M/E35G、T17A/N77D、I32A/T34M/A93E、S43P、N50S/N77D/A93E、N50S/A93E、N77D/A93E、A93E、R205L/R263V/P470Q、R205L/N344V/P470Q/N565A、R205L/Q345P/P470Q/S538T/Q664R、R205L/P470Q/I545L/L568R/K645S/Q647W/Q664R、R205L/P470Q/D567R/L568R/K645S、R263I/N344V/Q664R、R263I/P470Q/K645S、R263I/E489D、R263I/P539L/S541R/L568R/K645S、N344V/L355C/P470Q/E489D/K645S、N344V/L355C/P470Q/L568R/K645S/Q647W、N344V/P470Q/E489D/P539L/I542L/K645S/Q647W/Q664R、N344V/P470Q/E489D/D567R/L568R、N344V/P470Q/L568R、N344V/P470Q/Q647W、P470Q、P470Q/E489D、P470Q/S541R/I542L/F543A/N565A/K645S/Q647W、P470Q/D567R/L568R、P470Q/Q664R和I542L/F543A,其中多肽序列的氨基酸位置参考SEQ IDNO:756或1726来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:756或1726具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:9/17/32/34/36/50/77/107/127、9/17/63/77、9/43/93/127、9/63/93/107、17/29/32/34/36/63、29/34/35/77、32/43/93、35/93/145和205/263/489/647,其中多肽序列的氨基酸位置参考SEQ ID NO:756或1726来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:756或1726具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:9K/17A/32A/34M/36D/50S/77D/107K/127S、9K/17A/63E/77D、9K/43P/93E/127S、9K/63E/93E/107K、17A/29S/32A/34M/36D/63E、29S/34M/35G/77D、32A/43P/93E、35G/93E/145E和205L/263V/489D/647W,其中多肽序列的氨基酸位置参考SEQ ID NO:756或1726来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:756或1726具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:R9K/T17A/I32A/T34M/T36D/N50S/N77D/M107K/G127S、R9K/T17A/A63E/N77D、R9K/S43P/A93E/G127S、R9K/A63E/A93E/M107K、T17A/N29S/I32A/T34M/T36D/A63E、N29S/T34M/E35G/N77D、I32A/S43P/A93E、E35G/A93E/G145E和R205L/R263V/E489D/Q647W,其中多肽序列的氨基酸位置参考SEQ ID NO:756或1726来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:188、189、265、266、334、442、454、646和649,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:188W、189A、189P、265R、266E、266G、334I、442V、454L、454M、454S、646I、646M、646R、649T和649Y,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:N188W、K189A、K189P、G265R、N266E、N266G、V334I、L442V、A454L、A454M、A454S、V646I、V646M、V646R、D649T和D649Y,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:189、266、266/283、546、594和646,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:189I、266A、266L、266L/283K、266M、266S、266V、266W、266Y、546L、594A和646L,其中多肽序列的氨基酸位置参考SEQID NO:812或1782来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:K189I、N266A、N266L、N266L/N283K、N266M、N266S、N266V、N266W、N266Y、V546L、V594A和V646L,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:263/470/568、266、470/542/543/664和558/577/594,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:263I/470P/568R、266R、470P/542L/543A/664Q和558E/577V/594A,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:R263I/Q470P/L568R、N266R、Q470P/I542L/F543A/R664Q和T558E/D577V/V594A,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:29、29/35、29/35/342/581/582/664、29/50/511/539/581、35、35/50/205/406/511/581、35/205/511、35/342/346/511/539/581、35/346、35/346/406/511/581/582/664、35/511、35/539、50/342、132、133、143、147、187、188、257、258、263、294、294/441/527、308/342/511/581/582、342、346、398、406/664、429/652、441、441/446/526、446/652、482、505、511、526、527、536、545、581、582、615、620、639、645、646、648、652、654和664,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:29F、29G、29S/35G、29S/35G/342L/581S/582Y/664Q、29S/50S/511S/539L/581S、35D/511S、35G、35G/50S/205S/406R/511S/581S、35G/205S/511S、35G/342L/346V/511S/539L/581S、35G/346V、35G/346V/406R/511S/581S/582Y/664Q、35G/511S、35G/539L、50S/342L、132T、133V、143H、147T、187G、188T、257L、258H、258N、263S、294A、294A/441A/527A、308A/342L/511S/581S/582Y、342F、346V、398G、406R/664Q、429L/652T、441A、441A/446P/526L、441V、446P/652T、482V、505F、505M、511S、526V、527D、527R、536H、536R、545V、581A、581S、582G、582S、582Y、615Q、620E、639E、639I、645E、645G、645W、646G、646R、648Q、648V、652L、652Q、652T、652Y、654C、664G、664V和664W,其中多肽序列的氨基酸位置参考SEQ IDNO:812或1782来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:N29F、N29G、N29S/E35G、N29S/E35G/R342L/L581S/R582Y/R664Q、N29S/N50S/A511S/P539L/L581S、E35D/A511S、E35G、E35G/N50S/R205S/K406R/A511S/L581S、E35G/R205S/A511S、E35G/R342L/K346V/A511S/P539L/L581S、E35G/K346V、E35G/K346V/K406R/A511S/L581S/R582Y/R664Q、E35G/A511S、E35G/P539L、N50S/R342L、I132T、L133V、E143H、A147T、I187G、N188T、R257L、K258H、K258N、R263S、R294A、R294A/R441A/K527A、E308A/R342L/A511S/L581S/R582Y、R342F、K346V、A398G、K406R/R664Q、K429L/K652T、R441A、R441A/R446P/R526L、R441V、R446P/K652T、R482V、A505F、A505M、A511S、R526V、K527D、K527R、W536H、W536R、I545V、L581A、L581S、R582G、R582S、R582Y、K615Q、V620E、T639E、T639I、K645E、K645G、K645W、V646G、V646R、R648Q、R648V、K652L、K652Q、K652T、K652Y、R654C、R664G、R664V和R664W,其中多肽序列的氨基酸位置参考SEQ IDNO:812或1782来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:1030或2000具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下一个或更多个位置处包含至少一个取代或取代集:29、29/143/263/266/441/639、29/263/266、29/263/266/441/620、29/266/441、29/441/639、30、37、47/570、75、81、85、92、135、143、143/263/266/639、143/266/441/620/639、168、189/424、237/527、244、258/342/582/648、263、263/266/441、263/266/639、266/441、266/441/620/639、266/620/639、266/639、267、342/526/664、342/545、342/582、429、441、482、495、501、523、526、527、568、570、573、581、582、616、632、648、653和654,其中多肽序列的氨基酸位置参考SEQ ID NO:1030或2000来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:1030或2000具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:29G/143H/263S/266A/441V/639I、29G/263S/266A、29G/263S/266L/441A/620E、29G/266A/441A、29G/441V/639V、29S、30G、37L、47G/570E、75N、75S、81N、85L、92L、135E、143H/263S/266A/639V、143H/266A/441V/620E/639V、143Q、168E、189Q/424G、237E/527V、244S、258H/342F/582S/648Q、263S/266A/441A、263S/266A/441V、263S/266A/639V、263T、266A/441V/620E/639V、266A/620E/639I、266A/639I、266L/441A、267G、342F/526V/664G、342F/545V、342F/582G、429P、441E、482V、495L、501Q、523V、526E、527E、527L、527M、527R、527T、568P、570E、573T、581T、582F、616T、632Q、648A、653I和654V,其中多肽序列的氨基酸位置参考SEQ ID NO:1030或2000来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQID NO:1030或2000具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:N29G/E143H/R263S/N266A/R441V/T639I、N29G/R263S/N266A、N29G/R263S/N266L/R441A/V620E、N29G/N266A/R441A、N29G/R441V/T639V、N29S、R30G、R37L、E47G/K570E、R75N、R75S、R81N、R85L、P92L、R135E、E143H/R263S/N266A/T639V、E143H/N266A/R441V/V620E/T639V、E143Q、S168E、K189Q/D424G、D237E/K527V、R244S、K258H/L342F/R582S/R648Q、R263S/N266A/R441A、R263S/N266A/R441V、R263S/N266A/T639V、R263T、N266A/R441V/V620E/T639V、N266A/V620E/T639I、N266A/T639I、N266L/R441A、R267G、L342F/R526V/R664G、L342F/I545V、L342F/R582G、K429P、R441E、R482V、I495L、R501Q、M523V、R526E、K527E、K527L、K527M、K527R、K527T、L568P、K570E、K573T、S581T、R582F、K616T、K632Q、R648A、M653I和R654V,其中多肽序列的氨基酸位置参考SEQ ID NO:1030或2000来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:1136或2106具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:29、29/30、29/30/143/263/482/646、29/30/263、29/30/616/648、29/75/263/568/570/648、29/168/648、29/263/527/568、75、75/143/168/527、75/168、75/616、143、168/247/482/648、168/263/616、168/482/616、168/495/616、263、263/616、429/545、495和527,其中多肽序列的氨基酸位置参考SEQ ID NO:1136或2106来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:1136或2106具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:29S、29S/30G、29S/30G/143Q/263T/482V/646E、29S/30G/263T、29S/30G/616T/648A、29S/75S/263T/568P/570E/648A、29S/168E/648A、29S/263T/527L/568P、75S、75S/143Q/168E/527L、75S/168E、75S/616T、143Q、168E/247S/482V/648A、168E/263T/616T、168E/482V/616T、168E/495L/616T、263T、263T/616T、429P/545V、495L和527T,其中多肽序列的氨基酸位置参考SEQ ID NO:1136或2106来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:1136或2106具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:N29S、N29S/R30G、N29S/R30G/E143Q/S263T/R482V/V646E、N29S/R30G/S263T、N29S/R30G/K616T/R648A、N29S/R75S/S263T/L568P/K570E/R648A、N29S/S168E/R648A、N29S/S263T/K527L/L568P、R75S、R75S/E143Q/S168E/K527L、R75S/S168E、R75S/K616T、E143Q、S168E/G247S/R482V/R648A、S168E/S263T/K616T、S168E/R482V/K616T、S168E/I495L/K616T、S263T、S263T/K616T、K429P/I545V、I495L和K527T,其中氨基酸位置参考SEQ ID NO:1136或2106来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:1136或2106具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自207、222、266、307、454、535、546、548、580、604和610的一个或更多个位置处包含至少一个取代或取代集,其中多肽序列的氨基酸位置参考SEQ ID NO:1136或2106来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:1136或2106具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:207R、222T、266K、307L、454L、535V、546R、548S、580C、604P和610R,其中多肽序列的氨基酸位置参考SEQ ID NO:1136或2106来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ IDNO:1136或2106具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:Q207R、S222T、A266K、Q307L、A454L、E535V、V546R、D548S、H580C、H604P和A610R,其中多肽序列的氨基酸位置参考SEQ ID NO:1136或2106来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:1180或2150具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:75/168/207/454/568/586/610/648/659、75/168/266/454/546/570/580、75/207/454/570/659、75/207/546/580/648、75/263/454/548/568/604/648、75/266/454、75/454、75/454/546/548/568/604、75/546/548/610/648、168/207/263/454/568/570/604、168/263/266/546/604、168/454/604、207/604/610、209、212、221、223、228、266/454/568、319、373、412/546/554、431、454、454/546/568/570/580、454/546/570、454/570/580/610、454/580、454/659和506,其中多肽序列的氨基酸位置参考SEQID NO:1180或2150来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:1180或2150具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:75S/168E/207R/454L/568P/586V/610R/648A/659T、75S/168E/266K/454L/546R/570E/580C、75S/207R/454L/570E/659T、75S/207R/546R/580C/648A、75S/263T/454L/548S/568P/604P/648A、75S/266K/454L、75S/454L、75S/454L/546R/548S/568P/604P、75S/546R/548S/610R/648A、168E/207R/263T/454L/568P/570E/604P、168E/263T/266K/546R/604P、168E/454L/604P、207R/604P/610R、209V、212S、221I、223Q、228I、228V、266K/454L/568P、319Q、373F、412Y/546L/554M、431T、454I、454L/546R/568P/570E/580C、454L/546R/570E、454L/570E/580C/610R、454L/580C、454L/659T和506N,其中多肽序列的氨基酸位置参考SEQ ID NO:1180或2150来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:1180或2150具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:R75S/S168E/Q207R/A454L/L568P/L586V/A610R/R648A/E659T、R75S/S168E/A266K/A454L/V546R/K570E/H580C、R75S/Q207R/A454L/K570E/E659T、R75S/Q207R/V546R/H580C/R648A、R75S/S263T/A454L/D548S/L568P/H604P/R648A、R75S/A266K/A454L、R75S/A454L、R75S/A454L/V546R/D548S/L568P/H604P、R75S/V546R/D548S/A610R/R648A、S168E/Q207R/S263T/A454L/L568P/K570E/H604P、S168E/S263T/A266K/V546R/H604P、S168E/A454L/H604P、Q207R/H604P/A610R、I209V、D212S、L221I、N223Q、T228I、T228V、A266K/A454L/L568P、N319Q、L373F、F412Y/V546L/L554M、P431T、A454I、A454L/V546R/L568P/K570E/H580C、A454L/V546R/K570E、A454L/K570E/H580C/A610R、A454L/H580C、A454L/E659T和G506N,其中多肽序列的氨基酸位置参考SEQ ID NO:1180或2150来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:1250或2220具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:75/189/373/582、75/200/212/431/482、75/212/373/431/482、75/212/431/482/568/615/664、75/368/582、75/373/431/526/582、75/431/482/570/604/664、75/632、189/212/431/568/570、200/205/373/431、200/431/482/615/664、200/482/664、212/228/431、212/228/568/570/582/664、212/373/446/482/582、368/373/431、373/431/570/604/664、373/568/632、431、431/604/664、482/582、582和615/652/664,其中多肽序列的氨基酸位置参考SEQ ID NO:1250或2220来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:1250或2220具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:75S/189A/373F/582G、75S/200W/212S/431T/482S、75S/212S/373F/431T/482S、75S/212S/431T/482S/568P/615M/664G、75S/368M/582G、75S/373F/431T/526E/582G、75S/431T/482S/570K/604P/664G、75S/632Q、189A/212S/431T/568P/570K、200W/205S/373F/431T、200W/431T/482S/615M/664G、200W/482S/664W、212S/228V/431T、212S/228V/568P/570K/582G/664W、212S/373F/446F/482S/582G、368M/373F/431T、373F/431T/570K/604P/664W、373F/568P/632Q、431T、431T/604P/664G、482S/582G、582G和615M/652V/664G,其中多肽序列的氨基酸位置参考SEQ ID NO:1250或2220来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:1250或2220具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:R75S/K189A/L373F/R582G、R75S/K200W/D212S/P431T/R482S、R75S/D212S/L373F/P431T/R482S、R75S/D212S/P431T/R482S/L568P/K615M/R664G、R75S/K368M/R582G、R75S/L373F/P431T/R526E/R582G、R75S/P431T/R482S/E570K/H604P/R664G、R75S/K632Q、K189A/D212S/P431T/L568P/E570K、K200W/R205S/L373F/P431T、K200W/P431T/R482S/K615M/R664G、K200W/R482S/R664W、D212S/T228V/P431T、D212S/T228V/L568P/E570K/R582G/R664W、D212S/L373F/R446F/R482S/R582G、K368M/L373F/P431T、L373F/P431T/E570K/H604P/R664W、L373F/L568P/K632Q、P431T、P431T/H604P/R664G、R482S/R582G、R582G和K615M/K652V/R664G,其中多肽序列的氨基酸位置参考SEQ ID NO:1250或2220来编号。
在一些另外的实施方案中,重组蛋白酶包含与SEQ ID NO:1308或2278具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:408/439、439/514、470、470/667、514、514/537和537,其中多肽序列的氨基酸位置参考SEQ ID NO:1308或2278来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:1308或2278具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:408A/439S、439S/514R、470G、470G/667D、470P、514R、514R/537E和537E,其中多肽序列的氨基酸位置参考SEQ ID NO:1308或2278来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:1308或2278具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中重组蛋白酶包含选自以下的至少一个取代或取代集:V408A/M439S、M439S/H514R、Q470G、Q470G/G667D、Q470P、H514R、H514R/P537E和P537E,其中多肽序列的氨基酸位置参考SEQ ID NO:1308或2278来编号。
在一些另外的实施方案中,重组蛋白酶包含如表3.1、表3.2、表3.3、表3.4、表3.5、表3.6、表3.7、表3.8、表3.9、表3.10、表3.11、表3.12、表3.13、表3.14、表3.15、表3.16、表3.17、表3.18、表3.19、表3.20、表3.21、表3.22、表3.23、表3.24、表3.25、表3.26和/或表3.27中提供的至少一个位置中的至少一个突变,其中位置参考SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278来编号。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:4-1362和1366-2332中的偶数编号序列中列出的至少一个序列具有至少约80%、至少约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更多序列同一性的多肽序列。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:4-1362和1366-2332中的偶数编号序列中列出的至少一个序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。在一些此外的实施方案中,重组蛋白酶包含与SEQ ID NO:34、190、292、342、382、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1364、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220、2278和2332中的多肽序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。
在一些另外的实施方案中,重组蛋白酶包含SEQ ID NO:4-1362和1366-2332中的偶数编号序列中列出的至少一个序列。在另外的实施方案中,重组蛋白酶包含在SEQ IDNO:4-1362中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:1366-2332中的偶数编号序列中列出的至少一个序列。
在一些实施方案中,重组蛋白酶包含在SEQ ID NO:4-20中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:22-188中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:190-268中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ IDNO:270-282中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:284-340中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:342-380中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:382-394中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:396-450和1366-1420中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:452-522和1422-1492中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:524-574和1494-1544中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:576-646和1546-1616中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:648-660和1618-1630中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:662-684和1632-1654中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:686-728和1656-1698中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:730-756和1700-1726中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:758-836和1728-1806中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:838-854和1808-1824中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:856-886和1826-1856中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:888-910和1858-1880中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:912-916和1882-1886中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:918-1058和1888-2028中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:1060-1172和2030-2142中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:1174-1216和2144-2186中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:1218-1238和2188-2208中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:1240-1300和2210-2270中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:1302-1346和2272-2316中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含在SEQ ID NO:1348-1362和2318-2332中的偶数编号序列中列出的至少一个序列。在一些实施方案中,重组蛋白酶包含选自以下的多肽序列:SEQ ID NO:34、190、292、342、382、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1364、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220、2278和2332。
在一些实施方案中,工程化蛋白酶多肽包含由本发明包括的工程化蛋白酶多肽的功能片段。功能片段具有其所源自的工程化蛋白酶多肽(即,本文描述的亲本工程化蛋白酶或参考蛋白酶)的活性的至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。在一些实施方案中,功能片段包含工程化蛋白酶的亲本序列的至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%以及甚至99%。在一些实施方案中,功能片段被截短了少于5个、少于10个、少于15个、少于10个、少于25个、少于30个、少于35个、少于40个、少于45个和少于50个氨基酸。
当与参考序列相比时,本发明的工程化蛋白酶包含至少一种改进的特性。在一些实施方案中,参考序列是野生型蛋白酶,而在一些其他实施方案中,参考序列是另一种工程化蛋白酶。
在一些另外的实施方案中,重组蛋白酶比SEQ ID NO:2的蛋白酶更热稳定。在一些此外的实施方案中,重组蛋白酶比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更热稳定。在一些实施方案中,重组蛋白酶在40℃至50℃是稳定的。在一些实施方案中,重组蛋白酶在25℃、37℃、42℃和/或48℃是稳定的。在一些另外的实施方案中,重组蛋白酶在40℃至50℃比参考序列更稳定。在一些实施方案中,重组蛋白酶在25℃、37℃、42℃和/或48℃比参考序列更稳定。在一些另外的实施方案中,重组蛋白酶比SEQ ID NO:2的蛋白酶更热稳定。在一些此外的实施方案中,重组蛋白酶比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更热稳定。
在一些实施方案中,重组蛋白酶在低pH环境中是稳定的,而在其他实施方案中,重组蛋白酶在高pH环境中是稳定的。在一些实施方案中,重组蛋白酶在低pH和高pH环境两者中都是稳定的。在一些另外的实施方案中,与参考序列相比,重组蛋白酶在高pH环境或低pH环境(或两种环境)更稳定。在一些实施方案中,参考序列是野生型蛋白酶,而在其他实施方案中,参考序列是另一种工程化蛋白酶。在一些另外的实施方案中,重组蛋白酶比SEQ IDNO:2的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在大于7的pH比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在大于7的pH比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 7.8比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 7.8比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH7.5比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 7.5比SEQID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 7比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 7比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在小于7的pH比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在小于pH 7的pH比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 6.5比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH6.5比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 6比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 6比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在小于5的pH比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 5比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 5比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在pH 4比SEQ ID NO:2的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在pH 5比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 3.8比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 3.8比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 3.26比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 3.26比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在pH 3.5比SEQ ID NO:2的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在pH 3.5比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在pH 3比SEQID NO:2的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在pH 3比SEQ ID NO:34、190、292、342、382、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 2.75比SEQ ID NO:2的蛋白酶更稳定。在一些另外的实施方案中,重组蛋白酶在pH 2.75比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在pH 2.5比SEQ ID NO:2的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在pH 2.5比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在pH 2比SEQ ID NO:2的蛋白酶更稳定。在一些此外的实施方案中,重组蛋白酶在pH 2比SEQ IDNO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。
在一些实施方案中,重组蛋白酶比SEQ ID NO:2的蛋白酶更抗蛋白水解。在一些实施方案中,重组蛋白酶比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更抗蛋白水解。在一些实施方案中,重组蛋白酶抗胃蛋白酶的蛋白水解。在一些另外的实施方案中,重组蛋白酶比SEQ ID NO:2的蛋白酶更抗胃蛋白酶的蛋白水解。在一些实施方案中,重组蛋白酶比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更抗胃蛋白酶的蛋白水解。
在一些实施方案中,本发明的重组蛋白酶抗自溶。在一些实施方案中,重组蛋白酶比SEQ ID NO:2的蛋白酶更抗自溶。在一些实施方案中,重组蛋白酶比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更抗自溶。
在一些另外的实施方案中,重组蛋白酶在存在至少一种胆盐的情况下是有活性的。在一些另外的实施方案中,重组蛋白酶在存在至少一种胆盐的情况下比SEQ ID NO:2的蛋白酶更有活性。在一些另外的实施方案中,重组蛋白酶在存在至少一种胆盐的情况下比SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更有活性。在一些另外的实施方案中,胆盐是牛磺胆酸盐。
在又一些另外的实施方案中,与野生型蛋白酶或另一种重组蛋白酶相比,重组蛋白酶表现出多于一种改进的特性。在一些实施方案中,与SEQ ID NO:2相比,重组蛋白酶表现出多于一种改进的特性,而在一些另外的实施方案中,重组蛋白酶与SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278相比,表现出多于一种改进的特性。在一些实施方案中,改进的特性选自酸稳定性、碱稳定性、在酸性pH的稳定性、在碱性pH的稳定性、在中性pH的稳定性、热稳定性、蛋白水解抗性、自溶抗性和增加的在存在至少一种胆盐的情况下的活性。在一些实施方案中,改进的特性选自在酸性pH的活性、在酸性pH的稳定性、在中性pH的稳定性、热稳定性、蛋白水解抗性、自溶抗性和增加的在存在至少一种胆盐的情况下的活性。在又一些另外的实施方案中,重组蛋白酶在酸性pH比SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定和/或更有活性,更耐热、更抗蛋白水解、更抗自溶和/或在存在至少一种胆盐的情况下更有活性。设想了可将改进的特性的任何组合用于本发明。不意图本发明受限于改进的特性的任何特定组合。此外,在一些实施方案中,有两种改进的特性,而在一些其他实施方案中,有三种改进的特性,在一些另外的实施方案中,有四种改进的特性,并且在一些另外的实施方案中,有五种或更多种改进的特性。还设想了本发明的重组蛋白酶还包括另外的改进。在一些实施方案中,这些另外的改进提供了优于野生型蛋白酶的优势,而在一些其他实施方案中,这些另外的改进将提供优于其他重组蛋白酶的优势。
在一些实施方案中,与SEQ ID NO:2的蛋白酶相比,重组蛋白酶表现出至少一种选自以下的改进的特性:改进的在酸性pH的稳定性和/或活性、改进的热稳定性、改进的对蛋白水解的抗性、改进的对自溶的抗性和/或改进的在存在至少一种胆盐的情况下的活性。在一些实施方案中,与SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶相比,重组蛋白酶表现出至少一种选自以下的改进的特性:改进的在酸性pH的稳定性和/或活性、改进的热稳定性、改进的对蛋白水解的抗性、改进的对自溶的抗性和/或改进的在存在至少一种胆盐的情况下的活性。在一些实施方案中,与SEQ ID NO:2的蛋白酶相比,重组蛋白酶表现出至少两种选自以下的改进的特性:改进的在酸性pH的稳定性和/或活性、改进的热稳定性、改进的对蛋白水解的抗性、改进的对自溶的抗性和/或改进的在存在至少一种胆盐的情况下的活性。在一些实施方案中,与SEQ IDNO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶相比,重组蛋白酶表现出至少两种选自以下的改进的特性:改进的在酸性pH的稳定性和/或活性、改进的热稳定性、改进的对蛋白水解的抗性、改进的对自溶的抗性和/或改进的在存在至少一种胆盐的情况下的活性。在一些实施方案中,与SEQ ID NO:2的蛋白酶相比,重组蛋白酶表现出至少三种选自以下的改进的特性:改进的在酸性pH的稳定性和/或活性、改进的热稳定性、改进的对蛋白水解的抗性、改进的对自溶的抗性和/或改进的在存在至少一种胆盐的情况下的活性。在一些实施方案中,与SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶相比,重组蛋白酶表现出至少三种选自以下的改进的特性:改进的在酸性pH的稳定性和/或活性、改进的热稳定性、改进的对蛋白水解的抗性、改进的对自溶的抗性和/或改进的在存在至少一种胆盐的情况下的活性。在一些实施方案中,与SEQ ID NO:2的蛋白酶相比,重组蛋白酶表现出以下的改进的特性:改进的在酸性pH的稳定性和/或活性、改进的热稳定性、改进的对蛋白水解的抗性、改进的对自溶的抗性和改进的在存在至少一种胆盐的情况下的活性。在一些实施方案中,与SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶相比,重组蛋白酶表现出以下的改进的特性:改进的在酸性pH的稳定性和/或活性、改进的热稳定性、改进的对蛋白水解的抗性、改进的对自溶的抗性和/或改进的在存在至少一种胆盐的情况下的活性。在一些实施方案中,与SEQ ID NO:2的蛋白酶相比,重组蛋白酶表现出至少一种选自以下的改进的特性:改进的在酸性pH的稳定性和/或活性、改进的热稳定性、改进的对蛋白水解的抗性、改进的对自溶的抗性和/或改进的在存在至少一种胆盐的情况下的活性,以及至少一种另外的改进的特性。在一些实施方案中,与SEQ IDNO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶相比,重组蛋白酶表现出至少一种选自以下的改进的特性:改进的在酸性pH的稳定性和/或活性、改进的热稳定性、改进的对蛋白水解的抗性、改进的对自溶的抗性和/或改进的在存在至少一种胆盐的情况下的活性,以及至少一种另外的改进的特性。在一些实施方案中,与参考序列相比,重组蛋白酶表现出至少一种选自以下的改进的特性:i)增强的催化活性;ii)增加的对酸性pH的耐受性;iii)增加的对pH 3.5的耐受性;iv)增加的对pH 3的耐受性;v)增加的对至少一种蛋白酶的耐受性;vi)增加的对至少一种胆盐的耐受性;vii)增加的耐热性;viii)增加的对自溶的耐受性,或i)、ii)、iii)、iv)、v)、vi)、vii)和viii)的任何组合。在一些实施方案中,参考序列是SEQ ID NO:2,而在一些可选的实施方案中,参考序列选自SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278。在一些实施方案中,与至少一个参考序列相比,重组蛋白酶表现出至少一种选自以下的改进的特性:i)增强的催化活性;ii)增加的对酸性pH的耐受性;iii)增加的对pH 3.5的耐受性;iv)增加的对pH 3的耐受性;v)增加的对至少一种蛋白酶的耐受性;vi)增加的对至少一种胆盐的耐受性;vii)增加的耐热性;viii)增加的对自溶的耐受性;或i)、ii)、iii)、iv)、v)、vi)、vii)和viii)的任何组合。在一些实施方案中,参考序列是SEQ ID NO:2,而在一些可选的实施方案中,参考序列选自SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278。在一些实施方案中,与至少两个或更多个参考序列相比,重组蛋白酶表现出至少一种选自以下的改进的特性:i)增强的催化活性;ii)增加的对酸性pH的耐受性;iii)增加的对pH 3.5的耐受性;iv)增加的对pH 3的耐受性;v)增加的对至少一种蛋白酶的耐受性;vi)增加的对至少一种胆盐的耐受性;vii)增加的耐热性;viii)增加的对自溶的耐受性;或i)、ii)、iii)、iv)、v)、vi)、vii)和viii)的任何组合。在一些实施方案中,参考序列选自SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278。在一些此外的实施方案中,重组蛋白酶是纯化的。
在仍一些此外的实施方案中,蛋白酶在食物和/或饮料中是稳定的。在一些另外的实施方案中,蛋白酶在营养补充剂和其他补充剂中是稳定的。在一些实施方案中,补充剂是液体,而在其他实施方案中,它们是乳液、悬浮液或固体。不意图本发明受限于任何特定的食品、饮料和/或补充剂形制或形式。
编码工程化多肽的多核苷酸、表达载体和宿主细胞:
本发明提供了编码本文描述的工程化蛋白酶多肽的多核苷酸。在一些实施方案中,多核苷酸被可操作地连接至控制基因表达的一个或更多个异源调控序列,以创建能够表达多肽的重组多核苷酸。包含编码工程化蛋白酶多肽的异源多核苷酸的表达构建体可以被引入到适当的宿主细胞中以表达对应的蛋白酶多肽。
如对技术人员将是明显的,蛋白序列的可得性以及对对应于各种氨基酸的密码子的了解提供能够编码主题多肽的所有多核苷酸的说明。遗传密码子的简并性,其中相同氨基酸由可替代的密码子或同义的密码子编码,允许制备极大数目的核酸,所有这些核酸编码工程化蛋白酶多肽。因此,知道了特定的氨基酸序列后,本领域技术人员可以通过以不改变蛋白的氨基酸序列的方式简单改变一个或更多个密码子的序列来制备任何数目的不同核酸。在这方面,本发明具体地设想了可以通过基于可能的密码子选择来选择组合以制备编码本文描述的多肽的多核苷酸的每种和每一种可能的改变,并且对于本文描述的任何多肽,所有这样的改变,包括表3.1、表3.2、表3.3、表3.4、表3.5、表3.6、表3.7、表3.8、表3.9、表3.10、表3.11、表3.12、表3.13、表3.14、表3.15、表3.16、表3.17、表3.18、表3.19、表3.20、表3.21、表3.22、表3.23、表3.24、表3.25、表3.26和/或表3.27中,或者表3.8、表3.9、表3.10、表3.11、表3.12、表3.13、表3.14、表3.15、表3.16、表3.17、表3.18、表3.19、表3.20、表3.21、表3.22、表3.23、表3.24、表3.25、表3.26和/或表3.27中提供的变体,应被认为被具体地公开,其中所述变体缺少组氨酸标签和前面的氨基酸接头。
在各种实施方案中,密码子被优选地选择为适应在其中产生蛋白的宿主细胞。例如,细菌中使用的优选的密码子被用于在细菌中的表达,而真菌中使用的优选的密码子被用于在真菌中的表达。因此,编码工程化蛋白酶多肽的密码子优化的多核苷酸在全长编码区的约40%、50%、60%、70%、80%或大于90%的密码子位置处包含优选的密码子。
在一些实施方案中,本发明提供了与SEQ ID NO:1、33、189、2、291、341、381、395、399、453、561、637、679、755、811、1029、1135、1179、1249、1307、1365、1369、1423、1531、1607、1649、1725、1781、1999、2105、2149、2219和/或2277具有至少约80%、至少约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更多序列同一性的重组多核苷酸序列。在一些实施方案中,本发明提供了与SEQ ID NO:1、33、189、2、291、341、381、395、399、453、561、637、679、755、811、1029、1135、1179、1249、1307、1365、1369、1423、1531、1607、1649、1725、1781、1999、2105、2149、2219和/或2277具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的重组多核苷酸序列。在一些实施方案中,重组多核苷酸序列与SEQ ID NO:3-1361和1365-2331中的奇数编号序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性。在一些实施方案中,编码工程化蛋白酶多肽的多核苷酸包含SEQID NO:1、33、189、2、291、341、381、395、399、453、561、637、679、755、811、1029、1135、1179、1249、1307、1365、1369、1423、1531、1607、1649、1725、1781、1999、2105、2149、2219和/或2277的多核苷酸序列。
在一些实施方案中,如本文描述的,多核苷酸编码有本文公开的特性的具有蛋白酶活性的工程化多肽,其中所述多肽包含与参考序列(例如,SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278)具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性的氨基酸序列;或者如表3.1、表3.2、表3.3、表3.4、表3.5、表3.6、表3.7、表3.8、表3.9、表3.10、表3.11、表3.12、表3.13、表3.14、表3.15、表3.16、表3.17、表3.18、表3.19、表3.20、表3.21、表3.22、表3.23、表3.24、表3.25、表3.26和/或表3.27中公开的任何变体,或表3.8、表3.9、表3.10、表3.11、表3.12、表3.13、表3.14、表3.15、表3.16、表3.17、表3.18、表3.19、表3.20、表3.21、表3.22、表3.23、表3.24、表3.25、表3.26和/或表3.27中公开的任何变体的氨基酸序列,其中所述变体缺少组氨酸标签和前面的氨基酸接头;以及与以下相比的一个或更多个残基差异(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个或更多个氨基酸残基位置):SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的参考序列;或者如表格中公开的任何变体的氨基酸序列。在一些实施方案中,多核苷酸编码有本文公开的特性的具有蛋白酶活性的工程化多肽,其中当与SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的多肽进行最佳比对时,所述多肽包含与参考序列SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列;和与SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278相比,在选自表3.1、表3.2、表3.3、表3.4、表3.5、表3.6、表3.7、表3.8、表3.9、表3.10、表3.11、表3.12、表3.13、表3.14、表3.15、表3.16、表3.17、表3.18、表3.19、表3.20、表3.21、表3.22、表3.23、表3.24、表3.25、表3.26和/或表3.27中提供的残基位置的残基位置处的一个或更多个残基差异。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:2具有至少70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中所述重组蛋白酶在选自236、258、261、339、439、446和454的一个或更多个位置处包含至少一个取代或取代集,其中多肽序列的氨基酸位置参考SEQ ID NO:2来编号。在一些实施方案中,重组蛋白酶包含选自236V、258K、261L、339M、339W、439M、446A、446G、446L、446M、446T和454L的至少一个取代或取代集,其中多肽序列的氨基酸位置参考SEQ ID NO:2来编号。在一些实施方案中,重组蛋白酶包含选自M236V、Q258K、E261L、N339M、N339W、S439M、P446A、P446G、P446L、P446M、P446T和A454L的至少一个取代或取代集,其中多肽序列的氨基酸位置参考SEQ ID NO:2来编号。
在一些实施方案中,多核苷酸编码包含重组蛋白酶,所述重组蛋白酶包含与SEQID NO:2具有至少70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:107/536、162/408、168/547、208/366/504/591、208/485/526、210/223/258/552、210/241/258/599、223/241/258/599、223/429/481/533、223/481/533/552、225、225/260/263/265/544、225/262、225/362/366/591、225/366、225/482/591、244、258、258/318/429、258/449/481、258/481、261、261/504、318/481、318/533、318/599、339、342、345、362/366/485/591、363、366、366/485、366/497、366/526/591、366/591、408、427、446、448、449、450、481/533/552、482、482/485、482/591、485、485/591、533、533/552、536、544、547、549、565、615和652,其中多肽序列的氨基酸位置参考SEQ ID NO:2来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:107T/536D、162I/408R、168N/547V、208T/366G/504P/591L、208T/485D/526L、210D/223R/258K/552N、210D/241P/258K/599L、223R/241P/258K/599L、223R/429L/481S/533K、223R/481S/533K/552N、225A/260D/263H/265R/544R、225A/262L、225A/362T/366G/591L、225A/366G、225A/482V/591L、225K、244K、258K、258K/318D/429L、258K/449V/481S、258K/481S、258R、261G、261G/504V、261L、261R、261S、261V、318D/481S、318D/533K、318D/599L、339F、339W、342R、345W、362T/366G/485D/591L、363E、363W、366A、366G、366G/485D、366G/497R、366G/526L/591L、366G/591L、366L、366Q、408R、427H、427R、446R、446V、448K、448R、448W、449K、450W、481S/533K/552N、482V、482V/485D、482V/591L、485D、485D/591L、533A、533D、533E、533K、533K/552N、533N、536E、536G、536V、544R、547A、547E、549T、565C、565D、615A、615D、615G、615P、615T、615W和652I,其中多肽序列的氨基酸位置参考SEQ ID NO:2来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:M107T/Q536D、T162I/A408R、S168N/Q547V、A208T/N366G/Q504P/K591L、A208T/N485D/R526L、N210D/N223R/Q258K/K552N、N210D/E241P/Q258K/D599L、N223R/E241P/Q258K/D599L、N223R/K429L/A481S/M533K、N223R/A481S/M533K/K552N、T225A/N260D/R263H/G265R/T544R、T225A/P262L、T225A/N362T/N366G/K591L、T225A/N366G、T225A/R482V/K591L、T225K、R244K、Q258K、Q258K/Q318D/K429L、Q258K/A449V/A481S、Q258K/A481S、Q258R、E261G、E261G/Q504V、E261L、E261R、E261S、E261V、Q318D/A481S、Q318D/M533K、Q318D/D599L、N339F、N339W、L342R、Q345W、N362T/N366G/N485D/K591L、Q363E、Q363W、N366A、N366G、N366G/N485D、N366G/Q497R、N366G/R526L/K591L、N366G/K591L、N366L、N366Q、A408R、P427H、P427R、P446R、P446V、N448K、N448R、N448W、A449K、N450W、A481S/M533K/K552N、R482V、R482V/N485D、R482V/K591L、N485D、N485D/K591L、M533A、M533D、M533E、M533K、M533K/K552N、M533N、Q536E、Q536G、Q536V、T544R、Q547A、Q547E、V549T、N565C、N565D、K615A、K615D、K615G、K615P、K615T、K615W和K652I,其中多肽序列的氨基酸位置参考SEQ ID NO:2来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:34具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:258、258/261/342/345、258/261/342/504/533、258/261/345/504/549、258/261/482/504/549、258/342、258/342/504/533/536/549、258/345/427、258/408/427/504/549、258/427、258/427/482/504/533/536、258/427/482/536、261/342/345/536、261/342/482/504/533/536、261/342/482/504/549、261/342/482/536、261/342/533、261/482、318/339/362/544/547、318/339/448/544、318/339/547、318/448/544/615、339/362/363/544/547/615、339/362/544、339/448、339/448/547、339/544/547、342、342/408、342/408/536、342/482/536、362/363/544/547、362/448、363/544/547、427/482/504/533/536、427/533/536/549、448、448/544和448/544/547/615,其中多肽序列的氨基酸位置参考SEQ ID NO:34来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:258K、258K/261L/342R/345W、258K/261L/342R/504P/533D、258K/261L/345W/504P/549T、258K/261R/482V/504P/549T、258K/342R、258K/342R/504P/533K/536E/549T、258K/345W/427R、258K/408R/427R/504P/549T、258K/427R、258K/427R/482V/504P/533K/536E、258K/427R/482V/536E、261L/342R/345W/536E、261L/342R/482V/504P/533K/536E、261L/342R/533D、261R/342R/482V/504P/549T、261R/342R/482V/536E、261R/482V、318D/339W/362T/544R/547E、318D/339W/448R/544R、318D/339W/547E、318D/448R/544R/615A、339W/362T/363E/544R/547E/615A、339W/362T/544R、339W/448K、339W/448R、339W/448R/547E、339W/544R/547E、342R、342R/408R、342R/408R/536E、342R/482V/536E、362T/363E/544R/547E、362T/448R、363E/544R/547E、427R/482V/504P/533D/536E、427R/533K/536E/549T、448R、448R/544R和448R/544R/547E/615A,其中多肽序列的氨基酸位置参考SEQ ID NO:34来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:Q258K、Q258K/E261L/L342R/Q345W、Q258K/E261L/L342R/Q504P/M533D、Q258K/E261L/Q345W/Q504P/V549T、Q258K/E261R/R482V/Q504P/V549T、Q258K/L342R、Q258K/L342R/Q504P/M533K/Q536E/V549T、Q258K/Q345W/P427R、Q258K/A408R/P427R/Q504P/V549T、Q258K/P427R、Q258K/P427R/R482V/Q504P/M533K/Q536E、Q258K/P427R/R482V/Q536E、E261L/L342R/Q345W/Q536E、E261L/L342R/R482V/Q504P/M533K/Q536E、E261L/L342R/M533D、E261R/L342R/R482V/Q504P/V549T、E261R/L342R/R482V/Q536E、E261R/R482V、Q318D/N339W/N362T/T544R/Q547E、Q318D/N339W/N448R/T544R、Q318D/N339W/Q547E、Q318D/N448R/T544R/K615A、N339W/N362T/Q363E/T544R/Q547E/K615A、N339W/N362T/T544R、N339W/N448K、N339W/N448R、N339W/N448R/Q547E、N339W/T544R/Q547E、L342R、L342R/A408R、L342R/A408R/Q536E、L342R/R482V/Q536E、N362T/Q363E/T544R/Q547E、N362T/N448R、Q363E/T544R/Q547E、P427R/R482V/Q504P/M533D/Q536E、P427R/M533K/Q536E/V549T、N448R、N448R/T544R和N448R/T544R/Q547E/K615A,其中多肽序列的氨基酸位置参考SEQ ID NO:34来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:190具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自205、505、541、556和646的一个或更多个位置处包含至少一个取代或取代集,其中多肽序列的氨基酸位置参考SEQ ID NO:190来编号。在一些实施方案中,编码的重组蛋白酶包含选自205Q、205T、505A、541R、556V、646L和646V的至少一个取代或取代集,其中多肽序列的氨基酸位置参考SEQ ID NO:190来编号。在一些实施方案中,编码的重组蛋白酶包含选自S205Q、S205T、Q505A、S541R、T556V、A646L和A646V的至少一个取代或取代集,其中多肽序列的氨基酸位置参考SEQ ID NO:190来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:292具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:205/442/505/536/545/620/646、205/505/536/541/545/547/558/646/665、258、263、355/536/545/547、359、366、446、449、505/536/545/558/646、506、555、556、620和650,其中多肽序列的氨基酸位置参考SEQ ID NO:292来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:205R/442L/505A/536W/545I/620V/646V、205R/505A/536W/541I/545R/547E/558E/646V/665E、258G、263M、263S、355R/536W/545I/547E、359Y、366S、446P、449L、505A/536W/545I/558E/646V、506R、555D、555G、555L、556G、620L、620Q、620S和650T,其中多肽序列的氨基酸位置参考SEQ ID NO:292来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:S205R/V442L/Q505A/Q536W/A545I/E620V/A646V、S205R/Q505A/Q536W/S541I/A545R/Q547E/T558E/A646V/P665E、K258G、R263M、R263S、L355R/Q536W/A545I/Q547E、F359Y、N366S、R446P、A449L、Q505A/Q536W/A545I/T558E/A646V、G506R、E555D、E555G、E555L、T556G、E620L、E620Q、E620S和I650T,其中多肽序列的氨基酸位置参考SEQ ID NO:292来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:342具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:283/319/359/449/450/506、283/345/359/449/450/553/555、283/449/450/508/541/553/555、449/450、450/508/553/555/558、508和508/541/553,其中多肽序列的氨基酸位置参考SEQ ID NO:342来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:283H/345C/359Y/449L/450R/553T/555G、283L/319K/359Y/449L/450R/506R、283L/449L/450R/508G/541I/553T/555G、449L/450R、450R/508G/553R/555G/558E、508G和508G/541I/553T,其中多肽序列的氨基酸位置参考SEQ ID NO:342来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:N283H/Q345C/F359Y/A449L/N450R/D553T/E555G、N283L/N319K/F359Y/A449L/N450R/G506R、N283L/A449L/N450R/N508G/S541I/D553T/E555G、A449L/N450R、N450R/N508G/D553R/E555G/T558E、N508G和N508G/S541I/D553T,其中多肽序列的氨基酸位置参考SEQ ID NO:342来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:396或1366具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:205、205/442/449/450、205/450/536/545、205/450/536/545/646、258/442/446、258/442/449/646、258/450/536/545、308、361、439、442/446/536/545/620/646、442/450/536/545、514、535、577、591、592、610、639、643和644,其中多肽序列的氨基酸位置参考SEQ ID NO:396或1366来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:205S、205S/442V/449A/450N、205S/450N/536Q/545A、205S/450N/536Q/545A/646A、258Q/442V/446P、258Q/442V/449A/646A、258Q/450N/536Q/545A、308E、361V、439M、442V/446P/536Q/545A/620E/646A、442V/450N/536Q/545A、514H、535R、535V、577V、591R、591V、592P、610L、610P、610S、639E、639K、643E、643R和644A,其中多肽序列的氨基酸位置参考SEQ ID NO:396或1366来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:R205S、R205S/L442V/L449A/R450N、R205S/R450N/W536Q/I545A、R205S/R450N/W536Q/I545A/V646A、K258Q/L442V/R446P、K258Q/L442V/L449A/V646A、K258Q/R450N/W536Q/I545A、A308E、I361V、S439M、L442V/R446P/W536Q/I545A/V620E/V646A、L442V/R450N/W536Q/I545A、R514H、E535R、E535V、D577V、K591R、K591V、A592P、A610L、A610P、A610S、A639E、A639K、A643E、A643R和D644A,其中多肽序列的氨基酸位置参考SEQ ID NO:396或1366来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:400或1370具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:32/490/639、236、236/238/404/480/555/568/592、236/359/404/406/555/639、236/359/490/581/639、236/359/555、236/359/609、236/370/406/568/581、236/370/568/592、236/370/581、236/404/406/480/490、236/404/555/581/609/639、236/568、236/592、236/639、238/359/370/404/490/568/639、245/363/408/512/514/596/666、245/363/512/514/537/560、308/514/535/639/644、359/404、359/404/406/490/546/581、363/408/512/514/537、363/408/601/650、363/639/644、408/512、408/514/537、408/514/560/650、490/568/592/639、512/537/560/601、514/535/546/575/644、514/639/644、514/644、535/575/639/644、535/639/643/644、535/643/644和601/650,其中多肽序列的氨基酸位置参考SEQ ID NO:400或1370来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:32T/490E/639T、236V、236V/238I/404G/480L/555Q/568P/592P、236V/359Y/404G/406R/555Q/639T、236V/359Y/490E/581T/639T、236V/359Y/555Q、236V/359Y/609G、236V/370C/406R/568P/581T、236V/370C/568P/592P、236V/370C/581T、236V/404G/406R/480L/490E、236V/404G/555Q/581T/609G/639T、236V/568P、236V/592P、236V/639T、238I/359Y/370C/404G/490E/568P/639T、245S/363K/408V/512N/514H/596T/666D、245S/363K/512N/514H/537P/560S、308E/514H/535R/639K/644A、359Y/404G、359Y/404G/406R/490E/546E/581T、363H/639K/644A、363K/408V/512N/514H/537P、363K/408V/601I/650T、408V/512N、408V/514H/537P、408V/514H/560S/650T、490E/568P/592P/639T、512N/537P/560S/601I、514H/535R/546E/575G/644A、514H/639K/644A、514H/644A、535R/575G/639K/644A、535R/639K/643R/644A、535V/643R/644A和601I/650T,其中多肽序列的氨基酸位置参考SEQ ID NO:400或1370来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:I32T/Q490E/A639T、M236V、M236V/L238I/S404G/I480L/E555Q/L568P/A592P、M236V/F359Y/S404G/K406R/E555Q/A639T、M236V/F359Y/Q490E/S581T/A639T、M236V/F359Y/E555Q、M236V/F359Y/A609G、M236V/S370C/K406R/L568P/S581T、M236V/S370C/L568P/A592P、M236V/S370C/S581T、M236V/S404G/K406R/I480L/Q490E、M236V/S404G/E555Q/S581T/A609G/A639T、M236V/L568P、M236V/A592P、M236V/A639T、L238I/F359Y/S370C/S404G/Q490E/L568P/A639T、T245S/Q363K/A408V/S512N/R514H/M596T/S666D、T245S/Q363K/S512N/R514H/E537P/T560S、A308E/R514H/E535R/A639K/D644A、F359Y/S404G、F359Y/S404G/K406R/Q490E/V546E/S581T、Q363H/A639K/D644A、Q363K/A408V/S512N/R514H/E537P、Q363K/A408V/M601I/I650T、A408V/S512N、A408V/R514H/E537P、A408V/R514H/T560S/I650T、Q490E/L568P/A592P/A639T、S512N/E537P/T560S/M601I、R514H/E535R/V546E/S575G/D644A、R514H/A639K/D644A、R514H/D644A、E535R/S575G/A639K/D644A、E535R/A639K/A643R/D644A、E535V/A643R/D644A和M601I/I650T,其中多肽序列的氨基酸位置参考SEQ ID NO:400或1370来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:454或1424具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置包含至少一个取代或取代集:236、236/308/370/548、236/308/490/581/643、236/308/555/560/596、236/370、236/370/490/639、236/555、236/560/581、245/359/363/406/535/650、245/363/406/575/601/666、300、301、308、308/490/560/581/639/643、336、359/363/406/535/601/650、359/404/406/535、359/406/575/650/666、359/535/575/601、363/404/406/535/568、404/406/535、406、406/480/535/568/601、406/535/575、468和480/575/601/650,其中多肽序列的氨基酸位置参考SEQ IDNO:454或1424来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:236V、236V/308E/370C/548E、236V/308E/490E/581T/643R、236V/308E/555Q/560S/596T、236V/370C、236V/370C/490E/639T、236V/555Q、236V/560S/581T、245S/359Y/363K/406R/535R/650T、245S/363K/406R/575G/601I/666D、300F、301V、308E、308E/490E/560S/581T/639T/643R、336W、359Y/363K/406R/535R/601I/650T、359Y/404G/406R/535R、359Y/406R/575G/650T/666D、359Y/535R/575G/601I、363K/404G/406R/535R/568P、404G/406R/535R、406R、406R/480L/535R/568P/601I、406R/535R/575G、468S和480L/575G/601I/650T,其中多肽序列的氨基酸位置参考SEQ ID NO:454或1424来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:M236V、M236V/A308E/S370C/D548E、M236V/A308E/Q490E/S581T/A643R、M236V/A308E/E555Q/T560S/M596T、M236V/S370C、M236V/S370C/Q490E/A639T、M236V/E555Q、M236V/T560S/S581T、T245S/F359Y/Q363K/K406R/E535R/I650T、T245S/Q363K/K406R/S575G/M601I/S666D、L300F、A301V、A308E、A308E/Q490E/T560S/S581T/A639T/A643R、Y336W、F359Y/Q363K/K406R/E535R/M601I/I650T、F359Y/S404G/K406R/E535R、F359Y/K406R/S575G/I650T/S666D、F359Y/E535R/S575G/M601I、Q363K/S404G/K406R/E535R/L568P、S404G/K406R/E535R、K406R、K406R/I480L/E535R/L568P/M601I、K406R/E535R/S575G、A468S和I480L/S575G/M601I/I650T,其中多肽序列的氨基酸位置参考SEQ ID NO:454或1424来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:562或1532具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:133/301/346/347/468、205/236/347、205/236/370/490/537/620、205/342/439/442/514/620/639、205/370/537、205/442/505/620、236/258/370/505/545/639、236/339/514、236/370/450/620、236/545、258/339/342/505/537、258/342/370/408/442/537、300/301/308/346/347/468、300/301/347/468、301/308/336/346/406/468/601、301/308/346/406/468、301/308/468/601、301/347/406、308/336/347/468、308/347/468、342、342/408/490/505/514/545/639/646、342/620、370/442、370/537/639、489、539/649、542、543、543/673、558、559、566、634和661,其中多肽序列的氨基酸位置参考SEQ ID NO:562或1532来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:133M/301V/346K/347F/468S、205S/236M/347F、205S/236M/370S/490Q/537E/620E、205S/342L/439S/442V/514R/620E/639A、205S/370S/537E、205S/442V/505Q/620E、236M/258Q/370S/505Q/545A/639A、236M/339N/514R、236M/370S/450N/620E、236M/545A、258Q/339N/342L/505Q/537E、258Q/342L/370S/408A/442V/537E、300F/301V/308E/346K/347F/468S、300F/301V/347F/468S、301V/308E/336W/346K/406R/468S/601I、301V/308E/346K/406R/468S、301V/308E/468S/601I、301V/347F/406R、308E/336W/347F/468S、308E/347F/468S、342L、342L/408A/490Q/505Q/514R/545A/639A/646A、342L/620E、370S/442V、370S/537E/639A、489Y、539M/649H、542M、543A、543V/673Y、558R、559H、559S、566G、634C和661D,其中多肽序列的氨基酸位置参考SEQID NO:562或1532来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:L133M/A301V/V346K/V347F/A468S、R205S/V236M/V347F、R205S/V236M/C370S/E490Q/P537E/V620E、R205S/R342L/M439S/L442V/H514R/V620E/T639A、R205S/C370S/P537E、R205S/L442V/A505Q/V620E、V236M/K258Q/C370S/A505Q/I545A/T639A、V236M/W339N/H514R、V236M/C370S/R450N/V620E、V236M/I545A、K258Q/W339N/R342L/A505Q/P537E、K258Q/R342L/C370S/V408A/L442V/P537E、L300F/A301V/A308E/V346K/V347F/A468S、L300F/A301V/V347F/A468S、A301V/A308E/Y336W/V346K/K406R/A468S/M601I、A301V/A308E/V346K/K406R/A468S、A301V/A308E/A468S/M601I、A301V/V347F/K406R、A308E/Y336W/V347F/A468S、A308E/V347F/A468S、R342L、R342L/V408A/E490Q/A505Q/H514R/I545A/T639A/V646A、R342L/V620E、C370S/L442V、C370S/P537E/T639A、D489Y、P539M/D649H、I542M、F543A、F543V/H673Y、T558R、L559H、L559S、T566G、P634C和G661D,其中多肽序列的氨基酸位置参考SEQ ID NO:562或1532来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:562或1532具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:205/236/342/439/505/514/537/545、236/342/505/514/537/545、300/301/308/336/347/468/601、300/301/347/406、301/308/346/347/468、301/336/346/347/406/601和308/336/347/406/468/601,其中多肽序列的氨基酸位置参考SEQ ID NO:562或1532来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:205S/236M/342L/439S/505Q/514R/537E/545A、236M/342L/505Q/514R/537E/545A、300F/301V/308E/336W/347F/468S/601I、300F/301V/347F/406R、301V/308E/346K/347F/468S、301V/336W/346K/347F/406R/601I和308E/336W/347F/406R/468S/601I,其中多肽序列的氨基酸位置参考SEQ ID NO:562或1532来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:R205S/V236M/R342L/M439S/A505Q/H514R/P537E/I545A、V236M/R342L/A505Q/H514R/P537E/I545A、L300F/A301V/A308E/Y336W/V347F/A468S/M601I、L300F/A301V/V347F/K406R、A301V/A308E/V346K/V347F/A468S、A301V/Y336W/V346K/V347F/K406R/M601I和A308E/Y336W/V347F/K406R/A468S/M601I,其中多肽序列的氨基酸位置参考SEQ ID NO:562或1532来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:638或1532具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:346/511/537、346/511/537/541/543、346/511/542/582、346/511/581/582、346/511/583、346/529/571/581/582/583/589、511/537、516/539/568、537/582、539、568/662/663和581/582,其中多肽序列的氨基酸位置参考SEQ ID NO:638或1532来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:346V/511S/537E、346V/511S/537E/541I/543G、346V/511S/542S/582R、346V/511S/581L/582R、346V/511S/583R、346V/529G/571I/581C/582V/583V/589A、511S/537E、516M/539E/568R、537E/582R、539E、568R/662W/663W和581L/582R,其中多肽序列的氨基酸位置参考SEQ ID NO:638或1532来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:K346V/A511S/P537E、K346V/A511S/P537E/S541I/F543G、K346V/A511S/I542S/Y582R、K346V/A511S/S581L/Y582R、K346V/A511S/I583R、K346V/V529G/S571I/S581C/Y582V/I583V/T589A、A511S/P537E、P516M/P539E/L568R、P537E/Y582R、P539E、L568R/F662W/E663W和S581L/Y582R,其中多肽序列的氨基酸位置参考SEQ ID NO:638或1532来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:638或1608具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:346/511/537/582、346/511/543/582、346/511/544、346/537/542/544、346/543/544、346/583、511/537/542/582/583、516、516/539/555、537/543/582、539/568、540、542/544/581、548、549、559、559/568、582、647、650和664,其中多肽序列的氨基酸位置参考SEQ ID NO:638或1608来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:346V/511S/537E/582V、346V/511S/543G/582R、346V/511S/544L、346V/537E/542S/544L、346V/543G/544L、346V/583R、511S/537E/542S/582R/583R、516M、516M/539E/555G、537E/543G/582R、539E/568R、540G、542S/544L/581R、548R、549G、559S、559S/568R、582V、647L、647W、650G和664R,其中多肽序列的氨基酸位置参考SEQ ID NO:638或1608来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:K346V/A511S/P537E/Y582V、K346V/A511S/F543G/Y582R、K346V/A511S/T544L、K346V/P537E/I542S/T544L、K346V/F543G/T544L、K346V/I583R、A511S/P537E/I542S/Y582R/I583R、P516M、P516M/P539E/E555G、P537E/F543G/Y582R、P539E/L568R、V540G、I542S/T544L/S581R、D548R、V549G、L559S、L559S/L568R、Y582V、Q647L、Q647W、I650G和Q664R,其中多肽序列的氨基酸位置参考SEQ ID NO:638或1608来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:680或1650具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:261/355/543、261/355/567/568、261/489、261/489/511/568、261/489/539、261/489/567、261/539/543、261/539/543/567、261/542/543/568、511、511/539/543、511/567、543和583,其中多肽序列的氨基酸位置参考SEQ ID NO:680或1650来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:261D/355C/543A、261D/355C/567R/568R、261D/489E、261D/489E/511D/568R、261D/489E/539L、261D/489E/567R、261D/539L/543A、261D/539L/543D/567R、261D/542L/543A/568R、511D、511D/539L/543A、511D/567R、543A和583E,其中多肽序列的氨基酸位置参考SEQ ID NO:680或1650来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:L261D/L355C/F543A、L261D/L355C/D567R/L568R、L261D/D489E、L261D/D489E/A511D/L568R、L261D/D489E/P539L、L261D/D489E/D567R、L261D/P539L/F543A、L261D/P539L/F543D/D567R、L261D/I542L/F543A/L568R、A511D、A511D/P539L/F543A、A511D/D567R、F543A和I583E,其中多肽序列的氨基酸位置参考SEQ ID NO:680或1650来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:756或1726具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:9、9/17/34/35/93/554、9/17/50、9/17/93、9/29/35/43/77/542/554、9/32/77/93、9/43/77、9/50/63/93、9/93、17/29/34/35/36/77/93、17/32/34/35、17/77、32/34/93、43、50/77/93、50/93、77/93、93、205/263/470、205/344/470/565、205/345/470/538/664、205/470/545/568/645/647/664、205/470/567/568/645、263/344/664、263/470/645、263/489、263/539/541/568/645、344/355/470/489/645、344/355/470/568/645/647、344/470/489/539/542/645/647/664、344/470/489/567/568、344/470/568、344/470/647、470、470/489、470/541/542/543/565/645/647、470/567/568、470/664和542/543,其中多肽序列的氨基酸位置参考SEQ IDNO:756或1726来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:9K、9K/17A/34M/35G/93E/554M、9K/17A/50S、9K/17A/93E、9K/29S/35G/43P/77D/542V/554M、9K/32A/77D/93E、9K/43P/77D、9K/50S/63E/93E、9K/93E、9Q/17A/93E、17A/29S/34M/35G/36D/77D/93E、17A/32A/34M/35G、17A/77D、32A/34M/93E、43P、50S/77D/93E、50S/93E、77D/93E、93E、205L/263V/470Q、205L/344V/470Q/565A、205L/345P/470Q/538T/664R、205L/470Q/545L/568R/645S/647W/664R、205L/470Q/567R/568R/645S、263I/344V/664R、263I/470Q/645S、263I/489D、263I/539L/541R/568R/645S、344V/355C/470Q/489D/645S、344V/355C/470Q/568R/645S/647W、344V/470Q/489D/539L/542L/645S/647W/664R、344V/470Q/489D/567R/568R、344V/470Q/568R、344V/470Q/647W、470Q、470Q/489D、470Q/541R/542L/543A/565A/645S/647W、470Q/567R/568R、470Q/664R和542L/543A,其中多肽序列的氨基酸位置参考SEQ ID NO:756或1726来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:R9K、R9K/T17A/T34M/E35G/A93E/L554M、R9K/T17A/N50S、R9K/T17A/A93E、R9K/N29S/E35G/S43P/N77D/I542V/L554M、R9K/I32A/N77D/A93E、R9K/S43P/N77D、R9K/N50S/A63E/A93E、R9K/A93E、R9Q/T17A/A93E、T17A/N29S/T34M/E35G/T36D/N77D/A93E、T17A/I32A/T34M/E35G、T17A/N77D、I32A/T34M/A93E、S43P、N50S/N77D/A93E、N50S/A93E、N77D/A93E、A93E、R205L/R263V/P470Q、R205L/N344V/P470Q/N565A、R205L/Q345P/P470Q/S538T/Q664R、R205L/P470Q/I545L/L568R/K645S/Q647W/Q664R、R205L/P470Q/D567R/L568R/K645S、R263I/N344V/Q664R、R263I/P470Q/K645S、R263I/E489D、R263I/P539L/S541R/L568R/K645S、N344V/L355C/P470Q/E489D/K645S、N344V/L355C/P470Q/L568R/K645S/Q647W、N344V/P470Q/E489D/P539L/I542L/K645S/Q647W/Q664R、N344V/P470Q/E489D/D567R/L568R、N344V/P470Q/L568R、N344V/P470Q/Q647W、P470Q、P470Q/E489D、P470Q/S541R/I542L/F543A/N565A/K645S/Q647W、P470Q/D567R/L568R、P470Q/Q664R和I542L/F543A,其中多肽序列的氨基酸位置参考SEQ ID NO:756或1726来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:756或1726具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:9/17/32/34/36/50/77/107/127、9/17/63/77、9/43/93/127、9/63/93/107、17/29/32/34/36/63、29/34/35/77、32/43/93、35/93/145和205/263/489/647,其中多肽序列的氨基酸位置参考SEQ IDNO:756或1726来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:9K/17A/32A/34M/36D/50S/77D/107K/127S、9K/17A/63E/77D、9K/43P/93E/127S、9K/63E/93E/107K、17A/29S/32A/34M/36D/63E、29S/34M/35G/77D、32A/43P/93E、35G/93E/145E和205L/263V/489D/647W,其中多肽序列的氨基酸位置参考SEQ ID NO:756或1726来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:R9K/T17A/I32A/T34M/T36D/N50S/N77D/M107K/G127S、R9K/T17A/A63E/N77D、R9K/S43P/A93E/G127S、R9K/A63E/A93E/M107K、T17A/N29S/I32A/T34M/T36D/A63E、N29S/T34M/E35G/N77D、I32A/S43P/A93E、E35G/A93E/G145E和R205L/R263V/E489D/Q647W,其中多肽序列的氨基酸位置参考SEQ ID NO:756或1726来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:188、189、265、266、334、442、454、646和649,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:188W、189A、189P、265R、266E、266G、334I、442V、454L、454M、454S、646I、646M、646R、649T和649Y,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:N188W、K189A、K189P、G265R、N266E、N266G、V334I、L442V、A454L、A454M、A454S、V646I、V646M、V646R、D649T和D649Y,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:189、266、266/283、546、594和646,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:189I、266A、266L、266L/283K、266M、266S、266V、266W、266Y、546L、594A和646L,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:K189I、N266A、N266L、N266L/N283K、N266M、N266S、N266V、N266W、N266Y、V546L、V594A和V646L,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:263/470/568、266、470/542/543/664和558/577/594,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:263I/470P/568R、266R、470P/542L/543A/664Q和558E/577V/594A,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:R263I/Q470P/L568R、N266R、Q470P/I542L/F543A/R664Q和T558E/D577V/V594A,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:812或1782具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:29、29/35、29/35/342/581/582/664、29/50/511/539/581、35、35/50/205/406/511/581、35/205/511、35/342/346/511/539/581、35/346、35/346/406/511/581/582/664、35/511、35/539、50/342、132、133、143、147、187、188、257、258、263、294、294/441/527、308/342/511/581/582、342、346、398、406/664、429/652、441、441/446/526、446/652、482、505、511、526、527、536、545、581、582、615、620、639、645、646、648、652、654和664,其中多肽序列的氨基酸位置参考SEQID NO:812或1782来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:29F、29G、29S/35G、29S/35G/342L/581S/582Y/664Q、29S/50S/511S/539L/581S、35D/511S、35G、35G/50S/205S/406R/511S/581S、35G/205S/511S、35G/342L/346V/511S/539L/581S、35G/346V、35G/346V/406R/511S/581S/582Y/664Q、35G/511S、35G/539L、50S/342L、132T、133V、143H、147T、187G、188T、257L、258H、258N、263S、294A、294A/441A/527A、308A/342L/511S/581S/582Y、342F、346V、398G、406R/664Q、429L/652T、441A、441A/446P/526L、441V、446P/652T、482V、505F、505M、511S、526V、527D、527R、536H、536R、545V、581A、581S、582G、582S、582Y、615Q、620E、639E、639I、645E、645G、645W、646G、646R、648Q、648V、652L、652Q、652T、652Y、654C、664G、664V和664W,其中多肽序列的氨基酸位置参考SEQID NO:812或1782来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:N29F、N29G、N29S/E35G、N29S/E35G/R342L/L581S/R582Y/R664Q、N29S/N50S/A511S/P539L/L581S、E35D/A511S、E35G、E35G/N50S/R205S/K406R/A511S/L581S、E35G/R205S/A511S、E35G/R342L/K346V/A511S/P539L/L581S、E35G/K346V、E35G/K346V/K406R/A511S/L581S/R582Y/R664Q、E35G/A511S、E35G/P539L、N50S/R342L、I132T、L133V、E143H、A147T、I187G、N188T、R257L、K258H、K258N、R263S、R294A、R294A/R441A/K527A、E308A/R342L/A511S/L581S/R582Y、R342F、K346V、A398G、K406R/R664Q、K429L/K652T、R441A、R441A/R446P/R526L、R441V、R446P/K652T、R482V、A505F、A505M、A511S、R526V、K527D、K527R、W536H、W536R、I545V、L581A、L581S、R582G、R582S、R582Y、K615Q、V620E、T639E、T639I、K645E、K645G、K645W、V646G、V646R、R648Q、R648V、K652L、K652Q、K652T、K652Y、R654C、R664G、R664V和R664W,其中多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:1030或2000具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:29、29/143/263/266/441/639、29/263/266、29/263/266/441/620、29/266/441、29/441/639、30、37、47/570、75、81、85、92、135、143、143/263/266/639、143/266/441/620/639、168、189/424、237/527、244、258/342/582/648、263、263/266/441、263/266/639、266/441、266/441/620/639、266/620/639、266/639、267、342/526/664、342/545、342/582、429、441、482、495、501、523、526、527、568、570、573、581、582、616、632、648、653和654,其中多肽序列的氨基酸位置参考SEQ ID NO:1030或2000来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:29G/143H/263S/266A/441V/639I、29G/263S/266A、29G/263S/266L/441A/620E、29G/266A/441A、29G/441V/639V、29S、30G、37L、47G/570E、75N、75S、81N、85L、92L、135E、143H/263S/266A/639V、143H/266A/441V/620E/639V、143Q、168E、189Q/424G、237E/527V、244S、258H/342F/582S/648Q、263S/266A/441A、263S/266A/441V、263S/266A/639V、263T、266A/441V/620E/639V、266A/620E/639I、266A/639I、266L/441A、267G、342F/526V/664G、342F/545V、342F/582G、429P、441E、482V、495L、501Q、523V、526E、527E、527L、527M、527R、527T、568P、570E、573T、581T、582F、616T、632Q、648A、653I和654V,其中多肽序列的氨基酸位置参考SEQ ID NO:1030或2000来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:N29G/E143H/R263S/N266A/R441V/T639I、N29G/R263S/N266A、N29G/R263S/N266L/R441A/V620E、N29G/N266A/R441A、N29G/R441V/T639V、N29S、R30G、R37L、E47G/K570E、R75N、R75S、R81N、R85L、P92L、R135E、E143H/R263S/N266A/T639V、E143H/N266A/R441V/V620E/T639V、E143Q、S168E、K189Q/D424G、D237E/K527V、R244S、K258H/L342F/R582S/R648Q、R263S/N266A/R441A、R263S/N266A/R441V、R263S/N266A/T639V、R263T、N266A/R441V/V620E/T639V、N266A/V620E/T639I、N266A/T639I、N266L/R441A、R267G、L342F/R526V/R664G、L342F/I545V、L342F/R582G、K429P、R441E、R482V、I495L、R501Q、M523V、R526E、K527E、K527L、K527M、K527R、K527T、L568P、K570E、K573T、S581T、R582F、K616T、K632Q、R648A、M653I和R654V,其中多肽序列的氨基酸位置参考SEQ ID NO:1030或2000来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:1136或2106具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:29、29/30、29/30/143/263/482/646、29/30/263、29/30/616/648、29/75/263/568/570/648、29/168/648、29/263/527/568、75、75/143/168/527、75/168、75/616、143、168/247/482/648、168/263/616、168/482/616、168/495/616、263、263/616、429/545、495和527,其中多肽序列的氨基酸位置参考SEQ ID NO:1136或2106来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:29S、29S/30G、29S/30G/143Q/263T/482V/646E、29S/30G/263T、29S/30G/616T/648A、29S/75S/263T/568P/570E/648A、29S/168E/648A、29S/263T/527L/568P、75S、75S/143Q/168E/527L、75S/168E、75S/616T、143Q、168E/247S/482V/648A、168E/263T/616T、168E/482V/616T、168E/495L/616T、263T、263T/616T、429P/545V、495L和527T,其中多肽序列的氨基酸位置参考SEQ ID NO:1136或2106来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:N29S、N29S/R30G、N29S/R30G/E143Q/S263T/R482V/V646E、N29S/R30G/S263T、N29S/R30G/K616T/R648A、N29S/R75S/S263T/L568P/K570E/R648A、N29S/S168E/R648A、N29S/S263T/K527L/L568P、R75S、R75S/E143Q/S168E/K527L、R75S/S168E、R75S/K616T、E143Q、S168E/G247S/R482V/R648A、S168E/S263T/K616T、S168E/R482V/K616T、S168E/I495L/K616T、S263T、S263T/K616T、K429P/I545V、I495L和K527T,其中多肽序列的氨基酸位置参考SEQ ID NO:1136或2106来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:1136或2106具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:207、222、266、307、454、535、546、548、580、604和610,其中多肽序列的氨基酸位置参考SEQ ID NO:1136或2106来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:207R、222T、266K、307L、454L、535V、546R、548S、580C、604P和610R,其中多肽序列的氨基酸位置参考SEQ ID NO:1136或2106来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:Q207R、S222T、A266K、Q307L、A454L、E535V、V546R、D548S、H580C、H604P和A610R,其中多肽序列的氨基酸位置参考SEQ ID NO:1136或2106来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:1180或2150具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:75/168/207/454/568/586/610/648/659、75/168/266/454/546/570/580、75/207/454/570/659、75/207/546/580/648、75/263/454/548/568/604/648、75/266/454、75/454、75/454/546/548/568/604、75/546/548/610/648、168/207/263/454/568/570/604、168/263/266/546/604、168/454/604、207/604/610、209、212、221、223、228、266/454/568、319、373、412/546/554、431、454、454/546/568/570/580、454/546/570、454/570/580/610、454/580、454/659和506,其中多肽序列的氨基酸位置参考SEQ ID NO:1180或2150来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:75S/168E/207R/454L/568P/586V/610R/648A/659T、75S/168E/266K/454L/546R/570E/580C、75S/207R/454L/570E/659T、75S/207R/546R/580C/648A、75S/263T/454L/548S/568P/604P/648A、75S/266K/454L、75S/454L、75S/454L/546R/548S/568P/604P、75S/546R/548S/610R/648A、168E/207R/263T/454L/568P/570E/604P、168E/263T/266K/546R/604P、168E/454L/604P、207R/604P/610R、209V、212S、221I、223Q、228I、228V、266K/454L/568P、319Q、373F、412Y/546L/554M、431T、454I、454L/546R/568P/570E/580C、454L/546R/570E、454L/570E/580C/610R、454L/580C、454L/659T和506N,其中多肽序列的氨基酸位置参考SEQ ID NO:1180或2150来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:R75S/S168E/Q207R/A454L/L568P/L586V/A610R/R648A/E659T、R75S/S168E/A266K/A454L/V546R/K570E/H580C、R75S/Q207R/A454L/K570E/E659T、R75S/Q207R/V546R/H580C/R648A、R75S/S263T/A454L/D548S/L568P/H604P/R648A、R75S/A266K/A454L、R75S/A454L、R75S/A454L/V546R/D548S/L568P/H604P、R75S/V546R/D548S/A610R/R648A、S168E/Q207R/S263T/A454L/L568P/K570E/H604P、S168E/S263T/A266K/V546R/H604P、S168E/A454L/H604P、Q207R/H604P/A610R、I209V、D212S、L221I、N223Q、T228I、T228V、A266K/A454L/L568P、N319Q、L373F、F412Y/V546L/L554M、P431T、A454I、A454L/V546R/L568P/K570E/H580C、A454L/V546R/K570E、A454L/K570E/H580C/A610R、A454L/H580C、A454L/E659T和G506N,其中多肽序列的氨基酸位置参考SEQ ID NO:1180或2150来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:1250或2220具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:75/189/373/582、75/200/212/431/482、75/212/373/431/482、75/212/431/482/568/615/664、75/368/582、75/373/431/526/582、75/431/482/570/604/664、75/632、189/212/431/568/570、200/205/373/431、200/431/482/615/664、200/482/664、212/228/431、212/228/568/570/582/664、212/373/446/482/582、368/373/431、373/431/570/604/664、373/568/632、431、431/604/664、482/582、582和615/652/664,其中多肽序列的氨基酸位置参考SEQ ID NO:1250或2220来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:75S/189A/373F/582G、75S/200W/212S/431T/482S、75S/212S/373F/431T/482S、75S/212S/431T/482S/568P/615M/664G、75S/368M/582G、75S/373F/431T/526E/582G、75S/431T/482S/570K/604P/664G、75S/632Q、189A/212S/431T/568P/570K、200W/205S/373F/431T、200W/431T/482S/615M/664G、200W/482S/664W、212S/228V/431T、212S/228V/568P/570K/582G/664W、212S/373F/446F/482S/582G、368M/373F/431T、373F/431T/570K/604P/664W、373F/568P/632Q、431T、431T/604P/664G、482S/582G、582G和615M/652V/664G,其中多肽序列的氨基酸位置参考SEQ ID NO:1250或2220来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:R75S/K189A/L373F/R582G、R75S/K200W/D212S/P431T/R482S、R75S/D212S/L373F/P431T/R482S、R75S/D212S/P431T/R482S/L568P/K615M/R664G、R75S/K368M/R582G、R75S/L373F/P431T/R526E/R582G、R75S/P431T/R482S/E570K/H604P/R664G、R75S/K632Q、K189A/D212S/P431T/L568P/E570K、K200W/R205S/L373F/P431T、K200W/P431T/R482S/K615M/R664G、K200W/R482S/R664W、D212S/T228V/P431T、D212S/T228V/L568P/E570K/R582G/R664W、D212S/L373F/R446F/R482S/R582G、K368M/L373F/P431T、L373F/P431T/E570K/H604P/R664W、L373F/L568P/K632Q、P431T、P431T/H604P/R664G、R482S/R582G、R582G和K615M/K652V/R664G,其中多肽序列的氨基酸位置参考SEQ IDNO:1250或2220来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:1308或2278具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列或其功能片段,并且其中编码的重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:408/439、439/514、470、470/667、514、514/537和537,其中多肽序列的氨基酸位置参考SEQ ID NO:1308或2278来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:408A/439S、439S/514R、470G、470G/667D、470P、514R、514R/537E和537E,其中多肽序列的氨基酸位置参考SEQ ID NO:1308或2278来编号。在一些实施方案中,编码的重组蛋白酶包含选自以下的至少一个取代或取代集:V408A/M439S、M439S/H514R、Q470G、Q470G/G667D、Q470P、H514R、H514R/P537E和P537E,其中多肽序列的氨基酸位置参考SEQ ID NO:1308或2278来编号。
在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含与SEQ IDNO:34、190、292、342、382、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1364、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220、2278或2332具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。在一些实施方案中,多核苷酸编码重组蛋白酶,所述重组蛋白酶包含SEQ ID NO:34、190、292、342、382、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1364、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220、2278或2332的多肽序列。
在一些实施方案中,多核苷酸能够在高度严格的条件下与参考多核苷酸序列杂交。在一些实施方案中,参考序列选自SEQ ID NO:1、33、189、2、291、341、381、399、453、561、637、679、755、811、1029、1135、1179、1249和/或1307,或其互补物,或编码任何本文提供的变体蛋白酶多肽的多核苷酸序列。在一些实施方案中,能够在高度严格的条件下杂交的多核苷酸编码蛋白酶多肽,所述蛋白酶多肽包含与SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278相比,在选自如表3.1、表3.2、表3.3、表3.4、表3.5、表3.6、表3.7、表3.8、表3.9、表3.10、表3.11、表3.12、表3.13、表3.14、表3.15、表3.16、表3.17、表3.18、表3.19、表3.20、表3.21、表3.22、表3.23、表3.24、表3.25、表3.26和/或表3.27中列出的任何位置的残基位置处具有一个或更多个残基差异的氨基酸序列。在一些此外的实施方案中,工程化多核苷酸选自表3.1、表3.2、表3.3、表3.4、表3.5、表3.6、表3.7、表3.8、表3.9、表3.10、表3.11、表3.12、表3.13、表3.14、表3.15、表3.16、表3.17、表3.18、表3.19、表3.20、表3.21、表3.22、表3.23、表3.24、表3.25、表3.26和/或表3.27中或表3.8、表3.9、表3.10、表3.11、表3.12、表3.13、表3.14、表3.15、表3.16、表3.17、表3.18、表3.19、表3.20、表3.21、表3.22、表3.23、表3.24、表3.25、表3.26和/或表3.27中提供的那些,其中工程化多核苷酸不存在编码组氨酸标签和前面的氨基酸接头的序列;或者包含与选自SEQ ID NO:1、33、189、2、291、341、381、395、399、453、561、637、679、755、811、1029、1135、1179、1249、1307、1365、1369、1423、1531、1607、1649、1725、1781、1999、2105、2149、2219和/或2277的参考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多核苷酸。在一些另外的实施方案中,多核苷酸包含与表3.1、表3.2、表3.3、表3.4、表3.5、表3.6、表3.7、表3.8、表3.9、表3.10、表3.11、表3.12、表3.13、表3.14、表3.15、表3.16、表3.17、表3.18、表3.19、表3.20、表3.21、表3.22、表3.23、表3.24、表3.25、表3.26和/或表3.27中提供的至少一个多核苷酸序列,和/或SEQ ID NO:1、33、189、2、291、341、381、395、399、453、561、637、679、755、811、1029、1135、1179、1249、1307、1365、1369、1423、1531、1607、1649、1725、1781、1999、2105、2149、2219和/或2277具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的序列。在一些此外的实施方案中,多核苷酸包含与选自奇数编号的SEQ ID NO:3至1361和1365-2331的至少一个多核苷酸序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的序列。在一些此外的实施方案中,多核苷酸包含与选自奇数编号的SEQ ID NO:1365至2331的至少一个多核苷酸序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的序列。在一些此外的实施方案中,多核苷酸包含选自奇数编号的SEQ ID NO:3至1361和1365-2331的序列。在一些此外的实施方案中,多核苷酸包含选自奇数编号的SEQ ID NO:1365至2331的序列。在一些此外的实施方案中,与参考多核苷酸序列相比,工程化多核苷酸序列包含1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个或1-50个碱基变化。在仍一些其他实施方案中,与参考多核苷酸序列相比,工程化多核苷酸序列包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、31个、32个、33个、34个、35个、40个、45个或50个碱基变化。在一些实施方案中,与参考多核苷酸序列相比,工程化多核苷酸序列包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个碱基变化。
在一些实施方案中,编码本文提供的任何工程化蛋白酶多肽的分离的多核苷酸以各种方式被操作,以提供多肽基因的表达和多肽的产生。在一些实施方案中,编码多肽的多核苷酸以表达载体提供,其中存在一个或更多个控制序列以调控多核苷酸和/或多肽的表达。取决于表达载体,在将分离的多核苷酸插入到载体中之前对其进行操作可以是期望的或必要的。用于利用重组DNA方法修饰多核苷酸和核酸序列的技术是本领域熟知的。
在一些实施方案中,控制序列包括,除了其他序列以外,启动子、前导序列、多腺苷酸化序列、前肽序列、信号肽序列和转录终止子。如本领域已知的,合适的控制序列可以基于使用的宿主细胞来选择。不意图本发明受限于任何特定的控制序列。
用于细菌宿主细胞的示例性启动子包括但不限于从以下的基因获得的启动子:大肠杆菌乳糖操纵子、色氨酸操纵子、阿拉伯糖操纵子、来自T7噬菌体的T7启动子和红色糖多孢菌(Saccharopolyspora erythraea)红霉素抗性基因。
用于丝状真菌宿主细胞的示例性启动子包括从以下的基因获得的启动子:米曲霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶(proteinase)、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定型α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶、米黑根毛霉蛋白酶(protease)、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶和尖孢镰刀菌(Fusarium oxysporum)胰蛋白酶样蛋白酶(参见,例如WO 96/00787),以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉磷酸丙糖异构酶基因的启动子的杂合体),和其突变体、截短的和杂合的启动子。示例性酵母细胞启动子可以来自以下的基因:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和酿酒酵母3-磷酸甘油酸激酶。用于酵母宿主细胞的其他有用的启动子是本领域已知的(参见例如,Romanos等人,Yeast 8:423-488[1992])。用于在哺乳动物细胞中使用的示例性启动子包括但不限于,来自巨细胞病毒(CMV)的启动子、猿猴空泡病毒40(SV40)的启动子、来自智人(Homo sapiens)的磷酸甘油酸激酶、β-肌动蛋白、延伸因子-1a或甘油醛-3-磷酸脱氢酶的启动子或来自原鸡属(Gallus)的β-肌动蛋白的启动子。
在一些实施方案中,控制序列是合适的转录终止子序列,转录终止子序列是由宿主细胞识别以终止转录的序列。终止子序列被可操作地连接至编码多肽的核酸序列的3’末端。在选择的宿主细胞中有功能的任何终止子可用于本发明。例如,可以从T7细菌噬菌体(例如T7终止子)或大肠杆菌核糖体RNA(例如rrnB终止子)获得用于细菌宿主细胞的示例性转录终止子。例如,用于丝状真菌宿主细胞的示例性转录终止子可以从以下的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡萄糖苷酶和尖孢镰刀菌胰蛋白酶样蛋白酶。用于酵母宿主细胞的示例性终止子可以从以下的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。用于酵母宿主细胞的其他有用的终止子是本领域已知的(参见例如,Romanos等人,上文)。用于哺乳动物细胞的示例性终止子包括但不限于来自巨细胞病毒(CMV)、猿猴空泡病毒40(SV40)或来自智人生长激素的终止子。
在一些实施方案中,控制序列是合适的前导序列,前导序列是对由宿主细胞的翻译重要的mRNA的非翻译区。前导序列被可操作地连接至编码多肽的核酸序列的5’末端。可以使用在所选择的宿主细胞中有功能的任何前导序列。用于丝状真菌宿主细胞的示例性前导序列从以下的基因获得:米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶。用于酵母宿主细胞的合适的前导序列包括但不限于从以下的基因获得的那些:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
在一些实施方案中,控制序列还可以是多腺苷酸化序列,多腺苷酸化序列是可操作地连接于核酸序列的3’末端并且当转录时被宿主细胞识别为向转录的mRNA添加多腺苷残基的信号的序列。在本发明中可以使用在所选择的宿主细胞中有功能的任何多腺苷酸化序列。用于丝状真菌宿主细胞的示例性多腺苷酸化序列包括但不限于从以下的基因获得的那些:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α-葡萄糖苷酶。用于酵母宿主细胞的有用的多腺苷酸化序列也是本领域已知的(参见例如,Guo和Sherman,Mol.Cell.Biol.,15:5983-5990[1995])。
在一些实施方案中,控制序列是信号肽编码区,信号肽编码区编码连接至多肽的氨基末端的氨基酸序列并将编码的多肽引导到细胞的分泌途径中。核酸序列的编码序列的5’末端可以固有地包含信号肽编码区,信号肽编码区符合翻译阅读框地(in translationreading frame)与编码分泌的多肽的编码区的区段天然地连接。可选地,编码序列的5’末端可以包含对编码序列是外来的信号肽编码区。
将表达的多肽引导到选择的宿主细胞的分泌途径中的任何信号肽编码区可用于本文提供的工程化蛋白酶多肽的表达。用于丝状真菌宿主细胞的有效信号肽编码区包括但不限于从以下的基因获得的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶和绵毛状腐质霉(Humicola lanuginosa)蛋白酶。用于酵母宿主细胞的有用的信号肽包括但不限于来自以下的基因的那些:酿酒酵母α因子和酿酒酵母转化酶。用于哺乳动物宿主细胞的有用的信号肽包括但不限于来自免疫球蛋白γ(IgG)基因的信号肽。
在一些实施方案中,控制序列是前肽编码区,前肽编码区编码定位在多肽的氨基末端处的氨基酸序列。产生的多肽被称为“前酶(proenzyme)”、“前多肽(propolypeptide)”或在某些情况下称为“酶原(zymogen)”。前多肽可以通过催化或自体催化前肽从前多肽的裂解被转化为成熟活性多肽。
在另一方面,本发明还提供了重组表达载体,所述重组表达载体包含编码工程化蛋白酶多肽的多核苷酸和取决于多核苷酸被引入到的宿主的类型的一个或更多个表达调控区域,诸如启动子和终止子、复制起点等。在一些实施方案中,将以上描述的各种核酸和控制序列连接在一起以产生重组表达载体,所述重组表达载体包含一个或更多个方便的限制位点以允许编码变体蛋白酶多肽的核酸序列在这样的位点处插入或取代。可选地,本发明的多核苷酸序列通过将多核苷酸序列或包含该多核苷酸序列的核酸构建体插入到用于表达的适当的载体中来表达。在创建表达载体时,编码序列位于载体中,使得编码序列与用于表达的适当的控制序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其可以方便地经历重组DNA程序并且可以导致变体蛋白酶多核苷酸序列的表达。载体的选择通常将取决于载体与待引入载体的宿主细胞的相容性。载体可以是线性质粒或闭合的环状质粒。
在一些实施方案中,表达载体是自主复制载体(即,作为染色体外实体存在的载体,其复制独立于染色体复制,诸如质粒、染色体外元件、微型染色体或人工染色体)。载体可以包含用于确保自我复制的任何工具(means)。在一些可选的实施方案中,载体可以是当被引入到宿主细胞中时,被整合到基因组中并与其被整合进的染色体一起复制的载体。此外,可以使用单一载体或质粒或者一起包含待引入到宿主细胞基因组中的总DNA的两种或更多种载体或质粒,或转座子。
在一些实施方案中,表达载体优选地包含一个或更多个选择标记(selectablemarker),其允许容易选择经转化的细胞。
“选择标记”为其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养型等的基因。用于细菌宿主细胞的合适的标记包括但不限于提供针对以下的抗性的那些:羧苄青霉素、氨苄青霉素、氯霉素、四环素、卡那霉素、吉欧霉素。
用于酵母宿主细胞的合适的标记包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于在丝状真菌宿主细胞中使用的选择标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰基转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶(sulfateadenyltransferase))和trpC(邻氨基苯甲酸合酶),以及其等效物。在另一方面,本发明提供了宿主细胞,所述宿主细胞包含编码本申请的至少一种工程化蛋白酶多肽的多核苷酸,所述多核苷酸被可操作地连接至一个或更多个控制序列用于在宿主细胞中表达工程化蛋白酶。
用于表达由本发明的表达载体编码的多肽的宿主细胞是本领域熟知的,并且包括但不限于细菌细胞(例如,大肠杆菌);真菌细胞,诸如酵母细胞(例如,酿酒酵母和巴斯德毕赤酵母(Pichia pastoris)[例如,ATCC登录号201178]);昆虫细胞(例如,果蝇属(Drosophila)S2和夜蛾属(Spodoptera)Sf9细胞)、植物细胞、动物细胞(例如,CHO、CHO-K1、COS和BHK)和人类细胞(例如,HEK293T、人类成纤维细胞、THP-1、Jurkat和Bowes黑素瘤细胞系)。
因此,在另一方面,本发明提供了用于产生工程化蛋白酶多肽的方法,其中该方法包括将能够表达编码工程化蛋白酶多肽的多核苷酸的宿主细胞在适用于表达该多肽的条件下培养。在一些实施方案中,该方法还包括分离和/或纯化如本文描述的蛋白酶多肽的步骤。
用于上文描述的宿主细胞的适当的培养基和生长条件是本领域熟知的。用于表达蛋白酶的多核苷酸可以通过本领域已知的各种方法被引入到细胞中。技术包括,除了其他以外,电穿孔、生物弹射粒子轰击(biolistic particle bombardment)、脂质体介导的转染、氯化钙转染和原生质体融合。
具有本文公开的特性的工程化蛋白酶可以通过使编码天然存在或工程化的蛋白酶多肽的多核苷酸经历本领域已知的和如本文所描述的诱变和/或定向演化方法来获得。示例性定向演化技术为诱变和/或DNA改组(参见例如,Stemmer,Proc.Natl.Acad.Sci.USA.,1994,91:10747-10751;WO 95/22625;WO 97/0078;WO 97/35966;WO 98/27230;WO 00/42651;WO 01/75767和美国专利6,537,746)。可以使用的其他定向演化程序包括交错延伸过程(StEP)、体外重组(参见例如,Zhao等人,Nat.Biotechnol.,1998,16:258-261)、诱变PCR(参见例如,Caldwell等人,PCR MethodsAppl.,3:S136-S140,1994)和盒式诱变(参见例如,Black等人,Proc.Natl.Acad.Sci.USA.,1996,93:3525-3529)以及其他。
重组多肽可以使用本领域已知的任何合适的方法产生。编码感兴趣的野生型多肽的基因可以在载体诸如质粒中克隆,并在期望的宿主诸如大肠杆菌等中表达。重组多肽的变体可以通过本领域已知的各种方法产生。实际上,存在本领域技术人员熟知的各种各样不同的诱变技术。另外,诱变试剂盒还可从许多商业分子生物学供应商获得。产生确定的氨基酸(定点)处的特定取代、基因的局部区域中的特异性(区域特异性)或随机突变,或整个基因内的随机诱变(例如,饱和诱变)的方法是可得的。本领域的技术人员已知产生酶变体的许多合适的方法,包括但不限于,使用PCR对单链DNA或双链DNA定点诱变、盒式诱变、基因合成、易错PCR、改组和化学饱和诱变,或本领域已知的任何其他合适的方法。诱变和定向演化方法可以容易地应用于编码酶的多核苷酸,以产生可以被表达、筛选和测定的变体文库。任何合适的诱变和定向演化方法都可用于本发明,并且是本领域熟知的(参见例如,美国专利第5,605,793号、第5,811,238号、第5,830,721号、第5,834,252号、第5,837,458号、第5,928,905号、第6,096,548号、第6,117,679号、第6,132,970号、第6,165,793号、第6,180,406号、第6,251,674号、第6,265,201号、第6,277,638号、第6,287,861号、第6,287,862号、第6,291,242号、第6,297,053号、第6,303,344号、第6,309,883号、第6,319,713号、第6,319,714号、第6,323,030号、第6,326,204号、第6,335,160号、第6,335,198号、第6,344,356号、第6,352,859号、第6,355,484号、第6,358,740号、第6,358,742号、第6,365,377号、第6,365,408号、第6,368,861号、第6,372,497号、第6,337,186号、第6,376,246号、第6,379,964号、第6,387,702号、第6,391,552号、第6,391,640号、第6,395,547号、第6,406,855号、第6,406,910号、第6,413,745号、第6,413,774号、第6,420,175号、第6,423,542号、第6,426,224号、第6,436,675号、第6,444,468号、第6,455,253号、第6,479,652号、第6,482,647号、第6,483,011号、第6,484,105号、第6,489,146号、第6,500,617号、第6,500,639号、第6,506,602号、第6,506,603号、第6,518,065号、第6,519,065号、第6,521,453号、第6,528,311号、第6,537,746号、第6,573,098号、第6,576,467号、第6,579,678号、第6,586,182号、第6,602,986号、第6,605,430号、第6,613,514号、第6,653,072号、第6,686,515号、第6,703,240号、第6,716,631号、第6,825,001号、第6,902,922号、第6,917,882号、第6,946,296号、第6,961,664号、第6,995,017号、第7,024,312号、第7,058,515号、第7,105,297号、第7,148,054号、第7,220,566号、第7,288,375号、第7,384,387号、第7,421,347号、第7,430,477号、第7,462,469号、第7,534,564号、第7,620,500号、第7,620,502号、第7,629,170号、第7,702,464号、第7,747,391号、第7,747,393号、第7,751,986号、第7,776,598号、第7,783,428号、第7,795,030号、第7,853,410号、第7,868,138号、第7,783,428号、第7,873,477号、第7,873,499号、第7,904,249号、第7,957,912号、第7,981,614号、第8,014,961号、第8,029,988号、第8,048,674号、第8,058,001号、第8,076,138号、第8,108,150号、第8,170,806号、第8,224,580号、第8,377,681号、第8,383,346号、第8,457,903号、第8,504,498号、第8,589,085号、第8,762,066号、第8,768,871号、第8,849,575号、第9,593,326号、第9,665,694号、第9,684,771号、第9,864,833号、第9,996,661号和所有相关美国以及PCT和非美国对应专利;Ling等人,Anal.Biochem.,254(2):157-78[1997];Dale等人,Meth.Mol.Biol.,57:369-74[1996];Smith,Ann.Rev.Genet.,19:423-462[1985];Botstein等人,Science,229:1193-1201[1985];Carter,Biochem.J.,237:1-7[1986];Kramer等人,Cell,38:879-887[1984];Wells等人,Gene,34:315-323[1985];Minshull等人,Curr.Op.Chem.Biol.,3:284-290[1999];Christians等人,Nat.Biotechnol.,17:259-264[1999];Crameri等人,Nature,391:288-291[1998];Crameri,等人,Nat.Biotechnol.,15:436-438[1997];Zhang等人,Proc.Nat.Acad.Sci.U.S.A.,94:4504-4509[1997];Crameri等人,Nat.Biotechnol.,14:315-319[1996];Stemmer,Nature,370:389-391[1994];Stemmer,Proc.Nat.Acad.Sci.USA,91:10747-10751[1994];WO 95/22625、WO 97/0078、WO 97/35966、WO 98/27230、WO 00/42651、WO 01/75767和WO 2009/152336,所有这些通过引用并入本文)。
在一些实施方案中,诱变处理后获得的酶变体通过使酶变体经受确定的温度(或其他测定条件)并测量热处理或其他测定条件之后剩余的酶活性的量来筛选。然后从宿主细胞分离包含编码蛋白酶多肽的多核苷酸的DNA,测序以鉴定核苷酸序列改变(如果有的话),并用于在不同或相同的宿主细胞中表达酶。测量来自表达文库的酶活性可以使用本领域已知的任何合适的方法(例如,标准生物化学技术,诸如HPLC分析)来进行。
对于已知序列的工程化多肽,编码酶的多核苷酸可以根据已知的合成方法通过标准的固相方法制备。在一些实施方案中,多达约100个碱基的片段可以被单独地合成,然后连接(例如,通过酶促或化学连接方法(chemical ligation method)或聚合酶介导的方法)以形成任何期望的连续序列。例如,本文公开的多核苷酸和寡核苷酸可以使用经典的亚磷酰胺方法(参见例如,Beaucage等人,Tetra.Lett.,22:1859-69[1981];和Matthes等人,EMBO J.,3:801-05[1984]),如通常在自动化合成方法中所实践的,通过化学合成制备。根据亚磷酰胺方法,寡核苷酸被合成(例如,在自动DNA合成仪中)、纯化、退火、连接并克隆到适当的载体中。然而,不意图本发明受限于任何特定的用于产生多核苷酸和寡核苷酸的方法,因为任何合适的方法可用于本发明。
因此,在一些实施方案中,用于制备工程化蛋白酶多肽的方法可以包括:(a)合成编码多肽的多核苷酸,所述多肽包含选自以下的氨基酸序列:表3.1、表3.2、表3.3、表3.4、表3.5、表3.6、表3.7、表3.8、表3.9、表3.10、表3.11、表3.12、表3.13、表3.14、表3.15、表3.16、表3.17、表3.18、表3.19、表3.20、表3.21、表3.22、表3.23、表3.24、表3.25、表3.26、表3.27中提供的任何变体的氨基酸序列(例如,SEQ ID NO:4-1362中的偶数编号序列);或表3.8、表3.9、表3.10、表3.11、表3.12、表3.13、表3.14、表3.15、表3.16、表3.17、表3.18、表3.19、表3.20、表3.21、表3.22、表3.23、表3.24、表3.25、表3.26和/或表3.27中提供的任何变体的氨基酸序列,其中变体缺少组氨酸标签和前面的氨基酸接头(例如,SEQ ID NO:1366-2332中的偶数编号序列);以及SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和2278;和(b)表达由所述多核苷酸编码的蛋白酶多肽。在该方法的一些实施方案中,由多核苷酸编码的氨基酸序列包含一个或若干个(例如,多达3个、4个、5个或多达10个)氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列包含1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个或1-50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、31个、32个、33个、34个、35个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个或50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个氨基酸残基缺失、插入和/或取代。在一些实施方案中,取代可以是保守取代或非保守取代。
可以使用本领域已知的任何合适的测定,包括但不限于本文描述的测定和条件,测定所表达的工程化蛋白酶多肽的任何期望的改进的特性(例如,活性、选择性、稳定性、酸耐受性、蛋白酶敏感性等)。
在一些实施方案中,使用用于蛋白纯化的熟知技术中的任何一种或更多种,将在宿主细胞中表达的工程化蛋白酶多肽的任一种从细胞和/或培养基回收,用于蛋白纯化的熟知技术除了其他以外包括,溶菌酶处理、声处理(sonication)、过滤、盐析、热处理、超速离心和色谱法。
用于分离蛋白酶多肽的色谱技术,除了其他以外,包括反相色谱法、高效液相色谱法、离子交换色谱法、疏水相互作用色谱法、凝胶电泳和亲和色谱法。用于纯化特定酶的条件部分地取决于因素诸如净电荷、疏水性、亲水性、分子量、分子形状等,并且对本领域技术人员将是明显的。在一些实施方案中,亲和技术可以用于分离改进的变体蛋白酶。在利用亲和色谱法纯化的一些实施方案中,可使用特异性结合变体蛋白酶多肽的任何抗体。
在一些利用亲和色谱法纯化的实施方案中,可使用与共价附接至蛋白酶的聚糖结合的蛋白。在利用亲和色谱法纯化的其他实施方案中,可使用任何与蛋白酶活性位点结合的小分子。为了产生抗体,通过注射多肽(例如,蛋白酶变体)或其片段来免疫接种各种宿主动物,包括但不限于兔、小鼠、大鼠等。在一些实施方案中,蛋白酶多肽或片段通过侧链官能团或附接至侧链官能团的接头的手段附接至合适的载体,诸如BSA。
在一些实施方案中,工程化蛋白酶多肽通过包括以下的方法在宿主细胞中产生:将包含编码如本文描述的工程化蛋白酶多肽的多核苷酸序列的宿主细胞(例如,大肠杆菌、酿酒酵母、胡萝卜(Daucus carota)、烟草(Nicotiana tabacum)、智人(H.Sapiens)(例如,HEK293T)或灰仓鼠(Cricetulus griseus)(例如,CHO))在有利于工程化蛋白酶多肽产生的条件下培养,并从细胞和/或培养基回收工程化蛋白酶多肽。
在一些实施方案中,本发明包括产生工程化蛋白酶多肽的方法,该方法包括培养重组真核细胞,所述重组真核细胞包含编码工程化蛋白酶多肽的多核苷酸序列,所述工程化蛋白酶多肽与参考序列(例如,SEQ ID NO:2、、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278)具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、95%、96%、97%、98%、99%或100%序列同一性。
在一些实施方案中,本发明包括产生工程化蛋白酶多肽的方法,该方法包括在允许产生工程化蛋白酶多肽的适当的培养条件下培养包含编码工程化蛋白酶多肽的多核苷酸序列的重组真核细胞,和任选地从培养物和/或培养的真核细胞回收工程化蛋白酶多肽,所述工程化蛋白酶多肽在与SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的氨基酸序列进行最佳比对时,与参考序列(例如,SEQ IDNO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278)具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、95%、96%、97%、98%、99%或100%序列同一性,和与SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278相比选自表3.1、表3.2、表3.3、表3.4、表3.5、表3.6、表3.7、表3.8、表3.9、表3.10、表3.11、表3.12、表3.13、表3.14、表3.15、表3.16、表3.17、表3.18、表3.19、表3.20、表3.21、表3.22、表3.23、表3.24、表3.25、表3.26和/或表3.27(例如,SEQ ID NO:4-1362和1366-2332中的偶数编号序列)中提供的残基差异的一个或更多个氨基酸残基差异和/或其组合。
在一些实施方案中,将工程化多肽从重组宿主细胞或细胞培养基回收后,将它们通过本领域已知的任何合适的方法进一步纯化。在一些另外的实施方案中,纯化的蛋白酶多肽与其他成分和化合物组合以提供适当包含工程化蛋白酶多肽用于不同应用和用途的组合物和制剂(例如,药物组合物)。在一些另外的实施方案中,纯化的多肽或配制的蛋白酶多肽被冻干。
组合物和用途
本发明提供了各种组合物和形式,包括但不限于下文描述的那些。在一些实施方案中,本发明提供了工程化蛋白酶多肽,所述工程化蛋白酶多肽适用于在药物组合物和其他组合物(诸如膳食和/或营养补充剂)中使用。
取决于施用方式,包含治疗有效量的根据本发明的工程化蛋白酶的这些组合物呈固体、半固体或液体的形式。在一些实施方案中,组合物包括其他药学上可接受的组分,诸如稀释剂、缓冲剂、赋形剂、盐、乳化剂、防腐剂、稳定剂、填料和其他成分。用于配制和施用的技术的细节是本领域熟知的,并在文献中被描述。
在一些实施方案中,工程化蛋白酶多肽被配制用于在药物组合物中使用。用于在递送工程化蛋白酶多肽中使用的任何合适的形制可用于本发明,所述形制包括但不限于丸剂、片剂、凝胶片(gel tab)、胶囊、锭剂、糖衣丸、粉末、软凝胶、溶胶凝胶、凝胶、乳剂、植入物、贴剂、喷雾剂、软膏剂、搽剂、霜剂、糊剂、凝胶剂、涂剂、气雾剂、口香糖、缓和剂(demulcent)、条状物、溶液、悬浮液(包括但不限于油基悬浮液、水包油乳剂等)、浆液、糖浆剂、控释制剂、栓剂等。在一些实施方案中,工程化蛋白酶多肽以适用于注射或输注的形制提供(即,以可注射制剂的形制)。在一些实施方案中,工程化蛋白酶多肽以生物相容性基质诸如溶胶凝胶,包括基于二氧化硅(例如,氧基硅烷(oxysilane))的溶胶凝胶提供。在一些实施方案中,将工程化蛋白酶多肽封装和/或肠溶包衣。在一些可选的实施方案中,将工程化蛋白酶多肽封装在纳米结构(例如,纳米管、纳米小管、纳米胶囊或微米胶囊、微球体、脂质体等)中。实际上,不意图本发明受限于任何特定递送制剂和/或递送方式。意图工程化蛋白酶多肽通过本领域已知的任何合适的方式来施用,包括但不限于:肠胃外、口服、局部、经皮、鼻内、眼内、鞘内、经由植入物等。
在一些实施方案中,工程化蛋白酶多肽通过糖基化、化学交联试剂、聚乙二醇化(即,用聚乙二醇[PEG]或活化的PEG等修饰)或其他化合物被化学修饰(参见例如,Ikeda,Amino Acids,2005,29:283-287;美国专利第7,531,341号、第7,534,595号、第7,560,263号和第7,553,653号;美国专利申请公布第2013/0039898号、第2012/0177722号等)。实际上,不意图本发明受限于任何特定递送方法和/或机制。
在一些另外的实施方案中,工程化蛋白酶多肽在包含基质稳定的酶晶体的制剂中提供。在一些实施方案中,制剂包含交联的结晶工程化蛋白酶和具有附接至酶晶体的反应部分的聚合物。本发明还以聚合物提供了工程化蛋白酶多肽。
在一些实施方案中,包含本发明的工程化蛋白酶多肽的组合物包含一种或更多种常用的载体化合物,包括但不限于糖(例如,乳糖、蔗糖、甘露糖醇和/或山梨糖醇)、淀粉(例如,玉米淀粉、小麦淀粉、大米淀粉、马铃薯淀粉或其他植物淀粉)、纤维素(例如,甲基纤维素、羟丙基甲基纤维素、羧甲基纤维素钠)、树胶(例如,阿拉伯胶、黄芪胶、瓜尔胶等)和/或蛋白(例如,明胶、胶原蛋白等)。
在一些实施方案中,工程化蛋白酶多肽适用于用于改善膳食蛋白消化。在一些此外的实施方案中,工程化蛋白酶多肽可用于在食用食物或饲料之前分解食物和饲料中的蛋白。施用的工程化蛋白酶多肽的剂量取决于状况或疾病、受试者的一般状况以及本领域技术人员已知的其他因素。在一些实施方案中,意图将组合物单次或多于一次施用。在一些实施方案中,设想了向患有胰功能不全病的受试者施用的组合物中工程化蛋白酶多肽的浓度足以有效治疗和/或改善疾病(例如,胰功能不全病)。在一些实施方案中,受试者是人类,本文中也称为患者。在一些实施方案中,受试者是非人类哺乳动物,诸如非人类灵长类动物、猪、牛、山羊、狗和猫。在一些实施方案中,工程化蛋白酶多肽可用于与其他酶(诸如淀粉酶和/或脂肪酶)组合用于治疗诸如胰腺酶不足的疾病。
在一些实施方案中,工程化蛋白酶多肽与其他药物和/或膳食组合物(包括但不限于膳食补充剂、营养保健品等)组合施用。不意图本发明受限于任何特定的施用方法或形式,因为任何合适的方法和/或形式都可以使用。
实施例
提供以下实施例,包括实验和获得的结果,仅用于说明的目的,而不应被解释为限制本发明。
在以下的实验公开内容中,应用以下缩写:ppm(百万分率(parts per million));M(摩尔/升);mM(毫摩尔/升),uM和μM(微摩尔/升);nM(纳摩尔/升);mol(摩尔);gm和g(克);mg(毫克);ug和μg(微克);L和l(升);ml和mL(毫升);cm(厘米);mm(毫米);um和μm(微米);sec.(秒);min(s)(分钟);h(s)和hr(s)(小时);kDa(千道尔顿);U(单位);MW(分子量);rpm(转/分钟);℃(摄氏度);CDS(编码序列);DNA(脱氧核糖核酸);RNA(核糖核酸);大肠杆菌W3110(常用的实验室大肠杆菌菌株,可从大肠杆菌遗传资源中心(Coli Genetic StockCenter)[CGSC],New Haven,CT获得);EPI(外分泌胰功能不全);btLIP(热噬淀粉芽孢杆菌(B.thermoamylovorans)脂肪酶);HPLC(高压液相色谱法);ms(质谱法或质谱);SDS-PAGE(十二烷基硫酸钠聚丙烯酰胺凝胶电泳);PES(聚醚砜);ACN(乙腈);IPA(异丙醇);IPTG(异丙基β-D-1-硫代吡喃半乳糖苷);PBS(磷酸盐缓冲盐水);PMBS(硫酸多黏菌素B);NADPH(烟酰胺腺嘌呤二核苷酸膦酸);LB(Luria培养基);MeOH(甲醇);FIOPC和FIOP(相对于阳性对照的改进倍数);HTP(高通量);CAV(池加速电压;碰撞池加速电压);CE(碰撞能量);RF(射频);Greiner(Greiner Bio-One North America,Inc.,Monroe,NC);Biorad(Bio-RadLaboratories,Inc.,Hercules,CA);Sigma-Aldrich(Sigma-Aldrich,St.Louis,MO);PallCorp.(Pall,Corp.,Pt.Washington,NY);Millipore(Millipore,Corp.,Billerica MA);Difco(Difco Laboratories,BD Diagnostic Systems,Detroit,MI);Molecular Devices(Molecular Devices,LLC,Sunnyvale,CA);Kuhner(Adolf Kuhner,AG,Basel,Switzerland);Applied Biosystems(Applied Biosystems,Life Technologies,Corp.的一部分,Grand Island,NY);Agilent(Agilent Technologies,Inc.,Santa Clara,CA);MS(质谱仪,Agilent);Thermo Scientific(ThermoFisherScientific的一部分,Waltham,MA);Gibco(ThermoFisher Scientific);Pierce(PierceBiotechnology(现在是Thermo Fisher Scientific的一部分),Rockford,IL);ThermoFisher Scientific(Thermo Fisher Scientific,Waltham,MA);Corning(Corning,Inc.,Palo Alto,CA);AbbVie(AbbVie,Inc.,North Chicago,IL);Jackson(The JacksonLaboratory,Bar Harbor,ME);和Bio-Rad(Bio-Rad Laboratories,Hercules,CA);以及GraphPad(GraphPad Software,San Diego,CA)。
实施例1:蛋白酶基因的获取和表达载体的构建
对编码来自肽酶S8家族的微鞘藻属的种(Microcoleus sp)野生型蛋白酶(WP_015180421.1)(“WT Pro_16”)(SEQ ID NO:2)的DNA序列进行密码子优化以用于在大肠杆菌中表达,并克隆到大肠杆菌表达载体pCK110900载体系统(参见例如,美国专利第7,629,157号和第9,714,437号,以及美国专利申请公布2006/0195947,所有这些都在此通过引用并入本文)或pJV110900载体系统(参见例如,美国专利申请公布2017/213758,在此通过引用并入)中。然而,不意图本发明受限于任何特定的载体。另外,在一些实施方案中,使用缺少抗微生物抗性标记的表达载体。在一些构建体中,将C末端6xHis标签添加到蛋白酶变体中。将质粒构建体转化到源自W3110的大肠杆菌菌株中。使用本领域技术人员通常已知的定向演化技术从该质粒构建体产生基因变体文库(参见例如,美国专利第8,383,346号和WO2010/144103)及其衍生物。
实施例2:蛋白酶变体的高通量(HTP)培养和筛选条件
在本实施例中提供了用于培养产生本发明蛋白酶的细胞的方法,以及表征蛋白酶的筛选方法。
微鞘藻属的种的蛋白酶(“WTPro_16”)及变体的高通量(HTP)培养
通过将转化的大肠杆菌细胞铺在含有1%葡萄糖和选择物的LB琼脂板上来进行选择。在37℃孵育过夜后,将菌落放置到96孔浅平底板(NUNCTM Thermo-Scientific)的孔中,所述孔中填充有180μl/孔的补充有1%葡萄糖和选择物(例如,氯霉素)的LB。允许培养物在振荡培养箱(200rpm,30℃和85%相对湿度;Kuhner)中过夜生长18-20小时。
将过夜生长的样品(20μL)转移到填充有380μL的补充有选择标记的Terrific培养基的96孔深板中。将板在振荡器(250rpm,30℃和85%相对湿度;Kuhner)中孵育135分钟。然后用40μL在无菌水中的10mM IPTG诱导蛋白酶变体的表达,并将培养物在振荡器(250rpm、30℃和85%相对湿度;Kuhner)中过夜孵育20-24小时。使细胞通过离心(4000rpm x 20min)沉淀,将上清液弃去,并在分析前将细胞在-80℃冷冻。
HTP沉淀的裂解
首先,向细胞沉淀添加200μL的裂解缓冲液(1X PBS,1mg/ml溶菌酶,和0.5mg/ml硫酸多黏菌素B)。将细胞沉淀和缓冲液在室温温和地摇动1.5-2h,并离心(4000rpm x15min),然后在本文描述的各个HTP测定中使用澄清的裂解物。通过SDS-PAGE对这些裂解物的分析揭示,存在~52kDa和~22kDa的表观MW的过表达蛋白条带,分别与成熟活性蛋白酶和裂解的pro结构域的预期MW一致。在一些实验中,在挑战和分析之前,用PBS缓冲液对澄清的裂解物进行另外的稀释。
用于分析的蛋白酶变体的纯化
为了纯化加His标签的变体,根据制造商的方案,用HisPur Ni-NTA旋转板(ThermoFisher Scientific)和Zeba脱盐板(Thermo Fisher Scientific)纯化澄清的细胞裂解物。纯化的蛋白在PBS缓冲液中洗脱和脱盐。
澄清的裂解物或纯化的蛋白的蛋白酶活性分析
本发明开发期间产生的变体蛋白酶的活性通过使用蛋白酶测定试剂盒(Thermo Fisher Scientific)测量酪蛋白的降解来确定。对于该测定,将90μL水性缓冲液(100mM NaPO4,pH 6-7;或10mM Tris-HCl,pH 7.8)中的5μg/mL或10μg/mL FL-酪蛋白底物添加到96孔、不透明、黑色微量滴定板(板)中。为了开始测定,将10μL样品(细胞裂解物或纯化的蛋白酶)添加到反应混合物中并混合。立即在M2微板读取器(Molecular Devices)上读取板的动力学荧光(激发:485,发射:530,3分钟)。计算线性范围(通常为3分钟)内的斜率,以评估蛋白酶活性。为了确保样品不使测定饱和,根据需要,在分析前基于预定的稀释因子(高达256x)将样品稀释在测定缓冲液中。术语“未挑战的活性”被定义为没有任何以下测定方法描述中描述的外部挑战的蛋白酶活性。除非另有说明,否则本测定是本文实施例中描述的默认蛋白酶活性测定。
对澄清的裂解物或纯化的蛋白进行蛋白酶活性的HTP分析的替代方法
在一些实验中,使用了替代的活性测定。对于该测定,将100mM NaPO4缓冲液pH7.5中的187μL 0.086g/L Nα-苄醇-L精氨酸乙酯(BAEE)添加到透明平底板(Greiner微板)中。接下来,向板中添加8μL 1mM盐酸。为了开始反应,向反应混合物中添加5μL样品。立即在M2微板读取器(Molecular Devices)上读取板的动力学吸光度(A253,200s)。计算谱的线性范围内的斜率。
用热挑战预孵育的澄清的裂解物或纯化的蛋白的HTP分析
如本实施例描述地评估变体蛋白酶变体的热稳定性。将澄清的裂解物转移到PCR板(Biorad)中,并在热循环仪中于40-50℃孵育1小时。孵育后,将样品离心以沉淀热沉淀的蛋白,并如本文描述的分析上清液的蛋白酶残留活性。
在低pH预孵育的和/或暴露于胃蛋白酶的澄清的裂解物或纯化的蛋白的HTP分析
在低pH或在模拟胃环境的在低pH存在胃蛋白酶的情况下预孵育后,确定变体蛋白酶变体的活性。首先,在PCR板(Biorad)中,将澄清的裂解物与pH 2.0-4.0的McIlvaine缓冲液1:1混合,添加0-3.0mg/mL来自猪胃粘膜的胃蛋白酶(Sigma),以进行pH为2.0-4.0的最终挑战,并且最终胃蛋白酶浓度高达1.5mg/mL。将样品混合,然后在热循环仪中于37℃孵育1-2hr。为了使反应猝灭,将样品与400mM NaPO4 pH 6.0-7.0 1:1混合,从而中和pH并使胃蛋白酶失活。然后如本文描述地分析中和的挑战样品的残留蛋白酶活性。
纯化的蛋白的自溶稳定性的HTP评价
为了评估蛋白酶变体的自溶程度,在如本文描述地确定蛋白酶活性之前,将纯化的蛋白酶变体在室温(25℃)或37℃孵育1天或3天。
顺序多挑战的HTP评价
当同时研究两个稳定性特性时,将两个挑战筛选按顺序组合。例如,一小时的热稳定性挑战之后是一小时的pH和胃蛋白酶挑战。这被表示为顺序挑战或顺序预孵育。在顺序挑战后,如本文描述地分析样品的残留蛋白酶活性。
牛磺胆酸钠预孵育后蛋白酶活性的HTP评价
在模拟肠道环境的在中性pH存在牛磺胆酸钠的情况下预孵育之后,确定蛋白酶变体的活性。在PCR板(Biorad)中,将澄清的裂解物与含有10mM牛磺胆酸钠的100mM NaPO4 pH6.5 1:1混合,使最终pH为6.5,并且最终浓度为5mM牛磺胆酸钠。将混合物在热循环仪中于37℃孵育1hr。将样品在100mM NaPO4 pH 6.5中稀释另外8x,然后如本文描述地分析残留蛋白酶活性。
蛋白酶变体的摇瓶表达和纯化
将含有编码感兴趣的工程化多肽的质粒的大肠杆菌的单菌落接种到含有1%葡萄糖和选择物的5mL Luria Bertani培养基中。使细胞在培养箱中在30℃以250rpm振荡生长过夜(至少16小时)。在1升烧瓶中,将培养物稀释到250mL含有选择物的Terrific培养基(12g/L细菌胰蛋白酶,24g/L酵母提取物,4mL/L甘油,65mM磷酸钾,pH 7,1mM MgSO4)中,并允许其在30℃生长。当培养物的OD600为0.6至0.8时,通过将IPTG添加至1mM的最终浓度来诱导蛋白酶基因的表达。然后继续孵育过夜(至少16小时)。通过离心(5000rpm,15min,4℃)并弃去上清液来收获细胞。将细胞重悬于40-50mL含有150mM NaCl的PBS中,并使其通过具有标准大肠杆菌裂解设置的高压均质仪(Microfluidics),并维持在4℃。
收集澄清的裂解物上清液,并向裂解物中添加咪唑,使最终浓度为25mM。使用含有150mL NaCl和25mM咪唑的PBS作为洗涤缓冲液,以及含有150mL NaCl和250mM咪唑的PBS作为洗脱缓冲液,在具有AC步进1ml/5ml HiTrap-亲和色谱快速启动方案(AffinityChromatography Quick Start protocol)的AKTA启动系统上对该裂解物进行HIS亲和纯化。用来自Biorad的EconoPac-10DG脱盐预填充重力流柱将纯化的蛋白酶缓冲交换到PBS中。
实施例3:蛋白酶变体的筛选结果
如实施例2中描述地,一式一份筛选由同源物多样性(homolog diversity)和饱和诱变产生的变体在pH 7.8的蛋白酶活性和在pH 4预孵育1hr后的蛋白酶活性。结果(相对于用SEQ ID NO:2获得的结果)在表3.1中提供。如实施例2中描述地,一式三份测定由同源物多样性和饱和诱变文库产生的一些变体在pH 7.8的蛋白酶活性和在pH 4预孵育1hr后的蛋白酶活性。
结果(相对于用SEQ ID NO:2获得的结果)在表3.2中提供。
基于表3.2中示出的结果,选择SEQ ID NO:34作为用于下一蛋白优化迭代的下一亲本序列。从表3.2中示出的结果鉴定出的有益突变被重组到主链中。如实施例2中描述地,一式三份筛选变体在pH 7.8的蛋白酶活性和在pH 3预孵育1hr后的蛋白酶活性。结果(相对于SEQ ID NO:34获得的结果)在表3.3中提供。
基于表3.3中示出的结果,选择SEQ ID NO:190作为用于下一蛋白优化迭代的下一亲本序列。从表3.3中示出的结果鉴定出的有益突变被重组到主链中。另外,还用在不同位置处的诱变基于SEQ ID NO:190构建了变体。如实施例2中描述地,一式一份测定变体在pH7.8的蛋白酶活性和在pH 3.5预孵育1hr后的蛋白酶活性。结果(相对于SEQ ID NO:190获得的结果)在表3.4中提供。另外,如实施例2中描述的,一式三份测定来自文库的一些变体在pH 7.8的蛋白酶活性和在pH3.5预孵育1hr后的蛋白酶活性。结果(相对于SEQ ID NO:190获得的结果)在表3.5中提供。
基于表3.5中示出的结果,选择SEQ ID NO:292作为用于下一蛋白优化迭代的下一亲本序列。基于表3.5中示出的结果鉴定出的有益突变被重组到主链中。另外,还用在不同位置处的诱变基于SEQ ID NO:292构建了变体。如实施例2中描述的,一式三份测定变体在pH 6.5、在用5mM牛磺胆酸盐预孵育1hr后和在pH 4用0.5mg/mL胃蛋白酶预孵育1hr后的蛋白酶活性。结果(相对于SEQ ID NO:292获得的结果)在表3.6中提供。
基于表3.6中示出的结果,选择SEQ ID NO:342作为用于下一蛋白优化迭代的下一亲本序列。基于表3.6中示出的结果鉴定出的有益突变被重组到主链中。如实施例2中描述的,一式三份测定变体在pH 6.5、在用5mM牛磺胆酸盐预孵育1hr后和在pH 4用0.5mg/mL胃蛋白酶预孵育1hr后的蛋白酶活性。结果(相对于SEQ ID NO:342所获得的结果)在表3.7中提供。
基于表3.7中示出的结果,选择SEQ ID NO:382作为用于下一蛋白优化迭代的下一亲本序列。将该序列亚克隆到具有C末端组氨酸标签的pJV110900载体中(SEQ ID NO:396)。基于表3.7中示出的结果鉴定出的有益突变使用SEQ ID NO:396重组。另外,使用SEQ IDNO:396通过同源多样性和在不同位置处的诱变构建了变体。如实施例2中描述的,一式三份测定变体在pH 6.5、在42℃预孵育1hr后和在pH 3.8用1.5mg/mL胃蛋白酶预孵育2hr后的蛋白酶活性。结果(相对于SEQ ID NO:396获得的结果)在表3.8中提供。
基于表3.8中示出的结果,选择SEQ ID NO:400作为用于下一蛋白优化迭代的下一亲本序列。基于表3.8中示出的结果鉴定出的有益突变被重组到主链中。另外,还使用SEQID NO:400通过在不同位置处的同源多样性构建了变体。如实施例2中描述的,一式三份测定在包括在48℃预孵育1hr然后在pH 3.8用1.5mg/mL胃蛋白酶预孵育1hr的顺序预孵育中,变体在pH 6的蛋白酶活性。结果(相对于SEQ ID NO:400获得的结果)在表3.9中提供。
基于表3.9中示出的结果,选择SEQ ID NO:454作为用于下一蛋白优化迭代的下一亲本序列。基于表3.9中示出的结果鉴定出的有益突变被重组到主链中。另外,还用在不同位置处的诱变使用SEQ ID NO:454构建了变体。如实施例2中描述的,一式三份测定在包括在48℃预孵育1hr然后在pH 3.26用1.5mg/mL胃蛋白酶预孵育1hr的顺序预孵育中,变体在pH6的蛋白酶活性。结果(相对于SEQ ID NO:454的结果)在表3.10中提供。
基于表3.10中示出的结果,选择SEQ ID NO:562作为用于下一蛋白优化迭代的下一亲本序列。基于表3.10中示出的结果鉴定出的有益突变被重组到该主链中。另外,还用在不同位置处的饱和诱变使用SEQ ID NO:562构建了变体。如实施例2中描述的,纯化变体,并一式三份测定其在pH 6、在pH 4用1.5mg/mL胃蛋白酶预孵育1hr后的蛋白酶活性,以及通过测量在室温孵育1天后的蛋白酶活性的自溶稳定性。结果(相对于SEQ ID NO:562获得的结果)在表3.11中提供。另外,如实施例2中描述的,纯化一些变体,并一式三份测定其在pH 6、在pH 3.5用1.5mg/mL胃蛋白酶预孵育1hr后的蛋白酶活性,以及通过测量在室温孵育1天后的蛋白酶活性的自溶稳定性。结果(相对于SEQ ID NO:562获得的结果)在表3.12中提供。
基于表3.11中示出的结果,选择SEQ ID NO:638作为用于下一蛋白优化迭代的下一亲本序列。从表3.11中示出的结果鉴定出的有益突变被重组到该主链中。另外,还用在不同位置处的饱和诱变使用SEQ ID NO:638构建了变体。如实施例2中描述的,一式三份测定变体在pH 6、在pH 3.26用1.5mg/mL胃蛋白酶预孵育1hr后(用替代的BAEE测定在pH 7.5)的蛋白酶活性,以及通过测量在室温孵育1天后的蛋白酶活性的自溶稳定性。结果(相对于SEQID NO:638获得的结果)在表3.13中提供。在另外的实验中,如实施例2中描述地,纯化一些蛋白酶变体,并一式三份测定其在pH6、在pH 3.5用1.5mg/mL胃蛋白酶预孵育1hr后的蛋白酶活性,以及还通过测量在室温孵育1天后的蛋白酶活性的自溶稳定性。相对于SEQ ID NO:638的数据的分析在表3.14中列出。
基于表3.13中示出的结果,选择SEQ ID NO:680作为用于下一蛋白优化迭代的下一亲本序列。从表3.13和表3.14鉴定出的有益突变被重组到该主链中。如实施例2中描述地,纯化变体,并一式三份测定其在pH 6、在pH 3.25用1.5mg/mL胃蛋白酶预孵育1hr后的蛋白酶活性,以及通过测量在室温孵育1天后的蛋白酶活性的自溶稳定性。结果(相对于SEQID NO:680获得的结果)在表3.15中提供。
基于表3.15中示出的结果,选择SEQ ID NO:756作为用于下一蛋白优化迭代的下一亲本序列。从表3.15中示出的结果鉴定出的有益突变被重组到该主链中。另外,还用同源多样性使用SEQ ID NO:756构建了变体。如实施例2中描述的,纯化变体,并一式三份测定其在pH 6、在pH 3.25用1.5mg/mL胃蛋白酶预孵育1hr后的蛋白酶活性,以及通过测量在室温孵育1天后的蛋白酶活性的自溶稳定性。结果(相对于SEQ ID NO:756获得的结果)在表3.16中提供。在一些另外的实验中,如实施例2中描述的,纯化一些蛋白酶变体,并一式三份测定其在pH 6、在pH 3.5用1.5mg/mL胃蛋白酶预孵育1hr后的蛋白酶活性,以及通过测量在室温孵育1天后的蛋白酶活性的自溶稳定性。结果(相对于SEQ ID NO:756获得的结果)在表3.17中提供。
基于表3.16中示出的结果,选择SEQ ID NO:812作为用于下一蛋白优化迭代的下一亲本序列。从表3.16中的结果鉴定出的有益突变被重组到该主链中。另外,还用在不同位置处的饱和诱变使用SEQ ID NO:812构建了变体。如实施例2中描述的,一式一份筛选产生的变体在pH 6和在pH 2.5用1.5mg/mL胃蛋白酶预孵育1hr后的蛋白酶活性。结果(相对于SEQ ID NO:812获得的结果)在表3.18中提供。在一些另外的实验中,如实施例2中描述的,纯化一些蛋白酶变体,并一式三份测定其在pH 6、在pH 3用1.5mg/mL胃蛋白酶预孵育1hr后的蛋白酶活性,以及通过测量在室温孵育1天后的蛋白酶活性的自溶稳定性。结果(相对于SEQ ID NO:812获得的结果)在表3.18中提供。在一些另外的实验中,如实施例2中描述的,纯化一些变体,并一式三份测定其在pH 6、在pH 3.5用1.5mg/mL胃蛋白酶预孵育1hr后的蛋白酶活性,以及通过测量在室温孵育1天后的蛋白酶活性的自溶稳定性。结果(相对于SEQID NO:812获得的结果)在表3.19和
表3.20中提供。
在所测试的不同条件观察到的并在上述表格示出的有益突变被重组到SEQ IDNO:812中。另外,还用在不同位置处的诱变、同源物多样性使用SEQ ID NO:812构建了变体,并且还去除了精氨酸和赖氨酸残基。如实施例2中描述的,纯化变体,并一式三份测定其在pH 6、在pH 3用1.5mg/mL胃蛋白酶预孵育1hr后的蛋白酶活性,以及通过测量在室温孵育1天后的蛋白酶活性的自溶稳定性。结果(相对于SEQ ID NO:812获得的结果)在表3.21中提供。
基于表3.21中示出的结果,选择SEQ ID NO:1030作为用于下一蛋白优化迭代的下一亲本序列。基于表3.21中示出的结果鉴定出的有益突变被重组到该主链中。另外,还用在不同位置处的诱变在SEQ ID NO:1030上构建了变体。如实施例2中描述的,纯化变体,并一式三份测定其在pH 6、在pH 3用1.5mg/mL胃蛋白酶预孵育1hr后的蛋白酶活性,以及还通过测量在37℃孵育24小时后的蛋白酶活性的自溶稳定性。结果(相对于SEQ ID NO:1030获得的结果)在表3.22中提供。
基于表3.22中示出的结果,选择SEQ ID NO:1136作为用于下一蛋白优化迭代的下一亲本序列。从表3.22中示出的结果鉴定出的有益突变被重组到该主链中。如实施例2中描述的,一式三份测定变体在pH 6和在pH 2.5用1.5mg/mL胃蛋白酶预孵育1hr后的蛋白酶活性。结果(相对于SEQ ID NO:1136获得的结果)在表3.23中提供。另外,还使用SEQ ID NO:1136构建了具有在不同位置处的突变的变体。如实施例2中描述的,一式一份测定这些变体在pH 6和在pH 2.5用1.5mg/mL胃蛋白酶预孵育2hr后的蛋白酶活性。结果(相对于SEQ IDNO:1136获得的结果)在表3.24中提供。
基于表3.23中示出的结果,选择SEQ ID NO:1180作为用于下一蛋白优化迭代的下一亲本序列。基于表3.23和表3.24中示出的结果鉴定出的有益突变被重组到该主链中。另外,还用在不同位置处的诱变使用SEQ ID NO:1180构建了变体。如实施例2中描述的,纯化变体,并一式三份测定在pH 6、在pH 2.5用1.5mg/mL胃蛋白酶预孵育1hr后的蛋白酶活性,以及在37℃孵育24小时后的自溶稳定性。结果(相对于SEQ ID NO:1180获得的结果)在表3.25中提供。
基于表3.25中示出的结果,选择SEQ ID NO:1250作为用于下一蛋白优化迭代的下一亲本序列。基于表3.25中示出的结果鉴定出的有益突变被重组到该主链中。如实施例2中描述的,纯化变体,并一式三份测定在pH6、在pH 2.75用1.5mg/mL胃蛋白酶预孵育2hr后的蛋白酶活性,以及通过测定在37℃孵育24小时后蛋白酶活性的自溶稳定性。结果(相对于SEQ ID NO:1250获得的结果)在表3.26中提供。
基于表3.26中示出的结果,选择SEQ ID NO:1308作为用于下一蛋白优化迭代的下一亲本序列。基于SEQ ID NO:1308多样性的组合文库被重组到该主链中。还使用该主链构建了位置470处的饱和诱变文库。如实施例2中描述的,纯化变体,并一式三份测定在pH 6、在pH 2.75用1.5mg/mL胃蛋白酶预孵育2hr后的蛋白酶活性,以及在37℃孵育24小时后的自溶稳定性。结果(相对于SEQ ID NO:1308获得的结果)在表3.27中提供。
实施例4:带有和不带有His标签的变体的比较
来自SEQ ID NO:1362的接头和C末端His标签被去除以产生SEQ ID NO:2332。使用实施例2中的摇瓶纯化方法制备SEQ ID NO:1362,并且如以下实施例7中描述地制备SEQ IDNO:2332。在以下体外测定中对相等蛋白浓度(通过蛋白含量和纯度测量)的SEQ ID NO:1362和SEQ ID NO:2332如实施例2中描述地进行表征:未挑战的活性、在pH 3.5预孵育1小时后的活性、在pH 4预孵育1小时后的活性、在pH 3.5用1.5g/L胃蛋白酶预孵育1小时后的活性、在pH 4用1.5g/L胃蛋白酶预孵育1小时后的活性、用5mM牛磺胆酸盐预孵育1小时后的活性,以及在37℃孵育1天后的自溶稳定性。这些实验一式三份或一式六份地测试。在所测试的各种条件下,发现SEQ ID NO:1362和SEQ ID NO:2332具有类似的特性,如在表4中示出的。
实施例5:小型猪中外分泌胰功能不全手术模型的建立与验证
通过胰管结扎在SinclairTM小型猪中产生外分泌胰功能不全(EPI)手术模型。从手术前7天开始并在整个实验中继续,用高脂肪饲料(HFD;与橄榄油10:1,w/w混合的Sinclair标准饮食S-9[19%蛋白、5.8%脂肪],和预分份的3.9oz一杯的未加甜味剂的苹果酱)一天一次饲喂7-8个月龄且在19.9-26.2kg之间的雌性小型猪。临手术前连续3天和手术后第15天、第16天、第17天收集24h内的总粪便输出。通过以下来制备来自每只动物的每日总粪便收集物用于后续分析:添加约1.5x粪便净重的体积的蒸馏水,匀浆,分成3x 50mL等份试样,并在-20℃冷冻直至分析。通过以下来验证模型:测量粪便样品中的脂肪含量(通过修改的Van de Kamer方法;参见Van de Kamer,于Seligson(编著),Standard Methods of Clinical Chemistry,volume 2,Academic Press,New York,NY(1958),pp.34–39中)和氮含量(用Vario Max CN机器通过燃烧法的Kjeldahl总氮;参见Watson等人,于Peters等人(编著)Recommended Methods of Manure Analysis,Univ.ofWisconsin Cooperative Extension Publishing,Publication No.A3769.Madison,WI.[2003],p.18-24中),并评估手术前后的变化百分比。手术前,从健康小型猪收集的粪便物质含有低水平的脂肪(0.86g±0.1g SD/100g粪便物质)和氮(0.43g±0.28g SD/100g粪便物质)。手术后,粪便含量增加到3.75g脂肪±0.05g SD/100g粪便物质(336%的增加)和0.72g氮±0.04g SD/100g粪便物质(67%的增加),从而验证了用于EPI研究的该手术模型。
实施例6:蛋白酶变体在外分泌胰功能不全的小型猪模型中的体内表征
经验证的SinclairTM小型猪EPI手术模型(n=6只雌性,8-9个月龄)进一步用于体内研究以评价工程化蛋白酶变体(SEQ ID NO:756),所述工程化蛋白酶变体与工程化脂肪酶(SEQ ID NO:1364)共给药以用于维持。从给药前28天(手术后18天)开始,EPI小型猪从每日一次HFD切换到每日一次高蛋白饮食(HPD;与预分份的3.9oz一杯的未加甜味剂的苹果酱混合的Sinclair高蛋白饮食S-11[23.79%蛋白、5.65%脂肪])为功效研究做准备。在给药日期间,依次为每只动物准备膳食,以确保摄取前离体酶与膳食脂肪和蛋白的相互作用最低。简言之,S-11小型猪饲料首先在干净的饲喂碗中分份。接下来,将酶(0.045g冻干脂肪酶粉末和3.0g冻干蛋白酶粉末,分别对应于44,000U脂肪酶和465,000U蛋白酶)混合到3.9oz一杯的未加甜味剂的苹果酱中。(脂肪酶和蛋白酶的单位由美国药典(USP)测定确定)。然后将酶-苹果酱混合物转移到S-11小型猪饲料中并快速混合。最后,将饲喂碗立即提供给小型猪,然后进行接下来的准备。2小时后,移走饲喂碗;动物在30分钟或更短时间内吃完整顿饭。给药阶段持续14天的持续时间。给药临开始前连续3天以及给药阶段期间的第6、7、8天和第12、13、14天收集24小时内的总粪便输出。粪便样品通过以下制备:向各个每日总粪便收集物添加1.5x粪便净重的体积的蒸馏水,匀浆,分成3x 50mL,并在-20℃冷冻直到分析,弃去剩余的。对粪便物质中的氮含量的分析按照上文关于模型验证描述地完成。给药前氮含量为0.82g±0.11g SD/100g粪便物质,其与给药后1周或2周的(分别为0.75g±0.08g SD/100g粪便物质和0.78g±0.07g SD/100g粪便物质)没有显著差异。作为蛋白酶功效的替代评估,对给药前和给药后的血清样品中的氨基酸进行定量。在小型猪中的先前研究已示出,响应于各种饲喂的蛋白来源,血浆中的餐后氨基酸有差异地增加(Hagemeister等人,J.Nutrition,1990,120:1305-1311),因此该量度可用于评价当与含蛋白膳食一起给药时改进的蛋白酶活性。样品在餐前2小时(给药前第-6天和给药第12天)以及餐后0.75、1.25、1.75、2.25、4.25、8.25和24*小时(给药前第-3天和给药第14天;*24小时时间点实际在饲喂前的第二天获得)获得。在指定的时间点(±10%标称时间),通过颈静脉或其他适当血管的直接静脉穿刺采集3mL全血。允许血液在室温凝结~30分钟,然后在~4℃以~3000RPM离心~15分钟。将血清样品等分到预先标记的主要和备用冷冻瓶中,并在~70℃储存直至分析。如下制备用于氨基酸定量的血清样品:量取200uL血清到1.5mL Eppendorf离心瓶中,以1:1(V:V)的比例添加6%磺基水杨酸,将混合物充分匀浆。在4℃静置10分钟后,将混合物在冷藏条件(4℃)以16.0rcf旋转15分钟。然后,将25uL上清液上样到全自动化Biochrom 30+氨基酸分析仪(UK)上,该分析仪使用阳离子交换柱分离个体氨基酸,并使用柱后茚三酮比色进行定量。用于生物流体的氨基酸标准品购自Sigma。添加正亮氨酸作为QC的内标。数据分析在GraphPad Prism 7(GraphPad)中进行。给药前和给药后的餐前值没有显著差异。与给药前相比,九种必需氨基酸中的八种(EAA;甲硫氨酸、亮氨酸、缬氨酸、异亮氨酸、苯丙氨酸、组氨酸、赖氨酸和苏氨酸)在给药后的餐后血清样品中显著升高;第九种(色氨酸)也示出给药后的增加,尽管没有达到统计学显著性。图1示出用SEQ ID NO:756给药14天后,必需氨基酸总量在餐后显著增加。另外,在蛋白酶给药14天后,五种条件性必需氨基酸(酪氨酸、甘氨酸、脯氨酸、丝氨酸和鸟氨酸)在餐后显著升高,并且第六种(精氨酸)示出一些增加,尽管没有达到统计学显著性。
实施例7:蛋白酶变体在外分泌胰功能不全(EPI)的小猪模型中的体内表征
将工程化脂肪酶变体SEQ ID NO:1364和工程化蛋白酶变体SEQ ID NO:2332的表达构建体转化到大肠杆菌中,并以15L形制的进料批次发酵所得菌株。在发酵阶段结束时,通过离心收获细胞。
将收获的细胞重悬并通过快速压力变化裂解。通过絮凝和离心对全细胞裂解物进行澄清。然后通过添加亲液盐(kosmotropic salts)将可溶性靶蛋白酶可逆地从溶液中沉淀出来,并通过离心进行收集。将收集的蛋白酶沉淀再溶解。进行切向流过滤以浓缩再溶解的蛋白酶,并将其缓冲液交换到制剂缓冲液中。将所得渗余物(retentate)冷冻干燥以获得酶粉末。
经验证的Sinclair小猪EPI手术模型(n=4只雌性,47kg平均BW,年龄2.5-3岁,和n=8只雌性,31.6kg平均BW,年龄1.3岁)进一步用于体内研究以评价工程化蛋白酶变体,所述与工程化脂肪酶共给药以用于维持。从给药前21天开始,停止治疗以诱导疾病状态,并且每天一次饲喂高蛋白饮食,[HPD;与预分份的3.9oz一杯的未加甜味剂的苹果酱混合的Sinclair高蛋白饮食S-11(23.79%蛋白、5.65%脂肪)],为功效研究做准备。在给药日期间,依次为每只猪准备膳食,以确保摄取前离体药物与膳食脂肪和蛋白的相互作用最低。简言之,适合猪体重的S-11小猪饲料(600g或450g)首先在干净的饲喂碗中分份。接下来,将酶(液体配制的SEQ ID NO:1364和冻干的SEQ ID NO:2332)混合到3.9oz一杯的未加甜味剂的苹果酱中,以允许酸性pH防止早期酶活化。脂肪酶给药(1333U/g脂肪)基于USP脂肪酶单位,并通过USP测定(美国药典和国家处方集(United StatesPharmacopeia and National Formulary)(USP 42-NF 37).Rockville,MD:美国药典委员会(United States Pharmacopeial Convention);2016)以及膳食中提供的总计算脂肪来确定。蛋白酶给药(8.95mg酶/g蛋白)基于冻干粉末中的酶含量计算,通过SDS-PAGE和膳食中提供的总计算蛋白来确定。给药的总单位为33892U或45189U脂肪酶和137U或183U蛋白酶,这根据与所提供的S-11饮食的量对应的小猪体重而异。然后将酶-苹果酱混合物转移到S-11小猪饲料中并快速混合。在准备好后,将饲喂碗立即提供给小猪,然后进入接下来的准备。2小时后,移走饲喂碗;猪在30分钟或更短时间内吃完整顿饭。研究采用交叉设计;给药阶段持续14天的持续时间,间隔14天,每天一次HPD冲刷(washout)。在给药临开始前的适应期间的连续3天,以及第12、13、14天(给药阶段1)、第27、28、29天(冲刷)和第41、42、43天(给药阶段2)收集24小时内的总粪便输出。粪便样品通过以下制备:向各个每日总粪便收集物添加大约1.5x粪便净重的体积的蒸馏水,匀浆,分成3x 50mL,并在-20℃冷冻直到分析,丢弃其余。对粪便物质中的脂肪(通过修改的Van de Kamer方法;参见Van de Kamer,于Seligson(编著),Standard Methods of Clinical Chemistry,volume 2,AcademicPress,New York,NY[1958],pp.34–39中)和氮(用Vario Max CN机器通过燃烧法的Kjeldahl总氮量;参见Watson等人,于Peters等人(编著)Recommended Methods of ManureAnalysis,Univ.of Wisconsin Cooperative Extension Publishing,PublicationNo.A3769.Madison,WI.[2003],p.18-24中)含量进行定量。在给药阶段之前,氮含量为0.634g±0.09g SD/100g粪便物质(适应)和0.834±0.14g SD/100g(冲刷),这在第1阶段或第2阶段给药后(分别为0.78g±0.14g SD/100g粪便物质和0.872g±0.17g SD/100g粪便物质)没有显著差异。作为蛋白酶功效的替代评估,对给药前和给药后的血清样品中的氨基酸进行定量。在小猪中的先前研究已示出,响应于各种饲喂的蛋白来源,血浆中的餐后氨基酸有差异地增加(Hagemeister等人,The Journal of Nutrition,1990,120(11):1305-1311)。在第-1、14、27和42天,在餐前2小时以及餐后1、1.5、2、2.5、4.5、6.5和8.5小时获得样品。在指定的时间点(±10%标称时间),通过颈静脉或其他适当血管的直接静脉穿刺采集3mL全血。允许血液在室温凝结~30分钟,然后在~4℃以~3000RPM离心~15分钟。将血清样品等分到预先标记的主要和备用冷冻瓶中,并在~70℃储存直至分析。通过以下制备用于氨基酸定量的血清样品:用含0.1%甲酸的乙腈稀释,以4,000RPM离心10分钟,并转移上清液用于LC-MS/MS(HILIC)分析。数据分析在GraphPad Prism 7(GraphPadSoftware,San Diego,CA)中进行。给药前和给药后的餐前值没有显著差异。与给药前相比,九种必需氨基酸中的五种(EAA;亮氨酸、缬氨酸、异亮氨酸、色氨酸和赖氨酸)的AUC在给药后的餐后血清样品中显著升高。另外,蛋白酶给药14天后,酪氨酸和精氨酸的AUC在餐后显著升高。
出于所有目的,本申请中引用的所有出版物、专利、专利申请和其他文件在此通过引用以其整体并入,其程度如同每个单独的出版物、专利、专利申请或其他文件被单独地指出出于所有目的通过引用并入一样。
虽然已说明并描述了多种具体实施方案,但是应当理解,可以进行各种改变,而不偏离本发明的精神和范围。
Claims (79)
1.一种重组蛋白酶,所述重组蛋白酶包含含有与SEQ ID NO:2的至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列。
2.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。
3.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:2具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自236、258、261、339、439、446和454的一个或更多个位置处包含至少一个取代,其中所述多肽序列的氨基酸位置参考SEQID NO:2来编号。
4.根据权利要求5所述的重组蛋白酶,其中位置236、258、261、339、439、446和454处的取代选自236V、258K、261L、339M、339W、439M、446A、446G、446L、446M、446T和454L。
5.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:2具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:107/536、162/408、168/547、208/366/504/591、208/485/526、210/223/258/552、210/241/258/599、223/241/258/599、223/429/481/533、223/481/533/552、225、225/260/263/265/544、225/262、225/362/366/591、225/366、225/482/591、244、258、258/318/429、258/449/481、258/481、261、261/504、318/481、318/533、318/599、339、342、345、362/366/485/591、363、366、366/485、366/497、366/526/591、366/591、408、427、446、448、449、450、481/533/552、482、482/485、482/591、485、485/591、533、533/552、536、544、547、549、565、615和652,其中所述多肽序列的氨基酸位置参考SEQ ID NO:2来编号。
6.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:34具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:258、258/261/342/345、258/261/342/504/533、258/261/345/504/549、258/261/482/504/549、258/342、258/342/504/533/536/549、258/345/427、258/408/427/504/549、258/427、258/427/482/504/533/536、258/427/482/536、261/342/345/536、261/342/482/504/533/536、261/342/482/504/549、261/342/482/536、261/342/533、261/482、318/339/362/544/547、318/339/448/544、318/339/547、318/448/544/615、339/362/363/544/547/615、339/362/544、339/448、339/448/547、339/544/547、342、342/408、342/408/536、342/482/536、362/363/544/547、362/448、363/544/547、427/482/504/533/536、427/533/536/549、448、448/544和448/544/547/615,其中所述多肽序列的氨基酸位置参考SEQ ID NO:34来编号。
7.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:190具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自205、505、541、556和646的一个或更多个位置处包含至少一个取代或取代集,其中所述多肽序列的氨基酸位置参考SEQ ID NO:190来编号。
8.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:190具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:205、220、239、261、261/339、261/339/547、261/536、261/536/547、339/427/536、339/427/536/547、339/427/547、405、442、505、539、541、542、545、556、558、594、631、663和665,其中所述多肽序列的氨基酸位置参考SEQ ID NO:190来编号。
9.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:292具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:205/442/505/536/545/620/646、205/505/536/541/545/547/558/646/665、258、263、355/536/545/547、359、366、446、449、505/536/545/558/646、506、555、556、620和650,其中所述多肽序列的氨基酸位置参考SEQ ID NO:292来编号。
10.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:342具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:283/319/359/449/450/506、283/345/359/449/450/553/555、283/449/450/508/541/553/555、449/450、450/508/553/555/558、508和508/541/553,其中所述多肽序列的氨基酸位置参考SEQ ID NO:342来编号。
11.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:396或1366具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:205、205/442/449/450、205/450/536/545、205/450/536/545/646、258/442/446、258/442/449/646、258/450/536/545、308、361、439、442/446/536/545/620/646、442/450/536/545、514、535、577、591、592、610、639、643和644,其中所述多肽序列的氨基酸位置参考SEQ ID NO:396或1366来编号。
12.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:400或1370具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:32/490/639、236、236/238/404/480/555/568/592、236/359/404/406/555/639、236/359/490/581/639、236/359/555、236/359/609、236/370/406/568/581、236/370/568/592、236/370/581、236/404/406/480/490、236/404/555/581/609/639、236/568、236/592、236/639、238/359/370/404/490/568/639、245/363/408/512/514/596/666、245/363/512/514/537/560、308/514/535/639/644、359/404、359/404/406/490/546/581、363/408/512/514/537、363/408/601/650、363/639/644、408/512、408/514/537、408/514/560/650、490/568/592/639、512/537/560/601、514/535/546/575/644、514/639/644、514/644、535/575/639/644、535/639/643/644、535/643/644和601/650,其中所述多肽序列的氨基酸位置参考SEQ ID NO:400或1370来编号。
13.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:454或1424具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:236、236/308/370/548、236/308/490/581/643、236/308/555/560/596、236/370、236/370/490/639、236/555、236/560/581、245/359/363/406/535/650、245/363/406/575/601/666、300、301、308、308/490/560/581/639/643、336、359/363/406/535/601/650、359/404/406/535、359/406/575/650/666、359/535/575/601、363/404/406/535/568、404/406/535、406、406/480/535/568/601、406/535/575、468和480/575/601/650,其中所述多肽序列的氨基酸位置参考SEQ ID NO:454或1424来编号。
14.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:562或1532具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:133/301/346/347/468、205/236/347、205/236/370/490/537/620、205/342/439/442/514/620/639、205/370/537、205/442/505/620、236/258/370/505/545/639、236/339/514、236/370/450/620、236/545、258/339/342/505/537、258/342/370/408/442/537、300/301/308/346/347/468、300/301/347/468、301/308/336/346/406/468/601、301/308/346/406/468、301/308/468/601、301/347/406、308/336/347/468、308/347/468、342、342/408/490/505/514/545/639/646、342/620、370/442、370/537/639、489、539/649、542、543、543/673、558、559、566、634和661,其中所述多肽序列的氨基酸位置参考SEQ ID NO:562或1532来编号。
15.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:562或1532具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:205/236/342/439/505/514/537/545、236/342/505/514/537/545、300/301/308/336/347/468/601、300/301/347/406、301/308/346/347/468、301/336/346/347/406/601和308/336/347/406/468/601,其中所述多肽序列的氨基酸位置参考SEQ ID NO:562或1532来编号。
16.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:638或1608具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:46/511/537、346/511/537/541/543、346/511/542/582、346/511/581/582、346/511/583、346/529/571/581/582/583/589、511/537、516/539/568、537/582、539、568/662/663和581/582,其中所述多肽序列的氨基酸位置参考SEQ IDNO:638或1608来编号。
17.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:638或1608具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:346/511/537/582、346/511/543/582、346/511/544、346/537/542/544、346/543/544、346/583、511/537/542/582/583、516、516/539/555、537/543/582、539/568、540、542/544/581、548、549、559、559/568、582、647、650和664,其中所述多肽序列的氨基酸位置参考SEQ ID NO:638或1608来编号。
18.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:680或1650具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:261/355/543、261/355/567/568、261/489、261/489/511/568、261/489/539、261/489/567、261/539/543、261/539/543/567、261/542/543/568、511、511/539/543、511/567、543和583,其中所述多肽序列的氨基酸位置参考SEQ ID NO:680或1650来编号。
19.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:756或1726具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:9、9/17/34/35/93/554、9/17/50、9/17/93、9/29/35/43/77/542/554、9/32/77/93、9/43/77、9/50/63/93、9/93、17/29/34/35/36/77/93、17/32/34/35、17/77、32/34/93、43、50/77/93、50/93、77/93、93、205/263/470、205/344/470/565、205/345/470/538/664、205/470/545/568/645/647/664、205/470/567/568/645、263/344/664、263/470/645、263/489、263/539/541/568/645、344/355/470/489/645、344/355/470/568/645/647、344/470/489/539/542/645/647/664、344/470/489/567/568、344/470/568、344/470/647、470、470/489、470/541/542/543/565/645/647、470/567/568、470/664和542/543,其中所述多肽序列的氨基酸位置参考SEQ ID NO:756或1726来编号。
20.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:756或1726具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:9/17/32/34/36/50/77/107/127、9/17/63/77、9/43/93/127、9/63/93/107、17/29/32/34/36/63、29/34/35/77、32/43/93、35/93/145和205/263/489/647,其中所述多肽序列的氨基酸位置参考SEQ ID NO:756或1726来编号。
21.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:812或1782具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自188、189、265、266、334、442、454、646和649的一个或更多个位置处包含至少一个取代或取代集,其中所述多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。
22.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:812或1782具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自189、266、266/283、546、594和646的一个或更多个位置处包含至少一个取代或取代集,其中所述多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。
23.根据权利要求1的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:812或1782具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自263/470/568、266、470/542/543/664和558/577/594的一个或更多个位置处包含至少一个取代或取代集,其中所述多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。
24.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:812或1782具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:29、29/35、29/35/342/581/582/664、29/50/511/539/581、35、35/50/205/406/511/581、35/205/511、35/342/346/511/539/581、35/346、35/346/406/511/581/582/664、35/511、35/539、50/342、132、133、143、147、187、188、257、258、263、294、294/441/527、308/342/511/581/582、342、346、398、406/664、429/652、441、441/446/526、446/652、482、505、511、526、527、536、545、581、582、615、620、639、645、646、648、652、654和664,其中所述多肽序列的氨基酸位置参考SEQ ID NO:812或1782来编号。
25.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:1030或2000具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:29、29/143/263/266/441/639、29/263/266、29/263/266/441/620、29/266/441、29/441/639、30、37、47/570、75、81、85、92、135、143、143/263/266/639、143/266/441/620/639、168、189/424、237/527、244、258/342/582/648、263、263/266/441、263/266/639、266/441、266/441/620/639、266/620/639、266/639、267、342/526/664、342/545、342/582、429、441、482、495、501、523、526、527、568、570、573、581、582、616、632、648、653和654,其中所述多肽序列的氨基酸位置参考SEQ ID NO:1030或2000来编号。
26.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:1136或2106具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:29、29/30、29/30/143/263/482/646、29/30/263、29/30/616/648、29/75/263/568/570/648、29/168/648、29/263/527/568、75、75/143/168/527、75/168、75/616、143、168/247/482/648、168/263/616、168/482/616、168/495/616、263、263/616、429/545、495和527,其中所述多肽序列的氨基酸位置参考SEQ ID NO:1136或2106来编号。
27.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:1136或2106具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自207、222、266、307、454、535、546、548、580、604和610的一个或更多个位置处包含至少一个取代或取代集,其中所述多肽序列的氨基酸位置参考SEQ ID NO:1136或2106来编号。
28.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:1180或2150具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:75/168/207/454/568/586/610/648/659、75/168/266/454/546/570/580、75/207/454/570/659、75/207/546/580/648、75/263/454/548/568/604/648、75/266/454、75/454、75/454/546/548/568/604、75/546/548/610/648、168/207/263/454/568/570/604、168/263/266/546/604、168/454/604、207/604/610、209、212、221、223、228、266/454/568、319、373、412/546/554、431、454、454/546/568/570/580、454/546/570、454/570/580/610、454/580、454/659和506,其中所述多肽序列的氨基酸位置参考SEQID NO:1180或2150来编号。
29.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:1250或2220具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自以下的一个或更多个位置处包含至少一个取代或取代集:75/189/373/582、75/200/212/431/482、75/212/373/431/482、75/212/431/482/568/615/664、75/368/582、75/373/431/526/582、75/431/482/570/604/664、75/632、189/212/431/568/570、200/205/373/431、200/431/482/615/664、200/482/664、212/228/431、212/228/568/570/582/664、212/373/446/482/582、368/373/431、373/431/570/604/664、373/568/632、431、431/604/664、482/582、582和615/652/664,其中所述多肽序列的氨基酸位置参考SEQ ID NO:1250或2220来编号。
30.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含与SEQ ID NO:1308或2278具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述重组蛋白酶在选自408/439、439/514、470、470/667、514、514/537和537的一个或更多个位置处包含至少一个取代或取代集,其中所述多肽序列的氨基酸位置参考SEQ ID NO:1308或2278来编号。
31.根据权利要求1所述的重组蛋白酶,其中所述重组蛋白酶包含表3.1、表3.2、表3.3、表3.4、表3.5、表3.6、表3.7、表3.8、表3.9、表3.10、表3.11、表3.12、表3.13、表3.14、表3.15、表3.16、表3.17、表3.18、表3.19、表3.20、表3.21、表3.22、表3.23、表3.24、表3.25、表3.26表和/或表3.27中提供的至少一个位置中的至少一个突变,其中所述位置参考SEQ IDNO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278来编号。
32.根据权利要求1所述的重组蛋白酶,所述重组蛋白酶包含选自SEQ ID NO:4-1362和1366-2332中的偶数编号序列的多肽序列。
33.根据权利要求32所述的重组蛋白酶,所述重组蛋白酶包含选自SEQ ID NO:4-1362中的偶数编号序列的多肽序列。
34.根据权利要求32所述的重组蛋白酶,所述重组蛋白酶包含选自SEQ ID NO:1366-2332中的偶数编号序列的多肽序列。
35.根据权利要求1所述的重组蛋白酶,所述重组蛋白酶包含选自SEQ ID NO:1348-1362和2318-2332中的偶数编号序列的多肽序列。
36.根据权利要求1所述的重组蛋白酶,所述重组蛋白酶包含选自SEQ ID NO:34、190、292、342、382、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1364、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220、2278和2332的多肽序列。
37.根据权利要求1-36中任一项所述的重组蛋白酶,其中所述重组蛋白酶比SEQ IDNO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更热稳定。
38.根据权利要求1-37中任一项所述的重组蛋白酶,其中所述重组蛋白酶在酸性pH条件下比SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。
39.根据权利要求1-38中任一项所述的重组蛋白酶,其中所述重组蛋白酶在pH 7或更高时比SEQ ID NO:2、34、190、292、342、382、396、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。
40.根据权利要求1-39中任一项所述的重组蛋白酶,其中所述重组蛋白酶在酸性pH条件和pH 7或更高的条件下比SEQ ID NO:2、34、190、292、342、382、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更稳定。
41.根据权利要求1-40中任一项所述的重组蛋白酶,其中所述重组蛋白酶比SEQ IDNO:2、34、190、292、342、382、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更抗蛋白水解。
42.根据权利要求1-41中任一项所述的重组蛋白酶,其中所述重组蛋白酶比SEQ IDNO:2、34、190、292、342、382、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶对自溶更稳定。
43.根据权利要求1-42中任一项所述的重组蛋白酶,其中所述重组蛋白酶在pH 7或更低时比SEQ ID NO:2、34、190、292、342、382、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更有活性。
44.根据权利要求1-43中任一项所述的重组蛋白酶,其中所述重组蛋白酶在存在至少一种胆盐的情况下比SEQ ID NO:2、34、190、292、342、382、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1366、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和/或2278的蛋白酶更有活性。
45.根据权利要求1-44中任一项所述的重组蛋白酶,其中所述重组蛋白酶是纯化的。
46.根据权利要求1-44中任一项所述的重组蛋白酶,其中与参考序列相比,所述重组蛋白酶表现出至少一种选自以下的改进的特性:i)增强的催化活性;ii)增加的对酸性pH的耐受性;iii)增加的对pH 4或更低的耐受性;iv)增加的对pH 5或更高的耐受性;v)增加的对至少一种蛋白酶的耐受性;vi)增加的对至少一种胆盐的耐受性;vii)增加的耐热性;viii)增加的对自溶的耐受性;或i)、ii)、iii)、iv)、v)、vi)、vii)和viii)的任何组合。
47.根据权利要求46所述的重组蛋白酶,其中所述参考序列是SEQ ID NO:2。
48.根据权利要求46所述的重组蛋白酶,其中所述参考序列选自SEQ ID NO:34、190、292、342、382、400、454、562、638、680、756、812、1030、1136、1180、1250、1308、1364、1370、1424、1532、1608、1650、1726、1782、2000、2106、2150、2220和2278。
49.一种组合物,所述组合物包含至少一种权利要求1-48中任一项所述的重组蛋白酶。
50.一种重组多核苷酸序列,所述重组多核苷酸序列编码至少一种权利要求1-48中任一项所列的重组蛋白酶。
51.根据权利要求50所述的重组多核苷酸序列,其中所述多核苷酸序列是密码子优化的。
52.一种表达载体,所述表达载体包含至少一种权利要求50或51所述的重组多核苷酸序列。
53.根据权利要求52所述的表达载体,其中所述重组多核苷酸序列可操作地连接至控制序列。
54.根据权利要求52或53所述的表达载体,其中所述控制序列是启动子。
55.根据权利要求54所述的表达载体,其中所述启动子是异源启动子。
56.一种宿主细胞,所述宿主细胞包含权利要求52-55中任一项所述的表达载体。
57.根据权利要求56所述的宿主细胞,其中所述宿主细胞是真核的或原核的。
58.一种产生重组蛋白酶的方法,所述方法包括将权利要求56或57所述的所述宿主细胞在产生由所述重组多核苷酸编码的所述重组蛋白酶的条件下培养。
59.根据权利要求58所述的方法,所述方法还包括回收所述蛋白酶的步骤。
60.根据权利要求59所述的方法,所述方法还包括纯化所述蛋白酶的步骤。
61.一种药物组合物,用于治疗胰功能不全,所述药物组合物包含权利要求49所述的组合物。
62.根据权利要求61所述的药物组合物,所述药物组合物还包含药学上可接受的载体和/或赋形剂。
63.根据权利要求61或62所述的药物组合物,其中所述组合物还包含至少一种脂肪酶。
64.根据权利要求61-63中任一项所述的药物组合物,其中所述组合物还包含至少一种淀粉酶。
65.根据权利要求61-64中任一项所述的药物组合物,其中所述组合物还包含胰提取物,所述胰提取物包含至少一种蛋白酶、至少一种脂肪酶和至少一种淀粉酶。
66.根据权利要求61-65中任一项所述的药物组合物,其中所述组合物适用于肠胃外注射或输注、皮下注射、吸入或皮肤应用至人类。
67.根据权利要求61-65中任一项所述的药物组合物,其中所述组合物适用于口服施用至人类。
68.根据权利要求67所述的药物组合物,其中所述组合物还包含肠溶包衣。
69.一种用于治疗和/或预防受试者的胰功能不全的症状的方法,所述方法包括向患有胰功能不全的受试者提供权利要求71-68中任一项所述的药物组合物。
70.根据权利要求69所述的方法,其中所述胰功能不全的症状得到改善。
71.根据权利要求69或70所述的方法,其中所述受试者能够食用比表现出所述胰功能不全的症状的受试者所需的饮食在其蛋白含量方面限制更少的饮食。
72.根据权利要求69-71中任一项所述的方法,其中所述受试者是人类患者。
73.根据权利要求72所述的方法,其中所述人类患者是婴儿或儿童。
74.根据权利要求73所述的方法,其中所述人类患者是成年人或年轻人。
75.根据权利要求69-71中任一项所述的方法,其中所述受试者是非人类哺乳动物。
76.权利要求1-47中任一项所述的重组蛋白酶或权利要求49和61-68中任一项所述的组合物,用于用作药物。
77.权利要求1-47中任一项所述的重组蛋白酶或权利要求49和61-68中任一项所述的组合物,用于用作营养补充剂。
78.权利要求1-47中任一项所述的重组蛋白酶或权利要求49和61-68中任一项所述的组合物,用于治疗或预防胰功能不全的症状。
79.权利要求49和61-68中任一项中提供的所述组合物的用途。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063071625P | 2020-08-28 | 2020-08-28 | |
US63/071,625 | 2020-08-28 | ||
PCT/US2021/048105 WO2022047262A1 (en) | 2020-08-28 | 2021-08-27 | Engineered protease variants |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117098847A true CN117098847A (zh) | 2023-11-21 |
Family
ID=80354111
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180073590.9A Pending CN117098847A (zh) | 2020-08-28 | 2021-08-27 | 工程化蛋白酶变体 |
Country Status (8)
Country | Link |
---|---|
US (1) | US11959108B2 (zh) |
EP (1) | EP4204554A4 (zh) |
JP (1) | JP2023539632A (zh) |
CN (1) | CN117098847A (zh) |
AU (1) | AU2021334371A1 (zh) |
BR (1) | BR112023003606A2 (zh) |
CA (1) | CA3191867A1 (zh) |
WO (1) | WO2022047262A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024036099A1 (en) * | 2022-08-08 | 2024-02-15 | Waters Technologies Corporation | Engineered proteases with enhanced autolysis resistance |
Family Cites Families (70)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6165793A (en) | 1996-03-25 | 2000-12-26 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US6395547B1 (en) | 1994-02-17 | 2002-05-28 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US5837458A (en) | 1994-02-17 | 1998-11-17 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US6117679A (en) | 1994-02-17 | 2000-09-12 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US6335160B1 (en) | 1995-02-17 | 2002-01-01 | Maxygen, Inc. | Methods and compositions for polypeptide engineering |
US6309883B1 (en) | 1994-02-17 | 2001-10-30 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
US5834252A (en) | 1995-04-18 | 1998-11-10 | Glaxo Group Limited | End-complementary polymerase reaction |
US20060257890A1 (en) | 1996-05-20 | 2006-11-16 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US6406855B1 (en) | 1994-02-17 | 2002-06-18 | Maxygen, Inc. | Methods and compositions for polypeptide engineering |
US6995017B1 (en) | 1994-02-17 | 2006-02-07 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US5928905A (en) | 1995-04-18 | 1999-07-27 | Glaxo Group Limited | End-complementary polymerase reaction |
ATE294871T1 (de) | 1994-06-30 | 2005-05-15 | Novozymes Biotech Inc | Nicht-toxisches, nicht-toxigenes, nicht- pathogenes fusarium expressionssystem und darin zu verwendende promotoren und terminatoren |
FI104465B (fi) | 1995-06-14 | 2000-02-15 | Valio Oy | Proteiinihydrolysaatteja allergioiden hoitamiseksi tai estämiseksi, niiden valmistus ja käyttö |
US6096548A (en) | 1996-03-25 | 2000-08-01 | Maxygen, Inc. | Method for directing evolution of a virus |
US6506602B1 (en) | 1996-03-25 | 2003-01-14 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
WO1998031816A1 (en) | 1997-01-17 | 1998-07-23 | Regents Of The University Of Minnesota | Dna molecules and protein displaying improved triazine compound degrading ability |
US6326204B1 (en) | 1997-01-17 | 2001-12-04 | Maxygen, Inc. | Evolution of whole cells and organisms by recursive sequence recombination |
IL130635A0 (en) | 1997-01-17 | 2000-06-01 | Maxygen Inc | Evolution of whole cells and organisms by recursive sequence recombination |
US7148054B2 (en) | 1997-01-17 | 2006-12-12 | Maxygen, Inc. | Evolution of whole cells and organisms by recursive sequence recombination |
DK2270234T3 (da) | 1997-12-08 | 2013-06-03 | California Inst Of Techn | Fremgangsmåde til fremstilling af polynukleotid- og polypeptidsekvenser |
JP2002510506A (ja) | 1998-04-02 | 2002-04-09 | テラス ジェネティック リソーシズ,インコーポレイティド | 遺伝子配列に遺伝障害を有する植物を得る方法 |
CN1314911A (zh) | 1998-05-01 | 2001-09-26 | 麦克西根股份有限公司 | 用dna改组优化害虫抗性基因 |
KR20010052894A (ko) | 1998-06-17 | 2001-06-25 | 맥시겐, 인크. | 목적하는 특성을 보유한 폴리뉴클레오티드를 생성하는 방법 |
US6365408B1 (en) | 1998-06-19 | 2002-04-02 | Maxygen, Inc. | Methods of evolving a polynucleotides by mutagenesis and recombination |
US6605430B1 (en) | 1998-08-12 | 2003-08-12 | Maxygen, Inc. | DNA shuffling of monooxygenase genes for production of industrial chemicals |
EP1119616A2 (en) | 1998-10-07 | 2001-08-01 | Maxygen, Inc. | Dna shuffling to produce nucleic acids for mycotoxin detoxification |
WO2000028018A1 (en) | 1998-11-10 | 2000-05-18 | Maxygen, Inc. | Modified adp-glucose pyrophosphorylase for improvement and optimization of plant phenotypes |
JP4221100B2 (ja) | 1999-01-13 | 2009-02-12 | エルピーダメモリ株式会社 | 半導体装置 |
US6376246B1 (en) | 1999-02-05 | 2002-04-23 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
US6368861B1 (en) | 1999-01-19 | 2002-04-09 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
US6917882B2 (en) | 1999-01-19 | 2005-07-12 | Maxygen, Inc. | Methods for making character strings, polynucleotides and polypeptides having desired characteristics |
US6436675B1 (en) | 1999-09-28 | 2002-08-20 | Maxygen, Inc. | Use of codon-varied oligonucleotide synthesis for synthetic shuffling |
US7024312B1 (en) | 1999-01-19 | 2006-04-04 | Maxygen, Inc. | Methods for making character strings, polynucleotides and polypeptides having desired characteristics |
US7873477B1 (en) | 2001-08-21 | 2011-01-18 | Codexis Mayflower Holdings, Llc | Method and system using systematically varied data libraries |
US20070065838A1 (en) | 1999-01-19 | 2007-03-22 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
US6961664B2 (en) | 1999-01-19 | 2005-11-01 | Maxygen | Methods of populating data structures for use in evolutionary simulations |
US8457903B1 (en) | 1999-01-19 | 2013-06-04 | Codexis Mayflower Holdings, Llc | Method and/or apparatus for determining codons |
US7702464B1 (en) | 2001-08-21 | 2010-04-20 | Maxygen, Inc. | Method and apparatus for codon determining |
EP2253704B1 (en) | 1999-01-19 | 2015-08-19 | Codexis Mayflower Holdings, LLC | Oligonucleotide mediated nucleic acid recombination |
IL144657A0 (en) | 1999-02-11 | 2002-06-30 | Maxygen Inc | High throughput mass spectrometry |
CA2364997A1 (en) | 1999-03-05 | 2000-09-08 | Maxygen, Inc. | Encryption of traits using split gene sequences |
US6703240B1 (en) | 1999-04-13 | 2004-03-09 | Maxygar, Inc. | Modified starch metabolism enzymes and encoding genes for improvement and optimization of plant phenotypes |
US7430477B2 (en) | 1999-10-12 | 2008-09-30 | Maxygen, Inc. | Methods of populating data structures for use in evolutionary simulations |
US6519065B1 (en) | 1999-11-05 | 2003-02-11 | Jds Fitel Inc. | Chromatic dispersion compensation device |
US6686515B1 (en) | 1999-11-23 | 2004-02-03 | Maxygen, Inc. | Homologous recombination in plants |
JP2003519495A (ja) | 2000-01-11 | 2003-06-24 | マキシジェン, インコーポレイテッド | 多様性生成およびスクリーニングのための一体化されたシステムおよび方法 |
EP1272967A2 (en) | 2000-03-30 | 2003-01-08 | Maxygen, Inc. | In silico cross-over site selection |
JP2004508011A (ja) | 2000-04-03 | 2004-03-18 | マキシジェン, インコーポレイテッド | スブチリシン変異体 |
US20050084907A1 (en) | 2002-03-01 | 2005-04-21 | Maxygen, Inc. | Methods, systems, and software for identifying functional biomolecules |
WO2003075129A2 (en) | 2002-03-01 | 2003-09-12 | Maxygen, Inc. | Methods, systems, and software for identifying functional bio-molecules |
US7747391B2 (en) | 2002-03-01 | 2010-06-29 | Maxygen, Inc. | Methods, systems, and software for identifying functional biomolecules |
WO2003078583A2 (en) | 2002-03-09 | 2003-09-25 | Maxygen, Inc. | Optimization of crossover points for directed evolution |
WO2005017135A1 (en) | 2003-08-11 | 2005-02-24 | Codexis, Inc. | Improved ketoreductase polypeptides and related polynucleotides |
US7553653B2 (en) | 2004-09-17 | 2009-06-30 | Biomarin Pharmaceutical Inc. | Variants and chemically-modified variants of phenylalanine ammonia-lyase |
EP2886658A1 (en) | 2005-03-10 | 2015-06-24 | BASF Enzymes LLC | Lyase enzymes, nucleic acids encoding them and methods for making and using them |
US7534595B2 (en) | 2006-06-12 | 2009-05-19 | Biomarin Pharmaceutical Inc. | Compositions of prokaryotic phenylalanine ammonia-lyase and methods of using compositions thereof |
US7531341B1 (en) | 2006-06-12 | 2009-05-12 | Biomarin Pharmaceutical Inc. | Compositions of prokaryotic phenylalanine ammonia-lyase and methods of using compositions thereof |
US8211428B2 (en) | 2006-07-05 | 2012-07-03 | Torrey Pines Institute For Molecular Studies | Protease screening methods and proteases identified thereby |
US7537923B2 (en) | 2007-08-17 | 2009-05-26 | Biomarin Pharmaceutical Inc. | Compositions of prokaryotic phenylalanine ammonia-lyase and methods of treating cancer using compositions thereof |
US8504498B2 (en) | 2008-02-12 | 2013-08-06 | Codexis, Inc. | Method of generating an optimized, diverse population of variants |
WO2009102901A1 (en) | 2008-02-12 | 2009-08-20 | Codexis, Inc. | Method of generating an optimized, diverse population of variants |
HUE041367T2 (hu) | 2008-06-13 | 2019-05-28 | Codexis Inc | Eljárás polinukleotid-változatok szintézisére |
US20090312196A1 (en) | 2008-06-13 | 2009-12-17 | Codexis, Inc. | Method of synthesizing polynucleotide variants |
US8383346B2 (en) | 2008-06-13 | 2013-02-26 | Codexis, Inc. | Combined automated parallel synthesis of polynucleotide variants |
DK3025728T3 (en) | 2010-02-04 | 2018-10-29 | Biomarin Pharm Inc | PROCEDURE FOR PURIFICATION OF PROKARYOTIC PHENYLALANINE AMMONIAK LYASE VARIATIONS |
DK2726651T3 (en) | 2011-06-28 | 2019-01-28 | Codexis Inc | PROTEIN INVARIANT GENERATION BY REGION SHUFFLING |
US20150133698A1 (en) | 2012-04-20 | 2015-05-14 | Codexis, Inc. | Production of fatty alcohols from engineered microorganisms |
KR102215219B1 (ko) | 2013-01-31 | 2021-02-16 | 코덱시스, 인코포레이티드 | 승법형 모델을 이용하여 생체분자를 확인하기 위한 방법, 시스템, 및 소프트웨어 |
EP3469088B1 (en) | 2016-06-09 | 2023-09-06 | Codexis, Inc. | Biocatalysts and methods for hydroxylation of chemical compounds |
-
2021
- 2021-08-27 AU AU2021334371A patent/AU2021334371A1/en active Pending
- 2021-08-27 JP JP2023513730A patent/JP2023539632A/ja active Pending
- 2021-08-27 CA CA3191867A patent/CA3191867A1/en active Pending
- 2021-08-27 BR BR112023003606A patent/BR112023003606A2/pt unknown
- 2021-08-27 US US17/460,141 patent/US11959108B2/en active Active
- 2021-08-27 CN CN202180073590.9A patent/CN117098847A/zh active Pending
- 2021-08-27 WO PCT/US2021/048105 patent/WO2022047262A1/en active Application Filing
- 2021-08-27 EP EP21862892.3A patent/EP4204554A4/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4204554A4 (en) | 2024-08-21 |
BR112023003606A2 (pt) | 2023-03-28 |
US20220090039A1 (en) | 2022-03-24 |
CA3191867A1 (en) | 2022-03-03 |
US11959108B2 (en) | 2024-04-16 |
EP4204554A1 (en) | 2023-07-05 |
AU2021334371A1 (en) | 2023-03-09 |
WO2022047262A1 (en) | 2022-03-03 |
JP2023539632A (ja) | 2023-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10973888B2 (en) | Human alpha-galactosidase variants | |
US12071642B2 (en) | Engineered amylase variants | |
US20210222145A1 (en) | Engineered phenylalanine ammonia lyase polypeptides | |
US20240263156A1 (en) | Engineered lipase variants | |
US11959108B2 (en) | Engineered protease variants | |
CN113544268A (zh) | 人类α半乳糖苷酶变体 | |
US20210246176A1 (en) | Mucin-binding fusion proteins | |
US20230277635A1 (en) | Engineered leucine decarboxylases | |
CN117413057A (zh) | 工程化甲硫氨酸γ裂合酶变体 | |
TW202313969A (zh) | 經工程化的甲硫胺酸γ解離酶變異體 | |
TW202233834A (zh) | 用於治療乳糜瀉的組合物及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |