CN114269398A - 通过高剪切溶解来分离蜘蛛丝蛋白的方法 - Google Patents
通过高剪切溶解来分离蜘蛛丝蛋白的方法 Download PDFInfo
- Publication number
- CN114269398A CN114269398A CN202080057878.2A CN202080057878A CN114269398A CN 114269398 A CN114269398 A CN 114269398A CN 202080057878 A CN202080057878 A CN 202080057878A CN 114269398 A CN114269398 A CN 114269398A
- Authority
- CN
- China
- Prior art keywords
- gly
- ala
- ser
- spider silk
- silk protein
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 231
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 196
- 238000000034 method Methods 0.000 title claims abstract description 127
- 229920001872 Spider silk Polymers 0.000 title claims description 127
- 238000005063 solubilization Methods 0.000 title description 10
- 230000007928 solubilization Effects 0.000 title description 10
- 239000002904 solvent Substances 0.000 claims abstract description 44
- 210000004027 cell Anatomy 0.000 claims description 130
- 239000008188 pellet Substances 0.000 claims description 61
- 239000007864 aqueous solution Substances 0.000 claims description 60
- XSQUKJJJFZCRTK-UHFFFAOYSA-N urea group Chemical group NC(=O)N XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 claims description 60
- 239000004202 carbamide Substances 0.000 claims description 34
- 239000000243 solution Substances 0.000 claims description 32
- 230000003993 interaction Effects 0.000 claims description 30
- 239000000835 fiber Substances 0.000 claims description 21
- 239000000203 mixture Substances 0.000 claims description 18
- 230000003196 chaotropic effect Effects 0.000 claims description 17
- 238000000265 homogenisation Methods 0.000 claims description 16
- 239000000126 substance Substances 0.000 claims description 16
- 238000011282 treatment Methods 0.000 claims description 13
- 108010022355 Fibroins Proteins 0.000 claims description 12
- 238000001542 size-exclusion chromatography Methods 0.000 claims description 12
- 238000002965 ELISA Methods 0.000 claims description 11
- 239000003795 chemical substances by application Substances 0.000 claims description 11
- 239000002270 dispersing agent Substances 0.000 claims description 11
- 238000004113 cell culture Methods 0.000 claims description 10
- 238000000527 sonication Methods 0.000 claims description 8
- 102220311754 rs191837710 Human genes 0.000 claims description 6
- 230000001580 bacterial effect Effects 0.000 claims description 5
- 238000010438 heat treatment Methods 0.000 claims description 5
- PJJJBBJSCAKJQF-UHFFFAOYSA-N guanidinium chloride Chemical compound [Cl-].NC(N)=[NH2+] PJJJBBJSCAKJQF-UHFFFAOYSA-N 0.000 claims description 4
- ZJYYHGLJYGJLLN-UHFFFAOYSA-N guanidinium thiocyanate Chemical compound SC#N.NC(N)=N ZJYYHGLJYGJLLN-UHFFFAOYSA-N 0.000 claims description 4
- 230000002934 lysing effect Effects 0.000 claims description 4
- 210000005253 yeast cell Anatomy 0.000 claims description 4
- 230000003381 solubilizing effect Effects 0.000 claims description 3
- 238000003556 assay Methods 0.000 claims description 2
- 230000002538 fungal effect Effects 0.000 claims description 2
- 229920001400 block copolymer Polymers 0.000 abstract description 12
- 235000018102 proteins Nutrition 0.000 description 156
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 147
- 108090000765 processed proteins & peptides Proteins 0.000 description 73
- 102000004196 processed proteins & peptides Human genes 0.000 description 69
- 108010079364 N-glycylalanine Proteins 0.000 description 68
- 229920001184 polypeptide Polymers 0.000 description 64
- 108010043293 glycyl-prolyl-glycyl-glycine Proteins 0.000 description 55
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 51
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 44
- 241000235058 Komagataella pastoris Species 0.000 description 43
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 43
- 150000007523 nucleic acids Chemical class 0.000 description 42
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 41
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 41
- VWEWCZSUWOEEFM-WDSKDSINSA-N Ala-Gly-Ala-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(O)=O VWEWCZSUWOEEFM-WDSKDSINSA-N 0.000 description 38
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 33
- PEZMQPADLFXCJJ-ZETCQYMHSA-N 2-[[2-[[(2s)-1-(2-aminoacetyl)pyrrolidine-2-carbonyl]amino]acetyl]amino]acetic acid Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(=O)NCC(O)=O PEZMQPADLFXCJJ-ZETCQYMHSA-N 0.000 description 32
- WOJJIRYPFAZEPF-YFKPBYRVSA-N 2-[[(2s)-2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]propanoyl]amino]acetate Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)CN WOJJIRYPFAZEPF-YFKPBYRVSA-N 0.000 description 31
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 31
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 31
- 108010078144 glutaminyl-glycine Proteins 0.000 description 30
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 29
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 29
- 239000013598 vector Substances 0.000 description 29
- 108010047495 alanylglycine Proteins 0.000 description 28
- 102000039446 nucleic acids Human genes 0.000 description 28
- 108020004707 nucleic acids Proteins 0.000 description 28
- 230000028327 secretion Effects 0.000 description 28
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 27
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 27
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 26
- 125000003729 nucleotide group Chemical group 0.000 description 26
- 239000002773 nucleotide Substances 0.000 description 25
- 241000239290 Araneae Species 0.000 description 24
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 24
- 239000012634 fragment Substances 0.000 description 22
- 108010010147 glycylglutamine Proteins 0.000 description 22
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 21
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 21
- 230000014509 gene expression Effects 0.000 description 21
- 108020004414 DNA Proteins 0.000 description 20
- WMYJZJRILUVVRG-WDSKDSINSA-N Ala-Gly-Gln Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O WMYJZJRILUVVRG-WDSKDSINSA-N 0.000 description 18
- 108091033319 polynucleotide Proteins 0.000 description 18
- 102000040430 polynucleotide Human genes 0.000 description 18
- 239000002157 polynucleotide Substances 0.000 description 18
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 17
- 239000012530 fluid Substances 0.000 description 16
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 15
- 244000063299 Bacillus subtilis Species 0.000 description 15
- 235000014469 Bacillus subtilis Nutrition 0.000 description 15
- 108010050848 glycylleucine Proteins 0.000 description 15
- SBGXWWCLHIOABR-UHFFFAOYSA-N Ala Ala Gly Ala Chemical compound CC(N)C(=O)NC(C)C(=O)NCC(=O)NC(C)C(O)=O SBGXWWCLHIOABR-UHFFFAOYSA-N 0.000 description 14
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 14
- 108091028043 Nucleic acid sequence Proteins 0.000 description 14
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 14
- 239000006166 lysate Substances 0.000 description 14
- 238000003752 polymerase chain reaction Methods 0.000 description 14
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 13
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 13
- 235000001014 amino acid Nutrition 0.000 description 13
- 229940024606 amino acid Drugs 0.000 description 13
- 150000001413 amino acids Chemical class 0.000 description 13
- 230000000694 effects Effects 0.000 description 13
- 210000004907 gland Anatomy 0.000 description 13
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 12
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 12
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 12
- 108091005804 Peptidases Proteins 0.000 description 12
- 108010076504 Protein Sorting Signals Proteins 0.000 description 12
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 12
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 12
- 125000003275 alpha amino acid group Chemical group 0.000 description 12
- 239000013604 expression vector Substances 0.000 description 12
- 238000011084 recovery Methods 0.000 description 12
- 239000000523 sample Substances 0.000 description 12
- 239000004365 Protease Substances 0.000 description 11
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 11
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 11
- 239000012535 impurity Substances 0.000 description 11
- COEXAQSTZUWMRI-STQMWFEESA-N (2s)-1-[2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound C([C@H](N)C(=O)NCC(=O)N1[C@@H](CCC1)C(O)=O)C1=CC=C(O)C=C1 COEXAQSTZUWMRI-STQMWFEESA-N 0.000 description 10
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 10
- 108091026890 Coding region Proteins 0.000 description 10
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 10
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 10
- 238000005119 centrifugation Methods 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- 238000012986 modification Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 241000588724 Escherichia coli Species 0.000 description 9
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 9
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 9
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 9
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 9
- JWGXUKHIKXZWNG-RYUDHWBXSA-N Tyr-Gly-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O JWGXUKHIKXZWNG-RYUDHWBXSA-N 0.000 description 9
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 9
- 108010044940 alanylglutamine Proteins 0.000 description 9
- 239000012062 aqueous buffer Substances 0.000 description 9
- 239000000872 buffer Substances 0.000 description 9
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 9
- 108010077515 glycylproline Proteins 0.000 description 9
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 9
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 8
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 8
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 8
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 8
- 238000011534 incubation Methods 0.000 description 8
- 230000035772 mutation Effects 0.000 description 8
- 238000000746 purification Methods 0.000 description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 7
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 7
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 7
- 241000880493 Leptailurus serval Species 0.000 description 7
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 7
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 7
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 7
- 210000004899 c-terminal region Anatomy 0.000 description 7
- 239000013592 cell lysate Substances 0.000 description 7
- 230000001413 cellular effect Effects 0.000 description 7
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 7
- 108010037850 glycylvaline Proteins 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 7
- 244000005700 microbiome Species 0.000 description 7
- 239000002244 precipitate Substances 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 238000000108 ultra-filtration Methods 0.000 description 7
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 6
- 241001558017 Gynura Species 0.000 description 6
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 6
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 6
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 6
- 108010005233 alanylglutamic acid Proteins 0.000 description 6
- 108010087823 glycyltyrosine Proteins 0.000 description 6
- 230000010354 integration Effects 0.000 description 6
- 108010051242 phenylalanylserine Proteins 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 241000894007 species Species 0.000 description 6
- 230000005945 translocation Effects 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- RNLSZCQFOSDZDT-HUBLWGQQSA-N (2s)-2-[[2-[[(2s)-2-[[2-[[(2s)-2-[(2-aminoacetyl)amino]propanoyl]amino]acetyl]amino]propanoyl]amino]acetyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound NCC(=O)N[C@@H](C)C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RNLSZCQFOSDZDT-HUBLWGQQSA-N 0.000 description 5
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 5
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 5
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 5
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 5
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 5
- YMIZSYUAZJSOFL-SRVKXCTJSA-N Phe-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O YMIZSYUAZJSOFL-SRVKXCTJSA-N 0.000 description 5
- LZHHZYDPMZEMRX-STQMWFEESA-N Pro-Tyr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O LZHHZYDPMZEMRX-STQMWFEESA-N 0.000 description 5
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 5
- IDQFQFVEWMWRQQ-DLOVCJGASA-N Ser-Ala-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IDQFQFVEWMWRQQ-DLOVCJGASA-N 0.000 description 5
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 5
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 5
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 5
- -1 Vol.I Proteins 0.000 description 5
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000004090 dissolution Methods 0.000 description 5
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 5
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 5
- 239000002198 insoluble material Substances 0.000 description 5
- 150000002632 lipids Chemical class 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 239000012528 membrane Substances 0.000 description 5
- 239000000047 product Substances 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- 108091008146 restriction endonucleases Proteins 0.000 description 5
- 239000007858 starting material Substances 0.000 description 5
- 108010061238 threonyl-glycine Proteins 0.000 description 5
- 230000014616 translation Effects 0.000 description 5
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 4
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 4
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 4
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 4
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 4
- NNQHEEQNPQYPGL-FXQIFTODSA-N Gln-Ala-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NNQHEEQNPQYPGL-FXQIFTODSA-N 0.000 description 4
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 4
- NSORZJXKUQFEKL-JGVFFNPUSA-N Gln-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)N)N)C(=O)O NSORZJXKUQFEKL-JGVFFNPUSA-N 0.000 description 4
- JNGHLWWFPGIJER-STQMWFEESA-N Gly-Pro-Tyr Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JNGHLWWFPGIJER-STQMWFEESA-N 0.000 description 4
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 4
- RYAOJUMWLWUGNW-QMMMGPOBSA-N Gly-Val-Gly Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O RYAOJUMWLWUGNW-QMMMGPOBSA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 4
- 241000742192 Nephilengys cruentata Species 0.000 description 4
- NPLGQVKZFGJWAI-QWHCGFSZSA-N Phe-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O NPLGQVKZFGJWAI-QWHCGFSZSA-N 0.000 description 4
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 4
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 4
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 4
- 238000010521 absorption reaction Methods 0.000 description 4
- 108010087049 alanyl-alanyl-prolyl-valine Proteins 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 108010054666 glycyl-leucyl-glycyl-glycine Proteins 0.000 description 4
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 239000000843 powder Substances 0.000 description 4
- 239000012465 retentate Substances 0.000 description 4
- 238000003998 size exclusion chromatography high performance liquid chromatography Methods 0.000 description 4
- 125000006850 spacer group Chemical group 0.000 description 4
- 230000008685 targeting Effects 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- BUANFPRKJKJSRR-ACZMJKKPSA-N Ala-Ala-Gln Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CCC(N)=O BUANFPRKJKJSRR-ACZMJKKPSA-N 0.000 description 3
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 3
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 3
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 3
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 3
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 3
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 3
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 3
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 3
- KTXKIYXZQFWJKB-VZFHVOOUSA-N Ala-Thr-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O KTXKIYXZQFWJKB-VZFHVOOUSA-N 0.000 description 3
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 3
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 3
- 239000002028 Biomass Substances 0.000 description 3
- 241000754459 Deinopsis Species 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 3
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 3
- LGWNISYVKDNJRP-FXQIFTODSA-N Gln-Ser-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGWNISYVKDNJRP-FXQIFTODSA-N 0.000 description 3
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 3
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 3
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 3
- HILMIYALTUQTRC-XVKPBYJWSA-N Glu-Gly-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HILMIYALTUQTRC-XVKPBYJWSA-N 0.000 description 3
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 3
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 3
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 3
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 3
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 3
- 101001135086 Homo sapiens Leiomodin-1 Proteins 0.000 description 3
- UAQSZXGJGLHMNV-XEGUGMAKSA-N Ile-Gly-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N UAQSZXGJGLHMNV-XEGUGMAKSA-N 0.000 description 3
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 3
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 3
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 3
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 3
- 102100033519 Leiomodin-1 Human genes 0.000 description 3
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 3
- 241000238902 Nephila clavipes Species 0.000 description 3
- 241000228143 Penicillium Species 0.000 description 3
- WKTSCAXSYITIJJ-PCBIJLKTSA-N Phe-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O WKTSCAXSYITIJJ-PCBIJLKTSA-N 0.000 description 3
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 3
- KIZQGKLMXKGDIV-BQBZGAKWSA-N Pro-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 KIZQGKLMXKGDIV-BQBZGAKWSA-N 0.000 description 3
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 3
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 3
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 3
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 3
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 3
- OQPNSDWGAMFJNU-QWRGUYRKSA-N Ser-Gly-Tyr Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OQPNSDWGAMFJNU-QWRGUYRKSA-N 0.000 description 3
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 3
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 3
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 3
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 3
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 3
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 3
- NHQVWACSJZJCGJ-FLBSBUHZSA-N Thr-Thr-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NHQVWACSJZJCGJ-FLBSBUHZSA-N 0.000 description 3
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 3
- 239000007983 Tris buffer Substances 0.000 description 3
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 3
- QAYSODICXVZUIA-WLTAIBSBSA-N Tyr-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QAYSODICXVZUIA-WLTAIBSBSA-N 0.000 description 3
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 3
- 241000016888 Uloborus diversus Species 0.000 description 3
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 3
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 3
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 3
- 108010087924 alanylproline Proteins 0.000 description 3
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 230000009089 cytolysis Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 239000003599 detergent Substances 0.000 description 3
- 238000011026 diafiltration Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 230000003252 repetitive effect Effects 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 3
- SBKVPJHMSUXZTA-MEJXFZFPSA-N (2S)-2-[[(2S)-2-[[(2S)-1-[(2S)-5-amino-2-[[2-[[(2S)-1-[(2S)-6-amino-2-[[(2S)-2-[[(2S)-5-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-amino-3-(1H-indol-3-yl)propanoyl]amino]-3-(1H-imidazol-4-yl)propanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-4-methylpentanoyl]amino]-5-oxopentanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]acetyl]amino]-5-oxopentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylsulfanylbutanoyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical class C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 SBKVPJHMSUXZTA-MEJXFZFPSA-N 0.000 description 2
- HXUVTXPOZRFMOY-NSHDSACASA-N 2-[[(2s)-2-[[2-[(2-aminoacetyl)amino]acetyl]amino]-3-phenylpropanoyl]amino]acetic acid Chemical compound NCC(=O)NCC(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 HXUVTXPOZRFMOY-NSHDSACASA-N 0.000 description 2
- UKPGFKQVRITNFM-KBPBESRZSA-N 2-[[2-[[(2s)-1-[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]pyrrolidine-2-carbonyl]amino]acetyl]amino]acetic acid Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)NCC(O)=O)C1=CC=C(O)C=C1 UKPGFKQVRITNFM-KBPBESRZSA-N 0.000 description 2
- OTEWWRBKGONZBW-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]-4-methylpentanoyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NC(CC(C)C)C(=O)NCC(=O)NCC(O)=O OTEWWRBKGONZBW-UHFFFAOYSA-N 0.000 description 2
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 2
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 2
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 2
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 2
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 2
- KYDYGANDJHFBCW-DRZSPHRISA-N Ala-Phe-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KYDYGANDJHFBCW-DRZSPHRISA-N 0.000 description 2
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 2
- AENHOIXXHKNIQL-AUTRQRHGSA-N Ala-Tyr-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H]([NH3+])C)CC1=CC=C(O)C=C1 AENHOIXXHKNIQL-AUTRQRHGSA-N 0.000 description 2
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 2
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 2
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 2
- 241000023936 Argiope aurantia Species 0.000 description 2
- 241000023938 Argiope trifasciata Species 0.000 description 2
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 2
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 2
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 2
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 2
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 2
- 241000228215 Aspergillus aculeatus Species 0.000 description 2
- 241001513093 Aspergillus awamori Species 0.000 description 2
- 241000228195 Aspergillus ficuum Species 0.000 description 2
- 241001225321 Aspergillus fumigatus Species 0.000 description 2
- 241001480052 Aspergillus japonicus Species 0.000 description 2
- 241000351920 Aspergillus nidulans Species 0.000 description 2
- 241000228245 Aspergillus niger Species 0.000 description 2
- 240000006439 Aspergillus oryzae Species 0.000 description 2
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 2
- 241000131386 Aspergillus sojae Species 0.000 description 2
- 241000193738 Bacillus anthracis Species 0.000 description 2
- 241000193388 Bacillus thuringiensis Species 0.000 description 2
- 241000193764 Brevibacillus brevis Species 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 108010090461 DFG peptide Proteins 0.000 description 2
- 241000223195 Fusarium graminearum Species 0.000 description 2
- NVEASDQHBRZPSU-BQBZGAKWSA-N Gln-Gln-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O NVEASDQHBRZPSU-BQBZGAKWSA-N 0.000 description 2
- CLPQUWHBWXFJOX-BQBZGAKWSA-N Gln-Gly-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O CLPQUWHBWXFJOX-BQBZGAKWSA-N 0.000 description 2
- KKCJHBXMYYVWMX-KQXIARHKSA-N Gln-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N KKCJHBXMYYVWMX-KQXIARHKSA-N 0.000 description 2
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 2
- OKARHJKJTKFQBM-ACZMJKKPSA-N Gln-Ser-Asn Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OKARHJKJTKFQBM-ACZMJKKPSA-N 0.000 description 2
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 2
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 2
- OPAINBJQDQTGJY-JGVFFNPUSA-N Glu-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCC(=O)O)N)C(=O)O OPAINBJQDQTGJY-JGVFFNPUSA-N 0.000 description 2
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 2
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 2
- UXJHNZODTMHWRD-WHFBIAKZSA-N Gly-Asn-Ala Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O UXJHNZODTMHWRD-WHFBIAKZSA-N 0.000 description 2
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 2
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 2
- UQJNXZSSGQIPIQ-FBCQKBJTSA-N Gly-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)CN UQJNXZSSGQIPIQ-FBCQKBJTSA-N 0.000 description 2
- HAXARWKYFIIHKD-ZKWXMUAHSA-N Gly-Ile-Ser Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HAXARWKYFIIHKD-ZKWXMUAHSA-N 0.000 description 2
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 2
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 2
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 2
- RIYIFUFFFBIOEU-KBPBESRZSA-N Gly-Tyr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 RIYIFUFFFBIOEU-KBPBESRZSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 2
- NKVZTQVGUNLLQW-JBDRJPRFSA-N Ile-Ala-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)O)N NKVZTQVGUNLLQW-JBDRJPRFSA-N 0.000 description 2
- HDOYNXLPTRQLAD-JBDRJPRFSA-N Ile-Ala-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(=O)O)N HDOYNXLPTRQLAD-JBDRJPRFSA-N 0.000 description 2
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 2
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 2
- 241001138401 Kluyveromyces lactis Species 0.000 description 2
- 241001387337 Latrodectus hesperus Species 0.000 description 2
- 241000238866 Latrodectus mactans Species 0.000 description 2
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 2
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 2
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 2
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 2
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 2
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 2
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 2
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 2
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 2
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 2
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- OBVHKUFUDCPZDW-JYJNAYRXSA-N Met-Arg-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OBVHKUFUDCPZDW-JYJNAYRXSA-N 0.000 description 2
- HSJIGJRZYUADSS-IHRRRGAJSA-N Met-Lys-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HSJIGJRZYUADSS-IHRRRGAJSA-N 0.000 description 2
- FIZZULTXMVEIAA-IHRRRGAJSA-N Met-Ser-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FIZZULTXMVEIAA-IHRRRGAJSA-N 0.000 description 2
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical compound CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 2
- JOCBASBOOFNAJA-UHFFFAOYSA-N N-tris(hydroxymethyl)methyl-2-aminoethanesulfonic acid Chemical compound OCC(CO)(CO)NCCS(O)(=O)=O JOCBASBOOFNAJA-UHFFFAOYSA-N 0.000 description 2
- SEQKRHFRPICQDD-UHFFFAOYSA-N N-tris(hydroxymethyl)methylglycine Chemical compound OCC(CO)(CO)[NH2+]CC([O-])=O SEQKRHFRPICQDD-UHFFFAOYSA-N 0.000 description 2
- 241000221961 Neurospora crassa Species 0.000 description 2
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 2
- 241000235648 Pichia Species 0.000 description 2
- 241001466057 Plectreurys tristis Species 0.000 description 2
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 2
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 2
- 241000235403 Rhizomucor miehei Species 0.000 description 2
- 241000235525 Rhizomucor pusillus Species 0.000 description 2
- 240000005384 Rhizopus oryzae Species 0.000 description 2
- 235000013752 Rhizopus oryzae Nutrition 0.000 description 2
- 244000253911 Saccharomyces fragilis Species 0.000 description 2
- 235000018368 Saccharomyces fragilis Nutrition 0.000 description 2
- 241000235060 Scheffersomyces stipitis Species 0.000 description 2
- YPUSXTWURJANKF-KBIXCLLPSA-N Ser-Gln-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YPUSXTWURJANKF-KBIXCLLPSA-N 0.000 description 2
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 2
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 2
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 2
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 2
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 2
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 2
- NQZFFLBPNDLTPO-DLOVCJGASA-N Ser-Phe-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CO)N NQZFFLBPNDLTPO-DLOVCJGASA-N 0.000 description 2
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 2
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 2
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 2
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 241000187398 Streptomyces lividans Species 0.000 description 2
- 239000007994 TES buffer Substances 0.000 description 2
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 2
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 2
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 2
- GMXIJHCBTZDAPD-QPHKQPEJSA-N Thr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N GMXIJHCBTZDAPD-QPHKQPEJSA-N 0.000 description 2
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 2
- 108700019146 Transgenes Proteins 0.000 description 2
- 241000223260 Trichoderma harzianum Species 0.000 description 2
- 241000499912 Trichoderma reesei Species 0.000 description 2
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 2
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 2
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 2
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 2
- ZZGPVSZDZQRJQY-ULQDDVLXSA-N Val-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZZGPVSZDZQRJQY-ULQDDVLXSA-N 0.000 description 2
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 2
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 2
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 2
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 2
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 2
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 2
- 241000235015 Yarrowia lipolytica Species 0.000 description 2
- 241000222124 [Candida] boidinii Species 0.000 description 2
- DZBUGLKDJFMEHC-UHFFFAOYSA-N acridine Chemical compound C1=CC=CC2=CC3=CC=CC=C3N=C21 DZBUGLKDJFMEHC-UHFFFAOYSA-N 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000000246 agarose gel electrophoresis Methods 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 239000003125 aqueous solvent Substances 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 229940091771 aspergillus fumigatus Drugs 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 229940065181 bacillus anthracis Drugs 0.000 description 2
- 229940097012 bacillus thuringiensis Drugs 0.000 description 2
- 239000007853 buffer solution Substances 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 239000003610 charcoal Substances 0.000 description 2
- 238000005352 clarification Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000008602 contraction Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 229920001577 copolymer Polymers 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 150000004676 glycans Chemical class 0.000 description 2
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 229940031154 kluyveromyces marxianus Drugs 0.000 description 2
- 235000013372 meat Nutrition 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 238000001471 micro-filtration Methods 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 239000003960 organic solvent Substances 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 238000005191 phase separation Methods 0.000 description 2
- 239000002953 phosphate buffered saline Substances 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 108010000222 polyserine Proteins 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 108010079317 prolyl-tyrosine Proteins 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 238000001799 protein solubilization Methods 0.000 description 2
- 230000007925 protein solubilization Effects 0.000 description 2
- 238000001243 protein synthesis Methods 0.000 description 2
- ZCCUUQDIBDJBTK-UHFFFAOYSA-N psoralen Chemical compound C1=C2OC(=O)C=CC2=CC2=C1OC=C2 ZCCUUQDIBDJBTK-UHFFFAOYSA-N 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 239000002002 slurry Substances 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 239000007921 spray Substances 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 229920002994 synthetic fiber Polymers 0.000 description 2
- 239000012209 synthetic fiber Substances 0.000 description 2
- UMGDCJDMYOKAJW-UHFFFAOYSA-N thiourea Chemical compound NC(N)=S UMGDCJDMYOKAJW-UHFFFAOYSA-N 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- CWFMWBHMIMNZLN-NAKRPEOUSA-N (2s)-1-[(2s)-2-[[(2s,3s)-2-amino-3-methylpentanoyl]amino]propanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CWFMWBHMIMNZLN-NAKRPEOUSA-N 0.000 description 1
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 1
- QZTKDVCDBIDYMD-UHFFFAOYSA-N 2,2'-[(2-amino-2-oxoethyl)imino]diacetic acid Chemical compound NC(=O)CN(CC(O)=O)CC(O)=O QZTKDVCDBIDYMD-UHFFFAOYSA-N 0.000 description 1
- IHPYMWDTONKSCO-UHFFFAOYSA-N 2,2'-piperazine-1,4-diylbisethanesulfonic acid Chemical compound OS(=O)(=O)CCN1CCN(CCS(O)(=O)=O)CC1 IHPYMWDTONKSCO-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- DVLFYONBTKHTER-UHFFFAOYSA-N 3-(N-morpholino)propanesulfonic acid Chemical compound OS(=O)(=O)CCCN1CCOCC1 DVLFYONBTKHTER-UHFFFAOYSA-N 0.000 description 1
- INEWUCPYEUEQTN-UHFFFAOYSA-N 3-(cyclohexylamino)-2-hydroxy-1-propanesulfonic acid Chemical compound OS(=O)(=O)CC(O)CNC1CCCCC1 INEWUCPYEUEQTN-UHFFFAOYSA-N 0.000 description 1
- NUFBIAUZAMHTSP-UHFFFAOYSA-N 3-(n-morpholino)-2-hydroxypropanesulfonic acid Chemical compound OS(=O)(=O)CC(O)CN1CCOCC1 NUFBIAUZAMHTSP-UHFFFAOYSA-N 0.000 description 1
- UMCMPZBLKLEWAF-BCTGSCMUSA-N 3-[(3-cholamidopropyl)dimethylammonio]propane-1-sulfonate Chemical compound C([C@H]1C[C@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(=O)NCCC[N+](C)(C)CCCS([O-])(=O)=O)C)[C@@]2(C)[C@@H](O)C1 UMCMPZBLKLEWAF-BCTGSCMUSA-N 0.000 description 1
- VXGRJERITKFWPL-UHFFFAOYSA-N 4',5'-Dihydropsoralen Natural products C1=C2OC(=O)C=CC2=CC2=C1OCC2 VXGRJERITKFWPL-UHFFFAOYSA-N 0.000 description 1
- LOJNFONOHINEFI-UHFFFAOYSA-N 4-[4-(2-hydroxyethyl)piperazin-1-yl]butane-1-sulfonic acid Chemical compound OCCN1CCN(CCCCS(O)(=O)=O)CC1 LOJNFONOHINEFI-UHFFFAOYSA-N 0.000 description 1
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 1
- 239000007991 ACES buffer Substances 0.000 description 1
- 241000238876 Acari Species 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- DKJPOZOEBONHFS-ZLUOBGJFSA-N Ala-Ala-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O DKJPOZOEBONHFS-ZLUOBGJFSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- ZEXDYVGDZJBRMO-ACZMJKKPSA-N Ala-Asn-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZEXDYVGDZJBRMO-ACZMJKKPSA-N 0.000 description 1
- FXKNPWNXPQZLES-ZLUOBGJFSA-N Ala-Asn-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FXKNPWNXPQZLES-ZLUOBGJFSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 1
- DECCMEWNXSNSDO-ZLUOBGJFSA-N Ala-Cys-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DECCMEWNXSNSDO-ZLUOBGJFSA-N 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 1
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- PEIBBAXIKUAYGN-UBHSHLNASA-N Ala-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 PEIBBAXIKUAYGN-UBHSHLNASA-N 0.000 description 1
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 1
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 1
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 1
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 1
- WQKAQKZRDIZYNV-VZFHVOOUSA-N Ala-Ser-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WQKAQKZRDIZYNV-VZFHVOOUSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- BHFOJPDOQPWJRN-XDTLVQLUSA-N Ala-Tyr-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CCC(N)=O)C(O)=O BHFOJPDOQPWJRN-XDTLVQLUSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- 241001495960 Aliatypus gulosus Species 0.000 description 1
- 241000193935 Araneus diadematus Species 0.000 description 1
- 241001072627 Araneus ventricosus Species 0.000 description 1
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 1
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 1
- YNSGXDWWPCGGQS-YUMQZZPRSA-N Arg-Gly-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O YNSGXDWWPCGGQS-YUMQZZPRSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- UBCPNBUIQNMDNH-NAKRPEOUSA-N Arg-Ile-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O UBCPNBUIQNMDNH-NAKRPEOUSA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- UZSQXCMNUPKLCC-FJXKBIBVSA-N Arg-Thr-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UZSQXCMNUPKLCC-FJXKBIBVSA-N 0.000 description 1
- VLIJAPRTSXSGFY-STQMWFEESA-N Arg-Tyr-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 VLIJAPRTSXSGFY-STQMWFEESA-N 0.000 description 1
- 241000238421 Arthropoda Species 0.000 description 1
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 1
- QQEWINYJRFBLNN-DLOVCJGASA-N Asn-Ala-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QQEWINYJRFBLNN-DLOVCJGASA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 1
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 1
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- UYRPHDGXHKBZHJ-CIUDSAMLSA-N Asn-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N UYRPHDGXHKBZHJ-CIUDSAMLSA-N 0.000 description 1
- CBWCQCANJSGUOH-ZKWXMUAHSA-N Asn-Val-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O CBWCQCANJSGUOH-ZKWXMUAHSA-N 0.000 description 1
- ZAESWDKAMDVHLL-RCOVLWMOSA-N Asn-Val-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O ZAESWDKAMDVHLL-RCOVLWMOSA-N 0.000 description 1
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 1
- KDFQZBWWPYQBEN-ZLUOBGJFSA-N Asp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N KDFQZBWWPYQBEN-ZLUOBGJFSA-N 0.000 description 1
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 1
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 1
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 1
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- RKXVTTIQNKPCHU-KKHAAJSZSA-N Asp-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O RKXVTTIQNKPCHU-KKHAAJSZSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 241000228232 Aspergillus tubingensis Species 0.000 description 1
- 241000452926 Avicularia Species 0.000 description 1
- 239000007989 BIS-Tris Propane buffer Substances 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 241000193375 Bacillus alcalophilus Species 0.000 description 1
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 1
- 241000193749 Bacillus coagulans Species 0.000 description 1
- 241000770536 Bacillus thermophilus Species 0.000 description 1
- 102100032487 Beta-mannosidase Human genes 0.000 description 1
- 241000680806 Blastobotrys adeninivorans Species 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 239000008000 CHES buffer Substances 0.000 description 1
- QCMYYKRYFNMIEC-UHFFFAOYSA-N COP(O)=O Chemical class COP(O)=O QCMYYKRYFNMIEC-UHFFFAOYSA-N 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000012286 Chitinases Human genes 0.000 description 1
- 108010022172 Chitinases Proteins 0.000 description 1
- 241001674013 Chrysosporium lucknowense Species 0.000 description 1
- 241001149472 Clonostachys rosea Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 238000007702 DNA assembly Methods 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 241001001150 Digera Species 0.000 description 1
- 241000023940 Dolomedes tenebrosus Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241001125671 Eretmochelys imbricata Species 0.000 description 1
- 241000328437 Euprosthenops australis Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241000223218 Fusarium Species 0.000 description 1
- 241000567178 Fusarium venenatum Species 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 241000510209 Girardia Species 0.000 description 1
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 1
- RGXXLQWXBFNXTG-CIUDSAMLSA-N Gln-Arg-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O RGXXLQWXBFNXTG-CIUDSAMLSA-N 0.000 description 1
- IVCOYUURLWQDJQ-LPEHRKFASA-N Gln-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O IVCOYUURLWQDJQ-LPEHRKFASA-N 0.000 description 1
- RBWKVOSARCFSQQ-FXQIFTODSA-N Gln-Gln-Ser Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O RBWKVOSARCFSQQ-FXQIFTODSA-N 0.000 description 1
- YXQCLIVLWCKCRS-RYUDHWBXSA-N Gln-Gly-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N)O YXQCLIVLWCKCRS-RYUDHWBXSA-N 0.000 description 1
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 1
- UWKPRVKWEKEMSY-DCAQKATOSA-N Gln-Lys-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWKPRVKWEKEMSY-DCAQKATOSA-N 0.000 description 1
- HHRAEXBUNGTOGZ-IHRRRGAJSA-N Gln-Phe-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O HHRAEXBUNGTOGZ-IHRRRGAJSA-N 0.000 description 1
- XZUUUKNKNWVPHQ-JYJNAYRXSA-N Gln-Phe-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O XZUUUKNKNWVPHQ-JYJNAYRXSA-N 0.000 description 1
- FTTHLXOMDMLKKW-FHWLQOOXSA-N Gln-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(N)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FTTHLXOMDMLKKW-FHWLQOOXSA-N 0.000 description 1
- FQCILXROGNOZON-YUMQZZPRSA-N Gln-Pro-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O FQCILXROGNOZON-YUMQZZPRSA-N 0.000 description 1
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 1
- SXFPZRRVWSUYII-KBIXCLLPSA-N Gln-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N SXFPZRRVWSUYII-KBIXCLLPSA-N 0.000 description 1
- ZGHMRONFHDVXEF-AVGNSLFASA-N Gln-Ser-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZGHMRONFHDVXEF-AVGNSLFASA-N 0.000 description 1
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 1
- SJMJMEWQMBJYPR-DZKIICNBSA-N Gln-Tyr-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N SJMJMEWQMBJYPR-DZKIICNBSA-N 0.000 description 1
- ICRKQMRFXYDYMK-LAEOZQHASA-N Gln-Val-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ICRKQMRFXYDYMK-LAEOZQHASA-N 0.000 description 1
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- XXCDTYBVGMPIOA-FXQIFTODSA-N Glu-Asp-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XXCDTYBVGMPIOA-FXQIFTODSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- DAHLWSFUXOHMIA-FXQIFTODSA-N Glu-Ser-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O DAHLWSFUXOHMIA-FXQIFTODSA-N 0.000 description 1
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 1
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 1
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 1
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 1
- GZUKEVBTYNNUQF-WDSKDSINSA-N Gly-Ala-Gln Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GZUKEVBTYNNUQF-WDSKDSINSA-N 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- GRIRDMVMJJDZKV-RCOVLWMOSA-N Gly-Asn-Val Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O GRIRDMVMJJDZKV-RCOVLWMOSA-N 0.000 description 1
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 1
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 1
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 1
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 1
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- MTBIKIMYHUWBRX-QWRGUYRKSA-N Gly-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN MTBIKIMYHUWBRX-QWRGUYRKSA-N 0.000 description 1
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 1
- WDXLKVQATNEAJQ-BQBZGAKWSA-N Gly-Pro-Asp Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WDXLKVQATNEAJQ-BQBZGAKWSA-N 0.000 description 1
- SSFWXSNOKDZNHY-QXEWZRGKSA-N Gly-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN SSFWXSNOKDZNHY-QXEWZRGKSA-N 0.000 description 1
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 1
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 1
- FKYQEVBRZSFAMJ-QWRGUYRKSA-N Gly-Ser-Tyr Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FKYQEVBRZSFAMJ-QWRGUYRKSA-N 0.000 description 1
- NWOSHVVPKDQKKT-RYUDHWBXSA-N Gly-Tyr-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O NWOSHVVPKDQKKT-RYUDHWBXSA-N 0.000 description 1
- UVTSZKIATYSKIR-RYUDHWBXSA-N Gly-Tyr-Glu Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O UVTSZKIATYSKIR-RYUDHWBXSA-N 0.000 description 1
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- SBVMXEZQJVUARN-XPUUQOCRSA-N Gly-Val-Ser Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O SBVMXEZQJVUARN-XPUUQOCRSA-N 0.000 description 1
- 108010008488 Glycylglycine Proteins 0.000 description 1
- 239000006173 Good's buffer Substances 0.000 description 1
- 241000780354 Gulosus Species 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 101150007068 HSP81-1 gene Proteins 0.000 description 1
- 101150087422 HSP82 gene Proteins 0.000 description 1
- ZNPRMNDAFQKATM-LKTVYLICSA-N His-Ala-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZNPRMNDAFQKATM-LKTVYLICSA-N 0.000 description 1
- 101150028525 Hsp83 gene Proteins 0.000 description 1
- 241000257303 Hymenoptera Species 0.000 description 1
- 241000221931 Hypomyces rosellus Species 0.000 description 1
- PJLLMGWWINYQPB-PEFMBERDSA-N Ile-Asn-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PJLLMGWWINYQPB-PEFMBERDSA-N 0.000 description 1
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 1
- QIHJTGSVGIPHIW-QSFUFRPTSA-N Ile-Asn-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N QIHJTGSVGIPHIW-QSFUFRPTSA-N 0.000 description 1
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 1
- CYHJCEKUMCNDFG-LAEOZQHASA-N Ile-Gln-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N CYHJCEKUMCNDFG-LAEOZQHASA-N 0.000 description 1
- IGJWJGIHUFQANP-LAEOZQHASA-N Ile-Gly-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N IGJWJGIHUFQANP-LAEOZQHASA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 1
- UAELWXJFLZBKQS-WHOFXGATSA-N Ile-Phe-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O UAELWXJFLZBKQS-WHOFXGATSA-N 0.000 description 1
- VZSDQFZFTCVEGF-ZEWNOJEFSA-N Ile-Phe-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O VZSDQFZFTCVEGF-ZEWNOJEFSA-N 0.000 description 1
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 1
- 241001099157 Komagataella Species 0.000 description 1
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 1
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 1
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- MVJRBCJCRYGCKV-GVXVVHGQSA-N Leu-Val-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MVJRBCJCRYGCKV-GVXVVHGQSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102000004317 Lyases Human genes 0.000 description 1
- 108090000856 Lyases Proteins 0.000 description 1
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 1
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 1
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 1
- 239000007987 MES buffer Substances 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- 241000217407 Margaritifera Species 0.000 description 1
- 108010038049 Mating Factor Proteins 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- IUYCGMNKIZDRQI-BQBZGAKWSA-N Met-Gly-Ala Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O IUYCGMNKIZDRQI-BQBZGAKWSA-N 0.000 description 1
- WXJLBSXNUHIGSS-OSUNSFLBSA-N Met-Thr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WXJLBSXNUHIGSS-OSUNSFLBSA-N 0.000 description 1
- FSVCELGFZIQNCK-UHFFFAOYSA-N N,N-bis(2-hydroxyethyl)glycine Chemical compound OCCN(CCO)CC(O)=O FSVCELGFZIQNCK-UHFFFAOYSA-N 0.000 description 1
- DBXNUXBLKRLWFA-UHFFFAOYSA-N N-(2-acetamido)-2-aminoethanesulfonic acid Chemical compound NC(=O)CNCCS(O)(=O)=O DBXNUXBLKRLWFA-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- MKWKNSIESPFAQN-UHFFFAOYSA-N N-cyclohexyl-2-aminoethanesulfonic acid Chemical compound OS(=O)(=O)CCNC1CCCCC1 MKWKNSIESPFAQN-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 240000009215 Nepeta cataria Species 0.000 description 1
- 235000010679 Nepeta cataria Nutrition 0.000 description 1
- 241000238903 Nephila Species 0.000 description 1
- 241001221062 Nephila clavata Species 0.000 description 1
- 239000007990 PIPES buffer Substances 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241001216760 Parawixia bistriata Species 0.000 description 1
- 244000271379 Penicillium camembertii Species 0.000 description 1
- 235000002245 Penicillium camembertii Nutrition 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 241000293108 Peucetia Species 0.000 description 1
- 241000293107 Peucetia viridans Species 0.000 description 1
- 244000127818 Phalaenopsis amabilis Species 0.000 description 1
- JVTMTFMMMHAPCR-UBHSHLNASA-N Phe-Ala-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JVTMTFMMMHAPCR-UBHSHLNASA-N 0.000 description 1
- WFDAEEUZPZSMOG-SRVKXCTJSA-N Phe-Cys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O WFDAEEUZPZSMOG-SRVKXCTJSA-N 0.000 description 1
- WYPVCIACUMJRIB-JYJNAYRXSA-N Phe-Gln-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N WYPVCIACUMJRIB-JYJNAYRXSA-N 0.000 description 1
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 1
- BIYWZVCPZIFGPY-QWRGUYRKSA-N Phe-Gly-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O BIYWZVCPZIFGPY-QWRGUYRKSA-N 0.000 description 1
- HNFUGJUZJRYUHN-JSGCOSHPSA-N Phe-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HNFUGJUZJRYUHN-JSGCOSHPSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 1
- XNQMZHLAYFWSGJ-HTUGSXCWSA-N Phe-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XNQMZHLAYFWSGJ-HTUGSXCWSA-N 0.000 description 1
- 241000332308 Pisauridae Species 0.000 description 1
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 1
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 1
- ZPPVJIJMIKTERM-YUMQZZPRSA-N Pro-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(=O)N)NC(=O)[C@@H]1CCCN1 ZPPVJIJMIKTERM-YUMQZZPRSA-N 0.000 description 1
- LQZZPNDMYNZPFT-KKUMJFAQSA-N Pro-Gln-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LQZZPNDMYNZPFT-KKUMJFAQSA-N 0.000 description 1
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 1
- DXTOOBDIIAJZBJ-BQBZGAKWSA-N Pro-Gly-Ser Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CO)C(O)=O DXTOOBDIIAJZBJ-BQBZGAKWSA-N 0.000 description 1
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- GURGCNUWVSDYTP-SRVKXCTJSA-N Pro-Leu-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GURGCNUWVSDYTP-SRVKXCTJSA-N 0.000 description 1
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 1
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 1
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 1
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 1
- YHUBAXGAAYULJY-ULQDDVLXSA-N Pro-Tyr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O YHUBAXGAAYULJY-ULQDDVLXSA-N 0.000 description 1
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- YDTUEBLEAVANFH-RCWTZXSCSA-N Pro-Val-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 YDTUEBLEAVANFH-RCWTZXSCSA-N 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 241001123650 Schwanniomyces occidentalis Species 0.000 description 1
- MWMKFWJYRRGXOR-ZLUOBGJFSA-N Ser-Ala-Asn Chemical compound N[C@H](C(=O)N[C@H](C(=O)N[C@H](C(=O)O)CC(N)=O)C)CO MWMKFWJYRRGXOR-ZLUOBGJFSA-N 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 1
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 1
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 1
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 1
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 1
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 1
- RDFQNDHEHVSONI-ZLUOBGJFSA-N Ser-Asn-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O RDFQNDHEHVSONI-ZLUOBGJFSA-N 0.000 description 1
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- PMCMLDNPAZUYGI-DCAQKATOSA-N Ser-Lys-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMCMLDNPAZUYGI-DCAQKATOSA-N 0.000 description 1
- XVWDJUROVRQKAE-KKUMJFAQSA-N Ser-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=CC=C1 XVWDJUROVRQKAE-KKUMJFAQSA-N 0.000 description 1
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 1
- HAYADTTXNZFUDM-IHRRRGAJSA-N Ser-Tyr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HAYADTTXNZFUDM-IHRRRGAJSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 1
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 1
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 1
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- UZMAPBJVXOGOFT-UHFFFAOYSA-N Syringetin Natural products COC1=C(O)C(OC)=CC(C2=C(C(=O)C3=C(O)C=C(O)C=C3O2)O)=C1 UZMAPBJVXOGOFT-UHFFFAOYSA-N 0.000 description 1
- 241000023957 Tetragnatha kauaiensis Species 0.000 description 1
- 241001313536 Thermothelomyces thermophila Species 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- DFTCYYILCSQGIZ-GCJQMDKQSA-N Thr-Ala-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFTCYYILCSQGIZ-GCJQMDKQSA-N 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 1
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 1
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 1
- ZQUKYJOKQBRBCS-GLLZPBPUSA-N Thr-Gln-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O ZQUKYJOKQBRBCS-GLLZPBPUSA-N 0.000 description 1
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 1
- JQAWYCUUFIMTHE-WLTAIBSBSA-N Thr-Gly-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JQAWYCUUFIMTHE-WLTAIBSBSA-N 0.000 description 1
- XOWKUMFHEZLKLT-CIQUZCHMSA-N Thr-Ile-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O XOWKUMFHEZLKLT-CIQUZCHMSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 1
- RFKVQLIXNVEOMB-WEDXCCLWSA-N Thr-Leu-Gly Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N)O RFKVQLIXNVEOMB-WEDXCCLWSA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- DOBIBIXIHJKVJF-XKBZYTNZSA-N Thr-Ser-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DOBIBIXIHJKVJF-XKBZYTNZSA-N 0.000 description 1
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 1
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 1
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- BKVICMPZWRNWOC-RHYQMDGZSA-N Thr-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)O BKVICMPZWRNWOC-RHYQMDGZSA-N 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- 239000007997 Tricine buffer Substances 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 208000034953 Twin anemia-polycythemia sequence Diseases 0.000 description 1
- JONPRIHUYSPIMA-UWJYBYFXSA-N Tyr-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JONPRIHUYSPIMA-UWJYBYFXSA-N 0.000 description 1
- XLMDWQNAOKLKCP-XDTLVQLUSA-N Tyr-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XLMDWQNAOKLKCP-XDTLVQLUSA-N 0.000 description 1
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 1
- NOXKHHXSHQFSGJ-FQPOAREZSA-N Tyr-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NOXKHHXSHQFSGJ-FQPOAREZSA-N 0.000 description 1
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 1
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 1
- CDHQEOXPWBDFPL-QWRGUYRKSA-N Tyr-Gly-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDHQEOXPWBDFPL-QWRGUYRKSA-N 0.000 description 1
- SZEIFUXUTBBQFQ-STQMWFEESA-N Tyr-Pro-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SZEIFUXUTBBQFQ-STQMWFEESA-N 0.000 description 1
- TYFLVOUZHQUBGM-IHRRRGAJSA-N Tyr-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TYFLVOUZHQUBGM-IHRRRGAJSA-N 0.000 description 1
- KLQPIEVIKOQRAW-IZPVPAKOSA-N Tyr-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KLQPIEVIKOQRAW-IZPVPAKOSA-N 0.000 description 1
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 1
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 1
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 1
- GXAZTLJYINLMJL-LAEOZQHASA-N Val-Asn-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GXAZTLJYINLMJL-LAEOZQHASA-N 0.000 description 1
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 1
- JTWIMNMUYLQNPI-WPRPVWTQSA-N Val-Gly-Arg Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N JTWIMNMUYLQNPI-WPRPVWTQSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 1
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- KSFXWENSJABBFI-ZKWXMUAHSA-N Val-Ser-Asn Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KSFXWENSJABBFI-ZKWXMUAHSA-N 0.000 description 1
- RYHUIHUOYRNNIE-NRPADANISA-N Val-Ser-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RYHUIHUOYRNNIE-NRPADANISA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 1
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 1
- DFQZDQPLWBSFEJ-LSJOCFKGSA-N Val-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DFQZDQPLWBSFEJ-LSJOCFKGSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 1
- 238000005054 agglomeration Methods 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 108010041407 alanylaspartic acid Proteins 0.000 description 1
- 239000002168 alkylating agent Substances 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 229940054340 bacillus coagulans Drugs 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 108010055059 beta-Mannosidase Proteins 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000007998 bicine buffer Substances 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 1
- HHKZCCWKTZRCCL-UHFFFAOYSA-N bis-tris propane Chemical compound OCC(CO)(CO)NCCCNC(CO)(CO)CO HHKZCCWKTZRCCL-UHFFFAOYSA-N 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- FVMOEFABYNPCDS-UHFFFAOYSA-L calcium;1-(4-carboxy-2,6-dioxocyclohexylidene)propan-1-olate Chemical compound [Ca+2].CCC([O-])=C1C(=O)CC(C(O)=O)CC1=O.CCC([O-])=C1C(=O)CC(C(O)=O)CC1=O FVMOEFABYNPCDS-UHFFFAOYSA-L 0.000 description 1
- 150000004657 carbamic acid derivatives Chemical class 0.000 description 1
- 229920002301 cellulose acetate Polymers 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- KCFYHBSOLOXZIF-UHFFFAOYSA-N dihydrochrysin Natural products COC1=C(O)C(OC)=CC(C2OC3=CC(O)=CC(O)=C3C(=O)C2)=C1 KCFYHBSOLOXZIF-UHFFFAOYSA-N 0.000 description 1
- 238000011038 discontinuous diafiltration by volume reduction Methods 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- 230000002222 downregulating effect Effects 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 238000004945 emulsification Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 238000010336 energy treatment Methods 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- ZDKZHVNKFOXMND-UHFFFAOYSA-N epinepetalactone Chemical compound O=C1OC=C(C)C2C1C(C)CC2 ZDKZHVNKFOXMND-UHFFFAOYSA-N 0.000 description 1
- 239000000686 essence Substances 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 1
- 229960005542 ethidium bromide Drugs 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- BEBCJVAWIBVWNZ-UHFFFAOYSA-N glycinamide Chemical compound NCC(N)=O BEBCJVAWIBVWNZ-UHFFFAOYSA-N 0.000 description 1
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 229940043257 glycylglycine Drugs 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- YQOKLYTXVFAUCW-UHFFFAOYSA-N guanidine;isothiocyanic acid Chemical compound N=C=S.NC(N)=N YQOKLYTXVFAUCW-UHFFFAOYSA-N 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000003301 hydrolyzing effect Effects 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 239000013072 incoming material Substances 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 238000011031 large-scale manufacturing process Methods 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 1
- MHCFAGZWMAWTNR-UHFFFAOYSA-M lithium perchlorate Chemical compound [Li+].[O-]Cl(=O)(=O)=O MHCFAGZWMAWTNR-UHFFFAOYSA-M 0.000 description 1
- 229910001486 lithium perchlorate Inorganic materials 0.000 description 1
- 108010072591 lysyl-leucyl-alanyl-arginine Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 239000004530 micro-emulsion Substances 0.000 description 1
- 230000006911 nucleation Effects 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000012466 permeate Substances 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 108010054442 polyalanine Proteins 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 230000003334 potential effect Effects 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 230000001012 protector Effects 0.000 description 1
- 230000007398 protein translocation Effects 0.000 description 1
- 238000003906 pulsed field gel electrophoresis Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 102220271883 rs1555611550 Human genes 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000000276 sedentary effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 238000007614 solvation Methods 0.000 description 1
- 238000009987 spinning Methods 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010079202 tyrosyl-alanyl-cysteine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 108010037335 tyrosyl-prolyl-glycyl-glycine Proteins 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 239000004034 viscosity adjusting agent Substances 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/43504—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates
- C07K14/43513—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae
- C07K14/43518—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from invertebrates from arachnidae from spiders
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
- C07K1/14—Extraction; Separation; Purification
- C07K1/145—Extraction; Separation; Purification by extraction or solubilisation
-
- D—TEXTILES; PAPER
- D01—NATURAL OR MAN-MADE THREADS OR FIBRES; SPINNING
- D01F—CHEMICAL FEATURES IN THE MANUFACTURE OF ARTIFICIAL FILAMENTS, THREADS, FIBRES, BRISTLES OR RIBBONS; APPARATUS SPECIALLY ADAPTED FOR THE MANUFACTURE OF CARBON FILAMENTS
- D01F4/00—Monocomponent artificial filaments or the like of proteins; Manufacture thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61L—METHODS OR APPARATUS FOR STERILISING MATERIALS OR OBJECTS IN GENERAL; DISINFECTION, STERILISATION OR DEODORISATION OF AIR; CHEMICAL ASPECTS OF BANDAGES, DRESSINGS, ABSORBENT PADS OR SURGICAL ARTICLES; MATERIALS FOR BANDAGES, DRESSINGS, ABSORBENT PADS OR SURGICAL ARTICLES
- A61L27/00—Materials for grafts or prostheses or for coating grafts or prostheses
- A61L27/36—Materials for grafts or prostheses or for coating grafts or prostheses containing ingredients of undetermined constitution or reaction products thereof, e.g. transplant tissue, natural bone, extracellular matrix
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
- C07K2319/21—Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
-
- D—TEXTILES; PAPER
- D10—INDEXING SCHEME ASSOCIATED WITH SUBLASSES OF SECTION D, RELATING TO TEXTILES
- D10B—INDEXING SCHEME ASSOCIATED WITH SUBLASSES OF SECTION D, RELATING TO TEXTILES
- D10B2211/00—Protein-based fibres, e.g. animal fibres
- D10B2211/01—Natural animal fibres, e.g. keratin fibres
- D10B2211/04—Silk
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Insects & Arthropods (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Gastroenterology & Hepatology (AREA)
- Zoology (AREA)
- Toxicology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Analytical Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Textile Engineering (AREA)
- Peptides Or Proteins (AREA)
- Artificial Filaments (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本公开涉及通过应用溶剂和高剪切微流体化方法来分离和纯化合成嵌段共聚物蛋白的方法。
Description
相关申请的交叉引用
本申请要求2019年9月16日提交的美国临时申请号62/901,053的权益,所述临时申请特此以引用的方式整体并入。
序列表
本申请含有序列表,其已通过EFS-Web提交并特此以引用的方式整体并入。所述ASCII副本创建于2020年9月16日,命名为BTT-033WO_SL.txt,并且大小是50,960字节。
背景技术
蜘蛛的丝多肽是大(>150kDa,>1000个氨基酸)多肽,其可以分解成三个结构域:N末端非重复结构域(NTD)、重复结构域(REP)和C末端非重复结构域(CTD)。NTD和CTD相对较小(分别为约150、约100个氨基酸),得到了充分研究,并且被认为赋予多肽水稳定性、pH敏感性和聚集时的分子排列。NTD还具有强预测性分泌标签,其在异源表达期间经常被除去。重复区占天然多肽的约90%,并折叠成结晶区和非结晶区,它们分别赋予丝纤维强度和柔韧性。
丝多肽有多种来源,包括蜂、蛾、蜘蛛、螨和其他节肢动物。一些生物体制造出具有独特序列、结构元件和力学特性的多种丝纤维。例如,圆网蜘蛛(orb weaving spider)有六种独特类型的腺体,其产生不同的丝多肽序列,这些丝多肽序列聚合成适于配合环境或生命周期生态位(niche)的纤维。纤维以其来源的腺体命名,并且多肽以腺体缩写(例如,“Ma”)和蛛丝蛋白(蜘蛛丝心蛋白的简称)的“Sp”标记。在圆网蛛中,这些类型包括大壶状腺(MaSp,也称为拖丝)、小壶状腺(MiSp)、鞭状腺(Flag)、葡萄状腺(AcSp)、管状腺(TuSp)和梨状腺(PySp)。跨纤维类型、结构域和在不同属和物种的生物体间变异的多肽序列的这种组合导致了大量潜在特性,其可以通过商业生产重组纤维来加以利用。迄今为止,绝大多数以重组丝的工作都集中在大壶状腺蛛丝蛋白(MaSp)上。
目前,重组丝纤维不可商购获得,并且除了少数例外,在大肠杆菌(Escherichiacoli)和其他革兰氏阴性原核生物以外的微生物中都不产生。迄今所产生的重组丝主要由聚合的短丝序列基序或者原始(native)重复结构域(有时与NTD和/或CTD组合)的片段组成。
但是,在一些情况下,重组蜘蛛丝多肽在生产和纯化期间形成不期望的不溶性聚集体。由于它们聚集和形成β-折叠结构的能力,基于丝序列的蛋白质难以溶解。这些蛋白质的溶解常常需要苛刻的针对生物分子的化学条件,诸如高摩尔浓度离散剂溶液。在纯化期间重新溶解肽的方法常常使蛋白质降解,导致产率不佳并且纤维的韧性低且手感差。因此,需要增加丝蛋白的溶解度和回收率的纯化这些多肽的改善方法。
本文提供了在化学溶剂化(包括各种离散剂溶液)不足的条件下,通过施加高物理能(诸如由高能流体处理器产生的剪切、冲击和空化)来溶解丝蛋白的方法。
发明内容
在一个方面中,本文提供了从宿主细胞分离重组蜘蛛丝蛋白的方法,其包括:提供包含重组蜘蛛丝蛋白的不溶性团块;将不溶性团块添加到包含溶剂的水性溶液中;向包含不溶性团块的水性溶液施加剪切力,从而使重组蜘蛛丝蛋白溶解在水性溶液中。
在一些实施方案中,剪切力是通过微流体化(microfluidization)施加的。
在一些实施方案中,微流体化产生约6×106s-1至10×106s-1的剪切速率。在一些实施方案中,微流体化产生至少约6×106s-1的剪切速率。在一些实施方案中,微流体化产生至少约10×106s-1的剪切速率。
在一些实施方案中,微流体化在20,000psi至30,000psi下进行。在一些实施方案中,微流体化在30,000psi下进行。在一些实施方案中,微流体化在23,000psi下进行。
在一些实施方案中,微流体化器(microfluidizer)是M-110P或LM10微流体化器。
在一些实施方案中,微流体化器包括G10Z相互作用室。在一些实施方案中,微流体化器包括F12Y相互作用室。
在一些实施方案中,剪切力施加至少两次。在一些实施方案中,剪切力施加三次。在一些实施方案中,剪切力在至少两次施加中是相同的。在一些实施方案中,剪切力在至少两次施加中是不同的。
在一些实施方案中,不溶性团块来源于包含宿主细胞的细胞培养物,其中宿主细胞表达重组蜘蛛丝蛋白。
在一些实施方案中,所述方法还包括收集来源于细胞培养物的不溶性团块,其中不溶性团块包含重组蜘蛛丝蛋白。
在一些实施方案中,溶剂是离散剂。在一些实施方案中,离散剂是尿素、硫氰酸胍(GdnSCN)或氯化胍(GdnHCL)。
在一些实施方案中,不溶性团块以约5%、10%、15%、20%、25%或30%不溶性团块/溶剂体积添加到水性溶液中。
在一些实施方案中,离散剂以0.1-10M的浓度存在于水性溶液中。在一些实施方案中,水性溶液包含约10M尿素、约4M-8MGdnHCl或约3M-6M GdnSCN。在一些实施方案中,水性溶液包括不多于(no more than)包含10M尿素的水性溶液、包含8M GdnHCl的水性溶液或包含6M GdnSCN的水性溶液的离液活性(chaotropic activity)。
在一些实施方案中,离液活性使用琼脂-胶凝测定进行量化。
在一些实施方案中,水性溶液包括约15%不溶性部分团块与85%体积的3MGdnSCN。在一些实施方案中,水性溶液包括约15%不溶性部分团块与85%体积的4MGdnHCl。在一些实施方案中,水性溶液包括约15%不溶性部分团块与85%体积的10M尿素。
在一些实施方案中,不溶性团块在20℃与30℃之间温育。在一些实施方案中,不溶性团块在室温下温育。在一些实施方案中,不溶性团块在不高于30℃下温育。在一些实施方案中,不溶性部分在包含溶剂的水性溶液中温育60至120分钟。
在一些实施方案中,不溶性团块包含细胞沉淀。
在一些实施方案中,收集来源于细胞沉淀的不溶性团块包括裂解宿主细胞。
在一些实施方案中,裂解包括热处理、化学处理、剪切破坏、物理匀化(homogenization)、声处理或化学匀化。
在一些实施方案中,收集细胞培养物的不溶性团块还包括离心裂解的细胞以获得第一细胞沉淀。
在一些实施方案中,收集不溶性团块还包括:以10:1尿素体积与沉淀质量的比率将所述细胞沉淀与包含4M尿素的溶液一起温育;以及离心包含4M尿素的溶液以获得第二细胞沉淀,之后在包含溶剂的水性溶液中温育第二细胞沉淀。
在一些实施方案中,所述方法还包括从水性溶液分离重组蜘蛛丝蛋白,从而产生分离的重组蜘蛛丝蛋白。
在一些实施方案中,重组蜘蛛丝蛋白是高度结晶的丝蛋白、高β折叠含量丝蛋白或低溶解度丝蛋白。
在一些实施方案中,重组蜘蛛丝蛋白包括如SEQ ID NO:23中所示的差异妩蛛(Uloborus diversus)MiSP蛋白。
在一些实施方案中,重组蜘蛛丝蛋白在非离液溶剂中的溶解度阈值低于90%、80%、70%、60%或50%。
在一些实施方案中,细胞培养物包含真菌、细菌或酵母细胞。在一些实施方案中,细菌细胞是大肠杆菌。
在一些实施方案中,使用ELISA测量分离的重组蜘蛛丝蛋白的量。在一些实施方案中,使用尺寸排阻色谱法测量分离的重组蜘蛛丝蛋白的量。
在一些实施方案中,分离的重组蜘蛛丝蛋白是全长重组蜘蛛丝蛋白。
在一些实施方案中,分离的重组蜘蛛丝蛋白包含至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%全长重组蜘蛛丝蛋白。
在一些实施方案中,使用ELISA测量全长重组蜘蛛丝蛋白的量。在一些实施方案中,使用尺寸排阻色谱法测量全长重组蜘蛛丝蛋白的量。
在一些实施方案中,分离的重组蜘蛛丝蛋白的纯度是5-10%、10-15%、15-20%、20-25%、25-30%、30-35%、35-40%、45-50%、50-55%、55-60%、60-65%、65-70%、70-75%、75-80%、80-85%、85-90%、90-95%或95-100%。
在另一方面中,本文提供了从宿主细胞分离重组蜘蛛丝蛋白的方法,其包括:提供包含重组蜘蛛丝蛋白的不溶性团块;将不溶性团块添加到包含溶剂的水性溶液中,其中水性溶液以最终10M尿素浓度包含15%(重量/体积)不溶性部分;通过微流体化,向包含不溶性团块的水性溶液中施加剪切力,从而使重组蜘蛛丝蛋白溶解在水性溶液中;以及从水性溶液分离重组蜘蛛丝蛋白,从而产生分离的重组蜘蛛丝蛋白。
在另一方面中,本文提供了从宿主细胞分离重组蜘蛛丝蛋白的方法,其包括:提供包含重组蜘蛛丝蛋白的不溶性团块;将不溶性团块添加到水性溶液中,其中水性溶液以最终10M尿素浓度包含约15%(重量/体积)不溶性部分;通过微流体化向水性溶液中施加剪切力,从而使重组蜘蛛丝蛋白溶解在水性溶液中,其中剪切力是约10×106s-1;以及从水性溶液分离重组蜘蛛丝蛋白,从而产生分离的重组蜘蛛丝蛋白。
在另一方面中,本文提供了组合物,其包含通过本文所公开的方法产生的重组蜘蛛丝蛋白。
在一些实施方案中,重组蜘蛛丝包含至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或100%全长重组蜘蛛丝。
在另一方面中,本文提供了丝纤维,其包含通过本文所公开的方法产生的重组蜘蛛丝蛋白。
附图说明
本文所述的本发明方法和组合物的这些和其他特征、方面和优点将关于以下描述和附图得到更好的理解,在附图中:
图1A显示了在各种相互作用室类型中作为压力的函数的计算的剪切速率。图1B显示了在各种单槽相互作用室类型中作为压力的函数的计算的流率。
图2显示了10M尿素提取和微流体化处理后,差异妩蛛丝蛋白MiSp(SEQ ID NO:23)的SEC曲线图。箭头指在MiSp蛋白峰。
具体实施方式
定义
除非另外指明,否则权利要求和说明书中使用的术语如下文所示进行定义。
除非本文中另外定义,否则与本文所述的本发明方法和组合物结合使用的科学和技术术语应具有本领域中的普通技术人员通常所理解的含义。另外,除非上下文另外要求,否则单数术语应包括复数,且复数术语应包括单数。通常,与以下结合使用的命名法和以下技术为本领域中众所周知且常用的那些:本文所述的生物化学、酶学、分子与细胞生物学、微生物学、遗传学和多肽与核酸化学以及杂交。
除非另外指明,否则本文所述的方法和技术通常是根据本领域中众所周知的常规方法并且如在本说明书中通篇引用和讨论的各种一般和更具体的参考文献中所述来执行的。参见例如Sambrook等人,Molecular Cloning:A Laboratory Manual,第2版,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(1989);Ausubel等人,Current Protocols in Molecular Biology,Greene Publishing Associates(1992,以及至2002年的增刊);Harlow和Lane,Antibodies:A Laboratory Manual,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,N.Y.(1990);Taylor和Drickamer,Introduction to Glycobiology,Oxford Univ.Press(2003);Worthington EnzymeManual,Worthington Biochemical Corp.,Freehold,N.J.;Handbook of Biochemistry:Section A Proteins,第I卷,CRC Press(1976);Handbook of Biochemistry:Section AProteins,第II卷,CRC Press(1976);Essentials of Glycobiology,Cold Spring HarborLaboratory Press(1999)。
本文提及的所有出版物、专利和其他参考文献均以特此引用的方式整体并入本文。
除非另外指示,否则以下术语应理解成具有以下含义:
术语“体外”是指在与活生物体分开生长,例如在组织培养物中生长的活细胞中发生的过程。
术语“体内”是指在活生物体内发生的过程。
如本文所用的术语“澄清”是指除去宿主细胞生物质诸如全细胞、裂解的细胞、细胞膜、脂质、细胞器、细胞核、非蜘蛛丝蛋白或任何其他不期望的细胞部分或产物或者细胞培养物的任何其他不期望的部分的方法。澄清还可以指从部分纯化或分离蜘蛛丝组合物中除去杂质。杂质可包括但不限于非蜘蛛丝蛋白、降解的蜘蛛丝蛋白、大型蛋白质聚集体、纯化和分离过程期间使用的化学品或任何其他不期望的物质。
如本文所用的术语“纯度”是指基本上全长的分离的重组蜘蛛丝蛋白作为所有分离的组分的一部分的量,所述分离的组分具有例如部分的或降解的分离的重组蜘蛛丝蛋白、脂质、蛋白质、膜或样品诸如提取样品中的其他分子。全长重组蛋白是已知全长蛋白的长度的至少90-100%。在一些实施方案中,全长重组蜘蛛丝蛋白是已知全长蛋白的长度的至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
本文所用的术语“产率”是指与蜘蛛丝的起始量相比,回收的总蜘蛛丝的量,包括蜘蛛丝蛋白片段和基本上全长的蜘蛛丝。
术语“剪切力”是指在平行或切向于主体或团块的表面或平面截面的方向上作用的力。关于流体的术语“剪切速率”是指一层流体越过相邻层时的速度变化率。例如,当两个平行的流体平面以不同的速度移动时,出现剪切速率。
术语“可溶性丝蛋白”是指在严格离心后保留在上清液中的蛋白。严格离心的实例是将在50mL锥形离心管中的50mL丝蛋白等分试样样品在室温下以15,000x g离心20min。
术语“多核苷酸”或“核酸分子”是指长度为至少10个碱基的核苷酸的聚合形式。所述术语包括DNA分子(例如,cDNA或基因组DNA、或合成DNA)和RNA分子(例如,mRNA或合成RNA),以及含有非天然核苷酸类似物、非天然核苷间键或两者的DNA或RNA的类似物。核酸可以呈任何拓扑构象。例如,核酸可为单链、双链、三链、四链、部分双链、具支链、发夹型、环状或呈挂锁(padlocked)构象。
除非另外指示,且作为本文中以通用格式“SEQ ID NO:”描述的所有序列的实例,“包含SEQ ID NO:1的核酸”是指如下核酸,其至少一部分具有以下序列:(i)序列SEQ IDNO:1,或(ii)与SEQ ID NO:1互补的序列。两者之间的选择由上下文决定。例如,如果将核酸用作探针,那么两者之间的选择由探针与所需靶标互补的要求决定。
“分离的”RNA、DNA或混合聚合物为如下RNA、DNA或混合聚合物,其与在其天然宿主细胞中自然伴随天然多核苷酸的其他细胞组分,例如与其天然缔合的核糖体、聚合酶和基因组序列基本上分离。
术语“重组体”是指如下生物分子(例如基因或多肽),其:(1)已从其天然存在的环境中移出,(2)与在自然界中发现所述基因的多核苷酸的全部或部分不缔合,(3)与在自然界中未与其连接的多核苷酸可操作地连接,或者(4)在自然界中不存在。术语“重组体”可关于克隆的DNA分离物、化学合成的多核苷酸类似物或由异源系统生物合成的多核苷酸类似物以及由此类核酸编码的多肽和/或mRNA使用。
如本文所用,在本文中,如果异源序列与内源核酸序列相邻放置,使得所述内源核酸序列的表达发生改变,那么将生物体基因组中所述内源核酸序列(或所述序列的编码多肽产物)视为“重组体”。在此背景下,异源序列为与内源核酸序列天然不相邻的序列,无论所述异源序列本身为内源的(源自同一宿主细胞或其后代)亦或外源的(源自不同宿主细胞或其后代)。例如,启动子序列可取代(例如,通过同源重组)宿主细胞基因组中的基因的天然启动子,使得所述基因具有经改变的表达模式。所述基因现将变成“重组体”,因为其与自然侧接它的序列中的至少一些序列分离。在一个实施方案中,异源核酸分子不是生物体内源的。在另一实施方案中,异源核酸分子是通过同源或随机整合来整合到宿主染色体中的质粒或分子。
如果核酸含有基因组中的对应核酸中不自然存在的任何修饰,那么所述核酸同样被视为“重组体”。例如,如果内源编码序列含有人工引入(例如通过人为干预引入)的插入、缺失或点突变,那么所述内源编码序列被视为“重组体”。“重组核酸”还包括在异源位点处整合到宿主细胞染色体中的核酸和作为附加体存在的核酸构建体。
在核酸序列的语境中,术语“百分比序列同一性”是指在比对最大对应性时,两个序列中残基的比对的定量值。序列同一性比较的长度可以超过至少约9个核苷酸,通常至少约20个核苷酸,更通常至少约24个核苷酸,通常至少约28个核苷酸,更通常至少约32个核苷酸并且优选地至少约36个或更多个核苷酸的区段。本领域中已知有许多不同的算法可用于测量核苷酸序列同一性。例如,可以使用FASTA、Gap或Bestfit对多肽序列进行比较,它们是Wisconsin Package 10.0版,Genetics Computer Group(GCG),Madison,Wis中的程序。FASTA提供在查询序列与搜索序列之间最佳重叠区域的比对和序列同一性百分比。Pearson,Methods Enzymol.183:63-98(1990)(特此以引用的方式整体并入本文)。例如,核酸序列之间的百分比序列同一性可以如GCG 6.1版(以引入的方式并入本文)中所提供使用FASTA以其默认参数(字长6和用于计分矩阵的NOPAM系数)或使用Gap以其默认参数来确定。替代地,可以使用计算机程序BLAST(Altschul等人,J.Mol.Biol.215:403-410(1990);Gish和States,Nature Genet.3:266-272(1993);Madden等人,Meth.Enzymol.266:131-141(1996);Altschul等人,Nucleic Acids Res.25:3389-3402(1997);Zhang和Madden,GenomeRes.7:649-656(1997)),尤其是blastp或tblastn(Altschul等人,Nucleic Acids Res.25:3389-3402(1997))比较序列。
在提及核酸或其片段时,术语“基本上的同源性”或“基本上的类似性”指示在与另一核酸(或其互补链)以适当核苷酸插入或缺失进行最佳比对时,如通过如上文所讨论的任何众所周知的序列同一性算法(诸如FASTA、BLAST或Gap)所测量,在至少约76%、80%、85%,优选地至少约90%且更优选地至少约95%、96%、97%、98%或99%的核苷酸碱基中有核苷酸序列同一性。
核酸(也被称为多核苷酸)可以包括RNA、cDNA、基因组DNA以及上述的合成形式和混合聚合物的有义和反义链。它们可以通过化学或生物化学方式进行修饰,或可以含有非天然或衍生的核苷酸碱基,如本领域的技术人员很容易理解的那样。此类修饰包括例如标签、甲基化、用类似物取代一个或多个天然存在的核苷酸、核苷酸间修饰诸如不带电荷的键联(例如,膦酸甲酯、膦酸三酯、磷酰胺酯、氨基甲酸酯等)、带电荷的键联(例如,硫代磷酸酯、二硫代磷酸酯等)、垂悬(pendent)部分(例如,多肽)、嵌入剂(例如,吖啶、补骨脂素等)、螯合剂、烷化剂和修饰的键联(例如,α异头核酸等)。还包括能够经由氢键合和其他化学相互作用来结合指定序列的合成分子。此类分子在本领域中是已知的,并且包括例如肽键联取代分子主链中的磷酸酯键联的那些分子。其他修饰可以包括例如核糖环含有桥联部分或其他结构的类似物,诸如在“锁”核酸中存在的修饰。
当应用于核酸序列时,术语“突变的”意指核酸序列中的核苷酸与参考核酸序列相比可以是插入、缺失或改变的。可以在一个位点进行单一改变(点突变),或者可以在单一位点插入、缺失或改变多个核苷酸。此外,可以在核酸序列内任何数目的位点进行一个或多个改变。可以通过本领域中已知的任何方法使核酸序列突变,包括但不限于诱变技术,诸如“易错PCR”(用于在DNA聚合酶的复制保真度低的条件下进行PCR的过程,使得沿着PCR产物的整个长度获得高点突变率;参见例如Leung等人,Technique,1:11-15(1989)以及Caldwell和Joyce,PCR Methods Applic.2:28-33(1992));以及“寡核苷酸定点诱变”(在任何感兴趣的克隆DNA区段中实现产生位点特异性突变的过程;参见例如Reidhaar-Olson和Sauer,Science 241:53-57(1988))。
如本文所用的术语“载体”旨在指代一核酸分子,其能够运输与其连接的另一核酸。载体的一种类型是“质粒”,其通常指可将其他DNA区段连接到其中的环状双链DNA环,但还包括线性双链分子,诸如从通过聚合酶链反应(PCR)进行扩增或用限制性酶处理环状质粒而得到的那些。其他载体包括粘粒、细菌人工染色体(BAC)和酵母人工染色体(YAC)。另一类型的载体是病毒载体,其中其他DNA区段可以连接到病毒基因组中(下文将更详细地讨论)。某些载体能够在它们所引入的宿主细胞中进行自主复制(例如,在宿主细胞中发挥作用的具有复制起点的载体)。其他载体可以在进入到宿主细胞后整合到宿主细胞的基因组中,并从而与宿主基因组一起复制。此外,某些优选的载体能够指导它们可操作性地连接的基因的表达。此类载体在本文中称为“重组表达载体”(或简称“表达载体”)。
本文所用的术语“表达系统”包括在宿主细胞中表达基因的媒介物或载体,以及使基因稳定整合到宿主染色体中的载体或媒介物。
“可操作性地连接的”或“可操作地连接的”表达控制序列是指表达控制序列与感兴趣的基因接续以控制感兴趣的基因的键联,以及以反式或在远处作用以控制感兴趣的基因的表达控制序列。
本文所用的术语“表达控制序列”是指多核苷酸序列,它们对于影响与其可操作性地连接的编码序列的表达是必要的。表达控制序列是控制核酸序列的转录、转录后事件和翻译的序列。表达控制序列包括适当的转录起始、终止、启动子和增强子序列;有效的RNA处理信号,诸如剪接和聚腺苷酸化信号;稳定细胞质mRNA的序列;增强翻译效率的序列(例如,核糖体结合位点);增强多肽稳定性的序列;以及当需要时,增强多肽分泌的序列。此类控制序列的性质因宿主生物而不同;在原核生物中,此类控制序列通常包括启动子、核糖体结合位点和转录终止序列。术语“控制序列”旨在至少包括其存在对表达至关重要的所有组分,并且可以包括其存在是有利的其他组分,例如,前导序列和融合配偶体序列。
本文所用的术语“启动子”是指RNA聚合酶与其结合以起始基因转录的DNA区,以及在mRNA转录起始位点的5'方向处的位置。
如本文所用的术语“重组宿主细胞”(或简称“宿主细胞”)旨在指代其中引入了重组载体的细胞。应当理解,此类术语旨在不仅指代特定受试者细胞,还指代这种细胞的子代。因为在后代中,由于突变或环境影响,可能发生某些修饰,此类子代能实际上不与母体细胞相同,但仍包括在如本文所用的术语“宿主细胞”的范围内。重组宿主细胞可以是在培养物中生长的分离的细胞或细胞系,或者可以是驻留在活组织或生物体中的细胞。
术语“多肽”涵盖天然存在和非天然存在的蛋白及其片段、突变体、衍生物和类似物。多肽可为单体或聚合的。另外,多肽可包含多个不同结构域,每个结构域均具有一种或多种不同活性。
如本文所用,术语“分子”意指任何化合物,包括但不限于小分子、肽、多肽、糖、核苷酸、核酸、多核苷酸、脂质等,并且这种化合物可以是天然或合成的。
如本文所用的术语“嵌段”或“重复单元”是指天然丝多肽的大于约12个氨基酸的亚序列,其在天然丝多肽序列中重复出现,可能有适度变异,并且充当丝多肽序列中的基本重复单元。嵌段可以但不一定包括非常短的“基序”。如本文所用的“基序”是指在多个嵌段中出现的约2-10个氨基酸的序列。例如,基序可以由氨基酸序列GGA、GPG或AAAAA(SEQ IDNO:38)组成。多个嵌段的序列是“嵌段共聚物”。
如本文所用,术语“重复结构域”是指选自丝多肽中连续的(未被实质性的非重复结构域打断的,不包括已知的丝间隔元件)重复区段的集合的序列。原始丝序列通常含有一个重复结构域。在一些实施方案中,每个丝分子有一个重复结构域。如本文所用的“宏观重复体”(macro-repeat)是包括多于一个嵌段的天然存在的重复氨基酸序列。在一个实施方案中,宏观重复体在重复结构域中重复至少两次。在另一实施方案中,这两次重复是不完美的。本文所用的“准重复体”(quasi-repeat)是包含多于一个嵌段的氨基酸序列,使得在氨基酸序列中嵌段是类似的但不是完全相同的。
如本文所用的“重复序列”或“R”是指重复的氨基酸序列。在一个实施方案中,重复序列包括宏观重复体或宏观重复体的片段。在另一实施方案中,重复序列包括嵌段。在另一实施方案中,跨两个重复序列划分单一嵌段。
术语“约”指示并涵盖指示的值以及高于和低于所述值的范围。在某些实施方案中,术语“约”指示指定的值±10%、±5%或±1%。在某些实施方案中,在适用时,术语“约”指示指定的值±所述值的一个标准偏差。
必须注意,除非上下文另外明确规定,否则如说明书和所附权利要求书中所用的,单数形式“一个”、“一种”和“所述”包括多个指代物。
本文中提到的范围应理解为范围内所有数值的简略表达,包括所提到的端点。例如,1至50的范围应理解为包括由1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49和50组成的组的任何数字、数字组合或子范围。此外,2-5%的范围包括2%和5%,以及两者之间的任何数字或分数,例如:2.25%、2.5%、2.75%、3%、3.25%、3.5%、3.75%、4%、4.25%、4.5%和4.75%。
用于溶解和纯化重组蛋白的方法
在细胞培养物中表达的重组蜘蛛丝蛋白必须从细胞组分中纯化出来。在一些情况下,丝蛋白陷在不溶性细胞碎片中,或者形成不溶性丝蛋白聚集体。不溶性丝蛋白难以纯化并且导致重组丝蛋白回收率下降。此外,一些分离的蜘蛛丝蛋白固体物还可以是不溶性的。例如,MBI 18B丝粉的溶解度很低,并且已知一些模型蜘蛛丝诸如差异妩蛛MiSp是高度不溶性的。在此类情况下,可以将各种方法应用于不溶性团块、聚集体或丝固体物,以释放丝蛋白并使其溶解以供纯化,从而使重组丝蛋白的回收率增加。此外,即使在丝可溶(即,丝蛋白溶解是热力学上有利的)的条件下,溶解速度也可能很慢。这种缓慢的速率可能是由于溶解反应所需的活化能较高,或者丝从细胞碎片颗粒的大量运输是速率限制的。在两种情况下,当丝聚集体不溶解时,或者当丝是可溶的但溶解缓慢时,通过匀化或微流体化施加高物理能过程(诸如高剪切力)可以促进丝蛋白的溶解。高剪切力为溶液增添能量以增加反应速度,从而克服高活化能,或通过打碎细胞颗粒和丝蛋白聚集体,减少了大量运输效果。因此,以剪切力的形式施加物理能可以增加重组蜘蛛丝蛋白的溶解度,并且因此增加其回收率。
本文描述了通过施加高物理能过程诸如剪切力、剪切速率、冲击和空化来溶解、分离和纯化重组蜘蛛丝蛋白的方法。在一些实施方案中,高物理能过程是通过匀化或微流体化施加的。向重组蛋白施加高物理能过程使蛋白质在水性溶液中的溶解增加,从而使重组蛋白的纯化和回收率增加。
在一些实施方案中,不溶性团块是细胞沉淀。在一些实施方案中,不溶性团块是细胞裂解物。在一些实施方案中,不溶性团块是分离的蜘蛛丝固体物、团块粉末或挤出物。丝固体物或重组丝固体物是分离的重组蜘蛛丝组分,诸如纤维、挤出物、粉末或沉淀。挤出物是通过喷丝头挤出的挤出重组蜘蛛丝组合物。
物理能和剪切力
可以向不溶性重组蜘蛛丝蛋白施加物理能,以增加蛋白质的溶解度。物理能是通过施加机械力诸如压缩或收缩、压力、流体流动、冲击、空化、剪切力、剪切速率、剪切应力、拉伸或其任何组合或者本领域中已知的任何其他适当的机械力来转移到不溶性重组蜘蛛丝的动能或机械能。机械能的这种施加增加了重组蛋白在溶液中的溶解度。一般来讲,施加诱导对重组蛋白的受控损伤的动能或机械能的任何方法都可以用于溶解重组蛋白。不溶性重组蛋白的溶解度增加可以通过例如由机械应变或剪切力引起的压力、使重组蛋白或细胞裂解物经受变形、收缩、快速拉伸、快速压缩或高剪切速率的脉冲导致。
在一些实施方案中,剪切力包括但不限于剪切速率和其他物理能过程,诸如由高能流体处理器产生的冲击、空化和湍流混合。
在一些实施方案中,所施加的物理能是剪切速率、剪切力、空化、冲击、压力、声处理、乳化或本领域中已知的任何其他适当的施加方法。在一些方面中,物理能是通过匀化、微流体化微乳化或弗式压碎来施加。在一些实施方案中,物理能是剪切力。在一些实施方案中,剪切力产生剪切速率。在一些实施方案中,物理能是压力。在一些实施方案中,物理能是通过匀化或微流体化施加的。在一些实施方案中,声处理是超声处理。
许多不同的可以施加物理能的仪器可供使用,包括高能流体处理器、微流体化器、弗式压碎器(French Press)、高压匀化器、珠磨机、旋转共混机和转子/定子装置。在本文所述的一些实施方案中,重组蛋白可使用微流体化器进行溶解。微流体化器可以从商业来源购买,诸如Microfluidics Corp(Westwood,MA)生产的M110EH、M815、M700、LV1、LM10、LM20、M110Y或M110P微流体化器。
微流体化器由在其中流由泵驱动的可互换定几何(fixed-geometr y)相互作用室(诸如G10Z、H10Z、H30Z、H210Z、L30Z、F20Y或F12Y相互作用室)组成。在Y型几何相互作用室中,进入的流被分成两个或更多束流并且在高速下重新组合,以产生急剧升降的速度和压力梯度、剪切、空化和加热。相互作用室内的流体经历高流速和均匀施加的剪切力,导致流体上产生剪切速率。匀化的强度可以通过改变相互作用室的几何形状、改变温度、改变压力或通过仪器多次处理同一材料来改变。与进入的材料的浓度、缓冲液组成以及溶液、乳液或悬浮液的理化性质也存在复杂的相互作用。若干参数可能影响重组蛋白的溶解度,包括压力、毛细管直径、温度、匀化次数和缓冲条件。此外,相互作用室可以具有单一通道(单槽相互作用室)或多于两个通道(多槽互相互作用室)。多槽相互作用室可用于增加通过相互作用室的体积流率,实现更大的样品处理体积。通过小至50μm的通道,微流体化器室内的流体流率可以达到500m/s。流体移动穿过相互作用室时,压力的变化导致剪切速率的变化。
可以使用本领域中已知的任何适当的匀化器或微流体化器。微流体化器和高压匀化器可从多个供应商商购获得,包括Microfluidics(Westwood MA)、Thomas Scientific(Swedesboro,NJ)、CAT Scientific(Paso Robles,CA)和Thermo Fisher Scientific。在一些实施方案中,微流体化器包括Z型相互作用室。在一些实施方案中,微流体化器包括Y型相互作用室。在一些实施方案中,微流体化器是M-110P或LM10微流体化器。
微流体化器相互作用室的特定组合所产生的剪切速率以及样品处理的压力可以通过室制造商所提供的信息来确定。在各种单槽微流体化器品牌相互作用室类型中随压力变化的计算剪切速率的实例显示于图1A。在各种单槽微流体化器品牌相互作用室类型中随压力变化的流率显示于图1B。图1A和1B改编自MicrofluidicsTM制作的2014年微流体处理器用户指南(2014Microfluidics Processor User Guide)。如图1A所示,两个不同室中相同量的流体压力(例如,F12Y室和L30Z室,在30,000psi下)导致室产生的剪切速率分别相差几乎一个数量级,10×106s-1相比于2×106s-1。因此,改变流体流动通过不同相互作用室的压力导致不同量的剪切力和剪切速率。并且,剪切速率的量可以通过改变选定相互作用室中的流体压力来改变和优化。
向流体或溶液施加剪切力产生流体剪切速率。在一些实施方案中,剪切力通过微流体化器施加。在一些实施方案中,微流体化器产生剪切速率。在一些实施方案中,剪切速率可以是1×103s-1至1×109s-1。剪切速率可以是约1×103s-1、1.5×103s-1、2×103s-1、2.5×103s-1、3×103s-1、3.5×103s-1、4×103s-1、4.5×103s-1、5×103s-1、5.5×103s-1、6×103s-1、6.5×103s-1、7×103s-1、7.5×103s-1、8×103s-1、8.5×103s-1、9×103s-1、9.5×103s-1、1×104s-1、1.5×104s-1、2×104s-1、2.5×104s-1、3×104s-1、3.5×104s-1、4×104s-1、4.5×104s-1、5×104s-1、5.5×104s-1、6×104s-1、6.5×104s-1、7×104s-1、7.5×104s-1、8×104s-1、8.5×104s-1、9×104s-1、9.5×104s-1、1×105s-1、1.5×105s-1、2×105s-1、2.5×105s-1、3×105s-1、3.5×105s-1、4×105s-1、4.5×105s-1、5×105s-1、5.5×105s-1、6×105s-1、6.5×105s-1、7×105s-1、7.5×105s-1、8×105s-1、8.5×105s-1、9×105s-1、9.5×105s-1、1×106s-1、1.5×106s-1、2×106s-1、2.5×106s-1、3×106s-1、3.5×106s-1、4×106s-1、4.5×106s-1、5×106s-1、5.5×106s-1、6×106s-1、6.5×106s-1、7×106s-1、7.5×106s-1、8×106s-1、8.5×106s-1、9×106s-1、9.5×106s-1、1×107s-1、1.5×107s-1、2×107s-1、2.5×107s-1、3×107s-1、3.5×107s-1、4×107s-1、4.5×107s-1、5×107s-1、5.5×107s-1、6×107s-1、6.5×107s-1、7×107s-1、7.5×107s-1、8×107s-1、8.5×107s-1、9×107s-1、9.5×107s-1、1×108s-1、1.5×108s-1、2×108s-1、2.5×108s-1、3×108s-1、3.5×108s-1、4×108s-1、4.5×108s-1、5×108s-1、5.5×108s-1、6×108s-1、6.5×108s-1、7×108s-1、7.5×108s-1、8×108s-1、8.5×108s-1、9×108s-1、9.5×108s-1、1×109s-1。在一些实施方案中,剪切速率是约6.5×106s-1。在一些实施方案中,剪切速率是约9.5×106s-1。
压力可以是约500至50,000psi。压力可以是至少约500psi、750psi、1,000psi、2,000psi、3,000psi、4,000psi、5,000psi、10,000psi、15,000psi、20,000psi、25,000psi、20,000psi、25,000psi、40,000psi、45,000psi或50,000psi。压力可以是约500至50,000psi、500至1,000psi、1,000至5,000psi、5,000至10,000psi、7,500至12,000psi、10,000至15,000psi、15,000至20,000psi、15,000-22,000、psi、18,000-25,000psi、18,000-22,000psi、20,000至25,000psi、25,000至30,000psi、27,500至30,000psi、27,500至32,000psi、30,000至32,000psi、30,000至35,000psi、35,000至40,000psi、40,000至45,000psi或45,000至50,000psi。在一些实施方案中,压力是约10,000psi、20,000psi、23,000psi或30,000psi。在一些实施方案中,压力是约23,000psi。在一些实施方案中,压力是约30,000psi。在一些实施方案中,压力在10,000与30,000psi之间。
可以通过物理能将蜘蛛丝蛋白处理至少一次,即向蜘蛛丝蛋白施加来自微流体化器或匀化器的压力、剪切力和/或剪切速率一次。在一些实施方案中,压力、剪切力和/或剪切速率施加一次。还可以通过物理能将蜘蛛丝蛋白处理多于一次,即向蜘蛛丝蛋白施加压力、剪切力和/或剪切速率两次、三次、四次或更多次。在一些实施方案中,压力、剪切力和/或剪切速率施加三次。在一些实施方案中,压力、剪切力和/或剪切速率施加两次。
所施加的物理能即压力、剪切力和/或剪切速率在每次重复通过或运行时可以是相同的。例如,样品可以在第一次通过、第二次通过和第三次通过时以30,000psi进行处理。在其他实施方案中,每次通过或运行时的压力可以是不同的。例如,样品可以在第一次通过时以30,000psi进行处理,在第二次通过时以23,000psi进行处理并且在第三次通过时以10,000psi进行处理。在另一实例中,样品可以在第一次通过时以剪切速率6.5×106s-1进行处理,在第二次通过时以剪切速率9.5×106s-1进行处理并且在第三次通过时以剪切速率5.5×106s-1进行处理。在一些实施方案中,压力是每平方英寸的绝对压力(psia)。在一些实施方案中,压力是每平方英寸的表压(psig)。
在一些方面中,物理能是通过声处理施加的声能。在此类情况下,向溶液施加声波造成溶液的空化,导致溶液中气泡的成核、生长和破裂,从而导致了溶液中重组蛋白的机械和物理变形,并且因此溶解度增加。
溶剂和缓冲条件
也可以改变重组蛋白和不溶性细胞部分、沉淀或裂解物的溶液的缓冲条件,以优化重组蛋白的匀化或微流体化和溶解。重组丝多肽在生产和纯化期间由于其聚集并形成β-折叠结构的能力而形成不期望的不溶性聚集体。溶解这些生物分子需要苛刻的化学条件,诸如高摩尔浓度离散剂溶液。此外,在纯化期间重新溶解肽所需的条件常常使蛋白质降解,导致产率不佳并且纤维的韧性低且手感差。然而,较低离散剂浓度与施加高物理能(诸如微流体化或匀化)组合可以使重组蛋白的溶解度增加并且降解减少。
在一些实施方案中,可以将溶剂添加到不溶性细胞部分、沉淀或裂解物中,以溶解重组蜘蛛丝蛋白。可以使用本领域中已知的任何适当的溶剂,包括但不限于离散剂和有机溶剂。在一些实施方案中,溶剂是离散剂。可以使用本领域中已知的任何适当的离散剂,包括但不限于氯化胍(GdnHCl)、硫氰酸胍(GdnSCN)、异硫氰酸胍、正丁醇、乙醇、高氯酸锂、乙酸锂、氯化镁、苯酚、2-丙醇、十二烷基硫酸钠、硫脲和尿素。在一些实施方案中,溶剂是氯化胍(GdnHCl)。在一些实施方案中,溶剂是硫氰酸胍(GdnSCN)。在一些实施方案中,溶剂是尿素。
在一些实施方案中,溶剂被配制在水缓冲液中。在一些实施方案中,溶剂被配制在50mM Tris pH 7.5缓冲液中。可以使用本领域中已知的任何适当的缓冲溶液来配制溶剂,包括但不限于磷酸盐缓冲盐水(PBS)或古德氏缓冲液(Good's buffer),诸如Tris、Tricine、MES、PIPES、ACES、MOPS、MOPSO、TES、HEPES、TAPS、Bicine、TES、bis-tris丙烷、bis-tris甲烷、ADA、HEPBS、CHES、AMP、CAPS、CAPSO、甘氨酰胺、双甘氨肽或任何其他适当的缓冲液。
溶剂(例如,离散剂)可以直接添加到不溶性细胞部分、沉淀或裂解物中,或作为水性缓冲液的组分进行添加。水性缓冲液中溶剂的浓度可以如本领域的技术人员所确定来改变。在一些实施方案中,水性缓冲液中溶剂的浓度可以在0.01-10M、0.01-0.1M、0.1-0.5M、0.5-1M、1-2M、2-3M、3-4M、4-5M、5-6M、6-7M、7-8M、8-9M、9-10M之间或大于10M。在一些实施方案中,水性缓冲液中溶剂的浓度可以是至少约0.1M、0.15M、0.2M、0.25M、0.3M、0.35M、0.4M、0.45M、0.5M、0.55M、0.6M、0.65M、0.7M、0.75M、0.8M、0.85M、0.9M、0.95M、1M、1.5M、2M、2.5M、3M、3.5M、4M、4.5M、5M、5.5M、6M、6.5M、7M、7.5M、8M、8.5M、9M、9.5M或10M或更大。
在一些实施方案中,以特定的团块与体积的比率将溶剂添加到不溶性细胞部分、沉淀或裂解物中。在这样的实施方案中,确定总不溶性部分、沉淀或裂解物质量,并添加特定体积的具有一定浓度溶剂或离散剂的溶液。例如,测量细胞沉淀重量,并重新悬浮在包含离散剂的溶液中,使得细胞团块的最终体积为样品总体积的15%(例如,细胞沉淀为0.75mg,并重新悬浮在4.25ml含有0.01-10M离散剂溶液的缓冲溶液中)。在另一实例中,测量细胞沉淀重量,并重新悬浮在等体积的包含溶剂的溶液中,得到50%细胞团块与溶剂体积的比率。
在一些实施方案中,细胞团块与溶剂体积的比率可以在1-100%、1-5%、5-10%、10-15%、15-20%、20-25%、25-30%、30-35%、35-40%、45-50%、50-55%、55-60%、60-65%、65-70%、70-75%、75-80%、80-85%、85-90%、90-95%或95-100%细胞团块之间。在一些实施方案中,细胞团块与溶剂体积的比率可以是至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%细胞团块。
在一些实施方案中,细胞团块与溶剂体积的比率可以在1-100%、1-5%、5-10%、10-15%、15-20%、20-25%、25-30%、30-35%、35-40%、45-50%、50-55%、55-60%、60-65%、65-70%、70-75%、75-80%、80-85%、85-90%、90-95%或95-100%溶剂体积之间。在一些实施方案中,细胞团块与溶剂体积的比率可以是至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%溶剂体积。
在一些实施方案中,包含水性缓冲液和不溶性细胞部分、沉淀或裂解物的溶液中溶剂的最终浓度可以在0.01-10M、0.01-0.1M、0.1-0.5M、0.5-1M、1-2M、2-3M、3-4M、4-5M、5-6M、6-7M、7-8M、8-9M或9-10M之间。在一些实施方案中,包含水性缓冲液和细胞裂解物或沉淀的溶液中溶剂的最终浓度可以是至少约0.1M、0.15M、0.2M、0.25M、0.3M、0.35M、0.4M、0.45M、0.5M、0.55M、0.6M、0.65M、0.7M、0.75M、0.8M、0.85M、0.9M、0.95M、1M、1.5M、2M、2.5M、3M、3.5M、4M、4.5M、5M、5.5M、6M、6.5M、7M、7.5M、8M、8.5M、9M、9.5M或10M。
还可以使用其他缓冲液修饰,诸如剪切保护剂、粘度调节剂和/或影响囊泡结构特性的溶质。还可以添加赋形剂以改善匀化或微流体化的效率,诸如膜软化材料和分子拥挤剂(molecular crowding agent)。对缓冲液的其他修饰可以包括特定pH范围和/或盐、有机溶剂、小分子、去污剂、两性离子、氨基酸、聚合物和/或上述的任何组合的浓度,包括多种浓度。
在一些实施方案中,不溶性细胞部分、沉淀或裂解物与包含溶剂的水性溶液一起温育。细胞沉淀或裂解物与溶液一起温育的时间的量可以改变。温育时间可以在1min至超过3小时(180min)、1min至60min、3min至90min、60min至120min、90min至150min或120min至180min之间。温育时间可以是至少1min、5min、10min、15min、20min、30min、45min、60min、75min、90min、105min、120min、135min、150min、165min、180min或更长时间。在一些实施方案中,温育时间是60min。在一些实施方案中,温育时间是75min。在一些实施方案中,温育时间是90min。在一些实施方案中,温育时间是105min。在一些实施方案中,温育时间是120min。
不溶性细胞部分、沉淀或裂解物可以与水性溶液一起在5-70℃下温育。在一些实施方案中,不溶性细胞部分、沉淀或裂解物与水性溶液一起在5-10℃、10-20℃、10-15℃、15-20℃、20-30℃、20-22℃、20-25℃、22-27℃、25-27℃、25-20℃、27-30℃、30-40℃、40-50℃、40-45℃、45-50℃、50-60℃、50-55℃、55-60℃、60-70℃、60-65℃或65-70℃下温育。在一些实施方案中,不溶性细胞部分、沉淀或裂解物与水性溶液一起在20-30℃下温育。在一些实施方案中,不溶性细胞部分、沉淀或裂解物与水性溶液一起在25℃下温育。在一些实施方案中,不溶性细胞部分、沉淀或裂解物与水性溶液一起在室温下温育。在一些实施方案中,不溶性细胞部分、沉淀或裂解物与水性溶液一起在不高于30℃下温育。
在一些实施方案中,重组蜘蛛丝蛋白在宿主细胞的细胞质中表达。蛋白质的分离需要裂解宿主细胞以释放重组蜘蛛丝蛋白。可以使用任何适当的方法来裂解宿主细胞,包括但不限于热处理、化学处理、剪切破坏、物理匀化、声处理或化学匀化。化学处理包括用已知破坏原核细胞和真核细胞的质膜的化学品或酶温育细胞,诸如去污剂,诸如Triton X-100、Nonidet P-40、CHAPS、十二烷基硫酸钠(SDS)或其他适当的去污剂。
裂解细胞后,包含重组蜘蛛丝蛋白的不溶性部分可以通过离心细胞裂解物来收集,得到不溶性物质的细胞沉淀,其包含重组蜘蛛丝蛋白。使不溶性重组蛋白沉淀的离心速度可由本领域的技术人员确定。在一些实施方案中,离心机速度是100-10,000x g。在一些实施方案中,离心机速度是100x g、200x g、300x g、400x g、500x g、600x g、700x g、800xg、900x g、1000x g、2000x g、3000x g、4000x g、5000x g、6000x g、7000x g、8000x g、9000x g或10,000x g。
在一些情况下,不溶性细胞部分或沉淀可以用离散剂重新悬浮或洗涤,诸如尿素溶液,然后再次离心以产生第二细胞沉淀。然后此第二细胞沉淀与水性溶剂溶液一起温育,并施加物理力以使重组蜘蛛丝蛋白溶解。洗涤溶液中离散剂摩尔浓度可以是0.1-10M。在一些实施方案中,离散剂是尿素。在一些实施方案中,离散剂是4M尿素。
在一些实施方案中,可以从细胞裂解物或细胞沉淀中除去非蜘蛛丝蛋白的生物或化学杂质。从细胞裂解物或细胞沉淀中除去杂质可以通过过滤、吸收(例如,木炭或固态吸收)、渗析和通过凝聚或使用各种化学品诱导的相分离来完成。在其他实施方案中,相分离可以通过添加cosmotrope和/或用于从溶液中沉淀出蛋白质的化合物来化学诱导。
在一些实施方案中,杂质使用过滤、微滤、渗滤和/或超滤(例如,以去离子水)来除去。适用于微滤的膜可以包括0.1uM至1uM。适用于超滤的膜的非限制性实例包括疏水性膜(例如,PES、PS、乙酸纤维素),其分子量截留在50kDa与800kDa、100kDa与800kDa、200kDa与800kDa、300kDa与800kDa、400kDa与800kDa、500kDa与800kDa、600kDa与800kDa、700kDa与800kDa、100kDa与700kDa、200kDa与700kDa、300kDa与700kDa、400kDa与700kDa、500kDa与700kDa、600kDa与700kDa或500kDa与600kDa之间。在一些实施方案中,超滤得到呈渗余物的在水中的重组蛋白浆料和包含杂质的渗透物。超滤的合适条件(例如,膜、温度、体积置换)可以用本领域已知的方法来确定,以实现渗透密度最大化。在一些实施方案中,超滤提供了密度在1g/mL与30g/mL之间的渗余物。在一些实施方案中,超滤包括浓缩步骤,其得到浓渗余物,然后是渗滤步骤,其除去杂质并且得到在水中的悬浮蛋白浆料。在一些此类实施方案中,浓渗余物的浓缩系数为与起始体积相比的2倍至12倍体积减小。在一些实施方案中,渗滤提供了3倍至10倍的恒定体积替换。
根据实施方案和待除去的杂质类型,除去杂质的方法可能有所不同。从分离的重组蛋白中除去脂质杂质可以通过本领域中已知的方法完成。此类方法的非限制性实例包括吸收到木炭或专门结合脂质的其他吸收介质。从分离的重组蛋白中除去多糖杂质可以通过本领域中已知的方法完成。此类方法的非限制性实例包括用水解多糖的酶进行处理,然后通过超滤来除去产生的小型糖。此类酶的非限制性实例包括葡聚糖酶、裂解酶、甘露聚糖酶和壳多糖酶。
量化
可以对分离的重组蜘蛛丝蛋白进行测量或量化,以评估分离的蛋白的回收率(产率)和纯度。可以使用任何适当的方法来测量或量化分离的全长重组蛋白和重组蛋白片段的量,包括但不限于尺寸排阻色谱法(SEC)、酶联免疫吸附测定(ELISA)、SDS-ELISA、蛋白质印迹(免疫印迹)、高效液相色谱法(HPLC)、SEC-HPLC、液相色谱-质谱法(LC-MS)或快速蛋白液相色谱法(FPLC)、或本领域已知的任何其他适当的方法、或其任何组合。在一个实施方案中,使用蛋白质印迹测量全长重组蜘蛛丝蛋白和重组蛋白片段的量。在另一实施方案中,使用酶联免疫吸附测定(ELISA)测量全长重组蜘蛛丝蛋白和重组蛋白片段的量。在另一实施方案中,使用尺寸排阻色谱法(SEC)测量全长重组蜘蛛丝蛋白和重组蛋白片段的量。
在一些实施方案中,分离的重组蜘蛛丝蛋白是至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.9%或至少100%全长重组蜘蛛丝蛋白,如通过适当的方法所测量。
在一些实施方案中,分离的重组蜘蛛丝蛋白的纯度是5-10%、10-15%、15-20%、20-25%、25-30%、30-35%、35-40%、45-50%、50-55%、55-60%、60-65%、65-70%、70-75%、75-80%、80-85%、85-90%、90-95%或95-100%。在一些实施方案中,分离的重组蜘蛛丝蛋白的纯度是至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.9%或少100%。
在一些实施方案中,与起始不溶性材料相比,分离的重组蜘蛛丝蛋白的纯度增加。例如,在起始不溶性材料是不溶性或溶解性差的分离的重组蜘蛛丝蛋白或丝粉末的情况下,分离的重组蜘蛛丝蛋白的纯度可以通过本文所述的溶解和分离方法来增加。在一些实施方案中,与起始材料的纯度相比,分离的重组蜘蛛丝蛋白的纯度增加1-5%、5-10%、10-15%、15-20%、20-25%、25-30%、30-35%、35-40%、45-50%、50-55%、55-60%、60-65%、65-70%、70-75%、75-80%、80-85%、85-90%、90-95%或95-100%。在一些实施方案中,与起始材料的纯度相比,分离的重组蜘蛛丝蛋白的纯度增加至少1%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少100%。在一些实施方案中,不溶性材料的纯度是0-99%、1-5%、5-10%、10-15%、15-20%、20-25%、25-30%、30-35%、35-40%、45-50%、50-55%、55-60%、60-65%、65-70%、70-75%、75-80%、80-85%、85-90%、90-95%或95-99.9%。在一些实施方案中,不溶性材料的纯度是至少1%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%、至少99.5%或至少99.9%。
在一些实施方案中,分离的重组蜘蛛丝蛋白包含至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%全长重组蜘蛛丝蛋白。
重组蜘蛛丝组合物
以引用的方式并入本文的美国专利9,963,554“Methods and Compositions forSynthesizing Improved Silk Fibers”公开了合成嵌段共聚物的组合物、用于其生产的重组微生物以及包含这些蛋白质的合成纤维。以引用的方式并入本文的2019年4月4日公布的美国专利公布2019/0100740“Modified Strains for the Production of RecombinantSilk”公开了工程化巴斯德毕赤酵母(Pichia pastoris)细胞,其被选择或遗传工程化成减少酵母细胞所表达的重组蛋白的降解,以及培养酵母细胞以用于生产可用的化合物的方法。本领域的技术人员还可以在大肠杆菌中产生合成嵌段共聚物和包含这些蛋白质的合成纤维。
已鉴定若干种类型的天然蜘蛛丝。据信,每种天然纺丝类型的力学性质与所述丝的分子组成紧密相关。参见例如,Garb,J.E.等人,Untangling spider silk evolutionwith spidroin terminal domains,BMC Evol.Biol.,10:243(2010);Bittencourt,D.等人,Protein families,natural history and biotechnological aspects of spidersilk,Genet.Mol.Res.,11:3(2012);Rising,A.等人,Spider silk proteins:recentadvances in recombinant production,structure-function relationships andbiomedical applications,Cell.Mol.Life Sci.,68:2,第169-184页(2011);以及Humenik,M.等人,Spider silk:understanding the structure-function relationshipof a natural fiber,Prog.Mol.Biol.Transl.Sci.,103,第131-85页(2011)。例如:
葡萄状腺(AcSp)丝倾向于具有高韧性,这是适当高强度与适当高延展性结合的结果。AcSp丝的特征在于大嵌段(“整体重复”)尺寸,其常常掺有聚丝氨酸和GPX的基序。管状腺(TuSp或圆柱形)丝倾向于具有大直径,具有适度强度和高延展性。TuSp丝之特征在于其聚丝氨酸和聚苏氨酸含量,以及聚丙氨酸短束。大壶状腺(MaSp)丝倾向于具有高强度和适度延展性。MaSp丝可为两个亚型之一:MaSp1和MaSp2。MaSp1丝的延展性通常小于MaSp2丝,且特征在于聚丙氨酸、GX和GGX基序。MaSp2丝的特征在于聚丙氨酸、GGX和GPX基序。小壶状腺(MiSp)丝倾向于具有适度强度和适度延展性。MiSp丝的特征在于GGX、GA和poly A基序,且常常含有约100个氨基酸的间隔元件。鞭毛腺(Flag)丝倾向于具有极高延展性和适度强度。Flag丝的特征通常在于GPG、GGX和短间隔基序。
每种丝类型的性质可因物种不同而不同,且具有不同生活方式(例如,定居纺足目(sedentary web spinner)对比漫游猎蛛(vagabond hunter))或进化上更古老的蜘蛛可产生性质与前文描述不同的丝(关于蜘蛛多样性和分类的描述,参见Hormiga,G.和Griswold,C.E.,Systematics,phylogeny,and evolution of orb-weaving spiders,Annu.Rev.Entomol.59,第487-512页(2014);以及Blackedge,T.A.等人,Reconstructingweb evolution and spider diversification in the molecular era,Proc.Natl.Acad.Sci.U.S.A.,106:13,第5229-5234页(2009))。然而,与天然丝蛋白的重复结构域具有序列相似性和/或氨基酸组成相似性的合成嵌段共聚物多肽,可以用于按商业规模制造重现对应天然丝纤维的特性的一致性丝状纤维。
在一些实施方案中,重组蜘蛛丝是高度结晶的丝蛋白、高β折叠含量丝蛋白或低溶解度丝蛋白。在一些实施方案中,重组蜘蛛丝蛋白在非离液溶剂中的溶解度阈值低于95%、90%、85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、10%或5%。在一些实施方案中,溶解度阈值是离心后可溶于非离液溶剂的蛋白质的量。
丝核苷酸和肽序列
可以通过在GenBank中搜索相关术语,例如“蛛丝蛋白(spidroi n)”、“丝心蛋白(fibroin)”、“MaSp”来汇编假定丝序列的列表,且可以将那些序列与通过独立测序工作获得的额外序列汇集在一起。然后将序列翻译成氨基酸,过滤重复条目,且手动拆分成各结构域(NTD、REP、CTD)。在一些实施方案中,候选氨基酸序列被反向翻译成被优化以用于在巴斯德毕赤(Komagataella)酵母中表达的DNA序列。将DNA序列各自克隆到表达载体中,且将其转化到巴斯德毕赤酵母中。在一些实施方案中,随后以组合方式组装显示出成功表达和分泌的各种丝结构域,以构筑能够形成纤维的丝分子。
丝多肽特征性地由侧接于非重复区域(例如,C末端结构域和N末端结构域)的重复结构域(REP)组成。重复结构域表现出层次架构。重复结构域包含一系列嵌段(也称为重复单元)。嵌段在整个丝重复结构域中为重复的,有时完美重复,有时不完美重复(构成一个准重复结构域)。嵌段的长度和组成在不同丝类型之间以及在不同物种中有所不同。表1列出了来自所选物种和丝类型的嵌段序列的实例,以下文献中给出其他实例:Rising,A.等人,Spider silk proteins:recent advances in recombinant production,structure-function relationships and biomedical applications,Cell Mol.Life Sci.,68:2,第169-184页(2011),以及Gatesy,J.等人,Extreme diversity,conservation,and convergence of spider silk fibroin sequences,Science,291:5513,第2603-2605页(2001)。在一些情况下,嵌段可以按规则模式排列,形成在丝序列的重复结构域中出现多次(通常2至8次)的较大宏观重复体(macro-repeat)。重复结构域或宏观重复体内的重复嵌段,以及重复结构域内的重复宏观重复体,可以由间隔元件分开。嵌段序列可以包含富含甘氨酸的区域,随后为polyA区域。短(约1至10个)氨基酸基序可以在嵌段内多次出现。通常观察到的基序的子集描绘于图1。可以在不参考环状排列的情况下选择来自不同天然丝多肽的嵌段(即,丝多肽之间在其他方面相似的鉴定嵌段可能因环状排列而不能对齐)。因此,例如,出于本文所述的方法和组合物的目的,“嵌段”SGAGG(SEQ ID NO:39)与GSGAG(SEQ IDNO:40)相同,且与GGSGA(SEQ ID NO:41)相同;其全部彼此都为环状排列。针对给定丝序列选择的特定排列可能尤其由方便性(通常以G开始)决定。从NCBI数据库获得的丝序列可以划分为嵌段和非重复区域。
表1:嵌段序列的样品
根据某些实施方案,来自嵌段和/或宏观重复结构域的纤维形成嵌段共聚物多肽描述于国际公开号WO/2015/042164(以引用的方式并入)中。按照结构域(N末端结构域、重复结构域和C末端结构域)对自蛋白质数据库(例如GenBank)或透过从头测序获得的天然丝序列进行分解。出于合成和组装成纤维的目的而选择的N末端结构域和C末端结构域序列包括天然氨基酸序列信息和本文所述的其他修饰。重复结构域被分解成重复序列,所述重复序列含有代表性嵌段,所述嵌段根据丝的类型,通常为1至8个,所述嵌段捕获关键性氨基酸信息,同时将编码氨基酸的DNA的尺寸减小成容易合成的片段。在一些实施方案中,适当形成的嵌段共聚物多肽包含至少一个含有至少1个重复序列的重复结构域,且视情况侧接N末端结构域和/或C末端结构域。
在一些实施方案中,重复结构域包含至少一个重复序列。在一些实施方案中,重复序列为150至300个氨基酸残基。在一些实施方案中,重复序列包含多个嵌段。在一些实施方案中,重复序列包含多个宏观重复体。在一些实施方案中,嵌段或宏观重复体被分割成多个重复序列。
在一些实施方案中,重复序列以甘氨酸开始,且不能以苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W)、半胱氨酸(C)、组氨酸(H)、天冬酰胺(N)、甲硫氨酸(M)或天冬氨酸(D)结束,以满足DNA组装要求。在一些实施方案中,一些重复序列与天然序列相比可以改变。在一些实施方案中,可例如通过向多肽的C末端添加丝氨酸(以避免终止于F、Y、W、C、H、N、M或D)来改变重复序列。在一些实施方案中,可通过在不完全嵌段中填充自另一个嵌段的同源序列来修饰重复序列。在一些实施方案中,可通过重排嵌段或宏观重复体的顺序来修饰重复序列。
在一些实施方案中,可以选择非重复性N末端结构域和C末端结构域用于合成。在一些实施方案中,N末端结构域可以通过去除,例如,如通过SignalP(Peterson,T.N.等人,SignalP 4.0:discriminating signal peptides from transmembrane regions,Nat.Methods,8:10,第785-786页(2011)所鉴定的前导信号序列来获得。
在一些实施方案中,N末端结构域、重复序列或C末端结构域序列可以来自漏斗网蜘蛛(Agelenopsis aperta)、Aliatypus gulosus、哥斯大黎加斑马脚(Aphonopelmaseemanni)、短牙蛛种AS217、短牙蛛种AS220、十字园蛛(Araneus diadematus)、猫脸蜘蛛、大腹圆蛛(Araneus ventricosus)、悦目金蛛(Argiope amoena)、银色金蛛(Argiopeargentata)、横纹金蛛(Argiope bruennichi)、三带金蛛、Atypoides riversi、巴西黄斑粉趾(Avicularia juruensis)、加州陷门蛛(Bothriocyrtum californicum)、食人魔脸蜘蛛、灰色迪格蛛(Diguetia canities)、黑捕鱼蛛、Euagrus chisoseus、苗圃网络蜘蛛、乳突棘旗蛛(Gasteracantha mammosa)、Hypochilus thorelli、Kukulcania hibernalis、黑寡妇蜘蛛、Megahexura fulva、Metepeira grandiosa、金圆网蛛(Nephila antipodiana)、棒络新妇蛛、络新妇蛛、马达加斯加新妇(Nephila madagascariensis)、斑络新妇(Nephilapilipes)、Nephilengys cruentata、帕拉威夏双条纹蛛(Parawixia bistriata)、绿色猞猁蜘蛛(Peucetia viridans)、原始肉食蛛、印度华丽雨林蛛(Poecilotheria regalis)、长爪绿色突光蝴蛛或差异妩蛛。
在一些实施方案中,丝多肽核苷酸编码序列可以与α交配因子核苷酸编码序列操作性地连接。在一些实施方案中,丝多肽核苷酸编码序列可以与另一种内源或异源分泌信号编码序列操作性地连接。在一些实施方案中,丝多肽核苷酸编码序列可以与3X FLAG核苷酸编码序列操作性地连接。在一些实施方案中,丝多肽核苷酸编码序列与其他亲和标记诸如6至8个His残基(SEQ ID NO:42)核苷酸编码序列操作性地连接。
分泌信号
从细胞分泌的蛋白的量在不同蛋白之间有显著不同,并且部分取决于与蛋白在新生状态下可操作地连接的分泌信号。本领域中已知有许多分泌信号,并且一些常用于生产分泌重组蛋白。其中突出的是酿酒酵母(Saccharomyces cerevisiae)的α-交配因子(αMF)的分泌信号,它由N端19个氨基酸的信号肽(在本文还称为pre-αMF(sc))和70个氨基酸的前导肽(在本文还称为pro-αMF(sc))组成。已证明,将pro-αMF(sc)纳入到酿酒酵母的αMF的分泌信号中(在本文中还称为pre-αMF(sc)/pro-αMF(sc))对于实现蛋白的高分泌产率至关重要。将pro-αMF(sc)或其功能变体添加到除pre-αMF(sc)以外的信号肽中也用作实现重组蛋白分泌的手段,但显示出不同程度的有效性,增加了某些重组宿主细胞中某些重组蛋白的分泌,但对于其他重组蛋白没有影响或减少了分泌。
如美国申请15/724,196中所述,使用多种不同的分泌信号可以改善重组蛋白的分泌产率。与包括多个编码可操作地连接至仅一个分泌信号(例如,pre-αMF(sc)/pro-αMF(sc))的重组蛋白的多核苷酸序列的重组宿主细胞相比,包括相同数目的编码可操作地连接至至少2种不同的分泌信号的重组蛋白的多核苷酸序列的重组宿主细胞产生较高分泌产率的重组蛋白。不受理论的束缚,使用至少2种不同的分泌信号可以使重组宿主细胞参与不同的细胞分泌途径,以实现重组蛋白的有效分泌,并因此防止任何一个分泌途径的过度饱和。
不同的分泌信号中的至少一者包括可选自表2或表3的信号肽或者是与选自表2或表3的信号肽具有至少80%氨基酸序列同一性的功能变体。在一些实施方案中,功能变体是选自表2或表3的包括一个或两个取代氨基酸的信号肽。在一些此类实施方案中,功能变体与选自表2或表3的信号肽具有至少85%、至少90%、至少95%或至少99%氨基酸序列同一性。在一些实施方案中,信号肽介导新生重组蛋白在翻译后易位至ER中(即,蛋白合成先于异位,使得新生重组蛋白在易位至ER中之前就存在于胞质溶胶中)。在其他实施方案中,信号肽介导新生重组蛋白以共同翻译的方式易位至ER中(即,蛋白合成和易位至ER中同时发生)。使用介导共翻译易位至ER中的信号肽的优势在于,可以防止容易快速折叠的重组蛋白呈现阻碍易位至ER中并因此阻碍分泌的构象。
表2-分泌信号
表3-重组分泌信号
表达载体
鉴于本领域已知的技术,本文所述的表达载体可以按照本说明书的教导来生产。序列,例如载体序列或编码转基因的序列,可商购自诸如Integrated DNA Technologies,Coralville,IA或DNA 2.0,Menlo Park,CA的公司。本文所举例说明的是指导嵌合丝多肽高水平表达的表达载体。
本文所述的多核苷酸的另一标准来源是从生物体(例如,细菌)、细胞或选定组织中分离出来的多核苷酸。来自选定来源的核酸可以通过标准程序进行分离,其通常包括连续苯酚和苯酚/氯仿提取,然后进行乙醇沉淀。沉淀后,多核苷酸可以用将核酸分子切割成片段的限制性核酸内切酶处理。选定大小的片段可以通过许多技术进行分离,包括琼脂糖或聚丙烯酰胺凝胶电泳或脉冲场凝胶电泳(Care等人(1984)Nuc.Acid Res.12:5647-5664;Chu等人(1986)Science 234:1582;Smith等人(1987)Methods in Enzymology 151:461),以为克隆提供适当大小的起始材料。
获得表达载体或构建体的核苷酸组分的另一方法是PCR。PCR的一般程序教导于MacPherson等人,PCR:A PRACTICAL APPROACH,(IRL Press,Oxford University Press,(1991))。每个应用反应的PCR条件可以凭经验确定。许多参数影响反应的成功。在这些参数中有退火温度和时间、延伸时间、Mg2+和ATP浓度、pH值以及引物、模板和脱氧核糖核苷酸的相对浓度。示例性引物描述于以下实施例中。扩增后,所得片段可通过琼脂糖凝胶电泳检测,然后用溴化乙锭染色和紫外线照射进行可视化。
用于获得多核苷酸的另一方法是通过酶消化。例如,核苷酸序列可以通过用合适的识别限制性酶消化适当的载体来产生。限制性裂解的片段可以通过使用标准技术,在四种脱氧核苷酸三磷酸(dNTP)的存在下,用大肠杆菌DNA聚合酶I(Klenow)的大片段进行处理来钝末端化。
使用本领域众所周知的方法,将多核苷酸插入到合适的主链中,例如质粒。例如,在合适的条件下,插入序列和载体DNA可以与限制性酶接触,以在每个分子上产生互补或平末端,这些末端可以彼此配对并与连接酶连接。替代地,可以将合成核酸接头连接到多核苷酸的末端。这些合成接头可以包含与载体DNA中特定限制性位点对应的核酸序列。其他手段在本领域中是已知的且可用的。组分多核苷酸可以使用多种来源。
在一些实施方案中,将含有R、N或C序列的表达载体转化到宿主生物体中以进行表达和/或分泌。在一些实施方案中,表达载体包括分泌信号。在一些实施方案中,表达载体包括终止信号。在一些实施方案中,表达载体被设计成整合到宿主细胞基因组中,并包括:与靶基因组同源的区域、启动子、分泌信号、标签(例如,Flag标签)、终止/polyA信号、毕赤酵母的可选择标记、大肠杆菌的可选择标记、大肠杆菌的复制起点以及释放感兴趣的片段的限制位点。
本发明的载体可还包括靶向序列,其引导蜘蛛丝蛋白编码序列整合至宿主细胞基因组的特定位置。此类靶向序列的非限制性实例包括与宿主细胞基因组中存在的核苷酸序列相同的核苷酸序列。在一些实施方案中,靶向序列与宿主细胞基因组中的重复元件相同。在一些实施方案中,靶向序列与宿主细胞基因组中的转座元件相同。
在一些实施方案中,本文提供了重组宿主细胞,其包含本文所述的载体。在一些实施方案中,载体被稳定整合在重组宿主细胞基因组(例如,染色体)内,例如通过同源重组或靶向整合进行。基因组整合的合适位点的非限制性实例包括酿酒酵母基因组中的Ty1基因座、巴斯德毕赤酵母基因组中的rDNA和HSP82基因座以及拷贝散布在整个重组宿主细胞基因组中的转座元件。在其他实施方案中,载体不是稳定整合在重组宿主细胞基因组内,而是在染色体外。
宿主细胞转化体
提供了用表达蜘蛛丝多肽的核酸分子或载体转化的宿主细胞,以及其后代。这些细胞也可以携带在载体上的核酸序列,这些载体可以但不一定是游离复制载体。在其他实施方案中,核酸已被整合到宿主细胞的基因组中。
在一些实施方案中,实现大规模生产嵌段共聚物多肽的微生物或宿主细胞包括以下的组合:1)生产大(>50kDa)多肽的能力,2)对大规模污染物(诸如病毒和细菌污染)的抗性,以及3)现有的用于生长和处理生物的技术秘诀是大规模(1-2000m3)生物反应器。
在一些实施方案中,宿主细胞在细胞内表达重组蜘蛛丝蛋白,并且所述蛋白质留在宿主细胞中。在一些实施方案中,宿主细胞在细胞内表达重组蜘蛛丝蛋白,并且所述蛋白被分泌。
多种宿主生物可以被工程化/转化成包含嵌段共聚物多肽表达系统。表达重组丝多肽的生物体包括植物、藻类、酵母、真菌、革兰氏阳性和革兰氏阴性细菌。在一些实施方案中,宿主生物是解腺嘌呤阿氏酵母(Arxula adeninivorans)、棘孢曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillus awamori)、无花果曲霉(Aspergillus ficuum)、烟曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillusoryzae)、酱油曲霉(Aspergillus sojae)、塔宾曲霉(Aspergillus tubigensis)、嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)、炭疽杆菌(Bacillus anthracis)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacilluscirculans)、凝结芽孢杆菌(Bacillus coagulans)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacilluslentus)、地衣芽孢杆菌(Bacillus licheniformis)、甲醇芽孢杆菌(Bacillus methanolicus)、嗜热芽胞杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、苏云金芽孢杆菌(Bacillus thuringiensis)、博伊丁假丝酵母(Candida boidinii)、拉克淖金孢子菌(Chrysosporiumlucknowense)、大肠杆菌、禾谷镰孢菌(Fusarium graminearum)、金黃色镰孢菌(Fusarium venenatum)、乳酸克鲁维酵母(Kluyveromyces lactis)、马克斯克鲁维酵母(Kluyveromyces marxianus)、嗜热毁丝霉(Myceliopthora thermophila)、粗壮脉纹孢菌(Neurospora crassa)、Ogataeapolymorpha、卡门培尔青霉(Penicillium camemberti)、变灰青霉(Penicilliumcanescens)、产黄青霉(Penicillium chrysogenum)、埃默森青霉(Penicilliumemersonii)、绳状青霉(Penicillium funiculosum)、灰玫瑰青霉(Penicilliumgriseoroseum)、产紫青霉(Penicillium purpurogenum)、娄地青霉(Penicilliumroqueforti)、黄孢原毛平革菌(Phanerochaete chrysosporium)、安格斯毕赤酵母(Pichiaangusta)、甲醇毕赤酵母(Pichia methanolica)、巴斯德毕赤酵母(Pichia(Komagataella)pastoris)、多形毕赤酵母(Pichia polymorpha)、树干毕赤酵母(Pichia stipitis)、米黑根毛霉(Rhizomucor miehei)、微小根毛霉(Rhizomucor pusillus)、少根根霉(Rhizopusarrhizus)、变铅青链霉菌(Streptomyces lividans)、酿酒酵母、许旺酵母(Schwanniomyces occidentalis)、哈茨木霉(Trichoderma harzianum)、里氏木霉(Trichoderma reesei)或解脂耶氏酵母(Yarrowia lipolytica)。
可用作重组宿主细胞的其他菌株是本领域中已知的。应当理解,术语“重组宿主细胞”旨在不仅指代特定受试者细胞,还指代这种细胞的子代。因为在后代中,由于突变或环境影响,可能发生某些修饰,此类子代能实际上不与母体细胞相同,但仍包括在如本文所用的术语“重组宿主细胞”的范围内。
工程化宿主细胞系
用于重组蛋白生产的广泛使用的微生物是大肠杆菌。然而,在大肠杆菌菌株的培养期间,重组表达的蛋白可能是不溶性的,导致分离不佳和重组蛋白的产率下降。另一广泛使用的微生物是甲基营养型酵母巴斯德毕赤酵母。巴斯德毕赤酵母生长至高细胞密度,提供严格控制的甲醇诱导型反式基因表达并且在限定的培养基中有效地分泌异源蛋白。然而,在巴斯德毕赤酵母菌株的培养期间,重组表达的蛋白可能在可以收集之前被降解,得到包括重组表达的蛋白的片段的蛋白混合物并且导致全长重组蛋白的产率下降。
在一些实施方案中,本文所述的蛋白酶活性降低的修饰菌株重组表达丝状多肽序列。在一些实施方案中,丝状多肽序列为1)通过混合和匹配来源于丝多肽序列的重复结构域所得到的嵌段共聚物多肽组合物,和/或2)大小足够大(约40kDa)以通过从工业可放大微生物分泌来形成有用的纤维的嵌段共聚物多肽的重组表达。由丝重复结构域片段工程化的大(约40kDa至约100kDa)嵌段共聚物多肽(包括来自蜘蛛丝多肽的几乎所有公开的氨基酸序列的序列)可在本文所述的修饰微生物中表达。在一些实施方案中,丝多肽序列被匹配且设计来生产能够形成纤维的高度表达且分泌的多肽。在一些实施方案中,敲除蛋白酶基因或降低宿主修饰菌株中的蛋白酶活性减少丝状多肽的降解。
在一些实施方案中,为了减弱巴斯德毕赤酵母中的蛋白酶活性,使编码这些酶的基因失活或突变以减少或消除活性。这可以通过突变或插入基因本身或通过修饰基因调控元件来进行。这可以通过标准酵母遗传学技术来实现。此类技术的实例包括通过双重同源重组进行基因置换,在基因置换中,将待失活的基因侧翼的同源区域克隆在可选择标记基因(诸如抗生素抗性基因或补充酵母菌株的营养缺陷的基因)侧翼的载体中。
替代地,同源区域可通过重叠PCR进行PCR扩增并连接至可选择标记基因。随后,通过本领域已知的方法,例如电穿孔,将此类DNA片段转化到巴斯德毕赤酵母中。然后转化体在选择性条件下生长,通过标准技术,例如基因组DNA的PCR或Southern印迹,分析其基因破坏事件。在替代实验中,基因失活可以通过单一同源重组来实现,在这种情况下,例如,将基因ORF的5'端克隆在同样含有可选择标记基因的无启动子载体上。通过用仅切割靶基因同源片段中的载体的限制性酶进行消化来将这种载体线性化之后,将这种载体转化到巴斯德毕赤酵母中。通过基因组DNA的PCR或Southern印迹确认靶基因位点处的整合。以这种方式,在基因组中实现了克隆在载体上的基因片段的复制,得到靶基因基因座的两种拷贝:第一拷贝,在其中ORF是不完整的,因此得到缩短、失活的蛋白的表达(如果有的话);以及第二拷贝,其没有驱动转录的启动子。
替代地,使用转座子诱变来使靶基因失活。可以通过PCR筛选此类突变体文库的在靶基因中的插入事件。
工程化/敲除菌株的功能表型(即,缺陷)可以使用本领域已知的技术来评估。例如,工程化菌株在蛋白酶活性方面的缺陷可以使用本领域已知的各种方法中的任一种来确定,诸如显色蛋白酶底物的水解活性的测定、所选蛋白酶的底物蛋白的带移等。
本文所述的蛋白酶活性的减弱可以通过除敲除突变以外的机制来实现。例如,可以经由通过改变核酸序列、将基因置于活性较低的启动子的控制下、下调、表达干扰RNA、核糖酶或靶向感兴趣的基因的反义序列或者通过本领域已知的任何其他技术改变氨基酸序列来减弱期望的蛋白酶。在优选的菌株中,通过上文所述的任何方法减弱在PAS_chr4_0584(YPS1-1)和PAS_chr3_1157(YPS1-2)处编码的蛋白酶的蛋白酶活性。在一些方面中,描述了甲基营养型酵母菌株,特别是巴斯德毕赤酵母菌株,其中YPS1-1和YPS1-2基因已经失活。在一些实施方案中,还可以根据本文所提供的方法将其他蛋白酶编码基因敲除,以进一步降低菌株所表达的期望的蛋白产物的蛋白酶活性。
在一些实施方案中,本文所公开的巴斯德毕赤酵母菌株被修饰成表达丝状多肽。制造丝状多肽的优选实施方案的方法提供在WO2015/042164中,特别是第114-134段,其以引用的方式并入本文。其中公开了基于源自诸如来自物种横纹金蛛的MaSp2的重组蛛丝蛋白片段序列的合成蛋白质性共聚物。描述了丝状多肽,其包括二至二十个重复单元,其中每个重复单元的分子量大于约20kDa。在共聚物的每个重复单元内有超过约60个被组织成许多“准重复单元”的氨基酸残基。在一些实施方案中,本公开中描述的多肽的重复单元与MaSp2拖丝蛋白序列具有至少95%序列同一性。
实施例
以下是实行本文所述的本发明方法的具体实施方案的实施例。实施例仅出于说明性目的而提供,并且不旨在以任何方式限制本公开的范围。已努力确保所使用的数字(例如,量、温度等)的准确性,但当然应允许一些实验误差和偏差。
除非另外指明,否则本文所述的方法的实践将采用本领域技术内的蛋白质化学、生物化学、重组DNA技术和药理学的常规方法。此类技术在文献中进行了充分的解释。参见例如T.E.Creighton,Proteins:Structures and Molecular Properties(W.H.Freemanand Company,1993);A.L.Lehninger,Biochemistry(Worth Publishers,Inc.,现行版);Sambrook等人,Molecular Cloning:A Laboratory Manual(第2版,1989);Methods InEnzymology(S.Colowick和N.Kaplan编,Academic Press,Inc.);Remington'sPharmaceutical Sciences,第18版(Easton,Pennsylvania:Mack Publishing Company,1990);Carey和Sundberg Advanced Organic Chemistry第3版(Plenum Press)A卷和B卷(1992)。
实施例1:微流体化增加重组丝蛋白的溶解度
使用高物理能来在各种水性溶剂条件下使来自不溶性细胞材料的团聚(agglomeration)的模型丝蛋白溶解。
模型丝UD MiSp 64kDa是重组表达的64kD蛋白质,其来源于连结至N末端组氨酸六聚物(SEQ ID NO:43)的差异妩蛛次壶状腺蛛丝蛋白基因序列(GenBank:DQ399332.1,SEQID NO:23)。使用以编码MiSp蛋白的T7表达载体转化的大肠杆菌C41(DE3)(Lucigen)表达所述蛋白。使细胞在基本培养基中生长,用异丙基β-D-1-硫代吡喃半乳糖苷(IPTG)诱导MiSp基因表达,并通过匀化进行裂解。通过离心使不溶性细胞裂解物材料沉淀。将(质量)比率10:1的4M尿素溶液与不溶性团块混合1h,并且通过离心回收不溶性级分。所使用的匀化设备产生约0.7×106s-1的剪切速率。然而,已知这种UD MiSp 64kD模型丝是高度不溶的,并且匀化器产生的剪切速率不足以使UD MiSp 64kDa丝溶解。
将含有不溶性丝蛋白的细胞生物质和沉淀以比率15%重量/体积(细胞沉淀质量比溶液体积)重新悬浮在水性缓冲液(50mM Tris,pH 7.5)和选定的含有离散剂的溶液中。假设沉淀密度为1g/l,离散剂的最终浓度为10M尿素、4M GdnHCl、8M GdnHCl、3M GdnSCN或6M GdnSCN。通过在室温下搅拌至少1h以破坏材料的大块团簇来将溶液混合。100mL等分试样以3次通过在30,000psi(表压)下操作的F12Y相互作用室(M-110P,Microfluidics Inc.)进行处理。在处理步骤期间使用水浴来限制样品加热。作为对照,将单独的一组100mL等分试样在室温下搅拌3h,而不用微流体化器处理。
通过在室温下以15,000x g将50mL等分试样离心20min来测定丝蛋白的溶解度,并且分离上清液和细胞沉淀。可溶性丝蛋白被确定为离心后留在上清液中的丝蛋白。通过用50mL在水中的5MGdnSCN提取沉淀来测定细胞沉淀中剩余的不溶性丝。通过ELISA用抗His6抗体(“His6”公开为SEQ ID NO:43)评估两种级分中丝的浓度,并且结果显示在表1中。
表1:在水性缓冲液和选定的离散剂溶液中高能处理后模型丝溶解度的增加。通过ELISA确定两种级分中丝的浓度。
对于所评估的所有条件,微流体化均使可溶性级分中丝的量增加。值得注意的实施例是10M尿素和4M GdnHCl条件,在这两个条件下,对照中可溶的丝(在4M GdnHCl中为6%,或在10M尿素中为0%)是可忽略不计的,但在微流体化处理后,大于75%是可溶的。此外,3M和6M GdnSCN缓冲液在微流体化后均产生100%溶解的丝蛋白,而以相同离液浓度的对照处理没有使丝完全溶解。因此,使用微流体化时丝蛋白溶解所需的离散剂浓度降低。
还通过尺寸排阻色谱法(SEC)证实了可溶性级分中丝蛋白的存在。使用SEC HPLC比较用10M尿素和微流体化(高能线)提取的蛋白质样品与单独10M尿素(对照线)相比的可溶性级分(图2)。模型丝蛋白的洗脱时间(MiSp峰)用纯化的蛋白标准品确定(数据未显示)。用变性流动相(5M GdnSCN)运行柱,并且用折射率检测器检测洗脱液。与单独尿素相比,施加微流体化剪切力导致丝蛋白的溶解和回收率显著增加。通过计算一些样品的SEC峰%折射率曲线(RU)面积来评估溶解丝蛋白的纯度。所选样品的纯度显示在表2中。
实施例2:剪切速率压力优化
接下来,改变微流体化的相互作用室大小和压力以评估丝溶解。
如实施例1所述制备含有丝蛋白的不溶性细胞生物质,并将其悬浮在尿素中至最终浓度为10M尿素。将样品在两个不同的剪切速率下处理,通过如制造商(MicrofluidicsProcessor User Guide,Microfluidics,Inc)所述的相互作用室类型和操作压力进行控制。具体地,目标为预测剪切速率6.5×106s-1(G10Z相互作用室,23,000psi,icrofluidicsInc.LM10)或9.5×106s-1(F12Y相互作用室,30,000psi,Microfluidics Inc.M-110P)。通过实施例1中所述的离心方案测定丝蛋白的溶解。如前所述,通过SEC HPLC评估可溶性或不溶性级分中丝的浓度:通过SEC折射率峰的面积对丝蛋白进行测量,使用牛血清白蛋白标准品以便计算丝浓度。
表3显示两次处理后丝的溶解。与以较低速率6.5×106s-1处理的样品相比,剪切速率增加至9.5×106s-1使溶解的丝蛋白的产率增加了40%(使用23,000psi的产率为47%,相比之下使用30,000psi的产率为66%)。因此,较高的剪切速率导致丝蛋白溶解和回收率增加。
表3:用10M尿素溶解丝蛋白时改变剪切速率的效果。从SEC HPLC峰面积估计丝浓度。产率是回收的丝蛋白量,归一化为起始材料中丝蛋白的总量。通过与5M GdnSCN一起温育来提取起始材料中丝蛋白的总量。
虽然已经参考优选实施方案和各种替代实施方案具体地显示和描述了本发明,但是相关领域的技术人员应理解,在不脱离本发明的精神和范围的情况下,可以在形式和细节上在其中进行各种改变。
出于所有目的,在本说明书的正文中引用的所有参考文献、授权专利和专利申请均以引用的方式整体并入本文。
序列表
<110> 保尔特纺织品公司(BOLT THREADS, INC.)
<120> 通过高剪切溶解来分离蜘蛛丝蛋白的方法
<130> BTT-033WO
<140>
<141>
<150> 62/901,053
<151> 2019-09-16
<160> 43
<170> PatentIn version 3.5
<210> 1
<211> 181
<212> PRT
<213> Aliatypus gulosus
<400> 1
Gly Ala Ala Ser Ser Ser Ser Thr Ile Ile Thr Thr Lys Ser Ala Ser
1 5 10 15
Ala Ser Ala Ala Ala Asp Ala Ser Ala Ala Ala Thr Ala Ser Ala Ala
20 25 30
Ser Arg Ser Ser Ala Asn Ala Ala Ala Ser Ala Phe Ala Gln Ser Phe
35 40 45
Ser Ser Ile Leu Leu Glu Ser Gly Tyr Phe Cys Ser Ile Phe Gly Ser
50 55 60
Ser Ile Ser Ser Ser Tyr Ala Ala Ala Ile Ala Ser Ala Ala Ser Arg
65 70 75 80
Ala Ala Ala Glu Ser Asn Gly Tyr Thr Thr His Ala Tyr Ala Cys Ala
85 90 95
Lys Ala Val Ala Ser Ala Val Glu Arg Val Thr Ser Gly Ala Asp Ala
100 105 110
Tyr Ala Tyr Ala Gln Ala Ile Ser Asp Ala Leu Ser His Ala Leu Leu
115 120 125
Tyr Thr Gly Arg Leu Asn Thr Ala Asn Ala Asn Ser Leu Ala Ser Ala
130 135 140
Phe Ala Tyr Ala Phe Ala Asn Ala Ala Ala Gln Ala Ser Ala Ser Ser
145 150 155 160
Ala Ser Ala Gly Ala Ala Ser Ala Ser Gly Ala Ala Ser Ala Ser Gly
165 170 175
Ala Gly Ser Ala Ser
180
<210> 2
<211> 126
<212> PRT
<213> 原始肉食蛛(Plectreurys tristis)
<400> 2
Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala
1 5 10 15
Gly Ser Gly Ala Ser Thr Ser Val Ser Thr Ser Ser Ser Ser Gly Ser
20 25 30
Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala Gly Ser Gly Ala Gly Ala
35 40 45
Gly Ser Gly Ala Gly Ala Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly
50 55 60
Phe Gly Ser Gly Leu Gly Leu Gly Tyr Gly Val Gly Leu Ser Ser Ala
65 70 75 80
Gln Ala Gln Ala Gln Ala Gln Ala Ala Ala Gln Ala Gln Ala Gln Ala
85 90 95
Gln Ala Gln Ala Tyr Ala Ala Ala Gln Ala Gln Ala Gln Ala Gln Ala
100 105 110
Gln Ala Gln Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala
115 120 125
<210> 3
<211> 239
<212> PRT
<213> 原始肉食蛛(Plectreurys tristis)
<400> 3
Gly Ala Ala Gln Lys Gln Pro Ser Gly Glu Ser Ser Val Ala Thr Ala
1 5 10 15
Ser Ala Ala Ala Thr Ser Val Thr Ser Gly Gly Ala Pro Val Gly Lys
20 25 30
Pro Gly Val Pro Ala Pro Ile Phe Tyr Pro Gln Gly Pro Leu Gln Gln
35 40 45
Gly Pro Ala Pro Gly Pro Ser Asn Val Gln Pro Gly Thr Ser Gln Gln
50 55 60
Gly Pro Ile Gly Gly Val Gly Gly Ser Asn Ala Phe Ser Ser Ser Phe
65 70 75 80
Ala Ser Ala Leu Ser Leu Asn Arg Gly Phe Thr Glu Val Ile Ser Ser
85 90 95
Ala Ser Ala Thr Ala Val Ala Ser Ala Phe Gln Lys Gly Leu Ala Pro
100 105 110
Tyr Gly Thr Ala Phe Ala Leu Ser Ala Ala Ser Ala Ala Ala Asp Ala
115 120 125
Tyr Asn Ser Ile Gly Ser Gly Ala Asn Ala Phe Ala Tyr Ala Gln Ala
130 135 140
Phe Ala Arg Val Leu Tyr Pro Leu Val Gln Gln Tyr Gly Leu Ser Ser
145 150 155 160
Ser Ala Lys Ala Ser Ala Phe Ala Ser Ala Ile Ala Ser Ser Phe Ser
165 170 175
Ser Gly Thr Ser Gly Gln Gly Pro Ser Ile Gly Gln Gln Gln Pro Pro
180 185 190
Val Thr Ile Ser Ala Ala Ser Ala Ser Ala Gly Ala Ser Ala Ala Ala
195 200 205
Val Gly Gly Gly Gln Val Gly Gln Gly Pro Tyr Gly Gly Gln Gln Gln
210 215 220
Ser Thr Ala Ala Ser Ala Ser Ala Ala Ala Ala Thr Ala Thr Ser
225 230 235
<210> 4
<211> 182
<212> PRT
<213> 猫脸蜘蛛(Araneus gemmoides)
<400> 4
Gly Asn Val Gly Tyr Gln Leu Gly Leu Lys Val Ala Asn Ser Leu Gly
1 5 10 15
Leu Gly Asn Ala Gln Ala Leu Ala Ser Ser Leu Ser Gln Ala Val Ser
20 25 30
Ala Val Gly Val Gly Ala Ser Ser Asn Ala Tyr Ala Asn Ala Val Ser
35 40 45
Asn Ala Val Gly Gln Val Leu Ala Gly Gln Gly Ile Leu Asn Ala Ala
50 55 60
Asn Ala Gly Ser Leu Ala Ser Ser Phe Ala Ser Ala Leu Ser Ser Ser
65 70 75 80
Ala Ala Ser Val Ala Ser Gln Ser Ala Ser Gln Ser Gln Ala Ala Ser
85 90 95
Gln Ser Gln Ala Ala Ala Ser Ala Phe Arg Gln Ala Ala Ser Gln Ser
100 105 110
Ala Ser Gln Ser Asp Ser Arg Ala Gly Ser Gln Ser Ser Thr Lys Thr
115 120 125
Thr Ser Thr Ser Thr Ser Gly Ser Gln Ala Asp Ser Arg Ser Ala Ser
130 135 140
Ser Ser Ala Ser Gln Ala Ser Ala Ser Ala Phe Ala Gln Gln Ser Ser
145 150 155 160
Ala Ser Leu Ser Ser Ser Ser Ser Phe Ser Ser Ala Phe Ser Ser Ala
165 170 175
Thr Ser Ile Ser Ala Val
180
<210> 5
<211> 180
<212> PRT
<213> 花园蜘蛛(Argiope aurantia)
<400> 5
Gly Ser Leu Ala Ser Ser Phe Ala Ser Ala Leu Ser Ala Ser Ala Ala
1 5 10 15
Ser Val Ala Ser Ser Ala Ala Ala Gln Ala Ala Ser Gln Ser Gln Ala
20 25 30
Ala Ala Ser Ala Phe Ser Arg Ala Ala Ser Gln Ser Ala Ser Gln Ser
35 40 45
Ala Ala Arg Ser Gly Ala Gln Ser Ile Ser Thr Thr Thr Thr Thr Ser
50 55 60
Thr Ala Gly Ser Gln Ala Ala Ser Gln Ser Ala Ser Ser Ala Ala Ser
65 70 75 80
Gln Ala Ser Ala Ser Ser Phe Ala Arg Ala Ser Ser Ala Ser Leu Ala
85 90 95
Ala Ser Ser Ser Phe Ser Ser Ala Phe Ser Ser Ala Asn Ser Leu Ser
100 105 110
Ala Leu Gly Asn Val Gly Tyr Gln Leu Gly Phe Asn Val Ala Asn Asn
115 120 125
Leu Gly Ile Gly Asn Ala Ala Gly Leu Gly Asn Ala Leu Ser Gln Ala
130 135 140
Val Ser Ser Val Gly Val Gly Ala Ser Ser Ser Thr Tyr Ala Asn Ala
145 150 155 160
Val Ser Asn Ala Val Gly Gln Phe Leu Ala Gly Gln Gly Ile Leu Asn
165 170 175
Ala Ala Asn Ala
180
<210> 6
<211> 199
<212> PRT
<213> 巨眼蛛(Deinopis spinosa)
<400> 6
Gly Ala Ser Ala Ser Ala Tyr Ala Ser Ala Ile Ser Asn Ala Val Gly
1 5 10 15
Pro Tyr Leu Tyr Gly Leu Gly Leu Phe Asn Gln Ala Asn Ala Ala Ser
20 25 30
Phe Ala Ser Ser Phe Ala Ser Ala Val Ser Ser Ala Val Ala Ser Ala
35 40 45
Ser Ala Ser Ala Ala Ser Ser Ala Tyr Ala Gln Ser Ala Ala Ala Gln
50 55 60
Ala Gln Ala Ala Ser Ser Ala Phe Ser Gln Ala Ala Ala Gln Ser Ala
65 70 75 80
Ala Ala Ala Ser Ala Gly Ala Ser Ala Gly Ala Gly Ala Ser Ala Gly
85 90 95
Ala Gly Ala Val Ala Gly Ala Gly Ala Val Ala Gly Ala Gly Ala Val
100 105 110
Ala Gly Ala Ser Ala Ala Ala Ala Ser Gln Ala Ala Ala Ser Ser Ser
115 120 125
Ala Ser Ala Val Ala Ser Ala Phe Ala Gln Ser Ala Ser Tyr Ala Leu
130 135 140
Ala Ser Ser Ser Ala Phe Ala Asn Ala Phe Ala Ser Ala Thr Ser Ala
145 150 155 160
Gly Tyr Leu Gly Ser Leu Ala Tyr Gln Leu Gly Leu Thr Thr Ala Tyr
165 170 175
Asn Leu Gly Leu Ser Asn Ala Gln Ala Phe Ala Ser Thr Leu Ser Gln
180 185 190
Ala Val Thr Gly Val Gly Leu
195
<210> 7
<211> 171
<212> PRT
<213> 络新妇蛛(Nephila clavipes)
<400> 7
Gly Ala Thr Ala Ala Ser Tyr Gly Asn Ala Leu Ser Thr Ala Ala Ala
1 5 10 15
Gln Phe Phe Ala Thr Ala Gly Leu Leu Asn Ala Gly Asn Ala Ser Ala
20 25 30
Leu Ala Ser Ser Phe Ala Arg Ala Phe Ser Ala Ser Ala Glu Ser Gln
35 40 45
Ser Phe Ala Gln Ser Gln Ala Phe Gln Gln Ala Ser Ala Phe Gln Gln
50 55 60
Ala Ala Ser Arg Ser Ala Ser Gln Ser Ala Ala Glu Ala Gly Ser Thr
65 70 75 80
Ser Ser Ser Thr Thr Thr Thr Thr Ser Ala Ala Arg Ser Gln Ala Ala
85 90 95
Ser Gln Ser Ala Ser Ser Ser Tyr Ser Ser Ala Phe Ala Gln Ala Ala
100 105 110
Ser Ser Ser Leu Ala Thr Ser Ser Ala Leu Ser Arg Ala Phe Ser Ser
115 120 125
Val Ser Ser Ala Ser Ala Ala Ser Ser Leu Ala Tyr Ser Ile Gly Leu
130 135 140
Ser Ala Ala Arg Ser Leu Gly Ile Ala Asp Ala Ala Gly Leu Ala Gly
145 150 155 160
Val Leu Ala Arg Ala Ala Gly Ala Leu Gly Gln
165 170
<210> 8
<211> 268
<212> PRT
<213> 三带金蛛(Argiope trifasciata)
<400> 8
Gly Gly Ala Pro Gly Gly Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala
1 5 10 15
Gly Phe Gly Pro Gly Gly Gly Ala Gly Phe Gly Pro Gly Gly Gly Ala
20 25 30
Gly Phe Gly Pro Gly Gly Ala Ala Gly Gly Pro Gly Gly Pro Gly Gly
35 40 45
Pro Gly Gly Pro Gly Gly Ala Gly Gly Tyr Gly Pro Gly Gly Ala Gly
50 55 60
Gly Tyr Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly Gly Tyr Gly
65 70 75 80
Pro Gly Gly Ala Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly
85 90 95
Ala Gly Pro Gly Gly Ala Gly Gly Glu Gly Pro Val Thr Val Asp Val
100 105 110
Asp Val Thr Val Gly Pro Glu Gly Val Gly Gly Gly Pro Gly Gly Ala
115 120 125
Gly Pro Gly Gly Ala Gly Phe Gly Pro Gly Gly Gly Ala Gly Phe Gly
130 135 140
Pro Gly Gly Ala Pro Gly Ala Pro Gly Gly Pro Gly Gly Pro Gly Gly
145 150 155 160
Pro Gly Gly Pro Gly Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly
165 170 175
Gly Tyr Gly Pro Gly Gly Ala Gly Gly Val Gly Pro Ala Gly Thr Gly
180 185 190
Gly Phe Gly Pro Gly Gly Ala Gly Gly Phe Gly Pro Gly Gly Ala Gly
195 200 205
Gly Phe Gly Pro Gly Gly Ala Gly Gly Phe Gly Pro Ala Gly Ala Gly
210 215 220
Gly Tyr Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly Gly Phe Gly
225 230 235 240
Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Ala Gly Gly
245 250 255
Glu Gly Pro Val Thr Val Asp Val Asp Val Ser Val
260 265
<210> 9
<211> 420
<212> PRT
<213> 络新妇蛛(Nephila clavipes)
<400> 9
Gly Val Ser Tyr Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly
1 5 10 15
Gly Pro Tyr Gly Pro Gly Gly Glu Gly Pro Gly Gly Ala Gly Gly Pro
20 25 30
Tyr Gly Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr
35 40 45
Gly Pro Gly Gly Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly
50 55 60
Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro
65 70 75 80
Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly
85 90 95
Gly Tyr Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro Gly Gly
100 105 110
Ser Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Thr
115 120 125
Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly
130 135 140
Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly Gly Ser Gly Pro
145 150 155 160
Gly Gly Phe Gly Pro Gly Gly Ser Gly Pro Gly Gly Tyr Gly Pro Gly
165 170 175
Gly Ser Gly Pro Gly Gly Ala Gly Pro Gly Gly Val Gly Pro Gly Gly
180 185 190
Phe Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Ala Pro Gly Gly Ala
195 200 205
Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly
210 215 220
Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Pro Gly Gly Ala Gly Gly
225 230 235 240
Ala Gly Gly Ala Gly Gly Ser Gly Gly Ala Gly Gly Ser Gly Gly Thr
245 250 255
Thr Ile Ile Glu Asp Leu Asp Ile Thr Ile Asp Gly Ala Asp Gly Pro
260 265 270
Ile Thr Ile Ser Glu Glu Leu Pro Ile Ser Gly Ala Gly Gly Ser Gly
275 280 285
Pro Gly Gly Ala Gly Pro Gly Gly Val Gly Pro Gly Gly Ser Gly Pro
290 295 300
Gly Gly Val Gly Pro Gly Gly Ser Gly Pro Gly Gly Val Gly Pro Gly
305 310 315 320
Gly Ser Gly Pro Gly Gly Val Gly Pro Gly Gly Ala Gly Gly Pro Tyr
325 330 335
Gly Pro Gly Gly Ser Gly Pro Gly Gly Ala Gly Gly Ala Gly Gly Pro
340 345 350
Gly Gly Ala Tyr Gly Pro Gly Gly Ser Tyr Gly Pro Gly Gly Ser Gly
355 360 365
Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Glu Gly Pro
370 375 380
Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Ala Gly Gly Pro Tyr
385 390 395 400
Gly Pro Gly Gly Ala Gly Gly Pro Tyr Gly Pro Gly Gly Glu Gly Gly
405 410 415
Pro Tyr Gly Pro
420
<210> 10
<211> 376
<212> PRT
<213> 黑寡妇蜘蛛(Latrodectus hesperus)
<400> 10
Gly Ile Asn Val Asp Ser Asp Ile Gly Ser Val Thr Ser Leu Ile Leu
1 5 10 15
Ser Gly Ser Thr Leu Gln Met Thr Ile Pro Ala Gly Gly Asp Asp Leu
20 25 30
Ser Gly Gly Tyr Pro Gly Gly Phe Pro Ala Gly Ala Gln Pro Ser Gly
35 40 45
Gly Ala Pro Val Asp Phe Gly Gly Pro Ser Ala Gly Gly Asp Val Ala
50 55 60
Ala Lys Leu Ala Arg Ser Leu Ala Ser Thr Leu Ala Ser Ser Gly Val
65 70 75 80
Phe Arg Ala Ala Phe Asn Ser Arg Val Ser Thr Pro Val Ala Val Gln
85 90 95
Leu Thr Asp Ala Leu Val Gln Lys Ile Ala Ser Asn Leu Gly Leu Asp
100 105 110
Tyr Ala Thr Ala Ser Lys Leu Arg Lys Ala Ser Gln Ala Val Ser Lys
115 120 125
Val Arg Met Gly Ser Asp Thr Asn Ala Tyr Ala Leu Ala Ile Ser Ser
130 135 140
Ala Leu Ala Glu Val Leu Ser Ser Ser Gly Lys Val Ala Asp Ala Asn
145 150 155 160
Ile Asn Gln Ile Ala Pro Gln Leu Ala Ser Gly Ile Val Leu Gly Val
165 170 175
Ser Thr Thr Ala Pro Gln Phe Gly Val Asp Leu Ser Ser Ile Asn Val
180 185 190
Asn Leu Asp Ile Ser Asn Val Ala Arg Asn Met Gln Ala Ser Ile Gln
195 200 205
Gly Gly Pro Ala Pro Ile Thr Ala Glu Gly Pro Asp Phe Gly Ala Gly
210 215 220
Tyr Pro Gly Gly Ala Pro Thr Asp Leu Ser Gly Leu Asp Met Gly Ala
225 230 235 240
Pro Ser Asp Gly Ser Arg Gly Gly Asp Ala Thr Ala Lys Leu Leu Gln
245 250 255
Ala Leu Val Pro Ala Leu Leu Lys Ser Asp Val Phe Arg Ala Ile Tyr
260 265 270
Lys Arg Gly Thr Arg Lys Gln Val Val Gln Tyr Val Thr Asn Ser Ala
275 280 285
Leu Gln Gln Ala Ala Ser Ser Leu Gly Leu Asp Ala Ser Thr Ile Ser
290 295 300
Gln Leu Gln Thr Lys Ala Thr Gln Ala Leu Ser Ser Val Ser Ala Asp
305 310 315 320
Ser Asp Ser Thr Ala Tyr Ala Lys Ala Phe Gly Leu Ala Ile Ala Gln
325 330 335
Val Leu Gly Thr Ser Gly Gln Val Asn Asp Ala Asn Val Asn Gln Ile
340 345 350
Gly Ala Lys Leu Ala Thr Gly Ile Leu Arg Gly Ser Ser Ala Val Ala
355 360 365
Pro Arg Leu Gly Ile Asp Leu Ser
370 375
<210> 11
<211> 200
<212> PRT
<213> 三带金蛛(Argiope trifasciata)
<400> 11
Gly Ala Gly Tyr Thr Gly Pro Ser Gly Pro Ser Thr Gly Pro Ser Gly
1 5 10 15
Tyr Pro Gly Pro Leu Gly Gly Gly Ala Pro Phe Gly Gln Ser Gly Phe
20 25 30
Gly Gly Ser Ala Gly Pro Gln Gly Gly Phe Gly Ala Thr Gly Gly Ala
35 40 45
Ser Ala Gly Leu Ile Ser Arg Val Ala Asn Ala Leu Ala Asn Thr Ser
50 55 60
Thr Leu Arg Thr Val Leu Arg Thr Gly Val Ser Gln Gln Ile Ala Ser
65 70 75 80
Ser Val Val Gln Arg Ala Ala Gln Ser Leu Ala Ser Thr Leu Gly Val
85 90 95
Asp Gly Asn Asn Leu Ala Arg Phe Ala Val Gln Ala Val Ser Arg Leu
100 105 110
Pro Ala Gly Ser Asp Thr Ser Ala Tyr Ala Gln Ala Phe Ser Ser Ala
115 120 125
Leu Phe Asn Ala Gly Val Leu Asn Ala Ser Asn Ile Asp Thr Leu Gly
130 135 140
Ser Arg Val Leu Ser Ala Leu Leu Asn Gly Val Ser Ser Ala Ala Gln
145 150 155 160
Gly Leu Gly Ile Asn Val Asp Ser Gly Ser Val Gln Ser Asp Ile Ser
165 170 175
Ser Ser Ser Ser Phe Leu Ser Thr Ser Ser Ser Ser Ala Ser Tyr Ser
180 185 190
Gln Ala Ser Ala Ser Ser Thr Ser
195 200
<210> 12
<211> 357
<212> PRT
<213> 全异妩蛛(Uloborus diversus)
<400> 12
Gly Ala Ser Ala Ala Asp Ile Ala Thr Ala Ile Ala Ala Ser Val Ala
1 5 10 15
Thr Ser Leu Gln Ser Asn Gly Val Leu Thr Ala Ser Asn Val Ser Gln
20 25 30
Leu Ser Asn Gln Leu Ala Ser Tyr Val Ser Ser Gly Leu Ser Ser Thr
35 40 45
Ala Ser Ser Leu Gly Ile Gln Leu Gly Ala Ser Leu Gly Ala Gly Phe
50 55 60
Gly Ala Ser Ala Gly Leu Ser Ala Ser Thr Asp Ile Ser Ser Ser Val
65 70 75 80
Glu Ala Thr Ser Ala Ser Thr Leu Ser Ser Ser Ala Ser Ser Thr Ser
85 90 95
Val Val Ser Ser Ile Asn Ala Gln Leu Val Pro Ala Leu Ala Gln Thr
100 105 110
Ala Val Leu Asn Ala Ala Phe Ser Asn Ile Asn Thr Gln Asn Ala Ile
115 120 125
Arg Ile Ala Glu Leu Leu Thr Gln Gln Val Gly Arg Gln Tyr Gly Leu
130 135 140
Ser Gly Ser Asp Val Ala Thr Ala Ser Ser Gln Ile Arg Ser Ala Leu
145 150 155 160
Tyr Ser Val Gln Gln Gly Ser Ala Ser Ser Ala Tyr Val Ser Ala Ile
165 170 175
Val Gly Pro Leu Ile Thr Ala Leu Ser Ser Arg Gly Val Val Asn Ala
180 185 190
Ser Asn Ser Ser Gln Ile Ala Ser Ser Leu Ala Thr Ala Ile Leu Gln
195 200 205
Phe Thr Ala Asn Val Ala Pro Gln Phe Gly Ile Ser Ile Pro Thr Ser
210 215 220
Ala Val Gln Ser Asp Leu Ser Thr Ile Ser Gln Ser Leu Thr Ala Ile
225 230 235 240
Ser Ser Gln Thr Ser Ser Ser Val Asp Ser Ser Thr Ser Ala Phe Gly
245 250 255
Gly Ile Ser Gly Pro Ser Gly Pro Ser Pro Tyr Gly Pro Gln Pro Ser
260 265 270
Gly Pro Thr Phe Gly Pro Gly Pro Ser Leu Ser Gly Leu Thr Gly Phe
275 280 285
Thr Ala Thr Phe Ala Ser Ser Phe Lys Ser Thr Leu Ala Ser Ser Thr
290 295 300
Gln Phe Gln Leu Ile Ala Gln Ser Asn Leu Asp Val Gln Thr Arg Ser
305 310 315 320
Ser Leu Ile Ser Lys Val Leu Ile Asn Ala Leu Ser Ser Leu Gly Ile
325 330 335
Ser Ala Ser Val Ala Ser Ser Ile Ala Ala Ser Ser Ser Gln Ser Leu
340 345 350
Leu Ser Val Ser Ala
355
<210> 13
<211> 32
<212> PRT
<213> 苗圃网络蜘蛛(Euprosthenops australis)
<400> 13
Gly Gly Gln Gly Gly Gln Gly Gln Gly Arg Tyr Gly Gln Gly Ala Gly
1 5 10 15
Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala
20 25 30
<210> 14
<211> 42
<212> PRT
<213> 长爪绿色突光蝴蛛(Tetragnatha kauaiensis)
<400> 14
Gly Gly Leu Gly Gly Gly Gln Gly Ala Gly Gln Gly Gly Gln Gln Gly
1 5 10 15
Ala Gly Gln Gly Gly Tyr Gly Ser Gly Leu Gly Gly Ala Gly Gln Gly
20 25 30
Ala Ser Ala Ala Ala Ala Ala Ala Ala Ala
35 40
<210> 15
<211> 42
<212> PRT
<213> 花园蜘蛛(Argiope aurantia)
<400> 15
Gly Gly Tyr Gly Pro Gly Ala Gly Gln Gln Gly Pro Gly Ser Gln Gly
1 5 10 15
Pro Gly Ser Gly Gly Gln Gln Gly Pro Gly Gly Leu Gly Pro Tyr Gly
20 25 30
Pro Ser Ala Ala Ala Ala Ala Ala Ala Ala
35 40
<210> 16
<211> 46
<212> PRT
<213> 巨眼蛛(Deinopis spinosa)
<400> 16
Gly Pro Gly Gly Tyr Gly Gly Pro Gly Gln Gln Gly Pro Gly Gln Gly
1 5 10 15
Gln Tyr Gly Pro Gly Thr Gly Gln Gln Gly Gln Gly Pro Ser Gly Gln
20 25 30
Gln Gly Pro Ala Gly Ala Ala Ala Ala Ala Ala Ala Ala Ala
35 40 45
<210> 17
<211> 42
<212> PRT
<213> 棒络新妇蛛(Nephila clavata)
<400> 17
Gly Pro Gly Gly Tyr Gly Leu Gly Gln Gln Gly Pro Gly Gln Gln Gly
1 5 10 15
Pro Gly Gln Gln Gly Pro Ala Gly Tyr Gly Pro Ser Gly Leu Ser Gly
20 25 30
Pro Gly Gly Ala Ala Ala Ala Ala Ala Ala
35 40
<210> 18
<211> 174
<212> PRT
<213> 巨眼蛛(Deinopis spinosa)
<400> 18
Gly Ala Gly Tyr Gly Ala Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala
1 5 10 15
Gly Thr Gly Tyr Gly Gly Gly Ala Gly Tyr Gly Thr Gly Ser Gly Ala
20 25 30
Gly Tyr Gly Ala Gly Val Gly Tyr Gly Ala Gly Ala Gly Ala Gly Gly
35 40 45
Gly Ala Gly Ala Gly Ala Gly Gly Gly Thr Gly Ala Gly Ala Gly Gly
50 55 60
Gly Ala Gly Ala Gly Tyr Gly Ala Gly Thr Gly Tyr Gly Ala Gly Ala
65 70 75 80
Gly Ala Gly Gly Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala
85 90 95
Gly Ala Gly Ala Gly Ser Gly Ala Gly Ala Gly Tyr Gly Ala Gly Ala
100 105 110
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Gly Val Ala Gly Ala Gly Ala
115 120 125
Ala Gly Gly Ala Gly Ala Ala Gly Gly Ala Gly Ala Ala Gly Gly Ala
130 135 140
Gly Ala Ala Gly Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Ala
145 150 155 160
Gly Ala Gly Ala Gly Gly Gly Ala Arg Ala Gly Ala Gly Gly
165 170
<210> 19
<211> 149
<212> PRT
<213> 黑寡妇蜘蛛(Latrodectus hesperus)
<400> 19
Gly Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly Val Gly Ala
1 5 10 15
Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala Ile Ala Arg Ala Gly Gly
20 25 30
Tyr Gly Gln Gly Ala Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala
35 40 45
Ala Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gln Gly
50 55 60
Ala Gly Gly Tyr Gly Arg Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala
65 70 75 80
Gly Ala Gly Ala Arg Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala
85 90 95
Ala Gly Ala Ala Ala Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala
100 105 110
Gly Gly Tyr Gly Gln Gly Gln Gly Ala Gly Ala Ala Ala Gly Ala Ala
115 120 125
Ala Ser Ala Gly Ala Gly Gly Tyr Gly Gln Gly Ala Gly Gly Tyr Gly
130 135 140
Gln Gly Gln Gly Ala
145
<210> 20
<211> 161
<212> PRT
<213> 络新妇蛛(Nephila clavipes)
<400> 20
Gly Ala Gly Ala Gly Gly Ala Gly Tyr Gly Arg Gly Ala Gly Ala Gly
1 5 10 15
Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly
20 25 30
Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala
35 40 45
Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Ala
50 55 60
Gly Tyr Ser Arg Gly Gly Arg Ala Gly Ala Ala Gly Ala Gly Ala Gly
65 70 75 80
Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly Tyr Gly Gly Gln Gly
85 90 95
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ala
100 105 110
Gly Ser Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala
115 120 125
Ala Ala Gly Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly Ala Gly Gly
130 135 140
Tyr Gly Gly Gln Gly Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala
145 150 155 160
Ala
<210> 21
<211> 186
<212> PRT
<213> Nephilengys cruentata
<400> 21
Gly Ala Gly Ala Gly Val Gly Gly Ala Gly Gly Tyr Gly Ser Gly Ala
1 5 10 15
Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Ala Ser Gly Ala Ala Ala
20 25 30
Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Thr
35 40 45
Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala Gly Ala
50 55 60
Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala
65 70 75 80
Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala
85 90 95
Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Asp Gly Ala Gly Ala
100 105 110
Gly Gly Ala Gly Gly Tyr Gly Arg Gly Ala Gly Ala Gly Ala Gly Ala
115 120 125
Gly Ala Ala Ala Gly Ala Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala
130 135 140
Gly Gln Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Ala Ala Gly Ala
145 150 155 160
Gly Ala Gly Gly Ala Gly Gly Tyr Gly Ala Gly Gln Gly Tyr Gly Ala
165 170 175
Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala
180 185
<210> 22
<211> 132
<212> PRT
<213> 全异妩蛛(Uloborus diversus)
<400> 22
Gly Ser Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala
1 5 10 15
Gly Ala Gly Ser Gly Tyr Gly Ala Gly Ser Ser Ala Ser Ala Gly Ser
20 25 30
Ala Ile Asn Thr Gln Thr Val Thr Ser Ser Thr Thr Thr Ser Ser Gln
35 40 45
Ser Ser Ala Ala Ala Thr Gly Ala Gly Tyr Gly Thr Gly Ala Gly Thr
50 55 60
Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr Gly
65 70 75 80
Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Arg Ala Ala
85 90 95
Gly Ser Gly Tyr Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Gly Ser
100 105 110
Gly Tyr Gly Ala Gly Ala Gly Ala Gly Ala Gly Ser Gly Tyr Gly Ala
115 120 125
Gly Ala Ala Ala
130
<210> 23
<211> 198
<212> PRT
<213> 全异妩蛛(Uloborus diversus)
<400> 23
Gly Ala Gly Ala Gly Tyr Arg Gly Gln Ala Gly Tyr Ile Gln Gly Ala
1 5 10 15
Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Val Gly Tyr Gly
20 25 30
Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala
35 40 45
Ala Ala Ala Gly Ala Gly Ala Gly Arg Gln Ala Gly Tyr Gly Gln Gly
50 55 60
Ala Gly Ala Ser Ala Gly Ala Ala Ala Ala Gly Ala Gly Ala Gly Arg
65 70 75 80
Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala
85 90 95
Ala Gly Ala Asp Ala Gly Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly
100 105 110
Ala Gly Ala Ser Ala Gly Ala Ala Ala Ser Gly Ala Gly Ala Gly Tyr
115 120 125
Gly Gly Gln Ala Gly Tyr Gly Gln Gly Ala Gly Ala Ser Ala Gly Ala
130 135 140
Ala Ala Ala Gly Ala Gly Ala Gly Tyr Leu Gly Gln Ala Gly Tyr Gly
145 150 155 160
Gln Gly Ala Gly Ala Ser Ala Gly Ala Ala Ala Gly Ala Gly Ala Gly
165 170 175
Tyr Gly Gly Gln Ala Gly Tyr Gly Gln Gly Thr Gly Ala Ala Ala Ser
180 185 190
Ala Ala Ala Ser Ser Ala
195
<210> 24
<211> 190
<212> PRT
<213> 大腹园蛛(Araneus ventricosus)
<400> 24
Gly Gly Gln Gly Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gln Gly
1 5 10 15
Ala Gly Gln Gly Gly Tyr Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala
20 25 30
Ala Ala Ala Gly Gly Ala Gly Gly Ala Gly Arg Gly Gly Leu Gly Ala
35 40 45
Gly Gly Ala Gly Gln Gly Tyr Gly Ala Gly Leu Gly Gly Gln Gly Gly
50 55 60
Ala Gly Gln Ala Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gly Ala
65 70 75 80
Arg Gln Gly Gly Leu Gly Ala Gly Gly Ala Gly Gln Gly Tyr Gly Ala
85 90 95
Gly Leu Gly Gly Gln Gly Gly Ala Gly Gln Gly Gly Ala Ala Ala Ala
100 105 110
Ala Ala Ala Ala Gly Gly Gln Gly Gly Gln Gly Gly Tyr Gly Gly Leu
115 120 125
Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Ala Gly Gln Gly Gly
130 135 140
Ala Ala Ala Ala Ala Ala Ala Ala Gly Gly Gln Gly Gly Gln Gly Gly
145 150 155 160
Tyr Gly Gly Leu Gly Ser Gln Gly Ala Gly Gln Gly Gly Tyr Gly Gly
165 170 175
Arg Gln Gly Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala Ala
180 185 190
<210> 25
<211> 166
<212> PRT
<213> 黑捕鱼蛛(Dolomedes tenebrosus)
<400> 25
Gly Gly Ala Gly Ala Gly Gln Gly Ser Tyr Gly Gly Gln Gly Gly Tyr
1 5 10 15
Gly Gln Gly Gly Ala Gly Ala Ala Thr Ala Thr Ala Ala Ala Ala Gly
20 25 30
Gly Ala Gly Ser Gly Gln Gly Gly Tyr Gly Gly Gln Gly Gly Leu Gly
35 40 45
Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala
50 55 60
Ala Ala Gly Gly Ala Gly Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly
65 70 75 80
Gly Gln Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Ala Ala Ala
85 90 95
Ala Ala Gly Gly Ala Gly Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly
100 105 110
Gly Tyr Gly Gln Gly Gly Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala
115 120 125
Ala Ser Gly Gly Ser Gly Ser Gly Gln Gly Gly Tyr Gly Gly Gln Gly
130 135 140
Gly Leu Gly Gly Tyr Gly Gln Gly Ala Gly Ala Gly Ala Gly Ala Ala
145 150 155 160
Ala Ser Ala Ala Ala Ala
165
<210> 26
<211> 177
<212> PRT
<213> Nephilengys cruentata
<400> 26
Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala
1 5 10 15
Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly
20 25 30
Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala Ala Ser Gly Ala
35 40 45
Gly Gln Gly Gly Tyr Glu Gly Pro Gly Ala Gly Gln Gly Ala Gly Ala
50 55 60
Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu
65 70 75 80
Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala
85 90 95
Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala
100 105 110
Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln
115 120 125
Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala
130 135 140
Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Ser Gly Gln
145 150 155 160
Gly Gly Tyr Gly Arg Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala Ala
165 170 175
Ala
<210> 27
<211> 174
<212> PRT
<213> Nephilengys cruentata
<400> 27
Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly Gln Gly Ala
1 5 10 15
Gly Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly
20 25 30
Gly Gln Gly Ala Gly Gln Gly Ala Ala Ala Ala Ala Ala Ser Gly Ala
35 40 45
Gly Gln Gly Gly Tyr Gly Gly Pro Gly Ala Gly Gln Gly Ala Gly Ala
50 55 60
Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu
65 70 75 80
Gly Gly Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala
85 90 95
Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Gln Gly Ala Gly Gln Gly
100 105 110
Ala Ala Ala Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly
115 120 125
Leu Gly Ser Gly Gln Gly Gly Tyr Gly Gly Gln Gly Ala Gly Ala Ala
130 135 140
Ala Ala Ala Gly Gly Ala Gly Gln Gly Gly Tyr Gly Gly Leu Gly Gly
145 150 155 160
Gln Gly Ala Gly Gln Gly Ala Gly Ala Ala Ala Ala Ala Ala
165 170
<210> 28
<211> 22
<212> PRT
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 28
Met Phe Ser Leu Lys Ala Leu Leu Pro Leu Ala Leu Leu Leu Val Ser
1 5 10 15
Ala Asn Gln Val Ala Ala
20
<210> 29
<211> 23
<212> PRT
<213> 巴斯德毕赤酵母(Pichia pastoris)
<400> 29
Met Ser Phe Ser Ser Asn Val Pro Gln Leu Phe Leu Leu Leu Val Leu
1 5 10 15
Leu Thr Asn Ile Val Ser Gly
20
<210> 30
<211> 20
<212> PRT
<213> 巴斯德毕赤酵母(Pichia pastoris)
<400> 30
Met Lys Leu Ser Thr Asn Leu Ile Leu Ala Ile Ala Ala Ala Ser Ala
1 5 10 15
Val Val Ser Ala
20
<210> 31
<211> 18
<212> PRT
<213> 红原鸡(Gallus gallus)
<400> 31
Met Arg Ser Leu Leu Ile Leu Val Leu Cys Phe Leu Pro Leu Ala Ala
1 5 10 15
Leu Gly
<210> 32
<211> 89
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多肽
<400> 32
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Asp Leu Glu Gly Asp Phe
35 40 45
Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
50 55 60
Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Ser Leu Asp Lys Arg Glu Ala Glu Ala
85
<210> 33
<211> 89
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多肽
<400> 33
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe
35 40 45
Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
50 55 60
Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Ser Leu Glu Lys Arg Glu Ala Glu Ala
85
<210> 34
<211> 92
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多肽
<400> 34
Met Phe Ser Leu Lys Ala Leu Leu Pro Leu Ala Leu Leu Leu Val Ser
1 5 10 15
Ala Asn Gln Val Ala Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu
20 25 30
Thr Ala Gln Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu
35 40 45
Gly Asp Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn
50 55 60
Gly Leu Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu
65 70 75 80
Glu Gly Val Ser Leu Glu Lys Arg Glu Ala Glu Ala
85 90
<210> 35
<211> 93
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多肽
<400> 35
Met Ser Phe Ser Ser Asn Val Pro Gln Leu Phe Leu Leu Leu Val Leu
1 5 10 15
Leu Thr Asn Ile Val Ser Gly Ala Pro Val Asn Thr Thr Thr Glu Asp
20 25 30
Glu Thr Ala Gln Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu
35 40 45
Glu Gly Asp Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn
50 55 60
Asn Gly Leu Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys
65 70 75 80
Glu Glu Gly Val Ser Leu Glu Lys Arg Glu Ala Glu Ala
85 90
<210> 36
<211> 90
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多肽
<400> 36
Met Lys Leu Ser Thr Asn Leu Ile Leu Ala Ile Ala Ala Ala Ser Ala
1 5 10 15
Val Val Ser Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala
20 25 30
Gln Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp
35 40 45
Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu
50 55 60
Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly
65 70 75 80
Val Ser Leu Glu Lys Arg Glu Ala Glu Ala
85 90
<210> 37
<211> 88
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成多肽
<400> 37
Met Arg Ser Leu Leu Ile Leu Val Leu Cys Phe Leu Pro Leu Ala Ala
1 5 10 15
Leu Gly Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln Ile
20 25 30
Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe Asp
35 40 45
Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu Phe
50 55 60
Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val Ser
65 70 75 80
Leu Glu Lys Arg Glu Ala Glu Ala
85
<210> 38
<211> 5
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成肽
<400> 38
Ala Ala Ala Ala Ala
1 5
<210> 39
<211> 5
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成肽
<400> 39
Ser Gly Ala Gly Gly
1 5
<210> 40
<211> 5
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成肽
<400> 40
Gly Ser Gly Ala Gly
1 5
<210> 41
<211> 5
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成肽
<400> 41
Gly Gly Ser Gly Ala
1 5
<210> 42
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成His标签
<220>
<221> MISC_FEATURE
<222> (1)..(8)
<223> 此序列可涵盖6-8个残基
<400> 42
His His His His His His His His
1 5
<210> 43
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 人工序列的描述:合成6xHis标签
<400> 43
His His His His His His
1 5
Claims (54)
1.一种从宿主细胞分离重组蜘蛛丝蛋白的方法,其包括:
a.提供包含重组蜘蛛丝蛋白的不溶性团块;
b.将所述不溶性团块添加到包含溶剂的水性溶液中;
c.向包含所述不溶性团块的所述水性溶液施加剪切力,从而使所述重组蜘蛛丝蛋白溶解在所述水性溶液中。
2.如权利要求1所述的方法,其中所述剪切力是通过微流体化施加的。
3.如权利要求2所述的方法,其中所述微流体化产生约6×106s-1至10×106s-1的剪切速率。
4.如权利要求2所述的方法,其中所述微流体化产生至少约6×106s-1的剪切速率。
5.如权利要求2所述的方法,其中所述微流体化产生至少约10×106s-1的剪切速率。
6.如权利要求2-5所述的方法,其中所述微流体化在20,000psi至30,000psi下进行。
7.如权利要求6所述的方法,其中所述微流体化在30,000psi下进行。
8.如权利要求6所述的方法,其中所述微流体化在23,000psi下进行。
9.如前述权利要求中任一项所述的方法,其中微流体化器是M-110P或LM10微流体化器。
10.如权利要求9所述的方法,其中所述微流体化器包括G10Z相互作用室。
11.如权利要求9所述的方法,其中所述微流体化器包括F12Y相互作用室。
12.如前述权利要求中任一项所述的方法,其中所述剪切力施加至少两次。
13.如权利要求12所述的方法,其中所述剪切力施加至少三次。
14.如权利要求12所述的方法,其中所述剪切力在至少两次施加中是相同的。
15.如权利要求12所述的方法,其中所述剪切力在至少两次施加中是不同的。
16.如前述权利要求中任一项所述的方法,其中所述不溶性团块来源于包含宿主细胞的细胞培养物,其中所述宿主细胞表达所述重组蜘蛛丝蛋白。
17.如权利要求16所述的方法,其还包括收集来源于所述细胞培养物的所述不溶性团块,其中所述不溶性团块包含所述重组蜘蛛丝蛋白。
18.如权利要求1-17中任一项所述的方法,其中所述溶剂是离散剂。
19.如权利要求18所述的方法,其中所述离散剂是尿素、硫氰酸胍(GdnSCN)或氯化胍(GdnHCL)。
20.如权利要求1-19中任一项所述的方法,其中所述不溶性团块以约5%、10%、15%、20%、25%或30%不溶性团块/溶剂体积添加到所述水性溶液中。
21.如权利要求19或20所述的方法,其中所述离散剂以0.1-10M的浓度存在于所述水性溶液中。
22.如权利要求19或20所述的方法,其中所述水性溶液包含约10M尿素、约4M-8MGdnHCl或约3M-6M GdnSCN。
23.如权利要求19或20所述的方法,其中所述水性溶液包括不多于包含10M尿素的水性溶液、包含8M GdnHCl的水性溶液或包含6M GdnSCN的水性溶液的离液活性。
24.如权利要求23所述的方法,其中所述离液活性使用琼脂-胶凝测定进行量化。
25.如权利要求20所述的方法,其中所述水性溶液包括约15%不溶性部分团块与85%体积的3M GdnSCN。
26.如权利要求20所述的方法,其中所述水性溶液包括约15%不溶性部分团块与85%体积的4M GdnHCl。
27.如权利要求20所述的方法,其中所述水性溶液包括约15%不溶性部分团块与85%体积的10M尿素。
28.如权利要求1-27中任一项所述的方法,其中所述不溶性团块在20℃与30℃之间温育。
29.如权利要求28所述的方法,其中所述不溶性团块在室温下温育。
30.如权利要求28所述的方法,其中所述不溶性团块在不高于30℃下温育。
31.如权利要求1-30中任一项所述的方法,其中所述不溶性部分在包含所述溶剂的所述水性溶液中温育60至120分钟。
32.如权利要求1-31中任一项所述的方法,其中所述不溶性团块包含细胞沉淀。
33.如权利要求1-32中任一项所述的方法,其中收集来源于所述细胞沉淀的所述不溶性团块包括裂解所述宿主细胞。
34.如权利要求33所述的方法,其中裂解包括热处理、化学处理、剪切破坏、物理匀化、声处理或化学匀化。
35.如权利要求33至34所述的方法,其中收集所述细胞培养物的所述不溶性团块还包括离心所述裂解细胞以获得第一细胞沉淀。
36.如权利要求1-35中任一项所述的方法,其中收集所述不溶性团块还包括:
a.以10:1尿素体积与沉淀质量的比率将所述细胞沉淀与包含4M尿素的溶液一起温育;以及
b.离心所述包含4M尿素的溶液以获得第二细胞沉淀,之后在包含溶剂的所述水性溶液中温育所述第二细胞沉淀。
37.如权利要求1-36中任一项所述的方法,其还包括从所述水性溶液分离所述重组蜘蛛丝蛋白,从而产生分离的重组蜘蛛丝蛋白。
38.如权利要求1-37中任一项所述的方法,其中所述重组蜘蛛丝蛋白是高度结晶的丝蛋白、高β折叠含量丝蛋白或低溶解度丝蛋白。
39.如权利要求38所述的方法,其中所述重组蜘蛛丝蛋白包括如SEQ ID NO:23中所示的差异妩蛛MiSP蛋白。
40.如权利要求38所述的方法,其中所述重组蜘蛛丝蛋白在非离液溶剂中的溶解度阈值低于90%、80%、70%、60%或50%。
41.如权利要求1-40中任一项所述的方法,其中所述细胞培养物包含真菌、细菌或酵母细胞。
42.如权利要求1-41中任一项所述的方法,其中所述细菌细胞是大肠杆菌。
43.如前述权利要求中任一项所述的方法,其中使用ELISA测量分离的重组蜘蛛丝蛋白的量。
44.如权利要求1-43中任一项所述的方法,其中使用尺寸排阻色谱法测量分离的重组蜘蛛丝蛋白的量。
45.如权利要求1-44中任一项所述的方法,其中所述分离的重组蜘蛛丝蛋白是全长重组蜘蛛丝蛋白。
46.如权利要求45所述的方法,其中所述分离的重组蜘蛛丝蛋白包含至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%全长重组蜘蛛丝蛋白。
47.如权利要求45所述的方法,其中使用ELISA测量全长重组蜘蛛丝蛋白的量。
48.如权利要求45所述的方法,其中使用尺寸排阻色谱法测量全长重组蜘蛛丝蛋白的量。
49.如权利要求1-48中任一项所述的方法,其中所述分离的重组蜘蛛丝蛋白的纯度是5-10%、10-15%、15-20%、20-25%、25-30%、30-35%、35-40%、45-50%、50-55%、55-60%、60-65%、65-70%、70-75%、75-80%、80-85%、85-90%、09-95%或95-100%。
50.一种从宿主细胞分离重组蜘蛛丝蛋白的方法,其包括:
a.提供包含重组蜘蛛丝蛋白的不溶性团块;
b.将所述不溶性团块添加到包含溶剂的水性溶液中,其中所述水性溶液以最终10M尿素浓度包含15%(重量/体积)不溶性部分;
c.通过微流体化向包含所述不溶性团块的所述水性溶液施加剪切力,从而使所述重组蜘蛛丝蛋白溶解在所述水性溶液中;以及
d.从所述水性溶液分离所述重组蜘蛛丝蛋白,从而产生分离的重组蜘蛛丝蛋白。
51.一种从宿主细胞分离重组蜘蛛丝蛋白的方法,其包括:
a.提供包含重组蜘蛛丝蛋白的不溶性团块;
b.将所述不溶性团块添加到水性溶液中,其中所述水性溶液以最终10M尿素浓度包含约15%(重量/体积)不溶性部分;
c.通过微流体化向所述水性溶液施加剪切力,从而使所述重组蜘蛛丝蛋白溶解在所述水性溶液中,其中所述剪切力是约10×106s-1;以及
d.从所述水性溶液分离所述重组蜘蛛丝蛋白,从而产生分离的重组蜘蛛丝蛋白。
52.一种组合物,其包含通过如权利要求1-51中任一项所述的方法产生的重组蜘蛛丝蛋白。
53.如权利要求52所述的组合物,其中所述重组蜘蛛丝包含至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或100%全长重组蜘蛛丝。
54.一种丝纤维,其包含通过权利要求1-53中任一项所述的方法产生的重组蜘蛛丝蛋白。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962901053P | 2019-09-16 | 2019-09-16 | |
US62/901,053 | 2019-09-16 | ||
PCT/US2020/051024 WO2021055440A1 (en) | 2019-09-16 | 2020-09-16 | Methods for isolating spider silk proteins via high shear solubilization |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114269398A true CN114269398A (zh) | 2022-04-01 |
CN114269398B CN114269398B (zh) | 2024-06-25 |
Family
ID=74883695
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080057878.2A Active CN114269398B (zh) | 2019-09-16 | 2020-09-16 | 通过高剪切溶解来分离蜘蛛丝蛋白的方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20220372086A1 (zh) |
EP (2) | EP4031202A1 (zh) |
JP (1) | JP2022548481A (zh) |
KR (1) | KR20220083662A (zh) |
CN (1) | CN114269398B (zh) |
AU (1) | AU2020349480A1 (zh) |
CA (1) | CA3147370A1 (zh) |
MX (1) | MX2022001740A (zh) |
WO (1) | WO2021055440A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11993068B2 (en) | 2022-04-15 | 2024-05-28 | Spora Cayman Holdings Limited | Mycotextiles including activated scaffolds and nano-particle cross-linkers and methods of making them |
Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8908894D0 (en) * | 1989-04-19 | 1989-06-07 | Chajuss Daniel | Process for increasing the water-solubility of low water-soluble proteinaceous material |
JP2002306163A (ja) * | 2001-04-11 | 2002-10-22 | Chemo Sero Therapeut Res Inst | 大腸菌を宿主とする遺伝子組換えヒトトロンビンの調製方法 |
WO2003060099A2 (en) * | 2002-01-11 | 2003-07-24 | Nexia Biotechnologies, Inc. | Methods and apparatus for spinning spider silk protein |
US20060133957A1 (en) * | 2003-01-17 | 2006-06-22 | Knapp Merrill A | Device and method for fragmenting material by hydrodynamic shear |
AU2007202306A1 (en) * | 1999-08-12 | 2007-06-14 | Barofold, Inc. | Improved protein disaggregation and refolding using high pressure |
CN101018806A (zh) * | 2004-07-22 | 2007-08-15 | 慕尼黑技术大学 | 重组蜘蛛丝蛋白 |
US20100029553A1 (en) * | 2006-06-08 | 2010-02-04 | Technische Universitaet Muenchen | Microfluidic Device for Controlled Aggregation of Spider Silk |
CN103739691A (zh) * | 2013-12-11 | 2014-04-23 | 浙江大学 | 一种绿色环保制备丝素蛋白粉末的方法 |
US20140193466A1 (en) * | 2011-06-07 | 2014-07-10 | Cornell University | Silk compositions and methods of using same |
US20150202651A1 (en) * | 2013-12-17 | 2015-07-23 | Utah State University | Recombinant Spider Silk Protein Film and Method of Synthesizing |
US20150329587A1 (en) * | 2012-12-27 | 2015-11-19 | Spiber Inc. | Extraction method for hydrophilic recombinant protein |
CN105755025A (zh) * | 2016-04-14 | 2016-07-13 | 东华大学 | 一种重组蛛丝蛋白的制备方法 |
WO2017127940A1 (en) * | 2016-01-27 | 2017-08-03 | Dalhousie University | Artificial spider aciniform silk proteins, methods of making and uses thereof |
CN108368271A (zh) * | 2015-12-01 | 2018-08-03 | 丝芭博株式会社 | 制造蛋白质溶液的方法 |
CN109371035A (zh) * | 2018-11-30 | 2019-02-22 | 东华大学 | 一种大腹园蛛梨状腺丝蛋白的基因及其制备方法 |
CN109912720A (zh) * | 2019-03-14 | 2019-06-21 | 天津大学 | 一种蛛丝蛋白的设计合成方法和纺丝 |
CN110099917A (zh) * | 2016-12-27 | 2019-08-06 | 丝芭博株式会社 | 蛋白质的回收方法 |
CN113861282A (zh) * | 2021-09-14 | 2021-12-31 | 嘉必优生物技术(武汉)股份有限公司 | 一种纯化蛛丝蛋白包涵体的方法 |
CN114222751A (zh) * | 2019-08-22 | 2022-03-22 | 保尔特纺织品公司 | 用于改善蜘蛛丝蛋白的提取的方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1427742A1 (en) * | 2001-08-29 | 2004-06-16 | University of Wyoming | Spider silk protein encoding nucleic acids, polypeptides, antibodies and method of use thereof |
US9051383B2 (en) * | 2007-06-11 | 2015-06-09 | The Regents Of The University Of California | Spider silk dragline polynucleotides, polypeptides and methods of use thereof |
JP6556122B2 (ja) | 2013-09-17 | 2019-08-07 | ボルト スレッズ インコーポレイテッド | 改良シルク繊維を合成するための方法および組成物 |
US11597750B2 (en) * | 2017-06-13 | 2023-03-07 | Aalto University Foundation Sr | Method for producing a condensed adhesive phase of silk fusion proteins |
US10647975B2 (en) | 2017-10-03 | 2020-05-12 | Bolt Threads, Inc. | Modified strains for the production of recombinant silk |
WO2020112742A1 (en) * | 2018-11-28 | 2020-06-04 | Bolt Threads, Inc. | Alkaline purification of spider silk proteins |
-
2020
- 2020-09-16 EP EP20865591.0A patent/EP4031202A1/en not_active Withdrawn
- 2020-09-16 KR KR1020227004374A patent/KR20220083662A/ko active Search and Examination
- 2020-09-16 MX MX2022001740A patent/MX2022001740A/es unknown
- 2020-09-16 AU AU2020349480A patent/AU2020349480A1/en active Pending
- 2020-09-16 JP JP2022507848A patent/JP2022548481A/ja active Pending
- 2020-09-16 WO PCT/US2020/051024 patent/WO2021055440A1/en unknown
- 2020-09-16 US US17/636,721 patent/US20220372086A1/en active Pending
- 2020-09-16 CA CA3147370A patent/CA3147370A1/en active Pending
- 2020-09-16 EP EP23155482.5A patent/EP4218843A3/en active Pending
- 2020-09-16 CN CN202080057878.2A patent/CN114269398B/zh active Active
Patent Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8908894D0 (en) * | 1989-04-19 | 1989-06-07 | Chajuss Daniel | Process for increasing the water-solubility of low water-soluble proteinaceous material |
AU2007202306A1 (en) * | 1999-08-12 | 2007-06-14 | Barofold, Inc. | Improved protein disaggregation and refolding using high pressure |
JP2002306163A (ja) * | 2001-04-11 | 2002-10-22 | Chemo Sero Therapeut Res Inst | 大腸菌を宿主とする遺伝子組換えヒトトロンビンの調製方法 |
WO2003060099A2 (en) * | 2002-01-11 | 2003-07-24 | Nexia Biotechnologies, Inc. | Methods and apparatus for spinning spider silk protein |
US20060133957A1 (en) * | 2003-01-17 | 2006-06-22 | Knapp Merrill A | Device and method for fragmenting material by hydrodynamic shear |
CN101018806A (zh) * | 2004-07-22 | 2007-08-15 | 慕尼黑技术大学 | 重组蜘蛛丝蛋白 |
US20100029553A1 (en) * | 2006-06-08 | 2010-02-04 | Technische Universitaet Muenchen | Microfluidic Device for Controlled Aggregation of Spider Silk |
US20140193466A1 (en) * | 2011-06-07 | 2014-07-10 | Cornell University | Silk compositions and methods of using same |
US20150329587A1 (en) * | 2012-12-27 | 2015-11-19 | Spiber Inc. | Extraction method for hydrophilic recombinant protein |
CN103739691A (zh) * | 2013-12-11 | 2014-04-23 | 浙江大学 | 一种绿色环保制备丝素蛋白粉末的方法 |
US20150202651A1 (en) * | 2013-12-17 | 2015-07-23 | Utah State University | Recombinant Spider Silk Protein Film and Method of Synthesizing |
CN108368271A (zh) * | 2015-12-01 | 2018-08-03 | 丝芭博株式会社 | 制造蛋白质溶液的方法 |
US20180355120A1 (en) * | 2015-12-01 | 2018-12-13 | Spiber Inc. | Method for Producing Protein Solution |
WO2017127940A1 (en) * | 2016-01-27 | 2017-08-03 | Dalhousie University | Artificial spider aciniform silk proteins, methods of making and uses thereof |
CN105755025A (zh) * | 2016-04-14 | 2016-07-13 | 东华大学 | 一种重组蛛丝蛋白的制备方法 |
CN110099917A (zh) * | 2016-12-27 | 2019-08-06 | 丝芭博株式会社 | 蛋白质的回收方法 |
CN109371035A (zh) * | 2018-11-30 | 2019-02-22 | 东华大学 | 一种大腹园蛛梨状腺丝蛋白的基因及其制备方法 |
CN109912720A (zh) * | 2019-03-14 | 2019-06-21 | 天津大学 | 一种蛛丝蛋白的设计合成方法和纺丝 |
CN114222751A (zh) * | 2019-08-22 | 2022-03-22 | 保尔特纺织品公司 | 用于改善蜘蛛丝蛋白的提取的方法 |
CN113861282A (zh) * | 2021-09-14 | 2021-12-31 | 嘉必优生物技术(武汉)股份有限公司 | 一种纯化蛛丝蛋白包涵体的方法 |
Non-Patent Citations (9)
Title |
---|
LAN SHEN ET AL: "Microfluidization as a potential technique to modify surface properties of soy protein isolate", FOOD RESEARCH INTERNATIONAL, vol. 48, pages 377 - 378 * |
LUKAS EISOLDT ET AL: ""The role of salt and shear on the storage and assembly of spider silk proteins"", 《JOURNAL OF STRUCTURAL BIOLOGY》, vol. 170, 4 January 2010 (2010-01-04) * |
MARLENE ANDERSSON ET AL: ""Biomimetic spinning of artificial spider silk from a chimeric minispidroin"", 《NAT CHEM BIOL》 * |
MARLENE ANDERSSON ET AL: ""Biomimetic spinning of artificial spider silk from a chimeric minispidroin"", 《NAT CHEM BIOL》, vol. 13, 9 January 2017 (2017-01-09), pages 262 - 264, XP093015057, DOI: 10.1038/nchembio.2269 * |
XIAO HU ET AL: "Effects of Microfluidization Treatment and Transglutaminase Cross-Linking on Physicochemical, Functional, and Conformational Properties of Peanut Protein Isolate", J. AGRIC. FOOD CHEM, vol. 59 * |
吴忠笏等: "重组杂合蛛丝蛋白MiSpNT-PySpRp-MiSpCT的二级结构表征", 中国生物化学与分子生物学报, no. 08 * |
张晓鸣主编: "《食品风味化学》", 31 March 2009, pages: 268 - 269 * |
潘鸿春等: ""蜘蛛丝蛋白研究进展"", 《蛛形学报》 * |
潘鸿春等: ""蜘蛛丝蛋白研究进展"", 《蛛形学报》, no. 01, 30 May 2006 (2006-05-30), pages 52 - 59 * |
Also Published As
Publication number | Publication date |
---|---|
EP4218843A2 (en) | 2023-08-02 |
JP2022548481A (ja) | 2022-11-21 |
WO2021055440A1 (en) | 2021-03-25 |
EP4031202A1 (en) | 2022-07-27 |
KR20220083662A (ko) | 2022-06-20 |
CA3147370A1 (en) | 2021-03-25 |
CN114269398B (zh) | 2024-06-25 |
MX2022001740A (es) | 2022-05-18 |
AU2020349480A1 (en) | 2022-03-03 |
EP4218843A3 (en) | 2023-08-23 |
US20220372086A1 (en) | 2022-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7544348B2 (ja) | 改良シルク繊維を合成するための方法および組成物 | |
US20220289790A1 (en) | Methods for improved extraction of spider silk proteins | |
KR20190127802A (ko) | 재조합 단백질을 고분비 수율로 생산하기 위한 조성물 및 방법 | |
KR20190127806A (ko) | 재조합 단백질을 고분비 수율로 생산하기 위한 조성물 및 방법 | |
CN114269398B (zh) | 通过高剪切溶解来分离蜘蛛丝蛋白的方法 | |
US20220251533A1 (en) | Modified strains for the production of recombinant silk | |
US20220017580A1 (en) | Alkaline purification of spider silk proteins | |
JP7246102B2 (ja) | 組換え絹を製造するための改変株 | |
JP2004236642A (ja) | 昆虫細胞のゲノムに外来dnaを導入するための方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |