CN102414316A - 来自普通章鱼的dfp酶 - Google Patents
来自普通章鱼的dfp酶 Download PDFInfo
- Publication number
- CN102414316A CN102414316A CN2010800197908A CN201080019790A CN102414316A CN 102414316 A CN102414316 A CN 102414316A CN 2010800197908 A CN2010800197908 A CN 2010800197908A CN 201080019790 A CN201080019790 A CN 201080019790A CN 102414316 A CN102414316 A CN 102414316A
- Authority
- CN
- China
- Prior art keywords
- polypeptide
- sequence
- seq
- polynucleotide
- enzyme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000790 Enzymes Proteins 0.000 title claims description 115
- 102000004190 Enzymes Human genes 0.000 title claims description 112
- 241000238414 Octopus vulgaris Species 0.000 title description 15
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 317
- 229920001184 polypeptide Polymers 0.000 claims abstract description 310
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 308
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 90
- 239000002157 polynucleotide Substances 0.000 claims abstract description 90
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 90
- 238000000034 method Methods 0.000 claims abstract description 59
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 27
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 27
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 27
- 125000003729 nucleotide group Chemical group 0.000 claims description 80
- 239000002773 nucleotide Substances 0.000 claims description 79
- 230000003301 hydrolyzing effect Effects 0.000 claims description 68
- 108090000623 proteins and genes Proteins 0.000 claims description 49
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 31
- 235000001014 amino acid Nutrition 0.000 claims description 29
- 230000001105 regulatory effect Effects 0.000 claims description 28
- 150000001413 amino acids Chemical class 0.000 claims description 27
- 230000001276 controlling effect Effects 0.000 claims description 23
- 150000002903 organophosphorus compounds Chemical class 0.000 claims description 17
- 229940058344 antitrematodals organophosphorous compound Drugs 0.000 claims description 16
- 239000013604 expression vector Substances 0.000 claims description 16
- 239000012634 fragment Substances 0.000 claims description 15
- 102000004169 proteins and genes Human genes 0.000 claims description 15
- 238000009396 hybridization Methods 0.000 claims description 14
- 230000000295 complement effect Effects 0.000 claims description 13
- 235000018102 proteins Nutrition 0.000 claims description 13
- 239000003153 chemical reaction reagent Substances 0.000 claims description 12
- 230000002939 deleterious effect Effects 0.000 claims description 11
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 10
- 239000003905 agrochemical Substances 0.000 claims description 9
- 238000003259 recombinant expression Methods 0.000 claims description 7
- 239000006210 lotion Substances 0.000 claims description 2
- 239000004530 micro-emulsion Substances 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 42
- 239000013598 vector Substances 0.000 abstract description 4
- 102000004157 Hydrolases Human genes 0.000 abstract description 2
- 108090000604 Hydrolases Proteins 0.000 abstract description 2
- 210000004027 cell Anatomy 0.000 description 138
- 229940088598 enzyme Drugs 0.000 description 107
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 51
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 38
- 108020004414 DNA Proteins 0.000 description 34
- MUCZHBLJLSDCSD-UHFFFAOYSA-N diisopropyl fluorophosphate Chemical compound CC(C)OP(F)(=O)OC(C)C MUCZHBLJLSDCSD-UHFFFAOYSA-N 0.000 description 31
- 229960005051 fluostigmine Drugs 0.000 description 29
- 229940024606 amino acid Drugs 0.000 description 28
- 230000001580 bacterial effect Effects 0.000 description 27
- 241000894006 Bacteria Species 0.000 description 23
- 230000008859 change Effects 0.000 description 23
- 241000193830 Bacillus <bacterium> Species 0.000 description 22
- 239000000523 sample Substances 0.000 description 22
- -1 organo phosphorous Chemical compound 0.000 description 21
- 239000013612 plasmid Substances 0.000 description 21
- 230000014509 gene expression Effects 0.000 description 19
- 241000233866 Fungi Species 0.000 description 15
- 241000499912 Trichoderma reesei Species 0.000 description 15
- 230000002538 fungal effect Effects 0.000 description 15
- 241000187747 Streptomyces Species 0.000 description 14
- 239000002253 acid Substances 0.000 description 14
- 108091026890 Coding region Proteins 0.000 description 13
- 241000223218 Fusarium Species 0.000 description 13
- 239000002299 complementary DNA Substances 0.000 description 13
- 108010027293 diisopropyl-fluorophosphatase Proteins 0.000 description 12
- 230000000968 intestinal effect Effects 0.000 description 12
- 238000004321 preservation Methods 0.000 description 12
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 11
- 240000006439 Aspergillus oryzae Species 0.000 description 11
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 11
- 230000010076 replication Effects 0.000 description 11
- 241001655322 Streptomycetales Species 0.000 description 10
- 241000223258 Thermomyces lanuginosus Species 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 10
- 241000351920 Aspergillus nidulans Species 0.000 description 9
- 241000194108 Bacillus licheniformis Species 0.000 description 9
- 241001494489 Thielavia Species 0.000 description 9
- 125000000539 amino acid group Chemical group 0.000 description 9
- 239000000463 material Substances 0.000 description 9
- 239000000203 mixture Substances 0.000 description 9
- 230000008521 reorganization Effects 0.000 description 9
- 239000000758 substrate Substances 0.000 description 9
- 241000228212 Aspergillus Species 0.000 description 8
- 241000605909 Fusobacterium Species 0.000 description 8
- 241000194017 Streptococcus Species 0.000 description 8
- SNTRKUOVAPUGAY-UHFFFAOYSA-N cyclosarin Chemical compound CP(F)(=O)OC1CCCCC1 SNTRKUOVAPUGAY-UHFFFAOYSA-N 0.000 description 8
- WEBQKRLKWNIYKK-UHFFFAOYSA-N demeton-S-methyl Chemical compound CCSCCSP(=O)(OC)OC WEBQKRLKWNIYKK-UHFFFAOYSA-N 0.000 description 8
- 108020004999 messenger RNA Proteins 0.000 description 8
- 238000003752 polymerase chain reaction Methods 0.000 description 8
- 108091005804 Peptidases Proteins 0.000 description 7
- 102000035195 Peptidases Human genes 0.000 description 7
- 241000589516 Pseudomonas Species 0.000 description 7
- DYAHQFWOVKZOOW-UHFFFAOYSA-N Sarin Chemical compound CC(C)OP(C)(F)=O DYAHQFWOVKZOOW-UHFFFAOYSA-N 0.000 description 7
- 241000223259 Trichoderma Species 0.000 description 7
- 230000004927 fusion Effects 0.000 description 7
- 230000007062 hydrolysis Effects 0.000 description 7
- 238000006460 hydrolysis reaction Methods 0.000 description 7
- 239000002609 medium Substances 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 238000002703 mutagenesis Methods 0.000 description 7
- 231100000350 mutagenesis Toxicity 0.000 description 7
- 230000014616 translation Effects 0.000 description 7
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 6
- 108090000371 Esterases Proteins 0.000 description 6
- 241000221779 Fusarium sambucinum Species 0.000 description 6
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 6
- 125000003412 L-alanyl group Chemical group [H]N([H])[C@@](C([H])([H])[H])(C(=O)[*])[H] 0.000 description 6
- 241000235395 Mucor Species 0.000 description 6
- 108010076504 Protein Sorting Signals Proteins 0.000 description 6
- 230000008034 disappearance Effects 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 239000003958 nerve gas Substances 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 241000193422 Bacillus lentus Species 0.000 description 5
- 241000589876 Campylobacter Species 0.000 description 5
- 241000196324 Embryophyta Species 0.000 description 5
- 101000925662 Enterobacteria phage PRD1 Endolysin Proteins 0.000 description 5
- 241000194033 Enterococcus Species 0.000 description 5
- 241000589565 Flavobacterium Species 0.000 description 5
- 102100022624 Glucoamylase Human genes 0.000 description 5
- 241000186660 Lactobacillus Species 0.000 description 5
- 241000194036 Lactococcus Species 0.000 description 5
- 241000235648 Pichia Species 0.000 description 5
- 241000607142 Salmonella Species 0.000 description 5
- 241000191940 Staphylococcus Species 0.000 description 5
- 241000264435 Streptococcus dysgalactiae subsp. equisimilis Species 0.000 description 5
- 241000193996 Streptococcus pyogenes Species 0.000 description 5
- 241000194054 Streptococcus uberis Species 0.000 description 5
- 241000187392 Streptomyces griseus Species 0.000 description 5
- 241000202898 Ureaplasma Species 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 238000005520 cutting process Methods 0.000 description 5
- 238000004520 electroporation Methods 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 229940039696 lactobacillus Drugs 0.000 description 5
- 235000016709 nutrition Nutrition 0.000 description 5
- 230000008488 polyadenylation Effects 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 5
- 210000001938 protoplast Anatomy 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 229940115922 streptococcus uberis Drugs 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- KEZAYQGUTKCBLO-UHFFFAOYSA-N (5,7-dichloro-1,3-benzoxazol-2-yl)methylsulfanyl-diethoxy-sulfanylidene-$l^{5}-phosphane Chemical compound ClC1=CC(Cl)=C2OC(CSP(=S)(OCC)OCC)=NC2=C1 KEZAYQGUTKCBLO-UHFFFAOYSA-N 0.000 description 4
- PJISLFCKHOHLLP-UHFFFAOYSA-N 2-diethoxyphosphorylsulfanyl-n,n-diethylethanamine Chemical compound CCOP(=O)(OCC)SCCN(CC)CC PJISLFCKHOHLLP-UHFFFAOYSA-N 0.000 description 4
- FCUBTKFQDYNIIC-UHFFFAOYSA-N 2-dimethoxyphosphinothioylsulfanyl-n-(methoxymethyl)acetamide Chemical compound COCNC(=O)CSP(=S)(OC)OC FCUBTKFQDYNIIC-UHFFFAOYSA-N 0.000 description 4
- VMUXSMXIQBNMGZ-UHFFFAOYSA-N 3,4-dihydrocoumarin Chemical compound C1=CC=C2OC(=O)CCC2=C1 VMUXSMXIQBNMGZ-UHFFFAOYSA-N 0.000 description 4
- LQHMZSQJOYPNND-UHFFFAOYSA-N 3-(diethoxyphosphinothioylsulfanylmethyl)-5-propan-2-yloxy-1,3,4-thiadiazol-2-one Chemical compound CCOP(=S)(OCC)SCN1N=C(OC(C)C)SC1=O LQHMZSQJOYPNND-UHFFFAOYSA-N 0.000 description 4
- GDTZUQIYUMGJRT-UHFFFAOYSA-N Amidithion Chemical compound COCCNC(=O)CSP(=S)(OC)OC GDTZUQIYUMGJRT-UHFFFAOYSA-N 0.000 description 4
- 241000235349 Ascomycota Species 0.000 description 4
- 241000228215 Aspergillus aculeatus Species 0.000 description 4
- 241001513093 Aspergillus awamori Species 0.000 description 4
- 241001225321 Aspergillus fumigatus Species 0.000 description 4
- 241001480052 Aspergillus japonicus Species 0.000 description 4
- 241000193752 Bacillus circulans Species 0.000 description 4
- 241000193749 Bacillus coagulans Species 0.000 description 4
- 241000193747 Bacillus firmus Species 0.000 description 4
- 241000194107 Bacillus megaterium Species 0.000 description 4
- 241000194103 Bacillus pumilus Species 0.000 description 4
- 244000063299 Bacillus subtilis Species 0.000 description 4
- 235000014469 Bacillus subtilis Nutrition 0.000 description 4
- 241000193388 Bacillus thuringiensis Species 0.000 description 4
- 241000193764 Brevibacillus brevis Species 0.000 description 4
- VEDTXTNSFWUXGQ-UHFFFAOYSA-N Carbophenothion Chemical compound CCOP(=S)(OCC)SCSC1=CC=C(Cl)C=C1 VEDTXTNSFWUXGQ-UHFFFAOYSA-N 0.000 description 4
- 108010059892 Cellulase Proteins 0.000 description 4
- 241000123346 Chrysosporium Species 0.000 description 4
- 229920000742 Cotton Polymers 0.000 description 4
- TWDJIKFUVRYBJF-UHFFFAOYSA-N Cyanthoate Chemical compound CCOP(=O)(OCC)SCC(=O)NC(C)(C)C#N TWDJIKFUVRYBJF-UHFFFAOYSA-N 0.000 description 4
- YCAGGFXSFQFVQL-UHFFFAOYSA-N Endothion Chemical compound COC1=COC(CSP(=O)(OC)OC)=CC1=O YCAGGFXSFQFVQL-UHFFFAOYSA-N 0.000 description 4
- 108010062466 Enzyme Precursors Proteins 0.000 description 4
- 102000010911 Enzyme Precursors Human genes 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- DICRHEJCQXFJBY-UHFFFAOYSA-N Ethoate-methyl Chemical group CCNC(=O)CSP(=S)(OC)OC DICRHEJCQXFJBY-UHFFFAOYSA-N 0.000 description 4
- AIKKULXCBHRFOS-UHFFFAOYSA-N Formothion Chemical compound COP(=S)(OC)SCC(=O)N(C)C=O AIKKULXCBHRFOS-UHFFFAOYSA-N 0.000 description 4
- 241000567163 Fusarium cerealis Species 0.000 description 4
- 241000223195 Fusarium graminearum Species 0.000 description 4
- 241000146406 Fusarium heterosporum Species 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 241000223198 Humicola Species 0.000 description 4
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 4
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 4
- 239000005949 Malathion Substances 0.000 description 4
- 241000238413 Octopus Species 0.000 description 4
- JAYZFNIOOYPIAH-UHFFFAOYSA-N Oxydeprofos Chemical compound CCS(=O)CC(C)SP(=O)(OC)OC JAYZFNIOOYPIAH-UHFFFAOYSA-N 0.000 description 4
- UPUGLJYNCXXUQV-UHFFFAOYSA-N Oxydisulfoton Chemical compound CCOP(=S)(OCC)SCCS(=O)CC UPUGLJYNCXXUQV-UHFFFAOYSA-N 0.000 description 4
- 241000194109 Paenibacillus lautus Species 0.000 description 4
- GGNLTHFTYNDYNK-UHFFFAOYSA-N Phenkapton Chemical compound CCOP(=S)(OCC)SCSC1=CC(Cl)=CC=C1Cl GGNLTHFTYNDYNK-UHFFFAOYSA-N 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 4
- QTXHFDHVLBDJIO-UHFFFAOYSA-N Prothoate Chemical compound CCOP(=S)(OCC)SCC(=O)NC(C)C QTXHFDHVLBDJIO-UHFFFAOYSA-N 0.000 description 4
- 241000190932 Rhodopseudomonas Species 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 241000194048 Streptococcus equi Species 0.000 description 4
- 108010048241 acetamidase Proteins 0.000 description 4
- 229940091771 aspergillus fumigatus Drugs 0.000 description 4
- RQVGAIADHNPSME-UHFFFAOYSA-N azinphos-ethyl Chemical group C1=CC=C2C(=O)N(CSP(=S)(OCC)OCC)N=NC2=C1 RQVGAIADHNPSME-UHFFFAOYSA-N 0.000 description 4
- CJJOSEISRRTUQB-UHFFFAOYSA-N azinphos-methyl Chemical compound C1=CC=C2C(=O)N(CSP(=S)(OC)OC)N=NC2=C1 CJJOSEISRRTUQB-UHFFFAOYSA-N 0.000 description 4
- 229940054340 bacillus coagulans Drugs 0.000 description 4
- 229940005348 bacillus firmus Drugs 0.000 description 4
- 229940097012 bacillus thuringiensis Drugs 0.000 description 4
- 239000002585 base Substances 0.000 description 4
- 229950006402 benoxafos Drugs 0.000 description 4
- 239000012620 biological material Substances 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- JXSJBGJIGXNWCI-UHFFFAOYSA-N diethyl 2-[(dimethoxyphosphorothioyl)thio]succinate Chemical compound CCOC(=O)CC(SP(=S)(OC)OC)C(=O)OCC JXSJBGJIGXNWCI-UHFFFAOYSA-N 0.000 description 4
- MCWXGJITAZMZEV-UHFFFAOYSA-N dimethoate Chemical compound CNC(=O)CSP(=S)(OC)OC MCWXGJITAZMZEV-UHFFFAOYSA-N 0.000 description 4
- DOFZAZXDOSGAJZ-UHFFFAOYSA-N disulfoton Chemical compound CCOP(=S)(OCC)SCCSCC DOFZAZXDOSGAJZ-UHFFFAOYSA-N 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 229960000453 malathion Drugs 0.000 description 4
- NNKVPIKMPCQWCG-UHFFFAOYSA-N methamidophos Chemical compound COP(N)(=O)SC NNKVPIKMPCQWCG-UHFFFAOYSA-N 0.000 description 4
- 244000005700 microbiome Species 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- PZXOQEXFMJCDPG-UHFFFAOYSA-N omethoate Chemical compound CNC(=O)CSP(=O)(OC)OC PZXOQEXFMJCDPG-UHFFFAOYSA-N 0.000 description 4
- LCCNCVORNKJIRZ-UHFFFAOYSA-N parathion Chemical compound CCOP(=S)(OCC)OC1=CC=C([N+]([O-])=O)C=C1 LCCNCVORNKJIRZ-UHFFFAOYSA-N 0.000 description 4
- 235000012736 patent blue V Nutrition 0.000 description 4
- BULVZWIRKLYCBC-UHFFFAOYSA-N phorate Chemical compound CCOP(=S)(OCC)SCSCC BULVZWIRKLYCBC-UHFFFAOYSA-N 0.000 description 4
- IOUNQDKNJZEDEP-UHFFFAOYSA-N phosalone Chemical compound C1=C(Cl)C=C2OC(=O)N(CSP(=S)(OCC)OCC)C2=C1 IOUNQDKNJZEDEP-UHFFFAOYSA-N 0.000 description 4
- LMNZTLDVJIUSHT-UHFFFAOYSA-N phosmet Chemical compound C1=CC=C2C(=O)N(CSP(=S)(OC)OC)C(=O)C2=C1 LMNZTLDVJIUSHT-UHFFFAOYSA-N 0.000 description 4
- 231100000614 poison Toxicity 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- OPASCBHCTNRLRM-UHFFFAOYSA-N thiometon Chemical compound CCSCCSP(=S)(OC)OC OPASCBHCTNRLRM-UHFFFAOYSA-N 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- LESVOLZBIFDZGS-UHFFFAOYSA-N vamidothion Chemical compound CNC(=O)C(C)SCCSP(=O)(OC)OC LESVOLZBIFDZGS-UHFFFAOYSA-N 0.000 description 4
- 239000002023 wood Substances 0.000 description 4
- DSSYKIVIOFKYAU-XCBNKYQSSA-N (R)-camphor Chemical compound C1C[C@@]2(C)C(=O)C[C@@H]1C2(C)C DSSYKIVIOFKYAU-XCBNKYQSSA-N 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 3
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- 241000222518 Agaricus Species 0.000 description 3
- 102100034044 All-trans-retinol dehydrogenase [NAD(+)] ADH1B Human genes 0.000 description 3
- 101710193111 All-trans-retinol dehydrogenase [NAD(+)] ADH4 Proteins 0.000 description 3
- 241000223651 Aureobasidium Species 0.000 description 3
- 241001112741 Bacillaceae Species 0.000 description 3
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 3
- 101000898643 Candida albicans Vacuolar aspartic protease Proteins 0.000 description 3
- 101000898783 Candida tropicalis Candidapepsin Proteins 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- 241000238366 Cephalopoda Species 0.000 description 3
- 241000222511 Coprinus Species 0.000 description 3
- 101000898784 Cryphonectria parasitica Endothiapepsin Proteins 0.000 description 3
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- 241000006384 Jeotgalibacillus marinus Species 0.000 description 3
- 241000235649 Kluyveromyces Species 0.000 description 3
- 125000000570 L-alpha-aspartyl group Chemical group [H]OC(=O)C([H])([H])[C@]([H])(N([H])[H])C(*)=O 0.000 description 3
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 3
- 102100024295 Maltase-glucoamylase Human genes 0.000 description 3
- 241000226677 Myceliophthora Species 0.000 description 3
- 241000221960 Neurospora Species 0.000 description 3
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 3
- 241000233654 Oomycetes Species 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 241001236817 Paecilomyces <Clavicipitaceae> Species 0.000 description 3
- 241000228143 Penicillium Species 0.000 description 3
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 3
- 101000933133 Rhizopus niveus Rhizopuspepsin-1 Proteins 0.000 description 3
- 101000910082 Rhizopus niveus Rhizopuspepsin-2 Proteins 0.000 description 3
- 101000910079 Rhizopus niveus Rhizopuspepsin-3 Proteins 0.000 description 3
- 101000910086 Rhizopus niveus Rhizopuspepsin-4 Proteins 0.000 description 3
- 101000910088 Rhizopus niveus Rhizopuspepsin-5 Proteins 0.000 description 3
- 101000898773 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Saccharopepsin Proteins 0.000 description 3
- 241000222480 Schizophyllum Species 0.000 description 3
- 241000235346 Schizosaccharomyces Species 0.000 description 3
- GRXKLBBBQUKJJZ-UHFFFAOYSA-N Soman Chemical compound CC(C)(C)C(C)OP(C)(F)=O GRXKLBBBQUKJJZ-UHFFFAOYSA-N 0.000 description 3
- 241000187432 Streptomyces coelicolor Species 0.000 description 3
- 108700005078 Synthetic Genes Proteins 0.000 description 3
- 241000228341 Talaromyces Species 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 3
- 102100039662 Xaa-Pro dipeptidase Human genes 0.000 description 3
- 241000607479 Yersinia pestis Species 0.000 description 3
- 150000008065 acid anhydrides Chemical class 0.000 description 3
- 108010028144 alpha-Glucosidases Proteins 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 229960000846 camphor Drugs 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 229910001385 heavy metal Inorganic materials 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 150000002460 imidazoles Chemical class 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Natural products C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 239000002853 nucleic acid probe Substances 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 3
- DTBNBXWJWCWCIK-UHFFFAOYSA-N phosphoenolpyruvic acid Chemical compound OC(=O)C(=C)OP(O)(O)=O DTBNBXWJWCWCIK-UHFFFAOYSA-N 0.000 description 3
- 229910052698 phosphorus Inorganic materials 0.000 description 3
- 239000011574 phosphorus Substances 0.000 description 3
- 239000002574 poison Substances 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- DLYUQMMRRRQYAE-UHFFFAOYSA-N tetraphosphorus decaoxide Chemical compound O1P(O2)(=O)OP3(=O)OP1(=O)OP2(=O)O3 DLYUQMMRRRQYAE-UHFFFAOYSA-N 0.000 description 3
- 238000010361 transduction Methods 0.000 description 3
- 230000026683 transduction Effects 0.000 description 3
- 230000001810 trypsinlike Effects 0.000 description 3
- KPNPDRFFWQBXGT-UHFFFAOYSA-N 1-dimethoxyphosphorylsulfanyl-2-ethylsulfanylethane;2-ethylsulfanylethoxy-dimethoxy-sulfanylidene-$l^{5}-phosphane Chemical compound CCSCCOP(=S)(OC)OC.CCSCCSP(=O)(OC)OC KPNPDRFFWQBXGT-UHFFFAOYSA-N 0.000 description 2
- 240000000073 Achillea millefolium Species 0.000 description 2
- 235000007754 Achillea millefolium Nutrition 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 2
- 241000220433 Albizia Species 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 241000223600 Alternaria Species 0.000 description 2
- 101100163849 Arabidopsis thaliana ARS1 gene Proteins 0.000 description 2
- 241000892910 Aspergillus foetidus Species 0.000 description 2
- 241000228245 Aspergillus niger Species 0.000 description 2
- 101900318521 Aspergillus oryzae Triosephosphate isomerase Proteins 0.000 description 2
- 108090001008 Avidin Proteins 0.000 description 2
- 108090000145 Bacillolysin Proteins 0.000 description 2
- 241001328122 Bacillus clausii Species 0.000 description 2
- 241000221198 Basidiomycota Species 0.000 description 2
- 101100494262 Caenorhabditis elegans best-12 gene Proteins 0.000 description 2
- 108010008885 Cellulose 1,4-beta-Cellobiosidase Proteins 0.000 description 2
- 229920002101 Chitin Polymers 0.000 description 2
- 108010022172 Chitinases Proteins 0.000 description 2
- 102000012286 Chitinases Human genes 0.000 description 2
- 229920001661 Chitosan Polymers 0.000 description 2
- 241000985909 Chrysosporium keratinophilum Species 0.000 description 2
- 241001674001 Chrysosporium tropicum Species 0.000 description 2
- 241000233652 Chytridiomycota Species 0.000 description 2
- 241000235457 Chytridium Species 0.000 description 2
- 241000193403 Clostridium Species 0.000 description 2
- 241000222356 Coriolus Species 0.000 description 2
- GRPRVIYRYGLIJU-UHFFFAOYSA-N Demeton-S Chemical compound CCOP(=O)(OCC)SCCSCC GRPRVIYRYGLIJU-UHFFFAOYSA-N 0.000 description 2
- PZIRJMYRYORVIT-UHFFFAOYSA-N Demeton-S-methylsulphon Chemical compound CCS(=O)(=O)CCSP(=O)(OC)OC PZIRJMYRYORVIT-UHFFFAOYSA-N 0.000 description 2
- MUMQYXACQUZOFP-UHFFFAOYSA-N Dialifor Chemical compound C1=CC=C2C(=O)N(C(CCl)SP(=S)(OCC)OCC)C(=O)C2=C1 MUMQYXACQUZOFP-UHFFFAOYSA-N 0.000 description 2
- 239000005947 Dimethoate Substances 0.000 description 2
- VBKKVDGJXVOLNE-UHFFFAOYSA-N Dioxation Chemical compound CCOP(=S)(OCC)SC1OCCOC1SP(=S)(OCC)OCC VBKKVDGJXVOLNE-UHFFFAOYSA-N 0.000 description 2
- 241000935926 Diplodia Species 0.000 description 2
- 241001063191 Elops affinis Species 0.000 description 2
- 101710132690 Endo-1,4-beta-xylanase A Proteins 0.000 description 2
- 235000002756 Erythrina berteroana Nutrition 0.000 description 2
- 241000221433 Exidia Species 0.000 description 2
- 241000285023 Formosa Species 0.000 description 2
- 241000145614 Fusarium bactridioides Species 0.000 description 2
- 241000223194 Fusarium culmorum Species 0.000 description 2
- 241000223221 Fusarium oxysporum Species 0.000 description 2
- 241001112697 Fusarium reticulatum Species 0.000 description 2
- 241001014439 Fusarium sarcochroum Species 0.000 description 2
- 241001465753 Fusarium torulosum Species 0.000 description 2
- 241000567178 Fusarium venenatum Species 0.000 description 2
- 102000048120 Galactokinases Human genes 0.000 description 2
- 108700023157 Galactokinases Proteins 0.000 description 2
- 241000626621 Geobacillus Species 0.000 description 2
- 101100080316 Geobacillus stearothermophilus nprT gene Proteins 0.000 description 2
- 241000589989 Helicobacter Species 0.000 description 2
- 241001480714 Humicola insolens Species 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- 125000003440 L-leucyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C(C([H])([H])[H])([H])C([H])([H])[H] 0.000 description 2
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 2
- HXEACLLIILLPRG-YFKPBYRVSA-N L-pipecolic acid Chemical compound [O-]C(=O)[C@@H]1CCCC[NH2+]1 HXEACLLIILLPRG-YFKPBYRVSA-N 0.000 description 2
- 125000002842 L-seryl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])O[H] 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- 241001344131 Magnaporthe grisea Species 0.000 description 2
- 108090000157 Metallothionein Proteins 0.000 description 2
- XUYPXLNMDZIRQH-LURJTMIESA-N N-acetyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC(C)=O XUYPXLNMDZIRQH-LURJTMIESA-N 0.000 description 2
- 241000588653 Neisseria Species 0.000 description 2
- 102000035092 Neutral proteases Human genes 0.000 description 2
- 108091005507 Neutral proteases Proteins 0.000 description 2
- 108090000913 Nitrate Reductases Proteins 0.000 description 2
- 241001072230 Oceanobacillus Species 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 241000123526 Peziza Species 0.000 description 2
- 241000222385 Phanerochaete Species 0.000 description 2
- 239000005921 Phosmet Substances 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 241000222350 Pleurotus Species 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 241000235402 Rhizomucor Species 0.000 description 2
- 241000235403 Rhizomucor miehei Species 0.000 description 2
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 2
- 235000001006 Saccharomyces cerevisiae var diastaticus Nutrition 0.000 description 2
- 244000206963 Saccharomyces cerevisiae var. diastaticus Species 0.000 description 2
- 241001123227 Saccharomyces pastorianus Species 0.000 description 2
- 241000235343 Saccharomycetales Species 0.000 description 2
- 101100097319 Schizosaccharomyces pombe (strain 972 / ATCC 24843) ala1 gene Proteins 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 241000187391 Streptomyces hygroscopicus Species 0.000 description 2
- 108090000787 Subtilisin Proteins 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- 239000005864 Sulphur Substances 0.000 description 2
- 241001136494 Talaromyces funiculosus Species 0.000 description 2
- 241001540751 Talaromyces ruber Species 0.000 description 2
- 241000228178 Thermoascus Species 0.000 description 2
- 241000222354 Trametes Species 0.000 description 2
- 241000223260 Trichoderma harzianum Species 0.000 description 2
- 241000378866 Trichoderma koningii Species 0.000 description 2
- 241000223262 Trichoderma longibrachiatum Species 0.000 description 2
- 241000223261 Trichoderma viride Species 0.000 description 2
- 102000005924 Triose-Phosphate Isomerase Human genes 0.000 description 2
- 108700015934 Triose-phosphate isomerases Proteins 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- MNLAVFKVRUQAKW-UHFFFAOYSA-N VR nerve agent Chemical compound CCN(CC)CCSP(C)(=O)OCC(C)C MNLAVFKVRUQAKW-UHFFFAOYSA-N 0.000 description 2
- 241000082085 Verticillium <Phyllachorales> Species 0.000 description 2
- 241001523965 Xylaria Species 0.000 description 2
- 241000758405 Zoopagomycotina Species 0.000 description 2
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 2
- 108010047754 beta-Glucosidase Proteins 0.000 description 2
- 102000006995 beta-Glucosidase Human genes 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- HKPHPIREJKHECO-UHFFFAOYSA-N butachlor Chemical compound CCCCOCN(C(=O)CCl)C1=C(CC)C=CC=C1CC HKPHPIREJKHECO-UHFFFAOYSA-N 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- DSSYKIVIOFKYAU-UHFFFAOYSA-N camphor Chemical compound C1CC2(C)C(=O)CC1C2(C)C DSSYKIVIOFKYAU-UHFFFAOYSA-N 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 229940106157 cellulase Drugs 0.000 description 2
- 235000013339 cereals Nutrition 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000005695 dehalogenation reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000002050 diffraction method Methods 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 238000001952 enzyme assay Methods 0.000 description 2
- 235000020776 essential amino acid Nutrition 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 210000004209 hair Anatomy 0.000 description 2
- 239000004009 herbicide Substances 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 239000002917 insecticide Substances 0.000 description 2
- HXEACLLIILLPRG-RXMQYKEDSA-N l-pipecolic acid Natural products OC(=O)[C@H]1CCCCN1 HXEACLLIILLPRG-RXMQYKEDSA-N 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- KLGMSAOQDHLCOS-UHFFFAOYSA-N mecarbam Chemical compound CCOC(=O)N(C)C(=O)CSP(=S)(OCC)OCC KLGMSAOQDHLCOS-UHFFFAOYSA-N 0.000 description 2
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 2
- 229960000485 methotrexate Drugs 0.000 description 2
- 229940031815 mycocide Drugs 0.000 description 2
- 210000005036 nerve Anatomy 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 238000005222 photoaffinity labeling Methods 0.000 description 2
- 229920002704 polyhistidine Polymers 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108010066823 proline dipeptidase Proteins 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 239000003128 rodenticide Substances 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 230000003248 secreting effect Effects 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000003053 toxin Substances 0.000 description 2
- 231100000765 toxin Toxicity 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- YQMUORJJDBQCOV-UHFFFAOYSA-N $l^{1}-phosphanylmethane Chemical compound [P]C YQMUORJJDBQCOV-UHFFFAOYSA-N 0.000 description 1
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 1
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- JQFLYFRHDIHZFZ-RXMQYKEDSA-N (2s)-3,3-dimethylpyrrolidine-2-carboxylic acid Chemical compound CC1(C)CCN[C@@H]1C(O)=O JQFLYFRHDIHZFZ-RXMQYKEDSA-N 0.000 description 1
- CNPSFBUUYIVHAP-AKGZTFGVSA-N (2s)-3-methylpyrrolidine-2-carboxylic acid Chemical compound CC1CCN[C@@H]1C(O)=O CNPSFBUUYIVHAP-AKGZTFGVSA-N 0.000 description 1
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 1
- VOYXMQFJDIVEQN-UHFFFAOYSA-N 1,3-thiazolidine-2-carboxylic acid Chemical compound S1C(NCC1)C(=O)O.S1C(NCC1)C(=O)O VOYXMQFJDIVEQN-UHFFFAOYSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- ZFFMLCVRJBZUDZ-UHFFFAOYSA-N 2,3-dimethylbutane Chemical group CC(C)C(C)C ZFFMLCVRJBZUDZ-UHFFFAOYSA-N 0.000 description 1
- OMGHIGVFLOPEHJ-UHFFFAOYSA-N 2,5-dihydro-1h-pyrrol-1-ium-2-carboxylate Chemical compound OC(=O)C1NCC=C1 OMGHIGVFLOPEHJ-UHFFFAOYSA-N 0.000 description 1
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical compound CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 description 1
- CDUUKBXTEOFITR-BYPYZUCNSA-N 2-methyl-L-serine Chemical compound OC[C@@]([NH3+])(C)C([O-])=O CDUUKBXTEOFITR-BYPYZUCNSA-N 0.000 description 1
- 101710163881 5,6-dihydroxyindole-2-carboxylic acid oxidase Proteins 0.000 description 1
- 108010011619 6-Phytase Proteins 0.000 description 1
- FRXSZNDVFUDTIR-UHFFFAOYSA-N 6-methoxy-1,2,3,4-tetrahydroquinoline Chemical compound N1CCCC2=CC(OC)=CC=C21 FRXSZNDVFUDTIR-UHFFFAOYSA-N 0.000 description 1
- 101150008391 A1 gene Proteins 0.000 description 1
- 101150104118 ANS1 gene Proteins 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 1
- 101100510736 Actinidia chinensis var. chinensis LDOX gene Proteins 0.000 description 1
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 102000004400 Aminopeptidases Human genes 0.000 description 1
- 108090000915 Aminopeptidases Proteins 0.000 description 1
- 108010065511 Amylases Proteins 0.000 description 1
- 241000534414 Anotopterus nikparini Species 0.000 description 1
- 108010037870 Anthranilate Synthase Proteins 0.000 description 1
- 101000961203 Aspergillus awamori Glucoamylase Proteins 0.000 description 1
- 101900127796 Aspergillus oryzae Glucoamylase Proteins 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 101000775727 Bacillus amyloliquefaciens Alpha-amylase Proteins 0.000 description 1
- 101000695691 Bacillus licheniformis Beta-lactamase Proteins 0.000 description 1
- 108010029675 Bacillus licheniformis alpha-amylase Proteins 0.000 description 1
- 102100030981 Beta-alanine-activating enzyme Human genes 0.000 description 1
- 241000222490 Bjerkandera Species 0.000 description 1
- 102000021944 Butyrylcholinesterase Human genes 0.000 description 1
- 108010053652 Butyrylcholinesterase Proteins 0.000 description 1
- 101100327917 Caenorhabditis elegans chup-1 gene Proteins 0.000 description 1
- 108090000489 Carboxy-Lyases Proteins 0.000 description 1
- 102000005367 Carboxypeptidases Human genes 0.000 description 1
- 108010006303 Carboxypeptidases Proteins 0.000 description 1
- 108010031396 Catechol oxidase Proteins 0.000 description 1
- 102000030523 Catechol oxidase Human genes 0.000 description 1
- 108010084185 Cellulases Proteins 0.000 description 1
- 102000005575 Cellulases Human genes 0.000 description 1
- 102100037633 Centrin-3 Human genes 0.000 description 1
- 241000146399 Ceriporiopsis Species 0.000 description 1
- 241000259840 Chaetomidium Species 0.000 description 1
- 241001057137 Chaetomium fimeti Species 0.000 description 1
- 208000036086 Chromosome Duplication Diseases 0.000 description 1
- 241001674013 Chrysosporium lucknowense Species 0.000 description 1
- 241001556045 Chrysosporium merdarium Species 0.000 description 1
- 241000080524 Chrysosporium queenslandicum Species 0.000 description 1
- 241000355696 Chrysosporium zonatum Species 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 241000221760 Claviceps Species 0.000 description 1
- 241000228437 Cochliobolus Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 241001085790 Coprinopsis Species 0.000 description 1
- 241001509964 Coptotermes Species 0.000 description 1
- 241001252397 Corynascus Species 0.000 description 1
- 241001362614 Crassa Species 0.000 description 1
- 241000221755 Cryphonectria Species 0.000 description 1
- 241001559589 Cullen Species 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 101100342470 Dictyostelium discoideum pkbA gene Proteins 0.000 description 1
- 108010016626 Dipeptides Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 108010000912 Egg Proteins Proteins 0.000 description 1
- 102000002322 Egg Proteins Human genes 0.000 description 1
- 241000223924 Eimeria Species 0.000 description 1
- 108010013369 Enteropeptidase Proteins 0.000 description 1
- 102100029727 Enteropeptidase Human genes 0.000 description 1
- 101100385973 Escherichia coli (strain K12) cycA gene Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108010074860 Factor Xa Proteins 0.000 description 1
- 238000005033 Fourier transform infrared spectroscopy Methods 0.000 description 1
- 241000223192 Fusarium sporotrichioides Species 0.000 description 1
- 101150108358 GLAA gene Proteins 0.000 description 1
- 241000726221 Gemma Species 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 101100001650 Geobacillus stearothermophilus amyM gene Proteins 0.000 description 1
- 101100369308 Geobacillus stearothermophilus nprS gene Proteins 0.000 description 1
- 101000892220 Geobacillus thermodenitrificans (strain NG80-2) Long-chain-alcohol dehydrogenase 1 Proteins 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- LPBWRHRHEIYAIP-KKUMJFAQSA-N His-Tyr-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LPBWRHRHEIYAIP-KKUMJFAQSA-N 0.000 description 1
- ZHMZWSFQRUGLEC-JYJNAYRXSA-N His-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZHMZWSFQRUGLEC-JYJNAYRXSA-N 0.000 description 1
- 241001497663 Holomastigotoides Species 0.000 description 1
- 101000780443 Homo sapiens Alcohol dehydrogenase 1A Proteins 0.000 description 1
- 101000773364 Homo sapiens Beta-alanine-activating enzyme Proteins 0.000 description 1
- 101000880522 Homo sapiens Centrin-3 Proteins 0.000 description 1
- 241000223199 Humicola grisea Species 0.000 description 1
- 102000004867 Hydro-Lyases Human genes 0.000 description 1
- 108090001042 Hydro-Lyases Proteins 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 241000411968 Ilyobacter Species 0.000 description 1
- 241000222342 Irpex Species 0.000 description 1
- 241000222344 Irpex lacteus Species 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- 125000001176 L-lysyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C([H])([H])C([H])([H])C(N([H])[H])([H])[H] 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 125000000769 L-threonyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])[C@](O[H])(C([H])([H])[H])[H] 0.000 description 1
- KKJQZEWNZXRJFG-UHFFFAOYSA-N L-trans-4-Methyl-2-pyrrolidinecarboxylic acid Chemical compound CC1CNC(C(O)=O)C1 KKJQZEWNZXRJFG-UHFFFAOYSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 125000003798 L-tyrosyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C1=C([H])C([H])=C(O[H])C([H])=C1[H] 0.000 description 1
- 125000003580 L-valyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(C([H])([H])[H])(C([H])([H])[H])[H] 0.000 description 1
- 108010029541 Laccase Proteins 0.000 description 1
- 241000235087 Lachancea kluyveri Species 0.000 description 1
- 241000222435 Lentinula Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- 241000238428 Loligo vulgaris Species 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 1
- 101150068888 MET3 gene Proteins 0.000 description 1
- 241001344133 Magnaporthe Species 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 108010054377 Mannosidases Proteins 0.000 description 1
- 102000001696 Mannosidases Human genes 0.000 description 1
- 241000183011 Melanocarpus Species 0.000 description 1
- 241001184659 Melanocarpus albomyces Species 0.000 description 1
- 241000123315 Meripilus Species 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 229920002274 Nalgene Polymers 0.000 description 1
- 240000002853 Nelumbo nucifera Species 0.000 description 1
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 1
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 1
- 241000233892 Neocallimastix Species 0.000 description 1
- 241000221961 Neurospora crassa Species 0.000 description 1
- 101100022915 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cys-11 gene Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 description 1
- 101710198224 Ornithine carbamoyltransferase, mitochondrial Proteins 0.000 description 1
- 102100037214 Orotidine 5'-phosphate decarboxylase Human genes 0.000 description 1
- 108010055012 Orotidine-5'-phosphate decarboxylase Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 241000222393 Phanerochaete chrysosporium Species 0.000 description 1
- 241000222395 Phlebia Species 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- 241000235379 Piromyces Species 0.000 description 1
- 241001451060 Poitrasia Species 0.000 description 1
- 241000276498 Pollachius virens Species 0.000 description 1
- 241000768494 Polymorphum Species 0.000 description 1
- 241000222640 Polyporus Species 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 241000383860 Pseudoplectania Species 0.000 description 1
- 241001497658 Pseudotrichonympha Species 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 101900354623 Saccharomyces cerevisiae Galactokinase Proteins 0.000 description 1
- 101001076706 Saccharomyces cerevisiae Invertase 1 Proteins 0.000 description 1
- 101001053411 Saccharomyces cerevisiae Invertase 3 Proteins 0.000 description 1
- 101001053412 Saccharomyces cerevisiae Invertase 4 Proteins 0.000 description 1
- 101001053409 Saccharomyces cerevisiae Invertase 5 Proteins 0.000 description 1
- 101001053400 Saccharomyces cerevisiae Invertase 7 Proteins 0.000 description 1
- 101900084120 Saccharomyces cerevisiae Triosephosphate isomerase Proteins 0.000 description 1
- 241000204893 Saccharomyces douglasii Species 0.000 description 1
- 241001407717 Saccharomyces norbensis Species 0.000 description 1
- 101100022918 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sua1 gene Proteins 0.000 description 1
- 241000223255 Scytalidium Species 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- 241000238371 Sepiidae Species 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 241000120569 Streptococcus equi subsp. zooepidemicus Species 0.000 description 1
- 101100309436 Streptococcus mutans serotype c (strain ATCC 700610 / UA159) ftf gene Proteins 0.000 description 1
- 241000958303 Streptomyces achromogenes Species 0.000 description 1
- 241001468227 Streptomyces avermitilis Species 0.000 description 1
- 101100370749 Streptomyces coelicolor (strain ATCC BAA-471 / A3(2) / M145) trpC1 gene Proteins 0.000 description 1
- 241000187398 Streptomyces lividans Species 0.000 description 1
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 1
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 1
- 102000004523 Sulfate Adenylyltransferase Human genes 0.000 description 1
- 108010022348 Sulfate adenylyltransferase Proteins 0.000 description 1
- 241001215623 Talaromyces cellulolyticus Species 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 241000183057 Thielavia microspora Species 0.000 description 1
- 241000182980 Thielavia ovispora Species 0.000 description 1
- 241000183053 Thielavia subthermophila Species 0.000 description 1
- 241001495429 Thielavia terrestris Species 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 241001149964 Tolypocladium Species 0.000 description 1
- 108060008539 Transglutaminase Proteins 0.000 description 1
- 241000215642 Trichophaea Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 239000006035 Tryptophane Substances 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- 229930003756 Vitamin B7 Natural products 0.000 description 1
- 241001507667 Volvariella Species 0.000 description 1
- 101710171640 Xaa-Pro dipeptidase Proteins 0.000 description 1
- GLLRIXZGBQOFLM-UHFFFAOYSA-N Xanthorin Natural products C1=C(C)C=C2C(=O)C3=C(O)C(OC)=CC(O)=C3C(=O)C2=C1O GLLRIXZGBQOFLM-UHFFFAOYSA-N 0.000 description 1
- 241000409279 Xerochrysium dermatitidis Species 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- PJVJTCIRVMBVIA-JTQLQIEISA-N [dimethylamino(ethoxy)phosphoryl]formonitrile Chemical compound CCO[P@@](=O)(C#N)N(C)C PJVJTCIRVMBVIA-JTQLQIEISA-N 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine group Chemical group [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C=NC=2C(N)=NC=NC12 OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 1
- 108010045649 agarase Proteins 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 108090000637 alpha-Amylases Proteins 0.000 description 1
- 108010030291 alpha-Galactosidase Proteins 0.000 description 1
- 102000005840 alpha-Galactosidase Human genes 0.000 description 1
- CDUUKBXTEOFITR-UHFFFAOYSA-N alpha-methylserine Natural products OCC([NH3+])(C)C([O-])=O CDUUKBXTEOFITR-UHFFFAOYSA-N 0.000 description 1
- 101150078331 ama-1 gene Proteins 0.000 description 1
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 1
- KLOHDWPABZXLGI-YWUHCJSESA-M ampicillin sodium Chemical compound [Na+].C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C([O-])=O)(C)C)=CC=CC=C1 KLOHDWPABZXLGI-YWUHCJSESA-M 0.000 description 1
- 238000012197 amplification kit Methods 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 101150009206 aprE gene Proteins 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 210000001367 artery Anatomy 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 238000005844 autocatalytic reaction Methods 0.000 description 1
- QLULGSLAHXLKSR-UHFFFAOYSA-N azane;phosphane Chemical compound N.P QLULGSLAHXLKSR-UHFFFAOYSA-N 0.000 description 1
- 101150103518 bar gene Proteins 0.000 description 1
- 210000003323 beak Anatomy 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 102000005936 beta-Galactosidase Human genes 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000009141 biological interaction Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 108010089934 carbohydrase Proteins 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000034303 cell budding Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 238000011098 chromatofocusing Methods 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000002361 compost Substances 0.000 description 1
- ZYGHJZDHTFUPRJ-UHFFFAOYSA-N coumarin Chemical compound C1=CC=C2OC(=O)C=CC2=C1 ZYGHJZDHTFUPRJ-UHFFFAOYSA-N 0.000 description 1
- 101150005799 dagA gene Proteins 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 125000006202 diisopropylaminoethyl group Chemical group [H]C([H])([H])C([H])(N(C([H])([H])C([H])([H])*)C([H])(C([H])([H])[H])C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000002003 electron diffraction Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 108010091371 endoglucanase 1 Proteins 0.000 description 1
- 108010091384 endoglucanase 2 Proteins 0.000 description 1
- 108010092413 endoglucanase V Proteins 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000028023 exocytosis Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 210000003495 flagella Anatomy 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- XQGIZQWEZVJRDD-UHFFFAOYSA-N fluoro(methyl)phosphinic acid Chemical compound CP(O)(F)=O XQGIZQWEZVJRDD-UHFFFAOYSA-N 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 239000010437 gem Substances 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 108010061330 glucan 1,4-alpha-maltohydrolase Proteins 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- 229960002989 glutamic acid Drugs 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N glycerol Substances OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 235000013905 glycine and its sodium salt Nutrition 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 231100001261 hazardous Toxicity 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000000514 hepatopancreas Anatomy 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000009655 industrial fermentation Methods 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 229910017053 inorganic salt Inorganic materials 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000010813 internal standard method Methods 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- QPPQHRDVPBTVEV-UHFFFAOYSA-N isopropyl dihydrogen phosphate Chemical compound CC(C)OP(O)(O)=O QPPQHRDVPBTVEV-UHFFFAOYSA-N 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- GCHPUFAZSONQIV-UHFFFAOYSA-N isovaline Chemical compound CCC(C)(N)C(O)=O GCHPUFAZSONQIV-UHFFFAOYSA-N 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 238000007834 ligase chain reaction Methods 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 230000004879 molecular function Effects 0.000 description 1
- 229940045641 monobasic sodium phosphate Drugs 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- ZZTDUGSQHCSNBD-UHFFFAOYSA-N n-[2-di(propan-2-yloxy)phosphorylsulfanylethyl]-n-propan-2-ylpropan-2-amine Chemical compound CC(C)OP(=O)(OC(C)C)SCCN(C(C)C)C(C)C ZZTDUGSQHCSNBD-UHFFFAOYSA-N 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 239000012299 nitrogen atmosphere Substances 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 101150017837 nprM gene Proteins 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 210000004681 ovum Anatomy 0.000 description 1
- 239000005022 packaging material Substances 0.000 description 1
- 229940049547 paraxin Drugs 0.000 description 1
- 210000003681 parotid gland Anatomy 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 101150019841 penP gene Proteins 0.000 description 1
- 235000020030 perry Nutrition 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 150000003009 phosphonic acids Chemical class 0.000 description 1
- VSAISIQCTGDGPU-UHFFFAOYSA-N phosphorus trioxide Inorganic materials O1P(O2)OP3OP1OP2O3 VSAISIQCTGDGPU-UHFFFAOYSA-N 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 229940085127 phytase Drugs 0.000 description 1
- 230000007096 poisonous effect Effects 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000036316 preload Effects 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 101150108007 prs gene Proteins 0.000 description 1
- 101150086435 prs1 gene Proteins 0.000 description 1
- 101150070305 prsA gene Proteins 0.000 description 1
- 101150054232 pyrG gene Proteins 0.000 description 1
- 230000036632 reaction speed Effects 0.000 description 1
- 230000033458 reproduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 101150025220 sacB gene Proteins 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000012807 shake-flask culturing Methods 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- PNGLEYLFMHGIQO-UHFFFAOYSA-M sodium;3-(n-ethyl-3-methoxyanilino)-2-hydroxypropane-1-sulfonate;dihydrate Chemical compound O.O.[Na+].[O-]S(=O)(=O)CC(O)CN(CC)C1=CC=CC(OC)=C1 PNGLEYLFMHGIQO-UHFFFAOYSA-M 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000010563 solid-state fermentation Methods 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 230000001839 systemic circulation Effects 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- OFVLGDICTFRJMM-WESIUVDSSA-N tetracycline Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(O)=C(C(N)=O)C(=O)[C@@]4(O)C(O)=C3C(=O)C2=C1O OFVLGDICTFRJMM-WESIUVDSSA-N 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 102000003601 transglutaminase Human genes 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 229910000406 trisodium phosphate Inorganic materials 0.000 description 1
- 235000019801 trisodium phosphate Nutrition 0.000 description 1
- 101150016309 trpC gene Proteins 0.000 description 1
- 108010060175 trypsinogen activation peptide Proteins 0.000 description 1
- 229960004799 tryptophan Drugs 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 235000011912 vitamin B7 Nutrition 0.000 description 1
- 239000011735 vitamin B7 Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 210000002268 wool Anatomy 0.000 description 1
- 101150052264 xylA gene Proteins 0.000 description 1
- 101150110790 xylB gene Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明涉及具有有机磷水解酶活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及用于产生和使用所述多肽的方法。
Description
涉及序列表
本申请包含计算机可读形式的序列表。该计算机可读形式的序列表通过提述并入本文。
涉及生物材料的保藏
本申请包含对于生物材料保藏的提及,所述保藏通过提述并入本文。关于完整的信息,参见说明书最后一段。
技术领域
本发明涉及具有有机磷水解酶活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及产生和使用所述多肽的方法。
背景技术
本领域已知有机磷化合物。具体而言,已知一些战争药剂(warfare agent)为有机磷化合物如沙林(Sarin)、环沙林(Cyclosarin)和梭曼/索曼(Soman)。其他有机磷化合物作为农药为人所知。
需要能够使被上述有机磷化合物污染的区域去污染。已提出将具有有机磷水解酶活性如二异丙基氟磷酸酶(diisopropylfluorophosphatase)活性的多肽用于此目的,因为此种多肽能够水解有害的有机磷化合物并由此将其转化为有害性较低的产物。
在WO99/43791中,公开了来自鱿鱼(Loligo Vulgaris)的二异丙基氟磷酸酶,且亦描述了其用于去污染的潜在用途以及其他应用。
本发明的目标是提供具有有机磷水解酶例如二异丙基氟磷酸酶活性的多肽和编码所述多肽的多核苷酸,特别是具有高稳定性和/或高比活性的。
发明概述
本发明涉及具有有机磷水解酶活性的分离的多肽,所述多肽选自下组:
(a)包含氨基酸序列的多肽,所述氨基酸序列与SEQ ID NO:2的成熟多肽具有至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%,和甚至最优选至少95%的同一性;
(b)由多核苷酸编码的多肽,所述多核苷酸在至少中-高严格条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的DNA序列,或(iii)(i)或(ii)的全长互补链;
(c)由多核苷酸编码的多肽,所述多核苷酸包含与SEQ ID NO:1的成熟多肽编码序列具有至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,更优选至少90%,更优选至少95%,更优选至少96%,甚至更优选至少97%,最优选至少98%,且甚至最优选99%同一性的核苷酸序列;
(d)SEQ ID NO:2的成熟多肽的包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。
本发明还涉及编码具有有机磷水解酶活性的多肽的分离的多核苷酸,所述多核苷酸选自下组:
(a)编码包含氨基酸序列的多肽的多核苷酸,所述氨基酸序列与SEQ IDNO:2的成熟多肽具有至少75%同一性;
(b)多核苷酸,其在至少中严格条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的DNA序列,或(iii)(i)或(ii)的互补链;
(c)多核苷酸,其包含与SEQ ID NO:1的成熟多肽编码序列具有至少65%同一性的核苷酸序列;和
(d)多核苷酸,其编码SEQ ID NO:2的成熟多肽的包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。
本发明还涉及包含所述多核苷酸的核酸构建体、重组表达载体、重组宿主细胞,和产生具有有机磷水解酶活性的多肽的方法
本发明还涉及去污染的方法,例如,通过降解有机磷化合物。
具体而言,本发明涉及通过将本发明的有机磷水解酶施于经一种或多种有害的或不希望的有机磷化合物污染的区域或装置来对所述区域或装置去污染的方法。
本发明还涉及包含编码此种具有有机磷水解酶活性的多肽的分离的多核苷酸的植物。
本发明还涉及产生此种具有有机磷水解酶活性的多肽的方法,包括:(a)在有助于产生该多肽的条件下培养包含编码此种具有有机磷水解酶活性的多肽的多核苷酸的转基因植物或植物细胞;和(b)回收所述多肽。
附图简述
图1显示了NN059107的构建图(restruction map)。
定义:
术语“有机磷水解酶”在本文中定义为针对有机磷化合物,特别是有机磷化合物包括神经毒气中的磷酐键(phosphorous anhydride bond)的水解活性。因此该术语包括具有水解酶和/或酯酶活性的酶,例如有机磷水解酶活性(EC3.1.8.1)(如有机磷酸酯酶活性)或有机磷酸酐水解酶(anhydrolase)(OPAA)活性,或羧酯酶活性,二异丙基氟磷酸酶(DFP酶)活性(EC 3.1.8.2),脱卤酶活性,氨酰基脯氨酸二肽酶(prolidase)活性和/或亚胺二肽酶活性。
术语“DFP酶(EC 3.1.8.2)”在本文中定义为二异丙基氟磷酸酶(diisopropylfluorophosphatase)、二烷基氟磷酸酶(dialkylfluorophosphatase)、氟磷酸异丙酯水解酶(diisopropylphosphorofluoridate hydrolase)、异氟磷脱卤酶(diisopropylfluorophosphonate dehalogenase)、二异丙基磷酸氟化酶(diisopropylphosphofluoridase)、异丙基磷酸氟化酶(isopropylphosphorofluoridase)、有机磷酸脱水酶(organophosphate acidanhydrase)、有机磷酸酐水解酶(organophosphorous acid anhydrolase)、索曼酶(somanase)和塔崩酶(tabunase)。DFP酶作用于有机磷化合物(包括神经毒气)中的磷酸酐键(如磷-卤化物和磷-氰化物)。
本发明的多肽的活性如实施例4中“酶活性的测量”所述进行测量。本发明的多肽具有SEQ ID NO:2的成熟多肽的有机磷水解酶活性的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,更优选至少90%,更优选至少95%,更优选至少100%,或甚至更优选高于100%如110%,或120%,或130%,或140%,或甚至更优选至少或高于150%。
去污染活性:本文中术语“去污染活性”应理解为去除有害试剂如有机磷化合物例如神经毒气、毒素、农药,因此该术语包括例如解毒活性。
分离的多肽:术语“分离的多肽”用于本文中指由来源分离的多肽。在一个优选的方面,多肽是如通过SDS-PAGE测定的,至少1%纯,优选至少5%纯,更优选至少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,并且最优选至少90%纯的多肽。
基本上纯的多肽:术语“基本上纯的多肽”在本文表示多肽制备物,所述多肽制备物含有按重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然或重组结合的(associated)的其它多肽材料。因此,优选所述基本上纯的多肽是按存在于制备物中的全部多肽材料的重量计至少92%纯,优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少96%纯,更优选至少97%纯,更优选至少98%纯,甚至更优选至少99%,最优选至少99.5%纯,并且甚至最优选100%纯。本发明的多肽优选是基本上纯的形式,即,所述多肽制备物基本上(essentially)不含与其天然或重组结合的其它多肽材料。例如,这能够通过以下实现:通过公知的重组方法或由经典纯化方法制备多肽。
成熟多肽:术语“成熟多肽”在本文中定义为具有有机磷水解酶活性的多肽,所述多肽以其在翻译和任何翻译后修饰之后的最终形式存在,所述修饰例如N-末端加工、C-末端截短、糖基化、磷酸化等。
成熟多肽编码序列:术语“成熟多肽编码序列”在本文中定义为编码具有有机磷水解酶活性的成熟多肽的核苷酸序列。
同一性:由参数“同一性”描述的两个氨基酸序列之间或两个核苷酸序列之间的相关性。
就本发明而言,两个氨基酸序列之间的同一性程度使用如EMBOSS软件包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,Trends in Genetics 16:276-277)的Needle程序,优选3.0.0版或更高版本中执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)来确定。使用的任选参数为缺口罚分(gap penalty)10,缺口延伸罚分(gap extension penalty)0.5和EBLOSUM62取代矩阵(BLOSUM62的EMBOSS版)。使用Needle标记为“最高同一性(longest identity)”(使用-nobrief选项获得)的输出结果作为百分比同一性,并计算如下:
(相同的残基×100)/(比对长度-比对中缺口的总数)
就本发明而言,两个核苷酸序列之间的同一性程度使用如EMBOSS软件包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,见上文)的Needle程序,优选3.0.0或更高版本中执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)来测定。使用的任选参数为缺口罚分10,缺口延伸罚分0.5和EDNAFULL取代矩阵(NCBINUC4.4的EMBOSS版)。使用Needle标记为“最高同一性”的输出结果(使用-nobrief选项获得)作为百分比同一性,并计算如下:
(相同的脱氧核糖核苷酸×100)/(比对长度-比对中缺口的总数)
同源序列:术语“同源序列”在本文中定义为预测的蛋白质,其在用本发明的普通章鱼有机磷水解酶进行的tfasty搜索(Pearson,W.R.,1999,于Bioinformatics Methods and Protocols,S.Misener和S.A.Krawetz编,pp.185-219)中给出小于0.001的E值(或期望分数)。
多肽片段:术语“多肽片段”在本文中定义为从SEQ ID NO:2的成熟多肽或其同源序列的氨基和/或羧基末端缺失一个或多个(几个)氨基酸的多肽;其中所述片段具有有机磷水解酶活性。
亚序列:术语“亚序列(subsequence)”在本文中定义为从SEQ ID NO:1的成熟多肽编码序列或其同源序列的5’和/或3’端缺失一个或多个(几个)核苷酸的核苷酸序列;其中所述亚序列编码具有有机磷水解酶活性的多肽片段。
等位变体(allelic variant):术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
分离的多核苷酸:术语“分离的多核苷酸”用于本文中指从来源分离的多核苷酸。在一个优选的方面,多核苷酸是如通过琼脂糖电泳测定的,至少1%纯,优选5%纯,更优选至少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,并且最优选至少90%纯的多核苷酸。
基本上纯的多核苷酸:术语“基本上纯的多核苷酸”用于本文指不含其它外来的或不期望的核苷酸的多核苷酸制备物,并且所述多核苷酸制备物处于适合于在遗传工程的蛋白质生产体系中使用的形式。因此,基本上纯的多核苷酸含有按重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然或重组结合的其它多核苷酸材料。然而,基本上纯的多核苷酸可包括天然存在的5’和3’非翻译区,如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90%纯,优选至少92%纯,更优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少97%纯,甚至更优选至少98%纯,最优选至少99%,并且甚至最优选至少99.5%纯的。本发明所述多核苷酸优选为基本上纯的形式,即,所述多核苷酸制备物基本上(essentially)不含与其天然或重组结合的其它多核苷酸材料。所述多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的,或它们的任何组合。
编码序列:当用于本文时术语“编码序列”的意思是直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框决定,所述开读框通常以ATG起始密码子或可供选择的起始密码子例如GTG和TTG开始,并且以终止密码子例如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA、合成或重组核苷酸序列。
DNA:术语“DNA”如用于本文中指所有DNA,因此所述DNA可为合成、基因组或cDNA,在本文中定义为能够通过反转录从得自真核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列的步骤加工然后作为成熟的已剪接的mRNA出现。这些步骤包括通过称为剪接的过程去除内含子序列。因而源自mRNA的cDNA没有任何内含子序列。
核酸构建体:术语“核酸构建体”用于本文指单链或双链的核酸分子,所述核酸分子分离自天然存在的基因,或将所述核酸分子以本来不存在于(nototherwise exist)自然界中的方式修饰以含有核酸的区段,或所述核酸是合成的。当所述核酸构建体含有表达本发明的编码序列所需的调控序列时,术语核酸构建体与术语“表达盒”同义。
调控序列(control sequence):术语“调控序列”在本文定义为包括对编码本发明多肽的多核苷酸表达是必需的所有成分。各个调控序列对于编码所述多肽的核苷酸序列可以是天然的或外源的,或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。
可操作地连接:术语“可操作地连接”在本文表示这样的构型,其中将调控序列置于相对于多核苷酸序列的编码序列的适当位置,使得调控序列指导多肽编码序列的表达。
表达:术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体:术语“表达载体”在本文定义为线性的或环状的DNA分子,其包含编码本发明多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。
宿主细胞:如本文中所使用的术语“宿主细胞”包括任何细胞类型,所述细胞类型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。
修饰:术语“修饰”在本文的意思是,对由SEQ ID NO:2的成熟多肽或其同源序列组成的多肽的任何化学修饰,以及对编码所述多肽的DNA的遗传操作。所述修饰可以是一个或多个(几个)氨基酸的取代、缺失和/或插入,以及一个或多个(几个)氨基酸侧链的置换。
人工变体:当用在本文时,术语“人工变体”的意思是具有有机磷水解酶活性的多肽,所述多肽由表达SEQ ID NO:1的成熟多肽编码序列或其同源序列的修饰的多核苷酸序列的生物体产生。所述修饰的核苷酸序列通过人为干预(human intervention),通过修饰SEQ ID NO:1中公开的多核苷酸序列或其同源序列来获得。
发明详述
具有有机磷水解酶活性的多肽
本方面提供了具有水解酶活性,酯酶活性例如有机磷水解酶活性或有机磷酸酐水解酶(OPAA)活性或优选二异丙基氟磷酸酶(DFP酶)活性的新多肽。本发明进一步涉及这些多肽用于对毒素(toxin)、毒物(poison)如神经毒气例如Vx或Gx型神经毒气和农药进行去污染的用途。
本发明的多肽具有至少一种酶活性,如V试剂或G试剂和/或农药的水解,或去污染。
V试剂可包括VX(0-乙基-S-[2(二异丙基氨基)乙基]甲基硫代磷酸酯,或甲基磷硫代酸),VE(O-乙基-S-[2-(二乙基氨基)乙基]乙基硫代磷酸酯),VG(O,O-二乙基-S-[2-(二乙基氨基)乙基]硫代磷酸酯),VM(0-乙基-S-[2-(二乙基氨基)乙基]甲基硫代磷酸酯),VR(磷硫代酸)Soviet V-气(Russian VX),四异(0,0-二异丙基S-(2-二异丙基氨基乙基)硫代磷酸酯)。
G试剂可包括塔崩(GA),沙林(甲基磷氟酸(methylphosphonofluoridic acid))(GB),索曼(GD),环沙林(GF)或其组合。
农药可包括杀真菌剂、杀虫剂、除草剂和杀啮齿类剂。所述农药可为内吸磷-S(Demeton-S)、内吸磷-S-甲基(Demeton-S-methyl)、砜吸磷(Demeton-S-methylsulphon)、甲基内吸磷(Demeton-methyl)、对硫磷(Parathion)、亚胺硫磷(Phosmet)、三硫磷(Carbophenothion)、苯噁磷(Benoxafos)、谷硫磷(Azinphos-methyl)、益棉磷(Azinphos-ethyl)、胺吸磷(Amiton)、赛硫磷(Amidithion)、果虫磷(Cyanthoate)、Dialiphos、乐果(Dimethoate)、敌磷(Dioxathion)、乙拌磷(Disulfoton)、因毒磷(Endothion)、Etion、益硫磷(Ethoate-methyl)、安硫磷(Formothion)、马拉硫磷(Malathion)、Mercarbam、氧乐果(Omethoate)、异砜磷(Oxydeprofos)、砜拌磷(Oxydisulfoton)、芬硫磷(Phenkapton)、甲拌磷(Phorate)、伏杀硫磷(Phosalone)、乙噻唑磷(Prothidathion)、发硫磷(Prothoate)、苏硫磷(Sophamide)、甲基乙拌磷(Thiometon)、蚜灭磷(Vamidothion)和甲胺磷(Methamidophos)。
在一个方面,本发明的多肽的酶活性包括有机磷水解酶活性。
因此在第一个方面,本发明涉及包含氨基酸序列的分离的多肽,所述氨基酸序列与SEQ ID NO:2的成熟多肽具有优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,且甚至最优选至少96%,至少97%,至少98%或至少99%的同一性程度,所述多肽具有有机磷水解酶活性(下文中的“同源多肽”)。
在一个优选的方面,本发明的多肽的酶活性包括二异丙基氟磷酸酶(DFP酶)活性。
因此在另一个方面,本发明涉及包含氨基酸序列的分离的多肽,所述氨基酸序列与SEQ ID NO:2的成熟多肽具有优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,且甚至最优选至少96%,至少97%,至少98%或至少99%的同一性程度,所述多肽具有二异丙基氟磷酸酶(DFP酶)活性。
在一个优选的方面,所述同源多肽具有氨基酸序列,其与SEQ ID NO:2的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。
本发明的多肽优选包含SEQ ID NO:2的氨基酸序列或其等位变体;或它们的具有有机磷水解酶活性的片段。在一个优选的方面,多肽包含SEQ ID NO:2的氨基酸序列。在另一个优选方面,多肽包含SEQ ID NO:2的成熟多肽。在另一个优选方面,多肽由SEQ ID NO:2的氨基酸序列或其等位变体;或它们的具有酯酶活性的片段组成。在另一个优选方面,多肽由SEQ ID NO:2的氨基酸序列组成。在另一个优选方面,多肽由SEQ ID NO:2的成熟多肽组成。
在第二个方面,本发明涉及具有有机磷水解酶活性的分离的多肽,所述分离的多肽由多核苷酸编码,所述多核苷酸在优选非常低严格条件下,更优选低严格条件下,更优选中严格条件下,更优选中-高严格条件下,甚至更优选高严格条件下,并且最优选非常高严格条件下,与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch,和T.Maniatis,1989,Molecular Cloning,A Laboratory Manual,第2版,Cold Spring Harbor,New York)。SEQ ID NO:1的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有有机磷水解酶活性的多肽片段。在一个优选的方面,所述互补链是SEQ ID NO:1的成熟多肽编码序列的全长互补链。
SEQ ID NO:1的核苷酸序列或其亚序列,以及SEQ ID NO:2的氨基酸序列或其片段,可用于设计核酸探针,以根据本领域内公知的方法从不同属和种的菌株鉴定和克隆编码具有有机磷水解酶活性的多肽的DNA。具体而言,根据标准的Southern印迹方法,可将这些探针用于与感兴趣的属或种的基因组或cDNA杂交,以鉴定和从其中分离相应的基因。这些探针可明显短于完整序列,但长度上应为至少14,优选至少25,更优选至少35,并且最优选至少70个核苷酸。然而,优选所述核酸探针是至少100个核苷酸长度。例如,所述核酸探针的长度可为至少200个核苷酸,优选至少300个核苷酸,更优选至少400个核苷酸,或最优选至少500个核苷酸。甚至可以使用更长的探针,例如,长度是优选至少600个核苷酸,更优选至少700个核苷酸,更优选至少800个核苷酸,或最优选至少900个核苷酸的核酸探针。DNA和RNA探针二者均可使用。通常将探针标记以探测相应的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)标记)。将这些探针涵盖于本发明中。
因而,可从由这些其它菌株制备的基因组DNA或cDNA文库中筛选DNA,所述DNA与上述探针杂交并且编码具有有机磷水解酶活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术分离来自这些其它菌株的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的载体材料并且固定于其上。为了鉴定与SEQ ID NO:1或其亚序列同源的克隆或DNA,将所述载体材料优选用在Sounthern印迹中。
就本发明而言,杂交表示核苷酸序列在非常低至非常高的严格条件下与标记的核酸探针杂交,所述核酸探针对应于SEQ ID NO:1的成熟多肽编码序列;包含SEQ ID NO:1的成熟多肽编码序列的DNA序列,其全长互补链;或它们的亚序列。可使用例如X射线片(X-ray film)检测在这些条件下与核酸探针杂交的分子。
在一个优选的方面,核酸探针是SEQ ID NO:1的成熟多肽编码序列。在在另一个优选方面,核酸探针是编码SEQ ID NO:2的多肽的多核苷酸序列,或其亚序列。在另一个优选方面,核酸探针是SEQ ID NO:1。在另一个优选方面,核酸探针是包含在质粒NN059107中的多核苷酸序列,其中所述其多核苷酸序列编码具有有机磷水解酶活性的多肽。在另一个优选方面,核酸探针是包含在质粒NN059107中含有的成熟多肽编码区。
对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在42℃,在5X SSPE、0.3%SDS、200μg/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低严格性为25%的甲酰胺、对于中和中-高严格性为35%的甲酰胺、或对于高和非常高严格性为50%的甲酰胺,根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。
对于长度为至少100个核苷酸的长探针,使用2X SSC、0.2%SDS优选至少在55℃(中严格性),更优选至少在60℃(中-高严格性),甚至更优选至少在65℃(高严格性),并且最优选至少在70℃(非常高严格性)将载体材料最终洗涤三次,每次15分钟。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严格条件定义为在比根据Bolton和McCarthy计算法(1962,Proceedings of the NationalAcademy of Sciences USA 48:1390)得出的Tm低大约5℃至大约10℃,在0.9MNaCl,0.09M Tris-HCl pH 7.6,6mM EDTA,0.5%NP-40,1×Denhardt溶液,1mM焦磷酸钠,1mM磷酸二氢钠(sodium monobasic phosphate),0.1mMATP和0.2mg每ml的酵母RNA中,根据标准的Southern印迹步骤进行预杂交、杂交和杂交后洗涤最佳12至24小时。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将所述载体材料在6×SSC加0.1%SDS中洗涤一次15分钟,并用6×SSC在比计算的Tm低5℃至10℃的温度洗涤两次,每次15分钟。
在第三方面,本发明涉及具有有机磷水解酶活性的分离的多肽,其由包含核苷酸序列或由核苷酸序列组成的多核苷酸编码,所述核苷酸序列与SEQID NO:1的成熟多肽编码序列具有优选至少75%,更优选至少80%,优选至少85%,甚至更优选至少90%,且甚至最优选至少95%、96%、97%、98%或99%的同一性程度,其编码活性多肽。参见本文的多核苷酸部分。
在第四方面,本发明涉及SEQ ID NO:2的成熟多肽或其同源序列的包含取代、缺失和/或插入一个或多个(几个)氨基酸的人工变体。优选地,氨基酸改变对性质是较不重要的(of a minor nature),即保守的氨基酸取代或插入,其不显著影响蛋白质的折叠和/或活性;通常为1至大约30个氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸,如多组氨酸序列(poly histidine tract)、抗原表位(antigenic epitope)或结合域(binding domain)。
保守取代的实例是在以下组之内:碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specific activity)的氨基酸取代是本领域已知的,并且由例如H.Neurath和R.L.Hill,1979,于The Proteins,Academic Press,New York中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。
除了20个基本氨基酸,非基本氨基酸(例如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)可以取代野生型多肽的氨基酸残基。有限数量的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸可以取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰,和/或在它们的侧链具有不同于基本氨基酸的化学结构。非天然氨基酸能够以化学方法合成,并且优选是商业上能够获得的,包括六氢吡啶羧酸(pipecolic acid)、噻唑烷羧酸(thiazolidine carboxylic acid)、脱氢脯氨酸、3-和4-甲基脯氨酸,和3,3-二甲基脯氨酸。
或者,氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如,氨基酸改变可改进多肽的热稳定性,改变底物特异性,改变最适pH等。
能够根据本领域已知的方法,例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells,1989,Science 244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变分子的生物活性(即,有机磷水解酶活性)以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定,如通过以下这些技术:如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基酸的突变来测定。参见例如de Vos等,1992,Science 255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBS Lett.309:59-64。必需氨基酸的同一性也能够从与多肽的同一性分析来推断,所述多肽与根据本发明的多肽相关。
能够使用已知的诱变、重组和/或改组(shuffling)方法,然后是有关的筛选方法,例如由Reidhaar-Olson和Sauer,1988,Science 241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152-2156;WO 95/17413;或WO 95/22625公开的那些方法来进行并测试单个或多个氨基酸取代、缺失和/或插入。能够使用的其它方法包括易错PCR、噬菌体展示(例如,Lowman等,1991,Biochem.30:10832-10837;美国专利号5,223,409;WO 92/06204)和区域定向的诱变(Derbyshire等,1986,Gene 46:145;Ner等,1988,DNA 7:127)。
诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等,1999,Nature Biotechnology 17:893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域内标准方法快速测序。这些方法允许快速测定感兴趣的多肽中单个氨基酸残基的重要性,并且能够应用于未知结构的多肽。
SEQ ID NO:2的成熟多肽的氨基酸取代、缺失和/或插入的总数可为至少40,优选至少35,优选至少30,优选至少25,优选至少20,优选至少15,优选至少10,优选至少9,优选至少8,优选至少7,优选至少6,优选至少5,优选至少4,优选至少3,优选至少2或优选至少1。
具有有机磷水解酶活性的多肽的来源
本发明的多肽可以获得自任何属的海洋生物。就本发明而言,用于本文与给定的来源相连的术语“获得自”,意思是核苷酸序列编码的多肽由所述来源产生,或由其中插入了来自所述来源的核苷酸序列的菌株产生。在一个优选的方面,获得自给定来源的多肽是胞外分泌的。
本发明具有有机磷水解酶活性的多肽可以是细菌多肽。例如,所述多肽可以是具有有机磷水解酶活性的革兰氏阳性细菌多肽例如芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)或海洋芽孢杆菌属(Oceanobacillus)多肽;或具有有机磷水解酶活性的革兰氏阴性细菌多肽,如大肠杆菌(E.coli)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)多肽。
在一个优选的方面,所述多肽是具有有机磷水解酶活性的嗜碱芽孢杆菌(Bacillus alkaloph ilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillusclausii)、凝结芽孢杆菌(Bacillus coagulans)、坚强芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)或苏云金芽孢杆菌(Bacillus thuringiensis)多肽。
在另一个优选的方面,所述多肽是具有有机磷水解酶活性的似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcus uberis)或马链球菌兽瘟亚种(Streptococcus equi subsp.Zooepidemicus)多肽。
在另一个优选的方面,所述多肽是具有有机磷水解酶活性的不产色链霉菌(Streptomyces achromogenes)、除虫链霉菌(Streptomyces avermitilis)、天蓝链霉菌(Streptomyces coelicolor)、灰色链霉菌(Streptomyces griseus)或浅青紫链霉菌(Streptomyces lividans)多肽。
本发明具有有机磷水解酶活性的多肽也可以是真菌多肽,并且更优选具有有机磷水解酶活性的酵母多肽如念珠菌属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽;或更优选具有有机磷水解酶活性的丝状真菌多肽如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、Botryospaeria、拟蜡菌属(Ceriporiopsis)、毛喙壳属(Chaetomidium)、金孢子菌属(Chrysosporium)、Claviceps、Cochliobolus、鬼伞属(Coprinopsis)、Coptotermes、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、Filibasidium、镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙齿菌属(Irpex)、蘑菇属(Lentinula)、Leptospaeria、梨孢菌属(Magnaporthe)、Melanocarpus、多孔菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、包脚菇属(Volvariella)或炭角菌属(Xylaria)多肽。
在一个优选的方面,所述多肽是具有有机磷水解酶活性的卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomyces oviformis)多肽。
在另一个优选方面,所述多肽是具有有机磷水解酶活性的解纤维枝顶孢霉(Acremonium cellulolyticus)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillusfoetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、嗜角质金孢子菌(Chrysosporiumkeratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporiumtropicum)、Chrysosporium merdarium、Chrysosporium inops、毡金孢子菌(Chrysosporium pannicola)、Chrysosporium queenslandicum、Chrysosporiumzonatum、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusariumheterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusariumtorulosum)、拟丝孢镰孢(Fusarium trichothecioides)、镶片镰孢(Fusariumvenenatum)、灰腐质霉(Humicola grisea)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、白耙齿菌(Irpex lacteus)、米黑毛霉(Mucormiehei)、嗜热毁丝霉、粗糙脉孢菌(Neurospora crassa)、绳状青霉(Penicilliumfuniculosum)、产紫青霉(Penicillium purpurogenum)、黄孢平革菌(Phanerochaetechrysosporium)、Thielavia achromatica、Thielavia albomyces、Thielavia albopilosa、澳洲梭孢壳(Thielavia australeinsis)、Thielavia fimeti、小孢梭孢壳(Thielaviamicrospora)、卵孢梭孢壳(Thielavia ovispora)、Thielavia peruviana、瘤孢梭孢壳(Thielavia spededonium)、毛梭孢壳(Thielavia setosa)、Thielavia subthermophila、土生梭孢霉(Thielavia terrestris)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)或绿色木霉(Trichoderma viride)多肽。
在本发明的一个方面,所述多肽来自海洋动物如章鱼、头足类和软体类。在本发明的一个优选的方面,所述多肽是乌贼类型的多肽。
在另一个优选的方面,所述多肽是普通章鱼多肽。在一个更优选的方面,所述多肽是具有有机磷水解酶活性的普通章鱼多肽。在一个最优选的方面,所述多肽是具有有机磷水解酶活性的普通章鱼登录号DSM 22528多肽,例如包含SEQ ID NO:2的成熟多肽的多肽。大肠杆菌NN059107。
可理解的是对于前述的种,本发明包含完全和不完全阶段(perfect andimperfect states),和其它分类学的等同物(equivalent),例如无性型(anamorph),而无论它们已知的种名。本领域熟练技术人员将容易地识别适合的等同物的同一性。
这些种的菌株在许多培养物保藏中心对于公众能够容易地取得,所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammlung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center)(NRRL)和NCIMB。
此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。随后可通过相似地筛选这种微生物的基因组或cDNA文库来获得所述多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸序列,就能够使用本领域普通技术人员熟知的技术将所述多核苷酸分离或克隆(参见,例如,Sambrook等,1989,见上文)。
本发明的多肽还包括融合多肽或可切割的融合多肽,其中将另外的多肽融合到所述多肽或其片段的N末端或C末端。通过将编码另一个多肽的核苷酸序列(或其部分)融合于本发明的核苷酸序列(或其部分)来产生融合的多肽。产生融合多肽的技术是本领域已知的,并包括连接编码多肽的编码序列以使它们在阅读框中,并且使融合多肽的表达在相同启动子和终止子的控制下。
融合多肽还可以包括切割位点。一旦分泌了融合多肽,就切割所述位点,从融合蛋白质释放具有有机磷水解酶活性的多肽。切割位点的实例包括,但不限于,编码二肽Lys-Arg的Kex2位点(Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology 13:498-503;和Contreras等,1991,Biotechnology 9:378-381);Ile-(Glu或Asp)-Gly-Arg位点,其在精氨酸残基后通过因子Xa蛋白酶切割(Eaton等,1986,Biochem.25:505-512);Asp-Asp-Asp-Asp-Lys位点,其在赖氨酸后通过肠激酶切割(Collins-Racie等,1995,Biotechnology 13:982-987);His-Tyr-Glu位点或His-Tyr-Asp位点,其通过Genenase I切割(Carter等,1989,Proteins:Structure,Function,and Genetics 6:240-248);Leu-Val-Pro-Arg-Gly-Ser位点,其在Arg后通过凝血酶切割(Stevens,2003,Drug Discovery World 4:35-48);Glu-Asn-Leu-Tyr-Phe-Gln-Gly位点,其在Gln后通过TEV 蛋白酶切割(Stevens,2003,见上文);和Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位点,其在Gln后通过基因工程形式的人鼻病毒3C蛋白酶切割(Stevens,2003,见上文)。
多核苷酸
本发明还涉及分离的多核苷酸,其包含编码本发明具有有机磷水解酶活性的多肽的核苷酸序列,或由编码本发明具有有机磷水解酶活性的多肽的核苷酸序列组成。
在一个优选的方面,核苷酸序列包含SEQ ID NO:1或由SEQ ID NO:1组成。在另一个更优选的方面,核苷酸序列包含大肠杆菌Top10中所含质粒NN059107中含有的序列,或由大肠杆菌Top10中所含质粒NN059107中含有的序列组成。在另一个优选方面,核苷酸序列包含SEQ ID NO:1的成熟多肽编码序列或由SEQ ID NO:1的成熟多肽编码序列组成。在另一个更优选的方面,核苷酸序列包含大肠杆菌Top10中所含质粒NN059107中含有的成熟多肽编码序列或由大肠杆菌Top10中所含质粒NN059107中含有的成熟多肽编码序列组成。本发明还涵盖编码多肽的核苷酸序列,所述多肽包含SEQ ID NO:2的氨基酸序列或其成熟多肽,或由SEQ ID NO:2的氨基酸序列或其成熟多肽组成;由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:1或其成熟多肽编码序列。本发明还涉及SEQ ID NO:1的亚序列,所述亚序列编码具有有机磷水解酶活性的SEQ ID NO:2的片段。
本发明还涉及突变多核苷酸,所述突变多核苷酸在SEQ ID NO:1的成熟多肽编码序列中包含至少一个突变,或由具有至少一个突变的SEQ ID NO:1的成熟多肽编码序列组成,其中所述突变核苷酸序列编码SEQ ID NO:2的成熟多肽。
用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,包括从基因组DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特性的克隆DNA片段,从而实现从这种DNA克隆本发明的多核苷酸。参见,例如,Innis等,1990,PCR:A Guide to Methods and Application,Academic Press,New York。可以使用其它核酸扩增方法,如连接酶链式反应(LCR)、连接活化转录(ligatedactivated transcription;LAT)和基于核苷酸序列的扩增(NASBA)。可以从章鱼,或其它或相关生物体克隆多核苷酸,并且因此可以是例如所述核苷酸序列的多肽编码区的等位基因变体或种变体(species variant)。
本发明还涉及包含核苷酸序列或由核苷酸序列组成的分离的多核苷酸,所述核苷酸序列与SEQ ID NO:1的成熟多肽编码序列具有优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,至少97%,至少98%,或者至少99%同一性的同一性程度,其编码具活性多肽。
修饰编码本发明多肽的核苷酸序列对于合成与所述多肽基本上相似的多肽可为必需的。术语与所述多肽“基本上相似”指多肽的非天然存在的形式。这些多肽可能以一些工程改造的方式而不同于从其天然来源分离的多肽,例如,比活性、热稳定性、最适pH等方面不同的人工变体。可以在作为SEQ IDNO:1的成熟多肽编码序列存在的核苷酸序列,例如其亚序列的基础上,和/或通过引入如下核苷酸取代来构建变体序列:所述取代不产生由核苷酸序列编码的多肽的另外的氨基酸序列,但是符合意欲产生酶的宿主生物体的密码子选择;或者所述取代可产生不同的氨基酸序列。关于核苷酸取代的概述,参见,例如,Ford等,1991,Protein Expression and Purification 2:95-107。
对于本领域技术人员显而易见的是,这些取代能够在对于分子功能重要的区域之外进行,并且仍然产生活性多肽。对于由本发明的分离的多核苷酸编码的多肽活性关键的并且因此优选不进行取代的氨基酸残基,可以根据本领域公知的方法,例如定位诱变或丙氨酸分区诱变法(参见,例如,Cunningham和Wells,1989,见上文)来鉴定。在后一技术中,将突变引入到分子中的每个荷正电的残基处,并且测试所得突变分子的有机磷水解酶活性,以鉴定对于所述分子的活性关键的氨基酸残基。底物-酶相互作用的位点也能够通过分析三维结构测定,通过如核磁共振分析、晶体学或光亲和标记这样的技术来测定(参见,例如,deVos等,1992,见上文;Smith等,1992,见上文;Wlodaver等,1992,见上文)。
本发明还涉及编码本发明多肽的分离的多核苷酸,所述分离的多核苷酸在非常低严格条件下,优选低严格条件,更优选中等严格条件,更优选中-高严格条件,甚至更优选高严格条件,并且最优选非常高的严格条件下,与以下序列杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的DNA序列,或(iii)(i)或(ii)的全长互补链;或它们的等位变体和亚序列(Sambrook等,1989,见上文),如本文所定义的。在一个优选的方面,互补链是SEQ ID NO:1的成熟多肽编码序列的全长互补链。
本发明还涉及分离的多核苷酸,所述分离的多核苷酸通过以下方法获得:(a)在非常低、低、中、中-高、高或非常高严格条件下,将DNA的群体与以下序列杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的DNA序列,或(iii)(i)或(ii)的全长互补链;和(b)分离杂交的多核苷酸,其编码具有有机磷水解酶活性的多肽。在一个优选的方面,互补链是SEQ ID NO:1的成熟多肽编码序列的全长互补链。
核酸构建体
本发明还涉及包含本发明的分离的多核苷酸的核酸构建体,所述分离的多核苷酸与一个或多个(几个)调控序列可操作地连接,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。
可以用许多方式操作编码本发明多肽的分离的多核苷酸以提供多肽的表达。依赖于表达载体,在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。
调控序列可以是适当的启动子序列,其是由用于表达编码本发明多肽的多核苷酸的宿主细胞识别的核苷酸序列。启动子序列含有介导多肽的表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。
用于指导本发明的核酸构建体转录,特别是在细菌宿主细胞中转录的合适启动子的实例是从下述获得的启动子:大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因和原核β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceedings of the National Academy of Sciences USA 75:3727-3731),以及tac启动子(DeBoer等,1983,Proceedings of the National Academy of SciencesUSA 80:21-25)。另外的启动子在″Useful proteins from recombinant bacteria″于Scientific American,1980,242:74-94中;和在Sambrook等,1989,见上文中描述。
用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子:米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体);和它们的突变的、截短的和杂合的启动子。
在酵母宿主中,有用的启动子从如下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由Romanos等,1992,Yeast 8:423-488描述。
调控序列也可以是合适的转录终止子序列,是由宿主细胞识别以终止转录的序列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。
对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶。
对于酵母宿主细胞优选的终止子从如下酶的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由Romanos等,1992,见上文描述。
调控序列还可以是合适的前导序列,其是对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5’-末端。可以将在所选宿主细胞中有功能的任何前导序列用在本发明中。
对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得:米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。
对于酵母宿主细胞合适的前导序列从如下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
调控序列也可以是聚腺苷酸化序列,其是与核苷酸序列的3’末端可操作地连接的序列,并且在转录时,宿主细胞将其识别为信号以将聚腺苷残基添加至转录的mRNA。可以将在所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。
对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman,1995,Molecular Cellular Biology 15:5983-5990描述。
调控序列还可以是信号肽编码序列,其编码与多肽的氨基末端相连的氨基酸序列,并且指导编码的多肽进入细胞分泌途径。核苷酸序列的编码序列5’端可固有地包含信号肽编码序列,其与编码分泌多肽的编码序列片段一起天然地连接在翻译阅读框中。或者,编码序列5’端可含有对于所述编码序列异源的信号肽编码序列。异源信号肽编码序列在编码序列不天然地含有信号肽编码序列时可为必需的。或者,外源信号肽编码序列可以简单地取代天然信号肽编码序列以增强多肽的分泌。然而,指导表达的多肽进入所选宿主细胞的分泌途径(即,分泌至培养基中)的任何信号肽编码序列可在本发明中使用。
对于细菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列:芽孢杆菌属NCIB 11837产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT,nprS,nprM)、克劳氏芽孢杆菌碱性蛋白酶(Bacillus clausii alcaline protease)(aprH)和枯草芽孢杆菌prsA。另外的信号肽由Simonen和Palva,1993,Microbiological Reviews 57:109-137描述。
对于丝状真菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V和疏棉状腐质霉脂肪酶。
对于酵母宿主细胞有用的信号肽从酿酒酵母α-因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码序列由Romanos等,1992,见上文描述。
在一个方面,所述分离的、合成的或重组的多肽可包括缺乏信号序列的本发明的多肽。
调控序列还可以是前肽编码序列,其编码位于多肽氨基末端的氨基酸序列。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的并且能够通过前肽的催化或自催化切割从前多肽转化为成熟活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(WO 95/33836)的基因获得前肽编码序列。
当信号肽和前肽序列二者均出现在多肽的氨基末端时,将前肽序列置于紧接着(next to)多肽氨基末端,并且将信号肽序列置于紧接着前肽序列的氨基末端。
同样理想的是添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节系统包括lac、tac、xyl和trp操纵基因系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中,这些序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况下,编码多肽的核苷酸序列可与调节序列可操作地连接。
表达载体
本发明还涉及重组表达载体,所述重组表达载体包含本发明的多核苷酸、启动子和转录和翻译终止信号。本文中所述的多种核酸和调控序列可以结合在一起以产生重组表达载体,所述表达载体可以包括一个或多个(几个)方便的限制位点以允许在这些位点插入或取代编码多肽的核苷酸序列。或者,可以通过在适当的用于表达的载体中插入所述核苷酸序列或包含所述序列的核酸构建体来表达本发明的核酸序列。在制备表达载体的过程中,将编码序列置于载体中,使得该编码序列与适当的表达调控序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。
载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整DNA(total DNA),或可以使用转座子(transposon)。
本发明的载体优选地含有一个或多个(几个)选择性标记,其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。
细菌选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性的标记,所述抗生素抗性如氨苄青霉素、卡那霉素、氯霉素或四环素抗性。对于酵母宿主细胞合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶(orotidine-5’-phosphate decarboxylase))、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilate synthase))以及它们的等同物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
本发明的载体优选含有元件,其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。
为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的核苷酸序列,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应优选含有足够数量的核酸,如100至10,000碱基对,优选400至10,000碱基对,并且最优选800至10,000碱基对,其与相应的目标序列具有高度同一性以增强同源重组的概率。整合元件可以是任何序列,其与宿主细胞基因组中的目标序列同源。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,可以将载体通过非同源重组整合到宿主细胞的基因组中。
为了自主复制,载体可以进一步包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator),其在细胞中发挥功能。术语“复制起点”或“质粒复制子”在本文定义为能够使质粒或载体体内复制的核苷酸序列。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,和允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点,ARS1,ARS4,ARS1和CEN3的组合,和ARS4和CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等,1991,Gene 98:61-67;Cullen等,1987,Nucleic Acids Research 15:9163-9175;WO 00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公开于WO 00/24883中的方法完成。
可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加基因产物的产生。多核苷酸拷贝数的增加可通过如下方法获得:将至少一个额外拷贝的序列整合入宿主细胞基因组,或将可扩增的选择性标记基因包括于多核苷酸,其中可通过在合适的选择剂(selectable agent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝的细胞,和由此得到多核苷酸的额外拷贝。
用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook等,1989,见上文)。
宿主细胞
本发明还涉及重组宿主细胞,其包含本发明的分离的多核苷酸,可有利地用于多肽的重组生产中。将包含本发明的多核苷酸的载体导入宿主细胞,使载体作为染色体整合体或如前所述的自复制的染色体外载体维持。术语“宿主细胞”包括由于复制过程中发生的突变而与亲本细胞不同的亲本细胞的任何后代。宿主细胞的选择在很大程度上依赖于编码多肽的基因及其来源。
宿主细胞可以是在本发明的多肽的重组产生中有用的任何细胞,例如,原核或真核细胞。
原核宿主细胞可以是任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于,芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌和海洋芽孢杆菌。革兰氏阴性细菌包括但不限于,大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属和脲原体属。
细菌宿主细胞可以是任何芽孢杆菌属细胞。在本发明的实施中有用的芽孢杆菌属细胞包括但不限于,嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。
在一个优选的方面,细菌宿主细胞是解淀粉芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在一个更优选的方面,细菌宿主细胞是解淀粉芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是克劳氏芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是地衣芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是枯草芽孢杆菌细胞。
细菌宿主细胞还可以是任何链球菌属细胞。在本发明的实施中有用的链球菌属细胞包括但不限于,似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种细胞。
在一个优选的方面,细菌宿主细胞是似马链球菌细胞。在另一个优选的方面,细菌宿主细胞是酿脓链球菌细胞。在另一个优选的方面,细菌宿主细胞是乳房链球菌细胞。在另一个优选的方面,细菌宿主细胞是马链球菌兽瘟亚种细胞。
细菌宿主细胞还可以是任何链霉菌属细胞。在本发明的实施中有用的链霉菌属细胞包括但不限于,不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌和浅青紫链霉菌细胞。
在一个优选的方面,细菌宿主细胞是不产色链霉菌细胞。在另一个优选的方面,细菌宿主细胞是除虫链霉菌细胞。在另一个优选的方面,细菌宿主细胞是天蓝链霉菌细胞。在另一个优选的方面,细菌宿主细胞是灰色链霉菌细胞。在另一个优选的方面,细菌宿主细胞是浅青紫链霉菌细胞。
可通过如下方法实现将DNA引入到芽孢杆菌属细胞:例如原生质体转化(参见,例如,Chang和Cohen,1979,Molecular General Genettcs 168:111-115),使用感受态细胞(参见,例如,Young和Spizizen,1961,Journal of Bacteriology81:823-829或Dubnau和Davidoff-Abelson,1971,Journal of Molecular Biology56:209-221),电穿孔(参见,例如,Shigekawa和Dower,1988,Biotechniques 6:742-751)或接合(参见,例如,Koehler和Thorne,1987,Journal of Bacteriology169:5771-5278)。可通过如下方法实现将DNA引入到大肠杆菌细胞:例如原生质体转化(参见,例如,Hanahan,1983,J.Mol.Biol.166:557-580)或电穿孔(参见,例如,Dower等,1988,Nucleic Acids Res.16:6127-6145)。可通过如下方法实现将DNA引入到链霉菌属细胞:例如原生质体转化和电穿孔(参见,例如,Gong等,2004,Folia Microbiol.(Praha)49:399-405),接合(参见,例如,Mazodier等,1989,J.Bacteriol.171:3583-3585),或转导(参见,例如,Burke等,2001,Proc.Natl.Acad.Sci.USA 98:6289-6294)。可通过如下方法实现将DNA引入到假单胞菌属细胞,例如电穿孔(参见,例如,Choi等,2006,J.Microbiol.Methods64:391-397)或接合(参见,例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51-57)。可通过如下方法实现将DNA引入到链球菌属细胞,例如天然感受态(natural competence)(参见,例如,Perry和Kuramitsu,1981,Infect.Immun.32:1295-1297),原生质体转化(参见,例如,Catt和Jollick,1991,Microbios.68:189-207),电穿孔(参见,例如,Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)或接合(参见,例如,Clewell,1981,Microbiol.Rev.45:409-436)。然而,可以使用任何已知的将DNA引入宿主细胞的方法。
宿主细胞还可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。
在一个优选的方面,宿主细胞是真菌细胞。“真菌”用在本文包括以下门:子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如由Hawksworth等,于Ainsworth and Bisby’sDictionary of The Fungi,8th edition,1995,CAB International,University Press,Cambridge,UK中所定义)以及卵菌门(Oomycota)(如Hawksworth等,1995,见上,171页中所引用),和所有有丝分裂孢子真菌(mitosporic fungi)(Hawksworth等,1995,见上)。
在一个更优选的方面,真菌宿主细胞是酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,将酵母定义为如Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.,和Davenport,R.R.编,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述。
在一个甚至更优选的方面,酵母宿主细胞是念珠菌属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞。其他酵母宿主细胞描述于WO2007/023163,第23页第1-15行。
在另一个更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。
在一个甚至更优选的方面,丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属(Thermoascus)、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。其他丝状真菌宿主细胞描述于WO2007/023163第23页第20-35行。
可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP238023和Yelton等,1984,Proceedings of the National Academy of Sciences USA81:1470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene 78:147-156和WO 96/00787描述。可以使用由如下文献描述的方法转化酵母:Becker和Guarente,于Abelson,J.N.和Simon,M.I.编,Guide to Yeast Geneticsand Molecular Biology,Methods in Enzymology,194卷,182-187页,Academic Press,Inc.,New York;Ito等,1983,Journal of Bacteriology 153:163;和Hinnen等,1978,Proceedings of the National Academy of Sciences USA75:1920。
产生方法
本发明还涉及产生本发明多肽的方法,其包括:(a)在有助于产生多肽的条件下培养以其野生型形式产生所述多肽的细胞;和(b)回收所述多肽。在一个优选的方面,所述细胞为章鱼属的细胞。在一个更优选的方面,所述细胞为普通章鱼。在一个最优选的方面,所述细胞为普通章鱼DSM 22528。
本发明还涉及产生本发明的多肽的方法,包括:(a)在有助于产生多肽的条件下培养如本文中所述的重组宿主细胞;和(b)回收所述多肽。
本发明还涉及用于产生本发明的多肽的方法,其包括:(a)在有助于产生多肽的条件下培养重组宿主细胞,其中所述宿主细胞包含突变核苷酸序列,其在SEQ ID NO:1的成熟多肽编码序列中具有至少一个突变,其中所述突变核苷酸序列编码多肽,该多肽包含SEQ ID NO:2的成熟多肽或由SEQ ID NO:2的成熟多肽组成,和(b)回收所述多肽。
在本发明的产生方法中,使用本领域公知的方法在适合于产生所述多肽的营养培养基中培养细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中,该多肽能够从所述培养基中直接回收。如果多肽不分泌至培养基,则其能够从细胞裂解物(lysate)回收。
可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶测定法(enzyme assay)可用于测定如本文所述的多肽的活性。
所得多肽可以使用本领域已知的方法回收。例如,多肽可以通过常规方法从营养培养基中回收,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。
本发明的多肽可以通过多种本领域已知的方法纯化,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,Protein Purification,J.-C.Janson和Lars Ryden,editors,VCH Publishers,New York,1989)。
组合物
本发明还涉及包含本发明多肽的组合物。优选地,所述组合物富集此种多肽。术语“富集”指该组合物的有机磷水解酶活性以例如至少1.1的富集因子增加。
所述组合物可包含本发明的多肽作为主要的酶组分,例如,单组分组合物。或者,所述组合物可包含多种酶活性,如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶(chitinase)、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。其他酶可通过例如海洋生物或属于曲霉属的微生物优选棘孢曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)或米曲霉(Aspergillus oryzae),镰孢属的微生物优选杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusariumcerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusariumoxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides)或镶片镰孢(Fusarium venenatum),腐质霉属的微生物,优选特异腐质霉(Humicola insolens)或疏棉状腐质霉(Humicolalanuginosa),或木霉属的微生物,优选哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)或绿色木霉(Trichoderma viride)来产生。
或者,所述酶可由属于芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)或海洋芽孢杆菌属(Oceanobacillus)的微生物或细菌如大肠杆菌(E.coli)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(llyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)来产生。
其他酶亦可由嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金芽孢杆菌产生。
在一个方面,其他酶由似马链球菌、酿脓链球菌、乳房链球菌或马链球菌产生。
在一个方面,其他酶由不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌或浅青紫链霉菌产生。
可以依照本领域内已知的方法制备多肽组合物,并且可以是液体或干组合物的形式。例如,所述多肽组合物可以是颗粒(granulate)或微粒(microgranulate)的形式。可以依照本领域内已知方法将包含于所述组合物中的多肽稳定化。
下文给出本发明的多肽组合物的优选用途的实例。本发明的多肽组合物的剂量和使用所述组合物的其他条件可基于本领域已知方法来确定
用途
本发明还涉及使用具有有机磷水解酶活性的多肽(有机磷水解酶)或其组合物的方法。
在一个优选实施方案中,本发明还涉及本发明的有机磷水解酶用于对经至少一种有害的或不希望的有机磷化合物污染的区域或装置进行去污染的用途。将本发明的有机磷水解酶或包含本发明的有机磷水解酶的组合物以足以降解至少一种有害的或不希望的有机磷化合物的至少一部分的量施于所述区域或装置。
在另一个实施方案中,本发明的有机磷水解酶可用于供施于例如人的皮肤的洗剂或其他乳剂如微乳剂中。将本发明的有机磷水解酶或包含本发明的有机磷水解酶的组合物施于皮肤以针对至少一种有害的或不希望的有机磷化合物进行保护。
在进一步的实施方案中,本发明的有机磷水解酶可并入用于检测至少一种有害的或不希望的有机磷化合物的测定法中。此类测定法对于快速评估不希望的有机磷化合物的存在可为有利的。
有害的或不希望的有机磷化合物包括有毒的有机磷胆碱酯酶抑制化合物包括神经毒气如二异丙基氟磷酸(DFP)、O-异丙基甲基磷氟酸(沙林),O-频哪醇基甲基磷氟酸(O-pinacolyl methyl phosphonofluoridate)(索曼)和O-环己基甲基磷氟酸(O-cyclohexyl methylphosphonofluoridate)。
其他有害的化合物包括V试剂,其可包括VX、VE、VG、VM、VR Tetriso和SovietV-气(Russian VX)。
农药可包括杀真菌剂、杀虫剂、除草剂和杀啮齿类剂。农药可为内吸磷-S(Demeton-S)、内吸磷-S-甲基(Demeton-S-methyl)、砜吸磷(Demeton-S-methylsulphon)、甲基内吸磷(Demeton-methyl)、对硫磷(Parathion)、亚胺硫磷(Phosmet)、三硫磷(Carbophenothion)、苯噁磷(Benoxafos)、谷硫磷(Azinphos-methyl)、益棉磷(Azinphos-ethyl)、胺吸磷(Amiton)、赛硫磷(Amidithion)、果虫磷(Cyanthoate)、Dialiphos、乐果(Dimethoate)、敌磷(Dioxathion)、乙拌磷(Disulfoton)、因毒磷(Endothion)、Etion、益硫磷(Ethoate-methyl)、安硫磷(Formothion)、马拉硫磷(Malathion)、Mercarbam、氧乐果(Omethoate)、异砜磷(Oxydeprofos)、砜拌磷(Oxydisulfoton)、芬硫磷(Phenkapton)、甲拌磷(Phorate)、伏杀硫磷(Phosalone)、乙噻唑磷(Prothidathion)、发硫磷(Prothoate)、苏硫磷(Sophamide)、甲基乙拌磷(Thiometon)、蚜灭磷(Vamidothion)和甲胺磷(Methamidophos)。
本发明进一步由下述实施例描述,其不应视为限制本发明的范围。
实施例
用作缓冲液和底物的化学品为至少试剂级的商品。
实施例1:普通章鱼DFP酶cDNA的分离
普通章鱼种是在福尔摩沙河(Rio Formosa),葡萄牙南部(South of Portugal)捕获并活着带到岸边的。从主要腺体和组织(眼、脑、颊质(buccal mass)、大循环心和腮心(systemic and branchial heart)、腮、肾脏、腮腺、唾液腺、套膜(Mantle)、消化腺)使用来自Qiagen的RNAeasy试剂盒和进行总RNA提取,并使用来自Qiagen的Oligotex Kit进行mRNA提取。使用mRNA作为模板和来自CLONTECH的Marathon cDNA扩增试剂盒来构建cDNA文库。
使用cDNA文库作为模板用于PCR,以及引物:
引物1:5’-TCAAAATCCATCCATCGGCGCCACC-3’(SEQ ID NO:3)
引物2:5’-TGGRTSACKGCACCAGCTGG-3’(SEQ ID NO:4)
扩增了具有下述序列的307碱基对的DNA片段:
5’-TGGATTACAGCTCCAGCAGGAGATATTGCCCCAGCACCATTCAGGCGATCAATGGAGGAACCATTTGGCAGTGTCTACTGCTACACAAATGGAGAAATGATTAAAATTGACACAGGTCTACAGTTTCCCAATGGAATTGCAGTCTTACATCTGAACGATGGGCGACCTCAAAAGTTGATTGTAGCAGAAACTCCGACAAAACGTCTCTGGAGTTATGACATTGAAGCTCCAGGAAAGGTTTCAAATAAGAAAGTCTGGGCCACTATACCAGGTGATCATGAGGGTGGTGCAGATGGCATGGACTTTG-3’(SEQ ID NO:5)
将新的引物对:
引物3:5’-CCCCAGCACCATTCAGGCGAT-3’(SEQ ID NO:6)
引物4:5’-GCTTCAATGTCATAACTCCAGAGACG-3’(SEQ ID NO:7)
与载体特异性引物一同使用以从cDNA文库扩增整个DFP酶阅读框。计算了推定的普通章鱼DFP酶的氨基酸序列并如下所示。该序列用于设计编码蛋白质序列SEQ ID NO:2的合成基因,并针对DFP酶的细菌表达进行优化。
实施例2:DFP酶基因的克隆和表达
由商业供应商设计并合成了编码普通章鱼蛋白质序列的合成基因。然后如下所述克隆了该合成基因。
合成DFP酶基因的克隆
将下述列出的PCR引物组用于PCR扩增合成的DFP酶基因。为了克隆的目的,将限制性位点NdeI和XhoI引入PCR片段末端(在下述列出的引物序列中,位点以下划线表示)。
引物5:5’-ATACATATGATGGAGACTATCCCTGTTGAC-3’(SEQ ID NO:8)
引物6:5’-TATCTCGAGGAAAGATTTCATCTCACAG-3’(SEQ ID NO:9)
旋转纯化(spin purified)PCR片段,将其用NdeI和XhoI(New englandBiolabs)消化,并使用T4DNA连接酶(New England Biolabs)连接入事先经NdeI和XhoI消化的质粒表达载体pET30a+(InVitrogen)。
在16℃进行ON温育之后,将连接反应物转化入感受态大肠杆菌TOP10细胞(Invitrogen),并将其铺板于含20μg/ml卡那霉素的LB琼脂板。将平板在37℃温育16小时。
从选定的转化体纯化质粒DNA,并对其测序以供克隆过程的验证。最终将质粒转化入感受态大肠杆菌BL21(DE3)细胞以供蛋白质表达。
DFP酶表达
将携带上述的质粒的BL21(DE3)细胞接种入125ml锥形瓶中的补充了20μg/ml卡那霉素的20ml TB-Glycerol培养基(TBGK-培养基)。将培养物在37℃和180rpm进行ON生长。
翌日将含有1升TBGK培养基的2升锥形瓶用这些培养物接种至起始OD600=0.1。在30℃和180rpm生长培养物直至OD600达到0.7,此时将IPTG以终浓度1mM添加。继续在30℃和180rpm生长16小时。
实施例3:纯化
从培养物通过在5000rpm离心10分钟来收获细胞,并使用CelLytic蛋白质提取试剂(Sigma)来提取胞内蛋白。
将裂解的发酵物通过0.22μm瓶顶(bottle top)过滤器(Nalgene)过滤。将固体NaCl、Tris-HCl和咪唑添加至下述浓度:50mM Tris-HCl,20mM咪唑和0.5M NaCl。将pH调整至7.4,并使用在纯化器(purifier)900系统上预加载Cu2+的螯合Sepharose FF柱来纯化该溶液。洗脱是逐步用增加的咪唑浓度(0、10%、20%和50%500mM咪唑)来进行的。
汇集了属于同一个峰的级分,将其浓缩并使用具有30kDa截留值的Amicon Ultra离心过滤装置缓冲液交换入50mM TRIS,pH 7.0。
实施例4:酶活性的测量
DFP酶活性如下所述确定:
酶活性是通过如Blum等,JACS 128(2006):12750-12757中所述的恒定pH测定法或使用如等,Anal Biochem 385(2009):187-193中所述的原位傅里叶变换红外光谱法来确定的。在恒定pH测定法中,DFP水解是通过测量氟离子在298K在氮气气氛下的释放来确定的。该测定法是在3ml pH 7.5,含10mMNaCl和10%乙腈中进行的。反应是通过添加2微升的0.5mg/mlDFP酶起始的。起始速度是在八个不同底物浓度(0.5-10mM)确定的,并针对DFP水解的未催化的速率进行校正。使用原位傅里叶变换(FITR)光谱法以在神经毒剂底物水解为相应的磷酸和膦酸时,测量这些神经毒剂底物的实时反应速率。
通过将纯化的DFP酶添加至含在50mM Tris,2mM CaCl2,pH 7.5中的1mM二氢香豆素(dihydrocoumarine)的溶液来在分光光度计中在25℃在235nm处跟踪(follow)二氢香豆素的水解。对于DFP酶,当计算为每分钟每mg蛋白质在235nm处吸光度的减少时,二氢香豆素水解的比活性计算为:对于普通章鱼,13U/mg,而对于鱿鱼,1.7U/mg。
定性活性测试
用下述G试剂测试DFP酶:DFP、索曼、环沙林和沙林。章鱼DFP酶针对所有四种G试剂显示活性。
底物 | 鱿鱼对底物的比活性U/mg | 普通章鱼对底物的比活性U/mg |
DFP(1.79%) | 305 | 277 |
沙林(1.97%) | 115 | 162 |
索曼(1.89%) | 95 | 143 |
环沙林(1.9%) | 205 | 225 |
香豆素 | 1.7 | 13 |
从该表可见,来自普通章鱼的DFP酶对沙林、索曼和环沙林具有较佳活性,尽管对DFP具有较低活性。
生物材料的保藏
依据布达佩斯条约的条款,下述的生物材料已经保藏于德意志微生物和细胞培养物保藏中心(DSMZ-Deutsche Sammlung von Mikroorganismen undZellkulturen GmbH(DSM)),并给予下述的登录号:
保藏物 登录号 保藏日期
大肠杆菌(NN059107) DSM22528 2009年4月28日
所述菌株于下述条件下保藏:确保在本专利申请未决期间,由外国专利法律决定授权的人能够获得所述培养物。所述保藏物为所保藏菌株的基本上纯的培养物。在提交了题述申请的对应申请或其子申请(progeny)的国家中,依据该外国专利法律的要求,可以获得所述保藏物。然而,应当理解,保藏物的可获得性并不构成对实施题述发明的许可,实施题述发明是对政府行为所授予的专利权的侵犯。
在本文中描述并要求保护的发明在范围上并不受本文中披露的具体方面所限制,因为这些方面旨在作为本发明几个方面的说明。旨在使任何等同的方面落在本发明的范围内。事实上,依据前述描述,除了那些在本文中显示并描述的之外,对于本发明的多种修饰对于本领域技术人员而言会是显而易见的。此类修饰亦旨在落在所附权利要求的范围之内。在出现冲突时,应以包括定义的本公开为准。
PCT
PCT/RO/134表
申请人或代理人档案号 | 国际申请号 |
关于微生物保藏的说明
(专利合作条约实施细则13之2)
PCT/RO/134表(1998年7月,2004年1月再版)
Claims (16)
1.一种具有有机磷水解酶活性的分离的多肽,所述多肽选自下组:
(a)包含氨基酸序列的多肽,所述氨基酸序列与SEQ ID NO:2的成熟多肽具有至少75%,更优选至少80%,甚至更优选至少85%,最优选至少90%和甚至最优选至少95%的同一性;
(b)由多核苷酸编码的多肽,所述多核苷酸在至少中高严格条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的DNA序列,或(iii)(i)或(ii)的全长互补链;
(c)由多核苷酸编码的多肽,所述多核苷酸包含与SEQ ID NO:1的成熟多肽编码序列具有至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,更优选至少90%,更优选至少95%,更优选至少96%,甚至更优选至少97%,最优选至少98%,且甚至最优选99%同一性的核苷酸序列;
(d)SEQ ID NO:2的成熟多肽的包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。
2.权利要求1的多肽,包含SEQ ID NO:2的氨基酸序列或其具有有机磷水解酶活性的片段,或由SEQ ID NO:2的氨基酸序列或其具有有机磷水解酶活性的片段组成。
3.权利要求2的多肽,包含SEQ ID NO:2的成熟多肽,或由SEQ ID NO:2的成熟多肽组成。
4.权利要求1的多肽,其由多核苷酸编码,所述多核苷酸包含SEQ IDNO:1的核苷酸序列或其编码具有有机磷水解酶活性的片段的亚序列,或由SEQ ID NO:1的核苷酸序列或其编码具有有机磷水解酶活性的片段的亚序列组成。
5.权利要求4的多肽,其由多核苷酸编码,所述多核苷酸包含SEQ IDNO:1的成熟多肽编码序列或由SEQ ID NO:1的成熟多肽编码序列组成。
6.一种分离的多核苷酸,包含编码权利要求1-5任一项的多肽的核苷酸序列。
7.一种核酸构建体,其包含与一种或多种(几种)调控序列可操作地连接的权利要求6的多核苷酸,所述调控序列在表达宿主中指导所述多肽的产生。
8.一种重组表达载体,其包含权利要求7的核酸构建体。
9.一种重组宿主细胞,其包含权利要求7的核酸构建体或包含权利要求8的表达载体。
10.一种产生权利要求1-5任一项的多肽的方法,其包括:(a)在有助于产生多肽的条件下培养以其野生型形式产生所述多肽的细胞;和(b)回收所述多肽。
11.一种产生权利要求1-5任一项的多肽的方法,其包括:(a)在有助于产生多肽的条件下培养包含核酸构建体的宿主细胞,所述核酸构建体包含编码所述多肽的核苷酸序列,和(b)回收所述多肽。
12.一种产生蛋白质的方法,包括:(a)在有助于产生蛋白质的条件下培养权利要求9的重组宿主细胞;和(b)回收所述蛋白质。
13.一种包含权利要求1-5中任一项的多肽的组合物。
14.权利要求13的组合物,其中所述组合物是微乳剂或洗剂。
15.权利要求1-5任一项的多肽或权利要求13或14的组合物用于对经至少一种有害的或不希望的有机磷化合物污染的区域或装置进行去污染的用途,优选地,其中所述至少一种有害的或不希望的有机磷化合物选自G试剂、V试剂和农药。
16.通过添加权利要求1-5任一项的多肽或权利要求13和14的组合物用于去除有机磷化合物的方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP09159520A EP2248893A1 (en) | 2009-05-06 | 2009-05-06 | DFPase Enzymes from Octopus Vulgaris |
EP09159520.7 | 2009-05-06 | ||
PCT/EP2010/056204 WO2010128115A1 (en) | 2009-05-06 | 2010-05-06 | Dfpase enzymes from octopus vulgaris |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102414316A true CN102414316A (zh) | 2012-04-11 |
Family
ID=40912062
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010800197908A Pending CN102414316A (zh) | 2009-05-06 | 2010-05-06 | 来自普通章鱼的dfp酶 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20120100596A1 (zh) |
EP (2) | EP2248893A1 (zh) |
CN (1) | CN102414316A (zh) |
WO (1) | WO2010128115A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109234250A (zh) * | 2012-05-31 | 2019-01-18 | 诺维信公司 | 具有有机磷水解酶活性的多肽 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9771566B2 (en) | 2013-11-28 | 2017-09-26 | Novozymes A/S | Organophosphorous hydrolase variants |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK122686D0 (da) | 1986-03-17 | 1986-03-17 | Novo Industri As | Fremstilling af proteiner |
US5223409A (en) | 1988-09-02 | 1993-06-29 | Protein Engineering Corp. | Directed evolution of novel binding proteins |
IL99552A0 (en) | 1990-09-28 | 1992-08-18 | Ixsys Inc | Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof |
DE4343591A1 (de) | 1993-12-21 | 1995-06-22 | Evotec Biosystems Gmbh | Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
CN1192108C (zh) | 1994-06-03 | 2005-03-09 | 诺沃奇梅兹生物技术有限公司 | 纯化的毁丝霉属漆酶及编码该酶的核酸 |
ATE294871T1 (de) | 1994-06-30 | 2005-05-15 | Novozymes Biotech Inc | Nicht-toxisches, nicht-toxigenes, nicht- pathogenes fusarium expressionssystem und darin zu verwendende promotoren und terminatoren |
DE19808192A1 (de) | 1998-02-27 | 1999-09-09 | Rueterjans | Diisopropylfluorophosphatase sowie deren Verwendung und Herstellung |
WO2000024883A1 (en) | 1998-10-26 | 2000-05-04 | Novozymes A/S | Constructing and screening a dna library of interest in filamentous fungal cells |
EP1194572A2 (en) | 1999-03-22 | 2002-04-10 | Novozymes Biotech, Inc. | Promoter sequences derived from fusarium venenatum and uses thereof |
JP2009517002A (ja) * | 2005-04-06 | 2009-04-30 | ヴェレニウム コーポレイション | 化学及び生物兵器の広域特異性除染のための酵素及び処方物 |
MX2008002485A (es) | 2005-08-26 | 2008-04-03 | Novozymes As | Polipeptidos que tienen actividad antimicrobiana y polinucleotidos que los codifican. |
-
2009
- 2009-05-06 EP EP09159520A patent/EP2248893A1/en not_active Ceased
-
2010
- 2010-05-06 EP EP10718168A patent/EP2427548A1/en not_active Withdrawn
- 2010-05-06 WO PCT/EP2010/056204 patent/WO2010128115A1/en active Application Filing
- 2010-05-06 US US13/319,276 patent/US20120100596A1/en not_active Abandoned
- 2010-05-06 CN CN2010800197908A patent/CN102414316A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109234250A (zh) * | 2012-05-31 | 2019-01-18 | 诺维信公司 | 具有有机磷水解酶活性的多肽 |
Also Published As
Publication number | Publication date |
---|---|
US20120100596A1 (en) | 2012-04-26 |
WO2010128115A1 (en) | 2010-11-11 |
EP2248893A1 (en) | 2010-11-10 |
EP2427548A1 (en) | 2012-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2509427B1 (en) | Methods of producing gh8 xylanase variants | |
EP2638135B1 (en) | Polypeptides having phospholipase c activity and polynucleotides encoding same | |
CN102066409A (zh) | 具有阿魏酸酯酶活性的多肽和编码该多肽的多核苷酸 | |
CN101802180A (zh) | 真菌过氧合酶和应用方法 | |
CN101932704A (zh) | 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸 | |
CN101939420A (zh) | 具有阿魏酸酯酶活性的多肽和编码该多肽的多核苷酸 | |
CN105899660A (zh) | 通过酶的ph-稳定化来提高产率 | |
US9447392B2 (en) | DFPase enzymes from aplysia californica | |
CN101952303A (zh) | 提高目标蛋白质的表达产率的方法 | |
CN104364371B (zh) | 具有有机磷水解酶活性的多肽 | |
CN102414316A (zh) | 来自普通章鱼的dfp酶 | |
CN101918580A (zh) | 合酶抑制剂筛选方法 | |
US20110039301A1 (en) | Polypeptides Having Organophosphorous Hydrolase Activity and Polynucleotides Encoding Same | |
californica DFPase | T7 promoter\ | |
CN105992818A (zh) | 有机磷水解酶变体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20120411 |