CN116536280A - 2-酮戊二酸依赖性双加氧酶及其应用 - Google Patents
2-酮戊二酸依赖性双加氧酶及其应用 Download PDFInfo
- Publication number
- CN116536280A CN116536280A CN202310719497.1A CN202310719497A CN116536280A CN 116536280 A CN116536280 A CN 116536280A CN 202310719497 A CN202310719497 A CN 202310719497A CN 116536280 A CN116536280 A CN 116536280A
- Authority
- CN
- China
- Prior art keywords
- seq
- polypeptide
- ketoglutarate
- amino acid
- dependent dioxygenase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108010028143 Dioxygenases Proteins 0.000 title claims abstract description 84
- 102000016680 Dioxygenases Human genes 0.000 title claims abstract description 84
- 230000001419 dependent effect Effects 0.000 title claims abstract description 84
- KPGXRSRHYNQIFN-UHFFFAOYSA-N 2-oxoglutaric acid Chemical compound OC(=O)CCC(=O)C(O)=O KPGXRSRHYNQIFN-UHFFFAOYSA-N 0.000 title claims abstract description 81
- 229920001184 polypeptide Polymers 0.000 claims abstract description 142
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 142
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 142
- ZPIKVDODKLJKIN-NSHDSACASA-N Senkyunolide Chemical compound C1CC=CC2=C1[C@H](CCCC)OC2=O ZPIKVDODKLJKIN-NSHDSACASA-N 0.000 claims abstract description 78
- HJXMNVQARNZTEE-UHFFFAOYSA-N Butylphthalide Chemical compound C1=CC=C2C(CCCC)OC(=O)C2=C1 HJXMNVQARNZTEE-UHFFFAOYSA-N 0.000 claims abstract description 77
- 229950005197 butylphthalide Drugs 0.000 claims abstract description 38
- 230000000694 effects Effects 0.000 claims description 74
- 102000040430 polynucleotide Human genes 0.000 claims description 65
- 108091033319 polynucleotide Proteins 0.000 claims description 65
- 239000002157 polynucleotide Substances 0.000 claims description 65
- 108090000623 proteins and genes Proteins 0.000 claims description 49
- 238000000034 method Methods 0.000 claims description 31
- IQVQXVFMNOFTMU-FLIBITNWSA-N (Z)-ligustilide Chemical compound C1CC=CC2=C1C(=C/CCC)/OC2=O IQVQXVFMNOFTMU-FLIBITNWSA-N 0.000 claims description 30
- IQVQXVFMNOFTMU-DHZHZOJOSA-N Z-ligustilide Natural products C1CC=CC2=C1C(=C/CCC)\OC2=O IQVQXVFMNOFTMU-DHZHZOJOSA-N 0.000 claims description 29
- 150000001413 amino acids Chemical class 0.000 claims description 29
- -1 phthalide compound Chemical class 0.000 claims description 26
- 102000004169 proteins and genes Human genes 0.000 claims description 26
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 24
- 239000013598 vector Substances 0.000 claims description 24
- 241000112528 Ligusticum striatum Species 0.000 claims description 22
- 230000035772 mutation Effects 0.000 claims description 17
- 102000004190 Enzymes Human genes 0.000 claims description 14
- 108090000790 Enzymes Proteins 0.000 claims description 14
- 241000244365 Ligusticum sinense Species 0.000 claims description 13
- 230000014509 gene expression Effects 0.000 claims description 13
- WNZQDUSMALZDQF-UHFFFAOYSA-N isobenzofuranone Natural products C1=CC=C2C(=O)OCC2=C1 WNZQDUSMALZDQF-UHFFFAOYSA-N 0.000 claims description 12
- 150000007523 nucleic acids Chemical group 0.000 claims description 12
- 101710145473 2-oxoglutarate-dependent dioxygenase Proteins 0.000 claims description 11
- RSKPJCDZAFMWHH-UHFFFAOYSA-N 3-but-1-enyl-3h-2-benzofuran-1-one Chemical compound C1=CC=C2C(C=CCC)OC(=O)C2=C1 RSKPJCDZAFMWHH-UHFFFAOYSA-N 0.000 claims description 11
- 230000000295 complement effect Effects 0.000 claims description 11
- 239000000758 substrate Substances 0.000 claims description 10
- 238000012217 deletion Methods 0.000 claims description 9
- 230000037430 deletion Effects 0.000 claims description 9
- 238000003780 insertion Methods 0.000 claims description 9
- 230000037431 insertion Effects 0.000 claims description 9
- 108091092584 GDNA Proteins 0.000 claims description 8
- 102220465288 Interferon alpha-8_W180A_mutation Human genes 0.000 claims description 8
- 102220498084 Lipoma-preferred partner_Y76L_mutation Human genes 0.000 claims description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 8
- 102220489081 Phosphatidylinositol transfer protein alpha isoform_Y102A_mutation Human genes 0.000 claims description 8
- 238000006467 substitution reaction Methods 0.000 claims description 8
- 125000000539 amino acid group Chemical group 0.000 claims description 7
- 150000001875 compounds Chemical class 0.000 claims description 7
- 102000039446 nucleic acids Human genes 0.000 claims description 6
- 108020004707 nucleic acids Proteins 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 5
- 102220626871 Alpha-1,3-mannosyl-glycoprotein 4-beta-N-acetylglucosaminyltransferase A_Q66A_mutation Human genes 0.000 claims description 4
- 125000004432 carbon atom Chemical group C* 0.000 claims description 4
- 238000002360 preparation method Methods 0.000 claims description 3
- 239000004382 Amylase Substances 0.000 claims description 2
- 150000001335 aliphatic alkanes Chemical class 0.000 claims description 2
- 125000005506 phthalide group Chemical group 0.000 claims description 2
- 125000001424 substituent group Chemical group 0.000 claims description 2
- 102220012692 rs397516277 Human genes 0.000 claims 2
- 238000002474 experimental method Methods 0.000 abstract description 4
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 30
- 108020004414 DNA Proteins 0.000 description 25
- 210000004027 cell Anatomy 0.000 description 22
- 102000053602 DNA Human genes 0.000 description 16
- 241000208125 Nicotiana Species 0.000 description 16
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 16
- 239000013612 plasmid Substances 0.000 description 16
- 239000013604 expression vector Substances 0.000 description 15
- 241000589158 Agrobacterium Species 0.000 description 12
- 241000196324 Embryophyta Species 0.000 description 11
- 239000000203 mixture Substances 0.000 description 10
- 238000003752 polymerase chain reaction Methods 0.000 description 10
- 238000000746 purification Methods 0.000 description 10
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 9
- 230000003197 catalytic effect Effects 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 9
- 238000004519 manufacturing process Methods 0.000 description 9
- 239000002299 complementary DNA Substances 0.000 description 8
- 238000001514 detection method Methods 0.000 description 8
- 239000000499 gel Substances 0.000 description 8
- 238000003259 recombinant expression Methods 0.000 description 8
- 238000012163 sequencing technique Methods 0.000 description 8
- 241000894006 Bacteria Species 0.000 description 7
- 238000002347 injection Methods 0.000 description 7
- 239000007924 injection Substances 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 239000000523 sample Substances 0.000 description 7
- 239000006228 supernatant Substances 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 241000207746 Nicotiana benthamiana Species 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 238000010367 cloning Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- WMBOCUXXNSOQHM-FLIBITNWSA-N (Z)-3-butylidenephthalide Chemical compound C1=CC=C2C(=C/CCC)/OC(=O)C2=C1 WMBOCUXXNSOQHM-FLIBITNWSA-N 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 5
- 238000012300 Sequence Analysis Methods 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 238000000227 grinding Methods 0.000 description 5
- 238000011534 incubation Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 239000002773 nucleotide Substances 0.000 description 5
- 125000003729 nucleotide group Chemical group 0.000 description 5
- 238000011084 recovery Methods 0.000 description 5
- KZMAWJRXKGLWGS-UHFFFAOYSA-N 2-chloro-n-[4-(4-methoxyphenyl)-1,3-thiazol-2-yl]-n-(3-methoxypropyl)acetamide Chemical compound S1C(N(C(=O)CCl)CCCOC)=NC(C=2C=CC(OC)=CC=2)=C1 KZMAWJRXKGLWGS-UHFFFAOYSA-N 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- BZLVMXJERCGZMT-UHFFFAOYSA-N Methyl tert-butyl ether Chemical compound COC(C)(C)C BZLVMXJERCGZMT-UHFFFAOYSA-N 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000012258 culturing Methods 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- WMBOCUXXNSOQHM-UHFFFAOYSA-N n-butylidenephthalide Natural products C1=CC=C2C(=CCCC)OC(=O)C2=C1 WMBOCUXXNSOQHM-UHFFFAOYSA-N 0.000 description 4
- 238000010839 reverse transcription Methods 0.000 description 4
- 238000007702 DNA assembly Methods 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 108090000854 Oxidoreductases Proteins 0.000 description 3
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 238000010804 cDNA synthesis Methods 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 3
- 238000001035 drying Methods 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 239000003292 glue Substances 0.000 description 3
- 238000005286 illumination Methods 0.000 description 3
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 239000012074 organic phase Substances 0.000 description 3
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 3
- 238000010926 purge Methods 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000009261 transgenic effect Effects 0.000 description 3
- 238000002137 ultrasound extraction Methods 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- 241000972773 Aulopiformes Species 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 235000019750 Crude protein Nutrition 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 241000620209 Escherichia coli DH5[alpha] Species 0.000 description 2
- 206010064571 Gene mutation Diseases 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 208000002193 Pain Diseases 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 108700005078 Synthetic Genes Proteins 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 238000010805 cDNA synthesis kit Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 239000003797 essential amino acid Substances 0.000 description 2
- 235000020776 essential amino acid Nutrition 0.000 description 2
- 239000011536 extraction buffer Substances 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 238000004108 freeze drying Methods 0.000 description 2
- 239000001307 helium Substances 0.000 description 2
- 229910052734 helium Inorganic materials 0.000 description 2
- SWQJXJOGLNCZEY-UHFFFAOYSA-N helium atom Chemical compound [He] SWQJXJOGLNCZEY-UHFFFAOYSA-N 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N iron Substances [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 238000007834 ligase chain reaction Methods 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 239000004570 mortar (masonry) Substances 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- 239000012466 permeate Substances 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 description 2
- 235000013809 polyvinylpolypyrrolidone Nutrition 0.000 description 2
- 229920000523 polyvinylpolypyrrolidone Polymers 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 238000007670 refining Methods 0.000 description 2
- 235000019515 salmon Nutrition 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012106 screening analysis Methods 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 239000011534 wash buffer Substances 0.000 description 2
- USZVTXIEQADBGH-UHFFFAOYSA-N 2-butan-2-yloxycarbonylbenzoic acid Chemical group CCC(C)OC(=O)C1=CC=CC=C1C(O)=O USZVTXIEQADBGH-UHFFFAOYSA-N 0.000 description 1
- DQXVTXZOCXIHLT-UHFFFAOYSA-N 3-but-1-enyl-4,5-dihydro-3H-2-benzofuran-1-one Chemical compound C(=CCC)C1OC(C=2C=CCCC12)=O DQXVTXZOCXIHLT-UHFFFAOYSA-N 0.000 description 1
- ZPIKVDODKLJKIN-UHFFFAOYSA-N 3-butyl-4,5-dihydro-3h-2-benzofuran-1-one Chemical compound C1CC=CC2=C1C(CCCC)OC2=O ZPIKVDODKLJKIN-UHFFFAOYSA-N 0.000 description 1
- 208000004998 Abdominal Pain Diseases 0.000 description 1
- 201000000736 Amenorrhea Diseases 0.000 description 1
- 206010001928 Amenorrhoea Diseases 0.000 description 1
- 241000208173 Apiaceae Species 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 108030002893 DNA oxidative demethylases Proteins 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 101100136092 Drosophila melanogaster peng gene Proteins 0.000 description 1
- 208000005171 Dysmenorrhea Diseases 0.000 description 1
- 206010013935 Dysmenorrhoea Diseases 0.000 description 1
- CWYNVVGOOAEACU-UHFFFAOYSA-N Fe2+ Chemical compound [Fe+2] CWYNVVGOOAEACU-UHFFFAOYSA-N 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 206010019233 Headaches Diseases 0.000 description 1
- 208000032382 Ischaemic stroke Diseases 0.000 description 1
- 241000244355 Ligusticum Species 0.000 description 1
- 208000037093 Menstruation Disturbances Diseases 0.000 description 1
- 206010027339 Menstruation irregular Diseases 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108020005089 Plant RNA Proteins 0.000 description 1
- 102000004079 Prolyl Hydroxylases Human genes 0.000 description 1
- 108010043005 Prolyl Hydroxylases Proteins 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 206010042674 Swelling Diseases 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 231100000540 amenorrhea Toxicity 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 238000012870 ammonium sulfate precipitation Methods 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 230000003110 anti-inflammatory effect Effects 0.000 description 1
- 230000003064 anti-oxidating effect Effects 0.000 description 1
- 230000002785 anti-thrombosis Effects 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 239000012876 carrier material Substances 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 208000026106 cerebrovascular disease Diseases 0.000 description 1
- 238000011098 chromatofocusing Methods 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000011033 desalting Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 230000002526 effect on cardiovascular system Effects 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 239000005090 green fluorescent protein Substances 0.000 description 1
- 231100000869 headache Toxicity 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 108010051351 iron(II) oxygenase Proteins 0.000 description 1
- 238000001155 isoelectric focusing Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 125000005647 linker group Chemical group 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000011259 mixed solution Substances 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000002731 protein assay Methods 0.000 description 1
- 238000000751 protein extraction Methods 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000012807 shake-flask culturing Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N silicon dioxide Inorganic materials O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000010563 solid-state fermentation Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000001694 spray drying Methods 0.000 description 1
- 230000008961 swelling Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 229940126680 traditional chinese medicines Drugs 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 230000000472 traumatic effect Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 230000024883 vasodilation Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0069—Oxidoreductases (1.) acting on single donors with incorporation of molecular oxygen, i.e. oxygenases (1.13)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/02—Oxygen as only ring hetero atoms
- C12P17/04—Oxygen as only ring hetero atoms containing a five-membered hetero ring, e.g. griseofulvin, vitamin C
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y113/00—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13)
- C12Y113/12—Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13) with incorporation of one atom of oxygen (internal monooxygenases or internal mixed function oxidases)(1.13.12)
- C12Y113/12019—2-Oxuglutarate dioxygenase (ethylene-forming) (1.13.12.19)
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明涉及一种2‑酮戊二酸依赖性双加氧酶及其应用。本发明的多肽与SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21的多肽具有至少60%,至少65%,至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列相似性。实验证明,本发明的多肽具有2‑酮戊二酸依赖性双加氧酶的功能,能够催化洋川芎内酯A生成丁苯酞。本发明对有效解决丁苯酞资源稀缺问题具有重要意义。
Description
技术领域
本发明涉及一种具有2-酮戊二酸依赖性双加氧酶功能的多肽、编码该多肽的多核苷酸、含有该多核苷酸的核酸构建体、重组载体和宿主细胞。本发明还涉及制备丁苯酞的方法。
背景技术
川芎(Ligusticum chuanxiong Hort.)是伞形科藁本属植物,根入药,在我国主要分布在四川。川芎在传统中药中用于月经不调,经闭痛经,症瘕腹痛,胸胁刺痛,跌扑肿痛,头痛,风湿痹痛等相关疾病的治疗。目前,已有近60种苯酞类化合物从川芎中被分离出来,其中主要包括藁本内酯、洋川芎内酯A、丁烯基苯酞和丁苯酞等化合物。它们具有舒张血管、抗氧化、抗血栓、抗菌消炎等多种药理作用。其中,丁苯酞在临床上主要被用来治疗慢性或急性的缺血性脑卒中。随着人们生活水平的提高,同时伴随着心脑血管疾病的发病率逐年增长,含有川芎的药品的临床需求量日益增大。
巨大的市场需求使得很多科学家投身到丁苯酞的合成研究中,大部分研究集中于丁苯酞的化学合成。然而,化学合成过程中会代入很多杂质且很难被去除,影响丁苯酞原料药的质量。由于苯酞类物质的良好应用前景,产业上迫切需要一种不依赖于天然提取途径的3-取代苯酞类化合物的合成方法。因此,去解析丁苯酞的合成路径,可突破化学合成中面临的产业瓶颈,有助于推进丁苯酞原料药的来源的多样性。
发明内容
本发明提供了具有2-酮戊二酸依赖性双加氧酶活性的多肽,也可以说是属于2-酮戊二酸依赖性双加氧酶家族的多肽。
本发明的多肽可以是氨基酸序列为SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21的多肽。
本发明的多肽还可以是氨基酸序列与SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21具有至少10%或至少12%或至少14%或至少15%或至少16%或至少17%或至少18%或至少19%或至少20%或至少21%或至少22%或至少24%或至少26%或至少28%或至少29%或至少30%或至少31%或至少32%或至少34%或至少36%或至少38%或至少40%或至少42%或至少44%或至少46%或至少48%或至少50%或至少52%或至少54%或至少56%或至少58%或至少59%或至少60%或至少65%或至少70%或至少75%或至少80%或至少81%或至少82%或少83%或至少84%或至少85%或至少86%或至少87%或至少88%或至少89%或至少90%或至少91%或至少92%或至少93%或至少94%或至少95%或至少96%或至少97%或至少98%或至少99%以上相似性的多肽,且该多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员;其中,2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性,还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。
本发明的多肽还可以是氨基酸序列与SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21具有至少10%或至少12%或至少14%或至少15%或至少16%或至少17%或至少18%或至少19%或至少20%或至少21%或至少22%或至少24%或至少26%或至少28%或至少29%或至少30%或至少31%或至少32%或至少34%或至少36%或至少38%或至少40%或至少42%或至少44%或至少46%或至少48%或至少50%或至少52%或至少54%或至少56%或至少58%或至少59%或至少60%或至少65%或至少70%或至少75%或至少80%或至少81%或至少82%或少83%或至少84%或至少85%或至少86%或至少87%或至少88%或至少89%或至少90%或至少91%或至少92%或至少93%或至少94%或至少95%或至少96%或至少97%或至少98%或至少99%以上相似性的多肽,且该多肽来源于川芎(Ligusticum chuanxiong hort.),且该多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员;其中,2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性,还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。
本发明的多肽还可以是由如下多核苷酸编码得到的多肽:(a)SEQ ID NO:2或SEQID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20所示的多核苷酸;(b)核酸序列与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ IDNO:20具有60%以上相似性的多核苷酸;(c)在严格条件下与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ IDNO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20所示多核苷酸或其互补序列或其gDNA杂交的多核苷酸,该多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员;其中,2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性,还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。
本发明的多肽包括与SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21具有至少10%或至少12%或至少14%或至少15%或至少16%或至少17%或至少18%或至少19%或至少20%或至少21%或至少22%或至少24%或至少26%或至少28%或至少29%或至少30%或至少31%或至少32%或至少34%或至少36%或至少38%或至少40%或至少42%或至少44%或至少46%或至少48%或至少50%或至少52%或至少54%或至少56%或至少58%或至少59%或至少60%或至少65%或至少70%或至少75%或至少80%或至少81%或至少82%或少83%或至少84%或至少85%或至少86%或至少87%或至少88%或至少89%或至少90%或至少91%或至少92%或至少93%或至少94%或至少95%或至少96%或至少97%或至少98%或至少99%以上相似性的多肽的任何等位变体。多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员;其中,2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性,还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。其中,多肽的等位变体是由等位基因变体编码产生的。等位基因变体是指同一染色体基因座上两种或更多种基因中的任何一种。等位基因变体是由自然突变产生的,可在群体内导致多态性的产生。基因突变可以是沉默的(不改变其编码的多肽)或者是导致其编码的多肽的氨基酸序列的改变。
本发明的多肽还可是在SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ IDNO:17或SEQ ID NO:19或SEQ ID NO:21的基础上进行一个位置或多个位置的氨基酸残基替换、插入和/或缺失后得到的多肽突变体,该多肽突变体具有2-酮戊二酸依赖性双加氧酶活性或该多肽突变体是2-酮戊二酸依赖性双加氧酶家族的成员;其中,2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性,还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。
其中,氨基酸取代、缺失和/或插入的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个。这种替换、插入和/或缺失可以是在非必需氨基酸位置上进行的。本领域技术人员可以利用现有技术来推断序列的必需氨基酸,例如动力学参数测定法、X射线晶体结构分析法、定点诱变法等。
本发明的多肽还可是在SEQ ID NO:1所示氨基酸序列的基础上,在如下任意一个位置或任意几个位置进行氨基酸残基替换、插入和/或缺失后得到的多肽突变体:自其N端起第180位氨基酸、第102位氨基酸、第76位氨基酸、第165位氨基酸、第66位氨基酸(尤其是第180位、第102位、第76位),该多肽突变体具有2-酮戊二酸依赖性双加氧酶活性或该多肽突变体是2-酮戊二酸依赖性双加氧酶家族的成员;其中,2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性,还可将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。
本发明的多肽还可是在SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ IDNO:19或SEQ ID NO:21所示氨基酸序列的基础上,在如下任意一个位置或任意几个位置进行氨基酸残基替换、插入和/或缺失后得到的多肽突变体:与自SEQ ID NO:1的N端起第180位氨基酸、第102位氨基酸、第76位氨基酸、第165位氨基酸、第66位氨基酸(尤其是第180位、第102位、第76位)对应的位置;该多肽突变体具有2-酮戊二酸依赖性双加氧酶活性或该多肽突变体是2-酮戊二酸依赖性双加氧酶家族的成员;其中,2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性,还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。
本发明的多肽还可是在SEQ ID NO:1所示氨基酸序列的基础上,进行如下任意一种或任意几种的突变后得到的多肽突变体:W180A、Y102A、Y76F、G165A、Q66A(尤其是W180A、Y102A、Y76F);该多肽突变体具有2-酮戊二酸依赖性双加氧酶活性或该多肽突变体是2-酮戊二酸依赖性双加氧酶家族的成员;其中,2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性,还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。
本发明的多肽还可是在SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ IDNO:19或SEQ ID NO:21所示氨基酸序列的基础上,以SEQ ID NO:1为参照,在相对应的位置上进行相应的氨基酸种类突变后得到的多肽突变体;其中,SEQ ID NO:1中相应位置和相应氨基酸突变种类为如下的任一种或任几种:W180A、Y102A、Y76F、G165A、Q66A(尤其是W180A、Y102A、Y76F);该多肽突变体具有2-酮戊二酸依赖性双加氧酶活性或该多肽突变体是2-酮戊二酸依赖性双加氧酶家族的成员;其中,2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性,还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。
本发明的多肽包括由如下多核苷酸编码得到的多肽:(a)SEQ ID NO:2或SEQ IDNO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20所示的多核苷酸;(b)核酸序列与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20具有60%以上相似性的多核苷酸;(c)在严格条件下与SEQ ID NO:2或SEQ ID NO:4或SEQID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20所示多核苷酸或其互补序列或其gDNA杂交的多核苷酸,该多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员。严格条件指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃、于5X SSPE、0.3%SDS、200μg/mL剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。使用0.2X SSC、0.2%SDS,在70℃下洗涤三次,每次15分钟。互补序列可以是完全互补序列,也可以是不完全互补序列。
本发明的多肽包括SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21所示多肽或其等位变体或其突变体或如上多核苷酸编码的多肽与另一种多肽形成的融合多肽或可切割的融合多肽。该另一种多肽在SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21所示多肽或其等位变体或其突变体或如上多核苷酸编码的多肽的N-末端或C-末端处融合。融合多肽可进一步包含两个多肽之间的切割位点,在融合蛋白分泌之时,该位点被切割,从而释放出这两种多肽。其中另一种多肽包括但不限于组氨酸等纯化标签、标记蛋白(如荧光蛋白,进一步如红色荧光蛋白、绿色荧光蛋白等)或信号肽等。
本发明的多肽还包括上面以所述多肽(SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21所示多肽或其等位变体或其突变体或如上多核苷酸编码的多肽)的截短体,该截短体具有2-酮戊二酸依赖性双加氧酶活性或该截短体是2-酮戊二酸依赖性双加氧酶家族的成员;其中,2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性,还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。
编码上述任一所述多肽的多核苷酸也属于本发明的保护范围。多核苷酸可以是DNA、RNA或cDNA。
所述多核苷酸为如下(1)或(2)或(3):
(1)包含SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ IDNO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20的多核苷酸;
(2)核酸序列与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20具有至少60%或至少65%或至少70%或至少75%或至少80%或至少81%或至少82%或少83%或至少84%或至少85%或至少86%或至少87%或至少88%或至少89%或至少90%或至少91%或至少92%或至少93%或至少94%或至少95%或至少96%或至少97%或至少98%或至少99%以上序列相似性的多核苷酸,且该多核苷酸编码的多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员;其中,2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性,还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。
(3)在严格条件下与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQID NO:18或SEQ ID NO:20所示多核苷酸或其互补体或其gDNA杂交的多核苷酸,且该多核苷酸编码的多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员;其中,2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性,还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。
严格条件指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃、于5X SSPE、0.3%SDS、200μg/mL剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。运载体材料最终使用0.2X SSC、0.2%SDS,在70℃下洗涤三次,每次15分钟。
互补序列可以是完全互补序列,也可以是不完全互补序列。
分离或克隆多核苷酸的技术是本领域已知的,既可以从基因组DNA也可以从cDNA中进行分离。技术可以是聚合酶链式反应(PCR)、抗体文库筛选,还可以是其他核酸扩增程序,例如连接酶链式反应(LCR)、连接激活转录(LAT)和基于多核苷酸的扩增(NASBA)。该多核苷酸可以是多核苷酸的多肽编码区的等位基因或种类变体。
本发明的多核苷酸包括与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:14或SEQ IDNO:16或SEQ ID NO:18或SEQ ID NO:20的多核苷酸具有至少60%,至少65%,至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列相似性的多核苷酸的任何等位基因变体,且多核苷酸的任何等位变体编码的多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员;其中,2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性,还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。等位基因变体是指同一染色体基因座上两种或更多种基因中的任何一种。等位基因变体是由自然突变产生的,可在群体内导致多态性的产生。基因突变可以是沉默的(不改变其编码的多肽)或者是导致其编码的多肽的氨基酸序列的改变。
本发明的多核苷酸包括来源于药物植物川芎(Ligusticum chuanxiong Hort.)且与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ IDNO:20的多核苷酸具有至少60%,至少65%,至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列相似性,且编码的多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员;其中,2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性,还可是将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。
本发明的多核苷酸包括在SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:14或SEQ IDNO:16或SEQ ID NO:18或SEQ ID NO:20的基础上对一个或多个位置的碱基进行突变和/或修饰后得到的多核苷酸。这种突变或修饰包括密码子优化、简并碱基设计、甲基化修饰等等。实现这种修饰或突变的途径是本领域公知的,包括但不限于:插入、缺失,易错PCR,不同序列的重新连接,序列的不同部分与其他来源的同源序列进行定向进化,化学试剂诱变。
本发明的多核苷酸还包括编码上述任一所述融合多肽或截短体的多核苷酸。
本发明还包括编码上述任一所述多肽的多核苷酸的重组载体、核酸构建体或重组宿主细胞。
本发明的重组载体包括重组表达载体或重组克隆载体,重组表达载体中涉及的载体可以是本领域公知的用于基因表达的载体,包括但不限于pEAQ-HT、pSuper-1300、pET-28a、pET30a、pET24b、pESC-Ura、pESC-Trp、pESC-Leu、pESC-His、pGEX2T、pTAex3、pYMB03,优选pSuper1300和pET24b。
其中表达指包括涉及多肽产生的任何步骤,包括但不限于:转录、转录后修饰、翻译、翻译后修饰、以及分泌。表达载体指直链或环状DNA分子,其包含编码多肽的多核苷酸并且可操作地连接至提供用于其表达的调控序列。
本发明涉及的核酸构建体包含可操作地连接至一个或多个调控序列的本发明的多核苷酸,该一个或多个控制序列指导该编码序列在适合的宿主细胞中的表达。调控序列与多核苷酸可以是同源的也可以是异源的。
调控序列指对于表达编码多肽的多核苷酸来说必需的核酸序列。调控序列与编码多肽的多核苷酸可以是同源的(即二者来自相同的基因),也可以是异源的(即二者来自不同的基因)。这种调控序列包括但不限于前导序列、启动子、信号肽序列、转录终止子、增强子等。最少,调控序列包括启动子、以及转录和翻译终止信号。控制序列可以通过接头与编码多肽的多核苷酸连接。
本发明还涉及重组宿主细胞,这些宿主细胞包含可操作地连接至一个或多个调控序列的本发明的多核苷酸,该一个或多个控制序列调控本发明的多肽的产生。将包含多核苷酸的构建体或载体引入到宿主细胞中,构建体或载体要么整合到宿主染色体上,要么不整合而自主复制。这些宿主细胞还包含由于复制期间出现突变而与亲本细胞不完全相同的任何亲本细胞后代。宿主细胞的选择将取决于编码该多肽的基因及其来源。
该宿主细胞可以是任何可以用于生产本发明多肽的微生物细胞。如原核细胞或真核细胞。原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。微生物细胞包括但不限于:链霉菌、假单孢菌、芽孢杆菌、酵母细胞、大肠杆菌。
将表达载体引入宿主细胞的方法是本领域已知的,包括但不限于电穿孔、聚乙二醇(PEG)转化、脂质转染、热休克、磷酸钙沉淀、病毒介导和显微注射。
本发明包括生产本发明多肽的方法,该方法包括如下步骤:在有利于多肽表达的条件下,使含有编码本发明多肽的多核苷酸的重组宿主细胞进行表达,得到本发明多肽。
本发明包括生产本发明多肽的方法,该方法包括在有利于产生本发明多肽的条件下培养本发明的重组宿主细胞,得到本发明多肽。本发明生产本发明多肽的方法还可包括回收该多肽的步骤。
可以通过摇瓶培养、或在实验室或工业发酵罐中小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)培养细胞,该培养在合适的培养基中并且在允许表达和/或分离多肽的条件下进行。如果多肽被分泌到该营养培养基中,那么可以直接从该培养基中回收该多肽。如果多肽不进行分泌,那么其可以从细胞裂解液中进行回收。
可以使用本领域公知的检测多肽的方法来检测多肽。这些检测方法包括但不限于:特异性抗体检测、酶活检测。
可以使用本领域已知的方法来回收多肽,包括但不限于:收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀。
可以使用本领域已知的方法来纯化多肽,包括但不限于:色谱法(例如,离子交换、亲和、疏水、色谱聚焦和尺寸排阻)、电泳程序(例如,制备型等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE。
本发明还包括生产本发明多肽的方法,该方法包括在有益于产生该多肽的条件下培养转基因植物或植物细胞的步骤,其中该转基因植物或植物细胞包含编码本发明多肽的多核苷酸。该生产本发明多肽的方法还可包括回收该多肽的步骤。
本发明还包括包含编码本发明上述任一所述多肽的多核苷酸或核酸构建体的重组植物细胞或植物体。植物细胞可为植物体任何部位的细胞,如根、茎、叶、发根等。植物体可包括外植体,具体包括但不限于:插条、组织培养物、细胞悬浮液和愈伤组织。植物种类包括但不限于川芎或烟草。
本发明还包括具有2-酮戊二酸依赖性双加氧酶活性的多肽或一种属于2-酮戊二酸依赖性双加氧酶家族的多肽,即为上述任一所述的本发明多肽。
本发明提供了一种制备苯酞类化合物的方法,包括如下步骤:以式Ⅰ和/或式Ⅱ所示化合物为底物,使其与酶接触,得到式Ⅲ和/或式Ⅳ所示苯酞类化合物,其中酶是2-酮戊二酸依赖性双加氧酶家族中的酶或该酶具有2-酮戊二酸依赖性双加氧酶活性;
其中,式Ⅰ,式Ⅱ,式Ⅲ或式Ⅳ中R为不含任何取代基的碳原子数为1~10的直链烷烃,其中碳原子数为1-2,1-3,1-4,1-5,1-6,1-7,1-8,1-9,1-10,2-3,2-4,2-5,2-6,2-7,2-8,2-9,2-10,3-4,3-5,3-6,3-7,3-8,3-9,3-10,4-5,4-6,4-7,4-8,4-9,或4-10,或具体为1,2,3,4,5,6,7,8,9,10。
上述方法中,酶为本发明上述多肽中的任意一种或几种,或者为下述蛋白提取物。
本发明的制备方法中,底物可以是任何能被本发明多肽催化成苯酞类化合物的底物,包括但不限于式Ⅱ所示洋川芎内酯A或式Ⅰ所示藁本内酯。
本发明的制备方法中,产物是苯酞类化合物,进一步为3-取代苯酞类化合物,包括但不限于式Ⅳ所示丁苯酞、式Ⅲ所示丁烯基苯酞。
当以洋川芎内酯A为底物时,可以生成丁苯酞。当以藁本内酯为底物时,可以生成丁烯基苯酞。
本发明还涉及一种蛋白提取物,是川芎(Ligusticum chuanxiong Hort.)根的总蛋白提取物,该提取物具有2-酮戊二酸依赖性双加氧酶活性。关于从植物中提取蛋白的方法是本领域公知的。作为本发明的一个较佳实施例,用提取缓冲液进行蛋白提取,所用的提取缓冲液包括终浓度为20mM Tris-HCl,pH7.5,10mM DTT(二硫苏糖醇,Dithiothreitol),15%Glycerol(甘油),1%PVPP(交联聚乙烯吡咯烷酮),1X Complete Mini ProteaseInhibitor(不含EDTA的completeTMMini蛋白酶抑制剂混合物)。
本发明的蛋白提取物中含有上述任一所述的本发明的具有2-酮戊二酸依赖性双加氧酶活性的多肽或该提取物中含有2-酮戊二酸依赖性双加氧酶家族的成员的多肽。如氨基酸序列包含SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21的多肽。
本文中的2-酮戊二酸依赖性双加氧酶活性可以是现有技术中所指的2-酮戊二酸依赖性双加氧酶家族中任何成员的活性,还可是本文中发现的将洋川芎内酯A或藁本内酯或类似物催化生成3-取代苯酞类化合物的活性。
本文中该酶还可称为:铁(Ⅱ)/2-酮戊二酸依赖性双加氧酶OGD[e(II)/2-oxoglutarate-dependent dioxygenase(OGD)]、丁苯酞合成酶、洋川芎内酯A氧化酶。
本文中洋川芎内酯A:CAS No.62006-39-7。化学全称为(3S)-3-丁基-4,5-二氢-1(3H)-异苯并呋喃酮。英文名称为Senkyunolide A。
本文中藁本内酯:CAS NO.4431-01-0。化学全称为3-丁烯基-4,5-二氢-1(3H)-异苯并呋喃酮。英文名称Ligustilide。
本文中丁苯酞:CAS NO.6066-49-5。化学全称为3-丁基-1(3H)-异苯并呋喃酮。英文名称为3-Butylphthalide。
本文中丁烯基苯酞:CAS NO.551-08-6。化学全称为3-亚丁基-1(3H)-异苯并呋喃酮。英文名3-Butylidenephthalide。
本文中3-取代苯酞类化合物:3-Substituted phthalides,其中包括丁苯酞和丁烯基苯酞等。
本文中序列相似性:两个氨基酸序列之间的关联度或者两个核苷酸序列之间的关联度用参数“序列相似性”来描述。
本文中3-取代苯酞类化合物(如丁苯酞或丁烯基苯酞)包括任何类型的光学异构体,包括但不限于左旋类型。
实验证明,本发明的多肽具有2-酮戊二酸依赖性双加氧酶的功能,能够催化洋川芎内酯A和藁本内酯生成丁苯酞和丁烯基苯酞。本发明对有效解决丁苯酞资源稀缺问题具有重要意义。
附图说明
图1川芎不同组织中丁苯酞的含量。
图2川芎根粗蛋白体外催化洋川芎内酯A生成丁苯酞和丁烯基苯酞(a,丁苯酞;b,丁烯基苯酞;c,洋川芎内酯A;d,藁本内酯)。
图3重组质粒Lc2OGD1/2的PCR鉴定结果。
图4GC-MS检测Lc2OGD1/2酶促产物的总离子色谱图(TIC)。A、丁苯酞;B、丁烯基苯酞。
图5Lc2OGD1/2主要酶促产物的质谱图。A、丁苯酞离子碎片;B、丁烯基苯酞离子碎片。
图6大肠杆菌表达的蛋白体催化洋川芎内酯A生成丁苯酞。
图7烟草中表达突变体后突变体催化洋川芎内酯A生成丁苯酞。
图8GC-MS检测Lc2OGD3/4/5/6催化洋川芎内酯A生成丁苯酞。
图9GC-MS检测Lc2OGD3/4/5/6催化藁本内酯丁烯基苯酞。
具体实施方式
以下结合实施例,进一步阐述本发明。这些实施例仅用于解释本发明而不用于限制本发明的范围。实施例中记载的技术术语,若无特殊说明,均为本领域的常规理解。此外,任何与所记载内容相似或相同的方法及材料都可用于本发明中。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。以下实施例中所使用的实验方法如何特殊说明,均采用常规方法。所用的材料、试剂和耗材等,如无特殊说明,均可从商业途径获得。
川芎(Ligusticum chuanxiong Hort.)植株为商品川芎,由四川省彭州市军乐镇农户购买,公众可自行采集或从中药材天地网上获得。
OMEGA Plant RNA Kit(Omega),Plus All-in-one 1st StrandcDNA Synthesis SuperMix(gDNA Purge)(Novoprotein),KOD One TM PCR Master Mix-Blue-(Toyobo),Gel&PCR Clean Up Kit(Omega),HiPure PCR Pure Micro Kit(Magen),HiPure Plasmid Micro Kit C(Magen),BamHⅠ(NEB),EocRⅠ(NEB),XbaⅠ(NEB),KpnⅠ(NEB),Fast DNA Assembly Mix(Cistrome),2×T5 Super PCR Mix(Colony)(北京擎科),StarMarker D2000(Genstar),DH5α(康体生命),GV3101(维地生物),引物合成(北京六合华大基因科技有限公司),基因测序(北京六合华大基因科技有限公司)。
GC-MS检测条件:GC-MS仪器为安捷伦7890B/7000C(美国Waldbronn安捷伦科技),质谱检测器参数:70eV,氦气流速1.2mL·min-1,色谱柱安捷伦HP-5MS(5%苯基甲基氧化硅,30m×250μm内径,0.25μm膜厚度);升温程序为50℃开始,以4℃/min升至130℃,再以2℃/min升至230℃,保留10min,再以2℃/min升至250℃,保留5min;氦气流量1.0mL/min,进样口250℃;进样方式,脉冲不分流,进样量,1μL。质朴条件:标准EI源(轰击能量为70eV),离子源温度230℃,接口温度280℃,扫描质荷比(m/z)为40-350,并以丁苯酞标准品或丁烯基苯酞标准品作为对照组,对产物进行定性定量分析。
实施例1、丁苯酞检测体系的构建
用机溶剂(如甲醇、乙酸乙酯或甲基叔丁基醚(MTBE))对川芎的根、茎和叶进去萃取,过0.22μm滤膜,采用高效液相色谱和质谱联用测定丁苯酞的含量。结果如图1所示,证明川芎根中的丁苯酞的含量高于川芎茎和叶,与传统用药部位一致。
实施例2、川芎根部总蛋白的提取与活性实验
取生长旺盛的川芎根,洗净后,液氮冷冻研磨,加入提取缓冲液(终浓度为20mMTris-HCl,pH7.5,10mM DTT,15%Glycerol,1%PVPP,1X Complete Mini ProteaseInhibitor)冰上孵育,每隔15min轻轻上下振荡几次,1小时后,4℃,13000rpm离心20min,收集上清。上清液分别用40%-80%硫酸铵沉淀,4℃过夜后,13000rpm离心20min,收集上清。过脱盐柱,用Pirece 660nm protein assay试剂进行蛋白浓度测定。
脱盐后的蛋白根据蛋白浓度,取蛋白总量为10μg,蛋白液为20μL,实验组加入100μM的洋川芎内酯A和/或藁本内酯,对照组为不加任何物质的原始粗蛋白,其他均相同,置于冰上孵育1小时,每15分钟,缓慢摇几次,1小时后,加入等体积的乙酸乙酯终止反应,13000rpm离心10min,0.22μM滤膜过滤后,通过GC-MS检测。
检测结果如图2所示,结果表明川芎根中存在酶,能够催化洋川芎内酯A和藁本内酯,生成丁苯酞和丁烯基苯酞。
实施例3、川芎中Lc2OGD1、Lc2OGD2的克隆和序列分析
1)Lc2OGD基因的筛选和序列分析
根据已测序的川芎基因组和转录组数据,通过注释、差异表达基因分析,在川芎的根转录组数据库中,找到4条具有完整开放阅读框的氧化酶基因,分别命名为Lc2OGD1、Lc2OGD2、Lc2OGD3和Lc2OGD4(Ligusticum chuanxiong Fe(II)/2-oxoglutarate-dependent dioxygenase)。通过序列比对分析,发现:Lc2OGD1、Lc2OGD2的氨基酸序列分别与胡萝卜中prolyl 4-hydroxylase 6和DNA oxidative demethylase最近似。Lc2OGD1、Lc2OGD2读码框氨基酸序列和核苷酸序列分别为SEQ ID No.1、SEQ ID No.2和SEQ IDNo.3、SEQ ID No.4所示。
2)川芎根的cDNA的合成
取适量川芎根(-80℃冰箱保存),液氮磨碎。采用法Trizon法提取川芎总RNA,提取后用DNase I及RNA纯化试剂盒,对所提取的总RNA进行精制,去除RNA中的基因组污染。
根据Novoprotein的第一链cDNA合成试剂盒Plus All-in-one 1stStrand cDNA Synthesis SuperMix(gDNA Purge)说明书进行操作,反转录体系如下:
(1)去基因组DNA反应:
42℃孵育5min,反应结束后冰上放置。
(2)逆转录反应:
50℃孵育30min,75℃孵育5min,终止反应。
cDNA样品于-20℃保存。
3)Lc2OGD的克隆
以Lc2OGD基因的核苷酸序列为依据,设计Lc2OGD基因的合成引物,引物包含XbaⅠ和KpnⅠ酶切位点序列。以川芎根的cDNA为模板,采用PCR的方法扩增Lc2OGD基因,与经XbaⅠ和KpnⅠ双酶切的线性pSuper1300载体重组,采用Fast DNA Assembly Mix试剂盒的方法获得重组质粒,并转入大肠杆菌DH5α后,提取质粒测序(北京六合华大基因科技有限公司),阳性重组质粒命名为pSuper1300-Lc2OGD。
其中Lc2OGD的扩增引物序列如下:
Lc2OGD1-Forward:
CTCGATACACCAAATCGACTCTAGAATGGCGACCAAGGCCAA(SEQ ID No.5下划线为载体序列)
Lc2OGD1-Reverse:
CCCTTGCTCACCATGGTACCCTACGCGGAGCAAGCATTACA(SEQ ID No.6下划线为载体序列)
Lc2OGD2-Forward:
CTCGATACACCAAATCGACTCTAGAATGGAGCAATTTGTGAGCAG(SEQ ID No.7下划线为载体序列)
Lc2OGD2-Reverse:
CCCTTGCTCACCATGGTACCTTACGACAGATAGTAGAACAA(SEQ ID No.8下划线为载体序列)
4)胶回收
胶回收步骤:
取PCR产物与DNA loading buffer混合,在1%琼脂糖凝胶上以140V电压电泳15分钟;
用刀片切割含有DNA片段的凝胶,尽可能靠近DNA片段切割,将切下的胶放入已经称重的1.5mL离心管中并称重,记下回收胶的重量;
加入等量的(V:m=1:1)Binging buffer,在50℃的水浴锅中孵育10min,期间颠倒混匀2-3次,促进胶融化,保证胶,全部溶解,在上柱前将凝胶混合物快速涡旋混匀一次;
转移最多750μL胶混合液到回收纯化柱中,13000rpm离心1min,弃透过液,然后将回收柱放回相同的收集管;
加入700μL Wash Buffer到纯化柱中,13000rpm离心1min,弃透过液,然后将纯化柱放回收集管中;
在13000rpm 1min,离心空的纯化柱,彻底去除残留的Wash Buffer;
将纯化柱移至1.5mL微量离心管,加入30-50μL ddH2O(65℃预热)于纯化柱,静置2min,13000rpm离心1min;
丢掉纯化柱,将纯化后的DNA储存在-80℃的冰箱中。
实施案例4、Lc2OGD1和Lc2OGD2的烟草异源表达
将实例3中的重组载体导入农杆菌GV3101中,使用该重组的农杆菌GV3101侵染本氏烟草叶片。用转入pSuper1300载体的农杆菌作为对照菌株,同时侵染本氏烟草叶片。本氏烟草培养培养于25℃,16h光照条件下,直到长至6片真叶时用于农杆菌的侵染。将含有重组质粒的农杆菌于28℃下培养OD600=1.0,用注射缓冲液重悬清洗一次菌体,然后于注射缓冲液中脱毒2h,室温,避光。注射缓冲液配方(即如下农杆菌重悬液)。然后,用1mL的无菌注射器于烟草的背面注射到烟草叶片内,避光过夜,培养于25℃,16h光照条件下,3天后,注射100μM的底物洋川芎内酯A或藁本内酯。注射底物1天后,收集烟草,储存于-80℃中备用。
农杆菌重悬液
实施例5Lc2OGD1和Lc2OGD2催化产物的提取与鉴定
烟草通过冷冻干燥后,用研钵磨成粉,每100mg烟草用2mL乙酸乙酯提取,提取物超声处理30min,12000rpm下4℃离心10min,收集上清,真空浓缩至0.5mL,用0.45μm尼龙过滤器将上清过滤至棕色样品瓶中,待进样。采用GC-MS对转基因烟草的丁苯酞含量和丁烯基苯酞含量进行检测。
重组质粒Lc2OGD1/2的PCR鉴定结果如图3,催化结果如图4和图5所示。图4和5中的结果表明,Lc2OGD1和Lc2OGD能够催化洋川芎内酯A和生成丁苯酞和丁烯基苯酞。
实施例6大肠杆菌中表达的Lc2OGD1和Lc2OGD2的催化活性检测
将实施案例3中的重组质粒构建到pMal载体上,将该载体转入到Rosetta(DE3)中,验证转入后,挑选单克隆,37℃过夜培养。第二天从过夜培养的菌中,吸取少量,37℃,200rpm继续扩大培养,直至菌的OD600值达到0.6左右,加入0.5M的IPTG处理1小时后,加入20μL的洋川芎内酯A,16℃,180rpm共培养12小时后。加入等体积的乙酸乙酯,超声萃取30min,取有机相,真空浓缩干燥,加入200μL的乙酸乙酯复溶,通过GC-MS进行检测丁苯酞的含量。结果表明,Lc2OGD1和Lc2OGD2能够催化洋川芎内酯A生成丁苯酞(图6)。
实施例7突变体重组表达载体的构建
对Lc2OGD1进行序列分析、分子对接和突变,发现与Lc2OGD1催化效率相关的5个活性位点,分别是66,76,102,165和180位的氨基酸残基,将这5个氨基酸位点进行不同形式突变(表1),得到5个Lc2OGD1蛋白突变体(表2)。
将双链分子1插入至表达载体pSuper1300上,得到重组表达载体pSuper1300-W180A(测序验证正确)。双链DNA分子1是将Lc2OGD1进行点突变得到的。与Lc2OGD1基因SEQID No.2相比,双链DNA分子1的差别仅在于:将序列自5’端第538位t突变为g,第539位g突变为c。与Lc2OGD1蛋白SEQ ID No.1相比,DNA分子1编码蛋白的差别仅在于,将序列所示的第180位W突变为A。
将双链分子2插入至表达载体pSuper1300上,得到重组表达载体pSuper1300-Y102A(测序验证正确)。双链DNA分子2是将Lc2OGD1进行点突变得到的。与Lc2OGD1基因SEQID No.2相比,双链DNA分子2的差别仅在于:将序列自5’端第304位t突变为g,第305位a突变为c。与Lc2OGD1蛋白SEQ ID No.1相比,DNA分子2编码蛋白的差别仅在于,将序列所示的第102位Y突变为A。
将双链分子3插入至表达载体pSuper1300上,得到重组表达载体pSuper1300-Y76F(测序验证正确)。双链DNA分子3是将Lc2OGD1进行点突变得到的。与Lc2OGD1基因SEQ IDNo.2相比,双链DNA分子3的差别仅在于:将序列自5’端第227位a突变为t。与Lc2OGD1蛋白SEQ ID No.1相比,DNA分子3编码蛋白的差别仅在于,将序列所示的第76位Y突变为F。
将双链分子4插入至表达载体pSuper1300上,得到重组表达载体pSuper1300-G165A(测序验证正确)。双链DNA分子4是将Lc2OGD1进行点突变得到的。与Lc2OGD1基因SEQID No.2相比,双链DNA分子4的差别仅在于:将序列自5’端第494位g突变为c。与Lc2OGD1蛋白SEQ ID No.1相比,DNA分子4编码蛋白的差别仅在于,将序列所示的第165位G突变为A。
将双链分子5插入至表达载体pSuper1300上,得到重组表达载体pSuper1300-Q66A(测序验证正确)。双链DNA分子5是将Lc2OGD1进行点突变得到的。与Lc2OGD1基因SEQ IDNo.2相比,双链DNA分子5的差别仅在于:将序列自5’端第196位c突变为g,第197位a突变为c。与Lc2OGD1蛋白SEQ ID No.1相比,DNA分子5编码蛋白的差别仅在于,将序列所示的第66位Q突变为A。
表1氨基酸位点及其突变形式
表2突变体信息
突变体名称 | 氨基酸突变形式 | 核苷酸突变形式 |
LcOGD1w180A | W180A | t538g,g539c |
LcOGD1Y102A | Y102A | t304g,a305c |
LcOGD1Y76F | Y76F | a227t |
LcOGD1G165A | G165A | g494c |
LcOGD1Q66A | Q66A | c196g,a197c |
用于制备突变体的相关引物如下:
Q66A-F:SEQ ID NO:22;Q66A-R:SEQ ID NO:23;
Y76F-F:SEQ ID NO:24;Y76F-R:SEQ ID NO:25;
Y102A-F:SEQ ID NO:26;Y102A-R:SEQ ID NO:27;
G165A-F:SEQ ID NO:28;G165A-R:SEQ ID NO:29;
W180A-F:SEQ ID NO:30;W180A-R:SEQ ID NO:31。
实施案例8、突变体的烟草异源表达
将实例7中的重组载体导入农杆菌GV3101中,使用该重组的农杆菌GV3101侵染本氏烟草叶片。用转入pSuper1300载体的农杆菌作为对照菌株,同时侵染本氏烟草叶片。本氏烟草培养培养于25℃,16h光照条件下,直到长至6片真叶时用于农杆菌的侵染。将含有重组质粒的农杆菌于28℃下培养OD600=1.0,用注射缓冲液重悬清洗一次菌体,然后于注射缓冲液中脱毒2h,室温,避光。注射缓冲液配方(农杆菌重悬液)。然后,用1mL的无菌注射器于烟草的背面注射到烟草叶片内,避光过夜,培养于25℃,16h光照条件下,3天后,注射100μM的底物洋川芎内酯A。注射底物洋川芎内酯A,1天后,收集烟草,储存于-80℃中备用。
农杆菌重悬液
实施例9突变体催化产物的提取与鉴定
烟草通过冷冻干燥后,用研钵磨成粉,每100mg烟草用2mL乙酸乙酯提取,提取物超声处理30min,12000rpm下4℃离心10min,收集上清,真空浓缩至0.5mL,用0.45μm尼龙过滤器将上清过滤至棕色样品瓶中,待进样。采用GC-MS对转基因烟草的丁苯酞含量进行检测。
结果如图7,显示W180A,Y102A和Y76F可以增强Lc2OGD1的催化效率,G165A和Q66A不能增强Lc2OGD1的催化效率。
实施例10、川芎中Lc2OGD3、Lc2OGD4、Lc2OGD5、Lc2OGD6的克隆和序列分析
1)基因的筛选和序列分析
根据已测序的川芎基因组和转录组数据,通过注释、差异表达基因分析,在川芎的根转录组数据库中,找到4条具有完整开放阅读框的氧化酶基因,分别命名为Lc2OGD3、Lc2OGD4、Lc2OGD5、Lc2OGD6(Ligusticumchuanxiong Fe(II)/2-oxoglutarate-dependentdioxygenase)。它们的核苷酸序列依次为SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQID NO:20;它们的氨基酸序列依次为SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:9、SEQ IDNO:21。
相关引物如下:
LcOGD3
F:GATATCGTCGACGGATCCATGGAGAGTTCTGAGTGTATTAGG(SEQ ID NO:32)
R:AATTACCTGCAGGGAATTCCAGTTTAAGTTGATCTAAGAGGC(SEQ ID NO:33)
Lc2OGD4
F:GATATCGTCGACGGATCCATGGCTTCTCCAAAAGTTG(SEQ ID NO:34)
R:AATTACCTGCAGGGAATTCGTAGATAATTTTCATTTCGTTCA(SEQ ID NO:35)
Lc2OGD5
F:GATATCGTCGACGGATCCATGGAGAGTATTAGGGGACTAGA(SEQ ID NO:36)
R:AATTACCTGCAGGGAATTCCAGTTTAAGTTGATCTAAGAGGC(SEQ ID NO:37)
Lc2OGD6
F:GATATCGTCGACGGATCCATGGCTCCAAGTTTTGATAA(SEQ ID NO:38)
R:AATTACCTGCAGGGAATTCAACTCCTGTATTGCTCTTTTG(SEQ ID NO:39)
2)川芎根的cDNA的合成
取适量川芎根(-80℃冰箱保存),液氮磨碎。采用法Trizon法提取川芎总RNA,提取后用DNase I及RNA纯化试剂盒,对所提取的总RNA进行精制,去除RNA中的基因组污染。
根据Novoprotein的第一链cDNA合成试剂盒Plus All-in-one 1stStrand cDNA Synthesis SuperMix(gDNA Purge)说明书进行操作,反转录体系如下:
(1)去基因组DNA反应:
42℃孵育5min,反应结束后冰上放置。
(2)逆转录反应:
50℃孵育30min,75℃孵育5min,终止反应。
cDNA样品于-20℃保存。
3)Lc2OGD的克隆
以Lc2OGD基因的核苷酸序列为依据,设计Lc2OGD基因的合成引物,引物包含XbaⅠ和KpnⅠ酶切位点序列。以川芎根的cDNA为模板,采用PCR的方法扩增Lc2OGD基因,与经XbaⅠ和KpnⅠ双酶切的线性pSuper1300载体重组,采用Fast DNA Assembly Mix试剂盒的方法获得重组质粒,并转入大肠杆菌DH5α后,提取质粒测序(北京六合华大基因科技有限公司),阳性重组质粒命名为pSuper1300-Lc2OGD。
4)胶回收:同前述实施例。
实施例11大肠杆菌中表达的Lc2OGD3、Lc2OGD4、Lc2OGD5、Lc2OGD6的催化活性检测
将实施案例10中的重组质粒构建到pMal载体上,将该载体转入到Rosetta(DE3)中,验证转入后,挑选单克隆,37℃过夜培养。第二天从过夜培养的菌中,吸取少量,37℃,200rpm继续扩大培养,直至菌的OD600值达到0.6左右,加入0.5M的IPTG处理1小时后,加入20μL的洋川芎内酯A,16℃,180rpm共培养12小时后。加入等体积的乙酸乙酯,超声萃取30min,取有机相,真空浓缩干燥,加入200μL的乙酸乙酯复溶,通过GC-MS进行检测丁苯酞的含量。结果表明,Lc2OGD3、Lc2OGD4、Lc2OGD5、Lc2OGD6能够催化洋川芎内酯A生成丁苯酞(图8)。
实施例12大肠杆菌中表达的Lc2OGD3、Lc2OGD4、Lc2OGD5、Lc2OGD6的催化活性检测
将实施案例10中的重组质粒构建到pMal载体上,将该载体转入到Rosetta(DE3)中,验证转入后,挑选单克隆,37℃过夜培养。第二天从过夜培养的菌中,吸取少量,37℃,200rpm继续扩大培养,直至菌的OD600值达到0.6左右,加入0.5M的IPTG处理1小时后,加入50μM的藁本内酯,37℃,180rpm共培养12小时后。加入等体积的乙酸乙酯,超声萃取30min,取有机相,真空浓缩干燥,加入200μL的乙酸乙酯复溶,通过GC-MS进行检测丁烯基苯酞的含量。结果表明,Lc2OGD3、Lc2OGD4、Lc2OGD5、Lc2OGD6能够催化藁本内酯生成丁烯基苯酞(图9)。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种多肽,为如下任一所述多肽:
(1)氨基酸序列包含SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21的多肽;
(2)氨基酸序列与SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQID NO:19或SEQ ID NO:21具有至少10%或至少12%或至少14%或至少15%或至少16%或至少17%或至少18%或至少19%或至少20%或至少21%或至少22%或至少24%或至少26%或至少28%或至少29%或至少30%或至少31%或至少32%或至少34%或至少36%或至少38%或至少40%或至少42%或至少44%或至少46%或至少48%或至少50%或至少52%或至少54%或至少56%或至少58%或至少59%或至少60%或至少65%或至少70%或至少75%或至少80%或至少81%或至少82%或少83%或至少84%或至少85%或至少86%或至少87%或至少88%或至少89%或至少90%或至少91%或至少92%或至少93%或至少94%或至少95%或至少96%或至少97%或至少98%或至少99%以上相似性的多肽,且该多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员;
(3)氨基酸序列与SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQID NO:19或SEQ ID NO:21具有至少10%或至少12%或至少14%或至少15%或至少16%或至少17%或至少18%或至少19%或至少20%或至少21%或至少22%或至少24%或至少26%或至少28%或至少29%或至少30%或至少31%或至少32%或至少34%或至少36%或至少38%或至少40%或至少42%或至少44%或至少46%或至少48%或至少50%或至少52%或至少54%或至少56%或至少58%或至少59%或至少60%或至少65%或至少70%或至少75%或至少80%或至少81%或至少82%或少83%或至少84%或至少85%或至少86%或至少87%或至少88%或至少89%或至少90%或至少91%或至少92%或至少93%或至少94%或至少95%或至少96%或至少97%或至少98%或至少99%以上相似性的多肽,且该多肽来源于川芎(Ligusticum chuanxiong hort.),且该多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员;
(4)由如下多核苷酸编码得到的多肽:(a)SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQID NO:16或SEQ ID NO:18或SEQ ID NO:20所示的多核苷酸;(b)核酸序列与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ IDNO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20具有60%以上相似性的多核苷酸;(c)在严格条件下与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ IDNO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20所示多核苷酸或其互补序列或其gDNA杂交的多核苷酸,该多肽具有2-酮戊二酸依赖性双加氧酶活性或该多肽是2-酮戊二酸依赖性双加氧酶家族的成员;
(5)在SEQ ID NO:1或SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21的基础上进行一个位置或多个位置的氨基酸残基替换、插入和/或缺失后得到的多肽突变体,该多肽突变体具有2-酮戊二酸依赖性双加氧酶活性或该多肽突变体是2-酮戊二酸依赖性双加氧酶家族的成员;
(6)在SEQ ID NO:1所示氨基酸序列的基础上,在如下任意一个位置或任意几个位置进行氨基酸残基替换、插入和/或缺失后得到的多肽突变体:自其N端起第180位氨基酸、第102位氨基酸、第76位氨基酸、第165位氨基酸、第66位氨基酸,该多肽突变体具有2-酮戊二酸依赖性双加氧酶活性或该多肽突变体是2-酮戊二酸依赖性双加氧酶家族的成员;
(7)在SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21所示氨基酸序列的基础上,在如下任意一个位置或任意几个位置进行氨基酸残基替换、插入和/或缺失后得到的多肽突变体:与自SEQ ID NO:1的N端起第180位氨基酸、第102位氨基酸、第76位氨基酸、第165位氨基酸、第66位氨基酸对应的位置;该多肽突变体具有2-酮戊二酸依赖性双加氧酶活性或该多肽突变体是2-酮戊二酸依赖性双加氧酶家族的成员;
(8)在SEQ ID NO:1所示氨基酸序列的基础上,进行如下任意一种或任意几种的突变后得到的多肽突变体:W180A、Y102A、Y76F、G165A、Q66A;该多肽突变体具有2-酮戊二酸依赖性双加氧酶活性或该多肽突变体是2-酮戊二酸依赖性双加氧酶家族的成员;
(9)在SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:17或SEQ ID NO:19或SEQ ID NO:21所示氨基酸序列的基础上,以SEQ ID NO:1为参照,在相对应的位置上进行任一种或任几种相应的氨基酸种类突变后得到的多肽突变体;其中,SEQ ID NO:1中相应位置和相应氨基酸突变种类为如下的任一种或任几种:W180A、Y102A、Y76F、G165A、Q66A;该多肽突变体具有2-酮戊二酸依赖性双加氧酶活性或该多肽突变体是2-酮戊二酸依赖性双加氧酶家族的成员;
(10)在(1)或(2)或(3)或(4)或(5)或(6)或(7)或(8)或(9)所示多肽的N-末端或C-末端处融合另一多肽后形成的融合多肽。
2.编码权利要求1所述多肽的多核苷酸。
3.根据权利要求2所述的多核苷酸,其特征在于:所述多核苷酸为如下(1)或(2)或(3):
(1)包含SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ ID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQID NO:20的多核苷酸;
(2)核酸序列与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQ IDNO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20具有至少60%或至少65%或至少70%或至少75%或至少80%或至少81%或至少82%或少83%或至少84%或至少85%或至少86%或至少87%或至少88%或至少89%或至少90%或至少91%或至少92%或至少93%或至少94%或至少95%或至少96%或至少97%或至少98%或至少99%以上序列相似性的多核苷酸,且该多核苷酸编码的多肽具有2-酮戊二酸依赖性双加氧酶活性或是2-酮戊二酸依赖性双加氧酶家族的成员;
(3)在严格条件下与SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:9或SEQ ID NO:10或SEQID NO:11或SEQ ID NO:12或SEQ ID NO:13或SEQ ID NO:14或SEQ ID NO:16或SEQ ID NO:18或SEQ ID NO:20所示多核苷酸或其互补体或其gDNA杂交的多核苷酸,且该多核苷酸编码的多肽具有2-酮戊二酸依赖性双加氧酶活性或是2-酮戊二酸依赖性双加氧酶家族的成员。
4.含有权利要求2或3所述多核苷酸的重组载体、核酸构建体或重组宿主细胞。
5.一种蛋白提取物,是川芎(Ligusticum chuanxiong Hort.)根的总蛋白提取物,该提取物具有2-酮戊二酸依赖性双加氧酶活性或该提取物中含有2-酮戊二酸依赖性双加氧酶家族的成员酶。
6.一种制备苯酞类化合物的方法,包括如下步骤:以式Ⅰ和/或式Ⅱ所示化合物为底物,使其与酶接触,得到式Ⅲ和/或式Ⅳ所示苯酞类化合物,其中酶是2-酮戊二酸依赖性双加氧酶家族中的酶或该酶具有2-酮戊二酸依赖性双加氧酶活性;
其中,式Ⅰ,式Ⅱ,式Ⅲ或式Ⅳ中R为不含任何取代基的碳原子数为1~10的直链烷烃,其中碳原子数为1-2,1-3,1-4,1-5,1-6,1-7,1-8,1-9,1-10,2-3,2-4,2-5,2-6,2-7,2-8,2-9,2-10,3-4,3-5,3-6,3-7,3-8,3-9,3-10,4-5,4-6,4-7,4-8,4-9,或4-10,或具体为1,2,3,4,5,6,7,8,9,10。
7.根据权利要求6所述的方法,其特征在于:所述酶为权利要求1中所述多肽的任意一种或几种,或者为权利要求5所述蛋白提取物。
8.根据权利要求6或7所述的方法,其特征在于:所述式Ⅱ所示化合物为洋川芎内酯A,所述式Ⅰ所示化合物为藁本内酯。
9.根据权利要求6-8任意所述的方法,其特征在于:所述式Ⅳ所示化合物为丁苯酞,所述式Ⅲ所示化合物为丁烯基苯酞。
10.制备权利要求1所述多肽的方法,包括如下步骤:在有利于多肽表达的条件下,使含有权利要求2所述多核苷酸的重组宿主细胞进行表达,得到权利要求1所述多肽。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2023101066700 | 2023-02-13 | ||
CN202310106670 | 2023-02-13 | ||
CN202310321909 | 2023-03-29 | ||
CN2023103219096 | 2023-03-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116536280A true CN116536280A (zh) | 2023-08-04 |
Family
ID=87448997
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310719497.1A Pending CN116536280A (zh) | 2023-02-13 | 2023-06-16 | 2-酮戊二酸依赖性双加氧酶及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116536280A (zh) |
-
2023
- 2023-06-16 CN CN202310719497.1A patent/CN116536280A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109666658B (zh) | 用于制备nmn的烟酰胺磷酸核糖转移酶、编码基因、重组载体及应用 | |
CN105647943B (zh) | 天山雪莲细胞鲨烯合酶基因SiSQS及其编码的产物和应用 | |
WO2020029564A1 (zh) | 雷公藤三萜合酶TwOSC1及其编码基因与应用 | |
WO2023045682A1 (zh) | 一种提高多肽可溶性表达产量的方法 | |
CN106754989A (zh) | 布渣叶黄烷酮‑2‑羟基化酶及其编码基因与应用 | |
CN111100851B (zh) | 醇脱氢酶突变体及其在手性双芳基醇化合物合成中的应用 | |
CN116536280A (zh) | 2-酮戊二酸依赖性双加氧酶及其应用 | |
CN115992109A (zh) | 石吊兰素糖基转移酶蛋白及其编码基因与应用 | |
CN116496997A (zh) | 羰基还原酶突变体及其应用 | |
CN115975958A (zh) | 苯酞类化合物合成酶LcP450、编码其核苷酸序列及应用 | |
KR101794502B1 (ko) | 아스트로바이러스 표준양성대조군 유전자 및 이로부터 전사되는 rna 전사체 | |
CN112410353A (zh) | 一种fkbS基因、含其的基因工程菌及其制备方法和用途 | |
CN108707590A (zh) | 一种Pictet-Spengler酶及其编码基因与应用 | |
CN117683755B (zh) | 一种C-to-G碱基编辑系统 | |
CN117004628B (zh) | 天山雪莲黄酮醇合酶基因及其编码产物和应用 | |
CN118126997B (zh) | 一种多功能三萜环化酶及其在制备三萜化合物中的应用 | |
CN109385408B (zh) | SmSIP1蛋白及其相关生物材料在促进鲨烯合酶降解中的应用 | |
CN116042663A (zh) | 一种铁皮石斛β-紫罗兰酮合成关键酶基因DoCCD1及其克隆方法和应用 | |
CN118272339A (zh) | 一种蛋白质及其制备方法和应用、生物材料及其应用 | |
CN116121280A (zh) | 重组胱硫醚-β-裂解酶的制备方法和应用 | |
CN117946988A (zh) | 小檗碱桥酶突变体及其应用 | |
CN117586981A (zh) | 一种催化三七皂苷生物合成的木糖基转移酶及其编码基因与应用 | |
CN116987682A (zh) | 一种催化花椒毒酚生成花椒毒素的o-甲基转移酶及其编码基因与应用 | |
CN118460501A (zh) | 一种突变型Taq DNA聚合酶及其制备方法与应用 | |
CN117586994A (zh) | 重组ⅱ型胶原蛋白酶及其突变体的制备方法和应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |