CN111655855A - 人治疗靶标及其调节剂 - Google Patents
人治疗靶标及其调节剂 Download PDFInfo
- Publication number
- CN111655855A CN111655855A CN201880072708.4A CN201880072708A CN111655855A CN 111655855 A CN111655855 A CN 111655855A CN 201880072708 A CN201880072708 A CN 201880072708A CN 111655855 A CN111655855 A CN 111655855A
- Authority
- CN
- China
- Prior art keywords
- etag
- nucleic acid
- biosynthetic
- biosynthetic gene
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241000282414 Homo sapiens Species 0.000 title claims abstract description 237
- 230000001225 therapeutic effect Effects 0.000 title description 13
- 230000001851 biosynthetic effect Effects 0.000 claims abstract description 586
- 238000000034 method Methods 0.000 claims abstract description 245
- 230000002538 fungal effect Effects 0.000 claims abstract description 62
- 108090000623 proteins and genes Proteins 0.000 claims description 462
- 108091008053 gene clusters Proteins 0.000 claims description 363
- 150000007523 nucleic acids Chemical group 0.000 claims description 254
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 170
- 102000004169 proteins and genes Human genes 0.000 claims description 143
- 108010014186 ras Proteins Proteins 0.000 claims description 99
- 102000016914 ras Proteins Human genes 0.000 claims description 99
- 102000004190 Enzymes Human genes 0.000 claims description 92
- 108090000790 Enzymes Proteins 0.000 claims description 92
- 150000001875 compounds Chemical class 0.000 claims description 66
- 230000001105 regulatory effect Effects 0.000 claims description 47
- 230000000694 effects Effects 0.000 claims description 33
- 150000003384 small molecules Chemical class 0.000 claims description 27
- 238000011144 upstream manufacturing Methods 0.000 claims description 23
- 230000015572 biosynthetic process Effects 0.000 claims description 19
- 238000012360 testing method Methods 0.000 claims description 18
- 239000003795 chemical substances by application Substances 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 14
- 108020001580 protein domains Proteins 0.000 claims description 13
- 238000009830 intercalation Methods 0.000 claims description 12
- 230000027455 binding Effects 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 abstract description 10
- 238000009509 drug development Methods 0.000 abstract description 2
- -1 terpene compound Chemical class 0.000 description 52
- 101100412663 Danio rerio rasgef1bb gene Proteins 0.000 description 43
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 42
- 125000000539 amino acid group Chemical group 0.000 description 35
- 102100031426 Ras GTPase-activating protein 1 Human genes 0.000 description 34
- 108050004017 Ras GTPase-activating protein 1 Proteins 0.000 description 33
- 125000003118 aryl group Chemical group 0.000 description 31
- 229910052757 nitrogen Inorganic materials 0.000 description 30
- 125000005842 heteroatom Chemical group 0.000 description 29
- 230000006870 function Effects 0.000 description 28
- 239000002585 base Substances 0.000 description 26
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 24
- 229910052717 sulfur Inorganic materials 0.000 description 24
- 239000011593 sulfur Substances 0.000 description 24
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 23
- 229910052760 oxygen Inorganic materials 0.000 description 23
- 239000001301 oxygen Substances 0.000 description 23
- 150000003839 salts Chemical class 0.000 description 21
- 125000000623 heterocyclic group Chemical group 0.000 description 20
- 125000002619 bicyclic group Chemical group 0.000 description 19
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 19
- 125000001072 heteroaryl group Chemical group 0.000 description 19
- 229920006395 saturated elastomer Polymers 0.000 description 19
- 239000000126 substance Substances 0.000 description 19
- 125000001424 substituent group Chemical group 0.000 description 19
- 125000001931 aliphatic group Chemical group 0.000 description 18
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 18
- 125000000217 alkyl group Chemical group 0.000 description 17
- 125000002950 monocyclic group Chemical group 0.000 description 16
- 108020004707 nucleic acids Proteins 0.000 description 16
- 102000039446 nucleic acids Human genes 0.000 description 16
- 230000003993 interaction Effects 0.000 description 15
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 14
- 210000003205 muscle Anatomy 0.000 description 14
- 241000233866 Fungi Species 0.000 description 13
- 239000011574 phosphorus Substances 0.000 description 13
- 201000010099 disease Diseases 0.000 description 12
- 229910052698 phosphorus Inorganic materials 0.000 description 12
- 229910052710 silicon Inorganic materials 0.000 description 12
- 238000003786 synthesis reaction Methods 0.000 description 12
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 11
- 125000003367 polycyclic group Chemical group 0.000 description 11
- 239000010703 silicon Substances 0.000 description 11
- 125000004432 carbon atom Chemical group C* 0.000 description 10
- 238000004590 computer program Methods 0.000 description 10
- 125000006239 protecting group Chemical group 0.000 description 10
- 229910052736 halogen Inorganic materials 0.000 description 9
- 150000002367 halogens Chemical class 0.000 description 9
- 239000000463 material Substances 0.000 description 9
- 239000000203 mixture Substances 0.000 description 9
- 239000008194 pharmaceutical composition Substances 0.000 description 9
- 101150040459 RAS gene Proteins 0.000 description 8
- 230000001965 increasing effect Effects 0.000 description 8
- 108700042226 ras Genes Proteins 0.000 description 8
- 244000251953 Agaricus brunnescens Species 0.000 description 7
- 235000001674 Agaricus brunnescens Nutrition 0.000 description 7
- 208000035475 disorder Diseases 0.000 description 7
- 239000003814 drug Substances 0.000 description 7
- 239000012636 effector Substances 0.000 description 7
- 150000002148 esters Chemical class 0.000 description 7
- 229910052739 hydrogen Inorganic materials 0.000 description 7
- 239000001257 hydrogen Substances 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 108090000765 processed proteins & peptides Proteins 0.000 description 7
- 101150117869 Hras gene Proteins 0.000 description 6
- 101150105104 Kras gene Proteins 0.000 description 6
- 101150073096 NRAS gene Proteins 0.000 description 6
- 150000001412 amines Chemical class 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 239000003937 drug carrier Substances 0.000 description 6
- 125000005843 halogen group Chemical group 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 229930001119 polyketide Natural products 0.000 description 6
- 239000013558 reference substance Substances 0.000 description 6
- PCZOHLXUXFIOCF-UHFFFAOYSA-N Monacolin X Natural products C12C(OC(=O)C(C)CC)CC(C)C=C2C=CC(C)C1CCC1CC(O)CC(=O)O1 PCZOHLXUXFIOCF-UHFFFAOYSA-N 0.000 description 5
- 241000228143 Penicillium Species 0.000 description 5
- 241000223258 Thermomyces lanuginosus Species 0.000 description 5
- 125000004429 atom Chemical group 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 5
- 125000004122 cyclic group Chemical group 0.000 description 5
- 150000002632 lipids Chemical class 0.000 description 5
- PCZOHLXUXFIOCF-BXMDZJJMSA-N lovastatin Chemical compound C([C@H]1[C@@H](C)C=CC2=C[C@H](C)C[C@@H]([C@H]12)OC(=O)[C@@H](C)CC)C[C@@H]1C[C@@H](O)CC(=O)O1 PCZOHLXUXFIOCF-BXMDZJJMSA-N 0.000 description 5
- 229960004844 lovastatin Drugs 0.000 description 5
- QLJODMDSTUBWDW-UHFFFAOYSA-N lovastatin hydroxy acid Natural products C1=CC(C)C(CCC(O)CC(O)CC(O)=O)C2C(OC(=O)C(C)CC)CC(C)C=C21 QLJODMDSTUBWDW-UHFFFAOYSA-N 0.000 description 5
- 239000002773 nucleotide Substances 0.000 description 5
- 125000003729 nucleotide group Chemical group 0.000 description 5
- 229920001184 polypeptide Polymers 0.000 description 5
- 102000004196 processed proteins & peptides Human genes 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 239000000758 substrate Substances 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 4
- 244000251987 Coprinus macrorhizus Species 0.000 description 4
- 235000001673 Coprinus macrorhizus Nutrition 0.000 description 4
- PMATZTZNYRCHOR-CGLBZJNRSA-N Cyclosporin A Chemical compound CC[C@@H]1NC(=O)[C@H]([C@H](O)[C@H](C)C\C=C\C)N(C)C(=O)[C@H](C(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)N(C)C(=O)CN(C)C1=O PMATZTZNYRCHOR-CGLBZJNRSA-N 0.000 description 4
- 108010036949 Cyclosporine Proteins 0.000 description 4
- 108700039887 Essential Genes Proteins 0.000 description 4
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 4
- 240000007594 Oryza sativa Species 0.000 description 4
- 235000007164 Oryza sativa Nutrition 0.000 description 4
- 241001484137 Talaromyces leycettanus Species 0.000 description 4
- 125000002015 acyclic group Chemical group 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 4
- KQNZDYYTLMIZCT-KQPMLPITSA-N brefeldin A Chemical compound O[C@@H]1\C=C\C(=O)O[C@@H](C)CCC\C=C\[C@@H]2C[C@H](O)C[C@H]21 KQNZDYYTLMIZCT-KQPMLPITSA-N 0.000 description 4
- JUMGSHROWPPKFX-UHFFFAOYSA-N brefeldin-A Natural products CC1CCCC=CC2(C)CC(O)CC2(C)C(O)C=CC(=O)O1 JUMGSHROWPPKFX-UHFFFAOYSA-N 0.000 description 4
- 150000001720 carbohydrates Chemical class 0.000 description 4
- 235000014633 carbohydrates Nutrition 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 150000001735 carboxylic acids Chemical class 0.000 description 4
- 229960001265 ciclosporin Drugs 0.000 description 4
- 125000000753 cycloalkyl group Chemical group 0.000 description 4
- 229930182912 cyclosporin Natural products 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 150000002430 hydrocarbons Chemical group 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 4
- 125000005647 linker group Chemical group 0.000 description 4
- 239000002207 metabolite Substances 0.000 description 4
- 231100000252 nontoxic Toxicity 0.000 description 4
- 230000003000 nontoxic effect Effects 0.000 description 4
- 150000003881 polyketide derivatives Chemical class 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 235000009566 rice Nutrition 0.000 description 4
- 125000006413 ring segment Chemical group 0.000 description 4
- 235000007586 terpenes Nutrition 0.000 description 4
- CABVTRNMFUVUDM-VRHQGPGLSA-N (3S)-3-hydroxy-3-methylglutaryl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C[C@@](O)(CC(O)=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 CABVTRNMFUVUDM-VRHQGPGLSA-N 0.000 description 3
- DHKHKXVYLBGOIT-UHFFFAOYSA-N 1,1-Diethoxyethane Chemical compound CCOC(C)OCC DHKHKXVYLBGOIT-UHFFFAOYSA-N 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- 241000228212 Aspergillus Species 0.000 description 3
- 241000193738 Bacillus anthracis Species 0.000 description 3
- ZOXJGFHDIHLPTG-UHFFFAOYSA-N Boron Chemical compound [B] ZOXJGFHDIHLPTG-UHFFFAOYSA-N 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 108010067218 Guanine Nucleotide Exchange Factors Proteins 0.000 description 3
- 102000016285 Guanine Nucleotide Exchange Factors Human genes 0.000 description 3
- 101000709121 Homo sapiens Ral guanine nucleotide dissociation stimulator-like 1 Proteins 0.000 description 3
- 108090000144 Human Proteins Proteins 0.000 description 3
- 102000003839 Human Proteins Human genes 0.000 description 3
- RRHGJUQNOFWUDK-UHFFFAOYSA-N Isoprene Chemical class CC(=C)C=C RRHGJUQNOFWUDK-UHFFFAOYSA-N 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 241000284696 Penicillium rubens Wisconsin 54-1255 Species 0.000 description 3
- OFOBLEOULBTSOW-UHFFFAOYSA-N Propanedioic acid Natural products OC(=O)CC(O)=O OFOBLEOULBTSOW-UHFFFAOYSA-N 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- 229920001218 Pullulan Polymers 0.000 description 3
- 102100032665 Ral guanine nucleotide dissociation stimulator-like 1 Human genes 0.000 description 3
- 102100035582 Ral-GDS-related protein Human genes 0.000 description 3
- 238000005411 Van der Waals force Methods 0.000 description 3
- 230000002378 acidificating effect Effects 0.000 description 3
- 150000001299 aldehydes Chemical class 0.000 description 3
- 125000002947 alkylene group Chemical group 0.000 description 3
- 229910052796 boron Inorganic materials 0.000 description 3
- 125000002837 carbocyclic group Chemical group 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- KPUWHANPEXNPJT-UHFFFAOYSA-N disiloxane Chemical class [SiH3]O[SiH3] KPUWHANPEXNPJT-UHFFFAOYSA-N 0.000 description 3
- 125000004404 heteroalkyl group Chemical group 0.000 description 3
- 235000021317 phosphate Nutrition 0.000 description 3
- 235000019423 pullulan Nutrition 0.000 description 3
- 125000000719 pyrrolidinyl group Chemical group 0.000 description 3
- 230000007115 recruitment Effects 0.000 description 3
- 150000003505 terpenes Chemical class 0.000 description 3
- 125000000147 tetrahydroquinolinyl group Chemical group N1(CCCC2=CC=CC=C12)* 0.000 description 3
- 229940124597 therapeutic agent Drugs 0.000 description 3
- NQPDZGIKBAWPEJ-UHFFFAOYSA-N valeric acid Chemical class CCCCC(O)=O NQPDZGIKBAWPEJ-UHFFFAOYSA-N 0.000 description 3
- SPEUIVXLLWOEMJ-UHFFFAOYSA-N 1,1-dimethoxyethane Chemical compound COC(C)OC SPEUIVXLLWOEMJ-UHFFFAOYSA-N 0.000 description 2
- 102100030492 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase epsilon-1 Human genes 0.000 description 2
- XMIIGOLPHOKFCH-UHFFFAOYSA-N 3-phenylpropionic acid Chemical class OC(=O)CCC1=CC=CC=C1 XMIIGOLPHOKFCH-UHFFFAOYSA-N 0.000 description 2
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 2
- 241000415078 Anemone hepatica Species 0.000 description 2
- 241000351920 Aspergillus nidulans Species 0.000 description 2
- 241000122824 Aspergillus ochraceus Species 0.000 description 2
- 241000813221 Aspergillus terreus ATCC 20542 Species 0.000 description 2
- 241000223678 Aureobasidium pullulans Species 0.000 description 2
- 241000193388 Bacillus thuringiensis Species 0.000 description 2
- 241000228438 Bipolaris maydis Species 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 108010078791 Carrier Proteins Proteins 0.000 description 2
- 241000222199 Colletotrichum Species 0.000 description 2
- 241000371644 Curvularia ravenelii Species 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 108700005088 Fungal Genes Proteins 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101001126442 Homo sapiens 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase epsilon-1 Proteins 0.000 description 2
- 101001091564 Homo sapiens Kinase non-catalytic C-lobe domain-containing protein 1 Proteins 0.000 description 2
- 101000580034 Homo sapiens Ras-specific guanine nucleotide-releasing factor RalGPS1 Proteins 0.000 description 2
- 101000580036 Homo sapiens Ras-specific guanine nucleotide-releasing factor RalGPS2 Proteins 0.000 description 2
- 101500025562 Homo sapiens Saposin-A Proteins 0.000 description 2
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 2
- 101000868154 Homo sapiens Son of sevenless homolog 2 Proteins 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- 102100035795 Kinase non-catalytic C-lobe domain-containing protein 1 Human genes 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 241000640185 Penicillium brefeldianum Species 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 2
- 235000011613 Pinus brutia Nutrition 0.000 description 2
- 241000018646 Pinus brutia Species 0.000 description 2
- XBDQKXXYIPTUBI-UHFFFAOYSA-N Propionic acid Chemical class CCC(O)=O XBDQKXXYIPTUBI-UHFFFAOYSA-N 0.000 description 2
- KAESVJOAVNADME-UHFFFAOYSA-N Pyrrole Chemical compound C=1C=CNC=1 KAESVJOAVNADME-UHFFFAOYSA-N 0.000 description 2
- 102100023320 Ral guanine nucleotide dissociation stimulator Human genes 0.000 description 2
- 101150015043 Ralgds gene Proteins 0.000 description 2
- 102100027536 Ras-specific guanine nucleotide-releasing factor RalGPS1 Human genes 0.000 description 2
- 102100027535 Ras-specific guanine nucleotide-releasing factor RalGPS2 Human genes 0.000 description 2
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 2
- 102100032930 Son of sevenless homolog 2 Human genes 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 235000009754 Vitis X bourquina Nutrition 0.000 description 2
- 235000012333 Vitis X labruscana Nutrition 0.000 description 2
- 240000006365 Vitis vinifera Species 0.000 description 2
- 235000014787 Vitis vinifera Nutrition 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- OLBVUFHMDRJKTK-UHFFFAOYSA-N [N].[O] Chemical compound [N].[O] OLBVUFHMDRJKTK-UHFFFAOYSA-N 0.000 description 2
- 150000001241 acetals Chemical class 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 239000013543 active substance Substances 0.000 description 2
- 125000005073 adamantyl group Chemical group C12(CC3CC(CC(C1)C3)C2)* 0.000 description 2
- 235000010443 alginic acid Nutrition 0.000 description 2
- 229920000615 alginic acid Polymers 0.000 description 2
- 229910052784 alkaline earth metal Inorganic materials 0.000 description 2
- 229930013930 alkaloid Natural products 0.000 description 2
- 150000005215 alkyl ethers Chemical class 0.000 description 2
- 208000026935 allergic disease Diseases 0.000 description 2
- 150000001408 amides Chemical class 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 229940097012 bacillus thuringiensis Drugs 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 150000001558 benzoic acid derivatives Chemical class 0.000 description 2
- LUFPJJNWMYZRQE-UHFFFAOYSA-N benzylsulfanylmethylbenzene Chemical class C=1C=CC=CC=1CSCC1=CC=CC=C1 LUFPJJNWMYZRQE-UHFFFAOYSA-N 0.000 description 2
- 239000004305 biphenyl Substances 0.000 description 2
- 150000001721 carbon Chemical group 0.000 description 2
- 150000004649 carbonic acid derivatives Chemical class 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 239000006071 cream Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- ZUOUZKKEUPVFJK-UHFFFAOYSA-N diphenyl Chemical compound C1=CC=CC=C1C1=CC=CC=C1 ZUOUZKKEUPVFJK-UHFFFAOYSA-N 0.000 description 2
- MOTZDAYCYVMXPC-UHFFFAOYSA-N dodecyl hydrogen sulfate Chemical class CCCCCCCCCCCCOS(O)(=O)=O MOTZDAYCYVMXPC-UHFFFAOYSA-N 0.000 description 2
- 230000009088 enzymatic function Effects 0.000 description 2
- MMXKVMNBHPAILY-UHFFFAOYSA-N ethyl laurate Chemical compound CCCCCCCCCCCC(=O)OCC MMXKVMNBHPAILY-UHFFFAOYSA-N 0.000 description 2
- 239000006260 foam Substances 0.000 description 2
- 150000004675 formic acid derivatives Chemical class 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 125000004475 heteroaralkyl group Chemical group 0.000 description 2
- 239000010903 husk Substances 0.000 description 2
- 229930195733 hydrocarbon Natural products 0.000 description 2
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 230000007794 irritation Effects 0.000 description 2
- 150000002611 lead compounds Chemical class 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 235000009973 maize Nutrition 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 125000002757 morpholinyl group Chemical class 0.000 description 2
- 150000002823 nitrates Chemical class 0.000 description 2
- 125000006574 non-aromatic ring group Chemical group 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- VLTRZXGMWDSKGL-UHFFFAOYSA-N perchloric acid Chemical compound OCl(=O)(=O)=O VLTRZXGMWDSKGL-UHFFFAOYSA-N 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 125000004934 phenanthridinyl group Chemical group C1(=CC=CC2=NC=C3C=CC=CC3=C12)* 0.000 description 2
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 2
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 2
- 125000003386 piperidinyl group Chemical class 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 125000000830 polyketide group Chemical group 0.000 description 2
- 229930001118 polyketide hybrid Natural products 0.000 description 2
- 125000003308 polyketide hybrid group Chemical group 0.000 description 2
- 229930000044 secondary metabolite Natural products 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- KZNICNPSHKQLFF-UHFFFAOYSA-N succinimide Chemical compound O=C1CCC(=O)N1 KZNICNPSHKQLFF-UHFFFAOYSA-N 0.000 description 2
- 125000001273 sulfonato group Chemical class [O-]S(*)(=O)=O 0.000 description 2
- 150000003467 sulfuric acid derivatives Chemical class 0.000 description 2
- 239000000829 suppository Substances 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 125000003039 tetrahydroisoquinolinyl group Chemical group C1(NCCC2=CC=CC=C12)* 0.000 description 2
- 125000001712 tetrahydronaphthyl group Chemical group C1(CCCC2=CC=CC=C12)* 0.000 description 2
- 150000003573 thiols Chemical class 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- 125000001425 triazolyl group Chemical group 0.000 description 2
- 229940070710 valerate Drugs 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 239000001993 wax Substances 0.000 description 2
- LSPHULWDVZXLIL-UHFFFAOYSA-N (+/-)-Camphoric acid Chemical class CC1(C)C(C(O)=O)CCC1(C)C(O)=O LSPHULWDVZXLIL-UHFFFAOYSA-N 0.000 description 1
- AFMGAVDATRJOJG-GUYCJALGSA-N (3s,5s)-3-methyl-5-[(4-phenylphenyl)methyl]pyrrolidin-2-one Chemical compound N1C(=O)[C@@H](C)C[C@H]1CC1=CC=C(C=2C=CC=CC=2)C=C1 AFMGAVDATRJOJG-GUYCJALGSA-N 0.000 description 1
- SODPIMGUZLOIPE-UHFFFAOYSA-N (4-chlorophenoxy)acetic acid Chemical compound OC(=O)COC1=CC=C(Cl)C=C1 SODPIMGUZLOIPE-UHFFFAOYSA-N 0.000 description 1
- ZOJKRWXDNYZASL-NSCUHMNNSA-N (e)-4-methoxybut-2-enoic acid Chemical compound COC\C=C\C(O)=O ZOJKRWXDNYZASL-NSCUHMNNSA-N 0.000 description 1
- VAYTZRYEBVHVLE-UHFFFAOYSA-N 1,3-dioxol-2-one Chemical compound O=C1OC=CO1 VAYTZRYEBVHVLE-UHFFFAOYSA-N 0.000 description 1
- 125000006091 1,3-dioxolane group Chemical class 0.000 description 1
- SDTORDSXCYSNTD-UHFFFAOYSA-N 1-methoxy-4-[(4-methoxyphenyl)methoxymethyl]benzene Chemical compound C1=CC(OC)=CC=C1COCC1=CC=C(OC)C=C1 SDTORDSXCYSNTD-UHFFFAOYSA-N 0.000 description 1
- FFFIRKXTFQCCKJ-UHFFFAOYSA-M 2,4,6-trimethylbenzoate Chemical compound CC1=CC(C)=C(C([O-])=O)C(C)=C1 FFFIRKXTFQCCKJ-UHFFFAOYSA-M 0.000 description 1
- IMSODMZESSGVBE-UHFFFAOYSA-N 2-Oxazoline Chemical class C1CN=CO1 IMSODMZESSGVBE-UHFFFAOYSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- 125000006325 2-propenyl amino group Chemical group [H]C([H])=C([H])C([H])([H])N([H])* 0.000 description 1
- GPVOTFQILZVCFP-UHFFFAOYSA-N 2-trityloxyacetic acid Chemical compound C=1C=CC=CC=1C(C=1C=CC=CC=1)(OCC(=O)O)C1=CC=CC=C1 GPVOTFQILZVCFP-UHFFFAOYSA-N 0.000 description 1
- BMYNFMYTOJXKLE-UHFFFAOYSA-N 3-azaniumyl-2-hydroxypropanoate Chemical compound NCC(O)C(O)=O BMYNFMYTOJXKLE-UHFFFAOYSA-N 0.000 description 1
- ZRPLANDPDWYOMZ-UHFFFAOYSA-N 3-cyclopentylpropionic acid Chemical class OC(=O)CCC1CCCC1 ZRPLANDPDWYOMZ-UHFFFAOYSA-N 0.000 description 1
- XMIIGOLPHOKFCH-UHFFFAOYSA-M 3-phenylpropionate Chemical compound [O-]C(=O)CCC1=CC=CC=C1 XMIIGOLPHOKFCH-UHFFFAOYSA-M 0.000 description 1
- ATVJXMYDOSMEPO-UHFFFAOYSA-N 3-prop-2-enoxyprop-1-ene Chemical compound C=CCOCC=C ATVJXMYDOSMEPO-UHFFFAOYSA-N 0.000 description 1
- KTFBMMKWTQVUIV-UHFFFAOYSA-N 4-[(3,4-dimethoxyphenyl)methoxymethyl]-1,2-dimethoxybenzene Chemical compound C1=C(OC)C(OC)=CC=C1COCC1=CC=C(OC)C(OC)=C1 KTFBMMKWTQVUIV-UHFFFAOYSA-N 0.000 description 1
- JOOXCMJARBKPKM-UHFFFAOYSA-M 4-oxopentanoate Chemical compound CC(=O)CCC([O-])=O JOOXCMJARBKPKM-UHFFFAOYSA-M 0.000 description 1
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- 101100404726 Arabidopsis thaliana NHX7 gene Proteins 0.000 description 1
- 241000045403 Astragalus propinquus Species 0.000 description 1
- 241001309382 Aureobasidium pullulans EXF-150 Species 0.000 description 1
- 241000587712 Bipolaris maydis ATCC 48331 Species 0.000 description 1
- ROFVEXUMMXZLPA-UHFFFAOYSA-N Bipyridyl Chemical group N1=CC=CC=C1C1=CC=CC=N1 ROFVEXUMMXZLPA-UHFFFAOYSA-N 0.000 description 1
- 241000123650 Botrytis cinerea Species 0.000 description 1
- 125000005915 C6-C14 aryl group Chemical group 0.000 description 1
- 101100421901 Caenorhabditis elegans sos-1 gene Proteins 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- 241000687983 Cerobasis alpha Species 0.000 description 1
- 241001149955 Cladosporium cladosporioides Species 0.000 description 1
- 241001651803 Colletotrichum higginsianum IMI 349063 Species 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- OCUCCJIRFHNWBP-IYEMJOQQSA-L Copper gluconate Chemical class [Cu+2].OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C([O-])=O.OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C([O-])=O OCUCCJIRFHNWBP-IYEMJOQQSA-L 0.000 description 1
- 241000960997 Coprinopsis cinerea okayama7#130 Species 0.000 description 1
- 235000018139 Coprinopsis cinerea okayama7130 Nutrition 0.000 description 1
- 241000190633 Cordyceps Species 0.000 description 1
- 229920002261 Corn starch Polymers 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 241000609458 Corynespora Species 0.000 description 1
- 101000979117 Curvularia clavata Nonribosomal peptide synthetase Proteins 0.000 description 1
- 241000192700 Cyanobacteria Species 0.000 description 1
- 102000001493 Cyclophilins Human genes 0.000 description 1
- 108010068682 Cyclophilins Proteins 0.000 description 1
- 229930105110 Cyclosporin A Natural products 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- FEWJPZIEWOKRBE-JCYAYHJZSA-N Dextrotartaric acid Chemical compound OC(=O)[C@H](O)[C@@H](O)C(O)=O FEWJPZIEWOKRBE-JCYAYHJZSA-N 0.000 description 1
- LCGLNKUTAGEVQW-UHFFFAOYSA-N Dimethyl ether Chemical compound COC LCGLNKUTAGEVQW-UHFFFAOYSA-N 0.000 description 1
- 102100028572 Disabled homolog 2 Human genes 0.000 description 1
- 102100028571 Disabled homolog 2-interacting protein Human genes 0.000 description 1
- 235000014466 Douglas bleu Nutrition 0.000 description 1
- LVGKNOAMLMIIKO-UHFFFAOYSA-N Elaidinsaeure-aethylester Natural products CCCCCCCCC=CCCCCCCCC(=O)OCC LVGKNOAMLMIIKO-UHFFFAOYSA-N 0.000 description 1
- 241001445771 Endocarpon Species 0.000 description 1
- 241001445901 Endocarpon pusillum Species 0.000 description 1
- 239000001856 Ethyl cellulose Substances 0.000 description 1
- ZZSNKZQZMQGXPY-UHFFFAOYSA-N Ethyl cellulose Chemical compound CCOCC1OC(OC)C(OCC)C(OCC)C1OC1C(O)C(O)C(OC)C(CO)O1 ZZSNKZQZMQGXPY-UHFFFAOYSA-N 0.000 description 1
- 241000359453 Fistulina hepatica ATCC 64428 Species 0.000 description 1
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical compound [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 1
- 241000223218 Fusarium Species 0.000 description 1
- 241001319283 Fusarium sp. JS1030 Species 0.000 description 1
- 102100031692 GTPase-activating protein and VPS9 domain-containing protein 1 Human genes 0.000 description 1
- 241000270288 Gekko Species 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 241000606172 Gyalolechia Species 0.000 description 1
- 241000648226 Gyalolechia flavorubescens Species 0.000 description 1
- 241000820580 Gyalolechia flavorubescens KoLRI002931 Species 0.000 description 1
- 101000915391 Homo sapiens Disabled homolog 2 Proteins 0.000 description 1
- 101000915396 Homo sapiens Disabled homolog 2-interacting protein Proteins 0.000 description 1
- 101001066325 Homo sapiens GTPase-activating protein and VPS9 domain-containing protein 1 Proteins 0.000 description 1
- 101000926793 Homo sapiens Golgi-specific brefeldin A-resistance guanine nucleotide exchange factor 1 Proteins 0.000 description 1
- 101000878213 Homo sapiens Inactive peptidyl-prolyl cis-trans isomerase FKBP6 Proteins 0.000 description 1
- 101001092166 Homo sapiens RPE-retinal G protein-coupled receptor Proteins 0.000 description 1
- 101000709135 Homo sapiens Ral guanine nucleotide dissociation stimulator-like 2 Proteins 0.000 description 1
- 101000709129 Homo sapiens Ral guanine nucleotide dissociation stimulator-like 3 Proteins 0.000 description 1
- 101001092182 Homo sapiens Ral-GDS-related protein Proteins 0.000 description 1
- 101000848700 Homo sapiens Rap guanine nucleotide exchange factor 1 Proteins 0.000 description 1
- 101000848727 Homo sapiens Rap guanine nucleotide exchange factor 2 Proteins 0.000 description 1
- 101000848724 Homo sapiens Rap guanine nucleotide exchange factor 3 Proteins 0.000 description 1
- 101000848721 Homo sapiens Rap guanine nucleotide exchange factor 4 Proteins 0.000 description 1
- 101000848718 Homo sapiens Rap guanine nucleotide exchange factor 5 Proteins 0.000 description 1
- 101000848745 Homo sapiens Rap guanine nucleotide exchange factor 6 Proteins 0.000 description 1
- 101000848744 Homo sapiens Rap guanine nucleotide exchange factor-like 1 Proteins 0.000 description 1
- 101001130509 Homo sapiens Ras GTPase-activating protein 1 Proteins 0.000 description 1
- 101001130505 Homo sapiens Ras GTPase-activating protein 2 Proteins 0.000 description 1
- 101000620773 Homo sapiens Ras GTPase-activating protein 3 Proteins 0.000 description 1
- 101001061896 Homo sapiens Ras GTPase-activating protein 4 Proteins 0.000 description 1
- 101001023826 Homo sapiens Ras GTPase-activating protein nGAP Proteins 0.000 description 1
- 101000994790 Homo sapiens Ras GTPase-activating-like protein IQGAP2 Proteins 0.000 description 1
- 101000994788 Homo sapiens Ras GTPase-activating-like protein IQGAP3 Proteins 0.000 description 1
- 101000641879 Homo sapiens Ras/Rap GTPase-activating protein SynGAP Proteins 0.000 description 1
- 101001061898 Homo sapiens RasGAP-activating-like protein 1 Proteins 0.000 description 1
- 241000041770 Hypoxylon sp. E7406B Species 0.000 description 1
- 108010050332 IQ motif containing GTPase activating protein 1 Proteins 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 102100036984 Inactive peptidyl-prolyl cis-trans isomerase FKBP6 Human genes 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- 241000986493 Magnaporthe oryzae 70-15 Species 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 1
- 241001448444 Nannizzia gypsea CBS 118893 Species 0.000 description 1
- 102000007530 Neurofibromin 1 Human genes 0.000 description 1
- 108010085793 Neurofibromin 1 Proteins 0.000 description 1
- 241000221960 Neurospora Species 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 229910004749 OS(O)2 Inorganic materials 0.000 description 1
- 235000019483 Peanut oil Nutrition 0.000 description 1
- 229920002230 Pectic acid Polymers 0.000 description 1
- 241001149509 Penicillium vulpinum Species 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241000218657 Picea Species 0.000 description 1
- 229920002732 Polyanhydride Polymers 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 241001544359 Polyspora Species 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 102000004245 Proteasome Endopeptidase Complex Human genes 0.000 description 1
- 108090000708 Proteasome Endopeptidase Complex Proteins 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 240000001416 Pseudotsuga menziesii Species 0.000 description 1
- 235000005386 Pseudotsuga menziesii var menziesii Nutrition 0.000 description 1
- 239000004373 Pullulan Substances 0.000 description 1
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical group C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 1
- 102100032786 Ral guanine nucleotide dissociation stimulator-like 2 Human genes 0.000 description 1
- 102100032784 Ral guanine nucleotide dissociation stimulator-like 3 Human genes 0.000 description 1
- 102100034589 Rap guanine nucleotide exchange factor 1 Human genes 0.000 description 1
- 102100034585 Rap guanine nucleotide exchange factor 2 Human genes 0.000 description 1
- 102100034584 Rap guanine nucleotide exchange factor 3 Human genes 0.000 description 1
- 102100034591 Rap guanine nucleotide exchange factor 4 Human genes 0.000 description 1
- 102100034590 Rap guanine nucleotide exchange factor 5 Human genes 0.000 description 1
- 102100034587 Rap guanine nucleotide exchange factor 6 Human genes 0.000 description 1
- 102100034586 Rap guanine nucleotide exchange factor-like 1 Human genes 0.000 description 1
- 102100031427 Ras GTPase-activating protein 2 Human genes 0.000 description 1
- 102100022879 Ras GTPase-activating protein 3 Human genes 0.000 description 1
- 102100029555 Ras GTPase-activating protein 4 Human genes 0.000 description 1
- 102100035410 Ras GTPase-activating protein nGAP Human genes 0.000 description 1
- 102100034419 Ras GTPase-activating-like protein IQGAP1 Human genes 0.000 description 1
- 102100034418 Ras GTPase-activating-like protein IQGAP2 Human genes 0.000 description 1
- 102100034417 Ras GTPase-activating-like protein IQGAP3 Human genes 0.000 description 1
- 229940078123 Ras inhibitor Drugs 0.000 description 1
- 102100033428 Ras/Rap GTPase-activating protein SynGAP Human genes 0.000 description 1
- 102100029554 RasGAP-activating-like protein 1 Human genes 0.000 description 1
- 241000191021 Rhodobacter sp. Species 0.000 description 1
- 108700022176 SOS1 Proteins 0.000 description 1
- 101100197320 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) RPL35A gene Proteins 0.000 description 1
- 235000019485 Safflower oil Nutrition 0.000 description 1
- 102100029437 Serine/threonine-protein kinase A-Raf Human genes 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 102100032929 Son of sevenless homolog 1 Human genes 0.000 description 1
- 101150100839 Sos1 gene Proteins 0.000 description 1
- 241001149962 Sporothrix Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-N Succinic acid Natural products OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- 244000297179 Syringa vulgaris Species 0.000 description 1
- 235000004338 Syringa vulgaris Nutrition 0.000 description 1
- 241001659671 Talaromyces piceae Species 0.000 description 1
- FEWJPZIEWOKRBE-UHFFFAOYSA-N Tartaric acid Natural products [H+].[H+].[O-]C(=O)C(O)C(O)C([O-])=O FEWJPZIEWOKRBE-UHFFFAOYSA-N 0.000 description 1
- 241000228178 Thermoascus Species 0.000 description 1
- YTPLMLYBLZKORZ-UHFFFAOYSA-N Thiophene Chemical compound C=1C=CSC=1 YTPLMLYBLZKORZ-UHFFFAOYSA-N 0.000 description 1
- 241001144069 Tolypocladium inflatum NRRL8044 Species 0.000 description 1
- DTQVDTLACAAQTR-UHFFFAOYSA-M Trifluoroacetate Chemical compound [O-]C(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-M 0.000 description 1
- XXFXTBNFFMQVKJ-UHFFFAOYSA-N [diphenyl(trityloxy)methyl]benzene Chemical compound C=1C=CC=CC=1C(C=1C=CC=CC=1)(C=1C=CC=CC=1)OC(C=1C=CC=CC=1)(C=1C=CC=CC=1)C1=CC=CC=C1 XXFXTBNFFMQVKJ-UHFFFAOYSA-N 0.000 description 1
- DXHDPDHBCNHDAO-UHFFFAOYSA-N [diphenyl(tritylsulfanyl)methyl]benzene Chemical class C=1C=CC=CC=1C(C=1C=CC=CC=1)(C=1C=CC=CC=1)SC(C=1C=CC=CC=1)(C=1C=CC=CC=1)C1=CC=CC=C1 DXHDPDHBCNHDAO-UHFFFAOYSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- TWWSMHPNERSWRN-UHFFFAOYSA-N acetaldehyde diisopropyl acetal Natural products CC(C)OC(C)OC(C)C TWWSMHPNERSWRN-UHFFFAOYSA-N 0.000 description 1
- 150000001242 acetic acid derivatives Chemical class 0.000 description 1
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 1
- 125000000641 acridinyl group Chemical group C1(=CC=CC2=NC3=CC=CC=C3C=C12)* 0.000 description 1
- 102000035181 adaptor proteins Human genes 0.000 description 1
- 108091005764 adaptor proteins Proteins 0.000 description 1
- WNLRTRBMVRJNCN-UHFFFAOYSA-N adipic acid Chemical class OC(=O)CCCCC(O)=O WNLRTRBMVRJNCN-UHFFFAOYSA-N 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 239000000783 alginic acid Substances 0.000 description 1
- 229960001126 alginic acid Drugs 0.000 description 1
- 150000004781 alginic acids Chemical class 0.000 description 1
- 125000002723 alicyclic group Chemical group 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 125000003342 alkenyl group Chemical group 0.000 description 1
- 125000003545 alkoxy group Chemical group 0.000 description 1
- 125000000304 alkynyl group Chemical group 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 125000003277 amino group Chemical class 0.000 description 1
- 150000003863 ammonium salts Chemical group 0.000 description 1
- 125000002178 anthracenyl group Chemical group C1(=CC=CC2=CC3=CC=CC=C3C=C12)* 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 239000007900 aqueous suspension Substances 0.000 description 1
- 150000003974 aralkylamines Chemical class 0.000 description 1
- 125000003710 aryl alkyl group Chemical group 0.000 description 1
- 125000005160 aryl oxy alkyl group Chemical group 0.000 description 1
- 125000005228 aryl sulfonate group Chemical group 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 125000003289 ascorbyl group Chemical class [H]O[C@@]([H])(C([H])([H])O*)[C@@]1([H])OC(=O)C(O*)=C1O* 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-L aspartate group Chemical class N[C@@H](CC(=O)[O-])C(=O)[O-] CKLJMWTZIZZHCS-REOHCLBHSA-L 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 235000006533 astragalus Nutrition 0.000 description 1
- JPNZKPRONVOMLL-UHFFFAOYSA-N azane;octadecanoic acid Chemical class [NH4+].CCCCCCCCCCCCCCCCCC([O-])=O JPNZKPRONVOMLL-UHFFFAOYSA-N 0.000 description 1
- 150000001540 azides Chemical class 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- SRSXLGNVWSONIS-UHFFFAOYSA-N benzenesulfonic acid Chemical class OS(=O)(=O)C1=CC=CC=C1 SRSXLGNVWSONIS-UHFFFAOYSA-N 0.000 description 1
- 125000003785 benzimidazolyl group Chemical group N1=C(NC2=C1C=CC=C2)* 0.000 description 1
- 125000000499 benzofuranyl group Chemical group O1C(=CC2=C1C=CC=C2)* 0.000 description 1
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 1
- 125000001164 benzothiazolyl group Chemical group S1C(=NC2=C1C=CC=C2)* 0.000 description 1
- 125000004196 benzothienyl group Chemical group S1C(=CC2=C1C=CC=C2)* 0.000 description 1
- 229960002903 benzyl benzoate Drugs 0.000 description 1
- 125000000440 benzylamino group Chemical group [H]N(*)C([H])([H])C1=C([H])C([H])=C([H])C([H])=C1[H] 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 150000005347 biaryls Chemical group 0.000 description 1
- 125000002618 bicyclic heterocycle group Chemical group 0.000 description 1
- ZDZHCHYQNPQSGG-UHFFFAOYSA-N binaphthyl group Chemical group C1(=CC=CC2=CC=CC=C12)C1=CC=CC2=CC=CC=C12 ZDZHCHYQNPQSGG-UHFFFAOYSA-N 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000003570 biosynthesizing effect Effects 0.000 description 1
- 235000010290 biphenyl Nutrition 0.000 description 1
- IEPBPSSCIZTJIF-UHFFFAOYSA-N bis(2,2,2-trichloroethyl) carbonate Chemical compound ClC(Cl)(Cl)COC(=O)OCC(Cl)(Cl)Cl IEPBPSSCIZTJIF-UHFFFAOYSA-N 0.000 description 1
- JKJWYKGYGWOAHT-UHFFFAOYSA-N bis(prop-2-enyl) carbonate Chemical compound C=CCOC(=O)OCC=C JKJWYKGYGWOAHT-UHFFFAOYSA-N 0.000 description 1
- JZUVESQYEHERMD-UHFFFAOYSA-N bis[(4-nitrophenyl)methyl] carbonate Chemical compound C1=CC([N+](=O)[O-])=CC=C1COC(=O)OCC1=CC=C([N+]([O-])=O)C=C1 JZUVESQYEHERMD-UHFFFAOYSA-N 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-M bisulphate group Chemical group S([O-])(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-M 0.000 description 1
- 150000001642 boronic acid derivatives Chemical class 0.000 description 1
- 229910052794 bromium Inorganic materials 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 239000006172 buffering agent Substances 0.000 description 1
- KDYFGRWQOYBRFD-NUQCWPJISA-N butanedioic acid Chemical compound O[14C](=O)CC[14C](O)=O KDYFGRWQOYBRFD-NUQCWPJISA-N 0.000 description 1
- 150000004648 butanoic acid derivatives Chemical class 0.000 description 1
- 125000000484 butyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- MIOPJNTWMNEORI-UHFFFAOYSA-N camphorsulfonic acid Chemical class C1CC2(CS(O)(=O)=O)C(=O)CC1C2(C)C MIOPJNTWMNEORI-UHFFFAOYSA-N 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 150000004657 carbamic acid derivatives Chemical class 0.000 description 1
- 125000000609 carbazolyl group Chemical group C1(=CC=CC=2C3=CC=CC=C3NC12)* 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 150000007942 carboxylates Chemical class 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 229920002301 cellulose acetate Polymers 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 229910052729 chemical element Inorganic materials 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 229910052801 chlorine Inorganic materials 0.000 description 1
- FOCAUTSVDIKZOP-UHFFFAOYSA-M chloroacetate Chemical compound [O-]C(=O)CCl FOCAUTSVDIKZOP-UHFFFAOYSA-M 0.000 description 1
- 229940089960 chloroacetate Drugs 0.000 description 1
- 125000003016 chromanyl group Chemical group O1C(CCC2=CC=CC=C12)* 0.000 description 1
- 125000000259 cinnolinyl group Chemical group N1=NC(=CC2=CC=CC=C12)* 0.000 description 1
- 150000001860 citric acid derivatives Chemical class 0.000 description 1
- 229940110456 cocoa butter Drugs 0.000 description 1
- 235000019868 cocoa butter Nutrition 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013270 controlled release Methods 0.000 description 1
- 235000005687 corn oil Nutrition 0.000 description 1
- 239000002285 corn oil Substances 0.000 description 1
- 239000008120 corn starch Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 235000012343 cottonseed oil Nutrition 0.000 description 1
- 239000002385 cottonseed oil Substances 0.000 description 1
- LDHQCZJRKDOVOX-NSCUHMNNSA-N crotonic acid Chemical compound C\C=C\C(O)=O LDHQCZJRKDOVOX-NSCUHMNNSA-N 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 125000006448 cycloalkyl cycloalkyl group Chemical group 0.000 description 1
- 125000001995 cyclobutyl group Chemical group [H]C1([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 1
- 125000001162 cycloheptenyl group Chemical group C1(=CCCCCC1)* 0.000 description 1
- 125000000582 cycloheptyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 1
- 125000000596 cyclohexenyl group Chemical group C1(=CCCCC1)* 0.000 description 1
- 125000000113 cyclohexyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 1
- 125000000522 cyclooctenyl group Chemical group C1(=CCCCCCC1)* 0.000 description 1
- 125000000640 cyclooctyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 125000002433 cyclopentenyl group Chemical group C1(=CCCC1)* 0.000 description 1
- 125000001511 cyclopentyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 1
- 125000001559 cyclopropyl group Chemical group [H]C1([H])C([H])([H])C1([H])* 0.000 description 1
- 125000004856 decahydroquinolinyl group Chemical group N1(CCCC2CCCCC12)* 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000001784 detoxification Methods 0.000 description 1
- AQEFLFZSWDEAIP-UHFFFAOYSA-N di-tert-butyl ether Chemical compound CC(C)(C)OC(C)(C)C AQEFLFZSWDEAIP-UHFFFAOYSA-N 0.000 description 1
- MHDVGSVTJDSBDK-UHFFFAOYSA-N dibenzyl ether Chemical compound C=1C=CC=CC=1COCC1=CC=CC=C1 MHDVGSVTJDSBDK-UHFFFAOYSA-N 0.000 description 1
- 125000005044 dihydroquinolinyl group Chemical group N1(CC=CC2=CC=CC=C12)* 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 125000005879 dioxolanyl group Chemical group 0.000 description 1
- 150000002019 disulfides Chemical class 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 229940000406 drug candidate Drugs 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 239000003596 drug target Substances 0.000 description 1
- 229950005627 embonate Drugs 0.000 description 1
- 125000004185 ester group Chemical group 0.000 description 1
- CCIVGXIOQKPBKL-UHFFFAOYSA-N ethanesulfonic acid Chemical class CCS(O)(=O)=O CCIVGXIOQKPBKL-UHFFFAOYSA-N 0.000 description 1
- 229920001249 ethyl cellulose Polymers 0.000 description 1
- 235000019325 ethyl cellulose Nutrition 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- LVGKNOAMLMIIKO-QXMHVHEDSA-N ethyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC LVGKNOAMLMIIKO-QXMHVHEDSA-N 0.000 description 1
- 229940093471 ethyl oleate Drugs 0.000 description 1
- QHOKNKNDLHIBEV-UHFFFAOYSA-N fellutamide Natural products CCCCCCCCCC(O)CC(=O)NC(CC(N)=O)C(=O)NC(CCC(N)=O)C(=O)NC(CO)CC(C)C QHOKNKNDLHIBEV-UHFFFAOYSA-N 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- FGIVSGPRGVABAB-UHFFFAOYSA-N fluoren-9-ylmethyl hydrogen carbonate Chemical compound C1=CC=C2C(COC(=O)O)C3=CC=CC=C3C2=C1 FGIVSGPRGVABAB-UHFFFAOYSA-N 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- 235000019867 fractionated palm kernal oil Nutrition 0.000 description 1
- VZCYOOQTPOCHFL-OWOJBTEDSA-L fumarate(2-) Chemical class [O-]C(=O)\C=C\C([O-])=O VZCYOOQTPOCHFL-OWOJBTEDSA-L 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 125000002541 furyl group Chemical group 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 125000005612 glucoheptonate group Chemical group 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 150000002315 glycerophosphates Chemical class 0.000 description 1
- 150000002334 glycols Chemical class 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical class O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 1
- 150000004820 halides Chemical class 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- MNWFXJYAOYHMED-UHFFFAOYSA-N heptanoic acid Chemical class CCCCCCC(O)=O MNWFXJYAOYHMED-UHFFFAOYSA-N 0.000 description 1
- 150000005363 heterobiaryls Chemical group 0.000 description 1
- 125000004415 heterocyclylalkyl group Chemical group 0.000 description 1
- UQEAIHBTYFGYIE-UHFFFAOYSA-N hexamethyldisiloxane Chemical compound C[Si](C)(C)O[Si](C)(C)C UQEAIHBTYFGYIE-UHFFFAOYSA-N 0.000 description 1
- FUZZWVXGSFPDMH-UHFFFAOYSA-N hexanoic acid Chemical class CCCCCC(O)=O FUZZWVXGSFPDMH-UHFFFAOYSA-N 0.000 description 1
- 102000043603 human GBF1 Human genes 0.000 description 1
- 229930182851 human metabolite Natural products 0.000 description 1
- 229940042795 hydrazides for tuberculosis treatment Drugs 0.000 description 1
- 150000007857 hydrazones Chemical class 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 150000004679 hydroxides Chemical class 0.000 description 1
- 125000002883 imidazolyl group Chemical group 0.000 description 1
- 150000002466 imines Chemical class 0.000 description 1
- 125000003392 indanyl group Chemical group C1(CCC2=CC=CC=C12)* 0.000 description 1
- 125000003453 indazolyl group Chemical group N1N=C(C2=C1C=CC=C2)* 0.000 description 1
- 125000003387 indolinyl group Chemical group N1(CCC2=CC=CC=C12)* 0.000 description 1
- 125000003406 indolizinyl group Chemical group C=1(C=CN2C=CC=CC12)* 0.000 description 1
- 125000001041 indolyl group Chemical group 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000000266 injurious effect Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 229910052740 iodine Inorganic materials 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- SUMDYPCJJOFFON-UHFFFAOYSA-N isethionic acid Chemical class OCCS(O)(=O)=O SUMDYPCJJOFFON-UHFFFAOYSA-N 0.000 description 1
- 125000000959 isobutyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])* 0.000 description 1
- 125000000904 isoindolyl group Chemical group C=1(NC=C2C=CC=CC12)* 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 125000002183 isoquinolinyl group Chemical group C1(=NC=CC2=CC=CC=C12)* 0.000 description 1
- 125000001786 isothiazolyl group Chemical group 0.000 description 1
- 150000002576 ketones Chemical class 0.000 description 1
- 150000003893 lactate salts Chemical class 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 150000002678 macrocyclic compounds Chemical class 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- VTHJTEIRLNZDEV-UHFFFAOYSA-L magnesium dihydroxide Chemical compound [OH-].[OH-].[Mg+2] VTHJTEIRLNZDEV-UHFFFAOYSA-L 0.000 description 1
- 239000000347 magnesium hydroxide Substances 0.000 description 1
- 229910001862 magnesium hydroxide Inorganic materials 0.000 description 1
- VZCYOOQTPOCHFL-UPHRSURJSA-N maleic acid Chemical compound OC(=O)\C=C/C(O)=O VZCYOOQTPOCHFL-UPHRSURJSA-N 0.000 description 1
- 239000011976 maleic acid Substances 0.000 description 1
- 150000002688 maleic acid derivatives Chemical class 0.000 description 1
- 150000004701 malic acid derivatives Chemical class 0.000 description 1
- 150000002690 malonic acid derivatives Chemical class 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- AFVFQIVMOAPDHO-UHFFFAOYSA-M methanesulfonate group Chemical class CS(=O)(=O)[O-] AFVFQIVMOAPDHO-UHFFFAOYSA-M 0.000 description 1
- RMIODHQZRUFFFF-UHFFFAOYSA-M methoxyacetate Chemical compound COCC([O-])=O RMIODHQZRUFFFF-UHFFFAOYSA-M 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- HPNSFSBZBAHARI-UHFFFAOYSA-N micophenolic acid Natural products OC1=C(CC=C(C)CCC(O)=O)C(OC)=C(C)C2=C1C(=O)OC2 HPNSFSBZBAHARI-UHFFFAOYSA-N 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 150000007522 mineralic acids Chemical class 0.000 description 1
- 230000009149 molecular binding Effects 0.000 description 1
- CQDGTJPVBWZJAZ-UHFFFAOYSA-N monoethyl carbonate Chemical compound CCOC(O)=O CQDGTJPVBWZJAZ-UHFFFAOYSA-N 0.000 description 1
- 210000000214 mouth Anatomy 0.000 description 1
- HPNSFSBZBAHARI-RUDMXATFSA-N mycophenolic acid Chemical compound OC1=C(C\C=C(/C)CCC(O)=O)C(OC)=C(C)C2=C1C(=O)OC2 HPNSFSBZBAHARI-RUDMXATFSA-N 0.000 description 1
- 229960000951 mycophenolic acid Drugs 0.000 description 1
- KVBGVZZKJNLNJU-UHFFFAOYSA-N naphthalene-2-sulfonic acid Chemical class C1=CC=CC2=CC(S(=O)(=O)O)=CC=C21 KVBGVZZKJNLNJU-UHFFFAOYSA-N 0.000 description 1
- 125000001624 naphthyl group Chemical group 0.000 description 1
- 125000004593 naphthyridinyl group Chemical group N1=C(C=CC2=CC=CN=C12)* 0.000 description 1
- 150000002814 niacins Chemical class 0.000 description 1
- 235000001968 nicotinic acid Nutrition 0.000 description 1
- 125000002868 norbornyl group Chemical group C12(CCC(CC1)C2)* 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 239000002674 ointment Substances 0.000 description 1
- 239000004006 olive oil Substances 0.000 description 1
- 235000008390 olive oil Nutrition 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 125000001181 organosilyl group Chemical group [SiH3]* 0.000 description 1
- 150000002905 orthoesters Chemical class 0.000 description 1
- 125000001715 oxadiazolyl group Chemical group 0.000 description 1
- 150000003891 oxalate salts Chemical class 0.000 description 1
- 125000000160 oxazolidinyl group Chemical group 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 150000002942 palmitic acid derivatives Chemical class 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 239000006072 paste Substances 0.000 description 1
- 239000000312 peanut oil Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- JRKICGRDRMAZLK-UHFFFAOYSA-L persulfate group Chemical group S(=O)(=O)([O-])OOS(=O)(=O)[O-] JRKICGRDRMAZLK-UHFFFAOYSA-L 0.000 description 1
- 125000001791 phenazinyl group Chemical group C1(=CC=CC2=NC3=CC=CC=C3N=C12)* 0.000 description 1
- 125000001484 phenothiazinyl group Chemical group C1(=CC=CC=2SC3=CC=CC=C3NC12)* 0.000 description 1
- FAQJJMHZNSSFSM-UHFFFAOYSA-N phenylglyoxylic acid Chemical compound OC(=O)C(=O)C1=CC=CC=C1 FAQJJMHZNSSFSM-UHFFFAOYSA-N 0.000 description 1
- RGCLLPNLLBQHPF-HJWRWDBZSA-N phosphamidon Chemical compound CCN(CC)C(=O)C(\Cl)=C(/C)OP(=O)(OC)OC RGCLLPNLLBQHPF-HJWRWDBZSA-N 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 125000004592 phthalazinyl group Chemical group C1(=NN=CC2=CC=CC=C12)* 0.000 description 1
- XKJCHHZQLQNZHY-UHFFFAOYSA-N phthalimide Chemical compound C1=CC=C2C(=O)NC(=O)C2=C1 XKJCHHZQLQNZHY-UHFFFAOYSA-N 0.000 description 1
- 125000005545 phthalimidyl group Chemical group 0.000 description 1
- OXNIZHLAWKMVMX-UHFFFAOYSA-N picric acid Chemical class OC1=C([N+]([O-])=O)C=C([N+]([O-])=O)C=C1[N+]([O-])=O OXNIZHLAWKMVMX-UHFFFAOYSA-N 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 125000004193 piperazinyl group Chemical group 0.000 description 1
- IUGYQRQAERSCNH-UHFFFAOYSA-M pivalate Chemical compound CC(C)(C)C([O-])=O IUGYQRQAERSCNH-UHFFFAOYSA-M 0.000 description 1
- 229950010765 pivalate Drugs 0.000 description 1
- 125000005547 pivalate group Chemical group 0.000 description 1
- 229920000515 polycarbonate Polymers 0.000 description 1
- 239000004417 polycarbonate Substances 0.000 description 1
- 229920000728 polyester Polymers 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 229920001592 potato starch Polymers 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 125000001042 pteridinyl group Chemical group N1=C(N=CC2=NC=CN=C12)* 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 238000010298 pulverizing process Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 125000000561 purinyl group Chemical group N1=C(N=C2N=CNC2=C1)* 0.000 description 1
- 125000003373 pyrazinyl group Chemical group 0.000 description 1
- 125000003226 pyrazolyl group Chemical group 0.000 description 1
- 125000002098 pyridazinyl group Chemical group 0.000 description 1
- UDJFFSGCRRMVFH-UHFFFAOYSA-N pyrido[2,3-d]pyrimidine Chemical compound N1=CN=CC2=CC=CN=C21 UDJFFSGCRRMVFH-UHFFFAOYSA-N 0.000 description 1
- 125000004076 pyridyl group Chemical group 0.000 description 1
- 125000000714 pyrimidinyl group Chemical group 0.000 description 1
- 125000001422 pyrrolinyl group Chemical group 0.000 description 1
- 125000000168 pyrrolyl group Chemical group 0.000 description 1
- 125000001453 quaternary ammonium group Chemical group 0.000 description 1
- 125000002294 quinazolinyl group Chemical group N1=C(N=CC2=CC=CC=C12)* 0.000 description 1
- 125000002943 quinolinyl group Chemical group N1=C(C=CC2=CC=CC=C12)* 0.000 description 1
- 125000001567 quinoxalinyl group Chemical group N1=C(C=NC2=CC=CC=C12)* 0.000 description 1
- 125000004621 quinuclidinyl group Chemical group N12C(CC(CC1)CC2)* 0.000 description 1
- 150000003254 radicals Chemical class 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 235000005713 safflower oil Nutrition 0.000 description 1
- 239000003813 safflower oil Substances 0.000 description 1
- 150000007659 semicarbazones Chemical class 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000008159 sesame oil Substances 0.000 description 1
- 235000011803 sesame oil Nutrition 0.000 description 1
- FGEJJBGRIFKJTB-UHFFFAOYSA-N silylsulfanylsilane Chemical class [SiH3]S[SiH3] FGEJJBGRIFKJTB-UHFFFAOYSA-N 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 1
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 1
- 159000000000 sodium salts Chemical group 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 239000003549 soybean oil Substances 0.000 description 1
- 235000012424 soybean oil Nutrition 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008174 sterile solution Substances 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 125000003107 substituted aryl group Chemical group 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 150000003890 succinate salts Chemical class 0.000 description 1
- 229960002317 succinimide Drugs 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000013268 sustained release Methods 0.000 description 1
- 239000012730 sustained-release form Substances 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 239000000454 talc Substances 0.000 description 1
- 229910052623 talc Inorganic materials 0.000 description 1
- 239000011975 tartaric acid Substances 0.000 description 1
- 235000002906 tartaric acid Nutrition 0.000 description 1
- 150000003892 tartrate salts Chemical class 0.000 description 1
- ILMRJRBKQSSXGY-UHFFFAOYSA-N tert-butyl(dimethyl)silicon Chemical group C[Si](C)C(C)(C)C ILMRJRBKQSSXGY-UHFFFAOYSA-N 0.000 description 1
- FGTJJHCZWOVVNH-UHFFFAOYSA-N tert-butyl-[tert-butyl(dimethyl)silyl]oxy-dimethylsilane Chemical compound CC(C)(C)[Si](C)(C)O[Si](C)(C)C(C)(C)C FGTJJHCZWOVVNH-UHFFFAOYSA-N 0.000 description 1
- KJTULOVPMGUBJS-UHFFFAOYSA-N tert-butyl-[tert-butyl(diphenyl)silyl]oxy-diphenylsilane Chemical compound C=1C=CC=CC=1[Si](C=1C=CC=CC=1)(C(C)(C)C)O[Si](C(C)(C)C)(C=1C=CC=CC=1)C1=CC=CC=C1 KJTULOVPMGUBJS-UHFFFAOYSA-N 0.000 description 1
- 125000003718 tetrahydrofuranyl group Chemical group 0.000 description 1
- 125000005958 tetrahydrothienyl group Chemical group 0.000 description 1
- 125000003831 tetrazolyl group Chemical group 0.000 description 1
- 125000001113 thiadiazolyl group Chemical group 0.000 description 1
- 125000005308 thiazepinyl group Chemical group S1N=C(C=CC=C1)* 0.000 description 1
- 125000000335 thiazolyl group Chemical group 0.000 description 1
- 125000001544 thienyl group Chemical group 0.000 description 1
- 150000007970 thio esters Chemical class 0.000 description 1
- 150000003558 thiocarbamic acid derivatives Chemical class 0.000 description 1
- 150000003567 thiocyanates Chemical class 0.000 description 1
- 150000003568 thioethers Chemical class 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- JOXIMZWYDAKGHI-UHFFFAOYSA-N toluene-4-sulfonic acid Chemical class CC1=CC=C(S(O)(=O)=O)C=C1 JOXIMZWYDAKGHI-UHFFFAOYSA-N 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- LGSAOJLQTXCYHF-UHFFFAOYSA-N tri(propan-2-yl)-tri(propan-2-yl)silyloxysilane Chemical compound CC(C)[Si](C(C)C)(C(C)C)O[Si](C(C)C)(C(C)C)C(C)C LGSAOJLQTXCYHF-UHFFFAOYSA-N 0.000 description 1
- 125000002306 tributylsilyl group Chemical group C(CCC)[Si](CCCC)(CCCC)* 0.000 description 1
- WILBTFWIBAOWLN-UHFFFAOYSA-N triethyl(triethylsilyloxy)silane Chemical compound CC[Si](CC)(CC)O[Si](CC)(CC)CC WILBTFWIBAOWLN-UHFFFAOYSA-N 0.000 description 1
- 125000000026 trimethylsilyl group Chemical group [H]C([H])([H])[Si]([*])(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- ZDPHROOEEOARMN-UHFFFAOYSA-N undecanoic acid Chemical class CCCCCCCCCCC(O)=O ZDPHROOEEOARMN-UHFFFAOYSA-N 0.000 description 1
- NQPDZGIKBAWPEJ-UHFFFAOYSA-M valerate Chemical class CCCCC([O-])=O NQPDZGIKBAWPEJ-UHFFFAOYSA-M 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B10/00—ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
- G16B35/10—Design of libraries
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Library & Information Science (AREA)
- Molecular Biology (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biochemistry (AREA)
- Genetics & Genomics (AREA)
- Animal Behavior & Ethology (AREA)
- Physiology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本公开内容尤其提供了用于例如从真菌基因组中高效且有效地鉴定ETaG的技术。在一些实施方案中,所提供的技术可特别地用于鉴定真菌生物合成产物的哺乳动物靶标。在一些实施方案中,所提供的技术可特别地用于鉴定用于药物开发的人靶标和/或对其进行优先排序。在一些实施方案中,所提供的技术可特别地用于基于真菌的生物合成产物来开发用于人靶标的调节剂。
Description
相关申请的交叉引用
本申请要求于2017年9月14日提交的美国临时申请No.62/558,744的优先权,其整体通过引用并入本文。
背景技术
在人蛋白质组中鉴定所谓的“可成药(druggable)”靶标已被描述为一项“重大挑战”。参见,例如Dixon et al Curr.Opin.Chem.Biol.13:549,2009。自2011年起,报道估计仅约2%的人蛋白质已被批准的药物成功靶向,并且此外仅10%至15%的人蛋白质甚至容易被靶向(即,是“可成药的”)。参见,例如Stockwell Sci.Am 305:20,2011。
发明内容
越来越多的证据表明,一些微生物生物合成基因簇有时包含看起来不涉及通过由该簇编码的酶产生的相关生物合成产物之合成的基因(在本文中称为“过客(passenger)”基因)。在一些情况下,这样的过客基因被描述为“自保护的”,因为其编码明显可使宿主生物体对相关生物合成产物产生抗性的蛋白质。例如,在一些情况下,已经报道了编码生物合成产物的转运蛋白、作用于生物合成产物的解毒酶或活性由生物合成产物靶向的蛋白质的抗性变体的基因。参见,例如Cimermancic et al Cell 158:412,2014;KellerNat.Chem.Biol.11:671,2015。研究人员已提出,这样的基因及其功能的鉴定可用于确定通过该簇的酶合成的生物合成产物的作用。参见,例如,Yeh et al.ACS Chem.Biol.11:2275,2016;Tang et al.ACS Chem.Biol.10:2841,2015;Regueira et al.Appl,Environ.Microbiol.77:3035,2011;Kennedy et al.,Science 284:1368,1999;Lowtheret al.,Proc.Natl.Acad.Sci.USA 95:12153,1998;Abe et al,Mol.Genet.Genomics 268:130,2002。
本公开内容尤其提供了关于如本文中所述存在于生物合成基因簇中或存在于相对于所述簇中生物合成基因的邻近区中的非生物合成基因的不同观点,以及提供了关于某些这样的基因在人治疗剂中的潜在有用性的新见解。在一些实施方案中,本公开内容提供了利用这样的见解来开发和/或改善人治疗剂的技术。
本公开内容尤其提供了这样的见解:存在于生物合成基因簇中或存在于相对于所述簇中生物合成基因的邻近区中并且特别是存在于真核生物(例如,真菌,与细菌相比)生物合成基因簇中的某些非生物合成基因可代表代表具有治疗意义的靶标的人基因的同源物。本公开内容限定了表征这样的目的非生物合成基因的参数,所述基因在本文中称为“嵌入靶基因(embedded target gene)”或“ETaG”。本公开内容提供了用于鉴定和/或表征ETaG的技术、包含生物合成基因簇和/或ETaG基因序列(和任选的相关注释)的数据库、用于鉴定和/或表征对应于ETaG的人靶基因的系统,以及制备和/或使用这样的人靶基因和/或包含和/或表达这样的人靶基因的系统的方法,等等。
本公开内容提供了另外的见解:ETaG与其相关生物合成基因簇(包含生物合成基因的生物合成基因簇,该ETaG在相对于该生物合成基因的邻近区内)之间的关系提供了鉴定、设计和/或表征相应人靶基因的有效调节剂的信息。本公开内容提供了用于这样的鉴定、设计和/或表征的技术,并且还提供了实现对相关人靶基因进行调节的药剂,以及提供和/或使用这样的药剂的方法。
如上所述,本公开内容涵盖了ETaG可用作具有医学(例如,治疗)相关性的人靶标的功能性同源物(例如直向同源物)的见解。根据本公开内容,可将在真核生物(例如真菌)生物合成基因簇内或相对于该簇中生物合成基因的邻近区中的过客(即非生物合成)基因的序列与人基因的序列进行比较。对于所比较的序列,可确定(例如,定量评估和/或通过进化树可视化)核酸序列相似性、肽序列相似性和/或系统发育关系。作为替代或补充,可评估已知的结构和/或蛋白质效应物元件的保守性。在一些实施方案中,与人序列和/或保守结构和/或蛋白质效应物元件具有相对高同源性的那些过客基因可优先作为与人药物靶标一样具有意义的ETaG。
在一些实施方案中,本公开内容提供了包括以下步骤的方法:
查询核酸序列集合,所述核酸序列中的每一个存在于真菌菌株中并且包含生物合成基因簇;以及
在至少一个真菌核酸序列内鉴定嵌入靶基因(ETaG)序列,所述嵌入靶基因(ETaG)序列的特征在于,其:
在相对于所述簇中至少一个基因的邻近区内;并且
任选地与所述簇中至少一个生物合成基因共调节。
通常来说,生物合成基因簇包含一个或更多个生物合成基因。在一些实施方案中,生物合成基因簇包含一个或更多个生物合成基因和一个或更多个非生物合成基因。在一些实施方案中,非生物合成基因是调节性的,例如转录因子。在一些实施方案中,在通过生物信息学鉴定的生物合成基因簇中,非生物合成基因可以是假设基因。在一些实施方案中,生物合成基因簇的边界通过生物信息学方法例如antiSMASH来限定。在一些实施方案中,生物合成基因和非生物合成基因基于生物信息学来指定。在一些实施方案中,非生物合成基因可能具有生物合成功能,即使其通过生物信息学方法被鉴定为非生物合成基因(和/或在本公开内容中标示为非生物合成基因)。
在一些实施方案中,本公开内容提供了包括以下步骤的方法:
查询核酸序列集合,所述核酸序列中的每一个存在于真菌菌株中并且包含生物合成基因簇;以及
在至少一个真菌核酸序列内鉴定嵌入靶基因(ETaG)序列,所述嵌入靶基因(ETaG)序列的特征在于,其:
在相对于所述簇中至少一个生物合成基因的邻近区内;并且
任选地与所述簇中的至少一个生物合成基因共调节。
在一些实施方案中,本公开内容涵盖了这样的认识:来自真核生物真菌的ETaG与例如其在原核生物例如某些细菌中的对应物(如果有的话)相比可与哺乳动物基因具有更高相似性。在一些实施方案中,与在进化上与人相距更远的生物体相比,真菌包含在治疗上更相关的ETaG和/或包含更多治疗相关的ETaG。
在一些实施方案中,本公开内容提供了包括以下步骤的方法:
查询核酸序列集合,所述核酸序列中的每一个存在于真菌菌株中并且包含生物合成基因簇;以及
在至少一个真菌核酸序列内鉴定嵌入靶基因(ETaG)序列,所述嵌入靶基因(ETaG)序列的特征在于,其:
在相对于所述簇中至少一个基因的邻近区内;
与表达的哺乳动物核酸序列同源;并且
任选地与所述簇中的至少一个生物合成基因共调节。
在一些实施方案中,本公开内容提供了包括以下步骤的方法:
查询核酸序列集合,所述核酸序列中的每一个存在于真菌菌株中并且包含生物合成基因簇;以及
在至少一个真菌核酸序列内鉴定嵌入靶基因(ETaG)序列,所述嵌入靶基因(ETaG)序列的特征在于,其:
在相对于所述簇中至少一个生物合成基因的邻近区内;
与表达的哺乳动物核酸序列同源;并且
任选地与所述簇中的至少一个生物合成基因共调节。
在一些实施方案中,邻近区为在簇中生物合成基因上游或下游的不超过1至100kb,例如,不超过1、2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90或100kb。在一些实施方案中,邻近区为在簇中生物合成基因上游或下游的不超过1至100kb,例如,不超过1、2、3、4、5、6、7、8、9或10kb。在一些实施方案中,ETaG在生物合成基因簇内。在一些实施方案中,邻近区在生物合成基因簇中的两个生物合成基因之间。
在一些实施方案中,ETaG序列与哺乳动物核酸序列同源。在一些实施方案中,哺乳动物序列是人核酸序列。在一些实施方案中,ETaG序列与人核酸序列同源。在一些实施方案中,ETaG序列与表达的哺乳动物核酸序列同源。在一些实施方案中,ETaG序列与表达的人核酸序列同源。在一些实施方案中,哺乳动物核酸例如人核酸序列与人疾病、障碍或病症相关。在一些实施方案中,这样的人核酸序列是具有治疗意义的现有靶标。在一些实施方案中,这样的人核酸序列是具有治疗意义的新靶标。在一些实施方案中,这样的人核酸序列是先前认为不易被例如小分子靶向的靶标。在一些实施方案中,通过由相关生物合成基因簇编码的酶产生的生物合成产物或其类似物是人靶标的调节剂(例如,激活剂、抑制剂等)。
在一些实施方案中,ETaG序列与表达的哺乳动物核酸序列同源,这在于:其序列或其一部分与表达的哺乳动物核酸序列的序列或其一部分具有至少50%、60%、70%、80%或90%同一性。在一些实施方案中,ETaG序列与哺乳动物核酸序列同源,这在于:由ETaG产生的mRNA或其一部分与哺乳动物核酸序列的mRNA或其一部分同源。在一些实施方案中,同源部分的长度为至少50、100、150或200个碱基对。在一些实施方案中,同源部分编码从真菌到哺乳动物保守的蛋白质或蛋白质的保守部分,例如蛋白质结构域,与功能(例如,与另一分子(例如,蛋白质、小分子等)的相互作用、酶活性等)相关的残基集合,等等。
在一些实施方案中,ETaG序列与哺乳动物核酸序列同源,这在于:由ETaG编码的产物或其一部分与由哺乳动物核酸序列编码的产物或其一部分同源。在一些实施方案中,ETaG序列与哺乳动物核酸序列同源,这在于:由ETaG或其一部分编码的蛋白质与由哺乳动物核酸序列编码的蛋白质或其一部分同源。在一些实施方案中,ETaG序列与哺乳动物核酸序列同源,这在于:由ETaG编码的蛋白质的一部分与由哺乳动物核酸序列编码的蛋白质的一部分同源。
在一些实施方案中,蛋白质的一部分是蛋白质结构域。在一些实施方案中,蛋白质结构域是酶结构域。在一些实施方案中,蛋白质结构域与一种或更多种药剂例如小分子、脂质、碳水化合物、核酸、蛋白质等相互作用。
在一些实施方案中,蛋白质的一部分是限定该蛋白质所属的蛋白质家族的功能性结构域和/或结构性结构域。在限定蛋白质家族的特定的催化结构域或结构性结构域内的氨基酸残基可基于预测性亚家族结构域架构进行选择,并且任选地通过多种测定进行验证,以用于同源性的比对分析中。
在一些实施方案中,蛋白质的一部分是对于蛋白质的功能重要的连续或不连续的关键残基的集合。在一些实施方案中,功能是酶活性,并且蛋白质的一部分是该活性所需的残基的集合。在一些实施方案中,功能是酶活性,并且蛋白质的一部分是与底物、中间体或产物相互作用的残基的集合。在一些实施方案中,残基集合与底物相互作用。在一些实施方案中,残基集合与中间体相互作用。在一些实施方案中,残基集合与产物相互作用。
在一些实施方案中,功能是与一种或更多种药剂,例如小分子、脂质、碳水化合物、核酸、蛋白质等的相互作用,并且蛋白质的一部分是该相互作用所需的残基的集合。在一些实施方案中,集合中的残基各自独立地与相互作用剂接触。例如,在一些实施方案中,集合中的每个残基独立地与相互作用小分子接触。在一些实施方案中,蛋白质是激酶且相互作用小分子是或包含核碱基,并且集合中的残基各自独立地通过例如氢键键合、静电力、范德瓦耳斯力(van der Waals force)、芳香族堆积等与核碱基接触。在一些实施方案中,相互作用剂是另一大分子。在一些实施方案中,相互作用剂是核酸。在一些实施方案中,集合中的残基是与相互作用核酸接触的那些,例如转录因子中的那些。在一些实施方案中,集合中的残基是与相互作用蛋白质接触的那些。
在一些实施方案中,蛋白质的一部分是或包含蛋白质效应物募集和/或结合的基本结构元件,例如基于人靶标的三级蛋白质结构。
蛋白质的部分,例如蛋白质结构域、负责生物功能的残基的集合等,可在物种之间,例如,在一些实施方案中,从真菌到人是保守的,如本公开内容中所举例说明的。
在一些实施方案中,蛋白质同源性基于确切的同一性,例如在给定位置的相同氨基酸残基来测量。在一些实施方案中,同源性基于一种或更多种特性,例如具有一种或更多种相同或相似特性(例如,极性、非极性、疏水性、亲水性、尺寸、酸性、碱性、芳香族等)的氨基酸残基来测量。用于评估同源性的示例性方法是本领域中公知的,并且可根据本公开内容使用,例如,MUSCLE、TCoffee、ClustalW等。
在一些实施方案中,由ETaG或其一部分编码的蛋白质(例如,本公开内容中描述的那些)与由哺乳动物核酸序列编码的蛋白质或其一部分具有至少50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%、或100%(当100%时其与之相同)同源性。在一些实施方案中,由ETaG或其一部分编码的蛋白质与由表达的哺乳动物核酸序列编码的蛋白质或其一部分具有至少50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%、或100%同源性。
在一些实施方案中,ETaG与生物合成基因簇中的至少一个生物合成基因共调节。在一些实施方案中,ETaG与生物合成基因簇中的两个或更多个基因共调节。在一些实施方案中,ETaG与生物合成基因簇共调节,这在于:当产生通过由生物合成基因簇编码的酶产生的生物合成产物(生物合成基因簇的生物合成产物)时,ETaG的表达提高或开启。在一些实施方案中,ETaG与生物合成基因簇共调节,这在于:当生物合成基因簇的生物合成产物的水平提高时,ETaG的表达提高或开启。
在一些实施方案中,ETaG基因序列任选地与同一基因组中的一个或更多个基因序列具有超过约10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%或99%同源性。在一些实施方案中,ETaG基因序列任选地与同一基因组中的2、3、4、5、6、7、8、9或更多个基因序列具有超过约10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%或99%同源性。在一些实施方案中,同源性超过10%。在一些实施方案中,同源性超过20%。在一些实施方案中,同源性超过30%。在一些实施方案中,同源性超过40%。在一些实施方案中,同源性超过50%。在一些实施方案中,同源性超过60%。在一些实施方案中,同源性超过70%。在一些实施方案中,同源性超过80%。在一些实施方案中,同源性超过90%。某些实例提供于附图中。
在一些实施方案中,ETaG基因序列任选地与集合中至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%真菌核酸序列中的任何表达基因序列具有不超过约10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%或99%同一性,所述真菌核酸序列来自不同真菌菌株并且包含同源生物合成基因簇。在一些实施方案中,ETaG基因序列任选地与至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%来自不同真菌菌株在相对于同源生物合成基因簇中生物合成基因的邻近区内的真菌基因序列具有不超过约10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%或99%同一性。在一些实施方案中,ETaG基因序列任选地与至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%来自不同真菌菌株在相对于同源生物合成基因簇中生物合成基因的邻近区内的真菌基因序列具有不超过约10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%或99%同一性。在一些实施方案中,ETaG基因序列任选地与集合中任何真菌核酸序列中的任何表达基因序列具有不超过约10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%或99%同一性,所述真菌核酸序列来自不同真菌菌株并且包含同源生物合成基因簇。在一些实施方案中,ETaG基因序列任选地与来自不同真菌菌株在相对于同源生物合成基因簇中生物合成基因的邻近区内的任何表达基因序列具有不超过约10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%或99%同一性。在一些实施方案中,不超过约10%同一性。在一些实施方案中,不超过约20%同一性。在一些实施方案中,不超过约30%同一性。在一些实施方案中,不超过约40%同一性。在一些实施方案中,不超过约50%同一性。在一些实施方案中,不超过约60%同一性。在一些实施方案中,不超过约70%同一性。在一些实施方案中,不超过约80%同一性。在一些实施方案中,不超过约90%同一性。
在一些实施方案中,人靶基因和/或其产物容易被生物合成基因簇的生物合成产物或其类似物调节,其中所述人靶基因在所述生物合成基因簇内或在相对于所述簇中生物合成基因的邻近区中具有其同源ETaG。在一些实施方案中,由人靶基因编码的蛋白质容易被生物合成基因簇的生物合成产物或其类似物调节,其中所述人靶基因在所述生物合成基因簇内或在相对于所述簇中生物合成基因的邻近区中具有其同源ETaG。因此,在一些实施方案中,本公开内容不仅提供了新的人靶标,而且还提供了用于调节这样的人靶标的方法和药剂。
在一些实施方案中,本公开内容提供了用于鉴定ETaG和/或其医学相关性例如其治疗相关性的技术,例如方法、数据库、系统等。在一些实施方案中,本公开内容提供了数据库,任选地具有多种注释的数据库,所述数据库被构造用于ETaG、相关生物合成基因簇、生物合成基因簇的相关生物合成产物和/或其类似物、相关同源哺乳动物核酸序列(例如,人基因)等的有效鉴定、检索、使用等。本公开内容尤其提供了被构造以改善例如ETaG鉴定的计算效率和/或准确性的数据库和/或序列。
例如,在一些实施方案中,构建所提供的数据库,使得鉴定和注释所有生物合成基因簇。然后,将这些簇的核酸序列从真菌基因组中的其余核酸序列中计算移出并数据库化。然后,将所得生物合成基因簇数据库用于ETaG检索。尤其地,当使用这样的数据库鉴定ETaG检索中的命中项(hit)时,该命中项为ETaG,因为仅检索了在生物合成簇(或其邻近区)中的序列。使生物合成基因簇序列与全基因组序列分开提高了信噪比,并且极大加速了ETaG检索过程。尤其地,与使用所提供的数据库相比,在全真菌基因组序列中检索ETaG频繁导致其中所鉴定的命中项是位于基因组中但不位于生物合成基因簇或其邻近区中的“持家”基因的假阳性。在一些实施方案中,从所提供的技术(例如,方法、数据库等)中鉴定的命中项例如ETaG不是持家基因。在一些实施方案中,从所提供的技术中鉴定的命中项例如ETaG是或包含与在同一基因组中的第二核酸序列(例如,基因)或其一部分共有同源性的序列。本公开内容中序列的序列同源性可以是至少20%、30%、40%、50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%。在一些实施方案中,同源性为至少50%;在一些实施方案中,至少60%;在一些实施方案中,至少70%;在一些实施方案中,至少75%;在一些实施方案中,至少80%;在一些实施方案中,至少85%;在一些实施方案中,至少90%;以及在一些实施方案中,至少95%。本公开内容的序列的一部分可包含至少5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450、500、600、700、800、900或1000个氨基酸残基(对于蛋白质序列)或核碱基(对于核酸序列)。在一些实施方案中,核酸序列的一部分的长度为至少10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450、500、600、700、800、900或1000个核碱基。在一些实施方案中,长度为至少20个核碱基。在一些实施方案中,长度为至少30个核碱基。在一些实施方案中,长度为至少40个核碱基。在一些实施方案中,长度为至少50个核碱基。在一些实施方案中,长度为至少100个核碱基。在一些实施方案中,长度为至少150个核碱基。在一些实施方案中,长度为至少200个核碱基。在一些实施方案中,长度为至少300个核碱基。在一些实施方案中,长度为至少400个核碱基。在一些实施方案中,长度为至少500个核碱基。在一些实施方案中,从所提供的技术中鉴定的命中项例如ETaG是或包含编码与由同一基因组中第二核酸序列(例如,基因)编码的产物或其一部分(例如,如本公开内容中所述的蛋白质的关键残基的集合、蛋白质结构域等)共有同源性(例如,至少50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%)的产物(例如蛋白质)的序列。如本文中所述,同源性/相似性可使用本领域技术人员所理解的多种技术来评估。在一些实施方案中,第二核酸序列是或包含持家基因。在一些实施方案中,第二核酸序列在两个或更多个物种之间共有。在一些实施方案中,ETaG虽然与第二核酸序列同源但是与该第二核酸序列不同,这在于ETaG编码提供针对其相应生物合成簇的产物(例如,小分子)的抗性的产物(例如,蛋白质),而第二核酸序列则不是。
在一些实施方案中,本公开内容提供了包含以下的系统:
一个或更多个非暂时性机器可读存储介质,其存储代表核酸序列集合的数据,所述核酸序列中的每一个存在于真菌菌株中并且包含生物合成基因簇。
在一些实施方案中,本公开内容提供了包含以下的系统:
一个或更多个非暂时性机器可读存储介质,其存储代表核酸序列集合的数据,所述核酸序列中的每一个是或包含ETaG序列。
在一些实施方案中,集合中至少10、20、50、100、200或500个、或者至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%或95%、或所有的核酸序列包含经索引和/或经注释的ETaG。在一些实施方案中,所提供的系统可极大地提高计算效率,因为其被构造以极大地降低待处理的数据的量。例如,作为处理一个或更多个(在一些情况下,数百或数千或甚至更多)真菌基因组的所有基因组或生物合成基因簇序列数据以检索ETaG的替代,所提供的系统可仅检索索引/标记为ETaG的基因,从而节省了用于处理未索引为ETaG的序列的时间和成本。作为补充或替代,ETaG可独立地用信息例如其相关生物合成基因簇(其包含生物合成基因,该ETaG在相对于该生物合成基因的邻近区内)、相关生物合成基因簇的生物合成产物的结构、和/或该ETaG的人同源物等进行注释。在一些实施方案中,集合中至少10、20、50、100、200或500个、或者至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%或95%或者所有的ETaG独立地用以下至少一种进行注释:相关生物合成基因簇和ETaG的人同源物。在一些实施方案中,集合中至少10、20、50、100、200或500个、或者至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%或95%或者所有的ETaG独立地用以下至少一种进行注释:相关生物合成基因簇、相关生物合成基因簇的生物合成产物以及ETaG的人同源物。在一些实施方案中,通过利用ETaG索引和注释来构造序列数据,所提供的系统可提供许多优点。例如,在一些实施方案中,所提供系统允许在保持数据大小和较低成本的同时利用有用的相关信息,例如其相关的生物合成基因簇和人同源物快速访问ETaG,并且反之亦然。
在一些实施方案中,所提供的方法和系统可用于人靶标的鉴定和/或表征,因为所提供的方法和系统尤其提供了生物合成基因簇、ETaG和人靶基因之间的联系。在一些实施方案中,本公开内容通过提供在本公开内容之前被认为不可成药的靶标在真菌中的同源ETaG和相关生物合成基因簇特别地提供了对该靶标的了解。在一些实施方案中,本公开内容极大地提高了在本公开内容之前被认为不可成药的靶标的可成药性,在某些情况下基本上将其转化为可成药的靶标,通过例如其在真菌中的同源ETaG、相关生物合成基因簇、相关生物合成基因簇的生物合成产物(其可直接用作人靶标的调节剂,和/或其类似物可用作人靶标的调节剂)。
在一些实施方案中,本公开内容提供了用于鉴定和/或表征生物合成基因簇的生物合成产物或该产物的类似物的人靶标的方法。
在一些实施方案中,本公开内容提供了包括以下的方法:
鉴定ETaG的人同源物,所述ETaG在相对于生物合成基因簇中至少一个基因的邻近区内或在相对于第二生物合成基因簇中至少一个基因的邻近区内,所述第二生物合成基因簇编码产生通过由所述生物合成基因簇编码的酶产生的生物合成产物的酶;以及
任选地测定通过由所述生物合成基因簇编码的酶产生的生物合成产物或所述产物的类似物对人靶标的作用。
在一些实施方案中,本公开内容提供了包括以下的方法:
鉴定ETaG的人同源物,所述ETaG在相对于生物合成基因簇中至少一个生物合成基因的邻近区内或在相对于第二生物合成基因簇中至少一个生物合成基因的邻近区内,所述第二生物合成基因簇编码产生通过由所述生物合成基因簇编码的酶产生的生物合成产物的酶;以及
任选地测定通过由所述生物合成基因簇编码的酶产生的生物合成产物或所述产物的类似物对人靶标的作用。
在一些实施方案中,本公开内容提供了包括以下的方法:
鉴定ETaG的人同源物,所述ETaG在相对于生物合成基因簇中至少一个基因的邻近区内;以及
任选地测定通过由生物合成基因簇编码的酶产生的生物合成产物或所述产物的类似物对人靶标的作用。
在一些实施方案中,本公开内容提供了包括以下的方法:
鉴定ETaG的人同源物,所述ETaG在相对于生物合成基因簇中至少一个生物合成基因的邻近区内;以及
任选地测定通过由生物合成基因簇编码的酶产生的生物合成产物或所述产物的类似物对人靶标的作用。
在一些实施方案中,对于不包含相对于其的邻近区包含ETaG的生物合成基因的生物合成基因簇,这样的生物合成基因簇的产物(和/或其类似物)的哺乳动物靶标,例如人靶标可通过在相对于第二生物合成基因簇中生物合成基因的邻近区中的ETaG来鉴定,所述第二生物合成基因簇编码产生相同生物合成产物的酶。在一些实施方案中,第二生物合成基因簇在不同的生物体中。在一些实施方案中,第二生物合成基因簇在不同的真菌菌株中。
在一些实施方案中,本公开内容提供了用于鉴定和/或表征生物合成基因簇的生物合成产物或该产物的类似物的人靶标的方法,其包括:
鉴定ETaG的人同源物,所述ETaG在相对于第二生物合成基因簇中至少一个生物合成基因的邻近区内,所述第二生物合成基因簇编码产生通过由所述生物合成基因簇编码的酶产生的相同生物合成产物的酶;以及
任选地测定通过由所述生物合成基因簇编码的酶产生的生物合成产物或所述产物的类似物对人靶标的作用。
在一些实施方案中,所提供的技术可用于评估人靶标与化合物的相互作用。在一些实施方案中,本公开内容提供了用于评估人靶标与化合物的相互作用的方法,其包括:
将人靶标的核酸序列或编码人靶标的核酸序列与包含一个或更多个ETaG的核酸序列的集合进行比较。
在一些实施方案中,与ETaG的同源性(核酸水平或蛋白质水平,包括其部分)涉及该ETaG的相关生物合成基因簇及其生物合成产物。在一些实施方案中,生物合成产物与人靶标之间的这样的联系指示人靶标或由此编码的产物的相互作用和/或调节。在一些实施方案中,这样的生物合成产物与人靶标或由此编码的产物相互作用和/或对其进行调节。
在一些实施方案中,所提供的技术可用于设计和/或提供人靶标的调节剂,因为所提供的技术尤其提供了生物合成基因簇、ETaG和人靶基因之间的联系。
在一些实施方案中,本公开内容提供了化合物,所述化合物是由生物合成基因簇编码的酶的产物,其中在相对于该生物合成基因簇中至少一个基因的邻近区内存在ETaG,所述ETaG:
与人靶标或编码人靶标的核酸序列同源;并且
任选地与该簇中的至少一个生物合成基因共调节。
在一些实施方案中,所提供的化合物是由所提供的生物合成基因簇编码的酶的产物。在一些实施方案中,所提供的化合物是由所提供的生物合成基因簇编码的酶的产物的类似物。在一些实施方案中,所提供的生物合成基因簇包含图5至12和20至39之一中所示的一个或更多个生物合成基因。在一些实施方案中,所提供的生物合成基因簇是图5至12和20至39之一。在一些实施方案中,所提供的化合物是由图5至12和20至39之一中所示的所提供生物合成基因簇编码的酶的产物。在一些实施方案中,所提供的化合物是图5至12和20至39之一中所示的所提供生物合成基因簇或包含图5至12和20至39之一中所示的一个或更多个生物合成基因的生物合成基因簇的产物。在一些实施方案中,所提供的化合物是图5至12和20至39之一中所示的所提供生物合成基因簇的产物。在一些实施方案中,所提供的化合物是包含图5至12和20至39之一中所示的一个或更多个生物合成基因的所提供生物合成基因簇的产物。在一些实施方案中,所提供的化合物是由图5至12和20至39之一中所示的所提供生物合成基因簇编码的酶的产物的类似物。在一些实施方案中,所提供的化合物是包含图5至12和20至39之一中所示的一个或更多个生物合成基因的所提供生物合成基因簇的产物的类似物。在一些实施方案中,所提供的化合物调节人靶标的功能。在一些实施方案中,本公开内容提供了所提供化合物的药物组合物。在一些实施方案中,本公开内容提供了包含所提供化合物或其可药用盐的药物组合物。在一些实施方案中,本公开内容提供了包含所提供化合物或其可药用盐、以及可药用载体的药物组合物。在一些实施方案中,所提供组合物中的所提供化合物是由生物合成基因簇编码的酶的产物的类似物或其盐。在一些实施方案中,所提供组合物中的所提供化合物是由生物合成基因簇编码的酶的产物的非天然盐。
在一些实施方案中,本公开内容提供了用于鉴定和/或表征人靶标的调节剂的方法,其包括:
提供产物或其类似物,所述产物通过由生物合成基因簇编码的酶产生,其中在相对于该生物合成基因簇中至少一个基因的邻近区内存在ETaG,所述ETaG:
与人靶标或编码人靶标的核酸序列同源;并且
任选地与该簇中的至少一个生物合成基因共调节。
在一些实施方案中,本公开内容提供了用于鉴定和/或表征人靶标的调节剂的方法,其包括:
提供产物或其类似物,所述产物通过由生物合成基因簇编码的酶产生,其中在相对于该生物合成基因簇中至少一个生物合成基因的邻近区内存在ETaG,所述ETaG:
与人靶标或编码人靶标的核酸序列同源;并且
任选地与该簇中的至少一个生物合成基因共调节。
在一些实施方案中,本公开内容提供了用于调节人靶标的方法,其包括:
提供产物或其类似物,所述产物通过由生物合成基因簇编码的酶产生,其中在相对于该生物合成基因簇中至少一个基因的邻近区内存在ETaG,所述ETaG:
与人靶标或编码人靶标的核酸序列同源;并且
任选地与该簇中的至少一个生物合成基因共调节。
在一些实施方案中,本公开内容提供了用于调节人靶标的方法,其包括:
提供产物或其类似物,所述产物通过由生物合成基因簇编码的酶产生,其中在相对于该生物合成基因簇中至少一个生物合成基因的邻近区内存在ETaG,所述ETaG:
与人靶标或编码人靶标的核酸序列同源;并且
任选地与该簇中的至少一个生物合成基因共调节。
在一些实施方案中,本公开内容提供了用于治疗与人靶标相关的病症、障碍或疾病的方法,其包括向易患或患有所述病症、障碍或疾病的对象施用生物合成产物或其类似物,其中:
所述生物合成产物是生物合成基因簇的,其中在相对于该生物合成基因簇中至少一个基因的邻近区内存在ETaG,所述ETaG:
与人靶标或编码人靶标的核酸序列同源;并且
任选地与该簇中的至少一个生物合成基因共调节。
在一些实施方案中,本公开内容提供了用于治疗与人靶标相关的病症、障碍或疾病的方法,其包括向易患或患有所述病症、障碍或疾病的对象施用生物合成产物或其类似物,其中:
所述生物合成产物是生物合成基因簇的,其中在相对于该生物合成基因簇中至少一个生物合成基因的邻近区内存在ETaG,所述ETaG:
与人靶标或编码人靶标的核酸序列同源;并且
任选地与该簇中的至少一个生物合成基因共调节。
在一些实施方案中,人靶标是Ras蛋白。在一些实施方案中,人靶标包含RasGEF结构域。在一些实施方案中,人靶标包含RasGAP结构域。
在一些实施方案中,ETaG通过所提供的方法鉴定。
在一些实施方案中,产物(例如,生物合成产物)由真菌产生。在一些实施方案中,产物是无环的。在一些实施方案中,产物是聚酮化合物。在一些实施方案中,产物是萜化合物。在一些实施方案中,产物是非核糖体合成的。
在一些实施方案中,类似物是与参考物质共有一个或更多个特定结构特征、元件、组分或部分的物质。典型地,类似物显示与参考物质具有显著的结构相似性,例如共享核心或共有结构,但在某些离散方面也有所不同。在一些实施方案中,类似物是可由参考物质例如通过对参考物质进行化学操作而产生的物质。在一些实施方案中,类似物是可通过执行与产生参考物质的合成过程基本上相似(例如,与其共有多个步骤)的合成过程产生的物质。在一些实施方案中,类似物是通过或可通过执行与用于产生参考物质的合成过程不同的合成过程产生。在一些实施方案中,物质的类似物是在其可取代位置中一个或更多个处被取代的物质。
在一些实施方案中,产物的类似物包含产物的结构核心。在一些实施方案中,生物合成产物是环状的,例如单环、二环或多环的,并且产物的结构核心是或包含单环、二环或多环环系。在一些实施方案中,产物是或包含多肽,并且结构核心是多肽的骨架。在一些实施方案中,产物是或包含聚酮化合物,并且结构核心是聚酮化合物的骨架。
在一些实施方案中,类似物是经取代的生物合成产物。在一些实施方案中,类似物是或包含被如本文中所述的一个或更多个取代基取代的结构核心。
在一些实施方案中,本公开内容提供了所提供生物合成基因簇的生物合成产物或其类似物的组合物,其中ETaG存在于相对于该生物合成基因簇中至少一个基因的邻近区内。在一些实施方案中,所提供组合物是药物组合物。在一些实施方案中,所提供药物组合物包含:所提供生物合成基因簇的生物合成产物或其类似物的可药用盐,其中ETaG存在于相对于该生物合成基因簇中至少一个基因的邻近区内;以及可药用载体。
在一些实施方案中,如果一个事件或实体的存在、水平和/或形式与另一事件或实体的存在、水平和/或形式相关,则这两个事件或实体彼此相关。例如,如果特定实体(例如多肽、遗传特征、代谢物、微生物等)的存在、水平和/或形式与特定疾病、障碍或病症的发病率和/或易感性相关(例如,在相关人群中),则认为该特定实体与该疾病、障碍或病症相关。
在一些实施方案中,疾病是癌症。在一些实施方案中,疾病是感染性疾病。在一些实施方案中,疾病是心脏病。在一些实施方案中,疾病与脂质、蛋白质、人代谢物等的水平相关。
附图说明
图1:图1示出了在狐粪青霉IBT 29486(Penicillium vulpinum IBT 29486)中鉴定的布雷菲德菌素A(Brefeldin A)ETaG。所鉴定的示例性ETaG是Sec7鸟嘌呤-核苷酸-交换-因子超家族(pfam01369)。序列相似性是使用MUSCLE比对算法计算的Sec7结构域的相似性。
图2:图2示出了在土曲霉ATCC 20542(Aspergillus terreus ATCC 20542)中鉴定的洛伐他汀(Lovastatin)ETaG。所鉴定的示例性ETaG是羟甲基戊二酰-辅酶A还原酶(HMG-CoA;pfam00368)。序列相似性是使用MUSCLE比对算法计算的HMG-CoA结构域的相似性。
图3:图3示出了在构巢曲霉FGSCA4(Aspergillus nidulans FGSCA4)中鉴定的非鲁米特(Fellutamide)ETaG。所鉴定的示例性ETaG是蛋白酶体20S β-亚基(pfam00227)。序列相似性是使用MUSCLE比对算法计算的20S β-亚基的相似性。
图4:图4示出了在膨大弯颈霉NRRL 8044(Tolypocladium inflatum NRRL 8044)中鉴定的环孢素ETaG。所鉴定的示例性ETaG是亲环蛋白型肽基-脯氨酰基顺反异构酶(pfam00160)。序列相似性是使用MUSCLE比对算法计算的亲环蛋白结构域的相似性。
图5:图5示出了在疏棉状嗜热丝孢菌ATCC 200065(Thermomyces lanuginosusATCC 200065)(公共的)中鉴定的Ras ETaG。所鉴定的示例性ETaG来自Ras家族(pfam00071)。序列相似性是使用MUSCLE比对算法计算的Ras结构域的相似性。ETaG示出在比例尺下方。
图6:图6示出了在Talaromyces leycettanus菌株CBS 398.68中鉴定的Ras ETaG。所鉴定的示例性ETaG来自Ras家族(pfam00071)。序列相似性是使用MUSCLE比对算法计算的Ras结构域的相似性。ETaG示出在比例尺下方。
图7:图7示出了在Sistotremastrum niveocremeum HHB9708或在Sistotremastrum suecicum HHB10207(国家林业服务(National Forestry Service))中鉴定的Ras ETaG。所鉴定的示例性ETaG来自Ras家族(pfam00071)。序列相似性是使用MUSCLE比对算法计算的Ras结构域的相似性。ETaG示出在比例尺下方。
图8:图8示出了在双孢蘑菇贝纳特变种JB137-S8(Agaricus bisporusvar.burnettii JB137-S8)(真菌基因组库存中心(Fungal Genome Stock Center))中鉴定的Ras ETaG。所鉴定的示例性ETaG来自Ras家族(pfam00071)。序列相似性是使用MUSCLE比对算法计算的Ras结构域的相似性。ETaG示出在比例尺下方。
图9:图9示出了在冈山灰盖鬼伞7#130(Coprinopsis cinerea okayama 7#130)(真菌基因组库存中心)中鉴定的Ras ETaG。所鉴定的示例性ETaG来自Ras家族(pfam00071)。序列相似性是使用MUSCLE比对算法计算的Ras结构域的相似性。ETaG示出在比例尺下方。
图10:图10示出了在希金斯炭疽菌IMI 349063(Colletotrichum higginsianumIMI349063)(CABI)中鉴定的Ras ETaG。所鉴定的示例性ETaG来自Ras家族(pfam00071)。序列相似性是使用MUSCLE比对算法计算的Ras结构域的相似性。ETaG示出在比例尺下方。
图11:图11示出了在Gyalolechia flavorubescens KoLRI002931中鉴定的RasETaG。所鉴定的示例性ETaG来自Ras家族(pfam00071)。序列相似性是使用MUSCLE比对算法计算的Ras结构域的相似性。ETaG示出在比例尺下方。
图12:图12示出了在玉蜀黍平脐蠕孢ATCC 48331(Bipolaris maydis ATCC48331)中鉴定的Ras ETaG。所鉴定的示例性ETaG来自Ras家族(pfam00071)。序列相似性是使用MUSCLE比对算法计算的Ras结构域的相似性。ETaG示出在比例尺下方。
图13:图13示出了人Ras基因与某些所鉴定Ras ETaG的比对。如所示出的,人Ras基因与所示的ETaG在KRAS核苷酸结合残基的许多位置共有相同的氨基酸残基。
图14:图14示出了人Ras基因与某些所鉴定Ras ETaG的比对。如所示出的,人Ras基因与所示的ETaG于在BRAF的4A内的KRAS残基的许多位置共有相同的氨基酸残基。
图17:图17示出了其中ETaG被索引/标记(深色)的示例性序列。
图18:图18示出了在狐粪青霉IBT 29486中具有Sec7同源物的生物合成基因簇。
图19:图19示出了Sec7的序列比对。(A)示例性布雷菲德菌素A相互作用残基。(B)示例性序列比对。
图20:图20示出了例如来自疏棉状嗜热丝孢菌ATCC 200065、Aspergillusrambelli和赭曲霉(Aspergillus ochraceoroseus)的与Ras相关的示例性生物合成基因簇。所示的Ras同源物以黑色标示。
图21:图21示出了例如来自双孢蘑菇贝纳特变种JB137-S8、双孢蘑菇H97(Agaricus bisporus H97)、冈山灰盖鬼伞、亚砖红垂暮菇FD-334(Hypholomasublateritum FD-334)的与Ras相关的示例性生物合成基因簇。所示的Ras同源物以黑色标示。
图22:图22示出了例如来自Sistotremastrum niveocremeum HHB9708和Sistotremastrum suecicum HHB10207的与Ras相关的示例性生物合成基因簇。所示的Ras同源物以黑色标示。
图23:图23示出了例如来自Talaromyces leycettanus菌株CBS 398.68的与Ras相关的示例性生物合成基因簇。所示的Ras同源物以黑色标示。
图24:图24示出了例如来自坚脆嗜热子囊菌(Thermoascus crustaceus)的与Ras相关的示例性生物合成基因簇。所示的Ras同源物以黑色标示。
图25:图25示出了例如来自玉蜀黍平脐蠕孢ATCC 48331的与Ras相关的示例性生物合成基因簇。所示的Ras同源物以黑色标示。
图26:图26示出了例如来自希金斯炭疽菌IMI 349063的与Ras相关的示例性生物合成基因簇(CABI)。所示的Ras同源物以黑色标示。
图27:图27示出了例如来自Gyalolechia flavorubescens的与Ras相关的示例性生物合成基因簇。所示的Ras同源物以黑色标示。
图28:图28示出了例如来自产黄青霉威斯康星54-1255(Penicilliumchrysogenum Wisconsin 54-1255)和松针褐斑病菌CBS 871.95(Lecanosticta aciculaCBS 871.95)的与RasGEF相关的示例性生物合成基因簇。所示的RasGEF同源物以黑色标示。
图29:图29示出了例如来自稻大角间座壳70-15(Magnaporthe oryzae 70-15)的与RasGEF相关的示例性生物合成基因簇。所示的RasGEF同源物以黑色标示。
图30:图30示出了例如来自石膏样节皮菌CBS 118893(Arthroderma gypseum CBS118893)的与RasGEF相关的示例性生物合成基因簇。所示的RasGEF同源物以黑色标示。
图31:图31示出了例如来自Endocarpon pusillum菌株KoLRI No.LF000583的与RasGEF相关的示例性生物合成基因簇。所示的RasGEF同源物以黑色标示。
图32:图32示出了例如来自肝色牛舌菌ATCC 64428(Fistulina hepatica ATCC64428)的与RasGEF相关的示例性生物合成基因簇。所示的RasGEF同源物以黑色标示。
图33:图33示出了例如来自出芽短梗霉普鲁兰变种EXF-150(Aureobasidiumpullulans var.pullulans EXF-150)的与RasGEF相关的示例性生物合成基因簇。所示的RasGEF同源物以黑色标示。
图34:图34示出了例如来自分枝枝顶孢普鲁兰变种EXF-150(Acremoniumfurcatum var.pullulans EXF-150)的与RasGAP相关的示例性生物合成基因簇。所示的RasGAP同源物以黑色标示。
图35:图35示出了例如来自淡紫紫霉菌株TERIBC 1(Purpureocillium lilacinumstrain TERIBC 1)和镰孢霉JS1030(Fusarium sp.JS1030)的与RasGEF相关的示例性生物合成基因簇。所示的RasGEF同源物以黑色标示。
图36:图36示出了例如来自多主棒孢霉UM 591(Corynespora cassiicola UM591)和稻大角间座壳菌株SV9610的与RasGAP相关的示例性生物合成基因簇。所示的RasGAP同源物以黑色标示。
图37:图37示出了例如来自尖孢炭疽菌菌株1 KC05_01(Colletotrichumacutatum strain 1 KC05_01)的与RasGAP相关的示例性生物合成基因簇。所示的RasGAP同源物以黑色标示。
图38:图38示出了例如来自炭团菌E7406B(Hypoxylon sp.E7406B)和葡萄间座壳分离珠DA912(Diaporthe ampelina isolate DA912)的与RasGAP相关的示例性生物合成基因簇。所示的RasGAP同源物以黑色标示。
图39:图39示出了例如来自云杉蓝状菌菌株9-3(Talaromyces piceae strain 9-3)和虫生簇孢RCEF 264(Sporothrix insectorum RCEF 264)的与RasGAP相关的示例性生物合成基因簇。所示的RasGAP同源物以黑色标示。
具体实施方式
1.定义
如本文中所用,除非另外指出,否则将应用以下定义。出于本公开内容的目的,化学元素根据Periodic Table of the Elements,CAS version,Handbook of Chemistryand Physics,75th Ed来鉴定。另外,有机化学的一般原理描述于“Organic Chemistry”,Thomas Sorrell,University Science Books,Sausalito:1999,和“March’s AdvancedOrganic Chemistry”,5th Ed.,Ed.:Smith,M.B.and March,J.,John Wiley&Sons,NewYork:2001中。
脂族:本文中使用的“脂族”意指完全饱和或包含一个或更多个不饱和单元的直链(即,无支链的)或支链的、经取代或未经取代的烃链、或者完全饱和或包含一个或更多个不饱和单元的经取代或未经取代的单环、二环或多环烃环,或者其组合。除非另外指出,否则脂族基团包含1至100个脂族碳原子。在一些实施方案中,脂族基团包含1至20个脂族碳原子。在另一些实施方案中,脂族基团包含1至10个脂族碳原子。在另一些实施方案中,脂族基团包含1至9个脂族碳原子。在另一些实施方案中,脂族基团包含1至8个脂族碳原子。在另一些实施方案中,脂族基团包含1至7个脂族碳原子。在另一些实施方案中,脂族基团包含1至6个脂族碳原子。在又一些实施方案中,脂族基团包含1至5个脂族碳原子,并且在又一些实施方案中,脂族基团包含1、2、3或4个脂族碳原子。合适的脂族基团包括但不限于线性或支链的、经取代或未经取代的烷基、烯基、炔基,及其杂合物。
烷基:本文中使用的术语“烷基”以其在本领域中的普通含义给出,并且可包括饱和的脂族基团,包括直链烷基、支链烷基、环烷基(脂环族基团)、经烷基取代的环烷基以及经环烷基取代的烷基。在一些实施方案中,烷基具有1至100个碳原子。在某些实施方案中,直链或支链烷基在其骨架中具有约1至20个碳原子(例如,对于直链,C1-C20;对于支链,C2-C20),或者,约1至10个碳原子。在一些实施方案中,环烷基环在其环结构中具有约3至10个碳原子,其中这样的环为单环、二环或多环的,或者在环结构中具有约5、6或7个碳。在一些实施方案中,烷基可以是低级烷基,其中低级烷基包含1至4个碳原子(例如,对于直链低级烷基,C1-C4)。
芳基:单独或作为较大部分的一部分如“芳烷基”、“芳烷氧基”或“芳氧基烷基”中使用的术语“芳基”是指具有共计五至三十个环成员的单环、二环或多环环系,其中该体系中的至少一个环是芳香族的。在一些实施方案中,芳基是具有共计五至十四个环成员的单环、二环或多环环系,其中该体系中的至少一个环是芳香族的,并且其中该体系中的每个环包含3至7个环成员。在一些实施方案中,芳基为联芳基。术语“芳基”可与术语“芳环”互换使用。在本公开内容的某些实施方案中,“芳基”是指芳香族环系,其包括但不限于可具有一个或更多个取代基的苯基、联苯基、萘基、联萘基、蒽基,等等。在一些实施方案中,也包括在如本文中使用的术语“芳基”的范围内的是其中芳香环与一个或更多个非芳香环稠合的基团,例如茚满基、邻苯二甲酰亚胺基(phthalimidyl)、萘二甲酰亚胺基(naphthimidyl)、菲啶基或四氢萘基,等等,其中连接基团或连接点在芳环上。
环脂族:本文中使用的术语“环脂族”是指具有例如3至30个成员的饱和或部分不饱和的脂族单环、二环或多环环系,其中脂族环系任选地被取代。环脂族基团包括但不限于环丙基、环丁基、环戊基、环戊烯基、环己基、环己烯基、环庚基、环庚烯基、环辛基、环辛烯基、降冰片基(norbornyl)、金刚烷基(adamantyl)和环辛二烯基。在一些实施方案中,环烷基具有3至6个碳。术语“环脂族”还可包括与一个或更多个芳香环或非芳香环稠合的脂族环,例如十氢萘基或四氢萘基,其中连接基团或连接点在脂族环上。在一些实施方案中,碳环基团是二环的。在一些实施方案中,碳环基团是三环的。在一些实施方案中,碳环基团是多环的。在一些实施方案中,“环脂族”(或“碳环”或“环烷基”)是指完全饱和或包含一个或更多个不饱和单元但不是芳香族的单环C3-C6烃或C8-C10二环烃,或者完全饱和或包含一个或更多个不饱和单元但不是芳香族的C9-C16三环烃。
卤素:术语“卤素”意指F、Cl、Br或I。
杂脂族:术语“杂脂族”以其在本领域中的普通含义给出,并且是指其中一个或更多个碳原子被一个或更多个杂原子(例如,氧、氮、硫、硅、磷,等等)替代的如本文中所述的脂族基团。
杂烷基:术语“杂烷基”以其在本领域中的普通含义给出,并且是指其中一个或更多个碳原子被杂原子(例如,氧、氮、硫、硅、磷等)替代的如本文中所述的烷基。杂烷基的一些实例包括但不限于烷氧基、聚(乙二醇)-、烷基-取代的氨基、四氢呋喃基、哌啶基、吗啉基等。
杂芳基:单独或作为较大部分例如“杂芳烷基”或“杂芳烷氧基”的一部分使用的术语“杂芳基”和“杂芳-”是指具有例如共计5至30个环成员的单环、二环或多环环系,其中该体系中的至少一个环是芳香族的并且至少一个芳香环原子是杂原子。在一些实施方案中,杂原子是氮、氧或硫。在一些实施方案中,杂芳基是具有5至10个环原子(即,单环、二环或多环的),在一些实施方案中,5、6、9或10个环原子的基团。在一些实施方案中,杂芳基具有在环阵列中共有的6、10或14个π电子;并且除碳原子之外还具有1至5个杂原子。杂芳基包括但不限于噻吩基、呋喃基、吡咯基、咪唑基、吡唑基、三唑基、四唑基、唑基、异唑基、二唑基、噻唑基、异噻唑基、噻二唑基、吡啶基、哒嗪基、嘧啶基、吡嗪基、吲嗪基、嘌呤基、萘啶基和蝶啶基。在一些实施方案中,杂芳基是杂联芳基,例如联吡啶基等。本文中使用的术语“杂芳基”和“杂芳-”还包括其中杂芳香环与一个或更多个芳环、环脂族环或杂环基环稠合的基团,其中连接基团或连接点在杂芳香环上。一些非限制性实例包括吲哚基、异吲哚基、苯并噻吩基、苯并呋喃基、二苯并呋喃基、吲唑基、苯并咪唑基、苯并噻唑基、喹啉基、异喹啉基、噌啉基、酞嗪基、喹唑啉基、喹喔啉基、4H-喹啉基、咔唑基、吖啶基、吩嗪基、吩噻嗪基、吩嗪基、四氢喹啉基、四氢异喹啉基以及吡啶并[2,3-b]-1,4-嗪-3(4H)-酮。杂芳基可以是单环、二环或多环的。术语“杂芳基”可与术语“杂芳环”、“杂芳基基团”或“杂芳香族”互换使用,其中任何术语均包括任选经取代的环。术语“杂芳烷基”是指被杂芳基取代的烷基,其中烷基和杂芳基部分独立地任选被取代。
杂原子:术语“杂原子”意指不是碳或氢的原子。在一些实施方案中,杂原子是氧、硫、氮、磷、硼或硅(包括氮、硫、磷或硅的任何氧化形式;杂环的任何碱性氮或可取代氮的季铵化形式(例如,N(如在3,4-二氢-2H-吡咯基中)、NH(如在吡咯烷基中)或NR+(如在N-取代的吡咯烷基中));等)。在一些实施方案中,杂原子是硼、氮、氧、硅、硫或磷。在一些实施方案中,杂原子是氮、氧、硅、硫或磷。在一些实施方案中,杂原子是氮、氧、硫或磷。在一些实施方案中,杂原子是氮、氧或硫。
杂环基:本文中使用的术语“杂环”、“杂环基”、“杂环基团”和“杂环环”可互换使用,并且是指饱和或部分不饱和并且具有一个或更多个杂原子环原子的单环、二环或多环部分(例如3至30元)。在一些实施方案中,杂原子是硼、氮、氧、硅、硫或磷。在一些实施方案中,杂原子是氮、氧、硅、硫或磷。在一些实施方案中,杂原子是氮、氧、硫或磷。在一些实施方案中,杂原子是氮、氧或硫。在一些实施方案中,杂环基是饱和或部分不饱和并且除碳原子之外还具有一个或更多个,优选1至4个如上限定的杂原子的稳定的5至7元单环或7至10元二环杂环部分。当用于提及杂环的环原子时,术语“氮”包括经取代的氮。作为一个实例,在具有选自氧、硫或氮的0至3个杂原子的饱和或部分不饱和环中,氮可以是N(如在3,4-二氢-2H-吡咯基中)、NH(如在吡咯烷基中)或+NR(如在N-取代的吡咯烷基中)。杂环可在产生稳定结构的任何杂原子或碳原子处与其侧基连接,并且任何环原子均可任选地被取代。这样的饱和或部分不饱和杂环基团的一些实例包括但不限于四氢呋喃基、四氢噻吩基、吡咯烷基、哌啶基、吡咯啉基、四氢喹啉基、四氢异喹啉基、十氢喹啉基、唑烷基、哌嗪基、二烷基、二氧戊环基、二氮杂基、氧氮杂基、噻氮基(thiazepinyl)、吗啉基和奎宁环基。术语“杂环”、“杂环基”、“杂环基环”、“杂环族基团”、“杂环部分”和“杂环基团”在本文中可互换使用,并且还包括其中杂环基环与一个或更多个芳环、杂芳环或环脂族环稠合的基团,例如吲哚啉基、3H-吲哚基、色满基、菲啶基或四氢喹啉基,其中连接基团或连接点在杂脂族环上。杂环基可以是单环、二环或多环的。术语“杂环基烷基”是指被杂环基取代的烷基,其中烷基和杂环基部分独立地任选被取代。
部分不饱和的:本文中使用的术语“部分不饱和的”是指包含至少一个双键或三键的部分。术语“部分不饱和的”旨在涵盖具有多个不饱和位点的基团,但并不旨在包括芳基或杂芳基部分。
药物组合物:本文中使用的术语“药物组合物”是指与一种或更多种可药用载体一起配制的活性剂。在一些实施方案中,活性剂以适于在治疗方案中施用的单位剂量量存在,所述治疗方案在施用于相关群体时显示出统计学显著的实现预定治疗作用的概率。在一些实施方案中,可将药物组合物特别地配制为以固体或液体形式施用,包括适于以下的那些:经口施用,例如,顿服药(drench)(水性或非水性溶液剂或混悬剂),片剂,例如靶向口含、舌下和全身吸收的那些,丸剂,散剂,颗粒剂,施加于舌的糊剂;肠胃外施用,例如通过皮下、肌内、静脉内或硬膜外注射,如例如无菌溶液剂或混悬剂、或缓释制剂;表面施加,例如如乳膏剂、软膏剂或控释贴剂或喷雾剂,其施加至皮肤、肺或口腔;阴道内或直肠内,例如如阴道栓剂(pessary)、乳膏剂或泡沫剂(foam);舌下;眼部;经皮;或经鼻、经肺和到其他黏膜表面。
可药用的:本文中使用的词组“可药用的”是指在合理医学判断的范围内适用于与人和动物的组织接触而无过度毒性、刺激性、变应性应答或其他问题或并发症、与合理的益处/风险比相称的那些化合物、材料、组合物和/或剂型。
可药用载体:本文中使用的术语“可药用载体”意指涉及将主题化合物从身体的一个器官或部位运送或转运至身体的另一器官或部位的可药用的材料、组合物或载剂,例如液体或固体填充剂、稀释剂、赋形剂或溶剂包封材料。在与制剂的其他成分相容并且对患者无害的意义上,每种载体必须是“可接受的”。可用作可药用载体的材料的一些实例包括:糖,例如乳糖、葡萄糖和蔗糖;淀粉,例如玉米淀粉和马铃薯淀粉;纤维素及其衍生物,例如羧甲基纤维素钠、乙基纤维素和乙酸纤维素;粉化黄芪胶;麦芽;明胶;滑石;赋形剂,例如可可脂和栓剂用蜡(suppository wax);油,例如花生油、棉籽油、红花籽油、芝麻油、橄榄油、玉米油和大豆油;二醇,例如丙二醇;多元醇,例如甘油、山梨糖醇、甘露醇和聚乙二醇;酯,例如油酸乙酯和月桂酸乙酯;琼脂;缓冲剂,例如氢氧化镁和氢氧化铝;藻酸;无热原水;等张盐水;林格液(Ringer’s solution);乙醇;pH缓冲溶液;聚酯、聚碳酸酯和/或聚酐;以及药物制剂中使用的其他无毒的相容性物质。
可药用盐:本文中使用的术语“可药用盐”是指适用于药学背景的这样的化合物的盐,即在合理医学判断的范围内适用于与人和低等动物的组织接触而无过度毒性、刺激性、变应性应答等且与合理的益处/风险比相称的盐。
可药用盐是公知的。例如,S.M.Berge,et al.在J.Pharmaceutical Sciences,66:1-19(1977)中详细描述了可药用盐。在一些实施方案中,可药用盐包括但不限于无毒的酸加成盐,其是与无机酸例如盐酸、氢溴酸、磷酸、硫酸和高氯酸或者与有机酸例如乙酸、马来酸、酒石酸、柠檬酸、琥珀酸或丙二酸或者通过使用其他已知方法例如离子交换形成的氨基的盐。在一些实施方案中,可药用盐包括但不限于己二酸盐、藻酸盐、抗坏血酸盐、天冬氨酸盐、苯磺酸盐、苯甲酸盐、硫酸氢盐、硼酸盐、丁酸盐、樟脑酸盐(camphorate)、樟脑磺酸盐、柠檬酸盐、环戊烷丙酸盐、二葡糖酸盐、十二烷基硫酸盐、乙磺酸盐、甲酸盐、延胡索酸盐、葡庚糖酸盐、甘油磷酸盐、葡糖酸盐、半硫酸盐、庚酸盐、己酸盐、氢碘酸盐、2-羟基-乙磺酸盐、乳糖酸盐、乳酸盐、月桂酸盐、月桂基硫酸盐、苹果酸盐、马来酸盐、丙二酸盐、甲磺酸盐、2-萘磺酸盐、烟酸盐、硝酸盐、油酸盐、草酸盐、棕榈酸盐、扑酸盐、果胶酸盐(pectinate)、过硫酸盐、3-苯基丙酸盐、磷酸盐、苦味酸盐、新戊酸盐、丙酸盐、硬脂酸盐、琥珀酸盐、硫酸盐、酒石酸盐、硫氰酸盐、对甲苯磺酸盐、十一酸盐、戊酸盐等。在一些实施方案中,可药用盐包括但不限于无毒的碱加成盐,例如由所提供化合物的酸性基团(例如,寡核苷酸的磷酸酯键基团、寡核苷酸的硫代磷酸酯键基团等)与碱形成的那些。代表性碱金属盐或碱土金属盐包括钠、锂、钾、钙、镁等的盐。在一些实施方案中,可药用盐是铵盐(例如,-N(R)3 +)。在一些实施方案中,可药用盐是钠盐。在一些实施方案中,可药用盐在适当时包括使用反离子例如卤离子、氢氧根、羧酸根、硫酸根、磷酸根、硝酸根、具有1至6个碳原子的烷基、磺酸根和芳基磺酸根形成的无毒的铵、季铵和胺阳离子。
保护基:本文中使用的词组“保护基”是指保护潜在反应性官能团免于不期望的化学转化的临时取代基。这样的保护基的一些实例分别包括羧酸的酯、醇的甲硅烷基醚,以及醛和酮的缩醛和缩酮。“Si保护基”是包含Si原子的保护基,例如Si-三烷基(例如,三甲基甲硅烷基、三丁基甲硅烷基、叔丁基二甲基甲硅烷基)、Si-三芳基、Si-烷基-二苯基(例如,叔丁基二苯基甲硅烷基)或Si-芳基-二烷基(例如,Si-苯基二烷基)。通常来说,Si保护基与氧原子连接。已经综述了保护基化学领域(Greene,T.W.;Wuts,P.G.M.Protective Groups mOrganic Synthesis,5th ed.;John Wiley and Sons:Hoboken,NJ,2014)。示例性保护基(和相关的受保护部分)在下文详细描述。
受保护的羟基是本领域中公知的,并且包括在Protecting Groups in OrganicSynthesis,T.W.Greene and P.G.M.Wuts,3rd edition,John Wiley&Sons,1999中详细描述的那些,其整体通过引用并入本文。适当保护的羟基的一些实例还包括但不限于酯、碳酸酯、磺酸酯、烯丙基醚、醚、甲硅烷基醚、烷基醚、芳基烷基醚以及烷氧基烷基醚。合适的酯的一些实例包括甲酸酯、乙酸酯、丙酸酯、戊酸酯、巴豆酸酯和苯甲酸酯。合适的酯的一些具体实例包括甲酸酯、甲酸苯甲酰酯、氯乙酸酯、三氟乙酸酯、甲氧基乙酸酯、三苯基甲氧基乙酸酯、对氯苯氧基乙酸酯、3-苯基丙酸酯、4-氧代戊酸酯、4,4-(亚乙基二硫代)戊酸酯、新戊酸酯(三甲基乙酸酯)、巴豆酸酯、4-甲氧基-巴豆酸酯、苯甲酸酯、对苄基苯甲酸酯、2,4,6-三甲基苯甲酸酯。合适的碳酸酯的一些实例包括9-芴基甲基碳酸酯、碳酸乙酯、2,2,2-三氯乙基碳酸酯、2-(三甲基甲硅烷基)乙基碳酸酯、2-(苯基磺酰基)乙基碳酸酯、碳酸乙烯酯、碳酸烯丙酯和对硝基苄基碳酸酯。合适的甲硅烷基醚的一些实例包括三甲基甲硅烷基醚、三乙基甲硅烷基醚、叔丁基二甲基甲硅烷基醚、叔丁基二苯基甲硅烷基醚、三异丙基甲硅烷基醚以及其他三烷基甲硅烷基醚。合适的烷基醚的一些实例包括甲基醚、苄基醚、对甲氧基苄基醚、3,4-二甲氧基苄基醚、三苯甲基醚、叔丁基醚和烯丙基醚、或者其衍生物。烷氧基烷基醚包括缩醛,例如甲氧基甲基醚、甲硫基甲基醚、(2-甲氧基乙氧基)甲基醚、苄氧基甲基醚、β-(三甲基甲硅烷基)乙氧基甲基醚和四氢吡喃-2-基醚。合适的芳基烷基醚的一些实例包括苄基醚、对甲氧基苄基(MPM)醚、3,4-二甲氧基苄基醚、邻硝基苄基醚、对硝基苄基醚、对卤代苄基醚、2,6-二氯苄基醚、对氰基苄基醚、2-吡啶甲基醚和4-吡啶甲基醚。
受保护的胺是本领域中公知的,并且包括在Greene(1999)中详细描述的那些。合适的单保护胺还包括但不限于芳烷基胺、氨基甲酸酯、烯丙基胺、酰胺,等等。合适的单保护氨基部分的一些实例包括叔丁基氧基羰基氨基(-NHBOC)、乙氧基羰基氨基、甲氧基羰基氨基、三氯乙氧基羰基氨基、烯丙氧基羰基氨基(-NHAlloc)、苄基氧羰基氨基(-NHCBZ)、烯丙基氨基、苄基氨基(-NHBn)、芴基甲基羰基(-NHFmoc)、甲酰氨基、乙酰氨基、氯乙酰氨基、二氯乙酰氨基、三氯乙酰氨基、苯乙酰氨基、三氟乙酰氨基、苯甲酰氨基、叔丁基二苯基甲硅烷基,等等。合适的双保护胺包括被两个独立地选自上述按照单保护胺描述的那些的取代基取代的胺,并且还包括环状酰亚胺,例如邻苯二甲酰亚胺、马来酰亚胺、琥珀酰亚胺等。合适的双保护胺还包括吡咯等、2,2,5,5-四甲基-[1,2,5]氮杂二硅杂环戊烷(2,2,5,5-tetramethyl-[1,2,5]azadisilolidine)等,以及叠氮化物。
受保护的醛是本领域中公知的,并且包括在Greene(1999)中详细描述的那些。合适的受保护醛还包括但不限于无环缩醛、环状缩醛、腙、亚胺,等等。这样的基团的一些实例包括二甲基缩醛、二乙基缩醛、二异丙基缩醛、二苄基缩醛、双(2-硝基苄基)缩醛、1,3-二烷、1,3-二氧戊环、缩氨基脲,及其衍生物。
受保护的羧酸是本领域中公知的,并且包括在Greene(1999)中详细描述的那些。合适的受保护羧酸还包括但不限于:任选经取代的C1-6脂族酯、任选经取代的芳基酯、甲硅烷基酯、活化酯、酰胺、酰肼,等等。这样的酯基的一些实例包括甲酯、乙酯、丙酯、异丙酯、丁酯、异丁酯、苄酯和苯酯,其中每个基团是任选经取代的。另外的合适的受保护羧酸包括唑啉和原酸酯。
受保护的硫醇是本领域中公知的,并且包括在Greene(1999)中详细描述的那些。合适的受保护硫醇还包括但不限于二硫化物、硫醚、甲硅烷基硫醚、硫酯、硫代碳酸酯和硫代氨基甲酸酯,等等。这样的基团的一些实例包括但不限于烷基硫醚、苄基硫醚和经取代的苄基硫醚、三苯基甲基硫醚以及三氯乙氧基羰基硫酯,等等。
取代:如本文中所述,本公开内容的化合物可包含任选经取代的和/或经取代的部分。通常来说,术语“经取代的”无论前面是否有术语“任选”意指指定部分的一个或更多个氢被合适的取代基替代。除非另外指出,否则“任选经取代的”基团可在该基团的每个可取代位置具有合适的取代基,并且当任何给定结构中的多于一个位置可被选自指定组的多于一个取代基取代时,该取代基可以在每个位置相同或不同。本公开内容预见的取代基的组合优选地是使得形成稳定或化学上可行的化合物的那些。本文中使用的术语“稳定的”是指以下化合物,其当经受允许其产生、检测以及在某些实施方案中允许其回收、纯化以及用于一种或更多种本文中公开的目的的条件时基本上不改变。在一些实施方案中,一些示例性取代基描述于下文。
合适的单价取代基是卤素;-(CH2)0-4Ro;-(CH2)0-4ORo;-O(CH2)0-4Ro;-O-(CH2)0-4C(O)ORo;-(CH2)0-4CH(ORo)2;可被Ro取代的-(CH2)0-4Ph;可被Ro取代的-(CH2)1-4O(CH2)0-1Ph;可被Ro取代的-CH=CHPh;可被Ro取代的-(CH2)0-4O(CH2)0-1-吡比啶基;-NO2;-CN;-N3;-(CH2)0- 4N(Ro)2;-(CH2)0-4N(Ro)C(O)Ro;-N(Ro)C(S)Ro;-(CH2)0-4N(Ro)C(O)N(Ro)2;-N(Ro)C(S)N(Ro)2;-(CH2)0-4N(Ro)C(O)ORo;-N(Ro)N(Ro)C(O)Ro;-N(Ro)N(Ro)C(O)N(Ro)2;-N(Ro)N(Ro)C(O)ORo;-(CH2)0-4C(O)Ro;-C(S)Ro;-(CH2)0-4C(O)ORo;-(CH2)0-4C(O)SRo;-(CH2)0-4C(O)OSi(Ro)3;-(CH2)0-4OC(O)Ro;-OC(O)(CH2)0-4SRo;-SC(S)SRo;-(CH2)0-4SC(O)Ro;-(CH2)0-4C(O)N(Ro)2;-C(S)N(Ro)2;-C(S)SRo;-SC(S)SRo;-(CH2)0-4OC(O)N(Ro)2;-C(O)N(ORo)Ro;-C(O)C(O)Ro;-C(O)CH2C(O)Ro;-C(NORo)Ro;-(CH2)0-4SSRo;-(CH2)0-4S(O)2Ro;-(CH2)0-4S(O)2ORo;-(CH2)0-4OS(O)2Ro;-S(O)2N(Ro)2;-(CH2)0-4S(O)Ro;-N(Ro)S(O)2N(Ro)2-N(Ro)S(O)2Ro;-N(ORo)Ro;-C(NH)N(Ro)2;-Si(Ro)3;-OSi(Ro)3;-P(Ro)2;-P(ORo)2;-OP(Ro)2;-OP(ORo)2;-N(Ro)P(Ro)2;-B(Ro)2;-OB(Ro)2;-P(O)(Ro)2;-OP(O)(Ro)2;-N(Ro)P(O)(Ro)2;-(C1-4直链或支链亚烷基)O-N(Ro)2;或-(C1-4直链或支链亚烷基)C(O)O-N(Ro)2;其中每个Ro可以如下限定进行取代,并且独立地是氢;C1-20脂族;具有1至5个独立地选自氮、氧、硫、硅和磷的杂原子的C1-20杂脂族;-CH2-(C6-14芳基);-O(CH2)0-1(C6-14芳基);-CH2-(5至14元杂芳环);具有0至5个独立地选自氮、氧、硫、硅和磷的杂原子的5至20元的单环、二环或多环的饱和、部分不饱和或芳基环,或者尽管有上述限定,两个独立出现的Ro与其间插原子合在一起形成具有0至5个独立地选自氮、氧、硫、硅和磷的杂原子的5至20元的单环、二环或多环的饱和、部分不饱和或芳基环,其可如下限定进行取代。
在Ro(或通过两个独立出现的Ro与其间插原子合在一起而形成的环)上的合适单价取代基独立地是卤素;-(CH2)0-2R·;-(卤代R·);-(CH2)0-2OH;-(CH2)0-2OR·;-(CH2)0-2CH(OR·)2;-O(卤代R·);-CN;-N3;-(CH2)0-2C(O)R·;-(CH2)0-2C(O)OH;-(CH2)0-2C(O)OR·;-(CH2)0-2SR·;-(CH2)0-2SH;-(CH2)0-2NH2;-(CH2)0-2NHR·;-(CH2)0-2NR· 2;-NO2;-SiR· 3;-OSiR· 3;-C(O)SR·;-(C1-4直链或支链亚烷基)C(O)OR·;或-SSR·,其中每个R·是未经取代的或者在前面有“卤代”的情况下仅被一个或更多个卤素取代,并且独立地选自C1-4脂族;-CH2Ph;-O(CH2)0-1Ph;或者具有0至4个独立地选自氮、氧和硫的杂原子的5至6元的饱和、部分不饱和或芳基环。在Ro的饱和碳原子上的合适二价取代基包括=O和=S。
合适的二价取代基为以下:=O;=S;=NNR* 2;=NNHC(O)R*;=NNHC(O)OR*;=NNHS(O)2R*;=NR*;=NOR*;-O(C(R* 2))2-3O-;或-S(C(R* 2))2-3S-,其中每个独立出现的R*选自氢;可如以下限定进行取代的C1-6脂族;或具有0至4个独立地选自氮、氧和硫的杂原子的未经取代的5至6元饱和、部分不饱和或芳基环。与“任选经取代的”基团的邻位可取代碳结合的合适二价取代基包括:-O(CR* 2)2-3O-,其中每个独立出现的R*选自氢;可如以下限定进行取代的C1-6脂族;或具有0至4个独立地选自氮、氧和硫的杂原子的未经取代的5至6元饱和、部分不饱和或芳基环。
在R*的脂族基团上的合适取代基是卤素;-R·;-(卤代R·);-OH;-OR·;-O(卤代R·);-CN;-C(O)OH;-C(O)OR·;-NH2;-NHR·;-NR· 2;或-NO2,其中每个R·是未经取代的或者在前面有“卤代”的情况下仅被一个或更多个卤素取代的,并且独立地是C1-4脂族;-CH2Ph;-O(CH2)0-1Ph;或具有0至4个独立地选自氮、氧和硫的杂原子的5至6元饱和、部分不饱和或芳基环。
在一些实施方案中,在可取代氮上的合适取代基是 或其中每个独立地是氢;可如下限定进行取代的C1-6脂族;未经取代的-OPh;或具有0至4个独立地选自氮、氧和硫的杂原子的未经取代的5至6元饱和、部分不饱和或芳基环,或者尽管有上述限定,两个独立出现的与其间插原子合在一起形成具有0至4个独立地选自氮、氧和硫的杂原子的未经取代的3至12元饱和、部分不饱和或芳基单环或二环。
在的脂族基团上的合适取代基独立地是卤素;-R·;-(卤代R·);-OH;-OR·;-O(卤代R·);-CN;-C(O)OH;-C(O)OR·;-NH2;-NHR·;-NR· 2;或-NO2,其中每个R·是未经取代的或者在前面有“卤代”的情况下仅被一个或更多个卤素取代,并且独立地是C1-4脂族;-CH2Ph;-O(CH2)0-1Ph;或具有0至4个独立地选自氮、氧和硫的杂原子的5至6元饱和、部分不饱和或芳基环。
不饱和的:本文中使用的术语“不饱和的”意指部分具有一个或更多个不饱和单元。
除非另外指出,否则包括所提供化合物的盐例如可药用的酸加成盐或碱加成盐、立体异构形式和互变异构形式。
2.某些实施方案的详细描述
本公开内容尤其涵盖了这样的认识:通过由真菌生物合成基因簇编码的酶产生的许多产物可用于开发针对人靶标以治疗多种疾病的治疗剂。本公开内容认识到使用真菌产物的一个挑战是鉴定其人靶标。在一些实施方案中,本公开内容提供了用于有效鉴定通过由真菌生物合成基因簇编码的酶产生的生物合成产物的人靶标的技术。在一些实施方案中,所提供的技术鉴定在生物合成基因簇中生物合成基因的邻近区中的嵌入靶基因(ETaG),并且任选地还通过将ETaG序列与人核酸序列、特别是表达的人核酸序列(包括编码蛋白质的人基因)进行比较来鉴定通过由生物合成基因簇编码的酶产生的生物合成产物的人靶标。如本领域技术人员容易理解的,来自生物合成基因簇的生物合成产物、ETaG和人靶标之间的联系一旦建立可用于多种方法中。例如,可从通过由生物合成基因簇编码的酶产生的生物合成产物开始,到在该生物合成基因簇中生物合成基因的邻近区内的ETaG,然后到与该ETaG同源的人靶标。一旦鉴定了人靶标,可对其进行优先排序(prioritize)(即使其先前被认为是不可成药的),并且使用本领域技术人员可用的许多方法使用生物合成产物开发人靶标的调节剂,包括任选地进一步优化生物合成产物,以用于医学用途,例如通过制备和测定产物的类似物。也可从具有治疗意义的人靶标开始,到与人靶标同源的ETaG,然后到包含生物合成基因的生物合成基因簇,相对于该生物合成基因的邻近区包含该ETaG。一旦鉴定了生物合成基因簇,就可对通过由该生物合成基因簇编码的酶产生的生物合成产物进行表征和测定以调节人靶标或其产物。根据本公开内容,可将生物合成产物用作先导物以使用本领域中的许多方法进行优化,以提供可用于许多医学目的例如治疗目的的药剂。
在无意于受任何理论限制的情况下,在一些实施方案中,本公开内容涵盖了这样的认识:来自真核生物的ETaG和/或由此编码的产物与例如其在原核生物例如细菌中的对应物(如果有的话)相比可与哺乳动物基因和/或由此编码的产物具有更高相似性;在一些实施方案中,真核生物ETaG可以在治疗上更相关。在一些实施方案中,鉴于真菌与哺乳动物在系统树中的亲缘亲近性,真菌中的ETaG可特别用于开发人治疗剂。
在一些实施方案中,本公开内容提供了用于鉴定和/或表征ETaG的技术,所述ETaG是非生物合成基因,这在于:其不一定涉及通过由生物合成基因簇编码的酶产生的产物的合成,所述生物合成基因簇包含该ETaG,或者相对于所述生物合成基因簇的基因、在一些实施方案中,生物合成基因的邻近区包含该ETaG(由生物合成基因簇编码的酶可在无该ETaG的情况下产生生物合成产物)。在一些实施方案中,通过由生物合成基因簇编码的酶产生的产物的合成不需要ETaG,所述生物合成基因簇包含该ETaG,或者相对于所述生物合成基因簇的基因、在一些实施方案中,生物合成基因的邻近区包含该ETaG(由生物合成基因簇编码的酶可在无该ETaG的情况下产生生物合成产物)。在一些实施方案中,ETaG不涉及通过由生物合成基因簇编码的酶产生的产物的合成,所述生物合成基因簇包含该ETaG,或者相对于所述生物合成基因簇的基因、在一些实施方案中,生物合成基因的邻近区包含该ETaG(由生物合成基因簇编码的酶可在无该ETaG的情况下产生生物合成产物)。在一些实施方案中,ETaG与人基因同源或包含与人基因同源的序列,例如,与人蛋白质或序列(例如功能单元和/或结构单元,例如结构域、功能性结构性特征(螺旋、折叠片等)等)共有至少50%、55%、60%、65%、70%、75%、80%、85%、90%或95%同源性。
在一些实施方案中,ETaG与生物合成基因簇中的至少一个生物合成基因共调节。在一些实施方案中,ETaG与生物合成基因簇共调节,这在于:ETaG的表达与由生物合成基因簇的酶编码的产物的产生相关。在一些实施方案中,ETaG提供自保护功能。在一些实施方案中,ETaG编码通过生物合成基因簇的酶产生的产物的转运蛋白。在一些实施方案中,ETaG编码可使通过生物合成基因簇的酶产生的产物解毒的产物,例如蛋白质。在一些实施方案中,ETaG编码蛋白质的抗性变体,所述蛋白质的活性由通过生物合成基因簇的酶产生的产物靶向。
在一些实施方案中,本公开内容提供了包括以下的方法:
查询核酸序列集合,所述核酸序列中的每一个存在于真菌菌株中并且包含生物合成基因簇;以及
在至少一个真菌核酸序列内鉴定嵌入靶基因(ETaG)序列,所述嵌入靶基因(ETaG)序列的特征在于,其:
不涉及通过由生物合成基因簇编码的酶产生的产物的合成;
在相对于生物合成基因簇中至少一个生物合成基因的邻近区内;并且
任选地与生物合成基因簇中的至少一个生物合成基因共调节。
在一些实施方案中,ETaG与哺乳动物核酸序列同源。在一些实施方案中,本公开内容提供了包括以下的方法:
查询核酸序列集合,所述核酸序列中的每一个存在于真菌菌株中并且包含生物合成基因簇;以及
在至少一个真菌核酸序列内鉴定嵌入靶基因(ETaG)序列,所述嵌入靶基因(ETaG)序列的特征在于,其:
不涉及通过由生物合成基因簇编码的酶产生的产物的合成;
在相对于生物合成基因簇中至少一个生物合成基因的邻近区内;
与表达的哺乳动物核酸序列同源;并且
任选地与生物合成基因簇中的至少一个生物合成基因共调节。
邻近区
在一些实施方案中,ETaG通常在相对于生物合成基因簇中至少一个基因的邻近区内。在一些实施方案中,ETaG在相对于生物合成基因簇中至少一个生物合成基因的邻近区内。在一些实施方案中,邻近区为在基因上游或下游的不超过1至100kb。在一些实施方案中,邻近区为在基因上游或下游的不超过1至50kb。在一些实施方案中,邻近区为在基因上游或下游的不超过1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80或90kb。在一些实施方案中,邻近区为在基因上游或下游的不超过1kb。在一些实施方案中,邻近区为在基因上游或下游的不超过5kb。在一些实施方案中,邻近区为在基因上游或下游的不超过10kb。在一些实施方案中,邻近区为在基因上游或下游的不超过15kb。在一些实施方案中,邻近区为在基因上游或下游的不超过20kb。在一些实施方案中,邻近区为在基因上游或下游的不超过25kb。在一些实施方案中,邻近区为在基因上游或下游的不超过30kb。在一些实施方案中,邻近区为在基因上游或下游的不超过35kb。在一些实施方案中,邻近区为在基因上游或下游的不超过40kb。在一些实施方案中,邻近区为在基因上游或下游的不超过45kb。在一些实施方案中,邻近区为在基因上游或下游的不超过50kb。
在一些实施方案中,ETaG在生物合成基因簇内。在一些实施方案中,ETaG不在由生物合成基因簇中第一基因和最后基因限定的区域内,而是在相对于生物合成基因簇中第一基因或最后基因的邻近区内。
同源性
在一些实施方案中,ETaG与表达的哺乳动物核酸序列同源。在一些实施方案中,哺乳动物核酸序列是表达的哺乳动物核酸序列。在一些实施方案中,哺乳动物核酸序列是哺乳动物基因。在一些实施方案中,哺乳动物核酸序列是表达的哺乳动物基因。在一些实施方案中,哺乳动物核酸是人核酸序列。在一些实施方案中,人核酸序列是表达的人核酸序列。在一些实施方案中,人核酸序列是人基因。在一些实施方案中,人核酸序列是表达的人基因。在一些实施方案中,人核酸序列是或其编码产物是具有治疗意义的现有靶标。在一些实施方案中,人核酸序列是或其编码产物是具有治疗意义的新靶标。在一些实施方案中,人核酸序列是或其编码产物是在本公开内容之前被认为不可成药的靶标。在一些实施方案中,人核酸序列是或其编码产物是在本公开内容之前被认为是不可通过小分子成药的靶标。在一些实施方案中,本公开内容提供了意想不到的发现:传统上认为不可成药的靶标可由小分子有效地调节或靶向,所述小分子是通过由生物合成基因簇编码的酶产生的生物合成产物或生物合成产物的类似物,所述生物合成基因簇包含生物合成基因,相对于所述生物合成基因的邻近区包含与靶标同源的ETaG(或其部分,或由此编码的产物和/或其部分)。
在一些实施方案中,本公开内容提供了包括以下的方法:
查询核酸序列集合,所述核酸序列中的每一个存在于真菌菌株中并且包含生物合成基因簇;以及
在至少一个真菌核酸序列内鉴定嵌入靶基因(ETaG)序列,所述嵌入靶基因(ETaG)序列的特征在于,其:
不涉及通过由生物合成基因簇编码的酶产生的产物的合成;
在相对于生物合成基因簇中至少一个生物合成基因的邻近区内;
与表达的人核酸序列同源;并且
任选地与生物合成基因簇中的至少一个生物合成基因共调节。
在一些实施方案中,ETaG与核酸序列共有核酸序列同源性。在一些实施方案中,ETaG序列与另一核酸序列(例如,表达的人核酸序列)同源,这在于:ETaG核酸序列或其一部分与另一核酸序列或其一部分在核酸碱基序列的水平上共有相似性。在一些实施方案中,ETaG的序列与另一核酸序列共有核酸碱基序列相似性。在一些实施方案中,ETaG的序列的一部分与另一核酸序列的一部分共有核酸碱基序列相似性。
在一些实施方案中,同源部分的长度是至少50、100、150、200、300、400、500、600、70、800、900或1000个碱基对。在一些实施方案中,长度是至少50个碱基对。在一些实施方案中,长度是至少100个碱基对。在一些实施方案中,长度是至少150个碱基对。在一些实施方案中,长度是至少200个碱基对。在一些实施方案中,长度是至少300个碱基对。在一些实施方案中,长度是至少400个碱基对。在一些实施方案中,长度是至少500个碱基对。
在一些实施方案中,同源部分编码氨基酸残基,所述氨基酸残基是所编码蛋白质的某些结构单元和/或功能单元的。例如,在一些实施方案中,同源部分可编码蛋白质结构域,其是所编码蛋白质的家族特征性的、具有酶促活性、负责与效应物相互作用,等等,如本公开内容中所述的。
用于评估核酸序列的相似性/同源性的方法是本领域中公知的,并且可根据本公开内容使用。
在一些实施方案中,ETaG与核酸序列在其编码的产物例如蛋白质中共有同源性。在一些实施方案中,ETaG与核酸序列是同源的,这在于:由ETaG编码的产物或其一部分与由该核酸序列编码的产物或其一部分共有相似性。在一些实施方案中,编码的产物是蛋白质。在一些实施方案中,由ETaG和核酸序列编码的产物在其全长上共有相似性。在一些实施方案中,由ETaG和核酸序列编码的产物在某些部分共有相似性。
在一些实施方案中,ETaG与核酸是同源的,这在于:由该ETaG或其一部分编码的蛋白质与由该核酸或其一部分编码的蛋白质共有相似性。由ETaG和核酸序列编码的蛋白质可在其全长或部分的水平上共有相似性。在一些实施方案中,同源部分中的所有氨基酸残基是连续的。在一些实施方案中,同源部分中的氨基酸残基不是全部连续的。
在一些实施方案中,蛋白质的一部分是蛋白质结构域。在一些实施方案中,蛋白质结构域形成蛋白质家族特征性的结构。在一些实施方案中,蛋白质结构域执行特征性功能。例如,在一些实施方案中,蛋白质结构域具有酶功能。在一些实施方案中,这样的功能是由ETaG编码的蛋白质与由同源核酸序列例如人基因编码的蛋白质共有的。在一些实施方案中,特征性功能是非酶的。在一些实施方案中,特征性功能是与另一些实体例如小分子、核酸、蛋白质等的相互作用。
在一些实施方案中,蛋白质的一部分是对于蛋白质功能重要的连续或不连续的氨基酸残基的集合。在一些实施方案中,功能是酶活性。在一些实施方案中,蛋白质的一部分是活性所需的残基的集合。在一些实施方案中,一部分是与底物、中间体、产物或辅因子相互作用的残基的集合。在一些实施方案中,一部分是与底物相互作用的残基的集合。在一些实施方案中,一部分是与中间体相互作用的残基的集合。在一些实施方案中,一部分是与产物相互作用的残基的集合。在一些实施方案中,一部分是与辅因子相互作用的残基的集合。
在一些实施方案中,功能是与另一实体的相互作用。在一些实施方案中,实体是小分子。在一些实施方案中,实体是脂质。在一些实施方案中,实体是碳水化合物。在一些实施方案中,实体是核酸。在一些实施方案中,实体是蛋白质。在一些实施方案中,一部分是与相互作用剂接触的氨基酸残基的集合。例如,图13示出了与Ras蛋白及其同源ETaG的核苷酸相互作用的部分(氨基酸集合),以及图14至16示出了涉及蛋白质-蛋白质相互作用的部分。
在一些实施方案中,氨基酸残基与相互作用实体的相互作用可通过氢键键合、静电力、范德瓦耳斯力、芳香族堆积等来评估。在一些实施方案中,相互作用可通过氨基酸残基距相互作用实体的距离(例如,如在某些情况下使用的)来评估。
在一些实施方案中,相似性在于:两个结构具有在1、2、3、4、5、6、7、8、9、10、15、20、30、40或50平方埃内的Cα骨架rmsd(均方根偏差(root mean square deviation))并且具有相同的整体折叠或核心结构域。在一些实施方案中,Cα骨架rmsd在内。
在一些实施方案中,蛋白质的一部分是或包含对于蛋白质效应物募集必不可少的结构元件。在一些实施方案中,这样的部分可基于由与ETaG同源的核酸序列(例如,与ETaG同源的编码蛋白质的人基因)编码的蛋白质的结构和/或活性数据来选择。
在一些实施方案中,蛋白质的一部分包含至少2至200、2至100、2至50、2至40、2至30、2至20、2至15、2至10、3至200、3至100、3至50、3至40、3至30、3至20、3至15、3至10、4至200、4至100、4至50、4至40、4至30、4至20、4至15、4至10、5至200、5至100、5至50、5至40、5至30、5至20、5至15或5至10个氨基酸残基。在一些实施方案中,蛋白质的一部分包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、40、50、60、70、80、90、100或150个氨基酸残基。在一些实施方案中,一部分包含至少2个氨基酸残基。在一些实施方案中,一部分包含至少3个氨基酸残基。在一些实施方案中,一部分包含至少4个氨基酸残基。在一些实施方案中,一部分包含至少5个氨基酸残基。在一些实施方案中,一部分包含至少6个氨基酸残基。在一些实施方案中,一部分包含至少7个氨基酸残基。在一些实施方案中,一部分包含至少8个氨基酸残基。在一些实施方案中,一部分包含至少9个氨基酸残基。在一些实施方案中,一部分包含至少10个氨基酸残基。在一些实施方案中,一部分包含至少15个氨基酸残基。在一些实施方案中,一部分包含至少20个氨基酸残基。在一些实施方案中,一部分包含至少25个氨基酸残基。在一些实施方案中,一部分包含至少30个氨基酸残基。
根据本公开内容,核酸序列和蛋白质序列的相似性可通过多种方法(包括本领域中已知的那些)来评估。例如,MUSCLE用于蛋白质序列。在一些实施方案中,相似性基于确切同一性,例如在给定位置的相同氨基酸残基来测量。在一些实施方案中,相似性基于一种或更多种共同特性,例如,具有一种或更多种相同或相似特性(例如,酸性、碱性、芳香族等)的氨基酸残基来测量。
在一些实施方案中,ETaG与核酸序列(例如,表达的人核酸序列)同源,这在于:ETaG与该核酸碱基序列之间的相似性不小于基于ETaG和该核酸序列的核酸序列或其部分,或者由ETaG和该核酸序列编码的蛋白质或其一部分的水平,如本文中所述的。在一些实施方案中,ETaG与核酸序列同源,这在于:ETaG与该核酸序列之间的相似性不小于基于ETaG和该核酸序列的核酸碱基序列或其部分的水平。在一些实施方案中,ETaG与核酸序列同源,这在于:ETaG与该核酸序列之间的相似性不小于基于由ETaG和该核酸序列编码的蛋白质或其一部分的水平。在一些实施方案中,水平为至少10%至99%。在一些实施方案中,水平为至少10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。在一些实施方案中,水平为至少10%。在一些实施方案中,水平为至少20%。在一些实施方案中,水平为至少30%。在一些实施方案中,水平为至少40%。在一些实施方案中,水平为至少50%。在一些实施方案中,水平为至少60%。在一些实施方案中,水平为至少70%。在一些实施方案中,水平为至少80%。在一些实施方案中,水平为至少90%。在一些实施方案中,水平为100%。在一些实施方案中,水平低于100%。在一些实施方案中,水平不超过90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。
在一些实施方案中,ETaG与核酸序列同源,这在于:由ETaG或其一部分编码的蛋白质具有与由该核酸序列编码的蛋白质的3维结构相似的3维结构。在一些实施方案中,相似性通过例如在1至100平方埃内,例如为5、10、20、30、40、50平方埃的Cα骨架rmsd(均方根偏差)来评估。在一些实施方案中,共有相似性的序列具有不超过10平方埃的Cα骨架rmsd,并且还具有相同的整体折叠或核心结构域。在一些实施方案中,结构相似性通过与另一实体例如小分子、核酸、蛋白质等的相互作用来评估。在一些实施方案中,结构相似性通过小分子结合来评估。在一些实施方案中,由嵌入靶基因或其一部分编码的蛋白质与由核酸序列编码的蛋白质具有相似的3维结构,这在于:与由嵌入靶基因或其一部分编码的蛋白质结合的小分子也与由该核酸序列或其一部分编码的蛋白质结合。在一些实施方案中,结合的Kd为不超过1至100(例如,为1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100)μM。
共调节
在一些实施方案中,ETaG与生物合成基因簇中的至少一个生物合成基因共调节,所述生物合成基因簇包含生物合成基因,相对于所述生物合成基因的邻近区包含该ETaG。在一些实施方案中,ETaG与生物合成基因簇共调节,所述生物合成基因簇包含生物合成基因,相对于所述生物合成基因的邻近区包含该ETaG。在一些实施方案中,ETaG与生物合成基因簇共调节,这在于:该ETaG的表达和/或由该ETaG编码的产物例如蛋白质的产生与通过由该生物合成基因簇编码的酶产生的生物合成产物的产生相关。在一些实施方案中,由ETaG编码的产物例如蛋白质的产生与通过由生物合成基因簇编码的酶的生物合成产物的产生在时间上重叠。在一些实施方案中,ETaG与生物合成基因簇共调节,这在于:当产生通过由生物合成基因簇编码的酶产生的生物合成产物时,ETaG的表达提高或开启。在一些实施方案中,ETaG与生物合成基因簇共调节,这在于:当产生通过由生物合成基因簇编码的酶产生的生物合成产物的水平提高时,ETaG的表达提高或开启。
在一些实施方案中,当产生通过由共调节的生物合成基因簇编码的酶产生的生物合成产物时,ETaG为其宿主生物体例如真菌提供了优势。例如,在一些实施方案中,由ETaG编码的蛋白质有助于将生物合成产物转运出产生该产物的细胞。在一些实施方案中,由ETaG编码的蛋白质使生物合成产物解毒,使得该生物合成产物不损害产生该生物合成产物的生物体,而是影响其他生物体的生长或存活。
在一些实施方案中,本公开内容提供了用于鉴定ETaG的多种方法。例如,在一些实施方案中,对通常来自不同真菌菌株的同源生物合成基因簇,例如其编码的酶产生相同生物合成产物(基于产物的预测(例如,基于序列的预测)和/或鉴定)的生物合成基因簇的集合进行比较。将存在于仅一个或数个生物合成基因簇(在生物合成基因簇内或在相对于生物合成基因簇中生物合成基因的邻近区内)但不存在于集合中大多数生物合成基因簇的非生物合成基因鉴定为ETaG候选物,并且任选地进一步将其与哺乳动物(例如人)核酸序列进行比较以鉴定同源哺乳动物核酸序列。在一些实施方案中,这样的方法可用于在基因组规模上,例如从许多(例如,数百、数千或甚至更多)基因组的序列中鉴定ETaG,如实施例中所示的。所鉴定的ETaG可基于其哺乳动物同源物,特别是人同源物的治疗重要性进行优先排序。在一些实施方案中,如附图中所示的,包含ETaG的生物体包含ETaG的一个或更多个同源基因。
在一些实施方案中,ETaG存在于集合中不超过1%、5%或10%的生物合成基因簇。在一些实施方案中,ETaG存在于集合中不超过1%、5%或10%的同源生物合成基因簇。在一些实施方案中,ETaG存在于集合中不超过1%、5%或10%的生物合成基因簇,所述生物合成基因簇编码产生相同生物合成产物的酶。在一些实施方案中,该百分比小于1%。在一些实施方案中,该百分比小于5%。在一些实施方案中,该百分比小于10%。
在一些实施方案中,本公开内容提供了特别有效且高效地鉴定编码具有治疗意义的靶标的人核酸的同源ETaG的方法,其通过查询所提供的核酸序列集合进行,所述核酸序列包含生物合成基因簇和/或在相对于该生物合成基因簇中生物合成基因的邻近区内的ETaG。
在一些实施方案中,本公开内容提供了如本文中所述的核酸序列集合。在一些实施方案中,本公开内容提供了核酸序列集合,所述核酸序列中的每一个存在于真菌菌株中并且包含生物合成基因簇。在一些实施方案中,本公开内容提供了核酸序列集合,所述核酸序列中的每一个存在于真菌菌株中并且包含ETaG。在一些实施方案中,本公开内容提供了核酸序列集合,所述核酸序列中的每一个存在于真菌菌株中并且包含生物合成基因簇和在相对于该生物合成基因簇中生物合成基因的邻近区内的ETaG。在一些实施方案中,包含生物合成基因簇的核酸序列不包含除相对于该生物合成基因簇中生物合成基因的邻近区和该生物合成基因簇的序列之外的序列。在一些实施方案中,本公开内容提供了包含所提供的核酸序列集合的数据库。
在一些实施方案中,所提供技术的生物合成基因簇包含编码可涉及共有至少一种共同化学属性的化合物的合成的酶的生物合成基因。在一些实施方案中,共同化学属性是环状核心结构。在一些实施方案中,共同化学属性是大环核心结构。在一些实施方案中,共同化学属性是共有的无环骨架。在一些实施方案中,共同化学属性是化合物全部属于某种类别,例如非核糖体肽(non-ribosomal peptide,NPRS)、萜、异戊二烯、生物碱等。在一些实施方案中,通过鉴定生物合成基因簇的单独ETaG,本公开内容可区分共有共同化学属性的化合物,即使其在结构上可以是相似的。
所提供的集合可具有不同大小和/或多样性。在一些实施方案中,期望具有来自更多物种的更多序列以提高ETaG和生物合成基因簇的数目。在一些实施方案中,集合包含至少100、200、300、400、500、1,000、1,500、2,000、3,000、5,000、10,000、20,000、50,000、100,000、500,000、1,000,000、1,500,000或2,000,000个包含生物合成基因簇的核酸序列。在一些实施方案中,集合包含至少100、200、300、400、500、1,000、1,500、2,000、3,000、5,000、10,000、50,000、100,000、500,000、1,000,000、1,500,000或2,000,000个生物合成基因簇。在一些实施方案中,集合包含至少100、200、300、400、500、1,000、1,500、2,000、3,000、5,000、10,000、50,000、100,000、500,000、1,000,000、1,500,000或2,000,000个与ETaG相关的生物合成基因簇(包含生物合成基因的生物合成基因簇,相对于所述生物合成基因的邻近区包含ETaG)。在一些实施方案中,集合包含至少100、200、300、400、500、1,000、1,500、2,000、3,000、5,000、10,000、50,000、100,000、500,000、1,000,000、1,500,000或2,000,000个ETaG。在一些实施方案中,所提供集合中的序列来自于来自不同物种例如不同真菌物种的至少100、200、300、400、500、1,000、1,500、2,000、3,000、5,000、10,000、20,000、50,000、100,000个基因组。
尤其地,所提供数据库和/或所提供集合如此构造以特别地提高以下的效率:例如,鉴定ETaG、鉴定与给定生物合成基因簇相关的ETaG、鉴定与给定ETAG相关的生物合成基因簇、鉴定与给定哺乳动物核酸序列(例如,人基因)同源的ETaG、鉴定与给定哺乳动物核酸序列(例如,人基因;任选地通过相关ETaG)相关的生物合成基因簇,鉴定与给定ETaG同源的哺乳动物核酸序列(例如人基因)、与给定生物合成基因簇(任选地通过相关ETaG)同源的哺乳动物核酸序列(例如人基因),鉴定与通过由生物合成基因簇编码的酶产生的给定产物(和/或其类似物)相关的哺乳动物核酸序列(例如,人基因)(任选地通过相关ETaG和生物合成基因簇)、鉴定通过由与给定哺乳动物核酸序列(例如,人基因;任选地通过相关生物合成基因簇和ETaG)相关的生物合成基因簇编码的酶产生的产物(和/或其类似物),等等。
例如,在一些实施方案中,在所提供的集合和/或数据库中的ETaG被索引/标记以进行检索。例如,图17(申请人指出所提供的集合和数据库可以包含数百、数千或数百万个序列)示出了来自所提供的集合和/或数据库中的示例性序列,其中ETaG被特别地索引/标记(深色)。尤其地,这样的结构特征可极大地提高例如查询效率:与其检索数十、数百或数千个基因组以查找与人目的基因同源的ETaG,可作为代替使用所提供技术以将检索集中在经索引/经标记的ETaG(例如,跳过非生物合成基因簇序列和/或非ETaG序列(例如,图17中的空箭头和在其之间的序列))以快速定位命中项(例如,图17中带圆圈的ETaG),从而节省了检索绝大多数无关基因组信息的时间和资源。
作为补充或替代,所提供的序列集合和数据库被构造成使得ETaG可独立地用以下信息进行注释:例如,其相关生物合成基因簇(ETaG的相关生物合成基因簇是包含生物合成基因的生物合成基因簇,该ETaG在相对于所述生物合成基因的邻近区内)、通过由相关生物合成基因簇编码的酶产生的产物及其类似物、其同源哺乳动物核酸序列(例如,人基因),等等。类似地,生物合成基因簇可独立地用以下信息进行注释:例如,其相关ETaG(生物合成基因簇的相关ETaG是在相对于该生物合成基因簇中生物合成基因的邻近区内的etg)、通过由该生物合成基因簇编码的酶产生的生物合成产物及其类似物、其相关ETaG的同源哺乳动物核酸序列及由其编码的产物,等等。通过使用索引和注释来构造序列数据,所提供的集合和数据库可提供许多优点。例如,在一些实施方案中,所提供的系统允许在保持数据大小和较低查询成本的同时利用可用的相关信息例如其相关的生物合成基因簇和人同源物快速访问ETaG,并且反之亦然。
在一些实施方案中,集合中至少10、20、50、100、200、500、1,000、2,000、2,500、5,000或10,000个、或者至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%或95%、或者所有的ETaG独立地进行注释。在一些实施方案中,集合中至少10、20、50、100、200、500、1,000、2,000、2,500、5,000或10,000个、或者至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%或95%、或者所有的ETaG独立地用其相关生物合成基因簇和同源哺乳动物核酸序列进行注释。在一些实施方案中,集合中至少10、20、50、100、200、500、1,000、2,000、2,500、5,000或10,000个、或者至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%或95%、或者所有的生物合成基因簇独立地进行注释。在一些实施方案中,集合中至少10、20、50、100、200、500、1,000、2,000、2,500、5,000或10,000个、或者至少5%、10%、20%、30%、40%、50%、60%、70%、80%、90%或95%、或者所有的生物合成基因簇独立地用其相关ETaG进行注释。
在一些实施方案中,所提供的序列集合和/或数据库包含在计算机可读介质中。在一些实施方案中,本公开内容提供了系统,其包含一个或更多个非暂时性机器可读存储介质,该存储介质存储代表所提供的序列集合和/或数据库的数据。适合于包含所提供数据的非暂时性机器可读存储介质包括所有形式的非易失性存储区,包括例如半导体存储区器件,例如,EPROM、EEPROM和闪存存储区器件;磁盘,例如内部硬盘或可移动磁盘;磁光盘;以及CD-ROM和DVD-ROM磁盘。尤其地,由于所提供的集合和数据库具有本文中所述的特定结构,所提供的系统可特别地有效。
在一些实施方案中,本公开内容提供了可执行所提供技术的计算机系统。在一些实施方案中,本公开内容提供了适于执行所提供方法的计算机系统。在一些实施方案中,本公开内容提供了适于查询所提供序列集合的计算机系统。在一些实施方案中,本公开内容提供了适于查询所提供数据库的计算机系统。在一些实施方案中,本公开内容提供了适于访问所提供数据库的计算机系统。
可用于实施全部或部分的所提供技术的计算机系统可包括多种形式的数字计算机。数字计算机的实例包括但不限于膝上型计算机、台式计算机、工作站、个人数字助理、服务器、刀锋服务器、大型计算机、智能电视和其他合适的计算机。移动设备可用于实施全部或部分的所提供技术。移动设备包括但不限于平板计算设备、个人数字助理、蜂窝电话、智能电话、数字照相机、数字眼镜和其他便携式计算设备。本文中所述的计算设备、其联系和关系以及其功能仅旨在作为实例,而并非旨在对本技术的实施进行限制。
本文中所述的全部或部分的技术及其多种修改形式可至少部分地通过由数据处理设备(例如,可编程处理器、计算机或多台计算机)执行或对其操作进行控制的计算机程序产品,例如,有形地在一个或更多个信息载体中,例如包含在一个或更多个有形的机器可读存储介质中的计算机程序来实施。
用于所提供技术的计算机程序可以以任何形式的编程语言(包括编译或解释语言)进行编写,并且其可以以任何形式(包括作为独立程序或作为模块、部分、子例程、或适用于计算环境的其他单元)进行部署。计算机程序可被部署为在一台计算机上或者于在一个站点或分布在多个站点上且通过网络互连的多台计算机上执行。
动作例如与实施程序和技术相关的动作可由执行一个或更多个计算机程序以执行所提供技术的一个或更多个可编程处理器来执行。可将全部或部分的过程作为专用逻辑电路例如FPGA(现场可编程门阵列)和/或ASIC(专用集成电路(application-specificintegrated circuit))进行实施。
适合于执行计算机程序的处理器包括例如通用和专用微处理器二者,以及任何种类的数字计算机的任意一个或更多个处理器。通常来说,处理器将从仅读存储区或随机访问存储区或二者接收指令和数据。计算机(包括服务器)的一些元件包括用于执行指令的一个或更多个处理器以及用于存储指令和数据的一个或更多个存储区器件。通常来说,计算机还将包括或有效耦合以从一个或更多个机器可读存储介质(例如用于存储数据的海量存储器件(例如,磁盘、磁光盘或光盘))接收数据或将数据传送到此,或二者皆可。适合于包含计算机程序指令和数据的非暂时性机器可读存储介质包括所有形式的非易失性存储区,包括例如半导体存储区器件,例如,EPROM、EEPROM和闪存存储区器件;磁盘,例如内部硬盘或可移动磁盘;磁光盘;以及CD-ROM和DVD-ROM磁盘。
每个计算设备,例如平板计算机,可包含用于存储数据和计算机程序的硬盘驱动器,以及用于执行计算机程序的处理器件(例如,微处理器)和存储器(例如,RAM)。每个计算设备可包含图像捕获装置,例如静态照相机或摄像机。图像捕获装置可以是内置的或简单地可被计算设备访问。
每个计算设备可包含图形系统,该图形系统包含显示屏。显示屏例如LCD或CRT(阴极射线管)向用户显示由计算设备的图形系统生成的图像。如所公知的,在计算机显示器(例如,监视器)上的显示将计算机显示器物理转换。例如,如果计算机显示器是基于LCD的,则可通过在对用户在视觉上明显的物理转换中施加偏压来更改液晶的方向。作为另一个实例,如果计算机显示器是CRT,则可通过在也是视觉上明显的物理转换中的电子冲击来改变荧光屏的状态。每个显示屏可以是触敏的,允许用户通过虚拟键盘将信息输入到显示屏上。在一些计算设备(例如台式计算机或智能电话)上,可设置物理QWERTY键盘和滚轮,用于将信息输入到显示屏上。每个计算设备以及在其上执行的计算机程序也可以配置成接受语音命令,并响应于这样的命令而执行功能。
尤其地,所提供的技术(方法、集合、数据库、系统等)建立了生物合成基因簇、通过由生物合成基因簇编码的酶产生的产物、ETaG、ETaG的同源哺乳动物核酸序列(例如,人基因)等之间的联系。因此,在一些实施方案中,所提供的技术可特别有力地用于鉴定和/或表征通过由生物合成基因簇编码的酶产生的产物的人靶标。所提供的技术也可特别有力地用于鉴定和开发用于人靶标的调节剂。例如,在一些实施方案中,为了开发用于人靶标的治疗剂,人靶标(或编码人靶标的核酸序列)的ETaG可使用所提供的技术以及其相关生物合成基因簇和/或通过生物合成基因簇的酶产生的生物合成产物的信息快速鉴定。可进一步表征相关生物合成基因簇的产物,并且如必要的话,可制备、表征和测定其类似物以开发具有改善特性的治疗剂。所提供的技术可特别用于在本公开内容之前靶向具有挑战性和/或被认为不可成药的人靶标。
在一些实施方案中,本公开内容提供了使用所鉴定的ETaG和由此编码的产物来评估化合物的方法。在一些实施方案中,本公开内容提供了包括以下的方法:
使至少一种受试化合物与由真菌核酸序列中嵌入靶基因编码的基因产物接触,所述嵌入靶基因的特征在于,其:
对于生物合成基因簇的产物的生物合成不需要或不涉及所述生物合成;
在相对于该簇中至少一个生物合成基因的邻近区内;
与哺乳动物核酸序列同源;并且
任选地与该簇中的至少一个生物合成基因共调节;以及
确定:
与在不存在受试化合物时相比,在存在受试化合物时,基因产物的水平或活性改变;或者
基因产物的水平或活性与在存在对该水平或活性具有已知作用的参考剂时观察到的水平或活性相当。
在一些实施方案中,本公开内容提供了用于鉴定和/或表征通过由生物合成基因簇编码的酶产生的产物或该产物的类似物的哺乳动物(例如,人)靶标的方法,其包括:
鉴定ETaG的人同源物,所述ETaG在相对于该生物合成基因簇中至少一个生物合成基因的邻近区内或在相对于第二生物合成基因簇中至少一个生物合成基因的邻近区内,所述第二生物合成基因簇编码产生通过由所述生物合成基因簇编码的酶产生的相同生物合成产物的酶;以及
任选地测定通过由所述生物合成基因簇编码的酶产生的产物或该产物的类似物对靶标的作用。
在一些实施方案中,本公开内容提供了使用由与ETaG同源的哺乳动物(例如,人)核酸序列编码的产物来评估化合物的方法。在一些实施方案中,本公开内容提供了包括以下的方法:
使至少一种受试化合物与由与嵌入靶基因同源的哺乳动物核酸序列编码的基因产物接触,所述嵌入靶基因的特征在于,所述嵌入靶基因:
对于生物合成基因簇的产物的生物合成不需要或不涉及所述生物合成;
在相对于该簇中至少一个生物合成基因的邻近区内;
与哺乳动物核酸序列同源;并且
任选地与该簇中的至少一个生物合成基因共调节;以及
确定:
与在不存在受试化合物时相比,在存在受试化合物时,基因产物的水平或活性改变;或者
基因产物的水平或活性与在存在对该水平或活性具有已知作用的参考剂时观察到的水平或活性相当。
在一些实施方案中,本公开内容提供了用于鉴定和/或表征通过由生物合成基因簇编码的酶产生的产物或该产物的类似物的哺乳动物(例如,人)靶标的方法,其包括:
鉴定ETaG的人同源物,所述ETaG在相对于该生物合成基因簇中至少一个生物合成基因的邻近区内,以及
任选地测定通过由该生物合成基因簇编码的酶产生的产物或该产物的类似物对靶标的作用。
在一些实施方案中,所提供的方法和系统可用于评估人靶标与化合物的相互作用。在一些实施方案中,本公开内容提供了用于评估人靶标与化合物的相互作用的方法,其包括:
将人靶标的核酸序列或编码人靶标的核酸序列与包含一个或更多个ETaG的核酸序列集合进行比较。
在一些实施方案中,通过生物合成基因簇的酶产生的化合物与由与和该生物合成基因簇相关的ETaG同源的哺乳动物(例如,人)核酸序列编码的靶标相互作用。
在一些实施方案中,所提供的技术可特别地用于设计和/或提供用于人靶标的调节剂,因为所提供的技术尤其提供了生物合成基因簇、ETaG和人靶基因之间的联系。
在一些实施方案中,本公开内容提供了用于鉴定和/或表征人靶标的调节剂的方法,其包括:
提供产物或其类似物,所述产物通过由生物合成基因簇编码的酶产生,其中在相对于该生物合成基因簇中至少一个生物合成基因的邻近区内存在ETaG,所述ETaG:
与人靶标或编码人靶标的核酸序列同源;并且
任选地与该簇中的至少一个生物合成基因共调节。
在一些实施方案中,人靶标是Ras蛋白。在一些实施方案中,Ras蛋白是HRas蛋白。在一些实施方案中,Ras蛋白是KRas蛋白。在一些实施方案中,Ras蛋白是NRas蛋白。在一些实施方案中,人靶标是包含RasGEF结构域的蛋白质。在一些实施方案中,蛋白质是KNDC1、PLCE1、RALGDS、RALGPS1、RALGPS2、RAPGEF1、RAPGEF2、RAPGEF3、RAPGEF4、RAPGEF5、RAPGEF6、RAPGEFL1、RASGEF1A、RASGEF1B、RASGEF1C、RASGRF1、RASGRF2、RASGRP1、RASGRP2、RASGRP3、RASGRP4、RGL1、RGL2、RGL3、RGL4/RGR、SOS1、SOS2或人鸟嘌呤核苷酸交换因子。在一些实施方案中,蛋白质是SOS1。在一些实施方案中,蛋白质是人鸟嘌呤核苷酸交换因子。在一些实施方案中,人靶标是包含RasGAP结构域的蛋白质。在一些实施方案中,蛋白质是DAB2IP、GAPVD1、IQGAP1、IQGAP2、IQGAP3、NF1、RASA1、RASA2、RASA3、RASA4、RASAL1、RASAL2或SYNGAP1。在一些实施方案中,蛋白质是蛋白质p120。在一些实施方案中,蛋白质是人鸟嘌呤核苷酸激活因子。
在一些实施方案中,本公开内容提供了用于鉴定和/或表征人Ras蛋白的调节剂的方法,其包括:
制备通过由生物合成基因簇编码的酶产生的化合物的类似物;
其中在相对于该生物合成基因簇中至少一个生物合成基因的邻近区内存在ETaG,所述ETaG:
与人Ras蛋白、RasGEF结构域或RasGAP结构域或者编码人Ras蛋白、RasGEF结构域或RasGAP结构域的核酸序列同源;并且
任选地与该簇中的至少一个生物合成基因共调节。
在一些实施方案中,包含RasGEF结构域的蛋白质调节人Ras蛋白的一种或更多种功能。在一些实施方案中,包含RasGAP结构域的蛋白质调节人Ras蛋白的一种或更多种功能。
在一些实施方案中,本公开内容提供了用于鉴定和/或表征人Ras蛋白的调节剂的方法,其包括:
制备通过由生物合成基因簇编码的酶产生的化合物的类似物;
其中在相对于该生物合成基因簇中至少一个生物合成基因的邻近区内存在ETaG,所述ETaG:
与人Ras蛋白或编码人Ras蛋白的核酸序列同源;并且
任选地与该簇中的至少一个生物合成基因共调节。
在一些实施方案中,本公开内容提供了用于鉴定和/或表征包含RasGEF结构域的蛋白质的调节剂的方法,其包括:
制备通过由生物合成基因簇编码的酶产生的化合物的类似物;
其中在相对于该生物合成基因簇中至少一个生物合成基因的邻近区内存在ETaG,所述ETaG:
与RasGEF结构域或编码RasGEF结构域的核酸序列同源;并且
任选地与该簇中的至少一个生物合成基因共调节。
在一些实施方案中,本公开内容提供了用于鉴定和/或表征包含RasGAP结构域的蛋白质的调节剂的方法,其包括:
制备通过由生物合成基因簇编码的酶产生的化合物的类似物;
其中在相对于该生物合成基因簇中至少一个生物合成基因的邻近区内存在ETaG,所述ETaG:
与RasGAP结构域或编码RasGAP结构域的核酸序列同源;并且
任选地与该簇中的至少一个生物合成基因共调节。
在一些实施方案中,生物合成基因簇是和与Ras蛋白同源的ETaG一起示出在附图例如图5至12、和20至27之一中的示例性生物合成基因簇,或包含其中所示一个或更多个生物合成基因的生物合成基因簇。在一些实施方案中,生物合成基因簇是和与Ras蛋白同源的ETaG一起示出在附图例如图5至12、和20至27之一中的示例性生物合成基因簇。在一些实施方案中,生物合成基因簇是和与RasGEF结构域同源的ETaG一起示出在附图例如图28至33、和35之一中的示例性生物合成基因簇,或包含其中所示一个或更多个生物合成基因的生物合成基因簇。在一些实施方案中,生物合成基因簇是和与RasGEF结构域同源的ETaG一起示出在附图例如图28至33、和35之一中的示例性生物合成基因簇。在一些实施方案中,生物合成基因簇是和与RasGEF结构域同源的ETaG一起示出在附图例如图34、和36至39之一中的示例性生物合成基因簇,或包含其中所示一个或更多个生物合成基因的生物合成基因簇。在一些实施方案中,生物合成基因簇是和与RasGEF结构域同源的ETaG一起示出在附图例如图34、和36至39之一中的示例性生物合成基因簇。示例性ETaG序列在本公开内容中提供,并且尤其可用于定位和鉴定生物合成基因簇、生物合成基因等。
在一些实施方案中,本公开内容提供了用于调节人靶标的方法,其包括:
提供产物或其类似物,所述产物通过由生物合成基因簇编码的酶产生,其中在相对于该生物合成基因簇中至少一个生物合成基因的邻近区内存在ETaG,所述ETaG:
与人靶标或编码人靶标的核酸序列同源;并且
任选地与该簇中的至少一个生物合成基因共调节。
在一些实施方案中,本公开内容提供了用于调节Ras蛋白的方法,其包括:
提供产物或其类似物,所述产物通过由图5至12、和20至27之一中生物合成基因簇编码的酶产生。
在一些实施方案中,本公开内容提供了用于调节RasGEF蛋白的方法,其包括:
提供产物或其类似物,所述产物通过由图28至33、和35之一中生物合成基因簇编码的酶产生。
在一些实施方案中,本公开内容提供了用于调节RasGAP蛋白的方法,其包括:
提供产物或其类似物,所述产物通过由图34、和36至39之一中生物合成基因簇编码的酶产生。
在一些实施方案中,ETaG通过所提供的方法鉴定。
在一些实施方案中,通过由生物合成基因簇编码的酶产生的产物是通过该生物合成基因簇产生的次级代谢物。
在一些实施方案中,产物的类似物包含产物的结构核心。在一些实施方案中,产物是环状的,例如单环、二环或多环的。在一些实施方案中,产物的结构核心是或包含单环、二环或多环环系。在一些实施方案中,产物的结构核心包含产物的二环或多环环系中的一个环。
在一些实施方案中,产物是线性的,并且结构核心是其骨架。在一些实施方案中,产物是或包含多肽,并且结构核心是多肽的骨架。在一些实施方案中,产物是或包含聚酮化合物,并且结构核心是聚酮化合物的骨架。
在一些实施方案中,类似物是被如本文中所述的一个或更多个合适的取代基取代的产物。在一些实施方案中,类似物是被如本文中所述的一个或更多个合适的取代基取代的结构核心。
尤其地,本公开内容提供了以下示例性实施方案:
1.方法,其包括以下步骤:
查询核酸序列集合,所述核酸序列中的每一个存在于真菌菌株中并且包含生物合成基因簇;以及
在至少一个真菌核酸序列内鉴定嵌入靶基因(ETaG)序列,所述嵌入靶基因(ETaG)序列的特征在于,其:
对于所述生物合成基因簇的产物的生物合成不需要或不涉及所述生物合成;
在相对于所述簇中至少一个基因的邻近区内;
与哺乳动物核酸序列同源;并且
任选地与所述簇中的至少一个生物合成基因共调节。
2.实施方案1所述的方法,其中所述ETaG序列在相对于所述簇中至少一个生物合成基因的邻近区内。
3.前述实施方案中任一项所述的方法,其中包含生物合成基因簇的核酸序列不包含除相对于所述生物合成基因簇中生物合成基因的邻近区的核酸序列和所述生物合成基因簇的核酸序列之外的序列。
4.前述实施方案中任一项所述的方法,其中邻近区为在所述簇中生物合成基因上游或下游的不超过1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100kb。
5.前述实施方案中任一项所述的方法,其中邻近区为在所述簇中生物合成基因上游或下游的不超过50kb。
6.前述实施方案中任一项所述的方法,其中邻近区为在所述簇中生物合成基因上游或下游的不超过40kb。
7.前述实施方案中任一项所述的方法,其中邻近区为在所述簇中生物合成基因上游或下游的不超过30kb。
8.前述实施方案中任一项所述的方法,其中邻近区为在所述簇中生物合成基因上游或下游的不超过20kb。
9.前述实施方案中任一项所述的方法,其中邻近区为在所述簇中生物合成基因上游或下游的不超过10kb。
10.前述实施方案中任一项所述的方法,其中邻近区是在生物合成基因簇中两个生物合成基因之间的区域。
11.前述实施方案中任一项所述的方法,其中所述哺乳动物核酸序列是表达的序列。
12.前述实施方案中任一项所述的方法,其中所述哺乳动物核酸序列是基因。
13.前述实施方案中任一项所述的方法,其中所述哺乳动物核酸序列是人核酸序列。
14.前述实施方案中任一项所述的方法,其中嵌入靶基因序列与表达的哺乳动物核酸序列同源,这在于:所述嵌入靶基因序列的碱基序列或其一部分与哺乳动物核酸序列的碱基序列或其一部分具有至少50%、60%、70%、80%或90%同一性。
15.实施方案14所述的方法,其中所述序列或其一部分的长度为至少50、100、150或200个碱基对。
16.实施方案1至13中任一项所述的方法,其中嵌入靶基因序列与表达的哺乳动物核酸序列同源,这在于:由嵌入靶基因编码的产物或其一部分与哺乳动物核酸序列的产物或其一部分同源。
17.实施方案16所述的方法,其中所述产物是蛋白质。
18.实施方案16所述的方法,其中由嵌入靶基因或其一部分编码的蛋白质与由哺乳动物核酸序列或其一部分编码的蛋白质具有至少50%、60%、70%、80%或90%相似性。
19.实施方案16所述的方法,其中由嵌入靶基因或其一部分编码的蛋白质具有与由哺乳动物核酸序列或其一部分编码的蛋白质的3维结构相似的3维结构。
20.实施方案19所述的方法,其中由嵌入靶基因编码的蛋白质的一部分与由哺乳动物核酸序列编码的蛋白质的一部分具有相似的3维结构。
21.实施方案19至20中任一项所述的方法,其中所述相似是所述结构具有在10平方埃内的Cα骨架rmsd(均方根偏差),并且具有相同的整体折叠或核心结构域。
22.实施方案19至20中任一项所述的方法,其中由嵌入靶基因或其一部分编码的蛋白质与由哺乳动物核酸序列编码的蛋白质具有相似的3维结构,这在于:与由嵌入靶基因或其一部分编码的蛋白质结合的小分子也与由哺乳动物核酸序列或其一部分编码的蛋白质结合。
23.实施方案22所述的方法,其中所述小分子与由所述嵌入靶基因和所述哺乳动物核酸序列或其一部分编码的蛋白质的结合的Kd为不超过100μM、50μM、10μM、5μM或1μM。
24.实施方案22至23中任一项所述的方法,其中所述小分子由真菌产生。
25.实施方案24所述的方法,其中所述小分子是无环的。
26.实施方案24所述的方法,其中所述小分子是环状的。
27.实施方案24至26中任一项所述的方法,其中所述小分子是由真菌产生的次级代谢物分子。
28.实施方案24至27中任一项所述的方法,其中所述小分子是非核糖体合成的。
29.实施方案24至28中任一项所述的方法,其中所述小分子是生物合成基因簇的生物合成产物。
30.实施方案16所述的方法,其中由嵌入靶基因编码的蛋白质的一部分与由表达的哺乳动物核酸序列编码的蛋白质的一部分具有至少50%、60%、70%、80%或90%相似性。
31.实施方案30所述的方法,其中所述蛋白质的所述一部分是蛋白质结构域。
32.实施方案30至31中任一项所述的方法,其中所述蛋白质的所述一部分是功能所必需的氨基酸残基集合。
33.实施方案32所述的方法,其中所述功能是酶功能。
34.实施方案33所述的方法,其中所述氨基酸残基集合接触底物。
35.实施方案33所述的方法,其中所述氨基酸残基集合接触中间体。
36.实施方案33所述的方法,其中所述氨基酸残基集合接触产物。
37.实施方案32所述的方法,其中所述功能是与另一实体的相互作用。
38.实施方案37所述的方法,其中所述实体是小分子。
39.实施方案37所述的方法,其中所述实体是脂质。
40.实施方案37所述的方法,其中所述实体是碳水化合物。
41.实施方案37所述的方法,其中所述实体是核酸。
42.实施方案37所述的方法,其中所述实体是蛋白质。
44.前述实施方案中任一项所述的方法,其中所述嵌入靶基因与所述簇中的至少一个基因共调节。
45.前述实施方案中任一项所述的方法,其中所述嵌入靶基因在所述集合中在来自不同真菌菌株并且包含同源或相同生物合成基因簇的所有真菌核酸序列中的80%、90%、95%或100%不存在。
46.前述实施方案中任一项所述的方法,其中所述集合包含至少100、1,000、5,000、10,000、50,000、100,000、500,000、1,000,000、1,500,000、2,000,000或2,500,000个独立的真菌核酸序列。
47.前述实施方案中任一项所述的方法,其中所述集合包含来自至少100、500、1,000、5,000、10,000、15,000、20,000、22,000、25,000或30,000个独立真菌菌株的核酸序列。
48.前述实施方案中任一项所述的方法,其中所述ETaG序列不是持家基因。
49.前述实施方案中任一项所述的方法,其中所述ETaG序列是或包含与在同一基因组中的第二核酸序列或其一部分具有同源性的序列。
50.前述实施方案中任一项所述的方法,其中所述ETaG序列是或包含编码与由同一基因组中第二核酸序列编码的产物或其一部分具有同源性的产物的序列。
51.实施方案49或50所述的方法,其中所述同源性为至少50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%。
52.实施方案49所述的方法,其中所述同源性为至少70%。
53.实施方案49所述的方法,其中所述同源性为至少80%。
54.实施方案49所述的方法,其中所述同源性为至少90%。
55.实施方案48至54中任一项所述的方法,其中所述第二核酸序列是或包含持家基因。
56.实施方案48至55中任一项所述的方法,其中所述ETaG序列编码提供针对所述生物合成基因簇的产物的抗性的产物,而所述第二核酸序列则不是。
57.实施方案56所述的方法,其中所述ETaG序列编码提供针对所述生物合成基因簇的小分子产物的抗性的蛋白质,而由所述第二核酸序列编码的蛋白质则不是。
58.前述实施方案中任一项所述的方法,其中所述集合内的核酸序列包含生物合成基因簇,所述生物合成基因簇的生物合成基因编码涉及共有至少一种共同化学属性的化合物的合成的酶。
59.前述实施方案中任一项所述的方法,其中所述核酸序列来自多个真菌菌株。
60.前述实施方案中任一项所述的方法,其中所述共同化学属性是或包含环状体系。
61.前述实施方案中任一项所述的方法,其中所述共同化学属性是或包含大环。
62.实施方案52至61中任一项所述的方法,其中所述共同化学属性是或包含无环骨架。
63.实施方案52至62中任一项所述的方法,其中共有至少一种共同化学属性的化合物是聚酮化合物。
64.实施方案52至62中任一项所述的方法,其中共有至少一种共同化学属性的化合物是非核糖体肽。
65.实施方案52至62中任一项所述的方法,其中共有至少一种共同化学属性的化合物是生物碱。
66.实施方案52至62中任一项所述的方法,其中共有至少一种共同化学属性的化合物是萜/异戊二烯。
67.方法,其包括以下步骤:
使至少一种受试化合物与由真菌核酸序列中嵌入靶基因编码的基因产物接触,所述嵌入靶基因(ETaG)的特征在于,其:
对于生物合成基因簇的产物的生物合成不需要或不涉及所述生物合成;
在相对于所述簇中至少一个生物合成基因的邻近区内;
与哺乳动物核酸序列同源;并且
任选地与所述簇中的至少一个生物合成基因共调节;以及
确定:
与在不存在所述受试化合物时相比,在存在所述受试化合物时,所述基因产物的水平或活性改变;或者
所述基因产物的水平或活性与在存在对该水平或活性具有已知作用的参考剂时观察到的水平或活性相当。
68.实施方案67所述的方法,其中所述ETaG是如实施方案1至66中任一项所述的ETaG。
69.实施方案67或68所述的方法,其中所述哺乳动物核酸序列是人Ras序列。
70.实施方案69所述的方法,其中所述哺乳动物核酸序列是KRas、HRas或NRas序列。
71.实施方案67或68所述的方法,其中所述哺乳动物核酸序列是编码RasGEF结构域的序列。
72.实施方案67或68所述的方法,其中所述哺乳动物核酸序列是编码RasGAP结构域的序列。
73.实施方案66至72中任一项所述的方法,其中所述ETaG是图1至39之一中的ETaG。
74.实施方案66至73中任一项所述的方法,其中所述生物合成基因簇是图1至39之一中的生物合成基因簇。
75.实施方案66至74中任一项所述的方法,其中所述受试化合物是所述生物合成基因簇的生物合成产物或其类似物。
76.方法,其包括以下步骤:
使至少一种受试化合物与由表达的哺乳动物核酸序列编码的基因产物接触,所述序列是与实施方案1至75中任一项所述的嵌入靶基因序列同源的所述表达的哺乳动物核酸序列。
77.实施方案76所述的方法,其中所述哺乳动物核酸序列是人Ras序列。
78.实施方案77所述的方法,其中所述哺乳动物核酸序列是KRas、HRas或NRas序列。
79.实施方案76或77所述的方法,其中所述哺乳动物核酸序列是编码RasGEF结构域的序列。
80.实施方案76或77所述的方法,其中所述哺乳动物核酸序列是编码RasGAP结构域的序列。
81.实施方案76至80中任一项所述的方法,其中所述ETaG是图1至39之一中的ETaG。
82.实施方案76至81中任一项所述的方法,其中所述生物合成基因簇是图1至39之一中的生物合成基因簇。
83.实施方案76至82中任一项所述的方法,其中所述受试化合物是所述生物合成基因簇的生物合成产物或其类似物。
84.方法,其包括:
鉴定ETaG的人同源物,所述ETaG在相对于生物合成基因簇中至少一个生物合成基因的邻近区内;以及
任选地测定通过由所述生物合成基因簇编码的酶产生的产物或所述产物的类似物对所述人同源物的作用。
85.实施方案77所述的方法,其中所述ETaG是如实施方案1至66中任一项所述的ETaG。
86.用于鉴定和/或表征人靶标的调节剂的方法,其包括:
提供产物或其类似物,所述产物通过由生物合成基因簇编码的酶产生,其中在相对于所述生物合成基因簇中至少一个基因的邻近区内存在ETaG,所述ETaG:
与所述人靶标或编码所述人靶标的核酸序列同源;并且
任选地与所述簇中的至少一个生物合成基因共调节。
87.实施方案86所述的方法,其中所述ETaG是如实施方案1至83中任一项所述的ETaG。
88.实施方案86所述的方法,其中所述人靶标是Ras蛋白。
89.实施方案88所述的方法,其中所述人靶标是KRas、HRas或NRas。
90.实施方案86所述的方法,其中所述人靶标包含RasGEF结构域。
91.实施方案86所述的方法,其中所述人靶标包含RasGAP结构域。
92.实施方案86至91中任一项所述的方法,其中所述ETaG是图1至39之一中的ETaG。
93.实施方案86至92中任一项所述的方法,其中所述生物合成基因簇是图1至39之一中的生物合成基因簇。
94.用于调节人靶标的方法,其包括:
提供产物或其类似物,所述产物通过由生物合成基因簇编码的酶产生,其中在相对于所述生物合成基因簇中至少一个生物合成基因的邻近区内存在ETaG,所述ETaG:
与所述人靶标或编码所述人靶标的核酸序列同源;并且
任选地与所述簇中的至少一个生物合成基因共调节。
95.实施方案94所述的方法,其中所述人靶标是Ras蛋白。
96.实施方案94所述的方法,其中所述人靶标是KRas、HRas或NRas。
97.实施方案94所述的方法,其中所述人靶标包含RasGEF结构域。
98.实施方案94所述的方法,其中所述人靶标包含RasGAP结构域。
99.实施方案94至98中任一项所述的方法,其中所述ETaG是图1至39之一中的ETaG。
100.实施方案94至99中任一项所述的方法,其中所述生物合成基因簇是图1至39之一中的生物合成基因簇。
101.实施方案94所述的方法,其中所述ETaG是如实施方案1至93中任一项所述的ETaG。
102.数据库,其包含:
核酸序列集合,所述核酸序列中的每一个存在于真菌菌株中并且包含生物合成基因簇;
其中所述核酸序列集合包含在计算机可读介质中。
103.实施方案102所述的数据库,其中实施方案1至101中任一项所述的一个或更多个嵌入靶基因被索引。
104.系统,其包含:
一个或更多个非暂时性机器可读存储介质,其存储代表核酸序列集合的数据,所述核酸序列中的每一个存在于真菌菌株中并且包含生物合成基因簇。
105.系统,其包含:
一个或更多个非暂时性机器可读存储介质,其存储代表核酸序列集合的数据,所述核酸序列中的每一个是或包含ETaG序列。
106.实施方案105所述的系统,其中实施方案1至101中任一项所述的一个或更多个嵌入靶基因被索引。
107.计算机系统,其适于执行实施方案1至101中任一项所述的方法。
108.计算机系统,其适于访问实施方案95至103中任一项所述的数据库。
实施例
所提供技术的一些非限制性实例在下文进行描述。
实施例1:示例性数据库的构建及其示例性用途
使用例如antiSMASH处理约2,000个报道的真菌基因组以鉴定潜在的生物合成基因簇,并将鉴定的约70,000个生物合成基因簇添加到数据库中。使用目的人靶标以查询初始数据库。例如,使用人Sec7的蛋白质序列针对初始文库进行BLAST检索以鉴定ETaG。作为替代或补充,生物合成基因簇可在其之间进行比较。例如,在一个过程中,将存在于一个或一些生物合成基因簇(在相对于所述生物合成基因簇中至少一个生物合成基因的邻近区内)但是不存在于相同生物合成产物的大多数其他同源生物合成基因簇的非生物合成基因鉴定为潜在的ETaG,并且通过在核酸水平和/或优选地在蛋白质水平上分析它们是否具有同源哺乳动物核酸序列(例如,人基因)来进一步确定。可对所鉴定的ETaG进行索引/标记和注释。可通过核苷酸序列(例如,BLASTN;tBLASTx)或蛋白质序列(例如,tBLASTn)检索数据库。
在一些实施方案中,来自人靶标的BLAST查询的结果以序列同源性强度的顺序列出,指示数据库内所有推定的命中项。然后检查所有命中生物合成基因簇的DNA序列以验证靶蛋白的一个或更多个开放阅读框(基因)同源物是否在生物合成基因簇的预测范围内。
在一些实施方案中,组合并整理每个生物合成簇的GenBank格式化序列文件(*.gbk),通过预测算法(例如,包含antiSMASH的那些)和/或方法从其中获得ETaG蛋白序列。开放阅读框的蛋白质家族(pfam)功能可通过例如antiSMASH来预测,并且可确定每个所鉴定的ETaG与通过antiSMASH预测的其最接近的生物合成酶之间的核苷酸距离。在一些实施方案中,预测的ETaG越接近生物合成酶,该开放阅读框编码真正ETaG的可能性越高。
申请人已经成功地鉴定了多个具有相关ETaG的生物合成基因簇,包括数个包含真正ETaG的生物合成基因簇(针对环孢素、非鲁米特、洛伐他汀、霉酚酸和布雷菲德菌素的生物合成基因簇)。
在一些实施方案中,本公开内容涵盖了这样的认识:ETaG可用作推定人靶蛋白的功能同源物(直向同源物)。在一些实施方案中,将推定ETaG命中项的蛋白质序列与人靶标直向同源物的序列进行比较。例如,在寻找人蛋白A的ETaG的项目中,发现了n个包含推定蛋白A同源物的生物合成基因簇,并且将所有n个预测的ETaG蛋白与人蛋白A进行比对。在一些实施方案中,在比对分析中仅使用在限定ETaG/靶标的pfam边界的特定催化结构域或结构性结构域(例如,基于预测性亚家族结构域架构)内的氨基酸。通过将所有ETaG与人靶蛋白进行比对,将ETaG序列直接与其人对应物进行比较,以其系统发育关系产生定量相关数据(例如,肽序列相似性和/或进化树可视化)。另外的分析可包括蛋白质效应物募集/结合的基本结构元件的保守性/相似性,例如,基于对人靶标的三级蛋白质结构的检查。例如,在一些实施方案中,将比对的序列与对应于在相应接合蛋白的4埃内的靶蛋白残基的PDB晶体结构进行比较。不期望受任何理论束缚,在其中这些结构基序在真菌ETaG内保守的情况下,这可指示以下的可能性提高:由ETaG相关生物合成基因簇产生的代谢物是真菌靶蛋白和人靶蛋白二者的效应物,并且产生的代谢物可以是针对人靶标的药物候选物或用于药物开发的先导物。在一些实施方案中,对于靶向人靶标,使用以上分析对ETaG及其相关生物合成基因簇以及由该生物合成基因簇产生的代谢物进行优先排序。
实施例2:用于人靶标-Sec7的调节剂
尤其地,本公开内容提供了用于鉴定人靶标的调节剂的技术。在一些实施方案中,利用人序列来查询所提供的数据库以鉴定在其邻近区中存在人序列的同源物的生物合成基因簇。
例如,尤其地,本公开内容提供了其生物合成产物可调节Sec7功能的生物合成基因簇。为了鉴定用于人Sec7结构域的调节剂,使用Sec7蛋白序列查询数据库,例如实施例1中提供的数据库。在具有相关生物合成基因簇的狐粪青霉IBT 29486中鉴定出示例性Sec7同源ETaG-该ETaG在相对于该生物合成基因簇中生物合成基因之一的邻近区中。参见图1、图18和图19。尤其地,所鉴定的生物合成基因簇与布雷正青霉(Eupenicilliumbrefeldianum)中布雷菲德菌素A的生物合成基因簇共有同源性,并且预期产生布雷菲德菌素A。因此,布雷菲德菌素A被鉴定为Sec7的候选调节剂和/或其调节剂的先导化合物。如果期望的话,该结果可根据本公开内容任选地通过以下进行验证:表达狐粪青霉IBT 29486的生物合成基因簇,分离并表征其产物,并随后使用本领域中可用的多种方法针对Sec7测定产物的功能。由于已报道布雷菲德菌素A靶向人GBF1的Sec7结构域,因此该实施例举例说明了所提供的技术可成功地用于鉴定人靶标的调节剂。
实施例3:洛伐他汀、非鲁米特和环孢素的ETaG
所提供的技术可用于鉴定多种实体的ETaG。例如,如本文中所证明的,所提供的技术可有效地用于鉴定与洛伐他汀、非鲁米特和环孢素相关的EtaG。示例性结果示出于图2至4中。
实施例4:用于人靶标-Ras的调节剂
尤其地,本公开内容提供了其生物合成产物可调节以下蛋白质的一种或更多种功能的生物合成基因簇:Ras蛋白和/或包含RasGEF结构域(例如,KNDC1、PLCE1、RALGDS、RALGPS1、RALGPS2、RAPGEF1、RAPGEF2、RAPGEF3、RAPGEF4、RAPGEF5、RAPGEF6、RAPGEFL1、RASGEF1A、RASGEF1B、RASGEF1C、RASGRF1、RASGRF2、RASGRP1、RASGRP2、RASGRP3、RASGRP4、RGL1、RGL2、RGL3、RGL4/RGR、SOS1、SOS2等)和/或RasGAP结构域(DAB2IP、GAPVD1、IQGAP1、IQGAP2、IQGAP3、NF1、RASA1、RASA2、RASA3、RASA4、RASAL1、RASAL2、SYNGAP1等)的蛋白质。Ras蛋白(例如HRas、KRas和NRas)与许多人癌症有关,但众所周知地是药物发现的难点靶标。尤其地,本公开内容提供了用于开发Ras调节剂(包括Ras抑制剂)的技术。
使用人Ras序列查询所提供的数据库,例如实施例1的数据库。从不同菌株中鉴定出8个与人Ras蛋白具有不同序列相似性水平的示例性ETaG。相关生物合成基因簇编码产生不同类型的化合物的酶。参见图5至12和图20至27。所鉴定ETaG编码的蛋白质可与人Ras蛋白高度同源。例如,核苷酸结合残基的相似性参见图13,BRAF相互作用残基参见图14,rasGAP相互作用残基参见图15,以及SOS相互作用残基参见图16。
类似地,鉴定了生物合成产物可调节RasGEF和RasGAP结构域的生物合成基因簇。如本文中所证明的,所鉴定的示例性生物合成基因簇可包含涉及多种类型的部分/产物,例如,萜、PKS、NRPS等的合成的基因和/或模块。例如,所鉴定的生物合成基因簇以及RasGEF和RasGAP同源物,参见图28至39。
所鉴定的示例性ETaG序列列于下文:
图5:疏棉状嗜热丝孢菌,Ras ETaG序列:
图6:Talaromyces leycettanus CBS 398.68,Ras ETaG序列:
图7:Sistotremastrum niveocremeum,Ras ETaG序列:
Sistotremastrum suecicum,Ras ETaG序列:
图8:双孢蘑菇贝纳特变种JB137-S8,Ras ETaG序列:
图9:冈山灰盖鬼伞,Ras ETaG序列:
图10:希金斯炭疽菌,Ras ETaG序列:
图11:Gyalolechia flavorubescens KoLRI002931,Ras ETaG序列:
图12:玉蜀黍平脐蠕孢ATCC 48331,Ras ETaG序列:
图18:狐粪青霉IBT 29486,Sec7 ETaG序列:
图20:疏棉状嗜热丝孢菌ATCC 200065,Ras ETaG序列:
Aspergillus rambelli,Ras ETaG序列:
赭曲霉,Ras ETaG序列:
图21:双孢蘑菇贝纳特变种JB137-S8,Ras ETaG序列:
双孢蘑菇H97,Ras ETaG序列:
冈山灰盖鬼伞,Ras ETaG序列:
亚砖红垂暮菇FD-334,Ras ETaG序列:
图22:Sistotremastrum niveocremeum,Ras ETaG序列:
Sistotremastrum suecicum,Ras ETaG序列:
图23:Talaromyces leycettanus CBS 398.68,Ras ETaG序列:
图24:坚脆嗜热子囊菌,Ras ETaG序列:
图25:玉蜀黍平脐蠕孢ATCC 48331,Ras ETaG序列:
图26:希金斯炭疽菌IMI 349063,Ras ETaG序列:
图27:Gyalolechia flavorubescens,Ras ETaG序列:
图28:松针褐斑病菌CBS 871.95,RasGEF ETaG序列:
产黄青霉威斯康星54-1255,RasGEF ETaG序列:
图29:稻大角间座壳70-15,RasGEF ETaG序列:
图30:石膏样节皮菌CBS 118893,RasGEF ETaG序列:
图31:Endocarpon pusillum菌株KoLRI No.LF000583,RasGEF ETaG序列:
图32:肝色牛舌菌ATCC 64428,RasGEF ETaG序列:
图33:出芽短梗霉普鲁兰变种EXF-150,RasGEF ETaG序列:
图34:分枝枝顶孢,RasGAP ETaG序列:
图35:淡紫紫霉菌株TERIBC 1,RasGEF ETaG序列:
链孢霉JS1030,RasGEF ETaG序列:
图36:多主棒孢霉UM 591,RasGAP ETaG序列:
稻大角间座壳菌株SV9610,RasGAP ETaG序列:
图37:尖孢炭疽菌菌株1 KC05_01,RasGAP ETaG序列:
图38:炭团菌E7406B,RasGAP ETaG序列:
葡萄间座壳分离珠DA912,RasGAP ETaG序列:
图39:云杉蓝状菌菌株9-3,RasGAP ETaG序列:
虫生簇孢RCEF 264,RasGAP ETaG序列:
利用所鉴定的生物合成基因簇,根据本公开内容,可利用多种方法来鉴定和表征通过这些生物合成基因簇的酶产生的化合物(例如,Clevenger,et al.,Nat.Chem.Bio.,13,895-901(2017)和其中引用的参考文献中描述的那些)。所述化合物一旦鉴定出就可以对其进行测定以评估其调节人Ras蛋白的能力。作为补充或替代,所述化合物可用作先导化合物以制备用于例如SAR研究的更多类似物,以进一步改善用于调节Ras活性的亲和力、效力、选择性等。预期将由与所鉴定ETaG相关的生物合成基因簇开发有用的化合物。
尽管本文中已经描述和举例说明了多个实施方案,但是本领域普通技术人员将容易地想到用于执行本公开内容中所述功能和/或获得本公开内容中所述结果和/或一个或更多个优点的多种其他手段和/或结构,并且这样的变化方案和/或修改方案中的每一个均被认为包括在内。更一般地,本领域技术人员将容易地理解,本文中所述的所有参数、尺寸、材料和配置均意在是示例性的,而且实际参数、尺寸、材料和/或配置将取决于使用本公开内容的教导的一个或更多个具体应用。本领域技术人员将认识到或仅使用常规实验就能够确定本公开内容中所述的公开内容的具体实施方案的许多等同方案。因此,应当理解,前述实施方案仅通过实例给出,并且所提供的技术(包括所要求保护的那些)可以以除具体描述和要求保护的之外的方式进行实践。另外,如果两个或更多个特征、系统、制品、材料、套件和/或方法不是相互矛盾的,则这样的特征、系统、制品、材料、套件和/或方法的任意组合包括在本公开内容的范围内。
Claims (44)
1.方法,其包括以下步骤:
查询核酸序列集合,所述核酸序列中的每一个存在于真菌菌株中并且包含生物合成基因簇;以及
在至少一个真菌核酸序列内鉴定嵌入靶基因(ETaG)序列,所述嵌入靶基因(ETaG)序列的特征在于,其:
对于所述生物合成基因簇的产物的生物合成是不需要的或不涉及所述生物合成;
在相对于所述簇中至少一个基因的邻近区内;
是与哺乳动物核酸序列同源的;并且
任选地与所述簇中的至少一个生物合成基因共调节。
2.权利要求1所述的方法,其中所述ETaG序列在相对于所述簇中至少一个生物合成基因的邻近区内。
3.权利要求2所述的方法,其中包含生物合成基因簇的核酸序列不包含除相对于所述生物合成基因簇中生物合成基因的邻近区的核酸序列和所述生物合成基因簇的核酸序列之外的序列。
4.权利要求3所述的方法,其中邻近区在所述簇中生物合成基因上游或下游的不超过1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100kb。
5.权利要求4所述的方法,其中所述哺乳动物核酸序列是人核酸序列。
6.权利要求5所述的方法,其中嵌入靶基因序列是与表达的哺乳动物核酸序列同源的,这在于:所述嵌入靶基因序列的碱基序列或其一部分与哺乳动物核酸序列的碱基序列或其一部分具有至少50%、60%、70%、80%或90%同一性。
7.权利要求6所述的方法,其中所述序列或其一部分的长度为至少50、100、150或200个碱基对。
8.权利要求5所述的方法,其中嵌入靶基因序列是与表达的哺乳动物核酸序列同源的,这在于:由嵌入靶基因或其一部分编码的蛋白质是与哺乳动物核酸序列或其一部分编码的蛋白质同源的。
9.权利要求8所述的方法,其中所述由嵌入靶基因或其一部分编码的蛋白质与由哺乳动物核酸序列或其一部分编码的蛋白质具有至少50%、60%、70%、80%或90%相似性。
10.权利要求9所述的方法,其中由嵌入靶基因或其一部分编码的蛋白质与由哺乳动物核酸序列编码的蛋白质具有相似的3维结构,这在于:与由嵌入靶基因或其一部分编码的蛋白质结合的小分子也与由哺乳动物核酸序列或其一部分编码的蛋白质结合。
11.权利要求10所述的方法,其中所述小分子与由所述嵌入靶基因和所述哺乳动物核酸序列或其一部分编码的蛋白质的结合的Kd为不超过100μM、50μM、10μM、5μM或1μM。
12.权利要求10所述的方法,其中所述小分子是生物合成基因簇的生物合成产物。
13.权利要求5所述的方法,其中由嵌入靶基因编码的蛋白质的一部分与由表达的哺乳动物核酸序列编码的蛋白质的一部分具有至少50%、60%、70%、80%或90%相似性,其中所述蛋白质的一部分是蛋白质结构域。
14.前述权利要求中任一项所述的方法,其中所述嵌入靶基因在所述集合中来自不同真菌菌株并且包含同源或相同生物合成基因簇的所有真菌核酸序列中的80%、90%、95%或100%中不存在。
15.权利要求14所述的方法,其中所述集合包含来自至少100、500、1,000、5,000、10,000、15,000、20,000、22,000、25,000或30,000个独立真菌菌株的核酸序列。
16.方法,其包括以下步骤:
使至少一种受试化合物与由真菌核酸序列中嵌入靶基因编码的基因产物接触,所述嵌入靶基因(ETaG)的特征在于,其:
对于生物合成基因簇的产物的生物合成是不需要的或不涉及所述生物合成;
在相对于所述簇中至少一个生物合成基因的邻近区内;
是与哺乳动物核酸序列同源的;并且
任选地与所述簇中的至少一个生物合成基因共调节;以及
确定:
与在不存在所述受试化合物的情况相比,在存在所述受试化合物的情况下,所述基因产物的水平或活性发生改变;或者
所述基因产物的水平或活性与在存在对所述水平或活性具有已知作用的参考剂的情况下观察到的水平或活性相当。
17.权利要求16所述的方法,其中所述ETaG是如权利要求1至15中任一项所描述的ETaG。
18.权利要求17所述的方法,其中所述哺乳动物核酸序列是人Ras序列。
19.权利要求16所述的方法,其中所述生物合成基因簇是图1至39之一中的生物合成基因簇。
20.权利要求16所述的方法,其中所述受试化合物是所述生物合成基因簇的生物合成产物或其类似物。
21.方法,其包括以下步骤:
使至少一种受试化合物与由表达的哺乳动物核酸序列编码的基因产物接触,所述序列是与权利要求1至15中任一项所述的嵌入靶基因序列同源的表达的哺乳动物核酸序列。
22.权利要求21所述的方法,其中所述哺乳动物核酸序列是人Ras序列。
23.权利要求21所述的方法,其中所述ETaG是图1至39之一中的ETaG。
24.权利要求21所述的方法,其中所述生物合成基因簇是图1至39之一中的生物合成基因簇。
25.权利要求21所述的方法,其中所述受试化合物是所述生物合成基因簇的生物合成产物或其类似物。
26.方法,其包括:
鉴定ETaG的人同源物,所述ETaG在相对于生物合成基因簇中至少一个生物合成基因的邻近区内;以及
任选地测定通过由生物合成基因簇编码的酶产生的产物或所述产物的类似物对所述人同源物的作用。
27.权利要求26所述的方法,其中所述ETaG是如权利要求1至15中任一项所描述的ETaG。
28.用于鉴定和/或表征人靶标的调节剂的方法,其包括:
提供产物或其类似物,所述产物通过由生物合成基因簇编码的酶产生,其中在相对于所述生物合成基因簇中至少一个基因的邻近区内存在ETaG,所述ETaG:
是与所述人靶标或编码所述人靶标的核酸序列同源的;并且
任选地与所述簇中的至少一个生物合成基因共调节。
29.权利要求28所述的方法,其中所述ETaG是如权利要求1至15中任一项所描述的ETaG。
30.权利要求28所述的方法,其中所述人靶标是Ras蛋白。
31.权利要求28所述的方法,其中所述ETaG是图1至39之一中的ETaG。
32.权利要求28所述的方法,其中所述生物合成基因簇是图1至39之一中的生物合成基因簇。
33.用于调节人靶标的方法,其包括:
提供产物或其类似物,所述产物通过由生物合成基因簇编码的酶产生,其中在相对于所述生物合成基因簇中至少一个生物合成基因的邻近区内存在ETaG,所述ETaG:
是与所述人靶标或编码所述人靶标的核酸序列同源的;并且
任选地与所述簇中的至少一个生物合成基因共调节。
34.权利要求33所述的方法,其中所述人靶标是Ras蛋白。
35.权利要求33所述的方法,其中所述ETaG是图1至39之一中的ETaG。
36.权利要求33所述的方法,其中所述生物合成基因簇是图1至39之一中的生物合成基因簇。
37.权利要求33所述的方法,其中所述ETaG是如权利要求1至15中任一项所描述的ETaG。
38.数据库,其包含:
核酸序列集合,所述核酸序列中的每一个存在于真菌菌株中并且包含生物合成基因簇;
其中所述核酸序列集合包含在计算机可读介质中。
39.权利要求38所述的数据库,其中权利要求1至37任一项中的一个或更多个嵌入靶基因被索引。
40.系统,其包含:
一个或更多个非暂时性机器可读存储介质,其存储有代表核酸序列集合的数据,所述核酸序列中的每一个存在于真菌菌株中并且包含生物合成基因簇。
41.系统,其包含:
一个或更多个非暂时性机器可读存储介质,其存储有代表核酸序列集合的数据,所述核酸序列中的每一个是或包含ETaG序列。
42.权利要求41所述的系统,其中权利要求1至37任一项中的一个或更多个嵌入靶基因被索引。
43.适于执行权利要求1至37中任一项所述的方法的计算机系统,或者适于访问权利要求34至39中任一项所述的数据库的计算机系统。
44.示例性实施方案1至108中任一项所述的方法、数据库或系统。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762558744P | 2017-09-14 | 2017-09-14 | |
US62/558,744 | 2017-09-14 | ||
PCT/US2018/051134 WO2019055816A1 (en) | 2017-09-14 | 2018-09-14 | HUMAN THERAPEUTIC TARGETS AND MODULATORS THEREFOR |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111655855A true CN111655855A (zh) | 2020-09-11 |
Family
ID=65723840
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880072708.4A Pending CN111655855A (zh) | 2017-09-14 | 2018-09-14 | 人治疗靶标及其调节剂 |
Country Status (6)
Country | Link |
---|---|
US (2) | US11749375B2 (zh) |
EP (1) | EP3682022A4 (zh) |
JP (2) | JP7404229B2 (zh) |
CN (1) | CN111655855A (zh) |
CA (1) | CA3075528A1 (zh) |
WO (1) | WO2019055816A1 (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10612032B2 (en) | 2016-03-24 | 2020-04-07 | The Board Of Trustees Of The Leland Stanford Junior University | Inducible production-phase promoters for coordinated heterologous expression in yeast |
CA3075528A1 (en) | 2017-09-14 | 2019-03-21 | Lifemine Therapeutics, Inc. | Human therapeutic targets and modulators thereof |
IL294909A (en) | 2020-02-13 | 2022-09-01 | Zymergen Inc | A metagenomic library and natural product discovery platform |
US11200446B1 (en) | 2020-08-31 | 2021-12-14 | Element Biosciences, Inc. | Single-pass primary analysis |
AU2022383192A1 (en) * | 2021-11-05 | 2024-06-13 | Lifemine Therapeutics, Inc. | Methods and systems for discovery of embedded target genes in biosynthetic gene clusters |
EP4434038A1 (en) * | 2021-11-16 | 2024-09-25 | LifeMine Therapeutics, Inc. | Methods and systems for discovery of non-embedded target genes |
WO2023097290A1 (en) * | 2021-11-23 | 2023-06-01 | Lifemine Therapeutics, Inc. | Deep learning methods for biosynthetic gene cluster discovery |
CA3240445A1 (en) * | 2021-12-10 | 2023-06-15 | Chunhong Zhou | Primary analysis in next generation sequencing |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6261842B1 (en) * | 1997-10-23 | 2001-07-17 | Wisconsin Alumni Research Foundation | Microorganism genomics, compositions and methods related thereto |
US6892139B2 (en) * | 1999-01-29 | 2005-05-10 | The Regents Of The University Of California | Determining the functions and interactions of proteins by comparative analysis |
WO2000047771A2 (en) * | 1999-02-12 | 2000-08-17 | Genset | Biallelic markers derived from genomic regions carrying genes involved in arachidonic acid metabolism |
JP2003519495A (ja) * | 2000-01-11 | 2003-06-24 | マキシジェン, インコーポレイテッド | 多様性生成およびスクリーニングのための一体化されたシステムおよび方法 |
JP2005512504A (ja) | 2001-03-26 | 2005-05-12 | 協和発酵工業株式会社 | レイナマイシン生合成遺伝子クラスターおよびその成分ならびにそれらの使用 |
US20040076981A1 (en) * | 2001-11-21 | 2004-04-22 | Olen Yoder | Fungal gene cluster associated with pathogenesis |
US7053204B2 (en) | 2002-09-24 | 2006-05-30 | Wisconsin Alumni Research Foundation | Global regulator of secondary metabolite biosynthesis and methods of use |
WO2005071058A2 (en) | 2004-01-27 | 2005-08-04 | Compugen Ltd. | Methods and systems for annotating biomolecular sequences |
US8065089B1 (en) * | 2004-03-30 | 2011-11-22 | University Of North Carolina At Charlotte | Methods and systems for analysis of dynamic biological pathways |
US20090011476A1 (en) | 2005-08-19 | 2009-01-08 | Wisconsin Alumni Research Foundation | Gene cluster and method for the biosynthesis of terrequinone a |
AU2007204597B2 (en) * | 2006-01-11 | 2013-01-24 | Agriculture Victoria Services Pty Ltd | Method of producing transgenic graminaceous cells and plants |
WO2007139871A2 (en) | 2006-05-24 | 2007-12-06 | The Regents Of The University Of California | Methods and materials for making simvastatin and related compounds |
US8871494B2 (en) | 2009-04-24 | 2014-10-28 | Wisconsin Alumni Research Foundation | Over-production of secondary metabolites by over-expression of the VEA gene |
SG10201504099WA (en) | 2009-10-08 | 2015-06-29 | Univ California | LovD MUTANTS EXHIBITING IMPROVED PROPERTIES TOWARDS SIMVASTATIN SYNTHESIS |
US9499803B2 (en) | 2009-10-08 | 2016-11-22 | The Regents Of The University Of California | Variant LovD polypeptide |
TW201247315A (en) | 2011-05-16 | 2012-12-01 | Du Pont | Catalytic hydrogenation of fluoroolefins, alpha-alumina supported palladium compositions and their use as hydrogenation catalysts |
US20150310168A1 (en) * | 2012-09-24 | 2015-10-29 | National Institute Of Advanced Industrial Science And Technolgoy | Method for predicting gene cluster including secondary metabolism-related genes, prediction program, and prediction device |
US10968446B2 (en) * | 2012-11-01 | 2021-04-06 | Massachusetts Institute Of Technology | Directed evolution of synthetic gene cluster |
AU2014227811C1 (en) | 2013-03-15 | 2018-09-27 | Amyris, Inc. | Use of phosphoketolase and phosphotransacetylase for production of acetyl-coenzyme a derived compounds |
US10077448B2 (en) | 2015-02-16 | 2018-09-18 | Wisconsin Alumni Research Foundation | Methods and systems for producing fungal secondary metabolites |
US10118945B2 (en) | 2015-10-30 | 2018-11-06 | University Of Kansas | Dereplication strain of Aspergillus nidulans |
CA3008183A1 (en) * | 2015-12-14 | 2017-06-22 | Mcmaster University | A natural product and genetic data analysis and discovery system, method and computational platform therefor |
WO2017205387A1 (en) | 2016-05-23 | 2017-11-30 | Northwestern University | Systems and methods for untargeted metabolomic screening |
US11810649B2 (en) | 2016-08-17 | 2023-11-07 | The Broad Institute, Inc. | Methods for identifying novel gene editing elements |
US20200143907A1 (en) | 2016-09-28 | 2020-05-07 | The Broad Institute, Inc. | Systematic screening and mapping of regulatory elements in non-coding genomic regions, methods, compositions, and applications thereof |
CA3042726A1 (en) * | 2016-11-16 | 2018-05-24 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and methods for identifying and expressing gene clusters |
WO2018175635A1 (en) | 2017-03-21 | 2018-09-27 | The Regents Of The University Of California | Herbicidal compositions and methods of use thereof |
CA3075528A1 (en) | 2017-09-14 | 2019-03-21 | Lifemine Therapeutics, Inc. | Human therapeutic targets and modulators thereof |
US20190130999A1 (en) | 2017-10-26 | 2019-05-02 | Indigo Ag, Inc. | Latent Representations of Phylogeny to Predict Organism Phenotype |
-
2018
- 2018-09-14 CA CA3075528A patent/CA3075528A1/en active Pending
- 2018-09-14 WO PCT/US2018/051134 patent/WO2019055816A1/en unknown
- 2018-09-14 JP JP2020515852A patent/JP7404229B2/ja active Active
- 2018-09-14 EP EP18855399.4A patent/EP3682022A4/en active Pending
- 2018-09-14 CN CN201880072708.4A patent/CN111655855A/zh active Pending
- 2018-09-14 US US16/646,978 patent/US11749375B2/en active Active
-
2023
- 2023-07-13 US US18/221,761 patent/US20240212788A1/en active Pending
- 2023-08-04 JP JP2023127703A patent/JP2023153953A/ja active Pending
Non-Patent Citations (1)
Title |
---|
HSU-HUA YEH等: ""Resistance Gene-Guided Genome Mining: Serial Promoter Exchanges in Aspergillus nidulans Reveal the Biosynthetic Pathway for Fellutamide B, a Proteasome Inhibitor"", 《ACS CHEM. BIOL》, 13 June 2016 (2016-06-13), pages 2275 * |
Also Published As
Publication number | Publication date |
---|---|
EP3682022A1 (en) | 2020-07-22 |
JP7404229B2 (ja) | 2023-12-25 |
JP2020533991A (ja) | 2020-11-26 |
EP3682022A4 (en) | 2021-06-09 |
JP2023153953A (ja) | 2023-10-18 |
US20200211673A1 (en) | 2020-07-02 |
WO2019055816A1 (en) | 2019-03-21 |
US11749375B2 (en) | 2023-09-05 |
CA3075528A1 (en) | 2019-03-21 |
US20240212788A1 (en) | 2024-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111655855A (zh) | 人治疗靶标及其调节剂 | |
US11603531B1 (en) | Methods and compositions for modulating splicing | |
Claesen et al. | Genome mining and genetic analysis of cypemycin biosynthesis reveal an unusual class of posttranslationally modified peptides | |
US20220143202A1 (en) | Compounds that participate in cooperative binding and uses thereof | |
Kim | The epigenome, cell cycle, and development in Toxoplasma | |
Garbelli et al. | Targeting the human DEAD-box polypeptide 3 (DDX3) RNA helicase as a novel strategy to inhibit viral replication | |
Xu et al. | Rational reprogramming of fungal polyketide first-ring cyclization | |
Ortega-Pierres et al. | Recent advances in the genomic and molecular biology of Giardia | |
Zettler et al. | New aminocoumarins from the rare actinomycete Catenulispora acidiphila DSM 44928: identification, structure elucidation, and heterologous production | |
Lou et al. | The life of SARS-CoV-2 inside cells: Replication–transcription complex assembly and function | |
Liang et al. | Discovery of an isothiazolinone-containing antitubercular natural product Levesquamide | |
KR101496232B1 (ko) | 포스포트랜스아세틸라제 억제 활성을 가지는 화합물을 포함하는 세균 감염 질환 예방 또는 치료용 약제학적 조성물 | |
Song et al. | Post-translational changes in Phialophora verrucosa via lysine lactylation during prolonged presence in a patient with a CARD9-related immune disorder | |
Korolev et al. | Structural-functional analysis of 2, 1, 3-benzoxadiazoles and their N-oxides as HIV-1 integrase inhibitors | |
Bailey et al. | Stability-Based Proteomics for Investigation of Structured RNA–Protein Interactions | |
Bauer et al. | Characterization of the sterol 24-C-methyltransferase genes reveals a network of alternative sterol biosynthetic pathways in Mucor lusitanicus | |
EP3374027B1 (en) | Rational drug design targeting resistant gram-negative bacterial infections to polymyxin-class antibiotics | |
Murphy-Benenato et al. | Identification through structure-based methods of a bacterial NAD+-dependent DNA ligase inhibitor that avoids known resistance mutations | |
Aoyama et al. | Genome‐wide survey of transcriptional initiation in the pathogenic fungus, Candida glabrata | |
Tang et al. | Genome-wide mapping of fluoroquinolone-stabilized DNA gyrase cleavage sites displays drug specific effects that correlate with bacterial persistence | |
Lu-Culligan | Investigations of Novel Mechanisms of Epigenetic Regulation on Chromatin | |
Lu | An Exploration of Transcriptional Regulation in the Human Malaria Parasite, Plasmodium falciparum | |
Sharma | Age-dependent transcriptional and epigenetic alterations in mouse hepatocytes | |
Lu et al. | Expanding structural diversity of 5′-aminouridine moiety of sansanmycin via mutational biosynthesis | |
Schaenzer et al. | Angucyclinones rescue PhLOPSA antibiotic activity by inhibiting Cfr-dependent antibiotic resistance |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40034364 Country of ref document: HK |