ES2748460T3 - Procesos químicos para preparar espiroindolonas y compuestos intermedios correspondientes - Google Patents
Procesos químicos para preparar espiroindolonas y compuestos intermedios correspondientes Download PDFInfo
- Publication number
- ES2748460T3 ES2748460T3 ES13714246T ES13714246T ES2748460T3 ES 2748460 T3 ES2748460 T3 ES 2748460T3 ES 13714246 T ES13714246 T ES 13714246T ES 13714246 T ES13714246 T ES 13714246T ES 2748460 T3 ES2748460 T3 ES 2748460T3
- Authority
- ES
- Spain
- Prior art keywords
- compound
- formula
- transaminase
- polypeptide
- seq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000000543 intermediate Substances 0.000 title description 16
- 238000001311 chemical methods and process Methods 0.000 title description 2
- 150000001875 compounds Chemical class 0.000 claims abstract description 204
- 150000003839 salts Chemical class 0.000 claims abstract description 76
- 102000004190 Enzymes Human genes 0.000 claims abstract description 68
- 108090000790 Enzymes Proteins 0.000 claims abstract description 68
- -1 -CH2OH Chemical group 0.000 claims abstract description 47
- 150000004677 hydrates Chemical class 0.000 claims abstract description 39
- 239000012453 solvate Substances 0.000 claims abstract description 39
- 238000004519 manufacturing process Methods 0.000 claims abstract description 29
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 claims abstract description 17
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims abstract description 9
- 125000002023 trifluoromethyl group Chemical group FC(F)(F)* 0.000 claims abstract description 8
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 claims abstract description 6
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 claims abstract description 6
- 238000006243 chemical reaction Methods 0.000 claims description 166
- 238000000034 method Methods 0.000 claims description 129
- 230000008569 process Effects 0.000 claims description 69
- 230000002255 enzymatic effect Effects 0.000 claims description 16
- 125000001309 chloro group Chemical group Cl* 0.000 claims description 13
- 238000005891 transamination reaction Methods 0.000 claims description 13
- 125000001153 fluoro group Chemical group F* 0.000 claims description 8
- 239000001257 hydrogen Substances 0.000 claims description 5
- 229910052739 hydrogen Inorganic materials 0.000 claims description 5
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 claims description 3
- 125000004435 hydrogen atom Chemical group [H]* 0.000 claims description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 193
- 102000004196 processed proteins & peptides Human genes 0.000 description 190
- 229920001184 polypeptide Polymers 0.000 description 189
- 108090000340 Transaminases Proteins 0.000 description 164
- 102000003929 Transaminases Human genes 0.000 description 163
- 239000000758 substrate Substances 0.000 description 91
- 235000001014 amino acid Nutrition 0.000 description 81
- 239000000047 product Substances 0.000 description 79
- 229940024606 amino acid Drugs 0.000 description 78
- 150000001413 amino acids Chemical class 0.000 description 71
- 229940088598 enzyme Drugs 0.000 description 61
- NGVDGCNFYWLIFO-UHFFFAOYSA-N pyridoxal 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(C=O)=C1O NGVDGCNFYWLIFO-UHFFFAOYSA-N 0.000 description 57
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 53
- 108091033319 polynucleotide Proteins 0.000 description 52
- 102000040430 polynucleotide Human genes 0.000 description 52
- 239000002157 polynucleotide Substances 0.000 description 52
- 150000001412 amines Chemical class 0.000 description 47
- JJWLVOIRVHMVIS-UHFFFAOYSA-N isopropylamine Chemical compound CC(C)N JJWLVOIRVHMVIS-UHFFFAOYSA-N 0.000 description 47
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 45
- 239000000243 solution Substances 0.000 description 41
- 230000000694 effects Effects 0.000 description 40
- 239000000203 mixture Substances 0.000 description 40
- 108090000623 proteins and genes Proteins 0.000 description 40
- 210000004027 cell Anatomy 0.000 description 37
- 108020004705 Codon Proteins 0.000 description 34
- 125000003275 alpha amino acid group Chemical group 0.000 description 33
- 235000007682 pyridoxal 5'-phosphate Nutrition 0.000 description 32
- 239000011589 pyridoxal 5'-phosphate Substances 0.000 description 32
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 30
- 239000011541 reaction mixture Substances 0.000 description 28
- 229910001868 water Inorganic materials 0.000 description 27
- 150000007523 nucleic acids Chemical group 0.000 description 26
- 239000002904 solvent Substances 0.000 description 26
- GSEJCLTVZPLZKY-UHFFFAOYSA-N Triethanolamine Chemical compound OCCN(CCO)CCO GSEJCLTVZPLZKY-UHFFFAOYSA-N 0.000 description 25
- 238000007792 addition Methods 0.000 description 25
- 239000006184 cosolvent Substances 0.000 description 24
- 229960001327 pyridoxal phosphate Drugs 0.000 description 24
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 23
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 22
- 150000002576 ketones Chemical class 0.000 description 22
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 21
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 21
- 230000014509 gene expression Effects 0.000 description 21
- 102000004169 proteins and genes Human genes 0.000 description 21
- 239000000370 acceptor Substances 0.000 description 20
- 239000000872 buffer Substances 0.000 description 20
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 19
- ZMANZCXQSJIPKH-UHFFFAOYSA-N Triethylamine Chemical compound CCN(CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-N 0.000 description 19
- 230000015572 biosynthetic process Effects 0.000 description 19
- 102000039446 nucleic acids Human genes 0.000 description 19
- 108020004707 nucleic acids Proteins 0.000 description 19
- 235000018102 proteins Nutrition 0.000 description 19
- 125000000539 amino acid group Chemical group 0.000 description 18
- 125000000217 alkyl group Chemical group 0.000 description 17
- 238000004128 high performance liquid chromatography Methods 0.000 description 17
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 16
- 238000002360 preparation method Methods 0.000 description 16
- 239000012071 phase Substances 0.000 description 14
- LXNHXLLTXMVWPM-UHFFFAOYSA-N pyridoxine Chemical compound CC1=NC=C(CO)C(CO)=C1O LXNHXLLTXMVWPM-UHFFFAOYSA-N 0.000 description 14
- 241000894007 species Species 0.000 description 14
- 238000003786 synthesis reaction Methods 0.000 description 14
- 125000003277 amino group Chemical group 0.000 description 13
- 239000003054 catalyst Substances 0.000 description 13
- 239000000843 powder Substances 0.000 description 13
- 239000000725 suspension Substances 0.000 description 13
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 12
- 229920000604 Polyethylene Glycol 200 Polymers 0.000 description 12
- 239000002253 acid Substances 0.000 description 12
- 239000002585 base Substances 0.000 description 12
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 12
- RADKZDMFGJYCBB-UHFFFAOYSA-N pyridoxal hydrochloride Natural products CC1=NC=C(CO)C(C=O)=C1O RADKZDMFGJYCBB-UHFFFAOYSA-N 0.000 description 12
- 239000007787 solid Substances 0.000 description 12
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 11
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 11
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 11
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 11
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 11
- BZLVMXJERCGZMT-UHFFFAOYSA-N Methyl tert-butyl ether Chemical compound COC(C)(C)C BZLVMXJERCGZMT-UHFFFAOYSA-N 0.000 description 11
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 11
- 238000012217 deletion Methods 0.000 description 11
- 230000037430 deletion Effects 0.000 description 11
- 238000009396 hybridization Methods 0.000 description 11
- 230000005764 inhibitory process Effects 0.000 description 11
- 238000006467 substitution reaction Methods 0.000 description 11
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 10
- QNAYBMKLOCPYGJ-UWTATZPHSA-N D-alanine Chemical compound C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 10
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 10
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 10
- 238000003556 assay Methods 0.000 description 10
- 239000006227 byproduct Substances 0.000 description 10
- 229910052799 carbon Inorganic materials 0.000 description 10
- PAFZNILMFXTMIY-UHFFFAOYSA-N cyclohexylamine Chemical compound NC1CCCCC1 PAFZNILMFXTMIY-UHFFFAOYSA-N 0.000 description 10
- JMMWKPVZQRWMSS-UHFFFAOYSA-N isopropanol acetate Natural products CC(C)OC(C)=O JMMWKPVZQRWMSS-UHFFFAOYSA-N 0.000 description 10
- NHZMQXZHNVQTQA-UHFFFAOYSA-N pyridoxamine Chemical compound CC1=NC=C(CO)C(CN)=C1O NHZMQXZHNVQTQA-UHFFFAOYSA-N 0.000 description 10
- 229930194542 Keto Natural products 0.000 description 9
- YXFVVABEGXRONW-UHFFFAOYSA-N Toluene Chemical compound CC1=CC=CC=C1 YXFVVABEGXRONW-UHFFFAOYSA-N 0.000 description 9
- 230000008859 change Effects 0.000 description 9
- 239000003153 chemical reaction reagent Substances 0.000 description 9
- 239000010410 layer Substances 0.000 description 9
- 238000005160 1H NMR spectroscopy Methods 0.000 description 8
- 229960003767 alanine Drugs 0.000 description 8
- 125000003118 aryl group Chemical group 0.000 description 8
- 239000007789 gas Substances 0.000 description 8
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 8
- 239000006166 lysate Substances 0.000 description 8
- KIDHWZJUCRJVML-UHFFFAOYSA-N putrescine Chemical compound NCCCCN KIDHWZJUCRJVML-UHFFFAOYSA-N 0.000 description 8
- 108700010070 Codon Usage Proteins 0.000 description 7
- IAZDPXIOMUYVGZ-WFGJKAKNSA-N Dimethyl sulfoxide Chemical compound [2H]C([2H])([2H])S(=O)C([2H])([2H])[2H] IAZDPXIOMUYVGZ-WFGJKAKNSA-N 0.000 description 7
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 7
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 7
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 7
- 241000607291 Vibrio fluvialis Species 0.000 description 7
- 230000002210 biocatalytic effect Effects 0.000 description 7
- 235000019439 ethyl acetate Nutrition 0.000 description 7
- 125000000468 ketone group Chemical group 0.000 description 7
- 239000003960 organic solvent Substances 0.000 description 7
- ZMJGSOSNSPKHNH-UHFFFAOYSA-N pyridoxamine 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(CN)=C1O ZMJGSOSNSPKHNH-UHFFFAOYSA-N 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- 229940011671 vitamin b6 Drugs 0.000 description 7
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 6
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 6
- 108091026890 Coding region Proteins 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 6
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 6
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 6
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 6
- 229960005091 chloramphenicol Drugs 0.000 description 6
- IXCSERBJSXMMFS-UHFFFAOYSA-N hydrogen chloride Substances Cl.Cl IXCSERBJSXMMFS-UHFFFAOYSA-N 0.000 description 6
- 229910000041 hydrogen chloride Inorganic materials 0.000 description 6
- 230000006872 improvement Effects 0.000 description 6
- 238000011068 loading method Methods 0.000 description 6
- 229910052757 nitrogen Inorganic materials 0.000 description 6
- 239000002773 nucleotide Substances 0.000 description 6
- 125000003729 nucleotide group Chemical group 0.000 description 6
- BWHMMNNQKKPAPP-UHFFFAOYSA-L potassium carbonate Chemical compound [K+].[K+].[O-]C([O-])=O BWHMMNNQKKPAPP-UHFFFAOYSA-L 0.000 description 6
- 230000002829 reductive effect Effects 0.000 description 6
- 239000011780 sodium chloride Substances 0.000 description 6
- 238000011282 treatment Methods 0.000 description 6
- VECSRFWOHMDQCJ-UHFFFAOYSA-N 1-(6-chloro-5-fluoro-1h-indol-3-yl)propan-2-one Chemical compound ClC1=C(F)C=C2C(CC(=O)C)=CNC2=C1 VECSRFWOHMDQCJ-UHFFFAOYSA-N 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 5
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 239000002202 Polyethylene glycol Substances 0.000 description 5
- 230000002378 acidificating effect Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 239000013592 cell lysate Substances 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 5
- 125000000753 cycloalkyl group Chemical group 0.000 description 5
- 238000006911 enzymatic reaction Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 239000000706 filtrate Substances 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 125000005843 halogen group Chemical group 0.000 description 5
- 238000002955 isolation Methods 0.000 description 5
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 5
- 235000019341 magnesium sulphate Nutrition 0.000 description 5
- 230000014759 maintenance of location Effects 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 238000002844 melting Methods 0.000 description 5
- 230000008018 melting Effects 0.000 description 5
- 229930027945 nicotinamide-adenine dinucleotide Natural products 0.000 description 5
- BOPGDPNILDQYTO-NNYOXOHSSA-N nicotinamide-adenine dinucleotide Chemical compound C1=CCC(C(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OC[C@@H]2[C@H]([C@@H](O)[C@@H](O2)N2C3=NC=NC(N)=C3N=C2)O)O1 BOPGDPNILDQYTO-NNYOXOHSSA-N 0.000 description 5
- 239000012074 organic phase Substances 0.000 description 5
- KHPXUQMNIQBQEV-UHFFFAOYSA-N oxaloacetic acid Chemical compound OC(=O)CC(=O)C(O)=O KHPXUQMNIQBQEV-UHFFFAOYSA-N 0.000 description 5
- 235000011007 phosphoric acid Nutrition 0.000 description 5
- 229920001223 polyethylene glycol Polymers 0.000 description 5
- 229920005862 polyol Polymers 0.000 description 5
- 150000003077 polyols Chemical class 0.000 description 5
- 235000008164 pyridoxal Nutrition 0.000 description 5
- 239000011674 pyridoxal Substances 0.000 description 5
- 229960003581 pyridoxal Drugs 0.000 description 5
- 235000008151 pyridoxamine Nutrition 0.000 description 5
- 239000011699 pyridoxamine Substances 0.000 description 5
- 235000008160 pyridoxine Nutrition 0.000 description 5
- 239000011677 pyridoxine Substances 0.000 description 5
- WHOMFKWHIQZTHY-UHFFFAOYSA-L pyridoxine 5'-phosphate(2-) Chemical compound CC1=NC=C(COP([O-])([O-])=O)C(CO)=C1O WHOMFKWHIQZTHY-UHFFFAOYSA-L 0.000 description 5
- 150000003254 radicals Chemical class 0.000 description 5
- 238000010992 reflux Methods 0.000 description 5
- 238000003756 stirring Methods 0.000 description 5
- 239000011550 stock solution Substances 0.000 description 5
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 5
- RQEUFEKYXDPUSK-UHFFFAOYSA-N 1-phenylethylamine Chemical compound CC(N)C1=CC=CC=C1 RQEUFEKYXDPUSK-UHFFFAOYSA-N 0.000 description 4
- JWUJQDFVADABEY-UHFFFAOYSA-N 2-methyltetrahydrofuran Chemical compound CC1CCCO1 JWUJQDFVADABEY-UHFFFAOYSA-N 0.000 description 4
- 108020004414 DNA Proteins 0.000 description 4
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- VZCYOOQTPOCHFL-OWOJBTEDSA-N Fumaric acid Chemical compound OC(=O)\C=C\C(O)=O VZCYOOQTPOCHFL-OWOJBTEDSA-N 0.000 description 4
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 4
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 4
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 4
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 4
- JGFZNNIVVJXRND-UHFFFAOYSA-N N,N-Diisopropylethylamine (DIPEA) Chemical compound CCN(C(C)C)C(C)C JGFZNNIVVJXRND-UHFFFAOYSA-N 0.000 description 4
- 238000005481 NMR spectroscopy Methods 0.000 description 4
- LCTONWCANYUPML-UHFFFAOYSA-N Pyruvic acid Chemical compound CC(=O)C(O)=O LCTONWCANYUPML-UHFFFAOYSA-N 0.000 description 4
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 4
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 4
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- HEDRZPFGACZZDS-MICDWDOJSA-N Trichloro(2H)methane Chemical compound [2H]C(Cl)(Cl)Cl HEDRZPFGACZZDS-MICDWDOJSA-N 0.000 description 4
- 125000003545 alkoxy group Chemical group 0.000 description 4
- 229910021529 ammonia Inorganic materials 0.000 description 4
- 239000008346 aqueous phase Substances 0.000 description 4
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 4
- 239000011942 biocatalyst Substances 0.000 description 4
- HQABUPZFAYXKJW-UHFFFAOYSA-N butan-1-amine Chemical compound CCCCN HQABUPZFAYXKJW-UHFFFAOYSA-N 0.000 description 4
- 125000004432 carbon atom Chemical group C* 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- 239000013078 crystal Substances 0.000 description 4
- 239000005549 deoxyribonucleoside Substances 0.000 description 4
- UAOMVDZJSHZZME-UHFFFAOYSA-N diisopropylamine Chemical group CC(C)NC(C)C UAOMVDZJSHZZME-UHFFFAOYSA-N 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000008103 glucose Substances 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 4
- 239000002777 nucleoside Substances 0.000 description 4
- 125000003835 nucleoside group Chemical group 0.000 description 4
- 239000003921 oil Substances 0.000 description 4
- 239000008188 pellet Substances 0.000 description 4
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Substances [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 239000007858 starting material Substances 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- HBAQYPYDRFILMT-UHFFFAOYSA-N 8-[3-(1-cyclopropylpyrazol-4-yl)-1H-pyrazolo[4,3-d]pyrimidin-5-yl]-3-methyl-3,8-diazabicyclo[3.2.1]octan-2-one Chemical class C1(CC1)N1N=CC(=C1)C1=NNC2=C1N=C(N=C2)N1C2C(N(CC1CC2)C)=O HBAQYPYDRFILMT-UHFFFAOYSA-N 0.000 description 3
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 description 3
- 108010050375 Glucose 1-Dehydrogenase Proteins 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 102000016943 Muramidase Human genes 0.000 description 3
- 108010014251 Muramidase Proteins 0.000 description 3
- 241001302239 Mycobacterium tuberculosis complex Species 0.000 description 3
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 3
- KDLHZDBZIXYQEI-UHFFFAOYSA-N Palladium Chemical compound [Pd] KDLHZDBZIXYQEI-UHFFFAOYSA-N 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- 239000005700 Putrescine Substances 0.000 description 3
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 3
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 3
- 239000002671 adjuvant Substances 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 229910052783 alkali metal Inorganic materials 0.000 description 3
- 150000001340 alkali metals Chemical class 0.000 description 3
- 229910052784 alkaline earth metal Inorganic materials 0.000 description 3
- 229930013930 alkaloid Natural products 0.000 description 3
- 229960005261 aspartic acid Drugs 0.000 description 3
- 238000011914 asymmetric synthesis Methods 0.000 description 3
- 239000011575 calcium Substances 0.000 description 3
- MIOPJNTWMNEORI-UHFFFAOYSA-N camphorsulfonic acid Chemical compound C1CC2(CS(O)(=O)=O)C(=O)CC1C2(C)C MIOPJNTWMNEORI-UHFFFAOYSA-N 0.000 description 3
- 229910002092 carbon dioxide Inorganic materials 0.000 description 3
- 238000004587 chromatography analysis Methods 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 239000005515 coenzyme Substances 0.000 description 3
- 239000012043 crude product Substances 0.000 description 3
- 239000008367 deionised water Substances 0.000 description 3
- 229910021641 deionized water Inorganic materials 0.000 description 3
- HPNMFZURTQLUMO-UHFFFAOYSA-N diethylamine Chemical compound CCNCC HPNMFZURTQLUMO-UHFFFAOYSA-N 0.000 description 3
- 238000004821 distillation Methods 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 229960002989 glutamic acid Drugs 0.000 description 3
- RERZNCLIYCABFS-UHFFFAOYSA-N harmaline Chemical compound C1CN=C(C)C2=C1C1=CC=C(OC)C=C1N2 RERZNCLIYCABFS-UHFFFAOYSA-N 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 229940011051 isopropyl acetate Drugs 0.000 description 3
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 3
- GWYFCOCPABKNJV-UHFFFAOYSA-M isovalerate Chemical compound CC(C)CC([O-])=O GWYFCOCPABKNJV-UHFFFAOYSA-M 0.000 description 3
- 239000004325 lysozyme Substances 0.000 description 3
- 235000010335 lysozyme Nutrition 0.000 description 3
- 229960000274 lysozyme Drugs 0.000 description 3
- 159000000003 magnesium salts Chemical class 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- CKLPLPZSUQEDRT-WPCRTTGESA-N nitd609 Chemical compound O=C1NC2=CC=C(Cl)C=C2[C@@]11C(NC=2C3=CC(F)=C(Cl)C=2)=C3C[C@H](C)N1 CKLPLPZSUQEDRT-WPCRTTGESA-N 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 150000007524 organic acids Chemical class 0.000 description 3
- 239000012044 organic layer Substances 0.000 description 3
- 239000002798 polar solvent Substances 0.000 description 3
- 229910000027 potassium carbonate Inorganic materials 0.000 description 3
- 150000003141 primary amines Chemical class 0.000 description 3
- 229940076788 pyruvate Drugs 0.000 description 3
- 230000035484 reaction time Effects 0.000 description 3
- 102000005962 receptors Human genes 0.000 description 3
- 239000002342 ribonucleoside Substances 0.000 description 3
- 229910000029 sodium carbonate Inorganic materials 0.000 description 3
- 125000001424 substituent group Chemical group 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 3
- YBRBMKDOPFTVDT-UHFFFAOYSA-N tert-butylamine Chemical compound CC(C)(C)N YBRBMKDOPFTVDT-UHFFFAOYSA-N 0.000 description 3
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 3
- 239000004474 valine Substances 0.000 description 3
- 229960004295 valine Drugs 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- 125000004178 (C1-C4) alkyl group Chemical group 0.000 description 2
- 125000006701 (C1-C7) alkyl group Chemical group 0.000 description 2
- RXYPXQSKLGGKOL-UHFFFAOYSA-N 1,4-dimethylpiperazine Chemical compound CN1CCN(C)CC1 RXYPXQSKLGGKOL-UHFFFAOYSA-N 0.000 description 2
- KBPLFHHGFOOTCA-UHFFFAOYSA-N 1-Octanol Chemical compound CCCCCCCCO KBPLFHHGFOOTCA-UHFFFAOYSA-N 0.000 description 2
- 125000004206 2,2,2-trifluoroethyl group Chemical group [H]C([H])(*)C(F)(F)F 0.000 description 2
- XSAYZAUNJMRRIR-UHFFFAOYSA-N 2-acetylnaphthalene Chemical compound C1=CC=CC2=CC(C(=O)C)=CC=C21 XSAYZAUNJMRRIR-UHFFFAOYSA-N 0.000 description 2
- FEUISMYEFPANSS-UHFFFAOYSA-N 2-methylcyclohexan-1-amine Chemical compound CC1CCCCC1N FEUISMYEFPANSS-UHFFFAOYSA-N 0.000 description 2
- TYDMZADCGUWTCH-UHFFFAOYSA-N 2-methylcyclopentan-1-amine Chemical compound CC1CCCC1N TYDMZADCGUWTCH-UHFFFAOYSA-N 0.000 description 2
- KPGXRSRHYNQIFN-UHFFFAOYSA-N 2-oxoglutaric acid Chemical compound OC(=O)CCC(=O)C(O)=O KPGXRSRHYNQIFN-UHFFFAOYSA-N 0.000 description 2
- LUJMEECXHPYQOF-UHFFFAOYSA-N 3-hydroxyacetophenone Chemical compound CC(=O)C1=CC=CC(O)=C1 LUJMEECXHPYQOF-UHFFFAOYSA-N 0.000 description 2
- LGSSDLSVHUCRFI-UHFFFAOYSA-N 3-methylcyclopentan-1-amine Chemical compound CC1CCC(N)C1 LGSSDLSVHUCRFI-UHFFFAOYSA-N 0.000 description 2
- JOOXCMJARBKPKM-UHFFFAOYSA-N 4-oxopentanoic acid Chemical compound CC(=O)CCC(O)=O JOOXCMJARBKPKM-UHFFFAOYSA-N 0.000 description 2
- WECUIGDEWBNQJJ-UHFFFAOYSA-N 4-phenylbutan-2-amine Chemical compound CC(N)CCC1=CC=CC=C1 WECUIGDEWBNQJJ-UHFFFAOYSA-N 0.000 description 2
- WLICIRKRCWJTQD-KXFIGUGUSA-N 6-chloro-5-fluoro-3-[(z)-2-nitroprop-1-enyl]-1h-indole Chemical compound ClC1=C(F)C=C2C(/C=C(/C)[N+]([O-])=O)=CNC2=C1 WLICIRKRCWJTQD-KXFIGUGUSA-N 0.000 description 2
- UMWAPELVIFUJEA-UHFFFAOYSA-N 6-chloro-5-fluoro-3-hydroxy-3-(2-oxopropyl)-1h-indol-2-one Chemical compound ClC1=C(F)C=C2C(CC(=O)C)(O)C(=O)NC2=C1 UMWAPELVIFUJEA-UHFFFAOYSA-N 0.000 description 2
- XAJJIFHUOODCQU-UHFFFAOYSA-N 6-chloro-5-fluoro-3-hydroxy-3-[(2-methyl-1,3-dioxolan-2-yl)methyl]-1h-indol-2-one Chemical compound O=C1NC2=CC(Cl)=C(F)C=C2C1(O)CC1(C)OCCO1 XAJJIFHUOODCQU-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- KWOLFJPFCHCOCG-UHFFFAOYSA-N Acetophenone Chemical compound CC(=O)C1=CC=CC=C1 KWOLFJPFCHCOCG-UHFFFAOYSA-N 0.000 description 2
- NLXLAEXVIDQMFP-UHFFFAOYSA-N Ammonia chloride Chemical compound [NH4+].[Cl-] NLXLAEXVIDQMFP-UHFFFAOYSA-N 0.000 description 2
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- XKRFYHLGVUSROY-UHFFFAOYSA-N Argon Chemical compound [Ar] XKRFYHLGVUSROY-UHFFFAOYSA-N 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 2
- DKPFZGUDAPQIHT-UHFFFAOYSA-N Butyl acetate Natural products CCCCOC(C)=O DKPFZGUDAPQIHT-UHFFFAOYSA-N 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 2
- 101710088194 Dehydrogenase Proteins 0.000 description 2
- XBPCUCUWBYBCDP-UHFFFAOYSA-N Dicyclohexylamine Chemical compound C1CCCCC1NC1CCCCC1 XBPCUCUWBYBCDP-UHFFFAOYSA-N 0.000 description 2
- ROSDSFDQCJNGOL-UHFFFAOYSA-N Dimethylamine Chemical compound CNC ROSDSFDQCJNGOL-UHFFFAOYSA-N 0.000 description 2
- 238000005033 Fourier transform infrared spectroscopy Methods 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- MHAJPDPJQMAIIY-UHFFFAOYSA-N Hydrogen peroxide Chemical compound OO MHAJPDPJQMAIIY-UHFFFAOYSA-N 0.000 description 2
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-M Lactate Chemical compound CC(O)C([O-])=O JVTAAEKCZFNVCJ-UHFFFAOYSA-M 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- YNAVUWVOSKDBBP-UHFFFAOYSA-N Morpholine Chemical compound C1COCCN1 YNAVUWVOSKDBBP-UHFFFAOYSA-N 0.000 description 2
- IMNFDUFMRHMDMM-UHFFFAOYSA-N N-Heptane Chemical compound CCCCCCC IMNFDUFMRHMDMM-UHFFFAOYSA-N 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- AHLPHDHHMVZTML-UHFFFAOYSA-N Ornithine Chemical compound NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- KFSLWBXXFJQRDL-UHFFFAOYSA-N Peracetic acid Chemical compound CC(=O)OO KFSLWBXXFJQRDL-UHFFFAOYSA-N 0.000 description 2
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 2
- 229920002873 Polyethylenimine Polymers 0.000 description 2
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 2
- ATUOYWHBWRKTHZ-UHFFFAOYSA-N Propane Chemical compound CCC ATUOYWHBWRKTHZ-UHFFFAOYSA-N 0.000 description 2
- LOUPRKONTZGTKE-WZBLMQSHSA-N Quinine Chemical compound C([C@H]([C@H](C1)C=C)C2)C[N@@]1[C@@H]2[C@H](O)C1=CC=NC2=CC=C(OC)C=C21 LOUPRKONTZGTKE-WZBLMQSHSA-N 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 108700005078 Synthetic Genes Proteins 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 235000011054 acetic acid Nutrition 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 2
- 150000003863 ammonium salts Chemical class 0.000 description 2
- 239000003125 aqueous solvent Substances 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 125000003710 aryl alkyl group Chemical group 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 2
- AKGGYBADQZYZPD-UHFFFAOYSA-N benzylacetone Chemical compound CC(=O)CCC1=CC=CC=C1 AKGGYBADQZYZPD-UHFFFAOYSA-N 0.000 description 2
- WGQKYBSKWIADBV-UHFFFAOYSA-N benzylamine Chemical compound NCC1=CC=CC=C1 WGQKYBSKWIADBV-UHFFFAOYSA-N 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 229910052791 calcium Inorganic materials 0.000 description 2
- 125000003917 carbamoyl group Chemical group [H]N([H])C(*)=O 0.000 description 2
- 150000001721 carbon Chemical group 0.000 description 2
- 239000001569 carbon dioxide Substances 0.000 description 2
- 150000001728 carbonyl compounds Chemical class 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- LOUPRKONTZGTKE-UHFFFAOYSA-N cinchonine Natural products C1C(C(C2)C=C)CCN2C1C(O)C1=CC=NC2=CC=C(OC)C=C21 LOUPRKONTZGTKE-UHFFFAOYSA-N 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- DEZRYPDIMOWBDS-UHFFFAOYSA-N dcm dichloromethane Chemical compound ClCCl.ClCCl DEZRYPDIMOWBDS-UHFFFAOYSA-N 0.000 description 2
- XBDQKXXYIPTUBI-UHFFFAOYSA-N dimethylselenoniopropionate Natural products CCC(O)=O XBDQKXXYIPTUBI-UHFFFAOYSA-N 0.000 description 2
- 229910001873 dinitrogen Inorganic materials 0.000 description 2
- DMBHHRLKUKUOEG-UHFFFAOYSA-N diphenylamine Chemical compound C=1C=CC=CC=1NC1=CC=CC=C1 DMBHHRLKUKUOEG-UHFFFAOYSA-N 0.000 description 2
- 238000000132 electrospray ionisation Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000855 fermentation Methods 0.000 description 2
- 230000004151 fermentation Effects 0.000 description 2
- 239000012065 filter cake Substances 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 235000019256 formaldehyde Nutrition 0.000 description 2
- 238000004108 freeze drying Methods 0.000 description 2
- 239000001530 fumaric acid Substances 0.000 description 2
- 235000011087 fumaric acid Nutrition 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 2
- 238000004817 gas chromatography Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 150000002334 glycols Chemical class 0.000 description 2
- HHLFWLYXYJOTON-UHFFFAOYSA-N glyoxylic acid Chemical compound OC(=O)C=O HHLFWLYXYJOTON-UHFFFAOYSA-N 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 229940093915 gynecological organic acid Drugs 0.000 description 2
- 229910052736 halogen Inorganic materials 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 125000001072 heteroaryl group Chemical group 0.000 description 2
- 125000000592 heterocycloalkyl group Chemical group 0.000 description 2
- FUZZWVXGSFPDMH-UHFFFAOYSA-N hexanoic acid Chemical compound CCCCCC(O)=O FUZZWVXGSFPDMH-UHFFFAOYSA-N 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 238000011065 in-situ storage Methods 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 239000011261 inert gas Substances 0.000 description 2
- 125000000959 isobutyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])* 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- BTNMPGBKDVTSJY-UHFFFAOYSA-N keto-phenylpyruvic acid Chemical compound OC(=O)C(=O)CC1=CC=CC=C1 BTNMPGBKDVTSJY-UHFFFAOYSA-N 0.000 description 2
- JVTAAEKCZFNVCJ-UHFFFAOYSA-N lactic acid Chemical compound CC(O)C(O)=O JVTAAEKCZFNVCJ-UHFFFAOYSA-N 0.000 description 2
- 229960003136 leucine Drugs 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 125000005647 linker group Chemical group 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 239000007791 liquid phase Substances 0.000 description 2
- 235000018977 lysine Nutrition 0.000 description 2
- 239000012139 lysis buffer Substances 0.000 description 2
- 238000003760 magnetic stirring Methods 0.000 description 2
- NUJOXMJBOLGQSY-UHFFFAOYSA-N manganese dioxide Chemical compound O=[Mn]=O NUJOXMJBOLGQSY-UHFFFAOYSA-N 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 150000007522 mineralic acids Chemical class 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 125000004108 n-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 2
- 125000004123 n-propyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])* 0.000 description 2
- XTEGVFVZDVNBPF-UHFFFAOYSA-N naphthalene-1,5-disulfonic acid Chemical compound C1=CC=C2C(S(=O)(=O)O)=CC=CC2=C1S(O)(=O)=O XTEGVFVZDVNBPF-UHFFFAOYSA-N 0.000 description 2
- 125000004433 nitrogen atom Chemical group N* 0.000 description 2
- 235000005985 organic acids Nutrition 0.000 description 2
- NFHFRUOZVGFOOS-UHFFFAOYSA-N palladium;triphenylphosphane Chemical compound [Pd].C1=CC=CC=C1P(C=1C=CC=CC=1)C1=CC=CC=C1.C1=CC=CC=C1P(C=1C=CC=CC=1)C1=CC=CC=C1.C1=CC=CC=C1P(C=1C=CC=CC=1)C1=CC=CC=C1.C1=CC=CC=C1P(C=1C=CC=CC=1)C1=CC=CC=C1 NFHFRUOZVGFOOS-UHFFFAOYSA-N 0.000 description 2
- 150000002978 peroxides Chemical class 0.000 description 2
- 150000004965 peroxy acids Chemical class 0.000 description 2
- 239000003444 phase transfer catalyst Substances 0.000 description 2
- QCCDLTOVEPVEJK-UHFFFAOYSA-N phenylacetone Chemical compound CC(=O)CC1=CC=CC=C1 QCCDLTOVEPVEJK-UHFFFAOYSA-N 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 235000021317 phosphate Nutrition 0.000 description 2
- 150000008300 phosphoramidites Chemical class 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- ZWLUXSQADUDCSB-UHFFFAOYSA-N phthalaldehyde Chemical compound O=CC1=CC=CC=C1C=O ZWLUXSQADUDCSB-UHFFFAOYSA-N 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 239000011148 porous material Substances 0.000 description 2
- 229910052700 potassium Inorganic materials 0.000 description 2
- 239000011591 potassium Substances 0.000 description 2
- 235000015320 potassium carbonate Nutrition 0.000 description 2
- KRIOVPPHQSLHCZ-UHFFFAOYSA-N propiophenone Chemical compound CCC(=O)C1=CC=CC=C1 KRIOVPPHQSLHCZ-UHFFFAOYSA-N 0.000 description 2
- 229940107700 pyruvic acid Drugs 0.000 description 2
- 150000003242 quaternary ammonium salts Chemical class 0.000 description 2
- LOUPRKONTZGTKE-LHHVKLHASA-N quinidine Chemical compound C([C@H]([C@H](C1)C=C)C2)C[N@@]1[C@H]2[C@@H](O)C1=CC=NC2=CC=C(OC)C=C21 LOUPRKONTZGTKE-LHHVKLHASA-N 0.000 description 2
- 239000012429 reaction media Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 102220327423 rs148273392 Human genes 0.000 description 2
- 102220285426 rs1553646358 Human genes 0.000 description 2
- 102220013611 rs199972656 Human genes 0.000 description 2
- 238000007423 screening assay Methods 0.000 description 2
- 125000002914 sec-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N serine Chemical compound OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 229910052708 sodium Inorganic materials 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 235000017557 sodium bicarbonate Nutrition 0.000 description 2
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 2
- 239000007921 spray Substances 0.000 description 2
- 238000005507 spraying Methods 0.000 description 2
- 230000000707 stereoselective effect Effects 0.000 description 2
- WPLOVIFNBMNBPD-ATHMIXSHSA-N subtilin Chemical compound CC1SCC(NC2=O)C(=O)NC(CC(N)=O)C(=O)NC(C(=O)NC(CCCCN)C(=O)NC(C(C)CC)C(=O)NC(=C)C(=O)NC(CCCCN)C(O)=O)CSC(C)C2NC(=O)C(CC(C)C)NC(=O)C1NC(=O)C(CCC(N)=O)NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C1NC(=O)C(=C/C)/NC(=O)C(CCC(N)=O)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)CNC(=O)C(NC(=O)C(NC(=O)C2NC(=O)CNC(=O)C3CCCN3C(=O)C(NC(=O)C3NC(=O)C(CC(C)C)NC(=O)C(=C)NC(=O)C(CCC(O)=O)NC(=O)C(NC(=O)C(CCCCN)NC(=O)C(N)CC=4C5=CC=CC=C5NC=4)CSC3)C(C)SC2)C(C)C)C(C)SC1)CC1=CC=CC=C1 WPLOVIFNBMNBPD-ATHMIXSHSA-N 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- XOAAWQZATWQOTB-UHFFFAOYSA-N taurine Chemical compound NCCS(O)(=O)=O XOAAWQZATWQOTB-UHFFFAOYSA-N 0.000 description 2
- 150000003512 tertiary amines Chemical class 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- RIOQSEWOXXDEQQ-UHFFFAOYSA-N triphenylphosphine Chemical compound C1=CC=CC=C1P(C=1C=CC=CC=1)C1=CC=CC=C1 RIOQSEWOXXDEQQ-UHFFFAOYSA-N 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- DZGWFCGJZKJUFP-UHFFFAOYSA-N tyramine Chemical compound NCCC1=CC=C(O)C=C1 DZGWFCGJZKJUFP-UHFFFAOYSA-N 0.000 description 2
- 238000005292 vacuum distillation Methods 0.000 description 2
- 235000019158 vitamin B6 Nutrition 0.000 description 2
- 239000011726 vitamin B6 Substances 0.000 description 2
- RQEUFEKYXDPUSK-SSDOTTSWSA-N (1R)-1-phenylethanamine Chemical compound C[C@@H](N)C1=CC=CC=C1 RQEUFEKYXDPUSK-SSDOTTSWSA-N 0.000 description 1
- RQEUFEKYXDPUSK-ZETCQYMHSA-N (1S)-1-phenylethanamine Chemical class C[C@H](N)C1=CC=CC=C1 RQEUFEKYXDPUSK-ZETCQYMHSA-N 0.000 description 1
- ASWBNKHCZGQVJV-UHFFFAOYSA-N (3-hexadecanoyloxy-2-hydroxypropyl) 2-(trimethylazaniumyl)ethyl phosphate Chemical compound CCCCCCCCCCCCCCCC(=O)OCC(O)COP([O-])(=O)OCC[N+](C)(C)C ASWBNKHCZGQVJV-UHFFFAOYSA-N 0.000 description 1
- MIOPJNTWMNEORI-GMSGAONNSA-N (S)-camphorsulfonic acid Chemical compound C1C[C@@]2(CS(O)(=O)=O)C(=O)C[C@@H]1C2(C)C MIOPJNTWMNEORI-GMSGAONNSA-N 0.000 description 1
- UWYVPFMHMJIBHE-OWOJBTEDSA-N (e)-2-hydroxybut-2-enedioic acid Chemical compound OC(=O)\C=C(\O)C(O)=O UWYVPFMHMJIBHE-OWOJBTEDSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- JRZGPXSSNPTNMA-UHFFFAOYSA-N 1,2,3,4-tetrahydronaphthalen-1-amine Chemical compound C1=CC=C2C(N)CCCC2=C1 JRZGPXSSNPTNMA-UHFFFAOYSA-N 0.000 description 1
- LCGFVWKNXLRFIF-UHFFFAOYSA-N 1,2,3,4-tetrahydronaphthalen-2-amine Chemical compound C1=CC=C2CC(N)CCC2=C1 LCGFVWKNXLRFIF-UHFFFAOYSA-N 0.000 description 1
- MLYCFWZIAJAIGW-UHFFFAOYSA-N 1-(2,5-dimethoxy-4-methylphenyl)butan-2-amine Chemical compound CCC(N)CC1=CC(OC)=C(C)C=C1OC MLYCFWZIAJAIGW-UHFFFAOYSA-N 0.000 description 1
- UFIJNKLFLAOSDU-UHFFFAOYSA-N 1-(2,5-dimethoxy-4-methylphenyl)butan-2-one Chemical compound CCC(=O)CC1=CC(OC)=C(C)C=C1OC UFIJNKLFLAOSDU-UHFFFAOYSA-N 0.000 description 1
- WYECURVXVYPVAT-UHFFFAOYSA-N 1-(4-bromophenyl)ethanone Chemical compound CC(=O)C1=CC=C(Br)C=C1 WYECURVXVYPVAT-UHFFFAOYSA-N 0.000 description 1
- WKPWFAZJGVXPCH-UHFFFAOYSA-N 1-(4-bromophenyl)propan-1-amine Chemical compound CCC(N)C1=CC=C(Br)C=C1 WKPWFAZJGVXPCH-UHFFFAOYSA-N 0.000 description 1
- UOMOSYFPKGQIKI-UHFFFAOYSA-N 1-(4-bromophenyl)propan-1-one Chemical compound CCC(=O)C1=CC=C(Br)C=C1 UOMOSYFPKGQIKI-UHFFFAOYSA-N 0.000 description 1
- WLNPAEJYFNAKKH-UHFFFAOYSA-N 1-(4-nitrophenyl)propan-1-amine Chemical compound CCC(N)C1=CC=C([N+]([O-])=O)C=C1 WLNPAEJYFNAKKH-UHFFFAOYSA-N 0.000 description 1
- QHTSEJJUUBOESF-UHFFFAOYSA-N 1-(4-nitrophenyl)propan-1-one Chemical compound CCC(=O)C1=CC=C([N+]([O-])=O)C=C1 QHTSEJJUUBOESF-UHFFFAOYSA-N 0.000 description 1
- JFNGTRVLHDCFOX-UHFFFAOYSA-N 1-(5-fluoro-2-methoxyphenyl)ethanamine Chemical compound COC1=CC=C(F)C=C1C(C)N JFNGTRVLHDCFOX-UHFFFAOYSA-N 0.000 description 1
- MLBHFBKZUPLWBD-UHFFFAOYSA-N 1-[3-(trifluoromethyl)phenyl]-2-propanamine Chemical compound CC(N)CC1=CC=CC(C(F)(F)F)=C1 MLBHFBKZUPLWBD-UHFFFAOYSA-N 0.000 description 1
- UBTPNKXHYILGJU-UHFFFAOYSA-N 1-[3-(trifluoromethyl)phenyl]propan-1-one Chemical compound CCC(=O)C1=CC=CC(C(F)(F)F)=C1 UBTPNKXHYILGJU-UHFFFAOYSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- GFAZHVHNLUBROE-UHFFFAOYSA-N 1-hydroxybutan-2-one Chemical compound CCC(=O)CO GFAZHVHNLUBROE-UHFFFAOYSA-N 0.000 description 1
- WTKIGCDTNYVOMI-UHFFFAOYSA-N 1-methylperoxypropan-2-one Chemical compound COOCC(C)=O WTKIGCDTNYVOMI-UHFFFAOYSA-N 0.000 description 1
- KHSYYLCXQKCYQX-UHFFFAOYSA-N 1-naphthalen-2-ylethanamine Chemical compound C1=CC=CC2=CC(C(N)C)=CC=C21 KHSYYLCXQKCYQX-UHFFFAOYSA-N 0.000 description 1
- XHOXKVFLASIOJD-UHFFFAOYSA-N 1-phenylbutan-1-amine Chemical compound CCCC(N)C1=CC=CC=C1 XHOXKVFLASIOJD-UHFFFAOYSA-N 0.000 description 1
- GKDLTXYXODKDEA-UHFFFAOYSA-N 1-phenylbutan-2-one Chemical compound CCC(=O)CC1=CC=CC=C1 GKDLTXYXODKDEA-UHFFFAOYSA-N 0.000 description 1
- AQFLVLHRZFLDDV-UHFFFAOYSA-N 1-phenylpropan-1-amine Chemical compound CCC(N)C1=CC=CC=C1 AQFLVLHRZFLDDV-UHFFFAOYSA-N 0.000 description 1
- KWTSXDURSIMDCE-UHFFFAOYSA-N 1-phenylpropan-2-amine Chemical compound CC(N)CC1=CC=CC=C1 KWTSXDURSIMDCE-UHFFFAOYSA-N 0.000 description 1
- XHLHPRDBBAGVEG-UHFFFAOYSA-N 1-tetralone Chemical compound C1=CC=C2C(=O)CCCC2=C1 XHLHPRDBBAGVEG-UHFFFAOYSA-N 0.000 description 1
- XYPISWUKQGWYGX-UHFFFAOYSA-N 2,2,2-trifluoroethaneperoxoic acid Chemical compound OOC(=O)C(F)(F)F XYPISWUKQGWYGX-UHFFFAOYSA-N 0.000 description 1
- 125000004778 2,2-difluoroethyl group Chemical group [H]C([H])(*)C([H])(F)F 0.000 description 1
- XJEVHMGJSYVQBQ-UHFFFAOYSA-N 2,3-dihydro-1h-inden-1-amine Chemical compound C1=CC=C2C(N)CCC2=C1 XJEVHMGJSYVQBQ-UHFFFAOYSA-N 0.000 description 1
- UFBJCMHMOXMLKC-UHFFFAOYSA-N 2,4-dinitrophenol Chemical compound OC1=CC=C([N+]([O-])=O)C=C1[N+]([O-])=O UFBJCMHMOXMLKC-UHFFFAOYSA-N 0.000 description 1
- XNWFRZJHXBZDAG-UHFFFAOYSA-N 2-METHOXYETHANOL Chemical compound COCCO XNWFRZJHXBZDAG-UHFFFAOYSA-N 0.000 description 1
- JCBPETKZIGVZRE-UHFFFAOYSA-N 2-aminobutan-1-ol Chemical compound CCC(N)CO JCBPETKZIGVZRE-UHFFFAOYSA-N 0.000 description 1
- BKMMTJMQCTUHRP-UHFFFAOYSA-N 2-aminopropan-1-ol Chemical compound CC(N)CO BKMMTJMQCTUHRP-UHFFFAOYSA-N 0.000 description 1
- 125000001340 2-chloroethyl group Chemical group [H]C([H])(Cl)C([H])([H])* 0.000 description 1
- VFMPCBSRNCHHKO-UHFFFAOYSA-N 2-ethylcyclopentan-1-amine Chemical compound CCC1CCCC1N VFMPCBSRNCHHKO-UHFFFAOYSA-N 0.000 description 1
- 125000000954 2-hydroxyethyl group Chemical group [H]C([*])([H])C([H])([H])O[H] 0.000 description 1
- LFSAPCRASZRSKS-UHFFFAOYSA-N 2-methylcyclohexan-1-one Chemical compound CC1CCCCC1=O LFSAPCRASZRSKS-UHFFFAOYSA-N 0.000 description 1
- ZPVFWPFBNIEHGJ-UHFFFAOYSA-N 2-octanone Chemical compound CCCCCCC(C)=O ZPVFWPFBNIEHGJ-UHFFFAOYSA-N 0.000 description 1
- 239000001903 2-oxo-3-phenylpropanoic acid Substances 0.000 description 1
- NHQDETIJWKXCTC-UHFFFAOYSA-N 3-chloroperbenzoic acid Chemical compound OOC(=O)C1=CC=CC(Cl)=C1 NHQDETIJWKXCTC-UHFFFAOYSA-N 0.000 description 1
- QHKABHOOEWYVLI-UHFFFAOYSA-N 3-methyl-2-oxobutanoic acid Chemical compound CC(C)C(=O)C(O)=O QHKABHOOEWYVLI-UHFFFAOYSA-N 0.000 description 1
- JYDYHSHPBDZRPU-UHFFFAOYSA-N 3-methylcyclohexan-1-amine Chemical compound CC1CCCC(N)C1 JYDYHSHPBDZRPU-UHFFFAOYSA-N 0.000 description 1
- WTQZYHPAVNTISM-UHFFFAOYSA-N 4-(1-aminopropyl)phenol Chemical compound CCC(N)C1=CC=C(O)C=C1 WTQZYHPAVNTISM-UHFFFAOYSA-N 0.000 description 1
- WNTVTQIJPAFZEL-UHFFFAOYSA-N 4-(3-aminobutyl)phenol Chemical compound CC(N)CCC1=CC=C(O)C=C1 WNTVTQIJPAFZEL-UHFFFAOYSA-N 0.000 description 1
- CNPURSDMOWDNOQ-UHFFFAOYSA-N 4-methoxy-7h-pyrrolo[2,3-d]pyrimidin-2-amine Chemical compound COC1=NC(N)=NC2=C1C=CN2 CNPURSDMOWDNOQ-UHFFFAOYSA-N 0.000 description 1
- XHDJYQWGFIBCEP-UHFFFAOYSA-N 5-Chloro-1H-indole-2,3-dione Chemical compound ClC1=CC=C2NC(=O)C(=O)C2=C1 XHDJYQWGFIBCEP-UHFFFAOYSA-N 0.000 description 1
- SIHPGAYIYYGOIP-UHFFFAOYSA-N 5-methoxy-1,2,3,4-tetrahydronaphthalen-2-amine Chemical compound C1C(N)CCC2=C1C=CC=C2OC SIHPGAYIYYGOIP-UHFFFAOYSA-N 0.000 description 1
- SLXKOJJOQWFEFD-UHFFFAOYSA-N 6-aminohexanoic acid Chemical compound NCCCCCC(O)=O SLXKOJJOQWFEFD-UHFFFAOYSA-N 0.000 description 1
- GHBWNCFDSGAFIT-UHFFFAOYSA-N 6-chloro-5-fluoro-1h-indole-2,3-dione Chemical compound C1=C(Cl)C(F)=CC2=C1NC(=O)C2=O GHBWNCFDSGAFIT-UHFFFAOYSA-N 0.000 description 1
- XEAPZXNZOJGVCZ-UHFFFAOYSA-N 7-methoxy-3,4-dihydro-1h-naphthalen-2-one Chemical compound C1CC(=O)CC2=CC(OC)=CC=C21 XEAPZXNZOJGVCZ-UHFFFAOYSA-N 0.000 description 1
- 108010000700 Acetolactate synthase Proteins 0.000 description 1
- 241001453369 Achromobacter denitrificans Species 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Natural products OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 239000005711 Benzoic acid Substances 0.000 description 1
- 241000588779 Bordetella bronchiseptica Species 0.000 description 1
- 241000588780 Bordetella parapertussis Species 0.000 description 1
- CPELXLSAUQHCOX-UHFFFAOYSA-M Bromide Chemical compound [Br-] CPELXLSAUQHCOX-UHFFFAOYSA-M 0.000 description 1
- 241001148106 Brucella melitensis Species 0.000 description 1
- 241001453380 Burkholderia Species 0.000 description 1
- 241001136175 Burkholderia pseudomallei Species 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 125000003860 C1-C20 alkoxy group Chemical group 0.000 description 1
- WHLRMCHGXRMCOU-UHFFFAOYSA-N CC(C)(C1C2C1CC1)C1(CN=O)C2=O Chemical compound CC(C)(C1C2C1CC1)C1(CN=O)C2=O WHLRMCHGXRMCOU-UHFFFAOYSA-N 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- RKHJFVCZUCCCKR-HXUWFJFHSA-N Cc(cc1)cc([C@@]23NCCc4c2[nH]c(cc2C)c4cc2F)c1NC3=O Chemical compound Cc(cc1)cc([C@@]23NCCc4c2[nH]c(cc2C)c4cc2F)c1NC3=O RKHJFVCZUCCCKR-HXUWFJFHSA-N 0.000 description 1
- 241000588879 Chromobacterium violaceum Species 0.000 description 1
- 235000001258 Cinchona calisaya Nutrition 0.000 description 1
- 101710199851 Copy number protein Proteins 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- CKLJMWTZIZZHCS-UHFFFAOYSA-N D-OH-Asp Natural products OC(=O)C(N)CC(O)=O CKLJMWTZIZZHCS-UHFFFAOYSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 238000012270 DNA recombination Methods 0.000 description 1
- 241001302584 Escherichia coli str. K-12 substr. W3110 Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical compound [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 1
- 108090000698 Formate Dehydrogenases Proteins 0.000 description 1
- 101000727772 Homo sapiens Thiamine transporter 1 Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 108010093096 Immobilized Enzymes Proteins 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 241000588747 Klebsiella pneumoniae Species 0.000 description 1
- CKLJMWTZIZZHCS-UWTATZPHSA-N L-Aspartic acid Natural products OC(=O)[C@H](N)CC(O)=O CKLJMWTZIZZHCS-UWTATZPHSA-N 0.000 description 1
- 229930195714 L-glutamate Natural products 0.000 description 1
- 102000003855 L-lactate dehydrogenase Human genes 0.000 description 1
- 108700023483 L-lactate dehydrogenases Proteins 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 241000222722 Leishmania <genus> Species 0.000 description 1
- 241000222727 Leishmania donovani Species 0.000 description 1
- 239000006137 Luria-Bertani broth Substances 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- SBKRTALNRRAOJP-BWSIXKJUSA-N N-[(2S)-4-amino-1-[[(2S,3R)-1-[[(2S)-4-amino-1-oxo-1-[[(3S,6S,9S,12S,15R,18R,21S)-6,9,18-tris(2-aminoethyl)-15-benzyl-3-[(1R)-1-hydroxyethyl]-12-(2-methylpropyl)-2,5,8,11,14,17,20-heptaoxo-1,4,7,10,13,16,19-heptazacyclotricos-21-yl]amino]butan-2-yl]amino]-3-hydroxy-1-oxobutan-2-yl]amino]-1-oxobutan-2-yl]-6-methylheptanamide (6S)-N-[(2S)-4-amino-1-[[(2S,3R)-1-[[(2S)-4-amino-1-oxo-1-[[(3S,6S,9S,12S,15R,18R,21S)-6,9,18-tris(2-aminoethyl)-15-benzyl-3-[(1R)-1-hydroxyethyl]-12-(2-methylpropyl)-2,5,8,11,14,17,20-heptaoxo-1,4,7,10,13,16,19-heptazacyclotricos-21-yl]amino]butan-2-yl]amino]-3-hydroxy-1-oxobutan-2-yl]amino]-1-oxobutan-2-yl]-6-methyloctanamide sulfuric acid Polymers OS(O)(=O)=O.CC(C)CCCCC(=O)N[C@@H](CCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCN)C(=O)N[C@H]1CCNC(=O)[C@@H](NC(=O)[C@H](CCN)NC(=O)[C@H](CCN)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](Cc2ccccc2)NC(=O)[C@@H](CCN)NC1=O)[C@@H](C)O.CC[C@H](C)CCCCC(=O)N[C@@H](CCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCN)C(=O)N[C@H]1CCNC(=O)[C@@H](NC(=O)[C@H](CCN)NC(=O)[C@H](CCN)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](Cc2ccccc2)NC(=O)[C@@H](CCN)NC1=O)[C@@H](C)O SBKRTALNRRAOJP-BWSIXKJUSA-N 0.000 description 1
- HTLZVHNRZJPSMI-UHFFFAOYSA-N N-ethylpiperidine Chemical compound CCN1CCCCC1 HTLZVHNRZJPSMI-UHFFFAOYSA-N 0.000 description 1
- 239000007832 Na2SO4 Substances 0.000 description 1
- 101100030361 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) pph-3 gene Proteins 0.000 description 1
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 1
- 241001272808 Oceanicola granulosus HTCC2516 Species 0.000 description 1
- 241000247615 Oceanobacter sp. Species 0.000 description 1
- 241001546846 Oceanospirillum sp. Species 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 208000030852 Parasitic disease Diseases 0.000 description 1
- BHHGXPLMPWCGHP-UHFFFAOYSA-N Phenethylamine Chemical compound NCCC1=CC=CC=C1 BHHGXPLMPWCGHP-UHFFFAOYSA-N 0.000 description 1
- 241000223960 Plasmodium falciparum Species 0.000 description 1
- 241000223821 Plasmodium malariae Species 0.000 description 1
- 241001505293 Plasmodium ovale Species 0.000 description 1
- 241000223810 Plasmodium vivax Species 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 229920002582 Polyethylene Glycol 600 Polymers 0.000 description 1
- 108010093965 Polymyxin B Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- OFOBLEOULBTSOW-UHFFFAOYSA-N Propanedioic acid Natural products OC(=O)CC(O)=O OFOBLEOULBTSOW-UHFFFAOYSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 241000589776 Pseudomonas putida Species 0.000 description 1
- CEEQUQSGVRRXQI-UHFFFAOYSA-N Pyridoxal 5-phosphate monohydrate Chemical compound O.CC1=NC=C(COP(O)(O)=O)C(C=O)=C1O CEEQUQSGVRRXQI-UHFFFAOYSA-N 0.000 description 1
- 108010011939 Pyruvate Decarboxylase Proteins 0.000 description 1
- 241000589771 Ralstonia solanacearum Species 0.000 description 1
- 239000007868 Raney catalyst Substances 0.000 description 1
- 229910000564 Raney nickel Inorganic materials 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 241000589187 Rhizobium sp. Species 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 241000589196 Sinorhizobium meliloti Species 0.000 description 1
- PMZURENOXWZQFD-UHFFFAOYSA-L Sodium Sulfate Chemical compound [Na+].[Na+].[O-]S([O-])(=O)=O PMZURENOXWZQFD-UHFFFAOYSA-L 0.000 description 1
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-N Succinic acid Natural products OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 1
- 102100030104 Thiamine transporter 1 Human genes 0.000 description 1
- 241000223109 Trypanosoma cruzi Species 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 125000000218 acetic acid group Chemical group C(C)(=O)* 0.000 description 1
- UEYFKZOEGBKMKP-UHFFFAOYSA-N acetic acid;propan-2-amine Chemical compound CC(C)[NH3+].CC([O-])=O UEYFKZOEGBKMKP-UHFFFAOYSA-N 0.000 description 1
- YBCVMFKXIKNREZ-UHFFFAOYSA-N acoh acetic acid Chemical compound CC(O)=O.CC(O)=O YBCVMFKXIKNREZ-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 125000003172 aldehyde group Chemical group 0.000 description 1
- 150000001334 alicyclic compounds Chemical class 0.000 description 1
- 150000007824 aliphatic compounds Chemical class 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 150000001342 alkaline earth metals Chemical class 0.000 description 1
- 150000003973 alkyl amines Chemical class 0.000 description 1
- 125000003282 alkyl amino group Chemical group 0.000 description 1
- 125000005596 alkyl carboxamido group Chemical group 0.000 description 1
- 125000004390 alkyl sulfonyl group Chemical group 0.000 description 1
- 125000004414 alkyl thio group Chemical group 0.000 description 1
- DEDGUGJNLNLJSR-UHFFFAOYSA-N alpha-hydroxycinnamic acid Natural products OC(=O)C(O)=CC1=CC=CC=C1 DEDGUGJNLNLJSR-UHFFFAOYSA-N 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- 229960002684 aminocaproic acid Drugs 0.000 description 1
- 235000019270 ammonium chloride Nutrition 0.000 description 1
- 238000005349 anion exchange Methods 0.000 description 1
- 150000001450 anions Chemical class 0.000 description 1
- 239000012062 aqueous buffer Substances 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 229910052786 argon Inorganic materials 0.000 description 1
- 150000004982 aromatic amines Chemical class 0.000 description 1
- 125000005533 aryl carboxamido group Chemical group 0.000 description 1
- 125000004391 aryl sulfonyl group Chemical group 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 229960005070 ascorbic acid Drugs 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- SRSXLGNVWSONIS-UHFFFAOYSA-N benzenesulfonic acid Chemical compound OS(=O)(=O)C1=CC=CC=C1 SRSXLGNVWSONIS-UHFFFAOYSA-N 0.000 description 1
- 229940092714 benzenesulfonic acid Drugs 0.000 description 1
- 235000010233 benzoic acid Nutrition 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 230000002051 biphasic effect Effects 0.000 description 1
- 239000012455 biphasic mixture Substances 0.000 description 1
- 238000009835 boiling Methods 0.000 description 1
- 125000001246 bromo group Chemical group Br* 0.000 description 1
- 229940038698 brucella melitensis Drugs 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- KDYFGRWQOYBRFD-NUQCWPJISA-N butanedioic acid Chemical compound O[14C](=O)CC[14C](O)=O KDYFGRWQOYBRFD-NUQCWPJISA-N 0.000 description 1
- 125000000484 butyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- FFSAXUULYPJSKH-UHFFFAOYSA-N butyrophenone Chemical compound CCCC(=O)C1=CC=CC=C1 FFSAXUULYPJSKH-UHFFFAOYSA-N 0.000 description 1
- 159000000007 calcium salts Chemical class 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 125000002843 carboxylic acid group Chemical group 0.000 description 1
- 150000001767 cationic compounds Chemical class 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 230000003196 chaotropic effect Effects 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 239000013626 chemical specie Substances 0.000 description 1
- 125000004218 chloromethyl group Chemical group [H]C([H])(Cl)* 0.000 description 1
- 238000011097 chromatography purification Methods 0.000 description 1
- HNEGQIOMVPPMNR-IHWYPQMZSA-N citraconic acid Chemical compound OC(=O)C(/C)=C\C(O)=O HNEGQIOMVPPMNR-IHWYPQMZSA-N 0.000 description 1
- 235000015165 citric acid Nutrition 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 150000003983 crown ethers Chemical class 0.000 description 1
- 239000002739 cryptand Substances 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 238000006114 decarboxylation reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- LSXWFXONGKSEMY-UHFFFAOYSA-N di-tert-butyl peroxide Chemical compound CC(C)(C)OOC(C)(C)C LSXWFXONGKSEMY-UHFFFAOYSA-N 0.000 description 1
- 125000004663 dialkyl amino group Chemical group 0.000 description 1
- 125000004772 dichloromethyl group Chemical group [H]C(Cl)(Cl)* 0.000 description 1
- PQZTVWVYCLIIJY-UHFFFAOYSA-N diethyl(propyl)amine Chemical group CCCN(CC)CC PQZTVWVYCLIIJY-UHFFFAOYSA-N 0.000 description 1
- 125000001664 diethylamino group Chemical group [H]C([H])([H])C([H])([H])N(*)C([H])([H])C([H])([H])[H] 0.000 description 1
- 125000001028 difluoromethyl group Chemical group [H]C(F)(F)* 0.000 description 1
- SBZXBUIDTXKZTM-UHFFFAOYSA-N diglyme Chemical compound COCCOCCOC SBZXBUIDTXKZTM-UHFFFAOYSA-N 0.000 description 1
- 229940043279 diisopropylamine Drugs 0.000 description 1
- NLHWCTNYFFIPJT-UHFFFAOYSA-N disodium bis(trimethylsilyl)azanide Chemical compound [Na+].[Na+].C[Si](C)(C)[N-][Si](C)(C)C.C[Si](C)(C)[N-][Si](C)(C)C NLHWCTNYFFIPJT-UHFFFAOYSA-N 0.000 description 1
- CETRZFQIITUQQL-UHFFFAOYSA-N dmso dimethylsulfoxide Chemical compound CS(C)=O.CS(C)=O CETRZFQIITUQQL-UHFFFAOYSA-N 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- OLAMWIPURJGSKE-UHFFFAOYSA-N et2o diethylether Chemical compound CCOCC.CCOCC OLAMWIPURJGSKE-UHFFFAOYSA-N 0.000 description 1
- AFAXGSQYZLGZPG-UHFFFAOYSA-N ethanedisulfonic acid Chemical compound OS(=O)(=O)CCS(O)(=O)=O AFAXGSQYZLGZPG-UHFFFAOYSA-N 0.000 description 1
- CCIVGXIOQKPBKL-UHFFFAOYSA-M ethanesulfonate Chemical compound CCS([O-])(=O)=O CCIVGXIOQKPBKL-UHFFFAOYSA-M 0.000 description 1
- OCLXJTCGWSSVOE-UHFFFAOYSA-N ethanol etoh Chemical compound CCO.CCO OCLXJTCGWSSVOE-UHFFFAOYSA-N 0.000 description 1
- XYIBRDXRRQCHLP-UHFFFAOYSA-N ethyl acetoacetate Chemical compound CCOC(=O)CC(C)=O XYIBRDXRRQCHLP-UHFFFAOYSA-N 0.000 description 1
- SIVVHUQWDOGLJN-UHFFFAOYSA-N ethylsulfamic acid Chemical group CCNS(O)(=O)=O SIVVHUQWDOGLJN-UHFFFAOYSA-N 0.000 description 1
- OJCSPXHYDFONPU-UHFFFAOYSA-N etoac etoac Chemical compound CCOC(C)=O.CCOC(C)=O OJCSPXHYDFONPU-UHFFFAOYSA-N 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 239000010419 fine particle Substances 0.000 description 1
- 238000001917 fluorescence detection Methods 0.000 description 1
- 125000004216 fluoromethyl group Chemical group [H]C([H])(F)* 0.000 description 1
- 239000012458 free base Substances 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- 229940049906 glutamate Drugs 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 150000002367 halogens Chemical class 0.000 description 1
- 239000001307 helium Substances 0.000 description 1
- 229910052734 helium Inorganic materials 0.000 description 1
- SWQJXJOGLNCZEY-UHFFFAOYSA-N helium atom Chemical compound [He] SWQJXJOGLNCZEY-UHFFFAOYSA-N 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- NAQMVNRVTILPCV-UHFFFAOYSA-N hexane-1,6-diamine Chemical compound NCCCCCCN NAQMVNRVTILPCV-UHFFFAOYSA-N 0.000 description 1
- 238000004896 high resolution mass spectrometry Methods 0.000 description 1
- 238000012203 high throughput assay Methods 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- XMBWDFGMSWQBCA-UHFFFAOYSA-N hydrogen iodide Chemical compound I XMBWDFGMSWQBCA-UHFFFAOYSA-N 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-M hydroxide Chemical compound [OH-] XLYOFNOQVPJJNP-UHFFFAOYSA-M 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- XLSMFKSTNGKWQX-UHFFFAOYSA-N hydroxyacetone Chemical compound CC(=O)CO XLSMFKSTNGKWQX-UHFFFAOYSA-N 0.000 description 1
- 125000001841 imino group Chemical group [H]N=* 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 229910001411 inorganic cation Inorganic materials 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 239000011147 inorganic material Substances 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 125000002346 iodo group Chemical group I* 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- SYJRVVFAAIUVDH-UHFFFAOYSA-N ipa isopropanol Chemical compound CC(C)O.CC(C)O SYJRVVFAAIUVDH-UHFFFAOYSA-N 0.000 description 1
- 150000004715 keto acids Chemical class 0.000 description 1
- 108010045069 keyhole-limpet hemocyanin Proteins 0.000 description 1
- TYQCGQRIZGCHNB-JLAZNSOCSA-N l-ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(O)=C(O)C1=O TYQCGQRIZGCHNB-JLAZNSOCSA-N 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 239000004310 lactic acid Substances 0.000 description 1
- 235000014655 lactic acid Nutrition 0.000 description 1
- 229940040102 levulinic acid Drugs 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- VZCYOOQTPOCHFL-UPHRSURJSA-N maleic acid Chemical compound OC(=O)\C=C/C(O)=O VZCYOOQTPOCHFL-UPHRSURJSA-N 0.000 description 1
- 239000011976 maleic acid Substances 0.000 description 1
- 229940098895 maleic acid Drugs 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- COTNUBDHGSIOTA-UHFFFAOYSA-N meoh methanol Chemical compound OC.OC COTNUBDHGSIOTA-UHFFFAOYSA-N 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- CAAULPUQFIIOTL-UHFFFAOYSA-N methyl dihydrogen phosphate Chemical compound COP(O)(O)=O CAAULPUQFIIOTL-UHFFFAOYSA-N 0.000 description 1
- 125000000250 methylamino group Chemical group [H]N(*)C([H])([H])[H] 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 235000010755 mineral Nutrition 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- LPUQAYUQRXPFSQ-DFWYDOINSA-M monosodium L-glutamate Chemical compound [Na+].[O-]C(=O)[C@@H](N)CCC(O)=O LPUQAYUQRXPFSQ-DFWYDOINSA-M 0.000 description 1
- 235000013923 monosodium glutamate Nutrition 0.000 description 1
- 239000004223 monosodium glutamate Substances 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- ZUHZZVMEUAUWHY-UHFFFAOYSA-N n,n-dimethylpropan-1-amine Chemical compound CCCN(C)C ZUHZZVMEUAUWHY-UHFFFAOYSA-N 0.000 description 1
- 125000003136 n-heptyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000001280 n-hexyl group Chemical group C(CCCCC)* 0.000 description 1
- 125000000740 n-pentyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 229950006238 nadide Drugs 0.000 description 1
- KVBGVZZKJNLNJU-UHFFFAOYSA-N naphthalene-2-sulfonic acid Chemical compound C1=CC=CC2=CC(S(=O)(=O)O)=CC=C21 KVBGVZZKJNLNJU-UHFFFAOYSA-N 0.000 description 1
- 239000012299 nitrogen atmosphere Substances 0.000 description 1
- 229910052756 noble gas Inorganic materials 0.000 description 1
- 150000002835 noble gases Chemical class 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- IOQPZZOEVPZRBK-UHFFFAOYSA-N octan-1-amine Chemical compound CCCCCCCCN IOQPZZOEVPZRBK-UHFFFAOYSA-N 0.000 description 1
- NOUWNNABOUGTDQ-UHFFFAOYSA-N octane Chemical compound CCCCCCC[CH2+] NOUWNNABOUGTDQ-UHFFFAOYSA-N 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 150000001451 organic peroxides Chemical class 0.000 description 1
- KJIFKLIQANRMOU-UHFFFAOYSA-N oxidanium;4-methylbenzenesulfonate Chemical compound O.CC1=CC=C(S(O)(=O)=O)C=C1 KJIFKLIQANRMOU-UHFFFAOYSA-N 0.000 description 1
- 239000007800 oxidant agent Substances 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- VWMVAQHMFFZQGD-UHFFFAOYSA-N p-Hydroxybenzyl acetone Natural products CC(=O)CC1=CC=C(O)C=C1 VWMVAQHMFFZQGD-UHFFFAOYSA-N 0.000 description 1
- KQAOIKIZSJJTII-UHFFFAOYSA-N p-mercuribenzenesulfonic acid Chemical compound OS(=O)(=O)C1=CC=C([Hg])C=C1 KQAOIKIZSJJTII-UHFFFAOYSA-N 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- VLTRZXGMWDSKGL-UHFFFAOYSA-N perchloric acid Chemical class OCl(=O)(=O)=O VLTRZXGMWDSKGL-UHFFFAOYSA-N 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- IOLQWLOHKZENDW-UHFFFAOYSA-N phenylisobutylamine Chemical compound CCC(N)CC1=CC=CC=C1 IOLQWLOHKZENDW-UHFFFAOYSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- ABLZXFCXXLZCGV-UHFFFAOYSA-N phosphonic acid group Chemical group P(O)(O)=O ABLZXFCXXLZCGV-UHFFFAOYSA-N 0.000 description 1
- 150000004714 phosphonium salts Chemical class 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- OXNIZHLAWKMVMX-UHFFFAOYSA-N picric acid Chemical class OC1=C([N+]([O-])=O)C=C([N+]([O-])=O)C=C1[N+]([O-])=O OXNIZHLAWKMVMX-UHFFFAOYSA-N 0.000 description 1
- PJGSXYOJTGTZAV-UHFFFAOYSA-N pinacolone Chemical compound CC(=O)C(C)(C)C PJGSXYOJTGTZAV-UHFFFAOYSA-N 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 229940118768 plasmodium malariae Drugs 0.000 description 1
- 229920001983 poloxamer Polymers 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920000447 polyanionic polymer Polymers 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 229960003548 polymyxin b sulfate Drugs 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- XAEFZNCEHLXOMS-UHFFFAOYSA-M potassium benzoate Chemical compound [K+].[O-]C(=O)C1=CC=CC=C1 XAEFZNCEHLXOMS-UHFFFAOYSA-M 0.000 description 1
- 235000011181 potassium carbonates Nutrition 0.000 description 1
- 239000012286 potassium permanganate Substances 0.000 description 1
- 229910000160 potassium phosphate Inorganic materials 0.000 description 1
- 235000011009 potassium phosphates Nutrition 0.000 description 1
- 238000009700 powder processing Methods 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- ISYORFGKSZLPNW-UHFFFAOYSA-N propan-2-ylazanium;chloride Chemical compound [Cl-].CC(C)[NH3+] ISYORFGKSZLPNW-UHFFFAOYSA-N 0.000 description 1
- 239000001294 propane Substances 0.000 description 1
- 235000019260 propionic acid Nutrition 0.000 description 1
- HLIBNTOXKQCYMV-UHFFFAOYSA-N propylsulfamic acid Chemical compound CCCNS(O)(=O)=O HLIBNTOXKQCYMV-UHFFFAOYSA-N 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 239000012460 protein solution Substances 0.000 description 1
- IUVKMZGDUIUOCP-BTNSXGMBSA-N quinbolone Chemical compound O([C@H]1CC[C@H]2[C@H]3[C@@H]([C@]4(C=CC(=O)C=C4CC3)C)CC[C@@]21C)C1=CCCC1 IUVKMZGDUIUOCP-BTNSXGMBSA-N 0.000 description 1
- 229960001404 quinidine Drugs 0.000 description 1
- 229960000948 quinine Drugs 0.000 description 1
- NJGBTKGETPDVIK-UHFFFAOYSA-N raspberry ketone Chemical compound CC(=O)CCC1=CC=C(O)C=C1 NJGBTKGETPDVIK-UHFFFAOYSA-N 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000004007 reversed phase HPLC Methods 0.000 description 1
- 239000010948 rhodium Substances 0.000 description 1
- MHOVAHRLVXNVSD-UHFFFAOYSA-N rhodium atom Chemical compound [Rh] MHOVAHRLVXNVSD-UHFFFAOYSA-N 0.000 description 1
- 229910001927 ruthenium tetroxide Inorganic materials 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- BHRZNVHARXXAHW-UHFFFAOYSA-N sec-butylamine Chemical compound CCC(C)N BHRZNVHARXXAHW-UHFFFAOYSA-N 0.000 description 1
- 150000003335 secondary amines Chemical class 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 1
- 159000000000 sodium salts Chemical class 0.000 description 1
- 229910052938 sodium sulfate Inorganic materials 0.000 description 1
- 235000011152 sodium sulphate Nutrition 0.000 description 1
- WGRULTCAYDOGQK-UHFFFAOYSA-M sodium;sodium;hydroxide Chemical compound [OH-].[Na].[Na+] WGRULTCAYDOGQK-UHFFFAOYSA-M 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 238000001694 spray drying Methods 0.000 description 1
- 238000012289 standard assay Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- IIACRCGMVDHOTQ-UHFFFAOYSA-N sulfamic acid group Chemical class S(N)(O)(=O)=O IIACRCGMVDHOTQ-UHFFFAOYSA-N 0.000 description 1
- 125000000020 sulfo group Chemical group O=S(=O)([*])O[H] 0.000 description 1
- 125000000542 sulfonic acid group Chemical group 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 235000011149 sulphuric acid Nutrition 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 229920002994 synthetic fiber Polymers 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 229960003080 taurine Drugs 0.000 description 1
- 150000005621 tetraalkylammonium salts Chemical class 0.000 description 1
- VDZOOKBUILJEDG-UHFFFAOYSA-M tetrabutylammonium hydroxide Chemical compound [OH-].CCCC[N+](CCCC)(CCCC)CCCC VDZOOKBUILJEDG-UHFFFAOYSA-M 0.000 description 1
- YLQBMQCUIZJEEH-UHFFFAOYSA-N tetrahydrofuran Natural products C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 1
- WHRNULOCNSKMGB-UHFFFAOYSA-N tetrahydrofuran thf Chemical compound C1CCOC1.C1CCOC1 WHRNULOCNSKMGB-UHFFFAOYSA-N 0.000 description 1
- OSBSFAARYOCBHB-UHFFFAOYSA-N tetrapropylammonium Chemical compound CCC[N+](CCC)(CCC)CCC OSBSFAARYOCBHB-UHFFFAOYSA-N 0.000 description 1
- PHCBRBWANGJMHS-UHFFFAOYSA-J tetrasodium;disulfate Chemical compound [Na+].[Na+].[Na+].[Na+].[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O PHCBRBWANGJMHS-UHFFFAOYSA-J 0.000 description 1
- WROMPOXWARCANT-UHFFFAOYSA-N tfa trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F.OC(=O)C(F)(F)F WROMPOXWARCANT-UHFFFAOYSA-N 0.000 description 1
- 208000006446 thiamine-responsive megaloblastic anemia syndrome Diseases 0.000 description 1
- BRNULMACUQOKMR-UHFFFAOYSA-N thiomorpholine Chemical compound C1CSCCN1 BRNULMACUQOKMR-UHFFFAOYSA-N 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 229910052723 transition metal Inorganic materials 0.000 description 1
- 150000003624 transition metals Chemical class 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 125000005270 trialkylamine group Chemical group 0.000 description 1
- IMFACGCPASFAPR-UHFFFAOYSA-N tributylamine Chemical group CCCCN(CCCC)CCCC IMFACGCPASFAPR-UHFFFAOYSA-N 0.000 description 1
- 125000003866 trichloromethyl group Chemical group ClC(Cl)(Cl)* 0.000 description 1
- GKASDNZWUGIAMG-UHFFFAOYSA-N triethyl orthoformate Chemical compound CCOC(OCC)OCC GKASDNZWUGIAMG-UHFFFAOYSA-N 0.000 description 1
- YFNKIDBQEZZDLK-UHFFFAOYSA-N triglyme Chemical compound COCCOCCOCCOC YFNKIDBQEZZDLK-UHFFFAOYSA-N 0.000 description 1
- 239000012137 tryptone Substances 0.000 description 1
- 229960003732 tyramine Drugs 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 229910052720 vanadium Inorganic materials 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/10—Nitrogen as only ring hetero atom
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07D—HETEROCYCLIC COMPOUNDS
- C07D209/00—Heterocyclic compounds containing five-membered rings, condensed with other rings, with one nitrogen atom as the only ring hetero atom
- C07D209/02—Heterocyclic compounds containing five-membered rings, condensed with other rings, with one nitrogen atom as the only ring hetero atom condensed with one carbocyclic ring
- C07D209/04—Indoles; Hydrogenated indoles
- C07D209/10—Indoles; Hydrogenated indoles with substituted hydrocarbon radicals attached to carbon atoms of the hetero ring
- C07D209/12—Radicals substituted by oxygen atoms
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07D—HETEROCYCLIC COMPOUNDS
- C07D209/00—Heterocyclic compounds containing five-membered rings, condensed with other rings, with one nitrogen atom as the only ring hetero atom
- C07D209/02—Heterocyclic compounds containing five-membered rings, condensed with other rings, with one nitrogen atom as the only ring hetero atom condensed with one carbocyclic ring
- C07D209/04—Indoles; Hydrogenated indoles
- C07D209/10—Indoles; Hydrogenated indoles with substituted hydrocarbon radicals attached to carbon atoms of the hetero ring
- C07D209/14—Radicals substituted by nitrogen atoms, not forming part of a nitro radical
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07D—HETEROCYCLIC COMPOUNDS
- C07D209/00—Heterocyclic compounds containing five-membered rings, condensed with other rings, with one nitrogen atom as the only ring hetero atom
- C07D209/02—Heterocyclic compounds containing five-membered rings, condensed with other rings, with one nitrogen atom as the only ring hetero atom condensed with one carbocyclic ring
- C07D209/04—Indoles; Hydrogenated indoles
- C07D209/30—Indoles; Hydrogenated indoles with hetero atoms or with carbon atoms having three bonds to hetero atoms with at the most one bond to halogen, directly attached to carbon atoms of the hetero ring
- C07D209/32—Oxygen atoms
- C07D209/34—Oxygen atoms in position 2
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07D—HETEROCYCLIC COMPOUNDS
- C07D209/00—Heterocyclic compounds containing five-membered rings, condensed with other rings, with one nitrogen atom as the only ring hetero atom
- C07D209/02—Heterocyclic compounds containing five-membered rings, condensed with other rings, with one nitrogen atom as the only ring hetero atom condensed with one carbocyclic ring
- C07D209/04—Indoles; Hydrogenated indoles
- C07D209/30—Indoles; Hydrogenated indoles with hetero atoms or with carbon atoms having three bonds to hetero atoms with at the most one bond to halogen, directly attached to carbon atoms of the hetero ring
- C07D209/32—Oxygen atoms
- C07D209/38—Oxygen atoms in positions 2 and 3, e.g. isatin
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07D—HETEROCYCLIC COMPOUNDS
- C07D405/00—Heterocyclic compounds containing both one or more hetero rings having oxygen atoms as the only ring hetero atoms, and one or more rings having nitrogen as the only ring hetero atom
- C07D405/02—Heterocyclic compounds containing both one or more hetero rings having oxygen atoms as the only ring hetero atoms, and one or more rings having nitrogen as the only ring hetero atom containing two hetero rings
- C07D405/06—Heterocyclic compounds containing both one or more hetero rings having oxygen atoms as the only ring hetero atoms, and one or more rings having nitrogen as the only ring hetero atom containing two hetero rings linked by a carbon chain containing only aliphatic carbon atoms
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07D—HETEROCYCLIC COMPOUNDS
- C07D471/00—Heterocyclic compounds containing nitrogen atoms as the only ring hetero atoms in the condensed system, at least one ring being a six-membered ring with one nitrogen atom, not provided for by groups C07D451/00 - C07D463/00
- C07D471/12—Heterocyclic compounds containing nitrogen atoms as the only ring hetero atoms in the condensed system, at least one ring being a six-membered ring with one nitrogen atom, not provided for by groups C07D451/00 - C07D463/00 in which the condensed system contains three hetero rings
- C07D471/20—Spiro-condensed systems
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1096—Transferases (2.) transferring nitrogenous groups (2.6)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/52—Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Nitrogen Condensed Heterocyclic Rings (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Indole Compounds (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
Un proceso para preparar un compuesto de fórmula (II) o una de sus sales o solvatos o hidratos,**Fórmula** que comprende transaminar enzimáticamente un compuesto de fórmula (I) a un compuesto de fórmula (II), o una de sus sales, solvatos o hidratos, donde la enzima es SEQ ID NO: 134,**Fórmula** R4 y R7 son cada uno, independientemente, H o -Cl; R5 es H, -OH, -CH3, -OCH3, -F, -Cl, -CF3 o -CN; R6 es H, -OH, -OCH3, -F o -Cl; R8 es H, -CH3, -CH2CH3, -CH2OH, -CO2H, -CO2CH3, -CO2CH2CH3 o -CF3.
Description
DESCRIPCIÓN
Procesos químicos para preparar espiroindolonas y compuestos intermedios correspondientes
Referencia a la lista de secuencias, tabla o programa informático
La copia oficial de la Lista de secuencias se presenta conjuntamente con la memoria como un archivo de texto en formato ASCII a través de EFS-Web, con el nombre de archivo "PAT055051_seql2.txt", fecha de creación 22 de marzo de 2013 y un tamaño de 447 kilobytes. La Lista de secuencias presentada a través de EFS-Web es parte de la memoria y se incorpora en este documento por referencia en su totalidad.
Estado anterior de la técnica
Se conocen (1 ’R,3'S)-5,7'-dicloro-6'-fluoro-3’-metil-2’,3 ’,4 ’,9 ’-tetrahidroespiro[indolina-3,1 ’-pirído[3,4-b]indol]-2-ona (por ejemplo, un compuesto de fórmula (IV), que comprende una molécula espiroindolona) y un método de síntesis de 6 pasos para prepararla, que incluye un compuesto intermedio amina quiral conocida (IIA) (WO 2009/132921):
La presente invención se refiere a un método mejorado para la síntesis de compuestos espiroindolona, en particular, (1 R ,3 ’S)-5,7’-dicloro-6'-fluoro-3’-metil-2',3’,4 ',9’-tetrahidroespiro[indolina-3,1 ’-pirido[3,4-b]indol]-2-ona, y compuestos intermedios utilizados en el método mejorado.
En una primera realización, la invención es un proceso para preparar un compuesto de fórmula (II), o una de sus sales o solvatos o hidratos,
sus sales, solvatos o hidratos, donde la enzima es SEQ ID NO: 134,
(I)
donde:
o
R4 y R7 son cada uno, independientemente, H o -Cl;
R5 es H, -OH, -CHs, -OCH3, -F, -Cl, -CFs o -CN;
R6 es H, -OH, -OCHs, -F o -Cl;
R8 es H, -CHa, -CH2CH3, -CH2OH, -CO2H, -CO2CH3, -CO2CH2CH3 o -CFs.
En una segunda realización, la invención es un proceso para preparar un compuesto de fórmula (IIA), o una de sus sales o hidratos o solvatos,
(IIA)
que comprende transaminar enzimáticamente un compuesto de fórmula (IA) o una de sus sales o solvatos o hidratos,
(IA),
para proporcionar el compuesto de fórmula (IIA).
En una tercera realización, la invención es un proceso para preparar un compuesto de fórmula (IVA), o una de sus sales o solvatos o hidratos,
(IVA)
que comprende hacer reaccionar un compuesto de fórmula (IIIA) o una de sus sales o solvatos o hidratos,
(NIA)
con un compuesto de fórmula (IIA) o una de sus sales o solvatos o hidratos,
(NA)
para proporcionar el compuesto de fórmula (IVA) o una de sus sales o solvatos o hidratos,
en donde el compuesto de fórmula (IIA) se prepara mediante transaminación enzimática del compuesto de fórmula (IA), o una de sus sales o hidratos o solvatos,
y en donde la enzima es SEQ ID NO: 134.
En una cuarta realización la invención es el compuesto:
La invención se refiere a nuevos procesos, un nuevo paso del proceso y un nuevo compuesto intermedio útiles para la preparación de compuestos espiroindolona útiles para el tratamiento de enfermedades parasitarias, que comprenden, por ejemplo, una molécula espiroindolona como (1 R,3'S)-5,7'-dicloro-6'-fluoro-3'-metil-2',3',4',9'-tetrahidroespiro[indolina-3,1 ’-pirido[3,4-b]indol]-2-ona.
Antecedentes de la invención
La presente invención se refiere a procesos para la preparación de compuestos espiroindolona, como por ejemplo, (1 R,3 ’S)-5,7’-dicloro-6 ’-fluoro-3 ’-metil-2 ’,3 ’,4 ’,9 ’-tetrahidroespiro[indolina-3,1 ’-pirido[3,4-b]indol]-2-ona.
(1 R,3'S)-5,7'-dicloro-6’-fluoro-3’-metil-2’,3 ’,4 ’,9 ’-tetrahidroespiro[indolina-3,1 ’-pirído[3,4-b]indol]-2-ona es útil en el tratamiento y/o la prevención de infecciones como las causadas por Plasmodium falciparum, Plasmodium vivax, Plasmodium malariae, Plasmodium ovale, Trypanosoma cruzi y parásitos del género Leishmania genus como, por ejemplo, Leishmania donovani., y tiene la estructura siguiente:
(IVA)
(1 ’R,3 ’S)-5,7’-dicloro-6 ’-fluoro-3 ’-metil-2 ’,3 ’,4 ’,9 ’-tetrahidroespiro[indolina-3,1 ’-pirido[3,4-b]indol]-2-ona y una síntesis de la misma se describen en WO 2009/132921 A1 en particular en el Ejemplo 49 de ese documento.
Existe la necesidad de nuevos procesos para la preparación de (1 ’R,3'S)-5,7'-dicloro-6'-fluoro-3’-metil-2’,3 ’,4 ’,9 ’-tetrahidroespiro[indolina-3,1 ’-pirido[3,4-b]indol]-2-ona a fin de mejorar la eficiencia general de la síntesis para hacerla adecuada para la fabricación. En particular, existe la necesidad de aumentar la eficiencia de la síntesis del compuesto intermedio amina quiral (IIA):
(IIA).
Descripción detallada de la invención
Los procesos, de acuerdo con la presente divulgación, para producir compuestos espiroindolona, como los compuestos de acuerdo con la fórmula (IV), o una de sus sales, o hidratos o solvatos, y los compuestos intermedios, según se definen en este documento, se resumen en el Esquema 1.
Esquema 1
A saber, un compuesto de fórmula (I), o una de sus sales o hidratos o solvatos, se convierte en un compuesto de fórmula (II), o una de sus sales o hidratos o solvatos, de acuerdo con los métodos 1,2, 3, 4, 5 o 6 en donde
- el método 1 comprende
a) La transaminación enzimática para convertir un compuesto de fórmula (I), o una de sus sales o hidratos o solvatos, en un compuesto de fórmula (II), o una de sus sales o hidratos o solvatos
Un compuesto de fórmula (II), o una de sus sales, se puede convertir en un compuesto de fórmula (IV), o una de sus sales, por ejemplo, según se describe en WO 2009/132921 en particular según se describe en las reivindicaciones y los ejemplos pertinentes, que se incorporan por referencia en este documento.
La divulgación se refiere especialmente a los procesos descritos en cada sección. La divulgación se refiere asimismo, independientemente, a cada paso individual descrito en una secuencia del proceso en la sección correspondiente. Por lo tanto, la divulgación también se refiere a las realizaciones del proceso, de acuerdo con las cuales un compuesto que se puede obtener como compuesto intermedio en cualquier paso del proceso se utiliza como un material de partida.
La divulgación se refiere asimismo a nuevos materiales de partida que han sido desarrollados específicamente para la preparación de los compuestos de acuerdo con la invención, a su uso y a los procesos para su elaboración.
La divulgación también se refiere a compuestos intermedios que han sido desarrollados específicamente para la preparación de los compuestos de acuerdo con la invención, a su uso y a los procesos para su elaboración.
Se observa que en la presente solicitud, habitualmente las explicaciones proporcionadas en una sección también son aplicables en otras secciones, a menos que se indique lo contrario. Por ejemplo, las explicaciones para el residuo R1 en la fórmula (I) dadas en la sección A también aplican si la fórmula (I) aparece en otras secciones, como la Sección B, a menos que se indique lo contrario.
Sección A: Preparación de un compuesto de fórmula (I)
Un compuesto de fórmula (I), o una de sus sales o hidratos o solvatos, se puede preparar como se describe más
; o
Sección B: Conversión de un compuesto de fórmula (I) en un compuesto de fórmula (II).
En una primera realización, la invención es un proceso para preparar un compuesto de fórmula (II), o una de sus sales o solvatos o hidratos,
sus sales, solvatos o hidratos, donde la enzima es SEQ ID NO: 134,
donde:
o
R4 y R7 son cada uno, independientemente, H o -Cl;
R5 es H, -OH, -CHa, -OCHa, -F, -Cl, -CFa o -CN;
R6 es H, -OH, -OCHa, -F o -Cl;
R8 es H, -CHa, -CHaCHa, -CH2OH, -CO2H, -COaCHa, -COaCHaCHa o -CFa.
En una primera realización alternativa, la invención es un proceso para convertir un compuesto de fórmula (I) en un compuesto de fórmula (II), en donde, R5 y R6 son fluoro cuando: R8 es -CHa.
En una segunda realización alternativa, la invención es un proceso para convertir un compuesto de fórmula (I) en un compuesto de fórmula (II), en donde,R5 y R6 son fluoro y cloro, cuando: R8 es -CH3.
En una primera realización alternativa, la invención es un proceso para convertir un compuesto de fórmula (I) en un compuesto de fórmula (II), en donde, R5 y R6 son hidrógenoo cuando: R8 es -CH3.
En una cuarta realización alternativa, la invención es un proceso para convertir un compuesto de fórmula (I) en un compuesto de fórmula (II), en donde, R5 es fluoro cuando R6 es hidrógeno.
En una quinta realización alternativa, la invención es un proceso para convertir un compuesto de fórmula (I) en un compuesto de fórmula (II), en donde, el compuesto de fórmula (II) es de fórmula (IIA), o una de sus sales o solvatos o hidratos,
(IIA).
En una sexta realización alternativa, la invención es un proceso para convertir un compuesto de fórmula (I) en un compuesto de fórmula (II), en donde, el compuesto de fórmula (I) es un compuesto de fórmula (IA), o una de sus sales o hidratos o solvatos,
En otra realización, la invención es un proceso para preparar un compuesto de fórmula (IIA), o una de sus sales o hidratos o solvatos,
(IIA)
que comprende transaminar enzimáticamente un compuesto de fórmula (IA) o una de sus sales o solvatos o hidratos,
(IA).
para proporcionar el compuesto de fórmula (IIA).
Generalmente, la cetona, compuesto (I), se disuelve en un solvente orgánico, por ejemplo glicol, y se agrega a una mezcla acuosa de clorhidrato de isopropilamina y piridoxalfosfato, seguido de la adición de tampón TEA. Después se ajusta el pH hasta neutralidad con una base adecuada, por ejemplo NaOH, seguido de calentamiento y adición de la transaminasa. La reacción se deja en agitación a temperatura durante aproximadamente 24 h. El producto amina quiral sólida (compuesto de fórmula (II)) se aísla por medios conocidos por un experto en la materia y/o de acuerdo con los ejemplos 10-12.
En una realización de ejemplo, la enzima es SEQ ID NO: 134.
Sección C: Conversión de un compuesto de fórmula (II) en un compuesto de fórmula (IV).
En una tercera realización, la invención es un proceso para preparar un compuesto de fórmula (IVA), o una de sus sales o solvatos o hidratos,
(IVA)
que comprende hacer reaccionar un compuesto de fórmula (IIIA) o una de sus sales o solvatos o hidratos,
(NIA)
con un compuesto de fórmula (II) o una de sus sales o solvatos o hidratos,
(NA)
para proporcionar el compuesto de fórmula (IVA) o una de sus sales o solvatos o hidratos,
en donde el compuesto de fórmula (IIA) se prepara mediante transaminación enzimática del compuesto de fórmula (IA), o una de sus sales o hidratos o solvatos,
y en donde la enzima es SEQ ID NO: 134.
En una realización alternativa, la invención es un proceso para preparar un compuesto de fórmula (IVA) en donde, el compuesto de fórmula (IIA) se convierte en una sal de fórmula (IIB):
(IIB)
antes de la reacción con el compuesto de fórmula (IIIA).
De acuerdo con la invención, la enzima es SEQ ID NO: 134.
En otra realización alternativa, la invención es un proceso para preparar un compuesto de fórmula (IVA) en donde la reacción se lleva a cabo en condiciones básicas.
En una realización alternativa, la invención es un proceso para preparar un compuesto de fórmula (IVA) en donde la reacción se lleva a cabo en presencia de trietilamina.
En una realización alternativa, la invención es un proceso para preparar un compuesto de fórmula (IVA) en donde el compuesto de fórmula (IVA) se aísla como una sal de fórmula (IVB):
(IVB).
En una realización alternativa, la invención es un proceso para preparar un compuesto de fórmula (IVA) en donde la sal de fórmula (IVB) se convierte en el compuesto de fórmula (IVA) en base libre.
En una realización alternativa, la invención es un proceso para preparar un compuesto de fórmula (IVA) en donde la sal de fórmula (IVB) se convierte en el compuesto de fórmula (IVA) en base libre con carbonato de sodio.
En una realización alternativa, la invención es un proceso para preparar un compuesto de fórmula (IVA) en donde el compuesto de fórmula (IVA) es un hidrato.
En una realización alternativa, la invención es un proceso para preparar un compuesto de fórmula (IVA) en donde el compuesto de fórmula (IVA) es un / hidrato.
En una realización alternativa, la invención es un proceso para preparar un compuesto de fórmula (IVA) / hidrato en donde el compuesto de fórmula (IVA) / hidrato se muele después del aislamiento.
Sección D: Uso de los compuestos nuevos e inventivos de fórmula (IC).
En otra realización, la invención es un compuesto de fórmula (I), en donde el compuesto es de fórmula (IA):
o una de sus sales o hidratos o solvatos farmacéuticamente aceptables.
Sección I: Términos generales
A continuación se listan las definiciones de varios términos utilizados para describir los nuevos compuestos intermedios y los pasos de síntesis de la presente invención. Estas definiciones, ya sea reemplazando una, más de una, o todas las expresiones o los símbolos generales utilizados en la presente divulgación y, por lo tanto, dando lugar a realizaciones de la invención, se aplican en particular a los términos tal como se usan en toda la memoria a menos que se definan de otra manera en instancias específicas ya sea individualmente o como parte de un grupo más grande. Por lo tanto, las definiciones generales utilizadas antes y más adelante, a menos que se definan de manera diferente, tienen los significados siguientes:
El término "C1-C20-" define un resto con hasta y como máximo 20, especialmente hasta y como máximo 7 átomos de carbono, donde dicho resto puede ser de cadena ramificada (una o más veces) o lineal y unido través de un carbono terminal o no terminal.
Alquilo como un radical o como parte de un radical es una cadena de carbonos lineal o ramificada (una o, si se desea y es posible, más veces), y es especialmente alquilo C1-C7, alquilo C1-C4, en particular alquilo C1-C4 ramificado, como isopropilo. Los términos "inferior" o "C1-C7-" definen un resto con hasta y como máximo 7, especialmente hasta y como máximo 4 átomos de carbono, donde dicho resto puede ser de cadena ramificada (una o más veces) o lineal y unido a través de un carbono terminal o no terminal. Alquilo inferior o alquilo C1-C7, por ejemplo, es n-pentilo, n-hexilo o n
heptilo o preferentemente alquilo C1-C4, especialmente como metilo, etilo, n-propilo, iso-propilo, n-butilo, ¡sobutilo, secbutilo, tert-butilo, en particular metilo, etilo, n-propilo, iso-propilo, n-butilo, isobutilo, sec-butilo, tert-butilo; preferentemente metilo.
Alquilamino y dialquilamino se refieren a alquil-NH- y (alquil^N-, respectivamente, en donde el alquilo puede ser lineal o ramificado. El grupo alquilo, por ejemplo, contiene de 1 a 7, y en particular de 1 a 4 átomos de C. Algunos ejemplos son metilamino, dimetilamino, etilamino y dietilamino; preferentemente metilamino.
Halo o halógeno es preferentemente fluoro, cloro, bromo o yodo, preferentemente fluoro o cloro; cuando se menciona halo como un sustituyente, cuando sea posible, pueden estar presentes uno o más (por ejemplo, hasta tres o uno) átomos de halógeno, por ejemplo, en halo-alquilo C1-C7, como trifluorometilo, 2 ,2-difluoroetilo o 2 ,2 ,2-trifluoroetilo. Halo-alquilo C1-C7 puede ser lineal o ramificado y en particular contiene 1 a 4 átomos de C, por ejemplo, 1 o 2 átomos de C. Los ejemplos son fluorometilo, difluorometilo, trifluorometilo, clorometilo, diclorometilo, triclorometilo, 2-cloroetilo y 2 ,2 ,2-trifluoroetilo; preferentemente trifluorometilo.
Alcoxi, como un radical o parte de un radical, se refiere a -O-alquilo, en donde el término alquilo es el definido en este documento, e incluye, por ejemplo, alcoxi C1-C20 (-O-alquilo C1-C20), preferentemente alcoxi C1-C7 (-O-alquilo C1-C7). En particular, alcoxi incluye, por ejemplo, radicales metoxi, etoxi, n-propiloxi, isopropiloxi, n-butiloxi, isobutiloxi, secbutiloxi, tert-butiloxi, pentiloxi, hexiloxi y heptiloxi; preferentemente metoxi.
La expresión "base ópticamente activa" describe, por ejemplo, aminas quirales, preferentemente aminas terciarias quirales, más preferentemente alcaloides de cinchona, como quinidina y quinina, muy preferentemente alcaloides de cinchona modificados. Los ejemplos de dichos alcaloides de cinchona modificados se detallan, por ejemplo, en Tian, S.-K.; Chen, Y.; Hang, J.; Tang, L.; McDiad, P.; Deng, L. Acc. Chem. Res. 2004, 37, 621-631 y las referencias citadas en este documento.
La expresión "catalizador de transferencia de fase" según se usa en este documento se refiere a una cantidad catalítica de un agente químico que aumenta la velocidad de una reacción entre especies químicas ubicadas en fases diferentes (por ejemplo, líquidos inmiscibles o sólido y líquido), mediante extracción de uno de los reactivos, muy comúnmente un anión, a través de la interfase hacia la otra fase. Estos catalizadores incluyen sales de amonio cuaternario o fosfonio (por ejemplo, sales de tetraalquilamonio, en las que el alquilo puede ser el mismo o diferente), o agentes que forman complejos con cationes inorgánicos (por ejemplo, éteres corona u otros criptandos). El catión catalizador no se consume en la reacción aunque ocurre un intercambio aniónico. En particular, los catalizadores de transferencia de fase adecuados para usar de acuerdo con la presente invención son sales de amonio cuaternario, por ejemplo de fórmula RmRnRlRkNX, en donde RmRnRlRk son alquilo, iguales o diferentes, y X es halo (por ejemplo, cloruro, bromuro, yoduro) o hidróxido, por ejemplo, hidróxido de tetra-n-butylammonium hydroxide.
Un catalizador "heterogéneo" según se usa en este documento se refiere a un catalizador soportado en un portador, generalmente, aunque no necesariamente, un sustrato compuesto por un material inorgánico, por ejemplo, un material poroso como carbono, silicio y/u óxido de aluminio.
Un catalizador "homogéneo" según se usa en este documento se refiere a un catalizador que no está soportado en un portador.
El término "quiral" se refiere a moléculas que tienen la propiedad de no superponerse con su imagen especular, en tanto el término "aquiral" se refiere a moléculas que se superponen con su imagen especular.
El término "catalizador" significa cualquier sustancia que afecta la velocidad de una reacción química mediante disminución de la energía de activación para la reacción química.
La expresión "catalizador en polvo" significa un catalizador con un contenido de agua de 0 a 30% de masa.
La expresión "relación entre sustrato y catalizador" (S/C) se refiere a la relación molar entre los compuestos de partida, o sus sales, y el "metal de transición catalizador".
La expresión "tratamiento final" significa el trabajo de aislamiento y/o purificación que se lleva a cabo una vez que termina la reacción.
Según se usa en este documento, a menos que se especifique lo contrario, la expresión "temperatura ambiente" o "temperatura ambiental" significa una temperatura entre 15 y 30°C, tal como entre 20 y 30°C, tal como entre 20 y 25°C.
El término "inerte" según se usa en toda esta solicitud, significa que no reacciona con ninguno de los reactivos, solventes u otros componentes de la mezcla de reacción. Dichas condiciones inertes se logran generalmente utilizando gas inerte como dióxido de carbono, helio, nitrógeno o argón, entre otros gases.
Los enlaces con el (*) indican puntos de unión con el resto de la molécula.
Los compuestos de la presente invención pueden poseer uno o más centros asimétricos. Las configuraciones absolutas preferidas son las que se indican específicamente en este documento. Sin embargo, cualquier posible enantiómero puro, diastereoisómero puro, o sus mezclas, por ejemplo, mezclas de enantiómeros, como racematos, están comprendidos por la presente invención.
En las fórmulas de la presente solicitud los símbolos ", " " o " ------" en un C-sp3 representan un enlace covalente en el que la estereoquímica del enlace no está definida. Esto significa que los símbolos " ys\s\s\s"' o " ------" en un C-sp3 comprenden una configuración (S) así como una configuración (R) del centro quiral respectivo. Además, también están comprendidas las mezclas, por ejemplo, las mezclas de enantiómeros, como racematos, están comprendidas por la presente invención.
En las fórmulas de la presente solicitud, los símbolos ” ^ ^ s \ s '" o " " en un C-sp2 representan un enlace covalente, en el que la estereoquímica o la geometría del enlace no está definida. Esto significa que el símbolo " ' / w v ' " en un C-sp2 comprende una configuración cis (Z) así como una configuración trans (E) del doble enlace respectivo. Además, también están comprendidas las mezclas, por ejemplo, las mezclas de isómeros de doble enlace están comprendidas por la presente invención.
En las fórmulas de la presente solicitud, el símbolo " ..........-" indica un enlace Csp3-Csp3 o un enlace Csp2-Csp2.
Los compuestos de la presente invención pueden poseer uno o más centros asimétricos. Las configuraciones absolutas preferidas son las que se indican específicamente en este documento.
En las fórmulas de la presente solicitud el símbolo " ^ " en un C-sp3 indica la estereoquímica absoluta, ya sea (R) o (S).
o# 3
En las fórmulas de la presente solicitud el símbolo " ■'' " en un C-sp3 indica la estereoquímica absoluta, ya sea (R) o (S).
La expresión "pureza estereoisomérica" en un determinado porcentaje significa que el estereoisómero indicado predomina en ese porcentaje indicado en una mezcla de estereoisómeros.
El término "estereoisómero" significa una de las configuraciones absolutas de una molécula orgánica individual que tiene al menos un carbono asimétrico. Están incluidos en la definición de estereoisómeros los enantiómeros y los diastereoisómeros.
El término "resolución" se refiere a la separación o concentración o agotamiento de uno de los estereoisómeros de una molécula.
Las sales son especialmente sales farmacéuticamente aceptables o generalmente sales de cualquiera de los compuestos intermedios mencionados en este documento, un experto en la materia entenderá fácilmente que las sales no son excluidas por razones químicas. Se pueden formar cuando estén presentes grupos formadores de sales, tales como grupos básicos o ácidos, que pueden existir en forma disociada al menos parcialmente, por ejemplo, en un intervalo de pH de 4 a 10 en soluciones acuosas, o se pueden aislar especialmente en forma sólida, especialmente cristalina.
Dichas sales se forman por ejemplo, como sales de adición de ácido, preferentemente con ácidos orgánicos o inorgánicos, a partir de los compuestos o cualquiera de los compuestos intermedios mencionados en este documento, con un átomo de nitrógeno básico (por ejemplo, imino o amino), especialmente las sales farmacéuticamente aceptables. Los ácidos inorgánicos adecuados son por ejemplo, ácidos de halógeno, como ácido clorhídrico, ácido sulfúrico o ácido fosfórico. Los ácidos orgánicos adecuados son, por ejemplo, ácidos carboxílicos, fosfónicos, sulfónicos o sulfámicos, por ejemplo ácido acético, ácido propiónico, ácido láctico, ácido fumárico, ácido succínico, ácido cítrico, aminoácidos, como ácido glutámico o ácido aspártico, ácido maleico, ácido hidroximaleico, ácido metilmaleico, ácido benzoico, ácido metano o etanosulfónico, ácido etano-1,2-disulfónico, ácido bencenosulfónico,
ácido 2-naftalenosulfónico, ácido 1,5-naftalenodisulfónico, ácido N-cicIohexilsulfámico, ácido N-metil-, N-etil- o N-propilsulfámico, u otros ácidos orgánicos protónicos, como ácido ascórbico.
En presencia de radicales cargados negativamente, como carboxi o sulfo, las sales también se pueden formar con bases, por ejemplo, sales de metales o de amonio, como sales de metales alcalinos o metales alcalinotérreos, por ejemplo, sales de sodio, potasio, magnesio o calcio, o sales de amonio con amoníaco o aminas orgánicas adecuadas, por ejemplo, trietilamina o tri(2-hidroxietil)amina, N-etilpiperidina, N,N'-dimetilpiperazina, t-butilamina, n-butilamina, feniletilamina, diciclohexilamina o ciclohexilamina.
Cuando un grupo básico y un grupo ácido están presentes en la misma molécula, cualquiera de los compuestos intermedios mencionados en este documento también puede formar sales internas.
Con fines de aislamiento o purificación de cualquiera de los compuestos intermedios mencionados en este documento también es posible utilizar sales que no sean farmacéuticamente aceptables, por ejemplo picratos o percloratos.
Las formas salinas preferidas incluyen, por ejemplo, las sales de adición de ácido. Los compuestos que tienen al menos un grupo ácido (por ejemplo, COOH o 5-tetrazolilo) también pueden formar sales con bases. Las sales adecuadas con bases son, por ejemplo, sales metálicas, como sales de metales alcalinos o metales alcalinotérreos, por ejemplo, sales de sodio, potasio, calcio o magnesio, o sales con amoníaco o una amina orgánica, como morfolina, tiomorfolina, piperidina, pirrolidina, una mono-, di- o trialquilamina inferior, por ejemplo, etil-, tert-butil-, dietil-, diisopropil-, trietil-, tributil- o dimetilpropilamina, o una mono-, di- o trihidroxi-alquilamina inferior, por ejemplo, mono-, di- o trietanolamina. Además se pueden formar las correspondientes sales internas. También están incluidas sales que no son adecuadas para usos farmacéuticos pero que se pueden emplear, por ejemplo, para el aislamiento o la purificación de compuestos libres I o de sus sales farmacéuticamente aceptables. Muy preferentemente la sal de fórmula (IV) y la sal del ácido canforsulfónico.
En particular, la expresión "sal de un compuesto de fórmula (IV)" se refiere, por ejemplo, a una sal de amina de este, una sal de un metal alcalino o de un metal alcalinotérreo de este (por ejemplo, sal de sodio, sal de potasio, sal de calcio, sal de magnesio, etc). En particular, el término "amina" en la expresión "sal de amina de este", por ejemplo cuando se refiere a una sal de amina del compuesto de fórmula (IV), significa una amina terciaria de fórmula NR9R10R11, una amina secundaria de fórmula NHR9R10R una amina primaria de fórmula NH2R9, en donde R9, R10 y R11 son, independientemente uno de otro, alquilo, arilo, cicloalquilo o heterociclilo, según se definieron en este documento, preferentemente alquilo o cicloalquilo. El término "amina" es, por ejemplo, difenilamina, diisopropilamina, dimetilamina, trietilamina, diisopropiletilamina, diciclohexilamina, t-butilamina, n-butilamina o ciclohexilamina, en particular, t-butilamina, n-butilamina o ciclohexilamina, más preferentemente n-butilamina o ciclohexilamina.
Según se usa en esta memoria y en las reivindicaciones adjuntas, las formas en singular "un", "una", "el" y "la" incluyen los referentes en plural a menos que el contexto indique claramente lo contrario. Por lo tanto, por ejemplo, la referencia a "un polipéptido" incluye más de un polipéptido.
Análogamente, "comprenden," "comprende", "que comprende(n)", "incluyen," "incluye" y "que incluye(n)", son intercambiables y no pretenden ser limitantes.
Además se debe entender que cuando las descripciones de diversas realizaciones usan la expresión "que comprende(n)" los expertos en la materia deberán entender que en instancias específicas, una realización puede ser descrita alternativamente usando las expresiones "que consiste esencialmente en" o "que consiste en".
Se debe entender que tanto la descripción general precedente, incluidas las figuras, y la descripción detallada siguiente, son únicamente ejemplares y explicatorias, y no restrictivas de esta divulgación.
Los títulos de sección utilizados en este documento son solo con fines organizativos y no deben interpretarse como limitantes del tema descrito.
Las abreviaturas utilizadas para los aminoácidos codificados genéticamente son convencionales y son las siguientes:
Aminoácidos Tres letras Abreviatura de una letra
Alanina Ala A
Arginina Arg R
Asparragina Asn N
Aspartato Asp D
Cisteína Cys C
Glutamato Glu E
Glutamina Gln Q
Glicina Gly G
Histidina His H
Isoleucina Ile I
Leucina Leu L
Lisina Lys K
Metionina Met M
Fenilalanina Phe F
Prolina Pro P
Serina Ser S
Treonina Thr T
Triptófano Trp W
Tirosina Tyr Y
Valina Val V
Cuando se utilizan las abreviaturas de tres letras, a menos que estén precedidas específicamente por una "L" o una "D" o sea claro a partir del contexto en el cual se usa la abreviatura, el aminoácido puede estar en la configuración L o D- en un carbono a (Ca). Por ejemplo, mientras que "Ala" designa alanina sin especificar la configuración en el carbono a, "D-Ala" y "L-Ala" designan D-alanina y L-alanina, respectivamente. Cuando se usan las abreviaturas de una letra, las letras mayúsculas designan aminoácidos en la configuración L- en el carbono a y las letras minúsculas designan los aminoácidos en la configuración D- en el carbono a. Por ejemplo, "A" designa L-alanina y "a" designa D-alanina. Cuando las secuencias de polipéptidos se presentan como una cadena de abreviaturas de una letra o tres letras (o sus mezclas), las secuencias se presentan en la dirección de amino (N) a carboxi (C), de conformidad con la convención común.
Las abreviaturas utilizadas por los nucleósidos que codifican genéticamente son convencionales y son las siguientes: adenosina (A); guanosina (G); citidina (C); timidina (T); y uridina (U). A menos que se delinee específicamente, los nucleótidos abreviados pueden ser ribonucleósidos o 2'-desoxirribonucleósidos. Se puede especificar que los nucleósidos son ribonucleósidos o 2'-desoxirribonucleósidos de forma individual o agregada. Cuando las secuencias de ácido nucleico se presentan como una cadena de abreviaturas de una letra, las secuencias se presentan en la dirección 5' a 3', de conformidad con la convención común, y los fosfatos no están indicados.
En relación con la presente divulgación, los términos técnicos y científicos utilizados en las descripciones de este documento tendrán los significados comúnmente entendidos por un experto en la materia, a menos que se defina específicamente lo contrario. En consecuencia, los términos siguientes están destinados a tener los significados siguientes:
“Proteína", "polipéptido" y "péptido" se usan indistintamente en este documento para indicar un polímero de al menos dos aminoácidos unidos covalentemente por un enlace amida, independientemente de la longitud o la modificación postraducciónal (por ejemplo, glicosilación, fosforilación, lipidación, miristilación, ubiquitinación, etc.). Están incluidos en esta definición los aminoácidos D- y L-, y las mezclas de aminoácidos D- y L-.
“Polinucleótido" o "ácido nucleico" se refieren a dos o más nucleósidos que están unidos covalentemente entre sí. El polinucleótido puede estar totalmente compuesto por ribonucleósidos (es decir, un ARN), totalmente compuesto por 2'-desoxirribonucleósidos (es decir, un ADN) o mezclas de ribo- y 2' desoxirribonucleósidos. Mientras que los nucleósidos estarán generalmente unidos entre sí a través de enlaces fosfodiester estándar, los polinucleótidos pueden incluir uno o más enlaces no estándar. El polinucleótido puede ser monocatenario o bicatenario, o puede incluir tanto regiones monocatenarias como bicatenarias. Además, si bien un polinucleótido estará compuesto generalmente por nucleobases codificantes de origen natural (es decir, adenina, guanina, uracilo, timidina y citocina), puede incluir una o más nucleobases modificadas y/o sintéticas, como, por ejemplo, inosina, xantina, hipoxantina, etc. Preferentemente, dichas nucleobases modificadas o sintéticas serán nucleobases codificantes.
"Aminotransferasa" y "transaminasa" se usan indistintamente en este documento para referirse a un polipéptido que tiene la capacidad enzimática de transferir un grupo amino (NH2) de una amina primaria a un grupo carbonilo (C=O) de una molécula aceptora. Las transaminasas utilizadas en este documento incluyen transaminasas de origen natural (tipo silvestre) así como polipéptidos genomanipulados que no son de origen natural, generados mediante manipulación humana.
“Aceptor de amino" y "aceptor de amina", "sustrato ceto", "ceto" y "cetona" se usan indistintamente en este documento para referirse a un compuesto carbonilo (ceto o cetona) que acepta un grupo amino de una amina dadora. En algunas realizaciones, los receptores de amino son moléculas de la fórmula general siguiente,
aceptor de amino
En la cual cada uno de Ra y Rp, cuando se consideran independientemente, es un alquilo, cicloalquilo, heterocicloalquilo, arilo o heteroarilo, el que puede no estar sustituido o estar sustituido con uno o más grupos enzimáticamente aceptables. Ra puede ser igual o diferente a Rp en estructura o quiralidad. En algunas realizaciones, R° y R°, tomados juntos, pueden formar un anillo que está sustituido, no sustituido o fusionado a otros anillos. Los receptores de amino incluyen ácidos ceto carboxílicos y alcanonas (cetonas). Generalmente los ácidos ceto carboxílicos son ácidos a-ceto carboxílicos como ácido glioxálico, ácido pirúvico, ácido oxalacético, y similares, así como las sales de estos ácidos. Los aceptores de amino también incluyen sustancias que son convertidas en aceptores de amino mediante otras enzimas o procesos de células enteras, como el ácido fumárico (que se puede convertir en ácido oxalacético), glucosa (que se puede convertir en piruvato), lactato, ácido maleico y otras. Los aceptores de amino que se pueden utilizar incluyen, a modo de ejemplo y no limitante, 3,4-dihidronaftalen-1(2H)-ona, 1-fenilbutan-2-ona, 3,3-dimetilbutan-2-ona, octan-2-ona, 3-oxobutanoato de etilo, 4-fenilbutan-2-ona, 1-(4-bromofenil)etanona, 2-metil-ciclohexanona, 7-metoxi-2-tetralona, 1-hidroxibutan-2-ona, ácido pirúvico, acetofenona, 3'-hidroxiacetofenona, 2-metoxi-5-fluoroacetofenona, ácido levulínico, 1-fenilpropan-1-ona, 1-(4-bromofenil)propan-1-ona, 1-(4-nitrofenil)propan-1-ona, 1-fenilpropan-2-ona, ácido 2-oxo-3-metilbutanoico, 1-(3-trifluorometilfenil)propan-1-ona, hidroxipropanona, metoxioxipropanona, 1-fenilbutan-1-ona, 1-(2,5-dimetoxi-4-metilfenil)butan-2-ona, 1-(4-hidroxifenil)butan-3-ona, 2-acetilnaftaleno, ácido fenilpirúvico, ácido 2-cetoglutárico y ácido 2-cetosuccínico, incluidos ambos isómeros individuales (R) y (S), cuando es posible.
“Dador de amino" o "dador de amina" se refieren a un compuesto amino que dona un grupo amino al aceptor de amino, volviéndose por lo tanto una especie carbonilo. En algunas realizaciones, los dadores de amino son moléculas de la fórmula general siguiente,
dador de amino
en la cual cada uno de RE y R6, cuando se consideran independientemente, es un alquilo, cicloalquilo, heterocicloalquilo, arilo o heteroarilo, el que puede no estar sustituido o estar sustituido con uno o más grupos enzimáticamente no inhibidores. RE puede ser igual o diferente a R6 en estructura o quiralidad. En algunas realizaciones, RE y R6, tomados juntos, pueden formar un anillo que está sustituido, no sustituido o fusionado a otros anillos. Los dadores de amino típicos que se pueden utilizar, incluyen aminoácidos quirales y aquirales, y aminas quirales y aquirales. Los dadores de amino que se pueden utilizar incluyen, a modo de ejemplo y no limitante, isopropilamina (también denominada 2-aminopropano), a-fenetilamina (también denominada 1-feniletanamina), y sus enantiómeros (S)-1-feniletanamina y (R)-1-feniletanamina, 2-amino-4-fenilbutano, glicina, ácido L-glutámico, L-glutamato, glutamato monosódico, L-alanina, D-alanina, D,L-alanina, ácido L-aspártico, L-lisina, D,L-ornitina, palanina, taurina, n-octilamina, ciclohexilamina, 1,4-butanodiamina (también denominada putrescina), 1,6-hexanodiamina, ácido 6-aminohexanoico, ácido 4-aminobutírico, tiramina, y bencilamina, 2-aminobutano, 2-amino-1-butanol, 1-amino-1-feniletano, 1-amino-1-(2-metoxi-5-fluorofenil)etano, 1-amino-1-fenilpropano, 1-amino-1-(4-hidroxifenil)propano, 1-amino-1-(4-bromofenil)propano, 1-amino-1-(4-nitrofenil)propano, 1-fenil-2-aminopropano, 1-(3-trifluorometilfenil)-2-aminopropano, 2-aminopropanol, 1-amino-1-fenilbutano, 1-fenil-2-aminobutano, 1-(2,5-dimetoxi-4-metilfenil)-2-aminobutano, 1-fenil-3-aminobutano, 1-(4-hidroxifenil)-3-aminobutano, 1-amino-2-metilciclopentano, 1-amino-3-metilciclopentano, 1-amino-2-metilciclohexano, 1-amino-1-(2-naftil)etano, 3-metilciclopentilamina, 2-metilciclopentilamina, 2-etilciclopentilamina, 2-metilciclohexilamina, 3-metilciclohexilamina, 1-aminotetralina, 2aminotetralina, 2-amino-5-metoxitetralina y 1 -aminoindano, incluidos ambos isómeros individuales (R) y (S) cuando es posible, e incluidas todas las posibles sales de las aminas.
"Amina quiral" se refiere a amina de fórmula general R1-CH(NH2)- R1 y se emplea en este documento en su sentido más amplio, que incluye una amplia variedad de compuestos alifáticos y alicíclicos de tipos funcionales diferentes, y mixtos, caracterizados por la presencia de un grupo amino primario unido a un átomo de carbono secundario que, además de un átomo de hidrógeno, tiene unido (i) un grupo divalente que forma una estructura cíclica quiral, o (ii) dos sustituyentes (distintos de hidrógeno) que difieren entre sí en estructura o quiralidad. Los grupos divalentes que forman una estructura cíclica quiral incluyen, por ejemplo, 2-metilbutano-1,4-diilo, pentano-1,4-diilo, hexano-1,4-diilo, hexano-1,5-diilo, 2-metilpentano-1,5-diilo. Los dos sustituyentes diferentes en el átomo de carbono secundario (R1 y R2 anteriores) también pueden variar ampliamente e incluyen alquilo, aralquilo, arilo, halo, hidroxi, alquilo inferior, alcoxi inferior, alquiltio inferior, cicloalquilo, carboxi, carbalcoxi, carbamoilo, mono- y di-(alquilo inferior), carbamoilo, trifluorometilo, fenilo, nitro, amino, mono- y di-(alquilo inferior) sustituidos, amino, alquilsulfonilo, arilsulfonilo, alquilcarboxamido, arilcarboxamido, etc., sustituidos, así como alquilo, aralquilo o arilo sustituidos con los precedentes.
"Piridoxal-fosfato", "PLP" "piridoxal-5'-fosfato", "PYP" y "P5P" se usan indistintamente en este documento para referirse al compuesto que actúa como una coenzima en reacciones de transaminasa. En algunas realizaciones, el piridoxal fosfato es definido por la estructura ácido 1 -(4'-formil-3'-hidroxi-2'-metil-5'-piridil)metoxifosfónico, número CAS [54-47-7], el piridoxal-5'-fosfato se puede producir in vivo mediante fosforilación y oxidación de piridoxol (también conocido como vitamina B6). En las reacciones de transaminación que usan enzimas transaminasa, el grupo amina del dador de amino se transfiere a la coenzima para producir un subproducto ceto, mientras que el piridoxal-5'-fosfato se convierte en fosfato de piridoxamina. El piridoxal-5'-fosfato se regenera mediante reacción con un compuesto ceto diferente (el aceptor de amino). La transferencia del grupo amina desde fosfato de piridoxamina al aceptor de amino produce una amina quiral y regenera la coenzima. En algunas realizaciones, el piridoxal-5'-fosfato puede ser reemplazado por otros miembros de la familia de la vitamina B6, que incluyen piridoxina (PN), piridoxal (PL), piridoxamina (PM), y sus contrapartes fosforiladas; fosfato de piridoxina (PNP) y fosfato de piridoxamina (PMP).
“Secuencia de codificación" se refiere a la porción de un ácido nucleico (por ejemplo, un gen) que codifica una secuencia de aminoácidos de una proteína.
“De origen natural" o "tipo silvestre" se refiere a la forma que se encuentra en la naturaleza. Por ejemplo, un polipéptido o secuencia de polinucleótidos de origen natural o tipo silvestre es una secuencia presente en un organismo que se puede aislar de una fuente de la naturaleza y que no ha sido modificado intencionalmente mediante manipulación humana.
“Recombinante" o "genomanipulado" o "que no es de origen natural" cuando se utiliza con referencia a, por ejemplo, una célula, un ácido nucleico o un polipéptido, se refiere a un material, o a un material correspondiente a la forma natural o nativa del material, que ha sido modificado de una manera que de otra forma no existiría en la naturaleza, o es idéntico a, pero producido a partir de, o derivado de, materiales sintéticos y/o mediante manipulación empleando técnicas de recombinación. Los ejemplos no limitantes incluyen, entre otros, células recombinantes que expresan genes que no se encuentran en la forma nativa (no recombinante) de la célula o que expresan genes nativos que de lo contrario se expresan en un nivel diferente.
“Porcentaje de identidad de secuencia" y "porcentaje de homología" se usan indistintamente en este documento para referirse a comparaciones entre polinucleótidos y polipéptidos, y se determinan comparando dos secuencias alineadas óptimamente en una ventana de comparación, en donde la porción de la secuencia del polinucleótido o el polipéptido en la ventana de comparación puede comprender adiciones o deleciones (es decir, huecos) en comparación con la secuencia de referencia, para la alineación óptima de las dos secuencias. El porcentaje se puede calcular determinando el número de posiciones en las que aparece una base de ácido nucleico o residuo de aminoácido idéntico en ambas secuencias para calcular el número de posiciones coincidentes, dividiendo el número de posiciones coincidentes entre el número total de posiciones en la ventana de comparación y multiplicando el resultado por 100 para obtener el porcentaje de identidad de secuencia. Alternativamente, el porcentaje se puede calcular determinando el número de posiciones en las que aparece o bien la base de ácido nucleico o bien el residuo de aminoácido idéntico en ambas secuencias o una base de ácido nucleico o un residuo de aminoácido se alinea con un hueco, para calcular el número de posiciones coincidentes, dividiendo el número de posiciones coincidentes entre el número total de posiciones en la ventana de comparación y multiplicando el resultado por 100 para obtener el porcentaje de identidad de secuencia. Los expertos en la materia apreciarán que se dispone de muchos algoritmos establecidos para alinear dos secuencias. La alineación óptima de las secuencias por comparación se puede realizar mediante, por ejemplo, el algoritmo de homología local de Smith y Waterman, 1981, Adv. Appl. Math. 2:482, mediante el algoritmo de alineación de homología de Needleman y Wunsch, 1970, J. Mol. Biol. 48:443, mediante la búsqueda por método de similitud de Pearson y Lipman, 1988, Proc. Natl. Acad. Sci. USA 85:2444, mediante implementaciones computarizadas de estos algoritmos (GAP, BESTFIT, FASTA y TFASTA en el paquete informático GCG Wisconsin), o mediante inspección visual (véase en general, Current Protocols in Molecular Biology, F. M. Ausubel et al., eds., Current Protocols, un proyecto conjunto entre Greene Publishing Associates, Inc. y John Wiley & Sons, Inc., (Suplemento 1995) (Ausubel)).
Los ejemplos de algoritmos que son adecuados para determinar el porcentaje de identidad de secuencia y la similitud de secuencia son los algoritmos BLAST y BLAST 2.0 que se describen en Altschul et al., 1990, J. Mol. Biol. 215: 403 410 y Altschul et al., 1977, Nucleic Acids Res. 3389-3402, respectivamente. El programa informático para realizar análisis BLAST está disponible para el público a través del sitio web del National Center for Biotechnology Information. Este algoritmo implica primero identificar pares de secuencias de puntuación alta (HSP) mediante la identificación de palabras cortas de longitud W en la secuencia de interrogación, que coinciden o satisfacen alguna puntuación de umbral de valor positivo T cuando se alinean con una palabra de la misma longitud en una secuencia de base de datos. T es mencionada como la puntuación umbral de las palabras del vecindario (Altschul et al, supra). Estos resultados iniciales de palabras cercanas actúan como semillas para iniciar búsquedas con el fin de encontrar HSP más largas que las contengan. Los (hits) de palabras se extienden después en ambas direcciones a lo largo de cada secuencia, tan lejos como se pueda incrementar la puntuación de alineación acumulada. Las puntuaciones acumuladas se calculan usando, para las secuencias de nucleótidos, los parámetros M (puntuación de recompensa para un par de residuos coincidentes; siempre > 0) y N (puntuación de penalización para residuos que no coinciden; siempre < 0). Para las secuencias de aminoácidos, se utiliza una matriz de puntuación para calcular la puntuación acumulativa. La extensión de los resultados de las palabras en cada dirección se detiene cuando: la puntuación de alineación acumulativa cae fuera en una cantidad X de su valor máximo conseguido; la puntuación acumulativa se reduce hasta cero o por debajo, debido a la acumulación de una o más alineaciones de residuos con puntuación negativa; o se llega al final de cualquier secuencia. Los parámetros del algoritmo BLAST W, T y X determinan la sensibilidad y velocidad de la alineación. El programa BLASTN (para secuencias de nucleótidos) usa por defecto una longitud de palabra (W) de 11, una expectativa (E) de 10, M = 5, N = -4 y una comparación de ambas hebras. Para la secuencia de aminoácidos, el programa BLASTP usa por defecto una longitud de palabra (W) de 3, una expectativa (E) de 10 y la matriz de puntuación BLOSUM62 (véase Henikoff y Henikoff, 1989, Proc Natl Acad Sci USA 89:10915). El ejemplo de determinación de la alineación de secuencias y del % de identidad de secuencia puede emplear los programas BESTFIT o GAP del paquete informático GCG Wisconsin (Accelrys, Madison WI), usando los parámetros predeterminados provistos.
“Secuencia de referencia" se refiere a una secuencia definida utilizada como base para una comparación de secuencias. Una secuencia de referencia puede ser un subconjunto de una secuencia más grande, por ejemplo, un segmento de una secuencia de longitud completa de un gen o un polipéptido. Generalmente, una secuencia de referencia tiene al menos 20 nucleótidos o residuos de aminoácidos de longitud, al menos 25 residuos de longitud, al menos 50 residuos de longitud, o la longitud completa del ácido nucleico o polipéptido. Dado que dos polinucleótidos o polipéptidos pueden cada uno (1 ) contener una secuencia (es decir, una porción de la secuencia completa) que sea similar entre las dos secuencias, y (2) contener además una secuencia que sea divergente entre las dos secuencias, se realizan habitualmente comparaciones de secuencias entre dos (o más) polinucleótidos o polipéptidos por comparación de las secuencias de los dos polinucleótidos o polipéptidos en una "ventana de comparación" para identificar y comparar regiones locales de similitud de secuencia. En algunas realizaciones, una "secuencia de referencia" se puede basar en una secuencia de aminoácidos primaria, donde la secuencia de referencia es una secuencia que puede tener uno o más cambios en la secuencia primaria. Por ejemplo, una "secuencia de referencia basada en SEQ ID NO: 4 que tiene en el residuo correspondiente a X14 una valina" o X14V se refiere a una secuencia de referencia en la cual el residuo correspondiente a X14 en SEQ ID NO: 4, que es una tirosina, ha sido cambiado a valina.
Una "ventana de comparación", se refiere a un segmento conceptual de al menos alrededor de 20 posiciones de nucleótidos o residuos de aminoácidos contiguos donde una secuencia se puede comparar con una secuencia de referencia de al menos 20 nucleótidos o aminoácidos contiguos y donde la porción de la secuencia en la ventana de comparación puede comprender adiciones o deleciones (es decir, huecos) de 20 por ciento o menos en comparación con la secuencia de referencia (que no comprende adiciones ni deleciones) para la alineación óptima de las dos secuencias. La ventana de comparación puede ser más larga que 20 residuos contiguos, e incluye, opcionalmente ventanas de 30, 40, 50, 100, o más largas.
“Identidad sustancial" se refiere a una secuencia de polinucleótido o polipéptido que tiene al menos 80 por ciento de identidad de secuencia, al menos 85 por ciento de identidad y 89 a 95 por ciento de identidad de secuencia, más habitualmente al menos 99 por ciento de identidad de secuencia en comparación con una secuencia de referencia en una ventana de comparación de al menos 20 posiciones de residuos, frecuentemente en una ventana de al menos 30-50 residuos, en donde el porcentaje de identidad de secuencia se calcula mediante comparación de la secuencia de referencia con una secuencia que incluye deleciones o adiciones que totalizan 20 por ciento o menos de la secuencia de referencia en la ventana de comparación. En realizaciones específicas aplicadas a polipéptidos, la expresión "identidad sustancial" significa que dos secuencias polipeptídicas, cuando están alineadas óptimamente, por ejemplo mediante los programas GAP o BESTFIT usando los pesos predeterminados de los huecos, comparten al menos 80% de identidad de secuencia, preferentemente al menos 89% de identidad de secuencia, al menos 95% de identidad de secuencia o más (por ejemplo, 99% de identidad de secuencia). Preferentemente, las posiciones de los residuos que no son idénticos difieren en sustituciones conservadoras de aminoácidos.
“Correspondiente a", "con respecto a" o "en relación con" cuando se usan en el contexto de la numeración de una determinada secuencia de aminoácidos o polinucleótido se refiere a la numeración de los residuos de una secuencia de referencia especificada, cuando la secuencia de aminoácidos o polinucleótido dada se compara con la secuencia de referencia. En otras palabras, el número del residuo o la posición del residuo de un determinado polímero se designan con respecto a la secuencia de referencia más bien que por la posición numérica real del residuo dentro de la secuencia de aminoácidos o polinucleótido dada. Por ejemplo, una determinada secuencia de aminoácidos, tal como la de una transaminasa genomanipulada, se puede alinear con una secuencia de referencia introduciendo huecos para optimizar la coincidencia de residuos entre las dos secuencias. En estos casos, aunque están presentes los huecos, la numeración del residuo en la secuencia de aminoácidos o polinucleótido dada, se hace con respecto a la secuencia de referencia con la cual ha sido alineada.
“Diferencia de aminoácido" o "diferencia de residuo" se refiere a un cambio en el residuo de aminoácido en una posición de una secuencia polipeptídica en relación con el residuo de aminoácido en la posición correspondiente de la secuencia de referencia. Las posiciones de las diferencias de aminoácidos generalmente se indican en este documento como "Xn," donde n se refiere a la posición correspondiente en la secuencia de referencia sobre la cual se basa la diferencia de residuo. Por ejemplo, una "diferencia de residuo en la posición X14 en comparación con SEQ ID NO: 4" se refiere a un cambio del residuo de aminoácido en la posición del polipéptido correspondiente a la posición 14 de SEQ ID NO: 4. Por lo tanto, si el polipéptido de referencia de SEQ ID NO: 4 tiene una tirosina en la posición 14, entonces una "diferencia de residuo en la posición X14 en comparación con SEQ ID NO: 4" es una sustitución del aminoácido con cualquier residuo distinto de tirosina en la posición del polipéptido correspondiente a la posición 14 de SEQ ID NO: 4. En la mayoría de los casos de este documento, la diferencia de residuo de aminoácido específica en una posición, se indica como "XnY" donde "Xn" especifica la posición correspondiente, según se describió antes, e "Y" es el identificador de una sola letra del aminoácido encontrado en el polipéptido genomanipulado (es decir, el residuo diferente al del polipéptido de referencia). En algunas realizaciones, puede aparecer más de un aminoácido en una posición especificada del residuo, los aminoácidos alternativos se pueden indicar en forma de XnY/Z, donde Y y Z representan los residuos de aminoácidos alternativos. En algunos casos (por ejemplo, en las Tablas 2A y 2B), la presente divulgación también proporciona diferencias de aminoácidos específicas, indicadas mediante la anotación convencional "AnB", donde A es el identificador de una sola letra del residuo en la secuencia de referencia, "n" es el número de la posición del residuo en la secuencia de referencia, y B es el identificador de una sola letra del residuo sustituto en la secuencia del polipéptido genomanipulado. Además, en algunos casos, un polipéptido de la presente divulgación puede incluir una o más diferencias de residuos de aminoácidos en relación con una secuencia de referencia, lo que se indica mediante una lista de las posiciones especificadas en donde se hacen los cambios en relación con la secuencia de referencia. La presente divulgación incluye secuencias de polipétidos genomanipuladas que comprenden una o más diferencias de aminoácidos que incluyen sustituciones de aminoácidos tanto conservadoras como no conservadoras.
"Sustitución de aminoácido conservadora" se refiere a una sustitución de un residuo con un residuo diferente que tiene una cadena lateral similar, y por lo tanto implica generalmente la sustitución del aminoácido en el polipéptido con aminoácidos dentro de la misma clase definida de aminoácidos o una similar. A modo de ejemplo y no limitante, un aminoácido con una cadena lateral alifática puede ser sustituido con otro aminoácido alifático, por ejemplo, alanina, valina, leucina e isoleucina; un aminoácido con una cadena lateral hidroxilo se sustituye con otro aminoácido con una cadena lateral hidroxilo, por ejemplo, serina y treonina; un aminoácido que tiene una cadena lateral aromática se sustituye con otro aminoácido que tiene una cadena lateral aromática, por ejemplo, fenilalanina, tirosina, triptófano e histidina; un aminoácido con una cadena lateral básica se sustituye con otro aminoácido con una cadena lateral básica, por ejemplo, lisina y arginina; un aminoácido con una cadena lateral ácida se sustituye con otro aminoácido con una cadena lateral ácida, por ejemplo, ácido aspártico o ácido glutámico; y un aminoácido hidrófobo o hidrófilo es reemplazado por otro aminoácido hidrófobo o hidrófilo, respectivamente. Ejemplos de sustituciones conservadoras se proporcionan en la Tabla 1 a continuación.
Tabla 1
“Sustitución no conservadora" se refiere a la sustitución de un aminoácido en el polipéptido con un aminoácido con propiedades de cadena lateral que difieren significativamente. Las sustituciones no conservadoras pueden usar aminoácidos entre los grupos definidos, más bien que dentro de ellos, y afectan (a) la estructura del esqueleto del péptido en la zona de la sustitución (por ejemplo, prolina por glicina), (b) la carga o hidrofobicidad, o (c) el volumen de
la cadena lateral. A modo de ejemplo y no limitante, una sustitución no conservadora ejemplar puede ser un aminoácido ácido sustituido con un aminoácido básico o alifático; un aminoácido aromático sustituido con un aminoácido pequeño; y un aminoácido hidrófilo sustituido con un aminoácido hidrófobo.
"Deleción" se refiere a la modificación del polipéptido mediante la eliminación de uno o más aminoácidos del polipéptido de referencia. Las deleciones pueden comprender la eliminación de 1 o más aminoácidos, 2 o más aminoácidos, 5 o más aminoácidos, 10 o más aminoácidos, 15 o más aminoácidos, o 20 o más aminoácidos, hasta el 10% del número total de aminoácidos, o hasta el 20% del número total de aminoácidos que forman la enzima de referencia pero reteniendo la actividad enzimática y/o reteniendo las propiedades mejoradas de una enzima transaminasa genomanipulada. Las deleciones pueden dirigirse a las porciones internas y/o porciones terminales del polipéptido. En diversas realizaciones, la deleción puede comprender un segmento continuo o puede ser discontinua.
"Inserción" se refiere a la modificación del polipéptido mediante adición de uno o más aminoácidos del polipéptido de referencia. En algunas realizaciones, las enzimas transaminasa genomanipuladas mejoradas, comprenden inserciones de uno o más aminoácidos en el polipéptido transaminasa de origen natural, así como inserciones de uno o más aminoácidos en otros polipéptidos transaminasas mejorados. Las inserciones pueden estar en las porciones internas del polipéptido, o en el extremo carboxi o amino terminal. Las inserciones, según se usan en el presente documento, incluyen proteínas de fusión como es sabido en el área. La inserción puede ser un segmento contiguo de aminoácidos o estar separada por uno o más de los aminoácidos del polipéptido de origen natural.
"Fragmento" según se usa en este documento, se refiere a un polipéptido que tiene una deleción amino-terminal y/o carboxi-terminal, pero donde la secuencia de aminoácidos restante es idéntica a las posiciones correspondientes en la secuencia. Los fragmentos pueden tener al menos 14 aminoácidos de longitud, al menos 20 aminoácidos de longitud, al menos 50 aminoácidos de longitud o más, y hasta 70%, 80%, 90%, 95%, 98% y 99% del polipéptido transaminasa de longitud completa, por ejemplo, el polipéptido de SEQ ID NO: 2 o la transaminasa genomanipulada de SEQ ID NO: 34.
"Polipéptido aislado" se refiere a un polipéptido que está sustancialmente separado de otros contaminantes que lo acompañan naturalmente, por ejemplo, proteínas, lípidos y polinucleótidos. El término abarca polipéptidos que han sido eliminados o purificados de su entorno natural o sistema de expresión (por ejemplo, célula hospedadora o síntesis in vitro). Las enzimas transaminasa mejoradas pueden estar presentes dentro de una célula, presentes en el medio celular o preparadas de diversas formas, tales como lisados o preparaciones aisladas. Como tal, en algunas realizaciones, la enzima transaminasa mejorada puede ser un polipéptido aislado.
"Polipéptido sustancialmente puro" se refiere a una composición en la que la especie polipéptido es la especie predominante presente (es decir, en base molar o en peso es más abundante que cualquier otra especie macromolecular individual en la composición), y generalmente es una composición sustancialmente purificada cuando la especie objeto comprende al menos alrededor de 50 por ciento de la especie macromolecular presente en moles o % en peso. Generalmente, una composición de transaminasa sustancialmente pura comprenderá aproximadamente 60% o más, aproximadamente 70% o más, aproximadamente 80% o más, aproximadamente 90% o más, aproximadamente 95% o más, y aproximadamente 98% o más de todas las especies macromoleculares en moles o % en peso presentes en la composición. En algunas realizaciones, la especie objeto se purifica hasta homogeneidad esencial (es decir, las especies contaminantes no se pueden detectar en la composición por métodos de detección convencionales) en donde la composición consiste esencialmente en una única especie macromolecular. La especie solvente, las moléculas pequeñas (< 500 Dalton) y las especies de iones elementales no se consideran especies macromoleculares. En algunas realizaciones, el polipéptido transaminasa mejorado aislado, es una composición de polipéptido sustancialmente pura.
"Estereoselectividad" se refiere a la formación preferencial en una reacción química o enzimática de un estereoisómero respecto a otro. La estereoselectividad puede ser parcial, cuando se favorece la formación de un estereoisómero respecto al otro, o puede ser completa cuando solo se forma un estereoisómero. Cuando los estereoisómeros son enantiómeros, la estereoselectividad se denomina enantioselectividad, la fracción (habitualmente informada como un porcentaje) de un enantiómero en la suma de ambos. Comúnmente se informa alternativamente en el área (habitualmente como un porcentaje) como el exceso enantiomérico (e.e.) calculado a partir de la fórmula [enantiómero mayor - enantiómero menor]/[enantiómero mayor enantiómero menor]. Cuando los estereoisómeros son diastereoisómeros, la estereoselectividad se denomina diastereoselectividad, la fracción (habitualmente informada como un porcentaje) de un diastereómero en una mezcla de dos diastereómeros, comúnmente informada alternativamente como el exceso diastereoisomérico (e.d.). El exceso enantiomérico y el exceso diastereoisomérico son tipos de exceso estereoisomérico.
"Altamente estereoselectiva" se refiere a una reacción química o enzimática que es capaz de convertir un sustrato, por ejemplo, el Compuesto (IA), en su correspondiente producto amina quiral, por ejemplo, el Compuesto (IIA), con al menos alrededor de 85% de exceso estereoisomérico.
“Propiedad enzimática mejorada" se refiere a un polipéptido transaminasa que presenta una mejora en cualquier propiedad enzimática en comparación con una transaminasa de referencia. Para los polipéptidos transaminasa genomanipulados descritos en este documento, la comparación se hace generalmente con la enzima transaminasa tipo silvestre, aunque en algunas realizaciones, la transaminasa de referencia puede ser otra transaminasa genomanipulada mejorada. Las propiedades enzimáticas para las cuales es deseable una mejora incluyen, pero no exclusivamente, actividad enzimática (que se puede expresar en términos de porcentaje de conversión del sustrato), termoestabilidad, estabilidad al solvente, perfil de actividad del pH, requisitos de cofactores, refractariedad a los inhibidores (por ejemplo, inhibición por sustrato o producto), estereoespecificidad y estereoselectividad (incluida la enantioselectividad).
“Mayor actividad enzimática" se refiere a una propiedad mejorada de los polipéptidos transaminasa genomanipulados, que se puede representar mediante un aumento en la actividad específica (por ejemplo producto producido/tiempo/peso de proteína) o un aumento en el porcentaje de conversión del sustrato en el producto (por ejemplo, porcentaje de conversión de la cantidad de partida del sustrato en producto, en un período de tiempo especificado, utilizando una cantidad especificada de transaminasa) en comparación con la enzima transaminasa de referencia. Los ejemplos de métodos para determinar la actividad enzimática se proporcionan en los Ejemplos. Cualquier propiedad relacionada con la actividad enzimática puede ser afectada, incluidas las propiedades enzimáticas clásicas de Km, Vmáx o kcat, cuyos cambios pueden conducir a una mayor actividad enzimática. Las mejoras en la actividad enzimática pueden ser desde alrededor de 1,2 veces la actividad enzimática de la enzima transaminasa tipo silvestre correspondiente, hasta más de 2 veces, 5 veces, 10 veces, 20 veces, 25 veces, 50 veces, 75 veces, 100 veces, o más la actividad enzimática de la transaminasa de origen natural u otra transaminasa genomanipulada de la cual derivan los polipéptidos transaminasa. La actividad de transaminasa se puede medir por cualquiera de los ensayos estándar, como mediante control de los cambios en las propiedades espectrofotométricas de los reactivos o los productos. En algunas realizaciones, la cantidad de productos producida se puede medir mediante separación por cromatografía líquida de alto rendimiento (HPLC) combinada con absorbancia UV o detección fluorescente después de la derivatización, por ejemplo con o-ftaldialdehído (OPA). Las comparaciones de actividades enzimáticas se hacen usando una preparación de enzima definida, un ensayo definido en una condición establecida, y uno o más sustratos definidos, como se describe en detalle más adelante en este documento. Generalmente, cuando se comparan lisados, se determinan el número de células y la cantidad de proteína ensayada así como el uso de sistemas de expresión idénticos y células hospedadoras idénticas para minimizar las variaciones en la cantidad de enzima producida por las células hospedadoras y presente en los lisados.
“Conversión" se refiere a la conversión enzimática del o los sustratos en el o los productos correspondientes. “Porcentaje de conversión" se refiere el porcentaje de sustrato que se convierte en el producto dentro de un período de tiempo, en condiciones especificadas. Por lo tanto, la "actividad enzimática" o "actividad" de un polipéptido transaminasa se puede expresar como "porcentaje de conversión" del sustrato en el producto.
“Termoestable" se refiere al polipéptido transaminasa que mantiene una actividad similar (más de 60% a 80%, por ejemplo) después de la exposición a temperaturas elevadas (por ejemplo, 40-80°C) durante un período de tiempo (por ejemplo, 0,5-24 h) en comparación con la enzima tipo silvestre.
“Estable al solvente" se refiere a un polipéptido transaminasa que mantiene una actividad similar (más de, por ejemplo, 60% a 80%) después de la exposición a concentraciones variables (por ejemplo, 5-99%) de solvente (etanol, alcohol isopropílico, dimetilsulfóxido (DMSO), tetrahidrofurano, 2-metiltetrahidrofurano, acetona, tolueno, acetato de butilo, metil tert-butil éter, etc.) por un período de tiempo (por ejemplo, 0,5-24 h) en comparación con la enzima tipo silvestre.
“Termoestable y estable al solvente" se refiere a un polipéptido transaminasa que es tanto termoestable como estable al solvente.
“Hibridación rigurosa" se usa en este documento para referirse a las condiciones bajo las cuales los híbridos de ácido nucleico son estables. Como saben los expertos en la materia, la estabilidad de los híbridos se refleja en la temperatura de fusión (Tf) de los híbridos. En general, la estabilidad de un híbrido es una función de la fuerza iónica, la temperatura, el contenido G/C, y la presencia de agentes caotrópicos. Los valores de Tf para los polinucleótidos se pueden calcular empleando métodos conocidos para predecir las temperaturas de fusión (véanse, por ejemplo, Baldino et al., Methods Enzymology 168:761-777; Bolton et al., 1962, Proc. Natl. Acad. Sci. USA 48:1390; Bresslauer et al., 1986, Proc. Natl. Acad. Sci USA 83:8893-8897; Freier et al., 1986, Proc. Natl. Acad. Sci USA 83:9373-9377; Kierzek et al., Biochemistry 25:7840-7846; Rychlik et al., 1990, Nucleic Acids Res 18:6409-6412 (erratum, 1991, Nucleic Acids Res 19:698); Sambrook et al., supra); Suggs et al., 1981, In Developmental Biology Using Purified Genes (Brown et al., eds.), pp.683-693, Academic Press; y Wetmur, 1991, Crit Rev Biochem Mol Biol 26:227-259. En algunas realizaciones, el polinucleótido codifica el polipéptido dado a conocer en este documento y se hibrida en condiciones definidas, como condiciones moderadamente rigurosas o altamente rigurosas, al complemento de la secuencia que codifica una enzima transaminasa genomanipulada de la presente divulgación.
“Rigurosidad de hibridación" se refiere a las condiciones de hibridación, como condiciones de lavado en la hibridación de ácidos nucleicos. Generalmente, las reacciones de hibridación se llevan a cabo en condiciones de baja rigurosidad, seguidas de lavados de rigurosidad variable pero mayor. La expresión "hibridación moderadamente rigurosa" se refiere a las condiciones que permiten que el ADN-diana se una a un ácido nucleico complementario que tiene alrededor de 60% de identidad, preferentemente alrededor de 75% de identidad, alrededor del 85% de identidad con el ADN diana, con más de alrededor de 90% de identidad con el polinucleótido-diana. Ejemplos de condiciones moderadamente rigurosas son condiciones equivalentes a la hibridación en 50% de formamida, 5 x solución de Denhart, 5 x SSPE, 0,2% de SDS a 42°C, seguido de lavado en 0,2 x SSPE, 0,2% de SDS, a 42°C.
“Hibridación altamente rigurosa" se refiere generalmente a condiciones que son alrededor de 10°C o menos de la temperatura de fusión térmica Tf según se determina en la condición de solución para una secuencia de polinucleótido definida. En algunas realizaciones, una condición de alta rigurosidad se refiere a las condiciones que permiten la hibridación de solo aquellas secuencias de ácido nucleico que forman híbridos estables en NaCl 0,018 M a 65°C (es decir, si un híbrido no es estable en NaCl 0,018 M a 65°C, no ser estable en condiciones de alta rigurosidad, según se contempla en este documento). Se pueden proporcionar condiciones de alta rigurosidad, por ejemplo, mediante hibridación en condiciones equivalentes a 50% de formamida, 5 x solución de Denhart, 5 x SSPE, 0,2% de SDS a 42°C, seguida de lavado en 0,1 x SSPE, y 0,1% de SDS a 65°C. Otra condición de alta rigurosidad es hibridar en condiciones equivalentes a la hibridación en 5 x SSC que contiene 0,1% (p:v) de SDS a 65°C y lavado en 0,1 x SSC que contiene 0,1% de SDS a 65°C. Otras condiciones de alta rigurosidad de hibridación, así como condiciones moderadamente rigurosas, se describen en las referencias citadas antes.
Polinucleótido "heterólogo" se refiere a cualquier polinucleótido que es introducido en la célula hospedadora mediante técnicas de laboratorio, e incluye polinucleótidos que son extraídos de una célula hospedadora, sometidos a manipulación en el laboratorio, y luego reintroducidos en una célula hospedadora.
“Codones optimizados" se refiere a los cambios en los codones del polinucleótido que codifica una proteína a los preferencialmente utilizados en un organismo particular, de modo que la proteína codificada se exprese eficientemente en el organismo de interés. Aunque el código genético está degenerado en cuanto a que la mayoría de los aminoácidos están representados por varios codones, denominados "sinónimos" o codones "sinónimos", es bien sabido que el uso de codones por organismos particulares no es aleatorio y está sesgado hacia tripletes de codones particulares. Este sesgo de uso de codones puede ser mayor en referencia a un determinado gen, genes de función u origen ancestral común, proteínas altamente expresadas frente a proteínas de bajo número de copias y regiones de codificación de proteínas agregadas del genoma de un organismo. En algunas realizaciones, los polinucleótidos que codifican las enzimas transaminasa pueden tener codones optimizados para la producción óptima desde el organismo hospedador elegido para la expresión.
"Codones preferidos, óptimos, de alto sesgo en el uso de codones" se refiere indistintamente a codones que se usan con mayor frecuencia en las regiones de codificación de proteínas que otros codones que codifican el mismo aminoácido. Los codones preferidos se pueden determinar en relación con el uso de codones en un solo gen, un conjunto de genes de función u origen común, genes altamente expresados, la frecuencia de codones en las regiones de codificación de proteínas agregadas en todo el organismo, la frecuencia de codones en las regiones de codificación de proteínas agregadas de organismos relacionados, o sus combinaciones. Los codones cuya frecuencia aumenta con el nivel de expresión del gen, son habitualmente codones óptimos para la expresión. Se conocen diversos métodos para determinar la frecuencia de codones (por ejemplo, uso de codones, uso relativo de codones sinónimos) y la preferencia de codones en organismos específicos, que incluyen análisis multivariable, por ejemplo, usando análisis de conglomerados o análisis de correspondencia, y el número efectivo de codones utilizados en un gen (véanse GCG CodonPreference, Genetics Computer Group Wisconsin Package; CodonW, John Peden, University of Nottingham; McInerney, J. O, 1998, Bioinformatics 14:372-73; Stenico et al., 1994, Nucleic Acids Res. 222437-46; Wright, F., 1990, Gene 87:23-29). Se dispone de tablas de uso de codones para una lista creciente de organismos (véanse por ejemplo, Wada et al., 1992, Nucleic Acids Res. 20:2111-2118; Nakamura et al., 2000, Nucl. Acids Res. 28:292; Duret, et al., supra; Henaut y Danchin, "Escherichia coli and Salmonella," 1996, Neidhardt, et al. Eds., ASM Press, Washington D.C., pp. 2047-2066. La fuente de datos para obtener el uso de codones puede basarse en cualquier secuencia de nucleótidos disponible capaz de codificar una proteína. Estos conjuntos de datos incluyen secuencias de ácido nucleico que se sabe en la actualidad que codifican proteínas expresadas (por ejemplo, secuencias que codifican proteínas completas-CDS), etiquetas de secuencias expresadas (ESTS), o regiones de codificación predichas de secuencias genómicas (véanse por ejemplo, Mount, D., Bioinformatics: Sequence and Genome Analysis, capítulo 8, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 2001; Uberbacher, E. C., 1996, Methods Enzymol.
266:259-281; Tiwari et al., 1997, Comput. Appl. Biosci. 13:263-270).
“Secuencia de control" se define en este documento de modo de incluir todos los componentes, que son necesarios o ventajosos para la expresión de un polinucleótido y/o polipéptido de la presente divulgación. Cada secuencia control puede ser nativa o extraña a la secuencia de ácido nucleico que codifica el polipéptido. Dichas secuencias de control incluyen, pero no exclusivamente, un líder, una secuencia de poliadenilación, una secuencia de propéptido, un promotor, una secuencia de péptido señal y un terminador de la transcripción. Como mínimo, las secuencias de control
incluyen un promotor y señales de parada de la transcripción y la traducción. Las secuencias de control pueden estar provistas de conectores con el fin de introducir sitios de restricción específicos que faciliten la ligación de las secuencias de control con la región de codificación de la secuencia de ácido nucleico que codifica un polipéptido.
“Unido operativamente" se define en este documento como una configuración en la cual una secuencia de control se coloca adecuadamente (es decir, en una relación funcional) en una posición en relación con un polinucleótido de interés, de modo que la secuencia de control dirija o regule la expresión del polinucleótido y/o polipéptido de interés.
“Secuencia promotora" se refiere a una secuencia de ácido nucleico que es reconocida por una célula hospedadora para la expresión de un polinucleótido de interés, como una secuencia de codificación. La secuencia promotora contiene secuencias de control transcripcional, que median la expresión de un polinucleótido de interés. El promotor puede ser cualquier secuencia de ácido nucleico que tenga actividad transcripcional en la célula hospedadora de elección, incluidos los promotores mutantes, truncados e híbridos, y que se pueda obtener de genes que codifican polipéptidos extracelulares o intracelulares ya sean homólogos o heterólogos a la célula hospedadora.
“Condiciones de reacción adecuadas" se refieren a las condiciones en la solución de reacción biocatalítica (por ejemplo, intervalos de carga de enzima, carga de sustrato, carga de cofactor, temperatura, pH, tampones, cosolventes, etc.) en las cuales un polipéptido transaminasa de la presente divulgación es capaz de convertir un compuesto sustrato en un compuesto producto (por ejemplo, conversión de un Compuesto (IA) en un Compuesto (IIA)). Ejemplos de las "condiciones de reacción adecuadas" se proporcionan en la presente divulgación y se ilustran mediante los Ejemplos.
“Carga", como en "carga de compuesto" o "carga de enzima" o "carga de cofactor" se refiere la concentración o cantidad de un componente en una mezcla de reacción al inicio de la reacción.
“Sustrato" en el contexto de un proceso mediado por biocatalizador se refiere al compuesto o la molécula sobre el/la que actúa el biocatalizador. Por ejemplo, un ejemplo de sustrato para el biocatalizador transaminasa en el proceso dado a conocer en este documento es el compuesto (IA).
“Producto" en el contexto de un proceso mediado por biocatalizador se refiere el compuesto o la molécula que resulta de la acción del biocatalizador. Por ejemplo, un ejemplo de producto para el biocatalizador transaminasa en el proceso dado a conocer en este documento es el compuesto (IIA).
La presente divulgación proporciona métodos de uso de polipéptidos que tienen actividad de transaminasa para la síntesis de (S)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina en exceso enantiomérico de (R)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina. Cuando la descripción se refiere a polipéptidos, se debe entender que también describe los polinucleótidos que codifican los polipéptidos.
Las aminotransferasas, también conocidas como transaminasas, catalizan la transferencia de un grupo amino desde una amina primaria de un sustrato dador de amino al grupo carbonilo (por ejemplo, un grupo ceto o aldehido) de una molécula aceptora de amino. Se han identificado aminotransferasas de diversos organismos como Alcaligenes denitrificans, Bordetella bronchiseptica, Bordetella parapertussis, Brucella melitensis, Burkholderia malle, Burkholderia pseudomallei, Chromobacterium violaceum, Oceanicola granulosus HTCC2516, Oceanobacter sp. RED65, Oceanospirillum sp. MED92, Pseudomonas putida, Ralstonia solanacearum, Rhizobium meliloti, Rhizobium sp. (cepa NGR234), Vibrio fluvialis, Bacillus thuringensis, y Klebsiella pneumoniae (Shin et al., 2001, Biosci. Biotechnol, Biochem. 65:1782-1788).
Las transaminasas son útiles para la resolución quiral de aminas racémicas al explotar la capacidad de las transaminasas para llevar a cabo la reacción de manera estereoespecífica, es decir conversión preferencial de un enantiómero en la cetona correspondiente, de lo que resulta una mezcla enriquecida en el otro enantiómero (véase, por ejemplo, Koselewski et al., 2009, Org Lett. 11(21 ):4810-2). La estereoselectividad de las transaminasas en la conversión de una cetona en la amina correspondiente también hace que estas enzimas sean útiles en la síntesis asimétrica de aminas ópticamente puras a partir de los correspondientes compuestos ceto (véanse, por ejemplo, Hohne et al., "Biocatalytic Routes to Optically Active Amines," Chem Cat Chem 1(1):42 - 51; Zua y Hua, 2009, Biotechnol J. 4(10):1420-31).
La w-transaminasa de Vibrio fluvialis (w-VfT) posee una alta enantioselectividad por el enantiómero (S) de las aminas quirales y tiene especificidad de sustrato distintiva por las aminas aromáticas quirales (Shin y Kim, 2001, J. Org. Chem.
67:2848-2853). Alta enantioselectividad de w-VfT se ha aplicado a la resolución quiral de aminas (H. Yun, B.-K. Cho, B.-G. Kim, Biotechnol. Bioeng. 2004, 87, 772-778; J.-S. Shin, B.-G. Kim, Biotechnol. Bioeng. 1997, 55, 348-358; M. Hghne, K. Robins, U. T. Bornscheuer, Adv. Synth. Catal. 2008, 350,802-807). La enzima también ha sido utilizada en la síntesis asimétrica de aminas ópticamente puras usando un sustrato cetona proquiral. Sin embargo, la limitación en la síntesis asimétrica es el equilibrio desfavorable de la reacción inversa (Shin y Kim, 1999, Biotechnol. Bioeng. 65, 206-211), inhibición de la enzima w-VfT por el producto amina (Shin et al., 2001, Biotechnol Bioeng 73:179-187; Yun y Kim, 2008, Biosci. Biotechnol. Biochem. 72(11):3030-3033); baja actividad en aceptores de amino que tienen
cadenas laterales voluminosas como grupos aromáticos (Shin y Kim, 2002, J. Org. Chem. 67:2848-2853); y baja estabilidad de la enzima (Yun y Kim, supra).
Transaminasas genomanipuladas derivadas de la transaminasa de Vibrio fluvialis que tienen mayor resistencia a las cetonas alifáticas se describen en Yun et al., 2005, Appl Environ Micriobiol., 71 (8):4220-4224) mientras que w -VfT con más amplia especificidad por un sustrato dador de amino se describen en Cho et al., 2008, Biotechnol Bioeng.
99(2):275-84. Las publicaciones de patentes WO2010081053 y US20100209981 describen w-VfT genomanipuladas con mayor estabilidad a la temperatura y/o al solvente orgánico y actividad enzimática frente a moléculas receptoras de amino estructuralmente diferentes.
La presente divulgación se refiere a métodos de uso de polipéptidos transaminasa genomanipulados derivados de V. fluvialis que median de manera eficiente la conversión de 1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-ona, en el producto compuesto (S)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina en exceso enantiomérico. Significativamente, la divulgación identifica las posiciones de residuos de aminoácidos y las mutaciones correspondientes en el polipéptido transaminasa, que aumentan la actividad enzimática, la enantioselectividad, la estabilidad y la refractariedad a la inhibición por el producto en la conversión de 1-(1 H-5-fluoro-6-cloro-indol-3-il)propan-2-ona, en el producto compuesto (S)-1 -(1 H-5-fluoro-6-cloro-indol-3-il)propan-2-amina.
En consecuencia, en un aspecto la presente divulgación se refiere a métodos de uso de polipéptidos que son capaces de convertir el sustrato compuesto (IA), 1 -(1 H-5-fluoro-6-cloro-indol-3-il)propan-2-ona, en el producto compuesto (IIA), (S)-1 -(1 H-5-fluoro-6-cloro-indol-3-il)propan-2-amina,
Esquema 1
en presencia de un dador de amino, donde la (S)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina se produce en exceso enantiomérico del compuesto (IIC), (R)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina.
En algunos aspectos de la divulgación, los polipéptidos utilizados en los métodos son transaminasas que no son de origen natural, genomanipuladas para mejorar las propiedades en comparación con el polipéptido V. fluvialis tipo silvestre de SEQ ID NO: 2, u otro polipéptido genomanipulado, por ejemplo SEQ ID NO: 4. Estos polipéptidos transaminasa genomanipulados adaptados para la conversión eficiente de la conversión de 1-(1H-5-fluoro-6-cloroindol-3-il)propan-2-ona en (S)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina tienen una o más diferencias de residuos en comparación con la secuencia de aminoácidos de SEQ ID NO: 2 o un polipéptido transaminasa genomanipulado de referencia, como el polipéptido de referencia de SEQ ID NO: 4. Las diferencias de residuos se asocian con mejoras en las propiedades enzimáticas, que incluyen actividad enzimática, estabilidad enzimática y resistencia a la inhibición por el producto amina.
En algunos aspectos de la divulgación, los polipéptidos transaminasa genomanipulados utilizados en la presente divulgación, presentan mayor actividad en la conversión del sustrato 1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-ona en el producto (S)-1-(1 H-5-fluoro-6-cloro-indol-3-il)propan-2-amina, producto en exceso enantiomérico, en un tiempo definido con la misma cantidad de enzima en comparación con la enzima tipo silvestre o una enzima genomanipulada de referencia. En algunos aspectos, el polipéptido transaminasa genomanipulado tiene al menos alrededor de 1,2 veces, 1,5 veces, 2 veces, 3 veces, 4 veces, 5 veces, 10 veces, 20 veces, 30 veces, 40 veces, o 50 veces o más actividad en comparación con el polipéptido representado por SEQ ID NO: 4, en condiciones de reacción adecuadas.
En algunos aspectos de la divulgación, los polipéptidos transaminasa genomanipulados utilizados en la presente divulgación tiene mayor estabilidad a la temperatura y/o los solventes empleados en la reacción de conversión en comparación con la enzima tipo silvestre o genomanipulada de referencia. En algunos aspectos, el polipéptido transaminasa genomanipulado tiene al menos 1,2 veces, 1,5 veces, 2 veces, 3 veces, 4 veces, 5 veces, 10 veces o más estabilidad en comparación con el polipéptido de SEQ ID NO: 4, en condiciones de reacción adecuadas.
En algunos aspectos de la divulgación, los polipéptidos transaminasa genomanipulados utilizados en la presente divulgación tienen mayor refractariedad o resistencia a la amina producto (S)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina en comparación con la enzima tipo silvestre o genomanipulada de referencia. En algunos aspectos, el polipéptido transaminasa genomanipulado tiene al menos 1,2 veces, 1,5 veces, 2 veces, 3 veces, 4 veces, 5 veces o
más resistencia a la inhibición por 1 -(1 H-5-fluoro-6-cloro-indol-3-il)propan-2-amina, en particular (S)-1 -(1 H-5-fluoro-6-cloro-indol-3-il)propan-2-amina, en comparación con el polipéptido representado por SEQ ID NO: 4, en condiciones de reacción adecuadas, como se describe más detalladamente a continuación.
En algunos aspectos de la divulgación, los polipéptidos transaminasa genomanipulados utilizados en la presente divulgación son capaces de convertir el sustrato 1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-ona en el producto (S)-1-(1 H-5-fluoro-6-cloro-indol-3-il)propan-2-amina en exceso enantiomérico mayor de 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,5 o mayor respecto a (R)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina, en condiciones de reacción adecuadas.
En algunos aspectos de la divulgación, los polipéptidos transaminasa genomanipulados utilizados en la presente divulgación son capaces de convertir el compuesto (IA) en el compuesto (IIA) con mayor tolerancia por la presencia de sustrato en relación con el polipéptido de referencia de SEQ ID NO: 4, en condiciones de reacción adecuadas. Por lo tanto, en algunos aspectos, los polipéptidos transaminasa genomanipulados son capaces de convertir el sustrato compuesto (IIA) en el producto compuesto (IA) en presencia de una concentración de carga de sustrato de al menos alrededor de 1 g/L, alrededor de 5 g/L, alrededor de 10 g/L, alrededor de 20 g/L, alrededor de 30 g/L, alrededor de 40 g/L, alrededor de 50 g/L, alrededor de 70 g/L, alrededor de 100 g/L, alrededor de 125 g/L, alrededor de 150 g/L, alrededor de 175 g/L o alrededor de 200 g/L o más con un porcentaje de conversión de al menos alrededor de 50%, al menos alrededor de 60%, al menos alrededor de 70%, al menos alrededor de 80%, al menos alrededor de 90%, al menos alrededor de 95%, al menos alrededor de 98% o al menos alrededor de 99%, en un tiempo de reacción de alrededor de 72 h o menos, alrededor de 48 h o menos, alrededor de 36 h o menos, o alrededor de 24 h o menos, en condiciones de reacción adecuadas.
Las condiciones de reacción adecuadas en las cuales las propiedades mejoradas descritas antes de los polipéptidos genomanipulados llevan a cabo la conversión, se pueden determinar con respecto a concentraciones o cantidades de polipéptido, sustrato, cofactor, tampón, cosolvente, pH, y/o condiciones que incluyen temperatura y tiempo de reacción, como se describe más detalladamente más adelante y en los Ejemplos.
Los ejemplos de polipéptidos genomanipulados utilizados en la presente divulgación tienen asociadas con sus propiedades mejoradas para la conversión del compuesto (IA) en el compuesto (IIA) que incluyen una o más diferencias de residuos en comparación con SEQ ID NO: 2 en las posiciones de residuos siguientes: X9; X14; X18; X21; X26; X31; X33; X41; X45; X47; X57; X70; X86; X88; X107; X113; X132; X133; X146; X147; X148; X153; X163; X168; X173; X177; X203; X211; X233T; X235; X244; X250; X284; X294; X314; X315; X318; X323; X324; X324; X346; X383; X391; X395; X398; X400; X417; X419; X420; X423; X424; X427; X448; y X451. Las diferencias de aminoácidos específicas en cada una de estas posiciones que están asociadas con las propiedades mejoradas de los polipéptidos de ejemplo de las Tablas 2A y 2B incluyen: X9T; X14V; X18A; X21H; X26R; X31M; X31S; X33T; X41L; X45H; X47N; X57F; X57Y; X70A; X86D; X86Y; X88A; X88L; X107P; X113L; X113V; X132F; X133R; X146L; X147K; X148Q; X148R; X153S; X163F; X163I; X163L; X163R; X163V; X168K; X168S; X173A; X177L; X203S; X211K; X233T; X235P; X244T; X250A; X284A; X294V; X314N; X315G; X318D; X323T; X324G; X324H; X346L; X383V; X391A; X395P; X398L; X398V; X398W; X400G; X417M; X419S; X420N; X423I; X424V; X424A; X427Y; X448E; y X451D.
Las diferencias de residuos en comparación con la transaminasa genomanipulada representada por SEQ ID NO: 4 incluyen aquellas en las posiciones de residuos: X14; X26; X31; X33; X41; X47; X57; X70; X86; X88; X107; X113; X132; X148; X163; X168; X173; X203; X250; X284; X314; X315; X324; X346; X395; X398; X400; X417; X419; X420; X423; X424; X448; y X451. Las diferencias de aminoácidos específicas en esas posiciones incluyen: X14V; X26R; X31S; X33T; X41L; X47N; X57F; X57Y; X70A; X86D; X88A; X88L; X107P; X113L; X113V; X132F; X148Q; X148R; X163I; X163L; X163R; X163V; X168K; X168S; X173A; X203S; X250A; X284A; X314N; X315G; X324H; X346L; X395P; X398L; X398V; X398W; X400G; X417M; X419S; X420N; X423I; X424V; X448E; y X451D. Aunque las diferencias de residuos en comparación con SEQ ID NO: 4 también se producen en las posiciones de residuos X153 y X383, estas diferencias representan reversiones al residuo de aminoácido presente en la secuencia tipo silvestre de SEQ ID NO: 2, lo que indica que las interconversiones entre los aminoácidos S y V en la posición del residuo X153 y entre los aminoácidos A y V en la posición del residuo X383 no tienen efectos perjudiciales significativos sobre las propiedades de la enzima genomanipulada.
La información de estructura y función para los ejemplos de polipéptidos transaminasa que no son de origen natural (o genomanipulados) utilizados en el método de la presente divulgación se muestran más adelante en las Tablas 2A y 2B. Los identificadores de secuencia de número impar (es decir, SEQ ID NO) se refieren a la secuencia de nucleótidos que codifica la secuencia de aminoácidos provista por las SEQ ID NO de número par, y las secuencias se proporcionan en el archivo electrónico de Lista de secuencias que acompaña esta divulgación, que se incorpora por referencia en este documento. Las diferencias de residuos de aminoácidos se basan en la comparación con la secuencia de referencia de SEQ ID NO: 4, que es una transaminasa genomanipulada derivada del polipéptido w-VfT tipo silvestre que tiene las 24 diferencias de residuos de aminoácidos siguientes A9T; G18A; D21H; V31M; N45H; F86Y; A133R; R146L; W147K; V153S; K163F; V177L; R211K; P233T; A235P; P244T; M294V; P318D; A323T; S324G; A383V; T391A; C424A; F427Y con respecto a SEQ ID NO: 2. La actividad de cada polipéptido genomanipulado con
respecto al polipéptido de referencia de SEQ ID NO: 4 se determinó como la conversión del sustrato cetona 1 -(1H-5-fluoro-6-cloro-indol-3-il)propan-2-ona, en el producto amina compuesto (S)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina en un período de tiempo y una temperatura establecidos en un ensayo de alto rendimiento (HTP), que se usó como cribado primario. Los valores del ensayo HTP de la Tabla 2A se determinaron utilizando lisados celulares claros de E. coli. en el formato de placas de 96 pocillos de ~200 pL de volumen por pocillo, siguiendo las condiciones de reacción del ensayo indicadas en la Tabla y en los Ejemplos. En algunos casos, se usó un ensayo de polvo en matraz de agitación (SFP) y/o de procesamiento descendente del polvo (DSP) como un cribado secundario para evaluar las propiedades de las transaminasas genomanipuladas, cuyos resultados se proporcionan en la Tabla 2B. Las formas SFP y DSP proporcionan una preparación en polvo más purificada de los polipéptidos genomanipulados. Por ejemplo, la transaminasa genomanipulada en las preparaciones SFP es aproximadamente 30% de la proteína total mientras que las preparaciones DSP pueden contener las transaminasas genomanipuladas que son aproximadamente 80% de la proteína total.
Los niveles de actividad (es decir, "+" "++", etc.) se definen de la manera siguiente: "+" indica 1,2 veces o más actividad, en comparación con la de SEQ ID NO: 4 para el polipéptido transaminasa genomanipulado SEQ ID NO: 6 a 14, y 1,2 o más actividad, en comparación con la de SEQ ID NO: 8 para el polipéptido transaminasa genomanipulado SEQ ID NO: 16 a 154; y un "++" indica 5 veces o más actividad, en comparación con la de SEQ ID NO: 4 para los polipéptidos transaminasa genomanipulados SEQ ID NO: 6-14; y 5 veces o más actividad, en comparación con la de SEQ ID NO: 8 para los polipéptidos transaminasa genomanipulados SEQ ID NO: 16 a 154. Los datos de estabilidad se obtienen incluyendo las cantidades siguientes del producto (S)-1 -(1 H-5-fluoro-6-cloro-indol-3-il)propan-2-amina en el ensayo y comparando la actividad con la de una enzima de referencia en las mismas condiciones: 14 g/L para el análisis de los polipéptidos transaminasa genomanipulados de SEQ ID NO 6 a 14, y 16 g/L para el análisis de los polipéptidos transaminasa genomanipulados SEQ ID NO 16 a 154. La evaluación de la estabilidad se hizo comparando las actividades a dos temperaturas diferentes, 55°C y 50°C.
Tabla 2A: Polipéptidos genomanipulados y mejoras enzimáticas relativas utilizando preparaciones HTP (SEQ ID 134 de acuerdo con la invención SEQ ID 1-133 135-154 solo como referencia
Tabla 2B: Polipéptidos genomanipulados y mejoras enzimáticas relativas utilizando preparaciones en polvo en matraz d - -
A partir de una inspección de los ejemplos de polipéptidos útiles en los métodos de la presente divulgación, las mejoras en las propiedades enzimáticas se asocian con diferencias de residuos en comparación con SEQ ID NO: 4 en las posiciones de los residuos X14; X26; X31; X33; X41; X47; X57; X70; X86; X88; X107; X113; X132; X148; X163; X168; X173; X203; X250; X284; X314; X315; X324; X346; X395; X398; X400; X417; X419; X420; X423; X424; X448; y X451. Las diferencias de los residuos específicas en cada una de estas posiciones están asociadas con las propiedades mejoradas incluyen: X14V; X26R; X31S; X33T; X41L; X47N; X57F; X57Y; X70A; X86D; X88A; X88L; X107P; X113L; X113V; X132F; X148Q; X148R; X163I; X163L; X163R; X163V; X168K; X168S; X173A; X203S; X250A; X284A; X314N; X315G; X324H; X346L; X395P; X398L; X398V; X398W; X400G; X417M; X419S; X420N; X423I; X424V; X448E; y X451D.
En consecuencia, en algunos aspectos de la divulgación, el polipéptido transaminasa genomanipulado útil en los métodos de la presente divulgación capaz de convertir el sustrato Compuesto (IA), 1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-ona, en el producto Compuesto (IIA), (S)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina con propiedades mejoradas en comparación con SEQ ID NO: 4, comprende una secuencia de aminoácidos que tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más de identidad de secuencia con la secuencia de referencia SEQ ID NO: 2 y una o más diferencias de residuos en comparación con SEQ ID NO: 4 en las posiciones de residuos elegidas entre: X14; X26; X31; X33; X41; X47; X57; X70; x 86; X88; X107; X132; X148; X163; X168; X173; X203; X250; X284; X314; X315; X324; X346; X395; X398; X400; X417; X419; X423; X448; y X451, donde las diferencias de residuos en las posiciones de los residuos X31; X57; X86; X163; X168; X314; X324; X398; y X417 se eligen entre: X31S; X57Y; X86D; X163I; X163L; X163R; X163V; X168S; X314N; X324H; X398L; X398V; X398W; y X417M.
En algunos aspectos, el polipéptido transaminasa genomanipulado útil en los métodos dados a conocer en la presente, capaz de convertir el sustrato Compuesto (IA) en el producto Compuesto (IIA) con propiedades mejoradas en comparación con SEQ ID NO: 4, comprende una secuencia de aminoácidos que tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más de identidad de secuencia con la secuencia de referencia SEQ ID NO: 4 y una o más diferencias de residuos en comparación con SEQ ID NO: 4 en las posiciones de residuos elegidas entre: X14; X26; X31; X33; X41; X47; X57; X70; X86; X88; X107; X132; X148; X163; X168; X173; X203; X250; X284; X314; X315; X324; X346; X395; X398; X400; X417; X419; X423; X448; y X451, donde las diferencias de residuos en las posiciones de los residuos X31; X57; X86; X163; X168; X314; X324; X398; y X417 se eligen entre: X31S; X57Y; X86D; X163I; X163L; X163R; X163V; X168S; X314N; X324H; X398L; X398V; X398W; y
X417M. En algunos aspectos, los polipéptidos transaminasa genomanipulados son capaces de llevar a cabo la conversión con las enantioselectividades descritas antes, por ejemplo, > 90% de ee.
En algunos aspectos, el polipéptido transaminasa útil en los métodos dados a conocer en la presente, capaz de convertir el sustrato Compuesto (IA) en producto Compuesto (IIA) con propiedades mejoradas en comparación con SEQ ID NO: 4, comprende una secuencia de aminoácidos que tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más de identidad con una secuencia de referencia elegida entre SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, y 154, y una o más diferencias de residuos en comparación con SEQ ID NO: 4 en las posiciones de los residuos elegidas entre: X14; X26; X31; X33; X41; X47; X57; X70; X86; X88; X107; X132; X148; X163; X168; X173; X203; X250; X284; X314; X315; X324; X346; X395; X398; X400; X417; X419; X423; X448; y X451, donde las diferencias de residuos en las posiciones de los residuos X31; X57; X86; X163; X168; X314; X324; X398; y X417 se eligen entre: X31S; X57Y; X86D; X163I; X163L; X163R; X163V; X168S; X314N; X324H; X398L; X398V; X398W; y X417M. En algunos aspectos, la secuencia de referencia se elige entre SEQ ID NO: 4, 8, 14, 16, 132, 134 y 146. En algunos aspectos, la secuencia de referencia SEQ ID NO: 4. En algunos aspectos, la secuencia de referencia SEQ ID NO: 8. En algunos aspectos, la secuencia de referencia SEQ ID NO: 134. En otro aspecto de la divulgación, la secuencia de referencia es SEQ ID NO: 146.
En algunos aspectos de la divulgación, el polipéptido transaminasa capaz de convertir el sustrato Compuesto (IA) en producto Compuesto (IIA) con propiedades mejoradas en comparación con SEQ ID NO: 4, comprende una secuencia de aminoácidos elegida entre SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, y 154, y que tiene una o más diferencias de residuos en comparación con SEQ ID NO: 4 en las posiciones de los residuos elegidas entre: X14; X26; X31; X33; X41; X47; X57; X70; X86; X88; X107; X132; X148; X163; X168; X173; X203; X250; X284; X314; X315; X324; X346; X395; X398; X400; X417; X419; X423; X448; y X451, donde las diferencias de residuos en las posiciones de los residuos X31; X57; X86; X163; X168; X314; X324; X398; y X417 se eligen entre: X31S; X57Y; X86D; X163I; X163L; X163R; X163V; X168S; X314N; X324H; X398L; X398V; X398W; y X417M. En algunos aspectos, la secuencia de aminoácidos se elige entre SEQ ID NO: 4, 8, 14, 16, 132, 134 y 146. En algunos aspectos, la secuencia de aminoácidos es SEQ ID NO: 4. En algunos aspectos, la secuencia de aminoácidos es SEQ ID NO: 8. En una realización, la secuencia de aminoácidos es SEQ ID NO: 134. En otro aspecto, la secuencia de aminoácidos es SEQ ID NO: 146.
En algunos aspectos de la divulgación, el polipéptido transaminasa genomanipulado es capaz de convertir el sustrato Compuesto (IA) en el producto Compuesto (IIA) con al menos 1,2 veces la actividad en relación con SEQ ID NO: 4, y comprende una secuencia de aminoácidos elegida entre: SEQ ID NO: 6, 8, 10, 12, 14, 16, 22, 24, 28, 30, 32, 48, 52, 56, 62, 64, 66, 68, 86, 88, 90, 92, 98, 100, 104, 106, 108, 110, 112, 114, 116, 118, 124, 126, 128, 132, 134, 136, 142, 144, 148, y 154.
En algunos aspectos de la divulgación, el polipéptido transaminasa genomanipulado es capaz de convertir el sustrato Compuesto (IA) en el producto Compuesto (IIA) con al menos 5 veces la actividad en relación con SEQ ID NO: 4, y comprende una secuencia de aminoácidos que tiene una o más diferencias de residuos elegidas entre: X14V, X26R; X33T; X88A/L; X163I/L; y X284A.
En algunos aspectos de la divulgación, el polipéptido transaminasa genomanipulado útil en los métodos dados a conocer en la presente, es capaz de convertir el sustrato Compuesto (IA) en el producto Compuesto (I IA) con al menos 5 veces la actividad en relación con SEQ ID NO: 4, y comprende una secuencia de aminoácidos elegida entre: SEQ ID NO: 6, 8, 10, 14, 16, 22, 24, 28, 30, 32, 48, 52, 56, 62, 64, 86, 88, 90, 92, 98, 100, 104, 106, 108, 110, 112, 114, 116, 118, 124, 126, 128, 132, 134, 136, 142, 144, 148, y 154.
En algunos aspectos de la divulgación, el polipéptido transaminasa genomanipulado tiene al menos 1,2 veces, 1,5 veces, 2 veces, 3 veces, 4 veces, 5 veces o más refractariedad a la inhibición por 1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina, en particular (S)-1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina, en comparación con el polipéptido representado por SEQ ID NO: 4 en la conversión del Compuesto (IA) en el Compuesto (IIA). Generalmente el aumento en la refractariedad o resistencia a la inhibición por el compuesto producto se puede medir en las condiciones del ensayo HTP en presencia de 14 g/L o 16 g/L de Compuesto (IIA), como se describe en las Tablas 2A y 2B y los Ejemplos. En algunos aspectos de la divulgación, el polipéptido transaminasa genomanipulado que tiene al menos 1,2 veces o más refractariedad a la inhibición por 1-(1H-5-fluoro-6-cloro-indol-3-il)propan-2-amina comprende una secuencia de aminoácidos que tiene al menos una o más diferencias de residuos en comparación con SEQ ID NO: 4 elegidas entre: X26R; X70A; X86D; X88A/L; X132F; X163L; X315G; X395P; X398L; y X419S.
En algunos aspectos de la divulgación, el polipéptido transaminasa genomanipulado con propiedades mejoradas en la conversión del Compuesto (IA) en el Compuesto (IIA) tiene una secuencia de aminoácidos que comprende una
secuencia elegida entre SEQ ID NO: 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, y 154.
En algunos aspectos de la divulgación, la transaminasa genomanipulada capaz de convertir el Compuesto (IA) en el Compuesto (IIA), en condiciones de reacción adecuadas, comprende una secuencia de aminoácidos que tiene al menos 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, o 99% de identidad con una de las SEQ ID NO: 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, y 154, y las diferencias de residuos de aminoácidos en comparación con SEQ ID NO: 4 presentes en cualquiera de las SEQ ID NO: 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, y 154, como se proporciona en las Tablas 2A and 2B.
En algunos aspectos de la divulgación, los polipéptidos genomanipulados pueden estar en diversas formas, por ejemplo, como una preparación aislada, como una enzima sustancialmente purificada, células enteras transformadas con uno o más genes que codifican la enzima, y/o como extractos celulares y/o como lisados de dichas células. Las enzimas se pueden liofilizar, secar por aspersión, precipitar o estar en forma de una pasta cruda, como se trata más adelante.
En algunos aspectos de la divulgación, los polipéptidos transaminasa pueden estar unidos sobre un sustrato físico. El polipéptido transaminasa puede estar unido covalente o no covalentemente sobre un sustrato físico de modo de retener su actividad, estereoselectividad, tolerancia al producto y estabilidad mejoradas, y/u otras propiedades mejoradas en relación con el péptido de referencia de SEQ ID NO: 4. En dichos aspectos, los polipéptidos inmovilizados pueden facilitar la conversión biocatalítica de los sustratos cetona adecuados, por ejemplo, el Compuesto (IA) o sus análogos estructurales, en el correspondiente producto amina, por ejemplo, el Compuesto (IIA) o sus correspondientes análogos estructurales, y una vez que la reacción se completa son fácilmente retenidos (por ejemplo, mediante perlas de retención sobre las que el polipéptido se inmoviliza) y después reutilizados o reciclados en reacciones subsiguientes. Dichos procesos de enzimas inmovilizadas permiten una mayor eficiencia y reducción de costos. Los métodos de inmovilización de enzimas son bien conocidos en el área. Diversos métodos para la conjugación con sustratos, por ejemplo, membranas, perlas, vidrio, etc. se describen en, entre otros, Hermanson, G.T., Bioconjugate Techniques, 2a edición, Academic Press; (2008), y Bioconjugation Protocols: Strategies and Methods, In Methods in Molecular Biology, C.M. Niemeyer ed., Humana Press (2004).
Polinucleótidos que codifican transaminasas genomanipuladas, vectores de expresión y células hospedadoras
En otro aspecto, la presente divulgación proporciona polinucleótidos que codifican los polipéptidos transaminasa genomanipulados descritos en este documento. Los polinucleótidos pueden estar unidos operativamente a una o más secuencias reguladoras heterólogas que controlan la expresión génica para crear un polinucleótido recombinante capaz de expresar el polipéptido. Los constructos de expresión que contienen un polinucleótido heterólogo que codifica la transaminasa genomanipulada se pueden introducir en células hospedadoras apropiadas para expresar el polipéptido transaminasa correspondiente.
Como será evidente para los técnicos con experiencia, la disponibilidad de una secuencia de proteína y el conocimiento de los codones correspondientes a los diversos aminoácidos, proporcionan una descripción de todos los polinucleótidos capaces de codificar los polipéptidos en cuestión. La degeneración del código genético, en la que los mismos aminoácidos son codificados por codones alternativos o sinónimos, permite que se produzca una cantidad extremadamente grande de ácidos nucleicos, todos los cuales codifican las enzimas transaminasa mejoradas. Por lo tanto, teniendo conocimiento de una secuencia de aminoácidos particular, los expertos en la materia podrían producir cualquier cantidad de ácidos nucleicos diferentes simplemente modificando la secuencia de uno o más codones de una manera que no cambie la secuencia de aminoácidos de la proteína. En este sentido, la presente divulgación contempla específicamente cada una y todas las posibles variaciones de polinucleótidos que podrían producirse codificando los polipéptidos descritos en este documento mediante selección de combinaciones basadas en las posibles elecciones de codones, y todas dichas variaciones deben ser consideradas específicamente divulgadas para cualquier polipéptido descrito en este documento, incluidas las secuencias de aminoácidos presentadas en las Tablas 2A y 2B, y dadas a conocer en la Lista de secuencias incorporada en este documento por referencia como SEQ ID NO: 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, y 154.
En diversos aspectos de la divulgación, los codones se eligen preferentemente para que se adapten a la célula hospedadora en la cual se produce la proteína. Por ejemplo, los codones preferidos utilizados en bacterias se usan
para expresar el gen en las bacterias; los codones preferidos utilizados en levaduras se usan para la expresión en levaduras; y los codones preferidos utilizados en mamíferos se usan para la expresión en células de mamífero. En algunos aspectos, no todos los codones necesitan ser reemplazados para optimizar el uso de codones de las transaminasas dado que la secuencia natural comprenderá los codones preferidos y porque el uso de codones preferidos puede no ser necesario para todos los residuos de aminoácidos. Consecuentemente, los polinucleótidos con codones optimizados que codifican las enzimas transaminasa pueden contener codones preferidos en alrededor de 40%, 50%, 60%, 70%, 80% o más de 90% de las posiciones de los codones de la región de codificación de longitud completa.
Un polinucleótido aislado que codifica un polipéptido transaminasa mejorado puede ser manipulado de diversas maneras para proporcionar la expresión del polipéptido. En algunas realizaciones, los polinucleótidos que codifican los polipéptidos se pueden proporcionar como vectores de expresión donde están presentes una o más secuencias de control para regular la expresión de los polinucleótidos y/o los polipéptidos. La manipulación del polinucleótido aislado antes de su inserción en un vector puede ser deseable o necesaria dependiendo del vector de expresión. Las técnicas para modificar polinucleótidos y secuencias de ácido nucleico que utilizan métodos de recombinación del ADN son bien conocidas en el área. Se proporciona una guía en Sambrook et al., 2001, Molecular Cloning: A Laboratory Manual, 3a Ed., Cold Spring Harbor Laboratory Press; y Current Protocols in Molecular Biology, Ausubel. F. ed., Greene Pub. Associates, 1998, actualizaciones hasta 2006.
En aspectos de la divulgación de este documento, los polipéptidos mejorados y los correspondientes polinucleótidos se pueden obtener empleando métodos utilizados por los expertos en la materia. La secuencia del polinucleótido progenitor que codifica el polipéptido tipo silvestre de Vibrio fluvialis se describe en Shin et al., 2003, Appl. Microbiol. Biotechnol. 61(5-6):463-471, y los métodos para generar polipéptidos transaminasa genomanipulados con mejores propiedades de estabilidad y reconocimiento del sustrato se dan a conocer en las publicaciones de solicitudes de patentes WO2010081053 y US20100209981.
Cuando la secuencia del polipéptido genomanipulado es conocida, los polinucleótidos que codifican la enzima se pueden preparar mediante métodos estándar en fase sólida de acuerdo con métodos de síntesis conocidos. En algunas realizaciones, se pueden sintetizar individualmente fragmentos de hasta alrededor de 100 bases, y luego unir (por ejemplo mediante métodos de ligación enzimática o química, o métodos mediados por polimerasa) para formar cualquier secuencia continua deseada. Por ejemplo, los polinucleótidos y oligonucleótidos de la invención se pueden preparar por síntesis química, por ejemplo, usando el método clásico de fosforamidita descrito por Beaucage et al., 1981, Tet Lett 22:1859-69, o el método descrito por Matthes et al., 1984, EMBO J. 3:801-05, por ejemplo, como se practica habitualmente en métodos de síntesis automatizados. De acuerdo con el método de la fosforamidita, los oligonucleótidos se sintetizan, por ejemplo, en un sintetizador de ADN automático, se purifican, se aparean, se ligan y se clonan en los vectores apropiados. Además, esencialmente cualquier ácido nucleico se puede obtener de cualquiera de una diversidad de fuentes comerciales.
En consecuencia, en algunos aspectos de la divulgación, un método para preparar los polipéptidos transaminasa genomanipulados puede comprender: (a) sintetizar un polinucleótido que codifica un polipéptido que comprende la secuencia de aminoácidos elegidas entre SEQ ID NO: 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, y 154 y que tiene una o más diferencias de residuos en comparación con SEQ ID NO: 4 en las posiciones de los residuos elegidas entre: X14; X26; X31; X33; X41; X47; X57; X70; X86; X88; X107; X132; X148; X163; X168; X173; X203; X250; X284; X314; X315; X324; X346; X395; X398; X400; X417; X419; X423; X448; y X451, en donde las diferencias de residuos en las posiciones de los residuos X31; X57; X86; X163; X168; X314; X324; X398; y X417 se eligen entre: X31S; X57Y; X86D; X163I; X163L; X163R; X163V; X168S; X314N; X324H; X398L; X398V; X398W; y X417M.; y (b) expresar el polipéptido transaminasa codificado por el polinucleótido.
Se puede medir la propiedad mejorada deseada de la transaminasa genomanipulada expresada, por ejemplo, actividad, enantioselectividad, estabilidad y tolerancia al producto, en la conversión del compuesto (IA) en el compuesto (IIA), mediante cualquiera de las condiciones de ensayo descritas en este documento.
En algunos aspectos de la divulgación, cualquiera de las enzimas transaminasa genomanipuladas expresadas en una célula hospedadora, puede ser recuperada de las células y/o del medio de cultivo empleando una o más de las técnicas bien conocidas para la purificación de proteínas, que incluyen, entre otras, tratamiento con lisozima, ultrasonido, filtración, salting-out (precipitación salina), ultracentrifugación y cromatografía. Soluciones comerciales adecuadas para la lisis y la extracción de alta eficiencia de proteínas de bacterias, como E. coli, se pueden adquirir con el nombre comercial CelLytic B™ a Sigma-Aldrich de St. Louis MO.
Las técnicas cromatográficas para el aislamiento del polipéptido transaminasa incluyen, entre otras, cromatografía líquida de alto rendimiento de fase inversa, cromatografía de intercambio iónico, electroforesis en gel y cromatografía
por afinidad. Las condiciones para purificar una enzima particular dependerán, en parte, de factores como carga neta, hidrofobicidad, hidrofilicidad, peso molecular, forma molecular, etc., y serán evidentes para los expertos en la materia.
En algunos aspectos, se pueden usar las técnicas de afinidad para aislar las enzimas transaminasa mejoradas. Para
la purificación por cromatografía de afinidad, se puede utilizar cualquier anticuerpo que se una específicamente al polipéptido transaminasa. Para la producción de anticuerpos, se pueden inmunizar diversos animales hospedadores, incluidos pero no exclusivamente, conejos, ratones, ratas, etc., mediante inyección de un polipéptido transaminasa o
un fragmento de este. El polipéptido transaminasa o sus fragmentos pueden estar unidos a un portador adecuado, como BSA, por medio de un grupo funcional de cadena lateral o conectores unidos a un grupo funcional de cadena
lateral. Se pueden utilizar diversos adyuvantes para aumentar la respuesta inmunitaria, dependiendo de las especies hospedadoras, incluidos pero no exclusivamente, el adyuvante de Freund (completo e incompleto), geles minerales
como hidróxido de aluminio, surfactantes como lisolecitina, polioles plurónicos, polianiones, péptidos, emulsiones oleosas, hemocianina de lapa californiana, dinitrofenol y adyuvantes humanos potencialmente útiles como BCG (bacilo
de Calmette Guerin) y Corynebacterium parvum.
Métodos de uso de las enzimas transaminasa genomanipuladas
En otro aspecto, las transaminasas descritas en este documento se pueden usar en un proceso para llevar a cabo reacciones con transaminasa en las que un grupo amino de un dador de amino se transfiere a un aceptor de amino, por ejemplo, un sustrato cetona, para producir una amina. El uso de un aceptor cetona proquiral puede resultar en la producción de una amina quiral en exceso enantiomérico. En general, el proceso para realizar la reacción de transaminación comprende poner en contacto o incubar un dador de amino y un aceptor de amino con un polipéptido transaminasa genomanipulado de la divulgación, en condiciones de reacción adecuadas para convertir el aceptor de
amino en una amina.
En algunos aspectos de la divulgación, se pueden usar las transaminasas en la conversión del sustrato compuesto de
fórmula (I) en el producto compuesto de fórmula (II). En consecuencia, en algunos aspectos, un proceso para preparar el compuesto de fórmula (II) en exceso enantiomérico comprende poner en contacto el compuesto de fórmula (I) en presencia de un dador de amino, en condiciones de reacción adecuadas, con un polipéptido transaminasa genomanipulado descrito en este documento. En algunos aspectos de la divulgación del proceso, el compuesto de
fórmula (II) se puede formar en al menos 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más de exceso enantiomérico.
Para los procesos precedentes, se puede utilizar cualquiera de las transaminasas genomanipuladas descritas en este documento. A modo de ejemplo y sin limitación, en algunas realizaciones, el proceso puede utilizar un polipéptido transaminasa genomanipulado que comprenda una secuencia de aminoácidos que tenga al menos 80%, 85%, 86%,
87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más de identidad con una secuencia de referencia elegida entre SEQ ID NO: 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46,
48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, y
154, y una o más diferencias de residuos en comparación con SEQ ID NO: 4 en las posiciones de los residuos elegidas
entre: X14; X26; X31; X33; X41; X47; X57; X70; X86; X88; X107; X132; X148; X163; X168; X173; X203; X250; X284;
X314; X315; X324; X346; X395; X398; X400; X417; X419; X423; X448; y X451, en donde las diferencias de residuos
en las posiciones de los residuos X31; X57; X86; X163; X168; X314; X324; X398; y X417 se eligen entre: X31S; X57Y;
X86D; X163I; X163L; X163R; X163V; X168S; X314N; X324H; X398L; X398V; X398W; y X417M. En algunos aspectos, la secuencia de referencia se elige entre SEQ ID NO: 4, 8, 14, 16, 132, 134 y 146. En algunos aspectos, la secuencia
de referencia es SEQ ID NO: 4. En algunos aspectos, la secuencia de referencia es SEQ ID NO: 8. En una realización, la secuencia de referencia es SEQ ID NO: 134. En algunos aspectos, la secuencia de referencia es SEQ ID NO: 146.
En algunos aspectos de la divulgación, los ejemplos de transaminasas capaces de llevar a cabo los procesos de este documento pueden ser un polipéptido que comprenda una secuencia de aminoácidos elegida entre SEQ ID NO: 6, 8,
10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, y 154. Se proporciona una guía sobre la elección
y el uso de las transaminasas genomanipulada en las descripciones de este documento, por ejemplo en la Tabla 2 y
los Ejemplos.
En las realizaciones de este documento e ilustradas en los Ejemplos, diversos intervalos de condiciones de reacción adecuadas que se pueden usar en los procesos, incluyen pero no exclusivamente, intervalos de dador de amino, pH, temperatura, tampón, sistema solvente, carga de sustrato, carga de polipéptido, carga de cofactor, presión y tiempo
de reacción. Otras condiciones de reacción adecuadas para llevar a cabo los procesos para la conversión biocatalítica
de compuestos sustrato en compuestos producto utilizando un polipéptido transaminasa genomanipulado descrito en
este documento, se pueden optimizar fácilmente en vista de la guía provista en este documento por la experimentación
de rutina que incluye, pero no exclusivamente, poner en contacto el polipéptido transaminasa genomanipulado y el
compuesto sustrato en condiciones de reacción experimentales de concentración, pH, temperatura, condiciones del solvente, y detectar el compuesto producto.
En las realizaciones descritas en este documento, el polipéptido transaminasa usa un dador de amino para formar los compuestos producto. En algunas realizaciones, el dador de amino en la condición de reacción se puede elegir entre isopropilamina (también denominada en este documento como ''IPM''), putrescina, L-lisina, a-fenetilamina, D-alanina, L-alanina o D,L-alanina o D,L-ornitina. En algunas realizaciones, el dador de amino se elige del grupo que consiste en IPM, putrescina, L-lisina, D- o L- alanina. En algunas realizaciones, el dador de amino es IPM. En algunas realizaciones, las condiciones de reacción adecuadas comprenden el dador de amino, en particular IPM, presente en una concentración entre al menos alrededor de 0,1 y alrededor de 3,0 M, 0,2 y alrededor de 2,5 M, alrededor de 0,5 y alrededor de 2 M o alrededor de 1 y alrededor de 2 M. En algunas realizaciones, el dador de amino está presente en una concentración de alrededor de 0,1; 0,2; 0,3; 0,4; 0,5; 0,6; 0,7; 0,8; 1; 1,5; 2; 2,5 o 3 M. Se pueden usar mayores concentraciones de dador de amino, por ejemplo, IPM, para cambiar el equilibrio hacia la formación del producto amina.
Las condiciones de reacción adecuadas utilizando polipéptidos transaminasa genomanipulados también comprenden generalmente un cofactor. Los cofactores útiles en los procesos que usan las enzimas transaminasa genomanipuladas incluyen, pero no exclusivamente, piridoxal-5'-fosfato (también conocido como piridoxal-fosfato, PLP, P5P), piridoxina (PN), piridoxal (PL), piridoxamina (PM), y sus contrapartes fosforiladas; fosfato de piridoxina (PNP) y fosfato de piridoxamina (PMP). En algunas realizaciones, el cofactor PLP está presente naturalmente en el extracto celular y no necesita ser complementado. En algunas realizaciones de los métodos, las condiciones de reacción adecuadas comprenden el cofactor agregado a la mezcla de reacción de la enzima, por ejemplo, cuando se usa la enzima transaminasa parcialmente purificada o purificada. En algunas realizaciones, las condiciones de reacción adecuadas pueden comprender la presencia de un cofactor elegido entre PLP, PN, PL, PM, PNP y PMP, a una concentración entre alrededor de 0,1 g/L y alrededor de 10 g/L, alrededor de 0,2 g/L y alrededor de 5 g/L, alrededor de 0,5 g/L y alrededor de 2,5 g/L. En algunas realizaciones, las condiciones de reacción comprenden una concentración de PLP de alrededor de 0,1 g/L o menos, 0,2 g/L o menos, 0,5 g/L o menos, 1 g/L o menos, 2,5 g/L o menos, 5 g/L o menos, o 10 g/L o menos. En algunas realizaciones, el cofactor se puede agregar al comienzo de la reacción y/o se puede agregar más cofactor durante la reacción.
El compuesto sustrato en las mezclas de reacción puede variar, teniendo en consideración, por ejemplo, la cantidad deseada del compuesto producto, el efecto de la concentración de sustrato sobre la actividad de la enzima, la estabilidad de la enzima en las condiciones de reacción y el porcentaje de conversión del sustrato en producto. En algunas realizaciones, las condiciones de reacción adecuadas comprenden un compuesto sustrato con una carga de al menos entre alrededor de 0,5 y alrededor de 200 g/L, 1 y alrededor de 200 g/L, 5 y alrededor de 150 g/L, alrededor de 10 y alrededor de 100 g/L, 20 y alrededor de 100 g/L o alrededor de 50 y alrededor de 100 g/L. En algunas realizaciones, las condiciones de reacción adecuadas comprenden un compuesto sustrato con una carga de al menos alrededor de 0,5 g/L, al menos alrededor de 1 g/L, al menos alrededor de 5 g/L, al menos alrededor de 10 g/L, al menos alrededor de 15 g/L, al menos alrededor de 20 g/L, al menos alrededor de 30 g/L, al menos alrededor de 50 g/L, al menos alrededor de 75 g/L, al menos alrededor de 100 g/L, al menos alrededor de 150 g/L o al menos alrededor de 200 g/L, o incluso mayor.
La actividad y/o estereoselectividad mejoradas de los polipéptidos transaminasa genomanipulados dados a conocer en este documento proporcionan procesos en los que se puede lograr un mayor porcentaje de conversión con menores concentraciones del polipéptido genomanipulado. En algunas realizaciones del proceso, las condiciones de reacción adecuadas comprenden una concentración de polipéptido genomanipulado entre alrededor de 0,01 y alrededor de 50 g/L; alrededor de 0,05 y alrededor de 50 g/L; alrededor de 0,1 y alrededor de 40 g/L; alrededor de 1 y alrededor de 40 g/L; alrededor de 2 y alrededor de 40 g/L; alrededor de 5 y alrededor de 40 g/L; alrededor de 5 y alrededor de 30 g/L; alrededor de 0,1 y alrededor de 10 g/L; alrededor de 0,5 y alrededor de 10 g/L; alrededor de 1 y alrededor de 10 g/L; alrededor de 0,1 y alrededor de 5 g/L; alrededor de 0,5 y alrededor de 5 g/L; o alrededor de 0,1 y alrededor de 2 g/L. En algunas realizaciones, el polipéptido transaminasa está en una concentración de alrededor de 0,01; 0,05; 0,1; 0,2; 0,5; 1; 2; 5; 10; 15; 20; 25; 30; 35; 40 o 50 g/L.
En el transcurso de las reacciones de transaminación, el pH de la mezcla de reacción puede cambiar. El pH de la mezcla de reacción se puede mantener en el pH deseado o dentro de un intervalo de pH deseado. Esto se puede hacer mediante la adición de un ácido o una base, antes y/o durante el transcurso de la reacción. Alternativamente, el pH se puede controlar utilizando un tampón. En consecuencia, en algunas realizaciones, la condición de la reacción comprende un tampón. Los tampones adecuados para mantener los intervalos de pH deseados son conocidos en el área e incluyen, a modo de ejemplo y sin limitación, tampones de borato, carbonato, fosfato, trietanolamina, y similares. En algunas realizaciones, el tampón es de borato. En algunas realizaciones del proceso, las condiciones de reacción adecuadas comprenden una solución tampón de trietanolamina, en la que la concentración de trietanolamina es entre alrededor de 0,01 y alrededor de 0,4 M, 0,05 y alrededor de 0,4 M, 0,1 y alrededor de 0,3 M o alrededor de 0,1 y alrededor de 0,2 M. En algunas realizaciones, las condiciones de reacción comprenden una concentración de
trietanolamina de alrededor de 0,01; 0,02; 0,03; 0,04; 0,05; 0,07; 0,1; 0,12; 0,14; 0,16; 0,18; 0,2; 0,3 o 0,4 M. En algunas realizaciones las condiciones de reacción comprenden agua como un solvente adecuado sin tampón presente.
En las realizaciones del proceso, las condiciones de reacción pueden comprender un pH adecuado. El pH deseado o el intervalo de pH deseado se pueden mantener mediante el uso de un ácido o una base, un tampón apropiado, o una combinación de adición de tampón y de ácido o base. El pH de la mezcla de reacción se puede controlar antes y/o durante el transcurso de la reacción. En algunas realizaciones, las condiciones de reacción adecuadas comprenden un pH de la solución que comprende un pH entre alrededor de 6 y alrededor de 12, un pH entre alrededor de 6 y alrededor de 10, un pH entre alrededor de 6 y alrededor de 8, un pH entre alrededor de 7 y alrededor de 10, un pH entre alrededor de 7 y alrededor de 9 o un pH entre alrededor de 7 y alrededor de 8. En algunas realizaciones, las condiciones de reacción comprenden un pH de la solución de alrededor de 6; 6,5; 7; 7,5; 8; 8,5; 9; 9,5; 10; 10,5; 11; 11,5 o 12.
En las realizaciones de los procesos de este documento, se puede usar una temperatura adecuada para las condiciones de reacción, por ejemplo, teniendo en consideración el aumento en la velocidad de reacción a mayores temperaturas y la actividad de la enzima durante el período de tiempo de la reacción. Por ejemplo, los polipéptidos genomanipulados de la presente divulgación tienen mayor estabilidad en relación con el polipéptido transaminasa de origen natural por ejemplo, el polipéptido tipo silvestre de SEQ ID NO: 2, lo que permite que los polipéptidos genomanipulados se usen a mayores temperaturas para aumentar las velocidades de conversión y mejorar las características de solubilidad del sustrato para la reacción. En consecuencia, en algunas realizaciones, las condiciones de reacción adecuadas comprenden una temperatura entre alrededor de 10°C y alrededor de 70°C, alrededor de 10°C y alrededor de 65°C, alrededor de 15°C y alrededor de 60°C, alrededor de 20°C y alrededor de 60°C, alrededor de 20°C y alrededor de 55°C, alrededor de 30°C y alrededor de 55°C o alrededor de 40°C y alrededor de 50°C. En algunas realizaciones, las condiciones de reacción adecuadas comprenden una temperatura de alrededor de 10°C, 15°C, 20°C, 25°C, 30°C, 35°C, 40°C, 45°C, 50°C, 55°C, 60°C, 65°C, o 70°C. En algunas realizaciones, la temperatura durante la reacción enzimática se puede mantener a una temperatura durante todo el transcurso de la reacción. En algunas realizaciones, la temperatura durante la reacción enzimática se puede ajustar en un perfil de temperatura durante el curso de la reacción.
Los procesos de la divulgación se llevan a cabo generalmente en un solvente. Los solventes adecuados incluyen agua, soluciones tampón acuosas, solventes orgánicos, solventes poliméricos y/o sistemas cosolventes, que generalmente comprenden solventes acuosos, solventes orgánicos y/o solventes poliméricos. El solvente acuoso (agua o sistema cosolvente acuoso) puede estar tamponado o sin tamponar. En algunas realizaciones, los procesos que utilizan los polipéptidos transaminasa genomanipulados se llevan a cabo generalmente en un sistema cosolvente acuoso que comprende un solvente orgánico (por ejemplo, etanol, isopropanol (IPA), dimetilsulfóxido (DMSO), acetato de etilo, acetato de butilo, 1-octanol, heptano, octano, metil t-butil éter (MTBE), tolueno, y similares), solvente iónicos o polares (por ejemplo, tetrafluoroborato de 1 -etil-4-metilimidazolio, tetrafluoroborato de 1 -butil-3-metilimidazolio, hexafluorofosfato de 1 -butil-3-metilimidazolio, glicerol, polietilenglicol, y similares). En algunas realizaciones, el cosolvente puede ser un solvente polar, como un poliol, dimetilsulfóxido, DMSO, o un alcohol inferior. El componente cosolvente no acuoso de un sistema cosolvente acuoso puede ser miscible con el componente acuoso, proporcionando una única fase líquida, o puede ser parcialmente miscible o inmiscible con el componente acuoso, proporcionando dos fases líquidas. Los ejemplos de sistemas cosolventes acuosos pueden comprender agua y uno o más cosolventes elegidos entre un solvente orgánico, un solvente polar y un solvente poliol. En general, el componente cosolvente de un sistema cosolvente acuoso se elige de modo que no inactive de manera adversa a la enzima transaminasa en las condiciones de reacción. Los sistemas cosolventes apropiados se pueden identificar fácilmente midiendo la actividad enzimática de la enzima transaminasa genomanipulada especificada con un sustrato definido de interés, en el sistema solvente candidato, utilizando un ensayo de actividad enzimática como los descritos en este documento.
En algunas realizaciones del proceso, las condiciones de reacción adecuadas comprenden un cosolvente acuoso, donde el cosolvente comprende un solvente poliol, particularmente glicoles. Los ejemplos de solventes polioles adecuados incluyen, a modo de ejemplo y no limitante, polietilenglicol, polietilenglicol metil éter, dietilenglicol dimetil éter, trietilenglicol dimetil éter y propilenglicol. En algunas realizaciones, el cosolvente acuoso comprende polietilenglicol, que está disponible en diferentes pesos moleculares. Son particularmente útiles los glicoles de peso molecular más bajo como PEG 200 a PEG 600. En consecuencia, en algunas realizaciones, el cosolvente acuoso comprende PEG 200 entre alrededor de 1% y alrededor 40% v/v; alrededor de 1% y alrededor de 40% v/v; alrededor de 2% y alrededor de 40% v/v; alrededor de 5% y alrededor de 40% v/v; 2% y alrededor de 30% v/v; 5% y alrededor de 30% v/v; 1 y alrededor de 20% v/v; alrededor de 2% y alrededor de 20% v/v; alrededor de 5% y alrededor de 20% v/v; alrededor de 1 % y alrededor de 10% v/v; alrededor de 2% y alrededor de 10% v/v. En algunas realizaciones, las condiciones de reacción adecuadas comprenden un cosolvente acuoso que comprende PEG 200 en alrededor de 1 %, 2%, 5%, 10%, 15%, 20%; 25%; 30%; 35%; 35% o alrededor de 40% v/v.
En algunas realizaciones del proceso, las condiciones de reacción adecuadas comprenden un cosolvente acuoso, donde el cosolvente comprende DMSO entre alrededor de 1% y alrededor de 80% (v/v), alrededor de 1 y alrededor
de 70% (v/v), alrededor de 2% y alrededor de 60% (v/v), alrededor de 5% y alrededor de 40% (v/v), 10% y alrededor de 40% (v/v), 10% y alrededor de 30% (v/v), o alrededor de 10% y alrededor de 20% (v/v). En algunas realizaciones del proceso, las condiciones de reacción adecuadas comprenden un cosolvente acuoso que comprende DMSO en al menos alrededor de 1%, 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, o 80% (v/v).
Las cantidades de reactivos utilizadas en la reacción de transaminación variarán generalmente dependiendo de las cantidades de producto deseadas, y concomitantemente la cantidad de sustrato transaminasa empleada. Los expertos en la materia entenderán fácilmente como variar estas cantidades para adaptarlas al nivel deseado de productividad y escala de producción.
En algunas realizaciones, el orden de adición de los reactivos no es fundamental. Los reactivos se pueden agregar juntos al mismo tiempo a un solvente (por ejemplo, solvente monofásico, sistema cosolvente acuoso bifásico, y similares), o alternativamente, algunos de los reactivos se pueden agregar por separado y algunos juntos, en diferentes momentos. Por ejemplo, el cofactor, la transaminasa y el sustrato de la transaminasa se pueden agregar al solvente primero.
Los reactivos sólidos (por ejemplo, enzima, sales, etc.) se pueden proporcionar a la reacción de diversas formas, que incluyen polvo (por ejemplo liofilizado, secado por aspersión, y similares), solución, emulsión, suspensión, y similares. Los reactivos se pueden liofilizar o secar por aspersión fácilmente, empleando métodos y equipos conocidos por los expertos en la materia. Por ejemplo, la solución de proteína se puede congelar a -80°C en pequeñas alícuotas, después agregar a la cámara de liofilización previamente enfriada, seguido de la aplicación de vacío.
Para una mayor eficiencia de mezcla cuando se usa un sistema cosolvente acuoso, la transaminasa y el cofactor se pueden agregar y mezclar primero en la fase acuosa. Después se puede agregar la fase orgánica y mezclar allí, seguido de la adición del sustrato de la transaminasa. Alternativamente, el sustrato de la transaminasa se puede premezclar en la fase orgánica, antes de la adición a la fase acuosa.
La reacción de transaminación se deja proceder generalmente hasta que la conversión posterior del sustrato cetona en el producto amina no cambia significativamente con el tiempo de reacción, (por ejemplo, menos de 10% de sustrato es convertido o menos de 5% de sustrato es convertido). En algunas realizaciones, la reacción se deja proceder hasta que haya conversión completa o casi completa del sustrato cetona en el producto amina. La transformación de sustrato en producto se puede controlar empleando métodos conocidos para detectar sustrato y/o producto. Los métodos adecuados incluyen cromatografía de gases, HPLC, y similares. Los rendimientos de la conversión del producto amina quiral generado en la mezcla de reacción son generalmente mayores de alrededor de 50%, pueden incluso ser mayores de alrededor de 60%, pueden incluso ser mayores de alrededor de 70%, pueden incluso ser mayores de alrededor de 80%, pueden incluso ser mayores de 90% y a menudo son mayores de alrededor de 97%. En algunas realizaciones, los métodos para preparar compuestos de fórmula (II) que emplean un polipéptido transaminasa genomanipulado, en condiciones de reacción adecuadas, resultan en la al menos alrededor de 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más de conversión de sustrato cetona, por ejemplo, compuesto de fórmula (I), en el producto compuesto amina, por ejemplo, el compuesto de fórmula (II) en alrededor de 48 h o menos, en alrededor de 36 h o menos, en alrededor de 24 h o menos, o incluso en menos tiempo.
En algunas realizaciones del proceso, las condiciones de reacción adecuadas comprenden una carga de sustrato, de compuestos sustrato, de al menos alrededor de 20 g/L, 30 g/L, 40 g/L, 50 g/L, 60 g/L, 70 g/L, 100 g/L, o más, y donde el método da como resultado al menos alrededor de 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más de conversión del compuesto sustrato en el compuesto producto en alrededor de 48 h o menos, en alrededor de 36 h o menos, o en alrededor de 24 h o menos.
Los polipéptidos transaminasa genomanipulados de la presente divulgación cuando se usan en el proceso en condiciones de reacción adecuadas dan como resultado un exceso enantiomérico de la amina quiral en al menos 97%, 98, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8%, o 99,9%. de e.e.
En otra realización de los métodos para convertir el compuesto sustrato en el compuesto amina producto utilizando los polipéptidos transaminasa genomanipulados, las condiciones de reacción adecuadas comprenden una carga de sustrato inicial en la solución de reacción la cual después se pone en contacto con el polipéptido. Posteriormente esta solución de reacción es complementada con más compuesto sustrato como una adición continua en el tiempo a una velocidad de al menos alrededor de 1 g/L/h, al menos alrededor de 2 g/L/h, al menos alrededor de 4 g/L/h, al menos alrededor de 6 g/L/h, o mayor. Por lo tanto, de acuerdo con estas condiciones de reacción adecuadas el polipéptido se agrega a una solución que tiene una carga inicial de sustrato de al menos alrededor de 20 g/L, 30 g/L o 40 g/L. Esta adición de polipéptido es seguida de la adición continua de más sustrato a la solución a una velocidad de alrededor de 2 g/L/h, 4 g/L/h o 6 g/L/h hasta que se alcanza una carga final de sustrato mucho mayor de al menos alrededor de 30 g/L, 40 g/L, 50 g/L, 60 g/L, 70 g/L, 100 g/L, 150 g/L, 200 g/L o más. En consecuencia, en algunas realizaciones del método, las condiciones de reacción adecuadas comprenden la adición del polipéptido a una solución que tiene una
carga inicial de sustrato de al menos alrededor de 20 g/L, 30 g/L o 40 g/L, seguido de la adición de más sustrato a la solución a una velocidad de alrededor de 2 g/L/h, 4 g/L/h o 6 g/L/h hasta que se alcanza una carga final de sustrato de al menos alrededor de 30 g/L, 40 g/L, 50 g/L, 60 g/L, 70 g/L, 100 g/L o más. Esta condición de reacción de complementación de sustrato permite que se alcancen cargas de sustrato mayores mientras se mantienen altas tasas de conversión del sustrato cetona en el producto amina al menos de alrededor de 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o mayores. En algunas realizaciones de este método, el sustrato adicional agregado está en una solución que contiene isopropilamina o acetato de isopropilamina en una concentración de al menos alrededor de 0,5 M, al menos alrededor de 1,0 M, al menos alrededor de 2,5 M, al menos alrededor de 5,0 M, al menos alrededor de 7,5 M, al menos alrededor de 10,0 M.
En algunas realizaciones de los procesos, la reacción de transaminación que emplea un polipéptido transaminasa genomanipulado puede comprender las condiciones de reacción adecuadas siguientes: (a) carga de sustrato entre alrededor de 5 g/L y 200 g/L; (b) alrededor de 0,1 a 50 g/L de polipéptido transaminasa; (c) isopropilamina (IPM) alrededor de 0,1 a 4 M; (d) alrededor de 0,1 a 10 g/L de cofactor piridoxal fosfato (PLP); (e) pH de alrededor de 6 a 9; y (f) temperatura de alrededor de 30 a 60°C.
En algunas realizaciones de los procesos, la reacción de transaminación que emplea un polipéptido transaminasa genomanipulado puede comprender las condiciones de reacción adecuadas siguientes: (a) carga de sustrato entre alrededor de 5 y alrededor de 20 g/L; (b) alrededor de 0,05 a 2 g/L de polipéptido transaminasa; (c) alrededor de 1 a 10% v/v de PEG 200; (d) isopropilamina (IPM) alrededor de 1 a 2 M; (e) alrededor de 0,1 a 1 g/L de cofactor piridoxal fosfato (PLP); (f) trietanolamina (TEA) entre alrededor de 0,1 y alrededor de 0,5 M; (g) pH de alrededor de 6 a 8; y (h) temperatura de alrededor de 45 a 55°C.
En algunas realizaciones de los procesos, la reacción de transaminación que emplea un polipéptido transaminasa genomanipulado puede comprender las condiciones de reacción adecuadas siguientes: (a) carga de sustrato entre alrededor de 25 y alrededor de 100 g/L; (b) alrededor de 0,5 a 10 g/L de polipéptido transaminasa; (c) alrededor de 1 a 10% v/v de PEG 200; (d) isopropilamina (IPM) alrededor de 1 a 2 M; (e) alrededor de 0,1 a 1 g/L de cofactor piridoxal fosfato (PLP); (f) trietanolamina entre alrededor de 0,1 y alrededor de 0,5 M; (g) pH de alrededor de 6 a 8; y (h) temperatura de alrededor de 45 a 55°C.
En algunas realizaciones, se usan componentes de reacción adicionales o se llevan a cabo técnicas adicionales para complementar las condiciones de reacción. Estas pueden incluir tomar medidas para estabilizar o prevenir la inactivación de la enzima, reducir la inhibición por el producto, cambiar el equilibrio de reacción para la formación del producto amina.
En consecuencia, en algunas realizaciones del proceso para preparar una amina, tal como una amina quiral, se pueden agregar cantidades adicionales del aceptor de amino (hasta la saturación) y/o el aceptor de amino (cetona) formado se puede extraer continuamente de la mezcla de reacción. Por ejemplo, se puede usar un puente de solvente o un sistema cosolvente de dos fases para desplazar el producto amina a una solución de extracción, y de esa manera reducir la inhibición por el producto amina y también cambiar el equilibrio hacia la formación del producto (véase, por ejemplo, Yun y Kim, 2008, Biosci. Biotechnol. Biochem. 72(11):3030-3033).
En algunas realizaciones de los procesos, las condiciones de reacción adecuadas comprenden la presencia del cofactor reducido, nicotinamida adenina dinucleótido (NADH), que puede actuar para limitar la inactivación de la enzima transaminasa (véase, por ejemplo, van Ophem et al., 1998, Biochemistry 37(9):2879-88). En dichas realizaciones en las que está presente NADH, se puede usar un sistema de regeneración del cofactor, como glucosa deshidrogenasa (GDH) y glucosa o formiato deshidrogenasa y formiato, para regenerar el NADH en el medio de reacción.
En algunas realizaciones, el proceso puede comprender además la eliminación del subproducto carbonilo formado a partir del dador de grupo amino cuando el grupo amino se transfiere al aceptor del grupo amino. Dicha eliminación in situ puede reducir la velocidad de la reacción inversa de modo que domine la reacción hacia adelante y entonces más sustrato se convierta en producto. La eliminación del subproducto carbonilo se puede llevar a cabo de varias maneras. Cuando el dador del grupo amino es un aminoácido, como alanina, el subproducto carbonilo, un ceto ácido, se puede eliminar por reacción con un peróxido (véase, por ejemplo, US 2008/0213845).
Los peróxidos que se pueden usar incluyen, entre otros, peróxido de hidrógeno; peroxiácidos (perácidos) como ácido peracético (CH3CO3H), ácido trifluoroperacético y ácido metacloroperoxibenzoico; peróxidos orgánicos como t-butil peróxido ((CH3)3COOH), u otros oxidantes selectivos como perrutenato de tetrapropilamonio, MnO2, KMnO4, tetróxido de rutenio y compuestos relacionados. Alternativamente, la eliminación del piruvato se puede lograr mediante su reducción a lactato empleando lactato deshidrogenasa para cambiar el equilibrio a la amina producto (véase, por ejemplo Koszelewski et al., 2008, Adv. Syn. Catal. 350: 2761-2766). La eliminación del piruvato también se puede lograr mediante su descarboxilación empleando piruvato descarboxilasa (véase, por ejemplo, Hohne et al., 2008, Chem BioChem 9: 363-365) o acetolactato sintasa (véase, Yun y Kim, supra).
Alternativamente, en realizaciones en las que se usa un aminoácido como dador del grupo amino, el subproducto carbonilo del ceto ácido puede ser reciclado en el aminoácido mediante reacción con amoníaco y NADH utilizando una enzima deshidrogenasa apropiada, por ejemplo aminoácido deshidrogenasa, en presencia de un dador de amina, como amoníaco, reponiendo así el grupo dador de amino.
En algunas realizaciones, en las que la elección del dador de amino resulta en un subproducto carbonilo que tiene la presión de vapor superior a la del agua (por ejemplo, un coproducto con bajo punto de ebullición como un compuesto carbonilo orgánico volátil), el subproducto carbonilo se puede eliminar asperjando la solución de reacción con un gas no reactivo o aplicando vacío para disminuir la presión de la reacción y eliminando el subproducto carbonilo presente en la fase gaseosa. Un gas no reactivo es cualquier gas que no reacciona con los componentes de la reacción. Diversos gases no reactivos incluyen nitrógeno y gases nobles (por ejemplo, gases inertes). En algunas realizaciones, el gas no reactivo es gas de nitrógeno. En algunas realizaciones, el dador de amino utilizado en el proceso es isopropilamina (IPM), que forma el subproducto carbonilo acetona, después de la transferencia del grupo amino al grupo aceptor de amino. La acetona se puede eliminar mediante aspersión con gas de nitrógeno o aplicando un vacío a la solución de reacción y eliminando la acetona de la fase gaseosa mediante una trampa de acetona, como un condensador u otra trampa fría. Alternativamente, la acetona se puede eliminar por reducción a isopropanol utilizando una transaminasa.
En algunas realizaciones de los procesos anteriores en las que se elimina el subproducto carbonilo, el grupo dador de amino correspondiente se puede agregar durante la reacción de transaminación para reponer el grupo dador de amino y/o mantener el pH de la reacción. Reponer el grupo dador de amino también cambia el equilibrio hacia la formación de producto, aumentando así la conversión de sustrato en producto. Por lo tanto, en algunas realizaciones en las que el grupo dador de amino es isopropilamina y el producto acetona se elimina in situ, se puede agregar isopropilamina a la solución para reponer el grupo dador de amino perdido durante la eliminación de acetona y para mantener el pH de la reacción (por ejemplo en alrededor de 8,5).
En otras realizaciones, cualquiera de los procesos descritos antes para la conversión del compuesto sustrato en el compuesto producto puede comprender además uno o más de los pasos seleccionados entre: extracción; aislamiento; purificación; y cristalización del compuesto producto. Los métodos, las técnicas y los protocolos para extraer, aislar, purificar y/o cristalizar el producto amina de mezclas de reacción biocatalíticas producidas por los métodos dados a conocer antes, son conocidos por los técnicos con experiencia y/o accesibles mediante experimentación de rutina. Además, se proporcionan métodos ilustrativos en los Ejemplos más adelante.
Sección J: Ejemplos
Abreviaturas:
5 cambio químico
Hl microlitro
gm micrómetro
ac acuoso(a)
(+)CSA ácido (+) canforsulfónico
ESTP acetato de etilo
IPA acetato de isopropilo
TRMA trietilamina
Ac acetilo
AcOH ácido acético
br ancho
brm multiplete ancho
br. m. multiplete ancho
br. mult. multiplete ancho
br. s. señal ancha
br. sign. señal ancha
cat. cantidad catalítica
compl. m. multiplete complejo
compl. mult. multiplete complejo
copl. m. multiplete complejo
cpl. m. multiplete complejo
CDCl3 cloroformo deuterados
CH2Cl2 diclorometano
CH2O formaldehído
CO2 dióxido de carbono
d doblete
dd doblete de doblete
de exceso diastereoisomérico
dr relación diastereoisomérica
DCM diclorometano
DEA dietilamina
DMSO dimetilsulfóxido
DMSO-afe dimetilsulfóxido deuterado
ee exceso enantiomérico
equiv equivalente
ES electronebulización
ES+ ionización por electronebulización positiva
ESI ionización por electronebulización
Et etilo
Et2O éter dietílico
EtOAc acetato de etilo
EtOH etanol
FTIR espectroscopia infrarroja por transformada de Fourier g gramo(s)
GC cromatografía gaseosa
h hora(s)
HCl ácido clorhídrico
HCl(ac) solución acuosa de cloruro de hidrógeno HNMR resonancia magnética nuclear de protón 1HNMR resonancia magnética nuclear de protón
HPLC cromatografía líquida de alta resolución
H3PO4 ácido fosfórico
HRMS espectrometría de masas de alta resolución H2SO4 ácido sulfúrico
Hz hertzio
iPr isopropilo
iPr2NEt N-etildiisopropilamina
iPrOAc acetato de isopropilo
iPrOH isopropanol
IR infrarrojo
J constante de acoplamiento
K2CO3 carbonato de potasio
L litro
LC-MS cromatografía líquida-espectrometría de masas LCMS cromatografía líquida-espectrometría de masas LRMS espectroscopía de masas de baja resolución m multiplete
m/e relación masa a carga
mg miligramo
min minuto(s)
ml mililitro
mL mililitro
mmol(s) milimoles
mol(s) moles
monosub. monosustituido(a)
pf punto de fusión
p.f. punto de fusión
mult. d dobletes de multiplete
m/z relación masa a carga
M molaridad/molar
Me metilo
2-MeTHF 2-metiltetrahidrofurano
MeOH metanol
MgSO4 sulfato de magnesio
MS espectrometría de masas
[MS]+ masa de aducto de protones
MTBE tert-butil metil éter
nm nanómetro
N átomo de nitrógeno
N2 nitrógeno
NaCl cloruro de sodio
Na2CÜ3 carbonato de sodio
NaHCO3 bicarbonato de sodio
NaHMDS bis(trimetilsilil)amida de sodio
NaOH hidróxido de sodio
Na2SO4 sulfato de sodio
NH4CI cloruro de amonio
NMR resonancia magnética nuclear
oct. octete
ppm partes por millón
psi libras por pulgada cuadrada
Pd/C paladio sobre carbón
Pd(PPh3)4 tetrakis(trifenilfosfina)paladio(0)
Pt/C platino sobre carbón
q cuartete
Rh/C rodio sobre carbón
TA = ta temperatura ambiente
s singulete
sev. brm varios multipletes anchos
sev. dd varios dobletes de dobletes
t triplete
Temp. temperatura
T temperatura
tR tiempo de retención
tBu butilo terciario
TEA trietilamina
TFA ácido trifluoroacético
THF tetrahidrofurano
Tol tolueno
UV luz ultravioleta
vol. volumen
p peso
Ejemplo 1: Síntesis de compuesto intermedio cetona
6-cloro-5-fluoro-3-hidrox¡-3-(2-oxo-prop¡l)-1,3-d¡h¡dro-indol-2-ona
A la suspensión de 6-cloro-5-fluoro-isatina (25 g, 125 mmol) en acetona (620 ml), se le agregaron Et2NH (0,9 g, 12,5 mmol) y K2CO3 (1,7 g, 12,5 mmol). La mezcla de reacción se calentó a reflujo durante 2 horas. Después de enfriarla hasta temperatura ambiente, la mezcla de reacción se filtró y el solvente se eliminó a presión reducida. El producto crudo se volvió a disolver en MeOH (300 ml) a 50°C y se le agregó agua (300 ml). Con la adición de agua, el sólido precipitó. Se eliminó el MeOH (250 mL) a presión reducida a 50 °C. La mezcla se enfrió hasta 0-5 °C y se agitó durante 30 min. El sólido se filtró y se secó para producir 6-cloro-5-fluoro-3-hidroxi-3-(2-oxo-propil)-1,3-dihidro-indol-2-ona (27 g). 1H RMN (DMSO-ds): 2,00(3H, s, CH3), 3,09(1H, d, CH, J =16Hz), 3,39(1H, d, CH, J =16Hz), 6,16(1 H, s, OH); 6,88(1 H, d, CH, J =8Hz), 7,36(1H, d, CH, J =12Hz), 10,37(1H, s, NH). MS (ESI) m/z 258,0 (M+H)+
Método HpLC: Columna: Agilent Extend-C18; 150 x 3,0 mm; 3,5 pm. Fase móvil A (0,1% de h 3pO4) en agua; fase móvil B (acetonitrilo). Gradiente: 0 min (95% de A); 0,5 min (95% de A), 14 min (5% de A), 19,5 min (5% de A). Velocidad de flujo: 0,5 ml min-1 Longitud de onda: 210 nm. Temperatura: 40°C. Tiempo de retención: 7.52 min.
6-Cloro-5-fluoro-3-h¡drox¡-3-(2-met¡l-[1,3]d¡oxolan-2-¡lmet¡l)-1,3-d¡h¡dro-¡ndol-2-ona
A la suspensión de 6-cloro-5-fluoro-3-hidroxi-3-(2-oxopropil)indolin-2-ona (25 g, 97 mmol) en etilenglicol (250 mL), se le agregaron ortoformiato de trietilo (43 g, 291 mmol) y ácido tolueno-4-sulfónico monohidratado (0,9 g, 4,8 mmol). La mezcla de reacción se calentó a 40-50°C durante 2 horas. Se agregaron sucesivamente MeTHF (500 mL) y solución acuosa de NaCl al 10% (500 mL). La capa orgánica se separó y se lavó con agua dos veces. Después que el solvente se evaporó al vacío, el sólido blanco se lavó con TBME (400 mL) y se secó para producir 6-cloro-5-fluoro-3-hidroxi-3-(2-metil-[1,3]dioxolan-2-ilmetil)-1,3-dihidro-indol-2-ona (27,8 g). 1H RMN (DMSO-d6): 1,00(3H, s, CH3), 2,37(2H, d, CH2,), 3,13(1 H, c, CHH,), 3,58(1 H, c, CHH,), 3,59(1H, c, CHH,), 3,68(1H, c, CHH,), 6,00(1H, s, OH); 6,85(1H, d, CH, J =8Hz), 7,31 (1H, d, CH, J =12Hz), 10,24(1H, s, NH). MS (ESI) m/z 302,0 (M+H)+ Método HPLC: Columna: Agilent Extend-C18; 150 x 3,0 mm; 3,5 pm. Fase móvil A (0,1% de H3PO4) en agua; fase móvil B (acetonitrilo). Gradiente: 0 min (95% de A); 0,5 min (95% de A), 14 min (5% de A), 19,5 min (5% de A). Velocidad de flujo: 0,5 ml min-1 Longitud de onda: 210 nm. Temperatura: 40°C. Tiempo de retención: 7.94 min.
1 -(6-Cloro-5-fluoro-1 H-indol-3-il)-propan-2-ona
A la solución de 6-cloro-5-fluoro-3-hidroxi-3-((2-metil-1,3-dioxolan-2-il)metil)indolin-2-ona (27,8 g, 92 mmol) en THF (250 mL), se le agregó lentamente Red-Al (79,8 g, 276 mmol) en THF (100 mL) a 60°C en atmósfera de N2. Después de la adición, la mezcla se agitó a temperatura ambiente durante 3 horas. Se agregó HCl al 20% (400 mL) y la mezcla se agitó durante 20 min. Se agregó acetato de etilo (500 mL) y se agitó durante 10 min. La capa orgánica se separó y se lavó con agua (100 ml x 2). Después de tratarla con Na2SO4 (50 g) y carbón activado (5 g) a temperatura ambiente, la mezcla se filtró y el filtrado se concentró. El producto crudo se recristalizó con MeOH (80 mL) y agua (60 mL) para producir 1-(6-cloro-5-fluoro-1H-indol-3-il)-propan-2-ona (15,5 g).
1H RMN (DMSO-d6): 2,21 (3H, s, CH3), 3,78(2H, s, CH2,), 7,13(1 H, d, CH, J = 4Hz); 7,23(1 H, d, CH, J =8Hz), 7,33(1 H, d, CH, J =8Hz), 8,23(1 H, s, NH).
MS (ESI) m/z 226,0 (M+H)+
Método HPLC: Columna: Agilent Extend-C18; 150 x 3,0 mm; 3,5 pm. Fase móvil A (0,1% de H3PO4) en agua; fase móvil B (acetonitrilo). Gradiente: 0 min (95% de A); 0,5 min (95% de A), 14 min (5% de A), 19,5 min (5% de A). Velocidad de flujo: 0,5 ml min-1 Longitud de onda: 210 nm. Temperatura: 40°C Tiempo de retención: 10.75 min.
Ejemplo 2: Segunda síntesis alternativa de material de partida cetona
1 -(6-Cloro-5-fluoro-1 H-indol-3-il)-propan-2-ona
Se cargó Pt/C (10 g, 5% de Pt sobre carbón), bajo N2, a la suspensión de 6-cloro-5-fluoro-3-((Z)-2-nitro-propenil)-1H-indol (100 g, 0,39 mol) en acetato de etilo (500 mL). La mezcla de reacción se sometió a vacío y se purgó con H2 tres veces, y se agitó a temperatura ambiente toda la noche. El catalizador se separó por filtración y el solvente orgánico se eliminó a presión reducida para dar un aceite marrón. El aceite se volvió a disolver en EtOH (500 mL) y se le agregó bisulfito de sodio (81,7 g, 0,79 mol) en H2O (). La suspensión se calentó hasta 80°C toda la noche. El precipitado se separó por filtración y el etanol se eliminó a presión reducida. El residuo se diluyó con agua (500 mL) y se extrajo con
acetato de etilo (300 mL x 2). La capa orgánica combinada se secó en Na2SÜ4 y se condensó en evaporador rotatorio para dar un aceite marrón (53 g, 60% de rendimiento).
Ejemplo 3: Segunda síntesis alternativa del compuesto intermedio cetona
1 -(6-Cloro-5-fluoro-1 H-indol-3-il)-propan-2-ona
Se cargaron níquel Raney (0,75 g) y ácido acético (1,1 mL, 19,6 mmol) en la suspensión de 6-cloro-5-fluoro-3-((Z)-2-nitro-propenil)-1 H-indol (5 g, 19,6 mmol) en la mezcla de MeOH y H2O (2:1,50 mL) a temperatura ambiente. La mezcla de reacción se sometió a vacío y se purgó con H2 tres veces, y se calentó a 50°C toda la noche. Se agregó MeOH (50 mL) a la mezcla de reacción y el catalizador se filtró sobre Celite. El solvente se concentró hasta 50 mL y se le agregó H2O (300 ml). Con la adición de H2O, se produjo un sólido blancuzco. El sólido se filtró y se lavó con agua. Después de secar en la estufa, se aislaron 2,53 g de sólido blancuzco.
Ejemplo 4: Síntesis, optimización y cribado de polipéptidos transaminasa genomanipulados
Síntesis y optimización de genes: A la secuencia de polinucleótidos que codifica el polipéptido transaminasa omega tipo silvestre reportado de Vibrio fluvialis de SEQ ID NO: 2 se le optimizaron los codones y se sintetizó como el gen de SEQ ID NO: 1. El gen sintético de SEQ ID NO: 1 se clonó en un sistema vector pCK110900 (véase, por ejemplo, la publicación de la solicitud de patente de los Estados Unidos 20060195947) y a continuación se expresó en E. coli W3110fhuA. La E. co liW3110 expresa los polipéptidos transaminasa como una proteína intracelular bajo el control del promotor lac. El polinucleótido (SEQ ID NO:3) que codifica el polipéptido transaminasa genomanipulado de SEQ ID NO: 4 se obtuvo por evolución dirigida del gen con codones optimizados SEQ ID NO:1. El polipéptido de SEQ ID NO: 4 tiene 24 diferencias de residuos de aminoácidos (A9T; G18A; D21H; V31M; N45H; F86Y; A133R; R146L; W147K; V153S; K163F; V177L; R211K; P233T; A235P; P244T; M294V; P318D; A323T; S324G; A383V; T391A; C424A; F427Y) en relación con SEQ ID NO: 2. Este gen sintético de SEQ ID NO: 3 (que codifica el polipéptido de SEQ ID NO: 4) se usó como el esqueleto de partida para la optimización posterior usando métodos estándar de evolución dirigida a través de la generación iterativa de bibliotecas de variantes mediante síntesis de genes, seguido de cribado y secuenciación de los hits para generar genes que codifiquen transaminasas genomanipuladas capaces de convertir el compuesto (IA) en el compuesto (IIA) con propiedades enzimáticas mejoradas en relación con los polipéptidos SEQ ID NO: 2 y 4. Las secuencias de polipéptidos transaminasa genomanipulados resultantes, las mutaciones específicas y las actividades relativas se listan en la Tabla 2A.
Ejemplo 5: Producción de transaminasas genomanipuladas
Los polipéptidos transaminasa genomanipulados se produjeron en E. coli W3110 como una proteína intracelular expresada bajo el control del promotor lac. El polipéptido se acumula principalmente como una enzima activa citosólica soluble. Se usó un procedimiento de matraz de agitación para generar polvos de polipéptido genomanipulado que pueden ser utilizados en ensayos de actividad o en el proceso biocatalítico dado a conocer en este documento.
Multiplicación de alto rendimiento y expresión. Se picaron células y se cultivaron toda la noche en medio LB que contenía 1% de glucosa y 30 pg/mL de cloranfenicol (CAM), 30°C, 200 rpm, 85% de humedad. 20 pL del cultivo de toda la noche se transfirieron a una placa de pocillo hondo que contenía 380 pL de medio cultivo 2xYT que contenía 30 pg/mL de CAM, IPTG 1 mM, MgSO4, 1 mM, y se incubó durante ~18 h a 30°C, 200 rpm, 85% de humedad. Se preparó subcultivo de medio TB de medio TB (380 pL/pocillo), 30 pg/mL de CAM, MgSO4 1 mM e IPTG 1 mM. Los cultivos celulares se centrifugaron a 4000 rpm, 4°C durante 10 min, y el medio se desechó. Se resuspendieron los sedimentos celulares en 200 o 400 pL de tampón de lisis (tampón de trietanolamina (TEA) 0,1 M, pH 9,0, que contenía MgSO4, 1 mM, 400 pg/mL de PMBS y 500 pg/mL de lisozima), como se describe más adelante.
Producción de polvos en matraz de agitación (SFP): Se usó un procedimiento de matraz de agitación para generar polvos de polipéptidos transaminasa genomanipulados que pueden ser utilizados en ensayos secundarios de cribado o en el proceso biocatalítico dado a conocer en este documento. El polvo de matraz de agitación (SFP) incluye aproximadamente 30% de la proteína total y en consecuencia proporciona una preparación más purificada de una enzima genomanipulada en comparación con el lisado celular utilizado en los ensayos HTP. Una única colonia microbiana de E. coli que contiene un plásmido que codifica una transaminasa genomanipulada de interés se inocula en 50 mL de caldo Luria Bertani que contiene 30 pg/ml de cloranfenicol y 1% de glucosa. Las células se cultivan toda la noche (al menos 16 horas) en una estufa de incubación a 30°C con agitación a 250 rpm. El cultivo se diluye en 250 mL de caldo Terrific (12 g/L de bacto-triptona, 24 g/L de extracto de levadura, 4 mL/L de glicerol, fosfato de potasio 65
mM, pH 7,0; MgSC>41 mM) que contiene 30 pg/ml de cloranfenicol, en un matraz de 1 litro hasta una densidad óptica a 600 nm (DC600) de 0,2 y se deja en cultivo a 30°C. La expresión del gen de transaminasa es inducida mediante adición de isopropil-p-D-tiogalactósido ("IPTG") hasta una concentración final de 1 mM cuando la DC600 del cultivo es de 0,6 a 0,8 y después la incubación se continúa toda la noche (al menos 16 horas). Las células se recogen por centrifugación (5000 rpm, 15 min, 4°C) y el sobrenadante se desecha. El sedimento celular se resuspende en un volumen igual de tampón de trietanolamina (cloruro) 100 mM frío (4°C), pH 7,0 (que incluye opcionalmente MgSO42 mM), y se recoge por centrifugación igual que antes. Las células lavadas se resuspenden en dos volúmenes de tampón de trietanolamina (cloruro) frío y se pasan dos veces a través de una prensa francesa a 12.000 psi mientras se mantienen a 4°C. Los desechos celulares se eliminan por centrifugación (9000 rpm, 45 minutos, 4°C). El sobrenadante del lisado claro se recoge y se almacena a -20°C. La liofilización del lisado claro congelado proporciona un polvo de matraz de agitación de polipéptido transaminasa crudo. Alternativamente, el sedimento celular (antes o después del lavado) se puede almacenar a 4°C o -80°C.
Producción de polvos por el proceso descendente (DSP): Los polvos DSP contienen aproximadamente 80% de la proteína total y en consecuencia proporcionan una preparación más purificada de la enzima transaminasa genomanipulada en comparación con el lisado celular utilizado en el ensayo de alto rendimiento. Se puede llevar a cabo una fermentación a mayor escala (~100 - 120 g) de la transaminasas genomanipulada para la producción de polvos DSP como un lote corto seguido de un proceso de alimentación por lotes de acuerdo con métodos estándar debió procesamiento. Brevemente, la expresión de la transaminasa es inducida por adición de IPTG hasta una concentración final de 1 mM. Después de la fermentación, las células se recogen y se resuspenden en tampón de trietanolamina-H2SC4 100 mM, y después se rompen mecánicamente mediante homogeneización. Los desechos celulares y el ácido nucleico se floculan con polietilenimina (PEI) y la suspensión se clarifica por centrifugación. El sobrenadante claro resultante se concentra usando una membrana de ultrafiltración de flujo cruzado tangencial para eliminar las sales y el agua. El concentrado de enzima concentrado y parcialmente purificado se puede secar después en un liofilizador y envasar (por ejemplo, en recipientes de polietileno).
Ejemplo 6: Procedimientos analíticos
Análisis HPLC de reacciones HTP: Se sometió una alícuota de la reacción detenida a análisis de HPLC en las c n i i n i i n
La conversión del compuesto (IA) en el compuesto (IIA) se determinó de los cromatograma resultantes de la manera siguiente:
Conversión (%) = área del producto/(área del producto área del sustrato x 0,73) x 100%
Análisis HPLC de reacciones en escalas de 5 mL y 100 mL: Se sometieron alícuotas de la reacción detenida a análisis de HPLC en las condiciones^ si uientes.
La conversión del compuesto (IA) en el compuesto (IIA) se determinó de los cromatogramas de la manera siguiente: Conversión (%) = área del producto/(área del producto área del sustrato x 0,73) x 100%
Determinación de la pureza quiral del producto (% de ee): La pureza quiral del exceso enantiomérico del compuesto (I
Determinación de la pureza del producto: La pureza del producto se determinó por HPLC utilizando las condiciones si i n :
Ejemplo 7: Cribado de alto rendimiento (HTP) de transaminasas para la conversión del compuesto (IA) en el compuesto (IIA)
Ensayos de cribado HTP: El cribado de alto rendimiento utilizado para guiar la selección primaria de variantes se llevó a cabo en placas de 96 pocillos utilizando lisados celulares en condiciones de ensayo de 10 g/L de compuesto (IA); piridoxal fosfato (PLP)1 mM; isopropilamina (IPM) 2 M, pH 7,0; trietanolamina (TEA) 0,1 M, pH 7; 5% v/v de PEG 200; 10 pL de lisado; y 50 o 55°C.
Las células se cultivaron en placas de 96 pocillos como se describió antes y los lisados se prepararon distribuyendo 200 pL (para la ronda 1) o 400 pL (para la ronda 2) de tampón de lisis (1 mg/mL de lisozima, 0,5 mg/mL de sulfato de polimixina B, PLP 1 mM, trietanolamina (TEA) 0,1 M, pH 7,0) en cada pocillo. Las placas se sellaron, se agitaron durante 2 h, y después se centrifugaron durante 20 min a 4000 rpm a 4°C para sedimentar los desechos celulares.
Se agregaron 10 pL de solución madre de sustrato (200 g/L de compuesto (IIA) disuelto en PEG 200) a cada pocillo de una placa de 96 pocillos, seguido de 180 pL de una solución madre de isopropilamina (IPM)/piridoxal fosfato (PLP)
(IPM 2,2 M y PLP 1,06 mM en TEA 100 mM, pH 7,0). Para evaluar la refractariedad a la inhibición por el producto compuesto (IIA), se agregó el compuesto (IIA) a la mezcla de reacción hasta una concentración final de 14 g/L para los ensayos de ronda 1 y de 16 g/L de ronda 2. Las reacciones se iniciaron agregando 10 pL de lisado de células/pocillo. Las placas se sellaron y se incubaron con agitación a 50 o 55°C durante 24 h. Las reacciones se detuvieron con 600 pL de acetonitrilo y las muestras se examinaron por HPLC como se describe en el Ejemplo 5.
Ejemplo 8: Proceso para la conversión del compuesto (IA) en el compuesto (IIA) en una escala de 5 mL
Se llevaron a cabo reacciones en una escala de 5 ml de la manera siguiente. A un vial de vidrio de 20 mL equipado con una barra de agitación magnética en forma de cruz se le agregó 0,75 mL (o 0,5 mL en el caso de concentración de 10% v/v de PEG 200) de tampón de TEA 100 mM (pH 7,0). Se agregaron 2 mL de solución madre de IPM^HCl 5 M al vial, seguido de 1 mL de solución madre de PLP 5 mM. La mezcla se agitó a 500 rpm (agitación magnética). El pH de la mezcla se ajustó después a 7,0 con solución de NaOH 1 M. Después se agregaron 125 mg (o 250 mg para una concentración de 50 g/L o 500 mg para 100 g/L) de sustrato (sólido) al vial. Después se agregaron a la mezcla 0,25 mL (o 0,5 mL para 10% v/v) de PEG 200. Las concentraciones finales de los componentes fueron: 25 g/L (o 50 o 100 g/L) de compuesto (IA); Pl P 1 mM; IPM 2 M; 5% v/v (o 10%) de PEG 200; 2 g/L de enzima TA; TEA 100 mM, pH 7.0. Después la mezcla se agitó y se calentó hasta 50°C.
Las reacciones se iniciaron agregando 1 mL de la solución madre de la enzima (10 g/L). Se tomaron muestras de 20 pL en diferentes momentos y se diluyeron con 750 pL de metanol, y se analizaron por HPLC. Después de 24 h, las mezclas de reacción se detuvieron con 5 mL de acetonitrilo y las muestras se analizaron por HPLC para obtener el % de conversión final.
Ejemplo 9: Proceso para la conversión del compuesto (IA) en el compuesto (IIA) en una escala de 100 mL
Se llevaron a cabo reacciones en una escala de 100 mL de la manera siguiente. A un balón de 250 mL con una cuchilla de agitación en forma de ancla se le agregaron 15 mL de tampón de TEA 100 mM (pH 7). Se agregaron 40 mL de solución madre de IPM^HCl 5 M al balón, seguido de 20 mL de solución madre de PLP 5 mM. La mezcla se agitó a 100 rpm (agitación aérea) y el pH se ajustó a 7,0 usando NaOH 10 M. Después se agregó el sustrato sólido Compuesto (IA) al balón en el transcurso de ~5 min con agitación. Después se agregó PEG 200 (5 mL) y la mezcla se calentó hasta 50°C. Después se agregaron 20 mL de la solución madre de enzima (10 g/L) para iniciar la reacción. La reacción se agitó a 200 rpm (agitación magnética). Se tomaron muestras de 20 pL en diferentes momentos y se diluyeron con 750 pL de metanol, y se analizaron por HPLC. En algunos casos, en los que no se prosiguió con el tratamiento final, después de 24 h, las mezclas de reacción se detuvieron con 100 mL de acetonitrilo y las muestras se analizaron por HPLC para obtener el % de conversión final (Figura 9). Concentración de los diferentes componentes en la reacción: cetona: 25 g/L (o 50 o 100 g/L); PLP: 1 mM; IPM: 2 M; PEG 200: 5% v/v; enzima TA: 2 g/L; tampón: TEA 100 mM, pH 7.0. La conversión de sustrato en producto se analizó por HPLC como se describe en el Ejemplo 3.
Tratamiento final del producto: Después de 24 h de reacción en las condiciones descritas antes (hasta el punto 11), la mezcla de reacción se enfrió hasta temperatura ambiente. La mezcla se filtró a través de un embudo de vidrio sinterizado G4 estándar con una pieza de papel de filtro (Whatman 1, tamaño de poro 11 pm). El balón se enjuagó con 20 mL de agua desionizada que después se filtró a través del mismo embudo. La torta de filtración se lavó dos veces con 20 mL de agua desionizada. El pH del filtrado se ajustó de 6,8 a 3 con solución de HCl 5 M. Después el filtrado se transfirió a un embudo de separación y se extrajo con 100 mL de MTBE. Se permitió que la mezcla bifásica se separara. La capa de MTBE que contenía el sustrato sin reaccionar y las impurezas se desechó. La capa acuosa se transfirió a un vaso de precipitados y se agregaron 100 ml de MBTE. El pH de la capa acuosa se ajustó después de 3 a 10 utilizando solución de NaOH 10 M. Después la mezcla se transfirió a un embudo de separación y se permitió que las fases se separaran. La capa acuosa se extrajo después con 100 mL MTBE tres veces (nb: se repitió hasta que el producto no estuvo presente en la capa acuosa). Las fases de MTBE de las tres extracciones se combinaron y se evaporaron hasta sequedad usando un evaporador rotatorio. El producto crudo se secó posteriormente al vacío durante 48 h.
Ejemplo 10: Proceso para la conversión del compuesto (IA) en el compuesto (IIA) en una escala de 30 g
Se disolvieron 152,48 g de clorhidrato de /'so-propilamina y 0,204 g de piridoxal fosfato monohidratado en 495 ml de agua mientras se agitaba. A esta solución clara de color amarillo se le agregaron una solución de 30,0 g de cetona en 85 ml de polietilenglicol (peso molecular promedio 200) en el transcurso de 15 minutos. Después de la adición la cetona precipitó como partículas finas que se distribuyeron uniformemente en el medio de reacción. Se agregaron a la suspensión 180 ml de tampón de trietanolamina (0,1 mol/l, pH 7) y el pH se ajustó a 7 por adición de solución acuosa de hidróxido de sodio (1 mol/l). La mezcla de reacción se calentó hasta 50°C y se agregó una solución de 1,62 g de transaminasa SEQ ID NO: 134 disuelta en 162 ml de tampón de trietanolamina (0.1 mol/l, pH 7). La mezcla de reacción se mantuvo continuamente a pH 7 mediante adición de solución acuosa de hidróxido de sodio de 1 mol/l. La mezcla de reacción se agitó 24 h a 50°C y se hizo pasar una corriente de nitrógeno sobre la superficie de la mezcla de reacción para quitar la acetona formada. Después la mezcla de reacción se enfrió hasta 25°C y se filtró sobre un lecho de conglomerado de celulosa. El pH del filtrado se ajustó a =1 mediante adición de ácido sulfúrico concentrado. El filtrado acidificado se extrajo con 250 ml de acetato de /so-propilo. Las capas se separaron y el pH de la fase acuosa se ajustó a =10 mediante adición de solución acuosa concentrada de hidróxido de sodio. La fase acuosa basificada se extrajo con acetato de /so-propilo. Las capas se separaron y la fase orgánica se lavó con 100 ml de agua. La fase orgánica se concentró por destilación a 2/3 de su volumen original. En un segundo reactor se disolvieron 33,98 g de ácido (+)-canforsulfónico en 225 ml de acetato de /so-propilo después de calentar a reflujo y se agregó la fase orgánica concentrada en el transcurso de 10 minutos. Después que se completó la adición, la suspensión densa formada se enfrió hasta 0°C en el transcurso de 2 horas y se mantuvo a 0°C durante 15 horas. La sal precipitada (+)-canforsulfonato de amina se filtró, se lavó con 70 ml de acetato de /so-propilo y se secó a 40°C al vacío produciendo 51,57 g de cristales incoloros (84,5% de rendimiento c.t.)
Datos analíticos
IR:
v (cm-1)=3296, 3061, 2962, 2635, 2531, 2078, 1741, 1625, 1577, 1518, 1461, 1415, 1392, 1375, 1324, 1302, 1280, 1256, 1226, 1170, 1126, 1096, 1041,988, 966, 937, 868, 834, 814, 790, 766, 746, 719, 669, 615.
LC-MS (ESI ):
Ion amonio: m/z =227 ([M+H]), 268 ([M+H+CHaCN]), 453 ([2M+H]).
Ion canforsulfonato: m/z =250 ([M+NH4]), 482 ([2M+NH4]).
LC-MS (ESI -):
Ion canforsulfonato: m/z=231 ([M-H]), 463 ([2M-H]).
1H-RMN (DMSO-d6, 400 MHz):
11,22 (s a., 1H), 7,75 (s a., 3H), 7,59 (d, J = 10,3 Hz, 1H), 7,54 (d, J = 6,5 Hz, 1H), 7,36 (d, J = 2,3 Hz, 1H), 3,37 - 3,50 (m, 1H), 2,98 (dd, J = 14,3, 5,8 Hz, 1H), 2,91 (d, J = 14,8 Hz, 1H), 2,81 (dd, J = 14,3, 8,0 Hz, 1H), 2,63 - 2,74 (m, 1H), 2,41 (d, J = 14,6 Hz, 1H), 2,24 (dt, J = 18,3, 3,8 Hz, 1H), 1,94 (t, J = 4,4 Hz, 1H), 1,86 (dt, J = 7,4, 3,6 Hz, 1H), 1,80 (d, J = 18,1 Hz, 1H), 1,23 - 1,35 (m, 2H), 1,15 (d, J = 6,3 Hz, 3H), 1,05 (s, 3H), 0,74 (s, 3H)
Amina libre (obtenida evaporando la capa de acetato de iso-propilo después de la extracción de la capa acuosa basificada):
1H RMN (400MHz, DMSO-da):
11,04 (s a., 1H), 7,50 (d, J = 10,5 Hz, 1H), 7,48 (d, J = 6,5 Hz, 1H), 7,25 (s, 1H), 3,03 (sxt, J = 6,3 Hz, 1H), 2,61 (dd, J = 14,3, 6,5 Hz, 1H), 2,57 (dd, J = 14,1,6,5 Hz, 1H), 1,36 (s a., 2H), 0,96 (d, J = 6,3 Hz, 3H)
Ejemplo 11: Proceso para la conversión del compuesto (IIA) en el compuesto (IVB)
Se suspendieron 13,62 g de 5-cloroisatina en 35 ml de /'so-propanol y se agregaron 2,3 g de trietilamina. La suspensión se calentó a reflujo y se le agregó una solución de 34,42 g de sal (+)-canforsulfonato de amina disuelta en 300 ml de /so-propanol, en el transcurso de 50 minutos. La mezcla de reacción se agitó a reflujo durante 17 horas. La mezcla de reacción se enfrió hasta 75°C y se agregaron 17,4 g de ácido (+)-canforsulfónico a la mezcla de reacción. Se eliminaron aproximadamente 300 ml de /so-propanol mediante destilación al vacío. El /so-propanol eliminado por destilación se reemplazó con acetato de /so-propilo y se continuó con la destilación al vacío. Esta destilación se repitió una segunda vez. Al residuo de la destilación se le agregaron 19 ml de etanol y 265 ml de acetato de etilo y la mezcla se calentó a reflujo. La mezcla se enfrió en rampas hasta 0°C y se mantuvo a 0°C durante 24 horas. Los cristales de color beige a blancuzco se separaron por filtración, se lavaron con 3 porciones (cada una de 25 ml) de acetato de etilo enfriado previamente (0°C) y se secaron al vacío produciendo 40,3 g de cristales beige a blancuzcos. (rendimiento 86,3% c.t.) IR:
v (cm-1)= 3229, 3115, 3078, 3052, 2971, 2890, 2841, 2772, 2722, 2675, 2605, 2434, 1741, 1718, 1621, 1606, 1483, 1460, 1408, 1391, 1372, 1336, 1307, 1277, 1267, 1238, 1202, 1184, 1162, 1149, 1128, 1067, 1036, 987, 973, 939, 919, 896, 871,857, 843, 785, 771,756, 717, 690, 678, 613.
LC-MS (ESI ):
Ion amonio: m/z =390 ([M+H]), 431 ([M+H+CH3CN])
Ion canforsulfonato: m/z =250 ([M+NH4]), 482 ([2M+NH4])
LC-MS (ESI -):
Ion canforsulfonato: m/z=231 ([M-H]), 463 ([2M-H])
1H RMN (DMSO-da, 600 MHz):
11,49 (s, 1H), 11,23 (s, 1H), 10,29 - 10,83 (m, 1H), 9,78 - 10,31 (m, 1H), 7,55 - 7,60 (m, 2H), 7,52 (s, 1H), 7,40 (d, J = 6,2 Hz, 1H), 7,16 (d, J = 8,8 Hz, 1H), 4,52 - 4,63 (m, 1H), 3,20 (dd, J = 16,3, 4,2 Hz, 1H), 2,96 (dd, J = 16,1, 11,3 Hz, 1H), 2,90 (d, J = 15,0 Hz, 1H), 2,56 - 2,63 (m, 1H), 2,39 (d, J = 14,6 Hz, 1H), 2,21 (dt, J = 18,0, 3,8 Hz, 1H), 1,89 - 1,93 (m, 1H), 1,81 (ddd, J = 15,3, 7,8, 3,7 Hz, 1H), 1,76 (d, J = 18,3 Hz, 1H), 1,53 (d, J = 6,6 Hz, 3H), 1,20 - 1,33 (m, 2H), 0,98 (s, 3H), 0,70 (s, 3H)
Ejemplo 12: Proceso para preparar un compuesto de fórmula (IVA) / hidrato
La solución clara, amarillenta, se calentó hasta 58°C de temperatura interna. La solución clara, amarillenta, se calentó hasta 58°C de temperatura interna. Se agregaron a la solución 85 g de una solución acuosa de carbonato de sodio al 10% en el transcurso de 10 minutos. La solución clara se filtró en un filtro para partículas en un segundo recipiente de reacción. El recipiente y el filtro de partículas se enjuagaron cada uno con 25 ml de una mezcla de etanol:agua (3:1 v/v) en el segundo recipiente de reacción. La solución combinada filtrada de partículas se calentó hasta 58°C de temperatura interna y se le agregaron gota a gota 200 ml de agua (WEM) en el transcurso de 15 minutos. Hacia el final de la adición la solución se volvió turbia. La mezcla se agitó durante 10 minutos a 58°C de temperatura interna y después se enfrió lentamente hasta temperatura ambiente en el transcurso de 4 horas 30 minutos formando una suspensión blanca densa, bien estirable. Se agregaron 200 ml de agua a la suspensión y la mezcla se agitó durante otras 15 horas 20 minutos a temperatura ambiente. La suspensión se filtró y la torta de filtración se lavó dos veces con porciones de 25 ml de una mezcla de etanol:agua 9:1 (v/v). Los cristales incoloros se secaron a 60°C al vacío produciendo 26,23 g (= 91,2% de rendimiento).
1H RMN (400 MHz, DMSO-da)
10,70 (s, 1H), 10,52 (s, 1H), 7,44 (d, J = 10,0 Hz, 1H), 7,33 (dd, J = 8,4, 2,1 Hz, 1H), 7,26 (d, J = 6,5 Hz, 1H), 7,05 (d, J = 2,3 Hz, 1H), 6,93 (d, J = 8,3 Hz, 1H), 3,83 - 4,00 (m, 1H), 3,13 (d, J = 6,0 Hz, 1H), 2,77 (dd, J = 15,1,3,8 Hz, 1H), 2,38 (dd, J = 15,1, 10,5 Hz, 1H), 1,17 (d, J = 6,3 Hz, 3H).
Claims (12)
1. Un proceso para preparar un compuesto de fórmula (II) o una de sus sales o solvatos o hidratos,
sus sales, solvatos o hidratos, donde la enzima es SEQ ID NO: 134,
donde:
R4 y R7 son cada uno, independientemente, H o -Cl;
R5 es H, -OH, -CH3, -OCH3, -F, -Cl, -CF3 o -CN;
R6 es H, -OH, -OCH3, -F o -Cl;
R8 es H, -CH3, -CH2CH3, -CH2OH, -CO2H, -CO2CH3, -CO2CH2CH3 o -CF3.
2. El proceso de la reivindicación 1, en donde R5 y R6 son fluoro cuando: R8 es -CH3.
3. El proceso de la reivindicación 1, en donde R5 y R6 son fluoro y cloro, cuando: R8 es -CH3.
4. El proceso de la reivindicación 1, en donde R5 y R6 son hidrógeno cuando: R8 es -CH3.
5. El proceso de la reivindicación 1, en donde R5 es fluoro cuando: R6 es hidrógeno.
8. Un proceso para preparar un compuesto de fórmula (IVA) o una de sus sales o solvatos o hidratos,
hacer reaccionar un compuesto de fórmula (IIIA) o una de sus sales o solvatos o hidratos,
(IIIA)
con un compuesto de fórmula (IIA) o una de sus sales o solvatos o hidratos,
(IIA)
para proporcionar el compuesto de fórmula (IVA) o una de sus sales o solvatos o hidratos,
en donde el compuesto de fórmula (IIA) se prepara mediante transaminación enzimática del compuesto de fórmula (IA), o una de sus sales o hidratos o solvatos,
y en donde la enzima es SEQ ID NO: 134.
11. El proceso de la reivindicación 8, en donde la sal de fórmula (IVB) se convierte en el compuesto de fórmula (IVA) en base libre.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012000359 | 2012-03-23 | ||
PCT/EP2013/056170 WO2013139987A1 (en) | 2012-03-23 | 2013-03-22 | Chemical process for preparing spiroindolones and intermediates thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2748460T3 true ES2748460T3 (es) | 2020-03-16 |
Family
ID=48048006
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES19182727T Active ES2962530T3 (es) | 2012-03-23 | 2013-03-22 | Proceso químico para la preparación de espiroindolonas e intermedios de las mismas |
ES13714246T Active ES2748460T3 (es) | 2012-03-23 | 2013-03-22 | Procesos químicos para preparar espiroindolonas y compuestos intermedios correspondientes |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES19182727T Active ES2962530T3 (es) | 2012-03-23 | 2013-03-22 | Proceso químico para la preparación de espiroindolonas e intermedios de las mismas |
Country Status (21)
Country | Link |
---|---|
US (1) | US9598712B2 (es) |
EP (2) | EP2828256B1 (es) |
JP (1) | JP6117906B2 (es) |
KR (1) | KR102057590B1 (es) |
AP (1) | AP2014007906A0 (es) |
AU (1) | AU2013237330C1 (es) |
BR (1) | BR112014022909B1 (es) |
CA (1) | CA2866222C (es) |
CY (1) | CY1122087T1 (es) |
DK (1) | DK2828256T5 (es) |
ES (2) | ES2962530T3 (es) |
HK (1) | HK1202289A1 (es) |
HR (1) | HRP20191632T1 (es) |
HU (1) | HUE046421T2 (es) |
LT (1) | LT2828256T (es) |
MX (1) | MX354023B (es) |
PL (1) | PL2828256T3 (es) |
PT (1) | PT2828256T (es) |
RU (1) | RU2662815C2 (es) |
SI (1) | SI2828256T1 (es) |
WO (1) | WO2013139987A1 (es) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL287326B2 (en) | 2014-12-18 | 2023-09-01 | Hoffmann La Roche | Tetrahydro-pyrido[3, 4-b]indole estrogen receptor modulators and their uses |
JP2017024992A (ja) * | 2015-07-15 | 2017-02-02 | 公益財団法人微生物化学研究会 | 化合物の製造方法 |
CN118515596A (zh) | 2018-06-21 | 2024-08-20 | 豪夫迈·罗氏有限公司 | 固体形式及制备稠合三环化合物的方法,包括其使用方法 |
WO2021207200A2 (en) * | 2020-04-10 | 2021-10-14 | Codexis, Inc. | Engineered transaminase polypeptides |
CA3193755A1 (en) * | 2020-09-28 | 2022-03-31 | Codexis, Inc. | Engineered biocatalysts and methods for synthesizing chiral amines |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2947758A (en) * | 1959-04-28 | 1960-08-02 | Searle & Co | 3-(omega-hydrazino) alkylindoles |
GB974895A (en) * | 1961-04-06 | 1964-11-11 | Parke Davis & Co | Process for the production of amine compounds |
GB974893A (en) * | 1961-04-06 | 1964-11-11 | Parke Davis & Co | Amine compounds and means of producing the same |
US3183170A (en) * | 1961-10-03 | 1965-05-11 | Sanraku Ocean Kabushiki Kaisha | Method of l-amino acid manufacture |
BE795457A (fr) * | 1972-02-16 | 1973-08-16 | Clin Midy | Amines indoliques, leur preparation et leur application en therapeutiques |
US4073795A (en) * | 1976-06-22 | 1978-02-14 | Hoffmann-La Roche Inc. | Synthesis of tryptophans |
US4331818A (en) * | 1980-03-19 | 1982-05-25 | The Procter & Gamble Company | Chiral phospine ligand |
DE3307095A1 (de) * | 1983-03-01 | 1984-09-06 | Degussa Ag, 6000 Frankfurt | Mikrobiologisch hergestellte l-phenylalanin-dehydrogenase, verfahren zu ihrer gewinnung und ihre verwendung |
EP0135846B1 (en) * | 1983-09-01 | 1990-08-16 | Genetics Institute, Inc. | Production of l-amino acids by transamination |
US4518692A (en) * | 1983-09-01 | 1985-05-21 | Genetics Institute, Inc. | Production of L-amino acids by transamination |
US4859591A (en) * | 1984-07-05 | 1989-08-22 | W. R. Grace & Co.-Conn. | Transamination process for producing amino acids |
US4826766A (en) * | 1985-09-23 | 1989-05-02 | Genetics Institute, Inc. | Production of amino acids using coupled aminotransferases |
CA2533838A1 (en) | 2003-08-11 | 2005-02-24 | Codexis, Inc. | Improved ketoreductase polypeptides and related polynucleotides |
US7541091B2 (en) | 2004-05-18 | 2009-06-02 | M & G Usa Corporation | Compartmentalized resin pellets for oxygen scavenging |
JPWO2006038520A1 (ja) * | 2004-10-05 | 2008-05-15 | 味の素株式会社 | ヒドロキシイミノ酸からのアミノ酸誘導体製造方法 |
WO2008050207A1 (en) * | 2006-10-25 | 2008-05-02 | Pfizer Limited | Heterocyclic compounds useful as anabolic agents for livestock animals |
WO2008108998A2 (en) | 2007-03-02 | 2008-09-12 | Richmond Chemical Corporation | Method to increase the yield and improve purification of products from transaminase reactions |
EP2722333A1 (en) * | 2008-04-29 | 2014-04-23 | Novartis AG | Spiro-indole derivatives for the treatment of parasitic diseases. |
AT507050B1 (de) * | 2008-06-17 | 2010-06-15 | Angewandte Biokatalyse Kompete | Verfahren zur herstellung von aminen unter verwendung von omega-transaminasen |
WO2010081053A2 (en) | 2009-01-08 | 2010-07-15 | Codexis, Inc. | Transaminase polypeptides |
EP2593556B1 (en) | 2010-07-14 | 2017-08-30 | DPx Holdings B.V. | Enzymatic method for (r)-selective amination |
EP2828385B1 (en) * | 2012-03-23 | 2018-02-07 | Codexis, Inc. | Biocatalysts and methods for synthesizing derivatives of tryptamine and tryptamine analogs |
-
2013
- 2013-03-22 US US14/384,233 patent/US9598712B2/en active Active
- 2013-03-22 WO PCT/EP2013/056170 patent/WO2013139987A1/en active Application Filing
- 2013-03-22 ES ES19182727T patent/ES2962530T3/es active Active
- 2013-03-22 ES ES13714246T patent/ES2748460T3/es active Active
- 2013-03-22 SI SI201331580T patent/SI2828256T1/sl unknown
- 2013-03-22 AU AU2013237330A patent/AU2013237330C1/en active Active
- 2013-03-22 MX MX2014011489A patent/MX354023B/es active IP Right Grant
- 2013-03-22 RU RU2014142621A patent/RU2662815C2/ru active
- 2013-03-22 EP EP13714246.9A patent/EP2828256B1/en active Active
- 2013-03-22 HU HUE13714246A patent/HUE046421T2/hu unknown
- 2013-03-22 PT PT137142469T patent/PT2828256T/pt unknown
- 2013-03-22 JP JP2015500948A patent/JP6117906B2/ja active Active
- 2013-03-22 DK DK13714246T patent/DK2828256T5/da active
- 2013-03-22 PL PL13714246T patent/PL2828256T3/pl unknown
- 2013-03-22 KR KR1020147026392A patent/KR102057590B1/ko active IP Right Grant
- 2013-03-22 CA CA2866222A patent/CA2866222C/en active Active
- 2013-03-22 AP AP2014007906A patent/AP2014007906A0/xx unknown
- 2013-03-22 BR BR112014022909-0A patent/BR112014022909B1/pt active IP Right Grant
- 2013-03-22 EP EP19182727.8A patent/EP3578557B1/en active Active
- 2013-03-22 LT LTEP13714246.9T patent/LT2828256T/lt unknown
-
2015
- 2015-03-17 HK HK15102724.2A patent/HK1202289A1/xx unknown
-
2019
- 2019-09-11 HR HRP20191632 patent/HRP20191632T1/hr unknown
- 2019-10-02 CY CY20191101024T patent/CY1122087T1/el unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2748460T3 (es) | Procesos químicos para preparar espiroindolonas y compuestos intermedios correspondientes | |
US10526587B2 (en) | Engineered biocatalysts and methods for synthesizing chiral amines | |
DK2828385T3 (en) | BIOCATALIZATORS AND METHODS FOR SYNTHETIZING DERIVATIVES AND TRYPTAMIN AND TRYPTAMINE ANALOGS | |
CN103998461B (zh) | 用于合成取代的内酰胺的生物催化剂和方法 | |
KR20210031926A (ko) | 조작된 퓨린 뉴클레오사이드 포스포릴라제 변이체 효소 | |
JP2021531749A (ja) | 操作されたフェニルアラニンアンモニアリアーゼポリペプチド | |
KR20210031929A (ko) | 조작된 판토테네이트 키나제 변이체 효소 | |
JP2020521509A (ja) | 操作されたポリペプチドおよびβ−ヒドロキシ−α−アミノ酸合成におけるそれらの用途 | |
JP2022538229A (ja) | 操作された酢酸キナーゼバリアント酵素 | |
CN104185634B (zh) | 制备螺旋吲哚酮和其中间体的化学工艺 | |
JP2022518212A (ja) | 操作されたトランスアミナーゼポリペプチド | |
CN116209754A (zh) | 用于合成手性胺的工程化生物催化剂及方法 |