CN115142141A - 环状化合物库及其构建方法 - Google Patents
环状化合物库及其构建方法 Download PDFInfo
- Publication number
- CN115142141A CN115142141A CN202210148962.6A CN202210148962A CN115142141A CN 115142141 A CN115142141 A CN 115142141A CN 202210148962 A CN202210148962 A CN 202210148962A CN 115142141 A CN115142141 A CN 115142141A
- Authority
- CN
- China
- Prior art keywords
- molecule
- ring
- group
- tag
- reaction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 144
- 150000001923 cyclic compounds Chemical class 0.000 title claims abstract description 49
- 150000001875 compounds Chemical class 0.000 claims abstract description 185
- 238000007363 ring formation reaction Methods 0.000 claims abstract description 105
- 238000006243 chemical reaction Methods 0.000 claims abstract description 95
- 102000004190 Enzymes Human genes 0.000 claims abstract description 46
- 108090000790 Enzymes Proteins 0.000 claims abstract description 46
- 239000007790 solid phase Substances 0.000 claims abstract description 44
- 230000009471 action Effects 0.000 claims abstract description 43
- 125000000539 amino acid group Chemical group 0.000 claims abstract description 35
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 10
- 239000011347 resin Substances 0.000 claims description 419
- 229920005989 resin Polymers 0.000 claims description 419
- 125000000524 functional group Chemical group 0.000 claims description 254
- 108020004414 DNA Proteins 0.000 claims description 134
- 125000006239 protecting group Chemical group 0.000 claims description 77
- 150000001413 amino acids Chemical class 0.000 claims description 48
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims description 47
- 102000012410 DNA Ligases Human genes 0.000 claims description 46
- 108010061982 DNA Ligases Proteins 0.000 claims description 46
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 claims description 46
- 230000015572 biosynthetic process Effects 0.000 claims description 44
- 108091026890 Coding region Proteins 0.000 claims description 43
- 238000003786 synthesis reaction Methods 0.000 claims description 40
- 239000013256 coordination polymer Substances 0.000 claims description 36
- 239000002773 nucleotide Substances 0.000 claims description 35
- 125000003729 nucleotide group Chemical group 0.000 claims description 35
- 239000007787 solid Substances 0.000 claims description 35
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 34
- 239000012634 fragment Substances 0.000 claims description 28
- -1 small molecule compound Chemical class 0.000 claims description 27
- 230000000295 complement effect Effects 0.000 claims description 25
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 25
- ZGTMUACCHSMWAC-UHFFFAOYSA-L EDTA disodium salt (anhydrous) Chemical compound [Na+].[Na+].OC(=O)CN(CC([O-])=O)CCN(CC(O)=O)CC([O-])=O ZGTMUACCHSMWAC-UHFFFAOYSA-L 0.000 claims description 23
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 claims description 23
- 125000003277 amino group Chemical group 0.000 claims description 23
- 239000011780 sodium chloride Substances 0.000 claims description 23
- 239000003109 Disodium ethylene diamine tetraacetate Substances 0.000 claims description 22
- 102000003960 Ligases Human genes 0.000 claims description 22
- 108090000364 Ligases Proteins 0.000 claims description 22
- 125000002619 bicyclic group Chemical group 0.000 claims description 22
- 235000019301 disodium ethylene diamine tetraacetate Nutrition 0.000 claims description 22
- 125000004122 cyclic group Chemical group 0.000 claims description 16
- 125000002887 hydroxy group Chemical group [H]O* 0.000 claims description 16
- 230000000903 blocking effect Effects 0.000 claims description 15
- 230000035484 reaction time Effects 0.000 claims description 15
- 238000002156 mixing Methods 0.000 claims description 11
- 102000006275 Ubiquitin-Protein Ligases Human genes 0.000 claims description 10
- 108010083111 Ubiquitin-Protein Ligases Proteins 0.000 claims description 10
- 125000004432 carbon atom Chemical group C* 0.000 claims description 9
- 238000006798 ring closing metathesis reaction Methods 0.000 claims description 8
- 239000000758 substrate Substances 0.000 claims description 8
- 230000002255 enzymatic effect Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 7
- 239000000126 substance Substances 0.000 claims description 7
- 239000002253 acid Substances 0.000 claims description 6
- 238000003776 cleavage reaction Methods 0.000 claims description 6
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 claims description 6
- 230000000717 retained effect Effects 0.000 claims description 6
- 108010016626 Dipeptides Proteins 0.000 claims description 5
- 150000001299 aldehydes Chemical class 0.000 claims description 5
- 239000002131 composite material Substances 0.000 claims description 5
- 230000007017 scission Effects 0.000 claims description 5
- 150000004985 diamines Chemical class 0.000 claims description 4
- 150000001991 dicarboxylic acids Chemical class 0.000 claims description 4
- 150000002009 diols Chemical class 0.000 claims description 4
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 claims description 3
- 101100382741 Schizosaccharomyces pombe (strain 972 / ATCC 24843) cpy1 gene Proteins 0.000 claims description 3
- 101100244137 Tetradesmus obliquus PETE gene Proteins 0.000 claims description 3
- 150000007513 acids Chemical class 0.000 claims description 3
- 125000003118 aryl group Chemical group 0.000 claims description 3
- 150000002576 ketones Chemical class 0.000 claims description 3
- 230000004048 modification Effects 0.000 claims description 3
- 238000012986 modification Methods 0.000 claims description 3
- 125000002950 monocyclic group Chemical group 0.000 claims description 3
- 229910052736 halogen Inorganic materials 0.000 claims description 2
- 150000002367 halogens Chemical class 0.000 claims description 2
- 125000000449 nitro group Chemical group [O-][N+](*)=O 0.000 claims description 2
- 101150067577 patG gene Proteins 0.000 claims description 2
- 125000001424 substituent group Chemical group 0.000 claims description 2
- 150000001412 amines Chemical class 0.000 claims 2
- 150000002148 esters Chemical class 0.000 claims 2
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 claims 1
- 125000003275 alpha amino acid group Chemical group 0.000 claims 1
- 150000001408 amides Chemical class 0.000 claims 1
- 239000008366 buffered solution Substances 0.000 claims 1
- CREMABGTGYGIQB-UHFFFAOYSA-N carbon carbon Chemical compound C.C CREMABGTGYGIQB-UHFFFAOYSA-N 0.000 claims 1
- 239000011203 carbon fibre reinforced carbon Substances 0.000 claims 1
- 235000017281 sodium acetate Nutrition 0.000 claims 1
- 239000001632 sodium acetate Substances 0.000 claims 1
- BDHFUVZGWQCTTF-UHFFFAOYSA-M sulfonate Chemical compound [O-]S(=O)=O BDHFUVZGWQCTTF-UHFFFAOYSA-M 0.000 claims 1
- 238000010276 construction Methods 0.000 abstract description 19
- 238000005286 illumination Methods 0.000 abstract description 4
- 238000006757 chemical reactions by type Methods 0.000 abstract description 2
- ZMXDDKWLCZADIW-UHFFFAOYSA-N N,N-Dimethylformamide Chemical compound CN(C)C=O ZMXDDKWLCZADIW-UHFFFAOYSA-N 0.000 description 873
- YMWUJEATGCHHMB-UHFFFAOYSA-N Dichloromethane Chemical compound ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 description 357
- 239000000243 solution Substances 0.000 description 146
- 239000000203 mixture Substances 0.000 description 102
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 87
- 125000005647 linker group Chemical group 0.000 description 65
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 62
- 239000000047 product Substances 0.000 description 57
- ASOKPJOREAFHNY-UHFFFAOYSA-N 1-Hydroxybenzotriazole Chemical compound C1=CC=C2N(O)N=NC2=C1 ASOKPJOREAFHNY-UHFFFAOYSA-N 0.000 description 55
- NPZTUJOABDZTLV-UHFFFAOYSA-N hydroxybenzotriazole Substances O=C1C=CC=C2NNN=C12 NPZTUJOABDZTLV-UHFFFAOYSA-N 0.000 description 55
- 229940024606 amino acid Drugs 0.000 description 47
- 235000001014 amino acid Nutrition 0.000 description 44
- 239000000872 buffer Substances 0.000 description 37
- 239000013615 primer Substances 0.000 description 34
- 229940088598 enzyme Drugs 0.000 description 33
- JGFZNNIVVJXRND-UHFFFAOYSA-N N,N-Diisopropylethylamine (DIPEA) Chemical compound CCN(C(C)C)C(C)C JGFZNNIVVJXRND-UHFFFAOYSA-N 0.000 description 31
- VHYFNPMBLIVWCW-UHFFFAOYSA-N 4-Dimethylaminopyridine Chemical compound CN(C)C1=CC=NC=C1 VHYFNPMBLIVWCW-UHFFFAOYSA-N 0.000 description 28
- 238000012216 screening Methods 0.000 description 28
- DTQVDTLACAAQTR-UHFFFAOYSA-N Trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-N 0.000 description 27
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 24
- 125000003088 (fluoren-9-ylmethoxy)carbonyl group Chemical group 0.000 description 23
- 108010069514 Cyclic Peptides Proteins 0.000 description 22
- 102000001189 Cyclic Peptides Human genes 0.000 description 22
- 239000011324 bead Substances 0.000 description 22
- 239000007974 sodium acetate buffer Substances 0.000 description 22
- 238000009833 condensation Methods 0.000 description 20
- 230000005494 condensation Effects 0.000 description 20
- 239000006228 supernatant Substances 0.000 description 20
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 19
- 102000004169 proteins and genes Human genes 0.000 description 19
- 108090000623 proteins and genes Proteins 0.000 description 19
- XEKOWRVHYACXOJ-UHFFFAOYSA-N Ethyl acetate Chemical compound CCOC(C)=O XEKOWRVHYACXOJ-UHFFFAOYSA-N 0.000 description 18
- 239000002904 solvent Substances 0.000 description 18
- 238000001308 synthesis method Methods 0.000 description 18
- 239000007810 chemical reaction solvent Substances 0.000 description 17
- CMWYAOXYQATXSI-UHFFFAOYSA-N n,n-dimethylformamide;piperidine Chemical compound CN(C)C=O.C1CCNCC1 CMWYAOXYQATXSI-UHFFFAOYSA-N 0.000 description 17
- 102000004196 processed proteins & peptides Human genes 0.000 description 16
- 238000010511 deprotection reaction Methods 0.000 description 14
- UQLDLKMNUJERMK-UHFFFAOYSA-L di(octadecanoyloxy)lead Chemical compound [Pb+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O UQLDLKMNUJERMK-UHFFFAOYSA-L 0.000 description 14
- 229920001184 polypeptide Polymers 0.000 description 14
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 13
- SECXISVLQFMRJM-UHFFFAOYSA-N N-Methylpyrrolidone Chemical compound CN1CCCC1=O SECXISVLQFMRJM-UHFFFAOYSA-N 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 13
- KDLHZDBZIXYQEI-UHFFFAOYSA-N palladium Substances [Pd] KDLHZDBZIXYQEI-UHFFFAOYSA-N 0.000 description 13
- 238000012360 testing method Methods 0.000 description 13
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 12
- 210000004027 cell Anatomy 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 239000003960 organic solvent Substances 0.000 description 11
- 230000002194 synthesizing effect Effects 0.000 description 11
- 238000000246 agarose gel electrophoresis Methods 0.000 description 10
- 230000035699 permeability Effects 0.000 description 10
- 238000010532 solid phase synthesis reaction Methods 0.000 description 10
- 238000003756 stirring Methods 0.000 description 10
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 9
- 239000007995 HEPES buffer Substances 0.000 description 9
- 229940125898 compound 5 Drugs 0.000 description 9
- 239000003814 drug Substances 0.000 description 9
- 235000018102 proteins Nutrition 0.000 description 9
- NQTADLQHYWFPDB-UHFFFAOYSA-N N-Hydroxysuccinimide Chemical compound ON1C(=O)CCC1=O NQTADLQHYWFPDB-UHFFFAOYSA-N 0.000 description 8
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 8
- 229940079593 drug Drugs 0.000 description 8
- 239000012528 membrane Substances 0.000 description 8
- 239000000523 sample Substances 0.000 description 8
- 238000010200 validation analysis Methods 0.000 description 8
- 238000012795 verification Methods 0.000 description 8
- BDNKZNFMNDZQMI-UHFFFAOYSA-N 1,3-diisopropylcarbodiimide Chemical compound CC(C)N=C=NC(C)C BDNKZNFMNDZQMI-UHFFFAOYSA-N 0.000 description 7
- QTBSBXVTEAMEQO-UHFFFAOYSA-N acetic acid Substances CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 7
- 230000001588 bifunctional effect Effects 0.000 description 7
- 239000007853 buffer solution Substances 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 238000011534 incubation Methods 0.000 description 7
- 239000011259 mixed solution Substances 0.000 description 7
- 229910052757 nitrogen Inorganic materials 0.000 description 7
- PARWUHTVGZSQPD-UHFFFAOYSA-N phenylsilane Chemical compound [SiH3]C1=CC=CC=C1 PARWUHTVGZSQPD-UHFFFAOYSA-N 0.000 description 7
- 102100030708 GTPase KRas Human genes 0.000 description 6
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 229910052763 palladium Inorganic materials 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 238000007619 statistical method Methods 0.000 description 6
- 101150047697 tagB gene Proteins 0.000 description 6
- 101150009385 tcpI gene Proteins 0.000 description 6
- ZGYICYBLPGRURT-UHFFFAOYSA-N tri(propan-2-yl)silicon Chemical compound CC(C)[Si](C(C)C)C(C)C ZGYICYBLPGRURT-UHFFFAOYSA-N 0.000 description 6
- 102100036466 Delta-like protein 3 Human genes 0.000 description 5
- 101000928513 Homo sapiens Delta-like protein 3 Proteins 0.000 description 5
- 229910019142 PO4 Inorganic materials 0.000 description 5
- 150000001502 aryl halides Chemical class 0.000 description 5
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 5
- 229940125773 compound 10 Drugs 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- ZLVXBBHTMQJRSX-VMGNSXQWSA-N jdtic Chemical compound C1([C@]2(C)CCN(C[C@@H]2C)C[C@H](C(C)C)NC(=O)[C@@H]2NCC3=CC(O)=CC=C3C2)=CC=CC(O)=C1 ZLVXBBHTMQJRSX-VMGNSXQWSA-N 0.000 description 5
- 238000002372 labelling Methods 0.000 description 5
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 5
- 239000010452 phosphate Substances 0.000 description 5
- 108010026668 snake venom protein C activator Proteins 0.000 description 5
- ONBQEOIKXPHGMB-VBSBHUPXSA-N 1-[2-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]oxy-4,6-dihydroxyphenyl]-3-(4-hydroxyphenyl)propan-1-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1OC1=CC(O)=CC(O)=C1C(=O)CCC1=CC=C(O)C=C1 ONBQEOIKXPHGMB-VBSBHUPXSA-N 0.000 description 4
- KGVHCTWYMPWEGN-FSPLSTOPSA-N Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CN KGVHCTWYMPWEGN-FSPLSTOPSA-N 0.000 description 4
- LCPYQJIKPJDLLB-UWVGGRQHSA-N Leu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(C)C LCPYQJIKPJDLLB-UWVGGRQHSA-N 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- 125000000217 alkyl group Chemical group 0.000 description 4
- 239000008346 aqueous phase Substances 0.000 description 4
- 125000004429 atom Chemical group 0.000 description 4
- 229940126142 compound 16 Drugs 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 4
- 239000012043 crude product Substances 0.000 description 4
- 238000010494 dissociation reaction Methods 0.000 description 4
- 230000005593 dissociations Effects 0.000 description 4
- 239000012467 final product Substances 0.000 description 4
- 108010091798 leucylleucine Proteins 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 238000011865 proteolysis targeting chimera technique Methods 0.000 description 4
- 229940124823 proteolysis targeting chimeric molecule Drugs 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 150000003384 small molecules Chemical class 0.000 description 4
- 230000008685 targeting Effects 0.000 description 4
- ORKKMGRINLTBPC-FQEVSTJZSA-N (4s)-4-(9h-fluoren-9-ylmethoxycarbonylamino)-5-oxo-5-prop-2-enoxypentanoic acid Chemical compound C1=CC=C2C(COC(=O)N[C@@H](CCC(=O)O)C(=O)OCC=C)C3=CC=CC=C3C2=C1 ORKKMGRINLTBPC-FQEVSTJZSA-N 0.000 description 3
- WFDIJRYMOXRFFG-UHFFFAOYSA-N Acetic anhydride Chemical compound CC(=O)OC(C)=O WFDIJRYMOXRFFG-UHFFFAOYSA-N 0.000 description 3
- 239000005711 Benzoic acid Substances 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- 239000007821 HATU Substances 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 125000003172 aldehyde group Chemical group 0.000 description 3
- 235000010233 benzoic acid Nutrition 0.000 description 3
- 229940125782 compound 2 Drugs 0.000 description 3
- 238000006482 condensation reaction Methods 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 229940127276 delta-like ligand 3 Drugs 0.000 description 3
- 239000012153 distilled water Substances 0.000 description 3
- 239000003480 eluent Substances 0.000 description 3
- 238000000684 flow cytometry Methods 0.000 description 3
- 229960002989 glutamic acid Drugs 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 239000003999 initiator Substances 0.000 description 3
- 238000005304 joining Methods 0.000 description 3
- 239000000816 peptidomimetic Substances 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 230000004850 protein–protein interaction Effects 0.000 description 3
- OJBNDXHENJDCBA-QFIPXVFZSA-N (2s)-2-(9h-fluoren-9-ylmethoxycarbonylamino)-6-(prop-2-enoxycarbonylamino)hexanoic acid Chemical compound C1=CC=C2C(COC(=O)N[C@@H](CCCCNC(=O)OCC=C)C(=O)O)C3=CC=CC=C3C2=C1 OJBNDXHENJDCBA-QFIPXVFZSA-N 0.000 description 2
- QFLWZFQWSBQYPS-AWRAUJHKSA-N (3S)-3-[[(2S)-2-[[(2S)-2-[5-[(3aS,6aR)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]pentanoylamino]-3-methylbutanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-4-[1-bis(4-chlorophenoxy)phosphorylbutylamino]-4-oxobutanoic acid Chemical compound CCCC(NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H](NC(=O)CCCCC1SC[C@@H]2NC(=O)N[C@H]12)C(C)C)P(=O)(Oc1ccc(Cl)cc1)Oc1ccc(Cl)cc1 QFLWZFQWSBQYPS-AWRAUJHKSA-N 0.000 description 2
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 2
- SLXKOJJOQWFEFD-UHFFFAOYSA-N 6-aminohexanoic acid Chemical compound NCCCCCC(O)=O SLXKOJJOQWFEFD-UHFFFAOYSA-N 0.000 description 2
- ARPVSMCNIDAQBO-YUMQZZPRSA-N Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ARPVSMCNIDAQBO-YUMQZZPRSA-N 0.000 description 2
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 2
- JBCLFWXMTIKCCB-VIFPVBQESA-N Gly-Phe Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-VIFPVBQESA-N 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 2
- ATHHXGZTWNVVOU-UHFFFAOYSA-N N-methylformamide Chemical compound CNC=O ATHHXGZTWNVVOU-UHFFFAOYSA-N 0.000 description 2
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 2
- PMZURENOXWZQFD-UHFFFAOYSA-L Sodium Sulfate Chemical compound [Na+].[Na+].[O-]S([O-])(=O)=O PMZURENOXWZQFD-UHFFFAOYSA-L 0.000 description 2
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 2
- LNUFLCYMSVYYNW-ZPJMAFJPSA-N [(2r,3r,4s,5r,6r)-2-[(2r,3r,4s,5r,6r)-6-[(2r,3r,4s,5r,6r)-6-[(2r,3r,4s,5r,6r)-6-[[(3s,5s,8r,9s,10s,13r,14s,17r)-10,13-dimethyl-17-[(2r)-6-methylheptan-2-yl]-2,3,4,5,6,7,8,9,11,12,14,15,16,17-tetradecahydro-1h-cyclopenta[a]phenanthren-3-yl]oxy]-4,5-disulfo Chemical compound O([C@@H]1[C@@H](COS(O)(=O)=O)O[C@@H]([C@@H]([C@H]1OS(O)(=O)=O)OS(O)(=O)=O)O[C@@H]1[C@@H](COS(O)(=O)=O)O[C@@H]([C@@H]([C@H]1OS(O)(=O)=O)OS(O)(=O)=O)O[C@@H]1[C@@H](COS(O)(=O)=O)O[C@H]([C@@H]([C@H]1OS(O)(=O)=O)OS(O)(=O)=O)O[C@@H]1C[C@@H]2CC[C@H]3[C@@H]4CC[C@@H]([C@]4(CC[C@@H]3[C@@]2(C)CC1)C)[C@H](C)CCCC(C)C)[C@H]1O[C@H](COS(O)(=O)=O)[C@@H](OS(O)(=O)=O)[C@H](OS(O)(=O)=O)[C@H]1OS(O)(=O)=O LNUFLCYMSVYYNW-ZPJMAFJPSA-N 0.000 description 2
- 230000009102 absorption Effects 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 239000011543 agarose gel Substances 0.000 description 2
- 238000004873 anchoring Methods 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 239000013553 cell monolayer Substances 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000001212 derivatisation Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000009509 drug development Methods 0.000 description 2
- 238000007877 drug screening Methods 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 229910021645 metal ion Inorganic materials 0.000 description 2
- 239000002547 new drug Substances 0.000 description 2
- 125000004433 nitrogen atom Chemical group N* 0.000 description 2
- 239000012074 organic phase Substances 0.000 description 2
- 238000010647 peptide synthesis reaction Methods 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 235000013930 proline Nutrition 0.000 description 2
- 239000012264 purified product Substances 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000011550 stock solution Substances 0.000 description 2
- 125000005931 tert-butyloxycarbonyl group Chemical group [H]C([H])([H])C(OC(*)=O)(C([H])([H])[H])C([H])([H])[H] 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- GHYOCDFICYLMRF-UTIIJYGPSA-N (2S,3R)-N-[(2S)-3-(cyclopenten-1-yl)-1-[(2R)-2-methyloxiran-2-yl]-1-oxopropan-2-yl]-3-hydroxy-3-(4-methoxyphenyl)-2-[[(2S)-2-[(2-morpholin-4-ylacetyl)amino]propanoyl]amino]propanamide Chemical compound C1(=CCCC1)C[C@@H](C(=O)[C@@]1(OC1)C)NC([C@H]([C@@H](C1=CC=C(C=C1)OC)O)NC([C@H](C)NC(CN1CCOCC1)=O)=O)=O GHYOCDFICYLMRF-UTIIJYGPSA-N 0.000 description 1
- JQLPMTXRCLXOJO-NRFANRHFSA-N (2s)-2-(9h-fluoren-9-ylmethoxycarbonylamino)-3-pyridin-3-ylpropanoic acid Chemical compound C([C@@H](C(=O)O)NC(=O)OCC1C2=CC=CC=C2C2=CC=CC=C21)C1=CC=CN=C1 JQLPMTXRCLXOJO-NRFANRHFSA-N 0.000 description 1
- KSDTXRUIZMTBNV-INIZCTEOSA-N (2s)-2-(9h-fluoren-9-ylmethoxycarbonylamino)butanedioic acid Chemical compound C1=CC=C2C(COC(=O)N[C@@H](CC(=O)O)C(O)=O)C3=CC=CC=C3C2=C1 KSDTXRUIZMTBNV-INIZCTEOSA-N 0.000 description 1
- VCFCFPNRQDANPN-IBGZPJMESA-N (2s)-2-(9h-fluoren-9-ylmethoxycarbonylamino)hexanoic acid Chemical compound C1=CC=C2C(COC(=O)N[C@@H](CCCC)C(O)=O)C3=CC=CC=C3C2=C1 VCFCFPNRQDANPN-IBGZPJMESA-N 0.000 description 1
- YUGBZNJSGOBFOV-INIZCTEOSA-N (2s)-4-amino-2-(9h-fluoren-9-ylmethoxycarbonylamino)-4-oxobutanoic acid Chemical compound C1=CC=C2C(COC(=O)N[C@@H](CC(=O)N)C(O)=O)C3=CC=CC=C3C2=C1 YUGBZNJSGOBFOV-INIZCTEOSA-N 0.000 description 1
- NBMSMZSRTIOFOK-SFHVURJKSA-N (2s)-5-(carbamoylamino)-2-(9h-fluoren-9-ylmethoxycarbonylamino)pentanoic acid Chemical compound C1=CC=C2C(COC(=O)N[C@@H](CCCNC(=O)N)C(O)=O)C3=CC=CC=C3C2=C1 NBMSMZSRTIOFOK-SFHVURJKSA-N 0.000 description 1
- VZXQYACYLGRQJU-IBGZPJMESA-N (3s)-3-(9h-fluoren-9-ylmethoxycarbonylamino)-4-[(2-methylpropan-2-yl)oxy]-4-oxobutanoic acid Chemical compound C1=CC=C2C(COC(=O)N[C@@H](CC(O)=O)C(=O)OC(C)(C)C)C3=CC=CC=C3C2=C1 VZXQYACYLGRQJU-IBGZPJMESA-N 0.000 description 1
- FPIRBHDGWMWJEP-UHFFFAOYSA-N 1-hydroxy-7-azabenzotriazole Chemical compound C1=CN=C2N(O)N=NC2=C1 FPIRBHDGWMWJEP-UHFFFAOYSA-N 0.000 description 1
- FGRBYDKOBBBPOI-UHFFFAOYSA-N 10,10-dioxo-2-[4-(N-phenylanilino)phenyl]thioxanthen-9-one Chemical compound O=C1c2ccccc2S(=O)(=O)c2ccc(cc12)-c1ccc(cc1)N(c1ccccc1)c1ccccc1 FGRBYDKOBBBPOI-UHFFFAOYSA-N 0.000 description 1
- 238000005160 1H NMR spectroscopy Methods 0.000 description 1
- XNOJSAOJCBOZTA-UHFFFAOYSA-N 2-[2-[2-[2-(9h-fluoren-9-ylmethoxycarbonylamino)ethoxy]ethoxy]ethoxy]acetic acid Chemical compound C1=CC=C2C(COC(=O)NCCOCCOCCOCC(=O)O)C3=CC=CC=C3C2=C1 XNOJSAOJCBOZTA-UHFFFAOYSA-N 0.000 description 1
- NUHRPLKTAAVHCZ-UHFFFAOYSA-N 3-[2-[2-[2-[2-(9h-fluoren-9-ylmethoxycarbonylamino)ethoxy]ethoxy]ethoxy]ethoxy]propanoic acid Chemical compound C1=CC=C2C(COC(=O)NCCOCCOCCOCCOCCC(=O)O)C3=CC=CC=C3C2=C1 NUHRPLKTAAVHCZ-UHFFFAOYSA-N 0.000 description 1
- PCOCFIOYWNCGBM-UHFFFAOYSA-N 4-[(2-methylpropan-2-yl)oxy]-4-oxobutanoic acid Chemical compound CC(C)(C)OC(=O)CCC(O)=O PCOCFIOYWNCGBM-UHFFFAOYSA-N 0.000 description 1
- DUIJUTBRRZCWRD-UHFFFAOYSA-N 4-[4-(1-hydroxyethyl)-2-methoxy-5-nitrophenoxy]butanoic acid Chemical compound COC1=CC(C(C)O)=C([N+]([O-])=O)C=C1OCCCC(O)=O DUIJUTBRRZCWRD-UHFFFAOYSA-N 0.000 description 1
- 101100368725 Bacillus subtilis (strain 168) tagF gene Proteins 0.000 description 1
- OJRUSAPKCPIVBY-KQYNXXCUSA-N C1=NC2=C(N=C(N=C2N1[C@H]3[C@@H]([C@@H]([C@H](O3)COP(=O)(CP(=O)(O)O)O)O)O)I)N Chemical compound C1=NC2=C(N=C(N=C2N1[C@H]3[C@@H]([C@@H]([C@H](O3)COP(=O)(CP(=O)(O)O)O)O)O)I)N OJRUSAPKCPIVBY-KQYNXXCUSA-N 0.000 description 1
- 229940126062 Compound A Drugs 0.000 description 1
- WHUUTDBJXJRKMK-GSVOUGTGSA-N D-glutamic acid Chemical compound OC(=O)[C@H](N)CCC(O)=O WHUUTDBJXJRKMK-GSVOUGTGSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 108020001019 DNA Primers Proteins 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 238000012413 Fluorescence activated cell sorting analysis Methods 0.000 description 1
- 206010059024 Gastrointestinal toxicity Diseases 0.000 description 1
- NLDMNSXOCDLTTB-UHFFFAOYSA-N Heterophylliin A Natural products O1C2COC(=O)C3=CC(O)=C(O)C(O)=C3C3=C(O)C(O)=C(O)C=C3C(=O)OC2C(OC(=O)C=2C=C(O)C(O)=C(O)C=2)C(O)C1OC(=O)C1=CC(O)=C(O)C(O)=C1 NLDMNSXOCDLTTB-UHFFFAOYSA-N 0.000 description 1
- VLDVBZICYBVQHB-IUCAKERBSA-N His-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])CC1=CN=CN1 VLDVBZICYBVQHB-IUCAKERBSA-N 0.000 description 1
- 101100193693 Kirsten murine sarcoma virus K-RAS gene Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 125000000570 L-alpha-aspartyl group Chemical group [H]OC(=O)C([H])([H])[C@]([H])(N([H])[H])C(*)=O 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 239000007987 MES buffer Substances 0.000 description 1
- 101100030361 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) pph-3 gene Proteins 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 108010019160 Pancreatin Proteins 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108010067902 Peptide Library Proteins 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 150000001336 alkenes Chemical class 0.000 description 1
- 125000003342 alkenyl group Chemical group 0.000 description 1
- 150000001345 alkine derivatives Chemical class 0.000 description 1
- 150000001350 alkyl halides Chemical class 0.000 description 1
- 125000000304 alkynyl group Chemical group 0.000 description 1
- 125000005336 allyloxy group Chemical group 0.000 description 1
- 150000001370 alpha-amino acid derivatives Chemical class 0.000 description 1
- 235000008206 alpha-amino acids Nutrition 0.000 description 1
- 125000000266 alpha-aminoacyl group Chemical group 0.000 description 1
- 229960002684 aminocaproic acid Drugs 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 150000001540 azides Chemical class 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 229910002091 carbon monoxide Inorganic materials 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 150000005829 chemical entities Chemical class 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- FOCAUTSVDIKZOP-UHFFFAOYSA-N chloroacetic acid Chemical compound OC(=O)CCl FOCAUTSVDIKZOP-UHFFFAOYSA-N 0.000 description 1
- 229940106681 chloroacetic acid Drugs 0.000 description 1
- 239000012230 colorless oil Substances 0.000 description 1
- 229940125797 compound 12 Drugs 0.000 description 1
- 229940125758 compound 15 Drugs 0.000 description 1
- 229940126214 compound 3 Drugs 0.000 description 1
- 239000000039 congener Substances 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000005336 cracking Methods 0.000 description 1
- 230000002380 cytological effect Effects 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 125000004185 ester group Chemical group 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 125000005519 fluorenylmethyloxycarbonyl group Chemical group 0.000 description 1
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 231100000414 gastrointestinal toxicity Toxicity 0.000 description 1
- 125000003827 glycol group Chemical group 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 231100000304 hepatotoxicity Toxicity 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 238000005710 macrocyclization reaction Methods 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 239000012299 nitrogen atmosphere Substances 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 229940055695 pancreatin Drugs 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 239000012466 permeate Substances 0.000 description 1
- 125000000951 phenoxy group Chemical group [H]C1=C([H])C([H])=C(O*)C([H])=C1[H] 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 125000001500 prolyl group Chemical class [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 239000003223 protective agent Substances 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- LVTJOONKWUXEFR-FZRMHRINSA-N protoneodioscin Natural products O(C[C@@H](CC[C@]1(O)[C@H](C)[C@@H]2[C@]3(C)[C@H]([C@H]4[C@@H]([C@]5(C)C(=CC4)C[C@@H](O[C@@H]4[C@H](O[C@H]6[C@@H](O)[C@@H](O)[C@@H](O)[C@H](C)O6)[C@@H](O)[C@H](O[C@H]6[C@@H](O)[C@@H](O)[C@@H](O)[C@H](C)O6)[C@H](CO)O4)CC5)CC3)C[C@@H]2O1)C)[C@H]1[C@H](O)[C@H](O)[C@H](O)[C@@H](CO)O1 LVTJOONKWUXEFR-FZRMHRINSA-N 0.000 description 1
- 238000011403 purification operation Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000009103 reabsorption Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000012146 running buffer Substances 0.000 description 1
- 239000012488 sample solution Substances 0.000 description 1
- 125000000467 secondary amino group Chemical group [H]N([*:1])[*:2] 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000007086 side reaction Methods 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 229940126586 small molecule drug Drugs 0.000 description 1
- 230000008961 swelling Effects 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 150000003512 tertiary amines Chemical class 0.000 description 1
- YLQBMQCUIZJEEH-UHFFFAOYSA-N tetrahydrofuran Natural products C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 1
- 229940124598 therapeutic candidate Drugs 0.000 description 1
- 125000002769 thiazolinyl group Chemical group 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1068—Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
- C40B40/08—Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/10—Libraries containing peptides or polypeptides, or derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/14—Solid phase synthesis, i.e. wherein one or more library building blocks are bound to a solid support during library creation; Particular methods of cleavage from the solid support
- C40B50/18—Solid phase synthesis, i.e. wherein one or more library building blocks are bound to a solid support during library creation; Particular methods of cleavage from the solid support using a particular method of attachment to the solid support
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B70/00—Tags or labels specially adapted for combinatorial chemistry or libraries, e.g. fluorescent tags or bar codes
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biochemistry (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Genetics & Genomics (AREA)
- Structural Engineering (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Physics & Mathematics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Saccharide Compounds (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Physical Or Chemical Processes And Apparatus (AREA)
- Heterocyclic Compounds That Contain Two Or More Ring Oxygen Atoms (AREA)
- Hydrogenated Pyridines (AREA)
Abstract
本发明提供一种环状化合物库及其构建方法,利用固相载体、含光可裂解基团的分子、连接分子、合成砌块、两端的关环A端分子和关环B端分子反应合成,利用光照下分解的方法脱去固相载体,利用关环A端分子A和关环B端分子B的氨基酸残基结构在环合酶作用下进行完成关环。本发明的方法,关环条件温和,普适性更强,扩充了编码化合物库的化学反应类型和化合物库多样性空间。
Description
技术领域
本发明涉及药物化学领域,尤其是一种环状化合物库及其构建方法。
背景技术
疾病表征和靶点鉴定方面的进展不断将药物发现转移到未知领域,从病理学角度来看,越来越多的新兴靶点具有吸引力,但同时挑战性在于发现既定的低分子量化合物或生物制剂来调节这些靶点的功能。解决该问题的一种方法是建立化合物库,源自传统化合物库的小分子化合物原则上是生物可利用的,允许细胞渗透,并特异性地结合在限定的蛋白质(如酶)中。
源自DNA编码文库(DEL)的化合物类似于小分子,有机会筛选出多达109种或更多种可能的化学实体。大大增加了寻找新化学起点的机会。但是,小分子通常在对抗蛋白质间相互作用方面表现较差。蛋白质的相互作用往往具有较大且扩展的结合表面,另一方面,生物制剂更适合此类应用,并且通常有更好的选择性和更强的结合力。
环肽作为有前途的一类治疗候选物已引起广泛关注。与线性同类产品相比,它们具有多个重要优势。大环化通常限制了环肽的构象自由,通过使结合时的熵最小化,使环状分子能够更紧密特异性地与靶蛋白结合。此外,被蛋白酶水解的条件下,环肽比线性分子的稳定性更高。此外,由于其相对宽大的结构,环肽可能更有效地覆盖涉及蛋白质—蛋白质相互作用的大而浅的界面,而传统的类药物小分子不容易靶向。
目前,参考文献1(Min Hyeon Shin,等Bioconjugate Chemstry,2019,30,2931-2938)报道用DNA编码环状拟肽库的建立并描述了用DNA编码环状拟肽库的建立方法,但是其合成过程每步需要依赖氯乙酸来引入合成砌块,且合成砌块仅为单一活性基团-NH2的伯胺小分子化合物,这样造成的后果是,每个合成砌块之间的原子数目和种类固定不变,均为重复的-CO-CH2-N-结构单元,化合物库的多样性不足。已有先前的大量药物研发试验证明,药物之间的碳原子长度以及种类可以对药物的溶解性、渗透性造成巨大的改变;且环肽库主要用来筛选结合能力较强的蛋白质-蛋白质相互作用抑制剂(PPI),而PPI的结合能力主要依靠N原子或者氧原子形成的分子内或者分子间氢键,参考文献1的环状化合物库分子中合成砌块相连接后形成的N原子为叔胺,不利于与蛋白结合或者结合力不足。由此可知,该化合物库种类很局限,不能满足现代药物研发对多样性环状化合物库的需要。此外,构建环状化合物库的难点在于长链结构首尾两端反应成环,参考文献1报道的关环方式仅限于化学关环,由于化合物库建立时,需要在携带着DNA序列的前提下完成关环,因此对化学关环反应的限制性比较高,且关环反应中使用了金属离子,金属离子有可能会与DNA分子产生螯合,对DNA分子稳定性带来不利影响,限制了其筛选结果的稳定性及准确性。
此外,参考文献2(CN102471772A)公开了一种肽库,其中包含了双环的肽,双环肽分子集抗体、小分子药物及肽类的特性于一身,具有与抗体类似的亲和性和精确的靶向特异性;同时,由于它们分子量较小,使得其能够快速深入地渗透组织,从而实现从组织内部靶向病灶;其肽类的性质则提供了“可调控”的药物动力学半衰期和肾脏清除途径,从而避免了其他药物形式中常见的肝脏和胃肠道毒性。但是该文献公开的技术方法为噬菌体筛选技术,其仅限于天然的氨基酸,该化合物库的局限性较大。
因此,本领域需要建立一种关环反应条件更温和、普适性更强的关环方法以及不局限于拟肽的其他环状分子结构,以获得更丰富的环状化合物库,增加化合物库的多样性。此外,本领域需要建立化合物库与靶蛋白结合复合技术,以直接筛选靶向蛋白质的研究,增加化合物库的用途。
发明内容
本发明所要解决的技术问题之一在于,提供一种环状化合物文库的构建方法,其具有关环反应条件更温和、普适性强的优点,能用于单环、双环状化合物库的构建,克服现有技术中环状化合物库关环方式的局限性,且副反应少。
本发明所要解决的技术问题之二在于,提供一种新的具有环状分子结构的环状化合物库,以增加化合物库的多样性,扩大其在新药筛选中的应用范围。
为解决上述技术问题,本发明提供第一种技术方案:
一种环状化合物库的构建方法,包括以下步骤:
1)将固相载体G直接或间接与含光可裂解基团的分子M相连接,得到G—M:
2)按以下步骤进行:
a1.将G—M与关环A端分子A反应相连接,得到G—M—A;
b1.将G—M—A与具有至少三官能团的连接分子L1反应相连接,得到G—M—A—L1;
c1.将G—M—A—L1与起始核苷酸分子HP、开放引物OP依次反应相连接,其中起始核苷酸分子HP与连接分子L1相连接,得到G—M—A—L1—HP—OP;
d1.将步骤c1所得产物分别与合成砌块C1、合成砌块C1所对应的DNA标签tag1反应,使合成砌块C1与L1相连接,DNA标签tag1与OP相连接,得到G—M—A—L1(—HP—OP—tag1)—C1;
e1.定义一组相对应的合成砌块和DNA标签的连接反应为一个扩展步骤,重复所述扩展步骤,使合成砌块依次拼接形成延长的链,以及使合成砌块所对应的DNA标签依次拼接形成延长的链,得到G—M—A—L1(—HP—OP—tag1—……—tagn)—C1—……—Cn;其中2≤n≤7且n为正整数;
f1.将步骤e1所得产物与关环B端分子B、封闭引物CP反应,使关环B端分子B与Cn相连接,以及使封闭引物CP与tagn相连接,其中HP—OP—tag1—……—tagn—CP形成完整的DNA编码序列,得到G—M—A—L1(—DNA)—C1—……—Cn—B,即化合物库S1”;
g1.将步骤f1所得产物在光源下进行分解反应,使M与A断开,得到A—L1(—DNA)—C1—……—Cn—B,即化合物库S1’;
本发明提供的第一种技术方案中,最终获得的环状化合物从固相载体上脱离,且DNA编码在化合物上。该方案获得的化合物库适合于传统的DEL筛选模式,筛选出的化合物需要进行高通量测序。
为解决上述技术问题,本发明还提供了第二种技术方案:
一种环状化合物库的构建方法,包括以下步骤:
1)将固相载体G直接或间接与含光可裂解基团的分子M相连接,得到G—M:
2)按以下步骤进行:
a2.将G—M与至少三官能团的连接分子L1反应相连接,得到G—M—L1;
b2.G—M—L1与起始核苷酸分子HP、开放引物OP依次反应,使起始核苷酸分子HP与固相载体G相连接,得到OP—HP—G—M—L1;
c2.OP—HP—G—M-L1与合成砌块C1、合成砌块C1所对应的DNA标签tag1反应,使合成砌块C1与L1相连接,DNA标签tag1与OP相连接,得到tag1—OP—HP—G—M-L1-C1;
d2.定义一组相对应的合成砌块和DNA标签的连接反应为一个扩展步骤,重复所述扩展步骤,使合成砌块依次拼接形成延长的链,以及使合成砌块所对应的DNA标签依次拼接形成延长的链,得到tagn—……—tag1—OP—HP—G—M-L1—C1……—Cn;其中2≤n≤7且n为正整数;
e2.上一步所得产物与关环A端分子A反应,使关环A端分子A与Cn相连接;
f2.上一步所得产物按照所述扩展步骤与合成砌块Cn+1,……,Cn+m及其所对应的DNA标签tagn+1,……,tagn+m依次反应,使合成砌块Cn+1与连接分子L1相连接且DNA标签tagn+1与tagn相连接;经过步骤e2和步骤f2得到tagn+m—……—tag1—OP—HP—G—M—L1(—C1……—Cn—A)—Cn+1……—Cn+m;其中0≤n≤7,0≤m≤7,n和m为整数,且2≤n+m≤7;
g2.将上一步所得产物与关环B端分子B、封闭引物CP反应,使关环B端分子B与Cn+m相连接,以及使封闭引物CP与tagn+m相连接,其中HP—OP—tag1—……—tagn+m—CP形成完整的DNA编码序列,得到DNA—G—M—L1(—C1……—Cn—A)—Cn+1……—Cn+m—B,即化合物库S2’;
第二种技术方案中,步骤2)中,e2与f2的顺序可以交换,即:
一种方式是,先将步骤d2所得产物tagn—……—tag1—OP—HP—G—M—L1—C1……—Cn与关环A端分子A反应,使关环A端分子A与Cn相连接,得到tagn—……—tag1—OP—HP—G—M—L1—C1……—Cn—A;再将tagn—……—tag1—OP—HP—G—M—L1—C1……—Cn—A按照所述扩展步骤与合成砌块Cn+1,……,Cn+m及其所对应的DNA标签tagn+1,……,tagn+m依次反应,使合成砌块Cn+1与连接分子L1相连接且DNA标签tagn+1与tagn相连接,得到tagn+m—……—tag1—OP—HP—G—M—L1(—C1……—Cn—A)—Cn+1……—Cn+m;
另一种方式是,先将步骤d2所得产物tagn—……—tag1—OP—HP—G—M—L1—C1……—Cn按照所述扩展步骤与合成砌块Cn+1,……,Cn+m及其所对应的DNA标签tagn+1,……,tagn+m依次反应,使合成砌块Cn+1与连接分子L1相连接且DNA标签tagn+1与tagn相连接,得到tagn+m—……—tag1—OP—HP—G—M—L1(—C1……—Cn)—Cn+1……—Cn+m;再将tagn+m—……—tag1—OP—HP—G—M—L1(—C1……—Cn)—Cn+1……—Cn+m与关环A端分子A反应,使关环A端分子A与Cn相连接,得到tagn+m—……—tag1—OP—HP—G—M—L1(—C1……—Cn—A)—Cn+1……—Cn+m。
本发明提供的第二种技术方案中,最终获得的化合物在固相载体上,且DNA编码也在固相载体上,全部的合成步骤均是在固相载体上完成,化合物库的质量更有保证。该方案获得的化合物库可适用于流式细胞荧光分选技术(FACS)筛选,筛选出的环状化合物不需要高通量测序,可利用光照下的分解反应直接将筛选出的环状化合物从固相载体上脱离下来,筛选周期短、效率高。
为解决上述技术问题,本发明还提供第三种技术方案:
一种环状化合物库的构建方法,包括以下步骤:
1)将固相载体G直接或间接与含光可裂解基团的分子M相连接,得到G—M:
2)按以下步骤进行:
a3.将G—M与具有至少四官能团的连接分子L1反应相连接,得到G—M—L1;
b3.将G—M—L1与起始核苷酸分子HP、开放引物OP依次反应,使起始核苷酸分子HP与连接分子L1相连接,得到G—M—L1—HP—OP;
c3.将G—M—L1—HP—OP与合成砌块C1、合成砌块C1所对应的DNA标签tag1反应,使合成砌块C1与L1相连接,DNA标签tag1与OP相连接,得到G—M—L1(—HP—OP—tag1)—C1;
d3.定义一组相对应的合成砌块和DNA标签的连接反应为一个扩展步骤,重复所述扩展步骤,使合成砌块依次拼接形成延长的链,以及使合成砌块所对应的DNA标签依次拼接形成延长的链,得到G—M—L1(—HP—OP—tag1—……—tagn)—C1—……—Cn;其中2≤n≤7且n为正整数;
e3.将上一步所得产物与关环A端分子A反应,使关环A端分子A与Cn相连接;
f3.将上一步所得产物按照所述扩展步骤与合成砌块Cn+1,……,Cn+m及其所对应的DNA标签tagn+1,……,tagn+m依次反应,使合成砌块Cn+1与连接分子L1相连接且DNA标签tagn+1与tagn相连接;经过步骤e3和步骤f3得到G—M—L1(—HP—OP—tag1……—tagn+m)(—C1……—Cn—A)—Cn+1……—Cn+m;其中0≤n≤7,0≤m≤7,n和m为整数,且2≤n+m≤7;
g3.将上一步所得产物与关环B端分子B、封闭引物CP反应,使关环B端分子B与Cn+m相连接,以及使封闭引物CP与tagn+m相连接,其中HP—OP—tag1—……—tagn+m—CP形成完整的DNA编码序列,得到G—M—L1(—DNA)(—C1……—Cn—A)—Cn+1……—Cn+m—B,即化合物库S3’;
在第三种技术方案中,步骤2)中,e3与f3的顺序可以交换,即:
一种方式是,先将步骤d3所得产物G—M—L1(—HP—OP—tag1—……—tagn)—C1—……—Cn与关环A端分子A反应,使关环A端分子A与Cn相连接,得到G—M—L1(—HP—OP—tag1—……—tagn)—C1—……—Cn—A;再将G—M—L1(—HP—OP—tag1—……—tagn)—C1—……—Cn—A按照所述扩展步骤与合成砌块Cn+1,……,Cn+m及其所对应的DNA标签tagn+1,……,tagn+m依次反应,使合成砌块Cn+1与连接分子L1相连接且DNA标签tagn+1与tagn相连接,得到G—M—L1(—HP—OP—tag1……—tagn+m)(—C1……—Cn—A)—Cn+1……—Cn+m;
另一种方式是,先将步骤d3所得产物G—M—L1(—HP—OP—tag1—……—tagn)—C1—……—Cn按照所述扩展步骤与合成砌块Cn+1,……,Cn+m及其所对应的DNA标签tagn+1,……,tagn+m依次反应,使合成砌块Cn+1与连接分子L1相连接且DNA标签tagn+1与tagn相连接,得到G—M—L1(—HP—OP—tag1……—tagn+m)(—C1……—Cn)—Cn+1……—Cn+m;再将G—M—L1(—HP—OP—tag1……—tagn+m)(—C1……—Cn)—Cn+1……—Cn+m与关环A端分子A反应,使关环A端分子A与Cn相连接,得到G—M—L1(—HP—OP—tag1……—tagn+m)(—C1……—Cn—A)—Cn+1……—Cn+m。
本发明提供的第三种技术方案中,最终获得的化合物是在固相载体上,且DNA编码是在化合物上,全部的合成步骤也都是在固相载体上完成,化合物库的质量更有保证。该方法获得的化合物库可以通过裂解含光可裂解基团的分子M对库化合物进行二次筛选。二次筛选包括:先在固相载体上进行第一次筛选,然后通过裂解含光可裂解基团的分子M将化合物从固相载体上脱离,此时DNA编码在库化合物上,所获得的化合物库可以进行第二次筛选。二次筛选可以组合使用不同的筛选技术,比如流式细胞荧光分选技术(FACS)筛选、传统靶蛋白亲和力筛选、AS-MS筛选等任一两者相结合,以提高筛选结果的精度。
在第三种技术方案中,步骤g3得到的G—M-L1(—DNA)(—C1……—Cn—A)—Cn+1……—Cn+m—B可在光源下进行分解反应,使M与A断开,得到DNA—L1(—C1……—Cn—A)—Cn+1……—Cn+m—B,即化合物库S4’;化合物库S4’在环合酶作用下进行关环反应,使关环A端分子A与关环B端分子B反应成环,得到即环状化合物库S4。或者,将化合物库S3在光源下进行分解反应,使M与L1断开,得到即化合物库S4。
在本发明提供的三种技术方案中,所述固相载体G选自PEG树脂、PEGA树脂、TentaGel树脂、固相载体CPG中的任意一种或多种。
在第一、第三种技术方案中,固相载体G含有一个活性官能团R1。固相载体G可以用通式G0—R1表示,其中,R1表示固相载体G的活性官能团;G0表示固相载体G的除活性官能团之外的其他固相负载结构。固相载体G通过该活性挂能团R1直接地或间接地与含光可裂解基团的分子M连接。R1可以选自:氨基、羧基、或羟基。一种优选的实施方式中,所述固相载体G选自带有氨基活性官能团的固相载体;也就是说,优选的,所述活性官能团R1选自氨基,例如伯氨基、仲氨基。更优选的,所述活性官能团R1选自伯氨基。更优选的固相载体选自PEGA。
在第二种技术方案中,固相载体G含有两个活性官能团R1和R1’。固相载体G可以用通式R1’—G0—R1表示,其中,R1表示用于与连接分子L1连接的活性官能团,R1’表示用于连接DNA编码序列的活性官能团。一种优选的实施方式中,R1为氨基,R1’为羧基。
在本发明提供的三种技术方案中,所述含光可裂解基团的分子M含有至少两个活性官能团,分别用R2和R3表示。含光可裂解基团的分子M可以用通式R2—M0—R3表示,其中,R2和R3表示两个相互独立的活性官能团。R2是负责连接固相载体G的活性官能团,R3是负责连接关环A端分子A或者连接分子L1的活性官能团。R2和R3分别独立地以经保护基团保护的形式或未经保护基团保护的形式存在,且R2和R3相互之间不干扰对方的连接反应。其中,主要是R3不干扰R2与固相载体G相连接的反应过程,或者R2与固相载体G连接反应时R3为由保护基团保护的形式。
在一种优选的实施方式中,R2以未经保护基团保护的形式存在,R3以经保护基团保护的形式存在。当R2与固相载体G连接得到G—M之后,R3需要脱除保护基团然后再进行后续的反应。
固相载体G与含光可裂解基团的分子M的连接方式有两种。一种方式是,R2与R1直接互补配对反应,得到G—M。互补配对反应是指两个活性官能团恰好发生反应使这两个活性官能团所在的化学结构以共价键形式连接起来,比如将两个分子以共价键形式连接形成一个分子。基于不同的反应原理,R1与R2反应时可以脱去全部或部分碎片,比如R1与R2连接后脱去一分子水;或者,R1与R2反应时不脱去任何碎片,比如发生加成反应。R1与R2直接互补配对反应时,可以选自以下组合:氨基与羧基、氨基与羟基、氨基与磷酸基、氨基与烷基卤或芳基卤等。
另一种方式是,R2与R1通过其他具有双官能团的连接分子进行间接的连接反应,得到G—M。例如,该具有双官能团的连接分子具有两个活性官能团;其中,第一个活性基团可与固相载体G的活性官能团R1互补配对反应,第二个活性基团可与含光可裂解基团的分子M的活性官能团R2互补配对反应。反应过程可以有两种形式:第一种,先将第一个活性基团与固相载体G的活性官能团R1反应连接,再利用第二个活性基团与含光可裂解基团的分子M的活性官能团R2反应连接;第二种是,先将第二个活性基团与含光可裂解基团的分子M的活性官能团R2反应连接,再利用第一个活性基团与固相载体G的活性官能团R1反应连接,以得到间接连接的G—M。在间接连接的方式中,则不再要求R2与R1是否具有互补配对关系。
所述含光可裂解基团的分子M中,光可裂解基团优选为:
其中,R3是位于硝基邻位的侧链的与苯环直接相连的C原子上;R2是连接于R2与苯环上的C原子间隔一个或多个共价键相连或R2与R3所连接的C原子间隔一个或多个共价键相连;苯环上可以含有零个、一个或多个不干扰R2、R3连接反应的侧链或取代基。
在合适的光照条件下,该含光可裂解基团的分子M中,R3与R3所连接的C原子之间的化学键可以断裂。该含光可裂解基团的分子M可在365nm下裂解。
在一些优选的实施方式中,所述含光可裂解基团的分子M可以选自以下结构:
以上结构中,R3可以选自-OH、-NH2、-NHNH2、-N3、Cl、Br等。
以上结构中,R2均用羧基表示。
在一些具体实施方式中,固相载体G与含光可裂解基团的分子M可通过具有双官能团的小分子化合物间接连接。
在一些具体实施方式中,固相载体G具有活性官能团氨基,所述具有双官能团的小分子化合物是具有活性官能团羧基和经保护基保护的氨基。固相载体G与所述具有双官能团的小分子化合物反应生成酰胺键进行连接;反应溶剂为有机溶剂,如二氯甲烷、N,N-二甲基甲酰胺;反应温度为15~30℃,优选20~25℃;反应时间为1~12小时,优选2~6小时。然后,将所述具有双官能团的小分子化合物的经保护基保护的氨基进行脱保护,再与含光可裂解基团的分子M反应连接;该氨基的保护基优选为Fmoc保护基;脱保护基的反应溶剂为有机溶剂,如二氯甲烷、N,N-二甲基甲酰胺,且反应溶剂中加入哌啶;反应温度为15~30℃,优选20~25℃;反应时间为1~12小时,优选1~6小时。然后,脱保护后再与含光可裂解基团的分子M反应连接;脱保护后所述具有双官能团的小分子化合物提供活性官能团氨基,含光可裂解基团的分子M提供活性官能团羧基,反应生成酰胺键进行连接;反应溶剂为有机溶剂,如N,N-二甲基甲酰胺;反应溶剂中加入N,N'-二异丙基碳二亚胺(DIC)、1-羟基苯并三唑(HOBt)、4-二甲氨基吡啶(DMAP)中的一种或多种;反应温度为15~30℃,优选20~25℃;反应时间为1~12小时,优选1~6小时。
在一些具体实施方式中,固相载体G与含光可裂解基团的分子M可直接连接。固相载体G具有活性官能团氨基,含光可裂解基团的分子M提供活性官能团羧基,反应生成酰胺键进行连接;反应溶剂为有机溶剂,如二氯甲烷、N,N-二甲基甲酰胺;反应溶剂中加入N,N'-二异丙基碳二亚胺(DIC)、1-羟基苯并三唑(HOBt)、4-二甲氨基吡啶(DMAP)中的一种或多种;反应温度为15~30℃,优选20~25℃;反应时间为1~12小时,优选1~6小时。
在本发明提供的三种技术方案中,所述关环A端分子A与关环B分子B经环合酶关环反应时,关环A端分子A脱去部分或全部分子碎片;所述关环A端分子A具有两个活性官能团R4和R5;R4是参与环合酶关环反应的活性官能团,在关环反应时被脱除;R5是负责与连接分子L1或合成砌块反应连接的活性官能团,经关环反应后R5保留在环状化合物分子的环结构中;R4和R5分别独立地以经保护基团保护的形式或未经保护基团保护的形式存在,且R4和R5相互之间不干扰对方的连接反应。所述关环A端分子A的分子结构主要是由环合酶关环反应时脱去的分子碎片A1和关环反应时保留在环上的分子碎片A0两部分组成。关环A端分子A可以用通式R4—A1—A0—R5表示。R4是位于环合酶关环反应时脱去的分子碎片A1上,在关环反应时伴随着A1也被脱除。R5是位于关环反应时保留在环上的分子碎片A0上,其保留在环结构中。由于是R4先与R3反应拼接,因此主要是要求R5不干扰R4与含光可裂解基团的分子M的R3相连接的反应过程,或者R4与含光可裂解基团的分子M连接反应时R5为由保护基团保护的形式。
分子碎片A0结构中具有位阻基团,位阻基团与R5直接连接。位阻基团是分子碎片A0结构中的部分或全部。位阻基团是可以增加M和A之间空间位阻的基团;位阻基团可以选自:具有羧基的基团,脂肪链,聚乙二醇链,刚性环。一种优选的实施方式中,位阻基团为由一个或多个氨基酸构成的氨基酸残基。优选的位阻基团为由1~10个氨基酸构成的氨基酸残基。由于位阻基团是保留在环上,考虑到环的大小以及位阻效果,位阻基团优选为由2~5个氨基酸构成的氨基酸残基。
在一种优选的实施方式中,R4以未经保护基团保护的形式存在,R5以经保护基团保护的形式存在。当R4与含光可裂解基团的分子M的R3连接得到G—M—A之后,R5脱除保护基团然后再进行后续的反应。当R4与合成砌块连接后,R5脱除保护基团然后再进行后续的成环反应。
在第一种技术方案中,R4是与含光可裂解基团的分子M的R3互补配对的活性官能团,通过R4与R3反应将关环A端分子A与含光可裂解基团的分子M拼接,分离,纯化,得到G—M—A。R4与R3是互补配对的反应基团,在一些优选的实施方式中,R4与R3可以选自以下组合:氨基与羧基、羟基与羧基、磷酸基和羟基、氨基与烷基卤或芳基卤等。
在第二、第三种技术方案中,R4是与合成砌块的一个活性官能团互补配对的活性官能团,通过R4与合成砌块的活性官能团反应,将关环A端分子A与合成砌块拼接。在一些优选的实施方式中,R4与合成砌块的一个活性官能团可以选自以下组合:氨基与羧基、羟基与羧基、磷酸基和羟基、氨基与烷基卤或芳基卤等。
在一种优选的实施方案中,关环A端分子A的分子结构中脱去部分A1的结构为由一个氨基酸或多个氨基酸构成的氨基酸残基。该氨基酸残基通过肽键与关环A端分子A的分子结构中的A0连接。例如,在一些优选的实施方案中,关环A端分子A的分子结构中脱去部分A1的氨基酸氨基序列为:FAGDDAE(—Phe—Ala—Gly—Asp—Asp—Ala—Glu、AYDGE(—Ala—Tyr—Asp—Gly—Glu)、-OCam-L、FL(—Phe—Leu)、AL(—Ala—Leu)、GL(—Gly—Leu)、HL(—His—Leu)或HV(—His—Val)或SL(Ser-Leu)。
在一种优选的实施方案中,关环A端分子A是由至少3个氨基酸组成的肽链。更优选的,关环A端分子A是由3~20个氨基酸组成的肽链。
在第一种技术方案中,一些具体实施方式中,含光可裂解基团的分子M与关环A端分子A直接反应连接。含光可裂解基团的分子M提供活性官能团氨基或羟基,关环A端分子A提供活性官能团羧基,反应生成酯键或酰胺键进行连接。生成酰胺键时,反应溶剂为有机溶剂,如二氯甲烷、N,N-二甲基甲酰胺;反应溶剂中加入N,N'-二异丙基碳二亚胺(DIC)、1-羟基苯并三唑(HOBt)、4-二甲氨基吡啶(DMAP)中的一种或多种;反应温度为15~30℃,优选20~25℃;反应时间为1~24小时,优选12~18小时。关环A端分子A另一活性官能团为经保护基保护的氨基;优选的,关环A端分子A为经Fmoc保护氨基的四肽。氨基作为关环A端分子A与连接分子L1反应的活性官能团,需要经过脱保护基反应再与连接分子L1反应;脱保护基的反应溶剂为有机溶剂,如二氯甲烷、N,N-二甲基甲酰胺,且反应溶剂中加入哌啶;反应温度为15~30℃,优选20~25℃;反应时间为1~24小时,优选12~18小时。
在第一、第三种技术方案中,关环A端分子A与合成砌块Cn直接反应连接。两者之间反应生成酯键或酰胺键进行连接。生成酰胺键时,反应溶剂为有机溶剂,如二氯甲烷、N,N-二甲基甲酰胺;反应溶剂中加入N,N'-二异丙基碳二亚胺(DIC)、1-羟基苯并三唑(HOBt)、4-二甲氨基吡啶(DMAP)中的一种或多种;反应温度为15~30℃,优选20~25℃;反应时间为1~24小时,优选12~18小时。关环A端分子A另一活性官能团为经保护基保护的羧基;优选的,关环A端分子A为采用烯丙基羟基(AllO-)保护羧基的四肽。在成环反应之间,关环A端分子A应脱出羧基的保护基,再经环合酶关环。
在本发明提供的三种技术方案中,连接分子L1为至少三个活性官能团的连接分子,必要时为至少四个活性官能团的连接分子。
在第一种技术方案中,连接分子L1具有至少三个活性官能团R6、R7和R8。连接分子L1可以用以下通式表示:其中,R6、R7、R8为三个活性官能团。R6、R7和R8可以分别独立地以经保护基团保护的形式或未经保护基团保护的形式存在,且R6、R7和R8相互之间不干扰对方的连接反应。在第一种技术方案中,R6是与关环A端分子A上的活性官能团R5互补配对的活性官能团,R7是与起始核苷酸分子HP反应拼接的活性官能团,R8是与合成砌块C1反应拼接的活性官能团。由于三个活性官能团的反应次序为:先是由R6与R5反应拼接,因此首先是要求R7、R8不干扰R6与R5相连接的反应过程;其次是R7与起始核苷酸分子HP反应拼接,因此要求R8不干扰R7与起始核苷酸分子HP相拼接的过程;最后是R8与合成砌块C1反应拼接。在一种优选的实施方式中,R6是以未经保护基团保护的形式存在,R7、R8采用脱保护反应机制不同的保护基团进行保护的形式存在。比如R6为未保护的羧基,R7为经保护基保护的羧基,R8为经保护基保护的氨基;当R6与关环A端分子A的R5连接得到G—M—A—L1之后,先利用一种脱保护反应机制来脱除R7的保护基团,将R7与起始核苷酸分子HP反应拼接,同时可以继续再拼接开放引物OP;然后利用另一种不相同的脱保护反应机制来脱除R8的保护基团,将R8与合成砌块C1反应拼接,进行后续的反应。
在第二种技术方案中,连接分子L1具有至少三个活性官能团R6、R7和R8。连接分子L1可以用以下通式表示:其中,R6、R7、R8为三个活性官能团。R6、R7和R8可以分别独立地以经保护基团保护的形式或未经保护基团保护的形式存在,且R6、R7和R8相互之间不干扰对方的连接反应。在第二种技术方案中,R6是与含光可裂解基团的分子M的活性官能团R3互补配对的活性官能团,R7是与合成砌块C1反应拼接的活性官能团,R8是与合成砌块Cn+1反应拼接的活性官能团。由于三个活性官能团的反应次序为:先是由R6与含光可裂解基团的分子M反应拼接,因此首先是要求R7、R8不干扰R6的拼接反应过程;其次是R7与合成砌块C1反应拼接,因此要求R8不干扰R7的拼接反应过程;最后是R8与合成砌块Cn+1反应拼接。在一种优选的实施方式中,R6是以未经保护基团保护的形式存在,R7、R8采用脱保护反应机制不同的保护基团进行保护的形式存在。
在第三种技术方案中,连接分子L1具有至少四个活性官能团R6、R6’、R7和R8。连接分子L1可以用以下通式表示:其中,R6、R6’、R7、R8为四个活性官能团。R6、R6’、R7和R8可以分别独立地以经保护基团保护的形式或未经保护基团保护的形式存在,且R6、R6’、R7和R8相互之间不干扰对方的连接反应。R6是与含光可裂解基团的分子M的活性官能团R3互补配对的活性官能团,R6’是与起始核苷酸分子HP反应拼接的活性官能团,R7是与合成砌块C1反应拼接的活性官能团,R8是与合成砌块Cn+1反应拼接的活性官能团。
在第三种技术方案中,一种优选的实施方式为,连接分子L1是由两个三官能团连接分子L1’、L1”拼接组成,可以用以下通式表示:L1’—L1”;其中,L1’具有三个活性官能团R6、R6’和R6”,L1”具有三个活性官能团R7、R8和R8’,且R6”与R8’互补配对反应连接。
在第三种技术方案中,一种优选的实施方式为,连接分子L1包含一个可分解的官能团RL,RL分解时使连接分子L1分裂为两个分子碎片,两个分子碎片分别是:包含R6、R6’的分子碎片和包含R7、R8的分子碎片。
本发明提供的第三种技术方案的上述优选方案中,经二次筛选后所得的化合物库可以通过连接分子L1中可分解的官能团R对库化合物进行二次分段裂解,直接得到筛选出的化合物,同样达到周期短、效率高的效果。
在一些具体的实施例中,连接分子L1可以是由两个三官能团连接分子L1’、L1”,以及一个连接于L1’与L1”之间的连接分子L0组成,可分解的官能团RL是位于连接分子L0的结构内,或者是连接分子L0与连接分子L1’相连接的官能团,或者是连接分子L0与连接分子L1”相连接的官能团。连接分子L1可以用以下通式表示:L1’—L0—L1”。其中,L1’具有三个活性官能团R6、R6’和R6”,L1”具有三个活性官能团R7、R8和R8’,L0具有两个活性官能团R7和R7’;R7与R6”互补配对反应连接,R7’与R8’互补配对反应连接。也就是说,可分解的官能团RL可以是R7与R6”互补配对反应后形成的官能团,也可以是R7’与R8’互补配对反应后形成的官能团,还可以是位于连接分子L0的结构内独立的可分解的官能团。
在一些具体的实施例中,所述方法中,可分解的官能团RL是酸可裂解基团,或者是与所述含光可裂解基团的分子M具有不同裂解波长的光可裂解基团。酸可裂解基团可以是酯键、酰胺键等,
具体的,连接分子L0选自下列结构:
其中,式1~式7所示的可分解的连接分子L0的分子结构中,羟基、醛基可用于与连接分子L1’、L1”的活性官能团反应拼接,形成可分解的官能团RL。RL可以在酸性条件或者光照下裂解。例如,羟基可与羧基反应生成酯键,酯键可在酸性条件下裂解为两个分子碎片;醛基可与胺基反应生成胺键;式8~9所示的可分解的连接分子L0的分子结构中,羟基和胺基分别与L1”的羧基反应分别生成酯键和酰胺键可被光切割,光切割时光照波长为290nm。
在一些优选的实施方式中,连接分子L1的任一活性官能团与该活性官能团互补配对的活性官能团可以选自以下组合:氨基与羧基、羟基与羧基、磷酸基和羟基、氨基与烷基卤或芳基卤等。
在第一种技术方案中,一些具体实施方式中,关环A端分子A与连接分子L1直接反应连接。连接分子L1的活性官能团R6为羧基,关环A端分子A提供活性官能团氨基,两者反应生成酰胺键进行连接;反应溶剂为有机溶剂,如二氯甲烷、N,N-二甲基甲酰胺;反应溶剂中加入N,N'-二异丙基碳二亚胺(DIC)、1-羟基苯并三唑(HOBt)、4-二甲氨基吡啶(DMAP)中的一种或多种;反应温度为15~35℃,优选20~30℃;反应时间为1~12小时,优选1~6小时。
在第二、第三种技术方案中,一些具体实施方式中,含光可裂解基团的分子M与连接分子L1直接反应连接。连接分子L1的活性官能团R6为羧基,含光可裂解基团的分子M提供活性官能团羟基,两者反应生成酯键进行连接;反应溶剂为有机溶剂,如二氯甲烷、N,N-二甲基甲酰胺;反应溶剂中加入N,N'-二异丙基碳二亚胺(DIC)、1-羟基苯并三唑(HOBt)、4-二甲氨基吡啶(DMAP)中的一种或多种;反应温度为15~35℃,优选20~30℃;反应时间为1~12小时,优选1~6小时。
在本发明提供的三种技术方案中,起始核苷酸分子HP具有活性官能团R9,R9与连接分子L1的活性官能团或固相载体G的活性官能团互补配对反应。
在第一种技术方案中,连接分子L1的活性官能团R7与R9反应拼接,使起始核苷酸分子HP连接于连接分子L1。进一步的,起始核苷酸分子HP可以在DNA连接酶的作用下与开放引物OP反应相连接,得到G—M—A—L1—HP—OP,进一步DNA连接酶的作用下达到使DNA编码序列延长的目的。起始核苷酸分子HP是指DNA拼接技术中DNA链的起始连接端。开放引物OP是指DNA拼接技术中可以延伸的DNA链。
在第二种技术方案中,固相载体G含有两个活性官能团R1和R1’,固相载体G的R1’。与R9反应拼接,使起始核苷酸分子HP连接于固相载体G。进一步的,起始核苷酸分子HP可以在DNA连接酶的作用下与开放引物OP反应相连接,进一步DNA连接酶的作用下达到使DNA编码序列延长的目的。
在第三种技术方案中,连接分子L1的活性官能团R6’与R9反应拼接,使起始核苷酸分子HP连接于连接分子L1。进一步的,起始核苷酸分子HP可以在DNA连接酶的作用下与开放引物OP反应相连接,进一步DNA连接酶的作用下达到使DNA编码序列延长的目的。
在一些具体的实施方式中,起始核苷酸分子HP的活性官能团R9选自氨基,与R9互补配对反应的连接分子L1的活性官能团或固相载体G的活性官能团为羧基。羧基与R9(氨基)反应形成酰胺键使连接分子L1或固相载体G与起始核苷酸分子HP完成拼接。该羧基可以为形成叔丁基酯基保护的羧基;羧基叔丁酯的脱保护反应条件为95%三氟乙酸脱保护。完成脱保护基后得到的活性官能团羧基,与起始核苷酸分子HP(HDNA)的活性官能团R9氨基反应形成酰胺键连接;先与N,N'-二异丙基碳二亚胺(DIC)、N-羟基琥珀酰亚胺(NHS)在有机溶剂如二氯甲烷、N,N-二甲基甲酰胺中反应1~12h,优选1~6h;再于HEPES缓冲溶液中与起始核苷酸分子HP(HDNA)反应1~48h,优选反应12~24h,反应温度为15~30℃,优选20~25℃。
在一些具体的实施方式中,在T4 DNA连接酶作用下起始核苷酸分子HP连接开放引物OP,延长DNA序列,为连接DNA标签tag做准备。
在第一种技术方案中,一些具体的实施方式中,连接分子L1的活性官能团R8为经Fmoc保护基保护的氨基。可采用前述的含哌啶的有机溶剂条件下脱出Fmoc保护基,然后为连接合成砌块做准备。
在第二、第三种技术方案中,连接分子L1的活性官能团R7、R8具有不同的脱保护反应机制的保护基团。在一些具体的实施方式中,R1为采用烯丙基羟基(AllO-)保护的羧基,R8为采用芴甲氧羰基(Fmoc)保护的氨基。
在本发明提供的三种技术方案中,完成一个合成砌块及其对应的DNA标签的拼接,称为通过一个扩展步骤。通过重复所述扩展步骤,进行合合成砌块的连接和DNA标签的连接,以扩展化合物库中化合物的数量。每个合成砌块均有一个与之唯一对应的DNA标签,不同的合成砌块所对应的DNA标签不相同,合成砌块和与之对应的DNA标签构成一个清单。从清单中任意选择更多的合成砌块和与之对应的DNA标签,重复该扩展步骤,使每个合成砌块依次与前一扩展步骤的合成砌块相连接且使每个DNA标签依次与前一扩展步骤的DNA标签相连接,也就是分别延长合成砌块的链和DNA标签的链。
在第一种技术方案中,通过重复所述扩展步骤,得到G—M—A—L1(—HP—OP—tag1—……—tagn)—C1—……—Cn。根据所需要的环的大小来确定所连接的合成砌块和与之对应的DNA标签的数量n。通常而言,n的取值范围为2≤n≤7且n为正整数。
在第二种技术方案中,通过重复所述扩展步骤,分别得到tagn—……—tag1—OP—HP—G—M—L1—C1……—Cn和tagn+m—……—tag1—OP—HP—G—M—L1(—C1……—Cn—A)—Cn+1……—Cn+m;其中0≤n≤7,0≤m≤7,n和m为整数,且2≤n+m≤7。
在第三种技术方案中,通过重复所述扩展步骤,分别得到G—M—L1(—HP—OP—tag1……—tagn)—C1……—Cn和G—M—L1(—HP—OP—tag1……—tagn+m)(—C1……—Cn—A)—Cn+1……—Cn+m;其中0≤n≤7,0≤m≤7,n和m为整数,且2≤n+m≤7。
所述合成砌块是具有双活性官能团的小分子化合物。所述合成砌块的第一活性官能团与第二活性官能团不同时以未经保护基团保护的形式存在,第一活性官能团与第二活性官能团相互不干扰。合成砌块还可以包括骨架结构(例如骨架结构单元),其被连接于环内或者可以以环的侧链形式被连接于环上。相邻的两个合成砌块的活性官能团是互补的,即,通过彼此互补的两个活性官能团一起反应以形成共价键连接。合成砌块的双活性官能团分别独立地选自氨基、羧基、醛基、烯基、炔基、卤素、叠氮、羟基、巯基中的任意一种。
在优选的实施方式中,第一活性官能团是以经保护基团保护或未经保护基团保护的形式存在,第二活性官能团是以经保护基团保护的形式存在。当第一活性官能团是以经保护基团保护的形式存在时,第一活性官能团的脱保护机制与第二活性官能团的脱保护机制不相同。
在优选的实施方式中,第一活性官能团是以未经保护基团保护的形式存在,第二活性官能团是以经保护基团保护的形式存在。在合成砌块的拼接反应中,先直接利用未经保护基团保护的第一活性官能团进行拼接反应,然后需要脱出第二活性官能团的保护剂,再进行下一步合成砌块的拼接反应。
重复所述扩展步骤时,各合成砌块依次拼接。在第一种技术方案中,各合成砌块依次拼接,合成砌块C1的第一活性官能团负责与连接分子L1拼接,后续各合成砌块的第一活性官能团依次与前一个合成砌块的第二活性官能团拼接,合成砌块Cn的第二活性官能团负责与关环B端分子B拼接;第一活性官能团与第二活性官能团不同时以未经保护基团保护的形式存在,第一活性官能团与第二活性官能团相互不干扰。在第二、第三种技术方案中,合成砌块C1的第一活性官能团负责与连接分子L1的一个活性官能团拼接,C1至Cn之间的各合成砌块以及合成砌块Cn的第一活性官能团依次与前一个合成砌块的第二活性官能团拼接,合成砌块Cn的第二活性官能团负责与关环A端分子A拼接;合成砌块Cn+1的第一活性官能团负责与连接分子L1的另一个活性官能团拼接,Cn+1至Cn+m之间的各合成砌块以及合成砌块Cn+m的第一活性官能团依次与前一个合成砌块的第二活性官能团拼接,合成砌块Cn+m的第二活性官能团负责与关环B端分子B拼接;第一活性官能团与第二活性官能团不同时以未经保护基团保护的形式存在,第一活性官能团与第二活性官能团相互不干扰。
在优选的实施方式中,相邻合成砌块之间是通过以下化学键进行连接:酰胺键、酯键。
在优选的实施方式中,各合成砌块的第一活性官能团为同一种活性官能团,例如均为羧基;各合成砌块的第二活性官能团也为同一种活性官能团,例如均为氨基;且第一活性官能团与第二活性官能团不相同。
在一种优选的实施方式中,合成砌块的双活性官能团分别为羧基和氨基,羧基和氨基分别独立地以经保护基团保护的形式或未经保护基团保护的形式存在。
在一种优选的实施方式中,合成砌块为同时具有氨基和羧基的双活性官能团化合物。在一些实施方式中,合成砌块中的氨基和羧基连接于同一个碳原子,例如α-氨基酸。在另一些实施方式中,合成砌块中的氨基和羧基连接于不同的原子,可以为同时具有氨基和羧基的非氨基酸的化合物,也可以为N-取代的氨基酸。在另一些实施方式中,合成砌块选自取代或未取代的二羧酸、取代或未取代的二胺、取代或未取代的二醇、取代或未取代的烯烃、取代或未取代的炔烃、取代或未取代的醛。
在一种优选的实施方式中,第一活性官能团为羧基,羧基以未经保护基团保护的形式存在。
在一种优选的实施方式中,第一活性官能团为氨基,氨基以经保护基团保护的形式存在,氨基的保护基团采用Fmoc保护基。
在一种优选的实施方式中,所述合成砌块为Fmoc-氨基酸。
在一种优选的实施方式中,所述合成砌块中的至少一个含有骨架结构,且该骨架结构具有E3连接酶底物结构,能与E3连接酶结合。具有E3连接酶底物结构的化合物库,可以应用于在PROTAC中,可以实现库的多用途筛选。
在一些具体实施方式中,所述骨架结构选自:
在一种优选的实施方式中,所述合成砌块中,各合成砌块共含有至少一条环外侧链。环外侧链提供库化合物进一步衍生化的扩展功能,以扩大化合物库多样性。
在一种优选的实施方式中,所述合成砌块中,各合成砌块共含有至少两条环外侧链,且至少两条环外侧链通过化学反应连接,形成了双环结构。两条环外侧链的关环反应可以在酶关环反应之前进行,也可以在酶关环反应之后进行。由两条环外侧链形成双环结构的方法,在本发明提供的三种技术方案中均可以进行。
所述DNA标签(tag)是通过DNA连接酶依次完成彼此相互连接。在一个扩展步骤中,完成一个DNA标签及与该DNA标签对应的合成砌块的拼接反应,使合成砌块的链和DNA标签的链分别延长。在一个扩展步骤内,可以先执行DNA标签的拼接反应使DNA标签的链延长,再执行与该DNA标签对应的合成砌块的拼接反应使合成砌块的链延长;或者,先执行与合成砌块的拼接反应使合成砌块的链延长,再执行与该合成砌块对应的DNA标签的拼接反应使DNA标签的链延长。
在本发明提供的三种技术方案中,当DNA标签拼接完毕后,将封闭引物CP通过DNA连接酶连接,从而形成完整的DNA编码序列。封闭引物CP是指DNA拼接技术中DNA停止延伸的末端链。
在本发明提供的三种技术方案中,关环B端分子B是具有双活性官能团的化合物。关环B端分子B可以用通式R10-B0-R11表示。R10是用于与最末合成砌块的第二活性官能团反应拼接的活性官能团,R11是用于关环反应的活性官能团。R10和R11可以分别独立地以经保护基团保护的形式或未经保护基团保护的形式存在,且R10和R11相互之间不干扰对方的连接反应。由于是R10先与最末合成砌块的第二活性官能团反应拼接,因此主要是要求R11不干扰R10与末合成砌块的第二活性官能团相连接的反应过程,或者R10与末合成砌块的第二活性官能团连接反应时R11为由保护基团保护的形式。
在一种优选的实施方式中,R10以未经保护基团保护的形式存在,R11以经保护基团保护的形式存在。R10先与最末合成砌块的第二活性官能团反应完成拼接。当R11用于关环反应时,R11的保护基团先脱除后,再进行关环反应。
R10与末合成砌块的第二活性官能团是互补配对的反应基团,在一些优选的实施方式中,R10与最末合成砌块的第二活性官能团可以选自以下组合:氨基与羧基、羟基与羧基、磷酸基和羟基、氨基与烷基卤或芳基卤等。
在一种新优选的实施方式中,关环B端分子B的两个活性官能团的化合物R10和R11,其中一个为氨基,另一个为羧基。
在第一种技术方案中,通过拼接封闭引物OP和关环B端分子B,分离、纯化,得到G—M—A—L1(—DNA)—C1—……—Cn—B,该化合物本身即可构成化合物库S1”。化合物库S1”含有固相载体G,且还没有形成所需要的环结构。R10与Cn的第二活性官能团反应拼接,另一活性官能团R11在关环B端分子B的游离末端。
在第二种技术方案中,通过拼接封闭引物OP和关环B端分子B,分离、纯化,得到DNA—G—M—L1(—C1……—Cn—A)—Cn+1……—Cn+m—B,即化合物库S2’。R10与Cn的第二活性官能团反应拼接,另一活性官能团R11在关环B端分子B的游离末端。
在第三种技术方案中,通过拼接封闭引物OP和关环B端分子B,分离、纯化,得到G—M—L1(—DNA)(—C1……—Cn—A)—Cn+1……—Cn+m—B,即化合物库S3’。R10与Cn的第二活性官能团反应拼接,另一活性官能团R11在关环B端分子B的游离末端。
在一种优选的实施例中,R11位于关环B端分子B的游离末端,R11为氨基。优选的,关环B端分子B的游离末端的活性官能团R11为伯氨基。
在一种优选的实施例中,关环B端分子B是由2至10个氨基酸组成的肽链。
在一些具体实施例中,关环B端分子B为Fmoc保护的二肽。
在一些具体实施例中,关环B端分子B的分子结构具有氨基酸残基GL(Gly—Leu—)、LL(Leu—Leu—)、QL(Gln—Leu—)、KL(Lys—Leu—)、GF(Gly—Phe—)、GI(Gly—Ile—)、FSA、VGAG、GV、GF、GM。
在本发明提供的技术方案中,第一种技术方案中在光照的条件下,使G—M—A—L1(—DNA)—C1—……—Cn—B中M与A之间的连接发生裂解而断开,得到A—L1(—DNA)—C1—……—Cn—B,该化合物本身即可构成化合物库S1’。化合物库S1’不含有固相载体G,也没有形成所需要的环结构。
在本发明提供的技术方案中,将化合物库S1’、S2’或S3’在环合酶作用下进行关环反应,使关环A端分子A与关环B端分子B反应形成肽键相连接成环。在成环反应中,关环B端分子B的游离末端的活性官能团与关环A端分子A反应,使关环A端分子的脱去部分或全部分子碎片,且关环B端分子B的游离末端活性官能团与脱去后的剩余部分连接形成环结构。
本发明中所述的环合酶是指将分子中的两个末端氨基酸残基反应形成肽键相连接的酶。较佳的,所述环合酶为环肽合成酶,其催化分子中一个末端氨基酸残基的N端的α氨基和另一个末端氨基酸残基的C端的α羧基脱水反应形成环状多肽的酶。
所述的环合酶选自连接酶VyPAL2、Butelase1、PatG、PagG、ominiligase-1、PCY1或OaAEP1B&3-5。
其中,Butelase1是一种特异性天冬氨酸/氨酰连接酶,能高效催化羧基末端为Asx(Asp/Asn)—His—Val三肽序列的线性多肽在分子内或分子间环化。Butelase1将线性多肽羧基末端的—His—Val二肽切割掉后与氨基端相连,形成环状结构。
在一些具体实施方式中,酶关环反应温度为25~45℃;优选的酶关环反应温度为30~45℃;更优选的酶关环反应温度为35~40℃。
在一些具体实施方式中,酶关环反应的pH值范围为4.5~6.0;优选的酶关环反应的pH值范围为4.8~5.5;更优选的酶关环反应的pH值范围为4.9~5.3。
在一些具体实施方式中,酶关环反应的反应时间为12~48小时;优选的酶关环反应的反应时间为18~36小时;更优选的酶关环反应的反应时间为20~24小时。
在一些具体实施方式中,酶关环反应中使用醋酸钠缓冲溶液调节pH值。
在一些具体实施方式中,酶关环反应体系中加入乙二胺四乙酸二钠或其溶液(0.05M)。
在一些具体实施方式中,酶关环反应体系中加入氯化钠或其溶液(0.25M)。
在一些具体实施方式中,酶关环反应体系中加入TCEP作为还原剂。
本发明采用连接分子L1提供至少三个活性官能团,分别连接1)DNA编码序列,2)关环A端分子A,3)合成砌块及关环B端分子B,利用关环A端分子A和关环B端分子B的氨基酸残基结构在环合酶作用下进行完成关环,关环条件温和,普适性更强,扩充了编码化合物库的化学反应类型和化合物库多样性空间。
本发明提供了一种环状化合物库的构建方法,环结构中由每个合成砌块提供的原子数目和种类是可以多样化调整的,各合成砌块可以利用酰胺键(—CO—NH—)进行拼接并为环结构提供了更多的氢键结合的潜力,有利于提高环结构与蛋白的结合力。
本发明提供了利用光照切割的方法,反应条件温和,有效避免了其他严苛条件下脱除固相合成对DNA编码序列稳定性造成不利的影响。
本发明提供了利用固相载体负载DNA编码化合物合成的方法,反应的后处理纯化操作简单,通常只需要通过简单的几次过滤洗涤操作即可,简化了每步反应的后处理及分离纯化流程,使DNA编码化合物库合成周期显著缩短了,极大地节约了成本。
本发明的化合物库合成方法,将DNA编码序列与化合物库连接的连接分子(linker)先接在化合物库这边,然后接DNA编码序列,起始核苷酸分子HP与对接化合物的合成比例约1:250,大大降低了DNA用量比,节省成本。
本发明的化合物库合成方法中,相当于每一步DNA标签拼接后都残留有249份没有接上的DNA需要除去,合成砌块的双活性官能团之一带有保护基,在合成砌块及其对应的DNA标签一次交替反应连接时需要进行一步合成砌块的脱保护基,在进行脱保护基的同时可以封闭掉未接DNA的化合物库的反应点,有利于除去过量的DNA,降低干扰,并且起到了纯化的效果,提高了DNA编码的效率与唯一性以及最终产物的纯度。
本发明还提供一种双环结构化合物库的构建方法,是将前述的三种技术方案中的连接分子L1采用至少五官能团的连接分子,其中,连接分子L1的一个官能团用于直接或间接连接DNA编码序列,连接分子L1的其它四个官能团用于经过或未经过与合成砌块连接后再分别连接两个关环A端分子A、A’和两个关环B端分子B、B’,最后在环合酶1和环合酶2的作用下分别进行两个关环反应,使两对关环A端分子A和关环B端分子B,A端分子A’和关环B端分子B’分别关环,得到双环结构化合物库。
环合酶与关环A、B端的对应关系如下:当环合酶为OaAEP1B&3-5,A端可选自:NFL、NAL、NGL、NHL、DFL、DAL、DGL、DHL;B端选自:GL(Gly—Leu—)、LL(Leu—Leu—)、QL(Gln—Leu—)、KL(Lys—Leu—)、GF(Gly—Phe—);环合酶为VyPAL2时,A端选自NSL;B端选自GI;环合酶为Butelase1时,A端选自NHV;B端选自GI;环合酶为PatG时,A端选自、AYDGE;B端选自P或者噻唑啉环;环合酶为PagG时,A端选自FAGDDAE;环合酶为ominiligase-1时,A端选自OCam-Leu、OCam-;环合酶为PCY1时,A端选自FQA、IQT,B端选自FSA、VGAG。具体的方案是,前述的三种技术方案中,在与封闭引物CP反应之前,将步骤f2或f3再进行两次并分别连接一个关环A端分子A和一个关环B端分子B。
以前述第一种技术方案为例,双环结构化合物库的构建方法包括:
所述连接分子L1为至少五官能团的连接分子;
在步骤e1之后,进行以下步骤:
e1-1.将步骤e1所得产物与关环B端分子B反应,使关环B端分子B与Cn相连接,并使tagB与tagn相连接;
e1-2.将上一步所得产物按照所述扩展步骤与合成砌块Cn+1,……,Cn+m及其所对应的DNA标签tagn+1,……,tagn+m依次反应,使合成砌块Cn+1与L1相连接且DNA标签tagn+1与tagB相连接,得到G—M—A—L1(—HP—OP—tag1—……—tagn+m)(—C1—……—Cn—B)—Cn+1……—Cn+m;
e1-3.将上一步所得产物与关环A端分子A’反应,使关环A端分子A’与Cn+m相连接,并使tagA’与tagn+m相连接;
e1-4.将上一步所得产物按照所述扩展步骤与合成砌块Cn+m+1,……,Cn+m+x及其所对应的DNA标签tagn+m+1,……,tagn+m+x依次反应,使合成砌块Cn+1与L1相连接且DNA标签tagn+m+1与tagA’相连接,得到G—M—A1—L1(—HP—OP—tag1—……—tagn+m+x)(—C1—……—Cn—B)(—Cn+1……—Cn+m—A’)—Cn+m+1……—Cn+m+x;
e1-5.将上一步所得产物与关环B端分子B’、tagB’反应,使关环B端分子B’与Cn+m+x相连接,以及使tagB’与tagn+m+x相连接;
e1-6.将上一步所得产物与封闭引物CP反应,使封闭引物CP与tagB’相连接,其中HP—OP—tag1—…—tagn—tagB—tagn+1—……—tagn+m—tagA’—tagn+m+1—…—tagn+m+x—tagB’—CP形成完整的DNA编码序列,得到G—M—A—L1(—DNA)(—C1……—Cn—B)(—Cn+1……—Cn+m—A’)—Cn+m+1……—Cn+m+x—B’;
e1-7.将上一步所得产物在光源下进行分解反应,使M与A断开,得到A—L1(—DNA)(—C1……—Cn—B)(—Cn+1……—Cn+m—A’)—Cn+m+1……—Cn+m+x—B’;其中,0≤n≤7,0≤m≤7,0≤x≤7,n、m、x均为整数,且2≤n+m+x≤7;
以前述第二种技术方案为例,双环结构化合物库的构建方法包括:
所述连接分子L1为至少五官能团的连接分子;
在步骤e2之后,进行以下步骤:
e2-1.将步骤e2所得产物与关环分子A端对应的DNA标签tagA与tagn连接;
e2-2.将步骤e2-1所得产物与关环B端分子B反应,使关环B端分子B与Cn+m相连接,并在对应的DNA标签tag位置连接tagB,得到tagB-tagn+m—……—tag1—OP—HP—G—M—L1(—C1……—Cn—A)—Cn+1……—Cn+m—B;
e2-3.将上一步所得产物按照所述扩展步骤与合成砌块Cn+m+1,……,Cn+m+x及其所对应的DNA标签tagn+m+1,……,tagn+m+x依次反应,使合成砌块Cn+m+1与L1相连接且DNA标签tagn+m+1与tagB相连接,得到tagn+m+x—……—tag1—OP—HP—G—M—L1(—C1……—Cn—A)(—Cn+1……—Cn+m—B)—Cn+m+1……—Cn+m+x;
e2-4.将上一步所得产物与关环A端分子A’反应,使关环A端分子A’与Cn+m+x相连接,并在对应的DNAtag位置连接tagA’;
e2-5.将上一步所得产物按照所述扩展步骤与合成砌块Cn+m+x+1,……,Cn+m+x+y及其所对应的DNA标签tagn+m+x+1,……,tagn+m+x+y依次反应,使合成砌块Cn+m+x+1与L1相连接且DNA标签tagn+m+x+1与tagA’相连接,得到tagn+m+x+y—……—tag1—OP—HP—G—M—L1(—C1……—Cn—A)(—Cn+1……—Cn+m—B)(—Cn+m+1……—Cn+m+x—A’)—Cn+m+x+1……—Cn+m+x+y;
e2-6.将上一步所得产物与关环B端分子B、DNA标签tagB’反应,使关环B端分子B’与Cn+m+x+y相连接,以及使tagB’与tagn+m+x+y相连接;
e2-7.将上一步所得产物与封闭引物CP反应,使封闭引物CP与tagB’相连接,其中HP—OP—tag1—……—tagn+m+x+y—tagB’—CP形成完整的DNA编码序列,得到DNA—G—M—L1(—C1……—Cn—A)(—Cn+1……—Cn+m—B)(—Cn+m+1……—Cn+m+x—A’)—Cn+m+x+1……—Cn+m+x+y—B’);其中,0≤n≤7,0≤m≤7,0≤x≤7,0≤y≤7,n、m、x、y均为整数,且2≤n+m+x+y≤7;
以前述第三种技术方案为例,双环结构化合物库的构建方法包括:
所述连接分子L1为至少六官能团的连接分子;
在步骤e3之后,进行以下步骤:
e3-1.将步骤e3所得产物与关环分子A端对应的DNA标签tagA与tagn连接;
e3-2.将步骤e3-1所得产物与关环B端分子B反应,使关环B端分子B与Cn+m相连接,并在对应的DNAtag位置连接tagB,得到G—M—L1(—HP—OP—tag1……—tagn+m—tagB)(—C1……—Cn—A)—Cn+1……—Cn+m—B;
e3-3.将上一步所得产物按照所述扩展步骤与合成砌块Cn+m+1,……,Cn+m+x及其所对应的DNA标签tagn+m+1,……,tagn+m+x依次反应,使合成砌块Cn+m+1与L1相连接且DNA标签tagn+m+1与tagB相连接,得到G—M—L1(—HP—OP—tag1……—tagn+m+x)(—C1……—Cn—A)(—Cn+1……—Cn+m—B)—Cn+m+1……—Cn+m+x;
e3-4.将上一步所得产物与关环A端分子A’反应,使关环A端分子A’与Cn+m+x相连接,并在对应的DNAtag位置连接tagA’;
e3-5.将上一步所得产物按照所述扩展步骤与合成砌块Cn+m+x+1,……,Cn+m+x+y及其所对应的DNA标签tagn+m+x+1,……,tagn+m+x+y依次反应,使合成砌块Cn+m+x+1与L1相连接且DNA标签tagn+m+x+1与tagA’相连接,得到G—M—L1(—HP—OP—tag1……—tagn+m+x+y)(—C1……—Cn—A)(—Cn+1……—Cn+m—B)(—Cn+m+1……—Cn+m+x—A’)—Cn+m+x+1……—Cn+m+x+y;
e3-6.将上一步所得产物与关环B端分子B’、DNA标签tagB’反应,使关环B端分子B’与Cn+m+x+y相连接,以及使DNA标签tagB’与tagn+m+x+y相连接;
e3-7将上一步所得产物与封闭引物CP反应,使封闭引物CP与tagB’连接其中HP—OP—tag1—……—tagn+m+x+y—tagB’—CP形成完整的DNA编码序列,得到G—M—L1(—DNA)(—C1……—Cn—A)(—Cn+1……—Cn+m—B)(—Cn+m+1……—Cn+m+x—A’)—Cn+m+x+1……—Cn+m+x+y—B’;其中,0≤n≤7,0≤m≤7,0≤x≤7,0≤y≤7,n、m、x、y均为整数,且2≤n+m+x+y≤7;
在一种优选的实施方案中,至少五官能团的连接分子L1是由三个三官能团的连接分子拼接得到。
在一种优选的实施方案中,至少五官能团的连接分子L1是由一个四官能团连接分子和一个三官能团的连接分子拼接得到。
本发明还提供由前述方法构建得到的环状化合物库,其结构通式为:
其中,2≤n≤7且n为正整数,
L1为至少三官能团连接分子,DNA编码序列连接于L1,L1与DNA编码序列之间通过酰胺键进行连接;C1至Cn为首尾依次相连的具有双活性官能团的合成砌块;A表示关环A端分子,为氨基酸残基;B表示关环B端分子,为氨基酸残基;L1与A之间通过酰胺键或酯键进行连接;合成砌块Cn与B之间通过酰胺键或酯键进行连接;A与B之间通过环合酶作用下反应形成肽键相连接成环。
本发明还提供由前述方法构建得到的第二种环状化合物库,其具有结构通式为:
其中0≤n≤7,0≤m≤7,n和m为整数,且2≤n+m≤7;
L1为至少三官能团连接分子,DNA编码序列连接于固相载体G,G与DNA编码序列之间通过酰胺键进行连接;C1至Cn为首尾依次相连的具有双活性官能团的合成砌块,Cn+1至Cn+m为首尾依次相连的具有双活性官能团的合成砌块;G表示固相载体,M表示含光可裂解基团的分子;A表示关环A端分子,为氨基酸残基;B表示关环B端分子,为氨基酸残基;合成砌块Cn与A之间通过酰胺键或酯键进行连接;合成砌块Cn+m与B之间通过酰胺键或酯键进行连接;A与B之间通过环合酶作用下反应形成肽键相连接成环。
本发明还提供由前述方法构建得到的第三种环状化合物库,其具有结构通式为:
其中0≤n≤7,0≤m≤7,n和m为整数,且2≤n+m≤7;
L1为至少四官能团连接分子,DNA编码序列连接于L1,L1与DNA编码序列之间通过酰胺键进行连接;C1至Cn为首尾依次相连的具有双活性官能团的合成砌块,Cn+1至Cn+m为首尾依次相连的具有双活性官能团的合成砌块;G表示固相载体,M表示含光可裂解基团的分子;A表示关环A端分子,为氨基酸残基;B表示关环B端分子,为氨基酸残基;合成砌块Cn与A之间通过酰胺键或酯键进行连接;合成砌块Cn+m与B之间通过酰胺键或酯键进行连接;A与B之间通过环合酶作用下反应形成肽键相连接成环。
本发明还提供由前述方法构建得到的第四种环状化合物库,其结构通式为:
其中0≤n≤7,0≤m≤7,n和m为整数,且2≤n+m≤7;
L1为至少四官能团连接分子,DNA编码序列连接于L1,L1与DNA编码序列之间通过酰胺键进行连接;C1至Cn为首尾依次相连的具有双活性官能团的合成砌块,Cn+1至Cn+m为首尾依次相连的具有双活性官能团的合成砌块;A表示关环A端分子,为氨基酸残基;B表示关环B端分子,为氨基酸残基;合成砌块Cn与A之间通过酰胺键或酯键进行连接;合成砌块Cn+m与B之间通过酰胺键或酯键进行连接;A与B之间通过环合酶作用下反应形成肽键相连接成环。
本发明还提供由前述方法构建得到的第一种双环结构化合物库,其结构通式为:
其中,0≤n≤7,0≤m≤7,0≤x≤7,n、m、x均为整数,且2≤n+m+x≤7;
L1为至少五官能团连接分子,DNA编码序列连接于L1,L1与DNA编码序列之间通过酰胺键进行连接;C1至Cn为首尾依次相连的具有双活性官能团的合成砌块,Cn+1至Cn+m为首尾依次相连的具有双活性官能团的合成砌块,Cn+m+1至Cn+m+x为首尾依次相连的具有双活性官能团的合成砌块;A和B分别表示在一种环合酶作用下进行关环的关环A端分子和关环B端分子,A’和B’分别表示在另一种不同环合酶作用下进行关环的关环A端分子和关环B端分子,A、B、A’、B’均为氨基酸残基;合成砌块Cn与B之间通过酰胺键或酯键进行连接;合成砌块Cn+m与A’之间通过酰胺键或酯键进行连接;合成砌块Cn+m+x与B’之间通过酰胺键或酯键进行连接;A与B、A’与B’之间分别通过环合酶作用下反应形成肽键相连接成双环结构。
本发明还提供由前述方法构建得到的第二种双环结构化合物库,其结构通式为:
其中,0≤n≤7,0≤m≤7,0≤x≤7,0≤y≤7,n、m、x、y均为整数,且2≤n+m+x+y≤7;
L1为至少五官能团连接分子,DNA编码序列连接于固相载体G,G与DNA编码序列之间通过酰胺键进行连接;C1至Cn为首尾依次相连的具有双活性官能团的合成砌块,Cn+1至Cn+m为首尾依次相连的具有双活性官能团的合成砌块,Cn+m+1至Cn+m+x为首尾依次相连的具有双活性官能团的合成砌块,Cn+m+x+1至Cn+m+x+y为首尾依次相连的具有双活性官能团的合成砌块;A和B分别表示在一种环合酶作用下进行关环的关环A端分子和关环B端分子,A’和B’分别表示在另一种不同环合酶作用下进行关环的关环A端分子和关环B端分子,A、B、A’、B’均为氨基酸残基;合成砌块Cn与A之间通过酰胺键或酯键进行连接;合成砌块Cn+m与B之间通过酰胺键或酯键进行连接;合成砌块Cn+m+x与A’之间通过酰胺键或酯键进行连接;合成砌块Cn+m+x+y与B’之间通过酰胺键或酯键进行连接;A与B、A’与B’之间分别通过环合酶作用下反应形成肽键相连接成双环结构。
本发明还提供由前述方法构建得到的第三种双环结构化合物库,其结构通式为:
其中,0≤n≤7,0≤m≤7,0≤x≤7,0≤y≤7,n、m、x、y均为整数,且2≤n+m+x+y≤7;
L1为至少六官能团连接分子,DNA编码序列连接于L1,L1与DNA编码序列之间通过酰胺键进行连接;C1至Cn为首尾依次相连的具有双活性官能团的合成砌块,Cn+1至Cn+m为首尾依次相连的具有双活性官能团的合成砌块,Cn+m+1至Cn+m+x为首尾依次相连的具有双活性官能团的合成砌块,Cn+m+x+1至Cn+m+x+y为首尾依次相连的具有双活性官能团的合成砌块;G表示固相载体,M表示含光可裂解基团的分子;A和B分别表示在一种环合酶作用下进行关环的关环A端分子和关环B端分子,A’和B’分别表示在另一种不同环合酶作用下进行关环的关环A端分子和关环B端分子,A、B、A’、B’均为氨基酸残基;合成砌块Cn与A之间通过酰胺键或酯键进行连接;合成砌块Cn+m与B之间通过酰胺键或酯键进行连接;合成砌块Cn+m+x与A’之间通过酰胺键或酯键进行连接;合成砌块Cn+m+x+y与B’之间通过酰胺键或酯键进行连接;A与B、A’与B’之间分别通过环合酶作用下反应形成肽键相连接成双环结构。
本发明还提供由前述方法构建得到的第四种双环结构化合物库,其结构通式为:
其中,0≤n≤7,0≤m≤7,0≤x≤7,0≤y≤7,n、m、x、y均为整数,且2≤n+m+x+y≤7;
L1为至少六官能团连接分子,DNA编码序列连接于L1,L1与DNA编码序列之间通过酰胺键进行连接;C1至Cn为首尾依次相连的具有双活性官能团的合成砌块,Cn+1至Cn+m为首尾依次相连的具有双活性官能团的合成砌块,Cn+m+1至Cn+m+x为首尾依次相连的具有双活性官能团的合成砌块,Cn+m+x+1至Cn+m+x+y为首尾依次相连的具有双活性官能团的合成砌块;A和B分别表示在一种环合酶作用下进行关环的关环A端分子和关环B端分子,A’和B’分别表示在另一种不同环合酶作用下进行关环的关环A端分子和关环B端分子,A、B、A’、B’均为氨基酸残基;合成砌块Cn与A之间通过酰胺键或酯键进行连接;合成砌块Cn+m与B之间通过酰胺键或酯键进行连接;合成砌块Cn+m+x与A’之间通过酰胺键或酯键进行连接;合成砌块Cn+m+x+y与B’之间通过酰胺键或酯键进行连接,A与B、A’与B’之间分别通过环合酶作用下反应形成肽键相连接成双环结构。第四种双环结构化合物库可以由前述的第三种双环结构化合物库在光照下裂解含光可裂解基团的分子M得到。
具体的,各所述合成砌块中(C1,……,Cn,Cn+1,……,Cn+m,Cn+m+1,……,Cn+m+x,Cn+m+x+1,……,Cn+m+x+y),分别独立的选自取代或未取代的氨基酸、取代或未取代的二羧酸、取代或未取代的二胺、取代或未取代的二醇、α,β-不饱和醛、α,β-不饱和酮、α,β-不饱和酸、天然氨基酸或者非天然氨基酸。
具体的各所述合成砌块中,至少一个合成砌块含有骨架结构,且该骨架结构具有E3连接酶底物结构,能与E3连接酶结合。所述骨架结构连接于环内或者以环的侧链形式被连接于环上。
具体的所述骨架结构选自:
具体的各所述合成砌块中,各合成砌块共含有至少一条环外侧链。环外侧链提供库化合物进一步衍生化的扩展功能,同时可以在支链上做一些类似于脂化的功能性修饰,可以在分子本身透膜性基础上进一步提升分子的透膜以及渗透特性,以扩大化合物库多样性。
具体的各所述合成砌块中,各合成砌块共含有至少两条环外侧链,且至少两条环外侧链通过化学反应连接形成双环结构。双环或者多环结构可以稳定大环分子构象,提升环状结构刚性,提升环状结构分子的稳定性,延长环状结构分子药物的半衰期。
本发明的化合物库提供了一种环状化合物库,增加了化合物库的多样性,扩大其在新药筛选中的应用范围。
本发明的化合物库中,环结构中的原子数目和种类是可以由不同的合成砌块进行多样化调整,扩展了化合物库的多样性。
本发明的化合物库中,可以利用酰胺键(—CO—NH—)进行相邻的合成砌块的拼接,并为环结构提供了更多的氢键结合的潜力,有利于提高环结构与蛋白的结合力。
本发明的环状化合物库中,环上的合成砌块可以含有骨架结构,如E3连接酶底物结构,增加了该化合物库在PROTAC中的应用。
附图说明
图1为实施例29的琼脂糖凝胶电泳检测结果图一。
图2为实施例29的琼脂糖凝胶电泳检测结果图二。
图3为实施例29的琼脂糖凝胶电泳检测结果图三。
图4为实施例31第5步的琼脂糖凝胶电泳检测结果图。
图5为实施例32的Tag序列丰度统计结果。
图6为实施例33的测试结果图。
图7为实施例34第5步的琼脂糖凝胶电泳检测结果图。
图8为实施例35的Tag序列丰度统计结果。
图9为实施例36的流式细胞仪分析结果。
具体实施方式
下面将对本发明的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
以下各实施例的反应路线图中,表示固相载体(PEGA树脂),除此之外,其他的均表示合成砌块。内的英文字符L、N、A、I、E、P等为氨基酸的单字母符号缩写,如L表示亮氨酸(Leu)、N表示天冬氨酸(Asn)、A表示丙氨酸(Ala)、I表示异亮氨酸(Ile)、E表示谷氨酸(Glu)、P表示脯氨酸(Pro)。表示该合成砌块为亮氨酸,其他的单字母符号缩写也按本领域通常的氨基酸单字母符号缩写来解释。内具有字符AA1,……,AA4均表示该合成砌块为氨基酸,仅以序号1……4等以示区分。内具有字符C1,……,Cn,Cn+1,……,Cn+m均表示该合成砌块为本申请中所涉及的任意种类的合成砌块,仅以序号1……n,n+1……n+m以示区分。Photo linker表示光可裂解基团。Ahx表示6-氨基己酸。
实施例1环状化合物库的合成
步骤1.氨基修饰的PEGA树脂(1g,0.5mmol/g)在N,N-二甲基甲酰胺中溶胀1小时,树脂分别用10%N,N-二异丙基乙胺的N,N-二甲基甲酰胺和N,N-二甲基甲酰胺洗涤抽干备用。将备用的树脂加入10mL的N,N-二甲基甲酰胺,乙酸酐(26mg,0.25mmol)和N,N-二异丙基乙胺(129mg,1mmol),室温搅拌30分钟.树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,将树脂溶解在5mL的N,N-二甲基甲酰胺中,分别加入Fmoc-ε-Ahx-OH(397mg,4.5eq),HOAt(153mg,4.5eq),HATU(428mg,4.5eq)和DIEA(323mg,10equiv.),室温搅拌2小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂1g。
步骤2.1g树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液10mL,室温搅拌1小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂980mg。
步骤3.将DIC(126mg,4eq),HOBt(135mg,4eq)和光可切割基团分子M(225mg,3eq)在5毫升的N,N-二甲基甲酰胺中搅拌3分钟,然后加入980mg溶胀好的树脂,混合物在室温下搅拌2小时,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂1g。
步骤4.将DIC(126mg,4eq),HOBt(135mg,4eq),DMAP(15mg,0.5eq)和Fmoc保护的四肽(225mg,3eq)在10毫升的N,N-二甲基甲酰胺中搅拌10分钟,然后加入1g溶胀好的树脂,混合物在室温下搅拌16小时,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂1g。
步骤5.参照步骤2脱Fmoc的方法并且化合物18按照步骤3的缩合条件得到950mg树脂。
步骤6.将950mg树脂加入25毫升95%的三氟乙酸水溶液,室温反应2小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干,再将得到的树脂加入25毫升20%DIEA的N,N-二甲基甲酰胺溶液,室温搅拌2小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂900mg。
步骤7.将DIC(40mg,5eq),NHS(36mg,5eq)溶解在5毫升的N,N-二甲基甲酰胺中,然后加入到250mg的树脂中,室温反应2小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,将树脂溶胀在4mL pH 8.0的HEPES(100mM)缓冲溶液中,加入HDNA(250nmol,1mM)室温反应过夜得到树脂240mg。
步骤8.在240mg树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液10mL,室温搅拌1小时。树脂分别用N,N-二甲基甲酰胺(3x5mL),水(3x5mL)洗涤抽干备用,在树脂中加入3400微升的水,10×T4 DNA连接酶缓冲液400微升,T4DNA连接酶8微升(40U/微升)和OP(AAATCGATGTG)175微升(300nm,1.74nm/微升),室温反应过夜,树脂分别用水(3x10mL),T4DNA连接酶缓冲液(3x3mL)洗涤抽干备用,得到树脂230mg。在230mg树脂中加入3300微升的水,10×T4 DNA连接酶缓冲液400微升,T4 DNA连接酶8微升(40U/微升)和DNA tag1(ATCTGACA)294微升(300nm,1.7nm/微升)室温反应过夜,树脂分别用T4 DNA连接酶缓冲液(3x3mL),水(3x10mL),N,N-二甲基甲酰胺(3x10mL)洗涤抽干备用。将DIC(40mg,5eq),HOBt(42mg,5eq),氨基酸AA1(110mg,5eq)在5毫升的N,N-二甲基甲酰胺中搅拌10分钟,然后加入230mg溶胀好的树脂,混合物在室温下搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用。在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂220mg。GTTACACGT
步骤9.将DNA tag2(GTTACACGT)和氨基酸AA2按照步骤9的操作过程得到树脂210mg。
步骤10.将DNA tag3(CTGTAACGA)和氨基酸AA3按照步骤9的操作过程得到树脂200mg。
步骤11.将DNA tag4(TTCGAACTT)和氨基酸AA4按照步骤9的操作过程得到树脂190mg。
步骤12.将DIC(40mg,5eq),HOBt(42mg,5eq),和Fmoc保护的二肽(128mg,5eq)在5毫升的N,N-二甲基甲酰胺中搅拌10分钟,然后加入190mg溶胀好的树脂,混合物在室温下搅拌2小时,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂185mg。
步骤13.在185mg树脂中加入3400微升的水,10×T4 DNA连接酶缓冲液400微升,T4DNA连接酶8微升(40U/微升)和CP(TAGCCTATTGTCAGACAAGCTTCACCTGC)175微升(300nm,1.74nm/微升),室温反应过夜,树脂分别用水(3x10mL),T4 DNA连接酶缓冲液(3x3mL)洗涤抽干备用,得到树脂180mg。
步骤14.将180mg树脂加入1毫升N-甲基吡咯烷酮中,在365nm紫外光下照射5小时,将树脂过滤,溶剂透析冻干得到5mg化合物16。
步骤15.将2mg的化合物16溶解在800微升的水中,分别加入100微升的醋酸钠缓冲溶液(PH=5.0,0.5M),2微升的氯化钠溶液(0.25M),20微升的乙二胺四乙酸二钠溶液(0.05M),10微升的TCEP溶液(0.05M)和60微升的关环酶OaAEP3(1.34mg/mL),混合物在37℃反应过夜,制备后得到产品1.2mg。
本实施例中,连接分子化合物18的合成方法如下
步骤1.将化合物Fmoc-Asp(Alloc)-OH(750mg,1.83mmol),NH2-PEG4CH2CH2COOtBu(588mg,1.83mmol)和DIPEA(472mg,3.66mmol)溶解在10毫升N,N-二甲基甲酰胺中,在0度下加入HATU(836mg,2.2mmol),室温搅拌2小时,反应用水淬灭,加入10毫升乙酸乙酯.水相用乙酸乙酯萃取三次.有机相合并,无水硫酸钠干燥,过滤,旋干得到粗产品。粗产品以乙酸乙酯作为洗脱剂过柱子得到无色的油状物(1.2g,92.3%)。
步骤2.将化合物2(1.2g,1.68mmol)和Pd(PPh3)4(97mg,0.084mmol)溶解在20毫升的四氢呋喃溶液中,在0度和氮气的条件下加入苯硅烷(363mg,3.36mmol),室温搅拌1小时,混合物旋干过柱子纯化(6%甲醇的二氯甲烷溶液作为洗脱机)得到白色固体(1g,88.5%)。LCM S:673.7(M+H)+。
实施例2酶关环方法的验证
步骤1.将DIC(40mg,5eq),NHS(36mg,5eq)溶解在5毫升的N,N-二甲基甲酰胺中,然后加入到250mg的树脂中,室温反应2小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x5mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂240mg。
步骤2.将DIC(40mg,5eq),HOBt(42mg,5eq),氨基酸AA1(110mg,5eq)在5毫升的N,N-二甲基甲酰胺中搅拌10分钟,然后加入230mg溶胀好的树脂,混合物在室温下搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂240mg。
步骤3.使用20%哌啶的N,N-二甲基甲酰胺溶液5mL,DIC(40mg,5eq),HOBt(42mg,5eq),氨基酸AA2(142mg,5eq)参照步骤1脱Fmoc和步骤2的缩合操作得到树脂235mg。
步骤4.使用20%哌啶的N,N-二甲基甲酰胺溶液5mL,DIC(40mg,5eq),HOBt(42mg,5eq),氨基酸AA3(119mg,5eq)参照步骤1脱Fmoc和步骤2的缩合操作得到树脂230mg。
步骤5.使用20%哌啶的N,N-二甲基甲酰胺溶液5mL,DIC(40mg,5eq),HOBt(42mg,5eq),氨基酸AA4(105mg,5eq)参照步骤1脱Fmoc和步骤2的缩合操作得到树脂220mg。
步骤6.使用20%哌啶的N,N-二甲基甲酰胺溶液5mL,DIC(40mg,5eq),HOBt(42mg,5eq),二肽(128mg,5eq)参照步骤1脱Fmoc和步骤2的缩合操作后再参照步骤1脱Fmoc得到树脂215mg。
步骤7.将215mg树脂加入1毫升N-甲基吡咯烷酮中,在365nm紫外光下照射5小时,将树脂过滤,溶剂透析冻干得到25mg化合物8。
步骤8.将0.3mg的化合物8溶解在800微升的水中,分别加入100微升的醋酸钠缓冲溶液(PH=5.0,0.5M),2微升的氯化钠溶液(0.25M),20微升的乙二胺四乙酸二钠溶液(0.05M),10微升的TCEP溶液(0.05M)和30微升的OaAEP3(1.34mg/mL),混合物在37度反应过夜得到环状化合物9。LCMS:1154.72(M+H)+。
实施例3建库的方法3验证
合成方法:
1.将PEGA树脂(100mg,25μmol)在3毫升N,N-二甲基甲酰胺中溶胀2小时,按照标准的固相多肽合成操作得到树脂95mg。
2.95mg树脂中加入95%三氟乙酸,2.5%水和2.5%三异丙基硅烷室温搅拌2小时。树脂中加入10%N,N-二异丙基乙胺的N,N-二甲基甲酰胺溶液(3mL)室温搅拌2小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干。DIC(32mg,10eq),NHS(28mg,10eq)在3毫升的N,N-二甲基甲酰胺中搅拌1分钟加入到树脂中在37℃反应4小时。树脂分别用N,N-二甲基甲酰胺(3x2mL),二氯甲烷(3x2mL),N,N-二甲基甲酰胺(3x2mL)洗涤抽干,将HDNA(100nmol)溶于3毫升的100mM HEPES buffer pH 8.0加入树脂中,在37℃反应16小时。在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x5mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂85mg。
3.在85mg树脂中加入2095微升的水,10×T4 DNA连接酶缓冲液250微升,T4DNA连接酶25微升(10000U)和OP(AAATCGATGTG)58微升(100nm,1.74nm/微升),室温反应过夜,树脂分别用水(3x5mL),T4 DNA连接酶缓冲液(3x3mL)洗涤抽干备用,得到树脂75mg。在75mg树脂中加入2095微升的水,10×T4 DNA连接酶缓冲液250微升,T4DNA连接酶25微升(10000U),将混合物分成96份,每个孔加入DNA tag(1.35nm,1nm/微升)室温反应过夜,树脂分别用T4DNA连接酶缓冲液(3x3mL),水(3x3mL),N,N-二甲基甲酰胺(3x3mL)洗涤抽干备用。将DIC(16mg,5eq),HOBt(17mg,5eq)溶于5毫升的N,N-二甲基甲酰胺中分成96份,和氨基酸(5eq)加入到每个孔的树脂中,混合物在室温下搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用。将树脂放在一起,加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1h。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂70mg。所有的缩合反应和DNA连接反应一共重复4次,在接完第四轮氨基酸和DNA标签后,把树脂合并在一起,树脂分别用N,N-二甲基甲酰胺(3x5mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂70mg。
4.DIC(16mg,5eq),HOBt(17mg,5eq),和Fmoc-Gly-Leu-OH(51mg,5eq)在5毫升的N,N-二甲基甲酰胺中搅拌2分钟,然后加入70mg的树脂,混合物在室温下搅拌2小时,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干,将树脂,四三苯基膦钯(2.89mg,0.2eq)和苯硅烷(54.12mg,20eq)在氮气保护的条件下于5毫升二氯甲烷室温搅拌1小时。树脂分别用二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x3mL),洗涤抽干备用,树脂再按照标准的固相合成操作得到树脂65mg。
5.将65mg树脂,四三苯基膦钯(2.89mg,0.2eq)和苯硅烷(54.12mg,20eq)在氮气保护的条件下于5毫升二氯甲烷室温搅拌1小时。树脂分别用二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x3mL),洗涤抽干备用,将树脂加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干得到树脂60mg。
6.在60mg树脂中加入2095微升的水,10×T4 DNA连接酶缓冲液250微升,T4DNA连接酶25微升(10000U)和CP57微升(100nm,1.74nm/微升),室温反应过夜,树脂分别用T4 DNA连接酶缓冲液(3x3mL),水(3x5mL),洗涤抽干备用,50mg树脂溶胀在830微升的水中,分别加入100微升的醋酸钠缓冲溶液(PH=5.0,0.5M),2微升的氯化钠溶液(0.25M),20微升的乙二胺四乙酸二钠溶液(0.05M),10微升的TCEP溶液(0.05M)和30微升的OaAEP3(1.34mg/mL),混合物在37度反应过夜,得到DNA编码环肽库。
实施例4不同的A端关环建库
合成方法:
1. 100mg的树脂1参考上述合成方法按照标准的固相合成操作得到90mg的树脂。
2.将90mg树脂加入5毫升95%的三氟乙酸水溶液,室温反应2h。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干,再将得到的树脂加入5毫升20%DIEA的N,N-二甲基甲酰胺溶液,室温搅拌2小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂85mg。
3.将DIC(16mg,5eq),NHS(15mg,5eq)溶解在5毫升的N,N-二甲基甲酰胺中,然后加入到85mg的树脂中,室温反应2小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,将树脂溶胀在2mL pH 8.0的HEPES(100mM)缓冲溶液中,加入HDNA(100nmol,1mM)室温反应过夜得到树脂80mg。在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1h,树脂分别用N,N-二甲基甲酰胺(3x5mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂75mg。
4.在75mg树脂中加入2095微升的水,10×T4 DNA连接酶缓冲液250微升,T4DNA连接酶25微升(10000U)和OP(AAATCGATGTG)58微升(100nm,1.74nm/微升),室温反应过夜,树脂分别用水(3x5mL),T4 DNA连接酶缓冲液(3x3mL)洗涤抽干备用,得到树脂75mg。在75mg树脂中加入2095微升的水,10×T4 DNA连接酶缓冲液250微升,T4DNA连接酶25微升(10000U),将混合物分成96份,每个孔加入DNA tag(1.35nm,1nm/微升)室温反应过夜,树脂分别用T4DNA连接酶缓冲液(3x3mL),水(3x3mL),N,N-二甲基甲酰胺(3x3mL)洗涤抽干备用。将DIC(16mg,5eq),HOBt(17mg,5eq)溶于5毫升的N,N-二甲基甲酰胺中分成96份,和Fmoc-氨基酸(5eq)加入到每个孔的树脂中,混合物在室温下搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用。将树脂放在一起,加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂70mg。接完第四轮氨基酸和DNA标签后,把树脂合并在一起得到树脂65mg。
5.DIC(16mg,5eq),HOBt(17mg,5eq),和Fmoc-Gly-Leu-OH(51mg,5eq)在5毫升的N,N-二甲基甲酰胺中搅拌2分钟,然后加入65mg的树脂,混合物在室温下搅拌2小时,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干,树脂分别用二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x3mL),洗涤抽干,在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),water(3x5mL)洗涤抽干备用,得到树脂60mg。
6.在60mg树脂中加入2095微升的水,10×T4 DNA连接酶缓冲液250微升,T4DNA连接酶25微升(10000U)和CP57微升(100nm,1.74nm/微升),室温反应过夜,树脂分别用T4 DNA连接酶缓冲液(3x3mL),水(3x5mL),洗涤抽干备用。
7.将55mg树脂加入1毫升N-甲基吡咯烷酮中,在365nm紫外光下照射5小时,将树脂过滤,溶剂透析冻干得到5mg化合物8。
8.将5mg的化合物8溶解在800微升的水中,分别加入100微升的醋酸钠缓冲溶液(PH=5.0,0.5M),2微升的氯化钠溶液(0.25M),20微升的乙二胺四乙酸二钠溶液(0.05M),10微升的TCEP溶液(0.05M)和60微升的OaAEP3(1.34mg/mL),混合物在37度反应过夜,水相冻干得到DNA编码环肽库3mg。其中,进行关环反应时,关环A端分子脱去碎片-GL。
实施例5不同的A端关环建库
合成方法:
1. 100mg的树脂1参考上述合成方法按照标准的固相合成操作得到90mg的树脂。
2.将90mg树脂加入5毫升95%的三氟乙酸水溶液,室温反应2小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干,再将得到的树脂加入5毫升20%DIEA的N,N-二甲基甲酰胺溶液,室温搅拌2小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂85mg。
3.将DIC(16mg,5eq),NHS(15mg,5eq)溶解在5毫升的N,N-二甲基甲酰胺中,然后加入到85mg的树脂中,室温反应2小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,将树脂溶胀在2mL pH 8.0的HEPES(100mM)缓冲溶液中,加入HDNA(100nmol,1mM)室温反应过夜得到树脂80mg。在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x5mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂75mg。
4.在75mg树脂中加入2095微升的水,10×T4 DNA连接酶缓冲液250微升,T4DNA连接酶25微升(10000U)和OP(AAATCGATGTG)58微升(100nm,1.74nm/微升),室温反应过夜,树脂分别用水(3x5mL),T4 DNA连接酶缓冲液(3x3mL)洗涤抽干备用,得到树脂75mg。在75mg树脂中加入2095微升的水,10×T4 DNA连接酶缓冲液250微升,T4DNA连接酶25微升(10000U),将混合物分成96份,每个孔加入DNA tag(1.35nm,1nm/微升)室温反应过夜,树脂分别用T4DNA连接酶缓冲液(3x3mL),水(3x3mL),N,N-二甲基甲酰胺(3x3mL)洗涤抽干备用。将DIC(16mg,5eq),HOBt(17mg,5eq)溶于5毫升的N,N-二甲基甲酰胺中分成96份,和Fmoc-氨基酸(5eq)加入到每个孔的树脂中,混合物在室温下搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用。将树脂放在一起,加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂70mg。接完第四轮氨基酸和DNA标签后,把树脂合并在一起得到树脂65mg。
5.DIC(16mg,5eq),HOBt(17mg,5eq),和Fmoc-Gly-Leu-OH(51mg,5eq)在5毫升的N,N-二甲基甲酰胺中搅拌2分钟,然后加入65mg的树脂,混合物在室温下搅拌2小时,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干,树脂分别用二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x3mL),洗涤抽干,在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),water(3x5mL)洗涤抽干备用,得到树脂60mg。
6.在60mg树脂中加入2095微升的水,10×T4 DNA连接酶缓冲液250微升,T4DNA连接酶25微升(10000U)和CP57微升(100nm,1.74nm/微升),室温反应过夜,树脂分别用T4 DNA连接酶缓冲液(3x3mL),水(3x5mL),洗涤抽干备用。
7.将55mg树脂加入1毫升N-甲基吡咯烷酮中,在365nm紫外光下照射5小时,将树脂过滤,溶剂透析冻干得到5mg化合物8。
8.将5mg的化合物8溶解在800微升的水中,分别加入100微升的醋酸钠缓冲溶液(PH=5.0,0.5M),2微升的氯化钠溶液(0.25M),20微升的乙二胺四乙酸二钠溶液(0.05M),10微升的TCEP溶液(0.05M)和60微升的OaAEP3(1.34mg/mL),混合物在37度反应过夜,水相冻干得到DNA编码环肽库3mg。其中,进行关环反应时,其中,进行关环反应时,关环A端分子脱去碎片-FL。
实施例6不同的A端关环建库
合成方法:
参照实施例4的建库方法,起始树脂100mg最终得到DNA编码环肽库3mg。其中,进行关环反应时,关环A端分子脱去碎片-AL。
实施例7不同的A端关环建库
合成方法:
1.将PEGA树脂(100mg,25μmol)在3毫升N,N-二甲基甲酰胺中溶胀2小时,加入Fmoc-Ahx-OH(4.77equiv),琥珀酸单叔丁酯(0.23equiv),HOBt(5equiv),HBTU(5equiv)和DIPEA(10equiv),室温搅拌2小时。树脂分别用N,N-二甲基甲酰胺(3x2mL),二氯甲烷(3x2mL),N,N-二甲基甲酰胺(3x2mL)洗涤抽干。在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液4mL,室温搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x2mL),二氯甲烷(3x2mL),N,N-二甲基甲酰胺(3x2mL)洗涤抽干。DIC(16mg,5eq),HOBt(17mg,5eq),4-(4-(1-羟乙基)-2-甲氧基-5-硝基苯氧基)丁酸(38mg,5eq)在3毫升的N,N-二甲基甲酰胺中搅拌5分钟,然后加入到抽干的树脂中,混合物在室温下搅拌2小时,树脂分别用N,N-二甲基甲酰胺(3x2mL),二氯甲烷(3x2mL),N,N-二甲基甲酰胺(3x2mL)洗涤抽干。DIC(16mg,5eq),HOBt(17mg,5eq),DMAP(2mg,0.5eq)和Fmoc-Glu-OAll(51mg,5eq)在3毫升的N,N-二甲基甲酰胺中搅拌5分钟,然后加入到抽干的树脂中,混合物在室温下搅拌2小时,树脂分别用N,N-二甲基甲酰胺(3x2mL),二氯甲烷(3x2mL),N,N-二甲基甲酰胺(3x2mL)洗涤抽干得到树脂95mg。
2. 90毫克树脂,四三苯基膦钯(2.89mg,0.2eq)和苯硅烷(54.12mg,20eq)在氮气保护的条件下于5毫升二氯甲烷室温搅拌1小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂85mg。
3.以DIC(16mg,5eq),HOBt(17mg,5eq)为缩合剂,烯丙基保护的氨基酸为原料按照固相合成的标准操作流程得到树脂80mg。
4. 80mg树脂中加入95%TFA,2.5%H2O和2.5%三异丙基硅烷室温搅拌2小时。树脂中加入10%DIPEA的N,N-二甲基甲酰胺溶液(3mL)室温搅拌2小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干。DIC(32mg,10eq),NHS(28mg,10eq)在3毫升的N,N-二甲基甲酰胺中搅拌1分钟加入到树脂中在37℃反应4小时。树脂分别用N,N-二甲基甲酰胺(3x2mL),二氯甲烷(3x2mL),N,N-二甲基甲酰胺(3x2mL)洗涤抽干,将HDNA(100nmol)溶于3毫升的100mM HEPES buffer pH 8.0加入树脂中,在37℃反应16小时。在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x5mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂75mg。
5.在75mg树脂中加入2095微升的水,10×T4 DNA连接酶缓冲液250微升,T4DNA连接酶25微升(10000U)和OP(AAATCGATGTG)58微升(100nm,1.74nm/微升),室温反应过夜,树脂分别用水(3x5mL),T4 DNA连接酶缓冲液(3x3mL)洗涤抽干备用,得到树脂75mg。在75mg树脂中加入2095微升的水,10×T4 DNA连接酶缓冲液250微升,T4DNA连接酶25微升(10000U),将混合物分成96份,每个孔加入DNA tag(1.35nm,1nm/微升)室温反应过夜,树脂分别用T4DNA连接酶缓冲液(3x3mL),水(3x3mL),N,N-二甲基甲酰胺(3x3mL)洗涤抽干备用。将DIC(16mg,5eq),HOBt(17mg,5eq)溶于5毫升的N,N-二甲基甲酰胺中分成96份,和氨基酸(5eq)加入到每个孔的树脂中,混合物在室温下搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用。将树脂放在一起,加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂70mg。所有的缩合反应和DNA连接反应一共重复4次,在接完第四轮氨基酸和DNA标签后,把树脂合并在一起,DIC(16mg,5eq),HOBt(17mg,5eq),和Fmoc-Gly-Leu-OH(51mg,5eq)在5毫升的N,N-二甲基甲酰胺中搅拌2分钟,然后加入70mg的树脂,混合物在室温下搅拌2小时,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干,将树脂,四三苯基膦钯(2.89mg,0.2eq)和苯硅烷(54.12mg,20eq)在氮气保护的条件下于5毫升二氯甲烷室温搅拌1小时。树脂分别用二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x3mL),洗涤抽干,在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),水(3x5mL)洗涤抽干备用,得到树脂65mg。
6.在65mg树脂中加入2095微升的水,10×T4 DNA连接酶缓冲液250微升,T4DNA连接酶25微升(10000U)和CP57微升(100nm,1.74nm/微升),室温反应过夜,树脂分别用T4 DNA连接酶缓冲液(3x3mL),水(3x5mL),洗涤抽干备用,取10mg树脂溶胀在830微升的水中,分别加入100微升的醋酸钠缓冲溶液(PH=5.0,0.5M),2微升的氯化钠溶液(0.25M),20微升的乙二胺四乙酸二钠溶液(0.05M),10微升的TCEP溶液(0.05M)和30微升的OaAEP3(1.34mg/mL)进行关环反应,混合物在37度反应过夜,得到DNA编码环肽库。其中,进行关环反应时,关环A端分子脱去碎片-GL。
实施例8不同的A端关环建库
合成方法:
参照实施例7中树脂的合成与数据库的建库方法,起始树脂100mg最终得到固相DNA编码环肽库55mg。其中,进行关环反应时,关环A端分子脱去碎片-FL。
实施例9不同的A端关环建库
合成方法:
参照实施例7中树脂的合成与数据库的建库方法,起始树脂100mg最终得到固相DNA编码环肽库50mg。其中,进行关环反应时,关环A端分子脱去碎片-AL。
实施例10将ONB保护的多肽用于本发明的DEL库的合成
步骤1.合成ONB保护的Fmoc-Asn-OH,该保护基在365nm紫外光照下可以完全脱除。
(1)将化合物(2-硝基苯基)甲胺盐酸盐(1.9g,10mmol),Fmoc-Asp-OtBu(5g,12mmol)和DIPEA(3.9g,15mmol)溶解在20毫升N,N-二甲基甲酰胺中,在0度下加入HATU(5.8g,15mmol),室温搅拌2小时,反应用水淬灭,加入10毫升乙酸乙酯.水相用乙酸乙酯萃取三次.有机相合并,无水硫酸钠干燥,过滤,旋干得到粗产品。粗产品以乙酸乙酯作为洗脱剂过柱子得到白色固体(4.5g,82.6%)。
(2)将上步所得化合物(4.5g,8.25mmol)加入50毫升25%三氟乙酸的二氯甲烷溶液,室温反应2小时。混合物旋干过柱子纯化(6%甲醇的二氯甲烷溶液作为洗脱机)得到白色固体(3.5g,86.7%)。1H NMR(400MHz,DMSO)δ8.50(t,J=5.7Hz,1H),8.03(d,J=8.1Hz,1H),7.90(d,J=7.4Hz,2H),7.71(d,J=7.3Hz,2H),7.67–7.59(m,2H),7.59–7.48(m,2H),7.42(t,J=7.4Hz,2H),7.33(dd,J=6.9,4.5Hz,2H),4.56(d,J=4.2Hz,2H),4.47–4.36(m,1H),4.26(dt,J=13.7,7.2Hz,3H),2.74(dd,J=15.1,5.6Hz,1H),2.65–2.58(m,1H).LCMS:490.2(M+H)+。
步骤2.应用ONB保护的多肽用于DEL库的合成,检验ONB保护基在365nm紫外光照下的脱除效果
操作方法参照实施例1的DEL库的合成过程,在365nm紫外光照条件下下化合物15可以同时脱除ONB保护基并且从树脂上脱离得到化合物16。制备方法如下
实施例11环上含一个侧链的化合物的关环方法验证
步骤1.将DIC(16mg,5eq),HOBt(17mg,5eq),Fmoc-Lys(Alloc)-OH(57mg,5eq)在3毫升的N,N-二甲基甲酰胺中搅拌10分钟,然后加入100mg溶胀好的树脂,混合物在室温下搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂100mg。
步骤2.在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x5mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂100mg。DIC(16mg,5eq),HOBt(17mg,5eq),合成砌块A1(49mg,5eq)参照步骤1的缩合操作得到树脂95mg。
步骤3.使用20%哌啶的N,N-二甲基甲酰胺溶液5mL,DIC(16mg,5eq),HOBt(17mg,5eq),Fmoc-L-citrulline(合成砌块A2)(50mg,5eq)参照步骤1的脱Fmoc和缩合操作得到树脂95mg。
步骤4.使用20%哌啶的N,N-二甲基甲酰胺溶液5mL,DIC(16mg,5eq),HOBt(17mg,5eq),合成砌块A3(52mg,5eq)参照步骤1的脱Fmoc和缩合操作得到树脂90mg。
步骤5.90毫克树脂,四三苯基膦钯(2.89mg,0.2eq)和苯硅烷(54.12mg,20eq)在氮气保护的条件下于5毫升二氯甲烷室温搅拌1小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂85mg。
步骤6.DIC(16mg,5eq),HOBt(17mg,5eq),Fmoc-Gly-Leu-OH(50mg,5eq),20%哌啶的N,N-二甲基甲酰胺溶液5mL,参照步骤1的缩合和脱Fmoc操作得到树脂85mg。将85mg树脂加入0.5毫升乙腈和0.5毫升水的混合溶液,在365nm紫外光下照射5小时,将树脂过滤,溶剂透析冻干得到5mg化合物7。
步骤7.将0.25mg的化合物7溶解在800微升的水中,分别加入100微升的醋酸钠缓冲溶液(PH=5.0,0.5M),2微升的氯化钠溶液(0.25M),20微升的乙二胺四乙酸二钠溶液(0.05M),10微升的TCEP溶液(0.05M)和30微升的OaAEP3(1.34mg/mL)进行关环反应,混合物在37℃反应过夜得到环状化合物8。LCMS:1437.06(M+H)+。
实施例12环上含一个侧链的化合物的关环方法验证
步骤1.将DIC(16mg,5eq),HOBt(17mg,5eq),合成砌块A1(S)-2-((((9H-芴-9-基)甲氧基)羰基)氨基)-3-(吡啶-3-基)丙酸(50mg,5eq)在3mL的N,N-二甲基甲酰胺中搅拌10分钟,然后加入100mg溶胀好的树脂,混合物在室温下搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂100mg。树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x5mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂100mg。
步骤2.DIC(16mg,5eq),HOBt(17mg,5eq),合成砌块A2(50mg,5eq)参照步骤1的缩合操作得到树脂95mg。树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x5mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂95mg。
步骤3.DIC(16mg,5eq),HOBt(17mg,5eq),Fmoc-Lys(Alloc)-OH(57mg,5eq)参照步骤1的脱Fmoc和缩合操作得到树脂95mg。
步骤4.DIC(16mg,5eq),HOBt(17mg,5eq),合成砌块A3(52mg,5eq)参照步骤1的缩合和脱Fmoc操作得到树脂90mg。
步骤5.DIC(16mg,5eq),HOBt(17mg,5eq),Fmoc-Gly-Leu-OH(52mg,5eq),20%哌啶的N,N-二甲基甲酰胺溶液5mL,参照步骤1的缩合和脱Fmoc操作得到树脂85mg。将85mg树脂加入0.5mL乙腈和0.5mL水的混合溶液,在365nm紫外光下照射5小时,将树脂过滤,溶剂透析冻干得到5mg化合物6。
步骤6.将0.25mg的化合物6溶解在800微升的水中,分别加入100微升的醋酸钠缓冲溶液(PH=5.0,0.5M),2微升的氯化钠溶液(0.25M),20微升的乙二胺四乙酸二钠溶液(0.05M),10微升的TCEP溶液(0.05M)和30微升的OaAEP3(1.34mg/mL)进行关环反应,混合物在37度反应过夜得到环状分子化合物7。LCMS:1436.11(M+H)+。
实施例13本发明的环状分子化合物库在protac中的应用
合成方法:
参照上述双官能团树脂合成DEL环状分子库的合成过程,将POI作为一个特定的合成砌块加入化合物库,合成带有特定功能和结构的DEL环状分子库。
实施例14 DEL环状分子库在PROTAC技术中的应用:(靶蛋白底物在侧链)
方法步骤:
步骤1.将DIC(16mg,5eq),HOBt(17mg,5eq),Fmoc-AA1-OH(100mg,5eq)在3毫升的N,N-二甲基甲酰胺中搅拌10分钟,然后加入100mg制备好的树脂,混合物在室温下搅拌1h,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干。在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x5mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂100mg。
步骤2.按照步骤1的标准固相合成操作依次连接氨基酸得到85mg的化合物8。
步骤3. 85mg树脂中加入95%三氟乙酸,2.5%水和2.5%三异丙基硅烷室温搅拌2小时。树脂中加入10%DIPEA的N,N-二甲基甲酰胺溶液(3mL)室温搅拌2小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干。将50mg树脂加入3毫升的NMP溶液,在365nm紫外光下照射5小时,将树脂过滤,溶剂透析冻干得到8mg化合物9。
步骤4.将0.6mg的化合物9溶解在800微升的水中,分别加入100微升的醋酸钠缓冲溶液(PH=5.0,0.5M),2微升的氯化钠溶液(0.25M),20微升的乙二胺四乙酸二钠溶液(0.05M),10微升的TCEP溶液(0.05M)和30微升的OaAEP3(1.34mg/mL)进行关环反应,混合物在37度反应过夜,得到环状分子化合物10。LCMS:1740.04(M+H)+。
实施例15 DEL环状分子库在PROTAC中的应用:(靶蛋白底物在环内)
步骤1.将DIC(16mg,5eq),HOBt(17mg,5eq),Fmoc-AA1-OH(93mg,5eq)在3毫升的N,N-二甲基甲酰胺中搅拌10分钟,然后加入100mg制备好的树脂,混合物在室温下搅拌1h,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干。在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x5mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂100mg。
步骤2.按照步骤1的标准固相合成操作依次连接氨基酸得到80mg的化合物7。
步骤3. 80mg树脂中加入95%三氟乙酸,2.5%水和2.5%三异丙基硅烷室温搅拌2h。树脂中加入10%DIPEA的N,N-二甲基甲酰胺溶液(3mL)室温搅拌2小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干。将50mg树脂加入3毫升的NMP溶液,在365nm紫外光下照射5小时,将树脂过滤,溶剂透析冻干得到8mg化合物8。
步骤4.将0.5mg的化合物8溶解在800微升的水中,分别加入100微升的醋酸钠缓冲溶液(PH=5.0,0.5M),2微升的氯化钠溶液(0.25M),20微升的乙二胺四乙酸二钠溶液(0.05M),10微升的TCEP溶液(0.05M)和30微升的OaAEP3(1.34mg/mL)进行关环反应,混合物在37度反应过夜得到环肽化合物9。LCMS:1490.8(M+H)+。
实施例16双环的关环方法验证
合成方法:
步骤1.将DIC(16mg,5eq),HOBt(17mg,5eq),Fmoc-NH-PEG3CH2COOH(55mg,5eq)在3毫升的N,N-二甲基甲酰胺中搅拌10分钟,然后加入100mg溶胀好的树脂,混合物在室温下搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL),H2O(3x3mL)洗涤抽干备用,得到树脂100mg。
步骤2.在树脂中加入95%三氟乙酸的水溶液2mL,室温搅拌2天,树脂分别用H2O(3x3mL),N,N-二甲基甲酰胺(3x5mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂100mg。在树脂中加入50%DIPEA的N,N-二甲基甲酰胺溶液5mL,室温搅拌1h,树脂分别用N,N-二甲基甲酰胺(3x5mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂95mg。树脂按照标准的固相多肽合成操作得到树脂92mg,其中DIC(16mg,5eq),HOBt(17mg,5eq),Fmoc保护的氨基酸(60mg,5eq)。
步骤3.在树脂中加入50%三氟乙酸的二氯甲烷溶液5mL,室温搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x5mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂87mg。将PyBop(27mg,2eq),DIPEA(17mg,5eq)在3毫升的N,N-二甲基甲酰胺中搅拌1分钟,然后加入树脂中,混合物在室温下搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL),洗涤抽干备用,得到树脂85mg。此步反应中,合成砌块谷氨酸(E)的侧链与合成砌块甲硫氨酸(K)的侧链反应连接,形成环结构。
步骤4.将85mg树脂加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干,得到树脂80mg。将80mg树脂加入0.5毫升乙腈和0.5毫升水的混合溶液,在365nm紫外光下照射5小时,将树脂过滤,溶剂冻干得到4mg化合物5。
步骤5.将0.25mg的化合物5溶解在800微升的水中,分别加入100微升的醋酸钠缓冲溶液(PH=5.0,0.5M),2微升的氯化钠溶液(0.25M),20微升的乙二胺四乙酸二钠溶液(0.05M),10微升的TCEP溶液(0.05M)和30微升的OaAEP3(1.34mg/mL)进行关环反应,混合物在37度反应过夜得到环肽化合物6,获得双环结构化合物。
LCMS:1172.(M+H)+。
由以上验证结果可知,本申请的构建方法可以构建出双环化合物库。合成砌块E与合成砌块K各提供一条环外侧链,两条环外侧链通过化学反应连接形成环结构。本实施例获得的库化合物的双环结构为桥环,两环之间共用一个或多个合成砌块。
实施例17双环的关环验证试验
合成方法:
1.将PEGA树脂(100mg,25μmol)在3毫升N,N-二甲基甲酰胺中溶胀2小时,按照标准的固相多肽合成操作,首先与关环A端分子(LFNI,四肽)拼接,接着与Fmoc-O-叔丁基-L-谷氨酸(即三官能团连接子L1’)拼接,得到树脂95mg(化合物2)。
2.将上一步得到的95mg树脂中加入95%TFA,2.5%H2O和2.5%三异丙基硅烷室温搅拌2小时。树脂中加入10%DIPEA的N,N-二甲基甲酰胺溶液(3mL)室温搅拌2h。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干。DIC(32mg,10eq),HOBt(35mg,10eq),Boc-Lys-OAll(76mg,10eq,即三官能团连接子L1”)在3毫升的N,N-二甲基甲酰胺中搅拌1分钟加入到树脂中反应1小时,使三官能团连接子L1”与三官能团连接子L1’拼接合成一个四官能团连接子L1。树脂分别用N,N-二甲基甲酰胺(3x2mL),二氯甲烷(3x2mL),N,N-二甲基甲酰胺(3x2mL)洗涤抽干得到树脂85mg(化合物3)。
3.将85mg树脂,四三苯基膦钯(3mg,0.2eq)和苯硅烷(60.12mg,20eq)在氮气保护的条件下于5毫升二氯甲烷室温搅拌1小时。树脂分别用二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x3mL),洗涤抽干得到树脂80mg(化合物4)。
4.将烯丙酯保护的氨基酸按照标准的固相多肽合成操作得到树脂70mg(化合物5)。
5. 70mg树脂中加入95%TFA,2.5%H2O和2.5%三异丙基硅烷室温搅拌2小时。树脂中加入10%DIPEA的N,N-二甲基甲酰胺溶液(3mL)室温搅拌2小时。树脂分别用N,N-二甲基甲酰胺(3x3mL)洗涤抽干,将叔丁氧羰基保护的氨基酸按照标准的固相多肽合成操作得到树脂60mg(化合物6)。
6.将60mg树脂加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1小时。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干,将Fmoc保护的氨基酸按照标准的固相多肽合成操作得到树脂55mg(化合物7)。
7.树脂按照上述脱保护的方法依次脱除烯丙基,叔丁氧羰基和9-芴基甲氧基羰基得到树脂45mg(化合物8)。
8.将45mg树脂加入1毫升的NMP溶液,在365nm紫外光下照射5小时,将树脂过滤,溶剂透析冻干得到5mg化合物9。
9.在10mM PH=7.0的MES buffer中加入20%DMSO,100μM的多肽化合物9和20μM的PagG。混合物在25℃反应16小时。反应蒸煮5分钟淬灭反应,冻干得到化合物10。
10.将化合物10溶解在800微升的水中,分别加入100微升的醋酸钠缓冲溶液(PH=5.0,0.5M),2微升的氯化钠溶液(0.25M),20微升的乙二胺四乙酸二钠溶液(0.05M),10微升的TCEP溶液(0.05M)和30微升的OaAEP3(1.34mg/mL)进行关环反应,混合物在45度反应过夜,同时关两个环,得到环肽化合物10,获得双环结构化合物。LCMS:1746.1(M+H)+。
由以上验证结果可知,本申请的构建方法可以构建出双环化合物库,尤其是应用于筛选双环肽分子。双环或者多环结构可以稳定大环分子构象,提升环状结构刚性,提升环肽分子稳定性,延长环肽药物半衰期,应用前景更好。
实施例18关环的验证试验
H2N-GLRINGL-COOH→Cycle(GLRIN)
将0.25mg的多肽溶解在800微升的水中,分别加入100微升的醋酸钠缓冲溶液(PH=5.0,0.5M),2微升的氯化钠溶液(0.25M),20微升的乙二胺四乙酸二钠溶液(0.05M),10微升的TCEP溶液(0.05M)和60微升的OaAEP3(1.34mg/mL)进行关环反应,混合物在37度反应过夜,获得产物。
经LC-MS验证产物分子量为554(M+H)+,可以关环。
实施例19关环的验证试验
H2N-GLIRIKIRIKNGL-COOH→Cycle(GLIRIKIRIKN)
将0.5mg的多肽溶解在800微升的水中,分别加入100微升的醋酸钠缓冲溶液(PH=5.0,0.5M),2微升的氯化钠溶液(0.25M),20微升的乙二胺四乙酸二钠溶液(0.05M),10微升的TCEP溶液(0.05M)和60微升的OaAEP3(1.34mg/mL),混合物在37度反应过夜。
经LC-MS验证分子量为1306.5(M+H)+,可以关环。
实施例20关环的验证试验
将0.5mg的多肽溶解在800微升的水中,分别加入100微升的醋酸钠缓冲溶液(PH=5.0,0.5M),2微升的氯化钠溶液(0.25M),20微升的乙二胺四乙酸二钠溶液(0.05M),10微升的TCEP溶液(0.05M)和60微升的OaAEP3(1.34mg/mL)进行关环反应,混合物在37度反应过夜,获得产物。
LCMS:984.98(M+H)+。
实施例21关环的验证试验
将0.5mg的多肽溶解在800微升的水中,分别加入100微升的醋酸钠缓冲溶液(PH=5.0,0.5M),2微升的氯化钠溶液(0.25M),20微升的乙二胺四乙酸二钠溶液(0.05M),10微升的TCEP溶液(0.05M)和60微升的OaAEP3(1.34mg/mL)进行关环反应,混合物在37度反应过夜,获得产物。
LCMS:984.71(M+H)+。
实施例22环状分子内含有芳环的关环方法验证
步骤1.将DIC(16mg,5eq),HOBt(17mg,5eq),Fmoc-对苄胺苯甲酸(40mg,5eq)在3毫升的N,N-二甲基甲酰胺中搅拌10分钟,然后加入100mg溶胀好的树脂,混合物在室温下搅拌1h,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂100mg。
步骤2.在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1小时,树脂分别用N,N-二甲基甲酰胺(3x5mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂100mg。DIC(16mg,5eq),HOBt(17mg,5eq),Fmoc-Gly-Leu-OH(52mg,5eq)参照步骤1的缩合操作得到树脂95mg。
步骤3.20%哌啶的N,N-二甲基甲酰胺溶液5mL,参照步骤2的脱Fmoc操作得到树脂85mg。将85mg树脂加入0.5毫升乙腈和0.5毫升水的混合溶液,在365nm紫外光下照射5h,将树脂过滤,溶剂冻干得到5mg化合物4。
步骤4.将0.25mg的化合物5溶解在800微升的水中,分别加入100微升的醋酸钠缓冲溶液(PH=5.0,0.5M),2微升的氯化钠溶液(0.25M),20微升的乙二胺四乙酸二钠溶液(0.05M),10微升的TCEP溶液(0.05M)和30微升的OaAEP3(1.34mg/mL),混合物在37度反应过夜得到环肽化合物5。LCMS:962.53(M+H)+。
实施例23环状分子内含有芳环的关环方法验证
步骤1.将DIC(16mg,5eq),HOBt(17mg,5eq),4-(((((9H-芴-9-基)甲氧基)羰基)氨基)甲基)-2-(((烯丙氧基)羰基)氨基)苯甲酸(45mg,5eq)在3毫升的N,N-二甲基甲酰胺中搅拌10分钟,然后加入100mg溶胀好的树脂,混合物在室温下搅拌1h,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂100mg。
步骤2.在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1h,树脂分别用N,N-二甲基甲酰胺(3x5mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂100mg。DIC(16mg,5eq),HOBt(17mg,5eq),Fmoc-Gly-Leu-OH(52mg,5eq)参照步骤1的缩合操作得到树脂95mg。
步骤3.20%哌啶的N,N-二甲基甲酰胺溶液5mL,参照步骤2的脱Fmoc操作得到树脂85mg。将85mg树脂加入0.5毫升乙腈和0.5毫升水的混合溶液,在365nm紫外光下照射5h,将树脂过滤,溶剂冻干得到5mg化合物4。
步骤4.将0.25mg的化合物5溶解在800微升的水中,分别加入100微升的醋酸钠缓冲溶液(PH=5.0,0.5M),2微升的氯化钠溶液(0.25M),20微升的乙二胺四乙酸二钠溶液(0.05M),10微升的TCEP溶液(0.05M)和30微升的OaAEP3(1.34mg/mL),混合物在37度反应过夜得到环状化合物5。
LCMS:1061.56(M+H)+。
实施例24透膜性增加的化合物库及其构建
1. 100mg的PEGA树脂1参考上述合成方法按照标准的固相合成操作得到95mg的树脂。产物2分子结构中具有两个脯氨酸构成的分子片段。
2.参照固相合成标准的Fmoc脱保护和氨基酸缩合方法得到90mg的树脂。
3.将90mg树脂加入5毫升95%的三氟乙酸水溶液,室温反应2h。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干,再将得到的树脂加入5毫升20%DIEA的N,N-二甲基甲酰胺溶液,室温搅拌2h。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂85mg。
4.将DIC(16mg,5eq),NHS(15mg,5eq)溶解在5毫升的N,N-二甲基甲酰胺中,然后加入到85mg的树脂中,室温反应2h。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,将树脂溶胀在2mL pH 8.0的HEPES(100mM)缓冲溶液中,加入HDNA(100nmol,1mM)室温反应过夜得到树脂80mg。在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1h,树脂分别用N,N-二甲基甲酰胺(3x5mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂75mg。
5.在75mg树脂中加入2095微升的水,10×T4 DNA连接酶缓冲液250微升,T4DNA连接酶25微升(10000U)和OP(AAATCGATGTG)58微升(100nm,1.74nm/微升),室温反应过夜,树脂分别用水(3x5mL),T4 DNA连接酶缓冲液(3x3mL)洗涤抽干备用,得到树脂75mg。在75mg树脂中加入2095微升的水,10×T4 DNA连接酶缓冲液250微升,T4DNA连接酶25微升(10000U),将混合物分成96份,每个孔加入DNA标签(1.35nm,1nm/微升)室温反应过夜,树脂分别用T4DNA连接酶缓冲液(3x3mL),水(3x3mL),N,N-二甲基甲酰胺(3x3mL)洗涤抽干备用。将DIC(16mg,5eq),HOBt(17mg,5eq)溶于5毫升的N,N-二甲基甲酰胺中分成96份,和Fmoc-N-甲基氨基酸(5eq)加入到每个孔的树脂中,混合物在室温下搅拌1h,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用。将树脂放在一起,加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1h。树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂70mg。所有的缩合反应和DNA连接反应一共重复4次,在第二轮接Fmoc氨基酸,1,3,4轮接Fmoc-N-甲基氨基酸,接完第四轮氨基酸和DNA标签后,把树脂合并在一起得到树脂65mg。
6.DIC(16mg,5eq),HOBt(17mg,5eq),和Fmoc-Gly-Leu-OH(51mg,5eq)在5毫升的N,N-二甲基甲酰胺中搅拌2分钟,然后加入65mg的树脂,混合物在室温下搅拌2h,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干,树脂分别用二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x3mL),洗涤抽干,在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1h。树脂分别用N,N-二甲基甲酰胺(3x3mL),water(3x5mL)洗涤抽干备用,得到树脂60mg。
7.在60mg树脂中加入2095微升的水,10×T4 DNA连接酶缓冲液250微升,T4DNA连接酶25微升(10000U)和CP57微升(100nm,1.74nm/微升),室温反应过夜,树脂分别用T4 DNA连接酶缓冲液(3x3mL),水(3x5mL),洗涤抽干备用。
8.将60mg树脂加入1毫升N-甲基吡咯烷酮中,在365nm紫外光下照射5h,将树脂过滤,溶剂透析冻干得到5mg化合物9。
9.将5mg的化合物16溶解在800微升的水中,分别加入100微升的醋酸钠缓冲溶液(PH=5.0,0.5M),2微升的氯化钠溶液(0.25M),20微升的乙二胺四乙酸二钠溶液(0.05M),10微升的TCEP溶液(0.05M)和60微升的OaAEP3(1.34mg/mL),混合物在37度反应过夜,进行关环反应,制备后得到3mg产品10。
实施例25透膜性增加的化合物库及其构建
合成方法:
1.将DIC(16mg,5eq),HOBt(17mg,5eq),Fmoc-Glu(OtBu)-OH(100mg,5eq)在3毫升的N,N-二甲基甲酰胺中搅拌10分钟,然后加入100mg制备好的树脂,混合物在室温下搅拌1h,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干。在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1h,树脂分别用N,N-二甲基甲酰胺(3x5mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂95mg。
2.按照步骤1的标准固相合成操作依次连接氨基酸得到80mg的树脂7。
3.将80mg树脂加入2毫升的NMP溶液,在365nm紫外光下照射5h,将树脂过滤,溶剂透析冻干得到10mg化合物8。
4.将0.5mg的化合物8溶解在800微升的水中,分别加入100微升的醋酸钠缓冲溶液(PH=5.0,0.5M),2微升的氯化钠溶液(0.25M),20微升的乙二胺四乙酸二钠溶液(0.05M),10微升的TCEP溶液(0.05M)和30微升的OaAEP3(1.34mg/mL),混合物在37度反应过夜得到环肽化合物9。
LCMS:1238.70(M+H)+。
依照上述实施例的方法,分别合成化合物10,化合物11,化合物12。
化合物结构与LC-MS验证对照表格如下:
实施例26膜透过性评价
为测定上述实施例得到的环肽化合物9-12,建立MDCK模型分别测定其透膜性,MDCK细胞系来自于马丁达比犬上皮细胞系,单层MDCK细胞是研究药物在肾小管的吸收、重吸收等体内过程的最佳细胞学模型.消化分散培养瓶中的MDCK细胞,按5×104个/cm2接种到Millicell CPI上,在A侧(管腔侧,Apical)加入含10%FBS的MEM培养液400μL,B侧(基底侧,Basolateral)加800μL,置于含5%CO2,37℃的培养箱中孵育。每天换液,换液时要注意移液枪不要碰到细胞膜,以免损伤细胞层,定期用Millicell2ERS测跨膜电阻(Thetrans2epithelial electrical resistance,TEER)以检测细胞单层的完整性。
从MDCK细胞单层膜顶端(apical,A)到基底端(basolateral,B)A→B的转运情况。A→B的测定,将450μL药物或阳性对照的HEPES溶液加到膜顶端作为供给池、1 300μL空白HEPES溶液加到基底端作为接收池。将Transwell板置于37℃恒温摇床上振荡,90分钟后取出供给池和接收池中的样品溶液,加乙腈沉淀蛋白,涡旋、离心、转移,利用LC/MS测定了透过量。根据该透过量算出了膜透过系数(Papp),Papp(Apparent permeability)是具体的评价参数,大于1×10-6cm/s就能使得60%以上的药物被吸收,超过10×10-6cm/s的话80%以上的药物分子能被吸收。
化合物 | clog P | MDCK Papp(A-B)[10E-6cm/s] |
9 | 8.6 | 11.3 |
10 | 6.2 | 4.8 |
11 | 9.0 | 16.2 |
12 | 4.8 | 0.9 |
由以上数据可知,合成的化合物的Papp值均大于10-6,且化合物9和化合物11的Papp值大于10×10-6,表现出更加优越的细胞渗透性。
实施例27在环状分子中存在以醚键相连的合成切块关环验证试验
1.DIC(16mg,5eq),HOBt(17mg,5eq)和FmocNHPEG4CH2CH2COOH(104mg,5eq)在3毫升的N,N-二甲基甲酰胺中搅拌10分钟,然后加入100mg溶胀好的树脂,混合物在室温下搅拌1h,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用。在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1h,树脂分别用N,N-二甲基甲酰胺(3x5mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂95mg。
2.将DIC(16mg,5eq),HOBt(17mg,5eq),Fmoc-对苄胺苯甲酸(40mg,5eq)在3毫升的N,N-二甲基甲酰胺中搅拌10分钟,然后加入95mg溶胀好的树脂,混合物在室温下搅拌1h,树脂分别用N,N-二甲基甲酰胺(3x3mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1h,树脂分别用N,N-二甲基甲酰胺(3x5mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂90mg。
3.DIC(16mg,5eq),HOBt(17mg,5eq),Fmoc-Gly-Leu-OH(52mg,5eq)参照步骤1的缩合操作。然后在树脂中加入20%哌啶的N,N-二甲基甲酰胺溶液5mL,室温搅拌1h,树脂分别用N,N-二甲基甲酰胺(3x5mL),二氯甲烷(3x3mL),N,N-二甲基甲酰胺(3x5mL)洗涤抽干备用,得到树脂80mg。
4.将80mg树脂加入0.5毫升乙腈和0.5毫升水的混合溶液,在365nm紫外光下照射5h,将树脂过滤,溶剂冻干得到5mg化合物5。
5.将0.25mg的化合物5溶解在800微升的水中,分别加入100微升的醋酸钠缓冲溶液(PH=5.0,0.5M),2微升的氯化钠溶液(0.25M),20微升的乙二胺四乙酸二钠溶液(0.05M),10微升的TCEP溶液(0.05M)和30微升的OaAEP3(1.34mg/mL),混合物在37度反应过夜得到环肽化合物6。
LCMS:1210.92(M+H)+。
实施例28L0存在且为酸裂解的裂解验证
合成方法:
1.将DIC(16mg,5eq),HOBt(17mg,5eq),3-(((((9H-芴-9-基)甲氧基)羰基)氨基)-3-(2-硝基苯基)丙酸(54mg,5eq)在3毫升的DMF中搅拌10分钟,然后加入100mg溶胀好的树脂,混合物在室温下搅拌1h,树脂分别用DMF(3x3mL),DCM(3x3mL),DMF(3x5mL),洗涤抽干备用。在树脂中加入20%哌啶的DMF溶液5mL,室温搅拌1h,树脂分别用DMF(3x5mL),DCM(3x3mL),DMF(3x5mL)洗涤抽干备用,得到树脂95mg
2.DIC(16mg,5eq),HOBt(17mg,5eq),Fmoc-Glu-OAll(52mg,5eq)参照步骤1的缩合和脱Fmoc操作得到树脂92mg。
3.DIC(16mg,5eq),HOBt(17mg,5eq),2-(4-(((((((9H-芴-9-基)甲氧基)羰基)氨基)(3,5-二甲氧基苯基)甲基)苯氧基)乙酸(68mg,5eq)骤1的缩合和脱Fmoc操作得到树脂90mg。
4.DIC(16mg,5eq),HOBt(17mg,5eq),Fmoc-Glu-OAll(52mg,5eq)参照步骤1的缩合操作得到树脂90mg。
5.在树脂中加入50%三氟乙酸的二氯甲烷溶液2mL,室温搅拌1h,树脂用DCM(3x3mL)洗涤,滤液旋干4mg化合物6
LCMS:409.12(M+H)+。
分段切割验证如下:
合成方法:
1.将100mg树脂加入0.5毫升乙腈和0.5毫升水的混合溶液,在365nm紫外光下照射5h,将树脂过滤,溶剂冻干得到4mg化合物2。
LCMS:877.96(M+H)+。
实施例29多轮扩展步骤中DNA引物稳定性的验证
按照本申请所述的扩展步骤,将合成砌块依次拼接形成延长的链,以及将合成砌块所对应的DNA标签依次拼接形成延长的链。按照本申请前述的树脂合成方法与化合物库的建库方法,进行多轮合成,然后分别将4轮、5轮、7轮合成的库化合物进行PCR,再将PCR产物进行琼脂糖凝胶电泳检测。
其中,合成4轮的含有DNA的树脂使用引物(TGACTCCCAAATCGATGTG,GCAGGTGAAGCTTGTCTGACAATAGGCTAAA),2×taq master mix和蒸馏水进行PCR。得到的PCR产物进行琼脂糖凝胶电泳检测得到(PCR product band size:85bp)。
合成5轮的含有DNA的树脂使用引物(TGACTCCCAAATCGATGTG,GCAGGTGAAGCTTGTCTGACAATAGGCTATC),2×taq master mix和蒸馏水进行PCR。得到的PCR产物进行琼脂糖凝胶电泳检测得到(PCR product band size:94bp)。
合成7轮的含有DNA的树脂使用引物(TGACTCCCAAATCGATGTG,GCAGGTGAAGCTTGTCTGACAATAGGCTATC),2×taq master mix和蒸馏水进行PCR。得到的PCR产物进行琼脂糖凝胶电泳检测得到(PCR product band size:94bp)。
琼脂糖凝胶电泳检测结果如图1~3所示。图1~3分别显示合成4轮、5轮、7轮的PCR纯度高,这说明在本发明的合成方法中反应条件温和,尤其是关环反应条件,有利于保持DNA分子的稳定性,因此,本申请所构建的化合物库的筛选结果的稳定性及准确性更好。
实施例30
参照实施例5所述的方法,进行4轮的合成,得到相应的单环化合物库(数量级近一亿)。
实施例31用合成好的DEL库筛选靶向KRAS蛋白的化合物
实验目的:在实施例30化合物库中筛选靶向KRAS的目标化合物
实验步骤:
1.化合物库与靶点蛋白孵育
将PBST,0.25mg/mL的KRAS(溶解于PBS中),Yeast tRNA,10.2mg/mL的DEL化合物库,0.1mg/mL的BSA按下表体积加入到PCR管中,室温孵育60分钟;
将PBST,PBS,Yeast tRNA,10.2mg/mL的DEL化合物库,0.1mg/mL的BSA按表1对应体积加入到PCR管中,室温孵育60分钟,作为BSA对照组;
表1
名称 | 体积 | 终浓度 |
PBST | 69.45uL | |
KRAS或PBS | 4.4uL | 500nM |
Yeast tRNA | 10uL | 1mg/mL |
BSA | 10uL | 10ug/mL |
DEL库 | 6.15uL | 2.5nM |
2.分别对实验组和BSA组的Beads进行预处理
取160uL Beads到于PCR管中,将管子置于磁力架,待Beads吸附到管壁上、弃上清;取下PCR管,加160uL PBST重悬Beads,随后置于磁力架中、弃上清;重复以上步骤3次;Beads用160uL PBST重悬后置于4℃备用。
3.捕获/洗脱
加入20uL预处理过的Beads,室温孵育30分钟;在此期间,将水浴锅调至72℃。将孵育体系置于磁力架中,弃上清;取下PCR管,用100uL PBST重悬Beads,然后放置于磁力架中、弃上清;重复该步骤5次;用40uL PBST重悬Beads,并转移至新的PCR管中;置于72℃水浴锅中5分钟。将PCR管置于磁力架中,取上清至新的PCR管中;在上清中加10uL预处理过的Beads,室温孵育10分钟;上清用于下一轮的筛选。
4.进行2轮/3轮筛选
2轮:将步骤3获得的上清中按照表2加入相应的试剂,注意BSA组加PBS、实验组加相应的靶点蛋白;室温孵育30分钟;重复步骤3;
表2
名称 | 体积 |
KRAS或PBS | 4.4uL |
Yeast tRNA | 10uL |
BSA | 10uL |
3轮:重复步骤3,将样品置于磁力架中,上清(≈40uL)用于后续的PCR分析。
5.使用PCR(Bio-Rad T100 PCR仪)/NGS
PCR 50uL体系,按表3条件进行:
表3
制作4%琼脂糖凝胶;取10uL PCR样品跑胶分析,结果展示于附图4中。
实施例32 PCR样品的NGS分析
对实施例31所述的PCR样品进行NGS分析,具体的步骤如下:
1.文库构建:使用试剂盒进行文库构建。具体过程如下:用>50ng PCR纯化产物(原液需进行切胶或磁珠纯化)直接进行文库构建。通过End Prep Enzyme Mix进行末端修复(包括5’末端磷酸化和3’末端加A’),两端加测序接头。再使用DNA Clean Beads纯化片段,最后用P5和P7引物进行扩增。使用Qseq100生物分析仪(Bioptic,Taiwan,China)检测文库质量,并且通过Qubit 3.0检测文库浓度。
2.测序:DNA文库混合后,按Illumina Novaseq(Illumina,San Diego,CA,USA),由NovaSeq自带的NovaSeq Control Software(NCS)+OLB+GAPipeline-1.6读取序列信息。
3.数据分析-测序数据质量分析:对下机的原始数据进行初步统计分析。然后使用Cutadapt[1](version 1.9.1)软件对原始数据进行优化处理,去除引物及接头序列、两端质量值低于20的碱基及N碱基比率大于10%的序列,并对QC后的clean data数据进行统计分析。使用Pandaseq[2](version 2.7)根据两个读段Read1和Read2间的overlap区对CleanReads进行合并,生成完整序列,并统计分析合并后的序列长度分布等信息。
数据拆分:根据barcode序列进行数据拆分,并统计拆分结果。
Tag序列丰度统计:根据Tag序列上下游恒定区序列进行锚定,得到Tag序列。将Tag序列划分为不同Building Block对应的序列单元,分析每个序列单元是否属于BuildingBlock对应的DNA序列集合,若属于则将该序列提取出来,并且进行丰度统计。
由附图5可知,丰度值有明显差异,选取重复次数高的序列进行后续验证。
实施例33筛到的化合物SPR分析
1.蛋白的固定:
采用NTA芯片进行蛋白固定,固定前,用0.5M EDTA(pH8.0)和100mM NaOH将芯片分别再生120s活化芯片,将KRAS蛋白用分析缓冲液稀释至5μg/mL,流速设置为10μL/min,在测试通道进样360s捕获KRAS蛋白,并用PBS缓冲液冲洗测试通道90s至蛋白捕获稳定。
2.样品测试条件:
以含有0.05%吐温-20以及5%DMSO的PBS缓冲液pH 7.4作为运行缓冲液,将运行缓冲液作为对照测试样品,设置系列浓度(0.1953μM,0.3906μM,0.7812μM,1.5625μM,3.125μM,6.25μM,12.5μM,25μM,50μM,100μM),样品分析时设置流速为30μL/min,结合时间为90s,解离时间为300s。同时,设置8个梯度浓度的含DMSO缓冲液进行溶剂矫正。
3.参数拟合:
实验采用多循环运行,其响应信号以分析时间为横坐标,响应值为纵坐标。对溶剂矫正后所得数据进行双参比扣减,通过BIAcore T200分析软件进行拟合,所采用的拟合模型为1:1Langmuir结合模型,确定其结合解离常数等亲和力指标。解离常数的指标见表格4
表4筛到的化合物与对应的解离常数
化合物 | 解离常数KD值(μM) |
化合物A QHL-41-04 | 27.43 |
化合物B QHL-41-05 | 27.46 |
化合物C QHL-41-03 | 36.31 |
结论:测试结果图展示于附图6,从表格中数据可知,从库中筛到的化合物与靶点蛋白均有一定的结合能力,证明钓到了目标化合物。
实施例34用合成好的DEL库筛选靶向DLL3蛋白的化合物
实验目的:在实施例30的化合物库中筛选靶向K-RAS的目标化合物
实验步骤:
1.化合物库与靶点蛋白孵育
将PBST,40.2mg/mL的DLL3(溶解于PBS中),Yeast tRNA,10.2mg/mL的DEL化合物库,0.1mg/mL的BSA按下表体积加入到PCR管中,室温孵育60分钟;
将PBST,PBS,Yeast tRNA,10.2mg/mL的DEL化合物库,0.1mg/mL的BSA按表1对应体积加入到PCR管中,室温孵育60分钟,作为BSA对照组;
表5
名称 | 体积 | 终浓度 |
PBST | 10.85uL | |
DLL3或PBS | 63uL | 500nM |
Yeast tRNA | 10uL | 1mg/mL |
BSA | 10uL | 10ug/mL |
DEL库 | 6.15uL | 2.5nM |
2.分别对实验组和BSA组的Beads进行预处理
取160uL Beads到于PCR管中,将管子置于磁力架,待Beads吸附到管壁上、弃上清;取下PCR管,加160uL PBST重悬Beads,随后置于磁力架中、弃上清;重复以上步骤3次;Beads用160uL PBST重悬后置于4℃备用。
3.捕获/洗脱
加入20uL预处理过的Beads,室温孵育30分钟;在此期间,将水浴锅调至72℃。将孵育体系置于磁力架中,弃上清;取下PCR管,用100uL PBST重悬Beads,然后放置于磁力架中、弃上清;重复该步骤5次;用40uL PBST重悬Beads,并转移至新的PCR管中;置于72℃水浴锅中5分钟。将PCR管置于磁力架中,取上清至新的PCR管中;在上清中加10uL预处理过的Beads,室温孵育10分钟;上清用于下一轮的筛选。
4.进行2轮/3轮筛选
2轮--将步骤3获得的上清中按照表2加入相应的试剂,注意BSA组加PBS、实验组加相应的靶点蛋白;室温孵育30分钟;重复步骤3;
表6
名称 | 体积 |
DLL3或PBS | 63uL |
Yeast tRNA | 10uL |
BSA | 10uL |
3轮--重复步骤3,将样品置于磁力架中,上清(≈40uL)用于后续的PC分析。
5.使用PCR(Bio-Rad T100 PCR仪)/NGS
PCR 50uL体系,按表3条件进行:
表7
制作4%琼脂糖凝胶;取10uL PCR样品跑胶分析。结果展示于附图7。
结论:经过三轮的筛选、富集,500nM的DLL3蛋白可以从2.5nM的DEL文库可以筛选到与其相互作用的片段。
实施例35 PCR样品的NGS分析
对实施例34所述的PCR样品进行NGS分析,具体的步骤如下:
1.文库构建:使用试剂盒进行文库构建。具体过程如下:用>50ng PCR纯化产物(原液需进行切胶或磁珠纯化)直接进行文库构建。通过End Prep Enzyme Mix进行末端修复(包括5’末端磷酸化和3’末端加’A’),两端加测序接头。再使用DNA Clean Beads纯化片段,最后用P5和P7引物进行扩增。使用Qseq100生物分析仪(Bioptic,Taiwan,China)检测文库质量,并且通过Qubit 3.0检测文库浓度。
2.测序:DNA文库混合后,按Illumina Novaseq(Illumina,San Diego,CA,USA),由NovaSeq自带的NovaSeq Control Software(NCS)+OLB+GAPipeline-1.6读取序列信息。
3.数据分析-测序数据质量分析:对下机的原始数据进行初步统计分析。然后使用Cutadapt[1](version 1.9.1)软件对原始数据进行优化处理,去除引物及接头序列、两端质量值低于20的碱基及N碱基比率大于10%的序列,并对QC后的clean data数据进行统计分析。使用Pandaseq[2(]version 2.7)根据两个读段Read1和Read2间的overlap区对CleanReads进行合并,生成完整序列,并统计分析合并后的序列长度分布等信息。
数据拆分:根据barcode序列进行数据拆分,并统计拆分结果。
Tag序列丰度统计:根据Tag序列上下游恒定区序列进行锚定,得到Tag序列。将Tag序列划分为不同Building Block对应的序列单元,分析每个序列单元是否属于BuildingBlock对应的DNA序列集合,若属于则将该序列提取出来,并且进行丰度统计。由附图8可知,丰度值有明显差异,选取重复次数高的序列进行后续验证。
实施例36筛到的化合物FACS分析
将实施例35得到的化合物连接FITC之后与DLL3过表达的CT-26细胞孵育后进行流式细胞仪分析,具体步骤如下:
1将CT-26细胞从25cm3的培养瓶中消化、重悬后进行计数,种植到96孔板中,1×105细胞/孔;
2将化合物按不同浓度配置到培养基中,混匀后加入到96孔板,置于37℃培养箱中孵育6小时;
3将96孔板1000rpm、离心5分钟,弃上清;100uL/孔0.25%胰酶消化2分钟,离心弃上清;用PBS+2%FBS重悬细胞,200uL/孔。
4对细胞进行流式细胞仪上机分析,选择绿色荧光通道。具体结果见附图9。
结论:附图9的数据(自上而下分别是DMSO、2.5uM化合物、5uM化合物、10uM化合物的数据)可知,从库中筛到的化合物与DLL过表达CT-26细胞的结合有浓度依赖性。
综上所述,上述各实施例仅为本发明的较佳实施例而已,并不用以限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,皆应包含在本发明的保护范围内。
Claims (60)
1.一种环状化合物库的构建方法,其特征在于,包括以下步骤:
1)将固相载体G直接或间接与含光可裂解基团的分子M相连接,得到G—M;
2)进行方法1、方法2或方法3中的任一种;
方法1:按步骤a1~g1进行;
a1.将G—M与关环A端分子A反应相连接,得到G—M—A;
b1.将G—M—A与具有至少三官能团的连接分子L1反应相连接,得到G—M—A—L1;
c1.将G—M—A—L1与起始核苷酸分子HP、开放引物OP依次反应,其中起始核苷酸分子HP与连接分子L1相连接,得到G—M—A—L1—HP—OP;
d1.将上一步所得产物分别与合成砌块C1、合成砌块C1所对应的DNA标签tag1反应,使合成砌块C1与L1相连接,DNA标签tag1与OP相连接,得到G—M—A—L1(—HP—OP—tag1)—C1;
e1.定义一组相对应的合成砌块和DNA标签的连接反应为一个扩展步骤,重复所述扩展步骤,使合成砌块依次拼接形成延长的链,以及使合成砌块所对应的DNA标签依次拼接形成延长的链,得到G—M—A—L1(—HP—OP—tag1—……—tagn)—C1—……—Cn;其中2≤n≤7且n为正整数;
f1.将上一步所得产物与关环B端分子B、封闭引物CP反应,使关环B端分子B与Cn相连接,以及使封闭引物CP与tagn相连接,其中HP—OP—tag1—……—tagn—CP形成完整的DNA编码序列,分别得到G—M—A—L1(—DNA)—C1—……—Cn—B,即化合物库S1”;
g1.将上一步所得产物在光源下进行分解反应,使M与A断开,得到A—L1(—DNA)—C1—……—Cn—B,即化合物库S1’;
方法2:按步骤a2~g2进行,其中步骤e2和步骤f2的顺序可交换;
a2.将G—M与具有至少三官能团的连接分子L1反应相连接,得到G—M—L1;
b2.将G—M—L1与起始核苷酸分子HP、开放引物OP依次反应,其中起始核苷酸分子HP与固相载体G相连接,得到OP—HP—G—M—L1;
c2.将OP—HP—G—M—L1与合成砌块C1、合成砌块C1所对应的DNA标签tag1反应,使合成砌块C1与L1相连接,DNA标签tag1与OP相连接,得到tag1—OP—HP—G—M—L1—C1;
d2.定义一组相对应的合成砌块和DNA标签的连接反应为一个扩展步骤,重复所述扩展步骤,使合成砌块依次拼接形成延长的链,以及使合成砌块所对应的DNA标签依次拼接形成延长的链,得到tagn—……—tag1—OP—HP—G—M—L1—C1……—Cn;其中0≤n≤7,n 为整数;
e2.将上一步所得产物与关环A端分子A反应,使关环A端分子A与Cn相连接;
f2.将上一步所得产物按照所述扩展步骤与合成砌块Cn+1,……,Cn+m及其所对应的DNA标签tagn+1,……,tagn+m依次反应,使合成砌块Cn+1与连接分子L1相连接且DNA标签tagn+1与tagn相连接;经过步骤e2和步骤f2得到tagn+m—……—tag1—OP—HP—G—M—L1(—C1……—Cn—A)—Cn+1……—Cn+m;其中0≤n≤7,0≤m≤7,n和m均为整数,且2≤n+m≤7;
g2.将上一步所得产物与关环B端分子B、封闭引物CP反应,使关环B端分子B与Cn+m相连接,以及使封闭引物CP与tagn+m相连接,其中HP—OP—tag1—……—tagn+m—CP形成完整的DNA编码序列,得到DNA—G—M—L1(—C1……—Cn—A)—Cn+1……—Cn+m—B,即化合物库S2’;
方法3:按步骤a3~g3进行,其中步骤e3和步骤f3的顺序可交换;
a3.将G—M与具有至少四官能团的连接分子L1反应相连接,得到G—M—L1;
b3.将G—M—L1与起始核苷酸分子HP、开放引物OP依次反应,其中起始核苷酸分子HP与连接分子L1相连接,得到G—M—L1—HP—OP;
c3.将G—M—L1—HP—OP与合成砌块C1、合成砌块C1所对应的DNA标签tag1反应,使合成砌块C1与连接分子L1相连接,DNA标签tag1与OP相连接,得到G—M—L1(—HP—OP—tag1)—C1;
d3.定义一组相对应的合成砌块和DNA标签的连接反应为一个扩展步骤,重复所述扩展步骤,使合成砌块依次拼接形成延长的链,以及使合成砌块所对应的DNA标签依次拼接形成延长的链,得到G—M—L1(—HP—OP—tag1……—tagn)—C1……—Cn;其中2≤n≤7且n为正整数;
e3.将上一步所得产物与关环A端分子A反应,使关环A端分子A与Cn相连接;
f3.将上一步所得产物按照所述扩展步骤与合成砌块Cn+1,……,Cn+m及其所对应的DNA标签tagn+1,……,tagn+m依次反应,使合成砌块Cn+1与连接分子L1相连接且DNA标签tagn+1与tagn相连接;经过步骤e3和步骤f3得到G—M—L1(—HP—OP—tag1……—tagn+m)(—C1……—Cn—A)—Cn+1……—Cn+m;其中0≤n≤7,0≤m≤7,n和m均为整数,且2≤n+m≤7;
g3.将上一步所得产物与关环B端分子B、封闭引物CP反应,使关环B端分子B与Cn+m相连接,以及使封闭引物CP与tagn+m相连接,其中HP—OP—tag1—……—tagn+m—CP形成完整的DNA编码序列,得到G—M—L1(—DNA)(—C1……—Cn—A)—Cn+1……—Cn+m—B,即化合物库S3’;
2.如权利要求1所述的方法,其特征在于,所述固相载体G选自PEG树脂、PEGA树脂、TentaGel树脂、固相载体CPG中的任意一种或多种。
3.如权利要求2所述的方法,其特征在于,所述固相载体G具有一个活性官能团R1,R1为氨基;或者所述固相载体G具有两个活性官能团R1和R1’,R1为氨基,R1’为羧基。
4.如权利要求1所述的方法,其特征在于,所述含光可裂解基团的分子M含有至少两个活性官能团,分别用R2和R3表示;R2是负责连接固相载体G的活性官能团,R3是负责连接关环A端分子A或者连接分子L1的活性官能团。
5.如权利要求4所述的方法,其特征在于,R2以未经保护基团保护的形式存在,R3以经保护基团保护的形式存在。
8.如权利要求1所述的方法,其特征在于,所述关环A端分子A与关环B分子B经环合酶关环反应时,关环A端分子A脱去部分或全部分子碎片;所述关环A端分子A具有两个活性官能团R4和R5;R4是参与环合酶关环反应的活性官能团,在关环反应时被脱除;R5是负责与连接分子L1或合成砌块反应连接的活性官能团,经关环反应后R5保留在环状化合物分子的环结构中;R4和R5分别独立地以经保护基团保护的形式或未经保护基团保护的形式存在,且R4和R5相互之间不干扰对方的连接反应。
9.如权利要求8所述的方法,其特征在于,所述关环A端分子A的分子结构是由环合酶关环反应时脱去的分子碎片A1和关环反应时保留在环上的分子碎片A0两部分组成;R4是位于环合酶关环反应时脱去的分子碎片A1上,R5是位于关环反应时保留在环上的分子碎片A0上。
10.如权利要求9所述的方法,其特征在于,分子碎片A0结构中具有位阻基团,位阻基团与R5直接连接;位阻基团为由一个或多个氨基酸构成的氨基酸残基。
11.如权利要求10所述的方法,其特征在于,所述位阻基团为由1~10个氨基酸构成的氨基酸残基。
12.如权利要求8所述的方法,其特征在于,R4以未经保护基团保护的形式存在,R5以经保护基团保护的形式存在。
13.如权利要求8所述的方法,其特征在于,R4是与含光可裂解基团的分子M的R3互补配对的活性官能团。
14.如权利要求9所述的方法,其特征在于,关环A端分子A的分子结构中脱去的分子碎片A1的结构为由一个氨基酸或多个氨基酸构成的氨基酸残基。
15.如权利要求9所述的方法,其特征在于,关环A端分子A的分子结构中脱去部分A1的氨基酸氨基序列为:FAGDDAE、AYDGE、OCam-Leu、FL、AL、GL、HL或HV。
16.如权利要求8所述的方法,其特征在于,关环A端分子A是由至少3个氨基酸组成的肽链。
17.如权利要求1所述的方法,其特征在于,所述方法1中,连接分子L1具有至少三个活性官能团R6、R7和R8;R6、R7和R8可以分别独立地以经保护基团保护的形式或未经保护基团保护的形式存在,且R6、R7和R8相互之间不干扰对方的连接反应;R6是与关环A端分子A上的活性官能团R5互补配对的活性官能团,R7是与起始核苷酸分子HP反应拼接的活性官能团,R8是与合成砌块C1反应拼接的活性官能团。
18.如权利要求1所述的方法,其特征在于,所述方法2中,连接分子L1具有至少三个活性官能团R6、R7和R8;R6、R7和R8可以分别独立地以经保护基团保护的形式或未经保护基团保护的形式存在,且R6、R7和R8相互之间不干扰对方的连接反应;R6是与含光可裂解基团的分子M的活性官能团R3互补配对的活性官能团,R7是与合成砌块C1反应拼接的活性官能团,R8是与合成砌块Cn+1反应拼接的活性官能团。
19.如权利要求1所述的方法,其特征在于,所述方法3中,连接分子L1具有至少四个活性官能团R6、R6’、R7和R8;R6、R6’、R7和R8可以分别独立地以经保护基团保护的形式或未经保护基团保护的形式存在,且R6、R6’、R7和R8相互之间不干扰对方的连接反应;R6是与含光可裂解基团的分子M的活性官能团R3互补配对的活性官能团,R6’是与起始核苷酸分子HP反应拼接的活性官能团,R7是与合成砌块C1反应拼接的活性官能团,R8是与合成砌块Cn+1反应拼接的活性官能团。
20.如权利要求19所述的方法,其特征在于,连接分子L1包含一个可分解的官能团RL,RL分解时使连接分子L1分裂为两个分子碎片,所述两个分子碎片分别是:包含R6、R6’的分子碎片和包含R7、R8的分子碎片。
21.如权利要求20所述的方法,其特征在于,所述可分解的官能团RL是酸可裂解基团,或者是与所述含光可裂解基团的分子M具有不同裂解波长的光可裂解基团。
22.如权利要求20所述的方法,其特征在于,连接分子L1可以是由两个三官能团连接分子L1’、L1”,以及一个连接于L1’与L1”之间的连接分子L0组成,可分解的官能团RL是在连接分子L0的分子结构内;其中,L1’具有三个活性官能团R6、R6’和R6”,L1”具有三个活性官能团R7、R8和R8’,L0具有两个活性官能团R7和R7’,且R7与R6”互补配对反应连接,R7’与R8’互补配对反应连接。
24.如权利要求1所述的方法,其特征在于,起始核苷酸分子HP具有活性官能团R9,R9与连接分子L1的活性官能团、或固相载体G的活性官能团互补配对反应。
25.如权利要求24所述的方法,其特征在于,起始核苷酸分子HP的活性官能团R9为氨基,与R9互补配对反应的连接分子L1的活性官能团或固相载体G的活性官能团为羧基。
26.如权利要求1所述的方法,其特征在于,所述合成砌块是具有至少有两个活性官能团的小分子化合物。
27.如权利要求26所述的方法,其特征在于,所述方法1中,各合成砌块依次拼接,合成砌块C1的第一活性官能团负责与连接分子L1拼接,后续各合成砌块的第一活性官能团依次与前一个合成砌块的第二活性官能团拼接,合成砌块Cn的第二活性官能团负责与关环B端分子B拼接;第一活性官能团与第二活性官能团不同时以未经保护基团保护的形式存在,第一活性官能团与第二活性官能团相互不干扰。第三个官能团以保护基保护的形式存在,可以用于后续的化合物修饰及调整。
28.如权利要求26所述的方法,其特征在于,所述方法2或方法3中,合成砌块C1的第一活性官能团负责与连接分子L1的一个活性官能团拼接,C1至Cn之间的各合成砌块以及合成砌块Cn的第一活性官能团依次与前一个合成砌块的第二活性官能团拼接,合成砌块Cn的第二活性官能团负责与关环A端分子A拼接;合成砌块Cn+1的第一活性官能团负责与连接分子L1的另一个活性官能团拼接,Cn+1至Cn+m之间的各合成砌块以及合成砌块Cn+m的第一活性官能团依次与前一个合成砌块的第二活性官能团拼接,合成砌块Cn+m的第二活性官能团负责与关环B端分子B拼接;第一活性官能团与第二活性官能团不同时以未经保护基团保护的形式存在,第一活性官能团与第二活性官能团相互不干扰。
29.如权利要求27或28所述的方法,其特征在于,相邻合成砌块之间是通过以下化学键进行连接:酰胺键、或酯键、酰胺键、酯键、醚键、胺键或亚胺键。
30.如权利要求26所述的方法,其特征在于,合成砌块为同时具有氨基和羧基的双活性官能团的化合物。
31.如权利要求26所述的方法,其特征在于,合成砌块选自取代或未取代的二羧酸、取代或未取代的二胺、取代或未取代的二醇、α,β-不饱和醛、α,β-不饱和酮、α,β-不饱和酸、含有活性基团(羟基、胺基、醛基、羧基、磺酸酯或卤素)的碳碳双键或碳碳三键、含有两个及以上活性基团的芳环化合物、天然氨基酸或者非天然氨基酸,N-取代的氨基酸。
32.如权利要求26所述的方法,其特征在于,合成砌块还包括骨架结构,所述骨架结构被连接于环内或者以环的侧链形式连接于环上。
33.如权利要求32所述的方法,其特征在于,各所述合成砌块中的至少一个含有骨架结构,且该骨架结构具有E3连接酶底物结构,能与E3连接酶结合。
35.如权利要求32所述的方法,其特征在于,所述合成砌块中,各合成砌块共含有至少一条环外侧链。
36.如权利要求32所述的方法,其特征在于,所述合成砌块中,各合成砌块共含有至少两条环外侧链,且其中至少两条环外侧链通过化学反应连接,形成了双环结构。
37.如权利要求32所述的方法,其特征在于,所述DNA标签是通过DNA连接酶依次连接;在一个扩展步骤中,完成一个DNA标签及与该DNA标签对应的合成砌块的拼接反应,使合成砌块的链和DNA标签的链分别延长。
38.如权利要求1所述的方法,其特征在于,所述关环B端分子B是具有双活性官能团的化合物,两个活性官能团分别用R10、R11表示;R10是用于与最末合成砌块的第二活性官能团反应拼接的活性官能团,R11是负责关环反应的活性官能团;R10和R11可以分别独立地以经保护基团保护的形式或未经保护基团保护的形式存在,且R10和R11相互之间不干扰对方的连接反应。
39.如权利要求38所述的方法,其特征在于,R10以未经保护基团保护的形式存在,R11以经保护基团保护的形式存在。
40.如权利要求38所述的方法,其特征在于,关环B端分子B的两个活性官能团R10和R11,其中一个为氨基,另一个为羧基。
41.如权利要求40所述的方法,其特征在于,关环B端分子B是由2至10个氨基酸组成的肽链。
42.如权利要求40所述的方法,其特征在于,关环B端分子B为Fmoc保护的二肽。
43.如权利要求40所述的方法,其特征在于,关环B端分子B的分子结构具有氨基酸残基GL、LL、QL、KL、GF、GI。
44.如权利要求1所述的方法,其特征在于,所述步骤3)中,将化合物库S1’、S2’或S3’在环合酶作用下进行关环反应,使关环A端分子A与关环B端分子B反应形成酰胺键,而成环;在成环反应中,关环B端分子B的游离末端活性官能团与关环A端分子A反应,使关环A端分子A脱去部分或全部分子碎片,且关环B端分子B的游离末端活性官能团与脱去后的剩余部分连接形成环结构;所述环合酶选自连接酶VyPAL2、Butelase1、PatG、PagG、ominiligase-1、PCY1或OaAEP1B&3-5。
45.如权利要求44所述的方法,其特征在于,所形成的环结构可以为单环或双环或者带侧链的环状结构。
46.如权利要求44所述的方法,其特征在于,酶关环反应温度为25~45℃;优选的,酶关环反应温度为30~45℃;更优选的,酶关环反应温度为35~40℃。
47.如权利要求44所述的方法,其特征在于,酶关环反应的pH值范围为4.5~6.0;优选的,酶关环反应的pH值范围为4.8~5.5;更优选的,酶关环反应的pH值范围为4.9~5.3。
48.如权利要求44所述的方法,其特征在于,酶关环反应的反应时间为12~48小时;优选的,酶关环反应的反应时间为18~36小时;更优选的,酶关环反应的反应时间为20~24小时。
49.如权利要求44所述的方法,其特征在于,酶关环反应中使用醋酸钠缓冲溶液调节pH值。
50.如权利要求44所述的方法,其特征在于,酶关环反应体系中加入乙二胺四乙酸二钠、氯化钠和TCEP。
56.如权利要求52-55任一项所述的环状化合物库,其特征在于,各所述合成砌块分别独立的选自取代或未取代的氨基酸、取代或未取代的二羧酸、取代或未取代的二胺、取代或未取代的二醇、α,β-不饱和醛、α,β-不饱和酮、α,β-不饱和酸、天然氨基酸或者非天然氨基酸,N-取代的氨基酸。
57.如权利要求56所述的环状化合物库,其特征在于,各所述合成砌块中,至少一个合成砌块含有骨架结构,且该骨架结构具有E3连接酶底物结构,能与E3连接酶结合。
59.如权利要求57所述的环状化合物库,其特征在于,各所述合成砌块中,各合成砌块共含有至少一条环外侧链。
60.如权利要求57所述的环状化合物库,其特征在于,各所述合成砌块中,各合成砌块共含有至少两条环外侧链,且至少两条环外侧链通过化学反应连接形成双环结构。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110291745 | 2021-03-18 | ||
CN2021102917458 | 2021-03-18 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115142141A true CN115142141A (zh) | 2022-10-04 |
Family
ID=83321530
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210148962.6A Pending CN115142141A (zh) | 2021-03-18 | 2022-02-18 | 环状化合物库及其构建方法 |
Country Status (7)
Country | Link |
---|---|
EP (1) | EP4309665A1 (zh) |
JP (1) | JP2024510477A (zh) |
KR (1) | KR20230157474A (zh) |
CN (1) | CN115142141A (zh) |
AU (1) | AU2022240523A1 (zh) |
CA (1) | CA3212636A1 (zh) |
WO (1) | WO2022193902A1 (zh) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2980297A (en) * | 1996-06-10 | 1998-01-07 | Laboratory Of Molecular Biophotonics | Photocleavable cyclic oligonucleotide |
GB0914110D0 (en) | 2009-08-12 | 2009-09-16 | Medical Res Council | Peptide libraries |
DK2914607T3 (da) * | 2012-10-04 | 2018-01-29 | Ventana Med Syst Inc | Fotospaltbare linkermolekyler med diarylsulphidhovedkæde til transient biokonjugatsyntese |
CN107130300A (zh) * | 2016-10-08 | 2017-09-05 | 深圳劲宇生物科技有限公司 | 一种dna编码分子库的合成方法及dna模板 |
GB201714372D0 (en) * | 2017-09-07 | 2017-10-25 | Univ Court Univ St Andrews | Macrocyclisation tags |
WO2019168654A2 (en) * | 2018-02-09 | 2019-09-06 | President And Fellows Of Harvard College | Dna-templated macrocycle library |
-
2022
- 2022-02-18 CA CA3212636A patent/CA3212636A1/en active Pending
- 2022-02-18 JP JP2023556939A patent/JP2024510477A/ja active Pending
- 2022-02-18 KR KR1020237035469A patent/KR20230157474A/ko unknown
- 2022-02-18 AU AU2022240523A patent/AU2022240523A1/en active Pending
- 2022-02-18 CN CN202210148962.6A patent/CN115142141A/zh active Pending
- 2022-02-18 EP EP22770257.8A patent/EP4309665A1/en active Pending
- 2022-02-18 WO PCT/CN2022/076774 patent/WO2022193902A1/zh active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JP2024510477A (ja) | 2024-03-07 |
CA3212636A1 (en) | 2022-09-22 |
AU2022240523A1 (en) | 2023-09-21 |
WO2022193902A1 (zh) | 2022-09-22 |
KR20230157474A (ko) | 2023-11-16 |
EP4309665A1 (en) | 2024-01-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mäde et al. | Automated solid-phase peptide synthesis to obtain therapeutic peptides | |
AU686186B2 (en) | Topologically segregated, encoded solid phase libraries | |
Huang et al. | Facile synthesis of C-terminal peptide hydrazide and thioester of NY-ESO-1 (A39-A68) from an Fmoc-hydrazine 2-chlorotrityl chloride resin | |
Ollivier et al. | Tidbits for the synthesis of bis (2‐sulfanylethyl) amido (SEA) polystyrene resin, SEA peptides and peptide thioesters | |
CN111040020B (zh) | 一种烯烃硫醚类订书肽及其制备方法与应用 | |
AU2016251857B2 (en) | Method and composition for peptide cyclization and protease treatment | |
Openy et al. | Solid‐Phase Peptide Modification via Deaminative Photochemical Csp3‐Csp3 Bond Formation Using Katritzky Salts | |
Nakamura et al. | Synthesis of peptide thioesters via an N–S acyl shift reaction under mild acidic conditions on an N‐4, 5‐dimethoxy‐2‐mercaptobenzyl auxiliary group | |
CN115142141A (zh) | 环状化合物库及其构建方法 | |
US6492460B2 (en) | Linker based solid support for peptide and small molecule organic synthesis | |
CA2458084A1 (en) | Novel process for octreotide synthesis | |
Nuijens et al. | Enzymatic fragment condensation of side chain‐protected peptides using subtilisin A in anhydrous organic solvents: a general strategy for industrial peptide synthesis | |
Wysocka et al. | PEGylated substrates of NSP4 protease: A tool to study protease specificity | |
WO2003062417A1 (fr) | Produit de ligation arn-adn, et utilisation correspondante | |
Manabe et al. | Facile peptide thioester synthesis via solution-phase tosylamide preparation | |
Nagalingam et al. | Avoidance of epimerization in the synthesis of peptide thioesters using Fmoc protection | |
EP3497446B1 (en) | Method and composition for detection of peptide cyclization using protein tags | |
Sucholeiki et al. | An affinity chromatographic method for the purification of water-insoluble peptides | |
CN111690039A (zh) | 识别6xHis标签蛋白的自组装多肽探针、制备方法及其应用 | |
WO1999031124A1 (en) | Cholic acid-based scaffolds for multidimensional molecular presentation of peptides | |
CN115467029A (zh) | 环状化合物库的化学关环构建方法及环状化合物库 | |
Arbour | Harnessing the Reactivity of the N-Methyl Diaminobenzoyl Linker to Access C-Terminally Modified and Macrocyclic Peptides | |
US20200308310A1 (en) | Novel modified cellulose, method for preparing the same and use thereof | |
de Koning et al. | Reactivity of PNA thioesters in chemical ligation reactions | |
ES2743448T3 (es) | Procedimiento y composición del polipéptido de andamio de anticuerpo de vaca |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |