CN113636931B - 基因编码化合物库起始头片段化合物及其在基因编码化合物库合成上的应用 - Google Patents
基因编码化合物库起始头片段化合物及其在基因编码化合物库合成上的应用 Download PDFInfo
- Publication number
- CN113636931B CN113636931B CN202110896391.XA CN202110896391A CN113636931B CN 113636931 B CN113636931 B CN 113636931B CN 202110896391 A CN202110896391 A CN 202110896391A CN 113636931 B CN113636931 B CN 113636931B
- Authority
- CN
- China
- Prior art keywords
- compound
- oligonucleotide
- gene
- library
- reaction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 150000001875 compounds Chemical class 0.000 title claims abstract description 404
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 138
- 239000012634 fragment Substances 0.000 title claims abstract description 64
- 230000015572 biosynthetic process Effects 0.000 title abstract description 33
- 238000003786 synthesis reaction Methods 0.000 title abstract description 33
- 108091034117 Oligonucleotide Proteins 0.000 claims abstract description 129
- 238000006243 chemical reaction Methods 0.000 claims abstract description 96
- 125000003277 amino group Chemical group 0.000 claims abstract description 28
- 239000000243 solution Substances 0.000 claims description 78
- -1 2, 5-dioxapyrrolidin-1-yl carboxylic ester Chemical group 0.000 claims description 73
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 claims description 57
- 238000000034 method Methods 0.000 claims description 51
- 229910021538 borax Inorganic materials 0.000 claims description 37
- 235000010339 sodium tetraborate Nutrition 0.000 claims description 37
- BSVBQGMMJUBVOD-UHFFFAOYSA-N trisodium borate Chemical compound [Na+].[Na+].[Na+].[O-]B([O-])[O-] BSVBQGMMJUBVOD-UHFFFAOYSA-N 0.000 claims description 37
- 239000000872 buffer Substances 0.000 claims description 30
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 28
- ZMANZCXQSJIPKH-UHFFFAOYSA-N Triethylamine Chemical group CCN(CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-N 0.000 claims description 24
- 239000000203 mixture Substances 0.000 claims description 22
- 239000007853 buffer solution Substances 0.000 claims description 18
- 230000000977 initiatory effect Effects 0.000 claims description 17
- 108020004707 nucleic acids Proteins 0.000 claims description 15
- 150000007523 nucleic acids Chemical class 0.000 claims description 15
- 102000039446 nucleic acids Human genes 0.000 claims description 15
- JGFZNNIVVJXRND-UHFFFAOYSA-N N,N-Diisopropylethylamine (DIPEA) Chemical compound CCN(C(C)C)C(C)C JGFZNNIVVJXRND-UHFFFAOYSA-N 0.000 claims description 13
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 claims description 12
- 150000001732 carboxylic acid derivatives Chemical class 0.000 claims description 12
- WKBOTKDWSSQWDR-UHFFFAOYSA-N Bromine atom Chemical compound [Br] WKBOTKDWSSQWDR-UHFFFAOYSA-N 0.000 claims description 7
- GDTBXPJZTBHREO-UHFFFAOYSA-N bromine Substances BrBr GDTBXPJZTBHREO-UHFFFAOYSA-N 0.000 claims description 7
- 229910052794 bromium Inorganic materials 0.000 claims description 7
- 239000007810 chemical reaction solvent Substances 0.000 claims description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 7
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 claims description 6
- ZMXDDKWLCZADIW-UHFFFAOYSA-N N,N-Dimethylformamide Chemical compound CN(C)C=O ZMXDDKWLCZADIW-UHFFFAOYSA-N 0.000 claims description 6
- 229910017053 inorganic salt Inorganic materials 0.000 claims description 6
- 239000000178 monomer Substances 0.000 claims description 5
- 238000006116 polymerization reaction Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 230000035484 reaction time Effects 0.000 claims description 5
- 239000007858 starting material Substances 0.000 claims description 5
- GQHTUMJGOHRCHB-UHFFFAOYSA-N 2,3,4,6,7,8,9,10-octahydropyrimido[1,2-a]azepine Chemical compound C1CCCCN2CCCN=C21 GQHTUMJGOHRCHB-UHFFFAOYSA-N 0.000 claims description 4
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 claims description 4
- 125000003118 aryl group Chemical group 0.000 claims description 4
- 239000011259 mixed solution Substances 0.000 claims description 4
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 4
- 125000003161 (C1-C6) alkylene group Chemical group 0.000 claims description 3
- 125000006552 (C3-C8) cycloalkyl group Chemical group 0.000 claims description 3
- DKGAVHZHDRPRBM-UHFFFAOYSA-N Tert-Butanol Chemical compound CC(C)(C)O DKGAVHZHDRPRBM-UHFFFAOYSA-N 0.000 claims description 3
- 125000000217 alkyl group Chemical group 0.000 claims description 3
- 150000001408 amides Chemical class 0.000 claims description 3
- 239000001257 hydrogen Substances 0.000 claims description 3
- 229910052739 hydrogen Inorganic materials 0.000 claims description 3
- 125000004435 hydrogen atom Chemical class [H]* 0.000 claims description 3
- 150000007530 organic bases Chemical class 0.000 claims description 3
- 239000001301 oxygen Substances 0.000 claims description 3
- 229910052760 oxygen Inorganic materials 0.000 claims description 3
- FXHOOIRPVKKKFG-UHFFFAOYSA-N N,N-Dimethylacetamide Chemical compound CN(C)C(C)=O FXHOOIRPVKKKFG-UHFFFAOYSA-N 0.000 claims description 2
- 229910019142 PO4 Inorganic materials 0.000 claims description 2
- 238000005859 coupling reaction Methods 0.000 claims description 2
- 125000005842 heteroatom Chemical group 0.000 claims description 2
- 238000010534 nucleophilic substitution reaction Methods 0.000 claims description 2
- 238000002360 preparation method Methods 0.000 claims description 2
- YLQBMQCUIZJEEH-UHFFFAOYSA-N tetrahydrofuran Natural products C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 claims description 2
- 239000007983 Tris buffer Substances 0.000 claims 1
- 125000001931 aliphatic group Chemical group 0.000 claims 1
- 150000001642 boronic acid derivatives Chemical group 0.000 claims 1
- 150000001717 carbocyclic compounds Chemical class 0.000 claims 1
- 150000004649 carbonic acid derivatives Chemical class 0.000 claims 1
- 150000001923 cyclic compounds Chemical class 0.000 claims 1
- 239000003999 initiator Substances 0.000 claims 1
- 235000021317 phosphate Nutrition 0.000 claims 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 claims 1
- 239000002904 solvent Substances 0.000 claims 1
- 239000000758 substrate Substances 0.000 abstract description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 44
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 35
- 239000007864 aqueous solution Substances 0.000 description 28
- YMWUJEATGCHHMB-UHFFFAOYSA-N Dichloromethane Chemical compound ClCCl YMWUJEATGCHHMB-UHFFFAOYSA-N 0.000 description 27
- 230000008014 freezing Effects 0.000 description 25
- 238000007710 freezing Methods 0.000 description 25
- 239000011780 sodium chloride Substances 0.000 description 22
- 238000005119 centrifugation Methods 0.000 description 20
- 238000002156 mixing Methods 0.000 description 20
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 17
- 238000001514 detection method Methods 0.000 description 17
- 102000004169 proteins and genes Human genes 0.000 description 16
- 238000012216 screening Methods 0.000 description 15
- 239000000126 substance Substances 0.000 description 14
- YYROPELSRYBVMQ-UHFFFAOYSA-N 4-toluenesulfonyl chloride Chemical compound CC1=CC=C(S(Cl)(=O)=O)C=C1 YYROPELSRYBVMQ-UHFFFAOYSA-N 0.000 description 8
- 150000002611 lead compounds Chemical class 0.000 description 8
- 235000018102 proteins Nutrition 0.000 description 8
- 239000002547 new drug Substances 0.000 description 7
- VHYFNPMBLIVWCW-UHFFFAOYSA-N 4-Dimethylaminopyridine Chemical compound CN(C)C1=CC=NC=C1 VHYFNPMBLIVWCW-UHFFFAOYSA-N 0.000 description 6
- DTQVDTLACAAQTR-UHFFFAOYSA-N Trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F DTQVDTLACAAQTR-UHFFFAOYSA-N 0.000 description 6
- 238000011161 development Methods 0.000 description 6
- 238000009509 drug development Methods 0.000 description 6
- PFYXSUNOLOJMDX-UHFFFAOYSA-N bis(2,5-dioxopyrrolidin-1-yl) carbonate Chemical compound O=C1CCC(=O)N1OC(=O)ON1C(=O)CCC1=O PFYXSUNOLOJMDX-UHFFFAOYSA-N 0.000 description 5
- GHYOCDFICYLMRF-UTIIJYGPSA-N (2S,3R)-N-[(2S)-3-(cyclopenten-1-yl)-1-[(2R)-2-methyloxiran-2-yl]-1-oxopropan-2-yl]-3-hydroxy-3-(4-methoxyphenyl)-2-[[(2S)-2-[(2-morpholin-4-ylacetyl)amino]propanoyl]amino]propanamide Chemical compound C1(=CCCC1)C[C@@H](C(=O)[C@@]1(OC1)C)NC([C@H]([C@@H](C1=CC=C(C=C1)OC)O)NC([C@H](C)NC(CN1CCOCC1)=O)=O)=O GHYOCDFICYLMRF-UTIIJYGPSA-N 0.000 description 4
- KPRZOPQOBJRYSW-UHFFFAOYSA-N 2-(aminomethyl)phenol Chemical compound NCC1=CC=CC=C1O KPRZOPQOBJRYSW-UHFFFAOYSA-N 0.000 description 4
- ABRVLXLNVJHDRQ-UHFFFAOYSA-N [2-pyridin-3-yl-6-(trifluoromethyl)pyridin-4-yl]methanamine Chemical compound FC(C1=CC(=CC(=N1)C=1C=NC=CC=1)CN)(F)F ABRVLXLNVJHDRQ-UHFFFAOYSA-N 0.000 description 4
- 229940125904 compound 1 Drugs 0.000 description 4
- 229940125773 compound 10 Drugs 0.000 description 4
- 229940125797 compound 12 Drugs 0.000 description 4
- 229940125782 compound 2 Drugs 0.000 description 4
- 229940125898 compound 5 Drugs 0.000 description 4
- ZLVXBBHTMQJRSX-VMGNSXQWSA-N jdtic Chemical compound C1([C@]2(C)CCN(C[C@@H]2C)C[C@H](C(C)C)NC(=O)[C@@H]2NCC3=CC(O)=CC=C3C2)=CC=CC(O)=C1 ZLVXBBHTMQJRSX-VMGNSXQWSA-N 0.000 description 4
- SZUVGFMDDVSKSI-WIFOCOSTSA-N (1s,2s,3s,5r)-1-(carboxymethyl)-3,5-bis[(4-phenoxyphenyl)methyl-propylcarbamoyl]cyclopentane-1,2-dicarboxylic acid Chemical compound O=C([C@@H]1[C@@H]([C@](CC(O)=O)([C@H](C(=O)N(CCC)CC=2C=CC(OC=3C=CC=CC=3)=CC=2)C1)C(O)=O)C(O)=O)N(CCC)CC(C=C1)=CC=C1OC1=CC=CC=C1 SZUVGFMDDVSKSI-WIFOCOSTSA-N 0.000 description 3
- QFLWZFQWSBQYPS-AWRAUJHKSA-N (3S)-3-[[(2S)-2-[[(2S)-2-[5-[(3aS,6aR)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]pentanoylamino]-3-methylbutanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-4-[1-bis(4-chlorophenoxy)phosphorylbutylamino]-4-oxobutanoic acid Chemical compound CCCC(NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H](NC(=O)CCCCC1SC[C@@H]2NC(=O)N[C@H]12)C(C)C)P(=O)(Oc1ccc(Cl)cc1)Oc1ccc(Cl)cc1 QFLWZFQWSBQYPS-AWRAUJHKSA-N 0.000 description 3
- UNILWMWFPHPYOR-KXEYIPSPSA-M 1-[6-[2-[3-[3-[3-[2-[2-[3-[[2-[2-[[(2r)-1-[[2-[[(2r)-1-[3-[2-[2-[3-[[2-(2-amino-2-oxoethoxy)acetyl]amino]propoxy]ethoxy]ethoxy]propylamino]-3-hydroxy-1-oxopropan-2-yl]amino]-2-oxoethyl]amino]-3-[(2r)-2,3-di(hexadecanoyloxy)propyl]sulfanyl-1-oxopropan-2-yl Chemical compound O=C1C(SCCC(=O)NCCCOCCOCCOCCCNC(=O)COCC(=O)N[C@@H](CSC[C@@H](COC(=O)CCCCCCCCCCCCCCC)OC(=O)CCCCCCCCCCCCCCC)C(=O)NCC(=O)N[C@H](CO)C(=O)NCCCOCCOCCOCCCNC(=O)COCC(N)=O)CC(=O)N1CCNC(=O)CCCCCN\1C2=CC=C(S([O-])(=O)=O)C=C2CC/1=C/C=C/C=C/C1=[N+](CC)C2=CC=C(S([O-])(=O)=O)C=C2C1 UNILWMWFPHPYOR-KXEYIPSPSA-M 0.000 description 3
- DGDXDTSUVOEPFK-UHFFFAOYSA-N 1-carboxyprop-2-enylazanium;chloride Chemical compound Cl.C=CC(N)C(O)=O DGDXDTSUVOEPFK-UHFFFAOYSA-N 0.000 description 3
- MZYXHLMULHPGKX-UHFFFAOYSA-N 2-(2h-tetrazol-5-yl)ethanamine Chemical compound NCCC1=NN=NN1 MZYXHLMULHPGKX-UHFFFAOYSA-N 0.000 description 3
- KGSVNOLLROCJQM-UHFFFAOYSA-N 2-(benzylamino)acetic acid Chemical compound OC(=O)CNCC1=CC=CC=C1 KGSVNOLLROCJQM-UHFFFAOYSA-N 0.000 description 3
- LFIWXXXFJFOECP-UHFFFAOYSA-N 4-(aminomethyl)benzonitrile Chemical compound NCC1=CC=C(C#N)C=C1 LFIWXXXFJFOECP-UHFFFAOYSA-N 0.000 description 3
- IDIDJDIHTAOVLG-UHFFFAOYSA-N S-methyl-L-cysteine Natural products CSCC(N)C(O)=O IDIDJDIHTAOVLG-UHFFFAOYSA-N 0.000 description 3
- IDIDJDIHTAOVLG-VKHMYHEASA-N S-methylcysteine Chemical compound CSC[C@H](N)C(O)=O IDIDJDIHTAOVLG-VKHMYHEASA-N 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 229940126543 compound 14 Drugs 0.000 description 3
- 229940126214 compound 3 Drugs 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 238000013537 high throughput screening Methods 0.000 description 3
- UKAUYVFTDYCKQA-UHFFFAOYSA-N homoserine Chemical compound OC(=O)C(N)CCO UKAUYVFTDYCKQA-UHFFFAOYSA-N 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- DILRJUIACXKSQE-UHFFFAOYSA-N n',n'-dimethylethane-1,2-diamine Chemical compound CN(C)CCN DILRJUIACXKSQE-UHFFFAOYSA-N 0.000 description 3
- 238000007481 next generation sequencing Methods 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 239000011541 reaction mixture Substances 0.000 description 3
- GPIOYFUIBKYOHB-UHFFFAOYSA-N 1-(methylamino)cyclohexan-1-ol hydrochloride Chemical compound Cl.OC1(CCCCC1)NC GPIOYFUIBKYOHB-UHFFFAOYSA-N 0.000 description 2
- VNCXJXZUMVHKNG-UHFFFAOYSA-N 3-cyclobutylpropanoic acid Chemical compound OC(=O)CCC1CCC1 VNCXJXZUMVHKNG-UHFFFAOYSA-N 0.000 description 2
- YGCZTXZTJXYWCO-UHFFFAOYSA-N 3-phenylpropanal Chemical compound O=CCCC1=CC=CC=C1 YGCZTXZTJXYWCO-UHFFFAOYSA-N 0.000 description 2
- 235000001014 amino acid Nutrition 0.000 description 2
- 238000009833 condensation Methods 0.000 description 2
- 230000005494 condensation Effects 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000009510 drug design Methods 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N formamide Substances NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- UCUNFLYVYCGDHP-UHFFFAOYSA-N methionine sulfone Chemical compound CS(=O)(=O)CCC(N)C(O)=O UCUNFLYVYCGDHP-UHFFFAOYSA-N 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- KRIOVPPHQSLHCZ-UHFFFAOYSA-N phenyl propionaldehyde Natural products CCC(=O)C1=CC=CC=C1 KRIOVPPHQSLHCZ-UHFFFAOYSA-N 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 150000003384 small molecules Chemical group 0.000 description 2
- DATRVIMZZZVHMP-MRVPVSSYSA-N tert-butyl (2r)-2-methylpiperazine-1-carboxylate Chemical compound C[C@@H]1CNCCN1C(=O)OC(C)(C)C DATRVIMZZZVHMP-MRVPVSSYSA-N 0.000 description 2
- UWHCKJMYHZGTIT-UHFFFAOYSA-N tetraethylene glycol Chemical compound OCCOCCOCCOCCO UWHCKJMYHZGTIT-UHFFFAOYSA-N 0.000 description 2
- 125000006728 (C1-C6) alkynyl group Chemical group 0.000 description 1
- IBODDUNKEPPBKW-UHFFFAOYSA-N 1,5-dibromopentane Chemical compound BrCCCCCBr IBODDUNKEPPBKW-UHFFFAOYSA-N 0.000 description 1
- 101150092328 22 gene Proteins 0.000 description 1
- 101150029857 23 gene Proteins 0.000 description 1
- 241001156002 Anthonomus pomorum Species 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- 239000007821 HATU Substances 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- KEAYESYHFKHZAL-UHFFFAOYSA-N Sodium Chemical compound [Na] KEAYESYHFKHZAL-UHFFFAOYSA-N 0.000 description 1
- 150000007824 aliphatic compounds Chemical class 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 150000001491 aromatic compounds Chemical class 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 125000001246 bromo group Chemical group Br* 0.000 description 1
- 150000001735 carboxylic acids Chemical class 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 235000019441 ethanol Nutrition 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 238000003402 intramolecular cyclocondensation reaction Methods 0.000 description 1
- 238000012917 library technology Methods 0.000 description 1
- 238000002514 liquid chromatography mass spectrum Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000012046 mixed solvent Substances 0.000 description 1
- 229910000403 monosodium phosphate Inorganic materials 0.000 description 1
- 235000019799 monosodium phosphate Nutrition 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 239000008055 phosphate buffer solution Substances 0.000 description 1
- 150000003141 primary amines Chemical class 0.000 description 1
- 125000006239 protecting group Chemical group 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000007086 side reaction Methods 0.000 description 1
- BEOOHQFXGBMRKU-UHFFFAOYSA-N sodium cyanoborohydride Chemical compound [Na+].[B-]C#N BEOOHQFXGBMRKU-UHFFFAOYSA-N 0.000 description 1
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 1
- 239000012312 sodium hydride Substances 0.000 description 1
- 229910000104 sodium hydride Inorganic materials 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- CWXPZXBSDSIRCS-UHFFFAOYSA-N tert-butyl piperazine-1-carboxylate Chemical compound CC(C)(C)OC(=O)N1CCNCC1 CWXPZXBSDSIRCS-UHFFFAOYSA-N 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07C—ACYCLIC OR CARBOCYCLIC COMPOUNDS
- C07C59/00—Compounds having carboxyl groups bound to acyclic carbon atoms and containing any of the groups OH, O—metal, —CHO, keto, ether, groups, groups, or groups
- C07C59/125—Saturated compounds having only one carboxyl group and containing ether groups, groups, groups, or groups
- C07C59/135—Saturated compounds having only one carboxyl group and containing ether groups, groups, groups, or groups containing halogen
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07C—ACYCLIC OR CARBOCYCLIC COMPOUNDS
- C07C309/00—Sulfonic acids; Halides, esters, or anhydrides thereof
- C07C309/63—Esters of sulfonic acids
- C07C309/72—Esters of sulfonic acids having sulfur atoms of esterified sulfo groups bound to carbon atoms of six-membered aromatic rings of a carbon skeleton
- C07C309/73—Esters of sulfonic acids having sulfur atoms of esterified sulfo groups bound to carbon atoms of six-membered aromatic rings of a carbon skeleton to carbon atoms of non-condensed six-membered aromatic rings
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07D—HETEROCYCLIC COMPOUNDS
- C07D207/00—Heterocyclic compounds containing five-membered rings not condensed with other rings, with one nitrogen atom as the only ring hetero atom
- C07D207/46—Heterocyclic compounds containing five-membered rings not condensed with other rings, with one nitrogen atom as the only ring hetero atom with hetero atoms directly attached to the ring nitrogen atom
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H1/00—Processes for the preparation of sugar derivatives
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
- C07H21/04—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
- C40B40/08—Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/08—Liquid phase synthesis, i.e. wherein all library building blocks are in liquid phase or in solution during library creation; Particular methods of cleavage from the liquid support
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/55—Design of synthesis routes, e.g. reducing the use of auxiliary or protecting groups
Abstract
本发明提供了基因编码化合物库起始头片段化合物及其在基因编码化合物库合成上的应用,普适性好、条件较温和、操作方便、收率高,适用于多孔板进行的基因编码化合物库的合成,增加了基因编码化合物库中寡聚核酸与含有游离氨基类小分子化合物反应的底物类型,扩大了基因编码化合物库的多样性。
Description
技术领域
本发明属于生物化学领域,具体涉及基因编码化合物库起始头片段化合物及其在基因编码化合物库合成上的应用。
背景技术
任何一种药物的开发都是一个漫长且耗资巨大的过程。据药物研发的统计资料报道,一种新药从开始研发到最终批准投放市场,平均需10年的时间,研究费用更是高达~26亿美元。药物的研制历程之所以这样漫长,费用高昂,其中很重要的一个原因是先导化合物的发现与优化过程缓慢[1]。基于化学结构的药物设计(Structure-based drug design,简称 SBDD):根据目标蛋白质的3D结构特征,依赖于计算机算法指导小分子化合物结构设计与筛选,是发现先导化合物的一个重要途经[2]。基于有机化合物分子片段的筛选方法(Fragment screen)以及其筛选出先导化合物的方法(Fragment based lead generation,简称FBLG):通常对几千个小分子量(<200Da)的化合物组,在高浓度下进行筛选。这些基于小分子片段进行的筛选方法是早期发现活性化合物的有效途经[3]。在新型药物的研发过程中,科学家们不断地寻求更多有效的筛选方法,以便在许多化合物中通过对生物学靶标的结合亲和力和/或药理学效力以无差异性的筛选方式找到优异的活性化合物。高度自动化以及深度优化后的多种高通量筛选法在活性化合物的筛选与发现中的重要作用是无可争议的。经过许多年的应用、发展与完善,高通量筛选已经建立起了高度自动化、完善的筛选流程、以及与之相伴的提升的化学分子库质量和增长的化合物数量,是国际上主流的药物研发公司获得目标蛋白的先导化合物的重要途经。但是,高成本导致了化学结构及化合物总数上的局限性,以至于传统的药物研发方法越来越不能满足新药研发的需求。在很多疾病蛋白的筛选实践中用这种传统方法是徒劳无功的。为了能突破高通量筛选方法的瓶颈,使筛选的化合物在化学结构空间及数量上能呈现几何级数上的飞跃,及使用一种全新的生物筛选模式,基因编码库技术(DELT)应运而生。DELT正在改变药物发现研究领域里的游戏规则。Brenner和Lerner于1992年提出 DELT的原创理论并预见了它能够使用比传统方法更快捷的方式来合成和筛选数量庞大的基因编码化合物库[4]。
与传统高通量筛选相比,基因编码化合物库极大地增加了化合物的数量和多样性[5]。在很小的体积例如几十微升的反应管中,通过一系列反应,可以合成上千万甚至上亿种不同的化合物[6]。DELT的原理是用不同特定序列的基因片段来标记反应过程中的每一个小分子化合物,用组合化学的策略,通过使用拆分、合并(split and pool)的方法,利用有限的成本和时间,大量合成百万级至百亿级连接有特定基因序列的化合物文库[7]。然后将所得化合物的混合物与蛋白质靶标一起孵育,通过洗去没有与蛋白质靶标结合的化合物而达到物理分离并找到具有高结合亲和力的化合物[8]。孵育靶标蛋白质所需的基因编码化合物库只需极其小的剂量规模(微克) 而且可以在很短时间内(比如1天内)进行。可以轻松地在不同条件下[9](例如,溶液的酸碱度、样品蛋白混合方式、蛋白质浓度、存在或不存在竞争化合物、存在不同的缓冲液或辅助因子)进行多项筛选实验。由于基因序列与化合物结构一一对应,通过聚合酶链式反应(Polymerase Chain Reaction,简称PCR)扩增和下一代测序(Next Generation Sequencing,简称NGS)读取后,就可以通过基因序列解码得到活性化合物的化学结构式。然后对具有高结合亲和力化合物进行“脱离基因”的单独合成,并测定没有附着基因的化合物与目标蛋白质的结合力以确认其生物活性。
先导化合物的发现是新药研发的重要步骤,高起点的先导化合物是新药研发成功的关键因素之一。基因编码化合物库是诸多先导化合物筛选方法中引人注目的方法之一[10]。它以传统方法无可比拟的化合物数量、化学结构多样性以及对生物目标蛋白独特的结合方式脱颖而出。最近二十年来在新药研发领域取得的进展已将DELT转变为大多数制药公司新药研发产品的强大工具[11-12]。它不仅能为传统的生物学靶标蛋白寻找新的配体,而且能为困扰药物学家的新颖靶标蛋白以及用传统方法无法找到亲和物的疾病蛋白筛选到配体。因此,DELT将有助于找到药物化学研究的重要起点-先导化合物。尽管如此,DELT面对的挑战仍然是如何拓展文库小分子的化学空间以及优化其物理化学性质[13-15]和卓越的生物筛选方法。
最近几年在这一领域里出现的在活细胞上的生物筛选方法,是一个引人注目的成就[16]。在活细胞上的筛选将不再需要纯化过的靶标蛋白,也无需对蛋白进行修饰,更好地保持了蛋白的原生态结构,而且可以直接找到有细胞活性的先导化合物。这样,药物学家能够在此平台上找到更好的先导化合物[17-18]。
在基因编码化合物库的合成中,将基因片段末端与目标化合物库相连是最开始也是关键的步骤之一。目前最常用的方法是通过基因末端的氨基与小分子羧酸缩合形成酰胺键来链接,此方法适用性较好,但不适用于与含有游离氨基类小分子化合物的链接[19]。
上式是DELT文献中常用的链接方式。
通过基因末端羧基与含有游离氨基类小分子化合物进行反向缩合形成酰胺键的方法也有报道(如上式所示)。但是这种方法普适性不好,因其能够导致在接下来的酰胺反应中发生分子内环化副反应、并使得产物稳定性不好。这种链接方式导致反应收率普遍偏低,因此只有有限的应用[20]。
上式展示了本发明中提出的基因编码化合物库起始头片段化合物与含有游离氨基类小分子化合物的链接方式。
为解决以上问题,得到一种普适性较好的能够使基因末端与含有游离氨基类小分子化合物结合的合成新方法,我们研究并开发了基因编码化合物库起始头片段化合物及其在基因编码化合物库合成上与含有游离氨基类小分子化合物合成的应用。该基因编码化合物库起始头片段化合物相比于传统的羧酸起始头片段有着明显的优势[19]:1)新颖的链接方式而引导出新的产物的化学空间;2)增加了底物分子的多样性;3)化学文库的分子量更小;4)更高的化学文库稳定性。
发明内容
本发明所要解决的技术问题在于,提供基因编码化合物库起始头片段化合物及其在基因编码化合物库合成上的应用。其特征在于,基因编码化合物库起始头片段化合物与寡聚核酸链接得到寡聚核酸链接化合物,然后在硼酸钠无机盐缓冲液存在下与含有游离氨基类小分子化合物反应得到基因编码化合物。
为解决上述技术问题,本发明提供以下技术方案:
在第一方面,本申请提供基因编码化合物库起始头片段化合物与寡聚核酸链接化合物的制备方法,具体反应方程式如下:
其中,所述基因编码化合物库起始头片段化合物的结构通式如下:
其中,在基因编码化合物库起始头片段化合物的结构通式中,Y包括羧酸类,2,5-二氧杂吡咯烷-1-基羧酸酯类;X包括对甲苯磺酰基(OTs)、溴;n=3、4;m=1、2、3、4;在一个优选的实施方案中,Y为2,5-二氧杂吡咯烷-1-基羧酸酯类,X是对甲苯磺酰基(OTs),n=3;m=1。
其中,羧酸类基因编码化合物库起始头片段化合物与寡聚核酸的链接是通过酰胺偶联反应实现的,包括:将寡聚核酸溶于硼酸钠缓冲溶液,并依次将羧酸类基因编码化合物库起始头片段化合物溶液、2-(7-偶氮苯并三氮唑)-N,N,N',N'-四甲基脲六氟磷酸酯溶液、N,N-二异丙基乙胺溶液,加入到寡聚核酸溶液中,在室温下反应至反应结束;
优选地,将10纳摩尔寡聚核酸溶于10微升硼酸钠缓冲溶液(pH=9.5, 250毫摩尔/升),将80摩尔当量的羧酸类基因编码化合物库起始头片段化合物溶液(80毫摩尔/升,寡聚核酸的80摩尔当量)在室温下加入到寡聚核酸溶液中,并加入50摩尔当量2-(7-偶氮苯并三氮唑)-N,N,N',N'-四甲基脲六氟磷酸酯(50毫摩尔/升,寡聚核酸的50摩尔当量)及200摩尔当量 N,N-二异丙基乙胺(200毫摩尔/升,寡聚核酸的200摩尔当量),在室温下反应1小时。反应结束后,向反应液中加入4微升5摩尔/升的氯化钠水溶液,100微升无水乙醇,震荡混匀。放置-80℃冰箱冷冻10~30分钟后,高速冷冻离心(4℃,12000转数/分钟,5分钟),得到羧酸类基因编码化合物库起始头片段化合物与寡聚核酸链接化合物。
羧酸类基因编码化合物库起始头片段化合物结构如下:
和/或,2,5-二氧杂吡咯烷-1-基羧酸酯类基因编码化合物库起始头片段化合物与寡聚核酸的链接是通过亲核取代反应实现的,包括:将寡聚核酸溶于硼酸钠缓冲溶液,并将2,5-二氧杂吡咯烷-1-基羧酸酯类基因编码化合物库起始头片段化合物溶液加入到寡聚核酸溶液中,在室温下反应至反应结束;
优选地,将10纳摩尔寡聚核酸溶于10微升硼酸钠缓冲溶液(pH=9.5, 250毫摩尔/升),将10摩尔当量的2,5-二氧杂吡咯烷-1-基羧酸酯类基因编码化合物库起始头片段化合物溶液(10毫摩尔/升,寡聚核酸的10摩尔当量)加入到寡聚核酸溶液中,在室温下,反应1~2小时。反应结束后,向反应液中加入2微升5摩尔/升的氯化钠水溶液,50微升无水乙醇,震荡混匀。放置-80℃冰箱冷冻10~30分钟,高速冷冻离心(4℃,12000转数/分钟,5分钟),得到2,5-二氧杂吡咯烷-1-基羧酸酯类基因编码化合物库起始头片段化合物与寡聚核酸链接化合物。
2,5-二氧杂吡咯烷-1-基羧酸酯类基因编码化合物库起始头片段化合物结构如下:
其中,所述寡聚核酸是由经人工修饰的和/或未修饰的寡核苷酸单体聚合得到的单链或双链的寡聚核酸链,其中一种寡聚核酸结构如下:
在第二方面,本申请提供一种基因编码化合物的制备方法,其特征在于,与寡聚核酸链接的基因编码化合物库起始头片段化合物与含有游离氨基类小分子化合物反应得到基因编码化合物。
优选地,将摩尔浓度为0.1~2毫摩尔/升的寡聚核酸链接化合物、5~ 500摩尔当量的含有游离氨基类小分子化合物及反应溶剂混合,在0~90℃下反应1~24小时直至反应结束,具体反应方程式如下:
其中,所述含有游离氨基类小分子化合物的结构式为R1-NH-R2,可以是一级或二级胺类化合物,包括芳香类、脂肪类、碳环类化合物以及含有杂原子的环类化合物、氨基酸类化合物以及带有其他保护基团的游离氨基类化合物,R1、R2可任选地为羧酸、氢、氨基、硝基、氰基、羟基、巯基、芳基甲酮、烷基甲酮、C1-C12烷基、C1-C6烯烃基、C1-C6炔烃基、C3-C8环烷基、C1-C6烷基氧、芳基、杂环芳基中的任意一种至多种或它们的任意组合。
在一个实施方案中,所述基因编码化合物库起始头片段化合物与寡聚核酸链接化合物的摩尔浓度是0.1~2毫摩尔/升;在一个优选的实施方案中,所述基因编码化合物库起始头片段化合物与寡聚核酸链接化合物的摩尔浓度为0.5~1.5毫摩尔/升;在一个更优选的实施方案中,所述基因编码化合物库起始头片段化合物与寡聚核酸链接化合物的摩尔浓度为1.0毫摩尔/升。
在一个实施方案中,基因编码化合物库起始头片段化合物与寡聚核酸链接化合物的结构式中,X包括对甲苯磺酰基(OTs)、溴,n=3、4,m= 1、2、3、4;在一个优选的实施方案中,X为对甲苯磺酰基(OTs),n=3, m=1、3;在一个更优选的实施方案中,X为对甲苯磺酰基(OTs),n=3, m=1。
在一个实施方案中,所述含有游离氨基类小分子化合物摩尔当量为寡聚核酸的5~500摩尔当量;在一个优选的实施方案中,所述含有游离氨基类小分子化合物的摩尔当量为寡聚核酸的100~300摩尔当量;在一个更优选的实施方案中,所述含有游离氨基类小分子化合物的摩尔当量为寡聚核酸的200摩尔当量。
在一个实施方案中,所述反应溶剂是含水、乙腈、甲醇、乙醇、叔丁醇、二甲基甲酰胺、二甲基乙酰胺、四氢呋喃、二甲基亚砜、无机盐缓冲液(硼酸盐、磷酸盐、碳酸盐)、有机碱缓冲液(三乙胺、N,N-二异丙基乙胺、1,8-二氮杂二环[5.4.0]十一碳-7-烯、三羟甲基氨基甲烷)中的任意一种或几种的混合溶剂;在一个优选的实施方案中,所述反应溶剂是无机盐缓冲液及乙腈的混合溶液;在一个更优选的实施方案中,所述反应溶剂是pH=12.5的硼酸钠缓冲溶液及乙腈的混合溶液,且缓冲液总含量不低于20%。
在一个实施方案中,所述反应温度为0~90℃;在一个优选的实施方案中,所述反应温度为50~80℃;在一个更优选的实施方案中,所述反应温度为70℃。
在一个实施方案中,所述反应时间为0~24小时;在一个优选的实施方案中,所述反应时间为1~8小时;在一个更优选的实施方案中,所述反应时间为4小时。
本发明提供了基因编码化合物库起始头片段化合物与寡聚核酸链接化合物的制备方法及进一步与含有游离氨基类小分子化合物反应的方法,扩大了基因编码化合物库中直接与含有游离氨基类小分子化合物反应的范畴,增加了基因编码化合物库的多样性并提高了其稳定性。本发明的方法与含有游离氨基类小分子化合物反应普适性好、条件较温和、操作方便、收率高,适用于多孔板进行的基因编码化合物库的合成。
附图说明
图1为本发明基因编码化合物库起始头片段化合物2-1相应的液相色谱质谱检测结果。
图2为本发明基因编码化合物库起始头片段化合物1-8相应的液相色谱质谱检测结果。
图3为本发明基因编码化合物库起始头片段化合物2-8相应的液相色谱质谱检测结果。
图4为本发明基因编码化合物库起始头片段化合物2-1与寡聚核酸在 pH=9.5的硼酸钠缓冲溶液下链接得到的链接化合物b的液相色谱质谱检测结果。
图5为本发明基因编码化合物库起始头片段化合物2-8与寡聚核酸在 pH=9.5的硼酸钠缓冲溶液下链接得到的链接化合物c的液相色谱质谱检测结果。
图6为本发明基因编码化合物库起始头片段化合物与寡聚核酸链接化合物a在pH=12.5的硼酸钠缓冲溶液存在下与DL-高丝氨酸合成基因编码化合物1液相色谱质谱检测结果。
图7为本发明基因编码化合物库起始头片段化合物与寡聚核酸链接化合物a在pH=12.5的硼酸钠缓冲溶液存在下与N-苄基甘氨酸合成基因编码化合物2液相色谱质谱检测结果。
图8为本发明基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b在pH=12.5的硼酸钠缓冲溶液存在下与S-甲基-L-半胱氨酸合成基因编码化合物4液相色谱质谱检测结果。
图9为本发明基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b在pH=12.5的硼酸钠缓冲溶液存在下与L-乙烯基甘氨酸盐酸盐合成基因编码化合物5液相色谱质谱检测结果。
图10为本发明基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b在pH=12.5的硼酸钠缓冲溶液存在下与5-氨乙基四氮唑合成基因编码化合物10液相色谱质谱检测结果。
图11为本发明基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b在pH=12.5的硼酸钠缓冲溶液存在下与对氰基苄胺合成基因编码化合物12液相色谱质谱检测结果。
图12为本发明基因编码化合物库起始头片段化合物与寡聚核酸链接化合物c在pH=12.5的硼酸钠缓冲溶液存在下与N,N-二甲基乙二胺合成基因编码化合物14液相色谱质谱检测结果。
图13为本发明基因编码化合物库起始头片段化合物与寡聚核酸链接化合物与(9H-芴-9-基)甲基(2-(甲胺基)环己基)氨基甲酸酯的反应产物,进一步与苯丙醛反应得到的产物液相色谱质谱检测结果。
图14为本发明含有游离氨基氨基酸化合物的代表结构。
图15为本发明含有游离氨基二级胺化合物的代表结构。
图16为本发明含有游离氨基一级胺化合物的代表结构。
具体实施方式
下面将对本发明的技术方案进行清楚、完整的描述。显然,所描述的实施例只是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明实施例中的所有寡聚核酸原料均为寡聚核酸双链或者单链的底物。本发明中,“基因编码化合物库起始头片段化合物”是指用于连接寡聚核酸与含有游离氨基类小分子化合物的一段经化学修饰的长链化合物。
实施例1,基因编码化合物库起始头片段化合物1-1及2-1的合成
将1纳摩尔的乙酸叔丁酯-聚乙二醇溶于二氯甲烷中,并加入3纳摩尔三乙胺、0.1纳摩尔4-二甲胺基吡啶、1.5纳摩尔对甲苯磺酰氯,室温反应 4小时。经高效液相色谱柱制备得到中间体化合物;将中间体化合物溶于二氯甲烷中,加入适量三氟乙酸,室温反应1小时。经处理后得到基因编码化合物库起始头片段化合物1-1。将基因编码化合物库起始头片段化合物1-1溶于二氯甲烷溶液中,并在室温下加入3纳摩尔三乙胺、2纳摩尔 N,N-二琥珀酰亚胺碳酸酯。反应结束后,萃取浓缩得到基因编码化合物库起始头片段化合物2-1。液相色谱质谱检测结果如图1所示,具体反应方程式如下:
实施例2,基因编码化合物库起始头片段化合物1-8及2-8的合成
将1纳摩尔的四乙二醇溶于二氯甲烷中,并加入1.2纳摩尔三乙胺、0.1纳摩尔4-二甲胺基吡啶、1.5纳摩尔对甲苯磺酰氯(TsCl),室温反应4 小时。然后再加入1.5纳摩尔对甲苯磺酰氯、0.1纳摩尔氢化钠,室温反应直至反应结束。经高效液相色谱柱制备得到中间体化合物。将中间体化合物溶于二氯甲烷中,加入适量三氟乙酸,室温反应1小时。经处理后得到基因编码化合物库起始头片段化合物1-8。液相色谱质谱检测结果如图2 所示。将基因编码化合物库起始头片段化合物1-8溶于二氯甲烷溶液中,并在室温下加入3纳摩尔三乙胺、2纳摩尔N,N-二琥珀酰亚胺碳酸酯 (DSC)。反应结束后,萃取浓缩得到基因编码化合物库起始头片段化合物2-8,液相色谱质谱检测结果如图3所示,具体反应方程式如下:
实施例3,基因编码化合物库起始头片段化合物1-16及2-16的合成
将1纳摩尔的四乙二醇溶于二氯甲烷中,并加入3纳摩尔三乙胺、0.1 纳摩尔4-二甲胺基吡啶、1.5纳摩尔1,5-二溴戊烷,室温反应4小时。经高效液相色谱柱制备得到中间体化合物。将中间体化合物溶于二氯甲烷中,加入适量三氟乙酸,室温反应1小时。经处理后得基因编码化合物库起始头片段化合物1-16。将基因编码化合物库起始头片段化合物1-16溶于二氯甲烷溶液中,并在室温下加入3纳摩尔三乙胺、2纳摩尔N,N-二琥珀酰亚胺碳酸酯(DSC)。反应结束后,萃取浓缩得到基因编码化合物库起始头片段化合物2-16。通液相色谱质谱进行检测,具体反应方程式如下:
实施例4,基因编码化合物库起始头片段化合物与寡聚核酸链接化合物 a的合成
将10纳摩尔的寡聚核酸(长度为41个碱基,碱基序列为: TCTAGACCCCTCCACAGTAGGGA/GAGATCTGGGGAGGTGTCATC CCTCAGC,相对分子质量为15940)溶于10微升硼酸钠缓冲溶液(pH= 9.5,250毫摩尔/升),将80摩尔当量基因编码化合物库起始头片段化合物 1-1溶液(200毫摩尔/升,寡聚核酸的80摩尔当量),在室温下加入到寡聚核酸溶液中,并加入50摩尔当量2-(7-偶氮苯并三氮唑)-N,N,N',N'-四甲基脲六氟磷酸酯(200毫摩尔/升,寡聚核酸的50摩尔当量)及200摩尔当量N,N-二异丙基乙胺(200毫摩尔/升,寡聚核酸的200摩尔当量)。反应结束后,向反应液中加入2微升5摩尔/升的氯化钠水溶液,50微升无水乙醇,震荡混匀,放置-80℃冰箱冷冻10~30分钟。高速冷冻离心(4℃, 12000转数/分钟,5分钟),得到基因编码化合物库起始头片段化合物与寡聚核酸链接化合物a,分子量为16329。通过液相色谱质谱进行检测,检测到相应产物分子量,说明基因编码化合物库起始头片段化合物1-1可以用于与寡聚核酸的链接。
实施例5,基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b的合成
将10纳摩尔的寡聚核酸(长度为41个碱基,碱基序列为: TCTAGACCCCTCCACAGTAGGGA/GAGATCTGGGGAGGTGTCATC CCTCAGC,相对分子质量为15940)溶于10微升硼酸钠缓冲溶液(pH= 9.5,250毫摩尔/升),将10摩尔当量的基因编码化合物库起始头片段化合物2-1溶液(200毫摩尔/升,寡聚核酸的10摩尔当量),在室温下加入到寡聚核酸溶液中。反应结束后,向反应液中加入2微升5摩尔/升的氯化钠水溶液,50微升无水乙醇,震荡混匀,放置-80℃冰箱冷冻10~30分钟。高速冷冻离心(4℃,12000转数/分钟,5分钟),得到基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b,分子量为16329。液相色谱质谱检测到相应产物分子量,结果见图4,说明基因编码化合物库起始头片段化合物2-1可用于与寡聚核酸链接。与实例4相比,实例5中2,5-二氧杂吡咯烷-1-基羧酸酯类基因编码化合物库起始头片段化合物2-1与寡聚核酸的反应更简洁快速,反应条件更加温和。于是选择2,5-二氧杂吡咯烷-1-基羧酸酯类基因编码化合物库起始头片段化合物作为优选。
实施例6,基因编码化合物库起始头片段化合物与寡聚核酸链接化合物c的合成
将10纳摩尔的寡聚核酸(长度为41个碱基,碱基序列为:TCTAGACCCCTCCACAGTAGGGA/GAGATCTGGGGAGGTGTCATC CCTCAGC,相对分子质量为15940)溶于10微升硼酸钠缓冲溶液(pH= 9.5,250毫摩尔/升),将10摩尔当量的基因编码化合物库起始头片段化合物2-8溶液(200毫摩尔/升,寡聚核酸的10摩尔当量),在室温下加入到寡聚核酸溶液中。反应结束后,向反应液中加入2微升5摩尔/升的氯化钠水溶液,50微升无水乙醇,震荡混匀,放置-80℃冰箱冷冻10~30分钟。高速冷冻离心(4℃,12000转数/分钟,5分钟),得到基因编码化合物库起始头片段化合物与寡聚核酸链接化合物c,分子量为16419,液相色谱质谱检测到相应产物分子量,结果见图5,说明基因编码化合物库起始头片段化合物2-8可用于与寡聚核酸链接。与实例5相比,实例6得到的产物分子量更大,我们优先选择实例5产物分子量较小的基因编码化合物库起始头片段化合物2-1。
实施例7,基因编码化合物库起始头片段化合物与寡聚核酸链接化合物 d的合成
将10纳摩尔的寡聚核酸(长度为41个碱基,碱基序列为: TCTAGACCCCTCCACAGTAGGGA/GAGATCTGGGGAGGTGTCATC CCTCAGC,相对分子质量为15940)溶于10微升硼酸钠缓冲溶液(pH= 9.5,250毫摩尔/升),将10摩尔当量的基因编码化合物库起始头片段化合物2-16溶液(200毫摩尔/升,寡聚核酸的10摩尔当量),在室温下加入到寡聚核酸溶液中。反应结束后,向反应液中加入2微升5摩尔/升的氯化钠水溶液,50微升无水乙醇,震荡混匀,放置-80℃冰箱冷冻10~30分钟。高速冷冻离心(4℃,12000转数/分钟,5分钟),得到基因编码化合物库起始头片段化合物与寡聚核酸链接化合物d。由于使用含有溴的起始头片段化合物所得到产物的产率低于对甲苯磺酰基(OTs)的,于是优选实例5 中基因编码化合物库起始头片段化合物2-1。
实施例8,基因编码化合物库起始头片段化合物与寡聚核酸链接化合物 a与DL-高丝氨酸合成基因编码化合物1
将10纳摩尔的基因编码化合物库起始头片段化合物与寡聚核酸链接化合物a溶于10微升硼酸钠缓冲溶液(pH=12.5,250毫摩尔/升),加入200 摩尔当量的DL-高丝氨酸(200毫摩尔/升的水溶液,寡聚核酸的200摩尔当量),反应液在70℃下反应4小时。待反应结束后,向反应液中加入2 微升5摩尔/升的氯化钠水溶液,50微升无水乙醇,震荡混匀,放置-80℃冰箱冷冻10~30分钟。高速冷冻离心(4℃,12000转数/分钟,5分钟),得到基因编码化合物1,分子量为16275,液相色谱质谱检测到基因编码化合物1分子量,结果见图6。
实施例9,基因编码化合物库起始头片段化合物与寡聚核酸链接化合物 a与N-苄基甘氨酸合成基因编码化合物2
将10纳摩尔的基因编码化合物库起始头片段化合物与寡聚核酸链接化合物a溶于10微升硼酸钠缓冲溶液(pH=12.5,250毫摩尔/升),加入200 摩尔当量的N-苄基甘氨酸(200毫摩尔/升的水溶液,寡聚核酸的200摩尔当量),反应液在70℃下反应4小时。待反应结束后,向反应液中加入2 微升5摩尔/升的氯化钠水溶液,50微升无水乙醇,震荡混匀,放置-80℃冰箱冷冻10~30分钟。高速冷冻离心(4℃,12000转数/分钟,5分钟),得到基因编码化合物2,分子量为16320,液相色谱质谱检测到基因编码化合物2分子量,结果见图7。
实施例10,基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b与DL-蛋氨酸砜合成基因编码化合物3
将10纳摩尔的基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b溶于10微升硼酸钠缓冲溶液(pH=12.5,250毫摩尔/升),加入 200当量的DL-蛋氨酸砜(200毫摩尔/升的水溶液,寡聚核酸的200摩尔当量),反应液在70℃下反应4小时。待反应结束后,向反应液中加入2微升5摩尔/升的氯化钠水溶液,50微升无水乙醇,震荡混匀,放置-80℃冰箱冷冻10~30分钟。高速冷冻离心(4℃,12000转数/分钟,5分钟),得到基因编码化合物3,液相色谱质谱检测到基因编码化合物3分子量。
实施例11,基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b与S-甲基-L-半胱氨酸合成基因编码化合物4
将10纳摩尔的基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b溶于10微升硼酸钠缓冲溶液(pH=12.5,250毫摩尔/升),加入 200摩尔当量的S-甲基-L-半胱氨酸(200毫摩尔/升的水溶液,寡聚核酸的 200摩尔当量),反应液在70℃下反应4小时。待反应结束后,向反应液中加入2微升5摩尔/升的氯化钠水溶液,50微升无水乙醇,震荡混匀,放置-80℃冰箱冷冻10~30分钟。高速冷冻离心(4℃,12000转数/分钟, 5分钟),得到基因编码化合物4,分子量为16290,液相色谱质谱检测到基因编码化合物4分子量,结果见图8。
实施例12,基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b与L-乙烯基甘氨酸盐酸盐合成基因编码化合物5
将10纳摩尔的基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b溶于10微升硼酸钠缓冲溶液(pH=12.5,250毫摩尔/升),加入 200摩尔当量的L-乙烯基甘氨酸盐酸盐(200毫摩尔/升的水溶液,寡聚核酸的200摩尔当量),反应液在70℃下反应4小时。待反应结束后,向反应液中加入2微升5摩尔/升的氯化钠水溶液,50微升无水乙醇,震荡混匀,然后放置-80℃冰箱冷冻10~30分钟。高速冷冻离心(4℃,12000转数/分钟,5分钟),得到基因编码化合物5,分子量为16256,液相色谱质谱检测到基因编码化合物5分子量,结果见图9。
实施例13,基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b与叔丁基八氢吡咯并[3.4-B]吡啶-1-羧酸反应合成基因编码化合物6
将10纳摩尔的基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b溶于10微升硼酸钠缓冲溶液(pH=12.5,250毫摩尔/升),加入 200摩尔当量的叔丁基八氢吡咯并[3.4-B]吡啶-1-羧酸(200毫摩尔/升的乙腈溶液,寡聚核酸的200摩尔当量),反应液在70℃下反应4小时。待反应结束后,向反应液中加入2微升5摩尔/升的氯化钠水溶液,50微升无水乙醇,震荡混匀,放置-80℃冰箱冷冻10~30分钟。高速冷冻离心(4℃, 12000转数/分钟,5分钟),得到基因编码化合物6,液相色谱质谱检测到基因编码化合物6分子量。
实施例14,基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b与(9H-芴-9-基)甲基(2-(甲胺基)环己基)氨基甲酸酯合成基因编码化合物7
将10纳摩尔的基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b溶于10微升硼酸钠缓冲溶液(pH=12.5,250毫摩尔/升),加入 200摩尔当量的(9H-芴-9-基)甲基(2-(甲胺基)环己基)氨基甲酸酯(200 毫摩尔/升的乙腈/水溶液=1:1,寡聚核酸的200摩尔当量),反应液在70℃下反应4小时。待反应结束后,向反应液中加入2微升5摩尔/升的氯化钠水溶液,50微升无水乙醇,震荡混匀,放置-80℃冰箱冷冻10~30分钟。高速冷冻离心(4℃,12000转数/分钟,5分钟),得到基因编码化合物7,液相色谱质谱检测到基因编码化合物7分子量。
实施例15,基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b与1-叔丁氧羰基哌嗪合成基因编码化合物8
将10纳摩尔的基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b溶于10微升硼酸钠缓冲溶液(pH=12.5,250毫摩尔/升),加入 200摩尔当量的1-叔丁氧羰基哌嗪(200毫摩尔/升的乙腈溶液,寡聚核酸的200摩尔当量)。反应液在70℃下反应4小时。待反应结束后,向反应液中加入2微升5摩尔/升的氯化钠水溶液,50微升无水乙醇,震荡混匀,放置-80℃冰箱冷冻10~30分钟。高速冷冻离心(4℃,12000转数/分钟,5分钟),得到基因编码化合物8,液相色谱质谱检测到基因编码化合物8 分子量。
实施例16,基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b与(R)-1-N-Boc-2-甲基哌嗪合成基因编码化合物9
将10纳摩尔的基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b溶于10微升硼酸钠缓冲溶液(pH=12.5,250毫摩尔/升),加入 200摩尔当量的(R)-1-N-Boc-2-甲基哌嗪(200毫摩尔/升的乙腈溶液,寡聚核酸的200摩尔当量),反应液在70℃下反应4小时。待反应结束后,向反应液中加入2微升5摩尔/升的氯化钠水溶液,50微升无水乙醇,震荡混匀,放置-80℃冰箱冷冻10~30分钟。高速冷冻离心(4℃,12000转数 /分钟,5分钟),得到基因编码化合物9,液相色谱质谱检测到基因编码化合物9分子量。
实施例17,基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b与5-氨乙基四氮唑合成基因编码化合物10
将10纳摩尔的基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b溶于10微升硼酸钠缓冲溶液(pH=12.5,250毫摩尔/升),加入 200摩尔当量的5-氨乙基四氮唑(200毫摩尔/升的乙腈溶液,寡聚核酸的 200摩尔当量),反应液在70℃下反应4小时。待反应结束后,向反应液中加入2微升5摩尔/升的氯化钠水溶液,50微升无水乙醇,震荡混匀,放置-80℃冰箱冷冻10~30分钟。高速冷冻离心(4℃,12000转数/分钟,5分钟),得到基因编码化合物10,分子量为16255,液相色谱质谱检测到基因编码化合物10分子量,结果见图10。
实施例18,基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b与邻羟基苄胺合成基因编码化合物11
将10纳摩尔的基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b溶于10微升硼酸钠缓冲溶液(pH=12.5,250毫摩尔/升),加入 200摩尔当量的邻羟基苄胺(200毫摩尔/升的乙腈溶液,寡聚核酸的200 摩尔当量),反应液在70℃下反应4小时。待反应结束后,向反应液中加入2微升5摩尔/升的氯化钠水溶液,50微升无水乙醇,震荡混匀,放置-80℃冰箱冷冻10~30分钟。高速冷冻离心(4℃,12000转数/分钟,5分钟),得到基因编码化合物11,液相色谱质谱检测到基因编码化合物11分子量。
实施例19,基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b与对氰基苄胺合成基因编码化合物12
将10纳摩尔的基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b溶于10微升硼酸钠缓冲溶液(pH=12.5,250毫摩尔/升),加入 200摩尔当量的对氰基苄胺(200毫摩尔/升的乙腈溶液,寡聚核酸的200 摩尔当量),反应液在70℃下反应4小时。待反应结束后,向反应液中加入2微升5摩尔/升的氯化钠水溶液,50微升无水乙醇,震荡混匀,放置-80℃冰箱冷冻10~30分钟。高速冷冻离心(4℃,12000转数/分钟,5分钟),得到基因编码化合物12,分子量为16289,液相色谱质谱检测到基因编码化合物12分子量,结果见图11。
实施例20,基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b与1-甲氨基-1-环己醇盐酸盐合成基因编码化合物13
将10纳摩尔的基因编码化合物库起始头片段化合物与寡聚核酸链接化合物b溶于10微升硼酸钠缓冲溶液(pH=12.5,250毫摩尔/升),加入200摩尔当量的1-甲氨基-1-环己醇盐酸盐(200毫摩尔/升的乙腈/水溶液,所述乙腈/水溶液,其乙腈和水体积比为1:1,寡聚核酸的200摩尔当量),反应液在70℃下反应4小时。待反应结束后,向反应液中加入2微升5摩尔/升的氯化钠水溶液,50微升无水乙醇,震荡混匀,放置-80℃冰箱冷冻10~30分钟。高速冷冻离心(4℃,12000转数/分钟,5分钟),得到基因编码化合物13,液相色谱质谱检测到基因编码化合物13分子量。
实施例21,基因编码化合物库起始头片段化合物与寡聚核酸链接化合物c与N,N-二甲基乙二胺合成基因编码化合物14
将10纳摩尔的基因编码化合物库起始头片段化合物与寡聚核酸链接化合物c溶于10微升硼酸钠缓冲溶液(pH=12.5,250毫摩尔/升),加入200 摩尔当量的N,N-二甲基乙二胺(200毫摩尔/升的乙腈/水溶液,所述乙腈/ 水溶液,其乙腈和水体积比为1:1,寡聚核酸的200摩尔当量),反应液在 70℃下反应4小时。待反应结束后,向反应液中加入2微升5摩尔/升的氯化钠水溶液,50微升无水乙醇,震荡混匀。放置-80℃冰箱冷冻10~30分钟,高速冷冻离心(4℃,12000转数/分钟,5分钟),得到基因编码化合物14,分子量为16327,液相色谱质谱检测到基因编码化合物14分子量,结果见图12。实例4~21相应产物的成功合成,充分证明本发明制备的基因起始头片段化合物能够与寡聚核酸链接,且能够进一步与含有游离氨基类小分子化合物以新的链接方式链接的可实施性。相较寡聚核酸末端羧基与含有游离氨基类小分子化合物进行反向缩合形成酰胺键的方法的链接方式,本发明基因编码化合物库起始头片段化合物引导出了新的产物的化学空间,增加了底物分子的多样性,同时此方法合成的化学文库的分子量更小。
实施例22,基因编码化合物7与3-环丁基丙酸的反应
将10纳摩尔的产物7溶于10微升水溶液中,加入10微升硼酸钠缓冲溶液(pH=9.5,250毫摩尔/升),后将100摩尔当量的3-环丁基丙酸(200 毫摩尔/升的二甲基亚砜溶液,寡聚核酸的100摩尔当量)、200摩尔当量的 N,N-二异丙基乙胺(DIEA,200毫摩尔/升的二甲基亚砜溶液,寡聚核酸的 200摩尔当量)及50摩尔当量的7-偶氮苯并三氮唑(HATU,200毫摩尔/ 升的二甲基亚砜溶液,寡聚核酸的50摩尔当量)混合,在室温下活化10 分钟,加入到产物7溶液中,反应液在室温下反应1小时。待反应结束后,向反应液中加入3.75微升5摩尔/升的氯化钠水溶液,193.75微升无水乙醇,震荡混匀,放置-80℃冰箱冷冻10~30分钟。高速冷冻离心(4℃,12000 转数/分钟,5分钟),得到产物14,液相色谱质谱检测到产物分子量。
实施例23,基因编码化合物7与苯丙醛的反应
将10纳摩尔的产物7溶于10微升水溶液中,加入10微升磷酸二氢钠缓冲溶液(pH=5.5,250毫摩尔/升),100摩尔当量的苯丙醛(200毫摩尔/升的乙腈溶液,寡聚核酸的100摩尔当量)、100摩尔当量的氰基硼氢化钠(200毫摩尔/升的乙腈溶液,寡聚核酸的100摩尔当量)混合,反应液在室温下反应1小时。待反应结束后,向反应液中加入3微升5摩尔/ 升的氯化钠水溶液,75微升无水乙醇,震荡混匀,放置-80℃冰箱冷冻10~ 30分钟。高速冷冻离心(4℃,12000转数/分钟,5分钟),得到产物15,分子量为16383,液相色谱质谱检测到产物分子量,结果如图13。实施例 22-23说明,相较基因末端羧基与含有游离氨基类小分子化合物进行反向缩合形成酰胺键的方法的链接方式,本发明基因编码化合物库起始头片段化合物引导出的产物,具有更高的化学文库稳定性。
综上所述,上述各实施例及附图仅为说明本发明的广适性而已,可以适用于不同类型的含有游离氨基类小分子化合物,其后续反应的反应性及稳定性,并不用以限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,皆应包含在本发明的保护范围内。
参考文献
[1]温树棠.浅谈组合化学的应用前景[J].石油知识,2000,1,35-35.
[2]Moitessier N.;Pottel J.;Therrien E.;et al.Medicinal chemistryprojects requiring imaginative structure-based drug design methods[J].Acc.Chem.Res.,2016,49,1646-1657.
[3]Erlanson D.A.;Fesik S.W.;Hubbard R.E.;et al.Twenty years on:theimpact of fragments on drug discovery[J].Nat.Rev.Dru.Discov.,2016,15,605-619.
[4]Brenner S.;Lerner R.A.Encoded combinatorial chemistry[J].Proc.Nati.Acad.Sci.USA.,1992,89,5381-5383.
[5]段雨默.成都先导:创新先导化合物技术为新药研发"提速"[J].中国科技产业,2014,3,70-71.
[6]Clark M.A.;Acharya R.A.;Arico-Muendel C.C.;et al.Erratum:Design,synthesis,and selection of DNA-encoded small-molecule libraries[J].Nat.Chem.Biol.,2009,5(10),772-772.
[7]徐力昆;张东娜;窦媛媛等.DNA编码化合物库在药物筛选和发现中的研究与应用[J].国际药学研究杂志,2018,45(10),736-742.
[8]刘凯;张朋朋.药明康德:打造新药研发赋能平台[J].企业管理, 2020(02).
[9]Machutta C.A.;Kollmann C.S.;Lind K.E.;et al.Prioritizing multipletherapeutic targets in parallel using automated DNA-encoded library screening[J].Nat.Commun.,2017,8,16081.
[10]Brown D.G.;Jonas B.Where do recent small molecule clinicaldevelopment candidates come from?[J].J.Med.Chem.,2018,61(21),9442-9468.
[11]Goodnow R.A.Jr.;Dumelin C.E.;Keefe A.D.DNA-encoded chemistry:enabling the deeper sampling of chemical space[J].Nat.Rev.Dru.Discov.,2017,16,131–147.
[12]Neri D.;Lerner R.A.DNA-encoded chemical libraries:aselectionsystem based on endowing organic compounds with amplifiable information[J].Annu.Rev.Biochem.,2018,87,479–502.
[13]Favalli N.;Bassi G.;Scheuermann J.;et al.DNA-encoded chemicallibraries:achievements and remaining challenges[J].FEBS Lett.,2018,592,2168–2180.
[14]Zhao G.;Huang Y.;Zhou Y.;et al.Future challenges with DNA encodedchemical libraries in the drug discovery domain[J].Expert.Opin.Drug.Dis.,2019,14,735–753.
[15]Flood D.T.;Kingston C.;Vantourout J.C.;et al.DNA encodedlibraries:a visitor’s guide[J].Isr.J.Chem.,2020,60,1–14.
[16]Huang Y.;Meng L.;Nie Q.;et al.Selection of DNA-encoded chemicallibraries against endogenous membrane proteins on live cells[J].Nat.Chem.,2021,13(1),77-88.
[17]Cai B.;Kim D.;Akhand S.;et al.Selection of DNA-encoded librariesto protein targets within and on living cells[J].J.Am.Chem.Soc.,2019,141(43),17057-17061.
[18]Wu Z.;Graybill T.L.;Platchek M.;et al.Cell-based selectionexpands the utility of DNA-encoded small-molecule library technology to cellsurface drug targets:identification of novel antagonists of the nk3tachykininreceptor[J].ACS Comb.Sci.,2015,17(12),722-731.
[19]Hunter C.J.H.;Sauter B.;Anderson M.J.;et al.Highlyefficient on-DNA amide couplings promoted by micelle forming surfactants for the synthesisof DNA encoded libraries[J].Chem.Sci.,2021,12,9475–9484.
[20]Stress C.;Sauter B.;Schneider L.;et al.A DNA-encodedchemicallibrary incorporating elements of natural macrocycles[J].Angew.Chem.Int.Edit.,2019,58(28),9570-9574.
Claims (26)
1.基因编码化合物库起始头片段化合物,其结构通式如下:
其特征在于,所述的结构通式中,Y为2,5-二氧杂吡咯烷-1-基羧酸酯,X包括对甲苯磺酰基、溴,n=3、4;m=1、2、3、4。
2.根据权利要求1所述的基因编码化合物库起始头片段化合物,其特征在于,所述的结构通式中,Y为2,5-二氧杂吡咯烷-1-基羧酸酯,X是对甲苯磺酰基(OTs),n=3;m=1。
3.基因编码化合物库起始头片段化合物与寡聚核酸链接化合物,结构通式如下:
其特征在于,所述的结构通式中,X包括对甲苯磺酰基、溴,n=3、4,m=1、2、3、4;
其中,寡聚核酸是由经人工修饰的和/或未修饰的寡核苷酸单体聚合得到的单链或双链的寡核苷酸链。
4.根据权利要求3所述的基因编码化合物库起始头片段化合物与寡聚核酸链接化合物,其特征在于,所述的结构通式中,X是对甲苯磺酰基,n=3,m=1。
5.基因编码化合物,其结构通式如下:
其特征在于,所述的结构通式中,n=3、4,m=1、2、3、4
其中,R1、R2可任选地为羧酸、氢、氨基、氰基、羟基、巯基、芳基甲酮、烷基甲酮、C1-C12烷基、C1-C6烯烃基、C3-C8环烷基、C1-C6烷基氧、芳基、杂环芳基中的任意一种至多种或它们的任意组合;
其中,寡聚核酸是由经人工修饰的和/或未修饰的寡核苷酸单体聚合得到的单链或双链的寡核苷酸链。
6.根据权利要求5所述的基因编码化合物,其特征在于,所述的结构通式中,n=3;m=1。
7.一种基因编码化合物库起始头片段化合物与寡聚核酸链接化合物的制备方法,其反应方程式如下:
其特征在于,基因编码化合物库起始头片段化合物与寡聚核酸链接得到链接化合物;
对于羧酸类基因编码化合物库起始头片段化合物,与寡聚核酸链接是通过酰胺偶联反应实现的:将寡聚核酸溶于硼酸钠缓冲溶液,并依次将羧酸类基因编码化合物库起始头片段化合物溶液、2-(7-偶氮苯并三氮唑)-N,N,N',N'-四甲基脲六氟磷酸酯溶液、N,N-二异丙基乙胺溶液,加入到寡聚核酸溶液中,在室温下反应至反应结束;和/或
对于2,5-二氧杂吡咯烷-1-基羧酸酯类基因编码化合物库起始头片段化合物,与寡聚核酸链接是通过亲核取代反应实现的:将寡聚核酸溶于硼酸钠缓冲溶液,并将2,5-二氧杂吡咯烷-1-基羧酸酯类基因编码化合物库起始头片段化合物溶液加入到寡聚核酸溶液中,在室温下反应至反应结束;
其中,寡聚核酸是由经人工修饰的和/或未修饰的寡核苷酸单体聚合得到的单链或双链的寡核苷酸链;
其中,所述基因编码化合物库起始头片段化合物的结构中,Y包括羧酸、2,5-二氧杂吡咯烷-1-基羧酸酯,X包括对甲苯磺酰基、溴,n=3、4,m=1、2、3、4;
其中,所述基因编码化合物库起始头片段化合物与寡聚核酸链接化合物结构中,X包括对甲苯磺酰基、溴,n=3、4,m=1、2、3、4。
8.根据权利要求7所述的制备方法,其特征在于,所述基因编码化合物库起始头片段化合物的结构中,Y为2,5-二氧杂吡咯烷-1-基羧酸酯,X是对甲苯磺酰基,n=3,m=1;所述基因编码化合物库起始头片段化合物与寡聚核酸链接化合物结构中,X是对甲苯磺酰基,n=3,m=1。
9.一种用于制备基因编码化合物的方法,其特征在于,将基因编码化合物库起始头片段化合物与寡聚核酸链接化合物进一步与含有游离氨基类小分子化合物反应,具体反应方程式如下:
其中,所述基因编码化合物库起始头片段化合物与寡聚核酸链接化合物的结构中,X包括对甲苯磺酰基、溴,n=3、4,m=1、2、3、4;
其中,所述含有游离氨基类小分子化合物的结构式为R1-NH-R2,是一级或二级胺类化合物,包括芳香类、脂肪类、碳环类化合物以及含有杂原子的环类化合物、氨基酸类化合物以及带有其他保护基团的游离氨基类化合物,R1、R2可任选地为羧酸、氢、氨基、氰基、羟基、巯基、芳基甲酮、烷基甲酮、C1-C12烷基、C1-C6烯烃基、C3-C8环烷基、C1-C6烷基氧、芳基、杂环芳基中的任意一种至多种或它们的任意组合;
其中,寡聚核酸是由经人工修饰的和/或未修饰的寡核苷酸单体聚合得到的单链或双链的寡核苷酸链。
10.根据权利要求9的方法,其特征在于,所述基因编码化合物库起始头片段化合物与寡聚核酸链接化合物的结构中,X是对甲苯磺酰基,n=3;m=1。
11.根据权利要求9的方法,其特征在于,所述基因编码化合物库起始头片段化合物与寡聚核酸链接化合物的摩尔浓度是0.1~2毫摩尔/升。
12.根据权利要求11的方法,其特征在于,所述基因编码化合物库起始头片段化合物与寡聚核酸链接化合物的摩尔浓度为0.5~1.5毫摩尔/升。
13.根据权利要求12的方法,其特征在于,所述基因编码化合物库起始头片段化合物与寡聚核酸链接化合物的摩尔浓度为1.0毫摩尔/升。
14.根据权利要求9的方法,其特征在于,所述反应溶剂是含水、乙腈、乙醇、二甲基亚砜、二甲基甲酰胺、二甲基乙酰胺、甲醇、叔丁醇、四氢呋喃、二甲基亚砜、无机盐缓冲液、有机碱缓冲液中的任意一种或几种的混合溶剂。
15.根据权利要求14的方法,其特征在于,所述反应溶剂是无机盐缓冲液及乙腈混合溶液。
16.根据权利要求15的方法,其特征在于,所述无机盐缓冲液选自硼酸盐、磷酸盐、碳酸盐。
17.根据权利要求14的方法,其特征在于,所述反应溶剂是pH=12.5的硼酸钠缓冲溶液及乙腈混合溶液,且缓冲液总含量不低于20%。
18.根据权利要求14的方法,其特征在于,所述有机碱缓冲液选自三乙胺、N,N-二异丙基乙胺、1,8-二氮杂二环[5.4.0]十一碳-7-烯、三羟甲基氨基甲烷。
19.根据权利要求9的方法,其特征在于,所述含有游离氨基类小分子化合物摩尔当量为寡聚核酸的5~500当量。
20.根据权利要求19的方法,其特征在于,所述含有游离氨基类小分子化合物的摩尔当量为寡聚核酸的100~300当量。
21.根据权利要求20的方法,其特征在于,所述含有游离氨基类小分子化合物的摩尔当量为寡聚核酸的200当量。
22.根据权利要求9的方法,其特征在于,在将基因编码化合物库起始头片段化合物与寡聚核酸链接化合物进一步与含有游离氨基类小分子化合物反应中,反应温度为0~90℃。
23.根据权利要求22的方法,其特征在于,所述反应温度为50~80℃。
24.根据权利要求23的方法,其特征在于,所述反应温度为70℃。
25.根据权利要求9的方法,其特征在于,在将基因编码化合物库起始头片段化合物与寡聚核酸链接化合物进一步与含有游离氨基类小分子化合物反应中,反应时间为1~8小时。
26.根据权利要求25的方法,其特征在于,所述反应时间为4小时。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110896391.XA CN113636931B (zh) | 2021-08-05 | 2021-08-05 | 基因编码化合物库起始头片段化合物及其在基因编码化合物库合成上的应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110896391.XA CN113636931B (zh) | 2021-08-05 | 2021-08-05 | 基因编码化合物库起始头片段化合物及其在基因编码化合物库合成上的应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113636931A CN113636931A (zh) | 2021-11-12 |
CN113636931B true CN113636931B (zh) | 2024-02-13 |
Family
ID=78419720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110896391.XA Active CN113636931B (zh) | 2021-08-05 | 2021-08-05 | 基因编码化合物库起始头片段化合物及其在基因编码化合物库合成上的应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113636931B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999033493A1 (en) * | 1997-12-23 | 1999-07-08 | Inex Pharmaceuticals Corporation | Polyamide oligomers |
US6287591B1 (en) * | 1997-05-14 | 2001-09-11 | Inex Pharmaceuticals Corp. | Charged therapeutic agents encapsulated in lipid particles containing four lipid components |
US6320017B1 (en) * | 1997-12-23 | 2001-11-20 | Inex Pharmaceuticals Corp. | Polyamide oligomers |
CN1518536A (zh) * | 2001-05-04 | 2004-08-04 | ��¡���ӹɷ�����˾ | 标记试剂,合成该试剂的方法以及检测生物分子的方法 |
CN1639356A (zh) * | 2001-05-04 | 2005-07-13 | 比奥·麦利尤股份有限公司 | 标记和片段化dna的方法 |
EP2113247A2 (en) * | 1997-05-14 | 2009-11-04 | The University Of British Columbia | High efficiency encapsulation of nucleic acids in lipid vesicles |
CN102203288A (zh) * | 2008-09-03 | 2011-09-28 | 康特姆斯集团有限公司 | 核酸测序的方法和试剂盒 |
CN107847605A (zh) * | 2015-11-25 | 2018-03-27 | 乐高化学生物科学股份有限公司 | 包含分支接头的抗体‑药物缀合物及其相关方法 |
CN108136038A (zh) * | 2015-11-25 | 2018-06-08 | 乐高化学生物科学股份有限公司 | 包含肽基团的缀合物及其相关方法 |
CN110753693A (zh) * | 2016-12-23 | 2020-02-04 | 阿尔维纳斯运营股份有限公司 | Egfr蛋白水解靶向嵌合分子和相关使用方法 |
CN112451682A (zh) * | 2015-11-25 | 2021-03-09 | 乐高化学生物科学股份有限公司 | 包含自降解基团的缀合物及其相关方法 |
US11066391B1 (en) * | 2020-03-25 | 2021-07-20 | Uppthera | Atorvastatin derived HMG-CoA reductase degradation inducing compound |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7338805B2 (en) * | 2001-05-04 | 2008-03-04 | Bio Merieux | Labeling reagents, methods for synthesizing such reagents and methods for detecting biological molecules |
WO2017120148A1 (en) * | 2016-01-04 | 2017-07-13 | Quantumdx Group Limited | Design, synthesis and use of synthetic nucleotides comprising charge mass tags |
JP5822726B2 (ja) * | 2008-09-03 | 2015-11-24 | クワンタムディーエックス・グループ・リミテッド | 電荷量タグを含む合成ヌクレオチドのデザイン、合成及び使用 |
US10759824B2 (en) * | 2008-09-03 | 2020-09-01 | Quantumdx Group Limited | Design, synthesis and use of synthetic nucleotides comprising charge mass tags |
GB201504314D0 (en) * | 2015-03-13 | 2015-04-29 | Univ Dundee | Small molecules |
US20180311176A1 (en) * | 2015-10-26 | 2018-11-01 | Translate Bio Ma, Inc. | Nanoparticle formulations for delivery of nucleic acid complexes |
-
2021
- 2021-08-05 CN CN202110896391.XA patent/CN113636931B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6287591B1 (en) * | 1997-05-14 | 2001-09-11 | Inex Pharmaceuticals Corp. | Charged therapeutic agents encapsulated in lipid particles containing four lipid components |
EP2113247A2 (en) * | 1997-05-14 | 2009-11-04 | The University Of British Columbia | High efficiency encapsulation of nucleic acids in lipid vesicles |
WO1999033493A1 (en) * | 1997-12-23 | 1999-07-08 | Inex Pharmaceuticals Corporation | Polyamide oligomers |
US6320017B1 (en) * | 1997-12-23 | 2001-11-20 | Inex Pharmaceuticals Corp. | Polyamide oligomers |
CN1518536A (zh) * | 2001-05-04 | 2004-08-04 | ��¡���ӹɷ�����˾ | 标记试剂,合成该试剂的方法以及检测生物分子的方法 |
CN1639356A (zh) * | 2001-05-04 | 2005-07-13 | 比奥·麦利尤股份有限公司 | 标记和片段化dna的方法 |
CN102203288A (zh) * | 2008-09-03 | 2011-09-28 | 康特姆斯集团有限公司 | 核酸测序的方法和试剂盒 |
CN107847605A (zh) * | 2015-11-25 | 2018-03-27 | 乐高化学生物科学股份有限公司 | 包含分支接头的抗体‑药物缀合物及其相关方法 |
CN108136038A (zh) * | 2015-11-25 | 2018-06-08 | 乐高化学生物科学股份有限公司 | 包含肽基团的缀合物及其相关方法 |
CN112451682A (zh) * | 2015-11-25 | 2021-03-09 | 乐高化学生物科学股份有限公司 | 包含自降解基团的缀合物及其相关方法 |
CN110753693A (zh) * | 2016-12-23 | 2020-02-04 | 阿尔维纳斯运营股份有限公司 | Egfr蛋白水解靶向嵌合分子和相关使用方法 |
US11066391B1 (en) * | 2020-03-25 | 2021-07-20 | Uppthera | Atorvastatin derived HMG-CoA reductase degradation inducing compound |
Non-Patent Citations (5)
Title |
---|
Development and Synthesis of DNA-encoded Benzimidazole Library;Yun Ding;ACS Comb. Sci.;第20卷;251-255 * |
From haystack to needle: finding value with DNA encoded library technology at GSK;Christopher C. Arico-Muendel;Med.Chem.Comm.;第7卷;1898-1909 * |
Philip A. Harris. DNA-encoded library screening identifies benzo[b] [1,4]oxazepin-4-ones as highly potent and mono-selective receptor interacting protein 1 (RIP1) kinase inhibitors.Journal of Medicinal Chemistry.2016,第59卷2163-2164. * |
Reaction Development for DNA-Encoded Library Technology: From Evolution to Revolution?;Katharina Götte;Tetrahedron Letters;第61卷;151889-151899 * |
Systematic Evaluation and Optimization of Modification Reactions of Oligonucleotides with Amines and Carboxylic Acids for the Synthesis of DNA-Encoded Chemical Libraries;Raphael M. Franzini;Bioconjugate Chem.;第25卷;1453-1461 * |
Also Published As
Publication number | Publication date |
---|---|
CN113636931A (zh) | 2021-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Usanov et al. | Second-generation DNA-templated macrocycle libraries for the discovery of bioactive small molecules | |
CN113698441B (zh) | 一种将末端炔烃转化为羧酸的方法及其在基因编码库构建中的应用 | |
US10240147B2 (en) | Production of encoded chemical libraries | |
US20090163371A1 (en) | Anchor-Assisted Fragment Selection and Directed Assembly | |
CN113735916B (zh) | 一种将末端炔烃转化为酰胺的方法及其在基因编码库构建中的应用 | |
CN110818749B (zh) | DNA编码化合物库构建中On-DNA芳基磺酰胺类化合物的合成方法 | |
Dockerill et al. | DNA‐Encoded Libraries: Towards Harnessing their Full Power with Darwinian Evolution | |
US11814621B2 (en) | Expanding the chemical substrates for genetic code reprogramming | |
CN113636931B (zh) | 基因编码化合物库起始头片段化合物及其在基因编码化合物库合成上的应用 | |
CN114478671A (zh) | 一种脒基脲类先导化合物及其合成方法 | |
US20150321164A1 (en) | Method for synthesizing and screening lead compound and reagent testing kit | |
US11384205B2 (en) | Sequence-defined polymers and methods of making same and using same | |
US20030228619A1 (en) | Peptide nucleic acids as tags in encoded libraries | |
CN113355379A (zh) | 一种经济实用的核酸链5’-羟基磷酸化方法 | |
CN114853822A (zh) | 一种寡聚核苷酸-二硫化物及其合成方法 | |
CN115286671B (zh) | 一种寡聚核酸-噻唑烷类化合物、合成方法、应用 | |
CN111620921B (zh) | DNA编码化合物库构建中通过氧化酰胺化制备On-DNA酰胺化合物的方法 | |
CN115353539B (zh) | 寡聚核酸-四氢噻唑类化合物在基因编码化合物库合成上的应用 | |
CN114277446A (zh) | 一种一锅法合成基因编码β-内酰胺化合物库的方法 | |
US20240044909A1 (en) | Determination of protein information by recoding amino acid polymers into dna polymers | |
CN111675744B (zh) | 一种可溶于有机溶剂的dna编码化合物及其中间体化合物 | |
CN116411355A (zh) | 一种寡聚核酸-硫代磷酸酯类化合物及其合成方法 | |
CN117758374A (zh) | 一种On-DNAα-羟基烯烃类先导化合物及其合成方法 | |
CN112661803A (zh) | DNA编码化合物库构建中On-DNA 4-胺基喹唑啉化合物的合成方法 | |
CN113388894A (zh) | 一种DNA编码化合物库构建中On-DNA的芳基烯烃官能团化的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |