CN116768951A - 含有芳香族含氮骨架的dna编码化合物及其合成方法、dna编码化合物库 - Google Patents
含有芳香族含氮骨架的dna编码化合物及其合成方法、dna编码化合物库 Download PDFInfo
- Publication number
- CN116768951A CN116768951A CN202210230598.8A CN202210230598A CN116768951A CN 116768951 A CN116768951 A CN 116768951A CN 202210230598 A CN202210230598 A CN 202210230598A CN 116768951 A CN116768951 A CN 116768951A
- Authority
- CN
- China
- Prior art keywords
- group
- dna
- acid
- solvent
- amino
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 150000001875 compounds Chemical class 0.000 title claims abstract description 125
- 238000001308 synthesis method Methods 0.000 title description 4
- 238000000034 method Methods 0.000 claims abstract description 39
- 238000005859 coupling reaction Methods 0.000 claims abstract description 21
- -1 cyano, nitro, amino Chemical group 0.000 claims description 223
- FXHOOIRPVKKKFG-UHFFFAOYSA-N N,N-Dimethylacetamide Chemical compound CN(C)C(C)=O FXHOOIRPVKKKFG-UHFFFAOYSA-N 0.000 claims description 58
- 238000006243 chemical reaction Methods 0.000 claims description 53
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 53
- 125000001424 substituent group Chemical group 0.000 claims description 50
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical group [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 claims description 48
- 239000002904 solvent Substances 0.000 claims description 41
- 229910001868 water Inorganic materials 0.000 claims description 38
- KDLHZDBZIXYQEI-UHFFFAOYSA-N Palladium Chemical compound [Pd] KDLHZDBZIXYQEI-UHFFFAOYSA-N 0.000 claims description 35
- 150000002367 halogens Chemical class 0.000 claims description 32
- 229910052736 halogen Inorganic materials 0.000 claims description 31
- 239000003153 chemical reaction reagent Substances 0.000 claims description 29
- 238000002156 mixing Methods 0.000 claims description 28
- GITFHTZGVMIBGS-UHFFFAOYSA-M chloropalladium(1+);ditert-butyl-[2-[2,4,6-tri(propan-2-yl)phenyl]phenyl]phosphane;2-phenylethanamine Chemical group [Pd+]Cl.NCCC1=CC=CC=[C-]1.CC(C)C1=CC(C(C)C)=CC(C(C)C)=C1C1=CC=CC=C1P(C(C)(C)C)C(C)(C)C GITFHTZGVMIBGS-UHFFFAOYSA-M 0.000 claims description 25
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 claims description 23
- 125000003118 aryl group Chemical group 0.000 claims description 22
- 239000003054 catalyst Substances 0.000 claims description 22
- 229920006395 saturated elastomer Polymers 0.000 claims description 22
- 125000000217 alkyl group Chemical group 0.000 claims description 20
- 125000004432 carbon atom Chemical group C* 0.000 claims description 20
- YBYIRNPNPLQARY-UHFFFAOYSA-N 1H-indene Natural products C1=CC=C2CC=CC2=C1 YBYIRNPNPLQARY-UHFFFAOYSA-N 0.000 claims description 19
- 125000003454 indenyl group Chemical group C1(C=CC2=CC=CC=C12)* 0.000 claims description 19
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 claims description 18
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 claims description 18
- ZMXDDKWLCZADIW-UHFFFAOYSA-N N,N-Dimethylformamide Chemical compound CN(C)C=O ZMXDDKWLCZADIW-UHFFFAOYSA-N 0.000 claims description 18
- 229910052799 carbon Inorganic materials 0.000 claims description 17
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 claims description 16
- 229910052784 alkaline earth metal Inorganic materials 0.000 claims description 16
- 125000000027 (C1-C10) alkoxy group Chemical group 0.000 claims description 15
- 235000001014 amino acid Nutrition 0.000 claims description 15
- 229940024606 amino acid Drugs 0.000 claims description 15
- 239000002585 base Substances 0.000 claims description 15
- 229910052763 palladium Inorganic materials 0.000 claims description 15
- 125000001544 thienyl group Chemical group 0.000 claims description 15
- 125000004433 nitrogen atom Chemical group N* 0.000 claims description 14
- 229910052783 alkali metal Inorganic materials 0.000 claims description 13
- 150000001340 alkali metals Chemical class 0.000 claims description 13
- 150000001413 amino acids Chemical class 0.000 claims description 13
- 239000012445 acidic reagent Substances 0.000 claims description 12
- 239000003513 alkali Substances 0.000 claims description 12
- 125000004196 benzothienyl group Chemical group S1C(=CC2=C1C=CC=C2)* 0.000 claims description 12
- ZUOUZKKEUPVFJK-UHFFFAOYSA-N diphenyl Chemical compound C1=CC=CC=C1C1=CC=CC=C1 ZUOUZKKEUPVFJK-UHFFFAOYSA-N 0.000 claims description 12
- 125000004051 hexyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 claims description 12
- 125000001791 phenazinyl group Chemical group C1(=CC=CC2=NC3=CC=CC=C3N=C12)* 0.000 claims description 12
- 125000001484 phenothiazinyl group Chemical group C1(=CC=CC=2SC3=CC=CC=C3NC12)* 0.000 claims description 12
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 claims description 11
- 125000004435 hydrogen atom Chemical group [H]* 0.000 claims description 11
- XLYOFNOQVPJJNP-UHFFFAOYSA-M hydroxide Chemical compound [OH-] XLYOFNOQVPJJNP-UHFFFAOYSA-M 0.000 claims description 11
- 125000004169 (C1-C6) alkyl group Chemical group 0.000 claims description 10
- 125000003277 amino group Chemical group 0.000 claims description 10
- 125000004093 cyano group Chemical group *C#N 0.000 claims description 10
- 125000000753 cycloalkyl group Chemical group 0.000 claims description 10
- 229910052739 hydrogen Inorganic materials 0.000 claims description 10
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 claims description 10
- 125000004191 (C1-C6) alkoxy group Chemical group 0.000 claims description 9
- 125000000449 nitro group Chemical group [O-][N+](*)=O 0.000 claims description 9
- 125000003710 aryl alkyl group Chemical group 0.000 claims description 8
- 125000002887 hydroxy group Chemical group [H]O* 0.000 claims description 8
- 125000005913 (C3-C6) cycloalkyl group Chemical group 0.000 claims description 7
- 125000000732 arylene group Chemical group 0.000 claims description 7
- 125000003785 benzimidazolyl group Chemical group N1=C(NC2=C1C=CC=C2)* 0.000 claims description 7
- 238000006555 catalytic reaction Methods 0.000 claims description 7
- 229910052805 deuterium Inorganic materials 0.000 claims description 7
- 125000002541 furyl group Chemical group 0.000 claims description 7
- 125000000592 heterocycloalkyl group Chemical group 0.000 claims description 7
- 125000002883 imidazolyl group Chemical group 0.000 claims description 7
- 239000012046 mixed solvent Substances 0.000 claims description 7
- 125000001624 naphthyl group Chemical group 0.000 claims description 7
- 125000003373 pyrazinyl group Chemical group 0.000 claims description 7
- 125000003226 pyrazolyl group Chemical group 0.000 claims description 7
- 125000002098 pyridazinyl group Chemical group 0.000 claims description 7
- 125000004076 pyridyl group Chemical group 0.000 claims description 7
- 125000000714 pyrimidinyl group Chemical group 0.000 claims description 7
- 125000000168 pyrrolyl group Chemical group 0.000 claims description 7
- 125000003161 (C1-C6) alkylene group Chemical group 0.000 claims description 6
- 125000006714 (C3-C10) heterocyclyl group Chemical group 0.000 claims description 6
- 125000006708 (C5-C14) heteroaryl group Chemical group 0.000 claims description 6
- 125000006736 (C6-C20) aryl group Chemical group 0.000 claims description 6
- FNQJDLTXOVEEFB-UHFFFAOYSA-N 1,2,3-benzothiadiazole Chemical compound C1=CC=C2SN=NC2=C1 FNQJDLTXOVEEFB-UHFFFAOYSA-N 0.000 claims description 6
- 125000004502 1,2,3-oxadiazolyl group Chemical group 0.000 claims description 6
- 125000004511 1,2,3-thiadiazolyl group Chemical group 0.000 claims description 6
- 125000004529 1,2,3-triazinyl group Chemical group N1=NN=C(C=C1)* 0.000 claims description 6
- 125000001399 1,2,3-triazolyl group Chemical group N1N=NC(=C1)* 0.000 claims description 6
- 125000004504 1,2,4-oxadiazolyl group Chemical group 0.000 claims description 6
- 125000004514 1,2,4-thiadiazolyl group Chemical group 0.000 claims description 6
- 125000004530 1,2,4-triazinyl group Chemical group N1=NC(=NC=C1)* 0.000 claims description 6
- 125000001376 1,2,4-triazolyl group Chemical group N1N=C(N=C1)* 0.000 claims description 6
- 125000004506 1,2,5-oxadiazolyl group Chemical group 0.000 claims description 6
- 125000004517 1,2,5-thiadiazolyl group Chemical group 0.000 claims description 6
- 125000004520 1,3,4-thiadiazolyl group Chemical group 0.000 claims description 6
- 125000003363 1,3,5-triazinyl group Chemical group N1=C(N=CN=C1)* 0.000 claims description 6
- YJTKZCDBKVTVBY-UHFFFAOYSA-N 1,3-Diphenylbenzene Chemical group C1=CC=CC=C1C1=CC=CC(C=2C=CC=CC=2)=C1 YJTKZCDBKVTVBY-UHFFFAOYSA-N 0.000 claims description 6
- SXGMVGOVILIERA-UHFFFAOYSA-N 2,3-diaminobutanoic acid Chemical compound CC(N)C(N)C(O)=O SXGMVGOVILIERA-UHFFFAOYSA-N 0.000 claims description 6
- OYIFNHCXNCRBQI-UHFFFAOYSA-N 2-aminoadipic acid Chemical compound OC(=O)C(N)CCCC(O)=O OYIFNHCXNCRBQI-UHFFFAOYSA-N 0.000 claims description 6
- RDFMDVXONNIGBC-UHFFFAOYSA-N 2-aminoheptanoic acid Chemical compound CCCCCC(N)C(O)=O RDFMDVXONNIGBC-UHFFFAOYSA-N 0.000 claims description 6
- 239000005964 Acibenzolar-S-methyl Substances 0.000 claims description 6
- FMMWHPNWAFZXNH-UHFFFAOYSA-N Benz[a]pyrene Chemical compound C1=C2C3=CC=CC=C3C=C(C=C3)C2=C2C3=CC=CC2=C1 FMMWHPNWAFZXNH-UHFFFAOYSA-N 0.000 claims description 6
- 125000000041 C6-C10 aryl group Chemical group 0.000 claims description 6
- YZCKVEUIGOORGS-OUBTZVSYSA-N Deuterium Chemical compound [2H] YZCKVEUIGOORGS-OUBTZVSYSA-N 0.000 claims description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 6
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 claims description 6
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 claims description 6
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 6
- 239000004472 Lysine Substances 0.000 claims description 6
- KSPIYJQBLVDRRI-UHFFFAOYSA-N N-methylisoleucine Chemical compound CCC(C)C(NC)C(O)=O KSPIYJQBLVDRRI-UHFFFAOYSA-N 0.000 claims description 6
- DGEZNRSVGBDHLK-UHFFFAOYSA-N [1,10]phenanthroline Chemical group C1=CN=C2C3=NC=CC=C3C=CC2=C1 DGEZNRSVGBDHLK-UHFFFAOYSA-N 0.000 claims description 6
- QWCKQJZIFLGMSD-UHFFFAOYSA-N alpha-aminobutyric acid Chemical compound CCC(N)C(O)=O QWCKQJZIFLGMSD-UHFFFAOYSA-N 0.000 claims description 6
- 125000005428 anthryl group Chemical group [H]C1=C([H])C([H])=C2C([H])=C3C(*)=C([H])C([H])=C([H])C3=C([H])C2=C1[H] 0.000 claims description 6
- 125000004618 benzofuryl group Chemical group O1C(=CC2=C1C=CC=C2)* 0.000 claims description 6
- 125000001164 benzothiazolyl group Chemical group S1C(=NC2=C1C=CC=C2)* 0.000 claims description 6
- 125000004541 benzoxazolyl group Chemical group O1C(=NC2=C1C=CC=C2)* 0.000 claims description 6
- UCMIRNVEIXFBKS-UHFFFAOYSA-N beta-alanine Chemical compound NCCC(O)=O UCMIRNVEIXFBKS-UHFFFAOYSA-N 0.000 claims description 6
- 239000004305 biphenyl Substances 0.000 claims description 6
- 235000010290 biphenyl Nutrition 0.000 claims description 6
- 125000000609 carbazolyl group Chemical group C1(=CC=CC=2C3=CC=CC=C3NC12)* 0.000 claims description 6
- 125000004988 dibenzothienyl group Chemical group C1(=CC=CC=2SC3=C(C21)C=CC=C3)* 0.000 claims description 6
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 claims description 6
- 125000003983 fluorenyl group Chemical group C1(=CC=CC=2C3=CC=CC=C3CC12)* 0.000 claims description 6
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 claims description 6
- GNOIPBMMFNIUFM-UHFFFAOYSA-N hexamethylphosphoric triamide Chemical compound CN(C)P(=O)(N(C)C)N(C)C GNOIPBMMFNIUFM-UHFFFAOYSA-N 0.000 claims description 6
- 125000003453 indazolyl group Chemical group N1N=C(C2=C1C=CC=C2)* 0.000 claims description 6
- 125000003406 indolizinyl group Chemical group C=1(C=CN2C=CC=CC12)* 0.000 claims description 6
- 125000001041 indolyl group Chemical group 0.000 claims description 6
- 125000005990 isobenzothienyl group Chemical group 0.000 claims description 6
- 125000000904 isoindolyl group Chemical group C=1(NC=C2C=CC=CC12)* 0.000 claims description 6
- 125000002183 isoquinolinyl group Chemical group C1(=NC=CC2=CC=CC=C12)* 0.000 claims description 6
- 125000004957 naphthylene group Chemical group 0.000 claims description 6
- 125000004593 naphthyridinyl group Chemical group N1=C(C=CC2=CC=CN=C12)* 0.000 claims description 6
- 125000003933 pentacenyl group Chemical group C1(=CC=CC2=CC3=CC4=CC5=CC=CC=C5C=C4C=C3C=C12)* 0.000 claims description 6
- 125000002080 perylenyl group Chemical group C1(=CC=C2C=CC=C3C4=CC=CC5=CC=CC(C1=C23)=C45)* 0.000 claims description 6
- CSHWQDPOILHKBI-UHFFFAOYSA-N peryrene Natural products C1=CC(C2=CC=CC=3C2=C2C=CC=3)=C3C2=CC=CC3=C1 CSHWQDPOILHKBI-UHFFFAOYSA-N 0.000 claims description 6
- 125000005561 phenanthryl group Chemical group 0.000 claims description 6
- 125000000843 phenylene group Chemical group C1(=C(C=CC=C1)*)* 0.000 claims description 6
- 239000002798 polar solvent Substances 0.000 claims description 6
- 125000001042 pteridinyl group Chemical group N1=C(N=CC2=NC=CN=C12)* 0.000 claims description 6
- 125000000561 purinyl group Chemical group N1=C(N=C2N=CNC2=C1)* 0.000 claims description 6
- 125000005550 pyrazinylene group Chemical group 0.000 claims description 6
- 125000001725 pyrenyl group Chemical group 0.000 claims description 6
- 125000005551 pyridylene group Chemical group 0.000 claims description 6
- 125000002943 quinolinyl group Chemical group N1=C(C=CC2=CC=CC=C12)* 0.000 claims description 6
- 125000001567 quinoxalinyl group Chemical group N1=C(C=NC2=CC=CC=C12)* 0.000 claims description 6
- IFLREYGFSNHWGE-UHFFFAOYSA-N tetracene Chemical compound C1=CC=CC2=CC3=CC4=CC=CC=C4C=C3C=C21 IFLREYGFSNHWGE-UHFFFAOYSA-N 0.000 claims description 6
- 125000003831 tetrazolyl group Chemical group 0.000 claims description 6
- CPDDXQJCPYHULE-UHFFFAOYSA-N 4,5,14,16-tetrazapentacyclo[9.7.1.12,6.015,19.010,20]icosa-1(18),2,4,6,8,10(20),11(19),12,14,16-decaene Chemical group C1=CC(C2=CC=CC=3C2=C2C=NN=3)=C3C2=CC=NC3=N1 CPDDXQJCPYHULE-UHFFFAOYSA-N 0.000 claims description 5
- 150000008044 alkali metal hydroxides Chemical class 0.000 claims description 5
- 125000003354 benzotriazolyl group Chemical group N1N=NC2=C1C=CC=C2* 0.000 claims description 5
- QTBSBXVTEAMEQO-UHFFFAOYSA-N acetic acid Substances CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 claims description 4
- 150000004945 aromatic hydrocarbons Chemical class 0.000 claims description 4
- 125000005556 thienylene group Chemical group 0.000 claims description 4
- BJBUEDPLEOHJGE-UHFFFAOYSA-N (2R,3S)-3-Hydroxy-2-pyrolidinecarboxylic acid Natural products OC1CCNC1C(O)=O BJBUEDPLEOHJGE-UHFFFAOYSA-N 0.000 claims description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 claims description 3
- 125000006590 (C2-C6) alkenylene group Chemical group 0.000 claims description 3
- 125000006591 (C2-C6) alkynylene group Chemical group 0.000 claims description 3
- 125000006586 (C3-C10) cycloalkylene group Chemical group 0.000 claims description 3
- JHTPBGFVWWSHDL-UHFFFAOYSA-N 1,4-dichloro-2-isothiocyanatobenzene Chemical compound ClC1=CC=C(Cl)C(N=C=S)=C1 JHTPBGFVWWSHDL-UHFFFAOYSA-N 0.000 claims description 3
- OGNSCSPNOLGXSM-UHFFFAOYSA-N 2,4-diaminobutyric acid Chemical compound NCCC(N)C(O)=O OGNSCSPNOLGXSM-UHFFFAOYSA-N 0.000 claims description 3
- DRMDGQXVYQXMFW-UHFFFAOYSA-N 2-(ethylamino)butanedioic acid Chemical compound CCNC(C(O)=O)CC(O)=O DRMDGQXVYQXMFW-UHFFFAOYSA-N 0.000 claims description 3
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical compound CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 claims description 3
- XABCFXXGZPWJQP-UHFFFAOYSA-N 3-aminoadipic acid Chemical compound OC(=O)CC(N)CCC(O)=O XABCFXXGZPWJQP-UHFFFAOYSA-N 0.000 claims description 3
- SLXKOJJOQWFEFD-UHFFFAOYSA-N 6-aminohexanoic acid Chemical compound NCCCCCC(O)=O SLXKOJJOQWFEFD-UHFFFAOYSA-N 0.000 claims description 3
- 239000004475 Arginine Substances 0.000 claims description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 3
- 239000004471 Glycine Substances 0.000 claims description 3
- LCWXJXMHJVIJFK-UHFFFAOYSA-N Hydroxylysine Natural products NCC(O)CC(N)CC(O)=O LCWXJXMHJVIJFK-UHFFFAOYSA-N 0.000 claims description 3
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 claims description 3
- SNDPXSYFESPGGJ-BYPYZUCNSA-N L-2-aminopentanoic acid Chemical compound CCC[C@H](N)C(O)=O SNDPXSYFESPGGJ-BYPYZUCNSA-N 0.000 claims description 3
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 claims description 3
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 claims description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 3
- AGPKZVBTJJNPAG-UHNVWZDZSA-N L-allo-Isoleucine Chemical compound CC[C@@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-UHNVWZDZSA-N 0.000 claims description 3
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 claims description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 3
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 claims description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 3
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 3
- SNDPXSYFESPGGJ-UHFFFAOYSA-N L-norVal-OH Natural products CCCC(N)C(O)=O SNDPXSYFESPGGJ-UHFFFAOYSA-N 0.000 claims description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 claims description 3
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 claims description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 claims description 3
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 3
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 3
- YPIGGYHFMKJNKV-UHFFFAOYSA-N N-ethylglycine Chemical compound CC[NH2+]CC([O-])=O YPIGGYHFMKJNKV-UHFFFAOYSA-N 0.000 claims description 3
- 108010065338 N-ethylglycine Proteins 0.000 claims description 3
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 3
- 239000004473 Threonine Substances 0.000 claims description 3
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 claims description 3
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 3
- 235000004279 alanine Nutrition 0.000 claims description 3
- 125000004450 alkenylene group Chemical group 0.000 claims description 3
- 229960002684 aminocaproic acid Drugs 0.000 claims description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 3
- 235000009697 arginine Nutrition 0.000 claims description 3
- 235000003704 aspartic acid Nutrition 0.000 claims description 3
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 3
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims description 3
- 235000018417 cysteine Nutrition 0.000 claims description 3
- YSMODUONRAFBET-UHFFFAOYSA-N delta-DL-hydroxylysine Natural products NCC(O)CCC(N)C(O)=O YSMODUONRAFBET-UHFFFAOYSA-N 0.000 claims description 3
- YSMODUONRAFBET-UHNVWZDZSA-N erythro-5-hydroxy-L-lysine Chemical compound NC[C@H](O)CC[C@H](N)C(O)=O YSMODUONRAFBET-UHNVWZDZSA-N 0.000 claims description 3
- 229960003692 gamma aminobutyric acid Drugs 0.000 claims description 3
- 229930195712 glutamate Natural products 0.000 claims description 3
- 235000013922 glutamic acid Nutrition 0.000 claims description 3
- 239000004220 glutamic acid Substances 0.000 claims description 3
- 125000005549 heteroarylene group Chemical group 0.000 claims description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims description 3
- QJHBJHUKURJDLG-UHFFFAOYSA-N hydroxy-L-lysine Natural products NCCCCC(NO)C(O)=O QJHBJHUKURJDLG-UHFFFAOYSA-N 0.000 claims description 3
- 229960002591 hydroxyproline Drugs 0.000 claims description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 3
- 229960000310 isoleucine Drugs 0.000 claims description 3
- 125000005647 linker group Chemical group 0.000 claims description 3
- 239000003550 marker Substances 0.000 claims description 3
- 229930182817 methionine Natural products 0.000 claims description 3
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims description 3
- 125000000475 sulfinyl group Chemical group [*:2]S([*:1])=O 0.000 claims description 3
- 125000000472 sulfonyl group Chemical group *S(*)(=O)=O 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- YSMODUONRAFBET-WHFBIAKZSA-N threo-5-hydroxy-L-lysine Chemical compound NC[C@@H](O)CC[C@H](N)C(O)=O YSMODUONRAFBET-WHFBIAKZSA-N 0.000 claims description 3
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 claims description 3
- 239000004474 valine Substances 0.000 claims description 3
- 125000002485 formyl group Chemical class [H]C(*)=O 0.000 claims 3
- 229910000288 alkali metal carbonate Inorganic materials 0.000 claims 2
- 150000008041 alkali metal carbonates Chemical class 0.000 claims 2
- 229910000272 alkali metal oxide Inorganic materials 0.000 claims 2
- 229910001860 alkaline earth metal hydroxide Inorganic materials 0.000 claims 2
- 229910000287 alkaline earth metal oxide Inorganic materials 0.000 claims 2
- BJBUEDPLEOHJGE-IMJSIDKUSA-N trans-3-hydroxy-L-proline Chemical compound O[C@H]1CC[NH2+][C@@H]1C([O-])=O BJBUEDPLEOHJGE-IMJSIDKUSA-N 0.000 claims 1
- CKUAXEQHGKSLHN-UHFFFAOYSA-N [C].[N] Chemical compound [C].[N] CKUAXEQHGKSLHN-UHFFFAOYSA-N 0.000 abstract description 2
- 108020004414 DNA Proteins 0.000 description 98
- 239000000243 solution Substances 0.000 description 85
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 39
- 239000000047 product Substances 0.000 description 30
- 239000000203 mixture Substances 0.000 description 28
- JGFZNNIVVJXRND-UHFFFAOYSA-N N,N-Diisopropylethylamine (DIPEA) Chemical compound CCN(C(C)C)C(C)C JGFZNNIVVJXRND-UHFFFAOYSA-N 0.000 description 24
- 238000001819 mass spectrum Methods 0.000 description 20
- 239000000126 substance Substances 0.000 description 19
- 238000010276 construction Methods 0.000 description 18
- 239000007864 aqueous solution Substances 0.000 description 17
- 238000012869 ethanol precipitation Methods 0.000 description 17
- 238000000108 ultra-filtration Methods 0.000 description 17
- 230000015572 biosynthetic process Effects 0.000 description 16
- 239000000872 buffer Substances 0.000 description 16
- 239000008367 deionised water Substances 0.000 description 15
- 229910021641 deionized water Inorganic materials 0.000 description 15
- 238000003786 synthesis reaction Methods 0.000 description 15
- 239000007821 HATU Substances 0.000 description 12
- 125000005842 heteroatom Chemical group 0.000 description 11
- 125000000623 heterocyclic group Chemical group 0.000 description 11
- 239000000463 material Substances 0.000 description 10
- 229910052760 oxygen Inorganic materials 0.000 description 10
- 239000000758 substrate Substances 0.000 description 10
- 238000001269 time-of-flight mass spectrometry Methods 0.000 description 10
- SJRJJKPEHAURKC-UHFFFAOYSA-N N-Methylmorpholine Chemical compound CN1CCOCC1 SJRJJKPEHAURKC-UHFFFAOYSA-N 0.000 description 9
- 230000008878 coupling Effects 0.000 description 9
- 238000010168 coupling process Methods 0.000 description 9
- 238000004949 mass spectrometry Methods 0.000 description 9
- 238000011084 recovery Methods 0.000 description 9
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 8
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 8
- 229940125904 compound 1 Drugs 0.000 description 8
- 238000004090 dissolution Methods 0.000 description 8
- 229910052757 nitrogen Inorganic materials 0.000 description 8
- 238000012216 screening Methods 0.000 description 8
- 238000005406 washing Methods 0.000 description 8
- BAXOFTOLAUCFNW-UHFFFAOYSA-N 1H-indazole Chemical compound C1=CC=C2C=NNC2=C1 BAXOFTOLAUCFNW-UHFFFAOYSA-N 0.000 description 7
- 102000003960 Ligases Human genes 0.000 description 7
- 108090000364 Ligases Proteins 0.000 description 7
- 229940125773 compound 10 Drugs 0.000 description 7
- 125000001072 heteroaryl group Chemical group 0.000 description 7
- 150000002430 hydrocarbons Chemical group 0.000 description 7
- ZLVXBBHTMQJRSX-VMGNSXQWSA-N jdtic Chemical compound C1([C@]2(C)CCN(C[C@@H]2C)C[C@H](C(C)C)NC(=O)[C@@H]2NCC3=CC(O)=CC=C3C2)=CC=CC(O)=C1 ZLVXBBHTMQJRSX-VMGNSXQWSA-N 0.000 description 7
- 229910052717 sulfur Inorganic materials 0.000 description 7
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 6
- 150000001299 aldehydes Chemical class 0.000 description 6
- 150000001342 alkaline earth metals Chemical class 0.000 description 6
- 125000002619 bicyclic group Chemical group 0.000 description 6
- 125000002950 monocyclic group Chemical group 0.000 description 6
- QAPTWHXHEYAIKG-RCOXNQKVSA-N n-[(1r,2s,5r)-5-(tert-butylamino)-2-[(3s)-2-oxo-3-[[6-(trifluoromethyl)quinazolin-4-yl]amino]pyrrolidin-1-yl]cyclohexyl]acetamide Chemical compound CC(=O)N[C@@H]1C[C@H](NC(C)(C)C)CC[C@@H]1N1C(=O)[C@@H](NC=2C3=CC(=CC=C3N=CN=2)C(F)(F)F)CC1 QAPTWHXHEYAIKG-RCOXNQKVSA-N 0.000 description 6
- 239000000843 powder Substances 0.000 description 6
- 230000001376 precipitating effect Effects 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- GHYOCDFICYLMRF-UTIIJYGPSA-N (2S,3R)-N-[(2S)-3-(cyclopenten-1-yl)-1-[(2R)-2-methyloxiran-2-yl]-1-oxopropan-2-yl]-3-hydroxy-3-(4-methoxyphenyl)-2-[[(2S)-2-[(2-morpholin-4-ylacetyl)amino]propanoyl]amino]propanamide Chemical compound C1(=CCCC1)C[C@@H](C(=O)[C@@]1(OC1)C)NC([C@H]([C@@H](C1=CC=C(C=C1)OC)O)NC([C@H](C)NC(CN1CCOCC1)=O)=O)=O GHYOCDFICYLMRF-UTIIJYGPSA-N 0.000 description 5
- 150000001412 amines Chemical class 0.000 description 5
- 150000001502 aryl halides Chemical class 0.000 description 5
- 125000004429 atom Chemical group 0.000 description 5
- 239000000460 chlorine Substances 0.000 description 5
- 229940125797 compound 12 Drugs 0.000 description 5
- 239000008176 lyophilized powder Substances 0.000 description 5
- 125000006413 ring segment Chemical group 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 238000001196 time-of-flight mass spectrum Methods 0.000 description 5
- PAYRUJLWNCNPSJ-UHFFFAOYSA-N Aniline Chemical compound NC1=CC=CC=C1 PAYRUJLWNCNPSJ-UHFFFAOYSA-N 0.000 description 4
- WTKZEGDFNFYCGP-UHFFFAOYSA-N Pyrazole Chemical compound C=1C=NNC=1 WTKZEGDFNFYCGP-UHFFFAOYSA-N 0.000 description 4
- YLEIFZAVNWDOBM-ZTNXSLBXSA-N ac1l9hc7 Chemical compound C([C@H]12)C[C@@H](C([C@@H](O)CC3)(C)C)[C@@]43C[C@@]14CC[C@@]1(C)[C@@]2(C)C[C@@H]2O[C@]3(O)[C@H](O)C(C)(C)O[C@@H]3[C@@H](C)[C@H]12 YLEIFZAVNWDOBM-ZTNXSLBXSA-N 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- HUMNYLRZRPPJDN-UHFFFAOYSA-N benzaldehyde Chemical compound O=CC1=CC=CC=C1 HUMNYLRZRPPJDN-UHFFFAOYSA-N 0.000 description 4
- WPYMKLBDIGXBTP-UHFFFAOYSA-N benzoic acid Chemical compound OC(=O)C1=CC=CC=C1 WPYMKLBDIGXBTP-UHFFFAOYSA-N 0.000 description 4
- 239000012295 chemical reaction liquid Substances 0.000 description 4
- 238000006482 condensation reaction Methods 0.000 description 4
- LMBWSYZSUOEYSN-UHFFFAOYSA-N diethyldithiocarbamic acid Chemical compound CCN(CC)C(S)=S LMBWSYZSUOEYSN-UHFFFAOYSA-N 0.000 description 4
- 229950004394 ditiocarb Drugs 0.000 description 4
- 229910052740 iodine Inorganic materials 0.000 description 4
- 229910052751 metal Inorganic materials 0.000 description 4
- 239000002184 metal Substances 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000001556 precipitation Methods 0.000 description 4
- 239000002516 radical scavenger Substances 0.000 description 4
- 150000003384 small molecules Chemical class 0.000 description 4
- BMTZEAOGFDXDAD-UHFFFAOYSA-M 4-(4,6-dimethoxy-1,3,5-triazin-2-yl)-4-methylmorpholin-4-ium;chloride Chemical compound [Cl-].COC1=NC(OC)=NC([N+]2(C)CCOCC2)=N1 BMTZEAOGFDXDAD-UHFFFAOYSA-M 0.000 description 3
- UHOVQNZJYSORNB-UHFFFAOYSA-N Benzene Chemical compound C1=CC=CC=C1 UHOVQNZJYSORNB-UHFFFAOYSA-N 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 125000003342 alkenyl group Chemical group 0.000 description 3
- 229910021538 borax Inorganic materials 0.000 description 3
- 239000007853 buffer solution Substances 0.000 description 3
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 3
- 125000001995 cyclobutyl group Chemical group [H]C1([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 3
- 125000000113 cyclohexyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 3
- 125000001511 cyclopentyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 3
- 125000001559 cyclopropyl group Chemical group [H]C1([H])C([H])([H])C1([H])* 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 239000011259 mixed solution Substances 0.000 description 3
- 125000006239 protecting group Chemical group 0.000 description 3
- 102000004169 proteins and genes Human genes 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- 235000010339 sodium tetraborate Nutrition 0.000 description 3
- BSVBQGMMJUBVOD-UHFFFAOYSA-N trisodium borate Chemical compound [Na+].[Na+].[Na+].[O-]B([O-])[O-] BSVBQGMMJUBVOD-UHFFFAOYSA-N 0.000 description 3
- QFLWZFQWSBQYPS-AWRAUJHKSA-N (3S)-3-[[(2S)-2-[[(2S)-2-[5-[(3aS,6aR)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]pentanoylamino]-3-methylbutanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-4-[1-bis(4-chlorophenoxy)phosphorylbutylamino]-4-oxobutanoic acid Chemical compound CCCC(NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H](NC(=O)CCCCC1SC[C@@H]2NC(=O)N[C@H]12)C(C)C)P(=O)(Oc1ccc(Cl)cc1)Oc1ccc(Cl)cc1 QFLWZFQWSBQYPS-AWRAUJHKSA-N 0.000 description 2
- KGKZHHIUOZGUNP-UHFFFAOYSA-N 1h-indazole-4-carboxylic acid Chemical group OC(=O)C1=CC=CC2=C1C=NN2 KGKZHHIUOZGUNP-UHFFFAOYSA-N 0.000 description 2
- UDLGTTKXEYIEMM-UHFFFAOYSA-N 3-bromo-1-benzothiophene-2-carboxylic acid Chemical compound C1=CC=C2C(Br)=C(C(=O)O)SC2=C1 UDLGTTKXEYIEMM-UHFFFAOYSA-N 0.000 description 2
- KBDIRPOTVAODSA-UHFFFAOYSA-N 3-bromopyridine-2-carboxylic acid Chemical compound OC(=O)C1=NC=CC=C1Br KBDIRPOTVAODSA-UHFFFAOYSA-N 0.000 description 2
- QOWSWEBLNVACCL-UHFFFAOYSA-N 4-Bromophenyl acetate Chemical compound OC(=O)CC1=CC=C(Br)C=C1 QOWSWEBLNVACCL-UHFFFAOYSA-N 0.000 description 2
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 2
- 239000005711 Benzoic acid Substances 0.000 description 2
- 239000004215 Carbon black (E152) Substances 0.000 description 2
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 description 2
- OKKJLVBELUTLKV-MZCSYVLQSA-N Deuterated methanol Chemical compound [2H]OC([2H])([2H])[2H] OKKJLVBELUTLKV-MZCSYVLQSA-N 0.000 description 2
- RRSNDVCODIMOFX-MPKOGUQCSA-N Fc1c(Cl)cccc1[C@H]1[C@@H](NC2(CCCCC2)[C@@]11C(=O)Nc2cc(Cl)ccc12)C(=O)Nc1ccc(cc1)C(=O)NCCCCCc1cccc2C(=O)N(Cc12)C1CCC(=O)NC1=O Chemical compound Fc1c(Cl)cccc1[C@H]1[C@@H](NC2(CCCCC2)[C@@]11C(=O)Nc2cc(Cl)ccc12)C(=O)Nc1ccc(cc1)C(=O)NCCCCCc1cccc2C(=O)N(Cc12)C1CCC(=O)NC1=O RRSNDVCODIMOFX-MPKOGUQCSA-N 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 238000005481 NMR spectroscopy Methods 0.000 description 2
- KAESVJOAVNADME-UHFFFAOYSA-N Pyrrole Chemical compound C=1C=CNC=1 KAESVJOAVNADME-UHFFFAOYSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- HEDRZPFGACZZDS-MICDWDOJSA-N Trichloro(2H)methane Chemical compound [2H]C(Cl)(Cl)Cl HEDRZPFGACZZDS-MICDWDOJSA-N 0.000 description 2
- YZCKVEUIGOORGS-NJFSPNSNSA-N Tritium Chemical compound [3H] YZCKVEUIGOORGS-NJFSPNSNSA-N 0.000 description 2
- 125000003172 aldehyde group Chemical group 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 125000002393 azetidinyl group Chemical group 0.000 description 2
- 125000005605 benzo group Chemical group 0.000 description 2
- 235000010233 benzoic acid Nutrition 0.000 description 2
- KGBXLFKZBHKPEV-UHFFFAOYSA-N boric acid Chemical compound OB(O)O KGBXLFKZBHKPEV-UHFFFAOYSA-N 0.000 description 2
- 239000004327 boric acid Substances 0.000 description 2
- HUCVOHYBFXVBRW-UHFFFAOYSA-M caesium hydroxide Chemical compound [OH-].[Cs+] HUCVOHYBFXVBRW-UHFFFAOYSA-M 0.000 description 2
- 229910052801 chlorine Inorganic materials 0.000 description 2
- BJBUEDPLEOHJGE-IUYQGCFVSA-N cis-3-hydroxy-D-proline zwitterion Chemical compound O[C@H]1CCN[C@H]1C(O)=O BJBUEDPLEOHJGE-IUYQGCFVSA-N 0.000 description 2
- 229940125898 compound 5 Drugs 0.000 description 2
- 125000002993 cycloalkylene group Chemical group 0.000 description 2
- 125000000582 cycloheptyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 2
- 125000000640 cyclooctyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C([H])([H])C1([H])[H] 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000002330 electrospray ionisation mass spectrometry Methods 0.000 description 2
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 2
- 229910052731 fluorine Inorganic materials 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 238000004128 high performance liquid chromatography Methods 0.000 description 2
- 238000013537 high throughput screening Methods 0.000 description 2
- 229930195733 hydrocarbon Natural products 0.000 description 2
- 150000002473 indoazoles Chemical class 0.000 description 2
- 239000011630 iodine Substances 0.000 description 2
- 230000003447 ipsilateral effect Effects 0.000 description 2
- 125000000959 isobutyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])* 0.000 description 2
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 2
- 238000012917 library technology Methods 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 125000004108 n-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 2
- 125000000740 n-pentyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 2
- 125000004123 n-propyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])* 0.000 description 2
- 239000002547 new drug Substances 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- MUJIDPITZJWBSW-UHFFFAOYSA-N palladium(2+) Chemical compound [Pd+2] MUJIDPITZJWBSW-UHFFFAOYSA-N 0.000 description 2
- QNGNSVIICDLXHT-UHFFFAOYSA-N para-ethylbenzaldehyde Natural products CCC1=CC=C(C=O)C=C1 QNGNSVIICDLXHT-UHFFFAOYSA-N 0.000 description 2
- 239000008363 phosphate buffer Substances 0.000 description 2
- 125000003367 polycyclic group Chemical group 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 239000002244 precipitate Substances 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- 125000002914 sec-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 2
- 125000003003 spiro group Chemical group 0.000 description 2
- 239000011593 sulfur Substances 0.000 description 2
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 2
- 229910052722 tritium Inorganic materials 0.000 description 2
- 125000004178 (C1-C4) alkyl group Chemical group 0.000 description 1
- 125000003088 (fluoren-9-ylmethoxy)carbonyl group Chemical group 0.000 description 1
- GELUWKWLLGPUHA-UHFFFAOYSA-N 1-benzothiophene;hydrobromide Chemical compound Br.C1=CC=C2SC=CC2=C1 GELUWKWLLGPUHA-UHFFFAOYSA-N 0.000 description 1
- 125000006017 1-propenyl group Chemical group 0.000 description 1
- BHXVYTQDWMQVBI-UHFFFAOYSA-N 1h-indazole-3-carboxylic acid Chemical group C1=CC=C2C(C(=O)O)=NNC2=C1 BHXVYTQDWMQVBI-UHFFFAOYSA-N 0.000 description 1
- JVVRJMXHNUAPHW-UHFFFAOYSA-N 1h-pyrazol-5-amine Chemical compound NC=1C=CNN=1 JVVRJMXHNUAPHW-UHFFFAOYSA-N 0.000 description 1
- 125000004974 2-butenyl group Chemical group C(C=CC)* 0.000 description 1
- 125000006040 2-hexenyl group Chemical group 0.000 description 1
- 125000006022 2-methyl-2-propenyl group Chemical group 0.000 description 1
- 125000006024 2-pentenyl group Chemical group 0.000 description 1
- YNKVCLQNSSTHTD-UHFFFAOYSA-N 3,9-diazaspiro[5.5]undecane Chemical compound C1CNCCC21CCNCC2 YNKVCLQNSSTHTD-UHFFFAOYSA-N 0.000 description 1
- KPUSZZFAYGWAHZ-UHFFFAOYSA-N 3-azabicyclo[2.2.2]octane Chemical compound C1CC2CCC1NC2 KPUSZZFAYGWAHZ-UHFFFAOYSA-N 0.000 description 1
- 125000004975 3-butenyl group Chemical group C(CC=C)* 0.000 description 1
- 125000006041 3-hexenyl group Chemical group 0.000 description 1
- 125000006042 4-hexenyl group Chemical group 0.000 description 1
- 125000003119 4-methyl-3-pentenyl group Chemical group [H]\C(=C(/C([H])([H])[H])C([H])([H])[H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000006043 5-hexenyl group Chemical group 0.000 description 1
- 241001156002 Anthonomus pomorum Species 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-M Bicarbonate Chemical compound OC([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-M 0.000 description 1
- WKBOTKDWSSQWDR-UHFFFAOYSA-N Bromine atom Chemical compound [Br] WKBOTKDWSSQWDR-UHFFFAOYSA-N 0.000 description 1
- 125000000882 C2-C6 alkenyl group Chemical group 0.000 description 1
- OKTJSMMVPCPJKN-NJFSPNSNSA-N Carbon-14 Chemical compound [14C] OKTJSMMVPCPJKN-NJFSPNSNSA-N 0.000 description 1
- IAYPIBMASNFSPL-UHFFFAOYSA-N Ethylene oxide Chemical compound C1CO1 IAYPIBMASNFSPL-UHFFFAOYSA-N 0.000 description 1
- PXGOKWXKJXAPGV-UHFFFAOYSA-N Fluorine Chemical compound FF PXGOKWXKJXAPGV-UHFFFAOYSA-N 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- CSCPPACGZOOCGX-WFGJKAKNSA-N acetone d6 Chemical compound [2H]C([2H])([2H])C(=O)C([2H])([2H])[2H] CSCPPACGZOOCGX-WFGJKAKNSA-N 0.000 description 1
- 125000000641 acridinyl group Chemical group C1(=CC=CC2=NC3=CC=CC=C3C=C12)* 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 150000001338 aliphatic hydrocarbons Chemical class 0.000 description 1
- 125000002947 alkylene group Chemical group 0.000 description 1
- 125000000304 alkynyl group Chemical group 0.000 description 1
- HSFWRNGVRCDJHI-UHFFFAOYSA-N alpha-acetylene Natural products C#C HSFWRNGVRCDJHI-UHFFFAOYSA-N 0.000 description 1
- 150000001448 anilines Chemical class 0.000 description 1
- 150000001499 aryl bromides Chemical class 0.000 description 1
- 238000006254 arylation reaction Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- AXMNGEUJXLXFRY-UHFFFAOYSA-N azaspirodecane Chemical compound C1CCCC21CCNCC2 AXMNGEUJXLXFRY-UHFFFAOYSA-N 0.000 description 1
- 125000004069 aziridinyl group Chemical group 0.000 description 1
- QRUDEWIWKLJBPS-UHFFFAOYSA-N benzotriazole Chemical compound C1=CC=C2N[N][N]C2=C1 QRUDEWIWKLJBPS-UHFFFAOYSA-N 0.000 description 1
- 239000012964 benzotriazole Substances 0.000 description 1
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- GDTBXPJZTBHREO-UHFFFAOYSA-N bromine Substances BrBr GDTBXPJZTBHREO-UHFFFAOYSA-N 0.000 description 1
- 229910052794 bromium Inorganic materials 0.000 description 1
- DUEPRVBVGDRKAG-UHFFFAOYSA-N carbofuran Chemical compound CNC(=O)OC1=CC=CC2=C1OC(C)(C)C2 DUEPRVBVGDRKAG-UHFFFAOYSA-N 0.000 description 1
- 150000001721 carbon Chemical group 0.000 description 1
- 150000004649 carbonic acid derivatives Chemical class 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 125000001309 chloro group Chemical group Cl* 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 125000000596 cyclohexenyl group Chemical group C1(=CCCCC1)* 0.000 description 1
- 125000006547 cyclononyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010511 deprotection reaction Methods 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 125000000532 dioxanyl group Chemical group 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- SACNIGZYDTUHKB-UHFFFAOYSA-N ditert-butyl-[2-[2,4,6-tri(propan-2-yl)phenyl]phenyl]phosphane Chemical group CC(C)C1=CC(C(C)C)=CC(C(C)C)=C1C1=CC=CC=C1P(C(C)(C)C)C(C)(C)C SACNIGZYDTUHKB-UHFFFAOYSA-N 0.000 description 1
- 125000005883 dithianyl group Chemical group 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 125000002534 ethynyl group Chemical group [H]C#C* 0.000 description 1
- 239000011737 fluorine Substances 0.000 description 1
- 238000004108 freeze drying Methods 0.000 description 1
- 125000001188 haloalkyl group Chemical group 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 150000002460 imidazoles Chemical class 0.000 description 1
- 125000002632 imidazolidinyl group Chemical group 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 150000002475 indoles Chemical class 0.000 description 1
- 150000007529 inorganic bases Chemical class 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 125000001972 isopentyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000001786 isothiazolyl group Chemical group 0.000 description 1
- 125000000842 isoxazolyl group Chemical group 0.000 description 1
- 150000002611 lead compounds Chemical class 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 229910001092 metal group alloy Inorganic materials 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 125000002757 morpholinyl group Chemical group 0.000 description 1
- 125000001280 n-hexyl group Chemical group C(CCCCC)* 0.000 description 1
- 125000001971 neopentyl group Chemical group [H]C([*])([H])C(C([H])([H])[H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 238000000655 nuclear magnetic resonance spectrum Methods 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 125000001715 oxadiazolyl group Chemical group 0.000 description 1
- 125000002971 oxazolyl group Chemical group 0.000 description 1
- 125000003566 oxetanyl group Chemical group 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 125000004934 phenanthridinyl group Chemical group C1(=CC=CC2=NC=C3C=CC=CC3=C12)* 0.000 description 1
- 125000000286 phenylethyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000004344 phenylpropyl group Chemical group 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 125000004193 piperazinyl group Chemical group 0.000 description 1
- 125000003386 piperidinyl group Chemical group 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 238000002600 positron emission tomography Methods 0.000 description 1
- 150000003141 primary amines Chemical group 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 125000002568 propynyl group Chemical group [*]C#CC([H])([H])[H] 0.000 description 1
- 235000018102 proteins Nutrition 0.000 description 1
- 150000003217 pyrazoles Chemical class 0.000 description 1
- 125000003072 pyrazolidinyl group Chemical group 0.000 description 1
- BBFCIBZLAVOLCF-UHFFFAOYSA-N pyridin-1-ium;bromide Chemical compound Br.C1=CC=NC=C1 BBFCIBZLAVOLCF-UHFFFAOYSA-N 0.000 description 1
- 125000000719 pyrrolidinyl group Chemical group 0.000 description 1
- 125000001422 pyrrolinyl group Chemical group 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 238000006268 reductive amination reaction Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 239000012453 solvate Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- PTVIULBFZPNHNQ-UHFFFAOYSA-N tert-butyl n-(1h-pyrazol-4-yl)carbamate Chemical compound CC(C)(C)OC(=O)NC=1C=NNC=1 PTVIULBFZPNHNQ-UHFFFAOYSA-N 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 125000003718 tetrahydrofuranyl group Chemical group 0.000 description 1
- 125000001412 tetrahydropyranyl group Chemical group 0.000 description 1
- 125000000383 tetramethylene group Chemical group [H]C([H])([*:1])C([H])([H])C([H])([H])C([H])([H])[*:2] 0.000 description 1
- CZDYPVPMEAXLPK-UHFFFAOYSA-N tetramethylsilane Chemical group C[Si](C)(C)C CZDYPVPMEAXLPK-UHFFFAOYSA-N 0.000 description 1
- 125000001113 thiadiazolyl group Chemical group 0.000 description 1
- 125000000335 thiazolyl group Chemical group 0.000 description 1
- 125000004568 thiomorpholinyl group Chemical group 0.000 description 1
- 125000004306 triazinyl group Chemical group 0.000 description 1
- 125000001425 triazolyl group Chemical group 0.000 description 1
- 125000005455 trithianyl group Chemical group 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 1
- 229920002554 vinyl polymer Polymers 0.000 description 1
Landscapes
- Plural Heterocyclic Compounds (AREA)
- Nitrogen Condensed Heterocyclic Rings (AREA)
Abstract
本发明提供了提供了一类DNA编码化合物,其由以下式(1)表示。本发明还提供包含该类化合物的编码化合物库。进而,本发明提供式(1)表示的DNA编码化合物的构建方法,该构建方法中包含新颖的与DNA兼容的碳氮偶联反应作为重要步骤。
Description
技术领域
本发明属于药物化学领域,涉及含有芳香族含氮骨架的DNA编码化合物及其合成方法、DNA编码化合物库。
背景技术
新药的研发包含多个阶段,其中,针对相关疾病蛋白配体的筛选和验证是其中最重要的步骤之一。通过对生物靶标的高通量筛选可以快速获得先导化合物。传统高通量筛选依赖于昂贵的化合物小分子库,建立,维护和筛选这些化合物库对于大多数小公司和科研机构而言成本太大。近年来,DNA编码化合物库技术的出现,大大减少了合成,储存,和筛选化合物库的成本,促进了新药研发中具有新颖结构的苗头化合物的发现。其中,已有一些通过DNA编码化合物库技术筛选得到的化合物进入临床试验阶段。DNA编码化合物库技术是1992年由scripps研究所的Lerner和Brenner提出的,该技术类似于噬菌体展示技术,使用一段特定序列的DNA对化合物进行标记,这使得化合物的大量合成和混合筛选得以实现。DNA编码化合物库的DNA链可以是单链的DNA也可以是双链的DNA,目前已报道的DNA编码化合物库按药效团数量可分为单药效团库和双药效团库;按照合成方式分类主要有DNA模板化合物库(DNA templated synthesis),DNA标记化合物库(DNA-recorded chemicallibraries),编码自组装化合物库(Encoded self-assembling chemical library)和Yoctoreactor型化合物库,本专利中的DNA编码化合物库是双链的单药效团DNA标记化合物库。该库的合成结合了组合化学的方法和分子生物学技术,使得快速合成百万至上亿个化合物分子变成可能,例如一个每一轮都使用100个化学试剂的三轮DNA编码化合物库,最终分子量即可达百万级。随后将合成的DNA编码化合物库和靶蛋白一起孵育,进行亲和力筛选,洗去没有结合力的分子,将有亲和力分子的DNA链进行PCR扩增放大富集信号,随后通过测序解码获得有亲和力小分子的结构信息。最后去掉DNA链合成小分子进行活性验证,即可获得和靶标蛋白具有亲和力的小分子。
含氮杂环结构在药物分子结构中广泛存在,将其引入到DNA编码化合物库的合成中可大大增加筛选的成功率。一般DNA编码化合物库的合成是根据与DNA兼容的化学反应而建立的DNA编码化合物库,这种库缺乏对库中分子结构的设计,筛选成功率很大程度上取决于建库过程中所使用的化学试剂结构的新颖性。为了增加DNA编码化合物库的筛选成功率,公司需要购买更多的化学试剂,这无疑增加了DNA编码化合物库前期化学试剂购买的成本并且限制了DNA编码化合物库的可涵盖的化学空间类型。
到目前为止,在DNA编码化合物领域,为了保持化合物反应的DNA兼容性,反应条件需要尽量温和。Richard J.Fair等总结了DNA编码化合物领域C-N偶联的一般条件,其中温和的反应条件有的需要固相基质,有的使用单链的DNA建库,与一般建库方法不兼容因而通用性低,有些钯催化的反应条件在100℃,而众所周知,DNA在93℃左右就会变性,双螺旋打开,因此这样的反应对DNA损伤大;有些反应的条件是30℃和60℃的温度条件,然而,其以苯胺类为反应物,即只能将取代在芳香族杂环上的伯胺的N原子与芳基卤化物连接,不能直接构件含氮芳香杂环上的氮碳偶联反应(参见Richard J Fair 1,Ryan T Walsh 1,Christopher D Hupp.The expanding reaction toolkit for DNA-encodedlibrariesBioorg Med Chem Lett.2021 Nov 1;51:128339.)。
迄今为止,DNA兼容的(杂)芳香族sp2杂化的N原子与(杂)芳基卤化物的C-N偶联构建策略并不充分。作为DNA编码化合物库的原料底物,含有吡咯、吡唑、吲唑等杂环与芳香环偶联的双功能芳香杂环的底物范围有限,因此这(杂)芳香族sp2杂化的N原子与(杂)芳基卤化物的C-N偶联构建有必要被应用于库的构建,从而使得杂环结构多样化。因此,DNA兼容的(杂)芳香族sp2杂化的N原子与(杂)芳基卤化物的C-N偶联构建策略是亟待解决的问题。
为了克服这个问题,发明人进行了锐意研究,旨在开发一个最佳的反应条件,将DNA连接的偶联物连接到芳香环的N(sp2)原子上。
发明内容
本发明的发明人发现在碱的存在下,在含有钯的催化剂催化下,在溶剂中,能够以相对温和的温度条件,完成(杂)芳香族sp2杂化的N原子与(杂)芳基卤化物的C-N偶联,从而实现对于DNA的兼容。因此本发明能够提供一种DNA编码化合物,其结构由式1表示,
式1中,代表DNA编码标记,
L1为二价的连接基团,其为选自化学键、C1-6亚烷基、C2-6亚烯基、C2-6亚炔基、饱和或部分不饱和的C3-10亚环烃基、-CONH-AA-、-O-、-CO-、-C(=O)O-、-CONH-、-NHCO-、-NHCONH-、-NH-、-S-、亚磺酰基、磺酰基中的一种或者它们之间的组合,其中,AA为天然的或者人工合成的氨基酸试剂去除一个羧基和一个氨基之后剩余的二价残基,
Ar为取代或未取代的C6-C30的亚芳基、或者取代或未取代的C3-C30的亚杂芳基,
Z表示N或者CH,
虚线代表的苯环表示该稠合环可以存在可以不存在,“—”划过的环结构的表达方式,表示连接位点于该环结构上任意能够成键的位置;
各Rx独立地选自醛基、带保护基的氨基、氰基、硝基、C1-6烷基、C1-6烷氧基、饱和或部分不饱和的C3-6环烃基、饱和或部分不饱和的3-10元杂环基、C6-10芳基、5-14元杂芳基、C6-12芳烷基、-C(=O)R8、-OC(=O)R8、-C(=O)OR8、-OR8、-SR8、-S(=O)R8、-S(=O)2R8、-S(=O)2N(R8)2、-N(R8)2、-C(=O)N(R8)2、-NR8-C(=O)R8、-NR8-C(=O)OR8、-NR8-S(=O)2-R8、-NR8-C(=O)-N(R8)2、-C1-6亚烷基-N(R8)2、-C1-6亚烷基-OR8、-C1-6亚烯基-OR8和-O-C1-6亚烷基-N(R8)2,其中R8为H、C1~C6烷基;虚线代表的苯环不存在时m为0~3的整数,虚线代表的苯环存在时,m为0~4的整数,
上述取代或未取代的基团具有取代基时,所述取代基选自氘、卤素、氰基、硝基、氨基、C1-C10的直链或支链的烷基、C1-C10的烷氧基、C3-C10的环烷基、C3-C10的杂环烷基、C6-C20的芳基、C3-C20的杂芳基中的一种或者两种以上的组合。
在本发明优选的实施方式中,式1由式2表示,
式2中,Ar为取代或未取代的从以下基团中去掉一个氢原子得到的二价基团:苯基、萘基、蒽基、苯并蒽基、菲基、苯并菲基、芘基、窟基、茈基、荧蒽基、并四苯基、并五苯基、苯并芘基、联苯基、偶苯基、三联苯基、三聚苯基、四联苯基、芴基、螺二芴基、二氢菲基、二氢芘基、四氢芘基、顺式或反式茚并芴基、三聚茚基、异三聚茚基、螺三聚茚基、螺异三聚茚基、呋喃基、噻吩基、吡咯基、吡啶基、苯并呋喃基、苯并噻吩基、异苯并呋喃基、异苯并噻吩基、吲哚基、异吲哚基、二苯并呋喃基、二苯并噻吩基、咔唑基及其衍生物、喹啉基、异喹啉基、吖啶基、菲啶基、苯并-5,6-喹啉基、苯并-6,7-喹啉基、苯并-7,8-喹啉基、吩噻嗪基、吩嗪基、吡唑基、吲唑基、咪唑基、苯并咪唑基、萘并咪唑基、菲并咪唑基、吡啶并咪唑基、吡嗪并咪唑基、喹喔啉并咪唑基、嗯唑基、苯并嗯唑基、萘并嗯唑基、蒽并嗯唑基、菲并嗯唑基、1,2-噻唑基、1,3-噻唑基、苯并噻唑基、哒嗪基、苯并哒嗪基、嘧啶基、苯并嘧啶基、喹喔啉基、1,5-二氮杂蒽基、2,7-二氮杂芘基、2,3-二氮杂芘基、1,6-二氮杂芘基、1,8-二氮杂芘基、4,5-二氮杂芘基、4,5,9,10-四氮杂茈基、吡嗪基、吩嗪基、吩噻嗪基、萘啶基、氮杂咔唑基、苯并咔啉基、菲咯啉基、1,2,3-三唑基、1,2,4-三唑基、苯并三唑基、1,2,3-噁二唑基、1,2,4-嗯二唑基、1,2,5_嗯二唑基、1,2,3-噻二唑基、1,2,4-噻二唑基、1,2,5-噻二唑基、1,3,4-噻二唑基、1,3,5-三嗪基、1,2,4-三嗪基、1,2,3-三嗪基、四唑基、1,2,4,5-四嗪基、1,2,3,4-四嗪基、1,2,3,5-四嗪基、嘌呤基、蝶啶基、吲嗪基、苯并噻二唑;
Z表示N或者CH,虚线代表的苯环表示该稠合环可以存在可以不存在,“—”划过的环结构的表达方式,表示连接位点于该环结构上任意能够成键的位置;
各Rx独立地选自卤素、羟基、醛基、氨基、氰基、硝基、C1-6烷基、C1-6烷氧基、饱和或部分不饱和的C3-6环烃基、饱和或部分不饱和的3-10元杂环基、C6-10芳基、5-14元杂芳基、C6-12芳烷基、-C(=O)R8、-OC(=O)R8、-C(=O)OR8、-OR8、-SR8、-S(=O)R8、-S(=O)2R8、-S(=O)2N(R8)2、-N(R8)2、-C(=O)N(R8)2、-NR8-C(=O)R8、-NR8-C(=O)OR8、-NR8-S(=O)2-R8、-NR8-C(=O)-N(R8)2;其中R8为H、C1~C6烷基,
上述取代或未取代的基团具有取代基时,所述取代基选自氘、卤素、氰基、硝基、氨基、C1-C10的直链或支链的烷基、C1-C10的烷氧基、C3-C10的环烷基、C3-C10的杂环烷基、C6-C20的芳基、C3-C20的杂芳基中的一种或者两种以上的组合。
在本发明优选的实施方式中,上述的Ar表示取代或未取代的亚苯基、亚吡啶基、亚呋喃基、亚噻吩基、亚吡嗪基、亚萘基、亚苯并噻吩基;
Rx表示卤素、羟基、醛基、氨基、氰基、硝基、C1-6烷基、C1-6烷氧基、-N(R8)2、-C(=O)N(R8)2、-NR8-C(=O)R8、-NR8-C(=O)OR8、-NR8-S(=O)2-R8、-NR8-C(=O)-N(R8)2;其中R8为H、C1~C6烷基,
上述取代或未取代的基团具有取代基时,所述取代基选自卤素、氰基、硝基、氨基、C1-C10的直链或支链的烷基、C1-C10的烷氧基中的一种或者两种以上的组合。
本发明的另一个方面提供一种DNA编码化合物库,其包含上述DNA编码化合物。
本发明的另一个方面提供一种DNA编码化合物的合成方法,其特征在于,该方法包含在碱的存在下,在含有钯的催化剂催化下,在溶剂中,在90℃以下的温度条件下,使式A表示的化合物与式B表示的化合物接触的工序,生成式(1)所示的化合物,
式(A)中,X为卤素,L1和Ar与权利要求1中表达的意思相同,
式(B)中,Z、m、Rx与权利要求1中表达的意思相同。
在本发明的优选实施方式中,反应温度优选为70~85℃,所述含有钯的催化剂为tBuXPhos Pd G1、TBuBrettPhos Pd G3,所述碱为碱金属的氧化物、碱金属的氢氧化物、碱金属的碳酸盐、碱土金属的氧化物、碱土金属的氢氧化物、碱土金属的碳酸盐,所述溶剂为非质子性极性溶剂与水的混合溶剂,
优选的是所述含有钯的催化剂为tBuXPhos Pd G1、所述碱为碱金属的氢氧化物,所述溶剂为选自二甲亚砜、丙酮、乙腈、二甲基甲酰胺、二甲基乙酰胺、六甲基磷酰胺的溶剂与水混合而成的溶剂,
更优选的是,所述含有钯的催化剂为tBuXPhos Pd G1、所述碱为氢氧化钠,所述溶剂为二甲基乙酰胺DMA与水混合而成的溶剂。
本发明还提供一种DNA编码化合物库的构建方法,其特征在于,包括在tBuXPhosPd G1的催化剂催化下,在碱存在的条件下,在90℃以下的温度条件下,使连接于DNA的化合物上的卤代芳烃的C原子,与芳香族环的sp2杂化N原子发生C-N偶联的反应。
本发明还提供一种DNA编码化合物库的构建方法,其特征在于,所述碱为碱金属的氧化物、碱金属的氢氧化物、碱金属的碳酸盐、碱土金属的氧化物、碱土金属的氢氧化物、碱土金属的碳酸盐,所述溶剂为非质子性极性溶剂与水的混合溶剂,
优选的是所述碱为碱金属的氢氧化物,所述溶剂为选自二甲亚砜、丙酮、乙腈、二甲基甲酰胺、二甲基乙酰胺、六甲基磷酰胺的溶剂与水混合而成的溶剂,
更优选的是所述碱为氢氧化钠,所述溶剂为二甲基乙酰胺DMA与水混合而成的溶剂
本发明的优选实施方式中,提供包含以下式I~III表示的化合物,以及包含这些化合物的DEL编码化合物库。
式I~III中,R1表示为天然的或者人工合成的氨基酸试剂去除一个羧基和一个氨基之后剩余的二价残基,
R2表示为取代或未取代的从以下基团中去掉一个氢原子得到的二价基团:苯基、萘基、蒽基、苯并蒽基、菲基、苯并菲基、芘基、窟基、茈基、荧蒽基、并四苯基、并五苯基、苯并芘基、联苯基、偶苯基、三联苯基、三聚苯基、四联苯基、芴基、螺二芴基、二氢菲基、二氢芘基、四氢芘基、顺式或反式茚并芴基、三聚茚基、异三聚茚基、螺三聚茚基、螺异三聚茚基、呋喃基、噻吩基、吡咯基、吡啶基、苯并呋喃基、苯并噻吩基、异苯并呋喃基、异苯并噻吩基、吲哚基、异吲哚基、二苯并呋喃基、二苯并噻吩基、咔唑基及其衍生物、喹啉基、异喹啉基、吖啶基、菲啶基、苯并-5,6-喹啉基、苯并-6,7-喹啉基、苯并-7,8-喹啉基、吩噻嗪基、吩嗪基、吡唑基、吲唑基、咪唑基、苯并咪唑基、萘并咪唑基、菲并咪唑基、吡啶并咪唑基、吡嗪并咪唑基、喹喔啉并咪唑基、嗯唑基、苯并嗯唑基、萘并嗯唑基、蒽并嗯唑基、菲并嗯唑基、1,2-噻唑基、1,3-噻唑基、苯并噻唑基、哒嗪基、苯并哒嗪基、嘧啶基、苯并嘧啶基、喹喔啉基、1,5-二氮杂蒽基、2,7-二氮杂芘基、2,3-二氮杂芘基、1,6-二氮杂芘基、1,8-二氮杂芘基、4,5-二氮杂芘基、4,5,9,10-四氮杂茈基、吡嗪基、吩嗪基、吩噻嗪基、萘啶基、氮杂咔唑基、苯并咔啉基、菲咯啉基、1,2,3-三唑基、1,2,4-三唑基、苯并三唑基、1,2,3-噁二唑基、1,2,4-嗯二唑基、1,2,5_嗯二唑基、1,2,3-噻二唑基、1,2,4-噻二唑基、1,2,5-噻二唑基、1,3,4-噻二唑基、1,3,5-三嗪基、1,2,4-三嗪基、1,2,3-三嗪基、四唑基、1,2,4,5-四嗪基、1,2,3,4-四嗪基、1,2,3,5-四嗪基、嘌呤基、蝶啶基、吲嗪基、苯并噻二唑;
Y表示CH2或C(=O),
虚线代表的苯环表示该稠合环可以存在可以不存在,“—”划过的环结构的表达方式,表示连接位点于该环结构上任意能够成键的位置;
R3表示H、C1~C6烷基,
上述取代或未取代的基团具有取代基时,所述取代基选自卤素、氰基、硝基、氨基、C1-C10的直链或支链的烷基、C1-C10的烷氧基中的一种或者两种以上的组合。
在本发明的优选的实施方式中,式I~III中,R1表示为从下述氨基酸试剂去除一个羧基和一个氨基之后剩余的二价残基:
L-型的丙氨酸、精氨酸、天冬氨酸、半胱氨酸、谷氨酸、谷氨酸盐、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯基丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸,以及D-型的丙氨酸、精氨酸、天冬氨酸、半胱氨酸、谷氨酸、谷氨酸盐、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯基丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸,以及2-氨基己二酸、3-氨基己二酸、β-氨基丙酸、2-氨基丁酸、4-氨基丁酸、6-氨基己酸、2-氨基庚酸、2-氨基异丁酸、3-氨基异丁酸、2-氨基庚二酸、2,4-二氨基丁酸、锁链赖氨素、2,2′-二氨基庚二酸、2,3-二氨基丁酸、N-乙基甘氨酸、N-乙基天冬氨酸、羟基赖氨酸、别-羟基赖氨酸、3-羟基脯氨酸、4-羟基脯氨酸、异锁链赖氨素、别-异亮氨酸、N-甲基甘氨酸(肌氨酸)、N-甲基异亮氨酸、N-甲基缬氨酸、正缬氨酸、正亮氨酸和鸟氨酸;
R2表示为取代或未取代的亚苯基、亚吡啶基、亚呋喃基、亚噻吩基、亚吡嗪基、亚萘基、亚苯并噻吩基;
Y表示CH2或C(=O),
上述取代或未取代的基团具有取代基时,所述取代基选自卤素、氰基、硝基、氨基、C1-C10的直链或支链的烷基、C1-C10的烷氧基中的一种或者两种以上的组合。
本发明首次实现了DNA兼容性好的卤代芳烃的C原子,与芳香族环的sp2杂化N原子发生C-N偶联的反应,为解决现有DNA编码化合物库所涵盖结构化学空间类型少和筛选成功率低的问题提供了解决方案,并提供了新颖的DNA编码化合物。
附图说明
图1是式Ⅰ中DNA编码化合物库的制备方法流程图;
图2是式Ⅱ中DNA编码化合物库的制备方法流程图;
图3是式Ⅲ中DNA编码化合物库的制备方法流程图;
图4是另一种式III中DNA编码化合物库的制备方法流程图;
图5是AOP-HP的化学结构图;
图6是HP的化学结构图;
图7是本发明的化合物1的质谱图;
图8是本发明的化合物2a的质谱图;
图9是本发明的化合物2d的质谱图;
图10是本发明的化合物5的质谱图;
图11是本发明的化合物2aj的质谱图;
图12是本发明的化合物6的质谱图;
图13是本发明的化合物7的质谱图;
图14是本发明的化合物B-8的质谱图。
具体实施方式
下面通过实施例对本发明进行详细描述,但并不意味着对本发明任何不利限制。本文已经详细地描述了本发明,其中也公开了其具体实施例方式,对本领域的技术人员而言,在不脱离本发明精神和范围的情况下针对本发明具体实施方式进行各种变化和改进将是显而易见的。
以下对本发明的各要素进行更加详细的说明。
定义
术语“DEL”是DNA编码化合物库的简称。
术语“Fmoc氨基酸试剂”是指同时含有9-芴基甲氧基羰基保护的氨基和羧酸的化学试剂。
术语“卤素加酸试剂”是指同时含有卤素(氯、溴、碘)和羧酸的化学试剂。
术语“含氮杂环结构试剂”是指在芳环结构上含有N-H的化学试剂。如吡唑,吲唑,咪唑,苯并咪唑,吲哚等。
术语“胺试剂”是指包含氨基结构的化学试剂。
术语“醛试剂”是指包含醛基结构的化学试剂。
术语“羧酸试剂”是指包含羧基结构的化学试剂。
术语“tag溶液”是指有特定序列的DNA水溶液,其中的DNA序列可作为标签标记随后使用的步骤信息。
缩略语“tBuXPhos Pd G1”是指氯[2-(二叔丁基膦基)-2',4',6'-三异丙基-1,1'-联苯基][2-(2-氨基乙基)苯基)]钯(II),其CAS登记号为1142811-12-8,缩略语“TBuBrettPhos Pd G3”是指甲磺酸-2-(二叔丁基膦基)-3,6-二甲氧基-2',4',6'-三异丙基-1,1'-联苯(2-氨基-1,1'-联苯-2-基)钯(II),其CAS登记号为1536473-72-9。
缩略语DMTMM为4-(4,6-二甲氧基三嗪)-4-甲基吗啉盐酸盐,多肽偶联试剂。
缩略语“AOP-HP”为图5中所述结构的化合物,常用于DEL构建。
缩略语“HP”为图6中所述结构的化合物,常用于单个On-DNA化合物合成。
除非在下文中另有定义,本文中所用的所有技术术语和科学术语的含义意图与本领域技术人员通常所理解的相同。提及本文中使用的技术意图指在本领域中通常所理解的技术,包括那些对本领域技术人员显而易见的技术的变化或等效技术的替换。虽然相信以下术语对于本领域技术人员很好理解,但仍然阐述以下定义以更好地解释本发明。
术语“包括”、“包含”、“具有”、“含有”或“涉及”及其在本文中的其它变体形式为包含性的(inclusive)或开放式的,且不排除其它未列举的元素或方法步骤。
如本文中所使用,术语“亚烷基”表示饱和二价烃基,优选表示具有1、2、3、4、5或6个碳原子的饱和二价烃基,例如亚甲基、亚乙基、亚丙基或亚丁基。
如本文中所使用,术语“烷基”定义为线性或支化饱和脂肪族烃。在一些实施方案中,烷基具有1至12个,例如1至6个碳原子。例如,如本文中所使用,术语“C 1-6烷基”指1至6个碳原子的线性或支化的基团(例如甲基、乙基、正丙基、异丙基、正丁基、异丁基、仲丁基、叔丁基、正戊基、异戊基、新戊基或正己基),其任选地被1或多个(诸如1至3个)适合的取代基如卤素取代(此时该基团被称作“卤代烷基”)(例如CH2F、CHF2、CF 3、CCl3、C2F5、C2Cl5、CH2CF3、CH2Cl或-CH2CH2CF3等)。术语“C1-4烷基”指1至4个碳原子的线性或支化的脂肪族烃链(即甲基、乙基、正丙基、异丙基、正丁基、异丁基、仲丁基或叔丁基)。
如本文中所使用,术语“烯基”意指线性的或支化的单价烃基,其包含一个双键,且具有2-6个碳原子(“C 2-6烯基”)。所述烯基为例如乙烯基、1-丙烯基、2-丙烯基、2-丁烯基、3-丁烯基、2-戊烯基、3-戊烯基、4-戊烯基、2-己烯基、3-己烯基、4-己烯基、5-己烯基、2-甲基-2-丙烯基和4-甲基-3-戊烯基。当本发明的化合物含有烯基时,所述化合物可以纯E(异侧(entgegen))形式、纯Z(同侧(zusammen))形式或其任意混合物形式存在。
如本文中所使用,术语“炔基”表示包含一个或多个三键的单价烃基,其优选具有2、3、4、5或6个碳原子,例如乙炔基或丙炔基。
如本文中所使用,术语“环烷基”指饱和的单环或多环(诸如双环)烃环(例如单环,诸如环丙基、环丁基、环戊基、环己基、环庚基、环辛基、环壬基,或双环,包括螺环、稠合或桥连系统(诸如双环[1.1.1]戊基、双环[2.2.1]庚基、双环[3.2.1]辛基或双环[5.2.0]壬基、十氢化萘基等)),其任选地被1或多个(诸如1至3个)适合的取代基取代。所述环烷基具有3至15个碳原子。例如,术语“C3-6环烷基”指3至6个成环碳原子的饱和的单环或多环(诸如双环)烃环(例如环丙基、环丁基、环戊基或环己基),其任选地被1或多个(诸如1至3个)适合的取代基取代,例如甲基取代的环丙基。
如本文中所使用,术语“亚环烃基”、“环烃基”和“烃环”是指具有例如3-10个(适合地具有3-8个,更适合地具有3-6个)环碳原子的饱和(即,“亚环烷基”和“环烷基”)或不饱和的(即在环内具有一个或多个双键和/或三键)单环或多环烃环,其包括但不限于(亚)环丙基(环)、(亚)环丁基(环)、(亚)环戊基(环)、(亚)环己基(环)、(亚)环庚基(环)、(亚)环辛基(环)、(亚)环壬基(环)、(亚)环己烯基(环)等。
如本文中所使用,术语“杂环基”、“亚杂环基”和“杂环”是指具有例如3-10个(适合地具有3-8个,更适合地具有3-6个)环原子、其中至少一个环原子是选自N、O和S的杂原子且其余环原子是C的饱和(即,杂环烷基)或部分不饱和的(即在环内具有一个或多个双键和/或三键)环状基团。例如,“3-10元(亚)杂环(基)”是具有2-9个(如2、3、4、5、6、7、8或9个)环碳原子和独立地选自N、O和S的一个或多个(例如1个、2个、3个或4个)杂原子的饱和或部分不饱和(亚)杂环(基)。亚杂环基和杂环(基)的实例包括但不限于:(亚)环氧乙烷基、(亚)氮丙啶基、(亚)氮杂环丁基(azetidinyl)、(亚)氧杂环丁基(oxetanyl)、(亚)四氢呋喃基、(亚)二氧杂环戊烯基(dioxolinyl)、(亚)吡咯烷基、(亚)吡咯烷酮基、(亚)咪唑烷基、(亚)吡唑烷基、(亚)吡咯啉基、(亚)四氢吡喃基、(亚)哌啶基、(亚)吗啉基、(亚)二噻烷基(dithianyl)、(亚)硫吗啉基、(亚)哌嗪基或(亚)三噻烷基(trithianyl)。所述基团也涵盖双环系统,包括螺环、稠合或桥连系统(诸如8-氮杂螺[4.5]癸烷、3,9-二氮杂螺[5.5]十一烷、2-氮杂双环[2.2.2]辛烷等)。亚杂环基和杂环(基)可任选地被一个或多个(例如1个、2个、3个或4个)适合的取代基取代。
如本文中所使用,术语“(亚)芳基”和“芳环”指具有共轭π电子系统的全碳单环或稠合环多环芳族基团。例如,如本文中所使用,术语“C 6-10(亚)芳基”和“C 6-10芳环”意指含有6至10个碳原子的芳族基团,诸如(亚)苯基(苯环)或(亚)萘基(萘环)。(亚)芳基和芳环任选地被1或多个(诸如1至3个)适合的取代基(例如卤素、-OH、-CN、-NO 2、C 1-6烷基等)取代。
如本文中所使用,术语“(亚)杂芳基”和“杂芳环”指单环、双环或三环芳族环系,其具有5、6、8、9、10、11、12、13或14个环原子,特别是1或2或3或4或5或6或9或10个碳原子,且其包含至少一个可以相同或不同的杂原子(所述杂原子是例如氧、氮或硫),并且,另外在每一种情况下可为苯并稠合的。特别地,“(亚)杂芳基”或“杂芳环”选自(亚)噻吩基、(亚)呋喃基、(亚)吡咯基、(亚)噁唑基、(亚)噻唑基、(亚)咪唑基、(亚)吡唑基、(亚)异噁唑基、(亚)异噻唑基、(亚)噁二唑基、(亚)三唑基、(亚)噻二唑基等,以及它们的苯并衍生物;或(亚)吡啶基、(亚)哒嗪基、(亚)嘧啶基、(亚)吡嗪基、(亚)三嗪基等,以及它们的苯并衍生物。
如本文中所使用,术语“芳烷基”优选表示芳基或杂芳基取代的烷基,其中所述芳基、杂芳基和烷基如本文中所定义。通常,所述芳基可具有6-14个碳原子,所述杂芳基可具有5-14个环原子,并且所述烷基可具有1-6个碳原子。示例性芳烷基包括但不限于苄基、苯基乙基、苯基丙基、苯基丁基。
如本文中所使用,术语“卤代”或“卤素”基团定义为包括F、Cl、Br或I。
如本文中所使用,术语“含氮杂环”指饱和或不饱和的单环或双环基团,其在环中具有2、3、4、5、6、7、8、9、10、11、12或13个碳原子和至少一个氮原子,其还可任选地包含一个或多个(例如一个、两个、三个或四个)选自N、O、C=O、S、S=O和S(=O)2的环成员,其通过所述含氮杂环中的氮原子以及任一其余环原子与分子的其余部分连接,所述含氮杂环任选地为苯并稠合的,并且优选通过所述含氮杂环中的氮原子以及所稠合的苯环中的任一碳原子与分子的其余部分连接。
术语“取代”指所指定的原子上的一个或多个(例如一个、两个、三个或四个)氢被从所指出的基团的选择代替,条件是未超过所指定的原子在当前情况下的正常原子价并且所述取代形成稳定的化合物。取代基和/或变量的组合仅仅当这种组合形成稳定的化合物时才是允许的。
如果取代基被描述为“任选地被取代”,则取代基可(1)未被取代或(2)被取代。如果取代基的碳被描述为任选地被取代基列表中的一个或多个取代,则碳上的一个或多个氢(至存在的任何氢的程度)可单独和/或一起被独立地选择的任选的取代基替代。如果取代基的氮被描述为任选地被取代基列表中的一个或多个取代,则氮上的一个或多个氢(至存在的任何氢的程度)可各自被独立地选择的任选的取代基替代。
如果取代基被描述为“独立地选自”一组,则各取代基独立于另一者被选择。因此,各取代基可与另一(其他)取代基相同或不同。
如本文中所使用,术语“一个或多个”意指在合理条件下的1个或超过1个,例如2个、3个、4个、5个或10个。
除非指明,否则如本文中所使用,取代基的连接点可来自取代基的任意适宜位置。
本发明还包括所有药学上可接受的同位素标记的化合物,其与本发明的化合物相同,除了一个或多个原子被具有相同原子序数但原子质量或质量数不同于在自然界中占优势的原子质量或质量数的原子替代。适合包含入本发明的化合物中的同位素的实例包括(但不限于)氢的同位素(例如氘(2H)、氚(3H));碳的同位素(例如11C、13C及14C);氯的同位素(例如36Cl);氟的同位素(例如18F);碘的同位素(例如123I及125I);氮的同位素(例如13N及15N);氧的同位素(例如15O、17O及18O);磷的同位素(例如32P);及硫的同位素(例如35S)。某些同位素标记的本发明的化合物(例如掺入放射性同位素的那些)可用于药物和/或底物组织分布研究(例如分析)中。放射性同位素氚(即3H)及碳-14(即14C)因易于掺入且容易检测而特别可用于该目的。用正电子发射同位素(例如11C、18F、15O及13N)进行取代可在正电子发射断层显像术(PET)研究中用于检验底物受体占据情况。被同位素标记的本发明的化合物可通过与描述于随附路线和/或实施例及制备中的那些类似的方法通过使用适当的被同位素标记的试剂代替之前采用的非标记的试剂来制备。本发明的药学上可接受的溶剂合物包括其中结晶溶剂可被同位素取代的那些,例如,D2O、丙酮-d6或DMSO-d6。
本发明的碳酸盐包括碳酸氢盐。
术语“约”是指在所述数值的±10%范围内,优选±5%范围内,更优选±2%范围内。
DEL编码化合物
本发明能够提供一种DNA编码化合物,其结构由式1表示,
式1中,代表DNA编码标记,
L1为二价的连接基团,其为选自化学键、C1-6亚烷基、C2-6亚烯基、C2-6亚炔基、饱和或部分不饱和的C3-10亚环烃基、-CONH-AA-、-O-、-CO-、-C(=O)O-、-CONH-、-NHCO-、-NHCONH-、-NH-、-S-、亚磺酰基、磺酰基中的一种或者它们之间的组合,其中,AA为天然的或者人工合成的氨基酸试剂去除一个羧基和一个氨基之后剩余的二价残基,
Ar为取代或未取代的C6-C30的亚芳基、或者取代或未取代的C3-C30的亚杂芳基,
Z表示N或者CH,
虚线代表的苯环表示该稠合环可以存在可以不存在,“—”划过的环结构的表达方式,表示连接位点于该环结构上任意能够成键的位置;
各Rx独立地选自卤素、羟基、醛基、氨基、氰基、硝基、C1-6烷基、C1-6烷氧基、饱和或部分不饱和的C3-6环烃基、饱和或部分不饱和的3-10元杂环基、C6-10芳基、5-14元杂芳基、C6-12芳烷基、-C(=O)R8、-OC(=O)R8、-C(=O)OR8、-OR8、-SR8、-S(=O)R8、-S(=O)2R8、-S(=O)2N(R8)2、-N(R8)2、-C(=O)N(R8)2、-NR8-C(=O)R8、-NR8-C(=O)OR8、-NR8-S(=O)2-R8、-NR8-C(=O)-N(R8)2、-C1-6亚烷基-N(R8)2、-C1-6亚烷基-OR8、-C1-6亚烯基-OR8和-O-C1-6亚烷基-N(R8)2,其中R8为H、C1~C6烷基;虚线代表的苯环不存在时m为0~3的整数,虚线代表的苯环存在时,m为0~4的整数,
上述取代或未取代的基团具有取代基时,所述取代基选自氘、卤素、氰基、硝基、氨基、C1-C10的直链或支链的烷基、C1-C10的烷氧基、C3-C10的环烷基、C3-C10的杂环烷基、C6-C20的芳基、C3-C20的杂芳基中的一种或者两种以上的组合。
在本发明优选的实施方式中,式1由式2表示,
式2中,Ar为取代或未取代的从以下基团中去掉一个氢原子得到的二价基团:苯基、萘基、蒽基、苯并蒽基、菲基、苯并菲基、芘基、窟基、茈基、荧蒽基、并四苯基、并五苯基、苯并芘基、联苯基、偶苯基、三联苯基、三聚苯基、四联苯基、芴基、螺二芴基、二氢菲基、二氢芘基、四氢芘基、顺式或反式茚并芴基、三聚茚基、异三聚茚基、螺三聚茚基、螺异三聚茚基、呋喃基、噻吩基、吡咯基、吡啶基、苯并呋喃基、苯并噻吩基、异苯并呋喃基、异苯并噻吩基、吲哚基、异吲哚基、二苯并呋喃基、二苯并噻吩基、咔唑基及其衍生物、喹啉基、异喹啉基、吖啶基、菲啶基、苯并-5,6-喹啉基、苯并-6,7-喹啉基、苯并-7,8-喹啉基、吩噻嗪基、吩嗪基、吡唑基、吲唑基、咪唑基、苯并咪唑基、萘并咪唑基、菲并咪唑基、吡啶并咪唑基、吡嗪并咪唑基、喹喔啉并咪唑基、嗯唑基、苯并嗯唑基、萘并嗯唑基、蒽并嗯唑基、菲并嗯唑基、1,2-噻唑基、1,3-噻唑基、苯并噻唑基、哒嗪基、苯并哒嗪基、嘧啶基、苯并嘧啶基、喹喔啉基、1,5-二氮杂蒽基、2,7-二氮杂芘基、2,3-二氮杂芘基、1,6-二氮杂芘基、1,8-二氮杂芘基、4,5-二氮杂芘基、4,5,9,10-四氮杂茈基、吡嗪基、吩嗪基、吩噻嗪基、萘啶基、氮杂咔唑基、苯并咔啉基、菲咯啉基、1,2,3-三唑基、1,2,4-三唑基、苯并三唑基、1,2,3-噁二唑基、1,2,4-嗯二唑基、1,2,5_嗯二唑基、1,2,3-噻二唑基、1,2,4-噻二唑基、1,2,5-噻二唑基、1,3,4-噻二唑基、1,3,5-三嗪基、1,2,4-三嗪基、1,2,3-三嗪基、四唑基、1,2,4,5-四嗪基、1,2,3,4-四嗪基、1,2,3,5-四嗪基、嘌呤基、蝶啶基、吲嗪基、苯并噻二唑;
Z表示N或者CH,虚线代表的苯环表示该稠合环可以存在可以不存在,“—”划过的环结构的表达方式,表示连接位点于该环结构上任意能够成键的位置;
各Rx独立地选自卤素、羟基、醛基、氨基、氰基、硝基、C1-6烷基、C1-6烷氧基、饱和或部分不饱和的C3-6环烃基、饱和或部分不饱和的3-10元杂环基、C6-10芳基、5-14元杂芳基、C6-12芳烷基、-C(=O)R8、-OC(=O)R8、-C(=O)OR8、-OR8、-SR8、-S(=O)R8、-S(=O)2R8、-S(=O)2N(R8)2、-N(R8)2、-C(=O)N(R8)2、-NR8-C(=O)R8、-NR8-C(=O)OR8、-NR8-S(=O)2-R8、-NR8-C(=O)-N(R8)2;其中R8为H、C1~C6烷基,
上述取代或未取代的基团具有取代基时,所述取代基选自氘、卤素、氰基、硝基、氨基、C1-C10的直链或支链的烷基、C1-C10的烷氧基、C3-C10的环烷基、C3-C10的杂环烷基、C6-C20的芳基、C3-C20的杂芳基中的一种或者两种以上的组合。
在本发明优选的实施方式中,上述的Ar表示取代或未取代的亚苯基、亚吡啶基、亚呋喃基、亚噻吩基、亚吡嗪基、亚萘基、亚苯并噻吩基;
Rx表示卤素、羟基、醛基、氨基、氰基、硝基、C1-6烷基、C1-6烷氧基、-N(R8)2、-C(=O)N(R8)2、-NR8-C(=O)R8、-NR8-C(=O)OR8、-NR8-S(=O)2-R8、-NR8-C(=O)-N(R8)2;其中R8为H、C1~C6烷基,
上述取代或未取代的基团具有取代基时,所述取代基选自卤素、氰基、硝基、氨基、C1-C10的直链或支链的烷基、C1-C10的烷氧基中的一种或者两种以上的组合。
在本发明优选的实施方式中,提供结构由式I~III中的任一者的化合物,
式I~III中,R1表示为天然的或者人工合成的氨基酸试剂去除一个羧基和一个氨基之后剩余的二价残基,
R2表示为取代或未取代的从以下基团中去掉一个氢原子得到的二价基团:苯基、萘基、蒽基、苯并蒽基、菲基、苯并菲基、芘基、窟基、茈基、荧蒽基、并四苯基、并五苯基、苯并芘基、联苯基、偶苯基、三联苯基、三聚苯基、四联苯基、芴基、螺二芴基、二氢菲基、二氢芘基、四氢芘基、顺式或反式茚并芴基、三聚茚基、异三聚茚基、螺三聚茚基、螺异三聚茚基、呋喃基、噻吩基、吡咯基、吡啶基、苯并呋喃基、苯并噻吩基、异苯并呋喃基、异苯并噻吩基、吲哚基、异吲哚基、二苯并呋喃基、二苯并噻吩基、咔唑基及其衍生物、喹啉基、异喹啉基、吖啶基、菲啶基、苯并-5,6-喹啉基、苯并-6,7-喹啉基、苯并-7,8-喹啉基、吩噻嗪基、吩嗪基、吡唑基、吲唑基、咪唑基、苯并咪唑基、萘并咪唑基、菲并咪唑基、吡啶并咪唑基、吡嗪并咪唑基、喹喔啉并咪唑基、嗯唑基、苯并嗯唑基、萘并嗯唑基、蒽并嗯唑基、菲并嗯唑基、1,2-噻唑基、1,3-噻唑基、苯并噻唑基、哒嗪基、苯并哒嗪基、嘧啶基、苯并嘧啶基、喹喔啉基、1,5-二氮杂蒽基、2,7-二氮杂芘基、2,3-二氮杂芘基、1,6-二氮杂芘基、1,8-二氮杂芘基、4,5-二氮杂芘基、4,5,9,10-四氮杂茈基、吡嗪基、吩嗪基、吩噻嗪基、萘啶基、氮杂咔唑基、苯并咔啉基、菲咯啉基、1,2,3-三唑基、1,2,4-三唑基、苯并三唑基、1,2,3-噁二唑基、1,2,4-嗯二唑基、1,2,5_嗯二唑基、1,2,3-噻二唑基、1,2,4-噻二唑基、1,2,5-噻二唑基、1,3,4-噻二唑基、1,3,5-三嗪基、1,2,4-三嗪基、1,2,3-三嗪基、四唑基、1,2,4,5-四嗪基、1,2,3,4-四嗪基、1,2,3,5-四嗪基、嘌呤基、蝶啶基、吲嗪基、苯并噻二唑;
Y表示CH2或C(=O),
虚线代表的苯环表示该稠合环可以存在可以不存在,“—”划过的环结构的表达方式,表示连接位点于该环结构上任意能够成键的位置;
R3表示H、C1~C6烷基,
上述取代或未取代的基团具有取代基时,所述取代基选自卤素、氰基、硝基、氨基、C1-C10的直链或支链的烷基、C1-C10的烷氧基中的一种或者两种以上的组合。
在本发明的优选的实施方式中,式I~III中,R1表示为从下述氨基酸试剂去除一个羧基和一个氨基之后剩余的二价残基:
L-型的丙氨酸、精氨酸、天冬氨酸、半胱氨酸、谷氨酸、谷氨酸盐、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯基丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸,以及D-型的丙氨酸、精氨酸、天冬氨酸、半胱氨酸、谷氨酸、谷氨酸盐、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯基丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸,以及2-氨基己二酸、3-氨基己二酸、β-氨基丙酸、2-氨基丁酸、4-氨基丁酸、6-氨基己酸、2-氨基庚酸、2-氨基异丁酸、3-氨基异丁酸、2-氨基庚二酸、2,4-二氨基丁酸、锁链赖氨素、2,2′-二氨基庚二酸、2,3-二氨基丁酸、N-乙基甘氨酸、N-乙基天冬氨酸、羟基赖氨酸、别-羟基赖氨酸、3-羟基脯氨酸、4-羟基脯氨酸、异锁链赖氨素、别-异亮氨酸、N-甲基甘氨酸(肌氨酸)、N-甲基异亮氨酸、N-甲基缬氨酸、正缬氨酸、正亮氨酸和鸟氨酸;关于氨基酸试剂的例举,仅仅是为了说明,DEL领域常用的氨基酸试剂都可以使用。
R2表示为取代或未取代的亚苯基、亚吡啶基、亚呋喃基、亚噻吩基、亚吡嗪基、亚萘基、亚苯并噻吩基;
Y表示CH2或C(=O),
上述取代或未取代的基团具有取代基时,所述取代基选自卤素、氰基、硝基、氨基、C1-C10的直链或支链的烷基、C1-C10的烷氧基中的一种或者两种以上的组合。
合成方法
本发明的重要创新之处,在于创建了一种DNA兼容的芳香族sp2杂化N原子与芳香族sp2杂化C原子之间的偶联反应方法。该方法包含在碱的存在下,在含有钯的催化剂催化下,在溶剂中,在90℃以下的温度条件下,使式A表示的化合物与式B表示的化合物接触的工序,生成式(1)所示的化合物,
式(A)中,X为卤素,L1和Ar与权利要求1中表达的意思相同,
式(B)中,Z、m、Rx与权利要求1中表达的意思相同。
在本发明的优选实施方式中,反应温度优选为70~85℃,所述含有钯的催化剂为tBuXPhos Pd G1、TBuBrettPhos Pd G3,所述碱为碱金属的氧化物、碱金属的氢氧化物、碱金属的碳酸盐、碱土金属的氧化物、碱土金属的氢氧化物、碱土金属的碳酸盐,所述溶剂为非质子性极性溶剂与水的混合溶剂,
优选的是所述含有钯的催化剂为tBuXPhos Pd G1、所述碱为碱金属的氢氧化物,所述溶剂为选自二甲亚砜、丙酮、乙腈、二甲基甲酰胺、二甲基乙酰胺、六甲基磷酰胺的溶剂与水混合而成的溶剂,
更优选的是,所述含有钯的催化剂为tBuXPhos Pd G1、所述碱为氢氧化钠,所述溶剂为二甲基乙酰胺DMA与水混合而成的溶剂。
本发明还提供一种DNA编码化合物库的构建方法,其特征在于,包括在tBuXPhosPd G1的催化剂催化下,在碱存在的条件下,在90℃以下的温度条件下,使连接于DNA的化合物上的卤代芳烃的C原子,与芳香族环的sp2杂化N原子发生C-N偶联的反应。
本发明还提供一种DNA编码化合物库的构建方法,其特征在于,所述碱为碱金属的氧化物、碱金属的氢氧化物、碱金属的碳酸盐、碱土金属的氧化物、碱土金属的氢氧化物、碱土金属的碳酸盐,所述溶剂为非质子性极性溶剂与水的混合溶剂,
优选的是所述碱为碱金属的氢氧化物,所述溶剂为选自二甲亚砜、丙酮、乙腈、二甲基甲酰胺、二甲基乙酰胺、六甲基磷酰胺的溶剂与水混合而成的溶剂,
更优选的是所述碱为氢氧化钠,所述溶剂为二甲基乙酰胺DMA与水混合而成的溶剂。
DEL编码化合物库
通过对于式1化合的适当设计,利用本发明开发的使杂芳环的氮原子在DNA兼容的环境中直接发生芳基化的方法,结合标准的DNA兼容条件下,酰胺键的形成、De-Boc反应和还原性胺化,能够方便的构建DEL化合物库。作为以本发明的合成方法,结合现有常规DEL技术构件化合物库的方法,可以举例以下的方法,但是并不限于以下方法。
构建以式I~III表示的DEL化合物库的方法举例:
利用本发明,能够提供结构由式I~III表示的化合物的DEL库,以下给出详细的流程,其中的试剂用量仅为用来举例,本发明的范围不受其限制,本领域普通技术人员能够根据需要进行改变和选择。化合物的DEL库的构建,涉及同类试剂的平行试验,具体使用的试剂可以基于本发明的保护范围,本领域普通技术人员自行选择。
式Ⅰ中DNA编码化合物库的构建流程(参见图1):
1.制备AOP-HP-NH2-Primer:连接体系(AOP-HP-NH2 0.25mM,引物1.2当量,0.1倍反应液总体积的10x的T4缓冲液,0.12当量的T4连接酶,剩下的用水补充至总体积)。混合均匀后在4℃下过夜反应。用飞行时间质谱确定连接完全后,使用乙醇沉淀(反应液中加入10%体积的5M NaCl溶液和2.5倍体积的-80℃乙醇,混合均匀后置于-80℃的冰箱中保存30分钟,随后在4℃下,10000rpm离心30min,弃上清,沉淀用冻干机冻干。)得到AOP-HP-NH2与引物连接的产物,用水溶解,浓度为1mM,共17280μL。
2.建库第一轮编码:上一步产物17280μL中,加入10x的T4缓冲液6912μL,去离子水28167μL,T4连接酶2073μL,混合均匀后均分到193孔中,每孔282μL,约90nmol,再分别加入76μL193种不同第一轮tag溶液连接,混合物在4℃下反应过夜。用飞行时间质谱确定连接完全后,使用乙醇沉淀后得到AOP-HP-NH2-Primer与第一轮tag相连的产物,将其溶解在120μL250mM pH为9.4的硼酸缓冲液中形成DNA溶液。
3.建库第一轮化学:其中191个孔分别与不同的Fmoc保护的氨基酸试剂进行缩合反应,剩余两孔为空白。化学反应条件为:DNA溶液(1equiv),预混合等体积的Fmoc氨基酸试剂(200mM in DMA)、HATU(200mM in DMA)、DIPEA(200mM in DMA),再将54μL混合溶液加入反应体系,室温反应1-2h,用飞行时间质谱确定反应效率,将所有反应液混合到一起,使用乙醇沉淀得到冻干粉。加20mL水溶解,再加入2mL体积的哌啶,室温反应1h,脱去Fmoc保护基。使用乙醇沉淀操作后,加20mL水溶解,使用超滤管超滤,并用去离子水洗两次,最后得到16720μL,共14546nmol,浓度为0.87mM。回收率普遍可实现约86%。
4.建库第二轮编码:第一轮化学后的产物16720μL,加入10x的T4缓冲液5818μL,去离子水24447μL,T4连接酶1745μL,混合均匀后均分到195孔中,再分别加入49μL 195种不同第二轮tag溶液连接,混合物在4℃下反应过夜。用飞行时间质谱确定连接完全后,使用乙醇沉淀后得到与第二轮tag相连的产物,将其溶解在120μL 250mM pH为9.4的硼酸缓冲液中形成DNA溶液。
5.建库第二轮化学:其中192个孔分别与96个不同的卤素加酸试剂进行缩合反应。化学反应条件为:DNA溶液(1equiv),预混合35μL卤素加酸(200mM in DMA)、35μL HATU(200mM in DMA)、35μL DIPEA(200mM in DMA),再将91μL混合溶液加入DNA溶液,室温反应1-2h,用飞行时间质谱确定反应效率,将所有反应液混合到一起,使用乙醇沉淀得到冻干粉。加15mL水溶解,使用超滤管超滤,并用去离子水洗两次,最后得到16000μL,共13920nmol,浓度为0.87mM。回收率普遍可实现约96%。
6.建库第三轮编码:取第二轮化学后的产物988μL,加入10x的T4缓冲液344μL,去离子水1574μL,T4连接酶104μL,混合均匀后均分到87孔中,再分别加入5μL87种不同第三轮tag溶液连接,混合物在4℃下反应过夜。用飞行时间质谱确定连接完全后,使用乙醇沉淀得到与第三轮tag相连的产物,将其溶解在10μL水中形成DNA溶液。
7.建库第三轮化学:其中80个孔分别与20个不同的含氮芳杂环结构试剂反应,反应条件为:DNA溶液(1equiv),2μL氢氧化钠水溶液(1M in H2O)、10μL含氮芳杂环结构试剂(500mM in DMA)、5μL tBuXPhos Pd G1(16mM in DMA),混合均匀,80℃反应2h,加入20μL二乙基二硫代氨基甲酸钠溶液(100mM in H2O),混匀,80℃反应20分钟,用飞行时间质谱确定反应效率,将所有反应液混合到一起,使用乙醇沉淀得到冻干粉。加1mL水溶解,使用超滤管超滤,并用去离子水洗两次,最后得到400μL,共392nmol,浓度为0.98mM。回收率普遍可实现约约45%。
式II的DNA编码化合物库的构建流程(参见图2)
第1-5步,操作步骤与上述第1-5步完全相同。
6.取实施例1的建库第二轮化学后的DNA溶液连1H-吲唑-4-甲酸骨架:化学反应条件为:取DNA溶液2896μL,共2520nmol,浓度为0.87mM,均分到84孔中,每孔35μL,再加入11.25μL氢氧化钠水溶液(2M in H2O)、30μL1H-吲唑-4-甲酸(500mM in DMA)、15μLtBuXPhos Pd G1(16mM in DMA),混合均匀,80℃反应2h,加入60μL二乙基二硫代氨基甲酸钠溶液(100mM in H2O),混匀,80℃反应20分钟,用飞行时间质谱确定反应效率,将所有反应液混合到一起,使用乙醇沉淀得到冻干粉。加2mL水溶解,使用超滤管超滤,并用去离子水洗两次,最后得到2530μL,共1745nmol,浓度为0.69mM。回收率普遍可实现约69%。
7.建库第三轮编码:取第二轮化学后的产物2520μL,加入10x的T4缓冲液695μL,去离子水2745μL,T4连接酶210μL,混合均匀后均分到384孔中,再分别加入2μL384种不同第三轮tag溶液连接,混合物在4℃下反应过夜。用飞行时间质谱确定连接完全后,使用乙醇沉淀得到与第三轮tag相连的产物,将其溶解在9μL水中形成DNA溶液。
8.建库第三轮化学:382孔分别与382个不同的胺试剂进行缩合反应,化学反应条件为:DNA溶液(1equiv),22.5μL胺溶液(200mM in DMA)、4.5μL DMTMM(1M in H2O)、9μL N-甲基吗啡啉(1M in DMA),室温过夜反应,混合到一起,使用乙醇沉淀得到冻干粉。加4mL水溶解,再加入400mL体积的哌啶,室温反应1h。使用乙醇沉淀操作后,冻干粉加2mL水溶解,使用超滤管超滤,并用去离子水洗两次,最后得到1230μL,共1144nmol,浓度为0.93mM。回收率普遍可实现约66%。
式III表示化合物(Y为CH2)的DNA编码化合物库的构建流程(参见图3)
第1-5步,操作步骤与上述第1-5步完全相同。
6.取实施例1的建库第二轮化学后的DNA溶液连吡唑结构骨架:第二轮化学的DNA溶液9090μL,共7908nmol,浓度为0.87mM,均分到267孔中,每孔34μL,再加入6μL氢氧化钠水溶液(1M in H2O)、30μL1H-吡唑-4-基氨基甲酸叔丁酯(500mM in DMA)、15μL tBuXPhos PdG1(16mM in DMA),混合均匀,80℃反应2h,加入60μL二乙基二硫代氨基甲酸钠溶液(100mMin H2O),混匀,80℃反应20分钟,用飞行时间质谱确定反应效率,将所有反应液混合到一起,使用乙醇沉淀得到冻干粉。加30mL水溶解,使用超滤管超滤,并用去离子水洗两次,最后得到10000μL,共6800nmol,浓度为0.68mM。回收率普遍可实现约86%。
7.骨架脱Boc保护基:将上述的连完骨架的DNA溶液脱保护,反应条件为:10mL DNA溶液,3.4mL氯化镁溶液(1mM in H2O)、6.8mL乙酸钠水溶液(500mM in H2O),混合均匀后均分到96孔板中,每孔100μL,90℃下加热16小时。用飞行时间质谱确定反应效率,将所有反应液混合到一起,使用乙醇沉淀得到冻干粉。加8mL水溶解,使用超滤管超滤,并用去离子水洗两次,最后得到6000μL,共5100nmol,浓度为0.85mM。回收率普遍可实现约75%。
8.建库第三轮编码:取上完骨架后的产物3000μL,加入10x的T4缓冲液1000μL,去离子水4575μL,T4连接酶300μL,混合均匀后均分到384孔中,再分别加入2.93μL384种不同第三轮tag溶液连接,混合物在4℃下反应过夜。用飞行时间质谱确定连接完全后,使用乙醇沉淀得到与第三轮tag相连的产物,将其溶解在6.5μL pH为5.5的磷酸缓冲液中形成DNA溶液。
9.建库第三轮化学:384孔DNA溶液分别与384个不同的胺试剂进行缩合反应,反应条件为:DNA溶液(1equiv),6.5μL胺溶液(200mM in DMA)、6.5μL NaCNBH3(400mM in H2O),60℃下加热3小时,用飞行时间质谱确定反应效率,将所有反应液混合到一起,使用乙醇沉淀得到冻干粉。加2mL水溶解,使用超滤管超滤,并用去离子水洗两次,最后得到2000μL,共2040nmol,浓度为1.02mM。回收率普遍可实现约80%。
式III表示化合物(Y为C(=))的DNA编码化合物库的构建流程(参见图4)
第1-7步,与上述式III表示化合物(Y为CH2)的DNA编码化合物库的构建流程完全相同。
8.建库第三轮编码:取上完骨架后的产物3000μL,加入10x的T4缓冲液996μL,去离子水4543μL,T4连接酶300μL,混合均匀后均分到384孔中,再分别加入2.9μL384种不同第三轮tag溶液连接,混合物在4℃下反应过夜。用飞行时间质谱确定连接完全后,使用乙醇沉淀得到与第三轮tag相连的产物,将其溶解在10μL buffer(pH=9.4)中形成DNA溶液。
9.建库第三轮化学:384孔分别与384个不同的酸试剂进行缩合反应,反应条件为:DNA溶液(1equiv),预混合3μL酸溶液(200mM in DMA)、3μL HATU(200mM in DMA)、3μLDIPEA(200mM in DMA),再将7.8μL混合溶液加入反应体系,室温反应1-2h,用飞行时间质谱确定反应效率,将所有反应液混合到一起,使用乙醇沉淀得到冻干粉。加5mL水溶解,使用超滤管超滤,并用去离子水洗两次,最后得到2000μL,共2060nmol,浓度为1.03mM。回收率普遍可实现约81%。
实施例
提供这些实施例并非意在限制本发明的范围。
化合物的结构通过核磁共振波谱(1H NMR)和/或质谱(MS)进行确证。
化学位移(δ)以百万分之一(ppm)为单位给出。1H NMR的测定在Bruker 400或Varian 300核磁仪上进行,测试溶剂为氘代甲醇(CD 3OD)、氘代氯仿(CDCl 3)或六氘代二甲基亚砜(DMSO-d 6),内标为四甲基硅烷(TMS)。
所有实施例中,Headpiece购买于Biosearch Technologies,Novato,CA.;DNAtags购买于通用生物;核酸上产物由HPLC/ESI-MS,其中HPLC型号为:AgilentTechnologies 1260infinityⅡ,反相色谱柱为OPTI-LYNXTM Trap Columns,型号为:C18AQ-40μm,ESI-MS型号为G6230B。
如在实施例中无特殊说明,室温是指20℃~30℃。实施例中所使用的试剂购自Aldrich Chemical Company、上海国药试剂有限公司、百灵威试剂有限公司等公司。
合成实施例
以下的实施例使用的DNA头部序列Headpiece(简称HP)为图6所示的,其结构式简化表示为:
P17O101N51C154H213-NH2。
金属催化剂清除剂是浓度为100mM的二乙基二硫代氨基甲酸钠的水溶液,CAS号:20624-25-3
实施例1.On-DNA芳基溴化物化合物1的制备
实验材料:
2mM的HP水溶液
2-(4-溴苯基)乙酸:200mM的DMA溶液
DIPEA:N,N-二异丙基乙胺,200mM的DMA溶液
HATU:2-(7-Azabenzotriazol-1-yl)-N,N,N',N'-tetramethyluroniumhexafluorophosphate 200mM的DMA溶液
pH=9.4缓冲液:250mM的硼酸钠水溶液(pH=9.4)。
操作步骤:
1.将150μL 250mM pH 9.4的缓冲液加入到头饰溶液(200nmol,50μL)中,制成DNA溶液。
2.将2-(4-溴苯基)乙酸与等体积的HATU和DIPEA混合,制备混合物。
3..将120μL混合物加入到DNA溶液中并混合。
4.在室温下反应1小时。
5.如上所述,通过乙醇沉淀获得产物,产率约95%
产物质谱(ESI):5134.4746(理论值5134.26),具体质谱图参照图7。
实施例2 On-DNA化合物1的C-N偶联反应:On-DNA化合物2a的合成
实验材料:
化合物1:1mM的水溶液,3nmol。
氢氧化钠:1M水溶液。
杂环类底物吲唑:1M的DMA溶液。
tBuXPhos Pd G1:20mM的DMA溶液。
操作步骤:
1.在化合物1(3nmol,3μL)的溶液中加入3μL NaOH、2.25μL吲唑和1.2μL tBuXPhosPd G1并混合。
2在80℃下反应3小时
3.向混合物中加入6μL清除剂试剂,然后在70℃下反应20分钟,除去金属催化剂。
4.如上所述,通过乙醇沉淀获得产物化合物2a。转化率约为80%。
产物质谱(ESI):5171.5641(理论值5171.49),具体质谱图参照图8。
实施例3 On-DNA化合物1的C-N偶联反应:On-DNA化合物2d的合成
采用与实施例2同样的方法,将杂环底物替换为上述吲唑甲酸,获得On-DNA化合物2d,转化率约为65%。产物质谱(ESI):5215.6898(理论值5215.50),具体质谱图参照图9。
实施例4 On-DNA化合物2d的进一步修饰
实验材料:
化合物2d:0.5mM的水溶液
苯胺:200mM的DMA溶液,1000eq
DMTMM:1M的水溶液,1000eq
N-甲基吗啡啉(NMM):1M的DMA溶液,2000eq
操作步骤:
1.在化合物2d溶液(5nmol,10μL)中加入25μL苯胺、5μLDMTMM和10μLNMM并混合。
2.在室温下反应24小时。
3.如上所述,通过乙醇沉淀获得On-DNA中间物。
4.将10μLH2O加入冻干粉中并混合。
5.向DNA溶液中加入1μL哌啶并混合。
6.在室温下反应1小时。
7.如上所述,通过乙醇沉淀获得On-DNA化合物5。产率约为95%。
产物质谱(ESI):5290.7163(理论值5290.61),具体质谱图参照图10。
实施例5 On-DNA化合物1的C-N偶联反应:On-DNA化合物2aj的合成
利用与实施例2同样的方法,将其中的杂环底物替换为Boc氨基吡唑,获得了On-DNA化合物2aj。产率约为60%。
产物质谱(ESI):5236.6927(理论值5236.56),具体质谱图参照图11。
实施例6基于化合物2aj的衍生化:On-DNA化合物6的合成
实验材料:
化合物2aj:0.5mM水溶液
MgCl2:1mM水溶液
NaOAc:75mM水溶液
操作步骤:
1.在2aj溶液(5nmol,10μL)中加入5μLMgCl2和10LNaOAc并混合。
2.在90℃下反应16小时。
3.如上所述,通过乙醇沉淀得到产物6。产率约为90%。
产物质谱(ESI):52136.5201(理论值5136.44),具体质谱图参照图12.
实施例7 On-DNA化合物7的合成
实验材料:
化合物6:1mM溶于250mM pH 9.4缓冲溶液中
苯甲酸:200mM的DMA溶液
DIPEA:200mM的DMA溶液
HATU:200mM的DMA溶液
操作步骤:
1.将苯甲酸与等体积的HATU和DIPEA混合以制备混合物。
2.将2.7μL混合物加入6号溶液(3nmol,3μL)并混合。
3.在室温下反应2小时。
4.如上所述,通过乙醇沉淀获得化合物7。产率约为95%。
产物质谱(ESI):5240.6891(理论值5240.55),具体质谱图参照图13。
实施例8 On-DNA化合物B-8的合成
实验材料:
化合物6:1mM水溶液
苯甲醛:200mM DMA溶液
NaCNBH3:200mM水溶液
pH=5.5的缓冲液:500mM的磷酸缓冲液
操作步骤:
1.在化合物6的溶液(3nmol,3μL)中加入3μL500mM pH=5.5的缓冲液、3μL苯甲醛和6μLNaCNBH3并混合。
2.在60℃下反应6小时。
3.如上所述,通过乙醇沉淀获得化合物B-8。转化率约95%。
产物质谱(ESI):5316.7174(理论值5316.69),具体质谱图参照图14。
实施例9 On-DNA化合物1的C-N偶联反应条件初探
采用与实施例1同样的方法,但是按照下表1替换其中的催化剂,碱的种类,合成化合物2a,相应的产率也列在表1中。
表1
/>
在10当量的tBuXPhos Pd G1或TBuBrettPhos Pd G3,500当量的NaOH和250当量的吲唑在混合溶剂(DMA/H2O)的实验条件下能够进行的N-芳烃化反应。钯催化剂优选为tBuXPhos Pd G1。此外,无机碱的选择也大大影响了N-芳烃化的效率。在催化系统存在的情况下,CsOH也可以提供反应性,弱碱如K2CO3和Cs2CO3显示的转化率稍微差一些,但是可以完成反应。这样反应的条件足够温和,兼容DNA的稳定性。
实施例10 On-DNA苯并噻吩溴化物化合物10的制备
实验材料:
HP:2mM的水溶液
溴代苯并噻吩羧酸;200mM的DMA溶液
DIPEA:200mM的DMA溶液
HATU:200mM的DMA溶液
pH=9.4缓冲液:500mM的硼酸钠水溶液(pH=9.4)。
操作步骤:
与实施例1的操作类似,具体为:
1.在HP溶液中(6nmol,3μL)加入3μL500mM的pH=9.4缓冲液,制成DNA溶液。
2.将溴代苯并噻吩羧酸底物溶液与等体积的HATU和DIPEA混合,制备成混合物。
3.将7.2μL混合物加入到DNA溶液中并混合。
4.在室温下反应1小时。
5.如上所述,通过乙醇沉淀获得化合物10。
产物的ESI的质谱显示5176.5008(理论值5176.32)。产率大致为90%。
实施例11化合物10与吡唑的偶联获得化合物11
将实施例2中的化合物替换为上述化合物10,同样地进行了偶联反应,检验本发明反应的通用性。
实验材料:
化合物10:1mM的水溶液
NaOH;1M的水溶液
吲唑:1M的DMA溶液
tBuXPhos Pd G1:20mM的DMA溶液
操作步骤:
1.在化合物10(3nmol,3μL)的溶液中加入3μL NaOH、2.25μL吲唑和1.2μLtBuXPhos Pd G1。
2.在80℃下反应3小时
3.向混合物中加入6μL清除剂试剂,然后在70℃下反应20分钟以除去金属催化剂。
4.如上所述,通过乙醇沉淀获得化合物11。
产物的ESI的质谱显示5213.6782(理论值5213.54)。产率大致为70%。
实施例12 On-DNA吡啶溴化物化合物12的制备
实验材料:
HP:2mM的水溶液
溴代吡啶羧酸底物:200mM的DMA溶液
DIPEA:200mM的DMA溶液
HATU:200mM的DMA溶液
pH=9.4缓冲液:500mM的硼酸钠水溶液(pH=9.4)。
操作步骤:
与实施例1的操作类似,具体为:
1.在HP溶液中(6nmol,3μL)加入3μL500mM的pH=9.4缓冲液,制成DNA溶液。
2.将溴代吡啶羧酸底物溶液与等体积的HATU和DIPEA混合,制备成混合物。
3.将7.2μL制备混合物加入到DNA溶液中并混合。
4.在室温下反应1小时。
5.如上所述,通过乙醇沉淀获得化合物10。
产物的ESI的质谱显示5121.45628(理论值5121.22)。产率大致为90%。
实施例11化合物12与吡唑的偶联获得化合物13
将实施例2中的化合物替换为上述化合物12,同样地进行了偶联反应,检验本发明反应的通用性。
实验材料:
化合物12:1mM的水溶液
NaOH:1M的水溶液
吲唑:1M的DMA溶液
tBuXPhos Pd G1:20mM的DMA溶液
操作步骤:
1.在化合物12(3nmol,3μL)的溶液中加入3μL NaOH、2.25μL吲唑和1.2μLtBuXPhos Pd G1。
2.在80℃下反应3小时
3.向混合物中加入6μL清除剂试剂,然后在70℃下反应20分钟以除去金属催化剂。
4.通过乙醇沉淀获得化合物13。
产物的ESI的质谱显示5158.5793(理论值5158.45)。产率大致为83%。
本发明通过上述实施例来说明本发明的详细方法,但本发明并不局限于上述详细方法,即不意味着本发明必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本发明的任何改进,对本发明产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本发明的保护范围和公开范围之内。
Claims (10)
1.一种DNA编码化合物,其结构由式1表示,
式1中,代表DNA编码标记,
L1为二价的连接基团,其为选自化学键、C1-6亚烷基、C2-6亚烯基、C2-6亚炔基、饱和或部分不饱和的C3-10亚环烃基、-CONH-AA-、-O-、-CO-、-C(=O)O-、-CONH-、-NHCO-、-NHCONH-、-NH-、-S-、亚磺酰基、磺酰基中的一种或者它们之间的组合,其中,AA为天然的或者人工合成的氨基酸试剂去除一个羧基和一个氨基之后剩余的二价残基,
Ar为取代或未取代的C6-C30的亚芳基、或者取代或未取代的C3-C30的亚杂芳基,
Z表示N或者CH,
虚线代表的苯环表示该稠合环可以存在可以不存在,“—”划过的环结构的表达方式,表示连接位点于该环结构上任意能够成键的位置;
各Rx独立地选自卤素、羟基、醛基、氨基、氰基、硝基、C1-6烷基、C1-6烷氧基、饱和或部分不饱和的C3-6环烃基、饱和或部分不饱和的3-10元杂环基、C6-10芳基、5-14元杂芳基、C6-12芳烷基、-C(=O)R8、-OC(=O)R8、-C(=O)OR8、-OR8、-SR8、-S(=O)R8、-S(=O)2R8、-S(=O)2N(R8)2、-N(R8)2、-C(=O)N(R8)2、-NR8-C(=O)R8、-NR8-C(=O)OR8、-NR8-S(=O)2-R8、-NR8-C(=O)-N(R8)2、-C1-6亚烷基-N(R8)2、-C1-6亚烷基-OR8、-C1-6亚烯基-OR8和-O-C1-6亚烷基-N(R8)2,其中R8为H、C1~C6烷基;虚线代表的苯环不存在时m为0~3的整数,虚线代表的苯环存在时,m为0~4的整数,
上述取代或未取代的基团具有取代基时,所述取代基选自氘、卤素、氰基、硝基、氨基、C1-C10的直链或支链的烷基、C1-C10的烷氧基、C3-C10的环烷基、C3-C10的杂环烷基、C6-C20的芳基、C3-C20的杂芳基中的一种或者两种以上的组合。
2.根据权利要求1所述的DNA编码化合物,其结构由式2表示,
式2中,Ar为取代或未取代的从以下基团中去掉一个氢原子得到的二价基团:苯基、萘基、蒽基、苯并蒽基、菲基、苯并菲基、芘基、窟基、茈基、荧蒽基、并四苯基、并五苯基、苯并芘基、联苯基、偶苯基、三联苯基、三聚苯基、四联苯基、芴基、螺二芴基、二氢菲基、二氢芘基、四氢芘基、顺式或反式茚并芴基、三聚茚基、异三聚茚基、螺三聚茚基、螺异三聚茚基、呋喃基、噻吩基、吡咯基、吡啶基、苯并呋喃基、苯并噻吩基、异苯并呋喃基、异苯并噻吩基、吲哚基、异吲哚基、二苯并呋喃基、二苯并噻吩基、咔唑基及其衍生物、喹啉基、异喹啉基、吖啶基、菲啶基、苯并-5,6-喹啉基、苯并-6,7-喹啉基、苯并-7,8-喹啉基、吩噻嗪基、吩嗪基、吡唑基、吲唑基、咪唑基、苯并咪唑基、萘并咪唑基、菲并咪唑基、吡啶并咪唑基、吡嗪并咪唑基、喹喔啉并咪唑基、嗯唑基、苯并嗯唑基、萘并嗯唑基、蒽并嗯唑基、菲并嗯唑基、1,2-噻唑基、1,3-噻唑基、苯并噻唑基、哒嗪基、苯并哒嗪基、嘧啶基、苯并嘧啶基、喹喔啉基、1,5-二氮杂蒽基、2,7-二氮杂芘基、2,3-二氮杂芘基、1,6-二氮杂芘基、1,8-二氮杂芘基、4,5-二氮杂芘基、4,5,9,10-四氮杂茈基、吡嗪基、吩嗪基、吩噻嗪基、萘啶基、氮杂咔唑基、苯并咔啉基、菲咯啉基、1,2,3-三唑基、1,2,4-三唑基、苯并三唑基、1,2,3-噁二唑基、1,2,4-嗯二唑基、1,2,5_嗯二唑基、1,2,3-噻二唑基、1,2,4-噻二唑基、1,2,5-噻二唑基、1,3,4-噻二唑基、1,3,5-三嗪基、1,2,4-三嗪基、1,2,3-三嗪基、四唑基、1,2,4,5-四嗪基、1,2,3,4-四嗪基、1,2,3,5-四嗪基、嘌呤基、蝶啶基、吲嗪基、苯并噻二唑;
AA为天然的或者人工合成的氨基酸试剂去除一个羧基和一个氨基之后剩余的二价残基;
Z表示N或者CH,虚线代表的苯环表示该稠合环可以存在可以不存在,“—”划过的环结构的表达方式,表示连接位点于该环结构上任意能够成键的位置;
各Rx独立地选自卤素、羟基、醛基、氨基、氰基、硝基、C1-6烷基、C1-6烷氧基、饱和或部分不饱和的C3-6环烃基、饱和或部分不饱和的3-10元杂环基、C6-10芳基、5-14元杂芳基、C6-12芳烷基、-C(=O)R8、-OC(=O)R8、-C(=O)OR8、-OR8、-SR8、-S(=O)R8、-S(=O)2R8、-S(=O)2N(R8)2、-N(R8)2、-C(=O)N(R8)2、-NR8-C(=O)R8、-NR8-C(=O)OR8、-NR8-S(=O)2-R8、-NR8-C(=O)-N(R8)2;其中R8为H、C1~C6烷基,
上述取代或未取代的基团具有取代基时,所述取代基选自氘、卤素、氰基、硝基、氨基、C1-C10的直链或支链的烷基、C1-C10的烷氧基、C3-C10的环烷基、C3-C10的杂环烷基、C6-C20的芳基、C3-C20的杂芳基中的一种或者两种以上的组合。
3.根据权利要求2所述的DNA编码化合物,其中,
Ar表示取代或未取代的亚苯基、亚吡啶基、亚呋喃基、亚噻吩基、亚吡嗪基、亚萘基、亚苯并噻吩基;
Rx表示卤素、羟基、醛基、氨基、氰基、硝基、C1-6烷基、C1-6烷氧基、-N(R8)2、-C(=O)N(R8)2、-NR8-C(=O)R8、-NR8-C(=O)OR8、-NR8-S(=O)2-R8、-NR8-C(=O)-N(R8)2;其中R8为H、C1~C6烷基,
上述取代或未取代的基团具有取代基时,所述取代基选自卤素、氰基、硝基、氨基、C1-C10的直链或支链的烷基、C1-C10的烷氧基中的一种或者两种以上的组合。
4.根据权利要求1所述的DNA编码化合物,其结构由式I~III中的任一者表示,
式I~III中,R1表示为天然的或者人工合成的氨基酸试剂去除一个羧基和一个氨基之后剩余的二价残基;
R2表示为取代或未取代的从以下基团中去掉一个氢原子得到的二价基团:苯基、萘基、蒽基、苯并蒽基、菲基、苯并菲基、芘基、窟基、茈基、荧蒽基、并四苯基、并五苯基、苯并芘基、联苯基、偶苯基、三联苯基、三聚苯基、四联苯基、芴基、螺二芴基、二氢菲基、二氢芘基、四氢芘基、顺式或反式茚并芴基、三聚茚基、异三聚茚基、螺三聚茚基、螺异三聚茚基、呋喃基、噻吩基、吡咯基、吡啶基、苯并呋喃基、苯并噻吩基、异苯并呋喃基、异苯并噻吩基、吲哚基、异吲哚基、二苯并呋喃基、二苯并噻吩基、咔唑基及其衍生物、喹啉基、异喹啉基、吖啶基、菲啶基、苯并-5,6-喹啉基、苯并-6,7-喹啉基、苯并-7,8-喹啉基、吩噻嗪基、吩嗪基、吡唑基、吲唑基、咪唑基、苯并咪唑基、萘并咪唑基、菲并咪唑基、吡啶并咪唑基、吡嗪并咪唑基、喹喔啉并咪唑基、嗯唑基、苯并嗯唑基、萘并嗯唑基、蒽并嗯唑基、菲并嗯唑基、1,2-噻唑基、1,3-噻唑基、苯并噻唑基、哒嗪基、苯并哒嗪基、嘧啶基、苯并嘧啶基、喹喔啉基、1,5-二氮杂蒽基、2,7-二氮杂芘基、2,3-二氮杂芘基、1,6-二氮杂芘基、1,8-二氮杂芘基、4,5-二氮杂芘基、4,5,9,10-四氮杂茈基、吡嗪基、吩嗪基、吩噻嗪基、萘啶基、氮杂咔唑基、苯并咔啉基、菲咯啉基、1,2,3-三唑基、1,2,4-三唑基、苯并三唑基、1,2,3-噁二唑基、1,2,4-嗯二唑基、1,2,5_嗯二唑基、1,2,3-噻二唑基、1,2,4-噻二唑基、1,2,5-噻二唑基、1,3,4-噻二唑基、1,3,5-三嗪基、1,2,4-三嗪基、1,2,3-三嗪基、四唑基、1,2,4,5-四嗪基、1,2,3,4-四嗪基、1,2,3,5-四嗪基、嘌呤基、蝶啶基、吲嗪基、苯并噻二唑;
Y表示CH2或C(=O),
虚线代表的苯环表示该稠合环可以存在可以不存在,“—”划过的环结构的表达方式,表示连接位点于该环结构上任意能够成键的位置;
R3表示H、C1~C6烷基,
上述取代或未取代的基团具有取代基时,所述取代基选自卤素、氰基、硝基、氨基、C1-C10的直链或支链的烷基、C1-C10的烷氧基中的一种或者两种以上的组合。
5.根据权利要求4所述的DNA编码化合物,
式I~III中,R1表示为从下述氨基酸试剂去除一个羧基和一个氨基之后剩余的二价残基:
L-型的丙氨酸、精氨酸、天冬氨酸、半胱氨酸、谷氨酸、谷氨酸盐、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯基丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸,以及D-型的丙氨酸、精氨酸、天冬氨酸、半胱氨酸、谷氨酸、谷氨酸盐、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯基丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸,以及2-氨基己二酸、3-氨基己二酸、β-氨基丙酸、2-氨基丁酸、4-氨基丁酸、6-氨基己酸、2-氨基庚酸、2-氨基异丁酸、3-氨基异丁酸、2-氨基庚二酸、2,4-二氨基丁酸、锁链赖氨素、2,2′-二氨基庚二酸、2,3-二氨基丁酸、N-乙基甘氨酸、N-乙基天冬氨酸、羟基赖氨酸、别-羟基赖氨酸、3-羟基脯氨酸、4-羟基脯氨酸、异锁链赖氨素、别-异亮氨酸、N-甲基甘氨酸(肌氨酸)、N-甲基异亮氨酸、N-甲基缬氨酸、正缬氨酸、正亮氨酸和鸟氨酸;
R2表示为取代或未取代的亚苯基、亚吡啶基、亚呋喃基、亚噻吩基、亚吡嗪基、亚萘基、亚苯并噻吩基;
Y表示CH2或C(=O),
上述取代或未取代的基团具有取代基时,所述取代基选自卤素、氰基、硝基、氨基、C1-C10的直链或支链的烷基、C1-C10的烷氧基中的一种或者两种以上的组合。
6.一种DNA编码化合物库,其特征在于,包含权利要求1~5中任一项所述的DNA编码化合物。
7.权利要求1所述的DNA编码化合物的合成方法,其特征在于,该方法包含在碱的存在下,在含有钯的催化剂催化下,在溶剂中,在90℃以下的温度条件下,使式A表示的化合物与式B表示的化合物接触的工序,生成式(1)所示的化合物,
式(A)中,X为卤素,L1和Ar与权利要求1中表达的意思相同,
式(B)中,Z、m、Rx与权利要求1中表达的意思相同。
8.根据权利要求7所述的DNA编码化合物的合成方法,其中,
反应温度为70~85℃,
所述含有钯的催化剂为tBuXPhos Pd G1、TBuBrettPhos Pd G3,所述碱为碱金属的氧化物、碱金属的氢氧化物、碱金属的碳酸盐、碱土金属的氧化物、碱土金属的氢氧化物、碱土金属的碳酸盐,所述溶剂为非质子性极性溶剂与水的混合溶剂,
优选的是所述含有钯的催化剂为tBuXPhos Pd G1、所述碱为碱金属的氢氧化物,所述溶剂为选自二甲亚砜、丙酮、乙腈、二甲基甲酰胺、二甲基乙酰胺、六甲基磷酰胺的溶剂与水混合而成的溶剂,
更优选的是,所述含有钯的催化剂为tBuXPhos Pd G1、所述碱为氢氧化钠,所述溶剂为二甲基乙酰胺DMA与水混合而成的溶剂。
9.一种DNA编码化合物库的构建方法,其特征在于,包括在tBuXPhos Pd G1的催化剂催化下,在碱存在的条件下,在90℃以下的温度条件下,使连接于DNA的化合物上的卤代芳烃的C原子,与芳香族环的sp2杂化N原子发生C-N偶联的反应。
10.根据权利要求9所述的DNA编码化合物库的构建方法,其中,所述碱为碱金属的氧化物、碱金属的氢氧化物、碱金属的碳酸盐、碱土金属的氧化物、碱土金属的氢氧化物、碱土金属的碳酸盐,所述溶剂为非质子性极性溶剂与水的混合溶剂,
优选的是所述碱为碱金属的氢氧化物,所述溶剂为选自二甲亚砜、丙酮、乙腈、二甲基甲酰胺、二甲基乙酰胺、六甲基磷酰胺的溶剂与水混合而成的溶剂,
更优选的是所述碱为氢氧化钠,所述溶剂为二甲基乙酰胺DMA与水混合而成的溶剂。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210230598.8A CN116768951A (zh) | 2022-03-10 | 2022-03-10 | 含有芳香族含氮骨架的dna编码化合物及其合成方法、dna编码化合物库 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210230598.8A CN116768951A (zh) | 2022-03-10 | 2022-03-10 | 含有芳香族含氮骨架的dna编码化合物及其合成方法、dna编码化合物库 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116768951A true CN116768951A (zh) | 2023-09-19 |
Family
ID=87995048
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210230598.8A Pending CN116768951A (zh) | 2022-03-10 | 2022-03-10 | 含有芳香族含氮骨架的dna编码化合物及其合成方法、dna编码化合物库 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116768951A (zh) |
-
2022
- 2022-03-10 CN CN202210230598.8A patent/CN116768951A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kim et al. | Site-selective functionalization of methionine residues via photoredox catalysis | |
Singh et al. | Advances of azide-alkyne cycloaddition-click chemistry over the recent decade | |
Pretze et al. | The traceless Staudinger ligation with fluorine-18: A novel and versatile labeling technique for the synthesis of PET-radiotracers | |
Ramenda et al. | Synthesis of 18F-labeled neurotensin (8-13) via copper-mediated 1, 3-dipolar [3+ 2] cycloaddition reaction | |
CN102933554A (zh) | 用于研究蛋白质-蛋白质相互作用的交联试剂、方法和组合物 | |
EP2099776B1 (en) | Chelating agent | |
JP2022526939A (ja) | 修飾された切断酵素、その使用、および関連キット | |
JP2004536892A (ja) | 放射能標識された化合物のポリマー前駆体、ならびにその作製および使用法 | |
Ramenda et al. | 4-[18 F] Fluoro-N-methyl-N-(propyl-2-yn-1-yl) benzenesulfonamide ([18 F] F-SA): a versatile building block for labeling of peptides, proteins and oligonucleotides with fluorine-18 via Cu (I)-mediated click chemistry | |
CN112830950B (zh) | 一种合成On-DNA二氢噻唑/噻唑化合物的方法 | |
Xu et al. | Fast and catalyst-free hydrazone ligation via ortho-halo-substituted benzaldehydes for protein C-terminal labeling at neutral pH | |
Alfano et al. | Amide bonds meet flow chemistry: a journey into methodologies and sustainable evolution | |
CN110642803B (zh) | 一种二氢噻唑杂环化合物的合成方法及在生物分子修饰中的应用 | |
Asakawa et al. | Axially Chiral Catenanes and π‐Electron‐Deficient Receptors | |
Song et al. | Chemoselective Peptide Backbone Diversification and Bioorthogonal Ligation by Ruthenium‐Catalyzed C− H Activation/Annulation | |
CN114478671A (zh) | 一种脒基脲类先导化合物及其合成方法 | |
CN116768951A (zh) | 含有芳香族含氮骨架的dna编码化合物及其合成方法、dna编码化合物库 | |
US20230295222A1 (en) | Conjugation Reagents and Methods Using 1,2-Cyclohexanediones | |
Zhang et al. | A New Pyridoxal Derivative for Transamination of N‐Terminus of Proteins | |
Melsen et al. | Opportunities for Expanding Encoded Chemical Diversification and Improving Hit Enrichment in mRNA‐Displayed Peptide Libraries | |
Zinieris et al. | Improved solid-phase peptide synthesis of ‘difficult peptides’ by altering the microenvironment of the developing sequence | |
CN117127267A (zh) | Dna-nh-拟肽类衍生物化合物的合成方法以及dna编码化合物库构建 | |
CN113321690A (zh) | 一种可见光促进的on-DNA自由基反应合成DNA编码砜类化合物的方法 | |
CN116590798A (zh) | 含有三嗪骨架的dna编码化合物及其合成方法、dna编码化合物库 | |
CA3143662A1 (en) | A method for modification of peptides immobilized on a solid support by traceless reductively cleavable linker molecules |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |