WO2024040531A1 - Novel compositions for conjugating oligonucleotides and carbohydrates - Google Patents

Novel compositions for conjugating oligonucleotides and carbohydrates Download PDF

Info

Publication number
WO2024040531A1
WO2024040531A1 PCT/CN2022/114893 CN2022114893W WO2024040531A1 WO 2024040531 A1 WO2024040531 A1 WO 2024040531A1 CN 2022114893 W CN2022114893 W CN 2022114893W WO 2024040531 A1 WO2024040531 A1 WO 2024040531A1
Authority
WO
WIPO (PCT)
Prior art keywords
alkyl
compound
group
haloalkyl
independently
Prior art date
Application number
PCT/CN2022/114893
Other languages
French (fr)
Inventor
Chiang J. Li
Chen CAO
Li GUI
Praveen Pogula
Xiangao Sun
Danielle Rand
Original Assignee
1Globe Health Institute, Nanjing
1Globe Health Institute Llc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 1Globe Health Institute, Nanjing, 1Globe Health Institute Llc filed Critical 1Globe Health Institute, Nanjing
Priority to PCT/CN2022/114893 priority Critical patent/WO2024040531A1/en
Publication of WO2024040531A1 publication Critical patent/WO2024040531A1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H15/00Compounds containing hydrocarbon or substituted hydrocarbon radicals directly attached to hetero atoms of saccharide radicals
    • C07H15/02Acyclic radicals, not substituted by cyclic structures
    • C07H15/04Acyclic radicals, not substituted by cyclic structures attached to an oxygen atom of the saccharide radical
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/54Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic compound
    • A61K47/549Sugars, nucleosides, nucleotides or nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H15/00Compounds containing hydrocarbon or substituted hydrocarbon radicals directly attached to hetero atoms of saccharide radicals
    • C07H15/26Acyclic or carbocyclic radicals, substituted by hetero rings
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/315Phosphorothioates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate

Definitions

  • the invention relates to novel compositions and processes that can be used in conjugating carbohydrate ligands with oligonucleotides intended for biomedical applications.
  • oligonucleotides have been the focus of many research and development efforts as these strings of nucleotides hold great promise for treating or preventing many diseases and for modulating physiological conditions.
  • oligonucleotides include short/small interfering RNA (siRNA) , asymmetric short/small interfering RNA (aiRNA) , antisense oligonucleotide (ASO) , and micro-RNA (miRNA) .
  • RNA interference works through short, double-stranded RNA (dsRNA) duplexes called siRNA in a gene-specific fashion in many organisms.
  • the siRNAs have a well-defined structure of symmetric, short (usually 20-24 base pairs) dsRNA duplex having phosphorylated 5’ ends and hydroxylated 3’ ends that form two 3’ overhangs of equal lengths.
  • Gene modulation is mediated through a multi-protein RNA-induced silencing complex (RISC) , which binds, unwinds, and incorporates the anti-sense siRNA strand from the siRNA duplex, and then recognizes and targets complementary messenger RNAs (mRNAs) for cleavage thereby reducing its gene expression in a post-transcriptional fashion.
  • RISC multi-protein RNA-induced silencing complex
  • aiRNA was developed to overcome off-target effects mediated by sense strand of the symmetrically configured canonical siRNA as well as other off-target mechanisms of siRNA (See PCT Patent Publication WO2009029688) .
  • aiRNAs are designed to include short RNA duplex where the lengths of the two RNA strands are not equal, hence “asymmetric. ”
  • an aiRNA can include a first strand that is 18-23 nucleotides long and a second that is 12-17 nucleotides long, forming a duplex where the first strand might have a 3’ overhang of 1-9 nucleotides and a 5’ overhang of 0-8 nucleotides.
  • the aiRNA technology can be used in all areas where current siRNA or short-hairpin RNA (shRNA) are being applied including biology research, R&D research in biotechnology and pharmaceutical industry, and RNAi-based therapies.
  • Antisense technology is a highly selective gene silencing technology based upon a concept originally proposed in 1978 (Zamecnik P.C. et al., 1978) .
  • the principle behind the ASO technology is that an antisense oligonucleotide hybridizes to a target nucleic acid and modulates gene expression through post-transcriptional mechanisms.
  • the mechanisms can be broadly categorized as: (1) occupancy only without promoting RNA degradation, in which the binding of the ASO leads to translational arrest, inhibition of splicing, or induction of alternatively spliced variants, or (2) occupancy-induced destabilization, in which the binding of the ASO promotes degradation of the RNA through endogenous enzymes, such as ribonuclease H1 (RNase H1) ; and (3) increased translation: ASO can block upstream open reading frames (uORFs) or other inhibitory elements in the 5’UTR, increasing translation efficiency (Stanley T. Crooke et al., 2008; C. Frank Bennett, 2010; Richard G. Lee, 2013; Stanley T. Crooke, 2017) .
  • uORFs upstream open reading frames
  • ASO a single-stranded deoxyribonucleotide sequence with sulfur chemistry modification, known as phosphorothioate.
  • a miRNA molecule normally derives from noncoding regions of RNA transcripts that fold back onto themselves to form hairpins. After having been processed from its precursors through various cellular machineries, a mature miRNA is a small (about 22 nucleotides) RNA molecule found in plants, animal and some viruses that regulate gene expression through post-transcriptional silencing.
  • Therapeutics based on these and other nucleic acids provide promising solutions to a variety of diseases, including non-druggable targets.
  • oligonucleotides and oligonucleotide analogs as therapeutics, there continues to exist great needs for enhancing key pharmacological properties of these therapeutic oligonucleotides in areas such as serum stability, delivery to the intended organ or cell population, and uptake across cellular membranes.
  • Preferred delivery of therapeutic oligonucleotides to cells in vivo requires specific targeting and protection from the extracellular environment inside the body including from proteins in the serum.
  • a method that researchers have employed to achieve specific targeting is to conjugate a targeting moiety to the oligonucleotides to direct therapeutic oligonucleotides to the desired target site.
  • One way to improve specificity in delivery is by taking advantage of receptor mediated endocytic activities that already exist in the body.
  • the mechanism of uptake involves the movement of molecules bound to cell membrane receptors across the membrane and into the cell via invagination of the membrane structure or by fusion of the delivery system with the cell membrane. This process is initiated via activation of a cell-surface or membrane receptor following binding of a specific ligand to the receptor. Therefore, by conjugating a drug candidate to a targeting moiety that targets such cell surface receptor (s) , one can effectively borrow the innate endocytic pathways for drug delivery.
  • ASGP-R Asialoglycoprotein receptor
  • GalNAc N-Acetyl-D-Galactosylamine
  • the invention relates to a compound, as a therapeutic agent, where an oligonucleotide is conjugated with at least one ligand, e.g., a carbohydrate ligand such as a monosaccharide, disaccharide, trisaccharide, tetrasaccharide, oligosaccharide, polysaccharide or their derivatives, which can target the compound to receptor cells in the liver that can facilitate endocytic uptake as discussed above.
  • a carbohydrate ligand such as a monosaccharide, disaccharide, trisaccharide, tetrasaccharide, oligosaccharide, polysaccharide or their derivatives
  • the compound includes more than one carbohydrate ligand, preferably two or three.
  • the compound of the invention includes at least one (e.g., one, two or three or more) N-Acetyl-Galactosamine (GalNAc) , N-Ac-Glucosamine (GlcNAc) , galactose, lactose, or mannose (e.g., mannose-6-phosphate) .
  • the compound of the invention includes at least one (e.g., one, two or three or more) ligand selected from the group consisting of GalNAc, cholesterol, tocopherol, biotin, cyanine dyes, folic acid, RGDp, transferrin, anisamide, lactobionic acid, cRGD, hyaluronic acid, low molecular weight protamine, lipid derivatives, peptides, cyclic peptides, and heterocycles.
  • at least one e.g., one, two or three or more
  • ligand selected from the group consisting of GalNAc, cholesterol, tocopherol, biotin, cyanine dyes, folic acid, RGDp, transferrin, anisamide, lactobionic acid, cRGD, hyaluronic acid, low molecular weight protamine, lipid derivatives, peptides, cyclic peptides, and heterocycles.
  • the invention provides ligand-conjugated compounds having novel structure:
  • R 205 , R 206 are each independently for each occurrence H, OH, a protecting group for OH, a phosphate group, a phosphodiester group, an activated phosphate group, an activated phosphite group, a phosphoramidite, a solid support, -OP (M') (M”) O-nucleoside, -OP (M') (M”) O-oligonucleotide, a lipid, a PEG, a steroid, a polymer, -O-nucleotide, a nucleoside, -OP (M') (M") O-R 201 -OP (M'") (M"”) O-oligonucleotide, -X-OP (M') (M”) O-oligonucleotide, -Z-OP (M') (M”) O-oligonucleotide or an oligonucleotide;
  • M', M", M'" and M"" are each independently for each occurrence O or S;
  • A1, A2 and A3 are each independently for each occurrence selected from (S-1H) or (S-1G) :
  • R 202A is –R 202 -R 202L ;
  • R 217A is –R 217 -R 217L ;
  • R 202L , R 217L are independently for each occurrence one ligand capable of docking to a cell surface receptor
  • R 1 , R 2 , R 204 , R 207 , R 208 , R 213 , R 214 , R 215 , R 216 , R 209 are independently for each occurrence selected one or more from the group consisting of H, alkyl, aryl, heteroaryl, haloalkyl, -O alkyl, -O alkylphenyl, -alkyl-OH, -O haloalkyl, -S alkyl, -S alkylphenyl, -alkyl-SH, -S haloalkyl, halo, -OH, -SH, -NH 2 , -alkyl-NH 2 , -N (alkyl) (alkyl) , -NH (alkyl) , -N (alkyl) (alkylphenyl) , -NH (alkylphenyl) , cyano, nitro, -CO 2 H, -C (
  • n 201 , n 211 are each independently for each occurrence 1, 2, 3, 4, 5 or 6;
  • J 201 , J 202 , J 211 , J 212 are each independently for each occurrence absent or a spacer;
  • a, b and c are each independently for each occurrence integer 0-5, and the sum of a, b and c is an integer of 1-10;
  • the oligonucleotide comprises naturally occurring or chemically modified nucleotides/nucleosides.
  • Item 2 A compound of item 1, wherein the sum of a, b and c is an integer of 1 or 3.
  • Item 3 A compound of item 1, wherein the compound having the structural formula (S-H1) :
  • R 1 is selected one or more from the group consisting of H, C 1 -C 5 alkyl, aryl, heteroaryl, C 1 -C 5 haloalkyl, -C 1 -C 5 alkyl-OH, -C 1 -C 5 alkyl-SH, -C 1 -C 5 alkyl-NH 2 , -CO 2 H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2 , -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -SO 2 (alkyl) , -SO 2 (haloalkyl) , -SO 2 NH 2 , -SO 2 NH (alkyl) , and -SO 2 NH (phenyl) ;
  • n 202 is selected from 1-10, preferably 1-3.
  • J 202B is selected from a alkylene of 1 to 10 carbon atoms, optionally selected from a straight alkylene of 1 to 10 carbon atoms;
  • R 205A is a group comprising a solid support or H
  • the carbon marked with symbol “*” is chiral carbon atom.
  • Item 5 The compound of item 3 or item 4, wherein n 202 is 1 or 3.
  • Item 6 The compound of any one of items 3-4, wherein R 206 comprises an oligonucleotide.
  • Item 7 The compound of item 6, wherein the compound having the structural formula (S-H1-02) :
  • Item 10 The compound of item 9, wherein n 201 is 1, n 202 is 1 or 3;
  • A is O or S
  • X 1 is independently selected from Table 2;
  • J 202 , Z are independently for each occurrence selected from Table 3;
  • R, R’a re each independently selected from the group consisting of a naturally occurring and/or chemically modified oligonucleotide, H and a protecting group for OH; at least one of R and R’ comprises an oligonucleotide formed by natural and/or chemically modified nucleotides/nucleosides;
  • R 202 is selected from a straight alkylene of 3 to 15 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O; and wherein R 202 is optionally not substituted or substituted by R 209 .
  • R 202 is selected from -C 3 -C 8 straight alkylene-.
  • Item 12 The compound of item 11, wherein the compound having the structural formula (S-H1-06) , (S-H1-07) , (S-H1-08) or (S-H2-01) :
  • Item 13 The compound of item 11, the compound having the structural formula (S-H1-09) , (S-H1-10) , (S-H1-11) or (S-H2-02) :
  • Item 14 The compound of item 11, wherein having the structural formula (S-H1-12) , (S-H1-13) , (S-H1-14) or (S-H2-03) :
  • Item 15 The compound of item 1, the compound having the structural formula (S-H1-15) , (S-H1-16) or (S-H2-04) :
  • R, R’ are each independently selected from the group consisting of a naturally occurring or chemically modified oligonucleotide, H and a protecting group for OH;
  • R and R’ comprises an oligonucleotide formed by natural and/or chemically modified nucleotides/nucleosides;
  • each A independently is O or S;
  • each Q is independently selected from the group consisting of absent, amide, ether, triazole, carbonate, carbamate, phosphate, phosphonate, phosphorothioate, sulphate, disulfide, ester, thioester, alkyl amine, cyclic alkyl amine, alkyne, cyclic alkyne, alkene, cyclic alkene, lactone, and lactam bonds;
  • each Y is independently selected from Table 4, or a straight alkylene of 3 to 15 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O; and wherein Y is optionally not substituted or substituted by R 207 ;
  • each Z is independently selected from Table 3;
  • each L independently comprises a ligand moiety capable of docking to a cell-surface receptor.
  • Item 16 The compound of any one of items 11-15, wherein each A is O.
  • Item 17 The compound of any one of items 11-15, wherein at least one A is S.
  • Item 18 The compound of any one of items 1-17, wherein each ligand is independently selected from the group consisting of N-acetyl galactosamine (GalNAc) , cholesterol, tocopherol, biotin, cyanine dyes, folic acid, RGDp, transferrin, anisamide, lactobionic acid, cRGD, hyaluronic acid, low molecular weight protamine, lipid derivatives, peptides, cyclic peptides, and heterocycles.
  • GalNAc N-acetyl galactosamine
  • Item 19 The compound of any one of items 1-17, wherein the ligand is N-acetyl galactosamine (GalNAc) .
  • Item 20 The compound of item 12, wherein the compound has the structure shown in formula HS-1 to HS-8, HS-10:
  • Item 22 The compound of item 12, wherein the compound has the structure shown of HS-5, HS-13:
  • R 2 is selected one or more from the group consisting of H, C 1 -C 5 alkyl, aryl, heteroaryl, C 1 -C 5 haloalkyl, -C 1 -C 5 alkyl-OH, -C 1 -C 5 alkyl-SH, -C 1 -C 5 alkyl-NH 2 , -CO 2 H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2 , -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -SO 2 (alkyl) , -SO 2 (haloalkyl) , -SO 2 NH 2 , -SO 2 NH (alkyl) , and -SO 2 NH (phenyl) ;
  • n 212 is selected from 1-10, preferably 1-3.
  • J 212B is selected from a alkylene of 1 to 10 carbon atoms; optionally selected from a straight alkylene of 1 to 10 carbon atoms;
  • R 205 is a group comprising a solid support or H
  • the carbon marked with symbol “*” is chiral carbon atom.
  • Item 25 The compound of item 23 or item 24, wherein n 212 is selected from 1or 3.
  • Item 26 The compound of any one of items 23-24, wherein R 206 comprises an oligonucleotide.
  • Item 30 The compound of any of item 29, wherein n 211 is 1, n 212 is 1 or 3.
  • Item 31 The compound of item 29, wherein the compound having the structural formula (S-G1-03) , (S-G1-04) , (S-G1-05) or (S-G2) :
  • A is O or S
  • X 1 is independently selected from Table 2;
  • J 212 , Z are each independently for each occurrence selected from Table 3;
  • R, R’ are each independently selected from the group consisting of a naturally occurring and/or chemically modified oligonucleotide, H and a protecting group for OH;
  • R and R’ comprises an oligonucleotide formed by natural and/or chemically modified nucleotides/nucleosides;
  • R 217 is selected from a straight alkylene of 3 to 15 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O; and wherein R 217 is optionally not substituted or substituted by R 209 .
  • R 217 is selected from -C 3 -C 8 straight alkylene-.
  • Item 32 The compound of item 31, the compound having the structural formula (S-G1-06) , (S-G1-07) , (S-G1-08) or (S-G2-01) :
  • Item 33 The compound of item 31, the compound having the structural formula (S-G1-09) , (S-G1-10) , (S-G1-11) or (S-G2-02) :
  • Item 34 The compound of item 31, wherein the compound has the structural formula (S-G1-12) , (S-G1-13) , (S-G1-14) or (S-G2-03) :
  • Item 35 The compound of item 1, the compound having the structural formula (S-G1-15) , (S-G1-16) or (S-G2-04) :
  • R, R’ are each independently selected from the group consisting of a naturally occurring or chemically modified oligonucleotide, H and a protecting group for OH;
  • At least one of R and R’ comprises a naturally occurring or chemically modified oligonucleotide
  • each A independently is O or S;
  • each Q is independently selected from the group consisting of absent, amide, ether, triazole, carbonate, carbamate, phosphate, phosphonate, phosphorothioate, sulphate, disulfide, ester, thioester, alkyl amine, cyclic alkyl amine, alkyne, cyclic alkyne, alkene, cyclic alkene, lactone, and lactam bonds;
  • each Y is independently selected from Table 4, or a straight alkylene of 3 to 15 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O; and wherein Y is optionally not substituted or substituted by R 207 ;
  • each Z is independently selected from Table 3;
  • each Z is independently selected from Table 5;
  • each L independently comprises a ligand moiety capable of docking to a cell-surface receptor
  • each of n1, n2, n3 is independently selected from 1, 2, 3 or 4.
  • Item 36 The compound of any one of items 31-35, wherein each A is O.
  • Item 37 The compound of any one of items 31-35, wherein at least one A is S.
  • Item 38 The compound of any of items 23-37, wherein each ligand is independently selected from the group consisting of N-acetyl galactosamine (GalNAc) , cholesterol, tocopherol, biotin, cyanine dyes, folic acid, RGDp, transferrin, anisamide, lactobionic acid, cRGD, hyaluronic acid, low molecular weight protamine, lipid derivatives, peptides, cyclic peptides, and heterocycles.
  • GalNAc N-acetyl galactosamine
  • Item 39 The compound of any one of items 23-37, wherein the ligand is N-acetyl galactosamine (GalNAc) .
  • Item 40 The compound of item 31, wherein the compound has the structure shown in formula GS-1 to GS-8, GS-10:
  • Item 41 The compound of item 31, wherein the compound has the structure shown in formula GS-9, GS-14:
  • Item 42 The compound of item 31, wherein the compound has the structure shown in formula GS-5, GS-13:
  • Item 43 The compound of any of items 1-42, wherein the naturally occurring or chemically modified oligonucleotide is linked to the rest of the compound through its 5’ end and/or 3’ end.
  • Item 44 A compound of item 43, wherein the oligonucleotide comprises a small interfering RNA (siRNA) duplex.
  • siRNA small interfering RNA
  • Item 45 A compound of item 43, wherein the oligonucleotide comprises an asymmetric interfering RNA (aiRNA) duplex.
  • aiRNA asymmetric interfering RNA
  • Item 46 A compound of item 45, wherein the aiRNA comprising an antisense strand and a sense strand, wherein the antisense strand is longer than the sense strand, has a length of 19, 20, 21, 22, 23, 24, 25, 26 or 27 nucleotides and includes a 3'-overhang of 1-9nucleotides and a 5'-overhang of 0-8 nucleotides when duplexed with the sense strand;
  • the sense strand has a length of 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 or 26 nucleotides and forms a double-stranded region with the antisense strand.
  • Item 47 A compound of item 46, wherein the aiRNA comprising an antisense strand and a sense strand, wherein the antisense strand is longer than the sense strand, has a length of 19, 20, 21, 22, 23, 24, 25, 26 or 27 nucleotides and includes a 3'-overhang of 1-9nucleotides and a 5'-overhang of 1-8 nucleotides when duplexed with the sense strand;
  • the sense strand has a length of 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 or 26 nucleotides and forms a double-stranded region with the antisense strand.
  • Item 48 A compound of item 46, wherein the aiRNA comprising an antisense strand and a sense strand, wherein the antisense strand is longer than the sense strand, has a length of 19, 20, 21, 22, 23, 24, 25, 26 or 27 nucleotides and includes a 3'-overhang of 1-9nucleotides and a 5'blunt end when duplexed with the sense strand;
  • the sense strand has a length of 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 or 26 nucleotides and forms a double-stranded region with the antisense strand.
  • Item 49 A compound of item 43, wherein the oligonucleotide comprises an antisense oligonucleotide (ASO) .
  • ASO antisense oligonucleotide
  • Item 50 A compound of item 43, wherein the oligonucleotide comprises micro-RNA (miRNA) .
  • miRNA micro-RNA
  • Item 51 A small interfering RNA (siRNA) agent duplex comprising a structural formula of any of items 1-50.
  • siRNA small interfering RNA
  • Item 52 An asymmetric interfering RNA (aiRNA) agent comprising a structural formula of any of items 1-50.
  • aiRNA asymmetric interfering RNA
  • Item 53 An antisense oligonucleotide (ASO) agent comprising a structural formula of any of items 1-50.
  • ASO antisense oligonucleotide
  • Item 54 A micro-RNA (miRNA) agent comprising a structural formula of any of items 1-50.
  • Item 55 A pharmaceutical composition comprising a compound of items 1-50 or agent of any one of items 51-54 and a pharmaceutically acceptable excipient, carrier, or diluent.
  • Item 56 Use of a compound of any one of items 1-50 or agent of any one of items 51-54 in preparation of a medicament effective for treating a disease or condition.
  • the invention features a compound comprising a carbohydrate ligand as provided in the second aspect above, and the presence of the carbohydrate ligand can increase delivery of the compound to the targeted organs, e.g. liver.
  • a compound comprising a carbohydrate ligand can be useful for targeting a gene related to a disease or an undesired condition in the targeted organs.
  • a compound of the invention comprising the carbohydrate ligand can target a nucleic acid expressed by a hepatitis virus.
  • the target gene can be selected from the group consisting of: Factor VII, Eg5, PCSK9, APOC3, TPX2, apoB, SAA, TTR, RSV, PDGF beta gene, Erb-B gene, Src gene, CRK gene, GRB2 gene, RAS gene, MEKK gene, JNK gene, RAF gene, Erkl/2 gene, PCNA (p21) gene, MYB gene, JUN gene, FOS gene, BCL-2 gene, Cyclin D gene, VEGF gene, EGFR gene, Cyclin A gene, Cyclin E gene, WNT-I gene, beta-catenin gene, c-MET gene, PKC gene, NFKB gene, STAT3 gene, survivin gene, Her2/Neu gene, topoisomerase I gene, topoisomerase II alpha gene, mutations in the p73 gene, mutations in the p21(WAFl /CIPl) gene, mutations in the p27 (KIPl) gene, mutations in
  • the invention provides compounds having novel structure:
  • R 0 is selected one or more from the group consisting of H, C 1 -C 5 alkyl, aryl, heteroaryl, C 1 -C 5 haloalkyl, -C 1 -C 5 alkyl-OH, -C 1 -C 5 alkyl-SH, -C 1 -C 5 alkyl-NH 2 , -CO 2 H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2 , -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -SO 2 (alkyl) , -SO 2 (haloalkyl) , -SO 2 NH 2 , -SO 2 NH (alkyl) , and -SO 2 NH (phenyl) ;
  • R 202A comprises at least one ligand capable of docking to a cell surface receptor
  • R 204 , R 207 , R 208 are independently selected one or more from the group consisting of H, alkyl, aryl, heteroaryl, haloalkyl, -O alkyl, -O alkylphenyl, -alkyl-OH, -O haloalkyl, -S alkyl, -Salkylphenyl, -alkyl-SH, -S haloalkyl, halo, -OH, -SH, -NH 2 , -alkyl-NH 2 , -N (alkyl) (alkyl) , -NH (alkyl) , -N (alkyl) (alkylphenyl) , -NH (alkylphenyl) , cyano, nitro, -CO 2 H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH
  • n 201 is selected from 1, 2, 3, 4, 5 or 6;
  • R 206 is selected from OH or a protecting group for OH
  • J 201 , J 202 are each independently for each occurrence a spacer
  • R 205B is a -C 2 -C 10 alkynylene-CN
  • R 205C , R 205D are independently selected from -C 1 -C 6 -alkyl or R 205C and R 205D together form a five-or six-membered ring, optionally R 205C , R 205D are substituted, optionally R 205C , R 205D contain one further heteroatom selected from N and O.
  • J 202B is selected from a alkylene of 1 to 10 carbon atoms.
  • Item 60 A compound of item59, having the structural formula (G-P3) :
  • R 205B is a -C 2 –C 5 alkynylene-CN
  • R 205C , R 205D are independently selected from -C 1 -C 6 -alkyl
  • R 202A is –R 202C -branching group- (R 202B -R 202L ) n 111L or –R 202B -R 202L ;
  • R 202L is independently selected from a ligand capable of docking to a cell surface receptor
  • n 111L is selected from 1, 2 or 3.
  • Item 63 A compound of item 62, wherein R 202C is selected from –C (O) -C 5 –C 8 straight alkylene-NHCO-CH 2 -or –C (O) -C 8 –C 11 straight alkylene-.
  • Item 64 A compound of item 62, wherein the branching group is selected from the group consisting of:
  • each n is independently from 1 to 20.
  • Item 65 A compound of item 61, wherein, the ligand is wherein R A is H or a protecting group for OH.
  • Item 66 A compound of item 61, having the structural formula (G-P5) :
  • R 3 is selected one or more from the group consisting of H, C 1 -C 5 alkyl, aryl, heteroaryl, C 1 -C 5 haloalkyl, -C 1 -C 5 alkyl-OH, -C 1 -C 5 alkyl-SH, -C 1 -C 5 alkyl-NH 2 , -CO 2 H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2 , -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -SO 2 (alkyl) , -SO 2 (haloalkyl) , -SO 2 NH 2 , -SO 2 NH (alkyl) , -SO 2 NH (phenyl) ;
  • R 217A comprises at least one a ligand capable of docking to a cell surface receptor
  • R 213 , R 214 , R 215 , R 216 are selected one or more from the group consisting of H, alkyl, aryl, heteroaryl, haloalkyl, -O alkyl, -O alkylphenyl, -alkyl-OH, -O haloalkyl, -S alkyl, -S alkylphenyl, -alkyl-SH, -S haloalkyl, halo, -OH, -SH, -NH 2 , -alkyl-NH 2 , -N (alkyl) (alkyl) , -NH (alkyl) , -N (alkyl) (alkylphenyl) , -NH (alkylphenyl) , cyano, nitro, -CO 2 H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) ,
  • R 212 is selected from OH or a protecting group for OH
  • J 211 , J 212 are each independently for each occurrence a spacer
  • n 211 are each independently for each occurrence 1, 2, 3, 4, 5 or 6;
  • J 211 , J 212 are each independently for each occurrence a spacer
  • R 211B is a -C 2 -C 10 alkynylene-CN
  • R 211C , R 211D are independently selected from -C 1 -C 6 -alkyl or R 211C and R 211D together form a five-or six-membered ring, optionally R 211C , R 211D are substituted, optionally R 211C , R 211D contain one further heteroatom selected from N and O.
  • Item 70 A compound of item 68, having the structural formula (G-P8) :
  • J 212B is selected from a alkylene of 1 to 10 carbon atoms.
  • Item 72 A compound of item 68, having the structural formula (G-P10) :
  • R 211B is a -C 2 –C 5 alkynylene-CN
  • R 211C , R 211D are independently selected from -C 1 -C 6 -alkyl
  • R 217 is –R 217C -branching group- (R 217B -R 217L ) n 211L or –R 217B -R 217L ;
  • R 217L is independently selected from a ligand capable of docking to a cell surface receptor
  • n 211L is selected from 1, 2 or 3.
  • Item 74 A compound of item 73, wherein R 217C is selected from –C (O) -C 5 –C 8 straight alkylene-NHCO-CH 2 -or –C (O) -C 8 –C 11 straight alkylene-.
  • Item 75 A compound of item 73, wherein the branching group is selected from the group consisting of:
  • each n is independently from 1 to 20.
  • Item 76 A compound of item 68, wherein the ligand is wherein R A is H or a protecting group for OH.
  • the invention features a compound as provided in the fourth aspect above can be used as an intermediate linker to link the oligonucleotide and the ligand to synthesis a sequential and/or a cluster ligand conjugation, especially, be used as intermediate compound to synthesis a sequential ligand conjugation.
  • the compound as provided in the fourth aspect above can be used to directly conjugate the ligand conjugation to the “backbone” at the 5’ and/or 3’ end of the oligonucleotide. In some embodiments, the compound as provided in the fourth aspect above can be used to directly conjugate the ligand conjugation to 5’ end of any strand of an oligonucleotide.
  • the invention provides a pharmaceutical composition
  • a pharmaceutical composition comprising a compound of the invention as provided in any aspects above and a pharmaceutically acceptable excipient, carrier, or diluent.
  • the invention features a method for delivering a compound to a specific target in a subject for therapeutic or diagnostic purpose. Accordingly, the invention provides a method for treating or preventing a disease or a condition, wherein the method comprises administering to a subject in need thereof an effective amount of a pharmaceutical composition that includes the compound of the invention.
  • the treatment or prevention of a disease or condition is carried by partial or total silencing of disease genes.
  • the disease genes may be patient’s own genes or microbial genes come from outside, such as virus.
  • FIG. 1 illustrates exemplary structures of Oligonucleotide-Ligand Conjugation.
  • a conjugated interfering RNA duplex molecule comprises an antisense strand and a sense strand.
  • the oligonucleotide is interfering RNA duplex molecule, and the ligand can be conjugated at the 3’ end of sense strand (such as Structure 1.1-1.3, middle type aiRNA, blunt end type aiRNA and siRNA) , at the 3’ end of antisense strand (Structure 2) , at the 5’ end of sense strand (Structure 3) , or at both two ends of sense strand (Structure 5) , at both two ends of antisense strand (Structure 4) , at the 3’ end of antisense strand and 5’ end of sense strand (Structure 6) , at the 3’ end of sense strand and 3’ end of antisense strand (Structure 7) , or at
  • FIG. 2 illustrates the ex vivo uptake ⁇ -Catenin aiRNA results tested by QPCR.
  • “Non-GalNAc” is non-conjugated aiRNA.
  • Glu (R) -seq (3 GalNAc) is aiRNA conjugated with GalNAc conjugate composition “GS-5” .
  • FIG. 3 illustrates the ex vivo uptake potency of the mCat12 aiRNA conjugated with “His (R) -seq (3 GalNAc) ” , “His (S) -seq (3 GalNAc) ” and “Glu-seq (3 GalNAc) ” in primary hepatocytes.
  • FIG. 4 illustrates the ex vivo uptake potency of TTR aiRNA conjugated with “His-Seq (3 GalNAc) ” in primary hepatocytes.
  • variable As used herein, the recitation of a numerical range for a variable is intended to convey that the invention may be practiced with the variable equal to any of the values within that range. Thus, for a variable which is inherently discrete, the variable can be equal to any integer value within the numerical range, including the end-points of the range. Similarly, for a variable which is inherently continuous, the variable can be equal to any real value within the numerical range, including the end-points of the range.
  • a variable which is described as having values between 0 and 2 can take the values 0, 1 or 2 if the variable is inherently discrete, and can take the values 0.0, 0.1, 0.01, 0.001, or any other real values >0 and ⁇ 2 if the variable is inherently continuous.
  • “about” means within plus or minus 10%.
  • “about 1” means “0.9 to 1.1”
  • “about 2%” means “1.8%to 2.2%”
  • “about 2%to 3%” means “1.8%to 3.3%”
  • “about 3%to about 4%” means “2.7%to 4.4%. ”
  • hydroxyl protecting groups may be used in the present disclosure.
  • protecting groups render chemical functionalities inert to specific reaction conditions, and may be appended to and removed from such functionalities in a molecule without substantially damaging the remainder of the molecule.
  • Representative hydroxylprotecting groups are disclosed by Beaucage, et al., Tetrahedron 1992, 48, 2223-2311, and also in Greene and Wuts, Protective Groups in Organic Synthesis, Chapter 2, 2d ed, John Wiley &Sons, New York, 1991, each of which are hereby incorporated by reference in their entirety.
  • the protecting group is stable under basic conditions but may be removed under acidic conditions.
  • non-exclusive examples of the hydroxyl protecting groups that may be used herein include dimethoxytrityl (DMT) , monomethoxytrityl, 9-phenylxanthen-9-yl (Pixyl) and 9- (p-methoxyphenyl) xanthen-9-yl (Mox) .
  • non-exclusive examples of the hydroxyl protecting groups that may be used herein comprises Tr (trityl) , MMTr (4-methoxytrityl) , DMTr (4, 4'-dimethoxytrityl) , and TMTr (4, 4', 4"-trimethoxytrityl) .
  • a dash that is not between two letters or symbols is used to indicate a point of attachment for a substituent.
  • -C 1 -C 10 alkyl-NH 2 is attached through the C 1 -C 10 alkyl.
  • optionally substituted alkyl encompasses both “alkyl” and “substituted alkyl” as defined below. It will be understood by those skilled in the art, with respect to any group containing one or more substituents, that such groups are not intended to introduce any substitution or substitution patterns that are sterically impractical, synthetically non-feasible and/or inherently unstable.
  • alkyl refers to straight chain and branched chain having the indicated number of carbon atoms, usually from 1 to 20 carbon atoms, for example 1 to 10 carbon atoms, such as 1 to 8, 1 to 6, 1 to 5, or 1 to 3 carbon atoms.
  • C 1 -C 6 alkyl encompasses both straight and branched chain alkyl of from 1 to 6 carbon atoms.
  • alkyl residue having a specific number of carbons when named, all branched and straight chain versions having that number of carbons are intended to be encompassed; thus, for example, “butyl” is meant to include n-butyl, sec-butyl, isobutyl and t-butyl; “propyl” includes n-propyl and isopropyl.
  • Alkylene is a subset of alkyl, referring to the same residues as alkyl, but having two points of attachment.
  • alkenyl refers to an unsaturated branched or straight-chain alkyl group having at least one carbon-carbon double bond derived by the removal of one molecule of hydrogen from adjacent carbon atoms of the parent alkyl.
  • the group may be in either the cis or trans configuration about the double bond (s) .
  • Typical alkenyl groups include, but are not limited to, ethenyl; propenyls such as prop-1-en-1-yl, prop-1-en-2-yl, prop-2-en-1-yl (allyl) , prop-2-en-2-yl; butenyls such as but-1-en-1-yl, but-1-en-2-yl, 2-methyl-prop-1-en-1-yl, but-2-en-1-yl, but-2-en-1-yl, but-2-en-2-yl, buta-1, 3-dien-1-yl, buta-1, 3-dien-2-yl; and the like.
  • an alkenyl group has from 2 to 20 carbon atoms and in other embodiments, from 2 to 10, 2 to 8, or 2 to 6 carbon atoms.
  • Alkenylene is a subset of alkenyl, referring to the same residues as alkenyl, but having two points of attachment.
  • alkynyl refers to an unsaturated branched or straight-chain alkyl group having at least one carbon-carbon triple bond derived by the removal of two molecules of hydrogen from adjacent carbon atoms of the parent alkyl.
  • Typical alkynyl groups include, but are not limited to, ethynyl; propynyls such as prop-1-yn-1-yl, prop-2-yn-1-yl; butynyls such as but-1-yn-1-yl, but-1-yn-3-yl, but-3-yn-1-yl; and the like.
  • an alkynyl group has from 2 to 20 carbon atoms and in other embodiments, from 2 to 10, 2 to 8, or 2 to 6 carbon atoms.
  • Alkynylene is a subset of alkynyl, referring to the same residues as alkynyl, but having two points of attachment.
  • alkoxy refers to an alkyl group of the indicated number of carbon atoms attached through an oxygen bridge such as, for example, methoxy, ethoxy, propoxy, isopropoxy, n-butoxy, sec-butoxy, tert-butoxy, pentyloxy, 2-pentyloxy, isopentyloxy, neopentyloxy, hexyloxy, 2-hexyloxy, 3-hexyloxy, 3-methylpentyloxy, and the like. Alkoxy groups will usually have from 1 to 10, 1 to 8, 1 to 6, or 1 to 4 carbon atoms attached through the oxygen bridge.
  • aryl refers to a radical derived from an aromatic monocyclic or multicyclic hydrocarbon ring system by removing a hydrogen atom from a ring carbon atom.
  • the aromatic monocyclic or multicyclic hydrocarbon ring system contains only hydrogen and carbon from six to eighteen carbon atoms, where at least one of the rings in the ring system is fully unsaturated, i.e., it contains a cyclic, delocalized (4n+2) ⁇ –electron system in accordance with the Hückel theory.
  • Aryl groups include, but are not limited to, groups such as phenyl, fluorenyl, and naphthyl.
  • Arylene is a subset of aryl, referring to the same residues as aryl, but having two points of attachment.
  • cycloalkyl refers to a non-aromatic carbocyclic ring, usually having from 3 to 7 ring carbon atoms. The ring may be saturated or have one or more carbon-carbon double bonds.
  • cycloalkyl groups include cyclopropyl, cyclobutyl, cyclopentyl, cyclopentenyl, cyclohexyl, and cyclohexenyl, as well as bridged and caged ring groups such as norbornane.
  • halo or “halogen” refers to fluoro, chloro, bromo, and iodo, and the term “halogen” includes fluorine, chlorine, bromine, and iodine.
  • haloalkyl refers to alkyl as defined above having the specified number of carbon atoms, substituted with 1 or more halogen atoms, up to the maximum allowable number of halogen atoms.
  • haloalkyl include, but are not limited to, trifluoromethyl, difluoromethyl, 2-fluoroethyl, and penta-fluoroethyl.
  • Heterocyclyl refers to a stable 3-to 18-membered non-aromatic ring radical that comprises two to twelve carbon atoms and from one to six heteroatoms selected from nitrogen, oxygen and sulfur. Unless stated otherwise specifically in the specification, the heterocyclyl radical is a monocyclic, bicyclic, tricyclic or tetracyclic ring system, which may include fused or bridged ring systems. The heteroatoms in the heterocyclyl radical may be optionally oxidized. One or more nitrogen atoms, if present, are optionally quaternized. The heterocyclyl radical is partially or fully saturated. The heterocyclyl may be attached to the rest of the molecule through any atom of the ring (s) .
  • heterocyclyl radicals include, but are not limited to, dioxolanyl, thienyl [1, 3] dithianyl, decahydroisoquinolyl, imidazolinyl, imidazolidinyl, isothiazolidinyl, isoxazolidinyl, morpholinyl, octahydroindolyl, octahydroisoindolyl, 2-oxopiperazinyl, 2-oxopiperidinyl, 2-oxopyrrolidinyl, oxazolidinyl, piperidinyl, piperazinyl, 4-piperidonyl, pyrrolidinyl, pyrazolidinyl, quinuclidinyl, thiazolidinyl, tetrahydrofuryl, trithianyl, tetrahydropyranyl, thiomorpholinyl, thiamorpholinyl, 1-oxo-thiomorph
  • Heteroaryl refers to a radical derived from a 3-to 18-membered aromatic ring radical that comprises two to seventeen carbon atoms and from one to six heteroatoms selected from nitrogen, oxygen and sulfur.
  • the heteroaryl radical may be a monocyclic, bicyclic, tricyclic or tetracyclic ring system, wherein at least one of the rings in the ring system is fully unsaturated, i.e., it contains a cyclic, delocalized (4n+2) ⁇ –electron system in accordance with the Hückel theory.
  • Heteroaryl includes fused or bridged ring systems.
  • the heteroatom (s) in the heteroaryl radical is optionally oxidized.
  • heteroaryl is attached to the rest of the molecule through any atom of the ring (s) .
  • heteroaryls include, but are not limited to, azepinyl, acridinyl, benzimidazolyl, benzindolyl, 1, 3-benzodioxolyl, benzofuranyl, benzooxazolyl, benzo [d] thiazolyl, benzothiadiazolyl, benzo [b] [1, 4] dioxepinyl, benzo [b] [1, 4] oxazinyl, 1, 4-benzodioxanyl, benzonaphthofuranyl, benzoxazolyl, benzodioxolyl, benzodioxinyl, benzopyranyl, benzopyranonyl, benzofuranyl, benzofuranonyl, benzothienyl (benzo
  • a solid support comprises the solid phase carrier for the synthesis of oligonucleotide, such as CPG.
  • oligonucleotide refers to a compound comprising a plurality of linked nucleosides.
  • oligonucleotides are short, single-or double-stranded RNA or DNA molecules, and include antisense oligonucleotides (ASO) , RNA interference (RNAi) , and aptamer RNAs.
  • ASO antisense oligonucleotides
  • RNAi RNA interference
  • aptamer RNAs aptamer RNAs.
  • one or more of the plurality of nucleosides is modified.
  • an oligonucleotide comprises one or more ribonucleosides (as in RNA) and/or deoxyribonucleosides (as in DNA) .
  • the oligonucleotide is a single-stranded oligonucleotide. In some other embodiments, the oligonucleotide is a double-stranded interfering RNA, such as siRNA, aiRNA, shRNA. In some embodiments, the oligonucleotide is circRNA. In some embodiments, the oligonucleotide is mRNA.
  • RNA is an asymmetric interfering RNA duplex molecule, comprising an antisense strand and a sense strand, wherein the antisense strand is longer than the sense strand, consists of 19-27 nucleotides, and includes a 3’ overhang of at least one nucleotide, and a 5’ end of 0-8 nucleotides; wherein the antisense strand is at least 70%complementary to a target mRNA; wherein the sense strand consists of 10-26 nucleotides, forms a double-stranded region with the antisense strand where the double-stranded region includes 0, 1 or 2 mismatch pair (s) .
  • Exemplary structure of aiRNA is described in US 2009/0208564, which is hereby incorporated by reference in entirety.
  • the term “middle type” refers to an interfering RNA duplex molecule, comprising an antisense strand and a sense strand, where the antisense strand is longer than the sense strand, and comprises both 3’ overhang and 5’ overhang of at least one nucleotide.
  • blunt type refers to an interfering RNA duplex molecule, comprising an antisense strand and a sense strand, where the RNA duplex molecule has at least one blunt end, preferably having one blunt end at the 3’ end of the sense strand or at the 5’ end of antisense strand.
  • modified oligonucleotide means an oligonucleotide comprising at least one modified nucleotide.
  • modified nucleotide means a nucleotide having at least one modified sugar moiety, modified internucleoside linkage, and/or modified nucleobase.
  • modified nucleoside means a nucleoside having at least one modified sugar moiety, and/or modified nucleobase.
  • naturally occurring internucleoside linkage means a 3’ to 5’ phosphodiester linkage.
  • modified internucleoside linkage refers to a substitution or any change from a naturally occurring internucleotide bond.
  • a phosphorothioate linkage is a modified internucleotide linkage.
  • natural sugar moiety means a sugar found in DNA (2-H) or RNA (2-OH) .
  • modified sugar refers to a substitution or change from a natural sugar.
  • a 2’-O-methoxyethyl modified sugar is a modified sugar.
  • bicyclic sugar means a furosyl ring modified by the bridging of two non-geminal ring atoms.
  • a bicyclic sugar is a modified sugar.
  • modified nucleobase refers to any nucleobase other than adenine, cytosine, guanine, thymidine, or uracil.
  • 5-methylcytosine is a modified nucleobase.
  • An “unmodified nucleobase” means the purine bases adenine (A) and guanine (G) , and the pyrimidine bases thymine (T) , cytosine (C) , and uracil (U) .
  • prevention and “preventing” are used interchangeably. These terms refer to an approach for obtaining beneficial or desired results including but not limited to a prophylactic benefit.
  • prophylactic benefit the conjugates or compositions may be administered to a patient at risk of developing a particular disease, or to a patient reporting one or more of the physiological symptoms of a disease, even though a diagnosis of this disease may not have been made.
  • the term “effective amount” of an active agent refers to an amount sufficient to elicit the desired biological response.
  • the effective amount of a compound of the invention may vary depending on such factors as the desired biological endpoint, the pharmacokinetics of the compound, the disease being treated, the mode of administration, and the patient.
  • treatment refers to a method of reducing, delaying or ameliorating such a condition before or after it has occurred. Treatment may be directed at one or more effects or symptoms of a disease and/or the underlying pathology.
  • the treatment can be any reduction and can be, but is not limited to, the complete ablation of the disease or the symptoms of the disease. As compared with an equivalent untreated control, such reduction or degree of prevention is at least 5%, 10%, 20%, 40%, 50%, 60%, 80%, 90%, 95%, or 100%as measured by any standard technique.
  • a "pharmaceutical composition” includes a pharmacologically effective amount of a dsRNA and a pharmaceutically acceptable carrier.
  • pharmacologically effective amount “therapeutically effective amount” or simply “effective amount” refers to that amount of an RNA effective to produce the intended pharmacological, therapeutic or preventive result.
  • a therapeutically effective amount of a drug for the treatment of that disease or disorder is the amount necessary to effect at least a 25%reduction in that parameter.
  • pharmaceutically acceptable carrier refers to a carrier for administration of a therapeutic agent.
  • Such carriers include, but are not limited to, saline, buffered saline, dextrose, water, glycerol, ethanol, and combinations thereof.
  • the term specifically excludes cell culture medium.
  • pharmaceutically acceptable carriers include, but are not limited to pharmaceutically acceptable excipients such as inert diluents, disintegrating agents, binding agents, lubricating agents, sweetening agents, flavoring agents, coloring agents and preservatives.
  • suitable inert diluents include sodium and calcium carbonate, sodium and calcium phosphate, and lactose, while corn starch and alginic acid are suitable disintegrating agents.
  • Binding agents may include starch and gelatin, while the lubricating agent, if present, will generally be magnesium stearate, stearic acid or talc. If desired, the tablets may be coated with a material such as glyceryl monostearate or glyceryl distearate, to delay absorption in the gastrointestinal tract. nce to a human subject.
  • All stereoisomers of the compounds of the present invention are contemplated within the scope of this invention.
  • Individual stereoisomers of the compounds of the invention may, for example, be substantially free of other isomers (e.g., as a pure or substantially pure optical isomer having a specified activity) , or may be admixed, for example, as racemates or with all other, or other selected, stereoisomers.
  • the chiral centers of the present invention may have the S or R configuration as defined by the IUPAC 1974 Recommendations.
  • racemic forms can be resolved by physical methods, such as, for example, fractional crystallization, separation or crystallization of diastereomeric derivatives or separation by chiral column chromatography.
  • the individual optical isomers can be obtained from the racemates by any suitable method, including without limitation, conventional methods, such as, for example, salt formation with an optically active acid followed by crystallization.
  • Compounds of the present invention are, subsequent to their preparation, preferably isolated and purified to obtain a composition containing an amount by weight equal to or greater than 95% (e.g., “substantially pure” compound I) , which is then used or formulated as described herein. In certain embodiments, the compounds of the present invention are more than 99%pure.
  • Amino acids contained within the peptides or polypeptides described herein will be understood to be in the L-or D-configuration.
  • the present invention provides novel compounds with novel linker compositions for linking various components of the compound.
  • the compound conjugates an oligonucleotide with one or more targeting ligands.
  • the oligonucleotide can be naturally occurring (isolated from nature, or synthesized in a laboratory) or chemically modified in at least one subunit.
  • the oligonucleotide is chemically modified oligonucleotide.
  • chemically modified oligonucleotide comprises backbone modification (or internucleoside linkage modification, such as phosphate group modification) , ribose group modification, base modification.
  • the oligonucleotide has at least one phosphorothioate internucleoside linkage, or at least one methylphosphonate internucleoside linkage, or at least one other modified internucleoside linkage such as:
  • the oligonucleotide has at least one chemically modified nucleotide with ribose modification.
  • the 2′position of the modified ribose moiety is replaced by a group selected from OR, R, halo, SH, SR, NH 2 , NHR, NR 2 , or CN, where each R is independently C 1 -C 6 alkyl, alkenyl or alkynyl, and halo is F, Cl, Br or I.
  • the modified ribose moiety is selected from the group of 5’-vinyl, 5’-methyl (R or S) , 4’-S, 2’-F, 2’-OCH 3 , 2’-OCH 2 CH 3 , 2’-OCH 2 CH 2 F and 2’-O (CH2) 2 OCH 3 substituent groups.
  • the modified ribose moiety is substituted by bicyclic sugar selected from the group of 4′- (CH 2 ) -O-2′ (LNA) ; 4′- (CH 2 ) -S-2; 4′- (CH 2 ) 2-O-2′ (ENA) ; 4′-CH (CH 3 ) -O-2′ (cEt) and 4′- CH (CH 2 OCH 3 ) -O-2′, 4′-C (CH 3 ) (CH 3 ) -O-2′, 4′-CH 2 -N (OCH 3 ) -2′, 4′-CH 2 -O-N (CH 3 ) -2′, 4′-CH 2 -N (R) -O-2′, where R is H, C1-C12 alkyl, or a protecting group, 4′-CH 2 -C (H) (CH 3 ) -2′, and 4′-CH 2 -C- ( ⁇ CH 2 ) -2′.
  • R is H, C1-C
  • the modified sugar moiety is selected from the group of 2’-O-methoxyethyl modified sugar (MOE) , a 4′- (CH 2 ) -O-2′bicyclic sugar (LNA) , 2’-deoxy-2’-fluoroarabinose (FANA) , and a methyl (methyleneoxy) (4′-CH (CH 3 ) -O-2) bicyclic sugar (cEt) .
  • the oligonucleotide has a chemically modified nucleotide selected from the group consisting, 2'-methoxyethyl, 2'-OCH 3 and 2'-fluoro.
  • the oligonucleotide has at least one chemically modified nucleobase.
  • at least one chemically modified nucleobase is selected from the group of: 5-methylcytosine (5-Me-C) , inosine base, a tritylated base, 5-hydroxymethyl cytosine, xanthine, hypoxanthine, 2-aminoadenine, 6-methyl and other alkyl derivatives of adenine and guanine, 2-propyl and other alkyl derivatives of adenine and guanine, 2-thiouracil, 2-thiothymine and 2-thiocytosine, 5-halouracil and cytosine, 5-propynyl (-C ⁇ C-CH 3 ) uracil and cytosine and other alkynyl derivatives of pyrimidine bases, 6-azo uracil, cytosine and thymine, 5-uracil (pseudouracil) , 4-thi
  • any stabilizing modification known to a person skilled in the art can be used to improve the stability of the oligonucleotide molecules.
  • chemical modifications can be introduced to the phosphate backbone (e.g., phosphorothioate linkages) , the sugar (e.g., locked nucleic acids, glycerol nucleic acid, cEt, 2’-MOE, 2’-fluorouridine, 2’-O-methyl) , and/or the base (e.g., 2’-fluoropyrimidines) .
  • the oligonucleotide can be conjugated to the rest of the compound, or the “backbone” at the 5’ and/or 3’ end of the oligonucleotide.
  • the conjugated oligonucleotide can be delivered as a single strand or hybridized to a substantially complementary oligonucleotide as part of a duplex.
  • the substantially complementary oligonucleotide can be similarly conjugated or not.
  • the conjugated oligonucleotide forms part of a siRNA duplex (either the sense or antisense strand, or both) .
  • the conjugated oligonucleotide forms part of an aiRNA duplex (either the sense or antisense strand, or both) .
  • the oligonucleotide that is conjugated according to principles of the invention is used as an antisense oligonucleotide (ASO) .
  • the oligonucleotide that is conjugated according to principles of the invention is used as a micro-RNA (miRNA) molecule.
  • an oligonucleotide is conjugated to a backbone containing multiple components including a sequential motif along the backbone of more than one ligand (e.g., GalNAc) , e.g., 2-8 and preferably 3, directly or through one or more intermediate linkers, at an attachment point that provide by a residue derived from a histidine residue.
  • ligand e.g., GalNAc
  • the compound of the present invention has the structural formula as shown in (S-H1) , (S-H2) , (S-H1-01) ) to (S-H1-16) and (S-H2-01) to (S-H2-04) .
  • the compound of the present invention has the structure as shown in Table 6.
  • the configuration of the compound is R isomer, S isomer or its mixture. In one embodiment, the configuration of the compound is a mixture of R isomer and S isomer. In a preferably embodiment, the configuration of the compound is R isomer. In one embodiment, the configuration of the compound means the isomer of the chiral carbon atom shown in the structural formula S-H1-01.
  • the naturally occurring or chemically modified oligonucleotide is linked to the rest of the compound through its 5’ end and/or its 3’ end.
  • an oligonucleotide is conjugated to a backbone containing multiple components including a sequential motif along the backbone of more than one ligand (e.g., GalNAc) , e.g., 2-8 and preferably 3, directly or through one or more intermediate linkers, at an attachment point that provide by a moiety derived from a glutamic acid residue.
  • ligand e.g., GalNAc
  • the compound of the present invention has the structural formula as shown in (S-G1) , (S-G2) , (S-G1-01) ) to (S-G1-16) and (S-G2-01) to (S-G2-04) .
  • the compound of the present invention has the structure as shown in Table 6.
  • the configuration of the compound is R isomer, S isomer or racemate. In one embodiment, the configuration of the compound is a mixture of R isomer and S isomer. In a preferably embodiment, the configuration of the compound is R isomer. In one embodiment, the configuration of the compound means the isomer of the chiral carbon atom shown in the structural formula S-G1-01.
  • the naturally occurring or chemically modified oligonucleotide is linked to the rest of the compound through its 5’ end and/or its 3’ end.
  • a backbone containing multiple components including a sequential motif along the backbone of more than one ligand (e.g., GalNAc) , e.g., 2-8
  • Step 1 The synthesis route of compound S-05
  • Methyl (R) -3-hydroxybutanoate was replaced with methyl (S) -3-hydroxybutanoate. See M-3 synthesis in G-12 (Glu (R) -Sequential GalNAc) for the synthesis method.
  • H-15 See compound H-15 synthesis in H-17 (His (R) -sequential-GalNAc) synthesis route for the synthesis method. Due to the special chemical properties of H-15, it exhibits characteristic structural fragment peaks in mass spectrometry which is MS (ESI) m/z 1062.43 ( [M- (i-Pr) 2 N+H 2 O ] + ) .
  • GS-13-9 was dissolved in anhydrous methanol, 10% (W/W) palladium carbon was added, and replaced air with hydrogen for three times, stirred at room temperature until the raw material was completely consumed, then the palladium carbon was removed by filtration, and the filtrate was dried and directly put into the next step.
  • the synthesis method was the same as that of H-17, and the loading was 50 ⁇ mol/g.
  • the synthesis method was the same as that of H-17, and the loading was 50 ⁇ mol/g.
  • a naturally occurring or chemically modified oligonucleotide was synthesized by a usual method, e.g. solid phase method. And the compound conjugated oligonucleotide was synthesized by exemplary method as shown below:
  • connection of a nucleoside monomer included four steps: deprotection, coupling, capping and oxidation, standard procedures of the steps mentioned-above are known to one of ordinary skills in the art, and G-10 solutions were prepared with 0.1 M acetonitrile solutions.
  • the solid phase synthesis reagents were configured as follows:
  • Oxidizing reagent 0.02 M I2 in THF/Pyridine/H 2 O
  • the Oligo-support obtained by the steps of solid-phase synthesis above was added to a 1 mL centrifuge tube, 50 ⁇ 100 ⁇ L of concentrated ammonium hydroxide was added, cultured at 50-60 °C for 10 hours, the liquid supernatant was drawn by centrifugation, two-fold volume acetone-ethanol (80: 20) solvent was added to the liquid supernatant, a white precipitate was precipitated, and the supernatant was removed by centrifugation at 10,000 g to obtain a precipitated product, the precipitate was redissolved in 0.2 M sodium acetate solution.
  • Buffer A 20 mM sodium phosphate-10%acetonitrile-water buffer solution (pH7.5) ,
  • Buffer B 2.0 M NaCl-20 mM sodium phosphate-acetonitrile-water buffer solution (pH7.5) ; elution gradient: Buffer B 0 ⁇ 50%, Buffer A 100 ⁇ 50%
  • the eluates were collected and combined, and G25 Sephadex column was used for desalting finally; measured the OD 260 concentration value of the desalted product solution, the product content was calculated, and finally put it into a centrifuge tube for lyophilization to obtain a white freeze-dried product.
  • AS-Oligo refers to G-12-OLIGO, and Unylinker-CPG (From Glen Research) was used as a solid-phase synthesis carrier for synthesis.
  • Oligo conjugate His-R-Sequential-GalNAc refers to G-12-OLIGO, and H-17 was used as solid-phase synthesis carrier for synthesis. The only difference is that H-15 is prepared in 0.1 M acetonitrile solution, and sequence settings was performed on solid phase synthesizer.
  • Oligo conjugate His-S-Sequential-GalNAc refers to G-12-OLIGO, and H-23 was used as solid-phase synthesis carrier for synthesis. The only difference is that H-21 is prepared in 0.1 M acetonitrile solution, and sequence settings was performed on solid phase synthesizer.
  • siRNA-GalNAc conjugate or aiRNA-GalNac conjugate was prepared by annealing Oligo-GalNAC conjugate obtained above and anti-sense strand with its complementary sequence at a molar ratio of 1: 1 to obtain a double-stranded product.
  • Compounds HS-9, HS-5 and HS-6 are triple sequential GalNAc designed base on Histidine linker conjugated at 3’ end of sense strand of a duplex RNA, such as aiRNA or siRNA, it is represented by code “His-seq (3GalNAc) ” , “His (R) -seq (3GalNAc) ” and “His (S) -seq (3GalNAc) ” respectively as used and described in below examples.
  • Compounds GS-9 and GS-5 are triple sequential GalNAc designed base on Glutamine linker conjugated at 3’ end of sense strand of a duplex RNA, such as aiRNA or siRNA, they are represented by code “Glu-seq (3GalNAc) ” and “Glu (R) -seq (3GalNAc) ” respectively as used and described in below examples.
  • oligonucleotide (aiRNA and siRNA) synthesized and used in activity test examples are showed in below table 7:
  • AGCU represent 2’ OMe modified RNA
  • agcu represent 2’F modified RNA
  • * PS
  • -L represent GalNAc conjugation
  • Part A Perfusion
  • Buffer A Add 93 mg of EDTA (0.5 mM) to 500 mL HBSS
  • Buffer B Add 400 mg of Collagenase Type-I (0.8 mg/mL) ) to 500 mL DMEM
  • Buffer C Add 2 mg of BSA (2%) to 100 mL DMEM
  • liver After perfusion, in hood, place liver into 10 cm TC dish, open liver sack, help dissociation by shaking tissue with forceps.
  • ex vivo Self Delivery assay was conducted without using transfection reagent (free uptake) (tested in 12 well plate, 100,000 cells/well, 48 hours incubation) . Tested Oligo GalNAc conjugate concentrations was marked in each example as below. The expression level of targeted mRNA was detected by RT-q PCR.
  • Example 7 ex vivo uptake of the aiRNA by hepatocytes with/without conjugates
  • Glu (R) -seq (3GalNAc) ” conjugated m ⁇ -Catenin aiRNA (aiRNA#1) showed remarkable gene silencing activity in self-delivery ex vivo test at 10 nM, and even 1 nM, compared with non-conjugated aiRNA, demonstrating that the GalNAc conjugates provided by this invention have great potency for delivering duplex RNAi agent, such as aiRNA. The results were detected by QPCR as shown in FIG. 2.
  • Example 8 ex vivo uptake of the aiRNA by hepatocytes with GalNac conjugates
  • m ⁇ -Catenin aiRNA (aiRNA#2) conjugated with two different GalNAc conjugation provided by this invention were cocultured with isolated mouse hepatocytes for 24 hours at 303 nM, 92 nM, 28 nM concentration. The results were tested by QPCR and shown in FIG. 3. Both Glu-seq (3 GalNAc) , His (R) -seq (3 GalNAc) and His (S) -seq (3 GalNAc) showed very potent gene silencing in the ex vivo self-delivery which indicates GalNAc conjugates provided by this invention have great potency for delivering duplex RNAi agent, such as aiRNA.
  • Example 9 ex vivo uptake of mouse TTR targeted aiRNA by hepatocytes with Sequential Histidine GalNAc conjugates
  • aiRNA Conjugates 793-804
  • CM4000 cell culture media
  • RNA purified, and levels of mRNA were determined by RT-qPCR. Values are plotted as a fraction of untreated control cells. All aiRNA Conjugates were tested at 0.3 nM concentration. GAPDH served as the internal control.
  • GalNAc conjugates design based on present invention can dramatically enhance the delivery efficiency of an oligonucleotide ex vivo, achieving great gene silencing potency for targeting different genes in hepatocyte.
  • linker compositions provided in this invention were based on our body’s amino acids, which eliminate the safety risk of other types of linkers used in GalNAc conjugates.

Abstract

The invention provides compositions and linking configurations for an oligonucleotide to be conjugated to a carbohydrate ligand for targeted in vivo delivery of an oligonucleotide. These ligand-conjugated compounds target one or more organs or cell types, e.g., the parenchymal cells of the liver that facilitate endocytic uptake. The compound has structural formula (S-HG1): R206-[A1]a-[A2]b-[A3]c-R205 (S-HG1) R205, R206 are each independently for each occurrence H, OH, a protecting group for OH, a phosphate group, a phosphodiester group, an activated phosphate group, an activated phosphite group, a phosphoramidite, a solid support, -OP(M')(M")O-nucleoside, - OP(M')(M")O-oligonucleotide, a lipid, a PEG, a steroid, a polymer, -O- nucleotide, a nucleoside, -OP(M')( M")OR201-OP(M'")(M"")O- oligonucleotide, or an oligonucleotide; M', M", M'" and M"" are each independently for each occurrence O or S; Al, A2 and A3 are each independently for each occurrence selected from (S-1H) or (S-1G).

Description

Novel Compositions for Conjugating Oligonucleotides and Carbohydrates FIELD OF THE INVENTION
The invention relates to novel compositions and processes that can be used in conjugating carbohydrate ligands with oligonucleotides intended for biomedical applications.
BACKGROUND OF THE INVENTION
Gene-modulating and, in particular, gene-silencing oligonucleotides have been the focus of many research and development efforts as these strings of nucleotides hold great promise for treating or preventing many diseases and for modulating physiological conditions. Examples of such oligonucleotides include short/small interfering RNA (siRNA) , asymmetric short/small interfering RNA (aiRNA) , antisense oligonucleotide (ASO) , and micro-RNA (miRNA) .
RNA interference (RNAi) works through short, double-stranded RNA (dsRNA) duplexes called siRNA in a gene-specific fashion in many organisms. The siRNAs have a well-defined structure of symmetric, short (usually 20-24 base pairs) dsRNA duplex having phosphorylated 5’ ends and hydroxylated 3’ ends that form two 3’ overhangs of equal lengths. Gene modulation is mediated through a multi-protein RNA-induced silencing complex (RISC) , which binds, unwinds, and incorporates the anti-sense siRNA strand from the siRNA duplex, and then recognizes and targets complementary messenger RNAs (mRNAs) for cleavage thereby reducing its gene expression in a post-transcriptional fashion.
Relatively new to the scene, aiRNA was developed to overcome off-target effects mediated by sense strand of the symmetrically configured canonical siRNA as well as other off-target mechanisms of siRNA (See PCT Patent Publication WO2009029688) . aiRNAs are designed to include short RNA duplex where the lengths of the two RNA strands are not equal, hence “asymmetric. ” For example, an aiRNA can include a first strand that is 18-23 nucleotides long and a second that is 12-17 nucleotides long, forming a duplex where the first strand might have a 3’ overhang of 1-9 nucleotides and a 5’ overhang of 0-8 nucleotides. The aiRNA technology can be used in all areas where current siRNA or short-hairpin RNA (shRNA) are being applied including biology research, R&D research in biotechnology and pharmaceutical industry, and RNAi-based therapies.
Antisense technology is a highly selective gene silencing technology based upon a concept originally proposed in 1978 (Zamecnik P.C. et al., 1978) . Generally, the principle behind the ASO technology is that an antisense oligonucleotide hybridizes to a target nucleic acid and modulates gene expression through post-transcriptional mechanisms. The mechanisms can be broadly categorized as: (1) occupancy only without promoting RNA degradation, in which the binding of the ASO leads to translational arrest, inhibition of splicing, or induction of alternatively spliced variants, or (2) occupancy-induced destabilization, in which the binding of the ASO promotes degradation of the RNA through endogenous enzymes, such as ribonuclease H1 (RNase H1) ; and (3) increased translation: ASO can block upstream open reading frames (uORFs) or other inhibitory elements in the 5’UTR, increasing translation efficiency (Stanley T. Crooke et al., 2008; C. Frank Bennett, 2010; Richard G. Lee, 2013; Stanley T. Crooke, 2017) . The typical structure of an ASO is a single-stranded deoxyribonucleotide sequence with sulfur chemistry modification, known as phosphorothioate. After 40 years of research, antisense technology has been improved through various chemical modifications of the single stranded oligonucleotide.
A miRNA molecule normally derives from noncoding regions of RNA transcripts that fold back onto themselves to form hairpins. After having been processed from its precursors through various cellular machineries, a mature miRNA is a small (about 22 nucleotides) RNA molecule found in plants, animal and some viruses that regulate gene expression through post-transcriptional silencing.
Therapeutics based on these and other nucleic acids provide promising solutions to a variety of diseases, including non-druggable targets. However, despite the advances in application of oligonucleotides and oligonucleotide analogs as therapeutics, there continues to exist great needs for enhancing key pharmacological properties of these therapeutic oligonucleotides in areas such as serum stability, delivery to the intended organ or cell population, and uptake across cellular membranes.
Preferred delivery of therapeutic oligonucleotides to cells in vivo, e.g., in a mammalian body such as a human’s , requires specific targeting and protection from the extracellular environment inside the body including from proteins in the serum. A method that researchers have employed to achieve specific targeting is to conjugate a targeting moiety to the oligonucleotides to direct therapeutic oligonucleotides to the desired target site.
One way to improve specificity in delivery is by taking advantage of receptor mediated endocytic activities that already exist in the body. The mechanism of uptake involves the movement of molecules bound to cell membrane receptors across the membrane and into the cell via  invagination of the membrane structure or by fusion of the delivery system with the cell membrane. This process is initiated via activation of a cell-surface or membrane receptor following binding of a specific ligand to the receptor. Therefore, by conjugating a drug candidate to a targeting moiety that targets such cell surface receptor (s) , one can effectively borrow the innate endocytic pathways for drug delivery. Many receptor-mediated endocytic systems are known and have been studied, including those that recognize sugars including galactose, mannose, mannose-6-phosphate, peptides and proteins such as transferrin, asialoglycoprotein, vitamin B12, insulin and epidermal growth factor (EGF) . In particular, the Asialoglycoprotein receptor (ASGP-R) is a highly abundant receptor on hepatocytes. The ASGP-R shows a 50-fold higher affinity for N-Acetyl-D-Galactosylamine (GalNAc) than for D-Gal. However, it has been reported that in using this conjugation system, the linker structure design and various chemical attributes of the linker moieties are crucial in determining overall delivery efficiency, efficacy and safety of the conjugated oligonucleotides as well as in affecting the stability and manufacture challenges of the various therapeutic oligonucleotides.
Accordingly, a strong need remains for new and effective receptor-specific, ligand-conjugated nucleic acid complex designs for various biomedical applications.
SUMMARY OF THE INVENTION
In first aspect, the invention relates to a compound, as a therapeutic agent, where an oligonucleotide is conjugated with at least one ligand, e.g., a carbohydrate ligand such as a monosaccharide, disaccharide, trisaccharide, tetrasaccharide, oligosaccharide, polysaccharide or their derivatives, which can target the compound to receptor cells in the liver that can facilitate endocytic uptake as discussed above.
These ligand-conjugated compounds target one or more organs or cell types, e.g., the parenchymal cells of the liver in a human. In one embodiment, the compound includes more than one carbohydrate ligand, preferably two or three. In another embodiment, the compound of the invention includes at least one (e.g., one, two or three or more) N-Acetyl-Galactosamine (GalNAc) , N-Ac-Glucosamine (GlcNAc) , galactose, lactose, or mannose (e.g., mannose-6-phosphate) . In yet another embodiment, the compound of the invention includes at least one (e.g., one, two or three or more) ligand selected from the group consisting of GalNAc, cholesterol, tocopherol, biotin, cyanine dyes, folic acid, RGDp, transferrin, anisamide, lactobionic acid, cRGD, hyaluronic acid, low molecular weight protamine, lipid derivatives, peptides, cyclic peptides, and heterocycles.
In second aspect, the invention provides ligand-conjugated compounds having novel structure:
Item 1, A compound having the structural formula (S-HG1) :
R 206- [A1]  a- [A2]  b- [A3]  c-R 205        (S-HG1)
wherein:
R 205, R 206 are each independently for each occurrence H, OH, a protecting group for OH, a phosphate group, a phosphodiester group, an activated phosphate group, an activated phosphite group, a phosphoramidite, a solid support, -OP (M') (M") O-nucleoside, -OP (M') (M") O-oligonucleotide, a lipid, a PEG, a steroid, a polymer, -O-nucleotide, a nucleoside, -OP (M') (M") O-R 201-OP (M'") (M"") O-oligonucleotide, -X-OP (M') (M") O-oligonucleotide, -Z-OP (M') (M") O-oligonucleotide or an oligonucleotide;
M', M", M'" and M"" are each independently for each occurrence O or S;
A1, A2 and A3 are each independently for each occurrence selected from (S-1H) or (S-1G) :
Figure PCTCN2022114893-appb-000001
R 202A is –R 202-R 202L;
R 217A is –R 217-R 217L;
R 202L, R 217L are independently for each occurrence one ligand capable of docking to a cell surface receptor;
each R 202, R 217, R 201 are independently for each occurrence selected from a alkylene of 3 to 30 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N, S (O)  2, C 2 -C 10 alkenylene, C 2 -C 10 alkynylene, C 6 -C 10 arylene, C 3 -C 18 heterocyclylene, and C 5 -C 10 heteroarylene, and wherein each R 202, R 217, R 201 are independently optionally not substituted or substituted by R 209; optionally, R 202, R 201 are independently for each occurrence selected from a alkylene of 3 to 15 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O;
R 1, R 2, R 204, R 207, R 208 , R 213, R 214, R 215, R 216, R 209 are independently for each occurrence selected one or more from the group consisting of H, alkyl, aryl, heteroaryl, haloalkyl, -O alkyl, -O  alkylphenyl, -alkyl-OH, -O haloalkyl, -S alkyl, -S alkylphenyl, -alkyl-SH, -S haloalkyl, halo, -OH, -SH, -NH 2, -alkyl-NH 2, -N (alkyl) (alkyl) , -NH (alkyl) , -N (alkyl) (alkylphenyl) , -NH (alkylphenyl) , cyano, nitro, -CO 2H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2 , -NHC (O) (alkyl) , -NHC (O) (phenyl) , -N (alkyl) C (O) (alkyl) , -N (alkyl) C (O) (phenyl) , -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -OC (O) alkyl, -SO 2 (alkyl) , -SO 2 (phenyl) , -SO 2 (haloalkyl) , -SO 2 NH 2, -SO 2NH (alkyl) , -SO 2 NH (phenyl) , -NHSO 2 (alkyl) , -NHSO 2 (phenyl) , and -NHSO 2 (haloalkyl) ;
n 201, n 211 are each independently for each  occurrence  1, 2, 3, 4, 5 or 6;
J 201, J 202, J 211, J 212 are each independently for each occurrence absent or a spacer;
a, b and c are each independently for each occurrence integer 0-5, and the sum of a, b and c is an integer of 1-10;
the oligonucleotide comprises naturally occurring or chemically modified nucleotides/nucleosides.
Item 2, A compound of item 1, wherein the sum of a, b and c is an integer of 1 or 3.
Item 3, A compound of item 1, wherein the compound having the structural formula (S-H1) :
Figure PCTCN2022114893-appb-000002
wherein:
R 1 is selected one or more from the group consisting of H, C 1-C 5 alkyl, aryl, heteroaryl, C 1-C 5 haloalkyl, -C 1-C 5 alkyl-OH, -C 1-C 5 alkyl-SH, -C 1-C 5 alkyl-NH 2, -CO 2H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2, -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -SO 2 (alkyl) , -SO 2 (haloalkyl) , -SO 2 NH 2, -SO 2NH (alkyl) , and -SO 2 NH (phenyl) ;
n 202 is selected from 1-10, preferably 1-3.
Item 4, The compound of item 3, having the structural formula (S-H1-01) :
Figure PCTCN2022114893-appb-000003
wherein:
J 202A is selected from the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N and S (O)  2;
J 202B is selected from a alkylene of 1 to 10 carbon atoms, optionally selected from a straight alkylene of 1 to 10 carbon atoms;
R 205A is a group comprising a solid support or H;
the carbon marked with symbol “*” is chiral carbon atom.
Item 5, The compound of item 3 or item 4, wherein n 202 is 1 or 3.
Item 6, The compound of any one of items 3-4, wherein R 206 comprises an oligonucleotide.
Item 7, The compound of item 6, wherein the compound having the structural formula (S-H1-02) :
Figure PCTCN2022114893-appb-000004
Item 8, The compound of item 3, wherein:
J 201, J 202are independently for each occurrence selected from a alkylene of 1 to 30 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N, S (O)  2, C 2 -C 10 alkenylene, C 2 -C 10 alkynylene, C 6 -C 10 arylene, C 3 -C 18 heterocyclylene, and C 5 -C 10 heteroarylene, and wherein J 201, J 202are each independently optionally not substituted or substituted by R 209
Item 9, The compound of item3, wherein
J 201, J 202 are independently for each occurrence selected from a alkylene of 1 to 10 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N and S (O)  2, and wherein J 201,  J 202 are each independently optionally not substituted or substituted by at least one group selected from group: H, or, C 1-C 5 alkyl, -OC 1-C 5 alkyl.
Item 10, The compound of item 9, wherein n 201 is 1, n 202 is 1 or 3;
Item 11, The compound of item 3, the compound having the structural formula (S-H1-03) , (S-H1-04) , (S-H1-05) or (S-H2) :
Figure PCTCN2022114893-appb-000005
Wherein:
A is O or S;
X is independently selected from Table 1, or a alkylene of 1 to 10 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N and S (O)  2;
X 1 is independently selected from Table 2;
J 202, Z are independently for each occurrence selected from Table 3;
Optionally, J 202, Z are independently for each occurrence selected from a alkylene of 1 to 10 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N and S (O)  2, and wherein J 201, J 202 are each independently optionally not substituted or substituted by at least one group selected from group: H, or, C 1-C 5 alkyl, -OC 1-C 5 alkyl;
R, R’a re each independently selected from the group consisting of a naturally occurring and/or chemically modified oligonucleotide, H and a protecting group for OH; at least one of R and R’ comprises an oligonucleotide formed by natural and/or chemically modified nucleotides/nucleosides;
R 202 is selected from a straight alkylene of 3 to 15 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O; and wherein R 202 is optionally not substituted or substituted by R 209.
Optionally, R 202 is selected from -C 3-C 8 straight alkylene-.
Table 1:
Figure PCTCN2022114893-appb-000006
Table 2
Figure PCTCN2022114893-appb-000007
Table 3:
Figure PCTCN2022114893-appb-000008
Item 12, The compound of item 11, wherein the compound having the structural formula (S-H1-06) , (S-H1-07) , (S-H1-08) or (S-H2-01) :
Figure PCTCN2022114893-appb-000009
Figure PCTCN2022114893-appb-000010
Item 13, The compound of item 11, the compound having the structural formula (S-H1-09) , (S-H1-10) , (S-H1-11) or (S-H2-02) :
Figure PCTCN2022114893-appb-000011
Item 14, The compound of item 11, wherein having the structural formula (S-H1-12) , (S-H1-13) , (S-H1-14) or (S-H2-03) :
Figure PCTCN2022114893-appb-000012
Item 15, The compound of item 1, the compound having the structural formula (S-H1-15) , (S-H1-16) or (S-H2-04) :
Figure PCTCN2022114893-appb-000013
Figure PCTCN2022114893-appb-000014
wherein:
R, R’ are each independently selected from the group consisting of a naturally occurring or chemically modified oligonucleotide, H and a protecting group for OH;
at least one of R and R’ comprises an oligonucleotide formed by natural and/or chemically modified nucleotides/nucleosides;
each A independently is O or S;
each Q is independently selected from the group consisting of absent, amide, ether, triazole, carbonate, carbamate, phosphate, phosphonate, phosphorothioate, sulphate, disulfide, ester, thioester, alkyl amine, cyclic alkyl amine, alkyne, cyclic alkyne, alkene, cyclic alkene, lactone, and lactam bonds;
each X is independently selected from Table 1, or a alkylene of 1 to 10 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N and S (O)  2;
each Y is independently selected from Table 4, or a straight alkylene of 3 to 15 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O; and wherein Y is optionally not substituted or substituted by R 207;
each Z is independently selected from Table 3;
each L independently comprises a ligand moiety capable of docking to a cell-surface receptor.
Table 4:
Figure PCTCN2022114893-appb-000015
Item 16, The compound of any one of items 11-15, wherein each A is O.
Item 17, The compound of any one of items 11-15, wherein at least one A is S.
Item 18, The compound of any one of items 1-17, wherein each ligand is independently selected from the group consisting of N-acetyl galactosamine (GalNAc) , cholesterol, tocopherol, biotin, cyanine dyes, folic acid, RGDp, transferrin, anisamide, lactobionic acid, cRGD, hyaluronic acid, low molecular weight protamine, lipid derivatives, peptides, cyclic peptides, and heterocycles.
Item 19, The compound of any one of items 1-17, wherein the ligand is N-acetyl galactosamine (GalNAc) .
Item 20, The compound of item 12, wherein the compound has the structure shown in formula HS-1 to HS-8, HS-10:
Figure PCTCN2022114893-appb-000016
Item 21, The compound of item 12, wherein the compound has the structure shown of HS-9, HS-14:
Figure PCTCN2022114893-appb-000017
Item 22, The compound of item 12, wherein the compound has the structure shown of HS-5, HS-13:
Figure PCTCN2022114893-appb-000018
Item 23, The compound of item 1, the compound having the structural formula (S-G1) :
Figure PCTCN2022114893-appb-000019
wherein
R 2 is selected one or more from the group consisting of H, C 1-C 5 alkyl, aryl, heteroaryl, C 1-C 5  haloalkyl, -C 1-C 5 alkyl-OH, -C 1-C 5 alkyl-SH, -C 1-C 5 alkyl-NH 2, -CO 2H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2, -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -SO 2 (alkyl) , -SO 2 (haloalkyl) , -SO 2 NH 2, -SO 2NH (alkyl) , and -SO 2 NH (phenyl) ;
n 212 is selected from 1-10, preferably 1-3.
Item 24, The compound of item 23, having the structural formula (S-G1-01) :
Figure PCTCN2022114893-appb-000020
wherein:
J 212A is selected from the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N and S (O)  2;
J 212B is selected from a alkylene of 1 to 10 carbon atoms; optionally selected from a straight alkylene of 1 to 10 carbon atoms;
R 205 is a group comprising a solid support or H;
the carbon marked with symbol “*” is chiral carbon atom.
Item 25, The compound of item 23 or item 24, wherein n 212 is selected from 1or 3.
Item 26, The compound of any one of items 23-24, wherein R 206 comprises an oligonucleotide.
Item 27, The compound of item 26, wherein the compound having the structural formula (S-G1-02) :
Figure PCTCN2022114893-appb-000021
Item 28, The compound of item 23, wherein:
J 211, J 212 are independently selected from a alkylene of 1 to 30 carbon atoms, wherein one or  more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N, S (O)  2, C 2 -C 10 alkenylene, C 2 -C 10 alkynylene, C 6 -C 10 arylene, C 3 -C 18 heterocyclylene, and C 5 -C 10 heteroarylene, and wherein J 211, J 212 are each independently optionally not substituted or substituted by R 209.
Item 29, The compound of item 23, wherein:
J 211, J 212 are independently selected from a alkylene of 1 to 10 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N and S (O)  2, and wherein J 211, J 212 are each independently optionally not substituted or substituted by at least one group selected from group: H, or, C 1-C 5 alkyl, -O C 1-C 5 alkyl.
Item 30, The compound of any of item 29, wherein n 211 is 1, n 212 is 1 or 3.
Item 31, The compound of item 29, wherein the compound having the structural formula (S-G1-03) , (S-G1-04) , (S-G1-05) or (S-G2) :
Figure PCTCN2022114893-appb-000022
Wherein:
A is O or S;
X is independently selected from Table 1, or a alkylene of 1 to 10 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N and S (O)  2;
X 1 is independently selected from Table 2;
J 212, Z are each independently for each occurrence selected from Table 3;
Optionally, J 212 is independently selected from a alkylene of 1 to 10 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N and S (O)  2, and wherein J 212 is optionally not substituted or substituted by at least one group selected from group: H, or, C 1-C 5 alkyl, -OC 1-C 5 alkyl;
R, R’ are each independently selected from the group consisting of a naturally occurring and/or chemically modified oligonucleotide, H and a protecting group for OH;
at least one of R and R’ comprises an oligonucleotide formed by natural and/or chemically modified nucleotides/nucleosides;
R 217 is selected from a straight alkylene of 3 to 15 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O; and wherein R 217 is optionally not substituted or substituted by R 209.
Optionally, R 217 is selected from -C 3-C 8 straight alkylene-.
Item 32, The compound of item 31, the compound having the structural formula (S-G1-06) , (S-G1-07) , (S-G1-08) or (S-G2-01) :
Figure PCTCN2022114893-appb-000023
Figure PCTCN2022114893-appb-000024
Item 33, The compound of item 31, the compound having the structural formula (S-G1-09) , (S-G1-10) , (S-G1-11) or (S-G2-02) :
Figure PCTCN2022114893-appb-000025
Item 34, The compound of item 31, wherein the compound has the structural formula (S-G1-12) , (S-G1-13) , (S-G1-14) or (S-G2-03) :
Figure PCTCN2022114893-appb-000026
Item 35, The compound of item 1, the compound having the structural formula (S-G1-15) , (S-G1-16) or (S-G2-04) :
Figure PCTCN2022114893-appb-000027
wherein:
R, R’ are each independently selected from the group consisting of a naturally occurring or chemically modified oligonucleotide, H and a protecting group for OH;
at least one of R and R’ comprises a naturally occurring or chemically modified oligonucleotide;
each A independently is O or S;
each Q is independently selected from the group consisting of absent, amide, ether, triazole, carbonate, carbamate, phosphate, phosphonate, phosphorothioate, sulphate, disulfide, ester, thioester, alkyl amine, cyclic alkyl amine, alkyne, cyclic alkyne, alkene, cyclic alkene, lactone, and lactam bonds;
each X is independently selected from Table 1, or a alkylene of 1 to 10 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N and S (O)  2;
each Y is independently selected from Table 4, or a straight alkylene of 3 to 15 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O; and wherein Y is optionally not substituted or substituted by R 207;
each Z is independently selected from Table 3;
each Z” is independently selected from Table 5; and
each L independently comprises a ligand moiety capable of docking to a cell-surface receptor; and
each of n1, n2, n3 is independently selected from 1, 2, 3 or 4.
Table 5:
Figure PCTCN2022114893-appb-000028
Item 36, The compound of any one of items 31-35, wherein each A is O.
Item 37, The compound of any one of items 31-35, wherein at least one A is S.
Item 38, The compound of any of items 23-37, wherein each ligand is independently selected from the group consisting of N-acetyl galactosamine (GalNAc) , cholesterol, tocopherol,  biotin, cyanine dyes, folic acid, RGDp, transferrin, anisamide, lactobionic acid, cRGD, hyaluronic acid, low molecular weight protamine, lipid derivatives, peptides, cyclic peptides, and heterocycles.
Item 39, The compound of any one of items 23-37, wherein the ligand is N-acetyl galactosamine (GalNAc) .
Item 40, The compound of item 31, wherein the compound has the structure shown in formula GS-1 to GS-8, GS-10:
Figure PCTCN2022114893-appb-000029
Figure PCTCN2022114893-appb-000030
Item 41, The compound of item 31, wherein the compound has the structure shown in formula GS-9, GS-14:
Figure PCTCN2022114893-appb-000031
Item 42, The compound of item 31, wherein the compound has the structure shown in formula GS-5, GS-13:
Figure PCTCN2022114893-appb-000032
Item 43, The compound of any of items 1-42, wherein the naturally occurring or chemically modified oligonucleotide is linked to the rest of the compound through its 5’ end and/or 3’ end.
Item 44, A compound of item 43, wherein the oligonucleotide comprises a small interfering RNA (siRNA) duplex.
Item 45, A compound of item 43, wherein the oligonucleotide comprises an asymmetric interfering RNA (aiRNA) duplex.
Item 46, A compound of item 45, wherein the aiRNA comprising an antisense strand and a sense strand, wherein the antisense strand is longer than the sense strand, has a length of 19, 20, 21, 22, 23, 24, 25, 26 or 27 nucleotides and includes a 3'-overhang of 1-9nucleotides and a 5'-overhang of 0-8 nucleotides when duplexed with the sense strand;
wherein the sense strand has a length of 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 or 26 nucleotides and forms a double-stranded region with the antisense strand.
Item 47, A compound of item 46, wherein the aiRNA comprising an antisense strand and a sense strand, wherein the antisense strand is longer than the sense strand, has a length of 19, 20, 21, 22, 23, 24, 25, 26 or 27 nucleotides and includes a 3'-overhang of 1-9nucleotides and a 5'-overhang of 1-8 nucleotides when duplexed with the sense strand;
wherein the sense strand has a length of 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 or 26 nucleotides and forms a double-stranded region with the antisense strand.
Item 48, A compound of item 46, wherein the aiRNA comprising an antisense strand and a sense strand, wherein the antisense strand is longer than the sense strand, has a length of 19, 20, 21, 22, 23, 24, 25, 26 or 27 nucleotides and includes a 3'-overhang of 1-9nucleotides and a 5'blunt end when duplexed with the sense strand;
wherein the sense strand has a length of 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 or 26 nucleotides and forms a double-stranded region with the antisense strand.
Item 49, A compound of item 43, wherein the oligonucleotide comprises an antisense oligonucleotide (ASO) .
Item 50, A compound of item 43, wherein the oligonucleotide comprises micro-RNA (miRNA) .
Item 51, A small interfering RNA (siRNA) agent duplex comprising a structural formula of any of items 1-50.
Item 52, An asymmetric interfering RNA (aiRNA) agent comprising a structural formula of any of items 1-50.
Item 53, An antisense oligonucleotide (ASO) agent comprising a structural formula of any of items 1-50.
Item 54, A micro-RNA (miRNA) agent comprising a structural formula of any of items 1-50.
Item 55, A pharmaceutical composition comprising a compound of items 1-50 or agent of any one of items 51-54 and a pharmaceutically acceptable excipient, carrier, or diluent.
Item 56, Use of a compound of any one of items 1-50 or agent of any one of items 51-54 in preparation of a medicament effective for treating a disease or condition.
In third aspect, the invention features a compound comprising a carbohydrate ligand as provided in the second aspect above, and the presence of the carbohydrate ligand can increase delivery of the compound to the targeted organs, e.g. liver. Thus, a compound comprising a carbohydrate ligand can be useful for targeting a gene related to a disease or an undesired condition in the targeted organs. For example, a compound of the invention comprising the carbohydrate ligand can target a nucleic acid expressed by a hepatitis virus. In other examples, the target gene can be selected from the group consisting of: Factor VII, Eg5, PCSK9, APOC3, TPX2, apoB, SAA, TTR, RSV, PDGF beta gene, Erb-B gene, Src gene, CRK gene, GRB2 gene, RAS gene, MEKK gene, JNK gene, RAF gene, Erkl/2 gene, PCNA (p21) gene, MYB gene, JUN gene, FOS gene, BCL-2 gene, Cyclin D gene, VEGF gene, EGFR gene, Cyclin A gene, Cyclin E gene, WNT-I gene, beta-catenin gene, c-MET gene, PKC gene, NFKB gene, STAT3 gene, survivin gene, Her2/Neu gene, topoisomerase I gene, topoisomerase II alpha gene, mutations in the p73 gene, mutations in the p21(WAFl /CIPl) gene, mutations in the p27 (KIPl) gene, mutations in the PPMlD gene, mutations in the RAS gene, mutations in the caveolin I gene, mutations in the MIB I gene, mutations in the MTAI gene, mutations in the M68 gene, mutations in tumor suppressor genes, and mutations in the p53 tumor suppressor gene.
In fourth aspect, the invention provides compounds having novel structure:
Item 57, A compound having the structural formula (G-P1) :
Figure PCTCN2022114893-appb-000033
wherein:
R 0 is selected one or more from the group consisting of H, C 1-C 5 alkyl, aryl, heteroaryl, C 1-C 5 haloalkyl, -C 1-C 5 alkyl-OH, -C 1-C 5 alkyl-SH, -C 1-C 5 alkyl-NH 2, -CO 2H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2, -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -SO 2 (alkyl) , -SO 2 (haloalkyl) , -SO 2 NH 2, -SO 2NH (alkyl) , and -SO 2 NH (phenyl) ;
R 202A comprises at least one ligand capable of docking to a cell surface receptor;
R 204, R 207, R 208 are independently selected one or more from the group consisting of H, alkyl, aryl, heteroaryl, haloalkyl, -O alkyl, -O alkylphenyl, -alkyl-OH, -O haloalkyl, -S alkyl, -Salkylphenyl, -alkyl-SH, -S haloalkyl, halo, -OH, -SH, -NH 2, -alkyl-NH 2, -N (alkyl) (alkyl) , -NH (alkyl) , -N (alkyl) (alkylphenyl) , -NH (alkylphenyl) , cyano, nitro, -CO 2H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2 , -NHC (O) (alkyl) , -NHC (O) (phenyl) , -N (alkyl) C (O) (alkyl) , -N (alkyl) C (O) (phenyl) , -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -OC (O) alkyl, -SO 2 (alkyl) , -SO 2 (phenyl) , -SO 2 (haloalkyl) , -SO 2 NH 2 , -SO 2NH (alkyl) , -SO 2 NH (phenyl) , -NHSO 2 (alkyl) , -NHSO 2 (phenyl) , and -NHSO 2 (haloalkyl) ;
n 201 is selected from 1, 2, 3, 4, 5 or 6;
R 206 is selected from OH or a protecting group for OH;
J 201, J 202 are each independently for each occurrence a spacer;
R 205B is a -C 2 -C 10 alkynylene-CN;
R 205C, R 205D are independently selected from -C 1-C 6-alkyl or R 205C and R 205D together form a five-or six-membered ring, optionally R 205C, R 205D are substituted, optionally R 205C, R 205D contain one further heteroatom selected from N and O.
Item 58, A compound of item 57, wherein:
J 201, J 202 are each independently selected from a alkylene of 3 to 30 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N, S (O)  2, C 2 -C 10 alkenylene, C 2 -C 10 alkynylene, C 6 -C 10 arylene, C 3 -C 18 heterocyclylene, and C 5 -C 10 heteroarylene, and wherein J 201, J 202are optionally not substituted or substituted by R 209.
Item 59, A compound of item 57, having the structural formula (G-P2) :
Figure PCTCN2022114893-appb-000034
Wherein:
J 202A is selected from the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N and S (O)  2;
J 202B is selected from a alkylene of 1 to 10 carbon atoms.
Item 60, A compound of item59, having the structural formula (G-P3) :
Figure PCTCN2022114893-appb-000035
Item 61, A compound of item 57, having the structural formula (G-P4) :
Figure PCTCN2022114893-appb-000036
Item 62, A compound of item 57, wherein:
R 205B is a -C 2 –C 5 alkynylene-CN;
R 205C, R 205D are independently selected from -C 1-C 6-alkyl;
R 202A is –R 202C-branching group- (R 202B-R 202Ln 111L or –R 202B-R 202L;
R 202L is independently selected from a ligand capable of docking to a cell surface receptor;
R 202B is selected from a alkylene of 1 to 30 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N, S (O)  2, C 2 -C 10 alkenylene, C 2 -C 10 alkynylene, C 6 -C 10 arylene, C 3 -C 18 heterocyclylene, and C 5 -C 10 heteroarylene, and wherein R202 B is optionally not substituted or substituted by R 207;
n 111L is selected from 1, 2 or 3.
Item 63, A compound of item 62, wherein R 202C is selected from –C (O) -C 5 –C 8 straight alkylene-NHCO-CH 2-or –C (O) -C 8 –C 11 straight alkylene-.
Item 64, A compound of item 62, wherein the branching group is selected from the group consisting of:
Figure PCTCN2022114893-appb-000037
Wherein each A 1 is independently, O, S, C=O, or NH; and
each n is independently from 1 to 20.
Item 65, A compound of item 61, wherein, the ligand is
Figure PCTCN2022114893-appb-000038
wherein R A is H or a protecting group for OH.
Item 66, A compound of item 61, having the structural formula (G-P5) :
Figure PCTCN2022114893-appb-000039
Item 67, A compound of item 61, having the structural formula (G-P6) :
Figure PCTCN2022114893-appb-000040
Item 68, A compound having the structural formula (G-P7) :
Figure PCTCN2022114893-appb-000041
wherein:
R 3 is selected one or more from the group consisting of H, C 1-C 5 alkyl, aryl, heteroaryl, C 1-C 5 haloalkyl, -C 1-C 5 alkyl-OH, -C 1-C 5 alkyl-SH, -C 1-C 5 alkyl-NH 2, -CO 2H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2, -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -SO 2 (alkyl) , -SO 2 (haloalkyl) , -SO 2 NH 2, -SO 2NH (alkyl) , -SO 2 NH (phenyl) ;
R 217A comprises at least one a ligand capable of docking to a cell surface receptor;
R 213, R 214, R 215, R 216 are selected one or more from the group consisting of H, alkyl, aryl, heteroaryl, haloalkyl, -O alkyl, -O alkylphenyl, -alkyl-OH, -O haloalkyl, -S alkyl, -S alkylphenyl, -alkyl-SH, -S haloalkyl, halo, -OH, -SH, -NH 2, -alkyl-NH 2, -N (alkyl) (alkyl) , -NH (alkyl) , -N (alkyl) (alkylphenyl) , -NH (alkylphenyl) , cyano, nitro, -CO 2H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2 , -NHC (O) (alkyl) , -NHC (O) (phenyl) , -N (alkyl) C (O) (alkyl) , -N (alkyl) C (O) (phenyl) , -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -OC (O) alkyl, -SO 2 (alkyl) , -SO 2 (phenyl) , -SO 2 (haloalkyl) , -SO 2 NH 2 , -SO 2NH (alkyl) , -SO 2 NH (phenyl) , -NHSO 2 (alkyl) , - NHSO 2 (phenyl) , and -NHSO 2 (haloalkyl) ;
R 212 is selected from OH or a protecting group for OH;
J 211, J 212 are each independently for each occurrence a spacer;
n 211 are each independently for each  occurrence  1, 2, 3, 4, 5 or 6;
J 211, J 212 are each independently for each occurrence a spacer;
R 211B is a -C 2 -C 10 alkynylene-CN;
R 211C, R 211D are independently selected from -C 1-C 6-alkyl or R 211C and R 211D together form a  five-or six-membered ring, optionally R 211C, R 211D are substituted, optionally R 211C, R 211D contain one further heteroatom selected from N and O.
Item 69, A compound of item 68, wherein:
J 211, J 212 are each independently selected from a alkylene of 3 to 30 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N, S (O)  2, C 2 -C 10 alkenylene, C 2 -C 10 alkynylene, C 6 -C 10 arylene, C 3 -C 18 heterocyclylene, and C 5 -C 10 heteroarylene, and wherein J 211, J 212are optionally not substituted or substituted by R 209.
Item 70, A compound of item 68, having the structural formula (G-P8) :
Figure PCTCN2022114893-appb-000042
wherein:
J 212A is selected from the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N and S (O)  2;
J 212B is selected from a alkylene of 1 to 10 carbon atoms.
Item 71, A compound of item 69, having the structural formula (G-P9) :
Figure PCTCN2022114893-appb-000043
Item 72, A compound of item 68, having the structural formula (G-P10) :
Figure PCTCN2022114893-appb-000044
Item 73, A compound of item 68, wherein:
R 211B is a -C 2 –C 5 alkynylene-CN;
R 211C, R 211D are independently selected from -C 1-C 6-alkyl;
R 217 is –R 217C-branching group- (R 217B-R 217Ln 211L or –R 217B-R 217L;
R 217L is independently selected from a ligand capable of docking to a cell surface receptor;
R 217B is selected from a alkylene of 1 to 30 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N, S (O)  2, C 2 -C 10 alkenylene, C 2 -C 10 alkynylene, C 6 -C 10 arylene, C 3 -C 18 heterocyclylene, and C 5 -C 10 heteroarylene, and wherein R 217B is optionally not substituted or substituted by R 213;
n 211L is selected from 1, 2 or 3.
Item 74, A compound of item 73, wherein R 217C is selected from –C (O) -C 5 –C 8 straight alkylene-NHCO-CH 2-or –C (O) -C 8 –C 11 straight alkylene-.
Item 75, A compound of item 73, wherein the branching group is selected from the group consisting of:
Figure PCTCN2022114893-appb-000045
Wherein each A 1 is independently, O, S, C=O, or NH; and
each n is independently from 1 to 20.
Item 76, A compound of item 68, wherein the ligand is
Figure PCTCN2022114893-appb-000046
wherein R A is H or a protecting group for OH.
Item 77, A compound of item 68, having the structural formula (G-P11) :
Figure PCTCN2022114893-appb-000047
Item 78, A compound of item 68, having the structural formula (G-P12) :
Figure PCTCN2022114893-appb-000048
In another aspect, the invention features a compound as provided in the fourth aspect above can be used as an intermediate linker to link the oligonucleotide and the ligand to synthesis a sequential and/or a cluster ligand conjugation, especially, be used as intermediate compound to synthesis a sequential ligand conjugation.
In another aspect, the compound as provided in the fourth aspect above can be used to directly conjugate the ligand conjugation to the “backbone” at the 5’ and/or 3’ end of the oligonucleotide. In some embodiments, the compound as provided in the fourth aspect above can be used to directly conjugate the ligand conjugation to 5’ end of any strand of an oligonucleotide.
In a further aspect, the invention provides a pharmaceutical composition comprising a compound of the invention as provided in any aspects above and a pharmaceutically acceptable excipient, carrier, or diluent.
In another aspect, the invention features a method for delivering a compound to a specific target in a subject for therapeutic or diagnostic purpose. Accordingly, the invention provides a method for treating or preventing a disease or a condition, wherein the method comprises administering to a subject in need thereof an effective amount of a pharmaceutical composition that includes the compound of the invention. The treatment or prevention of a disease or condition is  carried by partial or total silencing of disease genes. The disease genes may be patient’s own genes or microbial genes come from outside, such as virus.
The foregoing and other objects, aspects, features, and advantages of the invention will become more apparent from the following description and from the claims.
BRIEF DESCRIPTION OF THE DRAWINGS
The objects and features of the invention can be better understood with reference to the drawings described below, and the claims. The drawings illustrate the core idea of the invention but do not necessarily conclude all the possible variations. In the drawings, like numerals are used to indicate like parts throughout the various views.
FIG. 1 illustrates exemplary structures of Oligonucleotide-Ligand Conjugation. A conjugated interfering RNA duplex molecule comprises an antisense strand and a sense strand. In some embodiments, the oligonucleotide is interfering RNA duplex molecule, and the ligand can be conjugated at the 3’ end of sense strand (such as Structure 1.1-1.3, middle type aiRNA, blunt end type aiRNA and siRNA) , at the 3’ end of antisense strand (Structure 2) , at the 5’ end of sense strand (Structure 3) , or at both two ends of sense strand (Structure 5) , at both two ends of antisense strand (Structure 4) , at the 3’ end of antisense strand and 5’ end of sense strand (Structure 6) , at the 3’ end of sense strand and 3’ end of antisense strand (Structure 7) , or at the 3’ end of sense strand, 3’ end of antisense strand and the 5’ end of sense strand. In some embodiments, the oligonucleotide is antisense oligonucleotide (ASO) , and the ligand can be conjugated at the 3’ end or/and 5’ end of the antisense strand.
FIG. 2 illustrates the ex vivo uptake β-Catenin aiRNA results tested by QPCR. “Non-GalNAc” is non-conjugated aiRNA. “Glu (R) -seq (3 GalNAc) ” is aiRNA conjugated with GalNAc conjugate composition “GS-5” .
FIG. 3 illustrates the ex vivo uptake potency of the mCat12 aiRNA conjugated with “His (R) -seq (3 GalNAc) ” , “His (S) -seq (3 GalNAc) ” and “Glu-seq (3 GalNAc) ” in primary hepatocytes.
FIG. 4 illustrates the ex vivo uptake potency of TTR aiRNA conjugated with “His-Seq (3 GalNAc) ” in primary hepatocytes.
DETAILED DESCRIPTION OF THE INVENTION
I. Definition
Unless otherwise noted, technical terms are used according to conventional usages. Definitions of common terms in molecular biology may be found, for example, in J. Krebs et al. (eds. ) , Lewin’s Genes XII, published by Jones and Bartlett Learning, 2017 (ISBN 9781284104493) ; Robert A. Meyers (ed. ) , Molecular Biology and Biotechnology: a Comprehensive Desk Reference, published by Anmol Publications Pvt. Ltd, 2011 (ISBN 9788126531783) ; and other similar technical references.
As used in the specification and claims, the singular form “a” , “an” , or “the” includes plural references unless the context clearly dictates otherwise. For example, the term “a cell” includes a plurality of cells including mixtures thereof. It is further noted that the claims may be drafted to exclude any optional element. As such, this statement is intended to serve as support for the recitation in the claims of such exclusive terminology as “solely, ” “only” and the like in connection with the recitation of claim elements, or use of a “negative” limitations, such as “wherein [a particular feature or element] is absent, ” or “except for [a particular feature or element] , ” or “wherein [a particular feature or element] is not present (included, etc. ) ... ” .
As used herein, the recitation of a numerical range for a variable is intended to convey that the invention may be practiced with the variable equal to any of the values within that range. Thus, for a variable which is inherently discrete, the variable can be equal to any integer value within the numerical range, including the end-points of the range. Similarly, for a variable which is inherently continuous, the variable can be equal to any real value within the numerical range, including the end-points of the range. As an example, and without limitation, a variable which is described as having values between 0 and 2 can take the  values  0, 1 or 2 if the variable is inherently discrete, and can take the values 0.0, 0.1, 0.01, 0.001, or any other real values >0 and <2 if the variable is inherently continuous.
As used herein, “about” means within plus or minus 10%. For example, “about 1” means “0.9 to 1.1” , “about 2%” means “1.8%to 2.2%” , “about 2%to 3%” means “1.8%to 3.3%” , and “about 3%to about 4%” means “2.7%to 4.4%. ” 
As used herein, the terms “spacer” , “linker” and “linkage” are used to link the two parts of the compounds, e.g. a alkylene of 1 to 30 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N, S (O) 2, C2 -C10 alkenylene, C2 -C10 alkynylene, C6 -C10 arylene, C3 - C18 heterocyclylene, and C5 -C10 heteroarylene, and wherein J201, J202are each independently optionally not substituted or substituted by one or more from the group consisting of H, alkyl, aryl, heteroaryl, haloalkyl, -O alkyl, -O alkylphenyl, -alkyl-OH, -O haloalkyl, -S alkyl, -S alkylphenyl, -alkyl-SH, -S haloalkyl, halo, -OH, -SH, -NH2, -alkyl-NH2, -N (alkyl) (alkyl) , -NH (alkyl) , -N (alkyl) (alkylphenyl) , -NH (alkylphenyl) , cyano, nitro, -CO2H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH2 , -NHC (O) (alkyl) , -NHC (O) (phenyl) , -N (alkyl) C (O) (alkyl) , -N (alkyl) C (O) (phenyl) , -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -OC (O) alkyl, -SO2 (alkyl) , -SO2 (phenyl) , -SO2 (haloalkyl) , -SO2 NH2, -SO2NH (alkyl) , -SO2 NH (phenyl) , -NHSO2 (alkyl) , -NHSO2 (phenyl) , and -NHSO2 (haloalkyl) .
Various hydroxyl protecting groups may be used in the present disclosure. In general, protecting groups render chemical functionalities inert to specific reaction conditions, and may be appended to and removed from such functionalities in a molecule without substantially damaging the remainder of the molecule. Representative hydroxylprotecting groups are disclosed by Beaucage, et al., Tetrahedron 1992, 48, 2223-2311, and also in Greene and Wuts, Protective Groups in Organic Synthesis, Chapter 2, 2d ed, John Wiley &Sons, New York, 1991, each of which are hereby incorporated by reference in their entirety. In some embodiments, the protecting group is stable under basic conditions but may be removed under acidic conditions. In some embodiments, non-exclusive examples of the hydroxyl protecting groups that may be used herein include dimethoxytrityl (DMT) , monomethoxytrityl, 9-phenylxanthen-9-yl (Pixyl) and 9- (p-methoxyphenyl) xanthen-9-yl (Mox) . In some embodiments, non-exclusive examples of the hydroxyl protecting groups that may be used herein comprises Tr (trityl) , MMTr (4-methoxytrityl) , DMTr (4, 4'-dimethoxytrityl) , and TMTr (4, 4', 4"-trimethoxytrityl) .
As used herein, a dash ( “-” ) that is not between two letters or symbols is used to indicate a point of attachment for a substituent. For example, -C 1 -C 10 alkyl-NH 2 is attached through the C 1 -C 10 alkyl.
As used herein, “optional” or “optionally” is meant that the subsequently described event or circumstance may or may not occur, and that the description includes instances wherein the event or circumstance occurs and instances in which it does not. For example, “optionally substituted alkyl” encompasses both “alkyl” and “substituted alkyl” as defined below. It will be understood by those skilled in the art, with respect to any group containing one or more substituents, that such groups are not intended to introduce any substitution or substitution patterns that are sterically impractical, synthetically non-feasible and/or inherently unstable.
As used herein, “alkyl” refers to straight chain and branched chain having the indicated number of carbon atoms, usually from 1 to 20 carbon atoms, for example 1 to 10 carbon atoms, such as 1 to 8, 1 to 6, 1 to 5, or 1 to 3 carbon atoms. For example, C 1 -C 6 alkyl encompasses both straight and branched chain alkyl of from 1 to 6 carbon atoms. When an alkyl residue having a specific number of carbons is named, all branched and straight chain versions having that number of carbons are intended to be encompassed; thus, for example, “butyl” is meant to include n-butyl, sec-butyl, isobutyl and t-butyl; “propyl” includes n-propyl and isopropyl. Alkylene is a subset of alkyl, referring to the same residues as alkyl, but having two points of attachment.
As used herein, “alkenyl” refers to an unsaturated branched or straight-chain alkyl group having at least one carbon-carbon double bond derived by the removal of one molecule of hydrogen from adjacent carbon atoms of the parent alkyl. The group may be in either the cis or trans configuration about the double bond (s) . Typical alkenyl groups include, but are not limited to, ethenyl; propenyls such as prop-1-en-1-yl, prop-1-en-2-yl, prop-2-en-1-yl (allyl) , prop-2-en-2-yl; butenyls such as but-1-en-1-yl, but-1-en-2-yl, 2-methyl-prop-1-en-1-yl, but-2-en-1-yl, but-2-en-1-yl, but-2-en-2-yl, buta-1, 3-dien-1-yl, buta-1, 3-dien-2-yl; and the like. In certain embodiments, an alkenyl group has from 2 to 20 carbon atoms and in other embodiments, from 2 to 10, 2 to 8, or 2 to 6 carbon atoms. Alkenylene is a subset of alkenyl, referring to the same residues as alkenyl, but having two points of attachment.
As used herein, “alkynyl” refers to an unsaturated branched or straight-chain alkyl group having at least one carbon-carbon triple bond derived by the removal of two molecules of hydrogen from adjacent carbon atoms of the parent alkyl. Typical alkynyl groups include, but are not limited to, ethynyl; propynyls such as prop-1-yn-1-yl, prop-2-yn-1-yl; butynyls such as but-1-yn-1-yl, but-1-yn-3-yl, but-3-yn-1-yl; and the like. In certain embodiments, an alkynyl group has from 2 to 20 carbon atoms and in other embodiments, from 2 to 10, 2 to 8, or 2 to 6 carbon atoms. Alkynylene is a subset of alkynyl, referring to the same residues as alkynyl, but having two points of attachment.
As used herein, “alkoxy” refers to an alkyl group of the indicated number of carbon atoms attached through an oxygen bridge such as, for example, methoxy, ethoxy, propoxy, isopropoxy, n-butoxy, sec-butoxy, tert-butoxy, pentyloxy, 2-pentyloxy, isopentyloxy, neopentyloxy, hexyloxy, 2-hexyloxy, 3-hexyloxy, 3-methylpentyloxy, and the like. Alkoxy groups will usually have from 1 to 10, 1 to 8, 1 to 6, or 1 to 4 carbon atoms attached through the oxygen bridge.
As used herein, “aryl” refers to a radical derived from an aromatic monocyclic or multicyclic hydrocarbon ring system by removing a hydrogen atom from a ring carbon atom. The aromatic monocyclic or multicyclic hydrocarbon ring system contains only hydrogen and carbon  from six to eighteen carbon atoms, where at least one of the rings in the ring system is fully unsaturated, i.e., it contains a cyclic, delocalized (4n+2) π–electron system in accordance with the Hückel theory. Aryl groups include, but are not limited to, groups such as phenyl, fluorenyl, and naphthyl. Arylene is a subset of aryl, referring to the same residues as aryl, but having two points of attachment.
As used herein, “cycloalkyl” refers to a non-aromatic carbocyclic ring, usually having from 3 to 7 ring carbon atoms. The ring may be saturated or have one or more carbon-carbon double bonds. Examples of cycloalkyl groups include cyclopropyl, cyclobutyl, cyclopentyl, cyclopentenyl, cyclohexyl, and cyclohexenyl, as well as bridged and caged ring groups such as norbornane.
As used herein, “halo” or “halogen” refers to fluoro, chloro, bromo, and iodo, and the term "halogen" includes fluorine, chlorine, bromine, and iodine.
As used herein, “haloalkyl” refers to alkyl as defined above having the specified number of carbon atoms, substituted with 1 or more halogen atoms, up to the maximum allowable number of halogen atoms. Examples of haloalkyl include, but are not limited to, trifluoromethyl, difluoromethyl, 2-fluoroethyl, and penta-fluoroethyl.
“Heterocyclyl” refers to a stable 3-to 18-membered non-aromatic ring radical that comprises two to twelve carbon atoms and from one to six heteroatoms selected from nitrogen, oxygen and sulfur. Unless stated otherwise specifically in the specification, the heterocyclyl radical is a monocyclic, bicyclic, tricyclic or tetracyclic ring system, which may include fused or bridged ring systems. The heteroatoms in the heterocyclyl radical may be optionally oxidized. One or more nitrogen atoms, if present, are optionally quaternized. The heterocyclyl radical is partially or fully saturated. The heterocyclyl may be attached to the rest of the molecule through any atom of the ring (s) . Examples of such heterocyclyl radicals include, but are not limited to, dioxolanyl, thienyl [1, 3] dithianyl, decahydroisoquinolyl, imidazolinyl, imidazolidinyl, isothiazolidinyl, isoxazolidinyl, morpholinyl, octahydroindolyl, octahydroisoindolyl, 2-oxopiperazinyl, 2-oxopiperidinyl, 2-oxopyrrolidinyl, oxazolidinyl, piperidinyl, piperazinyl, 4-piperidonyl, pyrrolidinyl, pyrazolidinyl, quinuclidinyl, thiazolidinyl, tetrahydrofuryl, trithianyl, tetrahydropyranyl, thiomorpholinyl, thiamorpholinyl, 1-oxo-thiomorpholinyl, and 1, 1-dioxo-thiomorpholinyl.
“Heteroaryl” refers to a radical derived from a 3-to 18-membered aromatic ring radical that comprises two to seventeen carbon atoms and from one to six heteroatoms selected from nitrogen, oxygen and sulfur. As used herein, the heteroaryl radical may be a monocyclic, bicyclic, tricyclic or tetracyclic ring system, wherein at least one of the rings in the ring system is fully unsaturated, i.e., it contains a cyclic, delocalized (4n+2) π–electron system in accordance with the  Hückel theory. Heteroaryl includes fused or bridged ring systems. The heteroatom (s) in the heteroaryl radical is optionally oxidized. One or more nitrogen atoms, if present, are optionally quaternized. The heteroaryl is attached to the rest of the molecule through any atom of the ring (s) . Examples of heteroaryls include, but are not limited to, azepinyl, acridinyl, benzimidazolyl, benzindolyl, 1, 3-benzodioxolyl, benzofuranyl, benzooxazolyl, benzo [d] thiazolyl, benzothiadiazolyl, benzo [b] [1, 4] dioxepinyl, benzo [b] [1, 4] oxazinyl, 1, 4-benzodioxanyl, benzonaphthofuranyl, benzoxazolyl, benzodioxolyl, benzodioxinyl, benzopyranyl, benzopyranonyl, benzofuranyl, benzofuranonyl, benzothienyl (benzothiophenyl) , benzothieno [3, 2-d] pyrimidinyl, benzotriazolyl, benzo [4, 6] imidazo [1, 2-a] pyridinyl, carbazolyl, cinnolinyl, cyclopenta [d] pyrimidinyl, 6, 7-dihydro-5H-cyclopenta [4, 5] thieno [2, 3-d] pyrimidinyl, 5, 6-dihydrobenzo [h] quinazolinyl, 5, 6-dihydrobenzo [h] cinnolinyl, 6, 7-dihydro-5H-benzo [6, 7] cyclohepta [1, 2-c] pyridazinyl, dibenzofuranyl, dibenzothiophenyl, furanyl, furanonyl, furo [3, 2-c] pyridinyl, 5, 6, 7, 8, 9, 10-hexahydrocycloocta [d] pyrimidinyl, 5, 6, 7, 8, 9, 10-hexahydrocycloocta [d] pyridazinyl, 5, 6, 7, 8, 9, 10-hexahydrocycloocta [d] pyridinyl, isothiazolyl, imidazolyl, indazolyl, indolyl, indazolyl, isoindolyl, indolinyl, isoindolinyl, isoquinolyl, indolizinyl, isoxazolyl, 5, 8-methano-5, 6, 7, 8-tetrahydroquinazolinyl, naphthyridinyl, 1, 6-naphthyridinonyl, oxadiazolyl, 2-oxoazepinyl, oxazolyl, oxiranyl, 5, 6, 6a, 7, 8, 9, 10, 10a-octahydrobenzo [h] quinazolinyl, 1-phenyl-1H-pyrrolyl, phenazinyl, phenothiazinyl, phenoxazinyl, phthalazinyl, pteridinyl, purinyl, pyrrolyl, pyrazolyl, pyrazolo [3, 4-d] pyrimidinyl, pyridinyl, pyrido [3, 2-d] pyrimidinyl, pyrido [3, 4-d] pyrimidinyl, pyrazinyl, pyrimidinyl, pyridazinyl, pyrrolyl, quinazolinyl, quinoxalinyl, quinolinyl, isoquinolinyl, tetrahydroquinolinyl, 5, 6, 7, 8-tetrahydroquinazolinyl, 5, 6, 7, 8-tetrahydrobenzo [4, 5] thieno [2, 3-d] pyrimidinyl, 6, 7, 8, 9-tetrahydro-5H-cyclohepta [4, 5] thieno [2, 3-d] pyrimidinyl, 5, 6, 7, 8-tetrahydropyrido [4, 5-c] pyridazinyl, thiazolyl, thiadiazolyl, triazolyl, tetrazolyl, triazinyl, thieno [2, 3-d] pyrimidinyl, thieno [3, 2-d] pyrimidinyl, thieno [2, 3-c] pridinyl, and thiophenyl (i.e. thienyl) .
As used herein, the term “a solid support” comprises the solid phase carrier for the synthesis of oligonucleotide, such as CPG.
As used herein, the term “oligonucleotide” , “oligonucleotides” refer to a compound comprising a plurality of linked nucleosides. In certain embodiments, “oligonucleotides” are short, single-or double-stranded RNA or DNA molecules, and include antisense oligonucleotides (ASO) , RNA interference (RNAi) , and aptamer RNAs. In certain embodiments, one or more of the plurality of nucleosides is modified. In certain embodiment, an oligonucleotide comprises one or more ribonucleosides (as in RNA) and/or deoxyribonucleosides (as in DNA) . In some embodiments, the oligonucleotide is a single-stranded oligonucleotide. In some other embodiments, the  oligonucleotide is a double-stranded interfering RNA, such as siRNA, aiRNA, shRNA. In some embodiments, the oligonucleotide is circRNA. In some embodiments, the oligonucleotide is mRNA.
As used herein, term “aiRNA” is an asymmetric interfering RNA duplex molecule, comprising an antisense strand and a sense strand, wherein the antisense strand is longer than the sense strand, consists of 19-27 nucleotides, and includes a 3’ overhang of at least one nucleotide, and a 5’ end of 0-8 nucleotides; wherein the antisense strand is at least 70%complementary to a target mRNA; wherein the sense strand consists of 10-26 nucleotides, forms a double-stranded region with the antisense strand where the double-stranded region includes 0, 1 or 2 mismatch pair (s) . Exemplary structure of aiRNA is described in US 2009/0208564, which is hereby incorporated by reference in entirety.
As used herein, the term “middle type” refers to an interfering RNA duplex molecule, comprising an antisense strand and a sense strand, where the antisense strand is longer than the sense strand, and comprises both 3’ overhang and 5’ overhang of at least one nucleotide.
As used herein, the term “blunt type” refers to an interfering RNA duplex molecule, comprising an antisense strand and a sense strand, where the RNA duplex molecule has at least one blunt end, preferably having one blunt end at the 3’ end of the sense strand or at the 5’ end of antisense strand.
As used herein, the term “modified oligonucleotide” means an oligonucleotide comprising at least one modified nucleotide.
As used herein, the term “modified nucleotide” means a nucleotide having at least one modified sugar moiety, modified internucleoside linkage, and/or modified nucleobase.
As used herein, the term “modified nucleoside” means a nucleoside having at least one modified sugar moiety, and/or modified nucleobase.
As used herein, the term “naturally occurring internucleoside linkage” means a 3’ to 5’ phosphodiester linkage.
As used herein, the term “modified internucleoside linkage” refers to a substitution or any change from a naturally occurring internucleotide bond. For example, a phosphorothioate linkage is a modified internucleotide linkage.
As used herein, the term “natural sugar moiety” means a sugar found in DNA (2-H) or RNA (2-OH) .
As used herein, the term “modified sugar” refers to a substitution or change from a natural sugar. For example, a 2’-O-methoxyethyl modified sugar is a modified sugar.
As used herein, the term “bicyclic sugar” means a furosyl ring modified by the bridging of two non-geminal ring atoms. A bicyclic sugar is a modified sugar.
As used herein, the term “modified nucleobase” refers to any nucleobase other than adenine, cytosine, guanine, thymidine, or uracil. For example, 5-methylcytosine is a modified nucleobase. An “unmodified nucleobase” means the purine bases adenine (A) and guanine (G) , and the pyrimidine bases thymine (T) , cytosine (C) , and uracil (U) .
As used herein, “prevention” and “preventing” are used interchangeably. These terms refer to an approach for obtaining beneficial or desired results including but not limited to a prophylactic benefit. For “prophylactic benefit” , the conjugates or compositions may be administered to a patient at risk of developing a particular disease, or to a patient reporting one or more of the physiological symptoms of a disease, even though a diagnosis of this disease may not have been made.
As used herein, the term “effective amount” of an active agent refers to an amount sufficient to elicit the desired biological response. As will be appreciated by those of ordinary skill in this art, the effective amount of a compound of the invention may vary depending on such factors as the desired biological endpoint, the pharmacokinetics of the compound, the disease being treated, the mode of administration, and the patient.
As used herein, the terms “treatment” or “treating” a disease or disorder refers to a method of reducing, delaying or ameliorating such a condition before or after it has occurred. Treatment may be directed at one or more effects or symptoms of a disease and/or the underlying pathology. The treatment can be any reduction and can be, but is not limited to, the complete ablation of the disease or the symptoms of the disease. As compared with an equivalent untreated control, such reduction or degree of prevention is at least 5%, 10%, 20%, 40%, 50%, 60%, 80%, 90%, 95%, or 100%as measured by any standard technique.
As used herein, the term “subject” refers to any animal (e.g., a mammal) , including, but not limited to humans, non-human primates, rodents, and the like, which is to be the recipient of a particular treatment. Typically, the terms “subject” and “patient” are used interchangeably. As used herein, a "pharmaceutical composition" includes a pharmacologically effective amount of a dsRNA and a pharmaceutically acceptable carrier. As used herein, "pharmacologically effective amount, " "therapeutically effective amount" or simply "effective amount" refers to that amount of an RNA effective to produce the intended pharmacological, therapeutic or preventive result. For example, if a given clinical treatment is considered effective when there is at least a 25%reduction in a measurable parameter associated with a disease or disorder, a therapeutically effective amount of a  drug for the treatment of that disease or disorder is the amount necessary to effect at least a 25%reduction in that parameter.
The term "pharmaceutically acceptable carrier" refers to a carrier for administration of a therapeutic agent. Such carriers include, but are not limited to, saline, buffered saline, dextrose, water, glycerol, ethanol, and combinations thereof. The term specifically excludes cell culture medium. For drugs administered orally, pharmaceutically acceptable carriers include, but are not limited to pharmaceutically acceptable excipients such as inert diluents, disintegrating agents, binding agents, lubricating agents, sweetening agents, flavoring agents, coloring agents and preservatives. Suitable inert diluents include sodium and calcium carbonate, sodium and calcium phosphate, and lactose, while corn starch and alginic acid are suitable disintegrating agents. Binding agents may include starch and gelatin, while the lubricating agent, if present, will generally be magnesium stearate, stearic acid or talc. If desired, the tablets may be coated with a material such as glyceryl monostearate or glyceryl distearate, to delay absorption in the gastrointestinal tract. nce to a human subject.
Compounds configuration
Compounds of the present invention, and salts thereof, may exist in their tautomeric form (for example, as an amide or imino ether) . All such tautomeric forms are contemplated herein as part of the present invention.
All stereoisomers of the compounds of the present invention (for example, those which may exist due to asymmetric carbons on various substituents) , including enantiomeric forms and diastereomeric forms, are contemplated within the scope of this invention. Individual stereoisomers of the compounds of the invention may, for example, be substantially free of other isomers (e.g., as a pure or substantially pure optical isomer having a specified activity) , or may be admixed, for example, as racemates or with all other, or other selected, stereoisomers. The chiral centers of the present invention may have the S or R configuration as defined by the IUPAC 1974 Recommendations. The racemic forms can be resolved by physical methods, such as, for example, fractional crystallization, separation or crystallization of diastereomeric derivatives or separation by chiral column chromatography. The individual optical isomers can be obtained from the racemates by any suitable method, including without limitation, conventional methods, such as, for example, salt formation with an optically active acid followed by crystallization.
Compounds of the present invention are, subsequent to their preparation, preferably isolated and purified to obtain a composition containing an amount by weight equal to or greater  than 95% (e.g., “substantially pure” compound I) , which is then used or formulated as described herein. In certain embodiments, the compounds of the present invention are more than 99%pure.
All configurational isomers of the compounds of the present invention are contemplated, either in admixture or in pure or substantially pure form. The definition of compounds of the present invention embraces both cis (Z) and trans (E) alkene isomers, as well as cis and trans isomers of cyclic hydrocarbon or heterocyclic rings.
D-amino acids/L-amino acids
Amino acids contained within the peptides or polypeptides described herein will be understood to be in the L-or D-configuration.
II. EMBODIMENTS
The present invention provides novel compounds with novel linker compositions for linking various components of the compound. The compound conjugates an oligonucleotide with one or more targeting ligands. The oligonucleotide can be naturally occurring (isolated from nature, or synthesized in a laboratory) or chemically modified in at least one subunit.
In some embodiments, the oligonucleotide is chemically modified oligonucleotide. In some embodiments, chemically modified oligonucleotide comprises backbone modification (or internucleoside linkage modification, such as phosphate group modification) , ribose group modification, base modification.
In certain embodiments, the oligonucleotide has at least one phosphorothioate internucleoside linkage, or at least one methylphosphonate internucleoside linkage, or at least one other modified internucleoside linkage such as:
Figure PCTCN2022114893-appb-000049
In certain embodiments, the oligonucleotide has at least one chemically modified nucleotide with ribose modification. In certain embodiments, the 2′position of the modified ribose  moiety is replaced by a group selected from OR, R, halo, SH, SR, NH 2, NHR, NR 2, or CN, where each R is independently C 1-C 6 alkyl, alkenyl or alkynyl, and halo is F, Cl, Br or I. In some embodiments, the 2′position of the modified ribose moiety is replaced by a group selected from allyl, amino, azido, thio, O-allyl, O-C 1-C 10 alkyl, OCF 3, OCH 2F, O (CH2)  2SCH 3, O (CH 22-O- N (R m) (R n) , O-CH 2-C (=O) -N (R m) (R n) , or O-CH 2-C (=O) -N (R 1) - (CH 22-N (R m) (R n) , where each R l, R m and R n is, independently, H or substituted or unsubstituted C 1-C 10 alkyl. In some embodiments, the modified ribose moiety is selected from the group of 5’-vinyl, 5’-methyl (R or S) , 4’-S, 2’-F, 2’-OCH 3, 2’-OCH 2CH 3, 2’-OCH 2CH 2F and 2’-O (CH2)  2OCH 3 substituent groups. In some embodiments, the modified ribose moiety is substituted by bicyclic sugar selected from the group of 4′- (CH 2) -O-2′ (LNA) ; 4′- (CH 2) -S-2; 4′- (CH 2) 2-O-2′ (ENA) ; 4′-CH (CH 3) -O-2′ (cEt) and 4′- CH (CH 2OCH 3) -O-2′, 4′-C (CH 3) (CH 3) -O-2′, 4′-CH 2-N (OCH 3) -2′, 4′-CH 2-O-N (CH 3) -2′, 4′-CH 2-N (R) -O-2′, where R is H, C1-C12 alkyl, or a protecting group, 4′-CH 2-C (H) (CH 3) -2′, and 4′-CH 2-C- (═CH 2) -2′. In some embodiments, the modified sugar moiety is selected from the group of 2’-O-methoxyethyl modified sugar (MOE) , a 4′- (CH 2) -O-2′bicyclic sugar (LNA) , 2’-deoxy-2’-fluoroarabinose (FANA) , and a methyl (methyleneoxy) (4′-CH (CH 3) -O-2) bicyclic sugar (cEt) . In certain embodiments, the oligonucleotide has a chemically modified nucleotide selected from the group consisting, 2'-methoxyethyl, 2'-OCH 3 and 2'-fluoro.
In certain embodiments, the oligonucleotide has at least one chemically modified nucleobase. In certain embodiments, at least one chemically modified nucleobase is selected from the group of: 5-methylcytosine (5-Me-C) , inosine base, a tritylated base, 5-hydroxymethyl cytosine, xanthine, hypoxanthine, 2-aminoadenine, 6-methyl and other alkyl derivatives of adenine and guanine, 2-propyl and other alkyl derivatives of adenine and guanine, 2-thiouracil, 2-thiothymine and 2-thiocytosine, 5-halouracil and cytosine, 5-propynyl (-C≡C-CH 3) uracil and cytosine and other alkynyl derivatives of pyrimidine bases, 6-azo uracil, cytosine and thymine, 5-uracil (pseudouracil) , 4-thiouracil, 8-halo, 8-amino, 8-thiol, 8-thioalkyl, 8-hydroxyl and other 8-substituted adenines and guanines, 5-halo particularly 5-bromo, 5-trifluoromethyl and other 5-substituted uracils and cytosines, 7-methylguanine and 7-methyladenine, 2-F-adenine, 2-aminoadenine, 8-azaguanine and 8-azaadenine, and 7-deazaguanine and 7-deazaadenine and 3-deazaguanine and 3-deazaadenine. In certain embodiment, the modified nucleobase in the molecule of the invention is a 5-methylcytosine. In certain embodiments, the modified nucleobase is a 5-methyluracil.
Any stabilizing modification known to a person skilled in the art can be used to improve the stability of the oligonucleotide molecules. Within the oligonucleotide molecules, chemical  modifications can be introduced to the phosphate backbone (e.g., phosphorothioate linkages) , the sugar (e.g., locked nucleic acids, glycerol nucleic acid, cEt, 2’-MOE, 2’-fluorouridine, 2’-O-methyl) , and/or the base (e.g., 2’-fluoropyrimidines) .
The oligonucleotide can be conjugated to the rest of the compound, or the “backbone” at the 5’ and/or 3’ end of the oligonucleotide. The conjugated oligonucleotide can be delivered as a single strand or hybridized to a substantially complementary oligonucleotide as part of a duplex. The substantially complementary oligonucleotide can be similarly conjugated or not.
In an embodiment, the conjugated oligonucleotide forms part of a siRNA duplex (either the sense or antisense strand, or both) . In a preferred embodiment, the conjugated oligonucleotide forms part of an aiRNA duplex (either the sense or antisense strand, or both) . In another embodiment, the oligonucleotide that is conjugated according to principles of the invention is used as an antisense oligonucleotide (ASO) . In yet another embodiment, the oligonucleotide that is conjugated according to principles of the invention is used as a micro-RNA (miRNA) molecule. Some exemplary embodiments of the conjugated oligonucleotide as shown in FIG. 1. For duplex RNA molecule, preferably, the oligonucleotide can be conjugated to the rest of the compound, or the “backbone” at the 3’ end of the sense strand.
Embodiment 1
In a first feature, an oligonucleotide is conjugated to a backbone containing multiple components including a sequential motif along the backbone of more than one ligand (e.g., GalNAc) , e.g., 2-8 and preferably 3, directly or through one or more intermediate linkers, at an attachment point that provide by a residue derived from a histidine residue.
In one embodiment, the compound of the present invention has the structural formula as shown in (S-H1) , (S-H2) , (S-H1-01) ) to (S-H1-16) and (S-H2-01) to (S-H2-04) .
In one embodiment, the compound of the present invention has the structure as shown in Table 6.
In one embodiment, optionally, the configuration of the compound is R isomer, S isomer or its mixture. In one embodiment, the configuration of the compound is a mixture of R isomer and S isomer. In a preferably embodiment, the configuration of the compound is R isomer. In one embodiment, the configuration of the compound means the isomer of the chiral carbon atom shown in the structural formula S-H1-01.
In the compound of the present invention, the naturally occurring or chemically modified oligonucleotide is linked to the rest of the compound through its 5’ end and/or its 3’ end.
Embodiment 2
In a second feature, an oligonucleotide is conjugated to a backbone containing multiple components including a sequential motif along the backbone of more than one ligand (e.g., GalNAc) , e.g., 2-8 and preferably 3, directly or through one or more intermediate linkers, at an attachment point that provide by a moiety derived from a glutamic acid residue.
In one embodiment, the compound of the present invention has the structural formula as shown in (S-G1) , (S-G2) , (S-G1-01) ) to (S-G1-16) and (S-G2-01) to (S-G2-04) .
In one embodiment, the compound of the present invention has the structure as shown in Table 6.
In one embodiment, optionally, the configuration of the compound is R isomer, S isomer or racemate. In one embodiment, the configuration of the compound is a mixture of R isomer and S isomer. In a preferably embodiment, the configuration of the compound is R isomer. In one embodiment, the configuration of the compound means the isomer of the chiral carbon atom shown in the structural formula S-G1-01.
In the compound of the present invention, the naturally occurring or chemically modified oligonucleotide is linked to the rest of the compound through its 5’ end and/or its 3’ end.
Table 6
Figure PCTCN2022114893-appb-000050
Figure PCTCN2022114893-appb-000051
Figure PCTCN2022114893-appb-000052
Figure PCTCN2022114893-appb-000053
Figure PCTCN2022114893-appb-000054
Figure PCTCN2022114893-appb-000055
Figure PCTCN2022114893-appb-000056
Figure PCTCN2022114893-appb-000057
III. EXAMPLES
Synthesis
In some embodiments, the compound shown in formula (S-H1) , (S-H1-01) ) to (S-H1-16) , (S-G1) , (S-G1-01) ) to (S-G1-16) , with an oligonucleotide conjugated to a backbone containing multiple components including a sequential motif along the backbone of more than one ligand (e.g.,  GalNAc) , e.g., 2-8, are synthesized by a sequence backbone comprising three or more reactive moieties reacting with ligands and oligonucleotides.
Figure PCTCN2022114893-appb-000058
Example 1 Synthesis of G-12 (Glu (R) -Sequential GalNAc)
Synthesis of G-12 (Glu (R) -Sequential GalNAc) was shown as below 4 Steps:
Step 1: The synthesis route of compound M-3
Figure PCTCN2022114893-appb-000059
Synthesis of Compound M-2
Under nitrogen atmosphere, 20 g M-1 ( (R) -3-hydroxy-methyl butyrate) was dissolved in 200 mL DCM, 18 g imidazole was added, and 56.2 g TBDPSCl was dropped. The reaction was performed for 2 h at room temperature after dropping completed. TLC was used to monitor the reaction complete. 200 mL saturated ammonium chloride was added to quench, DCM layer was separated, washed once with saturated sodium chloride, dried over anhydrous sodium sulfate, concentrated and dried to obtain 73 g of M-2 crude product. MS (ESI) m/z 357.10 ( [M+H]  +) .
Synthesis of Compound M-3
13.6 g sodium hydroxide was dissolved in 80 mL water to preparation aqueous solution of sodium hydroxide, and 73 g M-2 crude product was dissolved in 500 mL methanol, then the aqueous solution of sodium hydroxide was added. After stirring at 35 ℃ for 15 h, TLC was used to monitor the reaction complete. Methanol was removed by concentration at 40 ℃, 500 mL ethyl acetate was added, and the PH was adjusted to 3 with 2 M HCl. EA layer was separated, washed with saturated sodium chloride, dried over anhydrous sodium sulfate, concentrated, purified by silica gel column chromatography (PE: EA=50: 1-10: 1) , and 47.8 g of M-3 was obtained from the concentrated product. MS (ESI) m/z 341.10 ( [M-H]  -) .  1H-NMR (400MHz, CDCl 3) δ7.66-7.69 (m, 4H) , 7.35-7.45 (m, 6H) , 4.23-4.30 (m, 1H) , 2.43-2.56 (m, 2H) , 1.14 (d, 3H) , 8.77 (s, 9H) .
Step 2: The synthesis route of compound N-4
Figure PCTCN2022114893-appb-000060
Compound N-3 (5-hydroxy-amylamine) (15.0 g) was dissolved in 150 mL water, 36.6 g of NaHCO 3 was added, and 33.5 g of CbzCl was dropped under an ice bath, and stirred at room temperature for 3 h after dropping. TLC was used to monitor the reaction complete. 100 mL water was added to the reaction solution, extracted with EA 200 mL, washed with saturated sodium chloride solution once, dried over anhydrous sodium sulfate, and separated by silica gel column chromatography (DCM: MeOH=30: 1) after concentration. The product components were collected and concentrated to a white solid (23.5 g) . ESI-MS m/z: [M+H]  +=238.16.
Step 3: The synthesis route of compound S-07
Figure PCTCN2022114893-appb-000061
Synthesis of compound S-02
250 g of compound S-01 (N-acetylgalactosamine) was dissolved in 2000 mL DCM, and TMSOTf (157.5 g) was added dropwise. After dropping, the reaction was performed at 40 ℃ for 6 h  under nitrogen atmosphere, and TLC was used to monitor the reaction complete. Adjusted the pH to 8-9 with saturated sodium bicarbonate, extracted and separated organic phase, washed with saturated sodium chloride solution once, dried over anhydrous sodium sulfate, filtered, and concentrated under reduced pressure to provide 211 g yellow transparent oily substance. ESI-MS M/Z: [M +H]  + = 330.12.
Synthesis of compound S-06
25.2 g of compound S-02 was dissolved in 200 mL DCM, 20.0 g of compound N-4 was added, TMSOTf 6.93 g was added dropwise, and after dropping the reaction was performed at room temperature overnight. TLC was used to monitor the reaction complete. 100 mL saturated sodium bicarbonate solution was added to the reaction mixture, the organic phase was separated, washed with saturated sodium chloride solution once, dried over anhydrous sodium sulfate, and concentrated under reduced pressure, purify by silica gel column chromatography (DCM: MeOH=100: 1-50: 1) . The product components were collected and concentrated under reduced pressure to provide 28.9 g of compound S-06. ESI-MS m/z: [M +H]  + = 567.21.
Synthesis of compound S-07
16.5 g of compound S-06 was dissolved in 150 mL MeOH, 1.65 g Pd/C was added, and the reaction was performed at room temperature for 4 h after replaced air with hydrogen for three times. TLC was used to monitor the reaction complete. The reaction mixture was filtrated under vacuum and concentrated under reduced pressure to obtain 12.5 g of white foamy solid. ESI-MS m/z: [M + H]  + =433.21.
Step 4: The synthesis route of compound G-12
Figure PCTCN2022114893-appb-000062
Figure PCTCN2022114893-appb-000063
Synthesis of compound G-2
50 g of compound G-1 ( (S) -N-Boc-glutamic acid methyl ester) was dissolved in 500 mL of THF, 25.2 mL of NMM was introduced by dripping in an ice-water bath, and 26.6 mL of isobutyl chloroformate was introduced by dripping after stirring for 5 minutes. Stirred for 1 hour sequentially after the dropping was completed. Suction filtration was taken, the filtrate was collected, and 8.73 g of NaBH 4 was added to the filtrate under an ice-water bath. After the addition was completed, the reaction was continued for 2 hours, sample was taken to monitor the reaction completed by TLC, 250 mL of water was added and 500 mL of EA were added for extraction. The organic phase was washed with saturated sodium chloride solution, dried over anhydrous sodium sulfate, and concentrated to obtain 45.35 g of oily product G-2. MS (ESI) m/z 248.19 ( [M+H]  +) .
Synthesis of compound G-3
45.35 g of compound G-2 was dissolved in 500 mL of DCM, 31.2 g of imidazole was added, and 91.1 g of TBDPSCl was introduced by dripping. After the dropping was completed, the mixture was stirred at room temperature for 2 h, and the reaction completed was monitored by TLC. 150 mL of water was added to the reaction liquid, and the DCM layer was extracted and separated, washed once with saturated sodium chloride solution, dried over anhydrous sodium sulfate, and concentrated to obtain an oily product. Purified by silica gel column chromatography, gradient eluted with PE: EA=40: 1-10: 1, and concentrated to obtain 36.7 g of colorless transparent oily product G-3. MS (ESI) m/z 486.66 ( [M+H]  +) .
Synthesis of compound G-4
46.15 g of compound G-3 was dissolved in 500 mL of DCM, and 70 mL of TFA (trifluoroacetic Acid) was introduced by dripping in an ice-water bath. After the dropping was completed, reaction was stirred at room temperature for reaction 4 hours. The reaction completed was monitored by TLC, concentrated under reduced pressure, 500 mL of DCM was introduced by dripping to the remains, saturated sodium bicarbonate solution was added by dripping to adjust pH to 8, the DCM layer was extracted and separated, washed once with saturated sodium chloride solution, dried over anhydrous sodium sulfate, and concentrated to dryness to obtain 36.7 g of light-yellow oil G-4. MS (ESI) m/z 386.51 ( [M+H]  +) .
Synthesis of compound G-5
31.9 g of compound M-3 was dissolved in 300 mL DMF, 42 g HBTU and 23 mL DIEA were added, stirred at room temperature for 10 minutes, then 35 g of compound G-4 was added, moved to room temperature and stirred for 1 hour. TLC was used to monitor the reaction complete. The reaction solution was extracted with 600 mL saturated sodium bicarbonate and 400 mL EA. The EA layer was separated and washed with saturated salt water, dried over anhydrous sodium sulfate, and concentrated under reduced pressure to obtain an oil. Crude residue was purified by column chromatography (PE: EA=20: 1 -8: 1) to produce white solid product G-5 (41 g) . MS (ESI) , m/z 710.33 ( [M + H]  +) .
Synthesis of compound G-6
33.3 g of compound G-5 was added to a mixture of 100 mL MeOH, 100 mL THF and 100 mL water, and 5.92 g lithium hydroxide monohydrate was added, and reacted at room temperature for 8 hours. Reaction was monitor by TLC, the reaction mixture was concentrated under reduced pressure, then 400 mL ethyl acetate was added to the concentrated remains, adjusted the pH to 4-5 using dilute hydrochloric acid solution, extracted and separated organic phase, washed with saturated sodium chloride solution once, dried over anhydrous sodium sulfate, concentrated under reduced pressure,  33.8 g of colorless transparent oil product G-6 was obtained. MS (ESI) m/z: 694.35 ( [M+H]  +) .
Synthesis of compound G-7
18.3 g of compound G-6 was dissolved in 150 mL DMF, and 13.0 g HBTU and 6.52 mL DIEA were added. After stirring at room temperature for 15 min, a solution of 11.4 g compound S-07 in 100 mL DMF was added dropwise. After dropping, moved to room temperature and stirred for 1 h. TLC was used to monitor the reaction complete. 400 mL saturated sodium bicarbonate was added to the reaction solution, and extracted with 200 mL EA. The organic phase was washed with saturated sodium chloride solution, dried over anhydrous sodium sulfate and concentrated under reduced pressure to provide an oil product. Crude residue was purified by column chromatography (PE: EA=1: 1-1: 3) to produce a white solid (18.9 g) . MS (ESI) , m/z: 1110.5 ( [M + H]  +) .
Synthesis of compound G-8
18.6 g of compound G-7 was dissolved in 150 mL THF, and 50.3 mL of 1.0 M TBAF was added to react at room temperature overnight. TLC was used to monitor the reaction complete, the reaction was concentrated under reduced pressure, and purified by column chromatography (DCM: MeOH=50: 1-15: 1) , product components were collected, concentrated and dried to obtain 7.5g of white solid. MS (ESI) , m/z: 634.35 ( [M + H]  +) .
Synthesis of compound G-9
5.91 g of compound G-8 was dissolved in 60 mL anhydrous pyridine, and 6.01 g of DMTrCl was added, reacted at room temperature for 30 min. TLC was used to monitor the reaction complete. The reation was quenched with 10 mL methanol and concentrated under reduced pressure. Purified by column chromatography (DCM: MeOH=100: 1-50: 1) . The product components were collected and condensed to obtain 5.07 g of dry white solid. MS (ESI) , m/z: 634.44 ( [M -302 + H]  +) .
Synthesis of compound G-10
3.00 g of compound G-9 was dissolved in 30 mL anhydrous acetonitrile, 2.04 mL 2-cyanoethyl-N, N, N', N'-tetraisopropyl phosphate-diamine (CTPPA) and 9 mL of 0.5 M tetrazole-acetonitrile solution were added, and reacted at room temperature for 2 h under nitrogen atmosphere. The reaction was monitored by UPLC-MS. After decompression concentration, 50 mL DCM was added to dissolve, 30 mL water was added, DCM layer was extracted and separated. The organic phase was washed with saturated sodium chloride solution, dried over anhydrous sodium sulfate and concentrated under reduced pressure to provide 4.74 g of oil product. Purified by column chromatography, 1.3 g of white solid was obtained.  1H NMR (400 MHz, DMSO) δ 7.85-7.74 (m, 2H) , 7.72-7.62 (m, 1H) , 7.41-7.35 (m, 2H) , 7.33-7.27 (m, 2H) , 7.26-7.18 (m, 5H) , 6.88 (dd, 4H) ,  5.22 (d, 1H) , 4.97 (dd, 1H) , 4.49 (d, 1H) , 4.31-4.18 (m, 1H) , 4.06-3.98 (m, 3H) , 3.94-3.82 (m, 2H) , 3.74 (s, 6H) , 3.72-3.65 (m, 2H) , 3.65-3.48 (m, 3H) , 3.44-3.37 (m, 1H) , 3.04-2.94 (m, 2H) , 2.91-2.81 (m, 2H) , 2.77-2.69 (m, 1H) , 2.64-2.58 (m, 1H) , 2.36-2.19 (m, 2H) , 2.10 (s, 3H) , 2.06-1.95 (m, 5H) , 1.90 (s, 3H) , 1.77 (s, 3H) , 1.64-1.54 (m, 1H) , 1.51-1.42 (m, 2H) , 1.40-1.32 (m, 2H) , 1.29-1.22 (m, 3H) , 1.20-1.08 (m, 14H) , 1.06-1.01 (m, 1H) .  31P-NMR (d6-DMSO) : 145.79; ESI-MS m/z: [M+Na]  +=1158.56
Synthesis of compound G-11
700 mg of compound G-9 was dissolved in 7 mL anhydrous pyridine, 10 mg DMAP and 749 mg succinic anhydride were added and reacted at room temperature for 24 h under nitrogen atmosphere. After the reaction was complete, as monitored by LC-MS, the reaction mixture was concentrated under reduced pressure into an oily substance. Purified by silica gel column chromatography (DCM: MeOH=100: 1-20: 1) . The product components were collected and concentrated under reduced pressure to provide 0.74 g compound G-11.  1H NMR (400 MHz, CDCl 3) δ 7.5-7.25 (m, 8H) , 6.85-6.70 (m, 5H) , 5.34-5.25 (m, 2H) , 4.69-4.67 (m, 1H) , 4.13-4.11 (m, 3H) , 3.80 (s, 6H) , 3.51-3.45 (m, 1H) , 2.93-2.87 (m, 7H) , 2.03-1.97 (m, 10H) , 1.32-1.28 (m, 8H) , 1.24-1.21 (m, 12H) , 0.91-0.85 (m, 3H) , 0.09-0.02 (m, 4H) . MS (ESI) m/z: 734.45 ( [ (M-302) +H]  +) .
Synthesis of compound G-12
Compound G-11 (209 mg) , LCAA -CPG (96 μmol/g, 1.4 g) , HATU (86.8 mg) and DIEA (52.0 mg) were added into a 50 mL centrifuge tube, and the mixture was dissolved by 10 mL anhydrite acetonitrile, then placed in a shaker to shake overnight. The reaction mixture was filtered, washed with acetonitrile, and dried by suction filtration. The carrier was poured into a 50 mL centrifuge tube, 5 mL CapA (20%NMI-80%ACN) and 5 mL CapB (20%AC 2O-30%lutidine-50%ACN) were added, respectively. After shaked for 2 h at room temperature, Reaction mixture was filtered, washed with acetonitrile, and dried under vacuum overnight to obtain 1.32 g of compound G-12 with 62 μmol/g loading.
Example 2 Synthesis of H-17 (His (R) -sequential-GalNAc)
Synthesis of H-17 (His (R) -sequential-GalNAc) was show below (4 steps) :
Step 1: The synthesis route of compound S-05
Figure PCTCN2022114893-appb-000064
Under nitrogen atmosphere, 800 mL DCM and 57 g 5-bromo-1-pentanol were added to 120 g compound S-02 crude product. 28.5 mL TMSOTf was added dropwise to the reaction solution. After dropping and the reaction solution was stirred overnight at 25℃. Samples were obtained, and were used to monitor the reaction complete by TLC. The reaction was quenched with 1 L saturated sodium bicarbonate, and the DCM layer was separated, washed once with saturated sodium chloride, dried over anhydrous sodium sulfate, concentrated, purified by silica gel column chromatography with gradient elution (DCM: EA=10: 1-2: 1) . The product eluent was collected, concentrated and dried to obtain 98 g compound S-05. MS (ESI) m/z 497.07, 498.00 ( [M+H]  +) .  1H-NMR (400MHz, CDCl 3) δ 5.43 (d, 1H) , 5.36 (d, 1H) , 5.31 (dd, 1H) , 4.72 (d, 1H) , 4.10-4.20 (m, 2H) , 3.89-3.97 (m, 3H) , 3.47-3.52 (m, 1H) , 3.41 (t, 2H) , 2.15 (s, 3H) , 2.05 (s, 3H) , 2.01 (s, 3H) , 1.97 (s, 3H) , 1.84-1.91 (m, 2H) , 1.59-1.65 (m, 2H) , 1.47-1.54 (m, 2H) .
Step 2: The synthesis route of compound M-3
See compound M-3 synthesis of G-12 (Glu (R) -Sequential GalNAc) synthesis route for the synthesis method.
Step 3: The synthesis route of compound H-05
Figure PCTCN2022114893-appb-000065
Synthesis of compound H-02
38.4 g sodium hydroxide was dissolved in 400 mL water, and 400 mL THF was added. The mixture was cooled in ice water bath, 50 g H-01 (L-Histidine) was added to it and dissolved by stirring. 175 g di-tert-butyl dicarbonate was added and stirred at room temperature for 4 h. After the reaction was complete monitored by TLC, the reaction mixture was filtrated under reduced pressure and concentrated. 200 mL MTBE was added to the concentrated residue for washing and extraction for 3 times. The water layer was separated, 500 mL ethyl acetate was added, the pH was adjusted to 2-4 with 3 M hydrochloric acid. The EA layer was separated, washed with saturated sodium chloride, dried over anhydrous sodium sulfate, filtered, and the filtrate was concentrated and dried to obtain 98 g white solid. MS (ESI) m/z 356.25 ( [M+H]  +) .
Synthesis of compound H-03
110 g compound H-02 was dissolved in 880 mL anhydrous THF under nitrogen atmosphere. Cooled to 0-5℃ in ice bath, and 1.1 L borane tetrahydrofuran solution (1 M) was dropped slowly to reaction solution, stirred at room temperature for 1 h. The reaction was completely monitored by TLC. After temperature of the reaction mixture was cooled to 0-10℃ in ice bath, the reaction was quenched by 230 mL methanol with added dropwise. THF was concentrated, 800 mL l ethyl acetate and 300 mL saturated sodium chloride solution were added to the residue to extract, and the organic phase dried over anhydrous sodium sulfate, filtered, and the filtrate was concentrated and dried to obtain 106 g compound H-03 crude product. MS (ESI) m/z 342.40 ( [M+H]  +) ,  1H-NMR (400MHz, DMSO-d6) δ 8.69 (s, 1H) , 7.37 (s, 1H) , 6.68 (d, 1H) , 4.82 (s, 1H) , 3.68-3.82 (m, 1H) , 3.29-3.43 (m, 2H) , 2.89 (dd, 1H) , 2.54 (d, 1H) , 1.57 (s, 9H) , 1.34 (s, 9H) .
Synthesis of compound H-04
106 g compound H-03 was dissolved in 1 L dichloromethane, 38 g imidazole was added, 128 g TBDPSCl was added dropwise into the reaction solution. After dropping, the reaction was reacted at room temperature for 1 h. TLC was used to monitor the reaction complete. 400 mL saturated sodium chloride was added to the reaction solution, and DCM layer was extracted, washed with saturated sodium chloride, dried over sodium sulfate, concentrated, purified by silica gel column chromatography with gradient elution, (petroleum ether: ethyl acetate =100: 1-20: 1) . The product eluent was collected, condensed and dried to obtain 106 g white solid.  1H-NMR (400MHz, DMSO-d6) δ 8.71 (s, 1H) , 7.63-7.65 (m, 4H) , 7.41-7.48 (m, 6H) , 6.85 (d, 1H) , 3.91-4.02 (m, 1H) , 3.61 (d, 2H) , 3.04 (dd, 1H) , 2.57-2.63 (m, 1H) , 1.58 (s, 9H) , 1.35 (s, 9H) , 1.01 (s, 9H) .
Synthesis of compound H-05
80 g compound H-04 was dissolved in 240 mL glacial acetic acid and stirred overnight at 80℃. After the reaction was complete monitored by TLC, the mixture was cooled in ice water bath, then 400 mL ethyl acetate was added and 4 M sodium hydroxide was added dropwise to adjust the pH to 8-9. Organic phase was separated, and washed once with saturated sodium chloride, dried over anhydrous sodium sulfate, condense and dried to obtain 66 g white solid. MS (ESI) m/z 480.27 ( [M+H]  +) .
Step 4: The synthesis route of compound H-17
Figure PCTCN2022114893-appb-000066
Figure PCTCN2022114893-appb-000067
Synthesis of compound H-10
Under the nitrogen atmosphere, 58 g compound S-05 was dissolved in 300 mL anhydrous DMF, and 98.6 g anhydrous cesium carbonate was added. 78 g compound H-05 in DMF (200 mL) was added dropwise to the solution. After dropping, stirred at room temperature for 1 h. After the reaction was complete monitored by UPLC-MS, the reaction mixture was filtrated under reduced pressure, and the filter cake was washed with 400 mL EA, then 1.2L saturated ammonium chloride was added into the filtrate, and EA layer was extracted and separated, washed with saturated sodium chloride, dried over anhydrous sodium sulfate, concentrated, purified by silica gel column chromatography with gradient elution (DCM: MeOH=80: 1-20: 1) . The product eluent was collected, concentrated and dried to obtain 62.74 g compound H-10. MS (ESI) m/z 895.53 ( [M+H]  +) .
1H-NMR (400MHz, CDCl 3) δ7.62-7.66 (m, 4H) , 7.44 (s, 1H) , 7.36-7.42 (m, 6H) , 6.58 (s, 1H) , 5.95 (d, 1H) , 5.35-5.39 (m, 2H) , 5.22 (d, 1H) , 4.79 (d, 1H) , 4.12-4.19 (m, 2H) , 3.89-3.93 (m, 2H) , 3.80-3.85 (m, 2H) , 3.65-3.69 (m, 2H) , 3.39-3.45 (m, 1H) , 2.83-2.87 (m, 2H) , 2.13 (s, 3H) , 2.04 (s, 3H) , 1.99 (s, 3H) , 1.90 (s, 3H) , 1.68-1.76 (m, 2H) , 1.54-1.62 (m, 2H) , 1.41 (s, 9H) , 1.26-1.32 (m, 2H) , 1.07 (s, 9H) .
Synthesis of compound H-11
62 g compound H-10 was dissolved in 600 mL DCM, solution was cooled to 0-10 ℃ in an ice bath, and 103 mL TFA was dropped into the reaction solution. After dropping, stirred for 2 hours at room temperature. After the reaction was complete monitored by UPLC-MS, trifluoroacetic acid was removed, and 500 mL DCM was added to the residue, then the pH was adjusted to 8-9 with saturated sodium bicarbonate. The DCM layer was extracted, separated, and washed with saturated sodium chloride, dried over anhydrous sodium sulfate, concentrate and dried to 58 g compound H-11. MS (ESI) m/z 795.50 ( [M+H]  +) .
Synthesis of compound H-12
13 g compound M-3 was dissolved in 150 mL DMF, 8.23 mL DIEA and 15.53 g HBTU were added. After stirred at room temperature for 30 min, 25 g compound H-11 dissolved in 100 mL DMF was added dropwise to the solution. The reaction mixture reacted at room temperature for 2 hours and TLC was taken to monitor the reaction complete. 300 mL EA and 600 mL 10%ammonium chloride were added into the reaction solution, and the organic phase was separated, washed once with saturated sodium chloride, dried over anhydrous sodium sulfate, concentrated, purified by silica gel column chromatography with gradient elution (DCM: MeOH=100: 1-30: 1) . The product eluent was collected, concentrated and dried to obtain 19g compound H-12.MS (ESI) m/z 1119.69 ( [M+H]  +) .
Synthesis of compound H-13
22 g compound H-12 was dissolved in 200 mL anhydrous THF, 59 mL TBAF (1 M THF solution) was added, and stirred at room temperature for 23 h to complete the reaction. The mixture was concentrated, and purified by silica gel column chromatography with gradient elution (DCM: MeOH=20: 1-8: 1) . The product eluent was collected, concentrated and dried to obtain 10 g compound H-13. MS (ESI) m/z 643.42 ( [M+H]  +) .
Synthesis of compound H-14
Under the nitrogen atmosphere, 10 g compound H-13 was dissolved in 110 mL anhydrous Pyridine, and 10.6 g DMTrCl was added. After stirred at room temperature for 20 min, the starting materials have been completely consumed, as detected by UPLC-MS. The reaction solution was quenched with methanol (40 mL) , concentrated, and purified with silica gel column chromatography with gradient elution (DCM: MeOH=100: 1-50: 1) . The product eluent was collected, concentrated and dried to obtain 9.3 g compound H-14. MS (ESI) m/z 945.56 ( [M+H]  +) .
Synthesis of compound H-15
Under the nitrogen atmosphere, 3 g compound H-14 was dissolved in 40 mL anhydrous acetonitrile, then 2 g CTPPA and 0.5 M tetrazolazol-acetonitrile (6.4 mL) solution was added,  stirred at room temperature for 1.5 h, and samples was obtained to monitor the reaction complete by UPLC-MS. After acetonitrile was concentrated, the obtained residue was extracted with 50 mL DCM and 30 mL water, then the DCM layer was extracted and separated, and washed with saturated sodium chloride once, dried over anhydrous sodium sulfate, concentrated and dried to obtain compound H-15 crude product. 1.5 g white solid compound H-15 was obtained by purified the crude product through column chromatography.
1H-NMR (400MHz, DMSO-d6) δ8.04 (t, 1H) , 7.80 (d, 1H) , 7.47 (s, 1H) , 7.15-7.42 (m, 9H) , 6.80-6.94 (m, 4H) , 6.66 (s, 1H) , 5.75 (s, 1H) , 5.22 (d, 1H) , 4.96 (dd, 1H) , 4.72-4.86 (m, 1H) , 4.48 (d, 1H) , 4.06-4.24 (m, 3H) , 4.02 (s, 3H) , 3.83-3.93 (m, 2H) , 3.77-3.83 (m, 2H) , 3.73 (s, 6H) , 3.64-3.71 (m, 1H) , 3.37-3.53 (m, 3H) , 2.87-2.95 (m, 2H) , 2.81-2.87 (m, 1H) , 2.76 (dd, 1H) , 2.53-2.66 (m, 2H) , 2.38 (dd, 1H) , 2.10 (s, 3H) , 2.01-2.08 (m, 1H) , 1.98 (s, 3H) , 1.89 (s, 3H) , 1.76 (s, 3H) , 1.57-1.62 (m, 2H) , 1.44-1.51 (m, 2H) , 1.28 (d, 3H) , 1.14-1.22 (d, 12H) . ESI-MS (ESI) m/z 1167.54 ( [M+Na]  +) .
31P-NMR (d6-DMSO) : 147.50;
Synthesis of compound H-16
Under the nitrogen atmosphere, 1.5 g compound H-14 was dissolved in 15 mL anhydrous pyridine, DMAP (20 mg) and 1.58 g succinic anhydride were added. After 25 h reaction at room temperature, UPLC-MS was used to monitor the reaction complete. Pyridine was removed by concentration, and the residue was purified by silica gel column chromatography with gradient elution (DCM: MeOH=40: 1-20: 1) . Part of the collected products were concentrated and dried to obtain 1.37 g compound H-16. MS (ESI) m/z 1045.57 ( [M+H]  +) .  1H-NMR (400MHz, DMSO-d6) δ7.96 (d, 1H) , 7.88 (d, 1H) , 7.44 (s, 1H) , 7.34-7.41 (m, 2H) , 7.18-7.31 (m, 7H) , 6.82-6.89 (m, 4H) , 6.64 (s, 1H) , 5.22 (d, 1H) , 5.04-5.09 (m, 1H) , 4.97 (dd, 1H) , 4.50 (d, 1H) , 4.11-4.23 (m, 1H) , 4.02 (s, 3H) , 3.83-3.93 (m, 2H) , 3.79 (t, 2H) , 3.73 (s, 6H) , 3.65-3.72 (m, 2H) , 3.36-3.42 (m, 2H) , 2.90-2.94 (m, 1H) , 2.82-2.85 (m, 1H) , 2.72-2.79 (dd, 1H) , 2.56-2.61 (dd, 1H) , 2.35-2.45 (dd, 2H) , 2.27-2.32 (dd, 2H) , 2.10 (s, 3H) , 1.98 (s, 3H) , 1.89 (s, 3H) , 1.76 (s, 3H) , 1.56-1.64 (m, 2H) , 1.43-1.50 (m, 2H) , 1.12-1.20 (m, 2H) , 1.13 (d, 3H) .
Synthesis of compound H-17
180 mg compound H-16 was dissolved in 10 mL acetonitrile, then 75 mg HATU and 42 mg DIEA were added, and the mixture was shaken in a shaker for 10 min. LCAA-CPG- (96 μmol/g) was added to the mixture, and reacted at room temperature overnight in a shaker. The reaction solution was filtered, washed with acetonitrile, the filter cake was dried under vacuum and poured into a 50 mL centrifuge tube, then 5 mL Cap A (20%NMI-80%ACN) and 5 mL Cap B (20%AC 2O-30%lutidine-50%ACN) were added to the centrifuge tube. After mixture was shaken  for 2 h, the solvent was removed by filter, washed with acetonitrile, dried under vacuum for 2 h at room temperature to obtain 1.17 g compound H-17 with 47 μmol/g loading.
Example 3 Synthesis of H-23 (His (S) -sequential-GalNAc)
Synthesis of H-23 (His (S) -sequential-GalNAc) was show below (2 steps) :
Step 1: The synthesis route of compound M-6
Figure PCTCN2022114893-appb-000068
Synthesis of compound M-6
Methyl (R) -3-hydroxybutanoate was replaced with methyl (S) -3-hydroxybutanoate. See M-3 synthesis in G-12 (Glu (R) -Sequential GalNAc) for the synthesis method.
Step 2: The synthesis route of compound H-23
Figure PCTCN2022114893-appb-000069
Synthesis of compound H-18
See compound H-12 synthesis in H-17 (His (R) -sequential-GalNAc) synthesis route for the synthesis method. MS (ESI) m/z 1119.72 ( [M+H]  +) .
Synthesis of compound H-19
See compound H-13 synthesis in H-17 (His (R) -sequential-GalNAc) synthesis route for the synthesis method. MS (ESI) m/z 643.46 ( [M+H]  +) .
Synthesis of compound H-20
For synthesis method, see compound H-14 synthesis in H-17 (His (R) -sequential-GalNAc) synthesis route. MS (ESI) m/z 945.62 ( [M+H]  +) .
Synthesis of compound H-21
See compound H-15 synthesis in H-17 (His (R) -sequential-GalNAc) synthesis route for the synthesis method. Due to the special chemical properties of H-15, it exhibits characteristic structural fragment peaks in mass spectrometry which is MS (ESI) m/z 1062.43 ( [M- (i-Pr)  2N+H 2O ]  +) .  1H-NMR (400MHz, DMSO-d6) δ7.92 (t, 1H) , 7.73 (d, 1H) , 7.36 (s, 1H) , 7.05-7.33 (m, 9H) , 6.72-6.84 (m, 4H) , 6.55 (s, 1H) , 5.63 (s, 1H) , 5.16 (d, 1H) , 4.83 (dd, 1H) , 4.62-4.73 (m, 1H) , 4.36 (d, 1H) , 3.08-4.14 (m, 3H) , 3.91 (s, 3H) , 3.73-3.80 (m, 2H) , 3.63-3.73 (m, 2H) , 3.63 (s, 6H) , 3.54-3.66 (m, 1H) , 3.27-3.43 (m, 3H) , 2.77-2.85 (m, 2H) , 2.71-2.75 (m, 1H) , 2.66 (dd, 1H) , 2.43-2.58 (m, 2H) , 2.29 (dd, 1H) , 2.10 (s, 3H) , 2.01-2.07 (m, 1H) , 1.91 (s, 3H) , 1.86 (s, 3H) , 1.71 (s, 3H) , 1.47-1.58 (m, 2H) , 1.39-1.48 (m, 2H) , 1.26 (d, 3H) , 1.08-1.1.20 (d, 12H) .
Synthesis of compound H-22
For synthesis method, see compound H-16 synthesis in H-17 (His (R) -sequential-GalNAc) synthesis route.
MS (ESI) m/z 1045.66 ( [M+H]  +) .  1H-NMR (400MHz, DMSO-d6) δ7.96 (d, 1H) , 7.88 (d, 1H) , 7.44 (s, 1H) , 7.34-7.41 (m, 2H) , 7.18-7.31 (m, 7H) , 6.82-6.89 (m, 4H) , 6.64 (s, 1H) , 5.22 (d, 1H) , 5.04-5.09 (m, 1H) , 4.97 (dd, 1H) , 4.50 (d, 1H) , 4.11-4.23 (m, 1H) , 4.02 (s, 3H) , 3.83-3.93 (m, 2H) , 3.79 (t, 2H) , 3.73 (s, 6H) , 3.65-3.72 (m, 2H) , 3.36-3.42 (m, 2H) , 2.90-2.94 (m, 1H) , 2.82-2.85 (m, 1H) , 2.72-2.79 (dd, 1H) , 2.56-2.61 (dd, 1H) , 2.35-2.45 (dd, 2H) , 2.27-2.32 (dd, 2H) , 2.10 (s, 3H) , 1.98 (s, 3H) , 1.89 (s, 3H) , 1.76 (s, 3H) , 1.56-1.64 (m, 2H) , 1.43-1.50 (m, 2H) , 1.12-1.20 (m, 2H) , 1.13 (d, 3H) .
Synthesis of compound H-23
For synthesis method, see compound H-17 synthesis in H-17 (His (R) -sequential-GalNAc) synthesis route. H-23 with 52 μmol/g loading.
Example 4 Synthesis of GS-13-1 (Glu (R) -sequential-GalNAc)
Synthesis of GS-13-1 (Glu (R) -sequential-GalNAc) was show below:
Figure PCTCN2022114893-appb-000070
Figure PCTCN2022114893-appb-000071
Synthesis of compound GS-13-11
The starting material was changed to N-Boc-L-glutamic acid benzyl ester, and the synthesis method was the same as that of H-10. MS (ESI) m/z 752.30 ( [M+H]  +) .
Synthesis of compound GS-13-10
The synthesis method was the same as that of H-11. MS (ESI) m/z 652.30 ( [M+H]  +) .
Synthesis of compound GS-13-9
The synthesis method was the same as that of H-12. MS (ESI) m/z 976.43 ( [M+H]  +) .
Synthesis of compound GS-13-8
GS-13-9 was dissolved in anhydrous methanol, 10% (W/W) palladium carbon was added, and replaced air with hydrogen for three times, stirred at room temperature until the raw material was completely consumed, then the palladium carbon was removed by filtration, and the filtrate was dried and directly put into the next step. MS (ESI) m/z 884.40 ( [M-H]  -) .
Synthesis of compound GS-13-7
Equivalents of GS-13-8 and GS-13-10 was dissolved in anhydrous dichloromethane, added DMAP (0.1 equivalents) , DCC (2.0 equivalents) and DIEA (2.0 equivalents) , stirred at room temperature under nitrogen atmosphere until the the raw materials was completely consumed. The insolubles were removed by filtration, and the reaction solution was washed with purified water, the  organic phase was concentrated to dryness, then the crude product was purified by silica gel column chromatography (DCM: MeOH=10: 1) , and dried to obtain a white solid. MS (ESI) m/z 1519.60 ( [M+H]  +) .
Synthesis of compound GS-13-6
The synthesis method was the same as that of GS-13-8. MS (ESI) m/z1427.61 ( [M-H]  -) .
Synthesis of compound GS-13-5
The synthesis method was the same as that of GS-13-7, and the raw materials are GS-13-6 and GS-13-14. MS (ESI) m/z 1066.01 ( [ (M+2) /2]  +) .
Synthesis of compound GS-13-4
The synthesis method was the same as that of H-13. MS (ESI) m/z 889.41 ( [ (M+2) /2]  +) .
Synthesis of compound GS-13-3
The synthesis method was the same as that of H-14. MS (ESI) m/z 1040.92 ( [ (M+2) /2]  +) .
Synthesis of compound GS-13-2
The synthesis method was the same as that of H-16. MS (ESI) m/z 1091.15 ( [M+2) /2]  +) .
Synthesis of compound GS-13-1
The synthesis method was the same as that of H-17, and the loading was 50 μmol/g.
Example 5 Synthesis of HS-13-1 (His (R) -sequential-GalNAc)
Figure PCTCN2022114893-appb-000072
Figure PCTCN2022114893-appb-000073
Synthesis of compound HS-13-11
The starting material was changed to N-Boc-3-L-Histidine benzyl ester, and the synthesis  method was the same as that of H-10. MS (ESI) m/z 761.30 ( [M+H]  +) .
Synthesis of compound HS-13-10
The synthesis method was the same as that of H-11. MS (ESI) m/z 661.30 ( [M+H]  +) .
Synthesis of compound HS-13-9
The synthesis method was the same as that of H-12. MS (ESI) m/z 985.46 ( [M+H]  +) .
Synthesis of compound HS-13-8
HS-13-9 was dissolved in anhydrous methanol, 10% (W/W) palladium carbon was added, and replaced air with hydrogen for three times, stirred at room temperature until the raw material was completely consumed, then the palladium carbon was removed by filtration, and the filtrate was dried and directly put into the next step. MS (ESI) m/z 893.40 ( [M-H]  -) .
Synthesis of compound HS-13-7
Equivalents of HS-13-8 and HS-13-10 was dissolved in anhydrous dichloromethane, added DMAP (0.1 equivalents) , DCC (2.0 equivalents) and DIEA (2.0 equivalents) , stirred at room temperature under nitrogen atmosphere until the the raw materials was completely consumed. The insolubles were removed by filtration, and the reaction solution was washed with purified water, the organic phase was concentrated to dryness, then the crude product was purified by silica gel column chromatography (DCM: MeOH=10: 1) , and dried to obtain a white solid. MS (ESI) m/z 1537.60 ( [M+H]  +) .
Synthesis of compound HS-13-6
The synthesis method was the same as that of HS-13-8. MS (ESI) m/z 1445.60 ( [M-H]  -) .
Synthesis of compound HS-13-5
The synthesis method was the same as that of HS-13-7, and the raw materials are HS-13-6 and HS-13-14. MS (ESI) m/z 1079.52 ( [ (M+2) /2]  +) .
Synthesis of compound HS-13-4
The synthesis method was the same as that of H-13. MS (ESI) m/z 903.44 ( [ (M+2) /2]  +) .
Synthesis of compound HS-13-3
The synthesis method was the same as that of H-14. MS (ESI) m/z 1054.45 ( [ (M+2) /2]  +) .
Synthesis of compound HS-13-2
The synthesis method was the same as that of H-16. MS (ESI) m/z 1104.66 ( [M+2) /2]  +) .
Synthesis of compound HS-13-1
The synthesis method was the same as that of H-17, and the loading was 50 μmol/g.
Example 6 Synthesis of conjugated oligonucleotide provided by this invention
A naturally occurring or chemically modified oligonucleotide was synthesized by a usual method, e.g. solid phase method. And the compound conjugated oligonucleotide was synthesized by exemplary method as shown below:
Preparation of Oligo conjugate G-12 (Glu (R) -sequential-GalNAc)
Figure PCTCN2022114893-appb-000074
Steps of solid-phase synthesis
Using the phosphoramidite solid-phase synthesis method known in the art, G-12 was used as the solid-phase synthesis carrier, and sequential commands that the linking position of compound G-10 was set at the 3’-end of the sequentials and the numbers of it was also set were performed on MerMade192 solid phase synthesizer.
Each connection of a nucleoside monomer included four steps: deprotection, coupling, capping and oxidation, standard procedures of the steps mentioned-above are known to one of ordinary skills in the art, and G-10 solutions were prepared with 0.1 M acetonitrile solutions.
The solid phase synthesis reagents were configured as follows:
Wash: acetonitrile
Deblock: 3%Dichloro Acetic Acid in Dichloromethane
Activator: 0.25M 5-Ethylthio-1H-Tetrazole in Acetonitirle
Capping Reagent A: THF/Lutidine/Acetic Anhydride (8: 1: 1)
Capping Reagent B: 15%NMI/THF, GL38 finish
Oxidizing reagent: 0.02 M I2 in THF/Pyridine/H 2O
Sulfurizing reagent: 0.10 M DDTT solution
The solid-phase synthesis conditions taking 1 μmol synthesis scale as an example are as follows:
Figure PCTCN2022114893-appb-000075
Steps of cleavage and deprotection
The Oligo-support obtained by the steps of solid-phase synthesis above was added to a 1 mL centrifuge tube, 50~100 μL of concentrated ammonium hydroxide was added, cultured at 50-60 ℃ for 10 hours, the liquid supernatant was drawn by centrifugation, two-fold volume acetone-ethanol (80: 20) solvent was added to the liquid supernatant, a white precipitate was precipitated, and  the supernatant was removed by centrifugation at 10,000 g to obtain a precipitated product, the precipitate was redissolved in 0.2 M sodium acetate solution.
Steps of purification, desalting and lyophilization
Using ion chromatography column which has 1 mL volume (loaded with packing Nano Q 30) , purification was carried out on Avant 150 purification equipment.
The detailed conditions are:
Buffer A: 20 mM sodium phosphate-10%acetonitrile-water buffer solution (pH7.5) ,
Buffer B: 2.0 M NaCl-20 mM sodium phosphate-acetonitrile-water buffer solution (pH7.5) ; elution gradient: Buffer B 0 ~50%, Buffer A 100~50%
The eluates were collected and combined, and G25 Sephadex column was used for desalting finally; measured the OD 260 concentration value of the desalted product solution, the product content was calculated, and finally put it into a centrifuge tube for lyophilization to obtain a white freeze-dried product.
Detection: Reversed-phase UPLC-MS tandem mass spectrometry was used for detection, the purity was above 90%, and m/z [M-7/7]  -, [M-8/8]  -, [M-9/9]  -characteristic ion peaks was showed on the mass spectrometry.
For the synthesis example of AS-Oligo, refers to G-12-OLIGO, and Unylinker-CPG (From Glen Research) was used as a solid-phase synthesis carrier for synthesis.
For the synthesis example of Oligo conjugate His-R-Sequential-GalNAc, refers to G-12-OLIGO, and H-17 was used as solid-phase synthesis carrier for synthesis. The only difference is that H-15 is prepared in 0.1 M acetonitrile solution, and sequence settings was performed on solid phase synthesizer.
For the synthesis example of Oligo conjugate His-S-Sequential-GalNAc, refers to G-12-OLIGO, and H-23 was used as solid-phase synthesis carrier for synthesis. The only difference is that H-21 is prepared in 0.1 M acetonitrile solution, and sequence settings was performed on solid phase synthesizer.
siRNA-GalNAc conjugate or aiRNA-GalNac conjugate was prepared by annealing Oligo-GalNAC conjugate obtained above and anti-sense strand with its complementary sequence at a molar ratio of 1: 1 to obtain a double-stranded product.
Activity test
Materials and Method
Conjugated aiRNA synthesis for test:
Figure PCTCN2022114893-appb-000076
Compounds HS-9, HS-5 and HS-6 are triple sequential GalNAc designed base on Histidine linker conjugated at 3’ end of sense strand of a duplex RNA, such as aiRNA or siRNA, it is represented by code “His-seq (3GalNAc) ” , “His (R) -seq (3GalNAc) ” and “His (S) -seq (3GalNAc) ” respectively as used and described in below examples. Compounds GS-9 and GS-5 are triple sequential GalNAc designed base on Glutamine linker conjugated at 3’ end of sense strand of a duplex RNA, such as aiRNA or siRNA, they are represented by code “Glu-seq (3GalNAc) ” and “Glu (R) -seq (3GalNAc) ” respectively as used and described in below examples.
Sequences and structure of oligonucleotide (aiRNA and siRNA) synthesized and used in activity test examples are showed in below table 7:
Table 7. sequence of tested aiRNA for targeting mouse beta-Catenin
Figure PCTCN2022114893-appb-000077
AGCU represent 2’ OMe modified RNA, agcu represent 2’F modified RNA, *=PS, -L represent GalNAc conjugation
Unless specifically indicated otherwise, the ex vivo delivery efficiency of the conjugates in the invention was tested in liver cell by RT-qPCR. The procedure of primary mouse hepatocytes isolation is as follows:
Part A: Perfusion
(1) Perfuse with buffer A
(2) Perfuse with buffer B
(3) Dissect out liver, place into buffer C
Buffer A: Add 93 mg of EDTA (0.5 mM) to 500 mL HBSS
Buffer B: Add 400 mg of Collagenase Type-I (0.8 mg/mL) ) to 500 mL DMEM
Buffer C: Add 2 mg of BSA (2%) to 100 mL DMEM
Part-B: Isolation
· After perfusion, in hood, place liver into 10 cm TC dish, open liver sack, help dissociation by shaking tissue with forceps.
· Filter through 70 um filter; wash filter with buffer C, centrifuge 50 g for 5 minutes at 4℃.
· Discard supernatant, resuspend gently in 50 ml buffer C (wash 1) , and centrifuge at 50g for 5 minutes at 4℃.
· Discard supernatant, resuspend gently in 50 ml buffer C (wash 2) , and centrifuge at 50 g for 5 minutes at 4℃.
· Discard supernatant, resuspend gently in 50 ml buffer C (wash 3) , and centrifuge at 50 g for 5 minutes 4℃.
· Discard supernatant, resuspend in thawing/plating medium.
· Count with trypanblue to assess viability/yield.
· Seed the cells by using mouse primary hepatocytes thawing media (thermos fisher, CM3000) on collagenase coated plates, thermos fisher, A1142802. Better seed 1 mL/well in 24 will plate.
· After 3-4 hours, replace the media with primary hepatocyte maintenance media, thermofisher, CM4000.
ex vivo Self Delivery assay was conducted without using transfection reagent (free uptake) (tested in 12 well plate, 100,000 cells/well, 48 hours incubation) . Tested Oligo GalNAc conjugate concentrations was marked in each example as below. The expression level of targeted mRNA was detected by RT-q PCR.
Example 7 ex vivo uptake of the aiRNA by hepatocytes with/without conjugates
“Glu (R) -seq (3GalNAc) ” conjugated mβ-Catenin aiRNA (aiRNA#1) showed remarkable gene silencing activity in self-delivery ex vivo test at 10 nM, and even 1 nM, compared with non-conjugated aiRNA, demonstrating that the GalNAc conjugates provided by this invention have great potency for delivering duplex RNAi agent, such as aiRNA. The results were detected by QPCR as shown in FIG. 2.
Example 8 ex vivo uptake of the aiRNA by hepatocytes with GalNac conjugates
mβ-Catenin aiRNA (aiRNA#2) conjugated with two different GalNAc conjugation provided by this invention were cocultured with isolated mouse hepatocytes for 24 hours at 303 nM, 92 nM, 28 nM concentration. The results were tested by QPCR and shown in FIG. 3. Both Glu-seq (3 GalNAc) , His (R) -seq (3 GalNAc) and His (S) -seq (3 GalNAc) showed very potent gene silencing in the ex vivo self-delivery which indicates GalNAc conjugates provided by this invention have great potency for delivering duplex RNAi agent, such as aiRNA.
Example 9 ex vivo uptake of mouse TTR targeted aiRNA by hepatocytes with Sequential Histidine GalNAc conjugates
Gene silencing activity of novel designed mouse TTR targeted aiRNA “His-seq (3GalNAc) ” conjugates as shown in below Table 8 in the absence of a transfection agent (free uptake) in freshly isolated mouse primary hepatocytes were tested. The ex vivo free uptake mediated gene silencing assesses the receptor-mediated intracellular transport enabled by the GalNAc conjugate provided by this invention.
To the wells of a 12-well plate were added 50 μL of aiRNA Conjugates (793-804) and 950 μL of cell culture media (thermofisher, CM4000) containing ~100,000 primary mouse hepatocytes. Cells were incubated at 37℃ at 5%CO 2 for 24 h. RNA purified, and levels of mRNA were determined by RT-qPCR. Values are plotted as a fraction of untreated control cells. All aiRNA Conjugates were tested at 0.3 nM concentration. GAPDH served as the internal control.
Table 8 Mouse TTR targeted aiRNA with sequential histidine GalNAc conjugates
Figure PCTCN2022114893-appb-000078
Figure PCTCN2022114893-appb-000079
AGCU = 2’OMe modified RNA, agcu = 2’F modified RNA, *=PS, DDD = His-seq (3GalNAc) 
The results were shown in FIG. 4. All aiRNA Conjugates through conjugate compositions of this invention showed potent gene silencing activity in the ex vivo self-delivery assay at 0.3 nM which indicates GalNAc conjugates provided by this invention have great potency for delivering various duplex RNAi agent.
The results in all activity test examples have clearly demonstrated that GalNAc conjugates design based on present invention can dramatically enhance the delivery efficiency of an oligonucleotide ex vivo, achieving great gene silencing potency for targeting different genes in hepatocyte. Moreover, the linker compositions provided in this invention were based on our body’s amino acids, which eliminate the safety risk of other types of linkers used in GalNAc conjugates.
It will be apparent to those skilled in the art that various modifications and variations can be made in the present invention without departing from the scope or spirit of the invention. Other embodiments of the invention will be apparent to those skilled in the art from consideration of the specification and practice of the invention disclosed herein. It is intended that the specification and examples be considered as exemplary only, with a true scope and spirit of the invention being indicated by the following claims.
Throughout this application, various publications, patents, and/or patent applications are referenced in order to more fully describe the state of the art to which this invention pertains. The disclosures of these publications, patents, and/or patent applications are herein incorporated by reference in their entireties to the same extent as if each independent publication, patent, and/or patent application was specifically and individually indicated to be incorporated by reference.

Claims (75)

  1. A compound having the structural formula (S-HG1) :
    R 206- [A1]  a- [A2]  b- [A3]  c-R 205   (S-HG1)
    wherein:
    R 205, R 206 are each independently for each occurrence H, OH, a protecting group for OH, a phosphate group, a phosphodiester group, an activated phosphate group, an activated phosphite group, a phosphoramidite, a solid support, -OP (M') (M") O-nucleoside, -OP (M') (M") O-oligonucleotide, a lipid, a PEG, a steroid, a polymer, -O-nucleotide, a nucleoside, -OP (M') (M") O-R 201-OP (M'") (M"") O-oligonucleotide, or an oligonucleotide;
    M', M", M'" and M"" are each independently for each occurrence O or S;
    A1, A2 and A3 are each independently for each occurrence selected from (S-1H) or (S-1G) :
    Figure PCTCN2022114893-appb-100001
    R 202A is –R 202-R 202L;
    R 217A is –R 217-R 217L;
    R 202L, R 217L are independently for each occurrence one ligand capable of docking to a cell surface receptor;
    each R 202, R 217, R 201 are independently for each occurrence selected from a alkylene of 3 to 30 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N, S (O)  2, C 2 -C 10 alkenylene, C 2 -C 10 alkynylene, C 6 -C 10 arylene, C 3 -C 18 heterocyclylene, and C 5 -C 10 heteroarylene, and wherein each R 202, R 217, R 201 are independently optionally not substituted or substituted by R 209; optionally, R 202, R 201 are independently for each occurrence selected from a alkylene of 3 to 15 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O;
    R 1, R 2, R 204, R 207, R 208 , R 213, R 214, R 215, R 216, R 209 are independently for each occurrence selected one or more from the group consisting of H, alkyl, aryl, heteroaryl, haloalkyl, -O alkyl, -O alkylphenyl, -alkyl-OH, -O haloalkyl, -Salkyl, -Salkylphenyl, -alkyl-SH, -Shaloalkyl, halo, -OH,  -SH, -NH 2, -alkyl-NH 2, -N (alkyl) (alkyl) , -NH (alkyl) , -N (alkyl) (alkylphenyl) , -NH (alkylphenyl) , cyano, nitro, -CO 2H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2 , -NHC (O) (alkyl) , -NHC (O) (phenyl) , -N (alkyl) C (O) (alkyl) , -N (alkyl) C (O) (phenyl) , -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -OC (O) alkyl, -SO 2 (alkyl) , -SO 2 (phenyl) , -SO 2 (haloalkyl) , -SO 2 NH 2, -SO 2NH (alkyl) , -SO 2 NH (phenyl) , -NHSO 2 (alkyl) , -NHSO 2 (phenyl) , and -NHSO 2 (haloalkyl) ;
    n 201, n 211 are each independently for each occurrence 1, 2, 3, 4, 5 or 6;
    J 201, J 202, J 211, J 212 are each independently for each occurrence a spacer;
    a, b and c are each independently for each occurrence integer 0-5, and the sum of a, b and c is an integer of 1-10;
    wherein the oligonucleotide comprises naturally occurring or chemically modified nucleotides/nucleosides.
  2. A compound of claim 1, wherein the sum of a, b and c is an integer of 1 or 3.
  3. A compound of claim 1, wherein the compound having the structural formula (S-H1) :
    Figure PCTCN2022114893-appb-100002
    wherein:
    R 1 is selected one or more from the group consisting of H, C 1-C 5 alkyl, aryl, heteroaryl, C 1-C 5 haloalkyl, -C 1-C 5 alkyl-OH, -C 1-C 5 alkyl-SH, -C 1-C 5 alkyl-NH 2, -CO 2H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2, -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -SO 2 (alkyl) , -SO 2 (haloalkyl) , -SO 2 NH 2, -SO 2NH (alkyl) , and -SO 2 NH (phenyl) ;
    n 202 is selected from 1-10, preferably 1-3.
  4. The compound of claim 3, having the structural formula (S-H1-01) :
    Figure PCTCN2022114893-appb-100003
    wherein:
    J 202A is selected from the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N and S (O)  2;
    J 202B is selected from an alkylene of 1 to 10 carbon atoms, optionally selected from a straight alkylene of 1 to 10 carbon atoms;
    R 205A is a group comprising a solid support or H.
  5. The compound of claim 3 or claim 4, wherein n 202 is 3.
  6. The compound of any one of claims 3-4, wherein R 206 comprises an oligonucleotide.
  7. The compound of claim 6, wherein the compound having the structural formula (S-H1-02) :
    Figure PCTCN2022114893-appb-100004
  8. The compound of claim 3, wherein:
    J 201, J 202are independently for each occurrence selected from a alkylene of 1 to 30 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N, S (O)  2, C 2 -C 10 alkenylene, C 2 -C 10 alkynylene, C 6 -C 10 arylene, C 3 -C 18 heterocyclylene, and C 5 -C 10 heteroarylene, and wherein J 201, J 202are each independently optionally not substituted or substituted by one or more group selected from the group consisting of H, alkyl, aryl, heteroaryl, haloalkyl, -O alkyl, -O alkylphenyl, -alkyl-OH, -O haloalkyl, -Salkyl, -Salkylphenyl, -alkyl-SH, -Shaloalkyl, halo, -OH, -SH, -NH 2, -alkyl-NH 2, -N (alkyl) (alkyl) , -NH (alkyl) , -N (alkyl) (alkylphenyl) , -NH (alkylphenyl) , cyano, nitro, -CO 2H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2 , -NHC (O) (alkyl) , -NHC  (O) (phenyl) , -N (alkyl) C (O) (alkyl) , -N (alkyl) C (O) (phenyl) , -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -OC (O) alkyl, -SO 2 (alkyl) , -SO 2 (phenyl) , -SO 2 (haloalkyl) , -SO 2 NH 2, -SO 2NH (alkyl) , -SO 2 NH (phenyl) , -NHSO 2 (alkyl) , -NHSO 2 (phenyl) , and -NHSO 2 (haloalkyl) .
  9. The compound of claim3, wherein
    J 201, J 202 are independently for each occurrence selected from a alkylene of 1 to 10 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N and S (O)  2, and wherein J 201, J 202 are each independently optionally not substituted or substituted by at least one group selected from group: H, or, C 1-C 5 alkyl, -OC 1-C 5 alkyl.
  10. The compound of claim 9, wherein n 201 is 1, n 202 is 3;
  11. The compound of claim 3, the compound having the structural formula (S-H1-03) , (S-H1-04) or (S-H1-05) :
    Figure PCTCN2022114893-appb-100005
    Wherein:
    A is O or S;
    X is independently selected from Table 1;
    X 1 is independently selected from Table 2;
    J 202 is independently selected from Table 3; Optionally, J 202 is independently selected from a  alkylene of 1 to 10 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N and S (O)  2, and wherein J 201, J 202 are each independently optionally not substituted or substituted by at least one group selected from group: H, or, C 1-C 5 alkyl, -OC 1-C 5 alkyl;
    R, R’ are each independently selected from the group consisting of a naturally occurring and/or chemically modified oligonucleotide, H and a protecting group for OH; at least one of R and R’ comprises an oligonucleotide formed by natural and/or chemically modified nucleotides/nucleosides;
    R 202 is selected from a straight alkylene of 3 to 15 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O; and wherein R 202 is optionally not substituted or substituted by one or more group selected from the group consisting of H, alkyl, haloalkyl, -O alkyl, -alkyl-OH, -O haloalkyl, -Salkyl, -alkyl-SH, -Shaloalkyl, halo, -OH, -SH, -NH 2, -alkyl-NH 2, -N (alkyl) (alkyl) , -NH (alkyl) , cyano, nitro, -CO 2H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2 , -NHC (O) (alkyl) , -NHC (O) (phenyl) , -N (alkyl) C (O) (alkyl) , -C (O) alkyl, -C (O) haloalkyl, -OC (O) alkyl, -SO 2 (alkyl) , -SO 2 (haloalkyl) , -SO 2 NH 2, -SO 2NH (alkyl) , -NHSO 2 (alkyl) , and -NHSO 2 (haloalkyl) ;
    Optionally, R 202 is selected from -C 3-C 8 straight alkylene-.
  12. The compound of claim 11, wherein the compound having the structural formula (S-H1-06) , (S-H1-07) or (S-H1-08) :
    Figure PCTCN2022114893-appb-100006
    Figure PCTCN2022114893-appb-100007
  13. The compound of claim 11, the compound having the structural formula (S-H1-09) , (S-H1-10) or (S-H1-11) :
    Figure PCTCN2022114893-appb-100008
  14. The compound of claim 11, wherein having the structural formula (S-H1-12) , (S-H1-13) or (S-H1-14) :
    Figure PCTCN2022114893-appb-100009
    Figure PCTCN2022114893-appb-100010
  15. The compound of claim 3, the compound having the structural formula (S-H1-15) or (S-H1-16) :
    Figure PCTCN2022114893-appb-100011
    wherein:
    R, R’ are each independently selected from the group consisting of a naturally occurring or chemically modified oligonucleotide, H and a protecting group for OH;
    at least one of R and R’ comprises an oligonucleotide formed by natural and/or chemically modified nucleotides/nucleosides;
    each A independently is O or S;
    each Q is independently selected from the group consisting of absent, amide, ether, triazole, carbonate, carbamate, phosphate, phosphonate, phosphorothioate, sulphate, disulfide, ester, thioester, alkyl amine, cyclic alkyl amine, alkyne, cyclic alkyne, alkene, cyclic alkene, lactone, and  lactam bonds;
    each X is independently selected from Table 1;
    each Y is independently selected from Table 4;
    each Z is independently selected from Table 3;
    each L independently comprises a ligand moiety capable of docking to a cell-surface receptor.
  16. The compound of any one of claims 11-15, wherein each A is O.
  17. The compound of any one of claims 11-15, wherein at least one A is S.
  18. The compound of any one of claims 1-17, wherein each ligand is independently selected from the group consisting of N-acetyl galactosamine (GalNAc) , cholesterol, tocopherol, biotin, cyanine dyes, folic acid, RGDp, transferrin, anisamide, lactobionic acid, cRGD, hyaluronic acid, low molecular weight protamine, lipid derivatives, peptides, cyclic peptides, and heterocycles.
  19. The compound of any one of claims 1-17, wherein the ligand is N-acetyl galactosamine (GalNAc) .
  20. The compound of claim 12, wherein the compound has the structure shown in formula HS-1 to HS-8:
    Figure PCTCN2022114893-appb-100012
    Figure PCTCN2022114893-appb-100013
  21. The compound of claim 12, wherein the compound has the structure of formula HS-9.
  22. The compound of claim 12, wherein the compound has the structure of formula HS-5.
  23. The compound of claim 1, the compound having the structural formula (S-G1) :
    Figure PCTCN2022114893-appb-100014
    wherein:
    R 2 is selected one or more from the group consisting of H, C 1-C 5 alkyl, aryl, heteroaryl, C 1-C 5 haloalkyl, -C 1-C 5 alkyl-OH, -C 1-C 5 alkyl-SH, -C 1-C 5 alkyl-NH 2, -CO 2H, -C (O) O alkyl, -CON  (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2, -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -SO 2 (alkyl) , -SO 2 (haloalkyl) , -SO 2 NH 2, -SO 2NH (alkyl) , and -SO 2 NH (phenyl) ;
    n 212 is selected from 1-10, preferably 1-3.
  24. The compound of claim 23, having the structural formula (S-G1-01) :
    Figure PCTCN2022114893-appb-100015
    wherein:
    J 212A is selected from the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N and S (O)  2;
    J 212B is selected from a alkylene of 1 to 10 carbon atoms; optionally selected from a straight alkylene of 1 to 10 carbon atoms;
    R 205 is a group comprising a solid support or H.
  25. The compound of claim 23 or claim 24, wherein n 212 is 3.
  26. The compound of any one of claims 23-24, wherein R 206 comprises an oligonucleotide.
  27. The compound of claim 26, wherein the compound having the structural formula (S-G1-02) :
    Figure PCTCN2022114893-appb-100016
  28. The compound of claim 23, wherein:
    J 211, J 212 are independently for each occurrence selected from a alkylene of 1 to 30 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N, S (O)  2, C 2 -C 10 alkenylene, C 2 -C 10 alkynylene, C 6 -C 10 arylene, C 3 -C 18 heterocyclylene, and C 5 -C 10 heteroarylene, and wherein  J 211, J 212 are each independently optionally not substituted or substituted by one or more group selected from the group consisting of H, alkyl, aryl, heteroaryl, haloalkyl, -O alkyl, -O alkylphenyl, -alkyl-OH, -O haloalkyl, -Salkyl, -Salkylphenyl, -alkyl-SH, -Shaloalkyl, halo, -OH, -SH, -NH 2, -alkyl-NH 2, -N (alkyl) (alkyl) , -NH (alkyl) , -N (alkyl) (alkylphenyl) , -NH (alkylphenyl) , cyano, nitro, -CO 2H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2 , -NHC (O) (alkyl) , -NHC (O) (phenyl) , -N (alkyl) C (O) (alkyl) , -N (alkyl) C (O) (phenyl) , -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -OC (O) alkyl, -SO 2 (alkyl) , -SO 2 (phenyl) , -SO 2 (haloalkyl) , -SO 2 NH 2, -SO 2NH (alkyl) , -SO 2 NH (phenyl) , -NHSO 2 (alkyl) , -NHSO 2 (phenyl) , and -NHSO 2 (haloalkyl) .
  29. The compound of claim 23, wherein:
    J 211, J 212 are independently for each occurrence selected from a alkylene of 1 to 10 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N and S (O)  2, and wherein J 211, J 212 are each independently optionally not substituted or substituted by at least one group selected from group: H, or, C 1-C 5 alkyl, -O C 1-C 5 alkyl.
  30. The compound of any of claim 29, wherein n 211 is 1, n 212 is 1 or 3.
  31. The compound of claim 29, wherein the compound having the structural formula (S-G1-03) , (S-G1-04) or (S-G1-05) :
    Figure PCTCN2022114893-appb-100017
    Figure PCTCN2022114893-appb-100018
    Wherein:
    A is O or S;
    X is independently selected from Table 1;
    X 1 is independently selected from Table 2
    J 212 is independently selected from Table 3
    Optionally, J 212 is independently selected from a alkylene of 1 to 10 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N and S (O)  2, and wherein J 212 is optionally not substituted or substituted by at least one group selected from group: H, or, C 1-C 5 alkyl, -OC 1-C 5 alkyl;
    R, R’ are each independently selected from the group consisting of a naturally occurring and/or chemically modified oligonucleotide, H and a protecting group for OH;
    at least one of R and R’ comprises an oligonucleotide formed by natural and/or chemically modified nucleotides/nucleosides;
    R 217 is selected from a straight alkylene of 3 to 15 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O; and wherein R 217 is optionally not substituted or substituted by one or more group selected from the group consisting of H, alkyl, haloalkyl, -O alkyl, -alkyl-OH, -O haloalkyl, -Salkyl, -alkyl-SH, -Shaloalkyl, halo, -OH, -SH, -NH 2, -alkyl-NH 2, -N (alkyl) (alkyl) , -NH (alkyl) , cyano, nitro, -CO 2H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2 , -NHC (O) (alkyl) , -NHC (O) (phenyl) , -N (alkyl) C (O) (alkyl) , -C (O) alkyl, -C (O) haloalkyl, -OC (O) alkyl, -SO 2 (alkyl) , -SO 2 (haloalkyl) , -SO 2 NH 2, -SO 2NH (alkyl) , -NHSO 2 (alkyl) , and -NHSO 2 (haloalkyl) ;
    Optionally, R 217 is selected from -C 3-C 8 straight alkylene-.
  32. The compound of claim 31, the compound having the structural formula (S-G1-06) , (S-G1-07) or (S-G1-08) :
    Figure PCTCN2022114893-appb-100019
  33. The compound of claim 31, the compound having the structural formula (S-G1-09) , (S-G1-10) or (S-G1-11) :
    Figure PCTCN2022114893-appb-100020
  34. The compound of claim 31, wherein the compound has the structural formula (S-G1-12) , (S-G1-13) or (S-G1-14) :
    Figure PCTCN2022114893-appb-100021
  35. The compound of claim 1, the compound having the structural formula (S-G1-15) or (S-G1-16) :
    Figure PCTCN2022114893-appb-100022
    Figure PCTCN2022114893-appb-100023
    wherein:
    R, R’ are each independently selected from the group consisting of a naturally occurring or chemically modified oligonucleotide, H and a protecting group for OH;
    at least one of R and R’ comprises a naturally occurring or chemically modified oligonucleotide;
    each A independently is O or S;
    each Q is independently selected from the group consisting of absent, amide, ether, triazole, carbonate, carbamate, phosphate, phosphonate, phosphorothioate, sulphate, disulfide, ester, thioester, alkyl amine, cyclic alkyl amine, alkyne, cyclic alkyne, alkene, cyclic alkene, lactone, and lactam bonds;
    each X is independently selected from Table 1;
    each Y is independently selected from Table 4;
    each Z is independently selected from Table 3;
    each Z” is independently selected from Table 5; and
    each L independently comprises a ligand moiety capable of docking to a cell-surface receptor; and
    each of n1, n2, n3 is independently selected from 1, 2, 3 or 4.
  36. The compound of any one of claims 31-35, wherein each A is O.
  37. The compound of any one of claims 31-35, wherein at least one A is S.
  38. The compound of any of claims 23-37, wherein each ligand is independently selected from the group consisting of N-acetyl galactosamine (GalNAc) , cholesterol, tocopherol, biotin, cyanine dyes, folic acid, RGDp, transferrin, anisamide, lactobionic acid, cRGD, hyaluronic acid, low molecular weight protamine, lipid derivatives, peptides, cyclic peptides, and heterocycles.
  39. The compound of any one of claims 23-37, wherein the ligand is N-acetyl galactosamine (GalNAc) .
  40. The compound of claim 31, wherein the compound has the structure shown in formula GS-1 to GS-8:
    Figure PCTCN2022114893-appb-100024
  41. The compound of claim 31, wherein the compound has the structure of formula GS-9.
  42. The compound of claim 31, wherein the compound has the structure of formula GS-5.
  43. The compound of any of claims 1-42, wherein the naturally occurring or chemically modified oligonucleotide is linked to the rest of the compound through its 5’ end and/or 3’ end.
  44. A compound of claim 43, wherein the oligonucleotide comprises a small interfering RNA (siRNA) duplex, an asymmetric interfering RNA (aiRNA) duplex, an antisense oligonucleotide (ASO) or an micro-RNA (miRNA) .
  45. A compound of claim 44, wherein the aiRNA comprising an antisense strand and a sense strand, wherein the antisense strand is longer than the sense strand, has a length of 19, 20, 21, 22, 23, 24, 25, 26 or 27 nucleotides and includes a 3'-overhang of 1-9 nucleotides and a 5'-overhang of 0-8 nucleotides when duplexed with the sense strand;
    wherein the sense strand has a length of 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 or 26 nucleotides and forms a double-stranded region with the antisense strand.
  46. A compound of claim 45, wherein the antisense strand of the aiRNA includes a 5'-overhang of 1-8 nucleotides when duplexed with the sense strand.
  47. A compound of claim 45, wherein the antisense strand of the aiRNA includes a 5' blunt end when duplexed with the sense strand.
  48. A small interfering RNA (siRNA) agent duplex comprising a structural formula of any of claims 1-43.
  49. An asymmetric interfering RNA (aiRNA) agent comprising a structural formula of any of claims 1-43.
  50. An antisense oligonucleotide (ASO) agent comprising a structural formula of any of claims 1-43.
  51. A micro-RNA (miRNA) agent comprising a structural formula of any of claims 1-43.
  52. A pharmaceutical composition comprising a compound of claims 1-46 or agent of any one of claims 47-51 and a pharmaceutically acceptable excipient, carrier, or diluent.
  53. Use of a compound of any one of claims 1-46 or agent of any one of claims 47-51 in preparation of a medicament effective for treating a disease or condition.
  54. A compound having the structural formula (G-P1) :
    Figure PCTCN2022114893-appb-100025
    wherein:
    R 0 is selected one or more from the group consisting of H, C 1-C 5 alkyl, aryl, heteroaryl, C 1-C 5 haloalkyl, -C 1-C 5 alkyl-OH, -C 1-C 5 alkyl-SH, -C 1-C 5 alkyl-NH 2, -CO 2H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2, -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -SO 2 (alkyl) , -SO 2 (haloalkyl) , -SO 2 NH 2, -SO 2NH (alkyl) , and -SO 2 NH (phenyl) ;
    R 202A comprises at least one ligand capable of docking to a cell surface receptor;
    R 204, R 207, R 208 are independently selected one or more from the group consisting of H, alkyl, aryl, heteroaryl, haloalkyl, -O alkyl, -O alkylphenyl, -alkyl-OH, -O haloalkyl, -Salkyl, -S alkylphenyl, -alkyl-SH, -Shaloalkyl, halo, -OH, -SH, -NH 2, -alkyl-NH 2, -N (alkyl) (alkyl) , -NH (alkyl) , -N (alkyl) (alkylphenyl) , -NH (alkylphenyl) , cyano, nitro, -CO 2H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2 , -NHC (O) (alkyl) , -NHC (O) (phenyl) , -N (alkyl) C (O) (alkyl) , -N (alkyl) C (O) (phenyl) , -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -OC (O) alkyl, -SO 2 (alkyl) , -SO 2 (phenyl) , -SO 2 (haloalkyl) , -SO 2 NH 2 , -SO 2NH (alkyl) , -SO 2 NH (phenyl) , -NHSO 2 (alkyl) , -NHSO 2 (phenyl) , and -NHSO 2 (haloalkyl) ;
    n 201 is selected from 1, 2, 3, 4, 5 or 6;
    R 206 is selected from OH or a protecting group for OH;
    J 201, J 202 are each independently for each occurrence a spacer;
    R 205B is a -C 2 -C 10 alkynylene-CN;
    R 205C, R 205D are independently selected from -C 1-C 6-alkyl or R 205C and R 205D together form a five-or six-membered ring, optionally R 205C, R 205D are substituted , optionally R 205C, R 205D contain one further heteroatom selected from N and O.
  55. A compound of claim 57, wherein:
    J 201, J 202 are each independently selected from a alkylene of 3 to 30 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N, S (O)  2, C 2 -C 10 alkenylene, C 2 -C 10  alkynylene, C 6 -C 10 arylene, C 3 -C 18 heterocyclylene, and C 5 -C 10 heteroarylene, and wherein J 201, J 202are optionally not substituted or substituted by one or more from the group consisting of H, alkyl, aryl, heteroaryl, haloalkyl, -O alkyl, -O alkylphenyl, -alkyl-OH, -O haloalkyl, -Salkyl, -S alkylphenyl, -alkyl-SH, -Shaloalkyl, halo, -OH, -SH, -NH 2, -alkyl-NH 2, -N (alkyl) (alkyl) , -NH (alkyl) , -N (alkyl) (alkylphenyl) , -NH (alkylphenyl) , cyano, nitro, -CO 2H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2 , -NHC (O) (alkyl) , -NHC (O) (phenyl) , -N (alkyl) C (O) (alkyl) , -N (alkyl) C (O) (phenyl) , -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -OC (O) alkyl, -SO 2 (alkyl) , -SO 2 (phenyl) , -SO 2 (haloalkyl) , -SO 2 NH 2, -SO 2NH (alkyl) , -SO 2 NH (phenyl) , -NHSO 2 (alkyl) , -NHSO 2 (phenyl) , and -NHSO 2 (haloalkyl) .
  56. A compound of claim 54, having the structural formula (G-P2) :
    Figure PCTCN2022114893-appb-100026
    Wherein:
    J 202A is selected from the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N and S (O)  2;
    J 202B is selected from a alkylene of 1 to 10 carbon atoms.
  57. A compound of claim 56, having the structural formula (G-P3) :
    Figure PCTCN2022114893-appb-100027
  58. A compound of claim 54, having the structural formula (G-P4) :
    Figure PCTCN2022114893-appb-100028
  59. A compound of claim 54, wherein:
    R 205B is a -C 2 –C 5 alkynylene-CN;
    R 205C, R 205D are independently selected from -C 1-C 6-alkyl;
    R 202A is –R 202C-branching group- (R 202B-R 202Ln 111L or –R 202B-R 202L;
    R 202L is independently selected from a ligand capable of docking to a cell surface receptor;
    R 202B is selected from a alkylene of 1 to 30 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N, S (O)  2, C 2-C 10 alkenylene, C 2-C 10 alkynylene, C 6-C 10 arylene, C 3-C 18 heterocyclylene, and C 5-C 10 heteroarylene, and wherein R202 B is optionally not substituted or substituted by R 207;
    n 111L is selected from 1, 2 or 3.
  60. A compound of claim 59, wherein R 202C is selected from –C (O) -C 5 –C 8 straight alkylene-NHCO-CH 2-or –C (O) -C 8 –C 11 straight alkylene-.
  61. A compound of claim 59, wherein the branching group is selected from the group consisting of:
    Figure PCTCN2022114893-appb-100029
    Wherein each A 1 is independently, O, S, C=O, or NH; and
    each n is independently from 1 to 20.
  62. A compound of claim 59, wherein, the ligand is
    Figure PCTCN2022114893-appb-100030
    wherein R A is H or a protecting group for OH.
  63. A compound of claim 59, having the structural formula (G-P5) :
    Figure PCTCN2022114893-appb-100031
  64. A compound of claim 59, having the structural formula (G-P6) :
    Figure PCTCN2022114893-appb-100032
  65. A compound having the structural formula (G-P7) :
    Figure PCTCN2022114893-appb-100033
    wherein:
    R 3 is selected one or more from the group consisting of H, C 1-C 5 alkyl, aryl, heteroaryl, C 1-C 5 haloalkyl, -C 1-C 5 alkyl-OH, -C 1-C 5 alkyl-SH, -C 1-C 5 alkyl-NH 2, -CO 2H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2, -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -SO 2  (alkyl) , -SO 2 (haloalkyl) , -SO 2 NH 2, -SO 2NH (alkyl) , -SO 2 NH (phenyl) ;
    R 217A comprises at least one a ligand capable of docking to a cell surface receptor;
    R 213, R 214, R 215, R 216 are selected one or more from the group consisting of H, alkyl, aryl, heteroaryl, haloalkyl, -O alkyl, -O alkylphenyl, -alkyl-OH, -O haloalkyl, -Salkyl, -Salkylphenyl, -alkyl-SH, -Shaloalkyl, halo, -OH, -SH, -NH 2, -alkyl-NH 2, -N (alkyl) (alkyl) , -NH (alkyl) , -N (alkyl) (alkylphenyl) , -NH (alkylphenyl) , cyano, nitro, -CO 2H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2 , -NHC (O) (alkyl) , -NHC (O) (phenyl) , -N (alkyl) C (O) (alkyl) , -N (alkyl) C (O) (phenyl) , -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -OC (O) alkyl, -SO 2 (alkyl) , -SO 2 (phenyl) , -SO 2 (haloalkyl) , -SO 2 NH 2 , -SO 2NH (alkyl) , -SO 2 NH (phenyl) , -NHSO 2 (alkyl) , -NHSO 2 (phenyl) , and -NHSO 2 (haloalkyl) ;
    R 212 is selected from OH or a protecting group for OH;
    J 211, J 212 are each independently for each occurrence a spacer;
    n 211 are each independently for each occurrence 1, 2, 3, 4, 5 or 6;
    J 211, J 212 are each independently for each occurrence a spacer;
    R 211B is a -C 2 -C 10 alkynylene-CN;
    R 211C, R 211D are independently selected from -C 1-C 6-alkyl or R 211C and R 211D together form a five-or six-membered ring, optionally R 211C, R 211D are substituted , optionally R 211C, R 211D contain one further heteroatom selected from N and O.
  66. A compound of claim 65, wherein:
    J 211, J 212 are each independently selected from a alkylene of 3 to 30 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N, S (O)  2, C 2 -C 10 alkenylene, C 2 -C 10 alkynylene, C 6 -C 10 arylene, C 3 -C 18 heterocyclylene, and C 5 -C 10 heteroarylene, and wherein J 211, J 212are optionally not substituted or substituted by one or more from the group consisting of H, alkyl, aryl, heteroaryl, haloalkyl, -O alkyl, -O alkylphenyl, -alkyl-OH, -O haloalkyl, -Salkyl, -S alkylphenyl, -alkyl-SH, -Shaloalkyl, halo, -OH, -SH, -NH 2, -alkyl-NH 2, -N (alkyl) (alkyl) , -NH (alkyl) , -N (alkyl) (alkylphenyl) , -NH (alkylphenyl) , cyano, nitro, -CO 2H, -C (O) O alkyl, -CON (alkyl) (alkyl) , -CONH (alkyl) , -CONH 2 , -NHC (O) (alkyl) , -NHC (O) (phenyl) , -N (alkyl) C (O) (alkyl) , -N (alkyl) C (O) (phenyl) , -C (O) alkyl, -C (O) alkylphenyl, -C (O) haloalkyl, -OC (O) alkyl, -SO 2 (alkyl) , -SO 2 (phenyl) , -SO 2 (haloalkyl) , -SO 2 NH 2, -SO 2NH (alkyl) , -SO 2 NH (phenyl) , -NHSO 2 (alkyl) , -NHSO 2 (phenyl) , and -NHSO 2 (haloalkyl) .
  67. A compound of claim 65, having the structural formula (G-P8) :
    Figure PCTCN2022114893-appb-100034
    wherein:
    J 212A is selected from the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N and S (O)  2;
    J 212B is selected from a alkylene of 1 to 10 carbon atoms.
  68. A compound of claim 66, having the structural formula (G-P9) :
    Figure PCTCN2022114893-appb-100035
  69. A compound of claim 65, having the structural formula (G-P10) :
    Figure PCTCN2022114893-appb-100036
  70. A compound of claim 65, wherein:
    R 211B is a -C 2 –C 5 alkynylene-CN;
    R 211C, R 211D are independently selected from -C 1-C 6-alkyl;
    R 217A is –R 217C-branching group- (R 217B-R 217Ln 211L or –R 217B-R 217L;
    R 217L is independently selected from a ligand capable of docking to a cell surface receptor;
    R 217B is selected from a alkylene of 1 to 30 carbon atoms, wherein one or more carbon atoms are optionally replaced with any one or more substituent of the group consisting of: C (O) , NH, O, S, OP (O) O, OP (S) O, CH=N, S (O)  2, C 2 -C 10 alkenylene, C 2 -C 10 alkynylene, C 6 -C 10 arylene, C 3 -C 18 heterocyclylene, and C 5 -C 10 heteroarylene, and wherein R 217B is optionally not substituted or substituted by R 213;
    n 211L is selected from 1, 2 or 3.
  71. A compound of claim 70, wherein R 217C is selected from –C (O) -C 5 –C 8 straight alkylene-NHCO-CH 2-or –C (O) -C 8 –C 11 straight alkylene-.
  72. A compound of claim 70, wherein the branching group is selected from the group consisting of:
    Figure PCTCN2022114893-appb-100037
    Wherein each A 1 is independently, O, S, C=O, or NH; and
    each n is independently from 1 to 20.
  73. A compound of claim 65, wherein the ligand is
    Figure PCTCN2022114893-appb-100038
    wherein R A is H or a protecting group for OH.
  74. A compound of claim 65, having the structural formula (G-P11) :
    Figure PCTCN2022114893-appb-100039
  75. A compound of claim 65, having the structural formula (G-P12) :
    Figure PCTCN2022114893-appb-100040
PCT/CN2022/114893 2022-08-25 2022-08-25 Novel compositions for conjugating oligonucleotides and carbohydrates WO2024040531A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/CN2022/114893 WO2024040531A1 (en) 2022-08-25 2022-08-25 Novel compositions for conjugating oligonucleotides and carbohydrates

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2022/114893 WO2024040531A1 (en) 2022-08-25 2022-08-25 Novel compositions for conjugating oligonucleotides and carbohydrates

Publications (1)

Publication Number Publication Date
WO2024040531A1 true WO2024040531A1 (en) 2024-02-29

Family

ID=84047721

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2022/114893 WO2024040531A1 (en) 2022-08-25 2022-08-25 Novel compositions for conjugating oligonucleotides and carbohydrates

Country Status (1)

Country Link
WO (1) WO2024040531A1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009029688A2 (en) 2007-08-27 2009-03-05 Boston Biomedical, Inc. Compositions of asymmetric interfering rna and uses thereof
WO2019128611A1 (en) * 2017-12-29 2019-07-04 Suzhou Ribo Life Science Co., Ltd. Conjugates and preparation and use thereof
CN112390835A (en) * 2019-08-14 2021-02-23 苏州瑞博生物技术股份有限公司 Liver targeting compounds and conjugates

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009029688A2 (en) 2007-08-27 2009-03-05 Boston Biomedical, Inc. Compositions of asymmetric interfering rna and uses thereof
US20090208564A1 (en) 2007-08-27 2009-08-20 Chiang Jia Li Compositions of asymmetric interfering RNA and uses thereof
WO2019128611A1 (en) * 2017-12-29 2019-07-04 Suzhou Ribo Life Science Co., Ltd. Conjugates and preparation and use thereof
CN112390835A (en) * 2019-08-14 2021-02-23 苏州瑞博生物技术股份有限公司 Liver targeting compounds and conjugates

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
"Lewin's Genes XII", 2017, JONES AND BARTLETT LEARNING
"Molecular Biology and Biotechnology: a Comprehensive Desk Reference", 2011, ANMOL PUBLICATIONS PVT. LTD
BEAUCAGE ET AL., TETRAHEDRON, vol. 48, 1992, pages 2223 - 2311
GREENEWUTS: "Protective Groups in Organic Synthesis", 1991, JOHN WILEY & SONS

Similar Documents

Publication Publication Date Title
AU2018394875B2 (en) Conjugates and preparation and use thereof
US10329318B2 (en) Method for the synthesis of phosphorus atom modified nucleic acids
JP7365052B2 (en) Nucleic acids, compositions and complexes containing the nucleic acids, and preparation methods and uses
EP3719126A1 (en) Nucleic acid, composition and conjugate containing nucleic acid, preparation method therefor and use thereof
EP3718572A1 (en) Nucleic acid, composition and conjugate containing nucleic acid, preparation method and use
JP2008501693A (en) Double-stranded composition with individually regulated strands for use in gene regulation
CN111246855A (en) Compounds and methods for transmembrane delivery of molecules
CN113330117A (en) Nucleic acid, composition containing nucleic acid, conjugate, preparation method and application
TW202220695A (en) Systemic delivery of oligonucleotides
JP2024501857A (en) Cyclic disulfide-modified phosphate-based oligonucleotide prodrugs
CN110023322B (en) Novel bicyclic nucleosides and oligomers prepared therefrom
CN115298192A (en) 4&#39; -O-methylene phosphonate nucleic acids and analogs thereof
WO2020233651A1 (en) Nucleic acid, pharmaceutical composition, conjugate, preparation method, and use
WO2022175749A1 (en) Compositions for conjugating oligonucleotides and carbohydrates
WO2024040531A1 (en) Novel compositions for conjugating oligonucleotides and carbohydrates
CN112876534B (en) Liver targeting compounds and conjugates
TW202408581A (en) Novel compositions for conjugating oligonucleotides and carbohydrates
CN112759620A (en) Liver targeting compounds and oligonucleotide conjugates
TW202408490A (en) Novel compositions for conjugating oligonucleotides and carbohydrates
CN116615542A (en) Systemic delivery of oligonucleotides
JP2022120380A (en) Mirna133-b derivative and use thereof
CN116829567A (en) Oligonucleotide prodrugs based on cyclic disulfide modified phosphates

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22798233

Country of ref document: EP

Kind code of ref document: A1