KR20240038967A - Antisense compounds and methods for targeting CUG repeats - Google Patents

Antisense compounds and methods for targeting CUG repeats Download PDF

Info

Publication number
KR20240038967A
KR20240038967A KR1020247002577A KR20247002577A KR20240038967A KR 20240038967 A KR20240038967 A KR 20240038967A KR 1020247002577 A KR1020247002577 A KR 1020247002577A KR 20247002577 A KR20247002577 A KR 20247002577A KR 20240038967 A KR20240038967 A KR 20240038967A
Authority
KR
South Korea
Prior art keywords
cag
compound
amino acid
side chain
amino acids
Prior art date
Application number
KR1020247002577A
Other languages
Korean (ko)
Inventor
시우롱 선
즈칭 치앤
패트릭 도허티
마보베 케이라바디
시앙 리
Original Assignee
엔트라다 테라퓨틱스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔트라다 테라퓨틱스, 인크. filed Critical 엔트라다 테라퓨틱스, 인크.
Publication of KR20240038967A publication Critical patent/KR20240038967A/en

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/62Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being a protein, peptide or polyamino acid
    • A61K47/64Drug-peptide, drug-protein or drug-polyamino acid conjugates, i.e. the modifying agent being a peptide, protein or polyamino acid which is covalently bonded or complexed to a therapeutically active agent
    • A61K47/645Polycationic or polyanionic oligopeptides, polypeptides or polyamino acids, e.g. polylysine, polyarginine, polyglutamic acid or peptide TAT
    • A61K47/6455Polycationic oligopeptides, polypeptides or polyamino acids, e.g. for complexing nucleic acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/712Nucleic acids or oligonucleotides having modified sugars, i.e. other than ribose or 2'-deoxyribose
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P21/00Drugs for disorders of the muscular or neuromuscular system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K7/00Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
    • C07K7/64Cyclic peptides containing only normal peptide links
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K2300/00Mixtures or combinations of active ingredients, wherein at least one active ingredient is fully defined in groups A61K31/00 - A61K41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/323Chemical structure of the sugar modified ring structure
    • C12N2310/3233Morpholino-type ring
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3513Protein; Peptide

Abstract

환형 세포 투과 펩티드와 같은 환형 펩티드 및 안티센스 화합물을 포함하는 화합물이 제공된다. 안티센스 화합물은 확장된 CTG 반복을 갖는 유전자 또는 확장된 CUG 반복을 갖는 유전자 전사체에 결합한다. 화합물은 확장된 CTG·CUG 반복과 연관된 질환, 예컨대 1형 근긴장성 이영양증(DM1), 8형 척수소뇌 실조증(SCA8), 및 헌팅톤병 유사-2(HDL2)를 치료하기 위해 대상체에게 전달될 수 있다.Compounds including cyclic peptides, such as cyclic cell penetrating peptides, and antisense compounds are provided. Antisense compounds bind to genes with expanded CTG repeats or to gene transcripts with expanded CUG repeats. The compounds can be delivered to a subject to treat diseases associated with expanded CTG·CUG repeats, such as myotonic dystrophy type 1 (DM1), spinocerebellar ataxia type 8 (SCA8), and Huntington's disease-like-2 (HDL2). .

Description

CUG 반복을 표적화하기 위한 안티센스 화합물 및 방법Antisense compounds and methods for targeting CUG repeats

관련 출원에 대한 상호 참조Cross-reference to related applications

본 출원은 2021년 6월 23일에 출원된 미국 특허 가출원 제63/213,900호; 2021년 9월 1일에 출원된 미국 특허 가출원 제63/239,847호; 2021년 12월 17일에 출원된 미국 특허 가출원 제63/290,892호; 2022년 1월 31일에 출원된 미국 특허 가출원 제63/305,071호; 2022년 2월 26일에 출원된 미국 특허 가출원 제63/314,369호; 2022년 3월 4일에 출원된 미국 특허 가출원 제63/316,634호; 2022년 3월 8일에 출원된 미국 특허 가출원 제63/317,856호; 2022년 3월 31일 출원된 미국 특허 가출원 제63/326,201호; 2022년 4월 4일에 출원된 미국 특허 가출원 제63/327,179호; 2022년 5월 6일에 출원된 미국 특허 가출원 제63/339,250호; 2022년 3월 31일에 출원된 미국 특허 가출원 제63/362,295호; 2021년 9월 1일에 출원된 미국 특허 가출원 제63/239,671호; 2021년 12월 17일에 출원된 미국 특허 가출원 제63/290,960호; 2022년 1월 11일에 출원된 미국 특허 가출원 제63/298,565호; 및 2022년 2월 25일에 출원된 미국 특허 가출원 제63/268,577호의 이익을 주장한다.This application is related to U.S. Provisional Patent Application No. 63/213,900, filed on June 23, 2021; U.S. Provisional Patent Application No. 63/239,847, filed September 1, 2021; U.S. Provisional Patent Application No. 63/290,892, filed December 17, 2021; U.S. Provisional Patent Application No. 63/305,071, filed January 31, 2022; U.S. Provisional Patent Application No. 63/314,369, filed February 26, 2022; U.S. Provisional Patent Application No. 63/316,634, filed March 4, 2022; U.S. Provisional Patent Application No. 63/317,856, filed March 8, 2022; U.S. Provisional Patent Application No. 63/326,201, filed March 31, 2022; U.S. Provisional Patent Application No. 63/327,179, filed April 4, 2022; U.S. Provisional Patent Application No. 63/339,250, filed May 6, 2022; U.S. Provisional Patent Application No. 63/362,295, filed March 31, 2022; U.S. Provisional Patent Application No. 63/239,671, filed September 1, 2021; U.S. Provisional Patent Application No. 63/290,960, filed December 17, 2021; U.S. Provisional Patent Application No. 63/298,565, filed January 11, 2022; and U.S. Provisional Patent Application No. 63/268,577, filed February 25, 2022.

기술분야 Technology field

본 개시는 확장된 뉴클레오티드 반복, 특히 확장된 CTG·CUG 반복을 포함하는 유전자의 활성 및/또는 수준을 조절하기 위한 화합물, 조성물, 및 방법에 관한 것이다. 상기 화합물 및 이를 함유하는 조성물은 확장된 뉴클레오티드 반복, 특히 확장된 CTG·CUG 반복을 포함하는 유전자와 연관된 질환을 치료하는 데 사용될 수 있다.The present disclosure relates to compounds, compositions, and methods for modulating the activity and/or level of genes comprising expanded nucleotide repeats, particularly expanded CTG · CUG repeats. The compounds and compositions containing them can be used to treat diseases associated with genes containing expanded nucleotide repeats, especially expanded CTG · CUG repeats.

몇몇 질환은 확장된 뉴클레오티드 반복을 갖는 유전자, 즉 건강한 표현형에서 관찰된 것보다 더 많은 수의 뉴클레오티드 반복을 갖는 유전자와 연관이 있다. 확장된 반복은 확장된 반복 함유 전사체의 응집 및/또는 핵 형성을 야기할 수 있고/있거나 확장된 반복 함유 전사체에 결합하는 단백질의 핵 형성을 야기할 수 있다. 확장된 반복은 pre-mRNA 가공 단백질과 같은 일부 단백질을 반복 상에 격리시켜, 이들 단백질이 정상적인 기능을 수행하는 것을, 예컨대 확장된 반복을 함유하지 않는 다른 유전자의 pre-mRNA 전사체를 가공하는 것을 억제할 수 있다.Some diseases are associated with genes with expanded nucleotide repeats, that is, genes with a greater number of nucleotide repeats than observed in the healthy phenotype. Expanded repeats may cause aggregation and/or nucleation of expanded repeat-containing transcripts and/or may cause nucleation of proteins that bind to expanded repeat-containing transcripts. Expanded repeats sequester some proteins, such as pre-mRNA processing proteins, on the repeat, preventing these proteins from performing their normal functions, such as processing pre-mRNA transcripts from other genes that do not contain expanded repeats. It can be suppressed.

확장된 CTG·CUG 트리뉴클레오티드 반복을 갖는 유전자와 연관된 여러 질환이 있다(CTG는 DNA 반복을 지칭하고, CUG는 전사 후에 발생하는 상응하는 RNA 반복을 지칭함). 확장된 CTG·CUG 트리뉴클레오티드 반복을 갖는 유전자와 연관된 질환은 1형 근긴장성 이영양증(DM1), 8형 척수소뇌 실조증(SCA8), 헌팅턴병 유사-2형(HDL2), 및 푹스 각막내피 이상증(FECD)을 포함하지만 이에 한정되지는 않는다.There are several diseases associated with genes with expanded CTG · CUG trinucleotide repeats (CTG refers to a DNA repeat and CUG refers to the corresponding RNA repeat that occurs after transcription). Diseases associated with genes with expanded CTG · CUG trinucleotide repeats include myotonic dystrophy type 1 (DM1), spinocerebellar ataxia type 8 (SCA8), Huntington's disease-like-type 2 (HDL2), and Fuchs' corneal endothelial dystrophy (FECD). Including, but not limited to.

전 세계적으로 8500명 중 1명에게 영향을 미치고, 성인에서 근육 이영양증의 가장 흔한 원인인 1형 근긴장성 이영양증(DM1)은 확장된 트리뉴클레오티드 반복을 갖는 유전자와 연관이 있다(Lee 및 Cooper의 (2009) 문헌[“Pathogenic mechanisms of myotonic dystrophy,” Biochem Soc Trans. 37(06): 10.1042/BST0371281]). DM1은 골격근과 평활근뿐만 아니라 눈, 심장, 내분비계, 및 중추신경계에도 영향을 미치는 장애이다. DM1은 디스트로피아 근긴장성 이영양증 단백질 키나아제(DMPK)를 암호화하는 유전자의 비코딩 영역에서 CTG-트리뉴클레오티드 반복의 비정상적인 확장에 의해 야기된다. CTG 확장은 DMPK mRNA의 3’ 비번역 영역(3’-UTR)에 상응하는 영역 내에 위치한다. 건강한 개체에서의 DMPK 유전자는 5 내지 40개의 CTG 트리뉴클레오티드 반복을 포함하는 반면, DM1 환자는 50 내지 최대 수천 개의 CTG 트리뉴클레오티드 반복을 갖는다. CTG-트리뉴클레오티드 반복 확장은 3’ 비번역 영역(3’-UTR)에서의 CUG-확장 내 일부 조절 RNA-결합 단백질의 핵형성으로 인해, 질환을 가진 개체에서 유전자 발현의 전반적인 조절 상실을 초래하여, 머슬블라인드 유사 단백질(muscleblind-like protein, MBNL1-3)과 같은 RNA-결합 단백질이 정상적인 세포 기능을 수행할 수 없게 한다. 유핵 RNA 결합 단백질은 다른 mRNA 전사체에 결합하여 이들의 번역에 영향을 미치는 데 이용할 수 없다. 이들 CUG-확장된 mRNA-단백질 응집체는 구별되는 핵 병소를 형성한다. CUGBP Elav-유사 계열 구성원 1(CELF1)과 같은 추가 스플라이싱 인자의 활성도 파괴되어, DM1의 증상과 연관된 다수의 하류 유전자 전사체의 잘못된 스플라이싱으로 이어진다. 반복 횟수의 증가에 따라 질환 중증도가 증가하고 발병 연령이 낮아진다(Pettersson 등의 문헌[(2015) “Molecular mechanisms in DM1 - a focus on foci.” Nucleic Acids Res. 43(4):2433-2441]). Myotonic dystrophy type 1 (DM1), which affects 1 in 8500 people worldwide and is the most common cause of muscular dystrophy in adults, is associated with genes with expanded trinucleotide repeats (Lee and Cooper (2009 ) (“Pathogenic mechanisms of myotonic dystrophy,” Biochem Soc Trans. 37(06): 10.1042/BST0371281]). DM1 is a disorder that affects not only skeletal and smooth muscles, but also the eyes, heart, endocrine system, and central nervous system. DM1 is caused by abnormal expansion of CTG-trinucleotide repeats in the non-coding region of the gene encoding dystrophic myotonic dystrophy protein kinase (DMPK). The CTG extension is located within a region corresponding to the 3' untranslated region (3'-UTR) of DMPK mRNA. The DMPK gene in healthy individuals contains 5 to 40 CTG trinucleotide repeats, whereas DM1 patients have 50 to up to several thousand CTG trinucleotide repeats. CTG-trinucleotide repeat expansions result in a global loss of regulation of gene expression in diseased individuals due to nucleation of some regulatory RNA-binding proteins within the CUG-expansion in the 3' untranslated region (3'-UTR). , RNA-binding proteins such as muscleblind-like protein (MBNL1-3) prevent normal cellular functions. Nuclear RNA binding proteins are not available to bind to other mRNA transcripts and affect their translation. These CUG-extended mRNA-protein aggregates form distinct nuclear foci. The activity of additional splicing factors, such as CUGBP Elav-like family member 1 (CELF1), is also disrupted, leading to mis-splicing of multiple downstream gene transcripts that are associated with symptoms of DM1. As the number of repetitions increases, disease severity increases and the age of onset decreases (Pettersson et al. [(2015) “Molecular mechanisms in DM1 - a focus on foci.” Nucleic Acids Res. 43(4):2433-2441]) .

DMPK mRNA의 3’ 비번역 영역에서의 CUG-트리뉴클레오티드 반복은 불완전한 안정한 헤어핀 구조를 형성하는데, 이는 작은 리보핵 복합체 또는 현미경으로 보이는 내포물로 세포 핵에 축적되고, 전사, 스플라이싱, 또는 RNA 내보내기에 관여하는 단백질의 기능을 손상시킨다. CUG 반복을 갖는 DMPK 유전자가 mRNA로 전사되기는 하지만, 돌연변이체 전사체가 핵에서 응집체(병소)로서 격리되고, 그 결과 세포질 DMPK mRNA 수준이 감소한다. 이러한 응집은 2개의 RNA 결합 단백질: MBNL1(머슬블라인드-유사 1) 및 CUGBP1(CUG-결합 단백질 1)의 격리로 인한 많은 상이한 전사체의 대안적인 스플라이싱의 조절 상실로 이어지고, MBNL1의 기능 상실 및 CUGBP1의 상향 조절을 유발한다(Lee 및 Cooper의 문헌[(2009) “Pathogenic mechanisms of myotonic dystrophy,” Biochem Soc Trans. 37(06): 10.1042/BST0371281]). MBNL1 및 CUGBP-ETR-3 유사 인자 1(CELF1)은 태아가 성인이 되는 동안 스플라이싱 이벤트의 발달 조절자이며, DM1에서는 이들의 활성 변형으로 인해 성인 조직에서 태아 스플라이싱 패턴이 발현된다. MBNL1의 수준 감소와 CELF1 수준 증가가 하류에 미치는 영향은 MBNL1에 추가하여 심장 트로포닌 T(cTNT), 인슐린 수용체(INSR), 근육특이적 염화물 이온채널(CLCN1), 및 근소포체/소포체 칼슘 ATPase 1(ATP2A1) 전사체와 같은 단백질에서 대안적인 스플라이싱, mRNA 번역, 및 mRNA 붕괴의 파괴를 포함한다(Konieczny 등의 문헌[(2017) “Myotonic dystrophy: candidate small molecule therapeutics.” Drug Discov Today. 22(11):1740-174]).CUG-trinucleotide repeats in the 3' untranslated region of DMPK mRNA form incomplete stable hairpin structures, which accumulate in the cell nucleus as small ribonuclear complexes or microscopic inclusions and are not involved in transcription, splicing, or RNA export. Damages the function of proteins involved in Although the DMPK gene with CUG repeats is transcribed into mRNA, the mutant transcripts are sequestered as aggregates (foci) in the nucleus, resulting in decreased cytoplasmic DMPK mRNA levels. This aggregation leads to loss of regulation of alternative splicing of many different transcripts due to sequestration of two RNA binding proteins: muscleblind-like 1 (MBNL1) and CUG-binding protein 1 (CUGBP1), resulting in loss of function of MBNL1. and causes upregulation of CUGBP1 (Lee and Cooper (2009) “Pathogenic mechanisms of myotonic dystrophy,” Biochem Soc Trans. 37(06): 10.1042/BST0371281). MBNL1 and CUGBP-ETR-3-like factor 1 (CELF1) are developmental regulators of splicing events during fetal transition to adulthood, and in DM1, their active modifications result in expression of fetal splicing patterns in adult tissues. The downstream effects of decreased levels of MBNL1 and increased levels of CELF1 include, in addition to MBNL1, cardiac troponin T (cTNT), insulin receptor (INSR), muscle-specific chloride ion channel (CLCN1), and sarcoplasmic reticulum/endoplasmic reticulum calcium ATPase 1. (ATP2A1) involves disruption of alternative splicing, mRNA translation, and mRNA decay in protein-like transcripts (Konieczny et al. (2017) “Myotonic dystrophy: candidate small molecule therapeutics.” Drug Discov Today. 22 (11):1740-174]).

DM1, 또는 확장된 CTG·CUG 반복과 연관된 다른 질환을 치료하기 위한 가능한 치료 접근법은 치료 올리고뉴클레오티드 함유 화합물의 사용을 포함한다. 그러나, 치료제에 올리고뉴클레오티드 화합물을 사용하는 것과 연관된 주요 문제점은 이러한 화합물이 전신 투여될 때 세포내 구획에 접근할 수 있는 이들의 능력이 제한적이라는 것이다. 올리고뉴클레오티드 화합물의 세포내 전달은 중합체, 양이온성 리포좀과 같은 담체 시스템의 사용에 의하거나, 작제물의 화학적 변형에 의해, 예를 들어 콜레스테롤 분자의 공유 부착에 의해 용이해질 수 있다. 그러나, 올리고뉴클레오티드 화합물의 세포내 전달 효율은 여전히 낮다. 이들 화합물의 효능을 증가시키기 위해 개선된 전달 시스템이 여전히 요구된다.Possible therapeutic approaches for treating DM1, or other diseases associated with expanded CTG · CUG repeats, include the use of therapeutic oligonucleotide-containing compounds. However, a major problem associated with the use of oligonucleotide compounds in therapeutics is their limited ability to access intracellular compartments when these compounds are administered systemically. Intracellular delivery of oligonucleotide compounds can be facilitated by the use of carrier systems such as polymers, cationic liposomes, or by chemical modification of the construct, for example by covalent attachment of cholesterol molecules. However, the intracellular delivery efficiency of oligonucleotide compounds is still low. Improved delivery systems are still needed to increase the efficacy of these compounds.

확장된 CTG·CUG 반복에 의해 야기되는 DM1과 같은 질환을 치료하기 위해 치료 올리고뉴클레오티드 화합물을 세포내 구획에 전달하기 위한 효과적인 조성물에 대한 충족되지 않은 요구가 있다.There is an unmet need for effective compositions for delivering therapeutic oligonucleotide compounds to intracellular compartments to treat diseases such as DM1 caused by expanded CTG · CUG repeats.

확장된 CTG·CUG 반복과 연관된 질환을 치료하기 위한 화합물, 조성물, 및 방법이 본원에 기술된다. 구현예에서, 본 개시는 안티센스 화합물(AC) 및 환형 펩티드, 예컨대 환형 세포 투과 펩티드(cCPP)를 포함하는 화합물에 관한 것이다. 구현예에서, AC는 확장된 CUG 반복을 포함하는 유전자 또는 유전자 전사체에 결합한다. 구현예에서, 환형 펩티드는 AC의 세포내 국소화를 용이하게 한다. 화합물은 엔도솜 탈출 비히클(endosomal escape vehicle, EEV)을 포함할 수 있다. EEV는 환형 펩티드 및 환외 펩티드(exocyclic peptide)를 포함할 수 있다.Described herein are compounds, compositions, and methods for treating diseases associated with expanded CTG · CUG repeats. In embodiments, the present disclosure relates to compounds comprising antisense compounds (AC) and cyclic peptides, such as cyclic cell penetrating peptide (cCPP). In an embodiment, the AC binds to a gene or gene transcript comprising expanded CUG repeats. In embodiments, the cyclic peptide facilitates intracellular localization of AC. The compound may include an endosomal escape vehicle (EEV). EEV may include cyclic peptides and exocyclic peptides.

구현예에서, 다음을 포함하는 화합물이 본원에 제공된다: (a) 적어도 하나의 환형 펩티드 및 (b) 표적 뉴클레오티드에 상보적인 안티센스 화합물(AC). 구현예에서, 표적 뉴클레오티드는 적어도 하나의 확장된 CUG 또는 CTG 반복을 포함한다. 구현예에서, 표적 뉴클레오티드는 적어도 하나의 확장된 CTG 반복을 포함하는 유전자이다. 구현예에서, 표적 뉴클레오티드는 적어도 하나의 확장된 CUG 반복을 포함하는 RNA이다. 구현예에서, 적어도 하나의 확장된 CUG 반복을 포함하는 RNA는 pre-mRNA 서열이다. 구현예에서, 확장된 CUG 반복은 pre-mRNA가 전사되는 유전자에서의 확장된 CTG 반복에 상응한다. 구현예에서, 안티센스 화합물은 확장된 CTG 반복 또는 확장된 CUG 반복에 결합한다. 구현예에서, AC는 5~40개의 CAG 반복(예: 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40개의 반복)을 포함한다. 구현예에서, AC는 표 2, 표 10, 또는 표 11에 열거된 뉴클레오티드의 서열을 포함한다. 구현예에서, AC는 표 2에 열거된 뉴클레오티드의 서열을 포함한다.In an embodiment, provided herein is a compound comprising: (a) at least one cyclic peptide and (b) an antisense compound (AC) complementary to the target nucleotide. In an embodiment, the target nucleotide comprises at least one extended CUG or CTG repeat. In an embodiment, the target nucleotide is a gene comprising at least one expanded CTG repeat. In an embodiment, the target nucleotide is RNA comprising at least one expanded CUG repeat. In an embodiment, the RNA comprising at least one expanded CUG repeat is a pre-mRNA sequence. In an embodiment, the expanded CUG repeat corresponds to an expanded CTG repeat in the gene from which the pre-mRNA is transcribed. In an embodiment, the antisense compound binds to an expanded CTG repeat or an expanded CUG repeat. In embodiments, the AC has 5 to 40 CAG repeats (e.g., 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22 , 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, or 40 repeats). In an embodiment, the AC comprises a sequence of nucleotides listed in Table 2, Table 10 , or Table 11 . In an embodiment, the AC comprises a sequence of nucleotides listed in Table 2 .

구현예에서, AC는 다음으로부터 선택된 적어도 하나의 변형된 뉴클레오티드 또는 핵산을 포함한다: 포스포로티오에이트(PS) 뉴클레오티드, 포스포로디아미데이트 모르폴리노(PMO) 뉴클레오티드, 잠금 핵산(LNA), 펩티드 핵산(PNA), 2’-O-메틸(2’-OMe) 변형된 백본을 포함하는 뉴클레오티드, 2’O-메톡시-에틸(2’-MOE) 뉴클레오티드, 2’,4’ 구속된 에틸(cEt) 뉴클레오티드, 2’-데옥시-2’-플루오로-베타-D-아라비노핵산(2’F-ANA), 및 이들의 조합. 구현예에서, AC는 PMO 뉴클레오티드를 포함한다.In an embodiment, the AC comprises at least one modified nucleotide or nucleic acid selected from: phosphorothioate (PS) nucleotides, phosphorodiamidate morpholino (PMO) nucleotides, locked nucleic acids (LNA), peptides. Nucleic acid (PNA), nucleotides containing a 2'-O-methyl (2'-OMe) modified backbone, 2'O-methoxy-ethyl (2'-MOE) nucleotides, 2',4' tethered ethyl ( cEt) nucleotides, 2'-deoxy-2'-fluoro-beta-D-arabinonucleic acid (2'F-ANA), and combinations thereof. In an embodiment, AC comprises PMO nucleotides.

구현예에서, 6 내지 12개의 아미노산을 갖는 환형 펩티드를 포함하는 화합물이 제공되며, 여기서 환형 펩티드의 적어도 2개의 아미노산은 하전된 아미노산이고, 환형 펩티드의 적어도 2개의 아미노산은 방향족 소수성 아미노산이고, 환형 펩티드의 적어도 2개의 아미노산은 하전되지 않은 비방향족 아미노산이다. 구현예에서, 안티센스 화합물(AC)은 표적 mRNA 서열에서 확장된 CUG 반복의 적어도 일부에 상보적이다. 구현예에서, AC는 포스포로디아미데이트 모르폴리노(PMO) 뉴클레오티드이다.In an embodiment, provided is a compound comprising a cyclic peptide having 6 to 12 amino acids, wherein at least 2 amino acids of the cyclic peptide are charged amino acids, at least 2 amino acids of the cyclic peptide are aromatic hydrophobic amino acids, and wherein the cyclic peptide At least two amino acids are uncharged, non-aromatic amino acids. In an embodiment, the antisense compound (AC) is complementary to at least a portion of the expanded CUG repeat in the target mRNA sequence. In an embodiment, AC is a phosphorodiamidate morpholino (PMO) nucleotide.

구현예에서, 환형 펩티드의 적어도 2개의 하전된 아미노산은 아르기닌이다. 구현예에서, 환형 펩티드의 적어도 2개의 방향족 소수성 아미노산은 페닐알라닌, 나프틸알라닌(3-나프트-2-일-알라닌), 또는 이들의 조합이다. 구현예에서, 환형 펩티드의 적어도 2개의 하전되지 않은 비방향족 아미노산은 시트룰린, 글리신, 또는 이들의 조합이다. 구현예에서, 화합물은 6 내지 12개의 아미노산을 갖는 환형 펩티드이고, 여기서 환형 펩티드의 2개의 아미노산은 아르기닌이고; 적어도 2개의 아미노산은 페닐알라닌, 나프틸알라닌, 및 이들의 조합으로부터 선택된 방향족 소수성 아미노산이고; 적어도 2개의 아미노산은 시트룰린, 글리신, 및 이들의 조합으로부터 선택된 하전되지 않은 비방향족 아미노산이다.In an embodiment, at least two charged amino acids of the cyclic peptide are arginine. In an embodiment, the at least two aromatic hydrophobic amino acids of the cyclic peptide are phenylalanine, naphthylalanine (3-naphth-2-yl-alanine), or a combination thereof. In an embodiment, the at least two uncharged non-aromatic amino acids of the cyclic peptide are citrulline, glycine, or a combination thereof. In an embodiment, the compound is a cyclic peptide having 6 to 12 amino acids, wherein two amino acids of the cyclic peptide are arginine; at least two amino acids are aromatic hydrophobic amino acids selected from phenylalanine, naphthylalanine, and combinations thereof; The at least two amino acids are uncharged non-aromatic amino acids selected from citrulline, glycine, and combinations thereof.

구현예에서, 화합물은 환형 펩티드 및 환외 펩티드(EP)를 포함하는 엔도솜 탈출 비히클을 포함한다. 구현예에서, EP는 아미노기에서 링커에 접합된다. 링커는 본원에 기술된 것과 같은 링커일 수 있다. 구현예에서, EP는 링커를 통해 환형 펩티드에 접합된다. 구현예에서, EP는 링커를 통해 AC에 접합된다. 구현예에서, EP는 AC를 환형 펩티드에 접합시키는 링커에 접합된다.In an embodiment, the compound comprises an endosomal escape vehicle comprising a cyclic peptide and an extracyclic peptide (EP). In an embodiment, the EP is conjugated to the linker at the amino group. The linker may be a linker such as those described herein. In an embodiment, the EP is conjugated to the cyclic peptide via a linker. In an embodiment, EP is conjugated to AC via a linker. In an embodiment, the EP is conjugated to a linker that conjugates the AC to the cyclic peptide.

구현예에서, EP는 2 내지 10개의 아미노산을 포함한다. 구현예에서, EP는 4 내지 8개의 아미노산 잔기를 포함한다. 구현예에서, EP는 구아니딘기 또는 이의 양성자화된 형태를 포함하는 측쇄를 포함하는 1개 또는 2개의 아미노산을 포함한다. 구현예에서, EP는 1, 2, 3, 또는 4개의 리신 잔기를 포함한다. 구현예에서, 각각의 리신 잔기의 측쇄 상의 아미노기는 트리플루오로아세틸(-COCF3)기, 알릴옥시카르보닐(Alloc), 1-(4,4-디메틸-2,6-디옥소시클로헥실리덴)에틸(Dde), 또는 (4,4-디메틸-2,6-디옥소시클로헥스-1-일리덴-3)-메틸부틸(ivDde)기로 치환된다. 구현예에서, EP는 소수성 측쇄를 갖는 적어도 2개의 아미노산 잔기를 포함한다. 구현예에서, 소수성 측쇄를 갖는 아미노산 잔기는 발린, 프롤린, 알라닌, 류신, 이소류신, 및 메티오닌으로부터 선택된다. 구현예에서, 환외 펩티드는 다음 서열 중 하나를 포함한다: PKKKRKV; KR; RR; KKK; KGK; KBK; KBR; KRK; KRR; RKK; RRR; KKKK; KKRK; KRKK; KRRK; RKKR; RRRR; KGKK; KKGK; KKKKK; KKKRK; KBKBK; KKKRKV; PGKKRKV; PKGKRKV; PKKGRKV; PKKKGKV; PKKKRGV; 또는 PKKKRKG. 구현예에서, 환외 펩티드는 다음 서열 중 하나로 이루어진다: PKKKRKV; KR; RR; KKK; KGK; KBK; KBR; KRK; KRR; RKK; RRR; KKKK; KKRK; KRKK; KRRK; RKKR; RRRR; KGKK; KKGK; KKKKK; KKKRK; KBKBK; KKKRKV; PGKKRKV; PKGKRKV; PKKGRKV; PKKKGKV; PKKKRGV; 또는 PKKKRKG. 구현예에서, 환외 펩티드는 다음의 구조를 갖는다: Ac-P-K-K-K-R-K-V-.In embodiments, the EP comprises 2 to 10 amino acids. In embodiments, EP comprises 4 to 8 amino acid residues. In an embodiment, the EP comprises one or two amino acids comprising a side chain comprising a guanidine group or a protonated form thereof. In embodiments, EP comprises 1, 2, 3, or 4 lysine residues. In an embodiment, the amino group on the side chain of each lysine residue is a trifluoroacetyl (-COCF 3 ) group, allyloxycarbonyl (Alloc), 1-(4,4-dimethyl-2,6-dioxocyclohexyly) It is substituted with den)ethyl (Dde), or (4,4-dimethyl-2,6-dioxocyclohex-1-ylidene-3)-methylbutyl (ivDde) group. In an embodiment, the EP comprises at least two amino acid residues with hydrophobic side chains. In an embodiment, the amino acid residue having a hydrophobic side chain is selected from valine, proline, alanine, leucine, isoleucine, and methionine. In an embodiment, the exophytic peptide comprises one of the following sequences: PKKKRKV; KR; RR; KKK; KGK; KBK; KBR; KRK; KRR; RKK; RRR; KKKK; KKRK; KRKK; KRRK; RKKR; RRRR; KGKK; KKGK; KKKKK; KKKRK; KBKBK; KKKRKV; PGKKRKV; PKGKRKV; PKGRKV; PKKKGKV; PKKKRGV; Or PKKKRKG. In an embodiment, the exophytic peptide consists of one of the following sequences: PKKKRKV; KR; RR; KKK; KGK; KBK; KBR; KRK; KRR; RKK; RRR; KKKK; KKRK; KRKK; KRRK; RKKR; RRRR; KGKK; KKGK; KKKKK; KKKRK; KBKBK; KKKRKV; PGKKRKV; PKGKRKV; PKGRKV; PKKKGKV; PKKKRGV; Or PKKKRKG. In an embodiment, the exophytic peptide has the following structure: Ac-PKKKRKV-.

구현예에서, 환형 펜티드는 4 내지 12개의 아미노산을 포함한다. 구현예에서, 환형 펜티드는 6 내지 12개의 아미노산을 포함한다. 구현예에서, 환형 펩티드의 적어도 2개의 아미노산은 하전된 아미노산이고, 환형 펩티드의 적어도 2개의 아미노산은 방향족 소수성 아미노산이고, 환형 펩티드의 적어도 2개의 아미노산은 하전되지 않은 비방향족 아미노산이다. 구현예에서, 환형 펩티드의 적어도 2개의 하전된 아미노산은 아르기닌이고, 환형 펩티드의 적어도 2개의 방향족 소수성 아미노산은 페닐알라닌, 나프틸알라닌, 및 이들의 조합이고, 적어도 2개의 하전되지 않은 비방향족 아미노산은 시트룰린, 글리신, 및 이들의 조합이다.In an embodiment, the cyclic pentide contains 4 to 12 amino acids. In an embodiment, the cyclic pentide contains 6 to 12 amino acids. In an embodiment, at least two amino acids of the cyclic peptide are charged amino acids, at least two amino acids of the cyclic peptide are aromatic hydrophobic amino acids, and at least two amino acids of the cyclic peptide are uncharged non-aromatic amino acids. In an embodiment, the at least two charged amino acids of the cyclic peptide are arginine, the at least two aromatic hydrophobic amino acids of the cyclic peptide are phenylalanine, naphthylalanine, and combinations thereof, and the at least two uncharged non-aromatic amino acids are citrulline. , glycine, and combinations thereof.

구현예에서, 환형 펩티드는 4 내지 12개의 아미노산을 갖고, 상기 환형 펩티드의 적어도 2개의 아미노산은 아르기닌이고 적어도 2개의 아미노산은 소수성 측쇄를 포함하지만, 환형 펩티드는 서열번호 89~117의 서열을 갖는 환형 펩티드가 아니다. 구현예에서, 환형 펩티드는 서열번호 89~117의 서열을 갖는 환형 펩티드가 아니다.In an embodiment, the cyclic peptide has 4 to 12 amino acids, at least two amino acids of the cyclic peptide are arginine and at least two amino acids comprise hydrophobic side chains, but the cyclic peptide has a cyclic peptide having the sequence of SEQ ID NOs: 89-117. It's not a peptide. In an embodiment, the cyclic peptide is not a cyclic peptide having the sequence of SEQ ID NOs: 89-117.

여기서, F는 L-페닐알라닌이고, f는 D-페닐알라닌이고, Φ는 L-3-(2-나프틸)-알라닌이고, Φ는 D-3-(2-나프틸)-알라닌이고, R은 L-아르기닌이고, r은 D-아르기닌이고, Q는 L-글루타민이고, q는 D-글루타민이고, C는 L-시스테인이고, U는 L-셀레노시스테인이고, W는 L-트립토판이고, K는 L-리신이고, D는 L-아스파르트산이고, Ω은 L-노르류신이다.where F is L-phenylalanine, f is D-phenylalanine, Φ is L-3-(2-naphthyl)-alanine, Φ is D-3-(2-naphthyl)-alanine, and R is is L-arginine, r is D-arginine, Q is L-glutamine, q is D-glutamine, C is L-cysteine, U is L-selenocysteine, W is L-tryptophan, K is L-lysine, D is L-aspartic acid, and Ω is L-norleucine.

구현예에서, 환형 펩티드는 다음 구조:In an embodiment, the cyclic peptide has the following structure:

(A), 또는 (A), or

이의 양성자화된 형태를 가지며,It has a protonated form,

식 중:During the ceremony:

R1, R2, 및 R3은 각각 독립적으로 H이거나 아미노산의 방향족 또는 헤테로방향족 측쇄이고;R 1 , R 2 , and R 3 are each independently H or an aromatic or heteroaromatic side chain of an amino acid;

R1, R2, 및 R3 중 적어도 하나는 아미노산의 방향족 또는 헤테로방향족 측쇄이고;At least one of R 1 , R 2 , and R 3 is an aromatic or heteroaromatic side chain of an amino acid;

R4, R5, R6, 및 R7은 독립적으로 H이거나 아미노산 측쇄이고;R 4 , R 5 , R 6 , and R 7 are independently H or an amino acid side chain;

R4, R5, R6, R7 중 적어도 하나는 3-구아니디노-2-아미노프로피온산, 4-구아니디노-2-아미노부탄산, 아르기닌, 호모아르기닌, N-메틸아르기닌, N,N-디메틸아르기닌, 2,3-디아미노프로피온산, 2,4-디아미노부탄산, 리신, N-메틸리신, N,N-디메틸리신, N-에틸리신, N,N,N-트리메틸리신, 4-구아니디노페닐알라닌, 시트룰린, N,N-디메틸리신, β-호모아르기닌, 3-(1-피페리디닐)알라닌의 측쇄이고;At least one of R 4 , R 5 , R 6 , and R 7 is 3-guanidino-2-aminopropionic acid, 4-guanidino-2-aminobutanoic acid, arginine, homoarginine, N-methylarginine, N, N-dimethylarginine, 2,3-diaminopropionic acid, 2,4-diaminobutanoic acid, lysine, N-methyllysine, N,N-dimethyllysine, N-ethylysine, N,N,N-trimethyllysine, It is the side chain of 4-guanidinophenylalanine, citrulline, N,N-dimethyllysine, β-homoarginine, and 3-(1-piperidinyl)alanine;

AASC는 안티센스 화합물이 접합되는 아미노산 측쇄이고;AA SC is the amino acid side chain to which the antisense compound is conjugated;

q는 1, 2, 3, 또는 4이다.q is 1, 2, 3, or 4.

구현예에서, R4, R5, R6, 및 R7 중 적어도 하나는 독립적으로 아미노산의 하전되지 않은 비방향족 측쇄이다. 구현예에서, R4, R5, R6, 및 R7 중 적어도 하나는 독립적으로 H이거나 시트룰린의 측쇄이다.In embodiments, at least one of R 4 , R 5 , R 6 , and R 7 is independently an uncharged, non-aromatic side chain of an amino acid. In embodiments, at least one of R 4 , R 5 , R 6 , and R 7 is independently H or a side chain of citrulline.

구현예에서, 환형 펩티드는 식 I의 구조:In an embodiment, the cyclic peptide has the structure of Formula I:

(I) (I)

또는 이의 양성자화된 형태를 가지며,or a protonated form thereof,

식 중:During the ceremony:

R1, R2, 및 R3은 각각 독립적으로 H이거나 방향족기를 포함하는 측쇄를 갖는 아미노산 잔기이고;R 1 , R 2 , and R 3 are each independently H or an amino acid residue having a side chain containing an aromatic group;

R1, R2, 및 R3 중 적어도 하나는 아미노산의 방향족 또는 헤테로방향족 측쇄이고;At least one of R 1 , R 2 , and R 3 is an aromatic or heteroaromatic side chain of an amino acid;

R4 및 R7은 독립적으로 H이거나 아미노산 측쇄이고;R 4 and R 7 are independently H or an amino acid side chain;

AASC는 안티센스 화합물이 접합되는 아미노산 측쇄이고;AA SC is the amino acid side chain to which the antisense compound is conjugated;

q는 1, 2, 3, 또는 4이고;q is 1, 2, 3, or 4;

각각의 m은 독립적으로 0, 1, 2, 또는 3의 정수이다.Each m is independently an integer of 0, 1, 2, or 3.

구현예에서, 식 (I)의 환형 펩티드는 다음 구조 중 어느 하나:In an embodiment, the cyclic peptide of formula (I) has any of the following structures:

(I-a), (Ia),

(I-b), 또는 (Ib), or

이의 양성자화된 형태를 갖는다.It has its protonated form.

구현예에서, 식 (I)의 환형 펩티드는 다음 구조 중 어느 하나:In an embodiment, the cyclic peptide of formula (I) has any of the following structures:

(I-1), (I-1),

(I-2), (I-2),

(I-3), (I-3),

(I-4), (I-4),

(I-5), (I-5),

(I-6), 또는 (I-6), or

또는 이의 양성자화된 형태를 갖는다.or a protonated form thereof.

구현예에서, 식 (I)의 환형 펩티드는 다음 구조 중 어느 하나:In an embodiment, the cyclic peptide of formula (I) has any of the following structures:

(I-1), (I-1),

(I-2), 또는 (I-2), or

또는 이의 양성자화된 형태를 갖는다.or a protonated form thereof.

구현예에서, 식 (I)의 환형 펩티드는 다음 구조:In an embodiment, the cyclic peptide of formula (I) has the following structure:

(I-1), 또는 (I-1), or

또는 이의 양성자화된 형태를 갖는다.or a protonated form thereof.

구현예에서, 화합물은 식 C의 구조:In an embodiment, the compound has the structure of Formula C:

(C), 또는 (C), or

이의 양성자화된 형태 또는 염을 가지며,has a protonated form or salt thereof,

식 중:During the ceremony:

R1, R2, 및 R3은 각각 독립적으로 H이거나 아릴 또는 헤테로아릴기를 포함하는 측쇄이고, R1, R2, 및 R3 중 적어도 하나는 아릴 또는 헤테로아릴기를 포함하는 측쇄이고;R 1 , R 2 , and R 3 are each independently H or a side chain containing an aryl or heteroaryl group, and at least one of R 1 , R 2 , and R 3 is a side chain containing an aryl or heteroaryl group;

R4 및 R7은 독립적으로 H이거나 아미노산 측쇄이고;R 4 and R 7 are independently H or an amino acid side chain;

EP는 환외 펩티드이고;EP is an exophytic peptide;

각각의 m은 독립적으로 0~3의 정수이고;Each m is independently an integer from 0 to 3;

n은 0~2의 정수이고;n is an integer from 0 to 2;

x’은 1~23의 정수이고;x’ is an integer from 1 to 23;

y는 1~5의 정수이고;y is an integer from 1 to 5;

q는 1~4의 정수이고;q is an integer from 1 to 4;

z’은 1~23의 정수이고;z’ is an integer from 1 to 23;

화물은 안티센스 화합물이다.The cargo is an antisense compound.

구현예에서, 화합물은 다음 구조 중 하나:In embodiments, the compound has one of the following structures:

(C-1), (C-1),

(C-2), (C-2),

(C-3), (C-3),

(C-4) (C-4)

또는 이의 양성자화된 형태 또는 염을 가지며,or a protonated form or salt thereof,

식 중 EP는 환외 펩티드이고,In the formula, EP is an exophytic peptide,

올리고뉴클레오티드는 안티센스 화합물이다.Oligonucleotides are antisense compounds.

구현예에서, 식 (C-1), (C-2), (C-3), 또는 (C-4)의 화합물의 올리고뉴클레오티드는 다음의 서열을 포함한다: 5’-CAG CAG CAG CAG CAG CAG CAG-3’.In an embodiment, the oligonucleotide of a compound of formula (C-1), (C-2), (C-3), or (C-4) comprises the following sequence: 5'-CAG CAG CAG CAG CAG CAG CAG-3'.

구현예에서, 식 (C-1), (C-2), (C-3), 또는 (C-4)의 화합물의 EP는 다음의 서열을 포함한다: PKKKRKV.In an embodiment, the EP of a compound of formula (C-1), (C-2), (C-3), or (C-4) comprises the following sequence: PKKKRKV.

도면의 간단한 설명
도 1은 mRNA에서 CUG 반복을 표적화하기 위한 다수의 전략을 보여주는 개략도이다.
도 2는 본원에 기술된 안티센스 올리고뉴클레오티드에 사용된 변형된 뉴클레오티드를 보여준다. 구조 1~3(1 = 포스포로티오에이트; 2 = (SC5-Rp)-α,β-CAN; 3 = PMO)은 인산염 백본 변형이고; 4(2-티오-dT)는 염기 변형이고; 5~8(5 = 2’-OMe-RNA; 6 = 2’O-MOE-RNA; 7 = 2’F-RNA; 8 = 2’F-ANA)는 2’ 당 변형이고; 9~11은 구속된 뉴클레오티드이고; 12~14(9 = LNA; 10 = (S)-cET; 11 = tcDNA; 12 = FHNA; 13 = (S)5’-C-메틸; 14 = UNA)는 추가 당 변형이고; 15~18(15 = E -VP; 16 = 메틸 포스포네이트; 17 = 5’ 포스포로티오에이트; 18 = 인산염이 포함된 (S)-5’-C-메틸)은 5’ 인산염 안정화 변형이고; 19는 모르폴리노 당이다. Khvorova, A., 등의 문헌[Nat. Biotechnol. 2017 Mar; 35(3): 238-248]으로부터 서식을 재구성함.
도 3a~3d는 AC를 환형 세포 투과 펩티드에 연결하기 위한 접합 화학을 도시한다. 도 3a는 카르복시산기를 가진 펩티드 또는 TFP 활성화된 에스테르를 가진 펩티드와 AC의 5’ 단부에 있는 일차 아민 잔기 사이에서 아미드 결합이 형성되는 것을 보여준다. 도 3b는 3’에서 이차 아민 변형된 AC 또는 일차 아민 변형된 AC와 펩티드-TFP 에스테르가 아미드 결합 형성을 통해 접합되는 것을 보여준다. 도 3c는 구리-무함유 아지드-알킨 시클로첨가를 통해, 펩티드-아지드가 5’ 시클로옥틴 변형된 AC에 접합되는 것을 보여준다. 도 3d는 구리-무함유 아지드-알킨 시클로첨가 또는 구리 촉매된 아지드-알킨 시클로첨가를 통해(클릭 반응), 3’ 변형된 시클로옥틴 AC 또는 3’ 변형된 아지드 AC와 링커-아지드 또는 링커-알킨/시클로옥틴 모이어티를 함유하는 CPP가 접합되는 또 다른 예시를 각각 보여준다.
도 4는 AC 및 CPP를 폴리에틸렌 글리콜(PEG) 모이어티를 함유하는 추가 링커 모달리티와 연결하기 위한 접합 화학을 도시한다.
도 5a~5d는 포스포로디아미데이트-연결된 모르폴리노 올리고머(PMO)를 합성하는 데 사용될 수 있는 아데신(5a), 시토신(5b), 구아닌(5c), 및 티민(5d) 모르폴리노 서브유닛 단량체의 구조를 제공한다.
도 6a~6f는 엔도-포터(Endo-Porter) 형질감염제를 사용하거나(6a~6c) 엔도-포터 제제 없이(6e~6f) 1 μM, 3 μM, 또는 10 μM의 다양한 PMO 또는 PMO-EEV 화합물로 HeLa-48 세포를 치료하고 24시간 후(6a~6b) 및 48시간 후에(6c~6d), MBNL1(엑손 5; 도 6a, 6b, 6e) 및 CLASP1(엑손 19; 도 6b, 6d, 6f)의 대안적인 RNA 스플라이싱 이벤트(예: 엑손 포함 또는 배제)에 대한 RT-PCR 분석을 보여준다. 엔도-포터 제제를 사용하거나(6a~6d) 엔도-포터 제제없이(6e~6f) 치료한 부모 HeLa 세포주 및 HeLa-480 세포주를 대조군으로서 포함시켰다.
도 7a~7b는 엔도-포터 형질감염제 없이 1 μM의 다양한 PMO 또는 PMO-EEV 화합물로 DM1 근아세포를 치료하고 48시간 후에, MBNL1(엑손 5; 도 7a) 및 CLASP1(엑손 19; 도 7b)의 대안적인 스플라이싱 이벤트(예: 엑손 포함 또는 배제)에 대한 RT-PCR 분석을 보여준다. 2개의 대조군, 즉 엔도-포터 없이 치료한 DM-04 및 엔도-포터 없이 치료한 DM-05를 대조군으로서 포함시켰다.
도 8a~8d는 PMO, 20 mpk PMO-EEV 221-1106, 또는 40 mpk PMO-EEV 221-1106으로 HSA-LR(DM1-마우스 모델) 마우스를 치료하고 1주일 후에, 이 마우스의 비복근 조직에서 채취한 Atp2a1(엑손 22; 도 8a), Nfix(엑손 7; 도 8b), Clcn1(엑손 7a; 도 8c), 및 Mbnl1(엑손 5; 도 8d)의 대안적인 RNA 스플라이싱 이벤트(예: 엑손 포함 또는 배제)에 대한 RT-PCR 분석을 보여준다. FVB/NJ(야생형 교배 마우스) 및 HSA-LR(치료 없음) 마우스를 대조군으로서 포함시켰다.
도 9a~9d는 PMO, 20 mpk PMO-EEV 221-1106, 또는 40 mpk PMO-EEV 221-1106으로 HSA-LR(DM1-마우스 모델) 마우스를 치료하고 1주일 후에, 이 마우스의 사두근 조직에서 채취한 Atp2a1(엑손 22; 도 9a), Nfix(엑손 7; 도 9b), Clcn1(엑손 7a; 도 9c), 및 Mbnl1(엑손 5; 도 9d)의 대안적인 RNA 스플라이싱 이벤트(예: 엑손 포함 또는 배제)에 대한 RT-PCR 분석을 보여준다. FVB/NJ(야생형 교배 마우스) 및 HSA-LR(치료 없음) 마우스를 대조군으로서 포함시켰다.
도 10a~10d는 PMO, 20 mpk PMO-EEV 221-1106, 또는 40 mpk PMO-EEV 221-1106으로 HSA-LR(DM1-마우스 모델) 마우스를 치료하고 1주일 후에, 이 마우스의 전경골근 조직에서 채취한 Atp2a1(엑손 22; 도 10a), Nfix(엑손 7; 도 10b), Clcn1(엑손 7a; 도 10c), 및 Mbnl1(엑손 5; 도 10d)의 대안적인 RNA 스플라이싱 이벤트(예: 엑손 포함 또는 배제)에 대한 RT-PCR 분석을 보여준다. FVB/NJ(야생형 교배 마우스) 및 HSA-LR(치료 없음) 마우스를 대조군으로서 포함시켰다.
도 11a~11f는 DM1 환자 유래의 근육 세포를 상이한 농도의 (10μm, 3μm, 1μm, 0.3μm) DMPK CUG-표적화 EEV-PMO(CUGexp 197-777 및 CUGexp 221-1106)로 치료한 후, MBNL1(엑손 5, 도 11a), SOS1(엑손 25, 도 11b), IR(엑손 11, 도 11c), DMD(엑손 78, 도 11d), BIN1(엑손 11, 도 11e), 및 LDB3(엑손 11, 도 11f)의 대안적인 RNA 스플라이싱 이벤트(예: 엑손 포함 또는 배제)에 대한 RT-PCR 분석을 보여준다. 대조군으로서 건강한 사람(음성 대조군) 및 DM1 환자(양성 대조군)의 2개 군의 근육 세포를 대안적인 RNA 스플라이싱 이벤트에 대해 시험하였다. 모든 데이터는 3회의 개별 실험(n=3)으로부터 수집하였다. 치료된 DM1 근관 대 치료되지 않은 DM1 근관의 T-검정을 수행하였다; * p < 0.05; ** p < 0.01; *** p < 0.001.
도 12a~12f는 환자 유래의 DM1 근아세포 및 근관을 10μm, 3μm, 또는 1μm의 DMPK CUG-표적화 EEV-PMO 197-777로 치료한 후, MBL1(엑손 5, 도 12a), SOS1(엑손 25, 도 12b), INSR (엑손 11, 도 12c), DMD(엑손 78, 도 12d), BIN1(엑손 11, 도 12e), 및 LDB3(엑손 11, 도 12f)의 대안적인 RNA 스플라이싱 이벤트(예: 엑손 포함 또는 배제)에 대한 RT-PCR 분석을 보여준다. 건강한 환자 세포 및 DM1 세포를 대조군으로서 사용하였다. 모든 데이터는 3회의 개별 실험(n=3)으로부터 수집하였다. 치료된 DM1 근관 대 치료되지 않은 DM1 근관의 T-검정을 수행하였다; * p < 0.05; ** p < 0.01; *** p < 0.001.
도 13a~13b는 다양한 농도의 PMO-EEV 221-1120로 HSA-LR 마우스를 치료한 후, mRNA의 상대 수준을 보여준다. 도 13a는 비복근, 삼두근, 전경골, 및 횡격막에 대한 상대적인 mRNA 수준을 보여준다. 도 13b는 횡격막에서 상대적인 mRNA 수준을 보여준다.
도 14a~14c는 다양한 농도의 PMO-EEV 221-1120로 HSA-LR 마우스를 치료한 후, 사두근(14a), 비복근(14b), 삼두근(14c), 및 전경골(14d) 조직에서 mRNA의 상대 수준을 보여준다.
도 15a~15d는 다양한 농도의 PMO-EEV 221-1120으로 HSA-LR 마우스를 치료한 후, 사두근(도 15a), 비복근(도 15b), 삼두근(도 15c), 및 전경골(도 15d)에서 다양한 유전자에 대한 마우스 DM1 스플라이싱 지수(mDSI)를 보여준다.
도 16a~16c는 HSA-LR 마우스를 치료하지 않거나 EEV-PMO 221-1120(EEV-PMO-DM1-3; DM1-3)로 치료한 후, 전경골근에서 RNA 병소의 유병률을 보여준다. 도 16a~16b는 RNA CUG 병소(적색) 및 핵(청색)에 대해 염색한 전경골근 조직의 이미지를 보여준다. 도 16c도 16a~16b에서의 이미지와 연관된 데이터로부터 CUG 병소를 가진 핵의 백분율을 정량화한 도표이다.
도 17a~17f는 다양한 농도의 EEV-PMO-DM1-3으로 HSA-LR 마우스를 치료한 후, 사두근(17a), 삼두근(17b), 심장(17c), 비복근(17d), 전경골(17e), 횡격막(17f), 뇌(17h), 간(17i), 및 신장(17j) 조직에서 약물 수준에 대한 투여량 의존적 반응을 보여주는 도표이다. 도 17k는 60 mpk 투여량 수준에서 다양한 조직의 약물 노출을 보여준다.
도 18은 15, 30, 60, 및 90 mpk의 EEV-PMO-DM1-3으로 치료하고 7일 후에, HSA-LR 마우스에서 근긴장증의 투여량 의존적 감소를 보여준다.
도 19a~19d는 비질환 마우스(WT), DM1 마우스(HSA-LR), 및 PMO-EEV 221-1120로 치료한 HSA-LR 마우스에서의 유전자 발현을 비교하는 주요 성분 분석의 결과를 보여주는 도표이다. 도 19a 19c는 3개의 주요 성분을 보여주는 도표이고, 도 19b 19d는 2개의 주요 성분을 보여주는 도표이다.
도 20a~20b는 비질환 마우스(WT), DM1 마우스(HSA-LR), 및 60 mpk PMO-EEV 221-1120로 치료한 HSA-LR 마우스 사이에서 차등 발현된 유전자의 히트맵을 보여준다. 도 20a는 513개의 차등 발현된 유전자를 보여주는 군집형 히트맵이다. 도 20b는 CTG·CUG 반복을 갖는 것으로 알려진 40개의 유전자를 보여주는 군집형 히트맵이다.
도 21은 미치료 HSA-LR 마우스 및 PMO-EEV 221-1120로 치료한 마우스에 걸친 전반적인 전사 변화를 보여주는 화산 도표이다.
도 22a~22e는 비질환 마우스, HSA-LR 마우스, 및 PMO-EEV 221-1120으로 치료한 HSA-LR 마우스로부터의 Scube2(22a), Greb1(22b), Ttc7(22c), Txlnb(CUG)9(22d), 및 Ndrg3(22e) 유전자에 대한 주요 성분 분석의 결과를 보여주는 도표이다.
도 23a~23d는 비질환 마우스(WT-식염수), HSA-LR 마우스(HSA-LR 식염수), 및 PMO-EEV 221-1120으로 치료한 HSA-LR 마우스의 Atp2a1(23a; 엑손 22는 박스로 표시됨), Clcn1(23b; 엑손 7a는 박스로 표시됨), Nfix(23c; 엑손 7은 박스로 표시됨), 및 Mbn1(23d; 엑손 5는 박스로 표시됨)에 대한 RNA 시퀀싱(RNAseq) 데이터를 보여준다. 각 치료군에 대해 2개의 판독이 도시되어 있다.
도 24는 비질환 마우스(WT-식염수), HSA-LR 마우스(HSA-LR 식염수), 및 PMO-EEV 221-1120으로 치료한 HSA-LR 마우스의 다양한 관심 유전자에 대한 개별 엑손의 스플라이싱 지수 백분율(PSI)을 보여준다.
도 25a~25d는 80 mpk(60 mpk 올리고, 80 mpk 전체 약물) EEV-PMO-DM1-3으로 HSA-LR 마우스를 치료하고 1주 내지 4주 후에, 전경골(25a), 비복근(25b), 삼두근(25c), 및 사두근(25d) 조직에서의 약물 수준을 보여준다.
도 26a~26d는 80 mpk의 EEV-PMO-DM1-3을 1회씩 투여하여 HSA-LR 마우스를 치료한 후, 마우스에서의 약물 수준을 보여준다. 도 26a~26b는 치료 후 1주에서 12주까지 간에서의 약물 수준을 보여준다. 도 26c~26d는 치료 후 1주에서 12주까지 신장에서의 약물 수준을 보여준다.
도 27a~27c는 DM1 환자 유래의 근육 세포를 30 μM의 EEV-PMO-DM1-3으로 치료한 후 MBNL1(엑손 5; 26a), SOS1(엑손 25; 26b), 및 NFIX(엑손 7; 26c)에 대한 엑손 포함 수준을 보여주는 도표이다.
도 28a~28c는 EEV-PMO-DM1-3이 DM1 환자 유래 근육 세포의 핵(청색)에서 CUG 핵 병소(녹색)를 감소시킨다는 것을 보여준다. 도 28a~28b는 치료하지 않았거나 EEV-PMO-DM1-3으로 치료하였거나 치료하지 않은 DM1 환자 유래의 근육 세포의 이미지이다. 도 28c도 28a에서의 이미지와 연관된 데이터에 대해 핵 당 CUG 병소의 수를 정량화한 것이다.
도 29a~29b는 RPTEC 세포를 다양한 농도의 PMO-DM1 또는 EEV-PMO-DM1-3으로 치료한 CELLTITER-GLO 발광 생존력 검정의 원시 데이터(29a) 및 정규화된 데이터(29b)를 보여준다. 멜리틴을 양성 대조군으로서 사용하였다.
도 30a~30c는 DM1 환자-유래 세포(30a) 및 EEV-PMO 221-1113으로 치료한 DM1 환자-유래 세포(30b)에서 RNA CUG 반복 병소를 도시한 이미지를 보여준다. 세포를 핵(청색; Hoechst) 및 RNA CUG 병소(녹색)에 대해 염색하였다. 도 30c도 30a~30b의 이미지와 연관된 데이터에 대한 핵 면적 당 CUG RNA 병소의 도표이다.
도 31a~31b는 HeLa, 치료하지 않은 HeLa480, 및 EEV-PMO 221-1113으로 치료한 HeLa480 세포에서 RNA CUG7 병소의 유병률을 보여준다. 도 31a는 RNA CUG7 병소(녹색) 및 핵(청색)에 대해 염색한 세포의 이미지를 보여준다. 도 31b도 31a의 이미지와 연관된 데이터에 대한 핵 면적 당 CUG7 병소를 정량화한 도표이다.
도 32a~32c는 DM1 환자-유래 세포를 30 μM의 EEV-PMO 221-1113으로 치료한 후 MBNL1에서 엑손 5 포함 백분율(32a), SOS1에서 엑손 25 포함 백분율(32b), 및 NFIX에서 엑손 7 포함 백분율(32c)을 보여주는 도표이다.
도 33a~33e는 DM1 환자 유래의 근육 세포를 다양한 농도의 PMO-EEV 221-1113으로 치료한 후 MBNL1(엑손 5; 33a), SOS1(엑손 25; 33b), CLASP1(엑손 19, 33c), NFIX(엑손 7, 33d), 및 INSR(엑손 11, 33e)의 대안적인 RNA 스플라이싱 이벤트(예: 엑손 포함)에 대한 RT-PCR 분석을 보여준다. T-검정을 사용하여 유의성을 결정하였다; * p < 0.05; ** p < 0.01; *** p < 0.001.
도 34a~34d는 다양한 농도의 PMO 221 또는 EEV-PMO 221-1106으로 치료한 마우스의 비복근 조직에서 Atp2a1(엑손 22, 34a), Nfix(엑손 7, 34b), Clcn1(엑손 7a, 34c), 및 Mbnl1(엑손 5, 34d)의 대안적인 RNA 스플라이싱 이벤트(예: 엑손 포함)에 대한 RT-PCR 분석을 보여준다.
도 35a~35c는 PMO-EEV 0221-1121(21량체) 또는 PMO-EEV 0325-1121(24량체)로 치료한 HSA-LR 마우스의 전경골근 조직에서 Mbnl1(엑손 5, 35a), Nfix(엑손 7, 35b), 및 Atp2a1(엑손 22, 35c)의 대안적인 RNA 스플라이싱 이벤트(예: 엑손 포함 또는 배제)에 대한 RT-PCR 분석을 보여준다.
도 36a~36c는 PMO-EEV 0221-1121(21량체) 또는 PMO-EEV 0325-1121(24량체)로 치료한 HSA-LR 마우스의 비복근 조직에서 Mbnl1(엑손 5, 36a), Nfix(엑손 7, 36b), 및 Atp2a1(엑손 22, 36c)의 대안적인 RNA 스플라이싱 이벤트(예: 엑손 포함)에 대한 RT-PCR 분석을 보여준다.
도 37은 생체 내에서 검출된 PMO-EEV 220-1120의 주요 대사산물인 PMO-0221a를 보여준다.
도 38a~38b는 Hela480 세포를 다양한 농도의 EEV-PMO 221-1120으로 치료한 후 전경골(38a) 및 비복근(38b)에서 MBNL1(엑손 5)에 대한 엑손 포함 백분율을 보여준다.
도 39a~39b는 Hela480 세포를 다양한 농도의 EEV-PMO 221-1120으로 치료한 후 전경골(39a) 및 비복근(39b)에서 NFIX(엑손 7)에 대한 엑손 포함 백분율을 보여준다.
도 40a~40b는 Hela480 세포를 다양한 농도의 EEV-PMO 221-1120으로 치료한 후 전경골(40a) 및 비복근(40b)에서 Atp2a1(엑손 22)에 대한 엑손 포함 백분율을 보여준다.
도 41은 다양한 농도의 EEV-PMO 221-1120로 치료한 후 Hela480 세포에서 RNA CUG 반복 병소를 도시한 이미지(41a)를 보여준다. 도 41b도 41a의 이미지와 연관된 데이터에 대한 핵 면적 당 RNA 병소의 도표이다.
도 42a~42d는 다양한 농도의 EEV-PMO 221-1120으로 치료한 후 HeLa480 세포에서 상대적인 r(CUG480) 반복 mRNA 수준(42a), 상대적인 DMPK mRNA 수준(42b), MBNL1의 엑손 5 포함 백분율(42c), 및 SOS1에서 엑손 25 포함 백분율(42d)을 보여준다.
도 43은 CTG·CUG 반복을 가진 것으로 알려진 근육 조직에서 발현된 유전자의 예를 보여주는 막대 차트이다.
도 44a~44d는 20 mpk의 PMO-EEV 221-1106으로 치료한 HSA-LR 마우스 모델에서 근긴장증 표현형 감소를 보여준다. 도 44a 44c는 근육 이완의 도표를 보여준다. 도 44b는 예시적인 근력 트레이스의 원시 데이터를 보여준다. 도 44d는 대표적인 근전도 트레이스를 보여준다.
Brief description of the drawing
Figure 1 is a schematic showing multiple strategies for targeting CUG repeats in mRNA.
Figure 2 shows modified nucleotides used in the antisense oligonucleotides described herein. Structures 1 to 3 (1 = phosphorothioate; 2 = (S C5 -R p )-α,β-CAN; 3 = PMO) are phosphate backbone modifications; 4(2-thio-dT) is a base modification; 5 to 8 (5 = 2'-OMe-RNA; 6 = 2'O-MOE-RNA; 7 = 2'F-RNA; 8 = 2'F-ANA) are 2' sugar modifications; 9-11 are bound nucleotides; 12-14 (9 = LNA; 10 = ( S )-cET; 11 = tcDNA; 12 = FHNA; 13 = (S)5'-C-methyl; 14 = UNA) are additional sugar modifications; 15-18 (15 = E -VP; 16 = methyl phosphonate; 17 = 5'phosphorothioate; 18 = (S)-5'-C-methyl with phosphate) are the 5' phosphate stabilizing modifications; ; 19 is a morpholino sugar. Khvorova, A., et al. [Nat. Biotechnology. 2017 Mar; Format reconstructed from [35(3): 238-248].
Figures 3A-3D depict the conjugation chemistry for linking AC to a cyclic cell penetrating peptide. Figure 3a shows the formation of an amide bond between a peptide with a carboxylic acid group or a peptide with a TFP activated ester and the primary amine residue at the 5' end of AC. Figure 3b shows the conjugation of peptide-TFP ester with secondary amine modified AC or primary amine modified AC at the 3' through amide bond formation. Figure 3C shows peptide-azide conjugation to 5' cyclooctyne modified AC via copper-free azide-alkyne cycloaddition. Figure 3D shows linker-azide with 3' modified cyclooctyne AC or 3' modified azide AC via copper-free azide-alkyne cycloaddition or copper catalyzed azide-alkyne cycloaddition (click reaction). Alternatively, another example is shown in which a CPP containing a linker-alkyne/cyclooctyne moiety is conjugated.
Figure 4 depicts the conjugation chemistry for linking AC and CPP with additional linker modalities containing polyethylene glycol (PEG) moieties.
Figures 5A-5D show adesine ( 5a ), cytosine ( 5b ), guanine ( 5c ), and thymine ( 5d ) morpholinos that can be used to synthesize phosphorodiamidate-linked morpholino oligomers (PMOs). The structure of the subunit monomer is provided.
Figures 6a-6f show various PMO or PMO-EEV at 1 μM, 3 μM, or 10 μM with ( 6a-6c ) or without ( 6e-6f ) Endo-Porter transfection agent. 24 h ( 6a–6b ) and 48 h ( 6c–6d ) after treatment of HeLa-48 cells with the compounds, MBNL1 (exon 5; Figures 6a, 6b, 6e ) and CLASP1 (exon 19; Figures 6b, 6d; 6f ) shows RT-PCR analysis of alternative RNA splicing events (e.g. exon inclusion or exclusion). Parental HeLa cell lines and HeLa-480 cell lines treated with endo-porter agents ( 6a-6d ) or without endo-porter agents ( 6e-6f ) were included as controls.
Figures 7A-7B show MBNL1 (exon 5; Figure 7A ) and CLASP1 (exon 19; Figure 7B ) 48 hours after treatment of DM1 myoblasts with 1 μM of various PMO or PMO-EEV compounds without endo-porter transfectant. RT-PCR analysis of alternative splicing events (e.g., exon inclusion or exclusion) is shown. Two controls were included as controls: DM-04 treated without Endo-Porter and DM-05 treated without Endo-Porter.
Figures 8A-8D show gastrocnemius tissue samples from HSA-LR (DM1-mouse model) mice 1 week after treatment with PMO, 20 mpk PMO-EEV 221-1106, or 40 mpk PMO-EEV 221-1106. Alternative RNA splicing events in Atp2a1 (exon 22; Fig. 8A ), Nfix (exon 7; Fig. 8B ), Clcn1 (exon 7a; Fig. 8C ), and Mbnl1 (exon 5; Fig. 8D ), e.g. or exclusion). FVB/NJ (wild-type crossbred mice) and HSA-LR (no treatment) mice were included as controls.
Figures 9A-9D show quadriceps tissue samples from HSA-LR (DM1-mouse model) mice 1 week after treatment with PMO, 20 mpk PMO-EEV 221-1106, or 40 mpk PMO-EEV 221-1106. Alternative RNA splicing events in Atp2a1 (exon 22; Fig. 9A ), Nfix (exon 7; Fig. 9B ), Clcn1 (exon 7a; Fig. 9C ), and Mbnl1 (exon 5; Fig. 9D ), e.g. or exclusion). FVB/NJ (wild-type crossbred mice) and HSA-LR (no treatment) mice were included as controls.
Figures 10A-10D show tibialis anterior tissue from HSA-LR (DM1-mouse model) mice 1 week after treatment with PMO, 20 mpk PMO-EEV 221-1106, or 40 mpk PMO-EEV 221-1106. Alternative RNA splicing events (e.g. exon 5; Figure 10d ) of Atp2a1 (exon 22; Figure 10a ), Nfix (exon 7; Figure 10b ), Clcn1 (exon 7a; Figure 10c ), and Mbnl1 (exon 5; Figure 10d ) were harvested. RT-PCR analysis for inclusion or exclusion) is shown. FVB/NJ (wild-type crossbred mice) and HSA-LR (no treatment) mice were included as controls.
Figures 11A-11F show muscle cells from DM1 patients after treatment with different concentrations (10 μm, 3 μm, 1 μm, 0.3 μm) of DMPK CUG-targeted EEV-PMO (CUG exp 197-777 and CUG exp 221-1106). MBNL1 (exon 5, Figure 11A ), SOS1 (exon 25, Figure 11B ), IR (exon 11, Figure 11C ), DMD (exon 78, Figure 11D ), BIN1 (exon 11, Figure 11E ), and LDB3 (exon 11) , Figure 11f ) shows RT-PCR analysis of alternative RNA splicing events (e.g., exon inclusion or exclusion). As controls, two groups of muscle cells from healthy individuals (negative control) and DM1 patients (positive control) were tested for alternative RNA splicing events. All data were collected from three individual experiments (n=3). A T-test of treated versus untreated DM1 root canals was performed; *p <0.05; **p <0.01; ***p < 0.001.
Figures 12A-12F show MBL1 (exon 5, Figure 12A ), SOS1 (exon 25, Figure 12b ), INSR (exon 11, Figure 12c ), DMD (exon 78, Figure 12d ), BIN1 (exon 11, Figure 12e ), and LDB3 (exon 11, Figure 12f ) alternative RNA splicing events (examples) : shows RT-PCR analysis for exon inclusion or exclusion). Healthy patient cells and DM1 cells were used as controls. All data were collected from three individual experiments (n=3). A T-test of treated versus untreated DM1 root canals was performed; *p <0.05; **p <0.01; ***p < 0.001.
Figures 13A-13B show relative levels of mRNA after treatment of HSA-LR mice with various concentrations of PMO-EEV 221-1120. Figure 13A shows relative mRNA levels for gastrocnemius, triceps, tibialis anterior, and diaphragm. Figure 13B shows relative mRNA levels in the diaphragm.
Figures 14A-14C show relative mRNA expression in quadriceps ( 14a ), gastrocnemius ( 14b ), triceps ( 14c ), and tibialis anterior ( 14d ) tissues after treatment of HSA-LR mice with various concentrations of PMO-EEV 221-1120. Shows the level.
Figures 15A-15D show the quadriceps ( Figure 15A ), gastrocnemius ( Figure 15B ), triceps ( Figure 15C ), and tibialis anterior ( Figure 15D ) after treatment of HSA-LR mice with various concentrations of PMO-EEV 221-1120. Mouse DM1 splicing index (mDSI) for various genes is shown.
Figures 16A-16C show the prevalence of RNA foci in the tibialis anterior muscle of HSA-LR mice untreated or after treatment with EEV-PMO 221-1120 (EEV-PMO-DM1-3; DM1-3). Figures 16A-16B show images of tibialis anterior tissue stained for RNA CUG foci (red) and nuclei (blue). Figure 16C is a chart quantifying the percentage of nuclei with CUG foci from data associated with the images in Figures 16A-16B .
Figures 17a-17f show the quadriceps ( 17a ), triceps ( 17b ), heart ( 17c ), gastrocnemius ( 17d ), and tibialis anterior ( 17e ) muscles after treatment of HSA-LR mice with various concentrations of EEV-PMO-DM1-3. , a diagram showing the dose-dependent response to drug levels in diaphragm ( 17f ), brain ( 17h ), liver ( 17i ), and kidney ( 17j ) tissues. Figure 17K shows drug exposure of various tissues at the 60 mpk dose level.
Figure 18 shows dose-dependent reduction in myotonia in HSA-LR mice 7 days after treatment with 15, 30, 60, and 90 mpk of EEV-PMO-DM1-3.
19A-19D show the results of principal component analysis comparing gene expression in non-diseased mice (WT), DM1 mice (HSA-LR), and HSA-LR mice treated with PMO-EEV 221-1120. This is a diagram showing: Figures 19a and 19c are charts showing three main components, and Figures 19b and 19d are charts showing two main components.
Figures 20A-20B show heatmaps of differentially expressed genes between non-diseased mice (WT), DM1 mice (HSA-LR), and HSA-LR mice treated with 60 mpk PMO-EEV 221-1120. Figure 20A is a clustered heatmap showing 513 differentially expressed genes. Figure 20b is a clustered heatmap showing 40 genes known to have CTG·CUG repeats.
Figure 21 is a volcano plot showing overall transcriptional changes across untreated HSA-LR mice and mice treated with PMO-EEV 221-1120.
Figures 22A-22E show Scube2 ( 22a ), Greb1 ( 22b ), Ttc7 ( 22c ), and Txlnb(CUG)9 from non-disease mice, HSA-LR mice, and HSA-LR mice treated with PMO-EEV 221-1120. This is a chart showing the results of principal component analysis for ( 22d ), and Ndrg3 ( 22e ) genes.
23A-23D show Atp2a1 ( 23a ; exon 22 is boxed) in non-diseased mice (WT-saline), HSA-LR mice (HSA-LR saline), and HSA-LR mice treated with PMO-EEV 221-1120. ), Clcn1 ( 23b ; exon 7a is boxed), Nfix ( 23c ; exon 7 is boxed), and Mbn1 ( 23d ; exon 5 is boxed). Two readings are shown for each treatment group.
Figure 24 Splicing index of individual exons for various genes of interest in non-diseased mice (WT-saline), HSA-LR mice (HSA-LR saline), and HSA-LR mice treated with PMO-EEV 221-1120. Shows percentage (PSI).
Figures 25A-25D show tibialis anterior ( 25a ), gastrocnemius ( 25b ), 1-4 weeks after treatment of HSA-LR mice with 80 mpk (60 mpk oligo, 80 mpk full drug) EEV-PMO-DM1-3. triceps ( 25c ), and Shows drug levels in quadriceps ( 25d ) tissue.
Figures 26A-26D show drug levels in mice after treating HSA-LR mice with a single dose of 80 mpk of EEV-PMO-DM1-3. Figures 26A-26B show drug levels in the liver from 1 to 12 weeks after treatment. Figures 26C-26D show drug levels in the kidneys from 1 to 12 weeks after treatment.
Figures 27A-27C show MBNL1 (exon 5; 26a ), SOS1 (exon 25; 26b ), and NFIX (exon 7; 26c ) levels after treatment of muscle cells from DM1 patients with 30 μM EEV-PMO-DM1-3. This is a chart showing the level of exon inclusion for .
Figures 28A-28C show that EEV-PMO-DM1-3 reduces CUG nuclear foci (green) in the nuclei (blue) of muscle cells from DM1 patients. Figures 28A-28B are images of muscle cells from DM1 patients untreated or treated with EEV-PMO-DM1-3. Figure 28C quantifies the number of CUG foci per nucleus for data associated with the images in Figure 28A .
Figures 29A-29B show raw data ( 29a ) and normalized data ( 29b ) from the CELLTITER-GLO luminescence viability assay in which RPTEC cells were treated with various concentrations of PMO-DM1 or EEV-PMO-DM1-3. Melittin was used as a positive control.
Figures 30A-30C show images depicting RNA CUG repeat foci in DM1 patient-derived cells ( 30A ) and DM1 patient-derived cells treated with EEV-PMO 221-1113 ( 30B ). Cells were stained for nuclei (blue; Hoechst) and RNA CUG foci (green). Figure 30C is a plot of CUG RNA foci per nuclear area for data associated with the images of Figures 30A-30B .
Figures 31A-31B show the prevalence of RNA CUG7 foci in HeLa, untreated HeLa480, and HeLa480 cells treated with EEV-PMO 221-1113. Figure 31A shows cells stained for RNA CUG7 foci (green) and nuclei (blue). Shows the image. Figure 31B is a plot quantifying CUG7 foci per nuclear area for the data associated with the image in Figure 31A .
Figures 32A-32C show percent exon 5 inclusion in MBNL1 ( 32a ), percent exon 25 inclusion in SOS1 ( 32b ), and exon 7 inclusion in NFIX after treatment of DM1 patient-derived cells with 30 μM EEV-PMO 221-1113. This is a chart showing the percentage ( 32c ).
Figures 33a-33e show the expression of MBNL1 (exon 5; 33a ), SOS1 (exon 25; 33b ), CLASP1 (exons 19, 33c ), and NFIX after treating muscle cells from DM1 patients with various concentrations of PMO-EEV 221-1113. (exon 7, 33d ), and INSR (exon 11, 33e ). Significance was determined using the T-test; *p <0.05; **p <0.01; ***p < 0.001.
Figures 34A-34D show Atp2a1 (exon 22, 34a ), Nfix (exon 7, 34b ), Clcn1 (exon 7a, 34c ), and Shown is RT-PCR analysis of alternative RNA splicing events (including exon 5, 34d ) of Mbnl1 (exon 5, 34d).
Figures 35a-35c show Mbnl1 (exon 5, 35a ) and Nfix (exon 7) in tibialis anterior tissue of HSA-LR mice treated with PMO-EEV 0221-1121 (21-mer) or PMO-EEV 0325-1121 (24-mer). , 35b ), and RT-PCR analysis of alternative RNA splicing events (i.e., exon inclusion or exclusion) of Atp2a1 (exons 22, 35c ).
Figures 36a-36c show Mbnl1 (exon 5, 36a ), Nfix (exon 7, 36b ), and RT-PCR analysis of alternative RNA splicing events (including exons 22 and 36c ) of Atp2a1 (exons 22, 36c).
Figure 37 shows PMO-0221a, the main metabolite of PMO-EEV 220-1120 detected in vivo.
Figures 38A-38B show the percentage exon coverage for MBNL1 (exon 5) in tibialis anterior ( 38a ) and gastrocnemius ( 38b ) after treatment of Hela480 cells with various concentrations of EEV-PMO 221-1120.
Figures 39A-39B show the percentage exon coverage for NFIX (exon 7) in tibialis anterior ( 39a ) and gastrocnemius ( 39b ) after treatment of Hela480 cells with various concentrations of EEV-PMO 221-1120.
Figures 40A-40B show the percentage of exon coverage for Atp2a1 (exon 22) in tibialis anterior ( 40a ) and gastrocnemius ( 40b ) after treatment of Hela480 cells with various concentrations of EEV-PMO 221-1120.
Figure 41 shows an image depicting RNA CUG repeat foci in Hela480 cells after treatment with various concentrations of EEV-PMO 221-1120 ( 41a ). Figure 41B is a plot of RNA foci per nuclear area for the data associated with the image of Figure 41A .
Figures 42A-42D show relative r(CUG480) repeat mRNA levels ( 42a ), relative DMPK mRNA levels ( 42b ), and percent exon 5 coverage of MBNL1 ( 42c ) in HeLa480 cells after treatment with various concentrations of EEV-PMO 221-1120. , and percent inclusion of exon 25 in SOS1 ( 42d ).
Figure 43 is a bar chart showing examples of genes expressed in muscle tissue known to have CTG·CUG repeats.
Figures 44A-44D show reduction of myotonia phenotype in HSA-LR mouse model treated with 20 mpk of PMO-EEV 221-1106. Figures 44a and 44c show diagrams of muscle relaxation. Figure 44B shows raw data of an example muscle strength trace. Figure 44D shows a representative electromyography trace.

발명을 실시하기 위한 구체적인 내용Specific details for carrying out the invention

화합물compound

구현예에서, 확장된 CUG 트리뉴클레오티드 반복을 갖는 유전자 전사체의 수준 및/또는 활성을 조절하는 화합물이 제공된다. 구현예에서, 본 개시의 화합물은 적어도 하나의 환형 세포 투과 펩티드(cCPP) 및 치료 모이어티(TM)를 포함한다. cCPP는 TM이 세포 내로 진입하는 것을 용이하게 한다. 구현예에서, 화합물은 cCPP 및 환외 펩티드(EP)를 포함하는 엔도솜 탈출 비히클(EEV)을 포함한다. cCPP 또는 EEV는 TM이 세포액 또는 세포 구획에 진입하여 표적 전사체와 상호작용하게 할 수 있다.In embodiments, compounds are provided that modulate the level and/or activity of gene transcripts with expanded CUG trinucleotide repeats. In an embodiment, the compounds of the present disclosure comprise at least one cyclic cell penetrating peptide (cCPP) and a therapeutic moiety (TM). cCPP facilitates TM entry into cells. In an embodiment, the compound comprises an endosomal escape vehicle (EEV) comprising cCPP and an exophytic peptide (EP). cCPP or EEV can allow TM to enter cytosolic or cellular compartments and interact with target transcripts.

치료 모이어티 therapeutic moiety

일반적으로, TM은 반응을 유도하는 작동자 모이어티이다. 구현예에서, TM은 표적 전사체 및/또는 표적 단백질의 발현, 활성, 및/또는 수준을 조절함으로써 반응을 유도한다. 구현예에서, 표적 전사체는 확장된 CUG 트리뉴클레오티드 반복을 포함한다. 구현예에서, TM은 세포 내에서 표적 전사체 및/또는 표적 단백질의 수준을 조절한다. 구현예에서, TM은 세포 내에서 표적 전사체 및/또는 표적 단백질의 수준을 감소시킨다.Generally, TM is the actuator moiety that drives the reaction. In embodiments, the TM induces a response by modulating the expression, activity, and/or level of the target transcript and/or target protein. In an embodiment, the target transcript comprises an expanded CUG trinucleotide repeat. In embodiments, the TM modulates the level of the target transcript and/or target protein within the cell. In embodiments, the TM reduces the level of the target transcript and/or target protein within the cell.

구현예에서, TM은 표적 전사체와 표적 전사체에 결합하는 하나 이상의 단백질 사이의 친화도를 감소시킴으로써 표적 전사체의 활성을 조절한다. TM은, 표적 전사체와 하나 이상의 단백질 사이의 친화도를 감소시킴으로써, 표적 전사체와 연관될 수도 있었던 하나 이상의 단백질의 활성을 효과적으로 조절할 수 있다. 예를 들어, 하나 이상의 단백질이 표적 전사체에 결합하지 않는 경우, 이들은 다른 분자를 대상으로 이들의 기능을 수행할 수 있다. 예를 들어, 하나 이상의 단백질이 pre-mRNA 가공에 관여하는 경우, 확장된 CUG 반복을 포함하는 전사체에 대한 하나 이상의 단백질의 친화도를 감소시키면, 이들 하나 이상의 단백질로 하여금 확장된 CUG 반복을 포함하지 않는 pre-mRNA 전사체를 가공하게 할 수 한다. 이와 같이, TM은, TM에 의해 표적 전사체와 상호작용이 파괴되는 하나 이상의 단백질에 의해 조절되는 하류 유전자(확장된 CTG 반복을 함유하지 않는 유전자)의 활성, 발현, 및/또는 수준을 조절할 수 있다.In embodiments, the TM modulates the activity of the target transcript by reducing the affinity between the target transcript and one or more proteins that bind to the target transcript. TM can effectively modulate the activity of one or more proteins that may be associated with a target transcript by reducing the affinity between the target transcript and one or more proteins. For example, if one or more proteins do not bind to the target transcript, they can target other molecules to perform their function. For example, if one or more proteins are involved in pre-mRNA processing, reducing the affinity of one or more proteins for transcripts containing expanded CUG repeats will cause these one or more proteins to contain expanded CUG repeats. It is possible to process unused pre-mRNA transcripts. As such, a TM can modulate the activity, expression, and/or levels of downstream genes (genes that do not contain expanded CTG repeats) that are regulated by one or more proteins whose interaction with the target transcript is disrupted by the TM. there is.

구현예에서, TM은 올리고뉴클레오티드, 펩티드, 항체, 및/또는 소분자를 포함한다. TM의 부류 및 동일성은 확장된 CUG 트리뉴클레오티드 반복을 포함하는 표적 전사체의 수준 및/또는 활성을 조절하는 데 사용되는 메커니즘에 따라 달라진다.In embodiments, TMs include oligonucleotides, peptides, antibodies, and/or small molecules. The class and identity of the TM depends on the mechanism used to regulate the level and/or activity of the target transcript containing the extended CUG trinucleotide repeat.

안티센스 화합물 antisense compounds

다양한 구현예에서, 본원에 개시된 화합물은 안티센스 화합물(AC)에 접합된 세포 투과 펩티드(CPP)를 포함한다.In various embodiments, the compounds disclosed herein include a cell penetrating peptide (CPP) conjugated to an antisense compound (AC).

용어 “안티센스 화합물”은 표적 뉴클레오티드 서열에 상보적이거나 적어도 부분적으로 상보적인 올리고뉴클레오티드 서열을 지칭한다. AC는 천연 DNA 염기, 변형된 DNA 염기, 천연 RNA 염기, 변형된 RNA 염기, 천연 RNA 당, 변형된 RNA 당, 천연 DNA 당, 변형된 DNA 당, 천연 뉴클레오시드 간 연결, 변형된 뉴클레오시드 간 연결, 또는 이들의 임의의 조합을 포함하는 올리고뉴클레오티드이다. AC는 안티센스 올리고뉴클레오티드 RNAi, 마이크로RNA, 앤태고머(antagomir), 앱타머, 리보자임, 면역자극 올리고뉴클레오티드, 유인 올리고뉴클레오티드, 슈퍼머(supermir), miRNA 모방체, miRNA 억제제, U1 어댑터, 및 이들의 조합을 포함하지만 이에 한정되지는 않는다.The term “antisense compound” refers to an oligonucleotide sequence that is complementary or at least partially complementary to a target nucleotide sequence. AC stands for natural DNA bases, modified DNA bases, natural RNA bases, modified RNA bases, natural RNA sugars, modified RNA sugars, natural DNA sugars, modified DNA sugars, natural internucleoside linkages, modified nucleosides. It is an oligonucleotide containing interlinkages, or any combination thereof. AC includes antisense oligonucleotides RNAi, microRNA, antagomir, aptamer, ribozyme, immunostimulatory oligonucleotide, decoy oligonucleotide, supermir, miRNA mimic, miRNA inhibitor, U1 adapter, and these. Including, but not limited to, combinations of.

구현예에서, AC는 확장된 CUG 트리뉴클레오티드 반복을 갖는 표적 전사체에 적어도 부분적으로 상보적인 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 표적 mRNA 서열에서 확장된 CUG 트리뉴클레오티드 반복에 적어도 부분적으로 상보적인 뉴클레오티드 서열을 포함한다. 1형 근긴장성 이영양증(DM1), 푹스 각막내피 이상증(FECD), 8형 척수소뇌 실조증(SCA8), 및 헌팅턴병 유사-2형(HDL2)와 같은 몇몇 질환은 확장된 CUG 트리뉴클레오티드 반복과 연관이 있다. 표 1은 뉴클레오티드 반복 장애의 예, 및 이러한 장애와 연관된 확장된 뉴클레오티드 반복을 갖는 유전자의 특성을 제공한다. 다음 문헌은 탠덤 반복 질환을 치료하기 위한 예시적인 올리고뉴클레오티드를 기술하며, 동 문헌은 그 전체가 참조로서 본원에 통합된다: Zain 등의 문헌[Neurotherapeutics. 2019; 16(2): 248-262]; Zarouchlioti 등의 문헌[Am J Hum Genet. 2018;102(4):528-539]; Fautsch 등의 문헌[Prog Retin Eye Res. 2021; 81:100883].In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to the target transcript with expanded CUG trinucleotide repeats. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to an expanded CUG trinucleotide repeat in the target mRNA sequence. Several diseases, such as myotonic dystrophy type 1 (DM1), Fuchs' corneal endothelial dystrophy (FECD), spinocerebellar ataxia type 8 (SCA8), and Huntington's disease-like-type 2 (HDL2), are associated with expanded CUG trinucleotide repeats. . Table 1 provides examples of nucleotide repeat disorders and characteristics of genes with expanded nucleotide repeats associated with these disorders. The following documents describe exemplary oligonucleotides for treating tandem repeat diseases, which are incorporated herein by reference in their entirety: Zain et al., Neurotherapeutics. 2019; 16(2): 248-262]; Zarouchlioti et al., Am J Hum Genet. 2018;102(4):528-539]; Fautsch et al. [Prog Retin Eye Res. 2021; 81:100883].

확장된 CUG 트리뉴클레오티드 반복과 연관된 질환Diseases Associated with Expanded CUG Trinucleotide Repeats 질환(약어)Disease (abbreviation) 유전자gene 정상 반복 길이normal repeat length 확장된 반복 길이extended repeat length 유전자 산물gene product 반복 서열repeat sequence 반복 위치repeat position DM1DM1 DMPKDMPK 5-355-35 > 50> 50 근긴장성 근이영양증 단백질 키나아제Myotonic muscular dystrophy protein kinase CTG·CAGCTG·CAG 3’ UTR3’UTR FECDFECD TCF4TCF4 < 30< 30 > 40>40 전사 인자 4transcription factor 4 CTG·CAGCTG·CAG 인트론 3intron 3 SCA8SCA8 ATXN8OS 및/또는 ATXN8ATXN8OS and/or ATXN8 15-5015-50 > 50> 50 아탁신 8 및 아탁신 8 반대 가닥Ataxin 8 and Ataxin 8 opposing strands CTG·CAGCTG·CAG 3’ UTR3’UTR HDL2HDL2 JPH3JPH3 6-276-27 >40>40 정크토필린 3Junktophyllin 3 CTG·CAGCTG·CAG 3’ UTR3’UTR

구현예에서, AC는 확장된 CTG·CUG 트리뉴클레오티드 반복을 포함하는 표적 mRNA 전사체 내에 있는 뉴클레오티드 서열에 적어도 부분적으로 상보적인 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 표적 mRNA 전사체에서 확장된 CTG·CUG 트리뉴클레오티드 반복에 적어도 부분적으로 상보적인 뉴클레오티드 서열을 포함한다.In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to a nucleotide sequence within the target mRNA transcript comprising an expanded CTG·CUG trinucleotide repeat. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to an expanded CTG·CUG trinucleotide repeat in the target mRNA transcript.

구현예에서, AC는 확장된 CTG·CUG 트리뉴클레오티드 반복을 포함하는 DMPK1 표적 전사체 내에 있는 뉴클레오티드 서열에 적어도 부분적으로 상보적인 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 확장된 CTG·CUG 트리뉴클레오티드 반복을 포함하는 TCF4 표적 전사체 내에 있는 뉴클레오티드 서열에 적어도 부분적으로 상보적인 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 확장된 CTG·CUG 트리뉴클레오티드 반복을 포함하는 ATXN8OS/ATXN8 표적 전사체 내에 있는 뉴클레오티드 서열에 적어도 부분적으로 상보적인 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 확장된 CTG·CUG 트리뉴클레오티드 반복을 포함하는 JPH3 표적 전사체 내에 있는 뉴클레오티드 서열에 적어도 부분적으로 상보적인 뉴클레오티드 서열을 포함한다.In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to a nucleotide sequence within the DMPK1 target transcript comprising an expanded CTG·CUG trinucleotide repeat. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to a nucleotide sequence within the TCF4 target transcript comprising an expanded CTG·CUG trinucleotide repeat. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to a nucleotide sequence within the ATXN8OS/ATXN8 target transcript comprising an expanded CTG·CUG trinucleotide repeat. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to a nucleotide sequence within the JPH3 target transcript comprising an expanded CTG·CUG trinucleotide repeat.

구현예에서, AC는 표적 mRNA 전사체의 3’UTR에서 트리뉴클레오티드 반복에 적어도 부분적으로 상보적인 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 DMPK1 표적 전사체의 3’UTR에서 확장된 CTG·CUG 트리뉴클레오티드 반복에 적어도 부분적으로 상보적인 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 ATXN8OS/ATXN8 표적 전사체의 3’UTR에서 확장된 CTG·CUG 트리뉴클레오티드 반복에 적어도 부분적으로 상보적인 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 JPH3 표적 전사체의 3’UTR에서 확장된 CTG·CUG 트리뉴클레오티드 반복에 적어도 부분적으로 상보적인 뉴클레오티드 서열을 포함한다.In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to a trinucleotide repeat in the 3'UTR of the target mRNA transcript. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to an extended CTG·CUG trinucleotide repeat in the 3'UTR of the DMPK1 target transcript. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to an extended CTG·CUG trinucleotide repeat in the 3'UTR of the ATXN8OS/ATXN8 target transcript. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to an extended CTG·CUG trinucleotide repeat in the 3'UTR of the JPH3 target transcript.

구현예에서, AC는 CTG·CUG 반복과 같은 트리뉴클레오티드 반복에 적어도 부분적으로 상보적인 뉴클레오티드 서열을 포함한다. 구현예에서, 표적 뉴클레오티드 서열은 적어도 하나의 뉴클레오티드 반복(예: CTG·CUG 반복)을 포함한다. 구현예에서, 표적 뉴클레오티드 서열은 적어도 40, 적어도 45, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 150, 적어도 200, 적어도 300, 적어도 400, 적어도 500, 적어도 600, 적어도 700, 적어도 800, 적어도 900, 적어도 1000, 또는 적어도 2000개의 CTG·CUG 트리뉴클레오티드 반복을 포함한다. 구현예에서, 확장된 트리뉴클레오티드 반복은 표적 뉴클레오티드 서열의 3’UTR에 있다.In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to a trinucleotide repeat, such as a CTG·CUG repeat. In an embodiment, the target nucleotide sequence comprises at least one nucleotide repeat (e.g., CTG·CUG repeat). In embodiments, the target nucleotide sequence is at least 40, at least 45, at least 50, at least 60, at least 70, at least 80, at least 90, at least 100, at least 150, at least 200, at least 300, at least 400, at least 500, at least 600, It contains at least 700, at least 800, at least 900, at least 1000, or at least 2000 CTG·CUG trinucleotide repeats. In an embodiment, the expanded trinucleotide repeat is in the 3'UTR of the target nucleotide sequence.

구현예에서, AC는 표적 전사체에 존재하는 연속 확장된 트리뉴클레오티드 반복의 적어도 일부에 적어도 부분적으로 상보적이고, 이와 혼성화할 수 있는 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 표적 전사체 내의 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 적어도 19, 적어도 20개, 및 최대 50, 최대 100, 최대 150, 최대 200, 최대 300, 최대 400, 최대 500, 최대 600, 최대 700, 최대 800, 최대 900, 최대 1000, 또는 최대 2000개의 트리뉴클레오티드 반복에 적어도 부분적으로 상보적이고, 이와 혼성화할 수 있는 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 표적 전사체 내의 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개의 트리뉴클레오티드 반복에 적어도 부분적으로 상보적이고, 이와 혼성화할 수 있는 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 표적 전사체 내의 5 내지 10개의 트리뉴클레오티드 반복에 적어도 부분적으로 상보적이고, 이와 혼성화할 수 있는 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 표적 전사체 내의 5 내지 9개의 트리뉴클레오티드 반복에 적어도 부분적으로 상보적이고, 이와 혼성화할 수 있는 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 표적 전사체 내의 5 내지 8개의 트리뉴클레오티드 반복에 적어도 부분적으로 상보적이고, 이와 혼성화할 수 있는 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 표적 전사체 내의 5 내지 7개의 트리뉴클레오티드 반복에 적어도 부분적으로 상보적이고, 이와 혼성화할 수 있는 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 표적 전사체 내의 5 내지 6개의 트리뉴클레오티드 반복에 적어도 부분적으로 상보적이고, 이와 혼성화할 수 있는 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 표적 전사체 내의 5개의 트리뉴클레오티드 반복에 적어도 부분적으로 상보적이고, 이와 혼성화할 수 있는 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 표적 전사체 내의 6개의 트리뉴클레오티드 반복에 적어도 부분적으로 상보적이고, 이와 혼성화할 수 있는 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 표적 전사체 내의 7개의 트리뉴클레오티드 반복에 적어도 부분적으로 상보적이고, 이와 혼성화할 수 있는 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 표적 전사체 내의 8개의 트리뉴클레오티드 반복에 적어도 부분적으로 상보적이고, 이와 혼성화할 수 있는 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 표적 전사체 내의 9개의 트리뉴클레오티드 반복에 적어도 부분적으로 상보적이고, 이와 혼성화할 수 있는 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 뉴클레오티드 서열을 포함한다In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to and capable of hybridizing to at least a portion of the contiguous expanded trinucleotide repeats present in the target transcript. In embodiments, the AC is at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least 10, at least 11, at least 12, at least 13, at least 14, at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, and up to 50, up to 100, up to 150, up to 200, up to 300, up to 400, up to 500, up to 600, up to 700, up to 800, up to and a nucleotide sequence that is at least partially complementary to and capable of hybridizing to 900, up to 1000, or up to 2000 trinucleotide repeats. In embodiments, the AC is 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, or 20 trees within the target transcript. It comprises a nucleotide sequence that is at least partially complementary to and capable of hybridizing to the nucleotide repeat. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to and capable of hybridizing to 5 to 10 trinucleotide repeats in the target transcript. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to and capable of hybridizing to 5 to 9 trinucleotide repeats in the target transcript. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to and capable of hybridizing to 5 to 8 trinucleotide repeats in the target transcript. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to and capable of hybridizing to 5 to 7 trinucleotide repeats in the target transcript. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to and capable of hybridizing to 5 to 6 trinucleotide repeats in the target transcript. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to and capable of hybridizing to five trinucleotide repeats in the target transcript. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to and capable of hybridizing to six trinucleotide repeats in the target transcript. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to and capable of hybridizing to a 7 trinucleotide repeat in the target transcript. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to and capable of hybridizing to eight trinucleotide repeats in the target transcript. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to and capable of hybridizing to nine trinucleotide repeats in the target transcript. In embodiments, AC comprises a nucleotide sequence

구현예에서, AC는 표적 전사체 내의 임의의 위치에 존재하는 연속 확장된 트리뉴클레오티드 반복의 적어도 일부에 적어도 부분적으로 상보적이고, 이와 혼성화할 수 있는 뉴클레오티드 서열을 포함할 수 있다. 구현예에서, AC는 표적 전사체의 3’ UTR에 존재하는 연속 확장된 트리뉴클레오티드 반복의 적어도 일부에 적어도 부분적으로 상보적이고, 이와 혼성화할 수 있는 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 DMPK1, SCA8, 및/또는 HDL2 표적 전사체의 3’ UTR에 존재하는 연속 확장된 트리뉴클레오티드 반복의 적어도 일부에 적어도 부분적으로 상보적이고, 이와 혼성화할 수 있는 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 표적 전사체의 인트론에 존재하는 연속 확장된 트리뉴클레오티드 반복의 적어도 일부에 적어도 부분적으로 상보적이고, 이와 혼성화할 수 있는 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 TCF4 표적 전사체의 인트론 3에 존재하는 연속 확장된 트리뉴클레오티드 반복의 적어도 일부에 적어도 부분적으로 상보적이고, 이와 혼성화할 수 있는 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 TCF4 표적 전사체의 CTG18.1 유전자좌에 존재하는 연속 확장된 트리뉴클레오티드 반복의 적어도 일부에 적어도 부분적으로 상보적이고, 이와 혼성화할 수 있는 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 표적 전사체의 엑손에 존재하는 연속 확장된 트리뉴클레오티드 반복의 적어도 일부에 적어도 부분적으로 상보적이고, 이와 혼성화할 수 있는 뉴클레오티드 서열을 포함한다.In embodiments, the AC may comprise a nucleotide sequence that is at least partially complementary to and capable of hybridizing to at least a portion of a contiguous expanded trinucleotide repeat present at any position within the target transcript. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to and capable of hybridizing to at least a portion of the contiguous expanded trinucleotide repeats present in the 3' UTR of the target transcript. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to and capable of hybridizing to at least a portion of the contiguous extended trinucleotide repeats present in the 3' UTR of the DMPK1, SCA8, and/or HDL2 target transcript. . In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to and capable of hybridizing to at least a portion of the contiguous expanded trinucleotide repeats present in the intron of the target transcript. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to and capable of hybridizing to at least a portion of the contiguous expanded trinucleotide repeats present in intron 3 of the TCF4 target transcript. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to and capable of hybridizing to at least a portion of the contiguous expanded trinucleotide repeats present in the CTG18.1 locus of the TCF4 target transcript. In an embodiment, the AC comprises a nucleotide sequence that is at least partially complementary to and capable of hybridizing to at least a portion of the contiguous expanded trinucleotide repeats present in the exon of the target transcript.

구현예에서, AC는 5개 이상, 10개 이상, 15개 이상, 20개 이상, 25개 이상, 30개 이상, 35개 이상, 40개 이상, 또는 45개 이상의 핵산의 길이이다. 구현예에서, AC는 50개 이하, 45개 이하, 40개 이하, 35개 이하, 30개 이하, 25개 이하, 20개 이하, 15개 이하, 또는 10개 이하의 핵산의 길이이다. 구현예에서, AC는 5 내지 50, 5 내지 45, 5 내지 40, 5 내지 35, 5 내지 30, 5 내지 25, 5 내지 20, 5 내지 15, 또는 5 내지 10개 핵산의 길이이다. 구현예에서, AC는 10 내지 50, 10 내지 45, 10 내지 40, 10 내지 35, 10 내지 30, 10 내지 25, 10 내지 20, 또는 10 내지 15개 핵산의 길이이다. 구현예에서, AC는 15 내지 50, 15 내지 45, 15 내지 40, 15 내지 35, 15 내지 30, 15 내지 25, 또는 15 내지 20개 핵산의 길이이다. 구현예에서, AC는 20 내지 50, 20 내지 45, 20 내지 40, 20 내지 35, 20 내지 30, 또는 20 내지 25개 핵산의 길이이다. 구현예에서, AC는 25 내지 50, 25 내지 45, 25 내지 40, 25 내지 35, 또는 25 내지 30개 핵산의 길이이다. 구현예에서, AC는 30 내지 50, 30 내지 45, 30 내지 40, 또는 30 내지 35개 핵산의 길이이다. 구현예에서, AC는 35 내지 50, 35 내지 45, 또는 35 내지 40개 핵산의 길이이다. 구현예에서, AC는 40 내지 50 또는 40 내지 45개 핵산의 길이이다. 구현예에서, AC는 45 내지 50개 핵산의 길이이다. 구현예에서, AC는 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50개 핵산의 길이이다.In embodiments, AC is at least 5, at least 10, at least 15, at least 20, at least 25, at least 30, at least 35, at least 40, or at least 45 nucleic acids in length. In embodiments, AC is no more than 50, no more than 45, no more than 40, no more than 35, no more than 30, no more than 25, no more than 20, no more than 15, or no more than 10 nucleic acids in length. In embodiments, AC is 5 to 50, 5 to 45, 5 to 40, 5 to 35, 5 to 30, 5 to 25, 5 to 20, 5 to 15, or 5 to 10 nucleic acids in length. In embodiments, AC is 10 to 50, 10 to 45, 10 to 40, 10 to 35, 10 to 30, 10 to 25, 10 to 20, or 10 to 15 nucleic acids in length. In embodiments, AC is 15 to 50, 15 to 45, 15 to 40, 15 to 35, 15 to 30, 15 to 25, or 15 to 20 nucleic acids in length. In embodiments, AC is 20 to 50, 20 to 45, 20 to 40, 20 to 35, 20 to 30, or 20 to 25 nucleic acids in length. In embodiments, AC is 25 to 50, 25 to 45, 25 to 40, 25 to 35, or 25 to 30 nucleic acids in length. In embodiments, AC is 30 to 50, 30 to 45, 30 to 40, or 30 to 35 nucleic acids in length. In embodiments, AC is 35 to 50, 35 to 45, or 35 to 40 nucleic acids in length. In embodiments, AC is 40 to 50 or 40 to 45 nucleic acids in length. In embodiments, AC is 45 to 50 nucleic acids in length. In embodiments, AC is 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, or 50 nucleic acids is the length of

구현예에서, AC는 표적 뉴클레오티드 서열에 대해 100% 상보성을 갖는다. 구현예에서, AC는 표적 뉴클레오티드 서열에 대해 100% 상보성을 갖지는 않는다. 본원에서 사용되는 바와 같이, 용어 “상보성 백분율”은 올리고머 화합물 또는 핵산(예: 표적 뉴클레오티드 서열)의 상응하는 핵염기와 핵염기 상동성을 갖는 AC의 핵염기(예: 천연 핵염기 또는 변형된 핵염기)의 수를 AC의 총 길이(핵염기의 수)로 나눈 것을 지칭한다. 당업자는 안티센스 화합물의 활성을 제거하지 않고도 미스매치를 포함시키는 것이 가능하다는 것을 인식한다.In an embodiment, the AC has 100% complementarity to the target nucleotide sequence. In embodiments, the AC does not have 100% complementarity to the target nucleotide sequence. As used herein, the term “percent complementarity” refers to the number of nucleobases of an AC (e.g., a native nucleobase or a modified nucleobase) that has nucleobase homology to the corresponding nucleobase of an oligomeric compound or nucleic acid (e.g., a target nucleotide sequence). It refers to the number of bases) divided by the total length of AC (number of nucleobases). Those skilled in the art recognize that it is possible to include mismatches without eliminating the activity of the antisense compound.

구현예에서, AC는 표적 뉴클레오티드 서열에 대해 20% 이하, 15% 이하, 10% 이하, 5% 이하의 미스매치를 포함하거나, 미스매치를 포함하지 않는다. 일부 구현예에서, AC는 5% 이상, 10% 이상, 또는 15% 이상의 미스매치를 포함한다. 구현예에서, AC는 표적 뉴클레오티드 서열에 대해 0 내지 5%, 0 내지 10%, 0 내지 15%, 또는 0 내지 20%의 미스매치를 포함한다. 구현예에서, AC는 표적 뉴클레오티드 서열에 대해 5% 내지 10%, 5% 내지 15%, 또는 5% 내지 20%의 미스매치를 포함한다. 구현예에서, AC는 표적 뉴클레오티드 서열에 대해 10% 내지 15% 또는 10% 내지 20%의 미스매치를 포함한다. 구현예에서, AC는 표적 뉴클레오티드 서열에 대해 10% 내지 20%의 미스매치를 포함한다.In embodiments, the AC contains no more than 20%, no more than 15%, no more than 10%, no more than 5% mismatch to the target nucleotide sequence, or no mismatch. In some embodiments, the AC includes a mismatch of at least 5%, at least 10%, or at least 15%. In embodiments, the AC comprises 0 to 5%, 0 to 10%, 0 to 15%, or 0 to 20% mismatch to the target nucleotide sequence. In embodiments, the AC comprises a mismatch of 5% to 10%, 5% to 15%, or 5% to 20% relative to the target nucleotide sequence. In embodiments, the AC comprises a mismatch of 10% to 15% or 10% to 20% relative to the target nucleotide sequence. In an embodiment, the AC comprises a mismatch of 10% to 20% relative to the target nucleotide sequence.

구현예에서, AC는 표적 뉴클레오티드 서열에 대해 80% 이상, 85% 이상, 90% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 또는 99% 이상의 상보성을 갖는다. 구현예에서, AC는 표적 뉴클레오티드 서열에 대해 100% 이하, 99% 이하, 98% 이하, 97% 이하, 96% 이하, 95% 이하, 90% 이하, 85% 이하의 상보성을 갖는다. 구현예에서, AC는 표적 뉴클레오티드 서열에 대해 80% 내지 100%, 80% 내지 99%, 80% 내지 98%, 80% 내지 97%, 80% 내지 96%, 80% 내지 95%, 80% 내지 90%, 또는 80% 내지 85%의 상보성을 갖는다. 구현예에서, AC는 표적 뉴클레오티드 서열에 대해 85% 내지 100%, 85% 내지 99%, 85% 내지 98%, 85% 내지 97%, 85% 내지 96%, 85% 내지 95%, 또는 85% 내지 90%의 상보성을 갖는다. 구현예에서, AC는 표적 뉴클레오티드 서열에 대해 90% 내지 100%, 90% 내지 99%, 90% 내지 98%, 90% 내지 97%, 90% 내지 96%, 또는 90% 내지 95%의 상보성을 갖는다. 구현예에서, AC는 표적 뉴클레오티드 서열에 대해 95% 내지 100%, 95% 내지 99%, 95% 내지 98%, 95% 내지 97%, 또는 95% 내지 96%의 상보성을 갖는다. 구현예에서, AC는 표적 뉴클레오티드 서열에 대해 96% 내지 100%, 96% 내지 99%, 96% 내지 98%, 또는 96% 내지 97%의 상보성을 갖는다. 구현예에서, AC는 표적 뉴클레오티드 서열에 대해 97% 내지 100%, 97% 내지 99%, 또는 97% 내지 98%의 상보성을 갖는다. 구현예에서, AC는 표적 뉴클레오티드 서열에 대해 98% 내지 100% 또는 98% 내지 99%의 상보성을 갖는다. 구현예에서, AC는 표적 뉴클레오티드 서열에 대해 99% 내지 100%의 상보성을 갖는다.In embodiments, the AC has at least 80%, at least 85%, at least 90%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99% complementarity to the target nucleotide sequence. In embodiments, the AC has no more than 100%, no more than 99%, no more than 98%, no more than 97%, no more than 96%, no more than 95%, no more than 90%, no more than 85% complementarity to the target nucleotide sequence. In embodiments, AC is 80% to 100%, 80% to 99%, 80% to 98%, 80% to 97%, 80% to 96%, 80% to 95%, 80% to 80% relative to the target nucleotide sequence. It has a complementarity of 90%, or 80% to 85%. In embodiments, the AC is 85% to 100%, 85% to 99%, 85% to 98%, 85% to 97%, 85% to 96%, 85% to 95%, or 85% relative to the target nucleotide sequence. It has a complementarity of up to 90%. In embodiments, the AC has 90% to 100%, 90% to 99%, 90% to 98%, 90% to 97%, 90% to 96%, or 90% to 95% complementarity to the target nucleotide sequence. have In embodiments, the AC has 95% to 100%, 95% to 99%, 95% to 98%, 95% to 97%, or 95% to 96% complementarity to the target nucleotide sequence. In embodiments, the AC has 96% to 100%, 96% to 99%, 96% to 98%, or 96% to 97% complementarity to the target nucleotide sequence. In embodiments, the AC has 97% to 100%, 97% to 99%, or 97% to 98% complementarity to the target nucleotide sequence. In embodiments, the AC has 98% to 100% or 98% to 99% complementarity to the target nucleotide sequence. In embodiments, the AC has 99% to 100% complementarity to the target nucleotide sequence.

구현예에서, 뉴클레오티드 친화도 변형의 혼입은 변형되지 않은 화합물에 비해 더 많은 수의 불일치를 허용한다. 유사하게, 특정 올리고뉴클레오티드 서열은 다른 올리고뉴클레오티드 서열보다 미스매치에 더 내성이 있을 수 있다. 당업자는, 예컨대 열 용융 온도(Tm)를 결정함으로써, AC와 표적 뉴클레오티드 서열 사이의 적절한 수의 미스매치를 결정할 수 있다. Tm 또는 ΔTm은 당업자에게 익숙한 기술에 의해 계산될 수 있다. 예를 들어, Freier 등의 문헌[Nucleic Acids Research, 1997, 25, 22: 4429-4443]에 기술된 기술은, 당업자가 RNA:DNA 이중체의 용융 온도를 증가시키는 능력에 대해 뉴클레오티드 변형을 평가할 수 있게 한다.In embodiments, incorporation of nucleotide affinity modifications allows for a greater number of mismatches compared to unmodified compounds. Similarly, certain oligonucleotide sequences may be more tolerant of mismatches than other oligonucleotide sequences. A person skilled in the art can determine the appropriate number of mismatches between the AC and the target nucleotide sequence, such as by determining the thermal melting temperature (Tm). Tm or ΔTm can be calculated by techniques familiar to those skilled in the art. For example, the technique described in Freier et al. (Nucleic Acids Research, 1997, 25, 22: 4429-4443) allows those skilled in the art to evaluate nucleotide modifications for their ability to increase the melting temperature of RNA:DNA duplexes. let it be

구현예에서, AC는 그 자체가 트리뉴클레오티드 반복인, 즉 CAG 트리뉴클레오티드 반복인 뉴클레오티드 서열을 포함한다. 5’-CAG-3’의 역보체는 100% 상보성을 가지며, 5’-CUG-3’ 트리뉴클레오티드 반복체와 혼성화될 수 있다. 구현예에서, AC는 1 내지 50개의 CAG 반복을 포함한다. 구현예에서, CAG 반복은 연속적이다. 구현예에서, CAG 반복은 연속되지 않는다. 구현예에서, AC는 5’ 또는 3’ 단부 상에 불완전한 CAG 반복을 포함하는 뉴클레오티드 서열을 포함한다. 예를 들어, 구현예에서, AC는 AG(CAG)n, G(CAG)n, (CAG)nAG, 또는 (CAG)nA와 같은 서열을 포함하며, 여기서 n은 1 내지 50의 정수이다. 구현예에서, AC는 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 20개 이상, 30개 이상, 또는 50개 이상의 CAG 반복을 포함하는 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 50개 이하, 40개 이하, 30개 이하, 20개 이하, 10개 이하, 9개 이하, 8개 이하, 7개 이하, 6개 이하, 5개 이하, 4개 이하, 3개 이하, 또는 2개 이하의 CAG 반복을 포함하는 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 2 내지 50, 2 내지 20, 2 내지 10, 4 내지 10, 5 내지 10, 6 내지 10, 6 내지 9, 6 내지 8, 또는 6 내지 7개의 CAG 반복을 포함하는 뉴클레오티드 서열을 포함한다. 구현예에서, AC는 표 2의 뉴클레오티드 서열(서열번호 151~291)의 중 어느 하나를 포함한다. In an embodiment, the AC comprises a nucleotide sequence that is itself a trinucleotide repeat, i.e., a CAG trinucleotide repeat. The reverse complement of 5'-CAG-3' has 100% complementarity and can hybridize with the 5'-CUG-3' trinucleotide repeat. In embodiments, AC comprises 1 to 50 CAG repeats. In an embodiment, the CAG repeats are consecutive. In an embodiment, CAG repeats are not consecutive. In an embodiment, the AC comprises a nucleotide sequence comprising an incomplete CAG repeat on the 5' or 3' end. For example, in embodiments, AC comprises a sequence such as AG(CAG) n , G(CAG) n , (CAG) n AG, or (CAG) n A, where n is an integer from 1 to 50. . In embodiments, the AC is 1 or more, 2 or more, 3 or more, 4 or more, 5 or more, 6 or more, 7 or more, 8 or more, 9 or more, 10 or more, 20 or more, It contains a nucleotide sequence containing at least 30, or at least 50 CAG repeats. In embodiments, the AC is 50 or fewer, 40 or fewer, 30 or fewer, 20 or fewer, 10 or fewer, 9 or fewer, 8 or fewer, 7 or fewer, 6 or fewer, 5 or fewer, 4 or fewer, It contains a nucleotide sequence containing no more than 3, or no more than 2 CAG repeats. In embodiments, AC is a nucleotide sequence comprising 2 to 50, 2 to 20, 2 to 10, 4 to 10, 5 to 10, 6 to 10, 6 to 9, 6 to 8, or 6 to 7 CAG repeats. Includes. In an embodiment, the AC comprises any one of the nucleotide sequences in Table 2 (SEQ ID NOs: 151-291) .

CAG 반복 AC 뉴클레오티드 서열CAG repeat AC nucleotide sequence AC 서열(5’에서 3’ 방향)AC sequence (5’ to 3’ direction) 서열번호sequence number CAGC.A.G. NAN.A. CAG-CAGCAG-CAG NAN.A. CAG-CAG-CAGCAG-CAG-CAG NAN.A. CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG 151151 CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG 152152 CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG 153153 CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG 154154 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 155155 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 156156 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 157157 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 158158 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 159159 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 160160 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 161161 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 162162 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 163163 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 164164 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 165165 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 166166 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 167167 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 168168 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 169169 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 170170 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 171171 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 172172 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- C.A.G. 173173 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG 174174 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG 175175 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG 176176 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG-CAG 177177 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG-CAG-CAG 178178 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG-CAG-CAG-CAG 179179 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 180180 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 181181 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 182182 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 183183 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 184184 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 185185 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 186186 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 187187 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 188188 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 189189 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 190190 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 191191 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 192192 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 193193 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 194194 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 195195 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 196196 CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAGCAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG- CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG-CAG 197197 AGCAGC NAN.A. AGCAGCAGCAGC NAN.A. AGCAGCAGCAGCAGCAGC NAN.A. AGCAGCAGCAGCAGCAGCAGCAGC 198198 AGCAGCAGCAGCAGCAGCAGCAGCAGC 199199 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 200200 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 201201 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 202202 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 203203 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 204204 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 205205 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 206206 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 207207 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 208208 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 209209 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 210210 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 211211 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 212212 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 213213 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 214214 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 215215 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 216216 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 217217 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 218218 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 219219 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 220220 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 221221 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 222222 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 223223 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 224224 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 225225 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 226226 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 227227 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 228228 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 229229 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 230230 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 231231 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 232232 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 233233 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 234234 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 235235 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 236236 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 237237 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 238238 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 239239 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 240240 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 241241 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 242242 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 243243 AGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGC 244244 GCAGCA NAN.A. GCAGCAGCAGCA NAN.A. GCAGCAGCAGCAGCAGCA NAN.A. GCAGCAGCAGCAGCAGCAGCAGCA 245245 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 246246 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 247247 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 248248 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 249249 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 250250 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 251251 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 252252 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 253253 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 254254 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 255255 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 256256 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 257257 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 258258 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 259259 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 260260 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 261261 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 262262 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 263263 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 264264 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 265265 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 266266 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 267267 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 268268 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 269269 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 270270 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 271271 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 272272 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 273273 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 274274 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 275275 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 276276 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 277277 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 278278 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 279279 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 280280 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 281281 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 282282 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 283283 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 284284 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 285285 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 286286 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 287287 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 288288 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 289289 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 290290 GCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCA 291291

구현예에서, CAG 반복을 포함하는 뉴클레오티드를 갖는 AC는 CAG 반복의 5’ 단부, 3’ 단부, 또는 둘 모두에 추가 뉴클레오티드 서열을 포함할 수 있다. 구현예에서, 추가 뉴클레오티드 서열은 이들이 혼성화되는 표적 전사체의 부분에 대해 80% 내지 100% 또는 95% 내지 100%의 상보성을 가질 수 있다. 추가 뉴클레오티드 서열은 특정 표적 전사체에 혼성화되기 위한 AC의 선택도을 증가시키기 위해 CAG 반복 뉴클레오티드 서열에 첨가될 수 있다.In embodiments, an AC with nucleotides comprising a CAG repeat may include additional nucleotide sequences at the 5' end, the 3' end, or both of the CAG repeat. In embodiments, the additional nucleotide sequences can have 80% to 100% or 95% to 100% complementarity to the portion of the target transcript to which they hybridize. Additional nucleotide sequences can be added to the CAG repeat nucleotide sequence to increase the selectivity of the AC to hybridize to a specific target transcript.

구현예에서, AC는 1 내지 50개의 CAG 반복을 포함하는 갭머(gapmer)인 뉴클레오티드 서열을 포함한다. 갭머는, DNA/RNA 혼성물이고 RNase 붕괴 메커니즘을 유도하는 올리고뉴클레오티드이다. 예를 들어, 갭머는 DNA 또는 DNA 모방 분절의 5’ 및 3’ 단부 모두에서 RNA 또는 RNA 모방 분절이 측면에 위치하는 중앙 DNA 또는 DNA 모방 분절을 가질 수 있다. 구현예에서, AC는 표적 전사체의 확장된 CUG 반복과는 별개인 표적 전사체의 표적 핵산 서열과 혼성화하는 뉴클레오티드 서열을 포함하는 갭머를 포함한다.In an embodiment, the AC comprises a nucleotide sequence that is a gapmer containing 1 to 50 CAG repeats. Gapmers are oligonucleotides that are DNA/RNA hybrids and induce an RNase decay mechanism. For example, a gapmer may have a central DNA or DNA mimic segment flanked by RNA or RNA mimic segments at both the 5' and 3' ends of the DNA or DNA mimic segment. In an embodiment, the AC comprises a gapmer comprising a nucleotide sequence that hybridizes to a target nucleic acid sequence of the target transcript that is distinct from the expanded CUG repeat of the target transcript.

구현예에서, 본 개시의 AC는 미국 특허 제9,550,988호에 개시된 것과 같은 갭머 올리고뉴클레오티드이며, 상기 특허의 개시는 참조로서 본원에 통합된다.In an embodiment, the AC of the present disclosure is a gapmer oligonucleotide such as that disclosed in U.S. Pat. No. 9,550,988, the disclosure of which is incorporated herein by reference.

구현예에서, 본 개시의 AC는 미국 특허 공개 제2017/0260524호에 개시된 DMPK를 표적화하는 AC 중 어느 하나의 서열 및/또는 구조를 포함하며, 상기 특허 공개의 개시는 참조로서 본원에 통합된다.In an embodiment, the AC of the present disclosure comprises the sequence and/or structure of any one of the ACs targeting DMPK disclosed in US Patent Publication No. 2017/0260524, the disclosure of which is incorporated herein by reference.

구현예에서, 본 개시의 AC는 미국 특허 공개 US20030235845A1, US20060099616A1, US 2013/0072671 A1, US 2014/0275212 A1, US 2009/0312532 A1, US20100125099A1, US 2010/0125099 A1, US 2009/0269755 A1, US 2011/0294753 A1, US 2012/0022134 A1, US 2011/0263682 A1, US 2014/0128592 A1, US 2015/0073037 A1, 및 US20120059042A1에 개시된 AC 또는 올리고뉴클레오티드 중 어느 하나의 서열 및/또는 구조를 포함하며, 상기 특허 공개 각각의 내용은 모든 목적을 위해 그 전체가 본원에 통합된다.In embodiments, the AC of the present disclosure is disclosed in US Patent Publication US20030235845A1, US20060099616A1, US 2013/0072671 A1, US 2014/0275212 A1, US 2009/0312532 A1, US20100125099A1, US 2010/0125099 A1. , US 2009/0269755 A1, US 2011 /0294753 A1, US 2012/0022134 A1, US 2011/0263682 A1, US 2014/0128592 A1, US 2015/0073037 A1, and US20120059042A1, including the sequence and/or structure of any of the AC or oligonucleotides disclosed in the above The contents of each patent disclosure are incorporated herein in its entirety for all purposes.

확장된 CTG·CUG 반복을 표적화하고/하거나 이에 혼성화하기 위해 AC를 사용할 때, AC가 CTG·CUG 반복을 포함하는 표적 외 전사체(예: 확장된 CTG·CUG 반복이 아닌 CTG·CUG 반복을 포함하는 전사체)에 의도하지 않게 결합하는 표적 외 효과를 피하기 위해 주의를 기울여야 한다. 인간 게놈의 인실리코 분석은 총 63개의 인간 유전자가 CTG·CUG 반복을 갖는다는 것을 보여준다(Uhlen 등의 문헌[Science 2015 347(6220):1260419]). 63개의 유전자는 mRNA의 발현 + 전체 근육(심장, 골격, 및 평활근)에서 발현된 단백질의 양에 의해 순위가 매겨질 수 있다. 발현 수준은 RPM(백만 개 당 판독)을 사용해 정량화될 수 있고, mRNA 발현은 FPKM(백만 개의 맵핑된 단편 당 전사체의 킬로 염기 당 단편)을 사용해 정량화될 수 있고, 단백질 발현은 pTPM(백만 개의 단백질 코딩 유전자 당 전사체)을 사용해 정량화될 수 있으며, 여기서 10 RPM을 유의하지 않은 발현에 대한 컷오프로서 사용해 이를 초과하는 발현을 배제할 수 있다. 도 43은 이러한 인실리코 분석의 결과를 보여준다. 36개의 유전자는 > 10 RPM의 발현 수준을 나타낸다. 36개의 유전자 중, (DMPK 이외에) 3개의 유전자만이 > 10개의 CTG·CUG 반복을 가졌다. CTG·CUG 반복이 10개 이하인 유전자는 표적 외 결합 및 독성에 대한 가장 낮은 위험을 나타낸다. 그럼에도 불구하고, 이들 3개의 유전자(TCF4, CASK, MAP3k4)에서의 CTG·CUG 반복의 수(11~24)는 고전적 및 선천성 DM1 환자에서 관찰된 것보다 유의하게 더 낮다. 예를 들어, 후기 발병 DM1 환자는 DMPK 상에서 100~600개의 CTG·CUG 반복을 갖고, 고전적인 DM1 환자는 DMPK 상에서 250~750개의 CTG·CUG 반복을 갖고, 선천성 DM1 환자는 DMPK 상에서 750~1,400개의 CTG·CUG 반복을 갖는다. 간 및 신장에 대해 동일한 인실리코 분석을 수행할 수 있다. CASK는 신장에서 10개를 초과하는 CTG·CUG 반복을 갖는 유일한 유의한 유전자이다. 10개를 초과하는 CTG·CUG 반복을 갖는 유의한 유전자가 간에는 없었다.When using AC to target and/or hybridize to expanded CTG·CUG repeats, the AC may be used to detect off-target transcripts that contain CTG·CUG repeats (e.g., contain CTG·CUG repeats that are not expanded CTG·CUG repeats). Care must be taken to avoid off-target effects due to unintended binding to transcripts. In silico analysis of the human genome shows that a total of 63 human genes have CTG·CUG repeats (Uhlen et al., Science 2015 347(6220):1260419). The 63 genes can be ranked by expression of mRNA + amount of protein expressed in total muscle (cardiac, skeletal, and smooth muscle). Expression levels can be quantified using RPM (reads per million), mRNA expression can be quantified using FPKM (fragments per kilobase of transcript per million mapped fragments), and protein expression can be quantified using pTPM (fragments per kilo base of transcript per million mapped fragments). Transcripts per protein-coding gene), where 10 RPM can be used as a cutoff for non-significant expression to exclude expression above this. Figure 43 shows the results of this in silico analysis. 36 genes show expression levels >10 RPM. Among the 36 genes, only 3 genes (other than DMPK) had > 10 CTG·CUG repeats. Genes with 10 or fewer CTG·CUG repeats present the lowest risk for off-target binding and toxicity. Nevertheless, the number of CTG·CUG repeats (11–24) in these three genes (TCF4, CASK, MAP3k4) is significantly lower than that observed in patients with classical and congenital DM1. For example, patients with late-onset DM1 have 100 to 600 CTG·CUG repeats on the DMPK, patients with classic DM1 have 250 to 750 CTG·CUG repeats on the DMPK, and patients with congenital DM1 have 750 to 1,400 repeats on the DMPK. It has CTG·CUG repetitions. The same in silico analysis can be performed on liver and kidney. CASK is the only significant gene in the kidney with more than 10 CTG·CUG repeats. There were no significant genes in the liver with more than 10 CTG·CUG repeats.

본원에 기술된 AC는 하나 이상의 비대칭 중심을 함유함으로써, 절대 입체화학의 관점에서 (R) 또는 (S); α 또는 β; 또는 (D) 또는 (L)로서 정의될 수 있는 거울상 이성질체, 부분 입체이성질체, 및 다른 입체이성질체 구성을 생성할 수 있다. 본원에 제공된 안티센스 화합물에는 이러한 모든 가능한 이성질체뿐만 아니라 이들의 라세미 형태 및 광학적으로 순수한 형태도 포함된다.The ACs described herein contain one or more asymmetric centers, thereby, in terms of absolute stereochemistry, either (R) or (S); α or β; or (D) or (L). Antisense compounds provided herein include all of these possible isomers, as well as their racemic and optically pure forms.

AC의 효능은 이들의 투여에 의해 발휘되는 안티센스 활성을 평가함으로써 평가될 수 있다. 본원에서 사용되는 바와 같이, 용어 “안티센스 활성”은 안티센스 화합물이 이의 표적 뉴클레오티드 서열에 혼성화되는 것에 기인하는 임의의 검출 가능한 및/또는 측정 가능한 활성을 지칭한다. 이러한 검출 및/또는 측정은 직접적 또는 간접적일 수 있다. 구현예에서, 안티센스 활성은 관심 전사체로부터 발현된 단백질의 양을 검출 및/또는 측정함으로써 평가된다. 구현예에서, 안티센스 활성은 관심 전사체의 양을 검출 및/또는 측정함으로써 평가된다. 구현예에서, 안티센스 활성은 대안적으로 스플라이싱된 RNA의 양 및/또는 표적 전사체로부터 번역된 단백질 이소형의 양을 검출 및/또는 측정함으로써 평가된다.The efficacy of ACs can be assessed by assessing the antisense activity exerted by their administration. As used herein, the term “antisense activity” refers to any detectable and/or measurable activity resulting from hybridization of an antisense compound to its target nucleotide sequence. Such detection and/or measurement may be direct or indirect. In embodiments, antisense activity is assessed by detecting and/or measuring the amount of protein expressed from the transcript of interest. In embodiments, antisense activity is assessed by detecting and/or measuring the amount of transcript of interest. In embodiments, antisense activity is assessed by detecting and/or measuring the amount of alternatively spliced RNA and/or the amount of protein isoforms translated from the target transcript.

AC의 조절 메커니즘Regulating Mechanism of AC

구현예에서, AC는 세포 내에서 표적 전사체의 활성 및/또는 수준을 조절할 수 있다. 도 1은 AC가 표적 전사체의 수준 및/또는 활성을 조절할 수 있는 방법의 예시적인 메커니즘을 보여준다.In embodiments, the AC can modulate the activity and/or level of a target transcript within a cell. Figure 1 shows an exemplary mechanism of how AC can regulate the level and/or activity of a target transcript.

구현예에서, AC는 세포 내에서 표적 전사체의 수준을 조절할 수 있다. 예를 들어, AC가 갭머인 구현예에서, 표적 전사체에 대한 AC의 결합은 RNase H 경로를 통해 표적 전사체의 분해를 유도한다(도 1, 화살표 A 및 B). 구현예에서, 갭머는 확장된 CUG 트리뉴클레오티드 반복과 구별되는 표적 전사체의 일부에 혼성화되어, RNase H 경로를 통해 표적 전사체의 분해를 유도한다(도 1, 화살표 A). 구현예에서, 갭머는 표적 전사체 내의 확장된 CUG 반복의 적어도 일부에 혼성화되어, RNase H 경로를 통해 표적 전사체의 분해를 유도한다(도 1, 화살표 B). In embodiments, AC can modulate the level of a target transcript within a cell. For example, in embodiments where the AC is a gapmer, binding of the AC to the target transcript induces degradation of the target transcript via the RNase H pathway ( Figure 1 , arrows A and B). In an embodiment, the gapmer hybridizes to a portion of the target transcript that is distinct from the expanded CUG trinucleotide repeat, leading to degradation of the target transcript via the RNase H pathway ( Figure 1 , arrow A). In an embodiment, the gapmer hybridizes to at least a portion of the expanded CUG repeat in the target transcript, thereby inducing degradation of the target transcript via the RNase H pathway ( Figure 1 , arrow B).

구현예에서, AC는 표적 전사체의 활성을 조절할 수 있다. 활성 조절은 표적 전사체가 결합 파트너와 결합하는 능력을 증가시키거나 감소시키는 것을 포함할 수 있다. 구현예에서, AC는, 표적 전사체가 전사체와 결합할 수 있는 하나 이상의 단백질, 특히 표적 전사체의 확장된 CUG 반복의 적어도 일부와 결합하는 단백질과 결합하는 능력을 감소시킴으로써 표적 전사체의 활성을 조절할 수 있다(도 1, 화살표 C). 구현예에서, 하나 이상의 단백질과 결합하는 표적 전사체의 능력을 감소시키는 것은 하나 이상의 단백질에 대한 표적 전사체의 친화도를 감소시키는 것을 포함한다. 구현예에서, 하나 이상의 단백질과 결합하는 표적 전사체의 능력을 감소시키는 것은 표적 전사체가 하나 이상의 단백질에 결합하는 것을 부분적으로 또는 완전히 입체적으로 차단하는 것을 포함한다. 예를 들어, AC는 결합 부위의 적어도 일부를 점유할 수 있는데, 이 부분은 하나 이상의 단백질이 입체적으로 차단되지 않았다면 이들에 의해 점유될 수 있는 부분이다. 구현예에서, 표적 전사체에 대한 하나 이상의 단백질의 결합 부위는 표적 전사체의 확장된 트리뉴클레오티드 반복의 적어도 일부를 포함한다. 이와 같이, 구현예에서, AC는 확장된 트리뉴클레오티드 반복(예: 확장된 CUG 반복)의 적어도 일부를 점유할 수 있는데, 이 부분은 하나 이상의 단백질이 입체적으로 차단되지 않았다면 이들에 의해 점유될 수 있는 부분이다. 표적 전사체의 부분적인 입체적 차단은 표적 전사체와 하나 이상의 단백질 사이의 친화도를 감소시킬 수 있다. 예를 들어, 구현예에서, AC는 표적 전사체의 확장된 CUG 반복의 적어도 일부에 결합하여, 표적 전사체를 입체적으로 차단하고/하거나 확장된 CUG 반복에 결합할 수 있는 단백질에 대한 표적 전사체의 친화도를 감소시킨다(도 1, 화살표 C). 다음의 검토 논문에는 안티센스 올리고뉴클레오티드를 입체적으로 차단하기 위한 추가의 응용예가 기술되어 있으며, 동 문헌은 그 전체가 참조로서 본원에 통합된다: Roberts 등의 문헌[Nature Reviews Drug Discovery (2020) 19: 673-694].In embodiments, AC can modulate the activity of a target transcript. Modulating activity may involve increasing or decreasing the ability of a target transcript to bind a binding partner. In embodiments, the AC modifies the activity of the target transcript by reducing the ability of the target transcript to bind one or more proteins capable of binding the transcript, particularly a protein that binds at least a portion of the expanded CUG repeat of the target transcript. can be adjusted ( Figure 1 , arrow C). In embodiments, reducing the ability of the target transcript to bind one or more proteins includes reducing the affinity of the target transcript for the one or more proteins. In embodiments, reducing the ability of a target transcript to bind one or more proteins includes partially or completely sterically blocking the target transcript from binding to one or more proteins. For example, AC may occupy at least a portion of the binding site, a portion that could be occupied by one or more proteins if they were not sterically blocked. In an embodiment, the binding site of the one or more proteins for the target transcript comprises at least a portion of an extended trinucleotide repeat of the target transcript. As such, in embodiments, the AC may occupy at least a portion of an extended trinucleotide repeat (e.g., an extended CUG repeat), which portion may be occupied by one or more proteins if they were not sterically blocked. It's part. Partial steric blocking of the target transcript may reduce the affinity between the target transcript and one or more proteins. For example, in an embodiment, the AC binds to at least a portion of the expanded CUG repeat of the target transcript, thereby sterically blocking the target transcript and/or targeting the target transcript for a protein capable of binding to the expanded CUG repeat. decreases the affinity ( Figure 1 , arrow C). Additional applications for sterically blocking antisense oligonucleotides are described in the following review paper, which is incorporated herein by reference in its entirety: Roberts et al., Nature Reviews Drug Discovery (2020) 19: 673 -694].

확장된 CUG 반복의 CUG 반복은 이중 가닥 헤어핀 구조를 형성할 수 있다. 질환 상태일 때, 단백질은 이중 가닥 헤어핀 구조에 결합하고 격리되어 다른 기능을 수행할 수 없게 된다. 구현예에서, AC는 이중 가닥 헤어핀 구조의 적어도 일부에 결합하여 이중 가닥 헤어핀 구조를 입체적으로 차단하고/하거나, 단백질 결합 파트너에 대한 이중 가닥 헤어핀 구조의 친화도를 감소시킨다. 구현예에서, AC는 단일 가닥 확장 CUG 반복의 적어도 일부에 결합하여 이중 가닥 헤어핀 구조의 형성을 억제함으로써, 하나 이상의 단백질이 이중 가닥 헤어핀 구조에 결합하는 것을 억제한다. 구현예에서, 이중 헤어핀 구조에 대한 AC의 혼성화는 하나 이상의 단백질이 이중 헤어핀 구조에 결합하는 것을 입체적으로 차단하고/하거나, 이중 헤어핀 구조에 결합하기 위한 하나 이상의 단백질의 친화도를 감소시킨다. 구현예에서, 확장된 트리뉴클레오티드 반복의 단일 가닥 영역의 적어도 일부에 대한 AC의 혼성화는 이중 가닥 헤어핀 구조의 형성을 억제한다.The CUG repeats of the expanded CUG repeats can form double-stranded hairpin structures. In a diseased state, the protein binds to the double-stranded hairpin structure and becomes sequestered, making it unable to perform other functions. In embodiments, the AC binds to at least a portion of the double-stranded hairpin structure to sterically block the double-stranded hairpin structure and/or reduce the affinity of the double-stranded hairpin structure for a protein binding partner. In an embodiment, the AC inhibits the formation of the double-stranded hairpin structure by binding to at least a portion of the single-stranded extended CUG repeat, thereby inhibiting the binding of one or more proteins to the double-stranded hairpin structure. In embodiments, hybridization of the AC to the double hairpin structure sterically blocks one or more proteins from binding to the double hairpin structure and/or reduces the affinity of the one or more proteins to bind to the double hairpin structure. In an embodiment, hybridization of AC to at least a portion of the single-stranded region of the extended trinucleotide repeat inhibits the formation of double-stranded hairpin structures.

하나 이상의 단백질과 결합하는 표적 전사체의 능력을 감소시키는 것은, 하나 이상의 단백질이 다른 기능을, 예를 들어 하류 전사체(확장된 CUG 반복을 함유하지 않는 전사체)의 스플라이싱을 조절하는 것을 수행하게 할 수 있다. 이와 같이, 구현예에서, 하나 이상의 단백질과 결합하는 표적 전사체의 능력을 감소시키는 것은 세포 내에서 다른 기능을 제공할 수 있거나 다른 전사체에 대한 기능을 제공할 수 있는 하나 이상의 단백질의 수준을 증가시킬 수 있다. 구현예에서, 하나 이상의 단백질과 결합하는 표적 전사체의 능력을 감소시키는 것은 세포 내에서 다른 기능을 제공할 수 있거나 다른 전사체에 대한 기능을 제공할 수 있는 하나 이상의 단백질의 세포액 수준을 증가시킬 수 있다. 따라서, 구현예에서, AC를 표적 전사체에 결합시키면 표적 전사체와 상호작용하는 하나 이상의 단백질의 수준 및/또는 활성을 조절할 수 있다.Reducing the ability of a target transcript to bind one or more proteins prevents one or more proteins from performing other functions, such as regulating splicing of downstream transcripts (transcripts that do not contain expanded CUG repeats). It can be done. As such, in embodiments, reducing the ability of a target transcript to bind one or more proteins increases the level of one or more proteins that may serve another function within the cell or may serve a function for another transcript. You can do it. In embodiments, reducing the ability of a target transcript to bind one or more proteins may increase cytosolic levels of one or more proteins that may serve a different function within the cell or may serve a function for another transcript. there is. Accordingly, in embodiments, binding AC to a target transcript can modulate the level and/or activity of one or more proteins that interact with the target transcript.

구현예에서, 확장된 CUG 반복의 적어도 일부에 대한 AC의 혼성화는 표적 전사체에 대한 MNBL1의 친화도를 감소시키거나, 표적 전사체에 대한 MNBL1의 결합을 입체적으로 차단한다. MNBL1은 하류 유전자 전사체의 스플라이싱을 조절하는 스플라이싱 인자이다. DM1 질환 표현형에서, MNBL1은 표적 전사체의 확장된 CUG 반복에 결합한다. 표적 전사체에 결합되어 있는 동안, MNBL1은 핵에 격리되며, 하류 유전자 전사체(확장된 CUG 반복을 함유하지 않는 전사체)의 스플라이싱을 조절할 수 없다. 구현예에서, 표적 전사체 내의 확장된 CUG 반복체의 적어도 일부에 대한 AC의 혼성화는 표적 전사체에 대한 MNBL1의 친화도를 입체적으로 차단 및/또는 감소시켜, AC가 하류 유전자 전사체의 스플라이싱을 조절할 수 있게 한다. 구현예에서, 표적 전사체 내의 확장된 CUG 반복체의 적어도 일부에 대한 AC의 혼성화는 표적 전사체에 대한 MNBL1의 친화도를 입체적으로 차단 및/또는 감소시켜, 유리(예를 들어 CUG 반복을 갖는 전사체에 결합되지 않은) MNBL1의 양을 증가시킨다. 구현예에서, 표적 전사체 내의 확장된 CUG 반복체의 적어도 일부에 대한 AC의 혼성화는 표적 전사체에 대한 MNBL1의 친화도를 입체적으로 차단 및/또는 감소시켜, 표적 전사체에 결합되어 표적 전사체에 의해 격리되는 MNBL1의 양을 감소시킨다.In embodiments, hybridization of AC to at least a portion of the expanded CUG repeat reduces the affinity of MNBL1 for the target transcript or sterically blocks binding of MNBL1 to the target transcript. MNBL1 is a splicing factor that regulates splicing of downstream gene transcripts. In the DM1 disease phenotype, MNBL1 binds to expanded CUG repeats of target transcripts. While bound to the target transcript, MNBL1 is sequestered in the nucleus and is unable to regulate splicing of downstream gene transcripts (transcripts that do not contain expanded CUG repeats). In embodiments, hybridization of the AC to at least a portion of the expanded CUG repeat within the target transcript sterically blocks and/or reduces the affinity of MNBL1 for the target transcript, such that the AC is capable of splicing the downstream gene transcript. Allows you to control the sound. In embodiments, hybridization of AC to at least a portion of the expanded CUG repeat within the target transcript sterically blocks and/or reduces the affinity of MNBL1 for the target transcript, thereby freeing (e.g., having the CUG repeat) Increases the amount of MNBL1 (not bound to the transcript). In embodiments, hybridization of AC to at least a portion of the expanded CUG repeat within the target transcript sterically blocks and/or reduces the affinity of MNBL1 for the target transcript, such that it binds to the target transcript and binds to the target transcript. Reduces the amount of MNBL1 sequestered by .

표적 전사체가 DMPK인 구현예에서, 확장된 CUG 반복의 적어도 일부에 대한 AC의 혼성화는 표적 전사체에 대한 MNBL1의 친화도를 감소시키고, 표적 전사체에 대한 MNBL1의 결합을 입체적으로 차단한다. MNBL1은 하류 유전자 전사체의 스플라이싱을 조절하는 스플라이싱 인자이다. DM1 질환 표현형에서, MNBL1은 DMPK1의 확장된 CUG 반복에 결합한다. DMPK1에 결합되어 있는 동안, MNBL1은 핵에 격리되며, 하류 유전자 전사체(확장된 CUG 반복을 함유하지 않는 전사체)의 스플라이싱을 조절할 수 없다. 구현예에서, DMPK 내의 확장된 CUG 반복체의 적어도 일부에 대한 AC의 혼성화는 DMPK 전사체에 대한 MNBL1의 친화도를 입체적으로 차단 및/또는 감소시켜, AC가 하류 유전자 전사체의 스플라이싱을 조절할 수 있게 한다. 구현예에서, DMPK 내의 확장된 CUG 반복체의 적어도 일부에 대한 AC의 혼성화는 DMPK 전사체에 대한 MNBL1의 친화도를 입체적으로 차단 및/또는 감소시켜, 유리(예를 들어 CUG 반복을 갖는 전사체에 결합되지 않은) MNBL1의 양을 증가시킨다. 구현예에서, DMPK 내의 확장된 CUG 반복의 적어도 일부에 대한 AC의 혼성화는, DMPK 전사체에 대한 MNBL1의 친화도를 입체적으로 차단 및/또는 감소시켜, DMPK1 전사체에 결합되어 이에 의해 격리된 MBNL1의 양을 감소시킨다.In embodiments where the target transcript is DMPK, hybridization of AC to at least a portion of the expanded CUG repeat reduces the affinity of MNBL1 for the target transcript and sterically blocks binding of MNBL1 to the target transcript. MNBL1 is a splicing factor that regulates splicing of downstream gene transcripts. In the DM1 disease phenotype, MNBL1 binds to the expanded CUG repeat of DMPK1. While bound to DMPK1, MNBL1 is sequestered in the nucleus and is unable to regulate splicing of downstream gene transcripts (transcripts that do not contain expanded CUG repeats). In embodiments, hybridization of AC to at least a portion of the expanded CUG repeat in DMPK sterically blocks and/or reduces the affinity of MNBL1 for DMPK transcripts, such that AC inhibits splicing of downstream gene transcripts. Allows you to control it. In embodiments, hybridization of AC to at least a portion of the expanded CUG repeats in DMPK sterically blocks and/or reduces the affinity of MNBL1 for DMPK transcripts, thereby releasing (e.g., transcripts with CUG repeats) increases the amount of MNBL1 (unbound). In embodiments, hybridization of AC to at least a portion of the expanded CUG repeats in DMPK sterically blocks and/or reduces the affinity of MNBL1 for DMPK transcripts, thereby binding to DMPK1 transcripts and thereby sequestering MBNL1. reduces the amount of

표적 전사체가 DMPK인 구현예에서, 확장된 CUG 반복의 적어도 일부에 대한 AC의 혼성화는 CUGBP1 수준을 감소시킨다. DM1 질환 상태에서, 유리 MBNL1(기능할 수 있는 MBNL1)의 수준은 감소하는 반면, 유리 CUGBP1(기능할 수 있는 CUGBP1)의 수준은 증가한다. CUGBP1 수준의 증가는 질환 상태와 관련이 있다. 이와 같이, 구현예에서, 확장된 CUG 반복의 적어도 일부에 대한 AC의 혼성화는 유리 MBNL1(기능할 수 있는 MBNL1)의 수준을 증가시키고/시키거나 유리 CUGBP1(기능할 수 있는 CUGBP1)의 수준을 감소시킨다.In embodiments where the target transcript is DMPK, hybridization of AC to at least a portion of the expanded CUG repeat reduces CUGBP1 levels. In the DM1 disease state, levels of free MBNL1 (functional MBNL1) are decreased, while levels of free CUGBP1 (functional CUGBP1) are increased. Increased CUGBP1 levels are associated with disease states. As such, in an embodiment, hybridization of AC to at least a portion of the expanded CUG repeat increases the level of free MBNL1 (functional MBNL1) and/or decreases the level of free CUGBP1 (functional CUGBP1) I order it.

하나 이상의 단백질과 결합하는 표적 전사체의 능력을 감소시키면 CUG 반복 병소의 형성을 감소시키거나 억제할 수 있다. 확장된 뉴클레오티드 반복(예: 확장된 CUG 반복)을 포함하는 전사체는 전사된 다음 핵에서 격리될 수 있다. 핵 내에서, 격리된 전사체은 응집체를 형성할 수 있다. 그런 다음, 전사체에 결합하는 단백질은 격리된 전사체 상에서 핵을 형성하고/하거나 전사체 응집체를 격리시켜 확장된 뉴클레오티드 반복(예를 들어 CUG 반복) 병소를 형성할 수 있다. CUG 반복 병소는 현미경을 사용해 볼 수 있다. 구현예에서, 하나 이상의 단백질과 결합하는 표적 전사체의 능력을 감소시키면 표적 전사체를 포함하는 응집체의 형성을 감소시키거나 억제할 수 있다. 구현예에서, 하나 이상의 단백질과 결합하는 표적 전사체의 능력을 감소시키면 표적 전사체 상에서, 전사체의 이중 가닥 헤어핀 영역에서, 또는 표적 전사체의 응집체 상에서 하나 이상의 단백질의 핵 형성을 감소시키거나 억제할 수 있다. 표적 전사체가 DMPK인 구현예에서, MNBL1과 결합하는 DMPK1 표적 전사체의 능력을 감소시키면 DMPK1 표적 전사체 상에서 또는 DMPK1 표적 전사체 응집체 상에서 MNBL1 핵 형성을 감소시키거나 억제할 수 있다. 구현예에서, 표적 전사체에 AC를 혼성화하면 CUG 반복 핵 병소의 형성을 억제하거나 감소시킬 수 있다. 구현예에서, 표적 전사체에 AC를 혼성화하면 DMPK, TCF4, JPH3, 및/또는 ATXN8OS/ATXN8 표적 전사체로부터 CUG 반복 핵 병소의 형성을 억제하거나 감소시킬 수 있다.Reducing the ability of a target transcript to bind to one or more proteins can reduce or inhibit the formation of CUG repeat foci. Transcripts containing extended nucleotide repeats (e.g. expanded CUG repeats) can be transcribed and then sequestered in the nucleus. Within the nucleus, sequestered transcripts can form aggregates. Proteins that bind to the transcript may then nucleate on the isolated transcript and/or sequester the transcript aggregates, forming foci of extended nucleotide repeats (e.g., CUG repeats). CUG repeat lesions can be seen using a microscope. In embodiments, reducing the ability of a target transcript to bind one or more proteins can reduce or inhibit the formation of aggregates comprising the target transcript. In embodiments, reducing the ability of the target transcript to bind one or more proteins reduces or inhibits nucleation of the one or more proteins on the target transcript, in the double-stranded hairpin region of the transcript, or on aggregates of the target transcript. can do. In embodiments where the target transcript is DMPK, reducing the ability of the DMPK1 target transcript to bind MNBL1 may reduce or inhibit MNBL1 nucleation on the DMPK1 target transcript or on DMPK1 target transcript aggregates. In embodiments, hybridizing AC to the target transcript can inhibit or reduce the formation of CUG repeat nuclear foci. In embodiments, hybridizing AC to a target transcript can inhibit or reduce the formation of CUG repeat nuclear foci from DMPK, TCF4, JPH3, and/or ATXN8OS/ATXN8 target transcripts.

구현예에서, 표적 전사체에 AC를 혼성화하면 하나 이상의 하류 유전자의 수준, 발현, 및/또는 활성의 조절할 수 있다. 예를 들어, 표적 전사체에 대한 AC의 혼성화를 사용하면 표적 전사체 분해를 유도하거나 하나 이상의 단백질에 대한 표적 전사체의 친화도를 입체적으로 차단하거나 감소시킴으로써, 표적 전사체에 의해 격리된 하나 이상의 단백질이 하류 유전자의 발현, 수준, 및/또는 활성을 조절하게 할 수 있다. 예를 들어, 구현예에서, 하나 이상의 단백질은 하나 이상의 하류 전사체(확장된 CUG 반복을 함유하지 않는 전사체)의 스플라이싱을 조절하는 데 관여하는 단백질을 포함할 수 있다. 구현예에서, 하류 전사체의 스플라이싱은 스플라이싱에 관여하는 단백질이 표적 전사체에 결합되어 격리될 때 변경된다. 예를 들어, 스플라이싱의 변경은 하나 이상의 엑손을 배제하거나 전사체에 하나 이상의 인트론을 포함하는 것을 포함할 수 있는데, 이는 다양한 단백질 이소형의 발현으로 이어질 수 있다. 구현예에서, 스플라이싱의 변경으로 인해 조기 종결 코돈을 포함하는 엑손 및/또는 인트론이 포함될 수 있는데, 이는 활성이 없거나 유해한 활성을 가질 수 있는 절단된 이소형을 형성할 수 있다. 하류 유전자 전사체 스플라이싱의 변경은 질환 표현형과 연관될 수 있는 하류 유전자 산물의 수준, 접힘, 및/또는 활성의 변화로 이어질 수 있다. 확장된 CUG 반복을 포함하는 표적 전사체에 결합되어 있지 않을 때, 스플라이싱에 관여하는 단백질은 스플라이싱을 자유롭게 조절할 수 있으며, 이는 하류 유전자 전사체의 스플라이싱의 교정(또는 구제)을 유도하여, 건강한 표현형과 연관된 하류 유전자 산물의 단백질 수준, 접힘, 및/또는 활성을 적어도 부분적으로 복원할 수 있다.In embodiments, hybridizing AC to a target transcript can modulate the level, expression, and/or activity of one or more downstream genes. For example, hybridization of AC to a target transcript may be used to induce degradation of the target transcript or to sterically block or reduce the affinity of the target transcript for one or more proteins, thereby binding one or more proteins sequestered by the target transcript. Proteins can regulate the expression, level, and/or activity of downstream genes. For example, in an embodiment, the one or more proteins may include proteins involved in regulating splicing of one or more downstream transcripts (transcripts that do not contain expanded CUG repeats). In embodiments, splicing of a downstream transcript is altered when a protein involved in splicing binds to and sequesters the target transcript. For example, alterations in splicing may include excluding one or more exons or including one or more introns in the transcript, which may lead to expression of different protein isoforms. In embodiments, alterations in splicing may result in the inclusion of exons and/or introns containing premature stop codons, which may form truncated isoforms that may be inactive or have deleterious activity. Alterations in downstream gene transcript splicing may lead to changes in the level, folding, and/or activity of the downstream gene product, which may be associated with the disease phenotype. When not bound to a target transcript containing expanded CUG repeats, proteins involved in splicing are free to regulate splicing, which may result in correction (or rescue) of splicing of downstream gene transcripts. Induction can at least partially restore protein levels, folding, and/or activity of downstream gene products associated with a healthy phenotype.

구현예에서, 표적 전사체에 AC를 혼성화하면, 확장된 뉴클레오티드 반복(예를 들어, 확장된 트리뉴클레오티드 반복)과 연관된 질환 상태에서 표적 전사체에 의해 격리된 단백질에 의해 조절되는 하류 유전자 전사체의 스플라이싱을 조절할 수 있다. 확장된 트리뉴클레오티드 반복과 연관된 질환에서, 하류 유전자 전사체는 종종 잘못 가공되고, 예를 들어, 잘못 스플라이싱된다. 하류 유전자 전사체의 잘못된 스플라이싱은 유전자 산물이 번역되기 전에 이를 파괴하거나, 유전자 산물을 비정상적인 구조 및/또는 기능을 갖는 단백질로 번역할 수 있다. 예를 들어, 하류 유전자 전사체의 가공을 조절하는 단백질을 격리하면 조기 종결 코돈을 갖는 엑손 및/또는 인트론의 포함, 인트론의 포함, 엑손의 배제, 및/또는 대안적인 엑손의 포함을 초래할 수 있으며, 이는 전사체 및/또는 유전자 산물이 번역되기 전에 이들을 파괴하거나, 전사체 및/또는 유전자 산물을 비정상적인 기능을 갖는 유전자 산물로 번역할 수 있다. 하류 유전자 전사체 및/또는 유전자 산물의 수준 변화 및/또는 하류 유전자 산물의 비정상적인 구조 및/또는 기능은 확장된 트리뉴클레오티드 질환 표현형과 관련이 있다. 구현예에서, 표적 전사체에 AC를 혼성화하면, 질환 상태 동안 표적 전사체에 격리되는 단백질에 의해 스플라이싱이 조절되는 하류 전사체에서 엑손 포함, 엑손 배제, 인트론 포함, 및/또는 인트론 배제를 조절할 수 있다. 이와 같이, AC를 표적 전사체에 혼성화하면 건강한 표현형과 연관된 하류 단백질 이성질체 및/또는 전사체를 상향조절할 수 있다. 유사하게, AC를 표적 전사체에 혼성화하면 질환 표현형과 연관된 하류 전사체 및/또는 단백질 이성질체를 하향 조절(예를 들어, 억제)할 수 있다.In embodiments, hybridization of the AC to the target transcript results in the formation of a downstream gene transcript that is regulated by the protein sequestered by the target transcript in a disease state associated with an extended nucleotide repeat (e.g., an extended trinucleotide repeat). Splicing can be controlled. In diseases associated with expanded trinucleotide repeats, downstream gene transcripts are often misprocessed and, for example, mis-spliced. Incorrect splicing of a downstream gene transcript can destroy the gene product before it is translated or translate the gene product into a protein with abnormal structure and/or function. For example, sequestering proteins that regulate the processing of downstream gene transcripts can result in inclusion of exons and/or introns with premature stop codons, inclusion of introns, exclusion of exons, and/or inclusion of alternative exons; , which can destroy transcripts and/or gene products before they are translated, or translate transcripts and/or gene products into gene products with abnormal functions. Changes in the levels of downstream gene transcripts and/or gene products and/or abnormal structure and/or function of downstream gene products are associated with an extended trinucleotide disease phenotype. In embodiments, hybridizing AC to a target transcript results in exon inclusion, exon exclusion, intron inclusion, and/or intron exclusion in downstream transcripts whose splicing is regulated by proteins sequestered to the target transcript during disease states. It can be adjusted. As such, hybridization of AC to a target transcript may lead to upregulation of downstream protein isomers and/or transcripts associated with a healthy phenotype. Similarly, hybridization of AC to a target transcript can downregulate (e.g., suppress) downstream transcripts and/or protein isomers associated with the disease phenotype.

표적 전사체가 DMPK인 구현예에서, 표적 전사체에 AC를 혼성화하면, 질환 상태 동안 DMPK 표적 전사체에 의해 격리되는 단백질에 의해 조절되는 하류 유전자 전사체의 스플라이싱을 조절할 수 있다. DM1에서, 여러 하류 유전자 전사체는 잘못 스플라이싱된 리딩이다. 잘못 스플라이싱된 유전자는 질환 표현형과 연관이 있다. 이와 같이, 유전자 스플라이싱의 조절은 유전자의 스플라이싱을 교정(예를 들어, 구제)하여 건강한 표현형과 연관된 하류 유전자의 유전자 산물을 생성하는 것을 포함할 수 있다. 표적 전사체가 DMPK인 구현예에서, 표적 전사체에 AC를 혼성화하면, 질환 상태 동안 DMPK 표적 전사체에 의해 격리되는 스플라이싱 조절제인 MNBL1에 의해 조절되는 하류 유전자 전사체의 스플라이싱을 조절할 수 있다. 표적 전사체가 DMPK인 구현예에서, 표적 전사체에 AC를 혼성화하면, 확장된 CUG 반복에 의해 활성이 영향을 받는 단백질인 CUGBP1에 의해 조절되는 하류 유전자 전사체의 스플라이싱을 조절할 수 있다. 표적 전사체가 DMPK인 구현예에서, 표적 전사체에 AC를 혼성화하면, MNBL1 및/또는 CUGBP1에 의해 조절되는 하류 유전자를 올바르게 가공(예: 스플라이싱)할 수 있다. 표적 전사체가 DMPK인 구현예에서, 표적 전사체에 AC를 혼성화하면 다음을 포함하되 이에 한정되지 않는 하류 유전자의 스플라이싱을 조절할 수 있다: 4833439L19Rik, Abcc9, Atp2a1, Arhgef10, Arhgap28, Armcx6, Angel1, Best3, Bin1, Brd2, Cacna1s, Cacna2d1, Cpd, Cpeb3, Ccpg1, Clasp1, ClC-1, Clcn1, Clk4, Cpeb2, Camk2g, Capzb, Copz2, Coch, cTNT, Ctu2, Cyp2s1, Dctn4, Dnm1l, Eya4, Efna3, Efna2, Fbxo31, Fbxo21, Frem2, Fgd4, Fuca1, Fn1, Gogla4, Gpr37l1, Greb1, Heg1, Insr, Impdh2, IR, Itgav, Jag2, Klc1, Kcan6, Kif13a, Ldb3, Lrrfip2, Mapt, Macf1, Map3k4, Mapkap1, Mbnl1, Mllt3, Mbnl2, Mef2c, Mpdz, Mrpl1, Mxra7, Mybpc1, Myo9a, Ncapd3, Ngfr, Ndrg3, Ndufv3, Neb, Nfix, Numa1, Opa1, Pacsin2, Pcolce, Pdlim3, Pla2g15, Phactr4, Phka1, Phtf2, Ppp1r12b, Ppp3cc, Ppp1cc, Ramp2, Rapgef1, Rur1, Ryr1, Sorcs2, Spsb4, Scube2, Sema6c, Sfc8a3, Slain2, Sorbs1, Spag9, Tmem28, Tacc1, Tacc2, Ttc7, Tnik, Tnfrsf22, Tnfrsf25, Trappc9, Trim55, Ttn, Txnl4a, Txlnb, Ube2d3, Vsp39, 또는 이들의 임의의 조합.In embodiments where the target transcript is DMPK, hybridization of AC to the target transcript can modulate splicing of downstream gene transcripts regulated by proteins sequestered by the DMPK target transcript during disease states. In DM1, several downstream gene transcripts are mis-spliced reads. Misspliced genes are associated with disease phenotypes. As such, regulation of gene splicing may include correcting (e.g., rescuing) the splicing of a gene to generate the gene product of the downstream gene associated with a healthy phenotype. In embodiments where the target transcript is DMPK, hybridization of AC to the target transcript may modulate splicing of downstream gene transcripts regulated by MNBL1, a splicing regulator that is sequestered by the DMPK target transcript during disease states. there is. In embodiments where the target transcript is DMPK, hybridization of AC to the target transcript can modulate splicing of the downstream gene transcript regulated by CUGBP1, a protein whose activity is affected by expanded CUG repeats. In embodiments where the target transcript is DMPK, hybridization of AC to the target transcript allows correct processing (e.g., splicing) of downstream genes regulated by MNBL1 and/or CUGBP1. In embodiments where the target transcript is DMPK, hybridizing AC to the target transcript can modulate splicing of downstream genes, including but not limited to: 4833439L19Rik, Abcc9, Atp2a1, Arhgef10, Arhgap28, Armcx6, Angel1, Best3, Bin1, Brd2, Cacna1s, Cacna2d1, Cpd, Cpeb3, Ccpg1, Clasp1, ClC-1, Clcn1, Clk4, Cpeb2, Camk2g, Capzb, Copz2, Coch, cTNT, Ctu2, Cyp2s1, Dctn4, Dnm1l, Eya4, Efna3, Efna2, Fbxo31, Fbxo21, Frem2, Fgd4, Fuca1, Fn1, Gogla4, Gpr37l1, Greb1, Heg1, Insr, Impdh2, IR, Itgav, Jag2, Klc1, Kcan6, Kif13a, Ldb3, Lrrfip2, Mapt, Macf1, Map3k4, Mapkap1, Mbnl1, Mllt3, Mbnl2, Mef2c, Mpdz, Mrpl1, Mxra7, Mybpc1, Myo9a, Ncapd3, Ngfr, Ndrg3, Ndufv3, Neb, Nfix, Numa1, Opa1, Pacsin2, Pcolce, Pdlim3, Pla2g15, Phactr4, Phka1, Phtf2, Ppp1r12b, Ppp3cc, Ppp1cc, Ramp2, Rapgef1, Rur1, Ryr1, Sorcs2, Spsb4, Scube2, Sema6c, Sfc8a3, Slain2, Sorbs1, Spag9, Tmem28, Tacc1, Tacc2, Ttc7, Tnik, Tnfrsf22, Tnfrsf25, Trappc9, Trim55, Ttn, Txnl4a , Txlnb, Ube2d3, Vsp39, or any combination thereof.

전술한 하류 유전자 전사체 중 많은 것들의 잘못된 스플라이싱은 특정 DM1 질환 표현형을 초래한다. 예를 들어, MNBL1은 엑손 5 포함으로 인해 DM1에서의 기능이 상실된 스플라이싱 인자이다. MNBL1은 DMPK CUG 확장에 의해 격리되고 RNA 핵 병소를 형성한다. 또한, SOS1은 Ras 활성화를 촉진하여 RAS/MAPK 신호전달 경로를 긍정적으로 조절한다. DM1에서, SOS1의 엑손 25가 배제되며, 이는 근육 비대 경로의 억제로 이어진다. DM1에서, IR/INSR은 엑손 11 배제를 갖는데, 이는 낮은 신호 전달 비-근육 이소형의 수준을 높이고, DM1에서 인슐린에 대한 대사 반응을 감소시킨다(인슐린 내성). 유사하게, DMD의 엑손 78 배제가 DM에서 관찰된다. 엑손 78 배제는 C-말단 도메인에서 프레임 외 전사체를 초래한다. 이러한 돌연변이된 단백질은 DM1 환자에서 발현되고, 환자의 근육 소모를 담당하는 메커니즘과 연관된다. BIN1은 적절한 근육 T-관 형성(EC 결합)에 필요하다. 엑손 11 배제는 비활성 이소형을 생성하며 DM1 환자에서 발견된다. LDB3은 가로무늬근 내의 Z-판에서 α-액티닌과 상호작용하고 근육 구조를 유지한다. DM1에서 검출된 LDB3의 엑손 11 포함은 단백질 키나아제 C(PKC)에 대한 친화도를 감소시킨다. 결과적으로, PKC는 DM1에서 과활성이 된다. 구현예에서, 하나 이상의 하류 유전자를 조절하면 건강한 표현형과 연관된 전사 스플라이싱이 교정되거나 구제된다. 이와 같이, 구현예에서, DMPK 표적 전사체에 대한 AC의 혼성화는 하류 유전자/전사체의 스플라이싱 오류를 구제함으로써, 질환 표현형과 연관된 하류 유전자/전사체의 수준을 감소시킨다. 이와 같이, 구현예에서, DMPK 표적 전사체에 대한 AC의 혼성화는 하류 유전자/전사체의 스플라이싱 오류를 구제함으로써, 건강한 표현형과 연관된 하류 유전자/전사체의 수준을 증가시킨다. Missplicing of many of the aforementioned downstream gene transcripts results in specific DM1 disease phenotypes. For example, MNBL1 is a splicing factor that has lost its function in DM1 due to exon 5 inclusion. MNBL1 is sequestered by DMPK CUG expansion and forms RNA nuclear foci. Additionally, SOS1 positively regulates the RAS/MAPK signaling pathway by promoting Ras activation. In DM1, exon 25 of SOS1 is excluded, which leads to inhibition of the muscle hypertrophy pathway. In DM1, IR/INSR has exon 11 exclusion, which increases levels of low signaling non-muscle isoforms and reduces the metabolic response to insulin in DM1 (insulin resistance). Similarly, exon 78 exclusion of DMD is observed in DM. Exon 78 exclusion results in an out-of-frame transcript in the C-terminal domain. These mutated proteins are expressed in DM1 patients and are involved in the mechanisms responsible for their muscle wasting. BIN1 is required for proper muscle T-tube formation (EC binding). Exon 11 exclusion generates an inactive isoform and is found in DM1 patients. LDB3 interacts with α-actinin at the Z-plate within striated muscle and maintains muscle structure. Inclusion of exon 11 of LDB3 detected in DM1 reduces its affinity for protein kinase C (PKC). As a result, PKC becomes hyperactive in DM1. In embodiments, regulating one or more downstream genes corrects or rescues transcription splicing associated with a healthy phenotype. As such, in embodiments, hybridization of AC to a DMPK target transcript rescues splicing errors in the downstream gene/transcript, thereby reducing the level of the downstream gene/transcript associated with the disease phenotype. As such, in embodiments, hybridization of AC to a DMPK target transcript rescues splicing errors in the downstream gene/transcript, thereby increasing the level of the downstream gene/transcript associated with a healthy phenotype.

구현예에서, AC는 표적 전사체의 발현을 억제한다. 구현예에서, AC는 pre-mRNA 가공 기계 및/또는 번역 기계가 번역 및/또는 pre-mRNA 가공에 접근하고/하거나 이를 완료하는 것을 차단함으로써 표적 전사체의 발현을 억제한다. 구현예에서, AC는 표적 전사체의 분해를 유도함으로써, 예를 들어 RNase H 경로를 통해 표적 전사체의 발현을 억제한다.In an embodiment, the AC inhibits expression of the target transcript. In embodiments, the AC inhibits expression of the target transcript by blocking the pre-mRNA processing machinery and/or the translation machinery from accessing and/or completing translation and/or pre-mRNA processing. In embodiments, the AC inhibits expression of the target transcript by inducing degradation of the target transcript, e.g., via the RNase H pathway.

AC 구조 AC structure

AC는 올리고뉴클레오티드 및/또는 올리고뉴클레오시드를 포함한다. 올리고뉴클레오티드 및/또는 올리고뉴클레오티드는 뉴클레오시드간 연결을 통해 연결된 뉴클레오티드 또는 뉴클레오시드이다. 뉴클레오시드는 오탄당(예를 들어, 리보오스 또는 데옥시리보오스) 및 당에 공유 부착된 질소 염기를 포함한다. DNA 및/또는 RNA에서 발견되는 자연 발생 염기(또는 전통적인 염기)는 아데닌(A), 구아닌(G), 티민(T), 시토신(C), 및 우라실(U)이다. DNA 및/또는 RNA에서 발견되는 자연 발생 당(또는 전통적인 당)은 데옥시리보오스(DNA) 및 리보오스(RNA)이다. 자연 발생 뉴클레오시드 연결(또는 전통적인 뉴클레오시드 간 연결)은 포스포디에스테르 결합이다. 구현예에서, 본 개시의 AC는 모두 천연 당, 염기, 및 뉴클레오시드 간 연결을 가질 수 있다.AC includes oligonucleotides and/or oligonucleosides. Oligonucleotides and/or oligonucleotides are nucleotides or nucleosides linked through internucleoside linkages. Nucleosides include a pentose sugar (e.g., ribose or deoxyribose) and a nitrogen base covalently attached to the sugar. The naturally occurring bases (or traditional bases) found in DNA and/or RNA are adenine (A), guanine (G), thymine (T), cytosine (C), and uracil (U). The naturally occurring sugars (or traditional sugars) found in DNA and/or RNA are deoxyribose (DNA) and ribose (RNA). The naturally occurring nucleoside linkage (or traditional internucleoside linkage) is a phosphodiester linkage. In embodiments, the ACs of the present disclosure can all have natural sugars, bases, and internucleoside linkages.

화학적으로 변형된 뉴클레오시드는 표적 RNA에 대한 뉴클레아제 내성, 약동학, 또는 친화도와 같은 안티센스 화합물의 하나 이상의 특성을 향상시키기 위해 안티센스 화합물에 혼입하는 데 일상적으로 사용된다. 구현예에서, 본 개시의 AC는 하나 이상의 변형된 뉴클레오시드를 가질 수 있다. 구현예에서, 본 개시의 AC는 하나 이상의 변형된 당을 가질 수 있다. 구현예에서, 본 개시의 AC는 하나 이상의 변형된 염기를 가질 수 있다. 구현예에서, 본 개시의 AC는 하나 이상의 변형된 뉴클레오시드간 연결을 가질 수 있다. Chemically modified nucleosides are routinely used to incorporate into antisense compounds to improve one or more properties of the antisense compound, such as nuclease resistance, pharmacokinetics, or affinity for the target RNA. In embodiments, ACs of the present disclosure may have one or more modified nucleosides. In embodiments, the ACs of the present disclosure may have one or more modified sugars. In embodiments, ACs of the present disclosure may have one or more modified bases. In embodiments, ACs of the present disclosure may have one or more modified internucleoside linkages.

일반적으로, 핵염기는 또 다른 핵산의 염기에 수소 결합할 수 있는 하나 이상의 원자 또는 원자의 기를 함유하는 임의의 기이다. “변형되지 않은” 또는 “천연” 핵염기(A, G, T, C, 및 U) 외에도, 많은 변형된 핵염기 또는 핵염기 모방체가 당업자에게 알려져 있고, 본원에 기술된 화합물과 사용하기에 적합하다. 일반적으로, 변형된 핵염기는 부모 핵염기, 예컨대 7-데아자 퓨린, 5-메틸 시토신, 2-티오-dT(도 2), 또는 G-클램프와 구조가 상당히 유사한 핵염기를 지칭한다. 일반적으로, 핵염기 모방체는, 예를 들어 삼환 페녹사진 핵염기 모방체와 같은 변형된 핵염기보다 더 복잡한 구조를 포함하는 핵염기이다. 전술한 변형된 핵염기의 제조 방법은 당업자에게 잘 알려져 있다.Generally, a nucleobase is any group containing one or more atoms or groups of atoms capable of hydrogen bonding to the base of another nucleic acid. In addition to the “unmodified” or “natural” nucleobases (A, G, T, C, and U), many modified nucleobases or nucleobase mimetics are known to those skilled in the art and suitable for use with the compounds described herein. do. Generally, a modified nucleobase refers to a nucleobase that is substantially similar in structure to the parent nucleobase, such as 7-deaza purine, 5-methyl cytosine, 2-thio-dT ( Figure 2 ), or G-clamp. In general, nucleobase mimetics are nucleobases that contain a more complex structure than modified nucleobases, such as tricyclic phenoxazine nucleobase mimetics. Methods for preparing the modified nucleobases described above are well known to those skilled in the art.

구현예에서, AC는 변형된 당 모이어티를 갖는 하나 이상의 뉴클레오시드를 포함할 수 있다. 구현예에서, 천연 뉴클레오시드의 푸라노실 당은 2’ 변형, 구속된 뉴클레오시드를 제조하기 위한 변형, 및 다른 변형을 가질 수 있다( 2 참조). 예를 들어, 구현예에서, 천연 뉴클레오시드의 푸라노실 당 고리는 치환기의 첨가, 이환 핵산(BNA) 또는 잠금 핵산을 형성하기 위한 2개의 비-게미날 고리 원자의 가교, 푸라노실 고리의 산소를 C 또는 N으로 교환하는 것; 및/또는 이러한 원자 또는 기의 치환을 포함하지만 이에 한정되지 않는 다수의 방식으로 변형될 수 있다(도 2 참조). 변형된 당은 잘 알려져 있으며, AC의 표적 뉴클레오티드 서열에 대한 AC의 친화도를 증가시키거나 감소시키는 데 사용될 수 있다. 변형된 당은 뉴클레아제에 대한 AC의 내성을 증가시키는 데 사용될 수도 있다. 당류는 특히 당 모방체 기로 치환될 수도 있다. 구현예에서, AC의 뉴클레오시드의 하나 이상의 당은 도 2에서 19로서 도시된 메틸렌모르폴린 고리로 치환된다.In embodiments, the AC may comprise one or more nucleosides with modified sugar moieties. In embodiments, the furanosyl sugar of a natural nucleoside can have 2' modifications, modifications to produce tethered nucleosides, and other modifications (see Figure 2 ). For example, in embodiments, the furanosyl sugar ring of a natural nucleoside can be modified by addition of a substituent, bridging of two non-geminal ring atoms to form a bicyclic nucleic acid (BNA) or locked nucleic acid, oxygen of the furanosyl ring. exchanging for C or N; and/or substitution of such atoms or groups (see Figure 2 ). Modified sugars are well known and can be used to increase or decrease the affinity of AC for its target nucleotide sequence. Modified sugars can also be used to increase the resistance of AC to nucleases. Sugars may in particular be substituted with sugar mimetic groups. In an embodiment, one or more sugars of the nucleoside of AC are substituted with a methylenemorpholine ring, shown as 19 in Figure 2 .

구현예에서, AC는 이환 변형된 당(BNA; 가교 핵산으로 불리기도 함)을 포함하는 하나 이상의 뉴클레오시드를 포함한다. BNA의 예는 LNA (4'-(CH2)-O-2' 브릿지), 2'-티오-LNA (4'-(CH2)-S-2' 브릿지), 2'-아미노-LNA (4'-(CH2)-NR-2' 브릿지), ENA (4'-(CH2)2-O-2' 브릿지), 4'-(CH2)3-2' 가교된 BNA, 4'-(CH2CH(CH3)-2' 가교된 BNA" cEt (4'-(CH(CH3)-O-2' 브릿지), 및 cMOE BNA (4'-(CH(CH2OCH3)-O-2' 브릿지)를 포함하지만 이에 한정되지 않는다. BNA는 다음과 같은 특허 문헌뿐만 아니라 과학 문헌에서 제조되고 기술되어 왔다:Srivastava 등의 문헌[J. Am. Chem. Soc. (2007), ACS Advanced online publication, 10.1021/ja071106y]; Albaek 등의 문헌[J. Org. Chem. (2006), 71, 7731 -7740]; Fluiter 등의 문헌[Chembiochem (2005), 6, 1104-1109]; Singh 등의 문헌[Chem. Commun. (1998), 4, 455-456]; Koshkin 등의 문헌[Tetrahedron (1998), 54, 3607-3630]; Wahlestedt 등의 문헌[Proc. Natl. Acad. Sci. U.S.A. (2000), 97, 5633-5638]; Kumar 등의 문헌[Bioorg. Med. Chem. Lett. (1998), 8, 2219-2222]; WO 94/14226; WO 2005/021570; Singh 등의 문헌[J. Org. Chem. (1998), 63, 10035-10039], WO 2007/090071; 미국 특허 제7,053,207호; 제6,268,490호; 제6,770,748호; 제6,794,499호; 제7,034,133호; 및 제6,525,191호; 및 미국 출원 공개 제2004-0171570호; 제2004-0219565호; 제2004-0014959호; 제2003-0207841호; 제2004-0143114호; 및 제20030082807호.In an embodiment, the AC comprises one or more nucleosides comprising a bicyclic modified sugar (BNA; also referred to as a bridged nucleic acid). Examples of BNAs include LNA (4'-(CH 2 )-O-2' bridge), 2'-thio-LNA (4'-(CH 2 )-S-2' bridge), 2'-amino-LNA ( 4'-(CH 2 )-NR-2' bridge), ENA (4'-(CH 2 ) 2 -O-2' bridge), 4'-(CH 2 ) 3 -2' cross-linked BNA, 4' -(CH 2 CH(CH 3 )-2' cross-linked BNA" cEt (4'-(CH(CH 3 )-O-2' bridge), and cMOE BNA (4'-(CH(CH 2 OCH 3 ) -O-2' bridge) BNA has been prepared and described in the scientific literature as well as in the patent literature, such as: Srivastava et al., J. Am. Chem. Soc. (2007), ACS Advanced online publication, 10.1021/ja071106y; Albaek et al., J. Org. Chem. (2006), 71, 7731-7740; Fluiter et al., Chembiochem (2005), 6, 1104-1109; Singh Chem. Commun. (1998), 4, 455-456; Koshkin et al. (Tetrahedron (1998), 54, 3607-3630); Wahlestedt et al. (Proc. Natl. Acad. Sci. USA) (2000), 97, 5633-5638; Kumar et al. (Bioorg. Med. Chem. Lett. (1998), 8, 2219-2222); WO 94/14226; WO 2005/021570; Singh et al. J. Org. Chem. (1998), 63, 10035-10039], WO 2007/090071; US Patent No. 7,053,207; 6,268,490; 6,770,748; 6,794,499; 7,034,133; and 6,525,191; and 6,525,191; US Application Publication Nos. 2004-0171570; 2004-0219565; 2004-0014959; 2003-0207841; No. 2004-0143114; and No. 20030082807.

구현예에서, AC는 잠금 핵산(LNA)을 포함하는 하나 이상의 뉴클레오시드를 포함한다. LNA에서, 리보실 당 고리의 2’-하이드록실기는 당 고리의 4’ 탄소 원자에 연결되어 2’-C,4’-C-옥시메틸렌 연결을 형성하여 이환 당 모이어티를 형성한다(Elayadi 등의 문헌[Curr. Opinion Invens. Drugs (2001), 2, 558-561]; Braasch 등의 문헌[Chem. Biol. (2001), 8 1-7]; 및 Orum 등의 문헌[Curr. Opinion Mol. Ther. (2001), 3, 239-243]에서 검토되었으며; 미국 특허 제6,268,490호 및 제6,670,461호도 참조한다). 연결은 2’ 산소 원자와 4’ 탄소 원자를 가교하는 메틸렌 (-CH2-) 기일 수 있으며, 여기서 용어 LNA는 이환 모이어티에 사용되고; 이 위치에 에틸렌기가 있는 경우, 용어 ENA™이 사용된다(Singh 등의 문헌[Chem. Commun. (1998), 4, 455-456]; ENA™; Morita 등의 문헌[Bioorganic Medicinal Chemistry (2003), 11, 2211-2226]). LNA 및 다른 이환 당 유사체는 상보적 DNA 및 RNA와의 매우 높은 이중체 열 안정성(Tm = +3 내지 +10℃), 3’-외핵용해 분해에 대한 안정성, 및 양호한 용해 특성을 나타낸다. LNA를 함유하는 강력하고 비독성인 안티센스 올리고뉴클레오티드가 기술된 적이 있다(Wahlestedt 등의 문헌[Proc. Natl. Acad. Sci. U.S.A. (2000), 97, 5633-5638]).In an embodiment, the AC comprises one or more nucleosides comprising a locked nucleic acid (LNA). In LNA, the 2'-hydroxyl group of the ribosyl sugar ring is linked to the 4' carbon atom of the sugar ring to form a 2'-C,4'-C-oxymethylene linkage, forming a bicyclic sugar moiety (Elayadi Curr. (2001), 3, 239-243; see also US Pat. Nos. 6,268,490 and 6,670,461). The linkage may be a methylene (-CH 2 -) group bridging the 2' oxygen atom and the 4' carbon atom, where the term LNA is used for the bicyclic moiety; If there is an ethylene group at this position, the term ENA™ is used (Singh et al., Chem. Commun. (1998), 4, 455-456; ENA™; Morita et al., Bioorganic Medicinal Chemistry (2003), 11, 2211-2226]). LNA and other bicyclic sugar analogs exhibit very high duplex thermal stability (Tm = +3 to +10° C.) with complementary DNA and RNA, stability against 3'-exonucleolytic degradation, and good dissolution properties. Potent and non-toxic antisense oligonucleotides containing LNA have been described (Wahlestedt et al., Proc. Natl. Acad. Sci. USA (2000), 97, 5633-5638).

또한 연구된 LNA의 이성질체는 알파-L-LNA인데, 이는 3’-엑소뉴클레아제에 대해 우수한 안정성을 갖는 것으로 나타났다. 알파-L-LNA는 강력한 안티센스 활성을 나타낸 안티센스 갭머 및 키메라에 혼입되었다(Frieden 등의 문헌[Nucleic Acids Research (2003), 21, 6365-6372]).The isomer of LNA also studied is alpha-L-LNA, which has been shown to have excellent stability against 3'-exonucleases. Alpha-L-LNA was incorporated into antisense gapmers and chimeras that showed strong antisense activity (Frieden et al., Nucleic Acids Research (2003), 21, 6365-6372).

LNA 단량체인 아데닌, 시토신, 구아닌, 5-메틸-시토신, 티민, 및 우라실의 합성 및 제조는 이들의 올리고머화, 및 핵산 인식 특성과 함께 기술되었다 Koshkin 등의 문헌[Tetrahedron, 1998, 54, 3607-3630]에 기술된 적이 있다. LNA 및 이의 제조는 WO 98/39352 및 WO 99/14226에도 기술되어 있다.The synthesis and preparation of the LNA monomers adenine, cytosine, guanine, 5-methyl-cytosine, thymine, and uracil, along with their oligomerization and nucleic acid recognition properties, have been described by Koshkin et al. [Tetrahedron, 1998, 54, 3607- 3630]. LNA and its preparation are also described in WO 98/39352 and WO 99/14226.

LNA의 유사체인 포스포로티오에이트-LNA 및 2'-티오-LNA도 제조되었다(Kumar 등의 문헌[Bioorg. Med. Chem. Lett., 1998, 8, 2219-2222]). 핵산 중합효소에 대한 기질로서 올리고데옥시리보뉴클레오티드 이중체를 함유하는 LNA 유사체의 제조도 기술된 적이 있다(Wengel 등의 WO 99/14226). 또한, 형태적으로 제한된 고친화도 올리고뉴클레오티드 유사체인 2’-아미노-LNA의 합성이 기술되었다(Singh 등의 문헌[J. Org. Chem. (1998), 63, 10035-10039]). 또한, 2'-아미노- 및 2'-메틸아미노-LNA가 제조되었고, 상보적 RNA 및 DNA 가닥을 갖는 이들의 이중체의 열 안정성이 이전에 보고된 적이 있다.Analogs of LNA, phosphorothioate-LNA and 2'-thio-LNA, have also been prepared (Kumar et al. [Bioorg. Med. Chem. Lett., 1998, 8, 2219-2222]). The preparation of LNA analogues containing oligodeoxyribonucleotide duplexes as substrates for nucleic acid polymerases has also been described (Wengel et al., WO 99/14226). Additionally, the synthesis of 2'-amino-LNA, a conformationally restricted high-affinity oligonucleotide analog, has been described (Singh et al., J. Org. Chem. (1998), 63, 10035-10039). Additionally, 2'-amino- and 2'-methylamino-LNAs have been prepared, and the thermal stability of their duplexes with complementary RNA and DNA strands has been previously reported.

변형된 당의 제조 방법은 당업자에게 잘 알려져 있다. 이러한 변형된 당의 제조를 교지하는 일부 대표적인 특허 및 간행물은 미국 특허 제4,981,957호; 제5,118,800호; 제5,319,080호; 제5,359,044호; 제5,393,878호; 제5,446,137호; 제5,466,786호; 제5,514,785호; 제5,519,134호; 제5,567,811호; 제5,576,427호; 제5,591,722호; 제5,597,909호; 제5,610,300호; 제5,627,053호; 제5,639,873호; 제5,646,265호; 제5,658,873호; 제5,670,633호; 제5,792,747호; 제5,700,920호; 및 제6,600,032호; 및 WO 2005/121371를 포함하지만 이에 한정되지는 않는다.Methods for preparing modified sugars are well known to those skilled in the art. Some representative patents and publications teaching the preparation of these modified sugars include U.S. Pat. No. 4,981,957; No. 5,118,800; No. 5,319,080; No. 5,359,044; No. 5,393,878; No. 5,446,137; No. 5,466,786; No. 5,514,785; No. 5,519,134; No. 5,567,811; No. 5,576,427; No. 5,591,722; No. 5,597,909; No. 5,610,300; No. 5,627,053; No. 5,639,873; No. 5,646,265; No. 5,658,873; No. 5,670,633; No. 5,792,747; No. 5,700,920; and 6,600,032; and WO 2005/121371.

뉴클레오시드간 연결Internucleoside linkages

뉴클레오시드 또는 달리 변형된 뉴클레오시드 단량체 단위를 함께 연결하여 올리고뉴클레오티드 및/또는 AC를 함유하는 올리고뉴클레오티드를 형성하는 뉴클레오시드간 연결기가 본원에 기술된다. AC는 자연 발생 뉴클레오시드 간 연결, 비천연 뉴클레오시드 간 연결, 또는 둘 다를 포함할 수 있다.Described herein are internucleoside linkers that link nucleosides or otherwise modified nucleoside monomer units together to form oligonucleotides and/or oligonucleotides containing AC. ACs may include naturally occurring internucleoside linkages, non-natural internucleoside linkages, or both.

자연 발생 DNA 및 RNA에서, 뉴클레오시드간 연결기는 인접한 뉴클레오시드를 서로 공유 연결하여 선형 중합체 화합물을 형성하는 포스포디에스테르이다. 자연 발생 DNA 및 RNA에서, 포스포디에스테르는 당의 2’, 3’, 또는 5’ 하이드록실 모이어티에 연결된다. 올리고뉴클레오티드 내에서, 인산염기는 일반적으로 올리고뉴클레오티드의 뉴클레오시드간 백본을 형성하는 것으로서 지칭된다. 자연 발생 DNA 및 RNA에서, RNA 및 DNA의 연결 또는 백본은 3’에서 5’ 방향으로의 인산디에스테르 연결이다. 구현예에서, AC의 뉴클레오시드간 연결기는 포스포디에스테르이다. 구현예에서, AC의 뉴클레오시드간 연결기는 3’에서 5’ 방향으로의 인산디에스테르 연결이다. In naturally occurring DNA and RNA, internucleoside linkers are phosphodiesters that covalently link adjacent nucleosides to each other to form linear polymer compounds. In naturally occurring DNA and RNA, the phosphodiester is linked to the 2', 3', or 5' hydroxyl moiety of the sugar. Within oligonucleotides, the phosphate group is generally referred to as forming the internucleoside backbone of the oligonucleotide. In naturally occurring DNA and RNA, the linkage or backbone of RNA and DNA is a phosphodiester linkage in the 3' to 5' direction. In an embodiment, the internucleoside linker of AC is a phosphodiester. In an embodiment, the internucleoside linkage of AC is a phosphodiester linkage in the 3' to 5' direction.

비천연 뉴클레오시드 간 연결기의 두 가지 주요 부류는 인 원자의 존재 또는 부재에 의해 정의된다. 뉴클레오시드 간 연결을 함유하는 대표적인 인은 포스포트리에스테르, 메틸포스포네이트, 포스포라미데이트, 및 포스포로티오에이트를 포함하지만 이에 한정되지는 않는다. 뉴클레오시드 간 연결기를 함유하는 대표적인 비-인은 메틸렌메틸이미노 (-CH2-N(CH3)-O-CH2-), 티오디에스테르 (-O-C(O)-S-), 티오노카르바메이트 (-O-C(O)(NH)-S-); 실록산 (-O-Si(H2-O-); 및 N,N'-디메틸하이드라진 (-CH2-N(CH3)-N(CH3)-)을 포함하지만, 이에 한정되지 않는다. 인 뉴클레오시드 간 연결기를 갖는 AC는 올리고뉴클레오티드로서 지칭된다. 비-인 인터뉴클레오시드 간 연결기를 갖는 안티센스 화합물은 올리고뉴클레오시드로서 지칭된다. 천연 인산디에스테르 연결과 비교하여, 변형된 뉴클레오시드 간 연결은 안티센스 화합물의 뉴클레아제 내성을 변경하고, 통상적으로 증가시키는 데 사용될 수 있다. 키랄 원자를 갖는 뉴클레오시드간 연결은 라세미, 키랄, 또는 혼합물로서 제조될 수 있다. 대표적인 키랄 뉴클레오시드간 연결은 알킬포스포네이트 및 포스포로티오에이트를 포함하지만, 이에 한정되지 않는다. 인 함유 및 비-인 함유 연결의 제조 방법은 당업자에게 잘 알려져 있다.The two main classes of non-natural internucleoside linkers are defined by the presence or absence of a phosphorus atom. Representative phosphorus containing internucleoside linkages include, but are not limited to, phosphotriesters, methylphosphonates, phosphoramidates, and phosphorothioates. Representative non-phosphorus containing internucleoside linkages include methylenemethylimino (-CH 2 -N(CH 3 )-O-CH 2 -), thiodiester (-OC(O)-S-), ti. Onocarbamate (-OC(O)(NH)-S-); Including, but not limited to, siloxanes (-O-Si(H 2 -O-); and N,N'-dimethylhydrazine (-CH 2 -N(CH 3 )-N(CH 3 )-). ACs with internucleoside linkages are referred to as oligonucleotides. Antisense compounds with non-phosphorus internucleoside linkages are referred to as oligonucleosides. Compared to natural phosphodiester linkages, modified nucleosides Interseed linkages can be used to modify and typically increase the nuclease resistance of antisense compounds.Internucleoside linkages with chiral atoms can be prepared as racemic, chiral, or mixtures. Representative chiral nucleosides Intercleoside linkages include, but are not limited to, alkylphosphonates and phosphorothioates. Methods for making phosphorus containing and non-phosphorus containing linkages are well known to those skilled in the art.

구현예에서, 변형된 당 및/또는 변형된 핵염기를 갖는 둘 이상의 뉴클레오시드는 포스포라미데이트를 사용하여 결합될 수 있다. 구현예에서, 메틸렌모르폴린 고리를 갖는 둘 이상의 뉴클레오시드는 포스포라미데이트 뉴클레오시드간 연결을 통해 연결될 수 있다.In embodiments, two or more nucleosides having modified sugars and/or modified nucleobases can be linked using phosphoramidates. In an embodiment, two or more nucleosides having a methylenemorpholine ring can be linked via a phosphoramidate internucleoside linkage.

포스포라미데이트 뉴클레오시드간 연결을 통해 연결된 메틸렌모르폴린 고리를 갖는 핵염기를 포함하는 안티센스 화합물은 포스포라미데이트 모르폴리노 올리고머(PMO)로서 지칭될 수 있다.Antisense compounds comprising a nucleobase with methylenemorpholine rings linked through phosphoramidate internucleoside linkages may be referred to as phosphoramidate morpholino oligomers (PMOs).

접합기(Conjugate Groups)Conjugate Groups

구현예에서, AC는 하나 이상의 접합기의 공유 부착에 의해 변형된다. 일반적으로, 접합기는 약력학, 약동학, 결합, 흡수, 세포 분포, 세포 흡수, 전하, 및 제거를 포함하지만 이에 한정되지 않는, 부착된 AC의 하나 이상의 특성을 변형시킨다. 접합기는 화학 분야에서 일상적으로 사용되며, AC와 같은 부모 화합물에 직접적으로 연결되거나 임의의 연결 모이어티 또는 연결기를 통해 연결된다. 접합기는 인터칼레이터(intercalators), 리포터 분자, 폴리아민, 폴리아미드, 폴리에틸렌 글리콜, 티오에테르, 폴리에테르, 콜레스테롤, 티오콜레스테롤, 콜산 모이어티, 엽산, 지질, 인지질, 비오틴, 페나진, 페난트리딘, 안트라퀴논, 아다만탄, 아크리딘, 플루오레세인, 로다민, 쿠마린, 및 염료를 포함하지만 이에 한정되지는 않는다. 구현예에서, 접합기는 폴리에틸렌 글리콜(PEG)이고, PEG는 AC 또는 CPP(본원의 다른 곳에서 논의된 CPP)에 접합된다.In embodiments, the AC is modified by covalent attachment of one or more adapters. Typically, the conjugator modifies one or more properties of the attached AC, including but not limited to pharmacodynamics, pharmacokinetics, binding, uptake, cellular distribution, cellular uptake, charge, and clearance. Conjugators are routinely used in the field of chemistry, linking either directly to the parent compound, such as AC, or through an optional linking moiety or linker. Adapters include intercalators, reporter molecules, polyamines, polyamides, polyethylene glycol, thioethers, polyethers, cholesterol, thiocholesterol, cholic acid moieties, folic acid, lipids, phospholipids, biotin, phenazine, phenanthridine, Includes, but is not limited to, anthraquinone, adamantane, acridine, fluorescein, rhodamine, coumarin, and dyes. In an embodiment, the conjugator is polyethylene glycol (PEG), and PEG is conjugated to AC or CPP (CPP discussed elsewhere herein).

구현예에서, 접합기는 콜레스테롤 모이어티와 같은 지질 모이어티(Letsinger 등의 문헌[Proc. Natl. Acad. Sci. USA (1989), 86, 6553]); 콜산(Manoharan 등의 문헌[Bioorg. Med. Chem. Lett. (1994), 4, 1053]); 티오에테르, 예를 들어 헥실-S-트리틸티올(Manoharan 등의 문헌[Ann. N.Y. Acad. Sci., (1992), 660, 306]; Manoharan 등의 문헌[Bioorg. Med. Chem. Let. (1993), 3, 2765]); 티오콜레스테롤(Oberhauser 등의 문헌[Nucl. Acids Res. (1992), 20, 533]); 지방족 사슬, 예를 들어 도데칸디올 또는 운데실 잔기(Saison-Behmoaras 등의 문헌[EMBO J. (1991), 10, 111]; Kabanov 등의 문헌[FEBS Lett. (1990), 259, 327]; Svinarchuk 등의 문헌[Biochimie (1993), 75, 49]); 인지질, 예를 들어 디-헥사데실-rac-글리세롤 또는 트리에틸암모늄-1,2-디-O-헥사데실-rac-글리세로-3-H-포스포네이트(Manoharan 등의 문헌[Tetrahedron Lett. (1995), 36, 3651]; Shea 등의 문헌[Nucl. Acids Res. (1990), 18, 3777]); 폴리아민 또는 폴리에틸렌 글리콜 사슬(Manoharan 등의 문헌[Nucleosides & Nucleotides (1995), 14, 969]); 아다만탄 아세트산(Manoharan 등의 문헌[Tetrahedron Lett. (1995), 36, 3651]); 팔미틸 모이이티(Mishra 등의 문헌[Biochim. Biophys. Acta. (1995), 1264, 229]); 또는 옥타데실아민 또는 헥실아미노-카르보닐-옥시콜레스테롤 모이어티(Crooke 등의 문헌[J. Pharmacol. Exp. Ther. (1996) ,277,923])를 포함한다.In embodiments, the adapter is a lipid moiety, such as a cholesterol moiety (Letsinger et al., Proc. Natl. Acad. Sci. USA (1989), 86, 6553); Cholic acid (Manoharan et al., Bioorg. Med. Chem. Lett. (1994), 4, 1053); Thioethers, such as hexyl-S-tritylthiol (Manoharan et al., Ann. N.Y. Acad. Sci., (1992), 660, 306; Manoharan et al., Bioorg. Med. Chem. Let. ( 1993), 3, 2765]); thiocholesterol (Oberhauser et al., Nucl. Acids Res. (1992), 20, 533); Aliphatic chains, such as dodecanediol or undecyl moieties (Saison-Behmoaras et al., EMBO J. (1991), 10, 111; Kabanov et al., FEBS Lett. (1990), 259, 327); Svinarchuk et al. (Biochimie (1993), 75, 49]); Phospholipids, such as di-hexadecyl-rac-glycerol or triethylammonium-1,2-di-O-hexadecyl-rac-glycero-3-H-phosphonate (Manoharan et al., Tetrahedron Lett. (1995), 36, 3651; Shea et al. (Nucl. Acids Res. (1990), 18, 3777); polyamine or polyethylene glycol chains (Manoharan et al., Nucleosides & Nucleotides (1995), 14, 969); Adamantane acetic acid (Manoharan et al., Tetrahedron Lett. (1995), 36, 3651); palmityl moiety (Mishra et al., Biochim. Biophys. Acta. (1995), 1264, 229); or octadecylamine or hexylamino-carbonyl-oxycholesterol moiety (Crooke et al., J. Pharmacol. Exp. Ther. (1996), 277,923).

안티센스 화합물의 유형Types of Antisense Compounds

예를 들어 안티센스 올리고뉴클레오티드, siRNA, 마이크로RNA, 앤태고머, 앱타머, 리보자임, 슈퍼머, miRNA 모방체, miRNA 억제제, 또는 이들의 조합을 포함하는 다양한 유형의 AC가 사용될 수 있다.Various types of ACs can be used, including for example antisense oligonucleotides, siRNAs, microRNAs, entagomers, aptamers, ribozymes, supermers, miRNA mimics, miRNA inhibitors, or combinations thereof.

안티센스 올리고뉴클레오티드Antisense oligonucleotide

다양한 구현예에서, 안티센스 화합물(AC)은 표적 뉴클레오티드 서열에 상보적인 안티센스 올리고뉴클레오티드(ASO)이다. 용어 "안티센스 올리고뉴클레오티드(ASO)" 또는 단순히 "안티센스"는 표적 뉴클레오티드 서열에 상보적인 올리고뉴클레오티드를 포함하는 것을 의미한다. 상기 용어는 원하는 표적 뉴클레오티드 서열에 완전히 상보적이지 않을 수 있는 ASO도 포함한다. ASO는 선택된 표적 뉴클레오티드 서열 또는 표적 유전자에 상보적인 DNA 및/또는 RNA의 단일 가닥을 포함한다. ASO는 하나 이상의 변형된 DNA 및/또는 RNA 염기, 변형된 당, 및/또는 비천연 뉴클레오시드간 연결을 포함할 수 있다. 구현예에서, ASO는 하나 이상의 포스포라미데이트 뉴클레오시드간 연결을 포함할 수 있다. 구현예에서, ASO는 포스포라미데이트 모르폴리노 올리고머(PMO)이다. ASO는 임의의 특성을 가질 수 있고, 임의의 길이일 수 있고, 임의의 표적 뉴클레오티드 서열 및/또는 서열 요소에 결합할 수 있고, AC에 대해 기술된 바와 같은 임의의 메커니즘을 발휘할 수 있다.In various embodiments, the antisense compound (AC) is an antisense oligonucleotide (ASO) complementary to the target nucleotide sequence. The term “antisense oligonucleotide (ASO)” or simply “antisense” refers to comprising an oligonucleotide that is complementary to a target nucleotide sequence. The term also includes ASOs that may not be completely complementary to the desired target nucleotide sequence. ASOs contain a single strand of DNA and/or RNA that is complementary to a selected target nucleotide sequence or target gene. ASOs may comprise one or more modified DNA and/or RNA bases, modified sugars, and/or non-natural internucleoside linkages. In embodiments, the ASO may comprise one or more phosphoramidate internucleoside linkages. In an embodiment, the ASO is phosphoramidate morpholino oligomer (PMO). ASOs can have any properties, can be any length, can bind any target nucleotide sequence and/or sequence element, and can exert any mechanism as described for AC.

안티센스 올리고뉴클레오티드는 단백질 합성의 표적화된 억제제로서 효과적인 것으로 입증되었으며, 결과적으로 표적화된 유전자에 의한 단백질 합성을 특이적으로 억제하는 데 사용될 수 있다. 단백질 합성을 억제하는 ASO의 효능은 잘 확립되어 있다. 현재까지, 이들 화합물은 염증성 질환, 암, 및 HIV의 모델을 포함하여, 여러 시험관 내 및 생체 내 모델에서 가능성을 나타냈다(Agrawal의 문헌[Trends in Biotech. (1996), 14:376-387]). 안티센스는 염색체 DNA와 특이적으로 혼성화함으로써 세포 활성에 영향을 미칠 수도 있다.Antisense oligonucleotides have proven effective as targeted inhibitors of protein synthesis and consequently can be used to specifically inhibit protein synthesis by targeted genes. The efficacy of ASOs to inhibit protein synthesis is well established. To date, these compounds have shown promise in several in vitro and in vivo models, including models of inflammatory diseases, cancer, and HIV (Agrawal, Trends in Biotech. (1996), 14:376-387). . Antisense may affect cellular activity by specifically hybridizing to chromosomal DNA.

안티센스 올리고뉴클레오티드를 생산하는 방법은 당업계에 공지되어 있고, 임의의 폴리뉴클레오티드 서열을 표적화하는 안티센스 올리고뉴클레오티드를 생산하도록 쉽게 구성될 수 있다. 주어진 표적 서열에 특이적인 안티센스 올리고뉴클레오티드 서열의 선택은 선택된 표적 서열의 분석 및 이차 구조, Tm, 결합 에너지, 및 상대 안정성의 결정에 기초한다. 안티센스 올리고뉴클레오티드는 숙주 세포에서 표적 mRNA에 대한 특이적 결합을 감소시키거나 금지하는 이량체, 헤어핀, 또는 다른 이차 구조를 형성할 수 없는 이들의 상대적인 능력에 기초하여 선택될 수 있다. mRNA의 표적 영역은 AUG 번역 개시 코돈 또는 그 근처의 영역, 및 mRNA의 5’ 영역에 실질적으로 상보적인 서열을 포함한다. 이러한 이차 구조 분석 및 표적 부위 선택의 고려 사항은, 예를 들어 OLIGO 프라이머 분석 소프트웨어의 v.4(Molecular Biology Insights) 및/또는 BLASTN 2.0.5 알고리즘 소프트웨어(Altschul 등의 문헌[Nucleic Acids Res. 1997, 25(17):3389-402])를 사용해 수행될 수 있다.Methods for producing antisense oligonucleotides are known in the art and can be readily adapted to produce antisense oligonucleotides targeting any polynucleotide sequence. The selection of an antisense oligonucleotide sequence specific for a given target sequence is based on analysis of the selected target sequence and determination of secondary structure, Tm, binding energy, and relative stability. Antisense oligonucleotides may be selected based on their relative ability to form dimers, hairpins, or other secondary structures that reduce or inhibit specific binding to the target mRNA in the host cell. The target region of the mRNA includes a region at or near the AUG translation initiation codon, and a sequence substantially complementary to the 5' region of the mRNA. Considerations for such secondary structure analysis and target site selection can be considered, for example, in OLIGO primer analysis software v.4 (Molecular Biology Insights) and/or BLASTN 2.0.5 algorithm software (Altschul et al., Nucleic Acids Res. 1997, 25(17):3389-402]).

RNA 간섭 RNA interference

구현예에서, AC는 RNA 간섭(RNAi)을 매개하는 분자를 포함한다. 본원에서 사용되는 바와 같이, 문구 “RNAi를 매개하는”은 표적 전사체를 서열 특이적 방식으로 침묵화시키는 능력을 지칭한다. 이론에 구속되고자 하는 것은 아니지만, 침묵화는 RNAi 기계 또는 프로세스 및 가이드 RNA, 예를 들어 약 21 내지 약 23개 뉴클레오티드의 siRNA 화합물을 사용하는 것으로 여겨진다. 구현예에서, AC는 분해를 위해 표적 전사체를 표적화한다. 이와 같이, 구현예에서, RNAi 분자는 관심 유전자 또는 폴리뉴클레오티드의 발현을 파괴하는 데 사용될 수 있다. 구현예에서, RNAi 분자는 pre-mRNA 또는 성숙한 mRNA와 같은 표적 전사체의 분해를 유도하는 데 사용된다.In an embodiment, the AC comprises a molecule that mediates RNA interference (RNAi). As used herein, the phrase “mediating RNAi” refers to the ability to silence a target transcript in a sequence-specific manner. Without wishing to be bound by theory, silencing is believed to use the RNAi machinery or process and a guide RNA, for example, an siRNA compound of about 21 to about 23 nucleotides. In embodiments, the AC targets a target transcript for degradation. As such, in embodiments, RNAi molecules can be used to disrupt the expression of a gene or polynucleotide of interest. In embodiments, RNAi molecules are used to induce degradation of target transcripts, such as pre-mRNA or mature mRNA.

구현예에서, AC는 RNAi 반응을 유도하는 작은 간섭 RNA(siRNA)를 포함한다.In an embodiment, the AC comprises small interfering RNA (siRNA) that induces an RNAi response.

작은 간섭 RNA(siRNA)는 RNAi-유도 침묵화 복합체(RISC)로서 알려진 세포질 다중 단백질 복합체와 결합할 수 있는, 일반적으로 약 16 내지 약 30개 뉴클레오티드 길이의 핵산 이중체이다. siRNA가 로딩된 RISC는 상동성 전사체의 분해를 매개하므로, siRNA는 높은 특이성으로 단백질 발현을 녹다운하도록 설계될 수 있다. 다른 안티센스 기술과 달리, siRNA는 비암호화 RNA를 통해 유전자 발현을 제어하도록 진화된 천연 메커니즘을 통해 기능한다. 임상적으로 관련된 표적을 표적화하는 siRNA를 포함하여, 다양한 RNAi 시약이, 예를 들어 de Fougerolles, A. 등의 문헌[Nature Reviews (2007) 6:443-453]에 기술된 바와 같이, 현재 제약 개발 중이다.Small interfering RNAs (siRNAs) are nucleic acid duplexes, typically about 16 to about 30 nucleotides long, that can associate with a cytoplasmic multiprotein complex known as the RNAi-induced silencing complex (RISC). Because siRNA-loaded RISCs mediate degradation of homologous transcripts, siRNAs can be designed to knockdown protein expression with high specificity. Unlike other antisense technologies, siRNA functions through natural mechanisms that have evolved to control gene expression through non-coding RNA. A variety of RNAi reagents, including siRNAs targeting clinically relevant targets, are currently in pharmaceutical development, as described, for example, in de Fougerolles, A. et al., Nature Reviews (2007) 6:443-453. It's in progress.

처음 기술된 RNAi 분자는 RNA 센스 및 RNA 안티센스 가닥 둘 다를 포함하는 RNA:RNA 혼성물이었지만, 이제는 DNA 센스:RNA 안티센스 혼성물, RNA 센스:DNA 안티센스 혼성물, 및 DNA:DNA 혼성물이 RNAi를 매개할 수 있다는 것이 입증되었다(Lamberton, J.S. 및 Christian, A.T.의 문헌[Molecular Biotechnology (2003), 24:111-119]). 구현예에서, 이들 상이한 유형의 이중-가닥 분자 중 어느 하나를 포함하는 RNAi 분자가 사용된다. 또한, RNAi 분자가 다양한 형태로 사용되고 세포에 도입될 수 있음을 이해할 것이다. 따라서, 본원에서 사용되는 바와 같이, RNAi 분자는 세포에서 RNAi를 매개할 수 있는 임의의 및 모든 분자를 포함하며, 여기에는 2개의 별도의 가닥(센스 가닥 및 안티센스 가닥)을 포함하는 이중-가닥 올리고뉴클레오티드, 예를 들어 작은 간섭 RNA(siRNA); 비-뉴클레오티딜 링커에 의해 함께 연결되는 2개의 별도 가닥을 포함하는 이중-가닥 올리고뉴클레오티드; 이중 가닥 영역을 형성하는, 상보적 서열의 헤어핀 루프를 포함하는 올리고뉴클레오티드, 예를 들어 shRNAi 분자, 및 단독으로 또는 다른 폴리뉴클레오티드와 함께 이중-가닥 폴리뉴클레오티드를 형성할 수 있는 하나 이상의 폴리뉴클레오티드를 발현하는 발현 벡터가 포함되지만 이에 한정되지는 않는다.The first described RNAi molecules were RNA:RNA hybrids containing both RNA sense and RNA antisense strands, but now DNA sense:RNA antisense hybrids, RNA sense:DNA antisense hybrids, and DNA:DNA hybrids mediate RNAi. It has been proven that it can be done (Lamberton, J.S. and Christian, A.T. [Molecular Biotechnology (2003), 24:111-119]). In embodiments, RNAi molecules comprising any of these different types of double-stranded molecules are used. It will also be appreciated that RNAi molecules can be used and introduced into cells in a variety of forms. Accordingly, as used herein, RNAi molecule includes any and all molecules capable of mediating RNAi in a cell, including double-stranded oligos comprising two separate strands (sense strand and antisense strand) Nucleotides, such as small interfering RNA (siRNA); A double-stranded oligonucleotide comprising two separate strands joined together by a non-nucleotidyl linker; Expressing oligonucleotides comprising hairpin loops of complementary sequence, e.g., shRNAi molecules, forming a double-stranded region, and one or more polynucleotides capable of forming double-stranded polynucleotides alone or together with other polynucleotides. Includes, but is not limited to, expression vectors.

본원에서 사용되는 “단일 가닥 siRNA 화합물”은 단일 분자로 이루어진 siRNA 화합물이다. 이는 가닥 내 페어링에 의해 형성된 이중체화된 영역을 포함할 수 있으며, 예를 들어 이는 헤어핀 또는 팬-핸들 구조이거나 이를 포함할 수 있다. 단일 가닥 siRNA 화합물은 표적 분자에 대해 안티센스일 수 있다.As used herein, a “single-stranded siRNA compound” is an siRNA compound consisting of a single molecule. It may comprise a duplexed region formed by intra-strand pairing, for example it may be or include a hairpin or fan-handle structure. Single-stranded siRNA compounds may be antisense to the target molecule.

단일 가닥 siRNA 화합물은 RISC에 진입하고 표적 mRNA의 RISC 매개 절단에 참여할 수 있을 정도로 충분히 길 수 있다. 단일 가닥 siRNA 화합물은 적어도 약 14개, 적어도 약 15개, 적어도 약 20개, 적어도 약 25개, 적어도 약 30개, 적어도 약 35개, 적어도 약 40개, 또는 최대 약 50개 뉴클레오티드 길이이다. 소정의 구현예에서, 단일 가닥 siRNA는 약 200개, 약 100개, 또는 약 60개 뉴클레오티드 미만의 길이이다.Single-stranded siRNA compounds can be long enough to enter RISC and participate in RISC-mediated cleavage of target mRNA. The single-stranded siRNA compound is at least about 14, at least about 15, at least about 20, at least about 25, at least about 30, at least about 35, at least about 40, or up to about 50 nucleotides in length. In certain embodiments, the single-stranded siRNA is less than about 200, about 100, or about 60 nucleotides in length.

헤어핀 siRNA 화합물은 적어도 약 17, 약 18, 약 19, 약 20, 약 21, 약 22, 약 23, 약 24, 또는 약 25개 뉴클레오티드 쌍이거나 이와 동등한 길이의 이중체 영역을 가질 수 있다. 이중체 영역은 약 200, 약 100, 또는 약 50개 뉴클레오티드 쌍 이하의 길이일 수 있다. 소정의 구현예에서, 이중체 영역에 대한 범위는 약 15 내지 약 30, 약 17 내지 약 23, 약 19 내지 약 23, 및 약 19 내지 약 21개 뉴클레오티드 쌍의 길이이다. 헤어핀은 단일 가닥 오버행 또는 단말 쌍을 이루지 않은 영역을 가질 수 있다. 소정의 구현예에서, 오버행은 약 2 내지 약 3개 뉴클레오티드 길이이다. 구현예에서, 오버행은 헤어핀과 동일한 측에 있고, 구현예에서, 헤어핀의 안티센스 측에 있다.The hairpin siRNA compound may have a duplex region of at least about 17, about 18, about 19, about 20, about 21, about 22, about 23, about 24, or about 25 nucleotide pairs or an equivalent length. The duplex region may be no more than about 200, about 100, or about 50 nucleotide pairs in length. In certain embodiments, the range for the duplex region is about 15 to about 30, about 17 to about 23, about 19 to about 23, and about 19 to about 21 nucleotide pairs in length. Hairpins may have single-stranded overhangs or terminal unpaired regions. In certain embodiments, the overhang is about 2 to about 3 nucleotides long. In embodiments, the overhang is on the same side as the hairpin, and in embodiments, it is on the antisense side of the hairpin.

본원에서 사용되는 바와 같이, “이중 가닥 siRNA 화합물”은 사슬간 혼성화가 이중체 구조 영역을 형성할 수 있는 2개 이상, 및 일부 경우에 2개의 사슬을 포함하는 siRNA 화합물이다.As used herein, a “double-stranded siRNA compound” is an siRNA compound comprising two or more, and in some cases two, chains in which interchain hybridization can form a region of duplex structure.

이중 가닥 siRNA 화합물의 안티센스 가닥은 적어도 약 14, 약 15, 약 16, 약 17, 약 18, 약 19, 약 20, 약 25, 약 30, 약 40, 또는 약 60개 뉴클레오티드 길이일 수 있다. 이는 약 200개, 약 100개, 또는 약 50개 뉴클레오티드 이하의 길이일 수 있다. 범위는 약 17 내지 약 25개, 약 19 내지 약 23개, 및 약 19 내지 약 21개 뉴클레오티드 길이일 수 있다. 본원에서 사용되는 바와 같이 용어 “안티센스 가닥”은 표적 분자, 예를 들어 표적 전사체의 표적 뉴클레오티드 서열에 충분히 상보적인 siRNA 화합물의 가닥을 의미한다.The antisense strand of a double-stranded siRNA compound may be at least about 14, about 15, about 16, about 17, about 18, about 19, about 20, about 25, about 30, about 40, or about 60 nucleotides long. It may be less than about 200, about 100, or about 50 nucleotides in length. Ranges can be from about 17 to about 25, about 19 to about 23, and about 19 to about 21 nucleotides in length. As used herein, the term “antisense strand” refers to a strand of an siRNA compound that is sufficiently complementary to the target nucleotide sequence of a target molecule, e.g., a target transcript.

이중 가닥 siRNA 화합물의 센스 가닥은 적어도 약 14, 약 15, 약 16, 약 17, 약 18, 약 19, 약 20, 약 25, 약 30, 약 40, 또는 약 60개 뉴클레오티드 길이일 수 있다. 이는 약 200, 약 100, 또는 약 50개 뉴클레오티드 이하의 길이일 수 있다. 범위는 약 17 내지 약 25개, 약 19 내지 약 23개, 및 약 19 내지 약 21개 뉴클레오티드 길이일 수 있다.The sense strand of a double-stranded siRNA compound may be at least about 14, about 15, about 16, about 17, about 18, about 19, about 20, about 25, about 30, about 40, or about 60 nucleotides long. It may be up to about 200, about 100, or about 50 nucleotides in length. Ranges can be from about 17 to about 25, about 19 to about 23, and about 19 to about 21 nucleotides in length.

이중 가닥 siRNA 화합물의 이중 가닥 부분은 적어도 약 14, 약 15, 약 16, 약 17, 약 18, 약 19, 약 20, 약 21, 약 22, 약 23, 약 24, 약 25, 약 30, 약 40, 또는 약 60개 뉴클레오티드 쌍의 길이일 수 있다. 이는 약 200, 약 100, 또는 약 50개 뉴클레오티드 쌍 이하의 길이일 수 있다. 범위는 약 15 내지 약 30개, 약 17 내지 약 23개, 약 19 내지 약 23개, 및 약 19 내지 약 21개 뉴클레오티드 쌍의 길이일 수 있다.The double-stranded portion of a double-stranded siRNA compound has at least about 14, about 15, about 16, about 17, about 18, about 19, about 20, about 21, about 22, about 23, about 24, about 25, about 30, about It may be 40, or about 60 nucleotide pairs in length. It may be no more than about 200, about 100, or about 50 nucleotide pairs in length. Ranges can be about 15 to about 30, about 17 to about 23, about 19 to about 23, and about 19 to about 21 nucleotide pairs in length.

구현예에서, siRNA 화합물은 더 작은 siRNA 화합물, 예를 들어 siRNA 제제를 생산하도록 내인성 분자에 의해, 예를 들어 Dicer에 의해 절단될 수 있을 정도로 충분히 크다.In an embodiment, the siRNA compound is sufficiently large that it can be cleaved by an endogenous molecule, such as Dicer, to produce a smaller siRNA compound, such as an siRNA agent.

센스 및 안티센스 가닥은 이중 가닥 siRNA 화합물이 분자의 일 단부 또는 양 단부에서 단일 가닥 영역 또는 쌍을 이루지 않은 영역을 포함하도록 선택될 수 있다. 따라서, 이중 가닥 siRNA 화합물은 오버행, 예를 들어, 1개 또는 2개의 5’ 또는 3’ 오버행, 또는 1개 내지 3개의 뉴클레오티드로 이루어진 3’ 오버행을 함유하도록 쌍을 이룬 센스 및 안티센스 가닥을 함유할 수 있다. 오버행은 하나의 가닥이 다른 가닥보다 더 길어서 생긴 것이거나, 동일한 길이의 2개의 가닥이 엇갈려서 생긴 것일 수 있다. 일부 구현예는 적어도 하나의 3’ 오버행을 가질 것이다. 구현예에서, siRNA 분자의 양 단부는 3’ 오버행을 가질 것이다. 구현예에서, 오버행은 2개의 뉴클레오티드이다.The sense and antisense strands can be selected so that the double-stranded siRNA compound contains single-stranded regions or unpaired regions at one or both ends of the molecule. Accordingly, a double-stranded siRNA compound may contain sense and antisense strands paired to contain overhangs, e.g., one or two 5' or 3' overhangs, or a 3' overhang of one to three nucleotides. You can. An overhang may be caused by one strand being longer than the other, or by two strands of the same length crossing each other. Some embodiments will have at least one 3' overhang. In an embodiment, both ends of the siRNA molecule will have a 3' overhang. In an embodiment, the overhang is 2 nucleotides.

구현예에서, 이중체 영역의 길이는, 예를 들어 전술한 ssiRNA(끈적한 오버행을 갖는 siRNA) 화합물 범위에서, 약 15 내지 약 30개, 또는 약 18개, 약 19개, 약 20개, 약 21개, 약 22개, 또는 약 23개 뉴클레오티드의 길이이다. ssiRNA 화합물은 긴 dsiRNA로부터 천연 Dicer 가공된 생성물과 길이 및 구조가 유사할 수 있다. ssiRNA 화합물의 2개의 가닥이 연결된, 예를 들어 공유 연결된 구현예도 포함된다. 구현예에서, 헤어핀, 또는 이중 가닥 영역 및 3’ 오버행을 제공하는 다른 단일 가닥 구조가 포함된다.In embodiments, the length of the duplex region is from about 15 to about 30, or about 18, about 19, about 20, about 21, e.g., in the range of ssiRNA (siRNA with sticky overhangs) compounds described above. It is about 22, or about 23 nucleotides long. ssiRNA compounds may be similar in length and structure to natural Dicer-processed products from long dsiRNAs. Embodiments in which the two strands of the ssiRNA compound are linked, for example covalently linked, are also included. In embodiments, hairpins, or other single stranded structures that provide double stranded regions and 3' overhangs are included.

이중 가닥 siRNA 화합물 및 단일 가닥 siRNA 화합물을 포함하여, 본원에 기술된 siRNA 화합물은 표적 RNA, 예를 들어 mRNA, 예를 들어 단백질을 암호화하는 유전자의 전사체의 침묵화를 매개할 수 있다. 편의상, 이러한 mRNA 또한 침묵화할 mRNA로서 본원에서 지칭된다. 이러한 유전자도 표적 유전자로서 지칭된다. 일반적으로, 침묵화할 RNA는 내인성 유전자이다.The siRNA compounds described herein, including double-stranded siRNA compounds and single-stranded siRNA compounds, can mediate silencing of target RNA, e.g., mRNA, e.g., transcript of a gene encoding a protein. For convenience, such mRNA is also referred to herein as the mRNA to be silenced. These genes are also referred to as target genes. Typically, the RNA to be silenced is an endogenous gene.

구현예에서, siRNA 화합물은, siRNA 화합물이 표적 mRNA에 의해 암호화된 단백질의 생산을 침묵화하도록 표적 전사체에 대해 “충분하게 상보적”이다. 구현예에서, siRNA 화합물은, siRNA 화합물이 표적 전사체에 의해 암호화된 유전사 산물의 생산을 침묵화하도록 표적 전사체의 적어도 일부에 대해 “충분하게 상보적”이다. 다른 구현예에서, siRNA 화합물은, 표적 뉴클레오티드 서열 및 siRNA 화합물이 어닐링되어, 예를 들어 정확한 상보성 영역에서 Watson-Crick 염기쌍으로만 제조된 혼성물을 형성하도록, 표적 뉴클레오티드 서열(예를 들어, 표적 전사체의 일부)에 "정확하게 상보적"이다. 표적 뉴클레오티드 서열에 “충분히 상보적인”은 표적 뉴클레오티드 서열에 정확하게 상보적인 내부 영역(예를 들어, 적어도 약 10개의 뉴클레오티드)을 포함할 수 있다. 또한, 소정의 구현예에서, siRNA 화합물은 단일 뉴클레오티드 차이를 특이적으로 구별한다. 이 경우에, siRNA 화합물은 정확한 상보성이 단일 뉴클레오티드 차이 영역에서 (예를 들어, 7개의 뉴클레오티드 내에서) 발견되는 경우에만 RNAi를 매개한다.In embodiments, the siRNA compound is “sufficiently complementary” to the target transcript such that the siRNA compound silences production of the protein encoded by the target mRNA. In embodiments, the siRNA compound is “sufficiently complementary” to at least a portion of the target transcript such that the siRNA compound silences production of the genetic product encoded by the target transcript. In other embodiments, the siRNA compound is a target nucleotide sequence (e.g., a target nucleotide sequence) such that the target nucleotide sequence and the siRNA compound anneal to form a hybrid made only of Watson-Crick base pairs, e.g., in regions of exact complementarity. It is “exactly complementary” to the part of the corpse). “Sufficiently complementary” to a target nucleotide sequence may include an internal region (e.g., at least about 10 nucleotides) that is exactly complementary to the target nucleotide sequence. Additionally, in certain embodiments, siRNA compounds specifically distinguish single nucleotide differences. In this case, the siRNA compound mediates RNAi only if exact complementarity is found in the region of a single nucleotide difference (e.g., within 7 nucleotides).

RNAi의 치료적 적용은 매우 광범위한데, 이는 siRNA 및 miRNA 작제물이 표적 단백질에 대해 유도된 임의의 뉴클레오티드 서열로 합성될 수 있기 때문이다. 현재까지, siRNA 작제물은 시험관 내 및 생체 내 모델 모두에서뿐만 아니라 임상 연구에서도 표적 단백질을 특이적으로 하향 조절하는 능력을 나타냈다.The therapeutic applications of RNAi are very broad, because siRNA and miRNA constructs can be synthesized with arbitrary nucleotide sequences directed against the target protein. To date, siRNA constructs have shown the ability to specifically downregulate target proteins in both in vitro and in vivo models as well as in clinical studies.

마이크로RNAmicroRNA

구현예에서, AC는 마이크로RNA 분자를 포함한다. 마이크로RNA(miRNA)는 식물 및 동물의 게놈에서 DNA로부터 전사되지만 단백질로 번역되지는 않는 작은 RNA 분자의 고도로 보존된 부류이다. 가공된 miRNA는 RNA-유도 침묵 복합체(RISC)에 혼입되고 발달, 세포 증식, 세포자멸사, 및 분화의 주요 조절자로서 식별된 단일 가닥 17~25개 뉴클레오티드의 RNA 분자이다. 이들은 특이적 mRNA의 3’-비번역 영역에 결합함으로써 유전자 발현을 조절하는 역할을 하는 것으로 여겨진다. RISC는 번역 억제, 전사체 절단, 또는 둘 다를 통해 유전자 발현의 하향 조절을 매개한다. RISC는 광범위한 진핵생물의 핵에서 전사 침묵화에도 관여한다.In an embodiment, the AC comprises a microRNA molecule. MicroRNAs (miRNAs) are a highly conserved class of small RNA molecules that are transcribed from DNA in the genomes of plants and animals but are not translated into proteins. Engineered miRNAs are single-stranded RNA molecules of 17-25 nucleotides that are incorporated into the RNA-induced silencing complex (RISC) and have been identified as key regulators of development, cell proliferation, apoptosis, and differentiation. They are believed to play a role in regulating gene expression by binding to the 3'-untranslated region of specific mRNAs. RISC mediates downregulation of gene expression through translational repression, transcript cleavage, or both. RISC is also involved in transcriptional silencing in a wide range of eukaryotic nuclei.

앤타고머(Antagomirs)Antagomers

구현예에서, AC는 앤타고머이다. 앤타고머는 RNAse 보호 및 약리학적 특성, 예컨대 조직 및 세포 흡수 강화를 위한 다양한 변형을 보유하는 RNA-유사 올리고뉴클레오티드이다. 이들은, 예를 들어 당, 포스포로티오에이트 백본, 및 예를 들어 3’-단부에 있는 콜레스테롤 모이어티의 완전한 2’-0-메틸화만큼 정상적인 RNA와 상이하다. 앤타고머는, 앤타고머 및 내인성 miRNA를 포함하는 이중체를 형성하여 miRNA-유도 유전자 침묵화를 방지함으로써 내인성 miRNA를 효율적으로 침묵화시키는 데 사용될 수 있다. 앤타고머 매개 miRNA 침묵화의 예는 Krutzfeldt 등의 문헌에 기술된 miR-122의 침묵화이다(전체가 명시적으로 참조로서 본원에 통합된 Krutzfeldt 등의 문헌[Nature (2005), 438: 685-689] 참조). 앤타고머 RNA는 표준 고상 올리고뉴클레오티드 합성 프로토콜을 사용해 합성할 수 있다(미국 특허 출원 제11/502,158호 및 제11/657,341호; 이들 각각의 개시는 참조로서 본원에 통합됨).In an embodiment, AC is an antagomer. Antagomers are RNA-like oligonucleotides that possess various modifications for RNAse protection and pharmacological properties, such as enhancing tissue and cellular uptake. They differ from normal RNA by, for example, the sugar, the phosphorothioate backbone, and the complete 2'-0-methylation of the cholesterol moiety, for example, at the 3'-end. Antagomers can be used to efficiently silence endogenous miRNAs by forming a duplex containing an antagomer and an endogenous miRNA to prevent miRNA-induced gene silencing. An example of antagomer-mediated miRNA silencing is the silencing of miR-122 described in Krutzfeldt et al. (Krutzfeldt et al., Nature (2005), 438: 685-, expressly incorporated herein by reference in its entirety). 689]). Antagomeric RNA can be synthesized using standard solid-phase oligonucleotide synthesis protocols (U.S. Patent Application Nos. 11/502,158 and 11/657,341; the disclosures of each of these are incorporated herein by reference).

앤타고머는 올리고뉴클레오티드 합성을 위한 리간드-접합된 단량체 서브유닛 및 단량체를 포함할 수 있다. 단량체는 미국 특허 출원 제10/916,185호에 기술되어 있다. 앤타고머는 PCT 출원 번호 PCT/US2004/07070에 기술된 바와 같은 ZXY 구조를 가질 수 있다. 앤타고머는 양친매성 모이어티와 복합체를 형성할 수 있다. 올리고뉴클레오티드 제제와 함께 사용하기 위한 양친매성 모이어티는 PCT 출원 번호 PCT/US2004/07070에 기술되어 있다.Antagomers can include monomers and ligand-conjugated monomeric subunits for oligonucleotide synthesis. The monomer is described in US patent application Ser. No. 10/916,185. Antagomers may have the ZXY structure as described in PCT Application No. PCT/US2004/07070. Antagomers can form complexes with amphipathic moieties. Amphipathic moieties for use with oligonucleotide preparations are described in PCT Application No. PCT/US2004/07070.

앱타머(Aptamers)Aptamers

구현예에서, AC는 앱타머를 포함한다. 앱타머는 높은 친화도와 특이성으로 특정 관심 분자에 결합하는 핵산 또는 펩티드 분자이다(Tuerk 및 Gold의 문헌[Science 249:505 (1990)]; Ellington 및 Szostak의 문헌[Nature 346:818 (1990)]). 큰 단백질에서 작은 유기 분자까지, 많은 상이한 엔티티에 결합하는 DNA 또는 RNA 앱타머가 성공적으로 생산되었다(Eaton의 문헌[Curr. Opin. Chem. Biol. (1997), 1: 10-16]; Famulok의 문헌[Curr. Opin. Struct. Biol. (1999), 9:324-9]; 및 Hermann 및 Patel의 문헌[Science (2000), 287:820-5]). 앱타머는 RNA 또는 DNA 계열일 수 있고 리보스위치를 포함할 수 있다. 리보스위치(riboswitch)는 작은 표적 분자에 직접 결합할 수 있고, 이의 표적 결합이 유전자의 활성에 영향을 미치는 mRNA 분자의 일부이다. 따라서, 리보스위치를 함유하는 mRNA는 이의 표적 분자의 존재 또는 부재에 따라 이의 활성을 조절하는 데 직접 관여한다. 일반적으로, 앱타머는 소분자, 단백질, 핵산, 및 심지어 세포, 조직, 및 기관과 같은 다양한 분자 표적에 결합하도록 시험관 내 선택의 반복 라운드를 통해 조작되거나, 이와 동등하게 SELEX(지수 농축에 의한 리간드의 전신적 진화)를 통해 조작된다. 앱타머는 합성, 재조합, 및 정제 방법을 포함하는 임의의 공지된 방법에 의해 제조될 수 있고, 단독으로 사용되거나 동일한 표적에 특이적인 다른 앱타머와 조합하여 사용될 수 있다. 또한, 용어 "앱타머"는 주어진 표적에 대한 2개 이상의 알려진 앱타머를 비교함으로써 유래된 컨센서스 서열을 함유하는 "이차 앱타머"도 포함한다. 구현예에서, 앱타머는 세포내 표적을 특이적으로 인식하는 “세포내 앱타머”, 또는 “인트라머(intramer)”이다(Famulok 등의 문헌[Chem Biol. (2001),8(10):931-939]; Yoon 및 Rossi의 문헌[Adv. Drug Deliv. Rev. (2018), 134:22-35]; 각각은 참조로서 본원에 통합됨).In an embodiment, the AC comprises an aptamer. Aptamers are nucleic acid or peptide molecules that bind to a specific molecule of interest with high affinity and specificity (Tuerk and Gold, Science 249:505 (1990); Ellington and Szostak, Nature 346:818 (1990)). DNA or RNA aptamers that bind to many different entities, from large proteins to small organic molecules, have been successfully produced (Eaton, Curr. Opin. Chem. Biol. (1997), 1: 10-16; Famulok, [Curr. Opin. Struct. Biol. (1999), 9:324-9]; and Hermann and Patel, Science (2000), 287:820-5. Aptamers may be of the RNA or DNA family and may contain riboswitches. A riboswitch is a part of an mRNA molecule that can bind directly to a small target molecule, and whose target binding affects the activity of the gene. Therefore, mRNA containing a riboswitch is directly involved in regulating its activity depending on the presence or absence of its target molecule. Typically, aptamers are engineered through repeated rounds of in vitro selection to bind to a variety of molecular targets such as small molecules, proteins, nucleic acids, and even cells, tissues, and organs, or, equivalently, by SELEX (systemic sequencing of ligands by exponential enrichment). is manipulated through evolution. Aptamers can be prepared by any known method, including synthetic, recombinant, and purification methods, and can be used alone or in combination with other aptamers specific for the same target. The term “aptamer” also includes “secondary aptamers” containing a consensus sequence derived by comparing two or more known aptamers for a given target. In embodiments, the aptamer is an “intracellular aptamer” or “intramer” that specifically recognizes an intracellular target (Famulok et al., Chem Biol. (2001), 8(10):931 -939]; Yoon and Rossi (Adv. Drug Deliv. Rev. (2018), 134:22-35; each incorporated herein by reference).

리보자임Ribozyme

구현예에서, AC는 리보자임이다. 리보자임은 엔도뉴클레아제 활성을 갖는 특이적 촉매 도메인을 갖는 RNA 분자 복합체이다(Kim 및 Cech의 문헌[Proc. Natl. Acad. Sci. USA (1987),84(24):8788-92]; Forster 및 Symons의 문헌[Cell (1987) 24, 49(2):211-20]). 예를 들어, 다수의 리보자임은 높은 특이성으로 포스포에스테르 전달 반응을 가속화하여, 종종 올리고뉴클레오티드 기질에서 여러 포스포에스테르 중 하나만을 절단한다(Cech 등의 문헌[Cell (1981), 27(3 Pt 2):487-96]; Michel 및 Westhof의 문헌[J. Mol. Biol. (1990), 5, 216(3):585-610]; Reinhold-Hurek 및 Shub의 문헌[Nature (1992), 14, 357(6374): 173-6]). 이러한 특이성은, 화학 반응 전에 기질이 특이적 염기쌍 형성 상호작용을 통해 리보자임의 내부 가이드 서열(IGS)에 결합한다는 요건에 기인한 것이었다.In an embodiment, AC is a ribozyme. Ribozymes are complexes of RNA molecules with specific catalytic domains with endonuclease activity (Kim and Cech, Proc. Natl. Acad. Sci. USA (1987), 84(24):8788-92; Forster and Symons (Cell (1987) 24, 49(2):211-20). For example, many ribozymes accelerate phosphoester transfer reactions with high specificity, often cleaving only one of several phosphoesters in an oligonucleotide substrate (Cech et al., Cell (1981), 27(3 Pt 2):487-96; Michel and Westhof, J. Mol. Biol. (1990), 5, 216(3):585-610; Reinhold-Hurek and Shub, Nature (1992), 14 , 357(6374): 173-6]). This specificity was due to the requirement that the substrate bind to the internal guide sequence (IGS) of the ribozyme through specific base pairing interactions prior to the chemical reaction.

자연 발생 효소 RNA의 적어도 6가지 염기성 변이체가 현재 알려져 있다. 각각은 생리학적 조건 하에서 트랜스에서 RNA 포스포디에스테르 결합의 가수분해를 촉매할 수 있다 (따라서 다른 RNA 분자를 절단할 수 있음). 일반적으로, 효소 핵산은 표적 RNA에 먼저 결합함으로써 작용한다. 이러한 결합은 표적 RNA를 절단하도록 작용하는 분자의 효소 부분에 매우 근접하게 유지되는 효소 핵산의 표적 결합 부분을 통해 발생한다. 따라서, 효소 핵산은 표적 RNA를 먼저 인식한 다음, 상보적 염기쌍 형성을 통해 표적 RNA에 결합하고, 정확한 부위에 결합된 후, 효소적으로 작용하여 표적 RNA를 절단한다. 이러한 표적 RNA의 전략적 절단은 암호화된 단백질의 합성을 유도하는 능력을 파괴할 것이다. 효소 핵산이 RNA 표적에 결합하여 이를 절단한 후, 이는 RNA로부터 방출되어 다른 표적을 찾아서 새로운 표적에 반복적으로 결합하여 이를 절단할 수 있다.At least six basic variants of naturally occurring enzyme RNA are currently known. Each can catalyze the hydrolysis of RNA phosphodiester bonds in trans (and thus cleave other RNA molecules) under physiological conditions. Generally, enzyme nucleic acids act by first binding to target RNA. This binding occurs through the target binding portion of the enzymatic nucleic acid being held in close proximity to the enzymatic portion of the molecule that acts to cleave the target RNA. Therefore, the enzymatic nucleic acid first recognizes the target RNA, then binds to the target RNA through complementary base pairing, and after binding to the correct site, acts enzymatically to cleave the target RNA. This strategic cleavage of the target RNA will destroy its ability to induce synthesis of the encoded protein. After the enzyme nucleic acid binds to and cleaves the RNA target, it is released from the RNA and can find another target and repeatedly bind to and cleave new targets.

효소 핵산 분자는 해머헤드, 헤어핀, 간염 δ 바이러스, I 군 인트론, 또는 RNaseP RNA(RNA 가이드 서열과 연관됨), 또는 예를 들어 뉴로스포라 VS RNA 모티프로 형성될 수 있다. 해머헤드 모티프의 특정 예는 Rossi 등의 문헌[Nucleic Acids Res. (1992), 20(17):4559-65]에 기술되어 있다. 헤어핀 모티프의 예는 Hampel 등의 유럽 특허 출원 공개 번호 EP 0360257, Hampel 및 Tritz의 문헌[Biochemistry (1989), 28(12):4929- 33]; Hampel 등의 문헌[Nucleic Acids Res. (1990),18(2):299-304] 및 미국 특허 제5,631,359호에 기술되어 있다. 간염 바이러스 모티프의 예는 Perrotta 및 Been의 문헌[Biochemistry (1992), 31(47): 11843-52]에 기술되어 있고; RNaseP 모티프의 예는 Guerrier-Takada 등의 문헌[Cell (1983), 35(3 Pt 2):849-57]에 기술되어 있고; 뉴로스포라 VS RNA 리보자임 모티프는 Collins에 의해 기술되어 있고(Saville 및 Collins의 문헌[Cell (1990), 61(4):685-96]; Saville 및 Collins의 문헌[Proc. Natl. Acad. Sci. USA (1991),88(19):8826-30]; Collins 및 Olive의 문헌[Biochemistry (1993),32(l l):2795-9)]; I군 인트론의 예는 미국 특허 제4,987,071호에 기술되어 있다. 구현예에서, 효소 핵산 분자는 표적 유전자 DNA 또는 RNA 영역 중 하나 이상에 상보적인 특이적 기질 결합 부위를 가지며, 이들은 해당 기질 부위 내에서 또는 이를 둘러싸는 뉴클레오티드 서열을 갖는데, 이 뉴클레오티드 서열은 RNA 절단 활성을 분자에게 부여한다. 따라서, 리보자임 작제물은 본원에 언급된 특정 모티프에 한정될 필요는 없다.The enzymatic nucleic acid molecule may be formed of a hammerhead, hairpin, hepatitis δ virus, group I intron, or RNaseP RNA (associated with an RNA guide sequence), or, for example, a Neurospora VS RNA motif. Specific examples of hammerhead motifs include Rossi et al., Nucleic Acids Res. (1992), 20(17):4559-65. Examples of hairpin motifs include European Patent Application Publication No. EP 0360257 by Hampel et al., Hampel and Tritz, Biochemistry (1989), 28(12):4929-33; Hampel et al. [Nucleic Acids Res. (1990), 18(2):299-304] and U.S. Patent No. 5,631,359. Examples of hepatitis virus motifs are described in Perrotta and Been (Biochemistry (1992), 31(47): 11843-52; Examples of RNaseP motifs are described in Guerrier-Takada et al., Cell (1983), 35(3 Pt 2):849-57; The Neurospora VS RNA ribozyme motif was described by Collins (Saville and Collins, Cell (1990), 61(4):685-96); Saville and Collins, Proc. Natl. Acad. Sci. USA (1991), 88(19):8826-30; Collins and Olive (Biochemistry (1993), 32(l l):2795-9); Examples of group I introns are described in U.S. Pat. No. 4,987,071. In an embodiment, the enzymatic nucleic acid molecule has a specific substrate binding site complementary to one or more regions of the target gene DNA or RNA, and has a nucleotide sequence within or surrounding the substrate site, which nucleotide sequence has RNA cleavage activity. is given to the molecule. Accordingly, ribozyme constructs need not be limited to the specific motifs mentioned herein.

리보자임은 국제 특허 출원 공개 번호 WO 93/23569 및 국제 특허 출원 공개 번호 WO 94/02595(각각은 참조로서 본원에 구체적으로 통합됨)에 기술된 바와 같이 설계될 수 있고, 본원에 기술된 바와 같이 시험관 내 및 생체 내에서 시험하기 위해 합성될 수 있다. 구현예에서, 리보자임은 표적 전사체의 표적 뉴클레오티드 서열에 표적화된다.Ribozymes can be designed as described in International Patent Application Publication No. WO 93/23569 and International Patent Application Publication No. WO 94/02595 (each of which is specifically incorporated herein by reference) and can be grown in vitro as described herein. It can be synthesized for testing in vitro and in vivo. In an embodiment, the ribozyme is targeted to the target nucleotide sequence of the target transcript.

리보자임 활성은 리보자임 결합 아암의 길이를 변경하거나, 혈청 리보뉴클레아제에 의한 분해를 방지하는 변형으로 리보자임을 화학적으로 합성하거나(예를 들어 효소 RNA 분자의 당 변형에 대해 이루어질 수 있는 다양한 화학적 변형을 기술하는 국제 특허 출원 공개 번호 WO 92/07065; 국제 특허 출원 공개 번호 WO 93/15187; 국제 특허 출원 공개 WO 91/03162; 유럽 특허 출원 공개 제92110298.4호; 미국 특허 제5,334,711호; 및 국제 특허 출원 공개 번호 WO 94/13688 참조), 세포에서 이들의 효능을 향상시키는 변형, 및 RNA 합성 시간을 단축하고 화학적 요건을 감소시키기 위한 줄기 Π 염기의 제거에 의해 증가될 수 있다.Ribozyme activity can be achieved by altering the length of the ribozyme binding arm, by chemically synthesizing the ribozyme with modifications that prevent degradation by serum ribonucleases (for example, by sugar modification of the enzyme RNA molecule). International Patent Application Publication No. WO 92/07065, International Patent Application Publication No. WO 93/15187, International Patent Application Publication No. WO 91/03162, European Patent Application Publication No. 92110298.4, U.S. Patent No. 5,334,711, and International Patent Application Publication No. 92110298.4, which describe chemical modifications. See Patent Application Publication No. WO 94/13688), modifications to improve their efficacy in cells, and removal of stem Π bases to shorten RNA synthesis time and reduce chemical requirements.

수퍼머(Supermir)Supermir

구현예에서, AC는 슈퍼머이다. 수퍼머는 단일 가닥, 이중 가닥, 또는 부분 이중 가닥 올리고머, 또는 RNA의 중합체, DNA의 중합체, 또는 둘 다, 이들의 변형을 지칭하는데, 수퍼머는 miRNA와 실질적으로 동일하고 이의 표적에 대해 안티센스인 뉴클레오티드 서열을 갖는다. 이 용어는 자연 발생 핵염기, 당, 및 공유 뉴클레오시드간 (백본) 연결로 이루어지고, 유사하게 기능하는 적어도 하나의 비-자연 발생 부분을 함유하는 올리고뉴클레오티드를 포함한다. 이러한 변형되거나 치환된 올리고뉴클레오티드는, 예를 들어 세포 흡수 강화, 핵산 표적에 대한 친화도 강화, 및 뉴클레아제의 존재 시 안정성 증가와 같은 바람직한 특성을 갖는다. 구현예에서, 수퍼머는 센스 가닥을 포함하지 않고, 다른 구현예에서, 수퍼머는 상당한 정도로 자가 혼성화되지 않는다. 슈퍼머는 이차 구조를 가질 수 있지만, 생리학적 조건 하에서는 실질적으로 단일 가닥이다. 실질적으로 단일 가닥인 슈퍼머는, 슈퍼머의 약 50% 미만(예를 들어, 약 40%, 약 30%, 약 20%, 약 10%, 또는 약 5% 미만)이 그 자체와 이중체화되는 정도까지 단일 가닥이다. 슈퍼머는 헤어핀 분절, 예를 들어 3’ 말단에서의 서열은 자가-혼성화되고 이중체 영역, 예를 들어 적어도 약 1, 약 2, 약 3, 또는 약 4개, 또는 약 8, 약 7, 약 6, 또는 약 5개 뉴클레오티드 미만, 또는 약 5개 뉴클레오티드의 이중체 영역을 형성할 수 있다. 이중체 영역은 링커, 예를 들어 뉴클레오티드 링커, 예를 들어 약 3, 약 4, 약 5, 또는 약 6 dT, 예를 들어 변형된 dT에 의해 연결될 수 있다. 또 다른 구현예에서, 슈퍼머는 더 짧은 올리고, 예를 들어 약 5, 약 6, 약 7, 약 8, 약 9, 또는 약 10개 뉴클레오티드 길이의 올리고와, 예를 들어 수퍼머의 3’ 및 5’ 단부 중 하나 또는 둘 모두에서, 또는 일 단부 및 슈퍼머의 비-말단 또는 중간에서 이중체화된다. In an embodiment, AC is a supermer. Supermer refers to a single-stranded, double-stranded, or partially double-stranded oligomer, or a polymer of RNA, a polymer of DNA, or both, or a modification thereof, wherein the supermer is substantially identical to a miRNA and is antisense to its target. It has a nucleotide sequence. The term includes oligonucleotides consisting of naturally occurring nucleobases, sugars, and shared internucleoside (backbone) linkages and containing at least one non-naturally occurring moiety that functions similarly. These modified or substituted oligonucleotides have desirable properties, such as enhanced cellular uptake, enhanced affinity for nucleic acid targets, and increased stability in the presence of nucleases. In embodiments, the supermer does not include a sense strand, and in other embodiments, the supermer does not self-hybridize to a significant degree. Supermers may have secondary structures, but are substantially single stranded under physiological conditions. A substantially single-stranded supermer is such that less than about 50% (e.g., less than about 40%, about 30%, about 20%, about 10%, or about 5%) of the supermer is duplexed with itself. It is a single strand. A supermer is a hairpin segment, e.g., a sequence at the 3' end that self-hybridizes and has a duplex region, e.g., at least about 1, about 2, about 3, or about 4, or about 8, about 7, or about 6. , or less than about 5 nucleotides, or may form a duplex region of about 5 nucleotides. The duplex regions may be connected by a linker, for example a nucleotide linker, for example about 3, about 4, about 5, or about 6 dT, for example a modified dT. In another embodiment, the supermer is a shorter oligo, e.g., about 5, about 6, about 7, about 8, about 9, or about 10 nucleotides long, e.g., 3' and 5 nucleotides of the supermer. ' Duplexed at one or both of the ends, or at one end and at the non-terminus or middle of the supermer.

miRNA 모방체miRNA mimic

구현예에서, AC는 miRNA 모방체이다. miRNA 모방체는 하나 이상의 miRNA의 유전자 침묵화 능력을 모방하는 데 사용될 수 있는 분자의 부류를 나타낸다. 따라서 용어 “microRNA 모방체”는 RNAi 경로에 진입하여 유전자 발현을 조절할 수 있는 합성 비코딩 RNA(즉, 내인성 miRNA의 공급원으로부터 정제에 의해 수득되지 않는 miRNA)를 지칭한다. miRNA 모방체는 성숙한 분자(예를 들어, 단일 가닥) 또는 모방 전구체(예: pri- 또는 pre-miRNA)로서 설계될 수 있다. miRNA 모방체는 다음을 포함하지만 이에 한정되지 않는 올리고뉴클레오티드를 포함하는 핵산(변형되거나 변형된 핵산)을 포함할 수 있다: RNA, 변형된 RNA, DNA, 변형된 DNA, 잠금 핵산, 또는 2'-0,4'-C-에틸렌-가교된 핵산(ENA), 또는 이들의 임의의 조합(DNA-RNA 혼성물 포함). 또한, miRNA 모방체는 전달, 세포내 구획화, 안정성, 특이성, 작용성, 가닥 사용, 및/또는 효능에 영향을 미칠 수 있는 접합체를 포함할 수 있다. 하나의 설계에서, miRNA 모방체는 (예를 들어, 약 16 내지 약 31개 뉴클레오티드 길이의 이중체 영역을 갖는) 이중 가닥 분자이고, 주어진 miRNA의 성숙한 가닥과 동일성을 갖는 하나 이상의 서열을 함유한다. 변형은 분자의 하나의 가닥 또는 두 가닥 모두에 대한 2’ 변형(2’-0 메틸 변형 및 2’ F 변형 포함) 및 핵산 안정성 및/또는 특이성을 향상시키는 뉴클레오시드간 변형(예를 들어, 포스포로티오에이트 변형)을 포함할 수 있다. 또한, miRNA 모방체는 오버행을 포함할 수 있다. 오버행은 두 가닥 중 어느 하나의 3’ 또는 5’ 말단 상에 약 1 내지 약 6개의 뉴클레오티드를 포함할 수 있고, 안정성 또는 작용성을 향상시키도록 변형될 수 있다. 구현예에서, miRNA 모방체는 약 16 내지 약 31개 뉴클레오티드의 이중체 영역 및 다음의 화학적 변형 패턴 중 하나 이상을 포함한다: 센스 가닥인 뉴클레오티드 1 및 2(센스 올리고뉴클레오티드의 5’ 단부로부터 계수함) 및 C 및 U 모두의 2’-0-메틸 변형을 함유하며; 안티센스 가닥 변형은 C 및 U 모두의 2’ F 변형, 올리고뉴클레오티드의 5’ 단부의 인산화, 및 2 뉴클레오티드 3’ 오버행과 연관된 안정화된 뉴클레오시드간 연결을 포함할 수 있음. In an embodiment, AC is a miRNA mimetic. MiRNA mimics represent a class of molecules that can be used to mimic the gene silencing ability of one or more miRNAs. Accordingly, the term “microRNA mimetic” refers to synthetic non-coding RNA (i.e., a miRNA not obtained by purification from a source of endogenous miRNA) that can enter the RNAi pathway and regulate gene expression. MiRNA mimics can be designed as mature molecules (e.g., single-stranded) or mimic precursors (e.g., pri- or pre-miRNA). A miRNA mimetic may include a nucleic acid (modified or modified nucleic acid) containing oligonucleotides, including but not limited to: RNA, modified RNA, DNA, modified DNA, locked nucleic acid, or 2'- 0,4'-C-ethylene-crosslinked nucleic acid (ENA), or any combination thereof (including DNA-RNA hybrids). Additionally, miRNA mimetics can include conjugates that can affect delivery, intracellular compartmentalization, stability, specificity, functionality, strand usage, and/or efficacy. In one design, a miRNA mimetic is a double-stranded molecule (e.g., having a duplex region of about 16 to about 31 nucleotides in length) and contains one or more sequences that have identity to the mature strand of a given miRNA. Modifications include 2' modifications to one or both strands of the molecule (including 2'-0 methyl modifications and 2' F modifications) and internucleoside modifications that improve nucleic acid stability and/or specificity (e.g. phosphorothioate modification). Additionally, the miRNA mimic may contain overhangs. The overhang may comprise from about 1 to about 6 nucleotides on the 3' or 5' end of either strand and may be modified to improve stability or functionality. In an embodiment, the miRNA mimetic comprises a duplex region of about 16 to about 31 nucleotides and one or more of the following chemical modification patterns: nucleotides 1 and 2, the sense strand (counted from the 5' end of the sense oligonucleotide) ) and 2'-0-methyl modifications of both C and U; Antisense strand modifications may include 2' F modifications of both C and U, phosphorylation of the 5' end of the oligonucleotide, and a stabilized internucleoside linkage associated with a 2 nucleotide 3' overhang.

miRNA 억제제miRNA inhibitors

구현예에서, AC는 miRNA 억제제이다. 용어 "안티머(antimir)" "마이크로RNA 억제제", "miR 억제제", 또는 "miRNA 억제제"는 동의어이며, 특정 miRNA의 능력을 방해하는 올리고뉴클레오티드 또는 변형된 올리고뉴클레오티드를 지칭한다. 일반적으로, 억제제는 RNA, 변형된 RNA, DNA, 변형된 DNA, 잠금 핵산(LNA), 또는 이들의 임의의 조합을 포함하는 올리고뉴클레오티드를 포함하는, 사실상은 핵산 또는 변형된 핵산이다.In an embodiment, AC is a miRNA inhibitor. The terms “antimir,” “microRNA inhibitor,” “miR inhibitor,” or “miRNA inhibitor” are synonymous and refer to an oligonucleotide or modified oligonucleotide that interferes with the ability of a specific miRNA. Typically, the inhibitor is a nucleic acid or modified nucleic acid in nature, including an oligonucleotide comprising RNA, modified RNA, DNA, modified DNA, locked nucleic acid (LNA), or any combination thereof.

변형은 전달, 안정성, 특이성, 세포내 구획화, 또는 효능에 영향을 미칠 수 있는 2’ 변형(2’-0 알킬 변형 및 2’ F 변형 포함) 및 뉴클레오시드간 변형(예를 들어, 포스포로티오에이트 변형)을 포함한다. 또한, miRNA 억제제는 전달, 세포내 구획화, 안정성, 및/또는 효능에 영향을 미칠 수 있는 접합체를 포함할 수 있다. 억제제는 단일 가닥, 이중 가닥(RNA/RNA 또는 RNA/DNA 이중체), 및 헤어핀 설계를 포함하는 다양한 구성을 채택할 수 있고, 일반적으로 마이크로RNA 억제제는 표적화될 miRNA의 성숙한 가닥(가닥들)과 상보적이거나 부분적으로 상보적인 하나 이상의 서열 또는 서열의 일부를 포함한다. 또한, miRNA 억제제는 성숙한 miRNA의 역보체인 서열에 대해 5’ 및 3’에 위치한 추가 서열을 포함할 수도 있다. 추가 서열은 성숙한 miRNA가 유래되는 pri-miRNA에서 성숙한 miRNA에 인접한 서열의 역보체일 수 있거나, 추가 서열은 (A, G, C, 또는 U의 혼합물을 갖는) 임의 서열일 수 있다. 구현예에서, 추가 서열 중 하나 또는 둘 다는 헤어핀을 형성할 수 있는 임의 서열이다. 따라서, 구현예에서, miRNA의 역보체인 서열은 헤어핀 구조가 5’ 측부 및 3’ 측부에 위치한다. 마이크로-RNA 억제제가 이중 가닥일 때, 이는 반대 가닥 상의 뉴클레오티드 사이에서 미스매치를 포함할 수 있다. 또한, 마이크로-RNA 억제제는 세포 내로 억제제의 흡수를 용이하게 하기 위해 접합체 모이어티에 연결될 수 있다. 예를 들어, 마이크로-RNA 억제제는 마이크로-RNA 억제제를 세포 내로 수동적으로 흡수시킬 수 있는 콜레스테릴 5-(비스(4-메톡시페닐)(페닐)메톡시)-3 하이드록시펜틸카르바메이트)에 연결될 수 있다. 헤어핀 miRNA 억제제를 포함하여, 마이크로-RNA 억제제는 Vermeulen 등의 문헌[RNA 13: 723- 730 (2007)] 및 WO2007/095387 및 WO 2008/036825에 상세하게 기술되어 있다(이들 각각은 그 전체가 참조로서 본원에 통합됨). 당업자는 데이터베이스로부터 원하는 miRNA에 대한 서열을 선택하고 본원에 개시된 방법에 유용한 억제제를 설계할 수 있다.Modifications can include 2' modifications (including 2'-0 alkyl modifications and 2' F modifications) and internucleoside modifications (e.g., phosphoro- thioate modification). Additionally, miRNA inhibitors may include conjugates that may affect delivery, intracellular compartmentalization, stability, and/or efficacy. Inhibitors can adopt a variety of configurations, including single-stranded, double-stranded (RNA/RNA or RNA/DNA duplex), and hairpin designs, and generally microRNA inhibitors combine the mature strands (strands) of the miRNA to be targeted. Contains one or more complementary or partially complementary sequences or portions of sequences. Additionally, the miRNA inhibitor may contain additional sequences located 5' and 3' to the sequence that is the reverse complement of the mature miRNA. The additional sequence may be the reverse complement of a sequence adjacent to the mature miRNA in the pri-miRNA from which the mature miRNA is derived, or the additional sequence may be any sequence (with a mixture of A, G, C, or U). In an embodiment, one or both of the additional sequences are any sequence capable of forming a hairpin. Accordingly, in an embodiment, the sequence that is the reverse complement of the miRNA has hairpin structures located on the 5' and 3' sides. When a micro-RNA inhibitor is double stranded, it may contain mismatches between nucleotides on opposite strands. Additionally, micro-RNA inhibitors can be linked to a conjugate moiety to facilitate uptake of the inhibitor into the cell. For example, micro-RNA inhibitors include cholesteryl 5-(bis(4-methoxyphenyl)(phenyl)methoxy)-3 hydroxypentylcarbamate, which can passively uptake micro-RNA inhibitors into cells. ) can be connected to. Micro-RNA inhibitors, including hairpin miRNA inhibitors, are described in detail in Vermeulen et al. (RNA 13: 723-730 (2007)) and in WO2007/095387 and WO 2008/036825 (each of which is referenced in its entirety). (incorporated herein). One skilled in the art can select a sequence for a desired miRNA from a database and design inhibitors useful in the methods disclosed herein.

당업계에 공지된 것들과 같은 연결기 또는 이작용성 연결 모이어티가 본원에 제공된 화합물에 적합할 수 있다. 연결기는 화학적 작용기, 접합기, 리포터기, 및 다른 기를 예를 들어 AC와 같은 부모 화합물의 선택적 부위에 부착하는 데 유용하다. 일반적으로, 이작용성 연결 모이어티는 2개의 작용기를 갖는 하이드로카르빌 모이어티를 포함한다. 작용기 중 하나는 관심 부모 분자 또는 화합물에 결합하도록 선택되고, 다른 하나는 화학적 작용기 또는 접합기와 같은 임의의 선택된 작용기에 본질적으로 결합하도록 선택된다. 본원에 기술된 링커 중 어느 하나가 사용될 수 있다. 구현예에서, 링커는 사슬 구조를 포함하거나 에틸렌 글리콜 또는 아미노산 단위와 같은 반복 단위의 올리고머를 포함한다. 이작용성 연결 모이어티에 일상적으로 사용되는 작용기의 예는 친핵성기와 반응하기 위한 친전자체 및 친전자성기와 반응하기 위한 친핵체를 포함하지만 이에 한정되지는 않는다. 구현예에서, 이작용성 연결 모이어티는 아미노, 하이드록실, 카르복시산, 티올, 불포화물(예: 이중 또는 삼중 결합) 등을 포함한다. 이작용성 결합 모이어티의 일부 비제한적인 예는 8-아미노-3,6-디옥사옥탄산(ADO), 숙신이미딜 4-(N-말레이미도메틸)시클로헥산-1-카르복실레이트(SMCC), 및 6-아미노헥산산(AHEX 또는 AHA)을 포함한다. 다른 연결기는 치환된 C1-C10 알킬, 치환되었거나 치환되지 않은 C2-C10 알케닐 또는 치환되었거나 치환되지 않은 C2-C10 알키닐을 포함하지만 이에 한정되지 않으며, 여기서 치환기의 비제한적인 목록은 하이드록실, 아미노, 알콕시, 카르복시, 벤질, 페닐, 니트로, 티올, 티오알콕시, 할로겐, 알킬, 아릴, 알케닐, 및 알키닐을 포함한다.Linking groups or bifunctional linking moieties, such as those known in the art, may be suitable for the compounds provided herein. Linkers are useful for attaching chemical functional groups, adapter groups, reporter groups, and other groups to selective sites of the parent compound, such as AC. Typically, bifunctional linking moieties include a hydrocarbyl moiety with two functional groups. One of the functional groups is selected to bind to the parent molecule or compound of interest, and the other is selected to bind essentially any selected functional group, such as a chemical functional group or conjugation group. Any of the linkers described herein may be used. In embodiments, the linker comprises a chain structure or an oligomer of repeating units such as ethylene glycol or amino acid units. Examples of functional groups routinely used in bifunctional linking moieties include, but are not limited to, electrophiles for reacting with nucleophilic groups and nucleophiles for reacting with electrophilic groups. In embodiments, the bifunctional linking moiety includes amino, hydroxyl, carboxylic acid, thiol, unsaturated (e.g., double or triple bond), etc. Some non-limiting examples of bifunctional binding moieties include 8-amino-3,6-dioxaoctanoic acid (ADO), succinimidyl 4-(N-maleimidomethyl)cyclohexane-1-carboxylate (SMCC) , and 6-aminohexanoic acid (AHEX or AHA). Other linking groups include, but are not limited to, substituted C1-C10 alkyl, substituted or unsubstituted C2-C10 alkenyl, or substituted or unsubstituted C2-C10 alkynyl, wherein a non-limiting list of substituents includes hydroxyl, Includes amino, alkoxy, carboxy, benzyl, phenyl, nitro, thiol, thioalkoxy, halogen, alkyl, aryl, alkenyl, and alkynyl.

구현예에서, AC는 RNase H 활성을 뒷받침하지 않도록 설계된 뉴클레오티드 변형을 포함한다. RNase H 활성을 뒷받침하지 않는 안티센스 화합물의 뉴클레오티드 변형은 공지되어 있고, 2’-O-메톡시 에틸/포스포로티오에이트(MOE) 변형을 포함하지만 이에 한정되지는 않는다. 유리하게는, MOE 변형을 갖는 AC는 표적 RNA에 대해 증가된 친화도를 갖고, 뉴클레아제 안정성을 증가시킨다. In an embodiment, the AC comprises nucleotide modifications designed not to support RNase H activity. Nucleotide modifications of antisense compounds that do not support RNase H activity are known and include, but are not limited to, the 2'-O-methoxy ethyl/phosphorothioate (MOE) modification. Advantageously, ACs with MOE modifications have increased affinity for target RNA and increase nuclease stability.

면역자극 올리고뉴클레오티드Immunostimulatory oligonucleotides

구현예에서, 치료 모이어티는 면역자극 올리고뉴클레오티드이다. 면역자극 올리고뉴클레오티드(ISS; 단일 가닥 또는 이중 가닥)는 포유동물 또는 다른 환자일 수 있는 환자에게 투여될 때 면역 반응을 유도할 수 있다. ISS는, 예를 들어 헤어핀 이차 구조로 이어지는 특정 회문(Yamamoto S. 등의 문헌[(1992) J. Immunol. 148: 4072-4076]), 또는 CpG 모티프뿐만 아니라 다른 공지된 ISS 특징부(예컨대, 다중-G 도메인, WO 96/11266 참조)를 포함한다.In an embodiment, the therapeutic moiety is an immunostimulatory oligonucleotide. Immunostimulatory oligonucleotides (ISS; single or double stranded) can induce an immune response when administered to a patient, which may be a mammal or other patient. ISSs can, for example, contain specific palindromes leading to hairpin secondary structures (Yamamoto S. et al. (1992) J. Immunol. 148: 4072-4076), or CpG motifs as well as other known ISS features (e.g. multi-G domain, see WO 96/11266).

면역 반응은 선천 면역 반응 또는 적응 면역 반응일 수 있다. 면역계는 보다 선천적인 면역계, 및 척추동물의 후천적 적응 면역계로 분할되며, 이들 중 후자는 체액 세포 성분으로 추가로 분할된다. 특정 구현예에서, 면역 반응은 점막성일 수 있다.The immune response may be an innate or adaptive immune response. The immune system is divided into the more innate immune system and the adaptive immune system of vertebrates, the latter of which is further divided into humoral cellular components. In certain embodiments, the immune response may be mucosal.

면역자극 핵산은, 이들 핵산이 면역 반응을 유발하기 위해 표적 폴리뉴클레오티드에 특이적으로 결합하여 이의 발현을 감소시킬 필요가 없는 경우에, 비-서열 특이적인 것으로 간주된다. 따라서, 특정 면역자극 핵산은 자연 발생 유전자 또는 mRNA의 영역에 상응하는 서열을 포함할 수 있지만, 이들은 여전히 비-서열 특이적 면역자극 핵산으로 간주될 수 있다.Immunostimulatory nucleic acids are considered non-sequence specific if these nucleic acids do not need to specifically bind to and reduce the expression of the target polynucleotide to elicit an immune response. Accordingly, although certain immunostimulatory nucleic acids may contain sequences that correspond to regions of naturally occurring genes or mRNAs, they may still be considered non-sequence specific immunostimulatory nucleic acids.

구현예에서, 면역자극 핵산 또는 올리고뉴클레오티드는 적어도 하나의 CpG 디뉴클레오티드를 포함한다. 올리고뉴클레오티드 또는 CpG 디뉴클레오티드는 메틸화되지 않거나 메틸화될 수 있다. 또 다른 구현예에서, 면역자극 핵산은 메틸화된 시토신을 갖는 적어도 하나의 CpG 디뉴클레오티드를 포함한다. 구현예에서, 핵산은 단일 CpG 디뉴클레오티드를 포함하되, 상기 CpG 디뉴클레오티드 내의 시토신은 메틸화된다. 특정 구현예에서, 핵산은 서열 5’ TAACGTTGAGGG’CAT 3’(서열번호 369)을 포함한다. 대안적인 구현예에서, 핵산은 적어도 2개의 CpG 디뉴클레오티드를 포함하되, CpG 디뉴클레오티드 내의 적어도 하나의 시토신은 메틸화된다. 추가의 구현예에서, 서열에 존재하는 CpG 디뉴클레오티드 내의 각각의 시토신은 메틸화된다. 다른 구현예에서, 핵산은 복수의 CpG 디뉴클레오티드를 포함하되, 상기 CpG 디뉴클레오티드 중 적어도 하나는 메틸화된 시토신을 포함한다.In an embodiment, the immunostimulatory nucleic acid or oligonucleotide comprises at least one CpG dinucleotide. Oligonucleotides or CpG dinucleotides may be unmethylated or methylated. In another embodiment, the immunostimulatory nucleic acid comprises at least one CpG dinucleotide with a methylated cytosine. In an embodiment, the nucleic acid comprises a single CpG dinucleotide, wherein the cytosine within the CpG dinucleotide is methylated. In certain embodiments, the nucleic acid comprises sequence 5' TAACGTTGAGGG'CAT 3' (SEQ ID NO: 369). In an alternative embodiment, the nucleic acid comprises at least two CpG dinucleotides, wherein at least one cytosine within the CpG dinucleotide is methylated. In a further embodiment, each cytosine within a CpG dinucleotide present in the sequence is methylated. In another embodiment, the nucleic acid comprises a plurality of CpG dinucleotides, wherein at least one of the CpG dinucleotides comprises a methylated cytosine.

조성물 및 방법에 사용하기에 적합한 올리고뉴클레오티드(ODN)의 추가적인 특이적 핵산 서열은 Raney 등의 문헌[Journal of Pharmacology and Experimental Therapeutics, 298:1185-1192 (2001)]에 기술되어 있다. 소정의 구현예에서, 조성물 및 방법에 사용된 ODN은 포스포디에스테르("PO") “X본 또는 포스포로티오에이트("PS") 백본, 및/또는 CpG 모티프 내의 적어도 하나의 메틸화된 시토신 잔기를 갖는다.Additional specific nucleic acid sequences of oligonucleotides (ODNs) suitable for use in the compositions and methods are described in Raney et al., Journal of Pharmacology and Experimental Therapeutics, 298:1185-1192 (2001). In certain embodiments, the ODN used in the compositions and methods have a phosphodiester (“PO”) Xbone or a phosphorothioate (“PS”) backbone, and/or at least one methylated cytosine residue within a CpG motif. has

유인 올리고뉴클레오티드decoy oligonucleotide

구현예에서, 치료 모이어티는 유인 올리고뉴클레오티드이다. 전사 인자는 주변 게놈 DNA가 없는 경우 조차도 이들의 비교적 짧은 결합 서열을 인식하기 때문에, 특이적 전사 인자의 컨센서스 결합 서열을 갖는 짧은 올리고뉴클레오티드가 살아있는 세포에서 유전자 발현을 조작하기 위한 도구로서 사용될 수 있다. 이러한 전략은 이러한 "유인 올리고뉴클레오티드"의 세포내 전달을 포함하는데, 세포내 전달된 유인 올리고뉴클레오티드는 표적 인자에 의해 인식되고 결합된다. 전사 인자가 유인에 의해 DNA 결합 부위를 점유한 후에는, 전사 인자가 표적 유전자의 프로모터 영역에 결합할 수 없게 된다. 유인은 전사 인자에 의해 활성화되는 유전자의 발현을 억제하거나, 전사 인자의 결합에 의해 억제되는 유전자를 상향조절하기 위한 치료제로서 사용될 수 있다. 유인 올리고뉴클레오티드의 사용에 대한 예는 Mann 등의 문헌[J. Clin. Invest, 2000, 106: 1071-1075]에서 확인할 수 있고, 동 문헌은 그 전체가 참조로서 본원에 명시적으로 통합된다.In an embodiment, the therapeutic moiety is a decoy oligonucleotide. Because transcription factors recognize their relatively short binding sequences even in the absence of surrounding genomic DNA, short oligonucleotides with consensus binding sequences of specific transcription factors can be used as tools for manipulating gene expression in living cells. This strategy involves intracellular delivery of such “decoy oligonucleotides,” which are recognized and bound by targeting factors. After the transcription factor occupies the DNA binding site by attraction, the transcription factor is unable to bind to the promoter region of the target gene. Attractants can be used as a therapeutic agent to suppress the expression of genes activated by transcription factors or to upregulate genes suppressed by binding of transcription factors. An example of the use of decoy oligonucleotides is found in Mann et al. [J. Clin. Invest, 2000, 106: 1071-1075, which is expressly incorporated herein by reference in its entirety.

U1 어댑터U1 adapter

일부 구현예에서, 치료 모이어티는 U1 어댑터이다. U1 어댑터는 polyA 부위를 억제하며, 표적 유전자의 말단 엑손 내의 부위에 상보적인 표적 도메인; 및 U1 snRNP의 U1 더 작은 핵 RNA 성분에 결합하는 ‘U1 도메인’을 갖는 이작용성 올리고뉴클레오티드이다(Goraczniak 등의 문헌[2008, Nature Biotechnology, 27(3), 257-263], 그 전체가 참조로서 본원에 명시적으로 통합됨). U1 snRNP는 pre-mRNA 엑손-인트론 경계에 결합함으로써 스플라이소좀 형성의 초기 단계를 유도하도록 주로 작용하는 리보핵단백질 복합체이다(Brown 및 Simpson의 문헌[1998, Annu Rev Plant Physiol Plant Mol Biol 49:77-95]). U1 snRNA 염기 쌍의 5’ 단부의 뉴클레오티드 2~11은 pre mRNA의 5’ss와 결합한다. 일 구현예에서, 올리고뉴클레오티드는 U1 어댑터이다. 일 구현예에서, Ul 어댑터는 적어도 하나의 다른 iRNA 제제와 병용으로 투여될 수 있다.In some embodiments, the therapeutic moiety is a U1 adapter. The U1 adapter suppresses a polyA site, a targeting domain complementary to a site within the terminal exon of the target gene; and a 'U1 domain' that binds to the U1 smaller nuclear RNA component of the U1 snRNP (Goraczniak et al., 2008, Nature Biotechnology, 27(3), 257-263, by reference in its entirety. expressly incorporated herein). U1 snRNP is a ribonucleoprotein complex that acts primarily to induce the initial steps of spliceosome formation by binding to the pre-mRNA exon-intron boundary (Brown and Simpson, 1998, Annu Rev Plant Physiol Plant Mol Biol 49:77 -95]). Nucleotides 2 to 11 of the 5’ end of the U1 snRNA base pair bind to the 5’ss of the pre mRNA. In one embodiment, the oligonucleotide is a U1 adapter. In one embodiment, the Ul adapter can be administered in combination with at least one other iRNA agent.

(CRISPR) 유전자 편집 기계(CRISPR) gene editing machine

구현예에서, 본원에 개시된 화합물은 CRISPR 유전자 편집 기계에 접합된 하나 이상의 CPP(또는 cCPP)를 포함한다. 본원에서 사용되는 바와 같이, “CRISPR 유전자 편집 기계”는 게놈을 편집하는 데 사용될 수 있는 단백질, 핵산, 또는 이들의 조합을 지칭한다. 유전자 편집 기계의 비제한적인 예는 gRNA, 뉴클레아제, 뉴클레아제 억제제, 및 이들의 조합 및 복합체를 포함한다. 다음의 특허 문헌은 CRISPR 유전자 편집 기계를 기술한다: 미국 특허 제8,697,359호, 미국 특허 제8,771,945호, 미국 특허 제8,795,965호, 미국 특허 제8,865,406호, 미국 특허 제8,871,445호, 미국 특허 제8,889,356호, 미국 특허 제8,895,308호, 미국 특허 제8,906,616호, 미국 특허 제8,932,814호, 미국 특허 제8,945,839호, 미국 특허 제8,993,233호, 미국 특허 제8,999,641호, 미국 특허 제14/704,551호, 및 미국 특허 제13/842,859호. 전술한 특허 문헌 각각은 그 전체가 참조로서 본원에 통합된다.In an embodiment, the compounds disclosed herein comprise one or more CPPs (or cCPPs) conjugated to the CRISPR gene editing machine. As used herein, “CRISPR gene editing machine” refers to a protein, nucleic acid, or combination thereof that can be used to edit a genome. Non-limiting examples of gene editing machinery include gRNA, nucleases, nuclease inhibitors, and combinations and complexes thereof. The following patent documents describe CRISPR gene editing machines: U.S. Patent No. 8,697,359, U.S. Patent No. 8,771,945, U.S. Patent No. 8,795,965, U.S. Patent No. 8,865,406, U.S. Patent No. 8,871,445, U.S. Patent No. 8,889,356, U.S. Patent No. Patent Nos. 8,895,308, US Patent 8,906,616, US Patent 8,932,814, US Patent 8,945,839, US Patent 8,993,233, US Patent 8,999,641, US Patent 14/704,551, and US Patent 13/842,859. like. Each of the foregoing patent documents is incorporated herein by reference in its entirety.

구현예에서, 링커는 cCPP를 CRISPR 유전자 편집 기계에 접합시킨다. 본 개시에 기술되거나 당업자에게 알려진 임의의 링커가 사용될 수 있다.In an embodiment, the linker conjugates cCPP to the CRISPR gene editing machine. Any linker described in this disclosure or known to those skilled in the art may be used.

gRNAgRNA

구현예에서, 화합물은 gRNA에 접합된 CPP(또는 cCPP)를 포함한다. gRNA는 원핵 또는 진핵 세포에서 게놈 유전자좌를 표적화한다.In an embodiment, the compound comprises CPP (or cCPP) conjugated to a gRNA. gRNA targets genomic loci in prokaryotic or eukaryotic cells.

구현예에서, gRNA는 단일 분자 가이드 RNA(sgRNA)이다. sgRNA는 스페이서 서열 및 스캐폴드 서열을 포함한다. 스페이서 서열은 뉴클레아제(예를 들어, Cas9 뉴클레아제)를 특정 관심 뉴클레오티드 영역(예를 들어, 절단될 게놈 DNA 서열)에 대해 표적화하는 데 사용되는 짧은 핵산 서열이다. 구현예에서, 스페이서는 약 17~24 염기의 길이, 예컨대 약 20 염기의 길이일 수 있다. 구현예에서, 스페이서는 약 15, 약 16, 약 17, 약 18, 약 19, 약 20, 약 21, 약 22, 약 23, 약 24, 약 25, 약 26, 약 27, 약 28, 약 29, 또는 약 30 염기의 길이일 수 있다. 구현예에서, 스페이서는 적어도 15, 적어도 16, 적어도 17, 적어도 18, 적어도 19, 적어도 20, 적어도 21, 적어도 22, 적어도 23, 적어도 24, 적어도 25, 적어도 26, 적어도 27, 적어도 28, 적어도 29, 또는 적어도 30 염기의 길이일 수 있다. 구현예에서, 스페이서는 약 15, 약 16, 약 17, 약 18, 약 19, 약 20, 약 21, 약 22, 약 23, 약 24, 약 25, 약 26, 약 27, 약 28, 약 29, 또는 약 30 염기의 길이일 수 있다. 구현예에서, 스페이서 서열은 약 40% 내지 약 80%의 GC 함량을 갖는다.In an embodiment, the gRNA is a single molecule guide RNA (sgRNA). sgRNA includes a spacer sequence and a scaffold sequence. A spacer sequence is a short nucleic acid sequence used to target a nuclease (e.g., Cas9 nuclease) to a specific nucleotide region of interest (e.g., the genomic DNA sequence to be cleaved). In embodiments, the spacer can be about 17-24 bases in length, such as about 20 bases in length. In embodiments, the spacer is about 15, about 16, about 17, about 18, about 19, about 20, about 21, about 22, about 23, about 24, about 25, about 26, about 27, about 28, about 29. , or may be about 30 bases long. In embodiments, the spacer is at least 15, at least 16, at least 17, at least 18, at least 19, at least 20, at least 21, at least 22, at least 23, at least 24, at least 25, at least 26, at least 27, at least 28, at least 29 , or may be at least 30 bases in length. In embodiments, the spacer is about 15, about 16, about 17, about 18, about 19, about 20, about 21, about 22, about 23, about 24, about 25, about 26, about 27, about 28, about 29. , or may be about 30 bases long. In embodiments, the spacer sequence has a GC content of about 40% to about 80%.

구현예에서, 스페이서는 5’ 프로토스페이서 인접 모티프(PAM)에 바로 선행하는 부위를 표적화한다. PAM 서열은 원하는 뉴클레아제에 기초하여 선택될 수 있다. 예를 들어, PAM 서열은 아래 표 3에 나타낸 PAM 서열 중 어느 하나일 수 있으며, 여기서 N은 임의의 핵산을 지칭하고, R은 A 또는 G를 지칭하고, Y는 C 또는 T를 지칭하고, W는 A 또는 T를 지칭하고, V는 A 또는 C 또는 G를 지칭한다.In an embodiment, the spacer targets the region immediately preceding the 5' protospacer adjacent motif (PAM). PAM sequences can be selected based on the desired nuclease. For example, the PAM sequence can be any of the PAM sequences shown in Table 3 below, where N refers to any nucleic acid, R refers to A or G, Y refers to C or T, and W refers to A or T, and V refers to A or C or G.

예시적인 뉴클레아제 및 PAM 서열Exemplary nuclease and PAM sequences PAM 서열(5’에서 3’ 방향)PAM sequence (5’ to 3’ direction) 뉴클레아제nuclease 다음으로부터 단리함Isolated from NGGNGG SpCas9SpCas9 화농성 연쇄상구균Streptococcus pyogenes NGRRT 또는 NGRRNNGRRT or NGRRN SaCas9SaCas9 황색포도상구균Staphylococcus aureus NNNNGATTNNNNGATT NmeCas9NmeCas9 수막염균Meningococci NNNNRYACNNNNRYAC CjCas9CjCas9 캄필로박터 제주니Campylobacter jejuni NNAGAAWNNAGAAW StCas9StCas9 스트렙토코커스 써모필러스Streptococcus thermophilus TTTVTTTV LbCpf1LbCpf1 라크노스피라세애 박테리움Lachnospiraceae bacterium TTTVTTTV AsCpf1AsCpf1 아시드아미노코커스 종Acidaminococcus spp.

구현예에서, 스페이서는 인간 유전자와 같은 포유류 유전자의 서열을 표적화할 수 있다. 구현예에서, 스페이서는 돌연변이체 유전자를 표적화할 수 있다. 구현예에서, 스페이서는 코딩 서열을 표적화할 수 있다. 구현예에서, 스페이서는 엑손 서열을 표적화할 수 있다. 구현예에서, 스페이서는 폴리아데닐화 부위(PS)를 표적화할 수 있다. 구현예에서, 스페이서는 PS의 서열 요소를 표적화할 수 있다. 구현예에서, 스페이서는 폴리아데닐화 신호(PAS), 개재 서열(IS), 절단 부위(CS), 하류 요소(DES), 또는 이들의 일부 또는 조합을 표적화할 수 있다. 구현예에서, 스페이서는 스플라이싱 요소(SE) 또는 cis-스플라이싱 조절 요소(SRE)를 표적화할 수 있다.In embodiments, the spacer may target the sequence of a mammalian gene, such as a human gene. In embodiments, the spacer can target a mutant gene. In embodiments, a spacer can target a coding sequence. In embodiments, the spacer can target an exon sequence. In embodiments, the spacer can target a polyadenylation site (PS). In embodiments, the spacer can target a sequence element of PS. In embodiments, the spacer may target a polyadenylation signal (PAS), an intervening sequence (IS), a cleavage site (CS), a downstream element (DES), or a portion or combination thereof. In embodiments, the spacer may target a splicing element (SE) or cis-splicing regulatory element (SRE).

스캐폴드 서열은 뉴클레아제(예: Cas9) 결합을 담당하는 sgRNA 내의 서열이다. 스캐폴드 서열은 스페이서/표적화 서열을 포함하지 않는다. 구현예에서, 스캐폴드는 약 1 내지 약 10, 약 10 내지 약 20, 약 20 내지 약 30, 약 30 내지 약 40, 약 40 내지 약 50, 약 50 내지 약 60, 약 60 내지 약 70, 약 70 내지 약 80, 약 80 내지 약 90, 약 90 내지 약 100, 약 100 내지 약 110, 약 110 내지 약 120, 또는 약 120 내지 약 130개 뉴클레오티드의 길이일 수 있다. 구현예에서, 스캐폴드는 약 1, 약 2, 약 3, 약 4, 약 5, 약 6, 약 7, 약 8, 약 9, 약 10, 약 11, 약 12, 약 13, 약 14, 약 15, 약 16, 약 17, 약 18, 약 19, 약 20, 약 21, 약 22, 약 23, 약 24, 약 25, 약 26, 약 27, 약 28, 약 29, 약 30, 약 31, 약 32, 약 33, 약 34, 약 35, 약 36, 약 37, 약 38, 약 39, 약 40, 약 41, 약 42, 약 43, 약 44, 약 45, 약 46, 약 47, 약 48, 약 49, 약 50, 약 51, 약 52, 약 53, 약 54, 약 55, 약 56, 약 57, 약 58, 약 59, 약 60, 약 60, 약 61, 약 62, 약 63, 약 64, 약 65, 약 66, 약 67, 약 68, 약 69, 약 70, 약 71, 약 72, 약 73, 약 74, 약 75, 약 76, 약 77, 약 78, 약 79, 약 80, 약 81, 약 82, 약 83, 약 84, 약 85, 약 86, 약 87, 약 88, 약 89, 약 90, 약 91, 약 92, 약 93, 약 94, 약 95, 약 96, 약 97, 약 98, 약 99, 약 100, 약 101, 약 102, 약 103, 약 104, 약 105, 약 106, 약 107, 약 108, 약 109, 약 110, 약 111, 약 112, 약 113, 약 114, 약 115, 약 116, 약 117, 약 118, 약 119, 약 120, 약 121, 약 122, 약 123, 약 124, 또는 약 125개 뉴클레오티드의 길이일 수 있다. 구현예에서, 스캐폴드는 적어도 10개, 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 적어도 100개, 적어도 110개, 적어도 120개, 또는 적어도 125개 뉴클레오티드의 길이일 수 있다.The scaffold sequence is the sequence within the sgRNA that is responsible for nuclease (e.g. Cas9) binding. The scaffold sequence does not include a spacer/targeting sequence. In embodiments, the scaffold has about 1 to about 10, about 10 to about 20, about 20 to about 30, about 30 to about 40, about 40 to about 50, about 50 to about 60, about 60 to about 70, about It may be 70 to about 80, about 80 to about 90, about 90 to about 100, about 100 to about 110, about 110 to about 120, or about 120 to about 130 nucleotides in length. In embodiments, the scaffold has about 1, about 2, about 3, about 4, about 5, about 6, about 7, about 8, about 9, about 10, about 11, about 12, about 13, about 14, about 15, about 16, about 17, about 18, about 19, about 20, about 21, about 22, about 23, about 24, about 25, about 26, about 27, about 28, about 29, about 30, about 31, About 32, About 33, About 34, About 35, About 36, About 37, About 38, About 39, About 40, About 41, About 42, About 43, About 44, About 45, About 46, About 47, About 48 , about 49, about 50, about 51, about 52, about 53, about 54, about 55, about 56, about 57, about 58, about 59, about 60, about 60, about 61, about 62, about 63, about 64, about 65, about 66, about 67, about 68, about 69, about 70, about 71, about 72, about 73, about 74, about 75, about 76, about 77, about 78, about 79, about 80, About 81, about 82, about 83, about 84, about 85, about 86, about 87, about 88, about 89, about 90, about 91, about 92, about 93, about 94, about 95, about 96, about 97 , about 98, about 99, about 100, about 101, about 102, about 103, about 104, about 105, about 106, about 107, about 108, about 109, about 110, about 111, about 112, about 113, about It may be 114, about 115, about 116, about 117, about 118, about 119, about 120, about 121, about 122, about 123, about 124, or about 125 nucleotides in length. In embodiments, the scaffolds have at least 10, at least 20, at least 30, at least 40, at least 50, at least 60, at least 70, at least 80, at least 90, at least 100, at least 110. , may be at least 120 nucleotides, or at least 125 nucleotides in length.

구현예에서, gRNA는 이중 분자 가이드 RNA, 예를 들어 crRNA 및 tracrRNA이다. 구현예에서, gRNA는 폴리(A) 꼬리를 추가로 포함할 수 있다.In an embodiment, the gRNA is a dual molecular guide RNA, such as crRNA and tracrRNA. In embodiments, the gRNA may further comprise a poly(A) tail.

구현예에서, CPP를 포함하는 화합물은 gRNA를 포함하는 핵산에 접합된다. 구현예에서, 핵산은 약 1, 약 2, 약 3, 약 4, 약 5, 약 6, 약 7, 약 8, 약 9, 약 10, 약 11, 약 12, 약 13, 약 14, 약 15, 약 16, 약 17, 약 18, 약 19, 또는 약 20개의 gRNA를 포함한다. 구현예에서, gRNA는 동일한 표적을 인식한다. 구현예에서, gRNA는 상이한 표적을 인식한다. 구현예에서, gRNA를 포함하는 핵산은 프로모터를 암호화하는 서열을 포함하되, 프로모터는 gRNA의 발현을 유도한다.In an embodiment, a compound comprising CPP is conjugated to a nucleic acid comprising a gRNA. In embodiments, the nucleic acid has about 1, about 2, about 3, about 4, about 5, about 6, about 7, about 8, about 9, about 10, about 11, about 12, about 13, about 14, about 15. , about 16, about 17, about 18, about 19, or about 20 gRNAs. In embodiments, the gRNAs recognize the same target. In embodiments, the gRNA recognizes different targets. In an embodiment, the nucleic acid comprising the gRNA comprises a sequence encoding a promoter, wherein the promoter drives expression of the gRNA.

뉴클레아제nuclease

구현예에서, 화합물은 뉴클레아제에 접합된 세포 투과 펩티드를 포함한다. 구현예에서, 뉴클레아제는 II형, V-A형, V-B형, VC형, V-U형, VI-B형 뉴클레아제이다. 구현예에서, 뉴클레아제는 전사 활성화제-유사 작동자 뉴클레아제(TALEN), 메가뉴클레아제, 또는 징크-핑거 뉴클레아제이다. 구현예에서, 뉴클레아제는 Cas9, Cas12a (Cpf1), Cas12b, Cas12c, Tnp-B 유사, Cas13a (C2c2), Cas13b, 또는 Cas14 뉴클레아제이다. 예를 들어, 일부 구현예에서, 뉴클레아제는 Cas9 뉴클레아제 또는 Cpf1 뉴클레아제이다.In an embodiment, the compound comprises a cell penetrating peptide conjugated to a nuclease. In an embodiment, the nuclease is a type II, type V-A, type V-B, type VC, type V-U, or type VI-B nuclease. In embodiments, the nuclease is a transcription activator-like effector nuclease (TALEN), meganuclease, or zinc-finger nuclease. In embodiments, the nuclease is Cas9, Cas12a (Cpf1), Cas12b, Cas12c, Tnp-B like, Cas13a (C2c2), Cas13b, or Cas14 nuclease. For example, in some embodiments, the nuclease is Cas9 nuclease or Cpf1 nuclease.

구현예에서, 뉴클레아제는 Cas9, Cas12a (Cpf1), Cas12b, Cas12c, Tnp-B 유사, Cas13a (C2c2), Cas13b, 또는 Cas14 뉴클레아제의 변형된 형태 또는 변이체이다. 구현예에서, 뉴클레아제는 TAL 뉴클레아제, 메가뉴클레아제, 또는 징크-핑거 뉴클레아제의 변형된 형태 또는 변이체이다. “변형된” 또는 “변이체” 뉴클레아제는, 예를 들어 절단되거나, 다른 단백질(예컨대 다른 뉴클레아제)에 융합되거나, 촉매적으로 불활성화된 것 등이다. 구현예에서, 뉴클레아제는 자연 발생 Cas9, Cas12a (Cpf1), Cas12b, Cas12c, Tnp-B 유사, Cas13a (C2c2), Cas13b, Cas14 뉴클레아제, 또는 TALEN, 메가뉴클레아제, 또는 징크-핑거 뉴클레아제와 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%, 적어도 약 99%, 또는 약 100%의 서열 동일성을 가질 수 있다. 구현예에서, 뉴클레아제는 화농성연쇄상구균(S. pyogenes) 유래의 Cas9 뉴클레아제(SpCas9)이다. 구현예에서, 뉴클레아제는 화농성연쇄상구균 유래의 Cas9 뉴클레아제(SpCas9)와 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는다. 구현예에서, 뉴클레아제는 황색포도상구균(S. aureus) 유래의 Cas9(SaCas9)이다. 구현예에서, 뉴클레아제는 황색포도상구균 유래의 Cas9(SaCas9)와 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는다. 구현예에서, Cpf1은 아시다미노코쿠스(Acidaminococcus, 종 BV3L6, UniProt 수탁 번호 U2UMQ6) 유래의 Cpf1 효소이다. 구현예에서, 뉴클레아제는 아시다미노코쿠스(종 BV3L6, UniProt 수탁 번호 U2UMQ6) 유래의 Cpf1 효소와 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는다.In an embodiment, the nuclease is a modified form or variant of a Cas9, Cas12a (Cpf1), Cas12b, Cas12c, Tnp-B-like, Cas13a (C2c2), Cas13b, or Cas14 nuclease. In embodiments, the nuclease is a modified form or variant of a TAL nuclease, meganuclease, or zinc-finger nuclease. “Modified” or “variant” nucleases are, for example, truncated, fused to another protein (e.g., another nuclease), catalytically inactivated, etc. In an embodiment, the nuclease is a naturally occurring Cas9, Cas12a (Cpf1), Cas12b, Cas12c, Tnp-B-like, Cas13a (C2c2), Cas13b, Cas14 nuclease, or TALEN, meganuclease, or zinc-finger. It may have at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 98%, at least about 99%, or about 100% sequence identity with the nuclease. In an embodiment, the nuclease is Cas9 nuclease (SpCas9) from Streptococcus pyogenes ( S. pyogenes ). In embodiments, the nuclease is at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% different from the Cas9 nuclease from Streptococcus pyogenes (SpCas9). % sequence identity. In an embodiment, the nuclease is Cas9 (SaCas9) from Staphylococcus aureus ( S. aureus ). In embodiments, the nuclease has a sequence that is at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% identical to Cas9 (SaCas9) from Staphylococcus aureus. have sameness. In an embodiment, Cpf1 is the Cpf1 enzyme from Acidaminococcus (species BV3L6, UniProt accession number U2UMQ6). In an embodiment, the nuclease is at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98% identical to the Cpf1 enzyme from Asidaminococcus (strain BV3L6, UniProt Accession No. U2UMQ6). , or has a sequence identity of at least about 99%.

구현예에서, Cpf1은 라크노스피라세에(Lachnospiraceae, 종 ND2006, UniProt 수탁 번호 A0A182DWE3) 유래의 Cpf1 효소이다. 구현예에서, 뉴클레아제는 라크노스피라세에 유래의 Cpf1 효소와 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 서열 동일성을 갖는다. 구현예에서, 뉴클레아제를 암호화하는 서열은 포유류 세포에서의 발현에 맞게 코돈 최적화된다. 구현예에서, 뉴클레아제를 암호화하는 서열은 인간 세포 또는 마우스 세포에서의 발현에 맞게 코돈 최적화된다.In an embodiment, Cpf1 is the Cpf1 enzyme from Lachnospiraceae (species ND2006, UniProt accession number A0A182DWE3). In embodiments, the nuclease has about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, or at least about 99% sequence identity with the Cpf1 enzyme from Lachnospiraceae. has In an embodiment, the sequence encoding the nuclease is codon optimized for expression in mammalian cells. In an embodiment, the sequence encoding the nuclease is codon optimized for expression in human cells or mouse cells.

구현예에서, CPP를 포함하는 화합물은 뉴클레아제에 접합된다. 구현예에서, 뉴클레아제는 가용성 단백질이다.In an embodiment, the compound comprising CPP is conjugated to a nuclease. In an embodiment, the nuclease is a soluble protein.

구현예에서, CPP를 포함하는 화합물은 뉴클레아제를 암호화하는 핵산에 접합된다. 구현예에서, 뉴클레아제를 암호화하는 핵산은 프로모터를 암호화하는 서열을 포함하되, 프로모터는 뉴클레아제의 발현을 유도한다.In an embodiment, a compound comprising CPP is conjugated to a nucleic acid encoding a nuclease. In an embodiment, the nucleic acid encoding the nuclease comprises a sequence encoding a promoter, wherein the promoter drives expression of the nuclease.

gRNA 및 뉴클레아제 조합gRNA and nuclease combination

구현예에서, 화합물은 gRNA 및 뉴클레아제에 접합된 하나 이상의 CPP(또는 cCPP)를 포함한다. 구현예에서, 하나 이상의 CPP(또는 cCPP)는 gRNA 및/또는 뉴클레아제를 암호화하는 핵산에 접합된다. 구현예에서, 뉴클레아제 및 gRNA를 암호화하는 핵산은 프로모터를 암호화하는 서열을 포함하되, 프로모터는 뉴클레아제 및 gRNA의 발현을 유도한다. 구현예에서, 뉴클레아제 및 gRNA를 암호화하는 핵산은 2개의 프로모터를 포함하되, 제1 프로모터는 뉴클레아제의 발현을 조절하고 제2 프로모터는 gRNA의 발현을 조절한다. 구현예에서, gRNA 및 뉴클레아제를 암호화하는 핵산은 약 1 내지 약 20개의 gRNA, 또는 약 1, 약 2, 약 3, 약 4, 약 5, 약 6, 약 7, 약 8, 약 9, 약 10, 약 11, 약 12, 약 13, 약 14, 약 15, 약 16, 약 17, 약 18, 또는 약 19, 및 최대 약 20개의 gRNA를 암호화한다. 구현예에서, gRNA는 상이한 표적을 인식한다. 구현예에서, gRNA는 동일한 표적을 인식한다.In an embodiment, the compound comprises one or more CPPs (or cCPPs) conjugated to a gRNA and a nuclease. In an embodiment, one or more CPPs (or cCPPs) are conjugated to a nucleic acid encoding a gRNA and/or nuclease. In an embodiment, the nucleic acid encoding the nuclease and the gRNA comprises a sequence encoding a promoter, wherein the promoter drives expression of the nuclease and the gRNA. In an embodiment, the nucleic acid encoding the nuclease and the gRNA comprises two promoters, wherein the first promoter regulates expression of the nuclease and the second promoter regulates expression of the gRNA. In embodiments, the nucleic acids encoding gRNAs and nucleases comprise from about 1 to about 20 gRNAs, or about 1, about 2, about 3, about 4, about 5, about 6, about 7, about 8, about 9, encodes about 10, about 11, about 12, about 13, about 14, about 15, about 16, about 17, about 18, or about 19, and up to about 20 gRNAs. In embodiments, the gRNA recognizes different targets. In embodiments, the gRNAs recognize the same target.

구현예에서, 화합물은 gRNA 및 뉴클레아제를 포함하는 리보뉴클레오단백질(RNP)에 접합된 세포 투과 펩티드(또는 cCPP)를 포함한다.In an embodiment, the compound comprises a cell penetrating peptide (or cCPP) conjugated to a ribonucleoprotein (RNP) containing a gRNA and a nuclease.

구현예에서, 다음을 포함하는 조성물이 세포에 전달된다: (a) gRNA에 접합된 CPP; 및 (b) 뉴클레아제. 구현예에서, 다음을 포함하는 조성물이 세포에 전달된다: (a) 뉴클레아제에 접합된 CPP; 및 (b) gRNA.In an embodiment, a composition comprising: (a) CPP conjugated to gRNA is delivered to the cell; and (b) nuclease. In an embodiment, a composition comprising: (a) CPP conjugated to a nuclease; and (b) gRNA.

구현예에서, 다음을 포함하는 조성물이 세포에 전달된다: (a) gRNA에 접합된 제1 CPP; 및 (b) 뉴클레아제에 접합된 제2 CPP. 구현예에서, 제1 CPP 및 제2 CPP는 동일하다. 구현예에서, 제1 CPP 및 제2 CPP는 상이하다.In an embodiment, a composition comprising: (a) a first CPP conjugated to a gRNA is delivered to the cell; and (b) a second CPP conjugated to a nuclease. In an embodiment, the first CPP and the second CPP are the same. In an embodiment, the first CPP and the second CPP are different.

관심 유전자 요소Genetic element of interest

구현예에서, 본원에 개시된 화합물은 관심 유전자 요소에 접합된 세포 투과 펩티드를 포함한다. 구현예에서, 관심 유전자 요소는 뉴클레아제에 의해 절단된 게놈 DNA 서열을 치환한다. 관심 유전자 요소의 비제한적인 예는 유전자, 단일 뉴클레오티드 다형체, 프로모터, 또는 종결자를 포함한다.In an embodiment, the compounds disclosed herein comprise a cell penetrating peptide conjugated to a genetic element of interest. In an embodiment, the genetic element of interest replaces a genomic DNA sequence that has been cleaved by a nuclease. Non-limiting examples of genetic elements of interest include genes, single nucleotide polymorphisms, promoters, or terminators.

뉴클레아제 억제제nuclease inhibitor

구현예에서, 본원에 개시된 화합물은 뉴클레아제 억제제(예: Cas9)에 접합된 세포 투과 펩티드를 포함한다. 유전자 편집의 제한은 잠재적인 표적 외 편집이다. 뉴클레아제 억제제의 전달은 표적 외 편집을 제한하게 된다. 구현예에서, 뉴클레아제 억제제는 폴리펩티드, 폴리뉴클레오티드, 또는 소분자이다. 예시적인 뉴클레아제 억제제는 미국 공개 제2020/087354호, 국제 공개 제2018/085288호, 미국 공개 제2018/0382741호, 국제 공개 제2019/089761호, 국제 공개 제2020/068304호, 국제 공개 제2020/041384호, 및 국제 공개 제2019/076651호에 기술되어 있으며, 이들 각각은 그 전체가 참조로서 본원에 통합된다.In an embodiment, the compounds disclosed herein include a cell penetrating peptide conjugated to a nuclease inhibitor (e.g., Cas9). A limitation of gene editing is potential off-target editing. Delivery of nuclease inhibitors limits off-target editing. In embodiments, the nuclease inhibitor is a polypeptide, polynucleotide, or small molecule. Exemplary nuclease inhibitors include US Publication No. 2020/087354, International Publication No. 2018/085288, US Publication No. 2018/0382741, International Publication No. 2019/089761, International Publication No. 2020/068304, International Publication No. 2020/041384, and International Publication No. 2019/076651, each of which is incorporated herein by reference in its entirety.

치료 폴리펩티드therapeutic polypeptide

구현예에서, 치료 모이어티는 폴리펩티드를 포함한다. 구현예에서, 치료 모이어티는 단백질 또는 이의 단편을 포함한다. 구현예에서, 치료 모이어티는 RNA 결합 단백질 또는 이의 RNA 결합 단편을 포함한다. 구현예에서, 치료 모이어티는 효소를 포함한다. 구현예에서, 치료 모이어티는 RNA 절단 효소 또는 이의 활성 단편을 포함한다.In embodiments, the therapeutic moiety comprises a polypeptide. In embodiments, the therapeutic moiety comprises a protein or fragment thereof. In an embodiment, the therapeutic moiety comprises an RNA binding protein or RNA binding fragment thereof. In embodiments, the therapeutic moiety comprises an enzyme. In an embodiment, the therapeutic moiety comprises an RNA cleavage enzyme or active fragment thereof.

접합기(Conjugate Groups)Conjugate Groups

구현예에서, AC는 하나 이상의 접합기의 공유 부착에 의해 변형된다. 일반적으로, 접합기는 약력학, 약동학, 결합, 흡수, 세포 분포, 세포 흡수, 전하, 및 제거를 포함하지만 이에 한정되지 않는, 부착된 AC의 하나 이상의 특성을 변형시킨다. 접합기는 화학 분야에서 일상적으로 사용되며, AC와 같은 부모 화합물에 직접적으로 연결되거나 임의의 연결 모이어티 또는 연결기를 통해 연결된다. 접합기는 인터칼레이터(intercalators), 리포터 분자, 폴리아민, 폴리아미드, 폴리에틸렌 글리콜, 티오에테르, 폴리에테르, 콜레스테롤, 티오콜레스테롤, 콜산 모이어티, 엽산, 지질, 인지질, 비오틴, 페나진, 페난트리딘, 안트라퀴논, 아다만탄, 아크리딘, 플루오레세인, 로다민, 쿠마린, 및 염료를 포함하지만 이에 한정되지는 않는다. 구현예에서, 접합기는 폴리에틸렌 글리콜(PEG)이고, PEG는 AC 또는 CPP에 접합된다.In embodiments, the AC is modified by covalent attachment of one or more adapters. Typically, the conjugator modifies one or more properties of the attached AC, including but not limited to pharmacodynamics, pharmacokinetics, binding, uptake, cellular distribution, cellular uptake, charge, and clearance. Conjugators are routinely used in the field of chemistry, linking either directly to the parent compound, such as AC, or through an optional linking moiety or linker. Adapters include intercalators, reporter molecules, polyamines, polyamides, polyethylene glycol, thioethers, polyethers, cholesterol, thiocholesterol, cholic acid moieties, folic acid, lipids, phospholipids, biotin, phenazine, phenanthridine, Includes, but is not limited to, anthraquinone, adamantane, acridine, fluorescein, rhodamine, coumarin, and dyes. In an embodiment, the conjugating group is polyethylene glycol (PEG), and PEG is conjugated to AC or CPP.

접합기는 콜레스테롤 모이어티와 같은 지질 모이어티(Letsinger 등의 문헌[Proc. Natl. Acad. Sci. USA, 1989, 86, 6553]); 콜산(Manoharan 등의 문헌[Bioorg. Med. Chem. Lett., 1994, 4, 1053]); 티오에테르, 예를 들어 헥실-S-트리틸티올(Manoharan 등의 문헌[Ann. N.Y. Acad. Sci., 1992, 660, 306]; Manoharan 등의 문헌[Bioorg. Med. Chem. Let., 1993, 3, 2765]); 티오콜레스테롤(Oberhauser 등의 문헌[Nucl. Acids Res., 1992, 20, 533]); 지방족 사슬, 예를 들어 도데칸디올 또는 운데실 잔기(Saison-Behmoaras 등의 문헌[EMBO J., 1991, 10, 111]; Kabanov 등의 문헌[FEBS Lett., 1990, 259, 327]; Svinarchuk 등의 문헌[Biochimie, 1993, 75, 49]); 인지질, 예를 들어 디-헥사데실-rac-글리세롤 또는 트리에틸암모늄-1,2-디-O-헥사데실-rac-글리세로-3-H-포스포네이트(Manoharan 등의 문헌[Tetrahedron Lett., 1995, 36, 3651]; Shea 등의 문헌[Nucl. Acids Res., 1990, 18, 3777]); 폴리아민 또는 폴리에틸렌 글리콜 사슬(Manoharan 등의 문헌[Nucleosides & Nucleotides, 1995, 14, 969]); 아다만탄 아세트산(Manoharan 등의 문헌[Tetrahedron Lett., 1995, 36, 3651]); 팔미틸 모이이티(Mishra 등의 문헌[Biochim. Biophys. Acta, 1995, 1264, 229]); 또는 옥타데실아민 또는 헥실아미노-카르보닐-옥시콜레스테롤 모이어티(Crooke 등의 문헌[J. Pharmacol. Exp. Ther., 1996,277,923])를 포함한다.The conjugator may be a lipid moiety, such as a cholesterol moiety (Letsinger et al., Proc. Natl. Acad. Sci. USA, 1989, 86, 6553); cholic acid (Manoharan et al., Bioorg. Med. Chem. Lett., 1994, 4, 1053); Thioethers, such as hexyl-S-tritylthiol (Manoharan et al., Ann. N.Y. Acad. Sci., 1992, 660, 306; Manoharan et al., Bioorg. Med. Chem. Let., 1993, 3, 2765]); thiocholesterol (Oberhauser et al. [Nucl. Acids Res., 1992, 20, 533]); Aliphatic chains, such as dodecanediol or undecyl residues (Saison-Behmoaras et al., EMBO J., 1991, 10, 111; Kabanov et al., FEBS Lett., 1990, 259, 327; Svinarchuk et al. (Biochimie, 1993, 75, 49]); Phospholipids, such as di-hexadecyl-rac-glycerol or triethylammonium-1,2-di-O-hexadecyl-rac-glycero-3-H-phosphonate (Manoharan et al., Tetrahedron Lett. , 1995, 36, 3651]; Shea et al. [Nucl. Acids Res., 1990, 18, 3777]; polyamine or polyethylene glycol chains (Manoharan et al., Nucleosides & Nucleotides, 1995, 14, 969); Adamantane acetic acid (Manoharan et al., Tetrahedron Lett., 1995, 36, 3651); palmityl moiety (Mishra et al., Biochim. Biophys. Acta, 1995, 1264, 229); or octadecylamine or hexylamino-carbonyl-oxycholesterol moiety (Crooke et al., J. Pharmacol. Exp. Ther., 1996,277,923).

당업계에 공지된 것들과 같은 연결기 또는 이작용성 연결 모이어티가 본원에 제공된 화합물에 적합할 수 있다. 연결기는 화학적 작용기, 접합기, 리포터기, 및 다른 기를 예를 들어 AC와 같은 부모 화합물의 선택적 부위에 부착하는 데 유용하다. 일반적으로, 이작용성 연결 모이어티는 2개의 작용기를 갖는 하이드로카르빌 모이어티를 포함한다. 작용기 중 하나는 관심 부모 분자 또는 화합물에 결합하도록 선택되고, 다른 하나는 화학적 작용기 또는 접합기와 같은 임의의 선택된 작용기에 본질적으로 결합하도록 선택된다. 본원에 기술된 링커 중 어느 하나가 사용될 수 있다. 구현예에서, 링커는 사슬 구조를 포함하거나 에틸렌 글리콜 또는 아미노산 단위와 같은 반복 단위의 올리고머를 포함한다. 이작용성 연결 모이어티에 일상적으로 사용되는 작용기의 예는 친핵성기와 반응하기 위한 친전자체 및 친전자성기와 반응하기 위한 친핵체를 포함하지만 이에 한정되지는 않는다. 구현예에서, 이작용성 연결 모이어티는 아미노, 하이드록실, 카르복시산, 티올, 불포화물(예: 이중 또는 삼중 결합) 등을 포함한다. 이작용성 결합 모이어티의 일부 비제한적인 예는 8-아미노-3,6-디옥사옥탄산(ADO), 숙신이미딜 4-(N-말레이미도메틸)시클로헥산-1-카르복실레이트(SMCC), 및 6-아미노헥산산(AHEX 또는 AHA)을 포함한다. 다른 연결기는 치환된 C1-C10 알킬, 치환되었거나 치환되지 않은 C2-C10 알케닐 또는 치환되었거나 치환되지 않은 C2-C10 알키닐을 포함하지만 이에 한정되지 않으며, 여기서 치환기의 비제한적인 목록은 하이드록실, 아미노, 알콕시, 카르복시, 벤질, 페닐, 니트로, 티올, 티오알콕시, 할로겐, 알킬, 아릴, 알케닐, 및 알키닐을 포함한다.Linking groups or bifunctional linking moieties, such as those known in the art, may be suitable for the compounds provided herein. Linkers are useful for attaching chemical functional groups, adapter groups, reporter groups, and other groups to selective sites of the parent compound, such as AC. Typically, bifunctional linking moieties include a hydrocarbyl moiety with two functional groups. One of the functional groups is selected to bind to the parent molecule or compound of interest, and the other is selected to bind essentially any selected functional group, such as a chemical functional group or conjugation group. Any of the linkers described herein may be used. In embodiments, the linker comprises a chain structure or an oligomer of repeating units such as ethylene glycol or amino acid units. Examples of functional groups routinely used in bifunctional linking moieties include, but are not limited to, electrophiles for reacting with nucleophilic groups and nucleophiles for reacting with electrophilic groups. In embodiments, the bifunctional linking moiety includes amino, hydroxyl, carboxylic acid, thiol, unsaturated (e.g., double or triple bond), etc. Some non-limiting examples of bifunctional binding moieties include 8-amino-3,6-dioxaoctanoic acid (ADO), succinimidyl 4-(N-maleimidomethyl)cyclohexane-1-carboxylate (SMCC) , and 6-aminohexanoic acid (AHEX or AHA). Other linking groups include, but are not limited to, substituted C1-C10 alkyl, substituted or unsubstituted C2-C10 alkenyl, or substituted or unsubstituted C2-C10 alkynyl, wherein a non-limiting list of substituents includes hydroxyl, Includes amino, alkoxy, carboxy, benzyl, phenyl, nitro, thiol, thioalkoxy, halogen, alkyl, aryl, alkenyl, and alkynyl.

구현예에서, AC는 10개의 아르기닌-세린 디펩티드 반복에 연결될 수 있다. 스플라이싱 인핸서 인자의 인공적인 동원을 위해 10개의 아르기닌-세린 디펩티드 반복에 연결된 AC를 시험관 내에서 적용하여, 스키핑될 수도 있는 돌연변이된 BRCA1 및 SMN2 엑손의 포함을 유도하였다. 본원에 참조로서 통합된 Cartegni 및 Krainer의 2003 문헌 참조.In an embodiment, the AC may be linked to 10 arginine-serine dipeptide repeats. AC linked to 10 arginine-serine dipeptide repeats was applied in vitro for artificial recruitment of splicing enhancer factors, leading to inclusion of mutated BRCA1 and SMN2 exons that may be skipped. See Cartegni and Krainer, 2003, incorporated herein by reference.

엔도솜 탈출 비히클(EEV)Endosomal escape vehicle (EEV)

엔도솜 탈출 비히클(EEV)은, 예를 들어 화물을 세포의 세포액 또는 핵에 전달하기 위해, 세포막을 통해 화물을 수송하는 데 사용될 수 있다. 화물은 치료 모이어티(TM)를 포함할 수 있다. EEV는 세포 투과 펩티드(CPP), 예를 들어 환형 세포 투과 펩티드(cCPP)를 포함할 수 있다. 구현예에서, EEV는 환외 펩티드(EP)에 접합되는 cCPP를 포함한다. EP는 상호교환적으로 조절 펩티드(MP)로서 지칭될 수 있다. EP는 핵 국소화 신호(NLS)의 서열을 포함할 수 있다. EP는 화물에 결합될 수 있다. EP는 cCPP에 결합될 수 있다. EP는 화물 및 cCPP에 결합될 수 있다. EP, 화물, cCPP, 또는 이들의 조합 간의 결합은 비공유 또는 공유 결합일 수 있다. EP는 펩티드 결합을 통해 cCPP의 N-말단에 부착될 수 있다. EP는 펩티드 결합을 통해 cCPP의 C-말단에 부착될 수 있다. EP는 cCPP 내의 아미노산의 측쇄를 통해 cCPP에 부착될 수 있다. EP는 cCPP 내의 글루타민의 측쇄에 접합될 수 있는 리신의 측쇄를 통해 cCPP에 부착될 수 있다. EP는 올리고뉴클레오티드 화물의 5’ 또는 3’ 단부에 접합될 수 있다. EP는 링커에 결합될 수 있다. 환외 펩티드는 링커의 아미노기에 접합될 수 있다. EP는 EP의 C-말단을 통해 링커에 결합될 수 있고, cCPP 및/또는 EP 상의 측쇄를 통해 cCPP에 결합될 수 있다. 예를 들어, EP는 말단 리신을 포함할 수 있으며, 그런 다음 EP는 아미드 결합을 통해 글루타민을 함유하는 cCPP에 결합될 수 있다. EP가 말단 리신을 함유하고, 리신의 측쇄가 cCPP를 부착하는 데 사용될 수 있는 경우, C-말단 또는 N-말단은 화물 상의 링커에 부착될 수 있다.Endosomal escape vehicles (EEVs) can be used to transport cargo across the cell membrane, for example, to deliver the cargo to the cytosol or nucleus of the cell. The cargo may include a therapeutic moiety (TM). EEV may contain cell penetrating peptides (CPP), such as cyclic cell penetrating peptide (cCPP). In an embodiment, the EEV comprises cCPP conjugated to an exophytic peptide (EP). EPs may be referred to interchangeably as regulatory peptides (MPs). The EP may contain the sequence of a nuclear localization signal (NLS). EP can be combined with cargo. EP can be bound to cCPP. EP can be bound to cargo and cCPP. The bond between EP, cargo, cCPP, or combinations thereof may be non-covalent or covalent. EP can be attached to the N-terminus of cCPP via a peptide bond. EP can be attached to the C-terminus of cCPP via a peptide bond. EP can be attached to cCPP through the side chains of amino acids within cCPP. EP can be attached to cCPP through the side chain of lysine, which can be conjugated to the side chain of glutamine in cCPP. EP can be conjugated to the 5' or 3' end of the oligonucleotide cargo. EP can be linked to a linker. The extracyclic peptide may be conjugated to the amino group of the linker. The EP may be bound to a linker through the C-terminus of the EP and to cCPP through the side chains on cCPP and/or EP. For example, EP may contain a terminal lysine, and EP may then be linked to cCPP containing glutamine via an amide bond. If the EP contains a terminal lysine, and the side chain of the lysine can be used to attach cCPP, either the C-terminus or the N-terminus can be attached to a linker on the cargo.

환외 펩티드(Exocyclic Peptides) Exocyclic Peptides

환외 펩티드(EP)는 2 내지 10개의 아미노산 잔기, 예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 아미노산 잔기를 포함할 수 있으며, 이들 사이의 모든 범위 및 값을 포함한다. EP는 6 내지 9개의 아미노산 잔기를 포함할 수 있다. EP는 4 내지 8개의 아미노산 잔기를 포함할 수 있다.The exophytic peptide (EP) may comprise from 2 to 10 amino acid residues, for example 2, 3, 4, 5, 6, 7, 8, 9, or 10 amino acid residues, and all ranges and values in between. Includes. EP may contain 6 to 9 amino acid residues. EP may contain 4 to 8 amino acid residues.

환외 펩티드 내의 각각의 아미노산은 천연 또는 비-천연 아미노산일 수 있다. 용어 “비-천연 아미노산”은 천연 아미노산의 구조 및 반응성을 모방하도록 천연 아미노산과 유사한 구조를 갖는다는 점에서 천연 아미노산의 동속(congener)인 유기 화합물을 지칭한다. 비-천연 아미노산은 20개의 흔한 자연 발생 아미노산 중 하나가 아니고, 희귀 천연 아미노산인 셀레노시스테인 또는 피롤리신이 아닌 변형된 아미노산 및/또는 아미노산 유사체일 수 있다. 비-천연 아미노산은 또한 천연 아미노산의 D-이성질체일 수 있다. 적절한 아미노산의 예는 알라닌, 알로소류신, 아르기닌, 시트룰린, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 이소류신, 류신, 리신, 메티오닌, 나프틸알라닌, 페닐알라닌, 프롤린, 피로글루탐산, 세린, 트레오닌, 트립토판, 티로신, 발린, 이들의 유도체, 또는 이들의 조합을 포함하지만 이에 한정되지는 않는다. 이들 및 다른 아미노산은 본원에서 사용되는 이들의 약어와 함께 표 4에 열거되어 있다. 예를 들어, 아미노산은 A, G, P, K, R, V, F, H, Nal, 또는 시트룰린일 수 있다.Each amino acid in the exophytic peptide may be a natural or non-natural amino acid. The term “non-natural amino acid” refers to an organic compound that is a congener of a natural amino acid in that it has a structure similar to a natural amino acid to mimic the structure and reactivity of the natural amino acid. Non-natural amino acids may be modified amino acids and/or amino acid analogs that are not one of the 20 common naturally occurring amino acids and are not the rare natural amino acids selenocysteine or pyrrolysine. Non-natural amino acids can also be D-isomers of natural amino acids. Examples of suitable amino acids are alanine, allosoleucine, arginine, citrulline, asparagine, aspartic acid, cysteine, glutamine, glutamic acid, glycine, histidine, isoleucine, leucine, lysine, methionine, naphthylalanine, phenylalanine, proline, pyroglutamic acid, and serine. , threonine, tryptophan, tyrosine, valine, derivatives thereof, or combinations thereof. These and other amino acids are listed in Table 4 along with their abbreviations as used herein. For example, the amino acid can be A, G, P, K, R, V, F, H, Nal, or citrulline.

EP는 적어도 하나의 양으로 하전된 아미노산 잔기, 예를 들어 적어도 하나의 리신 잔기 및/또는 구아니딘기 또는 이의 양성자화된 형태를 포함하는 측쇄를 포함하는 적어도 하나의 아민산 잔기를 포함할 수 있다. EP는 구아니딘기 또는 이의 양성자화된 형태를 포함하는 측쇄를 포함하는 1 또는 2개의 아미노산 잔기를 포함할 수 있다. 구아니딘기를 포함하는 측쇄를 포함하는 아미노산 잔기는 아르기닌 잔기일 수 있다. 양성자화된 형태는 본 개시 전체에 걸쳐 이의 염을 의미할 수 있다.The EP may comprise at least one positively charged amino acid residue, such as at least one lysine residue and/or at least one amino acid residue comprising a side chain comprising a guanidine group or a protonated form thereof. EP may contain one or two amino acid residues containing a side chain containing a guanidine group or a protonated form thereof. The amino acid residue containing the side chain containing the guanidine group may be an arginine residue. Protonated forms may refer to salts thereof throughout this disclosure.

EP는 적어도 2개, 적어도 3개, 또는 적어도 4개 또는 그 이상의 리신 잔기를 포함할 수 있다. EP는 2, 3, 또는 4개의 리신 잔기를 포함할 수 있다. 각각의 리신 잔기의 측쇄 상의 아미노기는, 예를 들어 트리플루오로아세틸(-COCF3), 알릴옥시카르보닐(Alloc), 1-(4,4-디메틸-2,6-디옥소시클로헥실리덴)에틸(Dde), 또는 (4,4-디메틸-2,6-디옥소시클로헥스-1-일리덴-3)-메틸부틸(ivDde)기를 포함하는 보호기로 치환될 수 있다. 각각의 리신 잔기의 측쇄 상의 아미노기는 트리플루오로아세틸(-COCF3)기로 치환될 수 있다. 아미드 접합을 가능하게 하도록 보호기가 포함될 수 있다. 보호기는 EP가 cCPP에 접합된 후에 제거될 수 있다.EP may contain at least 2, at least 3, or at least 4 or more lysine residues. EP may contain 2, 3, or 4 lysine residues. The amino group on the side chain of each lysine residue can be, for example, trifluoroacetyl (-COCF 3 ), allyloxycarbonyl (Alloc), 1-(4,4-dimethyl-2,6-dioxocyclohexylidene) ) It may be substituted with a protecting group containing ethyl (Dde), or (4,4-dimethyl-2,6-dioxocyclohex-1-ylidene-3)-methylbutyl (ivDde) group. The amino group on the side chain of each lysine residue may be substituted with a trifluoroacetyl (-COCF 3 ) group. Protecting groups may be included to enable amide conjugation. The protecting group can be removed after EP is conjugated to cCPP.

EP는 소수성 측쇄를 갖는 적어도 2개의 아미노산 잔기를 포함할 수 있다. 소수성 측쇄를 갖는 아미노산 잔기는 발린, 프롤린, 알라닌, 류신, 이소류신, 및 메티오닌으로부터 선택될 수 있다. 소수성 측쇄를 갖는 아미노산 잔기는 발린 또는 프롤린일 수 있다.EP may comprise at least two amino acid residues with hydrophobic side chains. Amino acid residues with hydrophobic side chains may be selected from valine, proline, alanine, leucine, isoleucine, and methionine. The amino acid residue with a hydrophobic side chain may be valine or proline.

EP는 적어도 하나의 양으로 하전된 아미노산 잔기, 예를 들어 적어도 하나의 리신 잔기 및/또는 적어도 하나의 아르기닌 잔기를 포함할 수 있다. EP는 적어도 2개, 적어도 3개, 또는 적어도 4개 또는 그 이상의 리신 잔기 및/또는 아르기닌 잔기를 포함할 수 있다.The EP may comprise at least one positively charged amino acid residue, such as at least one lysine residue and/or at least one arginine residue. The EP may comprise at least 2, at least 3, or at least 4 or more lysine residues and/or arginine residues.

EP는 KK, KR, RR, HH, HK, HR, RH, KKK, KGK, KBK, KBR, KRK, KRR, RKK, RRR, KKH, KHK, HKK, HRR, HRH, HHR, HBH, HHH, HHHH (서열번호 1), KHKK (서열번호 2), KKHK (서열번호 3), KKKH (서열번호 4), KHKH (서열번호 5), HKHK (서열번호 6), KKKK (서열번호 7), KKRK (서열번호 8), KRKK (서열번호 9), KRRK (서열번호 10), RKKR (서열번호 11), RRRR (서열번호 12), KGKK (서열번호 13), KKGK (서열번호 14), HBHBH (서열번호 15), HBKBH (서열번호 16), RRRRR (서열번호 17), KKKKK (서열번호 18), KKKRK (서열번호 19), RKKKK (서열번호 20), KRKKK (서열번호 21), KKRKK (서열번호 22), KKKKR (서열번호 23), KBKBK (서열번호 24), RKKKKG (서열번호 25), KRKKKG (서열번호 26), KKRKKG (서열번호 27), KKKKRG (서열번호 28), RKKKKB (서열번호 29), KRKKKB (서열번호 30), KKRKKB (서열번호 31), KKKKRB (서열번호 32), KKKRKV (서열번호 33), RRRRRR (서열번호 34), HHHHHH (서열번호 35), RHRHRH (서열번호 36), HRHRHR (서열번호 37), KRKRKR (서열번호 38), RKRKRK (서열번호 39), RBRBRB (서열번호 40), KBKBKB (서열번호 41), PKKKRKV (서열번호 42), PGKKRKV (서열번호 43), PKGKRKV (서열번호 44), PKKGRKV (서열번호 45), PKKKGKV (서열번호 46), PKKKRGV (서열번호 47), 또는 PKKKRKG (서열번호 48)를 포함할 수 있고, 여기서 B는 베타-알라닌이다. EP 내의 아미노산은 D 또는 L 입체화학을 가질 수 있다.EP is KK, KR, RR, HH, HK, HR, RH, KKK, KGK, KBK, KBR, KRK, KRR, RKK, RRR, KKH, KHK, HKK, HRR, HRH, HHR, HBH, HHH, HHHH ( SEQ ID NO: 1), KHKK (SEQ ID NO: 2), KKHK (SEQ ID NO: 3), KKKH (SEQ ID NO: 4), KHKH (SEQ ID NO: 5), HKHK (SEQ ID NO: 6), KKKK (SEQ ID NO: 7), KKRK (SEQ ID NO: Number 8), KRKK (SEQ ID NO: 9), KRRK (SEQ ID NO: 10), RKKR (SEQ ID NO: 11), RRRR (SEQ ID NO: 12), KGKK (SEQ ID NO: 13), KKGK (SEQ ID NO: 14), HBHBH (SEQ ID NO: 15), HBKBH (SEQ ID NO: 16), RRRRR (SEQ ID NO: 17), KKKKK (SEQ ID NO: 18), KKKRK (SEQ ID NO: 19), RKKKK (SEQ ID NO: 20), KRKKK (SEQ ID NO: 21), KKRKK (SEQ ID NO: 22) ), KKKKR (SEQ ID NO: 23), KBKBK (SEQ ID NO: 24), RKKKKG (SEQ ID NO: 25), KRKKKG (SEQ ID NO: 26), KKRKKG (SEQ ID NO: 27), KKKKRG (SEQ ID NO: 28), RKKKKB (SEQ ID NO: 29) , KRKKKB (SEQ ID NO: 30), KKRKKB (SEQ ID NO: 31), KKKKRB (SEQ ID NO: 32), KKKRKV (SEQ ID NO: 33), RRRRRR (SEQ ID NO: 34), HHHHHH (SEQ ID NO: 35), RHRHRH (SEQ ID NO: 36), HRHRHR (SEQ ID NO: 37), KRKRKR (SEQ ID NO: 38), RKRKRK (SEQ ID NO: 39), RBRBRB (SEQ ID NO: 40), KBKBKB (SEQ ID NO: 41), PKKKRKV (SEQ ID NO: 42), PGKKRKV (SEQ ID NO: 43), PKGKRKV (SEQ ID NO: 44), PKKGRKV (SEQ ID NO: 45), PKKKGKV (SEQ ID NO: 46), PKKKRGV (SEQ ID NO: 47), or PKKKRKG (SEQ ID NO: 48), where B is beta-alanine. Amino acids in EP can have D or L stereochemistry.

EP는 KK, KR, RR, KKK, KGK, KBK, KBR, KRK, KRR, RKK, RRR, KKKK (서열번호 7), KKRK (서열번호 8), KRKK (서열번호 9), KRRK (서열번호 10), RKKR (서열번호 11), RRRR (서열번호 12), KGKK (서열번호 13), KKGK (서열번호 14), KKKKK (서열번호 18), KKKRK (서열번호 19), KBKBK (서열번호 24), KKKRKV (서열번호 33), PKKKRKV (서열번호 42), PGKKRKV (서열번호 43), PKGKRKV (서열번호 44), PKKGRKV (서열번호 45), PKKKGKV (서열번호 46), PKKKRGV (서열번호 47), 또는 PKKKRKG (서열번호 48)를 포함할 수 있다. EP는 PKKKRKV(서열번호 42), RR, RRR, RHR, RBR, RBRBR(서열번호 49), RBHBR(서열번호 50), 또는 HBRBH(서열번호 51)를 포함할 수 있고, 여기서 B는 베타-알라닌이다. EP 내의 아미노산은 D 또는 L 입체화학을 가질 수 있다.EP is KK, KR, RR, KKK, KGK, KBK, KBR, KRK, KRR, RKK, RRR, KKKK (SEQ ID NO: 7), KKRK (SEQ ID NO: 8), KRKK (SEQ ID NO: 9), KRRK (SEQ ID NO: 10) ), RKKR (SEQ ID NO: 11), RRRR (SEQ ID NO: 12), KGKK (SEQ ID NO: 13), KKGK (SEQ ID NO: 14), KKKKK (SEQ ID NO: 18), KKKRK (SEQ ID NO: 19), KBKBK (SEQ ID NO: 24) , KKKRKV (SEQ ID NO: 33), PKKKRKV (SEQ ID NO: 42), PGKKRKV (SEQ ID NO: 43), PKGKRKV (SEQ ID NO: 44), PKKGRKV (SEQ ID NO: 45), PKKKGKV (SEQ ID NO: 46), PKKKRGV (SEQ ID NO: 47), or PKKKRKG (SEQ ID NO: 48). EP may include PKKKRKV (SEQ ID NO: 42), RR, RRR, RHR, RBR, RBRBR (SEQ ID NO: 49), RBHBR (SEQ ID NO: 50), or HBRBH (SEQ ID NO: 51), where B is beta-alanine am. Amino acids in EP can have D or L stereochemistry.

EP는 KK, KR, RR, KKK, KGK, KBK, KBR, KRK, KRR, RKK, RRR, KKKK (서열번호 7), KKRK (서열번호 8), KRKK (서열번호 9), KRRK (서열번호 10), RKKR (서열번호 11), RRRR (서열번호 12), KGKK (서열번호 13), KKGK (서열번호 14), KKKKK (서열번호 18), KKKRK (서열번호 19), KBKBK (서열번호 24), KKKRKV (서열번호 33), PKKKRKV (서열번호 42), PGKKRKV (서열번호 Z43), PKGKRKV (서열번호 Z44), PKKGRKV (서열번호 Z45), PKKKGKV (서열번호 46), PKKKRGV (서열번호 47), 또는 PKKKRKG (서열번호 48)로 이루어질 수 있다. EP는 PKKKRKV(서열번호 42), RR, RRR, RHR, RBR, RBRBR(서열번호 49), RBHBR(서열번호 50), 또는 HBRBH(서열번호 51)로 이루어질 수 있고, 여기서 B는 베타-알라닌이다. EP 내의 아미노산은 D 또는 L 입체화학을 가질 수 있다.EP is KK, KR, RR, KKK, KGK, KBK, KBR, KRK, KRR, RKK, RRR, KKKK (SEQ ID NO: 7), KKRK (SEQ ID NO: 8), KRKK (SEQ ID NO: 9), KRRK (SEQ ID NO: 10) ), RKKR (SEQ ID NO: 11), RRRR (SEQ ID NO: 12), KGKK (SEQ ID NO: 13), KKGK (SEQ ID NO: 14), KKKKK (SEQ ID NO: 18), KKKRK (SEQ ID NO: 19), KBKBK (SEQ ID NO: 24) , KKKRKV (SEQ ID NO: 33), PKKKRKV (SEQ ID NO: 42), PGKKRKV (SEQ ID NO: Z43), PKGKRKV (SEQ ID NO: Z44), PKKGRKV (SEQ ID NO: Z45), PKKKGKV (SEQ ID NO: 46), PKKKRGV (SEQ ID NO: 47), or PKKKRKG (SEQ ID NO: 48). EP may consist of PKKKRKV (SEQ ID NO: 42), RR, RRR, RHR, RBR, RBRBR (SEQ ID NO: 49), RBHBR (SEQ ID NO: 50), or HBRBH (SEQ ID NO: 51), where B is beta-alanine . Amino acids in EP can have D or L stereochemistry.

EP는 당업계에서 핵 국소화 서열(NLS)로서 식별된 아미노산 서열을 포함할 수 있다. EP는 당업계에서 핵 국소화 서열(NLS)로서 식별된 아미노산 서열로 이루어질 수 있다. EP는 아미노산 서열 PKKKRKV(서열번호 42)를 포함하는 NLS를 포함할 수 있다. EP는 아미노산 서열 PKKKRKV(서열번호 42)를 포함하는 NLS로 이루어질 수 있다. EP는 다음으로부터 선택된 아미노산 서열을 포함하는 NLS를 포함할 수 있다: NLSKRPAAIKKAGQAKKKK (서열번호 52), PAAKRVKLD (서열번호 53), RQRRNELKRSF (서열번호 54), RMRKFKNKGKDTAELRRRRVEVSVELR (서열번호 Z55), KAKKDEQILKRRNV (서열번호 56), VSRKRPRP (서열번호 57), PPKKARED (서열번호 58), PQPKKKPL (서열번호 59), SALIKKKKKMAP (서열번호 60), DRLRR (서열번호 61), PKQKKRK (서열번호 62), RKLKKKIKKL (서열번호 63), REKKKFLKRR (서열번호 64), KRKGDEVDGVDEVAKKKSKK (서열번호 65), 및 RKCLQAGMNLEARKTKK (서열번호 66). EP는 다음으로부터 선택된 아미노산 서열을 포함하는 NLS로 이루어질 수 있다: NLSKRPAAIKKAGQAKKKK (서열번호 52), PAAKRVKLD (서열번호 53), RQRRNELKRSF (서열번호 54), RMRKFKNKGKDTAELRRRRVEVSVELR (서열번호 55), KAKKDEQILKRRNV (서열번호 56), VSRKRPRP (서열번호 57), PPKKARED (서열번호 58), PQPKKKPL (서열번호 59), SALIKKKKKMAP (서열번호 60), DRLRR (서열번호 61), PKQKKRK (서열번호 62), RKLKKKIKKL (서열번호 63), REKKKFLKRR (서열번호 64), KRKGDEVDGVDEVAKKKSKK (서열번호 65), 및 RKCLQAGMNLEARKTKK (서열번호 66).EPs may include amino acid sequences identified in the art as nuclear localization sequences (NLS). EPs may consist of amino acid sequences identified in the art as nuclear localization sequences (NLS). The EP may contain an NLS containing the amino acid sequence PKKKRKV (SEQ ID NO: 42). EP may consist of an NLS containing the amino acid sequence PKKKRKV (SEQ ID NO: 42). The EP may comprise an NLS comprising an amino acid sequence selected from: NLSKRPAAIKKAGQAKKKK (SEQ ID NO: 52), PAAKRVKLD (SEQ ID NO: 53), RQRRNELKRSF (SEQ ID NO: 54), RMRKFKNKGKDTAELRRRRVEVSVELR (SEQ ID NO: Z55), KAKKDEQILKRRNV (SEQ ID NO: 56) ), VSRKRPRP (SEQ ID NO: 57), PPKKARED (SEQ ID NO: 58), PQPKKKPL (SEQ ID NO: 59), SALIKKKKKKMAP (SEQ ID NO: 60), DRLRR (SEQ ID NO: 61), PKQKKRK (SEQ ID NO: 62), RKLKKKIKKL (SEQ ID NO: 63) , REKKKFLKRR (SEQ ID NO: 64), KRKGDEVDGVDEVAKKKSKK (SEQ ID NO: 65), and RKCLQAGMNLEARKTKK (SEQ ID NO: 66). The EP may consist of an NLS comprising an amino acid sequence selected from: NLSKRPAAIKKAGQAKKKK (SEQ ID NO: 52), PAAKRVKLD (SEQ ID NO: 53), RQRRNELKRSF (SEQ ID NO: 54), RMRKFKNKGKDTAELRRRRVEVSVELR (SEQ ID NO: 55), KAKKDEQILKRRNV (SEQ ID NO: 56) , VSRKRPRP (SEQ ID NO: 57), PPKKARED (SEQ ID NO: 58), PQPKKKPL (SEQ ID NO: 59), SALIKKKKKKMAP (SEQ ID NO: 60), DRLRR (SEQ ID NO: 61), PKQKKRK (SEQ ID NO: 62), RKLKKKIKKL (SEQ ID NO: 63), REKKKFLKRR (SEQ ID NO: 64), KRKGDEVDGVDEVAKKKSKK (SEQ ID NO: 65), and RKCLQAGMNLEARKTKK (SEQ ID NO: 66).

모든 환외 서열은 N-말단 아세틸기를 함유할 수도 있다. 따라서, 예를 들어 EP는 다음의 구조를 가질 수 있다: Ac-PKKKRKV (서열번호 42).All extracyclic sequences may contain an N-terminal acetyl group. Thus, for example, EP may have the following structure: Ac-PKKKRKV (SEQ ID NO: 42).

세포 투과 펩티드(CPP) Cell penetrating peptide (CPP)

세포 투과 펩티드(CPP)는 6 내지 20개의 아미노산 잔기를 포함할 수 있다. 세포 투과 펩티드는 환형 세포 투과 펩티드(cCPP)일 수 있다. cCPP는 세포막을 투과할 수 있다. 환외 펩티드(EP)는 cCPP에 접합될 수 있고, 생성된 작제물은 엔도솜 탈출 비히클(EEV)로서 지칭될 수 있다. cCPP는 화물(예: 올리고뉴클레오티드, 펩티드, 또는 소분자와 같은 치료 모이어티(TM))이 세포막을 투과하도록 유도할 수 있다. cCPP는 화물을 세포의 세포액에 전달할 수 있다. cCPP는 표적(예: pre-mRNA)이 위치한 세포 위치에 화물을 전달할 수 있다. cCPP를 화물(예: 펩티드, 올리고뉴클레오티드, 또는 소분자)에 접합시키기 위해, cCPP 상의 적어도 하나의 결합 또는 한 쌍의 전자가 치환될 수 있다.Cell penetrating peptides (CPPs) may contain 6 to 20 amino acid residues. The cell penetrating peptide may be a cyclic cell penetrating peptide (cCPP). cCPP can penetrate cell membranes. An exophytic peptide (EP) can be conjugated to cCPP, and the resulting construct can be referred to as an endosomal escape vehicle (EEV). cCPP can induce cargo (e.g. therapeutic moieties (TM) such as oligonucleotides, peptides, or small molecules) to permeate cell membranes. cCPP can deliver cargo to the cytosol of cells. cCPP can deliver cargo to cellular locations where targets (e.g. pre-mRNA) are located. To conjugate cCPP to a cargo (e.g., a peptide, oligonucleotide, or small molecule), at least one bond or pair of electrons on cCPP can be replaced.

cCPP 내의 아미노산 잔기의 총 수는 6 내지 20개 아미노산 잔기의 범위, 예를 들어, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개의 아미노산 잔기이며, 이들 사이의 모든 범위 및 하위 범위를 포함한다. cCPP는 6 내지 13개의 아미노산 잔기를 포함할 수 있다. 본원에 개시된 cCPP는 6 내지 10개의 아미노산을 포함할 수 있다. 예로서, 6~10개의 아미노산 잔기를 포함하는 cCPP는 식 I-A 내지 I-E 중 어느 하나에 따른 구조를 가질 수 있고:The total number of amino acid residues in cCPP ranges from 6 to 20 amino acid residues, e.g., 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, or 20 amino acid residues, including all ranges and subranges between them. cCPP may contain 6 to 13 amino acid residues. cCPP disclosed herein may contain 6 to 10 amino acids. By way of example, cCPP comprising 6-10 amino acid residues may have a structure according to any one of Formulas I-A to I-E:

또는 , 식 중 AA1, AA2, AA3, AA4, AA5, AA6, AA7, AA8, AA9, 및 AA10은 아미노산 잔기이다. or , where AA 1 , AA 2 , AA 3 , AA 4 , AA 5 , AA 6 , AA 7 , AA 8 , AA 9 , and AA 10 are amino acid residues.

cCPP는 6 내지 8개의 아미노산을 포함할 수 있다. cCPP는 8개의 아미노산을 포함할 수 있다.cCPP may contain 6 to 8 amino acids. cCPP may contain 8 amino acids.

cCPP 내의 각각의 아미노산은 천연 또는 비-천연 아미노산일 수 있다. 용어 "비-천연 아미노산"은 천연 아미노산의 구조 및 반응성을 모방하도록 천연 아미노산과 유사한 구조를 갖는다는 점에서 천연 아미노산의 동속인 유기 화합물을 지칭한다. 비-천연 아미노산은 20개의 흔한 자연 발생 아미노산 중 하나가 아니고, 희귀 천연 아미노산인 셀레노시스테인 또는 피롤리신이 아닌 변형된 아미노산 및/또는 아미노산 유사체일 수 있다. 비-천연 아미노산은 또한 천연 아미노산의 D-이성질체일 수 있다. 적절한 아미노산의 예는 알라닌, 알로소류신, 아르기닌, 시트룰린, 아스파라긴, 아스파르트산, 시스테인, 글루타민, 글루탐산, 글리신, 히스티딘, 이소류신, 류신, 리신, 메티오닌, 나프틸알라닌, 페닐알라닌, 프롤린, 피로글루탐산, 세린, 트레오닌, 트립토판, 티로신, 발린, 이들의 유도체, 또는 이들의 조합을 포함하지만 이에 한정되지는 않는다. 이들 및 다른 아미노산은 본원에서 사용되는 이들의 약어와 함께 표 5에 열거되어 있다.Each amino acid in cCPP can be a natural or non-natural amino acid. The term “non-natural amino acid” refers to an organic compound that is a class of natural amino acids in that it has a similar structure to a natural amino acid so as to mimic the structure and reactivity of the natural amino acid. Non-natural amino acids may be modified amino acids and/or amino acid analogs that are not one of the 20 common naturally occurring amino acids and are not the rare natural amino acids selenocysteine or pyrrolysine. Non-natural amino acids can also be D-isomers of natural amino acids. Examples of suitable amino acids are alanine, allosoleucine, arginine, citrulline, asparagine, aspartic acid, cysteine, glutamine, glutamic acid, glycine, histidine, isoleucine, leucine, lysine, methionine, naphthylalanine, phenylalanine, proline, pyroglutamic acid, and serine. , threonine, tryptophan, tyrosine, valine, derivatives thereof, or combinations thereof. These and other amino acids are listed in Table 5 along with their abbreviations as used herein.

아미노산 약어Amino Acid Abbreviations 아미노산amino acid 약어*abbreviation*
L-아미노산L-amino acid
약어*abbreviation*
D-아미노산D-amino acid
2-[2-[2-아미노에톡시]에톡시]아세트산2-[2-[2-aminoethoxy]ethoxy]acetic acid AEEA, miniPEG, PEG2AEEA, miniPEG, PEG2 NAN.A. 알라닌alanine Ala (A)Ala (A) ala (a)ala (a) 알로-이소류신Allo-isoleucine AileAile AileAile 아르기닌arginine Arg (R)Arg (R) arg (r)arg (r) 아스파라긴Asparagine Asn (N)Asn(N) asn (n)asn (n) 아스파르트산aspartic acid Asp (D)Asp (D) asp (d)asp (d) 시스테인cysteine Cys (C)Cys (C) cys (c)cys (c) 시트룰린Citrulline CitCit CitCit 시클로헥실알라닌Cyclohexylalanine ChaCha chacha 2,3-디아미노프로피온산2,3-Diaminopropionic acid DapDap dapdaps 4-플루오로페닐알라닌4-Fluorophenylalanine Fpa (Σ)Fpa (Σ) pfapfa 글루탐산glutamic acid Glu (E)Glu (E) glu (e)glu (e) 글루타민glutamine Gln (Q)Gln (Q) gln (q)gln(q) 글리신glycine Gly (G)Gly (G) gly (g)gly (g) 히스티딘histidine His (H)His (H) his (h)his (h) 호모프롤린(피페콜산으로도 알려짐)Homoproline (also known as pipecolic acid) Pip (Θ)Pip (Θ) pip (*?*)pip (*?*) 이소류신isoleucine Ile (I)Ile (I) ile (i)ile (i) 류신leucine Leu (L)Leu (L) leu (l)leu (l) 리신Lee Sin Lys (K)Lys (K) lys (k)lys (k) 메티오닌methionine Met (M)Met (M) met (m)meet (m) 3-(2-나프틸)-알라닌3-(2-naphthyl)-alanine Nal (Φ)Nal (Φ) nal (*?*)nal (*?*) 3-(1-나프틸)-알라닌3-(1-naphthyl)-alanine 1-Nal1-Nal 1-nal1-nal 노르류신Norleucine Nle (Ω)Nle (Ω) nle nle 페닐알라닌Phenylalanine Phe (F)Phe (F) phe (f)phe (f) 페닐글리신phenylglycine Phg (Ψ)Phg (Ψ) phg phg 4-(포스포노디플루오로메틸)페닐알라닌4-(phosphonodifluoromethyl)phenylalanine F2Pmp (Λ)F 2 Pmp (Λ) f2pmp f2pmp 프롤린proline Pro (P)Pro (P) pro (p)pro (p) 사르코신Sarcosine Sar (Ξ)Sar (Ξ) sar sar 셀레노시스테인Selenocysteine Sec (U)Sec (U) sec (u)sec (u) 세린serine Ser (S)Ser(S) ser (s)ser(s) 트레오닌threonine Thr (T)Thr (T) thr (y)thr(y) 티로신tyrosine Tyr (Y)Tyr (Y) tyr (y)tyr (y) 트립토판tryptophan Trp (W)Trp(W) trp (w)trp(w) 발린Valine Val (V)Val (V) val (v)val (v) 터트-부틸-알라닌tert-butyl-alanine TleTle tle tle 페니실아민penicillamine PenPen PenPen 호모아르기닌Homoarginine HomoArgHomoArg homoarghomoarg 니코틴-리신Nicotine-lysine Lys(NIC)Lys(NIC) lys(NIC)lys(NIC) 트리플루오로아세틸-리신Trifluoroacetyl-lysine Lys(TFA)Lys(TFA) lys(TFA)lys(TFA) 메틸-류신Methyl-leucine MeLeuMeLeu meLeumeLeu 3-(3-벤조티에닐)-알라닌 3-(3-benzothienyl)-alanine BtaBta btabta * 한 글자 약어: 대문자는 L-아미노산 형태를 나타내고, 소문자는 D-아미노산 형태를 나타냄.* One-letter abbreviation: uppercase letters indicate the L-amino acid form, lowercase letters indicate the D-amino acid form.

본원에서 사용되는 바와 같이, “폴리에틸렌 글리콜” 및 “PEG”는 상호 교환적으로 사용된다. “PEGm” 및 “PEGm”은 식 HO(CO)-(CH2)n-(OCH2CH2)m-NH2의 분자이거나 이로부터 유래되며, 식 중 n은 1 내지 5의 임의의 정수이고, m은 1 내지 23의 임의의 정수이다. 구현예에서, n은 1 또는 2이다. 구현예에서, n은 1이다. 구현예에서, n은 2이다. 구현예에서, n은 1이고 m은 2이다. 구현예에서, n은 2이고 m은 2이다. 구현예에서, n은 1이고 m은 4이다. 구현예에서, n은 2이고 m은 4이다. 구현예에서, n은 1이고 m은 12이다. 구현예에서, n은 2이고 m은 12이다.As used herein, “polyethylene glycol” and “PEG” are used interchangeably. “PEGm” and “PEG m ” are molecules of the formula HO(CO)-(CH 2 ) n -(OCH2CH 2 ) m -NH 2 , where n is any integer from 1 to 5; m is any integer from 1 to 23. In embodiments, n is 1 or 2. In embodiments, n is 1. In an embodiment, n is 2. In an embodiment, n is 1 and m is 2. In an embodiment, n is 2 and m is 2. In an embodiment, n is 1 and m is 4. In an embodiment, n is 2 and m is 4. In an embodiment, n is 1 and m is 12. In an embodiment, n is 2 and m is 12.

본원에서 사용되는 바와 같이, “miniPEGm” 및 “miniPEGm”은 식 HO(CO)-(CH2)n-(OCH2CH2)m-NH2의 분자이거나 이로부터 유래되며, 식 중 n은 1이고, m은 1 내지 23의 임의의 정수이다. 예를 들어, “miniPEG2” 또는 “miniPEG2”는 (2-[2-[2-아미노에톡시]에톡시]아세트산이거나 이로부터 유래되고, “miniPEG4” 또는 “miniPEG4”는 HO(CO)-(CH2)n-(OCH2CH2)m-NH2이거나 이로부터 유래되고, 식 중 n은 1이고, m은 4이다.As used herein, “miniPEGm” and “miniPEG m ” are or are derived from a molecule of the formula HO(CO)-(CH 2 ) n -(OCHCH 2 ) m -NH 2 , where n is 1 and , m is any integer from 1 to 23. For example, “miniPEG2” or “miniPEG 2 ” is or is derived from (2-[2-[2-aminoethoxy]ethoxy]acetic acid, and “miniPEG4” or “miniPEG 4 ” is HO(CO)- (CH 2 ) n -(OCH 2 CH 2 ) m -NH 2 or derived therefrom, where n is 1 and m is 4.

cCPP는 4 내지 20개의 아미노산을 포함할 수 있으며, 여기서: (i) 적어도 하나의 아미노산은 구아니딘기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖고; (ii) 적어도 하나의 아미노산은 측쇄를 갖지 않거나 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖고; (iii) 적어도 2개의 아미노산은 방향족 또는 헤테로방향족기를 포함하는 측쇄를 독립적으로 갖는다.cCPP may comprise 4 to 20 amino acids, where: (i) at least one amino acid has a side chain comprising a guanidine group, or a protonated form thereof; (ii) at least one amino acid has no side chain or or has a side chain comprising a protonated form thereof; (iii) at least two amino acids independently have side chains containing aromatic or heteroaromatic groups.

적어도 2개의 아미노산은 측쇄를 갖지 않거나, At least two amino acids have no side chains, or

또는 이의 양성자화된 형태를 포함하는 측쇄를 가질 수 있다. 본원에서 사용되는 바와 같이, 측쇄가 존재하지 않는 경우, 아미노산은 아민과 카르복시산을 연결하는, 탄소 원자(들) 상의 2개의 수소 원자(예: -CH2-)를 갖는다. or a side chain comprising a protonated form thereof. As used herein, when no side chain is present, an amino acid has two hydrogen atoms (eg, -CH 2 -) on the carbon atom(s) linking the amine and the carboxylic acid.

측쇄를 갖지 않는 아미노산은 글리신 또는 β-알라닌일 수 있다.The amino acid without a side chain may be glycine or β-alanine.

cCPP는 cCPP를 형성하는 6 내지 20개의 아미노산 잔기를 포함할 수 있으며, 여기서: (i) 적어도 하나의 아미노산은 글리신, β-알라닌, 또는 4-아미노부티르산 잔기일 수 있고; (ii) 적어도 하나의 아미노산은 아릴 또는 헤테로아릴기를 포함하는 측쇄를 가질 수 있고; (iii) 적어도 하나의 아미노산은 구아니딘기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는다.A cCPP may comprise 6 to 20 amino acid residues forming a cCPP, where: (i) at least one amino acid may be a glycine, β-alanine, or 4-aminobutyric acid residue; (ii) at least one amino acid may have a side chain comprising an aryl or heteroaryl group; (iii) at least one amino acid is a guanidine group, or a protonated form thereof.

cCPP는 cCPP를 형성하는 6 내지 20개의 아미노산 잔기를 포함할 수 있으며, 여기서: (i) 적어도 2개의 아미노산은 독립적으로 글리신, β-알라닌, 또는 4-아미노부티르산 잔기일 수 있고; (ii) 적어도 하나의 아미노산은 아릴 또는 헤테로아릴기를 포함하는 측쇄를 가질 수 있고; (iii) 적어도 하나의 아미노산은 구아니딘기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는다.A cCPP may comprise 6 to 20 amino acid residues forming a cCPP, where: (i) at least two amino acids may independently be glycine, β-alanine, or 4-aminobutyric acid residues; (ii) at least one amino acid may have a side chain comprising an aryl or heteroaryl group; (iii) at least one amino acid is a guanidine group, or a protonated form thereof.

cCPP는 cCPP를 형성하는 6 내지 20개의 아미노산 잔기를 포함할 수 있으며, 여기서: (i) 적어도 3개의 아미노산은 독립적으로 글리신, β-알라닌, 또는 4-아미노부티르산 잔기일 수 있고; (ii) 적어도 하나의 아미노산은 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 가질 수 있고; (iii) 적어도 하나의 아미노산은 구아니딘기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 가질 수 있다.A cCPP may comprise 6 to 20 amino acid residues forming a cCPP, where: (i) at least three amino acids may independently be glycine, β-alanine, or 4-aminobutyric acid residues; (ii) at least one amino acid may have a side chain comprising an aromatic or heteroaromatic group; (iii) at least one amino acid is a guanidine group, or a side chain comprising a protonated form thereof.

글리신 및 관련 아미노산 잔기Glycine and related amino acid residues

cCPP는 (i) 1, 2, 3, 4, 5, 또는 6개의 글리신, β-알라닌, 4-아미노부티르산 잔기, 또는 이들의 조합을 포함할 수 있다. cCPP는 (i) 2개의 글리신, β-알라닌, 4-아미노부티르산 잔기, 또는 이들의 조합을 포함할 수 있다. cCPP는 (i) 3개의 글리신, β-알라닌, 4-아미노부티르산 잔기, 또는 이들의 조합을 포함할 수 있다. cCPP는 (i) 4개의 글리신, β-알라닌, 4-아미노부티르산 잔기, 또는 이들의 조합을 포함할 수 있다. cCPP는 (i) 5개의 글리신, β-알라닌, 4-아미노부티르산 잔기, 또는 이들의 조합을 포함할 수 있다. cCPP는 (i) 6개의 글리신, β-알라닌, 4-아미노부티르산 잔기, 또는 이들의 조합을 포함할 수 있다. cCPP는 (i) 3, 4, 또는 5개의 글리신, β-알라닌, 4-아미노부티르산 잔기, 또는 이들의 조합을 포함할 수 있다. cCPP는 (i) 3 또는 4개의 글리신, β-알라닌, 4-아미노부티르산 잔기, 또는 이들의 조합을 포함할 수 있다.cCPP may comprise (i) 1, 2, 3, 4, 5, or 6 glycine, β-alanine, 4-aminobutyric acid residues, or combinations thereof. cCPP may comprise (i) two glycine, β-alanine, 4-aminobutyric acid residues, or combinations thereof. cCPP may comprise (i) three glycine, β-alanine, 4-aminobutyric acid residues, or a combination thereof. cCPP may comprise (i) four glycine, β-alanine, 4-aminobutyric acid residues, or combinations thereof. cCPP may comprise (i) five glycine, β-alanine, 4-aminobutyric acid residues, or combinations thereof. cCPP may comprise (i) six glycine, β-alanine, 4-aminobutyric acid residues, or combinations thereof. cCPP may comprise (i) 3, 4, or 5 glycine, β-alanine, 4-aminobutyric acid residues, or combinations thereof. cCPP may comprise (i) 3 or 4 glycine, β-alanine, 4-aminobutyric acid residues, or combinations thereof.

cCPP는 (i) 1, 2, 3, 4, 5, 또는 6개의 글리신 잔기를 포함할 수 있다. cCPP는 (i) 2개의 글리신 잔기를 포함할 수 있다. cCPP는 (i) 3개의 글리신 잔기를 포함할 수 있다. cCPP는 (i) 4개의 글리신 잔기를 포함할 수 있다. cCPP는 (i) 5개의 글리신 잔기를 포함할 수 있다. cCPP는 (i) 6개의 글리신 잔기를 포함할 수 있다. cCPP는 (i) 3, 4, 또는 5개의 글리신 잔기를 포함할 수 있다. cCPP는 (i) 3 또는 4개의 글리신 잔기를 포함할 수 있다. cCPP는 (i) 2 또는 3개의 글리신 잔기를 포함할 수 있다. cCPP는 (i) 1 또는 2개의 글리신 잔기를 포함할 수 있다.cCPP may include (i) 1, 2, 3, 4, 5, or 6 glycine residues. cCPP may include (i) two glycine residues. cCPP may include (i) three glycine residues. cCPP may include (i) four glycine residues. cCPP may include (i) five glycine residues. cCPP may contain (i) six glycine residues. cCPP may include (i) 3, 4, or 5 glycine residues. cCPP may include (i) 3 or 4 glycine residues. cCPP may include (i) 2 or 3 glycine residues. cCPP may include (i) 1 or 2 glycine residues.

cCPP는 (i) 3, 4, 5, 또는 6개의 글리신, β-알라닌, 4-아미노부티르산 잔기, 또는 이들의 조합을 포함할 수 있다. cCPP는 (i) 3개의 글리신, β-알라닌, 4-아미노부티르산 잔기, 또는 이들의 조합을 포함할 수 있다. cCPP는 (i) 4개의 글리신, β-알라닌, 4-아미노부티르산 잔기, 또는 이들의 조합을 포함할 수 있다. cCPP는 (i) 5개의 글리신, β-알라닌, 4-아미노부티르산 잔기, 또는 이들의 조합을 포함할 수 있다. cCPP는 (i) 6개의 글리신, β-알라닌, 4-아미노부티르산 잔기, 또는 이들의 조합을 포함할 수 있다. cCPP는 (i) 3, 4, 또는 5개의 글리신, β-알라닌, 4-아미노부티르산 잔기, 또는 이들의 조합을 포함할 수 있다. cCPP는 (i) 3 또는 4개의 글리신, β-알라닌, 4-아미노부티르산 잔기, 또는 이들의 조합을 포함할 수 있다.cCPP may comprise (i) 3, 4, 5, or 6 glycine, β-alanine, 4-aminobutyric acid residues, or combinations thereof. cCPP may comprise (i) three glycine, β-alanine, 4-aminobutyric acid residues, or a combination thereof. cCPP may comprise (i) four glycine, β-alanine, 4-aminobutyric acid residues, or a combination thereof. cCPP may comprise (i) five glycine, β-alanine, 4-aminobutyric acid residues, or combinations thereof. cCPP may comprise (i) six glycine, β-alanine, 4-aminobutyric acid residues, or combinations thereof. cCPP may comprise (i) 3, 4, or 5 glycine, β-alanine, 4-aminobutyric acid residues, or combinations thereof. cCPP may comprise (i) 3 or 4 glycine, β-alanine, 4-aminobutyric acid residues, or combinations thereof.

cCPP는 적어도 3개의 글리신 잔기를 포함할 수 있다. cCPP는 (i) 3, 4, 5, 또는 6개의 글리신 잔기를 포함할 수 있다. cCPP는 (i) 3개의 글리신 잔기를 포함할 수 있다. cCPP는 (i) 4개의 글리신 잔기를 포함할 수 있다. cCPP는 (i) 5개의 글리신 잔기를 포함할 수 있다. cCPP는 (i) 6개의 글리신 잔기를 포함할 수 있다. cCPP는 (i) 3, 4, 또는 5개의 글리신 잔기를 포함할 수 있다. cCPP는 (i) 3 또는 4개의 글리신 잔기를 포함할 수 있다.cCPP may contain at least 3 glycine residues. cCPP may include (i) 3, 4, 5, or 6 glycine residues. cCPP may include (i) three glycine residues. cCPP may include (i) four glycine residues. cCPP may include (i) five glycine residues. cCPP may contain (i) six glycine residues. cCPP may include (i) 3, 4, or 5 glycine residues. cCPP may include (i) 3 or 4 glycine residues.

구현예에서, cCPP 내의 글리신, β-알라닌, 또는 4-아미노부티르산 잔기 중 어느 것도 연속되지 않는다. 2 또는 3개의 글리신, β-알라닌, 4-또는 아미노부티르산 잔기는 연속될 수 있다. 2개의 글리신, β-알라닌, 4-아미노부티르산 잔기는 연속될 수 있다.In an embodiment, none of the glycine, β-alanine, or 4-aminobutyric acid residues in cCPP are continuous. Two or three glycine, β-alanine, 4- or aminobutyric acid residues may be consecutive. The two glycine, β-alanine, and 4-aminobutyric acid residues may be consecutive.

구현예에서, cCPP 내의 글리신 잔기 중 어느 것도 연속되지 않는다. cCPP 내의 각각의 글리신 잔기는 아미노산 잔기에 의해 분리될 수 있으며, 여기서 아미노산 잔기는 글리신일 수 없다. 2개 또는 3개의 글리신 잔기는 연속될 수 있다. 2개의 글리신 잔기는 연속될 수 있다.In an embodiment, none of the glycine residues in cCPP are consecutive. Each glycine residue in cCPP may be separated by an amino acid residue, where the amino acid residue cannot be glycine. Two or three glycine residues may be consecutive. Two glycine residues may be consecutive.

방향족 또는 헤테로방향족 기를 갖는 아미노산 측쇄Amino acid side chains with aromatic or heteroaromatic groups

cCPP는 (ii) 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 독립적으로 갖는 2, 3, 4, 5, 또는 6개의 아미노산 잔기를 포함할 수 있다. cCPP는 (ii) 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 독립적으로 갖는 2개의 아미노산 잔기를 포함할 수 있다. cCPP는 (ii) 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 독립적으로 갖는 3개의 아미노산 잔기를 포함할 수 있다. cCPP는 (ii) 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 독립적으로 갖는 4개의 아미노산 잔기를 포함할 수 있다. cCPP는 (ii) 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 독립적으로 갖는 5개의 아미노산 잔기를 포함할 수 있다. cCPP는 (ii) 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 독립적으로 갖는 6개의 아미노산 잔기를 포함할 수 있다. cCPP는 (ii) 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 독립적으로 갖는 2, 3, 또는 4개의 아미노산 잔기를 포함할 수 있다. cCPP는 (ii) 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 독립적으로 갖는 2 또는 3개의 아미노산 잔기를 포함할 수 있다.cCPP may comprise 2, 3, 4, 5, or 6 amino acid residues that independently have (ii) side chains comprising aromatic or heteroaromatic groups. cCPP may comprise (ii) two amino acid residues that independently have side chains comprising aromatic or heteroaromatic groups. cCPP may comprise three amino acid residues that independently have (ii) side chains comprising aromatic or heteroaromatic groups. cCPP may comprise four amino acid residues that independently have (ii) side chains comprising aromatic or heteroaromatic groups. cCPP may comprise five amino acid residues that independently have (ii) side chains comprising aromatic or heteroaromatic groups. cCPP may comprise six amino acid residues that independently have (ii) side chains comprising aromatic or heteroaromatic groups. cCPP may comprise 2, 3, or 4 amino acid residues that independently have (ii) side chains comprising aromatic or heteroaromatic groups. cCPP may comprise 2 or 3 amino acid residues that independently have (ii) side chains comprising aromatic or heteroaromatic groups.

cCPP는 (ii) 방향족 기를 포함하는 측쇄를 독립적으로 갖는 2, 3, 4, 5, 또는 6개의 아미노산 잔기를 포함할 수 있다. cCPP는 (ii) 방향족 기를 포함하는 측쇄를 독립적으로 갖는 2개의 아미노산 잔기를 포함할 수 있다. cCPP는 (ii) 방향족 기를 포함하는 측쇄를 독립적으로 갖는 3개의 아미노산 잔기를 포함할 수 있다. cCPP는 (ii) 방향족 기를 포함하는 측쇄를 독립적으로 갖는 4개의 아미노산 잔기를 포함할 수 있다. cCPP는 (ii) 방향족 기를 포함하는 측쇄를 독립적으로 갖는 5개의 아미노산 잔기를 포함할 수 있다. cCPP는 (ii) 방향족 기를 포함하는 측쇄를 독립적으로 갖는 6개의 아미노산 잔기를 포함할 수 있다. cCPP는 (ii) 방향족 기를 포함하는 측쇄를 독립적으로 갖는 2, 3, 또는 4개의 아미노산 잔기를 포함할 수 있다. cCPP는 (ii) 방향족 기를 포함하는 측쇄를 독립적으로 갖는 2 또는 3개의 아미노산 잔기를 포함할 수 있다.cCPP may comprise 2, 3, 4, 5, or 6 amino acid residues that independently have (ii) a side chain containing an aromatic group. cCPP may comprise (ii) two amino acid residues that independently have side chains containing an aromatic group. cCPP may comprise (ii) three amino acid residues that independently have side chains containing aromatic groups. cCPP may comprise four amino acid residues that independently have (ii) side chains containing aromatic groups. cCPP may comprise five amino acid residues that independently have (ii) side chains containing aromatic groups. cCPP may comprise six amino acid residues that independently have (ii) side chains containing aromatic groups. cCPP may comprise 2, 3, or 4 amino acid residues that independently have (ii) a side chain containing an aromatic group. cCPP may comprise 2 or 3 amino acid residues that independently have (ii) side chains containing aromatic groups.

방향족기는 6-원 내지 14-원 아릴일 수 있다. 아릴은 페닐, 나프틸, 또는 안트라세닐일 수 있으며, 이들 각각은 임의 치환된다. 아릴은 페닐 또는 나프틸일 수 있으며, 이들 각각은 임의 치환된다. 헤테로방향족 기는 N, O, 및 S로부터 선택된 1, 2, 또는 3개의 헤테로원자를 갖는 6원 내지 14원 헤테로아릴일 수 있다. 헤테로아릴은 피리딜, 퀴놀릴, 또는 이소퀴놀릴일 수 있다.The aromatic group may be 6-membered to 14-membered aryl. Aryl can be phenyl, naphthyl, or anthracenyl, each of which is optionally substituted. Aryl can be phenyl or naphthyl, each of which is optionally substituted. Heteroaromatic groups can be 6-14 membered heteroaryl having 1, 2, or 3 heteroatoms selected from N, O, and S. Heteroaryl can be pyridyl, quinolyl, or isoquinolyl.

방향족 또는 헤테로방향족 기를 포함하는 측쇄를 갖는 아미노산 잔기는 각각 독립적으로 비스(호모나프틸알라닌), 호모나프틸알라닌, 나프틸알라닌, 페닐글리신, 비스(호모페닐알라닌), 호모페닐알라닌, 페닐알라닌, 트립토판, 3-(3-벤조티에닐)-알라닌, 3-(2-퀴놀릴)-알라닌, O-벤질세린, 3-(4-(벤질옥시)페닐)-알라닌, S-(4-메틸벤질)시스테인, N-(나프탈렌-2-일)글루타민, 3-(1,1'-바이페닐-4-일)-알라닌, 3-(3-벤조티에닐)-알라닌, 또는 티로신일 수 있으며, 이들 각각은 하나 이상의 치환기로 임의 치환된다. 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 갖는 아미노산은 다음으로부터 각각 독립적으로 선택될 수 있으며:The amino acid residues having a side chain containing an aromatic or heteroaromatic group are each independently bis(homonaphthylalanine), homonaphthylalanine, naphthylalanine, phenylglycine, bis(homophenylalanine), homophenylalanine, phenylalanine, tryptophan, 3 -(3-benzothienyl)-alanine, 3-(2-quinolyl)-alanine, O-benzylserine, 3-(4-(benzyloxy)phenyl)-alanine, S-(4-methylbenzyl)cysteine , N -(naphthalen-2-yl)glutamine, 3-(1,1'-biphenyl-4-yl)-alanine, 3-(3-benzothienyl)-alanine, or tyrosine, each of these is optionally substituted with one or more substituents. Amino acids having side chains containing aromatic or heteroaromatic groups may each be independently selected from:

, 식 중 N-말단 상의 H 및/또는 C-말단 상의 H는 펩티드 결합으로 치환된다.and , wherein H on the N-terminus and/or H on the C-terminus are replaced by a peptide bond.

방향족 또는 헤테로방향족 기를 포함하는 측쇄를 갖는 아미노산 잔기는 각각 독립적으로 페닐알라닌, 나프틸알라닌, 페닐글리신, 호모페닐알라닌, 호모나프틸알라닌, 비스(호모페닐알라닌), 비스-(호모나프틸알라닌), 트립토판, 또는 티로신의 잔기일 수 있으며, 이들 각각은 하나 이상의 치환기로 임의 치환된다. 방향족기를 포함하는 측쇄를 갖는 아미노산 잔기는 각각 독립적으로 티로신, 페닐알라닌, 1-나프틸알라닌, 2-나프틸알라닌, 트립토판, 3-벤조티에닐알라닌, 4-페닐페닐알라닌, 3,4-디플루오로페닐알라닌, 4-트리플루오로메틸페닐알라닌, 2,3,4,5,6-펜타플루오로페닐알라닌, 호모페닐알라닌, β-호모페닐알라닌, 4-터트-부틸-페닐알라닌, 4-피리디닐알라닌, 3-피리디닐알라닌, 4-메틸페닐알라닌, 4-플루오로페닐알라닌, 4-클로로페닐알라닌, 3-(9-안트릴)-알라닌의 잔기일 수 있다. 방향족기를 포함하는 측쇄를 갖는 아미노산 잔기는 각각 독립적으로 페닐알라닌, 나프틸알라닌, 페닐글리신, 호모페닐알라닌, 또는 호모나프틸알라닌의 잔기일 수 있으며, 이들 각각은 하나 이상의 치환기로 임의 치환된다. 방향족 기를 포함하는 측쇄를 갖는 아미노산 잔기는 각각 독립적으로 페닐알라닌, 나프틸알라닌, 호모페닐알라닌, 호모나프틸알라닌, 비스(호모나프틸알라닌), 또는 비스(호모나프틸알라닌)의 잔기일 수 있으며, 이들 각각은 하나 이상의 치환기로 임의 치환된다. 방향족기를 포함하는 측쇄를 갖는 아미노산 잔기는 각각 독립적으로 페닐알라닌 또는 나프틸알라닌의 잔기일 수 있으며, 이들 각각은 하나 이상의 치환기로 임의 치환된다. 방향족기를 포함하는 측쇄를 갖는 적어도 하나의 아미노산 잔기는 페닐알라닌의 잔기일 수 있다. 방향족기를 포함하는 측쇄를 갖는 적어도 2개의 아미노산 잔기는 페닐알라닌의 잔기일 수 있다. 방향족기를 포함하는 측쇄를 갖는 각각의 아미노산 잔기는 페닐알라닌의 잔기일 수 있다.The amino acid residues having a side chain containing an aromatic or heteroaromatic group are each independently phenylalanine, naphthylalanine, phenylglycine, homophenylalanine, homonaphthylalanine, bis(homophenylalanine), bis-(homonaphthylalanine), tryptophan, or a tyrosine residue, each of which is optionally substituted with one or more substituents. Amino acid residues having side chains containing an aromatic group are each independently tyrosine, phenylalanine, 1-naphthylalanine, 2-naphthylalanine, tryptophan, 3-benzothienylalanine, 4-phenylphenylalanine, and 3,4-difluoro. Phenylalanine, 4-trifluoromethylphenylalanine, 2,3,4,5,6-pentafluorophenylalanine, homophenylalanine, β-homophenylalanine, 4-tert-butyl-phenylalanine, 4-pyridinylalanine, 3-pyridine. It may be a residue of dinylalanine, 4-methylphenylalanine, 4-fluorophenylalanine, 4-chlorophenylalanine, or 3-(9-anthryl)-alanine. The amino acid residues having a side chain containing an aromatic group may each independently be a residue of phenylalanine, naphthylalanine, phenylglycine, homophenylalanine, or homonaphthylalanine, each of which is optionally substituted with one or more substituents. The amino acid residues having a side chain containing an aromatic group may each independently be a residue of phenylalanine, naphthylalanine, homophenylalanine, homonaphthylalanine, bis(homonaphthylalanine), or bis(homonaphthylalanine), and these Each is optionally substituted with one or more substituents. The amino acid residues having a side chain containing an aromatic group may each independently be a residue of phenylalanine or naphthylalanine, each of which is optionally substituted with one or more substituents. At least one amino acid residue having a side chain containing an aromatic group may be a residue of phenylalanine. The at least two amino acid residues having side chains containing an aromatic group may be residues of phenylalanine. Each amino acid residue having a side chain containing an aromatic group may be a residue of phenylalanine.

구현예에서, 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 갖는 아미노산 중 어느 것도 연속되지 않는다. 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 갖는 2개의 아미노산은 연속될 수 있다. 2개의 연속 아미노산은 반대의 입체화학을 가질 수 있다. 2개의 연속 아미노산은 동일한 입체화학을 가질 수 있다. 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 갖는 3개의 아미노산은 연속될 수 있다. 3개의 연속 아미노산은 동일한 입체화학을 가질 수 있다. 3개의 연속 아미노산은 교번하는 입체화학을 가질 수 있다.In an embodiment, none of the amino acids having side chains containing aromatic or heteroaromatic groups are continuous. Two amino acids with side chains containing aromatic or heteroaromatic groups may be consecutive. Two consecutive amino acids can have opposite stereochemistry. Two consecutive amino acids can have the same stereochemistry. Three amino acids with side chains containing aromatic or heteroaromatic groups may be consecutive. Three consecutive amino acids can have the same stereochemistry. Three consecutive amino acids can have alternating stereochemistry.

방향족 또는 헤테로방향족 기를 포함하는 아미노산 잔기는 L-아미노산일 수 있다. 방향족 또는 헤테로방향족 기를 포함하는 아미노산 잔기는 D-아미노산일 수 있다. 방향족 또는 헤테로방향족 기를 포함하는 아미노산 잔기는 D-아미노산과 L-아미노산의 혼합물일 수 있다.The amino acid residue containing an aromatic or heteroaromatic group may be an L-amino acid. Amino acid residues containing aromatic or heteroaromatic groups may be D-amino acids. The amino acid residue containing an aromatic or heteroaromatic group may be a mixture of D-amino acids and L-amino acids.

임의 치환기는, 예를 들어 치환기를 갖지 않은 것을 제외하고는 동일한 서열과 비교하여, cCPP의 세포액 전달 효율을 유의하게 (예를 들어 50% 초과만큼) 감소시키지 않는 임의의 원자 또는 기일 수 있다. 임의 치환기는 소수성 치환기 또는 친수성 치환기일 수 있다. 임의 치환기는 소수성 치환기일 수 있다. 치환기는 소수성 아미노산의 (본원에서 정의된 바와 같은) 용매 접근 가능 표면적을 증가시킬 수 있다. 치환기는 할로겐, 알킬, 알케닐, 알키닐, 시클로알킬, 시클로알케닐, 시클로알키닐, 헤테로시클릴, 아릴, 헤테로아릴, 알콕시, 아릴옥시, 아실, 알킬카르바모일, 알킬카르복스아미딜, 알콕시카르보닐, 알킬티오, 또는 아릴티오일 수 있다. 치환기는 할로겐일 수 있다.The optional substituent may be any atom or group that does not significantly (e.g., by more than 50%) reduce the cytosolic transport efficiency of cCPP, e.g., compared to the same sequence but without the substituent. Optional substituents may be hydrophobic or hydrophilic substituents. The optional substituent may be a hydrophobic substituent. Substituents can increase the solvent accessible surface area (as defined herein) of a hydrophobic amino acid. Substituents include halogen, alkyl, alkenyl, alkynyl, cycloalkyl, cycloalkenyl, cycloalkynyl, heterocyclyl, aryl, heteroaryl, alkoxy, aryloxy, acyl, alkylcarbamoyl, alkylcarboxamidyl, It may be alkoxycarbonyl, alkylthio, or arylthio. The substituent may be halogen.

이론에 구속되고자 하는 것은 아니지만, 더 높은 소수성 값을 갖는 방향족 또는 헤테로방향족 기를 갖는 아미노산(즉, 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 갖는 아미노산)은 더 낮은 소수성 값을 갖는 아미노산에 비해 cCPP의 세포액 전달 효율을 개선할 수 있는 것으로 여겨진다. 각각의 소수성 아미노산은 독립적으로 글리신의 소수성 값보다 큰 소수성 값을 가질 수 있다. 각각의 소수성 아미노산은 독립적으로 알라닌의 소수성 값보다 큰 소수성 값을 갖는 소수성 아미노산일 수 있다. 각각의 소수성 아미노산은 독립적으로 페닐알라닌보다 크거나 동일한 소수성 값을 가질 수 있다. 소수성은 당업계에 공지된 소수성 척도를 사용하여 측정될 수 있다. 표 5는 Eisenberg 및 Weiss의 문헌[Proc. Natl. Acad. Sci. U. S. A. 1984;81(1):140-144], Engleman 등의 문헌[Ann. Rev. of Biophys. Biophys. Chem. 1986;1986(15):321-53], Kyte 및 Doolittle의 문헌[J. Mol. Biol. 1982;157(1):105-132], Hoop 및 Woods의 문헌[Proc. Natl. Acad. Sci. U. S. A. 1981;78(6):3824-3828], 및 Janin의 문헌[Nature. 1979;277(5696):491-492]에 보고된 것과 같은 다양한 아미노산에 대한 소수성 값을 열거한 것이며, 상기 문헌 각각은 그 전체가 참조로서 본원에 통합된다. 소수성은 Engleman 등에 의해 보고된 소수성 척도를 사용해 측정될 수 있다.Without wishing to be bound by theory, amino acids with aromatic or heteroaromatic groups with higher hydrophobicity values (i.e., amino acids with side chains containing aromatic or heteroaromatic groups) have a greater cytosolic transport of cCPP than amino acids with lower hydrophobicity values. It is believed that efficiency can be improved. Each hydrophobic amino acid can independently have a hydrophobicity value greater than that of glycine. Each hydrophobic amino acid may independently be a hydrophobic amino acid having a hydrophobicity value greater than that of alanine. Each hydrophobic amino acid can independently have a hydrophobicity value greater than or equal to phenylalanine. Hydrophobicity can be measured using hydrophobicity scales known in the art. Table 5 shows Eisenberg and Weiss [Proc. Natl. Acad. Sci. USA 1984;81(1):140-144], Engleman et al. [Ann. Rev. of Biophys. Biophys. Chem. 1986;1986(15):321-53], Kyte and Doolittle [J. Mol. Biol. 1982;157(1):105-132], Hoop and Woods [Proc. Natl. Acad. Sci. USA 1981;78(6):3824-3828], and Janin [Nature. 1979;277(5696):491-492, each of which is incorporated herein by reference in its entirety. Hydrophobicity can be measured using the hydrophobicity scale reported by Engleman et al.

아미노산 소수성amino acid hydrophobicity 아미노산amino acid energy Eisenberg 및 WeissEisenberg and Weiss Engleman 등Engleman et al. Kyrie 및 DoolittleKyrie and Doolittle Hoop 및 WoodsHoop and Woods JaninJanine IleIle 비극성nonpolar 0.730.73 3.13.1 4.54.5 -1.8-1.8 0.70.7 PhePhe 비극성nonpolar 0.610.61 3.73.7 2.82.8 -2.5-2.5 0.50.5 ValVal 비극성nonpolar 0.540.54 2.62.6 4.24.2 -1.5-1.5 0.60.6 LeuLeu 비극성nonpolar 0.530.53 2.82.8 3.83.8 -1.8-1.8 0.50.5 TrpTrp 비극성nonpolar 0.370.37 1.91.9 -0.9-0.9 -3.4-3.4 0.30.3 MetMet 비극성nonpolar 0.260.26 3.43.4 1.91.9 -1.3-1.3 0.40.4 AlaAla 비극성nonpolar 0.250.25 1.61.6 1.81.8 -0.5-0.5 0.30.3 GlyGly 비극성nonpolar 0.160.16 1.01.0 -0.4-0.4 0.00.0 0.30.3 CysCys 하전 안됨/극성uncharged/polarized 0.040.04 2.02.0 2.52.5 -1.0-1.0 0.90.9 TyrTyr 비하전/극성Uncharged/polar 0.020.02 -0.7-0.7 -1.3-1.3 -2.3-2.3 -0.4-0.4 ProPro 비극성nonpolar -0.07-0.07 -0.2-0.2 -1.6-1.6 0.00.0 -0.3-0.3 ThrThr 하전 안됨/극성uncharged/polarized -0.18-0.18 1.21.2 -0.7-0.7 -0.4-0.4 -0.2-0.2 SerSer 비하전/극성Uncharged/polar -0.26-0.26 0.60.6 -0.8-0.8 0.30.3 -0.1-0.1 HisHis 하전됨charged -0.40-0.40 -3.0-3.0 -3.2-3.2 -0.5-0.5 -0.1-0.1 GluGlu 하전됨charged -0.62-0.62 -8.2-8.2 -3.5-3.5 3.03.0 -0.7-0.7 AsnAsn 하전 안됨/극성uncharged/polarized -0.64-0.64 -4.8-4.8 -3.5-3.5 0.20.2 -0.5-0.5 GlnGln 하전 안됨/극성uncharged/polarized -0.69-0.69 -4.1-4.1 -3.5-3.5 0.20.2 -0.7-0.7 AspAsp 하전됨charged -0.72-0.72 -9.2-9.2 -3.5-3.5 3.03.0 -0.6-0.6 LysLys 하전됨charged -1.10-1.10 -8.8-8.8 -3.9-3.9 3.03.0 -1.8-1.8 ArgArg 하전됨charged -1.80-1.80 -12.3-12.3 -4.5-4.5 3.03.0 -1.4-1.4

방향족 또는 헤테로방향족 기의 크기는 cCPP의 세포액 전달 효율을 개선하도록 선택될 수 있다. 이론에 구속되고자 하는 것은 아니지만, 아미노산의 측쇄 상의 더 큰 방향족 또는 헤테로방향족 기가 더 작은 소수성 아미노산을 갖는 달리 동일한 서열에 비해 세포액 전달 효율을 개선할 수 있는 것으로 여겨진다. 소수성 아미노산의 크기는 소수성 아미노산의 분자량, 소수성 아미노산의 입체 효과, 측쇄의 용매 접근 가능 표면적(SASA), 또는 이들의 조합의 관점에서 측정될 수 있다. 소수성 아미노산의 크기는 소수성 아미노산의 분자량의 관점에서 측정될 수 있고, 소수성이 더 큰 아미노산은 분자량이 적어도 약 90 g/몰, 또는 적어도 약 130 g/몰, 또는 적어도 약 141 g/몰인 측쇄를 갖는다. 아미노산의 크기는 소수성 측쇄의 SASA의 관점에서 측정될 수 있다. 소수성 아미노산은 알라닌의 SASA 이상이거나, 글리신의 SASA 이상인 SASA를 가진 측쇄를 가질 수 있다. 소수성이 더 큰 아미노산은 알라닌의 SASA보다 더 크거나, 글리신의 SASA보다 더 큰 SASA를 가진 측쇄를 가질 수 있다. 소수성 아미노산은 대략 피페리딘-2-카르복시산의 SASA 이상이거나, 대략 트립토판의 SASA 이상이거나, 대략 페닐알라닌의 SASA 이상이거나, 대략 나프틸알라닌의 SASA 이상인 SASA를 갖는 방향족 또는 헤테로방향족 기를 가질 수 있다. 제1 소수성 아미노산(AAH1)은 적어도 약 200 Å2, 적어도 약 210 Å2, 적어도 약 220 Å2, 적어도 약 240 Å2, 적어도 약 250 Å2, 적어도 약 260 Å2, 적어도 약 270 Å2, 적어도 약 280 Å2, 적어도 약 290 Å2, 적어도 약 300 Å2, 적어도 약 310 Å2, 적어도 약 320 Å2, 또는 적어도 약 330 Å2의 SASA를 갖는 측쇄를 가질 수 있다. 제2 소수성 아미노산(AAH2)은 적어도 약 200 Å2, 적어도 약 210 Å2, 적어도 약 220 Å2, 적어도 약 240 Å2, 적어도 약 250 Å2, 적어도 약 260 Å2, 적어도 약 270 Å2, 적어도 약 280 Å2, 적어도 약 290 Å2, 적어도 약 300 Å2, 적어도 약 310 Å2, 적어도 약 320 Å2, 또는 적어도 약 330 Å2의 SASA를 갖는 측쇄를 가질 수 있다. AAH1 및 AAH2의 측쇄는 적어도 약 350 Å2, 적어도 약 360 Å2, 적어도 약 370 Å2, 적어도 약 380 Å2, 적어도 약 390 Å2, 적어도 약 400 Å2, 적어도 약 410 Å2, 적어도 약 420 Å2, 적어도 약 430 Å2, 적어도 약 440 Å2, 적어도 약 450 Å2, 적어도 약 460 Å2, 적어도 약 470 Å2, 적어도 약 480 Å2, 적어도 약 490 Å2, 약 500 Å2 초과, 적어도 약 510 Å2, 적어도 약 520 Å2, 적어도 약 530 Å2, 적어도 약 540 Å2, 적어도 약 550 Å2, 적어도 약 560 Å2, 적어도 약 570 Å2, 적어도 약 580 Å2, 적어도 약 590 Å2, 적어도 약 600 Å2, 적어도 약 610 Å2, 적어도 약 620 Å2, 적어도 약 630 Å2, 적어도 약 640 Å2, 약 650 Å2 초과, 적어도 약 660 Å2, 적어도 약 670 Å2, 적어도 약 680 Å2, 적어도 약 690 Å2, 또는 적어도 약 700 Å2의 합쳐진 SASA를 가질 수 있다. AAH2는 AAH1의 소수성 측쇄의 SASA 이하인 SASA를 갖는 측쇄를 갖는 소수성 아미노산 잔기일 수 있다. 예를 들어 (제한하는 것은 아님), Nal-Arg 모티프를 갖는 cCPP는 Phe-Arg 모티프를 갖는 달리 동일한 cCPP와 비교하여 개선된 세포액 전달 효율을 나타낼 수 있고; Phe-Nal-Arg 모티프를 갖는 cCPP는 Nal-Phe-Arg 모티프를 갖는 달리 동일한 cCPP와 비교하여 개선된 세포액 전달 효율을 나타낼 수 있고; phe-Nal-Arg 모티프는 nal-Phe-Arg 모티프를 갖는 달리 동일한 cCPP와 비교하여 개선된 세포액 전달 효율을 나타낼 수 있다.The size of the aromatic or heteroaromatic group can be selected to improve the cytosolic transport efficiency of cCPP. Without wishing to be bound by theory, it is believed that larger aromatic or heteroaromatic groups on the side chains of amino acids can improve cytosolic transport efficiency compared to otherwise identical sequences with smaller hydrophobic amino acids. The size of a hydrophobic amino acid can be measured in terms of the molecular weight of the hydrophobic amino acid, the steric effect of the hydrophobic amino acid, the solvent accessible surface area (SASA) of the side chain, or a combination thereof. The size of a hydrophobic amino acid can be measured in terms of the molecular weight of the hydrophobic amino acid, with the more hydrophobic amino acid having a side chain with a molecular weight of at least about 90 g/mole, or at least about 130 g/mole, or at least about 141 g/mole. . The size of an amino acid can be measured in terms of the SASA of the hydrophobic side chain. Hydrophobic amino acids can have side chains with a SASA that is greater than or equal to the SASA of alanine, or greater than or equal to the SASA of glycine. A more hydrophobic amino acid may have a side chain with a SASA greater than that of alanine or greater than that of glycine. The hydrophobic amino acid may have an aromatic or heteroaromatic group with a SASA that is approximately equal to or greater than the SASA of piperidine-2-carboxylic acid, approximately equal to or greater than the SASA of tryptophan, approximately equal to or greater than the SASA of phenylalanine, or approximately equal to or greater than the SASA of naphthylalanine. The first hydrophobic amino acid (AA H1 ) has a length of at least about 200 Å 2 , at least about 210 Å 2 , at least about 220 Å 2 , at least about 240 Å 2 , at least about 250 Å 2 , at least about 260 Å 2 , at least about 270 Å 2 , at least about 280 Å 2 , at least about 290 Å 2 , at least about 300 Å 2 , at least about 310 Å 2 , at least about 320 Å 2 , or at least about 330 Å 2 . The second hydrophobic amino acid (AA H2 ) is at least about 200 Å 2 , at least about 210 Å 2 , at least about 220 Å 2 , at least about 240 Å 2 , at least about 250 Å 2 , at least about 260 Å 2 , at least about 270 Å 2 , at least about 280 Å 2 , at least about 290 Å 2 , at least about 300 Å 2 , at least about 310 Å 2 , at least about 320 Å 2 , or at least about 330 Å 2 . The side chains of AA H1 and AA H2 are at least about 350 Å 2 , at least about 360 Å 2 , at least about 370 Å 2 , at least about 380 Å 2 , at least about 390 Å 2 , at least about 400 Å 2 , at least about 410 Å 2 , at least about 420 Å 2 , at least about 430 Å 2 , At least about 440 Å 2 , at least about 450 Å 2 , at least about 460 Å 2 , at least about 470 Å 2 , at least about 480 Å 2 , At least about 490 Å 2 , Greater than about 500 Å 2 but at least about 510 Å 2 , at least about 520 Å 2 , at least about 530 Å 2 , at least about 540 Å 2 , at least about 550 Å 2 , at least about 560 Å 2 , at least about 570 Å 2 , at least about 580 Å 2 , at least about 590 Å 2 , at least about 600 Å 2 , at least about 610 Å 2 , at least about 620 Å 2 , at least about 630 Å 2 , at least about 640 Å 2 , greater than about 650 Å 2 , and can have a combined SASA of at least about 660 Å 2 , at least about 670 Å 2 , at least about 680 Å 2 , at least about 690 Å 2 , or at least about 700 Å 2 . AA H2 may be a hydrophobic amino acid residue having a side chain with a SASA that is less than or equal to the SASA of the hydrophobic side chain of AA H1 . For example, but not by way of limitation, a cCPP with a Nal-Arg motif may exhibit improved cytosolic transport efficiency compared to an otherwise identical cCPP with a Phe-Arg motif; cCPP with a Phe-Nal-Arg motif can exhibit improved cytosolic transport efficiency compared to an otherwise identical cCPP with a Nal-Phe-Arg motif; The phe-Nal-Arg motif may exhibit improved cytosolic transport efficiency compared to an otherwise identical cCPP with a nal-Phe-Arg motif.

본원에서 사용되는 바와 같이, “소수성 표면적” 또는 “SASA”는 용매에 접근할 수 있는 아미노산 측쇄의 표면적(옹스트롬 제곱; Å2로서 보고됨)을 지칭하며, SASA는 에 의해 개발된 ‘롤링 볼(rolling ball)’ 알고리즘을 사용해 계산될 수 있다(Shrake 및 Rupley의 문헌[J Mol Biol .79(2): 351-71], 모든 목적을 위해 그 전체가 참조로서 본원에 통합됨). 이 알고리즘은 분자의 표면을 탐침하기 위해 특정 반경을 가진 용매의 “구체”를 사용한다. 구체의 전형적인 값은 1.4 Å인데, 이는 물 분자의 반경에 근사한다.As used herein, “hydrophobic surface area” or “SASA” refers to the surface area (angstrom squared; reported as Å 2 ) of amino acid side chains accessible to solvents, SASA being the ‘rolling ball’ developed by rolling ball' algorithm (Shrake and Rupley, J Mol Biol . 79 (2): 351-71, incorporated herein by reference in its entirety for all purposes). This algorithm uses a “sphere” of solvent with a specific radius to probe the surface of the molecule. A typical value for a sphere is 1.4 Å, which approximates the radius of a water molecule.

특정 측쇄에 대한 SASA 값은 아래 표 6에 나타나 있다. 본원에 기술된 SASA 값은 Tien 등에 의해 보고된 바와 같이, 아래 표 6에 열거된 이론적 값에 기초한다. (Tien 등의 문헌[PLOS ONE 8(11): e80635], doi.org/10.1371/journal.pone.0080635로 이용 가능함, 모든 목적을 위해 그 전체가 참조로서 본원에 통합됨).SASA values for specific side chains are shown in Table 6 below. The SASA values described herein are based on the theoretical values listed in Table 6 below, as reported by Tien et al. (Tien et al. [PLOS ONE 8(11): e80635], available at doi.org/10.1371/journal.pone.0080635, incorporated herein by reference in its entirety for all purposes).

아미노산 SASA 값Amino Acid SASA Value 잔기residue 이론적theoretical 경험적empirical Miller 등의 (1987)Miller et al. (1987) Rose 등의 (1985)Rose et al. (1985) 알라닌alanine 129.0129.0 121.0121.0 113.0113.0 118.1118.1 아르기닌arginine 274.0274.0 265.0265.0 241.0241.0 256.0256.0 아스파라긴Asparagine 195.0195.0 187.0187.0 158.0158.0 165.5165.5 아스파르테이트Aspartate 193.0193.0 187.0187.0 151.0151.0 158.7158.7 시스테인cysteine 167.0167.0 148.0148.0 140.0140.0 146.1146.1 글루탐산염glutamate 223.0223.0 214.0214.0 183.0183.0 186.2186.2 글루타민glutamine 225.0225.0 214.0214.0 189.0189.0 193.2193.2 글리신glycine 104.0104.0 97.097.0 85.085.0 88.188.1 히스티딘histidine 224.0224.0 216.0216.0 194.0194.0 202.5202.5 이소류신isoleucine 197.0197.0 195.0195.0 182.0182.0 181.0181.0 류신leucine 201.0201.0 191.0191.0 180.0180.0 193.1193.1 리신Lee Sin 236.0236.0 230.0230.0 211.0211.0 225.8225.8 메티오닌methionine 224.0224.0 203.0203.0 204.0204.0 203.4203.4 페닐알라닌Phenylalanine 240.0240.0 228.0228.0 218.0218.0 222.8222.8 프롤린proline 159.0159.0 154.0154.0 143.0143.0 146.8146.8 세린serine 155.0155.0 143.0143.0 122.0122.0 129.8129.8 트레오닌threonine 172.0172.0 163.0163.0 146.0146.0 152.5152.5 트립토판tryptophan 285.0285.0 264.0264.0 259.0259.0 266.3266.3 티로신tyrosine 263.0263.0 255.0255.0 229.0229.0 236.8236.8 발린Valine 174.0174.0 165.0165.0 160.0160.0 164.5164.5

구아니딘기, 구아니딘 치환기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 아미노산 잔기Amino acid residues with side chains containing a guanidine group, a guanidine substituent, or a protonated form thereof

본원에서 사용되는 바와 같이, 구아니딘은 다음의 구조를 지칭한다:As used herein, guanidine refers to the following structure:

. .

본원에서 사용되는 바와 같이, 구아니딘의 양성자화된 형태는 다음의 구조를 지칭한다:As used herein, the protonated form of guanidine refers to the following structure:

. .

구아니딘 치환기는 아미노산의 측쇄 상의 작용기로서, 생리학적 pH 이상에서 양으로 하전되거나, 구아니디늄기의 활성을 공여하고 수용하는 수소 결합을 재현할 수 있는 작용기를 지칭한다.A guanidine substituent refers to a functional group on the side chain of an amino acid that is positively charged at or above physiological pH, or that can reproduce hydrogen bonds that donate and accept the activity of the guanidinium group.

구아니딘 치환기는 구아니딘기 또는 이의 양성자화된 형태와 연관된 독성을 감소시키면서 치료제의 세포 투과 및 전달을 용이하게 한다. cCPP는 구아니딘 또는 구아니디늄 치환기를 포함하는 측쇄를 갖는 적어도 하나의 아미노산을 포함할 수 있다. cCPP는 구아니딘 또는 구아니디늄 치환기를 포함하는 측쇄를 갖는 적어도 2개의 아미노산을 포함할 수 있다. cCPP는 구아니딘 또는 구아니디늄 치환기를 포함하는 측쇄를 갖는 적어도 3개의 아미노산을 포함할 수 있다.The guanidine substituent facilitates cellular penetration and delivery of the therapeutic agent while reducing the toxicity associated with the guanidine group or its protonated form. cCPP may include at least one amino acid with a side chain containing a guanidine or guanidinium substituent. cCPP may comprise at least two amino acids with side chains containing guanidine or guanidinium substituents. cCPP may comprise at least three amino acids with side chains containing guanidine or guanidinium substituents.

구아니딘 또는 구아니디늄기는 구아니딘 또는 구아니디늄의 동배체(isostere)일 수 있다. 구아니딘 또는 구아니디늄 치환기는 구아니딘보다 덜 염기성일 수 있다.The guanidine or guanidinium group may be an isostere of guanidine or guanidinium. The guanidine or guanidinium substituent may be less basic than guanidine.

본원에서 사용되는 바와 같이, 구아니딘 치환기는 , , 또는 이의 양성자화된 형태를 지칭한다.As used herein, a guanidine substituent is , , or its protonated form.

본 개시는 4 내지 20개의 아미노산 잔기를 포함하는 cCPP에 관한 것으로서, 여기서: (i) 적어도 하나의 아미노산은 구아니딘기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖고; (ii) 적어도 하나의 아미노산 잔기는 측쇄를 갖지 않거나 , , , 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖고; (iii) 적어도 2개의 아미노산 잔기는 방향족 또는 헤테로방향족기를 포함하는 측쇄를 독립적으로 갖는다.The present disclosure relates to cCPPs comprising 4 to 20 amino acid residues, where: (i) at least one amino acid has a side chain comprising a guanidine group, or a protonated form thereof; (ii) at least one amino acid residue has no side chain, or , , or has a side chain comprising a protonated form thereof; (iii) at least two amino acid residues independently have side chains containing aromatic or heteroaromatic groups.

적어도 2개의 아미노산 잔기는 측쇄를 갖지 않거나, , , 또는 이의 양성자화된 형태를 포함하는 측쇄를 가질 수 있다. 본원에서 사용되는 바와 같이, 측쇄가 존재하지 않는 경우, 아미노산 잔기는 아민과 카르복시산을 연결하는, 탄소 원자(들) 상의 2개의 수소 원자(예: -CH2-)를 갖는다.At least two amino acid residues do not have side chains, or , , or a side chain comprising a protonated form thereof. As used herein, when no side chain is present, the amino acid residue has two hydrogen atoms (eg, -CH 2 -) on the carbon atom(s) linking the amine and the carboxylic acid.

cCPP는 다음 모이어티 중 하나를 포함하는 측쇄를 갖는 적어도 하나의 아미노산을 포함할 수 있다: , , 또는 이의 양성자화된 형태.cCPP may comprise at least one amino acid with a side chain comprising one of the following moieties: , , or a protonated form thereof.

cCPP는 다음 모이어티 중 하나를 각각 독립적으로 갖는 적어도 2개의 아미노산을 포함할 수 있다: , , 또는 이의 양성자화된 형태. 적어도 2개의 아미노산은 다음으로부터 선택된 동일한 모이어티를 포함하는 측쇄를 가질 수 있다: , , 또는 이의 양성자화된 형태. 적어도 하나의 또는 이의 양성자화된 형태를 포함하는 측쇄를 가질 수 있다. 적어도 2개의 아미노산은 또는 이의 양성자화된 형태를 포함하는 측쇄를 가질 수 있다. 1, 2, 3, 또는 4개의 아미노산은 또는 이의 양성자화된 형태를 포함하는 측쇄를 가질 수 있다. 하나의 아미노산은 또는 이의 양성자화된 형태를 포함하는 측쇄를 가질 수 있다. 2개의 아미노산은 또는 이의 양성자화된 형태를 포함하는 측쇄를 가질 수 있다. , , 또는 이의 양성자화된 형태는 아미노산 측쇄의 말단에 부착될 수 있다. 는 아미노산 측쇄의 말단에 부착될 수 있다.cCPP may comprise at least two amino acids each independently having one of the following moieties: , , or a protonated form thereof. The at least two amino acids may have side chains comprising the same moiety selected from: , , or a protonated form thereof. at least one or a side chain comprising a protonated form thereof. at least 2 amino acids or a side chain comprising a protonated form thereof. 1, 2, 3, or 4 amino acids or a side chain comprising a protonated form thereof. one amino acid or a side chain comprising a protonated form thereof. 2 amino acids or a side chain comprising a protonated form thereof. , , or its protonated form may be attached to the terminus of an amino acid side chain. Can be attached to the end of the amino acid side chain.

cCPP는 (iii) 구아니딘기, 구아니딘 치환기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 독립적으로 갖는 2, 3, 4, 5, 또는 6개의 아미노산 잔기를 포함할 수 있다. cCPP는 (iii) 구아니딘기, 구아니딘 치환기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 독립적으로 갖는 2개의 아미노산 잔기를 포함할 수 있다. cCPP는 (iii) 구아니딘기, 구아니딘 치환기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 독립적으로 갖는 3개의 아미노산 잔기를 포함할 수 있다. cCPP는 (iii) 구아니딘기, 구아니딘 치환기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 독립적으로 갖는 4개의 아미노산 잔기를 포함할 수 있다. cCPP는 (iii) 구아니딘기, 구아니딘 치환기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 독립적으로 갖는 5개의 아미노산 잔기를 포함할 수 있다. cCPP는 (iii) 구아니딘기, 구아니딘 치환기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 독립적으로 갖는 6개의 아미노산 잔기를 포함할 수 있다. cCPP는 (iii) 구아니딘기, 구아니딘 치환기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 독립적으로 갖는 2, 3, 4, 또는 5개의 아미노산 잔기를 포함할 수 있다. cCPP는 (iii) 구아니딘기, 구아니딘 치환기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 독립적으로 갖는 2, 3, 또는 4개의 아미노산 잔기를 포함할 수 있다. cCPP는 (iii) 구아니딘기, 구아니딘 치환기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 독립적으로 갖는 2 또는 3개의 아미노산 잔기를 포함할 수 있다. cCPP는 (iii) 구아니딘기 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 적어도 하나의 아미노산 잔기를 포함할 수 있다. cCPP는 (iii) 구아니딘기 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 2개의 아미노산 잔기를 포함할 수 있다. cCPP는 (iii) 구아니딘기 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 3개의 아미노산 잔기를 포함할 수 있다.cCPP may comprise 2, 3, 4, 5, or 6 amino acid residues that independently have (iii) a side chain comprising a guanidine group, a guanidine substituent, or a protonated form thereof. cCPP may comprise (iii) two amino acid residues that independently have side chains comprising a guanidine group, a guanidine substituent, or a protonated form thereof. cCPP may comprise three amino acid residues that independently have (iii) side chains comprising a guanidine group, a guanidine substituent, or a protonated form thereof. cCPP may comprise four amino acid residues that independently have (iii) a side chain comprising a guanidine group, a guanidine substituent, or a protonated form thereof. cCPP may comprise five amino acid residues that independently have (iii) a side chain comprising a guanidine group, a guanidine substituent, or a protonated form thereof. cCPP may comprise six amino acid residues that independently have (iii) side chains comprising a guanidine group, a guanidine substituent, or a protonated form thereof. cCPP may comprise 2, 3, 4, or 5 amino acid residues that independently have (iii) a side chain comprising a guanidine group, a guanidine substituent, or a protonated form thereof. cCPP may comprise 2, 3, or 4 amino acid residues that independently have (iii) a side chain comprising a guanidine group, a guanidine substituent, or a protonated form thereof. cCPP may comprise two or three amino acid residues that independently have (iii) a side chain comprising a guanidine group, a guanidine substituent, or a protonated form thereof. cCPP may comprise (iii) at least one amino acid residue having a side chain comprising a guanidine group or a protonated form thereof. cCPP may comprise (iii) two amino acid residues with side chains comprising a guanidine group or a protonated form thereof. cCPP may comprise (iii) three amino acid residues with side chains comprising a guanidine group or a protonated form thereof.

아미노산 잔기는 연속되지 않는 구아니딘기, 구아니딘 치환기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 독립적으로 가질 수 있다. 2개의 아미노산 잔기는 연속될 수 있는 구아니딘기, 구아니딘 치환기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 독립적으로 가질 수 있다. 3개의 아미노산 잔기는 연속될 수 있는 구아니딘기, 구아니딘 치환기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 독립적으로 가질 수 있다. 4개의 아미노산 잔기는 연속될 수 있는 구아니딘기, 구아니딘 치환기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 독립적으로 가질 수 있다. 연속된 아미노산 잔기는 동일한 입체화학을 가질 수 있다. 연속된 아미노산은 교번하는 입체화학을 가질 수 있다.The amino acid residues may independently have a side chain comprising a non-contiguous guanidine group, a guanidine substituent, or a protonated form thereof. The two amino acid residues may independently have side chains containing a guanidine group, a guanidine substituent, or a protonated form thereof, which may be consecutive. The three amino acid residues may independently have side chains containing guanidine groups, guanidine substituents, or protonated forms thereof, which may be consecutive. The four amino acid residues may independently have side chains containing guanidine groups, guanidine substituents, or protonated forms thereof, which may be consecutive. Consecutive amino acid residues may have the same stereochemistry. Sequential amino acids can have alternating stereochemistry.

구아니딘기, 구아니딘 치환기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 독립적으로 갖는 아미노산 잔기는 L-아미노산일 수 있다. 구아니딘기, 구아니딘 치환기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 독립적으로 갖는 아미노산 잔기는 D-아미노산일 수 있다. 구아니딘기, 구아니딘 치환기, 또는 이의 양성자화된 형태를 포함하는 측쇄를 독립적으로 갖는 아미노산 잔기는 L-아미노산 또는 D-아미노산의 혼합물일 수 있다.An amino acid residue that independently has a side chain comprising a guanidine group, a guanidine substituent, or a protonated form thereof may be an L-amino acid. An amino acid residue that independently has a side chain containing a guanidine group, a guanidine substituent, or a protonated form thereof may be a D-amino acid. The amino acid residues that independently have a side chain containing a guanidine group, a guanidine substituent, or a protonated form thereof may be an L-amino acid or a mixture of D-amino acids.

구아니딘기 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 각각의 아미노산 잔기는 독립적으로 아르기닌, 호모아르기닌, 2-아미노-3-프로피온산, 2-아미노-4-구아니디노부티르산, 또는 이의 양성자화된 형태의 잔기일 수 있다. 구아니딘기 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 각각의 아미노산 잔기는 독립적으로 아르기닌 또는 이의 양성자화된 형태의 잔기일 수 있다.Each amino acid residue having a side chain comprising a guanidine group or a protonated form thereof is independently arginine, homoarginine, 2-amino-3-propionic acid, 2-amino-4-guanidinobutyric acid, or a protonated form thereof. It may be a residue of the form Each amino acid residue having a side chain comprising a guanidine group or a protonated form thereof may independently be an arginine or a protonated form thereof.

구아니딘 치환기 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 각각의 아미노산은 독립적으로 , , 또는 이의 양성자화된 형태일 수 있다. Each amino acid having a side chain containing a guanidine substituent or a protonated form thereof is independently , , or it may be a protonated form thereof.

이론에 얽매이는 것은 아니지만, 구아니딘 치환기는 아르기닌에 비해 감소된 염기성을 가지며, 일부 경우에 생리학적 pH에서 하전되지 않으며(예: -N(H)C(O)), 효과적인 막 결합 및 후속 내재화를 용이하게 하는 것으로 여겨지는, 형질막 상의 인지질과 두자리 수소 결합 상호작용을 유지할 수 있는 것으로 가정한다. 양전하를 제거하는 것도 cCPP의 독성을 감소시키는 것으로 여겨진다.Without being bound by theory, the guanidine substituent has reduced basicity compared to arginine and, in some cases, is uncharged at physiological pH (e.g. -N(H)C(O)), facilitating effective membrane binding and subsequent internalization. It is assumed that it can maintain bidentate hydrogen bonding interactions with phospholipids on the plasma membrane, which are believed to allow it to do so. Removing the positive charge is also believed to reduce the toxicity of cCPP.

당업자는, 본원에 상기 비-천연 방향족 소수성 아미노산이 본원에 개시된 펩티드 내에 혼입된 후, 이들의 N-말단 및/또는 C-말단이 아미드 결합을 형성한다는 것을 이해할 것이다.Those skilled in the art will understand that after the non-natural aromatic hydrophobic amino acids are incorporated into the peptides disclosed herein, their N-termini and/or C-termini form amide bonds.

cCPP는 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 갖는 제1 아미노산; 및 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 갖는 제2 아미노산을 포함할 수 있고, 여기서 제1 글리신의 N-말단은 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 갖는 제1 아미노산과 펩티드 결합을 형성하고, 제1 글리신의 C-말단은 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 갖는 제2 아미노산과 펩티드 결합을 형성한다. 관례에 따라, 용어 “제1 아미노산”은 종종 펩티드 서열의 N-말단 아미노산을 지칭하지만, 본원에서 사용되는 바와 같이, “제1 아미노산”은 cCPP 내에서 기준 아미노산을 다른 아미노산(예: “제2 아미노산”)과 구별하는 데 사용되므로, 용어 “제1 아미노산”은 펩티드 서열의 N-말단에 위치한 아미노산을 지칭할 수 있거나 지칭할 수 있다.cCPP is a first amino acid having a side chain comprising an aromatic or heteroaromatic group; and a second amino acid having a side chain containing an aromatic or heteroaromatic group, wherein the N-terminus of the first glycine forms a peptide bond with the first amino acid having a side chain containing an aromatic or heteroaromatic group, and 1 The C-terminus of glycine forms a peptide bond with a second amino acid having a side chain containing an aromatic or heteroaromatic group. By convention, the term “first amino acid” often refers to the N-terminal amino acid of a peptide sequence, but as used herein, a “first amino acid” refers to a reference amino acid within a cCPP that is replaced by another amino acid (e.g., “second amino acid”). As used to distinguish between "amino acids"), the term "first amino acid" may or may refer to an amino acid located at the N-terminus of a peptide sequence.

cCPP는, 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 갖는 아미노산과 펩티드 결합을 형성하는 제2 글리신의 N-말단; 및 구아니딘기 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 아미노산과 펩티드 결합을 형성하는 제2 글리신의 C-말단을 포함할 수 있다.cCPP is the N-terminus of a second glycine that forms a peptide bond with an amino acid having a side chain containing an aromatic or heteroaromatic group; and the C-terminus of the second glycine that forms a peptide bond with an amino acid having a side chain containing a guanidine group or a protonated form thereof.

cCPP는 구아니딘기 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 제1 아미노산, 및 구아니딘기 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 제2 아미노산을 포함하되, 제3 글리신의 N-말단은 구아니딘기 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 제1 아미노산과 펩티드 결합을 형성하고, 제3 글리신의 C-말단은 구아니딘기 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 제2 아미노산과 펩티드 결합을 형성한다.cCPP comprises a first amino acid having a side chain comprising a guanidine group or a protonated form thereof, and a second amino acid having a side chain comprising a guanidine group or a protonated form thereof, wherein the N-terminus of the third glycine is Forms a peptide bond with a first amino acid having a side chain containing a guanidine group or a protonated form thereof, and the C-terminus of the third glycine is linked to a second amino acid having a side chain containing a guanidine group or a protonated form thereof. Forms peptide bonds.

cCPP는 아스파라긴, 아스파르트산, 글루타민, 글루탐산, 또는 호모글루타민의 잔기를 포함할 수 있다. cCPP는 아스파라긴의 잔기를 포함할 수 있다. cCPP는 글루타민의 잔기를 포함할 수 있다.cCPP may include the residues of asparagine, aspartic acid, glutamine, glutamic acid, or homoglutamine. cCPP may contain a residue of asparagine. cCPP may contain residues of glutamine.

cCPP는 티로신, 페닐알라닌, 1-나프틸알라닌, 2-나프틸알라닌, 트립토판, 3-벤조티에닐알라닌, 4-페닐페닐알라닌, 3,4-디플루오로페닐알라닌, 4-트리플루오로메틸페닐알라닌, 2,3,4,5,6-펜타플루오로페닐알라닌, 호모페닐알라닌, β-호모페닐알라닌, 4-터트-부틸-페닐알라닌, 4-피리디닐알라닌, 3-피리디닐알라닌, 4-메틸페닐알라닌, 4-플루오로페닐알라닌, 4-클로로페닐알라닌, 3-(9-안트릴)-알라닌의 잔기를 포함할 수 있다. cCPP contains tyrosine, phenylalanine, 1-naphthylalanine, 2-naphthylalanine, tryptophan, 3-benzothienylalanine, 4-phenylphenylalanine, 3,4-difluorophenylalanine, 4-trifluoromethylphenylalanine, 2 ,3,4,5,6-pentafluorophenylalanine, homophenylalanine, β-homophenylalanine, 4-tert-butyl-phenylalanine, 4-pyridinylalanine, 3-pyridinylalanine, 4-methylphenylalanine, 4-fluoro It may include residues of lophenylalanine, 4-chlorophenylalanine, and 3-(9-anthryl)-alanine.

이론에 구속되고자 하는 것은 아니지만, cCPP 내의 아미노산의 키랄성은 세포액 흡수 효율에 영향을 미칠 수 있는 것으로 여겨진다. cCPP는 적어도 하나의 D 아미노산을 포함할 수 있다. cCPP는 1 내지 15개의 D 아미노산을 포함할 수 있다. cCPP는 1 내지 10개의 D 아미노산을 포함할 수 있다. cCPP는 1, 2, 3, 또는 4개의 D 아미노산을 포함할 수 있다. cCPP는 D 및 L 키랄성이 교번하는 2, 3, 4, 5, 6, 7, 또는 8개의 연속 아미노산을 포함할 수 있다. cCPP는 동일한 키랄성을 갖는 3개의 연속 아미노산을 포함할 수 있다. cCPP는 동일한 키랄성을 갖는 2개의 연속 아미노산을 포함할 수 있다. 아미노산 중 적어도 2개는 반대 키랄성을 가질 수 있다. 반대 키랄성을 갖는 적어도 2개의 아미노산은 서로 인접할 수 있다. 적어도 3개의 아미노산은 서로에 대해 교번하는 입체화학을 가질 수 있다. 서로에 대해 교번하는 키랄성을 갖는 적어도 3개의 아미노산은 서로 인접할 수 있다. 적어도 4개의 아미노산은 서로에 대해 교번하는 입체화학을 갖는다. 서로에 대해 교번하는 키랄성을 갖는 적어도 4개의 아미노산은 서로 인접할 수 있다. 아미노산 중 적어도 2개는 동일한 키랄성을 가질 수 있다. 동일한 키랄성을 갖는 적어도 2개의 아미노산은 서로 인접할 수 있다. 적어도 2개의 아미노산은 동일한 키랄성을 갖고, 적어도 2개의 아미노산은 반대 키랄성을 갖는다. 반대 키랄성을 갖는 적어도 2개의 아미노산이 동일한 키랄성을 갖는 적어도 2개의 아미노산에 인접할 수 있다. 따라서, cCPP 내의 인접 아미노산은 다음 서열 중 어느 하나를 가질 수 있다: D-L; L-D; D-L-L-D; L-D-D-L; L-D-L-L-D; D-L-D-D-L; D-L-L-D-L; 또는 L-D-D-L-D. cCPP를 형성하는 아미노산 잔기는 모두 L-아미노산일 수 있다. cCPP를 형성하는 아미노산 잔기는 모두 D-아미노산일 수 있다.Without wishing to be bound by theory, it is believed that the chirality of the amino acids in cCPP may affect cytosolic uptake efficiency. cCPP may contain at least one D amino acid. cCPP may contain 1 to 15 D amino acids. cCPP may contain 1 to 10 D amino acids. cCPP may contain 1, 2, 3, or 4 D amino acids. cCPP may comprise 2, 3, 4, 5, 6, 7, or 8 consecutive amino acids of alternating D and L chirality. cCPP may contain three consecutive amino acids with the same chirality. cCPP may contain two consecutive amino acids with the same chirality. At least two of the amino acids may have opposite chirality. At least two amino acids with opposite chirality may be adjacent to each other. At least three amino acids can have alternating stereochemistry with respect to each other. At least three amino acids with alternating chirality with respect to each other may be adjacent to each other. At least four amino acids have alternating stereochemistry with respect to each other. At least four amino acids with alternating chirality with respect to each other may be adjacent to each other. At least two of the amino acids may have the same chirality. At least two amino acids with the same chirality may be adjacent to each other. At least two amino acids have identical chirality and at least two amino acids have opposite chirality. At least two amino acids with opposite chirality may be adjacent to at least two amino acids with the same chirality. Accordingly, contiguous amino acids within cCPP can have any of the following sequences: D-L; L-D; D-L-L-D; L-D-D-L; L-D-L-L-D; D-L-D-D-L; D-L-L-D-L; Or L-D-D-L-D. The amino acid residues that form cCPP may all be L-amino acids. The amino acid residues that form cCPP may all be D-amino acids.

아미노산 중 적어도 2개는 상이한 키랄성을 가질 수 있다. 상이한 키랄성을 갖는 적어도 2개의 아미노산은 서로 인접할 수 있다. 적어도 3개의 아미노산은 인접한 아미노산에 비해 상이한 키랄성을 가질 수 있다. 적어도 4개의 아미노산은 인접한 아미노산에 비해 상이한 키랄성을 가질 수 있다. 적어도 2개의 아미노산은 동일한 키랄성을 갖고, 적어도 2개의 아미노산은 상이한 키랄성을 갖는다. cCPP를 형성하는 하나 이상의 아미노산 잔기는 아키랄(achiral)일 수 있다. cCPP는 3, 4, 또는 5개의 아미노산의 모티프를 포함할 수 있으며, 여기서 동일한 키랄성을 갖는 2개의 아미노산은 아키랄 아미노산에 의해 분리될 수 있다. cCPP는 다음 서열을 포함할 수 있다: D-X-D; D-X-D-X; D-X-D-X-D; L-X-L; L-X-L-X; 또는 L-X-L-X-L (여기서 X는 아키랄 아미노산임). 아키랄 아미노산은 글리신일 수 있다.At least two of the amino acids may have different chiralities. At least two amino acids with different chirality may be adjacent to each other. At least three amino acids may have different chirality compared to adjacent amino acids. At least four amino acids may have different chirality compared to adjacent amino acids. At least two amino acids have the same chirality and at least two amino acids have different chirality. One or more amino acid residues forming cCPP may be achiral. cCPP may contain a motif of 3, 4, or 5 amino acids, where two amino acids with the same chirality can be separated by an achiral amino acid. cCPP may comprise the following sequences: D-X-D; D-X-D-X; D-X-D-X-D; L-X-L; L-X-L-X; or L-X-L-X-L, where X is an achiral amino acid. The achiral amino acid may be glycine.

, , 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 아미노산은 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 갖는 아미노산에 인접할 수 있다. , , 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 아미노산은 구아니딘 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 적어도 하나의 아미노산에 인접할 수 있다. 구아니딘 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 아미노산은 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 갖는 아미노산에 인접할 수 있다. , , 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 2개의 아미노산은 서로 인접할 수 있다. 구아니딘 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 2개의 아미노산은 서로 인접한다. cCPP는 방향족 또는 헤테로방향족 기를 포함할 수 있는 측쇄를 갖는 적어도 2개의 연속 아미노산; 및 , , 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 적어도 2개의 인접하지 않은 아미노산을 포함할 수 있다. cCPP는 방향족 또는 헤테로방향족 기를 포함하는 측쇄를 갖는 적어도 2개의 연속 아미노산; 및 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 적어도 2개의 인접하지 않은 아미노산을 포함할 수 있다. 인접한 아미노산은 동일한 키랄성을 가질 수 있다. 인접한 아미노산은 반대 키랄성을 가질 수 있다. 아미노산의 다른 조합은 D 및 L 아미노산의 임의의 배열, 예를 들어 이전 단락에 기술된 서열 중 어느 하나를 가질 수 있다. , , Alternatively, an amino acid with a side chain comprising a protonated form thereof may be adjacent to an amino acid with a side chain comprising an aromatic or heteroaromatic group. , , Alternatively, the amino acid having a side chain comprising guanidine or a protonated form thereof may be adjacent to at least one amino acid having a side chain comprising guanidine or a protonated form thereof. An amino acid with a side chain comprising guanidine or a protonated form thereof may be adjacent to an amino acid with a side chain comprising an aromatic or heteroaromatic group. , , Alternatively, two amino acids with side chains comprising protonated forms thereof may be adjacent to each other. Two amino acids with side chains comprising guanidine or a protonated form thereof are adjacent to each other. cCPP is at least two consecutive amino acids with side chains that may include aromatic or heteroaromatic groups; and , , or at least two non-contiguous amino acids with side chains comprising a protonated form thereof. cCPP is at least two consecutive amino acids with side chains containing aromatic or heteroaromatic groups; and or at least two non-contiguous amino acids with side chains comprising a protonated form thereof. Adjacent amino acids may have the same chirality. Adjacent amino acids may have opposite chiralities. Other combinations of amino acids can have any arrangement of D and L amino acids, for example any of the sequences described in the previous paragraph.

, , 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 적어도 2개의 아미노산은 구아니딘기 또는 이의 양성자화된 형태를 포함하는 측쇄를 갖는 적어도 2개의 아미노산과 교번한다. , , or at least two amino acids having side chains comprising a guanidine group or a protonated form thereof alternate with at least two amino acids having side chains comprising a guanidine group or a protonated form thereof.

cCPP는 식 (A)의 구조:cCPP has the structure of equation (A):

(A) (A)

또는 이의 양성자화된 형태를 포함할 수 있으며,or a protonated form thereof,

식 중:During the ceremony:

R1, R2, 및 R3은 각각 독립적으로 H이거나 아미노산의 방향족 또는 헤테로방향족 측쇄이고;R 1 , R 2 , and R 3 are each independently H or an aromatic or heteroaromatic side chain of an amino acid;

R1, R2, 및 R3 중 적어도 하나는 아미노산의 방향족 또는 헤테로방향족 측쇄이고;At least one of R 1 , R 2 , and R 3 is an aromatic or heteroaromatic side chain of an amino acid;

R4, R5, R6, 및 R7은 독립적으로 H이거나 아미노산 측쇄이고;R 4 , R 5 , R 6 , and R 7 are independently H or an amino acid side chain;

R4, R5, R6, R7 중 적어도 하나는 3-구아니디노-2-아미노프로피온산, 4-구아니디노-2-아미노부탄산, 아르기닌, 호모아르기닌, N-메틸아르기닌, N,N-디메틸아르기닌, 2,3-디아미노프로피온산, 2,4-디아미노부탄산, 리신, N-메틸리신, N,N-디메틸리신, N-에틸리신, N,N,N-트리메틸리신, 4-구아니디노페닐알라닌, 시트룰린, N,N-디메틸리신, β-호모아르기닌, 3-(1-피페리디닐)알라닌의 측쇄이고;At least one of R 4 , R 5 , R 6 , R 7 is 3-guanidino-2-aminopropionic acid, 4-guanidino-2-aminobutanoic acid, arginine, homoarginine, N-methylarginine, N, N-dimethylarginine, 2,3-diaminopropionic acid, 2,4-diaminobutanoic acid, lysine, N-methyllysine, N,N-dimethyllysine, N-ethylysine, N,N,N-trimethyllysine, It is the side chain of 4-guanidinophenylalanine, citrulline, N,N-dimethyllysine, β-homoarginine, and 3-(1-piperidinyl)alanine;

AASC는 아미노산 측쇄이고;AA SC is the amino acid side chain;

q는 1, 2, 3, 또는 4이다.q is 1, 2, 3, or 4.

구현예에서, R4, R5, R6, 및 R7 중 적어도 하나는 독립적으로 아미노산의 하전되지 않은 비방향족 측쇄이다. 구현예에서, R4, R5, R6, 및 R7 중 적어도 하나는 독립적으로 H이거나 시트룰린의 측쇄이다.In embodiments, at least one of R 4 , R 5 , R 6 , and R 7 is independently an uncharged, non-aromatic side chain of an amino acid. In embodiments, at least one of R 4 , R 5 , R 6 , and R 7 is independently H or a side chain of citrulline.

구현예에서, 6 내지 12개의 아미노산을 갖는 환형 펩티드를 포함하는 화합물이 제공되며, 여기서 환형 펩티드의 적어도 2개의 아미노산은 하전된 아미노산이고, 환형 펩티드의 적어도 2개의 아미노산은 방향족 소수성 아미노산이고, 환형 펩티드의 적어도 2개의 아미노산은 하전되지 않은 비방향족 아미노산이다. 구현예에서, 환형 펩티드의 적어도 2개의 하전된 아미노산은 아르기닌이다. 구현예에서, 환형 펩티드의 적어도 2개의 방향족 소수성 아미노산은 페닐알라닌 또는 나프틸알라닌이다. 구현예에서, 환형 펩티드의 적어도 2개의 하전되지 않은 비방향족 아미노산은 시트룰린 또는 글리신이다.In an embodiment, provided is a compound comprising a cyclic peptide having 6 to 12 amino acids, wherein at least 2 amino acids of the cyclic peptide are charged amino acids, at least 2 amino acids of the cyclic peptide are aromatic hydrophobic amino acids, and wherein the cyclic peptide At least two amino acids are uncharged, non-aromatic amino acids. In an embodiment, at least two charged amino acids of the cyclic peptide are arginine. In an embodiment, the at least two aromatic hydrophobic amino acids of the cyclic peptide are phenylalanine or naphthylalanine. In an embodiment, the at least two uncharged non-aromatic amino acids of the cyclic peptide are citrulline or glycine.

구현예에서, 식 (A)의 환형 펩티드는 서열번호 89~117의 서열을 갖는 환형 펩티드로부터 선택되지 않는다. In an embodiment, the cyclic peptide of formula (A) is not selected from cyclic peptides having the sequence of SEQ ID NOs: 89-117.

구현예에서, 식 (A)의 환형 펩티드는 서열번호 89~117의 서열을 갖는 환형 펩티드로부터 선택된다. In an embodiment, the cyclic peptide of formula (A) is selected from cyclic peptides having the sequence of SEQ ID NOs: 89-117.

cCPP는 식 (I)의 구조:cCPP has the structure of formula (I):

(I) (I)

또는 이의 양성자화된 형태를 포함할 수 있으며,or a protonated form thereof,

식 중:During the ceremony:

R1, R2, 및 R3은 각각 독립적으로 H이거나 방향족기를 포함하는 측쇄를 갖는 아미노산 잔기일 수 있고;R 1 , R 2 , and R 3 may each independently be H or an amino acid residue having a side chain containing an aromatic group;

R1, R2, 및 R3 중 적어도 하나는 아미노산의 방향족 또는 헤테로방향족 측쇄이고;At least one of R 1 , R 2 , and R 3 is an aromatic or heteroaromatic side chain of an amino acid;

R4 및 R7은 독립적으로 H이거나 아미노산 측쇄이고;R 4 and R 7 are independently H or an amino acid side chain;

AASC는 아미노산 측쇄이고;AA SC is the amino acid side chain;

q는 1, 2, 3, 또는 4이고;q is 1, 2, 3, or 4;

각각의 m은 독립적으로 0, 1, 2, 또는 3의 정수이다.Each m is independently an integer of 0, 1, 2, or 3.

R1, R2, 및 R3은 각각 독립적으로 H, -알킬렌-아릴, 또는 -알킬렌-헤테로아릴일 수 있다. R1, R2, 및 R3은 각각 독립적으로 H, -C1-3알킬렌-아릴, 또는 -C1-3알킬렌-헤테로아릴일 수 있다. R1, R2, 및 R3은 각각 독립적으로 H 또는 -알킬렌-아릴일 수 있다. R1, R2, 및 R3은 각각 독립적으로 H 또는 -C1-3알킬렌-아릴일 수 있다. C1-3알킬렌은 메틸렌일 수 있다. 아릴은 6원 내지 14원 아릴일 수 있다. 헤테로아릴은 N, O, 및 S로부터 선택된 하나 이상의 헤테로원자를 갖는 6원 내지 14원 헤테로아릴일 수 있다. 아릴은 페닐, 나프틸, 또는 안트라세닐로부터 선택될 수 있다. 아릴은 페닐 또는 나프틸일 수 있다. 아릴은 페닐일 수 있다. 헤테로아릴은 피리딜, 퀴놀릴, 및 이소퀴놀릴일 수 있다. R1, R2, 및 R3은 각각 독립적으로 H, -C1-3알킬렌-Ph, 또는 -C1-3알킬렌-나프틸일 수 있다. R1, R2, 및 R3은 각각 독립적으로 H, -CH2Ph, 또는 -CH2나프틸일 수 있다. R1, R2, 및 R3은 각각 독립적으로 H 또는 -CH2Ph일 수 있다.R 1 , R 2 , and R 3 may each independently be H, -alkylene-aryl, or -alkylene-heteroaryl. R 1 , R 2 , and R 3 may each independently be H, -C 1-3 alkylene-aryl, or -C 1-3 alkylene-heteroaryl. R 1 , R 2 , and R 3 may each independently be H or -alkylene-aryl. R 1 , R 2 , and R 3 may each independently be H or -C 1-3 alkylene-aryl. C 1-3 alkylene may be methylene. Aryl may be a 6-membered to 14-membered aryl. Heteroaryl may be a 6- to 14-membered heteroaryl having one or more heteroatoms selected from N, O, and S. Aryl may be selected from phenyl, naphthyl, or anthracenyl. Aryl can be phenyl or naphthyl. Aryl may be phenyl. Heteroaryl can be pyridyl, quinolyl, and isoquinolyl. R 1 , R 2 , and R 3 may each independently be H, -C 1-3 alkylene-Ph, or -C 1-3 alkylene-naphthyl. R 1 , R 2 , and R 3 may each independently be H, -CH 2 Ph, or -CH 2 naphthyl. R 1 , R 2 , and R 3 may each independently be H or -CH 2 Ph.

R1, R2, 및 R3은 각각 독립적으로 티로신, 페닐알라닌, 1-나프틸알라닌, 2-나프틸알라닌, 트립토판, 3-벤조티에닐알라닌, 4-페닐페닐알라닌, 3,4-디플루오로페닐알라닌, 4-트리플루오로메틸페닐알라닌, 2,3,4,5,6-펜타플루오로페닐알라닌, 호모페닐알라닌, β-호모페닐알라닌, 4-터트-부틸-페닐알라닌, 4-피리디닐알라닌, 3-피리디닐알라닌, 4-메틸페닐알라닌, 4-플루오로페닐알라닌, 4-클로로페닐알라닌, 3-(9-안트릴)-알라닌의 측쇄일 수 있다. R 1 , R 2 , and R 3 are each independently tyrosine, phenylalanine, 1-naphthylalanine, 2-naphthylalanine, tryptophan, 3-benzothienylalanine, 4-phenylphenylalanine, 3,4-difluoro Phenylalanine, 4-trifluoromethylphenylalanine, 2,3,4,5,6-pentafluorophenylalanine, homophenylalanine, β-homophenylalanine, 4-tert-butyl-phenylalanine, 4-pyridinylalanine, 3-pyridine. It may be the side chain of dinylalanine, 4-methylphenylalanine, 4-fluorophenylalanine, 4-chlorophenylalanine, or 3-(9-anthryl)-alanine.

R1은 티로신의 측쇄일 수 있다. R1은 페닐알라닌의 측쇄일 수 있다. R1은 1-나프틸알라닌의 측쇄일 수 있다. R1은 2-나프틸알라닌의 측쇄일 수 있다. R1은 트립토판의 측쇄일 수 있다. R1은 3-벤조티에닐알라닌의 측쇄일 수 있다. R1은 4-페닐페닐알라닌의 측쇄일 수 있다. R1은 3,4-디플루오로페닐알라닌의 측쇄일 수 있다. R1은 4-트리플루오로메틸페닐알라닌의 측쇄일 수 있다. R1은 2,3,4,5,6-펜타플루오로페닐알라닌의 측쇄일 수 있다. R1은 호모페닐알라닌의 측쇄일 수 있다. R1은 β-호모페닐알라닌의 측쇄일 수 있다. R1은 4-터트-부틸-페닐알라닌의 측쇄일 수 있다. R1은 4-피리디닐알라닌의 측쇄일 수 있다. R1은 3-피리디닐알라닌의 측쇄일 수 있다. R1은 4-메틸페닐알라닌의 측쇄일 수 있다. R1은 4-플루오로페닐알라닌의 측쇄일 수 있다. R1은 4-클로로페닐알라닌의 측쇄일 수 있다. R1은 3-(9-안트릴)-알라닌의 측쇄일 수 있다.R 1 may be the side chain of tyrosine. R 1 may be the side chain of phenylalanine. R 1 may be the side chain of 1-naphthylalanine. R 1 may be the side chain of 2-naphthylalanine. R 1 may be a side chain of tryptophan. R 1 may be the side chain of 3-benzothienylalanine. R 1 may be the side chain of 4-phenylphenylalanine. R 1 may be the side chain of 3,4-difluorophenylalanine. R 1 may be the side chain of 4-trifluoromethylphenylalanine. R 1 may be the side chain of 2,3,4,5,6-pentafluorophenylalanine. R 1 may be the side chain of homophenylalanine. R 1 may be the side chain of β-homophenylalanine. R 1 may be the side chain of 4-tert-butyl-phenylalanine. R 1 may be the side chain of 4-pyridinylalanine. R 1 may be the side chain of 3-pyridinylalanine. R 1 may be the side chain of 4-methylphenylalanine. R 1 may be the side chain of 4-fluorophenylalanine. R 1 may be the side chain of 4-chlorophenylalanine. R 1 may be the side chain of 3-(9-anthryl)-alanine.

R2는 티로신의 측쇄일 수 있다. R2는 페닐알라닌의 측쇄일 수 있다. R2는 1-나프틸알라닌의 측쇄일 수 있다. R1은 2-나프틸알라닌의 측쇄일 수 있다. R2는 트립토판의 측쇄일 수 있다. R2는 3-벤조티에닐알라닌의 측쇄일 수 있다. R2는 4-페닐페닐알라닌의 측쇄일 수 있다. R2는 3,4-디플루오로페닐알라닌의 측쇄일 수 있다. R2는 4-트리플루오로메틸페닐알라닌의 측쇄일 수 있다. R2는 2,3,4,5,6-펜타플루오로페닐알라닌의 측쇄일 수 있다. R2는 호모페닐알라닌의 측쇄일 수 있다. R2는 β-호모페닐알라닌의 측쇄일 수 있다. R2는 4-터트-부틸-페닐알라닌의 측쇄일 수 있다. R2는 4-피리디닐알라닌의 측쇄일 수 있다. R2는 3-피리디닐알라닌의 측쇄일 수 있다. R2는 4-메틸페닐알라닌의 측쇄일 수 있다. R2는 4-플루오로페닐알라닌의 측쇄일 수 있다. R2는 4-클로로페닐알라닌의 측쇄일 수 있다. R2는 3-(9-안트릴)-알라닌의 측쇄일 수 있다.R 2 may be the side chain of tyrosine. R 2 may be the side chain of phenylalanine. R 2 may be the side chain of 1-naphthylalanine. R 1 may be the side chain of 2-naphthylalanine. R 2 may be a side chain of tryptophan. R 2 may be the side chain of 3-benzothienylalanine. R 2 may be the side chain of 4-phenylphenylalanine. R 2 may be the side chain of 3,4-difluorophenylalanine. R 2 may be the side chain of 4-trifluoromethylphenylalanine. R 2 may be the side chain of 2,3,4,5,6-pentafluorophenylalanine. R 2 may be the side chain of homophenylalanine. R 2 may be the side chain of β-homophenylalanine. R 2 may be the side chain of 4-tert-butyl-phenylalanine. R 2 may be the side chain of 4-pyridinylalanine. R 2 may be the side chain of 3-pyridinylalanine. R 2 may be the side chain of 4-methylphenylalanine. R 2 may be the side chain of 4-fluorophenylalanine. R 2 may be the side chain of 4-chlorophenylalanine. R 2 may be the side chain of 3-(9-anthryl)-alanine.

R3은 티로신의 측쇄일 수 있다. R3은 페닐알라닌의 측쇄일 수 있다. R3은 1-나프틸알라닌의 측쇄일 수 있다. R3은 2-나프틸알라닌의 측쇄일 수 있다. R3은 트립토판의 측쇄일 수 있다. R3은 3-벤조티에닐알라닌의 측쇄일 수 있다. R3은 4-페닐페닐알라닌의 측쇄일 수 있다. R3은 3,4-디플루오로페닐알라닌의 측쇄일 수 있다. R3은 4-트리플루오로메틸페닐알라닌의 측쇄일 수 있다. R3은 2,3,4,5,6-펜타플루오로페닐알라닌의 측쇄일 수 있다. R3은 호모페닐알라닌의 측쇄일 수 있다. R3은 β-호모페닐알라닌의 측쇄일 수 있다. R3은 4-터트-부틸-페닐알라닌의 측쇄일 수 있다. R3은 4-피리디닐알라닌의 측쇄일 수 있다. R3은 3-피리디닐알라닌의 측쇄일 수 있다. R3은 4-메틸페닐알라닌의 측쇄일 수 있다. R3은 4-플루오로페닐알라닌의 측쇄일 수 있다. R3은 4-클로로페닐알라닌의 측쇄일 수 있다. R3은 3-(9-안트릴)-알라닌의 측쇄일 수 있다.R 3 may be the side chain of tyrosine. R 3 may be the side chain of phenylalanine. R 3 may be the side chain of 1-naphthylalanine. R 3 may be the side chain of 2-naphthylalanine. R 3 may be a side chain of tryptophan. R 3 may be the side chain of 3-benzothienylalanine. R 3 may be the side chain of 4-phenylphenylalanine. R 3 may be the side chain of 3,4-difluorophenylalanine. R 3 may be the side chain of 4-trifluoromethylphenylalanine. R 3 may be the side chain of 2,3,4,5,6-pentafluorophenylalanine. R 3 may be the side chain of homophenylalanine. R 3 may be the side chain of β-homophenylalanine. R 3 may be the side chain of 4-tert-butyl-phenylalanine. R 3 may be the side chain of 4-pyridinylalanine. R 3 may be the side chain of 3-pyridinylalanine. R 3 may be the side chain of 4-methylphenylalanine. R 3 may be the side chain of 4-fluorophenylalanine. R 3 may be the side chain of 4-chlorophenylalanine. R 3 may be the side chain of 3-(9-anthryl)-alanine.

R4는 H, -알킬렌-아릴, -알킬렌-헤테로아릴일 수 있다. R4는 H, -C1-3알킬렌-아릴, 또는 -C1-3알킬렌-헤테로아릴일 수 있다. R4는 H 또는 -알킬렌-아릴일 수 있다. R4는 H 또는 -C1-3알킬렌-아릴일 수 있다. C1-3알킬렌은 메틸렌일 수 있다. 아릴은 6원 내지 14원 아릴일 수 있다. 헤테로아릴은 N, O, 및 S로부터 선택된 하나 이상의 헤테로원자를 갖는 6원 내지 14원 헤테로아릴일 수 있다. 아릴은 페닐, 나프틸, 또는 안트라세닐로부터 선택될 수 있다. 아릴은 페닐 또는 나프틸일 수 있다. 아릴은 페닐일 수 있다. 헤테로아릴은 피리딜, 퀴놀릴, 및 이소퀴놀릴일 수 있다. R4는 H, -C1-3알킬렌-Ph, 또는 -C1-3알킬렌-나프틸일 수 있다. R4는 H이거나 표 4 또는 표 6의 아미노산의 측쇄일 수 있다. R4는 H이거나 방향족기를 포함하는 측쇄를 갖는 아미노산 잔기일 수 있다. R4는 H, -CH2Ph, 또는 -CH2나프틸일 수 있다. R4는 H 또는 -CH2Ph일 수 있다.R 4 may be H, -alkylene-aryl, -alkylene-heteroaryl. R 4 may be H, -C 1-3 alkylene-aryl, or -C 1-3 alkylene-heteroaryl. R 4 may be H or -alkylene-aryl. R 4 may be H or -C 1-3 alkylene-aryl. C 1-3 alkylene may be methylene. Aryl may be a 6-membered to 14-membered aryl. Heteroaryl may be a 6- to 14-membered heteroaryl having one or more heteroatoms selected from N, O, and S. Aryl may be selected from phenyl, naphthyl, or anthracenyl. Aryl can be phenyl or naphthyl. Aryl may be phenyl. Heteroaryl can be pyridyl, quinolyl, and isoquinolyl. R 4 may be H, -C 1-3 alkylene-Ph, or -C 1-3 alkylene-naphthyl. R 4 may be H or the side chain of an amino acid in Table 4 or Table 6 . R 4 may be H or an amino acid residue having a side chain containing an aromatic group. R 4 may be H, -CH 2 Ph, or -CH 2 naphthyl. R 4 may be H or -CH 2 Ph.

R5는 H, -알킬렌-아릴, -알킬렌-헤테로아릴일 수 있다. R5는 H, -C1-3알킬렌-아릴, 또는 -C1-3알킬렌-헤테로아릴일 수 있다. R5는 H 또는 -알킬렌-아릴일 수 있다. R5는 H 또는 -C1-3알킬렌-아릴일 수 있다. C1-3알킬렌은 메틸렌일 수 있다. 아릴은 6원 내지 14원 아릴일 수 있다. 헤테로아릴은 N, O, 및 S로부터 선택된 하나 이상의 헤테로원자를 갖는 6원 내지 14원 헤테로아릴일 수 있다. 아릴은 페닐, 나프틸, 또는 안트라세닐로부터 선택될 수 있다. 아릴은 페닐 또는 나프틸일 수 있다. 아릴은 페닐일 수 있다. 헤테로아릴은 피리딜, 퀴놀릴, 및 이소퀴놀릴일 수 있다. R5는 H, -C1-3알킬렌-Ph, 또는 -C1-3알킬렌-나프틸일 수 있다. R5는 H이거나 표 4 또는 표 6의 아미노산의 측쇄일 수 있다. R4는 H이거나 방향족기를 포함하는 측쇄를 갖는 아미노산 잔기일 수 있다. R5는 H, -CH2Ph, 또는 -CH2나프틸일 수 있다. R4는 H 또는 -CH2Ph일 수 있다.R 5 may be H, -alkylene-aryl, -alkylene-heteroaryl. R 5 may be H, -C 1-3 alkylene-aryl, or -C 1-3 alkylene-heteroaryl. R 5 may be H or -alkylene-aryl. R 5 may be H or -C 1-3 alkylene-aryl. C 1-3 alkylene may be methylene. Aryl may be a 6-membered to 14-membered aryl. Heteroaryl may be a 6- to 14-membered heteroaryl having one or more heteroatoms selected from N, O, and S. Aryl may be selected from phenyl, naphthyl, or anthracenyl. Aryl can be phenyl or naphthyl. Aryl may be phenyl. Heteroaryl can be pyridyl, quinolyl, and isoquinolyl. R 5 may be H, -C 1-3 alkylene-Ph, or -C 1-3 alkylene-naphthyl. R 5 may be H or the side chain of an amino acid in Table 4 or Table 6 . R 4 may be H or an amino acid residue having a side chain containing an aromatic group. R 5 may be H, -CH 2 Ph, or -CH 2 naphthyl. R 4 may be H or -CH 2 Ph.

R6은 H, -알킬렌-아릴, -알킬렌-헤테로아릴일 수 있다. R6은 H, -C1-3알킬렌-아릴, 또는 -C1-3알킬렌-헤테로아릴일 수 있다. R6은 H 또는 -알킬렌-아릴일 수 있다. R6은 H 또는 -C1-3알킬렌-아릴일 수 있다. C1-3알킬렌은 메틸렌일 수 있다. 아릴은 6원 내지 14원 아릴일 수 있다. 헤테로아릴은 N, O, 및 S로부터 선택된 하나 이상의 헤테로원자를 갖는 6원 내지 14원 헤테로아릴일 수 있다. 아릴은 페닐, 나프틸, 또는 안트라세닐로부터 선택될 수 있다. 아릴은 페닐 또는 나프틸일 수 있다. 아릴은 페닐일 수 있다. 헤테로아릴은 피리딜, 퀴놀릴, 및 이소퀴놀릴일 수 있다. R6은 H, -C1-3알킬렌-Ph, 또는 -C1-3알킬렌-나프틸일 수 있다. R6은 H이거나 표 4 또는 표 6의 아미노산의 측쇄일 수 있다. R6은 H이거나 방향족기를 포함하는 측쇄를 갖는 아미노산 잔기일 수 있다. R6은 H, -CH2Ph, 또는 -CH2나프틸일 수 있다. R6은 H 또는 -CH2Ph일 수 있다.R 6 may be H, -alkylene-aryl, -alkylene-heteroaryl. R 6 may be H, -C 1-3 alkylene-aryl, or -C 1-3 alkylene-heteroaryl. R 6 may be H or -alkylene-aryl. R 6 may be H or -C 1-3 alkylene-aryl. C 1-3 alkylene may be methylene. Aryl may be a 6-membered to 14-membered aryl. Heteroaryl may be a 6- to 14-membered heteroaryl having one or more heteroatoms selected from N, O, and S. Aryl may be selected from phenyl, naphthyl, or anthracenyl. Aryl can be phenyl or naphthyl. Aryl may be phenyl. Heteroaryl can be pyridyl, quinolyl, and isoquinolyl. R 6 may be H, -C 1-3 alkylene-Ph, or -C 1-3 alkylene-naphthyl. R 6 may be H or the side chain of an amino acid in Table 4 or Table 6 . R 6 may be H or an amino acid residue having a side chain containing an aromatic group. R 6 may be H, -CH 2 Ph, or -CH 2 naphthyl. R 6 may be H or -CH 2 Ph.

R7은 H, -알킬렌-아릴, -알킬렌-헤테로아릴일 수 있다. R7은 H, -C1-3알킬렌-아릴, 또는 -C1-3알킬렌-헤테로아릴일 수 있다. R7은 H 또는 -알킬렌-아릴일 수 있다. R7은 H 또는 -C1-3알킬렌-아릴일 수 있다. C1-3알킬렌은 메틸렌일 수 있다. 아릴은 6원 내지 14원 아릴일 수 있다. 헤테로아릴은 N, O, 및 S로부터 선택된 하나 이상의 헤테로원자를 갖는 6원 내지 14원 헤테로아릴일 수 있다. 아릴은 페닐, 나프틸, 또는 안트라세닐로부터 선택될 수 있다. 아릴은 페닐 또는 나프틸일 수 있다. 아릴은 페닐일 수 있다. 헤테로아릴은 피리딜, 퀴놀릴, 및 이소퀴놀릴일 수 있다. R7은 H, -C1-3알킬렌-Ph, 또는 -C1-3알킬렌-나프틸일 수 있다. R7은 H이거나 표 4 또는 표 6의 아미노산의 측쇄일 수 있다. R7은 H이거나 방향족기를 포함하는 측쇄를 갖는 아미노산 잔기일 수 있다. R7은 H, -CH2Ph, 또는 -CH2나프틸일 수 있다. R7은 H 또는 -CH2Ph일 수 있다.R 7 may be H, -alkylene-aryl, -alkylene-heteroaryl. R 7 may be H, -C 1-3 alkylene-aryl, or -C 1-3 alkylene-heteroaryl. R 7 may be H or -alkylene-aryl. R 7 may be H or -C 1-3 alkylene-aryl. C 1-3 alkylene may be methylene. Aryl may be a 6-membered to 14-membered aryl. Heteroaryl may be a 6- to 14-membered heteroaryl having one or more heteroatoms selected from N, O, and S. Aryl may be selected from phenyl, naphthyl, or anthracenyl. Aryl can be phenyl or naphthyl. Aryl may be phenyl. Heteroaryl can be pyridyl, quinolyl, and isoquinolyl. R 7 may be H, -C 1-3 alkylene-Ph, or -C 1-3 alkylene-naphthyl. R 7 may be H or the side chain of an amino acid in Table 4 or Table 6 . R 7 may be H or an amino acid residue having a side chain containing an aromatic group. R 7 may be H, -CH 2 Ph, or -CH 2 naphthyl. R 7 may be H or -CH 2 Ph.

R1, R2, R3, R4, R5, R6, 및 R7 중 1, 2, 또는 3개는 -CH2Ph일 수 있다. R1, R2, R3, R4, R5, R6, 및 R7 중 1개는 -CH2Ph일 수 있다. R1, R2, R3, R4, R5, R6, 및 R7 중 2개는 -CH2Ph일 수 있다. R1, R2, R3, R4, R5, R6, 및 R7 중 3개는 -CH2Ph일 수 있다. R1, R2, R3, R4, R5, R6, 및 R7 중 적어도 1개는 -CH2Ph일 수 있다. R1, R2, R3, R4, R5, R6, 및 R7 중 4개 이하는 -CH2Ph일 수 있다. 1 , 2, or 3 of R 1 , R 2 , R 3 , R 4 , R 5 , R 6 , and R 7 may be -CH 2 Ph. One of R 1 , R 2 , R 3 , R 4 , R 5 , R 6 , and R 7 may be -CH 2 Ph. Two of R 1 , R 2 , R 3 , R 4 , R 5 , R 6 , and R 7 may be -CH 2 Ph. Three of R 1 , R 2 , R 3 , R 4 , R 5 , R 6 , and R 7 may be -CH 2 Ph. At least one of R 1 , R 2 , R 3 , R 4 , R 5 , R 6 , and R 7 may be -CH 2 Ph. Four or less of R 1 , R 2 , R 3 , R 4 , R 5 , R 6 , and R 7 may be -CH 2 Ph.

R1, R2, R3, 및 R4 중 1, 2, 또는 3개는 -CH2Ph이다. R1, R2, R3, 및 R4 중 1개는 -CH2Ph이다. R1, R2, R3, 및 R4 중 2개는 -CH2Ph이다. R1, R2, R3, 및 R4 중 3개는 -CH2Ph이다. R1, R2, R3, 및 R4 중 적어도 1개는 -CH2Ph이다.1, 2 , or 3 of R1, R 2 , R 3 , and R 4 are -CH 2 Ph. One of R 1 , R 2 , R 3 , and R 4 is -CH 2 Ph. Two of R1, R 2 , R 3 , and R 4 are -CH 2 Ph. Three of R1, R 2 , R 3 , and R 4 are -CH 2 Ph. At least one of R 1 , R 2 , R 3 , and R 4 is -CH 2 Ph.

R1, R2, R3, R4, R5, R6, 및 R7 중 1, 2, 또는 3개는 H일 수 있다. R1, R2, R3, R4, R5, R6, 및 R7 중 1개는 H일 수 있다. R1, R2, R3, R4, R5, R6, 및 R7 중 2개는 H이다. R1, R2, R3, R4, R5, R6, 및 R7 중 3개는 H일 수 있다. R1, R2, R3, R4, R5, R6, 및 R7 중 적어도 1개는 H일 수 있다. R1, R2, R3, R4, R5, R6, 및 R7 중 3개 이하는 -CH2Ph일 수 있다. 1 , 2 , or 3 of R 1 , R 2 , R 3 , R 4 , R 5 , R 6 , and R 7 may be H. One of R 1 , R 2 , R 3 , R 4 , R 5 , R 6 , and R 7 may be H. Two of R 1 , R 2 , R 3 , R 4 , R 5 , R 6 , and R 7 are H. Three of R 1 , R 2 , R 3 , R 4 , R 5 , R 6 , and R 7 may be H. At least one of R 1 , R 2 , R 3 , R 4 , R 5 , R 6 , and R 7 may be H. Three or less of R 1 , R 2 , R 3 , R 4 , R 5 , R 6 , and R 7 may be -CH 2 Ph.

R1, R2, R3, 및 R4 중 1, 2, 또는 3개는 H이다. R1, R2, R3, 및 R4 중 1개는 H이다. R1, R2, R3, 및 R4 중 2개는 H이다. R1, R2, R3, 및 R4 중 3개는 H이다. R1, R2, R3, 및 R4 중 적어도 1개는 H이다. 1 , 2 , or 3 of R 1 , R 2 , R 3 , and R 4 are H. One of R 1 , R 2 , R 3 , and R 4 is H. Two of R 1 , R 2 , R 3 , and R 4 are H. Three of R 1 , R 2 , R 3 , and R 4 are H. At least one of R 1 , R 2 , R 3 , and R 4 is H.

R4, R5, R6, 및 R7 중 적어도 하나는 3-구아니디노-2-아미노프로피온산의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 하나는 4-구아니디노-2-아미노부탄산의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 하나는 아르기닌의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 하나는 호모아르기닌의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 하나는 N-메틸아르기닌의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 하나는 N,N-디메틸아르기닌의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 하나는 2,3-디아미노프로피온산의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 하나는 2,4-디아미노부탄산, 리신의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 하나는 N-메틸리신의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 하나는 N,N-디메틸리신의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 하나는 N-에틸리신의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 하나는 N,N,N-트리메틸리신, 4-구아니디노페닐알라닌의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 하나는 시트룰린의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 하나는 N,N-디메틸리신, β-호모아르기닌의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 하나는 3-(1-피페리디닐)알라닌의 측쇄일 수 있다.At least one of R 4 , R 5 , R 6 , and R 7 may be a side chain of 3-guanidino-2-aminopropionic acid. At least one of R 4 , R 5 , R 6 , and R 7 may be a side chain of 4-guanidino-2-aminobutanoic acid. At least one of R 4 , R 5 , R 6 , and R 7 may be the side chain of arginine. At least one of R 4 , R 5 , R 6 , and R 7 may be a side chain of homoarginine. At least one of R 4 , R 5 , R 6 , and R 7 may be a side chain of N-methylarginine. At least one of R 4 , R 5 , R 6 , and R 7 may be a side chain of N,N-dimethylarginine. At least one of R 4 , R 5 , R 6 , and R 7 may be a side chain of 2,3-diaminopropionic acid. At least one of R 4 , R 5 , R 6 , and R 7 may be the side chain of 2,4-diaminobutanoic acid or lysine. At least one of R 4 , R 5 , R 6 , and R 7 may be a side chain of N-methyllysine. At least one of R 4 , R 5 , R 6 , and R 7 may be a side chain of N,N-dimethyllysine. At least one of R 4 , R 5 , R 6 , and R 7 may be a side chain of N-ethylysine. At least one of R 4 , R 5 , R 6 , and R 7 may be the side chain of N,N,N-trimethyllysine or 4-guanidinophenylalanine. At least one of R 4 , R 5 , R 6 , and R 7 may be a side chain of citrulline. At least one of R 4 , R 5 , R 6 , and R 7 may be the side chain of N,N-dimethyllysine or β-homoarginine. At least one of R 4 , R 5 , R 6 , and R 7 may be a side chain of 3-(1-piperidinyl)alanine.

R4, R5, R6, 및 R7 중 적어도 2개는 3-구아니디노-2-아미노프로피온산의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 2개는 4-구아니디노-2-아미노부탄산의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 2개는 아르기닌의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 2개는 호모아르기닌의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 2개는 N-메틸아르기닌의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 2개는 N,N-디메틸아르기닌의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 2개는 2,3-디아미노프로피온산의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 2개는 2,4-디아미노부탄산, 리신의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 2개는 N-메틸리신의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 2개는 N,N-디메틸리신의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 2개는 N-에틸리신의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 2개는 N,N,N-트리메틸리신, 4-구아니디노페닐알라닌의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 2개는 시트룰린의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 2개는 N,N-디메틸리신, β-호모아르기닌의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 2개는 3-(1-피페리디닐)알라닌의 측쇄일 수 있다.At least two of R 4 , R 5 , R 6 , and R 7 may be side chains of 3-guanidino-2-aminopropionic acid. At least two of R 4 , R 5 , R 6 , and R 7 may be side chains of 4-guanidino-2-aminobutanoic acid. At least two of R 4 , R 5 , R 6 , and R 7 may be side chains of arginine. At least two of R 4 , R 5 , R 6 , and R 7 may be side chains of homoarginine. At least two of R 4 , R 5 , R 6 , and R 7 may be side chains of N-methylarginine. At least two of R 4 , R 5 , R 6 , and R 7 may be side chains of N,N-dimethylarginine. At least two of R 4 , R 5 , R 6 , and R 7 may be side chains of 2,3-diaminopropionic acid. At least two of R 4 , R 5 , R 6 , and R 7 may be the side chain of 2,4-diaminobutanoic acid or lysine. At least two of R 4 , R 5 , R 6 , and R 7 may be side chains of N-methyllysine. At least two of R 4 , R 5 , R 6 , and R 7 may be side chains of N,N-dimethyllysine. At least two of R 4 , R 5 , R 6 , and R 7 may be side chains of N-ethylysine. At least two of R 4 , R 5 , R 6 , and R 7 may be side chains of N,N,N-trimethyllysine or 4-guanidinophenylalanine. At least two of R 4 , R 5 , R 6 , and R 7 may be side chains of citrulline. At least two of R 4 , R 5 , R 6 , and R 7 may be side chains of N,N-dimethyllysine or β-homoarginine. At least two of R 4 , R 5 , R 6 , and R 7 may be side chains of 3-(1-piperidinyl)alanine.

R4, R5, R6, 및 R7 중 적어도 3개는 3-구아니디노-2-아미노프로피온산의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 3개는 4-구아니디노-2-아미노부탄산의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 3개는 아르기닌의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 3개는 호모아르기닌의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 3개는 N-메틸아르기닌의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 3개는 N,N-디메틸아르기닌의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 3개는 2,3-디아미노프로피온산의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 3개는 2,4-디아미노부탄산, 리신의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 3개는 N-메틸리신의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 3개는 N,N-디메틸리신의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 3개는 N-에틸리신의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 3개는 N,N,N-트리메틸리신, 4-구아니디노페닐알라닌의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 3개는 시트룰린의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 3개는 N,N-디메틸리신, , β-호모아르기닌의 측쇄일 수 있다. R4, R5, R6, 및 R7 중 적어도 3개는 3-(1-피페리디닐)알라닌의 측쇄일 수 있다.At least three of R 4 , R 5 , R 6 , and R 7 may be side chains of 3-guanidino-2-aminopropionic acid. At least three of R 4 , R 5 , R 6 , and R 7 may be side chains of 4-guanidino-2-aminobutanoic acid. At least three of R 4 , R 5 , R 6 , and R 7 may be side chains of arginine. At least three of R 4 , R 5 , R 6 , and R 7 may be side chains of homoarginine. At least three of R 4 , R 5 , R 6 , and R 7 may be side chains of N-methylarginine. At least three of R 4 , R 5 , R 6 , and R 7 may be side chains of N,N-dimethylarginine. At least three of R 4 , R 5 , R 6 , and R 7 may be side chains of 2,3-diaminopropionic acid. At least three of R 4 , R 5 , R 6 , and R 7 may be the side chain of 2,4-diaminobutanoic acid or lysine. At least three of R 4 , R 5 , R 6 , and R 7 may be side chains of N-methyllysine. At least three of R 4 , R 5 , R 6 , and R 7 may be side chains of N,N-dimethyllysine. At least three of R 4 , R 5 , R 6 , and R 7 may be side chains of N-ethylysine. At least three of R 4 , R 5 , R 6 , and R 7 may be side chains of N,N,N-trimethyllysine or 4-guanidinophenylalanine. At least three of R 4 , R 5 , R 6 , and R 7 may be side chains of citrulline. At least three of R 4 , R 5 , R 6 , and R 7 may be side chains of N,N-dimethyllysine, β-homoarginine. At least three of R 4 , R 5 , R 6 , and R 7 may be side chains of 3-(1-piperidinyl)alanine.

AASC는 아스파라긴, 글루타민, 또는 호모글루타민의 잔기의 측쇄일 수 있다. AASC는 글루타민 잔기의 측쇄일 수 있다. cCPP는 AASC에 접합된 링커, 예를 들어 아스파라긴, 글루타민, 또는 호모글루타민의 잔기를 추가로 포함할 수 있다. 따라서, cCPP는 아스파라긴, 글루타민, 또는 호모글루타민 잔기에 접합된 링커를 추가로 포함할 수 있다. cCPP는 글루타민 잔기에 접합된 링커를 추가로 포함할 수 있다.AA SC may be the side chain of a residue of asparagine, glutamine, or homoglutamine. AA SC may be the side chain of a glutamine residue. cCPP may further comprise a linker conjugated to AA SC , such as the residue of asparagine, glutamine, or homoglutamine. Accordingly, cCPP may further comprise a linker conjugated to an asparagine, glutamine, or homoglutamine residue. cCPP may further comprise a linker conjugated to a glutamine residue.

q는 1, 2 또는 3일 수 있다. q는 1 또는 2일 수 있다. q는 1일 수 있다. q는 2일 수 있다. q는 3일 수 있다. q는 4일 수 있다.q can be 1, 2 or 3. q may be 1 or 2. q may be 1. q may be 2. q may be 3. q may be 4.

m은 1~3일 수 있다. m은 1 또는 2일 수 있다. m은 0일 수 있다. m은 1일 수 있다. m은 2일 수 있다. m은 3일 수 있다.m may be 1 to 3. m may be 1 or 2. m may be 0. m may be 1. m may be 2. m may be 3.

식 (A)의 cCPP는 식 (I)의 구조 (I) 또는 이의 양성자화된 형태를 포함할 수 있으며, 식 중 AASC, R1, R2, R3, R4, R7, m, 및 q는 본원에서 정의된 바와 같다.cCPP of formula (A) has the structure of formula (I) (I) or a protonated form thereof, wherein AA SC , R 1 , R 2 , R 3 , R 4 , R 7 , m, and q is as defined herein.

식 (A)의 cCPP는 식 (I-a) 또는 식 (I-b)의 구조:cCPP of formula (A) has the structure of formula (I-a) or formula (I-b):

(I-a), (I-b), (Ia), (Ib),

또는 이의 양성자화된 형태를 포함할 수 있고, 식 중 AASC, R1, R2, R3, R4, 및 m은 본원에서 정의된 바와 같다.or protonated forms thereof, wherein AA SC , R 1 , R 2 , R 3 , R 4 , and m is as defined herein.

식 (A)의 cCPP는 식 (I-1), (I-2), (I-3), 또는 (I-4)의 구조:cCPP of formula (A) has the structure of formula (I-1), (I-2), (I-3), or (I-4):

(I-1), (I-2), (I-1), (I-2),

(I-3), (I-4) (I-3), (I-4)

또는 이의 양성자화된 형태를 포함할 수 있고, 식 중 AASC 및 m은 본원에서 정의된 바와 같다.or protonated forms thereof, wherein AA SC and m are as defined herein.

식 (A)의 cCPP는 식 (I-5) 또는 (I-6)의 구조:cCPP of formula (A) has the structure of formula (I-5) or (I-6):

(I-5), 또는 (I-5), or

(I-6) 또는 이의 양성자화된 형태를 포함할 수 있고, 식 중 AASC는 본원에서 정의된 바와 같다. (I-6) or protonated forms thereof, wherein AA SC is as defined herein.

식 (A)의 cCPP는 식 (I-1)의 구조:cCPP of formula (A) has the structure of formula (I-1):

(I-1), 또는 이의 양성자화된 형태를 포함할 수 있고, (I-1), or a protonated form thereof,

식 중 AASC 및 m은 본원에서 정의된 바와 같다.where AA SC and m are as defined herein.

식 (A)의 cCPP는 식 (I-2)의 구조:cCPP of formula (A) has the structure of formula (I-2):

(I-2), 또는 이의 양성자화된 형태를 포함할 수 있고, (I-2), or a protonated form thereof,

식 중 AASC 및 m은 본원에서 정의된 바와 같다.where AA SC and m are as defined herein.

식 (A)의 cCPP는 식 (I-3)의 구조:cCPP of formula (A) has the structure of formula (I-3):

(I-3), 또는 이의 양성자화된 형태를 포함할 수 있고, (I-3), or a protonated form thereof,

식 중 AASC 및 m은 본원에서 정의된 바와 같다.where AA SC and m are as defined herein.

식 (A)의 cCPP는 식 (I-4)의 구조:cCPP of formula (A) has the structure of formula (I-4):

(I-4), 또는 이의 양성자화된 형태를 포함할 수 있고, (I-4), or a protonated form thereof,

식 중 AASC 및 m은 본원에서 정의된 바와 같다.where AA SC and m are as defined herein.

식 (A)의 cCPP는 식 (I-5)의 구조:cCPP of formula (A) has the structure of formula (I-5):

(I-5), 또는 이의 양성자화된 형태를 포함할 수 있고, (I-5), or a protonated form thereof,

식 중 AASC 및 m은 본원에서 정의된 바와 같다.where AA SC and m are as defined herein.

식 (A)의 cCPP는 식 (I-6)의 구조:cCPP of formula (A) has the structure of formula (I-6):

(I-6), 또는 이의 양성자화된 형태를 포함할 수 있고, 식 중 AASC 및 m은 본원에서 정의된 바와 같다. (I-6), or protonated forms thereof, where AA SC and m are as defined herein.

cCPP는 다음 서열 중 하나를 포함할 수 있다: FGFGRGR (서열번호 68); GfFGrGr (서열번호 69), FfΦGRGR (서열번호 70); FfFGRGR (서열번호 71); 또는 FfΦGrGr (서열번호 72). cCPP는 다음 서열 중 하나를 가질 수 있다: FGFΦ (서열번호 73); GfFGrGrQ (서열번호 74), FfΦGRGRQ (서열번호 75); FfFGRGRQ (서열번호 76); 또는 FfΦGrGrQ (서열번호 77).cCPP may comprise one of the following sequences: FGFGRGR (SEQ ID NO: 68); GfFGrGr (SEQ ID NO: 69), FfΦGRGR (SEQ ID NO: 70); FfFGRGR (SEQ ID NO: 71); or FfΦGrGr (SEQ ID NO: 72). cCPP may have one of the following sequences: FGFΦ (SEQ ID NO: 73); GfFGrGrQ (SEQ ID NO: 74), FfΦGRGRQ (SEQ ID NO: 75); FfFGRGRQ (SEQ ID NO: 76); or FfΦGrGrQ (SEQ ID NO: 77).

본 개시는 또한 식 (II)의 구조를 갖는 cCPP에 관한 것으로서:The present disclosure also relates to cCPP having the structure of formula (II):

(II) (II)

식 중:During the ceremony:

AASC는 아미노산 측쇄이고;AA SC is the amino acid side chain;

R1a, R1b, 및 R1c는 각각 독립적으로 6원 내지 14원 아릴 또는 6원 내지 14원 헤테로아릴이고;R 1a , R 1b , and R 1c are each independently 6- to 14-membered aryl or 6- to 14-membered heteroaryl;

R2a , R2b , R2c, 및 R2d는 독립적으로 아미노산 측쇄이고;R 2a , R 2b , R 2c , and R 2d are independently amino acid side chains;

R2a , R2b , R2c 및 R2d 중 적어도 하나는 , , 또는 이의 양성자화된 형태이고;At least one of R 2a , R 2b , R 2c and R 2d , , or a protonated form thereof;

R2a, R2b, R2c, 및 R2d 중 적어도 하나는 구아니딘 또는 이의 양성자화된 형태이고;At least one of R 2a , R 2b , R 2c , and R 2d is guanidine or a protonated form thereof;

각각의 n”은 독립적으로 정수 0, 1, 2, 3, 4, 또는 5이고;Each n” is independently the integer 0, 1, 2, 3, 4, or 5;

각각의 n’은 독립적으로 정수 0, 1, 2, 또는 3이고;Each n' is independently an integer 0, 1, 2, or 3;

n’이 0인 경우, R2a, R2b, R2b, 또는 R2d는 부재한다.When n' is 0, R 2a , R 2b , R 2b , or R 2d is absent.

R2a, R2b, R2c, 및 R2d 중 적어도 2개는 , , 또는 이의 양성자화된 형태일 수 있다. R2a, R2b, R2c, 및 R2d 중 2 또는 3개는 , , 또는 이의 양성자화된 형태일 수 있다. R2a, R2b, R2c, 및 R2d 중 하나는 , , 또는 이의 양성자화된 형태일 수 있다. R2a, R2b, R2c, 및 R2d 중 적어도 하나는 , 또는 이의 양성자화된 형태일 수 있고, R2a, R2b, R2c, 및 R2d 중 나머지는 구아니딘 또는 이의 양성자화된 형태일 수 있다. R2a, R2b, R2c, 및 R2d 중 적어도 2개는 , 또는 이의 양성자화된 형태일 수 있고, R2a, R2b, R2c, 및 R2d 중 나머지는 구아니딘 또는 이의 양성자화된 형태일 수 있다.At least two of R 2a , R 2b , R 2c , and R 2d , , or it may be a protonated form thereof. 2 or 3 of R 2a , R 2b , R 2c , and R 2d , , or it may be a protonated form thereof. One of R 2a , R 2b , R 2c , and R 2d , , or it may be a protonated form thereof. At least one of R 2a , R 2b , R 2c , and R 2d , or a protonated form thereof, and the remainder of R 2a , R 2b , R 2c , and R 2d may be guanidine or a protonated form thereof. At least two of R 2a , R 2b , R 2c , and R 2d , or a protonated form thereof, and the remainder of R 2a , R 2b , R 2c , and R 2d may be guanidine or a protonated form thereof.

R2a, R2b, R2c, 및 R2d 모두는 , , 또는 이의 양성자화된 형태일 수 있다. 적어도 R2a, R2b, R2c, 및 R2d, 또는 이의 양성자화된 형태일 수 있고, R2a, R2b, R2c, 및 R2d 중 나머지는 구아니딘 또는 이의 양성자화된 형태일 수 있다. R2a, R2b, R2c, 및 R2d 기 중 적어도 2개는 , 또는 이의 양성자화된 형태일 수 있고, R2a, R2b, R2c, 및 R2d 중 나머지는 구아니딘 또는 이의 양성자화된 형태이다.R 2a , R 2b , R 2c , and R 2d are all , , or it may be a protonated form thereof. At least R 2a , R 2b , R 2c , and R 2d , or a protonated form thereof, and the remainder of R 2a , R 2b , R 2c , and R 2d may be guanidine or a protonated form thereof. At least two of R 2a , R 2b , R 2c , and R 2d groups , or a protonated form thereof, and the remainder of R 2a , R 2b , R 2c , and R 2d are guanidine or a protonated form thereof.

R2a, R2b, R2c, 및 R2d 각각은 독립적으로 2,3-디아미노프로피온산, 2,4-디아미노부티르산, 오르니틴, 리신, 메틸리신, 디메틸리신, 트리메틸리신, 호모-리신, 세린, 호모-세린, 트레오닌, 알로-트레오닌, 히스티딘, 1-메틸히스티딘, 2-아미노부탄디온산, 아스파르트산, 글루탐산, 또는 호모-글루탐산일 수 있다.R 2a , R 2b , R 2c , and R 2d each independently selected from 2,3-diaminopropionic acid, 2,4-diaminobutyric acid, ornithine, lysine, methyl lysine, dimethyl lysine, trimethyl lysine, homo-lysine, It may be serine, homo-serine, threonine, allo-threonine, histidine, 1-methylhistidine, 2-aminobutanedioic acid, aspartic acid, glutamic acid, or homo-glutamic acid.

AASC 또는 일 수 있으며, 여기서 t는 0 내지 5의 정수일 수 있다. AASC일 수 있으며, 여기서 t는 0 내지 5의 정수일 수 있다. t는 1 내지 5일 수 있다. t는 2 또는 3이다. t는 2일 수 있다. t는 3일 수 있다.AA SC is or may be, where t may be an integer from 0 to 5. AA SC is may be, where t may be an integer from 0 to 5. t may be 1 to 5. t is 2 or 3. t may be 2. t may be 3.

R1a, R1b, 및 R1c는 각각 독립적으로 6원 내지 14원 아릴일 수 있다. R1a, R1b, 및 R1c는 각각 독립적으로 N, O, 또는 S로부터 선택된 하나 이상의 헤테로원자를 갖는 6원 내지 14원 헤테로아릴일 수 있다. R1a, R1b, 및 R1c는 페닐, 나프틸, 안트라세닐, 피리딜, 퀴놀릴, 또는 이소퀴놀릴로부터 각각 독립적으로 선택될 수 있다. R1a, R1b, 및 R1c는 페닐, 나프틸, 또는 안트라세닐로부터 각각 독립적으로 선택될 수 있다. R1a, R1b, 및 R1c는 각각 독립적으로 페닐 또는 나프틸일 수 있다. R1a, R1b, 및 R1c는 각각 독립적으로 선택된 피리딜, 퀴놀릴, 또는 이소퀴놀릴일 수 있다.R 1a , R 1b , and R 1c may each independently be a 6-membered to 14-membered aryl. R 1a , R 1b , and R 1c may each independently be a 6- to 14-membered heteroaryl having one or more heteroatoms selected from N, O, or S. R 1a , R 1b , and R 1c may each be independently selected from phenyl, naphthyl, anthracenyl, pyridyl, quinolyl, or isoquinolyl. R 1a , R 1b , and R 1c may each be independently selected from phenyl, naphthyl, or anthracenyl. R 1a , R 1b , and R 1c may each independently be phenyl or naphthyl. R 1a , R 1b , and R 1c may each be independently selected pyridyl, quinolyl, or isoquinolyl.

각각의 n’은 독립적으로 1 또는 2일 수 있다. 각각의 n’은 1일 수 있다. 각각의 n’은 2일 수 있다. 적어도 하나의 n’은 0일 수 있다. 적어도 하나의 n’은 1일 수 있다. 적어도 하나의 n’은 2일 수 있다. 적어도 하나의 n’은 3일 수 있다. 적어도 하나의 n’은 4일 수 있다. 적어도 하나의 n’은 5일 수 있다.Each n’ can independently be 1 or 2. Each n’ can be 1. Each n’ can be 2. At least one n’ can be 0. At least one n’ can be 1. At least one n’ can be 2. At least one n’ can be 3. At least one n’ can be 4. At least one n’ can be 5.

각각의 n”은 독립적으로 1 내지 3의 정수일 수 있다. 각각의 n”은 독립적으로 2 또는 3일 수 있다. 각각의 n”은 2일 수 있다. 각각의 n”은 3일 수 있다. 적어도 하나의 n”은 0일 수 있다. 적어도 하나의 n”은 1일 수 있다. 적어도 하나의 n”은 2일 수 있다. 적어도 하나의 n”은 3일 수 있다.Each n” may independently be an integer from 1 to 3. Each n” can independently be 2 or 3. Each n” can be 2. Each n” can be 3. At least one n” can be 0. At least one n” can be 1. At least one n” can be 2. At least one n” can be 3.

각각의 n”은 독립적으로 1 또는 2일 수 있고, 각각의 n’은 독립적으로 2 또는 3일 수 있다. 각각의 n”은 1일 수 있고, 각각의 n’은 독립적으로 2 또는 3일 수 있다. 각각의 n”은 1일 수 있고, 각각의 n’은 2일 수 있다. 각각의 n”은 1이고 각각의 n’은 3이다.Each n” can independently be 1 or 2, and each n’ can independently be 2 or 3. Each n” can be 1, and each n’ can independently be 2 or 3. Each n” can be 1, and each n’ can be 2. Each n” is 1 and each n’ is 3.

식 (II)의 cCPP는 식 (II-1)의 구조를 가질 수 있고:cCPP of formula (II) may have the structure of formula (II-1):

(II-1), (II-1),

식 중 R1a, R1b, R1c, R2a, R2b, R2c, R2d, AASC, n’, 및 n”은 본원에서 정의된 바와 같다.In the formula, R 1a , R 1b , R 1c , R 2a , R 2b , R 2c , R 2d , AA SC, n’, and n” are as defined herein.

식 (II)의 cCPP는 식 (IIa)의 구조를 가질 수 있고:cCPP of formula (II) may have the structure of formula (IIa):

(IIa), (IIa),

식 중 R1a, R1b, R1c, R2a, R2b, R2c, R2d, AASC, 및 n’은 본원에서 정의된 바와 같다.wherein R 1a , R 1b , R 1c , R 2a , R 2b , R 2c , R 2d , AA SC , and n’ are as defined herein.

식 (II)의 cCPP는 식 (IIb)의 구조를 가질 수 있고:cCPP of formula (II) may have the structure of formula (IIb):

(IIb), (IIb),

식 중 R2a, R2b, AASC, 및 n’은 본원에서 정의된 바와 같다.where R 2a , R 2b , AA SC , and n' are as defined herein.

cCPP는 식 (IIc)의 구조:cCPP has the structure of formula (IIc):

(IIc), 또는 이의 양성자화된 형태를 가질 수 있고, (IIc), or a protonated form thereof,

식 중: During the ceremony:

AASC 및 n’은 본원에서 정의된 바와 같다.AA SC and n' are as defined herein.

식 (IIa)의 cCPP는 다음 구조 중 하나를 갖고:cCPP of formula (IIa) has one of the following structures:

, , , 또는 , 식 중 AASC, 및 n은 본원에서 정의된 바와 같다. , , , or , where AA SC , and n are as defined herein.

식 (IIa)의 cCPP는 다음 구조 중 하나를 갖고:cCPP of formula (IIa) has one of the following structures:

또는 , 식 중 AASC, 및 n은 본원에서 정의된 바와 같다. or , where AA SC , and n are as defined herein.

식 (IIa)의 cCPP는 다음 구조 중 하나를 갖고:cCPP of formula (IIa) has one of the following structures:

, 또는 , or

, 식 중 AASC, 및 n은 본원에서 정의된 바와 같다. , where AA SC , and n are as defined herein.

식 (II)의 cCPP는 다음 구조를 가질 수 있다:cCPP of formula (II) may have the following structure:

. .

식 (II)의 cCPP는 다음 구조를 가질 수 있다:cCPP of formula (II) may have the following structure:

cCPP는 식 (III)의 다음 구조를 가질 수 있고:cCPP may have the following structure in formula (III):

(III), (III),

식 중: During the ceremony:

AASC는 아미노산 측쇄이고;AA SC is the amino acid side chain;

R1a, R1b, 및 R1c는 각각 독립적으로 6원 내지 14원 아릴 또는 6원 내지 14원 헤테로아릴이고;R 1a , R 1b , and R 1c are each independently 6- to 14-membered aryl or 6- to 14-membered heteroaryl;

R2a 및 R2c는 각각 독립적으로 H, , , 또는 이의 양성자화된 형태이고;R 2a and R 2c are each independently H, , , or a protonated form thereof;

R2b 및 R2d는 각각 독립적으로 구아니딘 또는 이의 양성자화된 형태이고;R 2b and R 2d are each independently guanidine or a protonated form thereof;

각각의 n”은 독립적으로 1 내지 3의 정수이고;Each n” is independently an integer from 1 to 3;

각각의 n’은 독립적으로 1 내지 5의 정수이고;Each n' is independently an integer from 1 to 5;

각각의 p’은 독립적으로 0 내지 5의 정수이다.Each p’ is independently an integer from 0 to 5.

식 (III)의 cCPP는 식 (III-1)의 구조를 가질 수 있고:cCPP of formula (III) may have the structure of formula (III-1):

(III-1), (III-1),

식 중: During the ceremony:

AASC, R1a, R1b, R1c, R2a, R2c, R2b, R2d, n’, n”, 및 p’은 본원에서 정의된 바와 같다.AA SC , R 1a , R 1b , R 1c , R 2a , R 2c , R 2b , R 2d , n’, n”, and p’ are as defined herein.

식 (III)의 cCPP는 식 (IIIa)의 구조를 가질 수 있고:cCPP of formula (III) may have the structure of formula (IIIa):

(IIIa), (IIIa),

식 중: During the ceremony:

AASC, R2a, R2c, R2b, R2d, n’, n”, 및 p’은 본원에서 정의된 바와 같다.AA SC , R 2a , R 2c , R 2b , R 2d , n’, n”, and p’ are as defined herein.

식 (III), (III-1), 및 (IIIa)에서, Ra 및 Rc는 H일 수 있다. Ra 및 Rc는 H일 수 있고, Rb 및 Rd는 각각 독립적으로 구아니딘 또는 이의 양성자화된 형태일 수 있다. Ra는 H일 수 있다. Rb는 H일 수 있다. p’는 0일 수 있다. Ra 및 Rc는 H일 수 있고, 각각의 p’은 0일 수 있다.In formulas (III), (III-1), and (IIIa), R a and R c may be H. R a and R c may be H, and R b and R d may each independently be guanidine or a protonated form thereof. R a may be H. R b may be H. p' may be 0. R a and R c may be H, and each p' may be 0.

식 (III), (III-1), 및 (IIIa)에서, Ra 및 Rc는 H일 수 있다. Rb 및 Rd는 각각 독립적으로 구아니딘 또는 이의 양성자화된 형태일 수 있고, n”은 2 또는 3일 수 있고, 각각의 p’은 0일 수 있다.In formulas (III), (III-1), and (IIIa), R a and R c may be H. R b and R d may each independently be guanidine or a protonated form thereof, n” may be 2 or 3, and each p' may be 0.

p’은 0일 수 있다. p’은 1일 수 있다. p’은 2일 수 있다. p’은 3일 수 있다. p’은 4일 수 있다. p’은 5일 수 있다.p’ can be 0. p’ may be 1. p’ may be 2. p’ may be 3. p’ could be 4. p’ may be 5.

cCPP는 다음 구조를 가질 수 있다:cCPP may have the following structure:

. .

식 (A)의 cCPP는 다음으로부터 선택될 수 있다:cCPP in equation (A) can be selected from:

식 (A)의 cCPP는 다음으로부터 선택될 수 있다:cCPP in equation (A) can be selected from:

구현예에서, cCPP는 다음으로부터 선택된다: In an embodiment, cCPP is selected from:

구현예에서, cCPP는 다음으로부터 선택되지 않는다:In an embodiment, the cCPP is not selected from:

cCPP는 식 (D)의 구조 (D) cCPP is the structure of formula (D) (D)

또는 이의 양성자화된 형태를 포함할 수 있고, 식 중:or a protonated form thereof, wherein:

R1, R2, 및 R3은 각각 독립적으로 H이거나 방향족기를 포함하는 측쇄를 갖는 아미노산 잔기일 수 있고;R 1 , R 2 , and R 3 may each independently be H or an amino acid residue having a side chain containing an aromatic group;

R1, R2, 및 R3 중 적어도 하나는 아미노산의 방향족 또는 헤테로방향족 측쇄이고;At least one of R 1 , R 2 , and R 3 is an aromatic or heteroaromatic side chain of an amino acid;

R4 및 R6은 독립적으로 H이거나 아미노산 측쇄이고;R 4 and R 6 are independently H or an amino acid side chain;

Y는 , 또는 이고;Y is , or ego;

AASC는 아미노산 측쇄이고;AA SC is the amino acid side chain;

q는 1, 2, 3, 또는 4이고;q is 1, 2, 3, or 4;

각각의 m은 독립적으로 정수 0, 1, 2, 또는 3이고;Each m is independently an integer 0, 1, 2, or 3;

각각의 n은 독립적으로 정수 0, 1, 2, 또는 3이다.Each n is independently an integer 0, 1, 2, or 3.

식 (D)의 cCPP는 식 (D-I)의 구조:cCPP of formula (D) has the structure of formula (D-I):

(D-I) (DI)

또는 이의 양성자화된 형태를 가질 수 있고,or may have a protonated form thereof,

식 중:During the ceremony:

R1, R2, 및 R3은 각각 독립적으로 H이거나 방향족기를 포함하는 측쇄를 갖는 아미노산 잔기일 수 있고;R 1 , R 2 , and R 3 may each independently be H or an amino acid residue having a side chain containing an aromatic group;

R1, R2, 및 R3 중 적어도 하나는 아미노산의 방향족 또는 헤테로방향족 측쇄이고;At least one of R 1 , R 2 , and R 3 is an aromatic or heteroaromatic side chain of an amino acid;

R4 및 R6은 독립적으로 H이거나 아미노산 측쇄이고;R 4 and R 6 are independently H or an amino acid side chain;

AASC는 아미노산 측쇄이고;AA SC is the amino acid side chain;

q는 1, 2, 3, 또는 4이고;q is 1, 2, 3, or 4;

각각의 m은 독립적으로 정수 0, 1, 2, 또는 3이고;Each m is independently an integer 0, 1, 2, or 3;

Y는 이다.Y is am.

식 (D)의 cCPP는 식 (D-II)의 구조:cCPP of formula (D) has the structure of formula (D-II):

(D-II) (D-II)

또는 이의 양성자화된 형태를 가질 수 있고,or may have a protonated form thereof,

식 중:During the ceremony:

R1, R2, 및 R3은 각각 독립적으로 H이거나 방향족기를 포함하는 측쇄를 갖는 아미노산 잔기일 수 있고;R 1 , R 2 , and R 3 may each independently be H or an amino acid residue having a side chain containing an aromatic group;

R1, R2, 및 R3 중 적어도 하나는 아미노산의 방향족 또는 헤테로방향족 측쇄이고;At least one of R 1 , R 2 , and R 3 is an aromatic or heteroaromatic side chain of an amino acid;

R4 및 R6은 독립적으로 H이거나 아미노산 측쇄이고;R 4 and R 6 are independently H or an amino acid side chain;

AASC는 아미노산 측쇄이고;AA SC is the amino acid side chain;

q는 1, 2, 3, 또는 4이고;q is 1, 2, 3, or 4;

각각의 m은 독립적으로 정수 0, 1, 2, 또는 3이고;Each m is independently an integer 0, 1, 2, or 3;

각각의 m은 독립적으로 정수 0, 1, 2, 또는 3이고;Each m is independently an integer 0, 1, 2, or 3;

Y는 이다.Y is am.

식 (D)의 cCPP는 식 (D-III)의 구조:cCPP of formula (D) has the structure of formula (D-III):

(D-III) (D-III)

또는 이의 양성자화된 형태를 가질 수 있고,or may have a protonated form thereof,

식 중:During the ceremony:

R1, R2, 및 R3은 각각 독립적으로 H이거나 방향족기를 포함하는 측쇄를 갖는 아미노산 잔기일 수 있고;R 1 , R 2 , and R 3 may each independently be H or an amino acid residue having a side chain containing an aromatic group;

R1, R2, 및 R3 중 적어도 하나는 아미노산의 방향족 또는 헤테로방향족 측쇄이고;At least one of R 1 , R 2 , and R 3 is an aromatic or heteroaromatic side chain of an amino acid;

R4 및 R6은 독립적으로 H이거나 아미노산 측쇄이고;R 4 and R 6 are independently H or an amino acid side chain;

AASC는 아미노산 측쇄이고;AA SC is the amino acid side chain;

q는 1, 2, 3, 또는 4이고;q is 1, 2, 3, or 4;

각각의 m은 독립적으로 정수 0, 1, 2, 또는 3이고;Each m is independently an integer 0, 1, 2, or 3;

각각의 n은 독립적으로 정수 0, 1, 2, 또는 3이고;Each n is independently an integer 0, 1, 2, or 3;

Y는 이다.Y is am.

식 (D)의 cCPP는 식 (D-IV)의 구조:cCPP of formula (D) has the structure of formula (D-IV):

(D-IV) (D-IV)

또는 이의 양성자화된 형태를 가질 수 있고,or may have a protonated form thereof,

식 중:During the ceremony:

R1, R2, 및 R3은 각각 독립적으로 H이거나 방향족기를 포함하는 측쇄를 갖는 아미노산 잔기일 수 있고;R 1 , R 2 , and R 3 may each independently be H or an amino acid residue having a side chain containing an aromatic group;

R1, R2, 및 R3 중 적어도 하나는 아미노산의 방향족 또는 헤테로방향족 측쇄이고;At least one of R 1 , R 2 , and R 3 is an aromatic or heteroaromatic side chain of an amino acid;

R4 및 R6은 독립적으로 H이거나 아미노산 측쇄이고;R 4 and R 6 are independently H or an amino acid side chain;

AASC는 아미노산 측쇄이고;AA SC is the amino acid side chain;

q는 1, 2, 3, 또는 4이고;q is 1, 2, 3, or 4;

각각의 m은 독립적으로 정수 0, 1, 2, 또는 3이고;Each m is independently an integer 0, 1, 2, or 3;

Y는 이다.Y is am.

식 (D)의 cCPP는 식 (D-V)의 구조:cCPP of formula (D) has the structure of formula (D-V):

(D-V) (DV)

또는 이의 양성자화된 형태를 가질 수 있고,or may have a protonated form thereof,

식 중:During the ceremony:

R1, R2, 및 R3은 각각 독립적으로 H이거나 방향족기를 포함하는 측쇄를 갖는 아미노산 잔기일 수 있고;R 1 , R 2 , and R 3 may each independently be H or an amino acid residue having a side chain containing an aromatic group;

R1, R2, 및 R3 중 적어도 하나는 아미노산의 방향족 또는 헤테로방향족 측쇄이고;At least one of R 1 , R 2 , and R 3 is an aromatic or heteroaromatic side chain of an amino acid;

R4 및 R6은 독립적으로 H이거나 아미노산 측쇄이고;R 4 and R 6 are independently H or an amino acid side chain;

AASC는 아미노산 측쇄이고;AA SC is the amino acid side chain;

q는 1, 2, 3, 또는 4이고;q is 1, 2, 3, or 4;

각각의 m은 독립적으로 정수 0, 1, 2, 또는 3이고;Each m is independently an integer 0, 1, 2, or 3;

Y는 이다.Y is am.

AASC는 링커에 접합될 수 있다.AA SC can be conjugated to a linker.

링커linker

본 개시의 cCPP는 링커에 접합될 수 있다. 링커는 화물을 cCPP에 연결할 수 있다. 링커는 cCPP의 아미노산의 측쇄에 부착될 수 있고, 화물은 링커 상의 적절한 위치에 부착될 수 있다.The cCPP of the present disclosure can be conjugated to a linker. A linker can connect the cargo to cCPP. The linker can be attached to the side chain of an amino acid of cCPP, and the cargo can be attached to the appropriate position on the linker.

링커는 cCPP를 하나 이상의 추가 모이어티, 예를 들어 환외 펩티드(EP) 및/또는 화물에 접합시킬 수 있는 임의의 적절한 모이어티일 수 있다. cCPP 및 하나 이상의 추가 모이어티에 접합하기 전에, 링커는 2개 이상의 작용기를 가지며, 이들 각각은 cCPP 및 하나 이상의 추가 모이어티에 대한 공유 결합을 독립적으로 형성할 수 있다. 화물이 올리고뉴클레오티드인 경우, 링커는 화물의 5’ 단부 또는 화물의 3’ 단부에 공유 결합될 수 있다. 링커는 화물의 5’ 단부에 공유 결합될 수 있다. 링커는 화물의 3’ 단부에 공유 결합될 수 있다. 화물이 펩티드인 경우, 링커는 화물의 N-말단 또는 C-말단에 공유 결합될 수 있다. 링커는 올리고뉴클레오티드 또는 펩티드 화물의 백본에 공유 결합될 수 있다. 링커는 본원에 기술된 cCPP를 올리고뉴클레오티드, 펩티드, 또는 소분자와 같은 화물에 접합시키는 임의의 적절한 모이어티일 수 있다.The linker may be any suitable moiety capable of conjugating cCPP to one or more additional moieties, such as an exophytic peptide (EP) and/or cargo. Prior to conjugation to cCPP and one or more additional moieties, the linker has two or more functional groups, each of which can independently form a covalent bond to cCPP and one or more additional moieties. If the cargo is an oligonucleotide, the linker may be covalently attached to the 5' end of the cargo or to the 3' end of the cargo. The linker may be covalently attached to the 5' end of the cargo. The linker may be covalently attached to the 3' end of the cargo. If the cargo is a peptide, the linker may be covalently attached to the N-terminus or C-terminus of the cargo. The linker may be covalently attached to the backbone of the oligonucleotide or peptide cargo. The linker may be any suitable moiety that conjugates the cCPP described herein to a cargo such as an oligonucleotide, peptide, or small molecule.

링커는 탄화수소 링커를 포함할 수 있다.Linkers may include hydrocarbon linkers.

링커는 절단 부위를 포함할 수 있다. 절단 부위는 이황화 부위, 또는 카스파제-절단 부위(예: Val-Cit-PABC)일 수 있다.The linker may contain a cleavage site. The cleavage site may be a disulfide site, or a caspase-cleavage site (eg, Val-Cit-PABC).

링커는 다음을 포함할 수 있다: (i) 각각이 임의 치환되는 하나 이상의 D 또는 L 아미노산; (ii) 임의 치환된 알킬렌; (iii) 임의 치환된 알케닐렌; (iv) 임의 치환된 알키닐렌; (v) 임의 치환된 카르보시클릴; (vi) 임의 치환된 헤테로시클릴; (vii) 하나 이상의 -(R1-J-R2)z”- 서브유닛 (여기서 R1 및 R2 각각은, 각각의 경우에 알킬렌, 알케닐렌, 알키닐렌, 카르보시클릴, 및 헤테로시클릴로부터 독립적으로 선택되고; 각각의 J는 독립적으로 C, NR3, -NR3C(O)-, S, 및 O이고; 여기서 R3은 각각이 임의 치환된 H, 알킬, 알케닐, 알키닐, 카르보시클릴, 및 헤테로시클릴로부터 독립적으로 선택되고; z”는 1 내지 50의 정수임); (viii) -(R1-J)z”- 또는 -(J-R1)z”- (여기서 각각의 R1은 각각의 경우에 독립적으로 알킬렌, 알케닐렌, 알키닐렌, 카르보시클릴, 또는 헤테로시클릴이고; 각각의 J는 독립적으로 C, NR3, -NR3C(O)-, S, 또는 O이고, 여기서 R3은 H, 알킬, 알케닐, 알키닐, 카르보시클릴, 또는 헤테로시클릴이거나, 이들 각각은 임의 치환되고; z”은 1 내지 50의 정수임); 또는 (ix) (i) 내지 (x) 중 하나 이상을 포함할 수 있는 링커.The linker may comprise: (i) one or more D or L amino acids, each optionally substituted; (ii) optionally substituted alkylene; (iii) optionally substituted alkenylene; (iv) optionally substituted alkynylene; (v) optionally substituted carbocyclyl; (vi) optionally substituted heterocyclyl; (vii) one or more -(R 1- JR 2 )z”-subunits, wherein each of R 1 and R 2 is, at each occurrence, selected from alkylene, alkenylene, alkynylene, carbocyclyl, and heterocyclyl. is independently selected; each J is independently C, NR 3 , -NR 3 C(O)-, S, and O; wherein R 3 is each optionally substituted H, alkyl, alkenyl, alkynyl, independently selected from carbocyclyl, and heterocyclyl; z” is an integer from 1 to 50; (viii) -(R 1- J)z”- or -(JR 1 )z”- (wherein each R 1 is independently at each occurrence alkylene, alkenylene, alkynylene, carbocyclyl, or hetero cyclyl; each J is independently C, NR 3 , -NR 3 C(O)-, S, or O, where R 3 is H, alkyl, alkenyl, alkynyl, carbocyclyl, or hetero cyclyl, or each of these is optionally substituted; z” is an integer from 1 to 50; or (ix) a linker that may include one or more of (i) to (x).

링커는 하나 이상의 D 또는 L 아미노산 및/또는 -(R1-J-R2)z”-, 또는 이들의 조합을 포함할 수 있으며, 여기서 R1 및 R2 각각은 독립적으로 알킬렌이고, 각각의 J는 독립적으로 C, NR3, -NR3C(O)-, S, 및 O이고, R4는 H 및 알킬로부터 독립적으로 선택되고, z”은 1 내지 50의 정수이다.The linker may comprise one or more D or L amino acids and/or -(R 1- JR 2 )z”-, or combinations thereof, wherein each of R 1 and R 2 is independently alkylene, and each J is independently C, NR 3 , -NR 3 C(O)-, S, and O, R 4 is independently selected from H and alkyl, and z” is an integer from 1 to 50.

링커는 (예를 들어 스페이서로서) -(OCH2CH2)z’-를 포함할 수 있으며, 여기서 z’은 1 내지 23의 정수, 예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 또는 23이다. “-(OCH2CH2) z’은 폴리에틸렌 글리콜(PEG)로서 지칭될 수도 있다.The linker may comprise (e.g. as a spacer) -(OCH 2 CH 2 ) z'- , where z' is an integer from 1 to 23, for example 2, 3, 4, 5, 6, 7, It is 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, or 23. “-(OCH 2 CH 2 ) z’ may also be referred to as polyethylene glycol (PEG).

링커는 하나 이상의 아미노산을 포함할 수 있다. 링커는 펩티드를 포함할 수 있다. 링커는 -(OCH2CH2)z’- (z’은 1 내지 23의 정수임) 및 펩티드를 포함할 수 있다. 펩티드는 2 내지 10개의 아미노산을 포함할 수 있다. 링커는 클릭 화학을 통해 반응할 수 있는 작용기(FG)를 추가로 포함할 수 있다. FG는 아지드 또는 알킨일 수 있고, 화물이 링커에 접합될 때 트리아졸이 형성된다.The linker may contain one or more amino acids. Linkers may include peptides. The linker may include -(OCH 2 CH 2 ) z' - (z' is an integer from 1 to 23) and a peptide. Peptides may contain 2 to 10 amino acids. The linker may additionally contain functional groups (FGs) capable of reacting through click chemistry. FG can be an azide or an alkyne, and a triazole is formed when the cargo is conjugated to the linker.

링커는 (i) β 알라닌 잔기 및 리신 잔기; (ii) -(J-R1)z”; 또는 (iii) 이들의 조합을 포함할 수 있다. 각각의 R1은 독립적으로 알킬렌, 알케닐렌, 알키닐렌, 카르보시클릴, 또는 헤테로시클릴일 수 있고, 각각의 J는 독립적으로 C, NR3, -NR3C(O)-, S, 또는 O이고, 여기서 R3은 H, 알킬, 알케닐, 알키닐, 카르보시클릴, 또는 헤테로시클릴이고, 이들 각각은 임의 치환되고, z”은 1 내지 50의 정수일 수 있다. 각각의 R1은 알킬렌일 수 있고, 각각의 J는 O일 수 있다.The linker consists of (i) a β alanine residue and a lysine residue; (ii) -(JR 1 )z”; or (iii) a combination thereof. Each R 1 may independently be alkylene, alkenylene, alkynylene, carbocyclyl, or heterocyclyl, and each J may independently be C, NR 3 , -NR 3 C(O)-, S, or O, where R 3 is H, alkyl, alkenyl, alkynyl, carbocyclyl, or heterocyclyl, each of which is optionally substituted, and z” can be an integer from 1 to 50. Each R 1 may be alkylene, and each J may be O.

링커는 (i) β-알라닌, 글리신, 리신, 4-아미노부티르산, 5-아미노펜탄산, 6-아미노헥산산, 또는 이들의 조합의 잔기; 및 (ii) -(R1-J)z”- 또는 -(J-R1)z”을 포함할 수 있다. 각각의 R1은 독립적으로 알킬렌, 알케닐렌, 알키닐렌, 카르보시클릴, 또는 헤테로시클릴일 수 있고, 각각의 J는 독립적으로 C, NR3, -NR3C(O)-, S, 또는 O이고, 여기서 R3은 H, 알킬, 알케닐, 알키닐, 카르보시클릴, 또는 헤테로시클릴이고, 이들 각각은 임의 치환되고, z”은 1 내지 50의 정수일 수 있다. 각각의 R1은 알킬렌일 수 있고 각각의 J는 O일 수 있다. 링커는 글리신, 베타-알라닌, 4-아미노부티르산, 5-아미노펜탄산, 6-아미노헥산산, 또는 이들의 조합을 포함할 수 있다.The linker may include (i) the residues of β-alanine, glycine, lysine, 4-aminobutyric acid, 5-aminopentanoic acid, 6-aminohexanoic acid, or combinations thereof; and (ii) -(R 1- J)z”- or -(JR 1 )z”. Each R 1 may independently be alkylene, alkenylene, alkynylene, carbocyclyl, or heterocyclyl, and each J may independently be C, NR 3 , -NR 3 C(O)-, S, or O, where R 3 is H, alkyl, alkenyl, alkynyl, carbocyclyl, or heterocyclyl, each of which is optionally substituted, and z” can be an integer from 1 to 50. Each R 1 may be alkylene and each J may be O. The linker may include glycine, beta-alanine, 4-aminobutyric acid, 5-aminopentanoic acid, 6-aminohexanoic acid, or combinations thereof.

링커는 3가 링커일 수 있다. 링커는 다음 구조를 가질 수 있고: , 식 중 A1, B1, 및 C1은 독립적으로 탄화수소 링커(예: NRH-(CH2)n-COOH), PEG 링커(예: NRH-(CH2O)n-COOH, 여기서 R은 H, 메틸, 또는 에틸임), 또는 하나 이상의 아미노산 잔기이고, Z는 독립적으로 보호기이다. 링커는 이황화 [NH2-(CH2O)n-S-S-(CH2O)n-COOH]를 포함하는 절단 부위, 또는 카스파제-절단 부위(Val-Cit-PABC)를 혼입할 수도 있다.The linker may be a trivalent linker. A linker may have the following structure: , In the formula, A 1 , B 1 , and C 1 are independently a hydrocarbon linker (e.g. NRH-(CH 2 ) n -COOH), a PEG linker (e.g. NRH-(CH 2 O) n -COOH, where R is H , methyl, or ethyl), or one or more amino acid residues, and Z is independently a protecting group. The linker may incorporate a cleavage site containing the disulfide [NH 2 -(CH 2 O) n -SS-(CH 2 O)n-COOH], or a caspase-cleavage site (Val-Cit-PABC).

탄화수소는 글리신 또는 베타-알라닌의 잔기일 수 있다.The hydrocarbon may be the residue of glycine or beta-alanine.

링커는 2가일 수 있고 cCPP를 화물에 연결할 수 있다. 링커는 2가일 수 있고 cCPP를 환외 펩티드(EP)에 연결할 수 있다.The linker can be bivalent and connect cCPP to the cargo. The linker can be bivalent and connect cCPP to an exophytic peptide (EP).

링커는 3가일 수 있고 cCPP를 화물 및 EP에 연결할 수 있다.The linker may be trivalent and connect cCPP to the cargo and EP.

링커는 2가 또는 3가 C1-C50 알킬렌일 수 있고, 여기서 1~25개의 메틸렌기는 -N(H)-, -N(C1-C4 알킬)-, -N(시클로알킬)-, -O-, -C(O)-, -C(O)O-, -S-, -S(O)-, -S(O)2-, -S(O)2N(C1-C4 알킬)-, -S(O)2N(시클로알킬)-, -N(H)C(O)-, -N(C1-C4 알킬)C(O)-, -N(시클로알킬)C(O)-, -C(O)N(H)-, -C(O)N(C1-C4 알킬), -C(O)N(시클로알킬), 아릴, 헤테로시클릴, 헤테로아릴, 시클로알킬, 또는 시클로알케닐에 의해 임의로 및 독립적으로 치환된다. 링커는 2가 또는 3가 C1-C50 알킬렌일 수 있고, 여기서 1~25개의 메틸렌기는 -N(H)-, -O-, -C(O)N(H)-, 또는 이들의 조합에 의해 임의로 및 독립적으로 치환된다.The linker may be a divalent or trivalent C 1 -C 50 alkylene, where 1 to 25 methylene groups are -N(H)-, -N(C 1 -C 4 alkyl)-, -N(cycloalkyl)- , -O-, -C(O)-, -C(O)O-, -S-, -S(O)-, -S(O) 2 -, -S(O) 2 N(C 1 - C 4 alkyl)-, -S(O) 2 N(cycloalkyl)-, -N(H)C(O)-, -N(C 1 -C 4 alkyl)C(O)-, -N(cyclo Alkyl)C(O)-, -C(O)N(H)-, -C(O)N(C 1 -C 4 alkyl), -C(O)N(cycloalkyl), aryl, heterocyclyl , optionally and independently substituted by heteroaryl, cycloalkyl, or cycloalkenyl. The linker may be a divalent or trivalent C 1 -C 50 alkylene, where 1 to 25 methylene groups are -N(H)-, -O-, -C(O)N(H)-, or combinations thereof. is optionally and independently substituted by.

링커는 다음 구조를 가질 수 있고:A linker may have the following structure:

, 여기서: 각각의 AA는 독립적으로 아미노산 잔기이고; *는 AASC에 대한 부착점이고; AASC는 cCPP의 아미노산 잔기의 측쇄이고; x는 1~10의 정수이고; y는 1~5의 정수이고; z는 1~10의 정수이다. x는 1~5의 정수일 수 있다. x는 1~3의 정수일 수 있다. x는 1일 수 있다. y는 2~4의 정수일 수 있다. z는 4일 수 있다. z는 1~5의 정수일 수 있다. z는 1~3의 정수일 수 있다. z는 1일 수 있다. 각각의 AA는 글리신, β-알라닌, 4-아미노부티르산, 5-아미노펜탄산, 및 6-아미노헥산산으로부터 독립적으로 선택될 수 있다. , where: each AA is independently an amino acid residue; * is the point of attachment to AA SC ; AA SC is the side chain of the amino acid residues of cCPP; x is an integer from 1 to 10; y is an integer from 1 to 5; z is an integer from 1 to 10. x may be an integer from 1 to 5. x may be an integer from 1 to 3. x may be 1. y may be an integer between 2 and 4. z can be 4. z may be an integer from 1 to 5. z may be an integer from 1 to 3. z may be 1. Each AA can be independently selected from glycine, β-alanine, 4-aminobutyric acid, 5-aminopentanoic acid, and 6-aminohexanoic acid.

cCPP는 링커(“L”)를 통해 화물에 부착될 수 있다. 링커는 결합기(“M”)를 통해 화물에 접합될 수 있다.cCPP can be attached to the cargo via a linker (“L”). The linker can be conjugated to the cargo via a linker (“M”).

링커는 다음 구조를 가질 수 있고:A linker may have the following structure:

, 식 중: x는 1~10의 정수이고; y는 1~5의 정수이고; z는 1~10의 정수이고; 각각의 AA는 독립적으로 아미노산 잔기이고; *는 AASC에 대한 부착점이고, AASC는 cCPP의 아미노산 잔기의 측쇄이고; M은 본원에서 정의된 결합기이다. , where: x is an integer from 1 to 10; y is an integer from 1 to 5; z is an integer from 1 to 10; Each AA is independently an amino acid residue; * is the point of attachment to AA SC , where AA SC is the side chain of the amino acid residue of cCPP; M is a linking group as defined herein.

링커는 다음 구조를 가질 수 있고:A linker may have the following structure:

, ,

식 중: x는 1~23의 정수이고; y는 1~5의 정수이고; z’은 1~23의 정수이고; *는 AASC에 대한 부착점이고, AASC는 cCPP의 아미노산 잔기의 측쇄이고; M은 본원에서 정의된 결합기이다.In the formula: x is an integer from 1 to 23; y is an integer from 1 to 5; z' is an integer from 1 to 23; * is the point of attachment to AA SC , where AA SC is the side chain of the amino acid residue of cCPP; M is a linking group as defined herein.

링커는 다음 구조를 가질 수 있고:A linker may have the following structure:

식 중: x는 1~23의 정수이고; y는 1~5의 정수이고; z’은 1~23의 정수이고; *는 AASC에 대한 부착점이고, AASC는 cCPP의 아미노산 잔기의 측쇄이다. In the formula: x is an integer from 1 to 23; y is an integer from 1 to 5; z' is an integer from 1 to 23; * is the point of attachment to AA SC , and AA SC is the side chain of the amino acid residue of cCPP.

x는 1~10의 정수, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10일 수 있다(이들 사이의 모든 범위 및 하위 범위를 포함함).x may be an integer from 1 to 10, for example, 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10 (including all ranges and subranges therebetween).

x’은 1~23의 정수, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 또는 23일 수 있다(이들 사이의 모든 범위 및 하위 범위를 포함함). x’은 5~15의 정수일 수 있다. x’은 9~13의 정수일 수 있다. x’은 1~5의 정수일 수 있다. x’은 1일 수 있다.x' is an integer from 1 to 23, for example 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, It can be 20, 21, 22, or 23 (inclusive of all ranges and subranges in between). x’ can be an integer between 5 and 15. x’ can be an integer between 9 and 13. x’ can be an integer from 1 to 5. x’ may be 1.

y는 1~5의 정수, 예를 들어 1, 2, 3, 4, 또는 5일 수 있다(이들 사이의 모든 범위 및 하위 범위를 포함함). y는 2~5의 정수일 수 있다. y는 3~5의 정수일 수 있다. y는 3 또는 4일 수 있다. y는 4 또는 5일 수 있다. y는 3일 수 있다. y는 4일 수 있다. y는 5일 수 있다.y may be an integer from 1 to 5, for example, 1, 2, 3, 4, or 5 (including all ranges and subranges therebetween). y may be an integer from 2 to 5. y may be an integer between 3 and 5. y can be 3 or 4. y can be 4 or 5. y can be 3. y can be 4. y can be 5.

z는 1~10의 정수, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10일 수 있다(이들 사이의 모든 범위 및 하위 범위를 포함함).z may be an integer from 1 to 10, for example, 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10 (including all ranges and subranges therebetween).

z’은 1~23의 정수, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 또는 23일 수 있다(이들 사이의 모든 범위 및 하위 범위를 포함함). z’은 5~15의 정수일 수 있다. z’은 9~13의 정수일 수 있다. z’은 11일 수 있다.z' is an integer from 1 to 23, for example, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, It can be 20, 21, 22, or 23 (inclusive of all ranges and subranges in between). z’ can be an integer between 5 and 15. z’ can be an integer from 9 to 13. z’ could be 11.

전술한 바와 같이, 링커 또는 M(여기서 M은 링커의 일부임)은 화물 상의 임의의 적절한 위치에서 화물에 공유 결합될 수 있다. 링커 또는 M(여기서 M은 링커의 일부임)은 올리고뉴클레오티드 화물의 3’ 단부 또는 올리고뉴클레오티드 화물의 5’ 단부에 공유 결합될 수 있다. 링커 또는 M(여기서 M은 링커의 일부임)은 펩티드 화물의 N-말단 또는 C-말단에 공유 결합될 수 있다. 링커 또는 M(여기서 M은 링커의 일부임)은 올리고뉴클레오티드 또는 펩티드 화물의 백본에 공유 결합될 수 있다.As described above, the linker or M, where M is part of a linker, may be covalently attached to the cargo at any suitable location on the cargo. The linker or M (where M is part of the linker) may be covalently attached to the 3' end of the oligonucleotide cargo or to the 5' end of the oligonucleotide cargo. The linker or M (where M is part of the linker) may be covalently attached to the N-terminus or C-terminus of the peptide cargo. The linker or M (where M is part of the linker) may be covalently attached to the backbone of the oligonucleotide or peptide cargo.

링커는 cCPP 상에서 아스파르트산, 글루탐산, 글루타민, 아스파라긴, 또는 리신의 측쇄, 또는 글루타민 또는 아스파라긴의 변형된 측쇄(예를 들어, 아미노기를 갖는 환원된 측쇄)에 결합될 수 있다. 링커는 cCPP 상에서 리신의 측쇄에 결합될 수 있다.The linker may be attached to a side chain of aspartic acid, glutamic acid, glutamine, asparagine, or lysine, or to a modified side chain of glutamine or asparagine (e.g., a reduced side chain with an amino group) on cCPP. The linker can be linked to the side chain of lysine on cCPP.

링커는 펩티드 화물 상에서 아스파르트산, 글루탐산, 글루타민, 아스파라긴, 또는 리신의 측쇄, 또는 글루타민 또는 아스파라긴의 변형된 측쇄(예를 들어, 아미노기를 갖는 환원된 측쇄)에 결합될 수 있다. 링커는 펩티드 화물 상에서 리신의 측쇄에 결합될 수 있다.The linker may be attached to the side chain of aspartic acid, glutamic acid, glutamine, asparagine, or lysine, or to a modified side chain of glutamine or asparagine (e.g., a reduced side chain with an amino group) on the peptide cargo. The linker can be attached to the side chain of lysine on the peptide cargo.

링커는 다음 구조를 가질 수 있고: A linker may have the following structure:

, ,

식 중During the ceremony

M은 L을 화물(예: 올리고뉴클레오티드)에 접합시키는 기이고;M is a group that conjugates L to a cargo (e.g., oligonucleotide);

AAs는 cCPP 상의 아미노산의 측쇄 또는 말단이고;AA s is the side chain or terminus of an amino acid on cCPP;

각각의 AAx는 독립적으로 아미노산 잔기이고;Each AA x is independently an amino acid residue;

o는 0 내지 10의 정수이고;o is an integer from 0 to 10;

y는 0 내지 5의 정수이다.y is an integer from 0 to 5.

링커는 다음 구조를 가질 수 있고: A linker may have the following structure:

, ,

식 중During the ceremony

M은 L을 화물(예: 올리고뉴클레오티드)에 접합시키는 기이고;M is a group that conjugates L to a cargo (e.g., oligonucleotide);

AAs는 cCPP 상의 아미노산의 측쇄 또는 말단이고;AA s is the side chain or terminus of an amino acid on cCPP;

각각의 AAx는 독립적으로 아미노산 잔기이고;Each AA x is independently an amino acid residue;

o는 0 내지 10의 정수이고;o is an integer from 0 to 10;

y는 0 내지 5의 정수이다.y is an integer from 0 to 5.

M은 알킬렌, 알케닐렌, 알키닐렌, 카르보시클릴, 또는 헤테로시클릴을 포함할 수 있으며, 이들 각각은 임의 치환된다. M은 다음으로부터 선택될 수 있고:M may include alkylene, alkenylene, alkynylene, carbocyclyl, or heterocyclyl, each of which is optionally substituted. M can be selected from:

식 중 R은 알킬, 알케닐, 알키닐, 카르보시클릴, 또는 헤테로시클를이다. wherein R is alkyl, alkenyl, alkynyl, carbocyclyl, or heterocycle.

M은 다음으로부터 선택될 수 있고:M can be selected from:

식 중: R10은 알킬렌, 시클로알킬, 또는 이고, 여기서 a는 0 내지 10이다.where: R 10 is alkylene, cycloalkyl, or , where a is 0 to 10.

M은 이고, R10이고, a는 0 내지 10이다. M은 일 수 있다.M is And R 10 is and a is 0 to 10. M is It can be.

M은 헤테로이작용성 가교링커, 예를 들어 일 수 있으며, 이는 Williams 등의 문헌[Curr. Protoc Nucleic Acid Chem. 2010, 42, 4.41.1-4.41.20]에 개시되어 있고, 동 문헌은 그 전체가 참조로서 본원에 통합된다.M is a heterobifunctional crosslinker, e.g. It may be, which is described in Williams et al. [ Curr. Protoc Nucleic Acid Chem. 2010 , 42 , 4.41.1-4.41.20, which is hereby incorporated by reference in its entirety.

M은 -C(O)-일 수 있다.M may be -C(O)-.

AAs는 cCPP 상의 아미노산의 측쇄 또는 말단일 수 있다. AAs의 비제한적인 예는 아스파르트산, 글루탐산, 글루타민, 아스파라긴, 또는 리신, 또는 글루타민 또는 아스파라긴의 변형된 측쇄(예를 들어, 아미노기를 갖는 감소된 측쇄)를 포함한다. AAs는 본원에서 정의된 바와 같은 AASC일 수 있다.AA s can be a side chain or terminal of an amino acid on cCPP. Non-limiting examples of AA s include aspartic acid, glutamic acid, glutamine, asparagine, or lysine, or modified side chains of glutamine or asparagine (e.g., reduced side chains with amino groups). AA s may be AA SC as defined herein.

각각의 AAx는 독립적으로 천연 또는 비-천연 아미노산이다. 하나 이상의 AAx는 천연 아미노산일 수 있다. 하나 이상의 AAx는 비-천연 아미노산일 수 있다. 하나 이상의 AAx는 β-아미노산일 수 있다. β-아미노산은 β-알라닌일 수 있다.Each AA x is independently a natural or non-natural amino acid. One or more AA x may be a natural amino acid. One or more AA x may be a non-natural amino acid. One or more AA x may be a β-amino acid. The β-amino acid may be β-alanine.

o는 0 내지 10의 정수, 예를 들어 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 및 10일 수 있다. o는 0, 1, 2, 또는 3일 수 있다. o는 0일 수 있다. o는 1일 수 있다. o는 2일 수 있다. o는 3일 수 있다.o can be an integer from 0 to 10, such as 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, and 10. o can be 0, 1, 2, or 3. o may be 0. o may be 1. o may be 2. o can be 3.

p는 0 내지 5, 예를 들어 0, 1, 2, 3, 4, 또는 5일 수 있다. p는 0일 수 있다. p는 1일 수 있다. p는 2일 수 있다. p는 3일 수 있다. p는 4일 수 있다. p는 5일 수 있다.p can be 0 to 5, for example 0, 1, 2, 3, 4, or 5. p may be 0. p may be 1. p may be 2. p may be 3. p may be 4. p may be 5.

링커는 다음 구조를 가질 수 있고:A linker may have the following structure:

또는 , or ,

식 중 M, AAs, 각각의 -(R1-J-R2)z”-, o, 및 z”은 본원에서 정의되고; r은 0 또는 1일 수 있다.wherein M, AA s , each of -(R 1- JR 2 )z”-, o, and z” are defined herein; r can be 0 or 1.

r은 0일 수 있다. r은 1일 수 있다.r may be 0. r may be 1.

링커는 다음 구조를 가질 수 있고:A linker may have the following structure:

또는 , or ,

식 중 M, AAs, o, p, q, r, 및 z” 각각은 본원에서 정의된 바와 같을 수 있다.In the formula, each of M, AA s , o, p, q, r, and z” may be as defined herein.

z”은 1 내지 50의 정수, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 및 50일 수 있다(이들 사이의 모든 범위 및 값을 포함함). z”은 5~20의 정수일 수 있다. z”은 10~15의 정수일 수 있다.z” is an integer from 1 to 50, such as 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, It can be 45, 46, 47, 48, 49, and 50 (inclusive of all ranges and values in between). z” can be an integer from 5 to 20. z” may be an integer from 10 to 15.

링커는 다음 구조를 가질 수 있고:A linker may have the following structure:

, ,

식 중:During the ceremony:

M, AAs, 및 o는 본원에서 정의된 바와 같다.M, AA s , and o are as defined herein.

적절한 링커의 다른 비제한적인 예는 다음을 포함하며:Other non-limiting examples of suitable linkers include:

, ,

식 중 M 및 AAs는 본원에서 정의된 바와 같다.wherein M and AA s are as defined herein.

cCPP 및 AC를 포함하는 화합물이 본원에 제공되며, 여기서 AC는 L을 추가로 포함하는 pre-mRNA 서열에서 표적에 상보적이고, 링커는 결합기(M)를 통해 AC에 접합되고, M은 이다.Provided herein are compounds comprising cCPP and AC, wherein AC is complementary to the target in a pre-mRNA sequence further comprising L, the linker is conjugated to AC through a linker (M), and M is am.

cCPP 및 화물을 포함하는 화합물이 본원에 제공되며, 여기서 화물은 안티센스 화합물(AC). 예를 들어 pre-mRNA 서열에서 표적에 상보적인 안티센스 올리고뉴클레오티드를 포함하고, 상기 화합물은 L을 추가로 포함하고, 링커는 결합기(M)를 통해 AC에 접합되고, M은 다음으로부터 선택되고:Provided herein are compounds comprising cCPP and a cargo, wherein the cargo is an antisense compound (AC). For example, comprising an antisense oligonucleotide complementary to a target in a pre-mRNA sequence, wherein the compound further comprises L, the linker is conjugated to AC through a linker (M), and M is selected from:

, ; 식 중: R1은 알킬렌, 시클로알킬, 또는 이고, t’은 0 내지 10이고, 각각의 R은 독립적으로 알킬, 알케닐, 알키닐, 카르보시클릴, 또는 헤테로시클릴이고, R1이고, t’은 2이다. , ; where: R 1 is alkylene, cycloalkyl, or and t' is 0 to 10, each R is independently alkyl, alkenyl, alkynyl, carbocyclyl, or heterocyclyl, and R 1 is and t' is 2.

링커는 다음 구조를 가질 수 있고:A linker may have the following structure:

, ,

식 중 AAs는 본원에서 정의된 바와 같고, m’은 0~10이다.In the formula, AA s is as defined herein, and m' is 0 to 10.

링커는 다음 식의 링커일 수 있다:The linker may be a linker of the formula:

. .

링커는 다음 식의 링커일 수 있으며: , 식 중 “염기”는 화물 포스포로디아미데이트 모르폴리노 올리고머의 3’ 단부에 있는 핵염기이다.The linker may be a linker of the formula: , where “base” is the nucleobase at the 3’ end of the cargo phosphorodiamidate morpholino oligomer.

링커는 다음 식의 링커일 수 있고: The linker may be a linker of the formula:

, 식 중 “염기”는 화물 포스포로디아미데이트 모르폴리노 올리고머의 3’ 단부에 있는 핵염기에 상응한다. , where “base” corresponds to the nucleobase at the 3’ end of the cargo phosphorodiamidate morpholino oligomer.

링커는 다음 식의 링커일 수 있고: The linker may be a linker of the formula:

, 식 중 “염기”는 화물 포스포로디아미데이트 모르폴리노 올리고머의 3’ 단부에 있는 핵염기이다. , where “base” is the nucleobase at the 3’ end of the cargo phosphorodiamidate morpholino oligomer.

링커는 다음 식의 링커일 수 있으며: , 식 중 “염기”는 화물 포스포로디아미데이트 모르폴리노 올리고머의 3’ 단부에 있는 핵염기이다.The linker may be a linker of the formula: , where “base” is the nucleobase at the 3’ end of the cargo phosphorodiamidate morpholino oligomer.

링커는 다음 식의 링커일 수 있다: The linker may be a linker of the formula:

. .

링커는 화물 상의 임의의 적절한 위치에서 화물에 공유 결합될 수 있다. 링커는 화물의 3’ 단부 또는 올리고뉴클레오티드 화물의 5’ 단부에 공유 결합된다. 링커는 화물의 백본에 공유 결합될 수 있다.The linker may be covalently attached to the cargo at any suitable location on the cargo. The linker is covalently attached to the 3' end of the cargo or to the 5' end of the oligonucleotide cargo. The linker may be covalently attached to the backbone of the cargo.

링커는 cCPP 상에서 아스파르트산, 글루탐산, 글루타민, 아스파라긴, 또는 리신의 측쇄, 또는 글루타민 또는 아스파라긴의 변형된 측쇄(예를 들어, 아미노기를 갖는 환원된 측쇄)에 결합될 수 있다. 링커는 cCPP 상에서 리신의 측쇄에 결합될 수 있다.The linker may be attached to a side chain of aspartic acid, glutamic acid, glutamine, asparagine, or lysine, or to a modified side chain of glutamine or asparagine (e.g., a reduced side chain with an amino group) on cCPP. The linker can be linked to the side chain of lysine on cCPP.

cCPP-링커 접합체cCPP-linker conjugate

cCPP는 본원에서 정의된 링커에 접합될 수 있다. 링커는 본원에서 정의된 것과 같은 cCPP의 AASC에 접합될 수 있다.cCPP can be conjugated to linkers defined herein. The linker may be conjugated to the AA SC of cCPP as defined herein.

링커는 (예를 들어 스페이서로서) -(OCH2CH2)z’- 서브유닛을 포함할 수 있으며, 여기서 z’은 1 내지 23의 정수, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 또는 23이다. “-(OCH2CH2)z’은 PEG로도 지칭된다. cCPP-링커 접합체는 표 7로부터 선택된 구조를 가질 수 있다:The linker may comprise (e.g. as a spacer) -(OCH 2 CH 2 ) z' -subunit, where z' is an integer from 1 to 23, for example 1, 2, 3, 4, 5, It is 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, or 23. “-(OCH 2 CH 2 ) z’ is also referred to as PEG. The cCPP-linker conjugate may have a structure selected from Table 7 :

cCPP-링커 접합체 및 서열번호cCPP-linker conjugate and SEQ ID NO: 시클로(FfФ-4gp-r-4gp-rQ)-PEG4-K-NH2 Cyclo (FfФ-4gp-r-4gp-rQ)-PEG 4 -K-NH 2 시클로(서열번호 118)-PEG4-K-NH2 Cyclo (SEQ ID NO: 118)-PEG 4 -K-NH 2 시클로(FfФ-Cit-r-Cit-rQ)-PEG4-K-NH2 Cyclo (FfФ-Cit-r-Cit-rQ)-PEG 4 -K-NH 2 시클로(서열번호 119)-PEG4-K-NH2 Cyclo (SEQ ID NO: 119)-PEG 4 -K-NH 2 시클로(FfФ-Pia-r-Pia-rQ)-PEG4-K-NH2 Cyclo (FfФ-Pia-r-Pia-rQ)-PEG 4 -K-NH 2 시클로(서열번호 120)-PEG4-K-NH2 Cyclo (SEQ ID NO: 120)-PEG 4 -K-NH 2 시클로(FfФ-Dml-r-Dml -rQ)-PEG4-K-NH2 Cyclo (FfФ-Dml-r-Dml -rQ)-PEG 4 -K-NH 2 시클로(서열번호 121)-PEG4-K-NH2 Cyclo (SEQ ID NO: 121)-PEG 4 -K-NH 2 시클로(FfФ-Cit-r-Cit-rQ)-PEG12-OH Cyclo (FfФ-Cit-r-Cit-rQ)-PEG 12 -OH 시클로(서열번호 122)-PEG12-OH Cyclo (SEQ ID NO: 122)-PEG 12 -OH 시클로(fФR-Cit-R-Cit-Q)-PEG12-OH Cyclo (fФR-Cit-R-Cit-Q)-PEG 12 -OH 시클로(서열번호 123)-PEG12-OH Cyclo (SEQ ID NO: 123)-PEG 12 -OH

링커는 -(OCH2CH2)z’- 서브유닛(여기서 z’은 1 내지 23의 정수임), 및 펩티드 서브유닛을 포함할 수 있다. 펩티드 서브유닛은 2 내지 10개의 아미노산을 포함할 수 있다. cCPP-링커 접합체는 표 8로부터 선택된 구조를 가질 수 있다:The linker may include a -(OCH 2 CH 2 ) z' -subunit, where z' is an integer from 1 to 23, and a peptide subunit. A peptide subunit may contain 2 to 10 amino acids. The cCPP-linker conjugate may have a structure selected from Table 8 :

cCPP-링커 접합체 및 서열번호cCPP-linker conjugate and SEQ ID NO: Ac-PKKKRKV-Lys(시클로[FfФ-R-r-Cit-rQ])-PEG12-K(N3)-NH2 Ac-PKKKRKV-Lys(cyclo[FfФ-Rr-Cit-rQ])-PEG 12 -K(N 3 )-NH 2 Ac-서열번호 42-Lys(시클로[서열번호 127])-PEG12-K(N3)-NH2 Ac-SEQ ID NO: 42-Lys (cyclo[SEQ ID NO: 127])-PEG 12 -K(N 3 )-NH 2 Ac-PKKKRKV-Lys(시클로[FfФ-Cit-r-R-rQ])-PEG12-K(N3)-NH2 Ac-PKKKRKV-Lys(cyclo[FfФ-Cit-rR-rQ])-PEG 12 -K(N 3 )-NH 2 Ac- 서열번호 42-Lys(시클로[서열번호 128])-PEG12-K(N3)-NH2 Ac- SEQ ID NO: 42-Lys (cyclo[SEQ ID NO: 128])-PEG 12 -K(N 3 )-NH 2 Ac-PKKKRKV-K(시클로(FfФR-cit-R-cit-Q))-PEG12-K(N3)-NH2 Ac-PKKKRKV-K(cyclo(FfФR-cit-R-cit-Q))-PEG 12 -K(N 3 )-NH 2 Ac- 서열번호 42-K(시클로(서열번호 129))-PEG12-K(N3)-NH2 Ac- SEQ ID NO: 42-K (Cyclo (SEQ ID NO: 129)) -PEG 12 -K(N 3 )-NH 2 Ac-PKKKRKV-PEG2-Lys(시클로[FfФ-Cit-r-Cit-rQ])-B-k(N3)-NH2 Ac-PKKKRKV-PEG2-Lys(cyclo[FfФ-Cit-r-Cit-rQ])-Bk(N 3 )-NH 2 Ac- 서열번호 42-PEG2-Lys(시클로[서열번호 130])-B-k(N3)-NH2 Ac- SEQ ID NO: 42-PEG2-Lys(cyclo[SEQ ID NO: 130])-Bk(N 3 )-NH 2 Ac-PKKKRKV-PEG2-Lys(시클로[FfФ-Cit-r-Cit-rQ])-PEG2-k(N3)-NH2 Ac-PKKKRKV-PEG2-Lys(cyclo[FfФ-Cit-r-Cit-rQ])-PEG2-k(N 3 )-NH 2 Ac- 서열번호 42-PEG2-Lys(시클로[서열번호 130])-PEG2-k(N3)-NH2 Ac- SEQ ID NO: 42-PEG2-Lys (cyclo[SEQ ID NO: 130])-PEG2-k(N 3 )-NH 2 Ac-PKKKRKV-PEG2-Lys(시클로[FfФ-Cit-r-Cit-rQ])-PEG4-k(N3)-NH2 Ac-PKKKRKV-PEG2-Lys(cyclo[FfФ-Cit-r-Cit-rQ])-PEG4-k(N 3 )-NH 2 Ac- 서열번호 42-PEG2-Lys(시클로[서열번호 130])-PEG4-k(N3)-NH2 Ac- SEQ ID NO: 42-PEG2-Lys (cyclo[SEQ ID NO: 130])-PEG4-k(N 3 )-NH 2 Ac-PKKKRKV-Lys(시클로[FfФ-Cit-r-Cit-rQ])-PEG12-k(N3)-NH2 Ac-PKKKRKV-Lys(cyclo[FfФ-Cit-r-Cit-rQ])-PEG12-k(N 3 )-NH 2 Ac- 서열번호 42-Lys(시클로[서열번호 130])-PEG12-k(N3)-NH2 Ac- SEQ ID NO: 42-Lys (cyclo[SEQ ID NO: 130])-PEG12-k(N 3 )-NH 2 Ac-pkkkrkv-PEG2-Lys(시클로[FfФ-Cit-r-Cit-rQ])-PEG12-k(N3)-NH2 Ac-pkkkrkv-PEG2-Lys(cyclo[FfФ-Cit-r-Cit-rQ])-PEG12-k(N 3 )-NH 2 Ac- 서열번호 131-PEG2-Lys(시클로[서열번호 130])-PEG12-k(N3)-NH2 Ac- SEQ ID NO: 131-PEG2-Lys (cyclo[SEQ ID NO: 130])-PEG12-k(N 3 )-NH 2 Ac-rrv-PEG2-Lys(시클로[FfФ-Cit-r-Cit-rQ])-PEG12-OHAc-rrv-PEG2-Lys(cyclo[FfФ-Cit-r-Cit-rQ])-PEG12-OH Ac-rrv-PEG2-Lys(시클로[서열번호 130])-PEG12-OHAc-rrv-PEG2-Lys (cyclo [SEQ ID NO: 130]) -PEG12-OH Ac-PKKKRKV-PEG2-Lys(시클로[FfФ-Cit-r-Cit-r-Q])-PEG12-k(N3)-NH2 Ac-PKKKRKV-PEG2-Lys(cyclo[FfФ-Cit-r-Cit-rQ])-PEG12-k(N 3 )-NH 2 Ac- 서열번호 42-PEG2-Lys(시클로[서열번호 130])-PEG12-k(N3)-NH2 Ac- SEQ ID NO: 42-PEG2-Lys (cyclo[SEQ ID NO: 130])-PEG12-k(N 3 )-NH 2 Ac-PKKK-Cit-KV-PEG2-Lys(시클로[FfФ-Cit-r-Cit-r-Q])-PEG12-k(N3)-NH2 Ac-PKKK-Cit-KV-PEG2-Lys(cyclo[FfФ-Cit-r-Cit-rQ])-PEG12-k(N 3 )-NH 2 Ac- 서열번호 126-PEG2-Lys(시클로[서열번호 130])-PEG12-k(N3)-NH2 Ac- SEQ ID NO: 126-PEG2-Lys (cyclo[SEQ ID NO: 130])-PEG12-k(N 3 )-NH 2 Ac-PKKKRKV-PEG2-Lys(시클로[FfФ-Cit-r-Cit-r-Q]-PEG12-K(N3)-NH2 Ac-PKKKRKV-PEG2-Lys( cyclo [FfФ-Cit-r-Cit-rQ] - PEG12-K(N 3 )-NH 2 Ac- 서열번호 42-PEG2-Lys(시클로[서열번호 130]-PEG12-K(N3)-NH2 Ac- SEQ ID NO: 42-PEG2-Lys ( cyclo [SEQ ID NO: 130] - PEG12-K(N 3 )-NH 2

환형 세포 투과 펩티드(cCPP), 링커, 및 환외 펩티드(EP)를 포함하는 EEV가 제공된다. EEV는 식 (B)의 구조: EEVs comprising a circular cell penetrating peptide (cCPP), a linker, and an exocyclic peptide (EP) are provided. EEV has the structure of equation (B):

(B), 또는 이의 양성자화된 형태를 포함할 수 있고, (B), or a protonated form thereof,

식 중:During the ceremony:

R1, R2, 및 R3은 각각 독립적으로 H이거나 아미노산의 방향족 또는 헤테로방향족 측쇄이고;R 1 , R 2 , and R 3 are each independently H or an aromatic or heteroaromatic side chain of an amino acid;

R4 및 R7은 독립적으로 H이거나 아미노산 측쇄이고;R 4 and R 7 are independently H or an amino acid side chain;

EP는 본원에서 정의된 바와 같은 환외 펩티드이고;EP is an exophytic peptide as defined herein;

각각의 m은 독립적으로 0~3의 정수이고;Each m is independently an integer from 0 to 3;

n은 0~2의 정수이고;n is an integer from 0 to 2;

x’은 1~20의 정수이고;x’ is an integer from 1 to 20;

y는 1~5의 정수이고;y is an integer from 1 to 5;

q는 1~4이고;q is 1 to 4;

z’은 1~23의 정수이다.z’ is an integer from 1 to 23.

R1, R2, R3, R4, R7, EP, m, q, y, x’, z’은 본원에 기술된 바와 같다.R 1 , R 2 , R 3 , R 4 , R 7 , EP, m, q, y, x', z' are as described herein.

n은 0일 수 있다. n은 1일 수 있다. n은 2일 수 있다.n may be 0. n may be 1. n may be 2.

EEV는 식 (B-a) 또는 (B-b)의 구조:EEV has the structure of formula (B-a) or (B-b):

(B-a), (Ba),

(B-b), 또는 이의 양성자화된 형태를 포함할 수 있고, 식 중 EP, R1, R2, R3, R4, m, 및 z’은 식 (B)에서 정의된 바와 같다. (Bb), or a protonated form thereof, wherein EP, R 1 , R 2 , R 3 , R 4 , m, and z’ are as defined in formula (B).

EEV는 식 (B-c)의 구조:EEV has the structure of equation (B-c):

(B-c), (BC),

또는 이의 양성자화된 형태를 포함할 수 있으며, 식 중 EP, R1, R2, R3, R4, 및 m은 식 (B)에서 상기 정의된 바와 같고; AA는 본원에서 정의된 것과 같은 아미노산이고; M은 본원에서 정의된 바와 같고; n은 0~2의 정수이고; x는 1~10의 정수이고; y는 1~5의 정수이고; z는 1~10의 정수이다.or protonated forms thereof, wherein EP, R 1 , R 2 , R 3 , R 4 , and m are as defined above in formula (B); AA is an amino acid as defined herein; M is as defined herein; n is an integer from 0 to 2; x is an integer from 1 to 10; y is an integer from 1 to 5; z is an integer from 1 to 10.

EEV는 식 (B-1), (B-2), (B-3), 또는 (B-4)의 구조:EEV has the structure of formula (B-1), (B-2), (B-3), or (B-4):

(B-1), (B-1),

(B-2), (B-2),

(B-3), (B-3),

(B-4), 또는 이의 양성자화된 형태를 가질 수 있고, 식 중 EP는 식 (B)에서 상기 정의된 바와 같디. (B-4), or a protonated form thereof, wherein EP is as defined above in formula (B).

EEV는 식 (B)의 구조를 포함할 수 있고 다음 구조를 가질 수 있다: Ac-PKKKRKVAEEA-K(시클로[FGFGRGRQ])-PEG12-OH (Ac-서열번호 132- K(시클로[서열번호 82])-PEG12-OH) 또는 Ac-PK-KKR-KV-AEEA-K(시클로[GfFGrGrQ])-PEG12-OH (Ac- 서열번호 133-K(시클로[서열번호 83])-PEG12-OH).EEV may comprise a structure of formula (B) and may have the following structure: Ac-PKKKRKVAEEA-K( cyclo [FGFGRGRQ])-PEG 12 -OH (Ac-SEQ ID NO: 132-K( cyclo [SEQ ID NO: 82 ])-PEG 12 -OH) or Ac-PK-KKR-KV-AEEA-K( cyclo [GfFGrGrQ])-PEG 12 -OH (Ac- SEQ ID NO: 133-K ( cyclo [SEQ ID NO: 83])-PEG 12 -OH).

EEV는 다음 식의 cCPP를 포함할 수 있다:EEV may contain cCPP of the formula:

EEV는 다음 식을 포함할 수 있다: Ac-PKKKRKV-miniPEG2-Lys(시클로(FfFGRGRQ)-PEG2-K(N3) (Ac-서열번호 42-miniPEG2-Lys(시클로(서열번호 81)-PEG2-K(N3)).EEV may comprise the following formula: Ac-PKKKRKV-miniPEG 2 -Lys(cyclo(FfFGRGRQ)-PEG 2 -K(N 3 ) (Ac-SEQ ID NO: 42-miniPEG 2 -Lys(cyclo(SEQ ID NO: 81) -PEG 2 -K(N 3 )).

EEV는 다음과 같을 수 있다:EEV can be:

EEV는 다음과 같을 수 있다: EEV can be:

. .

EEV는 Ac-P-K(Tfa)-K(Tfa)-K(Tfa)-R-K(Tfa)-V-miniPEG2-K(cyclo(Ff-Nal-GrGrQ)-PEG12-OH (Ac-서열번호 134-miniPEG2-K(시클로(서열번호 135)-PEG12-OH)일 수 있다.EEV is Ac-PK(Tfa)-K(Tfa)-K(Tfa)-RK(Tfa)-V-miniPEG 2 -K( cyclo (Ff-Nal-GrGrQ)-PEG 12 -OH (Ac- SEQ ID NO: 134 -miniPEG 2 -K ( cyclo (SEQ ID NO: 135) -PEG 12 -OH).

EEV는 다음과 같을 수 있다: EEV can be:

. .

EEV는 Ac-P-K-K-K-R-K-V-miniPEG2-K(시클로(Ff-Nal-GrGrQ)-PEG12-OH (Ac- 서열번호 42-miniPEG2-K(시클로(서열번호 135)-PEG12-OH)일 수 있다.EEV can be Ac-PKKKRKV-miniPEG 2 -K( Cyclo (Ff-Nal-GrGrQ)-PEG 12 -OH (Ac-SEQ ID NO:42-miniPEG 2 -K( Cyclo (SEQ ID NO:135)-PEG 12 -OH) there is.

EEV는 다음과 같을 수 있다: EEV can be:

. .

EEV는 다음과 같을 수 있다: EEV can be:

. .

EEV는 다음과 같을 수 있다:EEV can be:

EEV는 다음과 같을 수 있다:EEV can be:

EEV는 다음과 같을 수 있다: EEV can be:

. .

EEV는 다음과 같을 수 있다: EEV can be:

EEV는 다음과 같을 수 있다:EEV can be:

EEV는 다음과 같을 수 있다: EEV can be:

EEV는 다음과 같을 수 있다:EEV can be:

. .

EEV는 다음과 같을 수 있다:EEV can be:

. .

EEV는 다음과 같을 수 있다: EEV can be:

. .

EEV는 다음으로부터 선택될 수 있다:EEV can be selected from:

EEV는 다음으로부터 선택될 수 있다:EEV can be selected from:

Ac-PKKKRKV-Lys(시클로[FfΦGrGrQ])-PEG12-K(N3)-NH2 Ac-PKKKRKV-Lys( cyclo [FfΦGrGrQ])-PEG 12 -K(N 3 )-NH 2

(Ac- 서열번호 42-Lys(시클로[서열번호 80])-PEG12-K(N3)-NH2)(Ac- SEQ ID NO: 42-Lys ( cyclo [SEQ ID NO: 80])-PEG 12 -K(N 3 )-NH 2 )

Ac-PKKKRKV-miniPEG2-Lys(시클로[FfΦGrGrQ])-miniPEG2-K(N3)-NH2 Ac-PKKKRKV-miniPEG 2 -Lys( cyclo [FfΦGrGrQ])-miniPEG 2 -K(N 3 )-NH 2

(Ac- 서열번호 42-miniPEG2-Lys(시클로[서열번호 80])-miniPEG2-K(N3)-NH2)(Ac- SEQ ID NO: 42-miniPEG 2 -Lys( cyclo [SEQ ID NO: 80])-miniPEG 2 -K(N 3 )-NH 2 )

Ac-PKKKRKV-miniPEG2-Lys(시클로[FGFGRGRQ])-miniPEG2-K(N3)-NH2 Ac-PKKKRKV-miniPEG 2 -Lys( cyclo [FGFGRGRQ])-miniPEG 2 -K(N 3 )-NH 2

(Ac- 서열번호 42-miniPEG2-Lys(시클로[서열번호 82])-miniPEG2-K(N3)-NH2)(Ac- SEQ ID NO: 42-miniPEG 2 -Lys( cyclo [SEQ ID NO: 82])-miniPEG 2 -K(N 3 )-NH 2 )

Ac-KR-PEG2-K(시클로[FGFGRGRQ])-PEG2-K(N3)-NH2 Ac-KR-PEG 2 -K( cyclo [FGFGRGRQ])-PEG 2 -K(N 3 )-NH 2

(Ac-KR-PEG2-K(시클로[서열번호 82])-PEG2-K(N3)-NH2)(Ac-KR-PEG 2 -K( cyclo [SEQ ID NO: 82])-PEG 2 -K(N 3 )-NH 2 )

Ac-PKKKGKV-PEG2-K(시클로[FGFGRGRQ])-PEG2-K(N3)-NH2 Ac-PKKKGKV-PEG 2 -K( cyclo [FGFGRGRQ])-PEG 2 -K(N 3 )-NH 2

(Ac- 서열번호 46-PEG2-K(시클로[서열번호 82])-PEG2-K(N3)-NH2)(Ac- SEQ ID NO: 46-PEG 2 -K( cyclo [SEQ ID NO: 82])-PEG 2 -K(N 3 )-NH 2 )

Ac-PKKKRKG-PEG2-K(시클로[FGFGRGRQ])-PEG2-K(N3)-NH2 Ac-PKKKRKG-PEG 2 -K( cyclo [FGFGRGRQ])-PEG 2 -K(N 3 )-NH 2

(Ac- 서열번호 48-PEG2-K(시클로[서열번호 82])-PEG2-K(N3)-NH2)(Ac- SEQ ID NO: 48-PEG 2 -K( cyclo [SEQ ID NO: 82])-PEG 2 -K(N 3 )-NH 2 )

Ac-KKKRK-PEG2-K(시클로[FGFGRGRQ])-PEG2-K(N3)-NH2 Ac-KKKRK-PEG 2 -K( cyclo [FGFGRGRQ])-PEG 2 -K(N 3 )-NH 2

(Ac- 서열번호 19-PEG2-K(시클로[서열번호 82])-PEG2-K(N3)-NH2)(Ac- SEQ ID NO: 19-PEG 2 -K( cyclo [SEQ ID NO: 82])-PEG 2 -K(N 3 )-NH 2 )

Ac-PKKKRKV-miniPEG2-Lys(시클로[FFΦGRGRQ])-miniPEG2-K(N3)-NH2 Ac-PKKKRKV-miniPEG 2 -Lys( cyclo [FFΦGRGRQ])-miniPEG 2 -K(N 3 )-NH 2

(Ac- 서열번호 42-miniPEG2-Lys(시클로[서열번호 80])-miniPEG2-K(N3)-NH2)(Ac- SEQ ID NO: 42-miniPEG 2 -Lys( cyclo [SEQ ID NO: 80])-miniPEG 2 -K(N 3 )-NH 2 )

Ac-PKKKRKV-miniPEG2-Lys(시클로[βhFfΦGrGrQ])-miniPEG2-K(N3)-NH2 Ac-PKKKRKV-miniPEG 2 -Lys( cyclo [βhFfΦGrGrQ])-miniPEG 2 -K(N 3 )-NH 2

(Ac- 서열번호 42-miniPEG2-Lys(시클로[서열번호 142])-miniPEG2-K(N3)-NH2)(Ac- SEQ ID NO: 42-miniPEG 2 -Lys( cyclo [SEQ ID NO: 142])-miniPEG 2 -K(N 3 )-NH 2 )

Ac-PKKKRKV-miniPEG2-Lys(시클로[FfΦSrSrQ])-miniPEG2-K(N3)-NH2 Ac-PKKKRKV-miniPEG 2 -Lys( cyclo [FfΦSrSrQ])-miniPEG 2 -K(N 3 )-NH 2

(Ac- 서열번호 42-miniPEG2-Lys(시클로[서열번호 143])-miniPEG2-K(N3)-NH2).(Ac-SEQ ID NO:42-miniPEG 2 -Lys( cyclo [SEQ ID NO:143])-miniPEG 2 -K(N 3 )-NH 2 ).

EEV는 다음으로부터 선택될 수 있다:EEV can be selected from:

Ac-PKKKRKV-miniPEG2-Lys(시클로(GfFGrGrQ])-PEG12-OH Ac-PKKKRKV-miniPEG 2 -Lys( cyclo (GfFGrGrQ])-PEG 12 -OH

(Ac- 서열번호 42-miniPEG2-Lys(시클로(서열번호 133])-PEG12-OH)(Ac- SEQ ID NO: 42-miniPEG 2 -Lys( cyclo (SEQ ID NO: 133])-PEG 12 -OH)

Ac-PKKKRKV-miniPEG2-Lys(시클로[FGFKRKRQ])-PEG12-OH Ac-PKKKRKV-miniPEG 2 -Lys( cyclo [FGFKRKRQ])-PEG 12 -OH

(Ac- 서열번호 42-miniPEG2-Lys(시클로[서열번호 144])-PEG12-OH)(Ac- SEQ ID NO: 42-miniPEG 2 -Lys( cyclo [SEQ ID NO: 144])-PEG 12 -OH)

Ac-PKKKRKV-miniPEG2-Lys(시클로[FGFRGRGQ])-PEG12-OH Ac-PKKKRKV-miniPEG 2 -Lys( cyclo [FGFRGRGQ])-PEG 12 -OH

(Ac- 서열번호 42-miniPEG2-Lys(시클로[서열번호 145])-PEG12-OH)(Ac- SEQ ID NO: 42-miniPEG 2 -Lys( cyclo [SEQ ID NO: 145])-PEG 12 -OH)

Ac-PKKKRKV-miniPEG2-Lys(시클로[FGFGRGRGRQ])-PEG12-OH Ac-PKKKRKV-miniPEG 2 -Lys( cyclo [FGFGRGRGRQ])-PEG 12 -OH

(Ac- 서열번호 42-miniPEG2-Lys(시클로[서열번호 146])-PEG12-OH)(Ac- SEQ ID NO: 42-miniPEG 2 -Lys( cyclo [SEQ ID NO: 146])-PEG 12 -OH)

Ac-PKKKRKV-miniPEG2-Lys(시클로[FGFGRrRQ])-PEG12-OHAc-PKKKRKV-miniPEG 2 -Lys( cyclo [FGFGRrRQ])-PEG 12 -OH

(Ac- 서열번호 42-miniPEG2-Lys(시클로[서열번호 147])-PEG12-OH)(Ac- SEQ ID NO: 42-miniPEG 2 -Lys( cyclo [SEQ ID NO: 147])-PEG 12 -OH)

Ac-PKKKRKV-miniPEG2-Lys(시클로[FGFGRRRQ])-PEG12-OH Ac-PKKKRKV-miniPEG 2 -Lys( cyclo [FGFGRRRQ])-PEG 12 -OH

(Ac- 서열번호 42-miniPEG2-Lys(시클로[서열번호 84])-PEG12-OH) 및 (Ac- SEQ ID NO: 42-miniPEG 2 -Lys( cyclo [SEQ ID NO: 84])-PEG 12 -OH) and

Ac-PKKKRKV-miniPEG2-Lys(시클로[FGFRRRRQ])-PEG12-OH Ac-PKKKRKV-miniPEG 2 -Lys( cyclo [FGFRRRRQ])-PEG 12 -OH

(Ac- 서열번호 42-miniPEG2-Lys(시클로[서열번호 85])-PEG12-OH).(Ac- SEQ ID NO: 42-miniPEG 2 -Lys( cyclo [SEQ ID NO: 85])-PEG 12 -OH).

EEV는 다음으로부터 선택될 수 있다:EEV can be selected from:

Ac-K-K-K-R-K-G-miniPEG2-K(시클로[FGFGRGRQ])-PEG12-OH Ac-KKKRKG-miniPEG 2 -K( cyclo [FGFGRGRQ])-PEG 12 -OH

(Ac-서열번호 148-miniPEG2-K(시클로[서열번호 82])-PEG12-OH)(Ac-SEQ ID NO: 148-miniPEG 2 -K( cyclo [SEQ ID NO: 82])-PEG 12 -OH)

Ac-K-K-K-R-K-miniPEG2-K(시클로[FGFGRGRQ])-PEG12-OH Ac-KKKRK-miniPEG 2 -K( cyclo [FGFGRGRQ])-PEG 12 -OH

(Ac- 서열번호 19-miniPEG2-K(시클로[서열번호 82])-PEG12-OH)(Ac- SEQ ID NO: 19-miniPEG 2 -K( cyclo [SEQ ID NO: 82])-PEG 12 -OH)

Ac-K-K-R-K-K-PEG4-K(시클로[FGFGRGRQ])-PEG12-OH Ac-KRKRKK-PEG 4 -K( cyclo [FGFGRGRQ])-PEG 12 -OH

(Ac- 서열번호 22-PEG4-K(시클로[서열번호 82])-PEG12-OH)(Ac- SEQ ID NO: 22-PEG 4 -K( cyclo [SEQ ID NO: 82])-PEG 12 -OH)

Ac-K-R-K-K-K-PEG4-K(시클로[FGFGRGRQ])-PEG12-OHAc-KRKKK-PEG 4 -K( cyclo [FGFGRGRQ])-PEG 12 -OH

(Ac- 서열번호 21-PEG4-K(시클로[서열번호 82])-PEG12-OH)(Ac- SEQ ID NO: 21-PEG 4 -K( cyclo [SEQ ID NO: 82])-PEG 12 -OH)

Ac-K-K-K-K-R-PEG4-K(시클로[FGFGRGRQ])-PEG12-OH Ac-KKKKR-PEG 4 -K( cyclo [FGFGRGRQ])-PEG 12 -OH

(Ac- 서열번호 23-PEG4-K(시클로[서열번호 82])-PEG12-OH)(Ac- SEQ ID NO: 23-PEG 4 -K( cyclo [SEQ ID NO: 82])-PEG 12 -OH)

Ac-R-K-K-K-K-PEG4-K(시클로[FGFGRGRQ])-PEG12-OH Ac-RKKKK-PEG 4 -K( cyclo [FGFGRGRQ])-PEG 12 -OH

(Ac- 서열번호 20-PEG4-K(시클로[서열번호 82])-PEG12-OH) 및 (Ac- SEQ ID NO: 20-PEG 4 -K( cyclo [SEQ ID NO: 82])-PEG 12 -OH) and

Ac-K-K-K-R-K-PEG4-K(시클로[FGFGRGRQ])-PEG12-OH Ac-KKKRK-PEG 4 -K( cyclo [FGFGRGRQ])-PEG 12 -OH

(Ac- 서열번호 19-PEG4-K(시클로[서열번호 82])-PEG12-OH).(Ac- SEQ ID NO: 19-PEG 4 -K( cyclo [SEQ ID NO: 82])-PEG 12 -OH).

EEV는 다음으로부터 선택될 수 있다:EEV can be selected from:

Ac-PKKKRKV-PEG2-K(시클로[FGFGRGRQ])-PEG2-K(N3)-NH2 Ac-PKKKRKV-PEG 2 -K( cyclo [FGFGRGRQ])-PEG 2 -K(N 3 )-NH 2

(Ac- 서열번호 42-PEG2-K(시클로[서열번호 82])-PEG2-K(N3)-NH2)(Ac- SEQ ID NO: 42-PEG 2 -K( cyclo [SEQ ID NO: 82])-PEG 2 -K(N 3 )-NH 2 )

Ac-PKKKRKV-PEG2-K(시클로[FGFGRGRQ])-PEG12-OH Ac-PKKKRKV-PEG 2 -K( cyclo [FGFGRGRQ])-PEG 12 -OH

(Ac- 서열번호 42-PEG2-K(시클로[서열번호 82])-PEG12-OH)(Ac- SEQ ID NO: 42-PEG 2 -K( cyclo [SEQ ID NO: 82])-PEG 12 -OH)

Ac-PKKKRKV-PEG2-K(시클로[GfFGrGrQ])-PEG2-K(N3)-NH2 Ac-PKKKRKV-PEG 2 -K( cyclo [GfFGrGrQ])-PEG 2 -K(N 3 )-NH 2

(Ac- 서열번호 42-PEG2-K(시클로[서열번호 133])-PEG2-K(N3)-NH2) 및 (Ac- SEQ ID NO: 42-PEG 2 -K( cyclo [SEQ ID NO: 133])-PEG 2 -K(N 3 )-NH 2 ) and

Ac- PKKKRKV-PEG2-K(시클로[GfFGrGrQ])-PEG12-OH Ac- PKKKRKV-PEG 2 -K( cyclo [GfFGrGrQ])-PEG 12 -OH

(Ac- 서열번호 42-PEG2-K(시클로[서열번호 133])-PEG12-OH).(Ac- SEQ ID NO: 42-PEG 2 -K( cyclo [SEQ ID NO: 133])-PEG 12 -OH).

화물은 AC일 수 있고 EEV는 다음으로부터 선택될 수 있으며:Cargo can be AC and EEV can be selected from:

Ac-PKKKRKV-PEG2-K(시클로[FfΦGrGrQ])-PEG12-OH Ac-PKKKRKV-PEG 2 -K( cyclo [FfΦGrGrQ])-PEG 12 -OH

(Ac- 서열번호 42-PEG2-K(시클로[서열번호 80])-PEG12-OH)(Ac- SEQ ID NO: 42-PEG 2 -K( cyclo [SEQ ID NO: 80])-PEG 12 -OH)

Ac-PKKKRKV-PEG2-K(시클로[FfΦCit-r-Cit-rQ])-PEG12-OH Ac-PKKKRKV-PEG 2 -K( cyclo [FfΦCit-r-Cit-rQ])-PEG 12 -OH

(Ac- 서열번호 42-PEG2-K(시클로[서열번호 79])-PEG12-OH)(Ac- SEQ ID NO: 42-PEG 2 -K( cyclo [SEQ ID NO: 79])-PEG 12 -OH)

Ac-PKKKRKV-PEG2-K(시클로[FfFGRGRQ])-PEG12-OH Ac-PKKKRKV-PEG 2 -K( cyclo [FfFGRGRQ])-PEG 12 -OH

(Ac- 서열번호 42-PEG2-K(시클로[서열번호 81])-PEG12-OH)(Ac- SEQ ID NO: 42-PEG 2 -K( cyclo [SEQ ID NO: 81])-PEG 12 -OH)

Ac-PKKKRKV-PEG2-K(시클로[FGFGRGRQ])-PEG12-OH Ac-PKKKRKV-PEG 2 -K( cyclo [FGFGRGRQ])-PEG 12 -OH

(Ac- 서열번호 42-PEG2-K(시클로[서열번호 82])-PEG12-OH)(Ac- SEQ ID NO: 42-PEG 2 -K( cyclo [SEQ ID NO: 82])-PEG 12 -OH)

Ac-PKKKRKV-PEG2-K(시클로[GfFGrGrQ])-PEG12-OH Ac-PKKKRKV-PEG 2 -K( cyclo [GfFGrGrQ])-PEG 12 -OH

(Ac- 서열번호 42-PEG2-K(시클로[서열번호 133])-PEG12-OH)(Ac- SEQ ID NO: 42-PEG 2 -K( cyclo [SEQ ID NO: 133])-PEG 12 -OH)

Ac-PKKKRKV-PEG2-K(시클로[FGFGRRRQ])-PEG12-OH Ac-PKKKRKV-PEG 2 -K( cyclo [FGFGRRRQ])-PEG 12 -OH

(Ac- 서열번호 42-PEG2-K(시클로[서열번호 84])-PEG12-OH)(Ac- SEQ ID NO: 42-PEG 2 -K( cyclo [SEQ ID NO: 84])-PEG 12 -OH)

Ac-PKKKRKV-PEG2-K(시클로[FGFRRRRQ])-PEG12-OH Ac-PKKKRKV-PEG 2 -K( cyclo [FGFRRRRQ])-PEG 12 -OH

(Ac- 서열번호 42-PEG2-K(시클로[서열번호 85])-PEG12-OH)(Ac- SEQ ID NO: 42-PEG 2 -K( cyclo [SEQ ID NO: 85])-PEG 12 -OH)

Ac-rr-PEG2-K(시클로[FfΦGrGrQ])-PEG12-OH Ac-rr-PEG 2 -K( cyclo [FfΦGrGrQ])-PEG 12 -OH

(Ac-rr-PEG2-K(시클로[서열번호 80])-PEG12-OH)(Ac-rr-PEG 2 -K( cyclo [SEQ ID NO: 80])-PEG 12 -OH)

Ac-rr-PEG2-K(시클로[FfΦCit-r-Cit-rQ])-PEG12-OH Ac-rr-PEG 2 -K( cyclo [FfΦCit-r-Cit-rQ])-PEG 12 -OH

(Ac-rr-PEG2-K(시클로[서열번호 79])-PEG12-OH)(Ac-rr-PEG 2 -K( cyclo [SEQ ID NO:79])-PEG 12 -OH)

Ac-rr-PEG2-K(시클로[FfF-GRGRQ])-PEG12-OH Ac-rr-PEG 2 -K( cyclo [FfF-GRGRQ])-PEG 12 -OH

(Ac-rr-PEG2-K(시클로[서열번호 81])-PEG12-OH)(Ac-rr-PEG 2 -K( cyclo [SEQ ID NO:81])-PEG 12 -OH)

Ac-rr-PEG2-K(시클로[FGFGRGRQ])-PEG12-OH Ac-rr-PEG 2 -K( cyclo [FGFGRGRQ])-PEG 12 -OH

(Ac-rr-PEG2-K(시클로[서열번호 82])-PEG12-OH)(Ac-rr-PEG 2 -K( cyclo [SEQ ID NO: 82])-PEG 12 -OH)

Ac-rr-PEG2-K(시클로[GfFGrGrQ])-PEG12-OH Ac-rr-PEG 2 -K( cyclo [GfFGrGrQ])-PEG 12 -OH

(Ac-rr-PEG2-K(시클로[서열번호 133])-PEG12-OH)(Ac-rr-PEG 2 -K( cyclo [SEQ ID NO: 133])-PEG 12 -OH)

Ac-rr-PEG2-K(시클로[FGFGRRRQ])-PEG12-OH Ac-rr-PEG 2 -K( cyclo [FGFGRRRQ])-PEG 12 -OH

(Ac-rr-PEG2-K(시클로[서열번호 84])-PEG12-OH)(Ac-rr-PEG 2 -K( cyclo [SEQ ID NO: 84])-PEG 12 -OH)

Ac-rr-PEG2-K(시클로[FGFRRRRQ])-PEG12-OH Ac-rr-PEG 2 -K( cyclo [FGFRRRRQ])-PEG 12 -OH

(Ac-rr-PEG2-K(시클로[서열번호 85])-PEG12-OH)(Ac-rr-PEG 2 -K( cyclo [SEQ ID NO:85])-PEG 12 -OH)

Ac-rrr-PEG2-K(시클로[FfΦGrGrQ])-PEG12-OH Ac-rrr-PEG 2 -K( cyclo [FfΦGrGrQ])-PEG 12 -OH

(Ac-rrr-PEG2-K(시클로[서열번호 80])-PEG12-OH)(Ac-rrr-PEG 2 -K( cyclo [SEQ ID NO: 80])-PEG 12 -OH)

Ac-rrr-PEG2-K(시클로[FfΦCit-r-Cit-rQ])-PEG12-OH Ac-rrr-PEG 2 -K( cyclo [FfΦCit-r-Cit-rQ])-PEG 12 -OH

(Ac-rrr-PEG2-K(시클로[서열번호 79])-PEG12-OH)(Ac-rrr-PEG 2 -K( cyclo [SEQ ID NO:79])-PEG 12 -OH)

Ac-rrr-PEG2-K(시클로[FfFGRGRQ])-PEG12-OH Ac-rrr-PEG 2 -K( cyclo [FfFGRGRQ])-PEG 12 -OH

(Ac-rrr-PEG2-K(시클로[서열번호 81])-PEG12-OH)(Ac-rrr-PEG 2 -K( cyclo [SEQ ID NO: 81])-PEG 12 -OH)

Ac-rrr-PEG2-K(시클로[FGFGRGRQ])-PEG12-OH Ac-rrr-PEG 2 -K( cyclo [FGFGRGRQ])-PEG 12 -OH

(Ac-rrr-PEG2-K(시클로[서열번호 82])-PEG12-OH)(Ac-rrr-PEG 2 -K( cyclo [SEQ ID NO: 82])-PEG 12 -OH)

Ac-rrr-PEG2-K(시클로[GfFGrGrQ])-PEG12-OH Ac-rrr-PEG 2 -K( cyclo [GfFGrGrQ])-PEG 12 -OH

(Ac-rrr-PEG2-K(시클로[서열번호 133])-PEG12-OH)(Ac-rrr-PEG 2 -K( cyclo [SEQ ID NO: 133])-PEG 12 -OH)

Ac-rrr-PEG2-K(시클로[FGFGRRRQ])-PEG12-OH Ac-rrr-PEG 2 -K( cyclo [FGFGRRRQ])-PEG 12 -OH

(Ac-rrr-PEG2-K(시클로[서열번호 84])-PEG12-OH)(Ac-rrr-PEG 2 -K( cyclo [SEQ ID NO:84])-PEG 12 -OH)

Ac-rrr-PEG2-K(시클로[FGFRRRRQ])-PEG12-OH Ac-rrr-PEG 2 -K( cyclo [FGFRRRRQ])-PEG 12 -OH

(Ac-rrr-PEG2-K(시클로[서열번호 85])-PEG12-OH)(Ac-rrr-PEG 2 -K( cyclo [SEQ ID NO: 85])-PEG 12 -OH)

Ac-rhr-PEG2-K(시클로[FfΦGrGrQ])-PEG12-OH Ac-rhr-PEG 2 -K( cyclo [FfΦGrGrQ])-PEG 12 -OH

(Ac-rhr-PEG2-K(시클로[서열번호 80])-PEG12-OH)(Ac-rhr-PEG 2 -K( cyclo [SEQ ID NO: 80])-PEG 12 -OH)

Ac-rhr-PEG2-K(시클로[FfΦCit-r-Cit-rQ])-PEG12-OH Ac-rhr-PEG 2 -K( cyclo [FfΦCit-r-Cit-rQ])-PEG 12 -OH

(Ac-rhr-PEG2-K(시클로[서열번호 79])-PEG12-OH)(Ac-rhr-PEG 2 -K( cyclo [SEQ ID NO:79])-PEG 12 -OH)

Ac-rhr-PEG2-K(시클로[FfFGRGRQ])-PEG12-OH Ac-rhr-PEG 2 -K( cyclo [FfFGRGRQ])-PEG 12 -OH

(Ac-rhr-PEG2-K(시클로[서열번호 81])-PEG12-OH)(Ac-rhr-PEG 2 -K( cyclo [SEQ ID NO: 81])-PEG 12 -OH)

Ac-rhr-PEG2-K(시클로[FGFGRGRQ])-PEG12-OH Ac-rhr-PEG 2 -K( cyclo [FGFGRGRQ])-PEG 12 -OH

(Ac-rhr-PEG2-K(시클로[서열번호 82])-PEG12-OH)(Ac-rhr-PEG 2 -K( cyclo [SEQ ID NO: 82])-PEG 12 -OH)

Ac-rhr-PEG2-K(시클로[GfFGrGrQ])-PEG12-OH Ac-rhr-PEG 2 -K( cyclo [GfFGrGrQ])-PEG 12 -OH

(Ac-rhr-PEG2-K(시클로[서열번호 133])-PEG12-OH)(Ac-rhr-PEG 2 -K( cyclo [SEQ ID NO: 133])-PEG 12 -OH)

Ac-rhr-PEG2-K(시클로[FGFGRRRQ])-PEG12-OH Ac-rhr-PEG 2 -K( cyclo [FGFGRRRQ])-PEG 12 -OH

(Ac-rhr-PEG2-K(시클로[서열번호 84])-PEG12-OH)(Ac-rhr-PEG 2 -K( cyclo [SEQ ID NO:84])-PEG 12 -OH)

Ac-rhr-PEG2-K(시클로[FGFRRRRQ])-PEG12-OH Ac-rhr-PEG 2 -K( cyclo [FGFRRRRQ])-PEG 12 -OH

(Ac-rhr-PEG2-K(시클로[서열번호 85])-PEG12-OH)(Ac-rhr-PEG 2 -K( cyclo [SEQ ID NO:85])-PEG 12 -OH)

Ac-rbr-PEG2-K(시클로[FfΦGrGrQ])-PEG12-OH Ac-rbr-PEG 2 -K( cyclo [FfΦGrGrQ])-PEG 12 -OH

(Ac-rbr-PEG2-K(시클로[서열번호 80])-PEG12-OH)(Ac-rbr-PEG 2 -K( cyclo [SEQ ID NO: 80])-PEG 12 -OH)

Ac-rbr-PEG2-K(시클로[FfΦCit-r-Cit-rQ])-PEG12-OH Ac-rbr-PEG 2 -K( cyclo [FfΦCit-r-Cit-rQ])-PEG 12 -OH

(Ac-rbr-PEG2-K(시클로[서열번호 79])-PEG12-OH)(Ac-rbr-PEG 2 -K( cyclo [SEQ ID NO:79])-PEG 12 -OH)

Ac-rbr-PEG2-K(시클로[FfFGRGRQ])-PEG12-OH Ac-rbr-PEG 2 -K( cyclo [FfFGRGRQ])-PEG 12 -OH

(Ac-rbr-PEG2-K(시클로[서열번호 81])-PEG12-OH)(Ac-rbr-PEG 2 -K( cyclo [SEQ ID NO: 81])-PEG 12 -OH)

Ac-rbr-PEG2-K(시클로[FGFGRGRQ])-PEG12-OH Ac-rbr-PEG 2 -K( cyclo [FGFGRGRQ])-PEG 12 -OH

(Ac-rbr-PEG2-K(시클로[서열번호 82])-PEG12-OH)(Ac-rbr-PEG 2 -K( cyclo [SEQ ID NO:82])-PEG 12 -OH)

Ac-rbr-PEG2-K(시클로[GfFGrGrQ])-PEG12-OH Ac-rbr-PEG 2 -K( cyclo [GfFGrGrQ])-PEG 12 -OH

(Ac-rbr-PEG2-K(시클로[서열번호 133])-PEG12-OH)(Ac-rbr-PEG 2 -K( cyclo [SEQ ID NO: 133])-PEG 12 -OH)

Ac-rbr-PEG2-K(시클로[FGFGRRRQ])-PEG12-OH Ac-rbr-PEG 2 -K( cyclo [FGFGRRRQ])-PEG 12 -OH

(Ac-rbr-PEG2-K(시클로[서열번호 84])-PEG12-OH)(Ac-rbr-PEG 2 -K( cyclo [SEQ ID NO:84])-PEG 12 -OH)

Ac-rbr-PEG2-K(시클로[FGFRRRRQ])-PEG12-OH Ac-rbr-PEG 2 -K( cyclo [FGFRRRRQ])-PEG 12 -OH

(Ac-rbr-PEG2-K(시클로[서열번호 85])-PEG12-OH)(Ac-rbr-PEG 2 -K( cyclo [SEQ ID NO: 85])-PEG 12 -OH)

Ac-rbrbr-PEG2-K(시클로[FfΦGrGrQ])-PEG12-OH Ac-rbrbr-PEG 2 -K( cyclo [FfΦGrGrQ])-PEG 12 -OH

(Ac-서열번호 138-PEG2-K(시클로[서열번호 80])-PEG12-OH)(Ac-SEQ ID NO: 138-PEG 2 -K( cyclo [SEQ ID NO: 80])-PEG 12 -OH)

Ac-rbrbr-PEG2-K(시클로[FfΦCit-r-Cit-rQ])-PEG12-OH Ac-rbrbr-PEG 2 -K( cyclo [FfΦCit-r-Cit-rQ])-PEG 12 -OH

(Ac- 서열번호 138-PEG2-K(시클로[서열번호 79])-PEG12-OH)(Ac- SEQ ID NO: 138-PEG 2 -K( cyclo [SEQ ID NO: 79])-PEG 12 -OH)

Ac-rbrbr-PEG2-K(시클로[FfFGRGRQ])-PEG12-OH Ac-rbrbr-PEG 2 -K( cyclo [FfFGRGRQ])-PEG 12 -OH

(Ac- 서열번호 138-PEG2-K(시클로[서열번호 81])-PEG12-OH)(Ac- SEQ ID NO: 138-PEG 2 -K( cyclo [SEQ ID NO: 81])-PEG 12 -OH)

Ac-rbrbr-PEG2-K(시클로[FGFGRGRQ])-PEG12-OH Ac-rbrbr-PEG 2 -K( cyclo [FGFGRGRQ])-PEG 12 -OH

(Ac- 서열번호 138-PEG2-K(시클로[서열번호 82])-PEG12-OH)(Ac- SEQ ID NO: 138-PEG 2 -K( cyclo [SEQ ID NO: 82])-PEG 12 -OH)

Ac-rbrbr-PEG2-K(시클로[GfFGrGrQ])-PEG12-OH Ac-rbrbr-PEG 2 -K( cyclo [GfFGrGrQ])-PEG 12 -OH

(Ac- 서열번호 138-PEG2-K(시클로[서열번호 133])-PEG12-OH)(Ac- SEQ ID NO: 138-PEG 2 -K( cyclo [SEQ ID NO: 133])-PEG 12 -OH)

Ac-rbrbr-PEG2-K(시클로[FGFGRRRQ])-PEG12-OH Ac-rbrbr-PEG 2 -K( cyclo [FGFGRRRQ])-PEG 12 -OH

(Ac- 서열번호 138-PEG2-K(시클로[서열번호 84])-PEG12-OH)(Ac- SEQ ID NO: 138-PEG 2 -K( cyclo [SEQ ID NO: 84])-PEG 12 -OH)

Ac-rbrbr-PEG2-K(시클로[FGFRRRRQ])-PEG12-OHAc-rbrbr-PEG 2 -K( cyclo [FGFRRRRQ])-PEG 12 -OH

(Ac- 서열번호 138-PEG2-K(시클로[서열번호 85])-PEG12-OH)(Ac- SEQ ID NO: 138-PEG 2 -K( cyclo [SEQ ID NO: 85])-PEG 12 -OH)

Ac-rbhbr-PEG2-K(시클로[FfΦGrGrQ])-PEG12-OH Ac-rbhbr-PEG 2 -K( cyclo [FfΦGrGrQ])-PEG 12 -OH

(Ac- 서열번호 149-PEG2-K(시클로[서열번호 80])-PEG12-OH)(Ac- SEQ ID NO: 149-PEG 2 -K( cyclo [SEQ ID NO: 80])-PEG 12 -OH)

Ac-rbhbr-PEG2-K(시클로[FfΦCit-r-Cit-rQ])-PEG12-OH Ac-rbhbr-PEG 2 -K( cyclo [FfΦCit-r-Cit-rQ])-PEG 12 -OH

(Ac- 서열번호 149-PEG2-K(시클로[서열번호 79])-PEG12-OH)(Ac- SEQ ID NO: 149-PEG 2 -K( cyclo [SEQ ID NO: 79])-PEG 12 -OH)

Ac-rbhbr-PEG2-K(시클로[FfFGRGRQ])-PEG12-OH Ac-rbhbr-PEG 2 -K( cyclo [FfFGRGRQ])-PEG 12 -OH

(Ac- 서열번호 149-PEG2-K(시클로[서열번호 81])-PEG12-OH)(Ac- SEQ ID NO: 149-PEG 2 -K( cyclo [SEQ ID NO: 81])-PEG 12 -OH)

Ac-rbhbr-PEG2-K(시클로[FGFGRGRQ])-PEG12-OH Ac-rbhbr-PEG 2 -K( cyclo [FGFGRGRQ])-PEG 12 -OH

(Ac- 서열번호 149-PEG2-K(시클로[서열번호 82])-PEG12-OH)(Ac- SEQ ID NO: 149-PEG 2 -K( cyclo [SEQ ID NO: 82])-PEG 12 -OH)

Ac-rbhbr-PEG2-K(시클로[GfFGrGrQ])-PEG12-OH Ac-rbhbr-PEG 2 -K( cyclo [GfFGrGrQ])-PEG 12 -OH

(Ac- 서열번호 149-PEG2-K(시클로[서열번호 133])-PEG12-OH)(Ac- SEQ ID NO: 149-PEG 2 -K( cyclo [SEQ ID NO: 133])-PEG 12 -OH)

Ac-rbhbr-PEG2-K(시클로[FGFGRRRQ])-PEG12-OH Ac-rbhbr-PEG 2 -K( cyclo [FGFGRRRQ])-PEG 12 -OH

(Ac- 서열번호 149-PEG2-K(시클로[서열번호 84])-PEG12-OH)(Ac- SEQ ID NO: 149-PEG 2 -K( cyclo [SEQ ID NO: 84])-PEG 12 -OH)

Ac-rbhbr-PEG2-K(시클로[FGFRRRRQ])-PEG12-OH Ac-rbhbr-PEG 2 -K( cyclo [FGFRRRRQ])-PEG 12 -OH

(Ac- 서열번호 149-PEG2-K(시클로[서열번호 85])-PEG12-OH)(Ac- SEQ ID NO: 149-PEG 2 -K( cyclo [SEQ ID NO: 85])-PEG 12 -OH)

Ac-hbrbh-PEG2-K(시클로[FfΦGrGrQ])-PEG12-OH Ac-hbrbh-PEG 2 -K( cyclo [FfΦGrGrQ])-PEG 12 -OH

(Ac- 서열번호 141-PEG2-K(시클로[서열번호 80])-PEG12-OH)(Ac- SEQ ID NO: 141-PEG 2 -K( cyclo [SEQ ID NO: 80])-PEG 12 -OH)

Ac-hbrbh-PEG2-K(시클로[FfΦCit-r-Cit-rQ])-PEG12-OHAc-hbrbh-PEG 2 -K( cyclo [FfΦCit-r-Cit-rQ])-PEG 12 -OH

(Ac- 서열번호 141-PEG2-K(시클로[서열번호 79])-PEG12-OH)(Ac- SEQ ID NO: 141-PEG 2 -K( cyclo [SEQ ID NO: 79])-PEG 12 -OH)

Ac-hbrbh-PEG2-K(시클로[FfFGRGRQ])-PEG12-OHAc-hbrbh-PEG 2 -K( cyclo [FfFGRGRQ])-PEG 12 -OH

(Ac- 서열번호 141-PEG2-K(시클로[서열번호 81])-PEG12-OH)(Ac- SEQ ID NO: 141-PEG 2 -K( cyclo [SEQ ID NO: 81])-PEG 12 -OH)

Ac-hbrbh-PEG2-K(시클로[FGFGRGRQ])-PEG12-OHAc-hbrbh-PEG 2 -K( cyclo [FGFGRGRQ])-PEG 12 -OH

(Ac- 서열번호 141-PEG2-K(시클로[서열번호 82])-PEG12-OH)(Ac- SEQ ID NO: 141-PEG 2 -K( cyclo [SEQ ID NO: 82])-PEG 12 -OH)

Ac-hbrbh-PEG2-K(시클로[GfFGrGrQ])-PEG12-OHAc-hbrbh-PEG 2 -K( cyclo [GfFGrGrQ])-PEG 12 -OH

(Ac- 서열번호 141-PEG2-K(시클로[서열번호 133])-PEG12-OH)(Ac- SEQ ID NO: 141-PEG 2 -K( cyclo [SEQ ID NO: 133])-PEG 12 -OH)

Ac-hbrbh-PEG2-K(시클로[FGFGRRRQ])-PEG12-OHAc-hbrbh-PEG 2 -K( cyclo [FGFGRRRQ])-PEG 12 -OH

(Ac- 서열번호 141-PEG2-K(시클로[서열번호 84])-PEG12-OH)(Ac- SEQ ID NO: 141-PEG 2 -K( cyclo [SEQ ID NO: 84])-PEG 12 -OH)

Ac- hbrbh -PEG2-K(시클로[FGFRRRRQ])-PEG12-OHAc- hbrbh -PEG 2 -K( cyclo [FGFRRRRQ])-PEG 12 -OH

(Ac- 서열번호 141-PEG2-K(시클로[서열번호 85])-PEG12-OH),(Ac- SEQ ID NO: 141-PEG 2 -K( cyclo [SEQ ID NO: 85])-PEG 12 -OH),

식 중 b는 베타-알라닌이고, 환외 서열은 D 또는 L 입체화학일 수 있다. where b is beta-alanine, and the extracircular sequence may be D or L stereochemistry.

화물 (Cargo)Cargo

환형 세포 투과 펩티드(예: cCPP)와 같은 세포 투과 펩티드(CPP)는 화물에 접합될 수 있다. 본원에서 사용되는 바와 같이, “화물”은 세포 내로의 전달이 필요한 화합물 또는 모이어티이다. 화물은 링커의 말단 카르보닐기에 접합될 수 있다. 환형 펩티드의 적어도 하나의 원자는 화물로 치환되거나, 적어도 하나의 단독 쌍은 화물에 대한 결합을 형성할 수 있다. 화물은 링커에 의해 cCPP에 접합될 수 있다. 화물은 링커에 의해 AASC에 접합될 수 있다. cCPP의 적어도 하나의 원자는 화물로 치환되거나, cCPP의 적어도 하나의 단독 쌍은 화물에 대한 결합을 형성한다. cCPP의 아미노산 측쇄 상의 하이드록실기는 화물에 대한 결합에 의해 치환될 수 있다. cCPP의 글루타민 측쇄 상의 하이드록실기는 화물에 대한 결합에 의해 치환될 수 있다. 화물은 링커에 의해 cCPP에 접합될 수 있다. 화물은 링커에 의해 AASC에 접합될 수 있다.Cell-penetrating peptides (CPPs), such as cyclic cell-penetrating peptides (e.g., cCPP), can be conjugated to the cargo. As used herein, “cargo” is a compound or moiety that requires delivery into a cell. The cargo may be conjugated to the terminal carbonyl group of the linker. At least one atom of the cyclic peptide can be substituted for the cargo, or at least one single pair can form a bond to the cargo. Cargo can be conjugated to cCPP by a linker. The cargo can be conjugated to AA SC by a linker. At least one atom of cCPP is substituted by the cargo, or at least one lone pair of cCPP forms a bond to the cargo. The hydroxyl group on the amino acid side chain of cCPP can be replaced by binding to the cargo. The hydroxyl group on the glutamine side chain of cCPP can be replaced by binding to the cargo. Cargo can be conjugated to cCPP by a linker. The cargo can be conjugated to AA SC by a linker.

구현예에서, 아미노산 측쇄는 링커 또는 카고가 접합되는 화학적 반응성 기를 포함한다. 화학적 반응성 기는 아민기, 카르복시산, 아미드, 하이드록실기, 설프하이드릴기, 구아니디닐기, 페놀기, 티오에테르기, 이미다졸릴기, 또는 인돌릴기를 포함할 수 있다. 구현예에서, 화물이 접합되는 cCPP의 아미노산은 리신, 아르기닌, 아스파르트산, 글루탐산, 아스파라긴, 글루타민, 호모글루타민, 세린, 트레오닌, 티로신, 시스테인, 아르기닌, 티로신, 메티오닌, 히스티딘, 또는 트립토판을 포함한다.In embodiments, the amino acid side chain comprises a chemically reactive group to which a linker or cargo is conjugated. Chemically reactive groups may include amine groups, carboxylic acids, amides, hydroxyl groups, sulfhydryl groups, guanidinyl groups, phenol groups, thioether groups, imidazolyl groups, or indolyl groups. In an embodiment, the amino acids of cCPP to which the cargo is conjugated include lysine, arginine, aspartic acid, glutamic acid, asparagine, glutamine, homoglutamine, serine, threonine, tyrosine, cysteine, arginine, tyrosine, methionine, histidine, or tryptophan.

화물은 하나 이상의 검출 가능한 모이어티, 하나 이상의 치료 모이어티(TM), 하나 이상의 표적화 모이어티, 또는 이들의 임의의 조합을 포함할 수 있다. 구현예에서, 화물은 TM을 포함한다. 구현예에서, 화물은 AC를 포함한다.The cargo may comprise one or more detectable moieties, one or more therapeutic moieties (TM), one or more targeting moieties, or any combination thereof. In an embodiment, the cargo includes TM. In embodiments, the cargo includes AC.

화물 모이어티에 접합된 환형 세포 투과 펩티드(cCPP)Cyclic cell penetrating peptide (cCPP) conjugated to cargo moiety

환형 세포 투과 펩티드(cCPP)는 화물 모이어티에 접합될 수 있다.Circular cell penetrating peptide (cCPP) can be conjugated to the cargo moiety.

화물 모이어티는 말단 카보닐기에서 링커에 접합되어 다음의 구조를 제공할 수 있으며:The cargo moiety can be conjugated to a linker at the terminal carbonyl group to give the following structure:

, 식 중: , in the formula:

EP는 환외 펩티드이고, M, AASC, 화물, x’, y, 및 z’은 위에서 정의된 바와 같고, *는 AASC에 대한 부착점이고, x’은 1일 수 있다. y는 4일 수 있다. z’은 11일 수 있다. -(OCH2CH2)x’- 및/또는 -(OCH2CH2)z’-는 예를 들어 다음을 포함하는 하나 이상의 아미노산으로 독립적으로 치환될 수 있다: 글리신, 베타-알라닌, 4-아미노부티르산, 5-아미노펜탄산, 6-아미노헥산산, 또는 이들의 조합.EP is the exophytic peptide, M, AA SC , cargo, x', y, and z' are as defined above, * is the point of attachment to AA SC , and x' may be 1. y can be 4. z' may be 11. -(OCH 2 CH 2 ) x' - and/or -(OCH 2 CH 2 ) z' - may be independently substituted with one or more amino acids, including for example: glycine, beta-alanine, 4- Aminobutyric acid, 5-aminopentanic acid, 6-aminohexanoic acid, or combinations thereof.

엔도솜 탈출 비히클(EEV)은 환형 세포 투과 펩티드(cCPP), 환외 펩티드(EP), 및 링커를 포함할 수 있고, 화물에 접합되어 식 (C)의 구조:The endosomal escape vehicle (EEV) may comprise a cyclic cell penetrating peptide (cCPP), an extracyclic peptide (EP), and a linker, which are conjugated to the cargo to form the structure of formula (C):

(C) (C)

또는 이의 양성자화된 형태를 포함하는 EEV-접합체를 형성할 수 있으며,or form an EEV-conjugate comprising a protonated form thereof,

식 중:During the ceremony:

R1, R2, 및 R3은 각각 독립적으로 H이거나 방향족기를 포함하는 측쇄를 갖는 아미노산 잔기일 수 있고;R 1 , R 2 , and R 3 may each independently be H or an amino acid residue having a side chain containing an aromatic group;

R4는 H이거나 아미노산 측쇄이고;R 4 is H or an amino acid side chain;

EP는 본원에서 정의된 바와 같은 환외 펩티드이고;EP is an exophytic peptide as defined herein;

화물은 본원에서 정의된 바와 같은 모이어티이고;Cargo is a moiety as defined herein;

각각의 m은 독립적으로 0~3의 정수이고;Each m is independently an integer from 0 to 3;

n은 0~2의 정수이고;n is an integer from 0 to 2;

x’은 2~20의 정수이고;x’ is an integer from 2 to 20;

y는 1~5의 정수이고;y is an integer from 1 to 5;

q는 1~4의 정수이고;q is an integer from 1 to 4;

z’은 2~20의 정수이다.z’ is an integer from 2 to 20.

R1, R2, R3, R4, EP, 화물, m, n, x’, y, q, 및 z’은 본원에서 정의된 바와 같다.R 1 , R 2 , R 3 , R 4 , EP, cargo, m, n, x', y, q, and z' are as defined herein.

EEV는 화물에 접합될 수 있고, EEV-접합체는 식 (C-a) 또는 (C-b)의 구조:EEV can be conjugated to a cargo and the EEV-conjugate has the structure of formula (C-a) or (C-b):

(C-a), (Ca),

(C-b), 또는 이의 양성자화된 형태를 포함할 수 있으며, 식 중 EP, m, 및 z는 상기 식 (C)에서 정의된 바와 같다. (Cb), or a protonated form thereof, wherein EP, m, and z are as defined in formula (C) above.

EEV는 화물에 접합될 수 있고, EEV-접합체는 식 (C-c)의 구조:EEV can be conjugated to a cargo, and the EEV-conjugate has the structure of formula (C-c):

(C-c), (Cc),

또는 이의 양성자화된 형태를 포함할 수 있으며, 식 중 EP, R1, R2, R3, R4, 및 m은 상기 식 (III)에서 정의된 바와 같고; AA는 본원에서 정의된 것과 같은 아미노산일 수 있고; n은 0~2의 정수일 수 있고; x는 1~10의 정수일 수 있고; y는 1~5의 정수일 수 있고; z는 1~10의 정수일 수 있다.or a protonated form thereof, wherein EP, R 1 , R 2 , R 3 , R 4 , and m are as defined in formula (III) above; AA may be an amino acid as defined herein; n may be an integer from 0 to 2; x can be an integer from 1 to 10; y may be an integer from 1 to 5; z can be an integer from 1 to 10.

EEV는 올리고뉴클레오티드 화물에 접합될 수 있고, EEV-올리고뉴클레오티드 접합체는 식 (C-1), (C-2), (C-3), 또는 (C-4)의 구조를 포함할 수 있다:EEV can be conjugated to an oligonucleotide cargo, and the EEV-oligonucleotide conjugate can comprise a structure of formula (C-1), (C-2), (C-3), or (C-4):

(C-1), (C-1),

(C-2), (C-2),

(C-3), (C-3),

(C-4) (C-4)

EEV는 올리고뉴클레오티드 화물에 접합될 수 있고, EEV-접합체는 다음의 구조를 포함할 수 있다:EEV can be conjugated to an oligonucleotide cargo, and the EEV-conjugate can include the following structure:

. .

세포액 전달 효율Cell fluid delivery efficiency

환형 세포 투과 펩티드(cCPP)에 대한 변형은 세포액 전달 효율을 개선할 수 있다. 개선된 세포액 흡수 효율은 변형된 서열을 갖는 cCPP의 세포액 전달 효율을 대조군 서열과 비교함으로써 측정될 수 있다. 대조군 서열은 변형된 서열에서 특정 치환 아미노산 잔기(아르기닌, 페닐알라닌, 및/또는 글리신을 포함하지만 이에 한정되지 않음)를 포함하지 않지만, 그 외에는 동일하다.Modifications to cyclic cell penetrating peptide (cCPP) can improve cytosolic transport efficiency. Improved cytosolic uptake efficiency can be measured by comparing the cytosolic transport efficiency of cCPPs with modified sequences to control sequences. The control sequence does not contain specific substituted amino acid residues (including but not limited to arginine, phenylalanine, and/or glycine) in the modified sequence, but is otherwise identical.

본원에서 사용되는 바와 같이, 세포액 전달 효율은 cCPP가 세포막을 통과하여 세포의 세포액에 진입하는 능력을 지칭한다. cCPP의 세포액 전달 효율은 수용체 또는 세포 유형에 따라 반드시 달라지는 것은 아니다. 세포액 전달 효율은 절대 세포액 전달 효율 또는 상대 세포액 전달 효율을 지칭할 수 있다.As used herein, cytosolic transport efficiency refers to the ability of cCPP to cross the cell membrane and enter the cytosol of a cell. The cytosolic transport efficiency of cCPP does not necessarily vary depending on the receptor or cell type. Cytosolic transfer efficiency may refer to absolute cytosolic transfer efficiency or relative cytosolic transfer efficiency.

절대 세포액 전달 효율은 성장 배지에서 cCPP(또는 cCPP-화물 접합체)의 농도에 대한 cCPP(또는 cCPP-화물 접합체)의 세포액 농도의 비율이다. 상대 세포액 전달 효율은 세포액 중 대조군 cCPP의 농도와 비교하여 세포액 중 cCPP의 농도를 지칭한다. 정량화는 cCPP를 (예를 들어 FITC 염료로) 형광 표지하고 당업계에 잘 알려진 기술을 사용하여 형광 강도를 측정함으로써 달성될 수 있다.Absolute cytosolic delivery efficiency is the ratio of the cytosolic concentration of cCPP (or cCPP-cargo conjugate) to the concentration of cCPP (or cCPP-cargo conjugate) in the growth medium. Relative cytosolic delivery efficiency refers to the concentration of cCPP in the cytosol compared to the concentration of control cCPP in the cytosol. Quantification can be accomplished by fluorescently labeling cCPP (e.g. with FITC dye) and measuring the fluorescence intensity using techniques well known in the art.

상대 세포액 전달 효율은 (i) 세포 유형(예: HeLa 세포)에 의해 내재화된 본 발명의 cCPP의 양을 (ii) 동일한 세포 유형에 의해 내재화된 대조군 cCPP의 양과 비교함으로써 결정된다. 상대 세포액 전달 효율을 측정하기 위해, 세포 유형을 특정 기간(예: 30분, 1시간, 2시간 등) 동안 cCPP의 존재 하에 인큐베이션할 수 있고, 그 후 세포에 의해 내재화된 cCPP의 양을 당업계에 공지된 방법, 예를 들어 형광 현미경을 사용하여 정량화한다. 별도로, 동일한 농도의 대조군 cCPP를 동일한 기간에 걸쳐 세포 유형의 존재 하에 인큐베이션하고, 세포에 의해 내재화된 대조군 cCPP의 양을 정량화한다.Relative cytosolic transfer efficiency is determined by comparing (i) the amount of cCPP of the invention internalized by a cell type (e.g., HeLa cells) to (ii) the amount of control cCPP internalized by the same cell type. To measure relative cytosolic transport efficiency, cell types can be incubated in the presence of cCPP for a specified period of time (e.g., 30 minutes, 1 hour, 2 hours, etc.), and then the amount of cCPP internalized by the cells is measured as described in the art. Quantification is performed using known methods, for example fluorescence microscopy. Separately, equal concentrations of control cCPP are incubated in the presence of cell types over the same period of time, and the amount of control cCPP internalized by the cells is quantified.

상대 세포액 전달 효율은 세포내 표적에 대해 변형된 서열을 갖는 cCPP의 IC50을 측정하고, 변형된 서열을 갖는 cCPP의 IC50을 (본원에 기술된 바와 같은) 대조군 서열과 비교함으로써 결정될 수 있다.Relative cytosolic delivery efficiency can be determined by measuring the IC 50 of cCPP with modified sequences against an intracellular target and comparing the IC 50 of cCPP with modified sequences to a control sequence (as described herein).

cCPP의 상대 세포액 전달 효율은 시클로(FfФRrRrQ, 서열번호 150)와 비교하여 약 50% 내지 약 450%의 범위, 예를 들어 약 60%, 약 70%, 약 80%, 약 90%, 약 100%, 약 110%, 약 120%, 약 130%, 약 140%, 약 150%, 약 160%, 약 170%, 약 180%, 약 190%, 약 200%, 약 210%, 약 220%, 약 230%, 약 240%, 약 250%, 약 260%, 약 270%, 약 280%, 약 290%, 약 300%, 약 310%, 약 320%, 약 330%, 약 340%, 약 350%, 약 360%, 약 370%, 약 380%, 약 390%, 약 400%, 약 410%, 약 420%, 약 430%, 약 440%, 약 450%, 약 460%, 약 470%, 약 480%, 약 490%, 약 500%, 약 510%, 약 520%, 약 530%, 약 540%, 약 550%, 약 560%, 약 570%, 약 580%, 또는 약 590%일 수 있다(이들 사이의 모든 값 및 하위 범위를 포함함). cCPP의 상대 세포액 전달 효율은 시클로(FfФRrRrQ, 서열번호 150)를 포함하는 환형 펩티드와 비교하여 약 600% 초과만큼 개선될 수 있다.The relative cytosolic transport efficiency of cCPP ranges from about 50% to about 450%, for example about 60%, about 70%, about 80%, about 90%, about 100% compared to cyclo (FfФRrRrQ, SEQ ID NO: 150). , about 110%, about 120%, about 130%, about 140%, about 150%, about 160%, about 170%, about 180%, about 190%, about 200%, about 210%, about 220%, about 230%, about 240%, about 250%, about 260%, about 270%, about 280%, about 290%, about 300%, about 310%, about 320%, about 330%, about 340%, about 350% , about 360%, about 370%, about 380%, about 390%, about 400%, about 410%, about 420%, about 430%, about 440%, about 450%, about 460%, about 470%, about It may be 480%, about 490%, about 500%, about 510%, about 520%, about 530%, about 540%, about 550%, about 560%, about 570%, about 580%, or about 590%. (Includes all values and subranges between them). The relative cytosolic transport efficiency of cCPP can be improved by more than about 600% compared to a cyclic peptide comprising cyclo (FfФRrRrQ, SEQ ID NO: 150).

절대 세포액 전달 효능은 약 40% 내지 약 100%, 예를 들어 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99%일 수 있다(이들 사이의 모든 값 및 하위 범위를 포함함).The absolute cytosolic transfer efficacy is about 40% to about 100%, for example about 45%, about 50%, about 55%, about 60%, about 65%, about 70%, about 75%, about 80%, about 85%. %, about 90%, about 91%, about 92%, about 93%, about 94%, about 95%, about 96%, about 97%, about 98%, about 99% (any value in between) and subranges).

본 개시의 cCPP는 달리 동일한 서열과 비교하여 세포액 전달 효율을 약 1.1배 내지 약 30배만큼, 예를 들어 약 1.2, 약 1.3, 약 1.4, 약 1.5, 약 1.6, 약 1.7, 약 1.8, 약 1.9, 약 2.0, 약 2.5, 약 3.0, 약 3.5, 약 4.0, 약 4.5, 약 5.0, 약 5.5, 약 6.0, 약 6.5, 약 7.0, 약 7.5, 약 8.0, 약 8.5, 약 9.0, 약 10, 약 10.5, 약 11.0, 약 11.5, 약 12.0, 약 12.5, 약 13.0, 약 13.5, 약 14.0, 약 14.5, 약 15.0, 약 15.5, 약 16.0, 약 16.5, 약 17.0, 약 17.5, 약 18.0, 약 18.5, 약 19.0, 약 19.5, 약 20, 약 20.5, 약 21.0, 약 21.5, 약 22.0, 약 22.5, 약 23.0, 약 23.5, 약 24.0, 약 24.5, 약 25.0, 약 25.5, 약 26.0, 약 26.5, 약 27.0, 약 27.5, 약 28.0, 약 28.5, 약 29.0, 또는 약 29.5배만큼(이들 사이의 모든 값 및 하위 범위를 포함함) 개선할 수 있다.The cCPP of the present disclosure increases the cytosolic transfer efficiency by about 1.1 times to about 30 times, for example, about 1.2, about 1.3, about 1.4, about 1.5, about 1.6, about 1.7, about 1.8, about 1.9 compared to the same sequence. , about 2.0, about 2.5, about 3.0, about 3.5, about 4.0, about 4.5, about 5.0, about 5.5, about 6.0, about 6.5, about 7.0, about 7.5, about 8.0, about 8.5, about 9.0, about 10, about 10.5, about 11.0, about 11.5, about 12.0, about 12.5, about 13.0, about 13.5, about 14.0, about 14.5, about 15.0, about 15.5, about 16.0, about 16.5, about 17.0, about 17.5, about 18.0, about 18.5, About 19.0, about 19.5, about 20, about 20.5, about 21.0, about 21.5, about 22.0, about 22.5, about 23.0, about 23.5, about 24.0, about 24.5, about 25.0, about 25.5, about 26.0, about 26.5, about 27.0 , about 27.5, about 28.0, about 28.5, about 29.0, or about 29.5 times (including all values and subranges therebetween).

검출 가능한 모이어티Detectable Moieties

구현예에서, 본원에 개시된 화합물은 검출 가능한 모이어티를 포함한다. 구현예에서, 검출 가능한 모이어티는 세포 투과 펩티드 모이어티의 아미노산 중 어느 하나의 아미노기, 카르복실레이트기, 또는 측쇄에서 (예를 들어 CPP 내의 임의의 아미노산의 아미노기, 카르복실레이트기, 또는 측쇄에서) 세포 투과 펩티드에 부착된다. 구현예에서, 치료 모이어티는 검출 가능한 모이어티를 포함한다. 검출 가능한 모이어티는 임의의 검출 가능한 표지를 포함할 수 있다. 적절한 검출 가능한 표지의 예는 UV-Vis 표지, 근적외선 표지, 발광기, 인광기, 자기 스핀 공명 표지, 감광제, 광절단성 모이어티, 킬레이트화 중심, 중원자, 방사성 동위원소, 동위원소 검출 가능한 스핀 공명 표지, 상자성 모이어티, 발색단, 또는 이들의 임의의 조합을 포함하지만 이에 한정되지는 않는다. 구현예에서, 표지는 추가 시약의 첨가 없이 검출 가능하다.In embodiments, compounds disclosed herein include a detectable moiety. In an embodiment, the detectable moiety is in the amino group, carboxylate group, or side chain of any of the amino acids of the cell-penetrating peptide moiety (e.g., in the amino group, carboxylate group, or side chain of any of the amino acids in CPP). ) is attached to a cell-penetrating peptide. In embodiments, the therapeutic moiety comprises a detectable moiety. A detectable moiety may include any detectable label. Examples of suitable detectable labels include UV-Vis labels, near-infrared labels, luminescent groups, phosphor groups, magnetic spin resonance labels, photosensitizers, photocleavable moieties, chelation centers, heavy atoms, radioactive isotopes, and isotopically detectable spin resonance labels. Including, but not limited to, labels, paramagnetic moieties, chromophores, or any combination thereof. In embodiments, the label is detectable without addition of additional reagents.

구현예에서, 검출 가능한 모이어티는 생체적합성 검출 가능한 모이어티이므로, 화합물은 다양한 생물학적 응용에 사용하기에 적합할 수 있다. 본원에서 사용되는 바와 같이, “생체적합성” 및 “생물학적으로 양립 가능한”은 세포 및 조직에 대해 일반적으로 비독성인 화합물을 이의 임의의 대사산물 또는 분해 산물과 함께 일반적으로 지칭하는데, 이러한 화합물은 이러한 화합물이 존재하는 가운데 세포 및 조직을 인큐베이션(예: 배양)했을 때, 세포 및 조직에 임의의 유의한 부작용을 초래하지 않는 화합물이다.In embodiments, the detectable moiety is a biocompatible detectable moiety, such that the compound may be suitable for use in a variety of biological applications. As used herein, “biocompatible” and “biologically compatible” generally refer to compounds that are generally non-toxic to cells and tissues, including any of their metabolites or degradation products. It is a compound that does not cause any significant side effects to cells and tissues when cells and tissues are incubated (e.g., cultured) in its presence.

검출 가능한 모이어티는 형광 표지 또는 근적외선 표지와 같은 발광단을 함유할 수 있다. 적절한 발광단의 예는 금속 포르피린; 벤조포르피린; 아자벤조포르피린; 나프토포르피린; 프탈로시아닌; 페릴렌 디이민과 같은 다환 방향족 탄화수소, 피렌; 아조 염료; 크산텐 염료; 붕소 디피오로메텐, 아자-붕소 디피오로메텐, 시아닌 염료, 비피리딘과 같은 금속-리간드 복합체, 비피리딜, 페난트롤린, 쿠마린, 및 루테늄 및 이리듐의 아세틸아세토네이트; 아크리딘, 벤조페녹사진과 같은 옥사진 유도체; 아자-아눌렌, 스쿠아린; 8-하이드록시퀴놀린, 폴리메틴, 양자 점과 같은 발광 생성 나노입자, 나노결정; 카르보스티릴; 테르븀 복합체; 무기 형광체; 크라운 에테르 연관된 또는 유도체화된 염료와 같은 이온담체; 또는 이들의 조합을 포함하지만 이에 한정되지는 않는다. 적절한 발광단의 특정 예는, Pd (II) 옥타에틸포르피린; Pt (II)-옥타에틸포르피린; Pd (II) 테트라페닐포르피린; Pt (II) 테트라페닐포르피린; Pd (II) 메소-테트라페닐포르피린 테트라벤조포르핀; Pt (II) 메소-테트라페닐 메틸벤조포르피린; Pd (II) 옥타에틸포르피린 케톤; Pt (II) 옥타에틸포르피린 케톤; Pd (II) 메소-테트라(펜타플루오로페닐)포르피린; Pt (II) 메소-테트라 (펜타플루오로페닐) 포르피린; Ru (II) 트리스(4,7-디페닐-1,10-페난트롤린) (Ru (dpp)3); Ru (II) 트리스(1,10-페난트롤린) (Ru(phen)3), 트리스(2,2’-바이피리딘)루테늄 (II) 염화물 6수화물 (Ru(bpy)3); 에리트로신 B; 플루오레세인; 플루오레세인 이소티오시아네이트(FITC); 에오신; 이리듐 (III) ((N-메틸-벤즈이미다졸-2-일)-7-(디에틸아미노)-쿠마린));엔조티아졸) ((벤조티아졸-2-일)-7-(디에틸아미노)-쿠마린))-2-(아세틸아세토네이트); 루모겐 염료; Macroflex 형광 레드; Macrolex 형광 옐로우; Texas 레드; 로다민 B; 로다민 6G; 황 로다민; m-크레졸; 티몰 블루; 크실레놀 블루; 크레졸 레드; 클로로페놀 블루; 브로모크레졸 그린; 브롬크레졸 레드; 브로모티몰 블루; Cy2; Cy3; Cy5; Cy5.5; Cy7; 4-니티로페놀; 알리자린; 페놀프탈레인; o-크레졸프탈레인; 클로로페놀 레드; 칼마지트; 브로모-크실레놀; 페놀 레드; 중성 레드; 니트라진; 3,4,5,6-테트라브롬페놀프탈레인; 콩고 레드; 플루오레세인; 에오신; 2’,7'-디클로로플루오레세인; 5(6)-카르복시-플루오레세인; 카르복시나프토플루오레세인; 8-하이드록시피렌-1,3,6-트리설폰산; 세미-나프토로다플루오르; 세미-나프토플루오레세인; 트리스(4,7-디페닐-1,10-페난트롤린) 루테늄 (II) 디클로라이드; (4,7-디페닐-1,10-페난트롤린) 루테늄 (II) 테트라페닐보론; 백금 (II) 옥타에틸포르피인; 디알킬카르보시아닌; 디옥타데실시클로옥사카르보시아닌; 플루오레닐메틸옥시카르보닐 클로라이드; 7-아미노-4-메틸쿠르마린(Amc); 녹색 형광 단백질(GFP); 및 이들의 유도체 또는 조합을 포함하지만 이에 한정되지는 않는다.The detectable moiety may contain a luminophore, such as a fluorescent label or a near-infrared label. Examples of suitable luminophores include metal porphyrins; benzoporphyrin; Azabenzoporphyrin; naphtoporphyrin; phthalocyanine; polycyclic aromatic hydrocarbons such as perylene diimine, pyrene; azo dye; xanthene dye; boron dipioromethene, aza-boron dipioromethene, cyanine dyes, metal-ligand complexes such as bipyridine, bipyridyl, phenanthroline, coumarin, and acetylacetonates of ruthenium and iridium; Oxazine derivatives such as acridine and benzophenoxazine; aza-annulene, squarine; Luminescence-producing nanoparticles and nanocrystals such as 8-hydroxyquinoline, polymethine, and quantum dots; Carbostyryl; Terbium complex; inorganic phosphor; Ionic carriers such as crown ether-related or derivatized dyes; or combinations thereof, but are not limited thereto. Specific examples of suitable luminophores include Pd (II) octaethylporphyrin; Pt (II)-octaethylporphyrin; Pd (II) tetraphenylporphyrin; Pt (II) tetraphenylporphyrin; Pd (II) meso-tetraphenylporphyrin tetrabenzoporphine; Pt (II) meso-tetraphenyl methylbenzoporphyrin; Pd (II) octaethylporphyrin ketone; Pt (II) octaethylporphyrin ketone; Pd (II) meso-tetra(pentafluorophenyl)porphyrin; Pt (II) meso-tetra (pentafluorophenyl) porphyrin; Ru (II) tris(4,7-diphenyl-1,10-phenanthroline) (Ru (dpp) 3 ); Ru (II) tris(1,10-phenanthroline) (Ru(phen) 3 ), tris(2,2'-bipyridine)ruthenium (II) chloride hexahydrate (Ru(bpy) 3 ); erythrosine B; fluorescein; fluorescein isothiocyanate (FITC); Eosin; Iridium (III) ((N-methyl-benzimidazol-2-yl)-7-(diethylamino)-coumarin));enzothiazole) ((benzothiazol-2-yl)-7-(di Ethylamino)-coumarin))-2-(acetylacetonate); lumogen dye; Macroflex Fluorescent Red; Macrolex Fluorescent Yellow; Texas Red; rhodamine B; Rhodamine 6G; rhodamine sulfur; m-cresol; thymol blue; xylenol blue; cresol red; chlorophenol blue; bromocresol green; Bromocresol Red; bromothymol blue; Cy2; Cy3; Cy5; Cy5.5; Cy7; 4-nitirophenol; alizarin; phenolphthalein; o -cresolphthalein; Chlorophenol Red; Kalmagit; bromo-xylenol; phenol red; neutral red; nitrazine; 3,4,5,6-tetrabromophenolphthalein; Congo Red; fluorescein; Eosin; 2',7'-dichlorofluorescein;5(6)-carboxy-fluorescein;carboxynaphthofluorescein; 8-hydroxypyrene-1,3,6-trisulfonic acid; semi-naphthorodafluoro; semi-naphthofluorescein; Tris(4,7-diphenyl-1,10-phenanthroline)ruthenium(II) dichloride; (4,7-diphenyl-1,10-phenanthroline) ruthenium (II) tetraphenylboron; Platinum(II) octaethylporphyine; dialkylcarbocyanine; dioctadecylcyclooxacarbocyanine; fluorenylmethyloxycarbonyl chloride; 7-amino-4-methylcoumarin (Amc); green fluorescent protein (GFP); and derivatives or combinations thereof.

일부 실시예에서, 검출 가능한 모이어티는 로다민 B(Rho), 플루오레세인 이소티오시아네이트(FITC), 7-아미노-4-메틸쿠르마린(Amc), 녹색 형광 단백질(GFP), 또는 이들의 유도체 또는 조합을 포함할 수 있다.In some embodiments, the detectable moiety is rhodamine B (Rho), fluorescein isothiocyanate (FITC), 7-amino-4-methylcoumarin (Amc), green fluorescent protein (GFP), or It may include derivatives or combinations of.

제조 방법 Manufacturing method

본원에 기술된 화합물은 유기 합성 분야의 당업자에게 알려진 다양한 방식으로, 또는 이에 대해 당업자가 이해할 수 있는 변형이 추가된 방식으로 제조될 수 있다. 본원에 기술된 화합물은 쉽게 이용 가능한 출발 물질로부터 제조될 수 있다. 최적의 반응 조건은 사용된 특정 반응물 또는 용매에 따라 달라질 수 있지만, 이러한 조건은 당업자에 의해 결정될 수 있다.The compounds described herein can be prepared in a variety of ways known to those skilled in the art of organic synthesis, or with modifications understood thereto by those skilled in the art. The compounds described herein can be prepared from readily available starting materials. Optimal reaction conditions may vary depending on the specific reactants or solvents used, but such conditions can be determined by those skilled in the art.

본원에 기술된 화합물에 대한 변형은 각각의 화합물에 대해 기술된 바와 같은 다양한 성분의 첨가, 차감, 또는 이동을 포함한다. 유사하게, 하나 이상의 키랄 중심이 분자에 존재할 때, 분자의 키랄성이 달라질 수 있다. 또한, 화합물 합성은 다양한 화학기의 보호 및 탈보호를 포함할 수 있다. 보호 및 탈보호의 사용, 및 적절한 보호기의 선택은 당업자에 의해 결정될 수 있다. 보호기의 화학은, 예를 들어 Wuts 및 Greene의 문헌[Protective Groups in Organic Synthesis, 4th Ed., Wiley & Sons, 2006]에서 확인할 수 있으며, 동 문헌은 그 전체가 참조로서 본원에 통합된다.Modifications to the compounds described herein include adding, subtracting, or moving various components as described for each compound. Similarly, when more than one chiral center is present in a molecule, the chirality of the molecule can vary. Additionally, compound synthesis may involve protection and deprotection of various chemical groups. The use of protection and deprotection, and the selection of appropriate protecting groups, can be determined by those skilled in the art. The chemistry of protecting groups can be found, for example, in Wuts and Greene (Protective Groups in Organic Synthesis, 4th Ed., Wiley & Sons, 2006), which is incorporated herein by reference in its entirety.

개시된 화합물 및 조성물을 제조하는 데 사용되는 출발 물질 및 시약은 Aldrich Chemical Co., (Milwaukee, WI), Acros Organics (Morris Plains, NJ), Fisher Scientific (Pittsburgh, PA), Sigma (St. Louis, MO), Pfizer (New York, NY), GlaxoSmithKline (Raleigh, NC), Merck (Whitehouse Station, NJ), Johnson & Johnson (New Brunswick, NJ), Aventis (Bridgewater, NJ), AstraZeneca (Wilmington, DE), Novartis (Basel, Switzerland), Wyeth (Madison, NJ), Bristol-Myers-Squibb (New York, NY), Roche (Basel, Switzerland), Lilly (Indianapolis, IN), Abbott (Abbott Park, IL), Schering Plough (Kenilworth, NJ), 또는 Boehringer Ingelheim (Ingelheim, Germany)과 같은 상업적 공급자로부터 이용할 수 있거나, 다음과 같은 문헌을 참조하여 동 문헌에 제시된 절차에 따라 당업자에게 알려진 방법에 의해 제조된다: Fieser and Fieser’s Reagents for Organic Synthesis, Volumes 1-17 (John Wiley and Sons, 1991); Rodd’s Chemistry of Carbon Compounds, Volumes 1-5 and Supplementals (Elsevier Science Publishers, 1989); Organic Reactions, Volumes 1-40 (John Wiley and Sons, 1991); March’s Advanced Organic Chemistry, (John Wiley and Sons, 4th Edition); 및 Larock’s Comprehensive Organic Transformations (VCH Publishers Inc., 1989). 본원에 개시된 약학적 담체와 같은 다른 물질은 상업적 공급원으로부터 확보할 수 있다.Starting materials and reagents used to prepare the disclosed compounds and compositions are from Aldrich Chemical Co., (Milwaukee, WI), Acros Organics (Morris Plains, NJ), Fisher Scientific (Pittsburgh, PA), and Sigma (St. Louis, MO). ), Pfizer (New York, NY), GlaxoSmithKline (Raleigh, NC), Merck (Whitehouse Station, NJ), Johnson & Johnson (New Brunswick, NJ), Aventis (Bridgewater, NJ), AstraZeneca (Wilmington, DE), Novartis (Basel, Switzerland), Wyeth (Madison, NJ), Bristol-Myers-Squibb (New York, NY), Roche (Basel, Switzerland), Lilly (Indianapolis, IN), Abbott (Abbott Park, IL), Schering Plough ( Kenilworth, NJ), or from commercial suppliers such as Boehringer Ingelheim (Ingelheim, Germany), or prepared by methods known to those skilled in the art following the procedures set forth therein with reference to the following literature: Fieser and Fieser's Reagents for Organic Synthesis, Volumes 1-17 (John Wiley and Sons, 1991); Rodd’s Chemistry of Carbon Compounds, Volumes 1-5 and Supplementals (Elsevier Science Publishers, 1989); Organic Reactions, Volumes 1-40 (John Wiley and Sons, 1991); March’s Advanced Organic Chemistry, (John Wiley and Sons, 4th Edition); and Larock’s Comprehensive Organic Transformations (VCH Publishers Inc., 1989). Other materials, such as pharmaceutical carriers disclosed herein, may be obtained from commercial sources.

본원에 기술된 화합물을 생성하는 반응은 용매에서 수행될 수 있으며, 이는 유기 합성 분야의 당업자에 의해 선택될 수 있다. 용매는 반응이 수행되는 조건, 즉 온도 및 압력 하에서 출발 물질(반응물), 중간체, 또는 생성물과 실질적으로 반응하지 않을 수 있다. 반응은 하나의 용매 또는 둘 이상의 용매의 혼합물에서 수행될 수 있다. 생성물 또는 중간체 형성은 당업계에 공지된 임의의 적절한 방법에 따라 모니터링될 수 있다. 예를 들어, 생성물 형성은 핵 자기 공명 분광법(예를 들어, 1H 또는 13C), 적외선 분광법, 분광광도법(예를 들어, UV-가시광), 또는 질량 분광법과 같은 분광 수단에 의해 모니터링되거나, 고성능 액체 크로마토그래피(HPLC) 또는 박층 크로마토그래피와 같은 크로마토그래피에 의해 모니터링될 수 있다.The reactions producing the compounds described herein can be carried out in solvents, which can be selected by those skilled in the art of organic synthesis. The solvent may not substantially react with the starting materials (reactants), intermediates, or products under the conditions at which the reaction is conducted, i.e., temperature and pressure. The reaction can be carried out in one solvent or a mixture of two or more solvents. Product or intermediate formation can be monitored according to any suitable method known in the art. For example, product formation is monitored by spectroscopic means such as nuclear magnetic resonance spectroscopy (e.g., 1 H or 13 C), infrared spectroscopy, spectrophotometry (e.g., UV-visible), or mass spectrometry; It can be monitored by chromatography, such as high performance liquid chromatography (HPLC) or thin layer chromatography.

개시된 화합물은 고상 펩티드 합성에 의해 제조될 수 있으며, 여기서 아미노산 α-N-말단은 산 또는 염기 보호기에 의해 보호된다. 이러한 보호기는 성장하는 펩티드 사슬의 파괴 또는 그 안에 함유된 키랄 중심 중 어느 하나의 라세미화 없이 쉽게 제거 가능하면서도, 펩티드 결합 형성의 조건에 대해 안정한 특성을 가져야 한다. 적절한 보호기는 9-플루오레닐메틸옥시카르보닐(Fmoc), t-부틸옥시카르보닐(Boc), 벤질옥시카르보닐(Cbz), 바이페닐이소프로필옥시카르보닐, t-아밀옥시카르보닐, 이소보르닐옥시카르보닐, α,α-디메틸-3,5-디메톡시벤질옥시카르보닐, o-니트로페닐설페닐, 2-시아노-t-부틸옥시카르보닐 등이다. 9-플루오레닐메틸옥시카르보닐(Fmoc) 보호기는 개시된 화합물의 합성에 특히 바람직하다. 다른 바람직한 측쇄 보호기는 다음과 같다: 리신 및 아르기닌과 같은 측쇄 아미노기의 경우, 2,2,5,7,8-펜타메틸크로만-6-설포닐(pmc), 니트로, p-톨루엔설포닐, 4-메톡시벤젠-설포닐, Cbz, Boc, 및 아다만틸옥시카르보닐; 티로신의 경우, 벤질, o-브로모벤질옥시-카르보닐, 2,6-디클로로벤질, 이소프로필, t-부틸 (t-Bu), 시클로헥실, 시클로페닐, 및 아세틸(Ac); 세린의 경우, t-부틸, 벤질, 및 테트라하이드로피라닐; 히스티딘의 경우, 트리틸, 벤질, Cbz, p-톨루엔설포닐, 및 2,4-디니트로페닐; 트립토판의 경우, 포르밀; 아스파르트산 및 글루탐산의 경우, 벤질 및 t-부틸; 및 시스테인의 경우, 트리페닐메틸(트리틸).The disclosed compounds can be prepared by solid phase peptide synthesis, wherein the amino acid α-N-terminus is protected by an acid or base protecting group. These protecting groups must be easily removable without destruction of the growing peptide chain or racemization of any of the chiral centers contained therein, while being stable against the conditions of peptide bond formation. Suitable protecting groups include 9-fluorenylmethyloxycarbonyl (Fmoc), t-butyloxycarbonyl (Boc), benzyloxycarbonyl (Cbz), biphenylisopropyloxycarbonyl, t-amyloxycarbonyl, iso Bornyloxycarbonyl, α,α-dimethyl-3,5-dimethoxybenzyloxycarbonyl, o-nitrophenylsulfenyl, 2-cyano-t-butyloxycarbonyl, etc. The 9-fluorenylmethyloxycarbonyl (Fmoc) protecting group is particularly preferred for the synthesis of the disclosed compounds. Other preferred side chain protecting groups are: for side chain amino groups such as lysine and arginine, 2,2,5,7,8-pentamethylchroman-6-sulfonyl (pmc), nitro, p-toluenesulfonyl, 4-methoxybenzene-sulfonyl, Cbz, Boc, and adamantyloxycarbonyl; For tyrosine, benzyl, o-bromobenzyloxy-carbonyl, 2,6-dichlorobenzyl, isopropyl, t-butyl (t-Bu), cyclohexyl, cyclophenyl, and acetyl (Ac); For serine, t-butyl, benzyl, and tetrahydropyranyl; For histidine, trityl, benzyl, Cbz, p-toluenesulfonyl, and 2,4-dinitrophenyl; For tryptophan, formyl; for aspartic acid and glutamic acid, benzyl and t-butyl; and for cysteine, triphenylmethyl (trityl).

고상 펩티드 합성 방법에서, α-C-말단 아미노산은 적절한 고형 지지체 또는 수지에 부착된다. 상기 합성에 유용한 적절한 고형 지지체는 시약 및 단계적 축합-탈보호 반응의 반응 조건에 불활성일 뿐만 아니라 사용된 배지에서 불용성인 물질이다. α-C-말단 카르복시 펩티드의 합성을 위한 고형 지지체는 Applied Biosystems(Foster City, Calif.)로부터 입수 가능한 4-하이드록시메틸페녹시메틸-코폴리(스티렌-1% 디비닐벤젠) 또는 4-(2',4'-디메톡시페닐-Fmoc-아미노메틸)페녹시아세트아미도에틸 수지이다. α-C-말단 아미노산은 4-디메틸아미노피리딘(DMAP), 1-하이드록시벤조트리아졸(HOBT), 벤조트리아졸-1-일옥시-트리스(디메틸아미노)포스포늄헥사플루오로포스페이트(BOP), 또는 비스(2-옥소-3-옥사졸리디닐)포스핀 클로라이드(BOPCl)가 있거나 없는 상태에서 N,N'-디시클로헥실카르보디이미드(DCC), N,N'-디이소프로필카르보디이미드(DIC), 또는 O-벤조트리아졸-1-일-N,N,N',N'-테트라메틸우로늄헥사플루오로포스페이트(HBTU)에 의해 수지에 결합되고, 디클로로메탄 또는 DMF와 같은 용매 중에서 10℃ 내지 50℃의 온도에서 약 1 내지 약 24시간 동안 커플링을 매개한다. 고형분 지지체가 4-(2',4'-디메톡시페닐-Fmoc-아미노메틸)페녹시-아세트아미도에틸 수지인 경우, 전술한 것과 같은 α-C-말단 아미노산과의 커플링 이전에, Fmoc기를 이차 아민, 바람직하게는 피페리딘으로 절단한다. 탈보호된 4 (2',4'-디메톡시페닐-Fmoc-아미노메틸)페녹시-아세트아미도에틸 수지에 커플링하기 위한 하나의 방법은 DMF 중 O-벤조트리아졸-1-일-N,N,N',N'-테트라메틸우로늄헥사플루오로포스페이트(HBTU, 1당량) 및 1-하이드록시벤조트리아졸(HOBT, 1당량)이다. 연속적인 보호된 아미노산의 커플링은 자동 폴리펩티드 합성기에서 수행될 수 있다. 일 실시예에서, 성장하는 펩티드 사슬의 아미노산의 α-N-말단은 Fmoc로 보호된다. 성장하는 펩티드의 α-N-말단 측으로부터 Fmoc 보호기를 제거하는 것은 이차 아민, 바람직하게는 피페리딘으로 처리함으로써 달성된다. 그런 다음, 각각의 보호된 아미노산은 약 3배 몰 과량으로 도입되고, 커플링은 바람직하게는 DMF에서 수행된다. 커플링제는 O-벤조트리아졸-1-일-N,N,N',N'-테트라메틸우로늄헥사플루오로포스페이트(HBTU, 1당량) 및 1-하이드록시벤조트리아졸(HOBT, 1당량)일 수 있다. 고상 합성이 종료된 후, 폴리펩티드를 수지로부터 제거하여 탈보호하는데, 이는 연속으로 이루어지거나 단일 작업으로 이루어진다. 폴리펩티드의 제거 및 탈보호는 수지-결합된 폴리펩티드를 티아니솔, 물, 에탄디티올, 및 트리플루오로아세트산을 포함하는 절단 시약으로 처리함으로써 단일 작업으로 이루어질 수 있다. 폴리펩티드의 α-C-말단이 알킬아미드인 경우, 수지는 알킬아민에 의한 아미노분해에 의해 절단된다. 대안적으로, 펩티드는 (예를 들어 메탄올을 이용한) 에스테르 교환 반응에 이어서 아미노분해 또는 직접 트랜스아미드화에 의해 제거될 수 있다. 보호된 펩티드는 이 시점에서 정제되거나 다음 단계로 직접 이동할 수 있다. 측쇄 보호기의 제거는 전술한 절단 칵테일을 사용하여 달성될 수 있다. 완전히 탈보호된 펩티드는 다음 유형 중 어느 하나 또는 모두를 사용하는 크로마토그래피 단계의 순서에 의해 정제될 수 있다: 약한 염기성 수지(아세테이트 형태)를 이용한 이온 교환; 유도체화되지 않은 폴리스티렌-디비닐벤젠(예를 들어, Amberlite XAD)을 이용한 소수성 흡착 크로마토그래피; 실리카 겔 흡착 크로마토그래피; 카르복시메틸셀룰로오스를 이용한 이온 교환 크로마토그래피; 예를 들어 Sephadex G-25, LH-20, 또는 역류 분배를 이용한 분할 크로마토그래피; 고성능 액체 크로마토그래피(HPLC), 특히 옥틸- 또는 옥타데실릴-실리카 결합된 상 컬럼 충진을 이용한 역상 HPLC.In solid-phase peptide synthesis methods, the α-C-terminal amino acid is attached to a suitable solid support or resin. Suitable solid supports useful for this synthesis are materials that are inert to the reagents and reaction conditions of the stepwise condensation-deprotection reaction as well as insoluble in the medium used. Solid supports for the synthesis of α-C-terminal carboxy peptides were 4-hydroxymethylphenoxymethyl-copoly(styrene-1% divinylbenzene) or 4-(, available from Applied Biosystems (Foster City, Calif.). It is 2',4'-dimethoxyphenyl-Fmoc-aminomethyl)phenoxyacetamidoethyl resin. The α-C-terminal amino acids are 4-dimethylaminopyridine (DMAP), 1-hydroxybenzotriazole (HOBT), and benzotriazol-1-yloxy-tris(dimethylamino)phosphonium hexafluorophosphate (BOP). , or N,N'-dicyclohexylcarbodiimide (DCC), N,N'-diisopropylcarbodiimide, with or without bis(2-oxo-3-oxazolidinyl)phosphine chloride (BOPCl). bound to a resin by med (DIC), or O-benzotriazol-1-yl-N,N,N',N'-tetramethyluroniumhexafluorophosphate (HBTU), such as dichloromethane or DMF. The coupling is mediated in a solvent at a temperature of 10° C. to 50° C. for about 1 to about 24 hours. When the solid support is 4-(2',4'-dimethoxyphenyl-Fmoc-aminomethyl)phenoxy-acetamidoethyl resin, prior to coupling with the α-C-terminal amino acid as described above, Fmoc The group is cleaved with a secondary amine, preferably piperidine. One method for coupling to deprotected 4(2',4'-dimethoxyphenyl-Fmoc-aminomethyl)phenoxy-acetamidoethyl resin is O-benzotriazol-1-yl-N in DMF. ,N,N',N'-tetramethyluroniumhexafluorophosphate (HBTU, 1 equivalent) and 1-hydroxybenzotriazole (HOBT, 1 equivalent). Coupling of sequential protected amino acids can be performed in an automated polypeptide synthesizer. In one embodiment, the α-N-terminus of the amino acids of the growing peptide chain is protected with Fmoc. Removal of the Fmoc protecting group from the α-N-terminal side of the growing peptide is achieved by treatment with a secondary amine, preferably piperidine. Each protected amino acid is then introduced in approximately 3-fold molar excess and coupling is preferably performed in DMF. The coupling agent is O-benzotriazol-1-yl-N,N,N',N'-tetramethyluronium hexafluorophosphate (HBTU, 1 equivalent) and 1-hydroxybenzotriazole (HOBT, 1 equivalent) ) can be. After solid phase synthesis is complete, the polypeptide is removed from the resin and deprotected, which can be done sequentially or in a single operation. Removal and deprotection of the polypeptide can be accomplished in a single operation by treating the resin-bound polypeptide with a cleavage reagent comprising thianisole, water, ethanedithiol, and trifluoroacetic acid. When the α-C-terminus of the polypeptide is an alkylamide, the resin is cleaved by aminolysis with an alkylamine. Alternatively, peptides can be removed by transesterification (e.g. using methanol) followed by aminolysis or direct transamidation. Protected peptides can be purified at this point or proceed directly to the next step. Removal of side chain protecting groups can be achieved using the cleavage cocktail described above. Fully deprotected peptides can be purified by a sequence of chromatographic steps using any or all of the following types: ion exchange using a mildly basic resin (acetate form); Hydrophobic adsorption chromatography using nonderivatized polystyrene-divinylbenzene (e.g., Amberlite XAD); silica gel adsorption chromatography; Ion exchange chromatography using carboxymethylcellulose; Partition chromatography using, for example, Sephadex G-25, LH-20, or countercurrent partitioning; High-performance liquid chromatography (HPLC), especially reversed-phase HPLC using octyl- or octadesilyl-silica bonded phase column packing.

PEG기와 같은 상기 중합체는 임의의 적절한 조건 하에서 AC와 같은 올리고뉴클레오티드에 부착될 수 있다. 당업계에 알려진 임의의 수단이 사용될 수 있으며, 여기에는 아실화, 환원성 알킬화, 마이클 첨가, 티올 알킬화를 통한 방법, 또는 PEG 모이어티 상의 반응성 기(예를 들어, 알데히드, 아미노, 에스테르, 티올, α-할로아세틸, 말레이미도, 또는 하이드라지노 기)를 통해 AC 상의 반응성 기(예를 들어, 알데히드, 아미노, 에스테르, 티올, α-할로아세틸, 말레이미도, 또는 하이드라지노 기)에 화학선택적으로 접합/결찰하는 다른 방법이 포함된다. 수용성 중합체를 하나 이상의 단백질에 연결하는 데 사용될 수 있는 활성화기는 설폰, 말레이미드, 설프하이드릴, 티올, 트리플레이트, 트레실레이트, 아지디린, 옥시란, 5-피리딜, 및 알파-할로겐화 아실기(예를 들어, α-요오드 아세트산, α-브로모아세트산, α-클로로아세트산)를 포함하지만 이에 한정되지 않는다. 환원성 알킬화에 의해 AC에 부착되는 경우, 선택된 중합체는 중합의 정도가 조절되도록 단일 반응성 알데히드를 가져야 한다. 예를 들어, Kinstler 등의 문헌[Adv. Drug Delivery Rev. (2002), 54: 477-485]; Roberts 등의 문헌[Adv. Drug Delivery Rev. (2002), 54: 459-476]; 및 Zalipsky 등의 문헌[Adv. Drug Delivery Rev. (1995), 16: 157-182]을 참조한다.Such polymers, such as PEG groups, can be attached to oligonucleotides such as AC under any suitable conditions. Any means known in the art may be used, including via acylation, reductive alkylation, Michael addition, thiol alkylation, or conjugation of reactive groups on the PEG moiety (e.g., aldehyde, amino, ester, thiol, α). -Chemiselectively to a reactive group on the AC (e.g., an aldehyde, amino, ester, thiol, α-haloacetyl, maleimido, or hydrazino group) via a haloacetyl, maleimido, or hydrazino group. Other methods of joining/ligating are included. Activating groups that can be used to link water-soluble polymers to one or more proteins include sulfone, maleimide, sulfhydryl, thiol, triflate, tresylate, azidiline, oxirane, 5-pyridyl, and alpha-halogenated azide. Includes, but is not limited to, real groups (e.g., α-iodoacetic acid, α-bromoacetic acid, α-chloroacetic acid). When attached to AC by reductive alkylation, the polymer selected should have a single reactive aldehyde so that the extent of polymerization is controlled. For example, Kinstler et al. [Adv. Drug Delivery Rev. (2002), 54: 477-485]; Roberts et al. [Adv. Drug Delivery Rev. (2002), 54: 459-476]; and Zalipsky et al. [Adv. Drug Delivery Rev. (1995), 16: 157-182.

AC 또는 링커를 CPP에 직접 공유 연결하기 위해, CPP의 적절한 아미노산 잔기를 선택된 아미노산의 측쇄 또는 N-말단 또는 C-말단과 반응할 수 있는 유기 유도체와제와 반응시킬 수 있다. 펩티드 또는 접합체 모이어티 상의 반응성 기는, 예를 들어, 알데히드, 아미노, 에스테르, 티올, α-할로아세틸, 말레이미도, 또는 하이드라지노기를 포함한다. 유도체화제는, 예를 들어 말레이미도벤조일 설포숙신이미드 에스테르(시스테인 잔기를 통한 접합), N-하이드록시숙신이미드(리신 잔기를 통함), 글루타르알데히드, 숙신 무수물, 또는 당업계에 알려진 다른 제제를 포함한다.To covalently link an AC or linker directly to a CPP, the appropriate amino acid residue of the CPP can be reacted with an organic derivative capable of reacting with the side chain or N-terminus or C-terminus of the selected amino acid. Reactive groups on the peptide or conjugate moiety include, for example, aldehyde, amino, ester, thiol, α-haloacetyl, maleimido, or hydrazino groups. Derivatizing agents include, for example, maleimidobenzoyl sulfosuccinimide ester (conjugation via a cysteine residue), N-hydroxysuccinimide (via lysine residue), glutaraldehyde, succinic anhydride, or others known in the art. Includes preparations.

AC를 제조하고 AC를 선형 CPP에 접합하는 방법은 미국 특허 공개 제2018/0298383호에 전반적으로 기술되어 있으며, 동 문헌은 모든 목적을 위해 참조로서 본원에 통합된다. 상기 방법은 본원에 개시된 환형 CPP에 적용될 수 있다.Methods for making AC and joining AC to linear CPP are generally described in US Patent Publication No. 2018/0298383, which is incorporated herein by reference for all purposes. The method can be applied to the cyclic CPP disclosed herein.

합성 반응식은 도 3a~3d도 4에 제공되어 있다.Synthetic schemes are provided in Figures 3a-3d and Figure 4 .

AC에 접합시키는 데 유용한 CPP 및 반응성 기를 포함하는 화합물의 비제한적인 예는 표 9에 나타나 있다. 예시적인 링키기도 나타나 있다. 예시적인 반응성 기는 테트라플루오로페닐 에스테르(TFP), 유리 카르복시산(COOH), 및 아지드(N3)를 포함한다. 표 9에서, n은 0 내지 20의 정수이고; Pipa6은 AcRXRRBRRXRYQFLIRXRBRXRB이고(여기서 B는 β-알라닌이고 X는 아미노헥산산임); Dap는 2,3-디아미노프로피온산이고; NLS는 핵 국소화 서열이고; βA는 베타 알라닌이고; -ss-는 이황화물이고; PABC는 폴리(A) 결합 단백질 C-말단 도메인이고; Cx는 길이 x의 알킬 사슬이고(x는 숫자임); BCN은 바이시클로 [6.1.0]노닌이다.Non-limiting examples of compounds containing CPP and reactive groups useful for conjugation to AC are shown in Table 9 . An exemplary linkage is also shown. Exemplary reactive groups include tetrafluorophenyl ester (TFP), free carboxylic acid (COOH), and azide (N 3 ). In Table 9 , n is an integer from 0 to 20; Pipa6 is AcRXRRBRRXRYQFLIRXRBRXRB, where B is β-alanine and X is aminohexanoic acid; Dap is 2,3-diaminopropionic acid; NLS is a nuclear localization sequence; βA is beta alanine; -ss- is disulfide; PABC is the poly(A) binding protein C-terminal domain; C x is an alkyl chain of length x (x is a number); BCN is bicyclo[6.1.0]nonine.

CPP 및 반응성 기를 포함하는 화합물Compounds containing CPP and reactive groups TFP-PEGn-K(CPP)TFP- PEGn -K(CPP) TFP-PEGn-K(CPP)-PEGn-Dap(팔미토일)TFP-PEG n -K(CPP)-PEG n -Dap(palmitoyl) TFP-PEGn-K(CPP)-PEGn-Dap(CPP)TFP-PEG n -K(CPP)-PEG n -Dap(CPP) TFP-Pip6aTFP-Pip6a CPP-PEGn-TFPCPP- PEGn -TFP CPP-PEGn-K(CPP)-PEGn-TFPCPP- PEGn -K(CPP) -PEGn -TFP CPP-PEGn-Lys(N3)CPP-PEG n -Lys(N 3 ) CPP-K(CPP)-PEGn-K(N3)CPP-K(CPP)-PEG n -K(N 3 ) CPP-PEGn-K(PEGn-CPP)-PEGn-K(N3)CPP-PEG n -K(PEG n -CPP)-PEG n -K(N 3 ) CPP-PEGn-K(PEGn-CPP)-PEGn-K(N3)CPP-PEG n -K(PEG n -CPP)-PEG n -K(N 3 ) CPP-K(CPP)-K(CPP)-PEGn-K(N3)CPP-K(CPP)-K(CPP)-PEG n -K(N 3 ) CPP-PEGn-K(PEGn-CPP)-K(PEGn-CPP)-PEGn-K(N3)CPP-PEG n -K(PEG n -CPP)-K(PEG n -CPP)-PEG n -K(N 3 ) CPP-PEGn-K(PEGn-CPP)-K(PEGn-CPP)-PEGn-K(N3)CPP-PEG n -K(PEG n -CPP)-K(PEG n -CPP)-PEG n -K(N 3 ) Ac-NLS-Lys(CPP)-PEGn-K(N3)Ac-NLS-Lys(CPP)-PEG n -K(N 3 ) K(N3)- PEGn-NLS-ss-PEGn-CPPK(N 3 )-PEG n -NLS-ss-PEG n -CPP BCN-NLS-ss-CPPBCN-NLS-ss-CPP CPP-PEGn-Val-Cit-PABC-K(N3)CPP- PEGn -Val-Cit-PABC-K(N 3 ) CPP-PEGn-Cys-ss-Cys-K(N3)CPP-PEG n -Cys-ss-Cys-K(N 3 ) CPP-PEGn-Cys-ss-Cys-K(N3)CPP-PEG n -Cys-ss-Cys-K(N 3 ) CPP-PEGn-TFP CPP- PEGn -TFP CPP-PEGn-Lys(N3)CPP-PEG n -Lys(N 3 ) CPP-PEGn-Cys-프로디설파이드-K(N3)CPP-PEG n -Cys-prodisulfide-K(N 3 ) CPP-PEGn-K(N3)CPP-PEG n -K(N 3 ) CPP-K(CPP)-PEGn-K(N3)CPP-K(CPP)-PEG n -K(N 3 ) CPP-PEGn-K(CPP)-PEGn-TFP CPP- PEGn -K(CPP) -PEGn -TFP CPP-C6-TFPCPP- C6 -TFP CPP-PEGn-K(PEGn-CPP)PEGn-K(N3)CPP-PEG n -K(PEG n -CPP)PEG n -K(N 3 ) Ac-T9-PEGn-Lys(CPP-PEGn)-K(N3)Ac-T9-PEG n -Lys(CPP-PEG n )-K(N 3 ) Ac-MSP-PEGn-K(CPP-PEGn)-K(N3)Ac-MSP-PEG n -K(CPP-PEG n )-K(N 3 ) CPP-PEGn-TFP (ENTRD 802)CPP- PEGn -TFP (ENTRD 802) CPP-C6-TFP (ENTRD 696)CPP-C 6 -TFP (ENTRD 696) CPP-PEGn-K(CPP)-PEGn-TFP (ENTRD-344)CPP-PEG n -K(CPP)-PEG n -TFP (ENTRD-344) CPP-PEGn-COOH CPP-PEG n -COOH CPP-C12-TFP (ENTD-695)CPP-C 12 -TFP (ENTD-695) 팔미토일-PEGn-K(CPP)-PEGn-TFP (ENTD-343)Palmitoyl-PEG n -K(CPP)-PEG n -TFP (ENTD-343) CPP-PEGn-K(N3) (ENTRD-617)CPP-PEG n -K(N 3 ) (ENTRD-617) Ac-T9-PEGn-K(CPP)-K(N3) (ENTRD 673)Ac-T9-PEG n -K(CPP)-K(N 3 ) (ENTRD 673) Ac-MSP-PEGn-K(CPP-PEGn)-K(N3) (ENTRD 675)Ac-MSP-PEG n -K(CPP-PEG n )-K(N 3 ) (ENTRD 675) Ac-NLS-K(CPP)-PEGn-K(N3) (ENTRD 684)Ac-NLS-K(CPP)-PEG n -K(N 3 ) (ENTRD 684) K(N3)-PEGn-NLS-ss-PEGn-CPP (ETRD-681)K(N3)-PEG n -NLS-ss-PEG n -CPP (ETRD-681) K(N3)-PEGn-NLS-K-βA-βA-CPP (ETRD-682)K(N3)-PEG n -NLS-K-βA-βA-CPP (ETRD-682)

구현예에서, CPP는 AC에 접합시키는 데 사용될 수 있는 유리 카르복시산기를 갖는다. 구현예에서, EEV는 AC에 접합시키는 데 사용될 수 있는 유리 카르복시산기를 갖는다.In an embodiment, CPP has a free carboxylic acid group that can be used to conjugate to AC. In embodiments, EEV has a free carboxylic acid group that can be used to conjugate to AC.

아래 구조는 아지드를 포함하는 화합물과의 클릭 반응에 사용되는 3’ 시클로옥틴 변형된 PMO이다: The structure below is a 3' cyclooctyne modified PMO used for click reactions with compounds containing azides:

아미드 결합을 통해 CPP 및 링커를 AC의 3’ 단부에 접합시키는 예시적인 반응식이 아래에 도시되어 있다.An exemplary scheme for conjugating CPP and a linker to the 3' end of AC via an amide bond is shown below.

계통-촉진된 아지드-알킨 시클로첨가를 통해 CPP 및 링커를 3’-시클로옥틴 변형된 PMO에 접합시키는 예시적인 반응식이 아래에 나타나 있다:An exemplary scheme for conjugating CPP and linker to 3'-cyclooctyne modified PMO via lineage-promoted azide-alkyne cycloaddition is shown below:

AC 및 CPP를 폴리에틸렌 글리콜 모이어티를 함유하는 추가 링커와 연결하는 데 사용되는 접합 화학의 예가 아래에 나타나 있다:Examples of conjugation chemistries used to link AC and CPP with additional linkers containing polyethylene glycol moieties are shown below:

계통-촉진된 아지드-알킨 시클로첨가(클릭 화학)를 통해 CPP-링커를 5’-시클로옥틴 변형된 PMO에 접합시키는 것의 예가 아래에 나타나 있다:An example of conjugation of a CPP-linker to a 5'-cyclooctyne modified PMO via lineage-promoted azide-alkyne cycloaddition (click chemistry) is shown below:

올리고머 안티센스 화합물을 합성하는 방법은 당업계에 알려져 있다. 본 개시는 AC를 합성하는 방법에 의해 제한되지 않는다. 구현예에서, 예를 들어 포스포디에스테르 및 포스포로티오에이트 뉴클레오시드 간 결합을 포함하는 뉴클레오시드 간 결합을 형성하는 데 유용한 반응성 인기를 갖는 화합물이 본원에 제공된다. 전구체 또는 안티센스 화합물의 제조 및/또는 정제 방법은 본원에 제공된 조성물 또는 방법으로 제한되지 않는다. DNA, RNA, 및 안티센스 화합물의 합성 및 정제 방법은 당업자에게 잘 알려져 있다.Methods for synthesizing oligomeric antisense compounds are known in the art. The present disclosure is not limited by the method of synthesizing AC. In embodiments, provided herein are compounds with reactive properties that are useful for forming internucleoside linkages, including, for example, linkages between phosphodiester and phosphorothioate nucleosides. Methods for making and/or purifying precursor or antisense compounds are not limited to the compositions or methods provided herein. Methods for synthesizing and purifying DNA, RNA, and antisense compounds are well known to those skilled in the art.

변형된 뉴클레오시드 및 변형되지 않은 뉴클레오시드의 올리고머화는 DNA(Agrawal(Ed.)의 문헌[Protocols for Oligonucleotides and Analogs, (1993), Humana Press]) 및/또는 RNA(Scaringe의 문헌[Methods (2001), 23, 206-217]; Gait 등의 문헌[Applications of Chemically synthesized RNA in RNA: Protein Interactions, Ed. Smith (1998), 1-36]; Gallo 등의 문헌[Tetrahedron (2001), 57, 5707-5713])에 대한 문헌 절차에 따라 일상적으로 수행될 수 있다.Oligomerization of modified and unmodified nucleosides can be performed using DNA (Protocols for Oligonucleotides and Analogs, (1993), Humana Press) and/or RNA (Scaringe, Methods). (2001), 23, 206-217]; Gait et al. [Applications of Chemically synthesized RNA in RNA: Protein Interactions, Ed. Smith (1998), 1-36]; Gallo et al. [Tetrahedron (2001), 57 , 5707-5713]) can be routinely performed according to literature procedures.

본원에 제공된 안티센스 화합물은 잘 알려진 고상 합성 기술을 통해 편리하고 일상적으로 제조될 수 있다. 이러한 합성을 위한 장비는, 예를 들어 Applied Biosystems(Foster City, CA)를 포함하는 여러 벤더에 의해 판매된다. 당업계에 알려진 이러한 합성을 위한 임의의 다른 수단이 추가적으로 또는 대안적으로 사용될 수 있다. 포스포로티오에이트 및 알킬화 유도체와 같은 올리고뉴클레오티드를 제조하기 위해 유사한 기술을 사용하는 것은 잘 알려져 있다. 본 발명은 안티센스 화합물 합성 방법에 의해 제한되지 않는다.Antisense compounds provided herein can be conveniently and routinely prepared through well-known solid phase synthesis techniques. Equipment for such synthesis is sold by several vendors, including, for example, Applied Biosystems (Foster City, CA). Any other means for such synthesis known in the art may additionally or alternatively be used. It is well known to use similar techniques to prepare oligonucleotides such as phosphorothioates and alkylated derivatives. The present invention is not limited by the method of synthesizing antisense compounds.

올리고뉴클레오티드 정제 및 분석 방법은 당업자에게 알려져 있다. 분석 방법은 모세관 전기영동(CE) 및 전기분무 질량 분광법을 포함한다. 이러한 합성 및 분석 방법은 다중-웰 플레이트에서 수행될 수 있다. 본 발명의 방법은 올리고머 정제 방법에 의해 제한되지 않는다.Methods for oligonucleotide purification and analysis are known to those skilled in the art. Analytical methods include capillary electrophoresis (CE) and electrospray mass spectrometry. These synthesis and analysis methods can be performed in multi-well plates. The method of the present invention is not limited by the oligomer purification method.

본원에 개시된 화합물에서, AC는 CPP(예: 환형 펩티드)에 결합된다. 본원에서 사용되는 바와 같이, “결합된”은 CPP와 AC 간의 공유 또는 비공유 결합을 지칭할 수 있으며, 여기에는 CPP를 AC에 융합하는 것; 및 CPP(예를 들어, 환형 펩티드)를 AC에 화학적으로 접합하는 것이 포함된다. CPP를 AC에 비공유 부착하는 수단의 비제한적인 예는, 예를 들어 비오틴을 CPP에 접합시키고 AC를 스트렙트아비딘에 융합함으로써, 스트렙트아비딘/비오틴 상호작용을 통하는 것이다. 생성된 화합물에서, CPP는 비오틴과 스트렙트아비딘 간의 비공유 결합을 통해 AC에 결합된다.In the compounds disclosed herein, AC is linked to CPP (eg, a cyclic peptide). As used herein, “bound” may refer to a covalent or non-covalent bond between a CPP and an AC, including but not limited to fusing a CPP to an AC; and chemically conjugating CPP (e.g., cyclic peptide) to AC. A non-limiting example of a means to non-covalently attach CPP to AC is through streptavidin/biotin interactions, for example, by conjugating biotin to CPP and fusing AC to streptavidin. In the resulting compound, CPP is bound to AC through a non-covalent bond between biotin and streptavidin.

구현예에서, CPP(예: 환형 펩티드)는 AC에 직접 또는 간접적으로 접합되어 CPP-AC 접합체를 형성한다. AC를 CPP에 접합시키는 것은 이들 모이어티 상의 임의의 적절한 부위에서 발생할 수 있다. 예를 들어, 구현예에서, AC의 5’ 또는 3’ 단부가 CPP 내의 아미노산의 C-말단, N-말단, 또는 측쇄에 접합될 수 있다.In embodiments, a CPP (e.g., a cyclic peptide) is conjugated directly or indirectly to AC to form a CPP-AC conjugate. Conjugation of AC to CPP can occur at any suitable site on these moieties. For example, in embodiments, the 5' or 3' end of AC may be conjugated to the C-terminus, N-terminus, or side chain of an amino acid in CPP.

구현예에서, AC는 CPP(예: 환형 펩티드)에 공유 연결된다. 본원에서 사용되는 바와 같이, 공유 연결은 CPP 모이어티가 AC 모이어티의 5’ 및/또는 3’ 단부에 공유 연결되는 작제물을 지칭한다. 이러한 접합체는 CPP 모이어티(예: 환형 펩티드 모이어티) 및 올리고뉴클레오티드 모이어티를 갖는 것으로서 대안적으로 기술될 수 있다. 소정의 구현예에 따라 공유 연결된 AC-CPP 또는 CPP-AC 접합체는 본원에 기술된 링커에 의해 서로 연관된 AC 성분 및 CPP 성분을 포함한다.In an embodiment, the AC is covalently linked to a CPP (e.g., a cyclic peptide). As used herein, covalent linkage refers to a construct in which the CPP moiety is covalently linked to the 5' and/or 3' ends of the AC moiety. These conjugates may alternatively be described as having a CPP moiety (eg, a cyclic peptide moiety) and an oligonucleotide moiety. According to certain embodiments, a covalently linked AC-CPP or CPP-AC conjugate comprises an AC component and a CPP component linked to each other by a linker described herein.

구현예에서, AC는 CPP 상의 아미노산의 측쇄를 통해 CPP(예: 환형 펩티드)에 접합될 수 있다. 공유 결합을 형성할 수 있거나 그렇게 변형될 수 있는 CPP 상의 임의의 아미노산 측쇄가 AC를 CPP에 연결하는 데 사용될 수 있다. CPP 상의 아미노산은 천연 또는 비-천연 아미노산일 수 있다. 구현예에서, AC를 접합시키는 데 사용되는 CPP 상의 아미노산은 아스파르트산, 글루탐산, 글루타민, 아스파라긴, 리신, 오르니틴, 2,3-디아미노프로피온산, 또는 이의 유사체이며, 여기서 측쇄는 AC 또는 링커에 대한 결합으로 치환된다. 구현예에서, 아미노산은 리신 또는 이의 유사체이다. 구현예에서, 아미노산은 글루탐산 또는 이의 유사체이다. 구현예에서, 아미노산은 아스파르트산 또는 이의 유사체이다.In embodiments, AC may be conjugated to a CPP (e.g., a cyclic peptide) through the side chain of an amino acid on the CPP. Any amino acid side chain on the CPP that can form a covalent bond or be so modified can be used to link the AC to the CPP. Amino acids on CPP may be natural or non-natural amino acids. In an embodiment, the amino acid on the CPP used to conjugate the AC is aspartic acid, glutamic acid, glutamine, asparagine, lysine, ornithine, 2,3-diaminopropionic acid, or an analog thereof, wherein the side chain is for the AC or linker. replaced by bonding. In an embodiment, the amino acid is lysine or an analog thereof. In an embodiment, the amino acid is glutamic acid or an analog thereof. In an embodiment, the amino acid is aspartic acid or an analog thereof.

구현예에서, CPP는 환형이다. 본원에 개시된 화합물에 대한 다수의 가능한 구성이 있다. 구현예에서, 본 개시의 화합물은 AC가 환형 펩티드 내의 아미노산의 측쇄에 접합되는 화합물을 포함한다. 구현예에서, 본원에 개시된 화합물은 식 I-A에 따른 구조(즉, 환외 구조)를 가지며:In embodiments, CPP is cyclic. There are many possible configurations for the compounds disclosed herein. In embodiments, compounds of the present disclosure include compounds where AC is conjugated to the side chain of an amino acid in a cyclic peptide. In embodiments, the compounds disclosed herein have a structure (i.e., extracyclic structure) according to Formula I-A:

, ,

여기서 링커는 CPP 상의 아미노산의 측쇄 및 AC의 5’ 단부, AC의 백본, 또는 AC의 3’ 단부에 공유 결합된다.Here the linker is covalently attached to the side chain of an amino acid on CPP and the 5' end of AC, the backbone of AC, or the 3' end of AC.

질환 및 표적 유전자Diseases and target genes

구현예에서, 확장된 뉴클레오티드 반복(예: 확장된 트리뉴클레오티드 반복과 같은 확장된 트리뉴클레오티드 반복)을 갖는 하나 이상의 유전자와 연관된 질환 또는 장애를 치료하기 위한 화합물 및 방법이 제공된다. 구현예에서, 확장된 CTG·CUG 트리뉴클레오티드 반복을 갖는 하나 이상의 유전자와 연관된 질환 또는 장애를 치료하기 위한 화합물 및 방법이 제공된다. 구현예에서, 유전자의 3’-UTR에서 확장된 CTG·CUG 트리뉴클레오티드 반복을 갖는 하나 이상의 유전자와 연관된 질환 또는 장애를 치료하기 위한 화합물 및 방법이 제공된다. 구현예에서, DMPK, ATXN8OS ATXN8, 및/또는 JPH3과 같이, 3’ UTR에서 확장된 CTG·CUG를 갖는 유전자와 연관된 질환 또는 장애를 치료하기 위한 화합물 및 방법이 제공된다. 구현예에서, 유전자의 인트론에서 확장된 CTG·CUG 트리뉴클레오티드 반복을 갖는 하나 이상의 유전자와 연관된 질환 또는 장애를 치료하기 위한 화합물 및 방법이 제공된다. 구현예에서, TCF4의 인트론에서 확장된 CTG·CUG 트리뉴클레오티드 반복과 연관된 질환 또는 장애를 치료하기 위한 화합물 및 방법이 제공된다. 구현예에서, 1형 근긴장성 이영양증(DM1), 푹스 각막내피 이영양증(FECD), 8형 척수소뇌 실조증(SCA8), 및/또는 헌팅턴병 유사-2형(HDL2)을 치료하기 위한 화합물 및 방법이 제공된다.In embodiments, compounds and methods are provided for treating diseases or disorders associated with one or more genes having extended nucleotide repeats (e.g., extended trinucleotide repeats, such as extended trinucleotide repeats). In embodiments, compounds and methods are provided for treating diseases or disorders associated with one or more genes having expanded CTG · CUG trinucleotide repeats. In embodiments, compounds and methods are provided for treating diseases or disorders associated with one or more genes having expanded CTG·CUG trinucleotide repeats in the 3'-UTR of the gene. In embodiments, compounds and methods are provided for treating diseases or disorders associated with genes with extended CTG·CUG in the 3' UTR, such as DMPK, ATXN8OS ATXN8, and/or JPH3. In embodiments, compounds and methods are provided for treating diseases or disorders associated with one or more genes having expanded CTG·CUG trinucleotide repeats in the introns of the genes. In embodiments, compounds and methods are provided for treating diseases or disorders associated with expanded CTG·CUG trinucleotide repeats in the intron of TCF4. In embodiments, compounds and methods are provided for treating myotonic dystrophy type 1 (DM1), Fuchs' corneal endothelial dystrophy (FECD), spinocerebellar ataxia type 8 (SCA8), and/or Huntington's disease pseudo-type 2 (HDL2). do.

1형 근긴장성 이영양증(DM1)Myotonic dystrophy type 1 (DM1)

구현예에서, 근긴장성 이영양증(DM1 또는 스타이너트병)을 치료하기 위한 화합물, 조성물, 및 방법이 제공된다. DM1은 종종 근섬유에서의 반복적인 활동 전위로 인한 근육 변성 및 근긴장증 또는 근육 이완 지연을 특징으로 하는 다계통성 장애이다. 1형 근긴장성 이영양증(DM1)은 가장 흔한 형태의 근육 이영양증으로서, 8000명 중 약 1명이 감염된다. DM1은 CTG·CUG 확장에 의해 야기되는 유전적 장애에 대한 패러다임이다. DM1은 근긴장성 이영양증 단백질 키나아제(DMPK) 유전자의 3’-비번역 영역(UTR)에서 CTG·CUG 반복 확장에 의해 야기되는 신경근 장애이다. RNA 수준에서, DMPK 전사체(예를 들어, 확장된 CUG 반복)는 스플라이싱 조절 단백질, 예를 들어, 머슬블라인드 유사(MBNL) 단백질을 격리하는데, 이는 MBNL1에 의해 조절되는 다수의 하류 pre-mRNA(확장된 CUG 반복을 함유하지 않는 pre-mRNA)의 부정확한 스플라이싱을 초래한다. 이러한 기능 획득이 DM1의 원인이다.In embodiments, compounds, compositions, and methods for treating myotonic dystrophy (DM1 or Steinert disease) are provided. DM1 is a multisystem disorder characterized by muscle degeneration and myotonia, or delayed muscle relaxation, often due to repetitive action potentials in muscle fibers. Myotonic dystrophy type 1 (DM1) is the most common form of muscular dystrophy, affecting approximately 1 in 8,000 people. DM1 is a paradigm for genetic disorders caused by CTG·CUG expansion. DM1 is a neuromuscular disorder caused by CTG·CUG repeat expansions in the 3’-untranslated region (UTR) of the myotonic dystrophy protein kinase (DMPK) gene. At the RNA level, DMPK transcripts (e.g., expanded CUG repeats) sequester splicing regulatory proteins, such as muscleblind-like (MBNL) proteins, which regulate a number of downstream pre- It results in incorrect splicing of mRNA (pre-mRNA that does not contain expanded CUG repeats). This gain of function is the cause of DM1.

과도한 수의 CUG 반복은 독성 기능 획득으로서 지칭되는 독성 활성을 부여한다. 다수의 주요 단백질이 잘못 가공되고, 이는 전신성 사지 약화, 호흡 근육 손상, 심장 이상, 피로, 위장 합병증, 백내장, 실금, 및 과도한 주간 졸림을 포함하는 질환의 다계통성 성질의 원인이 된다.Excessive numbers of CUG repeats confer toxic activity, referred to as toxic gain of function. A number of key proteins are incorrectly processed, contributing to the multisystemic nature of the disease, which includes generalized limb weakness, respiratory muscle damage, cardiac abnormalities, fatigue, gastrointestinal complications, cataracts, incontinence, and excessive daytime sleepiness.

DMPK 유전자의 3′-비번역 영역 내에서 CTG·CUG 확장을 갖는 DM1 환자는 FECD에 대한 위험이 증가하며 각막 내피에서 CUGexp-MBNL1 병소를 형성한다. (Mootha 등의 문헌[Investigative ophthalmology &visual science, 2017; 58, 4579-4585]). MBNL1이 돌연변이체 RNA와 결합하면 유리 MBNL1의 세포 풀에 영향을 미치고, 감염된 뇌, 근육, 및 심장 조직에서 일부 MBNL1 표적 유전자(예를 들어, MBNL1에 의해 조절되는 유전자)의 잘못된 스플라이싱을 유발한다(Jiang 등의 문헌[Hum Mol Genet. 2004; 13: 3079-3088]). Gattey 등은 (Cornea. 2014; 33: 96-98)은 모녀 쌍을 포함하는 4명의 DM1 대상체에서의 FECD를 보고하였다. 따라서, DM1과 FECD 간의 연관성이 존재할 가능성이 높다(FECD는 본원의 다른 곳에서 더 상세히 설명됨).DM1 patients with CTG·CUG expansions within the 3′-untranslated region of the DMPK gene are at increased risk for FECD and form CUGexp-MBNL1 foci in the corneal endothelium. (Mootha et al. [Investigative ophthalmology &visual science, 2017; 58, 4579-4585]). Binding of MBNL1 to mutant RNA affects the cellular pool of free MBNL1 and causes mis-splicing of some MBNL1 target genes (e.g., genes regulated by MBNL1) in infected brain, muscle, and heart tissues. (Jiang et al. [Hum Mol Genet. 2004; 13: 3079-3088]). Gattey et al. (Cornea. 2014; 33: 96-98) reported FECD in four DM1 subjects, including mother-daughter pairs. Therefore, it is likely that an association exists between DM1 and FECD (FECD is described in more detail elsewhere herein).

이론에 구속되고자 하는 것은 아니지만, DM1의 발병기전을 설명하기 위해 적어도 두 가지 가설이 제안되었다. 하나는 확장된 CTG·CUG 반복이 DMPK mRNA 또는 단백질 생성을 억제하여 DMPK 반수체기능부전을 초래한다는 것이다. 이는, DM1 근육에서 DMPK mRNA 및 단백질의 발현 감소를 입증하는 연구에 의해 뒷받침되었다(Fu, Y.H. 등의 문헌[(1993) Decreased expression of myotonin-protein kinase messenger RNA and protein in adult form of myotonic dystrophy. Science 260, 235-238]). 구현예에서, 본원에 기술된 화합물 및 방법은 DMPK 반수체기능부전을 개선한다. 또 다른 RNA 기능 획득 가설은 확장된 대립유전자로부터 전사된 돌연변이체 RNA가 질환의 증상을 유도하기에 충분하다는 것을 제안한다. 이는 관찰에 의해 제안되었다: (i) 확장된 CTG 반복은 CUG 반복으로 전사되어 이산된 핵 병소에 축적됨; (ii) 200개의 CTG 반복을 갖는 DMPK 3’-UTR의 발현은 근발생을 억제하기에 충분함(Davis, B.M. 등의 문헌[(1997) Expansion of a CUG trinucleotide repeat in the 3l untranslated region of myotonic dystrophy protein kinase transcripts results in nuclear retention of transcripts. Proc. Natl. Acad. Sci. U.S.A. 94, 7388-7393]; Amack, J.D. 등의 문헌[(1999) Cis and trans effects of the myotonic dystrophy (DM) mutation in a cell culture model. Hum. Mol. Genet. 8, 1975-1984]). 구현예에서, 본원에 기술된 화합물 및 방법은 확장된 대립유전자와 연관된 돌연변이체 RNA의 전사를 감소시킨다.Without wishing to be bound by theory, at least two hypotheses have been proposed to explain the pathogenesis of DM1. One is that expanded CTG·CUG repeats suppress DMPK mRNA or protein production, resulting in DMPK haploid dysfunction. This was supported by a study demonstrating decreased expression of DMPK mRNA and protein in DM1 muscle (Fu, Y.H. et al. [(1993) Reduced expression of myotonin-protein kinase messenger RNA and protein in adult form of myotonic dystrophy. Science 260, 235-238]). In embodiments, the compounds and methods described herein improve DMPK haplodysfunction. Another RNA gain-of-function hypothesis proposes that mutant RNA transcribed from the expanded allele is sufficient to induce disease symptoms. This is suggested by the observations: (i) expanded CTG repeats are transcribed into CUG repeats and accumulate in discrete nuclear foci; (ii) Expression of DMPK 3'-UTR with 200 CTG repeats is sufficient to inhibit myogenesis (Davis, B.M. et al. [(1997) Expansion of a CUG trinucleotide repeat in the 3l untranslated region of myotonic dystrophy protein kinase transcripts results in nuclear retention of transcripts. Proc. Natl. Acad. Sci. U.S.A. 94, 7388-7393]; Amack, J.D. et al. (1999) Cis and trans effects of the myotonic dystrophy (DM) mutation in a cell culture model. Hum. Mol. Genet. 8, 1975-1984]). In embodiments, the compounds and methods described herein reduce transcription of mutant RNA associated with an expanded allele.

DMPK mRNA의 3’ 비번역 영역에서의 확장된 CTG·CUG 트리뉴클레오티드 반복은 불완전한 안정한 헤어핀 구조를 형성하는데, 이는 작은 리보핵 복합체 또는 현미경으로 보이는 내포물로 세포 핵에 축적되고, 전사, 스플라이싱, 또는 RNA 내보내기에 관여하는 단백질의 기능을 손상시킨다. CUG 반복을 갖는 DMPK 유전자가 mRNA로 전사되기는 하지만, 돌연변이체 전사체가 핵에서 응집체(병소)로서 격리되고, 그 결과 세포질 DMPK mRNA 수준이 감소한다. 이러한 응집은 2개의 RNA 결합 단백질: MBNL1(머슬블라인드-유사 1) 및 CUGBP1(CUG-결합 단백질 1)의 격리로 인한 많은 상이한 전사체의 대안적인 스플라이싱의 조절 상실로 이어지고, MBNL1의 기능 상실 및 CUGBP1의 상향 조절을 유발한다(Lee 및 Cooper의 문헌[(2009) “Pathogenic mechanisms of myotonic dystrophy,” Biochem Soc Trans. 37(06): 1281-1286]).Expanded CTG·CUG trinucleotide repeats in the 3' untranslated region of DMPK mRNA form incomplete stable hairpin structures, which accumulate in the cell nucleus as small ribonuclear complexes or microscopic inclusions, and are involved in transcription, splicing, and transcription processes. Alternatively, it impairs the function of proteins involved in RNA export. Although the DMPK gene with CUG repeats is transcribed into mRNA, the mutant transcripts are sequestered as aggregates (foci) in the nucleus, resulting in decreased cytoplasmic DMPK mRNA levels. This aggregation leads to loss of regulation of alternative splicing of many different transcripts due to sequestration of two RNA binding proteins: muscleblind-like 1 (MBNL1) and CUG-binding protein 1 (CUGBP1), resulting in loss of function of MBNL1. and causes upregulation of CUGBP1 (Lee and Cooper (2009) “Pathogenic mechanisms of myotonic dystrophy,” Biochem Soc Trans. 37(06): 1281-1286).

DM1에서, RNA 결합 단백질 MBNL1은 CUG 반복에 의해 형성된 이중 가닥 헤어핀 구조에 격리되어, 핵형질로부터 고갈된다. 그런 다음, MBNL1이 결합된 CUG 반복은 미지의 메커니즘을 통해 단백질 키나아제 C(PKC) 활성을 자극하는데, 이는 CUGBP1 과인산화 및 안정화를 유도한다. 하류 효과는 대안적인 스플라이싱의 파괴, mRNA 번역, 및 하류 유전자의 mRNA 붕괴를 포함한다. DM1의 중요한 분자 특징은 이중 가닥 헤어핀 구조에 의해 MBNL1이 CUG 반복에 격리됨으로 인한 대안적 스플라이싱의 오조절이다. DM1에서 잘못 조절된 24개가 넘는 스플라이싱 이벤트 중에서, 골격근 특이적 ClC-1(염화물 채널 1)의 비정상적인 스플라이싱은 근긴장증의 원인 중 하나인 것으로 알려져 있다. 조기 종결 코돈을 함유하는 엑손의 포함 증가는 ClC-1 mRNA 및 단백질의 하향 조절을 초래하며, 이는 근긴장증을 유발하기에 충분하다(Charlet-B 등의 문헌[(2002) Loss of the muscle-specific chloride channel in type 1 myotonic dystrophy due to misregulated alternative splicing. Mol. Cell 10, 45-53]; Mankodi, A. 등의 문헌[(2002) Expanded CUG repeats trigger aberrant splicing of ClC-1 chloride channel pre-mRNA and hyperexcitability of skeletal muscle in myotonic dystrophy. Mol. Cell 10, 35-44]). 구현예에서, 본원에 기술된 화합물 및 방법은 대안적인 스플라이싱의 파괴, mRNA 번역, 및 하류 유전자의 mRNA 붕괴를 포함하는 하류 효과를 개선한다. 구현예에서, 본원에 기술된 화합물 및 방법은 본 개시의 화합물 또는 방법으로 치료되지 않은 DM1을 가진 대상체와 비교하여 DM1에서 잘못 조절된 스플라이싱 이벤트의 수를 감소시킨다. 예를 들어, 일부 구현예에서, 본원에 기술된 화합물 및 방법은 다음과 같은 하나 이상의 하류 유전자에서 잘못 조절된 스플라이싱 이벤트의 수를 감소시킬 수 있다: 4833439L19Rik, Abcc9, Atp2a1, Arhgef10, Arhgap28, Armcx6, Angel1, Best3, Bin1, Brd2, Cacna1s, Cacna2d1, Cpd, Cpeb3, Ccpg1, Clasp1, Clcn1, Clk4, Cpeb2, Camk2g, Capzb, Copz2, Coch, cTNT, Ctu2, Cyp2s1, Dctn4, Dnm1l, Eya4, Efna3, Efna2, Fbxo31, Fbxo21, Frem2, Fgd4, Fuca1, Fn1, Gogla4, Gpr37l1, Greb1, Heg1, Insr, Impdh2, IR, Itgav, Jag2, Klc1, Kcan6, Kif13a, Ldb3, Lrrfip2, Mapt, Macf1, Map3k4, Mapkap1, Mbnl1, Mllt3, Mbnl2, Mef2c, Mpdz, Mrpl1, Mxra7, Mybpc1, Myo9a, Ncapd3, Ngfr, Ndrg3, Ndufv3, Neb, Nfix, Numa1, Opa1, Pacsin2, Pcolce, Pdlim3, Pla2g15, Phactr4, Phka1, Phtf2, Ppp1r12b, Ppp3cc, Ppp1cc, Ramp2, Rapgef1, Rur1, Ryr1, Sorcs2, Spsb4, Scube2, Sema6c, Sfc8a3, Slain2, Sorbs1, Spag9, Tmem28, Tacc1, Tacc2, Ttc7, Tnik, Tnfrsf22, Tnfrsf25, Trappc9, Trim55, Ttn, Txnl4a, Txlnb, Ube2d3, 또는 Vsp39. 구현예에서, 본원에 기술된 화합물 및 방법은 본 개시의 화합물 또는 방법으로 치료되지 않은 DM1을 가진 대상체와 비교하여 ClC-1 mRNA의 하향 조절을 초래하는 조기 종결 코돈을 함유하는 엑손의 수를 감소시킨다.In DM1, the RNA binding protein MBNL1 is sequestered in a double-stranded hairpin structure formed by CUG repeats and is depleted from the nucleoplasm. MBNL1-bound CUG repeats then stimulate protein kinase C (PKC) activity through an unknown mechanism, which leads to CUGBP1 hyperphosphorylation and stabilization. Downstream effects include disruption of alternative splicing, mRNA translation, and mRNA decay of downstream genes. An important molecular feature of DM1 is the misregulation of alternative splicing due to the sequestration of MBNL1 to the CUG repeats by a double-stranded hairpin structure. Among the more than 24 splicing events misregulated in DM1, aberrant splicing of skeletal muscle-specific chloride channel 1 (ClC-1) is known to be one of the causes of myotonia. Increased inclusion of exons containing premature stop codons results in downregulation of ClC-1 mRNA and protein, which is sufficient to cause myotonia (Charlet-B et al. (2002) Loss of the muscle-specific chloride channel in type 1 myotonic dystrophy due to misregulated alternative splicing. Mol. Cell 10, 45-53]; Mankodi, A. et al. [(2002) Expanded CUG repeats trigger aberrant splicing of ClC-1 chloride channel pre-mRNA and hyperexcitability of skeletal muscle in myotonic dystrophy. Mol. Cell 10, 35-44]). In embodiments, the compounds and methods described herein improve downstream effects, including disruption of alternative splicing, mRNA translation, and mRNA decay of downstream genes. In embodiments, the compounds and methods described herein reduce the number of misregulated splicing events in DM1 compared to subjects with DM1 who were not treated with a compound or method of the present disclosure. For example, in some embodiments, the compounds and methods described herein can reduce the number of misregulated splicing events in one or more downstream genes, such as: 4833439L19Rik, Abcc9, Atp2a1, Arhgef10, Arhgap28, Armcx6, Angel1, Best3, Bin1, Brd2, Cacna1s, Cacna2d1, Cpd, Cpeb3, Ccpg1, Clasp1, Clcn1, Clk4, Cpeb2, Camk2g, Capzb, Copz2, Coch, cTNT, Ctu2, Cyp2s1, Dctn4, Dnm1l, Eya4, Efna3, Efna2, Fbxo31, Fbxo21, Frem2, Fgd4, Fuca1, Fn1, Gogla4, Gpr37l1, Greb1, Heg1, Insr, Impdh2, IR, Itgav, Jag2, Klc1, Kcan6, Kif13a, Ldb3, Lrrfip2, Mapt, Macf1, Map3k4, Mapkap1, Mbnl1, Mllt3, Mbnl2, Mef2c, Mpdz, Mrpl1, Mxra7, Mybpc1, Myo9a, Ncapd3, Ngfr, Ndrg3, Ndufv3, Neb, Nfix, Numa1, Opa1, Pacsin2, Pcolce, Pdlim3, Pla2g15, Phactr4, Phka1, Phtf2, Ppp1r12b, Ppp3cc, Ppp1cc, Ramp2, Rapgef1, Rur1, Ryr1, Sorcs2, Spsb4, Scube2, Sema6c, Sfc8a3, Slain2, Sorbs1, Spag9, Tmem28, Tacc1, Tacc2, Ttc7, Tnik, Tnfrsf22, Tnfrsf25, Trappc9, Trim55, Ttn, Txnl4a , Txlnb, Ube2d3, or Vsp39. In embodiments, the compounds and methods described herein reduce the number of exons containing premature stop codons that result in downregulation of ClC-1 mRNA compared to subjects with DM1 not treated with a compound or method of the present disclosure. I order it.

핵에서 MBNL1 및 CUGBP1의 수준은 DM1에서 역전되는 발달 조절된 스플라이싱 이벤트의 하위 집합을 조절한다. 배아 단계에서는, MBNL1 핵 수준이 낮고 CUGBP1 수준은 높다. 발달하는 동안, MBNL1 핵 수준은 증가하는 반면, CUGBP1 수준은 감소하여, 하류 스플라이싱 표적(IR 엑손 11, 정지 코돈을 함유하는 ClC-1 엑손, 및 cTNT 엑손 5 포함)의 배아에서 성인으로의 전이를 유도한다. 그러나, DM1에서, MBNL1은 CUG 반복에 격리되어 기능적 MBNL1의 감소시키는 반면, CUGBP1 수준은 인산화 및 안정화로 인해 증가한다. 이는 배아 조건을 시뮬레이션하고 성인에서 배아 이소형의 발현을 강화시켜, 다수의 질환 증상을 나타낸다(Lee 및 Cooper의 2009 문헌). 구현예에서, 본원에 기술된 화합물 및 방법은 본 개시의 화합물 또는 방법으로 치료되지 않은 DM1을 가진 대상체와 비교하여 격리된 MBNL1의 양을 감소시키고, 기능적 MBNL1의 양을 증가시키고, CUGBP1 수준을 감소시킨다.The levels of MBNL1 and CUGBP1 in the nucleus regulate a subset of developmentally regulated splicing events that are reversed in DM1. At embryonic stages, MBNL1 nuclear levels are low and CUGBP1 levels are high. During development, MBNL1 nuclear levels increase, while CUGBP1 levels decrease, resulting in increased inhibition of downstream splicing targets (including IR exon 11, ClC-1 exon containing a stop codon, and cTNT exon 5) from embryo to adult. induce metastasis. However, in DM1, MBNL1 is sequestered to CUG repeats, reducing functional MBNL1, while CUGBP1 levels increase due to phosphorylation and stabilization. This simulates embryonic conditions and enhances the expression of embryonic isoforms in the adult, resulting in multiple disease symptoms (Lee and Cooper, 2009). In embodiments, the compounds and methods described herein reduce the amount of sequestered MBNL1, increase the amount of functional MBNL1, and reduce CUGBP1 levels compared to subjects with DM1 not treated with a compound or method of the present disclosure. I order it.

MBNL1 및 CELF1(“CUGBP1”로도 지칭됨)은 태아가 성인이 되는 동안 스플라이싱 이벤트의 발달 조절자이며, DM1에서는 이들의 활성 변형으로 인해 성인 조직에서 태아 스플라이싱 패턴이 발현된다. 낮은 MBNL1 및 높은 CELF1의 하류 영향은, MBNL1에 추가하여, 심장 트로포닌 T(cTNT), 인슐린 수용체(INSR), 근육 특이적 염화물 이온 채널(CLCN1), 및 사르코플라스마성/내플라스마성 망상 칼슘 ATPase 1(ATP2A1) 전사체와 같은 단백질에서 대안적인 스플라이싱의 파괴, mRNA 번역, 및 mRNA 붕괴를 포함한다. Konieczny 등의 문헌[(2017) “Myotonic dystrophy: candidate small molecule therapeutics,” Drug Discovery Today. 22(11):1740-1748].MBNL1 and CELF1 (also referred to as “CUGBP1”) are developmental regulators of splicing events during fetal transition to adulthood, and in DM1, their active modifications result in expression of fetal splicing patterns in adult tissues. Downstream effects of low MBNL1 and high CELF1 include, in addition to MBNL1, cardiac troponin T (cTNT), insulin receptor (INSR), muscle-specific chloride ion channel (CLCN1), and sarcoplasmic/endoplasmic reticular calcium ATPase. These include disruption of alternative splicing, mRNA translation, and mRNA decay in proteins such as 1(ATP2A1) transcripts. Konieczny et al. (2017) “Myotonic dystrophy: candidate small molecule therapeutics,” Drug Discovery Today. 22(11):1740-1748].

DMPK 유전자의 3’-UTR에서 폴리CUG 반복을 표적화하는 안티센스 올리고머를 사용하여 근긴장성 이영양증을 치료하기 위한 화합물 및 방법은 US10106796B2, US10111962B2, US20150080311A1에 기술되어 있으며, 이들 각각은 모든 목적을 위해 그 전체가 참조로서 본원에 통합된다. 그러나, DM1을 치료하기 위해 CUG 반복을 표적화하는 이러한 PMO 또는 PPMO는 질환에 걸린 조직인 근육에 올리고 전달하는 데 있어서 한계가 있을 수 있다.Compounds and methods for treating myotonic dystrophy using antisense oligomers targeting polyCUG repeats in the 3'-UTR of the DMPK gene are described in US10106796B2, US10111962B2, US20150080311A1, each of which is incorporated in its entirety for all purposes. Incorporated herein by reference. However, these PMOs or PPMOs targeting CUG repeats to treat DM1 may have limitations in uptake and delivery to muscle, the diseased tissue.

구현예에서, 본 개시는 본원에 (예를 들어 표 210에) 기술된 AC(예: PMO 또는 ASO) 및 분해 서열을 세포의 세포액에 전달하기 위한 다양한 세포 투과 펩티드(CPP)의 용도를 교지한다. 구현예에서, AC와 접합된 CPP 또는 EEV는 pre-mRNA 상의 표적 서열이 위치하는 세포 위치에 관심 AC를 전달한다.In embodiments, the present disclosure provides for the use of various cell penetrating peptides (CPPs) to deliver ACs (e.g., PMOs or ASOs) and cleavage sequences described herein (e.g., in Tables 2 and 10 ) to the cytosol of cells. I teach. In an embodiment, CPP or EEV conjugated with an AC delivers the AC of interest to the cellular location where the target sequence on the pre-mRNA is located.

구현예에서, 질환은 근긴장성 이영양증(예를 들어, 1형 근긴장성 이영양증 또는 2형 근긴장성 이영양증)의 형태이다. 구현예에서, 표적 유전자는 근긴장성-단백질 키나아제를 암호화하는 DMPK 유전자이다. 구현예에서, 본원에 제공된 화합물은 DMPK 유전자를 분해하기 위해 DMPK(예: DMPK 유전자의 3’-비번역 영역/폴리아데닐화)를 표적화하는 AC(예: ASO)를 포함한다. 분해를 위해 DMPK를 표적화하는 예시적인 올리고뉴클레오티드는 표 10에 제공되어 있다. 분해 서열은, 표 2에 제공된 AC를 포함하지만 이에 한정되지 않는, 10~40개의 CAG 반복을 포함하는 AC 서열과 조합하여 사용될 수 있다.In an embodiment, the condition is a form of myotonic dystrophy (e.g., myotonic dystrophy type 1 or myotonic dystrophy type 2). In an embodiment, the target gene is the DMPK gene encoding myotonic-protein kinase. In embodiments, compounds provided herein include ACs (e.g., ASOs) that target DMPK (e.g., 3'-untranslated region/polyadenylation of the DMPK gene) to degrade the DMPK gene. Exemplary oligonucleotides targeting DMPK for degradation are provided in Table 10 . Degradation sequences can be used in combination with AC sequences containing 10-40 CAG repeats, including but not limited to the ACs provided in Table 2 .

분해를 위해 DMPK를 표적화하는 올리고뉴클레오티드(AC).Oligonucleotides (AC) targeting DMPK for degradation. 올리고(AC) IDOligo(AC) ID 서열 (5'에서 3' 방향)Sequence (5' to 3' direction) 서열번호sequence number 표적target 5’-CAG CAG CAG CAG CAG CAG CAG-3’-클릭-K-PEG12-Lys(CPP12)-NLS-AC
(모든 PMO 단량체)
5'-CAG CAG CAG CAG CAG CAG CAG-3'-Click-K-PEG12-Lys(CPP12)-NLS-AC
(all PMO monomers)
DMPKDMPK
DMPK-A-17DMPK-A-17 GGGCCTTTTATTCGCGAGGGTCGGGGGGCCTTTTATTCGCGAGGGTCGGG 151151 DMPKDMPK DMPK-A-18DMPK-A-18 GAGGGCCTTTTATTCGCGAGGGTCGGAGGGCCTTTATTCGCGAGGGTCG 152152 DMPKDMPK DMPK-A-19DMPK-A-19 TGGAGGGCCTTTTATTCGCGAGGGTTGGAGGGCCTTTTATTCGGCGAGGGT 153153 DMPKDMPK DMPK-A-20DMPK-A-20 GATGGAGGGCCTTTTATTCGCGAGGGATGGAGGCCTTTTATTCGGCGAGG 154154 DMPKDMPK DMPK-A-21DMPK-A-21 CAGATGGAGGGCCTTTTATTCGCGACAGATGGAGGGCCTTTTATTCGCGA 155155 DMPKDMPK DMPK-A-22DMPK-A-22 GGCAGATGGAGGGCCTTTTATTCGCGGCAGATGGAGGGGCCTTTTATTCGC 156156 DMPKDMPK DMPK-A-23DMPK-A-23 TGGGCAGATGGAGGGCCTTTTATTCTGGGCAGATGGAGGGCCTTTTATTC 157157 DMPKDMPK DMPK-A-24DMPK-A-24 TTTGGGCAGATGGAGGGCCTTTTATTTGGGCAGATGGAGGGCCTTTTAT 158158 DMPKDMPK DMPK-A-25DMPK-A-25 GCTTTGGGCAGATGGAGGGCCTTTTGCTTTGGGCAGATGGAGGGCCTTTT 159159 DMPKDMPK DMPK-A-26DMPK-A-26 GAGCTTTGGGCAGATGGAGGGCCTTGAGCTTTGGGCAGATGGAGGGCCTT 160160 DMPKDMPK DMPK-A-27DMPK-A-27 CAGAGCTTTGGGCAGATGGAGGGCCCAGAGCTTTGGGCAGATGGAGGGCC 161161 DMPKDMPK DMPK-A-28DMPK-A-28 TCCAGAGCTTTGGGCAGATGGAGGGTCCAGAGCTTTGGGCAGATGGAGGG 162162 DMPKDMPK DMPK-A-29DMPK-A-29 AGTCCAGAGCTTTGGGCAGATGGAGAGTCCAGAGCTTTGGGCAGATGGAG 163163 DMPKDMPK DMPK-A-30DMPK-A-30 GGAGTCCAGAGCTTTGGGCAGATGGGGAGTCCAGAGCTTTGGGCAGATGG 164164 DMPKDMPK DMPK-A-31DMPK-A-31 GTGGAGTCCAGAGCTTTGGGCAGATGTGGAGTCCAGAGCTTTGGCAGAT 165165 DMPKDMPK DMPK-A-32DMPK-A-32 CTGTGGAGTCCAGAGCTTTGGGCAGCTGTGGAGTCCAGAGCTTTGGGCAG 166166 DMPKDMPK DMPK-A-33DMPK-A-33 CACTGTGGAGTCCAGAGCTTTGGGCCACTGTGGAGTCCAGAGCTTTTGGGC 177177 DMPKDMPK DMPK-A-34DMPK-A-34 GACACTGTGGAGTCCAGAGCTTTGGGACACTGTGGAGTCCAGAGCTTTGG 178178 DMPKDMPK DMPK-A-35DMPK-A-35 CGGACACTGTGGAGTCCAGAGCTTTCGGACACTGTGGAGTCCAGAGCTTT 179179 DMPKDMPK DMPK-A-36DMPK-A-36 CGCGGACACTGTGGAGTCCAGAGCTCGCGGACACTGTGGAGTCCAGAGCT 180180 DMPKDMPK DMPK-A-37DMPK-A-37 ACCGCGGACACTGTGGAGTCCAGAGACCGCGGACACTGTGGAGTCCAGAG 181181 DMPKDMPK DMPK-A-38DMPK-A-38 AAACCGCGGACACTGTGGAGTCCAGAAACCGCGGACACTGTGGAGTCCAG 182182 DMPKDMPK DMPK-A-39DMPK-A-39 GCAAACCGCGGACACTGTGGAGTCCGCAAACCGCGGACACTGTGGAGGTCC 183183 DMPKDMPK DMPK-A-40DMPK-A-40 ACGCAAACCGCGGACACTGTGGAGTACGCAAACCGCGGACACTGTGGAGT 184184 DMPKDMPK DMPK-A-41DMPK-A-41 CAACGCAAACCGCGGACACTGTGGACAACGCAAACCGCGGACACTGTGGA 185185 DMPKDMPK

8형 척수소뇌 실조증(SCA8)Spinocerebellar ataxia type 8 (SCA8)

구현예에서, 8형 척수소뇌 실조증(SCA8)을 치료하기 위한 화합물, 조성물, 및 방법이 제공된다. SCA8은 서서히 진행되는 실조를 특징으로 하는 유전성 신경퇴행성 병태이다. 증상은 일반적으로 30대 내지 50대에 나타난다. 증상은 안구 운동 이상, 감각 신경병증, 연하곤란, 소뇌 실조, 및 인지 장애를 포함한다.In embodiments, compounds, compositions, and methods for treating spinocerebellar ataxia type 8 (SCA8) are provided. SCA8 is an inherited neurodegenerative condition characterized by slowly progressive ataxia. Symptoms generally appear in the 30s to 50s. Symptoms include oculomotor abnormalities, sensory neuropathy, dysphagia, cerebellar ataxia, and cognitive impairment.

SCA8은 2개의 중첩 유전자 ATXN8OS 및 ATXN8의 3’ UTR에서 이형접합성 비정상적인 확장된 CTG·CUG 반복과 관련이 있다. 건강한 개체는 일반적으로 ATXN8OS 및 ATXN8 유전자에서 15 내지 50개의 CTG·CUG 반복을 갖는다. SCA8 환자는 ATXN8OS 및 ATXN8 유전자에서 50개가 넘는 CTG·CUG 반복을 가지며, 많게는 240개의 CTG·CUG 반복을 갖기도 한다.SCA8 is associated with heterozygous abnormal expanded CTG·CUG repeats in the 3’ UTR of two overlapping genes, ATXN8OS and ATXN8. Healthy individuals typically have 15 to 50 CTG·CUG repeats in the ATXN8OS and ATXN8 genes. SCA8 patients have more than 50 CTG·CUG repeats in the ATXN8OS and ATXN8 genes, and may have as many as 240 CTG·CUG repeats.

헌팅톤병 유사-2형(HDL2) Huntington's disease pseudo-type 2 (HDL2)

구현예에서, 헌팅톤병 유사-2형(HDL2) 질환을 치료하기 위한 화합물, 조성물, 및 방법이 제공된다. HDL2는 헌팅톤병과 표현형적으로 관련된 상염색체 우성 신경퇴행성 장애이다. HDL2는 무도병, 근긴장 이상, 경직, 운동완서, 및 치매와 같은 정신과적 증상을 포함하는 증상을 특징으로 한다. HDL2의 증상은 일반적으로 중년에 발생하며, 약 10~15년의 조기 사망을 초래할 수 있다.In embodiments, compounds, compositions, and methods for treating Huntington's disease-like-2 (HDL2) disease are provided. HDL2 is an autosomal dominant neurodegenerative disorder phenotypically related to Huntington's disease. HDL2 is characterized by symptoms including chorea, dystonia, rigidity, bradykinesia, and psychiatric symptoms such as dementia. Symptoms of HDL2 typically occur in middle age and can cause premature death by about 10 to 15 years.

HDL2는 정크토필린 3(JPH3) 유전자(16q24.3)의 3’ UTR에서의 확장된 CTG·CUG와 관련이 있다. 건강한 개체는 일반적으로 JPH3 유전자에서 6 내지 27개의 CTG·CUG 반복을 갖는다. HDL2 환자는 JPH3 유전자에서 40개가 넘는 CTG·CUG 반복을 가지며, 많게는 60개 이상의 CTG·CUG 반복을 갖기도 한다.HDL2 is associated with an expanded CTG·CUG in the 3' UTR of the junktophilin 3 (JPH3) gene (16q24.3). Healthy individuals typically have 6 to 27 CTG·CUG repeats in the JPH3 gene. HDL2 patients have more than 40 CTG·CUG repeats in the JPH3 gene, and sometimes have more than 60 CTG·CUG repeats.

푹스 각막내피 이상증(Fuchs' Endothelial Corneal Dystrophy)Fuchs' Endothelial Corneal Dystrophy

구현예에서, 푹스 각막내피 이상증(FECD)을 치료하기 위한 화합물, 조성물, 및 방법이 제공된다. FECD(MIM 136800)는 노화와 관련된 각막내피의 퇴행성 장애이다. FECD는 각막내피 세포의 점진적인 손실, 데스메막의 비후, 및 구테(guttae) 형태의 세포외 기질의 침착을 특징으로 한다. 내피 세포의 수가 매우 낮아지면, 각막이 팽윤하여 시력 상실을 야기한다(Elhalis 등의 문헌[Ocul Surf. 2010; 8(4):173-184]).In embodiments, compounds, compositions, and methods for treating Fuchs' corneal endothelial dystrophy (FECD) are provided. FECD (MIM 136800) is an age-related degenerative disorder of the corneal endothelium. FECD is characterized by progressive loss of corneal endothelial cells, thickening of Descemet's membrane, and deposition of extracellular matrix in the form of guttae. When the number of endothelial cells becomes very low, the cornea swells, causing vision loss (Elhalis et al., Ocul Surf. 2010; 8(4):173-184).

FECD는 유전적 이질성을 갖는 상염색체 우성 형질로서 유전될 수 있다. 콜라겐, VIII형, 알파 2 유전자(COL8A2, MIM 120252)에서의 희귀 이형접합 돌연변이는 각막내피 이상증을 조기 발병시킬 수 있다. 용질 담체 계열 4, 붕산나트륨 수송체, 구성원 11(SLC4A11, MIM 610206), 전사 인자 8(TCF8, MIM 189909), 리폭시게나아제 상동성 도메인 1(LOXHD1, MIM 613267), 및 ATP/GTP 결합 단백질-유사 1(AGBL1, MIM 615523)과 같은 다른 유전자는 다 합쳐도 성인 발병 FECD 사례의 작은 부분과 연관된다. 성인 발병 FECD의 게놈 전체 연관성 연구는 전사 인자 4(TCF4, MIM 602272)를 시사하였고, 보다 최근에는 KN 모티프- 및 안키린 반복 도메인-함유 단백질 4(KANK4, MIM 614612), 라미닌 감마-1(LAMC1, MIM150290), Na+/ K+ 수송 ATPase, 및 베타-1 폴리펩티드(ATP1B1, MIM 182330)를 시사하였는데, 언급된 TCF4 유전자좌는 FECD에 지배적인 영향을 미친다(Mootha 등의 문헌[Investigative ophthalmology &visual science, 2017; 58, 4579-4585]).FECD can be inherited as an autosomal dominant trait with genetic heterogeneity. Rare heterozygous mutations in the collagen, type VIII, alpha 2 gene (COL8A2, MIM 120252) can cause early onset corneal endothelial dystrophy. Solute carrier family 4, sodium borate transporter, member 11 (SLC4A11, MIM 610206), transcription factor 8 (TCF8, MIM 189909), lipoxygenase homology domain 1 (LOXHD1, MIM 613267), and ATP/GTP binding protein- Other genes, such as pseudo-1 (AGBL1, MIM 615523), are collectively associated with a small proportion of adult-onset FECD cases. Genome-wide association studies of adult-onset FECD have implicated transcription factor 4 (TCF4, MIM 602272) and, more recently, KN motif- and ankyrin repeat domain-containing protein 4 (KANK4, MIM 614612) and laminin gamma-1 (LAMC1). , MIM150290), Na + / K + transport ATPase, and beta-1 polypeptide (ATP1B1, MIM 182330), and the mentioned TCF4 locus has a dominant effect on FECD (Mootha et al. [Investigative ophthalmology & visual science, 2017;58, 4579-4585]).

TCF4의 인트론 2의 CTG18.1 유전자좌에서의 확장된 트리뉴클레오티드 반복은 FECD와 관련이 있다(Wieben 등의 문헌[PLoS One. 2012; 7(11):e49083]). 40개가 넘는 CTG·CUG 트리뉴클레오티드 반복의 확장된 CTG18.1 대립유전자의 각 카피는 FECD의 발생에 대한 상당한 위험을 초래한다(Mootha 등의 문헌[Invest Ophthalmol Vis Sci. 2014; 55: 33-42]). 간단한 반복 확장에 의해 야기된 신경퇴행성 장애에서 독성 기능 획득 RNA의 특징인 RNA 핵 병소가 보고되었다. 확장된 CUG 반복 RNA는 CTG18.1 삼중항 확장을 갖는 FECD 대상체의 각막내피에서 핵 병소로서 축적되는 반면, 삼중항 확장이 결여된 대조군 샘플에서는 존재하지 않는다(Mootha 등의 문헌[Invest Ophthalmol Vis Sci. 2015;56(3):2003-2011]). 확장된 CUG 반복 RNA는 분자 특징으로서의 mRNA-스플라이싱 인자인 머슬블라인드-유사 1(MBNL1)과 함께 내피의 핵 병소에 공동 국소화된다. CTG18.1 유전자좌에서의 삼중항 반복 확장은, 돌연변이체 CUG RNA 전사체가 MBNL1을 격리하는 것에 기인하는 비정상적인 유전자 스플라이싱을 통해 내피 기능장애를 매개할 수 있다(Du 등의 문헌[J Biol Chem. 2015; 290: 5979-5990]). 따라서, 2개의 구별되는 삼중항 반복은 RNA 병소 및 FECD 상에서 수렴되며, 병소가 FECD에 대한 인과적 역할을 할 가능성이 있다.Expanded trinucleotide repeats at the CTG18.1 locus in intron 2 of TCF4 are associated with FECD (Wieben et al., PLoS One. 2012; 7(11):e49083). Each copy of the CTG18.1 allele with an expansion of more than 40 CTG·CUG trinucleotide repeats carries a significant risk for the development of FECD (Mootha et al. [Invest Ophthalmol Vis Sci. 2014; 55: 33-42] ). RNA nuclear foci, a hallmark of toxic gain-of-function RNA, have been reported in neurodegenerative disorders caused by simple repeat expansions. Expanded CUG repeat RNA accumulates as nuclear foci in the corneal endothelium of FECD subjects with the CTG18.1 triplet expansion, whereas it is absent in control samples lacking the triplet expansion (Mootha et al., Invest Ophthalmol Vis Sci. 2015;56(3):2003-2011]). Expanded CUG repeat RNA colocalizes in nuclear foci of the endothelium with the mRNA-splicing factor muscleblind-like 1 (MBNL1) as a molecular signature. Triplet repeat expansion at the CTG18.1 locus may mediate endothelial dysfunction through aberrant gene splicing due to mutant CUG RNA transcripts sequestering MBNL1 (Du et al., J Biol Chem. 2015; 290: 5979-5990]). Therefore, two distinct triplet repeats converge on the RNA foci and FECD, with the foci likely playing a causal role for FECD.

구현예에서, 안티센스 올리고뉴클레오티드로 확장된 CUG 반복 RNA를 감소시키는, 푹스 내피각막 이영양증(FECD)의 치료에 유용한 화합물 및 방법은 WO2018165541A1, US10760076B2에 기술되어 있으며, 이들 각각은 모든 목적을 위해 그 전체가 참조로서 본원에 통합된다. 그러나, DM1을 치료하기 위해 CUG 반복을 표적화하는 이러한 포스포로디아미데이트 모르폴리노 올리고머(PMO) 또는 펩티드-접합된 PMO(PPMO), 예컨대 종래 기술에 기술된 것들은 질환에 걸린 조직인 표적 조직(예: 각막 내 내피층)에 올리고를 전달하는 데 있어서 한계를 가질 수 있다.In embodiments, compounds and methods useful for the treatment of Fuchs endothelial corneal dystrophy (FECD), which reduce expanded CUG repeat RNA with antisense oligonucleotides, are described in WO2018165541A1, US10760076B2, each of which is incorporated in its entirety for all purposes. Incorporated herein by reference. However, such phosphorodiamidate morpholino oligomers (PMOs) or peptide-conjugated PMOs (PPMOs) that target the CUG repeat to treat DM1, such as those described in the prior art, do not target the diseased tissue, e.g. : There may be limitations in delivering oligos to the endothelial layer within the cornea.

구현예에서, 본 개시는 본원에 (예를 들어 표 6에) 기술된 AC(예: PMO 또는 ASO)를 세포의 세포액에 전달하기 위한 다양한 세포 투과 펩티드(CPP) 또는 엔도솜 탈출 비히클(EEV)의 용도를 교지한다. 구현예에서, AC에 접합된 CPP 또는 EEV는 pre-mRNA 상의 표적 서열이 위치하는 세포 위치에 관심 AC를 전달한다.In embodiments, the present disclosure provides various cell penetrating peptides (CPP) or endosomal escape vehicles (EEV) for delivering ACs (e.g., PMOs or ASOs) described herein (e.g., in Table 6) to the cytosol of cells. Explain its use. In an embodiment, CPP or EEV conjugated to an AC delivers the AC of interest to the cellular location where the target sequence on the pre-mRNA is located.

구현예에서, 질환은 푹스 각막내피 이상증(FECD)이다. 구현예에서, 표적 유전자는 TCF4이며, 이는 면역글로불린 전사 인자 2(ITF-2)로도 알려진 전사 인자 4(TCF-4)를 암호화한다. 구현예에서, 본원에 제공된 화합물은 TCF4를 표적화하는 안티센스 올리고뉴클레오티드를 포함한다. TCF4를 표적화하는 데 사용될 수 있는 예시적인 올리고뉴클레오티드는 표 2표 11에 제공되어 있다.In an embodiment, the disease is Fuchs corneal endothelial dystrophy (FECD). In an embodiment, the target gene is TCF4 , which encodes transcription factor 4 (TCF-4), also known as immunoglobulin transcription factor 2 (ITF-2). In embodiments, compounds provided herein include antisense oligonucleotides that target TCF4 . Exemplary oligonucleotides that can be used to target TCF4 are provided in Table 2 and Table 11 .

TCF4의 확장된 삼중항 반복을 표적화하는 예시적인 올리고뉴클레오티드Exemplary Oligonucleotides Targeting the Expanded Triplet Repeat of TCF4 올리고 화학oligo chemistry 설계design 표적target 21량체 PMO21-mer PMO 5’-CAG CAG CAG CAG CAG CAG CAG -3’
(모든 PMO 단량체; 서열번호 146)
5'-CAG CAG CAG CAG CAG CAG CAG -3'
(All PMO monomers; SEQ ID NO: 146)
TCF4 (CUG)nTCF4(CUG)n
25량체 PMO25-mer PMO 5’-CAG CAG CAG CAG CAG CAG CAG CAG C-3’
(모든 PMO 단량체; 서열번호 147)
5'-CAG CAG CAG CAG CAG CAG CAG CAG C-3'
(All PMO monomers; SEQ ID NO: 147)
TCF4 (CUG)nTCF4(CUG)n
21량체 EEV-NLS-PMO21-mer EEV-NLS-PMO EEV-NLS_PMO_CAG 21량체
(서열번호 146으로부터의 접합)
EEV-NLS_PMO_CAG 21-mer
(Conjugation from SEQ ID NO: 146)
TCF4 (CUG)nTCF4(CUG)n
30량체 PMO30-mer PMO 5’-CAG CAG CAG CAG CAG CAG CAG CAG CAG CAG-3’
(모든 PMO 단량체; 서열번호 148)
5'-CAG CAG CAG CAG CAG CAG CAG CAG CAG CAG-3'
(All PMO monomers; SEQ ID NO: 148)
TCF4 (CUG)nTCF4(CUG)n
30량체 PMO30-mer PMO 5’-AGC AGC AGC AGC AGC AGC AGC AGC AGC AGC-3’
(모든 PMO 단량체; 서열번호 149)
5'-AGC AGC AGC AGC AGC AGC AGC AGC AGC AGC-3'
(All PMO monomers; SEQ ID NO: 149)
TCF4 (CUG)nTCF4(CUG)n
30량체 PMO30-mer PMO 5’-GCA GCA GCA GCA GCA GCA GCA GCA GCA GCA-3’
(모든 PMO 단량체; 서열번호 150)
5'-GCA GCA GCA GCA GCA GCA GCA GCA GCA GCA-3'
(All PMO monomers; SEQ ID NO: 150)
TCF4 (CUG)nTCF4(CUG)n

PMO: 포스포로디아미데이트 모르폴리노 올리고머Mootha 등은 DM1 및 FECD가 모두 동일한 질환은 아니지만 비코딩 CTG 확장으로부터 유래한다고 보고하였다(Mootha 등의 (2017) 문헌). DM1에서의 DMPK 확장은 수정체, 망막, 및 각막내피를 포함하여 눈의 다양한 조직에 연루된 다기관 질환을 초래한다. 대조적으로, TCF4 반복 확장은 다른 안구 조직 또는 신체 기관에 대한 임상적으로 명백한 후유증 없이 각막내피에 영향을 미치는 것으로 보인다. DMPK 및 TCF4에서의 돌연변이체 확장은 (i) 증식된 CUG 반복을 함유하는 핵 병소, (ii) 병소와 MBNL1 단백질의 결합, 및 (iii) FECD를 유발하는 능력과 같은 중요한 유사성을 공유한다. DMPK 및 TCF4 둘 다에서 삼중항 확장은 공유 분자 메커니즘을 통해 FECD의 동일한 각막내피 조직 표현형을 야기할 수 있는 것으로 시사된다.PMO: phosphorodiamidate morpholino oligomerMootha et al. reported that DM1 and FECD are not all the same disease but result from non-coding CTG expansions (Mootha et al. (2017)). DMPK expansion in DM1 results in a multisystem disease involving various tissues of the eye, including the lens, retina, and corneal endothelium. In contrast, TCF4 repeat expansions appear to affect the corneal endothelium without clinically apparent sequelae on other ocular tissues or body organs. Mutant expansions in DMPK and TCF4 share important similarities, including (i) nuclear foci containing proliferated CUG repeats, (ii) association of foci with the MBNL1 protein, and (iii) the ability to cause FECD. It is suggested that triplet expansions in both DMPK and TCF4 may cause the same corneal endothelial tissue phenotype of FECD through shared molecular mechanisms.

미국 특허 제10760076B2호, 국제 출원 공개 제WO2018165541A1호, 미국 특허 출원 공개 제2016/0355796호, 및 미국 특허 출원 공개 제2018/0344817호를 참조하되, 이들 각각은 본원에 참조로서 통합되고, 이들 문헌은 탠덤 뉴클레오티드 반복을 형성 및/또는 확장하기 쉬운 질환 및 상응하는 유전자를 개시한다.See US Patent No. 10760076B2, International Application Publication No. WO2018165541A1, US Patent Application Publication No. 2016/0355796, and US Patent Application Publication No. 2018/0344817, each of which is incorporated herein by reference; Disclosed are diseases and corresponding genes prone to forming and/or expanding tandem nucleotide repeats.

조성물 및 투여 방법 Compositions and Administration Methods

본 개시의 화합물은 생체 내 적용에 적합한 조성물로 제형화될 수 있다. 화합물 및/또는 조성물은 확장된 트리뉴클레오티드 반복과 연관된 질환을 갖거나 가진 것으로 의심되는 환자에게 투여될 수 있다.Compounds of the present disclosure can be formulated into compositions suitable for in vivo application. Compounds and/or compositions may be administered to patients who have or are suspected of having a disease associated with expanded trinucleotide repeats.

개시된 화합물 및 이를 함유하는 조성물의 생체 내 적용은 당업자에게 현재 알려져 있거나 향후 알려지게 될 임의의 적절한 방법 및 기술에 의해 달성될 수 있다. 예를 들어, 개시된 화합물은 생리학적으로 또는 약학적으로 허용 가능한 조성물로 제형화될 수 있고, 예를 들어 경구 및 비경구 투여 경로를 포함하여 당업계에 공지된 임의의 적절한 경로에 의해 투여될 수 있다. 본원에서 사용되는 바와 같이, 비경구라는 용어는 피하, 피내, 정맥내, 근육내, 복강내, 흉골내, 및 예컨대 주사에 의한 경막내 투여를 포함한다. 개시된 화합물 또는 조성물의 투여는 단일 투여, 연속 투여, 또는 당업자에 의해 쉽게 결정될 수 있는 뚜렷한 간격을 둔 투여일 수 있다. In vivo application of the disclosed compounds and compositions containing them can be accomplished by any suitable method and technique now known or hereinafter known to those skilled in the art. For example, the disclosed compounds can be formulated in physiologically or pharmaceutically acceptable compositions and administered by any suitable route known in the art, including, for example, oral and parenteral routes of administration. there is. As used herein, the term parenteral includes subcutaneous, intradermal, intravenous, intramuscular, intraperitoneal, intrasternal, and intrathecal administration, such as by injection. Administration of the disclosed compounds or compositions may be single administration, sequential administration, or administration at sharply spaced intervals as can be readily determined by those skilled in the art.

본원에 개시된 화합물 및 이를 포함하는 조성물은 리포좀 기술, 서방형 캡슐, 이식형 펌프, 및 생분해성 용기를 사용하여 투여될 수도 있다. 이들 전달 방법은 유리하게는 연장된 기간에 걸쳐 균일한 투여량을 제공할 수 있다. 화합물은 염 유도체 형태 또는 결정질 형태로 투여될 수도 있다.The compounds disclosed herein and compositions containing them may be administered using liposome technology, sustained-release capsules, implantable pumps, and biodegradable containers. These delivery methods can advantageously provide a uniform dosage over an extended period of time. The compounds may be administered in salt derivative form or in crystalline form.

본원에 개시된 화합물은 약학적으로 허용 가능한 조성물을 제조하기 위한 공지된 방법에 따라 약학적 조성물로 제형화될 수 있다. 제형은 당업자에게 잘 알려져 있고 쉽게 이용할 수 있는 다수의 문헌 출처에 상세히 기술되어 있다. 예를 들어, E.W. Martin에 의한 문헌[Remington’s Pharmaceutical Science (1995)]는 개시된 방법과 관련하여 사용될 수 있는 제형을 기술한다. 일반적으로, 본원에 개시된 화합물은 화합물의 효과적인 투여를 용이하게 하기 위해 화합물의 유효량이 적절한 담체와 조합되도록 제형화될 수 있다. 사용된 조성물도 다양한 형태일 수 있다. 여기에는, 예를 들어 정제, 알약, 분말, 액체 용액 또는 현탁액, 좌제, 주사식 및 불용성 용액, 및 스프레이와 같은 고상, 반고상, 및 액상 투여 형태를 포함한다. 상기 형태는 의도된 투여 방식 및 치료적 적용에 따라 달라진다. 조성물은 또한, 당업자에게 공지된 종래의 약학적으로 허용 가능한 담체 및 희석제를 포함한다. 화합물과 함께 사용하기 위한 담체 또는 희석제의 예는 에탄올, 디메틸 설폭시드, 글리세롤, 알루미나, 전분, 식염수, 및 동등한 담체 및 희석제를 포함한다. 원하는 치료적 치료를 위한 이러한 투여량의 투여를 제공하기 위해, 본원에 개시된 조성물은 유리하게는, 담체 또는 희석제를 포함하는 총 조성물의 중량을 기준으로 대상 화합물 중 하나 이상을 약 약 0.1 중량% 내지 100 중량%로 포함할 수 있다.The compounds disclosed herein can be formulated into pharmaceutical compositions according to known methods for preparing pharmaceutically acceptable compositions. Formulations are well known to those skilled in the art and are described in detail in a number of readily available literature sources. For example, EW Martin in Remington's Pharmaceutical Science (1995) describes formulations that can be used in connection with the disclosed methods. In general, the compounds disclosed herein can be formulated such that an effective amount of the compound is combined with an appropriate carrier to facilitate effective administration of the compound. The compositions used may also be in various forms. This includes solid, semisolid, and liquid dosage forms, such as tablets, pills, powders, liquid solutions or suspensions, suppositories, injectables and insoluble solutions, and sprays. The form depends on the intended mode of administration and therapeutic application. The composition also includes conventional pharmaceutically acceptable carriers and diluents known to those skilled in the art. Examples of carriers or diluents for use with the compounds include ethanol, dimethyl sulfoxide, glycerol, alumina, starch, saline, and equivalent carriers and diluents. To provide for administration of such dosages for the desired therapeutic treatment, the compositions disclosed herein advantageously contain from about 0.1% to about 0.1% by weight of one or more of the compounds of interest, based on the weight of the total composition including the carrier or diluent. It can be included at 100% by weight.

투여에 적합한 제형은, 예를 들어, 항산화제, 완충액, 박테리오스타트, 및 용질을 함유할 수 있고 의도된 수용자의 혈액과 제형을 등장화시키는 수성 멸균 주사 용액; 및 현탁제 및 증점제를 포함할 수 있는 수성 및 비수성 멸균 현탁액을 포함한다. 제형은 단위 투여량 용기 또는 다회 투여량 용기, 예를 들어 밀봉된 앰플 및 바이알로 제공될 수 있고, 사용 전에는 멸균 액체 담체, 예를 들어 주사용수의 조건만이 필요한 동결 건조(동결 건조) 상태로 보관될 수 있다. 즉석 주입 용액 및 현탁액은 멸균 분말, 과립, 정제 등으로 제조할 수 있다. 본원에 개시된 조성물은 위에서 특히 언급한 성분 외에도, 해당 제형의 유형과 관련하여 당업계에서 통상적인 다른 제제를 포함할 수 있다는 것을 이해해야 한다.Formulations suitable for administration include, for example, aqueous sterile injectable solutions that may contain antioxidants, buffers, bacteriostats, and solutes and that render the formulation isotonic with the blood of the intended recipient; and aqueous and non-aqueous sterile suspensions, which may contain suspending agents and thickening agents. Formulations may be presented in unit dose containers or in multi-dose containers, such as sealed ampoules and vials, and in a lyophilized (lyophilized) state requiring only the condition of a sterile liquid carrier, such as water for injection, prior to use. It can be stored. Extemporaneous injection solutions and suspensions can be prepared as sterile powders, granules, tablets, etc. It should be understood that, in addition to the ingredients specifically mentioned above, the compositions disclosed herein may include other agents conventional in the art with respect to the type of formulation in question.

본원에 개시된 화합물 및 이를 포함하는 조성물은 세포와의 직접 접촉을 통해 또는 담체 수단을 통해 세포에 전달될 수 있다. 화합물 및 조성물을 세포에 전달하기 위한 담체 수단은 당업계에 공지되어 있으며, 예를 들어, 조성물을 리포좀 모이어티에 캡슐화하는 것을 포함한다. 본원에 개시된 화합물 및 조성물을 세포에 전달하기 위한 다른 수단은 표적 세포에 전달하기 위해 표적화된 단백질 또는 핵산에 화합물을 부착하는 것을 포함한다. 미국 특허 제6,960,648호 및 미국 출원 공개 제20030032594호 및 제20020120100호에는 다른 조성물에 결합될 수 있고 조성물이 생물학적 막을 통과하여 전위될 수 있게 하는 아미노산 서열이 개시되어 있다. 미국 출원 공개 제20020035243호는 또한, 세포내 전달을 위해 세포막을 통과하여 생물학적 모이어티를 수송하기 위한 조성물을 기술한다. 화합물은 중합체에 혼입될 수도 있는데, 이의 예는 두개내 종양의 경우, 폴리(D-L 락티드-코-글리콜리드) 중합체; (GLIADEL에 사용된 바와 같은) 20:80 몰비의 폴리[비스(p-카르복시페녹시) 프로판:세바스산]; 콘드로이틴; 키틴; 및 키토산을 포함한다.The compounds disclosed herein and compositions comprising them can be delivered to cells through direct contact with the cells or via carrier means. Carrier means for delivering compounds and compositions to cells are known in the art and include, for example, encapsulating the compositions in liposomal moieties. Other means for delivering compounds and compositions disclosed herein to cells include attaching the compound to a targeted protein or nucleic acid for delivery to the target cell. U.S. Patent No. 6,960,648 and U.S. Application Publication Nos. 20030032594 and 20020120100 disclose amino acid sequences that can bind to other compositions and allow the compositions to translocate across biological membranes. US Published Application No. 20020035243 also describes compositions for transporting biological moieties across cell membranes for intracellular delivery. The compounds may also be incorporated into polymers, examples of which include, for intracranial tumors, poly(D-L lactide-co-glycolide) polymer; poly[bis(p-carboxyphenoxy)propane:sebacic acid] in a 20:80 molar ratio (as used in GLIADEL); Chondroitin; chitin; and chitosan.

약학적으로 허용 가능한 염 또는 이의 프로드러그를 포함하여, 본원에 개시된 화합물 및 조성물은 주입 또는 주사에 의해 정맥내, 근육내, 또는 복강내 투여될 수 있다. 활성제 또는 이의 염의 용액은 물에서 제조될 수 있고, 임의로 비독성 계면활성제와 혼합될 수 있다. 분산제 또한 글리세롤, 액체 폴리에틸렌 글리콜, 트리아세틴, 및 이들의 혼합물 및 오일에서 제조될 수 있다. 통상적인 보관 및 사용 조건 하에서, 이들 제제는 미생물의 성장을 방지하기 위한 보존제를 함유할 수 있다.The compounds and compositions disclosed herein, including pharmaceutically acceptable salts or prodrugs thereof, can be administered intravenously, intramuscularly, or intraperitoneally by infusion or injection. Solutions of the active agent or salt thereof may be prepared in water and optionally mixed with a non-toxic surfactant. Dispersants can also be prepared from glycerol, liquid polyethylene glycol, triacetin, and mixtures thereof, and oils. Under normal conditions of storage and use, these preparations may contain preservatives to prevent microbial growth.

주사 또는 주입에 적합한 약학적 투여 형태는 활성 성분을 포함하는 멸균 수용액 또는 분산액 또는 멸균 분말을 포함할 수 있으며, 이는 임의로 리포솜에 캡슐화된 멸균 주사식 또는 주입식 용액 또는 분산액의 즉석 제조에 적합하다. 궁극적인 투여 형태는 제조 및 보관 조건 하에서 멸균 상태이고, 유동적이고, 안정해야 한다. 액체 담체 또는 비히클은, 예를 들어 물, 에탄올, 폴리올(예를 들어 글리세롤, 프로필렌 글리콜, 액체 폴리에틸렌 글리콜 등), 식물성 오일, 비독성 글리세릴 에스테르, 및 이들의 적절한 혼합물을 포함하는 용매 또는 액체 분산 매질일 수 있다. 적절한 유동성은, 예를 들어 리포솜을 형성함으로써, 분산액의 경우 요구되는 입자 크기를 유지함으로써, 또는 계면활성제를 사용함으로써 유지될 수 있다. 임의로, 미생물의 작용을 방지하는 것은 다양한 다른 항균제 및 항진균제, 예를 들어 파라벤, 클로로부탄올, 페놀, 소르브산, 티메로살 등에 의해 이루어질 수 있다. 많은 경우에, 등장화제, 예를 들어 당, 완충액, 또는 염화나트륨이 포함될 수 있다. 주사식 조성물의 장기간 흡수는 흡수를 지연시키는 제제, 예를 들어 알루미늄 모노스테아레이트 및 젤라틴을 포함시킴으로써 이루어질 수 있다.Pharmaceutical dosage forms suitable for injection or infusion may include sterile aqueous solutions or dispersions or sterile powders containing the active ingredient, which are suitable for the extemporaneous preparation of sterile injectable or infusible solutions or dispersions, optionally encapsulated in liposomes. The ultimate dosage form must be sterile, fluid, and stable under the conditions of manufacture and storage. Liquid carriers or vehicles may be solvents or liquid dispersions including, for example, water, ethanol, polyols (e.g., glycerol, propylene glycol, liquid polyethylene glycol, etc.), vegetable oils, non-toxic glyceryl esters, and suitable mixtures thereof. It could be a beating. Adequate fluidity can be maintained, for example, by forming liposomes, by maintaining the required particle size in the case of dispersions, or by using surfactants. Optionally, prevention of the action of microorganisms can be achieved by various other antibacterial and antifungal agents, such as parabens, chlorobutanol, phenol, sorbic acid, thimerosal, etc. In many cases, isotonic agents may be included, such as sugars, buffers, or sodium chloride. Prolonged absorption of the injectable composition can be achieved by including agents that delay absorption, such as aluminum monostearate and gelatin.

멸균 주사 용액은, 본원에 개시된 화합물 및/또는 제제를 필요한 양으로, 필요에 따라 상기 열거된 다양한 다른 성분과 함께 적절한 용매에 혼입한 다음, 필터 멸균함으로써 제조된다. 멸균 주사 용액의 제조를 위한 멸균 분말의 경우, 제조 방법은 진공 건조 및 동결 건조 기술을 포함하는데, 이를 통해 활성 성분의 분말 + 이전에 멸균 여과된 용액에 존재하는 임의의 추가의 원하는 성분을 생산한다.Sterile injectable solutions are prepared by incorporating the compounds and/or agents disclosed herein in the required amount in an appropriate solvent with various other ingredients enumerated above, as required, followed by filter sterilization. In the case of sterile powders for the preparation of sterile injectable solutions, manufacturing methods include vacuum drying and freeze-drying techniques, which produce a powder of the active ingredient plus any additional desired ingredient present in a previously sterile-filtered solution. .

본원에 개시된 화합물 및 제제 및 약학적 조성물의 유용한 투여량은 동물 모델에서 이들의 시험관 내 활성 및 생체 내 활성을 비교함으로써 결정될 수 있다. 마우스 및 다른 동물에서의 유효 투여량을 인간에게 외삽하는 방법은 당업계에 공지되어 있다.Useful dosages of the compounds and agents and pharmaceutical compositions disclosed herein can be determined by comparing their in vitro and in vivo activities in animal models. Methods for extrapolating effective doses in mice and other animals to humans are known in the art.

조성물의 투여를 위한 투여량 범위는 증상 또는 장애에 영향을 미치는 원하는 효과를 생성하기에 충분히 큰 범위이다. 투여량은 원치 않는 교차 반응, 아나필락시스 반응 등과 같은 부작용을 야기할 정도로는 크지 않아야 한다. 일반적으로, 투여량은 환자의 연령, 병태, 성별, 및 질환의 정도에 따라 달라질 것이고, 당업자에 의해 결정될 수 있다. 임의의 금기증(counterindications)이 나타나는 경우 개별 의사가 투여량을 조정할 수 있다. 투여량은 다양할 수 있고, 1일 또는 수일 동안 매일 1회 이상의 투여량으로 투여될 수 있다.The dosage range for administration of the composition is a sufficiently large range to produce the desired effect affecting the symptom or disorder. The dosage should not be large enough to cause side effects such as unwanted cross-reactions, anaphylactic reactions, etc. In general, the dosage will vary depending on the patient's age, condition, sex, and extent of the disease, and can be determined by one skilled in the art. If any contraindications appear, the individual physician may adjust the dosage. Dosages may vary and may be administered in one or more doses per day for one or several days.

또한, 본원에 개시된 화합물을 약학적으로 허용 가능한 담체와 함께 포함하는 약학적 조성물이 개시된다. 경구, 국소, 또는 비경구 투여에 적합하고, 일정량의 화합물을 포함하는 약학적 조성물이 본원에 개시된다. 환자(특히 인간)에게 투여되는 투여량은 치사량의 독성 없이, 합리적인 기간 동안 환자에서 치료 반응을 달성하기에 충분해야 하며, 허용 가능한 수준의 부작용 또는 사망을 야기하지 않아야 한다. 당업자는 투여량이 대상체의 상태(건강), 대상체의 체중, 동시 치료가 존재하는 경우 이의 종류, 치료 빈도, 치료율뿐만 아니라 병리학적 병태의 중증도 및 병기를 포함하는 다양한 인자에 따라 달라지게 된다는 것을 인식할 것이다.Also disclosed are pharmaceutical compositions comprising the compounds disclosed herein together with a pharmaceutically acceptable carrier. Disclosed herein are pharmaceutical compositions suitable for oral, topical, or parenteral administration and comprising an amount of a compound. The dosage administered to a patient (particularly a human) should be sufficient to achieve a therapeutic response in the patient for a reasonable period of time, without lethal toxicity, and should not cause an acceptable level of side effects or death. Those skilled in the art will recognize that the dosage will depend on a variety of factors, including the condition (health) of the subject, the subject's weight, the type of concurrent treatment, if present, the frequency of treatment, the cure rate, as well as the severity and stage of the pathological condition. will be.

또한, 본원에 개시된 화합물 및/또는 이를 함유하는 약학적 조성물을 하나 이상의 용기에 포함하는 키트가 개시된다. 개시된 키트는 약학적으로 허용 가능한 담체 및/또는 희석제를 임의로 포함할 수 있다. 일 구현예에서, 키트는 본원에 기술된 것과 같은 하나 이상의 다른 성분, 부수물, 또는 보조제를 포함한다. 일 구현예에서, 키트는 키트의 화합물 또는 조성물을 투여하는 방법이 설명된 지침 또는 포장물을 포함한다. 키트의 용기는 임의의 적합한 재료, 예를 들어 유리, 플라스틱, 금속 등을 가질 수 있고, 임의의 적합한 크기, 형상, 또는 구성을 가질 수 있다. 일 구현예에서, 본원에 개시된 화합물 및/또는 제제는 정제, 알약, 또는 분말 형태와 같은 고형분으로서 키트에 제공된다. 또 다른 구현예에서, 본원에 개시된 화합물 및/또는 제제는 액체 또는 용액으로서 키트에 제공된다. 일 구현예에서, 키트는 본원에 개시된 화합물 및/또는 제제가 액체 또는 용액 형태로 담긴 앰플 또는 주사기를 포함한다.Also disclosed are kits comprising a compound disclosed herein and/or a pharmaceutical composition containing the same in one or more containers. The disclosed kit may optionally include a pharmaceutically acceptable carrier and/or diluent. In one embodiment, the kit includes one or more other ingredients, concomitants, or adjuvants as described herein. In one embodiment, the kit includes instructions or packaging that describe how to administer the compound or composition of the kit. The container of the kit may be of any suitable material, such as glass, plastic, metal, etc., and may be of any suitable size, shape, or configuration. In one embodiment, the compounds and/or agents disclosed herein are provided in a kit as a solid form, such as in tablet, pill, or powder form. In another embodiment, the compounds and/or agents disclosed herein are provided in a kit as a liquid or solution. In one embodiment, the kit includes an ampoule or syringe containing a compound and/or agent disclosed herein in liquid or solution form.

구현예에서, 본 개시의 화합물 및/또는 조성물은 뉴클레오티드 반복 확장과 연관된 질환으로 진단된 환자에게 투여되는 약 0.1 mg/kg 내지 약 1000 mg/kg의 투여량으로, 예를 들어 약 0.1 mg/kg, 약 0.2 mg/kg, 약 0.3 mg/kg, 약 0.4 mg/kg, 약 0.5 mg/kg, 약 0.6 mg/kg, 약 0.7 mg/kg, 약 0.8 mg/kg, 약 0.9 mg/kg, 약 1 mg/kg, 약 2 mg/kg, 약 3 mg/kg, 약 4 mg/kg, 약 5 mg/kg, 약 6 mg/kg, 약 7 mg/kg, 약 8 mg/kg, 약 9 mg/kg, 약 10 mg/kg, 약 11 mg/kg, 약 12 mg/kg, 약 13 mg/kg, 약 14 mg/kg, 약 15 mg/kg, 약 16 mg/kg, 약 17 mg/kg, 약 18 mg/kg, 약 19 mg/kg, 약 20 mg/kg, 약 21 mg/kg, 약 22 mg/kg, 약 23 mg/kg, 약 24 mg/kg, 약 25 mg/kg, 약 26 mg/kg, 약 27 mg/kg, 약 28 mg/kg, 약 29 mg/kg, 약 30 mg/kg, 약 31 mg/kg, 약 32 mg/kg, 약 33 mg/kg, 약 34 mg/kg, 약 35 mg/kg, 약 36 mg/kg, 약 37 mg/kg, 약 38 mg/kg, 약 39 mg/kg, 약 40 mg/kg, 약 41 mg/kg, 약 42 mg/kg, 약 43 mg/kg, 약 44 mg/kg, 약 45 mg/kg, 약 46 mg/kg, 약 47 mg/kg, 약 48 mg/kg, 약 49 mg/kg, 약 50 mg/kg, 약 51 mg/kg, 약 52 mg/kg, 약 53 mg/kg, 약 54 mg/kg, 약 55 mg/kg, 약 56 mg/kg, 약 57 mg/kg, 약 58 mg/kg, 약 59 mg/kg, 약 60 mg/kg, 약 61 mg/kg, 약 62 mg/kg, 약 63 mg/kg, 약 64 mg/kg, 약 65 mg/kg, 약 66 mg/kg, 약 67 mg/kg, 약 68 mg/kg, 약 69 mg/kg, 약 70 mg/kg, 약 71 mg/kg, 약 72 mg/kg, 약 73 mg/kg, 약 74 mg/kg, 약 75 mg/kg, 약 76 mg/kg, 약 77 mg/kg, 약 78 mg/kg, 약 79 mg/kg, 약 80 mg/kg, 약 81 mg/kg, 약 82 mg/kg, 약 83 mg/kg, 약 84 mg/kg, 약 85 mg/kg, 약 86 mg/kg, 약 87 mg/kg, 약 88 mg/kg, 약 89 mg/kg, 약 90 mg/kg, 약 91 mg/kg, 약 92 mg/kg, 약 93 mg/kg, 약 94 mg/kg, 약 95 mg/kg, 약 96 mg/kg, 약 97 mg/kg, 약 98 mg/kg, 약 99 mg/kg, 약 100 mg/kg, 약 110 mg/kg, 약 120 mg/kg, 약 130 mg/kg, 약 140 mg/kg, 약 150 mg/kg, 약 160 mg/kg, 약 170 mg/kg, 약 180 mg/kg, 약 190 mg/kg, 약 200 mg/kg, 약 210 mg/kg, 약 220 mg/kg, 약 230 mg/kg, 약 240 mg/kg, 약 250 mg/kg, 약 260 mg/kg, 약 270 mg/kg, 약 280 mg/kg, 약 290 mg/kg, 약 300 mg/kg, 약 310 mg/kg, 약 320 mg/kg, 약 330 mg/kg, 약 340 mg/kg, 약 350 mg/kg, 약 360 mg/kg, 약 370 mg/kg, 약 380 mg/kg, 약 390 mg/kg, 약 400 mg/kg, 약 410 mg/kg, 약 420 mg/kg, 약 430 mg/kg, 약 440 mg/kg, 약 450 mg/kg, 약 460 mg/kg, 약 470 mg/kg, 약 480 mg/kg, 약 490 mg/kg, 약 500 mg/kg, 약 510 mg/kg, 약 520 mg/kg, 약 530 mg/kg, 약 540 mg/kg, 약 550 mg/kg, 약 560 mg/kg, 약 570 mg/kg, 약 580 mg/kg, 약 590 mg/kg, 약 600 mg/kg, 약 610 mg/kg, 약 620 mg/kg, 약 630 mg/kg, 약 640 mg/kg, 약 650 mg/kg, 약 660 mg/kg, 약 670 mg/kg, 약 680 mg/kg, 약 690 mg/kg, 약 700 mg/kg, 약 710 mg/kg, 약 720 mg/kg, 약 730 mg/kg, 약 740 mg/kg, 약 750 mg/kg, 약 760 mg/kg, 약 770 mg/kg, 약 780 mg/kg, 약 790 mg/kg, 약 800 mg/kg, 약 810 mg/kg, 약 820 mg/kg, 약 830 mg/kg, 약 840 mg/kg, 약 850 mg/kg, 약 860 mg/kg, 약 870 mg/kg, 약 880 mg/kg, 약 890 mg/kg, 약 900 mg/kg, 약 910 mg/kg, 약 920 mg/kg, 약 930 mg/kg, 약 940 mg/kg, 약 950 mg/kg, 약 960 mg/kg, 약 970 mg/kg, 약 980 mg/kg, 약 990 mg/kg, 또는 1000 mg/kg(이들 사이의 모든 값 및 범위를 포함함)의 투여량으로 투여된다.In embodiments, the compounds and/or compositions of the present disclosure are administered to patients diagnosed with a disease associated with nucleotide repeat expansions at a dosage of about 0.1 mg/kg to about 1000 mg/kg, for example about 0.1 mg/kg. , about 0.2 mg/kg, about 0.3 mg/kg, about 0.4 mg/kg, about 0.5 mg/kg, about 0.6 mg/kg, about 0.7 mg/kg, about 0.8 mg/kg, about 0.9 mg/kg, about 1 mg/kg, about 2 mg/kg, about 3 mg/kg, about 4 mg/kg, about 5 mg/kg, about 6 mg/kg, about 7 mg/kg, about 8 mg/kg, about 9 mg /kg, about 10 mg/kg, about 11 mg/kg, about 12 mg/kg, about 13 mg/kg, about 14 mg/kg, about 15 mg/kg, about 16 mg/kg, about 17 mg/kg , about 18 mg/kg, about 19 mg/kg, about 20 mg/kg, about 21 mg/kg, about 22 mg/kg, about 23 mg/kg, about 24 mg/kg, about 25 mg/kg, about 26 mg/kg, about 27 mg/kg, about 28 mg/kg, about 29 mg/kg, about 30 mg/kg, about 31 mg/kg, about 32 mg/kg, about 33 mg/kg, about 34 mg /kg, about 35 mg/kg, about 36 mg/kg, about 37 mg/kg, about 38 mg/kg, about 39 mg/kg, about 40 mg/kg, about 41 mg/kg, about 42 mg/kg , about 43 mg/kg, about 44 mg/kg, about 45 mg/kg, about 46 mg/kg, about 47 mg/kg, about 48 mg/kg, about 49 mg/kg, about 50 mg/kg, about 51 mg/kg, about 52 mg/kg, about 53 mg/kg, about 54 mg/kg, about 55 mg/kg, about 56 mg/kg, about 57 mg/kg, about 58 mg/kg, about 59 mg /kg, about 60 mg/kg, about 61 mg/kg, about 62 mg/kg, about 63 mg/kg, about 64 mg/kg, about 65 mg/kg, about 66 mg/kg, about 67 mg/kg , about 68 mg/kg, about 69 mg/kg, about 70 mg/kg, about 71 mg/kg, about 72 mg/kg, about 73 mg/kg, about 74 mg/kg, about 75 mg/kg, about 76 mg/kg, about 77 mg/kg, about 78 mg/kg, about 79 mg/kg, about 80 mg/kg, about 81 mg/kg, about 82 mg/kg, about 83 mg/kg, about 84 mg /kg, about 85 mg/kg, about 86 mg/kg, about 87 mg/kg, about 88 mg/kg, about 89 mg/kg, about 90 mg/kg, about 91 mg/kg, about 92 mg/kg , about 93 mg/kg, about 94 mg/kg, about 95 mg/kg, about 96 mg/kg, about 97 mg/kg, about 98 mg/kg, about 99 mg/kg, about 100 mg/kg, about 110 mg/kg, about 120 mg/kg, about 130 mg/kg, about 140 mg/kg, about 150 mg/kg, about 160 mg/kg, about 170 mg/kg, about 180 mg/kg, about 190 mg /kg, about 200 mg/kg, about 210 mg/kg, about 220 mg/kg, about 230 mg/kg, about 240 mg/kg, about 250 mg/kg, about 260 mg/kg, about 270 mg/kg , about 280 mg/kg, about 290 mg/kg, about 300 mg/kg, about 310 mg/kg, about 320 mg/kg, about 330 mg/kg, about 340 mg/kg, about 350 mg/kg, about 360 mg/kg, about 370 mg/kg, about 380 mg/kg, about 390 mg/kg, about 400 mg/kg, about 410 mg/kg, about 420 mg/kg, about 430 mg/kg, about 440 mg /kg, about 450 mg/kg, about 460 mg/kg, about 470 mg/kg, about 480 mg/kg, about 490 mg/kg, about 500 mg/kg, about 510 mg/kg, about 520 mg/kg , about 530 mg/kg, about 540 mg/kg, about 550 mg/kg, about 560 mg/kg, about 570 mg/kg, about 580 mg/kg, about 590 mg/kg, about 600 mg/kg, about 610 mg/kg, about 620 mg/kg, about 630 mg/kg, about 640 mg/kg, about 650 mg/kg, about 660 mg/kg, about 670 mg/kg, about 680 mg/kg, about 690 mg /kg, about 700 mg/kg, about 710 mg/kg, about 720 mg/kg, about 730 mg/kg, about 740 mg/kg, about 750 mg/kg, about 760 mg/kg, about 770 mg/kg , about 780 mg/kg, about 790 mg/kg, about 800 mg/kg, about 810 mg/kg, about 820 mg/kg, about 830 mg/kg, about 840 mg/kg, about 850 mg/kg, about 860 mg/kg, about 870 mg/kg, about 880 mg/kg, about 890 mg/kg, about 900 mg/kg, about 910 mg/kg, about 920 mg/kg, about 930 mg/kg, about 940 mg /kg, about 950 mg/kg, about 960 mg/kg, about 970 mg/kg, about 980 mg/kg, about 990 mg/kg, or 1000 mg/kg, including all values and ranges therebetween. It is administered in a dosage of

치료 방법Treatment method

본 개시는 질환의 치료를 필요로 하는 대상체에서 이를 치료하는 방법을 제공하며, 상기 방법은 본원에 개시된 화합물 및/또는 화합물을 함유하는 조성물을 투여하는 단계를 포함한다. 구현예에서, 질환은 본 개시에 제공된 질환 중 어느 하나이다. 구현예에서, 표적 유전자 또는 유전자 전사체는 본 개시에 제공된 표적 유전자 또는 유전자 전사체 중 어느 하나이다.The present disclosure provides a method of treating a disease in a subject in need thereof, the method comprising administering a compound and/or a composition containing the compound disclosed herein. In embodiments, the disease is any of the diseases provided in this disclosure. In an embodiment, the target gene or gene transcript is any of the target genes or gene transcripts provided in this disclosure.

구현예에서, 환자는 본원에 기술된 바와 같은 임의의 질환을 갖고 있거나 가질 위험이 있는 것으로서 식별된다. 구현예에서, 유전자/전사체의 3’ 미번역 영역에서 CTG·CUG 반복과 연관된 질환을 치료하기 위한 방법이 제공된다. 구현예에서, 근긴장성 이영양증을 치료하기 위한 방법이 제공된다. 구현예에서, 1형 근긴장성 이영양증(DM1)을 치료하기 위한 방법이 제공된다. 구현예에서, SCA8을 치료하기 위한 방법이 제공된다. 구현예에서, HDL2를 치료하기 위한 방법이 제공된다. 구현예에서, FECD를 치료하기 위한 방법이 제공된다.In embodiments, the patient is identified as having or at risk of having any of the conditions described herein. In embodiments, methods are provided for treating diseases associated with CTG·CUG repeats in the 3' untranslated region of a gene/transcript. In embodiments, methods for treating myotonic dystrophy are provided. In embodiments, methods for treating myotonic dystrophy type 1 (DM1) are provided. In embodiments, methods for treating SCA8 are provided. In embodiments, methods for treating HDL2 are provided. In embodiments, methods for treating FECD are provided.

구현예에서, 치료는 대상체에서 하나 이상의 증상의 부분적 또는 완전한 경감, 개선, 완화, 억제, 발생 지연, 하나 이상의 증상의 중증도 및/또는 발생을 감소시키는 것을 지칭한다.In embodiments, treatment refers to partial or complete relief, amelioration, alleviation, inhibition, delaying the onset, reducing the severity and/or occurrence of one or more symptoms in a subject.

질환 및/또는 질환의 증상의 치료는 본원에 기술된 것들과 같은 다양한 분자 메커니즘을 통해 이루어질 수 있다.Treatment of the disease and/or symptoms of the disease can be achieved through a variety of molecular mechanisms, such as those described herein.

구현예에서, 표적 유전자의 발현 및/또는 활성의 변경을 필요로 하는 대상체에서 이를 변경하기 위한 방법이 제공되며, 상기 방법은 본원에 개시된 화합물을 투여하는 단계를 포함한다. 구현예에서, 치료는 표적 전사체로부터 표적 단백질의 발현을 감소시킨다. 구현예에서, 치료는 표적 전사체의 수준을 낮춘다. 구현예에서, 치료는 표적 전사체 및/또는 표적 전사체에 결합하는 단백질에 의해 조절되는 하류 유전자 전사체의 스플라이싱을 조절한다. 구현예에서, 하류 유전자 전사체의 스플라이싱의 조절은 건강한 표현형과 연관된 하류 전사체 및/또는 하류 단백질 이소형을 증가시킨다. 구현예에서, 대안적인 스플라이싱은 질환 표현형과 연관된 하류 전사체 및/또는 하류 단백질 이소형을 감소시킨다.In embodiments, methods are provided for altering the expression and/or activity of a target gene in a subject in need thereof, comprising administering a compound disclosed herein. In embodiments, the treatment reduces expression of the target protein from the target transcript. In embodiments, the treatment lowers the level of the target transcript. In an embodiment, the treatment modulates splicing of the target transcript and/or a downstream gene transcript that is regulated by a protein that binds the target transcript. In embodiments, modulation of splicing of a downstream gene transcript increases the downstream transcript and/or downstream protein isoform associated with a healthy phenotype. In embodiments, alternative splicing reduces downstream transcripts and/or downstream protein isoforms associated with the disease phenotype.

구현예에서, 적어도 하나의 확장된 CUG 반복을 포함하는 pre-mRNA에 대한 적어도 하나의 RNA 결합 단백질의 격리를 감소시킴으로써 DM1을 치료하기 위한 방법이 제공된다. 구현예에서, 적어도 하나의 확장된 CUG 반복을 포함하는 pre-mRNA의 축적을 감소시킴으로써 DM1을 치료하기 위한 방법이 제공된다. 구현예에서, 하류 유전자 전사체의 스플라이싱 결함을 교정함으로써 DM1을 치료하기 위한 방법이 제공된다.In embodiments, methods are provided for treating DM1 by reducing sequestration of at least one RNA binding protein to pre-mRNA comprising at least one expanded CUG repeat. In embodiments, methods are provided for treating DM1 by reducing accumulation of pre-mRNA comprising at least one expanded CUG repeat. In embodiments, methods are provided for treating DM1 by correcting splicing defects in downstream gene transcripts.

구현예에서, 본 개시에 따른 치료는 치료 이전 대상체에서의 단백질 평균 수준과 비교했을 때, 또는 유사한 질환을 가진 하나 이상의 대조군 개체에서 치료하지 않았을 때의 평균 단백질 수준과 비교했을 때, 또는 본원에 개시된 환형 CPP에 접합되지 않은 AC로 치료한 경우와 비교했을 때, 표적 전사체의 수준 및/또는 표적 전사체(예를 들어, DMPK, TCF4, JPH3, ATXN8OS 및/또는 ATXN8) 유전자의 발현을 약 5% 초과, 약 10%, 약 15%, 약 20%, 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95%, 및 약 100%만큼 감소시킨다. 구현예에서, 본 개시에 따른 치료는 치료 이전 대상체에서의 전사체 및/또는 단백질의 평균 수준과 비교했을 때, 또는 유사한 질환을 가진 하나 이상의 대조군 개체에서 치료하지 않았을 때의 전사체 및/또는 단백질의 평균 수준과 비교했을 때, 또는 본원에 개시된 환형 CPP에 접합되지 않은 AC로 치료한 경우와 비교했을 때, 표적 전사체(예: DMPK, TCF4, JPH3, ATXN8OS, 및/또는 ATXN8)의 수준 및/또는 표적 전사체의 발현을 약 5% 내지 약 100%, 약 10% 내지 약 100%, 약 20% 내지 약 100%, 약 50% 내지 약 100%, 약 70% 내지 약 100%, 약 80% 내지 약 100%, 약 90% 내지 약 100%, 약 95% 내지 약 100%, 약 40% 내지 약 95%, 약 50% 내지 약 95%, 약 70% 내지 약 95%, 또는 약 90% 내지 약 95%만큼 감소시킨다. In embodiments, treatment according to the present disclosure is performed when compared to the average protein level in the subject prior to treatment, or compared to the average protein level without treatment in one or more control subjects with similar disease, or Compared to treatment with AC not conjugated to circular CPP, the level of target transcripts and/or the expression of target transcript (e.g., DMPK, TCF4, JPH3, ATXN8OS, and/or ATXN8) genes was reduced by approximately 5%. % greater than about 10%, about 15%, about 20%, about 25%, about 30%, about 35%, about 40%, about 45%, about 50%, about 55%, about 60%, about 65% , about 70%, about 75%, about 80%, about 85%, about 90%, about 95%, and about 100%. In embodiments, treatment according to the present disclosure is effective when compared to the average level of the transcripts and/or proteins in the subject prior to treatment, or when not treated in one or more control subjects with similar disease. The level of target transcripts (e.g., DMPK, TCF4, JPH3, ATXN8OS, and/or ATXN8) when compared to the average level of, or compared to treatment with AC not conjugated to the cyclic CPP disclosed herein, and /or increase the expression of the target transcript from about 5% to about 100%, about 10% to about 100%, about 20% to about 100%, about 50% to about 100%, about 70% to about 100%, about 80% % to about 100%, about 90% to about 100%, about 95% to about 100%, about 40% to about 95%, about 50% to about 95%, about 70% to about 95%, or about 90% Reduces by about 95%.

구현예에서, 본 개시에 따른 치료는 치료 이전 대상체에서의 평균 병소 수준과 비교했을 때, 또는 유사한 질환을 가진 하나 이상의 대조군 개체에서 치료하지 않았을 때의 평균 병소 수준과 비교했을 때, 또는 본원에 개시된 환형 CPP에 접합되지 않은 AC로 치료한 경우와 비교했을 때, 표적 유전자(예: DMPK, TCF4, JPH3, ATXN8OS 및/또는 ATXN8)의 CUG 반복 RNA 핵 병소의 수를 약 5% 초과만큼, 예를 들어 약 5%, 약 10%, 약 15%, 약 20%, 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95%, 및 약 100%만큼 감소시킨다. 구현예에서, 본 개시에 따른 치료는 치료 이전 대상체에서의 평균 병소 수준과 비교했을 때, 또는 유사한 질환을 가진 하나 이상의 대조군 개체에서 치료하지 않았을 때의 평균 병소 수준과 비교했을 때, 또는 본원에 개시된 환형 CPP에 접합되지 않은 AC로 치료한 경우와 비교했을 때, 표적 유전자(예: DMPK, TCF4, JPH3, ATXN8OS, 및/또는 ATXN8)의 CUG 반복 RNA 핵 병소의 소를 약 5% 내지 약 100%, 약 10% 내지 약 100%, 약 20% 내지 약 100%, 약 50% 내지 약 100%, 약 70% 내지 약 100%, 약 80% 내지 약 100%, 약 90% 내지 약 100%, 약 95% 내지 약 100%, 약 40% 내지 약 95%, 약 50% 내지 약 95%, 약 70% 내지 약 95%, 또는 약 90% 내지 약 95%만큼 감소시킨다.In embodiments, treatment according to the present disclosure is compared to the average lesion level in the subject prior to treatment, or compared to the average lesion level without treatment in one or more control subjects with similar disease, or Compared to treatment with AC not conjugated to circular CPP, the number of CUG repeat RNA nuclear foci of target genes (e.g. DMPK, TCF4, JPH3, ATXN8OS and/or ATXN8) was increased by approximately 5%, e.g. For about 5%, about 10%, about 15%, about 20%, about 25%, about 30%, about 35%, about 40%, about 45%, about 50%, about 55%, about 60%, about Reduce by 65%, about 70%, about 75%, about 80%, about 85%, about 90%, about 95%, and about 100%. In embodiments, treatment according to the present disclosure is compared to the average lesion level in the subject prior to treatment, or compared to the average lesion level without treatment in one or more control subjects with similar disease, or Compared to treatment with AC not conjugated to circular CPP, the reduction of CUG repeat RNA nuclear foci in target genes (e.g., DMPK, TCF4, JPH3, ATXN8OS, and/or ATXN8) was reduced by approximately 5% to approximately 100%. , about 10% to about 100%, about 20% to about 100%, about 50% to about 100%, about 70% to about 100%, about 80% to about 100%, about 90% to about 100%, about Reduce by 95% to about 100%, about 40% to about 95%, about 50% to about 95%, about 70% to about 95%, or about 90% to about 95%.

구현예에서, 본 개시에 따른 치료는 치료 이전 대상체에서의 단백질 평균 수준과 비교했을 때, 또는 유사한 질환을 가진 하나 이상의 대조군 개체에서 치료하지 않았을 때의 평균 단백질 수준과 비교했을 때, 또는 본원에 개시된 환형 CPP에 접합되지 않은 AC로 치료한 경우와 비교했을 때, 질환 표현형과 연관된 하류 전사체의 수준 및/또는 하류 유전자 산물의 발현을 약 5% 초과만큼, 예를 들어 약 5%, 약 10%, 약 15%, 약 20%, 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95%, 및 약 100%만큼 감소시킨다. 구현예에서, 본 개시에 따른 치료는 치료 이전 대상체에서의 단백질 평균 수준과 비교했을 때, 또는 유사한 질환을 가진 하나 이상의 대조군 개체에서 치료하지 않았을 때의 평균 단백질 수준과 비교했을 때, 또는 본원에 개시된 환형 CPP에 접합되지 않은 AC로 치료한 경우와 비교했을 때, 질환 표현형과 연관된 하류 전사체의 수준 및/또는 하류 유전자 산물의 발현을 약 5% 내지 100%, 약 10% 내지 100%, 약 20% 내지 100%, 약 50% 내지 100%, 약 70% 내지 100%, 약 80% 내지 100%, 약 90% 내지 100%, 약 95% 내지 100%, 약 40% 내지 95%, 약 50% 내지 95%, 약 70% 내지 95%, 또는 약 90% 내지 95%만큼 감소시킨다.In embodiments, treatment according to the present disclosure is performed when compared to the average protein level in the subject prior to treatment, or compared to the average protein level without treatment in one or more control subjects with similar disease, or Compared to treatment with AC not conjugated to circular CPP, the level of downstream transcripts and/or expression of downstream gene products associated with the disease phenotype is reduced by more than about 5%, e.g., about 5%, about 10%. , about 15%, about 20%, about 25%, about 30%, about 35%, about 40%, about 45%, about 50%, about 55%, about 60%, about 65%, about 70%, about Reduce by 75%, about 80%, about 85%, about 90%, about 95%, and about 100%. In embodiments, treatment according to the present disclosure is performed when compared to the average protein level in the subject prior to treatment, or compared to the average protein level without treatment in one or more control subjects with similar disease, or Compared to treatment with AC not conjugated to circular CPP, the levels of downstream transcripts and/or expression of downstream gene products associated with the disease phenotype are reduced by about 5% to 100%, about 10% to 100%, and about 20%. % to 100%, about 50% to 100%, about 70% to 100%, about 80% to 100%, about 90% to 100%, about 95% to 100%, about 40% to 95%, about 50% to 95%, about 70% to 95%, or about 90% to 95%.

구현예에서, 본 개시에 따른 치료는 치료 이전 대상체에서의 단백질 평균 수준과 비교했을 때, 또는 유사한 질환을 가진 하나 이상의 대조군 개체에서 치료하지 않았을 때의 평균 단백질 수준과 비교했을 때, 또는 본원에 개시된 환형 CPP에 접합되지 않은 AC로 치료한 경우와 비교했을 때, 건강한 표현형과 연관된 하류 전사체의 수준 및/또는 하류 유전자 산물의 발현을 약 5% 초과만큼, 예를 들어 약 5%, 약 10%, 약 15%, 약 20%, 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95%, 및 약 100%만큼 증가시킨다. 구현예에서, 본 개시에 따른 치료는 치료 이전 대상체에서의 단백질 평균 수준과 비교했을 때, 또는 유사한 질환을 가진 하나 이상의 대조군 개체에서 치료하지 않았을 때의 평균 단백질 수준과 비교했을 때, 또는 본원에 개시된 환형 CPP에 접합되지 않은 AC로 치료한 경우와 비교했을 때, 건강한 표현형과 연관된 하류 전사체의 수준 및/또는 하류 유전자 산물의 발현을 약 5% 내지 100%, 약 10% 내지 100%, 약 20% 내지 100%, 약 50% 내지 100%, 약 70% 내지 100%, 약 80% 내지 100%, 약 90% 내지 100%, 약 95% 내지 100%, 약 40% 내지 95%, 약 50% 내지 95%, 약 70% 내지 95%, 또는 약 90% 내지 95%만큼 증가시킨다.In embodiments, treatment according to the present disclosure is performed when compared to the average protein level in the subject prior to treatment, or compared to the average protein level without treatment in one or more control subjects with similar disease, or Compared to treatment with AC not conjugated to circular CPP, the levels of downstream transcripts and/or expression of downstream gene products associated with a healthy phenotype are reduced by more than about 5%, e.g., about 5%, about 10%. , about 15%, about 20%, about 25%, about 30%, about 35%, about 40%, about 45%, about 50%, about 55%, about 60%, about 65%, about 70%, about Increase by 75%, about 80%, about 85%, about 90%, about 95%, and about 100%. In embodiments, treatment according to the present disclosure is performed when compared to the average protein level in the subject prior to treatment, or compared to the average protein level without treatment in one or more control subjects with similar disease, or Compared to treatment with AC not conjugated to circular CPP, the levels of downstream transcripts and/or expression of downstream gene products associated with a healthy phenotype were reduced by about 5% to 100%, about 10% to 100%, and about 20%. % to 100%, about 50% to 100%, about 70% to 100%, about 80% to 100%, about 90% to 100%, about 95% to 100%, about 40% to 95%, about 50% to 95%, about 70% to 95%, or about 90% to 95%.

구현예에서, 본 개시에 따른 치료는 치료 이전 대상체의 각막 조직, 근육 조직, 횡경막 조직, 사두근, 삼두근, 전경골, 비복근, 또는 심장에서의 평균 단백질 발현 수준과 비교했을 때, 유사한 질환을 가진 하나 이상의 대조군 개체를 치료하지 않은 경우와 비교했을 때, 또는 본원에 개시된 환형 CPP에 접합되지 않은 AC로 치료한 경우와 비교했을 때, 대상체의 각막 조직, 근육 조직, 횡경막 조직, 사두근, 삼두근, 전경골, 비복근, 또는 심장에서 질환 표현형과 연관된 단백질 이소형의 발현을 약 5% 초과만큼, 예를 들어 약 5%, 약 10%, 약 15%, 약 20%, 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95%, 및 약 100%만큼 감소시킨다. 구현예에서, 본 개시에 따른 치료는 치료 이전 대상체의 각막 조직, 근육 조직, 횡경막 조직, 사두근, 삼두근, 전경골, 비복근, 또는 심장에서의 평균 단백질 발현 수준과 비교했을 때, 유사한 질환을 가진 하나 이상의 대조군 개체를 치료하지 않은 경우와 비교했을 때, 또는 본원에 개시된 환형 CPP에 접합되지 않은 AC로 치료한 경우와 비교했을 때, 대상체의 각막 조직, 근육 조직, 횡경막 조직, 사두근, 삼두근, 전경골, 비복근, 또는 심장에서 질환 표현형과 연관된 단백질 이소형의 발현을 약 5% 내지 약 100%, 약 10% 내지 약 100%, 약 20% 내지 약 100%, 약 50% 내지 약 100%, 약 70% 내지 약 100%, 약 80% 내지 약 100%, 약 90% 내지 약 100%, 약 95% 내지 약 100%, 약 40% 내지 약 95%, 약 50% 내지 약 95%, 약 70% 내지 약 95%, 약 90% 내지 약 95%만큼 감소시킨다.In embodiments, treatment according to the present disclosure is performed on subjects with similar disease when compared to the average protein expression level in the corneal tissue, muscle tissue, diaphragm tissue, quadriceps, triceps, tibialis anterior, gastrocnemius, or heart of the subject prior to treatment. When the above control subjects were compared to untreated or treated with AC not conjugated to the annular CPP disclosed herein, the subjects' corneal tissue, muscle tissue, diaphragm tissue, quadriceps, triceps, tibialis anterior. , gastrocnemius, or heart by greater than about 5%, e.g., about 5%, about 10%, about 15%, about 20%, about 25%, about 30%, about 35%, about 40%, about 45%, about 50%, about 55%, about 60%, about 65%, about 70%, about 75%, about 80%, about 85%, about 90%, about 95% , and decrease by about 100%. In embodiments, treatment according to the present disclosure is performed on subjects with similar disease when compared to the average protein expression level in the corneal tissue, muscle tissue, diaphragm tissue, quadriceps, triceps, tibialis anterior, gastrocnemius, or heart of the subject prior to treatment. When the above control subjects were compared to untreated or treated with AC not conjugated to the annular CPP disclosed herein, the subjects' corneal tissue, muscle tissue, diaphragm tissue, quadriceps, triceps, tibialis anterior. , gastrocnemius, or heart, about 5% to about 100%, about 10% to about 100%, about 20% to about 100%, about 50% to about 100%, about 70% % to about 100%, about 80% to about 100%, about 90% to about 100%, about 95% to about 100%, about 40% to about 95%, about 50% to about 95%, about 70% to Reduces by about 95%, about 90% to about 95%.

구현예에서, 본 개시에 따른 치료는 치료 이전 대상체의 각막 조직, 근육 조직, 횡격막 조직, 사두근, 또는 심장에서의 하류 단백질의 평균 수준과 비교했을 때, 유사한 질환을 가진 하나 이상의 대조군 개체를 치료하지 않은 경우와 비교했을 때, 또는 본원에 개시된 환형 CPP에 접합되지 않은 AC로 치료한 경우와 비교했을 때, 대상체의 각막 조직, 근육 조직, 횡경막 조직, 사두근, 또는 심장에서 대안적으로 스플라이싱된 하류 단백질의 발현을 약 5% 초과만큼, 예를 들어 약 5%, 약 10%, 약 15%, 약 20%, 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95%, 약 100%, 약 150%, 약 200%, 약 250%, 약 300%, 약 350%, 약 400%, 약 450%, 약 500%, 약 550%, 약 600%, 약 650%, 약 700%, 약 750%, 약 800%, 약 850%, 약 900%, 약 950%, 또는 약 1000%만큼 또는 그 이상 증가시킨다.In embodiments, treatment according to the present disclosure does not treat one or more control subjects with similar disease when compared to the average level of the downstream protein in the subject's corneal tissue, muscle tissue, diaphragmatic tissue, quadriceps muscle, or heart prior to treatment. alternatively spliced cells in the subject's corneal tissue, muscle tissue, diaphragm tissue, quadriceps muscle, or heart when compared to treatment with AC that is not conjugated to the annular CPP disclosed herein. Reduce the expression of the downstream protein by greater than about 5%, e.g., about 5%, about 10%, about 15%, about 20%, about 25%, about 30%, about 35%, about 40%, about 45%, About 50%, about 55%, about 60%, about 65%, about 70%, about 75%, about 80%, about 85%, about 90%, about 95%, about 100%, about 150%, about 200 %, about 250%, about 300%, about 350%, about 400%, about 450%, about 500%, about 550%, about 600%, about 650%, about 700%, about 750%, about 800%, Increase by about 850%, about 900%, about 950%, or about 1000% or more.

구현예에서, 본 개시에 따른 치료는 치료 이전 대상체의 각막 조직, 근육 조직, 횡경막 조직, 사두근, 또는 심장에서의 야생형 단백질 이성질체의 평균 발현 수준과 비교했을 때, 유사한 질환을 가진 하나 이상의 대조군 개체를 치료하지 않은 경우와 비교했을 때, 또는 본원에 개시된 환형 CPP에 접합되지 않은 AC로 치료한 경우와 비교했을 때, 대상체의 각막 조직, 근육 조직, 횡경막 조직, 사두근, 또는 심장에서 야생형 단백질 이성질체의 발현을 약 5% 초과만큼, 예를 들어 약 5%, 약 10%, 약 15%, 약 20%, 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95%, 및 약 100%만큼 증가시키거나 감소시킨다.In embodiments, treatment according to the present disclosure results in one or more control subjects with similar disease as compared to the average expression level of the wild-type protein isomer in the subject's corneal tissue, muscle tissue, diaphragm tissue, quadriceps muscle, or heart prior to treatment. Expression of the wild-type protein isomer in the subject's corneal tissue, muscle tissue, diaphragm tissue, quadriceps muscle, or heart compared to untreated or compared to treatment with AC not conjugated to the cyclic CPP disclosed herein By more than about 5%, for example about 5%, about 10%, about 15%, about 20%, about 25%, about 30%, about 35%, about 40%, about 45%, about 50%, Increase or decrease by about 55%, about 60%, about 65%, about 70%, about 75%, about 80%, about 85%, about 90%, about 95%, and about 100%.

구현예에서, 본 개시에 따른 치료는 치료 이전 대상체의 관심 조직에서의 단백질 평균 수준과 비교했을 때, 또는 유사한 질환을 가진 하나 이상의 대조군 개체에서 치료하지 않은 경우와 비교했을 때, 또는 본원에 개시된 환형 CPP에 접합되지 않은 AC로 치료한 경우와 비교했을 때, 대상체의 관심 조직에서 단백질의 발현을 약 5% 초과만큼, 예를 들어 약 5%, 약 10%, 약 15%, 약 20%, 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95%, 및 약 100%만큼 감소시킨다.In embodiments, treatment according to the present disclosure is performed when compared to the average level of the protein in the subject's tissue of interest prior to treatment, or when compared to no treatment in one or more control subjects with similar disease, or when compared to an annular protein as disclosed herein. Compared to treatment with AC not conjugated to CPP, the expression of the protein in the subject's tissue of interest is reduced by more than about 5%, for example about 5%, about 10%, about 15%, about 20%, about 25%, about 30%, about 35%, about 40%, about 45%, about 50%, about 55%, about 60%, about 65%, about 70%, about 75%, about 80%, about 85% , reduces by about 90%, about 95%, and about 100%.

구현예에서, 본 개시에 따른 치료는 치료 이전 대상체의 관심 조직에서의 하류 단백질의 평균 수준과 비교했을 때, 유사한 질환을 가진 하나 이상의 대조군 개체를 치료하지 않은 경우와 비교했을 때, 또는 본원에 개시된 환형 CPP에 접합되지 않은 AC로 치료한 경우와 비교했을 때, 대상체의 관심 조직에서 대안적으로 스플라이싱된 하류 단백질의 발현을 약 5% 초과만큼, 예를 들어 약 5%, 약 10%, 약 15%, 약 20%, 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95%, 약 100%, 약 150%, 약 200%, 약 250%, 약 300%, 약 350%, 약 400%, 약 450%, 약 500%, 약 550%, 약 600%, 약 650%, 약 700%, 약 750%, 약 800%, 약 850%, 약 900%, 약 950%, 또는 약 1000%만큼 또는 그 이상 증가시킨다.In embodiments, treatment according to the present disclosure is performed when compared to the average level of the downstream protein in the subject's tissue of interest prior to treatment, compared to no treatment of one or more control subjects with similar disease, or Compared to treatment with AC not conjugated to circular CPP, the expression of alternatively spliced downstream proteins in the subject's tissue of interest is reduced by more than about 5%, e.g., about 5%, about 10%, About 15%, about 20%, about 25%, about 30%, about 35%, about 40%, about 45%, about 50%, about 55%, about 60%, about 65%, about 70%, about 75 %, about 80%, about 85%, about 90%, about 95%, about 100%, about 150%, about 200%, about 250%, about 300%, about 350%, about 400%, about 450%, Increase by about 500%, about 550%, about 600%, about 650%, about 700%, about 750%, about 800%, about 850%, about 900%, about 950%, or about 1000% or more. .

구현예에서, 본 개시에 따른 치료는 치료 이전 대상체의 관심 조직에서의 하류 단백질의 평균 수준과 비교했을 때, 또는 유사한 질환을 가진 하나 이상의 대조군 개체에서 치료하지 않은 경우와 비교했을 때, 또는 본원에 개시된 환형 CPP에 접합되지 않은 AC로 치료한 경우와 비교했을 때, 대상체의 관심 조직에서 야생형 하류 단백질 이성질체의 발현을 약 5% 초과만큼, 예를 들어 약 5%, 약 10%, 약 15%, 약 20%, 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95%, 및 약 100%만큼 증가시키거나 감소시킨다.In embodiments, treatment according to the present disclosure is performed when compared to the average level of the downstream protein in the subject's tissue of interest prior to treatment, or compared to no treatment in one or more control subjects with similar disease, or herein. Compared to treatment with AC not conjugated to the disclosed cyclic CPP, the expression of the wild-type downstream protein isomer in the subject's tissue of interest is increased by greater than about 5%, e.g., about 5%, about 10%, about 15%, About 20%, about 25%, about 30%, about 35%, about 40%, about 45%, about 50%, about 55%, about 60%, about 65%, about 70%, about 75%, about 80 %, increase or decrease by about 85%, about 90%, about 95%, and about 100%.

구현예에서, 대상체의 관심 조직은 각막 조직 또는 근육 조직이다.In an embodiment, the tissue of interest in the subject is corneal tissue or muscle tissue.

본원에서 사용되는 바와 같이, “개선(improve)”, “증가(increase)”, “감소(reduce, decrease)” 등의 용어는 대조군에 대한 상대 값을 나타낸다. 구현예에서, 적절한 대조군은 베이스라인 측정치, 예컨대 본원에 기술된 치료의 개시 전 동일한 개체에서의 측정치, 또는 본원에 기술된 치료의 부재 시 대조군 개체(또는 다수의 대조군 개체)에서의 측정치이다. “대조군 개체”는 치료 중인 개체와 동일한 질환을 앓고 있고, 연령이 비슷하고/하거나, 성별이 동일한 개체이다(치료된 개체 및 대조군 개체(들)의 병기가 비슷해지도록 하기 위한 것임).As used herein, the terms “improve,” “increase,” “reduce, decrease,” etc. refer to values relative to a control group. In embodiments, an appropriate control is a baseline measurement, such as a measurement in the same individual prior to initiation of a treatment described herein, or a measurement in a control subject (or multiple control subjects) in the absence of a treatment described herein. A “control subject” is an individual suffering from the same disease, of similar age, and/or of the same sex as the subject being treated (this is to ensure that the stage of the treated and control subject(s) is similar).

치료 중인 개체(“환자” 또는 “대상체”로도 지칭됨)는 질환을 갖거나 질환이 발생할 가능성이 있는 개체(태아, 영아, 소아, 청소년, 또는 성인 인간)이다. 개체는 비정상적인 유전자 발현 또는 비정상적인 유전자 스플라이싱에 의해 매개되는 질환을 가질 수 있다. 다양한 구현예에서, 질환을 가진 개체는 질환에 걸리지 않은 개체에서의 정상적인 야생형 단백질 발현 또는 활성 수준의 약 1~99% 미만인 하류 단백질 발현 또는 활성 수준을 가질 수 있다. 구현예에서, 범위는 정상적인 야생형 단백질 발현 또는 활성 수준의 약 80~99% 미만, 약 65~80% 미만, 약 50~65% 미만, 약 30~50% 미만, 약 25~30% 미만, 약 20~25% 미만, 약 15~20% 미만, 약 10~15% 미만, 약 5~10% 미만, 약 1~5% 미만을 포함하지만 이에 한정되지는 않는다. 구현예에서, 개체는 질환에 걸리지 않은 개체에서 정상적인 야생형 표적 단백질 발현 또는 활성 수준보다 1~500% 더 높은 하류 단백질 발현 또는 활성 수준을 가질 수 있다. 구현예에서, 범위는 정상적인 야생형 표적 단백질 발현 또는 활성 수준의 약 1~10%, 약 10~50%, 약 50~100%, 약 100~200%, 약 200~300%, 약 300~400%, 약 400~500%, 또는 약 500~1000%를 포함하지만 이에 한정되지는 않는다.The individual being treated (also referred to as a “patient” or “subject”) is an individual (fetal, infant, child, adolescent, or adult human) who has a disease or is likely to develop a disease. An individual may have a disease mediated by abnormal gene expression or abnormal gene splicing. In various embodiments, an individual with a disease may have a level of downstream protein expression or activity that is less than about 1-99% of the normal wild-type protein expression or activity level in an individual without the disease. In embodiments, the range is less than about 80-99%, less than about 65-80%, less than about 50-65%, less than about 30-50%, less than about 25-30%, about Including, but not limited to, 20 to less than 25%, about 15 to less than 20%, about 10 to less than 15%, about 5 to less than 10%, and about 1 to less than 5%. In embodiments, the individual may have a level of downstream protein expression or activity that is 1-500% higher than the normal wild-type target protein expression or activity level in a non-diseased individual. In embodiments, the range is about 1-10%, about 10-50%, about 50-100%, about 100-200%, about 200-300%, about 300-400% of normal wild-type target protein expression or activity level. , including, but not limited to, about 400-500%, or about 500-1000%.

구현예에서, 개체는 최근에 질환으로 진단받은 적이 있는 개체이다. 일반적으로, 질환의 효과를 최소화하고 치료의 이점을 최대화하기 위해서는 조기 치료(진단 후 가능한 한 빨리 치료를 개시하는 것)가 중요하다.In embodiments, the individual is an individual who has recently been diagnosed with a disease. In general, early treatment (initiating treatment as soon as possible after diagnosis) is important to minimize the effects of the disease and maximize the benefits of treatment.

특정 정의specific definition

발명을 실시하기 위한 구체적인 내용 및 첨부된 청구범위에서 사용된 것과 같이, 단수 형태(“a”, “an”, 및 “the”)는 문맥이 명확하게 달리 언급하지 않는 한 복수의 지시 대상을 포함한다. 따라서, 예를 들어, “조성물”에 대한 언급은 2개 이상의 이러한 조성물의 혼합물을 포함하고, “제제”에 대한 언급은 2개 이상의 이러한 제제의 혼합물을 포함하고, “성분”에 대한 언급은 2개 이상의 이러한 성분의 혼합물을 포함한다.As used in the description and appended claims, the singular forms “a”, “an”, and “the” include plural referents unless the context clearly dictates otherwise. do. Thus, for example, a reference to a “composition” includes a mixture of two or more such compositions, a reference to an “agent” includes a mixture of two or more such agents, and a reference to an “ingredient” includes two or more such compositions. Contains mixtures of more than one of these ingredients.

용어 “약”이 숫자 값 바로 앞에 위치할 때, 이 용어는 범위(예를 들어 해당 값의 ±20%, 10%, 또는 5%)를 의미한다. 예를 들어, 본 개시의 맥락이 달리 나타내거나, 본 개시의 맥락이 이러한 해석과 모순되지 않는 한, “약 50”은 45 내지 55를 의미할 수 있고, “약 25,000”은 22,500 내지 27,500을 의미할 수 있다. 예를 들어, “약 49, 약 50, 약 55, ...”와 같은 숫자 값의 목록에서, “약 50”은 이전 값과 후속 값 사이의 간격(들)의 절반 미만으로 연장되는 범위, 예를 들어 49.5 초과 내지 52.5 미만을 의미한다. 또한, “약 얼마 미만” 또는 “약 얼마 초과”라는 표현은 본원에서 제공된 용어 “약”의 정의의 관점에서 이해되어야 한다. 유사하게, 용어 “약”이 연속된 숫자 값 또는 값의 범위 앞에 위치할 때(예를 들어, “약 10, 20, 30” 또는 “약 10~30”), 용어 “약”은 연속된 모든 값 또는 범위의 양 종점값을 각각 지칭한다.When the term “about” appears immediately before a numeric value, it refers to a range (e.g. ±20%, 10%, or 5% of that value). For example, “about 50” can mean 45 to 55, and “about 25,000” can mean 22,500 to 27,500, unless the context of the disclosure indicates otherwise or the context of the disclosure contradicts such interpretation. can do. For example, in a list of numeric values such as “about 49, about 50, about 55, ...”, “about 50” means a range that extends less than half the interval(s) between the previous and subsequent values; For example, it means greater than 49.5 and less than 52.5. Additionally, the expressions “less than about” or “more than about” should be understood in light of the definition of the term “about” provided herein. Similarly, when the term “about” is placed before a consecutive numeric value or range of values (e.g., “about 10, 20, 30” or “about 10 to 30”), the term “about” is used for all consecutive numeric values or ranges of values. Refers to both endpoints of a value or range, respectively.

본원에서 사용되는 바와 같이, “세포 투과 펩티드” 또는 “CPP”는 세포 내로 화물, 예를 들어 치료 모이어티(TM)를 전달하는 것을 용이하게 하는 펩티드를 지칭한다. 구현예에서, CPP는 환형이고, “cCPP”로서 표시된다. 구현예에서, cCPP는 치료 모이어티가 세포막을 침투하도록 유도할 수 있다. 구현예에서, cCPP는 세포의 세포액에 치료 모이어티를 전달한다. 구현예에서, cCPP는 pre-mRNA가 위치하는 세포 위치에 안티센스 화합물(AC)을 전달한다.As used herein, “cell penetrating peptide” or “CPP” refers to a peptide that facilitates the delivery of a cargo, e.g., a therapeutic moiety (TM), into a cell. In an embodiment, CPP is cyclic and is denoted as “cCPP”. In embodiments, cCPP can induce the therapeutic moiety to penetrate the cell membrane. In embodiments, cCPP delivers the therapeutic moiety to the cytosol of the cell. In embodiments, cCPP delivers an antisense compound (AC) to the cellular location where the pre-mRNA is located.

본원에서 사용되는 바와 같이, 용어 “엔도솜 탈출 비히클”(EEV)은 화학적 연결(즉, 공유 결합 또는 비공유 상호작용)에 의해 링커 및/또는 환외 펩티드(EP)에 접합되는 cCPP를 지칭한다. EEV는 식 (B)의 EEV일 수 있다.As used herein, the term “endosomal escape vehicle” (EEV) refers to cCPP that is conjugated to a linker and/or an exophytic peptide (EP) by a chemical linkage (i.e., covalent or non-covalent interaction). EEV may be the EEV of equation (B).

본원에서 사용되는 바와 같이, 용어 “EEV-접합체”는 화학적 연결(즉, 공유 결합 또는 비공유 상호작용)에 의해 화물에 접합된, 본원에서 정의된 엔도솜 탈출 비히클을 지칭한다. 화물은 EEV에 의해 세포 내로 전달될 수 있는 치료 모이어티(예: 올리고뉴클레오티드, 펩티드, 또는 소분자)일 수 있다. EEV-접합체는 식 (C)의 EEV-접합체일 수 있다.As used herein, the term “EEV-conjugate” refers to an endosomal escape vehicle, as defined herein, conjugated to a cargo by a chemical linkage (i.e., covalent or non-covalent interaction). The cargo may be a therapeutic moiety (e.g., an oligonucleotide, peptide, or small molecule) that can be delivered into cells by EEV. The EEV-conjugate may be an EEV-conjugate of formula (C).

본원에서 사용되는 바와 같이, “환외 펩티드”(EP) 및 “조절 펩티드”(MP)라는 용어는 본원에 개시된 환형 세포 투과 펩티드(cCPP)에 접합될 수 있는, 펩티드 결합에 의해 연결된 2개 이상의 아미노산 잔기를 지칭하도록 상호 교환적으로 사용될 수 있다. EP가 본원에 개시된 환형 펩티드에 접합될 때, EP는 화합물의 조직 분포 및/또는 머무름을 변경할 수 있다. 일반적으로, EP는 적어도 하나의 양으로 하전된 아미노산 잔기, 예를 들어 적어도 하나의 리신 잔기 및/또는 적어도 하나의 아르기닌 잔기를 포함한다. EP의 비제한적인 예가 본원에 기술되어 있다. EP는 당업계에서 “핵 국소화 서열”(NLS)로서 식별된 펩티드일 수 있다. 핵 국소화 서열의 비제한적인 예는 7개의 아미노산 서열 PKKKRKV(서열번호 42)로 이루어진 최소 기능 단위를 가진 SV40 바이러스 거대 T-항원의 핵 국소화 서열; 서열 NLSKRPAAIKAGQAKKKK(서열번호 52)를 가진 뉴클레오플라스민 2부분 NLS; 아미노산 서열 PAAKRVKLD(서열번호 53) 또는 RQRRNELKRSF(서열번호 54)를 갖는 c-myc 핵 국소화 서열; 임포틴-알파로부터의 IBB 도메인의 서열 RMRKFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (서열번호 50); 근종 T 단백질의 서열 VSRKRPRP (서열번호 57) 및 PPKKARED (서열번호 58); 인간 p53의 서열 PQPKKKPL (서열번호 59); 마우스c-abl IV의 서열 SALIKKKKKMAP (서열번호 60); 인플루엔자 바이러스 NS1의 서열 DRLRR (서열번호 61) 및 PKQKKRK (서열번호 62); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL (서열번호 63); 마우스 Mxl 단백질의 서열 REKKKFLKRR (서열번호 64); 인간 폴리(ADP-리보오스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK (서열번호 65); 및 스테로이드 호르몬 수용체 (인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK (서열번호 66)를 포함한다. 국제 공개 제2001/038547호는 NLS의 추가 예를 기술하며, 동 문헌은 그 전체가 참조로서 본원에 통합된다.As used herein, the terms “extracyclic peptide” (EP) and “modulatory peptide” (MP) refer to two or more amino acids linked by a peptide bond that can be conjugated to a cyclic cell penetrating peptide (cCPP) disclosed herein. Can be used interchangeably to refer to residues. When EP is conjugated to a cyclic peptide disclosed herein, the EP can alter the tissue distribution and/or retention of the compound. Typically, the EP comprises at least one positively charged amino acid residue, such as at least one lysine residue and/or at least one arginine residue. Non-limiting examples of EP are described herein. EP may be a peptide identified in the art as a “nuclear localization sequence” (NLS). Non-limiting examples of nuclear localization sequences include the nuclear localization sequence of the SV40 virus large T-antigen with the minimal functional unit consisting of the seven amino acid sequence PKKKRKV (SEQ ID NO: 42); Nucleoplasmin two-part NLS with sequence NLSKRPAAIKAGQAKKKK (SEQ ID NO: 52); c-myc nuclear localization sequence with amino acid sequence PAAKRVKLD (SEQ ID NO: 53) or RQRRNELKRSF (SEQ ID NO: 54); The sequence of the IBB domain from importin-alpha RMRKFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (SEQ ID NO: 50); The sequences VSRKRPRP (SEQ ID NO: 57) and PPKKARED (SEQ ID NO: 58) of the myoma T protein; Sequence PQPKKKPL (SEQ ID NO: 59) of human p53; Sequence SALIKKKKKKMAP (SEQ ID NO: 60) of mouse c-abl IV; Sequences DRLRR (SEQ ID NO: 61) and PKQKKRK (SEQ ID NO: 62) of influenza virus NS1; Sequence RKLKKKIKKL (SEQ ID NO: 63) of hepatitis virus delta antigen; Sequence REKKKFLKRR (SEQ ID NO: 64) of mouse Mxl protein; Sequence of human poly(ADP-ribose) polymerase KRKGDEVDGVDEVAKKKSKK (SEQ ID NO: 65); and the sequence RKCLQAGMNLEARKTKK (SEQ ID NO: 66) of the steroid hormone receptor (human) glucocorticoid. International Publication No. 2001/038547 describes additional examples of NLS, which is hereby incorporated by reference in its entirety.

본원에서 사용되는 바와 같이, “링커” 또는 “L”은 하나 이상의 모이어티(예를 들어 환외 펩티드(EP) 및 화물, 예를 들어 올리고뉴클레오티드, 펩티드, 또는 소분자)를 환형 세포 투과 펩티드(cCPP)에 공유 결합시키는 모이어티를 지칭한다. 링커는 천연 또는 비-천연 아미노산 또는 폴리펩티드를 포함할 수 있다. 링커는 cCPP를 화물 모이어티에 결합시켜 본원에 개시된 화합물을 형성하기에 적합한 둘 이상의 적절한 관능기를 함유하는 합성 화합물일 수 있다. 링커는 폴리에틸렌 글리콜(PEG) 모이어티를 포함할 수 있다. 링커는 하나 이상의 아미노산을 포함할 수 있다. cCPP는 링커를 통해 화물에 공유 결합될 수 있다.As used herein, “linker” or “L” refers to linking one or more moieties (e.g., an exocyclic peptide (EP) and a cargo, e.g., an oligonucleotide, peptide, or small molecule) to a cyclic cell penetrating peptide (cCPP). It refers to a moiety that is covalently bound to. Linkers may include natural or non-natural amino acids or polypeptides. The linker may be a synthetic compound containing two or more suitable functional groups suitable for linking cCPP to a cargo moiety to form a compound disclosed herein. The linker may include a polyethylene glycol (PEG) moiety. The linker may contain one or more amino acids. cCPP can be covalently linked to the cargo via a linker.

용어 “펩티드”, “단백질”, 및 “폴리펩티드”는 하나의 아미노산의 카르복시기에 의해 다른 아미노산의 알파 아미노기에 연결된 2개 이상의 아미노산을 포함하는 천연 또는 합성 분자를 지칭하도록 상호 교환적으로 사용된다. 2개 이상의 아미노산 잔기는 하나의 아미노산의 카르복시기에 의해 알파 아미노기에 연결될 수 있다. 폴리펩티드의 2개 이상의 아미노산은 펩티드 결합에 의해 결합될 수 있다. 폴리펩티드는 2개 이상의 아미노산이 펩티드 결합 이외의 결합에 의해 공유 부착되는 펩티드 백본 변형을 포함할 수 있다. 폴리펩티드는 폴리펩티드로 통합될 수 있는 하나 이상의 비-천연 아미노산, 아미노산 유사체, 또는 다른 합성 분자를 포함할 수 있다. 용어 폴리펩티드는 자연 발생 아미노산 및 인공 발생 아미노산을 포함한다. 용어 폴리펩티드는, 예를 들어 약 2 내지 약 100개의 아미노산 잔기를 포함하는 펩티드뿐만 아니라, 약 100개가 넘는 아미노산 잔기 또는 약 1000개가 넘는 아미노산 잔기를 포함하는 단백질도 포함하는데, 여기에는 항체, 효소, 수용체, 가용성 단백질 등과 같은 치료 단백질이 포함되지만 이에 한정되지는 않는다.The terms “peptide,” “protein,” and “polypeptide” are used interchangeably to refer to a natural or synthetic molecule containing two or more amino acids linked by the carboxyl group of one amino acid to the alpha amino group of another amino acid. Two or more amino acid residues may be linked to the alpha amino group by the carboxyl group of one amino acid. Two or more amino acids in a polypeptide may be joined by peptide bonds. A polypeptide may contain a peptide backbone modification in which two or more amino acids are covalently attached by a bond other than a peptide bond. A polypeptide may include one or more non-natural amino acids, amino acid analogs, or other synthetic molecules that may be incorporated into the polypeptide. The term polypeptide includes naturally occurring amino acids and artificially occurring amino acids. The term polypeptide includes, for example, peptides containing from about 2 to about 100 amino acid residues, as well as proteins containing more than about 100 amino acid residues or more than about 1000 amino acid residues, including antibodies, enzymes, receptors, etc. , soluble proteins, etc. include, but are not limited to, therapeutic proteins.

본원에서 사용되는 바와 같이, 용어 “연속(contiguous)”은 공유 결합에 의해 연결되는 2개의 아미노산을 지칭한다. 예를 들어, 대표적인 환형 세포 투과 펩티드(cCPP)의 맥락에서, 예컨대 , AA1/AA2, AA2/AA3, AA3/AA4, 및 AA5/AA1은 연속 아미노산의 쌍을 예시한다.As used herein, the term “contiguous” refers to two amino acids joined by a covalent bond. For example, in the context of representative cyclic cell penetrating peptides (cCPPs), e.g. , AA 1 /AA 2, AA 2 /AA 3, AA 3 /AA 4, and AA 5 /AA 1 exemplify pairs of consecutive amino acids.

본원에서 사용되는 바와 같이, 화학 종의 잔기는 특정 생성물에 존재하는 화학 종의 유도체를 지칭한다. 생성물을 형성하기 위해, 종의 적어도 하나의 원자는 또 다른 모이어티에 대한 결합에 의해 치환되어, 생성물은 화학 종의 유도체 또는 잔기를 함유한다. 예를 들어, 본원에 기술된 환형 세포 투과 펩티드(cCPP)는 하나 이상의 펩티드 결합을 형성함으로써 그 안에 혼입된 아미노산(예: 아르기닌)을 갖는다. cCPP에 혼입된 아미노산은 잔기로서 지칭되거나, 단순히 아미노산으로서 지칭될 수 있다. 예를 들어, 아르기닌 또는 아르기닌 잔기는 를 지칭한다.As used herein, a moiety of a chemical species refers to a derivative of the chemical species present in a particular product. To form a product, at least one atom of a species is replaced by bond to another moiety, such that the product contains a derivative or moiety of the chemical species. For example, the cyclic cell penetrating peptide (cCPP) described herein has an amino acid (e.g., arginine) incorporated therein by forming one or more peptide bonds. Amino acids incorporated into cCPP may be referred to as residues, or simply as amino acids. For example, arginine or an arginine residue is refers to

용어 “이의 양성자화된 형태”는 아미노산 또는 측쇄의 양성자화된 형태를 지칭한다. 예를 들어, 아르기닌의 측쇄 상의 구아니딘기는 양성자화되어 구아니디늄기를 형성할 수 있다. 아르기닌의 양성자화된 형태의 구조는 다음과 같다: .The term “protonated form thereof” refers to the protonated form of an amino acid or side chain. For example, a guanidine group on the side chain of arginine can be protonated to form a guanidinium group. The structure of the protonated form of arginine is: .

본원에서 사용되는 바와 같이, 용어 “키랄성(chirality)”은 원자의 3차원 공간 배열이 상이한 둘 이상의 입체이성질체를 갖는 분자를 지칭하며, 여기서 하나의 입체이성질체는 다른 입체이성질체의 겹쳐질 수 없는 거울상이다. 글리신을 제외한 아미노산은 카르복실기에 인접한 키랄 탄소 원자를 갖는다. 용어 “거울상이성질체”는 키랄인 입체 이성질체를 지칭한다. 키랄 분자는 “D” 및 “L” 거울상이성질체를 갖는 아미노산 잔기일 수 있다. 글리신과 같은 키랄 중심이 없는 분자는 "아키랄(achiral)"로서 지칭될 수 있다.As used herein, the term “chirality” refers to a molecule having two or more stereoisomers that differ in the three-dimensional spatial arrangement of the atoms, where one stereoisomer is a non-superimposable mirror image of the other stereoisomer. . Amino acids except glycine have a chiral carbon atom adjacent to the carboxyl group. The term “enantiomer” refers to a stereoisomer that is chiral. Chiral molecules can be amino acid residues that have “D” and “L” enantiomers. Molecules without a chiral center, such as glycine, may be referred to as “achiral.”

본원에서 사용되는 바와 같이, 용어 “소수성”은 물에 용해되지 않거나 물에서 최소 용해도를 갖는 모이어티를 지칭한다. 일반적으로, 중성 모이어티 및/또는 비극성 모이어티, 또는 대부분이 중성 및/또는 비극성인 모이어티가 소수성이다. 소수성은 본원에 개시된 방법 중 하나에 의해 측정될 수 있다.As used herein, the term “hydrophobic” refers to a moiety that is not soluble in water or has minimal solubility in water. Generally, neutral moieties and/or nonpolar moieties, or moieties that are predominantly neutral and/or nonpolar, are hydrophobic. Hydrophobicity can be measured by one of the methods disclosed herein.

본원에서 사용되는 바와 같이, “방향족”은 4n + 2 π 전자를 갖는 불포화 환형 분자를 지칭하며, 여기서 n은 임의의 정수이다. 아래에 정의된 “헤테로방향족”은 방향족의 하위 집합이다. 방향족 아미노산의 예는 페닐알라닌 및 나프틸알리닌을 포함한다. 용어 “비방향족”은 방향족의 정의에 속하지 않는 임의의 분자를 지칭한다. 예를 들어, 방향족의 정의 내에 속하지 않는 임의의 선형, 분지형, 또는 환형 분자는 비방향족이다. 비방향족 아미노산의 예는 글리신 및 시트룰린을 포함하지만, 이에 한정되지는 않는다.As used herein, “aromatic” refers to an unsaturated cyclic molecule having 4n + 2 π electrons, where n is any integer. “Heteroaromatics,” as defined below, are a subset of aromatics. Examples of aromatic amino acids include phenylalanine and naphthylalinine. The term “non-aromatic” refers to any molecule that does not fall within the definition of aromatic. For example, any linear, branched, or cyclic molecule that does not fall within the definition of aromatic is non-aromatic. Examples of non-aromatic amino acids include, but are not limited to, glycine and citrulline.

“알킬”, “알킬 사슬”, 또는 “알킬기”는 1 내지 40개의 탄소 원자를 갖고, 단일 결합에 의해 분자의 나머지 부분에 부착되는 완전히 포화된 직선형 또는 분지형 탄화수소 사슬 라디칼을 지칭한다. 1 내지 40개 중 임의의 수의 탄소 원자를 포함하는 알킬이 포함된다. 최대 40개의 탄소 원자를 포함하는 알킬은 C1-C40 알킬이고, 최대 10개의 탄소 원자를 포함하는 알킬은 C1-C10 알킬이고, 최대 6개의 탄소 원자를 포함하는 알킬은 C1-C6 알킬이고, 최대 5개의 탄소 원자를 포함하는 알킬은 C1-C5 알킬이다. C1-C5 알킬은 C5 알킬, C4 알킬, C3 알킬, C2 알킬, 및 C1 알킬(즉, 메틸)을 포함한다. C1-C6 알킬은 C1-C5 알킬에 대해 전술한 모든 모이어티를 포함하지만, C6 알킬도 포함한다. C1-C10 알킬은 C1-C5 알킬 및 C1-C6 알킬에 대해 전술한 모든 모이어티를 포함하지만, C7, C8, C9, 및 C10 알킬도 포함한다. 유사하게, C1-C12 알킬은 전술한 모든 모이어티를 포함하지만, C11 및 C12 알킬도 포함한다. C1-C12 알킬의 비제한적인 예는 메틸, 에틸, n-프로필, i-프로필, 세크-프로필, n-부틸, i-부틸, 세크-부틸, t-부틸, n-펜틸, t-아밀, n-헥실, n-헵틸, n-옥틸, n-노닐, n-데실, n-운데실, 및 n-도데실을 포함한다. 본 명세서에서 구체적으로 달리 언급되지 않는 한, 알킬기는 임의 치환될 수 있다.“Alkyl,” “alkyl chain,” or “alkyl group” refers to a fully saturated straight or branched hydrocarbon chain radical having 1 to 40 carbon atoms and attached to the remainder of the molecule by single bonds. Alkyls containing any number of carbon atoms from 1 to 40 are included. Alkyl containing up to 40 carbon atoms is C 1 -C 40 alkyl, alkyl containing up to 10 carbon atoms is C 1 -C 10 alkyl, and alkyl containing up to 6 carbon atoms is C 1 -C 6 alkyl, and alkyl containing up to 5 carbon atoms is C 1 -C 5 alkyl. C 1 -C 5 alkyl includes C 5 alkyl, C 4 alkyl, C 3 alkyl, C 2 alkyl, and C 1 alkyl (ie, methyl). C 1 -C 6 alkyl includes all moieties previously described for C 1 -C 5 alkyl, but also includes C 6 alkyl. C 1 -C 10 alkyl includes all moieties previously described for C 1 -C 5 alkyl and C 1 -C 6 alkyl, but also includes C 7 , C 8 , C 9 , and C 10 alkyl. Similarly, C 1 -C 12 alkyl includes all moieties described above, but also includes C 11 and C 12 alkyl. Non-limiting examples of C 1 -C 12 alkyl include methyl, ethyl, n -propyl, i -propyl, sec- propyl, n -butyl, i -butyl, sec -butyl, t -butyl, n -pentyl, t - Includes amyl, n -hexyl, n -heptyl, n -octyl, n -nonyl, n -decyl, n -undecyl, and n -dodecyl. Unless specifically stated otherwise in the specification, an alkyl group may be optionally substituted.

“알킬렌”, “알킬렌 사슬”, 또는 “알킬렌기”는 1 내지 40개의 탄소 원자를 갖는 완전히 포화된 직선형 또는 분지형 2가 탄화수소 사슬 라디칼을 지칭한다. C2-C40 알킬렌의 비제한적인 예는 에틸렌, 프로필렌, n-부틸렌, 에테닐렌, 프로페닐렌, n-부테닐렌, 프로피닐렌, n-부티닐렌 등을 포함한다. 본 명세서에서 구체적으로 달리 언급되지 않는 한, 알킬렌 사슬은 임의 치환될 수 있다.“Alkylene,” “alkylene chain,” or “alkylene group” refers to a fully saturated straight or branched divalent hydrocarbon chain radical having 1 to 40 carbon atoms. Non-limiting examples of C 2 -C 40 alkylene include ethylene, propylene, n -butylene, ethenylene, propenylene, n -butenylene, propynylene, n -butynylene, and the like. Unless specifically stated otherwise in the specification, alkylene chains may be optionally substituted.

“알케닐”, “알케닐 사슬”, 또는 “알케닐기”는 2개 내지 40개의 탄소 원자를 갖고 하나 이상의 탄소-탄소 이중 결합을 갖는 직선형 또는 분지형 탄화수소 사슬 라디칼을 지칭한다. 각각의 알케닐기는 단일 결합에 의해 분자의 나머지 부분에 부착된다. 2 내지 40개 중 임의의 수의 탄소 원자를 포함하는 알케닐이 포함된다. 최대 40개의 탄소 원자를 포함하는 알케닐기는 C2-C40 알케닐이고, 최대 10개의 탄소 원자를 포함하는 알케닐은 C2-C10 알케닐이고, 최대 6개의 탄소 원자를 포함하는 알케닐기는 C2-C6 알케닐이고, 최대 5개의 탄소 원자를 포함하는 알케닐은 C2-C5 알케닐이다. C2-C5 알케닐은 C5 알케닐, C4 알케닐, C3 알케닐, 및 C2 알케닐을 포함한다. C2-C6 알케닐은 C2-C5 알케닐에 대해 전술한 모든 모이어티를 포함하지만, C6 알케닐도 포함한다. C2-C10 알케닐은 C2-C5 알케닐 및 C2-C6 알케닐에 대해 전술한 모든 모이어티를 포함하지만, C7, C8, C9, 및 C10 알케닐도 포함한다. 유사하게, C2-C12 알케닐은 전술한 모든 모이어티를 포함하지만, C11 및 C12 알케닐도 포함한다. C2-C12 알케닐의 비제한적인 예는 에테닐(비닐), 1-프로페닐, 2-프로페닐(알릴), 이소-프로페닐, 2-메틸-1-프로페닐, 1-부테닐, 2-부테닐, 3-부테닐, 1-펜테닐, 2-펜테닐, 3-펜테닐, 4-펜테닐, 1-헥세닐, 2-헥세닐, 3-헥세닐, 4-헥세닐, 5-헥세닐, 1-헵테닐, 2-헵테닐, 3-헵테닐, 4-헵테닐, 5-헵테닐, 6-헵테닐, 1-옥테닐, 2-옥테닐, 3-옥테닐, 4-옥테닐, 5-옥테닐, 6-옥테닐, 7-옥테닐, 1-노네닐, 2-노네닐, 3-노네닐, 4-노네닐, 5-노네닐, 6-노네닐, 7-노네닐, 8-노네닐, 1-데세닐, 2-데세닐, 3-데세닐, 4-데세닐, 5-데세닐, 6-데세닐, 7-데세닐, 8-데세닐, 9-데세닐, 1-운데세닐, 2-운데세닐, 3-운데세닐, 4-운데세닐, 5-운데세닐, 6-운데세닐, 7-운데세닐, 8-운데세닐, 9-운데세닐, 10-운데세닐, 1-도데세닐, 2-도데세닐, 3-도데세닐, 4-도데세닐, 5-도데세닐, 6-도데세닐, 7-도데세닐, 8-도데세닐, 9-도데세닐, 10-도데세닐, 및 11-도데세닐을 포함한다. 본 명세서에서 구체적으로 달리 언급되지 않는 한, 알킬기는 임의 치환될 수 있다.“Alkenyl,” “alkenyl chain,” or “alkenyl group” refers to a straight or branched hydrocarbon chain radical having 2 to 40 carbon atoms and one or more carbon-carbon double bonds. Each alkenyl group is attached to the rest of the molecule by a single bond. Alkenyl containing any number of carbon atoms from 2 to 40 is included. An alkenyl group containing up to 40 carbon atoms is C 2 -C 40 alkenyl, an alkenyl group containing up to 10 carbon atoms is C 2 -C 10 alkenyl, and an alkenyl group containing up to 6 carbon atoms. The group is C 2 -C 6 alkenyl, and alkenyl containing up to 5 carbon atoms is C 2 -C 5 alkenyl. C 2 -C 5 alkenyl includes C 5 alkenyl, C 4 alkenyl, C 3 alkenyl, and C 2 alkenyl. C 2 -C 6 alkenyl includes all moieties previously described for C 2 -C 5 alkenyl, but also includes C 6 alkenyl. C 2 -C 10 alkenyl includes all moieties previously described for C 2 -C 5 alkenyl and C 2 -C 6 alkenyl, but also includes C 7 , C 8 , C 9 , and C 10 alkenyl. do. Similarly, C 2 -C 12 alkenyl includes all moieties described above, but also includes C 11 and C 12 alkenyl. Non-limiting examples of C 2 -C 12 alkenyl include ethenyl (vinyl), 1-propenyl, 2-propenyl (allyl), iso-propenyl, 2-methyl-1-propenyl, 1-butenyl. , 2-butenyl, 3-butenyl, 1-pentenyl, 2-pentenyl, 3-pentenyl, 4-pentenyl, 1-hexenyl, 2-hexenyl, 3-hexenyl, 4-hexenyl , 5-hexenyl, 1-heptenyl, 2-heptenyl, 3-heptenyl, 4-heptenyl, 5-heptenyl, 6-heptenyl, 1-octenyl, 2-octenyl, 3-octenyl , 4-octenyl, 5-octenyl, 6-octenyl, 7-octenyl, 1-nonenyl, 2-nonenyl, 3-nonenyl, 4-nonenyl, 5-nonenyl, 6-nonenyl , 7-nonenyl, 8-nonenyl, 1-decenyl, 2-decenyl, 3-decenyl, 4-decenyl, 5-decenyl, 6-decenyl, 7-decenyl, 8-decenyl , 9-undecenyl, 1-undecenyl, 2-undecenyl, 3-undecenyl, 4-undecenyl, 5-undecenyl, 6-undecenyl, 7-undecenyl, 8-undecenyl, 9-undecenyl , 10-undecenyl, 1-dodecenyl, 2-dodecenyl, 3-dodecenyl, 4-dodecenyl, 5-dodecenyl, 6-dodecenyl, 7-dodecenyl, 8-dodecenyl, 9-dodecenyl , 10-dodecenyl, and 11-dodecenyl. Unless specifically stated otherwise in the specification, an alkyl group may be optionally substituted.

“알케닐렌”, “알케닐렌 사슬”, 또는 “알케닐렌기”는 2개 내지 40개의 탄소 원자를 갖고 하나 이상의 탄소-탄소 이중 결합을 갖는 직선형 또는 분지형 2가 탄화수소 사슬 라디칼을 지칭한다. C2-C40 알케닐렌의 비제한적인 예는 에텐, 프로펜, 부텐 등을 포함한다. 본 명세서에서 구체적으로 달리 언급되지 않는 한, 알케닐렌 사슬은 임의일 수 있다.“Alkenylene,” “alkenylene chain,” or “alkenylene group” refers to a straight or branched divalent hydrocarbon chain radical having 2 to 40 carbon atoms and one or more carbon-carbon double bonds. Non-limiting examples of C 2 -C 40 alkenylene include ethene, propene, butene, and the like. Unless specifically stated otherwise in the specification, the alkenylene chain may be arbitrary.

“알콕시” 또는 “알콕시기”는 -OR 기를 지칭하며, 여기서 R은 본원에서 정의된 바와 같은 알킬, 알케닐, 알키닐, 시클로알킬, 또는 헤테로시클릴이다. 본 명세서에서 구체적으로 달리 언급되지 않는 한, 알콕시기는 임의 치환될 수 있다.“Alkoxy” or “alkoxy group” refers to the group -OR, where R is alkyl, alkenyl, alkynyl, cycloalkyl, or heterocyclyl as defined herein. Unless specifically stated otherwise in the specification, an alkoxy group may be optionally substituted.

“아실” 또는 “아실기”는 -C(O)R 기를 지칭하며, 여기서 R은 본원에서 정의된 바와 같은 수소, 알킬, 알케닐, 알키닐, 카르보시클릴, 또는 헤테로시클릴이다. 본 명세서에서 구체적으로 달리 언급되지 않는 한, 아실은 임의 치환될 수 있다.“Acyl” or “acyl group” refers to the group -C(O)R, where R is hydrogen, alkyl, alkenyl, alkynyl, carbocyclyl, or heterocyclyl as defined herein. Unless specifically stated otherwise in the specification, acyl may be optionally substituted.

“알킬카르바모일” 또는 “알킬카르바모일기”는 -O-C(O)-NRaRb 기를 지칭하며, 여기서 Ra Rb는 동일하거나 상이하고, 독립적으로 본원에서 정의된 바와 같은 알킬, 알케닐, 알키닐, 아릴, 헤테로아릴이거나, RaRb가 합쳐져 본원에서 정의된 바와 같은 시클로알킬기 또는 헤테로시클릴기를 형성할 수 있다. 본 명세서에서 구체적으로 달리 언급되지 않는 한, 알킬카르바모일기는 임의 치환될 수 있다.“Alkylcarbamoyl” or “alkylcarbamoyl group” refers to the group -OC(O)-NR a R b , where R a and R b is the same or different and is independently alkyl, alkenyl, alkynyl, aryl, heteroaryl as defined herein, or R a R b taken together to form a cycloalkyl group or heterocyclyl group as defined herein can do. Unless specifically stated otherwise in the specification, an alkylcarbamoyl group may be optionally substituted.

“알킬카르복스아미딜” 또는 “알킬복스아미딜기”는 -C(O)-NRaRb 기를 지칭하며, 여기서 Ra Rb는 동일하거나 상이하고, 독립적으로 본원에서 정의된 바와 같은 알킬, 알케닐, 알키닐, 아릴, 헤테로아릴, 시클로알킬, 시클로알케닐, 시클로알키닐, 또는 헤테로시클릴기이거나, RaRb가 합쳐져 본원에서 정의된 바와 같은 시클로알킬기를 형성할 수 있다. 본 명세서에서 구체적으로 달리 언급되지 않는 한, 알킬카르복스아미딜기는 임의 치환될 수 있다.“Alkylcarboxamidyl” or “alkylboxamidyl group” refers to the group -C(O)-NR a R b , where R a and R b is the same or different and, independently, is an alkyl, alkenyl, alkynyl, aryl, heteroaryl, cycloalkyl, cycloalkenyl, cycloalkynyl, or heterocyclyl group as defined herein, or R a R b may be combined to form a cycloalkyl group as defined herein. Unless specifically stated otherwise in the specification, an alkylcarboxamidyl group may be optionally substituted.

“아릴”은 수소, 6 내지 18개의 탄소 원자, 및 적어도 하나의 방향족 고리를 포함하는 탄화수소 고리 시스템 라디칼을 지칭한다. 본 발명의 목적을 위해, 아릴 라디칼은 단환, 이환, 삼환, 또는 사환 고리 시스템일 수 있으며, 융합되거나 가교된 고리 시스템을 포함할 수 있다. 아릴 라디칼은 아세안트릴렌, 아세나프틸렌, 아세페난트릴렌, 안트라센, 아줄렌, 벤젠, 크리센, 플루오르안텐, 플루오렌, as-인다센, s-인다센, 인단, 인덴, 나프탈렌, 페날렌, 페난트렌, 플리아덴, 피렌, 및 트리페닐렌으로부터 유래된 아릴 라디칼을 포함하지만, 이에 한정되지 않는다. 본 명세서에서 구체적으로 달리 언급되지 않는 한, 용어 “아릴”은 임의 치환된 아릴 라디칼을 포함하는 것을 의미한다.“Aryl” refers to a hydrocarbon ring system radical containing hydrogen, 6 to 18 carbon atoms, and at least one aromatic ring. For the purposes of the present invention, aryl radicals may be mono-, bi-, tri-, or tetra-cyclic ring systems and may include fused or bridged ring systems. Aryl radicals include aceanthrylene, acenaphthylene, acephenanthrylene, anthracene, azulene, benzene, chrysene, fluoranthene, fluorene, as -indacene, s -indacene, indane, indene, naphthalene, and phenalene. , phenanthrene, pliaden, pyrene, and triphenylene. Unless specifically stated otherwise in this specification, the term “aryl” is meant to include optionally substituted aryl radicals.

“헤테로아릴”은 수소 원자, 1 내지 13개의 탄소 원자, 질소, 산소, 및 황으로부터 선택된 1 내지 6개의 헤테로원자, 및 적어도 하나의 방향족 고리를 포함하는 5원 내지 20원 고리 시스템 라디칼을 지칭한다. 본 발명의 목적을 위해, 헤테로아릴 라디칼은 융합되거나 가교된 고리 시스템을 포함할 수 있는 단환, 이환, 삼환, 또는 사환 고리 시스템일 수 있고; 헤테로아릴 라디칼 내의 질소, 탄소, 또는 황 원자는 임의로 산화될 수 있고; 질소 원자는 임의로 사차화될 수 있다. 예로는 아제피닐, 아크리디닐, 벤즈이미다졸릴, 벤조티아졸릴, 벤즈인돌릴, 벤조디옥솔릴, 벤조푸라닐, 벤조옥사졸릴, 벤조티아졸릴, 벤조티아디아졸릴, 벤조[b][1,4]디옥세피닐, 1,4-벤조디옥사닐, 벤조나프토푸라닐, 벤조옥사졸릴, 벤조디옥솔릴, 벤조디옥시닐, 벤조피라닐, 벤조피라노닐, 벤조푸라닐, 벤조푸라노닐, 벤조티에닐 (벤조티오페닐), 벤조트리아졸릴, 벤조[4,6]이미다조[1,2-a]피리디닐, 카르바졸릴, 신놀리닐, 디벤조푸라닐, 디벤조티오페닐, 푸라닐, 푸라노닐, 이소티아졸릴, 이미다졸릴, 인다졸릴, 인돌릴, 인다졸릴, 이소인돌릴, 인돌리닐, 이소인돌리닐, 이소퀴놀릴, 인돌리지닐, 이속사졸릴, 나프티리디닐, 옥사디아졸릴, 2-옥소아제피닐, 옥사졸릴, 옥시라닐, 1-옥시도피리디닐, 1-옥시도피리미디닐, 1-옥시도피라지닐, 1-옥시도피리다지닐, 1-페닐-1H-피롤릴, 페나지닐, 페노티아지닐, 페녹사지닐, 프탈라지닐, 프테리디닐, 퓨리닐, 피롤릴, 피라졸릴, 피리디닐, 피라지닐, 피리미디닐, 피리다지닐, 퀴나졸리닐, 퀴녹살리닐, 퀴놀리닐, 퀴누클리디닐, 이소퀴놀리닐, 테트라하이드로퀴놀리닐, 티아졸릴, 티아디아졸릴, 트리아졸릴, 테트라졸릴, 트리아지닐, 및 티오페닐(즉, 티에닐)을 포함하지만 이에 한정되지는 않는다. 본 명세서에서 구체적으로 달리 언급되지 않는 한, 헤테로아릴기는 임의 치환될 수 있다.“Heteroaryl” refers to a 5- to 20-membered ring system radical comprising a hydrogen atom, 1 to 13 carbon atoms, 1 to 6 heteroatoms selected from nitrogen, oxygen, and sulfur, and at least one aromatic ring. . For the purposes of the present invention, a heteroaryl radical may be a monocyclic, bicyclic, tricyclic, or tetracyclic ring system, which may include fused or bridged ring systems; The nitrogen, carbon, or sulfur atoms in the heteroaryl radical may be optionally oxidized; The nitrogen atom may be arbitrarily quaternized. Examples include azepinyl, acridinyl, benzimidazolyl, benzothiazolyl, benzindolyl, benzodioxolyl, benzofuranyl, benzoxazolyl, benzothiazolyl, benzothiadiazolyl, benzo[ b ][1 ,4]dioxepinyl, 1,4-benzodioxanyl, benzonaphthofuranyl, benzoxazolyl, benzodioxolyl, benzodioxynyl, benzopyranyl, benzopyranonyl, benzofuranyl, benzofura Nonyl, benzothienyl (benzothiophenyl), benzotriazolyl, benzo[4,6]imidazo[1,2-a]pyridinyl, carbazolyl, cinnolinyl, dibenzofuranyl, dibenzothiophenyl , furanyl, furanonyl, isothiazolyl, imidazolyl, indazolyl, indolyl, indazolyl, isoindolyl, indolinyl, isoindolinyl, isoquinolyl, indolizinyl, isoxazolyl, naphthyridi Nyl, oxadiazolyl, 2-oxoazepinyl, oxazolyl, oxiranyl, 1-oxidopyridinyl, 1-oxidopyrimidinyl, 1-oxidopyrazinyl, 1-oxidopyridazinyl, 1- Phenyl-1 H -pyrrolyl, phenazinyl, phenothiazinyl, phenoxazinyl, phthalazinyl, pteridinyl, purinyl, pyrrolyl, pyrazolyl, pyridinyl, pyrazinyl, pyrimidinyl, pyridazinyl, Quinazolinyl, quinoxalinyl, quinolinyl, quinuclidinyl, isoquinolinyl, tetrahydroquinolinyl, thiazolyl, thiadiazolyl, triazolyl, tetrazolyl, triazinyl, and thiophenyl (i.e., thiophenyl) including, but not limited to, Neal). Unless specifically stated otherwise in the specification, heteroaryl groups may be optionally substituted.

본원에서 사용되는 용어 “치환된”은 상기 기(즉, 알킬, 알케닐, 알키닐, 시클로알킬, 시클로알케닐, 시클로알키닐, 헤테로시클릴, 아릴, 헤테로아릴, 알콕시, 아릴옥시, 아실, 알킬카르바모일, 알킬카르복스아미딜, 알콕시카르보닐, 알킬티오, 또는 아릴티오) 중 어느 하나의 적어도 하나의 원자가 다음과 같은 그러나 이에 한정되지 않는 비수소 원자에 의해 대체된 것을 의미한다: F, Cl, Br, 및 I와 같은 할로겐 원자; 하이드록실기, 알콕시기, 및 에스테르기와 같은 기 내의 산소 원자; 티올기, 티오알킬기, 설폰기, 설포닐기, 및 설폭시드기와 같은 기 내의 황 원자; 아민, 아미드, 알킬아민, 디알킬아민, 아릴아민, 알킬아릴아민, 디아릴아민, N-산화물, 이미드, 및 엔아민과 같은 기 내의 질소 원자; 트리알킬실릴기, 디알킬아릴실릴기, 알킬디아릴실릴기, 및 트리아릴실릴기와 같은 기 내의 규소 원자; 및 다양한 다른 기 내의 다른 헤테로원자. “치환된”은 또한, 상기 기 중 어느 하나의 하나 이상의 원자가 다음과 같은 헤테로원자에 대한 고차 결합(예: 이중 결합 또는 삼중 결합)에 의해 대체된 것을 의미한다: 옥소, 카르보닐, 카르복실, 및 에스테르 기 내의 산소; 및 이민, 옥심, 하이드라존, 및 니트릴과 같은 기 내의 질소. 예를 들어, “치환된”은 상기 기 중 어느 하나의 하나 이상의 원자가 -NRgRh, -NRgC(=O)Rh, -NRgC(=O)NRgRh, -NRgC(=O)ORh, -NRgSO2Rh, -OC(=O)NRgRh, -ORg, -SRg, -SORg, -SO2Rg, -OSO2Rg, -SO2ORg, =NSO2Rg, 및 -SO2NRgRh로 대체된 것을 포함한다. “치환된”은 또한, 상기 기 중 어느 하나의 하나 이상의 수소 원자가 -C(=O)Rg, -C(=O)ORg, -C(=O)NRgRh, -CH2SO2Rg, -CH2SO2NRgRh로 대체된 것을 의미한다. 전술한 것들 중, Rg 및 Rh는 동일하거나 상이하고 독립적으로 수소, 알킬, 알케닐, 알키닐, 알콕시, 알킬아미노, 티오알킬, 아릴, 아랄킬, 시클로알킬, 시클로알케닐, 시클로알키닐, 시클로알킬알킬, 할로알킬, 할로알케닐, 할로알키닐, 헤테로시클릴, N-헤테로시클릴, 헤테로시클릴알킬, 헤테로아릴, N-헤테로아릴, 및/또는 헤테로아릴알킬이다. 추가로, “치환된”은 상기 기 중 어느 하나의 하나 이상의 원자가 아미노, 시아노, 하이드록실, 이미노, 니트로, 옥소, 티옥소, 할로, 알킬, 알케닐, 알키닐, 알콕시, 알킬아미노, 티오알킬, 아릴, 아랄킬, 시클로알킬, 시클로알케닐, 시클로알키닐, 시클로알킬, 할로알킬, 할로알케닐, 할로알키닐, 헤테로시클릴, N-헤테로시클릴, 헤테로시클릴알킬, 헤테로아릴, N-헤테로아릴, 및/또는 헤테로아릴알킬기로 대체된 것을 의미한다. “치환된”은 아미노산의 측쇄 상의 하나 이상의 원자가 알킬, 알케닐, 알키닐, 아실, 알킬카르복스아미딜, 알콕시카르보닐, 카르보시클릴, 헤테로시클릴, 아릴, 또는 헤테로아릴로 대체된 것을 의미할 수도 있다. 또한, 전술한 치환기 각각은 상기 치환기 중 하나 이상으로 임의 치환될 수도 있다.As used herein, the term “substituted” refers to any of the following groups (i.e., alkyl, alkenyl, alkynyl, cycloalkyl, cycloalkenyl, cycloalkynyl, heterocyclyl, aryl, heteroaryl, alkoxy, aryloxy, acyl, means that at least one atom of any one of alkylcarbamoyl, alkylcarboxamidyl, alkoxycarbonyl, alkylthio, or arylthio) is replaced by a non-hydrogen atom such as, but not limited to: F halogen atoms such as , Cl, Br, and I; oxygen atoms in groups such as hydroxyl groups, alkoxy groups, and ester groups; sulfur atoms in groups such as thiol groups, thioalkyl groups, sulfone groups, sulfonyl groups, and sulfoxide groups; nitrogen atoms in groups such as amines, amides, alkylamines, dialkylamines, arylamines, alkylarylamines, diarylamines, N-oxides, imides, and enamines; Silicon atoms in groups such as trialkylsilyl group, dialkylarylsilyl group, alkyldiarylsilyl group, and trialylsilyl group; and other heteroatoms within various other groups. “Substituted” also means that one or more atoms of any of the above groups are replaced by a higher bond (e.g. a double or triple bond) to a heteroatom such as: oxo, carbonyl, carboxyl, and oxygen in the ester group; and nitrogen in groups such as imines, oximes, hydrazones, and nitriles. For example, “substituted” means that one or more atoms of any of the above groups are -NR g R h , -NR g C(=O)R h , -NR g C(=O)NR g R h , -NR g C(=O)OR h , -NR g SO 2 R h , -OC(=O)NR g R h , -OR g , -SR g , -SOR g , -SO 2 R g , -OSO 2 R g , -SO 2 OR g , =NSO 2 R g , and -SO 2 NR g R h . “Substituted” also means that one or more hydrogen atoms of any of the above groups are -C(=O)R g , -C(=O)OR g , -C(=O)NR g R h , -CH 2 SO 2 R g , -CH 2 SO 2 NR g R h means replaced. Among the foregoing, R g and R h are the same or different and independently hydrogen, alkyl, alkenyl, alkynyl, alkoxy, alkylamino, thioalkyl, aryl, aralkyl, cycloalkyl, cycloalkenyl, cycloalkynyl. , cycloalkylalkyl, haloalkyl, haloalkenyl, haloalkynyl, heterocyclyl, N -heterocyclyl, heterocyclylalkyl, heteroaryl, N -heteroaryl, and/or heteroarylalkyl. Additionally, “substituted” means that one or more atoms of any of the above groups are amino, cyano, hydroxyl, imino, nitro, oxo, thioxo, halo, alkyl, alkenyl, alkynyl, alkoxy, alkylamino, Thioalkyl, aryl, aralkyl, cycloalkyl, cycloalkenyl, cycloalkynyl, cycloalkyl, haloalkyl, haloalkenyl, haloalkynyl, heterocyclyl, N -heterocyclyl, heterocyclylalkyl, heteroaryl , N -heteroaryl, and/or heteroarylalkyl group. “Substituted” means that one or more atoms on the side chain of an amino acid are replaced with alkyl, alkenyl, alkynyl, acyl, alkylcarboxamidyl, alkoxycarbonyl, carbocyclyl, heterocyclyl, aryl, or heteroaryl. You may. Additionally, each of the above-described substituents may be optionally substituted with one or more of the above substituents.

본원에서 사용되는 바와 같이, 심볼 “”(이하 “부착점 결합”으로 지칭될 수 있음)는 2개의 화학적 엔티티 사이의 부착점인 결합을 나타내며, 2개의 화학적 엔티티 중 하나는 부착점 결합에 부착되는 것으로 도시되고 다른 하나는 부착점 결합에 부착되는 것으로 도시되지 않는다. 예를 들어, “”는 화학적 엔티티 “XY”가 부착점 결합을 통해 다른 화학적 엔티티에 결합되는 것을 나타낸다. 또한, 도시되지 않은 화학적 엔티티에 대한 특정 부착점은 추론에 의해 특정될 수 있다. 예를 들어, R3이 H 또는 “”인 화합물 CH3-R3은, R3이 “XY”인 경우, 부착점 결합이 R3이 CH3에 결합되는 것으로 도시된 결합과 동일한 결합인 것으로 추론한다.As used herein, the symbol “ ” (which may hereinafter be referred to as a “point of attachment bond”) refers to a bond that is the point of attachment between two chemical entities, where one of the two chemical entities is shown attached to the point of attachment bond and the other is shown as being attached to the point of attachment bond. It is not shown as being attached to. for example, " ” indicates that the chemical entity “XY” is bonded to another chemical entity through a point of attachment bond. Additionally, specific points of attachment to chemical entities not shown may be specified by inference. For example, if R 3 is H or “ "For the compound CH 3 -R 3 , when R 3 is "XY", it is inferred that the point of attachment bond is the same bond as the bond where R 3 is shown bonded to CH 3 .

본원에서 사용되는 바와 같이, “대상체”은 개체를 의미한다. 따라서, “대상체”는 가축(예: 고양이, 개 등), 농장 가축(예: 소, 말, 돼지, 양, 염소 등), 실험실 동물(예: 마우스, 토끼, 랫트, 기니피그 등), 및 조류를 포함할 수 있다. “대상체”은 영장류 또는 인간과 같은 포유동물을 포함할 수도 있다. 따라서, 대상체는 인간 또는 수의과 환자일 수 있다. 용어 “환자”는 임상의, 예를 들어 의사의 치료를 받고 있는 대상체를 지칭한다.As used herein, “subject” means an individual. Accordingly, “subjects” include livestock (e.g., cats, dogs, etc.), farm animals (e.g., cows, horses, pigs, sheep, goats, etc.), laboratory animals (e.g., mice, rabbits, rats, guinea pigs, etc.), and birds. may include. “Subject” may also include mammals, such as primates or humans. Accordingly, the subject may be a human or veterinary patient. The term “patient” refers to a subject undergoing treatment by a clinician, e.g., a physician.

용어 “억제(inhibit, inhibiting, 또는 inhibition)”는 활성, 발현, 기능, 또는 다른 생물학적 파라미터의 감소를 지칭하며, 활성, 발현, 기능, 또는 다른 생물학적 파라미터의 완전한 제거를 포함할 수 있지만, 이를 필요로 하지는 않는다. 억제는 대조군과 비교했을 때 활성, 반응, 병태, 또는 질환의 감소, 예를 들어 적어도 약 10%의 감소를 포함할 수 있다. 구현예에서, 유전자 또는 단백질의 발현, 활성, 또는 기능은 통계적으로 유의한 양만큼 감소된다. 구현예에서, 활성 또는 기능은 적어도 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 및 최대 약 60%, 약 70%, 약 80%, 약 90%, 또는 약 100%만큼 감소된다. The term “inhibit, inhibiting, or inhibition” refers to a decrease in activity, expression, function, or other biological parameter, which may include, but is not required to completely eliminate, the activity, expression, function, or other biological parameter. Do not do so. Inhibition may include a reduction in activity, response, pathology, or disease, e.g., a reduction of at least about 10%, as compared to a control. In embodiments, the expression, activity, or function of a gene or protein is reduced by a statistically significant amount. In embodiments, the activity or function is at least about 10%, about 20%, about 30%, about 40%, about 50%, and up to about 60%, about 70%, about 80%, about 90%, or about 100%. It is reduced by %.

“감소(reduce, reducing, 또는 reduction)”는 이베트 또는 특징(예: 종양 성장)을 저하시키는 것을 의미한다. 이는 통상적으로 일부 표준 또는 예상 값과 관련되고, 달리 말하자면 이는 상대적이지만, 표준 또는 상대 값을 항상 언급하지는 않다도 된다는 것을 이해할 것이다. 예를 들어, “종양 성장을 감소시키는”은 표준 또는 대조군(예를 들어, 미치료 종양)에 비해 종양의 성장 속도를 감소시키는 것을 의미한다.“Reduce, reduce, or reduce” means to slow down an event or characteristic (e.g., tumor growth). This usually relates to some standard or expected value, in other words it is relative, but it will be understood that it is not always necessary to refer to a standard or relative value. For example, “reducing tumor growth” means reducing the growth rate of a tumor compared to a standard or control group (e.g., an untreated tumor).

본원에서 사용되는 바와 같이, “치료(treat, treating, treatment)” 및 이의 다른 표현은 본원에 기술된 바와 같은 질환을 부분적으로 또는 완전히 완화, 개선, 경감, 억제하거나, 이의 발병을 지연시키거나, 이의 중증도를 감소시키고/시키거나, 이의 하나 이상의 증상 또는 특징의 발생을 감소시키는, 개시된 화합물의 임의의 투여를 지칭한다. 환자와 관련하여, 용어 “치료”는 질환, 병리학적 상태, 또는 장애를 치유, 개선, 안정화, 또는 예방하기 위한 의도로 환자의 의학적으로 관리하는 것을 지칭한다. 이 용어는 적극적 치료, 즉 질환, 병리학적 상태, 또는 장애의 개선을 특이적으로 지향하는 치료를 포함하고, 인과적 치료, 즉 연관된 질환, 병리학적 상태, 또는 장애의 원인의 제거를 지향하는 치료도 포함한다. 또한, 이 용어는 완화 치료, 즉 질환, 병리학적 상태, 또는 장애의 치유보다는 증상의 완화를 위해 설계된 치료; 예방 치료, 즉 연관된 질환, 병리학적 상태, 또는 장애의 발생을 최소화하거나 부분적으로 또는 완전히 억제하는 것을 지향하는 치료; 및 보조 치료, 즉 연관 질환, 병리학적 상태, 또는 장애의 개선을 지향하는 또 다른 특정 요법을 보충하기 위해 사용되는 치료를 포함한다.As used herein, “treat, treating, treatment” and other expressions thereof mean partially or completely alleviating, ameliorating, alleviating, suppressing, delaying the onset of, or delaying the onset of a condition as described herein; Refers to any administration of a disclosed compound that reduces the severity thereof and/or reduces the occurrence of one or more symptoms or characteristics thereof. With respect to a patient, the term “treatment” refers to the medical management of a patient with the intent to cure, improve, stabilize, or prevent a disease, pathological condition, or disorder. The term includes active treatment, i.e. treatment specifically directed at improving the disease, pathological condition, or disorder, and causal treatment, i.e. treatment directed at eliminating the cause of the associated disease, pathological condition, or disorder. Also includes. Additionally, the term refers to palliative care, i.e., treatment designed to relieve symptoms rather than cure a disease, pathological condition, or disorder; Preventive treatment, i.e. treatment aimed at minimizing or partially or completely suppressing the occurrence of an associated disease, pathological condition, or disorder; and adjuvant treatment, i.e., treatment used to supplement another specific therapy aimed at improving an associated disease, pathological condition, or disorder.

용어 “치료적으로 유효한”은 개시된 화합물 및/또는 사용된 조성물의 양이 질환 또는 장애의 하나 이상의 원인 또는 증상을 완화시키기에 충분한 양임을 지칭한다. 이러한 개선은 다시 감소 또는 변경을 필요로 하는 것이며, 반드시 제거를 필요로 하는 것은 아니다.The term “therapeutically effective” refers to an amount of a disclosed compound and/or composition used in an amount sufficient to alleviate one or more causes or symptoms of a disease or disorder. These improvements again require reduction or modification, not necessarily elimination.

용어 “약학적으로 허용 가능한(pharmaceutically acceptable)”은 이들 화합물, 물질, 조성물, 및/또는 투여 형태가 건전한 의학적 판단의 범위 내에서, 과도한 독성, 자극, 알레르기 반응 또는 다른 문제, 또는 합병증 없이 인간 및/또는 동물의 조직과 접촉하여 사용하기에 적합하고, 합리적인 이익/위험 비율에 상응함은 의미한다.The term “pharmaceutically acceptable” means that these compounds, substances, compositions, and/or dosage forms are suitable for human use and use without undue toxicity, irritation, allergic reaction or other problems or complications, within the scope of sound medical judgment. /or suitable for use in contact with animal tissue and commensurate with a reasonable benefit/risk ratio.

용어 “담체”는 본 개시의 화합물 또는 조성물과 조합될 때, 이러한 화합물 또는 조성물의 의도된 용도 또는 목적에 맞는 제조, 보관, 투여, 전달, 효율성, 선택도, 또는 임의의 다른 특징에 도움을 주거나 이를 용이하게 하는 화합물, 조성물, 물질, 또는 구조, 또는 이의 조합을 의미한다. 예를 들어, 담체는 활성 성분의 임의의 분해를 최소화하고 대상체에서 임의의 부작용을 최소화하도록 선택될 수 있다.The term “carrier” means that, when combined with a compound or composition of the present disclosure, it aids in the manufacture, storage, administration, delivery, efficiency, selectivity, or any other characteristic of the compound or composition for its intended use or purpose. It refers to a compound, composition, material, or structure that facilitates this, or a combination thereof. For example, the carrier can be selected to minimize any degradation of the active ingredient and minimize any side effects in the subject.

본원에서 사용되는 바와 같이, 용어 “약학적으로 허용 가능한 담체”는 환자에게 투여하기에 적합한 담체를 지칭한다. 약학적 담체는 본 개시의 화합물 또는 조성물의 의도된 용도 또는 목적에 맞는 제조, 보관, 투여, 전달, 효율성, 선택도, 또는 임의의 다른 특징에 도움을 주거나 이를 용이하게 하는 물질일 수 있다. 예를 들어, 담체는 환자에서 화합물의 분해를 감소시키거나 부작용을 감소시키도록 선택될 수 있다. 구현예에서, 약학적으로 허용 가능한 담체는 멸균 수성 또는 비수성 용액, 분산액, 현탁액 또는 유화액뿐만 아니라 사용 직전에 멸균 주사 용액 또는 분산액으로 재구성하기 위한 멸균 분말일 수 있다. 적합한 수성 및 비수성 담체, 희석제, 용매, 또는 비히클의 예는 물, 에탄올, 폴리올(예컨대 글리세롤, 프로필렌 글리콜, 폴리에틸렌 글리콜 등), 카르복시메틸셀룰로오스 및 이들의 적절한 혼합물, 식물성 오일(예컨대 올리브 오일) 및 주사식 유기 에스테르, 예컨대 에틸 올레에이트를 포함한다. 적절한 유동성은 레시틴과 같은 코딩 물질을 사용함으로써, 분산액의 경우 요구되는 입자 크기를 유지함으로써, 및 계면활성제를 사용함으로써 유지될 수 있다. 이들 조성물은 보존제, 습윤제, 유화제, 및 분산제와 같은 보조제를 함유할 수도 있다. 미생물의 작용을 방지하는 것은 파라벤, 클로로부탄올, 페놀, 소르브산 등과 같은 다양한 항균제 및 항진균제를 포함시킴으로써 보장될 수 있다. 당류, 염화나트륨 등과 같은 등장화제를 포함하는 것이 바람직할 수도 있다. 주사 가능 제형은, 예를 들어 세균 보유 필터를 통한 여과에 의해, 또는 사용 직전에 멸균수 또는 다른 멸균 주사 가능 매질에 용해되거나 분산될 수 있는 멸균 고형 조성물의 형태로 멸균제를 혼입함으로써 멸균될 수 있다. 적절한 불활성 담체는 락토오스와 같은 당류를 포함할 수 있다.As used herein, the term “pharmaceutically acceptable carrier” refers to a carrier suitable for administration to a patient. A pharmaceutical carrier may be a substance that aids or facilitates the manufacture, storage, administration, delivery, efficiency, selectivity, or any other characteristic of the compound or composition of the present disclosure for its intended use or purpose. For example, the carrier may be selected to reduce degradation of the compound in the patient or reduce side effects. In embodiments, pharmaceutically acceptable carriers may be sterile aqueous or non-aqueous solutions, dispersions, suspensions or emulsions, as well as sterile powders for reconstitution into sterile injectable solutions or dispersions immediately prior to use. Examples of suitable aqueous and non-aqueous carriers, diluents, solvents, or vehicles include water, ethanol, polyols (such as glycerol, propylene glycol, polyethylene glycol, etc.), carboxymethylcellulose and suitable mixtures thereof, vegetable oils (such as olive oil), and Injectable organic esters such as ethyl oleate. Adequate fluidity can be maintained by using coating materials such as lecithin, by maintaining the required particle size in the case of dispersions, and by using surfactants. These compositions may contain adjuvants such as preservatives, wetting agents, emulsifying agents, and dispersing agents. Prevention of the action of microorganisms can be ensured by the inclusion of various antibacterial and antifungal agents such as parabens, chlorobutanol, phenol, sorbic acid, etc. It may be desirable to include isotonic agents such as sugars, sodium chloride, etc. Injectable formulations may be sterilized, for example, by filtration through a bacteria-retaining filter, or by incorporating a sterilizing agent in the form of a sterile solid composition that can be dissolved or dispersed in sterile water or other sterile injectable medium immediately before use. there is. Suitable inert carriers may include sugars such as lactose.

용어 “약학적으로 허용 가능한 염”은 염기로서 기능하는 활성 화합물을 무기 또는 유기산과 반응시켜 염, 예를 들어 염산, 황산, 인산, 메탄설폰산, 캄포설폰산, 옥살산, 말레산, 숙신산, 구연산, 포름산, 브롬산, 벤조산, 타르타르산, 푸마르산, 살리실산, 만델산, 탄소산 등의 염을 형성함으로써 수득되는 것들을 포함한다. 당업자는 다수의 공지된 방법 중 어느 하나를 통해 화합물을 적절한 무기산 또는 유기산과 반응시킴으로써 산 부가염을 제조할 수 있다는 것을 추가로 인식할 것이다. 용어 “약학적으로 허용 가능한 염”은 산으로서 작용하는 활성 화합물을 무기 또는 유기 염기와 반응시켜 염, 예를 들어 에틸렌디아민, N-메틸-글루카민, 리신, 아르기닌, 오르니틴, 콜린, N,N'-디벤질에틸렌디아민, 클로로프로카인, 디에탄올아민, 프로카인, N-벤질펜에틸아민, 디에틸아민, 피페라진, 트리스-(하이드록시메틸)-아미노메탄, 수산화테트라메틸암모늄, 트리에틸아민, 디벤질아민, 에펜아민, 데하이드로아비에틸아민, N-에틸피페리딘, 벤질아민, 테트라메틸암모늄, 테트라에틸암모늄, 메틸아민, 디메틸아민, 트리메틸아민, 에틸아민, 염기성 아미노산 등을 형성함으로써 수득된 것들을 또한 포함한다. 무기 또는 금속 염의 비제한적인 예는 리튬, 나트륨, 칼슘, 칼륨, 마그네슘 염 등을 포함한다.The term “pharmaceutically acceptable salt” refers to salts obtained by reacting the active compound, which functions as a base, with an inorganic or organic acid, such as hydrochloric acid, sulfuric acid, phosphoric acid, methanesulfonic acid, camphorsulfonic acid, oxalic acid, maleic acid, succinic acid, citric acid. , formic acid, hydrobromic acid, benzoic acid, tartaric acid, fumaric acid, salicylic acid, mandelic acid, carbonic acid, etc., which are obtained by forming salts. Those skilled in the art will further recognize that acid addition salts may be prepared by reacting the compound with an appropriate inorganic or organic acid via any of a number of known methods. The term “pharmaceutically acceptable salt” refers to the reaction of the active compound, which acts as an acid, with an inorganic or organic base to form a salt, for example ethylenediamine, N-methyl-glucamine, lysine, arginine, ornithine, choline, N, N'-dibenzylethylenediamine, chloroprocaine, diethanolamine, procaine, N-benzylphenethylamine, diethylamine, piperazine, tris-(hydroxymethyl)-aminomethane, tetramethylammonium hydroxide, trimethylamine Ethylamine, dibenzylamine, ephenamine, dehydroabiethylamine, N-ethylpiperidine, benzylamine, tetramethylammonium, tetraethylammonium, methylamine, dimethylamine, trimethylamine, ethylamine, basic amino acids, etc. Also includes those obtained by forming. Non-limiting examples of inorganic or metal salts include lithium, sodium, calcium, potassium, magnesium salts, etc.

본원에서 사용되는 바와 같이, 용어 “비경구 투여”는 주사 또는 주입을 통한 투여를 지칭한다. 비경구 투여는 피하 투여, 정맥내 투여, 또는 근육내 투여를 포함하지만, 이에 한정되지 않는다.As used herein, the term “parenteral administration” refers to administration via injection or infusion. Parenteral administration includes, but is not limited to, subcutaneous administration, intravenous administration, or intramuscular administration.

본원에서 사용되는 바와 같이, 용어 “피하 투여”는 피부 바로 아래에 투여하는 것을 지칭한다. “정맥 내 투여”는 정맥 내로 투여하는 것을 의미한다.As used herein, the term “subcutaneous administration” refers to administration just beneath the skin. “Intravenous administration” means administration within a vein.

본원에서 사용되는 바와 같이, 용어 “투여량”은 1회 투여로 제공되는 약학적 제제의 명시된 양을 지칭한다. 실시예에서, 투여량은 2회 이상의 볼루스, 정제, 또는 주사로 투여될 수 있다. 피하 투여가 바람직한 구현예에서, 바람직한 투여량은 1회 주사에 의해 쉽게 수용되지 않는 부피를 필요로 한다. 이러한 구현예에서, 바람직한 투여량을 달성하기 위해 2회 이상의 주사가 사용될 수 있다. 구현예에서, 투여량은 환자의 주사 부위 반응을 감소시키기 위해 2회 이상의 주사로 투여될 수 있다.As used herein, the term “dose” refers to a specified amount of pharmaceutical agent given in one administration. In embodiments, the dosage may be administered in two or more boluses, tablets, or injections. In embodiments where subcutaneous administration is preferred, the preferred dosage requires a volume that is not readily accommodated by a single injection. In this embodiment, two or more injections may be used to achieve the desired dosage. In embodiments, the dosage may be administered in two or more injections to reduce injection site reactions in the patient.

본원에서 사용되는 바와 같이, 용어 “투여 단위”는 약학적 제제가 제공되는 형태를 지칭한다. 구현예에서, 투여 단위는 본원에 기술된 동결건조된 화합물 또는 조성물을 포함하는 바이알이다. 구현예에서, 투여 단위는 본원에 기술된 재구성된 화합물 또는 조성물을 포함하는 바이알이다.As used herein, the term “dosage unit” refers to the form in which the pharmaceutical formulation is provided. In an embodiment, the dosage unit is a vial containing a lyophilized compound or composition described herein. In an embodiment, the dosage unit is a vial containing the reconstituted compound or composition described herein.

용어 “치료 모이어티”(TM)는 질환 또는 장애의 적어도 하나의 증상을 치료하는 데 사용될 수 있는 화합물을 지칭하며, 질환 또는 장애의 적어도 하나의 증상을 치료하는 데 사용될 수 있는 치료 폴리펩티드, 올리고뉴클레오티드, 소분자, 및 다른 제제를 포함할 수 있지만 이에 한정되지는 않는다. 구현예에서, TM은 표적 전사체의 활성, 발현, 및/또는 수준을 조절한다. 구현예에서, TM은 붕괴 메커니즘을 통해 표적 전사체의 수준을 감소시킨다. 구현예에서, 활성은 하나 이상의 단백질에 결합하는 (예를 들어, 격리시키는) 표적 전사체의 능력이다. 구현예에서, TM은 표적 전사체와 표적 전사체에 결합하는 하나 이상의 단백질 사이의 친화도를 감소시킴으로써 표적 전사체의 활성을 조절한다. 표적 전사체와 하나 이상의 단백질 사이의 친화도를 감소시킨 결과로서 하나 이상의 단백질의 활성이 조절될 수 있다. 예를 들어, 하나 이상의 단백질이 표적 전사체에 결합되지 않는 경우, 이들은, 예를 들어 다른 전사체의 스플라이싱, 대안적인 스플라이싱, 및/또는 엑손 스키핑을 용이하게 하는 것과 같은 이들의 기능을 수행할 수 있다. TM의 기능의 결과로서, 표적 전사체와의 상호작용이 TM에 의해 파괴되는 하나 이상의 단백질에 의해 조절되는 하류 유전자의 활성, 발현, 및/또는 수준이 조절될 수 있다.The term “therapeutic moiety” (TM) refers to a compound that can be used to treat at least one symptom of a disease or disorder, including a therapeutic polypeptide, oligonucleotide, or oligonucleotide that can be used to treat at least one symptom of a disease or disorder. , small molecules, and other agents. In embodiments, the TM modulates the activity, expression, and/or level of the target transcript. In embodiments, the TM reduces the level of the target transcript through a decay mechanism. In embodiments, activity is the ability of a target transcript to bind (e.g., sequester) one or more proteins. In embodiments, the TM modulates the activity of the target transcript by reducing the affinity between the target transcript and one or more proteins that bind to the target transcript. The activity of one or more proteins may be modulated as a result of reducing the affinity between the target transcript and one or more proteins. For example, if one or more proteins do not bind to a target transcript, they may alter their function, for example, to facilitate splicing of other transcripts, alternative splicing, and/or exon skipping. can be performed. As a result of the function of the TM, the activity, expression, and/or level of downstream genes whose interaction with the target transcript is regulated by one or more proteins disrupted by the TM may be modulated.

용어 “조절(modulate, modulating, 및 modulation)”은 조절 전의 발현, 기능, 또는 활성의 수준과 비교했을 때 발현, 기능, 또는 활성을 교란하는 것을 지칭한다. 조절은 발현, 기능, 또는 활성의 증가(자극 또는 유도) 또는 감소(억제 또는 감소)를 포함할 수 있다. 구현예에서, 표적 전사체의 활성이 조절된다. 구현예에서, 표적 전사체의 활성을 조절하는 것은 하나 이상의 단백질에 결합하는 표적 전사체의 능력을 감소시키는 것을 포함한다. 구현예에서, 표적 전사체와 하나 이상의 단백질 간의 친화도를 감소시키면 표적 전사체와 상호작용하는 하나 이상의 단백질의 활성이 조절된다. 예를 들어, 하나 이상의 단백질이 표적 전사체에 결합되지 않는 경우, 이들은, 예를 들어 다른 전사체(예: 하류 전사체)의 스플라이싱, 대안적인 스플라이싱, 및/또는 엑손 스키핑을 용이하게 하는 것과 같은 이들의 기능을 수행할 수 있다. 이와 같이, 표적 전사체의 활성을 조절하면 표적 전사체과의 상호작용이 파괴될 수 있는 하나 이상의 단백질에 의해 조절되는 하류 유전자의 활성, 발현, 및/또는 수준을 조절할 수 있다.The terms “modulate, modulating, and modulation” refer to perturbing expression, function, or activity compared to the level of expression, function, or activity prior to modulation. Modulation may include increasing (stimulating or inducing) or decreasing (inhibiting or reducing) expression, function, or activity. In embodiments, the activity of the target transcript is modulated. In an embodiment, modulating the activity of a target transcript includes reducing the ability of the target transcript to bind one or more proteins. In embodiments, reducing the affinity between a target transcript and one or more proteins modulates the activity of one or more proteins that interact with the target transcript. For example, if one or more proteins do not bind to a target transcript, they facilitate, for example, splicing of other transcripts (e.g., downstream transcripts), alternative splicing, and/or exon skipping. They can perform their functions such as: As such, modulating the activity of a target transcript can modulate the activity, expression, and/or level of downstream genes regulated by one or more proteins whose interaction with the target transcript can be disrupted.

“아미노산”은 아미노기 및 카르복시산기를 포함하고 일반식(식 중 R은 임의 유기 기일 수 있음)를 갖는 유기 화합물을 지칭한다. 아미노산은 자연 발생 아미노산 또는 비-자연 발생 아미노산일 수 있다. 아미노산은 단백질원성 아미노산 또는 비단백질원성 아미노산일 수 있다. 아미노산은 L-아미노산 또는 D- 아미노산일 수 있다. 용어 “아미노산 측쇄” 또는 “ 측쇄”는 천연 또는 비-천연 α-아미노산의 α-탄소에 결합된 특성화 치환기(“R”)를 지칭한다. 아미노산은 펩티드 결합을 통해 폴리펩티드에 혼입될 수 있다.“Amino acid” includes an amino group and a carboxylic acid group and has the general formula (wherein R may be any organic group). Amino acids may be naturally occurring amino acids or non-naturally occurring amino acids. Amino acids may be proteinogenic amino acids or non-proteinogenic amino acids. The amino acid may be an L-amino acid or a D-amino acid. The term “amino acid side chain” or “side chain” refers to a characterizing substituent (“R”) attached to the α-carbon of a natural or non-natural α-amino acid. Amino acids can be incorporated into polypeptides through peptide bonds.

본원에서 사용되는 바와 같이, “하전되지 않은” 아미노산은 pH 7.35 내지 7.45에서 순 중성 전하를 갖는 측쇄를 갖는 아미노산이다. 하전되지 않은 아미노산의 예는 글리신 및 시트룰린을 포함하지만, 이에 한정되지는 않는다.As used herein, an “uncharged” amino acid is an amino acid that has a side chain that has a net neutral charge at pH 7.35 to 7.45. Examples of uncharged amino acids include, but are not limited to, glycine and citrulline.

본원에서 사용되는 바와 같이, “하전된” 아미노산은 pH 7.35 내지 7.45에서 순 전하를 갖는 측쇄를 갖는 아미노산이다. 하전된 아미노산의 예는 아르기닌이다.As used herein, a “charged” amino acid is an amino acid that has a side chain that has a net charge at pH 7.35 to 7.45. An example of a charged amino acid is arginine.

본원에서 사용되는 바와 같이, 용어 “서열 동일성”은 동일하고 동일한 상대 위치에 있는 2개의 올리고뉴클레오티드 서열 또는 폴리펩티드 서열 사이의 핵산 또는 아미노산의 백분율을 각각 지칭한다. 이와 같이, 하나의 서열은 다른 서열과 비교하여 특정 백분율의 서열 동일성을 갖는다. 서열 비교를 위해, 일반적으로 시험 서열의 비교 대상이 되는 하나의 서열이 기준 서열의 역할을 한다. 당업자는, 2개의 서열이 상응하는 위치에 동일한 잔기를 함유하는 경우 이들이 일반적으로 “실질적으로 동일한” 것으로 간주된다는 것을 이해할 것이다. 구현예에서, 서열 간의 서열 동일성은 EMBOXX 패키지(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., Trends Genet.(2000), 16: 276-277)의 Needle 프로그램으로서 구현된 것과 같은 Needleman-Wunsch 알고리즘(Needleman 및 Wunsch의 문헌[1970, J. Mol. Biol.48: 443-453])을 출원일 현재 존재하는 버전으로 사용해 결정할 수 있다. 사용된 파라미터는 10의 갭 개방 페널티, 0.5의 갭 연장 페널티, 및 EBLOSUM62(BLOSUM62의 EMBOSS 버전) 치환 매트릭스이다. (-nobrief 옵션을 사용하여 획득된) “최장 동일성”으로 표지된 Needle의 결과가 동일성 백분율로서 사용되며, 이는 다음과 같이 계산된다: (동일 잔기×100)/(정렬 길이-정렬 시 갭의 총 수)As used herein, the term “sequence identity” refers to the percentage of nucleic acids or amino acids, respectively, between two oligonucleotide sequences or polypeptide sequences that are identical and in the same relative position. As such, one sequence has a certain percentage of sequence identity compared to another sequence. For sequence comparison, generally one sequence against which test sequences are compared serves as a reference sequence. Those skilled in the art will understand that two sequences are generally considered “substantially identical” if they contain identical residues at corresponding positions. In embodiments, sequence identity between sequences is determined using the EMBOXX package (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., Trends Genet. (2000), 16: 276-277) can be determined using the Needleman-Wunsch algorithm (Needleman and Wunsch, 1970 , J. Mol. Biol. 48: 443-453), in the version existing as of the filing date. there is. The parameters used are a gap opening penalty of 10, a gap extension penalty of 0.5, and an EBLOSUM62 (EMBOSS version of BLOSUM62) substitution matrix. The result of the Needle labeled “longest identity” (obtained using the -nobrief option) is used as the percent identity, which is calculated as follows: (identical residues × 100)/(alignment length - total number of gaps in the alignment) number)

다른 구현예에서, 서열 동일성은 Smith-Waterman 알고리즘 출원일 현재 존재하는 버전으로 사용하여 결정할 수 있다.In other embodiments, sequence identity can be determined using the Smith-Waterman algorithm in its existing version as of the filing date.

본원에서 사용되는 바와 같이, “서열 상동성”은 상동성이고 동일한 상대 위치에 있는 2개의 폴리펩티드 서열 간의 아미노산의 백분율을 지칭한다. 이와 같이, 하나의 폴리펩티드 서열은 다른 폴리펩티드 서열과 비교하여 특정 백분율의 서열 상동성을 갖는다. 당업자는, 2개의 서열이 상응하는 위치에 상동성 잔기를 함유하는 경우 이들이 일반적으로 “실질적으로 상동성인” 것으로 간주된다는 것을 이해할 것이다. 상동성 잔기는 동일한 잔기일 수 있다. 대안적으로, 상동성 잔기는 적절하게 유사한 구조적 및/또는 기능적 특성을 갖는 동일하지 않은 잔기일 수 있다. 예를 들어, 당업자에 의해 잘 알려진 바와 같이, 특정 아미노산은 통상적으로 “소수성” 또는 “친수성” 아미노산으로서 분류되고/되거나 “극성” 또는 “비극성” 측쇄를 갖는 것으로 분류되고, 하나의 아미노산을 동일한 유형의 다른 아미노산으로 치환하는 것은 종종 “상동성” 치환으로 간주될 수 있다.As used herein, “sequence homology” refers to the percentage of amino acids between two polypeptide sequences that are homologous and in the same relative position. As such, one polypeptide sequence has a certain percentage of sequence homology compared to another polypeptide sequence. Those skilled in the art will understand that two sequences are generally considered “substantially homologous” if they contain homologous residues at corresponding positions. Homology residues may be identical residues. Alternatively, homologous residues may be non-identical residues that have suitably similar structural and/or functional properties. For example, as is well known to those skilled in the art, certain amino acids are typically classified as either “hydrophobic” or “hydrophilic” amino acids and/or as having “polar” or “non-polar” side chains, and may be classified as having an amino acid of the same type. Substitutions of amino acids with other amino acids can often be considered “homologous” substitutions.

당업계에 잘 알려져 있는 바와 같이, 아미노산 서열은 BLASTP, 갭형 BLAST, 및 PSI-BLAST와 같은 상업적 컴퓨터 프로그램에서 이용 가능한 것들을 포함하여, 출원일 현재 존재하는 다양한 알고리즘 중 어느 하나를 사용하여 비교될 수 있다. 이러한 프로그램은 Altschul 등의 문헌[J. Mol. Biol., (1990),215(3): 403-410]; Altschul 등의 문헌[Nucleic Acids Res. (1997), 25:3389-3402]; Baxevanis 등의 문헌[Bioinformatics A Practical Guide to the Analysis of Genes and Proteins, Wiley, 1998]; 및 Misener(eds.) 등의 문헌[Bioinformatics Methods and Protocols (Methods in Molecular Biology, Vol. 132), Humana Press, 1999]에 기술되어 있다. 상동성 서열을 식별하는 것에 추가하여, 전술한 프로그램은 일반적으로 상동성의 정도에 대한 표시를 제공한다.As is well known in the art, amino acid sequences can be compared using any of a variety of algorithms existing as of the filing date, including those available in commercial computer programs such as BLASTP, gapped BLAST, and PSI-BLAST. Such a program is described in Altschul et al. [J. Mol. Biol., (1990), 215(3): 403-410]; Altschul et al., Nucleic Acids Res. (1997), 25:3389-3402]; Baxevanis et al., Bioinformatics A Practical Guide to the Analysis of Genes and Proteins, Wiley, 1998; and Misener (eds.), et al., Bioinformatics Methods and Protocols (Methods in Molecular Biology, Vol. 132), Humana Press, 1999. In addition to identifying homologous sequences, the programs described above generally provide an indication of the degree of homology.

본원에서 사용되는 바와 같이, “세포 표적화 모이어티”는 표적 세포의 표면 상에서 수용체와 같은 분자에 특이적으로 결합하는 분자 또는 거대분자를 지칭한다. 구현예에서, 세포 표면 분자는 표적 세포의 표면에서만 발현된다. 구현예에서, 세포 표면 분자는 하나 이상의 비표적 세포의 표면 상에도 존재하지만, 세포 표면 분자 발현의 양은 표적 세포의 표면 상에서 더 높다. 세포 표적화 모이어티의 예는 항체, 펩티드, 단백질, 앱타머, 또는 소분자를 포함하지만, 이에 한정되지 않는다.As used herein, “cell targeting moiety” refers to a molecule or macromolecule that specifically binds to a molecule, such as a receptor, on the surface of a target cell. In embodiments, the cell surface molecule is expressed only on the surface of the target cell. In embodiments, the cell surface molecule is also present on the surface of one or more non-target cells, but the amount of cell surface molecule expression is higher on the surface of the target cell. Examples of cell targeting moieties include, but are not limited to, antibodies, peptides, proteins, aptamers, or small molecules.

본원에서 사용되는 바와 같이, 용어 “안티센스 화합물” 및 “AC”는 이들이 혼성화되는 표적 핵산 분자(AC)에 적어도 부분적으로 상보적인 중합체 핵산 구조를 지칭하도록 상호 교환적으로 사용된다. AC는 서열의 적어도 일부가 표적 서열에 상보적인 짧은(구현예에서, 50개 미만의 염기) 폴리뉴클레오티드 또는 폴리뉴클레오티드 상동체일 수 있다. 구현예에서, AC는 일부가 표적 pre-mRNA 가닥 내의 표적 서열에 상보적인 서열을 갖는 폴리뉴클레오티드 또는 폴리뉴클레오티드 상동체이다. AC는 천연 핵산, 합성 핵산, 핵산 상동체, 또는 이들의 임의의 조합으로 형성될 수 있다. 구현예에서, AC는 올리고뉴클레오시드를 포함한다. 구현예에서, AC는 안티센스 올리고뉴클레오시드를 포함한다. 구현예에서, AC는 접합기를 포함한다. AC의 비제한적인 예는 프라이머, 프로브, 안티센스 올리고뉴클레오티드, 외부 가이드 서열(EGS) 올리고뉴클레오티드, siRNA, 올리고뉴클레오티드, 올리고뉴클레오시드, 올리고뉴클레오티드 유사체, 올리고뉴클레오티드 모방체, 및 이들의 키메라 조합을 포함하지만, 이에 한정되지 않는다. 이와 같이, 이들 화합물은 단일 가닥, 이중 가닥, 원형, 분지형, 또는 헤어핀의 형태로 도입될 수 있고, 내부 또는 말단 돌출부(bulges) 또는 루프와 같은 구조적 요소를 함유할 수 있다. 올리고머 이중 가닥 화합물은 이중 가닥 화합물을 형성하도록 혼성화된 2개의 가닥이거나, 혼성화를 가능하게 하고 완전한 또는 부분적인 이중 가닥 화합물의 형성을 가능하게 할 정도로 충분한 자기 상보성을 갖는 단일 가닥일 수 있다. 구현예에서, AC는 표적 전사체(예를 들어, 표적 핵산)의 발현, 수준, 및/또는 활성을 조절(증가, 감소, 또는 변화)한다. 구현예에서, AC는 붕괴 메커니즘을 유도함으로써 표적 전사체의 수준을 감소시킨다. 구현예에서, AC는 표적 전사체의 활성을 조절한다. 구현예에서, AC는 하나 이상의 단백질에 결합하는 표적 전사체의 능력을 감소시킴으로써 표적 전사체의 활성을 조절한다. 구현예에서, 표적 전사체와 하나 이상의 단백질 간의 친화도를 감소시키면 하나 이상의 단백질의 활성이 조절될 수 있다. 예를 들어, 하나 이상의 단백질이 표적 전사체에 결합되지 않는 경우, 이들은, 예를 들어 다른 전사체(하류 전사체)의 스플라이싱, 대안적인 스플라이싱, 및/또는 엑손 스키핑을 용이하게 하는 것과 같은 이들의 기능을 수행할 수 있다. 이와 같이, 표적 전사체의 활성의 AC 매개 조절은 표적 전사체와의 상호작용이 파괴될 수 있는 하나 이상의 단백질에 의해 조절되는 하류 유전자의 활성, 발현, 및/또는 수준의 조절을 유도할 수 있다.As used herein, the terms “antisense compound” and “AC” are used interchangeably to refer to polymeric nucleic acid structures that are at least partially complementary to the target nucleic acid molecule (AC) to which they hybridize. The AC may be a short (in embodiments, less than 50 bases) polynucleotide or polynucleotide homolog where at least a portion of the sequence is complementary to the target sequence. In an embodiment, the AC is a polynucleotide or polynucleotide homolog, some of which has a sequence complementary to the target sequence within the target pre-mRNA strand. ACs may be formed from natural nucleic acids, synthetic nucleic acids, nucleic acid homologs, or any combination thereof. In an embodiment, AC comprises an oligonucleoside. In an embodiment, the AC comprises an antisense oligonucleoside. In an embodiment, the AC includes an adapter. Non-limiting examples of ACs include primers, probes, antisense oligonucleotides, external guide sequence (EGS) oligonucleotides, siRNA, oligonucleotides, oligonucleosides, oligonucleotide analogs, oligonucleotide mimetics, and chimeric combinations thereof. However, it is not limited to this. As such, these compounds may be introduced in the form of single-stranded, double-stranded, circular, branched, or hairpins, and may contain structural elements such as internal or terminal bulges or loops. An oligomeric double-stranded compound may be two strands that hybridize to form a double-stranded compound, or may be a single strand with sufficient self-complementarity to allow hybridization and formation of a complete or partial double-stranded compound. In embodiments, the AC modulates (increases, decreases, or changes) the expression, level, and/or activity of a target transcript (e.g., a target nucleic acid). In embodiments, AC reduces the level of the target transcript by inducing a decay mechanism. In embodiments, the AC modulates the activity of a target transcript. In embodiments, the AC modulates the activity of a target transcript by reducing the ability of the target transcript to bind to one or more proteins. In embodiments, reducing the affinity between a target transcript and one or more proteins may modulate the activity of one or more proteins. For example, if one or more proteins do not bind to a target transcript, they may, for example, facilitate splicing of other transcripts (downstream transcripts), alternative splicing, and/or exon skipping. They can perform the same functions as: As such, AC-mediated regulation of the activity of a target transcript can lead to modulation of the activity, expression, and/or levels of downstream genes regulated by one or more proteins whose interaction with the target transcript can be disrupted. .

본원에서 사용되는 바와 같이, “표적화(targeting 또는 targeted to)”라는 용어는 안티센스 화합물과 같은 치료 모이어티를 표적 핵산 분자 또는 표적 핵산 분자의 영역과 결합시키는 것을 지칭한다. 구현예에서, 치료 모이어티는 생리학적 조건 하에서 표적 핵산에 혼성화될 수 있는 안티센스 화합물을 포함한다. 구현예에서, 안티센스 화합물은 표적 핵산 내의 특정 부분 또는 부위, 예를 들어 적어도 하나의 식별 가능한 구조, 기능, 또는 특징(예: 특정 엑손 또는 인트론, 또는 엑손 또는 인트론 내의 선택된 핵염기 또는 모티프)을 갖는 표적 핵산의 일부를 표적화한다.As used herein, the term “targeting or targeted to” refers to linking a therapeutic moiety, such as an antisense compound, to a target nucleic acid molecule or region of a target nucleic acid molecule. In embodiments, the therapeutic moiety comprises an antisense compound that is capable of hybridizing to a target nucleic acid under physiological conditions. In embodiments, the antisense compound is a specific portion or region within a target nucleic acid, e.g., having at least one identifiable structure, function, or characteristic (e.g., a specific exon or intron, or a selected nucleobase or motif within an exon or intron). Targets part of the target nucleic acid.

본원에서 사용되는 바와 같이, 용어 “표적 핵산 서열”, “표적 뉴클레오티드 서열”, 및 “표적 서열”은 안티센스 화합물과 같은 치료 모이어티가 결합하거나 혼성화되는 핵산 서열 또는 뉴클레오티드 서열을 지칭한다. 표적 핵산은 표적 전사체의 일부, 표적 RNA(pre-mRNA 및 mRNA 또는 이의 일부를 포함하지만 이에 한정되지 않음), 이러한 RNA로부터 유래된 표적 cDNA의 일부뿐만 아니라 miRNA와 같은 표적 비번역 RNA의 일부를 포함하지만, 이에 한정되지 않는다. 예를 들어, 구현예에서, 표적 핵산은 발현 또는 전사가 특정 장애 또는 질환 상태와 관련이 있는 표적 세포 유전자의 일부(또는 이러한 유전자로부터 전사된 mRNA)일 수 있다. 용어 “일부(portion)”는 핵산의 연속(즉, 연결된) 뉴클레오티드의 정의된 수를 지칭한다.As used herein, the terms “target nucleic acid sequence,” “target nucleotide sequence,” and “target sequence” refer to a nucleic acid sequence or nucleotide sequence to which a therapeutic moiety, such as an antisense compound, binds or hybridizes. Target nucleic acids include portions of target transcripts, target RNAs (including, but not limited to, pre-mRNA and mRNA or portions thereof), portions of target cDNA derived from such RNAs, as well as portions of target untranslated RNAs such as miRNAs. Including, but not limited to this. For example, in embodiments, the target nucleic acid may be a portion of a target cell gene (or an mRNA transcribed from such a gene) whose expression or transcription is associated with a particular disorder or disease state. The term “portion” refers to a defined number of consecutive (i.e. linked) nucleotides of a nucleic acid.

본원에서 사용되는 바와 같이, 용어 “전사체” 또는 “유전자 전사체”는 DNA로부터 전사된 RNA 분자를 지칭하며, mRNA, pre-mRNA, 및 부분적으로 가공된 RNA를 포함하지만, 이에 한정되지 않는다.As used herein, the term “transcript” or “gene transcript” refers to an RNA molecule transcribed from DNA and includes, but is not limited to, mRNA, pre-mRNA, and partially processed RNA.

용어 “표적 전사체” 및 “표적 RNA”는 치료 모이어티에 의해 결합된 pre-mRNA 또는 mRNA 전사체를 지칭한다. 표적 전사체은 표적 뉴클레오티드 서열을 포함할 수 있다. 구현예에서, 표적 전사체은 확장된 CUG 트리뉴클레오티드 반복을 포함하는 표적 뉴클레오티드 서열을 포함한다.The terms “target transcript” and “target RNA” refer to the pre-mRNA or mRNA transcript bound by the therapeutic moiety. The target transcript may include a target nucleotide sequence. In an embodiment, the target transcript comprises a target nucleotide sequence comprising an expanded CUG trinucleotide repeat.

용어 “표적 유전자” 및 “관심 유전자”는 발현 및/또는 활성의 조절이 바람직하거나 의도되는 유전자를 지칭한다. 표적 유전자는 표적 뉴클레오티드 서열을 포함하는 표적 전사체로 전사될 수 있다. 표적 전사체은 관심 단백질로 번역될 수 있다.The terms “target gene” and “gene of interest” refer to a gene whose expression and/or activity is desired or intended. The target gene can be transcribed into a target transcript containing the target nucleotide sequence. The target transcript can be translated into the protein of interest.

용어 “표적 단백질”은 표적 전사체(예: 표적 mRNA)에 의해 암호화된 폴리펩티드 또는 단백질을 지칭한다.The term “target protein” refers to a polypeptide or protein encoded by a target transcript (e.g., target mRNA).

본원에서 사용되는 바와 같이, 용어 “mRNA”는 단백질을 암호화하는 RNA 분자를 지칭하며, pre-mRNA 및 성숙한 mRNA를 포함한다. “Pre-mRNA”는 DNA 전사 직후에 새롭게 합성된 진핵 mRNA 분자를 지칭한다. 구현예에서, pre-mRNA는 5’ cap으로 캡핑되고, 3’ 폴리-A 꼬리로 변형되고/되거나 스플라이싱되어 성숙한 mRNA 서열을 생성한다. 구현예에서, pre-mRNA는 하나 이상의 인트론을 포함한다. 구현예에서, pre-mRNA는, 인트론을 제거하고 엑손을 결합시키는 스플라이싱으로 알려진 프로세스를 거친다. 구현예에서, pre-mRNA는 하나 이상의 스플라이싱 요소 또는 스플라이싱 조절 요소를 포함한다. 구현예에서, pre-mRNA는 폴리아데닐화 부위를 포함한다.As used herein, the term “mRNA” refers to an RNA molecule that encodes a protein and includes pre-mRNA and mature mRNA. “Pre-mRNA” refers to newly synthesized eukaryotic mRNA molecules immediately after DNA transcription. In an embodiment, the pre-mRNA is capped with a 5' cap, modified with a 3' poly-A tail, and/or spliced to generate the mature mRNA sequence. In embodiments, the pre-mRNA includes one or more introns. In embodiments, pre-mRNA undergoes a process known as splicing, which removes introns and joins exons. In an embodiment, the pre-mRNA comprises one or more splicing elements or splicing regulatory elements. In an embodiment, the pre-mRNA includes a polyadenylation site.

본원에서 사용되는 바와 같이, 용어 “발현”, “유전자 발현”, “유전자의 발현” 등은 유전자에 암호화된 정보가 세포에서 폴리펩티드 또는 비코딩 RNA와 같은 기능적 유전자 산물로 변환되는 모든 기능 및 단계를 지칭한다. 비코딩 RNA의 예는 전달 RNA(tRNA) 및 리보솜 RNA를 포함한다. 폴리펩티드의 유전자 발현은 pre-mRNA를 형성하기 위한 유전자를 전사하는 것, 성숙한 mRNA를 형성하기 위한 pre-mRNA를 가공하는 것, 성숙한 mRNA를 핵으로부터 세포질로 전위시키는 것, 성숙한 mRNA를 폴리펩티드로 번역하는 것, 및 암호화된 폴리펩티드를 조립하는 것을 포함한다. 발현은 부분 발현을 포함한다. 예를 들어, 유전자의 발현은 유전자 전사체를 생성하는 것으로서 지칭될 수 있다. 성숙한 mRNA의 번역은 성숙한 mRNA의 발현으로서 지칭될 수 있다.As used herein, the terms “expression,” “gene expression,” “expression of a gene,” etc. refer to all functions and steps by which information encoded in a gene is converted in a cell to a functional gene product, such as a polypeptide or non-coding RNA. refers to Examples of non-coding RNA include transfer RNA (tRNA) and ribosomal RNA. Gene expression of a polypeptide involves transcribing the gene to form pre-mRNA, processing the pre-mRNA to form mature mRNA, translocating the mature mRNA from the nucleus to the cytoplasm, and translating the mature mRNA into a polypeptide. and assembling the encoded polypeptide. Expression includes partial expression. For example, expression of a gene may be referred to as producing a gene transcript. Translation of mature mRNA may be referred to as expression of mature mRNA.

본원에서 사용되는 바와 같이, “유전자 발현의 조절” 또는 이와 유사한 표현은 유전자 발현과 연관된 프로세스 중 하나 이상을 조절하는 것을 지칭한다. 예를 들어, 유전자 발현의 변형은 유전자 전사, RNA 가공, 핵으로부터 세포질로의 RNA 전위, 및 mRNA를 단백질로 번역하는 것 중 하나 이상을 포함할 수 있다.As used herein, “regulation of gene expression” or similar expressions refers to regulating one or more of the processes associated with gene expression. For example, modification of gene expression may include one or more of gene transcription, RNA processing, RNA translocation from the nucleus to the cytoplasm, and translation of mRNA into protein.

본원에서 사용되는 바와 같이, 용어 “유전자”는 유전자 산물의 발현과 연관된 5’ 프로모터 영역, 및 유전자 산물의 발현과 연관된 임의의 인트론 및 엑손 영역 및 3’ 비번역 영역(“UTR”)을 포함하는 핵산 서열을 지칭한다.As used herein, the term “gene” includes a 5' promoter region associated with expression of the gene product, and any intron and exon regions and 3' untranslated regions (“UTRs”) associated with expression of the gene product. refers to a nucleic acid sequence.

용어 “면역 세포”는 조혈 기원의 세포로서, 면역 반응에서 역할을 하는 세포를 지칭한다. 면역 세포는 림프구(예: B 세포 및 T 세포), 자연 살해(NK) 세포, 및 골수 세포를 포함하지만, 이에 한정되지 않는다. 용어 “골수 세포”는 단핵구, 대식세포, 및 과립구(예: 호염기구, 호중구, 호산구, 및 비만 세포)를 포함한다. 단핵구는 1~3일 동안 혈액을 통해 순환한 후, 조직 내로 이동하여 대식세포 또는 염증성 수지상 세포로 분화되거나 사멸하는 림프구이다. 본원에서 사용되는 용어 “대식세포”는 태아 유래 대식세포(상주 조직 대식세포로서 지칭될 수도 있음), 및 혈류로부터 신체의 조직 내로 이동한 단핵구에서 유래된 대식세포(단핵구 유래 대식세포로서 지칭될 수도 있음)를 포함한다. 대식세포는 위치하는 조직에 따라, 특히 쿠퍼 세포(간), 사구체내 혈관간 세포(신장), 폐포 대식세포(폐), 부비강 조직구(림프절), 호프바우어 세포(태반), 소교세포(뇌 및 척수), 또는 랑게르한스(피부)로서 지칭된다.The term “immune cell” refers to cells of hematopoietic origin that play a role in immune responses. Immune cells include, but are not limited to, lymphocytes (e.g., B cells and T cells), natural killer (NK) cells, and myeloid cells. The term “myeloid cells” includes monocytes, macrophages, and granulocytes (e.g., basophils, neutrophils, eosinophils, and mast cells). Monocytes are lymphocytes that circulate through the blood for 1 to 3 days and then migrate into tissues and differentiate into macrophages or inflammatory dendritic cells or die. As used herein, the term “macrophage” refers to fetal-derived macrophages (which may also be referred to as resident tissue macrophages), and macrophages derived from monocytes that have migrated from the bloodstream into the tissues of the body (which may also be referred to as monocyte-derived macrophages). includes). Depending on the tissue in which they are located, macrophages are specifically Kupffer cells (liver), intraglomerular mesangial cells (kidney), alveolar macrophages (lung), sinus histiocytes (lymph nodes), Hofbauer cells (placenta), and microglia (brain). and spinal cord), or Langerhans (skin).

본원에서 사용되는 바와 같이, 용어 “올리고뉴클레오티드”는 복수의 연결된 뉴클레오티드 또는 뉴클레오시드를 포함하는 올리고머 화합물을 지칭한다. 올리고뉴클레오티드의 하나 이상의 뉴클레오티드가 변형될 수 있다. 올리고뉴클레오티드는 리보핵산(RNA) 또는 데옥시리보핵산(DNA)을 포함할 수 있다. 올리고뉴클레오티드는 천연 및/또는 변형된 핵염기, 당 및 공유 뉴클레오시드 간 결합으로 구성될 수 있고, 비핵산 접합체를 추가로 포함할 수 있다.As used herein, the term “oligonucleotide” refers to an oligomeric compound comprising a plurality of linked nucleotides or nucleosides. One or more nucleotides of the oligonucleotide may be modified. Oligonucleotides may include ribonucleic acid (RNA) or deoxyribonucleic acid (DNA). Oligonucleotides may be composed of natural and/or modified nucleobases, sugars, and covalent internucleoside linkages, and may further include non-nucleic acid conjugates.

본원에서 사용되는 바와 같이, 용어 “뉴클레오시드”는 핵염기 및 당을 포함하는 글리코실아민을 지칭한다. 뉴클레오시드는 천연 뉴클레오시드, 비염기성 뉴클레오시드, 변형된 뉴클레오시드, 및 모방 염기 및/또는 당기를 갖는 뉴클레오시드를 포함하지만, 이에 한정되지 않는다. “천연 뉴클레오시드” 또는 “변형되지 않은 뉴클레오시드”는 천연 핵염기 및 천연 당을 포함하는 뉴클레오시드이다. 천연 뉴클레오시드는 RNA 및 DNA 뉴클레오시드를 포함한다.As used herein, the term “nucleoside” refers to a glycosylamine containing a nucleobase and a sugar. Nucleosides include, but are not limited to, natural nucleosides, abasic nucleosides, modified nucleosides, and nucleosides having mimetic bases and/or sugar groups. “Natural nucleosides” or “unmodified nucleosides” are nucleosides that contain natural nucleobases and natural sugars. Natural nucleosides include RNA and DNA nucleosides.

본원에서 사용되는 바와 같이, 용어 “천연 당”은 RNA(2'-OH) 또는 DNA(2'-H)에서 자연 발생 형태로부터 변형되지 않은 뉴클레오시드의 당을 지칭한다.As used herein, the term “natural sugar” refers to a sugar of a nucleoside that has not been modified from its naturally occurring form in RNA (2'-OH) or DNA (2'-H).

본원에서 사용되는 바와 같이, 용어 “뉴클레오티드”는 당에 공유 연결된 인산염기를 갖는 뉴클레오시드를 지칭한다. 뉴클레오티드는 다양한 치환기 중 어느 하나로 변형될 수 있다.As used herein, the term “nucleotide” refers to a nucleoside having a phosphate group covalently linked to a sugar. Nucleotides may be modified with any of a variety of substituents.

본원에서 사용되는 바와 같이, 용어 “핵염기”는 뉴클레오시드 또는 뉴클레오티드의 염기 부분을 지칭한다. 핵염기는 또 다른 핵산의 염기에 수소 결합할 수 있는 임의의 원자 또는 원자의 기를 포함할 수 있다. 천연 핵염기는 RNA 또는 DNA에서 자연 발생 형태로부터 변형되지 않은 핵염기이다.As used herein, the term “nucleobase” refers to the base portion of a nucleoside or nucleotide. A nucleobase can include any atom or group of atoms capable of hydrogen bonding to a base of another nucleic acid. A native nucleobase is a nucleobase that has not been modified from its naturally occurring form in RNA or DNA.

본원에서 사용되는 바와 같이, 용어 “헤테로환형 염기 모이어티”는 헤테로환을 포함하는 핵염기를 지칭한다.As used herein, the term “heterocyclic base moiety” refers to a nucleobase containing a heterocycle.

본원에서 사용되는 바와 같이, “뉴클레오시드간 연결”은 인접한 뉴클레오시드 간의 공유 연결을 지칭한다.As used herein, “internucleoside linkage” refers to a covalent linkage between adjacent nucleosides.

본원에서 사용되는 바와 같이, “천연 뉴클레오시드간 연결”은 3’에서 5’ 방향으로의 인산디에스테르 연결을 지칭한다.As used herein, “native internucleoside linkage” refers to a phosphodiester linkage in the 3’ to 5’ direction.

본원에서 사용되는 바와 같이, 용어 “변형된 뉴클레오시드간 연결”은 자연 발생 뉴클레오시드간 연결이 아닌 뉴클레오시드 간의 임의의 연결 또는 뉴클레오티드 간의 임의의 연결을 지칭한다.As used herein, the term “modified internucleoside linkage” refers to any linkage between nucleosides or between nucleotides that is not a naturally occurring internucleoside linkage.

본원에서 사용되는 바와 같이, “올리고뉴클레오시드”는 뉴클레오시드간 연결이 인 원자를 함유하지 않는 올리고뉴클레오티드를 지칭한다.As used herein, “oligonucleoside” refers to an oligonucleotide in which the internucleoside linkages do not contain phosphorus atoms.

본원에서 사용되는 바와 같이, 용어 “키메라 안티센스 화합물”은 동일한 올리고머 화합물 내의 다른 당, 핵염기, 및 뉴클레오시드 간 연결과 비교했을 때 상이하게 변형된 적어도 하나의 당, 핵염기, 및/또는 뉴클레오시드 간 연결을 갖는 안티센스 화합물을 지칭한다. 당, 핵염기, 및 뉴클레오시드간 연결의 나머지는 독립적으로 변형되거나 변형되지 않을 수 있다. 일반적으로, 키메라 올리고머 화합물은 변형된 뉴클레오시드를 갖게 되는데, 변형되 뉴클레오시드는 단리된 위치에 있거나, 특정 모티프를 정의하는 영역에서 함께 그룹화될 수 있다. 변형 및/또는 모방기의 임의의 조합은 본원에 기술된 키메라 올리고머 화합물을 포함할 수 있다.As used herein, the term “chimeric antisense compound” refers to a compound containing at least one sugar, nucleobase, and/or nucleoside that is differently modified compared to the linkages between other sugars, nucleobases, and nucleosides in the same oligomeric compound. Refers to an antisense compound with an intercleoside linkage. The remainder of the sugar, nucleobase, and internucleoside linkages may or may not be independently modified. Typically, chimeric oligomeric compounds will have modified nucleosides, which may be in isolated positions or grouped together in regions defining specific motifs. Any combination of modifications and/or mimetic groups may be included in the chimeric oligomeric compounds described herein.

본원에서 사용되는 바와 같이, 용어 “혼합된 백본 안티센스 올리고뉴클레오티드”는 안티센스 올리고뉴클레오티드의 적어도 하나의 뉴클레오시드 간 연결이 안티센스 올리고뉴클레오티드의 적어도 하나의 다른 뉴클레오시드 간 연결과 상이한 안티센스 올리고뉴클레오티드를 지칭한다.As used herein, the term “mixed backbone antisense oligonucleotide” refers to an antisense oligonucleotide in which at least one internucleoside linkage of the antisense oligonucleotide is different from at least one other internucleoside linkage of the antisense oligonucleotide. do.

본원에서 사용되는 바와 같이, 용어 “핵염기 상보성”은 핵염기가 또 다른 핵염기와 염기쌍을 형성할 수 있음을 지칭한다. 예를 들어, DNA에서, 아데닌(A)은 티민(T)에 상보적이다. 예를 들어, RNA에서, 아데닌(A)은 우라실(U)에 상보적이다. 구현예에서, 상보적 핵염기는, 표적 핵산의 핵염기와 염기쌍을 형성할 수 있는 안티센스 화합물의 핵염기를 지칭한다. 예를 들어, 안티센스 화합물의 특정 위치에 있는 핵염기가 표적 핵산의 특정 위치에 있는 핵염기와 수소 결합할 수 있는 경우, 올리고뉴클레오티드와 표적 핵산 사이의 수소 결합 위치는 해당 핵염기 쌍에서 상보적인 것으로 간주된다.As used herein, the term “nucleobase complementarity” refers to the ability of a nucleobase to form base pairs with another nucleobase. For example, in DNA, adenine (A) is complementary to thymine (T). For example, in RNA, adenine (A) is complementary to uracil (U). In an embodiment, complementary nucleobase refers to a nucleobase of an antisense compound that is capable of forming base pairs with a nucleobase of a target nucleic acid. For example, if a nucleobase at a specific position in an antisense compound can hydrogen bond with a nucleobase at a specific position in a target nucleic acid, the hydrogen bond site between the oligonucleotide and the target nucleic acid is considered complementary for that nucleobase pair. It is considered.

본원에서 사용되는 바와 같이, 용어 “비상보적 핵염기”는 서로 수소 결합을 형성하지 않거나 달리 혼성화를 뒷받침하지 않는 한 쌍의 핵염기를 지칭한다.As used herein, the term “non-complementary nucleobase” refers to a pair of nucleobases that do not form hydrogen bonds with each other or otherwise support hybridization.

본원에서 사용되는 바와 같이, 용어 “상보적”은 올리고머 화합물이 핵염기 상보성을 통해 또 다른 올리고머 화합물 또는 핵산에 혼성화하는 능력을 지칭한다. 구현예에서, 안티센스 화합물 및 이의 표적은, 각 분자 내의 충분한 수의 상응하는 위치가 핵염기에 의해 점유되고, 이 핵염기가 안티센스 화합물과 표적을 안정하게 결합시킬 수 있는 결합을 형성할 수 있을 때 서로 상보적이다. 당업자는 안티센스 화합물이 결합을 유지되는 능력을 제거하지 않고도 미스매치를 포함시키는 것이 가능하다는 것을 인식한다. 따라서, 최대 20%의 미스매치된 핵염기(즉, 표적의 상응하는 뉴클레오티드에 상보적이 아닌 핵염기)를 포함할 수 있는 안티센스 화합물이 본원에 기술된다. 구현예에서, 안티센스 화합물은 약 15% 이하, 예를 들어 약 10% 이하, 예를 들어 5% 이하의 미스매치를 함유하거나, 미스매치를 함유하지 않는다. 나머지 뉴클레오티드는 상보적인 핵염기이거나 달리 혼성화를 파괴하지 않는 핵염기(예: 범용 염기)이다. 당업자는 본원에 제공된 화합물이 표적 핵산에 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 상보적인 핵염기임을 인식할 것이다.As used herein, the term “complementary” refers to the ability of an oligomeric compound to hybridize to another oligomeric compound or nucleic acid through nucleobase complementarity. In an embodiment, an antisense compound and its target can be used when a sufficient number of corresponding positions in each molecule are occupied by a nucleobase, which nucleobase can form a bond that can stably bind the antisense compound and the target. are complementary to each other. Those skilled in the art recognize that it is possible to include mismatches in an antisense compound without eliminating its ability to maintain binding. Accordingly, antisense compounds are described herein that can contain up to 20% mismatched nucleobases (i.e., nucleobases that are not complementary to the corresponding nucleotide of the target). In embodiments, the antisense compound contains no more than about 15% mismatch, such as no more than about 10%, such as no more than 5% mismatch, or no mismatch. The remaining nucleotides are complementary nucleobases or nucleobases that do not otherwise destroy hybridization (e.g., universal bases). Those skilled in the art will determine that the compounds provided herein have nucleobases that are at least 80%, at least 85%, at least 90%, at least 95%, at least 96%, at least 97%, at least 98%, at least 99%, or 100% complementary to the target nucleic acid. will recognize

본원에서 사용되는 바와 같이, “혼성화”는 상보적 올리고머 화합물(예: 안티센스 화합물 및 이의 표적 핵산)의 쌍형성을 의미한다. 특정 메커니즘에 한정되고자 하는 것은 아니지만, 쌍형성의 가장 흔한 메커니즘은 상보적 뉴클레오시드 또는 뉴클레오티드 염기(핵염기) 사이의 수소 결합을 포함하며, 이는 Watson-Crick 수소 결합, Hoogsteen 수소 결합, 또는 역전된 Hoogsteen 수소 결합일 수 있다. 예를 들어, 천연 염기인 아데닌은 수소 결합의 형성을 통해 쌍을 형성하는 천연 핵염기인 티민 및 우라실에 상보적인 핵염기이다. 천연 염기인 구아닌은 천연 염기인 시토신 및 5-메틸 시토신에 상보적인 핵염기이다. 혼성화는 다양한 상황에서 이루어질 수 있다.As used herein, “hybridization” refers to the pairing of complementary oligomeric compounds (e.g., an antisense compound and its target nucleic acid). While not wishing to be limited to a particular mechanism, the most common mechanisms of pairing involve hydrogen bonding between complementary nucleoside or nucleotide bases (nucleobases), such as Watson-Crick hydrogen bonding, Hoogsteen hydrogen bonding, or inverted hydrogen bonding. Could be a Hoogsteen hydrogen bond. For example, the natural base adenine is a nucleobase complementary to the natural nucleobases thymine and uracil that pair together through the formation of hydrogen bonds. Guanine, a natural base, is a nucleobase complementary to the natural bases cytosine and 5-methyl cytosine. Hybridization can occur in a variety of situations.

본원에서 사용되는 바와 같이, 용어 “특이적으로 혼성화하는”은 올리고머 화합물이 다른 핵산 부위에 혼성화하는 것보다 더 큰 친화도로 하나의 핵산 부위에 혼성화되는 능력을 지칭한다. 구현예에서, 안티센스 올리고뉴클레오티드는 둘 이상의 표적 부위에 특이적으로 혼성화된다. 구현예에서, 올리고머 화합물은 엄격한 혼성화 조건 하에서 이의 표적과 특이적으로 혼성화된다.As used herein, the term “specifically hybridizes” refers to the ability of an oligomeric compound to hybridize to one nucleic acid site with greater affinity than to another nucleic acid site. In embodiments, the antisense oligonucleotide specifically hybridizes to two or more target sites. In embodiments, the oligomeric compound specifically hybridizes to its target under stringent hybridization conditions.

핵산 혼성화의 맥락에서 "엄격한 혼성화 조건" 및 "엄격한 혼성화 세척 조건"은 서열 의존적이며, 상이한 환경 파라미터 하에서 상이하다. 핵산의 혼성화에 대한 광범위한 가이드는 Tijssen의 문헌[Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes part I chapter 2 "Overview of principles of hybridization and the strategy of nucleic acid probe assays" Elsevier, New York (1993)]에서 확인할 수 있다. 일반적으로, 매우 엄격한 혼성화 및 세척 조건은 정의된 이온 강도 및 pH에서 특정 서열에 대한 열 융점(Tm)보다 약 5℃ 더 낮게 선택된다. Tm은 (정의된 이온 강도 및 pH 하에서) 표적 서열의 50%가 완벽하게 일치하는 프로브에 혼성화되는 온도이다. 매우 엄격한 조건은 특정 프로브에 대한 Tm과 동등하도록 선택된다. 서던 블롯 또는 노던 블롯에서 필터를 이용해 100개가 넘는 상보적 잔기를 갖는 상보적 뉴클레오티드 서열을 혼성화하기 위한 엄격한 혼성화 조건의 예는 1 mg의 헤파린이 포함된 42℃의 50% 포름아미드이며, 혼성화는 밤새 수행된다. 매우 엄격한 세척 조건의 예는 72℃에서 0.15M NaCl로 약 15분 동안 세척하는 것이다. 엄격한 세척 조건의 예는 65℃에서 0.2x SSC로 15분 동안 세척하는 것이다(SSC 완충액에 대한 설명은 Sambrook 및 Russel의 문헌[Molecular Cloning: A laboratory Manual, 3rd ed., Cold Spring Harbor Laboratory Press, 2001] 참조). 매우 엄격한 세척에 앞서 배경 프로브 신호를 제거하기 위한 낮은 정도의 엄격한 세척이 종종 이루어진다. 예를 들어 100개가 넘는 뉴클레오티드의 이중체에 대한 중간 정도의 엄격한 세척의 예는 45℃에서 1x SSC로 15분 동안 세척하는 것이다. 예를 들어 100개가 넘는 뉴클레오티드의 이중체에 대한 낮은 정도의 엄격한 세척의 예는 40℃에서 4~6x SSC로 15분 동안 세척하는 것이다. 짧은 프로브(예를 들어 약 10 내지 50개의 뉴클레오티드)의 경우, 엄격한 조건은 통상적으로 pH 7.0 내지 8.3에서 약 1.0 M 미만의 Na 이온의 염 농도, 통상적으로 약 0.01 내지 1.0 M의 Na 이온 농도(또는 다른 염 농도)를 포함하고, 온도는 통상적으로 적어도 약 30℃이다. 엄격한 조건은 포름아미드와 같은 불안정화제의 첨가에 의해 달성될 수도 있다.“Stringent hybridization conditions” and “stringent hybridization wash conditions” in the context of nucleic acid hybridization are sequence dependent and are different under different environmental parameters. An extensive guide to hybridization of nucleic acids is given by Tijssen, Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes part I chapter 2 "Overview of principles of hybridization and the strategy of nucleic acid probe assays" Elsevier, New York (1993). )]. Typically, very stringent hybridization and washing conditions are chosen to be about 5°C lower than the thermal melting point (Tm) for a particular sequence at a defined ionic strength and pH. Tm is the temperature (under defined ionic strength and pH) at which 50% of the target sequence hybridizes to a perfectly matching probe. Very stringent conditions are chosen to be equivalent to the Tm for a particular probe. An example of stringent hybridization conditions for hybridizing complementary nucleotide sequences with more than 100 complementary residues using filters in Southern or Northern blots is 50% formamide at 42°C with 1 mg of heparin, and hybridization is allowed overnight. It is carried out. An example of very stringent washing conditions is washing with 0.15M NaCl at 72°C for approximately 15 minutes. An example of stringent wash conditions is washing with 0.2x SSC for 15 minutes at 65° C. (For a description of SSC buffer, see Sambrook and Russel, Molecular Cloning: A laboratory Manual, 3 rd ed., Cold Spring Harbor Laboratory Press, 2001]). A low-stringency wash is often preceded by a high-stringency wash to remove background probe signal. For example, an example of a moderate stringency wash for duplexes of more than 100 nucleotides is washing with 1x SSC for 15 min at 45°C. An example of a low stringency wash for duplexes of more than 100 nucleotides would be washing with 4-6x SSC for 15 min at 40°C. For short probes (e.g., about 10 to 50 nucleotides), stringent conditions typically include a salt concentration of Na ions of less than about 1.0 M at pH 7.0 to 8.3, typically a Na ion concentration of about 0.01 to 1.0 M (or different salt concentrations), and the temperature is typically at least about 30°C. Stringent conditions may also be achieved by the addition of destabilizing agents such as formamide.

본원에서 사용되는 바와 같이, 용어 "2'-변형된" 또는 "2'-치환된"은 당이 2’ 위치에서 H 또는 OH 이외의 치환기를 포함하는 것을 의미한다. 2’-변형된 단량체는 2’-치환기를 갖는 BNA 및 단량체(예: 뉴클레오시드 및 뉴클레오티드), 예컨대 알릴, 아미노, 아지도, 티오, O-알릴, O-C1-C10 알킬, -OCF3, O-(CH2)2-O-CH3, 2'-O(CH2)2SCH3, O-(CH2)2-O-N(Rm)(Rn), 또는 O-CH2-C (=O)-N(Rm)(Rn)를 포함하지만 이에 한정되지는 않으며, 여기서 각각의 Rm 및 Rn은 독립적으로 H이거나, 치환되었거나 치환되지 않은 C1-C10 알킬이다.As used herein, the term "2'-modified" or "2'-substituted" means that the sugar contains a substituent other than H or OH at the 2' position. 2'-Modified monomers include BNA and monomers (e.g., nucleosides and nucleotides) with 2'-substituents, such as allyl, amino, azido, thio, O-allyl, O-C1-C10 alkyl, -OCF3, O-(CH2)2-O-CH3, 2'-O(CH2)2SCH3, O-(CH2)2-ON(Rm)(Rn), or O-CH2-C (=O)-N(Rm) (Rn), wherein each Rm and Rn is independently H or substituted or unsubstituted C 1 -C 10 alkyl.

본원에서 사용되는 바와 같이, 용어 "MOE"는 2'-O-메톡시에틸 치환기를 지칭한다.As used herein, the term “MOE” refers to the 2′-O-methoxyethyl substituent.

본원에서 사용되는 바와 같이, 용어 “고친화도 변형된 뉴클레오티드”는, 변형된 뉴클레오티드를 포함하는 안티센스 화합물의 표적 핵산에 대한 친화도가 변형에 의해 증가되도록, 적어도 하나의 변형된 핵염기, 뉴클레오시드간 연결, 또는 당 모이어티를 갖는 뉴클레오티드를 지칭한다. 고친화도 변형은 BNA, LNA, 및 2’-MOE를 포함하지만, 이에 한정되지 않는다.As used herein, the term “high affinity modified nucleotide” refers to at least one modified nucleobase, nucleoside, such that the affinity of the antisense compound comprising the modified nucleotide for the target nucleic acid is increased by the modification. Refers to a nucleotide having an interlinkage, or sugar moiety. High affinity modifications include, but are not limited to, BNA, LNA, and 2'-MOE.

본원에서 사용되는 바와 같이, 용어 “모방체”는 AC 내에서 당, 핵염기, 및/또는 뉴클레오시드간 결합으로 치환하는 기를 지칭한다. 일반적으로, 모방체는 당 또는 당-인터뉴클레오시드 연결 조합 대신에 사용되고, 핵염기는 선택된 표적에 혼성화되도록 유지된다. 당 모방체의 대표적인 예는 시클로헥세닐 또는 모르폴리노를 포함하지만, 이에 한정되지 않는다. 당-인터뉴클레오시드 연결 조합을 대한 모방체의 대표적인 예는 하전되지 않은 아키랄 연결에 의해 연결된 펩티드 핵산(PNA) 및 모르폴리노기를 포함하지만 이에 한정되지는 않는다. 일부 경우에, 모방체가 핵염기 대신에 사용된다. 대표적인 핵염기 모방체는 당업계에 잘 알려져 있으며, 삼환 페녹사진 유사체 및 범용 염기를 포함하지만 이에 한정되지 않는다(Berger 등의 문헌[Nuc Acid Res. 2000, 28:2911-14], 본원에 참조로서 통합됨). 당, 뉴클레오시드, 및 핵염기 모방체의 합성 방법은 당업자에게 잘 알려져 있다.As used herein, the term “mimetic” refers to a group within AC that substitutes for a sugar, nucleobase, and/or internucleoside linkage. Typically, a mimetic is used in place of a sugar or sugar-internucleoside linkage combination, and the nucleobase is kept hybridized to the selected target. Representative examples of sugar mimetics include, but are not limited to, cyclohexenyl or morpholino. Representative examples of mimetics for sugar-internucleoside linkage combinations include, but are not limited to, peptide nucleic acids (PNAs) and morpholino groups linked by uncharged achiral linkages. In some cases, mimetics are used in place of nucleobases. Representative nucleobase mimetics are well known in the art and include, but are not limited to, tricyclic phenoxazine analogs and universal bases (Berger et al., Nuc Acid Res. 2000, 28:2911-14, incorporated herein by reference). integrated). Methods for synthesizing sugars, nucleosides, and nucleobase mimetics are well known to those skilled in the art.

본원에서 사용되는 바와 같이, 용어 "이환형 뉴클레오시드" 또는 "BNA"는 뉴클레오시드를 지칭하며, 여기서 뉴클레오시드의 푸라노오스 부분은 푸라노오스 고리 상에서 두 개의 원자를 연결하여 이환형 고리 시스템을 형성하는 브릿지를 포함한다. BNA는 α-L-LNA, β-D-LNA, ENA, 옥시아미노 BNA (2'-O-N(CH3)-CH2-4'), 및 아미노옥시 BNA (2'-N(CH3)-O-CH2-4')를 포함하지만, 이에 한정되지 않는다.As used herein, the term “bicyclic nucleoside” or “BNA” refers to a nucleoside, wherein the furanose portion of the nucleoside connects two atoms on the furanose ring to form a bicyclic It contains bridges that form a ring system. BNAs include α-L-LNA, β-D-LNA, ENA, oxyamino BNA (2'-O-N(CH3)-CH2-4'), and aminooxy BNA (2'-N(CH3)-O-CH2 -4'), but is not limited thereto.

본원에서 사용되는 바와 같이, 용어 "4'-2' 이환 뉴클레오시드"는 푸라노오스 고리의 2개의 원자를 연결하는 브릿지가 푸라노오스 고리의 4' 탄소 원자와 2' 탄소 원자를 가교하여 이환 고리 시스템을 형성하는 BNA를 지칭한다.As used herein, the term "4'-2' bicyclic nucleoside" means that a bridge connecting two atoms of the furanose ring bridges the 4' and 2' carbon atoms of the furanose ring. Refers to BNA that forms a bicyclic ring system.

본원에서 사용되는 바와 같이, “잠긴 핵산” 또는 “LNA”는 리보실 당 고리의 2’-하이드록실기가 메틸렌기를 통해 당 고리의 4’ 탄소 원자에 연결되어 2’-C,4’-C-옥시메틸렌 연결을 형성하도록 변형된 뉴클레오티드를 지칭한다. LNA는 α-L-LNA 및 β-D-LNA를 포함하지만, 이에 한정되지 않는다.As used herein, “locked nucleic acid” or “LNA” means that the 2'-hydroxyl group of the ribosyl sugar ring is linked to the 4' carbon atom of the sugar ring through a methylene group to form a 2'-C,4'-C -refers to a nucleotide that has been modified to form an oxymethylene linkage. LNAs include, but are not limited to, α-L-LNA and β-D-LNA.

본원에서 사용되는 바와 같이, 용어 "cap 구조" 또는 "말단 cap 모이어티"는 AC의 말단 중 어느 하나에 혼입된 화학적 변형을 지칭한다. 용어 "치료 폴리펩티드"는, 2개 이상의 아미노산을 포함하고 치료적, 예방적, 또는 다른 생물학적 활성을 갖는 자연 발생 거대분자 또는 재조합적으로 생산된 거대분자를 지칭한다.As used herein, the term “cap structure” or “terminal cap moiety” refers to a chemical modification incorporated into either terminus of AC. The term “therapeutic polypeptide” refers to a naturally occurring or recombinantly produced macromolecule that contains two or more amino acids and has therapeutic, prophylactic, or other biological activity.

용어 “소분자”는 약리학적 활성을 갖고, 분자량이 약 2000 달톤 미만, 또는 약 1000 달톤 미만, 또는 약 500 달톤 미만인 유기 화합물을 지칭한다. 소분자 치료제는 일반적으로 화학적 합성에 의해 제조된다.The term “small molecule” refers to an organic compound that has pharmacological activity and has a molecular weight of less than about 2000 daltons, or less than about 1000 daltons, or less than about 500 daltons. Small molecule therapeutics are generally manufactured by chemical synthesis.

“야생형 표적 단백질”은 표적 유전자의 야생형, 정상적인 버전, 또는 돌연변이되지 않은 버전에 의해 생산된 고유한 기능성 단백질 이성질체를 지칭한다. 야생형 표적 단백질은 또한 재-스플라이싱된 표적 pre-mRNA로부터 생성된 단백질을 지칭하기도 한다.“Wild-type target protein” refers to the unique functional protein isomer produced by the wild-type, normal, or non-mutated version of the target gene. Wild-type target protein also refers to a protein produced from re-spliced target pre-mRNA.

본원에서 사용되는 “재-스플라이싱된 표적 단백질”은 AC가 혼성화되는 표적 pre-mRNA의 스플라이싱으로 인해 mRNA에 의해 암호화된 단백질을 지칭한다. 재-스플라이싱된 표적 단백질은 야생형 표적 단백질과 동일하거나, 야생형 표적 단백질과 상동성이거나, 야생형 표적 단백질의 기능적 변이체이거나, 야생형 표적 단백질의 이소형이거나, 야생형 표적 단백질의 활성 단편일 수 있다.As used herein, “re-spliced target protein” refers to a protein encoded by an mRNA resulting from splicing of a target pre-mRNA to which AC hybridizes. The re-spliced target protein may be identical to the wild-type target protein, homologous to the wild-type target protein, a functional variant of the wild-type target protein, an isoform of the wild-type target protein, or an active fragment of the wild-type target protein.

본원에서 사용되는 바와 같이, “확장된” CUG 및/또는 “확장된” CTG 반복과 같은 “확장된 트리뉴클레오티드 반복”은 트리뉴클레오티드 반복을 함유하거나 암호화하는 유전자가 야생형 유전자에 존재하는 것보다 많은 수의 반복된 연속 트리뉴클레오티드를 함유하는 것을 의미한다. 확장된 뉴클레오티드 반복은 XXX·NNN 또는 (XXX·NNN)으로서 기록될 수 있으며, 여기서 XXX는 DNA 반복을 지칭하고 NNN은 DNA 반복으로부터 전사되는 RNA 반복을 지칭한다. 예를 들어, CTG·CUG 반복은, CUG 반복을 갖는 RNA가 전사되는, CTG DNA 반복을 갖는 유전자를 지칭한다. 구현예에서, 확장된 트리뉴클레오티드 반복에서의 반복의 수는 야생형 유전자보다 5개 이상, 10개 이상, 15개 이상, 또는 20개 이상 더 많다. 구현예에서, 확장된 트리뉴클레오티드 반복은 야생형 유전자보다 2x, 3x, 4x, 5x, 10x, 20x, 50x 또는 그 이상의 트리뉴클레오티드 반복을 포함한다. 확장된 트리뉴클레오티드 반복은 확장된 트리뉴클레오티드 반복을 함유하는 유전자를 가진 대상체에서 질환을 초래할 수 있다. 예를 들어, 유전자에서 확장된 CTG 반복을 갖는 대상체는 DM1 또는 FECD를 앓을 수 있다. DM1에서, DPMK 유전자는 확장된 CTG 반복을 함유한다. DM1을 앓고 있는 대상체는 DPMK 유전자의 3’ 비번역 영역(UTR)에서 50개 이상의 CTG 반복을 가질 수 있는 반면, 비질환 대상체는 일반적으로 DPMK 유전자의 3’ UTR에서 5 내지 34개의 CTG 반복을 갖는다. FECD에서, TCF4 유전자는 확장된 CTG 반복을 함유한다. FECD를 앓고 있는 대상체는 TCF4 유전자의 CTG18.1 유전자좌에서 40개 이상의 CTG 반복을 가질 수 있는 반면, 비질환 대상체는 일반적으로 TCF4 유전자의 CTG18.1 유전자좌에서 30개 이하의 CTG 반복을 갖는다. 확장된 CTG 반복을 갖는 유전자로부터 전사된 mRNA는 확장된 CUG 반복을 갖게 된다.As used herein, “expanded trinucleotide repeats,” such as “expanded” CUG and/or “expanded” CTG repeats, refer to genes containing or encoding trinucleotide repeats in greater numbers than are present in the wild-type gene. means containing repeated consecutive trinucleotides. Extended nucleotide repeats can be written as XXX · NNN or (XXX · NNN), where XXX refers to the DNA repeat and NNN refers to the RNA repeat transcribed from the DNA repeat. For example, CTG · CUG repeats refer to genes with CTG DNA repeats from which RNA with CUG repeats is transcribed. In embodiments, the number of repeats in the expanded trinucleotide repeat is at least 5, at least 10, at least 15, or at least 20 more than the wild type gene. In an embodiment, the expanded trinucleotide repeat comprises 2x, 3x, 4x, 5x, 10x, 20x, 50x or more trinucleotide repeats than the wild type gene. Expanded trinucleotide repeats can cause disease in subjects whose genes contain the expanded trinucleotide repeats. For example, a subject with an expanded CTG repeat in a gene may have DM1 or FECD. In DM1, the DPMK gene contains expanded CTG repeats. Subjects suffering from DM1 may have more than 50 CTG repeats in the 3' untranslated region (UTR) of the DPMK gene, whereas non-disease subjects typically have 5 to 34 CTG repeats in the 3' UTR of the DPMK gene. . In FECD, the TCF4 gene contains expanded CTG repeats. Subjects suffering from FECD may have 40 or more CTG repeats at the CTG18.1 locus of the TCF4 gene, whereas non-disease subjects typically have 30 or fewer CTG repeats at the CTG18.1 locus of the TCF4 gene. mRNA transcribed from a gene with expanded CTG repeats will have expanded CUG repeats.

본 개시에서 용어 “하류”가 유전자, mRNA, 또는 단백질에 관한 것일 때, 상기 용어는 표적 뉴클레오티드(예를 들어, 표적 전사체)에 대한 AC의 결합에 의해 영향을 받지만 표적 뉴클레오티드에 상응하는 유전자, mRNA, 또는 단백질이 아닌 유전자, mRNA, 또는 단백질을 지칭한다. AC가 표적 뉴클레오티드에 결합하면 MBNL1 또는 CUGBP1과 같은 RNA 결합 단백질이 CUG 반복을 갖는 축적된 mRNA 상에 응집되거나 격리되는 것을 감소시킬 수 있으며, 이는 이러한 RNA 결합 단백질을 하류 유전자 산물의 적절한 전사, RNA 가공, 및/또는 발현에 이용할 수 있게 할 수 있다.When the term “downstream” in the present disclosure refers to a gene, mRNA, or protein, the term refers to a gene affected by the binding of an AC to a target nucleotide (e.g., a target transcript) but corresponding to the target nucleotide; Refers to a gene, mRNA, or protein other than mRNA or protein. Binding of AC to target nucleotides may reduce the aggregation or sequestration of RNA-binding proteins such as MBNL1 or CUGBP1 on accumulated mRNAs with CUG repeats, which may enable these RNA-binding proteins to participate in the proper transcription of downstream gene products, RNA processing. , and/or can be made available for expression.

본원에서 사용되는 바와 같이, “기능적 단편” 또는 “활성 단편”은 전장 야생형 표적 단백질의 하나 이상의 활성과 같은 활성을 나타내거나 다른 활성을 갖는 진핵 생물 야생형 표적 단백질의 일부를 지칭한다. 구현예에서, 야생형 표적 단백질의 적어도 하나의 생물학적 활성을 공유하는 재-스플라이싱된 표적 단백질은 야생형 표적 단백질의 활성 단편인 것으로 간주된다. 활성은 전장 야생형 표적 단백질의 활성의 임의의 (대략적인) 백분율일 수 있으며, 야생형 표적 단백질과 비교하여 약 1%, 약 2%, 약 3%, 약 4%, 약 5%, 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99%, 약 100%, 약 200%, 약 300%, 약 400%, 약 500%, 또는 그 이상의 활성(이들 값 사이의 모든 값 및 범위를 포함함)을 포함하지만 이에 한정되지는 않는다. 따라서, 구현예에서, 활성 단편은 야생형 표적 단백질의 하나 이상의 생물학적 활성의 적어도 일부를 보유할 수 있다. 구현예에서, 활성 단편은 야생형 표적 단백질의 하나 이상의 생물학적 활성을 향상시킬 수 있다.As used herein, “functional fragment” or “active fragment” refers to a portion of a eukaryotic wild-type target protein that exhibits an activity equal to or different from one or more activities of the full-length wild-type target protein. In an embodiment, a re-spliced target protein that shares at least one biological activity of the wild-type target protein is considered to be an active fragment of the wild-type target protein. The activity may be any (approximate) percentage of the activity of the full-length wild-type target protein, such as about 1%, about 2%, about 3%, about 4%, about 5%, about 10%, About 20%, about 30%, about 40%, about 50%, about 60%, about 70%, about 80%, about 90%, about 95%, about 96%, about 97%, about 98%, about 99 %, about 100%, about 200%, about 300%, about 400%, about 500%, or more activity (including all values and ranges between these values). Accordingly, in embodiments, the active fragment may retain at least a portion of one or more biological activities of the wild-type target protein. In embodiments, the active fragment can enhance one or more biological activities of a wild-type target protein.

“야생형 표적 단백질”은 표적 유전자의 야생형, 정상적인 버전, 또는 돌연변이되지 않은 버전에 의해 생산된 고유한 기능성 단백질 이성질체를 지칭한다. 야생형 표적 단백질은 적절히 스플라이싱된 표적 pre-mRNA로부터 생성된 단백질을 지칭하기도 한다.“Wild-type target protein” refers to the unique functional protein isomer produced by the wild-type, normal, or non-mutated version of the target gene. Wild-type target protein also refers to a protein produced from properly spliced target pre-mRNA.

본원에서 사용되는 바와 같이, 용어 “스플라이싱” 및 “가공”은 인트론이 제거되고 엑손이 결합되는, pre-mRNA의 전사 후 변형을 지칭한다. 스플라이싱은 스플라이소좀으로 지칭되는 5개의 작은 핵 리보핵단백질(snRNP)로 이루어진 큰 RNA-단백질 복합체에 의해 촉매되는 일련의 반응에서 발생한다. 인트론 내에서, 스플라이싱을 위한 3’ 스플라이스 부위, 5’ 스플라이스 부위, 및 분지 부위가 필요하다. snRNP의 RNA 성분은 인트론과 상호작용하고 촉매에 관여할 수 있다.As used herein, the terms “splicing” and “processing” refer to the post-transcriptional modification of pre-mRNA in which introns are removed and exons are joined. Splicing occurs in a series of reactions catalyzed by a large RNA-protein complex made up of five small nuclear ribonucleoproteins (snRNPs) called the spliceosome. Within the intron, a 3' splice site, 5' splice site, and branch site are required for splicing. The RNA component of snRNP can interact with introns and participate in catalysis.

본원에서 사용되는 바와 같이, 대안적인 스플라이싱은 유전자에 존재하는 엑손의 상이한 조합의 스플라이싱을 지칭하며, 이는 단일 유전자로부터 상이한 mRNA 전사체의 생성을 초래한다.As used herein, alternative splicing refers to the splicing of different combinations of exons present in a gene, which results in the production of different mRNA transcripts from a single gene.

본원에서 사용되는 “재-스플라이싱된 표적 단백질”은 AC가 혼성화되는 표적 pre-mRNA의 스플라이싱으로 인해 mRNA에 의해 암호화된 단백질을 지칭한다. 재-스플라이싱된 표적 단백질은 야생형 표적 단백질과 동일하거나, 야생형 표적 단백질과 상동성이거나, 야생형 표적 단백질의 기능적 변이체이거나, 야생형 표적 단백질의 활성 단편일 수 있다.As used herein, “re-spliced target protein” refers to a protein encoded by an mRNA resulting from splicing of a target pre-mRNA to which AC hybridizes. The re-spliced target protein may be identical to the wild-type target protein, homologous to the wild-type target protein, a functional variant of the wild-type target protein, or an active fragment of the wild-type target protein.

본 명세서에 언급된 모든 간행물, 특허 및 특허 출원은 본 발명이 속하는 당업자의 기술 수준을 나타낸다. 모든 간행물, 특허, 및 특허 출원은 마치 각각의 개별 간행물 또는 특허 출원이 구체적으로 및 개별적으로 참조로서 통합되는 것과 같은 정도로 참조로서 본원에 통합된다.All publications, patents, and patent applications mentioned herein are indicative of the level of skill of those skilled in the art to which this invention pertains. All publications, patents, and patent applications are herein incorporated by reference to the same extent as if each individual publication or patent application was specifically and individually incorporated by reference.

실시예Example

실시예 1. DM1-관련 세포주에서 RNA 병소 형성 및 스플라이싱 구제에 미치는 영향에 대한 PMO 및 PMO-EEV 화합물의 평가Example 1. Evaluation of PMO and PMO-EEV compounds for their effects on RNA foci formation and splicing rescue in DM1-related cell lines.

RNA 병소 형성 및 스플라이싱 구제에 (CUG)7 반복 PMO 및 (CUG)7 반복 PMO-EEV 화합물(표 12의 A 및 D)이 미치는 효과를 DM1-관련 세포주에서 평가하였다. 미스매치된 PMO 서열을 갖는 PMO-EEV 화합물 및 스크램블된 서열을 갖는 PMO도 포함시켰다(표 12의 B 및 C).The effect of (CUG) 7 repeat PMO and (CUG) 7 repeat PMO-EEV compounds (A and D in Table 12 ) on RNA foci formation and splicing rescue was evaluated in DM1-related cell lines. PMO-EEV compounds with mismatched PMO sequences and PMOs with scrambled sequences were also included ( Table 12 , B and C).

실험Experiment

세포. PMO 및 PMO-EEV를 높은 CUG 반복 부하 및 하류 스플라이싱 결함을 갖는 안정한 세포주인 DM1 HeLa 세포 모델(HeLa-480), 및 약 2600개의 CTG 반복 및 하류 스플라이싱 결함을 갖는 DM1 환자 유래의 DM1 근아세포에서 평가하였다. HeLa-480은, CUG 리보핵 병소 및 머슬블라인드(MBNL) 대안적 스플라이싱 인자의 pre-mRNA 표적의 스플라이싱 오류를 포함하여, DM1의 병원성 특징을 재현한다. DM1 근아세포는 상당히 느리게 성장하고(약 7일의 두 배 시간) 형질감염이 잘 되지 않는 것으로 나타났다. 대조군 HeLa 및 HeLa-480 세포를 추가 화합물 없이 ENDOPORTER로 치료하였다. HeLa-480 세포는 질환 상태를 나타내고, HeLa 세포는 비질환 상태를 나타낸다. cell. PMO and PMO-EEV were combined in the DM1 HeLa cell model (HeLa-480), a stable cell line with a high CUG repeat load and a downstream splicing defect, and DM1 patient-derived DM1 with approximately 2600 CTG repeats and a downstream splicing defect. Evaluated in myoblasts. HeLa-480 reproduces the pathogenic features of DM1, including CUG ribonuclear foci and splicing errors in the pre-mRNA target of the muscle blind (MBNL) alternative splicing factor. DM1 myoblasts grew quite slowly (doubling time approximately 7 days) and appeared to be poorly transfected. Control HeLa and HeLa-480 cells were treated with ENDOPORTER without additional compounds. HeLa-480 cells represent a diseased state and HeLa cells represent a non-disease state.

RNA 병소 분석. HeLa-480 세포 또는 DM1 근아세포를 1 μM, 3 μM, 또는 10 μM의 화합물 A~D로 치료하였다(표 12). 모든 화합물을 형질감염 시약 없이 형질감염시키거나, 자연적으로 하전된 PMO를 세포 내로 전달하도록 설계된 ENDOPORTER(GENETOOLS LLC(Philomath, Oregon)로부터 입수 가능함) 형질감염제를 사용하여 형질감염시켰다. 세포를 24시간 동안 인큐베이션한 다음, 현미경을 통한 정성적 RNA 병소 분석을 위해 고정시켰다. 치료한 Hela-480 세포의 정성적 육안 검사 후, 화합물 A(PMO-EEV)는 최소량의 RNA 병소를 나타냈다. DM1 근아세포로부터 결론은 도출되지 않았다. RNA foci analysis . HeLa-480 cells or DM1 myoblasts were treated with 1 μM, 3 μM, or 10 μM of Compounds A-D ( Table 12 ). All compounds were transfected without transfection reagent or using the ENDOPORTER (available from GENETOOLS LLC, Philomath, Oregon) transfection agent, which is designed to deliver naturally charged PMOs into cells. Cells were incubated for 24 hours and then fixed for qualitative RNA foci analysis by microscopy. After qualitative visual inspection of treated Hela-480 cells, Compound A (PMO-EEV) showed minimal amounts of RNA foci. No conclusions were drawn from DM1 myoblasts.

스플라이싱 분석 및 RT-PCR. 전술한 바와 같이 치료한 HeLa-480 세포를 인큐베이션하고 24시간 또는 48시간 후에 수확하고, 총 RNA를 추출하였다. RT-PCR을 수행하여 MBNL1 및 CLASP1과 같은 표적 RNA에서 DM 감염된 엑손의 스플라이싱 패턴을 측정 및/또는 정량화하였다. 관심 엑손 포함 백분율을 평가하였다. Splicing analysis and RT-PCR. HeLa-480 cells treated as described above were incubated and harvested after 24 or 48 hours, and total RNA was extracted. RT-PCR was performed to measure and/or quantify the splicing patterns of DM-infected exons in target RNAs such as MBNL1 and CLASP1. Percentage of exon coverage of interest was assessed.

결과. 도 6a~6d는 HeLa-480 세포를 화합물 A~D 및 ENDOPORTER 형질감염제로 치료하고 24시간 후(6a6c) 및 48시간 후에(6c6d) MBNL1(6a6c, 엑손 5 포함) 및 CLASP1(6b6d, 엑손 19 포함)의 대안적인 스플라이싱 이벤트에 대한 RT-PCR 결과를 보여준다. 화합물 A~D 각각으로 치료한 세포의 경우, 24시간 및 48시간 시점 모두에 MBNL1에서 엑손 5 포함의 감소가 관찰되었다(도 6a 6c). 화합물 A로 치료한 세포는 가장 큰 구제(엑손 5 포함 감소)를 나타냈다. 화합물 A~D 각각으로 치료한 세포의 경우, 24시간 및 48시간 시점 모두에 CLASP1에서 엑손 19 포함의 증가가 관찰되었다(도 6b 6d). 화합물 A로 치료한 세포는 가장 큰 구제(엑손 19 포함 증가)를 나타냈다. 대조적으로, HeLa-480 세포를 ENDOPORTER 형질감염 시약 없이 A~D로 치료했을 때, MBNL1의 스플라이싱 이벤트(도 6e) 또는 CLASP1의 스플라이싱 이벤트(도 6f)에 있어서의 변화는, 화합물 A를 제외하고는, 관찰되지 않았다. result. Figures 6A-6D show MBNL1 ( 6a and 6c, including exon 5) and CLASP1 24 h ( 6a and 6c ) and 48 h ( 6c and 6d ) after treatment of HeLa-480 cells with compounds A-D and ENDOPORTER transfection agent. Shows RT-PCR results for alternative splicing events ( 6b and 6d , involving exon 19). For cells treated with compounds A to D, respectively, a decrease in exon 5 inclusion in MBNL1 was observed at both 24 and 48 h time points ( Figures 6A and 6C ). Cells treated with Compound A showed the greatest rescue (reduced exon 5 inclusion). For cells treated with compounds A to D, respectively, an increase in exon 19 inclusion in CLASP1 was observed at both 24 and 48 h time points ( Figures 6B and 6D ). Cells treated with Compound A showed the greatest rescue (increased inclusion of exon 19). In contrast, when HeLa-480 cells were treated with A to D without ENDOPORTER transfection reagent, no changes in the splicing events of MBNL1 ( Figure 6E ) or CLASP1 ( Figure 6F ) were observed with compound A. Except, it was not observed.

도 7a~7b는 DM1 근아세포를 화합물 A~D, 음성 대조군 DM-04, 또는 양성 대조군 DM-05로 치료한 후 MBNL1 및 CLASP1의 대안적인 스플라이싱 이벤트에 대한 RT-PCR 결과를 보여준다. 모든 화합물에 의한 치료는 MBNL1(도 7a) 및 CLASP1(도 7b)의 스플라이싱 이벤트의 구제를 나타냈다. Figures 7A-7B show RT-PCR results for alternative splicing events of MBNL1 and CLASP1 after treating DM1 myoblasts with compounds A-D, negative control DM-04, or positive control DM-05. Treatment with all compounds showed rescue of splicing events of MBNL1 ( Figure 7A ) and CLASP1 ( Figure 7B ).

실시예 2. DM1-마우스 모델에서 스플라이싱 구제에 EEV-PMO 221-1106이 미치는 영향에 대한 평가Example 2. Evaluation of the effect of EEV-PMO 221-1106 on splicing rescue in the DM1-mouse model

PMO 단독 및 PMO-EEV(표 13)가 스플라이싱 구제에 미치는 효과를 HSA-LR DM1-마우스 모델을 사용하여 생체 내에서 평가하였다.The effects of PMO alone and PMO-EEV ( Table 13 ) on splicing rescue were evaluated in vivo using the HSA-LR DM1-mouse model.

실험.Experiment.

마우스 모델. HSA-LR은 인간 골격 액틴(HSA) 이식유전자의 3′-UTR에서 확장된 긴 CUG 반복(LR)을 갖는 유전자이식 마우스 모델로서, 골격근에서 높은 수준으로 CUGexp RNA(예: 확장된 CUG RNA)를 발현한다(Mankodi 등의 문헌[Science 2000, 289(5485):1769-1773]). HSA-LR 마우스는 스플라이싱 결함과 함께 근긴장성 표현형을 나타낸다. Friend 바이러스 B NIH Jackson(FVB/NJ) 마우스 모델을 대조군으로서 사용하였고, 이를 사용해 HSA-LR 유전자이식 마우스를 만들었다. Mouse model. HSA-LR is a transgenic mouse model carrying an expanded long CUG repeat (LR) in the 3′-UTR of the human skeletal actin (HSA) transgene, which produces high levels of CUGexp RNA (i.e. expanded CUG RNA) in skeletal muscle. expressed (Mankodi et al., Science 2000, 289(5485):1769-1773]). HSA-LR mice display a myotonic phenotype with splicing defects. The Friend virus B NIH Jackson (FVB/NJ) mouse model was used as a control, and HSA-LR transgenic mice were created.

실험 설계. 화합물 A~D를 체중 20 g 당 100 μL 화합물 용액의 1회 투여량으로, 후안와 주사 또는 정맥내(IV) 주사를 통해 마우스에게 투여하였다. 투여량은 각 마우스의 체중에 비례하였다(예를 들어, 체중 30 g 당 150 μL). Experimental Design. Compounds A-D were administered to mice via retroorbital injection or intravenous (IV) injection at a single dose of 100 μL compound solution per 20 g of body weight. The dosage was proportional to the body weight of each mouse (e.g., 150 μL per 30 g body weight).

연령이 일치하는 동물을 6개의 치료군에 배정하였다. 2개의 대조군을 사용하였고, 이들 각각에게 식염수를 주입하였다; 군 1: FVB/NJ 마우스(FVB/NJ; 무질환 대조군) 및 군 2: HSA-LR(질환 대조군) 마우스. 4개의 치료군(군 A~D)을 사용하였고; HSA-LR 마우스에게 화합물 A, B, C, 또는 D를 주입하였다. 주입 시점에 FVB/NJ 마우스는 5주 및 4일령이었고, HSA-LR 마우스는 6주 및 1일령 또는 2일령이었다. 군 당 4마리의 마우스(수컷 2마리 및 암컷 2마리)를 본 실험에 사용하였다. 치료하고 1주일 후에 마우스를 희생시켰다. 조직(비복근, 사두근, 전경골(TA))을 채취하고, 액체 질소 중에서 급속 냉동시키고, 스플라이싱 구조 분석의 추가 평가를 위해 -80℃에서 보관하였다.Age-matched animals were assigned to six treatment groups. Two control groups were used, each of which was injected with saline; Group 1: FVB/NJ mice (FVB/NJ; disease-free control) and Group 2: HSA-LR (disease control) mice. Four treatment groups (groups A-D) were used; HSA-LR mice were injected with compound A, B, C, or D. At the time of injection, FVB/NJ mice were 5 weeks and 4 days old, and HSA-LR mice were 6 weeks and 1 or 2 days old. Four mice (2 males and 2 females) per group were used in this experiment. Mice were sacrificed 1 week after treatment. Tissues (gastrocnemius, quadriceps, tibialis anterior (TA)) were harvested, flash frozen in liquid nitrogen, and stored at -80°C for further evaluation of splicing structure analysis.

조직 샘플로부터 총 RNA를 추출하고 RT-PCR로 분석하여, 다음에 대한 AC-유도된 대안적인 RNA 스플라이싱 구제 이벤트를 평가하였다: (i) Atp2a1 엑손 22, (ii) Nfix 엑손 7, (iii) Clcn1 엑손 7a, 및 (iv) Mbnl1 엑손 5. 관심 엑손 포함 백분율을 평가하였다.Total RNA was extracted from tissue samples and analyzed by RT-PCR to evaluate AC-induced alternative RNA splicing rescue events for: (i) Atp2a1 exon 22, (ii) Nfix exon 7, and (iii) ) Clcn1 exon 7a, and (iv) Mbnl1 exon 5. The percentage inclusion of exons of interest was assessed.

결과. 치료 전에, 모든 HSA-LR 마우스는 근긴장증을 가졌다. 화합물의 주입 후, 모든 마우스는 방향을 잃었다. 화합물 A 및 B를 주입한 마우스(군 A 및 B)는 15분 이내에 회복된 반면, 화합물 C 및 D를 주입한 마우스(군 C 및 D)는 몇 시간 후에 회복하였다. 치료한 모든 마우스는 다음 날까지 완전히 회복되었다. 희생 시점에, 군 A 및 B는 근긴장증을 가졌지만; 군 C 및 D는 근긴장증을 갖지 않은 것이 분명했다. result. Before treatment, all HSA-LR mice had myotonia. After injection of the compound, all mice became disoriented. Mice injected with compounds A and B (groups A and B) recovered within 15 minutes, whereas mice injected with compounds C and D (groups C and D) recovered after several hours. All treated mice fully recovered by the next day. At the time of sacrifice, Groups A and B had myotonia; Groups C and D clearly did not have myotonia.

도 8a~10d는 치료한 마우스의 비복근(도 8a~8d), 사두근(도 9a~9d), 및 전경골근(도 10a~10d) 조직에서 Atp2a1(엑손 22 포함에 대해; 도 8a, 9a,10a), Nfix(엑손 7 포함에 대해; 도 8b, 9b, 10b), Clcn1(엑손 7a 포함에 대해; 도 8c, 9c,10c), 및 Mbnl1(엑손 5 포함에 대해; 도 8d, 9d, 10d)에 대한 RNA 스플라이싱 측정을 보여준다. 화합물 C 및 D(PMO-EEV)로 치료한 마우스는 비복근, 사두근, 및 전경골 조직에서 Atp2a1 및 Nfix 스플라이싱 이벤트의 구제를 나타낸 반면, PMO 및 식염수 치료군은 스플라이싱 이벤트의 구제를 나타내지 않았다(도 8a, 8b, 9a, 9b, 10a,10b). 유사하게, 비복근 및 사두근 조직에서, 화합물 C 및 D로 치료한 마우스는 Clcn1(도 8c 9c) 및 Mbnl1(도 8d 9d) 스플라이싱 이벤트의 구제를 나타낸 반면, PMO 및 식염수 치료군은 스플라이싱 이벤트의 구제를 나타내지 않았다. 전경골근 조직에서 Clcn1 및 Mbnl1의 스플라이싱과 관련하여(도 10c~10d), 대조군 마우스 계통(FVB/NJ) 및 DM1 마우스 모델(HSA-LR)에서는 대안적인 스플라이싱 결함은 검출되지 않았다. 이와 같이, 화합물 A~D로 치료한 경우, 경골 조직에서 Clcn1 및 Mbnl1 유전자의 스플라이싱 구제가 나타나지 않았다.Figures 8A-10D show Atp2a1 (for exon 22 inclusions; Figures 8A-9A , and 10a ), Nfix (for inclusion of exon 7; Figures 8B, 9B, and 10B ), Clcn1 (for inclusion of exon 7a; Figures 8C, 9C, and 10C ), and Mbnl1 (for inclusion of exon 5; Figures 8D, 9D Shows RNA splicing measurements for , and 10d ). Mice treated with compounds C and D (PMO-EEV) showed rescue of Atp2a1 and Nfix splicing events in gastrocnemius, quadriceps, and tibialis anterior tissues, whereas PMO and saline treatment groups did not show rescue of splicing events. ( Figures 8a, 8b, 9a, 9b, 10a, and 10b ). Similarly, in gastrocnemius and quadriceps tissue, mice treated with compounds C and D expressed Clcn1 ( Figures 8C and 9C ). and Mbnl1 ( Figures 8D and 9D ). showed rescue of splicing events, whereas PMO and saline treatment groups did not show rescue of splicing events. Regarding the splicing of Clcn1 and Mbnl1 in tibialis anterior tissue ( Figures 10C-10D ), no alternative splicing defects were detected in the control mouse strain (FVB/NJ) and DM1 mouse model (HSA-LR). Likewise, treatment with compounds A to D did not result in splicing rescue of Clcn1 and Mbnl1 genes in tibial tissue.

이들 결과는 DM1 마우스 모델을 사용한 스플라이싱 구제의 생체 내 연구에서 PMO-EEV 치료가 미치는 긍정적인 영향을 미쳤음을 입증할 뿐만 아니라, 근긴장성 이영양증(DM)을 치료하기 위한 PMO-EEV 화합물의 잠재적인 용도도 입증한다.These results not only demonstrate the positive impact of PMO-EEV treatment in in vivo studies of splicing rescue using the DM1 mouse model, but also demonstrate the potential of PMO-EEV compounds to treat myotonic dystrophy (DM). It also proves the intended use.

실시예 3. DM1 환자 유래의 불멸화된 근아세포에서 스플라이싱 오류 이벤트를 교정하는 것에 대한 다양한 PMO-EEV 화합물의 평가Example 3. Evaluation of various PMO-EEV compounds for correcting splicing error events in immortalized myoblasts from DM1 patients.

DM1 환자 유래 근육 근아세포 및 근관을 사용하여, 2개의 DMPK CUG-표적화 PMO-EEV(197-777 및 221-1106; 표 14)가 DM1-관련 유전자의 스플라이싱 구제에 미치는 효과를 시험관 내에서 평가하였다.Using DM1 patient-derived muscle myoblasts and myotubes, the effects of two DMPK CUG-targeting PMO-EEVs (197-777 and 221-1106; Table 14 ) on splicing rescue of DM1-related genes were examined in vitro. evaluated.

실험.Experiment.

세포 배양DM1 환자(ASA308DM1) 및 병에 걸리지 않은 개체(KM1421; AB1190) 유래의 불멸화된 근아세포를 수득하였다. DM1 환자 근아세포는 DMPK의 3′-UTR에서 2600개의 CTG 반복을 보유한다. 골격근 세포 성장 배지(PromoCell (Heidelberg, Germany)로부터 입수 가능함), 2% 말 혈청(리조나주 브리스톨 소재의 Gibco로부터 입수 가능함), 1% 이마 배아 추출물(Gibco (Bristol, RI)로부터 입수 가능함), 및 0.5 mg/mL 페니실린/스트렙토마이신(Gibco)으로 이루어진 성장 배지에서 근아세포를 배양하였다. 근원세포 분화를 위해, 컨플루언트 배양물을 2% 말 혈청이 보충된 DMEM의 분화 배지로 전환시키고 4일 동안 배양하였다. Cell Culture Immortalized myoblasts from DM1 patients (ASA308DM1) and unaffected individuals (KM1421; AB1190) were obtained. DM1 patient myoblasts possess 2600 CTG repeats in the 3′-UTR of DMPK. Skeletal muscle cell growth medium (available from PromoCell (Heidelberg, Germany)), 2% horse serum (available from Gibco, Bristol, RI), 1% forehead embryo extract (available from Gibco (Bristol, RI)), and Myoblasts were cultured in growth medium consisting of 0.5 mg/mL penicillin/streptomycin (Gibco). For myoblast differentiation, confluent cultures were switched to differentiation medium of DMEM supplemented with 2% horse serum and cultured for 4 days.

치료. DM1 환자 근육 세포를 2개의 상이한 치료 조건을 사용하여 10 μm, 3 μm, 1 μm, 또는 0.3 μm의 화합물로 치료하였다. 제1 조건에서, 근아세포를 75~80% 컨플루언스에서 도말하고, 화합물을 성장 배지에서 연속 희석하고, 세포를 24시간 동안 조에 담궈 화합물이 자유롭게 흡수되도록 하였다. 화합물 함유 배지를 제거하고, 근아세포를 1X DPBS(Gibco)로 세척하고, 수확 전 4일 동안 분화시켰다. 병행하여 실행되는 제2 조건의 경우, 치료 3일 전에 근아세포를 분화시키고, 화합물을 분화 배지에서 연속 희석하고, 24시간 후에 분석을 위해 근관을 채취하였다. therapy. DM1 patient muscle cells were treated with 10 μM, 3 μM, 1 μM, or 0.3 μM compounds using two different treatment conditions. In the first condition, myoblasts were plated at 75-80% confluence, compounds were serially diluted in growth medium, and cells were soaked in bath for 24 hours to allow free uptake of compounds. Compound-containing medium was removed, and myoblasts were washed with 1X DPBS (Gibco) and differentiated for 4 days before harvest. For a second condition run in parallel, myoblasts were differentiated 3 days prior to treatment, compounds were serially diluted in differentiation medium, and myotubes were harvested for analysis 24 hours later.

RNA 단리 및 PCR. RNEASY 미니 키트(Qiagen (Germantown, MD)으로부터 입수 가능함)를 제조사의 지침에 따라 사용해 총 RNA를 단리하였다. 엑손 포함을 위해, 100 ng RNA를 역전사하고 PCR(OneStep RT-PCR 키트, Qiagen)에 사용하였다. HT DNA 고감도 검정 키트와 함께 LabChip(PerkinElmer (Waltham, MD)로부터 입수 가능함)에 의해 샘플을 분석하였다. RNA isolation and PCR . Total RNA was isolated using the RNEASY Mini Kit (available from Qiagen (Germantown, MD) according to the manufacturer's instructions. For exon inclusion, 100 ng RNA was reverse transcribed and used for PCR (OneStep RT-PCR kit, Qiagen). Samples were analyzed by LabChip (available from PerkinElmer (Waltham, MD)) with the HT DNA High Sensitivity Assay Kit.

결과. DMPK CUG 표적화 PMO(EEV와 접합되지 않음)는 MBNL1 엑손 5의 스플라이싱 오류를 개선하였다(데이터 미도시). 도 11a~11f는 다양한 농도의 DMPK CUG-표적화 EEV-PMO(CUGexp 197-777 및 CUGexp 221-1106)로 치료한 DM1 환자 유래의 근육 세포에서 MBNL1(도 11a) 및 이의 표적(SOS1, IR, DMD, BIN1, LDB3; 도 11b~11f)의 스플라이싱 결함의 혼합된 구제를 보여준다. EEV-PMO 197-777은 DM1 환자 근육 세포에서 스플라이싱 오류 이벤트의 중간 정도의 교정을 유도하였다. MBNL1 및 SOS1은 스플라이싱 오류 교정의 최상의 반응을 나타냈다. EEV-PMO 197-777을 아래에 기술된 추적 관찰 실험을 위한 도구 화합물로서 선택하였다. result. DMPK CUG targeting PMO (not conjugated with EEV) improved splicing errors in MBNL1 exon 5 (data not shown). Figures 11A-11F show MBNL1 ( Figure 11A ) and its targets (SOS1, IR) in muscle cells from DM1 patients treated with various concentrations of DMPK CUG-targeted EEV-PMO (CUG exp 197-777 and CUG exp 221-1106). , DMD, BIN1, and LDB3; Figures 11b-11f ) show mixed rescue of splicing defects. EEV-PMO 197-777 induced moderate correction of splicing error events in DM1 patient muscle cells. MBNL1 and SOS1 showed the best response of splicing error correction. EEV-PMO 197-777 was selected as the instrumental compound for the follow-up experiments described below.

DM1 환자 유래의 근아세포 및 근관을 전술한 것과 유사한 방법을 사용하여 10 μm, 3 μm, 및 1 μm의 DMPK CUG-표적화 EEV-PMO 197-777로 치료하였다. MNBL1 및 MNBL1 표적의 대안적인 RNA 스플라이싱 이벤트의 구제를 평가하였다. 근아세포 및 근관을 EEV-PMO로 치료한 후, MNBL1(엑소 5 배제; 도 12a), SOS1(엑손 25 포함; 도 12b), INSR (엑손 11 포함; 도 12c), DMD (엑손 78 포함, 도 12d), BIN1(엑손 11 포함; 도 12e), 및 LDB3 (엑손 11 배제; 도 12f)에 대해 다양한 정도의 스플라이싱 교정이 관찰되었다.Myoblasts and myotubes from DM1 patients were treated with 10 μm, 3 μm, and 1 μm of DMPK CUG-targeted EEV-PMO 197-777 using methods similar to those described above. Rescue of alternative RNA splicing events of MNBL1 and MNBL1 targets was assessed. After treatment of myoblasts and myotubes with EEV-PMO, MNBL1 (excluding exon 5; Figure 12A ), SOS1 (including exon 25; Figure 12B ), INSR (including exon 11; Figure 12C ), and DMD (including exon 78; Figure 12C ) Various degrees of splicing correction were observed for BIN1 ( including exon 11; Figure 12e ), and LDB3 (excluding exon 11; Figure 12f ).

도 44a~44d는 근육 이완 검정에 의해 정량화된 20 mpk의 221-1106으로 치료한 HSA-LR 마우스에서 근긴장증 표현형의 역전을 보여준다. 도 44a 44c는 피크 등척성 근력의 80%까지의 이완 시간의 도표를 도시하고, 도 44b는 근력 트레이스의 원시 데이터를 보여준다. 도 44d는 20 mpk의 221-1106로 치료한 HSA-LR 마우스에서 근긴장증 표현형이 역전되었음을, 대표적인 근전도(EMG) 트레이스에 의해 정량화하여 보여준다. Figures 44A-44D show reversal of the myotonia phenotype in HSA-LR mice treated with 20 mpk of 221-1106, quantified by muscle relaxation assay. Figures 44A and 44C show plots of relaxation time to 80% of peak isometric strength, and Figure 44B shows the raw data of the strength trace. Figure 44D shows reversal of myotonia phenotype in HSA-LR mice treated with 20 mpk of 221-1106, quantified by representative electromyographic (EMG) traces.

실시예 4. DM1 마우스 모델에서 PMO-EEV 221-1120의 평가 Example 4. Evaluation of PMO-EEV 221-1120 in DM1 mouse model

실시예 2에 기술된 것과 동일한 HSA-LR 유전자이식 마우스 모델에서 하류 유전자의 스플라이싱 및 mRNA 수준에 EEV-PMO 221-1120(EEV-PMO-DM1-3 또는 DM1-3으로도 지칭됨; PMO 221 = 5’-CAG CAG CAG CAG CAG CAG CAG-3’ (서열번호 154; 모두 PMO 단량체임); EEV 1120 = Ac-PKKKRKV-AEEA-Lys(시클로[FGFGRGRQ]-PEG12-OH (Ac-(서열번호 42)-AEEA-Lys(서열번호 82)-PEG12-OH))이 미치는 효과를 연구하기 위해 DM1 마우스 모델을 수행하였다. 아미드 화학을 사용해 PMO와 EEV를 접합시켰다.EEV-PMO 221-1120 (also referred to as EEV-PMO-DM1-3 or DM1-3; PMO) affected splicing and mRNA levels of downstream genes in the same HSA-LR transgenic mouse model as described in Example 2. 221 = 5'-CAG CAG CAG CAG CAG CAG CAG CAG-3' (SEQ ID NO: 154; all are PMO monomers); EEV 1120 = Ac-PKKKRKV-AEEA-Lys (cyclo[FGFGRGRQ]-PEG12-OH (Ac-(sequence To study the effect of No. 42)-AEEA-Lys (SEQ ID No. 82)-PEG12-OH)), a DM1 mouse model was performed. PMO and EEV were conjugated using amide chemistry.

실험. 2개의 일반적인 치료군이 있었다: 1) 야생형 마우스; 및 2) HSA-LR 마우스(DM1 질환 모델). HSA-LR 치료군 내에는 2개의 하위 치료군이 있었다: 1) 식염수로 치료한 HSA-LR(대조군); 및 2) HSA-LR + EEV-PMO 221-1120. 15 mpk, 30 mpk, 60 mpk, 또는 90 mpk(PMO 기준)의 PMO-EEV 또는 식염수를 꼬리 정맥을 통해 주사하여 마우스를 치료하였다. 치료하고 7일 후에, 마우스를 희생시키고, 분석을 위해 조직을 채취하였다. Experiment. There were two general treatment groups: 1) wild-type mice; and 2) HSA-LR mice (DM1 disease model). Within the HSA-LR treatment group, there were two sub-treatment groups: 1) HSA-LR treated with saline (control); and 2) HSA-LR + EEV-PMO 221-1120. Mice were treated by injecting 15 mpk, 30 mpk, 60 mpk, or 90 mpk (based on PMO) of PMO-EEV or saline via the tail vein. Seven days after treatment, mice were sacrificed and tissues were collected for analysis.

RT-PCR 검정(스플라이싱 교정). OMNI 비드 밀 균질화기로 조직을 균질화시키고, QIACUBEQ로 RNA를 추출하였다. 제조사의 프로토콜에 따라(35 사이클의 PCR, 94℃에서 30초; 60℃에서 30초; 및 72℃에서 30초/사이클) 1단계 RT-PCT 키트(Qiagen)를 사용해 RT-PCR 검정을 수행하였다. 유전자 특이적 프라이머의 서열은 다음과 같다: Clcn1 엑손 7a 포함 정방향 프라이머 = 5’-TTCACATCGCCAGCATCTGTGC-3’ (서열번호 319), 역방향 프라이머 = 5’-CACGGAACACAAAGGCACTGAATGT-3’ (서열번호 320); Mbnl1 엑손5 포함 정방향 프라이머 = 5’-GCTGCCCAATACCAGGTCAAC-3’ (서열번호 321), 역방향 프라이머 = 5’-TGGTGGGAGAAATGCTGTATGC-3’ (서열번호 322); RT-PCR assay (splicing correction). Tissue was homogenized with an OMNI bead mill homogenizer, and RNA was extracted with QIACUBEQ. RT-PCR assays were performed using a one-step RT-PCT kit (Qiagen) according to the manufacturer's protocol (35 cycles of PCR, 30 s at 94°C; 30 s/cycle at 60°C; and 30 s/cycle at 72°C). . The sequences of the gene-specific primers are as follows: forward primer containing Clcn1 exon 7a = 5'-TTCACATCGCCAGCATCTGTGC-3' (SEQ ID NO: 319), reverse primer = 5'-CACGGAACAAAAGGCACTGAATGT-3' (SEQ ID NO: 320); Forward primer containing Mbnl1 exon 5 = 5'-GCTGCCCAATACCAGGTCAAC-3' (SEQ ID NO: 321), reverse primer = 5'-TGGTGGGAGAAATGCTGTATGC-3' (SEQ ID NO: 322);

Atp2a1 엑손 22 포함 정방향 프라이머 = 5’-GCTCATGGTCCTCAAGATCTCAC-3’ (서열번호 323), 역방향 프라이머: 5’-GGGTCAGTGCCTCAGCTTTG-3’ (서열번호 324);Forward primer containing Atp2a1 exon 22 = 5'-GCTCATGGTCCTCAAGATCTCAC-3' (SEQ ID NO: 323), reverse primer: 5'-GGGTCAGTGCCTCAGCTTTG-3' (SEQ ID NO: 324);

Nfix 엑손 7 포함 정방향 프라이머 = 5’-TCGACGACAGTGAGATGGAG-3’ (서열번호 325), 역방향 프라이머 5’ CAAACTCCTTCAGCGAGTCC-3’ (서열번호 326). Clcn1, Mbnl1, 및 Atp2a1에 대한 프라이머는 Klein 등의 문헌[The Journal of Clinical Investigation. 2019, 129 (11), pg. 4739]로부터 유래하였고; Nfix에 대한 프라이머는 Chen 등의 문헌[Scientific Reports. 2016, 6(1), pg. 1]로부터 유래하였다. cDNA 생성물을 SYBR SAFE 염료가 포함된 2% 아가로오스 E-겔 상에서 분리하였다. 엑손 포함 백분율은 스키핑되지 않은 밴드/(스키핑되지 않은 밴드 + 스키핑된 밴드)의 비율로 계산하였다. Forward primer containing Nfix exon 7 = 5'-TCGACGACAGTGAGATGGAG-3' (SEQ ID NO: 325), reverse primer 5' CAAACTCCTTCAGCGAGTCC-3' (SEQ ID NO: 326). Primers for Clcn1, Mbnl1, and Atp2a1 are described in Klein et al., The Journal of Clinical Investigation. 2019, 129 (11), pg. 4739]; Primers for Nfix are described in Chen et al. [Scientific Reports. 2016, 6(1), pg. 1]. cDNA products were separated on a 2% agarose E-gel containing SYBR SAFE dye. The percentage of exon inclusion was calculated as the ratio of unskipped band/(unskipped band + skipped band).

마우스 DM1 스플라이싱 지수(mDSI) 계산. mDSI는 Tanner 등의 문헌 프로토콜에 따라 계산하였다 (Tanner 등의 문헌[Nucleic acids research. 2021, 49 (4), pg. 2240-54]). 각각의 샘플(i)에 대해, 각 스플라이싱 이벤트(j)에 대해 정규화된 스플라이싱 값을 (PSIi,j - PSI야생형,j)/(PSIHSALR,j -PSI야생형,j)로서 계산하였는데, 식 중 PSI야생형,j는 모든 야생형 마우스의 이벤트(j)에 대한 평균 PSI이고, PSIHSALR,j는 모든 HSALR 마우스에의 이벤트(j)에 대한 평균 PSI이다. 그런 다음, 임상시험 중인 Atp2a1, Nfix, Mbnl1, 및 Clcn1의 mDSI를 모든 정규화된 스플라이싱 값의 평균으로서 계산한다. Mouse DM1 splicing index (mDSI) calculation. mDSI was calculated according to the protocol of Tanner et al. (Tanner et al. [Nucleic acids research. 2021, 49 (4), pg. 2240-54]). For each sample (i), the normalized splicing value for each splicing event (j) is given as (PSI i,j - PSI wild-type,j )/(PSI HSALR,j -PSI wild-type,j ). It was calculated, where PSI wild type,j is the average PSI for events (j) in all wild type mice, and PSI HSALR,j is the average PSI for events (j) in all HSALR mice. The mDSI of Atp2a1, Nfix, Mbnl1, and Clcn1 in clinical trials is then calculated as the average of all normalized splicing values.

qRT-PCR 검정(HSA mRNA 녹다운). Life Technologies Corporation의 고 용량 cDNA 역전사 키트를 제조사의 프로토콜에 따라 사용하여 역전사를 수행하였다. 정량적 실시간 PCR은 Bio-Rad SyBr Green Supermix 및 QuantStudio3 qPCR 기계를 사용해 수행하였고, 유전자 특이적 프라이머는 다음과 같다: HSA mRNA 정방향 프라이머 = 5’-TTCCATCGTCCACCGCAAAT-3’ (서열번호 327), 역방향 프라이머 = 5’-AGTTTACGATGGCAGCAACG-3’ (서열번호 328)(둘 다 Klein 등의 문헌[The Journal of Clinical Investigation. 2019, 129 (11), pg. 4739] 유래의 것임); 및 마우스 GAPDH 정방향 프라이머 = 5’-AGGTCGGTGTGAACGGATTTG-3’ (서열번호 329), 역방향 프라이머 = 5’-TGTAGACCATGTAGTTGAGGTCA-3’ (서열번호 330). qRT-PCR assay (HSA mRNA knockdown). Reverse transcription was performed using a high-capacity cDNA reverse transcription kit from Life Technologies Corporation according to the manufacturer's protocol. Quantitative real-time PCR was performed using a Bio-Rad SyBr Green Supermix and QuantStudio3 qPCR machine, and the gene-specific primers were as follows: HSA mRNA forward primer = 5'-TTCCATCGTCCACCGCAAAT-3' (SEQ ID NO: 327), reverse primer = 5. '-AGTTTACGATGGCAGCAACG-3' (SEQ ID NO: 328) (both from Klein et al. [The Journal of Clinical Investigation. 2019, 129 (11), pg. 4739]); and mouse GAPDH forward primer = 5'-AGGTCGGTGTGAACGGATTTG-3' (SEQ ID NO: 329), reverse primer = 5'-TGTAGACCATGTAGTTGAGGTCA-3' (SEQ ID NO: 330).

RNAseq. 전사체 프로파일링을 위해 차세대 시퀀싱을 사용하는 폴리A RNAseq를 수행하였다. 각 유전자에 대한 Z-스코어를 (샘플 값 - 평균)/(표준 편차)로서 계산하였다. RNAseq 데이터에 대한 차등 스플라이싱 분석을 수행하여 각 유전자에 대한 개별 엑손의 스플라이싱 백분율(PSI)을 계산하였다. PSI는 해당 이벤트에 대한 전체 정규화된 리드(포함 및 배제 리드) 대비 전사체 요소의 포함을 나타내는 정규화된 판독 카운트의 비율이다. 예를 들어, 엑손이 100%의 시간 동안 판독에 포함되는 경우, PSI는 1이다. 또한, 엑손이 100%의 시간 동안 판독으로부터 제외되는 경우, PSI는 0이다. RNAseq. PolyA RNAseq using next-generation sequencing was performed for transcriptome profiling. Z-score for each gene was calculated as (sample value - mean)/(standard deviation). Differential splicing analysis was performed on RNAseq data to calculate percent splicing (PSI) of individual exons for each gene. PSI is the ratio of normalized read counts indicating inclusion of a transcript element relative to the total normalized reads (included and excluded reads) for that event. For example, if an exon is included in the read 100% of the time, the PSI is 1. Additionally, if an exon is excluded from reads 100% of the time, the PSI is 0.

DM1을 예측하는 것으로 알려진 22개의 관심 유전자를 분석하였다. 추가로, Wagner 등의 문헌[PLOS Gen 2016 (47)] 및 Tanner 등의 문헌[NAR 2021 (48), 4, 2240-2254]에서 연구된 유전자를 분석하였다. 마우스 엑손을 인간 위치에 맵핑하였다. 일부 경우에, 마우스 및/또는 인간 게놈에서 엑손의 경계는 완전히 알려지지는 않았다. 이와 같이, 상이한 경계를 사용하여 데이터를 분석하였다. RNAseq 데이터를 사용하여 정확한 경계를 확인하였다.Twenty-two genes of interest known to predict DM1 were analyzed. Additionally, genes studied in Wagner et al. [PLOS Gen 2016 (47)] and Tanner et al. [NAR 2021 (48), 4, 2240-2254] were analyzed. Mouse exons were mapped to human positions. In some cases, the boundaries of exons in the mouse and/or human genome are not completely known. As such, the data were analyzed using different boundaries. The exact boundaries were confirmed using RNAseq data.

RNA CUG 병소 분석 전경골근 절편을 CUG 병소(FISH, 적색) 및 핵(Hoechst, 청색)에 대해 염색하였다. TA 근육 절편을 영상화하고, CUG RNA 병소를 갖는 핵의 수를 정량화하였다. RNA CUG lesion analysis Tibialis anterior sections were stained for CUG lesions (FISH, red) and nuclei (Hoechst, blue). TA muscle sections were imaged, and the number of nuclei with CUG RNA foci was quantified.

결과result

HSA mRNA 녹다운. 사두근, 전경골근, 및 삼두근과 비교하여 횡경막만 5~10%의 HSA mRNA 수준의 나타냈다(도 13a). EEV-PMO 치료는 횡격막에서 HSA mRNA 수준을 변화시키는 것 같지 않았다(도 13b). HSA 220 CUG 반복의 발현 수준은 횡격막에서 DM1의 스플라이싱 오류 표현형으로 충분하지 않을 수 있다. HSA mRNA knockdown. Compared to the quadriceps, tibialis anterior, and triceps, only the diaphragm showed 5-10% higher HSA mRNA levels (Figure 13A). EEV-PMO treatment did not appear to change HSA mRNA levels in the diaphragm ( Figure 13B ). Expression levels of the HSA 220 CUG repeat may not be sufficient for the splicing error phenotype of DM1 in the diaphragm.

EEV-PMO는 HSA mRNA를 투여량 의존적 방식으로 녹다운하였고, 이에 의해 사두근(도 14a), 비복근(도 14b), 삼두근(도 14c), 및 전경골근(도 14d) 조직에서 표적 결합을 확인하였다. 또한, HSA mRNA의 Ct(사이클 임계값) 값은 마우스 GAPDH의 수준(약 15)과 유사한데, 이는 HSA-LR 마우스의 사두근에서 HSA 이식유전자의 발현이 높음을 시사한다.EEV-PMO knocked down HSA mRNA in a dose-dependent manner, thereby downregulating quadriceps ( Figure 14A ), gastrocnemius ( Figure 14B ), triceps ( Figure 14C ), and tibialis anterior ( Figure 14D ). Target binding was confirmed in tissue. Additionally, the Ct (cycle threshold) value of HSA mRNA is similar to the level of mouse GAPDH (approximately 15), suggesting high expression of the HSA transgene in the quadriceps muscle of HSA-LR mice.

mDSI(스플라이싱의 교정). 사두근, 비복근, 삼두근, 및 전경골근에 대한 마우스 DM1 스플라이싱 지수(mDSI)가 도 15a~15d에 도시되어 있다. EEV-PMO 치료는, 주입 후 1주일 차에 사두근(도 15a), 비복근(도 15b), 삼두근(도 15c), 및 전경골근(도 15d)에서 DM1 관련 스플라이싱 결함((Atp2a1 엑손 22, Nfix 엑손 7, Clcn1 엑손 7a, Mbnl1 엑손 5)을 투여량 의존적 방식으로 교정하였고, 투여량을 증가시키자 야생형에 근접하거나 동등한 교정(완전한 교정)이 나타났다. HSA-LR 마우스의 경우, 완전한 스플라이싱 교정을 달성하는 농도에서 약 50%~60%의 인간 골격 액틴 RNA 녹다운이 달성되었다. mDSI (correction of splicing). Mouse DM1 splicing index (mDSI) for quadriceps, gastrocnemius, triceps, and tibialis anterior are shown in Figures 15A-15D . EEV - PMO treatment resulted in DM1-related splicing defects (Atp2a1 exon 22 , Nfix exon 7, Clcn1 exon 7a, and Mbnl1 exon 5) were corrected in a dose-dependent manner, with increasing doses resulting in corrections approaching or equivalent to wild type (complete correction). In HSA-LR mice, complete splicing was observed. Approximately 50% to 60% human skeletal actin RNA knockdown was achieved at concentrations that achieved correction.

도 16a~b는 HSA-LR 마우스의 전경골근 조직(도 16a) 및 EEV-PMO로 치료한 HSA-LR 마우스의 전경골근 조직( 16b)을 CUG 병소(적색) 및 핵(청색)에 대해 염색한 이미지를 보여준다. 정성적 및 정량적 평가(도 16c)는 EEV-PMO 치료가 CUG 병소를 가진 핵의 수를 감소시켰음을 보여주었다. Figures 16a-b show tibialis anterior tissue from HSA-LR mice ( Figure 16a ) and tibialis anterior muscle tissue from HSA-LR mice treated with EEV-PMO ( Figure 16b ) staining for CUG foci (red) and nuclei (blue). Shows one image. Qualitative and quantitative evaluation ( Figure 16C ) showed that EEV-PMO treatment reduced the number of nuclei with CUG foci.

약물 노출. LC-MS를 사용하여 약물 노출을 연구하였다. 도 17a~17d는 사두근(도 17a), 삼두근(도 17b), 심장(도 17c), 비복근(도 17d), 전경골근(TA; 도 17f), 간(도 17i), 및 신장(도 17j)에서 PMO-EEV 노출에 대한 투여량 의존적 반응을 보여준다. 횡격막에서는 투여량 의존적 반응이 관찰되지 않았다(도 17g). EEV-PMO는, 60 mpk 및 90 mpk 투여량 수준을 제외하고는 뇌에서 검출되지 않았다. 도 17k는 60 mpk 투여량 수준에서 다양한 조직의 약물 노출을 보여준다. Drug exposure. Drug exposure was studied using LC-MS. Figures 17A-17D show the quadriceps ( Figure 17A ), triceps ( Figure 17B ), heart ( Figure 17C ), gastrocnemius ( Figure 17D ), tibialis anterior (TA; Figure 17F ), liver ( Figure 17I ), and kidney ( Figure 17J ). shows a dose-dependent response to PMO-EEV exposure. No dose-dependent response was observed in the diaphragm ( Figure 17g ). EEV-PMO was not detected in the brain except at the 60 mpk and 90 mpk dose levels. Figure 17K shows drug exposure of various tissues at the 60 mpk dose level.

근긴장증 반응: 15, 30, 60, 및 90 mpk의 EEV-PMO-DM1-3으로 치료하고 7일 후에, HSA-LR 마우스에서 근긴장증의 투여량 의존적 감소가 관찰되었다(도 18a). 근긴장증은 EEV-PMO-DM1-3으로 치료하고 1주일 후에 개선된 가능성이 높다. 90 mpk의 EEV-PMO-DM1-3의 1회 투여량으로 치료한 HSA-LR 마우스는, 유도 후 뒷다리 근긴장증의 명백한 징후를 나타내지 않았다. Myotonia response: After 7 days of treatment with 15, 30, 60, and 90 mpk of EEV-PMO-DM1-3, a dose-dependent reduction in myotonia was observed in HSA-LR mice ( Figure 18A ). Myotonia is likely to improve after 1 week of treatment with EEV-PMO-DM1-3. HSA-LR mice treated with a single dose of 90 mpk of EEV-PMO-DM1-3 showed no obvious signs of hindlimb myotonia after induction.

RNAseq 데이터 분석. 도 19a~19d는 주요 성분 분석의 결과를 보여준다. 주요 성분 분석을 사용하여 거리 매트릭스에 기초하여 샘플 간의 유사성을 밝힐 수 있다. 이러한 유형의 도표는 실험 공변량의 전반적인 효과 및 배치의 효과를 시각화하는 데 유용하다. x축은 가장 큰 변량을 설명하는 방향이고, y축은 두 번째로 큰 변량을 설명하는 방향이다. 방향 당 총 변량의 백분율은 PCA로서 도시되어 있다. 야생형 및 HSA-LR 마우스는 구별되는 군에 속한다. PMO-EEV로 치료한 HSA-LR 마우스의 비복근에서의 유전자 발현은 야생형 마우스의 유전자 발현을 향해 이동하였다. RNAseq data analysis. Figures 19a-19d show the results of principal component analysis. Principal component analysis can be used to reveal similarities between samples based on a distance matrix. This type of plot is useful for visualizing the overall effect of experimental covariates and the effect of placement. The x-axis is the direction that explains the largest variance, and the y-axis is the direction that explains the second largest variance. The percentage of total variance per direction is plotted as PCA. Wild-type and HSA-LR mice belong to distinct groups. Gene expression in the gastrocnemius muscle of HSA-LR mice treated with PMO-EEV shifted toward that of wild-type mice.

도 20a는 다음 3개의 치료군으로부터 차등 발현된 유전자를 (Z-스코어에 의해) 보여주는 히트맵이다: 1) WT 마우스; 2) HSA-LR 마우스; 및 3) HSA-LR + EEV-PMO 221-1120(60 mpk). 치료군 간에 총 956개의 유전자(p < 0.5)가 차등 발현되었는데, 이는 야생형 마우스(WT)와 질환 모델 마우스(HSA-LR) 간의 차이를 나타낸다. EEV-PMO로 치료한 결과(HSA-LR(+,+)), 유전자 발현이 전반적으로 교정되었고, 질환 프로파일(적색, HSA-LR(-,-))로부터 야생형 마우스(위의 WT) 프로파일을 향해 이동하였다. Figure 20A is a heatmap showing differentially expressed genes (by Z-score) from three treatment groups: 1) WT mice; 2) HSA-LR mice; and 3) HSA-LR + EEV-PMO 221-1120 (60 mpk). A total of 956 genes (p < 0.5) were differentially expressed between treatment groups, indicating differences between wild-type mice (WT) and disease model mice (HSA-LR). Treatment with EEV-PMO (HSA-LR(+,+)) resulted in an overall correction of gene expression, and the disease profile (red, HSA-LR(-,-)) compared to that of wild-type mice (WT above). moved towards.

도 20b는 43개의 유전자 중 7개를 초과하는 CTG 반복을 갖는 것으로 밝혀진 40개의 유전자의 발현 프로파일을 BLAST 분석으로부터 시각화하는 데 사용되는 히트맵이다. BLAST 분석에서 발견된 CTG 반복 유전자 중 3개(Crb2, Hsd3b6, 및 Inhbe)는 판독 수가 적어서 포함시키지 않았다. 이 분석은 치료 조건에 걸쳐 공동 조절된 유전자를 식별하는 데 유용하다. Figure 20B is a heatmap used to visualize the expression profile of 40 genes found to have more than 7 CTG repeats out of 43 genes from BLAST analysis. Three of the CTG repeat genes discovered in BLAST analysis (Crb2, Hsd3b6, and Inhbe) were not included due to low number of reads. This analysis is useful for identifying genes that are co-regulated across treatment conditions.

도 21은 EEV-PMO 치료군 및 HSA-LA 치료군에 걸쳐 전반적인 전사 변화에 대한 화산 도표를 보여준다. 산포도 내의 각 데이터 포인트는 유전자를 나타낸다. 각 유전자의 배수 변화는 x-축에 표시되어 있고, 이의 조정된 p-값의 log10은 y-축에 표시되어 있다. 조정된 p-값이 0.05 미만이고 배수 변화가 2를 초과하는 유전자는 적색 점으로 표시되어 있다. 이들은 상향 조절된 유전자를 나타낸다. 조정된 p-값이 0.05 미만이고 배수 변화가 -2 미만인 유전자는 청색 점으로 표시되어 있다. 이들은 하향 조절된 유전자를 나타낸다. 3개의 유전자는 유의하게 하향 조절되었고(Txlnb, Scube2, 및 Greb1), 1개의 유전자(Txlnb)는 유의하게 상향 조절된 것으로 확인되었다. 적어도 (CUG)7을 함유하는 대부분의 전사체는 유의한 영향을 받지 않았다. 이들 유전자의 PCA 분석은, Scube2(도 22a), Greb1(도 22b), Ttc7(도 22c), Txlnb(CUG)9, 및 Ndrg3(도 22e)이 EEV-PMO로 치료했을 때 교정을 나타냈음을 보여주었다. Txlnb는 치료에 의해 과도하게 교정된다(도 22d). Figure 21 shows a volcano plot of overall transcriptional changes across EEV-PMO treatment groups and HSA-LA treatment groups. Each data point within the scatterplot represents a gene. The fold change of each gene is shown on the x-axis and the log10 of its adjusted p-value is shown on the y-axis. Genes with adjusted p-values less than 0.05 and fold changes greater than 2 are marked with red dots. These represent upregulated genes. Genes with an adjusted p-value less than 0.05 and a fold change less than -2 are marked with blue dots. These represent down-regulated genes. Three genes were found to be significantly down-regulated (Txlnb, Scube2, and Greb1), and one gene (Txlnb) was found to be significantly up-regulated. Most transcripts containing at least (CUG) 7 were not significantly affected. PCA analysis of these genes showed that Scube2 ( Figure 22A ), Greb1 ( Figure 22B ), Ttc7 ( Figure 22C ), Txlnb(CUG)9, and Ndrg3 ( Figure 22E ) showed correction when treated with EEV-PMO. gave. Txlnb is overcorrected by treatment ( Figure 22D ).

도 23a~23d는 다양한 유전자 및 다양한 치료군에 대한 전사체 데이터를 보여준다. HSA-LR+ EEV-PMO 221-1120 치료군은 Atp2a1의 엑손 22 포함(도 23a), Clcn1의 엑손 7 배제(도 23b), Nfix의 엑손 7 배제(도 23c), 및 Mbnl1의 엑손 7 배제(도 23d)가 교정되었음을 나타냈다. Figures 23A-23D show transcriptome data for various genes and various treatment groups. The HSA-LR+EEV-PMO 221-1120 treatment group contained exon 22 of Atp2a1 ( Figure 23A ), excluded exon 7 of Clcn1 ( Figure 23B ), excluded exon 7 of Nfix ( Figure 23C ), and excluded exon 7 of Mbnl1 ( Figure 23D ) was corrected.

도 24는 다양한 유전자에 대한 개별 엑손의 스플라이싱 백분율(PSI)을 보여준다. 유전자는 MBNL-1 반응성 스플라이싱 바이오마커(예: 하류 유전자)이다. MBNL-1 의존적 바이오마커의 선택은 문헌에 기술된 바와 같이 야생형 및 질환군 간의 동적 범위에 기초하여 선택하였다. HSA-LR+EEV-PMO 221-1120 치료군은 Mbnl1, Nfix, Atp2a1, Ldb3, Camk2g, Trim55, Fbox31, Slc8a3, Map3k4, Dctn4, Cacna1s, Ryr1, Slain2, Phka1, Ppp3cc, Ttn, Neb, lrrfip2, Rapgef1, 및 Vsp39를 포함하는 20개의 관심 유전자 모두에 대해 엑손 포함/제외에 대한 교정을 나타냈다. Figure 24 shows percent splicing (PSI) of individual exons for various genes. The gene is an MBNL-1 reactive splicing biomarker (e.g., downstream gene). The selection of MBNL-1 dependent biomarkers was based on the dynamic range between wild type and disease groups as described in the literature. The HSA-LR+EEV-PMO 221-1120 treatment group had Mbnl1, Nfix, Atp2a1, Ldb3, Camk2g, Trim55, Fbox31, Slc8a3, Map3k4, Dctn4, Cacna1s, Ryr1, Slain2, Phka1, Ppp3cc, Ttn, Neb, lrrfip2, Rapgef1, and corrections for exon inclusion/exclusion were shown for all 20 genes of interest, including Vsp39.

실시예 5. Example 5. 제2 DM1 마우스 모델인 DM1 마우스 모델에서 PMO-EEV 221-1120의 평가 Evaluation of PMO-EEV 221-1120 in the DM1 mouse model, a second DM1 mouse model

PMO-EEV DM1-3(221-1120; 서열은 실시예 4 참조)을 실시예 4에 기술된 것과 유사한 방법을 사용하여 제2 DM1 마우스 모델에서 평가하였다.PMO-EEV DM1-3 (221-1120; see Example 4 for sequence) was evaluated in a second DM1 mouse model using methods similar to those described in Example 4.

실험. 7주령 HSA-LR 마우스에게 80 mpk의 EEV-PMO-DM1-3을 1회 투여하거나 20 mpk의 EEV-PMO-DM1-3의 6주 동안 격주로 정맥내 투여하고(4회에 걸쳐 총 80 mpk를 투여함), 1회 투여로부터 1주 내지 12주 후에 또는 최종 투여로부터 2주 후에 조직을 채취하였다. RT-PCR을 사용하여 특정 유전자(Atp2a1, Clcn1, Nfix, MBNL1)에 대한 대안적인 스플라이싱을 결정하였다. Q-PCR을 사용하여, 치료 후 액틴-HSA의 mRNA 수준 감소를 결정하였다. LC-질량을 사용하여 사두근, 비복근, 전경골근, 삼두근, 횡격막, 심장, 신장, 간, 뇌, 혈장에서 약물 수준을 결정하였다. EEV-PMO-DM1-3으로 치료하고 7일 후에 근긴장증의 감소가 기록되었다. Experiment. Seven-week-old HSA-LR mice were administered a single dose of 80 mpk of EEV-PMO-DM1-3 or intravenous administration of 20 mpk of EEV-PMO-DM1-3 every other week for 6 weeks (4 times for a total of 80 mpk). administered), tissues were collected 1 to 12 weeks after the first administration or 2 weeks after the final administration. Alternative splicing for specific genes (Atp2a1, Clcn1, Nfix, MBNL1) was determined using RT-PCR. Using Q-PCR, the decrease in mRNA levels of actin-HSA after treatment was determined. LC-mass was used to determine drug levels in the quadriceps, gastrocnemius, tibialis anterior, triceps, diaphragm, heart, kidney, liver, brain, and plasma. A reduction in myotonia was recorded after 7 days of treatment with EEV-PMO-DM1-3.

결과. 전경골근, 비복근, 삼두근, 및 사두근 조직에서의 Atp2a1, Clcn1, Nfix, 및 MBNL1에 대한 스플라이싱의 구제에 대해서는 실시예 4에서 관찰된 것과 유사한 경향이 관찰되었다(데이터 미도시). 또한, 치료하고 1주일 및 4주일 후 모두에 HSA mRNA 녹다운 전경골, 비복근, 삼두근, 및 사두근 조직에 대해 실시예 4에서 관찰된 것과 유사한 경향이 관찰되었다(데이터 미도시). result. A similar trend to that observed in Example 4 was observed for rescue of splicing for Atp2a1, Clcn1, Nfix, and MBNL1 in tibialis anterior, gastrocnemius, triceps, and quadriceps tissues (data not shown). Additionally, a trend similar to that observed in Example 4 was observed for HSA mRNA knockdown tibialis anterior, gastrocnemius, triceps, and quadriceps tissues both 1 and 4 weeks after treatment (data not shown).

도 25a~25d는 80 mpk의 EEV-PMO-DM1-3으로 치료하고 1주일 내지 8주일 후에 전경골(도 25a), 비복근(도 25b), 삼두근(도 25c), 및 사두근(도 25d) 조직에서 약물 수준이 감소하였음을 보여주는 도표이다. EEV-PMO-DM1-3(60 mpk 올리고, 80 mpk 전체 약물)은 치료로부터 1주일 후에 비복근, 삼두근, 전경골, 및 사두근에서 스플라이싱 오류를 완전히 교정한다. 도 26a~26b는 80 mpk의 EEV-PMO-DM1-3을 투여하고 1주 내지 4주, 4주 내지 8주, 및 8주 내지 12주 후에 간에서 약물 수준의 감소가 관찰되었음을 보여주는 도표이다. 1회 투여 요법으로 치료하고 4주 후에 관찰된 것과 비교했을 때, 6주 투여 요법의 마지막 투여량으로 치료하고 2주 후에 상대적으로 더 많은 양의 EEV-PMO-DM1-3이 간에서 관찰되었다. Figures 25A-25D show tibialis anterior ( Figure 25A ), gastrocnemius ( Figure 25B ) , triceps ( Figure 25C ), and triceps muscles 1 to 8 weeks after treatment with 80 mpk of EEV-PMO-DM1-3. Diagram showing decreased drug levels in quadriceps ( FIG. 25D ) tissue. EEV-PMO-DM1-3 (60 mpk oligo, 80 mpk full drug) completely corrects splicing errors in the gastrocnemius, triceps, tibialis anterior, and quadriceps after 1 week of treatment. Figures 26A-26B are charts showing that a decrease in drug levels in the liver was observed after 1 to 4 weeks, 4 to 8 weeks, and 8 to 12 weeks after administration of 80 mpk of EEV-PMO-DM1-3. Relatively higher amounts of EEV-PMO-DM1-3 were observed in the liver 2 weeks after treatment with the last dose of the 6-week dosing regimen compared to that observed 4 weeks after treatment with the single-dose regimen.

도 26c~26d는 80 mpk의 EEV-PMO-DM1-3을 투여하고 1주 내지 4주, 4주 내지 8주, 및 8주 내지 12주 후에 신장에서 약물 수준의 감소가 관찰되었음을 보여준다. 1회 투여 요법으로 치료하고 4주 후에 관찰된 것과 비교했을 때, 6주 투여 요법의 마지막 투여량으로 치료하고 2주 후에 상대적으로 적은 양의 EEV-PMO-DM1-3이 또한 신장에서 관찰되었다. EEV-PMO-DM1-3의 1회 투여 후 12주차에, 신장에는 여전히 약물이 존재하였지만 간에는 존재하지 않았다. Figures 26C-26D show that a decrease in drug levels in the kidney was observed after 1 to 4 weeks, 4 to 8 weeks, and 8 to 12 weeks after administration of 80 mpk of EEV-PMO-DM1-3. Relatively small amounts of EEV-PMO-DM1-3 were also observed in the kidneys 2 weeks after treatment with the last dose of the 6-week dosing regimen, compared to what was observed 4 weeks after treatment with the single-dose regimen. At 12 weeks after a single dose of EEV-PMO-DM1-3, drug was still present in the kidneys but not in the liver.

주관적 근긴장증 관찰이 이루어졌고 이는 표 15에 나타나 있다. 다회 투여 요법(Q2W)은 치료하고 2주 후에 근긴장증 구제의 아무런 징후를 나타내지 않았다. 80 mpk의 1회 투여량으로 치료한 마우스에서 근긴장증에 대한 혼합된 효과가 있었지만, 이는 치료 후 12주가 지나기 전에 없어졌다.Subjective myotonia observations were made and are shown in Table 15 . The multiple dose regimen (Q2W) showed no signs of relief of myotonia after 2 weeks of treatment. There was a mixed effect on myotonia in mice treated with a single dose of 80 mpk, but this disappeared before 12 weeks after treatment.

더 오랜 기간 동안 더 높은 투여량으로 EEV-PMO-DM1-3를 정맥내 투여하는 것을 평가하기 위해 유사한 실험을 수행하였다. 8주령 HSA-LR 마우스를 40 mpk, 60 mpk, 80 mpk, 또는 120 mpk의 EEV-PMO-DM1-3을 정맥내 투여하여 치료하고, 4주 내지 12주 후에 조직을 채취하였다. RT-PCR을 사용하여 특정 유전자(Atp2a1, Clcn1, Nfix, MBNL1)에 대한 대안적인 스플라이싱을 결정하였다. EEV-PMO-DM1-3으로 치료하고 7일 후에 근긴장증의 감소가 기록되었다. 전경골근 및 비복근 조직에서의 Atp2a1, Clcn1, Nfix, 및 MBNL1에 대한 스플라이싱의 구제에 대해서는 실시예 4에서 관찰된 것과 유사한 경향이 관찰되었다(데이터 미도시).A similar experiment was performed to evaluate intravenous administration of EEV-PMO-DM1-3 at higher doses for longer periods of time. Eight-week-old HSA-LR mice were treated with intravenous administration of 40 mpk, 60 mpk, 80 mpk, or 120 mpk of EEV-PMO-DM1-3, and tissues were collected 4 to 12 weeks later. Alternative splicing for specific genes (Atp2a1, Clcn1, Nfix, MBNL1) was determined using RT-PCR. A reduction in myotonia was recorded after 7 days of treatment with EEV-PMO-DM1-3. A similar trend to that observed in Example 4 was observed for rescue of splicing for Atp2a1, Clcn1, Nfix, and MBNL1 in tibialis anterior and gastrocnemius tissues (data not shown).

주관적 근긴장증 관찰이 이루어졌고 이는 표 16에 나타나 있다. 수컷보다 암컷에서 근긴장증이 더 많이 나타났다. 120 mpk를 투여한 수컷 및 암컷 마우스 모두에서 치료 후 8주차에 근긴장증의 징후는 없다.Subjective myotonia observations were made and are shown in Table 16 . Myotonia was more common in females than in males. There are no signs of myotonia at 8 weeks after treatment in both male and female mice administered 120 mpk.

실시예 6. EEV-PMO-DM1-3으로 환자 유래의 DM1 세포 치료하기DM1 환자 유래 근아세포에서 PMO-EEV DM1-3(221-1120; 서열은 실시예 4 참조)을 평가하였다.Example 6. Treating Patient-Derived DM1 Cells with EEV-PMO-DM1-3 PMO-EEV DM1-3 (221-1120; see Example 4 for sequence) was evaluated in DM1 patient-derived myoblasts.

실험. 환자의 근아세포를, 분화되는 4일 내내 30 μM의 DM1-3으로 치료하였다. 1단계 RT-PCR 및 Labpchip에 의해 스플라이싱 교정을 평가하였다(평균 ± SD 도표화함; n=4). HCR-FISH 및 격리된 MBNL1 단백질 검출 검정을 사용하여 RNA CUG 병소를 검출하였다. 결과: EEV-PMO-DM1-3은 DM1 환자 유래의 근육 세포에서 유의한 바이오마커인 스플라이싱 교정 및 핵 병소의 감소를 촉진한다. Experiment. Patient's myoblasts were treated with 30 μM DM1-3 for all 4 days of differentiation. Splicing correction was assessed by one-step RT-PCR and Labpchip (mean ± SD plotted; n=4). RNA CUG foci were detected using HCR-FISH and isolated MBNL1 protein detection assays. Results: EEV-PMO-DM1-3 promotes splicing correction and reduction of nuclear foci, significant biomarkers, in muscle cells derived from DM1 patients.

결과. 도 27a~27c는 EEV-PMO-DM1-3이 DM1 환자 유래 근육 세포에서 유의한 바이오마커인 스플라이싱 교정(MBLN1, SOS1, 및 NFIX)을 촉진함을 보여주는 도표이다. 또한, DM1-3으로 치료한 결과 DM1 환자 유래 근육 세포에서 핵 병가 감소하였다(도 28a~28c). result. Figures 27A-27C are diagrams showing that EEV-PMO-DM1-3 promotes splicing correction (MBLN1, SOS1, and NFIX), a significant biomarker in muscle cells derived from DM1 patients. Additionally, treatment with DM1-3 resulted in a decrease in nuclear sickness in muscle cells derived from DM1 patients ( Figures 28A-28C ).

실시예 7. 신장 세포에서 EEV-PMO-DM1-3의 세포독성 스크리닝Example 7. Cytotoxicity screening of EEV-PMO-DM1-3 in kidney cells

인간 신장 세포에서 PMO-EEV DM1-3(221-1120; 서열은 실시예 4 참조)을 평가하였다.PMO-EEV DM1-3 (221-1120; see Example 4 for sequence) was evaluated in human kidney cells.

실험. 인간 일차 신장 근위 세뇨관 상피 세포(Human Primary Renal Proximal Tubular Epithelial Cells, RPTEC)를 다양한 농도(식염수 중 1:2 연속 희석물, 최종 희석 인자 4x, 약 6 μM 내지 약 800 μM)의 PMO-DM1 및 EEV-PMO-DM1-3에 24시간 동안 노출시키고, CELLTITER-GLO 발광 생존력 검정을 사용하여 생존력에 대해 스크리닝하였다. 16.6 μM의 멜리틴을 양성 대조군으로서 사용하였다. Experiment. Human Primary Renal Proximal Tubular Epithelial Cells (RPTEC) were incubated with PMO-DM1 and EEV at various concentrations (1:2 serial dilutions in saline, final dilution factor 4x, from about 6 μM to about 800 μM). -PMO-DM1-3 for 24 hours and screened for viability using the CELLTITER-GLO luminescence viability assay. 16.6 μM melittin was used as a positive control.

결과. 도 29a~29b는 PMO-DM1 또는 접합된 EEV-PMO-DM1-3이 각각 817 μM 또는 797 μM의 최고 농도에서도 아무런 독성을 나타내지 않았음을 보여준다. result. Figures 29A-29B show that PMO-DM1 or conjugated EEV-PMO-DM1-3 showed no toxicity even at the highest concentration of 817 μM or 797 μM, respectively.

실시예 8. DM1 환자의 불멸화된 세포 및 HeLa-480 세포에서 스플라이싱 오류 이벤트 및 하류 스플라이싱을 교정하는 능력에 대한 PMO-EEV 221-1113의 평가Example 8. Evaluation of PMO-EEV 221-1113 for its ability to correct splicing error events and downstream splicing in immortalized cells from DM1 patients and HeLa-480 cells.

DM1 환자 유래의(2,600개의 CUG 반복) 불멸화된 근육 세포 및 HeLa-480(DM1 모델 세포주, 실시예 1 참조)을 EEV-PMO 작제물 221-1113로 치료하고 비정상적인 스플라이싱의 교정 및 병소 정량화에 대해 분석하였다. EEV 1113은 Ac-PKKKRKV-miniPEG-K(시클로(Ff-Nal-GrGrQ)-PEG12-OH (Ac-(서열번호 42)-miniPEG-K(시클로(서열번호 80)-PEG12-OH)이다. EEV-PMO 221-1113은 EEV 1113이 아미드 결합 화학을 통해 PMO 서열 221 (5’-CAG CAG CAG CAG CAG CAG CAG-3’ (서열번호 154; 모두 PMO 단량체임)에 접합된 것이다.Immortalized muscle cells from DM1 patients (2,600 CUG repeats) and HeLa-480 (DM1 model cell line, see Example 1) were treated with EEV-PMO construct 221-1113 and used for correction of aberrant splicing and quantification of lesions. analyzed. EEV 1113 is Ac-PKKKRKV-miniPEG-K( cyclo (Ff-Nal-GrGrQ)-PEG12-OH (Ac-(SEQ ID NO:42)-miniPEG-K(cyclo(SEQ ID NO:80)-PEG12-OH). EEV -PMO 221-1113 is EEV 1113 conjugated to PMO sequence 221 (5'-CAG CAG CAG CAG CAG CAG CAG-3' (SEQ ID NO: 154; all are PMO monomers) via amide linkage chemistry.

실험. 실시예 1 및 실시예 3에 기술된 것과 유사한 방법을 사용하였다. Experiment. Methods similar to those described in Examples 1 and 3 were used.

결과.result.

RNA CUG 병소 분석. 세포를 핵(Hoechst, 청색) 및 RNA CUG 반복 병소(녹색)에 대해 염색하였다. 미치료 DM1 환자 세포와 EEV-PMO로 치료한 DM1 세포 사이에서 RNA CUG 병소의 감소가 관찰되었다(도 30a~30c). 유사하게, 미치료 HeLa-480 세포와 EEV-PMO HeLa-480 세포 사이에서 RNA CUG 병소의 감소가 관찰되었다(도 31a~31b). RNA CUG foci analysis. Cells were stained for nuclei (Hoechst, blue) and RNA CUG repeat foci (green). A reduction in RNA CUG foci was observed between untreated DM1 patient cells and DM1 cells treated with EEV-PMO ( FIGS. 30A-30C ). Similarly, a reduction in RNA CUG foci was observed between untreated HeLa-480 cells and EEV-PMO HeLa-480 cells ( FIGS. 31A-31B ).

하류 스플라이싱의 교정. PMO-EEV로 치료한 DM1 환자 유래 세포 및 HeLa-480 세포를 MBLN1의 경우 엑손 5 포함 백분율에 대해서, SOS1의 경우 엑손 25 포함 백분율에 대해서, 및 NFIX의 경우 엑손 7 포함 백분율에 대해 분석하였다. EEV-PMO로 치료한 결과 Mbnl1(도 32a), Sos1(도 32b), 및 NFIX(도 32c)에 대한 스플라이싱 이벤트가 구제되었다. Correction of downstream splicing. Treated with PMO-EEV DM1 patient-derived cells and HeLa-480 cells were analyzed for percent exon 5 coverage for MBLN1, percent exon 25 coverage for SOS1, and percent exon 7 coverage for NFIX. Treatment with EEV-PMO rescued splicing events for Mbnl1 ( Figure 32A ), Sos1 ( Figure 32B ), and NFIX ( Figure 32C ).

또한, EEV-PMO로 치료한 HeLa-480 세포는 MBNL1 스플라이싱의 투여량 의존적 교정을 나타냈고(도 33a), SOS1(도 33b), CLASP1(도 33c), NFIX (도 33d), 및 INSR(도 33e)의 하류 스플라이싱 오류의 투여량 의존적 교정을 나타냈다. Additionally, HeLa-480 cells treated with EEV-PMO showed dose-dependent correction of MBNL1 splicing ( Figure 33A ), SOS1 ( Figure 33B ), CLASP1 ( Figure 33C ), NFIX ( Figure 33D ), and INSR. ( Figure 33E ) showed dose-dependent correction of downstream splicing errors.

실시예 9. 제2 DM1 마우스 모델에서 EEV-PMO 221-1106의 평가 Example 9. Evaluation of EEV-PMO 221-1106 in a second DM1 mouse model

하류 유전자의 스플라이싱 및 mRNA 수준에 EEV-PMO 221-1106이 미치는 효과를 연구하기 위해 DM1 마우스 모델을 수행하였다.A DM1 mouse model was performed to study the effects of EEV-PMO 221-1106 on splicing and mRNA levels of downstream genes.

실험. 인간 골격 액틴 긴 반복(HSA-LR) 유전자이식 마우스를 DM1 질환 모델로서 사용하였다. 실시예 5에 기술된 것과 유사한 방법을 사용하였다. Experiment. Human skeletal actin long repeat (HSA-LR) transgenic mice were used as a DM1 disease model . A method similar to that described in Example 5 was used.

결과. 도 34a~34d는 다양한 농도의 EEV-PMO 221-1106으로 치료한 마우스의 비복근에서, Atp2a1의 경우 엑손 22의 포함이(도 34a), Nfix의 경우 엑손 7의 포함이(도 34b), Clcn1의 경우 엑손 7A의 포함이(도 34c), 및 Mbnl1(도 34d)이 투여량 의존적으로 교정됨을 보여준다. PMO 221 단독으로 치료한 경우 스플라이싱이 교정되지 않았다. result. Figures 34a-34d show inclusion of exon 22 for Atp2a1 ( Figure 34a ), inclusion of exon 7 for Nfix ( Figure 34b ), and Clcn1 in the gastrocnemius muscle of mice treated with various concentrations of EEV-PMO 221-1106. It is shown that inclusion of exon 7A ( Figure 34C ), and Mbnl1 (Figure 34D ) are corrected in a dose-dependent manner. Treatment with PMO 221 alone did not correct splicing.

실시예 10. PMO에서 상이한 길이의 CUG 반복이 미치는 효과를 연구하기 위한 DM1 마우스 모델Example 10. DM1 mouse model to study the effect of different lengths of CUG repeats on PMO

PMO-EEV 221-1121(PMO는 7개의 CAG 반복을 가짐, 21량체) 및 PMO-EEV 0325-1121(PMO는 8개의 CAG 반복을 가짐, 24량체)이 하류 유전자의 스플라이싱 및 mRNA 수준에 미치는 효과를 연구하기 위해 DM1 마우스 모델을 수행하였다. PMO-EEV 221-1121은 PMO 221(5’-CAG CAG CAG CAG CAG CAG CAG-3’; 서열번호 154; 모두 PMO 단량체임)이 아미드 화학을 통해 EEV 1121(Ac-PKKKRKV-miniPEG2-Lys(시클로[GfFGrGrQ])-PEG12-OH; Ac-(서열번호 42)-miniPEG2-Lys(서열번호 74)-PEG12-OH)에 접합된 것이다. PMO-EEV 0325-1121은 PMO 0325 (5’-CAG CAG CAG CAG CAG CAG CAG-CAG-3’; 서열번호 155; 모두 PMO 단량체임)가 아미드 화학을 통해 EEV 1121에 접합된 것이다.PMO-EEV 221-1121 (PMO has 7 CAG repeats, 21-mer) and PMO-EEV 0325-1121 (PMO has 8 CAG repeats, 24-mer) on the splicing and mRNA levels of downstream genes. To study the effect, a DM1 mouse model was performed. PMO-EEV 221-1121 is PMO 221 (5'-CAG CAG CAG CAG CAG CAG CAG-3'; SEQ ID NO: 154; all are PMO monomers) via amide chemistry to EEV 1121 (Ac-PKKKRKV-miniPEG2-Lys (cyclo [GfFGrGrQ])-PEG12-OH; Ac-(SEQ ID NO: 42)-miniPEG2-Lys (SEQ ID NO: 74)-PEG12-OH). PMO-EEV 0325-1121 is PMO 0325 (5'-CAG CAG CAG CAG CAG CAG CAG-CAG-3'; SEQ ID NO: 155; all are PMO monomers) conjugated to EEV 1121 via amide chemistry.

실험. 인간 골격 액틴 긴 반복(HSA-LR) 유전자이식 마우스를 DM1 질환 모델로서 사용하였다. 간략하게, HSA-LR 마우스에게 20 mpk, 40 mpk, 또는 60 mpk의 0221-1121 또는 0325-1121을 정맥내 주사를 통해 꼬리 정맥 내에 투여하였다. 주사로부터 1주일 후에, 마우스를 희생시키고, 조직을 채취하였다. 실시예 5에 기술된 것과 유사한 다른 실험 방법을 사용하였다. Experiment. Human skeletal actin long repeat (HSA-LR) transgenic mice were used as a DM1 disease model . Briefly, HSA-LR mice were administered 20 mpk, 40 mpk, or 60 mpk of 0221-1121 or 0325-1121 via intravenous injection into the tail vein. One week after injection, mice were sacrificed and tissues were collected. Another experimental method similar to that described in Example 5 was used.

결과. 0221-1121(21량체)은 전경골근 조직에서 Mbnl1(도 35a), Nfix(도 35b), 및 Atp2a1(도 35c) 내의 엑손 스플라이싱을 교정함에 있어서 0325-1121(24량체)보다 더 효과적이었다. 이 결과는 예상치 못한 것이었다. 24량체가 더 높은 혼성화 효율 및 더 높은 열 용융 온도를 갖게 될 것이어서, 24량체가 더 효과적일 것으로 예상하였다. 도 36a~36c에 도시된 것과 같이, 비복근 조직에서의 차이는 덜 두드러졌다. 주관적 근긴장증 관찰은 수컷 마우스를 사용해 이루어졌다(표 17). 40 mpk에서 21량체의 경우, 치료하고 1주일 후에 혼합형 근긴장증이 관찰되었는데, 이는 표 11의 결과와 유사하다. result. 0221-1121 (21-mer) was more effective than 0325-1121 (24-mer) in correcting exon splicing in Mbnl1 ( Figure 35A ) , Nfix ( Figure 35B ), and Atp2a1 ( Figure 35C ) in tibialis anterior tissue. . This result was unexpected. It was expected that the 24-mer would be more effective, as it would have higher hybridization efficiency and higher thermal melt temperature. As shown in Figures 36A-36C , differences in gastrocnemius tissue were less pronounced. Subjective myotonia observations were made using male mice ( Table 17 ). For the 21-mer at 40 mpk, mixed myotonia was observed 1 week after treatment, similar to the results in Table 11.

실시예 11. CD1 마우스에서 EEV-PMO 221-1120의 약동학 연구CD1 마우스 모델을 사용하여 EEV-PMO 작제물 221-1120(서열은 실시예 4 참조) 및 PMO-0221a에 대한 혈장, 신장, 및 전경골근 약물 노출(AUC)을 연구하였고, 221-1120의 주요 대사산물(도 37 참조)도 측정하였다.Example 11. Pharmacokinetic Study of EEV-PMO 221-1120 in CD1 Mice Plasma, Kidney, and Transplantation for EEV-PMO Constructs 221-1120 (see Example 4 for sequence) and PMO-0221a using the CD1 mouse model. Tibialis muscle drug exposure (AUC) was studied and the major metabolite 221-1120 (see Figure 37 ) was also measured.

실험. 5 내지 7주령 CD1 마우스를 80 mpk의 EEV-PMO 작제물 221-1120의 정맥내 주사를 통해 치료하였다. 다양한 시점에 마우스로부터 채혈하고/하거나 희생시켰다. Experiment. Five to seven week old CD1 mice were treated via intravenous injection of 80 mpk of EEV-PMO construct 221-1120. Mice were bled and/or sacrificed at various time points.

결과. 표 18, 표 19, 및 표 20은 혈장, 신장, 및 전경골에서 각각 관찰된 약동학적 특성을 보여준다. 표에 대한 설명: AUClast = 0에서부터 정량화 가능한 최종 농도까지의 곡선 아래 면적; D = 투여량; Cmax = 최대 혈청 또는 혈장 농도; Tmax = Cmax까지의 소요 시간: CL = 총 혈장, 혈청, 또는 혈액 제거; t1/2 = 제거 반감기; Vss = 평형에서의 겉보기 분포 용적; Qh = 간 혈류 (ml/분/kg). result. Table 18 , Table 19 , and Table 20 show the pharmacokinetic properties observed in plasma, kidney, and anterior tibia, respectively. Description of the table: AUC last = area under the curve from 0 to the final quantifiable concentration; D = dose; C max = maximum serum or plasma concentration; T max = time to C max : CL = total plasma, serum, or blood removal; t 1/2 = elimination half-life; V ss = apparent volume of distribution at equilibrium; Q h = liver blood flow (ml/min/kg).

대사산물에 대한 AUC 값은 신장과 비교해 전경골에서 약 1000배 더 낮다. 혈장 내 대사산물 평균 머무름 시간(MRT) 값은, 배뇨 전에 대사산물이 조직에서 혈장으로 이동한 결과로서의 조직 MRT 값과 직접 관련될 수 있다.AUC values for metabolites are approximately 1000-fold lower in the anterior tibia compared to the kidney. The mean retention time (MRT) value of a metabolite in plasma can be directly related to the tissue MRT value as a result of the movement of metabolites from tissue to plasma prior to urination.

실시예 12. 제3 DM1 마우스 모델에서 PMO-EEV 221-1120의 평가 Example 12. Evaluation of PMO-EEV 221-1120 in a third DM1 mouse model

실시예 5 및 9와 유사한 DM1 마우스 모델 연구를 수행하여, HSA-LR 마우스에서 다양한 투여량의 PMO-EEV 221-220(서열은 실시예 4 참조)의 효과를 평가하였다.A DM1 mouse model study similar to Examples 5 and 9 was performed to evaluate the effect of various doses of PMO-EEV 221-220 (see Example 4 for sequence) in HSA-LR mice.

실험. 8주령 HSA-LR 마우스에게 40, 60, 80, 또는 120 mpk의 PMO-EEV 221-1120을 정맥내 투여하고, 4주 내지 12주 후에 조직을 채취하였다. RT-PCR을 사용하여 특정 유전자(Atp2a1, Clcn1, Nfix, MBNL1)에 대한 대안적인 스플라이싱을 결정하였다. LC-질량을 사용하여 사두근, 비복근, TA, 삼두근, 횡격막, 심장, 신장, 간, 뇌, 혈장에서 약물 수준을 결정하였다. 치료한 질환 모델, 치료하지 않은 질환 모델, 및 야생형 간의 전사 수준 변화를 RNA-seq를 사용하여 결정하였다. Q-PCR을 사용하여, 치료 후 액틴-HSA의 mRNA 수준 감소를 결정하였다. Experiment. 8-week-old HSA-LR mice were intravenously administered 40, 60, 80, or 120 mpk of PMO-EEV 221-1120, and tissues were collected 4 to 12 weeks later. Alternative splicing for specific genes (Atp2a1, Clcn1, Nfix, MBNL1) was determined using RT-PCR. LC-mass was used to determine drug levels in the quadriceps, gastrocnemius, TA, triceps, diaphragm, heart, kidney, liver, brain, and plasma. Transcript level changes between treated disease model, untreated disease model, and wild type were determined using RNA-seq. Using Q-PCR, the decrease in mRNA levels of actin-HSA after treatment was determined.

결과. 형광 이미징을 사용하여, EEV-올리고 화합물로 치료 후의 RNA 병소 감소를 결정하였다(데이터 미도시). 근긴장증 감소는 EEV-올리고 화합물로 치료하고 7일 후에 기록하였다(데이터 미도시). 이들 실험의 결과는 실시예 5 및 실시예 14에서 PMO-EEV 221-1120로 치료한 마우스와 유사한 경향을 나타낸다. result. Fluorescence imaging was used to determine RNA foci reduction following treatment with EEV-oligo compounds (data not shown). Reduction in myotonia was recorded 7 days after treatment with EEV-oligo compounds (data not shown). The results of these experiments show a similar trend to the mice treated with PMO-EEV 221-1120 in Examples 5 and 14.

다양한 농도의 EEV-PMO로 치료한 후, 전경골근(도 38a, 39a, 40a) 및 비복근(도 38b, 39b, 40b)에서 MBNL1, NFIX, 및 ATP2A1 스플라이싱의 교정이 관찰되었다. 120 mpk EEV-PMO로 치료하고 12주 후에, 전경골 및 비복근 모두에서 MBNL1, NFIX, 및 ATP2A1 스플라이싱의 교정이 관찰되었다.After treatment with various concentrations of EEV-PMO, correction of MBNL1, NFIX, and ATP2A1 splicing was observed in the tibialis anterior ( Figures 38A, 39A, 40A ) and gastrocnemius ( Figures 38B, 39B, 40B ). After 12 weeks of treatment with 120 mpk EEV-PMO, correction of MBNL1, NFIX, and ATP2A1 splicing was observed in both tibialis anterior and gastrocnemius muscles.

실시예 13. HeLa480 세포에서 EEV-PMO 221-1120의 평가Example 13. Evaluation of EEV-PMO 221-1120 in HeLa480 cells

HeLa480 세포를 다양한 농도의 EEV-PMO 221-1120(서열은 실시예 4 참조)로 치료하고, CUG 반복 병소, 선택적 r(CUG) 감소, 및 MBNL1 및 SOS1의 하류 스플라이싱 교정에 대해 이를 분석하였다.HeLa480 cells were treated with various concentrations of EEV-PMO 221-1120 (see Example 4 for sequences) and analyzed for CUG repeat foci, selective r(CUG) reduction, and downstream splicing correction of MBNL1 and SOS1. .

실험. Hela480 세포를 이전 실시예에 기술된 바와 같이 작제하였다. RT-PCR 및 병소 염색은 본원에 기술된 다른 실시예와 유사하게 수행하였다. Experiment. Hela480 cells were constructed as described in previous examples. RT-PCR and lesion staining were performed similarly to other examples described herein.

결과. 도 41a~41b는 대조군 세포(미치료) 및 5 μM, 10 μM, 20 μM, 50 μM, 및 100 μM의 EEV-PMO 221-1120로 치료한 세포의 예시적인 이미지를 보여준다. 미치료 HeLa480 세포와 비교하여, 치료한 HeLa480 군에서 CUG 병소(녹색)가 감소한다. 도 41b는 핵 면적 당 병소를 정량화한 도표이다. 도 41a~41b는 EEV-PMO 221-1120이 핵 CUG RNA 병소를 감소시킬 수 있음을 보여준다. 5 μM 투여량에서 거의 완전한 감소가 관찰된다. result. Figures 41A-41B show example images of control cells (untreated) and cells treated with 5 μM, 10 μM, 20 μM, 50 μM, and 100 μM of EEV-PMO 221-1120. Compared to untreated HeLa480 cells, CUG foci (green) are reduced in the treated HeLa480 group. Figure 41B is a chart quantifying lesions per nuclear area. Figures 41A-41B show that EEV-PMO 221-1120 can reduce nuclear CUG RNA foci. Almost complete reduction is observed at 5 μM dose.

도 42a~42b는 EEV-PMO 221-1120에 의한 치료가 HeLa480 세포주에서 반복 확장-함유 DMPK 전사체를 선택적으로 녹다운할 수 있음을 나타낸다. Figures 42A-42B show that treatment with EEV-PMO 221-1120 can selectively knock down repeat expansion-containing DMPK transcripts in the HeLa480 cell line.

도 42c~42d는 EEV-PMO 221-1120에 의한 치료가 MBNL1(도 42c) 및 SOCS1(도 42d) 스플라이싱을 투여량 의존적 방식으로 교정하였음을 보여준다. Figures 42C-42D show that treatment with EEV-PMO 221-1120 corrected MBNL1 ( Figure 42C ) and SOCS1 ( Figure 42D ) splicing in a dose-dependent manner.

본 발명의 다수의 구현예가 기술되었다. 그럼에도 불구하고, 본 발명의 사상 및 범주를 벗어나지 않고도 다양한 변형이 이루어질 수 있음을 이해할 것이다. 따라서, 다른 구현예는 다음 청구범위의 범주 내에 있다.A number of embodiments of the invention have been described. Nevertheless, it will be understood that various modifications may be made without departing from the spirit and scope of the invention. Accordingly, other implementations are within the scope of the following claims.

SEQUENCE LISTING <110> ENTRADA THERAPEUTICS, INC. <120> ANTISENSE COMPOUNDS AND METHODS FOR TARGETING CUG REPEATS <130> 0655.000040WO01 <140> PCT/US2022/034517 <141> 2022-06-22 <150> 63/339,250 <151> 2022-05-06 <150> 63/327,179 <151> 2022-04-04 <150> 63/362,295 <151> 2022-03-31 <150> 63/326,201 <151> 2022-03-31 <150> 63/317,856 <151> 2022-03-08 <150> 63/316,634 <151> 2022-03-04 <150> 63/314,369 <151> 2022-02-26 <150> 63/268,577 <151> 2022-02-25 <150> 63/305,071 <151> 2022-01-31 <150> 63/298,565 <151> 2022-01-11 <150> 63/290,960 <151> 2021-12-17 <150> 63/290,892 <151> 2021-12-17 <150> 63/239,847 <151> 2021-09-01 <150> 63/239,671 <151> 2021-09-01 <150> 63/213,900 <151> 2021-06-23 <160> 414 <170> PatentIn version 3.5 <210> 1 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 1 His His His His 1 <210> 2 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 2 Lys His Lys Lys 1 <210> 3 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 3 Lys Lys His Lys 1 <210> 4 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 4 Lys Lys Lys His 1 <210> 5 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 5 Lys His Lys His 1 <210> 6 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 6 His Lys His Lys 1 <210> 7 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 7 Lys Lys Lys Lys 1 <210> 8 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 8 Lys Lys Arg Lys 1 <210> 9 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 9 Lys Arg Lys Lys 1 <210> 10 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 10 Lys Arg Arg Lys 1 <210> 11 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 11 Arg Lys Lys Arg 1 <210> 12 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 12 Arg Arg Arg Arg 1 <210> 13 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 13 Lys Gly Lys Lys 1 <210> 14 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 14 Lys Lys Gly Lys 1 <210> 15 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Beta-alanine <220> <221> MOD_RES <222> (4)..(4) <223> Beta-alanine <400> 15 His Ala His Ala His 1 5 <210> 16 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Beta-alanine <220> <221> MOD_RES <222> (4)..(4) <223> Beta-alanine <400> 16 His Ala Lys Ala His 1 5 <210> 17 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 17 Arg Arg Arg Arg Arg 1 5 <210> 18 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 18 Lys Lys Lys Lys Lys 1 5 <210> 19 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 19 Lys Lys Lys Arg Lys 1 5 <210> 20 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 20 Arg Lys Lys Lys Lys 1 5 <210> 21 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 21 Lys Arg Lys Lys Lys 1 5 <210> 22 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 22 Lys Lys Arg Lys Lys 1 5 <210> 23 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 23 Lys Lys Lys Lys Arg 1 5 <210> 24 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Beta-alanine <220> <221> MOD_RES <222> (4)..(4) <223> Beta-alanine <400> 24 Lys Ala Lys Ala Lys 1 5 <210> 25 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 25 Arg Lys Lys Lys Lys Gly 1 5 <210> 26 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 26 Lys Arg Lys Lys Lys Gly 1 5 <210> 27 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 27 Lys Lys Arg Lys Lys Gly 1 5 <210> 28 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 28 Lys Lys Lys Lys Arg Gly 1 5 <210> 29 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (6)..(6) <223> Beta-alanine <400> 29 Arg Lys Lys Lys Lys Ala 1 5 <210> 30 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (6)..(6) <223> Beta-alanine <400> 30 Lys Arg Lys Lys Lys Ala 1 5 <210> 31 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (6)..(6) <223> Beta-alanine <400> 31 Lys Lys Arg Lys Lys Ala 1 5 <210> 32 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (6)..(6) <223> Beta-alanine <400> 32 Lys Lys Lys Lys Arg Ala 1 5 <210> 33 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 33 Lys Lys Lys Arg Lys Val 1 5 <210> 34 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 34 Arg Arg Arg Arg Arg Arg 1 5 <210> 35 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 35 His His His His His His 1 5 <210> 36 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 36 Arg His Arg His Arg His 1 5 <210> 37 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 37 His Arg His Arg His Arg 1 5 <210> 38 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 38 Lys Arg Lys Arg Lys Arg 1 5 <210> 39 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 39 Arg Lys Arg Lys Arg Lys 1 5 <210> 40 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Beta-alanine <220> <221> MOD_RES <222> (4)..(4) <223> Beta-alanine <220> <221> MOD_RES <222> (6)..(6) <223> Beta-alanine <400> 40 Arg Ala Arg Ala Arg Ala 1 5 <210> 41 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Beta-alanine <220> <221> MOD_RES <222> (4)..(4) <223> Beta-alanine <220> <221> MOD_RES <222> (6)..(6) <223> Beta-alanine <400> 41 Lys Ala Lys Ala Lys Ala 1 5 <210> 42 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 42 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 43 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 43 Pro Gly Lys Lys Arg Lys Val 1 5 <210> 44 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 44 Pro Lys Gly Lys Arg Lys Val 1 5 <210> 45 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 45 Pro Lys Lys Gly Arg Lys Val 1 5 <210> 46 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 46 Pro Lys Lys Lys Gly Lys Val 1 5 <210> 47 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 47 Pro Lys Lys Lys Arg Gly Val 1 5 <210> 48 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 48 Pro Lys Lys Lys Arg Lys Gly 1 5 <210> 49 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Beta-alanine <220> <221> MOD_RES <222> (4)..(4) <223> Beta-alanine <400> 49 Arg Ala Arg Ala Arg 1 5 <210> 50 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Beta-alanine <220> <221> MOD_RES <222> (4)..(4) <223> Beta-alanine <400> 50 Arg Ala His Ala Arg 1 5 <210> 51 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Beta-alanine <220> <221> MOD_RES <222> (4)..(4) <223> Beta-alanine <400> 51 His Ala Arg Ala His 1 5 <210> 52 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 52 Asn Leu Ser Lys Arg Pro Ala Ala Ile Lys Lys Ala Gly Gln Ala Lys 1 5 10 15 Lys Lys Lys <210> 53 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 53 Pro Ala Ala Lys Arg Val Lys Leu Asp 1 5 <210> 54 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 54 Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Phe 1 5 10 <210> 55 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 55 Arg Met Arg Lys Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu Arg 1 5 10 15 Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg 20 25 <210> 56 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 56 Lys Ala Lys Lys Asp Glu Gln Ile Leu Lys Arg Arg Asn Val 1 5 10 <210> 57 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 57 Val Ser Arg Lys Arg Pro Arg Pro 1 5 <210> 58 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 58 Pro Pro Lys Lys Ala Arg Glu Asp 1 5 <210> 59 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 59 Pro Gln Pro Lys Lys Lys Pro Leu 1 5 <210> 60 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 60 Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro 1 5 10 <210> 61 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 61 Asp Arg Leu Arg Arg 1 5 <210> 62 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 62 Pro Lys Gln Lys Lys Arg Lys 1 5 <210> 63 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 63 Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu 1 5 10 <210> 64 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 64 Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg 1 5 10 <210> 65 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 65 Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys 1 5 10 15 Lys Ser Lys Lys 20 <210> 66 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 66 Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys 1 5 10 15 Lys <210> 67 <400> 67 000 <210> 68 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 68 Phe Gly Phe Gly Arg Gly Arg 1 5 <210> 69 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> (5)..(5) <223> D-arginine <220> <221> MOD_RES <222> (7)..(7) <223> D-arginine <400> 69 Gly Phe Phe Gly Arg Gly Arg 1 5 <210> 70 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> (3)..(3) <223> L-naphthylalanine <400> 70 Phe Phe Ala Gly Arg Gly Arg 1 5 <210> 71 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <400> 71 Phe Phe Phe Gly Arg Gly Arg 1 5 <210> 72 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> (3)..(3) <223> L-naphthylalanine <220> <221> MOD_RES <222> (5)..(5) <223> D-arginine <220> <221> MOD_RES <222> (7)..(7) <223> D-arginine <400> 72 Phe Phe Ala Gly Arg Gly Arg 1 5 <210> 73 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (4)..(4) <223> L-naphthylalanine <400> 73 Phe Gly Phe Ala 1 <210> 74 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> (5)..(5) <223> D-arginine <220> <221> MOD_RES <222> (7)..(7) <223> D-arginine <400> 74 Gly Phe Phe Gly Arg Gly Arg Gln 1 5 <210> 75 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> (3)..(3) <223> L-naphthylalanine <400> 75 Phe Phe Ala Gly Arg Gly Arg Gln 1 5 <210> 76 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <400> 76 Phe Phe Phe Gly Arg Gly Arg Gln 1 5 <210> 77 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> (3)..(3) <223> L-naphthylalanine <220> <221> MOD_RES <222> (5)..(5) <223> D-arginine <220> <221> MOD_RES <222> (7)..(7) <223> D-arginine <400> 77 Phe Phe Ala Gly Arg Gly Arg Gln 1 5 <210> 78 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> (3)..(3) <223> L-naphthylalanine <220> <221> MOD_RES <222> (5)..(5) <223> D-arginine <220> <221> MOD_RES <222> (7)..(7) <223> D-arginine <400> 78 Phe Phe Ala Arg Arg Arg Arg Gln 1 5 <210> 79 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> (3)..(3) <223> L-naphthylalanine <220> <221> MOD_RES <222> (4)..(4) <223> Citrulline <220> <221> MOD_RES <222> (5)..(5) <223> D-arginine <220> <221> MOD_RES <222> (6)..(6) <223> Citrulline <220> <221> MOD_RES <222> (7)..(7) <223> D-arginine <400> 79 Phe Phe Ala Xaa Arg Xaa Arg Gln 1 5 <210> 80 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> (3)..(3) <223> L-naphthylalanine <220> <221> MOD_RES <222> (5)..(5) <223> D-arginine <220> <221> MOD_RES <222> (7)..(7) <223> D-arginine <400> 80 Phe Phe Ala Gly Arg Gly Arg Gln 1 5 <210> 81 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <400> 81 Phe Phe Phe Gly Arg Gly Arg Gln 1 5 <210> 82 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 82 Phe Gly Phe Gly Arg Gly Arg Gln 1 5 <210> 83 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> (5)..(5) <223> D-arginine <220> <221> MOD_RES <222> (7)..(7) <223> D-arginine <400> 83 Gly Phe Phe Gly Arg Gly Arg Gln 1 5 <210> 84 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 84 Phe Gly Phe Gly Arg Arg Arg Gln 1 5 <210> 85 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 85 Phe Gly Phe Arg Arg Arg Arg Gln 1 5 <210> 86 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <400> 86 Phe Ala Arg Arg Arg Arg Gln 1 5 <210> 87 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(1) <223> D-phenylalanine <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <220> <221> MOD_RES <222> (4)..(4) <223> D-arginine <220> <221> MOD_RES <222> (6)..(6) <223> D-arginine <400> 87 Phe Ala Arg Arg Arg Arg Gln 1 5 <210> 88 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> (3)..(3) <223> L-naphthylalanine <400> 88 Phe Phe Ala Arg Gly Arg Gly Gln 1 5 <210> 89 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <400> 89 Phe Ala Arg Arg Arg Gln 1 5 <210> 90 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <400> 90 Phe Ala Arg Arg Arg Cys 1 5 <210> 91 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <220> <221> MOD_RES <222> (6)..(6) <223> Selenocysteine <400> 91 Phe Ala Arg Arg Arg Xaa 1 5 <210> 92 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (4)..(4) <223> L-naphthylalanine <400> 92 Arg Arg Arg Ala Phe Gln 1 5 <210> 93 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (5)..(5) <223> L-naphthylalanine <400> 93 Arg Arg Arg Arg Ala Phe 1 5 <210> 94 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <400> 94 Phe Ala Arg Arg Arg Arg 1 5 <210> 95 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-naphthylalanine <220> <221> MOD_RES <222> (3)..(3) <223> D-arginine <220> <221> MOD_RES <222> (5)..(5) <223> D-arginine <220> <221> MOD_RES <222> (7)..(7) <223> D-glutamine <400> 95 Phe Ala Arg Arg Arg Arg Gln 1 5 <210> 96 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-naphthylalanine <220> <221> MOD_RES <222> (3)..(3) <223> D-arginine <220> <221> MOD_RES <222> (5)..(5) <223> D-arginine <400> 96 Phe Ala Arg Arg Arg Arg Gln 1 5 <210> 97 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <400> 97 Phe Ala Arg Arg Arg Arg Gln 1 5 <210> 98 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(1) <223> D-phenylalanine <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <220> <221> MOD_RES <222> (4)..(4) <223> D-arginine <220> <221> MOD_RES <222> (6)..(6) <223> D-arginine <400> 98 Phe Ala Arg Arg Arg Arg Gln 1 5 <210> 99 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (5)..(5) <223> L-naphthylalanine <400> 99 Arg Arg Phe Arg Ala Arg Gln 1 5 <210> 100 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (6)..(6) <223> L-naphthylalanine <400> 100 Phe Arg Arg Arg Arg Ala Gln 1 5 <210> 101 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(1) <223> D-arginine <220> <221> MOD_RES <222> (5)..(5) <223> L-naphthylalanine <400> 101 Arg Arg Phe Arg Ala Arg Gln 1 5 <210> 102 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (3)..(3) <223> L-naphthylalanine <400> 102 Arg Arg Ala Phe Arg Arg Gln 1 5 <210> 103 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 103 Cys Arg Arg Arg Arg Phe Trp Gln 1 5 <210> 104 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> (3)..(3) <223> L-naphthylalanine <220> <221> MOD_RES <222> (5)..(5) <223> D-arginine <220> <221> MOD_RES <222> (7)..(7) <223> D-arginine <400> 104 Phe Phe Ala Arg Arg Arg Arg Gln 1 5 <210> 105 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (3)..(3) <223> L-naphthylalanine <400> 105 Phe Phe Ala Arg Arg Arg Arg Gln 1 5 <210> 106 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (6)..(6) <223> L-naphthylalanine <400> 106 Arg Phe Arg Phe Arg Ala Arg Gln 1 5 <210> 107 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(1) <223> Selenocysteine <400> 107 Xaa Arg Arg Arg Arg Phe Trp Gln 1 5 <210> 108 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 108 Cys Arg Arg Arg Arg Phe Trp Gln 1 5 <210> 109 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <400> 109 Phe Ala Arg Arg Arg Arg Gln Lys 1 5 <210> 110 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <400> 110 Phe Ala Arg Arg Arg Arg Gln Cys 1 5 <210> 111 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(1) <223> D-phenylalanine <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <220> <221> MOD_RES <222> (4)..(4) <223> D-arginine <220> <221> MOD_RES <222> (6)..(6) <223> D-arginine <400> 111 Phe Ala Arg Arg Arg Arg Arg Gln 1 5 <210> 112 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <400> 112 Phe Ala Arg Arg Arg Arg Arg Gln 1 5 <210> 113 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (5)..(5) <223> L-naphthylalanine <220> <221> MOD_RES <222> (8)..(8) <223> Norleucine <400> 113 Arg Arg Arg Arg Ala Phe Asp Xaa Cys 1 5 <210> 114 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <400> 114 Phe Ala Arg Arg Arg 1 5 <210> 115 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 115 Phe Trp Arg Arg Arg 1 5 <210> 116 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (4)..(4) <223> L-naphthylalanine <400> 116 Arg Arg Arg Ala Phe 1 5 <210> 117 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 117 Arg Arg Arg Trp Phe 1 5 <210> 118 <400> 118 000 <210> 119 <400> 119 000 <210> 120 <400> 120 000 <210> 121 <400> 121 000 <210> 122 <400> 122 000 <210> 123 <400> 123 000 <210> 124 <400> 124 000 <210> 125 <400> 125 000 <210> 126 <400> 126 000 <210> 127 <400> 127 000 <210> 128 <400> 128 000 <210> 129 <400> 129 000 <210> 130 <400> 130 000 <210> 131 <400> 131 000 <210> 132 <400> 132 000 <210> 133 <400> 133 000 <210> 134 <400> 134 000 <210> 135 <400> 135 000 <210> 136 <400> 136 000 <210> 137 <400> 137 000 <210> 138 <400> 138 000 <210> 139 <400> 139 000 <210> 140 <400> 140 000 <210> 141 <400> 141 000 <210> 142 <400> 142 000 <210> 143 <400> 143 000 <210> 144 <400> 144 000 <210> 145 <400> 145 000 <210> 146 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 146 cagcagcagc agcagcagca g 21 <210> 147 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 147 cagcagcagc agcagcagca gcagc 25 <210> 148 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 148 cagcagcagc agcagcagca gcagcagcag 30 <210> 149 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 149 agcagcagca gcagcagcag cagcagcagc 30 <210> 150 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> (3)..(3) <223> L-naphthylalanine <220> <221> MOD_RES <222> (5)..(5) <223> D-arginine <220> <221> MOD_RES <222> (7)..(7) <223> D-arginine <400> 150 Phe Phe Ala Arg Arg Arg Arg Gln 1 5 <210> 151 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 151 cagcagcagc ag 12 <210> 152 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 152 cagcagcagc agcag 15 <210> 153 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 153 cagcagcagc agcagcag 18 <210> 154 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 154 cagcagcagc agcagcagca g 21 <210> 155 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 155 cagcagcagc agcagcagca gcag 24 <210> 156 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 156 cagcagcagc agcagcagca gcagcag 27 <210> 157 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 157 cagcagcagc agcagcagca gcagcagcag 30 <210> 158 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 158 cagcagcagc agcagcagca gcagcagcag cag 33 <210> 159 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 159 cagcagcagc agcagcagca gcagcagcag cagcag 36 <210> 160 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 160 cagcagcagc agcagcagca gcagcagcag cagcagcag 39 <210> 161 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 161 cagcagcagc agcagcagca gcagcagcag cagcagcagc ag 42 <210> 162 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 162 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcag 45 <210> 163 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 163 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcag 48 <210> 164 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 164 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca g 51 <210> 165 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 165 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcag 54 <210> 166 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 166 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcag 57 <210> 167 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 167 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 <210> 168 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 168 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cag 63 <210> 169 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 169 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcag 66 <210> 170 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 170 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcag 69 <210> 171 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 171 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc ag 72 <210> 172 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 172 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcag 75 <210> 173 <211> 78 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 173 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcag 78 <210> 174 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 174 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca g 81 <210> 175 <211> 84 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 175 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcag 84 <210> 176 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 176 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcag 87 <210> 177 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 177 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag 90 <210> 178 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 178 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cag 93 <210> 179 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 179 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcag 96 <210> 180 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 180 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcag 99 <210> 181 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 181 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc ag 102 <210> 182 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 182 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcag 105 <210> 183 <211> 108 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 183 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcag 108 <210> 184 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 184 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca g 111 <210> 185 <211> 114 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 185 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcag 114 <210> 186 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 186 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcag 117 <210> 187 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 187 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 <210> 188 <211> 123 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 188 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cag 123 <210> 189 <211> 126 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 189 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcag 126 <210> 190 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 190 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcag 129 <210> 191 <211> 132 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 191 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc ag 132 <210> 192 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 192 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcag 135 <210> 193 <211> 138 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 193 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcag 138 <210> 194 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 194 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca g 141 <210> 195 <211> 144 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 195 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcag 144 <210> 196 <211> 147 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 196 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagcag 147 <210> 197 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 197 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagcagcag 150 <210> 198 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 198 agcagcagca gc 12 <210> 199 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 199 agcagcagca gcagc 15 <210> 200 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 200 agcagcagca gcagcagc 18 <210> 201 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 201 agcagcagca gcagcagcag c 21 <210> 202 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 202 agcagcagca gcagcagcag cagc 24 <210> 203 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 203 agcagcagca gcagcagcag cagcagc 27 <210> 204 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 204 agcagcagca gcagcagcag cagcagcagc 30 <210> 205 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 205 agcagcagca gcagcagcag cagcagcagc agc 33 <210> 206 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 206 agcagcagca gcagcagcag cagcagcagc agcagc 36 <210> 207 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 207 agcagcagca gcagcagcag cagcagcagc agcagcagc 39 <210> 208 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 208 agcagcagca gcagcagcag cagcagcagc agcagcagca gc 42 <210> 209 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 209 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagc 45 <210> 210 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 210 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagc 48 <210> 211 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 211 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag c 51 <210> 212 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 212 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagc 54 <210> 213 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 213 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagc 57 <210> 214 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 214 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 <210> 215 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 215 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agc 63 <210> 216 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 216 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagc 66 <210> 217 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 217 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagc 69 <210> 218 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 218 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gc 72 <210> 219 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 219 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagc 75 <210> 220 <211> 78 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 220 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagc 78 <210> 221 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 221 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag c 81 <210> 222 <211> 84 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 222 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagc 84 <210> 223 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 223 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagc 87 <210> 224 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 224 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc 90 <210> 225 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 225 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agc 93 <210> 226 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 226 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagc 96 <210> 227 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 227 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagc 99 <210> 228 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 228 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gc 102 <210> 229 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 229 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagc 105 <210> 230 <211> 108 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 230 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagc 108 <210> 231 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 231 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag c 111 <210> 232 <211> 114 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 232 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagc 114 <210> 233 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 233 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagc 117 <210> 234 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 234 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 120 <210> 235 <211> 123 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 235 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 120 agc 123 <210> 236 <211> 126 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 236 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 120 agcagc 126 <210> 237 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 237 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 120 agcagcagc 129 <210> 238 <211> 132 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 238 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 120 agcagcagca gc 132 <210> 239 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 239 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 120 agcagcagca gcagc 135 <210> 240 <211> 138 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 240 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 120 agcagcagca gcagcagc 138 <210> 241 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 241 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 120 agcagcagca gcagcagcag c 141 <210> 242 <211> 144 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 242 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 120 agcagcagca gcagcagcag cagc 144 <210> 243 <211> 147 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 243 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 120 agcagcagca gcagcagcag cagcagc 147 <210> 244 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 244 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 120 agcagcagca gcagcagcag cagcagcagc 150 <210> 245 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 245 gcagcagcag ca 12 <210> 246 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 246 gcagcagcag cagca 15 <210> 247 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 247 gcagcagcag cagcagca 18 <210> 248 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 248 gcagcagcag cagcagcagc a 21 <210> 249 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 249 gcagcagcag cagcagcagc agca 24 <210> 250 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 250 gcagcagcag cagcagcagc agcagca 27 <210> 251 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 251 gcagcagcag cagcagcagc agcagcagca 30 <210> 252 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 252 gcagcagcag cagcagcagc agcagcagca gca 33 <210> 253 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 253 gcagcagcag cagcagcagc agcagcagca gcagca 36 <210> 254 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 254 gcagcagcag cagcagcagc agcagcagca gcagcagca 39 <210> 255 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 255 gcagcagcag cagcagcagc agcagcagca gcagcagcag ca 42 <210> 256 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 256 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagca 45 <210> 257 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 257 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagca 48 <210> 258 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 258 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc a 51 <210> 259 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 259 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agca 54 <210> 260 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 260 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagca 57 <210> 261 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 261 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 <210> 262 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 262 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gca 63 <210> 263 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 263 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagca 66 <210> 264 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 264 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagca 69 <210> 265 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 265 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag ca 72 <210> 266 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 266 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagca 75 <210> 267 <211> 78 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 267 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagca 78 <210> 268 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 268 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc a 81 <210> 269 <211> 84 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 269 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agca 84 <210> 270 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 270 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagca 87 <210> 271 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 271 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca 90 <210> 272 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 272 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gca 93 <210> 273 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 273 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagca 96 <210> 274 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 274 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagca 99 <210> 275 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 275 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag ca 102 <210> 276 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 276 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagca 105 <210> 277 <211> 108 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 277 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagca 108 <210> 278 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 278 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc a 111 <210> 279 <211> 114 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 279 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agca 114 <210> 280 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 280 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagca 117 <210> 281 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 281 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 <210> 282 <211> 123 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 282 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 gca 123 <210> 283 <211> 126 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 283 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 gcagca 126 <210> 284 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 284 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 gcagcagca 129 <210> 285 <211> 132 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 285 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 gcagcagcag ca 132 <210> 286 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 286 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 gcagcagcag cagca 135 <210> 287 <211> 138 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 287 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 gcagcagcag cagcagca 138 <210> 288 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 288 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 gcagcagcag cagcagcagc a 141 <210> 289 <211> 144 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 289 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 gcagcagcag cagcagcagc agca 144 <210> 290 <211> 147 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 290 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 gcagcagcag cagcagcagc agcagca 147 <210> 291 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 291 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 gcagcagcag cagcagcagc agcagcagca 150 <210> 292 <400> 292 000 <210> 293 <400> 293 000 <210> 294 <400> 294 000 <210> 295 <400> 295 000 <210> 296 <400> 296 000 <210> 297 <400> 297 000 <210> 298 <400> 298 000 <210> 299 <400> 299 000 <210> 300 <400> 300 000 <210> 301 <400> 301 000 <210> 302 <400> 302 000 <210> 303 <400> 303 000 <210> 304 <400> 304 000 <210> 305 <400> 305 000 <210> 306 <400> 306 000 <210> 307 <400> 307 000 <210> 308 <400> 308 000 <210> 309 <400> 309 000 <210> 310 <400> 310 000 <210> 311 <400> 311 000 <210> 312 <400> 312 000 <210> 313 <400> 313 000 <210> 314 <400> 314 000 <210> 315 <400> 315 000 <210> 316 <400> 316 000 <210> 317 <400> 317 000 <210> 318 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 318 agccagagca ccgcaaccgg acgag 25 <210> 319 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 319 ttcacatcgc cagcatctgt gc 22 <210> 320 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 320 cacggaacac aaaggcactg aatgt 25 <210> 321 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 321 gctgcccaat accaggtcaa c 21 <210> 322 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 322 tggtgggaga aatgctgtat gc 22 <210> 323 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 323 gctcatggtc ctcaagatct cac 23 <210> 324 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 324 gggtcagtgc ctcagctttg 20 <210> 325 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 325 tcgacgacag tgagatggag 20 <210> 326 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 326 caaactcctt cagcgagtcc 20 <210> 327 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 327 ttccatcgtc caccgcaaat 20 <210> 328 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 328 agtttacgat ggcagcaacg 20 <210> 329 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 329 aggtcggtgt gaacggattt g 21 <210> 330 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 330 tgtagaccat gtagttgagg tca 23 <210> 331 <400> 331 000 <210> 332 <400> 332 000 <210> 333 <400> 333 000 <210> 334 <400> 334 000 <210> 335 <400> 335 000 <210> 336 <400> 336 000 <210> 337 <400> 337 000 <210> 338 <400> 338 000 <210> 339 <400> 339 000 <210> 340 <400> 340 000 <210> 341 <400> 341 000 <210> 342 <400> 342 000 <210> 343 <400> 343 000 <210> 344 <400> 344 000 <210> 345 <400> 345 000 <210> 346 <400> 346 000 <210> 347 <400> 347 000 <210> 348 <400> 348 000 <210> 349 <400> 349 000 <210> 350 <400> 350 000 <210> 351 <400> 351 000 <210> 352 <400> 352 000 <210> 353 <400> 353 000 <210> 354 <400> 354 000 <210> 355 <400> 355 000 <210> 356 <400> 356 000 <210> 357 <400> 357 000 <210> 358 <400> 358 000 <210> 359 <400> 359 000 <210> 360 <400> 360 000 <210> 361 <400> 361 000 <210> 362 <400> 362 000 <210> 363 <400> 363 000 <210> 364 <400> 364 000 <210> 365 <400> 365 000 <210> 366 <400> 366 000 <210> 367 <400> 367 000 <210> 368 <400> 368 000 <210> 369 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 369 taacgttgag ggcat 15 <210> 370 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 370 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 371 <211> 41 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 371 Arg Met Arg Lys Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu Arg 1 5 10 15 Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys Asp 20 25 30 Glu Gln Ile Leu Lys Arg Arg Asn Val 35 40 <210> 372 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 372 gcagcagcag cagcagcagc agcagcagca 30 <210> 373 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 373 gggcctttta ttcgcgaggg tcggg 25 <210> 374 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 374 gagggccttt tattcgcgag ggtcg 25 <210> 375 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 375 tggagggcct tttattcgcg agggt 25 <210> 376 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 376 gatggagggc cttttattcg cgagg 25 <210> 377 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 377 cagatggagg gccttttatt cgcga 25 <210> 378 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 378 ggcagatgga gggcctttta ttcgc 25 <210> 379 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 379 tgggcagatg gagggccttt tattc 25 <210> 380 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 380 tttgggcaga tggagggcct tttat 25 <210> 381 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 381 gctttgggca gatggagggc ctttt 25 <210> 382 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 382 gagctttggg cagatggagg gcctt 25 <210> 383 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 383 cagagctttg ggcagatgga gggcc 25 <210> 384 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 384 tccagagctt tgggcagatg gaggg 25 <210> 385 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 385 agtccagagc tttgggcaga tggag 25 <210> 386 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 386 ggagtccaga gctttgggca gatgg 25 <210> 387 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 387 gtggagtcca gagctttggg cagat 25 <210> 388 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 388 ctgtggagtc cagagctttg ggcag 25 <210> 389 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 389 cactgtggag tccagagctt tgggc 25 <210> 390 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 390 gacactgtgg agtccagagc tttgg 25 <210> 391 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 391 cggacactgt ggagtccaga gcttt 25 <210> 392 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 392 cgcggacact gtggagtcca gagct 25 <210> 393 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 393 accgcggaca ctgtggagtc cagag 25 <210> 394 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 394 aaaccgcgga cactgtggag tccag 25 <210> 395 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 395 gcaaaccgcg gacactgtgg agtcc 25 <210> 396 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 396 acgcaaaccg cggacactgt ggagt 25 <210> 397 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 397 caacgcaaac cgcggacact gtgga 25 <210> 398 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(120) <223> This sequence may encompass 5-40 "cag" repeating units <400> 398 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 <210> 399 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(150) <223> This sequence may encompass 1-50 "cag" repeating units <400> 399 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagcagcag 150 <210> 400 <211> 152 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (3)..(152) <223> This region may encompass 1-50 "cag" repeating units <400> 400 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 120 agcagcagca gcagcagcag cagcagcagc ag 152 <210> 401 <211> 151 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (2)..(151) <223> This region may encompass 1-50 "cag" repeating units <400> 401 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 gcagcagcag cagcagcagc agcagcagca g 151 <210> 402 <211> 152 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(150) <223> This region may encompass 1-50 "cag" repeating units <400> 402 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagcagcag ag 152 <210> 403 <211> 151 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(150) <223> This region may encompass 1-50 "cag" repeating units <400> 403 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagcagcag a 151 <210> 404 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(150) <223> This sequence may encompass 2-50 "cag" repeating units <400> 404 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagcagcag 150 <210> 405 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(60) <223> This sequence may encompass 2-20 "cag" repeating units <400> 405 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 <210> 406 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(30) <223> This sequence may encompass 2-10 "cag" repeating units <400> 406 cagcagcagc agcagcagca gcagcagcag 30 <210> 407 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(30) <223> This sequence may encompass 4-10 "cag" repeating units <400> 407 cagcagcagc agcagcagca gcagcagcag 30 <210> 408 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(30) <223> This sequence may encompass 5-10 "cag" repeating units <400> 408 cagcagcagc agcagcagca gcagcagcag 30 <210> 409 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(30) <223> This sequence may encompass 6-10 "cag" repeating units <400> 409 cagcagcagc agcagcagca gcagcagcag 30 <210> 410 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> misc_feature <222> (1)..(27) <223> This sequence may encompass 6-9 "cag" repeating units <400> 410 cagcagcagc agcagcagca gcagcag 27 <210> 411 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> misc_feature <222> (1)..(24) <223> This sequence may encompass 6-8 "cag" repeating units <400> 411 cagcagcagc agcagcagca gcag 24 <210> 412 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> misc_feature <222> (1)..(21) <223> This sequence may encompass 6-7 "cag" repeating units <400> 412 cagcagcagc agcagcagca g 21 <210> 413 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 413 cugcugcugc ugcugcugcu g 21 <210> 414 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(120) <223> This sequence may encompass 10-40 "cag" repeating units <400> 414 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 SEQUENCE LISTING <110> ENTRADA THERAPEUTICS, INC. <120> ANTISENSE COMPOUNDS AND METHODS FOR TARGETING CUG REPEATS <130> 0655.000040WO01 <140> PCT/US2022/034517 <141> 2022-06-22 <150> 63/339,250 <151> 2022-05-06 <150> 63 /327,179 <151> 2022-04-04 <150> 63/362,295 <151> 2022-03-31 <150> 63/326,201 <151> 2022-03-31 <150> 63/317,856 <151> 2022-03 -08 <150> 63/316,634 <151> 2022-03-04 <150> 63/314,369 <151> 2022-02-26 <150> 63/268,577 <151> 2022-02-25 <150> 63/305,071 <151> 2022-01-31 <150> 63/298,565 <151> 2022-01-11 <150> 63/290,960 <151> 2021-12-17 <150> 63/290,892 <151> 2021-12-17 <150> 63/239,847 <151> 2021-09-01 <150> 63/239,671 <151> 2021-09-01 <150> 63/213,900 <151> 2021-06-23 <160> 414 <170> PatentIn version 3.5 <210> 1 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 1 His His His His 1 <210> 2 <211> 4 < 212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 2 Lys His Lys Lys 1 <210> 3 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 3 Lys Lys His Lys 1 <210> 4 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide < 400> 4 Lys Lys Lys His 1 <210> 5 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 5 Lys His Lys His 1 <210> 6 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 6 His Lys His Lys 1 <210> 7 <211> 4 <212> PRT <213 > Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 7 Lys Lys Lys Lys 1 <210> 8 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 8 Lys Lys Arg Lys 1 <210> 9 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 9 Lys Arg Lys Lys 1 <210> 10 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 10 Lys Arg Arg Lys 1 <210> 11 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 11 Arg Lys Lys Arg 1 <210> 12 <211> 4 <212> PRT <213> Artificial Sequence <220 > <223> Description of Artificial Sequence: Synthetic peptide <400> 12 Arg Arg Arg Arg 1 <210> 13 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 13 Lys Gly Lys Lys 1 <210> 14 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 14 Lys Lys Gly Lys 1 <210 > 15 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Beta -alanine <220> <221> MOD_RES <222> (4)..(4) <223> Beta-alanine <400> 15 His Ala His Ala His 1 5 <210> 16 <211> 5 <212> PRT < 213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Beta-alanine <220> <221> MOD_RES <222 > (4)..(4) <223> Beta-alanine <400> 16 His Ala Lys Ala His 1 5 <210> 17 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 17 Arg Arg Arg Arg Arg 1 5 <210> 18 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 18 Lys Lys Lys Lys Lys Lys 1 5 <210> 19 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 19 Lys Lys Lys Arg Lys 1 5 < 210> 20 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 20 Arg Lys Lys Lys Lys 1 5 <210> 21 <211> 5 <212 > PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 21 Lys Arg Lys Lys Lys 1 5 <210> 22 <211> 5 <212> PRT <213> Artificial Sequence <220 > <223> Description of Artificial Sequence: Synthetic peptide <400> 22 Lys Lys Arg Lys Lys 1 5 <210> 23 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 23 Lys Lys Lys Lys Arg 1 5 <210> 24 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Beta-alanine <220> <221> MOD_RES <222> (4)..(4) <223> Beta-alanine <400> 24 Lys Ala Lys Ala Lys 1 5 <210> 25 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 25 Arg Lys Lys Lys Lys Gly 1 5 <210> 26 <211 > 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 26 Lys Arg Lys Lys Lys Gly 1 5 <210> 27 <211> 6 <212> PRT <213 > Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 27 Lys Lys Arg Lys Lys Gly 1 5 <210> 28 <211> 6 <212> PRT <213> Artificial Sequence <220> <223 > Description of Artificial Sequence: Synthetic peptide <400> 28 Lys Lys Lys Lys Lys Arg Gly 1 5 <210> 29 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (6)..(6) <223> Beta-alanine <400> 29 Arg Lys Lys Lys Lys Ala 1 5 <210> 30 <211> 6 <212> PRT <213 > Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (6)..(6) <223> Beta-alanine <400> 30 Lys Arg Lys Lys Lys Ala 1 5 <210> 31 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (6)..(6) <223> Beta-alanine <400> 31 Lys Lys Arg Lys Lys Ala 1 5 <210> 32 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220 > <221> MOD_RES <222> (6)..(6) <223> Beta-alanine <400> 32 Lys Lys Lys Lys Arg Ala 1 5 <210> 33 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 33 Lys Lys Lys Arg Lys Val 1 5 <210> 34 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 34 Arg Arg Arg Arg Arg Arg 1 5 <210> 35 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400 > 35 His His His His His His His 1 5 <210> 36 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 36 Arg His Arg His Arg His 1 5 <210> 37 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 37 His Arg His Arg His Arg 1 5 <210> 38 <211 > 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 38 Lys Arg Lys Arg Lys Arg 1 5 <210> 39 <211> 6 <212> PRT <213 > Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 39 Arg Lys Arg Lys Arg Lys 1 5 <210> 40 <211> 6 <212> PRT <213> Artificial Sequence <220> <223 > Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Beta-alanine <220> <221> MOD_RES <222> (4)..(4) <223> Beta-alanine <220> <221> MOD_RES <222> (6)..(6) <223> Beta-alanine <400> 40 Arg Ala Arg Ala Arg Ala 1 5 <210> 41 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Beta-alanine <220> < 221> MOD_RES <222> (4)..(4) <223> Beta-alanine <220> <221> MOD_RES <222> (6)..(6) <223> Beta-alanine <400> 41 Lys Ala Lys Ala Lys Ala 1 5 <210> 42 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 42 Pro Lys Lys Lys Arg Lys Val 1 5 < 210> 43 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 43 Pro Gly Lys Lys Arg Lys Val 1 5 <210> 44 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 44 Pro Lys Gly Lys Arg Lys Val 1 5 <210> 45 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 45 Pro Lys Lys Gly Arg Lys Val 1 5 <210> 46 <211> 7 <212> PRT <213> Artificial Sequence <220> <223 > Description of Artificial Sequence: Synthetic peptide <400> 46 Pro Lys Lys Lys Gly Lys Val 1 5 <210> 47 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 47 Pro Lys Lys Lys Arg Gly Val 1 5 <210> 48 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 48 Pro Lys Lys Lys Arg Lys Gly 1 5 <210> 49 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2) ..(2) <223> Beta-alanine <220> <221> MOD_RES <222> (4)..(4) <223> Beta-alanine <400> 49 Arg Ala Arg Ala Arg 1 5 <210> 50 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Beta-alanine <220> <221> MOD_RES <222> (4)..(4) <223> Beta-alanine <400> 50 Arg Ala His Ala Arg 1 5 <210> 51 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Beta-alanine <220> <221> MOD_RES <222> ( 4)..(4) <223> Beta-alanine <400> 51 His Ala Arg Ala His 1 5 <210> 52 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 52 Asn Leu Ser Lys Arg Pro Ala Ala Ile Lys Lys Ala Gly Gln Ala Lys 1 5 10 15 Lys Lys Lys <210> 53 <211> 9 <212> PRT <213> Artificial Sequence <220 > <223> Description of Artificial Sequence: Synthetic peptide <400> 53 Pro Ala Ala Lys Arg Val Lys Leu Asp 1 5 <210> 54 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 54 Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Phe 1 5 10 <210> 55 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 55 Arg Met Arg Lys Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu Arg 1 5 10 15 Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg 20 25 <210> 56 <211> 14 < 212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 56 Lys Ala Lys Lys Asp Glu Gln Ile Leu Lys Arg Arg Asn Val 1 5 10 <210> 57 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 57 Val Ser Arg Lys Arg Pro Arg Pro 1 5 <210> 58 <211> 8 <212> PRT <213 > Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 58 Pro Pro Lys Lys Ala Arg Glu Asp 1 5 <210> 59 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 59 Pro Gln Pro Lys Lys Lys Pro Leu 1 5 <210> 60 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 60 Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro 1 5 10 <210> 61 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence : Synthetic peptide <400> 61 Asp Arg Leu Arg Arg 1 5 <210> 62 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 62 Pro Lys Gln Lys Lys Arg Lys 1 5 <210> 63 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 63 Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu 1 5 10 <210> 64 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 64 Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg 1 5 10 <210> 65 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 65 Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys 1 5 10 15 Lys Ser Lys Lys 20 <210> 66 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 66 Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys 1 5 10 15 Lys <210> 67 <400> 67 000 <210> 68 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 68 Phe Gly Phe Gly Arg Gly Arg 1 5 <210> 69 <211 > 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220 > <221> MOD_RES <222> (5)..(5) <223> D-arginine <220> <221> MOD_RES <222> (7)..(7) <223> D-arginine <400> 69 Gly Phe Phe Gly Arg Gly Arg 1 5 <210> 70 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> ( 2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> (3)..(3) <223> L-naphthylalanine <400> 70 Phe Phe Ala Gly Arg Gly Arg 1 5 <210> 71 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223 > D-phenylalanine <400> 71 Phe Phe Phe Gly Arg Gly Arg 1 5 <210> 72 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> (3)..(3) <223> L-naphthylalanine <220> <221 > MOD_RES <222> (5)..(5) <223> D-arginine <220> <221> MOD_RES <222> (7)..(7) <223> D-arginine <400> 72 Phe Phe Ala Gly Arg Gly Arg 1 5 <210> 73 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (4). .(4) <223> L-naphthylalanine <400> 73 Phe Gly Phe Ala 1 <210> 74 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide < 220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> (5)..(5) <223> D-arginine <220> <221> MOD_RES <222> (7)..(7) <223> D-arginine <400> 74 Gly Phe Phe Gly Arg Gly Arg Gln 1 5 <210> 75 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> ( 3)..(3) <223> L-naphthylalanine <400> 75 Phe Phe Ala Gly Arg Gly Arg Gln 1 5 <210> 76 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <400> 76 Phe Phe Phe Gly Arg Gly Arg Gln 1 5 <210> 77 < 211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine < 220> <221> MOD_RES <222> (3)..(3) <223> L-naphthylalanine <220> <221> MOD_RES <222> (5)..(5) <223> D-arginine <220> <221> MOD_RES <222> (7)..(7) <223> D-arginine <400> 77 Phe Phe Ala Gly Arg Gly Arg Gln 1 5 <210> 78 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> (3)..(3) <223> L-naphthylalanine <220> <221> MOD_RES <222> (5)..(5) <223> D-arginine <220 > <221> MOD_RES <222> (7)..(7) <223> D-arginine <400> 78 Phe Phe Ala Arg Arg Arg Arg Gln 1 5 <210> 79 <211> 8 <212> PRT <213 > Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> (3)..(3) <223> L-naphthylalanine <220> <221> MOD_RES <222> (4)..(4) <223> Citrulline <220> <221> MOD_RES <222> (5). .(5) <223> D-arginine <220> <221> MOD_RES <222> (6)..(6) <223> Citrulline <220> <221> MOD_RES <222> (7)..(7) <223> D-arginine <400> 79 Phe Phe Ala <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> (3)..(3) <223> L-naphthylalanine <220 > <221> MOD_RES <222> (5)..(5) <223> D-arginine <220> <221> MOD_RES <222> (7)..(7) <223> D-arginine <400> 80 Phe Phe Ala Gly Arg Gly Arg Gln 1 5 <210> 81 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <400> 81 Phe Phe Phe Gly Arg Gly Arg Gln 1 5 <210> 82 <211> 8 <212> PRT <213> Artificial Sequence <220> <223 > Description of Artificial Sequence: Synthetic peptide <400> 82 Phe Gly Phe Gly Arg Gly Arg Gln 1 5 <210> 83 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> (5)..(5) <223> D-arginine <220> <221> MOD_RES <222> (7)..(7) <223> D-arginine <400> 83 Gly Phe Phe Gly Arg Gly Arg Gln 1 5 <210> 84 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 84 Phe Gly Phe Gly Arg Arg Arg Gln 1 5 <210> 85 <211> 8 <212> PRT <213> Artificial Sequence < 220> <223> Description of Artificial Sequence: Synthetic peptide <400> 85 Phe Gly Phe Arg Arg Arg Arg Gln 1 5 <210> 86 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <400> 86 Phe Ala Arg Arg Arg Arg Gln 1 5 <210> 87 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(1) <223> D-phenylalanine <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <220> <221> MOD_RES <222> (4)..(4) <223> D-arginine <220> <221 > MOD_RES <222> (6)..(6) <223> D-arginine <400> 87 Phe Ala Arg Arg Arg Arg Gln 1 5 <210> 88 <211> 8 <212> PRT <213> Artificial Sequence < 220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES <222> (3). .(3) <223> L-naphthylalanine <400> 88 Phe Phe Ala Arg Gly Arg Gly Gln 1 5 <210> 89 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <400> 89 Phe Ala Arg Arg Arg Gln 1 5 <210> 90 <211> 6 <212 > PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <400> 90 Phe Ala Arg Arg Arg Cys 1 5 <210> 91 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2). .(2) <223> L-naphthylalanine <220> <221> MOD_RES <222> (6)..(6) <223> Selenocysteine <400> 91 Phe Ala Arg Arg Arg Xaa 1 5 <210> 92 <211 > 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (4)..(4) <223> L-naphthylalanine <400 > 92 Arg Arg Arg Ala Phe Gln 1 5 <210> 93 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (5)..(5) <223> L-naphthylalanine <400> 93 Arg Arg Arg Arg Ala Phe 1 5 <210> 94 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <400> 94 Phe Ala Arg Arg Arg Arg 1 5 <210> 95 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-naphthylalanine <220> < 221> MOD_RES <222> (3)..(3) <223> D-arginine <220> <221> MOD_RES <222> (5)..(5) <223> D-arginine <220> <221> MOD_RES <222> (7)..(7) <223> D-glutamine <400> 95 Phe Ala Arg Arg Arg Arg Gln 1 5 <210> 96 <211> 7 <212> PRT <213> Artificial Sequence <220 > <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-naphthylalanine <220> <221> MOD_RES <222> (3).. (3) <223> D-arginine <220> <221> MOD_RES <222> (5)..(5) <223> D-arginine <400> 96 Phe Ala Arg Arg Arg Arg Gln 1 5 <210> 97 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <400> 97 Phe Ala Arg Arg Arg Arg Gln 1 5 <210> 98 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(1) <223> D-phenylalanine <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <220> <221> MOD_RES <222 > (4)..(4) <223> D-arginine <220> <221> MOD_RES <222> (6)..(6) <223> D-arginine <400> 98 Phe Ala Arg Arg Arg Arg Gln 1 5 <210> 99 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (5)..(5) <223> L-naphthylalanine <400> 99 Arg Arg Phe Arg Ala Arg Gln 1 5 <210> 100 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide < 220> <221> MOD_RES <222> (6)..(6) <223> L-naphthylalanine <400> 100 Phe Arg Arg Arg Arg Ala Gln 1 5 <210> 101 <211> 7 <212> PRT <213 > Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(1) <223> D-arginine <220> <221> MOD_RES <222> (5)..(5) <223> L-naphthylalanine <400> 101 Arg Arg Phe Arg Ala Arg Gln 1 5 <210> 102 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (3)..(3) <223> L-naphthylalanine <400> 102 Arg Arg Ala Phe Arg Arg Gln 1 5 <210> 103 <211 > 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 103 Cys Arg Arg Arg Arg Phe Trp Gln 1 5 <210> 104 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> D-phenylalanine <220> <221> MOD_RES < 222> (3)..(3) <223> L-naphthylalanine <220> <221> MOD_RES <222> (5)..(5) <223> D-arginine <220> <221> MOD_RES <222> (7)..(7) <223> D-arginine <400> 104 Phe Phe Ala Arg Arg Arg Arg Gln 1 5 <210> 105 <211> 8 <212> PRT <213> Artificial Sequence <220> <223 > Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (3)..(3) <223> L-naphthylalanine <400> 105 Phe Phe Ala Arg Arg Arg Arg Gln 1 5 <210> 106 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (6)..(6) <223> L-naphthylalanine <400> 106 Arg Phe Arg Phe Arg Ala Arg Gln 1 5 <210> 107 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(1) <223> Selenocysteine <400> 107 <223> Description of Artificial Sequence: Synthetic peptide <400> 108 Cys Arg Arg Arg Arg Phe Trp Gln 1 5 <210> 109 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <400> 109 Phe Ala Arg Arg Arg Arg Gln Lys 1 5 <210> 110 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <400> 110 Phe Ala Arg Arg Arg Arg Gln Cys 1 5 <210> 111 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(1) <223> D-phenylalanine <220> <221> MOD_RES <222> (2)..(2) <223> L-naphthylalanine <220> <221> MOD_RES <222> (4 )..(4) <223> D-arginine <220> <221> MOD_RES <222> (6)..(6) <223> D-arginine <400> 111 Phe Ala Arg Arg Arg Arg Arg Gln 1 5 <210> 112 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223 > L-naphthylalanine <400> 112 Phe Ala Arg Arg Arg Arg Arg Gln 1 5 <210> 113 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220 > <221> MOD_RES <222> (5)..(5) <223> L-naphthylalanine <220> <221> MOD_RES <222> (8)..(8) <223> Norleucine <400> 113 Arg Arg Arg Arg Ala Phe Asp 2)..(2) <223> L-naphthylalanine <400> 114 Phe Ala Arg Arg Arg 1 5 <210> 115 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 115 Phe Trp Arg Arg Arg 1 5 <210> 116 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221 > MOD_RES <222> (4)..(4) <223> L-naphthylalanine <400> 116 Arg Arg Arg Ala Phe 1 5 <210> 117 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 117 Arg Arg Arg Trp Phe 1 5 <210> 118 <400> 118 000 <210> 119 <400> 119 000 <210> 120 <400> 120 000 <210> 121 <400> 121 000 <210> 122 <400> 122 000 <210> 123 <400> 123 000 <210> 124 <400> 124 000 <210> 125 <400> 125 000 <210> 126 <400> 126 000 <210> 127 <400> 127 000 <210> 128 <400> 128 000 <210> 129 <400> 129 000 <210> 130 <400> 130 000 <210> 131 <400> 131 000 <210> 132 <400> 132 000 <210> 133 <400> 133 000 <210> 134 <400> 134 000 <210> 135 <400> 135 000 <210> 136 <400> 136 000 <210> 137 <400> 137 000 <210> 138 <400> 138 000 <210> 139 <400> 139 000 <210> 140 <400> 140 000 <210> 141 <400> 141 000 <210> 142 <400> 142 000 <210> 143 <400> 143 000 <210> 144 <400> 144 000 <210> 145 <400> 145 000 <210> 146 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 146 cagcagcagc agcagcagca g 21 <210> 147 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 147 cagcagcagc agcagcagca gcagc 25 <210> 148 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 148 cagcagcagc agcagcagca gcagcagcag 30 <210> 149 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 149 agcagcag ca gcagcagcag cagcagcagc 30 <210> 150 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) ) <223> D-phenylalanine <220> <221> MOD_RES <222> (3)..(3) <223> L-naphthylalanine <220> <221> MOD_RES <222> (5)..(5) < 223> D-arginine <220> <221> MOD_RES <222> (7)..(7) <223> D-arginine <400> 150 Phe Phe Ala Arg Arg Arg Arg Gln 1 5 <210> 151 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 151 cagcagcagc ag 12 <210> 152 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 152 cagcagcagc agcag 15 <210> 153 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 153 Cagcagcagc AGCAGCAG 18 <210> 154 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Description of artificial sequence > 154 cagcagcAgcAgca G 21 <210> 155 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 155 cagcagcagc agcagcagca gcag 24 <210> 156 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 156 cagcagcagc agcagcagca gcagcag 27 <210> 157 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400 > 157 cagcagcagc agcagcagca gcagcagcag 30 <210> 158 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 158 cagcagcagc agcagcagca gcagcagcag cag 33 <210> 159 < 211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 159 cagcagcagc agcagcagca gcagcagcag cagcag 36 <210> 160 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 160 cagcagcagc agcagcagca gcagcagcag cagcagcag 39 <210> 161 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence : Synthetic oligonucleotide <400> 161 cagcagcagc agcagcagca gcagcagcag cagcagcagc ag 42 <210> 162 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 162 cagcagca gc agcagcagca gcagcagcag cagcagcagc agcag 45 <210> 163 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 163 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcag 48 <210 > 164 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 164 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca g 51 <210> 165 <211> 54 <212> DNA <213> Artificial ial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 165 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcag 54 <210> 166 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 166 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcag 57 <210> 167 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oli gonucleotide <400> 167 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 <210> 168 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 168 cagcagcagc agca gcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cag 63 <210> 169 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 169 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcag 66 <21 0> 170 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 170 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcag 69 <210> 171 <211> 72 <212> DNA <213 > Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 171 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc ag 72 <210> 172 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oli gonucleotide <400> 172 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcag 75 <210> 173 <211> 78 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 173 cagcagcagc agca gcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcag 78 <210> 174 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 174 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 ca gcagcagc agcagcagca g 81 <210> 175 <211> 84 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 175 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca g cag 84 <210> 176 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 176 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcag 87 <210> 177 <211> 90 <212> DNA < 213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 177 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag 90 <210> 178 <211> 93 <212> DNA <213> Artificial Sequence < 220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 178 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cag 93 <210> 179 <211> 96 < 212> DNA <213> Artificial Sequence <220> <223 > Description of Artificial Sequence: Synthetic oligonucleotide <400> 179 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcag 96 <210> 180 <211> 99 <212> DNA <2 13> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 180 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcag 99 <210> 181 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 181 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc ag 102 <210> 182 <211> 105 <212> DNA <213> Artificial Sequence < 220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 182 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcag 105 <210> 183 <211> 108 <212> DNA <213> Artificial Sequence <220 > <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 183 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcag 108 <210> 184 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Syn thetic polynucleotide <400> 184 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca g 111 <210> 185 <211> 114 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 185 cagcagcag c agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcag 114 <210> 186 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 186 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcag 117 <210> 187 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 187 cagcagcagc agcagcagca gcagcagcag cagcagca gc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 <210> 188 <211> 123 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 188 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcag cagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cag 123 <210> 189 <211> 126 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 189 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 ca gcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcag 126 <210> 190 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 190 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 6 0 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcag 129 <210> 191 <211> 132 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 191 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc ag 132 <210> 192 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 192 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagca gcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcag 135 <210> 193 <211> 138 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 193 cagcagcagc agcagcagca gcagcagcag cagcagcagc ag cagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcag 138 <210> 194 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 194 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca g 141 <210> 195 <211> 144 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 195 cagcagcagc agcagca gca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcag 144 <210> 196 <211> 147 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 196 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagcag 147 <210> 197 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequ ence: Synthetic polynucleotide <400> 197 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagcagcag 150 <210> 198 <211> 12 <212> DNA <213> Artificial Sequence <2 20> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 198 agcagcagca gc 12 <210> 199 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 199 agcagcagca gcagc 15 <210> 200 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 200 agcagcagca gcagcagc 18 <210> 201 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 201 agcagcagca gcagcagcag c 21 <210> 202 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 202 agcagcagca gcagcagcag cagc 24 <210> 203 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 203 agcagcagca gcagcagcag cagcagc 27 <210> 204 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 204 agcagcagca gcagcagcag cagcagcagc 30 <210> 205 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 205 agcagcagca gcagcagcag cagcagcagc agc 33 <210> 206 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 206 agcagcagca gcagcagcag cagcagcagc agcagc 36 <210> 207 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 207 agcagcagca gcagcagcag cagcagcagc agcagca gc 39 <210> 208 <211 > 42 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 208 agcagcagca gcagcagcag cagcagcagc agcagcagca gc 42 <210> 209 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 209 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagc 45 <210> 210 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 210 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagc 48 <210> 211 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 2 11 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag c 51 <210> 212 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 212 agcagcagca gcagcagcag cagcagcagc agcagcagca gca gcagcag cagc 54 <210> 213 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 213 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagc 57 <210> 214 <211> 60 <212 > DNA < 213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 214 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 <210> 215 <211> 63 <212> DNA <213> Artificial Sequ ence <220> <223 > Description of Artificial Sequence: Synthetic oligonucleotide <400> 215 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agc 63 <210> 216 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Description of Art ificial Sequence: Synthetic oligonucleotide <400> 216 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagc 66 <210> 217 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oli gonucleotide <400> 217 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagc 69 <210> 218 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 218 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gc 72 <210> 219 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 219 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagc 75 <210> 220 < 211> 78 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 220 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagc 78 <21 0> 221 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 221 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag c 81 <210> 222 <211> 84 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 222 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagc 84 <210> 223 <211> 87 <212 > DNA <213> Artificial Sequence <220> < 223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 223 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagc 87 <210> 224 <211> 90 <212> DNA <213 > Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 224 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc 90 <210> 225 <211> 93 <212> DNA <213> Artificial Sequence < 220> <223> Description of Artificial Sequence: Synthetic oligonucleotide < 400> 225 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agc 93 <210> 226 <211> 96 <212> DNA <213> Artificial Sequence <220> <223 > Description of Artificial Sequence: Synthetic oligonucleotide <400> 226 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagc 96 <210> 227 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 227 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagc 99 <210> 228 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 228 agcagcagca gcagcagcag ca gcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gc 102 <210> 229 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 229 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag ca gcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagc 105 <210> 230 <211> 108 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 230 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagc 108 <210 > 231 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 231 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag ca gcagcagc agcagcagca gcagcagcag c 111 <210> 232 <211> 114 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 232 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcag c agcagcagca gcagcagcag cagc 114 <210> 233 <211 > 117 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 233 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agca gcagca gcagcagcag cagcagc 117 <210> 234 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 234 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca g cagcagcag cagcagcagc 120 <210> 235 <211> 123 <212 > DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 235 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcag cag cagcagcagc 120 agc 123 <210> 236 <211> 126 <212 > DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 236 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcag cag cagcagcagc 120 agcagc 126 <210> 237 <211> 129 <212 > DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 237 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcag cag cagcagcagc 120 agcagcagc 129 <210> 238 <211> 132 <212 > DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 238 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 120 agcagcagca gc 132 <210> 239 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 239 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 120 agcagcagca gcagc 135 <210> 240 <211> 138 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide < 400> 240 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 120 agcagcagca gcagcagc 138 <210> 241 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial S equence: Synthetic polynucleotide <400> 241 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 120 agcagcagca gcagcagcag c 141 <210> 242 <211> 144 <212> DNA <213> Artificial Sequence <220> <2 23> Description of Artificial Sequence: Synthetic polynucleotide <400> 242 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 120 agcagcagca gcagcagcag cagc 144 <210> 243 <211> 147 <212> DNA <2 13> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 243 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 120 agcagcagca gcagcagcag cagcagc 147 <210> 244 < 211> 150 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400 > 244 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 120 agcagcagca gcagcagcag cagcagcagc 150 <21 0> 245 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 245 gcagcagcag ca 12 <210> 246 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 246 gcagcagcag cagca 15 <210> 247 <211 > 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 247 gcagcagcag cagcagca 18 <210> 248 <211> 21 <212> DNA <213> Artificial Sequence <220 > <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 248 gcagcagcag cagcagcagc a 21 <210> 249 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide < 400>249 gcagcagcag cagcagcagc agca 24 <210> 250 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 250 gcagcagcag cagcagcagc agcagca 27 <210> 251 <211 >30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 251 gcagcagcag cagcagcagc agcagcagca 30 <210> 252 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 252 gcagcagcag cagcagcagc agcagcagca gca 33 <210> 253 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide < 400> 253 gcagcagcag cagcagcagc agcagcagca gcagca 36 <210> 254 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 254 gcagcagcag cagcagcagc agcag cagca gcagcagca 39 <210> 255 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 255 gcagcagcag cagcagcagc agcagcagca gcagcagcag ca 42 <210> 256 <211> 45 <212> DNA <212> 213> Artificial sequence <220> <223> Description of Artificial sequence: Synthetic Oligonucleotide G cagca 45 <210> 257 <211> 48 <212> DNA <213> Artificial sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 257 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagca 48 <210> 258 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <40 0> 258 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc a 51 <210> 259 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 259 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agca 54 <210> 260 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 260 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagca 57 <210 > 261 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 261 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 <210> 262 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 262 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gca 63 <210> 263 <211> 66 <212> DNA <213 > Artificial Sequence < 220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 263 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagca 66 <210> 264 <211> 69 <212> DNA <213> Artificial Sequence <22 0> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 264 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagca 69 <210> 265 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Description of Art ificial Sequence: Synthetic oligonucleotide <400 > 265 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag ca 72 <210> 266 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <40 0> 266 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagca 75 <210> 267 <211> 78 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 267 gcagcagcag cagcagcagc agcagcagca gcagca gcag cagcagcagc agcagcagca 60 gcagcagcag cagcagca 78 <210> 268 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 268 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagca gcagc a 81 <210> 269 < 211> 84 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 269 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agca 84 <210> 270 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligo nucleotide <400> 270 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagca 87 <210> 271 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 271 gcagcagcag cagcagcagc agcagcagca gca gcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca 90 <210> 272 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 272 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gca 93 <210> 273 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 273 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc a gcagcagca gcagca 96 <210> 274 <211> 99 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 274 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcag cagca 99 <210> 275 <211> 102 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 275 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag ca 102 < 210> 276 <211> 105 <212> DNA <213 > Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 276 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagca 105 <210 > 277 <211> 108 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 277 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagca 108 <210> 278 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 278 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc a 111 <210> 279 <2 11> 114 <212> DNA <213> Artificial Sequence <220> <223 > Description of Artificial Sequence: Synthetic polynucleotide <400> 279 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agca 114 <210> 280 <211> 117 <212> DNA <213> Artificial Sequence <2 20> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 280 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagca 117 <210> 281 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial ial Sequence: Synthetic polynucleotide <400> 281 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 <210> 282 <211> 123 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <4 00> 282 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 gca 123 <210> 283 <211> 126 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 283 g cagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 gcagca 126 <210> 284 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 28 4 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 gcagcagca 129 <210> 285 <211> 132 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 285 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 gcagcagcag ca 132 <210> 286 <211> 135 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400 > 286 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 gcagcagcag cagca 135 <210> 287 <211> 138 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 287 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 gcagcagcag cagcagca 138 <210> 288 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 288 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 gcagcagcag cagcagcagc a 141 <210> 289 <211> 144 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 289 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 gcagcagcag cagcagcagc agca 144 <210> 290 <21 1> 147 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400 > 290 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 gcagcagcag cagcagcagc agcagca 147 <210> 291 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 291 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 120 gcagcagcag cagcagcagc agcagcagca 15 0 <210> 292 <400> 292 000 <210> 293 <400> 293 000 <210> 294 <400> 294 000 <210> 295 <400> 295 000 <210> 296 <400> 296 000 <210> 297 <400> 297 000 <210> 298 <400> 298 000 <210> 299 <400> 299 000 <210> 300 <400> 300 000 <210> 301 <400> 301 000 <210> 302 <400> 302 000 <210> 303 <400> 303 000 <210> 304 <400> 304 000 <210> 305 <400> 305 000 <210> 306 <400> 306 000 <210> 307 <400> 307 000 <210> 308 <400> 308 000 <210> 309 <400> 309 000 <210> 310 <400> 310 000 <210> 311 <400> 311 000 <210> 312 <400> 312 000 <210> 313 <400> 313 000 <210> 314 <400> 314 000 <210> 315 <400> 315 000 <210> 316 <400> 316 000 <210> 317 <400> 317 000 <210> 318 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 318 agccagagca ccgcaaccgg acgag 25 <210> 319 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 319 ttcacatcgc cagcatctgt gc 22 <210> 320 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 320 cacggaacac aaaggcactg aatgt 25 <210> 321 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 321 gctgcccaat accaggtcaa c 21 <210> 322 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 322 tggtggggaga aatgctgtat gc 22 <210> 323 <211> 23 < 212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 323 gctcatggtc ctcaagatct cac 23 <210> 324 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 324 gggtcagtgc ctcagctttg 20 <210> 325 <211> 20 < 212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 325 tcgacgacag tgagatggag 20 <210> 326 <211> 20 <212> DNA <213> Artificial Sequence <220> <223 > Description of Artificial Sequence: Synthetic oligonucleotide <400> 326 caaactcctt cagcgagtcc 20 <210> 327 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 327 ttccatcgtc caccgcaaat 20 <210> 328 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 328 agtttacgat ggcagcaacg 20 <210> 329 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 329 aggtcggtgt gaacggattt g 21 <210> 330 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 330 tgtagaccat gtagttgagg tca 23 <210> 331 <400> 331 000 <210> 332 <400> 332 000 <210> 333 <400> 333 000 <210> 334 <400> 334 000 <210> 335 <400> 335 000 <210> 336 <400> 336 000 <210> 337 <400> 337 000 <210> 338 <400> 338 000 <210> 339 <400> 339 000 <210> 340 <400> 340 000 <210> 341 <400> 341 000 <210> 342 <400> 342 000 <210> 343 <400> 343 000 <210> 344 <400> 344 000 <210> 345 <400> 345 000 <210> 346 <400> 346 000 <210> 347 <400> 347 000 <210> 348 <400> 348 000 <210> 349 <400> 349 000 <210> 350 <400> 350 000 <210> 351 <400> 351 000 <210> 352 <400> 352 000 <210> 353 <400> 353 000 <210> 354 <400> 354 000 <210> 355 <400> 355 000 <210> 356 <400> 356 000 <210> 357 <400> 357 000 <210> 358 <400> 358 000 <210> 359 <400> 359 000 <210> 360 <400> 360 000 <210> 361 <400> 361 000 <210> 362 <400> 362 000 <210> 363 <400> 363 000 <210> 364 <400> 364 000 <210> 365 <400> 365 000 <210> 366 <400> 366 000 <210> 367 <400> 367 000 <210> 368 <400> 368 000 <210> 369 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 369 taacgttgag ggcat 15 <210> 370 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 370 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 371 <211> 41 <212> PRT <213> Artificial Sequence <220 > <223> Description of Artificial Sequence: Synthetic polypeptide <400> 371 Arg Met Arg Lys Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu Arg 1 5 10 15 Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys Asp 20 25 30 Glu Gln Ile Leu Lys Arg Arg Asn Val 35 40 <210> 372 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 372 gcagcagcag cagcagcagc agcagcagca 30 <210> 373 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 373 gggcctttta ttcgcgaggg tcggg 25 <210> 374 <211> 25 < 212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 374 gagggccttt tattcgcgag ggtcg 25 <210> 375 <211> 25 <212> DNA <213> Artificial Sequence <220> < 223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 375 tggagggcct tttattcgcg agggt 25 <210> 376 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 376 gatggagggc cttttatattcg cgagg 25 <210> 377 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 377 cagatggagg gccttttatt cgcga 25 <210> 378 <2 11> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 378 ggcagatgga gggcctttta ttcgc 25 <210> 379 <211> 25 <212> DNA <213> Artificial Sequence <220 > <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 379 tgggcagatg gagggccttt tattc 25 <210> 380 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide < 400> 380 tttgggcaga tggagggcct tttat 25 <210> 381 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 381 gctttgggca gatggagggc ctttt 25 <210> 382 < 211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 382 gagctttggg cagatggagg gcctt 25 <210> 383 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 383 cagagctttg ggcagatgga gggcc 25 <210> 384 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 384 tccagagctt tgggcagatg gaggg 25 <210> 385 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 385 agtccagagc tttgggcaga tggag 25 <210 > 386 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 386 ggagtccaga gctttgggca gatgg 25 <210> 387 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 387 gtggagtcca gagctttggg cagat 25 <210> 388 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence : Synthetic oligonucleotide <400> 388 ctgtggagtc cagagctttg ggcag 25 <210> 389 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 389 cactgtggag tccagagctt tgggc 25 < 210> 390 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 390 gacactgtgg agtccagagc tttgg 25 <210> 391 <211> 25 <212> DNA < 213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 391 cggacactgt ggagtccaga gcttt 25 <210> 392 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 392 cgcggacact gtggagtcca gagct 25 <210> 393 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 393 accgcggaca ctgtggagt c cagag 25 <210> 394 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 394 aaaccgcgga cactgtggag tccag 25 <210> 395 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 395 gcaaaccgcg gacactgtgg agtcc 25 <210> 396 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 396 acgcaaaccg cggacactgt ggagt 25 <210> 397 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 397 caacgcaaac cgcggacact gtgga 25 <210> 398 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(120) ) <223> This sequence may encompass 5-40 "cag" repeating units <400> 398 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 <2 10> 399 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(150) <223> This sequence may encompass 1-50 "cag" repeating units <400> 399 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagcagcag 150 <210 > 400 <211> 152 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide < 220> <221> misc_feature <222> (3)..(152) <223> This region may encompass 1-50 "cag" repeating units <400> 400 agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc 60 agcagcagca gcagcagcag cagcagca gc agcagcagca gcagcagcag cagcagcagc 120 agcagcagca gcagcagcag cagcagcagc ag 152 <210> 401 <211> 151 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (2).. (151) <223> This region may encompass 1-50 "cag" repeating units <400> 401 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 60 gcagcagcag cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca 1 20 gcagcagcag cagcagcagc agcagcagca g 151 <210> 402 <211> 152 < 212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(150) <223> This region may encompass 1-50 " cag" repeating units <400> 402 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagca gcag ag 152 <210> 403 <211> 151 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(150) <223> This region may encompass 1-50 "cag" repeating units <400> 403 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120 cagcagcagc agcagcagca gcagcagcag a 151 <210> 404 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial ial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(150) <223> This sequence may encompass 2-50 "cag" repeating units <400> 404 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcag ca gcagcagcag 120 cagcagcagc agcagcagca gcagcagcag 150 <210 > 405 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(60) <223> This sequence may encompass 2-20 "cag" repeating units <400> 405 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60 <210> 406 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(30) <223> This sequence may encompass 2-10 "cag" repeating units <400> 406 cagcagcagc agcagcagca gcagcagcag 30 <210> 407 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(30) <223> This sequence may encompass 4- 10 "cag" repeating units <400> 407 cagcagcagc agcagcagca gcagcagcag 30 <210> 408 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(30) <223> This sequence may encompass 5-10 "cag" repeating units <400> 408 cagcagcagc agcagcagca gcagcagcag 30 <210> 409 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1)..(30) <223> This sequence may encompass 6-10 "cag" repeating units <400 > 409 cagcagcagc agcagcagca gcagcagcag 30 <210> 410 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> misc_feature <222> (1). .(27) <223> This sequence may encompass 6-9 "cag" repeating units <400> 410 cagcagcagc agcagcagca gcagcag 27 <210> 411 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> misc_feature <222> (1)..(24) <223> This sequence may encompass 6-8 "cag" repeating units <400> 411 cagcagcagc agcagcagca gcag 24 <210 > 412 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> misc_feature <222> (1)..(21) <223> This sequence may encompass 6-7 "cag" repeating units <400> 412 cagcagcagc agcagcagca g 21 <210> 413 <211> 21 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide < 400> 413 cugcugcugc ugcugcugcu g 21 <210> 414 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <220> <221> misc_feature <222> (1) ..(120) <223> This sequence may encompass 10-40 "cag" repeating units <400> 414 cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcag cag 120

Claims (81)

다음을 포함하는 화합물:
6 내지 12개의 아미노산을 갖는 환형 펩티드로서, 적어도 2개의 아미노산은 하전된 아미노산이고, 적어도 2개의 아미노산은 방향족 소수성 아미노산이고, 적어도 2개의 아미노산은 하전되지 않은 비방향족 아미노산인, 환형 펩티드; 및
표적 mRNA 서열에서 확장된 CUG 반복의 적어도 일부에 상보적인 안티센스 화합물(AC)로서, 포스포로디아미데이트 모르폴리노(PMO) 뉴클레오티드를 포함하는, AC.
Compounds containing:
a cyclic peptide having 6 to 12 amino acids, wherein at least 2 amino acids are charged amino acids, at least 2 amino acids are aromatic hydrophobic amino acids, and at least 2 amino acids are uncharged non-aromatic amino acids; and
An antisense compound (AC) complementary to at least a portion of an expanded CUG repeat in a target mRNA sequence, the AC comprising a phosphorodiamidate morpholino (PMO) nucleotide.
제1항에 있어서, 환형 펩티드의 적어도 2개의 하전 아미노산은 아르기닌인, 화합물.2. The compound of claim 1, wherein at least two charged amino acids of the cyclic peptide are arginine. 제1항 또는 제2항에 있어서, 환형 펩티드의 적어도 2개의 방향족 소수성 아미노산은 페닐알라닌, 나프틸알라닌, 또는 이들의 조합인, 화합물.3. The compound of claim 1 or 2, wherein at least two aromatic hydrophobic amino acids of the cyclic peptide are phenylalanine, naphthylalanine, or a combination thereof. 제1항 내지 제3항 중 어느 한 항에 있어서, 적어도 2개의 하전되지 않은 비방향족 아미노산은 시트룰린, 글리신, 또는 이들의 조합인, 화합물.4. The compound of any one of claims 1-3, wherein the at least two uncharged non-aromatic amino acids are citrulline, glycine, or combinations thereof. 제1항에 있어서, 환형 펩티드는 다음 구조 중 하나:
(I-a);
(I-b); 또는
이의 양성자화된 형태를 가지며,
식 중:
R1, R2, 및 R3은 각각 독립적으로 H이거나 방향족기를 포함하는 측쇄를 갖는 아미노산 잔기이고;
R1, R2, 및 R3 중 적어도 하나는 아미노산의 방향족 또는 헤테로방향족 측쇄이고;
R4는 H이거나 아미노산 측쇄이고;
AASC는 안티센스 화합물이 접합되는 아미노산 측쇄이고;
각각의 m은 독립적으로 0, 1, 2, 또는 3의 정수인, 화합물.
2. The method of claim 1, wherein the cyclic peptide has one of the following structures:
(Ia);
(Ib); or
It has a protonated form,
During the ceremony:
R 1 , R 2 , and R 3 are each independently H or an amino acid residue having a side chain containing an aromatic group;
At least one of R 1 , R 2 , and R 3 is an aromatic or heteroaromatic side chain of an amino acid;
R 4 is H or an amino acid side chain;
AA SC is the amino acid side chain to which the antisense compound is conjugated;
A compound wherein each m is independently an integer of 0, 1, 2, or 3.
제5항에 있어서, 환형 펩티드는 다음 구조 중 하나:
(I-1);
(I-2);
(I-3);
(I-4);
(I-5);
(I-6); 또는
이의 양성자화된 형태를 갖는, 화합물.
6. The method of claim 5, wherein the cyclic peptide has one of the following structures:
(I-1);
(I-2);
(I-3);
(I-4);
(I-5);
(I-6); or
A compound having its protonated form.
제5항 또는 제6항에 있어서, AASC는 아스파라긴 잔기, 아스파르트산 잔기, 글루탐산 잔기, 호모글루탐산 잔기, 또는 호모글루탐산염 잔기의 측쇄인, 화합물.7. The compound of claim 5 or 6, wherein AA SC is a side chain of an asparagine residue, an aspartic acid residue, a glutamic acid residue, a homoglutamic acid residue, or a homoglutamate residue. 제5항 또는 제6항에 있어서,
R1, R2, 및 R3은 각각 독립적으로 H이거나 방향족기를 포함하는 측쇄를 갖는 아미노산 잔기이고;
R1, R2, 및 R3 중 적어도 하나는 아미노산의 방향족 또는 헤테로방향족 측쇄이고;
R4는 H이거나 아미노산 측쇄이고;
m은 2이고;
AASC는 글루탐산 잔기의 측쇄인, 화합물.
According to claim 5 or 6,
R 1 , R 2 , and R 3 are each independently H or an amino acid residue having a side chain containing an aromatic group;
At least one of R 1 , R 2 , and R 3 is an aromatic or heteroaromatic side chain of an amino acid;
R 4 is H or an amino acid side chain;
m is 2;
AA SC is the side chain of a glutamic acid residue.
제5항 또는 제6항에 있어서, AASC는:또는 이고, 식 중 t는 0 내지 5의 정수인, 화합물.The method of claim 5 or 6, wherein AA SC : or , where t is an integer from 0 to 5. 제1항 내지 제9항 중 어느 한 항에 있어서, 링커를 추가로 포함하되, 링커는 안티센스 화합물을 AASC에 접합시키는, 화합물.10. The compound of any one of claims 1 to 9, further comprising a linker, wherein the linker conjugates the antisense compound to AA SC . 제10항에 있어서, 링커는 -(OCH2CH2)z’- 서브유닛을 포함하되, z’은 1 내지 23의 정수인, 화합물.11. The compound of claim 10, wherein the linker comprises a -(OCH 2 CH 2 ) z'- subunit, wherein z' is an integer from 1 to 23. 제10항에 있어서, 링커는 다음을 포함하는, 화합물:
(i) -(OCH2CH2)z- 서브유닛 (식 중 z’은 1 내지 23의 정수임);
(ii) 하나 이상의 아미노산 잔기, 예컨대 글리신, β-알라닌, 4-아미노부티르산, 5-아미노펜탄산, 또는 6-아미노헥산산의 잔기, 또는 이들의 조합; 또는
(iii) (i) 및 (ii)의 조합.
11. The compound of claim 10, wherein the linker comprises:
(i) -(OCH 2 CH 2 ) z -subunit (where z' is an integer from 1 to 23);
(ii) one or more amino acid residues, such as those of glycine, β-alanine, 4-aminobutyric acid, 5-aminopentanoic acid, or 6-aminohexanoic acid, or combinations thereof; or
(iii) A combination of (i) and (ii).
제10항에 있어서, 링커는 다음을 포함하는, 화합물:
(i) -(OCH2CH2)z- 서브유닛 (식 중 z는 2 내지 20의 정수임);
(ii) 글리신, β-알라닌, 4-아미노부티르산, 5-아미노펜탄산, 6-아미노헥산산의 잔기, 또는 이들의 조합; 또는
(iii) (i) 및 (ii)의 조합.
11. The compound of claim 10, wherein the linker comprises:
(i) -(OCH 2 CH 2 ) z -subunit, where z is an integer from 2 to 20;
(ii) the residues of glycine, β-alanine, 4-aminobutyric acid, 5-aminopentanoic acid, 6-aminohexanoic acid, or combinations thereof; or
(iii) A combination of (i) and (ii).
다음을 포함하는 화합물:
환형 펩티드 및 환외 펩티드를 포함하는 엔도솜 탈출 비히클로서, 상기 환형 펩티드는 6 내지 12개의 아미노산을 포함하고 상기 환외 펩티드는 2 내지 10개의 아미노산을 포함하는, 엔도솜 탈출 비히클; 및
표적 mRNA 서열에서 확장된 CUG 반복의 적어도 일부에 상보적인 안티센스 화합물(AC)로서, 포스포로디아미데이트 모르폴리노(PMO) 뉴클레오티드를 포함하는, AC.
Compounds containing:
An endosomal escape vehicle comprising a cyclic peptide and an extracyclic peptide, wherein the cyclic peptide comprises 6 to 12 amino acids and the extracyclic peptide comprises 2 to 10 amino acids; and
An antisense compound (AC) complementary to at least a portion of an expanded CUG repeat in a target mRNA sequence, the AC comprising a phosphorodiamidate morpholino (PMO) nucleotide.
제14항에 있어서, 환형 펩티드의 적어도 2개의 아미노산은 하전된 아미노산이고, 환형 펩티드의 적어도 2개의 아미노산은 방향족 소수성 아미노산이고, 환형 펩티드의 적어도 2개의 아미노산은 하전되지 않은 비방향족 아미노산인, 화합물.15. The compound of claim 14, wherein at least two amino acids of the cyclic peptide are charged amino acids, at least two amino acids of the cyclic peptide are aromatic hydrophobic amino acids, and at least two amino acids of the cyclic peptide are uncharged non-aromatic amino acids. 제15항에 있어서, 환형 펩티드의 적어도 2개의 하전된 아미노산은 아르기닌이고, 환형 펩티드의 적어도 2개의 방향족 소수성 아미노산은 페닐알라닌, 나프틸알라닌, 및 이들의 조합이고, 적어도 2개의 하전되지 않은 비방향족 아미노산은 시트룰린, 글리신, 및 이들의 조합인, 화합물.16. The method of claim 15, wherein at least two charged amino acids of the cyclic peptide are arginine, at least two aromatic hydrophobic amino acids of the cyclic peptide are phenylalanine, naphthylalanine, and combinations thereof, and at least two uncharged non-aromatic amino acids. A compound that is citrulline, glycine, and combinations thereof. 제14항에 있어서, 환형 펩티드는 다음 구조 중 하나:
(I-a);
(I-b); 또는
이의 양성자화된 형태를 가지며,
식 중:
R1, R2, 및 R3은 각각 독립적으로 H이거나 방향족기를 포함하는 측쇄를 갖는 아미노산 잔기이고;
R1, R2, 및 R3 중 적어도 하나는 아미노산의 방향족 또는 헤테로방향족 측쇄이고;
R4는 H이거나 아미노산 측쇄이고;
AASC는 안티센스 화합물 및 환외 펩티드가 접합되는 아미노산 측쇄이고;
각각의 m은 독립적으로 0, 1, 2, 또는 3의 정수인, 화합물.
15. The method of claim 14, wherein the cyclic peptide has one of the following structures:
(Ia);
(Ib); or
It has a protonated form,
During the ceremony:
R 1 , R 2 , and R 3 are each independently H or an amino acid residue having a side chain containing an aromatic group;
At least one of R 1 , R 2 , and R 3 is an aromatic or heteroaromatic side chain of an amino acid;
R 4 is H or an amino acid side chain;
AA SC is the amino acid side chain to which the antisense compound and exophytic peptide are conjugated;
A compound wherein each m is independently an integer of 0, 1, 2, or 3.
제17항에 있어서, 환형 펩티드는 다음 구조 중 하나:
(I-1);
(I-2);
(I-3);
(I-4);
(I-5);
(I-6); 또는
이의 양성자화된 형태를 갖는, 화합물.
18. The method of claim 17, wherein the cyclic peptide has one of the following structures:
(I-1);
(I-2);
(I-3);
(I-4);
(I-5);
(I-6); or
A compound having its protonated form.
제17항 또는 제18항에 있어서, AASC는 아스파라긴 잔기, 아스파르트산 잔기, 글루탐산 잔기, 호모글루탐산 잔기, 또는 호모글루탐산염 잔기의 측쇄인, 화합물.19. The compound of claim 17 or 18, wherein AA SC is a side chain of an asparagine residue, an aspartic acid residue, a glutamic acid residue, a homoglutamic acid residue, or a homoglutamate residue. 제17항 또는 제18항에 있어서, AASC는 글루탐산 잔기의 측쇄인, 화합물.19. The compound according to claim 17 or 18, wherein AA SC is the side chain of a glutamic acid residue. 제17항 또는 제18항에 있어서,
R1, R2, 및 R3은 각각 독립적으로 H이거나 방향족기를 포함하는 측쇄를 갖는 아미노산 잔기이고;
R1, R2, 및 R3 중 적어도 하나는 아미노산의 방향족 또는 헤테로방향족 측쇄이고;
R4는 H이거나 아미노산 측쇄이고;
m은 2이고;
AASC는 글루탐산 잔기의 측쇄인, 화합물.
According to claim 17 or 18,
R 1 , R 2 , and R 3 are each independently H or an amino acid residue having a side chain containing an aromatic group;
At least one of R 1 , R 2 , and R 3 is an aromatic or heteroaromatic side chain of an amino acid;
R 4 is H or an amino acid side chain;
m is 2;
AA SC is the side chain of a glutamic acid residue.
제17항 내지 제21항 중 어느 한 항에 있어서, AASC는:또는 이고, 식 중 t는 0 내지 5의 정수인, 화합물.22. The method according to any one of claims 17 to 21, wherein AA SC is: or , where t is an integer from 0 to 5. 제14항 내지 제22항 중 어느 한 항에 있어서, 환외 펩티드는 4 내지 8개의 아미노산 잔기를 포함하는, 화합물.23. The compound of any one of claims 14 to 22, wherein the extracyclic peptide comprises 4 to 8 amino acid residues. 제14항 내지 제23항 중 어느 한 항에 있어서, 환외 펩티드는 구아니딘기를 포함하는 측쇄를 포함하는 1 또는 2개의 아미노산 잔기, 또는 이의 양성자화된 형태 또는 염을 포함하는, 화합물.24. A compound according to any one of claims 14 to 23, wherein the extracyclic peptide comprises one or two amino acid residues comprising a side chain comprising a guanidine group, or a protonated form or salt thereof. 제14항 내지 제24항 중 어느 한 항에 있어서, 환외 펩티드는 2, 3, 또는 4개의 리신 잔기를 포함하는, 화합물.25. The compound of any one of claims 14 to 24, wherein the extracyclic peptide comprises 2, 3, or 4 lysine residues. 제25항에 있어서, 각각의 리신 잔기의 측쇄 상의 아미노기는 트리플루오로아세틸(-COCF3), 알릴옥시카르보닐(Alloc), 1-(4,4-디메틸-2,6-디옥소시클로헥실리덴)에틸(Dde), 또는 (4,4-디메틸-2,6-디옥소시클로헥스-1-일리덴-3)-메틸부틸(ivDde)기로 치환되는, 화합물.26. The method of claim 25, wherein the amino group on the side chain of each lysine residue is trifluoroacetyl (-COCF 3 ), allyloxycarbonyl (Alloc), 1-(4,4-dimethyl-2,6-dioxocyclohexane) A compound substituted with silidene)ethyl (Dde), or (4,4-dimethyl-2,6-dioxocyclohex-1-ylidene-3)-methylbutyl (ivDde) group. 제14항 내지 제24항 중 어느 한 항에 있어서, 환외 펩티드는 소수성 측쇄를 갖는 적어도 2개의 아미노산 잔기를 포함하는, 화합물.25. A compound according to any one of claims 14 to 24, wherein the exocyclic peptide comprises at least two amino acid residues with hydrophobic side chains. 제27항에 있어서, 소수성 측쇄를 갖는 아미노산 잔기는 발린, 프롤린, 알라닌, 류신, 이소류신, 및 메티오닌으로부터 선택되는, 화합물.28. The compound of claim 27, wherein the amino acid residue having a hydrophobic side chain is selected from valine, proline, alanine, leucine, isoleucine, and methionine. 제14항 내지 제24항 중 어느 한 항에 있어서, 환외 펩티드는 다음 서열 중 하나를 포함하는, 화합물: KK, KR, RR, HH, HK, HR, RH, KKK, KGK, KBK, KBR, KRK, KRR, RKK, RRR, KKH, KHK, HKK, HRR, HRH, HHR, HBH, HHH, HHHH, KHKK, KKHK, KKKH, KHKH, HKHK, KKKK, KKRK, KRKK, KRRK, RKKR, RRRR, KGKK, KKGK, HBHBH, HBKBH, RRRRR, KKKKK, KKKRK, RKKKK, KRKKK, KKRKK, KKKKR, KBKBK, RKKKKG, KRKKKG, KKRKKG, KKKKRG, RKKKKB, KRKKKB, KKRKKB, KKKKRB, KKKRKV, RRRRRR, HHHHHH, RHRHRH, HRHRHR, KRKRKR, RKRKRK, RBRBRB, KBKBKB, PKKKRKV, PGKKRKV, PKGKRKV, PKKGRKV, PKKKGKV, PKKKRGV, 또는 PKKKRKG (B는 베타-알라닌임).25. The compound of any one of claims 14 to 24, wherein the exocyclic peptide comprises one of the following sequences: KK, KR, RR, HH, HK, HR, RH, KKK, KGK, KBK, KBR, KRK , KRR, RKK, RRR, KKH, KHK, HKK, HRR, HRH, HHR, HBH, HHH, HHHH, KHKK, KKHK, KKKH, KHKH, HKHK, KKKK, KKRK, KRKK, KRRK, RKKR, RRRR, KGKK, KKGK , HBHBH, HBKBH, RRRRR, KKKKK, KKKRK, RKKKK, KRKKK, KKRKK, KKKKR, KBKBK, RKKKKG, KRKKKG, KKRKKG, KKKKRG, RKKKKB, KRKKKB, KKRKKB, KKKKRB, KKKRKV, RRRRRR, HHHHHH, RHRHRH, HRHRHR, KRKRKR, RKRKRK , RBRBRB, KBKBKB, PKKKRKV, PGKKRKV, PKGKRKV, PKKGRKV, PKKKGKV, PKKKRGV, or PKKKRKG (B is beta-alanine). 제14항 내지 제24항 중 어느 한 항에 있어서, 환외 펩티드는 다음 서열 중 하나를 포함하는, 화합물: PKKKRKV, RR, RRR, RHR, RBR, RBRBR, RBHBR, 또는 HBRBH (B는 베타-알라닌임).25. The compound of any one of claims 14 to 24, wherein the extracyclic peptide comprises one of the following sequences: PKKKRKV, RR, RRR, RHR, RBR, RBRBR, RBHBR, or HBRBH (B is beta-alanine) ). 제14항 내지 제24항 중 어느 한 항에 있어서, 환외 펩티드는 다음 서열 중 하나를 포함하는, 화합물: KK, KR, RR, KKK, KGK, KBK, KBR, KRK, KRR, RKK, RRR, KKKK, KKRK, KRKK, KRRK, RKKR, RRRR, KGKK, KKGK, KKKKK, KKKRK, KBKBK, KKKRKV, PKKKRKV, PGKKRKV, PKGKRKV, PKKGRKV, PKKKGKV, PKKKRGV, 또는 PKKKRKG.25. The compound of any one of claims 14 to 24, wherein the exocyclic peptide comprises one of the following sequences: KK, KR, RR, KKK, KGK, KBK, KBR, KRK, KRR, RKK, RRR, KKKK , KKRK, KRKK, KRRK, RKKR, RRRR, KGKK, KKGK, KKKKK, KKKRK, KBKBK, KKKRKV, PKKKRKV, PGKKRKV, PKGKRKV, PKKGRKV, PKKKGKV, PKKKRGV, or PKKKRKG. 제14항 내지 제24항 중 어느 한 항에 있어서, 환외 펩티드는 PKKKRKV를 포함하는, 화합물.25. The compound of any one of claims 14-24, wherein the extracyclic peptide comprises PKKKRKV. 제14항 내지 제24항 중 어느 한 항에 있어서, 환외 펩티드는 다음 서열 중 하나를 포함하는, 화합물: NLSKRPAAIKKAGQAKKKK, PAAKRVKLD, RQRRNELKRSF, RMRKFKNKGKDTAELRRRRVEVSVELR, KAKKDEQILKRRNV, VSRKRPRP, PPKKARED, PQPKKKPL, SALIKKKKKMAP, DRLRR, PKQKKRK, RKLKKKIKKL, REKKKFLKRR, KRKGDEVDGVDEVAKKKSKK, 또는 RKCLQAGMNLEARKTKK.25. The compound of any one of claims 14 to 24, wherein the exocyclic peptide comprises one of the following sequences: NLSKRPAAIKKAGQAKKKK, PAAKRVKLD, RQRRNELKRSF, RMRKFKNKGKDTAELRRRRVEVSVELR, KAKKDEQILKRRNV, VSRKRPRP, PPKKARED, PQPKKKPL, SALIKKKKKKMAP, DRLRR, PKQKKRK, RKLKKK IKKL , REKKKFLKRR, KRKGDEVDGVDEVAKKKSKK, or RKCLQAGMNLEARKTKK. 제14항 내지 제33항 중 어느 한 항에 있어서, 안티센스 화합물 및 환외 펩티드를 AASC에 접합시키는 링커를 추가로 포함하는 화합물.34. The compound of any one of claims 14 to 33, further comprising a linker conjugating the antisense compound and the extracyclic peptide to AA SC . 제34항에 있어서, 링커는 다음을 포함하는, 화합물:
(i) -(OCH2CH2)z’- 서브유닛 (식 중 z’은 1 내지 23의 정수임);
(ii) 하나 이상의 아미노산 잔기, 예컨대 글리신, β-알라닌, 4-아미노부티르산, 5-아미노펜탄산, 또는 6-아미노헥산산의 잔기, 또는 이들의 조합; 또는
(iii) (i) 및 (ii)의 조합.
35. The compound of claim 34, wherein the linker comprises:
(i) -(OCH 2 CH 2 ) z' -subunit (where z' is an integer from 1 to 23);
(ii) one or more amino acid residues, such as those of glycine, β-alanine, 4-aminobutyric acid, 5-aminopentanoic acid, or 6-aminohexanoic acid, or combinations thereof; or
(iii) A combination of (i) and (ii).
제34항에 있어서, 링커는 다음을 포함하는, 화합물:
(i) -(OCH2CH2)z- 서브유닛 (식 중 z는 2 내지 20의 정수임);
(ii) 글리신, β-알라닌, 4-아미노부티르산, 5-아미노펜탄산, 6-아미노헥산산의 잔기, 또는 이들의 조합; 또는
(iii) (i) 및 (ii)의 조합.
35. The compound of claim 34, wherein the linker comprises:
(i) -(OCH 2 CH 2 ) z -subunit, where z is an integer from 2 to 20;
(ii) the residues of glycine, β-alanine, 4-aminobutyric acid, 5-aminopentanoic acid, 6-aminohexanoic acid, or combinations thereof; or
(iii) A combination of (i) and (ii).
제34항에 있어서, 링커는 2가 또는 3가 C1-C50 알킬렌을 포함하되, 1~25개의 메틸렌기는 -N(H)-, -N(C1-C4 알킬)-, -N(시클로알킬)-, -O-, -C(O)-, -C(O)O-, -S-, -S(O)-, -S(O)2-, -S(O)2N(C1-C4 알킬)-, -S(O)2N(시클로알킬)-, -N(H)C(O)-, -N(C1-C4 알킬)C(O)-, -N(시클로알킬)C(O)-, -C(O)N(H)-, -C(O)N(C1-C4 알킬), -C(O)N(시클로알킬), 아릴, 헤테로아릴, 시클로알킬, 또는 시클로알케닐에 의해 임의로 및 독립적으로 치환되는, 화합물.The method of claim 34, wherein the linker comprises a divalent or trivalent C 1 -C 50 alkylene, and 1 to 25 methylene groups are -N(H)-, -N(C 1 -C 4 alkyl)-, - N(cycloalkyl)-, -O-, -C(O)-, -C(O)O-, -S-, -S(O)-, -S(O) 2 -, -S(O) 2 N(C 1 -C 4 alkyl)-, -S(O) 2 N(cycloalkyl)-, -N(H)C(O)-, -N(C 1 -C 4 alkyl)C(O) -, -N(cycloalkyl)C(O)-, -C(O)N(H)-, -C(O)N(C 1 -C 4 alkyl), -C(O)N(cycloalkyl) , aryl, heteroaryl, cycloalkyl, or cycloalkenyl. 제34항에 있어서, 링커는 다음 구조를 갖고:
,
식 중:
x’은 1~23의 정수이고; y는 1~5의 정수이고; z’은 1~23의 정수이고; *는 환형 펩티드의 아미노산 잔기의 아미노산 측쇄에 대한 부착점이고; M은 결합기인, 화합물.
35. The method of claim 34, wherein the linker has the following structure:
,
During the ceremony:
x' is an integer from 1 to 23; y is an integer from 1 to 5; z' is an integer from 1 to 23; * is the point of attachment to the amino acid side chain of the amino acid residue of the cyclic peptide; M is a linking group.
제38항에 있어서, z’은 11인, 화합물.39. The compound of claim 38, wherein z' is 11. 제38항 또는 제39항에 있어서, x’은 1인, 화합물.40. The compound of claim 38 or 39, wherein x' is 1. 제38항 내지 제40항 중 어느 한 항에 있어서, 환외 펩티드는 링커의 아미노 말단에서 링커에 접합되는, 화합물.41. A compound according to any one of claims 38 to 40, wherein the exocyclic peptide is conjugated to the linker at the amino terminus of the linker. 제38항 내지 제41항 중 어느 한 항에 있어서, 안티센스 화합물은 M에 접합되는, 화합물.42. The compound of any one of claims 38-41, wherein the antisense compound is conjugated to M. 제17항에 있어서, 화합물은 식 (C)의 화합물:
(C),
또는 이의 양성자화된 형태 또는 염이고,
식 중:
R1, R2, 및 R3은 각각 독립적으로 H이거나 아릴 또는 헤테로아릴기를 포함하는 측쇄이고, R1, R2, 및 R3 중 적어도 하나는 아릴 또는 헤테로아릴기를 포함하는 측쇄이고;
R4 및 R7은 독립적으로 H이거나 아미노산 측쇄이고;
EP는 환외 펩티드이고;
각각의 m은 독립적으로 0~3의 정수이고;
n은 0~2의 정수이고;
x’은 1~23의 정수이고;
y는 1~5의 정수이고;
q는 1~4의 정수이고;
z’은 1~23의 정수이고;
화물은 안티센스 화합물인, 화합물.
18. The method of claim 17, wherein the compound is a compound of formula (C):
(C),
or a protonated form or salt thereof,
During the ceremony:
R 1 , R 2 , and R 3 are each independently H or a side chain containing an aryl or heteroaryl group, and at least one of R 1 , R 2 , and R 3 is a side chain containing an aryl or heteroaryl group;
R 4 and R 7 are independently H or an amino acid side chain;
EP is an exophytic peptide;
Each m is independently an integer from 0 to 3;
n is an integer from 0 to 2;
x' is an integer from 1 to 23;
y is an integer from 1 to 5;
q is an integer from 1 to 4;
z' is an integer from 1 to 23;
Compound, wherein the cargo is an antisense compound.
제43항에 있어서, R1, R2, 및 R3은 H이거나 아릴기를 포함하는 측쇄인, 화합물.44. The compound of claim 43, wherein R 1 , R 2 , and R 3 are H or a side chain comprising an aryl group. 제44항에 있어서, 아릴기를 포함하는 측쇄는 페닐알라닌의 측쇄인, 화합물.45. The compound of claim 44, wherein the side chain comprising the aryl group is the side chain of phenylalanine. 제45항에 있어서, R1, R2, 및 R3 중 2개는 페닐알라닌의 측쇄인, 화합물.46. The compound of claim 45, wherein two of R 1 , R 2 , and R 3 are side chains of phenylalanine. 제44항 내지 제46항 중 어느 한 항에 있어서, R1, R2, R3, 및 R4 중 2개는 H인, 화합물.47. The compound of any one of claims 44-46, wherein two of R 1 , R 2 , R 3 , and R 4 are H. 제44항 내지 제47항 중 어느 한 항에 있어서, z’은 11인, 화합물.48. The compound of any one of claims 44 to 47, wherein z' is 11. 제44항 내지 제48항 중 어느 한 항에 있어서, x’은 1인, 화합물.49. The compound of any one of claims 44 to 48, wherein x' is 1. 제17항에 있어서, 식 (C-1), (C-2), (C-3), 또는 (C-4)의 구조:
(C-1),
(C-2),
(C-3),
(C-4)
또는 이의 양성자화된 형태 또는 염을 포함하되,
식 중 EP는 환외 펩티드이고,
올리고뉴클레오티드는 안티센스 화합물인, 화합물.
18. The structure of claim 17, wherein the structure of formula (C-1), (C-2), (C-3), or (C-4):
(C-1),
(C-2),
(C-3),
(C-4)
or protonated forms or salts thereof,
In the formula, EP is an exophytic peptide,
The oligonucleotide is an antisense compound.
제50항에 있어서, 올리고뉴클레오티드는 다음의 서열을 포함하는, 화합물:
5’-CAG CAG CAG CAG CAG CAG CAG-3’.
51. The compound of claim 50, wherein the oligonucleotide comprises the following sequence:
5'-CAG CAG CAG CAG CAG CAG CAG-3'.
제50항 또는 제51항에 있어서, EP는 다음의 서열을 포함하는, 화합물: PKKKRKV.52. The compound of claim 50 or 51, wherein EP comprises the following sequence: PKKKRKV. 제1항 내지 제52항 중 어느 한 항에 있어서, 확장된 트리뉴클레오티드 반복은 표적 mRNA 서열의 3’UTR에 있는, 화합물.53. The compound of any one of claims 1-52, wherein the expanded trinucleotide repeat is in the 3'UTR of the target mRNA sequence. 제53항에 있어서, 표적 mRNA 서열은 DMPK mRNA 서열인, 화합물.54. The compound of claim 53, wherein the target mRNA sequence is a DMPK mRNA sequence. 제53항에 있어서, 표적 mRNA 서열은 ATXN8OS/ATXN8 mRNA 서열인, 화합물.54. The compound of claim 53, wherein the target mRNA sequence is the ATXN8OS/ATXN8 mRNA sequence. 제53항에 있어서, 표적 mRNA 서열은 JPH3 mRNA 서열인, 화합물.54. The compound of claim 53, wherein the target mRNA sequence is the JPH3 mRNA sequence. 제1항 내지 제56항 중 어느 한 항에 있어서, AC는 5~10개의 CAG 반복을 포함하는, 화합물.57. The compound of any one of claims 1-56, wherein AC comprises 5-10 CAG repeats. 제1항 내지 제57항 중 어느 한 항에 있어서, mRNA는 pre-mRNA 또는 성숙한 mRNA인, 화합물.58. The compound of any one of claims 1 to 57, wherein the mRNA is pre-mRNA or mature mRNA. 제1항 내지 제58항 중 어느 한 항에 있어서, mRNA는 pre-mRNA인, 화합물.59. The compound of any one of claims 1-58, wherein the mRNA is pre-mRNA. 제1항 내지 제59항 중 어느 한 항의 화합물의 유효량을 포함하는 약학적 조성물.A pharmaceutical composition comprising an effective amount of the compound of any one of claims 1 to 59. 제1항 내지 제59항 중 어느 한 항의 화합물을 포함하는 세포.A cell containing the compound of any one of claims 1 to 59. 근긴장성 이영양증(DM)의 치료를 필요로 하는 대상체에서 이를 치료하는 방법으로서, 제1항 내지 제59항 중 어느 한 항의 화합물 또는 제60항의 조성물을 대상체에게 투여하는 단계를 포함하는, 방법.1. A method of treating myotonic dystrophy (DM) in a subject in need thereof, comprising administering to the subject a compound of any one of claims 1 to 59 or the composition of claim 60. 제62항에 있어서, 상기 투여하는 단계는 근육 조직에서 야생형 단백질의 발현을 증가시키는, 방법.63. The method of claim 62, wherein said administering increases expression of wild-type protein in muscle tissue. 제63항에 있어서, 상기 투여하는 단계는 횡격막 조직, 사두근 조직, 및/또는 심장 조직에서 야생형 단백질의 발현을 증가시키는, 방법.64. The method of claim 63, wherein said administering increases expression of the wild-type protein in diaphragm tissue, quadriceps muscle tissue, and/or cardiac tissue. 제63항 또는 제64항에 있어서, 야생형 단백질은 확장된 CUG 반복을 갖지 않는 유전자로부터 발현된 단백질인, 방법.65. The method of claim 63 or 64, wherein the wild-type protein is a protein expressed from a gene that does not have expanded CUG repeats. 제62항 내지 제65항 중 어느 한 항에 있어서, 상기 투여하는 단계는 병소 형성을 방지하거나 감소시키는, 방법.66. The method of any one of claims 62-65, wherein said administering prevents or reduces lesion formation. 제62항 내지 제66항 중 어느 한 항에 있어서, 뉴클레오티드 반복 확장은 DMPK mRNA의 3’UTR에 위치하는, 방법.67. The method of any one of claims 62-66, wherein the nucleotide repeat expansion is located in the 3'UTR of DMPK mRNA. 3’ 비번역 영역(UTR)에서 확장된 CUG 반복을 갖는 mRNA와 연관된 질환을 치료하기 위한 방법으로서, 상기 방법은 다음을 포함하는 화합물을 이를 필요로 하는 대상체에게 투여하는 단계를 포함하는, 방법:
mRNA에서 확장된 CUG 반복의 적어도 일부에 상보적인 안티센스 화합물(AC); 및
6 내지 12개의 아미노산을 갖는 환형 펩티드로서, 적어도 2개의 아미노산은 하전된 아미노산이고, 적어도 2개의 아미노산은 방향족 소수성 아미노산이고, 적어도 2개의 아미노산은 하전되지 않은 비방향족 아미노산인, 환형 펩티드.
1. A method for treating a disease associated with an mRNA having an expanded CUG repeat in the 3' untranslated region (UTR), comprising administering to a subject in need thereof a compound comprising:
An antisense compound (AC) complementary to at least a portion of the expanded CUG repeat in the mRNA; and
A cyclic peptide having 6 to 12 amino acids, wherein at least 2 amino acids are charged amino acids, at least 2 amino acids are aromatic hydrophobic amino acids, and at least 2 amino acids are uncharged non-aromatic amino acids.
제68항에 있어서, 환형 펩티드의 적어도 2개의 하전된 아미노산은 아르기닌이고, 환형 펩티드의 적어도 2개의 방향족 소수성 아미노산은 페닐알라닌, 나프틸알라닌, 및 이들의 조합이고, 환형 펩티드의 적어도 2개의 하전되지 않은 비방향족 아미노산은 시트룰린, 글리신, 또는 이들의 조합인, 방법.69. The method of claim 68, wherein the at least two charged amino acids of the cyclic peptide are arginine, the at least two aromatic hydrophobic amino acids of the cyclic peptide are phenylalanine, naphthylalanine, and combinations thereof, and the at least two uncharged amino acids of the cyclic peptide are arginine. The method of claim 1, wherein the non-aromatic amino acid is citrulline, glycine, or a combination thereof. 제68항에 있어서, 환형 펩티드는 다음 구조:
(A), 또는
이의 양성자화된 형태를 가지며,
식 중:
R1, R2, 및 R3은 각각 독립적으로 H이거나 아미노산의 방향족 또는 헤테로방향족 측쇄이고;
R1, R2, 및 R3 중 적어도 하나는 아미노산의 방향족 또는 헤테로방향족 측쇄이고;
R4, R5, R6, 및 R7은 독립적으로 H이거나 아미노산 측쇄이고;
R4, R5, R6, R7 중 적어도 하나는 H 시트룰린의 측쇄이고;
AASC는 안티센스 화합물이 접합되는 아미노산 측쇄이고;
q는 1, 2, 3, 또는 4인, 방법.
69. The method of claim 68, wherein the cyclic peptide has the following structure:
(A), or
It has a protonated form,
During the ceremony:
R 1 , R 2 , and R 3 are each independently H or an aromatic or heteroaromatic side chain of an amino acid;
At least one of R 1 , R 2 , and R 3 is an aromatic or heteroaromatic side chain of an amino acid;
R 4 , R 5 , R 6 , and R 7 are independently H or an amino acid side chain;
At least one of R 4 , R 5 , R 6 , and R 7 is the side chain of H citrulline;
AA SC is the amino acid side chain to which the antisense compound is conjugated;
q is 1, 2, 3, or 4, method.
제70항에 있어서, R4, R5, R6, R7 중 적어도 하나는 3-구아니디노-2-아미노프로피온산, 4-구아니디노-2-아미노부탄산, 아르기닌, 호모아르기닌, N-메틸아르기닌, N,N-디메틸아르기닌, 2,3-디아미노프로피온산, 2,4-디아미노부탄산, 리신, N-메틸리신, N,N-디메틸리신, N-에틸리신, N,N,N-트리메틸리신, 4-구아니디노페닐알라닌, N,N-디메틸리신, β-호모아르기닌, 또는 3-(1-피페리디닐)알라닌의 측쇄인, 방법.The method of claim 70, wherein at least one of R 4 , R 5 , R 6 , R 7 is 3-guanidino-2-aminopropionic acid, 4-guanidino-2-aminobutanoic acid, arginine, homoarginine, N -Methylarginine, N,N-dimethylarginine, 2,3-diaminopropionic acid, 2,4-diaminobutanoic acid, lysine, N-methyllysine, N,N-dimethyllysine, N-ethylysine, N,N , a side chain of N-trimethyllysine, 4-guanidinophenylalanine, N,N-dimethyllysine, β-homoarginine, or 3-(1-piperidinyl)alanine. 제68항에 있어서, 환형 펩티드는 다음 구조:
(I)
또는 이의 양성자화된 형태를 가지며,
식 중:
R1, R2, 및 R3은 각각 독립적으로 H이거나 방향족기를 포함하는 측쇄를 갖는 아미노산 잔기이고;
R1, R2, 및 R3 중 적어도 하나는 아미노산의 방향족 또는 헤테로방향족 측쇄이고;
R4 및 R7은 독립적으로 H이거나 아미노산 측쇄이고;
AASC는 안티센스 화합물이 접합되는 아미노산 측쇄이고;
q는 1, 2, 3, 또는 4이고;
각각의 m은 독립적으로 0, 1, 2, 또는 3의 정수인, 방법.
69. The method of claim 68, wherein the cyclic peptide has the following structure:
(I)
or a protonated form thereof,
During the ceremony:
R 1 , R 2 , and R 3 are each independently H or an amino acid residue having a side chain containing an aromatic group;
At least one of R 1 , R 2 , and R 3 is an aromatic or heteroaromatic side chain of an amino acid;
R 4 and R 7 are independently H or an amino acid side chain;
AA SC is the amino acid side chain to which the antisense compound is conjugated;
q is 1, 2, 3, or 4;
wherein each m is independently an integer of 0, 1, 2, or 3.
제72항에 있어서, 환형 펩티드는 다음 구조 중 하나:
(I-a),
(I-b), 또는
이의 양성자화된 형태를 갖는, 방법.
73. The method of claim 72, wherein the cyclic peptide has one of the following structures:
(Ia),
(Ib), or
A method having a protonated form thereof.
제72항에 있어서, 환형 펩티드는 다음 구조 중 하나:
(I-1),
(I-2),
(I-3),
(I-4),
(I-5),
(I-6), 또는
이의 양성자화된 형태를 갖는, 방법.
73. The method of claim 72, wherein the cyclic peptide has one of the following structures:
(I-1),
(I-2),
(I-3),
(I-4),
(I-5),
(I-6), or
A method having a protonated form thereof.
제68항 내지 제74항 중 어느 한 항에 있어서, 안티센스 화합물은 포스포로디아미데이트 모르폴리노(PMO) 뉴클레오티드를 포함하는, 방법.75. The method of any one of claims 68-74, wherein the antisense compound comprises phosphorodiamidate morpholino (PMO) nucleotides. 제68항 내지 제75항 중 어느 한 항에 있어서, 안티센스 화합물을 AASC에 접합시키는 링커를 추가로 포함하는, 방법.76. The method of any one of claims 68-75, further comprising a linker conjugating the antisense compound to AA SC . 제68항 내지 제76항 중 어느 한 항에 있어서, 엔도솜 탈출 비히클을 포함하되, 엔도솜 탈출 비히클은 환형 펩티드 및 환외 펩티드를 포함하는, 방법.77. The method of any one of claims 68-76, comprising an endosomal escape vehicle, wherein the endosomal escape vehicle comprises a cyclic peptide and an extracyclic peptide. 제68항 내지 제77항 중 어느 한 항에 있어서, 질환은 근긴장성 이영양증(DM)인, 방법.78. The method of any one of claims 68-77, wherein the disease is myotonic dystrophy (DM). 제68항 내지 제77항 중 어느 한 항에 있어서, 질환은 8형 척수소뇌 실조증(SCA8)인, 방법.78. The method of any one of claims 68-77, wherein the disease is spinocerebellar ataxia type 8 (SCA8). 제68항 내지 제77항 중 어느 한 항에 있어서, 질환은 헌팅톤병-유사 2(HDL2)인, 방법.78. The method of any one of claims 68-77, wherein the disease is Huntington's disease-like 2 (HDL2). 제1항 내지 제80항 중 어느 한 항에 있어서, 안티센스 화합물은 표 2에 열거된 뉴클레오티드의 서열을 포함하는, 화합물, 조성물, 또는 방법.81. The compound, composition, or method of any one of claims 1-80, wherein the antisense compound comprises the sequence of nucleotides listed in Table 2.
KR1020247002577A 2021-06-23 2022-06-22 Antisense compounds and methods for targeting CUG repeats KR20240038967A (en)

Applications Claiming Priority (31)

Application Number Priority Date Filing Date Title
US202163213900P 2021-06-23 2021-06-23
US63/213,900 2021-06-23
US202163239671P 2021-09-01 2021-09-01
US202163239847P 2021-09-01 2021-09-01
US63/239,847 2021-09-01
US63/239,671 2021-09-01
US202163290960P 2021-12-17 2021-12-17
US202163290892P 2021-12-17 2021-12-17
US63/290,960 2021-12-17
US63/290,892 2021-12-17
US202263298565P 2022-01-11 2022-01-11
US63/298,565 2022-01-11
US202263305071P 2022-01-31 2022-01-31
US63/305,071 2022-01-31
US202263268577P 2022-02-25 2022-02-25
US63/268,577 2022-02-25
US202263314369P 2022-02-26 2022-02-26
US63/314,369 2022-02-26
US202263316634P 2022-03-04 2022-03-04
US63/316,634 2022-03-04
US202263317856P 2022-03-08 2022-03-08
US63/317,856 2022-03-08
US202263362295P 2022-03-31 2022-03-31
US202263326201P 2022-03-31 2022-03-31
US63/362,295 2022-03-31
US63/326,201 2022-03-31
US202263327179P 2022-04-04 2022-04-04
US63/327,179 2022-04-04
US202263339250P 2022-05-06 2022-05-06
US63/339,250 2022-05-06
PCT/US2022/034517 WO2022271818A1 (en) 2021-06-23 2022-06-22 Antisense compounds and methods for targeting cug repeats

Publications (1)

Publication Number Publication Date
KR20240038967A true KR20240038967A (en) 2024-03-26

Family

ID=82608300

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020247002577A KR20240038967A (en) 2021-06-23 2022-06-22 Antisense compounds and methods for targeting CUG repeats

Country Status (6)

Country Link
KR (1) KR20240038967A (en)
AU (1) AU2022298774A1 (en)
CA (1) CA3222824A1 (en)
CO (1) CO2023018002A2 (en)
IL (1) IL309001A (en)
WO (1) WO2022271818A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023219933A1 (en) * 2022-05-09 2023-11-16 Entrada Therapeutics, Inc. Compositions and methods for delivery of nucleic acid therapeutics

Family Cites Families (85)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5118800A (en) 1983-12-20 1992-06-02 California Institute Of Technology Oligonucleotides possessing a primary amino group in the terminal nucleotide
FR2567892B1 (en) 1984-07-19 1989-02-17 Centre Nat Rech Scient NOVEL OLIGONUCLEOTIDES, THEIR PREPARATION PROCESS AND THEIR APPLICATIONS AS MEDIATORS IN DEVELOPING THE EFFECTS OF INTERFERONS
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
CA1340323C (en) 1988-09-20 1999-01-19 Arnold E. Hampel Rna catalyst for cleaving specific rna sequences
CA2039718C (en) 1989-08-31 2003-02-25 John J. Rossi Chimeric dna-rna catalytic sequences
US5591722A (en) 1989-09-15 1997-01-07 Southern Research Institute 2'-deoxy-4'-thioribonucleosides and their antiviral activity
DK0497875T3 (en) 1989-10-24 2000-07-03 Gilead Sciences Inc 2'-modified oligonucleotides
US5646265A (en) 1990-01-11 1997-07-08 Isis Pharmceuticals, Inc. Process for the preparation of 2'-O-alkyl purine phosphoramidites
US5670633A (en) 1990-01-11 1997-09-23 Isis Pharmaceuticals, Inc. Sugar modified oligonucleotides that detect and modulate gene expression
GB9009980D0 (en) 1990-05-03 1990-06-27 Amersham Int Plc Phosphoramidite derivatives,their preparation and the use thereof in the incorporation of reporter groups on synthetic oligonucleotides
DE69032425T2 (en) 1990-05-11 1998-11-26 Microprobe Corp Immersion test strips for nucleic acid hybridization assays and methods for covalently immobilizing oligonucleotides
US6365730B1 (en) 1990-06-19 2002-04-02 Gene Shears Pty. Limited DNA-Armed ribozymes and minizymes
DE69123979T2 (en) 1990-10-12 1997-04-30 Max Planck Gesellschaft MODIFIED RIBOZYMS
DE4216134A1 (en) 1991-06-20 1992-12-24 Europ Lab Molekularbiolog SYNTHETIC CATALYTIC OLIGONUCLEOTIDE STRUCTURES
ES2103918T3 (en) 1991-10-17 1997-10-01 Ciba Geigy Ag BICYCLE NUCLEOSIDES, OLIGONUCLEOTIDES, PROCEDURE FOR THEIR OBTAINING AND INTERMEDIATE PRODUCTS.
US5359044A (en) 1991-12-13 1994-10-25 Isis Pharmaceuticals Cyclobutyl oligonucleotide surrogates
US5652094A (en) 1992-01-31 1997-07-29 University Of Montreal Nucleozymes
FR2687679B1 (en) 1992-02-05 1994-10-28 Centre Nat Rech Scient OLIGOTHIONUCLEOTIDES.
CA2135646A1 (en) 1992-05-11 1993-11-25 Kenneth G. Draper Method and reagent for inhibiting viral replication
EP0577558A2 (en) 1992-07-01 1994-01-05 Ciba-Geigy Ag Carbocyclic nucleosides having bicyclic rings, oligonucleotides therefrom, process for their preparation, their use and intermediates
WO1994002595A1 (en) 1992-07-17 1994-02-03 Ribozyme Pharmaceuticals, Inc. Method and reagent for treatment of animal diseases
WO1994014226A1 (en) 1992-12-14 1994-06-23 Honeywell Inc. Motor system with individually controlled redundant windings
ES2107205T3 (en) 1993-03-30 1997-11-16 Sanofi Sa ANALOGS OF ACICLIC NUCLEOSIDES AND OLIGONUCLEOTIDE SEQUENCES THAT CONTAIN THEM.
DE4311944A1 (en) 1993-04-10 1994-10-13 Degussa Coated sodium percarbonate particles, process for their preparation and detergent, cleaning and bleaching compositions containing them
US5446137B1 (en) 1993-12-09 1998-10-06 Behringwerke Ag Oligonucleotides containing 4'-substituted nucleotides
US5519134A (en) 1994-01-11 1996-05-21 Isis Pharmaceuticals, Inc. Pyrrolidine-containing monomers and oligomers
US5631359A (en) 1994-10-11 1997-05-20 Ribozyme Pharmaceuticals, Inc. Hairpin ribozymes
US5627053A (en) 1994-03-29 1997-05-06 Ribozyme Pharmaceuticals, Inc. 2'deoxy-2'-alkylnucleotide containing nucleic acid
US5597909A (en) 1994-08-25 1997-01-28 Chiron Corporation Polynucleotide reagents containing modified deoxyribose moieties, and associated methods of synthesis and use
AU3889595A (en) 1994-10-05 1996-05-02 Amgen, Inc. Method for inhibiting smooth muscle cell proliferation and oligonucleotides for use therein
US5792747A (en) 1995-01-24 1998-08-11 The Administrators Of The Tulane Educational Fund Highly potent agonists of growth hormone releasing hormone
JP3756313B2 (en) 1997-03-07 2006-03-15 武 今西 Novel bicyclonucleosides and oligonucleotide analogues
US6770748B2 (en) 1997-03-07 2004-08-03 Takeshi Imanishi Bicyclonucleoside and oligonucleotide analogue
US6794499B2 (en) 1997-09-12 2004-09-21 Exiqon A/S Oligonucleotide analogues
EP2341057A3 (en) 1997-09-12 2011-11-23 Exiqon A/S Oligonucleotide Analogues
US6043352A (en) 1998-08-07 2000-03-28 Isis Pharmaceuticals, Inc. 2'-O-Dimethylaminoethyloxyethyl-modified oligonucleotides
JP2002535247A (en) 1998-11-26 2002-10-22 ペンタファルム アクチェンゲゼルシャフト Transport complex
AU758956B2 (en) 1999-02-12 2003-04-03 Daiichi Sankyo Company, Limited Novel nucleosides and oligonucleotide analogues
US7084125B2 (en) 1999-03-18 2006-08-01 Exiqon A/S Xylo-LNA analogues
EP1178999B1 (en) 1999-05-04 2007-03-14 Santaris Pharma A/S L-ribo-lna analogues
US6525191B1 (en) 1999-05-11 2003-02-25 Kanda S. Ramasamy Conformationally constrained L-nucleosides
JP4151751B2 (en) 1999-07-22 2008-09-17 第一三共株式会社 New bicyclonucleoside analogues
AU785007B2 (en) 1999-11-24 2006-08-24 Mcs Micro Carrier Systems Gmbh Polypeptides comprising multimers of nuclear localization signals or of protein transduction domains and their use for transferring molecules into cells
EP1191097A1 (en) 2000-09-21 2002-03-27 Leids Universitair Medisch Centrum Induction of exon skipping in eukaryotic cells
US6960648B2 (en) 2000-10-13 2005-11-01 Universite De Lausanne Intracellular delivery of biological effectors
US7033597B2 (en) 2000-10-13 2006-04-25 Université de Lausanne Intracellular delivery of biological effectors
US7569575B2 (en) 2002-05-08 2009-08-04 Santaris Pharma A/S Synthesis of locked nucleic acid derivatives
US20040219565A1 (en) 2002-10-21 2004-11-04 Sakari Kauppinen Oligonucleotides useful for detecting and analyzing nucleic acids of interest
WO2004041889A2 (en) 2002-11-05 2004-05-21 Isis Pharmaceuticals, Inc. Polycyclic sugar surrogate-containing oligomeric compounds and compositions for use in gene modulation
AU2003225410A1 (en) 2003-03-21 2004-10-11 Academisch Ziekenhuis Leiden Modulation of exon recognition in pre-mrna by interfering with the secondary rna structure
ES2382807T3 (en) 2003-08-28 2012-06-13 Takeshi Imanishi New artificial nucleic acids of the N-O link type with cross-linking
US7523096B2 (en) 2003-12-03 2009-04-21 Google Inc. Methods and systems for personalized network searching
JP2008501693A (en) 2004-06-03 2008-01-24 アイシス ファーマシューティカルズ、インク. Double-stranded composition with individually regulated strands for use in gene regulation
CA2605512A1 (en) 2005-04-22 2006-10-26 Academisch Ziekenhuis Leiden Modulation of exon recognition in pre-mrna by interfering with the binding of sr proteins and by interfering with secondary rna structure.
CA2640171C (en) 2006-01-27 2014-10-28 Isis Pharmaceuticals, Inc. 6-modified bicyclic nucleic acid analogs
US20100184209A1 (en) 2006-02-17 2010-07-22 Dharmacon, Inc. Compositions and methods for inhibiting gene silencing by rna interference
WO2007123391A1 (en) 2006-04-20 2007-11-01 Academisch Ziekenhuis Leiden Therapeutic intervention in a genetic disease in an individual by modifying expression of an aberrantly expressed gene.
EP1857548A1 (en) 2006-05-19 2007-11-21 Academisch Ziekenhuis Leiden Means and method for inducing exon-skipping
WO2008036825A2 (en) 2006-09-22 2008-03-27 Dharmacon, Inc. Duplex oligonucleotide complexes and methods for gene silencing by rna interference
US9550988B2 (en) 2006-10-18 2017-01-24 Ionis Pharmaceuticals, Inc. Antisense compounds
US20100016215A1 (en) 2007-06-29 2010-01-21 Avi Biopharma, Inc. Compound and method for treating myotonic dystrophy
ES2564563T3 (en) 2007-10-26 2016-03-23 Academisch Ziekenhuis Leiden Means and methods to counteract muscle disorders
EP2119783A1 (en) 2008-05-14 2009-11-18 Prosensa Technologies B.V. Method for efficient exon (44) skipping in Duchenne Muscular Dystrophy and associated means
US20120149756A1 (en) 2009-04-10 2012-06-14 Associatin Institut de Myologie Tricyclo-dna antisense oligonucleotides, compositions, and methods for the treatment of disease
US20110269665A1 (en) 2009-06-26 2011-11-03 Avi Biopharma, Inc. Compound and method for treating myotonic dystrophy
US9161948B2 (en) 2011-05-05 2015-10-20 Sarepta Therapeutics, Inc. Peptide oligonucleotide conjugates
JP6404219B2 (en) 2012-09-25 2018-10-10 ジェンザイム・コーポレーション Peptide-bound morpholino antisense oligonucleotides for the treatment of myotonic dystrophy
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
JP6552965B2 (en) 2012-12-12 2019-07-31 ザ・ブロード・インスティテュート・インコーポレイテッド Engineering and optimization of improved systems, methods and enzyme compositions for sequence manipulation
PT2771468E (en) 2012-12-12 2015-06-02 Harvard College Engineering of systems, methods and optimized guide compositions for sequence manipulation
US8993233B2 (en) 2012-12-12 2015-03-31 The Broad Institute Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
KR20150105635A (en) 2012-12-12 2015-09-17 더 브로드 인스티튜트, 인코퍼레이티드 Crispr-cas component systems, methods and compositions for sequence manipulation
US20140310830A1 (en) 2012-12-12 2014-10-16 Feng Zhang CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes
KR20160097331A (en) 2013-12-12 2016-08-17 더 브로드 인스티튜트, 인코퍼레이티드 Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders
EP4015633A1 (en) 2015-05-01 2022-06-22 Precision Biosciences, Inc. Precise deletion of chromosomal sequences in vivo and treatment of nucleotide repeat expansion disorders using engineered nucleases
KR20180053753A (en) 2015-10-05 2018-05-23 프로큐알 테라퓨틱스 Ⅱ 비.브이. Use of single-stranded antisense oligonucleotides for the prevention or treatment of genetic diseases associated with trinucleotide repeat extension
JP6657520B2 (en) 2016-02-03 2020-03-04 株式会社神戸製鋼所 Tire air filling mechanism and tire air filling method of tire testing device
KR20170130253A (en) 2016-05-18 2017-11-28 에스케이텔레콤 주식회사 Method for providing of adaptive streaming service and apparatus therefor
US10265249B2 (en) 2016-09-29 2019-04-23 The Procter & Gamble Company Fibrous structures comprising glyceride copolymers
EP3541932A4 (en) 2016-11-16 2021-03-03 The Regents of the University of California Inhibitors of crispr-cas9
KR20180102871A (en) 2017-03-08 2018-09-18 엘지전자 주식회사 Mobile terminal and vehicle control method of mobile terminal
US11512312B2 (en) 2017-03-10 2022-11-29 The Board Of Regents Of The University Of Texas System Treatment of Fuchs' endothelial corneal dystrophy
EP3755351A4 (en) * 2018-02-22 2021-11-24 Entrada Therapeutics, Inc. Compositions and methods for treating mitochondrial neurogastrointestinal encephalopathy
GB201812972D0 (en) * 2018-08-09 2018-09-26 Univ Oxford Innovation Ltd Cell-penetrating peptides
WO2021127650A1 (en) * 2019-12-19 2021-06-24 Entrada Therapeutics, Inc. Compositions for delivery of antisense compounds

Also Published As

Publication number Publication date
AU2022298774A1 (en) 2023-12-14
CO2023018002A2 (en) 2024-02-05
IL309001A (en) 2024-02-01
WO2022271818A1 (en) 2022-12-29
CA3222824A1 (en) 2022-12-29

Similar Documents

Publication Publication Date Title
US20230020092A1 (en) Compositions for delivery of antisense compounds
EP2751128B1 (en) Cell-penetrating peptides having a central hydrophobic domain
JP6604544B2 (en) Double-stranded antisense nucleic acid with exon skipping effect
US20180311176A1 (en) Nanoparticle formulations for delivery of nucleic acid complexes
RU2748834C2 (en) Antisense oligonucleotides against scn9a
JP7305542B2 (en) Exon skipping by peptide nucleic acid derivatives
US20180312839A1 (en) Methods and compositions for increasing smn expression
WO2017106292A1 (en) Compositions and methods for treatment of kidney diseases
JP2019522987A (en) Antisense oligonucleotides for regulating HTRA1 expression
US20210052706A1 (en) Compositions and methods for facilitating delivery of synthetic nucleic acids to cells
KR20240012425A (en) Compositions and methods for intracellular therapeutics
KR20240009393A (en) Cyclic cell penetrating peptide
KR20240038967A (en) Antisense compounds and methods for targeting CUG repeats
AU2018277219A1 (en) Antisense oligonucleotides for modulating HTRA1 expression
WO2022240760A2 (en) COMPOSITIONS AND METHODS FOR MODULATING mRNA SPLICING
WO2022240758A1 (en) Compositions and methods for modulating gene expression
WO2011143762A1 (en) Method for reducing expression of downregulated iν renal cell carcinoma iν malignant gliomas
WO2023034818A1 (en) Compositions and methods for skipping exon 45 in duchenne muscular dystrophy
RU2786637C2 (en) Exon skip with peptidonucleic acid derivatives
CA3229661A1 (en) Compounds and methods for skipping exon 44 in duchenne muscular dystrophy
WO2022240721A1 (en) Compositions and methods for modulating interferon regulatory factor-5 (irf-5) activity
CN117915957A (en) Compositions and methods for modulating mRNA splicing
WO2024073042A1 (en) Ocular delivery of therapeutic agents
TW202039848A (en) Myostatin signal inhibitor