KR102255995B1 - 인공 단일 가이드 rna 및 이의 용도 - Google Patents

인공 단일 가이드 rna 및 이의 용도 Download PDF

Info

Publication number
KR102255995B1
KR102255995B1 KR1020187024080A KR20187024080A KR102255995B1 KR 102255995 B1 KR102255995 B1 KR 102255995B1 KR 1020187024080 A KR1020187024080 A KR 1020187024080A KR 20187024080 A KR20187024080 A KR 20187024080A KR 102255995 B1 KR102255995 B1 KR 102255995B1
Authority
KR
South Korea
Prior art keywords
formula
represented
sgrna
single guide
guide rna
Prior art date
Application number
KR1020187024080A
Other languages
English (en)
Other versions
KR20180100692A (ko
Inventor
에리코 아오키
타다아키 오기
타카시 키노시타
Original Assignee
가부시키가이샤 보낙
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가부시키가이샤 보낙 filed Critical 가부시키가이샤 보낙
Publication of KR20180100692A publication Critical patent/KR20180100692A/ko
Application granted granted Critical
Publication of KR102255995B1 publication Critical patent/KR102255995B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C229/00Compounds containing amino and carboxyl groups bound to the same carbon skeleton
    • C07C229/02Compounds containing amino and carboxyl groups bound to the same carbon skeleton having amino and carboxyl groups bound to acyclic carbon atoms of the same carbon skeleton
    • C07C229/04Compounds containing amino and carboxyl groups bound to the same carbon skeleton having amino and carboxyl groups bound to acyclic carbon atoms of the same carbon skeleton the carbon skeleton being acyclic and saturated
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C229/00Compounds containing amino and carboxyl groups bound to the same carbon skeleton
    • C07C229/02Compounds containing amino and carboxyl groups bound to the same carbon skeleton having amino and carboxyl groups bound to acyclic carbon atoms of the same carbon skeleton
    • C07C229/34Compounds containing amino and carboxyl groups bound to the same carbon skeleton having amino and carboxyl groups bound to acyclic carbon atoms of the same carbon skeleton the carbon skeleton containing six-membered aromatic rings
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07FACYCLIC, CARBOCYCLIC OR HETEROCYCLIC COMPOUNDS CONTAINING ELEMENTS OTHER THAN CARBON, HYDROGEN, HALOGEN, OXYGEN, NITROGEN, SULFUR, SELENIUM OR TELLURIUM
    • C07F9/00Compounds containing elements of Groups 5 or 15 of the Periodic System
    • C07F9/02Phosphorus compounds
    • C07F9/06Phosphorus compounds without P—C bonds
    • C07F9/22Amides of acids of phosphorus
    • C07F9/222Amides of phosphoric acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/318Chemical structure of the backbone where the PO2 is completely replaced, e.g. MMI or formacetal
    • C12N2310/3181Peptide nucleic acid, PNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/50Methods for regulating/modulating their activity
    • C12N2320/51Methods for regulating/modulating their activity modulating the chemical stability, e.g. nuclease-resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/30Production chemically synthesised
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/55Design of synthesis routes, e.g. reducing the use of auxiliary or protecting groups

Abstract

본 발명은 천연형의 sgRNA와 동등하거나 그보다 더 높은 활성과 향상된 생체 내 안정성을 갖는 신규한 인공 sgRNA, 및 상기 sgRNA 및 Cas9를 조합한 효율적인 CRISPR/Cas9 시스템을 제공한다. sgRNA에서 crRNA의 3'-말단과 tracrRNA의 5'-말단을 연결하여 단일 가닥을 형성하기 위한 뉴클레오티드 링커 영역이 아미노산 유도체 링커로 치환되는 경우에도, 최초의 sgRNA와 동등하거나 그보다 더 높은 활성이 시험관 내 DNA 절단 분석에서 유지된다. 또한, tracrRNA의 스템-루프 1 및 스템-루프 2 및/또는 스템-루프 2의 루프 부분 사이에 존재하는 링커 영역이 아미노산 유도체 링커로 치환되는 경우에도, 또는 아미노산 유도체 링커가 sgRNA의 5'-말단 및/또는 3'-말단의 부근 내로 부가/삽입되는 경우에도, 최초 sgRNA와 동등하거나 그보다 더 높은 활성이 유지된다. 생체 내 활성은 하나 이상의 아미노산 유도체 링커를 sgRNA 내로 도입함으로써 향상될 수 있다.

Description

인공 단일 가이드 RNA 및 이의 용도
본 발명은 천연형과 같거나 그보다 높은 활성과 향상된 생체 내 안정성을 갖는 신규한 단일 가이드(single guide) RNA (이하, "sgRNA"로도 언급됨), 상기 인공 sgRNA 및 CRISPR-연합 단백질 9 (Cas9)의 조합으로 이루어진 CRISPR/Cas9 시스템, 및 이의 용도를 제공한다.
CRISPR (clustered regularly interspaced short palindromic repeats)은 세균에 존재하는 수십 개 염기쌍의 짧은 반복적 서열로서 박테리오파지, 플라스미드 등과 같은 외래 DNA에 대한 획득 면역 기전에 관여한다. CRISPR의 상류에 있는 Cas 유전자 클러스터 중 하나는 외래 DNA에서 PAM (proto-spacer adjacent motif)으로 불리는 특이적 짧은 서열을 인식하고, 그의 상류에서 수십 개의 염기쌍을 절단하여 이들을 CRISPR 영역 내로 삽입한다. 삽입된 표적 서열은 일련의 CRISPR RNA (crRNA) 전구체로서 반복 서열과 함께 전사되고, 반복 서열은 crRNA에 부분적으로 상보적인 트랜스-활성화 crRNA (tracrRNA)의 작용에 의해 절단되어 성숙 crRNA를 제공하며, 성숙 crRNA는 tracrRNA 및 Cas 유전자 클러스터 중 하나로서 이중 가닥 단절-유도 엔도뉴클리아제인 Cas9와 복합체를 형성한다. 상기 복합체는 외래 DNA에서 PAM 서열을 인식하고, 그에 인접한 표적 서열에 결합하고, Cas9는 외래 DNA를 절단하고 제거한다. 이러한 일련의 기전은 CRISPR/Cas9 시스템으로 불린다.
Figure 112018082822241-pct00001
(각각의 n은 독립적으로 A, G, C 또는 U이고, (n)20은 crRNA의 가이드 영역임).
TracrRNA는 crRNA의 성숙 및 crRNA와 함께 형성되는 헤어핀 구조를 통해 Cas9와의 복합체 형성에 필요하다. 일단 단일 가이드 RNA (sgRNA)가 crRNA의 3'-말단과 tracrRNA의 5'-말단을 단축시키고 뉴클레오티드 링커(linker)를 통해 단일 가닥을 형성함에 의해 만들어지면, 그 후에는 Cas9 및 sgRNA만으로 게놈 편집 (genome editing)이 가능해진다. 스트렙토코커스 피오게네스 (Streptococcus pyogenes)-유래 Cas9 (SpCas9)는 PAM으로서 NGG를 인식한다. 따라서, GG가 3'-측면에 존재하는 경우, 임의의 이중-가닥 DNA는 sgRNA의 5'-말단 측면 상의 약 20개 염기를 원하는 표적 서열로 대체함으로써 간단히 표적 부위에서 절단 (이중-가닥 DNA 단절; DSB)될 수 있다. 시험관 내 전사 시스템 또는 재조합 세포 또는 sgRNA를 암호화하는 DNA를 사용하여 생산된 천연형 RNA 형태의 sgRNA는 Cas9 mRNA 또는 단백질, 또는 Cas9를 암호화하는 DNA와 함께 세포 내로 도입된다. 세포 내로 도입된 (그리고 발현된) sgRNA는 Cas9 단백질과 복합체를 형성하고 표적 서열에 결합하여 표적 유전자에서 DSB를 유도한다. DSB는 비-상동성 말단 연결 (non-homologous end joining, NHEJ)에 의해 복구되지만, 표적 유전자는 그 당시에 발생하는 염기(들)의 우발적인 삽입 또는 결실 (indel)로 인한 해독틀 돌연변이에 의해 파괴된다. 또한, 양 말단에 표적에 상동인 서열을 갖는 공여자 DNA의 동시-형질감염은 상동 재조합 복구를 초래하고, 그로써 염기 변형 및 유전자 삽입을 가능케 한다.
그러나, DSB가 오프타겟 (offtarget) 절단에 의한 예기치 않은 게놈 변형을 포함하기 때문에, 강력한 세포독성, 염색체 전위 등과 같은 부작용이 발생한다. 따라서, 단세포 미생물에서는 생세포 수가 극히 적고 유전적 변형 자체가 어렵다는 문제가 있다. sgRNA 및 Cas9를 암호화하는 DNA 발현 벡터의 사용은 sgRNA 및 Cas9의 지속적인 발현을 포함하고, 이는 차례로 오프타겟 절단의 문제를 더 크게 만들고 발현 벡터의 염색체 내로의 통합으로 인한 유전적 교란의 위험을 초래한다. 상기에 언급한 문제는 RNA 형태의 sgRNA 및 mRNA 또는 단백질 형태의 Cas9를 도입함으로써 회피 또는 감소될 수 있다. 그러나, 천연형 (바-변형) RNA는 생체 내에서 불안정하기 때문에, 생체 내에서 게놈 편집 효율이 저하되는 문제점이 있다.
생체 내 안정성을 개선하거나 세포 내 전달을 증강시키도록 뉴클리아제 내성을 향상시키기 위해, 변형된 뉴클레오티드의 사용에 의한 siRNA 또는 안티센스 RNA 분자의 화학적 합성이 익히 알려져 있으나; 화학적으로 변형된 sgRNA를 사용하는 게놈 편집에 대한 보고는 극히 제한적이다. Hendel 등 (비-특허 문헌 1)은 리보스의 2'-위치에서 변형된 화학적으로 변형된 sgRNA 및 5'- 및 3'-말단 뉴클레오티드 각각에서의 인산 디에스테르 결합이 인간 1차 배양 세포에서 게놈 편집 효율을 현저하게 향상시켰음을 보고한다. 그러나, sgRNA의 내부 뉴클레오티드의 화학적 변형에 대해서는 보고된바 없다.
부수적으로, 생체 내 안정성을 향상시키고 선천적 면역 반응의 촉진에 의해 야기되는 부작용을 감소시키기 위해, siRNA, microRNA 등과 같은 이중-가닥 핵산의 말단이 각종 링커로 연결된 1 또는 2개의 헤어핀-유형 부분 2차 구조를 취할 수 있는 단일-가닥 핵산 분자가 개발되었다 (예를 들어, 특허 문헌 1-6 참조). 그러나, 링커가 상대적으로 복잡한 2차 구조를 갖는 sgRNA에 적용되어, Cas9와의 복합체 형성에 영향을 미치고, 결과적으로 게놈 편집 효율을 전혀 예측할 수 없음이 보고된 바는 없다.
특허 문헌 1: WO 2012/017919 특허 문헌 2: WO 2013/103146 특허 문헌 3: WO 2012/005368 특허 문헌 4: WO 2013/077446 특허 문헌 5: WO 2013/133393 특허 문헌 6: WO 2013/180038
비-특허 문헌 1: Hendel et al., Nat. Biotechnol., 33(9): 985-989 (2015)
상기에 언급한 바와 같이, CRISPR/Cas9 시스템을 이용한 게놈 편집에서, RNA 형태로 sgRNA의 도입이 특정한 이점을 가지지만, 천연형 RNA는 생체 내에서 불안정하고, 재조합 또는 시험관 내 전사에 의한 생산 시 벡터 또는 주형 DNA를 제조할 필요가 있고, 배양, 효소 반응 및 RNA 정제에 시간과 노력을 요구한다. 한편, 화학적으로-변형된 RNA가 사용되는 경우, 게놈 편집 효율, 특히 상동 재조합에 의한 유전자 삽입 돌연변이의 도입 효율은 충분하지 못하다.
따라서, 본 발명의 목적은 천연형 RNA와 동등하거나 그보다 더 높은 활성 및 개선된 생체 내 안정성을 갖는 신규한 인공 sgRNA를 제공하고, 상기 인공 sgRNA 및 Cas9를 조합함으로써 더 효율적인 CRISPR/Cas9 시스템을 제공하는 것이다.
본 발명자들은 sgRNA에서 crRNA의 3'-말단 및 tracrRNA의 5'-말단의 연결에 의해 단일 가닥을 형성하기 위해서 뉴클레오티드 링커 영역 (SpCas9에 상응하는 sgRNA 내 5'-GAAA-3'의 테트라루프 (하기 식) (Nishimasu et al., Cell, 156: 935-949 (2014) 참조))을 아미노산 유도체 링커로 치환하는 경우에도, 최초 sgRNA와 동등하거나 그보다 더 높은 활성이 시험관 내 (무-세포 또는 세포 내) DNA 절단 분석에서 유지된다는 것을 발견하였다. 또한, 본 발명자들은 tracrRNA의 스템-루프 1 및 스템-루프 2 및/또는 스템-루프 2의 루프 부분 사이에 존재하는 링커 영역이 아미노산 유도체 링커로 치환되는 경우, 또는 아미노산 유도체 링커가 sgRNA의 5'-말단 및/또는 3'-말단의 부근 내로 부가/삽입되는 경우에도 (하기 식에서 화살표), 최초 sgRNA와 동등하거나 그보다 더 높은 활성이 적어도 무-세포 시스템에서 유지된다는 것을 또한 확인하였다. 나아가, 스템-루프 1 또는 스템-루프 3의 루프 부분을 아미노산 유도체 링커로 치환하거나, 또는 스템 부분 및/또는 스템-루프 2 부분에 수반되는 테트라루프를 아미노산 유도체 링커로 치환함으로써 수득되는 절단된 (truncated) sgRNA는, 적어도 무-세포 시스템에서, 최초 sgRNA보다는 낮지만, 충분한 활성을 유지하였다.
구체적으로, 최초 sgRNA와 동등하거나 그보다 더 높은 세포 내 절단 활성이 테트라루프 부분뿐만 아니라 스템-루프 2의 루프 부분이 아미노산 유도체 링커로 치환된 2개 위치에서 링커가 도입된 sgRNA에서 발견되었다는 것이 흥미롭다. 이러한 인공 sgRNA는 생체 내에서 더 우수한 안정성 개선 효과를 갖는 것으로 여겨진다.
Figure 112018082822241-pct00002
(각각의 n은 독립적으로 A, G, C 또는 U이고, (n)20은 crRNA의 가이드 영역임).
상기에 기술된 바와 같이, 본 발명자들은 하나 이상의 아미노산 유도체 링커를 sgRNA 내로 도입하여 sgRNA의 활성 (Cas9와의 조합에 의한 표적 이중-가닥 DNA 절단 활성)을 유지하면서 sgRNA의 생체 내 안정성을 성공적으로 개선하였고, 그 결과 본 발명을 완성하였다.
따라서, 본 발명은 하기와 같다.
[1] (1) 하기 식 (A)로 표시되는 단일 가이드 RNA:
Figure 112018082822241-pct00003
[식 (A)에서, Xa는 하기 식 (I)로 표시되는 아미노산 유도체 링커이고:
Figure 112018082822241-pct00004
식 (I)에서,
X1 및 X2는 각각 독립적으로 H2, O, S, 또는 NH이고;
Y1 및 Y2는 각각 독립적으로 단일 결합, CH2, NH, O, 또는 S이고;
L1은 n개의 탄소 원자를 갖는 알킬렌 사슬이고, 알킬렌 탄소 원자(들) 상의 수소 원자(들)은 OH, ORa, NH2, NHRa, NRaRb, SH, 또는 SRa로 치환되거나 치환되지 않을 수 있고, 또는
L1은 알킬렌 사슬 상의 적어도 하나의 탄소 원자를 산소 원자로 치환함으로써 수득되는 폴리에테르 사슬이되,
단, Y1이 NH, O, 또는 S인 경우, L1 내 Y1에 결합된 원자는 탄소이고, L1 내 OR1에 결합된 원자는 탄소이고, 산소 원자는 서로 인접하지 않으며;
L2는 m개의 탄소 원자를 갖는 알킬렌 사슬이고, 알킬렌 탄소 원자(들) 상의 수소 원자(들)은 OH, ORc, NH2, NHRc, NRcRd, SH, 또는 SRc로 치환되거나 치환되지 않을 수 있고, 또는
L2는 알킬렌 사슬 상의 적어도 하나의 탄소 원자를 산소 원자로 치환함으로써 수득되는 폴리에테르 사슬이되,
단, Y2가 NH, O, 또는 S인 경우, L2 내 Y2에 결합된 원자는 탄소이고, L2 내 OR2에 결합된 원자는 탄소이고, 산소 원자는 서로 인접하지 않으며;
Ra, Rb, Rc, 및 Rd는 각각 독립적으로 치환기 또는 보호기이고;
m은 0 내지 30 범위의 정수이고;
n은 0 내지 30 범위의 정수이고;
R1 및 R2는 존재하거나 부존재할 수 있고, 이들이 존재하는 경우, R1 및 R2는 각각 독립적으로 뉴클레오티드 잔기 또는 상기에 언급한 구조 (I)이고,
A는 임의의 원자 그룹이되, 단 하기 식 (Ia)는 아미노산 또는 펩티드이고,
Figure 112018082822241-pct00005
상기에 언급한 Xa는 상기에 언급한 -OR1- 또는 -OR2-를 통해 인접한 뉴클레오티드 잔기에 결합되고,
식 (A)에서, Xb 및 Y는 각각 독립적으로 1 내지 5개의 임의의 뉴클레오티드 링커, 또는 상기에 언급한 식 (I)로 표시되는 아미노산 유도체 링커를 나타내고,
상기에 언급한 Xb 및 Y는 각각 독립적으로 상기에 언급한 -OR1- 또는 -OR2-를 통해 인접한 뉴클레오티드 잔기에 결합되고,
식 (A)에서, Xc 및 Xd는 존재하거나 부존재할 수 있고, 이들이 존재하는 경우, 이들은 각각 독립적으로 상기에 언급한 식 (I)로 표시되는 아미노산 유도체 링커이고,
상기에 언급한 Xc 및 Xd는 각각 독립적으로 상기에 언급한 -OR1- 또는 -OR2-를 통해 인접한 뉴클레오티드 잔기에 결합되고,
식 (A)에서, (n)20은 이들 각각이 독립적으로 A, G, C 또는 U인 20±5개 뉴클레오티드 잔기로 이루어진 뉴클레오티드 서열임], 또는
(2) 1 내지 수개의 뉴클레오티드 잔기가 (n)20을 제외한 영역에서 치환, 결실, 삽입 또는 부가된 전술한 식 (A)의 단일 가이드 RNA로서, Cas9 단백질과 복합체를 형성하고 상기에 언급한 (n)20에 상보적인 표적 뉴클레오티드 서열을 함유하는 이중-가닥 DNA를 인식하는 활성을 갖는 RNA.
[2] 상기에 언급한 식 (Ia)의 아미노산 또는 펩티드를 구성하는 아미노산이 글리신, α-알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 시스틴, 글루타민, 글루탐산, 히스티딘, 이소류신, 류신, 리신, 히드록시리신, 메티오닌, 페닐알라닌, 세린, 쓰레오닌, 티로신, 발린, 프롤린, 4-히드록시프롤린, 트립토판, β-알라닌, 1-아미노-2-카르복시사이클로펜탄, 아미노벤조산, 아미노피리딘카르복실산, 및 하기 화학식 (Ia2)로 표시되는 아미노산으로 이루어진 군으로부터 선택되는 적어도 하나의 종류이고, 이들 각각은 선택적으로 치환기 또는 보호기를 갖는 것인, [1]의 단일 가이드 RNA:
Figure 112018082822241-pct00006
(식 (Ia2)에서, R100은 임의의 치환기이고, 존재하거나 부존재할 수 있고, 존재하는 경우, 이는 하나 또는 복수일 수 있고, 복수인 경우, 각각은 동일하거나 상이할 수 있음).
[3] 상기에 언급한 Xa가 하기 식 (I-1) 내지 (I-7)로 표시되는, [1] 또는 [2]의 단일 가이드 RNA:
Figure 112018082822241-pct00007
여기서 n 및 m은 각각 독립적으로 0 내지 30의 정수임.
[4] 상기에 언급한 Xa가 상기에 언급한 식 (I-4) 또는 (I-7) (여기서 n=5이고 m=4임)로 표시되는, [3]의 단일 가이드 RNA.
[5] 상기에 언급한 식 (I-1) (여기서 n=5이고 m=4임)로 표시되거나, 또는 상기에 언급한 식 (I-6) (여기서 n=4이고 m=4임)으로 표시되는, [3]의 단일 가이드 RNA.
[6] 상기에 언급한 Xa가 하기 식 (II)로 표시되는, [1] 또는 [2]의 단일 가이드 RNA:
Figure 112018082822241-pct00008
(식 (II)에서,
X1 및 X2는 각각 독립적으로 H2, O, S, 또는 NH이고;
Y1 및 Y2는 각각 독립적으로 단일 결합, CH2, NH, O, 또는 S이고;
R3은 고리 A 상의 C-3, C-4, C-5, 또는 C-6에 결합되는 수소 원자 또는 치환기이고;
L1은 n개의 원자로 구성된 알킬렌 사슬이고, 알킬렌 탄소 원자(들) 상의 수소 원자(들)은 OH, ORa, NH2, NHRa, NRaRb, SH, 또는 SRa로 치환되거나 치환되지 않을 수 있고, 또는
L1은 알킬렌 사슬 상의 적어도 하나의 탄소 원자를 산소 원자로 치환함으로써 수득되는 폴리에테르 사슬이되,
단, Y1이 NH, O, 또는 S인 경우, L1 내 Y1에 결합된 원자는 탄소이고, L1 내 OR1에 결합된 원자는 탄소이고, 산소 원자는 서로 인접하지 않으며;
L2는 m개의 원자로 구성된 알킬렌 사슬이고, 알킬렌 탄소 원자(들) 상의 수소 원자(들)은 OH, ORc, NH2, NHRc, NRcRd, SH, 또는 SRc로 치환되거나 치환되지 않을 수 있고, 또는
L2는 알킬렌 사슬 상의 적어도 하나의 탄소 원자를 산소 원자로 치환함으로써 수득되는 폴리에테르 사슬이되,
단, Y2가 NH, O, 또는 S인 경우, L2 내 Y2에 결합된 원자는 탄소이고, L2 내 OR2에 결합된 원자는 탄소이고, 산소 원자는 서로 인접하지 않으며;
Ra, Rb, Rc, 및 Rd는 각각 독립적으로 치환기 또는 보호기이고;
l은 1 또는 2이고;
m은 0 내지 30 범위의 정수이고;
n은 0 내지 30 범위의 정수이고;
고리 A 상에서, C-2 이외의 하나의 탄소 원자는 질소, 산소, 또는 황으로 치환될 수 있고;
고리 A는 탄소-탄소 이중 결합 또는 탄소-질소 이중 결합을 함유할 수 있고,
R1 및 R2는 존재하거나 부존재할 수 있고, 이들이 존재하는 경우, R1 및 R2는 각각 독립적으로 뉴클레오티드 잔기 또는 상기에 언급한 구조 (II)이고,
상기에 언급한 Xa는 -OR1- 또는 -OR2-를 통해 인접한 뉴클레오티드 잔기에 결합됨).
[7] 상기에 언급한 Xa가 하기 식 (II-1) 내지 (II-9)로 표시되는, [6]의 단일 가이드 RNA:
Figure 112018082822241-pct00009
여기서 n 및 m은 각각 독립적으로 0 내지 30의 정수이고 q는 0 내지 10의 정수임.
[8] 상기에 언급한 Xa가 상기에 언급한 식 (II-8) (여기서 n=5이고 m=4이며, n=7이고 m=6이며, n=9이고 m=8이며, 또는 n=11이고 m=10임)로 표시되는, [7]의 단일 가이드 RNA.
[9] 상기에 언급한 Xa가 하기 식 (III-1) 내지 (III-3)으로 표시되는, [1] 또는 [2]의 단일 가이드 RNA:
Figure 112018082822241-pct00010
여기서 n 및 m은 각각 독립적으로 0 내지 30의 정수임.
[10] 상기에 언급한 각각의 식에서, n=5이고 m=4인, [9]의 단일 가이드 RNA.
[11] 상기에 언급한 Xb 및 Y가 각각 독립적으로 1 내지 5개의 임의의 뉴클레오티드 링커를 나타내는, [1] 내지 [10] 중 어느 하나의 단일 가이드 RNA.
[12] 상기에 언급한 Xc 및 Xd가 부존재하는, [1]의 단일 가이드 RNA.
[13] 상기에 언급한 Xc 및 Xd가 각각 독립적으로 상기에 언급한 식 (I)로 표시되는 아미노산 유도체 링커인, [11]의 단일 가이드 RNA.
[14] 상기에 언급한 Xc 및 Xd가 상기에 언급한 식 (II)로 표시되는 아미노산 유도체 링커인, [13]의 단일 가이드 RNA.
[15] 상기에 언급한 Xc 및 Xd가 상기에 언급한 식 (II-8) (여기서 n=5이고 m=4임)로 표시되는, [14]의 단일 가이드 RNA.
[16] 상기에 언급한 Xc 및 Xd가 상기에 언급한 식 (I-1), (I-4), (I-7) 및 (III-1) 내지 (III-3) (여기서 n=5이고 m=4임) 중 어느 하나로 표시되거나, 또는 상기에 언급한 식 (I-6) (여기서 n=4이고 m=4임)으로 표시되는, [13]의 단일 가이드 RNA.
[17] 상기에 언급한 Xb가 상기에 언급한 식 (I)로 표시되는 아미노산 유도체 링커인, [1] 내지 [10] 중 어느 하나의 단일 가이드 RNA.
[18] 상기에 언급한 Xb가 상기에 언급한 식 (II)으로 표시되는 아미노산 유도체 링커인, [17]의 단일 가이드 RNA.
[19] 상기에 언급한 Xb가 상기에 언급한 식 (II-8) (여기서 n=5이고 m=4임)로 표시되는, [18]의 단일 가이드 RNA.
[20] 상기에 언급한 Xb가 상기에 언급한 식 (I-1), (I-4), (I-7) 및 (III-1) 내지 (III-3) (여기서 n=5이고 m=4임) 중 어느 하나로 표시되거나, 또는 상기에 언급한 식 (I-6) (여기서 n=4이고 m=4임)으로 표시되는, [17]의 단일 가이드 RNA.
[21] 상기에 언급한 Y가 1 내지 5개의 임의의 뉴클레오티드 링커를 나타내는, [17] 내지 [20] 중 어느 하나의 단일 가이드 RNA.
[22] 상기에 언급한 Y가 상기에 언급한 식 (I)로 표시되는 아미노산 유도체 링커인, [17] 내지 [20] 중 어느 하나의 단일 가이드 RNA.
[23] 상기에 언급한 Y가 상기에 언급한 식 (I-4) (여기서 n=5이고 m=4임)로 표시되는, [22]의 단일 가이드 RNA.
[24] 상기에 언급한 Y가 상기에 언급한 식 (II)로 표시되는 아미노산 유도체 링커인, [22]의 단일 가이드 RNA.
[25] 상기에 언급한 Y가 상기에 언급한 식 (II-8) (여기서 n=5이고 m=4이며, n=7이고 m=6이며, n=9이고 m=8이며, 또는 n=11이고 m=10임)로 표시되는, [24]의 단일 가이드 RNA.
[26] 상기에 언급한 Y가 상기에 언급한 식 (I-1), (I-7) 및 (III-1) 내지 (III-3) (여기서 n=5이고 m=4임) 중 어느 하나로 표시되거나 상기에 언급한 식 (I-6) (여기서 n=4이고 m=4임)으로 표시되는, [22]의 단일 가이드 RNA.
[27] 상기에 언급한 Xa가 상기에 언급한 식 (II-8) (여기서 n=5이고 m=4임)로 표시되고, 상기에 언급한 Xa에 인접한 스템의 1 내지 3개 염기쌍이 결실되는, [7]의 단일 가이드 RNA.
[28] 상기에 언급한 Xa에 인접한 스템의 1 내지 4개 염기쌍이 결실되는, [19]의 단일 가이드 RNA.
[29] 상기에 언급한 Xa가 상기에 언급한 식 (II-8) (여기서 n=5이고 m=4임)로 표시되고, 상기에 언급한 Xa에 인접한 스템의 1 내지 3개 염기쌍이 결실되는, [28]의 단일 가이드 RNA.
[30] Xa, Xb 및 Y가 1 내지 5개의 임의의 뉴클레오티드 링커이고, Xc 및 Xd가 부존재하고, 스템-루프 1의 루프 부분 (UA) 또는 스템-루프 3의 루프 부분 (AGU)이 상기에 언급한 식 (II-8) (여기서 n=5이고 m=4임)로 표시되는 아미노산 유도체 링커로 치환되는, 상기에 언급한 식 (A)로 표시되는 단일 가이드 RNA.
[31] [1] 내지 [30] 중 어느 하나의 단일 가이드 RNA 및 Cas9의 조합을 포함하는 CRISPR/Cas9 시스템.
[32] 상기 Cas9가 스트렙터코커스 피오게네스로부터 유래하는, [31]의 CRISPR/Cas9 시스템.
[33] 상기 Cas9가 단백질, 이를 암호화하는 mRNA 또는 이를 암호화하는 DNA를 포함하는 발현 벡터의 형태인, [31] 또는 [32]의 CRISPR/Cas9 시스템.
[34] [31] 내지 [33] 중 어느 하나의 CRISPR/Cas9 시스템을 표적 이중-가닥 DNA와 접촉시키는 것을 포함하는, 이중-가닥 DNA를 인식하는 방법.
[35] Cas9 단백질이 이중-가닥 DNA 절단 활성을 갖는, [34]의 방법.
[36] 상기에 언급한 이중-가닥 DNA가 세포 내에서 절단되는, [35]의 방법.
[37] 표적 유전자의 넉아웃 (knock out)을 위한, [36]의 방법.
[38] 표적 유전자 내 염기의 변형, 또는 상기 유전자 내 외인성 유전자의 삽입을 위한, [36]의 방법.
[39] 하기 식 (IV-1) 내지 (IV-3) 중 어느 하나로 표시되는 핵산 분자 합성을 위한 단량체:
Figure 112018082822241-pct00011
(각각의 식에서, R11 및 R21은 각각 독립적으로 수소 원자, 보호기 또는 인산 보호기이고, n 및 m은 각각 독립적으로 0 내지 30의 정수임).
[40] 상기에 언급한 식 각각에서 n=5이고 m=4인, [39]의 단량체.
[41] [39] 또는 [40]의 단량체의 사용을 포함하는 핵산 분자를 생산하는 방법.
[42] 상기에 언급한 핵산 분자가 [1] 내지 [26] 중 어느 하나의 단일 가이드 RNA인, [41]의 방법.
[43] 핵산 분자의 생산에 있어서 [39] 또는 [40]의 단량체의 용도.
[44] 상기에 언급한 핵산 분자가 [1] 내지 [26] 중 어느 하나의 단일 가이드 RNA인, [43]의 용도.
본 발명의 인공 sgRNA는 저렴한 비용으로 쉽게 합성될 수 있고 표적 이중-가닥 DNA의 절단 활성을 손상시키기 않으면서 sgRNA의 생체 내 안정성을 향상시킬 수 있다. 따라서, 이는 게놈 편집 효율, 특히 생체 내 게놈 편집 효율을 향상시킬 수 있다.
도 1은 KRAS 유전자를 표적하는 sgRNA의 시험관 내 절단 활성을 나타낸다.
도 2는 BCL-2 유전자를 표적하는 sgRNA의 시험관 내 절단 활성을 나타낸다.
도 3은 KRAS 유전자를 표적하는 sgRNA의 시험관 내 절단 활성을 나타낸다.
도 4는 KRAS 유전자를 표적하는 sgRNA의 시험관 내 절단 활성을 나타낸다.
도 5는 KRAS 유전자를 표적하는 sgRNA의 시험관 내 절단 활성을 나타낸다.
도 6은 KRAS 유전자를 표적하는 sgRNA의 시험관 내 절단 활성을 나타낸다.
도 7은 KRAS 유전자를 표적하는 인공 sgRNA와 천연형 sgRNA 사이의 시험관 내 절단 활성의 비교를 나타낸다.
도 8은 BCL-2 유전자를 표적하는 sgRNA의 시험관 내 절단 활성을 나타낸다.
도 9는 BCL-2 유전자를 표적하는 sgRNA의 시험관 내 절단 활성을 나타낸다.
도 10은 BRAF 유전자를 표적하는 sgRNA의 시험관 내 절단 활성을 나타낸다.
도 11은 BRAF 유전자를 표적하는 sgRNA의 시험관 내 절단 활성을 나타낸다.
도 12는 BCL-2 유전자를 표적하는 sgRNA의 세포 내 절단 활성을 나타낸다.
도 13은 BCL-2 유전자를 표적하는 인공 sgRNA와 천연형 sgRNA 사이의 세포 내 절단 활성의 비교를 나타낸다.
도 14는 BRAF 유전자를 표적하는 sgRNA의 세포 내 절단 활성을 나타낸다.
도 15는 BCL-2 유전자를 표적하는 인공 sgRNA와 천연형 sgRNA 사이의 세포 내 절단 활성의 비교를 나타낸다.
1. 인공 sgRNA
본 발명은 적어도 이들의 내부 서열에 하나 이상의 아미노산 유도체 링커를 포함하는 하기 단일 가이드 RNA (천연형 sgRNA)인 화학적으로-변형된 sgRNA (또한 본 출원 명세서에서 "인공 sgRNA"로도 언급됨)를 제공하고,
Figure 112018082822241-pct00012
상기 천연형 sgRNA는 스트렙토코커스 피오게네스로부터 유래하고 하기 식으로 표시되는 crRNA 및 tracrRNA의 키메라화 (chimerization) (단일 가닥의 절단 및 형성)에 의해 수득된다:
Figure 112018082822241-pct00013
(각각의 n은 독립적으로 A, G, C 또는 U이고 (n)20은 crRNA의 가이드 영역임).
본 발명의 인공 sgRNA가 유래하는 천연형 sgRNA (sgRNA 자체는 본질적으로 인공 RNA이지만, 본 명세서에서는 "천연형 (즉, 비-변형된) 뉴클레오티드로만 이루어진 sgRNA라는 의미에서 천연형 sgRNA로 지칭함)는 상기에 언급한 바와 같이, 5'-말단 상의 표적 뉴클레오티드 서열에 상보적인 가이드 영역 ((n)20)을 함유하고, crRNA-유래 반복 영역 및 tracrRNA-유래 항반복 (antirepeat) 영역은 4개 뉴클레오티드 (GAAA)로 이루어진 테트라루프를 통해 이의 하류에 연결되어, 스템-루프 구조를 형성한다. 또한, 이는 항반복 영역의 하류에 3개의 tracrRNA-유래 스템-루프 구조를 함유하고, 스템-루프 1과 스템-루프 2 사이에 5개 뉴클레오티드 (UUAUC)로 이루어진 링커 영역을 갖는다.
가이드 영역 내 뉴클레오티드 서열 ((n)20)의 길이는 단지 sgRNA가 표적 뉴클레오티드 서열에 특이적으로 결합하기에 충분할 필요가 있다. 예를 들어, 돌연변이가 포유류의 게놈 DNA 내 특정 부위에 도입되는 경우, 이는 그의 게놈 크기에 따라서 12개 뉴클레오티드 이상, 바람직하게는 15개 뉴클레오티드 이상, 더욱 바람직하게는 17개 뉴클레오티드 이상이다. 길이의 상한은 특별히 제한되는 것은 아니지만, 바람직하게는 25개 뉴클레오티드 이하, 더욱 바람직하게는 22개 뉴클레오티드 이하이다. 더욱 특이적으로, 가이드 영역의 뉴클레오티드 길이는 20±5개 뉴클레오티드, 바람직하게는 17 내지 22개 뉴클레오티드, 특히 바람직하게는, 20개 뉴클레오티드이다.
구체적으로, 본 발명의 인공 sgRNA는 적어도 천연형 sgRNA의 테트라루프 부분이 아미노산 유도체 링커 (Xa)로 치환되는 것을 특징으로 한다. 즉, 본 발명의 인공 sgRNA는 하기 식 (A)로 표시되는 단일 가이드 RNA이다:
Figure 112018082822241-pct00014
[식 (A)에서, Xa는 식 (I)로 표시되는 아미노산 유도체 링커이고:
Figure 112018082822241-pct00015
식 (I)에서,
X1 및 X2는 각각 독립적으로 H2, O, S 또는 NH이고;
Y1 및 Y2는 각각 독립적으로 단일 결합, CH2, NH, O 또는 S이고;
L1은 n개의 탄소 원자를 갖는 알킬렌 사슬이고, 알킬렌 탄소 원자(들) 상의 수소 원자(들)은 OH, ORa, NH2, NHRa, NRaRb, SH, 또는 SRa로 치환되거나 치환되지 않을 수 있고, 또는
L1은 알킬렌 사슬 상의 적어도 하나의 탄소 원자를 산소 원자로 치환함으로써 수득되는 폴리에테르 사슬이되,
단, Y1이 NH, O 또는 S인 경우, L1 내 Y1에 결합된 원자는 탄소이고, L1 내 OR1에 결합된 원자는 탄소이고, 산소 원자는 서로 인접하지 않으며;
L2는 m개의 탄소 원자를 갖는 알킬렌 사슬이고, 알킬렌 탄소 원자(들) 상의 수소 원자(들)은 OH, ORc, NH2, NHRc, NRcRd, SH, 또는 SRc로 치환되거나 치환되지 않을 수 있고, 또는
L2는 알킬렌 사슬 상의 적어도 하나의 탄소 원자를 산소 원자로 치환함으로써 수득되는 폴리에테르 사슬이되,
단, Y2가 NH, O 또는 S인 경우, L2 내 Y2에 결합된 원자는 탄소이고, L2 내 OR2에 결합된 원자는 탄소이고, 산소 원자는 서로 인접하지 않으며;
Ra, Rb, Rc, 및 Rd는 각각 독립적으로 치환기 또는 보호기이고;
l은 1 또는 2이고;
m은 0 내지 30 범위의 정수이고;
n은 0 내지 30 범위의 정수이고;
R1 및 R2는 존재하거나 부존재할 수 있고, 이들이 존재하는 경우, R1 및 R2는 각각 독립적으로 뉴클레오티드 잔기 또는 상기에 언급한 구조 (I)이고,
A는 임의의 원자 그룹이되, 단 하기 식 (Ia)는 아미노산 또는 펩티드이고,
Figure 112018082822241-pct00016
상기에 언급한 Xa는 상기에 언급한 -OR1- 또는 -OR2-를 통해 인접한 뉴클레오티드 잔기에 결합되고,
식 (A)에서, Xb 및 Y는 각각 독립적으로 1 내지 5개의 임의의 뉴클레오티드 링커, 또는 상기에 언급돤 식 (I)로 표시되는 아미노산 유도체 링커를 나타내고,
상기에 언급한 Xb 및 Y는 각각 독립적으로 상기에 언급한 -OR1- 또는 -OR2-를 통해 인접한 뉴클레오티드 잔기에 결합되고,
식 (A)에서, Xc 및 Xd는 존재하거나 부존재할 수 있고, 이들이 존재하는 경우, 이들은 각각 독립적으로 상기에 언급한 식 (I)로 표시되는 아미노산 유도체 링커이고,
상기에 언급한 Xc 및 Xd는 각각 독립적으로 상기에 언급한 -OR1- 또는 -OR2-를 통해 인접한 뉴클레오티드 잔기에 결합되고,
식 (A)에서, (n)20은 이들 각각이 독립적으로 A, G, C 또는 U인 20±5개 뉴클레오티드 잔기로 이루어진 뉴클레오티드 서열임], 또는
(2) 1 내지 수개의 뉴클레오티드 잔기가 (n)20을 제외한 영역에서 치환, 결실, 삽입 또는 부가된 상기에 언급한 식 (A)의 단일 가이드 RNA로서, Cas9 단백질과 복합체를 형성하고 상기에 언급한 (n)20에 상보적인 표적 뉴클레오티드 서열을 함유하는 이중-가닥 DNA를 인식하는 활성을 갖는 RNA.
식 (I)에서, X1 및 X2는, 예를 들어, 각각 독립적으로 H2, O, S 또는 NH이다. 식 (I)에서, "X1은 H2이다"라는 것은 그에 X1이 결합하는 탄소 원자와 함께 X1이 CH2 (메틸렌 그룹)를 형성하는 것을 의미한다. X2에도 동일하게 적용된다.
식 (I)에서, Y1 및 Y2는 각각 독립적으로 단일 결합, CH2, NH, O 또는 S이다.
식 (I)에서, L1은 n개의 탄소 원자를 갖는 알킬렌 사슬이다. 알킬렌 탄소 원자(들) 상의 수소 원자(들)은, 예를 들어, OH, ORa, NH2, NHRa, NRaRb, SH, 또는 SRa로 치환되거나 치환되지 않을 수 있다. 대안적으로, L1은 알킬렌 사슬 상의 적어도 하나의 탄소 원자를 산소 원자로 치환함으로써 수득되는 폴리에테르 사슬일 수 있다. 폴리에테르 사슬은, 예를 들어, 폴리에틸렌 글리콜이다. Y1이 NH, O 또는 S인 경우, L1 내 Y1에 결합된 원자는 탄소이고, L1 내 OR1에 결합된 원자는 탄소이고, 산소 원자는 서로 인접하지 않는다. 즉, 예를 들어, Y1이 O인 경우, 이 산소 원자 및 L1 내 산소 원자는 서로 인접하지 않으며, OR1 내 산소 원자 및 L1 내 산소 원자는 서로 인접하지 않는다.
식 (I)에서, L2는 m개의 탄소 원자를 갖는 알킬렌 사슬이다. 알킬렌 탄소 원자(들) 상의 수소 원자(들)은, 예를 들어, OH, ORc, NH2, NHRc, NRcRd, SH, 또는 SRc로 치환되거나 치환되지 않을 수 있다. 대안적으로, L2는 알킬렌 사슬 상의 적어도 하나의 탄소 원자를 산소 원자로 치환함으로써 수득되는 폴리에테르 사슬일 수 있다. Y2가 NH, O 또는 S인 경우, L2 내 Y2에 결합된 원자는 탄소이고, L2 내 OR2에 결합된 원자는 탄소이고, 산소 원자는 서로 인접하지 않는다. 즉, Y2가 O인 경우, 이 산소 원자 및 L2 내 산소 원자는 서로 인접하지 않으며, OR2 내 산소 원자 및 L2 내 산소 원자는 서로 인접하지 않는다.
L1의 n 및 L2의 m은 특별히 제한되지 않으며, 이들 각각의 하한은 0일 수 있고, 예를 들어, 이들 각각의 상한은 특별히 제한되지 않는다. n 및 m은, 예를 들어, 링커 영역 (Lx)의 원하는 길이에 따라서 적절하게 설정될 수 있다. 예를 들어, 제조 비용, 수율 등의 측면에서, n 및 m은 각각 바람직하게는 0 내지 30, 더욱 바람직하게는 0 내지 20, 더 더욱 바람직하게는 0 내지 15이다. n 및 m은 같거나 (n = m) 다를 수 있다. n + m은, 예를 들어, 0 내지 30, 바람직하게는 0 내지 20, 더욱 바람직하게는 0 내지 15이다.
Ra, Rb, Rc, 및 Rd는, 예를 들어, 각각 독립적으로 치환기 또는 보호기이다. 치환기의 예시에는 히드록시, 카르복시, 설포, 할로겐, 알킬 할라이드 (할로알킬, 예컨대, CF3, CH2CF3, CH2CCl3), 니트로, 니트로소, 시아노, 알킬 (예컨대, 메틸, 에틸, 이소프로필, 터트-부틸), 알케닐 (예컨대, 비닐), 알키닐 (예컨대, 에티닐), 사이클로알킬 (예컨대, 사이클로프로필, 아다만틸), 사이클로알킬알킬 (예컨대, 사이클로헥실메틸, 아다만틸메틸), 사이클로알케닐 (예컨대, 사이클로프로페닐), 사이클릴알킬, 히드록시알킬 (예컨대, 히드록시메틸, 히드록시에틸), 알콕시알킬 (예컨대, 메톡시메틸, 에톡시메틸, 에톡시에틸), 아릴 (예컨대, 페닐, 나프틸), 아릴알킬 (예컨대, 벤질, 펜에틸), 알킬아릴 (예컨대, p-메틸페닐), 헤테로아릴 (예컨대, 피리딜, 퓨릴), 헤테로아릴알킬 (예컨대, 피리딜메틸), 헤테로사이클릴 (예컨대, 피페리딜), 헤테로사이클릴알케닐, 헤테로사이클릴알킬 (예컨대, 모르폴릴메틸), 알콕시 (예컨대, 메톡시, 에톡시, 프로폭시, 부톡시), 할로겐화 알콕시 (예컨대, OCF3), 알케닐옥시 (예컨대, 비닐옥시, 알릴옥시), 아릴옥시 (예컨대, 페닐옥시), 알킬옥시카르보닐 (예컨대, 메톡시카르보닐, 에톡시카르보닐, 터트-부톡시카르보닐), 아릴알킬옥시 (예컨대, 벤질옥시), 아미노 [알킬아미노 (예컨대, 메틸아미노, 에틸아미노, 디메틸아미노), 아실아미노 (예컨대, 아세틸아미노, 벤조일아미노), 아릴알킬아미노 (예컨대, 벤질아미노, 트리틸아미노), 히드록시아미노], 아미노알킬 (예컨대, 아미노메틸), 알킬아미노알킬 (예컨대, 디에틸아미노메틸), 카바모일, 설파모일, 옥소, 실릴, 실릴옥시알킬 등이 포함된다. 이들 치환기는 임의로 하나 이상의 추가 치환기 또는 추가 보호기로 치환된다. 상기에 언급한 추가 치환기는 특별히 제한되는 것은 아니지만, 예를 들어, 이는 상기에 예시된 치환기일 수 있다. 상기에 언급한 추가 보호기는 특별히 제한되는 것은 아니지만, 예를 들어, 이는 하기에 예시된 보호기일 수 있다. 이하 동일하게 적용된다.
상기에 언급한 보호기 (또는 상기에 언급한 추가 보호기)는, 예를 들어, 고도로 반응성인 관능기를 불활성화하는 관능기이다. 보호기의 예시에는 공지의 보호기가 포함된다. 보호기와 관련하여, 예를 들어, 문헌 (J.F.W. McOmie, "Protecting Groups in Organic Chemistry", Plenum Press, London and New York, 1973)의 기재가 참고로서 본원에 포함된다. 보호기는 특별히 제한되지 않으며, 이의 예시에는 터트-부틸디메틸실릴 그룹 (TBDMS), 비스(2-아세톡시에틸옥시)메틸 그룹 (ACE), 트리이소프로필실릴옥시메틸 그룹 (TOM), 1-(2-시아노에톡시)에틸 그룹 (CEE), 2-시아노에톡시메틸 그룹 (CEM), 톨릴설포닐에톡시메틸 그룹 (TEM), 및 디메톡시트리틸 그룹 (DMTr)이 포함된다. R3이 OR4인 경우, 보호기는 특별히 제한되지 않으며, 이의 예시에는 TBDMS 그룹, ACE 그룹, TOM 그룹, CEE 그룹, CEM 그룹, 및 TEM 그룹이 포함된다. 이들 외에, 하기 식 (P1) 및 (P2)의 실릴-함유 그룹이 언급될 수 있다. 이들 중에서, 임의의 DMtr 그룹 및 상기에 언급한 실릴-함유 그룹이 바람직하다.
Figure 112018082822241-pct00017
식 (I)에서, 각각의 수소 원자는, 예를 들어, 독립적으로 Cl, Br, F, 또는 I와 같은 할로겐으로 치환될 수 있다.
상기에 언급한 Xa는 -OR1- 또는 -OR2-를 통해 인접한 뉴클레오티드 잔기에 결합된다. 이때, R1 및 R2는 존재하거나 부존재할 수 있다. R1 및 R2가 존재하는 경우, R1 및 R2는 각각 독립적으로 뉴클레오티드 잔기 또는 상기에 언급한 구조 (I)이다. R1 및/또는 R2가 상기에 언급한 식 (I)의 구조를 갖는 경우, Xa는 상기에 언급한 식 (I)의 구조를 갖는 2개 이상의 아미노산 유도체 잔기가 연결된 구조이다. 상기에 언급한 식 (I)의 구조는, 예를 들어, 1, 2, 3 또는 4개의 수로 함유될 수 있다. 따라서, 상기에 언급한 구조의 복수 개가 함유되는 경우, 상기에 언급한 (I)의 구조는, 예를 들어, 상기에 언급한 뉴클레오티드 잔기를 통해 직접적으로 연결 또는 결합될 수 있다.
인접한 뉴클레오티드 잔기 및 -OR1- 및 -OR2-의 조합은 특별히 제한되지 않으며, 예를 들어, 하기 조건 중 하나일 수 있다.
조건 (1)
인접한 뉴클레오티드 잔기의 3'-말단은 -OR2-를 통해 상기에 언급한 식 (I)의 구조에 연결되고 인접한 뉴클레오티드 잔기의 5'-말단은 -OR1-을 통해 상기에 언급한 식 (I)의 구조에 연결된다.
조건 (2)
인접한 뉴클레오티드 잔기의 3'-말단은 -OR1-을 통해 상기에 언급한 식 (I)의 구조에 연결되고 인접한 뉴클레오티드 잔기의 5'-말단은 -OR2-를 통해 상기에 언급한 식 (I)의 구조에 연결된다.
상기에 언급한 식 (I)에서, 원자 그룹 A는 하기 (Ia)가 아미노산 또는 펩티드이기만 하면 특별히 제한되지 않는다:
Figure 112018082822241-pct00018
예를 들어, 상기에 언급한 (I) 또는 (Ia)에서 원자 그룹 A는, 예를 들어, 사슬 원자 그룹, 지방족 원자 그룹 및 방향족 원자 그룹으로 이루어진 군으로부터 선택된 적어도 하나를 함유하거나 함유하지 않을 수 있다. 상기에 언급한 사슬 원자 그룹이 특별히 제한되는 것은 아니지만, 예를 들어, 알킬, 알케닐, 알키닐, 할로알킬, 히드록시알킬, 알콕시알킬, 아미노알킬, 실릴, 실릴옥시알킬 등이 언급될 수 있다. 상기에 언급한 지방족 원자 그룹이 특별히 제한되는 것은 아니지만, 예를 들어, 사이클로알킬, 사이클로알케닐, 사이클로알킬알킬, 사이클릴알킬 등이 언급될 수 있다. 상기에 언급한 방향족 원자 그룹이 특별히 제한되는 것은 아니지만, 예를 들어, 아릴, 아릴알킬, 알킬아릴, 축합-고리 아릴, 축합-고리 아릴알킬, 축합-고리 알킬아릴 등이 언급될 수 있다. 상기에 언급한 식 (I) 또는 (Ia) 내 원자 그룹 A에서, 상기에 언급한 원자 그룹 각각은 치환기 또는 보호기를 추가로 갖거나 갖지 않을 수 있다. 상기에 언급한 치환기 또는 보호기가 복수 개인 경우, 이들은 같거나 다를 수 있다. 상기에 언급한 치환기는, 예를 들어, 상기에 언급한 Ra, Rb, Rc 및 Rd에 대해 예시된 것들이고, 더욱 구체적으로는, 예를 들어, 할로겐, 히드록시, 알콕시, 아미노, 카르복시, 설포, 니트로, 카바모일, 설파모일, 알킬, 알케닐, 알키닐, 할로알킬, 아릴, 아릴알킬, 알킬아릴, 사이클로알킬, 사이클로알케닐, 사이클로알킬알킬, 사이클릴알킬, 히드록시알킬, 알콕시알킬, 아미노알킬, 실릴, 실릴옥시알킬, 피롤릴, 이미다졸릴 등이다. 상기에 언급한 보호기는, 예를 들어, 상기에 언급한 Ra, Rb, Rc 및 Rd에 대해 예시된 것들과 같다
본 발명에서, "아미노산"은 분자 내에 적어도 하나의 아미노 그룹 및 적어도 하나의 카르복시 그룹을 함유하는 임의의 유기 화합물을 지칭한다. "펩티드"는 아미노산의 2개 이상의 분자가 펩티드 결합을 통해 결합된 구조를 갖는 유기 화합물을 지칭한다. 상기에 언급한 펩티드 결합은 산 아미드 구조 또는 산 이미드 구조일 수 있다. 복수의 아미노 그룹이 상기에 언급한 식 (Ia)로 표시되는 아미노산 분자에 존재하는 경우, 상기에 언급한 식 (Ia)에 명백히 나타난 아미노 그룹은 임의의 아미노 그룹일 수 있다. 또한, 복수의 카르복시 그룹이 상기에 언급한 식 (Ia)로 표시되는 아미노산 분자에 존재하는 경우, 상기에 언급한 식 (Ia)에 명백히 나타난 카르복시 그룹은 임의의 카르복시 그룹일 수 있다.
본 발명에 따른 인공 sgRNA의 상기에 언급한 링커 영역 (Xa)에서, 상기에 언급한 아미노산은 천연 아미노산 또는 인공 아미노산일 수 있다. 본 발명에서, "천연 아미노산"은 자연 발생적인 구조를 갖는 아미노산 또는 이의 광학 이성질체를 지칭한다. 상기에 언급한 천연 아미노산의 생산 방법은 특별히 제한되지 않으며, 예를 들어, 이는 자연계로부터 추출될 수도 있고. 또는 합성될 수도 있다. 본 발명에서, 또한, "인공 아미노산"은 자연적으로 발생하지 않는 구조를 갖는 아미노산을 지칭한다. 즉, 상기에 언급한 인공 아미노산은 아미노산, 즉 아미노 그룹을 함유 (분자 내에 적어도 하나의 아미노 그룹 및 적어도 하나의 카르복시 그룹을 함유하는 유기 화합물)하고 자연적으로 발생하지 않는 구조를 갖는 카르복실산 유도체이다. 상기에 언급한 인공 아미노산은 바람직하게는, 예를 들어, 헤테로 고리를 함유하지 않는다. 상기에 언급한 아미노산은, 예를 들어, 단백질을 구성하는 아미노산일 수 있다. 상기에 언급한 아미노산은, 예를 들어, 글리신, α-알라닌, 아르기닌, 아스파라긴, 아스파르트산, 시스테인, 시스틴, 글루타민, 글루탐산, 히스티딘, 이소류신, 류신, 리신, 히드록시리신, 메티오닌, 페닐알라닌, 세린, 쓰레오닌, 티로신, 발린, 프롤린, 4-히드록시프롤린, 트립토판, β-알라닌, 1-아미노-2-카르복시사이클로펜탄, 아미노벤조산, 아미노피리딘카르복실산 및 하기 화학식 (Ia2)로 표시되는 아미노산으로 이루어진 군으로부터 선택되는 적어도 하나의 종류일 수 있고, 치환기 또는 보호기를 추가로 가지거나 가지지 않을 수 있다. 상기에 언급한 치환기의 예시에는 상기에 언급한 Ra, Rb, Rc 및 Rd에 대해 예시된 치환기가 포함된다. 보다 구체적으로, 예를 들어, 할로겐, 히드록시, 알콕시, 아미노, 카르복시, 설포, 니트로, 카바모일, 설파모일, 알킬, 알케닐, 알키닐, 할로알킬, 아릴, 아릴알킬, 알킬아릴, 사이클로알킬, 사이클로알케닐, 사이클로알킬알킬, 사이클릴알킬, 히드록시알킬, 알콕시알킬, 아미노알킬, 실릴, 실릴옥시알킬, 피롤릴, 이미다졸릴 등이 언급될 수 있다. 상기에 언급한 보호기는, 예를 들어, 상기에 언급한 Ra, Rb, Rc 및 Rd에 대해 예시된 보호기와 동일하다. 상기에 언급한 식 (Ia)의 아미노산 또는 펩티드가 광학 이성질체, 기하학적 이성질체, 입체이성질체 등과 같은 이성질체를 함유하는 경우, 임의의 이성질체가 사용될 수 있다.
Figure 112018082822241-pct00019
상기에 언급한 화학식 (Ia2)에서, R100은 임의의 치환기이고, 존재하거나 부존재할 수 있다. 존재하는 경우, 이는 단수로 또는 복수로 존재할 수 있다. 복수로 존재하는 경우, 이들은 서로 같거나 다를 수 있다. 상기에 언급한 R100에 대한 임의의 치환기의 예시에는 상기에 언급한 Ra, Rb, Rc 또는 Rd에서 예시된 것들이 포함된다. 이의 보다 구체적인 예시에는 할로겐, 히드록시, 알콕시, 아미노, 카르복시, 설포, 니트로, 카바모일, 설파모일, 알킬, 알케닐, 알키닐, 할로알킬, 아릴, 아릴알킬, 알킬아릴, 사이클로알킬, 사이클로알케닐, 사이클로알킬알킬, 사이클릴알킬, 히드록시알킬, 알콕시알킬, 아미노알킬, 실릴, 실릴옥시알킬, 피롤릴, 이미다졸릴 등이 포함된다. 또한, 상기에 언급한 화학식 (Ia2)의 구조는, 예를 들어, 하기 화학식 (Ia3)일 수 있다:
Figure 112018082822241-pct00020
.
상기에 언급한 화학식 (Ia)의 구조가 상기에 언급한 화학식 (Ia2)인 경우, 상기에 언급한 화학식 (I) 내 원자 그룹 A의 구조는 하기 화학식 (A2)로 표시된다. 하기 화학식 (A2) 내 R100은 상기에 언급한 화학식 (Ia2) 내 R100과 동일하다. 또한, 상기에 언급한 화학식 (Ia)의 구조가 상기에 언급한 화학식 (Ia3)인 경우, 상기에 언급한 화학식 (I) 내 원자 그룹 A의 구조는 하기 화학식 (A2a)로 표시된다:
Figure 112018082822241-pct00021
.
상기에 언급한 화학식 (I)의 구조의 예시에는 하기 화학식 (I-1) 내지 (I-7)이 포함된다. 하기 화학식 (I-1) 내지 (I-7)에서, n 및 m은 상기에 언급한 화학식 (I)에서와 동일하다.
Figure 112018082822241-pct00022
상기에 언급한 화학식 (I-1) 내지 (I-7)에서, n 및 m은 특별히 제한되지 않으며, 상기에 기술된 바와 같다. 이의 특별한 예시에는 상기에 언급한 화학식 (I-1)에서 n=11 및 m=12 또는 n=5 및 m=4 (하기에 언급된 실시예에서 Gly), 상기에 언급한 화학식 (I-4)에서 n=5 및 m=4 (하기에 언급된 실시예에서 GlyGly), 상기에 언급한 화학식 (I-6)에서 n=4 및 m=4 (하기에 언급된 실시예에서 TP), 및 상기에 언급한 화학식 (1-7)에서 n=5 및 m=4 (하기에 언급된 실시예에서 K)가 포함된다. 구조는 하기 화학식 (I-1a), (I-1b), (I-4a), (I-6a) 및 (I-7a)로 표시된다. 이들 중에서, 식 (I-1b), (I-6a) 및 (I-7a)가 바람직하다.
Figure 112018082822241-pct00023
대안적으로, 본 발명의 인공 sgRNA에서, 상기에 언급한 링커 영역 (Xa)은 하기 식 (II)로 표시된다:
Figure 112018082822241-pct00024
.
상기에 언급한 식 (II)에서, 예를 들어,
X1 및 X2는 각각 독립적으로 H2, O, S 또는 NH이고;
Y1 및 Y2는 각각 독립적으로 단일 결합, CH2, NH, O 또는 S이고;
R3은 고리 A 상의 C-3, C-4, C-5, 또는 C-6에 결합되는 수소 원자 또는 치환기이고;
L1은 n개의 원자로 구성된 알킬렌 사슬이고, 알킬렌 탄소 원자(들) 상의 수소 원자(들)은 OH, ORa, NH2, NHRa, NRaRb, SH, 또는 SRa로 치환되거나 치환되지 않을 수 있고, 또는
L1은 알킬렌 사슬 상의 적어도 하나의 탄소 원자를 산소 원자로 치환함으로써 수득되는 폴리에테르 사슬이되,
단: Y1이 NH, O, 또는 S인 경우, L1 내 Y1에 결합된 원자는 탄소이고, L1 내 OR1에 결합된 원자는 탄소이고, 산소 원자는 서로 인접하지 않으며;
L2는 m개의 원자로 구성된 알킬렌 사슬이고, 알킬렌 탄소 원자(들) 상의 수소 원자(들)은 OH, ORc, NH2, NHRc, NRcRd, SH, 또는 SRc로 치환되거나 치환되지 않을 수 있고, 또는
L2는 알킬렌 사슬 상의 적어도 하나의 탄소 원자를 산소 원자로 치환함으로써 수득되는 폴리에테르 사슬이되,
단: Y2가 NH, O, 또는 S인 경우, L2 내 Y2에 결합된 원자는 탄소이고, L2 내 OR2에 결합된 원자는 탄소이고, 산소 원자는 서로 인접하지 않으며;
Ra, Rb, Rc, 및 Rd는 각각 독립적으로 치환기 또는 보호기이고;
l은 1 또는 2이고;
m은 0 내지 30 범위의 정수이고;
n은 0 내지 30 범위의 정수이고;
고리 A 상에서, C-2 이외의 하나의 탄소 원자는 질소, 산소, 또는 황으로 치환될 수 있고;
고리 A는 탄소-탄소 이중 결합 또는 탄소-질소 이중 결합을 함유할 수 있고,
R1 및 R2는 존재하거나 부존재할 수 있고, 이들이 존재하는 경우, R1 및 R2는 각각 독립적으로 뉴클레오티드 잔기 또는 구조 (II)이고,
상기에 언급한 Xa는 -OR1- 또는 -OR2-를 통해 인접한 뉴클레오티드 잔기에 결합된다.
식 (II)에서, X1 및 X2는 각각 독립적으로, 예를 들어, H2, O, S 또는 NH이다. 식 (I)에서, "X1이 H2이다"라는 것은 그에 X1이 결합하는 탄소 원자와 함께 X1이 CH2 (메틸렌 그룹)를 형성하는 것을 의미한다. X2에도 동일하게 적용된다.
식 (II)에서, Y1 및 Y2는 각각 독립적으로 단일 결합, CH2, NH, O 또는 S이다.
상기에 언급한 식 (II)에서, L1은 n개의 원자로 구성된 알킬렌 사슬이다. 알킬렌 탄소 원자(들) 상의 수소 원자(들)은, 예를 들어, OH, ORa, NH2, NHRa, NRaRb, SH, 또는 SRa로 치환되거나 치환되지 않을 수 있다. 대안적으로, L1은 알킬렌 사슬 상의 적어도 하나의 탄소 원자를 산소 원자로 치환함으로써 수득되는 폴리에테르 사슬일 수 있다. 폴리에테르 사슬은, 예를 들어, 폴리에틸렌 글리콜이다. Y1이 NH, O, 또는 S인 경우, L1 내 Y1에 결합된 원자는 탄소이고, L1 내 OR1에 결합된 원자는 탄소이고, 산소 원자는 서로 인접하지 않는다. 즉, 예를 들어, Y1이 O인 경우, 이 산소 원자 및 L1 내 산소 원자는 서로 인접하지 않으며, OR1 내 산소 원자 및 L1 내 산소 원자는 서로 인접하지 않는다.
식 (II)에서, L2는 m개의 원자로 구성된 알킬렌 사슬이다. 알킬렌 탄소 원자(들) 상의 수소 원자(들)은, 예를 들어, OH, ORc, NH2, NHRc, NRcRd, SH, 또는 SRc로 치환되거나 치환되지 않을 수 있다. 대안적으로, L2는 알킬렌 사슬 상의 적어도 하나의 탄소 원자를 산소 원자로 치환함으로써 수득되는 폴리에테르 사슬일 수 있다. Y2가 NH, O, 또는 S인 경우, L2 내 Y2에 결합된 원자는 탄소이고, L2 내 OR2에 결합된 원자는 탄소이고, 산소 원자는 서로 인접하지 않는다. 즉, 예를 들어, Y2가 O인 경우, 이 산소 원자 및 L2 내 산소 원자는 서로 인접하지 않으며, OR2 내 산소 원자 및 L2 내 산소 원자는 서로 인접하지 않는다.
L1의 n 및 L2의 m은 특별히 제한되지 않으며, 이들 각각의 하한은 0일 수 있고, 예를 들어, 이들 각각의 상한은 특별히 제한되지 않는다. n 및 m은, 예를 들어, 상기에 언급한 비-뉴클레오티드 구조의 원하는 길이에 따라서 적절히 설정될 수 있다. 예를 들어, 제조 비용, 수율 등의 측면에서, n 및 m은 각각 바람직하게는 0 내지 30, 더욱 바람직하게는 0 내지 20, 더 더욱 바람직하게는 0 내지 15이다. n 및 m은 같거나 (n = m) 다를 수 있다. n + m은, 예를 들어, 0 내지 30, 바람직하게는 0 내지 20, 더욱 바람직하게는 0 내지 15이다.
Ra, Rb, Rc, 및 Rd는, 예를 들어, 각각 독립적으로 치환기 또는 보호기이다. 치환기 및 보호기는, 예를 들어, 상기에 기술된 것과 동일하다.
상기에 언급한 식 (II)에서, 수소 원자는 각각 독립적으로, 예를 들어, Cl, Br, F, 또는 I와 같은 할로겐으로 치환될 수 있다.
상기에 언급한 Xa는 -OR1- 또는 -OR2-를 통해 인접한 뉴클레오티드 잔기에 결합된다. R1 및 R2는 존재하거나 부존재할 수 있다. R1 및 R2가 존재하는 경우, R1 및 R2는 각각 독립적으로 뉴클레오티드 잔기 또는 식 (II)로 표시되는 구조이다. R1 및/또는 R2가 식 (II)로 표시되는 구조인 경우, 링커 영역 (Xa)의 구조는, 예를 들어, 상기에 언급한 식 (II)의 구조를 갖는 아미노산 유도체 잔기의 2개 이상이 서로 연결되게 하는 것이다. 식 (II)의 구조의 개수는, 예를 들어, 1, 2, 3, 또는 4개일 수 있다. 링커 영역 (Lx)이 복수의 구조를 포함하는 경우, 식 (II)의 구조는, 예를 들어, 직접적으로 또는 뉴클레오티드 잔기(들)을 통해 연결될 수 있다.
인접한 뉴클레오티드 잔기 및 -OR1- 및 -OR2-의 조합은 특별히 제한되지 않으며, 예를 들어,하기 조건 중 하나일 수 있다.
조건 (1)
인접한 뉴클레오티드 잔기의 3'-말단은 -OR2-를 통해 상기에 언급한 식 (II)의 구조에 연결되고 인접한 뉴클레오티드 잔기의 5'-말단은 -OR1-을 통해 상기에 언급한 식 (II)의 구조에 연결된다.
조건 (2)
인접한 뉴클레오티드 잔기의 3'-말단은 -OR1-을 통해 상기에 언급한 식 (II)의 구조에 연결되고 인접한 뉴클레오티드 잔기의 5'-말단은 -OR2-를 통해 상기에 언급한 식 (II)의 구조에 연결된다.
상기에 언급한 식 (II)에서, 고리 A 내 l은 1 또는 2이다. l = 1인 경우, 고리 A는 5-원 고리이고, 이는, 예를 들어, 피롤리딘 골격이다. 피롤리딘 골격은, 예를 들어, 프롤린 골격, 프롤리놀 골격 등이고, 특정 예시에는 프롤린 골격 및 프롤리놀 골격의 이가 구조가 포함된다. l = 2인 경우, 고리 A는 6-원 고리이고, 이는, 예를 들어, 피페리딘 골격이다. 고리 A 상에서, C-2 이외의 하나의 탄소 원자가 질소, 산소, 또는 황으로 치환될 수 있다. 또한, 고리 A는 탄소-탄소 이중 결합 또는 탄소-질소 이중 결합을 함유할 수 있다. 고리 A는, 예를 들어, L-형태 또는 D-형태 중 하나일 수 있다.
식 (II)에서, R3은 고리 A 상에서 C-3, C-4, C-5, 또는 C-6에 결합되는 수소 원자 또는 치환기이다. R3이 치환기인 경우, 1개의 치환기 R3, 2개 이상의 치환기 R3이 존재하거나, 치환기 R3이 존재하지 않을 수 있고, 복수의 치환기 R3이 존재하는 경우, 이들은 같거나 다를 수 있다.
치환기 R3은, 예를 들어, 할로겐, OH, OR4, NH2, NHR4, NR4R5, SH, SR4, 옥소 그룹 (=O) 등일 수 있다.
R4 및 R5는 각각 치환기 또는 보호기이고, 이들은 같거나 다를 수 있다. 치환기의 예시에는 할로겐, 알킬, 알케닐, 알키닐, 할로알킬, 아릴, 헤테로아릴, 아릴알킬, 사이클로알킬, 사이클로알케닐, 사이클로알킬알킬, 사이클릴알킬, 히드록시알킬, 알콕시알킬, 아미노알킬, 헤테로사이클릴알케닐, 헤테로사이클릴알킬, 헤테로아릴알킬, 실릴, 및 실릴옥시알킬이 포함된다. 이후에 동일하게 적용된다. 치환기 R3은 상기에 열거된 치환기의 어느 하나일 수 있다.
보호기는, 예를 들어, 고도로 반응성인 관능기를 불활성화시키는 관능기이다. 보호기의 예시에는 공지된 보호기가 포함된다. 보호기와 관련하여, 예를 들어, 문헌 (J.F.W. McOmie, "Protecting Groups in Organic Chemistry", Plenum Press, London and New York, 1973) 내 설명이 참조로서 본원에 포함된다. 보호기는 특별히 제한되지 않으며, 이의 예시에는 터트-부틸디메틸실릴 그룹 (TBDMS), 비스(2-아세톡시에틸옥시)메틸 그룹 (ACE), 트리이소프로필실릴옥시메틸 그룹 (TOM), 1-(2-시아노에톡시)에틸 그룹 (CEE), 2-시아노에톡시메틸 그룹 (CEM), 톨릴설포닐에톡시메틸 그룹 (TEM), 및 디메톡시트리틸 그룹 (DMTr)이 포함된다. R3이 OR4인 경우, 보호기는 특별히 제한되지 않으며, 이의 예시에는 TBDMS 그룹, ACE 그룹, TOM 그룹, CEE 그룹, CEM 그룹, 및 TEM 그룹이 포함된다. 보호기의 다른 예시에는 단락 [0275]에 제시된 식으로 표시되는 실릴-함유 그룹이 포함된다. 이후에 동일하게 적용된다.
식 (II)의 구조의 예시는 하기 식 (II-1) 내지 (II-9)의 구조를 포함한다. 하기 식에서, n 및 m은 식 (II)에서와 동일하다. 하기 식에서, q는 0 내지 10의 정수이다.
Figure 112018082822241-pct00025
식 (II-1) 내지 (II-9)에서, n, m, 및 q는 특별히 제한되지 않으며, 상기에 기술된 바와 같다. 특별한 예시는 다음과 같다: 식 (II-1)에서, n = 8이고; 식 (II-2)에서, n = 3이고; 식 (II-3)에서, n = 4 또는 8이고; 식 (II-4)에서, n = 7 또는 8이고; 식 (II-5)에서, n = 3 및 m = 4이고; 식 (II-6)에서, n = 8 및 m = 4이고; 식 (II-7)에서, n = 8 및 m = 4이고; 식 (II-8)에서, n = 5 및 m = 4이고 (하기에 기술된 실시예에서 P), n=7 및 m=6이고 (하기에 기술된 실시예에서 P13), n=9 및 m=8이고 (하기에 기술된 실시예에서 P14), 또는 n=11 및 m=10이고 (하기에 기술된 실시예에서 P15); 식 (II-9)에서, q = 1 및 m = 4이다. 하기 식 (II-4a)는 식 (II-4) (n = 8)의 예시를 나타내고, 하기 식 (II-8a)는 식 (II-8) (n = 5, m = 4)의 예시를 나타낸다.
Figure 112018082822241-pct00026
본 발명에서, 용어 "알킬"은, 예를 들어, 직쇄 및 분지된 알킬 그룹을 포함한다. 알킬 내 탄소 원자의 수는 특별히 제한되지 않으며, 예를 들어, 1 내지 30개, 바람직하게는 1 내지 6개 또는 1 내지 4개이다. 알킬 그룹의 예시는: 메틸, 에틸, n-프로필, 이소프로필, n-부틸, 이소부틸, sec-부틸, 터트-부틸, n-펜틸, 이소펜틸, 네오펜틸, n-헥실, 이소헥실, n-헵틸, n-옥틸, n-노닐, 및 n-데실이다. 이들 중에서, 예를 들어, 메틸, 에틸, n-프로필, 이소프로필, n-부틸, 이소부틸, sec-부틸, 터트-부틸, n-펜틸, 이소펜틸, 네오펜틸, n-헥실, 이소헥실 등이 바람직하다.
본 발명에서, 용어 "알케닐"은 직쇄 및 분지된 알케닐을 포함한다. 알케닐의 예시에는 하나 이상의 이중 결합을 갖는 상기에 언급한 알킬을 포함한다. 알케닐 내 탄소 원자의 수는 특별히 제한되지 않으며, 예를 들어, 알킬 내 수와 동일하고, 바람직하게는 2 내지 8개이다. 알케닐의 예시에는 비닐, 1-프로페닐, 2-프로페닐, 1-부테닐, 2-부테닐, 3-부테닐, 1,3-부타디에닐, 및 3-메틸-2-부테닐이 포함된다.
본 발명에서, 용어 "알키닐"은, 예를 들어, 직쇄 및 분지된 알키닐을 포함한다. 알키닐의 예시에는 하나 이상의 삼중 결합을 갖는 상기에 기술된 알킬이 포함된다. 알키닐 내 탄소 원자의 수는 특별히 제한되지 않으며, 알킬 내 수와 동일하고, 바람직하게는 2 내지 8개이다. 알키닐의 예시에는 에티닐, 프로피닐, 및 부티닐이 포함된다. 알키닐은, 예를 들어, 하나 이상의 이중 결합을 추가로 포함할 수 있다.
본 발명에서, 용어 "아릴"은, 예를 들어, 단환 방향족 탄화수소 그룹 및 다환 방향족 탄화수소 그룹을 포함한다. 단환 방향족 탄화수소 그룹의 예시에는 페닐이 포함된다. 다환 방향족 탄화수소 그룹의 예시에는 1-나프틸, 2-나프틸, 1-안쓰릴, 2-안쓰릴, 9-안쓰릴, 1-페난쓰릴, 2-페난쓰릴, 3-페난쓰릴, 4-페난쓰릴, 및 9-페난쓰릴이 포함된다. 이들 중에서, 예를 들어, 페닐, 1-나프틸 및 2-나프틸 등과 같은 나프틸이 바람직하다.
본 발명에서, 용어 "헤테로아릴"은, 예를 들어, 단환 방향족 헤테로사이클릭 그룹 및 축합 방향족 헤테로사이클릭 그룹을 포함한다. 헤테로아릴의 예시에는 퓨릴 (예컨대, 2-퓨릴, 3-퓨릴), 티에닐 (예컨대, 2-티에닐, 3-티에닐), 피롤릴 (예컨대, 1-피롤릴, 2-피롤릴, 3-피롤릴), 이미다졸릴 (예컨대, 1-이미다졸릴, 2-이미다졸릴, 4-이미다졸릴), 피라졸릴 (예컨대, 1-피라졸릴, 3-피라졸릴, 4-피라졸릴), 트리아졸릴 (예컨대, 1,2,4-트리아졸-1-일, 1,2,4-트리아졸-3-일, 1,2,4-트리아졸-4-일), 테트라졸릴 (예컨대, 1-테트라졸릴, 2-테트라졸릴, 5-테트라졸릴), 옥사졸릴 (예컨대, 2-옥사졸릴, 4-옥사졸릴, 5-옥사졸릴), 이속사졸릴 (예컨대, 3-이속사졸릴, 4-이속사졸릴, 5-이속사졸릴), 티아졸릴 (예컨대, 2-티아졸릴, 4-티아졸릴, 5-티아졸릴), 티아디아졸릴, 이소티아졸릴 (예컨대, 3-이소티아졸릴, 4-이소티아졸릴, 5-이소티아졸릴), 피리딜 (예컨대, 2-피리딜, 3-피리딜, 4-피리딜), 피리다지닐 (예컨대, 3-피리다지닐, 4-피리다지닐), 피리미디닐 (예컨대, 2-피리미디닐, 4-피리미디닐, 5-피리미디닐), 퓨라자닐 (예컨대, 3-퓨라자닐), 피라지닐 (예컨대, 2-피라지닐), 옥사디아졸릴 (예컨대, 1,3,4-옥사디아졸-2-일), 벤조퓨릴 (예컨대, 2-벤조[b]퓨릴, 3-벤조[b]퓨릴, 4-벤조[b]퓨릴, 5-벤조[b]퓨릴, 6-벤조[b]퓨릴, 7-벤조[b]퓨릴), 벤조티에닐 (예컨대, 2-벤조[b]티에닐, 3-벤조[b]티에닐, 4-벤조[b]티에닐, 5-벤조[b]티에닐, 6-벤조[b]티에닐, 7-벤조[b]티에닐), 벤즈이미다졸릴 (예컨대, 1-벤즈이미다졸릴, 2-벤즈이미다졸릴, 4-벤즈이미다졸릴, 5-벤즈이미다졸릴), 디벤조퓨릴, 벤즈옥사졸릴, 벤조티아졸릴, 퀴녹살릴 (예컨대, 2-퀴녹살리닐, 5-퀴녹살리닐, 6-퀴녹살리닐), 신놀리닐 (예컨대, 3-신놀리닐, 4-신놀리닐, 5-신놀리닐, 6-신놀리닐, 7-신놀리닐, 8-신놀리닐), 퀴나졸릴 (예컨대, 2-퀴나졸리닐, 4-퀴나졸리닐, 5-퀴나졸리닐, 6-퀴나졸리닐, 7-퀴나졸리닐, 8-퀴나졸리닐), 퀴놀릴 (예컨대, 2-퀴놀릴, 3-퀴놀릴, 4-퀴놀릴, 5-퀴놀릴, 6-퀴놀릴, 7-퀴놀릴, 8-퀴놀릴), 프탈라지닐 (예컨대, 1-프탈라지닐, 5-프탈라지닐, 6-프탈라지닐), 이소퀴놀릴 (예컨대, 1-이소퀴놀릴, 3-이소퀴놀릴, 4-이소퀴놀릴, 5-이소퀴놀릴, 6-이소퀴놀릴, 7-이소퀴놀릴, 8-이소퀴놀릴), 퓨릴, 프테리디닐 (예컨대, 2-프테리디닐, 4-프테리디닐, 6-프테리디닐, 7-프테리디닐), 카바졸릴, 페난쓰리디닐, 아크리디닐 (예컨대, 1-아크리디닐, 2-아크리디닐, 3-아크리디닐, 4-아크리디닐, 9-아크리디닐), 인돌릴 (예컨대, 1-인돌릴, 2-인돌릴, 3-인돌릴, 4-인돌릴, 5-인돌릴, 6-인돌릴, 7-인돌릴), 이소인돌릴, 페난지닐 (예컨대, 1-페난지닐, 2-페난지닐), 및 페노티아지닐 (예컨대, 1-페노티아지닐, 2-페노티아지닐, 3-페노티아지닐, 4-페노티아지닐)이 포함된다.
본 발명에서, 용어 "사이클로알킬"은, 예를 들어, 사이클릭 포화된 탄화수소 그룹을 지칭하고, 사이클로알킬 내 탄소 원자의 수는, 예를 들어, 3 내지 15개이다. 사이클로알킬의 예시에는 사이클로프로필, 사이클로부틸, 사이클로펜틸, 사이클로헥실, 사이클로헵틸, 사이클로옥틸, 브릿지된 (bridged) 사이클릭 탄화수소 그룹, 및 스피로 (spiro) 탄화수소 그룹이 포함된다. 이들 중에서, 사이클로프로필, 사이클로부틸, 사이클로펜틸, 사이클로헥실, 브릿지된 사이클릭 탄화소수 등이 바람직하다.
본 발명에서, "브릿지된 사이클릭 탄화수소 그룹"의 예시에는 비사이클로[2.1.0]펜틸, 비사이클로[2.2.1]헵틸, 비사이클로[2.2.2]옥틸, 및 비사이클로[3.2.1]옥틸, 트리사이클로[2.2.1.0]헵틸, 비사이클로[3.3.1]노난, 1-아다만틸, 및 2-아다만틸이 포함된다.
본 발명에서, "스피로 탄화수소 그룹"의 예시에는 스피로[3.4]옥틸이 포함된다.
본 발명에서, 용어 "사이클로알케닐"은, 예를 들어, 불포화 사이클릭 지방족 탄화수소 그룹을 포함하고, 사이클로알케닐 내 탄소 원자의 수는, 예를 들어, 3 내지 7개이다. 사이클로알케닐 그룹의 예시에는 사이클로프로페닐, 사이클로부테닐, 사이클로펜테닐, 사이클로헥세닐, 및 사이클로헵테닐이 포함된다. 이들 중에서, 사이클로프로페닐, 사이클로부테닐, 사이클로펜테닐, 사이클로헥세닐 등이 바람직하다. 용어 "사이클로알케닐"은 또한, 예를 들어, 그들의 고리에 불포화 결합을 갖는 브릿지된 사이클릭 탄화수소 그룹 및 스피로 탄화수소 그룹을 포함한다.
본 발명에서, "아릴알킬"의 예시에는 벤질, 2-펜에틸, 및 나프탈레닐메틸이 포함된다. "사이클로알킬알킬" 및 "사이클릴알킬"의 예시에는 사이클로헥실메틸 및 아다만틸메틸이 포함된다. "히드록시알킬"의 예시에는 히드록시메틸 및 2-히드록시에틸이 포함된다.
본 발명에서, "알콕시"는 상기에 기술된 임의의 알킬 및 산소 (알킬-O- 그룹)로 구성된 그룹을 포함하고, 예를 들어, 이의 예시에는 메톡시, 에톡시, n-프로폭시, 이소프로폭시, 및 n-부톡시가 포함된다. "알콕시알킬"의 예시에는 메톡시메틸이 포함된다. "아미노알킬"의 예시에는 2-아미노에틸이 포함된다.
본 발명에서, "헤테로사이클릴"의 예시에는 1-피롤리닐, 2-피롤리닐, 3-피롤리닐, 1-피롤리디닐, 2-피롤리디닐, 3-피롤리디닐, 피롤리디논, 1-이미다졸리닐, 2-이미다졸리닐, 4-이미다졸리닐, 1-이미다졸리디닐, 2-이미다졸리디닐, 4-이미다졸리디닐, 이미다졸리디논, 1-피라졸리닐, 3-피라졸리닐, 4-피라졸리닐, 1-피라졸리디닐, 3-피라졸리디닐, 4-피라졸리디닐, 피페리디논, 피페리디노, 2-피페리디닐, 3-피페리디닐, 4-피페리디닐, 1-피페라지닐, 2-피페라지닐, 피페라지논, 2-모르폴리닐, 3-모르폴리닐, 모르폴리노, 테트라히드로피라닐, 및 테트라히드로퓨라닐이 포함된다.
본 발명에서, "헤테로사이클릴알킬"의 예시에는 피페리디닐메틸 및 피페라지닐메틸이 포함된다. "헤테로사이클릴알케닐"의 예시에는 2-피페리디닐 에테닐이 포함된다. "헤테로아릴알킬"에는 피리딜메틸 및 퀴놀린-3-일메틸이 포함된다.
본 발명에서, 용어 "실릴"은 식 R3Si-로 표시되는 그룹을 포함하는데, 여기서 R은 독립적으로 상기에 기술된 알킬, 아릴, 및 사이클로알킬로부터 선택될 수 있다. 실릴의 예시에는 트리메틸실릴 그룹 및 터트-부틸디메틸실릴 그룹이 포함된다. "실릴옥시"의 예시에는 트리메틸실릴옥시 그룹이 포함된다. "실릴옥시알킬"의 예시에는 트리메틸실릴옥시메틸이 포함된다.
본 발명에서, "알킬렌"의 예시에는 메틸렌, 에틸렌, 및 프로필렌이 포함된다.
본 발명에서, 상기에 기술된 다양한 그룹은 치환될 수 있다. 치환기의 예시에는 히드록시, 카르복시, 설포, 할로겐, 알킬 할라이드 (할로알킬, 예컨대, CF3, CH2CF3, CH2CCl3), 니트로, 니트로소, 시아노, 알킬 (예컨대, 메틸, 에틸, 이소프로필, 터트-부틸), 알케닐 (예컨대, 비닐), 알키닐 (예컨대, 에티닐), 사이클로알킬 (예컨대, 사이클로프로필, 아다만틸), 사이클로알킬알킬 (예컨대, 사이클로헥실메틸, 아다만틸메틸), 사이클로알케닐 (예컨대, 사이클로프로페닐), 사이클릴알킬, 히드록시알킬 (예컨대, 히드록시메틸, 히드록시에틸), 알콕시알킬 (예컨대, 메톡시메틸, 에톡시메틸, 에톡시에틸), 아릴 (예컨대, 페닐, 나프틸), 아릴알킬 (예컨대, 벤질, 펜에틸), 알킬아릴 (예컨대, p-메틸페닐), 헤테로아릴 (예컨대, 피리딜, 퓨릴), 헤테로아릴알킬 (예컨대, 피리딜메틸), 헤테로사이클릴 (예컨대, 피페리딜), 헤테로사이클릴알케닐, 헤테로사이클릴알킬 (예컨대, 모르폴릴메틸), 알콕시 (예컨대, 메톡시, 에톡시, 프로폭시, 부톡시), 할로겐화 알콕시 (예컨대, OCF3), 알케닐옥시 (예컨대, 비닐옥시, 알릴옥시), 아릴옥시 (예컨대, 페닐옥시), 알킬옥시카르보닐 (예컨대, 메톡시카르보닐, 에톡시카르보닐, 터트-부톡시카르보닐), 아릴알킬옥시 (예컨대, 벤질옥시), 아미노 [알킬아미노 (예컨대, 메틸아미노, 에틸아미노, 디메틸아미노), 아실아미노 (예컨대, 아세틸아미노, 벤조일아미노), 아릴알킬아미노 (예컨대, 벤질아미노, 트리틸아미노), 히드록시아미노], 아미노알킬 (예컨대, 아미노메틸), 알킬아미노알킬 (예컨대, 디에틸아미노메틸), 카바모일, 설파모일, 옥소, 실릴, 실릴옥시알킬 등이 포함된다.
대안적으로, 본 발명의 인공 sgRNA에서, 상기에 언급한 링커 영역 (Xa)은 하기 식 (III-1) 내지 (III-3) 중 어느 하나로 표시된다. 각각의 식에서, n 및 m은 상기에 언급한 화학식 (I)에서와 동일하다:
Figure 112018082822241-pct00027
.
상기에 언급한 화학식 (III-1) 내지 (III-3)에서, n 및 m은 특별히 제한되지 않으며, 상기에 기술된 바와 같다. 이의 특별한 예시에는 상기에 언급한 화학식 (III-1)에서 n=5 및 m=4이고 (하기에 기술된 실시예에서 F), 상기에 언급한 화학식 (III-2)에서 n=5 및 m=4이고 (하기에 기술된 실시예에서 L), 상기에 언급한 화학식 (III-3)에서 n=5 및 m=4인 것 (하기에 기술된 실시예에서 E)이 포함된다.
이의 구조는 하기 화학식 (III-1a), (III-2a) 및 (III-3a)에 의해 표시된다.
Figure 112018082822241-pct00028
본 발명의 인공 sgRNA에서, (1) 스템-루프 2의 루프 부분 (GAAA) 및/또는 (2) 천연형 sgRNA의 링커 영역 (UUAUC)은 상기에 언급한 아미노산 유도체 링커 (Xa)에 추가로 상기에 언급한 식 (I)의 아미노산 유도체 링커 (Xb, Y)로 치환될 수 있다. 대안적으로/이에 덧붙여, 상기에 언급한 식 (I)의 아미노산 유도체 링커 (Xc, Xd)는 천연형 sgRNA의 (3) 5'-말단 및/또는 (4) 3'-말단 부근에 부가 및/또는 삽입될 수 있다.
Figure 112018082822241-pct00029
아미노산 유도체 링커 Xb, Y, Xc 및 Xd는 각각 독립적으로, 상기에 언급한 식 (I)로 표시되는 임의의 아미노산 유도체일 수 있다. 예를 들어, 상기에 언급한 Xb와 같이, 상기에 언급한 식 (II)로 표시되는 프롤린 유도체 링커가 바람직하고, 상기에 언급한 식 (II-8) (여기서 n=5이고 m=4임)로 표시되는 프롤린 유도체 링커 (P)가 더욱 바람직하다.
대안적으로, 상기에 언급한 Xb와 같이, 상기에 언급한 식 (I-1) (여기서 n=5이고 m=4임)로 표시되는 글리신 유도체 링커 (Gly), 상기에 언급한 식 (I-4) (여기서 n=5이고 m=4임)로 표시되는 글리실글리신 유도체 링커 (GlyGly), 상기에 언급한 식 (I-6) (여기서 n=4이고 m=4임)으로 표시되는 테레프탈산 유도체 링커 (TP), 상기에 언급한 식 (I-7) (여기서 n=5이고 m=4임)로 표시되는 리신 유도체 링커 (K), (III-1) (여기서 n=5이고 m=4임)로 표시되는 페닐알라닌 유도체 링커 (F), 상기에 언급한 식 (III-2) (여기서 n=5이고 m=4임)로 표시되는 류신 유도체 링커 (L), 및 상기에 언급한 식 (III-3) (여기서 n=5이고 m=4임)로 표시되는 글루탐산 유도체 링커 (E)가 또한 바람직하다.
상기에 언급한 Y와 같이, 상기에 언급한 식 (I-4)로 표시되는 글리실글리신 유도체 링커 및 상기에 언급한 식 (II)로 표시되는 프롤린 유도체 링커가 바람직하고, 상기에 언급한 식 (I-4) (여기서 n=5이고 m=4임)로 표시되는 글리실글리신 유도체 링커 (GlyGly) 및 상기에 언급한 식 (II-8) (여기서 n=5이고 m=4임 (P), n=7이고 m=6임 (P13), n=9이고 m=8임 (P14), 또는 n=11이고 m=10임 (P15))으로 표시되는 프롤린 유도체 링커가 더욱 바람직하다.
대안적으로, 상기에 언급한 Y와 같이, 상기에 언급한 식 (I-1) (여기서 n=5이고 m=4임)로 표시되는 글리신 유도체 링커 (Gly), 상기에 언급한 식 (I-6) (여기서 n=4이고 m=4임)으로 표시되는 테레프탈산 유도체 링커 (TP), 상기에 언급한 식 (I-7) (여기서 n=5이고 m=4임)로 표시되는 리신 유도체 링커 (K), (III-1) (여기서 n=5이고 m=4임)로 표시되는 페닐알라닌 유도체 링커 (F), 상기에 언급한 식 (III-2) (여기서 n=5이고 m=4임)로 표시되는 류신 유도체 링커 (L), 및 상기에 언급한 식 (III-3) (여기서 n=5이고 m=4임)으로 표시되는 글루탐산 유도체 링커 (E)가 또한 바람직하다.
상기에 언급한 Xc 및 Xd와 같이, 예를 들어, 상기에 언급한 식 (II)로 표시되는 프롤린 유도체 링커가 바람직하고, 상기에 언급한 식 (II-8) (여기서 n=5이고 m=4임)로 표시되는 프롤린 유도체 링커 (P)가 더욱 바람직하다.
대안적으로, 상기에 언급한 Xc 및 Xd와 같이, 상기에 언급한 식 (I-1) (여기서 n=5이고 m=4임)로 표시되는 글리신 유도체 링커 (Gly), 상기에 언급한 식 (I-4) (여기서 n=5이고 m=4임)로 표시되는 글리실글리신 유도체 링커 (GlyGly), 상기에 언급한 식 (I-6) (여기서 n=4이고 m=4임)으로 표시되는 테레프탈산 유도체 링커 (TP), 상기에 언급한 식 (I-7) (여기서 n=5이고 m=4임)로 표시되는 리신 유도체 링커 (K), (III-1) (여기서 n=5이고 m=4임)로 표시되는 페닐알라닌 유도체 링커 (F), 상기에 언급한 식 (III-2) (여기서 n=5이고 m=4임)로 표시되는 류신 유도체 링커 (L), 및 상기에 언급한 식 (III-3) (여기서 n=5이고 m=4임)으로 표시되는 글루탐산 유도체 링커 (E)가 또한 바람직하다.
바람직한 일 실시양태에서, 본 발명의 인공 sgRNA는 천연형 sgRNA의 테트라루프 부분만을 상기에 언급한 아미노산 유도체 링커 (Xa)로 치환함으로써 수득될 수 있다. 즉, 하기 식 (A)에서, Xb 및 Y는 1 내지 5개의 임의의 뉴클레오티드 잔기로 이루어진 뉴클레오티드 링커를 나타내고 Xc 및 Xd는 부존재한다:
Figure 112018082822241-pct00030
.
Xb 및 Y는 각각 천연형 sgRNA의 스템-루프 2의 루프 부분 (GAAA) 및 링커 영역으로 잔존할 수 있고, 또는 천연형 sgRNA 내 스템-루프 2 및 링커 영역의 구조가 유지되는 한 다른 뉴클레오티드 링커로 또한 대체될 수 있다. 예를 들어, 상기에 언급한 Y가 UUAUC에서 U 단독으로 치환된 경우에도 동등하거나 더 높은 DSB 활성을 얻을 수 있음이 보고되었다.
본 발명의 인공 sgRNA의 다른 바람직한 실시양태에서, 천연형 sgRNA 내 테트라루프 부분 이외에 스템-루프 2의 루프 부분 (GAAA)이 상기에 언급한 아미노산 유도체 링커, 바람직하게는, 상기에 언급한 식 (II)로 표시되는 프롤린 유도체 링커, 더욱 바람직하게는, 상기에 언급한 식 (II-8) (여기서 n=5이고 m=4임)로 표시되는 프롤린 유도체 링커 (P)로 치환된다.
대안적으로, 스템-루프 2의 루프 부분 (GAAA)이 상기에 언급한 식 (I-1) (여기서 n=5이고 m=4임)로 표시되는 글리신 유도체 링커 (Gly), 상기에 언급한 식 (I-4) (여기서 n=5이고 m=4임)로 표시되는 글리실글리신 유도체 링커 (GlyGly), 상기에 언급한 식 (I-6) (여기서 n=4이고 m=4임)으로 표시되는 테레프탈산 유도체 링커 (TP), 상기에 언급한 식 (I-7) (여기서 n=5이고 m=4임)로 표시되는 리신 유도체 링커 (K), (III-1) (여기서 n=5이고 m=4임)로 표시되는 페닐알라닌 유도체 링커 (F), 상기에 언급한 식 (III-2) (여기서 n=5이고 m=4임)로 표시되는 류신 유도체 링커 (L), 및 상기에 언급한 식 (III-3) (여기서 n=5이고 m=4임)으로 표시되는 글루탐산 유도체 링커 (E)로 치환된 인공 sgRNA이 또한 바람직하다.
천연형 sgRNA의 테트라루프 부분 이외에 스템-루프 2의 루프 부분 (GAAA)이 상기에 언급한 아미노산 유도체 링커로 치환된 본 발명의 인공 sgRNA는 생체 내 안정성 향상 효과로 인해 더 우수한 것으로 생각된다. 세포 내에서 천연형 sgRNA와 같거나 그보다 더 높은 DNA 절단 활성을 유지하기 때문에 이는 또한 생체 내 게놈 편집을 위한 도구로 특히 유용하다.
본 발명의 인공 sgRNA의 또 다른 바람직한 실시양태에서, 천연형 sgRNA 내 스템-루프 2의 링커 영역 (UUAUC) 뿐만 아니라 테트라루프 부분 및 루프 부분 (GAAA)은 상기에 언급한 아미노산 유도체 링커, 바람직하게는, 상기에 언급한 식 (I-4)로 표시되는 글리실글리신 유도체 링커 및 상기에 언급한 식 (II)로 표시되는 프롤린 유도체 링커, 더욱 바람직하게는, 상기에 언급한 식 (I-4) (여기서 n=5이고 m=4임)로 표시되는 글리실글리신 유도체 링커 (GlyGly) 및 상기에 언급한 식 (II-8) (여기서 n=5이고 m=4임 (P), n=7이고 m=6임 (P13), n=9이고 m=8임 (P14), 또는 n=11이고 m=10임 (P15))로 표시되는 프롤린 유도체 링커로 치환된다.
대안적으로, 링커 영역 (UUAUC)이 상기에 언급한 식 (I-1) (여기서 n=5이고 m=4임)로 표시되는 글리신 유도체 링커 (Gly), 상기에 언급한 식 (I-4) (여기서 n=5이고 m=4임)로 표시되는 글리실글리신 유도체 링커 (GlyGly), 상기에 언급한 식 (I-6) (여기서 n=4이고 m=4임)으로 표시되는 테레프탈산 유도체 링커 (TP), 상기에 언급한 식 (I-7) (여기서 n=5이고 m=4임)로 표시되는 리신 유도체 링커 (K), (III-1) (여기서 n=5이고 m=4임)로 표시되는 페닐알라닌 유도체 링커 (F), 상기에 언급한 식 (III-2) (여기서 n=5이고 m=4임)로 표시되는 류신 유도체 링커 (L), 및 상기에 언급한 식 (III-3) (여기서 n=5이고 m=4임)으로 표시되는 글루탐산 유도체 링커 (E)로 치환된 인공 sgRNA가 또한 바람직하다.
그러나, Cas9와 조합되는 경우의 세포 내 DNA 절단 활성을 고려할 때, 본 발명의 인공 sgRNA는 경우에 따라 상기에 언급한 식 (A)에서 Xa, Xb 및 Y의 아미노산 유도체 링커로의 동시 치환이 없는 것이 바람직할 수 있다.
본 발명의 인공 sgRNA의 또 다른 바람직한 실시양태에서, 상기에 언급한 아미노산 유도체 링커, 바람직하게는, 상기에 언급한 식 (II)로 표시되는 프롤린 유도체 링커, 더욱 바람직하게는, 상기에 언급한 식 (II-8) (여기서 n=5이고 m=4임)로 표시되는 프롤린 유도체 링커 (P)는 천연형 sgRNA 내 테트라루프 부분 이외에 5'-말단 및 3'-말단의 부근에 부가되고 그에 삽입된다.
대안적으로, 상기에 언급한 식 (I-1) (여기서 n=5이고 m=4임)로 표시되는 글리신 유도체 링커 (Gly), 상기에 언급한 식 (I-4) (여기서 n=5이고 m=4임)로 표시되는 글리실글리신 유도체 링커 (GlyGly), 상기에 언급한 식 (I-6) (여기서 n=4이고 m=4임)으로 표시되는 테레프탈산 유도체 링커 (TP), 상기에 언급한 식 (I-7) (여기서 n=5이고 m=4임)로 표시되는 리신 유도체 링커 (K), (III-1) (여기서 n=5이고 m=4임)로 표시되는 페닐알라닌 유도체 링커 (F), 상기에 언급한 식 (III-2) (여기서 n=5이고 m=4임)로 표시되는 류신 유도체 링커 (L), 및 상기에 언급한 식 (III-3) (여기서 n=5이고 m=4임)으로 표시되는 글루탐산 유도체 링커 (E)가 각각 5'-말단 및 3'-말단 부근에 부가되고 그에 삽입된 인공 sgRNA가 또한 바람직하다.
상기에 언급한 아미노산 유도체 링커, 바람직하게는, 상기에 언급한 식 (II)로 표시되는 프롤린 유도체 링커, 더욱 바람직하게는, 상기에 언급한 식 (II-8) (여기서 n=5이고 m=4임)로 표시되는 프롤린 유도체 링커 (P)가 천연형 sgRNA의 테트라루프 부분 이외에 5'-말단 및 3'-말단의 부근 각각에 부가되고 그에 삽입된 본 발명의 인공 sgRNA가 생체 내 안전성의 향상 및 증강된 선천적 면역 반응으로 인한 부작용 감소 효과로 인해 더 우수한 것으로 생각된다. 세포 내에서 천연형 sgRNA와 같거나 그보다 더 높은 DNA 절단 활성을 유지하기 때문에 이는 또한 생체 내 게놈 편집을 위한 도구로 특히 유용하다.
상기에 언급한 바와 같이, 2개 이상의 아미노산 유도체 링커가 도입된 상기에 언급한 인공 sgRNA 중 어느 하나는, Cas9와 조합되는 경우 아미노산 유도체 링커가 Xa에만 도입된 인공 sgRNA와 유사한, 세포 내에서 천연형 sgRNA와 같거나 더 높은 표적 이중-가닥 DNA 절단 활성을 가질 수 있다. 2개 이상의 아미노산 유도체 링커의 도입은 sgRNA의 뉴클리아제 내성을 더욱 증강시키고 생체 내 안정성을 향상시킬 수 있다. 생체 내 안정성 향상 효과는, 예를 들어, 혈청 및/또는 뉴클리아제에 대한 시험관 내 내성 테스트를 수행함으로써 확인될 수 있다.
본 발명의 인공 sgRNA는 또한 상기에 언급한 식 (A)에 나타난 뉴클레오티드 서열뿐만 아니라, 1 내지 수개 (예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개) 뉴클레오티드 잔기가 치환, 결실, 삽입 또는 부가되고, Cas9와 조합하여, 천연형 sgRNA와 같거나 더 높은 표적 이중-가닥 DNA 인식능을 나타내는 상기 뉴클레오티드 서열을 포함한다. 예를 들어, 반복 영역과 항반복 영역 사이에서 왓슨-크릭 (Watson-Crick) 염기쌍 (UUUU/AAAA)의 대체, 또는 스템-루프 2 내 왓슨-크릭 염기쌍 (ACUU/UGAA)의 CGCC/GCGG로의 치환 또는 2개 염기쌍 (ACUUGA/UGAACU)의 삽입은, Cas9와 조합되는 경우, DSB 활성의 현저한 감소를 초래하지 않았고, 링커 영역 (UUAUC)의 U 단독으로의 절단은 DSB 활성을 유의미하게 증가시켰음이 보고되었다. 따라서, 본 발명의 인공 sgRNA의 작용 효과는 sgRNA의 특징적 헤어핀 구조를 유지하는 돌연변이가 상기에 언급한 식 (A)의 뉴클레오티드 서열 내로 도입되는 경우에도 발휘될 수 있다.
본 발명의 연구에 따르면, 천연형 sgRNA 내로 본 발명의 아미노산 유도체 링커의 도입 없이, tracrRNA의 3'-말단 및 추가 스템-루프 2 및 링커 영역이 결여된 절단된 sgRNA는 Cas9와 조합되는 경우 유의미하게 감소된 DSB 활성을 나타내었다. 반면, 하기에 언급된 실험예 3에 나타난 바와 같이, 천연형 sgRNA의 테트라루프뿐만 아니라 그에 인접한 스템의 1 내지 4개 염기쌍은 상기에 언급한 아미노산 유도체 링커, 바람직하게는, 상기에 언급한 식 (II)로 표시되는 프롤린 유도체 링커, 더욱 바람직하게는, 상기에 언급한 식 (II-8) (여기서 n=5이고 m=4임)로 표시되는 프롤린 유도체 링커 (P)로 치환되고, 그에 의해 심지어 절단된 sgRNA도 천연형 sgRNA보다는 낮지만 충분한 DSB 활성을 유지할 수 있다.
또한, 우수한 DSB 활성은, Cas9와 조합되는 경우, tracrRNA 내 테트라루프, 스템-루프 2 또는 링커 영역 또는 sgRNA의 양 말단의 변형 없이, tracrRNA 내 스템-루프 1 또는 스템-루프 3의 루프 부분을 상기에 언급한 아미노산 유도체 링커, 바람직하게는, 상기에 언급한 식 (II)로 표시되는 프롤린 유도체 링커, 더욱 바람직하게는, 상기에 언급한 식 (II-8) (여기서 n=5이고 m=4임)로 표시되는 프롤린 유도체 링커 (P)로 치환함으로써 유지될 수 있다.
따라서, 본 발명은 또한 하기 인공 sgRNA를 제공한다.
(a) 상기에 언급한 식 (A)로 표시되는 sgRNA,
(i) 여기서 Xa는 상기에 언급한 식 (II-8) (여기서 n=5이고 m=4임)로 표시되고, Xa에 인접한 스템의 1 내지 3개 염기쌍은 결실되고/되거나,
(ii) 여기서 Xb는 상기에 언급한 식 (II-8) (여기서 n=5이고 m=4임)로 표시되고, Xb에 인접한 스템의 1 내지 4개 염기쌍은 결실됨;
(b) 상기에 언급한 식 (A)로 표시되는 sgRNA, 여기서 Xa, Xb 및 Y는 1 내지 5개의 임의의 뉴클레오티드 링커이고, Xc 및 Xd는 부존재하고, 스템-루프 1의 루프 부분 (UA) 또는 스템-루프 3의 루프 부분 (AGU)은 상기에 언급한 식 (II-8) (여기서 n=5이고 m=4임)로 표시되는 아미노산 유도체 링커로 치환됨.
본 발명의 인공 sgRNA를 구성하는 뉴클레오티드 잔기는, 그의 구성성분으로서, 당, 염기, 및 포스페이트를 포함한다. 뉴클레오티드 잔기는, 예를 들어, 상기에 기술된 바와 같은, 리보뉴클레오티드 잔기 또는 데옥시리보뉴클레오티드 잔기일 수 있다. 리보뉴클레오티드 잔기는, 예를 들어, 당과 같은 리보스 잔기; 및 염기로서 아데닌 (A), 구아닌 (G), 시스테인 (C), 또는 우라실 (U)을 갖는다. 데옥시리보스 잔기는, 예를 들어, 당으로서 데옥시리보스 잔기; 및 염기로서 아데닌 (A), 구아닌 (G), 시스테인 (C), 또는 티민 (T)을 갖는다.
상기에 언급한 뉴클레오티드 잔기는, 예를 들어, 비변형된 뉴클레오티드 잔기 또는 변형된 뉴클레오티드 잔기일 수 있다. 비변형된 뉴클레오티드 잔기의 구성성분은, 예를 들어, 자연 발생적인 뉴클레오티드 잔기의 구성성분과 동일하거나 실질적으로 동일하다. 바람직하게는, 구성성분은 인체 내에서 자연적으로 발생하는 뉴클레오티드 잔기의 구성성분과 동일하거나 실질적으로 동일하다.
변형된 뉴클레오티드 잔기는, 예를 들어, 비변형된 뉴클레오티드 잔기의 변형에 의해 수득된 뉴클레오티드 잔기이다. 변형된 뉴클레오티드 잔기는, 예를 들어, 비변형된 뉴클레오티드 잔기의 임의의 구성성분이 변형되도록 하는 것일 수 있다. 본 발명에서, "변형"은, 예를 들어, 임의의 구성성분의 치환, 부가 및/또는 결실; 및 구성성분(들) 내 원자(들) 및/또는 관능기(들)의 치환, 부가, 및/또는 결실을 의미한다. 이는 또한 "변형"으로서 지칭될 수 있다. 변형된 뉴클레오티드 잔기의 예시에는 자연 발생적인 뉴클레오티드 잔기 및 인공적으로 변형된 뉴클레오티드 잔기를 포함한다. 자연적으로 유래된 변형된 뉴클레오티드 잔기와 관련하여, 예를 들어, 문헌 [Limbach et al. (1994, Summary: the modified nucleosides of RNA, Nucleic Acids Res. 22: pp. 2183 to 2196)]이 인용될 수 있다. 변형된 뉴클레오티드 잔기는, 예를 들어, 뉴클레오티드 잔기의 대체물의 잔기일 수 있다.
뉴클레오티드 잔기의 변형의 예시에는 리보스-포스페이트 골격의 변형을 포함한다 (이후에는 "리보포스페이트 골격"으로 지칭됨).
리보포스페이트 골격에서, 예를 들어, 리보스 잔기는 변형될 수 있다. 리보스 잔기에서, 2'-위치의 탄소가 변형될 수 있다. 구체적으로, 2'-위치의 탄소에 결합된 히드록실 그룹은, 예를 들어, 수소, 플루오로 등으로 치환될 수 있다. 2'-위치의 탄소에 결합된 히드록실 그룹을 수소로 치환함으로써, 리보스 잔기를 데옥시리보스 잔기로 치환할 수 있다. 리보스 잔기는, 예를 들어, 입체이성질체로 치환될 수 있고, 예를 들어, 아라비노스 잔기로 치환될 수 있다.
리보포스페이트 골격은 골격, 예를 들어, 비-리보스 잔기 및/또는 비-포스페이트를 갖는 비-리보포스페이트 골격으로 치환될 수 있다. 비-리보포스페이트 골격은, 예를 들어, 비하전되도록 변형된 리보포스페이트 골격 등일 수 있다. 뉴클레오티드 잔기에서 리보포스페이트 골격을 비-리보포스페이트 골격으로 치환하여 수득된 대체물의 예시에는 모르폴리노, 사이클로부틸, 및 피롤리딘이 포함된다. 대체물의 다른 예시는 인공 핵산 단량체 잔기를 포함한다. 이의 특정 예시에는 PNA (Peptide Nucleic Acid), LNA (Locked Nucleic Acid), 및 ENA (2'-O,4'-C-Ethylenebridged Nucleic Acids)가 포함된다. 이들 중에서, PNA가 바람직하다.
리보포스페이트 골격에서, 예를 들어, 포스페이트 그룹이 변형될 수 있다. 리보포스페이트 골격에서, 당 잔기에 가장 근접한 포스페이트 그룹은 "α-포스페이트 그룹"으로 불린다. α-포스페이트 그룹은 음으로 하전되고, 전하는 당 잔기에 연결되지 않은 2개의 산소 원자 위에 고르게 분포된다. α-포스페이트 그룹 내 4개의 산소 원자 중에서, 뉴클레오티드 잔기들 사이의 포스포디에스테르 연결에서 당 잔기에 연결되지 않은 2개의 산소 원자는 이후에 "비-연결 산소"로 언급된다. 한편, 뉴클레오티드 잔기들 사이의 포스포디에스테르 연결에서 당 잔기에 연결된 2개의 산소 원자는 이후에 "연결 산소"로 언급된다. α-포스페이트 그룹은 바람직하게는 비하전되도록, 또는 예를 들어, 비-연결 원자 사이의 전하 분포가 비대칭이 되도록 변형된다.
포스페이트 그룹에서, 예를 들어, 비-연결 산소(들)이 치환될 수 있다. 산소(들)은 S (황), Se (셀레늄), B (붕소), C (탄소), H (수소), N (질소), 및 OR (R은, 예를 들어, 알킬 그룹 또는 아릴 그룹임)로부터 선택된 임의의 원자로 치환될 수 있고, 예를 들어, S로의 치환이 바람직하다. 비-연결 산소 둘 다가 치환되는 것이 바람직하고, 예를 들어, 비-연결 산소 둘 다가 S로 치환되는 것이 더욱 바람직하다. 그렇게 변형된 포스페이트 그룹의 예시에는 포스포로티오에이트, 포스포로디티오에이트, 포스포로셀레네이트, 보라노 포스페이트, 보라노 포스페이트, 수소 포스포노에이트, 포스포로아미데이트, 알킬 또는 아릴 포스포노에이트, 및 포스포트리에스테르가 포함된다. 특히, 2개의 비-연결 산소 둘 다가 S로 치환된 포스포로디티오에이트가 바람직하다.
포스페이트 그룹에서, 예를 들어, 연결 산소(들)이 치환될 수 있다. 산소(들)은, 예를 들어, S (황), C (탄소), 및 N (질소)로부터 선택된 임의의 원자로 치환될 수 있다. 그렇게 변형된 포스페이트 그룹의 예시에는: N으로의 치환으로부터 생성된 브릿지된 포스포로아미데이트; 치환 S로부터 생성된 브릿지된 포스포로티오에이트; 및 치환 C로부터 생성된 브릿지된 메틸렌포스포노에이트가 포함된다. 바람직하게는, 연결 산소(들)의 치환은, 예를 들어, 본 발명의 인공 sgRNA의 5' 말단 뉴클레오티드 잔기 및 3' 말단 뉴클레오티드 잔기의 적어도 하나에서 수행된다. 치환이 5' 측면에서 수행되는 경우, C로의 치환이 바람직하다. 치환이 3' 측면에서 수행되는 경우, N으로의 치환이 바람직하다.
포스페이트 그룹은, 예를 들어, 포스페이트-무함유 링커로 치환될 수 있다. 링커는 실록산, 카르보네이트, 카르복시메틸, 카바메이트, 아미드, 티오에테르, 에틸렌 옥사이드 링커, 설포네이트, 설폰아미드, 티오포마세탈 (thioformacetal), 포마세탈, 옥심, 메틸렌이미노, 메틸렌메틸이미노, 메틸렌히드라조, 메틸렌디메틸히드라조, 메틸렌옥시메틸이미노 등을 함유할 수 있다. 바람직하게는, 링커는 메틸렌 카르보닐 아미노 그룹 및 메틸렌메틸이미노 그룹을 함유할 수 있다.
본 발명의 인공 sgRNA에서, 예를 들어, 3' 말단에서의 뉴클레오티드 잔기 및 5' 말단에서의 뉴클레오티드 잔기 중 적어도 하나가 변형될 수 있다. 3' 말단 및 5' 말단 중 어느 하나에서의 뉴클레오티드 잔기가 변형될 수 있고, 또는, 예를 들어, 3' 말단 및 5' 말단 둘 다에서의 뉴클레오티드 잔기가 변형될 수 있다. 변형은 상기에 기술된 바와 같을 수 있고, 예를 들어, 상기 말단(들)에서 포스페이트 그룹(들)을 변형하는 것이 바람직하다. 예를 들어, 전체 포스페이트 그룹이 변형될 수 있고, 또는 포스페이트 그룹 내 하나 이상의 원자가 변형될 수 있다. 전자의 경우에, 전체 포스페이트 그룹이 치환되거나 결실될 수 있다.
말단(들)에서 뉴클레오티드 잔기(들)의 변형은, 예를 들어, 임의의 다른 분자의 부가 등일 수 있다. 다른 분자의 예시에는 상기에 기술된 바와 같은 표지 물질과 같은 기능성 분자 및 보호기가 포함된다. 보호기의 예시에는 S (황), Si (실리콘), B (붕소), 및 에스테르-함유 그룹이 포함된다.
다른 분자가, 예를 들어, 뉴클레오티드 잔기의 포스페이트 그룹에 부가될 수 있고, 또는 포스페이트 그룹 또는 당 잔기에 스페이서를 통해 부가될 수 있다. 스페이서의 말단 원자는, 예를 들어, 포스페이트 그룹의 연결 산소, 또는 당 잔기의 O, N, S 또는 C 중 어느 하나에 부가되거나 그로 치환될 수 있다. 당 잔기 내 결합 부위는 바람직하게는, 예를 들어, 3'-위치에서 C, 5'-위치에서 C, 또는 그에 결합된 임의의 원자이다. 스페이서는 또한, 예를 들어, PNA와 같은 뉴클레오티드 대체물의 말단 원자에 부가되거나 치환될 수 있다.
스페이서는 특별히 제한되지 않으며, 이의 예시에는 -(CH2)n-, -(CH2)nN-, -(CH2)nO-, -(CH2)nS-, O(CH2CH2O)nCH2CH2OH, 어베이직 (abasic) 당, 아미드, 카르복시, 아민, 옥시아민, 옥시이민, 티오에테르, 디설파이드, 티오우레아, 설폰아미드, 및 모르폴리노가 포함되고, 또한 비오틴 시약 및 플루오레세인 시약이 포함된다. 상기 식에서, n은 양의 정수이고, n = 3 또는 6이 바람직하다.
말단에 부가되는 분자의 다른 예시에는 염료, 인터칼레이팅 제제 (예컨대, 아크리딘), 가교결합제 (예컨대, 소랄렌 (psoralen), 미토마이신 C), 포르피린 (TPPC4, 텍사피린, 사피린), 다환 방향족 탄화수소 (예컨대, 페나진, 디히드로페나진), 인공 엔도뉴클리아제 (예컨대, EDTA), 친지방성 담체 (예컨대, 콜레스테롤, 콜산, 아다만탄 아세트산, 1-피렌 부티르산, 디히드로테스토스테론, 1,3-비스-O (헥사데실)글리세롤, 제나릴옥시헥실 그룹, 헥사데실글리세롤, 보르네올, 멘톨, 1,3-프로판디올, 헵타데실 그룹, 팔미트산, 미리스트산, O3-(올레오일)리토콜산, O3-(올레오일)콜산, 디메톡시트리틸, 또는 페녹사진), 펩티드 복합체 (예컨대, 안테나페디아 (Antennapedia) 펩티드, Tat 펩티드), 알킬화제, 포스페이트, 아미노, 머캅토, PEG (예컨대, PEG-40K), MPEG, [MPEG]2, 폴리아미노, 알킬, 치환된 알킬, 방사선표지 마커, 효소, 합텐 (예컨대, 비오틴), 수송체/흡수 촉진제 (예컨대, 아스피린, 비타민 E, 엽산), 및 합성 리보뉴클리아제 (예컨대, 이미다졸, 비스이미다졸, 히스타민, 이미다졸 클러스터, 아크리딘-이미다졸 복합체, 테트라아자마크로사이클의 Eu3 + 복합체)가 포함된다.
본 발명의 인공 sgRNA에서, 예를 들어, 5' 말단은 포스페이트 그룹 또는 포스페이트 그룹 유사체로 변형될 수 있다. 포스페이트 그룹의 예시에는 다음이 포함된다: 5'-모노포스페이트((HO)2(O)P-O-5'); 5'-디포스페이트((HO)2(O)P-O-P(HO)(O)-O-5'); 5'-트리포스페이트(HO)2(O)P-O-(HO)(O)P-O-P(HO)(O)-O-5');
5'-구아노신 캡 (7-메틸화 또는 비-메틸화, 7m-G-O-5'-(HO)(O)P-O-(HO)(O)P-O-P(HO)(O)-O-5');
5'-아데노신 캡 (Appp);
임의의 변형 또는 비변형된 뉴클레오티드 캡 구조 (N-O-5'-(HO)(O)P-O-(HO)(O)P-O-P(HO)(O)-O-5');
5'-모노티오포스페이트 (포스포로티오에이트: (HO)2(S)P-O-5');
5'-모노디티오포스페이트 (포스포로디티오에이트: (HO)(HS)(S)P-O-5');
5'-포스포로티올레이트 ((HO)2(O)P-S-5');
황 치환된 모노포스페이트, 디포스페이트, 및 트리포스페이트 (예컨대, 5'-α- 티오트리포스페이트, 5'-γ- 티오트리포스페이트 등);
5'-포스포로아미데이트 ((HO)2(O)P-NH-5', (HO)(NH2)(O)P-O-5');
5'-알킬포스포노에이트 (예컨대, RP(OH)(O)-O-5', (OH)2(O)P-5'-CH2, 여기서 R은 알킬임 (예컨대, 메틸, 에틸, 이소프로필, 프로필 등)); 및
5'-알킬에테르포스포노에이트 (예컨대, RP(OH)(O)-O-5', 여기서 R은 알킬에테르임 (예컨대, 메톡시메틸, 에톡시메틸 등)).
뉴클레오티드 잔기에서, 염기는 특별히 제한되지 않는다. 염기는, 예를 들어, 천연 염기 또는 비-천연 염기일 수 있다. 염기는, 예를 들어, 자연-유래된 염기 또는 합성 염기일 수 있다. 염기로서, 예를 들어, 통상의 (보편적인) 염기, 이의 변형된 유사체 등이 사용될 수 있다.
염기의 예시에는: 아데닌 및 구아닌과 같은 퓨린 염기; 및 시스테인, 우라실, 및 티민과 같은 피리미딘 염기가 포함된다. 염기의 다른 예시에는 이노신, 티민, 크산틴, 히포크산틴, 노불라린 (nubularine), 이소구아니신, 및 투베르시딘 (tubercidine)이 포함된다. 염기의 예시에는 또한: 2-아미노아데닌, 6-메틸화 퓨린, 및 2-프로필화 퓨린과 같은 알킬 유도체; 5-할로우라실 및 5-할로시스테인; 5-프로피닐 우라실 및 5-프로피닐 시스테인; 6-아조 우라실, 6-아조 시스테인, 및 6-아조 티민; 5-우라실 (슈도우라실), 4-티오우라실, 5-할로우라실, 5-(2-아미노프로필)우라실, 5-아미노 알릴 우라실; 8-할로겐화, 아미네이트화 (aminated), 티올레이트화, 티오알킬레이트화, 히드록실화, 및 다른 8-치환된 퓨린; 5-트리플루오로메틸화 및 다른 5-치환된 피리미딘; 7-메틸구아닌; 5-치환된 피리미딘; 6-아자피리미딘; N-2, N-6, 및 O-6 치환된 퓨린 (2-아미노프로필아데닌 포함); 5-프로피닐우라실 및 5-프로피닐시스테인; 디히드로우라실; 3-데아자-5-아자시스테인; 2-아미노퓨린; 5-알킬우라실; 7-알킬구아닌; 5-알킬시스테인; 7-데아자아데닌; N6,N6-디메틸아데닌; 2,6-디아미노퓨린; 5-아미노-알릴-우라실; N3-메틸우라실; 치환된 1,2,4-트리아졸; 2-피리디논; 5-니트로인돌; 3-니트로피롤; 5-메톡시우라실; 우라실-5-옥시아세트산; 5-메톡시카르보닐메틸우라실; 5-메틸-2-티오우라실; 5-메톡시카르보닐메틸-2-티오우라실; 5-메틸아미노메틸-2-티오우라실; 3-(3-아미노-3-카르복시프로필)우라실; 3-메틸시스테인; 5-메틸시스테인; N4-아세틸시스테인; 2-티오시스테인; N6-메틸아데닌; N6-이소펜틸아데닌; 2-메틸티오-N6-이소펜테닐아데닌; N-메틸구아닌; 및 O-알킬화 염기가 포함된다. 퓨린 및 피리미딘의 예시에는 미국 특허 제3,687,808호, 문헌 ["Concise Encyclopedia of Polymer Science and Engineering", pp. 858 to 859, edited by Kroschwitz J. I, John Wiley & Sons, 1990, and Englisch et al, Angewandte Chemie, International Edition, 1991, vol. 30, p. 613]에 개시된 것들이 포함된다.
변형된 뉴클레오티드 잔기의 다른 예시에는 염기를 갖지 않는 것들, 즉 어베이직 리보포스페이트 골격을 갖는 것들이 포함된다. 나아가, 변형된 뉴클레오티드 잔기로서, 예를 들어, 미국 가특허 출원 제60/465,665호 (출원일: 2003년 4월 25일) 및 국제출원 제PCT/US04/07070호 (출원일: 2004년 3월 8일)에 기술된 것들이 사용될 수 있고, 이들 문헌은 참조로서 본원에 포함된다.
본 발명의 인공 sgRNA는, 예를 들어, 임의의 기능성 분자가 WO 2013/180038에 기술된 방법에 의해 아미노산 유도체 링커와 같은 비-뉴클레오티드 잔기를 통해 부가되는 변형된 형태일 수 있다.
2. 본 발명의 인공 sgRNA의 합성 방법
본 발명의 인공 sgRNA를 합성하는 방법은 특별히 제한되지 않으며, 통상적으로 알려진 방법이 이용될 수 있다. 이의 예시에는 포스포르아미다이트 방법 및 H-포스포노에이트 방법이 포함된다. 화학적 합성 방법은, 예를 들어, 상업적으로 이용가능한 자동화 핵산 합성기를 사용하여 실시될 수 있다. 화학적 합성 방법에서, 아미다이트가 일반적으로 사용된다. 아미다이트는 특별히 제한되지 않는다. 상업적으로 이용가능한 아미다이트에는 RNA 포스포르아미다이트 (2'-O-TBDMSi, 상품명, Samchully Pharm. Co., Ltd.), ACE 아미다이트, TOM 아미다이트, CEE 아미다이트, CEM 아미다이트, 및 TEM 아미다이트가 포함된다. 본 발명의 인공 sgRNA의 합성에서는, 예를 들어, 식 (I)로 표시되는 링커 영역(들)의 합성에 대해 하기에 기술되는 본 발명의 단량체를 사용하는 것이 바람직하다.
3. 본 발명의 단량체
본 발명에 따른 단량체는 하기 식 (IV)의 구조를 갖는, 핵산 합성을 위한 단량체이다:
Figure 112018082822241-pct00031
상기 식에서 X1, X2, Y1, Y2, L1, L2 및 A는 상기에 언급한 식 (I)에 대해 정의된 바와 같고, R11 및 R21은 각각 독립적으로 수소 원자, 보호기 또는 인산 보호기이다.
R11 및 R21에서, 예를 들어, 보호기는 식 (I)에 관해 상기에 기술된 바와 같다. 특히, 예를 들어, 보호기는 그룹 I로부터 선택될 수 있다. 그룹 I에는, 예를 들어, 디톡시트리틸 (DMTr) 그룹, TBDMS 그룹, ACE 그룹, TOM 그룹, CEE 그룹, CEM 그룹, TEM 그룹, 및 하기 식 (P1) 또는 (P2)로 표시되는 실릴-함유 그룹 (그룹 I)이 포함된다. 구체적으로, 보호기는 DMtr 그룹 또는 임의의 실릴-함유 그룹인 것이 바람직하다.
Figure 112018082822241-pct00032
포스페이트-보호기는, 예를 들어, 하기 식에 의해 표시될 수 있다:
-P(OR6)(NR7R8).
상기 식에서, R6은 수소 원자 또는 임의의 치환기이다. 치환기 R6은 바람직하게는 탄화수소 그룹이고, 예를 들어, 탄화수소 그룹은 전자-흡인기 (electron-withdrawing group)로 치환되거나 치환되지 않을 수 있다. 치환기 R6의 예시에는 할로겐, 할로알킬, 헤테로아릴, 히드록시알킬, 알콕시알킬, 아미노알킬, 실릴, 실릴옥시알킬, 헤테로사이클릴알케닐, 헤테로사이클릴알킬, 헤테로아릴알킬, 및 알킬, 알케닐, 알키닐, 아릴, 아릴알킬, 사이클로알킬, 사이클로알케닐, 사이클로알킬알킬, 및 사이클릴알킬과 같은 탄화수소가 포함된다. 나아가, 치환기 R6은 전자-흡인기로 치환되거나 치환되지 않을 수 있다. 치환기 R6의 구체적 예시에는 β-시아노에틸 그룹, 니트로페닐에틸 그룹, 및 메틸 그룹이 포함된다.
R7 및 R8은 각각 수소 원자 또는 임의의 치환기이고, 이들은 같거나 다를 수 있다. 치환기 R7 및 R8은 바람직하게는 각각 탄화수소 그룹이고, 탄화수소 그룹은 임의의 치환기로 치환되거나 치환되지 않을 수 있다. 탄화수소 그룹의 예시는 R6에 대한 상기 설명에서 열거된 것들과 동일하고, 탄화수소 그룹은 바람직하게는 메틸 그룹, 에틸 그룹, 또는 이소프로필 그룹이다. 이 경우에, -NR7R8의 특정 예시에는 디이소프로필아미노 그룹, 디에틸아미노 그룹, 및 에틸메틸아미노 그룹이 포함된다. 대안적으로, 치환기 R7 및 R8은 함께 (즉, 전체적으로 -NR7R8) 이들이 결합하는 질소 원자(들)과 질소-함유 고리 (예컨대, 피페리딜 그룹, 모르폴리노 그룹 등)을 형성할 수 있다.
상기에 언급한 포스페이트-보호기의 구체적인 예시로서, 예를 들어, -P(OCH2CH2CN)(N(i-Pr)2), -P(OCH3)(N(i-Pr)2) 및 기타 (그룹 II)가 언급될 수 있다. 상기 식에서, i-Pr은 이소프로필을 나타낸다.
식 (IV)에서, 예를 들어, R11 및 R21의 하나는 수소 원자 또는 보호기이고, 다른 하나는 수소 원자 또는 포스페이트-보호기이다. 예를 들어, R11이 보호기인 경우, R21은 수소 원자 또는 포스페이트-보호기인 것이 바람직하다. 구체적으로, R11이 그룹 I로부터 선택되는 경우, R21은 수소 원자이거나 그룹 II로부터 선택되는 것이 바람직하다. 또한, 예를 들어, R11이 포스페이트-보호기인 경우, R21은 수소 원자 또는 보호기인 것이 바람직하다. 구체적으로, R11 이 그룹 II로부터 선택되는 경우, R21이 수소 원자이거나 그룹 I로부터 선택되는 것이 바람직하다.
구체적으로, 본 발명의 단량체로서, 예를 들어, WO 2013/103146 및 기타에 기술된 단량체, 하기 식 (IV-1) 내지 (IV-3)으로 표시되는 단량체가 언급될 수 있다.
Figure 112018082822241-pct00033
(각각의 식에서, R11 및 R21은 상기에 언급한 식 (IV)에 대해 정의된 바와 같고, n 및 m은 각각 독립적으로 0 내지 30의 정수임.)
본 발명의 단량체는, 예를 들어, WO 2013/103146 및 기타에 기술된 방법, 또는 하기에 언급된 실시에에 기술된 방법으로 합성될 수 있다.
4. CRISPR / Cas9 시스템
본 발명은 또한 상기에 언급한 본 발명의 인공 sgRNA 및 Cas9를 조합하는 CRISPR/Cas9 시스템을 제공한다.
본 발명의 인공 sgRNA와 복합체를 형성하고 표적 이중-가닥 DNA 내 표적 뉴클레오티드 서열 및 그에 인접한 프로토-스페이서 인접 모티프 (PAM)를 인식하고 결합하는 한 본 발명에 사용되는 Cas9는 특별히 제한되지 않는다. 스트렙토코커스 피오게네스-유래 Cas9 (SpCas9; PAM 서열 NGG (N은 A, G, T 또는 C임, 이하 동일)), 본 발명의 인공 sgRNA와 복합체를 형성할 수 있는 한, 스트렙토코커스 써모필레스 (Streptococcus thermophiles)-유래 Cas9 (StCas9; PAM 서열 NNAGAAW), 네이세리아 메닝지티디스 (Neisseria meningitidis)-유래 Cas9 (MmCas9; PAM 서열 NNNNGATT) 및 기타가 바람직하게 사용될 수 있다. PAM에 의해 덜 제한되는 SpCas9가 특히 바람직하다 (이는 실질적으로 2개 염기이고 이론적으로는 게놈 상의 거의 모든 곳에 표적될 수 있음). 본 발명에 사용되는 Cas9로서, 이중-가닥 DNA의 두 가닥 모두를 절단할 수 있는 야생형 Cas9에 추가로, 한 사슬의 절단 능력의 불활성화로부터 초래된 닉케이즈 (nickase) 활성을 갖는 것이 또한 사용될 수 있다. 예를 들어, SpCas9의 경우에, 10번째 Asp 잔기가 Ala 잔기로 전환되고 sgRNA와 상보적인 가닥을 형성하는 가닥의 반대쪽에 있는 가닥의 절단 능력이 결여된 D10A 변이체, 및 840번째 His 잔기가 Ala 잔기로 전환되고 sgRNA와 상보적인 가닥을 형성하는 가닥의 절단 능력이 결여된 H840A 변이체가 언급될 수 있으나, 이들로 제한되지 않는다. 또한, 사용 목적에 따라서, 두 가닥 모두의 절단 능력이 결여된 이중 변이체 (dCas9)가 또한 사용될 수 있다. dCas9 및 nCas9를 사용하는 실시양태의 구체적인 예시에는, 이들로 제한되는 것은 아니지만, 표적 유전자의 전사를 제어하기 위한 전사 조절 인자 또는 염색질 조정자와 dCas9/nCas9의 융합 및 형광 단백질의 융합에 의한 표적 유전자좌의 시각화 (라이브 영상) 등을 포함한다.
나아가, Cpf1이 또한 Cas9 대신에 사용될 수 있다. Cpf1의 예시에는 프란시셀라 노비시다 (Francisella novicida)-유래 Cpf1 (FnCpf1; PAM 서열 NTT), 아시다미노코커스 종 (Acidaminococcus sp.)-유래 Cpf1 (AsCpf1; PAM 서열 NTTT), 라츠노스피라세아에 박테리움 (Lachnospiraceae bacterium)-유래 Cpf1 (LbCpf1; PAM 서열 NTTT) 및 기타가 포함되지만, 이들로 제한되지 않는다. Cpf1의 경우에, 하나 또는 두 가닥 모두의 절단능이 결여된 변이체를 사용하는 것이 또한 가능하다. 예를 들어, FnCpf1의 경우에, 917번째 Asp 잔기가 Ala 잔기로 전환 (D917A)되거나 1006번째 Glu 잔기가 Ala 잔기로 전환 (E1006A)되고, 두 가닥 모두의 절단능이 결여된 변이체 (dCpf1)가 사용될 수 있다.
본 발명의 CRISPR/Cas9 시스템에 사용되는 Cas9는 단백질 또는 상기 단백질을 암호화하는 mRNA의 형태일 수 있다. 대안적으로, 이는 Cas9를 암호화하는 DNA를 함유하는 발현 벡터의 형태일 수 있다. CRISPR/Cas9 시스템이 무세포 시스템의 효소 반응으로서 수행되는 경우에, Cas9는 단백질의 형태로 제공된다. 반면, 세포에서 표적 유전자의 변형을 목적으로 하는 경우, Cas9는 단백질, 상기 단백질을 암호화하는 mRNA, 및 이를 암호화하는 DNA를 함유하는 발현 벡터의 형태로 세포 내로 도입될 수 있다.
Cas9를 암호화하는 DNA는, 예를 들어, 주형으로서 상기 단백질을 생산하는 세포로부터 준비된 총 RNA 또는 mRNA 분획을 사용하는 RT-PCR에 의해 이를 증폭함으로써 클로닝될 수 있다. 변이체 Cas9는 그 자체로 공지된 부위 특이적 돌연변이화를 이용하여, DNA 절단 활성에 중요한 부위에서 아미노산 잔기 (예컨대, Cas9의 경우에, 이들로 제한되는 것은 아니지만, 10번째 Asp 잔기 및 840번째 His 잔기가 언급될 수 있음)를 다른 아미노산으로 전환하기 위해, 클로닝된 Cas9를 암호화하는 DNA 내로 돌연변이를 도입함으로써 수득될 수 있다. 대안적으로, Cas9를 암호화하는 DNA는 또한 화학 합성 또는 PCR 방법 또는 깁슨 어셈블리 (Gibson Assembly) 방법과 조합하여, 사용되는 숙주 세포에서의 발현에 적합한 코돈 사용법을 갖는 DNA로서 작제될 수 있다. 예를 들어, 진핵 세포에서 SpCas9의 발현에 최적화된 CDS 서열은 익히 공지되어 있다.
수득된 Cas9를 암호화하는 DNA는 숙주에 따라 적합한 발현 벡터의 프로모터의 하류 내에 삽입될 수 있다. 발현 벡터는 숙주의 종류에 따라서 공지된 방법 (예컨대, 리소자임 방법, 적격 (competent) 방법, PEG 방법, CaCl2 공침법, 전기천공법, 미세주입법, 입자 총 방법, 리포펙션 방법, 아그로박테리움 (Agrobacterium) 방법 등)에 의해 도입될 수 있다.
본 발명의 인공 sgRNA 및 Cas9는 바람직하게는 뉴클레오펙션 (nucleofection) 방법에 의해 숙주 세포 내로 도입될 수 있다.
세포에 도입된 (그리고 발현된) sgRNA는 Cas9 단백질과 복합체를 형성하고 표적 서열에 결합하여 표적 유전자에서 DSB를 유도한다. DSB는 비-상동성 말단 연결 (NHEJ)에 의해 복구되지만, 표적 유전자는 그 시점에 일어나는 염기(들)의 우연한 삽입 또는 결실 (indel)에 의한 해독틀 돌연변이에 의해 파괴 (넉아웃)된다. 또한, 양 말단에 표적에 상동성인 서열을 갖는 공여자 DNA의 동시-형질감염은 상동 재조합 복구를 초래하고, 그로써 염기 변형 및 유전자 삽입 (넉인)을 가능케 한다.
본 발명은 이하의 실시예 등에 의해 구체적으로 설명되지만, 이들은 제한적으로 해석되어서는 안된다.
[ 실시예 ]
( 실시예 1) sgRNA의 합성
표 1에 나타난 sgRNA를 포스포르아미다이트 방법을 토대로 핵산 합성기 (The ABI Expedite(R) 8909 Nucleic Acid Synthesis System, Applied Biosystems)를 사용하여 합성하였다. RNA 아미다이트로서, EMM 아미다이트 (WO 2013/027843)를 상기에 언급한 합성에 사용하였다 (이하 동일함). 상기에 언급한 아미다이트의 탈보호는 통상적인 방법에 따라 수행되었고, sgRNA를 HPLC로 정제하였다. 하기 서열에서, 밑줄 친 부분은 표적 뉴클레오티드 서열에 상보적인 가이드 영역이고, 프롤린 디아미드 아미다이트가 P 내로 도입되었고, 리신 디아미드 아미다이트가 K 내로 도입되었으며, 글리실글리신 디아미드 아미다이트가 X 내로 도입되었다.
[표 1]
Figure 112018082822241-pct00034
(실험예 1) KRAS 유전자를 표적하는 sgRNA의 시험관 내 절단 활성의 평가
인간 KRAS 유전자 (GenBank 등재번호 NM_004985.3)에 G12V 돌연변이를 갖는 서열 (NCBI 참조 서열 NP_0049762)을 도입하는 플라스미드 DNA (pCMV6-Entry-KRAS (G12V), OriGene Technologies)를 첨부의 프로토콜에 따라서 제한 효소 Tth111I (TaKaRa)와 반응시켰다. 반응의 종결 후, 관심 DNA를 통상적인 방법에 따라 정제하고 100 ng/μL의 최종 농도로 TE 완충제 (10 mM Tris-HCl, pH 8, 1 mM EDTA)에 용해시켜 기질 DNA를 제공하였다.
상기에 언급한 기질 DNA를 Cas9 뉴클리아제, S. 피오게네스 (New England Biolabs)에 부착된 시약을 사용하여 다음과 같이 sgRNA 및 Cas9와 혼합하였다:
100 ng 기질 DNA + 10 ng sgRNA + 0.3 pmol Cas9 (총량 10 μL)
이를 37℃에서 30분간 인큐베이션하고, 70℃에서 10분간 추가로 인큐베이션하여 Cas9를 불활성화하였다. 그 후에, 전기천공을 수행하였고, 에티디움 브로마이드 염색 후에 밴드 강도를 이미징 시스템 PXi4 (SYNGENE)를 사용하여 측정하였다.
측정 결과를 토대로, 절단 효율을 하기 식에 의해 계산하였다.
절단 효율 = 절단된 밴드 강도의 합/(절단 및 비절단된 밴드 강도의 합)
결과를 도 1에 나타내었다. 모든 인공 sgRNA는 천연형 sgRNA (SG-0001)와 동등한 절단 효율을 나타내었다.
(실험예 2) BCL -2 유전자를 표적하는 sgRNA의 시험관 내 절단 활성의 평가
인간 BCL-2 유전자 (GenBank 등재번호 NM_000633)를 도입하는 플라스미드 DNA (pCAGGS-hbcl-2, Iwahashi et. al., Nature, vol 390, pp 414-417, 1997)를 첨부의 프로토콜에 따라 제한 효소 HindIII (TaKaRa)와 반응시켰다. 반응의 종결 후, 관심 DNA를 통상적인 방법에 따라 정제하고 100 ng/μL의 최종 농도로 TE 완충제 (10 mM Tris-HCl, pH 8, 1 mM EDTA) 에 용해시켜 기질 DNA를 제공하였다.
상기에 언급한 기질 DNA를 Cas9 뉴클리아제, S. 피오게네스 (New England Biolabs)에 부착된 시약을 사용하여 다음과 같이 sgRNA 및 Cas9와 혼합하였다:
100 ng 기질 DNA + 10 ng sgRNA + 0.3 pmol Cas9 (총량 10 μL)
이를 37℃에서 30분간 인큐베이션하고, 70℃에서 10분간 추가로 인큐베이션하여 Cas9를 불활성화하였다. 그 후에, 전기천공을 수행하였고, 에티디움 브로마이드 염색 후에 밴드 강도를 이미징 시스템 PXi4 (SYNGENE)를 사용하여 측정하였다.
측정 결과를 토대로, 절단 효율을 하기 식에 의해 계산하였다.
절단 효율 = 절단된 밴드 강도의 합/(절단 및 비절단된 밴드 강도의 합)
결과를 도 2에 나타내었다. 모든 인공 sgRNA는 천연형 sgRNA (SG-0017)와 동등한 절단 효율을 나타내었다.
( 실시예 2) 페닐알라닌 아미다이트의 합성: 화합물 (5)
하기 반응식에 따라서, 화합물 (5)를 합성하였다.
Figure 112018082822241-pct00035
[[1] 화합물 ( 1)의 합성]
아세토니트릴 중의 Fmoc-페닐알라닌 (3.0 g, 7.7 mmol), 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드 히드로클로라이드 (EDC) (1.78 g, 9.3 mmol) 및 1-히드록시벤조트리아졸 일수화물 (HOBt) (2.51 g, 18.6 mmol)의 용액 (100 mL)에 4-아미노-1-부탄올 (0.83 g, 9.3 mmol)을 첨가하고 상기 혼합물을 실온에서 밤새 교반하였다. 반응의 종결 후, 용매를 감압 하에서 증발시켰다. 잔사에 디클로로메탄을 첨가하고, 혼합물을 포화 수성 탄산수소나트륨 용액으로 2회 및 포화 수성 포화 수성 염화나트륨 용액으로 1회 세척하였다. 세척된 유기층을 무수 황산나트륨 상에서 건조시키고 감압 하에 농축하여 목적 화합물 (1)의 조 생성물 (4.1 g)을 제공하였다.
[[2] 화합물 ( 2)의 합성]
화합물 (1) (4.1 g, 8.9 mmol)을 피리딘으로 공비 (azeotropically) 증류시키고 진공 건조시켰다. 화합물을 파리딘 (80 mL)에 용해시키고, 4,4'-디메톡시트리틸 클로라이드 (4.54 g, 13.4 mmol)를 첨가한 후 혼합물을 실온에서 밤새 교반하였다. 반응의 종결 후, 메탄올을 첨가하고 혼합물을 30분간 교반하고 용매를 감압 하에서 증발시켰다. 잔사에 에틸 아세테이트를 첨가하고, 혼합물을 포화 수성 탄산수소나트륨 용액으로 2회 및 포화 수성 염화나트륨 용액으로 1회 세척하였다. 세척된 유기층을 무수 황산나트륨 상에서 건조시키고 감압 하에 농축하여 목적 화합물 (2)의 조 생성물 (9.8 g)을 제공하였다.
[[3] 화합물 ( 3)의 합성]
화합물 (2) (9.8 g, 12.9 mmol)에 N,N-디메틸포름아미드 (50 mL) 및 피페리딘 (8.9 mL)을 실온에서 첨가하고, 혼합물을 실온에서 밤새 교반하였다. 반응의 종결 후, 용매를 감압 하에서 증발시키고, 수득된 잔사를 실리카 겔 칼럼 크로마토그래피 (디클로로메탄:메탄올=20:1, 0.05% 파리딘 함유)로 정제하여 목적 화합물 (3) (3.1 g, 3-단계 후 수율 74%)을 제공하였다.
[[4] 화합물 ( 4)의 합성]
화합물 (3) (3.1 g, 5.8 mmol)을 피리딘으로 공비 증류시키고 진공 건조시켰다. 아르곤 대기 하에서, 6-히드록시헥사노산 (0.91 g, 6.9 mmol), 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드 히드로클로라이드 (EDC) (1.32 g, 6.9 mmol), 1-히드록시벤조트리아졸 일수화물 (HOBt) (1.87 g, 13.8 mmol) 및 디클로로메탄 (40 mL)을 실온에서 첨가하고, 혼합물을 10분간 교반하였다. 교반 후, 트리에틸아민 (2.1 g, 20.7 mmol)을 첨가하고, 혼합물을 실온에서 밤새 교반하였다. 수득된 잔사에 디클로로메탄을 첨가하고, 혼합물을 포화 수성 중탄산나트륨 용액으로 2회 및 포화 수성 염화나트륨 용액으로 세척하였다. 세척된 유기층을 무수 황산나트륨 상에서 건조시키고 감압 하에 농축하였다. 수득된 조 생성물을 실리카 겔 칼럼 크로마토그래피 (헥산:에틸 아세테이트=1:2, 0.05% 파리딘 함유)로 정제하여 목적 화합물 (4) (2.0 g, 수율 53%)을 제공하였다. 화합물 (4)의 기기 분석 값을 하기에 나타내었다.
화합물 (4):
1H-NMR (500 MHz, CDCl3) δ: 7.41-7.39(2H, m), 7.30-7.16(12H, m), 6.84-6.80(4H, m), 6.26(1H, d, J=7.4Hz), 5.71-5.69(1H, m), 4.57-4.52(1H, m), 3.79(6H, s), 3.64-3.58(2H, m), 3.18-3.15(1H, m), 3.09-2.93(5H, m), 2.19-2.16(2H, m), 1.64-1.58(2H, m), 1.56-1.50(2H, m), 1.46-1.39(4H, m), 1.36-1.30(2H, m).
[[5] 화합물 ( 5)의 합성]
화합물 (4) (2.0 g, 3.1 mmol)를 피리딘으로 공비 증류시키고, 진공 건조시켰다. 그 후에, 아세토니트릴 (4 mL) 및 디이소프로필암모늄테트라졸리드 (0.63 g, 3.7 mmol)를 첨가하고, 2-시아노에틸-N,N,N',N'-테트라이소프로필포스포르디아미다이트 (1.1 g, 3.7 mmol)를 추가 첨가하고, 혼합물을 40℃에서 2시간 동안 교반하였다. 반응의 종결 후, 용매를 감압 하에서 증발시키고, 에틸 아세테이트를 첨가하고, 혼합물을 포화 수성 탄산수소나트륨 용액으로 2회 및 포화 수성 염화나트륨 용액으로 1회 세척하였다. 세척된 유기층을 무수 황산나트륨 상에서 건조시키고, 감압 하에서 농축시켰다. 수득된 조 생성물을 실리카 겔 칼럼 크로마토그래피 (헥산:에틸 아세테이트=1:1, 0.1% 트리에틸아민 아민)로 정제하여 목적 화합물 (5) (2.4 g, 순도 97.5%, 수율 92%)을 제공하였다.
화합물 (5)의 기기 분석 값을 하기에 나타내었다.
화합물 (5):
1H-NMR (500 MHz, CDCl3) δ: 7.41-7.40(2H, m), 7.33-7.16(12H, m), 6.86-6.80(4H, m), 6.28(1H, d, J=7.7 Hz), 5.77(1H, t, J=6.0 Hz), 4.58-4.54(1H, m), 3.87-3.80(1H, m), 3.79-3.74(1H, m), 3.78(6H, s), 3.67-3.53(4H, m), 3.21-3.15(1H, m), 3.10-2.94(5H, m), 2.62(2H, t, J=6.4 Hz), 2.18-2.12(2H, m), 1.64-1.55(4H, m), 1.46-1.39(4H, m), 1.36-1.31(2H, m), 1.17(12H, m).31P-NMR (202 MHz, CDCl3) δ: 147.95, 147.91
ESI-Mass: 871.49 [M+H2O+H]+
( 실시예 3) 류신 아미다이트의 합성: 화합물 (10)
하기 반응식에 따라, 화합물 (10)을 합성하였다.
Figure 112018082822241-pct00036
[[1] 화합물 ( 6)의 합성]
아세토니트릴 중의 Fmoc-류신 (3.0 g, 8.5 mmol), 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드 히드로클로라이드 (EDC) (1.95 g, 10.2 mmol) 및 1-히드록시벤조트리아졸 일수화물 (HOBt) (2.75 g, 20.4 mmol)의 용액 (90 mL)에 4-아미노-1-부탄올 (0.91 g, 10.2 mmol)을 첨가하고 혼합물을 실온에서 밤새 교반하였다. 반응의 종결 후, 용매를 감압 하에서 증발시켰다. 잔사에 디클로로메탄을 첨가하고, 혼합물을 포화 수성 탄산수소나트륨 용액으로 2회, 및 포화 수성 염화나트륨 용액으로 1회 세척하였다. 세척된 유기층을 무수 황산나트륨 상에서 건조시키고 감압 하에 농축하여 목적 화합물 (6)의 조 생성물 (4.42 g)을 제공하였다.
[[2] 화합물 ( 7)의 합성]
화합물 (6) (4.42 g, 10.4 mmol)을 피리딘으로 공비 증류시키고, 진공 건조시켰다. 화합물을 파리딘 (80 mL)에 용해시키고, 4,4'-디메톡시트리틸 클로라이드 (5.29 g, 15.6 mmol)를 첨가하고 혼합물을 실온에서 밤새 교반하였다. 반응의 종결 후, 메탄올을 첨가하고 혼합물을 30분간 교반하고, 용매를 감압 하에서 증발시켰다. 잔사에 에틸 아세테이트를 첨가하고, 혼합물을 포화 수성 탄산수소나트륨 용액으로 2회, 및 포화 수성 염화나트륨 용액으로 1회 세척하였다. 세척된 유기층을 무수 황산나트륨 상에서 건조시키고 감압 하에 농축하여 목적 화합물 (7)의 조 생성물 (9.51 g)을 제공하였다.
[[3] 화합물 ( 8)의 합성]
화합물 (7) (9.51 g, 13.1 mmol)에 N,N-디메틸포름아미드 (40 mL) 및 피페리딘 (9.0 mL)을 실온에서 첨가하고, 혼합물을 실온에서 밤새 교반하였다. 반응의 종결 후, 용매를 감압 하에서 증발시키고, 수득된 잔사를 실리카 겔 칼럼 크로마토그래피 (디클로로메탄:메탄올=30:1, 0.05% 파리딘 함유 및 클로로메탄:메탄올=40:1, 0.05% 파리딘 함유)로 정제하여 목적 화합물 (8) (3.89 g, 3-단계 후 수율 91%)을 수득하였다.
[[4] 화합물 ( 9)의 합성]
화합물 (8) (3.89 g, 7.7 mmol)을 피리딘으로 공비 증류시키고, 진공 건조시켰다. 아르곤 대기 하에서, 6-히드록시헥사노산 (1.22 g, 9.2 mmol), 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드 히드로클로라이드 (EDC) (1.77 g, 9.2 mmol), 1-히드록시벤조트리아졸 일수화물 (HOBt) (2.50 g, 18.5 mmol) 및 디클로로메탄 (50 mL)을 실온에서 첨가하고, 혼합물을 10분간 교반하였다. 교반 후, 트리에틸아민 (2.81 g, 27.7 mmol)을 첨가하고 혼합물을 실온에서 밤새 교반하였다. 수득된 잔사에 디클로로메탄을 첨가하고, 혼합물을 포화 수성 중탄산나트륨 용액으로 2회 및 포화 수성 염화나트륨 용액으로 세척하였다. 세척된 유기층을 무수 황산나트륨 상에서 건조시키고, 감압 하에서 농축시켰다. 수득된 조 생성물을 실리카 겔 칼럼 크로마토그래피 (헥산:에틸 아세테이트=1:4, 0.05% 파리딘 함유)로 정제하여 목적 화합물 (9) (3.80 g, 수율 80%)을 제공하였다. 화합물 (9)의 기기 분석 값을 하기에 나타내었다.
화합물 (9):
1H-NMR (500 MHz, CDCl3) δ: 7.42-7.41(2H, m), 7.31-7.27(6H, m), 7.21-7.18(1H, m),6.83-6.80(4H, m), 6.21(1H, t, J=5.7 Hz), 6.05(1H, d, J=8.3 Hz), 4.41-4.36(1H, m), 3.78(6H, s), 3.64-3.59(2H, m), 3.31-3.15(2H, m), 3.06(2H, t, J=6.0 Hz), 2.20(2H, t, J=7.4 Hz), 1.78(1H, t, J=5.5 Hz), 1.68-1.47(10H, m), 1.40-1.34(2H, m), 0.93-0.91(6H, m).
[[5] 화합물 ( 10)의 합성]
화합물 (9) (3.80 g, 6.1 mmol)를 피리딘으로 공비 증류시키고, 진공 건조시켰다. 그 후에, 아세토니트릴 (7.6 mL) 및 디이소프로필암모늄테트라졸리드 (1.26 g, 7.4 mmol)를 첨가하고, 2-시아노에틸-N,N,N',N'-테트라이소프로필포스포르디아미다이트 (2.22 g, 7.4 mmol)를 추가로 첨가하고, 혼합물을 40℃에서 2시간 동안 교반하였다. 반응의 종결 후, 용매를 감압 하에서 증발시키고, 에틸 아세테이트를 첨가하고 혼합물을 포화 수성 탄산수소나트륨 용액으로 2회 및 포화 수성 염화나트륨 용액으로 1회 세척하였다. 세척된 유기층을 무수 황산나트륨 상에서 건조시키고, 감압 하에서 농축시켰다. 수득된 조 생성물을 실리카 겔 칼럼 크로마토그래피 (헥산:에틸 아세테이트=1:1, 0.1% 트리에틸아민 함유)로 정제하여 목적 화합물 (10) (4.80 g, 순도 97.5%, 수율 95.4%)을 제공하였다. 화합물 (10)의 기기 분석 값을 하기에 나타내었다.
화합물 (10):
1H-NMR (500 MHz, CDCl3) δ: 7.42-7.40(2H, m), 7.31-7.26(6H, m), 7.21-7.18(1H, m), 6.83-6.81(4H, m), 6.29(1H, t, J=5.6 Hz), 6.09(1H, d, J=8.5 Hz), 4.42-4.37(1H, m), 3.87-3.74(2H, m), 3.78(6H, s), 3.68-3.51(4H, m), 3.29-3.23(1H, m), 3.19-3.14(1H, m), 3.06(2H, t, J=5.7 Hz), 2.62(2H, t, J=6.2 Hz), 2.19(2H, t, J=8.0 Hz), 1.69-1.50(8H, m), 1.40-1.35(2H, m), 1.30-1.21(2H, m), 1.17(12H, m), 0.94-0.91(6H, m).
31P-NMR (202 MHz, CDCl3) δ: 147.95
ESI-Mass: 841.47 [M+Na]+
( 실시예 4) 글루탐산 아미다이트의 합성: 화합물 (15)
하기 반응식에 따라, 화합물 (15)를 합성하였다.
Figure 112018082822241-pct00037
[[1] 화합물 ( 11)의 합성]
피리딘 중의 6-히드록시헥사노산 (1.00 g, 7.6 mmol) 및 디메틸아미노피리딘 (DMAP) (92 mg, 0.8 mmol)의 용액 (25 ml)에 4,4'-디메톡시트리틸 클로라이드 (2.6 g, 7.6 mmol)를 첨가하고 혼합물을 실온에서 5시간 동안 교반하였다. TLC에 의해 출발 물질의 소실을 확인한 후, 메탄올을 첨가하고 혼합물을 30분간 교반하였다. 용매를 감압 하에서 증발시키고, 디클로로메탄을 첨가하고 혼합물을 포화 수성 탄산수소나트륨 용액으로 3회 및 포화 식염수로 1회 세척하였다. 유기층을 황산나트륨 상에서 건조시키고, 감압 하에서 농축하고, 헥산과 함께 분쇄하고 (triturated), 감압 하에서 건조시켜 유성 (oily) 조 생성물을 제공하였다. 유성 조 생성물에 디클로로메탄 (32 mL), 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드 히드로클로라이드 (EDC) (2.48 g, 13.0 mmol) 및 N-히드록시석시니미드 (1.49 g, 13.0 mmol)를 첨가하고 혼합물을 실온에서 밤새 교반하였다. 반응의 종결 후, 용매를 감압 하에서 증발시키고, 에틸 아세테이트를 첨가하고, 혼합물을 포화 탄산수소나트륨 용액으로 3회 및 포화 식염수로 1회 세척하였다. 유기층을 황산나트륨 상에서 건조시키고, 용매를 감압 하에서 증발시켜 목적 화합물 (11)의 조 생성물 (3.40 g)을 제공하였다.
[[2] 화합물 ( 12)의 합성]
아세토니트릴 중의 Boc-글루탐산 (OMe) (2.0 g, 7.7 mmol), 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드 히드로클로라이드 (EDC) (1.76 g, 9.2 mmol) 및 1-히드록시벤조트리아졸 일수화물 (HOBt) (2.48 g, 18.4 mmol)의 용액 (40 mL)에 4-아미노-1-부탄올 (0.82 g, 9.2 mmol)을 첨가하고 혼합물을 실온에서 밤새 교반하였다. 반응의 종결 후, 용매를 감압 하에서 증발시켰다. 잔사에 디클로로메탄을 첨가하고, 혼합물을 포화 수성 탄산수소나트륨 용액으로 2회, 및 포화 수성 염화나트륨 용액으로 1회 세척하였다. 세척된 유기층을 무수 황산나트륨 상에서 건조시키고 감압 하에 농축하여 목적 화합물 (12)의 조 생성물 (2.30 g)을 제공하였다.
[[3] 화합물 ( 13)의 합성]
화합물 (12) (2.30 g, 6.9 mmol)에 용매를 첨가함으로써 이를 1,4-디옥산 (23 ml)에 용해시키고, 염산 (2.3 ml)을 0℃에서 첨가하였다. 혼합물을 실온으로 가온하고 30분간 교반하였다. 반응의 종결 후, 용매를 감압 하에서 증발시키고, 잔사를 이소프로필에테르와 함께 분쇄하고 감압 하에 건조시켜 목적 화합물 (13)의 조 생성물 (2.06 g)을 제공하였다.
[[4] 화합물 ( 14)의 합성]
DMF 중의 화합물 (13) (0.93 g, 4.0 mmol)의 용액 (9 ml)에 트리에틸아민 (0.61 g, 6.0 mmol) 및 DMF 중의 화합물 (11) (2.34 g, 4.4 mmol)의 용액을 첨가하고 혼합물을 실온에서 밤새 교반하였다. 반응의 종결 후, 용매를 감압 하에서 증발시키고, 잔사에 디클로로메탄을 첨가하고 혼합물을 포화 식염수로 3회 세척하였다. 세척된 유기층을 무수 황산나트륨 상에서 건조시키고, 용매를 감압 하에서 증발시켰다. 수득된 조 생성물을 실리카 겔 칼럼 크로마토그래피 (에틸 아세테이트, 0.05% 파리딘 함유)로 정제하였다. 이 반응을 2회 실시하여 목적 화합물 (14) (0.85 g)을 제공하였다. 화합물 (14)의 기기 분석 값을 하기에 나타내었다.
화합물 (14):
1H-NMR (500 MHz, CDCl3) δ: 7.43-7.41(2H, m), 7.32-7.26(6H, m), 7.21-7.18(1H, m), 6.87-6.85(1H, m), 6.83-6.80(4H, m), 6.51(1H, d,J=7.3 Hz), 4.43-4.38(1H, m), 3.79(6H, s), 3.67(3H, s), 3.63(2H, d, J=6.1 Hz), 3.28-3.25(2H, m), 3.02(2H, t, J=6.6 Hz), 2.54-2.48(1H, m), 2.38-2.32(1H, m), 2.20-2.17(2H, m), 2.14-2.07(1H, m), 1.96-1.89(1H, m), 1.64-1.53(8H, m), 1.40-1.34(2H, m)
[[5] 화합물 ( 15)의 합성]
화합물 (14) (0.85 g, 1.3 mmol)를 피리딘으로 공비 증류시키고, 진공 건조시켰다. 그 후에, 아세토니트릴 (2.5 mL) 및 디이소프로필암모늄테트라졸리드 (0.27 g, 1.6 mmol)를 첨가하고, 2-시아노에틸-N,N,N',N'-테트라이소프로필포스포르디아미다이트 (0.47 g, 1.6 mmol)를 추가로 첨가하고 혼합물을 실온에서 2시간 동안 교반하였다. 반응의 종결 후, 용매를 감압 하에서 증발시키고, 에틸 아세테이트를 첨가하고, 혼합물을 포화 수성 탄산수소나트륨 용액으로 2회, 및 포화 수성 염화나트륨 용액으로 1회 세척하였다. 세척된 유기층을 무수 황산나트륨 상에서 건조시키고, 감압 하에서 농축시켰다. 수득된 조 생성물을 실리카 겔 칼럼 크로마토그래피 (헥산:에틸 아세테이트=1:2, 0.1% 트리에틸아민 함유)로 정제하여 목적 화합물 (15) (0.95 g, 순도 92.%, 수율 86.4%)을 제공하였다. 화합물 (15)의 기기 분석 값을 하기에 나타내었다.
화합물 (15):
1H-NMR (500 MHz, CDCl3) δ: 7.43-7.41(2H, m), 7.32-7.26(6H, m), 7.21-7.17(1H, m), 6.83-6.80(4H, m), 6.63-6.60(1H, m), 6.47(1H, d,J=7.4 Hz), 4.44-4.40(1H, m), 3.88-3.82(1H, m), 3.80-3.75(1H, m), 3.78(6H, s), 3.71-3.67(1H, m), 3.66(3H, s), 3.64-3.55(3H, m), 3.31-3.21(2H, m), 3.03(2H, t, J=6.4 Hz), 2.64(2H, t, J=6.4 Hz), 2.53-2.47(1H, m), 2.38-2.32(1H, m), 2.18(2H, t, J=7.5 Hz), 2.14-2.07(1H, m), 1.96-1.89(1H, m), 1.64-1.56(8H, m), 1.41-1.34(2H, m), 1.19-1.16(12H, m).
31P-NMR (202 MHz, CDCl3) δ: 147.89
ESI-Mass: 867.49 [M+H2O+H]+
( 실시예 5) 프롤린 아미다이트의 합성: 화합물 (5a-c)
하기 반응식에 따라, 화합물 (5a-c)을 합성하였다.
Figure 112018082822241-pct00038
[[1] 화합물 (1a)의 합성]
Fmoc-L-프롤린 (3.0 g, 8.9 mmol)을 탈수된 N,N-디메틸포름아미드 (50 mL) 중에 용해시켰다. 6-아미노-1-헥사놀 (1.3 g, 1.2 eq), 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드 히드로클로라이드 (2.0 g, 1.2 eq) 및 1-히드록시벤조트리아졸 (3.3 g, 2.4 eq)을 첨가하고 혼합물을 실온의 아르곤 대기 하에서 밤새 교반하였다. 반응의 종결 후, 용매를 반응 혼합물로부터 감압 하에서 증발시켰다. 수득된 잔사에 디클로로메탄을 첨가하고, 혼합물을 포화 수성 중탄산나트륨 용액 및 포화 식염수로 세척하였다. 유기상을 황산나트륨 상에서 건조시키고, 용매를 증발시켰다. 수득된 잔사를 실리카 겔 칼럼 크로마토그래피 (용리제: 디클로로메탄-메탄올 (20:1))에 적용하여 목적 물질 (2.9 g, 수율 75%)을 제공하였다.
1H-NMR(CDCl3): δ7.76-7.83(m,2H), 7.50-7.63(m,2H), 7.38-7.43 (m,2H), 7.27-7.34(m,2H), 4.54-4.35(m,2H), 4.13-4.35(m,2H), 3.54-3.63(m,2H), 3.35-3.54(m,2H), 3.17
Figure 112018082822241-pct00039
3.28(m,2H), 1.82-2.07(m,3H), 1.21-1.59(m,9H)
[[2] 화합물 (2a)의 합성]
화합물 1a (2.9 g, 6.6 mmol)를 탈수된 파리딘을 사용해 공비 건조시켰다. 잔사를 탈수된 파리딘 (40 mL) 중에 용해시켰다. 4,4-디메톡시트리틸클로라이드 (DMTrCl) (2.7 g, 1.2 eq.)를 0℃에서 첨가하고 혼합물을 실온에서 밤새 교반하였다. TLC에 의해 출발 물질의 소실을 확인한 후, 메탄올을 첨가하고 혼합물을 30분간 교반하였다. 용매를 감압 하에서 증발시켰다. 수득된 잔사에 디클로로메탄을 첨가하고, 혼합물을 포화 수성 중탄산나트륨 용액 및 포화 식염수로 세척하였다. 유기상을 황산나트륨 상에서 건조시키고 용매를 증발시켰다. 잔사를 감압 하에 건조시켜 유성 물질 (5.0 g)을 제공하였다.
[[3] 화합물 (3a)의 합성]
화합물 2a (5.0 g, 6.6 mmol)를 탈수된 N,N-디메틸포름아미드 (40 mL) 중에 용해시켰다. 피페리딘 (6.5 mL)을 첨가하고, 혼합물을 실온의 아르곤 대기 하에서 밤새 교반하였다. 반응의 종결 후, 용매를 감압 하에서 반응 혼합물로부터 증발시켰다. 수득된 잔사를 실리카 겔 칼럼 크로마토그래피 (용리제: 디클로로메탄-메탄올 (20:1), 0.05% 파리딘)에 적용하여 목적 물질 (2.6 g, 수율 76%, 2-단계)을 제공하였다.
1H-NMR(CDCl3):δ7.44-7.49(m,2H), 7.28-7.38(m, 6H), 7.20-7.26(m, 1H), 6.83-6.88(m,4H), 3.83(s,6H), 3.70(dd,1H,J=9.2Hz,5.2Hz), 3.20(q, 2H,J=6.9Hz), 3.03(t,2H, J=6.6Hz), 2.97-3.00(m,1H), 2.86-2.93(m,1H), 2.10-2.21(m,1H), 1.58-1.97(m,5H), 1.25-1.57(m,6H)
[[4] 화합물 (4a)의 합성]
화합물 3a (2.5 g, 4.8 mmol)를 N,N-디메틸포름아미드 (15 mL) 중에 용해시켰다. 8-히드록시옥타노산 (0.93 g, 1.2 eq) 및 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드 히드로클로라이드 (1.1 g, 1.2 eq) 및 1-히드록시벤조트리아졸 (1.8 g, 2.4 eq)을 N,N-디메틸포름아미드 (15 mL) 중에 용해시켰다. 이 혼합물에 N,N-디메틸포름아미드 중의 화합물 3a의 용액을 0℃에서 첨가하고, 혼합물을 실온의 아르곤 대기 하에서 밤새 교반하였다. 반응의 종결 후, 용매를 감압 하에서 반응 혼합물로부터 증발시켰다. 수득된 잔사에 디클로로메탄을 첨가하고, 혼합물을 포화 수성 중탄산나트륨 및 포화 식염수로 세척하였다. 유기상을 황산나트륨 상에서 건조시키고 용매를 증발시켰다. 수득된 잔사를 실리카 겔 칼럼 크로마토그래피 (용리제: 디클로로메탄-메탄올 (40:1), 0.05% 파리딘)에 적용하여 목적 물질 (2.1 g, 수율 71%)을 제공하였다.
1H-NMR(CDCl3):δ7.42-7.46(m,2H), 7.26-7.36(m, 6H), 7.16-7.24(m, 1H), 6.81-6.86(m,4H), 3.79(s,6H), 3.58-3.66(m,2H), 3.49-3.56(m,1H), 3.37-3.44(m,1H), 3.10-3.27(m,1H), 3.01 (2H, t, J = 6.6 Hz), 2.29-2.35(m,2H), 1.42-1.71(m,10H), 1.21-1.41(m,12H)
[[5] 화합물 (5a)의 합성]
아세토니트릴 중의 공비 건조된 화합물 4a (2.0 g, 2.6 mmol)의 용액 (8 mL)에 디이소프로필암모늄테트라졸리드 (DIPAT) (0.64 g, 1.2 eq.)를 첨가하였다. 아세토니트릴 중의 2-시아노에톡시-N,N,N',N'-테트라이소프로필포스포르디아미다이트 (1.1 g, 1.2 eq.)의 용액 (2 mL)을 첨가하고 혼합물을 실온에서 2시간 동안 교반하였다. 디클로로메탄을 첨가하고, 혼합물을 포화 수성 중탄산나트륨 용액 및 포화 식염수로 세척하였다. 유기상을 황산나트륨 상에서 건조시키고 용매를 증발시켰다. 잔사를 아미노 실리카를 사용하는 칼럼 크로마토그래피 (용리제: n-헥산-에틸 아세테이트(1:1), 0.1% 트리에틸아민)에 적용하여 목적 물질 (2.1 g, 수율 81%)을 제공하였다.
31P-NMR (CDCl3): δ=147.821
ESI-Mass m/z: 877.55 [M+H2O+H]+, 960.66 [M+TEA+H]+
[[6] 화합물 (1b)의 합성]
Fmoc-L-프롤린 (3.0 g, 8.9 mmol)을 탈수된 N,N-디메틸포름아미드 (60 mL) 중에 용해시켰다. 8-아미노-1-옥타놀 (1.5 g, 1.2 eq), 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드 히드로클로라이드 (2.0 g, 1.2 eq) 및 1-히드록시벤조트리아졸 (3.3 g, 2.4 eq)을 첨가하고, 혼합물을 실온의 아르곤 대기 하에서 밤새 교반하였다. 반응의 종결 후, 용매를 감압 하에서 반응 혼합물로부터 증발시켰다. 수득된 잔사에 디클로로메탄을 첨가하고, 혼합물을 포화 수성 중탄산나트륨 용액 및 포화 식염수로 세척하였다. 유기상을 황산나트륨 상에서 건조시키고 용매를 증발시켰다. 수득된 잔사를 실리카 겔 칼럼 크로마토그래피 (용리제: 디클로로메탄-메탄올(20:1))에 적용하여 목적 물질 (3.0 g, 수율 73%)을 제공하였다.
1H-NMR(CDCl3): δ7.76-7.83(m,2H), 7.50-7.64(m,2H), 7.39-7.45(m,2H), 7.30-7.36(m,2H), 4.58-4.37(m,2H), 4.16-4.37(m,2H), 3.57-3.65(m,2H), 3.38-3.57(m,2H), 3.10-3.30(m,2H), 1.82-2.07(m,3H), 1.21-1.59(m,13H)
[[7] 화합물 (2b)의 합성]
탈수된 파리딘을 사용하여, 화합물 1b (3.0 g, 6.5 mmol)를 공비 건조시켰다. 잔사를 탈수된 파리딘 (40 mL) 중에 용해시켰다. 4,4-디메톡시트리틸클로라이드 (DMTrCl) (2.6 g, 1.2 eq.)를 0℃에서 첨가하고 혼합물을 실온에서 밤새 교반하였다. TLC에 의해 출발 물질의 소실을 확인한 후, 메탄올을 첨가하고 혼합물을 30분간 교반하였다. 용매를 감압 하에서 증발시켰다. 수득된 잔사에 디클로로메탄을 첨가하고, 혼합물을 포화 수성 중탄산나트륨 용액 및 포화 식염수로 세척하였다. 유기상을 황산나트륨 상에서 건조시키고 용매를 증발시켰다. 잔사를 감압 하에 건조시켜 유성 물질 (5.0 g)을 제공하였다.
[[8] 화합물 (3b)의 합성]
화합물 2b (5.0 g, 6.5 mmol)를 탈수된 N,N-디메틸포름아미드 (40 mL) 중에 용해시켰다. 피페리딘 (6.4 mL)을 첨가하고, 혼합물을 실온의 아르곤 대기 하에서 밤새 교반하였다. 반응의 종결 후, 용매를 감압 하에서 반응 혼합물로부터 증발시켰다. 수득된 잔사를 실리카 겔 칼럼 크로마토그래피 (용리제: 디클로로메탄-메탄올 (15:1), 0.05% 파리딘)에 적용하여 목적 물질 (2.9 g, 수율 83%, 2-단계)을 제공하였다.
1H-NMR(CDCl3):δ7.43-7.47(m,2H), 7.26-7.37(m, 6H), 7.18-7.23(m, 1H), 6.81-6.86(m,4H), 3.80(s,6H), 3.71(dd,1H,J=9.2Hz,5.2Hz), 3.21(q, 2H,J=6.9Hz), 2.97-3.06(m,3H), 2.85-2.91(m,1H), 2.09-2.18(m,1H), 1.87-1.96(m,1H), 1.66-1.74(m,2H), 1.57-1.65(m,2H), 1.44-1.52(m,2H), 1.22-1.38(m,8H)
[[9] 화합물 (4b)의 합성]
화합물 3b (2.8 g, 5.1 mmol)를 탈수된 디클로로메탄 (40 mL) 중에 용해시켰다. 10-히드록시데카노산 (1.2 g, 1.2 eq), 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드 히드로클로라이드 (1.2 g, 1.2 eq), 1-히드록시벤조트리아졸 (1.9 g, 2.4 eq) 및 트리에틸아민 (2.6 mL)을 첨가하고, 혼합물을 실온의 아르곤 대기 하에서 밤새 교반하였다. 반응의 종결 후, 용매를 감압 하에서 반응 혼합물로부터 증발시켰다. 수득된 잔사에 디클로로메탄을 첨가하고, 혼합물을 포화 수성 중탄산나트륨 용액 및 포화 식염수로 세척하였다. 유기상을 황산나트륨 상에서 건조시키고 용매를 증발시켰다. 수득된 잔사를 실리카 겔 칼럼 크로마토그래피 (용리제: 디클로로메탄-메탄올 (20:1), 0.05% 파리딘)에 적용하여 목적 물질 (2.5 g, 수율 70%)을 제공하였다.
1H-NMR(CDCl3):δ7.41-7.45(m,2H), 7.25-7.35(m, 6H), 7.16-7.21(m, 1H), 6.79-6.85(m,4H), 3.79(s,6H), 3.58-3.65(m,2H), 3.48-3.54(m,1H), 3.36-3.43(m,1H), 3.11-3.22(m,1H), 3.01 (2H, t, J = 6.6 Hz), 2.26-2.32(m,2H), 1.50-1.68(m,8H), 1.39-1.49(m,2H)1.19-1.38(m,20H)
[[10] 화합물 (5b)의 합성]
아세토니트릴 중의 공비 건조된 화합물 4b (2.4 g, 3.4 mmol)의 용액 (8 mL)에 디이소프로필암모늄테트라졸리드 (DIPAT) (0.69 g, 1.2 eq.)를 첨가하였다. 아세토니트릴 중의 2-시아노에톡시-N,N,N',N'-테트라이소프로필포스포르디아미다이트 (1.2 g, 1.2 eq.)의 용액 (2 mL)을 첨가하고 혼합물을 실온에서 2시간 동안 교반하였다. 디클로로메탄을 첨가하고 혼합물을 포화 수성 중탄산나트륨 용액 및 포화 식염수로 세척하였다. 유기상을 황산나트륨 상에서 건조시키고 용매를 증발시켰다. 잔사를 아미노 실리카를 사용하는 칼럼 크로마토그래피 (용리제: n-헥산-에틸 아세테이트 (1:1), 0.1% 트리에틸아민)에 적용하여 목적 물질 (2.4 g, 수율 80%)을 제공하였다.
31P-NMR (CDCl3): δ=147.810
ESI-Mass m/z: 937.56 [M+Na]+, 1016.70 [M+TEA+H]+
[[11] 화합물 (1c)의 합성]
Fmoc-L-프롤린 (3.0 g, 8.9 mmol)을 탈수된 아세토니트릴 (75 mL) 및 탈수된 N,N-디메틸포름아미드 (15 mL)의 혼합 용매 중에 용해시켰다. 10-아미노-1-데카놀 (1.8 g, 1.2 eq), N,N'-디사이클로헥실카르보디이미드 (2.2 g, 1.2 eq) 및 1-히드록시벤조트리아졸 (3.3 g, 2.4 eq)을 첨가하고, 혼합물을 실온의 아르곤 대기 하에서 밤새 교반하였다. 반응의 종결 후, 침전물을 여과하고, 용매를 감압 하에서 여과물로부터 증발시켰다. 수득된 잔사에 디클로로메탄을 첨가하고, 혼합물을 포화 수성 중탄산나트륨 용액 및 포화 식염수로 세척하였다. 유기상을 황산나트륨 상에서 건조시키고 용매를 증발시켰다. 잔사를 디이소프로필에테르와 함께 분쇄하고 감압 하에 건조시켜 고체 물질 (4.0 g, 수율 93%)을 제공하였다.
1H-NMR(CDCl3): δ7.72-7.78(m,2H), 7.50-7.62(m,2H), 7.35-7.42(m,2H), 7.26-7.33(m,2H), 4.54-4.33(m,2H), 4.12-4.33(m,2H), 3.57-3.62(m,2H), 3.34-3.54(m,2H), 3.06-3.26(m,2H), 1.80-2.04(m,3H), 1.13-1.47(m,17H)
[[12] 화합물 (2c)의 합성]
탈수된 파리딘을 사용하여, 화합물 1c (3.9 g, 8.0 mmol)를 공비 건조시켰다. 잔사를 탈수된 파리딘 (50 mL) 중에 용해시켰다. 4,4-디메톡시트리틸클로라이드 (DMTrCl) (3.2 g, 1.2 eq.)를 0℃에서 첨가하고 혼합물을 실온에서 밤새 교반하였다. TLC에 의해 출발 물질의 소실을 확인한 후, 메탄올을 첨가하고 혼합물을 30분간 교반하였다. 용매를 감압 하에서 증발시켰다. 수득된 잔사에 디클로로메탄을 첨가하고, 혼합물을 포화 수성 중탄산나트륨 용액 및 포화 식염수로 세척하였다. 유기상을 황산나트륨 상에서 건조시키고 용매를 증발시켰다. 잔사를 감압 하에 건조시켜 유성 물질 (6.2 g)을 제공하였다.
[[13] 화합물 (3c)의 합성]
화합물 2c (6.2 g, 7.8 mmol)를 탈수된 N,N-디메틸포름아미드 (50 mL) 중에 용해시켰다. 피페리딘 (7.7 mL)을 첨가하고, 혼합물을 실온의 아르곤 대기 하에서 밤새 교반하였다. 반응의 종결 후, 용매를 감압 하에서 반응 혼합물로부터 증발시켰다. 수득된 잔사를 실리카 겔 칼럼 크로마토그래피 (용리제: 디클로로메탄-메탄올(15:1), 0.05% 파리딘)에 적용하여 목적 물질 (3.4 g, 수율 76%, 2-단계)을 제공하였다.
1H-NMR(CDCl3):δ7.38-7.42(m,2H), 7.21-7.31(m, 6H), 7.13-7.18(m, 1H), 6.75-6.80(m,4H), 3.79(s,6H), 3.72(dd,1H,J=9.2Hz,5.7Hz), 3.21(q, 2H,J=6.9Hz), 2.98-3.03(m,3H), 2.80-2.88(m,1H), 2.05-2.15(m,1H), 1.83-1.91(m,1H), 1.66-1.74(m,2H), 1.52-1.59(m,2H), 1.38-1.48(m,2H), 1.16-1.34(m,12H)
[[14] 화합물 (4c)의 합성]
화합물 3c (2.4 g, 4.2 mmol)를 N,N-디메틸포름아미드 (20 mL) 중에 용해시켰다. 12-히드록시도데카노산 (1.1 g, 1.2 eq), 1-에틸-3-(3-디메틸아미노프로필)카르보디이미드 히드로클로라이드 (0.96 g, 1.2 eq) 및 1-히드록시벤조트리아졸 (1.5 g, 2.4 eq)을 N,N-디메틸포름아미드 (20 mL) 중에 용해시켰다. 이 혼합물에 N,N-디메틸포름아미드 중의 화합물 3c의 용액을 0℃에서 첨가하고, 화합물을 실온의 아르곤 대기 하에서 밤새 교반하였다. 반응의 종결 후, 용매를 감압 하에서 반응 혼합물로부터 증발시켰다. 수득된 잔사에 디클로로메탄을 첨가하고, 혼합물을 포화 수성 중탄산나트륨 용액 및 포화 식염수로 세척하였다. 유기상을 황산나트륨 상에서 건조시키고 용매를 증발시켰다. 수득된 잔사를 실리카 겔 칼럼 크로마토그래피 (용리제: n-헥산-에틸 아세테이트 (1:3), 0.05% 파리딘)에 적용하여 목적 물질 (2.1 g, 수율 66%)을 제공하였다.
1H-NMR(CDCl3):δ7.41-7.45(m,2H), 7.25-7.34(m, 6H), 7.17-7.22(m, 1H), 6.79-6.83(m,4H), 3.79(s,6H), 3.58-3.67(m,2H), 3.47-3.56(m,1H), 3.35-3.44(m,1H), 3.09-3.29(m,1H), 3.02 (2H, t, J = 6.6 Hz), 2.25-2.35(m,2H), 1.53-1.65(m,9H), 1.18-1.39(m,29H)
[[15] 화합물 (5c)의 합성]
아세토니트릴 중의 공비 건조된 화합물 4c (2.0 g, 2.6 mmol)의 용액 (8 mL)에 디이소프로필암모늄테트라졸리드 (DIPAT) (0.53 g, 1.2 eq.)를 첨가하였다. 아세토니트릴 중의 2-시아노에톡시-N,N,N',N'-테트라이소프로필포스포르디아미다이트 (0.94 g, 1.2 eq.)의 용액 (2 mL)을 첨가하고 혼합물을 실온에서 2시간 동안 교반하였다. 디클로로메탄을 첨가하고, 혼합물을 포화 수성 중탄산나트륨 용액 및 포화 식염수로 세척하였다. 유기상을 황산나트륨 상에서 건조시키고 용매를 증발시켰다. 잔사를 아미노 실리카를 사용하는 칼럼 크로마토그래피 (용리제: n-헥산-에틸 아세테이트 (1:1), 0.1% 트리에틸아민)에 적용하여 목적 물질 (1.9 g, 수율 76%)을 제공하였다.
31P-NMR (CDCl3): δ=147.821
ESI-Mass m/z: 989.67 [M+H2O+H]+, 1072.78 [M+TEA+H]+
( 실시예 6) sgRNA의 합성
실시예 2 내지 5에서 합성된 화합물 5, 10, 15, 5a, 5b 및 5c, 그 자체로 알려진 프롤린 디아미드 아미다이트, 리신 디아미드 아미다이트, 글리신 디아미드 아미다이트, 테레프탈산 디아미드 아미다이트 및 글리실글리신 디아미드 아미다이트를 사용하여, 표 2-1 내지 표 4에 나타낸 sgRNA를 실시예 1에서와 동일한 방식으로 합성하였다. 하기 서열에서, 밑줄 친 부분이 표적 뉴클레오티드 서열에 상보적인 가이드 영역이고 아미노산 유도체 링커는 표 5에 나타난 바와 같은 약어로 표시된다.
[표 2-1]
Figure 112018082822241-pct00040
Figure 112018082822241-pct00041
Figure 112018082822241-pct00042
[표 2-2]
Figure 112018082822241-pct00043
Figure 112018082822241-pct00044
Figure 112018082822241-pct00045
[표 2-3]
Figure 112018082822241-pct00046
Figure 112018082822241-pct00047
표에서, del은 서열이 결실된 것을 의미함.
[표 3-1]
Figure 112018082822241-pct00048
Figure 112018082822241-pct00049
Figure 112018082822241-pct00050
[표 3-2]
Figure 112018082822241-pct00051
[표 4]
Figure 112018082822241-pct00052
아미노산 아미다이트
약어 아미노산 일반식 n m 실시예 화합물
X 글리실글리신 (GlyGly) I-4 5 4
X7 테레프탈산 (TP) I-6 4 4
X8 글리신 (Gly) I-1 5 4
X10 페닐알라닌 (P) IV-1 5 4 화합물 5
X11 류신 (L) IV-2 5 4 화합물 10
X12 글루탐산 ('E) IV-3 5 4 화합물 15
P 프롤린 (P) II-8 5 4
P13 프롤린 (P) II-8 7 6 화합물 5a
P14 프롤린 (P) II-8 9 8 화합물 5b
P15 프롤린 (P) II-8 11 10 화합물 5c
K lysin (K) I-7 5 4
( 실험예 3) KRAS 유전자를 표적하는 sgRNA의 시험관 내 전달 활성의 평가 - 2
인간 KRAS 유전자 (GenBank 등재번호 NM_004985.3) 내 G12V 돌연변이를 갖는 서열 (NCBI 참조 서열 NP_0049762)을 도입하는 플라스미드 DNA (pCMV6-Entry-KRAS (G12V), OriGene Technologies)를 첨부의 프로토콜에 따라서 제한 효소 Tth111I (TaKaRa)와 반응시켰다. 반응의 종결 후, 관심 DNA를 통상적인 방법에 따라 정제하고 TE 완충제 (10 mM Tris-HCl, pH 8, 1 mM EDTA) 중에 100 ng/μL의 최종 농도로 용해하여 기질 DNA를 제공하였다.
상기에 언급한 기질 DNA를 Cas9 뉴클리아제, S. 피오게네스 (New England Biolabs)에 부착된 시약을 사용하여 다음과 같이 sgRNA 및 Cas9와 혼합하였다:
100 ng 기질 DNA + 0.5 ng sgRNA + 0.3 pmol Cas9 (총량 10 μL)
이를 37℃에서 15분간 인큐베이션하고, 70℃에서 10분간 추가로 인큐베이션하여 Cas9를 불활성화하였다. 그 후에, 전기천공을 수행하였고, 에티디움 브로마이드 염색 후에 밴드 강도를 이미징 시스템 PXi4 (SYNGENE)를 사용하여 측정하였다.
측정 결과를 토대로, 절단 효율을 하기 식에 의해 계산하였다.
절단 효율 = 절단된 밴드 강도의 합/(절단 및 비절단된 밴드 강도의 합)
결과를 도 3 내지 6에 나타내었다. 겔 하의 수치는 상기에 언급한 계산식에 의해 결정되는 절단 효율을 나타낸다. 또한, 1로서 참고예에서 천연형 sgRNA (SG-0001)의 절단 효율에 대한 이 실시예의 인공 sgRNA의 상대적 절단 효율을 도 7에 나타내었다.
이 실시예의 인공 sgRNA의 다수는 참고예에서 천연형 sgRNA의 것과 동일하거나 그보다 더 높은 절단 효율을 나타내었고, 각각의 부위를 아미노산 유도체로 치환하는 것이 효과적임이 명백해졌다.
( 실험예 4) BCL -2 유전자를 표적하는 sgRNA의 시험관 내 절단 활성의 평가 - 2
인간 BCL-2 유전자 (GenBank 등재번호 NM_000633)를 도입하는 플라스미드 DNA (pCAGGSHB2)를 첨부의 프로토콜에 따라서 제한 효소 HindIII (TaKaRa)와 반응시켰다. 반응의 종결 후, 관심 DNA를 통상적인 방법에 따라 정제하고 TE 완충제 (10 mM Tris-HCl, pH 8, 1 mM EDTA) 중에 100 ng/μL의 최종 농도로 용해하여 기질 DNA를 제공하였다.
상기에 언급한 기질 DNA를 Cas9 뉴클리아제, S. 피오게네스 (New England Biolabs)에 부착된 시약을 사용하여 다음과 같이 sgRNA 및 Cas9와 혼합하였다:
100 ng 기질 DNA + 10 ng sgRNA + 0.3 pmol Cas9 (총량 10 μL)
이를 37℃에서 30분간 인큐베이션하고, 70℃에서 10분간 추가로 인큐베이션하여 Cas9를 불활성화하였다. 그 후에, 전기천공을 수행하였고, 에티디움 브로마이드 염색 후에 밴드 강도를 이미징 시스템 PXi4 (SYNGENE)를 사용하여 측정하였다.
측정 결과를 토대로, 절단 효율을 하기 식에 의해 계산하였다.
절단 효율 = 절단된 밴드 강도의 합/(절단 및 비절단된 밴드 강도의 합)
결과를 도 8에 나타내었다. 겔 하의 수치는 상기에 언급한 계산식에 의해 결정되는 절단 효율을 나타낸다. 또한, 1로서 참고예에서 천연형 sgRNA (SG-0017)의 절단 효율에 대한 이 실시예의 인공 sgRNA의 상대적 절단 효율을 도 9에 나타내었다.
이 실시예의 인공 sgRNA는 참고예에서 천연형 sgRNA의 것과 동일하거나 그보다 더 높은 절단 효율을 나타내었고, 각각의 부위를 아미노산 유도체로 치환하는 것이 효과적임이 명백해졌다.
( 실험예 5) BRAF 유전자를 표적하는 sgRNA의 시험관 내 절단 활성의 평가
인간 BRAF 유전자 (GenBank 등재번호 NM_004333) 내 V600E 돌연변이를 갖는 서열 (NCBI 참조 서열 NP_0049762)을 도입하는 플라스미드 DNA (pCMV6-Entry-BRAF (V600E), OriGene Technologies)를 첨부의 프로토콜에 따라서 제한 효소 Tth111I (TaKaRa)와 반응시켰다. 반응의 종결 후, 관심 DNA를 통상적인 방법에 따라 정제하고 TE 완충제 (10 mM Tris-HCl, pH 8, 1 mM EDTA) 중에 100 ng/μL의 최종 농도로 용해하여 기질 DNA를 제공하였다.
상기에 언급한 기질 DNA를 Cas9 뉴클리아제, S. 피오게네스 (New England Biolabs)에 부착된 시약을 사용하여 다음과 같이 sgRNA 및 Cas9와 혼합하였다:
100 ng 기질 DNA + 0.5 ng sgRNA + 0.3 pmol Cas9 (총량 10 μL)
이를 37℃에서 15분간 인큐베이션하고, 70℃에서 10분간 추가로 인큐베이션하여 Cas9를 불활성화하였다. 그 후에, 전기천공을 수행하였고, 에티디움 브로마이드 염색 후에 밴드 강도를 이미징 시스템 PXi4 (SYNGENE)를 사용하여 측정하였다.
측정 결과를 토대로, 절단 효율을 하기 식에 의해 계산하였다.
절단 효율 = 절단된 밴드 강도의 합/(절단 및 비절단된 밴드 강도의 합)
결과를 도 10에 나타내었다. 겔 하의 수치는 상기에 언급한 계산식에 의해 결정되는 절단 효율을 나타낸다. 또한, 1로서 참고예에서 천연형 sgRNA (SG-0090)의 절단 효율에 대한 이 실시예의 인공 sgRNA의 상대적 절단 효율을 도 11에 나타내었다.
이 실시예의 인공 sgRNA는 참고예에서 천연형 sgRNA의 것과 동일하거나 그보다 더 높은 절단 효율을 나타내었고, 각각의 부위를 아미노산 유도체로 치환하는 것이 효과적임이 명백해졌다.
( 실험예 6) BCL -2 유전자를 표적하는 sgRNA의 세포 내 절단 활성의 평가
저켓 (Jurkat) 세포 (2×105 세포)를 마이크로튜브에 수집하고, PBS로 세척하고, 6 μg GeneArt Platinum Cas9 뉴클리아제 (Thermo Fisher Scientific) 및 1.2 μg sgRNA를 Neon 10 μL 팁 (Thermo Fisher Scientific)에 부착된 ReSuspension 완충제 R에 첨가하여 수득된 시험 물질 용액 (10 μL)에 현탁하였다. 세포 현탁액을 Neon 10 μL 팁 내로 흡인하고 펄스 전압 1700V, 펄스 폭 20 ms, 펄스 횟수 1회의 조건하에서 전기천공기 Neon (Thermo Fisher Scientific)을 사용하여 형질감염시켰다. 수득된 세포를 24-웰 접시 (Thermo Fisher Scientific)에서 10% 소 태아 혈청 (MP Biomedicals)을 함유하는 RPMI1640 배지 (Thermo Fisher Scientific) (500 μL)에 접종하였다. 5% CO2 하 37℃에서 48시간 동안 배양한 후, 세포를 회수하고, PBS로 세척하고 게놈 DNA를 GeneArt (등록된 상품명) 게놈 절단 검출 키트 (Thermo Fisher Scientific)를 사용하여 정제하였다. 주형으로서 수득된 게놈 DNA의 일부 및 인간 BCL-2 유전자 증폭용 프라이머 세트: 5'-ATCAAGTGTTCCGCGTGATTGAAGA-3'/5'-CTCACATCACCAAGTGCACCTACCC-3'를 사용하여, PCR을 GeneArt (등록된 상품명) 게놈 절단 검출 키트에 부착된 프로토콜에 따라서 수행하였다. 수득된 PCR 생성물을 사용하고 GeneArt (등록된 상품명) 게놈 절단 검출 키트에 첨부된 프로토콜에 따라서, 염색체 in-del 검출 반응을 수행하였다. 그 후에, 아가로스 겔 전기영동을 수행하고, 겔을 에티디움 브로마이드로 염색하고, 겔 상의 밴드 강도를 겔 imagint 시스템 PXi4 (SYNGENE)를 사용하여 측정하였다.
측정 결과를 토대로, 절단 효율을 하기 식에 의해 계산하였다.
절단 효율 = 1- [(1-절단된 분획) 1/2]
절단된 분획 = 절단된 밴드 강도의 합/(절단 및 비절단된 밴드 강도의 합)
결과를 도 12에 나타내었다. 겔 하의 수치는 상기에 언급한 계산식에 의해 결정되는 절단 효율을 나타낸다. 또한, 1로서 참고예에서 천연형 sgRNA (SG-0017)의 절단 효율에 대한 이 실시예의 인공 sgRNA의 상대적 절단 효율을 도 13에 나타내었다.
이 실시예의 인공 sgRNA의 일부는 세포에서 또한 참고예에서 천연형 sgRNA의 것과 동일하거나 그보다 더 높은 절단 효율을 나타내었다.
( 실험예 7) BRAF 유전자를 표적하는 sgRNA의 세포 내 절단 활성의 평가
A-375 세포 (5.6×104 세포)를 마이크로튜브에 수집하고, PBS로 세척하고, 6 μg GeneArt Platinum Cas9 뉴클리아제 (Thermo Fisher Scientific) 및 1.2 μg sgRNA를 Neon 10 μL 팁 (Thermo Fisher Scientific)에 부착된 ReSuspension 완충제 R에 첨가하여 수득된 시험 물질 용액 (10 μL)에 현탁하였다. 세포 현탁액을 Neon 10 μL 팁 내로 흡인하고 펄스 전압 1700V, 펄스 폭 20 ms, 펄스 횟수 2회의 조건하에서 전기천공기 Neon (Thermo Fisher Scientific)을 사용하여 형질감염시켰다. 수득된 세포를 24-웰 접시 (Thermo Fisher Scientific)에서 10% 소 태아 혈청 (MP Biomedicals)을 함유하는 둘베코의 변형된 이글 배지 (High Glucose) (Sigma Aldrich) (500 μL)에 접종하였다. 5% CO2 하 37℃에서 48시간 동안 배양한 후, 세포를 회수하고, PBS로 세척하고 게놈 DNA를 GeneArt (등록된 상품명) 게놈 절단 검출 키트 (Thermo Fisher Scientific)를 사용하여 정제하였다. 주형으로서 수득된 게놈 DNA의 일부 및 인간 BRAF 유전자 증폭용 프라이머 세트: 5'-CGCCCAGGAGTGCCAAGAGAATATC-3'/5'-CAGCAGCATCTCAGGGCCAAAAAT-3'를 사용하여, PCR을 GeneArt (등록된 상품명) 게놈 절단 검출 키트에 부착된 프로토콜에 따라서 수행하였다. 수득된 PCR 생성물을 사용하고 GeneArt (등록된 상품명) 게놈 절단 검출 키트에 첨부된 프로토콜에 따라서, 염색체 in-del 검출 반응을 수행하였다. 그 후에, 아가로스 겔 전기영동을 수행하고, 겔을 에티디움 브로마이드로 염색하고, 겔 상의 밴드 강도를 겔 imagint 시스템 PXi4 (SYNGENE)를 사용하여 측정하였다.
측정 결과를 토대로, 절단 효율을 하기 식에 의해 계산하였다.
절단 효율 = 1- [(1-절단된 분획) 1/2]
절단된 분획 = 절단된 밴드 강도의 합/(절단 및 비절단된 밴드 강도의 합)
결과를 도 14에 나타내었다. 겔 하의 수치는 상기에 언급한 계산식에 의해 결정되는 절단 효율을 나타낸다. 또한, 1로서 참고예에서 천연형 sgRNA (SG-0090)의 절단 효율에 대한 이 실시예의 인공 sgRNA의 상대적 절단 효율을 도 15에 나타내었다.
이 실시예의 인공 sgRNA의 일부는 세포에서 또한 참고예에서 천연형 sgRNA의 것과 동일하거나 그보다 더 높은 절단 효율을 나타내었다.
이상 본 발명을 실시양태를 인용하면서 설명하였지만, 본 발명은 상기에 언급한 실시양태로 제한되지 않는다. 본 발명의 구성 및 세부사항은 당업자가 본 발명의 범위 내에서 이해할 수 있는 한 다양하게 변형될 수 있다.
특허 및 특허 출원을 비롯해 본원에 인용된 임의의 공보에 개시된 내용은 본 명세서에 개시된 범위 내에서 참조로서 그의 전체가 본원에 포함된다.
이 출원은 그의 내용 전채가 본원에 포함되는, 일본에서 출원된 특허 출원 제2016-016743호 (출원일: 2016년 1월 30일)를 토대로 한다.
[산업상 이용가능성]
본 발명의 인공 sgRNA는 저비용으로 쉽게 합성될 수 있고 천연형 sgRNA와 동일하거나 그보다 더 높은 DSB 활성을 유지하면서 Cas9과 조합하는 경우 생체 내 안정성을 향상시킬 수 있다. 따라서, 이는 게놈 편집 효율, 특히 생체 내 게놈 편집 효율을 향상시키는데 유용하다.
SEQUENCE LISTING <110> BONAC CORPORATION <120> ARTIFICIAL SINGLE GUIDE RNA AND USE THEREOF <130> IPA180907-JP <150> JP 2016-016743 <151> 2016-01-30 <160> 83 <170> PatentIn version 3.5 <210> 1 <211> 42 <212> RNA <213> Artificial Sequence <220> <223> crRNA derived from Streptococcus pyogenes <220> <221> misc_feature <222> (1)..(20) <223> Guide region of crRNA <400> 1 nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu ug 42 <210> 2 <211> 69 <212> RNA <213> Streptococcus pyogenes <220> <221> misc_feature <222> (1)..(69) <223> tracrRNA derived from Streptococcus pyogenes <400> 2 aaacagcaua gcaaguuaaa auaaggcuag uccguuauca acuugaaaaa guggcaccga 60 gucggugcu 69 <210> 3 <211> 98 <212> RNA <213> Artificial Sequence <220> <223> sgRNA derived from Streptococcus pyogenes <220> <221> misc_feature <222> (1)..(20) <223> Guide region of sgRNA <400> 3 nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuu 98 <210> 4 <211> 99 <212> RNA <213> Artificial Sequence <220> <223> sgRNA SG-0001 specifically binding to human KRAS gene <400> 4 guaguuggag cuguuggcgu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuu 99 <210> 5 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0002 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <400> 5 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 6 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0012 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via lysine derivative linker. <400> 6 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 7 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0013 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via glycylglycine derivative linker. <400> 7 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 8 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0014 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (68)..(69) <223> The 68th "u" and the 69th "a" are linked via proline derivative linker. <400> 8 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuaa guggcaccga gucggugcuu u 91 <210> 9 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0015 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (58)..(59) <223> The 58th "g" and the 59th "a" are linked via glycylglycine derivative linker. <220> <221> misc_feature <222> (63)..(64) <223> The 63rd "u" and the 64th "a" are linked via proline derivative linker. <400> 9 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccgaa 60 cuuaaguggc accgagucgg ugcuuu 86 <210> 10 <211> 94 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0016 specifically binding to human KRAS gene <220> <221> misc_feature <222> (1)..(1) <223> The 1st "g" is modified with proline derivative linker. <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (93)..(94) <223> The 93rd "u" and the 94th "u" are linked via proline derivative linker. <400> 10 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuu 94 <210> 11 <211> 99 <212> RNA <213> Artificial Sequence <220> <223> sgRNA SG-0017 specifically binding to human BCL-2 gene <400> 11 aagcgucccc gcgcggugaa guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuu 99 <210> 12 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0018 specifically binding to human BCL-2 gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <400> 12 aagcgucccc gcgcggugaa guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 13 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0019 specifically binding to human BCL-2 gene <220> <221> misc_feature <223> The 32nd "a" and the 33rd "u" are linked via lysine derivative linker. <400> 13 aagcgucccc gcgcggugaa guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 14 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0020 specifically binding to human BCL-2 gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via glycylglycine derivative linker. <400> 14 aagcgucccc gcgcggugaa guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 15 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0021 specifically binding to human BCL-2 gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (68)..(69) <223> The 68th "u" and the 69th "a" are linked via proline derivative linker. <400> 15 aagcgucccc gcgcggugaa guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuaa guggcaccga gucggugcuu u 91 <210> 16 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0022 specifically binding to human BCL-2 gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (58)..(59) <223> The 58th "g" and the 59th "a" are linked via glycylglycine derivative linker. <220> <221> misc_feature <222> (63)..(64) <223> The 63rd "u" and the 64th "a" are linked via proline derivative linker. <400> 16 aagcgucccc gcgcggugaa guuuuagagc uauagcaagu uaaaauaagg cuaguccgaa 60 cuuaaguggc accgagucgg ugcuuu 86 <210> 17 <211> 94 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0023 specifically binding to human BCL-2 gene <220> <221> misc_feature <222> (1)..(1) <223> The 1st "a" is modified with proline derivative linker. <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (93)..(94) <223> The 93rd "u" and the 94th "u" are linked via proline derivative linker. <400> 17 aagcgucccc gcgcggugaa guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuu 94 <210> 18 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0024 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative (P13) linker. <400> 18 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 19 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0025 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative (P14) linker. <400> 19 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 20 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0026 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative (P15) linker. <400> 20 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 21 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0027 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via phenylalanine derivative linker. <400> 21 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 22 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0028 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via leucine derivative linker. <400> 22 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 23 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0029 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via glutamic acid derivative linker. <400> 23 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 24 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0030 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (58)..(59) <223> The 58th "g" and the 59th "a" are linked via proline derivative linker. <220> <221> misc_feature <222> (63)..(64) <223> The 63rd "u" and the 64th "a" are linked via proline derivative linker. <400> 24 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccgaa 60 cuuaaguggc accgagucgg ugcuuu 86 <210> 25 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0031 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (58)..(59) <223> The 58th "g" and the 59th "a" are linked via proline derivative (P13) linker. <220> <221> misc_feature <222> (63)..(64) <223> The 63rd "u" and the 64th "a" are linked via proline derivative linker. <400> 25 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccgaa 60 cuuaaguggc accgagucgg ugcuuu 86 <210> 26 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0032 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (58)..(59) <223> The 58th "g" and the 59th "a" are linked via proline derivative (P14) linker. <220> <221> misc_feature <222> (63)..(64) <223> The 63rd "u" and the 64th "a" are linked via proline derivative linker. <400> 26 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccgaa 60 cuuaaguggc accgagucgg ugcuuu 86 <210> 27 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0033 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (58)..(59) <223> The 58th "g" and the 59th "a" are linked via proline derivative (P15) linker. <220> <221> misc_feature <222> (63)..(64) <223> The 63rd "u" and the 64th "a" are linked via proline derivative linker. <400> 27 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccgaa 60 cuuaaguggc accgagucgg ugcuuu 86 <210> 28 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0034 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (58)..(59) <223> The 58th "g" and the 59th "a" are linked via phenylalanine derivative linker. <220> <221> misc_feature <222> (63)..(64) <223> The 63rd "u" and the 64th "a" are linked via proline derivative linker. <400> 28 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccgaa 60 cuuaaguggc accgagucgg ugcuuu 86 <210> 29 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0035 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (58)..(59) <223> The 58th "g" and the 59th "a" are linked via leucine derivative linker. <220> <221> misc_feature <222> (63)..(64) <223> The 63rd "u" and the 64th "a" are linked via proline derivative linker. <400> 29 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccgaa 60 cuuaaguggc accgagucgg ugcuuu 86 <210> 30 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0036 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (58)..(59) <223> The 58th "g" and the 59th "a" are linked via glutamic acid derivative linker. <220> <221> misc_feature <222> (63)..(64) <223> The 63rd "u" and the 64th "a" are linked via proline derivative linker. <400> 30 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccgaa 60 cuuaaguggc accgagucgg ugcuuu 86 <210> 31 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0050 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via glycine derivative linker. <400> 31 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 32 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0051 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via terephthalic acid derivative linker. <400> 32 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 33 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0052 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (58)..(59) <223> The 58th "g" and the 59th "a" are linked via glycine derivative linker. <220> <221> misc_feature <222> (63)..(64) <223> The 63rd "u" and the 64th "a" are linked via proline derivative linker. <400> 33 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccgaa 60 cuuaaguggc accgagucgg ugcuuu 86 <210> 34 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0053 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (58)..(59) <223> The 58th "g" and the 59th "a" are linked via terephthalic acid derivative linker. <220> <221> misc_feature <222> (63)..(64) <223> The 63rd "u" and the 64th "a" are linked via proline derivative linker. <400> 34 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccgaa 60 cuuaaguggc accgagucgg ugcuuu 86 <210> 35 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0075 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via lysine derivative linker. <220> <221> misc_feature <222> (68)..(69) <223> The 68th "u" and the 69th "a" are linked via lysine derivative linker. <400> 35 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuaa guggcaccga gucggugcuu u 91 <210> 36 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0076 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via glycylglycine derivative linker. <220> <221> misc_feature <222> (68)..(69) <223> The 68th "u" and the 69th "a" are linked via glycylglycine derivative linker. <400> 36 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuaa guggcaccga gucggugcuu u 91 <210> 37 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0077 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via glycine derivative linker. <220> <221> misc_feature <222> (68)..(69) <223> The 68th "u" and the 69th "a" are linked via glycine derivative linker. <400> 37 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuaa guggcaccga gucggugcuu u 91 <210> 38 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0078 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via terephthalic acid derivative linker. <220> <221> misc_feature <222> (68)..(69) <223> The 68th "u" and the 69th "a" are linked via terephthalic acid derivative linker. <400> 38 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuaa guggcaccga gucggugcuu u 91 <210> 39 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0079 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via phenylalanine derivative linker. <220> <221> misc_feature <222> (68)..(69) <223> The 68th "u" and the 69th "a" are linked via phenylalanine derivative linker. <400> 39 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuaa guggcaccga gucggugcuu u 91 <210> 40 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0080 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via leucine derivative linker. <220> <221> misc_feature <222> (68)..(69) <223> The 68th "u" and the 69th "a" are linked via leucine derivative linker. <400> 40 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuaa guggcaccga gucggugcuu u 91 <210> 41 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0081 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via glutamic acid derivative linker. <220> <221> misc_feature <222> (68)..(69) <223> The 68th "u" and the 69th "a" are linked via glutamic acid derivative linker. <400> 41 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuaa guggcaccga gucggugcuu u 91 <210> 42 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0082 specifically binding to human KRAS gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (58)..(59) <223> The 58th "g" and the 59th "a" are linked via lysine derivative linker. <220> <221> misc_feature <222> (63)..(64) <223> The 63rd "u" and the 64th "a" are linked via proline derivative linker. <400> 42 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccgaa 60 cuuaaguggc accgagucgg ugcuuu 86 <210> 43 <211> 94 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0083 specifically binding to human KRAS gene <220> <221> misc_feature <222> (1)..(1) <223> The 1st "g" is modified with lysine derivative linker. <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (93)..(94) <223> The 93rd "u" and the 94th "u" are linked via lysine derivative linker. <400> 43 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuu 94 <210> 44 <211> 94 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0084 specifically binding to human KRAS gene <220> <221> misc_feature <222> (1)..(1) <223> The 1st "g" is modified with glycylglycine derivative linker. <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (93)..(94) <223> The 93rd "u" and the 94th "u" are linked via glycylglycine derivative linker. <400> 44 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuu 94 <210> 45 <211> 94 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0085 specifically binding to human KRAS gene <220> <221> misc_feature <222> (1)..(1) <223> The 1st "g" is modified with glycine derivative linker. <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (93)..(94) <223> The 93rd "u" and the 94th "u" are linked via glycine derivative linker. <400> 45 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuu 94 <210> 46 <211> 94 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0086 specifically binding to human KRAS gene <220> <221> misc_feature <222> (1)..(1) <223> The 1st "g" is modified with terephthalic acid derivative linker. <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (93)..(94) <223> The 93rd "u" and the 94th "u" are linked via terephthalic acid derivative linker. <400> 46 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuu 94 <210> 47 <211> 94 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0087 specifically binding to human KRAS gene <220> <221> misc_feature <222> (1)..(1) <223> The 1st "a" is modified with phenylalanine derivative linker. <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (93)..(94) <223> The 93rd "u" and the 94th "u" are linked via phenylalanine derivative linker. <400> 47 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuu 94 <210> 48 <211> 94 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0088 specifically binding to human KRAS gene <220> <221> misc_feature <222> (1)..(1) <223> The 1st "g" is modified with leucine derivative linker. <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (93)..(94) <223> The 93rd "u" and the 94th "u" are linked via leucine derivative linker. <400> 48 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuu 94 <210> 49 <211> 94 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0089 specifically binding to human KRAS gene <220> <221> misc_feature <222> (1)..(1) <223> The 1st "g" is modified with glutamic acid derivative linker. <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (93)..(94) <223> The 93rd "u" and the 94th "u" are linked via glutamic acid derivative linker. <400> 49 guaguuggag cuguuggcgu guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuu 94 <210> 50 <211> 62 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0004 specifically binding to human KRAS gene <400> 50 guaguuggag cuguuggcgu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cg 62 <210> 51 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0054 specifically binding to human KRAS gene <400> 51 guaguuggag cuguuggcgu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu 80 <210> 52 <211> 55 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0055 specifically binding to human KRAS gene <400> 52 guaguuggag cuguuggcgu guuuuagagc uagaaauagc aaguuaaaau aaggc 55 <210> 53 <211> 50 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0056 specifically binding to human KRAS gene <400> 53 guaguuggag cuguuggcgu guuuuagagc uagaaauagc aaguuaaaau 50 <210> 54 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0057 specifically binding to human KRAS gene <400> 54 guaguuggag cuguuggcgu guuuuagagc uagaaauagc aaguu 45 <210> 55 <211> 97 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0058 specifically binding to human KRAS gene <220> <221> misc_feature <222> (55)..(56) <223> The 55th "c" and the 56th "g" are linked via proline derivative linker. <400> 55 guaguuggag cuguuggcgu guuuuagagc uagaaauagc aaguuaaaau aaggcguccg 60 uuaucaacuu gaaaaagugg caccgagucg gugcuuu 97 <210> 56 <211> 96 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0059 specifically binding to human KRAS gene <220> <221> misc_feature <222> (87)..(88) <223> The 87th "g" and the 88th "c" are linked via proline derivative linker. <400> 56 guaguuggag cuguuggcgu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgcgg ugcuuu 96 <210> 57 <211> 89 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0060 specifically binding to human KRAS gene <220> <221> misc_feature <222> (29)..(30) <223> The 29th "g" and the 30th "c" are linked via proline derivative linker. <400> 57 guaguuggag cuguuggcgu guuuuagagc aaguuaaaau aaggcuaguc cguuaucaac 60 uugaaaaagu ggcaccgagu cggugcuuu 89 <210> 58 <211> 87 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0061 specifically binding to human KRAS gene <220> <221> misc_feature <222> (68)..(69) <223> The 68th "a" and the 69th "g" are linked via proline derivative linker. <400> 58 guaguuggag cuguuggcgu guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucagg caccgagucg gugcuuu 87 <210> 59 <211> 72 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0062 specifically binding to human KRAS gene <220> <221> misc_feature <222> (29)..(30) <223> The 29th "g" and the 30th "c" are linked via proline derivative linker. <220> <221> misc_feature <222> (52)..(53) <223> The 52nd "g" and the 53rd "a" are linked via proline derivative linker. <220> <221> misc_feature <222> (53)..(54) <223> The 53rd "a" and the 54th "g" are linked via proline derivative linker. <400> 59 guaguuggag cuguuggcgu guuuuagagc aaguuaaaau aaggcuaguc cgaggcaccg 60 agucggugcu uu 72 <210> 60 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0037 specifically binding to human BCL-2 gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative (P13) linker. <400> 60 aagcgucccc gcgcggugaa guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 61 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0038 specifically binding to human BCL-2 gene <220> <221> misc_feature <222> (352)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative (P14) linker. <400> 61 aagcgucccc gcgcggugaa guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 62 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0039 specifically binding to human BCL-2 gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative (P15) linker. <400> 62 aagcgucccc gcgcggugaa guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 63 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0040 specifically binding to human BCL-2 gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via phenylalanine derivative linker. <400> 63 aagcgucccc gcgcggugaa guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 64 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0041 specifically binding to human BCL-2 gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via leucine derivative linker. <400> 64 aagcgucccc gcgcggugaa guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 65 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0042 specifically binding to human BCL-2 gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via glutamic acid derivative linker. <400> 65 aagcgucccc gcgcggugaa guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 66 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0043 specifically binding to human BCL-2 gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (58)..(59) <223> The 58th "g" and the 59th "a" are linked via proline derivative linker. <220> <221> misc_feature <222> (63)..(64) <223> The 63rd "u" and the 64th "a" are linked via proline derivative linker. <400> 66 aagcgucccc gcgcggugaa guuuuagagc uauagcaagu uaaaauaagg cuaguccgaa 60 cuuaaguggc accgagucgg ugcuuu 86 <210> 67 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0044 specifically binding to human BCL-2 gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (58)..(59) <223> The 58th "g" and the 59th "a" are linked via proline derivative (P13) linker. <220> <221> misc_feature <222> (63)..(64) <223> The 63rd "u" and the 64th "a" are linked via proline derivative linker. <400> 67 aagcgucccc gcgcggugaa guuuuagagc uauagcaagu uaaaauaagg cuaguccgaa 60 cuuaaguggc accgagucgg ugcuuu 86 <210> 68 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0045 specifically binding to human BCL-2 gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (58)..(59) <223> The 58th "g" and the 59th "a" are linked via proline derivative (P14) linker. <220> <221> misc_feature <222> (63)..(64) <223> The 63rd "u" and the 64th "a" are linked via proline derivative linker. <400> 68 aagcgucccc gcgcggugaa guuuuagagc uauagcaagu uaaaauaagg cuaguccgaa 60 cuuaaguggc accgagucgg ugcuuu 86 <210> 69 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0046 specifically binding to human BCL-2 gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (58)..(59) <223> The 58th "g" and the 59th "a" are linked via proline derivative (P15) linker. <220> <221> misc_feature <222> (63)..(64) <223> The 63rd "u" and the 64th "a" are linked via proline derivative linker. <400> 69 aagcgucccc gcgcggugaa guuuuagagc uauagcaagu uaaaauaagg cuaguccgaa 60 cuuaaguggc accgagucgg ugcuuu 86 <210> 70 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0047 specifically binding to human BCL-2 gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (58)..(59) <223> The 58th "g" and the 59th "a" are linked via phenylalanine derivative linker. <220> <221> misc_feature <222> (63)..(64) <223> The 63rd "u" and the 64th "a" are linked via proline derivative linker. <400> 70 aagcgucccc gcgcggugaa guuuuagagc uauagcaagu uaaaauaagg cuaguccgaa 60 cuuaaguggc accgagucgg ugcuuu 86 <210> 71 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0048 specifically binding to human BCL-2 gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (58)..(59) <223> The 58th "g" and the 59th "a" are linked via leucine derivative linker. <220> <221> misc_feature <222> (63)..(64) <223> The 63rd "u" and the 64th "a" are linked via proline derivative linker. <400> 71 aagcgucccc gcgcggugaa guuuuagagc uauagcaagu uaaaauaagg cuaguccgaa 60 cuuaaguggc accgagucgg ugcuuu 86 <210> 72 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0049 specifically binding to human BCL-2 gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (58)..(59) <223> The 58th "g" and the 59th "a" are linked via glutamic acid derivative linker. <220> <221> misc_feature <222> (63)..(64) <223> The 63rd "u" and the 64th "a" are linked via proline derivative linker. <400> 72 aagcgucccc gcgcggugaa guuuuagagc uauagcaagu uaaaauaagg cuaguccgaa 60 cuuaaguggc accgagucgg ugcuuu 86 <210> 73 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0063 specifically binding to human BCL-2 gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via lysine derivative linker. <220> <221> misc_feature <222> (68)..(69) <223> The 68th "u" and the 69th "a" are linked via lysine derivative linker. <400> 73 aagcgucccc gcgcggugaa guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuaa guggcaccga gucggugcuu u 91 <210> 74 <211> 94 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0064 specifically binding to human BCL-2 gene <220> <221> misc_feature <222> (1)..(1) <223> The 1st "a" is modified with lysine derivative linker. <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (93)..(94) <223> The 93rd "u" and the 94th "u" are linked via lysine derivative linker. <400> 74 aagcgucccc gcgcggugaa guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuu 94 <210> 75 <211> 99 <212> RNA <213> Artificial Sequence <220> <223> sgRNA SG-0090 specifically binding to human BRAF gene <400> 75 uagcuacaga gaaaucucga guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuu 99 <210> 76 <211> 91 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0093 specifically binding to human BRAF gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (68)..(69) <223> The 68th "u" and the 69th "a" are linked via proline derivative linker. <400> 76 uagcuacaga gaaaucucga guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuaa guggcaccga gucggugcuu u 91 <210> 77 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0096 specifically binding to human BRAF gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <400> 77 uagcuacaga gaaaucucga guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 78 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0097 specifically binding to human BRAF gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via lysine derivative linker. <400> 78 uagcuacaga gaaaucucga guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuuu 95 <210> 79 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0098 specifically binding to human BRAF gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (58)..(59) <223> The 58th "g" and the 59th "a" are linked via proline derivative linker. <220> <221> misc_feature <222> (63)..(64) <223> The 63rd "u" and the 64th "a" are linked via proline derivative linker. <400> 79 uagcuacaga gaaaucucga guuuuagagc uauagcaagu uaaaauaagg cuaguccgaa 60 cuuaaguggc accgagucgg ugcuuu 86 <210> 80 <211> 86 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0099 specifically binding to human BRAF gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (58)..(59) <223> The 58th "g" and the 59th "a" are linked via glycylglycine derivative linker. <220> <221> misc_feature <222> (63)..(64) <223> The 63rd "u" and the 64th "a" are linked via proline derivative linker. <400> 80 uagcuacaga gaaaucucga guuuuagagc uauagcaagu uaaaauaagg cuaguccgaa 60 cuuaaguggc accgagucgg ugcuuu 86 <210> 81 <211> 92 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0100 specifically binding to human BRAF gene <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via lysine derivative linker. <220> <221> misc_feature <222> (68)..(69) <223> The 68th "u" and the 69th "a" are linked via lysine derivative linker. <400> 81 uagcuacaga gaaaucucga guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuka aguggcaccg agucggugcu uu 92 <210> 82 <211> 94 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0101 specifically binding to human BRAF gene <220> <221> misc_feature <222> (1)..(1) <223> The 1st "u" is modified with proline derivative linker. <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (93)..(94) <223> The 93rd "u" and the 94th "u" are linked via proline derivative linker. <400> 82 uagcuacaga gaaaucucga guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuu 94 <210> 83 <211> 94 <212> RNA <213> Artificial Sequence <220> <223> Modified sgRNA SG-0102 specifically binding to human BRAF gene <220> <221> misc_feature <222> (1)..(1) <223> The 1st "u" is modified with lysine derivative linker. <220> <221> misc_feature <222> (32)..(33) <223> The 32nd "a" and the 33rd "u" are linked via proline derivative linker. <220> <221> misc_feature <222> (93)..(94) <223> The 93rd "u" and the 94th "u" are linked via lysine derivative linker. <400> 83 uagcuacaga gaaaucucga guuuuagagc uauagcaagu uaaaauaagg cuaguccguu 60 aucaacuuga aaaaguggca ccgagucggu gcuu 94

Claims (44)

  1. 하기 식 (A)로 표시되는 단일 가이드(single guide) RNA:
    Figure 112020140951916-pct00053

    [식 (A)에서, Xa는 하기 식으로 표시되는 것 중의 어느 하나인 아미노산 유도체 링커(linker)임:
    Figure 112020140951916-pct00077

    (상기 식에서, n 및 m은 각각 독립적으로 0 내지 30의 정수임)
    Figure 112020140951916-pct00078

    (상기 식에서, n 및 m은 각각 독립적으로 0 내지 30의 정수이고, q는 0 내지 10의 정수임)
    Figure 112020140951916-pct00079

    (상기 식에서, n 및 m은 각각 독립적으로 0 내지 30의 정수임)
    식 (A)에서, Y는 식 (I-1) 내지 (I-7), (II-1) 내지 (II-9), 및 (III-1) 내지 (III-3) 중의 어느 하나로 표시되는 아미노산 유도체 링커를 나타내고,
    식 (A)에서, Xb는 식 (I-1), (I-4), (I-6), (I-7), (II-1) 내지 (II-9), 및 (III-1) 내지 (III-3) 중의 어느 하나로 표시되는 아미노산 유도체 링커를 나타내고,
    식 (A)에서, Xc 및 Xd는 존재하거나 부존재할 수 있고, 이들이 존재하는 경우, 이들은 각각 독립적으로 식 (I-1), (I-4), (I-6), (I-7), (II-1) 내지 (II-9), 및 (III-1) 내지 (III-3) 중의 어느 하나로 표시되는 아미노산 유도체 링커이고,
    식 (A)에서, (n)20은 이들 각각이 독립적으로 A, G, C 또는 U인 20±5개 뉴클레오티드 잔기로 이루어진 뉴클레오티드 서열임].
  2. 삭제
  3. 제1항에 있어서, 상기 Xa가 식 (I-1) 내지 (I-7) 중의 어느 하나로 표시되는 것인, 단일 가이드 RNA.
  4. 제3항에 있어서, 상기 Xa가 식 (I-4) 또는 (I-7) (여기서 n=5이고 m=4임)로 표시되는 것인, 단일 가이드 RNA.
  5. 제3항에 있어서, 상기 Xa가 식 (I-1) (여기서 n=5이고 m=4임) 또는 식 (I-6) (여기서 n=4 및 m=4임)으로 표시되는 것인, 단일 가이드 RNA.
  6. 삭제
  7. 제1항에 있어서, 상기 Xa가 식 (II-1) 내지 (II-9) 중의 어느 하나로 표시되는 것인, 단일 가이드 RNA.
  8. 제7항에 있어서, 상기 Xa가 식 (II-8) (여기서 n=5이고 m=4이거나, n=7이고 m=6이거나, n=9이고 m=8이거나, 또는 n=11이고 m=10임)로 표시되는 것인, 단일 가이드 RNA.
  9. 제1항에 있어서, 상기 Xa가 식 (III-1) 내지 (III-3) 중의 어느 하나로 표시되는 것인, 단일 가이드 RNA.
  10. 제9항에 있어서, 상기 각각의 식에서, n=5이고 m=4인 것인, 단일 가이드 RNA.
  11. 삭제
  12. 제1항에 있어서, 상기 Xc 및 Xd가 부존재하는 것인, 단일 가이드 RNA.
  13. 제1항에 있어서, 상기 Xc 및 Xd가 각각 독립적으로 식 (I-1), (I-4), (I-6), 및 (I-7) 중의 어느 하나로 표시되는 아미노산 유도체 링커인 것인, 단일 가이드 RNA.
  14. 제1항에 있어서, 상기 Xc 및 Xd가 각각 독립적으로 식 (II-1) 내지 (II-9) 중의 어느 하나로 표시되는 아미노산 유도체 링커인 것인, 단일 가이드 RNA.
  15. 제14항에 있어서, 상기 Xc 및 Xd가 식 (II-8) (여기서 n=5이고 m=4임)로 표시되는 것인, 단일 가이드 RNA.
  16. 제1항에 있어서, 상기 Xc 및 Xd가 식 (I-1), (I-4), (I-7) 및 (III-1) 내지 (III-3) 중 어느 하나 (여기서 n=5이고 m=4임), 또는 식 (I-6) (여기서 n=4이고 m=4임)으로 표시되는 것인, 단일 가이드 RNA.
  17. 제1항에 있어서, 상기 Xb가 식 (I-1), (I-4), (I-6), 및 (I-7) 중의 어느 하나로 표시되는 아미노산 유도체 링커인 것인, 단일 가이드 RNA.
  18. 제17항에 있어서, 상기 Xb가 식 (II-1) 내지 (II-9) 중의 어느 하나로 표시되는 아미노산 유도체 링커인 것인, 단일 가이드 RNA.
  19. 제1항에 있어서, 상기 Xb가 식 (II-8) (여기서 n=5이고 m=4임)로 표시되는 것인, 단일 가이드 RNA.
  20. 제1항에 있어서, 상기 Xb가 식 (I-1), (I-4), (I-7) 및 (III-1) 내지 (III-3) 중의 어느 하나 (여기서 n=5이고 m=4임)로 표시되거나, 또는 식 (I-6) (여기서 n=4이고 m=4임)으로 표시되는 것인, 단일 가이드 RNA.
  21. 삭제
  22. 제17항에 있어서, 상기 Y가 식 (I-1) 내지 (I-7) 중의 어느 하나로 표시되는 아미노산 유도체 링커인 것인, 단일 가이드 RNA.
  23. 제22항에 있어서, 상기 Y가 식 (I-4) (여기서 n=5이고 m=4임)로 표시되는 것인, 단일 가이드 RNA.
  24. 제17항에 있어서, 상기 Y가 식 (II-1) 내지 (II-9) 중의 어느 하나로 표시되는 아미노산 유도체 링커인 것인, 단일 가이드RNA.
  25. 제24항에 있어서, 상기 Y가 식 (II-8) (여기서 n=5이고 m=4이거나, n=7이고 m=6이거나, n=9이고 m=8이거나, 또는 n=11이고 m=10임)로 표시되는 것인, 단일 가이드 RNA.
  26. 제1항에 있어서, 상기 Y가 식 (I-1), (I-7) 및 (III-1) 내지 (III-3) 중의 어느 하나 (여기서 n=5이고 m=4임)로 표시되거나, 또는 식 (I-6) (여기서 n=4이고 m=4임)으로 표시되는 것인, 단일 가이드 RNA.
  27. 제7항에 있어서, 상기 Xa가 식 (II-8) (여기서 n=5이고 m=4임)로 표시되고, Xa에 인접한 스템 (stem)의 1 내지 3개 염기쌍이 제거되는 것인, 단일 가이드 RNA.
  28. 제19항에 있어서, Xb에 인접한 스템의 1 내지 4개 염기쌍이 제거되는 것인, 단일 가이드 RNA.
  29. 제28항에 있어서, 상기 Xa가 식 (II-8) (여기서 n=5이고 m=4임)로 표시되고, Xa에 인접한 스템의 1 내지 3개 염기쌍이 제거되는 것인, 단일 가이드 RNA.
  30. 삭제
  31. 제1항에 따른 단일 가이드 RNA 및 Cas9를 조합하여 포함하는 CRISPR/Cas9 시스템.
  32. 제31항에 있어서, 상기 Cas9가 스트렙토코커스 피오게네스 (Streptococcus pyogenes)로부터 유래하는 것인, CRISPR/Cas9 시스템.
  33. 제31항에 있어서, 상기 Cas9가 단백질, 이를 암호화하는 mRNA 또는 이를 암호화하는 DNA를 포함하는 발현 벡터의 형태인 것인, CRISPR/Cas9 시스템.
  34. 제31항에 따른 CRISPR/Cas9 시스템을 표적 이중-가닥 DNA와 접촉시키는 것을 포함하는, 이중-가닥 DNA를 인식하는 방법으로서, 상기 접촉은 인간의 생체 내 (in vivo)에서의 접촉은 제외하는 것인 방법.
  35. 제34항에 있어서, Cas9 단백질이 이중-가닥 DNA 절단 활성을 갖는 것인, 방법.
  36. 제35항에 있어서, 상기 이중-가닥 DNA가 세포 내에서 절단되는 것인, 방법.
  37. 제36항에 있어서, 표적 유전자를 넉아웃 (knock out)하기 위한, 방법.
  38. 제36항에 있어서, 표적 유전자 내 염기를 변형하거나 상기 유전자에 외인성 유전자를 삽입하기 위한, 방법.
  39. 삭제
  40. 삭제
  41. 삭제
  42. 삭제
  43. 삭제
  44. 삭제
KR1020187024080A 2016-01-30 2017-01-30 인공 단일 가이드 rna 및 이의 용도 KR102255995B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JPJP-P-2016-016743 2016-01-30
JP2016016743 2016-01-30
PCT/JP2017/003251 WO2017131237A1 (ja) 2016-01-30 2017-01-30 人工単一ガイドrna及びその用途

Publications (2)

Publication Number Publication Date
KR20180100692A KR20180100692A (ko) 2018-09-11
KR102255995B1 true KR102255995B1 (ko) 2021-05-25

Family

ID=59398320

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187024080A KR102255995B1 (ko) 2016-01-30 2017-01-30 인공 단일 가이드 rna 및 이의 용도

Country Status (8)

Country Link
US (1) US11518994B2 (ko)
EP (1) EP3409776A4 (ko)
JP (2) JP6800171B2 (ko)
KR (1) KR102255995B1 (ko)
CN (1) CN109072224B (ko)
AU (2) AU2017213405B2 (ko)
CA (1) CA3013179A1 (ko)
WO (1) WO2017131237A1 (ko)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6261500B2 (ja) 2011-07-22 2018-01-17 プレジデント アンド フェローズ オブ ハーバード カレッジ ヌクレアーゼ切断特異性の評価および改善
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9840699B2 (en) 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
WO2016022363A2 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
JP2018515142A (ja) * 2015-05-15 2018-06-14 ダーマコン,インコーポレイテッド. Cas9介在遺伝子編集用の合成シングルガイドrna
US20190225955A1 (en) 2015-10-23 2019-07-25 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
KR102547316B1 (ko) 2016-08-03 2023-06-23 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 아데노신 핵염기 편집제 및 그의 용도
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
KR20240007715A (ko) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
EP3565895A1 (en) * 2016-12-30 2019-11-13 Editas Medicine, Inc. Synthetic guide molecules, compositions and methods relating thereto
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
EP3592777A1 (en) 2017-03-10 2020-01-15 President and Fellows of Harvard College Cytosine to guanine base editor
US11268082B2 (en) 2017-03-23 2022-03-08 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable DNA binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
WO2019014564A1 (en) 2017-07-14 2019-01-17 Editas Medicine, Inc. SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES
WO2019023680A1 (en) 2017-07-28 2019-01-31 President And Fellows Of Harvard College METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE)
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
CN111492060A (zh) * 2017-09-28 2020-08-04 株式会社绿十字 因子viii或因子ix基因敲除兔、其制备方法及其用途
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
US20210269799A1 (en) * 2018-06-29 2021-09-02 Editas Medicine, Inc. Synthetic guide molecules, compositions and methods relating thereto
KR20210123309A (ko) * 2019-01-25 2021-10-13 신테고 코포레이션 Crispr 활성을 조절하는 시스템 및 방법
CA3130488A1 (en) 2019-03-19 2020-09-24 David R. Liu Methods and compositions for editing nucleotide sequences
CN115335387A (zh) * 2020-03-27 2022-11-11 住友化学株式会社 核酸寡聚物的制造方法
GB2614813A (en) 2020-05-08 2023-07-19 Harvard College Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
US20240102113A1 (en) * 2020-12-02 2024-03-28 Arizona Board Of Regents On Behalf Of Arizona State University Silica-based chromatographic processes for isolating nucleic acid-protein complexes and detecting target nucleic acids
WO2022164796A1 (en) * 2021-01-26 2022-08-04 California Institute Of Technology Allosteric conditional guide rnas for cell-selective regulation of crispr/cas
CN113512767B (zh) * 2021-04-30 2022-09-23 天津诺禾致源生物信息科技有限公司 用于构建small RNA文库的接头、试剂盒及small RNA文库的构建方法
TW202334419A (zh) * 2021-11-03 2023-09-01 美商英特利亞醫療公司 用於基因編輯之經修飾引導rna
JP7152094B1 (ja) 2022-06-30 2022-10-12 リージョナルフィッシュ株式会社 tracrRNAユニット、及びゲノム編集方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013077446A1 (ja) 2011-11-26 2013-05-30 株式会社ボナック 遺伝子発現制御のための一本鎖核酸分子
WO2013103146A1 (ja) 2012-01-07 2013-07-11 株式会社ボナック アミノ酸骨格を有する一本鎖核酸分子
WO2013133393A1 (ja) 2012-03-07 2013-09-12 学校法人東京医科大学 Vegf遺伝子の発現抑制用一本鎖核酸分子

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8785121B2 (en) 2010-07-08 2014-07-22 Bonac Corporation Single-stranded nucleic acid molecule for controlling gene expression
NZ704812A (en) 2010-07-08 2017-01-27 Bonac Corp Single-stranded nucleic acid molecule for controlling gene expression
EP2628801B1 (en) * 2010-08-03 2015-01-07 Bonac Corporation Single-stranded nucleic acid molecule having nitrogen-containing alicyclic skeleton
US8691782B2 (en) 2010-08-03 2014-04-08 Bonac Corporation Single-stranded nucleic acid molecule having nitrogen-containing alicyclic skeleton
PE20190844A1 (es) * 2012-05-25 2019-06-17 Emmanuelle Charpentier Modulacion de transcripcion con arn de direccion a adn generico
EP2857513A4 (en) 2012-05-26 2016-05-25 Bonac Corp SINGLE STRANDED NUCLEIC ACID MOLECULE FOR CONTROLLING THE EXPRESSION OF A GENE HAVING AN ADMINISTRATION FUNCTION
US10660943B2 (en) * 2013-02-07 2020-05-26 The Rockefeller University Sequence specific antimicrobials
DK3620534T3 (da) * 2013-03-14 2021-12-06 Caribou Biosciences Inc Crispr-cas sammensætninger af nucleinsyre-targeting nucleinsyrer
HUE056760T2 (hu) 2013-07-11 2022-03-28 Modernatx Inc A CRISPR-hez kapcsolódó fehérjéket és a szintetikus SGRNS-ket kódoló szintetikus polinukleotidokat tartalmazó készítmények és felhasználási módjaik
WO2015093495A1 (ja) * 2013-12-16 2015-06-25 株式会社ボナック TGF-β1遺伝子発現制御のための一本鎖核酸分子
SG11201605247XA (en) 2013-12-27 2016-08-30 Bonac Corp Artificial match-type mirna for controlling gene expression and use therefor
WO2016080097A1 (ja) * 2014-11-17 2016-05-26 国立大学法人東京医科歯科大学 簡便で高効率の遺伝子改変非ヒト哺乳動物の作製方法
EP3280803B1 (en) 2015-04-06 2021-05-26 The Board of Trustees of the Leland Stanford Junior University Chemically modified guide rnas for crispr/cas-mediated gene regulation
CN108350489B (zh) * 2015-09-24 2022-04-29 西格马-奥尔德里奇有限责任公司 用于使用rna引导的核酸结合蛋白的分子邻位检测的方法和试剂
CN105755040A (zh) * 2016-01-21 2016-07-13 北京大学 一种改造的sgRNA及染色体标记应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013077446A1 (ja) 2011-11-26 2013-05-30 株式会社ボナック 遺伝子発現制御のための一本鎖核酸分子
WO2013103146A1 (ja) 2012-01-07 2013-07-11 株式会社ボナック アミノ酸骨格を有する一本鎖核酸分子
WO2013133393A1 (ja) 2012-03-07 2013-09-12 学校法人東京医科大学 Vegf遺伝子の発現抑制用一本鎖核酸分子

Also Published As

Publication number Publication date
EP3409776A4 (en) 2019-12-25
EP3409776A1 (en) 2018-12-05
CA3013179A1 (en) 2017-08-03
AU2017213405B2 (en) 2021-02-04
JP2020198880A (ja) 2020-12-17
JP7096604B2 (ja) 2022-07-06
AU2021202749A1 (en) 2021-05-27
CN109072224A (zh) 2018-12-21
JPWO2017131237A1 (ja) 2018-11-01
KR20180100692A (ko) 2018-09-11
JP6800171B2 (ja) 2020-12-16
US20190382758A1 (en) 2019-12-19
WO2017131237A1 (ja) 2017-08-03
US11518994B2 (en) 2022-12-06
AU2017213405A1 (en) 2018-09-13
CN109072224B (zh) 2022-07-15

Similar Documents

Publication Publication Date Title
KR102255995B1 (ko) 인공 단일 가이드 rna 및 이의 용도
JP5876890B2 (ja) アミノ酸骨格を有する一本鎖核酸分子
JP5555346B2 (ja) 含窒素脂環式骨格を有する一本鎖核酸分子
JP6162182B2 (ja) 遺伝子発現制御のための一本鎖核酸分子
US9206422B2 (en) Single-stranded nucleic acid molecule having nitrogen-containing alicyclic skeleton
US20160108400A1 (en) Single-Stranded Nucleic Acid Molecule for Controlling Gene Expression
WO2013077446A1 (ja) 遺伝子発現制御のための一本鎖核酸分子
JP2013153736A (ja) ペプチド骨格を有する一本鎖核酸分子
JP2013055913A (ja) 遺伝子発現制御のための一本鎖rna分子
JP2023127512A (ja) 標的遺伝子の発現を抑制する核酸分子

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant