KR20190012229A - 유전자 조작을 위한 하이브리드 핵산 서열 - Google Patents

유전자 조작을 위한 하이브리드 핵산 서열 Download PDF

Info

Publication number
KR20190012229A
KR20190012229A KR1020187038125A KR20187038125A KR20190012229A KR 20190012229 A KR20190012229 A KR 20190012229A KR 1020187038125 A KR1020187038125 A KR 1020187038125A KR 20187038125 A KR20187038125 A KR 20187038125A KR 20190012229 A KR20190012229 A KR 20190012229A
Authority
KR
South Korea
Prior art keywords
nucleic acid
crispr
acid sequence
sequence
dna
Prior art date
Application number
KR1020187038125A
Other languages
English (en)
Inventor
아론 험멜
Original Assignee
케이더블유에스 사아트 에스이
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 케이더블유에스 사아트 에스이 filed Critical 케이더블유에스 사아트 에스이
Publication of KR20190012229A publication Critical patent/KR20190012229A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 발명은 서로 공유 및/또는 비-공유적인 방식으로 결합된 CRISPR 핵산 서열 및 DNA 복구 주형을 포함하는 CRISPR 게놈 편집을 위한 하이브리드 핵산 서열에 관한 것이다. 또한, 본 발명은 하나 이상의 CRISPR 폴리펩타이드를 추가적으로 포함하는 분자 복합체를 제공한다. 복합체의 모든 구성 성분들은 물리적으로 인접하게 위치된다. 또한, 본 발명은, 하이브리드 RNA/DNA 서열 및/또는 분자 복합체를 포함하는, 식물, 식물 세포, 식물 물질 또는 이의 파생물 또는 후대를 제공한다. 또한, 본 발명은, 원핵생물 또는 진핵생물 세포에서 하나 이상의 DNA 타겟 서열을 변형시키는 방법 및 식물 또는 식물 세포의 제조 방법을 제공한다. 마지막으로, 본 발명은 원핵생물 또는 진핵생물 세포 또는 유기체에서 유전자 편집 또는 게놈 조작을 위한 하나 이상의 하이브리드 RNA/DNA 서열의 용도 또는 분자 복합체의 용도를 제공한다.

Description

유전자 조작을 위한 하이브리드 핵산 서열
본 발명은, DNA의 이중 가닥 절단부 주위에서 복구 주형 (repair template)의 국소 이용가능성을 높임으로써, CRISPR 기재의 유전자 편집 또는 게놈 조작을 위한 유연하면서도 안정적인 툴을 제공하기 위하여, 서로 공유 및/또는 비-공유적인 방식으로 조합된 CRISPR 핵산 서열과 DNA 복구 주형 핵산 서열을 포함하는, 하이브리드 핵산 서열 구조체에 관한 것이다. 또한, 본 발명은, 분자 복합체의 모든 구성 성분들이 물리적으로 가까이 위치되고; 따라서, 타겟화되고 제어된 방식으로, 변형시킬 DNA 타겟 서열 부위에서 모든 구성 성분들이 인 시추로 쉽게 이용가능하도록, 하나 이상의 CRISPR 폴리펩타이드를 부가적으로 포함하는 분자 복합체를 제공한다. 또한, 하이브리드 RNA/DNA 서열 및/또는 분자 복합체를 포함하거나, 또는 이에 의해 편집된, 식물, 식물 세포, 식물 물질, 이의 파생물 또는 이의 후대를 제공한다. 이러한 툴을 사용해, 원핵생물 또는 진핵생물 세포에서 하나 이상의 DNA 타겟 서열을 변형시키는 방법 뿐만 아니라 식물 또는 식물 세포를 제조하는 방법을 제공한다. 마지막으로, 원핵생물 또는 진핵생물 세포 또는 유기체에서, 바람직하게는 식물 세포 또는 유기체에서 유전자 편집 또는 게놈 조작을 위한, 하나 이상의 하이브리드 RNA/DNA 핵산 서열의 용도, 또는 CRISPR RNA, 복구 주형 DNA 및 CRISPR 폴리펩타이드 서열을 서로 조합하여 포함하는 분자 복합체의 용도를 제공한다.
정확한 유전자 편집 또는 게놈 조작 기술은 가장 중요한 유전자 편집 기술 분야 중 하나로 진화하여, 대상 게놈의 타겟화된 부위-특이적인 조작이 가능해졌다. 부위 특이적인 게놈 조작에 필수적인 선행 조건은, 대상 핵산을 지정된 위치에서 잘라 이중 가닥 절단 (DSB) 또는 하나 이상의 단일 가닥 절단을 유도하기 위해 사용될 수 있는, 프로그래밍 가능한 뉴클레아제이다. 다른 예로, 이러한 뉴클레아제는, 더 이상 뉴클레아제 기능을 포함하지 않고 오히려 다른 효소와 조합하여 인지 분자 (recognition molecule)로서 작용하는, 키메라 변이체 또는 돌연변이 변이체일 수 있다. 즉, 이러한 뉴클레아제 또는 이의 변이체가 모든 유전자 편집 방식 또는 게놈 조작 방식에서 핵심이다. 최근 수년간, 적절한 다수의 뉴클레아제, 예를 들어, CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) 시스템의 일부로서 Cas 또는 Cpf1 뉴클레아제를 포함하는 CRISPR 뉴클레아제, 메가뉴클레아제, 징크 핑거 뉴클레아제, TALE 뉴클레아제 등의, 특히 맞춤형 엔도뉴클레아제들이 개발되었다.
CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats)는, 본래, CRISPR 시스템이 바이러스 공격을 방어하기 위한 후천적인 면역 시스템의 역할을 수행하는 박테리아에서, 천연 환경에서 진화되었다. 바이러스에 노출되면, 바이러스 DNA의 짧은 DNA 세그먼트가 CRISPR 유전자 좌에 통합된다. 바이러스 서열을 포함하는 CRISPR 유전자 좌의 일부에서 RNA가 전사된다. 바이러스 게놈에 상보적인 서열을 포함하고 있는 이 RNA는, CRISPR 작동자 (effector) 단백질을 바이러스 게놈 내 타겟 서열에 타겟팅하도록 매개한다. CRISPR 작동자 단백질은 바이러스 타겟을 절단함으로써, 바이러스 복제를 방해한다. 최근 수년간, CRISPR 시스템은 진핵생물 세포에서도 유전자 편집 또는 게놈 조작에 성공적으로 적용되었다. 현재 동물 세포에서의 편집 및 인간에서의 치료학적인 적용이 중요한 중점 연구 과제이다. 복잡한 동물 및 식물 게놈을 타겟화된 방식으로 변형시키는 것은 여전히 어려운 과제이다.
CRISPR 시스템은, 천연 환경에서, 하나 이상의 작은 개별 비-코딩 RNA를, Cas 뉴클레아제 또는 특이적인 DNA 이중 가닥 절단을 만들 수 있는 Cpf1 뉴클레아제 (Zetsche et al., "Cpf1 is a Single RNA-Guides Endonuclease of a Class 2 CRISPR-Cas System", Cell, 163, pp. 1-13, October 2015)와 같은 다른 CRISPR 뉴클레아제와 조합하여 포함하는, 분자 복합체이다. 현재, CRISPR 시스템은 5가지 타입의 CRISPR 시스템을 포함하는 2종의 클래스, 즉, 예를 들어 작동자로서 Cas9를 이용하는 타입 II 시스템과, 작동자 분자로서 Cpf1을 이용하는 타입 V 시스템으로 분류된다 (Makarova et al., Nature Rev. Microbiol., 2015). 인공적인 CRISPR 시스템에서, 합성 비-코딩 RNA 및 CRISPR 뉴클레아제 및/또는 선택적으로, 닉카제 (nickase)로서 작용하도록 변형되거나 또는 어떠한 뉴클레아제 기능이 결핍되도록 변형된 CRISPR 뉴클레아제는, crRNA 및/또는 tracrRNA의 기능을 겸비한, 하나 이상의 합성 또는 인공 가이드 RNA 또는 gRNA와 조합하여 사용될 수 있다 (Makarova et al., 2015, supra). 천연 시스템에서 CRISPR/Cas에 의해 매개되는 면역 반응에는 CRISPR-RNA (crRNA)가 필요한데, CRISPR 뉴클레아제의 특이적인 활성화를 조절하는 이러한 가이드 RNA의 성숙화는 지금까지 파악된 다양한 CRISPR 시스템들에 따라 매우 다양하다. 먼저, 스페이서 (spacer)라고도 하는 침입 DNA (invading DNA)가 CRISPR 유전자 좌의 근위 말단에 위치된 2개의 인접 반복 영역 사이에 삽입된다. 타입 II CRISPR 시스템은 간섭 단계의 핵심 효소로서 Cas9 뉴클레아제를 코딩하며, 이 시스템은 crRNA와 또한 가이드 모티프로서 트랜스-활성화성 RNA (trans-activating RNA, tracrRNA)를 둘다 포함한다. 이 2개의 RNA가 혼성되어, RNAseIII에 의해 인지되는 이중 가닥 (ds) RNA를 형성하는데, 이것이 절단되어 성숙한 crRNA가 될 수 있다. 이후, Cas 분자와 조합하여, 뉴클레아제를 타겟 핵산 영역으로 특이적으로 안내한다. 재조합 gRNA 분자는 가변적인 DNA 인지 영역과 Cas 상호작용 영역을 둘다 포함할 수 있으며, 따라서, 특이적인 타겟 핵산 및 바람직한 Cas 뉴클레아제와는 독립적으로, 특이적으로 설계될 수 있다. 추가적인 안전 기전으로서, PAM (protospacer adjacent motif)이 타겟 핵산 영역에 존재하여야 하며; PAM은 Cas9/RNA 복합체-인지 DNA 바로 다음에 위치하는 DNA 서열이다. 스트렙토코커스 피오게네스 (Streptococcus pyogenes) Cas9의 경우, PAM 서열은 "NGG" 또는 "NAG" (표준 IUPAC 뉴클레오티드 코드)로 기술되어 있다 (Jinek et al, "A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity", Science 2012, 337: 816-821). 스타필로코커스 아우레우스 (Staphylococcus aureus) Cas9의 경우, PAM 서열은 "NNGRRT" 또는 "NNGRR(N)"이다. 또 다른 변이체 CRISPR/Cas9 시스템들도 알려져 있다. 즉, 네이세리아 메닝기티디스 (Neisseria meningitidis) Cas9은 PAM 서열 NNNNGATT에서 절단한다. 스트렙토코커스 서모필러스 (Streptococcus thermophilus) Cas9은 PAM 서열 NNAGAAW에서 절단한다. 최근, 캄필로박터 (Campylobacter)의 CRISPR 시스템에 대한, 또 다른 PAM 모티프 NNNNRY가 공지되었다 (WO 2016/021973 A1). Cpf1 뉴클레아제의 경우, Cpf1-crRNA 복합체가, tracrRNA 없이, 짧은 T-풍부 PAM 앞에 위치하는 타겟 DNA를 효과적으로 인지 및 절단하는 것으로 공지되었는데, 이는 일반적으로 Cas9 시스템이 G-풍부 PAM을 인지하는 것과는 대조적이다 (Zetsche et al., supra). 또한, 변형된 CRISPR 폴리펩타이드를 이용함으로써, 특이적인 단일 가닥의 절단을 달성할 수 있다. Cas 닉카제와 다양한 재조합 gRNA의 조합 사용 역시 이중 DNA 닉킹을 이용해 매우 특이적인 DNA 이중 가닥 절단을 유도할 수 있다. 또한, 2개의 gRNA를 이용함으로써, DNA 결합의 특이성, 즉 DNA 절단을 최적화할 수 있다. 본래 박테리아에서 언급된 CasX 및 CasY 작동자와 같은 또 다른 CRISPR 작동자들도 동시에 이용가능하며, 게놈 조작 목적으로 사용될 수 있는 또 다른 작동자이다 (Burstein et al., "New CRISPR-Cas systems from uncultivated microbes", Nature, 2017, 542, 237-241).
현재, 예를 들어, 엔도뉴클레아제로서 Cas9 또는 이의 변이체 또는 임의의 키메라 형태에 의존하는 타입 II 시스템이 게놈 조작을 위해 변형되었다. 2개의 구성 성분, 즉 싱글 가이드 RNA (sgRNA)라고도 하는 가이드 RNA (gRNA)와 비-특이적인 CRISPR-부속 엔도뉴클레아제로 이루어진 합성 CRISPR 시스템을 이용하여, 타겟팅할 유전자에 특이적이면서 엔도뉴클레아제 Cas9와 조합될 수 있는 gRNA를 공동-발현함으로써, 넉-아웃 세포 또는 동물을 구축할 수 있다. 특히, gRNA는, Cas 또는 임의의 다른 CRISPR 작동자 단백질 또는 이의 변이체 또는 촉매 활성 단편과 상호작용하는 하나의 도메인과, 대상 타겟 핵산과 상호작용하는 또 다른 도메인을 포함하는, 인공 분자이며, 즉 crRNA와 tracrRNA ("싱글 가이드 RNA" (sgRNA) 또는 간략하게 "gRNA")가 융합된 합성 물질이다 (Science 2012, supra). 게놈 타겟은 약 20개의 뉴클레오티드 DNA 서열일 수 있으며, 이 타겟은 PAM 서열 바로 상류에 존재한다. PAM 서열은 타겟 결합에 특히 중요하며, 정확한 서열은 Cas9 타입에 따라 결정되며, 예를 들어, 스트렙토코커스 피오게네스 유래 Cas9의 경우 5' NGG 3' 또는 5' NAG 3' (표준 IUPAC 뉴클레오티드 코드)를 인지한다 (Jinek et al., Science 2012, supra). 스타필로코커스 아우레우스 유래 Cas9의 경우, PAM 서열은 NNGRRT 또는 NNGRR(N)이다. 또 다른 다수의 변이체 CRISPR/Cas9 시스템들이 공지되어 있는데, 그 예로, 특히 네이세리아 메닝기티디스 Cas9은 PAM 서열 NNNNGATT를 절단한다. 스트렙토코커스 서모필러스 Cas9은 PAM 서열 NNAGAAW를 절단한다. 변형된 Cas 뉴클레아제를 사용해, 대상 타겟 서열에 타겟화된 단일 가닥 절단을 만들 수 있다. 이러한 Cas 닉카제를 다른 재조합 gRNA와 조합 사용하면, 이중 닉킹 시스템을 이용하여 높은 수준의 부위 특이적인 DNA 이중 가닥 절단을 도입할 수 있다. 하나 이상의 gRNA를 사용하면, 전체 특이성을 추가로 높이고, 오프-타겟 효과를 낮출 수 있다.
Cas9 단백질과 gRNA는, 일단 발현되면, gRNA "스캐폴드" 도메인과 Cas9 상의 표면-노출된 양 전하의 그루브 간의 상호작용을 통해, 리보뉴클레오-단백질 복합체를 형성한다. Cas9은, gRNA과 결합되면, 비-활성의 DNA 비-결합성 구조에서 활성의 DNA-결합성 구조로 전환되는, 입체구조적인 변화를 겪게 된다. 중요한 점은, gRNA의 "스페이서" 서열이 자유로운 상태로 남아 타겟 DNA와 상호작용하게 된다는 것이다. Cas9-gRNA 복합체가 PAM을 가진 임의의 게놈 서열과 결합하겠지만, gRNA 스페이서가 타겟 DNA와 매칭되는 정도가 Cas9의 절단 여부를 결정할 것이다. Cas9-gRNA 복합체가 잠정적인 DNA 타겟에 결합하면, gRNA 타겟팅 서열의 3' 말단에 위치한 "시드 (seed)" 서열이 타겟 DNA에 어닐링되기 시작한다. 시드 서열과 타겟 DNA 서열이 매칭되면, gRNA는 타겟 DNA에 3'에서 5' 방향 (gRNA의 극성 (polarity)을 기준으로)으로 계속적으로 어닐링될 것이다.
CRISPR/Cas9, 그리고 마찬가지로 CRISPR/Cpf1 및 그외 CRISPR 시스템들은, gRNA가 올바르게 설계된다면, 높은 특이성을 나타내지만, 특히 CRISPR 기술에 기초한 임상적인 용도에서는 특별히 특이성이 여전히 중요한 과제이다. CRISPR 시스템의 특이성은, 게놈 타겟에 대한 gRNA 타겟팅 서열의 특이성이 그 게놈의 나머지 부분에 대한 특이성과 비교하여 어느 정도인가에 의해, 대부분 결정된다.
식물계는, 녹조류, 이끼 식물, 양치 식물 및 육상 식물의 게놈 및 표현형 차이를 감안하면, 이종성과 다양성이 높은 종들을 포함한다. 식물 게놈과 이의 복잡성은 매우 정확한 유전자 편집 또는 게놈 조작을 위한 도전 과제이다. 지 메이스 (Zea mays) (옥수수 (maize 또는 corn))는, 예를 들어, 전체 곡물들 중 전세계적으로 가장 많이 생산되며, 2012년 생산량이 875,000,000톤에 달한다. 옥수수는 약 2.4 기가베이스 (Gb)의 거대한 게놈을 가지고 있으며, 반수 염색체의 개수가 10개이다 (Schnable et al, 2009; Zhang et al, 2009). 트리티컴 에어스티붐 (Triticum aestivum) (빵 밀)은, 예를 들어, 육배체이고, 게놈 크기가 ~17 Gb로 추정된다. 베타 불가리스 ssp. 불가리스 (Beta vulgaris ssp. vulgaris) (사탕무)는 약 470 메가베이스 (Mb) 내지 약 569 Mb 범위의 게놈 크기를 가진다. 식물 세포의 특수 아키텍처 (architecture) 및 구성, 그리고 식물의 고유한 발생 과정으로 인해, 식물 세포의 타겟 서열을 변형시키기 위한 용도로 이용하고자 하는 경우, CRISPR 툴에 대한 특이적인 개조가 요구된다. 따라서, 동물, 특히 포유류 시스템에서 확립된 CRISPR 툴 및 이와 관련된 원리가 대상 식물 세포에서도 반드시 작동하게 되는 것은 아닐 것이므로, 식물에서 광범위한 적용을 달성하기 위한 기법을 확립하는데 특별한 전략이 요구된다.
마찬가지로, 동물, 특히 포유류의 게놈도 복잡하며, 예를 들어, 무스 무스쿨러스 (Mus musculus)의 경우 게놈 크기가 2.7 Gb이고, 호모 사피엔스 (Homo sapiens)의 경우 3.2 Gb이다. 특히, CRISPR을 이용한 유전자 편집 또는 게놈 조작 방식을 인간 게놈 내에 타겟을 정확하게 유전자 편집 또는 유전자 조작하는데 이용하고자 할 경우, 모든 타입의 오프-타겟 효과가 매우 유해할 수 있으므로, 높은 특이성이 절실히 요구된다.
게놈 조작시 매우 중요하게 고려해야하는 또 다른 측면은, 일반적으로 이중 가닥 절단 (DSB) 또는 DNA 병변이 게놈의 온전성에 유해하기 때문에, 대상 게놈 타겟 부위의 절단 후 복구 기전이 필요하다는 것이다. 게놈 물질 내 DSB는 이온화 방사선 조사, 화학제 처리, 산화, 효소 및 복제 시 단일 가닥 절단에 의해 유발될 수 있는데, 이는 유전자 손실, 정지된 (stalled) DNA 복제 및 세포 사멸로 이어질 수 있는 심각한 DNA 손상 형태이다. 따라서, 세포 기구 (cellular machinery)가 이중 가닥 절단 (DSB)의 복구 기전을 제공하는 것이 매우 중요하다. 세포는 임의의 이중 가닥 또는 단일 가닥 DNA 손상을 복구하기 위해 고유의 기전을 가지고 있다. DSB 복구 기전은 2가지 주요 기본 타입, 즉 비-상동적인 말단 연결 (non-homologous end joining, NHEJ)과 상동적인 재조합 (homologous recombination, HR)으로 분류된다. 상동성에 기초한 복구 기전은 일반적으로 상동성-특이적인 복구 (HDR)로 지칭된다.
NHEJ는 상동적인 서열이 필요없는 동식물에서의 지배적인 핵 반응이지만, 흔히 오류가 발생하며, 따라서 잠재적으로 돌연변이 유발성이다 (Wyman C., Kanaar R. "DNA double-strand break repair: all's well that ends well", Annu. Rev. Genet. 2006; 40, 363-83). HDR에 의한 복구에는 상동성이 필요하지만, 절단된 염색체를 복구하기 위해 온전한 염색체를 이용하는 HDR 경로, 즉 이중 가닥 절단 복구 및 합성-의존적인 가닥 어닐링은 매우 정확하다. 고전적인 DSB 복구 경로에서, 3' 말단이 온전한 상동적인 주형에 침입해, DNA 복구 합성을 위한 프라이머로 사용되어, 궁극적으로 이중 홀리데이 정션 (double Holliday junction, dHJ)의 형성을 유도한다. dHJ는, 침입 가닥의 연장 (elongation)이 제2 DSB 말단으로부터 DNA를 "포획"하여 합성할 때, 형성되는 4 가닥의 갈라진 구조 (four-stranded branched structure)이다. 각각의 HJ는 2가지 방식 중 한가지 방식으로 절단되어 분리된다. 합성-의존적인 가닥 어닐링은 보존적이며, 오직 비-교차 방식 (non-crossover event)으로 이루어진다. 이는, 신규 합성된 서열들 모두 동일 분자 상에 존재한다는 것을 의미한다. NHEJ 복구 경로와 달리, 합성-의존적인 가닥 어닐링에서는 가닥 침투 및 D 루프 형성 후, 침투 가닥의 신규 합성된 부분이 주형으로부터 분리되고, 다른 DSB 말단에서 비-침투 가닥의 가공된 말단 쪽으로 회귀한다. 비-침투 가닥의 3' 말단이 연장 및 라이게이션되어, 갭이 채워지게 된다. 아직 충분히 규명된 것은 아니지만 절단-유발성 복구 경로로 지칭되는, 또 다른 HDR 경로도 존재한다. 이 경로의 중요한 특징은 복구에 사용될 수 있는 단 하나의 침투 말단이 DSB에 존재한다는 것이다.
또 다른 HDR 경로는 단일 가닥 어닐링 (SSA)이다. SSA는 비-보존적이며, >30 bp의 다이렉트 리피트들 사이에서 발생하며, 결손이 발생한다. 최근 수년간, 진핵생물에서 MMEJ (microhomology-mediated end joining)이 독특한 DSB 복구 타입으로서 인식되었다. 이 경로에 매우 짧은 (2-14 bp) 상동성 영역만 필요하며, 전형적으로 SSA와 같은 결손을 발생시킨다. 또한, 이는 HR 경로 및 NHEJ 경로와는 유전자 측면에서 구분되며, 포유류 세포에서 NHEJ에 대한 백업으로서 작용한다 (Kwon, T., Huq, E., & Herrin, D. L. (2010). Microhomology-mediated and nonhomologous repair of a double-strand break in the chloroplast genome of Arabidopsis. Proceedings of the National Academy of Sciences of the United States of America, 107(31), 13954-13959). 아울러, 식물에서, 소위 AEJ (alternative end-joining) 경로가 개시되었다 (Charbonnel C, Allain E, Gallego ME, White CI (2011) Kinetic analysis of DNA double-strand break repair pathways in Arabidopsis. DNA Repair (Amst) 10: 611-619). 요컨대, HR/HDR은 주형으로서 딸 염색분체 (sister chromatid)에 상동적인 DNA 가닥을 이용한다. 따라서, 높은 충실성을 제공하지만, 효율은 낮다. 반면, NHEJ는, 매우 효율적이고 유의한 상동성과 독립적으로 2개의 말단을 다시 연결할 수 있는 간단한 경로이지만, 이러한 효율은 이 방법이 오류 발생 경향이 있으며 삽입 또는 결손과 연관될 수 있는 문제를 수반한다.
그러므로, 자연적인 복구 경로에 영향을 미치기 위한 유전자 편집 또는 게놈 조작 방식에서는, 중요한 파라미터인 복구 주형 (RT)을 물리적으로 설계하여야 한다. RT를 ssDNA 또는 부분적인 dsDNA로서 제공할 수도 있다. ssDNA 또는 dsDNA로서 전달되었을 때, 매우 다양한 동물 시스템들에서, 짧은 올리고뉴클레오티드가 HR에 성공적으로 사용된 바 있다. 보고된 유전자 편집 빈도는 긴 dsDNA RT를 이용하는 경우 만큼 높지 않다 (Yang et al., 2013). 유리형 분자로서 전달될 경우, 약 70-99 bp 범위의 ssDNA RT가 동물 시스템에서 성공적으로 사용된 바 있으며 (Yang et al., 2013; Davis and Maizels, 2014), 일부 경우에는 더 긴 ssDNA RT 보다 더 우수하였다 (예, Yang et al., 2013). 70 bp 보다 짧은 ssDNA RT가 통상적으로 사용되지만, 유전자 편집 빈도는 약간 낮다. CRISPR을 이용한 유전자 편집 또는 게놈 조작 편집에서, gRNA에 대한 스트랜드 바이어스 (strand bias)도 ssDNA RT로 확인된 바 있다 (Yang et al., 2013).
게놈 편집용 CRISPR 툴을 복구 주형 (RT)과 조합하여 사용하는 현행 프로토콜에서는, DNA에서 염기 쌍 형성 및 혼성화에 의해서만 복구될 DNA 내 절단을 인지하는, 이중 가닥 또는 단일 가닥의 핵산 RT를 별도로 제공하여야 하는 점이 절대적이다. 그러나, 현재 이용가능한 방법은, 바람직하게는 절단 뿐만 아니라 복구 이벤트를 특이적으로 조절하기 위해 타겟화된 DNA 절단을 유도한 직후에, 복구가 이루어져야 하는 구획에서, 올바른 배열 (right configuration), 농도, 즉 화학양론적으로 RT를 공간적 및 시간적으로 정확하게 제공하지 못하므로, 현재 이용가능한 방법으로는 DNA 절단이 유발된 부위에서 RT의 물리적 및 시간적인 이용가능성을 제어할 수 없다.
문헌에서, 2개의 서열 간의 상동적인 재조합은, 이들 서열이 상당히 떨어져 있는 경우 보다는 핵 내에서 가까이 위치할 경우, 발생 빈도가 더 높은 것으로, 입증되어 있다. 예를 들어, 아라비돕시스에서, 염색체에 위치한 도너 분자와 타겟 간에 달성되는 유전자 편집율 분석에서, 도너가 타겟과 동일한 염색체 상에 존재하는 경우가, 2개의 유전자 좌가 별개의 염색체에 위치하는 경우에 비해, 더 우수하였다 (Fauser et al., 2012). 그러나, 이러한 사실은 진핵생물 세포에서 CRISPR을 이용한 유전자 편집 또는 게놈 조작 방식을 최적화하기 위해 합리적인 방식으로 활용된 바 없다.
US 2015/0376645 A1은 DNA 복구, 변형 또는 치환 툴로서 핵산 서열을 포함하는 MiniVectors™을 이용한 유전자 테라피 조성물 및 방법을 개시하고 있다. MiniVector는 세포 내에서 타겟화된 DNA 서열의 생체내 또는 시험관내 상동성-특이적인 복구, 변형 또는 치환을 수행하기 위한 핵산 서열 주형을 포함하며, MiniVector에는 박테리아 복제 오리진과 항생제 선별 유전자 둘다 없으며, MiniVector의 크기는 최대 약 2,500 bp이다. 그러나, MiniVector의 코딩된 복구 주형의 효과는 타겟 DNA 서열 주변의 핵산 서열에 대한 복구 주형 서열의 상보성에만 의존하며, 대상 타겟 부위에서 복구 주형의 물리적인 이용가능성은 전혀 제어되지 않는다.
US 2015/0082478 A1은 식물 또는 식물 세포의 게놈 내 타겟 서열의 게놈 변형, 식물 선별, 유전자 편집 및 대상 폴리뉴클레오티드의 식물 게놈내 삽입을 위한, 식물의 가이드 RNA/Cas 엔도뉴클레아제 시스템을 이용하는 방법 및 조성물에 관한 것이다. 이 방법 및 조성물은 식물, 식물 세포 또는 종자의 게놈 내 타겟 부위와 대상 뉴클레오티드를 수정 또는 변형하기 위한 효과적인 시스템을 제공하기 위해, 가이드 RNA/Cas 엔도뉴클레아제 시스템을 이용한다. 도입된 DSB의 복구를 매개하기 위해, 별개의 HDR 복구 DNA 벡터가 개시 및 이용되거나, 또는 NHEJ에 의한 자발적인 복구가 제시되어 있다.
EP 2 958 996 A1은 뉴클레아제 (예, ZFN 또는 TALEN) 또는 뉴클레아제 시스템 (예, CRISPR/Cas)에 의해 매개되는 유전자 파괴를 증가시키기 위해 세포에 NHEJ 기전의 저해제를 제공함으로써, 특이적인 DSB 복구 문제를 해결하고자 하였다. DNA-의존적인-단백질 키나제 촉매성 서브유닛 (DNA-PKcs) 및/또는 폴리-(ADP-리보스) 중합효소 1/2 (PARP1/2)의 소분자 저해제를 사용해 이러한 NHEJ DNA 복구 경로의 중요한 효소적 활성을 저해함으로써, 세포가 대안적인 NHEJ과 같은 고전적인 NHEJ 및/또는 미세상동성 매개 말단-연결에 비해 오류 발생 경향이 높은 복구 기전에 의지하게 됨에 따라, 뉴클레아제에 의한 유전자 파괴 수준이 증가된다. 이에, 게놈 편집 과정에 추가적인 화학제가 첨가되는데, 이는 몇몇 세포 타입 및 분석에 불리하다. 또한, 이는 처리된 세포의 게놈 온전성 및/또는 재생 잠재성 (regenerative potential)에 영향을 미칠 수 있다.
Nishimasu et al. ("Crystal structure of Cas9 in complex with guide RNA and target DNA", Cell, 156(5): 935-49, 2014)에는, 2.5Å 해상도로, sgRNA 및 타겟 DNA와 복합체를 이룬 형태의 스트렙토코커스 피로게네스 Cas9의 결정 구조가 개시되었으며, 구체적으로 Cas9-sgRNA-DNA 3성분 복합체 및 Cas9의 2개의 로브 (lobe), 즉, 인지 로브 (recognition lobe)와 뉴클레아제 로브 (nuclease lobe)가 밝혀져 있다. 상세한 구조적 정보가 제공되어 있지만, 구조에 관한 지식을 DSB 복구 문제는 고사하고 게놈 편집에 어떻게 이용할 수 있는 지에 대한 추가적인 기능적인 기법은 기술되어 있지 않다.
Tsai et al. ("Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing", Nature Biotechnology, 32, 569-576 (2014), doi:10.1038/nbt.2908)에는 RNA에 의해 안내되는 FokI 뉴클레아제 (RFN) 및 Csy4-기재의 멀티플렉스 gRNA 발현 시스템이 기술되어 있다. 타겟으로서 인간 세포의 경우, 3' 말단에 추가적인 서열 28 bp를 가진 gRNA가 탑재된 Cas9 + 조합된 187 아미노산 (21.4 kD) Csy4 (Cas6) 단백질은, 표준 gRNA 대조군과 비교해, DSB 유도시 90% 이상의 활성을 유지하는 것으로 확인되었다. 그러나, 이러한 발견 결과에는, CRISPR/Cas 매개 게놈 편집을 최적화하기 위해 gRNA를 DNA 복구 주형의 개념과 결합시킬 수 있는 지에 대해서는 전혀 개시되어 있지 않다.
또한, Shechner et al. ("Multiplexable, locus-specific targeting of long RNAs with CRISPR-display", Nature Methods, 12(7), 664-670 (2015), doi: 10.1038/nmeth.3433)는, 긴 비-코딩 ssRNA 서열이 전사적으로 융합된 sgRNA가 탑재된 경우에서도, Cas9이 특이적인 게놈 타겟 부위와 상호작용하는 능력이 존재함을 기술하고 있다. sgRNA 및 tracrRNA의 5'- 및 3'-말단에서, 그리고 표준 sgRNA 구조의 내부 스템-루프에서 구축된 전사 융합체를 조사하였다. sgRNA의 5' 및 3' 전사 융합체들이 가장 효과적이기는 했지만, 구조체들 모두 Cas9에 의한 서열-특이적인 타겟팅이 가능하였다. 3' 융합체가, 4,819 bp 정도로 커다란 ssRNA 카고에 의한, 특이적인 타겟팅을 나타내었다. 그러나, Shechner 등은, 전적으로 멀티플렉싱 (multiplexing) 및 에토픽 타겟팅 (ectopic targeting)에 집중하여, 정확성이 높은 게놈 조작에 효과적인 sgRNA/복구 주형 복합체를 제공하는 문제를 해결하기 위한, 복구 주형 툴과 관련된 어떠한 (s)gRNA 또는 복구 주형에 대해서도 언급하지 않았다.
따라서, 적합한 CRISPR 툴, 구체적으로, 예를 들어, 대상 세포 내 타겟 부위에 대해 최적화된 gRNA를 제공하고 동시에 매우 정확하고 정밀한 HDR을 매개할 수 있는 가능성을 제공하여, 유전자 편집 또는 게놈 조작 개입을 조절하는데 필수적인, DSB의 타겟화된 복구를 제공함으로써, 정확성이 높은 게놈 절단을 겸비한, 식물, 특히 주요 농작물의 정확한 편집을 위해 최적화된 툴이 계속적으로 요구되고 있다.
이에, 본 발명의 새로운 전략은 정확한 게놈 편집, 특히 효모, 동물 및 식물 세포 등의 진핵생물 세포에 적합한 정확한 게놈 편집을 위한 복구 주형을 제공하는 것을 목적으로 한다.
예를 들어, 치료학적 방법, 유전자 테라피 또는 타겟화된 형질 개발을 위한 식물 또는 미생물 게놈 조작에, 생물공학 분야의 게놈 편집이 상당한 이점을 가짐에도 불구하고, 도입할 타겟화된 게놈 변형의 특이성 또는 오프-타겟 효과와 관련된 주요 문제들과 염려는 여전한 실정이다. 이러한 문제는, 특히 대상 게놈 타겟 핵산에 절단 및 관련 복구를 유도할 경우에 달성될 수 있는 정확도와 관련 있다.
DSB를 유도하는 임의 타입의 유전자 편집 또는 게놈 조작 방식들이 잠재적으로 유해한 DNA 절단을 일으키고, 잠재적으로는 원치않은 핵산 교환을 야기하는 바람직하지 않은 DNA 복구 기전을 야기하므로, 타겟화된 DNA 복구 주형 (RT)의 사용을 또한 내포하는, 매우 정확하고 제어된 유전자 편집 또는 게놈 조작을 달성하기 위한, 보다 효율적인 방법과 툴의 개발이 여전히 요구되고 있다.
오프-타겟 효과를 매개하지 않는 성공적인 게놈 조작을 제공하는 것과 관련된 빈번한 또 다른 문제는, 절단이 이루어지고 따라서 복구되어야 하는 시점에, 정확하게 DSB 부위에서의 복구 주형의 물리적인 이용가능성이다. 통상적으로, 바람직한 편집 이벤트가, 비-상동적인 말단-연결 (NHEJ) 경로 또는 전술한 바와 같은 내인적인 상동성 서열과의 재조합을 통한 복구 보다 우수하다. 변형시킬 타겟 유기체에 따라, 모든 툴, 즉 엔도뉴클레아제 가위, 가이딩 gRNA 및 복구 주형이 적절한 시기에 게놈을 포함하는 세포내 구획, 즉 바람직하게는 핵, 또는 미토콘드리아와 같은 임의의 다른 게놈 보유 구획에 도달하도록, 대상 복구 주형과 더불어 유전자 편집 또는 게놈 조작 툴을 도입하기 위한, 집중된 전략이 요구된다. 이러한 한계를 일부 해소하기 위한 한가지 방법은, 복구 주형을 증폭시켜 핵내 주형의 농도를 증가시키고, 추측컨대 게미니바이러스 벡터를 보조적으로 사용해 DSB를 복구하는데 더 이용가능하게 만드는 것이다 (예, Mach, Plant Cell. 2014, doi:10.1105/tpc.114.122606; 및 Baltes et al., Plant Cell. 2014, doi: 10.1105/tpc.113.119792). 그러나, 복구 주형은 분리된 물리적 개체로서 전달되므로, DSB가 엔도뉴클레아제에 의해 도입되는 그 시점에 정확하게 DNA 복구가 필요한 위치에 실제 복구 주형이 존재하게 보장해주는 제어 기전은 존재하지 않는다.
CRISPR 활용과 관련하여, 복구 주형 또는 플라스미드계 복구 주형으로서 유리형 ssDNA 뉴클레오티드의 사용이 빈번히 제시되었지만 (http://blog.addgene.org/crispr-101-homology-directed-repair), DSB가 만들어지는 시점에 인 시추로 복구시킬 DSB를 복구 주형과 실제 물리적으로 접촉되게 보장할 수 있는 전략은 개시된 바도 제안된 바도 없다.
이런 점에서, 서로 다른 타겟 세포들에서는, 필요에 따라, 유전자 편집 또는 게놈 조작 및/또는 복구 주형 툴을 전달하는데 있어 특유한 차이가 명백해진다. 이와 관련하여, 식물 세포는 세포벽 등의 특정한 구분되는 특징을 가지고 있어, 게놈 편집 및/또는 복구 툴의 전달이 다른 진핵생물 세포와는 다른 형질전환, 형질감염 및/또는 형질도입 방법에 의해 매개되므로, 식물 세포에서의 유전자 편집 또는 게놈 조작은 동물/포유류 세포에서 확립된 유전자 편집 또는 게놈 조작과는 완전히 달라진다. 그러나, 이러한 특이성은 매우 정확한 식물 세놈 편집을 달성하기 위해 고려되어야 한다. 현재, 생물학적 및 물리적 수단을 포함하여, 대상 식물 세포에 유전 물질을 유전자 구조체 형태로 도입하기 위한 다양한 식물 형질전환 방법들이 있다. 통상적인 생물학적 수단은, 여러가지 다양한 식물 물질을 전달하는데 사용되어 온 아그로박테리움 spp. (Agrobacterium spp.)를 이용한 형질전환이다. 대상 세포에 유전 물질을 도입하기 위한 또 다른 전략은 바이러스 벡터 매개의 식물 형질감염이다. 식물 생물학에서 유용성이 확인된 물리적인 수단은 바이올리스틱 형질감염 또는 미세입자-매개 유전자 전달로도 지칭되는 입자 총격 (particle bombardment)이며, 이는 대상 핵산 또는 유전자 구조체를 포함하는 코팅된 미세입자 또는 나노입자를 타겟 세포 또는 조직에 전달하기 위한 물리적인 전달 방법이다. 이러한 물리적인 도입 수단은 핵산, 즉, RNA 및/또는 DNA, 그리고 단백질을 도입하는데 적합하다. 마찬가지로, 대상 핵산 또는 아미노산 구조체를 식물 세포에 특이적으로 도입하기 위한, 특수 형질전환 또는 형질감염 방법들, 예를 들어, 전기충격, 미세주입, 나노입자 및 세포-침투성 펩타이드 (CPP) 등도 존재한다. 또한, 유전자 구조체 및/또는 핵산 및/또는 단백질을 도입하기 위한 화학제를 이용한 형질감염 방법도 존재하며, 이는 특히 칼슘 포스페이트를 이용한 형질감염, 리포좀, 예를 들어, 양이온성 리포좀을 이용한 형질감염, 또는 DEAD-덱스트란 또는 폴리에틸렌이민 등의 양이온성 폴리머를 이용한 형질감염 또는 이들의 조합 등을 포함한다. 이러한 전달 방법 및 전달 비히클 또는 카고는, 따라서, 동물 및 포유류 세포 등의 다른 진핵생물 세포에 사용되는 전달 툴과는 본질적으로 차이가 있으며, 모든 전달 방법은, 게놈 편집을 매개하기 위한 대상 구조체가 대상 타겟 세포의 특정 구획에 완전히 기능적이고 능동적인 방식으로 도입될 수 있도록, 특이적으로 미세-조정되고 최적화되어야 한다.
따라서, 본 발명의 과제는, DSB가 복구되는 부위 및 시기에 복구 주형의 물리적인 이용성, 그리고 비-상동적인 말단-연결 방법 (NHEJ) 또는 (내인성) 상동 서열과의 재조합 (HR/HDR)을 통한 DNA 복구 기전에 의한 경쟁과 관련하여, 유전자 편집 분야에서 현재의 한계를 극복하기 위해, 식물 세포 등의 진핵생물 세포에서, 특히 CRISPR 매개 게놈 편집 분야에서, 매우 정확한 게놈 편집을 수행하는데 적합한 새로운 툴과 방법을 제공하는데 있어, 상당한 요구를 극복하는 것이다. 본 발명의 또 다른 과제는, 동물 또는 식물 세포의 게놈 편집시 달성되는 정확도가 의학 및 식품 관리 기관에서 확립된 필수적인 높은 규제 요건을 충족시키도록 개선되어야 하므로, 별개의 복구 주형 또는 복구 올리고뉴클레오티드를 제공하지 않지만, CRISPR 핵산 및 복구 주형의 특성을 통합하고 동시에 타겟 부위, 즉, 원핵생물 세포, 진핵생물의 게놈, 특히, 동물 세포, 특히 포유류 세포 또는 식물 세포의 게놈에 쉽게 전달될 수 있는 분자 또는 분자 복합체를 진핵생물 세포에서 부위-특이적인 게놈 편집에 이용할 수 있는, 간단한 CRISPR 툴키트를 제공하는 것이다. RNA와의 하이브리드이고 본원에 기술된 바와 같이 단백질-RNA 뉴클레아제 복합체에 물리적으로 결합되는 복구 주형은, 오프-타겟 통합 위험성이, 세포에 유리형 분자로서 도입되는 ss- 또는 ds-DNA 복구 주형 보다 낮다. 또한, 식물 특이적인 전달 방법을 이용해 식물 특이적인 게놈 편집 구조체를 전달하기 위해 특이적으로 최적화된 전달 툴을 제공하는 것을 과제로 하였다. 또한, 제조 과정 중에, 매개인자로서 외부 DNA를 통합하는 임의 형태의 유전자 변형에 대한 특정 영역에서의 민감성으로 인해, 필요에 따라 일시적으로 제공되는 RNA 및 부위-특이적인 뉴클레아제를 이용한 일시적인 편집 활성에 의존할 수 있는 방식을 제공하는 것이다. 마지막으로, 본 발명의 과제는, 번거러운 클로닝 및 사전 검사가 필요없어야 하므로, 새로운 타겟을 테스트하는 시간을 절약한다는 점에서 최근 방법 보다 우수한 유전자 편집 또는 게놈 조작 방법을 제공하는 것이다.
전술한 과제는, "카고 (cargo)"로서 뉴클레아제 복합체에 직접 이용해 복구 주형을 DSB 부위에 전달하여 복구 주형 이용가능성 문제를 해결함으로써, 본 발명에 따라 달성되었다. 복구 주형을 절단 시점에 이중 가닥 절단부에 인가하여, 절단부의 복구에 이용하기 위한 복구 주형 (RT)의 국소 이용가능성을 인 시추로 증진한다. 이로써, 본 발명에 따른 CRISPR 핵산/RT 툴은 맞춤 제작형 복구 주형을 제공할 뿐만 아니라 유전자 편집 현상의 빈도 및/또는 특이성을 높이는데 도움이 될 수 있다. 이러한 생각으로 CRISPR 뉴클레아제 복합체 내 핵산, 예를 들어, gRNA의 존재 및 시험관내 핵산 조작을 활용하여, 동시적인 게놈 절단 및 타겟화된 복구를 위한 부위-특이적인 뉴클레아제와 복구 주형의 기능을 하나의 분자 복합체에 통합하고, 게놈 편집 툴(들) 및/또는 복구 주형을 타겟 세포의 대상 구획 내에 전달하기 위한 특이적인 전달 툴 및 방법과 결합하게 되었다. 즉, 이런 시스템은 보다 높은 특이성을 구현할 수 있하며, 따라서, 대형 동물, 특히 포유류 또는 때때로 더 복잡한 식물 게놈에서 오프-타겟 절단을 최소화하는데 요구되는 CRISPR 방식의 오프-타겟 효과를 줄일 수 있다.
구체적으로, 전술한 과제는, 제1 측면에서, (a) 하나 이상의 RNA 핵산 서열을 포함하는, CRISPR 핵산 서열을 포함하며, 상기 CRISPR 핵산 서열과 결합된, (b) DNA 핵산 서열을 포함하는 복구 주형 핵산 서열; 및 (c) 선택적으로, 상기 CRISPR 핵산 서열과 상기 복구 주형 핵산 서열 사이의 링커를 포함하고, 상기 CRISPR 핵산 서열이, (i) 제1 DNA 타겟 서열에 상보적인 제1 서열 영역과, (ii) CRISPR 폴리펩타이드와 상호작용하도록 되어 있는 제2 서열 영역을 포함하고; 상기 복구 주형 핵산 서열이 제2 DNA 타겟 서열과 상보적인 하나 이상의 영역을 포함하고, 상기 복구 주형 핵산 서열이 타겟화된 상동성 특이적인 복구를 매개하도록 구성되며; 상기 하이브리드 핵산 서열이, CRISPR 폴리펩타이드가 상기 제1 타겟 서열을 인지하여 선택적으로 DNA 절단을 유도할 수 있도록, CRISPR 폴리펩타이드와 상호작용하며, 상기 하이브리드 핵산 서열이, 제2 DNA 타겟 서열의 부위에서 상기 복구 주형 핵산 서열에 의해 매개되는 상동성 특이적인 복구를 통해, 게놈 조작을 지시하며, 상기 제2 DNA 타겟 서열이 세포의 내인성 DNA 서열인, 하나 이상의 RNA 및 하나 이상의 DNA 핵산 서열을 포함하거나 또는 이들로 구성되는 하이브리드 핵산 서열을 제공함으로써, 달성된다.
제1 측면에 대한 일 구현예에서, 복구 주형 핵산 서열 및/또는 CRISPR 핵산 서열 또는 가이드 핵산 서열이, 선택적으로 백본 변형 및/또는 염기 변형을 포함하는, 천연 뉴클레오티드 서열 또는 합성 뉴클레오티드 서열 등의 비-천연 뉴클레오티드 서열로부터 선택되는 뉴클레오티드 서열을 포함하고; CRISPR 핵산 서열 또는 가이드 핵산 서열이 단일 가닥 또는 부분 단일 가닥 RNA 뉴클레오티드 서열을 포함하고; 복구 주형 핵산 서열이 단일 가닥 또는 이중 가닥 DNA 뉴클레오티드 서열을 포함하는, 하이브리드 핵산 서열을 제공한다.
상기 측면에 대한 다른 구현예에서, 복구 주형 핵산 서열이 CRISPR 핵산 서열 또는 가이드 핵산 서열의 3' 말단에서 CRISPR 핵산 서열 또는 가이드 핵산 서열과 결합되거나, 및/또는 복구 주형 핵산 서열이 CRISPR 핵산 서열 또는 가이드 핵산 서열의 5' 말단에서 결합되거나, 및/또는 복구 주형 핵산 서열이 CRISPR 핵산 서열 또는 가이드 핵산 서열 내부에 위치된, 하이브리드 핵산 서열을 제공한다.
본 발명의 상기 측면에 대한 또 다른 구현예에서, 하나 이상의 복구 주형 핵산 서열이 하나 이상의 CRISPR 핵산 서열 또는 하나 이상의 가이드 핵산 서열에 공유적으로 부착되거나, 및/또는 하나 이상의 복구 주형 핵산 서열이 하나 이상의 CRISPR 핵산 서열 또는 하나 이상의 가이드 핵산 서열에 비-공유적으로 부착된, 하이브리드 핵산 서열을 제공한다.
본 발명에 따른 제2 측면에서, 본 발명의 제1 측면에 따른 하나 이상의 하이브리드 핵산 서열과 하나 이상의 CRISPR 폴리펩타이드를 포함하고, 하나 이상의 하이브리드 핵산 서열과 하나 이상의 CRISPR 폴리펩타이드가 기능적인 방식으로 결합된, 분자 복합체를 제공한다.
본 발명의 임의 측면에 따른 일 구현예에서, 하나 이상의 CRISPR 폴리펩타이드는 독립적으로 스트렙토코커스 피오게네스 (Streptococcus pyogenes), 스트렙토코커스 서모필 (Streptococcus thermophiles) 등의 스트렙토코커스 (Streptococcus spp.), 스타필로코커스 아우레우스 (Staphylococcus aureus) 또는 네이세리아 메닝기티데스 (Neisseria meningitides) 등의 네이세리아 (Neisseria spp.), 코리네박터 (Corynebacter), 슈테렐라 (Sutterella), 레지오넬라 (Legionella), 트레포네마 (Treponema), 필리팍토르 (Filifactor), 유박테리움 (Eubacterium), 락토바실러스 (Lactobacillus), 미코플라스마 (Mycoplasma), 박테로이데스 (Bacteroides), 플라비이볼라 (Flaviivola), 플라보박테리움 (Flavobacterium), 스파로키타 (Sphaerochaeta), 아조스피릴룸 (Azospirillum), 글루콘아세토박터 (Gluconacetobacter), 로세부리아 (Roseburia), 파르비바쿨럼 (Parvibaculum), 니트라티프락토르 (Nitratifractor), 미코플라스마 (Mycoplasma) 및 캄필로박터 (Campylobacter)의 Cas 폴리펩타이드로 이루어진 군으로부터 선택되거나, 또는 CRISPR 폴리펩타이드는 액시드아미노코커스 sp. BV3L6 (Acidaminococcus sp. BV3L6) 등의 액시드아미노코커스 (Acidaminococcus), 라크노스피레이세아 박테리움 ND2006 (Lachnospiraceae bacterium ND2006) 등의 라크노스피레이세아 (Lachnospiraceae spp.), 프란시셀라 노비시다 U112 (Francisella novicida U112) 등의 프란시셀라 (Francisella spp.), 유박테리움 엘리겐스 (Eubacterium eligens), 프레보텔라 (Prevotella spp.) 또는 포르피로모나스 (Porphyromonas spp.)의 Cpf1 폴리펩타이드 등의 고세균 또는 박테리아 유래 Cpf1 폴리펩타이드들로부터 선택되거나, 또는 CRISPR 폴리펩타이드는, CRISPR 폴리펩타이드 닉카제 또는 엔도뉴클레오분해 활성이 결핍된 CRISPR 폴리펩타이드 등의, CasX 폴리펩타이드 또는 CasY 폴리펩타이드, 또는 이의 변이체 및/또는 기능성 단편 및/또는 이들의 조합으로부터 선택된다.
본 발명에 따른 다른 측면에서, 제1 측면에 따른 하나 이상의 하이브리드 핵산 서열을 포함하거나 또는 이에 의해 편집된, 또는 본 발명의 제2 측면에 따른 하나 이상의 분자 복합체를 포함하는, 식물, 식물 세포, 식물 물질, 또는 이의 파생물 (derivative) 또는 후대를 제공한다.
본 발명에 따른 또 다른 측면에서, (i) 하나 이상의 제1 DNA 타겟 서열 및 하나 이상의 제2 DNA 타겟 서열을 포함하는 하나 이상의 DNA 타겟 서열을, 대상 게놈 영역에 포함하는 하나 이상의 원핵생물 또는 진핵생물 세포를 제공하는 단계; (ii) 본 발명의 제1 측면에 따른 하나 이상의 하이브리드 핵산 서열과 하나 이상의 CRISPR 폴리펩타이드를 포함하는, 본 발명의 제2 측면에 따른 하나 이상의 분자 복합체를 제공하는 단계; (iii) 하나 이상의 하이브리드 핵산 서열의 CRISPR 핵산 서열 또는 가이드 핵산 서열의 제1 서열 영역이 하나 이상의 제1 DNA 타겟 서열과의 상보적인 염기 쌍 형성을 달성하는데 적합한 조건 하에, 하나 이상의 분자 복합체를 하나 이상의 DNA 타겟 서열과 접촉시켜, 하나 이상의 CRISPR 폴리펩타이드에 의한 제1 DNA 타겟 서열의 인지를 달성하는 단계; 선택적으로, 하나 이상의 CRISPR 폴리펩타이드에 의한 하나 이상의 DNA 절단을 유도하는 단계; 및 (iv) 하나 이상의 DNA 타겟 서열에 변형을 포함하는 하나 이상의 원핵생물 또는 진핵생물 세포를 수득하는 단계를 포함하며, 상기 하나 이상의 하이브리드 핵산 서열의 하나 이상의 복구 주형 핵산 서열이 하나 이상의 제2 DNA 타겟 서열의 부위에서 상동성 특이적인 복구를 지시하는, 원핵생물 또는 진행생물 세포에서 하나 이상의 DNA 타겟 서열을 변형시키는 방법을 제공한다.
이러한 측면에 대한 일 구현예에서, 분자 복합체의 하나 이상의 하이브리드 핵산 서열은, 하나 이상의 분자 복합체의 하나 이상의 CRISPR 폴리펩타이드와 독립적으로, 하나 이상의 원핵생물 또는 진핵생물 세포에 제공되며, 하나 이상의 분자 복합체는 하나 이상의 원핵생물 또는 진핵생물 세포 내부에서 조립된다.
하나 이상의 진핵생물 세포가 포유류, 영장류 또는 인간 세포인, 제1 측면에 대한 추가적인 구현예를 제공한다. 일 구현예에서, 세포는 인간 세포이다. 일 구현예에서, 세포는 조혈 세포, 림프구, 예를 들어, B-림프구 및 T-림프구, 체세포, 생식 세포 (germ cell), 태아 세포 (prenatal cell), 예로, 접합 (zygotic), 배반포 또는 배아 세포, 줄기 세포, 유사분열 컴피턴트 세포 (mitotically competent cell) 또는 감수분열 컴피턴트 세포 (meiotically competent cell)이다. 바람직하게는, 세포는 동물의 면역 세포 또는 암 세포이다. 일 구현예에서, DNA 타겟 영역은 염색체 핵산이다.
제1 측면에 대한 일 구현예에서, 세포는 식물 세포, 바람직하게는 호르데움 불가리 (Hordeum vulgare), 호르데움 불부숨 (Hordeum bulbusom), 소르굼 비콜러 (Sorghum bicolor), 사카룸 오피시나리움 (Saccharum officinarium), 지 메이스 (Zea mays), 세타리아 이탈리카 (Setaria italica), 오리자 미누타 (Oryza minuta), 오리자 사티바 (Oriza sativa), 오리자 아우스트랄리엔시스 (Oryza australiensis), 오리자 알타 (Oryza alta), 트리티쿰 에이스티붐 (Triticum aestivum), 트리티쿰 두럼 (Triticum durum), 세칼레 세레알레 (Secale cereale), 트리티칼레 (Triticale), 말루스 도메스티카 (Malus domestica), 브라키포듐 디스타키온 (Brachypodium distachyon), 호르데움 마리눔 (Hordeum marinum), 에이길롭스 타우치이 (Aegilops tauschii), 다우쿠스 글로키디아투스 (Daucus glochidiatus), 베타 불가리스 (Beta vulgaris), 다우쿠스 푸실루스 (Daucus pusillus), 다우쿠스 무리카투스 (Daucus muricatus), 다우쿠스 카로타 (Daucus carota), 유칼립투스 그란디스 (Eucalyptus grandis), 니코티아나 실베스트리스 (Nicotiana sylvestris), 니코티아나 토멘토시포르미스 (Nicotiana tomentosiformis), 니코티아나 타바쿰 (Nicotiana tabacum), 니코티아나 벤타미아나 (Nicotiana benthamiana), 솔라눔 라이코퍼시쿰 (Solanum lycopersicum), 솔라눔 투베로숨 (Solanum tuberosum), 코페아 카네포라 (Coffea canephora), 비티스 비니페라 (Vitis vinifera), 에리트란테 구타타 (Erythrante guttata), 겐리시아 아우레아 (Genlisea aurea), 쿠쿠미스 사티부스 (Cucumis sativus), 모루스 노타빌리스 (Morus notabilis), 아라비돕시스 아레노사 (Arabidopsis arenosa), 아라비돕시스 라이라타 (Arabidopsis lyrata), 아라비옵시스 탈리아나 (Arabidopsis thaliana), 크루시히말라야 히말라이카 (Crucihimalaya himalaica), 크루시히말라야 발리치이 (Crucihimalaya wallichii), 카르다민 플렉수오사 (Cardamine flexuosa), 레피디움 비르기니쿰 (Lepidium virginicum), 캡셀라 부르사 파스토리스 (Capsella bursa pastoris), 올마라비돕시스 푸밀라 (Olmarabidopsis pumila), 아라비스 히르수테 (Arabis hirsute), 브라씨카 나푸스 (Brassica napus), 브라씨카 올레라시아 (Brassica oleracea), 브라씨카 라파 (Brassica rapa), 라파누스 사티부스 (Raphanus sativus), 브라씨카 준카시아 (Brassica juncacea), 브라씨카 니그라 (Brassica nigra), 에루카 베시카리아 아종 사티바 (Eruca vesicaria subsp. sativa), 시트러스 시넨시스 (Citrus sinensis), 자트로파 쿠르카스 (Jatropha curcas), 포풀루스 트리코카르파 (Populus trichocarpa), 메디카고 트룬카툴라 (Medicago truncatula), 시져 야마시타 (Cicer yamashitae), 시져 비주굼 (Cicer bijugum), 시져 아리에티눔 (Cicer arietinum), 시져 레티쿨라툼 (Cicer reticulatum), 시져 주다이쿰 (Cicer judaicum), 카야누스 카자니폴리우스 (Cajanus cajanifolius), 카자누스 스카라바에오이데스 (Cajanus scarabaeoides), 파세올루스 불가리스 (Phaseolus vulgaris), 글리신 맥스 (Glycine max), 고씨퓸 (Gossypium sp.), 아스트라갈루스 시니쿠스 (Astragalus sinicus), 로투스 자포니카스 (Lotus japonicas), 토레니아 포우르니에리 (Torenia fournieri), 알리움 세파 (Allium cepa), 알리움 피스툴로숨 (Allium fistulosum), 알리움 사티붐 (Allium sativum), 헬리안투스 안누스 (Helianthus annuus), 헬리안투스 투베로수스 (Helianthus tuberosus) 및 알리움 투베로숨 (Allium tuberosum), 또는 전술한 식물들 중 하나에 속하는 임의 품종 또는 아종으로 이루어진 군으로부터 선택되는 식물의 식물 세포이다.
본 발명에 따른 이러한 측면에 대한 또 다른 구현예에서, 하나 이상의 DNA 타겟 서열의 변형은, 수율 개선, 건조 스트레스, 삼투성 스트레스, 열 스트레스, 한랭 스트레스, 산화 스트레스, 중금속 스트레스, 염 스트레스 또는 침수 (waterlogging) 등의 비-생물적 스트레스에 대한 저항성, 곤충 내성, 박테리아 내성, 바이러스 내성, 진균 내성 또는 선충 내성 등의 생물 스트레스에 대한 저항성, 글리포세이트, 글루포시네이트, ALS 저해제 및 Dicamba 등의 제초제 저항성, 내도복성 (lodging resistance), 개화 시기, 내탈립성, 종자 색, 배젖 조성, 영양분 함량 등의 농업형질 개선, 또는 하나 이상의 식물 세포에서 분자 조작 기법 (molecular pharming approach)을 허용하는 게놈 편집 등의 대사 조작으로 이루어진 군으로부터 선택되는 형질을 유발하는 게놈 편집 기법이다.
이러한 측면에 대한 다른 구현예에서, 본 방법은, (v) 하나 이상의 DNA 타겟 서열에 변형을 포함하는 하나 이상의 원핵생물 또는 진핵생물 세포를 동정 및/또는 선별하는 단계를 더 포함한다.
본 발명의 다른 측면에서, (i) 본 발명의 전술한 측면에 상세히 기술된 방법을 수행하는 단계로서, 하나 이상의 진핵생물 세포가 식물 세포인, 단계; (ii) 단계 (i)의 하나 이상의 식물 세포로부터 하나 이상의 식물 또는 그 후대를 수득하는 단계; (iii) 선택적으로, 하나 이상의 식물 또는 그 후대의 하나 이상의 세포에서 하나 이상의 DNA 타겟 서열 내 변형을 확인하는 단계를 포함하는, 식물 또는 식물 세포의 제조 방법을 제공한다.
본 발명에 따른 전술한 측면에 대한 일 구현예에서, 하나 이상의 식물 또는 식물 세포는 외떡잎 식물 또는 쌍떡잎 식물로부터 선택되며, 바람직하게는, 식물은 지 메이스 (Zea mays) 등의 Zea spp., 니코티아나 벤타미아나 (Nicotiana benthamiana) 또는 베타 불가리스 (Beta vulgaris) 등의 Beta spp., 또는 세칼레 세레알 (Secale cereal) 등의 Secale ssp., 또는 트리티쿰 에이스티붐 (Triticum aestivum) 등의 Triticum spp.로 이루어진 군으로부터 선택된다.
본 발명에 따른 또 다른 측면에서, 원핵생물 또는 진핵생물 세포 또는 유기체, 바람직하게는 식물 세포 또는 유기체에서 게놈 편집을 수행하기 위한, 본 발명의 제1 측면에 따른 하나 이상의 하이브리드 RNA/DNA 핵산 서열의 용도 또는 본 발명의 제2 측면에 따른 분자 복합체의 용도를 제공한다.
본 발명의 추가적인 측면 및 구현예들은 후술한 상세한 설명, 도면, 서열목록 및 첨부된 청구항으로부터 유추될 수 있다.
도 1a A - D (도 1a A - D)는 본 발명에 따른 여러가지 RNA-DNA 하이브리드 핵산 서열들의 가능한 배열과 여러가지 결합 방식에 대한 비-제한적인 예를 나타낸 것이다. 도 1a는, CRISPR 핵산 서열이 5'에 위치하고; RT가 CRISPR 핵산의 3' 말단에 위치한 CRISPR 핵산과 결합된, 배열을 도시한다. (A) 단일 가닥의 표준 복구 주형 (RT) (ssDNA)과 CRISPR 핵산의 왓슨-크릭 염기 쌍 형성에 의한 비-공유 결합으로서, CRISPR 핵산은 tracrRNA로서, crRNA (예, Cpf1 또는 Cpf1-유래 CRISPR 작동자의 경우)로서, 또는 이들의 조합 (예컨대, sgRNA)으로서 기능하는 서열을 함유한 RNA 분자를 포함한다. (B) CRISPR 핵산과 단일 가닥 RT (ssDNA)의 공유 결합. 이 형태는 단일 분자로서 RNA 또는 RT 영역의 순차적 합성에 의해, 또는 단일 분자를 형성하기 위한 분리된 영역들의 라이게이션에 의해 제조될 수 있다. (C) CRISPR 핵산과 이중 가닥 RT (dsDNA)의 비-공유 결합. (D) CRISPR 핵산과 이중 가닥 RT (dsDNA)의 공유 결합.
도 1b A - D (도 1b A - D)는 본 발명에 따른 여러가지 RNA-DNA 하이브리드 핵산 서열들에 대한 가능한 배열과 여러가지 결합 방식에 대한 비-제한적인 예를 나타낸 것이다. 도 1b는, RT가 5'에 위치하고; CRISPR 핵산 서열이 RT의 3'에 결합된, 배열을 보여준다. (A) 단일 가닥의 표준 복구 주형 (RT) (ssDNA)과 CRISPR 핵산의 왓슨-크릭 염기 쌍 형성에 의한 비-공유 결합으로서, CRISPR 핵산은 tracrRNA로서, crRNA (예, Cpf1 또는 Cpf1-유래 CRISPR 작동자의 경우)로서, 또는 이들의 조합 (예컨대, sgRNA)으로서 기능하는 서열을 함유한 RNA 분자를 포함한다. (B) CRISPR 핵산과 단일 가닥 RT (ssDNA)의 공유 결합. 이 형태는 단일 분자로서 RNA 또는 RT 영역의 순차적 합성에 의해, 또는 단일 분자를 형성하기 위한 분리된 영역들의 라이게이션에 의해 제조될 수 있다. (C) CRISPR 핵산과 이중 가닥 RT (dsDNA)의 비-공유 결합. (D) CRISPR 핵산과 이중 가닥 RT (dsDNA)의 공유 결합.
도 2 A - C (도 2 A - C)는, 하나 이상의 RNA 가닥을 포함하는 CRISPR 핵산에 RT가 결합 또는 부착하여, 본 발명에 따른 RNA-DNA 하이브리드 핵산을 형성할 수 있는 가능한 위치들에 대한 비-제한적인 예를 보여준다. (A) CRISPR 핵산의 3' 말단, 예를 들어 sgRNA에, 단일 가닥 또는 이중 가닥 RT의 공유 또는 비-공유 결합. (B) CRISPR 핵산의 5' 말단, 예를 들어 sgRNA에, 단일 가닥 또는 이중 가닥 RT의 공유 또는 비-공유 결합. (D) CRISPR 핵산의 내부, 예를 들어 sgRNA에, 단일 가닥 또는 이중 가닥 RT의 공유 또는 비-공유 결합. 복구 주형 (RT/rt) 영역은 전체 도면에 회색으로 표시된다.
도 3 A - E (도 3 A - E)는, CRISPR 핵산, 예를 들어, sgRNA 또는 tracrRNA의 3'-영역과 또는 영역 내에서의 RT와의 공유 결합에 대한 일 구현예로서, 본원에 기술된 뉴클레아제 복합체를 이용하여 대상 게놈 핵산에 편집을 단계적으로 도입하는 방법에 대한 비-제한적인 예를 나타낸 것이다. (A) CRISPR 엔도뉴클레아제, 예를 들어 Cas9, Cpf, CasX, CasY 또는 이들의 임의 조합과 복합체를 형성한, 하이브리드 RNA-DNA 핵산 (CRISPR 핵산, 예, sgRNA, 및 복구 주형 (rt))을 개략적으로 도시한 도. (B) 타겟 DNA (게놈 DNA (gDNA))에 결합된 복합체와 절단 부위 (검정 삼각형)를 도시한 도. (C) CRISPR 뉴클레아제에 의해 절단된 타겟 DNA가 해리되고, 상보적인 왓슨-크릭 염기 쌍 형성에 의해 복구 주형 (rt)과 상호작용함을 개략적으로 도시한 도. (E) 상동적인 재조합 과정 중에 RT로부터 복사된 편집 (회색)을 포함하는 복구된 타겟 부위 (gDNA)를 개략적으로 도시한 도. 복구 주형 (RT/rt) 영역은 도면에 회색으로 표시된다.
도 4 (도 4)는, RNA-DNA 라이게이션 분석의 셋-업 (상단 표) 및 결과 (트리스-보레이트-EDTA (TBE) 우레아 겔, 6% 아크릴아미드, 하단)를 나타낸 것이다. 이를 위해, RT로서 5' 인산화된 ssDNA를 구입하였다. 이 ssDNA를 이후 5' 아데닐화하고, 제조된 아데닐화된 RT를 대상 CRISPR 핵산의 3' 말단에 라이게이션하였다. RecJF, 단일 가닥 DNA 특이적인 5' 엑소뉴클레아제를 사용해, 아데닐화된 RT의 CRISPR 핵산과의 성공적인 라이게이션을 테스트하였다. 각 방법 단계의 결과 (educt) 및 혼합물을 TBE 우레아 겔에 적용하여, 각 방법 단계의 결과 및 각 생성물을 모니터링하였다.
서열목록 자유 텍스트
서열번호 1은 SV40 라지 T-항원의 핵 위치화 서열/신호 (NLS)이다.
서열번호 2는 뉴클레오플라스민 2파트 NLS (nucleoplasmin bipartite NLS)이다.
서열번호 3은 c-myc NLS이다.
서열번호 4는 또 다른 c-myc NLS이다.
서열번호 5는 hRNPA1 M9 NLS이다.
서열번호 6은 importin-alpha의 IBB 도메인이다.
서열번호 7은 myoma T 단백질 유래 서열이다.
서열번호 8은 myoma T 단백질 유래 또 다른 서열이다.
서열번호 9는 인간 p53의 서열이다.
서열번호 10은 마우스 c-abl IV의 서열이다.
서열번호 11은 인플루엔자 바이러스 NS1의 서열이다.
서열번호 12는 인플루엔자 바이러스 NS1의 또 다른 서열이다.
서열번호 13은 간염 바이러스 델타 항원의 서열이다.
서열번호 14는 마우스 Mx1 단백질 유래 서열이다.
서열번호 15는 인간 폴리(ADP-리보스) 중합효소 유래 서열이다.
서열번호 16은 스테로이드 호르몬 수용체 (인간) 글루코코르티코이드 유래 서열이다.
서열번호 17은 HIV Tat 유래 서열이다.
서열번호 18은 HIV Tat 유래의 또 다른 서열이다.
정의
용어 "가이드 RNA", "gRNA" 또는 "싱글 가이드 RNA" 또는 "sgRNA"는 본원에서 상호 호환적으로 사용되며, CRISPR RNA (crRNA)와 tracrRNA (trans-activating crRNA)가 융합된 합성물을 지칭하거나, 또는 이 용어는 crRNA 및/또는 tracrRNA로만 구성된 싱글 RNA 분자를 지칭하거나, 또는 이 용어는 crRNA 또는 tracrRNA 모이어티를 별도로 포함하는 gRNA를 지칭한다. 대응되는 CRISPR 폴리펩타이드에 의해 요청되는, tracr 및 crRNA 모이어티는, 존재하더라도, 반드시 공유적으로 부착된 하나의 RNA 분자로 존재하여야 하는 것은 아니며, 이는 또한 2개의 개별 RNA 분자에 포함될 수 있으며, 이들은 비-공유 또는 공유적 상호작용에 의해 결합되어 본 발명에 따른 gRNA를 제공할 수 있다. Cpf1와 같이 싱글 RNA-가이드 엔도뉴클레아제 (single RNA-guided endonucleases)의 경우에는 (Zetsche et al., 2015, supra), 예를 들어, 싱글 가이드 핵산 서열로서 crRNA가 DNA 타겟팅을 매개하는데 충분할 수도 있다.
용어 "가이드 핵산 (서열)" 및 "CRISPR 핵산 (서열)"은 본원에서 상호 호환적으로 사용되며, CRISPR 폴리펩타이드와 특이적으로 상호작용할 수 있으며 하나 이상의 RNA 영역을 포함하는, 핵산 서열을 지칭한다.
용어 "게놈 편집", "유전자 편집" 및 "게놈 조작"은 본원에서 상호 호환적으로 사용되며, 살아있는 유기체의 임의의 유전자 정보 또는 게놈에 대한 타겟화된 특이적인 변형 전략 및 기법을 의미한다. 이와 같이, 이들 용어는 유전자 편집을 포함하며, 또한 게놈의 유전자 코딩 영역 이외의 영역의 편집도 포함한다. (존재한다면) 핵 뿐만 아니라 세포의 다른 유전자 정보의 편집 또는 조작을 추가로 포함한다. 또한, 이들 용어 "게놈 편집" 및 "게놈 조작"은 또한 후생 편집 (epigenetic editing) 또는 조작, 즉, 유전자 발현에 유전가능한 변화를 유발할 수 있는 비-코딩 RNA의 타겟화된 변형, 예를 들어, 메틸화, 히스톤 변형을 포함한다.
용어 "CRISPR 폴리펩타이드", "CRISPR 엔도뉴클레아제", CRISPR 뉴클레아제", "CRISPR 단백질", "CRISPR 작동자 (effector)" 또는 "CRISPR 효소"는 본원에서 상호 호환적으로 사용되며, 부위-특이적인 DNA 뉴클레아제 또는 닉카제로서 작용하는 임의의 천연 또는 인공 아미노산 서열, 또는 이를 코딩하는 핵산 서열을 지칭하며, 여기서 "CRISPR 폴리펩타이드"는 타겟화된 게놈 조작을 위해 클로닝 및 사용될 수 있는 임의의 유기체의 CRISPR 시스템으로부터 유래된다. 용어 "CRISPR 폴리펩타이드"는 또한 천연 CRISPR 작용자 서열의 융합체 또는 돌연변이 또는 촉매 활성 단편을 포함한다. "CRISPR 폴리펩타이드"는, 따라서, 예를 들어, CRISPR 닉카제를 지칭하거나, 또는 천연 환경에서 엔도뉴클레오분해 기능 (endonucleolytic function)을 가진 CRISPR 폴리펩타이드의 뉴클레아제-결핍 변이체를 지칭할 수 있다.
서열 또는 분자와 관련하여 용어 "뉴클레오티드" 및 "핵산"은 본원에서 상호 호환적으로 사용되며, 천연 또는 합성 기원의 단일 가닥 또는 이중 가닥 DNA 또는 RNA를 지칭한다. 즉, 용어 뉴클레오티드 서열은 길이와 무관하게 모든 DNA 또는 RNA 서열에 사용되며, 따라서 이 용어는 하나 이상의 뉴클레오티드를 포함하는 임의의 뉴클레오티드 서열 뿐만 아니라 이 보다 더 큰 임의 타입의 올리고뉴클레오티드 또는 폴리클레오티드를 포함한다. 즉, 이 용어(들)는 천연 및/또는 합성 데옥시리보뉴클레익산 (DNA) 및/또는 리보뉴클레익산 (RNA) 서열을 지칭하며, 이는 선택적으로 합성 핵산 유사체를 포함할 수 있다. 본 발명에 따른 핵산은 선택적으로 코돈 최적화될 수 있다. 코돈 최적화는, 대상 세포 또는 유기체에서 재조합 핵산의 전사율을 개선하기 위해 DNA 또는 RNA의 코돈 용법을 대상 세포 또는 유기체에 적합하게 하는 것을, 의미한다. 당해 기술 분야의 당업자라면, 타겟 핵산이 코돈 중복 (codon degeneracy)으로 인해 하나의 위치에서 변형될 수 있지만, 이러한 변형이 번역 후 그 위치에서 여전히 동일한 아미노산 서열을 만들고자 한다면, 이는 타겟 세포 또는 유기체의 종-특이적인 코돈 용법을 감안하기 위해 코돈 최적화에 의해 달성됨을, 잘 알 것이다. 본 발명에 따른 핵산 서열은 다음과 같은 비-제한적인 유기체 리스트에 대해 특이적인 코돈 최적화를 수행할 수 있다: 호르데움 불가리 (Hordeum vulgare), 소르굼 비콜러 (Sorghum bicolor), 세칼레 세레알레 (Secale cereale), 트리티칼레 (Triticale), 사카룸 오피시나리움 (Saccharum officinarium), 지 메이스 (Zea mays), 세타리아 이탈리카 (Setaria italica), 오리자 사티바 (Oriza sativa), 오리자 미누타 (Oryza minuta), 오리자 아우스트랄리엔시스 (Oryza australiensis), 오리자 알타 (Oryza alta), 트리티쿰 에이스티붐 (Triticum aestivum), 트리티쿰 두럼 (Triticum durum), 트리티칼레 (Triticale), 호르데움 불부숨 (Hordeum bulbusom), 브라키포듐 디스타키온 (Brachypodium distachyon), 호르데움 마리눔 (Hordeum marinum), 에이길롭스 타우치이 (Aegilops tauschii), 말루스 도메스티카 (Malus domestica), 베타 불가리스 (Beta vulgaris), 헬리안투스 안누스 (Helianthus annuus), 다우쿠스 글로키디아투스 (Daucus glochidiatus), 다우쿠스 푸실루스 (Daucus pusillus), 다우쿠스 무리카투스 (Daucus muricatus), 다우쿠스 카로타 (Daucus carota), 유칼립투스 그란디스 (Eucalyptus grandis), 에리트란테 구타타 (Erythranthe guttata), 겐리시아 아우레아 (Genlisea aurea), 니코티아나 실베스트리스 (Nicotiana sylvestris), 니코티아나 타바쿰 (Nicotiana tabacum), 니코티아나 토멘토시포르미스 (Nicotiana tomentosiformis), 니코티아나 벤타미아나 (Nicotiana benthamiana), 솔라눔 라이코퍼시쿰 (Solanum lycopersicum), 솔라눔 투베로숨 (Solanum tuberosum), 코페아 카네포라 (Coffea canephora), 비티스 비니페라 (Vitis vinifera), 쿠쿠미스 사티부스 (Cucumis sativus), 모루스 노타빌리스 (Morus notabilis), 아라비옵시스 탈리아나 (Arabidopsis thaliana), 아라비돕시스 라이라타 (Arabidopsis lyrata), 아라비돕시스 아레노사 (Arabidopsis arenosa), 크루시히말라야 히말라이카 (Crucihimalaya himalaica), 크루시히말라야 발리치이 (Crucihimalaya wallichii), 카르다민 플렉수오사 (Cardamine flexuosa), 레피디움 비르기니쿰 (Lepidium virginicum), 캡셀라 부르사 파스토리스 (Capsella bursa pastoris), 올마라비돕시스 푸밀라 (Olmarabidopsis pumila), 아라비스 히르수테 (Arabis hirsute), 브라씨카 나푸스 (Brassica napus), 브라씨카 올레라시아 (Brassica oleracea), 브라씨카 라파 (Brassica rapa), 브라씨카 준카시아 (Brassica juncacea), 브라씨카 니그라 (Brassica nigra), 라파누스 사티부스 (Raphanus sativus), 에루카 베시카리아 사티바 (Eruca vesicaria sativa), 시트러스 시넨시스 (Citrus sinensis), 자트로파 쿠르카스 (Jatropha curcas), 글리신 맥스 (Glycine max), 고씨퓸 (Gossypium sp.), 포풀루스 트리코카르파 (Populus trichocarpa), 무스 무스쿨러스 (Mus musculus), 라투스 노르베기쿠스 (Rattus norvegicus) 또는 호모 사피엔스 (Homo sapiens).
본원에서, 용어 "전달 구조체" 또는 "전달 벡터"는 RNA 및 DNA를 포함하는 하이브리드 핵산 등의 핵산 및/또는 대상 아미노산 서열을 타겟 세포, 바람직하게는 진핵생물 세포로 운반하기 위한 카고로서 사용되는 임의의 생물학적 또는 화학적 수단을 지칭한다. 본원에서, 용어 전달 구조체 또는 벡터는 본 발명에 따른 유전자 또는 재조합 구조체를 타겟 세포, 조직, 장기 또는 유기체에 전달하기 위한 수송 수단을 의미한다. 즉, 벡터는, 조절 서열 또는 직접 또는 간접적으로 식물의 원하는 세포 구획 내 식물 타겟 구조 또는 대상 타겟 세포에 전달하기 위한 위치화 서열 (localization sequence)과 같은 서열을 선택적으로 포함하는, 핵산 서열을 포함할 수 있다. 또한, 벡터는 아미노산 서열 또는 리보뉴클레오-분자 복합체를 타겟 세포 또는 타겟 구조에 도입하기 위해 사용될 수 있다. 통상적으로, 본원에서 벡터는 플라스미드 벡터일 수 있다. 또한, 본 발명에 따른 바람직한 특정 구현예에서, 대상 구조체, 서열 또는 복합체의 직접 도입이 수행된다. 용어 직접 도입은, 본 발명에 따라 변형시킬 DNA 타겟 서열을 함유한 원하는 타겟 세포 또는 타겟 구조가, 전달 벡터로 전달된 물질이 그 효과를 발휘하게 될 특정 타겟 대상 세포로 직접 형질전환, 형질도입 또는 형질감염되는 것을 의미한다. 용어 간접 도입은 구조, 예를 들어, 그 자체가 형질전환될 실제 타겟 세포 또는 대상 구조는 아니지만 실제 타겟 구조, 예를 들어 분열조직 세포 또는 조직 또는 줄기 세포 또는 조직으로, 바람직하게는 본 발명에 따른 유전자 구조체를 포함하는 벡터의 전신 전파 및 전달을 위한 토대로서 사용되는, 잎 세포 또는 기관 또는 조직의 세포로의 도입이 달성되는 것을 의미한다. 하이브리드 핵산 서열 등의 아미노산 서열 및/또는 핵산 서열을 타겟 세포에 형질감염시키는 맥락에서 용어 벡터가 사용되는 경우, 용어 벡터는 펩타이드 또는 단백질 형질감염에 적합한 물질, 예를 들어, 이온성 지질 혼합물, 세포 침투 펩타이드 (CPP) 또는 입자 총격 (particle bombardment)을 내포한다. 핵산 물질을 도입하는 맥락의 경우, 용어 벡터는 플라스미드 벡터 뿐만 아니라 핵산 및/또는 아미노산 서열을 대상 타겟 세포로, 예를 들어 입자 총격에 의해 도입하기 위한 토대로 사용할 수 있는 적합한 담체 물질을 의미할 수 있다. 이러한 담체 물질은, 특히, 금 또는 텅스텐 입자를 포함한다. 마지막으로, 용어 벡터는 또한 본 발명에 따른 하나 이상의 유전자 구조체를 도입하기 위한 바이러스 벡터, 예를 들어, 다음과 같은 바이러스 균주로부터 유래된 변형된 바이러스의 사용을 의미한다: 아데노바이러스 또는 아데노부속 바이러스 (AAV) 벡터, 렌티바이러스 벡터, 헤르페스 심플렉스 바이러스 (HSV-1), 백시니아 바이러스, 센다이 바이러스, 신드비스 바이러스, 셈리키 삼림 알파바이러스, 엡스타인-바-바이러스 (EBV), 옥수수 스트리크 바이러스 (Maize Streak Virus, MSV), 보리 스트라입 모자이크 바이러스 (Barley Stripe Mosaic Virus, BSMV), 브롬 모자이크 바이러스 (Brome Mosaic virus, BMV, 등재번호: RNA1: X58456; RNA2: X58457; RNA3: X58458), 옥수수 스트라입 바이러스 (Maize stripe virus, MSpV), MYDV (Maize rayado fino virus), MYDV (Maize yellow dwarf virus), MDMV (Maize dwarf mosaic virus), Benyviridae 과의 (+) 가닥 RNA 바이러스, 예를 들어, 사탕무 엽맥황화 바이러스 (Beet necrotic yellow vein virus) (등재번호: RNA1: NC_003514; RNA2: NC_003515; RNA3: NC_003516; RNA4: NC_003517) 또는 Bromoviridae 과의 (+) 가닥 RNA 바이러스, 예를 들어, 속명 알파파 모자이크 바이러스 (Alfalfa mosaic virus, 등재번호: RNA1: NC_001495; RNA2: NC_002024; RNA3: NC_002025) 또는 속명 브로모바이러스 (Bromovirus), 예를 들어 BMV (상기 참조), 또는 속명 쿠쿠모바이러스 (Cucumovirus), 예를 들어, 오이 모자이크 바이러스 (Cucumber mosaic virus, 등재번호: RNA1: NC_002034; RNA2: NC_002035; RNA3: NC_001440), 속명 올레아바이러스 (Oleavirus), Caulimoviridae 과, 특히 바드나바이러스 (Badnavirus) 또는 콜리모바이러스 (Caulimovirus) 과의 dsDNA 바이러스, 예를 들어, 여러가지 바나나 스트리크 바이러스 (Banana streak viruse) (예, 등재번호: NC_007002, NC_015507, NC_006955 또는 NC_003381) 또는 콜리플라워 모자이크 바이러스 (등재번호: NC_001497), 또는 속명 카베모바이러스 (Cavemovirus), 페투바이러스 (Petuvirus), 로사드나바이러스 (Rosadnavirus), 솔렌도바이러스 (Solendovirus), 소이모바이러스 (Soymovirus) 또는 툰그로바이러스 (Tungrovirus), 또는 Closteroviridae 과의 (+) 가닥 RNA 바이러스, 예를 들어, 속명 앰펠로바이러스 (Ampelovirus), 크리니바이러스 (Crinivirus), 예를 들어, 상추 감염성 황색 바이러스 (Lettuce infectious yellows virus, 등재번호: RNA1: NC_003617; RNA2: NC_003618) 또는 토마토 클로로시스 바이러스 (등재번호: RNA1: NC_007340; RNA2: NC_007341), 클로스테로바이러스 (Closterovirus), 예로, 사탕무 황색 바이러스 (등재번호: NC_001598) 또는 벨라리바이러스 (Velarivirus), Geminiviridae 과의 단일 가닥 DNA (+/-) 바이러스, 예를 들어, 베쿠르토바이러스 (Becurtovirus), 베고모바이러스 (Begomovirus), 예를 들어, 빈 골든 옐로우 모자이크 바이러스 (Bean golden yellow mosaic virus), 토바코 컬리 쇼트 바이러스 (Tobacco curly shoot virus), 토바코 모틀 리프 컬 바이러스 (Tobacco mottle leaf curl virus), 토마토 클로로틱 모틀 바이러스 (Tomato chlorotic mottle virus), 토마토 위축 잎 바이러스 (Tomato dwarf leaf virus), 토마토 골든 모자이크 바이러스 (Tomato golden mosaic virus), 토마토 잎 말림 바이러스 (Tomato leaf curl virus), 토마토 모틀 바이러스 (Tomato mottle virus), 오데르 토마토 옐로우 스팟 바이러스 (oder Tomato yellow spot virus), 또는 Geminiviridae 과의 속명 쿠르토바이러스 (Curtovirus), 예를 들어, 비트 컬리 탑 바이러스 (Beet curly top virus), 또는 Geminiviridae 과의 속명 토포쿠바이러스 (Topocuvirus), 턴큐트바이러스 (Turncurtvirus) 또는 마스트레바이러스 (Mastrevirus), z.B 옥수수 스트리크 바이러스 (z.B Maize streak virus)(supra), 토바코 황화 위축 바이러스 (Tobacco yellow dwarf virus), 밀 위축 바이러스 (Wheat dwarf virus), Luteoviridae 과의 (+) 가닥 RNA 바이러스, 예를 들어, 속명 루테오바이러스 (Luteovirus), 예로, 보리 황화 위축 바이러스-PAV (Barley yellow dwarf virus-PAV, 등재번호: NC_004750), 또는 속명 폴레로바이러스 (Polerovirus), 예로, 감자 잎 말림 바이러스 (Potato leafroll virus, 등재번호: NC_001747), Nanoviridae 과의 단일 가닥 DNA 바이러스, 예를 들어, 속명 나노바이러스 (Nanovirus) 또는 바부바이러스 (Babuvirus), Partiviridae 과의 이중 가닥 RNA 바이러스, 예를 들어, 특히 알파파티티바이러스 (Alphapartitivirus), 베타파티티바이러스 (Betapartitivirus) 또는 델타파티티바이러스 (Deltapartitivirus), Pospiviroidae 과의 비로이드 (viroid), Potyviridae 과의 (+) 가닥 RNA 바이러스, 예를 들어, 속명 브람비바이러스 (Brambyvirus), 비모바이러스 (Bymovirus), 이포모바이러스 (Ipomovirus), 마클루라바이러스 (Macluravirus), 포아세바이러스 (Poacevirus), 예를 들어, 트리티컴 모자이크 바이러스 (Triticum mosaic virus) (등재번호: NC_012799), 또는 Potyviridae 과의 속명 포티바이러스 (Potyvirus), 예를 들어, 비트 모자이크 바이러스 (등재번호: NC_005304), 옥수수 위축 모자이크 바이러스 (Maize dwarf mosaic virus) (등재번호: NC_003377), 감자 바이러스 Y (등재번호: NC_001616), 또는 옥수수 모자이크 바이러스 (Zea mosaic virus, 등재번호: NC_018833), 또는 속명 트리티모바이러스 (Tritimovirus)의 Potyviridae, 예를 들어 브롬 스트리크 모자이크 바이러스 (Brome streak mosaic virus, 등재번호: NC_003501) 또는 밀 스트리크 모자이크 바이러스 (Wheat streak mosaic virus, 등재번호: NC_001886), Pseudoviridae 과의 단일 가닥 RNA 바이러스, 예를 들어, 속명 슈도바이러스 (Pseudovirus) 또는 시레바이러스 (Sirevirus), Reoviridae 과의 이중 가닥 RNA 바이러스, 예를 들어, 벼 위축 바이러스 (Rice dwarf virus) (등재번호: RNA1: NC_003773; RNA2: NC_003774; RNA3: NC_003772; RNA4: NC_003761; RNA5: NC_003762; RNA6: NC_003763; RNA7: NC_003760; RNA8: NC_003764; RNA9: NC_003765; RNA10: NC_003766; RNA11: NC_003767; RNA12: NC_003768), Tombusviridae 과의 (+) 가닥 RNA 바이러스, 예를 들어, 속명 알파네크로바이러스 (Alphanecrovirus), 아우레우스바이러스 (Aureusvirus), 베타네크로바이러스 (Betanecrovirus), 카르모바이러스 (Carmovirus), 다이안토바이러스 (Dianthovirus), 갈란티바이러스 (Gallantivirus), 마카나바이러스 (Macanavirus), 마클로모바이러스 (Machlomovirus), 파니코바이러스 (Panicovirus), 톰부스바이러스 (Tombusvirus), 움브라바이러스 (Umbravirus) 또는 지아바이러스 (Zeavirus), 예를 들어, 옥수수 괴사 스트리크 바이러스 (Maize necrotic streak virus) (등재번호: NC_007729), 또는 Virgaviridae 과의 (+) 가닥 RNA 바이러스, 예를 들어 속명 푸로바이러스 (Furovirus), 호르데이바이러스 (Hordeivirus), 예를 들어, 보리 스트립 모자이크 바이러스 (등재번호: RNA1: NC_003469; RNA2: NC_003481; RNA3: NC_003478), 또는 속명 페클루바이러스 (Pecluvirus), 포모바이러스 (Pomovirus), 토바모바이러스 (Tobamovirus) 또는 토브라마이러스 (Tobravirus), 예로 담배 얼룩 바이러스 (Tobacco rattle virus) (등재번호: RNA1: NC_003805; RNA2: NC_003811), 뿐만 아니라 목 Mononegavirales의 (-) 가닥 RNA 바이러스, 특히 과 Rhabdoviridae, 예를 들어, 보리 황색 스트리아테 모자이크 바이러스 (Barley yellow striate mosaic virus) (등재번호: KM213865) 또는 상추 괴사성 황색 바이러스 (Lettuce necrotic yellows virus) (등재번호/생검: NC_007642/ AJ867584), 목 Picornavirales의 (+) 가닥 RNA 바이러스, 특히 과 Secoviridae, 예를 들어, 속명 코모바이러스 (Comovirus), 파바바이러스 (Fabavirus), 네포바이러스 (Nepovirus), 케라바이러스 (Cheravirus), 사드와바이러스 (Sadwavirus), 세퀴바이러스 (Sequivirus), 토라도바이러스 (Torradovirus) 또는 와이카바이러스 (Waikavirus), 목 Tymovirales의 (+) 가닥 RNA 바이러스, 특히 과 Alphaflexiviridae, 예를 들어, 속명 알렉시바이러스 (Allexivirus), 롤라바이러스 (Lolavirus), 만드리바이러스 (Mandarivirus) 또는 포텍스바이러스 (Potexvirus), 목 Tymovirales, 특히 과 Betaflexiviridae, 예를 들어, 속명 카필로바이러스 (Capillovirus), 카를라바이러스 (Carlavirus), 시트리바이러스 (Citrivirus), 포베아바이러스 (Foveavirus), 테포바이러스 (Tepovirus) 또는 비티바이러스 (Vitivirus), 목 Tymovirales의 (+) 가닥 RNA 바이러스, 특히 과 Tymoviridae, 예를 들어, 속명 마쿨라바이러스 (Maculavirus), 마라피바이러스 (Marafivirus) 또는 티모바이러스 (Tymovirus) 및 박테리아 벡터, 예를 들어 아그로박테리움 spp. (Agrobacterium spp.), 예를 들어, 아그로박테리움 투메팍시엔스 (Agrobacterium tumefaciens). 마지막으로, 용어 벡터는 또한 폴리머성 또는 지질-기반의 전달 구조체 등의, 물리적인 도입 방법과 조합되는, 선형 핵산 서열 (단일 가닥 또는 이중 가닥)을 타겟 세포에 도입하기 적합한 화학적 전달 물질을 의미한다.
적합한 전달 구조체 또는 벡터는, 따라서, 타겟 세포에 뉴클레오티드 서열을 전달하기 위한 생물학적 수단, 예를 들어 바이러스 벡터, 아그고박테리움 spp. 또는 화학적 전달 구조체, 예를 들어, 나노입자, 예로, 메조포러스 실리카 나노입자 (MSNP), 나노결정, 양이온성 폴리머, 예로, PEI (폴리에틸렌이민) 폴리머를 이용한 방법 또는 폴리머, 예를 들어, DEAE-덱스트란, 또는 양이온성 표면을 구축하기 위한 PEI의 비-공유적 표면 결합, 지질 또는 폴리모성 소낭 또는 이들의 조합물을 포함한다. 지질 또는 폴리머성 소낭은, 예를 들어, 지질, 리포좀, 지질 캡슐화 시스템, 나노입자, 소형 핵산-지질 입자 포뮬레이션, 폴리머 및 폴리머좀으로부터 선택될 수 있다.
용어 "유전자 구조체" 또는 "재조합 구조체"는, 본 발명에 따른 식물, 식물 세포, 조직, 기관 또는 물질 등의 임의의 진핵생물 타겟 세포 또는 원핵생물에 도입, 형질전환, 형질감염 또는 형질전이하기 위한, 특히 DNA 서열, RNA 서열 또는 아미노산 서열을 포함하는, 플라스미드 또는 플라스미드 벡터, 코스미드, 인공 효모- 또는 박테리아 인공 염색체 (YAC 및 BAC), 파지미드, 박테리아 파지에 기반한 벡터, 발현 카세트, 단리된 단일 가닥 또는 이중 가닥 핵산 서열, 변형된 바이러스 등의 바이러스 벡터 및 이들의 조합 또는 혼합물을 포함하는 구조체를 지칭한다. 본 발명에 따른 재조합 구조체는 핵산 또는 아미노산 서열의 형태로서 작동자 도메인을 포함할 수 있으며, 여기서 작동자 도메인은 타겟 세포에서 작용을 발휘할 수 있는 분자를 의미하며, 이는 전이유전자, 단일 가닥 또는 이중 가닥 RNA 분자, 예를 들어 가이드 RNA ((s)gRNA), miRNA 또는 siRNA, 또는 아미노산 서열, 예를 들어, 특히 효소 또는 이의 촉매 활성 단편, 결합 단백질, 항체, 전사인자, 뉴클레아제, 바람직하게는 부위 특이적인 뉴클레아제 등을 포함한다. 아울러, 재조합 구조체는 조절 서열 및/또는 위치화 서열을 포함할 수 있다. 재조합 구조체는 플라스미드 벡터 등의 벡터에 통합될 수 있거나, 및/또는 벡터 구조로부터, 예를 들어 폴리펩타이드 서열 형태로 또는 벡터에 연결되지 않은 단일 가닥 또는 이중 가닥 핵산으로서 분리되어 존재할 수 있다. 이는, 예를 들어, 형질전환에 의해 도입된 후, 유전자 구조체는, 염색체 외부에, 즉 타겟 세포의 게놈에 통합되지 않고, 예를 들어 이중 가닥 또는 단일 가닥 DNA, 이중 가닥 또는 단일 가닥 RNA 또는 아미노산 서열로서 존재할 수 있다. 다른 구현예로, 본 발명에 따른 유전자 구조체 또는 이의 일부는, 타겟 세포의 핵 게놈 또는 다른 유전 요소, 예를 들어 미토콘드리아 또는 엽록체와 같은 플라스티드 (plastid) 게놈 등의, 타겟 세포의 게놈에 안정적으로 통합될 수 있다. 이와 관련하여 사용되는 용어 플라스미드 벡터는 본래 플라스미드로부터 수득되는 유전자 구조체를 의미한다. 플라스미드는 통상적으로 이중 가닥 핵산 서열의 형태로 자율적으로 복제하는 원형의 염색체외 인자를 지칭한다. 유전자 조작 분야에서, 이들 플라스미드는, 예를 들어 항생제 또는 제초제에 대한 저항성을 코딩하는 유전자, 타겟 핵산 서열을 코딩하는 유전자, 위치화 서열, 조절 서열, 테그 서열, 마커 유전자, 예를 들어 항생제 마커 또는 형광 마커 등을 삽입함으로써, 타겟화된 변형을 일반적으로 겪게 된다. 복제 오리진과 같은, 오리지날 플라스미드의 구조 성분들은 유지된다. 본 발명의 특정 구현예에서, 위치화 서열은 핵 위치화 서열, 플라스티드 위치화 서열, 바람직하게는 미토콘드리아 위치화 서열 또는 엽록체 위치화 서열을 포함할 수 있다. 이러한 위치화 서열은 식물 생명공학 분야에서 당업자가 입수가능하다. 여러가지 대상 타겟 서열에 사용하기 위한 다양한 플라스미드 벡터들이 상업적으로 이용가능하며, 이의 변형은 해당 분야의 당업자들에게 공지되어 있다.
용어 "유전자 변형된" 또는 "유전자 조작" 또는 "유전자(유전학적으로) 조작된"은 본원에서 광의적인 의미로 사용되며, 인간의 개입이 없는 경우에 확인되는 상태와 다르게 목적한 방식으로 변형시키도록 타겟 세포, 조직, 기관 또는 유기체의 내인성 유전 물질 또는 트랜스크립톰 또는 프로테옴에 영향을 미치기 위한, 인간의 개입에 의해 직접 또는 간접적으로 달성되는, 핵산 서열 또는 아미노산 서열, 타겟 세포, 조직, 기관 또는 유기체에 대한 모든 변형을 의미하며, 반면 용어 게놈 편집은 구체적으로 타겟 세포의 게놈에 대한 타겟화된 조작을 의미한다. 인간 개입은 시험관내, 생체내 또는 이 둘다에서 이루어질 수 있다. 추가적인 변형, 예를 들어, 하나 이상의 점 돌연변이(들), 예를 들어 타겟화된 단백질 조작 또는 코돈 최적화, 결손(들), 및 하나 이상의 핵산 또는 아미노산 분자의 하나 이상의 삽입(들) 또는 결손(들) (상동적인 재조합 포함), 핵산 또는 아미노산 서열의 변형, 또는 이들의 조합이 포함될 수 있다. 또한, 이들 용어는, 천연적으로 발생하는 비교 서열, 유기체 또는 물질과 유사하지만, 목적한 조작을 위한 하나 이상의 단계에 의해 구축된, 핵산 분자 또는 아미노산 분자 또는 식물 또는 이의 식물 물질 등의, 숙주 세포 또는 유기체를 포함할 것이다.
따라서, 본원에서, "타겟화된 유전자 조작" 또는 "타겟화된" 또는 "부위-특이적인" 유전자 편집 또는 게놈 편집은, 조작할 하나 이상의 세포, 바람직하게는 식물 세포에서 원하는 효과를 달성하기 위해, 타겟화된 방식, 즉 타겟 세포에서 하나 이상의 특정 위치에서, 적절한 특수 상황에서 이루어지는, "유전자 조작"의 결과이다.
본원에서, 용어 "전이유전자" 또는 "전이유전자성"은, 하나의 유기체의 게놈으로부터 취해지거나, 또는 합성에 의해 제조되고, 이후 대상 숙주 세포, 유기체 또는 조직 내에 도입된 후 "안정적인" 형질전환 또는 형질감염 방식에 의해 숙주의 게놈에 통합되는, 하나 이상의 핵산 서열을 지칭한다. 이와는 반대로, 용어 "일시적" 형질전환 또는 형질감염 또는 도입은, 세포의 하나 이상의 대상 구획, 비-제한적으로, 세포질, 핵, 미토콘드리아, 액포, 엽록체 등의 소기관 또는 막 내로의 전달을 달성하여, 안정적인 통합 또는 병합, 즉 세포의 게놈 내 도입된 하나 이상의 해당 분자를 유전시키지 않으면서, 도입된 하나 이상의 분자의 전사 및/또는 번역 및/또는 결합 및/또는 활성을 구현하기 위한, 선택적으로 적합한 화학 제제 또는 생물 제제를 포함하는, 하나 이상의 핵산 (DNA, RNA, 단일 가닥 또는 이중 가닥 또는 이의 혼합물) 및/또는 하나 이상의 아미노산 서열)을 비롯한 분자 툴을 도입하는 방식을 지칭한다.
본원에서, 용어 "식물" 또는 "식물 세포"는 식물 유기체, 식물 기관, 분화된 및 미-분화된 식물 조직, 식물 세포, 종자, 및 이의 파생물 및 후대를 지칭한다. 식물 세포는, 비-제한적인 예로, 종자 유래 세포, 성숙 및 미성숙 배 유래 세포, 분열 조직, 묘목, 여러가지 분화 상태의 캘러스 조직, 잎, 꽃, 뿌리, 줄기, 배우체, 포자체, 꽃가루, 꽃가루관 및 소포자, 프로토플라스트, 거대조류 (macroalgae) 및 미세조류 유래 세포를 포함한다. 여러가지 식물 세포는 반수체, 이배체, 사배체, 육배체 또는 배수체일 수 있다.
본원에서, "개체"는 인간 또는 인간을 제외한 동물을 의미할 수 있다. 이 용어는, 비-제한적으로, 포유류 (예, 인간, 그외 영장류, 돼지, 설치류 (예, 마우스, 랫 또는 햄스터), 토끼, 기니아피그, 소, 말, 고양이, 개, 양 및 염소)를 포함한다. 일 구현예에서, 개체는 인간이다.
본원에서, "치료한다", "치료하는" 및 "치료"는 일반적으로 바람직한 약리학적 및/또는 생리학적 효과를 수득하는 것을 의미한다. 이러한 효과는 질환 또는 그 증상을 완전히 또는 일부 예방한다는 측면에서 예방학적일 수 있거나, 및/또는 질환 또는 질환에 기인한 부작용을 일부 또는 완전히 치유한다는 측면에서 치료학적일 수 있다. 본원에서, "치료"는 포유류에서 질환 또는 증상에 대한 모든 치료를 포괄하며, (a) 질환 또는 증상이 발생할 성향을 가질 수 있지만 아직 발생한 것으로 진단되지 않은 개체에서 질환 또는 증상의 발병 예방; (b) 질환 또는 증상의 저해, 즉 이의 진행 중지; 또는 (c) 질환의 완화, 즉 질환의 퇴행 유발을 포함한다. 치료제는 질환 또는 상해의 발병 전, 발병 중 또는 발병 이후에 투여될 수 있다. 치료로 임상 환자의 부적절한 증상을 안정화 또는 감소시키는, 진행 중인 질환에 대한 치료가 특히 중요하다. 이러한 치료는 바람직하게는 병든 조직에서 기능이 완전히 소실되기 전에 수행된다. 개체 테라피 (subject therapy)는 바람작하게는 질환의 증상 단계 동안에 투여될 것이며, 일부 경우에는 질환의 증상 단계 이후에 투여될 것이다.
본원에서, "식물 물질"은 식물의 모든 발생 단계 (developmental stage)에서 수득할 수 있는 모든 물질을 지칭한다. 식물 물질은 식물 자체 (in planta)에서 또는 식물 또는 식물 조직 또는 이의 기관의 시험관내 배양으로부터 수득할 수 있다. 즉, 이 용어는 식물 세포, 조직 및 기관 뿐만 아니라 발생된 식물 구조와, 식물 세포 또는 구획내에서 발견할 수 있거나 및/또는 식물에 의해 생산될 수 있거나, 또는 모든 발생 단계에서 임의의 식물 세포, 조직 또는 식물의 추출물로부터 수득될 수 있는 핵산, 폴리펩타이드 및 모든 화학적 식물 물질 또는 대사산물과 같은 세포내 성분 (sub-cellular component)을 포함한다. 이 용어는, 또한, 식물 물질을 포함하는 하나 이상의 식물 세포로부터 유래되는, 식물 물질의 파생물, 예를 들어 프로토플라스트를 포함한다. 또한, 이 용어는 식물의 분열 조직 세포 또는 분열 조직을 포함한다.
본원에서, 용어 "돌연변이" 및 "변형"은 상호 호환적으로 사용되며, 생체내 또는 시험관내 핵산 조작 측면에서 부가물 (adduct)의 도입, 및/또는 결손, 삽입, 부가, 치환, 편집, 가닥 절단을 지칭한다. 결손은 핵산 서열에서 하나 이상의 뉴클레오티드가 생략되는 변화로서 정의된다. 삽입 또는 부가는 핵산 서열에서 하나 이상의 뉴클레오티드가 첨가되는 변화이다. "치환" 또는 편집은 치환 대상인 하나 이상의 뉴클레오티드와 다른 분자에 의해 하나 이상의 뉴클레오티드가 대체되는 것이다. 예를 들어, 티민이 시토신, 아데신, 구아닌 또는 우리딘으로 대체되는 것으로 예시되는 바와 같이, 핵산이 다른 핵산으로 대체될 수 있다. 피리미딘 -> 피리미딘 (예, C -> T 또는 T -> C 뉴클레오티드 치환) 또는 퓨린 -> 퓨린 (예, G -> A 또는 A -> G 뉴클레오티드 치환)은 염기 전이로 지칭하며, 반면 피리미딘 -> 퓨린 또는 퓨린 -> 피리미딘 (예, G -> T 또는 G -> C 또는 A -> T 또는 A -> C)은 염기 전환으로 지칭한다. 다른 구현예에서, 핵산은, 티민이 티민 글리콜로 치환되는 예와 같이, 변형된 핵산으로 대체될 수 있다. 돌연변이는 미스매치를 유발할 수 있다. 용어 미스매치는 2개의 핵산 간의 비-공유적인 상호작용을 지칭하는데, 이때 각 핵산은 서로 다른 뉴클레오티드 서열 또는 핵산 분자에 존재하는 것이며, 염기-쌍 형성 규칙을 따르지 않는다. 예를 들어, 부분적으로 상보적인 서열 5'-AGT-3' 및 5'-AAT-3'의 경우, G-A 미스매치 (염기 전이)가 존재한다.
이중 가닥 핵산 서열, 예를 들어 DNA 타겟 서열로서 게놈 서열과 관련하여, 용어 "가닥 절단"은 단일 가닥 절단 및/또는 이중 가닥 절단을 포함한다. 단일 가닥 절단 (닉)은 이중 가닥의 핵산 서열의 2개의 가닥 중 하나에서 끊어짐 (interruption)을 의미한다. 이는, 이중 가닥 핵산 서열의 양쪽 가닥에서의 끊어짐을 의미하는 이중 가닥 절단과 대비된다. 본 발명에 따른 가닥 절단은 대상 핵산 염기 위치에서, CRISPR 엔도뉴클레아제 또는 야생형 단백질 또는 엔도뉴클레아제의 돌연변이되거나 절단된 버전일 수 있지만 여전히 야생형 단백질의 효소적 기능을 발휘할 수 있는 이의 변이체 등의 적절한 엔도뉴클레아제를 사용한 효소적 절단에 의해, 이중 가닥 핵산 서열에 도입될 수 있다.
본원에서, "상보적인" 또는 "상보성"은 2개의 DNA, 2개의 RNA 또는 본 발명에 따른 하이브리드 서열, RNA 및 DNA 핵산 영역들 간의 상관성을 나타내는 것이다. DNA 또는 RNA의 뉴클레오베이스에 의해 정의된 바에 따라, 2개의 핵산 영역은 자물쇠-열쇠 모형에 따라 서로 혼성할 수 있다. 이를 위해, 왓슨-크릭 염기 쌍 형성 원리는 상보적인 염기로서 아데닌과 티민/우라실 뿐만 아니라 구아닌과 시토신을 각각 기본으로 한다. 또한, 리버스-왓슨-크릭, 후그스틴 (Hoogsteen), 리버스-후그스틴 및 워블 쌍 형성 (Wobble pairing)과 같은 비-왓슨-크릭 쌍 형성도, 각각의 염기 쌍들이 서로 수소 결합을 형성할 수 있는 한, 즉 2개의 서로 다른 핵산 가닥이 상호성에 기초하여 서로 혼성할 수 있는 한, 본원에서는 용어 "상보성"에 포함된다.
본원에서, 용어 "일시적인 도입"은, 바람직하게는 전달 벡터 또는 재조합 구조체에 삽입된, 본 발명에 따른 하나 이상의 핵산 서열이, 전달 벡터의 도움을 받거나 또는 도움없이, 타겟 구조, 예를 들어, 식물 세포에 일시적으로 도입되는 것을 의미하며, 이때 하나 이상의 핵산 서열이 타겟 구조의 내인성 핵산 물질, 즉 게놈에 전체로서 삽입되지 않는, 즉 하나 이상의 핵산 서열이 타겟 세포의 내인성 DNA에 삽입되지 않는, 적절한 반응 조건 하에 하나 이상의 핵산 서열이 도입된다. 결론적으로, 일시적인 도입의 경우, 도입된 유전자 구조체는 타겟 구조의 후대, 예를 들어, 원핵생물, 동물 또는 식물 세포에서 유전되지 않을 것이다. 하나 이상의 핵산 서열 또는 이의 전사 또는 번역으로부터 생기는 생성물만 일시적으로 존재하며, 즉, 일시적인 방식으로, 구성적이거나 또는 유도성 형태로 존재하므로, 따라서 타겟 세포 내에서 제한된 시간 동안 효과를 발휘하도록 작용할 수 있을 뿐이다. 따라서, 일시적인 도입에 의해 도입된 하나 이상의 핵산 서열은 세포의 후대로 유전되지 않을 것이다. 그러나, 일시적인 방식으로 도입된 핵산 서열의 효과는 타겟 세포의 후대에 이어질 가능성도 있다.
본원에서, 용어 "안정적인 통합" 또는 "안정적으로 통합된"은, 본 발명에 따른, 바람직하게는 전달 벡터 또는 재조합 구조체에 병합된 하나 이상의 핵산 서열이 안정적으로 통합되는 것을 의미한다. 통합은 타겟 세포의 핵 게놈 또는 대상 진핵생물 세포 구획 내 게놈이 아닌 임의의 핵 물질, 예를 들어, 미토콘드리아 또는 식물 세포 플라스티드에서 이루어질 수 있다. 안정적으로 통합된 하나 이상의 재조합 구조체는 따라서 변형된 타겟 세포의 후대로 유전될 것이다. 유전자 구조체는 안정적으로 통합될 타겟 영역과, 수송, 전달, 유지 및 식물 세포 내 유전자 구조체의 올바른 위치화를 위해 필요한 추가적인 영역을 포함하는 수개의 대상 영역을 포함할 수 있지만, 당해 기술 분야의 당업자에게 공지된 바와 같이 이들 영역들이 전부 통합되는 것은 아니며, 안정적으로 통합시킬 대상 영역에 대한 카고로서 제공하므로, 유전자 구조체의 특성에 따라, 유전자 구조체의 전체 또는 일부가 안정적으로 통합될 것이다. 본 발명에 따른 하나 이상의 유전자 구조체가 하나 이상의 조혈 또는 분열 세포 또는 조직에 안정적인 통합되면, 타겟 구조, 즉 DNA 타겟 영역의 변형된 게놈 영역은, 하나 이상의 조혈 또는 분열 세포의 전체 발생 단계를 통해 변형된 세포의 후대로 유전될 것이며, 이는, 하나 이상의 조혈 분열 세포의 분화 및 발생에서 기원한 최종 세포 타입에서의 타겟화된 변형 및 수율 (yield)을 원하는 방식에 긍정적일 수 있다. 예를 들어, 식물의 미성숙 꽃의 하나 이상의 분열 세포 내의 안정적인 통합이 달성되면, 미성숙 꽃의 하나 이상의 분열 세포로부터 발생학적으로 발생되는 화분 또는 밑씨의 생식 세포에 도입된 유전자 특징이 안정적으로 유전될 수 있다. 하나 이상의 만능성 조혈 세포 또는 임의의 만능성 또는 다능성 세포 내 안정적인 통합 역시 도입된 유전자 특징의 안정적인 유전으로 이어질 것이다.
본원에서, 용어 "입자 총격"은 바이올리스틱 형질감염 또는 미세입자-매개 유전자 전달이라고도 하며, 대상 핵산 또는 유전자 구조체를 포함하는 코팅된 미세입자 또는 나노입자를 타겟 세포나 조직으로 이동시키기 위한 물리적인 전달 방법을 의미한다. 미세입자 또는 나노입자는 발사체로서 기능하며, 종종 "유전자 총"으로 지칭되는 적절한 장치를 사용해 고압 하에 대상 타겟 구조로 발포된다. 입자 총격을 통한 형질전환은 대상 유전자로 덮힌 금속 미세발사체를 사용하는데, 이는 "유전자 총"으로 알려진 장치를 사용해 타겟 조직의 세포 벽을 뚫기에 충분하지만 세포 사멸을 유발할 만큼 해롭지 않은 높은 속도로 타겟 세포에 대해 발사된다 (Sandford et al. 1987). 세포 벽이 완전히 제거된 프로토플라스트의 경우, 논리적으로 조건이 다르다. 하나 이상의 미세발사체 상에 침전된 핵산 또는 유전자 구조체는 발사 후 세포 내로 방출되고, 전술한 정의에 따라 일시적으로 발현되거나 또는 게놈에 통합된다. 미세발사체의 가속은 고 전압 전기 방전 또는 압축 가스 (헬륨)에 의해 달성된다. 사용되는 금속 입자는, 무독성, 무-반응성이며, 타겟 세포 보다 직경이 더 작아야하는 것이 필수 조건이다. 가장 흔히 사용되는 것이 금 또는 텅스텐이다. 유전자 총 및 이의 일반적인 사용과 관련한 관련 시스템의 제조사 및 판매사로부터 공개된 많은 정보들을 입수할 수 있다.
본원에서, 원핵생물 또는 진핵생물 세포, 바람직하게는 동물 세포, 더 바람직하게는 본 발명에 따른 식물 또는 식물 세포 또는 식물 물질과 관련하여, 용어 "파생물" 또는 "후손" 또는 "후대"는 유성 및 무성 증식을 비롯한 자연적인 번식 (reproductive propagation)으로부터 생기는 상기한 세포 또는 물질의 후손을 지칭한다. 이러한 번식이 자연 현상으로부터 생긴 유기체의 게놈에 돌연변이 도입을 유도하여, 부모 유기체 또는 세포와 게놈 측면에서는 다르지만 여전히 동일한 속/종에 속하며; 부모 재조합 숙주 세포와 동일한 특징들을 대부분 가진, 후손 또는 후대를 만들 수 있음은, 당해 기술 분야의 당업자에게 널리 공지되어 있다. 생식 또는 재생 중에 자연 현상으로부터 생기는 상기한 파생물, 후손 또는 후대도, 따라서, 본 발명의 상기한 용어에 포함된다. 또한, 용어 "파생물"은, 직접적으로 세포 또는 유기체를 지칭한다기 보다는, 다른 것으로부터 간접적으로 수득되는 변형에 의한, 물질 또는 분자를 의미할 수 있다. 이는 세포 또는 물질로부터 수득되는 식물 대사산물 또는 세포로부터 유래되는 핵산 서열을 의미할 수 있다.
본원에서, 용어 "타겟 영역", "타겟 부위", "타겟 구조", "타겟 구조체", "타겟 핵산" 또는 "타겟 세포/조직/유기체", 또는 "DNA 타겟 영역"은 타겟 세포의 임의 구획내 임의의 게놈 영역일 수 있는 타겟을 의미한다.
본원에서, 용어 "조절 서열"은, 대상 핵산 서열의 전사 및/또는 번역 및/또는 변형을 지시할 수 있는, 핵산 또는 아미노산 서열을 지칭한다.
본원에서, 용어 "단백질", "아미노산" 또는 "폴리펩타이드"는 상호 호환적으로 사용되며, 촉매적 효소 기능 또는 구조적 또는 기능적 작용을 가진 아미노산 서열을 지칭한다. 용어 "아미노산" 또는 "아미노산 서열" 또는 "아미노산 분자"는 천연 및 화학 합성된 단백질, 펩타이드, 폴리펩타이드 및 효소 또는 변형된 단백질, 펩타이드, 폴리펩타이드 및 효소를 포함하며, 여기서 용어 "변형된"은, 야생형 서열의 절단형 (truncation)에서부터 짧지만 여전히 활성인 영역을 비롯하여, 단백질, 펩타이드, 폴리펩타이드 및 효소의 모든 화학적 또는 효소적 변형을 포함한다.
상세한 설명
본 발명은, 제1 측면에서, (a) 하나 이상의 RNA 핵산 서열을 포함하는, CRISPR 핵산 서열 또는 가이드 핵산 서열을 포함하며, CRISPR 핵산 서열 또는 가이드 핵산 서열과 결합된, (b) DNA 핵산 서열을 포함하는 복구 주형 핵산 서열, 및 (c) 선택적으로, 상기 CRISPR 핵산 서열 또는 가이드 핵산 서열과 상기 복구 주형 핵산 서열 사이에 링커를 포함하며; 상기 CRISPR 핵산 서열 또는 가이드 핵산 서열이 (i) 제1 DNA 타겟 서열에 상보적인 제1 서열 영역, 및 (ii) CRISPR 폴리펩타이드와 상호작용하도록 되어 있는 제2 서열 영역을 포함하고; 상기 복구 주형 핵산 서열이 제2 DNA 타겟 서열과 상보적인 하나 이상의 영역을 포함하고, 상기 복구 주형 핵산 서열이 타겟화된 상동성 특이적인 복구를 매개하도록 구성되며; 상기 하이브리드 핵산 서열이, CRISPR 폴리펩타이드가 상기 제1 타겟 서열을 인지하여 선택적으로 DNA 절단을 유도할 수 있도록, CRISPR 폴리펩타이드와 상호작용할 수 있으며, 상기 하이브리드 핵산 서열이, 제2 DNA 타겟 서열의 부위에서 상기 복구 주형 핵산 서열에 의해 매개되는 상동성 특이적인 복구를 통해, 게놈 조작을 지시하는, 하나 이상의 RNA 및 하나 이상의 DNA 핵산 서열을 포함하거나 또는 이들로 구성되는 하이브리드 핵산 서열을 제공한다.
본 발명에 따른 하이브리드 핵산 서열에 대한 적절한 배열은 도 1a A - D, 도 1b A - D 도 2 A - C에 도시되지만, 이들로 한정되는 것은 아니다. CRISPR 뉴클레아제에 따라, 복구 주형 (RT)은 ssDNA 또는 dsDNA 형태일 수 있으며, 공유 또는 비-공유적인 방식으로 3' 말단, 5' 말단에서 하나 이상의 CRISPR 핵산 또는 가이드 핵산 (sgRNA 또는 gRNA 또는 crRNA 또는 tracrRNA) 서열에 부착될 수 있거나, 또는 RT는 gRNA 내부에 위치될 수 있으며, 예를 들어 지정된 크기 및 형태를 가진 헤어핀 이차 구조를 형성할 수 있다. 이러한 설계는, 하나 이상의 대상 RNA가 대상 CRISPR 뉴클레아제와 상호작용하는 것을 방해하지 않으면서 동시에 하나 이상의 CRISPR 뉴클레아제/크리스퍼 RNA 쌍에 의해 유도된 DNA 절단 부위에 RT를 인접하게 위치시킴으로써, RNA와 RT 영역 모두 자체 기능들을 모두 충족시킬 수 있게 한다. 통상적으로, 게놈 조작에 적합한 서로 다른 CRISPR 뉴클레아제들은 본 발명에 따른 RT를 포함하는 CRISPR 핵산과의 상호작용시 서로 다른 입체적인 요건 (sterical requirement)을 가질 것이며, 그래서 CRISPR 뉴클레아제의 고유한 기능, 즉 CRISPR 핵산에 의해 안내된 DNA 타겟팅 및 DNA 절단은 CRISPR 핵산 서열에 부착된 RT를 포함하는 하이브리드 핵산 서열의 존재시 또한 매개될 수 있다.
하나 이상의 RNA 및 하나 이상의 DNA 핵산 서열을 포함하거나 또는 이들로 구성된 하이브리드 핵산 서열 또는 간략하게는 본 발명에 따른 하이브리드 RNA/DNA 핵산 서열은, 따라서, 2가지 기능을 포함하는, RNA 및 DNA 키메라이다. 첫째, 이것은, 리보핵산을 포함하는, CRISPR 핵산 서열 (gRNA 또는 crRNA 또는 tracrRNA) 모이어티를 포함한다. gRNA는 통상적으로 2개의 뉴클레오티드 서열 영역을 포함하는데, 하나의 뉴클레오티드 서열은 대상 CRISPR 폴리펩타이드와 상호작용하는데 필요한 것이고, 다른 뉴클레오티드 서열은 타겟팅 도메인을 포함하며, 타겟팅 도메인은 반대 가닥의 PAM 서열에 인접한 상보적인 대상 DNA 타겟 서열과의 염기-쌍 형성을 통해 혼성할 수 있으며, 따라서 이러한 상보적인 DNA 타겟 서열이 본 발명에 따른 제1 DNA 타겟 서열이 된다. 두번째로, 하이브리드 RNA/DNA 핵산 서열은 대상 DNA 타겟 서열에 도입시킬 원하는 편집을 포함할 수 있는 복구 주형 핵산 서열 모이어티를 포함한다. 또한, 복구 주형 핵산 서열은 DNA 타겟 서열의 바로 상류 및 하류, 즉 좌측 및 우측 상동성 암에 추가적인 상동성 서열을 포함할 수 있다. 각 상동성 암의 길이 및 결합 위치는 도입되는 변화의 크기에 따라 결정되며, 최적의 효율을 달성하도록 조정될 수 있다. 예를 들어, Cas9에 의해 먼저 분리된 절단된 DNA 가닥에 특이적인 상보성을 가진 복구 주형 (Richardson, et al., Nature Biotechnology. 2016, doi: 10.1038/nbt.3481)이 가장 효율적인 복구를 수행할 수 있을 가능성이 있다. 복구 주형은 구체적인 용도에 따라 단일 가닥 또는 이중 가닥 DNA 뉴클레오티드 서열일 수 있다. 복구 주형은 뉴클레아제에 의한 결합을 파괴하기 위해 게놈 DNA에 대비 다형성을 포함할 수 있으며, 또는 복구 주형은 CRISPR 폴리펩타이드 절단에 적합한 타겟이 될 수 있다. 예를 들어, PAM이, 더 이상 존재하지 않지만 유전자의 코딩 영역에는 영향이 없도록, 즉 코딩된 아미노산 서열을 변화시키지 않는 침묵 돌연변이로, 돌연변이될 수 있다. 다른 구현예에서, 뉴클레아제 결핍된 CRISPR 폴리펩타이드를 사용할 경우, 복구 주형 서열 내에 PAM 서열이 존재할 수 있다. 일 구현예에서, 하이브리드 RNA/DNA 핵산 서열은 하나 이상의 CRISPR 핵산 서열 및 하나 이상의 복구 주형 핵산 서열을 포함하지만, 이 하이브리드는 후술한 바와 같이 게놈 편집에 적합한 이에 부착된 추가의 모이어티를 포함할 수 있다. 다른 구현예에서, 하이브리드 RNA/DNA 핵산 서열은 하나 이상의 CRISPR 핵산 서열 및 하나 이상의 복구 주형 핵산 서열로 구성된다.
최적의 RT 크기는, 뉴클레아제 효율과 HR-매개 DSB 복구 효율을 위한 상동성 암 크기 간의 균형을 제공하는, 사용되는 CRISPR 시스템에 따라 결정될 수 있는 것으로 알려져 있다.
일 구현예에서, CRISPR 핵산 서열은 tracrRNA와 crRNA 요소를 통합한 하나의 RNA 핵산 서열로서 제공될 수 있다. 다른 구현예에서, 예를 들어 Cpf1 폴리펩타이드 또는 이의 변이체 또는 촉매 활성 단편을 이용해 Type V CRISPR 시스템으로 구동할 경우, gRNA는 crRNA 요소를 포함한다. 또 다른 구현예에서, gRNA는, crRNA 및 tracrRNA가 둘다 필요할 경우, 2개의 별개의 RNA 분자로서 제공되는, 다수의 CRISPR 시스템에서 천연 상황을 모방하는 2 이상의 RNA 핵산 서열로서 제공될 수 있다. 특정 구현예들에서, 이러한 배열 (arrangement)은 자연에서와 같이 2가지 요소 (tracrRNA 및 crRNA)를 개별 RNA 가닥에 존재시킬 수 있다. 일 구현예에서, crRNA를 제공하는 개별 RNA 핵산 분자가 제공되며, 개별 RNA 핵산 분자가 제공된다. crRNA 모이어티 또는 tracrRNA 모이어티는 복구 주형 (RT) 핵산 서열과 결합될 수 있다. 예를 들어, gRNA가 crRNA와 tracrRNA 기능을 통합한 하나의 싱글 RNA 분자로 구성된 gRNA:RT 하이브리드와 비교해, 해당 분자의 길이가 더 짧다는 이유로 tracrRNA:RT 또는 crRNA:RT의 생체외 화학적 합성을 선택할 경우, tracrRNA:RT 하이브리드 또는 crRNA:RT를 제공하는 것이 바람직할 수 있다.
특정 구현예들에서, 하나 이상의 CRISPR RNA 영역을 포함하는 CRISPR 핵산 서열이 하이브리드 핵산 서열의 5' 영역을 형성하는 것을 생각해 볼 수 있다. 이러한 토폴로지 (topology) 또는 입체 구조를 도 1a에 예시한다.
다른 구현예에서, 하나 이상의 단일 가닥 또는 이중 가닥 DNA 영역을 포함하는 RT가 하이브리드 핵산 서열의 5' 영역을 형성하는 것을 생각해 볼 수 있다. 이러한 토폴로지는 도 1b에서 예시된다.
또 다른 구현예에서, RT 영역이 도 2에 예시된 바와 같이 CRISPR 핵산 내부에 위치되는 것을 생각해 볼 수 있다. 도 2C에 도시된 바와 같이, RT는 CRISPR 핵산 서열 내 개별 영역으로서 특정 루프 영역에 위치될 수 있다. 도 2에 도시된 CRISPR 핵산-RT 토폴로지를 제공하기 위해, CRISPR 핵산 영역들을 RT와 결합시키는 2 단계가 CRISPR 핵산 영역 내에 DNA를 포함하는 RT 영역을 배치하기 위해 필요할 수 있으며, 이때 CRISPR 핵산은 하나 이상의 RNA 영역을 포함한다.
천연적인 염기 쌍 형성력을 이용하는 방법 외에도 핵산들을 서로 연결시키는데 충분한 화학적 방법 및 효소적 방법들이 당해 기술 분야의 당업자라면 이용가능하므로, 현재 이용가능한 기술을 이용해 하이브리드 핵산 서열의 임의의 토폴로지를 제공할 수 있다. 또한, CRISPR 핵산의 임의 구성 성분, 즉 하나 이상의 CRISPR 핵산 및/또는 하나 이상의 RT는, 자신의 자유로운 5' 또는 3' 말단에 추가적인 변형 또는 표지 물질을 포함할 수 있거나, 또는 하나 이상의 CRISPR 핵산 및/또는 하나 이상의 RT 내부의 임의 뉴클레오티드에 부착될 수 있다. 상기한 변형 또는 표지물질은 CRISPR 핵산 및/또는 RT를 서로 연결하기 위한 관능기를 제공하기 위한 목적으로 사용할 수 있다. 다른 구현예에서, 변형 또는 표지물질은 RT 및/또는 CRISPR 핵산, 즉 본 발명에 따라 결합된 하이브리드 핵산에 추가적인 기능성, 예를 들어 형광 기능성을 제공하기 위한 목적으로 사용될 수 있으며, 형광 기능성은 대상 타겟 세포 내에서 하이브리드 핵산 서열 또는 개개 구성 성분, 또는 심지어 하이브리드 핵산 서열과 대상 CRISPR 폴리펩타이드 간의 분자 복합체의 가시화 및/또는 추적을 가능하게 해준다. 이는, 특정 구획의 가시화, 또는 생체내 복합체 이용가능성에 대한 테스트 등을 가능하게 해준다.
본 발명에 따른 하이브리드 핵산 서열에서 CRISPR 핵산과 RT의 최상의 토폴로지는 CRISPR 폴리펩타이드와 대응되는 대상 CRISPR 핵산 서열 및 변형시킬 대상 타겟 세포에 따라 결정될 것이다. 일 구현예에서, 예를 들어, sgRNA를 사용할 경우, 5' CRISPR 핵산 서열-3' RT 토폴로지가 바람직할 수 있는데, 이러한 토폴로지는 3'-RT 말단이 비-결합된 상태이고 플렉시블하므로, RT 영역이 타겟화된 HDR 이벤트에서 최상의 결과를 보장하기 위한 상동성 검색을 도울 수 있기 때문이다. 이러한 토폴로지는 또한, tracrRNA 없이 기능할 수 있는, CRISPR 폴리펩타이드, 예를 들어 Cpf1을 사용할 경우, 적합할 것으로 보인다.
하이브리드 핵산 서열의 유리형 5' 말단 및 3' 말단에 일부 벌키하고 입체적으로 필요한 변형 또는 표지 물질을 도입시킬 경우, 대상 하이브리드 핵산 서열과 복합체 형태에서 CRISPR 폴리펩타이드의 최적의 성능을 허용하기 위해서는 5' RT-3' CRISPR 핵산 서열 토폴로지가 바람직할 수 있다. 또한, 임의의 추가적인 5' 또는 3' 변형 또는 표지 물질과는 무관하게, 동족 CRISPR 핵산과의 고유한 상호작용 특성으로 인해 특정 CRISPR 폴리펩타이드의 경우에는 5' RT-3' CRISPR 핵산 서열 토폴로지가 바람직할 수 있다.
또한, 하이브리드 핵산 서열의 토폴로지는 사용되는 CRISPR 핵산 서열에 따라 결정될 수 있다. crRNA/tracrRNA 조합은 crRNA만 사용하는 경우와는 다른 조건을 가질 수 있다. 마찬가지로, crRNA와 tracrRNA의 sgRNA 융합은 CRISPR 핵산의 경우에서와 같이 본 발명에 따른 하이브리드 핵산 서열에서 다른 구조를 허용할 수 있으며, crRNA 및 tracrRNA 영역은 혼성화되지만 서로 공유적으로 결합하진 않는다. 본원에 기술된 여러가지 하이브리드 핵산 서열과 CRISPR 핵산 영역과 RT 영역의 배치와 관련한 여러가지 토폴로지를 가진 구조체들에 대한 테스트 결과에 기초하여, 당해 기술 분야의 당업자라면 CRISPR 폴리펩타이드, CRISPR 핵산 서열, RT, 및 변형시킬 대상 타겟 유전자 좌에 대한 본 발명에 따른 하이브리드 핵산 구조체의 최상의 토폴로지를 결정할 수 있다.
본 발명에 따른 하이브리드 핵산 서열은, 원핵생물 세포 및 진핵생물 세포, 예를 들어, 진균, 동물 및 식물 세포 등의 모든 대상 세포 타입들에서 정확한 게놈 편집을 수행하기에 적합하며, 게놈 편집시 복구 주형 및 CRISPR RNA의 동시적인 시공적인 이용가능성을 허용하기에 적합한 물리적으로 연결된 툴이다.
본 발명의 모든 측면 및 구현예들에서, CRISPR 핵산 서열과 복구 주형 핵산 서열은 서로 결합되어 있다. 본 발명에서 용어 "와 결합된" 또는 "결합하여"는 광의적으로 해석되어야 하며, 즉 본 발명에 따라, CRISPR 호환성 (CRISPR compatible) RNA는, 본질적으로 상동성 재조합에서 복구 주형의 이용가능성을 증가시키는, DNA 복구 주형과 물리적으로 결합된 형태로 제공되는 것을 의미하며, 결합은 공유 또는 비-공유적인 특성을 가진다. RNA와 물리적으로 연결되지 않은, 복구 주형의 무차별적인 증폭 또는 과량의 복구 주형을 제공이기 보다는, 복구 주형 뉴클레오티드 서열은 RNA에 의해 대상 타겟 DNA 서열로 안내된 CRISPR 뉴클레아제 복합체와 함께 DSB에 제시되므로, 게놈 편집 방법의 예측가능성 및 특이성을 현저하게 향상시킨다.
본 발명의 또 다른 구현예에서, 하나 이상의 복구 주형 핵산 서열은 공유 및/또는 비-공유 결합 또는 부착에 의해 하나 이상의 CRISPR 핵산 서열에 부착된다. 이러한 구현예에서, 하이브리드 RNA/DNA 복합체는 시험관내 합성된 뉴클레오티드 분자로서 제공될 수 있으며, 이는 제1 및 제2 DNA 타겟 서열을 게놈에 포함하는 대상 타겟 세포 내에서 시험관내 또는 생체내에서 대상 CRISPR 폴리펩타이드와 결합할 수 있다. 바람직하게는, 세포는 진균, 동물 또는 식물 세포 등의 진핵생물 세포이다.
본 발명의 다양한 측면에 대한 일 구현예에서, 하나 이상의 복구 주형 핵산 서열 (RT)은 하나 이상의 CRISPR 핵산 서열에 공유적으로 부착된다. 공유 부착 또는 공유 결합은 분자의 원자들 간의 전기 쌍 공유 또는 서로 공유 부착된 서열을 수반하는 화학적 결합이다.
본 발명의 다양한 측면들에 대한 다른 구현예에서, 하나 이상의 복구 주형 핵산 서열은 하나 이상의 CRISPR 핵산 서열에 비-공유적으로 부착된다. 비-공유적인 상호작용은, 전자를 공유하지 않고, 분자/서열들 간에 또는 분자/서열 내에서 보다 분산된 다양한 전자기적 상호작용을 수반한다는 점에서, 공유 결합과 상이하다. 비-공유적 상호작용 또는 부착은 따라서 정전기적 상호작용, 반 데르 발스 힘, π-이펙트 (π-effect) 및 소수성 효과를 포함한다. 특히, 핵산의 경우에는 정전기적 상호작용은 수소 결합이다. 수소 결합 (H-결합)은 부분적으로 양을 띄는 수소 원자와 음전도가 높은 부분적으로 음을 띄는 산소, 질소, 황 또는 불소 원자 간에, 수소 원자에 공유 결합되지 않은, 상호작용을 수반하는, 특정한 쌍극자-쌍극자 상호작용 타입이다. 본원에서, 용어 "혼성화"는 핵산 가닥이 염기 쌍 형성을 통해 상호적인 가닥과 합쳐져 혼성화된 복합체를 형성하는 임의의 프로세스에 의한 상보적인 핵산, 즉 DNA 및/또는 RNA의 쌍 형성을 의미한다. 혼성화 및 혼성화 세기 (즉 핵산 들 간의 결합 세기)는 핵산들 간의 상보성 정도 및 길이, 사용되는 조건의 엄격성, 형성된 하이브리드의 Tm 및 핵산의 G:C 비율 등의 인자들에 의해 영향을 받는다. 용어 혼성화된 복합체는 상보적인 G와 C 염기, 상보적인 A와 T/U 염기 간의 수소 결합을 형성함으로써 2개의 핵산 서열 간에 형성된 복합체를 지칭한다. 혼성화된 복합체 또는 대응되는 하이브리드 구조체는 2개의 DNA 핵산 분자들 간에, 2개의 RNA 핵산 분자들 간에, 또는 DNA와 RNA 핵산 분자 간에 형성될 수 있다. 모든 경우에, 핵산 분자는 시험관내 또는 생체내에서 제조된 천연 핵산 분자 및/또는 인공 또는 합성 핵산 분자일 수 있다. DNA, RNA 및 DNA/RNA 서열들 간에 형성될 수 있는, 전술한 바와 같은 혼성화, 예를 들어, 왓슨-크릭 염기 쌍은, 특정한 수소 결합 패턴에 의해 구축되므로, 따라서 본 발명에 따른 비-공유적 부착이다.
본 발명에 따른 비-공유적 결합과 관련하여, 하나 이상의 CRISPR 핵산 서열과 하나 이상의 복구 주형 서열은 DNA-RNA 염기 쌍 형성을 통해 서로 결합될 수 있다.
또 다른 비-공유적인 상호작용의 형태는 하나 이상의 복구 주형 서열이 전하 (electrical charge)에 의해 하나 이상의 구성 성분, CRISPR 핵산 서열 또는 CRISPR 폴리펩타이드와 결합되는 형태이다.
공유 결합 또는 부착과 관련하여, 하나 이상의 CRISPR 핵산 서열과 하나 이상의 복구 주형 서열은 생체내 또는 시험관내에서 제조된, 연속적인 분자로서 연결되어 있다. 공유 및 비-공유적 부착은 또한, 예를 들어, 공유 부착된 CRISPR 핵산 서열/복구 주형 서열에 비-공유적으로 부착되는 추가적인 복구 주형 핵산 서열을 더 포함할 수 있는, 공유 부착된 CRISPR 핵산 서열/복구 주형 서열을 제공함으로써, 조합될 수 있다. 이러한 방식은, 공유 부착된 CRISPR 핵산 서열/복구 주형 서열이 적어도 부분적으로 생체내에서 제조되고, 생체내 또는 시험관내에서 제조된 추가의 복구 주형이 기-존재하는 CRISPR 핵산 서열/복구 주형 복합체에 첨가되는 경우에, 특히 적합하다.
본 발명의 다양한 구현예에서, 공유 및 비-공유 결합 또는 부착에 대한 전술한 내용은 또한 2가지 이상의 영역, 예를 들어, 전술한 바와 같이 서로 결합될 수 있는 crRNA 및 tracrRNA 영역을 포함할 수 있는, CRISPR 핵산 서열에 적용된다. 다른 구현예에서, RT는 대상 CRISPR 핵산 서열에 위치하여 본 발명에 따른 하이브리드 핵산 서열을 형성할 수 있으며, 이 하이브리드는 전술한 바와 같이 공유 및 비-공유 결합에 의해 형성될 수 있다.
Nishimasu et al.에서 입증된 바와 같이, 만일 gRNA가, 서열 의존적인 방식으로, 즉 A, U, G 및 C를 포함하는 RNA 염기와의 상호작용을 통해 또는 서열 비-의존적인 방식으로, 즉 gRNA 뉴클레오티드 서열의 백본 포스페이트와 CRISPR 폴리펩타이드의 상호작용을 통해 CRISPR 폴리펩타이드에 의해 인지되는, 헤테로두플렉스 구조를 일반적으로 포함하는 하나 이상의 영역을 포함할 경우, gRNA는 본 발명의 내용에 따라 CRISPR 폴리펩타이드와 상호작용하도록 구성될 수 있다.
제1 측면 및 본 발명의 다른 측면에 대한 특정 구현예에서, 제1 DNA 타겟 서열은 세포, 바람직하게는 진핵생물 세포, 더 바람직하게는 진균, 동물 또는 식물 세포의 게놈 내에 위치될 수 있으며, 게놈은 핵 게놈 뿐만 아니라 플라스티드 게놈 등의 다른 게놈 부위를 포함한다.
"DNA 타겟 서열"은, 타겟화된 게놈 편집이 이루어지는, 게놈 영역으로 정의된다. CRISPR 핵산 서열과 복구 주형 핵산 서열이 본질적으로 서로 다른 기능을 가지므로, 제1 및 제2 DNA 타겟 영역이 존재할 수 있다. 제1 DNA 타겟 서열은 CRISPR 핵산 서열의 제1 서열 영역과 상보적인 대상 DNA 타겟 영역으로 정의되며, 제2 DNA 타겟 서열은 복구 주형 핵산 서열의 하나 이상의 영역과 상보적인 대상 DNA 타겟 영역으로 정의된다. 제1 및 제2 DNA 타겟 영역은 동일하거나 또는 바람직하게는 상이하지만, 대상 DNA 타겟 서열에서 중복되는 영역을 공유할 수 있다.
CRISPR 핵산 서열에 대한 타겟 부위와 복구 주형 핵산 서열 (RT)에 대한 상동성 부위 간의 공간 관계 (spatial relation)는 가변적일 수 있다. 2 부위는 동일할 수 있거나, 완전히 또는 일부 중복될 수 있거나, 또는 대상 게놈내 임의 개수의 뉴클레오티드 거리로 떨어져 있을 수 있다. RT는 게놈 DNA의 양쪽 가닥에 대해 상동성을 가질 수 있거나, 또는 가닥이 CRISPR 핵산 서열 스페이서 서열에 의해 타겟화되는지와는 독립적으로, 각 가닥에 대해 상동성을 가질 수 있다. 효과적인 복구 주형은 Cas9에 의해 먼저 분리된 절단된 DNA 가닥에 특이적인 상보성을 가지도록 구성될 수 있다 (Richardson, et al., Nature Biotechnology. 2016, doi: 10.1038/nbt.3481).
본 발명에 따른 하이브리드 RNA/DNA 핵산 서열은, CRISPR 핵산 서열 모이어티에 대해 화학량론적인 방식으로 존재하는 복구 주형 뉴클레오티드 서열의 물리적인 이용가능성을 보장하고, 타겟화된 게놈 가닥 절단 위치에 인 시추 CRISPR 폴리펩타이드가 DNA 타겟 서열에 CRISPR 폴리펩타이드에 의해 도입되므로, 상동성 특이적인 복구 (HDR)/상동성 재조합 (HR)의 일반적인 낮은 효율을 극복할 것으로 예상된다.
따라서, 본 발명에 따른 하이브리드 RNA/DNA 뉴클레오티드 서열의 일부로서, 용어 DNA 변형 복구 주형은, 단일 가닥 또는 이중 가닥 DNA 서열일 수 있으며, DNA 절단의 복구 및/또는 변형을 위한 주형을 제공할 수 있는, 뉴클레오티드 서열을 포함한다.
본 발명의 제1 측면에 따른 바람직한 일 구현예에서, 하이브리드 RNA/DNA 뉴클레오티드 서열은, RNA 및 DNA 영역이 서로 공유 부착되거나 또는 비-공유적으로 결합된, 시험관내에서 사전-조립된 복합체일 수 있다. 일 구현예에서, RNA/DNA 뉴클레오티드 서열은 사전-조립되며, CRISPR 폴리펩타이드는 타겟 세포로 전사가능한 DNA 또는 번역가능한 RNA 구조체로서 또는 직접 아미노산 서열로서 개별적으로 타겟 세포에 전달되며, RNA/DNA 뉴클레오티드 서열과 CRISPR 폴리펩타이드는 타겟 세포 내에서 복합체를 형성한다. 다른 구현예에서, RNA/DNA 뉴클레오티드 서열 뿐만 아니라 CRISPR 폴리펩타이드는 시험관내에서 조립될 수 있으며, 리보핵단백질 복합체는 이후 변형시킬 하나 이상의 DNA 타겟 뉴클레오티드 서열을 포함하는 대상 타겟 세포 내로 도입된다.
CRISPR 엔도뉴클레아제를 사용할 경우, 타겟 세포에 사전-조립된 기능성 복합체의 도입시 타겟화된 이중 가닥 절단이 발생하며, RNA에 의해 안내된 CRISPR 폴리펩타이드의 활성이 본 발명에 따른 제2 DNA 타겟 서열의 부위에서 CRISPR 핵산 서열과 연결된 DNA 복구 주형 뉴클레오티드 서열에 의한 후속적인 상동성 재조합을 즉시적으로 수반한다는 점에서, 복구 및 부위-특이적인 변형을 동시에 진행한다. 따라서, 하이브리드 RNA/DNA 뉴클레오티드 서열과 대응되는 CRISPR 폴리펩타이드를 포함하는 분자 복합체는, CRISPR 핵산 서열:CRISPR 폴리펩타이드 및 CRISPR 핵산 서열/CRISPR 폴리펩타이드:복구 주형의 적절한 화학량론적 조성이 타겟 부위에 협동적인 방식 (coordinated way)으로 도달할 수 있기 때문에, 고-특이적이며 제어가능한 게놈 편집 이벤트를 방해하는 비-특이적인 NHEJ 이벤트 (상기 배경기술 참조) 또는 RT의 낮은 이용가능성 문제를 동시에 줄일 수 있다. 추가적인 이점은, 게놈 내에 그 자체가 통합될 수 없는, 복합체의 단백질 및 RNA 구성 성분과의 물리적 결합으로 인해, 복구 주형의 오프-타겟 통합 가능성이 줄어든다는 것이다.
본 발명에 따른 용어 "타겟화된 상동성 특이적인 복구"는 본 발명에 따른 복구 주형 서열에 의해 도입될 수 있는 임의 타입의 변형을 포함하며, 이는 독립적으로 서열 삽입, 하나 이상의 서열 위치의 편집, 결손 또는 재배열을 포함할 수 있으며, 현재 고등 진핵생물에서 게놈 편집 기법의 바람직한 전략은 삽입, 결손 또는 편집인데, 이는 DNA 타겟 서열 내 대상 서열의 타겟화된 넉-인 또는 넉-아웃 또는 하나 이상의 서열의 부위-특이적인 변형이 가능하기 때문이다.
본 발명에 따른 하이브리드 핵산 서열과의 공동-작용으로 생체외 또는 생체내에서 형성된 분자 복합체에 의해 매개되는 타겟화된 상동성 특이적인 복구는, 예시적인 CRISPR 엔도뉴클레아제/CRISPR 핵산 서열/복구 주형 복합체 및 소정의 내인성 DNA 타겟 서열에 대한 DNA 인지, 결합, 절단 및 복구를 시간적인 순서로 도시한, 도 3 A - E에서 확인할 수 있다.
본 발명의 다양한 측면들에 대한 일 구현예에서, 복구 주형 핵산 서열 및/또는 CRISPR 핵산 서열은, 선택적으로 백본 변형 및/또는 염기 변형을 포함하는, 합성 뉴클레오티드 서열 등의, 천연 또는 비-천연 뉴클레오티드 서열로부터 선택되는 뉴클레오티드 서열을 포함할 수 있으며, CRISPR 핵산 서열은 단일 가닥 또는 부분 단일 가닥 RNA 뉴클레오티드 서열을 포함하고, 복구 주형 핵산 서열은 단일 가닥 또는 이중 가닥 DNA 뉴클레오티드 서열을 포함한다.
임의의 CRISPR 게놈 편집에서의 도전 과제는, 본 발명의 하이브리드 핵산 서열의 RNA 영역과 기능성 CRISPR 폴리펩타이드가 게놈 DNA, 즉 DNA 타겟 서열을 포함하는 핵 또는 임의의 다른 구획으로 기능적인 (분해되지 않은) 방식으로 수송되어야 한다는 것이다. RNA는 특히 뉴클레아제에 의해 쉽게 분해될 수 있어 비교적 폴리펩타이드 또는 이중 가닥 DNA 보다 안정성이 떨어지고, 턴오버가 빠르므로, 본 발명의 제1 측면에 따른 일부 구현예에서, CRISPR RNA 서열 및/또는 DNA 복구 주형 핵산 서열은 하나 이상의 비-천연 뉴클레오티드를 포함한다. CRISPR RNA 및/또는 DNA 복구 주형 핵산 서열의 안정성을 증가시키는 본 발명에 따른 바람직한 백본 변형은 포스포로티오에이트 (phosphorothioate) 변형, 메틸 포스포네이트 변형, 자물쇠형 핵산 변형 (locked nucleic acid modification), O-(2-메톡시에틸) 변형, 다이-포스포로티오에이트 변형 및 펩타이드 핵산 변형으로 이루어진 군으로부터 선택된다. 특히, 이러한 백본 변형들 모두 여전히 핵산 가닥 2개 간에 상보적인 염기 쌍 형성은 가능하지만, 내인성 뉴클레아제에 의한 절단에 대한 내성이 더 강하다. 본 발명에 따른 하이브리드 RNA/DNA 핵산 서열과 조합에 의해 사용되는 CRISPR 뉴클레아제에 따라, CRISPR 폴리펩타이드와 서열-독립적인 상호작용에 관여하는 CRISPR 핵산 서열의 뉴클레오티드 위치는 수정하지 않는 것이 필수적일 수 있다. 이러한 정보는 CRISPR 뉴클레아제/CRISPR 핵산 서열 복합체에 이용가능한 입수가능한 구조 정보로부터 수득할 수 있다.
본 발명의 제1 측면에 따른 특정 구현예들에서, CRISPR 핵산 서열 및/또는 DNA 복구 주형 핵산 서열은, 바람직하게는 전체가 아닌 선택된 뉴클레오티드 위치에서, 뉴클레오티드 및/또는 염기 변형을 포함할 수 있는 것으로 생각된다. 이러한 변형은 아크리딘, 아민, 바이오틴, 케스케이드 블루, 콜레스테롤, Cy3, Cy5, Cy5.5, Daboyl, 디옥시게닌 (digoxigenin), 다이니트로페닐, Edans, 6-FAM, 플루오레세인, 3'-글리세릴, HEX, IRD-700, IRD-800, JOE, 포스페이트 소랄렌, 로다민, ROX, 티올 (SH), 스페이서, TAMRA, TET, AMCA-S", SE, BODIPY®, Marina Blue®, Pacific Blue®, Oregon Green®, 로다민 Green®, 로다민 Red®, Rhodol Green® 및 Texas Red®의 부가로 이루어진 군으로부터 선택된다. 바람직하게는, 이러한 부가는 CRISPR 핵산 서열 및/또는 DNA 복구 주형 핵산 서열의 3' 또는 5' 말단 위치에서 통합된다. 이러한 변형은, 세포 내 CRISPR 핵산 서열 및/또는 DNA 복구 주형 핵산 서열의 세포 위치화를 가시화하여 해당 서열의 분포, 집중 및/또는 이용가능성을 연구할 수 있다는 점에서, 유익한 효과를 가진다. 또한, 대상 CRISPR 폴리펩타이드와 본 발명에 따른 하이브리드 RNA/DNA 구조체의 상호작용을 연구할 수 있다. 전술한 바와 같이 변형 또는 테깅된 뉴클레오티드 서열의 상호작용 또는 가시화를 연구하기 위한 방법들은 당해 기술 분야의 당업자들에게 이용가능하다.
일 구현예에서, CRISPR 핵산 서열 및/또는 DNA 복구 주형 핵산 서열의 임의의 뉴클레오티드는, CRISPR 핵산 서열 및/또는 DNA 복구 주형 핵산 서열의 하나 이상의 뉴클레오티드에 포함된 표지 물질 또는 링커로서 상기한 변형들 중 하나를 포함할 수 있다. 따라서, 본원에서, "뉴클레오티드"는 일반적으로 염기-당-포스페이트 조합을 지칭할 수 있다. 뉴클레오티드는 합성 뉴클레오티드를 포함할 수 있다. 뉴클레오티드는 합성 뉴클레오티드 유사체를 포함할 수 있다. 뉴클레오티드는 핵산 서열의 단량체 단위일 수 있다 (예, 데옥시리보핵산 (DNA) 및 리보핵산 (RNA)). 용어 뉴클레오티드는 리보뉴클레오시드 트리포스페이트, 즉 아데노신 트리포스페이트 (ATP), 우리딘 트리포스페이트 (UTP), 시토신 트리포스페이트 (CTP), 구아노신 트리포스페이트 (GTP) 및 데옥시리보뉴클레오시드 트리포스페이트, 예를 들어, dATP, dCTP, dITP, dUTP, dGTP, dTTP 또는 이의 유도체를 포함할 수 있다. 이러한 유도체로는, 예를 들어, 비-제한적으로, [αS]dATP, 7-deaza-dGTP 및 7-deaza-dATP, 및 이를 함유한 핵산 분자에 대해 뉴클레아제 내성을 부여하는 뉴클레오티드 유도체 등이 있다. 본원에서, 용어 뉴클레오티드는 다이데옥시리보뉴클레오시드 트리포스페이트 (ddNTP) 및 이의 유도체를 지칭할 수 있다. 다이데옥시리보뉴클레오시드 트리포스페이트에 대한 예시적인 예로는, 비-제한적으로, ddATP, ddCTP, ddGTP, ddITP 및 ddTTP 등이 있다. 뉴클레오티드는 표지되지 않거나, 또는 널리 공지된 기법에 의해 검출가능하게 표지될 수 있다. 또한, 표지는 양자점 (quantum dot)을 이용해 수행될 수 있다. 검출가능한 표지 물질로는, 예를 들어, 방사성 동위원소, 형광 표지 물질, 화학발광 표지 물질, 생발광 표지 물질 및 효소 표지 물질 등이 있을 수 있다. 뉴클레오티드의 형광 표지 물질은, 비-제한적으로, 플루오레세인, 5-카르복시플루오레세인 (FAM), 2'7'-5 다이메톡시-4'5-다이클로로-6-카르복시플루오레세인 (JOE), 로다민, 6-카르복시로다민 (R6G), N,N,N',N'-테트라메틸-6-카르복시로다민 (TAMRA), 6-카르복시-X-로다민 (ROX), 4-(4'다이메틸아미노페닐아조)벤조산 (DABCYL), 케스케이드 블루, 오레곤 그린, 텍사스 레드, 시아닌 및 5-(2'-아미노에틸)아미노나프탈렌-l-설폰산 (EDANS) 등을 포함할 수 있다.
표지 물질 또는 링커 역시 CRISPR 핵산 서열 또는 이의 일부 및 DNA 복구 주형 핵산 서열을 서로 연결하거나, 또는 하이브리드 핵산 서열을 대상 CRISPR 폴리펩타이드에 연결하기 위한 클릭 화학 반응 (click chemistry)에 적합한 모이어티를 포함할 수 있다.
본 발명에 따른 임의의 핵산 또는 아미노산을 변형시켜 시험관내 또는 생체내에서 분자 복합체를 구축하기에 적합한 클릭 화학 반응을 포함하는 반응들 중에서도, 일 예는 알킨을 아지드로 Huisgen 1,3-쌍극자 고리화 반응하여 1,4-이중 치환된-1,2,3-트리아졸을 형성하는 반응이다. 구리 (I)-촉매 반응은 온화하며, 매우 효율적이고, 보호기가 필요 없으며, 다수 경우에 정제할 필요가 없다. 아지드 및 알킨 관능기는 일반적으로 생물 분자 및 수계 환경에 불활성이다. 트리아졸은 자연에서 발견되는 편재된 아미드 모이어티와 유사성을 가지고 있지만, 아미드와는 달리 절단되는 경향을 보이지 않는다. 또한, 이는 산화 또는 환원이 거의 불가능하다.
당해 기술 분야의 당업자에게 공지된 바와 같이, 생체내 반응에 적합한 특수 클릭 화학 반응은 아지드, 말단 알킨 또는 변형된 (strained) 알킨 (예, 다이벤조사이클로옥틸 (DBCO)) 등의 반응성 기에 의존하며, 반응성 기는 천연적인 카운터파트 대신 통합된 그에 따라 변형된 뉴클레오티드를 통해 임의의 RNA 또는 DNA 형태에 도입될 수 있다. 표지 물질은 효소적으로 또는 화학적으로 도입될 수 있다. 이후, 제조된 클릭-관능화된 DNA는 Cu(I)-촉매화된 알킨-아지드 (CuAAC) 또는 Cu(I)-프리 변형된 알킨-아지드 (SPAAC) 클릭 화학 반응을 통해 변형될 수 있으며, 구리-프리 반응 (copper-free reaction)은 세포 또는 살아있는 시스템에 이용하기에 바람직하다. 이들 반응은 본 발명에 따라 이용해, 후속적인 정제 과정을 위해 바이오틴 기를 (아지드, 바이오틴의 알킨 또는 DBCO-함유성 바이오틴화 시약을 통해) 도입하거나, 후속적인 현미경 이미지 촬영을 위한 형광 기를 (형광성 아지드, 형광성 알킨 또는 DBCO-함유성 형광 염료를 통해) 도입하거나, 또는 생체분자, 예를 들어, 본 발명에 따른 CRISPR 핵산 서열 및 DNA 복구 주형을 가교하여, 공유적으로 연결시키거나 또는 관능화된 생체 분자를 제공할 수 있다.
일 구현예에서, 본 발명에 따른, 선택적으로 정제된, 기능적으로 결합된 5' 또는 3' 말단 클릭-화학 반응으로 표지된 하이브리드 핵산 서열은, 대응되는 CRISPR 폴리펩타이드를 안정적으로 또는 일시적으로 발현하는 세포 또는 세포 시스템으로, 형질전환 또는 형질감염 방법에 의해 전달될 수 있다. 이로써, 하이브리드 핵산 서열의 CRISPR 핵산 서열은 CRISPR 폴리펩타이드와 상호작용하고, 따라서 이미 복구 주형에 부착된 채 이를 활성화한다. 대상 게놈 타겟 부위에서 절단이 이루어지는 동안, 절단 부위에의 복구 주형의 인접한 근접성은 HDR 빈도를 증가시킨다. 특정 구현예들에서, CRISPR 폴리펩타이드는 이와 함께 사용가능한 클릭-화학-표지 물질을 포함할 수 있으며, 따라서, 하이브리드 핵산 서열의 5' 및/또는 3' 말단에 존재하는 클릭 화학 표지 물질과 반응할 수 있다.
본원에 따른 핵산, 즉 임의의 CRISPR 핵산 및 단일 가닥 또는 이중 가닥 복구 주형을 공유적인 방식으로 서로 연결하기 위해, 당해 기술 분야의 당업자라면, 다양한 추가적인 화학 반응 및 대응되는 변형을 이용할 수 있다. 이러한 변형제로는 티옥산 N-하이드록시숙신이미드 (NHS) 에스테르, 일차 아민 (-NH2)과 반응하는 화학 기와 같은, 티올 변형 등의 다양한 가교제 등이 있다. 이들 일차 아민은 생리학적 pH에서 양 전하를 띠며; 따라서, 수성 매질에 투입된 접합 시약에 쉽게 접근가능한 천연 단백질 3차 구조의 외 표면 상에서 주로 형성된다. 또한, 전형적인 생물 샘플 또는 단백질 샘플에서 이용가능한 관능기들 중, 일차 아민이 특히 친핵성이므로, 이는 수종의 반응성 기와의 접합에 쉽게 타겟이 된다. 일차 아민과의 화학적 결합을 형성하는 합성 화학 기들이 몇가지 존재한다. 이러한 것으로는, 이소티오시아네이트, 이소시아네이트, 아실 아지드, NHS 에스테르, 설포네이트 기 (-SO3)를 함유한 설포-NHS 에스테르, 예를 들어, 비스(설포숙신이미딜)서베레이트 (BS3), 설포닐 클로라이드, 알데하이드, 글리옥살, 에폭사이드, 옥시란, 카보네이트, 아릴 할라이드, 이미도에스테르, 카르보디이미드, 예를 들어, 1-에틸-3-(3-다이메틸아미노프로필)카르보디이미드 (EDC) 또는 다이사이클로헥실카르보디이미드 (DCC), 무수물, 및 플루오로페닐 에스테르 등이 있다.
CRISPR 핵산 서열과 DNA 복구 주형 핵산 서열을 커플링시키기 위해, CRISPR 핵산 서열과 DNA 복구 주형 핵산 서열 간에 바람직한 방향으로 후속적인 공유 결합이 구축될 수 있도록, 해당 핵산 서열의 5' 또는 3' 말단에 변형 또는 표지 물질을 삽입하는 것이 유익할 것이다. 변형 또는 표지 물질의 위치 설정은, 도 1a도 1b 각각에 예시된 여러가지 토폴로지 또는 구조에서 명백한 바와 같이, 제조할 하이브리드 핵산 구조체의 토폴로지에 따라 결정될 것이다.
본 발명의 다양한 측면에 따른 임의 구현예들에서, 하이브리드 핵산 서열 뿐만 아니라 CRISPR 폴리펩타이드는 대상 타겟 세포 내 해당 구획의 대상 DNA 타겟 서열에 반드시 도달하여야 한다. 본 발명의 특정 구현예에서, 위치화 서열은 핵 위치화 서열, 플라스티드 위치화 서열, 바람직하게는 미토콘드리아 위치화 서열 또는 엽록체 위치화 서열을 포함할 수 있다. 따라서, CRISPR 폴리펩타이드 및/또는 하이브리드 핵산 구조체는 해당 위치화 서열, 바람직하게는 복합체를 세포의 핵 게놈으로 향하게 하기 위한 핵 위치화 서열 (NLS)을 포함하여야 한다. 일부 구현예에서, CRISPR 효소 또는 하이브리드 핵산은 아미노 말단에 또는 그 근처에, 또는 하이브리드 핵산 서열의 5' 말단에 또는 그 근처에 각각 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 NLS를 포함할 수 있거나, 또는 카르복시 말단에 또는 그 근처에 또는 하이브리드 핵산 서열의 3' 말단에 또는 그 근처에 각각 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 NLS를 포함할 수 있거나, 또는 이의 조합 (예, 아미노 말단/5' 말단에서 하나 이상의 NLS 및 카르복시 말단/3' 말단에서 하나 이상의 NLS)을 포함할 수 있다. NLS가 2 이상 존재하는 경우, 이들 각각은, 싱글 NLS가 2 카피 이상으로 존재하거나 및/또는 하나 이상의 카피로 존재하는 하나 이상의 다른 NLS와 조합하여 존재하도록, 독립적으로 선택될 수 있다. 본 발명의 바람직한 구현예에서, CRISPR 효소 및/또는 하이브리드 핵산 서열은 최대 6개의 NLS를 포함할 수 있다. 본 발명에 따른 하이브리드 핵산 서열에 NLS를 부착하기 위해, NLS는 펩타이드로서 또는 시험관내 전사된 서열로서 제공될 수 있으며, 이후 이는 CRISPR 핵산 서열, RT 또는 하이브리드 핵산 서열의 유리형 5' 및/또는 3' 말단에 화학적으로 부착될 수 있다.
NLS가 CRISPR 폴리펩타이드 또는 이를 코딩하는 서열에 부착되는 일부 구현예에서, NLS의 가장 가까운 아미노산이 N- 또는 C-말단으로부터 폴리펩타이드를 따라 약 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40 또는 50개 이상 이내에 위치할 경우, NLS는 N- 또는 C-말단 근처로 간주된다. NLS에 대한 비-제한적인 예로는 다음으로부터 유래되는 NLS 서열 등이 있다: 아미노산 서열 PKKKRKV (서열번호 1)을 가진, SV40 바이러스 라지 T-항원의 NLS; 뉴클레오플라스민 유래 NLS (예, 뉴클레오플라스민 바이파티트 (nucleoplasmin bipartite) NLS, 서열 KRPAATKKAGQAKKKK (서열번호 2)); 아미노산 서열 PAAKRVKLD (서열번호 3) 또는 RQRRNELKRSP (서열번호 4)를 가진, c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (서열번호 5)를 가진 hRNPA1 M9 NLS; 임포틴-알파의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (서열번호 6); 근종 T 단백질의 서열 VSRKRPRP (서열번호 7) 및 PPKKARED (서열번호 8); 인간 p53의 서열 PXPKKKPL (서열번호 9), 여기서 서열번호 9의 8번 위치의 "L"은 옵션임; 마우스 c-abl IV의 서열 SALIKKKKKMAP (서열번호 10); 인플루엔자 바이러스 NS1의 서열 DRLRR (서열번호 11) 및 PKQKKRK (서열번호 12); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL (서열번호 13); 마우스 Mx1 단백질의 서열 REKKKFLKRR (서열번호 14); 인간 폴리(ADP-리보스) 중합효소의 KRKGDEVDGVDEVAKKKSKK (서열번호 15); 및 스테로이드 호르몬 수용체 (인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK (서열번호 16). 일부 구현예에서, 위치화 신호는 플라스티드 위치화 서열, 예를 들어, 플라스티드 또는 미토콘드리아 위치화 신호일 수 있다. 적합한 플라스티드 위치화 신호는 엽록체 전이 펩타이드 또는 미토콘드리아 타겟팅 펩타이드로 이루어진 군으로부터 선택된다. 또한, HIV Tat 단백질로부터 유래되는 펩타이드 또는 이를 코딩하는 서열은 세포 및/또는 대상 세포의 구획으로 대상 구조체 또는 분자를 타겟팅하는데 적합할 수 있다. 적합한 Tat 펩타이드는 YGRKKRRQRRR (서열번호 17)로부터 유래되거나 또는 모티프 GRKKR (서열번호 18)를 포함한다.
CRISPR 폴리펩타이드가 핵산 서열 형태로 하나 이상의 전달 벡터의 도움을 받아 세포에 전달되는 구현예에서, 위치화 신호는, CRISPR 폴리펩타이드의 인지 및/또는 절단 기능을 교란하지 않는 CRISPR 폴리펩타이드 내부 임의의 적절한 위치에, 위치화 서열을 코딩하는 핵산 서열로서 공유적인 방식으로 하나 이상의 CRISPR 폴리펩타이드 코딩 서열에 공유적으로 부착될 수 있다.
일 구현예에서, 하나 이상의 CRISPR 폴리펩타이드는 형광 리포터 유전자 또는 단백질과 공유적으로 또는 비-공유적으로 결합될 수 있다. 이러한 리포터는 DNA로서, mRNA로서, 독립적인 단백질로서 또는 하나 이상의 CRISPR 폴리펩타이드에 연결된 융합 단백질로서 전달될 수 있다.
CRISPR 핵산 서열 모이어티 및 복구 주형 (RT) 모이어티를 포함하는 본 발명에 따른 하이브리드 핵산 서열은 여러가지 방식으로 제조될 수 있다. 적절한 경우, 합성 방식으로 RNA 염기를 부가하고, 적절한 경우 합성 방식으로 DNA 염기를 부가하는, 화학적 합성에 의해 제조될 수 있다. 다른 구현예에서, CRISPR 핵산 서열 및 RT는 서로 독립적으로 합성한 다음 분자를 전술한 바와 같이 결합시킬 수 있다. 또 다른 옵션은 핵산을 RNA, 바람직하게는 단일 가닥 RNA에 연결시킬 수 있는 T4 RNA 리가제 또는 다른 효소를 이용하는 것이다. 본원에서, RNA 및 DNA 구성 성분은 임의 방식으로 독립적으로 제조하고, 혼합한 후 이를 제조사의 프로토콜에 따라 효소에 노출시키고, 이들 구성 성분은 라이게이션에 의해 공유적으로 연결되어, 즉 공유 부착이 형성된다. 본원에 기술된 변형 및 표지 물질을 사용해, CRISPR 핵산 서열 모이어티 및 RT 모이어티를 서로 공유적으로 연결시킬 수 있다. CRISPR 핵산 서열을 RT에 공유 결합시키기 위한 다른 전략은 이들 각각을 다른 연결성 화학 기 또는 복합체, 예를 들어 펩타이드와 연결시키는 것을 포함한다. 이러한 유형의 방식은, 하이브리드 핵산 서열을 세포 내에서 향후 검출하여야 하거나 또는 추가적인 기능이 하이브리드 핵산 서열로부터 발휘되어야 할 경우에, 특히 적합하다. CRISPR 핵산 서열 및/또는 하이브리드 핵산 서열의 화학적 변형은, 하이브리드 핵산 서열을 안정화하고, 세포 효소에 의한 분해를 방지함으로써, 대상 DNA 타겟 부위에서 하이브리드 핵산 서열 및 CRISPR 폴리펩타이드의 높은 동시적인 이용가능성을 달성하는 것이 매우 중요할 수 있다.
본 발명의 다양한 측면들에 따른 특정 구현예들에서, 하나 이상의 하이브리드 핵산 서열은 CRISPR 핵산 서열과 복구 주형 핵산 서열 사이에 링커 영역을 포함할 수 있다. 이 서열을 이용해, 하이브리드 핵산 서열의 각각의 영역들이 그 기능을 완전히 발휘할 수 있도록, CRISPR 핵산 서열 및 복구 주형 핵산 서열의 최적의 기하학적 구조를 달성할 수 있다. 링커 또는 테더 영역 (tether region)의 길이와 조성은 특정 CRISPR 핵산 서열과 RT 쌍들에 중요한 설계 측면일 수 있다. 일 구현예에서, 특히 RT의 좌측 상동성 암의 5' 말단에 링커 영역을 포함할 수 있다. 테터 또는 링커는 다양한 형태를 취할 수 있다. RT의 좌측 또는 우측 상동성 암에서 시작하여, 이러한 RT 영역은, 염색체 타겟 쪽으로의 RT의 이동을 허용하기 위한 테더 또는 플렉시블 링커로서, 그리고 HR 반응을 매개하기 위한 상동성으로서 작용할 수 있게 하는 것은, 본 발명의 내용에 기초하여 게놈 편집을 위해 현재 널리 사용되는 복구 주형에 대한 통상적인 설계 파라미터에 대한 지식을 가진 당업자에 의해 수행될 수 있다.
고려되어야 하는 설계 파라미터로는, 도입될 링커 및 링커의 길이에 영향을 미칠 수 있는, CRISPR 폴리펩타이드의 절단 부위에 대해 상동적인 복구 주형의 기하학적 구조, 복구 주형과 상동적인 대상 DNA 타겟 부위의 가닥, 복구 주형의 크기 등이 있다. 링커 서열은 CRISPR 핵산 서열과 복구 주형의 공유 및 비-공유 결합 둘다에 사용될 수 있다. 본원의 내용과 Nishimasu (supra), Tsai et. al (Nature Biotechnology, 32, 569-576, (2014)) 또는 Shechner et al. (Nature Methods, 12(7), 664-670 (2015), doi: 10.1038/nmeth.3433)에 제공된 정보에 기초해, 당해 기술 분야의 당업자라면 CRISPR 핵산 서열과 RT 사이 또는 여러가지 CRISPR 핵산 서열 및/또는 RT들 사이에 위치한 구체적인 서열을 정의하기 위해, 하이브리드 핵산 서열에 적합한 링커 영역을 정의할 수 있으며, 이 경우, 수 종의 하이브리드 핵산은 CRISPR 핵산 서열(들) 및 RT 모이어티 둘다에 어떠한 입체적 제약없이 그 기능을 충분히 발휘할 수 있도록 사용된다. 하나 이상의 링커 영역은 하나 이상의 CRISPR 핵산 서열을 RT와 적절하게 분리시키거나, 또는 CRISPR 핵산 서열 및/또는 RT의 위치를 최적화하기 위해 최대 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 또는 100개의 추가적인 뉴클레오티드를 포함할 수 있다. 특정 구현예들에서, 링커 서열은 CRISPR 핵산 서열 및/또는 RT의 보다 나은 위치 설정을 달성하기 위해 최대 150, 200, 250, 500, 1,000, 1,500, 2,000, 2,500, 3,000, 3,500, 4,000, 4,500 또는 적어도 4,700개 또는 5,000개의 뉴클레오티드를 포함할 수 있다.
CRISPR 핵산 서열과 RT의 비-공유적 결합을 수행하고자 하는 경우, 한가지 방법은 CRISPR 핵산 서열과 RT 2 분자가 RNA-DNA 염기 쌍 형성에 의해 자연스럽게 결합되도록, CRISPR 핵산 서열과 RT에 부분적으로 상보적인 서열을 제공하는 것이다.
RT가 편집 복합체의 일부 구성 성분과 충분한 결합을 유도하도록 분자의 전하를 이용하는 등의 또 다른 비-공유적인 결합 방법도 가능하다. 다른 구현예에서, 하나 이상의 CRISPR 폴리펩타이드 또는 하나 이상의 하이브리드 핵산 서열, 또는 CRISPR 핵산 서열 및/또는 이의 RT 영역은 테그와 결합 파트너, 즉 하이브리드 핵산 서열을 포함할 수 있거나, 또는 CRISPR 핵산 서열 및/또는 이의 RT 영역, 및 하나 이상의 CRISPR 폴리펩타이드는 각각, 각각 CRISPR 핵산 서열과 RT 간의 염기 쌍 형성 이외의 상호작용 및 CRISPR 핵산 서열과 CRISPR 폴리펩타이드 간의 결합이 달성되어, 분자 리보핵단백질 복합체의 상호작용 즉, 안정성을 높이도록, 테그의 대응되는 결합 파트너를 포함할 수 있다.
인간 세포에서, 3' 말단에 28 bp의 추가적인 서열을 가진 gRNA + 결합된 187개의 아미노산 (21.4 kD) Csy4 단백질이 탑재된 Cas9은, 표준 gRNA 대조군과 비교해 DSB 유도 활성을 90% 이상 유지하였다 (Tsai et al., Nature Biotech., 32, 2014). 이는 sgRNA의 3' 말단에 연결된 (tethered) 카고에 대한 Cas9에 의한 꽤 상당한 허용성 (tolerance)과 연장된 sgRNA 분자에 대한 적절한 구조-기능 잠재성을 시사해준다. Cas9 허용성은, 표준 gRNA에서 Cas9 단백질의 아키텍처 바깥쪽에 고정된 활성 부위를 홀딩하는 표면에 거의 직각인 표면에 헤어핀 형태에서 종결되는, 핵산 서열의 유리형 3' 말단의 플렉시빌리티에 의해 부분적으로 달성된다 (Nishimasu et al., 2014; Anders et al., 2014). 아울러, Shechner et al. ("Multiplexable, locus-specific targeting of long RNAs with CRISPR-display", Nature Methods, 12(7), 664-670 (2015), doi: 10.1038/nmeth.3433)에 따르면, 긴 비-코딩 sgRNA 분자는, 인간 세포 게놈에서 dCas9 단백질에 의한 서열-특이적인 타겟팅 활성을 감소시키지 않으면서, sgRNA의 5' 또는 3' 말단에 또는 sgRNA의 내부 루프에 전사적으로 부착될 수 있다. 최대 4.8 kb의 ssRNA가 서열-특이적인 타겟팅 활성을 유지한 리보핵단백질 복합체에 수용되었다.
본 발명의 다양한 측면들에 따른 일 구현예에서, 복구 주형 핵산 서열은 CRISPR 핵산 서열의 3' 말단에서 CRISPR 핵산 서열과 결합되거나, 및/또는 복구 주형 핵산 서열은 CRISPR 핵산 서열의 5' 말단에서 결합되거나, 및/또는 복구 주형 핵산 서열은 CRISPR 핵산 서열 내부에 위치한다.
놀랍게도, 본 발명자들은, 3'에 위치한 DNA 복구 주형 서열 (RT), 즉, 단일 가닥 또는 이중 가닥 RT를 싣고 있는(carrying) CRISPR 핵산 서열은, CRISPR 폴리펩타이드, 예를 들어 CRISPR 타입 II 시스템의 Cas9 또는 CRISPR 타입 V 시스템의 Cpf1 또는 다른 CRISPR 폴리펩타이드 작동자에 의해 타겟으로 전달되기 때문에, 상동적인 서열과 자유롭게 상호작용함을 발견하였다. 비슷한 결과는, 5' 위치된 DNA 복구 주형 서열, 단일 가닥 또는 이중 가닥 RT 또는 이 둘다의 경우, 3' 및 5'에 위치한 RT를 싣고 있는 CRISPR 핵산 서열을 이용하였을 때에도 관찰되었다. 3' 또는 5'에 위치한다는 것은, RT가 CRISPR 핵산 서열의 3' 또는 5' 말단에 공유 부착된다는 것을 의미하거나, 또는 이는 RT가 CRISPR 핵산 서열의 3' 및/또는 5' 영역에 부착된 서열에 해당되는 영역에 혼성화, 즉 비-공유적으로 결합한다는 것을 의미한다. 또한, RT는 CRISPR 핵산 서열의 스템 루프에 공유적으로 통합될 수 있거나, 또는 이는 CRISPR 핵산 서열의 스템 루프와 비-공유적으로 결합하여 기능적인 하이브리드 핵산 구조체를 형성할 수 있다. 따라서, 전술한 바와 같이, CRISPR 핵산 서열의 다양한 위치에서 CRISPR 핵산 서열과 DNA의 결합은 충분히 허용적이며, 따라서 이러한 새로운 형태의 하이브리드 복합체는 유전자 편집 원리의 중요한 2가지 특징을 조합하는데 적합한 것으로, 확인되었다: (1) CRISPR 핵산 서열에 의해 매개되는 정확한 타겟팅, 및 (2) RT에 의해 매개되는 효율적이며 부위-특이적인 복구. 또한, CRISPR 핵산 서열 및 RT는, 대상 DNA 타겟 부위에서, 대상 CRISPR 폴리펩타이드와 함께 하이브리드 구조체의 안정성 및 이용가능성을 높이도록 매우 근접하게 위치시키는 상승적인 효과도 존재한다.
RT가 CRISPR 핵산 서열의 3' 또는 5' 말단에 부착되는 경우, CRISPR 핵산 서열과 함께 전달되는 긴 복구 주형 뉴클레오티드 서열의 길이에는 거의 제한이 없다. RT의 길이는 오히려 도입할 타겟화된 변형에 따라 결정된다. 전형적인 RT 서열은, CRISPR 폴리펩타이드의 절단율을 현저하게 감소시키지 않으면서, 단일 가닥 및/또는 이중 가닥 DNA를 약 20 - 8,000 bp 이상, 예를 들어 20 - 5,000 bp, 30 - 8,000 bp, 30 - 5,000 bp, 40 - 8,000 bp, 40 - 5,000 bp, 50 - 8,000 bp, 50 - 5,000 bp, 60 - 8,000 bp, 60 - 5,000 bp, 70 - 8,000 bp, 70 - 5,000 bp, 80 - 8,000 bp, 80 - 5,000 bp, 90 - 8,000 bp, 90 - 5,000 bp, 100 - 8,000 bp, 100 - 5,000 bp의 길이로 가질 수 있다. 당해 기술 분야의 당업자에게 공지된 바와 같이, RT 주형의 길이는 발휘 효과/도입할 변형/삽입 타입에 의해 상당히 결정된다. 대상 단백질을 코딩하는 더 큰 핵산 서열을 넉-인하는 경우, RT 서열의 길이는 소정의 길이: 대상 단백질을 코딩하는 핵산 구조체 + 서열의 좌 및 우측에 위치한 충분히 긴 2개의 상동성 암을 가질 것이다. 즉, 기본적으로 상한 1,500 bp은 존재하지 않으며, RT는 최대 5,000개 이상의 염기 쌍 (bp)을 가질 수 있다. 예를 들어, 복구 주형으로서 플라스미드 DNA를 이용하여 타겟 부위에서 복구 주형으로 제조되는, 현재 도입되는 더 큰 삽입체는, 800 bp 이상의 우측 및 좌측 상동성 암을 이용하므로, 복구 주형의 총 길이는 수 천 bp일 수 있다. 핵산 삽입체의 길이는 대상 CRISPR 뉴클레아제, 예를 들어, Cas 뉴클레아제 또는 Cpf1 뉴클레아제를 저해하지 않도록 설계되어야 하며, 이는 사전 실험을 통해 결정될 수 있다.
본 발명에 따른 제2 측면에서, 본 발명은 본 발명의 제1 측면에 따른 하나 이상의 하이브리드 핵산 서열과 하나 이상의 CRISPR 폴리펩타이드를 포함하며, 하나 이상의 하이브리드 핵산 서열 및 하나 이상의 CRISPR 폴리펩타이드가 기능적인 방식으로 결합된, 분자 복합체를 제공한다.
용어 "기능적인 방식으로 결합된"은, CRISPR 폴리펩타이드와 CRISPR 핵산 서열의 제2 서열 영역이 서로, 바람직하게는, 전술한 비-공유 결합 형태로 상호작용할 수 있도록, 분자 리보핵단백질 복합체가 접촉되도록 하는 것을, 의미한다. 하나 이상의 CRISPR 핵산 서열과 하나 이상의 복구 주형 핵산 서열을 포함하는 하나 이상의 하이브리드 핵산 서열은, 하나 이상의 CRISPR 핵산 서열이 하나 이상의 대응되는 대상 CRISPR 폴리펩타이드와 접촉되기 전, 접촉된 후 또는 접촉과 동시에, 독립적으로, 조립된다. 일 구현예에서, 전체 복합체는, 편집할 하나 이상의 대상 DNA 타겟 영역을 포함하는 타겟 세포에 도입되기 전에, 시험관내에서 결합된다. 다른 구현예에서, 하나 이상의 CRISPR 폴리펩타이드는 하나 이상의 하이브리드 핵산 서열 도입 전 또는 도입 후에 하나 이상의 타겟 세포에 도입된다. CRISPR 폴리펩타이드는, 폴리펩타이드 서열을 형질감염시키거나, 또는 하나 이상의 폴리펩타이드를 코딩하는 RNA로 하나 이상의 타겟 세포를 형질감염 또는 형질전환시키거나, 또는 타겟 세포에서 전사 및 번역될 수 있는 하나 이상의 CRISPR 폴리펩타이드를 코딩하는 전달 구조체를 도입함으로써, 타겟 세포에 도입할 수 있다. 특정 구현예들에서, CRISPR 폴리펩타이드는 또한 대상 세포 또는 유기체의 게놈에 안정적으로 통합되어, 구성적으로 또는 유도성 방식으로 발현시킬 수 있다. 마찬가지로, 특정 구현예들에서, CRISPR 핵산 서열(들) 및 복구 주형 핵산 서열(들)은, 시험관내에서 제공되어 구조체로 조립되는 바와 같이, 동시적으로 제공될 수 있다. 다른 구현예에서, CRISPR 핵산 서열 및/또는 복구 주형 핵산 서열은 전술한 바와 같이 적합한 전달 벡터를 이용해 타겟 세포에 형질감염 또는 형질전환될 수 있다. 바람직한 구현예에서, 전체 분자 복합체를 시험관내에서 조립한 후 대상 타겟 세포로 도입함으로써, 게놈 편집 구조체의 최상의 공간적 및 화학량론적 조절이 가능하다. 다른 바람직한 구현예에서, 하나 이상의 CRISPR 폴리펩타이드를 하이브리드 핵산 서열에 앞서 타겟 세포에 도입하고, 이후 하나 이상의 하이브리드 핵산 서열을 대상 타겟 세포에 도입한다. 폴리펩타이드와 비교해 RNA의 선천적인 낮은 안정성의 이유로, 도입된 CRISPR 핵산 서열이 즉각적으로 결합하여 세포에 이미 존재하는 CRISPR 폴리펩타이드에 의해 안정화될 수 있도록, 일부 경우에는 순차적인 순서가 바람직할 수 있다. 이론으로 결부시키고자 하는 것은 아니지만, CRISPR 핵산 서열 및 복구 주형 핵산 서열의 생체외 조립은 또한 예를 들어 가이드 RNA 단독에 비해 구조체의 안정성을 높일 수 있다.
또 다른 구현예에서, 분자 복합체의 개별 구성 성분들은 전술한 표지 물질 또는 링커 형태의 하나 이상의 변형을 포함할 수 있다. 상기한 변형은 생체내 또는 시험관내에서 분자 복합체에 결합되어, 안정적인 공유 또는 비-공유 결합을 달성하는데 도움이 될 수 있다. 예를 들어, 클릭 화학 기 또는 NHS-에스테르 화합물을 이용해, 분자를 공유적으로 연결시킬 수 있다. 다른 예로, 비-공유 결합은 하나의 변형으로서 바이오틴 및 바이오틴-결합 단백질 모이어티를 통해, 또는 단쇄 Fv 항체 단편 및 이의 동족 타겟 간에 달성될 수 있으며, 이러한 변형은 연결되는 분자 복합체의 구성 성분 내에 존재한다. 이러한 방법을 통해, 핵산과 다른 핵산, 또는 핵산과 아미노산 구성 성분간의 기능적인 결합을 달성할 수 있다.
일부 용도의 경우, 대상 세포에 도입하기 전에 구성 성분들을 시험관내에서 결합시키는 것이 적합할 수 있다. 다른 용도의 경우, 예를 들어, 세포에서의 과정을 가시화하기 위해, 하나 이상의 형광 영역 또는 염료를 포함하는 분자 복합체를 이용하는 것이 적합할 수도 있다. 세포 내부의 세포(내) 위치화 및/또는 다이나믹스를 모니터링하기 위해서는, 개별 구성 성분을 도입한 후, 선택적으로 이의 전사/발현 후, 생체내에서 개별 구성 성분들이 연결되게 하는 것이 적합할 수 있다.
본 발명에 다른 하이브리드 핵산 서열 및/또는 분자 복합체의 일부로서 본 발명에 따른 하나 이상의 복구 주형 핵산 서열의 크기는 달라질 수 있다. 변형할 DNA 타겟 서열에 따라, 그 범위는 약 20 bp 내지 약 5,000 bp 또는 심지어 8,000 bp일 수 있다.
대상 DNA 타겟 영역에 특이적인 돌연변이 또는 삽입을 구축하기 위해 사용되는 HDR 주형은 변형시킬 타겟 서열 주변부에 대해 어느 정도의 상동성을 가져야 한다. 변형이 삽입되는 부위는, 뉴클레아제 결핍성 CRISPR 폴리펩타이드의 경우, CRISPR 폴리펩타이드 또는 융합 파트너에 의해 발생된 DSB로부터 100 bp 이상 떨어져 있지 않는 것이, 가장 좋으며, 이상적으로는 가능하다면 10 bp 미만으로 떨어져 있는 것이 최선이며, 상동성 암의 전체 길이는 이를 설계할 때 고려해야 할 주요 인자이다. 더 먼 거리에서도 작동가능하지만, 효율이 더 낮아, 대상 DNA 타겟 서열에 도입할 바람직한 변형이 존재하는 지를 확인하기 위한 선택 마커를 반드시 도입해야 할 수도 있다.
본 발명의 다양한 측면에서, 하나 이상의 복구 주형 핵산 서열은 단일 가닥 또는 이중 가닥 DNA 핵산 분자일 수 있다. 하나 이상의 복구 주형 핵산 서열은 하나 이상의 선형, ss- 또는 ds-DNA 분자의 형태로 제공될 수 있다. 그러나, 분자 복합체가 생체외에서 조립할 경우, 생체외에서 제조된 하나 이상의 단일 가닥 또는 이중 가닥 복구 주형 핵산 서열을 사용하는 것이 적합할 수 있으며, 이는 모든 구성 성분들을 게놈 편집 방법의 특이성을 증가시키기 위해 정확한 화학량론으로 동시에 도입할 수 있으므로, 기능적인 CRISPR 뉴클레아제-CRISPR 핵산-RT 복합체의 이용가능성을 높이는데 특히 적합하다.
단일 가닥 또는 이중 가닥 형태의 보다 긴 핵산 서열의 합성은 통상적인 종래 방법으로 달성할 수 있다. 특정 구현예에서, 또한 부분적인 단일 가닥 및/또는 부분적인 이중 가닥 복구 주형 핵산 서열이 적합할 수 있다는 것에도 유념한다. 단일 가닥 및/또는 이중 가닥 핵산 서열 및 분자 복합체의 CRISPR 폴리펩타이드의 도입과 동시에, 도입 전 또는 도입 후와 같은 임의의 도입 방식의 모든 조합들이 가능하다. 일 구현예에서, 일부 게놈 편집 방식에서는 2 이상의 복구 주형 핵산 서열을 사용하는 것이 유리하므로, 타겟 세포가 복구 주형 또는 부가적인 복구 주형 서열을 코딩하는 추가적인 플라스미드를 포함하고, 여러가지 구성 성분들이 제공된 이후에 생체내에서 분자 복합체를 조립할 수 있는, 제2 측면에 따른 분자 복합체를 타겟 세포에 도입하는 방법을 제공한다. 매우 정확한 게놈 편집 이벤트를 고려하면, 타겟 세포 내, DNA 타겟 영역이 위치하는 부위에서 복구 주형 핵산 서열의 높은 물리적인 이용가능성은 매우 중요하다. 특정 구현예에서, 특히 단일 가닥 (ss) DNA 복구 주형은, 가능한 낮은 분자량을 유지시켜 적절한 균형을 달성하는데 적합하면서도, 동시에 최적의 상동성에 의한 복구를 달성하기 위한 충분한 상동성 상호작용 길이를 제공해준다.
본 발명의 임의 측면에 따른 일 구현예에서, 하나 이상의 CRISPR 폴리펩타이드는 독립적으로 스트렙토코커스 피오게네스 (Streptococcus pyogenes), 스트렙토코커스 서모필 (Streptococcus thermophiles) 등의 스트렙토코커스 (Streptococcus spp.), 스타필로코커스 아우레우스 (Staphylococcus aureus) 또는 네이세리아 메닝기티데스 (Neisseria meningitides) 등의 네이세리아 (Neisseria spp.), 코리네박터 (Corynebacter), 슈테렐라 (Sutterella), 레지오넬라 (Legionella), 트레포네마 (Treponema), 필리팍토르 (Filifactor), 유박테리움 (Eubacterium), 락토바실러스 (Lactobacillus), 미코플라스마 (Mycoplasma), 박테로이데스 (Bacteroides), 플라비이볼라 (Flaviivola), 플라보박테리움 (Flavobacterium), 스파로키타 (Sphaerochaeta), 아조스피릴룸 (Azospirillum), 글루콘아세토박터 (Gluconacetobacter), 로세부리아 (Roseburia), 파르비바쿨럼 (Parvibaculum), 니트라티프락토르 (Nitratifractor), 미코플라스마 (Mycoplasma) 및 캄필로박터 (Campylobacter)의 Cas 폴리펩타이드로 이루어진 군으로부터 선택되거나, 또는 CRISPR 폴리펩타이드는 액시드아미노코커스 sp. BV3L6 등의 액시드아미노코커스 (Acidaminococcus), 라크노스피레이세아 박테리움 ND2006 (Lachnospiraceae bacterium ND2006) 등의 라크노스피레이세아 (Lachnospiraceae spp.), 프란시셀라 노비시다 U112 (Francisella novicida U112) 등의 프란시셀라 (Francisella spp.), 유박테리움 엘리겐스 (Eubacterium eligens), 프레보텔라 (Prevotella spp.) 또는 포르피로모나스 (Porphyromonas spp.)의 Cpf1 폴리펩타이드 등의 고세균 또는 박테리아 유래 Cpf1 폴리펩타이드들로부터 선택되거나, 또는 CRISPR 폴리펩타이드는 CRISPR 폴리펩타이드 닉카제, 또는 엔도뉴클레오분해 활성이 결핍된 CRISPR 폴리펩타이드 등의 CasX 폴리펩타이드 또는 CasY 폴리펩타이드, 또는 이의 변이체 및/또는 기능성 단편 및/또는 이들의 조합으로부터 선택된다.
본 발명에 따른 일 구현예에서, 본 발명에 따른 하이브리드 RNA/DNA 핵산 서열은, 오프-타겟 돌연변이를 최소화하기 위해, CRISPR 닉카제 돌연변이, 예를 들어, Cas9 닉카제 돌연변이와 함께 사용될 수 있으며, 이때 각각의 가이드 RNA가 Cas9 유래 닉카제 돌연변이에 특이적인, 가이드 RNA 쌍이 사용된다.
일부 구현예에서, CRISPR 폴리펩타이드는 시험관내 발현된, 번역된 또는 합성된 폴리펩타이드로서 제공된다. 일부 구현예에서, 하나 이상의 CRISPR 폴리펩타이드를 코딩하는 전달 벡터가 사용되며, 여기서 전달 벡터는 추가적으로 조절 서열 또는 위치화 신호를 포함할 수 있다. 돌연변이된 CRISPR 효소에, 본 발명에 따른 다양한 구현예에 또한 포함된 타겟 서열을 함유한 타겟 폴리펩타이드의 한 가닥 또는 양쪽 가닥을 절단하는 절단력이 결여되도록, 대응되는 야생형 효소과 비교해 CRISPR 폴리펩타이드에 돌연변이를 유발한다. 예를 들어, 대상 DNA 타겟 영역의 양쪽 가닥을 절단하는 엔도뉴클레아제를 단일 가닥을 절단하는 닉카제로 Cas9을 변형시키는, S. pyogenes 유래 Cas9의 RuvC I 촉매 도메인에서 아스파르테이트 -> 알라닌 치환 (D10A)을 이용할 수 있다. Cas9 폴리펩타이드를 닉카제로 만드는 돌연변이의 다른 예로는, 비-제한적으로, H840A, N854A 및 N863A 등이 있다. 또 다른 예로, Cas9의 2 이상의 촉매 도메인 (RuvC I, RuvC II, 및 RuvC III 또는 HNH 도메인)을 돌연변이시켜, 전체 DNA 절단 활성이 실질적으로 결핍된 돌연변이 Cas9를 제조할 수 있다. 일부 구현예에서, 전체 DNA 절단 활성이 실질적으로 결핍된 Cas9 효소를 제조하기 위해, D10A 돌연변이에 H840A, N854A 또는 N863A 돌연변이 중 하나 이상을 조합한다. 일부 구현예에서, CRISPR 효소는, 돌연변이된 효소의 DNA 절단 활성이 비-돌연변이 효소의 DNA 절단 활성의 약 25% 이하, 10% 이하, 5% 이하, 1% 이하, 0.1% 이상, 0.01% 이하일 경우, 전체 DNA 절단 활성이 실질적으로 결핍된 것으로 간주되며; 일 예로, 돌연변이된 형태의 DNA 절단 활성이 비-돌연변이된 야생형 형태와 비교해 없거나 (null) 또는 극히 낮을 경우일 수 있다. 효소가 S. pyogenes 유래 Cas9가 아닐 경우, 돌연변이는 SpCas9의 10, 762, 840, 854, 863 및/또는 986번 위치에 해당되는 임의 또는 전체 잔기에서 유발될 수 있다 (이는 예를 들어 표준 서열 비교 툴에 의해 확인할 수 있음). 특히, S. pyogenes 유래 Cas9에 대해 다음과 같은 돌연변이들 중 일부 또는 전체 돌연변이가 바람직하며: D10A, E762A, H840A, N854A, N863A 및/또는 D986A; 아울러, 임의의 치환 아미노산에 대한 보존적인 치환도 본원에 따라 고려된다. 특정 구현예에서, 기타 Cas9의 경우에도 대응되는 위치에서 상기한 동일한 돌연변이 또는 보존적인 치환이 가능하며, 특히 S. pyogenes 유래 Cas9의 D10 및 H840에서 가능하다. 그러나, 다른 Cas9의 경우, S. pyogenes 유래 Cas9의 D10 및 H840에 해당되는 잔기도 가능하다. 소정의 CRISPR 단백질의 "오솔로그 (Ortholog)" 또는 "오솔로거스 (orthologous)" 역시 본 발명을 실시하는데 이용될 수 있다. 오솔로그는 종분화에 의해 공통 조상 유전자로부터 진화된 서로 다른 종의 유전자이다. 일반적으로, 오솔로그는 진화 과정 중에 동일한 기능을 유지한다. Cas9은 타입 II CRISPR 시스템으로부터 복수의 뉴클레아제 도메인들을 가진 가장 큰 뉴클레아제와 상동성을 공유하는 전체 효소 클래스를 지칭하는 것일 수 있으므로, CRISPR 효소는 Cas9로 표시될 수 있다. 가장 바람직하게는, Cas9 효소는 S. pyogenes Cas9, 또는 S. aureus Cas9이거나 또는 이로부터 유래되거나, 또는 S. thermophilus의 야생형 Cas9이며, 단백질 서열은 SwissProt database에 등재번호 G3ECR1으로 제공된다. 마찬가지로, S. pyogenes Cas9 또는 S. aureus Cas9은 SwissProt의 등재번호 Q99ZW2에 등록되어 있다.
일 구현예에서, 본 발명에 따른 하이브리드 RNA/DNA 핵산 서열의 하나 이상의 RNA를 포함하는 CRISPR 핵산 서열은 특정 길이의 선택된 CRISPR 효소 또는 폴리펩타이드에 대한 최적의 활성, 즉, 인지 특성을 가지도록 설계될 수 있으며, 시험관내 또는 생체내에서 전사 또는 번역될 수 있는 CRISPR 효소를 코딩하는 핵산 분자의 길이를 줄이 (truncating)거나 또는 합성된 CRISPR 폴리펩타이드를 제공함으로써, CRISPR 효소의 길이를 대응되는 야생형 CRISPR 효소 보다 더 작게 만들어, 절단 형태로 제조할 수 있다. 서로 다른 오솔로그들 간에 효소의 서로 다른 부위를 교체 또는 교환하여 맞춤 조절된 특이성을 가진 키메라 효소를 제조하는, 키메라 Cas9 효소를 제조하는 것도 가능하다.
본 발명에 따른 "변이체" 또는 "기능적 단편"은, 야생형 효소에 대해 소정의 서열 상동성 수준을 가지지만, 본원에 기술된 일부 방식으로 돌연변이된 (변형된), 야생형 CRISPR 단백질로부터 유래되는, 임의의 CRISPR 단백질 또는 이의 절단형 버전을 포함한다. Cas9 유래 뉴클레아제에 의한 효소 활성은, 가이드 서열의 뉴클레오티드 20개와 혼성하고; 타겟 서열에서부터 뉴클레오티드 20개 뒤에 위치한 본원에 기술된 바와 같이 결정될 수 있는 NGG/NRG 또는 PAM 등의 프로토스페이서-인접 모티프 (PAM) 서열을 가진, 타겟 부위 서열에 이중 가닥 절단을 형성한다. 이러한 효소 기능은 닉카제 활성을 가진 CRISPR 변이체 또는 뉴클레아제 데드 변이체 (nuclease dead variant)를 구축함으로써 변형시킬 수 있다. 또한, 본 발명에 따른 CRISPR 폴리펩타이드 변이체는 타겟 세포, 바람직하게는 진핵생물 세포, 바람직하게는 동물 또는 식물 세포의 코돈 용법에 맞게 CRISPR 폴리펩타이드를 코돈-최적화할 수 있다.
전술한 측면에 따른 일 구현예에서, CRISPR 폴리펩타이드는 야생형 CRISPR 폴리펩타이드의 촉매 활성 단편일 수 있으며, 단, CRISPR 폴리펩타이드는 여전히 야생형 CRISPR 폴리펩타이드의 촉매 기능을 발휘하거나, 및/또는 CRISPR 폴리펩타이드는 코돈 최적화될 수 있거나, 및/또는 CRISPR 폴리펩타이드는, 폴리히스티딘(His)-테그, 글루타티온-S-트랜스퍼라제 (GST)-테그, 티오레독신-테그, FLAG-테그, 형광 특성을 가진 테그, 예를 들어, (E)GFP ((보강된) 그린 형광 단백질) 테그, DsRed-테그, mCherry-테그, (t)dtomato-테그, mNeonGreen-테그 등으로부터 선택되는 테그, 스트렙타비딘 또는 strep-테그, 말토스-결합 단백질 (MBP) 테그, 미토콘드리아 또는 핵 등의 세포내 구획으로 타겟팅할 수 있는 트랜지트 (transit) 펩타이드, snap-테그 및/또는 부착된 아미노산 서열을 분비시킬 수 있는 분비 테그, 자연에서 정상적으로 생기지 않는 비-천연 아미노산 또는 전술한 테그들의 조합으로 이루어진 군으로부터 선택될 수 있는, 테그 서열과 연결될 수 있거나, 및/또는 CRISPR 폴리펩타이드는 DNA 닉카제로서 기능하는 변형된 CRISPR 펩타이드일 수 있거나, 및/또는 CRISPR 폴리펩타이드 또는 이의 촉매 활성 단편이 다른 기능성 모이어티, 바람직하게는 효소 기능을 가진 기능성 폴리펩타이드 모이어티, 바람직하게는 염색질 모델링 기능, 및/또는 상동성 재조합 자극, 및/또는 전사 변형 기능을 가진 기능성 모이어티와 융합된 분자 형태로 존재할 수 있다. 다세포 유기체의 조직에서 하나 이상의 변형된 세포를 분석할 경우, 상기한 테그 및 마커 단백질, 특히 복합 조직의 심부 층에서도 측정할 수 있도록 밝은 형광을 가진 형광 단백질 테그가 바람직하다. 적합한 형광 단백질들은 상업적으로 입수가능하며, 당업자에 의해 구체적인 목적에 따라 쉽게 선택될 수 있다.
본 발명의 다양한 구현예들에서, CRISPR 폴리펩타이드(들) 및/또는 하이브리드 CRISPR 핵산 서열/DNA 핵산 서열(들)은, 변형될 대상 게놈 DNA 서열을 포함하는 세포 구획으로 CRISPR 폴리펩타이드를 효율적으로 타겟팅하기 위해, 하나 이상의 핵 위치화 서열, 및/또는 플라스티드 위치화 서열, 예를 들어, 미토콘드리아 위치화 서열 또는 엽록체 위치화 서열을 포함할 수 있다. 이러한 위치화 서열에 대한 서열 조건들은 분자 생물학 분야의 당업자들에게 공지되어 있다. CRISPR 폴리펩타이드 또는 하이브리드 RNA/DNA 뉴클레오티드 서열의 기능을 방해하지 않도록, 위치화 서열은 융합되며, 즉, N-말단 또는 C-말단 파트에, 또는 해당 분자의 대응되는 5' 또는 3' 말단에 공유적으로 연결된다.
일 구현예에서, CRISPR 폴리펩타이드는 재조합 단백질 제조 기법을 이용하거나 또는 해당 아미노산 서열의 합성을 통해 생체외에서 제조된 폴리펩타이드 서열로서 제공될 수 있다. 다른 구현예에서, CRISPR 폴리펩타이드는 RNA 서열로서 존재하며, 이는 대상 타겟 세포로의 도입시 해당 아미노산 서열로 번역될 수 있다. 또 다른 구현예에서, CRISPR 폴리펩타이드는 대상 세포에서 안정적으로 발현 또는 일시적으로 발현되도록, DNA 구조체로서 삽입될 수 있으며, 이후 CRISPR 폴리펩타이드는 대상 타겟 세포에서 구성적인 방식 또는 유도성 방식으로 전사 및 번역된다. 본 발명에 따른 CRISPR 폴리펩타이드를 타겟 세포에 도입하기 위한 적합한 DNA 구조체 및 관련 방법들은 당해 기술 분야에 공지되어 있지만, 식물 세포에서 이러한 용도로 특수 개조된 본 발명의 특정 구현예에 따른 CRISPR 폴리펩타이드를 도입하기 위한 구체적인 방법은 이하에서 추가로 기술된다.
분자 복합체, 또는 이의 일부, 즉 하나 이상의 CRISPR 폴리펩타이드, 하나 이상의 CRISPR 핵산 서열 및 하나 이상의 RT, 또는 이를 코딩하는 구조체는, 적절한 전달 구조체를 이용해 대상 타겟 세포에 도입되어야 한다. 통상적으로, 전달 구조체의 타입은, 분자 복합체가 시험관내에서 완전히 조립된 다음 타겟 세포에 도입되는지, 또는 분자 복합체의 여러 구성성분들이 세포에 각각 도입된 후 대상 타겟 세포 내에서 비-공유적인 상호작용에 의해 복합체가 조립되는 지에 따라, 달라질 수 있다. 도입은 일반적으로 적합한 전달 구조체를 이용해 이루어진다.
본원에서, 본 발명의 여러가지 측면들에 대한 다양한 구현예들에서, 용어 "전달 구조체" 또는 "(전달) 벡터"는 대상 뉴클레오티드 및/또는 아미노산 서열을 타겟 진핵생물 세포로 수송하기 위한 카고로서 사용되는, 임의의 생물학적 또는 화학적, 또는 비-화학적 또는 입자를 이용한 수단 및/또는 방법을 지칭한다. 적합한 전달 구조체는, 타겟 세포에 뉴클레오티드 서열을 전달하기 위한 생물학적 수단, 예를 들어, 바이러스 벡터, 아그로박테리움 (Agrobacterium spp.), 세포-침투성 펩타이드 (CPP) 또는 화학적 전달 구조체, 예를 들어 나노입자, 나노결정, 지질 또는 폴리머성 소낭, 칼슘 포스페이트, 또는 이들의 조합물 등을 포함한다. 지질 또는 폴리머성 소낭은, 예를 들어, 지질, 리포좀, 지질 캡슐화 시스템, 나노입자, 예를 들어 메조포러스 실리카 나노입자, 소형 핵산-지질 입자 포뮬레이션, 폴리머, 예를 들어, 양이온성 폴리머, 예로, DEAE-덱스트란 또는 폴리에틸렌이민 및 폴리머좀으로부터 선택될 수 있다. 일 구현예에서, 폴리머는 선형 폴리머, 분지형 폴리머, 덴드리머 (다 분지형 유기 화합물 (highly branched organic compound)) 및 다당류로 이루어진 군으로부터 선택된다. 다른 구현예에서, 지질 캡슐화 시스템으로는 타겟 조직에 입자를 전달하는 친지성 화합물, 인지질, 콜레스테롤 및 폴리에틸렌 글리콜 (PEG)-지질 중 하나 이상을 포함한다. 다른 구현예에서, 전달 구조체는 메조포러스 실리카 나노입자일 수 있다. 나노입자 및 나노결정은 일반적으로 약 100 nm 미만, 약 50 nm 미만, 선택적으로 약 20 nm 미만, 일부 측면에서는 10 nm 미만의 소형 입자 크기를 가진다. 사용가능한 나노입자에 대한 비-제한적인 예로는 산화마그네슘, 및 금, 은 등을 포함하는 금속 기재의 나노입자 등이 있다. 적절한 활성 물질 나노결정은 자철석 (Fe3O4)을 포함한다.
예를 들어, 1,3-다이아미노프로판 측쇄 또는 1,2-다이아미노에탄 측쇄를 가지고 있는 폴리(아스파르트아미드) 유도체로부터 유래된 양이온성 복합체를 양이온성 폴리머로 사용할 수 있으며, 1,2-다이아미노에탄 측쇄는 최소화된 세포 독성으로 인해 일부 용도에 바람직할 수 있다 (Miyata et al., J. Am. Chem. Soc., 2008, 130(48):16287-94). DNA 및/또는 RNA의 세포 전달을 개선하기 위해, 해당 핵산은 손상으로부터 보호되어야 하며, 세포 도입이 용이하여야 한다. 이를 위해, 형질감염 과정 중에 부적절한 분해로부터 핵산을 보호하는 보호력을 가진 소위 리포플렉스 (lipoplexe) 및 폴리플렉스 (polyplexe)가 구축된 바 있다 (Tros de Illarduya et al., Eur. J. Pharm. Sci., 2010, 40(3):159-70). 양이온성 리포좀 또는 폴리머로부터 수득되는 이러한 복합체는, 바이러스 벡터 전달의 대안 방법이며, 특히 렌티바이러스 또는 AAC와 같은 바이러스 벡터와 관련된 염증 및 면역 반응의 문제가 바이러스 벡터의 높은 핵산 전달 효율을 이용하기에는 때때로 심각한, 유전자 테라피 분야에서 대안 방법이 된다. 핵산을 분해로부터 보호하고 높은 형질감염 효율을 달성하는 이의 특징들로 인해, 리포플렉스 및 폴리플렉스는 본 발명에 따른 임의의 하이브리드 핵산 또는 분자 복합체를 대상 세포에 전달하는데 적합한다.
본 발명에서, 임의의 전달 입자, 예를 들어, 미세입자 또는 나노입자는 다관능성 표면 도메인 (multiple functionalized surface domains)을 가질 수 있다. 입자는 표면; 복수의 제1 링커, 예를 들어, 각각 코어 구조의 표면에 결합하는 제1 말단 및 제1 관능기를 포함하는 제2 말단을 포함하는, 이형관능성 (heterofunctional) 링커; 및 복수의 제2 링커, 예를 들어, 각각 코어 구조의 표면에 결합하는 제1 말단 및 상기 제1 말단과 상이한 제2 관능기를 포함하는 제2 말단을 포함하는, 이형관능성 링커를 가진 코어 구조를 포함하며; 이들 링커는 해당되는 제1 말단을 통해 코어 구조의 표면에 결합되며 (코어 표면으로부터 바깥쪽으로 연장될 수 있음), 제1 관능기와 제2 관능기는 표면 도메인들로 된 외부 모자이크 (external mosaic)를 형성하되 각각의 도메인은 한가지 타입의 관능기를 주로 포함한다. 새로운 입자는 3종, 4종 이상의 복수의 링커를 포함할 수 있다. 일부 구현예에서, 제1 링커 및 제2 링커는 관능기가 다른 것을 제외하고는 동일할 수 있다. 특정 구현예들에서, 입자는 3개 이상의 서로 다른 링커를 포함할 수 있다. 다양한 구현예들에서, 링커는 지질, 계면활성제, 폴리머, 탄화수소 쇄 또는 양친매성 폴리머이거나 또는 이를 포함할 수 있다. 예를 들어, 링커는 폴리에틸렌 글리콜 또는 폴리알킬렌 글리콜이거나 또는 이를 포함할 수 있다. 특정 구현예들에서, 링커의 제1 말단은 폴리에틸렌 글리콜 (PEG)에 결합된 지질을 포함하고, 제2 말단은 PEG에 결합된 관능기를 포함한다.
특정 구현예들에서, 전술한 바와 같이 조합된 또는 멀티-도메인 전달 기법을 이용하는 형질감염 또는 형질전이 방법을 이용할 수 있다. 일 구현예에서, 하이브리드 핵산 서열, CRISPR 폴리펩타이드 또는 본 발명에 따른 분자 복합체를 대상 타겟 세포로 형질감염시키기에 적합한 전달 비히클을 제공하기 위해, 하나 이상의 CPP를 기능적인 방식으로 추가의 도메인과 결합시킬 수 있다. 따라서, 전달 비히클은, 구조체 또는 복합체의 대상 타겟 세포의 시토졸 또는 다른 구획으로의 형질감염/형질도입 효율을 높이기 위해, CPP 도메인에 연결된 엔도좀 리키지 도메인 (endosome leakage domain, ELD)을 포함할 수 있다. 일부 구현예에서, 전달 비히클은 엔도좀 탈출 (endosome escape) 및 세포질 구획 (cytoplasmic compartment)으로의 접근을 용이하게 하기 위한 엔도좀 리키지 도메인 (ELD)을 포함할 수 있다. 본원에서, "엔도좀 리키지 도메인"이라는 표현은 엔도좀에 포획된 (endosomally-trapped) 거대 분자가 세포질 구획으로의 접근성을 획득하는 능력을 부여하는 아미노산 서열을 의미한다. 이론으로 결부시키고자 하는 것은 아니지만, 엔도좀 리키지 도메인은, 엔도좀의 막을 불안정하게 만들어 엔도좀의 내용물을 세포질로 방출시키는 것을 유도하는 것으로 보이는, 짧은 서열 (종종 바이러스성 또는 박테리아성 펩타이드로부터 유래됨)이다. 본원에서, "엔도좀분해 펩타이드 (endosomolytic peptide)"는 엔도좀 막-불안정화 특성을 가진 펩타이드들로 된 이러한 일반적인 클래스를 지칭하는 것으로 의도된다. 즉, 일부 구현예에서, 본원의 합성 펩타이드 또는 폴리펩타이드-기반의 셔틀 물질은 엔도좀분해 펩타이드인 ELD를 포함할 수 있다. 본 발명에 따른 전달 비히클의 일부로서 사용하기에 적합한 ELD는 US 2016/0298078 A1에 기술되어 있으며, pH-의존적인 막 활성 펩타이드 (PMAP) 또는 pH-의존적인 세포분해 펩타이드와 같이 산성 pH에서 막을 파괴하는 펩타이드를 포함한다. 예를 들어, 펩타이드 GALA 및 INF-7은, 낮은 pH에서 함유된 아미노산의 전하에 변화가 발생하면, 알파 나선 구조를 형성하는 양친매성 펩타이드이다. 특히, 이론으로 결부시키고자 하는 것은 아니지만, GALA 등의 ELD는 pH 감소로 인한 입체구조적 변화에 따라 포어 형성 및 막 지질의 플립-플롭 (flip-flop)에 의해 엔도좀 리키지를 유발하는 것으로 시사되어 있다 (Kakudo, Chaki et al., 2004, Li, Nicol et al., 2004). 반면, INF-7과 같은 ELD는 엔도좀 막에 축적되어 불안정화를 유도함으로써 엔도좀 리키지를 유도하는 것으로 시사된다 (El-Sayed, Futaki et al., 2009). 이에, 엔도좀 성숙화 과정에서, 동시적인 pH 감소는 펩타이드의 구조에 변화를 유발하게 되며, 이는 엔도좀 막을 불안정하게 만들어 엔도좀 내용물의 방출을 유발한다. 동일한 원리가 슈도모나스 독소 A에도 적용되는 것으로 보인다 (Varkouhi, Scholte et al., 2011). pH 감소 후, 독소의 전좌 도메인의 입체구조가 변하게 되고, 이는 포어가 형성된 엔도좀 막에 삽입되게 된다 (London 1992, O'Keefe 1992). 이는 궁극적으로 엔도좀 불안정화 및 엔도좀의 복잡한 외측 전좌에 유익하다. 아울러, ELD는 선형의 양이온성 알파-나선형 항-미생물 펩타이드 (AMP)와 같은 항-미생물 펩타이드 (AMP) 또는 이러한 서열로부터 유래된 펩타이드일 수 있거나, 또는 ELD는 세크로핀-A/멜리틴 하이브리드 (CM 시리즈) 펩타이드 등의 항-미생물 펩타이드 (AMP) 또는 이 서열로부터 유래된 펩타이드일 수 있다. 이러한 펩타이드는 특히 막-파괴력을 가진, 가장 작고 가장 효과적인 AMP-유래 펩타이드로 간주된다. 세크로핀은 그람 양성 및 그람 음성 박테리아 둘다에 대해 막-교란 능력을 가진 항-미생물 펩타이드 패밀리이다. 최초로 동정된 항-박테리아 펩타이드인 세크로핀 A (CA)는 아미노산 37개로 구성된 선형 구조를 가진다. 멜리틴 (M)은 아미노산 26개로 이루어진 펩타이드로서, 벌침 독에서 발견된 세포 막 용해 인자 (cell membrane lytic factor)이다. 세크로핀-멜리틴 하이브리드 펩타이드는, 임의의 항-박테리아제로서 바람직한 특성인 진핵생물 세포에 세포독성이 없는 (즉, 비-용혈성), 짧고 효과적인 항생제 펩타이드를 형성하는 것으로 알려져 있다. 이들 키메라 펩타이드는, 세크로핀 A의 친수성 N-말단 도메인과 멜리틴의 소수성 N-말단 도메인으로 이루어진 다양한 조합들로부터 제조되었으며, 박테리아 모델 시스템에서 검증된 바 있다. 2종의, 26-mer, CA(1-13)M(1-13) 및 CA(1-8) M(1-18) (Boman et al., 1989)가, 넓은 스펙트럼을 가지며, 천연 세크로핀 A의 효과는 개선되었지만 멜리틴의 세포독성 효과는 없는 것으로, 확인되었다. 일부 구현예에서, ELD는 인플루엔자 헴어글루티닌 (HA)의 HA2 서브유닛의 N 말단으로부터 유래된 펩타이드일 수 있으며, 이는 또한 엔도좀 내에 축적될 경우 엔도좀 막의 불안정화를 유발할 수 있다.
본원에서, 그리고 본 발명에 따른 하나 이상의 분자 복합체 또는 하나 이상의 하이브리드 RNA/DNA 핵산 서열을 제공하는데 적합한, 물리적 도입 방법은, 전기천공, 미세주입법, 입자 총격, 초음파천공 (sonoporation), 자기주입법 (magnetofection) 또는 플라스미드 DNA로 관능화된 탄소 나노섬유 또는 실리콘 나노와이어 등의 연장된 나노구조 또는 나노구조 어레이를 이용한 임페일펙션 (impalefection)을 의미하며, 화학적 방법은 폴리에틸렌글리콜 (PEG) 등의 화학제 또는 미세입자 또는 나노입자의 사용에 의존할 수 있다.
예를 들어, 분자 복합체의 구성 성분들을 생체외에서 결합시키는 구현예에서, 전달 벡터는 지질-기반의 또는 폴리머성 벡터일 수 있다. 지질-기반의 또는 폴리머성 벡터는, 예를 들어, 지질, 리포좀, 지질 캡슐화 시스템, 미세입자, 위스커 (whisker), 나노입자, 소형 핵산-지질 입자, 폴리머 및 폴리머좀으로부터 선택될 수 있다. 일부 구현예에서, 폴리머는 선형 폴리머, 분지형 폴리머, 덴드리머 및 다당류로 이루어진 군으로부터 선택될 수 있다. 다른 구현예에서, 지질 캡슐화 시스템은 인지질, 콜레스테롤, 폴리에틸렌 글리콜 (PEG)-지질 및 타겟 세포에 입자를 전달하는 친지성 화합물 중 하나 이상을 포함한다.
포유류 세포의 경우, 다양한 치료학적 목적에 따른 면역 세포의 생체외 변형은, 특수 변형된 림프구, 바람직하게는 T 세포를 입양 전달함으로써 수종의 종양 질환을 퇴치하기 위해, 과거 수십년간 상당한 관심을 받아왔다. 특히, CD8+ T 세포 림프구가 이와 관련해 흥미로운 타겟이다. 하나의 나이브 T 세포, 싱글 일차, 및 비슷한 크기와 표현형 다양성을 획득한 싱글 이차 중심 기억 T 세포로부터 유래된 면역 반응은 비슷한 확률 변이 (comparable stochastic variation)를 겪게 되며, 궁극적으로, 3 세대에 걸친 연속적인 싱글-세포 입양 전달 및 감염-유도성 재-증식을 통해, CD8+ T 세포와 그 후대의 생체내 운명 맵핑에 의해 측정된 바와 같이, 박테리아 병원체의 치사 감염에 대한 면역성 (immunocompetence)을 재-구축할 수 있는 것으로, 공지된 바 있다 (Graf et al., Immunity, 41, 116-126, 2014). 조혈 세포로부터 신규 (de novo) 흉선 T 세포 발생 후, 완전히 성숙한 항원-특이적인 T 세포를 개체에서 장기간 동안 유지시킬 수 있으며, 이때 항원은 외부 항원, 예를 들어 바이러스 또는 암 세포 상에 발현된 항원일 수 있다. 이러한 작동자 T 세포 또는 이의 전구체의 타겟화된 변형은, 따라서, 면역요법에 적합한 T 세포를 제공하기 위한 중요한 전략이 된다. 나이브 T 세포는 줄기 세포 기억 T 세포로 지칭되는 단계를 통해 분화되어, 중심 기억 T 세포 및 작동자 기억 T 세포, 그리고 최종적으로 작동자 T 세포로 만들어지며, 작동자 T 세포는 궁극적으로 타겟 세포를 인지하여 파괴할 수 있는 최종 분화된 세포이다. 작동자 기억 및 작동자 T 세포는 말초 조직으로 이동할 수 있는 능력을 가진 T 세포의 아종이다. 또 다른 아종인 조직-체류성 기억 T 세포는, 더 이상 순환하지 않는 것으로, 현재 알려져 있다 (예, Farber et al., Nature Reviews Immunology, 14, 24-35, 2014).
또한, 암 면역요법에서, 재조합 종양-반응성 수용체를 발현하는 T 세포의 입양 전달이 치료-내성 악성을 치유할 수 있으며; 입양 전달 요법에 조작된 T 세포의 사용이 암, 특히 조혈 암에서 현저하게 유망한 것으로 입증된, 최초의 극적인 임상 사례들 중 일부가 제시되어 있다 (Brentjens et al., 2013; Grupp et al., 2013; Porter et al., 2011). 암 면역요법의 성공율을 높이기 위해, 점점 더 많은, 지정된 아종 및 표현형 구성을 가진 유전자 변형된 T 세포들이 사용되고 있다 (Riddell et al., Cancer J., 20(2), 141-144, 2014). 혈액 악성의 치료제로서, 그리고 고형 종양의 치료제로서 키메라 항원 수용체-변형된 T 세포의 사용이 점점 더 확대되고 있다. 이를 위해, T 세포는 종양-특이적인 키메라 항원 수용체 (CAR)를 발현하도록 변형된다 (예, Anurathapan et al., Molecular Therapy, 22, 623-633, 2014). 또한, 소위 2세대 CAR, 예를 들어, 항-종양 효과를 높이기 위해, T 세포의 재-타겟팅 및 리프로그래밍을 위한, CD28 또는 4-1BB 신호전달 도메인이 통합된, CD19-타겟팅 CAR이, 점점 더 중요해지고 있다 (예, Sjoukje et al., Nature Reviews Drug Discovery, 14, 499-509, 2015).
본 발명에 따른 하이브리드 핵산 서열 또는 분자 복합체가 높은 정확도로 게놈 편집을 매개하는데 적합한지를 검사하기 위해, 당해 기술 분야의 당업자들은 다양한 포유류 세포주 (접착 또는 현탁식 배양)를 이용할 수 있으며, ATCC (American Type Culture Collection) 또는 DSMZ (Leibniz Institute German Collection of Microorganisms and Cell Cultures)에서 입수할 수 있다. 세포주로는 HeLa, HEK293 세포, 예를 들어, HEK293T 및 HEK293A 세포, THP-1, CHO, NIH3T3, CA46, Balb3T3 및 HT2 세포 등이 있다. 또한, 본 발명에 따른 하이브리드 핵산 서열 또는 분자 복합체를 대상으로 대상 세포 타입에 대한 게놈 조작 능력을 조사하기 위해, 포유류로부터 일차 세포 배양물을 수득할 수 있다. 대상 세포 배양물을 배양 및 유지시키기 위한 배양 배지, 배양 조건 및 첨가제들은 다음과 같은 제조사의 지침에 따라 당업자들이라면 이용가능하다.
따라서, 본 발명에 따른 하이브리드 RNA/DNA 핵산 서열은, 바람직하게는, 질환을 치료하기 위해, 하나 이상의 포유류 세포를 생체내 또는 생체외에서 변형하기 위한 중요한 툴이다. 예를 들어, 림프구 세포, 더 바람직하게는, 모든 발생 단계의 T 세포 또는 자연 살상 (NK) 세포이며, 변형된 세포 또는 세포 집단을 치료학적인 용도로 사용하기에 유해할 수 있는 오프-타겟 효과를 방지하기 위해, T 세포 또는 NK 세포 증식, 생존 및 또는 기능에 영향을 주는 T 세포 또는 NK 세포 발현성 유전자를 높은 정확도로 변형할 수 있다.
마찬가지로, 본 발명에 따른 하이브리드 RNA/DNA 핵산 서열은 가축 또는 그외 동물 세포에서 유전 물질을 변형시키기 위한 유용한 툴일 수 있다. 예를 들어, 유전자 질환의 교정 또는 육류, 우유, 예를 들어, 락토스 함량이 저감된 우유, 또는 가축 또는 가금류에서의 난 생산 등의 유익한 특징들에 대한 편집 용도로 사용할 수 있다.
이에, 일 구현예에서, 본 발명에 따른 하이브리드 핵산 구조체를 하나 이상의 대상 면역 세포에 생체내 또는 생체외에서 도입하여, 질환, 바람직하게는 자가면역 질환, 예를 들어, I형 당뇨병 또는 류마티스 관절염, 또는 암과 같은 증식성 질환을 치료하는 단계를 포함하는, 동물의 면역 세포 집단을 구축하는 방법을 제공한다.
게놈 편집에서 타겟이 되는 대부분 식물 종에서 바람직한 조직은 미성숙 배, 배발생 캘러스 (embryogenic callus), 온전한 식물 (intact plant)의 분열조직, 화분, 화분관 또는 난세포, 현탁 세포 (suspension cell) 또는 그외 재생력을 가진 세포 타입이다. 일부 식물의 경우, 바람직한 조직은 프로토플라스트 또는 잎일 수 있다. 처리 후 완전한 식물로 재생시킬 수 있는 모든 세포가 바람직한 조직 또는 세포로 간주될 수 있다. 조직 준비, 재생 및 DNA 전달 프로토콜은 종, 조직 타입, 전달 방법 및 기타 인자들에 따라 달라진다. 공통적인 전달 방법은 DNA- 또는 단백질-코팅된 금 또는 텅스텐 입자를 세포에 발사하는 방법이다. 또 다른 전달 방법은 폴리에틸렌 글리콜 (PEG)-매개 형질감염, 전기천공, 바이러스 감염, 세포로의 직접 주입 및 아그로박테리움-매개 형질전환이다. 일부 식물의 경우, 전달은, 수정 후 즉시 암술대를 자르고, 절단된 화분관을 통해 편집 물질이 함유된 액체를 적용함으로써, 수정된 난세포에서 수행할 수 있다. 동물 세포, 바람직하게는 포유류 세포의 경우, 전기천공, 즉, 전기 펄스를 적용함으로써 세포 막에 일시적으로 작은 구멍을 만드는 방법에 기초한 형질감염 기법이, 본 발명에 따른 하나 이상의 분자 복합체를 도입하기 위한 적합한 방법이 될 수 있다. 당해 기술 분야의 당업자라면, 본 발명에 따른 하나 이상의 분자 복합체의 전달 툴로서 적합한, 포유류 일차 세포, 줄기 세포 등의 다수의 다양한 세포 타입들을 직접 형질감염 성공하기 위한 수종의 세포 타입 특이적인 프로토콜들을 입수할 수 있다. 전달에 적합한 2가지 이상의 방법 또는 물질의 조합이 편집시킬 게놈의 세포 타입에 따라 우수한 결과를 제공할 수 있으며, 이는 본 발명의 범위내에 포함됨에 유념하는 것이 중요하다.
바람직한 전달 방법은 CRISPR 핵산 서열-RT 하이브리드 핵산을 시험관내에서 조립한 다음 이를 시험관내에서 제조되고 선택적으로 정제된 CRISPR 폴리펩타이드에 로딩하여, 이를 대상 타겟 세포에 적용하는 방법이다. 그러나, 또 다른 사용가능한 전달 방법은, CRISPR 폴리펩타이드를, 선택적으로 추가의 조절 인자를 포함하는, mRNA로서 또는 유전자 DNA 구조체로서, 생체내 전사 및/또는 발현시키기 위한 하나 이상의 타겟 세포에, CRISPR 폴리펩타이드 전달과 동시에, 그 전에 또는 특히 그 이후에 하이브리드 핵산를 적용하여, 전달할 수 있다. CRISPR 핵산 서열이 RT 성분과 비-공유 결합된 경우, 이들 분자는 또한 개별적으로 전달될 수 있으며; CRISPR 핵산 서열은 생체내에서 전사될 수 있는 RNA 또는 DNA 발현 카세트로서 전달될 수 있다. 하나 이상의 CRISPR 폴리펩타이드 또는 하나 이상의 CRISPR 핵산 서열이 발현 카세트로서 전달되는 경우, 특히 타겟 세포가 식물 세포일 경우, RNA 또는 DNA 바이러스 레플리콘 또는 바이러스 벡터로부터 이를 발현시키는 것이 바람직할 수 있다.
하나 이상의 분자 복합체가 생체외에서 결합되는 본 발명의 제2 측면에 따른 바람직한 구현예에서, 복합체의 여러가지 구성 성분들, 즉, 하나 이상의 CRISPR 핵산 서열 및 하나 이상의 복구 주형 핵산을 포함하는 하나 이상의 하이브리드 핵산 뿐만 아니라 하나 이상의 CRISPR 폴리펩타이드는 화학적으로 또는 재조합 방식으로 생체외/시험관내에서 합성한 다음, 이들 여러 구성 성분들을 바람직하게는 조립하기 전에 정제한다. 추가적인 정제 단계는 본 발명에 따른 하나 이상의 분자 복합체를 조립한 이후에 수행할 수도 있다. DNA 및 RNA 등의 핵산, 또는 폴리펩타이드, 또는 리보뉴클레오- 및 리보핵단백질-복합체의 정제 방법들은 당업자들이 쉽게 이용가능하다. 선택적으로 시험관내에서 분석할 수 있는, 순도가 높은 화학량론적 분자 복합체를 제공함으로써, 효율이 우수한 정확한 게놈 편집 툴을 제공할 수 있다.
본 발명의 다양한 측면들에 대한 추가적인 구현예에서, 타겟화된 게놈 편집 이벤트의 효율을 추가로 높이기 위해, 하이브리드 RNA/DNA 핵산과 더불어, 플라스미드 또는 핵산 올리고뉴클레오티드 형태의 통상적인 복구 주형 핵산 서열을 사용할 수 있다. 통상적으로, 플라스미드 또는 다른 이중 가닥 DNA 복구 주형의 적용 여부, 또는 단일 가닥 올리고뉴클레오티드의 복구 주형으로서의 사용 여부를 결정하는 요소는, 도입시킬 의도한 변형의 크기에 의해 결정된다. 당업자라면, 본 발명에 따른 하이브리드 핵산 구조체와 함께 사용될 수 있는 추가적인 통상적인 복구 주형을 쉽게 규정할 수 있다. 이러한 통상적인 복구 주형은, 타겟 세포가 식물 세포일 경우, 전달 벡터, 예를 들어, 게미니바이러스 벡터에 의해, 또는 직접 형질감염 또는 도입에 의해, 본 발명에 따른 하이브리드 RNA/DNA 핵산 서열의 도입에 대해 본원에 상세히 기술된 바와 같이, 하나 이상의 대상 타겟 세포에 도입될 수 있다.
본 발명에 따른 추가적인 측면에서, 본 발명의 제2 측면에 따른 분자 복합체를 포함하는 구성 성분 하나 이상을 포함하며, 적절한 완충제 및 시약을 더 포함하는, 키트를 제공하며, 하나 이상의 분자 복합체는 사전-조립된 복합체로서 제공될 수 있거나, 또는 바람직하게는 하나 이상의 분자 복합체는, 하나 이상의 CRISPR 폴리펩타이드, 하나 이상의 CRISPR 핵산 서열 및 하나 이상의 복구 주형 핵산 서열을 포함하는, 개별 구성 요소의 형태로 제공될 수 있다. 분자 복합체의 여러가지 구성 요소들을, 바람직하게는 핵산 서열의 경우 건조된 또는 동결건조된 분말 형태로서, 개별 제공함으로써, 하이브리드 RNA/DNA 구조체의 핵산 서열의 높은 안정성을 보장할 수 있으며, 이는 특히 RNA 서열이 폴리펩타이드 보다 안정성이 훨씬 낮기 때문이다. CRISPR 단백질은, Cas9 폴리펩타이드의 경우, 예를 들어, 300 mM NaCl, 10 mM Tris-HCl, 0.1 mM EDTA, 1 mM DTT, 50% 글리세롤, pH 7.4를 포함하는 적합한 저장 완충제 중에, 25℃에서 전달될 수 있다. 본 키트는, 해당 CRISPR 폴리펩타이드의 활성에 필요한 적절한 이온, 예를 들어, Cas9 효소의 경우 Mg2+가 함유된 적절한 반응 완충제를 더 포함할 수 있다. 또한, 키트가 표지된 또는 변형된 구성 성분을 포함하는 구현예에서, 키트는, 대상 세포에 구성 성분을 형질감염시킨 후, 구성 성분의 결합 (공유 연결 또는 비-공유 결합)을 유도하거나 및/또는 보조하기 위한, 추가적인 완충제 및 화학제를 포함할 수 있다. 다른 구현예에서, 키트는 본 발명의 분자 복합체의 하나 이상의 구성 성분을 동시에 또는 후속적으로 대상 타겟 세포에 형질감염, 형질전이 또는 형질전환하기 위해, 본원에 기술된 전달 구조체 또는 비히클을 수용하는 용기를 포함할 수 있다. 다른 예로, 키트는 CRISPR 구성 성분들을 각각 동결건조된 mRNA 또는 동결건조된 단백질로서 포함할 수 있다. 이러한 측면에 대한 다른 구현예에서, 키트는, 분자 복합체로서 CRISPR 구성 성분(들)을 포함하는 구성 성분과 더불어, 적합한 전달 비히클 또는 전달 시스템을 제공하는, 추가의 구성 성분을 포함할 수 있다. 이러한 측면에 대한 다른 구현예에서, CRISPR 폴리펩타이드와 하이브리드 핵산 서열은 2 이상의 구성 성분들로 제공된다. CRISPR 폴리펩타이드는 대상 세포로 형질감염 또는 형질전환되는 벡터로서 제공될 수 있으며, 하나 이상의 CRISPR 핵산 서열 및 하나 이상의 복구 주형을 포함하는 하이브리드 핵산 서열은 개별 성분으로서 제공될 수 있다. 본 발명에 따른 키트는, 따라서, 2종 이상의 구성 성분을 제공할 경우, 여러가지 구성 성분들은 동시에 또는 순차적으로 사용하는 것이 적합할 수 있다. 선택적으로, 이러한 측면에 따른 키트는, 사용 설명서, 구체적으로 편집할 타겟 세포에 특이적인 사용 설명서를 포함할 수 있다. 본 발명의 이러한 측면에 대한 또 다른 바람직한 구현예에서, 키트는, 원하는 형질 변형을 달성하기 위해, 특수 툴 등의 특정 대상 식물에 대한 형질 발생 키트 (trait development kit)를 제공하도록, 특수 개발된다. 이러한 구현예에서, 키트는 식물 세포내 대상 DNA 타겟 유전자 좌에 대상 형질을 전달하도록 구성된, 특이적인 복구 주형을 포함한다. 또한, 키트는, 하나 이상의 CRISPR 핵산 서열과 분자 복합체로서 결합된, 적합한 CRISPR 효소 또는 2종의 CRISPR 닉카제를 포함하며, 이 CRISPR 핵산 서열은 제1 DNA 타겟 서열에 상보적인 하나 이상의 제1 서열 영역과, 하나 이상의 CRISPR 폴리펩타이드와 상호작용하도록 구성된 제2 서열 영역을 포함하며, 하나 이상의 CRISPR 핵산 서열은 특정한 대상 형질을 운반하는 복구 주형과 결합되거나 또는 결합될 수 있도록 구성된다. 이러한 구현예에 따른 키트는 식물 세포 뿐만 아니라 형질에 특이적이므로, 키트를 사용해, 대상 게놈 DNA 유전자 좌의 신속한 타겟팅 및 변형을 수행하여 형질 발현 (trait development)을 달성할 수 있는데, 그 이는 CRISPR 핵산 서열 구성 성분들이 대상 PAM 모티프 및 CRISPR 효소와 상호작용하도록 이미 설계되어 있고 제공된 복구 주형이 편리한 방식으로 삽입 또는 변형시킬 서열을 제시하기 때문이다.
본 발명에 따른 일 측면에서, 따라서, 본 발명의 제1 측면에 따른 하나 이상의 하이브리드 핵산 서열을 포함하거나 또는 이에 의해 편집된, 또는 본 발명의 제2 측면에 따른 하나 이상의 분자 복합체를 포함하는, 식물, 식물 세포, 식물 물질, 이의 파생물 또는 그 후대를 제공한다. 본 발명에 따른 추가적인 측면에서, 하이브리드 핵산 복합체로 변형된, 식물, 식물 세포, 식물 물질, 또는 이의 파생물 또는 후대를 제공한다.
본 발명에 따른 또 다른 측면에서, 본 발명은, (i) 대상 게놈 영역에, 하나 이상의 제1 DNA 타겟 서열과 하나 이상의 제2 DNA 타겟 서열을 포함하는, 하나 이상의 DNA 타겟 서열을 포함하는, 하나 이상의 원핵생물 또는 진핵생물 세포를 제공하는 단계; (ii) 본 발명의 제1 측면에서 상세히 기술된 하나 이상의 하이브리드 핵산 서열과 하나 이상의 CRISPR 폴리펩타이드를 포함하는, 본 발명의 제2 측면에서 상세히 기술된 하나 이상의 분자 복합체를 제공하는 단계; (iii) 하나 이상의 하이브리드 핵산 서열의 CRISPR 핵산 서열의 제1 서열 영역이 하나 이상의 제1 DNA 타겟 서열과 상보적인 염기 쌍 형성을 달성하기 위한 적절한 조건 하에, 하나 이상의 분자 복합체를 하나 이상의 DNA 타겟 서열과 접촉시켜, 하나 이상의 CRISPR 폴리펩타이드에 의해 제1 DNA 타겟 서열을 인지하고, 선택적으로 하나 이상의 CRISPR 폴리펩타이드에 의해 하나 이상의 DNA 절단을 유도하는 단계로서, 하나 이상의 하이브리드 핵산 서열의 하나 이상의 복구 주형 핵산 서열이 하나 이상의 제2 DNA 타겟 서열의 부위에서 상동성에 의한 복구를 지시하는 것인, 단계; 및 (iv) 하나 이상의 DNA 타겟 서열에 변형을 포함하는 하나 이상의 원핵생물 또는 진핵생물 세포를 수득하는 단계를 포함하는, 원핵생물 또는 진핵생물 세포에서 하나 이상의 DNA 타겟 서열을 변형시키는 방법을 제공한다.
일 구현예에서, 분자 복합체의 하나 이상의 하이브리드 핵산 서열은, 하나 이상의 분자 복합체의 하나 이상의 CRISPR 폴리펩타이드와 독립적으로, 하나 이상의 원핵생물 또는 진핵생물 세포에 제공될 수 있으며, 하나 이상의 원핵생물 또는 진핵생물 세포에서 하나 이상의 분자 복합체가 조립된다.
전술한 하나 이상의 분자 복합체는 시험관내에서 조립된 복합체로서 제공될 수 있으며, 이는 하나 이상의 대상 타겟에 도입된다. 다른 구현예에서, 하나 이상의 CRISPR 폴리펩타이드 및/또는 하나 이상의 CRISPR 핵산 서열 및/또는 하나 이상의 복구 주형 핵산 서열 중 일부 또는 전부는 RNA 또는 DNA 유전자 구조체로서 삽입될 수 있으며, 생체내에서 제조되어, 하나 이상의 복합체로의 최종적인 조립은 생체내에서 이루어질 수 있다. 바람직한 구현예에서, 하나 이상의 분자 복합체는 생체외에서 결합된 다음, 하나 이상의 CRISPR 폴리펩타이드, 하나 이상의 CRISPR 핵산 서열 및 하나 이상의 복구 주형 핵산 서열을 포함하는 하나 이상의 분자 복합체는, 하나 이상의 대상 DNA 타겟 서열을 포함하는 하나 이상의 타겟 세포에 하나 이상의 분자 복합체를 기능적으로 도입할 수 있는 적합한 전달 벡터에 의해 하나 이상의 세포에 동시적으로 공급된다.
본 발명에 따른 방법의 맥락에서, 본원에서 언급되는 "적절한 조건" 또는 "적절한 반응 조건"은, 형질전환 또는 제조 중인, 원핵생물 또는 진핵생물 세포 등의 세포 또는 유기체의 생장 및 발생을 모두 허용하는 조건, 그리고 하나 이상의 대상 세포 또는 유기체에서 대상 유전자 구조체의 안정적인 통합 또는 일시적인 도입을 달성하는데 필수적인 조건을 의미한다. 원핵생물 또는 박테리아의 생장 및/또는 형질전환을 촉진하기 위한 조건들은 당업자들에게 알려져 있다 (Green and Sambrook, Molecular Cloning, A Laboratory Manual, 2012, Cold Spring Harbor Laboratory Press 참조). 다양한 여러가지 세포주들에 따라, 동물 세포의 생장을 촉진하거나 및/또는 유전 물질을 동물, 특히 포유류 세포에 도입하기 위한 조건들 역시 당업자들이 이용할 수 있다 (상기 Green and Sambrook 문헌 참조). 특히 온도, 빛, 물, 산소, 미네랄 영양분 및 토양 지지체 등의, 식물 또는 식물 세포의 생장 및 발생을 촉진하기 위한 조건들은 여러 식물 종들에서 상이할 수 있으며, 본원에 제시된 내용에 대한 지식을 가진 당업자라면 쉽게 결정할 수 있다. 하나 이상의 대상 분자 복합체의 안정적인 통합 또는 일시적 도입을 달성하기 위해 적합한 또 다른 조건은, 하나 이상의 대상 분자 복합체를 도입하기 위해 선택된 형질전환 방법, 형질전환될 식물 물질 또는 식물 세포의 발생 단계, 및 도입시킬 하나 이상의 대상 분자 복합체에 따라 결정된다. 이러한 적절한 조건은 본 발명의 내용에 비추어 당업자에 의해 정해질 수 있으며, 본원에 기술 및 청구된, 예시적인 분자 복합체와 적절한 전달 벡터 및 전달 기법과 조합하여, 방법의 적절한 조건을 정할 수 있다.
본 발명의 상기한 방법에 대한 일 구현예에서, 하나 이상의 진핵생물 세포는 식물 세포이며, 바람직하게는, 호르데움 불가리 (Hordeum vulgare), 호르데움 불부숨 (Hordeum bulbusom), 소르굼 비콜러 (Sorghum bicolor), 사카룸 오피시나리움 (Saccharum officinarium), 지 메이스 (Zea mays), 세타리아 이탈리카 (Setaria italica), 오리자 미누타 (Oryza minuta), 오리자 사티바 (Oriza sativa), 오리자 아우스트랄리엔시스 (Oryza australiensis), 오리자 알타 (Oryza alta), 트리티쿰 에이스티붐 (Triticum aestivum), 트리티쿰 두럼 (Triticum durum), 세칼레 세레알레 (Secale cereale), 트리티칼레 (Triticale), 말루스 도메스티카 (Malus domestica), 브라키포듐 디스타키온 (Brachypodium distachyon), 호르데움 마리눔 (Hordeum marinum), 에이길롭스 타우치이 (Aegilops tauschii), 다우쿠스 글로키디아투스 (Daucus glochidiatus), 베타 불가리스 (Beta vulgaris), 다우쿠스 푸실루스 (Daucus pusillus), 다우쿠스 무리카투스 (Daucus muricatus), 다우쿠스 카로타 (Daucus carota), 유칼립투스 그란디스 (Eucalyptus grandis), 니코티아나 실베스트리스 (Nicotiana sylvestris), 니코티아나 토멘토시포르미스 (Nicotiana tomentosiformis), 니코티아나 타바쿰 (Nicotiana tabacum), 니코티아나 벤타미아나 (Nicotiana benthamiana), 솔라눔 라이코퍼시쿰 (Solanum lycopersicum), 솔라눔 투베로숨 (Solanum tuberosum), 코페아 카네포라 (Coffea canephora), 비티스 비니페라 (Vitis vinifera), 에리트란테 구타타 (Erythrante guttata), 겐리시아 아우레아 (Genlisea aurea), 쿠쿠미스 사티부스 (Cucumis sativus), 모루스 노타빌리스 (Morus notabilis), 아라비돕시스 아레노사 (Arabidopsis arenosa), 아라비돕시스 라이라타 (Arabidopsis lyrata), 아라비옵시스 탈리아나 (Arabidopsis thaliana), 크루시히말라야 히말라이카 (Crucihimalaya himalaica), 크루시히말라야 발리치이 (Crucihimalaya wallichii), 카르다민 플렉수오사 (Cardamine flexuosa), 레피디움 비르기니쿰 (Lepidium virginicum), 캡셀라 부르사 파스토리스 (Capsella bursa pastoris), 올마라비돕시스 푸밀라 (Olmarabidopsis pumila), 아라비스 히르수테 (Arabis hirsute), 브라씨카 나푸스 (Brassica napus), 브라씨카 올레라시아 (Brassica oleracea), 브라씨카 라파 (Brassica rapa), 라파누스 사티부스 (Raphanus sativus), 브라씨카 준카시아 (Brassica juncacea), 브라씨카 니그라 (Brassica nigra), 에루카 베시카리아 아종 사티바 (Eruca vesicaria subsp. sativa), 시트러스 시넨시스 (Citrus sinensis), 자트로파 쿠르카스 (Jatropha curcas), 포풀루스 트리코카르파 (Populus trichocarpa), 메디카고 트룬카툴라 (Medicago truncatula), 시져 야마시타 (Cicer yamashitae), 시져 비주굼 (Cicer bijugum), 시져 아리에티눔 (Cicer arietinum), 시져 레티쿨라툼 (Cicer reticulatum), 시져 주다이쿰 (Cicer judaicum), 카야누스 카자니폴리우스 (Cajanus cajanifolius), 카자누스 스카라바에오이데스 (Cajanus scarabaeoides), 파세올루스 불가리스 (Phaseolus vulgaris), 글리신 맥스 (Glycine max), 고씨퓸 (Gossypium sp.), 아스트라갈루스 시니쿠스 (Astragalus sinicus), 로투스 자포니카스 (Lotus japonicas), 토레니아 포우르니에리 (Torenia fournieri), 알리움 세파 (Allium cepa), 알리움 피스툴로숨 (Allium fistulosum), 알리움 사티붐 (Allium sativum), 헬리안투스 안누스 (Helianthus annuus), 헬리안투스 투베로수스 (Helianthus tuberosus) 및 알리움 투베로숨 (Allium tuberosum), 또는 전술한 식물들 중 하나에 속하는 임의 품종 또는 아종로 이루어진 군으로부터 선택되는 식물의 식물 세포이다.
타겟으로서 식물 세포를 고려할 경우, 예를 들어, 당해 기술 분야의 당업자라면 다양한 형질전환 및/또는 형질감염 방법들을 이용할 수 있다. 옥수수 프로토플라스트의 경우, 예를 들어, 적절한 방법은 Sheen, J. 2002. A transient expression assay using maize mesophyll protoplasts에 기술되어 있다. 아라비돕시스 프로토플라스트의 경우, 적절한 프로토콜은 http://dx.doi.org/10.1038/nprot.2007.199에서 이용가능하다. 담배 또는 그외 쌍떡잎 식물의 프로토플라스트의 경우, 적절한 프로토콜은 www.plantphysiol.org/cgi/doi/10.1104/pp.112.205179에서 입수가능하다. 본 발명의 내용에 대한 지식과 인용된 프로토콜을 인지하고 있는 당업자라면, 따라서, 본 발명에 따른 분자 복합체를 외떡잎 또는 쌍떡잎 식물로부터 파생된 식물 프로토플라스트에 도입하기 위한 적절한 방법을 결정할 수 있다.
프로토플라스트는 유전자 편집 기술 및 시약을 테스트하는데 매우 유용하지만, 유전자 편집된 식물을 재생시키는 경우, 극소수의 식물 종만 프로토플라스트로부터 효율적으로 재생되기 때문에, 항상 바람직한 세포 타입인 것은 아니다. 이 경우, 대부분의 식물 종들에서 바람직한 조직은 미성숙 배, 배발생 캘러스, 수정된 배, 온전한 식물의 분열 조직, 화분, 화분관 또는 난 세포, 배아성 현탁 세포 또는 그외 재생력을 가진 세포 타입이다. 공통적인 물질적 전달 방법은 DNA- 또는 단백질-코팅된 금 또는 텅스텐 입자를 세포에 발사하는 방법이며, 일반적인 생물학적 지원 방법은 아크로박테리움 또는 본원에 기술된 (변형된) 바이러스 벡터를 사용하는 방법이다.
본 발명에 따라 언급되는 "분열조직 세포(들)"는, 또한, 분열 조직 또는 형성층 (cambium) 또는 형성 조직 (formative tissue)을 지칭하는, 식물의 조직 타입에 속한다. 동물 유기체의 줄기 세포와 같이, 미분화된 세포인 식물의 분열 조직 세포는, 유전적 소인과 추가적인 환경적 및 발생적 요인에 따라, 특수 세포 타입으로 발생 및 분화할 수 있는 내재된 능력을 가지고 있다. 식물 유기체에서, 분열 조직은 배 발생 중에 존재할 뿐만 아니라 식물의 전체 생활 주기 (life cycle) 중에도 발견될 수 있으므로, 본 발명에 따른 분열 조직 세포 또는 조직의 타겟화된 유전자 변형은 식물 배 또는 묘목으로 한정되지 않으며, 오히려, 예를 들어, 식물의 생식 기관, 예를 들어, 옥수수의 경우 수이삭 (tassel) 또는 암이삭 (ear)에 대한 토대를 구축하는 분열 조직을 타겟팅할 경우, 더 큰 묘목과 보다 성숙한 식물에서 수행될 수 있다.
본 발명에 따른 다양한 측면에 대한 일 구현예에서, 분열 조직 세포는 하나 이상의 분열 조직 세포 또는 분열 조직을 포함하는 식물의 식물 배 또는 묘목의 성숙한 또는 미성숙한 식물 세포일 수 있다.
일부 게놈 편집 방식에서는, 원하는 대상 구조체 또는 이의 일부를 보유한 형질전환 유기체가 안정적으로 삽입된 구조체를 처음에 형질전환 또는 형질감염된 대상 식물 세포의 후대로 전달할 수 있을 경우, 발현 카세트(들)를 코딩하는 분자 복합체를 안정적으로 통합하는 것이 바람직할 수 있다. 안정적인 통합은 유기체, 바람직하게는 진핵생물 유기체의 임의의 게놈 영역, 예를 들어, 핵 게놈 뿐만 아니라 핵외 게놈, 예를 들어 플라스티드 게놈에서 이루어질 수 있다.
일부 효과는 대상 분자 복합체 또는 이의 일부의 도입에 의해 요망되지만, 구조체 자체는 처음에 세포의 후대로 유전되지 않아야 할 경우에는, 일시적인 도입이 바람직할 수도 있다. 이러한 방식은, 규제로 인해, 특히 변형될 DNA 타겟 서열을 포함하는 구조로서 식물 세포, 조직, 기관 또는 물질을 이용하는 일부 용도에서는, 특히 적합할 수 있다.
본원에서, 용어 "타겟화된 통합" 또는 "기능적인 통합"은, 전사 및/또는 번역 및/또는 촉매 활성 및/또는 결합 활성, 예를 들어, 핵산 분자의 다른 핵산 분자, 예를 들어, DNA 또는 RNA에의 결합, 또는 하나 이상의 세포 내에서 단백질의 다른 구조에의 결합을 허용하는, 대상 유전자 구조체의 하나 이상의 세포로의 통합을 의미한다. 적절할 경우, 기능적인 통합은, 핵, 사이토졸, 미토콘드리아, 엽록체, 액포 (vacuole), 막, 세포 벽 등을 비롯한, 하나 이상의 세포의 특정 세포 구획에서 이루어진다. 즉, 용어 "기능적인 통합"은, 전술한 용어 "안정적인 통합"과 대비되며, 대상 분자 복합체가 하나 이상의 세포로, 아그로박테리움 형질전환 등의 생물학적인 수단, 또는 입자 총격 등의 물리적인 수단에 의한 형질감염, 형질전환 또는 형질전이 및 후속적인 단계에 의해 도입되며, 분자 복합체는 이것이 도입된 하나 이상의 세포 내에서 또는 세포에 대해 그 효과를 발휘한다. 도입할 유전자 구조체의 특성에 따라, 이러한 효과는 물론 달라질 수 있으며, 그 예로는, 단독으로 또는 조합된 형태의, 특히, 유전자 구조체에 의해 코딩된 DNA의 리보핵산으로의 전사, RNA의 아미노산 서열로의 번역, RNA 간섭에 사용하기 위한 miRNA 또는 siRNA, 또는 가이드 RNA, crRNA, tracrRNA의 활성을 포함하는, 세포 내에서의 RNA 분자의 활성, 및/또는 핵산 분자의 다른 핵산 분자, 예를 들어, DNA 또는 RNA에의 결합 또는 하나의 세포 내에서 단백질의 타겟 구조에의 결합, 또는 벡터 또는 유전자 구조체를 통해 전달된 서열의 일시적인 또는 안정적인 방식의 통합 등이 있다. 또한, 이러한 효과는 하나 이상의 세포 등의 내부에서 효소 또는 이의 촉매 활성 영역을 나타내는 아미노산 서열의 촉매 활성을 포함할 수 있다. 본 발명에 따른 분자 복합체의 기능적인 통합 후 달성되는 효과는, 당해 기술 분야의 당업자에 공지된 바와 같이, 대상이 되는 유전자 구조체에 포함된 조절 서열 또는 위치화 서열의 존재에 따라, 결정될 수 있다.
전술한 바와 같이, 만능성 또는 다능성 세포를 타겟팅하는 본 발명에 따른 방법은, 형질전환 및 형질전환된 하나 이상의 세포, 구체적으로 분열 조직 세포의 추가적인 발생이 모두 식물 (in planta)에서 이루어져, 식물 또는 이로부터 유래된 식물 물질을 재생시키기 위한 번거러운 시험관내 배양 단계들이 필요없는, 이점을 제공해준다. 그러나, 특정 구현예에서, 특별한 요구 조건에 따라서는, 추가적인 배양, 스크리닝 또는 테스트를 위해 식물 세포, 조직, 기관 또는 물질을 외식 (explant) 또는 분석 (dissect)하는 것이 적합할 수도 있다. 식물 세포, 조직, 기관 또는 물질을 시험관내 배양하기 위한 몇가지 방법들은 당업자라면 이용가능하다.
따라서, 형질전환 식물에 탑재된 바람직한 대상 구조체 또는 이의 일부가 안정적으로 삽입되고, 삽입된 구조체 또는 그 일부가 처음에 형질전환된 대상 식물 세포의 후대로 유전되는 경우, 안정적인 통합이 바람직할 수 있다. 이러한 안정적인 통합은, 핵 게놈 및 핵외 게놈, 예를 들어 식물 세포의 플라스티드 게놈 등의, 식물의 모든 게놈 영역에서 발생할 수 있다.
일시적인 도입은, 특정 효과, 예를 들어, 침묵 효과 (silencing effect), 넉인 또는 넉아웃을 포함하는 타겟화된 조작이, 대상 유전자 구조체 또는 그 일부의 도입에 의해 요망되지만, 구조체 자체는 처음에 형질전환, 형질감염 또는 형질전이된 세포의 후대로 유전되어서는 안되는 경우에, 바람직할 수 있다.
본 발명에 따른 전술한 측면에 대한 또 다른 구현예에서, CRISPR 핵산 서열 및/또는 RT 등의, 하나 이상의 대상 분자 복합체 또는 그 일부의 도입은, 유전자 총, 예를 들어, 휴대형 (hand-held) 유전자 총 (예, Helios® Gene Gun System, BIO-RAD) 또는 고정형 유전자 총 등의, 입자 총격에 적합한 장치, 아그로박테리움 spp. 또는 바이러스 벡터를 이용한 형질전환 등의 형질전환, 미세주입, 전기천공, 실리콘 카바이드 위스커 기술 등의 위스커 기술, 및 화학적, 예를 들어 칼슘 포스페이트를 이용한 화학제, 덴드리머, 리포좀 또는 양이온성 폴리머, 및 비-화학제, 예를 들어, 전기천공, 초음퍼천공, 레이저를 이용한 광학적 형질감염, 프로토플라스트 융합, 임페일펙션, 전달 구조체의 동물, 바람직하게는 설치류 동물의 장기, 바람직하게는 간으로의 주입에 의한 DNA의 하이드로다이나믹 유전자 전달, 형질감염 또는 이들의 조합으로 이루어진 군으로부터 선택되는 수단을 이용해 수행될 수 있다.
특정 구현예들에서, 하나 이상의 진핵생물 세포는 식물의 분열 조직 세포일 수 있으며, 식물 세포는, 본 발명에 따른 분자 복합체의 도입 후, 꽃의 성숙 발생 단계에 도달하여 본 발명에 따른 하나 이상의 분자 복합체에 의해 매개되는 목적한 변형을 포함하는 식물 또는 식물 물질을 수득할 때까지, 적절한 조건 하에 추가로 배양된다. 당해 기술 분야의 당업자는, 예를 들어, Pareddy DR et al. (1992) Maturation of maize pollen in vitro. Plant Cell Rep 11 (10):535-539. doi:10.1007/BF00236273, Stapleton AE et al. (1992) Immature maize spikelets develop and produce pollen in culture. Plant Cell Rep 11 (5-6):248-252 또는 Pareddy DR et al. (1989) Production of normal, germinable and viable pollen from in vitro-cultured maize tassels. Theor Appl Genet 77 (4):521-526에서, 예시된 바와 같이, 시험관내 배양된 수이삭으로부터 발아가능하고 생존가능한 화분을 생산하기 위한 몇가지 프로토콜들을 이용할 수 있다. 이들 프로토콜은, 특히, 수이삭 절개, 표면 살균 및 수이삭 증식 및 성숙을 촉매하기 위해 키네틴이 첨가된 배지에서의 배양을 기반으로 한다. 소수 (spikelet) 형성 후, 지속적인 꽃밥 수확을 수행할 수 있다. 압출 (extrusion) 후, 화분이 떨어질 때까지 꽃밥을 건조시킨다. 다른 구현예로, 꽃밥을 건조시킬 수 있으며, 화분을 액체 매질로 떨어뜨려, 이후 암이삭 (ear)을 수분시키는데 사용한다.
본원에서, "꽃의 성숙 (maturity)"은, 하나 이상의 분열 조직 세포를 포함하는 식물의 미성숙 꽃이 발생 단계에 도달한 상태, 성숙한 꽃, 즉 수꽃 차례 (staminate inflorescence)(웅성) 또는 암꽃 (pistillate inflorescence)(자성)이 형성되어, 화분 (웅성) 또는 밑씨 (자성) 또는 둘다가 존재하는 상태를 의미한다. 수득되는 식물 물질은 추가의 식물의 수분 또는 또 다른 식물의 화분을 이용한 수정에 직접 사용될 수 있으므로, 이러한 식물 번식 단계가 특히 중요하다.
본 발명의 전술한 방법에 따른 다른 구현예에서, 하나 이상의 DNA 타겟 서열의 변형은, 수확율 개선, 건조 스트레스, 삼투성 스트레스, 열 스트레스, 한랭 스트레스, 산화 스트레스, 중금속 스트레스, 염 스트레스 또는 침수 (waterlogging) 등의 비-생물적 스트레스에 대한 저항성, 곤충 내성, 박테리아 내성, 바이러스 내성, 진균 내성 또는 선충 내성 등의 생물 스트레스에 대한 저항성, 글리포세이트, 글루포시네이트, 아세토락테이트 신타제 (ALS) 저해제 및 Dicamba 등의 제초제 저항성, 내도복성 (lodging resistance), 개화 시기, 내탈립성, 종자 색, 배젖 조성, 영양분 함량, 또는 하나 이상의 식물 세포에서 분자 조작 기법 (molecular pharming approach)을 허용하는 게놈 편집 등의 대사 조작으로 이루어진 군으로부터 선택되는, 게놈 편집 기법일 수 있다.
본 발명의 상기한 방법에 대한 다른 구현예에서, 하나 이상의 DNA 타겟 서열의 변형은, 바이러스 질환의 치료 또는 면역요법, 특히 암 면역요법에 적합한 변형된 세포를 수득하기 위한, 하나 이상의 진핵생물 세포, 바람직하게는 포유류 세포, 바람직하게는 포유류 백혈구에서 면역 세포를 생체외 변형시키는 게놈 편집 방법일 수 있다.
바람직한 일 구현예에서, 본 발명에 따른 상기한 방법은, 진핵생물 세포, 바람직하게는 하나 이상의 식물 세포를, 유전자 변형된, 바람직하게는 비-형질전환 식물을 제공하기 위한 타겟화된 방식으로 변형시키는 방법으로서, 이 방법은 특히 형질 발현 (trait development) 방법일 수 있다. 예를 들어, 식물 유전자의 코딩 서열에서, 1, 2, 3 또는 그 이상의 뉴클레오티드의 부위 고-특이적인 치환을 도입하여, 글리포세이트, 글루포시네이트, Dicamba 또는 아세토락테이트 신타제 (ALS) 저해 제초제와 같은 하나 이상의 제초제에 대해 저항성을 부여하는 하나 이상의 아미노산의 치환을 달성할 수 있다. 또한, 다른 구현예에서, 뉴클레오티드 결합 부위-루신-풍부 리피트 (NBS-LRR) 식물 유전자의 코딩 서열에서 하나 이상의 아미노산을 치환하면, 식물의 질병 내성을 최적화하도록 단백질의 병원체 인지 스펙트럼이 변이될 것이다. 또 다른 구현예에서, 소형 인핸서 서열 또는 전사 인자 결합 부위가, 식물 유전자의 내인성 프로모터 내에서 변형될 수 있거나, 또는 프로모터에 의해 조절되는 식물 유전자의 발현 프로파일 또는 강도를 변형시키기 위해 식물 유전자의 프로모터에 도입될 수 있다. 발현 프로파일은 다양한 영역, 예를 들어, 인트론, 3' 비-번역 영역, cis- 또는 trans- 인핸서 서열에서의 다양한 변형, 도입 또는 결손을 통해 변형될 수 있다. 또 다른 구현예에서, 식물 세포, 바람직하게는 분열조직 식물 세포의 게놈은, 변형된 분열조직 세포에서 기원한 식물이 화학 물질 또는 작물학적 또는 약리학적 관심 물질, 예를 들어, 인슐린 또는 인슐린 유사체, 항체, 원하는 효소 기능을 가진 단백질 또는 약제로서, 식이 보충제로서 또는 건강 관리 제품으로서 적합한 임의의 그외 약리학적으로 적절한 화합물을 생산할 수 있는 방식으로, 변형될 수 있다.
본 방법에 의해 도입될 수 있는 형질에 대한 비-제한적인 예는, 해충, 예를 들어, 뿌리 벌레 (rootworm), 줄기를 파먹는 벌레 (stem borer), 뿌리를 잘라 먹는 벌레 (cutworm), 딱정벌레, 진딧물, 매미충 (leafhopper), 바구미 (weevil), 응애 (mite) 및 노린재 (stinkbug)에 대한 저항성 또는 내성이다. 이는 식물 유전자의 변형에 의해, 예를 들어, 식물의 선천적인 해충 저항성을 높이거나 또는 해충 유인성 (attractiveness)을 낮추기 위한 변형에 의해 이루어질 수 있다. 그외 형질로는 선충류, 박테리아, 진균 또는 바이러성 병원체 또는 이의 벡터에 대한 저항성 또는 내성일 수 있다. 또 다른 형질은 보다 효율적인 영양소 사용, 예를 들어, 강화된 질소 사용, 질소 고정 효율 개선 또는 도입, 광합성 효율 강화, 예를 들어 C3 식물의 C4로의 변환일 수 있다. 또 다른 형질은 온도, 물 공급, 염도, pH, 극심한 태양광 노출에 대한 내성 (tolerance for extremes in sunlight exposure)과 같은 비-생물적 스트레스에 대한 내성 강화일 수 있다. 추가적인 형질은 식물의 식용 또는 섭취가능한 부위의 맛, 외양, 영양 또는 비타민 프로파일과 관련있는 특징일 수 있거나, 또는 이러한 부위의 저장 수명 또는 품질과 관련있을 수 있다. 마지막으로, 형질은 도복 (lodging) 저항성, 탈립 (shattering), 개화기, 숙성, 출아 (emergence), 수확, 식물 구조, 활력 (vigor), 크기, 수율 및 그외 특징과 같은 농경학적 품질과 관련있을 수 있다.
본 발명에 따른 전술한 방법에 대한 일 구현예에서, 타겟 세포는 원핵생물 세포일 수 있으며, 변형은 하나 이상의 원핵생물 세포의 대상 게놈 타겟 영역의 하나 이상의 변형을 포함하여, 여기서 변형은 항생제에 대한 저항성을 비롯하여 생물적 또는 비-생물적 스트레스에 대한 박테리아의 저항성을 조절 또는 증가시키는데 적합하거나, 또는 변형은 하나 이상의 원핵생물 세포의 파지 저항성을 개선하는데 적합하다. 다른 구현예에서, 변형은 하나 이상의 대상 원핵생물 세포의 DNA 타겟 부위에 대상 유전자를 삽입하는 것, 예를 들어, 형광 마커 단백질 또는 다른 선별 마커를 코딩하는 삽입 서열을 하나 이상의 대상 DNA 타겟 부위에 삽입하는 것을 포함할 수 있다. 다른 구현예에서, 변형은 하나 이상의 원핵생물 세포에서 하나 이상의 대상 DNA 타겟 부위를 넉-아웃, 즉 제거하는 단계를 포함한다. 원핵생물 세포는 추가로 분화되지 않지만, 그 후대로 하나 이상의 대상 도입 변형을 직접 유전시킬 수 있으며, 원핵생물 세포는 일반적으로 진핵생물 세포와 비교해 세대 시간 (generation time)이 매우 짧기 때문에, 본 발명에 따른 하나 이상의 분자 복합체 형태로 하나 이상의 하이브리드 RNA/DNA에 의해 도입되는 변형이 신속하게 달성될 수 있으며, 제조되는 변형된 세포 집단을 매우 짧은 시간 동안 수득 및 분석할 수 있다.
특정 구현예에서, 본 발명에 따른 상기한 방법은, (v) 하나 이상의 DNA 타겟 서열에 변형을 포함하는 하나 이상의 원핵생물 또는 진핵생물 세포를 동정 및/또는 선별하는 단계를 더 포함할 수 있다.
하나 이상의 원핵생물 또는 진핵생물 세포의 게놈에서 달성된 본 발명에 따른 변형을 분석 또는 동정하는 방법은 당해 기술 분야의 당업자들에게 공지되어 있으며, 비-제한적으로, 특히 실시간 정량적인 PCR, 멀티플렉스 PCR, RT-PCR, nested PCR, 분석용 PCR 등의 중합효소 연쇄 반응 (PCR), 명시야 및 암시야 현미경 검경법, 분산 염색 (dispersion staining), 위상차 (phase contrast), 형광, 공초점, 차등 간섭 위상차, 디콘볼루션 (deconvolution), 전자 현미경 검경법, UV 현미경 검경법, IC 현미경 검경법, 스캐닝 프로브 현미경 검경법 등의 현미경 검경법, 세포의 대사 산물 분석, 변형된 세포의 저항성 스펙트럼 변화 분석, RNA 분석, 프로테옴 분석, 예를 들어, 대상 마커 유전자 또는 전이유전자, 또는 넉-아웃의 기능적인 통합을 확인하기 위한 기능성 분석, 서든 블롯 분석, 딥 서열분석 (deep sequencing) 등의 서열분석 및 이들의 조합을 포함한다. 원하는 변형을 포함하는 세포는 이후 추가적인 배양 또는 임의의 기타 하류 제조 단계를 위해 선별될 수 있다.
본 발명은, 다른 측면에서, (i) 하나 이상의 진핵생물 세포가 식물 세포인, 진핵생물 세포에서, 전술한 바와 같이, 하나 이상의 DNA 타겟 서열을 변형시키는 방법을 수행하는 단계; (ii) 단계 (i)에서 수득되는 하나 이상의 식물 세포로부터 하나 이상의 식물 또는 그 후대를 수득하는 단계; (iii) 선택적으로, 상기 하나 이상의 식물 또는 그 후대의 하나 이상의 세포에서 하나 이상의 DNA 타겟 서열에서 변형을 확인하는 단계를 포함하는, 식물 또는 식물 세포를 제조하는 방법을 제공한다.
이러한 측면을 수행하는데 적합한 식물 세포, 조직, 기관 및 물질은 전술한 바와 같다. 본 발명에서 용어 "제조하는"은 광의적으로 해석되어야 하며, 식물 또는 식물 세포의 유전 물질에 수행되는 임의 형태의 유전자 조작을 포함한다. 하나 이상의 CRISPR 핵산 서열 및 하나 이상의 복구 주형 핵산을 포함하는 하나 이상의 하이브리드 핵산 서열과 하나 이상의 CRISPR 폴리펩타이드를 포함하는, 하나 이상의 분자 복합체의 제공은, 전술한 바와 같은 여러가지 구성 성분들의 일시적 작용 또는 안정적인 통합 또는 이들의 조합을 허용하는 방식으로, 이루어질 수 있다. 바람직하게는, 하나 이상의 분자 복합체 또는 이의 서로 다른 구성 성분들은, CRISPR RNA를 코딩하는 서열, 복구 주형 핵산 DNA를 코딩하는 서열 및 CRISPR 폴리펩타이드를 코딩하는 서열을 비롯하여, 이들 임의의 작동자 구성 성분들이 대상 타겟 세포의 게놈에 통합되지 않는, 일시적인 방식으로 제공된다.
본 발명에 따른 상기 제조 방법에 대한 일 구현예에서, 하나 이상의 식물 또는 식물 세포는 외떡잎 또는 쌍떡잎 식물로부터 선택될 수 있으며, 바람직하게는, 식물은 지 메이스 (Zea mays) 등의 Zea spp., 니코티아나 벤타미아나 (Nicotiana benthamiana) 또는 베타 불가리스 (Beta vulgaris) 등의 Beta spp, 또는 세칼레 세레알 (Secale cereal) 등의 Secale spp., 또는 트리티쿰 에이스티붐 (Triticum aestivum) 등의 Triticum spp.로 이루어진 군으로부터 선택된다.
본원 전체에 상세히 기술된 바와 같이, 기능적인 방식으로 결합되는 하이브리드 RNA/DNA 구조체를 이용하는 방법의 핵심은 종 및 세포 독립적이라는 것이므로, 본 발명에 따른 방법은, 적어도 CRISPR 핵산 서열 및 하나 이상의 RT에 대한 공유 또는 비-공유 상호작용에 의해 이루어지더라도, 세포에서 상동적인 재조합에 의한 DNA 복구 기전이 존재하는 한, 모든 생명계에 속하는 타겟 세포에 적합하며 적용할 수 있다. 각 타겟 세포 및 각 타겟에서 각각 확인되어야 하는 사항은, (i) CRISPR 핵산 서열 및 CRISPR 폴리펩타이드가 전술한 바와 같이 상용가능하여야 (compatible) 하며; (ii) 대상 CRISPR 핵산 서열이 대상 DNA 타겟 영역 내 PAM 부위와 매칭되며; 및 (iii) DNA 타겟 서열 및 도입할 타겟 변형이다. 모든 서열분석된 게놈은 공개적으로 이용가능하므로, 적절한 핵산 서열은 본 발명의 내용에 기초하여 인실리코 (in silico)로 설계할 수 있다.
본 발명은, 또 다른 측면에서, 원핵생물 또는 진핵생물 세포에서 게놈 편집에 있어, 본 발명의 제1 측면에 따른 하나 이상의 하이브리드 RNA/DNA 핵산 서열의 용도, 또는 본 발명의 제2 측면에 따른 분자 복합체의 용도를 제공한다. 이러한 측면에 대한 일 구현예에서, 상기한 용도는 진핵생물 세포, 바람직하게는 진균, 동물 또는 식물 세포 또는 유기체에 대한 것이다.
본 발명에 따른 다양한 측면 및 구현예에서, 진핵생물 세포 또는 진핵생물 세포를 변형하기 위한 방법 및 용도는 모든 인간 클로닝 방법, 인간의 생식 계열 유전자 동일성 (germ line genetic identity)을 변형시키는 방법 또는 인간 배아의 용도, 또는 인간 배아로부터 세포를 수득하기 위해 인간 배아 파괴가 요구되는 방법을 명백하게 포함하지 않는다.
본 발명은 이하 비-제한적인 실시예를 참조하여 더욱 설명된다.
실시예
본 발명은 이하 비-제한적인 실시예를 참조하여 추가로 예시된다.
실시예 1: CRISPR 폴리펩타이드와의 조합에 적합한 하이브리드 핵산 서열.
본 실시예에서, 맞춤형 sgRNA 또는 기타 적합한 CRISPR 핵산은 상보적인 염기 쌍 형성 및 RNA-DNA 연결을 통해 단일 가닥 복구 주형과 혼성화된다. 공유 결합되는 경우, DNA 합성 올리고뉴클레오티드를 RNA 올리고뉴클레오티드의 3' 말단에 ssRNA 리가제를 제조사의 프로토콜에 따라 사용해 공유적으로 라이게이션한다. 비-공유 결합의 경우, 부분적인 상보성 서열을 가진 RNA 및 DNA 올리고뉴클레오티드를 혼합하고, 왓슨-크릭 염기 쌍 형성을 통해 복합체가 형성되게 한다. 겔 쉬프트 분석으로 혼성화의 성공을 확인할 수 있다. 겔 쉬프트 분석 전, 하이브리드 핵산 분액에 RNase 및 DNase 효소를 처리하여, 하이브리드 핵산 중 일부가 RNA와 일부의 DNA로 구성된 것을 확인한다. 그런 후, 핵산 하이브리드를 재조합 CRISPR 폴리펩타이드, 예를 들어, Cpf1, Cas9, CasX 또는 CasY 단백질과 함께 복합체로 형성시킨다. 복합체 형성의 성공은 프로테이나제 K, RNase, DNase 처리 및 모의 처리 (mock treatment) 후 상대적인 겔 쉬프트 패턴을 관찰함으로써, 검증할 수 있다. 재조합 CRISPR 폴리펩타이드가 제조되었으며, 이후 외부 상업 회사 또는 사내 시설을 통해 정제하였다. 테스트한 하이브리드 핵산 서열의 여러가지 아키텍쳐들을 도 1a - 1b도 2에 도시한다.
실시예 2: CRISPR 단백질과 하이브리드 RNA-DNA 핵산의 복합체에 의한 DNA 타겟의 시험관내 절단
본 실시예에서, 본원의 핵산 하이브리드 기법을 사용할 경우, 부위-특이적인 엔도뉴클레아제로서의 CRISPR 단백질, 예를 들어 Cpf1, Cas9, CasX 또는 CasY 단백질의 기능성을 테스트하였다. sgRNA 또는 다른 적절한 CRISPR 핵산에 대한 하나 이상의 타겟 부위를 가진 선형화된 플라스미드를, 본 발명의 전술한 CRISPR 단백질- CRISPR 핵산 -RT 복합체 (예, Cas9-sgRNA-RT 복합체)와 혼합하였다. 다양한 CRISPR 뉴클레아제 및 이의 변이체에 대한, 당업자에게 공지된, 적절한 pH, 온도 및 조인자 등을 비롯하여 뉴클레아제 활성에 적합한 조건 하에 인큐베이션한 후, DNA 타겟 플라스미드를 아가로스 겔에서 전개시키고, 예상된 타겟 부위의 절단을 의미하는 밴드 크기를 관찰하였다. 타겟 DNA의 시험관내 절단에서, "카고"로서 sgRNA와 결합된 RT는, 부위 특이적인 엔도뉴클레아제로서 복합체의 정상적인 기능을 간섭하지 않는 것으로, 확인되었다.
실시예 3: 하이브리드 RNA-DNA 핵산과 CRISPR 단백질의 복합체에 의한 생체내 편집
타겟 유전자가 생체내에서 CRISPR 단백질, 예를 들어 Cpf1, Cas9, CasX 또는 CasY 단백질과 하이브리드 RNA-DNA 핵산을 포함하는 전달된 복합체에 의해 편집될 수 있는 지를 확인하기 위해, 싱글 뉴클레오티드를 교체하여 형질전환된 플라스미드에 함유된 비-기능성 tdTomato 유전자로 복구하여, tdTomato 유전자에서 형광 신호를 부활시켰다. 타겟 가닥 또는 비-타겟 가닥에 상보성을 가진 ssDNA 복구 주형을 제공함으로써, 편집을 위한 최적의 용도를 확인하기 위해, 한쪽 가닥의 복구 주형을 가진 복합체들을 비교하였다.
실시예 1에서 수득된 하이브리드 핵산 RNA/DNA-CRISPR 폴리펩타이드 복합체를 사용하여, 51번 코돈 위치에서 조기 정지 신호를 만드는 A -> T 단일 점 돌연변이를 가진 tdTomato 유전자를 코딩하는, 에피좀 플라스미드의 타겟을 복구하였다. 이 플라스미드를, CRISPR 단백질 및 하이브리드 RNA-DNA 핵산을 포함하는 편집 복합체와 함께, PEG- 또는 전기천공-매개 전달을 통해 옥수수 프로토플라스트 시스템에 도입하였다. 이후, 단일 가닥 복구 주형은 상보적인 염기 쌍 형성을 통해 sgRNA와 같은 CRISPR 핵산과 연결된다. 복구 주형은 절단 부위에서 하류 ~80 bp 및 상류 ~40 bp에 이르는 영역에 대해 상보성을 가진다. 성공적인 편집으로, 상기한 tdTomato 유전자를 함유한 하나 이상의 플라스미드의 tdTomato 유전자로 복구됨으로써, 일부 세포는 tdTomato 형광 표현형으로 나타내게 된다. 따라서, 각 처리에서 나타난 형광 세포의 빈도 (abundance)를 측정하여, 여러가지 복구 주형들의 상대적인 편집 효율을 평가할 수 있다.
실시예 4: RNA 구성 성분이 공유적 부착되거나 또는 상보적인 염기 쌍 형성에 의해 결합된 RT와 CRISPR 단백질 복합체에 의한 생체내 편집
다양한 방식으로 제조된 하이브리드 핵산 분자를 이용한 편집을 입증하기 위해, 실시예 3에서 동정된 최적의 조건을 적용해, 복구 주형과 sgRNA가 공유 결합되거나 또는 비-공유 염기 쌍을 형성한 하이브리드 핵산에 의해 동일한 에피좀 플라스미드 타겟으로 복구되었는 지를 분석하였다.
마커, 특히 형광 마커를 사용할 경우, 성공적인 편집 시, tdTomato 유전자를 함유한 하나 이상의 플라스미드의 tdTomato 유전자 등의 형광 코딩 유전자로 복구됨으로써, 일부 세포는 형광 표현형을 나타내게 될 것이다. 각 처리에서 나타난 형광 세포의 빈도 (abundance)를 측정하여, 여러가지 복구 주형들의 상대적인 편집 효율을 평가할 수 있다.
실시예 5: CRISPR 핵산 (gRNA)의 5' 말단 또는 3' 말단에 RT를 연결하여 제조된 핵산 하이브리드와 CRISPR 단백질의 복합체에 의한 생체내 편집
본 실시예에서, 실시예 3에 기술된 방법을 이용해, sgRNA 또는 다른 적절한 CRISPR 핵산의 5' 또는 3' 말단에 혼성되거나 또는 연결되는 복구 주형의 선호성을 동정할 수 있다. 실시예 4에서 결정된 선호적인 공유 연결을 본 실시예에서 사용할 수 있다. Tsai et al. ("Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing", Nature Biotechnology, 32, 569-576 (2014), doi:10.1038/nbt.2908) 및 Shechner et al. ("Multiplexable, locus-specific targeting of long RNAs with CRISPR-Display", Nature Methods, 12(7), 664-670 (2015), doi: 10.1038/nmeth.3433)에 제시된 결과에 따르면, 3' 융합이 바람직할 것으로 예상된다.
성공적인 편집 시, tdTomato 유전자를 함유한 하나 이상의 플라스미드의 tdTomato 유전자로 복구되어, 일부 세포는 형광 표현형을 나타내게 될 것이다. 각 처리에서 나타난 형광 세포의 빈도 (abundance)를 측정하여, 여러가지 복구 주형들의 상대적인 편집 효율을 평가할 수 있다.
실시예 6: 하이브리드 핵산과 CRISPR 복합체에 의한 생체내 편집에 있어, CRISPR 핵산과 복구 주형 간의 최적의 링커 길이 결정
본 실시예에서, gRNA와 복구 주형 사이에 증가 단위가 50 bp인 최대 500 bp 길이의 링커를 사용해, 실시예 3에 기술된 타겟을 복구하기 위한 최적의 상동성 재조합 조건을 동정하였다. 링커 길이 세트의 사용은, 단백질 타겟 가닥의 기하구조를 극복하기 위해 하이브리드에 필요한 필수적인 유연성을 결정하는데 도움이 될 것이다. 이는, 특히, 분자 복합체의 상호작용을 조직화하고 또한 RT의 존재 하에 CRISPR 복합체가 그 효과를 발휘할 수 있음을 보장하기 위해, 여러가지 CRISPR 뉴클레아제와, 즉 특정 gRNA 및 개별 복구 주형 (RT)을 사용해 작동시킬 경우에, 필수적이다. 실시예 3의 조건을 실시예 3-5에서 결정된 최적화된 파라미터와 함께 사용하였다. 링커는 타겟 유전자 주변 서열에 상보성을 가진 DNA이다.
성공적인 편집 시, tdTomato 유전자를 함유한 하나 이상의 플라스미드의 tdTomato 유전자로 복구되므로, tdTomato 마커를 사용할 경우, 일부 세포는 tdTomato 형광 표현형을 나타내게 될 것이다. 각 처리에서 나타난 형광 세포의 빈도 (abundance)를 측정하여, 여러가지 링커 길이를 이용할 경우의 상대적인 편집 효율을 평가할 수 있다. 마찬가지로, 대상 세포 타입에 적합한 임의의 형광 마커, 항생제 마커, tag 서열, 조절 서열 등을 비롯하여, 임의의 그외 대상 선별 마커도 사용할 수 있다.
실시예 7: CRISPR 단백질과 하이브리드 핵산의 복합체에 의한 생체내 편집에서 복구 주형의 최적의 배열 (optimal configuration) 결정
단일 가닥 및 이중 가닥 복구 주형을 이용한 편집을 확인하기 위해, 실시예 3에 기술된 생체내 분석으로 2가지 배열을 상대적으로 비교하였다. 단일 가닥 복구 주형은 저 분자량이 좋을 것으로 예상되며, 짧은 dsDNA 올리고에 비해 짧은 ssDNA 올리고가 편집율이 높은 것으로 알려져 있다. 그러나, 큰 서열을 편집 또는 삽입할 경우에는 이중 가닥 복구 주형을 사용해야 할 수 있다. 실시예 4 및 6의 최적의 조건을 본 실시예에 이용할 수 있다.
성공적인 편집 시, tdTomato 유전자를 함유한 하나 이상의 플라스미드에 의해 tdTomato 유전자가 복구되므로, 일부 세포는 tdTomato 표현형과 같은 형광 표현형을 나타내게 될 것이다. 각 처리에서 나타난 형광 세포의 빈도 (abundance)를 측정하여, 여러가지 복구 주형을 이용할 경우의 상대적인 편집 효율을 평가할 수 있다.
실시예 8: CRISPR 단백질과 하이브리드 RNA-DNA 핵산의 복합체에 의한 염색체 타겟의 생체내 편집
본 실시예에서, 실시예 3-7에서 최적화된 방법을 이용해, 염색체 타겟 유전자에 대한 편집을 수행할 수 있다. 본 실시예에서, 조기 정지 코돈 tdTomato 카세트가 안정적으로 삽입된 형질전환 옥수수 식물을 이용해, 염색체 타겟에 대한 본 발명의 유용성을 입증하였다. 성공적인 편집 시, 게놈 DNA에 통합된 tdTomato 유전자가 복구됨으로써, 일부 세포는 tdTomato 형광 표현형을 나타내었다. 편집 효율은 각 처리시 나타나는 형광 세포 빈도를 측정함으로써 평가하였다.
실시예 9: CRISPR 단백질과 하이브리드 RNA-DNA 핵산의 복합체에 의한 염색체 타겟으로의 유전자 카세트의 생체내 삽입
염색체 타겟에 전장 유전자 (full length gene)을 삽입하는데 있어 본 발명의 유용성을 확인하기 위해, tdTomato 형광 리포터 유전자와 종결인자를 옥수수 hmg13 유전자에 삽입하였으며, 그 결과 hmg13의 내인성 프로모터에 의해 구동된 발현을 통해 tdTomato 형광 신호가 발생하였다. 그 결과, 긴 유전자를 본 발명의 방법을 이용해 삽입할 수 있으며, 이러한 삽입 조건을 최적화하는데 일조할 것임을, 확인할 수 있었다.
성공적인 편집 시, 일부 세포는 tdTomato 형광 표현형을 나타낸다. 이 표현형은 hmg13 타겟에 tdTomato 유전자의 삽입 및 후속적인 tdTomato 단백질 발현에 의해 나타난다. 테스트한 세포 타입에서의 각각의 편집 효율은 각 처리시 나타나는 형광 세포 빈도를 측정함으로써 평가할 수 있다.
실시예 10: Cas9 단백질과 하이브리드 RNA-DNA 핵산의 복합체를 식물 세포에 전달하기 위한 세포 침투성 펩타이드의 사용
실시예 8 또는 9에서 동정된 최적 시스템을 본 실시예에 사용하여, 세포 침투성 펩타이드 (CPP)를 이용한 형질전환과 PEG를 이용한 형질전환의 효율을 비교 테스트하였다. 기존의 간행물 및 출원에서, CPP를 전달하기 위한 용도로 사용하면, 세포벽이 있는 세포에 CRISPR 단백질, 예를 들어 Cas9 또는 Cpf1 단백질과 하이브리드RNA-DNA 핵산의 복합체를 도입가능할 것으로, 시사된 바 있다. 이에, CPP를 CRISPR 융합 단백질 내부에 사용하거나 또는 CRISPR 단백질의 N-말단 시스테인과 CPP의 N-말단 시스테인 간에 형성된 이황화 결합을 통해 CRISPR 단백질에 연결시켜 사용하였다. 유리형 CPP도 사용하여, 핵산 가닥에 대한 일시적인 결합을 통한 CRISPR 핵산 복합체의 도입을 보조할 수 있다. 초기 CPP는 HIV TAT 펩타이드 (예, 서열번호 17 및 18) 또는 이로부터 유래된 서열 및/또는 (Arg)9 서열을 포함할 수 있다. 실시예 3-9의 최적화된 방법을 이용해 프로토플라스트 시스템에서의 성공적인 tdTomato 발현을 통해 효율을 평가할 수 있다.
실시예 12: 또 다른 CRISPR 뉴클레아제
전술한 바와 같이, 본 발명에 따른 하이브리드 핵산 서열은 여러가지 CRISPR 시스템의 다양한 CRISPR 뉴클레아제에 적합하다. 임의의 작동자 뉴클레아제, 예를 들어, Cas9, Cpf1, CasX 또는 CasY의 경우, 각 대상 세포 타입에서 게놈 편집 이벤트에서 최적의 결과를 달성하기 위해, 최적의 조건과 gRNA 및 RT의 길이를 상기 실시예 1-11에 기술된 바와 같이 조사하여야 한다. 또한, CRISPR 닉카제를 이용한 일차 실험은 전술한 바와 동일한 방법으로, 하나 이상의 gRNA가 결합된 1 또는 2개의 개별 RT를 이용하여, 2 이상의 gRNA를 이용해 수행하였다. 일차 결과에서, 진핵생물 세포에서도 게놈 편집을 정확하게 수행할 수 있는 유망한 방법인 것으로, 확인된다.
실시예 13: 동물 세포 구조체
본 발명의 방법은, 상동적인 재조합을 수행할 수 있는, 진핵생물 세포에 적용할 수 있다. 뮤라인 T 세포 또는 T 세포 전구체는, 암 면역요법에 적합하도록 시험관내에서 변형시킬 수 있다. 본 발명에 따른 하이브리드 핵산 구조체는, 동물 시스템에 대해 특이적으로 최적화 (코돈 최적화) 및 설계 (PAM, 타겟부위)할 경우, 진핵생물의 대상 동물 세포 타입에서 매우 정확한 게놈 편집 용도로 사용될 수 있음을 입증할 수 있었다. 본 발명에 기술된 방법을 이용한 T 세포의 증식 또는 기능을 조절하는 발현된 유전자의 변형은, 따라서, 본 발명에 따른 구조체를 사용해 대상 세포 타입을 변형시킴으로써, 테라피, 특히 포유류에서, 보다 상세하게는 개체에서 질환 또는 장애를 치료하는데 사용할 수 있다.
실시예 14: 노출된 미성숙 수이삭 조직의 형질전환/형질감염
전술한 바와 같이, 식물 또는 식물 타겟 구조에 유전 물질을 도입하기 위해, 식물 세포, 조직, 기관 또는 전체 식물 또는 이의 일부를 형질전환하기 위한 다양한 물리적/기계적 수단 및 생물학적 수단들이 개시되어 있다. 이들 방법들은 본 발명에 따른, 하나 이상의 하이브리드 RNA/DNA 핵산 서열 및/또는 하나 이상의 gRNA, 및/또는 하나 이상의 복구 주형, 및/또는 하나 이상의 CRISPR 폴리펩타이드를 도입하는데 마찬가지로 적합하다. 노출시키고, 분열 조직, 예를 들어, 옥수수 웅성 식물의 수이삭 조직을 수득한 후, 하기 방법을 적용해 이 조직을 형질전환시킬 수 있다:
생물학적 수단의 경우, 식물 조직 또는 이의 세포는, 아그로박테리움 투메팩시엔스 또는 아그로박테리움 리조게네스 매개 형질전환 등의 아그로박테리아를 사용해 형질전환시킬 수 있다. 이러한 타입의 형질전환은 당해 기술 분야의 당업자들에게 잘 알려져 있다 (예, Jones, H.D. et al., "Review of methodologies and a protocol for the Agrobacterium-mediated transformation of wheat", plant methods, 2005; 또는 Frame, B.R. et al., "Agrobacterium tumefaciens-mediated transformation of maize embryos using a standard binary vector system", Plant, 2002). 이를 위해, 대상 구조체를 포함하는 아그로박테리아 배양물은, 예를 들어, 적절한 항생제, 10 mM MES 및 200 mM ACE가 함유된 루리아 브로스 (Luria Broth) 액체 배지에서 28℃에서 밤새 배양한다. 다음날, 밤새 배양한 배양물을 4,400 rpm에서 15분간 원심분리하고, 상층액을 버린다. 그런 후, 펠렛을 다시 4,400 rpm에서 15분간, 2분간 원심분리하고, 상층액을 버린다. 펠렛을 재현탁한다 (5 ml H2O, 10 mM MES, 10 mM MgCl2 + 20μM ACE). 600 nm에서의 광학 밀도를 1.5로 맞춘다. 현탁액은 이후 잠재적으로 희석하여 사용될 수 있다.
생물학적 수단을 통해 식물의 분열조직 세포 또는 조직을 형질전환시킬 수 있는 또 다른 방법은 바이러스 벡터를 이용하는 것이다. 바이러스 벡터는 DNA 또는 RNA로서 대상 식물 타겟 구조에 도입시킬 수 있다는 이점이 있다. 또한, 바이러스 벡터 또는 식물 바이러스는 여러가지 세포 및 조직으로 전파될 수 있는 전파력을 가지고 있다.
본 발명의 목적에서, 바이러스 또는 아그로박테리아를 운반하는 바이러스의 T-DNA를 코딩하는 시험관내 전사체를 필터레이션 (진공 및 비-진공)을 통해 대상 식물 타겟 구조에 도입시킬 수 있다. 식물 수액을 이용해 또 다른 실험을 수행할 수 있다. 이를 위해, 담배 또는 시금치에 대상 바이러스를 감염시킨 다음, 바이러스를 함유한 식물 수액으로, 또 다른 식물 타겟 조직, 특히 여러가지 식물의 분열조직 세포 또는 조직을 감염시키기 위해, 대상 바이러스를 식물 수액으로부터 분리할 수 있다.
대상 수이삭 조직을 형질전환하는 생물학적 수단도 있으며, 입자 총격과 더불어 추가의 물리적/기계적 형질전환 수단을 이용할 수도 있다.
적합한 한가지 방법은 미세주입법이다. 미세주입법은 바람직하게는 마이크로조작기가 장착된 현미경을 사용해 임의 타입의 테스트 분열조직 구조에 사용할 수 있다. 수이삭 또는 암이삭과 같은 특정 분열조직 구조의 크기로 인해, 현미경 하에 미세주입법을 수행할 수 있거나, 또는 타겟 구조가 매우 클 경우, 현미경을 사용하지 않고도 수행할 수 있다. 주입은, 다양한 여러가지 타겟 분자에 대해 다양한 방법을 이용해 수행함으로써, 이중 가닥 플라스미드 DNA, 선형의 이중 가닥 DNA, RNA 및 단백질 뿐만 아니라 액체 내 바이러스 입자 등을 대상 식물 타겟 구조에 도입시킬 수 있다. 이러한 여러가지 분자들은 타겟 분자를 대상 분열조직 세포 또는 구조에 주입하는 과정을 보조하는 마이크로-바늘 또는 나노-바늘을 사용해 적용할 수 있다. 타겟 분자를 먼저 바늘에 코팅한 다음 바늘을 대상 분열조직 세포 또는 구조에 삽입한다.
또 다른 적절한 수단은, 예를 들어 입자 전달 시스템을 이용한, 입자 총격이며, 이 방법은 상기에 더욱 기술되어 있다.
이 기술은, 실리콘 카바이드 (SiC) 위스커 (예, Silar® Silicon Carbide Whisker)를 미세주입법과 조합하여 사용하는 것으로 더욱 발전되었다. 이를 위해, 이중 가닥 (선택적으로, 플라스미드) DNA, 선형 이중 가닥 DNA, RNA 단백질 또는 본 발명에 따른 분자 리보뉴클레오-복합체, 또는 바이러스 입자를, 미세주입 바늘을 통해, 대상 분열조직 구조 또는 세포에 주입되는 실리콘 카바이드 위스커 상에 침전시킨다. 이 기법은, 하나의 세포를 형질감염시킬 수 있을 뿐만 아니라 위스커의 전파로 인해 여러 세포에 동시에 침투시킬 수 있는, 이점을 가진다. 또한, 바늘이 세포를 관통하지 않으며 위스커의 크기가 매우 작기 때문에, 세포는 거의 파괴되지 않는다.
실시예 15: 변형을 검출하기 위한 수단
형광 리포터를 사용할 경우, 본 발명에 따른 하나 이상의 DNA 타겟 서열에 도입된 임의의 일시적인 또는 안정적인 변형은, 형광 검출 수단을 이용해 검출할 수 있다. 꽃밥 및 건조시킨 화분과 같은 수이삭 조직은 자기형광성이 강하기 때문에, 이들 세포 및 조직에 대해는 다른 수단을 사용하여야 한다. 따라서, PCR, 예를 들어, 농화 PCR, PCR-digest, 농화 PCR과 PCR-digest의 조합, 정량적인 PCR 또는 서열분석, 또는 RT-PCR, 예를 들어, 딥 또는 차세대 서열분석 또는 노든 또는 서든 블롯 분석과 같은, 다른 분자적 방법으로 검출을 수행하고, 검증할 수 있다. 단백질 수준은 웨스턴-블롯팅 등에 의해 분석할 수 있다. 표현형 검출가능한 형질이 하나 이상의 대상 세포에 도입되었을 경우, 이 형질, 예를 들어, 저항성, 형광, 형태적 돌연변이 표현형 또는 임의의 다른 형질이 하나 이상의 변형된 세포 또는 이의 후대 또는 파생물에 존재하는 지의 유무를 검출하기 위한 분석을 수행할 수도 있다. 이러한 검출 방법은 당업자들에게 공지되어 있다.
여러가지 타겟 식물 및 이의 세포에서 안정적인 통합 이벤트를 분석하기 위한 일반적인 셋업은 다음과 같이 수행될 수 있다: 먼저, 여러가지 물질, 예를 들어, 형광 단백질, 예를 들어 레드 형광 단백질을 코딩하는 여러가지 구조체로 형질전환된 수이삭, 꽃밥 또는 화분 조직/세포 등의 여러 물질들에서 DNA 및/또는 RNA를 추출한다. 요컨대, 샘플은 정량적인 PCR (qPCR)을 사용해 분석할 수 있다. 상기한 샘플들 중, 수종의 샘플은 명확한, 즉 매우 강한 (적색) 형광 신호를 나타낼 것이며, 이는 양성 결과를 나타내는 것으로, 이를 이후 선별할 수 있다. 이들 샘플에서, 이후 결과가 비-절단된 DNA와 연관성이 없을 경우를 배제하기 위해, 역전사효소를 사용하지 않고, 대조군과 더불어 cDNA를 구축한다. 전사 측정에 사용된 양성 DNA 신호가 관찰된 샘플들 중, 수개의 샘플에서는 명확한 전사를 관찰할 수 있었지만, 나머지 샘플들에서는 잠재적인 전사가 관찰되었다 (명확하게 측정할 수 있는 경계).
실시예 16: 적절한 하이브리드 RT/CRISPR 핵산의 제조
다양한 여러가지 하이브리드 핵산을 시험관내에서 제조하고, 도 4에 기술된 바와 같이 테스트하였다. 먼저, 대상 Cas 또는 Cpf 뉴클레아제로서 적합한 CRISPR RNA 핵산과 대상 게놈 타겟 핵산을 설계하였다 (도 4에 도시된 예에서 100 nt). 타겟화된 HDR 복구를 도입하기 위해 복구 주형으로서 ssDNA를 RT로서 설계하였다 (도 4에 도시된 예에서 127 nt). 여러가지 CRISPR 핵산과 대상 RT를 각각 RNA-DNA 라이게이션하기 위해, 5' 아데닐화 RT를 사용하였다. 이를 위해, 5' 인산화된 ssDNA (또는 부분적인 ssDNA 또는 5' 인산화를 가진 dsDNA)를 구입 또는 합성할 수 있으며, 인산화되지 않았을 경우에는, ssDNA를 인산화하여, 5' 인산화된 RT를 제조할 수 있다. 일 예로, RT DNA 스톡 (4 nmol 인산화된 울트라머로서 제공됨)을 준비하여 100 μM 스톡으로 제조하였다. 그런 후, 3,000 ng/㎕ 인산화된 RT 스톡 2 ㎕, 10X 5' DNA 아데닐화 반응 완충제 (2 ㎕), 1 mM ATP (4 ㎕), Mth RNA 리가제 (4 ㎕, 100 pmol) 및 8 ㎕ 뉴클레아제 프리 물 (nuclease free water)을 사용해 RT를 아데닐화하였다. 혼합물을 65℃에서 1시간 인큐베이션한 다음 효소를 불활성화하였다 (5분, 85℃). 이후, 아데닐화된 복구 주형 2,250 ng (아데닐화 반응의 ~7.5 ㎕), RNase 저해제 1 ㎕, RNA CRISPR 핵산 750 ng, 50% PEG 용액 (5 ㎕, 최종 10%), T4 RNA 리가제 반응 완충제 2.5 ㎕ 및 리가제 0.5 ㎕를 사용해, RNA-DNA 라이게이션을 수행하였다. 혼합물을 25℃에서 1시간 인큐베이션한 다음 효소를 불활화하였다 (20분, 65℃). 마지막으로, RecJF 처리를 수행하였다. RecJF는 단일 가닥 DNA 특이적인 5' 엑소뉴클레아제이며, 즉, RecJF는 라이게이션되지 않은 RT DNA를 분해할 것이다. RNA-DNA 라이게이션 산물 15 ㎕, NEB 완충제 2 2 ㎕, RecJF 1.5 ㎕ 및 뉴클레아제 프리 물 1.5 ㎕을 37℃에서 30분간 인큐베이션한 다음, 효소를 불활성화하였다 (20분, 65℃). 상기한 반응과 선행 단계들의 결과물을 시각화하기 위해 겔-적색 염색으로 6% 아크릴아미드 TBE 우레아 겔에서 분석하였다.
도 4에서 확인된 바와 같이, 라이게이션으로부터 수득되는 명백한 크기 변화를 제외하고는, RecJF 처리로부터의 보호되어, 수득된 라이게이션된 산물은 RecJF에 의해 분해되지 않기 때문에, RT의 5' 말단에 더 이상 접근하지 못하는 것으로 확인된다. 따라서, 대상 CRISPR 핵산과 주문 제작되는 선택 복구 주형을 상기한 방법으로 서로 공유적으로 부착시켜, 게놈 조작을 위한 형질감염에 적합한 안정적인 구조체를 제공할 수 있다. CRISPR 핵산과 RT 간의 연결은, 대상 세포에 형질감염된 이후에 구조체의 물리적인 이용가능성을 보장해주고, CRISPR 핵산과 RT를 각각 제공하는 방식과 비교해 구조체의 안정성을 향상시킴으로써, 최대 효율을 제공해 줄 것이다.
하이브리드 CRISPR 핵산/RT 구조체는 시험관내 또는 생체내에서 대상 CRISPR 폴리펩타이드와 결합되어, 대상 유전자 편집을 수행하는 안정적으로 결합된 뉴클레오-단백질 복합체를 안정적으로 구축할 수 있으며, 이는 선택된 CRISPR 뉴클레아제에 의해 생긴 게놈 DNA 절단 부위에 CRISPR 핵산과 융합된 RT를 제시함으로써 즉각적으로 복구할 수 있다.
하이브리드 핵산에서 상호 관련된 CRISPR 핵산과 RT의 여러가지 토폴로지들의 효율을 비교하기 위해, 대상 RT를 설계 및 합성하였으며, 서로 다른 대상 CRISPR 뉴클레아제에 대한 다양한 CRISPR 핵산 서열을 인 실리코로 설계한 다음 합성하였다. 제조한 RT에 선택적으로 5' 말단에서 형광 염료를 표지하였다. 그런 다음, RT와 CRISPR 핵산을 서로 화학적으로 융합시키거나, 또는 RT와 CRISPR 핵산 서열의 상보적인 가닥 간에 혼성화시켜, 후속적인 테스트를 위한 5' RT-CRISPR 핵산 3' 구조체를 제조하였다.
실시예 17: 하이브리드 핵산 및 통상적인 RT/CRISPR 핵산 쌍들의 생체내 유전자 편집 효율 비교
전술한 하이브리드 핵산 서열을 이용한 타겟화된 DNA 절단 및 복구를 달성하는 효율과 차이를, RT 및 CRISPR 핵산이 각각 제공되고 서로 결합되지 않는 기존의 방식과 비교하기 위해, 아래 실험을 설정하였다.
본 실시예에서, 여러가지 배열의 하이브리드 복구 주형 (RT)-CRISPR 핵산 복합체 ((5'-CRISPR RNA-RT-3' 또는 3'-RT-CRISPR RNA-3' 각각)의 HDR 효율을, 2가지 구성 성분이 각각 전달되는 방식의 HDR의 효율과 비교한다. 복합체는, 실시예 16에 기술된 바와 같은 아데닐화된 복구 주형과 CRISPR 핵산을 라이게이션하거나, 또는 CRISPR 핵산과 선택 RT를 서로 화학적으로 연결시킴으로써, 제조된다. 대상 CRISPR 뉴클레아제, 대상 타겟 게놈 및 변형시킬 대상 게놈 타겟 부위에 따라, 도 1a도 1b에 상세히 기술된 바와 같은 임의 배열의 하이브리드 핵산 서열을 선택할 수 있다. CRISPR 핵산과 RT의 복합체를 이후 정제한다. 그런 후, 정제된 복합체를 대상 CRISPR 뉴클레아제와 조립하고, 수득되는 분자 복합체를 PEG 또는 전기천공 방법을 통해 프로토플라스트 세포 집단에 형질도입한다. 다른 예로, 대상 CRISPR 뉴클레아제를 안정적으로 (구성적 또는 유도성) 또는 일시적인 방식으로 발현하는 세포 집단을 선택하고, 하이브리드 핵산 서열 복합체를 생체외에서 형성시킨 다음 이를, 예를 들어, PEG 방법을 통해 프로토플라스트 세포 집단에 형질도입한다. 동시에, 동일한 함량의 CRISPR 핵산과 아데닐화된 복구 주형을 라이게이션 단계 없이 프로토플라스트 세포 집단에 PEG 또는 전기천공 방법에 의해 전달한다. 재차, 타겟 프로토플라스트에 따라, CRISPR 핵산과 아데닐화된 RT를 대상 CRISPR 뉴클레아제와 생체외에서 조립하거나, 또는 CRISPR 핵산과 아데닐화된 RT를 각각 대상 CRISPR 뉴클레아제를 안정적으로 또는 일시적으로 발현하는 프로토플라스트에 형질도입한다.
48시간 후, 2가지 세포 집단을 회수하고, 이의 게놈 DNA를 추출한 다음, (농화) PCR 또는 앰플리콘 딥 서열분석과 같은 분자적인 기법을 통해 타겟 유전자 좌를 분석한다. HDR 효율을 상대값으로 비교한다. 대상 타겟 유전자가 대상 세포의 게놈 내에 함유된 결함성 형광 코딩 유전자, 예를 들어, tdTomato 유전자 (상기 실시예 3과 비교)일 경우, 수득되는 세포 집단은 실시예 3에 상세히 기술된 바와 같이 수득된 세포 집단에서 형광을 측정함으로써 분석할 수 있다.
SEQUENCE LISTING <110> KWS SAAT SE <120> Hybrid nucleic acid sequences for genome engineering <130> KWS0240PCT <150> US 62/344,109 <151> 2016-06-01 <160> 18 <170> PatentIn version 3.5 <210> 1 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> NLS of the SV40 virus large T-antigen <400> 1 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 2 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Nucleoplasmin bipartite NLS <400> 2 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 3 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> c-myc NLS <400> 3 Pro Ala Ala Lys Arg Val Lys Leu Asp 1 5 <210> 4 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> c-myc NLS <400> 4 Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro 1 5 10 <210> 5 <211> 38 <212> PRT <213> Artificial Sequence <220> <223> hRNPA1 M9 NLS <400> 5 Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly 1 5 10 15 Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro 20 25 30 Arg Asn Gln Gly Gly Tyr 35 <210> 6 <211> 42 <212> PRT <213> Artificial Sequence <220> <223> IBB domain from importin-alpha <400> 6 Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu 1 5 10 15 Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys 20 25 30 Asp Glu Gln Ile Leu Lys Arg Arg Asn Val 35 40 <210> 7 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Sequence derived from myoma T protein <400> 7 Val Ser Arg Lys Arg Pro Arg Pro 1 5 <210> 8 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Sequence derived from myoma T protein <400> 8 Pro Pro Lys Lys Ala Arg Glu Asp 1 5 <210> 9 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Sequence derived from human p53 <220> <221> misc_feature <222> (2)..(2) <223> Xaa can be any naturally occurring amino acid <400> 9 Pro Xaa Pro Lys Lys Lys Pro Leu 1 5 <210> 10 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Sequence derived from mouse c-abl IV <400> 10 Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro 1 5 10 <210> 11 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Sequence derived from influenza virus NS1 <400> 11 Asp Arg Leu Arg Arg 1 5 <210> 12 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Sequence derived from influenza virus NS1 <400> 12 Pro Lys Gln Lys Lys Arg Lys 1 5 <210> 13 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Sequence derived from Hepatitis virus delta antigen <400> 13 Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu 1 5 10 <210> 14 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Sequence derived from mouse Mx1 protein <400> 14 Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg 1 5 10 <210> 15 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Sequence derived from human poly(ADP-ribose) polymerase <400> 15 Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys 1 5 10 15 Lys Ser Lys Lys 20 <210> 16 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Sequence derived from steroid hormone receptors (human) glucocorticoid <400> 16 Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys 1 5 10 15 Lys <210> 17 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Sequence derived from HIV Tat <400> 17 Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg 1 5 10 <210> 18 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Sequence derived from HIV Tat <400> 18 Gly Arg Lys Lys Arg 1 5

Claims (15)

  1. 하나 이상의 RNA 및 하나 이상의 DNA 핵산 서열을 포함하거나 또는 이들로 구성된 하이브리드 핵산 서열로서,
    상기 하이브리드 핵산 서열은,
    (a) 하나 이상의 RNA 핵산 서열을 포함하는, CRISPR 핵산 서열;
    상기 CRISPR 핵산 서열과 결합된,
    (b) DNA 핵산 서열을 포함하는 복구 주형 (repair template: RT) 핵산 서열; 및
    (c) 선택적으로, 상기 CRISPR 핵산 서열과 상기 복구 주형 핵산 서열 사이의 링커를 포함하며,
    상기 (a) CRISPR 핵산 서열이,
    (i) 제1 DNA 타겟 서열에 상보적인 제1 서열 영역과,
    (ii) CRISPR 폴리펩타이드와 상호작용하도록 되어 있는, 제2 서열 영역을 포함하고;
    상기 (b) 복구 주형 핵산 서열이 제2 DNA 타겟 서열에 상보적인 하나 이상의 영역을 포함하고, 상기 복구 주형 핵산 서열은 타겟화된 상동성 특이적인 복구 (targeted homology directed repair)를 매개하도록 구성되며;
    상기 하이브리드 핵산 서열은, CRISPR 폴리펩타이드가 상기 제1 타겟 서열을 인지하여 선택적으로 DNA 절단을 유도할 수 있도록, CRISPR 폴리펩타이드와 상호작용하며,
    상기 하이브리드 핵산 서열은, 제2 DNA 타겟 서열의 부위에서 상기 복구 주형 핵산 서열에 의해 매개되는 상동성 특이적인 복구를 통해, 게놈 조작을 수행하는, 하이브리드 핵산 서열.
  2. 제1항에 있어서,
    상기 복구 주형 핵산 서열 및/또는 상기 CRISPR 핵산 서열이, 선택적으로 백본 변형 및/또는 염기 변형을 포함하는, 천연 뉴클레오티드 서열 또는 합성 뉴클레오티드 서열을 포함하는 비-천연 뉴클레오티드 서열로부터 선택되는 뉴클레오티드 서열을 포함하고,
    상기 CRISPR 핵산 서열이 단일 가닥 또는 부분 단일 가닥 RNA 뉴클레오티드 서열을 포함하고,
    상기 복구 주형 핵산 서열이 단일 가닥 또는 이중 가닥 DNA 뉴클레오티드 서열을 포함하는, 하이브리드 핵산 서열.
  3. 제1항 또는 제2항에 있어서,
    상기 복구 주형 핵산 서열이 상기 CRISPR 핵산 서열의 3' 말단에서 상기 CRISPR 핵산 서열과 결합되거나, 및/또는
    상기 복구 주형 핵산 서열이 상기 CRISPR 핵산 서열의 5' 말단에서 상기 CRISPR 핵산 서열과 결합되거나, 및/또는
    상기 복구 주형 핵산 서열이 상기 CRISPR 핵산 서열 내에 위치하는, 하이브리드 핵산 서열.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    하나 이상의 복구 주형 핵산 서열이 하나 이상의 CRISPR 핵산 서열과 공유적으로 부착되거나, 및/또는 하나 이상의 복구 주형 핵산 서열이 하나 이상의 CRISPR 핵산 서열과 비-공유적으로 부착된, 하이브리드 핵산 서열.
  5. 제1항 내지 제4항 중 어느 한 항에 따른 하나 이상의 하이브리드 핵산 서열, 및 하나 이상의 CRISPR 폴리펩타이드를 포함하며,
    상기 하나 이상의 하이브리드 핵산 서열과 상기 하나 이상의 CRISPR 폴리펩타이드가 기능적인 방식으로 결합된, 분자 복합체.
  6. 제5항에 있어서,
    상기 하나 이상의 CRISPR 폴리펩타이드가 독립적으로 스트렙토코커스 피오게네스 (Streptococcus pyogenes), 스트렙토코커스 서모필 (Streptococcus thermophiles)을 포함하는 스트렙토코커스 (Streptococcus spp.), 스타필로코커스 아우레우스 (Staphylococcus aureus), 네이세리아 메닝기티데스 (Neisseria meningitides)를 포함하는 네이세리아 (Neisseria spp.), 코리네박터 (Corynebacter), 슈테렐라 (Sutterella), 레지오넬라 (Legionella), 트레포네마 (Treponema), 필리팍토르 (Filifactor), 유박테리움 (Eubacterium), 락토바실러스 (Lactobacillus), 미코플라스마 (Mycoplasma), 박테로이데스 (Bacteroides), 플라비이볼라 (Flaviivola), 플라보박테리움 (Flavobacterium), 스파로키타 (Sphaerochaeta), 아조스피릴룸 (Azospirillum), 글루콘아세토박터 (Gluconacetobacter), 로세부리아 (Roseburia), 파르비바쿨럼 (Parvibaculum), 니트라티프락토르 (Nitratifractor), 미코플라스마 (Mycoplasma) 및 캄필로박터 (Campylobacter)의 Cas 폴리펩타이드로 이루어진 군으로부터 선택되거나, 또는
    상기 CRISPR 폴리펩타이드가 액시드아미노코커스 sp. BV3L6 (Acidaminococcus sp. BV3L6)를 포함하는 액시드아미노코커스 (Acidaminococcus spp.), 라크노스피레이세아 박테리움 ND2006 (Lachnospiraceae bacterium ND2006)를 포함하는 라크노스피레이세아 (Lachnospiraceae spp.), 프란시셀라 노비시다 U112 (Francisella novicida U112)를 포함하는 프란시셀라 (Francisella spp.), 유박테리움 엘리겐스 (Eubacterium eligens), 프레보텔라 (Prevotella spp.) 또는 포르피로모나스 (Porphyromonas spp.)의 Cpf1 폴리펩타이드를 포함하는, 고세균 또는 박테리아 유래 Cpf1 폴리펩타이드들로부터 선택되거나, 또는
    상기 CRISPR 폴리펩타이드가, CRISPR 폴리펩타이드 닉카제 (CRISPR polypeptide nickase) 또는 엔도뉴클레오분해 활성이 결핍된 CRISPR 폴리펩타이드 (CRISPR polypeptide lacking endonucleolytic activity)를 포함하는, CasX 폴리펩타이드 또는 CasY 폴리펩타이드, 또는 이의 변이체 및/또는 기능성 단편 및/또는 이들의 조합으로부터 선택되는, 분자 복합체.
  7. 제1항 내지 제4항 중 어느 한 항에 따른 하나 이상의 하이브리드 핵산 서열 또는 제5항 또는 제6항에 따른 하나 이상의 분자 복합체를 포함하거나 또는 상기한 하이브리드 핵산 서열 또는 분자 복합체에 의해 편집된, 식물, 식물 세포, 식물 물질 (plant material) 또는 이의 파생물 (derivative) 또는 후대 (progeny).
  8. 원핵생물 또는 진핵생물 세포에서 하나 이상의 DNA 타겟 서열을 변형시키는 방법으로서,
    (i) 대상 게놈 영역에 하나 이상의 제1 DNA 타겟 서열 및 하나 이상의 제2 DNA 타겟 서열을 포함하는 하나 이상의 DNA 타겟 서열을 포함하는 하나 이상의 원핵생물 또는 진핵생물 세포를 제공하는 단계;
    (ii) 제1항 내지 제4항 중 어느 한 항에 따른 하나 이상의 하이브리드 핵산 서열과 하나 이상의 CRISPR 폴리펩타이드를 포함하는, 제5항 또는 제6항에 따른 하나 이상의 분자 복합체를 제공하는 단계;
    (iii) 상기 하나 이상의 하이브리드 핵산 서열의 CRISPR 핵산 서열의 제1 서열 영역이 상기 하나 이상의 제1 DNA 타겟 서열과의 상보적인 염기 쌍 형성을 달성하는데 적합한 조건 하에, 상기 하나 이상의 분자 복합체를 상기 하나 이상의 DNA 타겟 서열과 접촉시켜, 상기 하나 이상의 CRISPR 폴리펩타이드에 의한 상기 제1 DNA 타겟 서열의 인지를 달성하고, 선택적으로 상기 하나 이상의 CRISPR 폴리펩타이드에 의한 하나 이상의 DNA 절단 (DNA break)을 유도하는 단계로서, 상기 하나 이상의 하이브리드 핵산 서열의 하나 이상의 복구 주형 핵산 서열이 상기 하나 이상의 제2 DNA 타겟 서열의 부위에서 상동성 특이적인 복구 (homology directed repair)를 수행하는, 단계; 및
    (iv) 상기 하나 이상의 DNA 타겟 서열에 변형을 포함하는 하나 이상의 원핵생물 또는 진핵생물 세포를 수득하는 단계를 포함하는, 방법.
  9. 제8항에 있어서,
    상기 분자 복합체의 상기 하나 이상의 하이브리드 핵산 서열이, 상기 분자 복합체의 상기 하나 이상의 CRISPR 폴리펩타이드와 독립적으로, 상기 하나 이상의 원핵생물 또는 진핵생물 세포에 제공되며,
    상기 하나 이상의 분자 복합체가 상기 하나 이상의 원핵생물 또는 진핵생물 세포 내부에서 조립되는, 방법.
  10. 제8항 또는 제9항에 있어서,
    상기 하나 이상의 진핵생물 세포가 식물 세포이고, 바람직하게는 호르데움 불가리 (Hordeum vulgare), 호르데움 불부숨 (Hordeum bulbusom), 소르굼 비콜러 (Sorghum bicolor), 사카룸 오피시나리움 (Saccharum officinarium), 지 메이스 (Zea mays), 세타리아 이탈리카 (Setaria italica), 오리자 미누타 (Oryza minuta), 오리자 사티바 (Oriza sativa), 오리자 아우스트랄리엔시스 (Oryza australiensis), 오리자 알타 (Oryza alta), 트리티쿰 에이스티붐 (Triticum aestivum), 트리티쿰 두럼 (Triticum durum), 세칼레 세레알레 (Secale cereale), 트리티칼레 (Triticale), 말루스 도메스티카 (Malus domestica), 브라키포듐 디스타키온 (Brachypodium distachyon), 호르데움 마리눔 (Hordeum marinum), 에이길롭스 타우치이 (Aegilops tauschii), 다우쿠스 글로키디아투스 (Daucus glochidiatus), 베타 불가리스 (Beta vulgaris), 다우쿠스 푸실루스 (Daucus pusillus), 다우쿠스 무리카투스 (Daucus muricatus), 다우쿠스 카로타 (Daucus carota), 유칼립투스 그란디스 (Eucalyptus grandis), 니코티아나 실베스트리스 (Nicotiana sylvestris), 니코티아나 토멘토시포르미스 (Nicotiana tomentosiformis), 니코티아나 타바쿰 (Nicotiana tabacum), 니코티아나 벤타미아나 (Nicotiana benthamiana), 솔라눔 라이코퍼시쿰 (Solanum lycopersicum), 솔라눔 투베로숨 (Solanum tuberosum), 코페아 카네포라 (Coffea canephora), 비티스 비니페라 (Vitis vinifera), 에리트란테 구타타 (Erythrante guttata), 겐리시아 아우레아 (Genlisea aurea), 쿠쿠미스 사티부스 (Cucumis sativus), 모루스 노타빌리스 (Morus notabilis), 아라비돕시스 아레노사 (Arabidopsis arenosa), 아라비돕시스 라이라타 (Arabidopsis lyrata), 아라비옵시스 탈리아나 (Arabidopsis thaliana), 크루시히말라야 히말라이카 (Crucihimalaya himalaica), 크루시히말라야 발리치이 (Crucihimalaya wallichii), 카르다민 플렉수오사 (Cardamine flexuosa), 레피디움 비르기니쿰 (Lepidium virginicum), 캡셀라 부르사 파스토리스 (Capsella bursa pastoris), 올마라비돕시스 푸밀라 (Olmarabidopsis pumila), 아라비스 히르수테 (Arabis hirsute), 브라씨카 나푸스 (Brassica napus), 브라씨카 올레라시아 (Brassica oleracea), 브라씨카 라파 (Brassica rapa), 라파누스 사티부스 (Raphanus sativus), 브라씨카 준카시아 (Brassica juncacea), 브라씨카 니그라 (Brassica nigra), 에루카 베시카리아 아종 사티바 (Eruca vesicaria subsp. sativa), 시트러스 시넨시스 (Citrus sinensis), 자트로파 쿠르카스 (Jatropha curcas), 포풀루스 트리코카르파 (Populus trichocarpa), 메디카고 트룬카툴라 (Medicago truncatula), 시져 야마시타 (Cicer yamashitae), 시져 비주굼 (Cicer bijugum), 시져 아리에티눔 (Cicer arietinum), 시져 레티쿨라툼 (Cicer reticulatum), 시져 주다이쿰 (Cicer judaicum), 카야누스 카자니폴리우스 (Cajanus cajanifolius), 카자누스 스카라바에오이데스 (Cajanus scarabaeoides), 파세올루스 불가리스 (Phaseolus vulgaris), 글리신 맥스 (Glycine max), 고씨퓸 (Gossypium sp.), 아스트라갈루스 시니쿠스 (Astragalus sinicus), 로투스 자포니카스 (Lotus japonicas), 토레니아 포우르니에리 (Torenia fournieri), 알리움 세파 (Allium cepa), 알리움 피스툴로숨 (Allium fistulosum), 알리움 사티붐 (Allium sativum), 헬리안투스 안누스 (Helianthus annuus), 헬리안투스 투베로수스 (Helianthus tuberosus) 및 알리움 투베로숨 (Allium tuberosum), 또는 이들 식물 중 어느 하나에 속하는 품종 또는 아종으로부터 선택되는 식물 세포인, 방법.
  11. 제8항 내지 제10항 중 어느 한 항에 있어서,
    상기 하나 이상의 DNA 타겟 서열의 상기 변형이 수율 개선; 건조 스트레스, 삼투성 스트레스, 열 스트레스, 한랭 스트레스, 산화 스트레스, 중금속 스트레스, 염 스트레스 또는 침수 (waterlogging)를 포함하는, 비-생물적 스트레스에 대한 저항성; 곤충 내성, 박테리아 내성, 바이러스 내성, 진균 내성 또는 선충 내성을 포함하는 생물학적 스트레스에 대한 저항성; 글리포세이트, 글루포시네이트, ALS 저해제 및 Dicamba를 포함하는 제초제에 대한 저항성; 내도복성 (lodging resistance), 개화기, 내탈립성 (shattering resistance), 종자 색, 배젖 조성, 영양분 함량; 또는 하나 이상의 식물 세포에서 분자 조작 기법 (molecular pharming approach)을 허용하는 게놈 편집을 포함하는, 대사 조작 (metabolic engineering)으로 이루어진 군으로부터 선택되는 형질을 유발하는 게놈 편집 기법인, 방법.
  12. 제8항 내지 제11항 중 어느 한 항에 있어서,
    (v) 상기 하나 이상의 DNA 타겟 서열에 변형을 포함하는 하나 이상의 원핵생물 또는 진핵생물 세포를 동정 및/또는 선별하는 단계를 더 포함하는, 방법.
  13. 하기 단계 (i) 및 (ii), 선택적으로 (iii)를 포함하는, 식물 또는 식물 세포의 제조 방법:
    (i) 제8항 내지 제12항 중 어느 한 항에 따른 방법을 수행하는 단계로서, 하나 이상의 진핵생물 세포가 식물 세포인, 단계;
    (ii) 단계 (i)의 하나 이상의 식물 세포부터 하나 이상의 식물 또는 이의 후대를 수득하는 단계; 및
    (iii) 선택적으로, 상기 하나 이상의 식물 또는 이의 후대의 하나 이상의 세포에서 하나 이상의 DNA 타겟 서열의 변형을 확인하는 단계.
  14. 제13항에 있어서,
    상기 하나 이상의 식물 또는 식물 세포가 외떡잎 식물 또는 쌍떡잎 식물로부터 선택되며,
    바람직하게는, 상기 식물이 지 메이스 (Zea mays)를 포함하는 Zea spp., 니코티아나 벤타미아나 (Nicotiana benthamiana), 베타 불가리스 (Beta vulgaris)를 포함하는 Beta spp., 세칼레 세레알 (Secale cereal)을 포함하는 Secale spp., 또는 트리티쿰 에이스티붐 (Triticum aestivum)을 포함하는 Triticum spp.로 이루어진 군으로부터 선택되는, 방법.
  15. 원핵생물 또는 진핵생물 세포 또는 유기체, 바람직하게는, 식물 세포 또는 유기체에서 게놈 편집을 수행하기 위한, 제1항 내지 제4항 중 어느 한 항에 따른 하나 이상의 하이브리드 RNA/DNA 핵산 서열의 용도, 또는 제5항 또는 제6항에 따른 하나 이상의 분자 복합체의 용도.
KR1020187038125A 2016-06-01 2017-05-30 유전자 조작을 위한 하이브리드 핵산 서열 KR20190012229A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662344109P 2016-06-01 2016-06-01
US62/344,109 2016-06-01
PCT/EP2017/063067 WO2017207589A1 (en) 2016-06-01 2017-05-30 Hybrid nucleic acid sequences for genome engineering

Publications (1)

Publication Number Publication Date
KR20190012229A true KR20190012229A (ko) 2019-02-08

Family

ID=59030920

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187038125A KR20190012229A (ko) 2016-06-01 2017-05-30 유전자 조작을 위한 하이브리드 핵산 서열

Country Status (10)

Country Link
US (1) US12084668B2 (ko)
EP (1) EP3464594A1 (ko)
JP (1) JP2019517261A (ko)
KR (1) KR20190012229A (ko)
CN (1) CN109642232A (ko)
AU (1) AU2017272623A1 (ko)
BR (1) BR112018074494A2 (ko)
CA (1) CA3025828A1 (ko)
EA (1) EA201892810A1 (ko)
WO (1) WO2017207589A1 (ko)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013066438A2 (en) 2011-07-22 2013-05-10 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
US10704021B2 (en) 2012-03-15 2020-07-07 Flodesign Sonics, Inc. Acoustic perfusion devices
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US9068179B1 (en) 2013-12-12 2015-06-30 President And Fellows Of Harvard College Methods for correcting presenilin point mutations
US9725710B2 (en) 2014-01-08 2017-08-08 Flodesign Sonics, Inc. Acoustophoresis device with dual acoustophoretic chamber
WO2016022363A2 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
AU2015342749B2 (en) 2014-11-07 2022-01-27 Editas Medicine, Inc. Methods for improving CRISPR/Cas-mediated genome-editing
US11708572B2 (en) 2015-04-29 2023-07-25 Flodesign Sonics, Inc. Acoustic cell separation techniques and processes
US11377651B2 (en) 2016-10-19 2022-07-05 Flodesign Sonics, Inc. Cell therapy processes utilizing acoustophoresis
WO2017053879A1 (en) 2015-09-24 2017-03-30 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
IL294014B2 (en) 2015-10-23 2024-07-01 Harvard College Nucleobase editors and their uses
EP3433363A1 (en) 2016-03-25 2019-01-30 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
US11236313B2 (en) 2016-04-13 2022-02-01 Editas Medicine, Inc. Cas9 fusion molecules, gene editing systems, and methods of use thereof
US11214789B2 (en) 2016-05-03 2022-01-04 Flodesign Sonics, Inc. Concentration and washing of particles with acoustics
CA3032699A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
WO2018071868A1 (en) 2016-10-14 2018-04-19 President And Fellows Of Harvard College Aav delivery of nucleobase editors
EP3541945A4 (en) * 2016-11-18 2020-12-09 Genedit Inc. COMPOSITIONS AND METHODS OF MODIFICATION OF TARGET NUCLEIC ACIDS
WO2018115389A1 (en) * 2016-12-22 2018-06-28 Keygene N.V. Methods of targeted genetic alteration in plant cells
EP3557981A1 (en) * 2016-12-22 2019-10-30 Keygene N.V. Method for targeted alteration of duplex dna
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
JP2020510439A (ja) 2017-03-10 2020-04-09 プレジデント アンド フェローズ オブ ハーバード カレッジ シトシンからグアニンへの塩基編集因子
IL269458B2 (en) 2017-03-23 2024-02-01 Harvard College Nucleic base editors that include nucleic acid programmable DNA binding proteins
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
US11866726B2 (en) 2017-07-14 2024-01-09 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
JP2020534795A (ja) 2017-07-28 2020-12-03 プレジデント アンド フェローズ オブ ハーバード カレッジ ファージによって支援される連続的進化(pace)を用いて塩基編集因子を進化させるための方法および組成物
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
KR102439221B1 (ko) 2017-12-14 2022-09-01 프로디자인 소닉스, 인크. 음향 트랜스듀서 구동기 및 제어기
US11268092B2 (en) 2018-01-12 2022-03-08 GenEdit, Inc. Structure-engineered guide RNA
WO2020023529A1 (en) * 2018-07-24 2020-01-30 The Regents Of The University Of California Rna-guided nucleic acid modifying enzymes and methods of use thereof
KR102090078B1 (ko) * 2018-11-22 2020-03-17 경희대학교 산학협력단 배추의 내건성 관련 유전자 교정용 식물형질전환 벡터 및 이의 적용 방법
DE112020001342T5 (de) 2019-03-19 2022-01-13 President and Fellows of Harvard College Verfahren und Zusammensetzungen zum Editing von Nukleotidsequenzen
NL2024019B1 (en) * 2019-10-15 2021-06-17 Univ Delft Tech Detection of a target polynucleotide
CN115279898A (zh) * 2019-10-23 2022-11-01 成对植物服务股份有限公司 用于植物中rna模板化编辑的组合物和方法
BR112022008415A2 (pt) 2019-11-05 2022-09-06 Pairwise Plants Services Inc Composições e métodos para substituição do dna codificado pelo rna dos alelos
CN112779240B (zh) * 2019-11-11 2022-09-23 北京惠大生物科技有限公司 Crispr家族蛋白与核酸的定点偶联方法及其偶联物和用途
DE112021002672T5 (de) 2020-05-08 2023-04-13 President And Fellows Of Harvard College Vefahren und zusammensetzungen zum gleichzeitigen editieren beider stränge einer doppelsträngigen nukleotid-zielsequenz
CN112225790B (zh) * 2020-10-14 2021-12-10 厦门大学 水稻抗盐胁迫相关基因onac103及编码蛋白与应用
CN113462717A (zh) * 2021-06-28 2021-10-01 郑州大学 BSMV投送splited-Sacas9和sgRNA介导的基因编辑方法

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2467167B (en) 2009-01-26 2013-09-11 Algentech Sas Gene targeting in plants
KR20150027756A (ko) 2012-05-30 2015-03-12 베일러 칼리지 오브 메디신 Dna 수복, 변경 및 대체를 위한 도구로서의 초나선 미니벡터
WO2014093694A1 (en) * 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
US10227610B2 (en) 2013-02-25 2019-03-12 Sangamo Therapeutics, Inc. Methods and compositions for enhancing nuclease-mediated gene disruption
NZ712727A (en) 2013-03-14 2017-05-26 Caribou Biosciences Inc Compositions and methods of nucleic acid-targeting nucleic acids
EP2796558A1 (en) 2013-04-23 2014-10-29 Rheinische Friedrich-Wilhelms-Universität Bonn Improved gene targeting and nucleic acid carrier molecule, in particular for use in plants
CN105531372A (zh) 2013-06-14 2016-04-27 塞尔克蒂斯股份有限公司 植物中非转基因基因组编辑方法
SG10201913026TA (en) 2013-07-09 2020-02-27 Harvard College Multiplex rna-guided genome engineering
US10563225B2 (en) 2013-07-26 2020-02-18 President And Fellows Of Harvard College Genome engineering
EP3036334A1 (en) 2013-08-22 2016-06-29 E. I. du Pont de Nemours and Company A soybean u6 polymerase iii promoter and methods of use
WO2015054375A2 (en) * 2013-10-08 2015-04-16 International Rice Research Institute Drought-resistant cereal grasses and related materials and methods
EP3971283A1 (en) 2014-02-27 2022-03-23 Monsanto Technology LLC Compositions and methods for site directed genomic modification
EP3155116A4 (en) 2014-06-10 2017-12-27 Massachusetts Institute Of Technology Method for gene editing
CN113789317B (zh) 2014-08-06 2024-02-23 基因工具股份有限公司 使用空肠弯曲杆菌crispr/cas系统衍生的rna引导的工程化核酸酶的基因编辑
CA2963080A1 (en) * 2014-10-01 2016-04-07 The General Hospital Corporation Methods for increasing efficiency of nuclease-induced homology-directed repair
US20170306306A1 (en) * 2014-10-24 2017-10-26 Life Technologies Corporation Compositions and Methods for Enhancing Homologous Recombination
RS64527B1 (sr) 2015-01-28 2023-09-29 Caribou Biosciences Inc Hibridni polinukleotidi crispr dnk/rnk i postupci upotrebe
GB201504223D0 (en) 2015-03-12 2015-04-29 Genome Res Ltd Biallelic genetic modification
CA3149413A1 (en) 2015-04-10 2016-10-13 Feldan Bio Inc. Polypeptide-based shuttle agents for improving the transduction efficiency of polypeptide cargos to the cytosol of target eukaryotic cells, uses thereof, methods and kits relating to same
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
KR102691636B1 (ko) * 2015-08-31 2024-08-02 애질런트 테크놀로지스, 인크. 상동 재조합에 의한 crispr/cas-기반 게놈 편집을 위한 화합물 및 방법
AU2016339053A1 (en) 2015-09-24 2018-04-12 Crispr Therapeutics Ag Novel family of RNA-programmable endonucleases and their uses in genome editing and other applications
WO2017070598A1 (en) 2015-10-23 2017-04-27 Caribou Biosciences, Inc. Engineered crispr class 2 cross-type nucleic-acid targeting nucleic acids
EP3443088B1 (en) 2016-04-13 2024-09-18 Editas Medicine, Inc. Grna fusion molecules, gene editing systems, and methods of use thereof
EP4166660A1 (en) 2016-04-29 2023-04-19 BASF Plant Science Company GmbH Improved methods for modification of target nucleic acids using fused guide rna - donor molecules

Also Published As

Publication number Publication date
BR112018074494A2 (pt) 2019-03-19
AU2017272623A1 (en) 2018-11-29
JP2019517261A (ja) 2019-06-24
EP3464594A1 (en) 2019-04-10
CN109642232A (zh) 2019-04-16
WO2017207589A1 (en) 2017-12-07
US20190161760A1 (en) 2019-05-30
EA201892810A1 (ru) 2019-06-28
US12084668B2 (en) 2024-09-10
CA3025828A1 (en) 2017-12-07

Similar Documents

Publication Publication Date Title
KR20190012229A (ko) 유전자 조작을 위한 하이브리드 핵산 서열
EP3574101B1 (en) Repair template linkage to endonucleases for genome engineering
JP6947784B2 (ja) オリゴヌクレオチド仲介型遺伝子修復を使用した標的遺伝子修飾の効率を高めるための方法および組成物
CN108795972B (zh) 不使用转基因标记序列分离细胞的方法
JP6275668B2 (ja) 配列特異的ヌクレアーゼのナノ粒子媒介送達
JP6777549B2 (ja) オリゴヌクレオチド仲介型遺伝子修復を使用した標的遺伝子修飾の効率を高めるための方法および組成物
JP2016539653A (ja) 微小藻類のゲノム操作のためのCas9ヌクレアーゼプラットフォーム
JP2019506170A (ja) オリゴヌクレオチド介在性遺伝子修復を利用した標的遺伝子修飾の効率を上昇させるための方法および組成物
JP2015500648A (ja) 所定の標的核酸配列を修飾するための組成物及び方法
BR112020012327A2 (pt) sistemas de regulação de transcrição com base em cpf1 em plantas
US20230332169A1 (en) Gene edited wheat plants with enhanced traits
KR20210099608A (ko) 게놈 편집을 통한 유전자 침묵화
US20230235349A1 (en) Novel maize cells and maize plants
KR20200004382A (ko) 전이유전자성 마커 서열을 이용하지 않는 세포 단리 방법
WO2022120142A1 (en) Pest and pathogen resistant soybean plants
US11802288B1 (en) Methods for efficient soybean genome editing
US11926835B1 (en) Methods for efficient tomato genome editing
Orel The influence of DNA double-strand break repair on plant genome integrity

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application