KR20200004382A

KR20200004382A - 전이유전자성 마커 서열을 이용하지 않는 세포 단리 방법

Info

Publication number: KR20200004382A
Application number: KR1020197036090A
Authority: KR
Inventors: 차이샤 가오; 루이 장; 진싱 류; 아론 험멜; 자리르 바츠히파왈라; 마티아스 랩스
Original assignee: 인스티튜트 오브 제네틱스 앤드 디벨롭멘털 바이오롤지, 차이니즈 아카데미 오브 사이언시스
Priority date: 2017-05-05
Filing date: 2018-05-07
Publication date: 2020-01-13
Also published as: KR20220137166A; EP3635118A1; EP3635118A4; CA3062475A1; AU2018263195B2; BR112019022737A2; JP2020518253A; US20210230616A1; AU2018263195A1; CN117051035A

Abstract

본 발명은 표현형으로 선별가능한 형질의 병행 도입과 조합된, 식물, 식물 세포 또는 물질에서의 타겟화된 편집 방법에 관한 것이다. 또한, 본 발명은 전이유전자성 선별 마커 서열을 도입하는 단계를 포함하지 않는 방법을 제공한다.

Description

전이유전자성 마커 서열을 이용하지 않는 세포 단리 방법

본 발명은, 표현형으로 선별가능한 형질의 병행 도입 (parallel introduction)과 조합되는, 식물, 식물 세포 또는 물질에서의 타겟화된 편집 (targeted editing) 방법에 관한 것이다. 또한, 전이유전자성 선별 마커 서열 (transgenic selection marker sequence)을 도입하는 단계를 포함하지 않는 방법을 제공한다. 이 방법은 제1 게놈 타겟 부위에 타겟화된 변형을 도입하여, 외인성 폴리뉴클레오티드 주형의 제공 또는 타겟 부위에의 이중 가닥 절단의 도입에 의존하지 않는 선별가능한 표현형을 수득하는 것을 포함한다. 마지막으로, 본 발명은 서로 다른 게놈 타겟 부위에서 전이유전자성 마커-프리 선별 (transgenic marker-free selection) 및 타겟화된 편집을 병행함으로써, 식물 물질을 선별 마커 카세트 없이도 단리할 수 있는 선별가능한 또는 기타 표현형을 부여하여, 대상 유전자형을 동정하기 위한 현저하게 감소된 선별 시도를 포함하는 정확한 육종을 가능하게 한다.

진핵생물 세포의 정확한 유전자 정보 변형은 농업, 제약 및 의학 응용분야들에서 상당한 가치가 있지만, 기초 연구에서도 중요하다. 게놈 조작 또는 편집은 높은 정확도로 타겟에 지정된 유전자 변화를 만드는 능력을 나타낸다. 타겟화된 이중 가닥 절단은 예를 들어 진핵생물 세포에서 부위-특이적인 뉴클레아제 (SSN) 또는 재조합효소에 의해 구축될 수 있다.

식물의 경우, 정확한 이중 가닥 절단 유도는 상동적인 재조합 (HR) 현상의 빈도를 100x 내지 1000x 높인다 (Puchta et al., Proc. Natl. Acad. Sci. USA 93:5055-5060, 1996). 그러나, 변형된 세포 및 식물의 다운스트림 동정은 식물 개선을 위한 육종 도구로서 유전자 편집의 일상적인 사용을 제한한다.

농약과 같은 농업 기술에서 식물 육종 및 개발은 한 세기 동안 농작물 생산량 증가에 상당한 진전을 거두었다. 그러나, 식물 육종가들은 수많은 변화에 계속적으로 대응하여야 한다. 농업 관행이 바뀌고 있어, 특이적인 농경 특징을 보유한 유전자형의 식물 개발 필요성이 발생한다. 또한, 타겟 환경 및 그 환경 내 유기체는 계속적으로 바뀌고, 예를 들어, 진균 및 해충이 계속 발생하여, 대상 식물의 저항성을 극복한다. 새로운 토지는 정기적으로 농사에 사용되어, 식물은 달라진 재배 조건에 노출된다. 마지막으로, 소비자 선호 및 요구 사항도 변한다. 이에 식물 육종가들은 새로운 농작물 품종을 계속적으로 개발하여야 하는 끊임없는 과제에 직면해있다 (Collard and Mackill, Philos. Trans. R. Soc. Lond. B. Biol. Sci. 2008 Feb 12; 363(1491): 557-572).

육종 전략을 돕기 위해, 대상 유전자형을 신뢰성있게 확인할 수 있도록, 진단학적 가능성을 가진 선별가능한 마커 서열 또는 마커-보조 선별 (marker-assisted selection, MAS) 전략이 필요하다. EP 2 342 337 B1에 개시된 바와 같이, 진단 마커의 개발은 대상 형질의 기저가 되는 유전자(들)의 유전자 위치 맵핑에서 시작되는 프로세스는, 측면 마커 동정, 밀접하게 연관된 마커의 동정을 통한 유전자(들)의 정밀 맵핑, 가장 연관된 마커의 DNA 마커 서열 결정, 타겟 유전자를 맵핑하는데 사용된 부모 계통들 간에 마커 유전자 좌에서의 서열 변이 확인, 간단한 PCR 분석 개발, 스크리닝 또는 육종시 진단 특성을 가진 마커를 테스트하게 될, 식물 물질의 유전자 백그라운드 (생식질 (germplasm))에서 예측치 검정으로 이어지게 된된다. 이러한 전략은, 대상 게놈 내 적정 위치에 대상 마커가 존재하여야 하거나 또는 삽입되어야 하므로, 기본적으로 고된 일이며, 따라서 비용 집약적이다.

DNA 마커 기술은 표현형 형질을 확인하는 대신 용이한 마커 분석에 기반한 선별을 가능하게 함으로써 식물 육종의 효율을 상당히 높일 수 있다. 그러나, 진단 또는 스크리닝 특성을 가진 마커 개발 및 이들 마커의 적용 효과는 앞서 기술한 바와 같이 어려운 일이며 시간이 많이 소요되는 과정이다. 현재, 점 돌연변이, 예를 들어, SNP를 검출하는 방법은 오직 제한된 수의 점 돌연변이를 제한된 수로 동정할 수 있으며, 제한된 레퍼토리를 검출할 수 있다 (Slade et al., Nat. Biotech. 23, 75-81).

여전히, 선별가능한 마커 유전자는 형질전환 및 색소체형질전환 (transplastomic) 식물 연구 또는 농작물 개발에서 식물에서 중요한 역할을 수행한다. 선별가능한 마커 유전자는 종종 리포터 유전자와 함께 사용되는데, 리포터 유전자는 선택 이점을 세포에 제공하진 않지만, 형질전환 현상을 모니터링하거나 또는 비-형질전환 물질로부터 형질전환 물질을 수동 분리하는데 사용될 수 있다.

빠르게 발전하고 있는 영역은 마커-프리 (marker-free) 식물을 제조하기 위해 선별가능한 마커 유전자를 없애는 전략을 개발하는 것이다. 마커-프리 식물의 구축 합리화는 여러가지 관점에서 상세히 논의되어 있다 (Yoder and Goldsbrough, 1994; Ow, 2001; Hare and Chua, 2002). 형질전환 및 비-형질전환 식물의 상업화를 위해, 최종 식물 품종에서 용도를 제공하지 않는 유전자 서열을 제거하는 것이 규정된 절차를 단순화하고 소비자 허용성을 개선할 것이다. 최종 식물로부터 마커 유전자의 제거는 광범위한 생물안전성 평가를 거치지 않았거나 또는 식물에서 부정적인 다면발현 효과 (pleiotropic effect)를 발생시킬 수 있는 실험 마커 유전자의 사용을 허용할 것이다. 또한, 이는 다음번 형질전환 전에 제거된다면 형질전환 식물의 반복적인 형질전환에 사용가능한 마커 유전자의 재사용을 허용할 것이다.

따라서, 전이유전자성 선별 마커 유전자는 처리된 세포로부터 재생되는 식물의 회수 효율을 높일 순 있지만, 식물 게놈 내 전이유전자 서열을 도입하는 것이 늘 바람직한 것은 아니다. 또한, 형질전환 마커 유전자를 선별한 후 제거하는 것 역시 종종 매우 복잡하다.

정확한 유전자 편집 또는 게놈 조작은 과거 수년 간 대상 게놈의 타겟화된 부위-특이적인 조작을 달성할 수 있는 가장 중요한 유전자 조작 분야 중 하나로서 부상하였다. 부위-특이적인 게놈 조작의 필수 전제 조건은 프로그래밍가능한 뉴클레아제로서, 이를 사용해 지정된 위치에서 대상 핵산을 절단하여 이중 가닥 절단 (DSB) 또는 하나 이상의 단일 가닥 절단을 만들 수 있다. 다른 예로, 이러한 뉴클레아제는, 뉴클레아제 기능을 포함하지 않고 다른 효소와 조합하여 인지 서열로서 작용한다면, 키메라 또는 돌연변이된 변이체일 수 있다. 이러한 뉴클레아제 또는 이의 변이체가 임의의 유전자 편집 또는 게놈 조작 방식에서 핵심이다. 최근 수년간, 메가뉴클레아제, 징크 핑거 뉴클레아제, TALE 뉴클레아제, 아르고너트 (Argonaute) 뉴클레아제, 예를 들어 나트로노박테리움 그레고리 (Natronobacterium gregoryi)로부터 유래된 아르고너트 (Argonaute) 뉴클레아제, 그리고 예를 들어, CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) 시스템의 일부로서 Cas, Cpf1, CasX 또는 CasY 뉴클레아제를 포함하는 CRISPR 뉴클레아제를 포함하여, 적절한 다수의 뉴클레아제, 특히 맞춤형 엔도뉴클레아제들이 개발되었다.

CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats)는, 본래, CRISPR 시스템이 바이러스 공격을 방어하기 위한 후천적인 면역 시스템의 역할을 수행하는 박테리아에서, 천연 환경에서 진화되었다. 바이러스에 노출되면, 바이러스의 짧은 DNA 세그먼트가 CRISPR 유전자 좌에 삽입된다. 바이러스 서열을 포함하는 CRISPR 유전자 좌의 영역으로부터 RNA가 전사된다. 바이러스 게놈에 상보적인 서열을 포함하고 있는 이 RNA는, CRISPR 작동자 (effector) 단백질을 바이러스 게놈 내 타겟 서열을 타겟팅하도록 매개한다. CRISPR 작동자 단백질은 바이러스 타겟을 절단함으로써, 바이러스의 복제를 방해한다. 과거 수년간, CRISPR 시스템은 진핵생물 세포에서도 유전자 편집 또는 게놈 조작에 성공적으로 적용되고 있다. 현재 동물 세포에서의 편집 및 인간에서의 치료학적인 적용이 주된 중점 연구 과제이다. 복잡한 동물 및 식물 게놈을 타겟화된 방식으로 변형시키는 것은 여전히 어려운 과제이다.

CRISPR 시스템은, 천연 환경에서, 하나 이상의 작은 개별 비-코딩 RNA를, Cas 뉴클레아제 또는 특이적인 DNA 이중 가닥 절단을 만들 수 있는 Cpf1 뉴클레아제 (Zetsche et al., "Cpf1 is a Single RNA-Guides Endonuclease of a Class 2 CRISPR-Cas System", Cell, 163, pp. 1-13, October 2015)와 같은 다른 CRISPR 뉴클레아제와 조합하여 포함하는, 분자 복합체이다. 현재, CRISPR 시스템은 5가지 타입의 CRISPR 시스템을 포함하는 2가지 클래스, 즉, 예를 들어 작동자로서 Cas9를 이용하는 타입 II 시스템과, 작동자 분자로서 Cpf1을 이용하는 타입 V 시스템으로 분류된다 (Makarova et al., Nature Rev. Microbiol., 2015). 인공적인 CRISPR 시스템에서, 합성 비-코딩 RNA 및 CRISPR 뉴클레아제 및/또는 선택적으로, 닉카제 (nickase)로서 작용하도록 변형되거나 또는 어떠한 뉴클레아제 기능이 결핍되도록 변형된 CRISPR 뉴클레아제는, crRNA 및/또는 tracrRNA의 기능을 겸비한 하나 이상의 합성 또는 인공 가이드 RNA 또는 gRNA와 조합하여, 사용될 수 있다 (Makarova et al., 2015, supra). 천연 시스템에서 CRISPR/Cas에 의해 매개되는 면역 반응에는 CRISPR-RNA (crRNA)가 필요한데, CRISPR 뉴클레아제의 특이적인 활성화를 조절하는 이러한 가이드 RNA의 성숙화는 지금까지 파악된 다양한 CRISPR 시스템들에 따라 매우 다양하다. 먼저, 스페이서 (spacer)라고도 하는 침입 DNA (invading DNA)가 CRISPR 유전자 좌의 근위 말단에 위치된 2개의 인접 반복 영역 사이에 삽입된다. 타입 II CRISPR 시스템은 간섭 단계 (interference step)의 핵심 효소로서 Cas9 뉴클레아제를 코딩하며, 이 시스템은 crRNA와 또한 가이드 모티프로서 트랜스-활성화성 RNA (trans-activating RNA, tracrRNA)를 둘다 포함한다. 이들이 혼성되어, RNAseIII에 의해 인지되는 이중 가닥 (ds) RNA 영역을 만드는데, 이것이 절단되어 성숙한 crRNA가 될 수 있다. 이후, Cas 분자와 조합되어, 뉴클레아제를 타겟 핵산 영역으로 특이적으로 안내한다. 재조합 gRNA 분자는 가변적인 DNA 인지 영역과 Cas 상호작용 영역을 둘다 포함할 수 있으며, 따라서, 특이적인 타겟 핵산 및 바람직한 Cas 뉴클레아제와는 독립적으로, 특이적으로 설계될 수 있다. 추가적인 안전 기전으로서, PAM (protospacer adjacent motif)이 타겟 핵산 영역에 존재하여야 하며; PAM은 Cas9/RNA 복합체-인지 DNA 바로 다음에 위치하는 DNA 서열이다. 스트렙토코커스 피오게네스 (Streptococcus pyogenes) Cas9의 경우, PAM 서열은 "NGG" 또는 "NAG" (표준 IUPAC 뉴클레오티드 코드)로 알려져 있다 (Jinek et al, "A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity", Science 2012, 337: 816-821). 스타필로코커스 아우레우스 (Staphylococcus aureus) Cas9의 경우, PAM 서열은 "NNGRRT" 또는 "NNGRR(N)"이다. 또 다른 변이체 CRISPR/Cas9 시스템들도 알려져 있다. 즉, 네이세리아 메닌기티디스 (Neisseria meningitidis) Cas9은 PAM 서열 NNNNGATT에서 절단한다. 스트렙토코커스 서모필러스 (Streptococcus thermophilus) Cas9은 PAM 서열 NNAGAAW에서 절단한다. 최근, 캄필로박터 (Campylobacter)의 CRISPR 시스템에 대한, 또 다른 PAM 모티프 NNNNRY가 공지되었다 (WO　2016/021973 A1). Cpf1 뉴클레아제의 경우, Cpf1-crRNA 복합체가 짧은 T-풍부 PAM 앞에 위치하는 타겟 DNA를 효과적으로 절단하는 것으로 공지되었는데, 이는 일반적으로 Cas9 시스템이 G-풍부 PAM을 인지하는 것과는 대비된다 (Zetsche et al., supra). 또한, 변형된 CRISPR 폴리펩타이드를 이용함으로써, 특이적인 단일 가닥의 절단을 만들 수 있다. Cas 닉카제와 다양한 재조합 gRNA의 조합 사용 역시 이중 DNA 닉킹을 이용해 매우 특이적인 DNA 이중 가닥 절단을 유도할 수 있다. 또한, 2개의 gRNA를 이용함으로써, DNA 결합의 특이성, 즉 DNA 절단을 최적화할 수 있다.

현재, 예를 들어, 엔도뉴클레아제로서 Cas9 또는 이의 변이체 또는 임의의 키메라 형태에 의존하는 타입 II 시스템이 게놈 조작용으로 변형되었다. 2개의 구성성분, 즉 싱글 가이드 RNA (sgRNA)로도 지칭되는 가이드 RNA (gRNA)와 비-특이적인 CRISPR-부속 엔도뉴클레아제로 이루어진 합성 CRISPR 시스템을 이용해, 타겟팅할 유전자에 특이적이면서 엔도뉴클레아제 Cas9와 조합될 수 있는 gRNA를 공동-발현함으로써, 넉-아웃 세포 또는 동물을 구축할 수 있다. 특히, gRNA는, Cas 또는 임의의 다른 CRISPR 작동자 단백질 또는 이의 변이체 또는 촉매학적 활성 단편과 상호작용하는 하나의 도메인과, 대상 타겟 핵산과 상호작용하는 또 다른 도메인을 포함하는, 인공 분자이며, 즉 crRNA와 tracrRNA로 된 합성 융합체이다 ("싱글 가이드 RNA" (sgRNA) 또는 간단히 "gRNA"; Jinek et al., 2012, supa). 게놈 타겟은 뉴클레오티드 약 20개로 된 DNA 서열일 수 있으며, 이 타겟은 PAM 서열 바로 상류에 존재한다. PAM 서열은 타겟 결합에 특히 중요하며, 정확한 서열은 Cas9의 타입에 따라 결정되며, 예를 들어, 스트렙토코커스 피오게네스 유래 Cas9의 경우 5' NGG 3' 또는 5' NAG 3' (표준 IUPAC 뉴클레오티드 코드)를 인지한다 (Jinek et al., 2012, supra). 변형된 Cas 뉴클레아제를 사용해, 대상 타겟 서열에 타겟화된 단일 가닥 절단을 만들 수 있다. 이러한 Cas 닉카제를 다른 재조합 gRNA와 조합 사용하면, 이중 닉킹 시스템을 이용하여 높은 수준의 부위 특이적인 DNA 이중 가닥 절단을 도입할 수 있다. 하나 이상의 gRNA를 사용하면, 전체 특이성은 추가로 높이고, 오프-타겟 효과는 낮출 수 있다.

Cas9 단백질과 gRNA는, 일단 발현되면, gRNA "스캐폴드" 도메인과 Cas9 상의 표면-노출된 양 전하의 그루브 간의 상호작용을 통해, 리보뉴클레오-단백질 복합체를 형성한다. 중요한 점은, gRNA의 "스페이서" 서열이 자유로운 상태로 남아 타겟 DNA와 상호작용하게 된다는 것이다. Cas9-gRNA 복합체는 PAM을 가진 임의의 게놈 서열과 결합하지만, gRNA 스페이서가 타겟 DNA와 매칭되는 정도에 따라 Cas9의 절단 여부가 결정된다. Cas9-gRNA 복합체가 잠정적인 DNA 타겟에 결합하면, gRNA 타겟팅 서열의 3' 말단에 위치한 "시드 (seed)" 서열이 타겟 DNA에 대한 어닐링을 개시한다. 시드 서열과 타겟 DNA 서열이 매칭되면, gRNA는 타겟 DNA에 3'에서 5' 방향 (gRNA의 극성 (polarity)을 기준으로)으로 계속 어닐링하게 될 것이다.

최근, 타겟화된 게놈 조작에 CRISPR/Cas9 시스템과 더불어, 조작된 CRISPR/Cpf1 시스템이 점점 중요해지고 있다 (Zetsche et al., supra 및 EP 3 009 511 A2). 타입 V 시스템은 타입 II 시스템과 더불어 클래스 2 CRISPR 시스템에 속한다 (Makarova and Koonin Methods. Mol. Biol., 2015, 1311:47-753). Cpf1 작동자 단백질은, Cas9의 특징적인 아르기닌-풍부 클러스터에 대한 카운터파트와 더불어, Cas9의 해당 도메인에 상동적인 RuvC 유사 뉴클레아제 도메인을 포함하는 거대 단백질 (아미노산 약 1,3000개)이다. 그러나, Cpf1에는 모든 Cas9 단백질에 존재하는 HNH 뉴클레아제 도메인이 없으며, HNH 도메인 등의 긴 삽입체를 포함하고 있는 Cas9와는 달리 Cpf1 서열에서는 RuvC-유사 도메인이 연속적이다 (Chylinski, 2014; Makarova, 2015). Cpf1 작동자는 Cas9 작동자와 비교해 구체적인 차이가 있으며, 즉 CRISPR 어레이 프로세싱, 짧은 T-풍부 PAM에 의한 타겟 DNA의 효과적인 절단 (PAM이 G-풍부 서열 앞에 있는 Cas9과 대조적으로), 및 Cpf1에 의한 엇갈린 형태의 (staggered) DNA 이중 가닥 절단 도입에, 부가적인 트랜스-활성화 crRNA (tracrRNA)가 요구되지 않는다. 극히 최근에, CasX 및 CasY에 기반한 부가적인 새로운 CRISPR-Cas 시스템이 동정되었으며, 이는 작동자 단백질의 비교적 작은 크기로 인해 수많은 유전자 편집 또는 게놈 조작 방식에서 특히 주목을 받고 있다 (Burstein et al., "New CRISPR-Cas systems from uncultivated microbes", Nature, December 2016).

여전히, CRISPR 시스템 그 자체는 타겟 세포의 대상 게놈 내 바람직한 위치에 점 돌연변이를 형성하는 고유한 능력이 결핍되어 있다.

이중 가닥 절단 (DSB)를 도입하는 CRISPR 시스템과 같은 게놈 조작 도구는 DSB 복구 기전이 필요하다. 이러한 기전은 2가지 주된 기본 타입, 즉 비-상동적인 말단 연결 (non-homologous end joining, NHEJ)과 상동적인 재조합 (homologous recombination, HR)으로 분류된다. 상동성에 기초한 복구 기전은 대개 일반적으로 상동성-특이적인 복구 (HOR)로 지칭된다.

NHEJ는 상동적인 서열이 필요없는 동식물에서의 지배적인 핵 반응이지만, 흔히 오류가 발생하며, 따라서 잠재적으로 돌연변이 유발성이다 (Wyman C., Kanaar R. "DNA double-strand break repair: all's well that ends well", Annu. Rev. Genet. 2006; 40, 363-83). HOR에 의한 복구에는 상동성이 필요하지만, 절단된 염색체를 복구하기 위해 온전한 염색체를 이용하는 HOR 경로, 즉 이중 가닥 절단 복구 및 합성-의존적인 가닥 어닐링이 매우 정확하다. 고전적인 DSB 복구 경로에서, 3' 말단이 온전한 상동적인 주형에 침입해, DNA 복구 합성을 위한 프라이머로 사용되어, 궁극적으로 이중 홀리데이 정션 (double Holliday junction, dHJ)의 형성을 유도한다. dHJ는, 침입 가닥의 연장 (elongation)이 제2 DSB 말단으로부터 DNA를 "포획"하여 합성할 때 형성되는, 4 가닥의 갈라진 구조 (four-stranded branched structure)이다. 각각의 HJ는 2가지 방식 중 한가지 방식으로 절단에 의해 해리된다. 합성-의존적인 가닥 어닐링은 보존적이며, 오직 비-교차 방식 (non-crossover event)으로 이루어진다. 이는, 신규 합성된 서열들 모두 동일 분자 상에 존재한다는 것을 의미한다. NHEJ 복구 경로와 달리, 합성-의존적인 가닥 어닐링에서는 가닥 침투 및 D 루프 형성 후, 침투 가닥의 신규 합성된 부분이 주형으로부터 분리되고, 다른 DSB 말단 위치에서 비-침투 가닥의 가공된 말단 쪽으로 회귀한다. 비-침투 가닥의 3' 말단이 연장 및 라이게이션되어, 갭이 채워지게 된다. 아직 충분히 규명된 것은 아니지만 절단-유발성 복구 경로로 지칭되는, 또 다른 HOR 경로도 존재한다. 이 경로의 중요한 특징은 DSB에 복구에 사용될 수 있는 침투 말단이 단 하나라는 것이다.

따라서, 식물 게놈에 타겟화된 점 돌연변이를 도입하고 이 돌연변이를 활용하는 것이 오늘날 도전 과제이다. 또한, 부위-특이적인 뉴클제 (SSN)를 이용한 게놈 조작 가능성은 특히 대상 게놈이 식물 게놈과 같이 복합한 진핵생물 게놈인 경우 SSN에 의해 도입된 변형의 선별 문제를 여전히 가지고 있으며, 타겟화된 변형을 육종시 선별 라운드 동안 추적하여야 한다.

현재 게놈 조작 (GE)의 이용 잠재성이 풍부함에도 불구하고, 이러한 GE 방식 대부분은 하나의 SSN을 포함하는 복합체에 의해 타겟화된 대상 변형을 도입하는 것을 목표로 한다. 따라서, 이러한 타겟화된 변형을 후속 식물 육종을 위해 식물 생식질에 도입하는 것은 가능하지만, 여전히 타겟화된 변형을 후속 추적하는 것은 번거러운 일이다. 만일 선별 마커 또는 선별 마커 카세트를 사용해 선별하는 것을 보조하고, 따라서 잠재적으로 대상이 되는 세포를 분리한다면, 대상 유전자형/표현형 조합을 달성하기 위한 육종시, 연속적인 교배 라운드 후 식물 게놈으로부터 이러한 마커 카세트를 제거하는 것이 상당한 장애물로 여전히 남아있다.

동시에, 예를 들어, 대상 변형에 기반한 대상 형질, 엘리트 이벤트 (elite event) 또는 품종으로부터 교배할 우호적인 특성을 육종시 규정, 구축 또는 교배할 수 있는, 식물 육종에 적합한 새로운 방법을 제공할 필요도 있다. 여러가지 육종 단계 동안에 대상 형질의 존재 및 증폭을 스크리닝하는 것은 때때로 어렵거나 또는 시간이 매우 많이 소요된다.

따라서, 세포 및 식물을 단리하기 위해 더 좋은 방법, 바람직하게는 후속 선별 라운드에서 전이유전자성 마커 서열을 게놈에 삽입할 필요없는 방법이 필요하다. 또한, 선별 및 스크리닝 수단을 위해 외인성 전이유전자 서열을 도입하지 않는 매우 정확한 부위-특이적인 방식으로 구축할 수 있는, 선별가능한 마커 서열이 상당히 요구된다. 마지막으로, 육종시 연속적인 교배 및 선별 라운드 동안에 대상 형질을 생식질에 축적하기 위한 신속 육종을 돕는 새로운 전략을 규정할 필요성이 상당하다.

따라서, 본 발명의 기본 과제는 표현형으로 선별가능한 형질의 스크리닝 용이성을 이용함으로써 유전자 편집 물질로 처리 및 편집된 세포를 분리하는 새로운 방법을 제공하는 것이다. 이를 위해, 세포 및 그 후대에서 선별가능한 또는 기타 표현형을 부여하기 위한 타겟화된 변형을 제1 유전자에 만들어, 형질전환 선별가능한 마커 서열의 도입을 억제한다. 병행하여, 세포에 표현형을 부여하거나 또는 일반적으로 부여하지 않을 수 있는 타겟화된 변형을 대상 제2 유전자에 만든다. 제1 유전자 변형이 적용된 세포를 동정하기 위해, 제1 유전자에서의 변형에 의해 부여된 표현형을 이용하는 다른 방법 또는 선별 물질을 적용함으로써, 세포 및 이의 후대 세포 또는 식물을 무처리 세포 백그라운드로부터 분리 또는 재생할 수 있다. 대상 게놈에 존재하거나 또는 도입할 전이유전자성 선별 마커 서열의 사용없이, 보다 신속하고, 따라서 저렴한 선별을 제공하기 위해, 이들 개체군으로부터 제2 대상 유전자에 타겟화된 변형을 가진 세포 또는 식물을 동정하며, 제2 변형이 추구하는 실제 목표이다.

전술한 과제는, 전략을 제2 부위 특이적인 대상 변형 (site-directed modification of interest)의 타겟화된 도입과 더불어, 비-전이유전자성 및 표현형으로 선별가능한 변형의 부위-특이적인 도입을 병행하도록 정의함으로써, 본원에 상세히 기술된 바와 같이 달성하였다. 일반적으로, 제2 변형은, 이것으로 부여되는 표현형이 식물 재생 과정에서 발현되지 않거나 또는 관련없기 때문에, 선별 기회를 가지지 않을 것이다. 그래서, 본 발명의 방법의 기초가 되는 목적은 선별 도구로서 제1 변형을 이용하는 것이다. 전통적인 전략과 비교해, 본 발명의 방법은 전이유전자성 마커 유전자를 도입하지 않는 이점을 가진다. 대응되는 선별 물질로 선별가능한 선별 표현형을 이용하지 않는 경우와 비교해, 식물을 생성하는 세포 대부분을 차지할 비처리 세포를 모두 또는 대부분 제거함으로써 효율을 높이는 이점을 가진다. 제1 식물 게놈 타겟 부위에서 표현형으로 선별가능한 형질의 발현을 유발하는타겟화된 변형을 겪지 않은 비처리 세포를 제거함으로써, 생산하여야 하는 식물의 수가 크게 줄어들고, 제2 변형에 대해 분자 스크리닝해야 할 식물의 숫자도 상당히 줄어든다. 본 발명에 따른 방법은 따라서 육종 효율을 현저하게 높이고, 노동-집약적인 단계들을 회피한다.

구체적으로, 상기한 과제들은, 제1 측면에서, (a) 하나 이상의 제1 타겟화된 염기 변형을 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에 도입하는 단계로서, 하나 이상의 타겟화된 염기 변형이 하나 이상의 표현형으로 선별가능한 형질의 발현을 유발하는, 단계; (b) 하나 이상의 제2 타겟화된 변형을 변형할 하나 이상의 식물 세포의 제2 식물 게놈 타겟 부위에 도입하는 단계로서, 하나 이상의 제2 타겟화된 변형이 하나 이상의 부위-특이적인 작동자를 이용해 도입되어 제2 식물 게놈 타겟 부위에 하나 이상의 제2 타겟화된 변형이 달성되고, 하나 이상의 제1 타겟화된 염기 변형의 도입과 동시에 또는 후속적으로 하나 이상의 제2 타겟화된 변형이 변형할 동일한 하나 이상의 식물 세포 또는 하나 이상의 제1 타겟화된 변형을 포함하는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물에 도입되어 하나 이상의 변형된 식물 세포가 수득되는 단계; 및 (c) (i) 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형에 의해 유발된 하나 이상의 표현형으로 선별가능한 형질을 선별하고, 선택적으로 (ii) 제2 식물 게놈 타겟 부위에서 하나 이상의 제2 타겟화된 변형을 추가로 선별함으로써, 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 단리하거나, 또는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물을 단리하는 단계를 포함하는, 전이유전자성 선별 마커 서열의 안정적인 통합없이, 하나 이상의 변형된 식물 세포 또는 하나 이상의 변형된 식물 세포를 포함하는 하나 이상의 변형된 식물 조직, 기관 또는 완전한 식물 (whole plant)을 단리하는 방법을 제공함으로써, 달성되었다.

본 발명의 다양한 측면에 따른 일 구현예에서, (b) 부가적으로 복구 주형을 도입하여, 적어도 제2 식물 게놈 타겟 부위에서 타겟화된 서열 변환 (targeted sequence conversion) 또는 치환을 만드는 단계를 포함하는, 방법을 제공한다.

추가적인 구현예에서, 제1 측면에 따른 방법은, (d) 하나 이상의 제1 타겟화된 변형 및 하나 이상의 제2 타겟화된 변형을 포함하는 하나 이상의 변형된 식물 또는 식물 물질을 추가의 대상 식물 또는 식물 물질과 교배하여, 수득되는 자손 식물 또는 식물 물질을 분리 (segregation)함으로써, 대상 유전자형, 선택적으로 하나 이상의 제1 타겟화된 변형을 포함하지 않는 대상 유전자형을 달성하는 단계를 더 포함한다.

일 구현예에서, 하나 이상의 부위-특이적인 작동자는 하나 이상의 염기 편집 복합체와 일시적으로 또는 영구적으로 연결되며, 염기 편집 복합체는 단계 (a)의 하나 이상의 제1 타겟화된 염기 변형을 매개한다.

추가적인 구현예에서, 하나 이상의 부위-특이적인 작동자는 CRISPR 뉴클레아제, 예로 Cas 또는 Cpf1 뉴클레아제, TALEN, ZFN, 메가뉴클레아제, 아르고너트 (Argonaute) 뉴클레아제, 제한 엔도뉴클레아제, 예로, FokI 또는 이의 변이체, 재조합효소 또는 2 부위-특이적인 닉킹 엔도뉴클레아제, 또는 염기 편집기 (base editor), 또는 전술한 작동자의 임의의 변이체 또는 촉매학적으로 활성인 단편을 포함하는, 하나 이상의 뉴클레아제로부터 선택된다.

다른 추가의 구현예에서, 하나 이상의 부위-특이적인 작동자는 CRISPR-기반의 뉴클레아제이며, CRISPR-기반의 뉴클레아제는 하나 이상의 염기 편집 복합체에 관한 부위-특이적인 DNA 결합 도메인 (site-specific DNA binding domain directing the at least one base editing complex)을 포함하며, 하나 이상의 CRISPR-기반의 뉴클레아제 또는 이를 코딩하는 핵산 서열은 (a) SpCas9, SaCas9, SaKKH-Cas9, VQR-Cas9, St1Cas9 등의 Cas9, (b) AsCpf1, LbCpf1, FnCpf1 등의 Cpf1, (c) CasX, 또는 (d) CasY, 또는 전술한 CRISPR-기반의 뉴클레아제의 임의 변이체 또는 유도체를 포함하는 군으로부터 선택되며, 바람직하게는 하나 이상의 CRISPR-기반의 뉴클레아제는 대응되는 야생형 서열과 비교해 돌연변이를 포함하므로, 형성되는 CRISPR-기반의 뉴클레아제는 단일 가닥 특이적인 DNA 닉카제 또는 모든 DNA 절단력이 결핍된 DNA 결합 작동자로 변환된다.

일 구현예에서, 제1 측면에 따른 하나 이상의 제1 타겟화된 염기 변형은 구성성분으로서 하나 이상의 염기 편집기를 포함하는 하나 이상의 염기 편집 복합체에 의해 만들어진다.

일 구현예에서, 염기 편집 복합체는 하나 이상의 시티딘 데아미나제 및 이의 촉매학적으로 활성인 단편을 포함한다.

추가적인 구현예에서, 하나 이상의 제1 타겟화된 염기 변형은 임의의 뉴클레오티드 C, A, T 또는 G가 임의의 다른 뉴클레오티드로 변환되는 것이다.

본 발명의 방법에 따른 일 구현예에서, 염기 편집 복합체는 APOBEC1 구성성분, UGI 구성성분, XTEN 구성성분 또는 PmCDA1 구성성분 중 하나 이상을 포함한다. 추가적인 구현예에서, 하나 이상의 염기 편집 복합체는 구성성분을 1개 보다 많이 포함하며, 2개 이상의 구성성분이 물질적으로 연결된다.

본 발명의 방법에 따른 일 측면에서, 하나 이상의 염기 편집 복합체는 하나 보다 많은 수의 구성성분을 포함하며, 2 이상의 구성성분은 개별 구성성분으로서 제공된다.

본 발명의 방법에 따른 추가적인 구현예에서, 하나 이상의 염기 편집 복합체의 하나 이상의 구성성분은 하나 이상의 염기 편집 복합체를 세포내 소기관으로 타겟팅하기 위한 하나 이상의 소기관 위치화 신호를 포함한다. 일 구현예에서, 하나 이상의 소기관 위치화 신호는 핵 위치화 신호 (NLS)이며, 추가적인 구현예에서, 하나 이상의 소기관 위치화 신호는 엽록체 수송 펩타이드이다. 다른 추가의 구현예에서, 하나 이상의 소기관 위치화 신호는 미토콘드리아 수송 펩타이드이다.

본 발명의 방법의 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 게놈 타겟 부위이고, 하나 이상의 표현형으로 선별가능한 형질은 내성 형질/허용성 형질 (tolerance trait) 또는 생장 우세 형질 (growth advantage trait)이며, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형은 하나 이상의 변형된 식물 세포, 조직 또는 식물 또는 그 자손에 부가할, 화합물 또는 촉발인자에 대한 내성/허용성 또는 생장 우세 (growth advantage)를 부여한다.

일 구현예에서, 하나 이상의 표현형으로 선별가능한 대상 형질은 하나 이상의 내인성 유전자이거나 또는 이에 의해 코딩되거나, 또는 하나 이상의 대상 표현형 형질은 하나 이상의 전이유전자이거나 또는 이에 의해 코딩되며, 하나 이상의 내인성 유전자 또는 하나 이상의 전이유전자는 하나 이상의 대상 표현형 형질에서 하나 이상의 변형이 결핍된 세포를 저해, 손상 또는 사멸시키는, 식물독소, 바람직하게는 제초제에 대한 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형 형질을 코딩하거나, 또는 하나 이상의 표현형 형질은 세포 분열, 증식 속도, 배발생 또는 비-변형된 세포, 조직, 기관 또는 식물과 비교해 변형된 세포, 조직, 기관 또는 식물에 우세를 제공하는 다른 표현형으로 선별가능한 특성의 부스터 (booster)로 이루어진 군으로부터 선택된다.

일 구현예에서, 하나 이상의 제1 식물 게놈 타겟 부위는 제초제 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 하나 이상의 내인성 유전자 또는 전이유전자이며, 제초제 내성/허용성은 글리포세이트 등의 EPSPS-저해제에 대한 내성/허용성, 글루포시네이트 등의 글루타민 합성 저해제에 대한 내성/허용성, 이미다졸린 또는 설포닐우레아 등의 ALS- 또는 AHAS-저해제에 대한 내성/허용성, 아릴옥시페녹시프로피오네이트 (FOP) 등의 ACCase 저해제에 대한 내성/허용성, 피토엔 데세투라제 (phytoene desaturase) 단계에서 카로티노이드 생합성의 저해제, 4-하이드록시페닐-피루베이트-다이옥시게나제 (HPPD)의 저해제 또는 기타 카로티노이드 생합성 타겟의 저해제 등의 카로티노이드 생합성 저해제에 대한 내성/허용성, 셀룰로스 저해제에 대한 내성/허용성, 지질 합성 저해제에 대한 내성/허용성, 장쇄 지방산 저해제에 대한 내성/허용성, 미소관 조립 저해제에 대한 내성/허용성, 광화학계 I 전자 전환체 (photosystem I electron diverter)에 대한 내성/허용성, 카바메이트, 트리아진 및 트리아지논 등의 광화학계 II 저해제에 대한 내성/허용성, PPO-저해제에 대한 내성/허용성 및 디캄바 (2,4-D, 즉, 2,4-다이클로로페녹시아세트산) 등의 합성 옥신에 대한 내성/허용성으로 이루어진 군으로부터 선택된다.

추가적인 구현예에서, 하나 이상의 표현형으로 선별가능한 형질은 식물독성 내성/허용성 형질, 바람직하게는 제초제 내성/허용성 형질이며, 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형은 식물독성 화합물, 바람직하게는 제초제에 대해 내성/허용성을 부여하며, 이 화합물은 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물, 또는 그 자손에 부가될 외인성 화합물이다.

일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 ALS이다. 다른 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 PPO이다. 또 다른 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 EPSPS, ALS 또는 PPO이고, EPSPS, ALS 또는 PPO는 하나 이상의 대응되는 아미노산 변환을 만드는 하나 이상의 핵산 변환을 포함하며, 하나 이상의 핵산 변환은 하나 이상의 염기 편집기에 의해 수행된다.

일 구현예에서, 본 발명의 방법은 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에 타겟화된 변형의 도입을 포함하며, 제1 식물 게놈 타겟 부위는 ALS이고, 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 A122를 코딩하는 서열에서, 또는 서열번호 25에 따른 ALS 참조 서열과 비교해 P197을 코딩하는 서열에서, 또는 서열번호 25에 따른 ALS 참조 서열과 비교해 A205를 코딩하는 서열에서, 또는 서열번호 25에 따른 ALS 참조 서열과 비교해 D376을 코딩하는 서열에서, 또는 서열번호 25에 따른 ALS 참조 서열과 비교해 R377을 코딩하는 서열에서 발생한다. 또 다른 구현예에서, 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 W574를 코딩하는 서열에서 발생한다. 일 구현예에서, 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 S653을 코딩하는 서열에서 발생한다. 일 구현예에서, 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 G654를 코딩하는 서열에서 발생한다.

본 발명의 방법의 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 PPO이고, 타겟화된 변형은 서열번호 26에 따른 PPO 참조 서열과 비교해 C215를 코딩하는 서열에서 발생한다. 다른 구현예에서, 타겟화된 변형은 서열번호 26에 따른 PPO 참조 서열과 비교해 A220을 코딩하는 서열에서 발생한다. 추가적인 구현예에서, 타겟화된 변형은 서열번호 26에 따른 PPO 참조 서열과 비교해 G221을 코딩하는 서열에서 발생한다. 다른 추가의 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 PPO이고, 타겟화된 변형은 서열번호 26에 따른 PPO 참조 서열과 비교해 N425를 코딩하는 서열에서, 또는 서열번호 26에 따른 PPO 참조 서열과 비교해 I475를 코딩하는 서열에서 발생한다.

본 발명의 방법에 따른 일 측면에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 EPSPS이고, 타겟화된 변형은 서열번호 27에 따른 EPSPS 참조 서열과 비교해, G101 및 G144를 코딩하는 서열에서, G101 및 A192를 코딩하는 서열에서, 또는 T102 및 P106을 코딩하는 서열에서 발생한다.

제1 게놈 타겟 부위의 타겟화된 변형들의 추가적인 조합 또는 부가적인 변형도 본 발명의 범위에 포함된다.

본 발명의 방법에 대한 일 구현예에서, 하나 이상의 표현형으로 선별가능한 형질은 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 동정 또는 분리하는데 유용한 가시적인 표현형 (visible phenotype)이다. 하나 이상의 표현형으로 선별가능한 형질은 광택 표현형, 골든 표현형, 생장 우세 표현형 또는 색소 표현형 또는 임의의 다른 가시적으로 스크리닝가능한 표현형일 수 있다.

본 발명에 따른 제2 측면에서, (a) 하나 이상의 제1 타겟화된 코돈 결손 변형을 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에 뉴클레아제, 재조합효소 또는 DNA 변형 물질을 포함하는 하나 이상의 제1 부위-특이적인 작동자를 이용해 도입하는 단계로서, 하나 이상의 타겟화된 코돈 결손 변형이 하나 이상의 표현형으로 선별가능한 형질의 발현을 유발하는, 단계; (b) 하나 이상의 제2 타겟화된 변형을 변형할 하나 이상의 식물 세포의 제2 식물 게놈 타겟 부위에 도입하는 단계로서, 하나 이상의 제2 타겟화된 변형이 하나 이상의 제2 부위-특이적인 작동자를 이용해 도입되어 제2 식물 게놈 타겟 부위에 하나 이상의 제2 타겟화된 변형이 달성되고, 하나 이상의 제1 타겟화된 염기 변형의 도입과 동시에 또는 후속적으로 하나 이상의 제2 타겟화된 변형이 변형할 동일한 하나 이상의 식물 세포 또는 하나 이상의 제1 타겟화된 변형을 포함하는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물에 도입되어 하나 이상의 변형된 식물 세포가 수득되는, 단계; 및 (c) (i) 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 코돈 결손 변형에 의해 유발된 하나 이상의 표현형으로 선별가능한 형질을 선별하고, 선택적으로 (ii) 제2 식물 게놈 타겟 부위에서 하나 이상의 제2 타겟화된 변형을 추가로 선별함으로써, 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 단리하거나, 또는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물을 단리하는 단계, 및 선택적으로 (d) 하나 이상의 제1 타겟화된 변형 및 하나 이상의 제2 타겟화된 변형을 포함하는 하나 이상의 변형된 식물 또는 식물 물질을 추가의 대상 식물 또는 식물 물질과 교배하여, 수득되는 자손 식물 또는 식물 물질을 분리함으로써, 대상 유전자형, 선택적으로 하나 이상의 제1 타겟화된 변형을 포함하지 않는 대상 유전자형을 달성하는 단계를 포함하는, 전이유전자성 선별 마커 서열의 안정적인 통합없이, 하나 이상의 변형된 식물 세포, 또는 하나 이상의 변형된 식물 세포를 포함하는 하나 이상의 변형된 식물 조직, 기관 또는 완전한 식물을 단리하는 방법을 제공한다.

본 발명은, 다른 측면에서, (a) 하나 이상의 제1 타겟화된 프래임쉬프트 (frameshift) 또는 결손 변형을 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에 하나 이상의 제1 부위-특이적인 작동자를 사용해 도입하는 단계로서, 하나 이상의 타겟화된 프래임쉬프트 또는 결손 변형이 하나 이상의 표현형으로 선별가능한 형질의 발현을 유발하는, 단계; (b) 하나 이상의 제2 타겟화된 변형을 변형할 하나 이상의 식물 세포의 제2 식물 게놈 타겟 부위에 도입하는 단계로서, 하나 이상의 제2 타겟화된 변형이 뉴클레아제, 재조합효소 또는 DNA 변형 물질을 포함하는 하나 이상의 제2 부위-특이적인 작동자를 이용해 도입되어, 제2 식물 게놈 타겟 부위에 하나 이상의 제2 타겟화된 변형이 달성되고, 하나 이상의 제1 타겟화된 염기 변형의 도입과 동시에 또는 후속적으로 하나 이상의 제2 타겟화된 변형이 변형할 동일한 하나 이상의 식물 세포, 또는 하나 이상의 제1 타겟화된 변형을 포함하는 하나 이상의 자손 세포, 조직, 기관 또는 완전한 식물에 도입되어 하나 이상의 변형된 식물 세포가 수득되는, 단계; 및 (c) (i) 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 프래임쉬프트 또는 결손 변형에 의해 유발된 하나 이상의 표현형으로 선별가능한 형질을 선별하고, 선택적으로, 추가적으로 (ii) 제2 식물 게놈 타겟 부위에서 하나 이상의 제2 타겟화된 변형을 추가로 선별함으로써, 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 단리하거나, 또는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물을 단리하는 단계, 그리고 선택적으로, (d) 하나 이상의 제1 타겟화된 변형 및 하나 이상의 제2 타겟화된 변형을 포함하는 하나 이상의 변형된 식물 또는 식물 물질을 추가의 대상 식물 또는 식물 물질과 교배하여, 수득되는 자손 식물 또는 식물 물질을 분리함으로써, 대상 유전자형, 선택적으로 하나 이상의 제1 타겟화된 변형을 포함하지 않는 대상 유전자형을 달성하는 단계를 포함하는, 전이유전자성 선별 마커 서열의 안정적인 통합없이, 하나 이상의 변형된 식물 세포, 또는 하나 이상의 변형된 식물 세포를 포함하는 하나 이상의 변형된 식물 조직, 기관 또는 완전한 식물을 단리하는 방법을 제공한다.

상기한 측면에 따른 일 구현예에서, 바람직하게는 단계 (b)는 복구 주형을 도입하여 하나 이상의 제1 및/또는 제2 식물 게놈 타겟 부위에 타겟화된 서열 변형 또는 치환을 만드는 것을 더 포함한다.

추가적인 구현예에서, 하나 이상의 부위-특이적인 작동자는 하나 이상의 CRISPR 뉴클레아제, 예로 Cas 또는 Cpf1 뉴클레아제, TALEN, ZFN, 메가뉴클레아제, 아르고너트 (Argonaute) 뉴클레아제, 제한 엔도뉴클레아제, 예로, FokI 또는 이의 변이체, 재조합효소 또는 2 부위-특이적인 닉킹 엔도뉴클레아제, 또는 전술한 작동자의 임의의 변이체 또는 촉매학적으로 활성인 단편으로부터 선택된다.

본 발명의 다양한 측면에 따른 일 구현예에서, 하나 이상의 부위-특이적인 작동자는 CRISPR-기반의 뉴클레아제이고, CRISPR-기반의 뉴클레아제는 부위-특이적인 DNA 결합 도메인을 포함하고, 하나 이상의 CRISPR-기반의 뉴클레아제, 또는 이를 코딩하는 핵산 서열은 (a) SpCas9, SaCas9, SaKKH-Cas9, VQR-Cas9, St1Cas9 등의 Cas9, (b) AsCpf1, LbCpf1, FnCpf1 등의 Cpf1, (c) CasX, 또는 (d) CasY, 또는 전술한 CRISPR-기반의 뉴클레아제의 임의 변이체 또는 유도체를 포함하는 군으로부터 선택되고, 선택적으로 하나 이상의 CRISPR-기반의 뉴클레아제는 해당 야생형 서열과 비교해 돌연변이를 포함하여, 제조되는 CRISPR-기반의 뉴클레아제는 단일 가닥 특이적인 DNA 닉카제, 또는 모든 DNA 절단력이 결핍된 DNA 결합 작동자로 변환된다.

본 발명의 측면들에 따른 추가적인 구현예에서, 적어도 부위-특이적인 작동자, 또는 하나 이상의 부위-특이적인 작동자를 포함하는 복합체의 하나 이상의 구성성분은, 하나 이상의 염기 편집 복합체를 세포내 소기관으로의 타겟화하기 위한 하나 이상의 소기관 위치화 신호를 포함하며, 하나 이상의 소기관 위치화 신호는 핵 위치화 신호 (NLS), 엽록체 수송 펩타이드, 또는 미토콘드리아 수송 펩타이드로부터 선택될 수 있다.

전술한 측면들의 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 게놈 타겟 부위이고, 하나 이상의 표현형으로 선별가능한 형질은 내성/허용성 형질 또는 생장 우세 형질이고, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형은 하나 이상의 변형된 식물 세포, 조직 또는 식물, 또는 그 자손에 부가될 화합물 또는 촉발제에 대해 내성/허용성 또는 생장 우세를 부여한다.

상기한 측면들에 대한 추가적인 구현예에서, 하나 이상의 표현형으로 선별가능한 대상 형질은 하나 이상의 내인성 유전자이거나 또는 이에 의해 코딩되거나, 또는 하나 이상의 대상 표현형 형질은 하나 이상의 전이유전자이거나 또는 이에 의해 코딩되며, 하나 이상의 내인성 유전자 또는 하나 이상의 전이유전자는 하나 이상의 대상 표현형 형질에 하나 이상의 변형이 결핍된 세포를 저해, 손상 또는 사멸시키는, 식물독소, 바람직하게는 제초제에 대한 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형 형질을 코딩하거나, 또는 하나 이상의 표현형 형질은 세포 분열, 증식 속도, 배발생 또는 비-변형된 세포, 조직, 기관 또는 식물과 비교해 변형된 세포, 조직, 기관 또는 식물에 우세를 제공하는 다른 표현형으로 선별가능한 특성의 부스터로 이루어진 군으로부터 선택된다.

상기한 측면에 대한 다른 추가의 구현예에서, 하나 이상의 제1 식물 게놈 타겟 부위는 제초제 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 하나 이상의 내인성 유전자 또는 전이유전자이며, 제초제 제초제 내성/허용성은 글리포세이트 등의 EPSPS-저해제에 대한 내성/허용성, 글루포시네이트 등의 글루타민 합성 저해제에 대한 내성/허용성, 이미다졸린 또는 설포닐우레아 등의 ALS- 또는 AHAS-저해제에 대한 내성/허용성, 아릴옥시페녹시프로피오네이트 (FOP) 등의 ACCase 저해제에 대한 내성/허용성, 피토엔 데세투라제 단계에서 카로티노이드 생합성의 저해제, 4-하이드록시페닐-피루베이트-다이옥시게나제 (HPPD)의 저해제 또는 기타 카로티노이드 생합성 타겟의 저해제 등의 카로티노이드 생합성 저해제에 대한 내성/허용성, 셀룰로스 저해제에 대한 내성/허용성, 지질 합성 저해제에 대한 내성/허용성, 장쇄 지방산 저해제에 대한 내성/허용성 지방산 저해제, 미소관 조립 저해제에 대한 내성/허용성, 광화학계 I 전자 전환체에 대한 내성/허용성, 카바메이트, 트리아진 및 트리아지논 등의 광화학계 II 저해제에 대한 내성/허용성, PPO-저해제에 대한 내성/허용성 및 디캄바 (2,4-다이클로로페녹시아세트산) 등의 합성 옥신에 대한 내성/허용성으로 이루어진 군으로부터 선택된다.

전술한 측면들의 일 구현예에서, 하나 이상의 표현형으로 선별가능한 형질은 식물독성 내성/허용성 형질, 바람직하게는 제초제 내성/허용성 형질이며, 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 코돈 결손 또는 프래임쉬프트 또는 결손 변형은 식물독성 화합물, 바람직하게는 제초제에 대한 내성/허용성을 부여하며, 이 화합물은 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물, 또는 그 자손에 부가될 외인성 화합물이다.

본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 선별 목적으로 아마란투스 투베르쿨라투스 (Amaranthus tuberculatus)로부터 유래된 PPX2L 유전자 산물의 상동체이다.

본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 제1 타겟화된 염기 변형, 타겟화된 코돈 결손 또는 타겟화된 프래임쉬프트 또는 결손 변형은 서열번호 28에 따른 아마란투스 투베르쿨라투스 (Amaranthus tuberculatus)의 PPX2L 유전자 산물의 G210 잔기에 상응하는 위치에서 이루어진다.

본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 표현형으로 선별가능한 형질은 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 동정 또는 단리하는데 유용한 가시적인 표현형이다. 본 발명의 다양한 측면들에 따른 하나 이상의 표현형으로 선별가능한 형질은 광택 표현형, 골든 표현형, 생장 우세 표현형 또는 색소 표현형 또는 임의의 다른 가시적으로 스크리닝가능한 표현형일 수 있다.

본 발명의 모든 측면에 따른 방법의 일 구현예에서, 변형할 하나 이상의 식물 세포는 바람직하게는 호르데움 불가리 (Hordeum vulgare), 호르데움 불부숨 (Hordeum bulbusom), 소르굼 비콜러 (Sorghum bicolor), 사카룸 오피시나리움 (Saccharum officinarium), 지 메이스 (Zea mays) 등의 지 spp. (Zea spp.), 세타리아 이탈리카 (Setaria italica), 오리자 미누타 (Oryza minuta), 오리자 사티바 (Oriza sativa), 오리자 아우스트랄리엔시스 (Oryza australiensis), 오리자 알타 (Oryza alta), 트리티쿰 에이스티붐 (Triticum aestivum), 트리티쿰 두럼 (Triticum durum), 세칼레 세레알레 (Secale cereale), 트리티칼레 (Triticale), 말루스 도메스티카 (Malus domestica), 브라키포듐 디스타키온 (Brachypodium distachyon), 호르데움 마리눔 (Hordeum marinum), 에이길롭스 타우치이 (Aegilops tauschii), 다우쿠스 글로키디아투스 (Daucus glochidiatus), 베타 불가리스 (Beta vulgaris) 등의 베타 spp., 다우쿠스 푸실루스 (Daucus pusillus), 다우쿠스 무리카투스 (Daucus muricatus), 다우쿠스 카로타 (Daucus carota), 유칼립투스 그란디스 (Eucalyptus grandis), 니코티아나 실베스트리스 (Nicotiana sylvestris), 니코티아나 토멘토시포르미스 (Nicotiana tomentosiformis), 니코티아나 타바쿰 (Nicotiana tabacum), 니코티아나 벤타미아나 (Nicotiana benthamiana), 솔라눔 라이코퍼시쿰 (Solanum lycopersicum), 솔라눔 투베로숨 (Solanum tuberosum), 코페아 카네포라 (Coffea canephora), 비티스 비니페라 (Vitis vinifera), 에리트란테 구타타 (Erythrante guttata), 겐리시아 아우레아 (Genlisea aurea), 쿠쿠미스 사티부스 (Cucumis sativus), 마루스 노타빌리스 (Marus notabilis), 아라비돕시스 아레노사 (Arabidopsis arenosa), 아라비돕시스 라이라타 (Arabidopsis lyrata), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 크루시히말라야 히말라이카 (Crucihimalaya himalaica), 크루시히말라야 발리치이 (Crucihimalaya wallichii), 카르다민 넥수오사 (Cardamine nexuosa), 레피디움 비르기니쿰 (Lepidium virginicum), 캡셀라 부르사 파스토리스 (Capsella bursa pastoris), 올마라비돕시스 푸밀라 (Olmarabidopsis pumila), 아라비스 히르수테 (Arabis hirsute), 브라씨카 나푸스 (Brassica napus), 브라씨카 올레라시아 (Brassica oleracea), 브라씨카 라파 (Brassica rapa), 라파누스 사티부스 (Raphanus sativus), 브라씨카 준카시아 (Brassica juncacea), 브라씨카 니그라 (Brassica nigra), 에루카 베시카리아 아종 사티바 (Eruca vesicaria subsp . sativa), 시트러스 시넨시스 (Citrus sinensis), 자트로파 쿠르카스 (Jatropha curcas), 포풀루스 트리코카르파 (Populus trichocarpa), 메디카고 트룬카툴라 (Medicago truncatula), 시져 야마시타 (Cicer yamashitae), 시져 비주굼 (Cicer bijugum), 시져 아리에티눔 (Cicer arietinum), 시져 레티쿨라툼 (Cicer reticulatum), 시져 주다이쿰 (Cicer judaicum), 카야누스 카자니폴리우스 (Cajanus cajanifolius), 카야누스 스카라바에오이데스 (Cajanus scarabaeoides), 파세올루스 불가리스 (Phaseolus vulgaris), 글리신 맥스 (Glycine max), 고씨퓸 (Gossypium sp .), 아스트라갈루스 시니쿠스 (Astragalus sinicus), 로투스 자포니카스 (Lotus japonicas), 토레니아 포우르니에리 (Torenia fournieri), 알리움 세파 (Allium cepa), 알리움 피스툴로숨 (Allium fistulosum), 알리움 사티붐 (Allium sativum), 헬리안투스 안누스 (Helianthus annuus), 헬리안투스 투베로수스 (Helianthus tuberosus) 및 알리움 투베로숨 (Allium tuberosum), 또는 전술한 식물들 중 하나에 속하는 임의 품종 또는 아종으로 이루어진 군으로부터 선택되는 식물로부터 유래된다.

도 1 (도 1 A - C)은 예를 들어 식물 육종 및 타겟화된 선별 전략에서 선별시 대상 세포를 단리하기 위해 본 발명에 따른 방법을 수행하는 방식을 예시한 것이다. 도 1A는 염기 편집기 (BE) 또는 BE 복합체, 및 편집 물질, 즉, 부위-특이적인 뉴클레아제 (SSN)를 포함하는 부위-특이적인 작동자를 2개의 서로 다른 게놈 위치에서 병행하여 세포에 처리한 것을 보여준다. 화살표는, 염기 편집기 (복합체) 및 부위-특이적인 작동자가 2개의 타겟화된 부위-특이적인 변형을 도입하게 되는 타겟 부위를 표시한다. 도 1B는 도 1A에 예시된 선행 단계의 결과를 나타낸 것으로, 즉, BE (복합체)는 백색 강조 표시된 대상 유전자에 변형된 표현형을 도입하고, 부위-특이적인 작동자는 흑색으로 강도 표시된 형질 유전자에 타겟화된 편집을 도입한다. 따라서, 2개의 서로 다른 게놈 타겟 부위 내 2개의 개별 변형은 처리된 식물로부터 식물 세포 또는 식물의 단리를 허용한다. 그런 후, 식물에서 대상 유전자에서의 편집을 스크리닝할 수 있으며, 이는 일반적으로 스크리닝 목적으로 사용되는 변형된 표현형과는 상이하다. 도　1C는 바람직한 유전자형을 달성하기 위한 식물 분리 결과를 나타낸 것이다. 이러한 바람직한 대상 유전자형은 부위-특이적인 작동자를 통해 도입된 타겟화된 변형 (검정)을 포함하지만, 변형된 표현형 변형을 더 이상 포함하지 않으며, 변형된 표현형 변형은 스크리닝 목적으로 도입된 것이며, 실시예에서 제조되는 식물 세포, 조직, 기관 또는 완전한 식물의 게놈에 게놈 형질로서 포함되지 않는다.
도 2는 TaALS S1 부위의 공동-편집에 의한 강화된 스크리닝 효율을 예시한 것이다.
도 3은 TaALS-P173 편집에 의한 제초제 내성 밀을 예시한 것이다.
도 4는 ZmALS-P165 편집에 의한 제초제 내성 옥수수의 구축을 예시한 것이다.
도 5는 옥수수에서 편집할 제초제 내성 부위 및 서열 구조를 예시한 것이다.
도 6은 ZmALS-P197 및 ZmALS-G654의 효율적인 편집을 예시한 것이다.
도 7은 ZmALS-P197 및 ZmALS-G654의 바람직한 제초제 내성-부여 잔기로의 변환 효율을 예시한 것이다.
서열:
서열번호 1은 APOBEC1 (랫 시티딘 데아미나제) - XTEN 링커의 뉴클레오티드 서열이다 (예, Schellenberger et al., "A recombinant polypeptide extends the in vivo half-life of peptides and proteins in a tunable manner", Nature Biotechnol. 27, 1186-1190 (2009)) - nCas9(D10A) - UGI (우라실 DNA 글리코실라제 저해제) - NLS 코딩 구조체, 코돈 최적화되지 않음. 이 서열은 3' 정지 코돈 TAA를 포함한다.
서열번호 2는 곡류 식물에서 사용하기 위해 코돈 최적화된 APOBEC1 - XTEN 링커 - nCas9(D10A) - UGI - NLS 코딩 구조체의 뉴클레오티드 서열이다. 이 서열은 3' 정지 코돈 TAG를 포함한다.
서열번호 3은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_ALS1&2_P197S/L/F의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 ALS 상동체에서의 잔기 배열을 기반으로 한다. 이 서열은 SpCas9-유래 (스크렙토코커스 피오게네스 Cas9-유래) 기반의 편집기에 적용된다.
서열번호 4는 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_ALS1&2_P197S/L/F의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 ALS 상동체에서의 잔기 배열을 기반으로 한다. 이 서열은 SaKKH-BE3-유래 기반의 편집기에 적용된다 (스타필로코커스 아우레우스 Cas9 (SaCas9)-유래의 SaCas9 돌연변이, PAM 특이성이 완화됨).
서열번호 5는 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_ALS1&2_P197S/L/F의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 ALS 상동체에서의 잔기 배열을 기반으로 한다. 이 서열은 VQR-BE3-유래 기반의 편집기에 적용된다 (스타필로코커스 아우레우스 Cas9 (SaCas9)-유래의 SaCas9 돌연변이, 여러가지 PAM 특이성을 가짐).
서열번호 6은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_ALS1&2_S653N의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 ALS 상동체에서의 잔기 배열을 기반으로 한다. 이 서열은 SpCas9-유래 기반의 편집기에 적용된다.
서열번호 7은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_A220_&_G221의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 SpCas9-유래 기반의 편집기에 적용된다.
서열번호 8은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_A220_&_G221의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 SaKKH-BE3-유래 기반의 편집기에 적용된다.
서열번호 9는 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_A220_&_G221의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 VQR-BE3-유래 기반의 편집기에 적용된다.
서열번호 10은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_C215의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 SpCas9-유래 기반의 편집기에 적용된다.
서열번호 11은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_C215의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 SaKKH-BE3-유래 기반의 편집기에 적용된다.
서열번호 12는 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_C215의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 SaKKH-BE3-유래 기반의 편집기에 적용된다.
서열번호 13은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_C215의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 VQR-BE3-유래 기반의 편집기에 적용된다.
서열번호 14는 코돈 최적화된 APOBEC1 - XTEN 링커 - CasX1 - UGI - NLS 코딩 구조체의 뉴클레오티드 서열이다. 이 서열은 3' 정지 코돈 TAG를 포함한다.
서열번호 15는 코돈 최적화된 APOBEC1 - XTEN 링커 - AsCpf1(R1226A) (액시드아미노코커스 sp . R1226A 돌연변이를 가진 Cpf1)- UGI - NLS 코딩 구조체의 뉴클레오티드 서열이다. 이 서열은 3' 정지 코돈 TAG를 포함한다.
서열번호 16은 NLS - dCas9 - NLS - 링커 - PmCDA1 (바다 칠성장어 (sea lamprey) 유래의 활성화-유도된 시티딘 데아미나제 (AID) 오르소로그 PmCDA1, Nishida et al. (Science 2016, vol. 353, issue 6305, aaf8729) 참조) - UGI를 코딩하는 구조체의 뉴클레오티드 서열이다. 이 서열은 3' 정지 코돈 TAG를 포함한다.
서열번호 17은 예시적인 Cas9 닉카제 n(i)Cas9 (D10A)를 코딩하는 뉴클레오티드 서열이다.
서열번호 18은 예시적인 CasX를 코딩하는 뉴클레오티드 서열이다.
서열번호 19는 예시적인 AsCpf1 (R1226A)을 코딩하는 뉴클레오티드 서열이다.
서열번호 20은 예시적인 APOBEC1을 코딩하는 뉴클레오티드 서열이다.
서열번호 21은 예시적인 UGI를 코딩하는 뉴클레오티드 서열이다.
서열번호 22는 예시적인 PmCDA1을 코딩하는 뉴클레오티드 서열이다.
서열번호 23은 B73 참조 유전자형에 대한 염기 편집을 위한 Zm_PPO_N425_&Y426의 예시적인 프로토스페이서 서열이다. 그 위치는 아라비돕시스 PPO 상동체에서의 잔기 위치를 기반으로 한다. 이 서열은 VQR-BE3-유래 기반의 편집기에 적용된다.
서열번호 24는 액시드아미노코커스 sp BV3L6 Cpf1 (AsCpf1), UniProtKB/Swiss-Prot identifier: U2UMQ6.1의 서열이다.
서열번호 25는 아라비돕시스 탈리아나 유래의 아세토락테이트 신타제 (ALS) (엽록체), GenBank: AAW70386의 서열이다.
서열번호 26은 아라비돕시스 탈리아나 프로토포르피리노겐 옥시다제 (PPO)의 서열이다.
서열번호 27은 엽록체 수송 펩타이드가 제거된 성숙 단백질인 아라비돕시스 탈리아나 5-에놀피루빌쉬키메이트-3-포스페이트 신타제 (EPSPS)의 서열이다; NCBI accession AAY25438.
서열번호 28은 아마란투스 투베르쿨라투스 (Amaranthus tuberculatus) 미토콘드리아 프로토포르피리노겐 옥시다제 (PPX2L), cf. NCBI accession DQ386114의 서열이다.

정의:

본원에서, 단수 형태 ("a" "an" 및 "the")는 문맥 상 명확하게 달리 언급되지 않은 한 복수의 언급도 포함하는 것임에 유념하여야 한다. 예를 들어, 구성성분을 언급하는 것은 복수의 구성성분들로 된 조성물을 포함하는 것으로 의도된다. "a" 구성요소를 포함하는 조성물을 언급하는 것은 언급된 것 외에도 다른 구성요소를 포함하는 것으로 의도된다. 즉, 용어 "a" "an" 및 "the"는 수적인 제한을 나타내는 것이 아니라 언급된 항목이 하나 이상 존재하는 것을 의미한다. 각 용어는 당해 기술 분야의 당업자가 이해하는 가장 넓은 의미로 간주되며, 비슷한 목적을 달성하기 위해 유사한 방식으로 작동하는 모든 기술적인 균등물을 포괄하는 것으로 의도된다.

범위는 본원에서 "약" 또는 "대략" 또는 "실질적으로" 하나의 특정 수치 형태로서 및/또는 "약" 또는 "대략" 또는 "실질적"으로 다른 특정 수치 형태로서 표현될 수 있다. 이러한 범위로 표현되는 경우, 그외 예시적인 구현예들은 하나의 특정 수치에서 및/또는 다른 특정 수치까지를 포함한다. 나아가, 용어 "약"은, 수치가 측정 또는 결정되는 방식, 즉 측정 시스템의 한계에 따라 일부 결정되는, 당해 기술 분야의 당업자에 의해 결정된 특정 수치에 대한 허용가능한 오차 범위 내인 것으로 이해된다. 예를 들어, "약"은 당해 기술 분야에서 실시시 허용가능한 표준 편차 내인 것을 의미할 수 있다. 다른 예로, "약"은 주어진 수치에서 최대 ±20%, 바람직하게는 최대 5 내지 ±10%, 더 바람직하게 최대 ±5%, 더 더 바람직하게 최대 ±1%의 범위를 의미할 수 있다. 다른 예로, 생물 시스템 또는 프로세스와 특히 관련하여, 이 용어는 수치의 자릿수 이내, 바람직하게는 2배수 이내를 의미할 수 있다. 구체적인 수치가 출원서 및 청구항에 기술되어 있을 경우, 달리 언급되지 않은 한, 용어 "약"이 내포된 것이며, 문맥 상 구체적인 수치에 대해 허용가능한 오차 범위 내인 것을 의미한다.

"포함하는" 또는 "함유하는" 또는 "비롯하여"는 적어도 언급된 화합물, 요소, 입자 또는 방법 단계가 조성물 또는 물품 또는 방법에 존재하는 것을 의미하지만, 다른 화합물, 물질, 입자, 방법 단계가 명명된 바와 동일한 기능을 가지고 있더라도, 다른 화합물, 물질, 입자, 방법 단계의 존재를 배제하는 것은 아니다.

본원에서 아미노산 서열과 관련하여 용어 "촉매학적으로 활성인 단편 (catalytically active fragment)"은, 주형 서열의 활성 부위 전체 또는 일부를 포함하는, 주어진 주형 아미노산 서열로부터 유래된 코어 서열 또는 이를 코딩하는 핵산 서열을 지칭하는 것으로, 단 수득되는 촉매적으로 활성인 단편은 천연 효소의 활성 부위 또는 이의 변이체가 담당하는 주형 서열의 특징적인 활성을 여전히 유지한다. 이러한 변형은 주형 서열과 동일한 활성을 여전히 가지고 있는 크기가 작은 아미노산 서열을 만들어, 촉매적으로 활성인 단편을 보다 다목적의 또는 입체적으로 부담이 적은 보다 안정적인 도구로 만드는데 적합하다.

본원에서, "상보적인" 또는 "상보성"은 2개의 DNA, 2개의 RNA 또는 본 발명에 따른 하이브리드 서열, RNA와 DNA 핵산 영역들 간의 상관성을 나타내는 것이다. DNA 또는 RNA의 뉴클레오베이스에 의해 정의된 바에 따라, 2개의 핵산 영역은 자물쇠-열쇠 모형에 따라 서로 혼성할 수 있다. 이를 위해, 왓슨-크릭 염기 쌍 형성 원리는 상보적인 염기로서 아데닌과 티민/우라실뿐만 아니라 구아닌과 시토신을 각각 기본으로 한다. 또한, 리버스-왓슨-크릭, 후그스틴 (Hoogsteen), 리버스-후그스틴 및 워블 쌍 형성 (Wobble pairing)과 같은 비-왓슨-크릭 쌍 형성도, 각각의 염기 쌍들이 서로 수소 결합을 형성할 수 있는 한, 즉 2개의 서로 다른 핵산 가닥이 상보성에 기초하여 서로 혼성할 수 있는 한, 본원에서 용어 "상보성"에 포함된다.

본원에서, 용어 "구조체", 특히 "유전자 구조체" 또는 "재조합 구조체" 또는 "발현 구조체"는, 본 발명에 따른 타겟 세포 또는 식물, 식물 세포, 조직, 기관 또는 물질에 도입, 형질전환, 형질감염 또는 형질전이되기 위한, 특히 플라스미드 또는 플라스미드 벡터, 코스미드, 인공 효모- 또는 박테리아 인공 염색체 (YAC 및 BAC), 파지미드, 박테리아 파지에 기반한 벡터, 발현 카세트, DNA 서열 및 RNA 서열을 포함하는 단리된 단일 가닥 또는 이중 가닥 핵산 서열, 또는 아미노산 서열, 변형된 바이러스 등의 바이러스 벡터 및 이들의 조합 또는 혼합물을 포함하는 구조체를 지칭한다. 본 발명에 따른 재조합 구조체는 핵산 또는 아미노산 서열의 형태로서 작동자 도메인을 포함할 수 있으며, 여기서 작동자 도메인은 타겟 세포에서 작용을 발휘할 수 있는 분자를 의미하며, 이는 전이유전자, 단일 가닥 또는 이중 가닥 RNA 분자, 예를 들어 가이드 RNA, miRNA, 단일 또는 이중 CRISPR tracr/crRNA, 또는 siRNA, 또는 아미노산 서열, 예를 들어, 특히 효소 또는 이의 촉매학적으로 활성인 단편, 결합 단백질, 항체, 전사인자, 뉴클레아제, 바람직하게는 부위 특이적인 뉴클레아제 등을 포함한다. 아울러, 재조합 구조체는 조절 서열 및/또는 위치화 서열을 포함할 수 있다. 재조합 구조체는 플라스미드 벡터 등의 벡터에 통합될 수 있거나, 및/또는 벡터 구조로부터, 예를 들어 폴리펩타이드 서열 형태로 또는 벡터에 연결되지 않은 단일 가닥 또는 이중 가닥 핵산으로서 분리되어 존재할 수 있다. 이는, 예를 들어, 형질전환에 의해 도입된 후, 유전자 구조체는, 염색체 외부에, 즉 타겟 세포의 게놈에 통합되지 않고, 예를 들어 이중 가닥 또는 단일 가닥 DNA, 이중 가닥 또는 단일 가닥 RNA 또는 아미노산 서열로서 존재할 수 있다. 다른 구현예로, 본 발명에 따른 유전자 구조체 또는 이의 일부는, 타겟 세포의 핵 게놈 또는 다른 유전 요소, 예를 들어 미토콘드리아 또는 엽록체와 같은 색소체 게놈 등의, 타겟 세포의 게놈에 안정적으로 통합될 수 있다. 이와 관련하여 사용되는 용어 "플라스미드 벡터"는 본래 플라스미드로부터 수득되는 유전자 구조체를 의미한다.

본원에서 용어 "전달 구조체" 또는 "전달 벡터"는 RNA 및 DNA를 포함하는 하이브리드 핵산 등이 핵산 및/또는 대상 아미노산 서열을 타겟 세포, 바람직하게는 진핵생물 세포로 수송하기 위한 카고로서 사용되는 임의의 생물학적 또는 화학적 수단을 지칭한다. 본원에서, 용어 전달 구조체 또는 벡터는 따라서 본 발명에 따른 유전자 또는 재조합 구조체를 타겟 세포, 조직, 장기 또는 유기체로 전달하기 위한 수송 수단을 지칭한다. 즉, 벡터는 핵산 서열을 포함할 수 있으며, 선택적으로 대상 타겟 세포 또는 식물 타겟 구조 내 식물의 바람직한 세포 구획으로 직접 또는 간접적으로 전달하기 위한 위치화 서열 또는 조절 서열과 같은 서열을 포함할 수 있다. 또한, 벡터는 아미노산 서열 또는 리보뉴클레오-분자 복합체를 타겟 세포 또는 타겟 구조에 도입하기 위해 사용될 수 있다. 통상적으로, 본원에서, 벡터는 플라스미드 벡터일 수 있다. 또한, 본 발명에 따른 일부 바람직한 구현예에서, 대상 구조체 또는 서열 또는 복합체의 직접 도입이 수행된다. 용어 직접 도입은, 본원에 따라 변형할 DNA 타겟 서열을 포함하는 원하는 타겟 세포 또는 타겟 구조가, 전달 벡터를 사용해 전달된 물질이 그 효과를 발휘하게 될 특이적인 대상 타겟 세포로, 직접 형질절환 또는 형질전이 또는 형질감염되는 것을 암시한다. 용어 간접 도입은 구조, 예를 들어, 그 자체가 형질전환될 실제 타겟 세포 또는 대상 구조는 아니지만 실제 타겟 구조, 예를 들어 분열 세포 또는 조직, 또는 줄기세포 또는 조직으로, 바람직하게는 본 발명에 따른 유전자 구조체를 포함하는 벡터의 전신 전파 및 전달을 위한 토대로서 사용되는, 잎 세포 또는 기관 또는 조직의 세포로의 도입이 달성되는 것을 의미한다. 하이브리드 핵산 서열 등의 아미노산 서열 및/또는 핵산 서열로 타겟 세포를 형질감염하는 맥락에서 용어 벡터가 사용되는 경우, 용어 벡터는 펩타이드 또는 단백질 형질감염에 적합한 물질, 예를 들어, 이온성 지질 혼합물, 세포 침투 펩타이드 (CPP) 또는 입자 총법 (particle bombardment)을 내포한다. 핵산 물질을 도입하는 맥락의 경우, 용어 벡터는 플라스미드 벡터뿐 아니라 핵산 및/또는 아미노산 서열을 대상 타겟 세포로, 예를 들어 입자 총법에 의해 도입하기 위한 토대로 사용할 수 있는 적합한 담체 물질을 의미할 수 있다. 이러한 담체 물질은, 특히, 금 또는 텅스텐 입자를 포함한다. 마지막으로, 용어 벡터는 또한 본 발명에 따른 하나 이상의 유전자 구조체를 도입하기 위한 바이러스 벡터, 예를 들어, 다음과 같은 바이러스 균주로부터 유래된 변형된 바이러스의 사용을 의미한다: 아데노바이러스 또는 아데노부속 바이러스 (AAV) 벡터, 렌티바이러스 벡터, 헤르페스 심플렉스 바이러스 (HSV-1), 백시니아 바이러스, 센다이 바이러스, 신드비스 바이러스, 셈리키 포레스트 알파바이러스 (Semliki forest alphavirus), 엡스타인-바-바이러스 (EBV), 옥수수 스트리크 바이러스 (Maize Streak Virus, MSV), 보리 줄무늬 모자이크 바이러스 (Barley Stripe Mosaic Virus, BSMV), 브롬 모자이크 바이러스 (Brome Mosaic virus, BMV, 등재번호: RNA1: X58456; RNA2: X58457; RNA3: X58458), 옥수수 줄무늬 바이러스 (Maize stripe virus, MSpV), MYDV (Maize rayado fino virus), MYDV (Maize yellow dwarf virus), MDMV (Maize dwarf mosaic virus), Benyviridae 과의 (+) 가닥 RNA 바이러스, 예를 들어, 사탕무 엽맥황화 바이러스 (Beet necrotic yellow vein virus) (등재번호: RNA1: NC_003514; RNA2: NC_003515; RNA3: NC_003516; RNA4: NC_003517) 또는 Bromoviridae 과의 (+) 가닥 RNA 바이러스, 예를 들어, 속명 알파파 모자이크 바이러스 (Alfalfa mosaic virus, 등재번호: RNA1: NC_001495; RNA2: NC_002024; RNA3: NC_002025) 또는 속명 브로모바이러스 (Bromovirus), 예를 들어 BMV (상기 참조), 또는 속명 쿠쿠모바이러스 (Cucumovirus), 예를 들어, 오이 모자이크 바이러스 (Cucumber mosaic virus, 등재번호: RNA1: NC_002034; RNA2: NC_002035; RNA3: NC_001440), 속명 올레아바이러스 (Oleavirus), Caulimoviridae 과, 특히 바드나바이러스 (Badnavirus) 또는 콜리모바이러스 (Caulimovirus) 과의 dsDNA 바이러스, 예를 들어, 여러가지 바나나 스트리크 바이러스 (Banana streak viruse) (예, 등재번호: NC_007002, NC_015507, NC_006955 또는 NC_003381) 또는 콜리플라워 모자이크 바이러스 (등재번호: NC_001497), 또는 속명 카베모바이러스 (Cavemovirus), 페투바이러스 (Petuvirus), 로사드나바이러스 (Rosadnavirus), 솔렌도바이러스 (Solendovirus), 소이모바이러스 (Soymovirus) 또는 툰그로바이러스 (Tungrovirus), 또는 Closteroviridae 과의 (+) 가닥 RNA 바이러스, 예를 들어, 속명 앰펠로바이러스 (Ampelovirus), 크리니바이러스 (Crinivirus), 예를 들어, 상추 감염성 황색 바이러스 (Lettuce infectious yellows virus, 등재번호: RNA1: NC_003617; RNA2: NC_003618) 또는 토마토 클로로시스 바이러스 (등재번호: RNA1: NC_007340; RNA2: NC_007341), 클로스테로바이러스 (Closterovirus), 예로, 사탕무 황색 바이러스 (등재번호: NC_001598) 또는 벨라리바이러스 (Velarivirus), Geminiviridae 과의 단일 가닥 DNA (+/-) 바이러스, 예를 들어, 베쿠르토바이러스 (Becurtovirus), 베고모바이러스 (Begomovirus), 예를 들어, 빈 골든 옐로우 모자이크 바이러스 (Bean golden yellow mosaic virus), 토바코 컬리 쇼트 바이러스 (Tobacco curly shoot virus), 토바코 모틀 리프 컬 바이러스 (Tobacco mottle leaf curl virus), 토마토 클로로틱 모틀 바이러스 (Tomato chlorotic mottle virus), 토마토 위축 잎 바이러스 (Tomato dwarf leaf virus), 토마토 골든 모자이크 바이러스 (Tomato golden mosaic virus), 토마토 잎 말림 바이러스 (Tomato leaf curl virus), 토마토 모틀 바이러스 (Tomato mottle virus) 또는 토마토 옐로우 스팟 바이러스 (Tomato yellow spot virus), 또는 Geminiviridae 과의 속명 쿠르토바이러스 (Curtovirus), 예를 들어, 비트 컬리 탑 바이러스 (Beet curly top virus), 또는 Geminiviridae 과의 속명 토포쿠바이러스 (Topocuvirus), 턴큐트바이러스 (Turncurtvirus) 또는 마스트레바이러스 (Mastrevirus), 예를 들어 옥수수 스트리크 바이러스 (Maize streak virus)(상기 참조), 토바코 황화 위축 바이러스 (Tobacco yellow dwarf virus), 밀 위축 바이러스 (Wheat dwarf virus), Luteoviridae 과의 (+) 가닥 RNA 바이러스, 예를 들어, 속명 루테오바이러스 (Luteovirus), 예로, 보리 황화 위축 바이러스- PAV (Barley yellow dwarf virus- PAV, 등재번호: NC_004750), 또는 속명 폴레로바이러스 (Polerovirus), 예로, 감자 잎 말림 바이러스 (Potato leafroll virus, 등재번호: NC_001747), Nanoviridae 과의 단일 가닥 DNA 바이러스, 예를 들어, 속명 나노바이러스 (Nanovirus) 또는 바부바이러스 (Babuvirus), Partiviridae 과의 이중 가닥 RNA 바이러스, 예를 들어, 특히 알파파티티바이러스 (Alphapartitivirus), 베타파티티바이러스 (Betapartitivirus) 또는 델타파티티바이러스 (Deltapartitivirus), Pospiviroidae 과의 비로이드 (viroid), Potyviridae 과의 (+) 가닥 RNA 바이러스, 예를 들어, 속명 브람비바이러스 (Brambyvirus), 비모바이러스 (Bymovirus), 이포모바이러스 (Ipomovirus), 마클루라바이러스 (Macluravirus), 포아세바이러스 (Poacevirus), 예를 들어, 트리티컴 모자이크 바이러스 (Triticum mosaic virus) (등재번호: NC_012799), 또는 Potyviridae 과의 속명 포티바이러스 (Potyvirus), 예를 들어, 비트 모자이크 바이러스 (등재번호: NC_005304), 옥수수 위축 모자이크 바이러스 (Maize dwarf mosaic virus) (등재번호: NC_003377), 감자 바이러스 Y (등재번호: NC_001616), 또는 옥수수 모자이크 바이러스 (Zea mosaic virus, 등재번호: NC_018833), 또는 Potyviridae의 속명 트리티모바이러스 (Tritimovirus), 예를 들어 브롬 스트리크 모자이크 바이러스 (Brome streak mosaic virus, 등재번호: NC_003501) 또는 밀 스트리크 모자이크 바이러스 (Wheat streak mosaic virus, 등재번호: NC_001886), Pseudoviridae 과의 단일 가닥 RNA 바이러스, 예를 들어, 속명 슈도바이러스 (Pseudovirus) 또는 시레바이러스 (Sirevirus), Reoviridae 과의 이중 가닥 RNA 바이러스, 예를 들어, 벼 위축 바이러스 (Rice dwarf virus) (등재번호: RNA1: NC_003773; RNA2: NC_003774; RNA3: NC_003772; RNA4: NC_003761; RNA5: NC_003762; RNA6: NC_003763; RNA7: NC_003760; RNA8: NC_003764; RNA9: NC_003765; RNA10: NC_003766; RNA11: NC_003767; RNA12: NC_003768), Tombusviridae 과의 (+) 가닥 RNA 바이러스, 예를 들어, 속명 알파네크로바이러스 (Alphanecrovirus), 아우레우스바이러스 (Aureusvirus), 베타네크로바이러스 (Betanecrovirus), 카르모바이러스 (Carmovirus), 다이안토바이러스 (Dianthovirus), 갈란티바이러스 (Gallantivirus), 마카나바이러스 (Macanavirus), 마클로모바이러스 (Machlomovirus), 파니코바이러스 (Panicovirus), 톰부스바이러스 (Tombusvirus), 움브라바이러스 (Umbravirus) 또는 지아바이러스 (Zeavirus), 예를 들어, 옥수수 괴사 스트리크 바이러스 (Maize necrotic streak virus) (등재번호: NC_007729), 또는 Virgaviridae 과의 (+) 가닥 RNA 바이러스, 예를 들어 속명 푸로바이러스 (Furovirus), 호르데이바이러스 (Hordeivirus), 예를 들어, 보리 스트립 모자이크 바이러스 (등재번호: RNA1: NC_003469; RNA2: NC_003481; RNA3: NC_003478), 또는 속명 페클루바이러스 (Pecluvirus), 포모바이러스 (Pomovirus), 토바모바이러스 (Tobamovirus) 또는 토브라마이러스 (Tobravirus), 예를 들어, 담배 얼룩 바이러스 (Tobacco rattle virus) (등재번호: RNA1: NC_003805; RNA2: NC_003811), 뿐만 아니라 목 Mononegavirales의 (-) 가닥 RNA 바이러스, 특히 과 Rhabdoviridae, 예를 들어, 보리 황색 스트리아테 모자이크 바이러스 (Barley yellow striate mosaic virus) (등재번호: KM213865) 또는 상추 괴사성 황색 바이러스 (Lettuce necrotic yellows virus) (등재번호/생검: NC_007642/ AJ867584), 목 Picornavirales의 (+) 가닥 RNA 바이러스, 특히 과 Secoviridae, 예를 들어, 속명 코모바이러스 (Comovirus), 파바바이러스 (Fabavirus), 네포바이러스 (Nepovirus), 케라바이러스 (Cheravirus), 사드와바이러스 (Sadwavirus), 세퀴바이러스 (Sequivirus), 토라도바이러스 (Torradovirus) 또는 와이카바이러스 (Waikavirus), 목 Tymovirales의 (+) 가닥 RNA 바이러스, 특히 과 Alphaflexiviridae, 예를 들어, 속명 알렉시바이러스 (Allexivirus), 롤라바이러스 (Lolavirus), 만드리바이러스 (Mandarivirus) 또는 포텍스바이러스 (Potexvirus), 목 Tymovirales, 특히 과 Betaflexiviridae, 예를 들어, 속명 카필로바이러스 (Capillovirus), 카를라바이러스 (Carlavirus), 시트리바이러스 (Citrivirus), 포베아바이러스 (Foveavirus), 테포바이러스 (Tepovirus) 또는 비티바이러스 (Vitivirus), 목 Tymovirales의 (+) 가닥 RNA 바이러스, 특히 과 Tymoviridae, 예를 들어, 속명 마쿨라바이러스 (Maculavirus), 마라피바이러스 (Marafivirus) 또는 티모바이러스 (Tymovirus) 및 박테리아 벡터, 예를 들어 아그로박테리움 spp . (Agrobacterium spp.), 예를 들어, 아그로박테리움 투메팍시엔스 (Agrobacterium tumefaciens). 마지막으로, 용어 벡터는 또한 폴리머성 또는 지질-기반의 전달 구조체 등의, 물리적인 도입 방법과 조합하여, 선형 핵산 서열 (단일 가닥 또는 이중 가닥) 또는 아미노산 서열 또는 이의 조합을 타겟 세포에 도입하기 적합한 화학적 전달 물질을 의미한다.

적합한 전달 구조체 또는 벡터는, 따라서, 타겟 세포에 뉴클레오티드 서열을 전달하기 위한 생물학적 수단, 예를 들어 바이러스 벡터, 아그로박테리움 spp. 또는 화학적 전달 구조체, 예를 들어, 나노입자, 예로, 메조포러스 실리카 나노입자 (MSNP), 양이온성 폴리머, 예로, PEI (폴리에틸렌이민) 폴리머를 이용한 방법 또는 폴리머, 예를 들어, DEAE-덱스트란, 또는 양이온성 표면을 구축하기 위한 PEI의 비-공유적 표면 결합, 지질 또는 폴리머성 소낭 또는 이들의 조합을 포함한다. 지질 또는 폴리머성 소낭은, 예를 들어, 지질, 리포좀, 지질 캡슐화 시스템, 나노입자, 소형 핵산-지질 입자 포뮬레이션, 폴리머 및 폴리머좀으로부터 선택될 수 있다.

본원에서, 원핵생물 또는 진핵생물 세포, 바람직하게는 동물 세포, 더 바람직하게는 본 발명에 따른 식물 또는 식물 세포 또는 식물 물질과 관련하여, 용어 "파생물" 또는 "자손" 또는 "후대"는 유성 및 무성 증식을 포함하는 자연적인 번식 (reproductive propagation)으로부터 생기는 상기한 세포 또는 물질의 자손을 지칭한다. 이러한 번식은 자연 현상으로부터 생긴 유기체의 게놈에 돌연변이 도입을 유도하여, 부모 유기체 또는 세포와 게놈 측면에서는 다르지만, 여전히 동일한 속/종에 속하며; 부모 재조합 숙주 세포와 동일한 특징들을 대부분 가진, 자손 또는 후대를 만들 수 있음은, 당해 기술 분야의 당업자에게 널리 공지되어 있다. 생식 또는 재생 중에 자연 현상으로부터 생기는 상기한 파생물, 자손 또는 후대도, 따라서, 본 발명의 상기한 용어에 포함된다. 또한, 용어 "파생물"은, 직접적으로 세포 또는 유기체를 지칭한다기 보다는, 다른 것으로부터 간접적으로 수득되는 변형에 의한, 물질 또는 분자를 의미할 수 있다. 이는 세포 또는 물질로부터 수득되는 식물 대사산물 또는 세포로부터 유래되는 핵산 서열을 의미할 수 있다. 따라서, 이들 용어는 임의의 파생물, 자손 또는 선조 (progenitor)를 지칭하기 보다는, 부모 세포 또는 바이러스 또는 이의 분자에 기초하여 계통 발생적으로 관련된 파생물 또는 자손 또는 선조를 지칭하는 것이며, 파생물, 자손 또는 선조와 "부모" 간의 연관성은 당해 기술 분야의 당업자가 명백하게 추론가능하다.

또한, 본원에서, 생물학적 서열(핵산 또는 아미노산) 또는 분자 또는 복합체의 맥락에서 사용되는 용어 "유래된" 또는 "로부터 유래되는" 또는 "유도체"는, 해당 서열이, 참조 서열, 예를 들어, 즉, 상기 서열의 기원이 되는 서열 목록 또는 데이터베이스 등재 번호 또는 각각의 스캐폴드 구조를 기반으로 하며, 참조 서열이 더 많은 서열, 예를 들어 바이러스의 전체 게놈 또는 전체 폴리단백질 코딩 서열을 포함할 수 있는 반면, 천연 서열"로부터 유래된" 서열은 이의 단리된 단편 또는 이의 코헤런트 단편 (coherent fragment)만 포함할 수 있다는 것을 암시한다. 이런 맥락에서, cDNA 분자 또는 RNA는 분자 주형으로서 사용되는 DNA 서열"로부터 유래된" 것으로 칭해질 수 있다. 이에, 당해 기술 분야의 당업자는 기준 서열"로부터 유래된" 서열을 쉽게 규정할 수 있으며, 이는 DNA 또는 아미노산 수준에서 서열 정렬함으로써 대응되는 참조 서열에 대해 높은 동일성을 가질 것이며, 해당 참조 서열과 마찬가지로 DNA/아미노산의 코헤런트 가닥을 가질 것이다 (정렬된 분자의 주어진 길이에 대해 >75%의 쿼리 동일성, 단, 서열 정렬시 유래된 서열은 쿼리이고, 참조 서열은 대상이 됨). 따라서, 당업자는 중합효소 연쇄 반응 등을 이용해 본원에 제공된 내용에 기초한 각각의 서열을 적절한 대상 벡터 시스템에 클로닝하거나 또는 서열을 벡터 스캐폴드로서 이용할 수 있다. 즉, "로부터 유래된"이란 용어는 임의의 (arbitrary) 서열이 아니라, 이것이 유래된 참조 서열에 대응되는 서열이며, 일부 차이, 예를 들어, 숙주 세포 내에서 재조합 구조체의 복제시 천연적으로 발생하는 일부 돌연변이를 배제할 수 없으며, 즉 용어 "로부터 유래된"에 포함된다. 또한, 부모 서열로부터 나온 몇몇 서열 가닥들은 부모로부터 유래된 서열에 연결될 수 있다. 서로 다른 가닥들은 부모 서열에 대해 높은 상동성 또는 심지어 100% 상동성을 가질 것이다. 당업자라면, 본 발명에 따른 인공 분자 복합체의 서열이, 핵산 서열로서 제공되거나 또는 일부 제공될 경우, 이후 전사되며, 선택적으로 생체내 번역되며, 숙주 세포에서 추가적으로 소화 및/또는 가공 처리 (신호 펩타이드 절단, 내인성 바이오틴화 등)될 가능성이 있다는 것을 잘 알고 있을 것이므로, 용어 "로부터 유래된"은 본 발명의 내용에 따라 기원 서열에 대한 상관관계를 나타낸다.

본원에서, "융합체"는 하나 이상의 비-천연 서열 (예, 모이어티)를 포함하는 단백질 및/또는 핵산을 지칭할 수 있다. 융합체는 변형된 단백질의 N-말단 또는 C-말단에 또는 이 둘다에 또는 개별 도메인으로서 분자 내부에 위치될 수 있다. 핵산 분자의 경우, 융합체 분자들은 5'- 또는 3'- 말단에서, 또는 둘 사이 임의의 적절한 위치에서 부착될 수 있다. 융합체는 전사 및/또는 번역 융합체일 수 있다. 융합체는 하나 이상의 동일한 비-천연 서열을 포함할 수 있다. 융합체는 하나 이상의 서로 다른 비-천연 서열을 포함할 수 있다. 융합체는 키메라일 수 있다. 융합체는 핵산 친화성 태그를 포함할 수 있다. 융합체는 바코드를 포함할 수 있다. 융합체는 펩타이드 친화성 태그를 포함할 수 있다. 융합체는 부위-특이적인 작동자 또는 염기 편집기의 세포내 위치화를 제공할 수 있다 (예, 핵으로의 타겟팅을 위한 핵 위치화 신호 (NLS), 미토콘드리아로의 타겟팅을 위한 미토콘드리아 위치화 신호, 엽록체 타겟팅을 위한 엽록체 위치화 신호, 15 소포체 (ER) 체류 신호 등). 융합체는 추적 또는 정제하는데 사용될 수 있는 비-천연 서열 (예, 친화성 태그)을 제공할 수 있다. 융합체는 바이오틴과 같은 소분자 또는 alexa fluor 염료, Cyanine3 염료, Cyanine5 염료와 같은 염료일 수 있다. 융합체는 안정성 증가 또는 감소를 제공할 수 있다. 일부 구현예에서, 융합체는 검출가능한 신호를 제공할 수 있는 모이어티 등의 검출가능한 표지 물질을 포함할 수 있다. 검출가능한 신호를 제공할 수 있는 적합한 검출가능한 표지 물질 및/또는 모이어티로는, 비-제한적으로, 효소, 방사성 동위원소, 특이 결합 쌍의 구성원; 형광단; 플루오레센트 리포터 또는 형광 단백질; 양자점 등을 포함할 수 있다. 융합체는 FRET 쌍의 구성원, 또는 형광단/양자점 도너/어셉터 쌍의 구성원을 포함할 수 있다. 융합체는 효소를 포함할 수 있다. 적합한 효소로는 비-제한적으로 HRP (horse radish peroxidase), 루시퍼라제, β-25 갈락토시다제 등이 있을 수 있다. 융합체는 형광 단백질을 포함할 수 있다. 적합한 형광 단백질로는 비-제한적으로 그린 형광 단백질 (GFP) (예, 아큐오리아 빅토리아 (Aequoria victoria)의 GFP, 안구일라 자포니카 (Anguilla japonica)의 형광 단백질 또는 이의 돌연변이 또는 유도체), 레드 형광 단백질, 옐로우 형광 단백질, 옐로우-그린 형광 단백질 (예, 세팔로코르데이트 브란키오스토마 란세올라툼 (cephalochordate Branchiostoma lanceolatum)의 테트라머 형광 단백질로부터 유래된 mNeonGreen) 다양한 임의의 형광 및 유색 단백질 등을 포함할 수 있다. 융합체는 나노입자를 포함할 수 있다. 적합한 나노입자로는, 선택적으로 나노입자와 연결된, 형광 또는 발광 나노입자, 그리고 자기 나노입자 또는 나노다이아몬드를 포함할 수 있다. 나노입자(들)의 임의의 광학 또는 자기 특성 또는 특징을 검출할 수 있다. 융합체는 헬리카제, 뉴클레아제 (예, Fokl), 엔도뉴클레아제, 엑소뉴클레아제 (예, 5'-엑소뉴클레아제 및/또는 3'-엑소뉴클레아제), 리가제, 닉카제, 뉴클레아제-헬리카제 (예, Cas3), DNA 메틸트랜스퍼라제 (예, Dam), 또는 DNA 데메틸라제, 히스톤 메틸트랜스퍼라제, 히스톤 데메틸라제, 아세틸라제 (예를 들어, 비-제한적으로, 히스톤 아세틸라제), 데아세틸라제 (예를 들어, 비-제한적으로, 히스톤 데아세틸라제), 포스파타제, 키나제, 전사 (조) 활성인자, 전사 (조)인자, RNA 폴리머라제 서브유닛, 전사 억제자, DNA 결합 단백질, DNA 구조형성 단백질, 긴 비-코딩 RNA, DNA 복구 단백질 (예, 단일 가닥 및/또는 이중 가닥 절단을 복구하는데 참여하는 단백질, 예를 들어, 염기 절개 복구 (base excision repair), 뉴클레오티드 절개 복구, 미스매치 복구, NHEJ, HR, MMEJ (microhomology-mediated end joining), 및/또는 ANHEJ (alternative non-homologous end-joining)에 참여하는 단백질, 예를 들어, 비-제한적으로 HR 조절인자 및 HR 복합체 조립 신호), 마커 단백질, 리포터 단백질, 형광 단백질, 리간드 결합 단백질 (예, mCherry 또는 중금속 결합 단백질), 신호 펩타이드 (예, Tat-신호 서열), 타겟팅 단백질 또는 펩타이드, 세포내 위치화 서열 (예, 핵 위치화 서열, 엽록체 위치화 서열), 및/또는 항체 에피토프, 또는 이들의 임의 조합을 포함할 수 있다.

용어 "유전자 변형된" 또는 "유전자 조작" 또는 "유전자(유전학적으로) 조작된"은 본원에서 광의적인 의미로 사용되며, 인간의 개입이 없는 경우에 확인되는 상태와 다르게 목적한 방식으로 변형시키도록 타겟 세포, 조직, 기관 또는 유기체의 내인성 유전 물질 또는 트랜스크립톰 또는 프로테옴에 영향을 미치기 위한, 인간의 개입에 의해 직접 또는 간접적으로 달성되는, 핵산 서열 또는 아미노산 서열, 타겟 세포, 조직, 기관 또는 유기체에 대한 모든 변형을 의미한다. 인간 개입은 시험관내, 생체내/식물체내 (in planta) 또는 이 둘다에서 이루어질 수 있다. 추가적인 변형은, 예를 들어, 하나 이상의 점 돌연변이(들), 예를 들어 타겟화된 단백질 조작 또는 코돈 최적화, 결손(들), 및 하나 이상의 핵산 또는 아미노산 분자의 하나 이상의 삽입(들) 또는 결손(들) (상동적인 재조합 포함), 핵산 또는 아미노산 서열의 변형, 또는 이들의 조합을 포함할 수 있다. 또한, 이들 용어는, 천연적으로 생기는 참조 서열, 유기체 또는 물질과 유사하지만, 목적한 조작을 위한 하나 이상의 단계에 의해 구축된, 핵산 분자 또는 아미노산 분자 또는 숙주 세포 또는 유기체, 예로 식물 또는 이의 식물 물질을 포함할 것이다. 따라서, 본원에서, "타겟화된 유전자 조작" 또는 "타겟화된 (염기) 변형"은, 조작할 하나 이상의 세포, 바람직하게는 식물 세포에서 원하는 효과를 달성하기 위해, 타겟화된 방식, 즉 타겟 세포에서 특정 위치에서, 적절한 특수 상황에서 이루어지는, "유전자 조작"의 결과이며, 이 용어는 달성되는 변형이 예를 들어 세포의 게놈 내 타겟 부위의 이용가능한 서열 정보 및/또는 대상 분자 도구의 타겟 특이성의 정보 (핵산 또는 아미노산 서열의 인지 또는 결합 특성, 상보적인 염기 쌍 등)에 기반하여 미리 계획할 수 있도록, 타겟화할 서열에 대응되는 변형이 선행되는 서열 고려에 기초함을 암시한다.

용어 "게놈"은 유기체의 각 세포, 또는 바이러스 또는 소기관에 존재하는 유전 물질 전체 (유전자 및 비-코딩 서열); 및/또는 하나의 부모로부터 (반수체) 유닛으로서 유전된 염색체 전체 세트를 의미한다. 본원에서, 용어 "입자 총법"은 바이올리스틱 형질감염 (biolistic transfection) 또는 미세입자-매개 유전자 전달이라고도 하며, 대상 핵산 또는 유전자 구조체를 포함하는 코팅된 미세입자 또는 나노입자를 타겟 세포나 조직으로 이동시키기 위한 물리적인 전달 방법을 의미한다. 미세입자 또는 나노입자는 발사체로서 기능하며, 종종 "유전자 총 (gene gun)"으로 지칭되는 적절한 장치를 사용해 고압 하에 대상 타겟 구조로 발포한다. 입자 총법을 통한 형질전환은 대상 유전자로 덮인 금속 미세발사체를 사용하는데, 이는 "유전자 총"으로 알려진 장치를 사용해 타겟 조직의 세포 벽을 뚫기에 충분하지만 세포 사멸을 유발할 만큼 해롭지 않은 높은 속도 (~1500 km/h)로 타겟 세포에 발사된다 (Sandford et al. 1987). 세포 벽이 완전히 제거된 원형질체의 경우, 논리적으로 조건은 다르다. 하나 이상의 미세발사체 상에 침전된 핵산 또는 유전자 구조체는 발사 후 세포 내로 방출되어, 게놈에 통합된다. 미세발사체의 가속은 고 전압 전기 방전 또는 압축 가스 (헬륨)에 의해 달성된다. 사용되는 금속 입자는, 무독성, 비-반응성이며, 타겟 세포 보다 직경이 더 작아야 한다는 필수 조건을 가진다. 가장 흔히 사용되는 것은 금 또는 텅스텐이다. 유전자 총 및 이의 일반적인 사용과 관련한 관련 시스템의 제조사 및 판매사로부터 공개적으로 이용가능한 많은 정보들이 존재한다.

용어 "게놈 편집" 및 "게놈 조작"은 본원에서 상호 호환적으로 사용되며, 살아있는 유기체의 게놈 또는 임의의 유전자 정보를 타겟화된 방식으로 특이적으로 변형시키는 전략 및 기법을 지칭한다. 이와 같이, 이들 용어는 유전자 편집을 포함하며, 게놈의 유전자 코딩 영역 이외의 다른 영역의 편집 역시 포함한다. 이 용어는 또한 (존재하는 경우) 핵의 편집 또는 조작뿐 아니라 세포의 다른 유전자 정보를 편집 또는 조작하는 것을 포함한다. 아울러, 용어 "게놈 편집" 및 "게놈 조작"은 또한 후생유전학적 편집 (epigenetic editing) 또는 조작, 즉 타겟화된 변형, 예를 들어 메틸화, 히스톤 변형 또는 유전자 발현시 유전가능한 변화를 유발할 가능성이 있는 비-코딩 RNA의, 변형을 포함한다.

본원에서, "생식질 (germplasm)"은 유전 자원, 또는 보다 정확하게는 유기체의 DNA 및 이들 물질의 콜렉션을 나타내기 위해 사용되는 용어이다. 육종 기법에서, 용어 생식질은 새로운 식물 또는 식물 품종이 구축될 수 있는 유전 물질의 콜렉션을 나타내기 위해 사용된다.

용어 "가이드 RNA", "gRNA" 또는 "싱글 가이드 RNA" 또는 "sgRNA"는 본원에서 상호 호환적으로 사용되며, CRISPR RNA (crRNA)와 트랜스-활성화 crRNA (tracrRNA)로 된 합성 융합체를 지칭하거나, 또는 이 용어는 crRNA 및/또는 tracrRNA로만 이루어진 단일 RNA 분자를 지칭하거나, 또는 이 용어는 crRNA 또는 tracrRNA 모이어티를 각각 포함하는 gRNA들을 지칭한다. tracr 및 crRNA 모이어티가 따라서 하나의 공유 결합된 RNA 분자에 반드시 존재하여야 하는 것은 아니지만, 이는 2개의 개별 RNA 분자들로 구성될 수 있으며, 이들은 조합되거나 또는 비-공유 또는 공유 상호작용에 의해 조합되어 본원에 따른 gRNA를 제공할 수 있다. 용어 "gDNA" 또는 "sgDNA" 또는 "가이드 DNA"는 본원에서 상호 호환적으로 사용되며, 아르고너트 (Argonaute) 뉴클레아제와 상호작용하는 핵산 분자를 지칭한다. 본원에 언급된 gRNA 및 gDNA 둘다, 부위-특이적인 뉴클레아제와 상호작용하여 부위-특이적인 뉴클레아제를 게놈 타겟 부위로 타겟팅하는 것을 보조하는 능력으로 인해, "가이딩 핵산(들)" 또는 "가이드 핵산(들)"로 지칭된다.

본원에서, 용어 "돌연변이" 및 "변형"은 상호 호환적으로 사용되며, 생체내 또는 시험관내 핵산 조작 측면에서 부가물 (adduct)의 도입, 결손, 삽입, 부가, 치환, 편집 및/또는 가닥 절단을 의미한다. 결손은 핵산 서열에서 하나 이상의 뉴클레오티드가 생략되는 변화로서 정의된다. 삽입 또는 부가는 핵산 서열에서 하나 이상의 뉴클레오티드가 첨가되는 변화이다. "치환" 또는 편집은 치환 대상인 하나 이상의 뉴클레오티드와 다른 분자에 의해 하나 이상의 뉴클레오티드가 대체되는 것이다. 예를 들어, 티민이 시토신, 아데신, 구아닌 또는 우리딘으로 대체되는 것으로 예시되는 바와 같이, 핵산이 다른 핵산으로 대체될 수 있다. 피리미딘 -> 피리미딘 (예, C -> T 또는 T -> C 뉴클레오티드 치환) 또는 퓨린 -> 퓨린 (예, G -> A 또는 A -> G 뉴클레오티드 치환)은 염기 전이 (transition)로 지칭되며, 피리미딘 -> 퓨린 또는 퓨린 -> 피리미딘 (예, G -> T 또는 G -> C 또는 A -> T 또는 A -> C)은 염기 전환 (transversion)으로 지칭된다. 다른 구현예에서, 핵산은, 티민이 티민 글리콜로 치환되는 예와 같이, 변형된 핵산으로 대체될 수 있다. 돌연변이는 미스매치를 유발할 수 있다. 용어 미스매치는 2개의 핵산 간의 비-공유적인 상호작용을 지칭하는데, 이때 각 핵산은 서로 다른 뉴클레오티드 서열 또는 핵산 분자에 존재하는 것이며, 염기-쌍 형성 규칙을 따르지 않는다. 예를 들어, 부분적으로 상보적인 서열 5'-AGT-3' 및 5'-AAT-3'의 경우, G-A 미스매치 (염기 전이)가 존재한다.

서열 또는 분자와 관련하여 용어 "뉴클레오티드" 및 "핵산"은 본원에서 상호 호환적으로 사용되며, 천연 또는 합성 기원의 단일 가닥 또는 이중 가닥 DNA 또는 RNA를 지칭한다. 즉, 용어 뉴클레오티드 서열은 길이와 무관하게 모든 DNA 또는 RNA 서열에 사용되며, 따라서 이 용어는 하나 이상의 뉴클레오티드를 포함하는 임의의 뉴클레오티드 서열뿐 아니라 이 보다 더 큰 임의 타입의 올리고뉴클레오티드 또는 폴리클레오티드를 포괄한다. 즉, 이 용어(들)는 천연 및/또는 합성 데옥시리보뉴클레익산 (DNA) 및/또는 리보뉴클레익산 (RNA) 서열을 지칭하며, 이는 선택적으로 합성 핵산 유사체를 포함할 수 있다. 본 발명에 따른 핵산은 선택적으로 코돈 최적화될 수 있다. "코돈 최적화"는, 대상 세포 또는 유기체에서 재조합 핵산의 전사율을 개선하기 위해 DNA 또는 RNA의 코돈 용법을 대상 세포 또는 유기체에 적합하게 하는 것을, 의미한다. 당해 기술 분야의 당업자라면, 타겟 핵산이 코돈 중복 (codon degeneracy)으로 인해 하나의 위치에서 변형될 수 있지만, 이러한 변형이 번역 후 그 위치에서 여전히 동일한 아미노산 서열을 만들 것임을 잘 인지하고 있으며, 이는 타겟 세포 또는 유기체의 종-특이적인 코돈 용법을 고려하기 위해 코돈 최적화에 의해 달성된다. 본 발명에 따른 핵산 서열은 다음과 같은 비-제한적인 유기체 리스트에 대해 특이적인 코돈 최적화를 수행할 수 있다: 호르데움 불가리 (Hordeum vulgare), 소르굼 비콜러 (Sorghum bicolor), 세칼레 세레알레 (Secale cereale), 사카룸 오피시나리움 (Saccharum officinarium), 지 메이스 (Zea mays), 세타리아 이탈리카 (Setaria italica), 오리자 사티바 (Oriza sativa), 오리자 미누타 (Oryza minuta), 오리자 아우스트랄리엔시스 (Oryza australiensis), 오리자 알타 (Oryza alta), 트리티쿰 에이스티붐 (Triticum aestivum), 트리티쿰 두럼 (Triticum durum), 트리티칼레 (Triticale), 호르데움 불부숨 (Hordeum bulbusom), 브라키포듐 디스타키온 (Brachypodium distachyon), 호르데움 마리눔 (Hordeum marinum), 에이길롭스 타우치이 (Aegilops tauschii), 말루스 도메스티카 (Malus domestica), 베타 불가리스 (Beta vulgaris), 헬리안투스 안누스 (Helianthus annuus), 다우쿠스 글로키디아투스 (Daucus glochidiatus), 다우쿠스 푸실루스 (Daucus pusillus), 다우쿠스 무리카투스 (Daucus muricatus), 다우쿠스 카로타 (Daucus carota), 유칼립투스 그란디스 (Eucalyptus grandis), 에리트란테 구타타 (Erythranthe guttata), 겐리시아 아우레아 (Genlisea aurea), 니코티아나 실베스트리스 (Nicotiana sylvestris), 니코티아나 타바쿰 (Nicotiana tabacum), 니코티아나 토멘토시포르미스 (Nicotiana tomentosiformis), 니코티아나 벤타미아나 (Nicotiana benthamiana), 솔라눔 라이코퍼시쿰 (Solanum lycopersicum), 솔라눔 투베로숨 (Solanum tuberosum), 코페아 카네포라 (Coffea canephora), 비티스 비니페라 (Vitis vinifera), 쿠쿠미스 사티부스 (Cucumis sativus), 마루스 노타빌리스 (Marus notabilis), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 아라비돕시스 라이라타 (Arabidopsis lyrata), 아라비돕시스 아레노사 (Arabidopsis arenosa), 크루시히말라야 히말라이카 (Crucihimalaya himalaica), 크루시히말라야 발리치이 (Crucihimalaya wallichii), 카르다민 플렉수오사 (Cardamine flexuosa), 레피디움 비르기니쿰 (Lepidium virginicum), 캡셀라 부르사 파스토리스 (Capsella bursa pastoris), 올마라비돕시스 푸밀라 (Olmarabidopsis pumila), 아라비스 히르수테 (Arabis hirsute), 브라씨카 나푸스 (Brassica napus), 브라씨카 올레라시아 (Brassica oleracea), 브라씨카 라파 (Brassica rapa), 브라씨카 준카시아 (Brassica juncacea), 브라씨카 니그라 (Brassica nigra), 라파누스 사티부스 (Raphanus sativus), 에루카 베시카리아 사티바 (Eruca vesicaria sativa), 시트러스 시넨시스 (Citrus sinensis), 자트로파 쿠르카스 (Jatropha curcas), 글리신 맥스 (Glycine max), 고씨퓸 (Gossypium sp .), 포풀루스 트리코카르파 (Populus trichocarpa), 무스 무스쿨러스 (Mus musculus), 라투스 노르베기쿠스 (Rattus norvegicus) 또는 호모 사피엔스 (Homo sapiens).

본원에서, "뉴클레오티드"는 일반적으로 염기-당-포스페이트 조합을 지칭할 수 있다. 뉴클레오티드는 합성 뉴클레오티드를 포함할 수 있다. 뉴클레오티드는 합성 뉴클레오티드 유사체를 포함할 수 있다. 뉴클레오티드는 핵산 서열로 된 모노머 단위일 수 있다 (예, 데옥시리보핵산 (DNA) 및 리보핵산 (RNA)). 용어 뉴클레오티드는 리보뉴클레오시드 트리포스페이트 아데노신 트리포스페이트 (ATP), 우리딘 트리포스페이트 (UTP), 시토신 트리포스페이트 (CTP), 구아노신 트리포스페이트 (GTP) 및 데옥시리보뉴클레오시드 트리포스페이트, 예를 들어 dATP, dCTP, dITP, dUTP, dGTP, dTTP 또는 이의 유도체를 포함할 수 있다. 이러한 유도체는 예를 들어, 비-제한적으로, [αS]dATP, 7-deaza-dGTP 및 7-deaza-dATP, 및 이를 함유한 핵산 분자에 뉴클레아제 내성을 부여하는 뉴클레오티드 유도체 등을 지칭할 수 있다. 용어 뉴클레오티드는 본원에서 다이데옥시리보뉴클레오시드 트리포스페이트 (ddNTP) 및 이의 유도체를 지칭할 수 있다. 다이데옥시리보뉴클레오시드 트리포스페이트에 대한 예시적인 예로는, 비-제한적으로, ddATP, ddCTP, ddGTP, ddITP 및 ddTTP 등을 포함할 수 있다. 뉴클레오티드는 널리 공지된 기법으로 검출가능하게 표지되거나 또는 비-표지될 수 있다. 또한, 표지는 양자점으로 수행될 수 있다. 검출가능한 표지 물질로는, 예를 들어, 방사성 동위원소, 형광 표지물질, 화학발광성 표지 물질, 생발광성 표지 물질 및 효소 표지 물질 등을 포함할 수 있다. 뉴클레오티드의 형광 표지 물질은 비-제한적으로 플루오레세인, 5-카르복시플루오레세인 (FAM), 2'7'-5 다이메톡시-4'5-다이클로로-6-카르복시플루오레세인 (JOE), 로다민, 6-카르복시로다민 (R6G), N,N,N',N'-테트라메틸-6-카르복시로다민 (TAMRA), 6-카르복시-X-로다민 (ROX), 4-(4'-다이메틸아미노페닐아조) 벤조산 (DABCYL), 케스케이드 블루, 오렌지 그린, 텍사스 레드, 시아닌 및 5-(2'-아미노에틸)아미노나프탈렌-l-설폰산 (EDANS) 등을 포함할 수 있다.

본원에서, "비-천연" 또는 "비-천연적으로 생기는" 또는 "인공"은 핵산 또는 폴리펩타이드 서열, 또는 천연 핵산 또는 단백질에서 발견되지 않는 바이오틴 또는 플루오레세인과 같은 임의의 기타 생체분자를 지칭할 수 있다. 비-천연은 친화성 태그를 지칭할 수 있다. 비-천연은 융합체를 지칭할 수 있다. 비-천연은 돌연변이, 삽입 및/또는 결손을 포함하는 천연적으로 생기는 핵산 또는 폴리펩타이드 서열을 지칭할 수 있다. 비-천연 서열은, 비-천연 서열이 융합된 핵산 및/또는 폴리펩타이드 서열에 의해 발휘될 수 있는 활성 (예, 효소 활성, 메틸트랜스퍼라제 활성, 아세틸트랜스퍼라제 활성, 키나제 활성, 유비퀴틴화 활성 등)을 나타내거나 및/또는 코딩할 수 있다. 비-천연 핵산 또는 폴리펩타이드 서열은 천연적으로 생기는 핵산 또는 폴리펩타이드 서열 (또는 이의 변이체)에 유전자 조작에 의해 연결되어, 키메라 핵산 및/또는 폴리펩타이드를 코딩하는 키메라 핵산 및/또는 폴리펩타이드 서열을 제작할 수 있다. 비-천연 서열은 3' 혼성화 연장 서열을 지칭할 수 있다.

본원에서, 용어 "식물독성 (phytotoxic 또는 phytotoxicity)은 식물 세포, 조직, 기관 또는 식물과 관련하여, 식물 또는 임의의 식물 세포에서의 일반적으로 세포독성 또는 세포독성 효과를 의미한다. 즉, 이 용어는 식물 세포, 조직, 기관 또는 완전한 식물을 저해하거나, 손상시키거나 또는 심지어 죽이는 화합물 또는 촉발물질에 의한 식물에 대한 독성 효과를 내포한다. 이러한 손상은, 제초제, 농약, 미량 금속, 병원체에 의해 유발된 독성 작동물질, 염 함유 식물독소 (salinity phytotoxin) 또는 이종감응물질 (allelochemical) 등의 매우 다양한 화합물들에 의해 유발될 수 있다. 또한, 이 용어는 식물의 식물호르몬을 의미하지만, 에틸렌, 자스몬산 및 살리실산과 같은 식물 면역 반응을 조절하는 호르몬 또는 식물 생장 및 발단을 조절하는 옥신, 아브시스산 (ABA), 사이토카인, 지베렐린 및 브라시노스테로이드와 같은 식물 호르몬으로 제한되는 것은 아니다.

본원에서, 용어 "식물"은 완전한 식물 유기체, 식물 기관, 분화된 및 미-분화된 식물 조직, 식물 세포, 종자, 및 이의 파생물 및 후대를 지칭한다. "식물 세포"는, 비-제한적인 예로, 종자 유래 세포, 성숙 및 미성숙 배 유래 세포, 분열 조직, 모종 (seedling), 여러가지 분화 상태의 캘러스 조직, 잎, 꽃, 뿌리, 순 (shoot), 배우체, 포자체, 꽃가루 및 소포자, 원형질체 (protoplast), 거대조류 (macroalgae) 및 미세조류 유래 세포를 포함한다. 여러가지 식물 세포는 반수체, 이배체 또는 배수체일 수 있다. 용어 "식물 기관"은 식물의 형태학적으로 기능적으로 구분되는 부분을 구성하는 조직 군 또는 식물 조직을 의미한다.

본원에서, "식물 물질"은 식물의 모든 발생 단계 (developmental stage)에서 수득할 수 있는 모든 물질을 지칭한다. 식물 물질은 식물 자체 (in planta)에서 또는 식물 또는 식물 조직 또는 이의 기관의 시험관내 배양으로부터 수득할 수 있다. 즉, 이 용어는 식물 세포, 조직 및 기관뿐만 아니라 발생된 식물 구조와, 식물 세포 또는 구획 내에서 발견할 수 있거나 및/또는 식물에 의해 생산될 수 있거나, 또는 모든 발생 단계에서 임의의 식물 세포, 조직 또는 식물의 추출물로부터 수득될 수 있는, 핵산, 폴리펩타이드 및 모든 화학적 식물 물질 또는 대사산물과 같은, 세포내 성분 (sub-cellular component)을 포함한다. 이 용어는, 또한, 식물 물질을 포함하는 하나 이상의 식물 세포로부터 유래되는, 식물 물질의 파생물, 예를 들어 원형질체를 포함한다. 또한, 이 용어는 식물의 분열 조직 세포 (meristematic cell) 또는 분열 조직을 포함한다.

"플라스미드"는 이중 가닥 핵산 서열의 형태로 된 자율적으로 복제하는 원형의 염색체외 인자를 지칭한다. 유전자 조작 분야에서, 이들 플라스미드는, 예를 들어 항생제 또는 제초제에 대한 내성을 코딩하는 유전자, 타겟 핵산 서열을 코딩하는 유전자, 위치화 서열, 조절 서열, 테그 서열, 마커 유전자, 예를 들어 항생제 마커 또는 형광 마커 등을 삽입함으로써, 타겟화된 변형을 일반적으로 겪는다. 복제 오리진과 같은 오리지날 플라스미드의 구조 성분들은 유지된다. 본 발명의 특정 구현예에서, 위치화 서열은 핵 위치화 서열, 색소체 위치화 서열, 바람직하게는 미토콘드리아 위치화 서열 또는 엽록체 위치화 서열을 포함할 수 있다. 이러한 위치화 서열은 식물 생명공학 분야에서 당업자가 입수가능하다. 여러가지 대상 타겟 서열에 사용하기 위한 다양한 플라스미드 벡터들이 상업적으로 이용가능하며, 이의 변형들 역시 해당 분야의 당업자들에게 공지되어 있다.

"중합효소 연쇄 반응" (PCR)은 특정 DNA 세그먼트를 합성하기 위한 기법이다. PCR은 일련의 반복적인 변성, 어닐링 및 연장 사이클을 포함한다. 전형적으로, 이중 가닥 DNA는 열 변성되며, 타겟 세그먼트의 3' 바운더리에 상보적인 프라이머 2개가 낮은 온도에서 DNA에 어닐링된 다음 중간 온도에서 연장된다. 이러한 연속적인 3가지 단계로 된 세트를 "사이클"이라 한다.

"자손"은 식물, 식물 세포 또는 식물 조직의 임의의 후손 세대를 포함한다.

본원에서, 용어 "조절 서열"은, 대상 핵산 서열의 전사 및/또는 번역 및/또는 변형을 지시할 수 있는, 핵산 또는 아미노산 서열을 지칭한다.

본원에서, 용어 "단백질", "아미노산" 또는 "폴리펩타이드"는 상호 호환적으로 사용되며, 촉매적 효소 기능 또는 구조적 또는 기능적 작용을 가진 아미노산 서열을 지칭한다. 용어 "아미노산" 또는 "아미노산 서열" 또는 "아미노산 분자"는 모든 천연 및 화학 합성된 단백질, 펩타이드, 폴리펩타이드 및 효소 또는 변형된 단백질, 펩타이드, 폴리펩타이드 및 효소를 포함하며, 여기서 용어 "변형된"은, 야생형 서열의 말단 절단 (truncation)에서부터 더 짧지만 여전히 활성인 영역을 비롯하여, 단백질, 펩타이드, 폴리펩타이드 및 효소의 모든 화학적 또는 효소적 변형을 포함한다.

본 발명에 따르면, 당해 기술 분야의 당업자들은 통상적인 분자 생물학, 미생물학 및 재조합 DNA 기술을 사용할 수 있다. 이러한 기술들은 문헌에 충분히 설명되어 있다. 예를 들어, 특히 Sambrook, Fritsch & Maniatis, Molecular Cloning: A Laboratory Manual, Second Edition (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York (herein "Sambrook et al., 1989"); DNA Cloning: A Practical Approach, Volumes I and II (D.N. Glover ed. 1985); Oligonucleotide Synthesis (M.J. Gait ed. 1984); Nucleic Acid Hybridization (B.D. Hames & SJ. Higgins eds. (1985); Transcription and Translation (B.D. Hames & S.J. Higgins, eds. (1984); Animal Cell Culture (RI. Freshney, ed. (1986); Immobilized Cells and Enzymes (IRL Press, (1986); B. Perbal, A Practical Guide To Molecular Cloning (1984); F.M. Ausubel et al. (eds.), Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (1994)을 참조한다.

본원에서, "선별가능한 표현형" 또는 "표현형으로 선별가능한" 또는 "표현형으로 스크리닝가능한"은 생장, 대사, 식물독성 (예, 제초제) 또는 기타 화합물에 대한 민감성 또는 영양분의 소모와 관련하여 세포 또는 유기체의 성능 또는 가시적인 특징의 변형으로 정의된다. 또한, "선별가능한 표현형"은 육안 또는 특수 장치를 사용해 관찰되는 가시적인 또는 비-가시적인 외양을 포함한다. 표현형으로 선별가능한 형질은 즉 하나 이상의 게놈 영역에 의해 코딩되며, 가시적으로 현미경에 의해 또는 분자 또는 분석 생물학의 임의 수단에 의해 스크리닝할 수 있는 표현형을 나타낸다.

본 발명에서 핵산 또는 아미노산 서열의 상동성 또는 동일성 %에 관한 경우, 이들 값은 핵산의 경우 EMBOSS Water Pairwise Sequence Alignments (nucleotide) programme (www.ebi.ac.uk/Tools/psa/ emboss_water/nucleotide.html) 또는 아미노산 서열의 경우 EMBOSS Water Pairwise Sequence Alignments (protein) programme (www.ebi.ac.uk/Tools/psa/emboss_water/)을 이용함으로써 수득되는 값으로 정의된다. 국소 서열 정렬을 위해 European Molecular Biology Laboratory (EMBL) European Bioinformatics Institute (EBI)에 의해 제공되는 이들 툴은 변형된 Smith-Waterman 알고리즘 (see www.ebi.ac.uk/Tools/psa/ and Smith, T.F. & Waterman, M.S. "Identification of common molecular subsequences" Journal of Molecular Biology, 1981 147 (1):195-197)을 사용한다. 정렬 수행시 EMBL-EBI에 의해 규정된 디폴트 파라미터를 사용한다. 그러한 파라미터는 (i) 아미노산 서열의 경우: 매트릭스 = BLOSUM62, 갭 오픈 패널티 = 10 및 갭 연장 패널티 = 0.5이거나, 또는 (ii) 핵산 서열의 경우: 매트릭스 = DNAfull, 갭 오픈 패널티 = 10 및 갭 연장 패널티 = 0.5이다.

이중 가닥 핵산 서열, 예를 들어 DNA 타겟 서열로서 게놈 서열과 관련하여, 용어 "가닥 절단"은 단일 가닥 절단 및/또는 이중 가닥 절단을 포함한다. 단일 가닥 절단 (닉)은 이중 가닥의 핵산 서열의 2개의 가닥 중 하나에서 끊어짐 (interruption)을 의미한다. 이는, 이중 가닥 핵산 서열의 양쪽 가닥에서의 끊어짐을 의미하는 이중 가닥 절단과 비교된다. 본 발명에 따른 가닥 절단은, 대상 핵산 염기 위치에서, 적합한 엔도뉴클레아제, 예를 들어, CRISPR 엔도뉴클레아제 또는 야생형 단백질 또는 엔도뉴클레아제의 돌연변이되거나 절단된 버전일 수 있지만 여전히 야생형 단백질의 효소적 기능을 발휘할 수 있는 이의 변이체를 이용한 효소적 절단에 의해, 이중 가닥 핵산 서열에 도입될 수 있다.

본원에서, 용어 "타겟 영역", "타겟 부위", "타겟 구조", "타겟 구조체", "타겟 핵산" 또는 "타겟 세포/조직/유기체", 또는 "DNA 타겟 영역"은 타겟 세포의 임의 구획 내의 임의의 게놈 또는 에피게놈 영역일 수 있는 타겟을 지칭한다.

본원에서, 용어 "타겟화된 (targeted)" 또는 "부위-특이적인 (site-specific 또는 site-directed)"은 변형할 대상 게놈 영역의 서열에 대한 정보를 이용하며, 대상 게놈 타겟 영역 안에서 구현될 하나 이상의 변형을 인 실리코 예측할 수 있는, 분자 도구, 예를 들어, CRISPR 등의 뉴클레아제 및 이의 변이체, TALEN, ZFN, 메가뉴클레아제 또는 재조합효소, DNA-변형 효소, 예로, 시티딘 데아미나제 효소, 히스톤 변형 효소 등과 같은 염기 변형 효소, DNA-결합 단백질, cr/tracRNA, 가이드 RNA의 작동 기전에 대한 정보에 추가적으로 의존하는, 분자 생물학의 작용을 지칭한다. 따라서, 관련 분자 도구는 생체외 또는 인 실리코로 설계 및 구축할 수 있다.

본원에서, 용어 "전이유전자" 또는 "전이유전자성"은 하나의 유기체의 게놈으로부터 취득되거나 또는 합성에 의해 제조된 다음 대상 숙주 세포 또는 유기체 또는 조직으로 도입되고, 후숙적으로 "안정적인" 형질전환 또는 형질감염 방식을 이용해 숙주의 게놈에 통합되는, 하나 이상의 핵산 서열을 지칭한다. 반면에, 용어 "일시적인" 형질전환 또는 형질감염 또는 도입은, 선택적으로 적절한 화학제 또는 생물 제제를 포함하는, 하나 이상의 핵산 (단일 가닥 또는 이중 가닥의 DNA, RNA 또는 이들의 혼합) 및/또는 하나 이상의 아미노산 서열을 비롯하여, 분자 도구를 도입하여, 비-제한적인 예로, 세포질, 소기관, 예로 핵, 미토콘드리아, 액포, 엽록체 또는 막 등의 하나 이상의 세포의 대상 구획 내로 전달하여, 안정적인 통합 또는 삽입을 달성하지 않고도 도입된 하나 이상의 분자의 전사 및/또는 번역 및/또는 조합 및/또는 활성을 달성하고, 따라서 세포의 게놈에 도입된 각각의 하나 이상의 분자의 유전이 구축되는, 방식을 의미한다.

따라서, 본원에서, 용어 "일시적인 도입"은, 본 발명에 따른 하나 이상의 핵산 서열의 일시적인 도입, 바람직하게는 전달 벡터의 도움을 받거나 또는 도움없이, 전달 벡터 또는 재조합 구조체에의 삽입, 타겟 구조, 예를 들어, 식물 세포에 통합되는 것을 의미하며, 하나 이상의 핵산 서열은 타겟 구조의 내인성 핵산 물질, 즉 게놈에 전체로서 삽입되지 않는, 즉 하나 이상의 핵산 서열이 타겟 세포의 내인성 DNA에 삽입되지 않는, 적절한 반응 조건 하에 도입된다. 결론적으로, 일시적인 도입의 경우, 도입된 유전자 구조체는 타겟 구조의 후대, 예를 들어, 원핵생물, 동물 또는 식물 세포로 유전되지 않을 것이다. 하나 이상의 핵산 서열 또는 이의 전사 또는 번역으로부터 생기는 생성물만 일시적으로 존재하며, 즉, 일시적인 방식으로, 구성적이거나 또는 유도성 형태로 존재하므로, 따라서 타겟 세포 내에서 제한된 시간 동안 효과를 발휘하도록 작용할 수 있을 뿐이다. 따라서, 일시적인 도입에 의해 도입된 하나 이상의 핵산 서열은 세포의 후대로 유전되지 않을 것이다. 그러나, 일시적인 방식으로 도입된 핵산 서열의 효과는 타겟 세포의 후대로까지 이어질 가능성이 있을 수 있다.

본원에 기술된 임의의 부위-특이적인 작동자 또는 염기 편집기의 "변이체"는 천연적으로 생기는 야생형 효소의 활성을 변형시키기 위해, 해당 야생형 효소와 비교해 하나 이상의 돌연변이, 결손 또는 삽입을 포함하는 분자를 의미한다. "변이체"는, 비-제한적인 예로서, 촉매적으로 비-활성형 Cas9 (dCas9), 또는 닉카제로서 기능하도록 변형된 부위-특이적인 뉴클레아제일 수 있다.

상세한 설명

본 발명은 병행 도입 전략을 특이적으로 조합 및 이용하는, 식물 세포, 조직, 기관 또는 물질에서의 타겟화된 편집 방법을 제공한다. 본원에 제공된 방법은 따라서 제1 게놈 타겟 부위에서 표현형으로 선별가능한 형질의 병행 도입을 기초로 하며, 이러한 표현형으로 선별가능한 형질은 쉽게 스크리닝할 수 있으며, 전이유전자성 마커 서열 또는 마커 카세트의 도입을 포함하지 않는다. 또한, 선별가능한 표현형을 수득하기 위해 제1 게놈 타겟 부위에 타겟화된 변형의 도입은, 일반적으로 게놈 타겟 부위에 이중 가닥 절단을 도입하는 부위-특이적인 뉴클레아제 (SSN)를 이용하는 다양한 게놈 편집 방식에 필요한 단계들인, 외인성 폴리뉴클레오티드 주형의 제공도, 타겟 부위에 이중 가닥 (ds) 절단의 도입에도 의존하지 않으며, 외인성 핵산 물질로서 상동적인 복구 (HR)의 복구 주형을 제공함으로써 대개 해결된다.

이에, 일반적으로 반복적이며 일반적으로 시간 소모적인 선별 단계가 요구되는, 대상 농업 형질들을 대상 식물에 조합하는 식물 육종 전략과 구체적으로 관련있는 방법을 제공한다. 또한, 본원에 제공된 구체적인 방법 단계들은 전이유전자성 마커-프리 선별 및 여러가지 게놈 타겟 부위에서의 타겟화된 편집을 병행하여, 식물 또는 식물 세포에 선별가능한 또는 기타 표현형을 부여하게 된다. 이에, 이러한 변형된 식물 물질을 선별 마커 카세트 없이도 분리할 수 있으며, 이러한 표현형 선별은 일반적으로 이처럼 표현형으로 스크리닝가능하지 않은 제2 대상 타겟화된 변형을 스크리닝하는 비율을 현저하게 낮출 수 있다. 하나의 변형이 전이유전자성 마커-프리 선별을 보장하고 또 다른 변형은 고도의 부위-특이적이며 예측가능한 편집을 대상 게놈 타겟 부위 도입할 수 있게 하는 2가지 타겟화된 변형의 동시적인 도입의 상승적인 상호작용 (synergistic interplay)으로 인해, 본 발명의 방법은 대상 유전자형을 동정하기 위한 선별 노력을 현저하게 낮추는 것을 포함한 정확한 육종 전략을 가능케 하며, 이로써 대상 식물 세포 또는 생식질 내에서 해당 변형을 동정하는데 필요한 시간과 비율 감소의 도움이 된다.

제1 측면에서, 본 발명은, (a) 하나 이상의 제1 타겟화된 염기 변형을 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에 도입하는 단계로서, 하나 이상의 타겟화된 염기 변형이 하나 이상의 표현형으로 선별가능한 형질의 발현을 유발하는, 단계; (b) 하나 이상의 제2 타겟화된 변형을 변형할 하나 이상의 식물 세포의 제2 식물 게놈 타겟 부위에 도입하는 단계로서, 하나 이상의 제2 타겟화된 변형이 하나 이상의 부위-특이적인 작동자를 이용해 도입되어 제2 식물 게놈 타겟 부위에 하나 이상의 제2 타겟화된 변형이 달성되고, 하나 이상의 제1 타겟화된 염기 변형의 도입과 동시에 또는 후속적으로 하나 이상의 제2 타겟화된 변형이 변형할 동일한 하나 이상의 식물 세포 또는 하나 이상의 제1 타겟화된 변형을 포함하는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물에 도입되어 하나 이상의 변형된 식물 세포가 수득되는, 단계; 및 (c) (i) 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형에 의해 유발된 하나 이상의 표현형으로 선별가능한 형질을 선별하고, 선택적으로 (ii) 제2 식물 게놈 타겟 부위에서 하나 이상의 제2 타겟화된 변형을 추가로 선별함으로써, 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 단리하거나, 또는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물을 단리하는 단계를 포함하는, 전이유전자성 선별 마커 서열의 안정적인 통합없이, 하나 이상의 변형된 식물 세포, 또는 하나 이상의 변형된 식물 세포를 포함하는 하나 이상의 변형된 식물 조직, 기관 또는 완전한 식물을 단리하는 방법을 제공한다.

본 발명의 방법에 따르면, 선별가능한 마커로서 사용할 형질전환성 외인성 서열의 안정적인 통합은 필수적이지 않다. 대신, 표현형으로 선별가능한 형질 또는 표현형은 제1 식물 게놈 타겟 부위에 구축된다. 이는 선별시 마커로서 사용할 외인성 핵산 구조체의 통합에 의존하지 않는, 선별가능한 편집을 제공하는 이점이 있다.

본원에서, "표현형으로 선별가능한 형질"은 관련 게놈 형질의 발현 후 가시적인 또는 선별가능한 표현형을 유발하는 하나 이상의 유전자에 의해 코딩되는 형질을 의미한다. 이러한 형질에 대한 선별은 가시적으로, 또는 식물 세포, 조직, 기관, 물질 또는 완전한 식물에 적용될 선별 물질, 화합물 또는 촉발제를 이용함으로써, 달성될 수 있다.

제1 및 제2 식물 게놈 타겟 부위는 동일한 또는 서로 다른 게놈 유전자 좌일 수 있다. 바람직하게는, 제1 및 제2 식물 게놈 타겟 부위는 서로 다른 게놈 유전자 좌에 위치하고, 게놈 유전자 좌는 동일한 또는 서로 다른 염색체에 위치될 수 있다.

본 발명의 방법에 따르면, 제1 및 제2 타겟화된 변형의 동시적인 도입 전략이 이루어지며, 이러한 제1 및 제2 식물 게놈 타겟 부위에 도입된 여러가지 타겟화된 변형들의 병행은 이후 스크리닝 단계를 현저하게 개선한다. 통상적으로, 제1 변형은, 이로 부여되는 표현형이 식물 구축 프로세스에서 관련 또는 발현되지 않기 때문에, 선별 기회는 없을 것이다. 그래서, 본 발명의 방법의 기저가 되는 의도는 선별하기 위한 도구로서 표현형으로 선별가능한 표현형을 유발하는 제1 변형을 이용하는 것이다. 전통적인 방법과 비교해, 본원에 개시된 방법은 전이유전자성 마커 유전자를 통합시키지 않는 이점을 가진다. 선별 물질로 선별가능한 표현형을 이용하지 않는 경우와 비교해, 식물을 생산하는 세포 대부분을 포함하는 모든 또는 대부분의 무처리 세포를 제거함으로써 효율을 높이는 이점을 가진다. 무처리 세포를 제거함으로써, 생산해야 할 식물의 수가 크게 감소되며, 제2 타겟화된 변형을 분자 스크리닝해야 할 식물의 수가 크게 줄어드어, 개시된 식물 육종 방법의 효율이 크게 증가한다.

바람직하게는, 본 발명의 다양한 측면에 따른 방법들은, 대상 제2 식물 게놈 타겟 부위에의 하나 이상의 제2 타겟화된 변형 수용 (receiving)과 더불어, 변형할 하나 이상의 식물 세포에의 하나 이상의 제1 타겟화된 염기 변형, 코돈 결손 또는 프래임쉬프트 또는 결손 변형의 동시적인 또는 후속적인 도입에 의존한다. 따라서, 제1 및 제2 타겟 부위에서의 변형은 바람직하게는 동일한 세포에 동시적으로, 즉 동시적인 방식으로, 즉 병행 방식으로 도입된다. 이러한 의미에서 후속적인 도입 (subsequent introduction)은, 하나 이상의 염기 편집 복합체 및/또는 하나 이상의 부위-특이적인 작동자를 포함하는 도입된 여러가지 도구들이 서로 직전에 작용할 수 있다는 것을 의미한다. 여전히, 이 용어는 이런 맥락에서 동일한 세포 안에 대상 도구들을 동시적으로 병행 도입하는 것을 내포한다. 이는, 하나 이상의 제1 및 제2 타겟화된 변형을 매개하는 분자 도구의 도입 프로세스 커플링은 서로 완전히 독립적이기 때문에, 스크리닝 잠재성을 개선하는 효과를 가진다. 하나의 변형을 가진 변형할 세포는 따라서 또한 제2 타겟화된 변형을 가질 가능성이 훨씬 더 높다. 세포를 특히 처리된 및 무처리된 세포의 전제 집단으로부터 명확한 표현형을 일반적으로 가지지 않은 제2 변형에 대해 랜덤 선별하는 것과 비교해, 본 발명의 방법은 선별 이점을 제공해준다. 따라서, 통상적으로 게놈 편집시 병목 현상인 선별은 기능적인 방식으로 해당 도구의 전달로서 현저하게 개선되며, 동조화되고, 동시적으로 행해진다. 타겟화된 방식으로 제1 변형을 선별할 가능성으로 인해, 본 발명에 따른 임의의 도구 또는 복합체를 기능적인 방식으로 전혀 수용하지 않는 세포는 제1 식물 게놈 타겟 부위에서 표현형으로 선별가능한 형질을 유도하는 변형을 수용하지 않을 것이므로, 제2 식물 게놈 타겟 부위의 하나 이상의 타겟화된 변형을 스크리닝하는 시도는 제한된 횟수로 행해져야 있다. 상기한 식물 세포가 병행된 방식으로 세포에 첨가된 본 발명에 따른 제2 부위-특이적인 작동자 복합체를 수용할 가능성이 낮기 때문에, 제1 타겟화된 변형의 스크리닝이 음성인 경우, 제2 타겟화된 변형에 대해서는 시간-소모적인 스크리닝을 행할 필요가 없을 것이다.

따라서, 본 발명에 따른 방법은, 적절한 시약 또는 가시적인 스크리닝에 의해 제1 타겟화된 변형을 가진 타겟화된 표현형으로 선별가능한 형질을 선별함으로써 하나 이상의 제1 변형을 수용하거나 또는 수용하지 않은 세포를 선별할 수 있게 한다. 이에, 이러한 스크리닝은 하나 이상의 제1 변형을 포함하지 않는 세포를 제거하거나, 스크리닝은 육안 검사 (visual inspection) 및 제1 타겟화된 변형을 수용한 또는 수용하지 않은 변형된 세포들로의 분리를 가능하게 한다. 제1 타겟화된 변형을 성공적으로 수용한 세포들 중에서, 본 발명에 따른 병행 도입 및 전달 방식으로 인해 합리적인 갯수가 하나 이상의 제2 타겟화된 변형 역시 가질 것으로 예상할 수 있다. 이러한 맥락에서 "합리적인"은 하나 이상의 제1 타겟화된 염기 변형에 의해 유발된 하나 이상의 표현형으로 선별가능한 형질을 선별함으로써 하나 이상의 제2 타겟화된 변형의 존재를 스크리닝해야 하는 세포의 수의 임의 개선, 즉 감소를 내포한다. 하나 이상의 제2 타겟화된 변형이 존재하는 실제 빈도는 일반적으로 수종의 인자에 따라 가변적일 것이므로, 예측하기 어렵다. 이는 통상적인 분자 기법, 예를 들어 PCR 기반의 통상적인 분자 기법을 이용하여 스크리닝하기 번거러운 게놈 조작을 통해 도입된 임의의 변형을 스크리닝하게끔 한다. 본 발명의 방법에 따르면, 제1 및 제2 타겟화된 변형 둘다 수용한 세포의 빈도는, 제1 및 제2 변형을 가진 것에 대해, 제1 변형을 가진 식물 세포 또는 식물 2:1 내지 1,000:1 범위일 수 있다. 따라서, 제2 변형을 스크리닝하여야 하는 세포의 총 수가 줄어들기 때문에, 임의의 스크리닝 또는 선별 단계에서 본질적인 이점이 존재한다. 구체적으로, 제1 및 제2 타겟화된 변형을 도입하기 위한 도구의 전달에 실패한 세포는, 임의의 분자 도구(들)를 수용하지 않을 가능성이 높으며, 따라서 제1 타겟화된 변형도 제2 타겟화된 변형도 존재하지 않을 것이다. 표현형으로 선별가능한 제1 형질이 나타나지, 즉 선별가능하지 않을 것이다. 선별압 또는 육안 선별 후, 표현형으로 선별가능한 형질이 "음성"인 해당 식물 세포, 조직, 기관 또는 완전한 식물은, 제1 변형이 존재하지 않을 경우 제2 변형이 도입될 기회가 대응되는 도구의 병행 도입으로 인해 낮기 때문에, 제2 타겟화된 변형에 대한 후속적인 스크리닝을 거치지 않아도 될 것이다.

필요에 따라, 유래된 식물을 교배하고 제2 변형으로부터 이를 유전자적으로 분리함으로써, 제1 변형을 제거할 수 있다.

본원에 개시된 방법은 따라서 하나 이상의 제1 타겟화된 대상 변형에 대해 스크리닝한 바와 같이 편집 시약을 수용하지 않거나 또는 타겟화된 변형을 겪지 않은 세포를 소거 또는 제거함으로써 대상 제2 유전자에서 타겟화된 변형을 가진 식물 회수를 높이는데 이용할 수 있다.

본 발명의 다양한 구현예에 따른 타겟화된 염기 변형은, dsDNA 백본 절단 또는 도너 주형 없이도, 프로그래밍가능한 방식으로 하나의 타겟 DNA 염기를 다른 것으로 직접적이고 비가역적으로 변환할 수 있는 게놈 편집을 의미한다 (cf. Komor et al., Nature, Vol. 533, 2016).

일 구현예에서, 본 발명의 제1 측면에 따른 방법은, 부가적으로, 단계 (b)에서, 적어도 제2 식물 게놈 타겟 부위에서 타겟화된 서열 변환 또는 치환을 만들기 위해 복구 주형을 도입하는 것을 포함한다. 복구 주형 (RT)은 임의의 게놈 편집시 제공될 수 있는 이중 가닥 또는 단일 가닥 핵산 서열이며, 이는 이중 가닥 또는 단일 가닥 DNA 절단을 유발하여, 상동적인 복구 (homology-directed repair)를 보조하는 것으로 알려진 서열을 가진 주형으로서, RT를 제공함으로써 DNA 절단의 타겟화된 복구를 보조한다. 본 발명에 따른 하나 이상의 복구 주형 핵산 서열의 크기는 부분적으로 다양할 수 있다. 이는 부위-특이적인 방식으로 변형할 DNA 타겟 서열에 따라 약 20 bp 내지 약 5,000 bp 또는 심지어 8,000 bp 범위일 수 있다. RT는 개별체 (physical entity)로서 또는 본 발명에 따른 복합체의 일부로서 제공될 수 있다. RT의 사용은 세포의 NHEJ 복구 기전으로 인한 부적절한 삽입 또는 결손을 회피하기 위해 특정 용도에 유익할 수 있을 것이다.

본 발명의 다양한 측면들에 따른 일 구현예에서, 본원에 제공된 방법은 (d) 하나 이상의 제1 타겟화된 변형 및 하나 이상의 제2 타겟화된 변형을 포함하는 하나 이상의 변형된 식물 또는 식물 물질을 추가의 대상 식물 또는 식물 물질과 교배하여, 수득되는 자손 식물 또는 식물 물질을 분리함으로써, 대상 유전자형, 선택적으로 하나 이상의 제1 타겟화된 변형을 포함하지 않는 대상 유전자형을 달성하는 추가적인 단계를 포함한다.

추가적인 대상 식물 또는 식물 물질은 대상 게놈 물질을 포함하는 임의의 식물 물질일 수 있으며, 예를 들어 임의의 대상 형질 또는 엘리트 이벤트 (elite event)를 포함하는 이 물질은, 예를 들어, 유전자형을 구축하고, 따라서 대상 식물을 확립하기 위한 후속적인 육종 라운드 용도로 의도된다. 따라서, 대상 유전자형은 여러가지 대상 식물로부터 유래된 형질들을 조합하는 선행 육종 단계의 결과이다.

본 발명의 모든 측면들에 따른 일 구현예에서, 대상 최종 유전자형은 하나 이상의 제1 타겟화된 변형, 즉 하나 이상의 표현형으로 선별가능한 형질을 포함하지 않는다. 도 1에 예시한 바와 같이, 본 발명의 방법은, 특정 용도에서 바람직하다면, 원하는 식물을 교배하고, 이를 제2 타겟화된 변형으로부터 유전자 측면에서 분리함으로써, 표현형으로 선별가능한 형질을 유발하는 제1 타겟화된 변형을 제거하는데 특히 적합하다 (cf. 도 1 C). 다른 구현예에서, 표현형으로 선별가능한 대상 형질을 코딩하는 제1 타겟화된 변형은, 달성되는 대상 유전자형 및 대응되는 식물 또는 식물 물질에 이와 같은 표현형으로 선별가능한 형질이 유용한 경우에, 대상 유전자형을 유지할 수 있다.

본 발명의 제1 측면에 따른 일 구현예에서, 하나 이상의 부위-특이적인 작동자는 하나 이상의 염기 편집 복합체에 일시적으로 또는 영구적으로 연결되며, 염기 편집 복합체는 단계 (a)의 하나 이상의 제1 타겟화된 염기 변형을 매개한다. 따라서, 하나 이상의 부위-특이적인 작동자는 하나 이상의 염기 편집 복합체에 비-공유적으로(일시적으로) 또는 공유적으로(영구적으로) 부착될 수 있다. 하나 이상의 염기 편집 복합체의 임의 구성성분이 하나 이상의 부위-특이적인 작동자에 일시적으로 또는 영구적으로 연결될 수 있다. 용어 "일시적" 및 "영구적"은 따라서 광의적으로 해석되며, 하나 이상의 부위-특이적인 작동자 및 하나 이상의 염기 편집 복합체의 물리적 근접성을 달성하기 위한 공유적 및/또는 비-공유적 결합 또는 부착을 둘다 포함한다. 적어도 하나 이상의 염기 편집 복합체의 구성성분 및 하나 이상의 부위-특이적인 작동자 또는 임의의 기타 구성성분, 예를 들어 하나 이상의 부위-특이적인 작동자와 조합된 gRNA 또는 RT 상의 연결은, 하나 이상의 제1 및 하나 이상의 제2 게놈 타겟 부위가 대상 게놈 내에서 매우 근접하게 위치된 경우에, 흥미로울 수 있다.

본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 부위-특이적인 작동자는 CRISPR 뉴클레아제, 예로 Cas 또는 Cpf1 뉴클레아제, TALEN, ZFN, 메가뉴클레아제, 아르고너트 (Argonaute) 뉴클레아제, 제한 엔도뉴클레아제, 예로, FokI 또는 이의 변이체, 재조합효소 또는 2 부위-특이적인 닉킹 엔도뉴클레아제, 또는 염기 편집기, 또는 전술한 작동자의 임의의 변이체 또는 촉매학적으로 활성인 단편을 포함하는, 하나 이상의 뉴클레아제로부터 선택된다.

따라서, 본원에서, "부위-특이적인 작동자"는, 게놈 타겟 부위에 단일 가닥 또는 이중 가닥 절단을 도입할 수 있는 능력, 또는 대상 게놈 타겟 부위에 점 돌연변이, 삽입 또는 결손을 포함하여 타겟화된 변형을 도입할 수 있는 능력을 가진, 임의의 뉴클레아제, 닉카제, 재조합효소 또는 염기 편집기로서 정의될 수 있다. 하나 이상의 "부위-특이적인 작동자"는 자체적으로 작용할 수 있거나, 또는 분자 복합체의 일부로서 다른 분자와 조합하여 작용할 수 있다. "부위-특이적인 작동자"는, 부위-특이적인 작동자 복합체의 구성성분들이 물리적으로 인접하도록 공유 또는 비-공유적 상호작용 중 하나 이상에 의해 결합된 또는 결합되는, 개별 분자들로서 또는 융합 분자로서 존재할 수 있다.

본원에서, "염기 편집기"는 단백질 또는 기원이 되는 단백질과 동일한 촉매 활성을 가진 이의 단편을 지칭하며, 단백질 또는 이의 단편은 단독으로 또는 분자 복합체로서 제공되는 경우에는 본원에서 염기 편집 복합체로서 지칭되며, 만일 염기 변환이 침목 돌연변이를 야기하지 않고 오히려 염기 편집기로 변환할 위치를 포함하는 코돈에 의해 코딩된 아미노산의 변환을 유발한다면, 타겟화된 염기 변형을 매개할 수 있는 능력, 즉 대상 점 돌연변이를 유발하여 타겟화된 돌연변이를 발생시킬 수 있는 대상 염기의 변환을 매개하는 능력을 가진다. 바람직하게는, 본 발명에 따른 하나 이상의 염기 편집기는 하나 이상의 부위-특이적인 작동자, 또는 선택적으로 하나 이상의 부위-특이적인 작동자 복합체의 구성성분에 일시적으로 또는 영구적으로 연결된다. 연결은 공유 및/또는 비-공유적일 수 있다.

본원에 기술된 임의의 염기 편집기 또는 부위-특이적인 작동자 및 이의 촉매학적으로 활성인 단편, 또는 염기 편집기 복합체 또는 부위-특이적인 작동자 복합체의 임의 구성성분은 핵산 단편으로서 세포에 도입될 수 있으며, 핵산 단편은 DNA, RNA 또는 단백질 작동자이거나 또는 이를 코딩하는 것이거나, 또는 이는 DNA, RNA 및/또는 단백질, 또는 이들의 임의 조합으로서 도입될 수 있다.

엔도뉴클레아제, DSB 및 복구 주형으로 선별가능한 변형을 만들기 위한 요건을 제거하는 핵심적인 툴세트는 염기 편집기 또는 타겟화된 돌연변이 유발 도메인의 사용이다. 복수의 간행물들에서 CRISPR/Cas9 닉카제 또는 시티딘 데아미나제 도메인에 연결된 비-기능성 뉴클레아제, 아포지단백질 B mRNA-편집성 촉매적 폴리펩타이드 (APOBEC1), 예를 들어 랫 유래의 APOBEC를 이용하여, 타겟화된 염기 변환, 주로 시티딘 (C)에서 티민 (T) 변환이 입증된 바 있다. 시토신 (C)의 탈아민화는 시티딘 데아미나제에 의해 촉매되며, 우라실 (U)이 만들어지며, 이는 티민 (T)과 염기 쌍을 형성하는 특성을 가진다. 가장 알려진 시티딘 데아미나제는 RNA에 작용하며, DNA를 받아들이는 것으로 공지된 수종의 예들은 단일 가닥 (ss) DNA를 필요로 한다. dCas9-타겟 DNA 복합체에 대한 연구를 통해, 대체된 DNA 가닥의 뉴클레오티드 (nt) 9개 이상이 Cas9-가이드 RNA-DNA 'R-루프' 복합체의 형성시 쌍 형성으로부터 해리되는 것으로, 밝혀졌다 (Jore et al., Nat. Struct. Mol. Biol., 18, 529-536 (2011)). 실제, Cas9 R-루프 복합체의 구조에서, 대체된 DNA 가닥의 프로토스페이서 첫 nt 11개는 무질서해지는데, 이는 이러한 움직임이 매우 제한적이지 않다는 것을, 시사한다. 비-주형 가닥에서 시토신의 Cas9 닉카제-유도성 돌연변이가 세포의 시토신 데아미나제 효소에 의한 이의 허용성으로부터 생길 수 있는 것으로 또한 추측되었다. R-루프에서 ssDNA 가닥 서브세트는 DNA에서 C에서 U로의 직접적이고 프로그래밍가능한 변환을 달성하기 위한 dCas9-묶인 (tethered) 시티딘 데아미나제의 효과적인 기질로서 이용할 수 있는 것으로 추정되었다 (Komor et al., supra).

따라서, 본 발명에 따른 임의의 염기 편집 복합체는 하나 이상의 시티딘 데아미나제 및 이의 촉매학적으로 활성인 단편을 포함한다. 하나 이상의 염기 편집 복합체는, 염기 편집기로서, 시티딘 데아미나제 또는 촉매학적 활성 단편 형태로 이의 도메인을 포함할 수 있다.

다른 구현예에서, 하나 이상의 제1 타겟화된 염기 변형은 임의의 뉴클레오티드 C, A, T 또는 G에서 임의의 다른 뉴클레오티드로의 변환이다. C, A, T 또는 G 뉴클레오티드 중 어느 하나는 부위-특이적인 방식으로 염기 편집기 및 이의 촉매학적으로 활성인 단편에 의해 다른 뉴클레오티드로 교체될 수 있다. 하나 이상의 염기 편집 복합체는 따라서 타겟화된 방식으로 임의의 다른 대상 뉴클레오티드로 대상 뉴클레오티드를 변환할 수 있는, 임의의 염기 편집기 또는 이의 염기 편집기 도메인 또는 이의 촉매학적 활성 단편을 포함할 수 있다.

본 발명은 이와 같은 염기 편집기 도구에 대한 정보를 조합하는 방법을 제공하며, 염기 편집으로 선별가능한 표현형 아웃풋을 가진 내인성 마커를 인위적으로 구축할 수 있으므로, 전이유전자성 마커의 사용을 피하기 위한, 표현형으로 선별가능한 대상 표현형을 달성하는 조합된 방법으로 이 기법을 이용한다. 이를 위해, 염기 편집기는, C에서 U 또는 G에서 A로의 변형을 매개하여 부위 특이적인 돌연변이 유발을 도입하기 위해, 선택적으로, CRISPR-기반의 뉴클레아제에 대한 gRNA에 의해 안내되는 게놈 타겟 영역을 인지 및 결합하는 능력을 보유한, 변형된 부위-특이적인 작동자와 조합된다. 그래서, 타겟화된 돌연변이가 달성될 수 있으며, 이로써 대상 표현형이 구축된다. 이는, 특히 본원에 기술된 방법은 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에 타겟화된 염기 변형을 도입하기 위한 하나 이상의 염기 편집기 또는 염기 편집 복합체의 사용을, 하나 이상의 부위-특이적인 작동자에 의해 매개되는 제2 변형과 병행 방식으로 조합하는 것이므로, 타겟화된 육종 전략 방식을 제시해준다. 이러한 방식은, 본 발명의 다양한 측면들에 따른 하나 이상의 제1 변형을 위해, 즉, 타겟화된 염기 변형, 타겟화된 코돈 결손 또는 타겟화된 프래임쉬프트 또는 결손 변형을 위해 DSB 또는 RT를 도입할 필요없이, 상승적인 방식으로 대상 변형 또는 유전자형을 마커-프리 방식으로 선별 및 스크리닝할 수 있게 해준다.

우라실 DNA 글리코실라제 (UGI) 도메인의 추가는 염기-편집 효율을 추가적으로 높인다. 복합체의 적절한 타겟팅을 보장하기 위해 핵 위치화 신호 (NLS) 또는 임의의 다른 소기관 타겟팅 신호가 추가적으로 필요할 수도 있다.

본 발명의 모든 측면들에 따른 일 구현예에서, 하나 이상의 부위-특이적인 작동자는 CRISPR-기반의 뉴클레아제이고, CRISPR-기반의 뉴클레아제는 하나 이상의 염기 편집 복합체를 디렉팅하는 부위-특이적인 DNA 결합 도메인을 포함하며, 하나 이상의 CRISPR-기반의 뉴클레아제 또는 이를 코딩하는 핵산 서열은 (a) SpCas9, SaCas9, SaKKH-Cas9, VQR-Cas9, St1Cas9 등의 Cas9, (b) AsCpf1, LbCpf1, FnCpf1 등의 Cpf1, (c) CasX, 또는 (d) CasY, 또는 전술한 CRISPR-기반의 뉴클레아제의 임의 변이체 또는 유도체를 포함하는 군으로부터 선택되며, 바람직하게는 하나 이상의 CRISPR-기반의 뉴클레아제는 해당 야생형 서열과 비교해 돌연변이를 포함하며, 그래서 제조되는 CRISPR-기반의 뉴클레아제는 단일 가닥 특이적인 DNA 닉카제, 또는 모든 DNA 절단력이 결핍된 DNA 결합 작동자로 변환된다.

본원에서, "CRISPR-기반의 뉴클레아제"는 천연적으로 생긴 다음 이의 천연 상태로부터 단리되고, 바람직하게는 타겟화된 게놈 조작의 도구로서 적합하게 변형되거나 또는 대상 재조합 구조체에 조합된, CRISPR 시스템에서 동정된 임의의 뉴클레아제이다. 임의의 CRISPR-기반의 뉴클레아제가 사용될 수 있으며, 선택적으로 오리지날 야생형 CRISPR-기반의 뉴클레아제가 DNA 인지, 즉 결합 특성을 제공하는 한, 본 발명에 따른 다양한 구현예에 적합하게 리프로그래밍되거나 또는 추가적으로 돌연변이될 수 있다. 이러한 DNA 인지는 PAM 의존적일 수 있다. 최적화되고 조작된 PAM 인지 패턴을 가진 CRISPR 뉴클레아제가 사용될 수 있으며, 특정한 용도로 구축될 수 있다. PAM 인지 코드의 확대 (expansion)는, 야생형 CRISPR-기반의 뉴클레아제의 오리지날 PAM 특이성과 무관하게, 부위-특이적인 작동자 복합체를 대상 타겟 부위로 타겟팅하는데 적합할 수 있다. Cpf1 변이체는 S542R, K548V, N552R 또는 K607R 돌연변이 중 하나 이상, 바람직하게는 액시드아미노코커스 (cf. 서열번호 24) 유래의 AsCpf1에서 돌연변이 S542R/K607R 또는 S542R/K548V/N552R을 포함할 수 있다. 또한, 변형된 Cas 변이체, 예를 들어 Cas9 변이체는, 염기 편집 복합체의 일부로서 예를 들어 BE3, VQR-BE3, EQR-BE3, VRER-BE3, SaBE3, SaKKH-BE3의 일부로서 본 발명의 방법에 따라 사용할 수 있다 (Kim et al., Nat. Biotech., 2017, doi:10.1038/nbt.3803). 따라서, 본 발명에서, 이중 가닥 절단 효소의 의미에서 임의의 "뉴클레아제"가 아닐 수 있지만, 여전히 본질적인 DNA 인지, 따라서 결합력을 가지고 있는 뉴클레아제-데드 변이체 (nuclease-dead variant) 또는 닉카제일 수 있는, 인위적으로 변형된 CRISPR 뉴클레아제가 고려된다. 본 발명의 목적에 적합한 예시적인 Cas- 또는 Cpf1-기반의 구조체는 서열번호 17 - 19에 열거된다. AsCpf1 야생형 서열은 서열번호 24에 기술된다. 본 발명의 방법에 사용하기에 적합한 다른 Cpf1-기반의 작동자는 라크노스피래세애 박테리움 (Lachnospiraceae bacterium) (LbCpf1, 예로, NCBI Reference Sequence: WP_051666128.1), 또는 프란시셀라 툴라렌시스 (Francisella tularensis) (FnCpf1, 예, UniProtKB/Swiss-Prot: A0Q7Q2.1)로부터 유래된다. Cpf1의 변이체들이 공지되어 있다 (cf. Gao et al., BioRxiv, dx.doi.org/10.1101/091611). 시험관내 및 생체내 강화된 활성을 가진, 각각 TYCV/CCCC 및 TATV PAM을 가진 타겟 부위를 절단할 수 있는 돌연변이 S542R/K607R 및 S542R/K548V/N552R을 가진 AsCpf1의 변이체는, 따라서 본 발명에 따른 부위-특이적인 작동자로서 간주된다. 오프-타겟 활성의 게놈-와이드 분석에서, 이들 변이체가 DNA 타겟팅 특이성을 높은 수준으로 보유한 것으로 나타났으며, 이는 non-PAM-상호작용 도메인에 돌연변이를 도입함으로써 추가적으로 개선할 수 있다. 요컨대, 이들 변이체는 인간 게놈의 비-반복 영역에 각 ~8.7에서 하나의 절단부에 대한 AsCpf1의 타겟팅 범위를 증가시키며, 단, CRISPR/Cas 게놈 조작 툴박스에 유용한 추가를 제공한다 (Gao et al., supra).

본 발명의 제1 측면에 따른 일 구현예에서, 하나 이상의 제1 타겟화된 염기 변형은 하나 이상의 염기 편집기를 구성성분으로서 포함하는 하나 이상의 염기 편집 복합체에 의해 수행된다. 본 발명에 따른 염기 편집 복합체는 염기 편집기를 포함하며, 아울러 선택적인 구성성분을 추가로 포함한다.

일 구현예에서, 염기 편집 복합체는 APOBEC1 구성성분, 바람직하게는 랫 APOBEC1을 포함한다. 다른 구현예에서, 염기 편집 복합체는 염기 편집기로서 임의의 시티딘/시토신 데아미나제 효소, 예를 들어 인간 AID, 예컨대, UniProtKB/Swiss-Prot: Q9GZX7.1, 인간 APOBEC3G, 예컨대, GenBank: CAK54752.1, 또는 칠성장어 (lamprey) CDA1, 예컨대 GenBank: ABO15150.1을 포함하며, 임의의 효소 또는 이의 촉매학적 활성인 단편도 본 발명의 범위에 고려된다. 본 발명의 방법으로 사용하기 적합한 예시적인 APOBEC 구성성분은 서열번호 20으로 표시된다. 아울러, 변형된 염기 편집기를 본 발명의 방법에 따라 사용할 수 있으며, 바람직하게는 바람직하게는 < 6 nt, < 5 nt, < 4 nt, < 3 nt 또는 심지어 2　또는 1 nt의 편집 폭이 작은 염기 편집기가 사용될 수 있다. 편집 범위가 더 작을수록, 보다 정확한 편집을 대상 게놈 타겟 부위에 도입할 수 있다.

일 구현예에서, 염기 편집 복합체는 UGI (우라실 DNA 글리코실라제 저해제) 구성성분을 포함한다. 특정 구현예에서, 바실러스 섭틸리스 유래 UGI이 사용되거나, 또는 특정 세포에서 활성인 내인성 염기-절개 복구 (base-excision repair, BER) 활성을 억제하기 위해 UDG 활성을 저해하는 임의의 다른 도메인이 사용될 수 있다. 본 발명의 방법에 사용하기 적합한 예시적인 UGI 구성성분은 서열번호 21로 표시된다.

다른 추가의 구현예에서, 염기 편집 복합체는 하나 이상의 부위-특이적인 작동자에 연결된 하나 이상의 염기 편집기의 최적화된 탈아민화 활성을 제공하기 위해, XTEN 구성성분, 즉, 특이적인 링커를 포함한다. 염기 편집기와 부위-특이적인 작동자 사이에 뉴클레오티드 (nt) 2개 이상 길이의 다른 링커가 사용될 수 있으며, 이 링커는 부위-특이적인 작동자에 의해 부여되는 결합 활성 및/또는 염기 편집기의 염기 편집 활성에 영향을 미치지 않는다. 적절한 XTEN 링커 서열은 서열번호 1 (688번부터 735번 위치), 서열번호 2 (706번부터 753번 위치), 서열번호 14 (706번부터 753번 위치), 또는 서열번호 15 (706번부터 753번 위치)에 제공된다. 당해 기술 분야의 당업자에게 공지된 다양한 추가적인 링커뿐 아니라 링커 설계에 대한 문헌들이 존재한다. 고정된 링커뿐 아니라 유연한 링커 둘다 본 발명의 다양한 방법에 따라 사용될 수 있다.

본 발명에 따른 융합 구조체의 예는 서열번호 1, 2, 14, 15 또는 16으로 제공된다.

일 구현예에서, 하나 이상의 염기 편집 복합체는 구성성분을 한개 보다 많이 포함하며, 적어도 2개의 구성성분이 물질적으로 연결된다. 물질적인 연결은 공유 연결, 예를 들어, DNA 단편들을 서로 융합하여 발현 후 융합 단백질을 구축하거나, 또는 본 발명에 따른 복합체의 서로 다른 구성성분들을 서로 화학적으로 가교함으로써, 공유 연결을 포함할 수 있다. 물질적인 연결은 부가적으로 비-공유적 상호작용을 포함할 수 있다. 따라서, 비-공유적 상호작용 또는 부착은 정전기 상호작용, 반데르 발스 힘, TT-이펙트 및 소수성 효과를 포함한다. 핵산 분자 측면에서 특히 중요한 것은 정전기 상호작용으로서 수소 결합이다. 수소 결합 (H-결합)은 부분적인 양의 수소 원자와 수소 원자에 공유 결합되지 않은 음전기성이 매우 높은 부분적인 음의 산소, 질소, 황 또는 불소 원자 간의 상호작용을 수반하는, 특별한 타입의 쌍극자-쌍극자 상호작용이다.

추가적인 구현예에서, 염기 편집 복합체는 염기 편집기로서 PmCDA1 (바다 칠성장어 유래의 활성화-유도된 시티딘 데아미나제 (AID) 오르소로그 PmCDA1, Nishida et al. (Science 2016, vol. 353, issue 6305, aaf8729) 참조함) 구성성분을 포함한다. 본 발명의 방법에 따라 사용하기 위한 예시적인 PmCDA1은 서열번호 22에 제공된다.

CRISPR-기반의 뉴클레아제는 변형할 대상 게놈 타겟 영역 내에 존재하는 프로토스페이서-인접 모티프 (PAM)의 인지를 통해 작동한다. 변형된 CRISPR-기반의 뉴클레아제를 이용하여 염기 편집의 범위 및 정확도를 추가적으로 높이기 위해, 타겟화할 수 있는 부위의 수를 늘리기 위한 여러가지 PAM 특이성 도입이 특히 관심의 대상이다 (Kim et al., Nat. Biotech., 2017, doi:10.1038/nbt.3808). 당해 기술 분야의 당업자에 공지된 바와 같이, 야생형 CRISPR 뉴클레아제는 뉴클레아제에 따라 다양한 본질적인 PAM 특이성을 가진다. 본 발명에서, 변형된 PAM 특이성, 따라서 변형된 타겟팅 범위를 가진, CRISPR-기반의 뉴클레아제, 예를 들어, NGA (VQR-Cas9), NGAG (EQR-Cas9) 또는 NGCG (VRER-Cas9) PAM 서열을 수용하는 SpCas9 돌연변이뿐 아니라 NNNRRT에 대한 변이체의 PAM 요건을 완화하는 돌연변이 3개 (SaKKH-Cas9)를 포함하는 조작된 SaCas9 변이체가 고려된다 (Kleinstiver et al., Nat. Biotechnol. 33, 1293-1298 (2015)). 여러가지 CRISPR-기반의 뉴클레아제에 적합한 본 발명에 따른 예시적인 PAM 서열은 서열번호 3-13 및 23으로 표시된다.

일 구현예에서, 하나 이상의 염기 편집 복합체는 2개 이상의 구성성분을 포함하며, 2 이상의 구성성분은 개별 구성성분으로 제공된다. 이러한 방식은 특정 형질전환 또는 형질감염 전략에 적합할 수 있다.

본 발명에 따른 특정 구현예에서, 본 발명에 따른 임의의 복합체의 하나 이상의 구성성분은, 복합체가 세포 안에서 형성되거나 또는 복합체가 형질전환 또는 형질감염 이전에 생체외에서 형성될 수 있도록, 대상 세포에서 동족 결합 파트너와 특이적으로 상호작용하거나 또는 조합할 수 있는 부분 또는 영역을 포함할 수 있다. 결합 쌍들은 도킹 도메인 또는 조합 도메인, 또는 이를 코딩하는 핵산 서열을 통해 조합할 수 있으며, 이는 바이오틴, 앱타머, DNA, RNA 또는 플루오레세인을 포함하는 형광단을 포함하는 단백질 염료, 또는 이의 변이체, 말레이미드 또는 테트라졸륨 (XTT), 하나 이상의 복구 주형 핵산 서열과 상호작용하도록 특이적으로 구성된 가이드 핵산 서열, 스트렙타비딘 또는 이의 변이체, 바람직하게는 모노머성 스트렙타비딘, 아비딘 또는 이의 변이체, 친화성-태그, 바람직하게는 스트렙타비딘-태그, 항체, 단쇄 가변 단편 (scFv), 주어진 항체 또는 scFv에 대해 특이적인 항원, 싱글-도메인 항체 (나노바디), 안티칼린 (anticalin), 아그로박테리움 VirD2 단백질 또는 이의 도메인, 피코나바이러스 VPg, 토포이소머라제 또는 이의 도메인, PhiX174 파지 A 단백질, PhiX A* 단백질, VirE2 단백질 또는 이의 도메인, 또는 디곡시게닌 (digoxigenin) 중 하나 이상으로부터 선택된다. 다른 적합한 결합 쌍들도 당해 기술 분야의 당업자들에게 공지되어 있다. 가장 바람직하게는, 동족 결합 파트너는 높은 친화성 상수 (high affinity constant) 또는 결합 친화성을 가지며, 따라서 본 발명에 따른 하나 이상의 염기 복합체 또는 하나 이상의 부위-특이적인 작동자 복합체의 복합체 형성을 돕기 위해, 생리학적 조건에서 각각에 대해 낮은 해리 상수 (K_d)를 가지며, 즉 K_d 값은 낮은 μM, 또는 바람직하게는 nM 범위, 바람직하게는 그 보다 더 낮다.

본 발명의 모든 측면들에 따른 일 구현예에서, 하나 이상의 염기 편집 복합체의 하나 이상의 구성성분, 및/또는 하나 이상의 부위-특이적인 작동자 복합체의 하나 이상의 구성성분은 하나 이상의 염기 편집 복합체를 세포내 소기관으로의 타겟화하기 위한 하나 이상의 소기관 위치화 신호를 포함한다. 일 구현예에서, 하나 이상의 소기관 위치화 신호는 핵 위치화 신호 (NLS)이다. 추가적인 구현예에서, 하나 이상의 소기관 위치화 신호는 엽록체 수송 펩타이드이다. 다른 추가의 구현예에서, 하나 이상의 소기관 위치화 신호는 미토콘드리아 수송 펩타이드이다. 하나 이상의 위치화 신호(들)가 염기 편집의 하나 이상의 구성성분 또는 부위-특이적인 작동자 복합체와 조합되어 존재할 수 있다.

본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 게놈 타겟 부위이고, 하나 이상의 표현형으로 선별가능한 형질은 내성/허용성 형질 또는 생장 우세 형질이고, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형은 하나 이상의 변형된 식물 세포, 조직 또는 식물, 또는 그 자손에 부가될 화합물 또는 촉발제에 대해 내성/허용성 또는 생장 우세를 부여한다.

본원에서, "생장 우세"는 식물 발생 및 재생의 모든 단계 동안에 임의의 생리학적 또는 대사적으로 유익한 특성을 의미하며, 예를 들어 생물적 및 비생물적 스트레스에 대한 내성에 유익한 특성 또는 예를 들어 가뭄 또는 염분과 같은 스트레스 조건에서의 식물 생장 및 발달에 영향을 미치는 특성을 의미한다.

본 발명에 따른 "화합물" 또는 "촉발제"는 제초제일 수 있으며, 이는 예를 들어 세포 대사 저해제로부터 선택되며, 예를 들어: EPSPS 저해 (글리신, 예, 글리포세이트); ALS/AHAS (분지형 아미노산 생산) 저해 (예를 들어, 이미다졸린, 설포닐우레아); 지질 합성 저해/ACCases (아릴옥시페녹시프로피오네이트 (FOP), 사이클로헥산다이온 (DIM), 페닐피라졸린 (DEN); 글루타민 신테타제의 저해제 (글루포시네이트/포스피노트리신), 증식/세포 분열 저해제, 예를 들어, 식물 세포 증식 파괴물질 (페녹시카르복시산, 예, 2,4-D), 합성 옥신 (벤조산 예, 디캄바), 옥신 수송 저해 (프탈라메이트); 및 광 프로세스 간섭, 예를 들어: 표백물질 (bleacher)/ HPPD 저해제 (피라졸 및 이속사졸); II 광시스템 저해제 (PS II 저해제) (트리아진, 트리아지논, 피리다존, C3: 이옥시닐 및 브로복시닐 및 수많은 기타 물질); 프로토포르피리노겐 옥시다제의 저해제 (PPO/PPX) (예, 다이페닐에테르 및 N-페닐프탈이미드) 등이 있다.

아울러, 본 발명에 따른 "화합물" 또는 "촉발제"는 식물 대사에 영향을 미치는, 식물에 의해 내인성으로 생산되거나 또는 외부적으로 적용되는, 식물 성장인자 또는 임의의 기타 물질일 수 있다.

본원에 기술된 방법에 대한 모든 구현예들에서, 화합물 또는 촉발제는 대상 형질, 본 발명의 모든 측면의 다양한 방법에 따라 타겟화된 방식으로 변형된, 하나 이상의 식물 세포, 조직, 기관, 물질 또는 완전한 식물에 의해 코딩된 표현형으로 선별가능한 형질을 선별할 수 있도록, 외부에서 적용될 수 있다. 표현형으로 선별가능한 형질의 변형 형태에서 특이적인 상호작용 쌍의 제공, 및 후속적인 선별 및 교배 단계 동안의 해당 화합물 또는 촉발제의 제공은, 따라서, 임의의 육종 시도를 향상시킬 수 있다.

본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 표현형으로 선별가능한 대상 형질은 하나 이상의 내인성 유전자이거나 또는 이에 의해 코딩되거나, 또는 하나 이상의 대상 표현형 형질은 하나 이상의 전이유전자이거나 또는 이에 의해 코딩되며, 하나 이상의 내인성 유전자 또는 하나 이상의 전이유전자는 하나 이상의 대상 표현형 형질에 하나 이상의 변형이 결핍된 세포를 저해, 손상 또는 사멸시키는, 식물독소, 바람직하게는 제초제에 대한 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형 형질을 코딩하거나, 또는 하나 이상의 표현형 형질은 세포 분열, 증식 속도, 배발생, 또는 비-변형된 세포, 조직, 기관 또는 식물과 비교해 변형된 세포, 조직, 기관 또는 식물에 이점을 제공하는 기타 표현형으로 선별가능한 특성의 부스터로 이루어진 군으로부터 선택된다.

본 발명의 다양한 측면들에 따른 추가적인 구현예에서, 하나 이상의 제1 식물 게놈 타겟 부위는 제초제 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 하나 이상의 내인성 유전자 또는 전이유전자이며, 제초제 내성/허용성은 글리포세이트 등의 EPSPS-저해제에 대한 내성/허용성, 글루포시네이트 등의 글루타민 합성 저해제에 대한 내성/허용성, 이미다졸린 또는 설포닐우레아 등의 ALS- 또는 AHAS-저해제에 대한 내성/허용성, 아릴옥시페녹시프로피오네이트 (FOP) 등의 ACCase 저해제에 대한 내성/허용성, 피토엔 데세투라제 (phytoene desaturase) 단계에서 카로티노이드 생합성의 저해제, 4-하이드록시페닐-피루베이트-다이옥시게나제 (HPPD)의 저해제 또는 기타 카로티노이드 생합성 타겟의 저해제 등의 카로티노이드 생합성 저해제에 대한 내성/허용성, 셀룰로스 저해제에 대한 내성/허용성, 지질 합성 저해제에 대한 내성/허용성, 장쇄 지방산 저해제에 대한 내성/허용성 지방산 저해제, 미소관 조립 저해제에 대한 내성/허용성, 광화학계 I 전자 전환체에 대한 내성/허용성, 카바메이트, 트리아진 및 트리아지논 등의 광화학계 II 저해제에 대한 내성/허용성, PPO-저해제에 대한 내성/허용성 및 디캄바 (2,4-D, 즉, 2,4-다이클로로페녹시아세트산) 등의 합성 옥신에 대한 내성/허용성으로 이루어진 군으로부터 선택된다.

본 발명의 다양한 측면들에 따른 추가적인 구현예에서, 하나 이상의 내인성 유전자 또는 하나 이상의 전이유전자는, 병원체 내성/허용성을 포함하는 생물학적 스트레스에 대한 내성/허용성; 저온 내성/허용성, 가뭄 스트레스 내성/허용성, 삼투성 내성/허용성, 열 스트레스 내성/허용성, 한랭 스트레스 내성/허용성, 산화 스트레스 내성/허용성, 중금속 스트레스 내성/허용성, 염 스트레스 또는 침수 (waterlogging) 내성/허용성, 도복 내성/허용성, 탈립 내성/허용성 등의 비생물학적 스트레스에 대한 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형 형질을 코딩하며, 병원체는 바이러스, 박테리아, 진균 또는 동물 병원체로부터 선택되거나, 또는 하나 이상의 대상 표현형 형질은 수율 증가, 개화기 변형, 종자 색 변형, 내포자 조성 변형, 영양 함량 변형 또는 대상 경로의 대사적 조작 등의, 추가적인 농업 대상 형질 변형으로 이루어진 군으로부터 선택된다.

본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 표현형으로 선별가능한 형질은 식물독성 내성/허용성 형질, 바람직하게는 제초제 내성/허용성 형질이며, 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형은 식물독성 화합물, 바람직하게는 제초제에 대해 내성/허용성을 부여하며, 이 화합물은 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물, 또는 그 자손에 부가될 외인성 화합물이다.

대상 식물 세포의 게놈에 의해 코딩된 임의의 추가적인 표현형으로 선별가능한 형질은, 표현형으로 선별가능한 대상 형질을 코딩하는 하나 이상의 유전자가 공지되어 있고 대응되는 상보적인 화합물 또는 촉발제가 타겟화된 변형을 스크리닝하기 위해 이용가능하거나 또는 스크리닝하도록 설계할 수 있다면, 본 발명의 다양한 측면들에 따른 하나 이상의 제1 타겟화된 변형의 타겟이 될 수 있다. 가시적인 표현형의 경우, 스크리닝 목적을 위해 화합물 또는 촉발제가 반드시 필요한 것은 아니며, 대신 가시적으로 스크리닝가능한 형질의 관찰에 기초한 적절한 판독 및 결정 전략이 준비되어 있어야 한다.

다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 제초제 또는 식물독성 화합물에 대해 내성 또는 허용성을 부여하는 유전자이며, 제1 식물 게놈 타겟 부위는 하나 이상의 대응되는 아미노산 변환을 발생시키는 하나 이상의 핵산 변환을 포함하며, 하나 이상의 핵산 변환은 하나 이상의 염기 편집기에 의해 이루어진다.

본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 ALS이다. 임의의 ALS 서열이 본 발명의 목적에 적합하다. 예시적인 ALS 서열은 서열번호 25로 표시된다.

본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 PPO이다. 임의의 PPO 서열이 본 발명의 목적에 적합하다. 예시적인 PPO 서열은 서열번호 26으로 표시된다.

본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 EPSPS이다. 임의의 EPSPS 서열이 본 발명의 목적에 적합하다. 예시적인 EPSPS 서열은 서열번호 27로 표시된다.

본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 EPSPS, ALS 또는 PPO, 또는 이의 임의의 대립유전자 또는 식물 변이체이며, EPSPS, ALS 또는 PPO는 하나 이상의 대응되는 아미노산 변환을 만드는 하나 이상의 핵산 변환을 포함하며, 하나 이상의 핵산 변환은 하나 이상의 염기 편집기에 의해 수행된다.

본 발명에 따른 표현형으로 선별가능한 형질을 코딩하는 이러한 타겟 하나는 5-에놀피루빌쉬키메이트-3-포스페이트 신타제 (EPSPS) 유전자이다. 효소의 글리포세이트 민감성을 낮추기 위한 여러가지 단일 및 이중 아미노산 치환들이 밝혀져 있다 (Sammons, R. D. and Gaines, T. A. (2014), Glyphosate resistance: state of knowledge. Pest. Manag. Sci., 70: 1367-1377.)

다른 타겟은, 다양한 단일 아미노산 돌연변이들이 트리아졸로피리미딘, 설포닐우레아, 피리미디닐티오벤조네이트, 이미다졸리논 및 설포닐아미노카르보닐트리아졸리논 클래스 유래의 하나 이상의 제초제에 대한 내성과 연관되어 있는, 아세토락테이트 신타제 (ALS) 유전자이다. 본 발명의 목적에 적합한 잔기 치환으로는 A122, P197, A205, D376, W574 및 S653 등이 있다.

또 다른 선별가능한 변형은 지 메이스 (Zea mays) 및 아라비돕시스 탈리아나 (Arabidopsis thaliana)의 프로토포르피리노겐 옥시다제 (PPO) 유전자에 존재할 것이다. 여기서, 215번 위치의 시스테인의, 페닐알라닌 (A215F), 루신 (A215L) 또는 라이신 (A215K)으로의 변형뿐 아니라 220번 알라닌의 발린 (A220V), 트레오닌 (A220T) 또는 루신 (A220L)으로의 변형, 그리고 221번 글리신의 세린 (A221S) 또는 루신 (A221L)으로의 변형은, 다이페닐에테르, N-페닐프탈이미드, 옥사다이아졸, 옥사졸리딘다이온, 페닐피라졸, 피리미디니다이온, 티아다이아졸, 트리아졸리논 및 기타 등의 PPO 제초제에 대한 내성과 연관되어 있다 (Li, Xianggan et al. "Development of Protoporphyrinogen Oxidase as an Efficient Selection Marker for Agrobacterium Tumefaciens-Mediated Transformation of Maize. "Plant Physiology 133.2 (2003): 736-747. PMC. Web. 15 Mar. 2017). 전술한 잔기 치환 외에도, N. tabacum 또는 이의 상동체에서 178번 글리신의 단일 아미노산 결손은 PPO 저해제 결합을 방해하여, 전술한 저해제들에 대해 내성을 제공하며 (Patzoldt, W. L. et al. (2006). "A codon deletion confers resistance to herbicides inhibiting protoporphyrinogen oxidase" PNAS 103(33):12329-12334), 본 발명의 다양한 측면에 따라 이용할 수 있다.

아울러, 본 발명에 제시된 기법은 정확한 아미노산 변형 및 결손뿐 아니라 선별가능한 표현형을 유발하는 유전자 서열을 변형 또는 방해하기 위한 정지 코돈의 도입도 가능하게 한다. 아미노산을 코딩하는 코돈 61개 중, 아미노산 5종은 하나 이상의 시토신/시티딘을 양쪽 가닥에서 티민/티미딘으로 변환함으로써 정지 코돈으로 변환될 수 있다.

이러한 변형을 만드는 툴은 CRISPR 뉴클레아제 자체이다. 단일 또는 다중 염기 쌍 결손을 제공하는 것으로 입증된 CRISPR 뉴클레아제로는 Cas9, Cpf1, CasX 및 CasY가 있다. 이들 뉴클레아제는 이 시점에 가장 편리한 옵션이지만, 향후 부위-특이적인 뉴클레아제 개발을 본원에 기술된 절차에 맞게 쉽게 적용시킬 수 있을 것이다.

본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 ALS이며, 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 A122를 코딩하는 서열에서 발생하거나, 또는 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 P197을 코딩하는 서열에서 발생하거나, 또는 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 A205를 코딩하는 서열에서 발생하거나, 또는 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 D376을 코딩하는 서열에서 발생하거나, 또는 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 R377을 코딩하는 서열에서 발생하거나, 또는 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 W574를 코딩하는 서열에서 발생하거나, 또는 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 S653을 코딩하는 서열에서 발생하거나, 또는 타겟화된 변형은 서열번호 25에 따른 ALS 참조 서열과 비교해 G654를 코딩하는 서열에서 발생하거나, 또는 전술한 변형들의 임의 조합을 포함한다.

본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 PPO이고, 타겟화된 변형은 서열번호 26에 따른 PPO 참조 서열과 비교해 C215, A220, G221, N425 또는 Y426을 코딩하는 서열에서 또는 이들 돌연변이들의 임의 조합으로 발생한다.

본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 선별 목적의 경우 아마란투스 투베르쿨라투스 (Amaranthus tuberculatus)의 PPX2L 유전자 산물이다. 본 발명의 다양한 측면들에 따른 일 구현예에서, 타겟화된 염기 변형, 타겟화된 코돈 결손 또는 타겟화된 프래임쉬프트 또는 결손 변형을 포함하는 제1 타겟화된 변형은, 서열번호 28에 따른 아마란투스 투베르쿨라투스 (Amaranthus tuberculatus)의 PPX2L 유전자 산물의 G210 잔기와 동일한 위치에서 이루어진다.

본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위는 EPSPS이고, 하나 이상의 타겟화된 변형은 서열번호 27에 따른 EPSPS 참조 서열과 비교해 G101, T102, P106, G144 또는 A192를 코딩하는 서열에서 발생하거나, 또는 전술한 돌연변이의 임의 조합이다. 바람직한 특정 구현예에서, 타겟화된 변형은 서열번호 27에 따른 EPSPS 참조 서열과 비교해 G101 및 G144를 코딩하는 서열에서 발생하거나, 또는 타겟화된 변형은 서열번호 27에 따른 EPSPS 참조 서열과 비교해 G101 및 A192를 코딩하는 서열에서 발생하거나, 또는 타겟화된 변형은 서열번호 27에 따른 EPSPS 참조 서열과 비교해 T102 및 P106을 코딩하는 서열에서 발생한다.

당해 기술 분야의 당업자는, 본원의 내용을 기반으로, 본 발명에 따른 하나 이상의 표현형으로 선별가능한 형질을 구축하기 위해 추가적으로 적합한 식물독성 내성/허용성 형질 및 대응되는 돌연변이를 규정할 수 있다.

본 발명의 다양한 측면들에 따른 특정 구현예에서, 하나 이상의 표현형으로 선별가능한 형질은 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 동정 또는 단리하는데 유용한 가시적인 표현형이다. "가시적인" 표현형은 눈을 통해 육안으로 또는 현미경을 통해 관찰하는 수단에 의해 검출하여, 분자 생물학적 수단에 의한 스크리닝이 필수적이지 않은, 임의의 표현형이다.

본 발명의 다양한 측면들에 따른 일 구현예에서, 하나 이상의 표현형으로 선별가능한 형질은 광택 표현형, 골든 표현형, 생장 우세 표현형 또는 색소 표현형이다. 몇가지 다른 가시적인 표현형들이 당해 기술 분야의 당업자들에게 잘 알려져 있다. 이러한 가시적인 표현형은 이의 유전자 백그라운드로 인해 대상 식물 또는 식물 세포에 상당히 의존적일 것이다.

본 발명에 따른 제2 측면에서, (a) 하나 이상의 제1 타겟화된 코돈 결손 변형을, 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에, 뉴클레아제, 재조합효소 또는 DNA 변형 물질을 포함하는 하나 이상의 제1 부위-특이적인 작동자를 이용해 도입하는 단계로서, 하나 이상의 타겟화된 코돈 결손 변형이 하나 이상의 표현형으로 선별가능한 형질의 발현을 유발하는, 단계; (b) 하나 이상의 제2 타겟화된 변형을 변형할 하나 이상의 식물 세포의 제2 식물 게놈 타겟 부위에 도입하는 단계로서, 하나 이상의 제2 타겟화된 변형이 하나 이상의 제2 부위-특이적인 작동자를 이용해 도입되어 제2 식물 게놈 타겟 부위에 하나 이상의 제2 타겟화된 변형이 달성되고, 하나 이상의 제1 타겟화된 염기 변형의 도입과 동시에 또는 후속적으로 하나 이상의 제2 타겟화된 변형이 변형할 동일한 하나 이상의 식물 세포 또는 하나 이상의 제1 타겟화된 변형을 포함하는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물에 도입되어 하나 이상의 변형된 식물 세포가 수득되는, 단계; 및 (c) (i) 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 코돈 결손 변형에 의해 유발된 하나 이상의 표현형으로 선별가능한 형질을 선별하고, 선택적으로, 추가적으로 (ii) 제2 식물 게놈 타겟 부위에서 하나 이상의 제2 타겟화된 변형을 추가로 선별함으로써, 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 단리하거나, 또는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물을 단리하는 단계; 선택적으로 (d) 하나 이상의 제1 타겟화된 변형 및 하나 이상의 제2 타겟화된 변형을 포함하는 하나 이상의 변형된 식물 또는 식물 물질을 추가의 대상 식물 또는 식물 물질과 교배하여, 수득되는 자손 식물 또는 식물 물질을 분리함으로써, 대상 유전자형, 선택적으로 하나 이상의 제1 타겟화된 변형을 포함하지 않는 대상 유전자형을 달성하는 단계를 포함하는, 전이유전자성 선별 마커 서열의 안정적인 통합없이, 하나 이상의 변형된 식물 세포, 또는 하나 이상의 변형된 식물 세포를 포함하는 하나 이상의 변형된 식물 조직, 기관 또는 완전한 식물을 단리하는 방법을 제공한다.

본 발명의 다른 측면에서, (a) 하나 이상의 제1 타겟화된 프래임쉬프트 또는 결손 변형을, 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에 하나 이상의 제1 부위-특이적인 작동자를 사용해 도입하는 단계로서, 하나 이상의 타겟화된 프래임쉬프트 또는 결손 변형이 하나 이상의 표현형으로 선별가능한 형질의 발현을 유발하는, 단계; (b) 하나 이상의 제2 타겟화된 변형을 변형할 하나 이상의 식물 세포의 제2 식물 게놈 타겟 부위에 도입하는 단계로서, 하나 이상의 제2 타겟화된 변형이 뉴클레아제, 재조합효소 또는 DNA 변형 시약을 포함하는 하나 이상의 제2 부위-특이적인 작동자를 이용해 도입되어, 제2 식물 게놈 타겟 부위에 하나 이상의 제2 타겟화된 변형이 구축되고, 하나 이상의 제1 타겟화된 염기 변형의 도입과 동시에 또는 후속적으로 하나 이상의 제2 타겟화된 변형이 변형할 동일한 하나 이상의 식물 세포, 또는 하나 이상의 제1 타겟화된 변형을 포함하는 하나 이상의 자손 세포, 조직, 기관 또는 완전한 식물에 도입되어 하나 이상의 변형된 식물 세포가 수득되는, 단계; 및 (c) (i) 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 프래임쉬프트 또는 결손 변형에 의해 유발된 하나 이상의 표현형으로 선별가능한 형질을 선별하고, 선택적으로, 추가적으로 (ii) 제2 식물 게놈 타겟 부위에서 하나 이상의 제2 타겟화된 변형을 추가로 선별함으로써, 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 단리하거나, 또는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물을 단리하는 단계; 선택적으로, (d) 하나 이상의 제1 타겟화된 변형 및 하나 이상의 제2 타겟화된 변형을 포함하는 하나 이상의 변형된 식물 또는 식물 물질을 추가의 대상 식물 또는 식물 물질과 교배하여, 수득되는 자손 식물 또는 식물 물질을 분리함으로써, 대상 유전자형, 선택적으로 하나 이상의 제1 타겟화된 변형을 포함하지 않는 대상 유전자형을 달성하는 단계를 포함하는, 전이유전자성 선별 마커 서열의 안정적인 통합없이, 하나 이상의 변형된 식물 세포, 또는 하나 이상의 변형된 식물 세포를 포함하는 하나 이상의 변형된 식물 조직, 기관 또는 완전한 식물을 단리하는 방법을 제공한다.

전술한 바와 같이, 본 발명에 따른 방법은, 2가지 서로 다른 분자 복합체, 즉 전이유전자성 마커의 삽입없이, 선별가능한 표현형을 구축하는 하나 이상의 제1 타겟화된 변형을 도입하도록 구성된 복합체 하나와, 하나 이상의 제2 타겟화된 변형을 도입하도록 구성된 다른 복합체를 조합하는 새로운 방법을 제공하며, 이때 제1 변형은 스크리닝 목적으로 이용되고, 제2 변형은 도입할 게놈 편집이다. 따라서, 본 발명의 방법은 서로 다른 게놈 타겟 부위에서 게놈 편집 전략을 상승적으로 조합하여, 서로 다른 타겟화된 변형을 달성하며, 따라서 궁극적으로 대상 유전자형을 가진 식물을 확립하기 위한 효율적인 육종 공정을 확립한다.

특정 구현예에서, 본 발명의 방법에서 단계 (b)는 복구 주형(RT)을 도입하여, 하나 이상의 제1 및/또는 제2 식물 게놈 타겟 부위에서 타겟화된 서열 변환 또는 치환을 만드는 단계를 더 포함한다. 뉴클레아제 또는 닉카제로 인해 발생하는 절단이 복구 기전으로서 에러가 발생하기 쉬운 내인성 NHEJ 경로에 의존하기 보다는 상동적인 복구를 보조하도록 대상 RT를 제공함으로써 미리 정해진 방식으로 복구할 수 있으므로, 이 RT는, 별도로 또는 본 발명에 따른 하나 이상의 복합체의 일부로서 제공되는 적합한 RT이 제공되는 한, 게놈 편집 방식에 또 다른 수준의 정확도가 부가된다. 일 구현예에서, CRISPR-기반의 뉴클레아제는 gRNA와 상호작용하는 부위-특이적인 작동자로 사용되고, 이때 gRNA는 RT에 공유 결합될 수 있거나, 또는 CRISPR-기반의 뉴클레아제 및/또는 gRNA는 RT와 비-공유적으로 상호작용할 수 있다. 다른 구현예에서, RT는, 대상 RT를 코딩하는 구조체에 부가되는 등의, 별도로 제공되며, RT는 하나 이상의 대상 게놈 타겟 부위에 어닐링하는 RT 내 상동성 팔에 의해 매개되는 상보적인 염기 쌍 형성을 이용해 부위-특이적인 작동자 복합체와 조합할 것이다.

일 구현예에서, 융합 단백질 또는 비-공유적으로 조합된 활성 Cpf1 및 상호작용 도메인으로서 비활성형 dCas9는 부위-특이적인 작동자로서 제공될 수 있다. Cas9에 대한 gRNA는 복구 주형 또는 이의 연장부를 타겟팅하여, Cpf1-dCas9-RT 복합체를 형성할 수 있다. crRNA (Cpf1)는 HDR를 개시하기 위해 이중 가닥 절단이 결정된 게놈 유전자 좌를 타겟팅한다. 마찬가지로, 고 활성의 징크 핑거 단백질, megaTAL 또는 비활성 메가뉴클레아제도 사용될 수 있다.

본 발명의 다양한 측면들에 따른 일 구현예에서, 본원의 임의 한가지 방법에 의해 수득가능한 식물 세포, 조직, 기관, 물질 또는 완전한 식물, 또는 그 자손를 제공한다.

본원에 제공된 방법이 농업적으로 유익한 형질을 가진 새로운 식물을 제공하는 것을 돕도록 특이적으로 설계되어 있어 전이유전자성 마커 서열은 포함하지 않으므로, 본원의 방법은 빠르고 믿을 수 있는 방식으로 여러가지 다양한 식물 유전자형을 구축하는데 적합하다.

본 발명의 다양한 측면들에 따른 일 구현예에서, 변형할 하나 이상의 식물 세포는 바람직하게는 호르데움 불가리 (Hordeum vulgare), 호르데움 불부숨 (Hordeum bulbusom), 소르굼 비콜러 (Sorghum bicolor), 사카룸 오피시나리움 (Saccharum officinarium), 지 메이스 (Zea mays) 등의 지 spp. (Zea spp .), 세타리아 이탈리카 (Setaria italica), 오리자 미누타 (Oryza minuta), 오리자 사티바 (Oriza sativa), 오리자 아우스트랄리엔시스 (Oryza australiensis), 오리자 알타 (Oryza alta), 트리티쿰 에이스티붐 (Triticum aestivum), 트리티쿰 두럼 (Triticum durum), 세칼레 세레알레 (Secale cereale), 트리티칼레 (Triticale), 말루스 도메스티카 (Malus domestica), 브라키포듐 디스타키온 (Brachypodium distachyon), 호르데움 마리눔 (Hordeum marinum), 에이길롭스 타우치이 (Aegilops tauschii), 다우쿠스 글로키디아투스 (Daucus glochidiatus), 베타 불가리스 (Beta vulgaris) 등의 베타 spp., 다우쿠스 푸실루스 (Daucus pusillus), 다우쿠스 무리카투스 (Daucus muricatus), 다우쿠스 카로타 (Daucus carota), 유칼립투스 그란디스 (Eucalyptus grandis), 니코티아나 실베스트리스 (Nicotiana sylvestris), 니코티아나 토멘토시포르미스 (Nicotiana tomentosiformis), 니코티아나 타바쿰 (Nicotiana tabacum), 니코티아나 벤타미아나 (Nicotiana benthamiana), 솔라눔 라이코퍼시쿰 (Solanum lycopersicum), 솔라눔 투베로숨 (Solanum tuberosum), 코페아 카네포라 (Coffea canephora), 비티스 비니페라 (Vitis vinifera), 에리트란테 구타타 (Erythrante guttata), 겐리시아 아우레아 (Genlisea aurea), 쿠쿠미스 사티부스 (Cucumis sativus), 마루스 노타빌리스 (Marus notabilis), 아라비돕시스 아레노사 (Arabidopsis arenosa), 아라비돕시스 라이라타 (Arabidopsis lyrata), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 크루시히말라야 히말라이카 (Crucihimalaya himalaica), 크루시히말라야 발리치이 (Crucihimalaya wallichii), 카르다민 넥수오사 (Cardamine nexuosa), 레피디움 비르기니쿰 (Lepidium virginicum), 캡셀라 부르사 파스토리스 (Capsella bursa pastoris), 올마라비돕시스 푸밀라 (Olmarabidopsis pumila), 아라비스 히르수테 (Arabis hirsute), 브라씨카 나푸스 (Brassica napus), 브라씨카 올레라시아 (Brassica oleracea), 브라씨카 라파 (Brassica rapa), 라파누스 사티부스 (Raphanus sativus), 브라씨카 준카시아 (Brassica juncacea), 브라씨카 니그라 (Brassica nigra), 에루카 베시카리아 아종 사티바 (Eruca vesicaria subsp . sativa), 시트러스 시넨시스 (Citrus sinensis), 자트로파 쿠르카스 (Jatropha curcas), 포풀루스 트리코카르파 (Populus trichocarpa), 메디카고 트룬카툴라 (Medicago truncatula), 시져 야마시타 (Cicer yamashitae), 시져 비주굼 (Cicer bijugum), 시져 아리에티눔 (Cicer arietinum), 시져 레티쿨라툼 (Cicer reticulatum), 시져 주다이쿰 (Cicer judaicum), 카야누스 카자니폴리우스 (Cajanus cajanifolius), 카야누스 스카라바에오이데스 (Cajanus scarabaeoides), 파세올루스 불가리스 (Phaseolus vulgaris), 글리신 맥스 (Glycine max), 고씨퓸 (Gossypium sp .), 아스트라갈루스 시니쿠스 (Astragalus sinicus), 로투스 자포니카스 (Lotus japonicas), 토레니아 포우르니에리 (Torenia fournieri), 알리움 세파 (Allium cepa), 알리움 피스툴로숨 (Allium fistulosum), 알리움 사티붐 (Allium sativum), 헬리안투스 안누스 (Helianthus annuus), 헬리안투스 투베로수스 (Helianthus tuberosus) 및 알리움 투베로숨 (Allium tuberosum), 또는 전술한 식물들 중 하나에 속하는 임의 품종 또는 아종으로 이루어진 군으로부터 선택되는 식물로부터 유래된다.

유전자 변형된 전이유전자가 없는 식물의 제조 방법:

다른 측면에서, 본 발명은 하기 단계들을 포함하는 게놈 편집에 의해 유전자 변형된 식물을 구축하는 방법을 제공한다:

a) 유전자 변형할 식물의 세포 또는 조직을 제공하는 단계;

b) 제1 게놈 편집 시스템 및 제2 게놈 편집 시스템을 제공하는 단계로서, 제1 게놈 편집 시스템이 식물 선별가능한 마커 유전자를 타겟하여 변형시킬 수 있고, 제2 게놈 편집 시스템이 식물에서 대상 유전자를 타겟하여 변형시킬 수 있는, 단계;

c) 세포 또는 조직을 제1 및 제2 게놈 편집 시스템으로 공동-형질전환하는 단계;

d) 형질전환된 세포 또는 조직으로부터, 바람직하게는 선택압없이 식물을 재생하는 단계 ;

e) 단계 d)에서 재생한 식물에서 선별가능한 마커 유전자가 변형된 식물을 선별하는 단계; 및

f) 단계 e)에서 선별된 식물로부터 타겟 유전자가 변형된 식물을 동정하는 단계.

본 발명의 식물 또는 조직은 원형질체, 캘러스, 외식편, 미성숙 배 등의 온전한 식물로 재생될 수 있는 모든 세포 또는 조직을 포함한다.

본원에서, "유전자 변형 (genetical modification)"은 유전자의 서열 변형 및/또는 유전자의 발현 변형을 포함한다.

본원에서, 용어 "대상 유전자"는 구조 유전자 및 비-구조 유전자 등의 식물에서 변형시킬 임의의 뉴클레오티드 서열을 의미한다. 바람직하게는, 대상 식물은 식물의 형질, 바람직하게는 농업 형질과 연관되어 있다.

본원에서, "선별가능한 마커 유전자"는, 적절하게 변형된 후, 선별할 선별가능한 형질을 식물에 부여하는 식물의 내인성 유전자를 의미한다. 바람직하게는, 적절하게 변형되었을 때, 선별가능한 마커 유전자는 식물의 다른 형질은 실질적으로 변형시키지 않는다.

예를 들어, 선별가능한 마커 유전자는, 적절하게 변형되었을 때 식물에 제초제 내성을 부여하는 식물 내인성 제초제 내성 유전자일 수 있다. 식물 내인성 제초제 내성 유전자로는 비-제한적으로 PsbA, ALS, EPSPS, ACCase, PPO, HPPD, PDS, GS, DOXPS 및 P450 등이 있다. 제초제 내성을 부여할 수 있는 ALS 돌연변이 부위로는, 비-제한적으로, A122, P197, A205 및 S653 (아미노산의 번호는 아라비돕시스 탈리아나 ALS의 아미노산 서열을 참조함)을 포함한다. 제초제 내성을 부여할 수 있는 EPSPS 돌연변이 부위로는, 비-제한적으로, T102, P106 (아미노산의 번호는 아라비돕시스 탈리아나 EPSPS의 아미노산 서열을 참조함)을 포함한다. 제초제 내성을 부여할 수 있는 ACCase 돌연변이 부위로는, 비-제한적으로, I1781, W2027, I2041, D2078 및 G2096 (아미노산의 번호는 알로페쿠러스 미오수로이데스 (Alopecurus myosuroides) 엽록체 ACCase의 아미노산 서열을 참조함)를 포함한다. 제초제 내성을 부여할 수 있는 HPPD 돌연변이 부위로는, 비-제한적으로, P277, L365, G417 및 G419 (아미노산의 번호는 벼 HPPD 효소의 아미노산 서열을 참조함)를 포함한다.

본 발명의 일부 구현예에서, 밀에 제초제 내성을 부여할 수 있는 ALS 돌연변이 부위는 TaALS P173을 포함한다. 일부 구현예에서, 옥수수에 제초제 내성을 부여할 수 있는 ALS 돌연변이 부위는 ZmALS P165를 포함한다. 일부 구현예에서, 벼에 제초제 내성을 부여할 수 있는 ALS 돌연변이 부위는 OsALS P171을 포함한다.

다른 예로, 선별가능한 마커 유전자는, 적절하게 변형되었을 때, 식물이 비-제한적인 예로, LIG, PDS, zb7 및 GL2 등의 엽설 (ligule), 잎의 색, 잎 광택을 조절하는 유전자와 같은, 가시적으로-관찰가능한 형질 변화를 발생시키도록 유도할 수 있는, 유전자일 수 있다.

전통적인 식물 변형 방법 (형질전환 방법)에는 효율을 높이기 위해 식물 재생시 특정한 선택압이 적용되어야 한다 (예, 사용한 형질전환 벡터에 따라 여러가지 항생제를 사용하여 스크리닝함). 그러나, 이는 외래 유전자, 특히 항생제 내성 유전자가 식물 게놈에 삽입되어, 잠재적인 안전성 문제가 될 수 있다.

식물 변형에 게놈 편집 기술을 이용함으로써, 게놈 편집 시스템은 식물 게놈내 삽입되지 않고도 타겟 유전자의 변형을 달성할 수 있다. 따라서, 본 발명의 방법에서, 단계 d)의 재생은 바람직하게는 선택압없이 수행된다. 이는 외래 유전자의 삽입을 방지하며, 유전자 변형된 (게놈 편집된) 형질전환 식물이 구축된다. 그러나, 선택압없이 식물을 재생하면 스크리닝 효율은 크게 떨어질 것이다.

이 문제는 대상 유전자를 타겟팅하는 게놈 편집 시스템과 내인성 선별가능한 마커 유전자를 타겟팅하는 게놈 편집 시스템을 공동-형질전환함으로써, 본 발명에서 해소된다.

임의 이론으로 결부시키고자 하는 것은 아니지만, 본 발명의 방법에서, 대상 유전자를 타겟팅하는 게놈 편집 시스템 및 내인성 선별가능한 마커 유전자를 타겟팅하는 게놈 편집 시스템은 식물 (예, 식물 세포 또는 조직) 내에 공동-형질전환되면, 대상 유전자와 내인성 선별가능한 마커 유전자의 편집이 동시에 발생할 경향을 보일 것이다. 따라서, 내인성 선별가능한 마커 유전자에 기반하여 선택된 식물은, 대상 유전자 역시 변형될 가능성이 높을 것이다. 내인성 선별가능한 마커 유전자 편집에 대한 1차 스크리닝은 대상 유전자 편집에 대한 스크리닝 효율을 크게 향상시킬 것이다. 내인성 선별가능한 마커 유전자만 사용되기 때문에, 전이유전자 문제는 피할 수 있다. 본 발명에서, 내인성 선별가능한 마커 유전자는 바람직하게는 변형 후 대상 형질에는 영향을 미치지 않으며, 예를 들어, 수율을 감소시키지 않는다. 더 바람직하게는, 내인성 선별가능한 마커 유전자의 변형은 식물에 부가적인 대상 형질, 예를 들어 제초제 내성을 부여한다. 즉, 본 발명에서 식물 선별에 이용가능한 형질은 또한 제초제 내성과 같은 농업적으로 유용한 형질인 것이 바람직하다.

단계 e)에서 선별을 수행하는 방법은 선별가능한 마커 유전자의 특성에 따라 결정된다. 예를 들어, 선별가능한 마커 유전자가 변형되어 식물에 제초제 내성이 부여된다면, 재생된 식물은 야생형 선별가능한 마커 유전자를 가진 식물은 생존할 수 없거나 생장이 불량한 적절한 농도 하에 둘 수 있다. 그런 후, 이러한 제초제 농도에서 충분히 생존 또는 생장하는 식물을 선별한다.

단계 f)에서 동정은 예를 들어 PCR/RE, 서열분석에 의해 수행할 수 있다. 당해 기술 분야의 당업자라면 유전자의 돌연변이 유무를 동정하는 방법을 충분히 알 것이다.

본 발명의 식물 (세포 또는 조직)을 형질전환하는 적합한 방법으로는, 비-제한적으로, 입자 총법, PEG-매개 원형질체 형질전환 및 아그로박테리움-매개 형질전환 등이 있다.

본 발명은, 식물 게놈의 정확한 편집을 수행할 수 있는 한, 특정 게놈 편집 시스템으로 특별히 제한되는 것은 아니다. 예를 들어, 본 발명와 함께 사용하기 적합한 게놈 편집 시스템으로는, 비-제한적으로, PBE (precise base editor) 시스템, CRISPR-Cas9 시스템, CRISPR-Cpfl 시스템, CRISPRi 시스템, 징크 핑거 뉴클레아제 시스템 및 TALEN 시스템 등이 있다. 대상 유전자 및 내인성 선별가능한 마커 유전자를 타겟팅하는 적절한 게놈 편집 시스템의 선정 또는 설계는 당해 기술 분야의 당업자의 능력에 속한다.

CRISPR 시스템은 외부 유전자 침입으로부터 보호하기 위해 진화 중에 박테리아에서 발생하였다. 이는 변형되어 진핵생물의 게놈 편집에 널리 사용되고 있다.

CRISPR-Cas9 시스템은 Cas9 뉴클레아제-기반의 게놈 CRISPR 편집 시스템을 의미한다. "Cas9 뉴클레아제" 및 "Cas9"은 본원에서 상호 호환적으로 사용되며, Cas 단백질 또는 이의 단편 (예, Cas9의 활성형의 DNA 절단 도메인 및/또는 Cas9의 gRNA 결합 도메인을 포함하는 단백질)을 포함하는, RNA 안내된 뉴클레아제를 지칭한다. Cas9은 가이드 RNA의 안내 하에 DNA 타겟 서열을 타겟팅 및 절단하여 DNA 이중 가닥 절단 (DSB)을 형성할 수 있는, 원핵생물 면역 시스템 CRISPR/Cas의 구성 성분이다. 본 발명에 사용하기 적합한 CRISPR-Cas9 시스템은 비-제한적으로 Shan, Q. et al. Targeted genome modification of crop plants using a CRISPR-Cas system. Nat. Biotechnol. 31, 686-688 (2013)에 기술된 것을 포함한다.

"가이드 RNA" 및 "gRNA"는 본원에서 상호 호환적으로 사용될 수 있으며, 전형적으로 일부 상보적인 부분을 통해 복합체를 형성하는 crRNA와 tracrRNA 분자로 구성되며, crRNA는 혼성화하기 위해 타겟 서열에 충분히 상보적이며 CRISPR 복합체 (Cas9+crRNA+tracrRNA)가 타겟 서열에 특이적으로 결합하게 지시하는, 서열을 포함한다. 그러나, 당해 기술 분야에서는, crRNA 및 tracrRNA 특징 둘다를 포함하는 싱글 가이드 RNA (sgRNA)가 설계될 수 있는 것으로 공지되어 있다.

본 발명의 CRISPR-Cas9 시스템은 하기 중 하나를 포함할 수 있다:

i) Cas9 단백질, 및 가이드 RNA;

ii) Cas9 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체, 및 가이드 RNA;

iii) Cas9 단백질, 및 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체;

iv) Cas9 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체, 및 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체; 또는

v) Cas9 단백질을 코딩하는 뉴클레오티드 서열과 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체.

CRISPR-Cpf1 시스템은 Cpf1 뉴클레아제를 기반으로 하는 CRISPR 게놈 편집 시스템이다. Cpf1와 Cas9의 차이는, Cpf1 단백질의 분자량이 작고, crRNA만 가이드 RNA로서 필요하며, PAM 서열 역시 다르다는 것이다. 본 발명에 사용하기 적합한 CRISPR-Cpf1 시스템으로는 Tang et al., 2017에 언급된 시스템 등이 있으나, 이로 한정되는 것은 아니다.

본 발명의 CRISPR-Cpfl 시스템은 하기 중 하나를 포함할 수 있다:

i) Cpf1 단백질, 및 가이드 RNA (crRNA);

ii) Cpf1 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체, 및 가이드 RNA;

iii) Cpf1 단백질, 및 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체;

iv) Cpf1 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체, 및 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체; 또는

v) Cpf1 단백질을 코딩하는 뉴클레오티드 서열과 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체.

CRISPR interference (CRISPRi)는 뉴클레아제-불활성화된 Cas9 단백질을 이용하는 CRISPR-Cas9 시스템으로부터 파생된 유전자 침묵화 시스템이다. 이 시스템은 타겟 유전자의 서열을 바꾸진 않지만, 이는 본원에서 게놈 편집 시스템으로 정의된다. 본 발명에 함께 사용하기 적합한 CRISPRi 시스템으로는 Seth and Harish, 2016에 언급된 시스템 등이 있으나, 이로 한정되는 것은 아니다.

본 발명의 CRISPRi 시스템은 하기 중 하나 이상을 포함할 수 있다:

i) 뉴클레아제-불활성화된 Cas9 단백질, 및 가이드 RNA;

ii) 뉴클레아제-불활성화된 Cas9 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체, 및 가이드 RNA;

iii) 뉴클레아제-불활성화된 Cas9 단백질, 및 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체;

iv) 뉴클레아제-불활성화된 Cas9 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체, 및 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체; 또는

v) 뉴클레아제-불활성화된 Cas9 단백질을 코딩하는 뉴클레오티드 서열과 가이드 RNA을 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체.

정확한 염기 편집기 시스템 (precise base editor system)은 최근 CRISPR-Cas9에 기반하여 개발되었으며, Cas9 단백질과 시티딘 데아미나제로 된 뉴클레아제-불활성화된 융합 단백질을 이용해 게놈의 정확한 단일-염기 편집을 수행할 수 있는 시스템이다. 뉴클레아제-불활성화된 Cas9 (DNA 절단 도메인의 HNH 서브도메인 및/또는 RuvC 서브도메인 내 돌연변이가 원인임)는 gRNA-특이적인 DNA-결합력을 유지하고 있으며, 시티딘 데아미나제는 DNA의 시티딘(C) 탈아민화를 촉매하여 우라실 (U)을 만들 수 있다. 뉴클레아제-불활성화된 Cas9은 시티딘 데아미나제와 융합된다. 가이드 RNA의 안내 하에, 이 융합 단백질을 식물 게놈 내 타겟 서열을 타겟팅할 수 있다. 이 Cas9은 뉴클레아제 활성이 없어, DNA 이중 가닥은 절단되지 않는다. 융합 단백질에서 데아미나제 도메인은 Cas9-gRNA-DNA 복합체의 형성시 만들어진 단일 가닥 DNA의 시티딘을 U로 변환하며, C에서 T로의 치환은 염기 미스매치 복구에 의해 달성된다. 본 발명에서 사용하기 적합한 정확한 염기 편집기 시스템으로는 Zong et al., 2017에 기술된 시스템 등이 있으나, 이로 제한되는 것은 아니다.

본 발명의 정확한 염기 편집기 시스템은 하기 중 하나를 포함할 수 있다:

i) 뉴클레아제-불활성화된 Cas9와 시티딘 데아미나제로 된 융합 단백질, 및 가이드 RNA;

ii) 뉴클레아제-불활성화된 Cas9 단백질과 시티딘 데아미나제로 된 융합 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체, 및 가이드 RNA;

iii) 뉴클레아제-불활성화된 Cas9 단백질과 시티딘 데아미나제로 된 융합 단백질, 및 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체;

iv) 뉴클레아제-불활성화된 Cas9 단백질과 시티딘 데아미나제로 된 융합 단백질을 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체, 및 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체; 또는

v) 뉴클레아제-불활성화된 Cas9 단백질과 시티딘 데아미나제로 된 융합 단백질을 코딩하는 뉴클레오티드 서열과 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 발현 구조체.

일부 구현예에서, 뉴클레아제-불활성화된 Cas9 단백질은 야생형 Cas9 (S. pyogenes SpCas9)와 비교해 아미노산 치환 D10A 및/또는 H840A를 포함한다. 시티딘 데아미나제의 예로는, 비-제한적으로, APOBEC1 데아미나제, 활성화-유도된 시티딘 데아미나제 (AID), APOBEC3G 또는 CDA1(PmCDA1) 등이 있다.

"징크 핑거 뉴클레아제 (ZFN)"는 징크 핑거 DNA 결합 도메인을 DNA 절단 도메인과 융합시켜 제조된 인공적인 제한 효소이다. 하나의 ZFN의 징크 핑거 DNA 결합 도메인은 전형적으로 징크 핑거 리피트를 3-6개 포함하며, 각각의 징크 핑거 리피트는 예를 들어 3 bp를 인지한다. 본 발명에 사용하기 적합한 ZFN 시스템은 예를 들어 Shukla et al., 2009 및 Townsend et al., 2009로부터 입수할 수 있다.

"TALEN (Transactivator-like effector nuclease)"은 일반적으로 TALE (transcriptional activator-like effector)의 DNA 결합 도메인과 DNA 절단 도메인의 융합에 의해 제조된, 특정 DNA 서열을 절단하도록 조작될 수 있는, 제한 효소이다. TALE는 거의 임의의 적절한 DNA 서열에 결합하도록 조작될 수 있다. 본 발명에 사용하기 적합한 TALEN 시스템은 예를 들어 Li et al., 2012로부터 입수할 수 있다.

당해 기술 분야의 당업자라면, 서로 다른 게놈 편집 시스템의 각각의 특징과 구현하기 원하는 구체적인 타입의 게놈 편집에 따라 본 발명의 방법에서 제1 게놈 편집 시스템 및 제2 게놈 편집 시스템의 조합을 적절하게 결정할 수 있으며, 예를 들어, 서로 간의 간섭, 예를 들어 동일한 gRNA를 공유할 수 있는 서로 다른 시스템 간의 간섭을 피하는데 적합한 조합을 선택할 수 있다.

예를 들어, 내인성 선별가능한 마커 유전자가 선별가능한 형질을 구축하기 위한 정확한 돌연변이용으로 단일 염기 편집 시스템이 필요하다면, CRISPR-Cas9 시스템은 통상적으로 2가지 시스템이 동일한 gRNA를 공유할 수 있기 때문에, CRISPR-Cas9 시스템은 대상 유전자의 타겟팅에는 사용되지 않으며, 따라서, 대상 유전자의 넉아웃을 위한 Cas9은 내인성 선별가능한 마커 유전자를 넉아웃시킬 수 있으며, 그 역도 가능하다.

본 발명의 방법에 대한 일부 바람직한 구현예에서, 제1 및 제2 게놈 편집 시스템은 정확한 염기 편집기 시스템이다.

본 발명의 일부 구현예에서, 제1 및 제2 게놈 편집 시스템의 구성성분들은 동일한 발현 구조체 또는 서로 다른 발현 구조체에 의해 발현될 수 있으며, 이는 당해 기술 분야의 당업자에 의해 편리하게 선택될 수 있다. 예를 들어, 대상 유전자 및 선별가능한 마커 유전자에 대한 가이드 RNA들은 동일한 발현 구조체를 이용해 전사될 수 있다. 바람직하게는, 제1 및 제2 게놈 편집 시스템의 구성성분들은 동일한 발현 구조에 의해 발현된다.

본 발명의 방법에 대한 일부 구현예에서, 제1 및 제2 게놈 편집 시스템은 둘다 정확한 염기 편집기 시스템이고, 뉴클레아제-불활성화된 Cas9 단백질과 시티딘 데아미나제로 된 융합 단백질 및 대상 유전자 및 선별가능한 마커 유전자에 대한 가이드 RNA들은 동일 발현 구조체에 의해 발현된다.

본 발명의 방법에 대한 일부 구현예에서, 식물은 외떡잎 또는 쌍떡잎이다. 예를 들어, 식물은 호르데움 불가리 (Hordeum vulgare), 호르데움 불부숨 (Hordeum bulbusom), 소르굼 비콜러 (Sorghum bicolor), 사카룸 오피시나리움 (Saccharum officinarium), 지 메이스 (Zea mays) 등의 지 spp. (Zea spp .), 세타리아 이탈리카 (Setaria italica), 오리자 미누타 (Oryza minuta), 오리자 사티바 (Oriza sativa), 오리자 아우스트랄리엔시스 (Oryza australiensis), 오리자 알타 (Oryza alta), 트리티쿰 에이스티붐 (Triticum aestivum), 트리티쿰 두럼 (Triticum durum), 세칼레 세레알레 (Secale cereale), 트리티칼레 (Triticale), 말루스 도메스티카 (Malus domestica), 브라키포듐 디스타키온 (Brachypodium distachyon), 호르데움 마리눔 (Hordeum marinum), 에이길롭스 타우치이 (Aegilops tauschii), 다우쿠스 글로키디아투스 (Daucus glochidiatus), 베타 불가리스 (Beta vulgaris) 등의 베타 spp., 다우쿠스 푸실루스 (Daucus pusillus), 다우쿠스 무리카투스 (Daucus muricatus), 다우쿠스 카로타 (Daucus carota), 유칼립투스 그란디스 (Eucalyptus grandis), 니코티아나 실베스트리스 (Nicotiana sylvestris), 니코티아나 토멘토시포르미스 (Nicotiana tomentosiformis), 니코티아나 타바쿰 (Nicotiana tabacum), 니코티아나 벤타미아나 (Nicotiana benthamiana), 솔라눔 라이코퍼시쿰 (Solanum lycopersicum), 솔라눔 투베로숨 (Solanum tuberosum), 코페아 카네포라 (Coffea canephora), 비티스 비니페라 (Vitis vinifera), 에리트란테 구타타 (Erythrante guttata), 겐리시아 아우레아 (Genlisea aurea), 쿠쿠미스 사티부스 (Cucumis sativus), 마루스 노타빌리스 (Marus notabilis), 아라비돕시스 아레노사 (Arabidopsis arenosa), 아라비돕시스 라이라타 (Arabidopsis lyrata), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 크루시히말라야 히말라이카 (Crucihimalaya himalaica), 크루시히말라야 발리치이 (Crucihimalaya wallichii), 카르다민 넥수오사 (Cardamine nexuosa), 레피디움 비르기니쿰 (Lepidium virginicum), 캡셀라 부르사 파스토리스 (Capsella bursa pastoris), 올마라비돕시스 푸밀라 (Olmarabidopsis pumila), 아라비스 히르수테 (Arabis hirsute), 브라씨카 나푸스 (Brassica napus), 브라씨카 올레라시아 (Brassica oleracea), 브라씨카 라파 (Brassica rapa), 라파누스 사티부스 (Raphanus sativus), 브라씨카 준카시아 (Brassica juncacea), 브라씨카 니그라 (Brassica nigra), 에루카 베시카리아 아종 사티바 (Eruca vesicaria subsp . sativa), 시트러스 시넨시스 (Citrus sinensis), 자트로파 쿠르카스 (Jatropha curcas), 포풀루스 트리코카르파 (Populus trichocarpa), 메디카고 트룬카툴라 (Medicago truncatula), 시져 야마시타 (Cicer yamashitae), 시져 비주굼 (Cicer bijugum), 시져 아리에티눔 (Cicer arietinum), 시져 레티쿨라툼 (Cicer reticulatum), 시져 주다이쿰 (Cicer judaicum), 카야누스 카자니폴리우스 (Cajanus cajanifolius), 카야누스 스카라바에오이데스 (Cajanus scarabaeoides), 파세올루스 불가리스 (Phaseolus vulgaris), 글리신 맥스 (Glycine max), 고씨퓸 (Gossypium sp .), 아스트라갈루스 시니쿠스 (Astragalus sinicus), 로투스 자포니카스 (Lotus japonicas), 토레니아 포우르니에리 (Torenia fournieri), 알리움 세파 (Allium cepa), 알리움 피스툴로숨 (Allium fistulosum), 알리움 사티붐 (Allium sativum), 헬리안투스 안누스 (Helianthus annuus), 헬리안투스 투베로수스 (Helianthus tuberosus) 및 알리움 투베로숨 (Allium tuberosum), 또는 전술한 식물들 중 하나에 속하는 임의 품종 또는 아종으로 이루어진 군으로부터 선택되는 식물로부터 유래된다. 일부 구현예에서, 식물은 농작물이다.

본 발명의 일부 구현예에서, 본 방법은 유전자 조작된 전이유전자가 없는 식물의 자손을 수득하는 단계를 더 포함한다.

다른 측면에서, 본 발명은 또한 본 발명의 상기한 방법에 의해 수득되는 유전자 변형된 식물 또는 그 자손 또는 그 일부를 제공한다.

다른 측면에서, 본 발명은 또한 본 발명의 방법에 의해 수득된 제1 유전자 변형 식물을 유전자 변형을 포함하지 않는 제2 식물과 교배하여, 유전자 변형을 제2 식물에 도입하는 것을 포함하는 식물 육종 방법을 제공한다.

식물에서 변형시킬 대상 유전자 및 내인성 선별가능한 마커 유전자를 동시에 타겟팅함으로써, 유전자 변형된 전이유전자가 없는 식물의 스크리닝 효율을 크게 향상시킬 수 있다. 본 발명의 방법에 의해, 전이유전자가 없는 돌연변이의 스크리닝 효율을 돌연변이율이 1% 미만인 대상 유전자의 경우 약 10-100배까지 향상시킬 수 있다.

전달 방법:

식물에 유전 물질을 도입하는데 적합한 다양한 전달 기법들이, 예를 들어, 원형질체의 폴리에틸렌 글리콜 (PEG) 처리 (Potrykus et al. 1985), 전기천공 유사 공정 (D' Halluin et al., 1992), 미세주입법 (Neuhaus et al., 1987), 탄화규소 섬유 위스커 기법 (Kaeppler et al., 1992), 바이러스 벡터 매개 방식 (Gelvin, Nature Biotechnology 23, "Viral-mediated plant transformation gets a boost", 684-685 (2005)) 및 입자 총법 (예, Sood et al., 2011, Biologia Plantarum, 55, 1-15)을 포함하는 직접 전달 기법의 선택에 의해, 당해 기술 분야의 당업자들에게 공지되어 있다.

그럼에도 불구하고, 아그로박테리움 형질전환 또는 바이러스 벡터 매개 식물 형질전환과 같은 생물학적 방식, 및 입자 충격 또는 미세주입법과 물리적 전달 방법에 기반한 방법에 기초한 형질전전환 방법이 대상 식물 세포 또는 조직에 유전 물질을 도입하기 위한 유망한 기법으로서 부상하였다. Helenius et al. ("Gene delivery into intact plants using the HeliosTM Gene Gun", Plant Molecular Biology Reporter, 2000, 18 (3):287-288)는 식물 세포에 물질을 도입하기 위한 물리적 방법으로서 입자 총법을 기술하고 있다. 현재, 적어도 염기 편집기 및 하나 이상의 부위-특이적인 작동자뿐 아니라 적어도 염기 편집기 및 하나 이상의 부위-특이적인 작동자를 포함하는 대응되는 복합체를 도입하기 위해 적용할 수 있는, 식물 생물공학 분야의 당업자들에게 공지된 생물학적 및 물리적 수단을 포함하는, 대상 식물 세포에 유전자 구조체 형태로 유전 물질을 도입하기 위한 다양한 식물 형질전환 방법들이 존재한다. 특히, 형질전환 및 형질감염을 위한 전달 방법을 적용해, 본 발명의 툴을 동시에 도입할 수 있다. 일반적인 생물학적 수단은 다양한 여러가지 식물 물질들에 대해 수십년간 사용되어 온 아그로박테리움 spp.를 이용한 형질전환이다. 바이러스 벡터 매개 식물 형질전환은 대상 세포에 유전 물질을 도입하기 위한 또 다른 전략이다. 식물 생물학에서 유용한 물리적 수단은 입자 총법이며, 이는 또한 바이올리스틱 형질감염 또는 미세입자-매개 유전자 전달로 지칭되며, 대상 핵산 또는 유전자 구조체를 포함하는 코딩된 미세입자 또는 나노입자를 타겟 세포 또는 조직에 전달하기 위한 물리적 전달 방법을 지칭한다. 물리적 도입 수단은 핵산, 즉 RNA 및/또는 DNA 및 단백질을 도입하기 적합하다. 마찬가지로, 전기천공, 미세주입, 나노입자 및 세포 침투성 펩타이드 (CPP) 등의, 대상 핵산 또는 아미노산 구조체를 식물 세포에 특이적으로 도입하기 위한 특이적인 형질전환 또는 형질감염 방법들이 존재한다. 아울러, 유전자 구조체 및/또는 핵산 및/또는 단백질을 도입하기 위한 화학제를 이용한 형질감염 방법도 있으며, 이는 특히 칼슘 포스페이트를 이용한 형질감염, 리포좀, 예를 들어, 양이온성 리포좀을 이용한 형질감염, 또는 DEAD-덱스트란 또는 폴리에틸렌이민 등의 양이온성 폴리머를 이용한 형질감염 또는 이들의 조합 등을 포함한다. 이러한 전달 방법 및 전달 비히클 또는 카고는, 따라서, 동물 및 포유류 세포 등의 다른 진핵생물 세포에 사용되는 전달 툴과는 본질적으로 차이가 있으며, 모든 전달 방법은, 게놈 편집을 매개하기 위한 대상 구조체가 대상 타겟 세포의 특정 구획에 완전히 기능적이고 능동적인 방식으로 도입될 수 있도록, 특이적으로 미세-조정되고 최적화되어야 한다. 상기한 전달 기법을 단독으로 또는 조합하여 사용함으로써, 본 발명에 따른 하나 이상의 분자 복합체, 즉, 본 발명에 따른, 염기 편집기 복합체 및/또는 부위-특이적인 작동자 복합체 또는 이의 하나 이상의 서브컴포넌트, 즉 하나 이상의 SSN, 하나 이상의 gRNA, 하나 이상의 RT 또는 하나 이상의 염기 편집기, 또는 전술한 서브컴포넌트를 코딩하는 서열을 타겟 세포에 생체내 또는 시험관내 삽입할 수 있다.

물리적 및 화학적 전달 방법은 하나 이상의 식물 세포에 다양한 대상 툴을 공동-전달하여 병행 도입할 수 있으므로, 본 발명에 따르면 특히 바람직하다.

특정 구현예에서, RNA의 crRNA 영역은 스템 루프 또는 최적화된 스템 루프 구조 또는 최적화된 2차 구조를 포함한다. 다른 구현예에서, 성숙형 crRNA는 다이렉트 리피트 서열 (direct repeat sequence)에 스템 루프 또는 최적화된 스템 루프 구조를 포함하며, 이 스템 루프 또는 최적화된 스템 루프 구조는 절단 활성에 중요하다. 특정 구현예에서, 성숙형 crRNA는 바람직하게는 단일한 스템 루프를 포함한다. 특정 구현예에서, 다이렉트 리피트 서열은 바람직하게는 단일한 스템 루프를 포함한다. 특정 구현예에서, 작동자 단백질 복합체의 절단 활성은 스템 루프 RNA 듀플렉스 구조에 영향을 미치는 돌연변이를 도입함으로써 변형된다. 바람직한 구현예에서, 스템 루프의 RNA 듀플렉스를 유지하는 돌연변이가 도입될 수 있으며, 이로써 작동자 단백질 복합체의 절단 활성은 유지된다. 다른 바람직한 구현예에서, 스템 루프의 RNA 듀플렉스를 교란하는 돌연변이가 도입될 수 있으며, 이로써 작동자 단백질 복합체의 절단 활성은 완전히 없어진다.

특히, 본 발명의 다양한 측면들에 따른 방법은 아미노산을 코딩하는 코딩 영역 내의 변형인 제1 및/또는 제2 타겟화된 변형으로 제한되는 것은 아니다. 조절 서열의 변형 역시 고려된다. 후생유전학적 효과 (epigenetic effect)를 가진 임의의 변형 역시 본 발명의 방법에서 다루어질 수 있다.

일 구현예에서, 변형할 하나 이상의 게놈 타겟 서열은 프로모터와 같은 조절 서열일 수 있으며, 프로모터의 편집은 프로모터 또는 프로모터 단편을 다른 프로모터 (치환 프로모터라 함) 또는 프로모터 단편 (치환 프로모터 단편이라 함)으로 치환하는 것을 포함하며, 프로모터 치환으로 다음 중 임의의 하나의 조합이 달성된다: 프로모터 활성 증가, 프로모터 조직 특이성 증가, 프로모터 활성 감소, 프로모터 조직 특이성 감소, 새로운 프로모터 활성, 유도성 프로모터 활성, 유전자 발현의 윈도우 연장, 동일한 세포 층 또는 다른 세포층에서 유전자 발현의 시기 또는 전개 프로세스의 변형, 예를 들어, 꽃밥의 반사면 (tapetum)에서 유전자 발현 시기 연장, DNA 결합 인자의 돌연변이 및/또는 DNA 결합 인자의 결손 또는 부가. 변형할 프로모터 (또는 프로모터 단편)은, 편집되는 세포에 내인성, 인공적인, 기-존재하는 또는 전이유전자인, 프로모터 (또는 프로모터 단편)일 수 있다. 치환 프로모터 또는 이의 단편은 편집되는 세포에 내인성, 인공적인, 기-존재하는 또는 전이유전자성인 프로모터 또는 이의 단편일 수 있다.

일 구현예에서, 하나 이상의 게놈 타겟 서열은 프로모터일 수 있으며, 프로모터의 편집은 천연 EPSPS1 프로모터를 식물 유비퀴틴 프로모터로 치환하는 것을 포함한다. 다른 구현예에서, 변형할 하나 이상의 게놈 타겟 서열은 프로모터일 수 있으며, 편집할 프로모터는 지 메이스 (Zea mays)-PEPC1 프로모터 (Kausch et al., Plant Molecular Biology, 45: 1-15, 2001), 지 메이스 (Zea mays) 유비퀴틴 프로모터 (UBI1ZM PRO, Christensen et al., plant Molecular Biology 18: 675-689, 1992), 벼 액틴 프로모터 (McElroy et al., The Plant Cell, Vol 2, 163-171, February 1990), 지 메이스 (Zea mays)-GOS2 프로모터 (미국 특허 6,504,083) 또는 지 메이스 (Zea mays) 올레신 (oleosin) 프로모터 (미국 특허 8,466,341)를 포함하는 군으로부터 선택된다.

일 구현예에서, 하나 이상의 부위-특이적인 작동자 복합체는 공동-전달된 RT와 조합하여 사용하여, 선별가능한 전이유전자 마커의 삽입없이, 프로모터 또는 프로모터 요소를 대상 게놈 뉴클레오티드 서열에 삽입할 수 있으며, 프로모터 삽입 (또는 프로모터 요소 삽입)으로 다음과 같은 사항 중 어느 하나 또는 이들 조합 중 어느 하나가 달성된다: 프로모터 활성 증가, 즉, 프로모터 강도 증가, 프로모터 조직 특이성 증가, 프로모터 활성 감소, 프로모터 조직 특이성 감소, 새로운 프로모터 활성, 유도성 프로모터 활성, 유전자 발현 윈도우 연장, 유전자 발현의 시기 또는 전개 프로세스의 변형, DNA 결합 인자의 돌연변이 및/또는 DNA 결합 인자의 부가. 삽입할 프로모터 요소는, 비-제한적으로, 프로모터 코어 요소, 예를 들어, 비-제한적으로, CAAT box, CCAAT box, Pribnow box, 및/또는 TATA box, 번역 조절 서열 및/또는 유도성 발현을 위한 억제인자 시스템, 예를 들어, TET 오퍼레이터 리프레서/오퍼레이터/인듀서 요소, 또는 설포닐우레아 리프레서/오퍼레이터/인듀서 요소일 수 있다. 탈수-반응성 인자 (dehydration-responsive element, DRE)가 9 bp 보존된 코어 서열 TACCGACAT를 포함하는, 가뭄-반응성 유전자 rd29A의 프로모터에서 cis-작용성 프로모터 요소로서 최초로 동정되었다 (Yamaguchi-Shinozaki, K., and Shinozaki, K. (1994) Plant Cell 6, 251-264). 내인성 프로모터에 DRE의 삽입은 하류 유전자의 가뭄 유도성 발현을 부여할 수 있다. 또 다른 예는 ABA-반응성 인자 (ABRE)로서, 이는 수많은 ABA 및/또는 스트레스-조절되는 유전자에 존재하는 것으로 확인된 (C/T)ACGTGGC 컨센서스 서열을 포함한다 (Busk P. K., Pages M. (1998) Plant Mol. Biol. 37:425-435). 내인성 프로모터 영역에 35S 인핸서 또는 MMV 인핸서가 삽입되면, 유전자 발현이 증가할 것이다 (미국 특허 5,196,525). 삽입할 프로모터 또는 프로모터 요소는, 편집 대상 세포에 내인성, 인공적인, 기-존재하는 또는 전이유전자성, 프로모터 또는 프로모터 요소일 수 있다.

일 구현예에서, 하나 이상의 부위-특이적인 작동자 복합체를 사용해, 비-제한적인 예로, 콜리플라워 모자이크 바이러스 35 S 인핸서와 같은 인핸서 요소를 내인성 FMT1 프로모터 앞에 삽입하여, FTM1의 발현을 강화할 수 있다. 추가적인 구현예에서, 하나 이상의 부위-특이적인 작동자 복합체를 사용해, TET 오퍼레이터 리프레서/오퍼레이터/인듀서 시스템의 구성성분, 또는 설포닐우레아 리프레서/오퍼레이터/인듀서 시스템의 구성성분을 식물 게놈에 삽입하여, 선별가능한 전이유전자 마커의 삽입없이 유도성 발현 시스템을 구축 또는 조절할 수 있다.

다른 구현예에서, 하나 이상의 부위-특이적인 작동자 복합체를 사용해 프로모터 또는 프로모터 요소의 결손을 허용할 수 있으며, 프로모터 결손 (또는 프로모터 요소 결손)으로 다음과 같은 사항 중 어느 하나 또는 이들 조합 중 어느 하나가 달성된다: 영구적으로 불활성화된 유전자 좌, 프로모터 활성 증가 (프로모터 강도 증가), 프로모터 조직 특이성 증가, 프로모터 활성 감소, 프로모터 조직 특이성 감소, 새로운 프로모터 활성, 유도성 프로모터 활성, 유전자 발현 윈도우 연장, 유전자 발현의 시기 또는 전개 프로세스의 변형, DNA 결합 인자의 돌연변이 및/또는 DNA 결합 인자의 부가. 제거될 프로모터 요소는, 비-제한적으로, 프로모터 코어 요소, 프로모터 인핸서 요소 또는 35S 인핸서 요소일 수 있다. 제거될 프로모터 또는 프로모터 단편은 편집 대상 세포에 내인성, 인공적인, 기-존재하는 또는 전이유전자성일 수 있다.

또 다른 구현예에서, 변형할 하나 이상의 게놈 타겟 대상 부위는 종결인자일 수 있으며, 종결인자의 편집은 "종결인자 스왑 (terminator swap)" 또는 "종결인자 대체 (terminator replacement)"로도 지칭되는 종결인자 또는 종결인자 단편을, 치환 종결인자로도 지칭되는 다른 종결인자 또는 치환 종결인자 단편으로도 지칭되는 종결인자 단편으로 치환하는 것을 포함하며, 종결인자 치환으로 다음과 같은 사항 중 어느 하나 또는 이들 조합 중 어느 하나가 달성된다: 종결인자 활성 증가, 종결인자 조직 특이성 증가, 종결인자 활성 감소, 종결인자 조직 특이성 감소, DNA 결합 인자의 돌연변이 및/또는 DNA 결합 인자의 결손 또는 부가. 변형할 종결인자 또는 그 단편은 편집되는 세포에 내인성, 인공적인, 기-존재하는 또는 전이유전자인 종결인자일 수 있다. 치환 종결인자는 편집되는 세포에 내인성, 인공적인, 기-존배하는 또는 전이유전자인 종결인자 또는 그 단편일 수 있다.

일 구현예에서, 변형할 하나 이상의 대상 게놈 타겟 부위는 종결인자를 포함하며, 편집 대상인 종결인자는 옥수수 Argos 8 또는 SRTF18 유전자 유래 종결인자 또는 기타 종결인자, 예를 들어 감자 PinII 종결인자, 수수 액틴 종결인자 (WO 2013/184537 A1), 벼 T28 종결인자 (WO 2013/012729 A2), AT-T9 TERM (WO 2013/012729 A2) 또는 GZ-W64A TERM (미국 특허 7,053,282)을 포함하는 군으로부터 선택된다.

일 구현예에서, 본 발명에 따른 하나 이상의 부위-특이적인 작동자 복합체는 공동-전달된 RT 서열과 조합 사용하여, 종결인자 또는 종결인자 요소를 대상 게놈 뉴클레오티드 서열에 삽입할 수 있으며, 종결인자 (단편)의 삽입으로 다음과 같은 사항 중 어느 하나 또는 이들 조합 중 어느 하나가 달성된다: 종결인자 활성 증가, 즉, 종결인자 강도 증가, 종결인자 조직 특이성 증가, 종결인자 활성 감소, 종결인자 조직 특이성 감소, DNA 결합 인자의 돌연변이 및/또는 DNA 결합 인자의 부가.

삽입할 종결인자 또는 이의 요소 또는 단편은 편집되는 세포에 내인성, 인공적인, 기-존재하는 또는 전이유전자인 종결인자 (또는 종결인자 요소)일 수 있다.

또 다른 구현예에서, 하나 이상의 부위-특이적인 작동자 복합체를 사용해 종결인자 또는 종결인자 요소를 결손시킬 수 있으며, 종결인자 결손 (또는 종결인자 요소 결손)으로 다음과 같은 사항 중 어느 하나 또는 이들 조합 중 어느 하나가 달성된다: 종결인자 활성 증가 (종결인자 강도 증가), 종결인자 조직 특이성 증가, 종결인자 활성 감소, 종결인자 조직 특이성 감소, DNA 결합 인자의 돌연변이 및/또는 DNA 결합 인자의 부가. 제거할 종결인자 또는 이의 단편은 편집되는 세포에 내인성, 인공적인, 기-존재하는 또는 전이유전자일 수 있다.

일 구현예에서, 본 발명의 하나 이상의 부위-특이적인 작동자 복합체는 선별가능한 전이유전자 마커의 삽입없이도 세포의 게놈 내 조절 서열을 변형 또는 치환할 수 있다. 조절 서열은 유기체에서 특정 유전자의 발현을 증가 또는 감소시킬 수 있거나 및/또는 유기체에서 조직 특이적인 유전자의 발현을 변형시킬 수 있는 핵산 분자의 세그먼트이다. 조절 서열의 예로는, 비-제한적으로, 3' UTR (비-번역 영역) 영역, 5' UTR 영역, 전사 활성인자 (transcription activator), 전사 인핸서, 전사 억제인자, 번역 억제인자, 스플라이싱 인자, miRNA, siRNA, 인공 miRNA, 프로모터 요소, CAMV 35 S 인핸서, MMV 인핸서 요소, SECIS 요소, 폴리아데닐화 신호 및 폴리유비퀴틴화 부위 등이 있다. 일부 구현예에서, 본 발명의 하나 이상의 타겟화된 변형 형태의 편집 또는 조절 인자의 치환으로, 단백질 번역, RNA 절단, RNA 스플라이싱, 전사 종결인자 또는 번역 후 수정이 변형될 수 있다. 일 구현예에서, 조절 인자는 프로모터에서 동정할 수 있으며, 이러한 조절 인자는 프로모터를 상향 또는 하향 조절하도록 이들 조절 인자를 최적화하기 위해 편집 또는 변형될 수 있다.

일 구현예에서, 변형할 하나 이상의 대상 게놈 타겟 부위는 폴리유비퀴틴화 부위이며, 폴리유비퀴틴화 부위의 변형으로 단백질 분해 속도가 변경된다. 유비퀴틴 태그는 단백질이 프로테아좀 또는 자가포식에 의해 분해되게 만든다. 프로테아좀 저해제는 단백질 과생산을 유발할 수 있는 것으로 알려져 있다. 대상 단백질을 코딩하는 DNA 서열에 행해진 변형은 대상 단백질의 하나 이상의 아미노산 변형을 발생시킬 수 있으며, 이러한 변형은 단백질의 폴리유비퀴틴화 (번역 후 수정)를 허용하여 단백질 분해를 바꿀 수 있다.

추가적인 구현예에서, 변형할 하나 이상의 대상 게놈 타겟 부위는 옥수수 EPSPS 유전자의 폴리유비퀴틴화 부위이며, 변형된 폴리유비퀴틴화 부위는 EPSPS 단백질 분해 속도를 낮춤으로써 단백질 함량 증가를 야기한다.

다른 추가의 구현예에서, 변형할 하나 이상의 대상 게놈 타겟 부위는 인트론 부위이며, 변형은 인트론 강화 모티프 (intron enhancing motif)의 인트론에의 삽입으로 구성되며, 그 결과 이 인트론을 포함하는 유전자의 전사 활성이 조정된다.

이제 본 발명은 하기 실시예를 들어 설명될 것이나, 이들 실시예는 본 발명의 범위를 제한하는 것으로 해석되지 않는다.

실시예 :

실시예 1: 염기 편집을 검증하기 위한 차세대 서열분석

닉카제 커플링된 염기 편집기를 이용한 이전에 언급된 타겟에 대한 활성을 조사하기 위해, 표준 방법에 의해 APOBEC-XTEN-Cas9 (nickase)-UGI (서열번호 1 및 서열번호 2)를 코딩하는 플라스미드를 구축하고, 염기 편집기 및 sgRNA를 지 메이스(Zea mays) 조직으로부터 유래된 세포에서 일시적으로 발현시켰다. 복합체와 더불어, 실시예 2-6에서 설계된 gRNA를 검사하였다. 아울러, 대상 타겟 부위와 관련하여 특이적인 PAM 모티프 (서열번호 3-13 및 23)를 지정하였다.

또한, 특정 제초제 타겟 유전자에서 해당 아미노산을 변환시키는데 이용가능한 타겟 부위 범위를 넓이기 위해, SaKKH-BE3 및 VQR-BE3 단백질 (Komor A. et al., Increasing the genome-targeting scope and precision of base editing with engineered Cas9-cytidine deaminase fusion, Nat. Biotech. (2017))를 옥수수 발현용으로 코돈-최적화하여 합성한 다음 동일한 옥수수 세포 시스템에서 발현하기 위한 적절한 sgRNA와 함께 플라스미드에 클로닝하였다.

염기 편집기 발현성 플라스미드를 처리한 지 12-96시간 후, 세포 집단으로부터 전체 게놈 DNA를 추출하고, 타겟화된 심층 서열분석을 실시하여 타겟에서의 염기 변환 빈도 및 패턴을 분석하였다. ALS1 (특히 P197, S653), ALS2 (특히 P197, S653) 및 PPO (특히 C215, A220, G221, N425, Y426) 유전자에서 제초제-내성 아미노산 치환을 유발하는 변환력을 분석하였다.

실시예 2: 염기 편집 구성성분의 형질전환 및 설포닐우레아 또는 이미다졸 리논에 대한 선별

염기 편집으로 본원에 기술된 방법을 이용해 제초제 내성을 부여할 수 있는 지를 확인하기 위해, 실시예 1에 기술된 염기 편집기를, 실시예 1에서 NGS에 의해 검증된 옥수수 ALS1, ALS2 유전자를 타겟팅하는 특이적으로 설계된 몇가지 gRNA를 이용해, 지 메이스 (Zea mays) 유래 조직으로 형질전환하고, 설포닐우레아 (P197 또는 S653 치환의 경우) 또는 이미다졸리논 (S653 치환의 경우)이 함유된 선별 배지에서 재생하였다. 제초제 내성 식물은 염기 편집기의 작동으로 인해 염기 변환을 겪게 될 것이며, 따라서 197번 프로린 또는 653번 세린이 전달된 편집기에 따라 치환될 것이다. 염기 변환 이벤트를 검증하기 위해, 제초제 내성 식물의 ALS 유전자를 상호보완적인 제초제 (complementary herbicide)를 사용해 선별하고, 분자 기법으로 분석하였다.

실시예 3: 비-연관 유전자 좌에서 비- 선별성 변형의 빈도를 높이기 위한 염기 편집기 작용으로 인한 제초제 내성의 공동-선별

유전자 편집 이벤트를 가진 식물을 단리하기 위한 전이유전자가 없는 선별이 게놈 조작시 적절하고 간단한 툴을 제공함을 입증하기 위해, 실시예 2에 기술된 방법을, 동일 세포에서 제초제 유전자의 염기-변환과 대상 유전자의 타겟화된 변형을 병행하여 동시에 구축하기 위한, 부위-특이적인 뉴클레아제의 공동-전달과 결합시켰다. 동일 플라스미드 또는 제2 플라스미드에 뉴클레아제를 sgRNA 및 선택적으로 복구 주형과 함께 코딩시켜, 염기 편집기의 작용으로 인한 염기 변환으로 동일 세포에서 타겟화된 변형을 만들었다. 이후 단계에서, 실시예 2에 기술된 바와 같이 식물을 제초제 선별 조건에서 재생시킨 다음 대상 유전자에서 타겟화된 변형에 대한 분자 및 기타 적절한 기법을 통해 스크리닝할 수 있으며, 제초제 선별로 하나 이상의 제2 변형, 즉 변형시킬 대상 유전자를 표시하는 제2 게놈 유전자 좌에서 하나 이상의 타겟화된 변형을 스크리닝할 세포의 수를 현저하게 줄일 수 있다.

실시예 4: 기능성 CRISPR / Cpf1 염기 편집기 설계 및 염기 편집기 윈도우의 정의

본 실시예에서, 제2 CRISPR 단백질, 즉 Cpf1을 이용해, 게놈 타겟에 염기 편집기 복합체를 전달하였다. CRISPR/Cas9와 마찬가지로, CRISPR/Cpf1은 이의 DNA 타겟에 결합하면 R 루프 유사 구조를 형성하여, 염기 편집에 이용가능한 비-타겟 가닥을 단일 가닥으로 남기게 된다. 그러나, Cpf1-유래 염기 편집기를 이용한 염기 변환 윈도우의 정확한 위치는 모르기 때문에, 타겟에서 PAM 서열에 대한 염기 변환 패턴을 분석할 필요가 있다. 염기 변환 윈도우는 실시예 1에 기술된 세포 집단에서 그 서열을 타겟팅하는 Cpf1 기반의 편집자의 전달 후 옥수수 게놈의 GC-풍부 서열 상의 타겟화된 NGS에 의해 정의될 수 있다. 다른 타겟 식물의 경우, 전략을 그에 맞게 수정할 수 있다.

실시예 5: 복구 주형 또는 상동적인 재조합없이 선별가능한 변형을 만들기 위한 PPO 유전자에서 단일-뉴클레오티드 결손 적용

아마란투스 투베르쿨라투스 (Amaranthus tuberculatus) PPO 유전자의 210번 글리신 아미노산을 제거하면, PPO-저해성 제초제에 대한 내성이 작물에 부여된다 (Patzoldt, W. L. et al. (2006). "A codon deletion confers resistance to herbicides inhibiting protoporphyrinogen oxidase" PNAS 103(33):12329-12334). 이 이소형은 PPX2L로도 지칭된다. 니코티아나 타바쿰 (Nicotiana tabacum)에서 대응되는 아미노산은 PPO2 유전자의 178번 글리신이다. 지 메이스 (Zea mays)의 경우, 대응되는 아미노산은 알라닌이지만, 주변 잔기들이 고도로 보존적이서, 알라닌 결손으로 인해 내성으로 될 기능성 활성 부위를 여전히 구성할 것으로 보인다.

본 실시예에서, Cas9 또는 Cpf과 같은 부위-특이적인 뉴클레아제를 적절한 crRNA 또는 sgRNA와 함께 사용해, 이 아미노산 코돈 근처에 이중 가닥 절단을 만들 수 있다. 활성 PPO 효소를 보존하면서 제초제 결합을 저해하는 염기 3개의 결손으로, 제초제 내성 식물이 만들어질 것이다. 따라서, 이러한 선별가능한 변형은 복구 주형 또는 상동적인 재조합을 사용하지 않고 행할 수 있으며, 따라서 전이유전자 마커 프리 전략을 제공해준다.

실시예 6: 부가적인 이용

부가적인 실시예는 CRISPR 뉴클레아제 CasX, CasY 및 Cpf1을, 상기 실시예 1-3에서 CRISPR Cas9에 대해 기술된 방법과 함께 사용가능하다. 또한, 실시예 1에 기술된 Cas9-연계된 염기 편집기 또는 실시예 4에 언급된 Cpf1과 연계된 염기 편집기를 이용한, 선별가능한 유전자 타겟 또는 식물 스크리닝을 위한 표현형 마커에의 조기 정지 코돈의 도입. 구체적인 예는 표현형 유전자 (예, 수많은 광택 유전자, 골든 등) 내 정지 코돈일 수 있다.

또한, 제초제-내성에 기반하여 선별하기 위한 추가적인 타겟은 앞서 기술된 바와 같이 PPO, ALS 및 EPSPS 유전자에서의 기타 아미노산 결손, 조기 정지 코돈의 도입 또는 아미노한 변경을 포함한다. PPO 유전자에서 염기 편집하기 적합한 gRNA 프로토스페이서 서열이 제공된다 (서열번호 7 - 13).

CasX-연계된 염기 편집 복합체의 서열 (서열번호 14), AsCpf1-연계된 염기 편집 복합체의 서열(서열번호 15) 및 시티딘 데아미나제 PmCDA1을 Cas9-연계된 염기 편집 복합체에 도입하기 위한 서열 (서열번호 16)이 추가적으로 제공된다.

CRISPR 뉴클레아제-연계된 염기 편집 복합체의 최적화, 특히 데 노보 설계를 위해, 다음과 같은 구성성분들을 임의 순서로, 임의 조합으로 사용할 수 있다: niCas9 (D10A; 서열번호 17), CasX (서열번호 18), niAsCpf1 (R1226A; 서열번호 19), APOBEC1 (서열번호 20), UGI (서열번호 21), PmCDA1 (서열번호 22), 및 링커, 예로 XTEN 링커, 및 핵 위치화 신호 또는 대상 게놈 부위에 따른 기타 소기관 타겟팅 신호, 또는 이들 구성성분들의 임의 조합.

실시예 7: 벼 돌연변이 식물의 스크리닝

Yuan Zong et al. (Zong, Y. et al. Precise base editing in rice, wheat and maize with a Cas9-cytidine deaminase fusion. Nat. Biotechnol. 2017, doi: 10.1038/nbt.3811)에 따라, OsALS 유전자 (Genbank No.: AY885674.1)의 2개의 다른 부위 (S1 및 S2)를 동시에 타겟팅하는 벡터 pH-nCas9-PBE-OsALS-S1/S2를, pH-nCas9- PBE를 기반으로 구축하였다. OsALS의 S1 부위를 제초제 선별을 위한 부위로 사용하였다. S1 유전자 좌가 돌연변이되면, 식물은 니코설푸론과 같은 제초제에 대해 내성을 획득하게 될 것이다 (Tranel and Wright, 2002). 실험의 sgRNA 타겟 서열을 표 1에 나타낸다.

표 1. 벼 sgRNA 타겟 서열

sgRNA	타겟 서열
sgRNA-OsALS-S1	CAGGTCCCCCGCCGCATGATCGG
sgRNA-OsALS-S2	CCTACCCGGGCGGCGCGTCCATG

PAM은 밑줄 표시된다.

pH-nCas9-PBE-OsALS-S1/S2 바이너리 벡터를 아그로박테리움 균주 AGL1에 전기천공에 의해 형질전환하였다. 아그로박테리움-매개 형질전환, 조직 배양 및 벼 품종 Zhonghua 11에서의 재생을 Shan et al. (Shan, Q. et al. Targeted genome modification of crop plants using a CRISPR-Cas system. Nat. Biotechnol. 31, 686-688 (2013))에 따라 수행하였다. 조직 배양시 히그로마이신 선별 (50 μg/ml)을 이용하였다. (본 실험은 개념 증명이어서, 식물을 먼저 히그로마이신을 사용해 선별한 다음 니코설푸론으로 선별하였다. 목표는 먼저 형질전환 식물을 수득한 다음 제초제 내성에 대해 스크리닝하는 것이었다.) 벼 식물을 재생시킨 후, 재생된 모종 10주를, 야생형 식물은 생존할 수 없는 니코설푸론 0.0065 PPM 함유성 선별 배지에서 배양하였다. 14일 후 4주가 생존하였다. 이들 4주로부터 DNA를 추출하였다. ALS 유전자를 PCR에 의해 증폭시키고, 서열분석하여 돌연변이 유전자형을 확인하였다. 그 결과, 이들 4주 모두 S2 유전자 좌에서 염기 돌연변이되었으며, 제초제-내성 식물은 S2 부위에서 100% (4/4)의 돌연변이율을 달성한 것으로, 나타났다. 돌연변이 패턴은 도 2a에 나타낸다.

실시예 8: 밀 돌연변이 식물 스크리닝

Yuan Zong et al. (Zong, Y. et al. Precise base editing in rice, wheat and maize with a Cas9-cytidine deaminase fusion. Nat. Biotechnol. 2017, doi: 10.1038/nbt.3811)에 따라, 하기 구조체들을 pTaU6에 기반하여 제조하였다:

1) B 게놈 (GenBank No.: AY210406)의 TaALS 유전자의 S2 부위를 타겟팅하는 pTaU6-TaALS-S2,

2) B 게놈 및 D 게놈 (Genbank No. EU660901 및 EU660902)의 TaACCase 유전자에서 하나의 부위를 타겟팅하는 pTaU6-TaACCase,

3) 병행하여 TaALS 유전자의 2가지 부위를 타겟팅하는 pTaU6-TaALS-S1/S2, 및

4) 병행하여 TaALS 및 ACCase 유전자를 타겟팅하는 TaU6-TaALS-S1/TaACCase.

TaALS S1 부위를 제초제 선별 부위로 사용하였다. 그 부위가 돌연변이되면, 식물은 제초제 (예, 니코설푸론) 내성을 획득하게 될 것이지만, TaALS S2 부위에서의 돌연변이만으로는 내성이 부여되진 않을 것이다 (Tranel and Wright, 2002). 이 실험에 사용된 sgRNA 타겟 서열을 표 2에 나타낸다.

표 2. 밀 sgRNA 타겟 서열

sgRNA	타겟 서열
sgRNA-TaALS-S1	CAGGTCCCCCGCCGCATGATCGG
sgRNA-TaALS-S2	CCTACCCTGGCGGCGCGTCCATG
sgRNA-TaACCase	TTCAGCTACTAAGACAGCGCAGG

PAM은 밑줄 표시된다.

플라스미드 DNA (pnCas9-PBE와 pTaU6 벡터 시리즈의 동일 비율 혼합물)를 사용해, 기존에 언급된 형질전환과 같이 Konun 199의 어린 배아에 유전자 총으로 형질전환하였다 (Zhang, K., Liu, J., Zhang, Y., Yang, Z. & Gao, C. Biolistic genetic transformation of a wide range of Chinese elite wheat (Triticum aestivum L.) varieties. J. Genet. Genomics. 42, 39-42 (2015). 유전자 총 형질전환 후, 배아를 문헌에 따라 처리하고, 조직 배양시 선별 물질은 사용하지 않았다.

B 게놈의 TaALS 유전자의 S2 부위만 타겟팅함으로써 수득한 밀 식물의 경우, 식물 3-4주를 하나의 샘플로 각각 채집하여 PCR/RE에 의해 돌연변이를 검출하였다. 샘플 258개를 PCR/RE에 의해 검출하였으며 (개별 식물 약 1000주), 돌연변이는 검출되지 않았다.

TaACCase 유전자 부위만 타겟팅함으로써 수득한 밀 식물의 경우, 식물 3-4주를 하나의 샘플로 각각 채집하여 생거 서열분석으로 분석하였다. 샘플 64개를 서열분석하였으며 (개별 식물 약 256주), 돌연변이는 검출되지 않았다.

TaALS 유전자의 S1 부위와 S2 부위를 병행하여 타겟팅함으로써 수득한 밀 식물 (약 800주)을 먼저 (야생형 식물은 생존할 수 없는) 0.13 PPM 니코설푸론 함유성 선별 배지에서 배양하였다. 30일 후, 12주가 생존하였으며, 이중 9주는 TaALS-S2 부위에 염기 돌연변이를 가지고 있었다. 니코설푸론 선별 배지를 이용한 ALS-S2 부위 돌연변이의 선별 효율은 75% (9/12)이었다. 돌연변이주 5종의 돌연변이 타입을 도 2b에 나타낸다.

TaALS 유전자 및 TaACCase 유전자를 병행하여 타겟팅함으로써 수득한 밀 식물 (약 800주)을 0.13 PPM 니코설푸론 함유성 선별 배지에서 배양하였다. 30일 후, 9주가 생존하였으며, 2주는 TaACCase 부위에 염기 돌연변이를 가지고 있었다. 니코설푸론 선별 배지를 이용한 TaACCase 부위 돌연변이의 선별 효율은 22% (2/9)이었다. TaACCase 부위의 돌연변이 패턴을 도 2c에 나타낸다.

실험 결과, 돌연변이 비율이 매우 낮은 타겟 유전자 (예, 타겟 유전자의 돌연변이율이 0.5%)의 경우, 본 발명의 방법은 타겟 돌연변이의 수득 가능성을 10-100배 높일 수 있는 것으로, 확인되었다.

실시예 9: TaALS -P173에 기반한 밀에서의 염기 공동-편집 시스템의 개발

본 실험에서, TaALS-P173에 대응되는 sgRNA 부위를 이용해, 밀 형질전환 중에 제초제 선별 시스템을 확립하였다. PnCas9-PBE 및 TaALS-P173-sgRNA 구조체를 빵밀 품종인 Kenong 199의 미성숙 배아 세포 640개에 입자 총법에 의해 전달하였다. 모종 (2-3 cm)을 재생한 후, PCR 제한 효소 분해 분석 (PCR-RE 분석)으로 돌연변이 빈도를 분석하였다. 동시에, 동일 모종을 0.27 ppm 니코설푸론 함유 배지로 이동시켰다 (도 3). PCR-RE 분석에 의해 동정된 돌연변이 모종 14주 (2.1%) 중 10주 (1.56%)가, 제초제 함유 배지에서 3주 배양 후 내성을 나타내었으며, 민감성 돌연변이 3주는 어떠한 아미노산 치환도 포함하지 않았다 (표 3).

내성		A 게놈 치환	B 게놈 치환	D 게놈 치환
R	T0-1	F/S	F/S	F/S
R	T0-2	F(헤테로)	F(호모)	S(호모)
R	T0-3	S(헤테로)	F/S	S(헤테로)
S	T0-4	WT	WT	SM
R	T0-5	S(호모)	S(헤테로)	F/S
R	T0-6	S(호모)	F,C(헤테로)	WT
S	T0-7	S(호모)	F,C(헤테로)	WT
R	T0-8	WT	WT	F(헤테로)
R	T0-9	F(호모)	F/S	S(헤테로)
R	T0-10	F(호모)	F/S	S(헤테로)
R	T0-11	S(헤테로)	F(헤테로)	F/S
R	T0-12	S(헤테로)	F(헤테로)	F/S
S	T0-13	WT	SM	WT
S	T0-14	WT	SM	WT

SM: 침묵 돌연변이; S: 민감성; R: 내성; 호모: 동형접합체; 헤테로: 이형접합체

그 결과, TaALS-P173 치환을 제초제 함유 배지에서 인지할 수 있는 것으로 검증되었다. 그래서, 본 발명자들은, 이 부위가 또한 다른 게놈 편집 이벤트를 선별하는데 이용할 수 있는지를 확인하기 위해, 조사를 수행하였다. 다른 3 부위 (TaALS-A98, TaALS-A181 및 TaACCase-A2004)를 TaALS-P173와 각각 조합하였다. 선별 효율을 평가하기 위해, TaALS-P173 부위 타겟팅 시스템이 공동-입자 총법 형질전환된 재생 모종을 니코설푸론 함유 배지에 배치하였으며, 생존한 모종은 유전자형 분석에 사용하였다. 타겟화된 돌연변이들이 이들 3가지 부위 모두에서 검출되었으며 (표 4), 선별 효율은 최대 78%이었다. TaALS-A181 및 TaACCase-A2004 부위의 경우, 선별 효율은 비교적 낮았는데 (~25%), 아마도 데아미나제 APOBEC1의 GC 컨텍스트 (GC context)에서 낮은 변환 효율이 원인일 수 있다.

GC 컨텍스트를 가진 부위에서의 선별 효율을 높이기 위해, APOBEC1을 APOBEC1과 비교해 다른 서열 선호성을 가진 데아미나제-PmCDA1으로 치환하였다. 새롭게 확립한 염기 편집기 pPmCDA1-PBE, TaACCase-A2004-sgRNA 및 TaALS-P173-sgRNA 구조체를 입자 총법에 의해 미성숙 배아 세포 640개에 전달하였다. 생존 모종 2주 모두 타겟 부위 TaACCase-A2004에서 돌연변이 대립유전자를 가지고 있었다 (100%) (표 4).

	데아미나제	생존 식물 수	제2 부위에서의 돌연변이 수	선별 효율 (%)
TaALS-P173+A98	APOBEC1	18	14	78
TaALS-P173+A181	APOBEC1	8	2	25
TaALS-P173 +TaACCase A2004	APOBEC1	9	2	22
TaALS-P173 +TaACCase A2004	PmCDA1	2	2	100

실시예 10: ZmALS -P165에 기반한 옥수수에서의 염기 공동-편집 시스템 개발

옥수수에서 공동-편집 시스템을 확립하기 위해, TaALS-P173에 대응되는 아세토락테이트 신타제 부위를 제초제 내성 검사를 위한 타겟으로 하였다. ZmALS2 상의 싱글 편집된 대립유전자가 식물 제초제 내성을 부여할 수 있는 것으로 보고된 바 있다 (Svitashev et al, 2016). 이에, ZmALS-P165를 타겟팅하는 바이너리 벡터를 미성숙 배아에 형질전환하였다 (ZmALS-P165 부위는 ZmALS1 및 ZmALS2 둘다에 보존되어 있음). 재생 식물로부터 3가지 독립적인 돌연변이를 수득하였으며, 이들의 유전자형은 동일하였다. C에서 T로의 치환을 가진 ZmALS1 대립유전자 2종과 ZmALS2 대립유전자 1종에서는 하나의 아미노산 잔기 변형이 달성되었다: 165번 위치에서 프롤린에서 루신으로 치환. ZmALS2에 이형접합성 P165L 치환을 가진 돌연변이 식물 1주는 설포닐우레아 계열의 제초제인 메조설푸론-메틸에 내성을 나타내었다 (도 4).

ZmALS-P165 부위가 선별가능한 마커로서 충분히 작동함을 검증한 후, 다른 2가지 부위 - ZmAccase A2004 및 ZmSbe2 Stop - 를 이 선별가능한 부위와 각각 조합하였다. 형질전환을 위해 바이올리스틱 및 아그로박테리움-매개 전달을 수행하였다. ZmAccase A2004 부위는 GC 컨텍스트 내에 위치하였으며, PmCDA1을 사용해 APOBEC1을 대체하였다.

바이올리스틱 전달을 이용한 선별 효율을 평가하기 위해, 입자 총 발사한 캘러스와 아그로박테리움 매개 형질전환된 미성숙 배아를 메조설푸론-메틸 함유 배지 위에 배치하였다. 생존 모종들은 타겟 부위 돌연변이를 나타내었다.

실시예 11: OsALS -P171에 기반한 벼에서의 염기 공동-편집 시스템의 개발

벼에서 공동-편집 시스템을 확립하기 위해, TaALS-P173에 대응되는 아세토락테이트 신타제 부위를 제초제 내성 검사를 위한 타겟으로 하였다. 싱글 편집된 대립유전자가 식물 제초제 내성을 부여할 수 있는 것으로 보고된 바 있다 (Kawai, K., Kaku, K., Izawa, N., Shimizu, M., Kobayashi, H., & Shimizu, T. (2008). Herbicide sensitivities of mutated enzymes expressed from artificially generated genes of acetolactate synthase. Journal of pesticide science, 33(2), 128-137). 이에, OsALS-P171을 타겟팅하는 바이너리 벡터를 미성숙 배아에 형질전환하였다. 재생 식물로부터 돌연변이들이 수득되었다.

OsALS-P171 부위가 선별가능한 마커로서 충분히 작동함을 검증한 후, 다른 3가지 부위 - OsAccase W2125, OsBDAH2 Stop 및 OsSbe2 Stop - 를 이 선별가능한 부위와 각각 조합하였다. 형질전환을 위해 바이올리스틱 및 아그로박테리움-매개 전달을 수행하였다. 생존 모종은 타겟 부위 돌연변이를 나타내었다.

실시예 12: ZmALS -P197 또는 ZmALS -G654에 기반한 옥수수에서의 염기 공동-편집 시스템의 개발

1. 염기 편집기를 이용해 달성된 제초제 내성을 부여하는 아미노산 변환 구축

이미다졸리논 및 설포닐우레아와 같은 제초제 그룹에 대해 식물에서 내성을 나타내는 아미노산으로 변환하기 위한 지 메이스 (Zea mays)의 타겟 아미노산을 선정하였다. 도 5에서 녹색 화살표는 원하는 변환을 수득하기 위한 코딩 또는 비-코딩 가닥에 대한 가이드 서열이다. 주의: 본 실시예에서 아미노산 잔기 위치 번호는 아라비돕시스 탈리아나의 원형이 되는 (archetypal) ALS 유전자에 대해 표준화하였다. 옥수수 및 밀 펩타이드 서열에서 이들 잔기들의 위치는 다소 다를 것이다.

2. 옥수수 ALS에서 제초제-민감성 P197 코돈은 염기 편집기에 의해 효과적으로 편집될 수 있다.

모든 실험은 옥수수 원형질체 시스템 (Corn Protoplast system)에서 수행하였다. sgRNA:-Guide에 대한 Pol III 프로모터는 P197 유전자 좌 (도 6, 좌측 그래프, 상단) 및 G654 유전자 좌 (도 6, 우측 그래프, 상단)에서 ALS1 및 ALS2 유전자를 변형하도록 제작하였다. 염기-편집기 시스템은 이 경우 pUbi1 구동형 (driven) 염기 편집기 및 ZmU3-구동형 가이드 RNA를 포함하는, 싱글 벡터 시스템이다. 상기에 나타낸 결과는 가이드 RNA에서 모든 C에 대해 계산된 C에서 T로의 변환 빈도 %이며, ALS1 및 ALS2 둘다 음성 대조군에서 백그라운드를 제한 것이다. 여기에 표시된 빈도는 P197 코돈에서 C 하나 또는 양쪽 C가 동일 세포에서 변경되었는지는 나타내지 않는다. G654 유전자 좌에서, 변경 역시 명백하였지만, 그 정도는 낮았다.

3. 제초제-민감성 잔기는 처리 세포의 최대 6% 빈도로 제초제-내성으로 변환된다 (도 7)

도 6에 나타낸 데이터를 분석하는 다른 방법은 원하는 아미노산 코돈 변환을 나타낸 리드의 수를 측정하는 것이다. 최종 데이터 %는 원형질체 형질전환 효율에 대해 정규화한다.

상단 패널: 프롤린197이 ALS1 및 ALS2 유전자 좌 양쪽에서 루신 또는 세린으로 변환된 리드의 %를 보여준다. 데이터는 Pol III 프로모터를 사용한 실험의 결과이다.

중앙 패널: 프롤린197이 ALS1 및 ALS2 유전자 좌 양쪽에서 루신 또는 세린으로 변환된 리드의 %를 보여준다. 데이터는 Pol III 프로모터 및 sgRNA에 대한 리보자임 전달 전략을 사용한 실험의 결과이다.

하단 패널: 글리신654가 ALS1 및 ALS2 유전자 좌 양쪽에서 아스파르트산으로 변환된 리드의 %를 보여준다. 데이터는 Pol III 프로모터 및 sgRNA에 대한 리보자임 전달 전략을 사용한 실험의 결과이다.

SEQUENCE LISTING <110> Institute of Genetics and Developmental Biology, Chinese Academy of Sciences KWS SAAT SE <120> Methods for isolating cells without the use of transgenic marker sequences <130> P20182491 <160> 28 <170> PatentIn version 3.5 <210> 1 <211> 5142 <212> DNA <213> Artificial Sequence <220> <223> APOBEC1 XTEN nCas9(D10A) UGI NLS construct <400> 1 atgagctcag agactggccc agtggctgtg gaccccacat tgagacggcg gatcgagccc 60 catgagtttg aggtattctt cgatccgaga gagctccgca aggagacctg cctgctttac 120 gaaattaatt gggggggccg gcactccatt tggcgacata catcacagaa cactaacaag 180 cacgtcgaag tcaacttcat cgagaagttc acgacagaaa gatatttctg tccgaacaca 240 aggtgcagca ttacctggtt tctcagctgg agcccatgcg gcgaatgtag tagggccatc 300 actgaattcc tgtcaaggta tccccacgtc actctgttta tttacatcgc aaggctgtac 360 caccacgctg acccccgcaa tcgacaaggc ctgcgggatt tgatctcttc aggtgtgact 420 atccaaatta tgactgagca ggagtcagga tactgctgga gaaactttgt gaattatagc 480 ccgagtaatg aagcccactg gcctaggtat ccccatctgt gggtacgact gtacgttctt 540 gaactgtact gcatcatact gggcctgcct ccttgtctca acattctgag aaggaagcag 600 ccacagctga cattctttac catcgctctt cagtcttgtc attaccagcg actgccccca 660 cacattctct gggccaccgg gttgaaaagc ggcagcgaga ctcccgggac ctcagagtcc 720 gccacacccg aaagtgataa aaagtattct attggtttag ccatcggcac taattccgtt 780 ggatgggctg tcataaccga tgaatacaaa gtaccttcaa agaaatttaa ggtgttgggg 840 aacacagacc gtcattcgat taaaaagaat cttatcggtg ccctcctatt cgatagtggc 900 gaaacggcag aggcgactcg cctgaaacga accgctcgga gaaggtatac acgtcgcaag 960 aaccgaatat gttacttaca agaaattttt agcaatgaga tggccaaagt tgacgattct 1020 ttctttcacc gtttggaaga gtccttcctt gtcgaagagg acaagaaaca tgaacggcac 1080 cccatctttg gaaacatagt agatgaggtg gcatatcatg aaaagtaccc aacgatttat 1140 cacctcagaa aaaagctagt tgactcaact gataaagcgg acctgaggtt aatctacttg 1200 gctcttgccc atatgataaa gttccgtggg cactttctca ttgagggtga tctaaatccg 1260 gacaactcgg atgtcgacaa actgttcatc cagttagtac aaacctataa tcagttgttt 1320 gaagagaacc ctataaatgc aagtggcgtg gatgcgaagg ctattcttag cgcccgcctc 1380 tctaaatccc gacggctaga aaacctgatc gcacaattac ccggagagaa gaaaaatggg 1440 ttgttcggta accttatagc gctctcacta ggcctgacac caaattttaa gtcgaacttc 1500 gacttagctg aagatgccaa attgcagctt agtaaggaca cgtacgatga cgatctcgac 1560 aatctactgg cacaaattgg agatcagtat gcggacttat ttttggctgc caaaaacctt 1620 agcgatgcaa tcctcctatc tgacatactg agagttaata ctgagattac caaggcgccg 1680 ttatccgctt caatgatcaa aaggtacgat gaacatcacc aagacttgac acttctcaag 1740 gccctagtcc gtcagcaact gcctgagaaa tataaggaaa tattctttga tcagtcgaaa 1800 aacgggtacg caggttatat tgacggcgga gcgagtcaag aggaattcta caagtttatc 1860 aaacccatat tagagaagat ggatgggacg gaagagttgc ttgtaaaact caatcgcgaa 1920 gatctactgc gaaagcagcg gactttcgac aacggtagca ttccacatca aatccactta 1980 ggcgaattgc atgctatact tagaaggcag gaggattttt atccgttcct caaagacaat 2040 cgtgaaaaga ttgagaaaat cctaaccttt cgcatacctt actatgtggg acccctggcc 2100 cgagggaact ctcggttcgc atggatgaca agaaagtccg aagaaacgat tactccatgg 2160 aattttgagg aagttgtcga taaaggtgcg tcagctcaat cgttcatcga gaggatgacc 2220 aactttgaca agaatttacc gaacgaaaaa gtattgccta agcacagttt actttacgag 2280 tatttcacag tgtacaatga actcacgaaa gttaagtatg tcactgaggg catgcgtaaa 2340 cccgcctttc taagcggaga acagaagaaa gcaatagtag atctgttatt caagaccaac 2400 cgcaaagtga cagttaagca attgaaagag gactacttta agaaaattga atgcttcgat 2460 tctgtcgaga tctccggggt agaagatcga tttaatgcgt cacttggtac gtatcatgac 2520 ctcctaaaga taattaaaga taaggacttc ctggataacg aagagaatga agatatctta 2580 gaagatatag tgttgactct taccctcttt gaagatcggg aaatgattga ggaaagacta 2640 aaaacatacg ctcacctgtt cgacgataag gttatgaaac agttaaagag gcgtcgctat 2700 acgggctggg gacgattgtc gcggaaactt atcaacggga taagagacaa gcaaagtggt 2760 aaaactattc tcgattttct aaagagcgac ggcttcgcca ataggaactt tatgcagctg 2820 atccatgatg actctttaac cttcaaagag gatatacaaa aggcacaggt ttccggacaa 2880 ggggactcat tgcacgaaca tattgcgaat cttgctggtt cgccagccat caaaaagggc 2940 atactccaga cagtcaaagt agtggatgag ctagttaagg tcatgggacg tcacaaaccg 3000 gaaaacattg taatcgagat ggcacgcgaa aatcaaacga ctcagaaggg gcaaaaaaac 3060 agtcgagagc ggatgaagag aatagaagag ggtattaaag aactgggcag ccagatctta 3120 aaggagcatc ctgtggaaaa tacccaattg cagaacgaga aactttacct ctattaccta 3180 caaaatggaa gggacatgta tgttgatcag gaactggaca taaaccgttt atctgattac 3240 gacgtcgatc acattgtacc ccaatccttt ttgaaggacg attcaatcga caataaagtg 3300 cttacacgct cggataagaa ccgagggaaa agtgacaatg ttccaagcga ggaagtcgta 3360 aagaaaatga agaactattg gcggcagctc ctaaatgcga aactgataac gcaaagaaag 3420 ttcgataact taactaaagc tgagaggggt ggcttgtctg aacttgacaa ggccggattt 3480 attaaacgtc agctcgtgga aacccgccaa atcacaaagc atgttgcaca gatactagat 3540 tcccgaatga atacgaaata cgacgagaac gataagctga ttcgggaagt caaagtaatc 3600 actttaaagt caaaattggt gtcggacttc agaaaggatt ttcaattcta taaagttagg 3660 gagataaata actaccacca tgcgcacgac gcttatctta atgccgtcgt agggaccgca 3720 ctcattaaga aatacccgaa gctagaaagt gagtttgtgt atggtgatta caaagtttat 3780 gacgtccgta agatgatcgc gaaaagcgaa caggagatag gcaaggctac agccaaatac 3840 ttcttttatt ctaacattat gaatttcttt aagacggaaa tcactctggc aaacggagag 3900 atacgcaaac gacctttaat tgaaaccaat ggggagacag gtgaaatcgt atgggataag 3960 ggccgggact tcgcgacggt gagaaaagtt ttgtccatgc cccaagtcaa catagtaaag 4020 aaaactgagg tgcagaccgg agggttttca aaggaatcga ttcttccaaa aaggaatagt 4080 gataagctca tcgctcgtaa aaaggactgg gacccgaaaa agtacggtgg cttcgatagc 4140 cctacagttg cctattctgt cctagtagtg gcaaaagttg agaagggaaa atccaagaaa 4200 ctgaagtcag tcaaagaatt attggggata acgattatgg agcgctcgtc ttttgaaaag 4260 aaccccatcg acttccttga ggcgaaaggt tacaaggaag taaaaaagga tctcataatt 4320 aaactaccaa agtatagtct gtttgagtta gaaaatggcc gaaaacggat gttggctagc 4380 gccggagagc ttcaaaaggg gaacgaactc gcactaccgt ctaaatacgt gaatttcctg 4440 tatttagcgt cccattacga gaagttgaaa ggttcacctg aagataacga acagaagcaa 4500 ctttttgttg agcagcacaa acattatctc gacgaaatca tagagcaaat ttcggaattc 4560 agtaagagag tcatcctagc tgatgccaat ctggacaaag tattaagcgc atacaacaag 4620 cacagggata aacccatacg tgagcaggcg gaaaatatta tccatttgtt tactcttacc 4680 aacctcggcg ctccagccgc attcaagtat tttgacacaa cgatagatcg caaacgatac 4740 acttctacca aggaggtgct agacgcgaca ctgattcacc aatccatcac gggattatat 4800 gaaactcgga tagatttgtc acagcttggg ggtgactctg gtggttctac taatctgtca 4860 gatattattg aaaaggagac cggtaagcaa ctggttatcc aggaatccat cctcatgctc 4920 ccagaggagg tggaagaagt cattgggaac aagccggaaa gcgatatact cgtgcacacc 4980 gcctacgacg agagcaccga cgagaatgtc atgcttctga ctagcgacgc ccctgaatac 5040 aagccttggg ctctggtcat acaggatagc aacggtgaga acaagattaa gatgctctct 5100 ggtggttctc ccaagaagaa gaggaaagtc taagacgtct aa 5142 <210> 2 <211> 5214 <212> DNA <213> Artificial Sequence <220> <223> APOBEC1 XTEN nCas9(D10A) UGI NLS construct codon optimized <400> 2 atgccaaaga agaagaggaa ggtttcatcg gagaccggcc ctgttgctgt tgaccccacc 60 ctgcggcgga gaatcgagcc acacgagttc gaggtgttct tcgacccaag ggagctccgc 120 aaggaaacgt gcctcctgta cgagatcaac tggggcggca ggcactccat ctggaggcac 180 accagccaaa acaccaacaa gcacgtggag gtcaacttca tcgagaagtt caccaccgag 240 aggtacttct gcccaaacac ccgctgctcc atcacctggt tcctgtcctg gagcccatgc 300 ggcgagtgct ccagggccat caccgagttc ctcagccgct acccacacgt caccctgttc 360 atctacatcg ccaggctcta ccaccacgcc gacccaagga acaggcaggg cctccgcgac 420 ctgatctcca gcggcgtgac catccaaatc atgaccgagc aggagtccgg ctactgctgg 480 aggaacttcg tcaactactc cccaagcaac gaggcccact ggccaaggta cccacacctc 540 tgggtgcgcc tctacgtgct cgagctgtac tgcatcatcc tcggcctgcc accatgcctc 600 aacatcctga ggcgcaagca accacagctg accttcttca ccatcgccct ccaaagctgc 660 cactaccaga ggctcccacc acacatcctg tgggctaccg gcctcaagtc cggcagcgaa 720 acgccaggca cctccgagag cgctacgcct gaacttaagg acaagaagta ctcgatcggc 780 ctcgccatcg ggacgaactc agttggctgg gccgtgatca ccgacgagta caaggtgccc 840 tctaagaagt tcaaggtcct ggggaacacc gaccgccatt ccatcaagaa gaacctcatc 900 ggcgctctcc tgttcgacag cggggagacc gctgaggcta cgaggctcaa gagaaccgct 960 aggcgccggt acacgagaag gaagaacagg atctgctacc tccaagagat tttctccaac 1020 gagatggcca aggttgacga ttcattcttc caccgcctgg aggagtcttt cctcgtggag 1080 gaggataaga agcacgagcg gcatcccatc ttcggcaaca tcgtggacga ggttgcctac 1140 cacgagaagt accctacgat ctaccatctg cggaagaagc tcgtggactc caccgataag 1200 gcggacctca gactgatcta cctcgctctg gcccacatga tcaagttccg cggccatttc 1260 ctgatcgagg gggatctcaa cccagacaac agcgatgttg acaagctgtt catccaactc 1320 gtgcagacct acaaccaact cttcgaggag aacccgatca acgcctctgg cgtggacgcg 1380 aaggctatcc tgtccgcgag gctctcgaag tccaggaggc tggagaacct gatcgctcag 1440 ctcccaggcg agaagaagaa cggcctgttc gggaacctca tcgctctcag cctggggctc 1500 accccgaact tcaagtcgaa cttcgatctc gctgaggacg ccaagctgca actctccaag 1560 gacacctacg acgatgacct cgataacctc ctggcccaga tcggcgatca atacgcggac 1620 ctgttcctcg ctgccaagaa cctgtcggac gccatcctcc tgtcagatat cctccgcgtg 1680 aacaccgaga tcacgaaggc tccactctct gcctccatga tcaagcgcta cgacgagcac 1740 catcaggatc tgaccctcct gaaggcgctg gtccgccaac agctcccgga gaagtacaag 1800 gagattttct tcgatcagtc gaagaacggc tacgctgggt acatcgacgg cggggcctca 1860 caagaggagt tctacaagtt catcaagcca atcctggaga agatggacgg cacggaggag 1920 ctcctggtga agctcaacag ggaggacctc ctgcggaagc agagaacctt cgataacggc 1980 agcatccccc accaaatcca tctcggggag ctgcacgcca tcctgagaag gcaagaggac 2040 ttctaccctt tcctcaagga taaccgggag aagatcgaga agatcctgac cttcagaatc 2100 ccatactacg tcggccctct cgcgcggggg aactcaagat tcgcttggat gacccgcaag 2160 tctgaggaga ccatcacgcc gtggaacttc gaggaggtgg tggacaaggg cgctagcgct 2220 cagtcgttca tcgagaggat gaccaacttc gacaagaacc tgcccaacga gaaggtgctc 2280 cctaagcact cgctcctgta cgagtacttc accgtctaca acgagctcac gaaggtgaag 2340 tacgtcaccg agggcatgcg caagccagcg ttcctgtccg gggagcagaa gaaggctatc 2400 gtggacctcc tgttcaagac caaccggaag gtcacggtta agcaactcaa ggaggactac 2460 ttcaagaaga tcgagtgctt cgattcggtc gagatcagcg gcgttgagga ccgcttcaac 2520 gccagcctcg ggacctacca cgatctcctg aagatcatca aggataagga cttcctggac 2580 aacgaggaga acgaggatat cctggaggac atcgtgctga ccctcacgct gttcgaggac 2640 agggagatga tcgaggagcg cctgaagacg tacgcccatc tcttcgatga caaggtcatg 2700 aagcaactca agcgccggag atacaccggc tgggggaggc tgtcccgcaa gctcatcaac 2760 ggcatccggg acaagcagtc cgggaagacc atcctcgact tcctcaagag cgatggcttc 2820 gccaacagga acttcatgca actgatccac gatgacagcc tcaccttcaa ggaggatatc 2880 caaaaggctc aagtgagcgg ccagggggac tcgctgcacg agcatatcgc gaacctcgct 2940 ggctcccccg cgatcaagaa gggcatcctc cagaccgtga aggttgtgga cgagctcgtg 3000 aaggtcatgg gccggcacaa gcctgagaac atcgtcatcg agatggccag agagaaccaa 3060 accacgcaga aggggcaaaa gaactctagg gagcgcatga agcgcatcga ggagggcatc 3120 aaggagctgg ggtcccaaat cctcaaggag cacccagtgg agaacaccca actgcagaac 3180 gagaagctct acctgtacta cctccagaac ggcagggata tgtacgtgga ccaagagctg 3240 gatatcaacc gcctcagcga ttacgatgtc gatcatatcg ttccccagtc tttcctgaag 3300 gatgactcca tcgacaacaa ggtcctcacc aggtcggaca agaaccgcgg caagtcagat 3360 aacgttccat ctgaggaggt cgttaagaag atgaagaact actggaggca gctcctgaac 3420 gccaagctga tcacgcaaag gaagttcgac aacctcacca aggctgagag aggcgggctc 3480 tcagagctgg acaaggccgg cttcatcaag cggcagctgg tcgagaccag acaaatcacg 3540 aagcacgttg cgcaaatcct cgactctcgg atgaacacga agtacgatga gaacgacaag 3600 ctgatcaggg aggttaaggt gatcaccctg aagtctaagc tcgtttccga cttcaggaag 3660 gatttccagt tctacaaggt tcgcgagatc aacaactacc accatgccca tgacgcttac 3720 ctcaacgctg tggtcggcac cgctctgatc aagaagtacc caaagctgga gtccgagttc 3780 gtgtacgggg actacaaggt ttacgatgtg cgcaagatga tcgccaagtc ggagcaagag 3840 atcggcaagg ctaccgccaa gtacttcttc tactcaaaca tcatgaactt cttcaagacc 3900 gagatcacgc tggccaacgg cgagatccgg aagagaccgc tcatcgagac caacggcgaa 3960 acgggggaga tcgtgtggga caagggcagg gatttcgcga ccgtccgcaa ggttctctcc 4020 atgccccagg tgaacatcgt caagaagacc gaggtccaaa cgggcgggtt ctcaaaggag 4080 tctatcctgc ctaagcggaa cagcgacaag ctcatcgcca gaaagaagga ctgggaccca 4140 aagaagtacg gcgggttcga cagccctacc gtggcctact cggtcctggt tgtggcgaag 4200 gttgagaagg gcaagtccaa gaagctcaag agcgtgaagg agctcctggg gatcaccatc 4260 atggagaggt ccagcttcga gaagaaccca atcgacttcc tggaggccaa gggctacaag 4320 gaggtgaaga aggacctgat catcaagctc ccgaagtact ctctcttcga gctggagaac 4380 ggcaggaaga gaatgctggc ttccgctggc gagctccaga aggggaacga gctcgcgctg 4440 ccaagcaagt acgtgaactt cctctacctg gcttcccact acgagaagct caagggcagc 4500 ccggaggaca acgagcaaaa gcagctgttc gtcgagcagc acaagcatta cctcgacgag 4560 atcatcgagc aaatctccga gttcagcaag cgcgtgatcc tcgccgacgc gaacctggat 4620 aaggtcctct ccgcctacaa caagcaccgg gacaagccca tcagagagca agcggagaac 4680 atcatccatc tcttcaccct gacgaacctc ggcgctcctg ctgctttcaa gtacttcgac 4740 accacgatcg atcggaagag atacacctcc acgaaggagg tcctggacgc gaccctcatc 4800 caccagtcga tcaccggcct gtacgaaacg aggatcgacc tctcacaact cggcggggat 4860 aagagacccg cagcaaccaa gaaggcaggg caagcaaaga agaagaagac gcgtgactcc 4920 ggcggcagca ccaacctgtc cgacatcatc gagaaggaaa cgggcaagca actcgtgatc 4980 caggagagca tcctcatgct gccagaggag gtggaggagg tcatcggcaa caagccagag 5040 tccgacatcc tggtgcacac cgcctacgac gagtccaccg acgagaacgt catgctcctg 5100 accagcgacg ccccagagta caagccatgg gccctcgtca tccaggacag caacggggag 5160 aacaagatca agatgctgtc gggggggagc ccaaagaaga agcggaaggt gtag 5214 <210> 3 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Protospacer sequence <400> 3 caggtgccgc gacgcatgat 20 <210> 4 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Protospacer sequence <400> 4 cacgggacag gtgccgcgac g 21 <210> 5 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Protospacer sequence <400> 5 gggacaggtg ccgcgacgca 20 <210> 6 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Protospacer sequence <400> 6 gccccaccac tagggatcat 20 <210> 7 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Protospacer sequence <400> 7 atcaccagca tagacacctt 20 <210> 8 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Protospacer sequence <400> 8 aggatcacca gcatagacac c 21 <210> 9 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Protospacer sequence <400> 9 cttagaagga tcaccagcat 20 <210> 10 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Protospacer sequence <400> 10 ctgagcagaa aggctcaatg 20 <210> 11 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Protospacer sequence <400> 11 ataagcacct gagcagaaag g 21 <210> 12 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Protospacer sequence <400> 12 cctttctgct caggtgctta t 21 <210> 13 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Protospacer sequence <400> 13 acctgagcag aaaggctcaa 20 <210> 14 <211> 4047 <212> DNA <213> Artificial Sequence <220> <223> APOBEC1 XTEN linker CasX1 UGI NLS codon optimized <400> 14 atgccaaaga agaagaggaa ggtttcatcg gagaccggcc ctgttgctgt tgaccccacc 60 ctgcggcgga gaatcgagcc acacgagttc gaggtgttct tcgacccaag ggagctccgc 120 aaggaaacgt gcctcctgta cgagatcaac tggggcggca ggcactccat ctggaggcac 180 accagccaaa acaccaacaa gcacgtggag gtcaacttca tcgagaagtt caccaccgag 240 aggtacttct gcccaaacac ccgctgctcc atcacctggt tcctgtcctg gagcccatgc 300 ggcgagtgct ccagggccat caccgagttc ctcagccgct acccacacgt caccctgttc 360 atctacatcg ccaggctcta ccaccacgcc gacccaagga acaggcaggg cctccgcgac 420 ctgatctcca gcggcgtgac catccaaatc atgaccgagc aggagtccgg ctactgctgg 480 aggaacttcg tcaactactc cccaagcaac gaggcccact ggccaaggta cccacacctc 540 tgggtgcgcc tctacgtgct cgagctgtac tgcatcatcc tcggcctgcc accatgcctc 600 aacatcctga ggcgcaagca accacagctg accttcttca ccatcgccct ccaaagctgc 660 cactaccaga ggctcccacc acacatcctg tgggctaccg gcctcaagtc cggcagcgaa 720 acgccaggca cctccgagag cgctacgcct gaacttaagg agaagagaat taacaagatc 780 agaaaaaaat tgagcgccga caatgcgact aaaccagttt ccagaagcgg ccctatgaaa 840 acgctcctcg tgcgggtcat gacagatgac cttaaaaaac gccttgagaa gcgcagaaag 900 aaaccggaag tgatgcctca agttatttcc aataatgccg ccaataacct ccgcatgctt 960 ttggatgact acaccaaaat gaaggaagcg atacttcaag tttactggca agagttcaaa 1020 gatgatcacg ttggtcttat gtgtaaattt gcccaaccgg cctctaagaa gatagatcag 1080 aacaagctga agccagagat ggacgagaag ggaaatctca cgactgcggg cttcgcgtgc 1140 tcgcaatgtg gtcagcctct ctttgtgtat aaacttgagc aagtctcaga gaaggggaaa 1200 gcatatacga actacttcgg tagatgcaac gtggcagagc atgaaaaact tattttgctc 1260 gctcagctga aaccggagaa agactcggac gaagcagtta cttatagcct tggcaaattt 1320 ggccaaaggg cactcgactt ctatagcatc cacgtgacga aggaatctac gcatccagtg 1380 aaaccattgg cgcagattgc aggaaatcgc tatgcgtcgg gaccggtggg caaggccctt 1440 tcggatgcct gtatgggtac gatagcttcc tttttgtcaa agtaccaaga tataattatc 1500 gaacaccaaa aggtcgtcaa ggggaatcaa aagagattgg aaagtttgag ggagctcgct 1560 ggcaaggaga atctcgaata tccatcagtc acgctccctc cgcagccaca taccaaggaa 1620 ggggttgacg cttataatga ggttatcgcg cgggtccgca tgtgggtcaa cttgaatctt 1680 tggcaaaaac tcaaactgtc cagagatgat gcaaagcctt tgctcaggtt gaagggcttc 1740 ccttcgttcc cagtcgttga aaggagagaa aacgaagtcg attggtggaa cactatcaat 1800 gaagtgaaaa agctcattga tgctaagaga gacatgggta gggtcttttg gtctggagtt 1860 accgcagaaa agcggaatac tattctggaa ggctacaact atcttcccaa cgaaaacgac 1920 cacaagaaaa gggaggggag cctcgaaaat cccaaaaaac cggcgaaacg ccaatttggg 1980 gatctgcttc tttatctgga gaagaagtat gcaggcgact ggggaaaagt gtttgacgag 2040 gcttgggagc gcatcgacaa aaagatcgct ggcctcacat cacacataga aagggaggag 2100 gcaaggaatg cagaagatgc gcagagcaaa gcagttctta cggattggtt gcgcgctaag 2160 gcttcctttg ttttggagcg cttgaaggaa atggacgaaa aggaatttta tgcgtgcgaa 2220 atccagctgc aaaaatggta tggtgatttg agggggaacc ccttcgctgt ggaagccgaa 2280 aaccgggtcg tggacatatc cgggttttcc atagggtcgg acggtcactc cattcaatac 2340 cggaatttgc ttgcatggaa atatcttgag aacggtaagc gggagtttta tttgctgatg 2400 aactacggaa aaaagggtcg cattaggttc actgatggca cagatattaa aaaaagcggt 2460 aagtggcaag gtcttctgta cggcggagga aaggcgaagg ttatcgactt gacctttgac 2520 ccagacgatg agcagttgat tattttgcct ttggcattcg gtacaagaca agggagggaa 2580 ttcatctgga acgatctgct ctcccttgaa acgggtctca tcaagctggc taacggcaga 2640 gtcatagaga aaaccatata taataagaag attggtagag atgagccggc tctttttgtg 2700 gcgctcactt tcgagaggcg cgaggtcgtt gacccgtcca acatcaagcc cgttaacctg 2760 atcggtgttg ataggggaga aaacataccg gcggtgatag cacttaccga cccagaggga 2820 tgccccctcc cagaattcaa agattcttcg gggggaccaa ctgacattct caggataggt 2880 gagggctata aggagaagca gcgcgctatc caagcggcga aggaagtcga gcaacggaga 2940 gcggggggct attctcggaa attcgcatcg aaaagccgga atcttgccga cgacatggtc 3000 aggaactcag ccagggacct cttctatcac gcggttacgc acgacgccgt tcttgttttt 3060 gaaaatctct cgcggggttt tggacggcaa ggtaagcgga cctttatgac ggaaagacag 3120 tacaccaaaa tggaagattg gctcaccgcg aagctcgcgt acgaggggct tacatctaaa 3180 acgtacttgt ccaaaacact cgcccagtac actagcaaaa cgtgttctaa ctgcggcttt 3240 acgatcacta ccgcggacta cgacggcatg ctcgtcaggc tcaagaaaac gtctgacgga 3300 tgggcaacca cacttaacaa taaagagctc aaggctgaag gtcagatcac atattataat 3360 agatataaga ggcagaccgt ggagaaggag ctgtcagctg agcttgacag gttgtctgag 3420 gagtccggca acaacgatat ttctaagtgg acaaaaggac ggagagatga agcattgttt 3480 ctgctcaaaa agcggttctc gcacaggccc gttcaggagc agtttgtttg tcttgattgc 3540 ggtcacgagg tccacgcgga tgagcaggcc gctctcaata tagcgaggag ctggttgttt 3600 ttgaactcta attccacaga attcaaaagc tataagtccg ggaagcaacc gttcgtgggc 3660 gcttggcaag ccttttataa gcgcaggctc aaggaggttt ggaaaccaaa cgctaaacgc 3720 cccgcggcta caaagaaggc tggccaggca aagaagaaga agaccaacct gtccgacatc 3780 atcgagaagg aaacgggcaa gcaactcgtg atccaggaga gcatcctcat gctgccagag 3840 gaggtggagg aggtcatcgg caacaagcca gagtccgaca tcctggtgca caccgcctac 3900 gacgagtcca ccgacgagaa cgtcatgctc ctgaccagcg acgccccaga gtacaagcca 3960 tgggccctcg tcatccagga cagcaacggg gagaacaaga tcaagatgct gtcggggggg 4020 agcccaaaga agaagcggaa ggtgtag 4047 <210> 15 <211> 4962 <212> DNA <213> Artificial Sequence <220> <223> APOBEC1 XTEN linker AsCpf1(R1226A) UGI NLS codon optimized <400> 15 atgccaaaga agaagaggaa ggtttcatcg gagaccggcc ctgttgctgt tgaccccacc 60 ctgcggcgga gaatcgagcc acacgagttc gaggtgttct tcgacccaag ggagctccgc 120 aaggaaacgt gcctcctgta cgagatcaac tggggcggca ggcactccat ctggaggcac 180 accagccaaa acaccaacaa gcacgtggag gtcaacttca tcgagaagtt caccaccgag 240 aggtacttct gcccaaacac ccgctgctcc atcacctggt tcctgtcctg gagcccatgc 300 ggcgagtgct ccagggccat caccgagttc ctcagccgct acccacacgt caccctgttc 360 atctacatcg ccaggctcta ccaccacgcc gacccaagga acaggcaggg cctccgcgac 420 ctgatctcca gcggcgtgac catccaaatc atgaccgagc aggagtccgg ctactgctgg 480 aggaacttcg tcaactactc cccaagcaac gaggcccact ggccaaggta cccacacctc 540 tgggtgcgcc tctacgtgct cgagctgtac tgcatcatcc tcggcctgcc accatgcctc 600 aacatcctga ggcgcaagca accacagctg accttcttca ccatcgccct ccaaagctgc 660 cactaccaga ggctcccacc acacatcctg tgggctaccg gcctcaagtc cggcagcgaa 720 acgccaggca cctccgagag cgctacgcct gaacttaaga cccaatttga gggatttacg 780 aatctttatc aagtttcaaa gacgcttagg tttgagctca ttccacaagg aaaaaccttg 840 aagcacattc aagagcaggg ctttatcgag gaagacaagg cacggaatga ccattataaa 900 gaattgaaac ccataatcga tcgcatatac aaaacttatg ccgaccaatg cttgcagctt 960 gtccaactcg actgggaaaa tctctcggct gcgatagact cttacaggaa ggaaaagaca 1020 gaagaaacaa gaaacgccct cattgaagag caggctacgt atagaaatgc tattcacgac 1080 tatttcattg gcagaacaga taacttgacg gacgccataa acaaaagaca tgcggagatc 1140 tacaagggat tgttcaaagc ggagcttttc aacggaaaag ttctcaagca gcttggcacg 1200 gtcaccacta ccgaacacga aaacgccttg ttgaggagct tcgataagtt cacgacatat 1260 ttctctggtt tctatgagaa tcggaagaat gtcttctctg cagaagacat ttcaaccgca 1320 atcccacacc ggattgtgca agataacttt ccgaaattta aggaaaactg tcacatcttc 1380 actaggttga ttacggctgt tccatctctt agagaacact tcgaaaacgt caaaaaagct 1440 ataggcattt tcgtctcaac gagcatagag gaggtcttct cgttcccttt ctataaccag 1500 cttctcaccc agacacagat tgatctctat aatcaactcc ttggtggtat ttcaagggaa 1560 gccgggacgg agaagattaa ggggttgaat gaagttctca atctggcgat acagaagaat 1620 gacgaaaccg cccatattat agcttccctc ccacatcggt ttataccgtt gttcaagcag 1680 atcctgtcgg accgcaacac gctttctttc atactcgaag agttcaaaag cgacgaggaa 1740 gtcatacaga gcttctgtaa gtataaaaca cttttgagga atgaaaacgt tcttgaaact 1800 gccgaggcct tgtttaacga gctcaacagc atagatctta cgcatatttt tatttcccac 1860 aaaaaattgg aaactataag ctcagcgctg tgtgatcact gggatacgct tcgcaatgcc 1920 ctttatgagc gcaggatcag cgaactgacg gggaagatta cgaaatctgc gaaagagaaa 1980 gttcaaaggt cccttaagca cgaggatatt aatctccaag aaataataag cgcggctggt 2040 aaagaacttt ccgaagcttt caagcaaaag acatccgaaa tactctccca tgcgcatgca 2100 gccctggacc aaccattgcc aacaactttg aagaaacaag aagagaagga aatcctgaag 2160 tcccaactcg actctttgct cggcctctat cacttgcttg attggttcgc ggttgatgag 2220 tccaacgaag ttgaccctga gttcagcgcc aggttgaccg gtataaagtt ggaaatggaa 2280 ccaagcctct cattttacaa caaggcgagg aactacgcga ccaagaaacc atacagcgtc 2340 gaaaagttta agcttaactt tcaaatgcca acgctcgctt ccggttggga tgttaacaaa 2400 gaaaaaaata acggcgccat cttgtttgtt aaaaacggtt tgtattacct cggcatcatg 2460 ccaaaacaaa agggtcggta caaggctctg agcttcgagc caacagagaa aacaagcgaa 2520 ggcttcgaca agatgtatta tgattacttt cccgatgcag ctaaaatgat ccccaagtgc 2580 tcaacacagc ttaaagcggt taccgcccat ttccagactc acacgacccc aattctcttg 2640 tcaaataact ttattgaacc cttggaaata accaaagaga tatatgacct taataacccg 2700 gagaaagaac ccaagaagtt ccagacggcg tacgctaaga aaacaggaga tcagaagggc 2760 tatagggagg ccctttgtaa atggattgac tttacaaggg actttttgtc gaaatatacg 2820 aagaccactt caattgacct ttcgtccctg cggccgtcta gccagtataa agatttgggt 2880 gagtactatg cggaacttaa tcctttgttg taccacatat cttttcaacg gattgcagag 2940 aaggagataa tggatgcggt cgaaacagga aagctctatc tgttccagat ttacaataaa 3000 gattttgcca agggacacca tggaaaacct aacctgcata ctctttactg gacgggtctt 3060 ttctcgccgg aaaatttggc taagacgtct atcaagttga atgggcaggc agaactcttc 3120 tatcgcccta agtctaggat gaaacggatg gctcatcggc tgggtgaaaa aatgctcaac 3180 aaaaagctta aggatcaaaa gacaccaatc ccggacacac tttatcaaga attgtacgat 3240 tacgttaatc acagactctc acatgacctt tcagatgagg cccgcgcttt gcttcccaat 3300 gttattacta aagaggtctc gcatgagatc ataaaagata gaagattcac gtctgataag 3360 ttcttttttc atgtgccaat aactctcaac tatcaggccg caaattcgcc gtccaagttc 3420 aaccaaaggg tgaatgccta cctcaaggag cacccggaga cgccaataat aggtatcgat 3480 cggggcgaac gcaaccttat ttatataaca gttatcgata gcacagggaa aatactggag 3540 cagcggagcc tgaatactat tcaacagttt gactaccaaa agaaactgga caatagagag 3600 aaggagcgcg tcgccgcccg gcaagcttgg tccgtggtcg gaactataaa agatcttaaa 3660 cagggatacc tgtcacaggt catccatgaa atcgtggatc tgatgataca ctatcaagct 3720 gttgtcgtgc tcgaaaactt gaattttgga ttcaaatcga agagaactgg aatcgctgaa 3780 aaagcggtgt accaacagtt cgagaagatg ctcatcgata agcttaattg tttggtgctt 3840 aaggactatc ccgccgaaaa ggttgggggg gtgctgaacc cgtatcagct cacagatcaa 3900 tttacttcat tcgcgaagat gggaacgcag tcaggatttc tgttctacgt tccagcccct 3960 tatacgtcga aaattgaccc tcttacgggg ttcgtggacc cctttgtttg gaaaacgata 4020 aaaaaccacg agtcacgcaa gcactttctc gagggatttg attttcttca ttatgatgtg 4080 aagaccgggg acttcatttt gcactttaag atgaacagga acttgtcttt ccaaaggggc 4140 ttgcctggat tcatgccggc ctgggatatc gtgtttgaaa agaacgaaac acagttcgat 4200 gcgaaaggga cgcccttcat agctggaaag cgcatagttc cagtgattga gaaccacaga 4260 ttcactggtc gctacagaga cctgtatccg gcaaatgaac tgatagcact ccttgaggaa 4320 aagggtatcg tgtttcgcga tggttcaaat attctcccga agcttttgga gaacgacgat 4380 tctcatgcta tagatactat ggtcgctctc atccggtccg tccttcaaat ggccaattcg 4440 aatgcagcga ccggtgagga ttacataaat tcaccagtcc gggaccttaa tggggtttgc 4500 ttcgactcgc gctttcaaaa ccccgaatgg ccaatggacg ccgatgctaa cggtgcctac 4560 catatagcac ttaaaggaca gcttctgttg aatcacctta aagaatcaaa agaccttaag 4620 ctgcagaatg gaatttcaaa tcaggattgg ctcgcgtaca tacaggagct tcgcaatacc 4680 aacctgtccg acatcatcga gaaggaaacg ggcaagcaac tcgtgatcca ggagagcatc 4740 ctcatgctgc cagaggaggt ggaggaggtc atcggcaaca agccagagtc cgacatcctg 4800 gtgcacaccg cctacgacga gtccaccgac gagaacgtca tgctcctgac cagcgacgcc 4860 ccagagtaca agccatgggc cctcgtcatc caggacagca acggggagaa caagatcaag 4920 atgctgtcgg gggggagccc aaagaagaag cggaaggtgt ag 4962 <210> 16 <211> 5121 <212> DNA <213> Artificial Sequence <220> <223> NLS dCas9 NLS Linker PmCDA1 UGI construct <400> 16 atgccaaaga agaagaggaa ggttgacaag aagtactcga tcggcctcgc catcgggacg 60 aactcagttg gctgggccgt gatcaccgac gagtacaagg tgccctctaa gaagttcaag 120 gtcctgggga acaccgaccg ccattccatc aagaagaacc tcatcggcgc tctcctgttc 180 gacagcgggg agaccgctga ggctacgagg ctcaagagaa ccgctaggcg ccggtacacg 240 agaaggaaga acaggatctg ctacctccaa gagattttct ccaacgagat ggccaaggtt 300 gacgattcat tcttccaccg cctggaggag tctttcctcg tggaggagga taagaagcac 360 gagcggcatc ccatcttcgg caacatcgtg gacgaggttg cctaccacga gaagtaccct 420 acgatctacc atctgcggaa gaagctcgtg gactccaccg ataaggcgga cctcagactg 480 atctacctcg ctctggccca catgatcaag ttccgcggcc atttcctgat cgagggggat 540 ctcaacccag acaacagcga tgttgacaag ctgttcatcc aactcgtgca gacctacaac 600 caactcttcg aggagaaccc gatcaacgcc tctggcgtgg acgcgaaggc tatcctgtcc 660 gcgaggctct cgaagtccag gaggctggag aacctgatcg ctcagctccc aggcgagaag 720 aagaacggcc tgttcgggaa cctcatcgct ctcagcctgg ggctcacccc gaacttcaag 780 tcgaacttcg atctcgctga ggacgccaag ctgcaactct ccaaggacac ctacgacgat 840 gacctcgata acctcctggc ccagatcggc gatcaatacg cggacctgtt cctcgctgcc 900 aagaacctgt cggacgccat cctcctgtca gatatcctcc gcgtgaacac cgagatcacg 960 aaggctccac tctctgcctc catgatcaag cgctacgacg agcaccatca ggatctgacc 1020 ctcctgaagg cgctggtccg ccaacagctc ccggagaagt acaaggagat tttcttcgat 1080 cagtcgaaga acggctacgc tgggtacatc gacggcgggg cctcacaaga ggagttctac 1140 aagttcatca agccaatcct ggagaagatg gacggcacgg aggagctcct ggtgaagctc 1200 aacagggagg acctcctgcg gaagcagaga accttcgata acggcagcat cccccaccaa 1260 atccatctcg gggagctgca cgccatcctg agaaggcaag aggacttcta ccctttcctc 1320 aaggataacc gggagaagat cgagaagatc ctgaccttca gaatcccata ctacgtcggc 1380 cctctcgcgc gggggaactc aagattcgct tggatgaccc gcaagtctga ggagaccatc 1440 acgccgtgga acttcgagga ggtggtggac aagggcgcta gcgctcagtc gttcatcgag 1500 aggatgacca acttcgacaa gaacctgccc aacgagaagg tgctccctaa gcactcgctc 1560 ctgtacgagt acttcaccgt ctacaacgag ctcacgaagg tgaagtacgt caccgagggc 1620 atgcgcaagc cagcgttcct gtccggggag cagaagaagg ctatcgtgga cctcctgttc 1680 aagaccaacc ggaaggtcac ggttaagcaa ctcaaggagg actacttcaa gaagatcgag 1740 tgcttcgatt cggtcgagat cagcggcgtt gaggaccgct tcaacgccag cctcgggacc 1800 taccacgatc tcctgaagat catcaaggat aaggacttcc tggacaacga ggagaacgag 1860 gatatcctgg aggacatcgt gctgaccctc acgctgttcg aggacaggga gatgatcgag 1920 gagcgcctga agacgtacgc ccatctcttc gatgacaagg tcatgaagca actcaagcgc 1980 cggagataca ccggctgggg gaggctgtcc cgcaagctca tcaacggcat ccgggacaag 2040 cagtccggga agaccatcct cgacttcctc aagagcgatg gcttcgccaa caggaacttc 2100 atgcaactga tccacgatga cagcctcacc ttcaaggagg atatccaaaa ggctcaagtg 2160 agcggccagg gggactcgct gcacgagcat atcgcgaacc tcgctggctc ccccgcgatc 2220 aagaagggca tcctccagac cgtgaaggtt gtggacgagc tcgtgaaggt catgggccgg 2280 cacaagcctg agaacatcgt catcgagatg gccagagaga accaaaccac gcagaagggg 2340 caaaagaact ctagggagcg catgaagcgc atcgaggagg gcatcaagga gctggggtcc 2400 caaatcctca aggagcaccc agtggagaac acccaactgc agaacgagaa gctctacctg 2460 tactacctcc agaacggcag ggatatgtac gtggaccaag agctggatat caaccgcctc 2520 agcgattacg atgtcgatca tatcgttccc cagtctttcc tgaaggatga ctccatcgac 2580 aacaaggtcc tcaccaggtc ggacaagaac cgcggcaagt cagataacgt tccatctgag 2640 gaggtcgtta agaagatgaa gaactactgg aggcagctcc tgaacgccaa gctgatcacg 2700 caaaggaagt tcgacaacct caccaaggct gagagaggcg ggctctcaga gctggacaag 2760 gccggcttca tcaagcggca gctggtcgag accagacaaa tcacgaagca cgttgcgcaa 2820 atcctcgact ctcggatgaa cacgaagtac gatgagaacg acaagctgat cagggaggtt 2880 aaggtgatca ccctgaagtc taagctcgtt tccgacttca ggaaggattt ccagttctac 2940 aaggttcgcg agatcaacaa ctaccaccat gcccatgacg cttacctcaa cgctgtggtc 3000 ggcaccgctc tgatcaagaa gtacccaaag ctggagtccg agttcgtgta cggggactac 3060 aaggtttacg atgtgcgcaa gatgatcgcc aagtcggagc aagagatcgg caaggctacc 3120 gccaagtact tcttctactc aaacatcatg aacttcttca agaccgagat cacgctggcc 3180 aacggcgaga tccggaagag accgctcatc gagaccaacg gcgaaacggg ggagatcgtg 3240 tgggacaagg gcagggattt cgcgaccgtc cgcaaggttc tctccatgcc ccaggtgaac 3300 atcgtcaaga agaccgaggt ccaaacgggc gggttctcaa aggagtctat cctgcctaag 3360 cggaacagcg acaagctcat cgccagaaag aaggactggg acccaaagaa gtacggcggg 3420 ttcgacagcc ctaccgtggc ctactcggtc ctggttgtgg cgaaggttga gaagggcaag 3480 tccaagaagc tcaagagcgt gaaggagctc ctggggatca ccatcatgga gaggtccagc 3540 ttcgagaaga acccaatcga cttcctggag gccaagggct acaaggaggt gaagaaggac 3600 ctgatcatca agctcccgaa gtactctctc ttcgagctgg agaacggcag gaagagaatg 3660 ctggcttccg ctggcgagct ccagaagggg aacgagctcg cgctgccaag caagtacgtg 3720 aacttcctct acctggcttc ccactacgag aagctcaagg gcagcccgga ggacaacgag 3780 caaaagcagc tgttcgtcga gcagcacaag cattacctcg acgagatcat cgagcaaatc 3840 tccgagttca gcaagcgcgt gatcctcgcc gacgcgaacc tggataaggt cctctccgcc 3900 tacaacaagc accgggacaa gcccatcaga gagcaagcgg agaacatcat ccatctcttc 3960 accctgacga acctcggcgc tcctgctgct ttcaagtact tcgacaccac gatcgatcgg 4020 aagagataca cctccacgaa ggaggtcctg gacgcgaccc tcatccacca gtcgatcacc 4080 ggcctgtacg aaacgaggat cgacctctca caactcggcg gggataagag acccgcagca 4140 accaagaagg cagggcaagc aaagaagaag aagacgcgtg actccggcgg cagcccaaag 4200 aagaagagga aggttggtgg aggaggttct ggaggtggag gttctatgac cgacgctgag 4260 tacgtgagaa tccatgagaa gttggacatc tacacgttta agaaacagtt tttcaacaac 4320 aaaaaatccg tgtcgcatag atgctacgtt ctctttgaat taaaacgacg gggtgaacgt 4380 agagcgtgtt tttggggcta tgctgtgaat aaaccacaga gcgggacaga acgtggcatt 4440 cacgccgaaa tctttagcat tagaaaagtc gaagaatacc tgcgcgacaa ccccggacaa 4500 ttcacgataa attggtactc atcctggagt ccttgtgcag attgcgctga aaagatctta 4560 gaatggtata accaggagct gcgggggaac ggccacactt tgaaaatctg ggcttgcaaa 4620 ctctattacg agaaaaatgc gaggaatcaa attgggctgt ggaacctcag agataacggg 4680 gttgggttga atgtaatggt aagtgaacac taccaatgtt gcaggaaaat attcatccaa 4740 tcgtcgcaca atcaattgaa tgagaataga tggcttgaga agactttgaa gcgagctgaa 4800 aaacgacgga gcgagttgtc cattatgatt caggtaaaaa tactccacac cactaagagt 4860 cctgctgtta ccaacctgtc cgacatcatc gagaaggaaa cgggcaagca actcgtgatc 4920 caggagagca tcctcatgct gccagaggag gtggaggagg tcatcggcaa caagccagag 4980 tccgacatcc tggtgcacac cgcctacgac gagtccaccg acgagaacgt catgctcctg 5040 accagcgacg ccccagagta caagccatgg gccctcgtca tccaggacag caacggggag 5100 aacaagatca agatgctgtg a 5121 <210> 17 <211> 4101 <212> DNA <213> Artificial Sequence <220> <223> nCas9 (D10A) <400> 17 gataaaaagt attctattgg tttagccatc ggcactaatt ccgttggatg ggctgtcata 60 accgatgaat acaaagtacc ttcaaagaaa tttaaggtgt tggggaacac agaccgtcat 120 tcgattaaaa agaatcttat cggtgccctc ctattcgata gtggcgaaac ggcagaggcg 180 actcgcctga aacgaaccgc tcggagaagg tatacacgtc gcaagaaccg aatatgttac 240 ttacaagaaa tttttagcaa tgagatggcc aaagttgacg attctttctt tcaccgtttg 300 gaagagtcct tccttgtcga agaggacaag aaacatgaac ggcaccccat ctttggaaac 360 atagtagatg aggtggcata tcatgaaaag tacccaacga tttatcacct cagaaaaaag 420 ctagttgact caactgataa agcggacctg aggttaatct acttggctct tgcccatatg 480 ataaagttcc gtgggcactt tctcattgag ggtgatctaa atccggacaa ctcggatgtc 540 gacaaactgt tcatccagtt agtacaaacc tataatcagt tgtttgaaga gaaccctata 600 aatgcaagtg gcgtggatgc gaaggctatt cttagcgccc gcctctctaa atcccgacgg 660 ctagaaaacc tgatcgcaca attacccgga gagaagaaaa atgggttgtt cggtaacctt 720 atagcgctct cactaggcct gacaccaaat tttaagtcga acttcgactt agctgaagat 780 gccaaattgc agcttagtaa ggacacgtac gatgacgatc tcgacaatct actggcacaa 840 attggagatc agtatgcgga cttatttttg gctgccaaaa accttagcga tgcaatcctc 900 ctatctgaca tactgagagt taatactgag attaccaagg cgccgttatc cgcttcaatg 960 atcaaaaggt acgatgaaca tcaccaagac ttgacacttc tcaaggccct agtccgtcag 1020 caactgcctg agaaatataa ggaaatattc tttgatcagt cgaaaaacgg gtacgcaggt 1080 tatattgacg gcggagcgag tcaagaggaa ttctacaagt ttatcaaacc catattagag 1140 aagatggatg ggacggaaga gttgcttgta aaactcaatc gcgaagatct actgcgaaag 1200 cagcggactt tcgacaacgg tagcattcca catcaaatcc acttaggcga attgcatgct 1260 atacttagaa ggcaggagga tttttatccg ttcctcaaag acaatcgtga aaagattgag 1320 aaaatcctaa cctttcgcat accttactat gtgggacccc tggcccgagg gaactctcgg 1380 ttcgcatgga tgacaagaaa gtccgaagaa acgattactc catggaattt tgaggaagtt 1440 gtcgataaag gtgcgtcagc tcaatcgttc atcgagagga tgaccaactt tgacaagaat 1500 ttaccgaacg aaaaagtatt gcctaagcac agtttacttt acgagtattt cacagtgtac 1560 aatgaactca cgaaagttaa gtatgtcact gagggcatgc gtaaacccgc ctttctaagc 1620 ggagaacaga agaaagcaat agtagatctg ttattcaaga ccaaccgcaa agtgacagtt 1680 aagcaattga aagaggacta ctttaagaaa attgaatgct tcgattctgt cgagatctcc 1740 ggggtagaag atcgatttaa tgcgtcactt ggtacgtatc atgacctcct aaagataatt 1800 aaagataagg acttcctgga taacgaagag aatgaagata tcttagaaga tatagtgttg 1860 actcttaccc tctttgaaga tcgggaaatg attgaggaaa gactaaaaac atacgctcac 1920 ctgttcgacg ataaggttat gaaacagtta aagaggcgtc gctatacggg ctggggacga 1980 ttgtcgcgga aacttatcaa cgggataaga gacaagcaaa gtggtaaaac tattctcgat 2040 tttctaaaga gcgacggctt cgccaatagg aactttatgc agctgatcca tgatgactct 2100 ttaaccttca aagaggatat acaaaaggca caggtttccg gacaagggga ctcattgcac 2160 gaacatattg cgaatcttgc tggttcgcca gccatcaaaa agggcatact ccagacagtc 2220 aaagtagtgg atgagctagt taaggtcatg ggacgtcaca aaccggaaaa cattgtaatc 2280 gagatggcac gcgaaaatca aacgactcag aaggggcaaa aaaacagtcg agagcggatg 2340 aagagaatag aagagggtat taaagaactg ggcagccaga tcttaaagga gcatcctgtg 2400 gaaaataccc aattgcagaa cgagaaactt tacctctatt acctacaaaa tggaagggac 2460 atgtatgttg atcaggaact ggacataaac cgtttatctg attacgacgt cgatcacatt 2520 gtaccccaat cctttttgaa ggacgattca atcgacaata aagtgcttac acgctcggat 2580 aagaaccgag ggaaaagtga caatgttcca agcgaggaag tcgtaaagaa aatgaagaac 2640 tattggcggc agctcctaaa tgcgaaactg ataacgcaaa gaaagttcga taacttaact 2700 aaagctgaga ggggtggctt gtctgaactt gacaaggccg gatttattaa acgtcagctc 2760 gtggaaaccc gccaaatcac aaagcatgtt gcacagatac tagattcccg aatgaatacg 2820 aaatacgacg agaacgataa gctgattcgg gaagtcaaag taatcacttt aaagtcaaaa 2880 ttggtgtcgg acttcagaaa ggattttcaa ttctataaag ttagggagat aaataactac 2940 caccatgcgc acgacgctta tcttaatgcc gtcgtaggga ccgcactcat taagaaatac 3000 ccgaagctag aaagtgagtt tgtgtatggt gattacaaag tttatgacgt ccgtaagatg 3060 atcgcgaaaa gcgaacagga gataggcaag gctacagcca aatacttctt ttattctaac 3120 attatgaatt tctttaagac ggaaatcact ctggcaaacg gagagatacg caaacgacct 3180 ttaattgaaa ccaatgggga gacaggtgaa atcgtatggg ataagggccg ggacttcgcg 3240 acggtgagaa aagttttgtc catgccccaa gtcaacatag taaagaaaac tgaggtgcag 3300 accggagggt tttcaaagga atcgattctt ccaaaaagga atagtgataa gctcatcgct 3360 cgtaaaaagg actgggaccc gaaaaagtac ggtggcttcg atagccctac agttgcctat 3420 tctgtcctag tagtggcaaa agttgagaag ggaaaatcca agaaactgaa gtcagtcaaa 3480 gaattattgg ggataacgat tatggagcgc tcgtcttttg aaaagaaccc catcgacttc 3540 cttgaggcga aaggttacaa ggaagtaaaa aaggatctca taattaaact accaaagtat 3600 agtctgtttg agttagaaaa tggccgaaaa cggatgttgg ctagcgccgg agagcttcaa 3660 aaggggaacg aactcgcact accgtctaaa tacgtgaatt tcctgtattt agcgtcccat 3720 tacgagaagt tgaaaggttc acctgaagat aacgaacaga agcaactttt tgttgagcag 3780 cacaaacatt atctcgacga aatcatagag caaatttcgg aattcagtaa gagagtcatc 3840 ctagctgatg ccaatctgga caaagtatta agcgcataca acaagcacag ggataaaccc 3900 atacgtgagc aggcggaaaa tattatccat ttgtttactc ttaccaacct cggcgctcca 3960 gccgcattca agtattttga cacaacgata gatcgcaaac gatacacttc taccaaggag 4020 gtgctagacg cgacactgat tcaccaatcc atcacgggat tatatgaaac tcggatagat 4080 ttgtcacagc ttgggggtga c 4101 <210> 18 <211> 3003 <212> DNA <213> Artificial Sequence <220> <223> CasX <400> 18 gagaagagaa ttaacaagat cagaaaaaaa ttgagcgccg acaatgcgac taaaccagtt 60 tccagaagcg gccctatgaa aacgctcctc gtgcgggtca tgacagatga ccttaaaaaa 120 cgccttgaga agcgcagaaa gaaaccggaa gtgatgcctc aagttatttc caataatgcc 180 gccaataacc tccgcatgct tttggatgac tacaccaaaa tgaaggaagc gatacttcaa 240 gtttactggc aagagttcaa agatgatcac gttggtctta tgtgtaaatt tgcccaaccg 300 gcctctaaga agatagatca gaacaagctg aagccagaga tggacgagaa gggaaatctc 360 acgactgcgg gcttcgcgtg ctcgcaatgt ggtcagcctc tctttgtgta taaacttgag 420 caagtctcag agaaggggaa agcatatacg aactacttcg gtagatgcaa cgtggcagag 480 catgaaaaac ttattttgct cgctcagctg aaaccggaga aagactcgga cgaagcagtt 540 acttatagcc ttggcaaatt tggccaaagg gcactcgact tctatagcat ccacgtgacg 600 aaggaatcta cgcatccagt gaaaccattg gcgcagattg caggaaatcg ctatgcgtcg 660 ggaccggtgg gcaaggccct ttcggatgcc tgtatgggta cgatagcttc ctttttgtca 720 aagtaccaag atataattat cgaacaccaa aaggtcgtca aggggaatca aaagagattg 780 gaaagtttga gggagctcgc tggcaaggag aatctcgaat atccatcagt cacgctccct 840 ccgcagccac ataccaagga aggggttgac gcttataatg aggttatcgc gcgggtccgc 900 atgtgggtca acttgaatct ttggcaaaaa ctcaaactgt ccagagatga tgcaaagcct 960 ttgctcaggt tgaagggctt cccttcgttc ccagtcgttg aaaggagaga aaacgaagtc 1020 gattggtgga acactatcaa tgaagtgaaa aagctcattg atgctaagag agacatgggt 1080 agggtctttt ggtctggagt taccgcagaa aagcggaata ctattctgga aggctacaac 1140 tatcttccca acgaaaacga ccacaagaaa agggagggga gcctcgaaaa tcccaaaaaa 1200 ccggcgaaac gccaatttgg ggatctgctt ctttatctgg agaagaagta tgcaggcgac 1260 tggggaaaag tgtttgacga ggcttgggag cgcatcgaca aaaagatcgc tggcctcaca 1320 tcacacatag aaagggagga ggcaaggaat gcagaagatg cgcagagcaa agcagttctt 1380 acggattggt tgcgcgctaa ggcttccttt gttttggagc gcttgaagga aatggacgaa 1440 aaggaatttt atgcgtgcga aatccagctg caaaaatggt atggtgattt gagggggaac 1500 cccttcgctg tggaagccga aaaccgggtc gtggacatat ccgggttttc catagggtcg 1560 gacggtcact ccattcaata ccggaatttg cttgcatgga aatatcttga gaacggtaag 1620 cgggagtttt atttgctgat gaactacgga aaaaagggtc gcattaggtt cactgatggc 1680 acagatatta aaaaaagcgg taagtggcaa ggtcttctgt acggcggagg aaaggcgaag 1740 gttatcgact tgacctttga cccagacgat gagcagttga ttattttgcc tttggcattc 1800 ggtacaagac aagggaggga attcatctgg aacgatctgc tctcccttga aacgggtctc 1860 atcaagctgg ctaacggcag agtcatagag aaaaccatat ataataagaa gattggtaga 1920 gatgagccgg ctctttttgt ggcgctcact ttcgagaggc gcgaggtcgt tgacccgtcc 1980 aacatcaagc ccgttaacct gatcggtgtt gataggggag aaaacatacc ggcggtgata 2040 gcacttaccg acccagaggg atgccccctc ccagaattca aagattcttc ggggggacca 2100 actgacattc tcaggatagg tgagggctat aaggagaagc agcgcgctat ccaagcggcg 2160 aaggaagtcg agcaacggag agcggggggc tattctcgga aattcgcatc gaaaagccgg 2220 aatcttgccg acgacatggt caggaactca gccagggacc tcttctatca cgcggttacg 2280 cacgacgccg ttcttgtttt tgaaaatctc tcgcggggtt ttggacggca aggtaagcgg 2340 acctttatga cggaaagaca gtacaccaaa atggaagatt ggctcaccgc gaagctcgcg 2400 tacgaggggc ttacatctaa aacgtacttg tccaaaacac tcgcccagta cactagcaaa 2460 acgtgttcta actgcggctt tacgatcact accgcggact acgacggcat gctcgtcagg 2520 ctcaagaaaa cgtctgacgg atgggcaacc acacttaaca ataaagagct caaggctgaa 2580 ggtcagatca catattataa tagatataag aggcagaccg tggagaagga gctgtcagct 2640 gagcttgaca ggttgtctga ggagtccggc aacaacgata tttctaagtg gacaaaagga 2700 cggagagatg aagcattgtt tctgctcaaa aagcggttct cgcacaggcc cgttcaggag 2760 cagtttgttt gtcttgattg cggtcacgag gtccacgcgg atgagcaggc cgctctcaat 2820 atagcgagga gctggttgtt tttgaactct aattccacag aattcaaaag ctataagtcc 2880 gggaagcaac cgttcgtggg cgcttggcaa gccttttata agcgcaggct caaggaggtt 2940 tggaaaccaa acgctaaacg ccccgcggct acaaagaagg ctggccaggc aaagaagaag 3000 aag 3003 <210> 19 <211> 3918 <212> DNA <213> Artificial Sequence <220> <223> AsCpf1 (R1226A) <400> 19 acccaatttg agggatttac gaatctttat caagtttcaa agacgcttag gtttgagctc 60 attccacaag gaaaaacctt gaagcacatt caagagcagg gctttatcga ggaagacaag 120 gcacggaatg accattataa agaattgaaa cccataatcg atcgcatata caaaacttat 180 gccgaccaat gcttgcagct tgtccaactc gactgggaaa atctctcggc tgcgatagac 240 tcttacagga aggaaaagac agaagaaaca agaaacgccc tcattgaaga gcaggctacg 300 tatagaaatg ctattcacga ctatttcatt ggcagaacag ataacttgac ggacgccata 360 aacaaaagac atgcggagat ctacaaggga ttgttcaaag cggagctttt caacggaaaa 420 gttctcaagc agcttggcac ggtcaccact accgaacacg aaaacgcctt gttgaggagc 480 ttcgataagt tcacgacata tttctctggt ttctatgaga atcggaagaa tgtcttctct 540 gcagaagaca tttcaaccgc aatcccacac cggattgtgc aagataactt tccgaaattt 600 aaggaaaact gtcacatctt cactaggttg attacggctg ttccatctct tagagaacac 660 ttcgaaaacg tcaaaaaagc tataggcatt ttcgtctcaa cgagcataga ggaggtcttc 720 tcgttccctt tctataacca gcttctcacc cagacacaga ttgatctcta taatcaactc 780 cttggtggta tttcaaggga agccgggacg gagaagatta aggggttgaa tgaagttctc 840 aatctggcga tacagaagaa tgacgaaacc gcccatatta tagcttccct cccacatcgg 900 tttataccgt tgttcaagca gatcctgtcg gaccgcaaca cgctttcttt catactcgaa 960 gagttcaaaa gcgacgagga agtcatacag agcttctgta agtataaaac acttttgagg 1020 aatgaaaacg ttcttgaaac tgccgaggcc ttgtttaacg agctcaacag catagatctt 1080 acgcatattt ttatttccca caaaaaattg gaaactataa gctcagcgct gtgtgatcac 1140 tgggatacgc ttcgcaatgc cctttatgag cgcaggatca gcgaactgac ggggaagatt 1200 acgaaatctg cgaaagagaa agttcaaagg tcccttaagc acgaggatat taatctccaa 1260 gaaataataa gcgcggctgg taaagaactt tccgaagctt tcaagcaaaa gacatccgaa 1320 atactctccc atgcgcatgc agccctggac caaccattgc caacaacttt gaagaaacaa 1380 gaagagaagg aaatcctgaa gtcccaactc gactctttgc tcggcctcta tcacttgctt 1440 gattggttcg cggttgatga gtccaacgaa gttgaccctg agttcagcgc caggttgacc 1500 ggtataaagt tggaaatgga accaagcctc tcattttaca acaaggcgag gaactacgcg 1560 accaagaaac catacagcgt cgaaaagttt aagcttaact ttcaaatgcc aacgctcgct 1620 tccggttggg atgttaacaa agaaaaaaat aacggcgcca tcttgtttgt taaaaacggt 1680 ttgtattacc tcggcatcat gccaaaacaa aagggtcggt acaaggctct gagcttcgag 1740 ccaacagaga aaacaagcga aggcttcgac aagatgtatt atgattactt tcccgatgca 1800 gctaaaatga tccccaagtg ctcaacacag cttaaagcgg ttaccgccca tttccagact 1860 cacacgaccc caattctctt gtcaaataac tttattgaac ccttggaaat aaccaaagag 1920 atatatgacc ttaataaccc ggagaaagaa cccaagaagt tccagacggc gtacgctaag 1980 aaaacaggag atcagaaggg ctatagggag gccctttgta aatggattga ctttacaagg 2040 gactttttgt cgaaatatac gaagaccact tcaattgacc tttcgtccct gcggccgtct 2100 agccagtata aagatttggg tgagtactat gcggaactta atcctttgtt gtaccacata 2160 tcttttcaac ggattgcaga gaaggagata atggatgcgg tcgaaacagg aaagctctat 2220 ctgttccaga tttacaataa agattttgcc aagggacacc atggaaaacc taacctgcat 2280 actctttact ggacgggtct tttctcgccg gaaaatttgg ctaagacgtc tatcaagttg 2340 aatgggcagg cagaactctt ctatcgccct aagtctagga tgaaacggat ggctcatcgg 2400 ctgggtgaaa aaatgctcaa caaaaagctt aaggatcaaa agacaccaat cccggacaca 2460 ctttatcaag aattgtacga ttacgttaat cacagactct cacatgacct ttcagatgag 2520 gcccgcgctt tgcttcccaa tgttattact aaagaggtct cgcatgagat cataaaagat 2580 agaagattca cgtctgataa gttctttttt catgtgccaa taactctcaa ctatcaggcc 2640 gcaaattcgc cgtccaagtt caaccaaagg gtgaatgcct acctcaagga gcacccggag 2700 acgccaataa taggtatcga tcggggcgaa cgcaacctta tttatataac agttatcgat 2760 agcacaggga aaatactgga gcagcggagc ctgaatacta ttcaacagtt tgactaccaa 2820 aagaaactgg acaatagaga gaaggagcgc gtcgccgccc ggcaagcttg gtccgtggtc 2880 ggaactataa aagatcttaa acagggatac ctgtcacagg tcatccatga aatcgtggat 2940 ctgatgatac actatcaagc tgttgtcgtg ctcgaaaact tgaattttgg attcaaatcg 3000 aagagaactg gaatcgctga aaaagcggtg taccaacagt tcgagaagat gctcatcgat 3060 aagcttaatt gtttggtgct taaggactat cccgccgaaa aggttggggg ggtgctgaac 3120 ccgtatcagc tcacagatca atttacttca ttcgcgaaga tgggaacgca gtcaggattt 3180 ctgttctacg ttccagcccc ttatacgtcg aaaattgacc ctcttacggg gttcgtggac 3240 ccctttgttt ggaaaacgat aaaaaaccac gagtcacgca agcactttct cgagggattt 3300 gattttcttc attatgatgt gaagaccggg gacttcattt tgcactttaa gatgaacagg 3360 aacttgtctt tccaaagggg cttgcctgga ttcatgccgg cctgggatat cgtgtttgaa 3420 aagaacgaaa cacagttcga tgcgaaaggg acgcccttca tagctggaaa gcgcatagtt 3480 ccagtgattg agaaccacag attcactggt cgctacagag acctgtatcc ggcaaatgaa 3540 ctgatagcac tccttgagga aaagggtatc gtgtttcgcg atggttcaaa tattctcccg 3600 aagcttttgg agaacgacga ttctcatgct atagatacta tggtcgctct catccggtcc 3660 gtccttcaaa tggccaattc gaatgcagcg accggtgagg attacataaa ttcaccagtc 3720 cgggacctta atggggtttg cttcgactcg cgctttcaaa accccgaatg gccaatggac 3780 gccgatgcta acggtgccta ccatatagca cttaaaggac agcttctgtt gaatcacctt 3840 aaagaatcaa aagaccttaa gctgcagaat ggaatttcaa atcaggattg gctcgcgtac 3900 atacaggagc ttcgcaat 3918 <210> 20 <211> 687 <212> DNA <213> Artificial Sequence <220> <223> APOBEC1 <400> 20 atgagctcag agactggccc agtggctgtg gaccccacat tgagacggcg gatcgagccc 60 catgagtttg aggtattctt cgatccgaga gagctccgca aggagacctg cctgctttac 120 gaaattaatt gggggggccg gcactccatt tggcgacata catcacagaa cactaacaag 180 cacgtcgaag tcaacttcat cgagaagttc acgacagaaa gatatttctg tccgaacaca 240 aggtgcagca ttacctggtt tctcagctgg agcccatgcg gcgaatgtag tagggccatc 300 actgaattcc tgtcaaggta tccccacgtc actctgttta tttacatcgc aaggctgtac 360 caccacgctg acccccgcaa tcgacaaggc ctgcgggatt tgatctcttc aggtgtgact 420 atccaaatta tgactgagca ggagtcagga tactgctgga gaaactttgt gaattatagc 480 ccgagtaatg aagcccactg gcctaggtat ccccatctgt gggtacgact gtacgttctt 540 gaactgtact gcatcatact gggcctgcct ccttgtctca acattctgag aaggaagcag 600 ccacagctga cattctttac catcgctctt cagtcttgtc attaccagcg actgccccca 660 cacattctct gggccaccgg gttgaaa 687 <210> 21 <211> 249 <212> DNA <213> Artificial Sequence <220> <223> UGI <400> 21 accaacctgt ccgacatcat cgagaaggaa acgggcaagc aactcgtgat ccaggagagc 60 atcctcatgc tgccagagga ggtggaggag gtcatcggca acaagccaga gtccgacatc 120 ctggtgcaca ccgcctacga cgagtccacc gacgagaacg tcatgctcct gaccagcgac 180 gccccagagt acaagccatg ggccctcgtc atccaggaca gcaacgggga gaacaagatc 240 aagatgctg 249 <210> 22 <211> 624 <212> DNA <213> Artificial Sequence <220> <223> PmCDA1 <400> 22 atgaccgacg ctgagtacgt gagaatccat gagaagttgg acatctacac gtttaagaaa 60 cagtttttca acaacaaaaa atccgtgtcg catagatgct acgttctctt tgaattaaaa 120 cgacggggtg aacgtagagc gtgtttttgg ggctatgctg tgaataaacc acagagcggg 180 acagaacgtg gcattcacgc cgaaatcttt agcattagaa aagtcgaaga atacctgcgc 240 gacaaccccg gacaattcac gataaattgg tactcatcct ggagtccttg tgcagattgc 300 gctgaaaaga tcttagaatg gtataaccag gagctgcggg ggaacggcca cactttgaaa 360 atctgggctt gcaaactcta ttacgagaaa aatgcgagga atcaaattgg gctgtggaac 420 ctcagagata acggggttgg gttgaatgta atggtaagtg aacactacca atgttgcagg 480 aaaatattca tccaatcgtc gcacaatcaa ttgaatgaga atagatggct tgagaagact 540 ttgaagcgag ctgaaaaacg acggagcgag ttgtccatta tgattcaggt aaaaatactc 600 cacaccacta agagtcctgc tgtt 624 <210> 23 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Protospacer sequence <400> 23 tgttacttct aaactacata 20 <210> 24 <211> 1307 <212> PRT <213> Acidaminococcus sp. BV3L6 <400> 24 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp 530 535 540 Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu 1010 1015 1020 Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly 1025 1030 1035 Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala 1040 1045 1050 Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro 1055 1060 1065 Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe 1070 1075 1080 Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu 1085 1090 1095 Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe 1100 1105 1110 Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly 1115 1120 1125 Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn 1130 1135 1140 Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys 1145 1150 1155 Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr 1160 1165 1170 Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu 1175 1180 1185 Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu 1190 1195 1200 Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu 1205 1210 1215 Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly 1220 1225 1230 Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp 1250 1255 1260 Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu 1265 1270 1275 Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile 1280 1285 1290 Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1295 1300 1305 <210> 25 <211> 670 <212> PRT <213> Arabidopsis thaliana <400> 25 Met Ala Ala Ala Thr Thr Thr Thr Thr Thr Ser Ser Ser Ile Ser Phe 1 5 10 15 Ser Thr Lys Pro Ser Pro Ser Ser Ser Lys Ser Pro Leu Pro Ile Ser 20 25 30 Arg Phe Ser Leu Pro Phe Ser Leu Asn Pro Asn Lys Ser Ser Ser Ser 35 40 45 Ser Arg Arg Arg Gly Ile Lys Ser Ser Ser Pro Ser Ser Ile Ser Ala 50 55 60 Val Leu Asn Thr Thr Thr Asn Val Thr Thr Thr Pro Ser Pro Thr Lys 65 70 75 80 Pro Thr Lys Pro Glu Thr Phe Ile Ser Arg Phe Ala Pro Asp Gln Pro 85 90 95 Arg Lys Gly Ala Asp Ile Leu Val Glu Ala Leu Glu Arg Gln Gly Val 100 105 110 Glu Thr Val Phe Ala Tyr Pro Gly Gly Ala Ser Met Glu Ile His Gln 115 120 125 Ala Leu Thr Arg Ser Ser Ser Ile Arg Asn Val Leu Pro Arg His Glu 130 135 140 Gln Gly Gly Val Phe Ala Ala Glu Gly Tyr Ala Arg Ser Ser Gly Lys 145 150 155 160 Pro Gly Ile Cys Ile Ala Thr Ser Gly Pro Gly Ala Thr Asn Leu Val 165 170 175 Ser Gly Leu Ala Asp Ala Leu Leu Asp Ser Val Pro Leu Val Ala Ile 180 185 190 Thr Gly Gln Val Pro Arg Arg Met Ile Gly Thr Asp Ala Phe Gln Glu 195 200 205 Thr Pro Ile Val Glu Val Thr Arg Ser Ile Thr Lys His Asn Tyr Leu 210 215 220 Val Met Asp Val Glu Asp Ile Pro Arg Ile Ile Glu Glu Ala Phe Phe 225 230 235 240 Leu Ala Thr Ser Gly Arg Pro Gly Pro Val Leu Val Asp Val Pro Lys 245 250 255 Asp Ile Gln Gln Gln Leu Ala Ile Pro Asn Trp Glu Gln Ala Met Arg 260 265 270 Leu Pro Gly Tyr Met Ser Arg Met Pro Lys Pro Pro Glu Asp Ser His 275 280 285 Leu Glu Gln Ile Val Arg Leu Ile Ser Glu Ser Lys Lys Pro Val Leu 290 295 300 Tyr Val Gly Gly Gly Cys Leu Asn Ser Ser Asp Glu Leu Gly Arg Phe 305 310 315 320 Val Glu Leu Thr Gly Ile Pro Val Ala Ser Thr Leu Met Gly Leu Gly 325 330 335 Ser Tyr Pro Cys Asp Asp Glu Leu Ser Leu His Met Leu Gly Met His 340 345 350 Gly Thr Val Tyr Ala Asn Tyr Ala Val Glu His Ser Asp Leu Leu Leu 355 360 365 Ala Phe Gly Val Arg Phe Asp Asp Arg Val Thr Gly Lys Leu Glu Ala 370 375 380 Phe Ala Ser Arg Ala Lys Ile Val His Ile Asp Ile Asp Ser Ala Glu 385 390 395 400 Ile Gly Lys Asn Lys Thr Pro His Val Ser Val Cys Gly Asp Val Lys 405 410 415 Leu Ala Leu Gln Gly Met Asn Lys Val Leu Glu Asn Arg Ala Glu Glu 420 425 430 Leu Lys Leu Asp Phe Gly Val Trp Arg Asn Glu Leu Asn Val Gln Lys 435 440 445 Gln Lys Phe Pro Leu Ser Phe Lys Thr Phe Gly Glu Ala Ile Pro Pro 450 455 460 Gln Tyr Ala Ile Lys Val Leu Asp Glu Leu Thr Asp Gly Lys Ala Ile 465 470 475 480 Ile Ser Thr Gly Val Gly Gln His Gln Met Trp Ala Ala Gln Phe Tyr 485 490 495 Asn Tyr Lys Lys Pro Arg Gln Trp Leu Ser Ser Gly Gly Leu Gly Ala 500 505 510 Met Gly Phe Gly Leu Pro Ala Ala Ile Gly Ala Ser Val Ala Asn Pro 515 520 525 Asp Ala Ile Val Val Asp Ile Asp Gly Asp Gly Ser Phe Ile Met Asn 530 535 540 Val Gln Glu Leu Ala Thr Ile Arg Val Glu Asn Leu Pro Val Lys Val 545 550 555 560 Leu Leu Leu Asn Asn Gln His Leu Gly Met Val Met Gln Trp Glu Asp 565 570 575 Arg Phe Tyr Lys Ala Asn Arg Ala His Thr Phe Leu Gly Asp Pro Ala 580 585 590 Gln Glu Asp Glu Ile Phe Pro Asn Met Leu Leu Phe Ala Ala Ala Cys 595 600 605 Gly Ile Pro Ala Ala Arg Val Thr Lys Lys Ala Asp Leu Arg Glu Ala 610 615 620 Ile Gln Thr Met Leu Asp Thr Pro Gly Pro Tyr Leu Leu Asp Val Ile 625 630 635 640 Cys Pro His Gln Glu His Val Leu Pro Met Ile Pro Ser Gly Gly Thr 645 650 655 Phe Asn Asp Val Ile Thr Glu Gly Asp Gly Arg Ile Lys Tyr 660 665 670 <210> 26 <211> 537 <212> PRT <213> Arabidopsis thaliana <400> 26 Met Glu Leu Ser Leu Leu Arg Pro Thr Thr Gln Ser Leu Leu Pro Ser 1 5 10 15 Phe Ser Lys Pro Asn Leu Arg Leu Asn Val Tyr Lys Pro Leu Arg Leu 20 25 30 Arg Cys Ser Val Ala Gly Gly Pro Thr Val Gly Ser Ser Lys Ile Glu 35 40 45 Gly Gly Gly Gly Thr Thr Ile Thr Thr Asp Cys Val Ile Val Gly Gly 50 55 60 Gly Ile Ser Gly Leu Cys Ile Ala Gln Ala Leu Ala Thr Lys His Pro 65 70 75 80 Asp Ala Ala Pro Asn Leu Ile Val Thr Glu Ala Lys Asp Arg Val Gly 85 90 95 Gly Asn Ile Ile Thr Arg Glu Glu Asn Gly Phe Leu Trp Glu Glu Gly 100 105 110 Pro Asn Ser Phe Gln Pro Ser Asp Pro Met Leu Thr Met Val Val Asp 115 120 125 Ser Gly Leu Lys Asp Asp Leu Val Leu Gly Asp Pro Thr Ala Pro Arg 130 135 140 Phe Val Leu Trp Asn Gly Lys Leu Arg Pro Val Pro Ser Lys Leu Thr 145 150 155 160 Asp Leu Pro Phe Phe Asp Leu Met Ser Ile Gly Gly Lys Ile Arg Ala 165 170 175 Gly Phe Gly Ala Leu Gly Ile Arg Pro Ser Pro Pro Gly Arg Glu Glu 180 185 190 Ser Val Glu Glu Phe Val Arg Arg Asn Leu Gly Asp Glu Val Phe Glu 195 200 205 Arg Leu Ile Glu Pro Phe Cys Ser Gly Val Tyr Ala Gly Asp Pro Ser 210 215 220 Lys Leu Ser Met Lys Ala Ala Phe Gly Lys Val Trp Lys Leu Glu Gln 225 230 235 240 Asn Gly Gly Ser Ile Ile Gly Gly Thr Phe Lys Ala Ile Gln Glu Arg 245 250 255 Lys Asn Ala Pro Lys Ala Glu Arg Asp Pro Arg Leu Pro Lys Pro Gln 260 265 270 Gly Gln Thr Val Gly Ser Phe Arg Lys Gly Leu Arg Met Leu Pro Glu 275 280 285 Ala Ile Ser Ala Arg Leu Gly Ser Lys Val Lys Leu Ser Trp Lys Leu 290 295 300 Ser Gly Ile Thr Lys Leu Glu Ser Gly Gly Tyr Asn Leu Thr Tyr Glu 305 310 315 320 Thr Pro Asp Gly Leu Val Ser Val Gln Ser Lys Ser Val Val Met Thr 325 330 335 Val Pro Ser His Val Ala Ser Gly Leu Leu Arg Pro Leu Ser Glu Ser 340 345 350 Ala Ala Asn Ala Leu Ser Lys Leu Tyr Tyr Pro Pro Val Ala Ala Val 355 360 365 Ser Ile Ser Tyr Pro Lys Glu Ala Ile Arg Thr Glu Cys Leu Ile Asp 370 375 380 Gly Glu Leu Lys Gly Phe Gly Gln Leu His Pro Arg Thr Gln Gly Val 385 390 395 400 Glu Thr Leu Gly Thr Ile Tyr Ser Ser Ser Leu Phe Pro Asn Arg Ala 405 410 415 Pro Pro Gly Arg Ile Leu Leu Leu Asn Tyr Ile Gly Gly Ser Thr Asn 420 425 430 Thr Gly Ile Leu Ser Lys Ser Glu Gly Glu Leu Val Glu Ala Val Asp 435 440 445 Arg Asp Leu Arg Lys Met Leu Ile Lys Pro Asn Ser Thr Asp Pro Leu 450 455 460 Lys Leu Gly Val Arg Val Trp Pro Gln Ala Ile Pro Gln Phe Leu Val 465 470 475 480 Gly His Phe Asp Ile Leu Asp Thr Ala Lys Ser Ser Leu Thr Ser Ser 485 490 495 Gly Tyr Glu Gly Leu Phe Leu Gly Gly Asn Tyr Val Ala Gly Val Ala 500 505 510 Leu Gly Arg Cys Val Glu Gly Ala Tyr Glu Thr Ala Ile Glu Val Asn 515 520 525 Asn Phe Met Ser Arg Tyr Ala Tyr Lys 530 535 <210> 27 <211> 444 <212> PRT <213> Arabidopsis thaliana <400> 27 Lys Ala Ser Glu Ile Val Leu Gln Pro Ile Arg Glu Ile Ser Gly Leu 1 5 10 15 Ile Lys Leu Pro Gly Ser Lys Ser Leu Ser Asn Arg Ile Leu Leu Leu 20 25 30 Ala Ala Leu Ser Glu Gly Thr Thr Val Val Asp Asn Leu Leu Asn Ser 35 40 45 Asp Asp Ile Asn Tyr Met Leu Asp Ala Leu Lys Arg Leu Gly Leu Asn 50 55 60 Val Glu Thr Asp Ser Glu Asn Asn Arg Ala Val Val Glu Gly Cys Gly 65 70 75 80 Gly Ile Phe Pro Ala Ser Ile Asp Ser Lys Ser Asp Ile Glu Leu Tyr 85 90 95 Leu Gly Asn Ala Gly Thr Ala Met Arg Pro Leu Thr Ala Ala Val Thr 100 105 110 Ala Ala Gly Gly Asn Ala Ser Tyr Val Leu Asp Gly Val Pro Arg Met 115 120 125 Arg Glu Arg Pro Ile Gly Asp Leu Val Val Gly Leu Lys Gln Leu Gly 130 135 140 Ala Asp Val Glu Cys Thr Leu Gly Thr Asn Cys Pro Pro Val Arg Val 145 150 155 160 Asn Ala Asn Gly Gly Leu Pro Gly Gly Lys Val Lys Leu Ser Gly Ser 165 170 175 Ile Ser Ser Gln Tyr Leu Thr Ala Leu Leu Met Ser Ala Pro Leu Ala 180 185 190 Leu Gly Asp Val Glu Ile Glu Ile Val Asp Lys Leu Ile Ser Val Pro 195 200 205 Tyr Val Glu Met Thr Leu Lys Leu Met Glu Arg Phe Gly Val Ser Val 210 215 220 Glu His Ser Asp Ser Trp Asp Arg Phe Phe Val Lys Gly Gly Gln Lys 225 230 235 240 Tyr Lys Ser Pro Gly Asn Ala Tyr Val Glu Gly Asp Ala Ser Ser Ala 245 250 255 Ser Tyr Phe Leu Ala Gly Ala Ala Ile Thr Gly Glu Thr Val Thr Val 260 265 270 Glu Gly Cys Gly Thr Thr Ser Leu Gln Gly Asp Val Lys Phe Ala Glu 275 280 285 Val Leu Glu Lys Met Gly Cys Lys Val Ser Trp Thr Glu Asn Ser Val 290 295 300 Thr Val Thr Gly Pro Pro Arg Asp Ala Phe Gly Met Arg His Leu Arg 305 310 315 320 Ala Ile Asp Val Asn Met Asn Lys Met Pro Asp Val Ala Met Thr Leu 325 330 335 Ala Val Val Ala Leu Phe Ala Asp Gly Pro Thr Thr Ile Arg Asp Val 340 345 350 Ala Ser Trp Arg Val Lys Glu Thr Glu Arg Met Ile Ala Ile Cys Thr 355 360 365 Glu Leu Arg Lys Leu Gly Ala Thr Val Glu Glu Gly Ser Asp Tyr Cys 370 375 380 Val Ile Thr Pro Pro Lys Lys Val Lys Thr Ala Glu Ile Asp Thr Tyr 385 390 395 400 Asp Asp His Arg Met Ala Met Ala Phe Ser Leu Ala Ala Cys Ala Asp 405 410 415 Val Pro Ile Thr Ile Asn Asp Pro Gly Cys Thr Arg Lys Thr Phe Pro 420 425 430 Asp Tyr Phe Gln Val Leu Glu Arg Ile Thr Lys His 435 440 <210> 28 <211> 534 <212> PRT <213> Amaranthus tuberculatus <400> 28 Met Val Ile Gln Ser Ile Thr His Leu Ser Pro Asn Leu Ala Leu Pro 1 5 10 15 Ser Pro Leu Ser Val Ser Thr Lys Asn Tyr Pro Val Ala Val Met Gly 20 25 30 Asn Ile Ser Glu Arg Glu Glu Pro Thr Ser Ala Lys Arg Val Ala Val 35 40 45 Val Gly Ala Gly Val Ser Gly Leu Ala Ala Ala Tyr Lys Leu Lys Ser 50 55 60 His Gly Leu Ser Val Thr Leu Phe Glu Ala Asp Ser Arg Ala Gly Gly 65 70 75 80 Lys Leu Lys Thr Val Lys Lys Asp Gly Phe Ile Trp Asp Glu Gly Ala 85 90 95 Asn Thr Met Thr Glu Ser Glu Ala Glu Val Ser Ser Leu Ile Asp Asp 100 105 110 Leu Gly Leu Arg Glu Lys Gln Gln Leu Pro Ile Ser Gln Asn Lys Arg 115 120 125 Tyr Ile Ala Arg Asp Gly Leu Pro Val Leu Leu Pro Ser Asn Pro Ala 130 135 140 Ala Leu Leu Thr Ser Asn Ile Leu Ser Ala Lys Ser Lys Leu Gln Ile 145 150 155 160 Met Leu Glu Pro Phe Leu Trp Arg Lys His Asn Ala Thr Glu Leu Ser 165 170 175 Asp Glu His Val Gln Glu Ser Val Gly Glu Phe Phe Glu Arg His Phe 180 185 190 Gly Lys Glu Phe Val Asp Tyr Val Ile Asp Pro Phe Val Ala Gly Thr 195 200 205 Cys Gly Gly Asp Pro Gln Ser Leu Ser Met His His Thr Phe Pro Glu 210 215 220 Val Trp Asn Ile Glu Lys Arg Phe Gly Ser Val Phe Ala Gly Leu Ile 225 230 235 240 Gln Ser Thr Leu Leu Ser Lys Lys Glu Lys Gly Gly Glu Asn Ala Ser 245 250 255 Ile Lys Lys Pro Arg Val Arg Gly Ser Phe Ser Phe Gln Gly Gly Met 260 265 270 Gln Thr Leu Val Asp Thr Met Cys Lys Gln Leu Gly Glu Asp Glu Leu 275 280 285 Lys Leu Gln Cys Glu Val Leu Ser Leu Ser Tyr Asn Gln Lys Gly Ile 290 295 300 Pro Ser Leu Gly Asn Trp Ser Val Ser Ser Met Ser Asn Asn Thr Ser 305 310 315 320 Glu Asp Gln Ser Tyr Asp Ala Val Val Val Thr Ala Pro Ile Arg Asn 325 330 335 Val Lys Glu Met Lys Ile Met Lys Phe Gly Asn Pro Phe Ser Leu Asp 340 345 350 Phe Ile Pro Glu Val Thr Tyr Val Pro Leu Ser Val Met Ile Thr Ala 355 360 365 Phe Lys Lys Asp Lys Val Lys Arg Pro Leu Glu Gly Phe Gly Val Leu 370 375 380 Ile Pro Ser Lys Glu Gln His Asn Gly Leu Lys Thr Leu Gly Thr Leu 385 390 395 400 Phe Ser Ser Met Met Phe Pro Asp Arg Ala Pro Ser Asp Met Cys Leu 405 410 415 Phe Thr Thr Phe Val Gly Gly Ser Arg Asn Arg Lys Leu Ala Asn Ala 420 425 430 Ser Thr Asp Glu Leu Lys Gln Ile Val Ser Ser Asp Leu Gln Gln Leu 435 440 445 Leu Gly Thr Glu Asp Glu Pro Ser Phe Val Asn His Leu Phe Trp Ser 450 455 460 Asn Ala Phe Pro Leu Tyr Gly His Asn Tyr Asp Ser Val Leu Arg Ala 465 470 475 480 Ile Asp Lys Met Glu Lys Asp Leu Pro Gly Phe Phe Tyr Ala Gly Asn 485 490 495 His Lys Gly Gly Leu Ser Val Gly Lys Ala Met Ala Ser Gly Cys Lys 500 505 510 Ala Ala Glu Leu Val Ile Ser Tyr Leu Asp Ser His Ile Tyr Val Lys 515 520 525 Met Asp Glu Lys Thr Ala 530

Claims

전이유전자성 선별 마커 서열 (transgenic selectable marker sequence)의 안정적인 통합없이, 하나 이상의 변형된 식물 세포, 또는 하나 이상의 변형된 식물 세포를 포함하는 하나 이상의 변형된 식물 조직, 기관 또는 완전한 식물 (whole plant)을 단리하는 방법으로서,
상기 방법은,
a. 하나 이상의 제1 타겟화된 염기 변형을, 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에 도입하는 단계로서, 상기 하나 이상의 타겟화된 염기 변형이 하나 이상의 표현형으로 선별가능한 형질 (phenotypically selectable trait)의 발현을 유발하는, 단계;
b. 하나 이상의 제2 타겟화된 변형을, 변형할 하나 이상의 식물 세포의 제2 식물 게놈 타겟 부위에 도입하는 단계로서, 상기 하나 이상의 제2 타겟화된 변형이 하나 이상의 부위-특이적인 작동자 (site-specific effector)를 이용해 도입되어 제2 식물 게놈 타겟 부위에 하나 이상의 제2 타겟화된 변형이 달성되고, 상기 하나 이상의 제1 타겟화된 염기 변형의 도입과 동시에 또는 후속적으로, 상기 하나 이상의 제2 타겟화된 변형이, 변형할 동일한 하나 이상의 식물 세포에, 또는 상기 하나 이상의 제1 타겟화된 변형을 포함하는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물에 도입되어 하나 이상의 변형된 식물 세포가 수득되는, 단계; 및
c. i. 상기 제1 식물 게놈 타겟 부위에서 상기 하나 이상의 제1 타겟화된 염기 변형에 의해 유발된 하나 이상의 표현형으로 선별가능한 형질을 선별하고, 선택적으로,
ii. 상기 제2 식물 게놈 타겟 부위에서 상기 하나 이상의 제2 타겟화된 변형을 추가로 선별함으로써.
하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 단리하거나, 또는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물을 단리하는 단계를 포함하는, 방법.
제1항에 있어서,
상기 단계 b가 복구 주형을 도입하여 적어도 상기 제2 식물 게놈 타겟 부위에 타겟화된 서열 변환 또는 치환을 만드는 단계를 더 포함하는, 방법.
제1항에 있어서,
d. 상기 하나 이상의 제1 타겟화된 변형 및 상기 하나 이상의 제2 타겟화된 변형을 포함하는 하나 이상의 변형된 식물 또는 식물 물질을, 추가의 대상 식물 또는 식물 물질과 교배하여, 수득되는 자손 식물 또는 식물 물질을 분리 (segregation)함으로써, 대상 유전자형, 선택적으로 하나 이상의 제1 타겟화된 변형을 포함하지 않는 대상 유전자형을 달성하는 단계를 더 포함하는, 방법.
제1항에 있어서,
상기 하나 이상의 부위-특이적인 작동자가 하나 이상의 염기 편집 복합체에 일시적으로 또는 영구적으로 연결되고, 상기 염기 편집 복합체가 단계 a의 하나 이상의 제1 타겟화된 염기 변형을 매개하는, 방법.
제1항에 있어서,
하나 이상의 부위-특이적인 작동자가 Cas 또는 Cpf1 뉴클레아제를 포함하는 CRISPR 뉴클레아제, TALEN, ZFN, 메가뉴클레아제, 아르고너트 (Argonaute) 뉴클레아제, FokI 또는 이의 변이체를 포함하는 제한 엔도뉴클레아제, 재조합효소 또는 2 부위-특이적인 닉킹 엔도뉴클레아제 (two site-specific nicking endonucleases), 또는 염기 편집기, 또는 이들 작동자의 임의 변이체 또는 촉매학적으로 활성인 단편을 포함하는, 하나 이상의 뉴클레아제로부터 선택되는, 방법.
제1항에 있어서,
상기 하나 이상의 부위-특이적인 작동자가 CRISPR-기반의 뉴클레아제이고, 상기 CRISPR-기반의 뉴클레아제는 하나 이상의 염기 편집 복합체에 대한 (directing) 부위-특이적인 DNA 결합 도메인을 포함하고, 상기 하나 이상의 CRISPR-기반의 뉴클레아제 또는 이를 코딩하는 핵산 서열이
a. SpCas9, SaCas9, SaKKH-Cas9, VQR-Cas9, St1Cas9를 포함하는, Cas9,
b. AsCpf1, LbCpf1, FnCpf1을 포함하는, Cpf1,
c. CasX, 또는
d. CasY
또는 상기 CRISPR-기반의 뉴클레아제의 임의 변이체 또는 유도체를 포함하는 군으로부터 선택되고, 바람직하게는, 상기 하나 이상의 CRISPR-기반의 뉴클레아제는 해당 야생형 서열과 비교해 돌연변이를 포함하므로, 형성되는 CRISPR-기반의 뉴클레아제는 단일 가닥 특이적인 DNA 닉카제로 또는 모든 DNA 절단력이 결핍된 DNA 결합 작동자로 변환되는, 방법.
제1항에 있어서,
상기 하나 이상의 제1 타겟화된 염기 변형이 구성성분으로서 하나 이상의 염기 편집기를 포함하는 하나 이상의 염기 편집 복합체에 의해 수행되는, 방법.
제7항에 있어서,
상기 염기 편집 복합체가 하나 이상의 시티딘 데아미나제 또는 이의 촉매학적으로 활성인 단편을 포함하는, 방법.
제7항에 있어서,
상기 하나 이상의 제1 타겟화된 염기 변형은, 뉴클레오티드 C, A, T 또는 G가 다른 뉴클레오티드로 변환되는 것인, 방법.
제7항에 있어서,
상기 염기 편집 복합체가 APOBEC1 구성성분을 포함하는, 방법.
제7항에 있어서,
상기 염기 편집 복합체가 UGI 구성성분을 포함하거나, 및/또는 상기 염기 편집 복합체가 XTEN 구성성분을 포함하는, 방법.
제7항에 있어서,
상기 염기 편집 복합체가 PmCDA1 구성성분을 포함하는, 방법.
제7항에 있어서,
상기 하나 이상의 염기 편집 복합체가 구성성분을 2개 이상 포함하고, 상기 2개 이상의 구성성분이 물리적으로 연결된, 방법.
제7항에 있어서,
상기 하나 이상의 염기 편집 복합체가 구성성분을 2개 이상 포함하고, 상기 2개 이상의 구성성분이 개별 구성성분으로서 제공되는, 방법.
제7항에 있어서,
상기 하나 이상의 염기 편집 복합체의 하나 이상의 구성성분이 상기 하나 이상의 염기 편집 복합체를 세포내 소기관으로 타겟화하기 위한 하나 이상의 소기관 위치화 신호 (organelle localization signal)를 포함하는, 방법.
제15항에 있어서,
상기 하나 이상의 소기관 위치화 신호가 핵 위치화 신호 (NLS)인, 방법.
제15항에 있어서,
상기 하나 이상의 소기관 위치화 신호가 엽록체 수송 펩타이드인, 방법.
제15항에 있어서,
상기 하나 이상의 소기관 위치화 신호가 미토콘드리아 수송 펩타이드인, 방법.
제1항에 있어서,
상기 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위가 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 게놈 타겟 부위이고, 상기 하나 이상의 표현형으로 선별가능한 형질은 내성/허용성 형질 또는 생장 우세 (growth advantage) 형질이고, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형이 하나 이상의 변형된 식물 세포, 조직 또는 식물, 또는 그 자손에 부가될 화합물 또는 촉발제에 대해 내성/허용성 또는 생장 우세를 부여하는, 방법.
제19항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 대상 형질이 하나 이상의 내인성 유전자이거나 또는 이에 의해 코딩되거나, 또는 상기 하나 이상의 대상 표현형 형질이 하나 이상의 전이유전자이거나 또는 이에 의해 코딩되고, 여기서 상기 하나 이상의 내인성 유전자 또는 하나 이상의 전이유전자가, 하나 이상의 대상 표현형 형질에서 하나 이상의 변형이 결핍된 세포를 저해, 손상 또는 사멸시키는, 식물독소, 바람직하게는 제초제에 대한 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형 형질을 코딩하거나, 또는 상기 하나 이상의 표현형 형질이 세포 분열; 증식 속도; 배발생 (embryogenesis); 또는 비-변형된 세포, 조직, 기관 또는 식물과 비교해 변형된 세포, 조직, 기관 또는 식물에 이점을 제공하는 다른 표현형으로 선별가능한 특성의 부스터 (booster)로 이루어진 군으로부터 선택되는, 방법.
제19항에 있어서,
상기 하나 이상의 제1 식물 게놈 타겟 부위가 제초제 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 하나 이상의 내인성 유전자 또는 전이유전자이고, 여기서 상기 제초제 내성/허용성이 글리포세이트를 포함하는 EPSPS-저해제에 대한 내성/허용성, 글루포시네이트를 포함하는 글루타민 합성 저해제에 대한 내성/허용성, 이미다졸린 또는 설포닐우레아를 포함하는 ALS- 또는 AHAS-저해제에 대한 내성/허용성, 아릴옥시페녹시프로피오네이트 (FOP)를 포함하는 ACCase 저해제에 대한 내성/허용성, 피토엔 데세투라제 (phytoene desaturase) 단계에서 카로티노이드 생합성의 저해제, 4-하이드록시페닐-피루베이트-다이옥시게나제 (HPPD)의 저해제 또는 기타 카로티노이드 생합성 타겟의 저해제를 포함하는 카로티노이드 생합성 저해제에 대한 내성/허용성, 셀룰로스 저해제에 대한 내성/허용성, 지질 합성 저해제에 대한 내성/허용성, 장쇄 지방산 저해제에 대한 내성/허용성, 미소관 조립 저해제 (microtubule assembly inhibitor)에 대한 내성/허용성, 광화학계 I 전자 전환체 (photosystem I electron diverter)에 대한 내성/허용성, 카바메이트, 트리아진 및 트리아지논을 포함하는 광화학계 II 저해제에 대한 내성/허용성, PPO-저해제에 대한 내성/허용성 및 디캄바 (2,4-다이클로로페녹시아세트산)를 포함하는 합성 옥신에 대한 내성/허용성으로 이루어진 군으로부터 선택되는, 방법.
제19항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 식물독성 내성/허용성 형질, 바람직하게는 제초제 내성/허용성 형질이고, 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형이 식물독성 화합물, 바람직하게는 제초제에 대한 내성/허용성을 부여하며, 상기 화합물이 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물, 또는 그 자손에 부가될 외인성 화합물인, 방법.
제19항에 있어서,
상기 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위가 ALS인, 방법.
제19항에 있어서,
상기 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위가 PPO인, 방법.
제19항에 있어서,
상기 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위가 EPSPS, ALS 또는 PPO이고, 상기 EPSPS, ALS 또는 PPO가 하나 이상의 핵산 변환을 포함하여 하나 이상의 대응되는 아미노산 변환이 이루어지고, 상기 하나 이상의 핵산 변환이 하나 이상의 염기 편집기에 의해 수행되는, 방법.
제23항에 있어서,
상기 타겟화된 변형이 서열번호 25에 따른 ALS 참조 서열과 비교해 A122를 코딩하는 서열에서 이루어지는, 방법.
제23항에 있어서,
상기 타겟화된 변형이 서열번호 25에 따른 ALS 참조 서열과 비교해 P197을 코딩하는 서열에서 이루어지는, 방법.
제23항에 있어서,
상기 타겟화된 변형이 서열번호 25에 따른 ALS 참조 서열과 비교해 A205를 코딩하는 서열에서 이루어지는, 방법.
제23항에 있어서,
상기 타겟화된 변형이 서열번호 25에 따른 ALS 참조 서열과 비교해 D376을 코딩하는 서열에서 이루어지는, 방법.
제23항에 있어서,
상기 타겟화된 변형이 서열번호 25에 따른 ALS 참조 서열과 비교해 R377을 코딩하는 서열에서 이루어지는, 방법.
제23항에 있어서,
상기 타겟화된 변형이 서열번호 25에 따른 ALS 참조 서열과 비교해 W574를 코딩하는 서열에서 이루어지는, 방법.
제23항에 있어서,
상기 타겟화된 변형이 서열번호 25에 따른 ALS 참조 서열과 비교해 S653을 코딩하는 서열에서 이루어지는, 방법.
제23항에 있어서,
상기 타겟화된 변형이 서열번호 25에 따른 ALS 참조 서열과 비교해 G654를 코딩하는 서열에서 이루어지는, 방법.
제24항에 있어서,
상기 타겟화된 변형이 서열번호 26에 따른 PPO 참조 서열과 비교해 C215를 코딩하는 서열에서 이루어지는, 방법.
제24항에 있어서,
상기 타겟화된 변형이 서열번호 26에 따른 PPO 참조 서열과 비교해 A220을 코딩하는 서열에서 이루어지는, 방법.
제24항에 있어서,
상기 타겟화된 변형이 서열번호 26에 따른 PPO 참조 서열과 비교해 G221을 코딩하는 서열에서 이루어지는, 방법.
제24항에 있어서,
상기 타겟화된 변형이 서열번호 26에 따른 PPO 참조 서열과 비교해 N425를 코딩하는 서열에서 이루어지는, 방법.
제24항에 있어서,
상기 타겟화된 변형이 서열번호 26에 따른 PPO 참조 서열과 비교해 Y426 또는 I475를 코딩하는 서열에서 이루어지는, 방법.
제25항에 있어서,
상기 타겟화된 변형이 서열번호 27에 따른 EPSPS 참조 서열과 비교해 G101 및 G144를 코딩하는 서열에서 이루어지는, 방법.
제25항에 있어서,
상기 타겟화된 변형이 서열번호 27에 따른 EPSPS 참조 서열과 비교해 G101 및 A192를 코딩하는 서열에서 이루어지는, 방법.
제25항에 있어서,
상기 타겟화된 변형이 서열번호 27에 따른 EPSPS 참조 서열과 비교해 T102 및 P106을 코딩하는 서열에서 이루어지는, 방법.
제1항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 동정 또는 단리하는데 유용한 가시적인 표현형 (visible phenotype)인, 방법.
제42항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 광택 (glossy) 표현형인, 방법.
제42항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 골든 (golden) 표현형인, 방법.
제42항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 색소 (pigmentation) 표현형 또는 생장 우세 표현형인, 방법.
제1항에 있어서,
상기 변형할 하나 이상의 식물 세포가 바람직하게는 호르데움 불가리 (Hordeum vulgare), 호르데움 불부숨 (Hordeum bulbusom), 소르굼 비콜러 (Sorghum bicolor), 사카룸 오피시나리움 (Saccharum officinarium), 지 메이스 (Zea mays) 등의 지 spp. (Zea spp .), 세타리아 이탈리카 (Setaria italica), 오리자 미누타 (Oryza minuta), 오리자 사티바 (Oriza sativa), 오리자 아우스트랄리엔시스 (Oryza australiensis), 오리자 알타 (Oryza alta), 트리티쿰 에이스티붐 (Triticum aestivum), 트리티쿰 두럼 (Triticum durum), 세칼레 세레알레 (Secale cereale), 트리티칼레 (Triticale), 말루스 도메스티카 (Malus domestica), 브라키포듐 디스타키온 (Brachypodium distachyon), 호르데움 마리눔 (Hordeum marinum), 에이길롭스 타우치이 (Aegilops tauschii), 다우쿠스 글로키디아투스 (Daucus glochidiatus), 베타 불가리스 (Beta vulgaris) 등의 베타 spp., 다우쿠스 푸실루스 (Daucus pusillus), 다우쿠스 무리카투스 (Daucus muricatus), 다우쿠스 카로타 (Daucus carota), 유칼립투스 그란디스 (Eucalyptus grandis), 니코티아나 실베스트리스 (Nicotiana sylvestris), 니코티아나 토멘토시포르미스 (Nicotiana tomentosiformis), 니코티아나 타바쿰 (Nicotiana tabacum), 니코티아나 벤타미아나 (Nicotiana benthamiana), 솔라눔 라이코퍼시쿰 (Solanum lycopersicum), 솔라눔 투베로숨 (Solanum tuberosum), 코페아 카네포라 (Coffea canephora), 비티스 비니페라 (Vitis vinifera), 에리트란테 구타타 (Erythrante guttata), 겐리시아 아우레아 (Genlisea aurea), 쿠쿠미스 사티부스 (Cucumis sativus), 마루스 노타빌리스 (Marus notabilis), 아라비돕시스 아레노사 (Arabidopsis arenosa), 아라비돕시스 라이라타 (Arabidopsis lyrata), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 크루시히말라야 히말라이카 (Crucihimalaya himalaica), 크루시히말라야 발리치이 (Crucihimalaya wallichii), 카르다민 넥수오사 (Cardamine nexuosa), 레피디움 비르기니쿰 (Lepidium virginicum), 캡셀라 부르사 파스토리스 (Capsella bursa pastoris), 올마라비돕시스 푸밀라 (Olmarabidopsis pumila), 아라비스 히르수테 (Arabis hirsute), 브라씨카 나푸스 (Brassica napus), 브라씨카 올레라시아 (Brassica oleracea), 브라씨카 라파 (Brassica rapa), 라파누스 사티부스 (Raphanus sativus), 브라씨카 준카시아 (Brassica juncacea), 브라씨카 니그라 (Brassica nigra), 에루카 베시카리아 아종 사티바 (Eruca vesicaria subsp . sativa), 시트러스 시넨시스 (Citrus sinensis), 자트로파 쿠르카스 (Jatropha curcas), 포풀루스 트리코카르파 (Populus trichocarpa), 메디카고 트룬카툴라 (Medicago truncatula), 시져 야마시타 (Cicer yamashitae), 시져 비주굼 (Cicer bijugum), 시져 아리에티눔 (Cicer arietinum), 시져 레티쿨라툼 (Cicer reticulatum), 시져 주다이쿰 (Cicer judaicum), 카야누스 카자니폴리우스 (Cajanus cajanifolius), 카야누스 스카라바에오이데스 (Cajanus scarabaeoides), 파세올루스 불가리스 (Phaseolus vulgaris), 글리신 맥스 (Glycine max), 고씨퓸 (Gossypium sp .), 아스트라갈루스 시니쿠스 (Astragalus sinicus), 로투스 자포니카스 (Lotus japonicas), 토레니아 포우르니에리 (Torenia fournieri), 알리움 세파 (Allium cepa), 알리움 피스툴로숨 (Allium fistulosum), 알리움 사티붐 (Allium sativum), 헬리안투스 안누스 (Helianthus annuus), 헬리안투스 투베로수스 (Helianthus tuberosus) 및 알리움 투베로숨 (Allium tuberosum), 또는 상기 식물들 중 하나에 속하는 품종 또는 아종으로 이루어진 군으로부터 선택되는 식물로부터 유래되는, 방법.
전이유전자성 선별 마커 서열의 안정적인 통합없이, 하나 이상의 변형된 식물 세포, 또는 하나 이상의 변형된 식물 세포를 포함하는 하나 이상의 변형된 식물 조직, 기관 또는 완전한 식물을 단리하는 방법으로서,
상기 방법은
a. 하나 이상의 제1 타겟화된 코돈 결손 변형을, 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에, 뉴클레아제, 재조합효소 또는 DNA 변형 물질을 포함하는 하나 이상의 제1 부위-특이적인 작동자를 이용해 도입하는 단계로서, 상기 하나 이상의 타겟화된 코돈 결손 변형이 하나 이상의 표현형으로 선별가능한 형질의 발현을 유발하는, 단계;
b. 하나 이상의 제2 타겟화된 변형을, 변형할 하나 이상의 식물 세포의 제2 식물 게놈 타겟 부위에 도입하는 단계로서, 상기 하나 이상의 제2 타겟화된 변형이 하나 이상의 제2 부위-특이적인 작동자를 이용해 도입되어 제2 식물 게놈 타겟 부위에 하나 이상의 제2 타겟화된 변형이 달성되고, 상기 하나 이상의 제1 타겟화된 염기 변형의 도입과 동시에 또는 후속적으로, 하나 이상의 상기 제2 타겟화된 변형이 변형할 동일한 하나 이상의 식물 세포에, 또는 상기 하나 이상의 제1 타겟화된 변형을 포함하는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물에 도입되어 하나 이상의 변형된 식물 세포가 수득되는, 단계; 및
c. i. 상기 제1 식물 게놈 타겟 부위에서 상기 하나 이상의 제1 타겟화된 코돈 결손 변형에 의해 유발된 하나 이상의 표현형으로 선별가능한 형질을 선별하고, 선택적으로,
ii. 상기 제2 식물 게놈 타겟 부위에서 상기 하나 이상의 제2 타겟화된 변형을 추가로 선별함으로써,
하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 단리하거나, 또는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물을 단리하는 단계;
선택적으로,
d. 상기 하나 이상의 제1 타겟화된 변형 및 상기 하나 이상의 제2 타겟화된 변형을 포함하는 하나 이상의 변형된 식물 또는 식물 물질을, 추가의 대상 식물 또는 식물 물질과 교배하여, 수득되는 자손 식물 또는 식물 물질을 분리함으로써, 대상 유전자형, 선택적으로 하나 이상의 제1 타겟화된 변형을 포함하지 않는 대상 유전자형을 달성하는 단계를 포함하는, 방법.
제47항에 있어서,
단계 b는 바람직하게는 복구 주형을 도입하여 하나 이상의 제1 및/또는 제2 식물 게놈 타겟 부위에 타겟화된 서열 변환 또는 치환을 만드는 단계를 더 포함하는, 방법.
제47항에 있어서,
상기 하나 이상의 부위-특이적인 작동자가 Cas 또는 Cpf1 뉴클레아제를 포함하는 CRISPR 뉴클레아제, TALEN, ZFN, 메가뉴클레아제, 아르고너트 (Argonaute) 뉴클레아제, FokI 또는 이의 변이체를 포함하는 제한 엔도뉴클레아제, 재조합효소 또는 2 부위-특이적인 닉킹 엔도뉴클레아제, 또는 이들 작동자의 임의 변이체 또는 촉매학적으로 활성인 단편 중 하나 이상으로부터 선택되는, 방법.
제47항에 있어서,
상기 하나 이상의 부위-특이적인 작동자가 CRISPR-기반의 뉴클레아제이고, 상기 CRISPR-기반의 뉴클레아제는 부위-특이적인 DNA 결합 도메인을 포함하고, 상기 하나 이상의 CRISPR-기반의 뉴클레아제 또는 이를 코딩하는 핵산 서열이
a. SpCas9, SaCas9, SaKKH-Cas9, VQR-Cas9, St1Cas9를 포함하는, Cas9,
b. AsCpf1, LbCpf1, FnCpf1을 포함하는, Cpf1,
c. CasX, 또는
d. CasY
또는 상기한 CRISPR-기반의 뉴클레아제의 임의 변이체 또는 유도체를 포함하는 군으로부터 선택되고, 선택적으로, 상기 하나 이상의 CRISPR-기반의 뉴클레아제가 해당 야생형 서열과 비교해 돌연변이를 포함하므로, 형성되는 CRISPR-기반의 뉴클레아제는 단일 가닥 특이적인 DNA 닉카제로 또는 모든 DNA 절단력이 결핍된 DNA 결합 작동자로 변환되는, 방법.
제47항에 있어서,
상기 적어도 부위-특이적인 작동자, 또는 상기 하나 이상의 부위-특이적인 작동자를 포함하는 복합체의 하나 이상의 구성성분이, 하나 이상의 염기 편집 복합체를 세포내 소기관으로의 타겟화하기 위한 하나 이상의 소기관 위치화 신호를 포함하는, 방법.
제51항에 있어서,
상기 하나 이상의 소기관 위치화 신호가 핵 위치화 신호 (NLS)인, 방법.
제51항에 있어서,
상기 하나 이상의 소기관 위치화 신호가 엽록체 수송 펩타이드인, 방법.
제51항에 있어서,
상기 하나 이상의 소기관 위치화 신호가 미토콘드리아 수송 펩타이드인, 방법.
제47항에 있어서,
상기 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위가 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 게놈 타겟 부위이고, 상기 하나 이상의 표현형으로 선별가능한 형질은 내성/허용성 형질 또는 생장 우세 형질이고, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형이 하나 이상의 변형된 식물 세포, 조직 또는 식물, 또는 그 자손에 부가될 화합물 또는 촉발제에 대해 내성/허용성 또는 생장 우세를 부여하는, 방법.
제47항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 대상 형질이 하나 이상의 내인성 유전자이거나 또는 이에 의해 코딩되거나, 또는 상기 하나 이상의 대상 표현형 형질이 하나 이상의 전이유전자이거나 또는 이에 의해 코딩되고, 여기서 상기 하나 이상의 내인성 유전자 또는 하나 이상의 전이유전자가, 하나 이상의 대상 표현형 형질에 하나 이상의 변형이 결핍된 세포를 저해, 손상 또는 사멸시키는, 식물독소, 바람직하게는 제초제에 대한 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형 형질을 코딩하거나, 또는 상기 하나 이상의 표현형 형질이 세포 분열; 증식 속도; 배발생; 또는 비-변형된 세포, 조직, 기관 또는 식물과 비교해 변형된 세포, 조직, 기관 또는 식물에 이점을 제공하는 다른 표현형으로 선별가능한 특성의 부스터 (booster)로 이루어진 군으로부터 선택되는, 방법.
제47항에 있어서,
상기 하나 이상의 제1 식물 게놈 타겟 부위가 제초제 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 하나 이상의 내인성 유전자 또는 전이유전자이고, 여기서 상기 제초제 내성/허용성이 글리포세이트를 포함하는 EPSPS-저해제에 대한 내성/허용성, 글루포시네이트를 포함하는 글루타민 합성 저해제에 대한 내성/허용성, 이미다졸린 또는 설포닐우레아를 포함하는 ALS- 또는 AHAS-저해제에 대한 내성/허용성, 아릴옥시페녹시프로피오네이트 (FOP)를 포함하는 ACCase 저해제에 대한 내성/허용성, 피토엔 데세투라제 (phytoene desaturase) 단계에서 카로티노이드 생합성의 저해제, 4-하이드록시페닐-피루베이트-다이옥시게나제 (HPPD)의 저해제 또는 기타 카로티노이드 생합성 타겟의 저해제를 포함하는 카로티노이드 생합성 저해제에 대한 내성/허용성, 셀룰로스 저해제에 대한 내성/허용성, 지질 합성 저해제에 대한 내성/허용성, 장쇄 지방산 저해제에 대한 내성/허용성, 미소관 조립 저해제 (microtubule assembly inhibitor)에 대한 내성/허용성, 광화학계 I 전자 전환체 (photosystem I electron diverter)에 대한 내성/허용성, 카바메이트, 트리아진 및 트리아지논을 포함하는 광화학계 II 저해제에 대한 내성/허용성, PPO-저해제에 대한 내성/허용성 및 디캄바 (2,4-다이클로로페녹시아세트산)를 포함하는 합성 옥신에 대한 내성/허용성으로 이루어진 군으로부터 선택되는, 방법.
제47항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 식물독성 내성/허용성 형질, 바람직하게는 제초제 내성/허용성 형질이고, 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 코돈 결손 변형이 식물독성 화합물, 바람직하게는 제초제에 대해 내성/허용성을 부여하며, 상기 화합물이 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물, 또는 그 자손에 부가될 외인성 화합물인, 방법.
제58항에 있어서,
상기 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위가 선별 목적으로 아마란투스 투베르쿨라투스 (Amaranthus tuberculatus) 유래의 PPX2L 유전자 산물의 상동체 (homolog)인, 방법.
제59항에 있어서,
상기 하나 이상의 제1 타겟화된 코돈 결손 변형이 서열번호 28에 따른 아마란투스 투베르쿨라투스 (Amaranthus tuberculatus) 유래의 PPX2L 유전자 산물의 G210 잔기에 상응하는 위치에서 이루어지는, 방법.
제47항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 동정 또는 단리하는데 유용한 가시적인 표현형인, 방법.
제47항에 있어서,
상기 변형할 하나 이상의 식물 세포가 바람직하게는 호르데움 불가리 (Hordeum vulgare), 호르데움 불부숨 (Hordeum bulbusom), 소르굼 비콜러 (Sorghum bicolor), 사카룸 오피시나리움 (Saccharum officinarium), 지 메이스 (Zea mays) 등의 지 spp. (Zea spp .), 세타리아 이탈리카 (Setaria italica), 오리자 미누타 (Oryza minuta), 오리자 사티바 (Oriza sativa), 오리자 아우스트랄리엔시스 (Oryza australiensis), 오리자 알타 (Oryza alta), 트리티쿰 에이스티붐 (Triticum aestivum), 트리티쿰 두럼 (Triticum durum), 세칼레 세레알레 (Secale cereale), 트리티칼레 (Triticale), 말루스 도메스티카 (Malus domestica), 브라키포듐 디스타키온 (Brachypodium distachyon), 호르데움 마리눔 (Hordeum marinum), 에이길롭스 타우치이 (Aegilops tauschii), 다우쿠스 글로키디아투스 (Daucus glochidiatus), 베타 불가리스 (Beta vulgaris) 등의 베타 spp., 다우쿠스 푸실루스 (Daucus pusillus), 다우쿠스 무리카투스 (Daucus muricatus), 다우쿠스 카로타 (Daucus carota), 유칼립투스 그란디스 (Eucalyptus grandis), 니코티아나 실베스트리스 (Nicotiana sylvestris), 니코티아나 토멘토시포르미스 (Nicotiana tomentosiformis), 니코티아나 타바쿰 (Nicotiana tabacum), 니코티아나 벤타미아나 (Nicotiana benthamiana), 솔라눔 라이코퍼시쿰 (Solanum lycopersicum), 솔라눔 투베로숨 (Solanum tuberosum), 코페아 카네포라 (Coffea canephora), 비티스 비니페라 (Vitis vinifera), 에리트란테 구타타 (Erythrante guttata), 겐리시아 아우레아 (Genlisea aurea), 쿠쿠미스 사티부스 (Cucumis sativus), 마루스 노타빌리스 (Marus notabilis), 아라비돕시스 아레노사 (Arabidopsis arenosa), 아라비돕시스 라이라타 (Arabidopsis lyrata), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 크루시히말라야 히말라이카 (Crucihimalaya himalaica), 크루시히말라야 발리치이 (Crucihimalaya wallichii), 카르다민 넥수오사 (Cardamine nexuosa), 레피디움 비르기니쿰 (Lepidium virginicum), 캡셀라 부르사 파스토리스 (Capsella bursa pastoris), 올마라비돕시스 푸밀라 (Olmarabidopsis pumila), 아라비스 히르수테 (Arabis hirsute), 브라씨카 나푸스 (Brassica napus), 브라씨카 올레라시아 (Brassica oleracea), 브라씨카 라파 (Brassica rapa), 라파누스 사티부스 (Raphanus sativus), 브라씨카 준카시아 (Brassica juncacea), 브라씨카 니그라 (Brassica nigra), 에루카 베시카리아 아종 사티바 (Eruca vesicaria subsp . sativa), 시트러스 시넨시스 (Citrus sinensis), 자트로파 쿠르카스 (Jatropha curcas), 포풀루스 트리코카르파 (Populus trichocarpa), 메디카고 트룬카툴라 (Medicago truncatula), 시져 야마시타 (Cicer yamashitae), 시져 비주굼 (Cicer bijugum), 시져 아리에티눔 (Cicer arietinum), 시져 레티쿨라툼 (Cicer reticulatum), 시져 주다이쿰 (Cicer judaicum), 카야누스 카자니폴리우스 (Cajanus cajanifolius), 카야누스 스카라바에오이데스 (Cajanus scarabaeoides), 파세올루스 불가리스 (Phaseolus vulgaris), 글리신 맥스 (Glycine max), 고씨퓸 (Gossypium sp .), 아스트라갈루스 시니쿠스 (Astragalus sinicus), 로투스 자포니카스 (Lotus japonicas), 토레니아 포우르니에리 (Torenia fournieri), 알리움 세파 (Allium cepa), 알리움 피스툴로숨 (Allium fistulosum), 알리움 사티붐 (Allium sativum), 헬리안투스 안누스 (Helianthus annuus), 헬리안투스 투베로수스 (Helianthus tuberosus) 및 알리움 투베로숨 (Allium tuberosum), 또는 상기 식물들 중 하나에 속하는 품종 또는 아종으로 이루어진 군으로부터 선택되는 식물로부터 유래되는, 방법.
전이유전자성 선별 마커 서열의 안정적인 통합없이, 하나 이상의 변형된 식물 세포, 또는 하나 이상의 변형된 식물 세포를 포함하는 하나 이상의 변형된 식물 조직, 기관 또는 완전한 식물을 단리하는 방법으로서,
상기 방법인
a. 하나 이상의 제1 타겟화된 프래임쉬프트 또는 결손 변형을 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에, 하나 이상의 제1 부위-특이적인 작동자를 사용해 도입하는 단계로서, 상기 하나 이상의 타겟화된 프래임쉬프트 또는 결손 변형이 하나 이상의 표현형으로 선별가능한 형질의 발현을 유발하는, 단계;
b. 하나 이상의 제2 타겟화된 변형을 변형할 하나 이상의 식물 세포의 제2 식물 게놈 타겟 부위에 도입하는 단계로서, 상기 하나 이상의 제2 타겟화된 변형이 뉴클레아제, 재조합효소 또는 DNA 변형 시약 (DNA modification reagent)을 포함하는 하나 이상의 제2 부위-특이적인 작동자를 이용해 도입되어, 제2 식물 게놈 타겟 부위에 하나 이상의 제2 타겟화된 변형이 달성되고, 상기 하나 이상의 제1 타겟화된 염기 변형의 도입과 동시에 또는 후속적으로, 하나 이상의 상기 제2 타겟화된 변형이 변형할 동일한 하나 이상의 식물 세포에, 또는 상기 하나 이상의 제1 타겟화된 변형을 포함하는 하나 이상의 자손 세포, 조직, 기관 또는 완전한 식물에 도입되어 하나 이상의 변형된 식물 세포가 수득되는, 단계; 및
c. i. 상기 제1 식물 게놈 타겟 부위에서 상기 하나 이상의 제1 타겟화된 프래임쉬프트 또는 결손 변형에 의해 유발된 하나 이상의 표현형으로 선별가능한 형질을 선별하고, 선택적으로,
ii. 상기 제2 식물 게놈 타겟 부위에서 상기 하나 이상의 제2 타겟화된 변형을 추가로 선별함으로써,
하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 단리하거나, 또는 하나 이상의 자손 세포, 조직, 기관 또는 이의 식물을 단리하는 단계;
선택적으로,
d. 상기 하나 이상의 제1 타겟화된 변형 및 상기 하나 이상의 제2 타겟화된 변형을 포함하는 하나 이상의 변형된 식물 또는 식물 물질을, 추가의 대상 식물 또는 식물 물질과 교배하여, 수득되는 자손 식물 또는 식물 물질을 분리함으로써, 대상 유전자형, 선택적으로 하나 이상의 제1 타겟화된 변형을 포함하지 않는 대상 유전자형을 달성하는 단계를 포함하는 방법.
제63항에 있어서,
단계 b는 바람직하게는 복구 주형을 도입하여 하나 이상의 제1 및/또는 제2 식물 게놈 타겟 부위에 타겟화된 서열 변환 또는 치환을 만드는 단계를 더 포함하는, 방법.
제63항에 있어서,
상기 하나 이상의 부위-특이적인 작동자가 Cas 또는 Cpf1 뉴클레아제를 포함하는 CRISPR 뉴클레아제, TALEN, ZFN, 메가뉴클레아제, 아르고너트 (Argonaute) 뉴클레아제, FokI 또는 이의 변이체를 포함하는 제한 엔도뉴클레아제, 재조합효소 또는 2 부위-특이적인 닉킹 엔도뉴클레아제, 또는 이들 작동자의 임의 변이체 또는 촉매학적으로 활성인 단편 중 하나 이상으로부터 선택되는, 방법.
제63항에 있어서,
상기 하나 이상의 부위-특이적인 작동자가 CRISPR-기반의 뉴클레아제이고, 상기 CRISPR-기반의 뉴클레아제는 부위-특이적인 DNA 결합 도메인을 포함하고, 상기 하나 이상의 CRISPR-기반의 뉴클레아제 또는 이를 코딩하는 핵산 서열이
a. SpCas9, SaCas9, SaKKH-Cas9, VQR-Cas9, St1Cas9를 포함하는, Cas9,
b. AsCpf1, LbCpf1, FnCpf1을 포함하는, Cpf1,
c. CasX, 또는
d. CasY
또는 상기한 CRISPR-기반의 뉴클레아제의 임의 변이체 또는 유도체를 포함하는 군으로부터 선택되고, 선택적으로, 상기 하나 이상의 CRISPR-기반의 뉴클레아제가 해당 야생형 서열과 비교해 돌연변이를 포함하므로, 형성되는 CRISPR-기반의 뉴클레아제는 단일 가닥 특이적인 DNA 닉카제로 또는 모든 DNA 절단력이 결핍된 DNA 결합 작동자로 변환되는, 방법.
제63항에 있어서,
상기 적어도 부위-특이적인 작동자, 또는 상기 하나 이상의 부위-특이적인 작동자를 포함하는 복합체의 하나 이상의 구성성분이, 하나 이상의 염기 편집 복합체를 세포내 소기관으로의 타겟화하기 위한 하나 이상의 소기관 위치화 신호를 포함하는, 방법.
제67항에 있어서,
상기 하나 이상의 소기관 위치화 신호가 핵 위치화 신호 (NLS)인, 방법.
제67항에 있어서,
상기 하나 이상의 소기관 위치화 신호가 엽록체 수송 펩타이드인, 방법.
제67항에 있어서,
상기 하나 이상의 소기관 위치화 신호가 미토콘드리아 수송 펩타이드인, 방법.
제63항에 있어서,
상기 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위가 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 게놈 타겟 부위이고, 상기 하나 이상의 표현형으로 선별가능한 형질은 내성/허용성 형질 또는 생장 우세 형질이고, 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 염기 변형이 하나 이상의 변형된 식물 세포, 조직 또는 식물, 또는 그 자손에 부가될 화합물 또는 촉발제에 대해 내성/허용성 또는 생장 우세를 부여하는, 방법.
제63항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 대상 형질이 하나 이상의 내인성 유전자이거나 또는 이에 의해 코딩되거나, 또는 상기 하나 이상의 대상 표현형 형질이 하나 이상의 전이유전자이거나 또는 이에 의해 코딩되고, 여기서 상기 하나 이상의 내인성 유전자 또는 하나 이상의 전이유전자가, 하나 이상의 대상 표현형 형질에 하나 이상의 변형이 결핍된 세포를 저해, 손상 또는 사멸시키는, 식물독소, 바람직하게는 제초제에 대한 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형 형질을 코딩하거나, 또는 상기 하나 이상의 표현형 형질이 세포 분열; 증식 속도; 배발생; 또는 비-변형된 세포, 조직, 기관 또는 식물과 비교해 변형된 세포, 조직, 기관 또는 식물에 이점을 제공하는 다른 표현형으로 선별가능한 특성의 부스터 (booster)로 이루어진 군으로부터 선택되는, 방법.
제63항에 있어서,
상기 하나 이상의 제1 식물 게놈 타겟 부위가 제초제 내성/허용성으로 이루어진 군으로부터 선택되는 하나 이상의 표현형으로 선별가능한 형질을 코딩하는 하나 이상의 내인성 유전자 또는 전이유전자이고, 여기서 상기 제초제 내성/허용성이 글리포세이트를 포함하는 EPSPS-저해제에 대한 내성/허용성, 글루포시네이트를 포함하는 글루타민 합성 저해제에 대한 내성/허용성, 이미다졸린 또는 설포닐우레아를 포함하는 ALS- 또는 AHAS-저해제에 대한 내성/허용성, 아릴옥시페녹시프로피오네이트 (FOP)를 포함하는 ACCase 저해제에 대한 내성/허용성, 피토엔 데세투라제 단계에서 카로티노이드 생합성의 저해제, 4-하이드록시페닐-피루베이트-다이옥시게나제 (HPPD)의 저해제 또는 기타 카로티노이드 생합성 타겟의 저해제를 포함하는 카로티노이드 생합성 저해제에 대한 내성/허용성, 셀룰로스 저해제에 대한 내성/허용성, 지질 합성 저해제에 대한 내성/허용성, 장쇄 지방산 저해제에 대한 내성/허용성, 미소관 조립 저해제에 대한 내성/허용성, 광화학계 I 전자 전환체에 대한 내성/허용성, 카바메이트, 트리아진 및 트리아지논을 포함하는 광화학계 II 저해제에 대한 내성/허용성, PPO-저해제에 대한 내성/허용성 및 디캄바 (2,4-다이클로로페녹시아세트산)를 포함하는 합성 옥신에 대한 내성/허용성으로 이루어진 군으로부터 선택되는, 방법.
제63항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 식물독성 내성/허용성 형질, 바람직하게는 제초제 내성/허용성 형질이고, 변형할 하나 이상의 식물 세포의 제1 식물 게놈 타겟 부위에서 하나 이상의 제1 타겟화된 프래임쉬프트 또는 결손 변형이 식물독성 화합물, 바람직하게는 제초제에 대한 내성/허용성을 부여하며, 상기 화합물이 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물, 또는 그 자손에 부가될 외인성 화합물인, 방법.
제63항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 하나 이상의 변형된 식물 세포, 조직, 기관 또는 완전한 식물을 동정 또는 단리하는데 유용한 가시적인 표현형인, 방법.
제75항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 광택 표현형인, 방법.
제75항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 골든 표현형인, 방법.
제75항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 색소 표현형인, 방법.
제75항에 있어서,
상기 하나 이상의 표현형으로 선별가능한 형질이 생장 우세 표현형인, 방법.
제63항에 있어서,
상기 변형할 하나 이상의 식물 세포가, 바람직하게는 호르데움 불가리 (Hordeum vulgare), 호르데움 불부숨 (Hordeum bulbusom), 소르굼 비콜러 (Sorghum bicolor), 사카룸 오피시나리움 (Saccharum officinarium), 지 메이스 (Zea mays) 등의 지 spp. (Zea spp .), 세타리아 이탈리카 (Setaria italica), 오리자 미누타 (Oryza minuta), 오리자 사티바 (Oriza sativa), 오리자 아우스트랄리엔시스 (Oryza australiensis), 오리자 알타 (Oryza alta), 트리티쿰 에이스티붐 (Triticum aestivum), 트리티쿰 두럼 (Triticum durum), 세칼레 세레알레 (Secale cereale), 트리티칼레 (Triticale), 말루스 도메스티카 (Malus domestica), 브라키포듐 디스타키온 (Brachypodium distachyon), 호르데움 마리눔 (Hordeum marinum), 에이길롭스 타우치이 (Aegilops tauschii), 다우쿠스 글로키디아투스 (Daucus glochidiatus), 베타 불가리스 (Beta vulgaris) 등의 베타 spp., 다우쿠스 푸실루스 (Daucus pusillus), 다우쿠스 무리카투스 (Daucus muricatus), 다우쿠스 카로타 (Daucus carota), 유칼립투스 그란디스 (Eucalyptus grandis), 니코티아나 실베스트리스 (Nicotiana sylvestris), 니코티아나 토멘토시포르미스 (Nicotiana tomentosiformis), 니코티아나 타바쿰 (Nicotiana tabacum), 니코티아나 벤타미아나 (Nicotiana benthamiana), 솔라눔 라이코퍼시쿰 (Solanum lycopersicum), 솔라눔 투베로숨 (Solanum tuberosum), 코페아 카네포라 (Coffea canephora), 비티스 비니페라 (Vitis vinifera), 에리트란테 구타타 (Erythrante guttata), 겐리시아 아우레아 (Genlisea aurea), 쿠쿠미스 사티부스 (Cucumis sativus), 마루스 노타빌리스 (Marus notabilis), 아라비돕시스 아레노사 (Arabidopsis arenosa), 아라비돕시스 라이라타 (Arabidopsis lyrata), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 크루시히말라야 히말라이카 (Crucihimalaya himalaica), 크루시히말라야 발리치이 (Crucihimalaya wallichii), 카르다민 넥수오사 (Cardamine nexuosa), 레피디움 비르기니쿰 (Lepidium virginicum), 캡셀라 부르사 파스토리스 (Capsella bursa pastoris), 올마라비돕시스 푸밀라 (Olmarabidopsis pumila), 아라비스 히르수테 (Arabis hirsute), 브라씨카 나푸스 (Brassica napus), 브라씨카 올레라시아 (Brassica oleracea), 브라씨카 라파 (Brassica rapa), 라파누스 사티부스 (Raphanus sativus), 브라씨카 준카시아 (Brassica juncacea), 브라씨카 니그라 (Brassica nigra), 에루카 베시카리아 아종 사티바 (Eruca vesicaria subsp . sativa), 시트러스 시넨시스 (Citrus sinensis), 자트로파 쿠르카스 (Jatropha curcas), 포풀루스 트리코카르파 (Populus trichocarpa), 메디카고 트룬카툴라 (Medicago truncatula), 시져 야마시타 (Cicer yamashitae), 시져 비주굼 (Cicer bijugum), 시져 아리에티눔 (Cicer arietinum), 시져 레티쿨라툼 (Cicer reticulatum), 시져 주다이쿰 (Cicer judaicum), 카야누스 카자니폴리우스 (Cajanus cajanifolius), 카야누스 스카라바에오이데스 (Cajanus scarabaeoides), 파세올루스 불가리스 (Phaseolus vulgaris), 글리신 맥스 (Glycine max), 고씨퓸 (Gossypium sp .), 아스트라갈루스 시니쿠스 (Astragalus sinicus), 로투스 자포니카스 (Lotus japonicas), 토레니아 포우르니에리 (Torenia fournieri), 알리움 세파 (Allium cepa), 알리움 피스툴로숨 (Allium fistulosum), 알리움 사티붐 (Allium sativum), 헬리안투스 안누스 (Helianthus annuus), 헬리안투스 투베로수스 (Helianthus tuberosus) 및 알리움 투베로숨 (Allium tuberosum), 또는 상기 식물들 중 하나에 속하는 품종 또는 아종으로 이루어진 군으로부터 선택되는 식물로부터 유래되는, 방법.
제1항에 따른 방법에 의해 수득가능한 식물 세포, 조직, 기관, 물질 또는 완전한 식물, 또는 이들의 자손.
제47항에 따른 방법에 의해 수득가능한 식물 세포, 조직, 기관, 물질 또는 완전한 식물, 또는 이들의 자손.
제63항에 따른 방법에 의해 수득가능한 식물 세포, 조직, 기관, 물질 또는 완전한 식물, 또는 이들의 자손.
게놈 편집에 의해 유전자 변형된 식물을 제조하는 방법으로서,
상기 방법은
a) 유전자 변형할 식물의 세포 또는 조직을 제공하는 단계;
b) 제1 게놈 편집 시스템 및 제2 게놈 편집 시스템을 제공하는 단계로서, 상기 제1 게놈 편집 시스템은 식물 선별가능한 마커 유전자를 타겟하여 변형시킬 수 있고, 상기 제2 게놈 편집 시스템은 식물에서 대상 유전자를 타겟하여 변형시킬 수 있는, 단계;
c) 세포 또는 조직을 상기 제1 및 제2 게놈 편집 시스템으로 공동-형질전환하는 단계;
d) 형질전환된 세포 또는 조직으로부터, 바람직하게는 선택압 (selection pressure) 없이 식물을 재생하는 단계;
e) 단계 d)에서 재생된 식물에서 선별가능한 마커 유전자가 변형된 식물을 선별하는 단계; 및
f) 단계 e)에서 선별된 식물로부터 타겟 유전자가 변형된 식물을 동정하는 단계를 포함하는, 방법.
제84항에 있어서,
상기 게놈 편집 시스템이 PBE (정확한 염기 편집기 (precise base editor)) 시스템, CRISPR-Cas9 시스템, CRISPR-Cpfl 시스템, CRISPRi 시스템, 징크 핑거 뉴클레아제 시스템 및 TALEN 시스템으로부터 선택되는, 방법.
제84항에 있어서,
상기 선별가능한 마커 유전자의 변형으로 식물에서 선별가능한 형질이 발현되고, 바람직하게는 상기 선별가능한 마커 유전자의 변형이 식물의 다른 형질은 변형시키지 않는, 방법.
제86항에 있어서,
상기 선별가능한 형질이 제초제 내성인, 방법.
제87항에 있어서,
상기 선별가능한 마커 유전자가 sbA, ALS, EPSPS, ACCase, PPO, HPPD, PDS, GS, DOXPS 및 P450로 이루어진 군으로부터 선택되는, 방법.
제86항에 있어서,
상기 선별가능한 형질이 엽설 (ligule), 잎의 색, 잎 광택과 같은 가시적으로-관찰가능한 형질인, 방법.
제87항에 있어서,
상기 선별가능한 마커 유전자가 LIG, PDS, zb7 및 GL2로 이루어진 군으로부터 선택되는, 방법.
제84항 내지 제90항 중 어느 한 항에 있어서,
상기 제1 및 제2 게놈 편집 시스템이 정확한 염기 편집기 (PBE) 시스템인, 방법.
제84항 내지 제91항 중 어느 한 항에 있어서,
상기 식물이 호르데움 불가리 (Hordeum vulgare), 호르데움 불부숨 (Hordeum bulbusom), 소르굼 비콜러 (Sorghum bicolor), 사카룸 오피시나리움 (Saccharum officinarium), 지 메이스 (Zea mays) 등의 지 spp. (Zea spp .), 세타리아 이탈리카 (Setaria italica), 오리자 미누타 (Oryza minuta), 오리자 사티바 (Oriza sativa), 오리자 아우스트랄리엔시스 (Oryza australiensis), 오리자 알타 (Oryza alta), 트리티쿰 에이스티붐 (Triticum aestivum), 트리티쿰 두럼 (Triticum durum), 세칼레 세레알레 (Secale cereale), 트리티칼레 (Triticale), 말루스 도메스티카 (Malus domestica), 브라키포듐 디스타키온 (Brachypodium distachyon), 호르데움 마리눔 (Hordeum marinum), 에이길롭스 타우치이 (Aegilops tauschii), 다우쿠스 글로키디아투스 (Daucus glochidiatus), 베타 불가리스 (Beta vulgaris) 등의 베타 spp., 다우쿠스 푸실루스 (Daucus pusillus), 다우쿠스 무리카투스 (Daucus muricatus), 다우쿠스 카로타 (Daucus carota), 유칼립투스 그란디스 (Eucalyptus grandis), 니코티아나 실베스트리스 (Nicotiana sylvestris), 니코티아나 토멘토시포르미스 (Nicotiana tomentosiformis), 니코티아나 타바쿰 (Nicotiana tabacum), 니코티아나 벤타미아나 (Nicotiana benthamiana), 솔라눔 라이코퍼시쿰 (Solanum lycopersicum), 솔라눔 투베로숨 (Solanum tuberosum), 코페아 카네포라 (Coffea canephora), 비티스 비니페라 (Vitis vinifera), 에리트란테 구타타 (Erythrante guttata), 겐리시아 아우레아 (Genlisea aurea), 쿠쿠미스 사티부스 (Cucumis sativus), 마루스 노타빌리스 (Marus notabilis), 아라비돕시스 아레노사 (Arabidopsis arenosa), 아라비돕시스 라이라타 (Arabidopsis lyrata), 아라비돕시스 탈리아나 (Arabidopsis thaliana), 크루시히말라야 히말라이카 (Crucihimalaya himalaica), 크루시히말라야 발리치이 (Crucihimalaya wallichii), 카르다민 넥수오사 (Cardamine nexuosa), 레피디움 비르기니쿰 (Lepidium virginicum), 캡셀라 부르사 파스토리스 (Capsella bursa pastoris), 올마라비돕시스 푸밀라 (Olmarabidopsis pumila), 아라비스 히르수테 (Arabis hirsute), 브라씨카 나푸스 (Brassica napus), 브라씨카 올레라시아 (Brassica oleracea), 브라씨카 라파 (Brassica rapa), 라파누스 사티부스 (Raphanus sativus), 브라씨카 준카시아 (Brassica juncacea), 브라씨카 니그라 (Brassica nigra), 에루카 베시카리아 아종 사티바 (Eruca vesicaria subsp . sativa), 시트러스 시넨시스 (Citrus sinensis), 자트로파 쿠르카스 (Jatropha curcas), 포풀루스 트리코카르파 (Populus trichocarpa), 메디카고 트룬카툴라 (Medicago truncatula), 시져 야마시타 (Cicer yamashitae), 시져 비주굼 (Cicer bijugum), 시져 아리에티눔 (Cicer arietinum), 시져 레티쿨라툼 (Cicer reticulatum), 시져 주다이쿰 (Cicer judaicum), 카야누스 카자니폴리우스 (Cajanus cajanifolius), 카야누스 스카라바에오이데스 (Cajanus scarabaeoides), 파세올루스 불가리스 (Phaseolus vulgaris), 글리신 맥스 (Glycine max), 고씨퓸 (Gossypium sp .), 아스트라갈루스 시니쿠스 (Astragalus sinicus), 로투스 자포니카스 (Lotus japonicas), 토레니아 포우르니에리 (Torenia fournieri), 알리움 세파 (Allium cepa), 알리움 피스툴로숨 (Allium fistulosum), 알리움 사티붐 (Allium sativum), 헬리안투스 안누스 (Helianthus annuus), 헬리안투스 투베로수스 (Helianthus tuberosus) 및 알리움 투베로숨 (Allium tuberosum), 또는 상기 식물들 중 하나에 속하는 품종 또는 아종으로 이루어진 군으로부터 선택되는, 방법.
제84항의 방법에 의해 수득가능하며, 바람직하게는 전이유전자가 없는 (transgene-free), 유전자 변형된 식물.