KR20190016970A - 식물 게놈 변형을 위한 cpf1 엔도뉴클레아제의 용도 - Google Patents

식물 게놈 변형을 위한 cpf1 엔도뉴클레아제의 용도 Download PDF

Info

Publication number
KR20190016970A
KR20190016970A KR1020187036654A KR20187036654A KR20190016970A KR 20190016970 A KR20190016970 A KR 20190016970A KR 1020187036654 A KR1020187036654 A KR 1020187036654A KR 20187036654 A KR20187036654 A KR 20187036654A KR 20190016970 A KR20190016970 A KR 20190016970A
Authority
KR
South Korea
Prior art keywords
sequence
polynucleotide
plant
dna
cpf1
Prior art date
Application number
KR1020187036654A
Other languages
English (en)
Inventor
앤드류 마크 시간
베스나 주카노비치
조슈아 케이. 용
Original Assignee
파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드 filed Critical 파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드
Publication of KR20190016970A publication Critical patent/KR20190016970A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Abstract

식물 또는 식물 세포의 게놈 내 표적 서열의 게놈 변형을 위한, 식물 또는 식물 세포의 게놈 내 뉴클레오티드 서열의 게놈 편집을 위한, 및/또는 식물 게놈 내로 또는 게놈으로부터 관심 폴리뉴클레오티드의 삽입 또는 결실을 위한 조성물 및 방법이 제공된다. 상기 방법 및 조성물은 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 시스템을 이용하여 식물, 식물 세포 또는 종자의 게놈 내 표적 서열을 변형하거나 변경하기 위한 효과적인 시스템을 제공한다. 또한 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체, 가이드 폴리뉴클레오티드, 식물-최적화된 Cpf1 엔도뉴클레아제 서열, 식물-최적화된 Cpf1 엔도뉴클레아제 유전자를 포함하는 재조합 DNA 작제물, 및 이의 조합이 제공된다.

Description

식물 게놈 변형을 위한 CPF1 엔도뉴클레아제의 용도
본 출원은, 각각 본원에 그 전체가 참조로 포함되는, 2016년 6월 14일 출원된 미국 가출원 번호 62/349826호 및 2017년 3월 7일 출원된 미국 가출원 번호 62/468013호의 이익을 주장한다.
기술분야
본 발명은 식물 분자 생물학 분야에 관한 것으로서, 특히 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 시스템의 조성물, 및 식물 세포의 게놈을 변경하기 위한 조성물 및 방법에 관한 것이다.
전자적으로 제출된 서열 목록에 대한 참조
본 서열 목록의 공식 사본은 2017년 5월 18일 작성되고 크기가 94 킬로바이트이며 본 명세서와 동시에 제출된, 파일명 20170518_7128PCT_ST25.txt의 ASCII 형식의 서열 목록으로서 EFS-웹을 통해 전자적으로 제출되었다. 이러한 ASCII 형식의 서류에 포함된 서열 목록은 본 명세서의 일부이며, 그 전체가 본원에 참조로 포함된다.
재조합 DNA 기술은 표적화된 게놈 위치에 DNA 서열을 삽입하고/하거나 특정한 내인성 염색체 서열을 변형할 수 있도록 하였다. 부위 특이적 재조합 시스템을 이용한 부위 특이적 통합 기술뿐만 아니라 다른 방식의 재조합 기술이 다양한 생물에서 관심 유전자의 표적화된 삽입을 생성하는 데 이용되어 왔다. 게놈 편집 기술, 예컨대, 디자이너 징크 핑거 뉴클레아제(ZFN) 또는 전사 활성인자-유사 이펙터 뉴클레아제(TALEN), 또는 호밍 메가뉴클레아제가 표적화된 게놈 교란을 생성하는 데 이용 가능하지만, 이들 시스템은 특이성이 낮고 각각의 표적 부위에 대해 재설계되어야 하는 설계된 이용하는 경향이 있어, 제조에 많은 비용과 시간이 소요된다.
식물의 게놈에서 변형을 위한 특정 부위를 표적화 하기 위해 몇몇 접근법이 개발되었지만, 저렴하고, 설정이 용이하고, 확장 가능하며, 식물 게놈 내 여러 위치를 표적화할 수 있는 보다 효과적인 게놈 조작 기술이 여전히 필요하다.
간략 요약
가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 시스템 및 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체, 가이드 폴리뉴클레오티드, 폴리뉴클레오티드 변형 주형, Cpf1 엔도뉴클레아제 단백질, 식물-최적화된 Cpf1 엔도뉴클레아제 유전자를 포함하는 재조합 DNA 작제물 및 이의 조합을 포함하지만 이에 한정되지는 않는 이러한 시스템을 포함하는 요소를 위한 조성물 및 방법이 제공된다. 식물 게놈 변형에서 Cpf1 엔도뉴클레아제 시스템의 사용을 위한 조성물 및 방법이 또한 제공된다.
일 구현예에서, Cpf1 엔도뉴클레아제는 식물 세포 또는 식물에서 사용되며, 상기 Cpf1 엔도뉴클레아제는 가이드 폴리뉴클레오티드와 복합체를 형성할 수 있고, 상기 복합체는 식물 세포 또는 식물에서 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있다.
본 발명의 일 구현예에서, 방법은 식물 세포의 게놈 내 표적 서열을 변형하기 위한 방법을 포함하며, a) 식물 세포에 Cpf1 엔도뉴클레아제 또는 Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드, 및 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적화 도메인을 포함하는 가이드 폴리뉴클레오티드 또는 가이드 폴리뉴클레오티드를 발현하는 재조합 DNA를 도입하는 단계; 및, b) 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하고, 상기 폴리뉴클레오티드 및 Cpf1 엔도뉴클레아제는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있다.
본 발명의 일 구현예에서, 방법은 식물 세포의 게놈 내 표적 서열을 변형하기 위한 방법을 포함하며, a) Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터를 포함하는 재조합 DNA 작제물을 그 게놈에 포함하는 식물 세포 내로, 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적화 도메인을 포함하는 가이드 폴리뉴클레오티드 또는 가이드 폴리뉴클레오티드를 발현하는 재조합 DNA를 도입하는 단계; 및, b) 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하고, 상기 가이드 폴리뉴클레오티드 및 Cpf1 엔도뉴클레아제는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있다.
본 발명의 일 구현예에서, 방법은 식물 또는 식물 세포의 게놈 내 표적 서열을 변형하기 위한 방법을 포함하며, a) 그 게놈에 제1 재조합 DNA 작제물로서, Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터를 포함하는 제1 재조합 DNA 작제물 및 제2 재조합 DNA 작제물로서, 가이드 RNA를 암호화하는 뉴클레오티드 서열에 작동 가능하게 연결된 프로모터를 포함하는 제2 재조합 DNA 작제물을 포함하는 식물 또는 식물 세포를 수득하는 단계로서, 상기 가이드 RNA 및 Cpf1 엔도뉴클레아제는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있는 단계; 및 b) 식물 또는 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계로서, 상기 가이드 RNA 및 Cpf1 엔도뉴클레아제는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 단계를 포함한다.
방법은 표적 서열에서 변형을 갖는 적어도 하나의 식물 세포, 식물 또는 자손 식물을 동정하는 단계를 더 포함할 수 있고, 상기 표적 서열에서의 변형은 (i) 적어도 하나의 뉴클레오티드의 치환, (ii) 적어도 하나의 뉴클레오티드의 결실, (iii) 적어도 하나의 뉴클레오티드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택된다. 방법은 식물 세포로 공여 DNA를 더 제공할 수 있고, 상기 공여 DNA는 관심 폴리뉴클레오티드를 포함한다. 이는 검출 가능한 표적화된 게놈 변형을 갖는 식물 세포 또는 식물을 생성할 수 있다.
본 발명의 일 구현예에서, 방법은 식물 세포의 게놈 내 뉴클레오티드 서열을 편집하기 위한 방법을 포함하며, a) 식물 세포 내로 Cpf1 엔도뉴클레아제 또는 Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드, 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적화 도메인을 포함하는 가이드 폴리뉴클레오티드 또는 가이드 폴리뉴클레오티드를 발현하는 재조합 DNA를, 및 폴리뉴클레오티드 변형 주형을 도입하는 단계로서, 상기 폴리뉴클레오티드 변형 주형은 뉴클레오티드 서열의 적어도 하나의 뉴클레오티드 변형을 포함하는 단계; 및, b) 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하고, 상기 가이드 폴리뉴클레오티드 및 Cpf1 엔도뉴클레아제는 표적 서열의 전부 또는 일부를 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있다.
식물 세포, 식물 또는 자손 식물은 28℃ 초과 온도에서 인큐베이션될 수 있다. 식물 세포의 28℃ 초과 온도 온도로의 노출은 식물 세포, 식물 배아 및/또는 식물의 임의의 발달 단계에 있을 수 있다. Cpf1 엔도뉴클레아제(또는 Cpf1 엔도뉴클레아제를 발현하는 재조합 작제물) 및 가이드 RNA(및/또는 가이드 RNA를 발현하는 재조합 작제물)를 포함하는 식물의 자손은 또한 28℃ 초과 온도에 노출되어서, 자손 식물 내의 가이드 RNA/Cpf1 복합체를 활성화할 수 있고(발달 동안 원하는 단계에), 이는 자손 식물이 가이드 RNA/Cpf1 엔도뉴클레아제 복합체에 의해 인식되는 특정한 표적 부위에서 변형될 수 있도록 한다.
본 발명의 일 구현예에서, 재조합 DNA 작제물은 Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 뉴클레오티드 서열에 작동 가능하게 연결된 프로모터를 포함하는 재조합 DNA 작제물이다.
본 발명의 일 구현예에서, 방법은 식물 세포의 게놈에서 여러 표적 서열을 동시에 변형하는 방법을 포함하며, a) 식물 세포 내로 Cpf1 엔도뉴클레아제 단백질, 또는 Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드, 및 여러 단일 가이드 RNA로 가공되는 단일 전구체 RNA를 발현할 수 있는 전구체 가이드 RNA 전사 카세트를 도입하는 단계로서, 상기 각각의 단일 가이드 RNA는 식물 게놈 내 단일 표적 서열과 실질적으로 상보적인 프로토스페이서 인접 모티프(PAM)의 3' 가변 표적화 도메인을 포함하는 단계; 및 b) (a)의 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하고, 각각의 단일 가이드 RNA 및 Cpf1 엔도뉴클레아제 단백질은 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 리보뉴클레오티드 복합체를 형성할 수 있다. 여러 표적 서열은 적어도 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개 표적 서열 내지 최대 100개 표적 서열로 이루어질 수 있다.
본 발명의 일 구현예에서, 키트는 식물 세포 또는 식물에서 표적 서열에 결합하고, 절단 또는 닉킹하기 위한 키트이며, 상기 키트는 표적 서열에 특이적인 가이드 DNA, 및 Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 뉴클레오티드 서열을 포함하고, 가이드 DNA는 가이드 DNA/Cpf1 엔도뉴클레아제 복합체를 형성할 수 있고, 복합체는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있다.
본 발명의 일 구현예에서, 방법은 식물 세포의 게놈 내 DNA 표적 서열을 변형하기 위한 방법이며, a) 식물 세포 내로 Cpf1 엔도뉴클레아제, 및 Cpf1 엔도뉴클레아제와 복합체를 형성할 수 있는 가이드 폴리뉴클레오티드를 도입하는 단계로서, 상기 가이드 폴리뉴클레오티드는 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적화 도메인을 포함하는 단계; 및 b) Cpf1 복합체에 의해 인식되는 PAM 서열에 인접한 DNA 표적 서열에 대응하는 적어도 하나의 영역을 포함하는 폴리뉴클레오티드 변형 주형을 도입하는 단계로서, 상기 DNA 표적 서열에 대응하는 적어도 하나의 영역이 PAM 서열의 3', +1 내지 +19 위치에서 DNA 표적 서열에 비해 적어도 하나의 뉴클레오티드 미스매치를 포함하는 단계를 포함한다. 방법은 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 더 포함할 수 있고, 및/또는 상기 Cpf1 복합체는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있다.
본 발명의 일 구현예에서, 폴리뉴클레오티드 변형 주형은 Cpf1 복합체에 의해 인식되는 PAM 서열에 인접한 DNA 표적 서열과 상보적인 적어도 하나의 영역을 포함하는 폴리뉴클레오티드 변형 주형이며, 상기 DNA 표적 서열에 대응하는 적어도 하나의 영역은 PAM 서열의 3', +1 내지 +19 위치에서 DNA 표적 서열에 비해 적어도 하나의 뉴클레오티드 미스매치를 포함한다. 폴리뉴클레오티드 변형 주형은 PAM 서열의 3', +20 내지 +24 위치에서 표적 DNA 서열에 대응하는 영역에 변형을 더 포함할 수 있다.
또한 본원에 기술된 방법에 의해 생성되는, 변형된 표적 서열을 갖거나 식물 게놈에 뉴클레오티드 서열 변형을 갖는 핵산 작제물, 식물, 식물 세포, 외식편, 종자 및 낟알이 제공된다. 본 발명의 방법 및 조성물의 추가적인 구현예가 본원에 제시된다.
도면 및 서열 목록의 간단한 설명
본 발명은 본 출원의 일부를 형성하는 다음의 상세한 설명 및 첨부 도면 그리고 서열 목록으로부터 더욱 완전하게 이해될 수 있다. 본원에 첨부된 서열 설명 및 서열 목록은 37 C.F.R. §§1.821-1.825에 명시된 바와 같이 특허 출원에서 뉴클레오티드 및 아미노산 서열 개시를 규율하는 규칙을 따른다. 서열 기술은 본원에 참조로 포함되는, 37 C.F.R. §§ 1.821-1.825에 정의된 바와 같은 아미노산에 대한 3글자 코드를 포함한다.
도 1은 Cpf1 엔도뉴클레아제 단백질을 암호화하는 옥수수 최적화된 Cpf1 엔도뉴클레아제 유전자(옥수수 최적화된 Cpf1 ORF)를 포함하는 발현 카세트를 도시한다. 성분은 유비퀴틴 5' 미번역 영역(5' UTR)에 작동 가능하게 연결된 프로모터(예를 들어, 유비퀴틴 프로모터), 유비퀴틴 인트론 1 및 옥수수 코돈 최적화된 Cpf1 개방 해독틀(ORF), ST-LS1 인트론-2, 3' 또는 C-말단 SV40 핵 국재화 신호(NLS), 및 종결인자를 포함한다.
도 2는 단일 가닥 또는 이중 가닥 표적 부위에 결합하고, 닉킹 또는 절단할 수 있는 Cpf1 엔도뉴클레아제와 기능적 복합체를 형성할 수 있는 가이드 폴리뉴클레오티드(Cpf1 인식 도메인 및 Cpf1 가변 표적화 도메인 포함)를 암호화하는 DNA 서열에 작동 가능하게 연결된 옥수수 소형 RNA 전사 개시 서열(옥수수 U6 폴리머라아제 IIII 프로모터)을 포함하는 발현 카세트를 도시한다. 성분은 전사를 개시하기 위해 G 뉴클레오티드에 작동 가능하게 연결된 옥수수 U6 폴리머라아제 III 프로모터, Cpf1에 의해 인식될 수 있는 5'의 약 20개 뉴클레오티드(nt) 영역(Cpf1 인식 도메인), Cpf1 절단 활성을 가이드하는 약 23개 nt 서열(Cpf1 가변 표적화 도메인), 및 종결인자를 포함한다.
도 3은 옥수수 최적화된 Cpf1 엔도뉴클레아제를 암호화하는 DNA 서열에 작동 가능하게 연결된 BSV 프로모터 및 종결인자를 포함하는 발현 카세트를 도시한다. 성분은 BSV 프로모터, HPLV9 인트론 1, 옥수수 최적화된 Cpf1 개방 해독틀(ORF), ST-LS1 인트론 2, C-말단 SV40 핵 국내화 신호(NLS) 및 종결인자를 포함한다.
도 4는 옥수수 최적화된 Cpf1 엔도뉴클레아제를 암호화하는 DNA 서열에 작동 가능하게 연결된 PLTP 프로모터 및 종결인자를 포함하는 발현 카세트를 도시한다. 성분은 PLTP 프로모터, PLTP 5' UTR, ST-LS1 인트론-2, 옥수수 최적화된 Cpf1 개방 해독틀(ORF), C-말단 SV40 핵 국재화 신호(NLS) 및 종결인자를 포함한다.
도 5a~5b는 Cpf1 엔도뉴클레아제(도 5a) 또는 Cas 엔도뉴클레아제(도 5b)에 의해 절단될 수 있는 DNA 표적 부위를 예시한다. 도 5a는 Cpf1 엔도뉴클레아제에 대한 DNA 표적 부위를 예시한다. 센스(5'에서 3'으로, 상부 가닥) 및 안티센스(5'에서 3'으로, 하부 가닥) DNA 가닥을 검은색으로 나타내며, PAM(프로토스페이서 인접 영역) 및 Cpf1 가이드 RNA(진한 회색 및 연한 회색 선)의 가변 표적화 도메인과 염기쌍을 이루는 DNA 표적 부위 영역(+1 내지 +23)을 포함하는 Cpf1 DNA 표적 부위 영역을 나타낸다. 미스매치에 대해 낮은 관용성을 나타내는 Cpf1 가이드 RNA 영역을 진한 회색선으로 도시하는 반면, 연한 회색선은 미스매치에 대해 높은 관용성을 갖는 영역(PAM의 3', 위치 +20 내지 +23)을 나타낸다. Cpf1 DNA 절단 부위는 삼각형으로 나타낸다. 도 5b는 Cas9 엔도뉴클레아제에 대한 DNA 표적 부위를 예시한다. 센스(5'에서 3'으로, 상부 가닥) 및 안티센스(5'에서 3'으로, 하부 가닥) DNA 가닥을 검은색으로 나타내며, PAM(프로토스페이서 인접 모티프) 및 Cas9 가이드 RNA의 가변 표적화 도메인과 염기쌍을 이루는 DNA 표적 부위 영역(+1 내지 +20)(진한 회색선 및 연한 회색선)을 포함하는 Cas9 DNA 표적 부위 영역을 나타낸다. 미스매치에 대해 낮은 관용성을 나타내는 Cas9 가이드 RNA 영역을 진한 회색선으로 도시하는 반면, 연한 회색선은 미스매치에 대해 더 높은 관용성을 갖는 영역(PAM의 5', 위치 약 +10 내지 +20)을 나타낸다. Cas9 DNA 절단 부위는 삼각형으로 나타낸다.
도 6은 단일 가닥 또는 이중 가닥 표적 부위에 결합하고, 닉킹 또는 절단할 수 있는 Cpf1 엔도뉴클레아제와 기능적 복합체를 형성할 수 있는 가이드 폴리뉴클레오티드를 암호화하는 DNA 서열에 작동 가능하게 연결된 옥수수 소형 RNA 전사 개시 서열(옥수수 U6 폴리머라아제 IIII 프로모터)을 포함하는 발현 카세트를 도시한다. 성분은 옥수수 U6 폴리머라아제 III 프로모터, Cpf1 CRISPR 반복 서열, AsMs26-1 표적화 도메인, AsLIGULELESS-1 표적화 도메인, AsMs45-1 표적화 도메인, 및 종결인자를 포함한다.
도 7은 단일 가닥 또는 이중 가닥 표적 부위에 결합하고, 닉킹 또는 절단할 수 있는 Cpf1 엔도뉴클레아제와 기능적 복합체를 형성할 수 있는 가이드 폴리뉴클레오티드를 암호화하는 DNA 서열에 작동 가능하게 연결된 Pol-II 프로모터(유비퀴틴 프로모터)를 포함하는 발현 카세트를 도시한다. 성분은 유비퀴틴 Pol-II 프로모터, 유비퀴틴 5' UTR, 유비퀴틴 인트론-1, Cpf1 CRISPR 반복 서열, AsMs26-1 표적화 도메인, AsLIGULELESS-1 표적화 도메인, AsMs45-1 표적화 도메인, 및 종결인자를 포함한다.
도 8은 Cpf1 인식 도메인에 적어도 하나의 DNA 뉴클레오티드(회색 점) 및/또는 가변 표적화 도메인에 적어도 하나의 DNA 뉴클레오티드(회색 점)를 포함하는 하이브리드 DNA-RNA 가이드 폴리뉴클레오티드(hDRNA)의 일례를 도시한다.
서열
Figure pct00001
Figure pct00002
Figure pct00003
식물 게놈 변형에서 사용하기 위한 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 시스템 및 이러한 시스템을 포함하는 요소를 위한 조성물 및 방법이 제공된다. 식물 세포 또는 식물의 게놈에서 표적 뉴클레오티드 서열을 변형하기 위한 방법이 개시된다. 본 발명은 또한 식물 세포의 게놈 내 뉴클레오티드 서열을 편집하기 위한, 표적화된 돌연변이유발을 위한, 그리고 식물 세포의 게놈 내로 관심 폴리뉴클레오티드를 삽입하기 위한 방법을 기술한다.
본원의 용어 "Cas 유전자"는 일반적으로 플랭킹 CRISPR 유전자좌에 커플링되거나 결합되거나 가까이 있거나, 또는 그 부근에 있는 하나 이상의 유전자를 지칭한다. 용어 "Cas 유전자", "CRISPR-결합(associated(Cas)) 유전자" 및 "클러스터링된 규칙적으로 사이 간격을 두고 분포하는 짧은 회문구조 반복 서열-결합 유전자"는 본원에서 상호 교환적으로 사용된다.
CRISPR(클러스터링된 규칙적으로 사이 간격을 두고 분포하는 짧은 회문구조 반복 서열) 유전자좌는, 예를 들어, 박테리아 및 고세균 세포에 의해 외래 DNA를 파괴하는데 사용되는 DNA 절단 시스템의 성분을 암호화하는 특정 유전자좌를 지칭한다(Horvath and Barrangou, 2010, Science 327:167-170; WO2007/025097, 2007년 3월 1일 공개됨). CRISPR 유전자좌는 다양한 Cas(CRISPR-결합(associated)) 유전자에 의해 플랭킹될 수 있는, 짧은 가변 DNA 서열(소위 '스페이서')에 의해 분리된 짧은 다이렉트 반복 서열(CRISPR 반복 서열)을 포함하는 CRISPR 배열로 이루어질 수 있다. 주어진 CRISPR 유전자좌에서 CRISPR-결합 유전자의 수는 종 간에 변할 수 있다. 다중서브유닛 이펙터 복합체(I형, III형 및 IV형 서브유닛)를 갖는 클래스 1 시스템, 및 단일 단백질 이펙터(II형 및 V형 서브타입을 포함하며, 예컨대 Cas9, Cpf1, C2c1, C2c2, C2c3를 들 수 있지만 여기에 한정되는 것은 아님)를 갖는 클래스 2 시스템을 포함하는 여러 CRISPR/Cas 시스템이 기술되었다. 클래스 1시스템(본원에 참조로 포함되는 Makarova et al. 2015, Nature Reviews; Microbiology Vol. 13:1-15; Zetsche et al., 2015, Cell 163, 1-13; Shmakov et al., 2015, Molecular_Cell 60, 1-13; Haft et al., 2005, Computational Biology, PLoS Comput Biol 1(6): e60. doi:10.1371/journal .pcbi. 0010060 및 2013년 11월 23일에 공개된 WO 2013/176772 A1). 박테리아로부터의 II형 CRISPR/Cas 시스템은 crRNA(CRISPR RNA) 및 tracrRNA(트랜스-활성화 CRISPR RNA)를 이용하여 Cas 엔도뉴클레아제를 그 DNA 표적으로 유도한다.  crRNA는 이중 가닥 DNA 표적의 한 가닥에 상보적인 스페이서 영역 및 tracrRNA(트랜스-활성화 CRISPR RNA)와 염기쌍을 이루어 Cas 엔도뉴클레아제가 DNA 표적을 절단하도록 유도하는 RNA 듀플렉스를 형성하는 영역을 포함한다. 스페이서는 Cas1 및 Cas2 단백질과 관련된 완전히 이해되지 않은 프로세스를 통해 획득된다. 모든 II형 CRISPR/Cas 유전자좌는 cas9 유전자 외에 cas1 및 cas2 유전자를 포함한다(Chylinski et al., 2013, RNA Biology 10:726-737; Makarova et al. 2015, Nature Reviews Microbiology Vol. 13:1-15). II형 CRISPR-Cas 유전자좌는 각각의 CRISPR 배열 내 반복 서열과 부분적으로 상보적인 tracrRNA를 암호화할 수 있고, Csn1 및 Csn2와 같은 다른 단백질을 포함할 수 있다. cas 1 및 cas2 유전자 부근에 있는 cas9의 존재가 II형 유전자좌의 특징이다(Makarova et al. 2015, Nature Reviews Microbiology Vol. 13:1-15).
용어 "Cas 단백질"은 Cas(CRISPR-결합(associated)) 유전자에 의해 암호화되는 단백질을 지칭한다. Cas 단백질은 Cas9 단백질, Cpf1 단백질, C2c1 단백질, C2c2 단백질, C2c3 단백질, Cas3, Cas3-HD, Cas5, Cas7, Cas8, Cas10, 또는 이의 조합 또는 복합체를 포함한다(Makarova et al. 2015, Nature Reviews Microbiology Vol. 13:1-15).
Cas 단백질은 Cas 엔도뉴클레아제를 포함한다. Cas 엔도뉴클레아제는, 적합한 폴리뉴클레오티드 성분과의 복합체인 경우, 특정 DNA 표적 서열의 전부 또는 일부를 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있다. Cas 엔도뉴클레아제는 하나 이상의 뉴클레아제 도메인을 포함한다.
본원에서 "Cas9"(예전에 Cas5, Csn1, 또는 Csx12로 언급됨)는 적합한 폴리뉴클레오티드 성분(예컨대 cr뉴클레오티드 및 tracr뉴클레오티드, 또는 단일 가이드 폴리뉴클레오티드)과의 복합체인 경우, DNA 표적 서열의 전부 또는 일부를 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 Cas 엔도뉴클레아제를 지칭한다. Cas9 단백질은 RuvC 뉴클레아제 도메인 및 HNH(H-N-H) 뉴클레아제 도메인을 포함하며, 이들 각각은 표적 서열에서 단일 DNA 가닥을 절단할 수 있다(두 도메인의 공동 작용은 DNA 이중 가닥 절단을 유도하는 반면, 하나의 도메인의 활성은 닉을 유도함). 일반적으로, RuvC 도메인은 서브도메인 I, II 및 III을 포함하며, 여기서 도메인 I은 Cas9의 N 말단 근처에 위치하고, 서브도메인 II 및 III은 HNH 도메인에 플랭킹하는, 단백질의 중간에 위치한다(Hsu et al., 2013, Cell 157:1262-1278). Cas9 엔도뉴클레아제는 전형적으로 II형 CRISPR 시스템으로부터 유도되는데, 이 시스템은 적어도 하나의 폴리뉴클레오티드 성분과의 복합체인 Cas9 엔도뉴클레아제를 이용하는 DNA 절단 시스템을 포함한다. 예를 들어, Cas9는 CRISPR RNA(crRNA) 및 트랜스-활성화 CRISPR RNA(tracrRNA)와의 복합체일 수 있다. 다른 예에서, Cas9는 단일 가이드 RNA와의 복합체일 수 있다(Makarova et al. 2015, Nature Reviews Microbiology Vol. 13:1-15).
본원에서 사용되는 "Cpf1"은 클래스 2-V형 시스템의 Cas 엔도뉴클레아제를 지칭하며, 이는 이중 가닥 DNA의 절단에 협력하는 RuvC-유사 뉴클레아제 도메인 및 추정 제2 뉴클레아제 도메인을 포함한다(Yamane et al., 2016, Cell 165:949-962). Cpf1은 DNA 표적 서열을 절단할 수 있는 폴리뉴클레오티드 유도 엔도뉴클레아제(PGEN) 복합체를 형성하기 위해 cr뉴클레오티드만을 필요로 하므로, 뚜렷한 트랜스-작용 RNA(tracrRNA)의 부재는 Cpf1 엔도뉴클레아제 시스템의 또 다른 특징적 속성이다. Cpf1에 의한 표적 서열의 절단은 PAM으로부터 원위이며(crRNA-비상보적 가닥에서 약 19개 염기쌍이 제거됨) 대략 4개 뉴클레오티드 5' 오버행을 갖는 이중 가닥 절단을 생성한다(Zetsche et al., 2015, Cell 163, 1-13; Fagerlund et al., 2015, Genome Biology 16:251-253). 일 양태에서, Cpf1 엔도뉴클레아제는 애시도아미노코커스 종 BV3L6 Cpf1 엔도뉴클레아제이다(Zetsche et al., 2015, Cell 163, 1-13; Fagerlund et al., 2015, Genome Biology 16:251-253; Yamane et al., 2016, Cell 165:949-962).
본원에서 용어 "Cpf1 유전자"는 Cpf1 엔도뉴클레아제를 암호화하는 유전자를 지칭한다.
예상치 못하게도, 본원에 기술된 바와 같이, Cpf1 엔도뉴클레아제 활성은 가이드 폴리뉴클레오티드와의 복합체(예컨대 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체)인 경우 온도에 의해 조절될 수 있다. 28℃ 초과 온도는 28℃ 이하에서의 활성에 비해 Cpf1 절단 활성을 증가시킨다. 이러한 예상치 못한 온도 민감성은 Cpf1 엔도뉴클레아제의 활성화 조절 그리고 이에 따른 가이드 RNA/Cpf1 엔도뉴클레아제 복합체의 활성 조절을 허용할 수 있다. 가이드 RNA/Cpf1 엔도뉴클레아제 복합체(또는 복합체를 포함하는 숙주 세포)의 증가된 온도로의 노출은 Cpf1 단백질에 의한 절단 활성의 빈도 증가를 시사하는 표적 부위 돌연변이유발의 빈도 증가를 허용한다. 또한, 본원에서는 이러한 표적 부위 돌연변이유발의 증가된 빈도가 Cpf1 발현을 유도하기 위해 어떤 프로모터가 사용되는지(Pol-II)와 무관함이 기술된다.
본원에 기술된 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 시스템 및 방법은 절단을 위해 식물 세포의 DNA를 표적화하기 위해 사용될 수 있고 식물 게놈 및 유전자 조작의 목적을 위해 식물 게놈 DNA(염색체 DNA, 미토콘드리아 DNA, 색소체 DNA)에 결합하고, 닉킹 또는 절단하기 위한 도구로서 이용될 수 있다. 식물 세포에서 Cpf1 엔도뉴클레아제의 최적 활성은 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체(또는 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체를 포함하는 숙주 세포)를 28℃ 초과 온도, 예컨대 적어도 29℃, 30℃, 31℃, 32℃, 33℃, 34℃, 35℃, 36℃, 37℃, 38℃, 39℃, 40℃, 41℃, 42℃, 43℃, 44℃ 또는 45℃ 내지 50℃까지 또는 Cpf1 엔도뉴클레아제를 기능적으로 유도하는 임의의 온도까지, 그러나 이에 한정되지는 않는 온도에서 인큐베이션하여 수득될 수 있다. 28℃를 초과하는 이러한 온도에서의 인큐베이션 시간은 적어도 약 10분, 20분, 30분, 40분, 50분, 1 hr, 2 hr, 3 hr, 4 hr, 5 hr, 6 hr, 7 hr, 8 hr, 9 hr, 10 hr, 11 hr, 12 hr, 13 hr, 14 hr, 15 hr, 16 hr, 17 hr, 18 hr, 19 hr, 20 hr, 21 hr, 22 hr, 23 hr, 24 hr, 25 hr, 26 hr, 27 hr, 28 hr, 29 hr, 30 hr, 31 hr, 32 hr, 33 hr, 34 hr, 35 hr, 36 hr, 37 hr, 38 hr, 39 hr, 40 hr, 41 hr, 42 hr, 43 hr, 44 hr, 45 hr, 46 hr, 47 hr, 48 hr, 적어도 3일, 4일, 5일, 6일, 7일, 적어도 1주, 2주, 3주, 4주, 5주, 적어도 1개월, 2개월, 3개월 내지 생물의 전체 수명까지의 기간 동안일 수 있다.
식물 세포에서 Cpf1 엔도뉴클레아제의 최적 활성은 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체(또는 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체를 포함하는 식물 세포 또는 식물)를 29℃ 내지 30℃, 29℃ 내지 35℃, 29℃ 내지 40℃, 29℃ 내지 45℃, 29℃ 내지 50℃, 30℃ 내지 35℃, 35℃ 내지 40℃, 40℃ 내지 45℃ 및 45℃ 내지 50℃의 온도에서 인큐베이션하여 수득될 수 있다.
일부 구현예에서, Cpf1 엔도뉴클레아제 활성은 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체, 또는 이러한 복합체를 포함하는 숙주 세포의 온도 환경을 28℃ 이하 온도(Cpf1 엔도뉴클레아제가 거의 불활성인 온도 요법인 20℃, 21℃, 22℃, 23℃, 24℃, 25℃, 26℃, 26℃ 내지 28℃의 범위)에서 적어도 29℃, 30℃, 31℃, 32℃, 33℃, 34℃, 35℃, 36℃, 37℃, 38℃, 39℃, 40℃, 41℃, 42℃, 43℃, 44℃ 또는 45℃ 또는 50℃까지 또는 Cpf1 엔도뉴클레아제를 기능적으로 유도하는 임의의 온도까지 증가시킴으로써 활성화될 수 있다. 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체, 또는 이러한 복합체를 포함하는 숙주 세포가 노출되는 온도 증가 기간은, 적어도 약 10분, 20분, 30분, 40분, 50분, 1 hr, 2 hr, 3 hr, 4 hr, 5 hr, 6 hr, 7 hr, 8 hr, 9 hr, 10 hr, 11 hr, 12 hr, 13 hr, 14 hr, 15 hr, 16 hr, 17 hr, 18 hr, 19 hr, 20 hr, 21 hr, 22 hr, 23 hr, 24 hr, 25 hr, 26 hr, 27 hr, 28 hr, 29 hr, 30 hr, 31 hr, 32 hr, 33 hr, 34 hr, 35 hr, 36 hr, 37 hr, 38 hr, 39 hr, 40 hr, 41 hr, 42 hr, 43 hr, 44 hr, 45 hr, 46 hr, 47 hr, 48 hr, 3일, 4일, 5일, 6일, 7일, 적어도 1주, 2주, 3주, 4주, 5주 또는 적어도 수 개월 내지 3개월까지, 또는 Cpf1 엔도뉴클레아제를 기능적으로 유도하는 임의의 시기까지의 기간 동안일 수 있다. 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 활성의 일시적 유도, 예컨대, 그러나 한정되지는 않고 Cpf1 엔도뉴클레아제를 포함하는 식물 세포의 28℃ 초과 온도로의 노출은 식물 세포, 식물 배아 및/또는 식물의 임의의 발달 단계일 수 있고 식물 꽃가루를 포함하는 임의의 식물 세포 유형에서 유도될 수 있다. Cpf1 엔도뉴클레아제(또는 Cpf1 엔도뉴클레아제를 발현하는 재조합 작제물) 및 가이드 RNA(및/또는 가이드 RNA를 발현하는 재조합 작제물)을 포함하는 식물의 자손이 또한 증가된 온도(28℃ 초과 내지 50℃ 까지) 노출되어 자손 식물(발달 동안 원하는 단계에서) 내에서 RNA/Cpf1 복합체를 활성화할 수 있고 이는 자손 식물이 가이드 RNA/Cpf1 엔도뉴클레아제 복합체에 의해 인식되는 특정 표적 부위에서 변형될 수 있도록 한다. 예를 들어, 식물 세포의 감수분열 동안 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 시스템의 일시적 유도는 감수분열 동안에만 접근 가능한 게놈 영역, 예컨대 낮은 재조합 빈도를 갖는 것으로 알려진 영역 또는 동원체 영역에서 DNA 절단 변화를 증가시키는 반면 다른 식물 세포 발달 단계 동안 활성을 최소화하거나 제거할 수 있다.
본원에 기술된 조절되는(온도 유도성) 가이드 RNA/Cpf1 시스템은 특히 게놈 조작을 위해, 예를 들어 식물 게놈 조작에서 뉴클레아제의 표적을 벗어난 절단이 표적화된 세포에 대해 독성일 수 있거나 달리 원하지 않는 상황에서 유용하다. Cpf1 엔도뉴클레아제가 증가된 온도 처리(28℃ 초과 내지 50℃까지) 동안 DNA를 가장 효율적으로 절단할 것이며 식물 세포 또는 Cpf1 환경의 온도가 29℃ 미만 온도로 다시 감소되는 경우 불활성이거나 최소 활성이므로, Cpf1 엔도뉴클레아제 활성의 일시적 유도는 표적을 벗어난 절단의 감소를 허용한다. 일 양태에서, 표적을 벗어난 절단 감소는 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 99%, 5~10%, 10~20%, 20~30%, 30~40%, 40~50%, 50~60%, 60~70%, 70~80%, 80~90%, 90~99% 내지 100%까지일 수 있다. 표적을 벗어난 절단의 백분율(%)은 당분야, 예컨대 문헌[Koo et al. Molecules and Cells 2015, 38(6):475-481 및 Cho et al. Genome Res 2014, 24(1):132-141]에 공지된 그러나 이에 한정되지 않는 임의의 방법에 의해 측정될 수 있다.
일부 구현예에서, 본 발명은 표적 서열을 갖는 표적 핵산 분자를 데옥시리보핵산(DNA)을 포함하며 핵산 내 표적 서열과 혼성화하도록 배치된 가변 표적화 도메인을 포함하는 단일 가이드 폴리뉴클레오티드; 리보핵산(RNA)을 포함하는 가변 표적화 도메인에 인접한 Cpf1 인식 도메인; 및 Cpf1 폴리펩티드와 접촉시키는 단계를 포함하는 Cpf1 시스템을 사용하여 표적을 벗어난 변형을 감소시키기 위한 방법을 제공하며, 상기 단일 가이드 폴리뉴클레오티드는 Cpf1 폴리펩티드와 복합체를 형성하고 상기 표적 핵산 분자는 표적 핵산 내 다른 서열에서보다 더 우선적으로 표적 서열에서 절단되거나 편집되어 표적을 벗어난 변형을 감소시킨다. 일부 구현예에서, 표적 핵산은 DNA이며, 일부 구현예에서 표적 핵산은 RNA이고, 일부 구현예에서 표적 핵산은 RNA 및 DNA의 혼합물이다. 일부 구현예에서, Cpf1 인식 도메인은 표적 영역의 하류이다. 일부 구현예에서, Cpf1 인식 도메인은 표적 영역의 상류이다. 일부 구현예에서, Cpf1 인식 도메인은 하부 줄기, 루프, 상부 줄기, 헤어핀, 또는 이의 임의의 조합으로 이루어진 군으로부터 선택된 구조를 포함한다. 일부 구현예에서, Cpf1 인식 도메인은 줄기 루프 구조를 포함한다. 일부 구현예에서, Cpf1 인식 도메인은 Cpf1 폴리펩티드와 상호작용한다. 일부 구현예에서, Cpf1 인식 도메인은 DNA 및 RNA의 혼합물을 포함한다. 일부 구현예에서, 가변 표적화 도메인은 DNA 및 RNA의 혼합물을 포함한다. 일부 구현예에서, 가변 표적화 도메인은 우라실을 포함하지 않는다.
본원에 기술된 Cpf1 엔도뉴클레아제는 표적화된 게놈 편집(심플렉스 및 멀티플렉스 이중 가닥 절단 및 닉을 통해) 및 표적화된 게놈 조절(Cpf1 단백질 또는 단일 가이드 RNA(sgRNA)로의 후성적 이펙터 도메인의 테더링을 통해)을 위해 사용될 수 있다. Cpf1 엔도뉴클레아제는 RNA-유도 재조합효소로서 기능하도록 조작될 수도 있으며, RNA 테더를 통해 다중단백질과 핵산 복합체의 조립을 위한 스캐폴드로서 역할할 수 있다(Mali et al., 2013, Nature Methods Vol. 10: 957-963).
본원의 Cpf1 단백질은 하나 이상의 이종 핵 국재화 서열(NLS)을 포함할 수 있다. 본원의 이종 NLS 아미노산 서열은 본원의 진핵생물 세포, 예를 들어, 식물 세포의 핵에서 검출 가능한 양으로 단백질의 축적을 유도하기에 충분한 강도일 수 있다. NLS는 염기성의, 양으로 하전된 잔기(예를 들어, 라이신 및/또는 아르기닌)의 하나(1부분(monopartite)) 이상(예를 들어, 2부분(bipartite))의 짧은 서열(예를 들어, 2개 내지 20개의 잔기)을 포함할 수 있으며, Cpf1 아미노산 서열 중 어디에도, 그러나 단백질 표면 상에 노출되도록 위치할 수 있다. NLS는, 예를 들어, 본원의 Cpf1 단백질의 N 말단 또는 C 말단에 작동 가능하게 연결될 수 있다. 둘 이상의 NLS 서열이 Cpf1 단백질에, 예를 들어, Cpf1 단백질의 N 말단과 C 말단 모두에 연결될 수 있다. Cpf1 엔도뉴클레아제 유전자는 Cpf1 코돈 영역 상류의 SV40 핵 표적화 신호 및 Cpf1 코돈 영역 하류의 2부분 VirD2 핵 국재화 신호(Tinland et al. (1992) Proc. Natl. Acad. Sci. USA 89:7442-6)에 작동 가능하게 연결될 수 있다. 본원의 적합한 NLS 서열의 비제한적 예는 미국 특허 6660830호 및 7309576호에 개시된 것들을 포함하며, 둘 다 본원에 참조로 포함된다.
본원의 용어 "식물-최적화된 Cpf1 엔도뉴클레아제"는 식물 세포 또는 식물에서의 발현에 대해 최적화된 뉴클레오티드 서열에 의해 암호화된 Cpf1 단백질을 지칭한다.
"Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 뉴클레오티드 서열", "Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 작제물" 및 "Cpf1을 암호화하는 식물-최적화된 폴리뉴클레오티드"는 본원에서 상호 교환적으로 사용되며, 식물 세포 또는 식물에서의 발현을 위해 최적화된 Cpf1 엔도뉴클레아제 단백질, 또는 이의 변이체 또는 기능적 단편을 암호화하는 뉴클레오티드 서열을 지칭한다. 식물-최적화된 Cpf1 엔도뉴클레아제를 포함하는 식물은 Cpf1 서열을 암호화하는 뉴클레오티드 서열을 포함하는 식물 및/또는 Cpf1 엔도뉴클레아제 단백질을 포함하는 식물을 포함한다. 일 양태에서, 식물-최적화된 Cpf1 엔도뉴클레아제 뉴클레오티드 서열은 그로부터 최적화되는 야생형 서열과 비교할 때 Cpf1 단백질 발현을 증가시킨다. 일 양태에서, Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 뉴클레오티드 서열은 옥수수-최적화, 카놀라-최적화, 해바라기-최적화, 벼-최적화, 밀-최적화, 또는 대두-최적화 Cpf1 엔도뉴클레아제이다. 일 양태에서, 식물-최적화된 뉴클레오티드 서열은 SEQ ID NO: 10, 또는 SEQ ID NO: 11의 단백질, 또는 이의 기능적 단편을 암호화한다. 식물-최적화된 뉴클레오티드 서열은 코돈-최적화 유전자를 포함한다. 식물-최적화된 뉴클레오티드 서열은 향상된 발현을 위한 하나 이상의 식물-선호 코돈을 사용하여, 단백질, 예를 들어 본원에 개시된 바와 같은 Cpf1 엔도뉴클레아제를 암호화하는 뉴클레오티드 서열을 변형하여 합성될 수 있다. 예를 들어, 숙주-선호 코돈 사용의 논의에 대해서는 문헌[Campbell and Gowri (1990) Plant Physiol. 92:1-11]을 참고한다.
임의의 Cpf1 단백질(또는 Cpf1 단백질을 암호화하는 임의의 DNA 서열)이 본원에 기술된 방법을 위해 사용될 수 있고 SEQ ID NO: 10, 11, 32 또는 33의 Cpf1 단백질, 또는 SEQ ID NO: 10, 11, 32 또는 33의 기능적 변이체, 또는 SEQ ID NO: 10, 11, 32 또는 33의 기능적 단편을 포함하지만 이에 한정되는 것은 아니다. 본원에 제공된 조성물 및 방법에서 사용하기 위한 다른 Cpf1 단백질은, 예를 들어, 미국 특허 공개 2016/0208243호에 기술된 것들을 포함한다.
용어 Cpf1 엔도뉴클레아제의 "기능적 단편", "기능적으로 동등한 단편" 및 "기능적 동등 단편"은 본원에서 상호 교환적으로 사용되며, 표적 부위를 인식하고, 결합하고, 선택적으로 닉킹 또는 절단(단일 또는 이중 가닥 절단을 도입)하는 능력이 유지되는 Cpf1 엔도뉴클레아제 단백질 서열의 일부 또는 하위서열을 지칭한다.
용어 Cpf1 엔도뉴클레아제의 "기능적 변이체", "기능적으로 동등한 변이체" 및 "기능적 동등 변이체"는 본원에서 상호 교환적으로 사용되며, 표적 부위를 인식하고, 결합하고, 선택적으로 닉킹 또는 절단(단일 또는 이중 가닥 절단을 도입)하는 능력이 유지되는 Cpf1 엔도뉴클레아제 단백질 서열의 변이체를 지칭한다. 단편 및 변이체는 부위 특이적 돌연변이유발 및 합성 제조와 같은 방법을 통해 수득될 수 있다.
Cpf1 엔도뉴클레아제의 기능적 단편은 참조 Cpf1 단백질, 예컨대 SEQ ID NO: 10 또는 11의 본 발명의 참조 Cpf1 엔도뉴클레아제의 50~100개, 100~200개, 100~300개, 100~400개, 100~500개, 100~600개, 100~700개, 100~800개, 100~900개, 100~1000개, 200~300개, 200~400개, 200~500개, 200~600개, 200~700개, 200~800개, 200~900개, 200~1000개, 300~400개, 300~500개, 300~600개, 300~700개, 300~800개, 300~900개, 300~1000개, 400~500개, 400~600개, 400~700개, 400~800개, 400~900개, 400~1000개, 500~600개, 500~700개, 500~800개, 500~900개, 500~1000개, 600~700개, 600~800개, 600~900개, 600~1000개, 700~800개, 700~900개, 700~1000개, 800~900개, 800~1000개, 900~1000개, 1000~1100개, 1100~1200개 또는 1200~1300개 아미노산을 포함하는 단편을 포함한다.
Cpf1 엔도뉴클레아제의 기능적 단편은 가이드 폴리뉴클레오티드 결합 도메인(가이드 RNA에 결합하거나 혼성화할 수 있는 아미노산 도메인), crRNA 결합 도메인(crRNA에 결합하거나 혼성화할 수 있는 아미노산 도메인), DNA 결합 도메인(DNA 표적 서열에 결합할 수 있는 아미노산 도메인), DNA 절단 도메인(DNA 표적 서열을 절단할 수 있는 아미노산 도메인), 및 이의 임의의 조합으로 이루어진 군으로부터 선택된 적어도 하나의 도메인을 포함하는 단백질을 포함한다.
개시된 방법에서 사용하기 위한 Cpf1 단백질, 또는 이의 기능적 단편은 유전적으로 변형된 숙주 세포(예컨대 곤충 세포 또는 효모 세포 또는 인간-유래 세포주)가 Cpf1 단백질을 암호화하는 핵산 서열을 발현하도록 변형되는 재조합 원천으로부터 단리될 수 있다. 대안적으로, Cpf1 단백질은 무세포 단백질 발현 시스템을 사용하여 생성되거나 합성적으로 생성될 수 있다.
Cpf1 엔도뉴클레아제의 기능적 변이체는 Cpf1 폴리펩티드의 변형된 형태를 포함할 수 있다. Cpf1 폴리펩티드의 변형된 형태는 Cpf1 단백질의 자연 발생 뉴클레아제 활성을 감소시키는 아미노산 변화(예를 들어, 결실, 삽입, 또는 치환)를 포함할 수 있다. 예를 들어, 일부 경우, Cpf1 단백질의 변형된 형태는 대응 야생형 Cpf1 폴리펩티드의 뉴클레아제 활성의 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만, 또는 1% 미만을 갖는다. 일부 경우, Cpf1 폴리펩티드의 변형된 형태는 실질적인 뉴클레아제 활성을 갖지 않으며, 촉매적으로 "불활성화된 Cpf1" 또는 "비활성화된 Cpf1(dCpf1)"로 지칭된다.
Cpf1 단백질 서열의 기능적 변이체가 사용될 수 있지만, 본원의 RNA 성분과 결합할 경우 DNA에 대한 특이적 결합 활성 및 선택적으로 엔도뉴클레오리틱 활성을 가져야 한다. 이러한 기능적 변이체는 참조 Cpf1의 아미노산 서열과 적어도 약 20%, 30%, 40%, 50%, 60%, 70%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 아미노산 서열을 포함할 수 있다. 이러한 변이체 Cpf1 단백질은 본원의 RNA 성분과 결합할 경우 DNA에 대한 특이적 결합 활성, 및 선택적으로 절단 또는 닉킹 활성을 가져야 한다.
본원에 기술된 가이드 폴리뉴클레오티드 Cpf1 시스템의 온도 유도를 이용하여 Cpf1 엔도뉴클레아제의 절단 활성을 조절할 수 있다. 일 양태에서, 이는 표적을 벗어난 절단 활성의 가능성을 감소시킬 플라스미드 DNA 발현 카세트로부터의 Cpf1 엔도뉴클레아제 활성의 일시적 펄스를 제공할 수 있다. 추가로, 플라스미드 DNA 발현 카세트로부터의 가이드 RNA/Cpf1 활성의 온도 유도를 이용하여 이것이 세포 내로 도입된 지 오랜 시간이 지난 후 원하는 세포, 조직 배양 또는 식물 발달 단계로 절단 활성의 시간을 조절할 수 있다. 본원에 기술된 가이드 폴리뉴클레오티드 Cpf1 시스템은 또한 Cpf1 엔도뉴클레아제 활성에 대한 추가 제어를 제공하기 위해 유도성(예컨대 열 충격, 화학약물 또는 세포 주기) 또는 조직 특이적 프로모터와 조합될 수 있다.
Cpf1 엔도뉴클레아제 단편 및 변이체는 부위 특이적 돌연변이유발 및 합성 제조와 같은 방법을 통해 수득할 수 있다.
본 발명의 Cpf1 엔도뉴클레아제의 단편 및/또는 변이체가 기능적인지 여부를 결정하는 방법은 적합한 폴리뉴클레오티드와 조합된 경우 단편 또는 변이체의 엔도뉴클레아제 활성을 측정하는 방법을 포함한다. 엔도뉴클레아제 활성을 측정하는 방법은, 예컨대, 그러나 이에 한정되지 않는, 본원에 참조로 포함되는 2013년 5월 1일에 출원된 PCT/US13/39011, 2016년 5월 12일에 출원된 PCT/US16/32073, 2016년 5월 12일에 출원된 PCT/US16/32028에 널리 공지되어 있다. Cpf1 엔도뉴클레아제 활성을 측정하는 방법은 이중 가닥 절단이 발생한 후 표적 부위에서 돌연변이 빈도를 측정하는 방법을 포함한다.
Cpf1 엔도뉴클레아제 활성을 측정하는 방법은 이중 가닥 절단이 발생한 후 표적 부위에서 돌연변이 빈도를 측정하는 방법을 포함한다. 본 발명의 Cpf1 엔도뉴클레아제의 기능적 단편 또는 기능적 변이체가 이중 가닥 절단을 제조할 수 있는지를 측정하는 방법은 하기 방법을 포함한다: 간략하게, 적절한 CRISPR-Cpf1 옥수수 게놈 DNA 표적 부위가 선택될 수 있고, 가이드 RNA 전사 카세트(가이드 RNA를 발현하는 재조합 DNA) 및 본 발명의 Cpf1 엔도뉴클레아제를 발현하는 DNA 재조합 작제물(또는 본 발명의 Cpf1 엔도뉴클레아제의 기능적 단편, 또는 본 발명의 Cpf1 엔도뉴클레아제 변이체의 기능적 변이체가 제조될 수 있고 문헌[Svitashev et al. (2015)]에 기술된 BBM 및 WUS2 유전자의 존재 하에 Hi-II형 10-일령 미성숙 옥수수 배아(IME)의 바이올리스틱 형질전환에 의해 공동 전달될 수 있다. 황색 형광 단백질을 암호화하는 시각 마커 DNA 발현 카세트는 또한 균일하게 형질전환된 IME의 선택을 보조하기 위해 가이드 RNA 전사 카세트 및 Cpf1 엔도뉴클레아제 발현 카세트(재조합 DNA 작제물)와 공동-전달될 수 있다. 2일 후, 20~30개의 거의 균일하게 형질전환된 IME는 이의 형광에 기반하여 수확될 수 있다. 전체 게놈 DNA가 추출되고 의도되는 표적 부위 주변 DNA 영역이 앰플리콘-특이적 바코드 및 Illumnia 서열분석을 위해 필요한 서열에 부가하여 Phusion® HighFidelity PCR 마스터 믹스(New England Biolabs, M0531L)로 PCR 증폭되고 심층 서열분석된다. 이어서 생성된 판독치가 가이드 RNA 전사 카세트가 형질전환으로부터 생략되는 대조 실험과의 비교에 의해 예상되는 절단 부위에서 돌연변이의 존재에 대해 조사된다. 적합한 가이드 폴리뉴클레오티드와의 복합체인, 본 발명의 Cpf1 엔도뉴클레아제의 단편 또는 변이체를 사용하는 경우, 의도되는 표적 부위에서 돌연변이가 관찰되면, 단편 또는 변이체는 기능적이다.
본 발명의 Cpf1 엔도뉴클레아제의 기능적 단편 또는 기능적 변이체가 이중 가닥 DNA 표적 부위에서 단일 가닥 절단(닉으로도 지칭됨; 따라서 닉카아제로 작용함)을 제조할 수 있는지를 측정하는 방법은 하기 방법을 포함한다: 이중 가닥 DNA 표적에서 염색체 단일 가닥 절단(SSB)의 세포성 복구는 전형적으로 식물 세포, 예컨대 옥수수에서 계속해서 복구될 수 있다. 따라서, 닉킹 활성에 대한 기능적 Cpf1 단편 또는 Cpf1에 대한 기능적 변이체를 조사하기 위해, 각각 이중 가닥 DNA의 상이한 가닥(센스 및 안티센스 DNA 가닥)을 표적화하는, 가까이 인접한(0~200 bp) 2개의 염색체 DNA 표적 부위가 표적화될 수 있다. SSB 활성이 존재하는 경우, 두 표적 부위로부터의 SSB 활성은 옥수수 세포에서 삽입 또는 결실(삽입-결실) 돌연변이유발을 생성할 DNA 이중 가닥 절단(DSB)을 일으킬 것이다. 이어서 상기 결과는 문헌[Karvelis et al. (2015)]에 기술된 것과 유사한 Cpf1 닉카아제의 활성을 검출하고 모니터링하기 위해 사용될 수 있다. 간략하게, 적절한 CRISPR-Cpf1 옥수수 게놈 DNA 표적 부위가 선택되고, 가이드 RNA 전사 카세트 및 기능적 단편 Cpf1 닉킹 발현 카세트가 제조되고 문헌[Svitashev et al. (2015)]에 기술된 바와 같이 BBM 및 WUS2 유전자의 존재 하에 Hi-II형 10-일령 미성숙 옥수수 배아(IME) 내로 바이올리스틱 형질전환에 의해 공동 전달된다. 입자 총 형질전환은 매우 가변적일 수 있으므로, 황색 형광 단백질을 암호화하는 시각 마커 DNA 발현 카세트가 또한 균일하게 형질전환된 IME[미성숙 옥수수 배아]의 선택을 보조하기 위해 공동 전달될 수 있다. 2일 후, 20~30개의 거의 균일하게 형질전환된 IME가 이의 형광에 기반하여 수확되고, 전체 게놈 DNA가 추출되고, 의도되는 표적 부위 주변 영역이 앰플리콘-특이적 바코드 및 Illumnia 서열분석을 위해 필요한 서열에 부가하여 Phusion® HighFidelity PCR 마스터 믹스(New England Biolabs, M0531L)로 PCR 증폭되고 심층 서열분석된다. 이어서 생성 판독치가 소형 RNA 전사 카세트가 형질전환으로부터 생략되는 대조 실험과의 비교에 의해 예상되는 절단 부위에서 돌연변이의 존재에 대해 조사된다.
본 발명의 Cpf1 엔도뉴클레아제의 기능적 변이체의 기능적 단편이 의도되는 DNA 표적 부위에 결합할 수 있는지를 측정하는 방법은 하기 방법을 포함한다: 옥수수 염색체 DNA 표적 부위의 결합은 이중 가닥 DNA 표적 부위에서 단일 가닥 절단(SSB) 또는 이중 가닥 절단(DSB)을 일으키지 않는다. 따라서, 옥수수 세포에서의 결합 활성에 대한 기능적 Cpf1 단편을 조사하기 위해, 또 다른 뉴클레아제 도메인(예컨대, FokI)이 결합 활성을 갖는 기능적 Cpf1 단편에 부착될 수 있다. 결합 활성이 존재하는 경우, 부가된 뉴클레아제 도메인이 옥수수 세포에서 삽입 또는 결실(삽입-결실) 돌연변이유발을 생성할 DSB를 생성하기 위해 사용될 수 있다. 이어서 상기 결과는 문헌[Karvelis et al. (2015)]에 기술된 것과 유사한 Cpf1의 결합 활성을 검출하고 모니터링하기 위해 사용될 수 있다. 간략하게, 적절한 CRISPR-Cpf1 옥수수 게놈 DNA 표적 부위가 선택될 수 있고, 가이드 RNA 전사 카세트 및 기능적 단편 Cpf1 결합 및 뉴클레아제 부착 발현 카세트가 제조되고 문헌[Svitashev et al. (2015)]에 기술된 바와 같이 BBM 및 WUS2 유전자의 존재 하에 Hi-II형 10-일령 미성숙 옥수수 배아(IME) 내로 바이올리스틱 형질전환에 의해 공동 전달될 수 있다. 황색 형광 단백질을 암호화하는 시각 마커 DNA 발현 카세트가 또한 균일하게 형질전환된 IME[미성숙 옥수수 배아]의 선택을 보조하기 위해 공동 전달될 수 있다. 2일 후, 20~30개의 거의 균일하게 형질전환된 IME가 이의 형광에 기반하여 수확되고, 전체 게놈 DNA가 추출되고, 의도되는 표적 부위 주변 영역이 앰플리콘-특이적 바코드 및 Illumnia 서열분석을 위해 필요한 서열에 부가하여 Phusion® HighFidelity PCR 마스터 믹스(New England Biolabs, M0531L)로 PCR 증폭되고 심층 서열분석될 수 있다. 이어서 생성 판독치가 소형 RNA 전사 카세트가 형질전환으로부터 생략된 대조 실험과의 비교에 의해 예상되는 절단 부위에서 돌연변이의 존재에 대해 조사될 수 있다.
대안적으로, 옥수수 염색체 DNA 표적 부위의 결합 활성이 유전자의 전사 유도 또는 억제에 의해 모니터링될 수 있다. 이는 기능적 Cpf1 결합 단편으로 전사 활성화 또는 억제 도메인을 부착하고 이를 유전자의 프로모터 영역으로 표적화하고 결합이 유전자 전사체 또는 단백질의 축적 증가를 통해 모니터링되어 달성될 수 있다. 활성화 또는 억제를 위해 표적화된 유전자는 임의의 자연 발생 옥수수 유전자 또는 당분야에 공지된 방법(예컨대 입자 총 또는 아그로박테리움 형질전환)에 의해 옥수수 게놈 내로 도입된 조작된 유전자(예컨대 적색 형광 단백질을 암호화한 유전자)일 수 있다.
Cpf1 단백질은 하나 이상의 이종 단백질 도메인(예를 들어, Cpf1 단백질에 부가하여 1개, 2개, 3개 이상의 도메인)을 포함하는 융합 단백질의 일부일 수 있다. 이러한 융합 단백질은 임의의 추가적인 단백질 서열, 및 선택적으로 임의의 두 도메인 사이, 예컨대, Cpf1과 제1 이종 도메인 사이의 링커 서열을 포함할 수 있다. 본원의 Cpf1 단백질에 융합될 수 있는 단백질 도메인의 예는 에피토프 태그(예를 들어, 히스티딘[His], V5, FLAG, 인플루엔자 혈구응집소[HA], myc, VSV-G, 티오레독신[Trx]), 리포터(예를 들어, 글루타티온-5-트랜스퍼라아제[GST], 홀스래디쉬 퍼옥시다아제[HRP], 클로람페니콜 아세틸트랜스퍼라아제[CAT], 베타-갈락토시다아제, 베타-글루쿠로니다아제[GUS], 루시퍼라아제, 녹색 형광 단백질[GFP], HcRed, DsRed, 청록색 형광 단백질[CFP], 황색 형광 단백질[YFP], 청색 형광 단백질[BFP]), 및 메틸라아제 활성, 탈메틸라아제 활성, 전사 활성화 활성(예를 들어, VP16 또는 VP64), 전사 억제 활성, 전사 방출 인자 활성, 히스톤 변형 활성, RNA 절단 활성 및 핵산 결합 활성 중 하나 이상을 갖는 도메인을 포함하지만 이에 한정되는 것은 아니다. Cpf1 단백질은 DNA 분자 또는 다른 분자에 결합하는 단백질, 예컨대, 말토스 결합 단백질(MBP), S-태그, Lex A DNA 결합 도메인(DBD), GAL4A DNA 결합 도메인, 및 단순 헤르페스 바이러스(HSV) VP16과 융합될 수도 있다.
촉매 불활성화 Cpf1은 이종 서열에 융합될 수 있다. 적합한 융합 상대는 표적 DNA 상에 또는 표적 DNA와 결합된 폴리펩티드(예를 들어, 히스톤 또는 다른 DNA-결합 단백질) 상에 직접 작용하여 전사를 간접적으로 증가시키는 활성을 제공하는 폴리펩티드를 포함하나, 이에 한정되는 것은 아니다. 추가적인 적합한 융합 상대는 메틸트랜스퍼라아제 활성, 탈메틸라아제 활성, 아세틸트랜스퍼라아제 활성, 탈아세틸라아제 활성, 키나아제 활성, 포스파타아제 활성, 유비퀴틴 리가아제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO일화 활성, 탈SUMO일화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성, 또는 탈미리스토일화 활성을 제공하는 폴리펩티드를 포함하나, 이에 한정되는 것은 아니다. 또한 적합한 융합 상대는 표적 핵산의 증가된 전사를 직접적으로 제공하는 폴리펩티드(예를 들어, 전사 활성인자 또는 이의 단편, 전사 활성인자를 모집하는 단백질 또는 이의 단편, 소분자/약물 반응성 전사 조절인자 등)를 포함하나, 이에 한정되는 것은 아니다. 촉매 불활성 Cpf1은 또한 FokI 뉴클레아제에 융합되어 이중 가닥 절단을 생성할 수 있다.
본원에 사용된 용어 "가이드 폴리뉴클레오티드"는 Cas 엔도뉴클레아제, 예컨대 Cpf1 엔도뉴클레아제 또는 Cas9 엔도뉴클레아제와 복합체를 형성할 수 있고, Cas 엔도뉴클레아제가 DNA 표적 부위를 인식하고, 결합하고, 선택적으로 절단할 수 있게 하는 폴리뉴클레오티드 서열에 관한 것이다. Cpf1 엔도뉴클레아제 시스템에 있어서, 용어 가이드 폴리뉴클레오티드 및 cr폴리뉴클레오티드는 상호 교환적으로 사용될 수 있다. 가이드 폴리뉴클레오티드 서열은 RNA 서열, DNA 서열, 또는 이의 조합(RNA-DNA 폴리뉴클레오티드로도 지칭되는 RNA-DNA 조합 서열)일 수 있다.  선택적으로, 가이드 폴리뉴클레오티드는 적어도 하나의 뉴클레오티드, 포스포디에스테르 결합 또는 연결 변형, 예컨대, 고정 핵산(LNA), 5-메틸 dC, 2,6-디아미노퓨린, 2'-플루오로 A, 2'-플루오로 U, 2'-O-메틸 RNA, 포스포로티오에이트 결합, 콜레스테롤 분자에 대한 연결, 폴리에틸렌 글리콜 분자에 대한 연결, 스페이서 18(헥사에틸렌 글리콜 사슬) 분자에 대한 연결, 또는 고리화를 초래하는 5'에서 3'으로의 공유 연결을 포함할 수 있으나, 이에 한정되는 것은 아니다. 리보핵산만을 포함하는 가이드 폴리뉴클레오티드는 "가이드 RNA" 또는 "gRNA"로도 지칭된다(또한 둘 다 본원에 참조로 포함되는, 2015년 3월 19일에 공개된 미국 특허 출원 US20150082478 및 2015년 2월 26일에 공개된 US20150059010을 참고한다).
가이드 폴리뉴클레오티드는 Cas 엔도뉴클레아제 인식 도메인(Cas endonuclease recognition(CER) 도메인; Cpf1 엔도뉴클레아제에 대해 Cpf1 인식 도메인)으로 지칭되는 Cas 엔도뉴클레아제(예컨대 Cpf1 엔도뉴클레아제)에 의해 인식되는 제1 뉴클레오티드 서열 도메인 및 표적 DNA에서 뉴클레오티드 서열과 혼성화할 수 있는 가변 표적화(Variable Targeting) 도메인 또는 VT 도메인을 포함한다. Cpf1 엔도뉴클레아제 시스템에 있어서, 용어 가이드 RNA 및 crRNA는 상호 교환적으로 사용될 수 있다. 가이드 폴리뉴클레오티드는 단일 분자(단일 가이드 폴리뉴클레오티드, sgRNA로도 지칭됨)를 포함한다. "도메인"이란 RNA, DNA, 및/또는 RNA-DNA-조합 서열(하이브리드 DNA-RNA 또는 hDRNA로도 지칭됨)일 수 있는 뉴클레오티드의 연속 스트레치를 의미한다. 가이드 폴리뉴클레오티드의 VT 도메인 및/또는 CER 도메인은 RNA 서열, DNA 서열, 또는 RNA-DNA-조합 서열을 포함할 수 있다. 가이드 폴리뉴클레오티드는 "가이드 RNA"(RNA 뉴클레오티드의 연속 스트레치로 이루어지는 경우) 또는 "가이드 DNA"(DNA 뉴클레오티드의 연속 스트레치로 이루어지는 경우) 또는 "가이드 RNA-DNA"(RNA 및 DNA 뉴클레오티드의 조합으로 이루어지는 경우)로 지칭될 수 있다.  하나의 양태에서, 가이드 폴리뉴클레오티드는 Cpf1 엔도뉴클레아제와 복합체를 형성할 수 있으며, 상기 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체(가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 시스템으로도 지칭됨)는 Cpf1 엔도뉴클레아제를 게놈 표적 부위로 유도하여 Cpf1 엔도뉴클레아제가 표적 부위를 인식하고, 결합하고, 선택적으로 닉킹 또는 절단(단일 또는 이중 가닥 절단을 도입)하게 할 수 있다.
일부 구현예에서, 가이드 폴리뉴클레오티드의 VT 도메인 및/또는 Cpf1 인식 도메인은 RNA 서열, DNA 서열, 또는 RNA-DNA-조합 서열을 포함할 수 있다. 예를 들어, VT 도메인은 RNA 서열, 또는 VT 서열 내에 하나 이상의 DNA 뉴클레오티드를 포함하는 RNA 서열을 포함할 수 있다. 유사하게, Cpf1 인식 도메인은 RNA 서열, 또는 CER 서열 내에 하나 이상의 DNA 뉴클레오티드를 포함하는 RNA 서열을 포함할 수 있다. 또 다른 예에서, 가이드 폴리뉴클레오티드는 VT 도메인 내에 하나 이상의 DNA 뉴클레오티드 및 CER 도메인 내에 하나 이상의 DNA 뉴클레오티드를 포함하는 RNA 서열을 포함할 수 있다.
일 양태에서 가이드 폴리뉴클레오티드는 Cpf1 인식 도메인에 적어도 하나의 DNA 뉴클레오티드 및/또는 가변 표적화 도메인에 적어도 하나의 DNA 뉴클레오티드를 포함하는 DNA-RNA 가이드 폴리뉴클레오티드(하이브리드 DNA-RNA 가이드 폴리뉴클레오티드, hDRNA, RNA-DNA 폴리뉴클레오티드로도 지칭됨)이다.
일 양태에서 가이드 폴리뉴클레오티드의 Cpf1 인식 도메인은 5' 줄기 루프 3' 줄기 이차 구조를 형성할 수 있으며, 상기 Cpf1 인식 도메인은 RNA 및 적어도 하나의 DNA 뉴클레오티드를 포함한다.
일 양태에서 Cpf1 인식 도메인은 5' 말단 또는 루프 구조에 DNA 뉴클레오티드를 포함한다.
일 양태에서 가변 표적화 도메인은 3' 말단에 DNA 뉴클레오티드를 포함한다.
일 양태에서, 가이드 폴리뉴클레오티드는 SEQ ID NO: 40, 41, 42, 43, 44, 45 및 46으로 이루어진 군으로부터 선택된다.
일부 구현예에서, 본 발명은 데옥시리보핵산(DNA), 리보핵산(RNA) 또는 DNA 및 RNA의 혼합물을 포함하고, 핵산에서 표적 서열과 혼성화하도록 배치되는 가변 표적화 도메인; 및 DNA, RNA 또는 DNA 및 RNA의 혼합물을 포함하는 가변 표적화 도메인에 인접한 Cpf1 인식 도메인을 포함하는 Cpf1 시스템과 사용하기 위한 단일 가이드 폴리뉴클레오티드를 제공한다. 일부 구현예에서, Cpf1 인식 도메인은 가변 표적화 도메인의 상류이다. 일부 구현예에서, Cpf1 인식 도메인은 하부 줄기, 루프, 상부 줄기, 헤어핀, 이들 중 하나 이상 및 이의 조합으로 이루어진 군으로부터 선택되는 적어도 하나의 이차 구조를 포함한다. 일부 구현예에서, Cpf1 인식 도메인은 내부 듀플렉스를 형성하는 줄기 루프 구조를 포함한다. Cpf1은 줄기 루프 및 줄기 루프에 인접한 서열, 특히 표적 핵산과 혼성화하는 가변 표적화 도메인의 5' 뉴클레오티드를 인식하는 서열 및 구조 특이적 방식으로 가이드 폴리뉴클레오티드의 Cpf1 인식 도메인에 결합할 수 있다. 상기 줄기 루프 구조는 적어도 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 내지 100개까지의 뉴클레오티드 길이일 수 있다. 줄기 루프 구조는 줄기 루프의 루프 구조에 추가 폴리뉴클레오티드의 삽입을 더 포함할 수 있다.
줄기 루프는 5' 요소 및 3' 요소를 포함한다.
일부 구현예에서 Cpf1 인식 도메인의 줄기 루프의 5' 요소는 DNA, RNA 또는 DNA-RNA의 혼합물을 포함한다.
일부 구현예에서 Cpf1 인식 도메인의 줄기 루프의 3' 요소는 DNA, RNA 또는 DNA-RNA의 혼합물을 포함한다.
일부 구현예에서 Cpf1 인식 도메인의 줄기 루프의 루프는 DNA, RNA 또는 DNA-RNA의 혼합물을 포함한다.
일부 구현예에서, Cpf1 인식 도메인은 DNA 및 RNA의 혼합물을 포함하는 줄기 루프 구조를 포함한다. Cpf1 인식 도메인의 DNA-RNA 혼합물은 다양한 비의 DNA 및 RNA를 포함할 수 있다. 특정 구현예에서, 상기 지정은 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% RNA 및 이들 사이의 범위일 수 있다.
일부 구현예에서, 가변 표적화 도메인은 DNA 및 RNA의 혼합물을 포함한다. 가변 표적화 도메인의 DNA-RNA 혼합물은 다양한 비의 DNA 및 RNA를 포함할 수 있다. 특정 구현예에서, 상기 지정은 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% RNA 및 이들 사이의 범위일 수 있다.
일부 구현예에서 가변 표적화 도메인은 DNA를 포함하며 Cpf1 인식 도메인은 DNA를 포함한다.
일부 구현예에서 가변 표적화 도메인은 DNA를 포함하며 Cpf1 인식 도메인은 RNA를 포함한다.
일부 구현예에서 가변 표적화 도메인은 DNA를 포함하며 Cpf1 인식 도메인은 DNA 및 RNA의 혼합물을 포함한다.
일부 구현예에서 가변 표적화 도메인은 RNA를 포함하며 Cpf1 인식 도메인은 DNA를 포함한다.
일부 구현예에서 가변 표적화 도메인은 RNA를 포함하며 Cpf1 인식 도메인은 RNA를 포함한다.
일부 구현예에서 가변 표적화 도메인은 RNA를 포함하며 Cpf1 인식 도메인은 DNA 및 RNA의 혼합물을 포함한다.
일부 구현예에서 가변 표적화 도메인은 DNA 및 RNA의 혼합물을 포함하며 Cpf1 인식 도메인은 DNA를 포함한다.
일부 구현예에서 가변 표적화 도메인은 DNA 및 RNA의 혼합물을 포함하며 Cpf1 인식 도메인은 RNA를 포함한다.
일부 구현예에서 가변 표적화 도메인은 DNA 및 RNA의 혼합물을 포함하며 Cpf1 인식 도메인은 DNA 및 RNA의 혼합물을 포함한다.
일부 구현예에서, 본 발명은 데옥시리보핵산(DNA)을 포함하며 핵산에서 표적 서열과 혼성화하도록 배치된 가변 표적화 도메인; 리보핵산(RNA)을 포함하는 가변 표적화 도메인에 인접한 Cpf1 인식 도메인을 포함하는 단일 가이드 폴리뉴클레오티드를 제공하며, 상기 단일 가이드 폴리뉴클레오티드는 Cpf1 폴리펩티드와 복합체를 형성하고 선택적으로 상기 표적 핵산 분자는 표적 핵산 내 다른 서열에서보다 더 우선적으로 표적 서열에서 절단되거나 편집되어 표적을 벗어난 변형을 감소시킨다. 일부 구현예에서, 표적 핵산은 DNA이며, 일부 구현예에서 표적 핵산은 RNA이고, 일부 구현예에서 표적 핵산은 RNA 및 DNA의 혼합물이다. 일부 구현예에서, Cpf1 인식 도메인은 표적 영역의 하류이다. 일부 구현예에서, Cpf1 인식 도메인은 표적 영역의 상류이다. 일부 구현예에서, Cpf1 인식 도메인은 하부 줄기, 팽창부, 상부 줄기, 교통반점 및 헤어핀으로 이루어진 군으로부터 선택된 구조를 포함한다. 일부 구현예에서, Cpf1 인식 도메인은 줄기 루프 구조를 포함한다. 일부 구현예에서, Cpf1 인식 도메인은 Cpf1 폴리펩티드와 상호작용한다. 일부 구현예에서, Cpf1 인식 도메인은 DNA 및 RNA의 혼합물을 포함한다. 일부 구현예에서, 가변 표적화 도메인은 DNA 및 RNA의 혼합물을 포함한다. 일부 구현예에서, 가변 표적화 도메인에는 우라실이 없다.
일부 구현예에서, Cpf1 인식 도메인은 DNA 및 RNA의 혼합물을 포함하는 줄기 루프 구조를 포함한다. Cpf1 인식 도메인의 DNA-RNA, 혼합물은 다양한 비의 DNA 및 RNA를 포함할 수 있다. 특정 구현예에서, 상기 지정은 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 또는 99% RNA 및 이들 사이의 범위일 수 있다.
가이드 폴리뉴클레오티드는 자연에서 모두 함께 확인되지 않는 영역을 포함하는 키메라성 비-자연 발생 가이드 RNA를 포함한다(즉, 이들은 서로 이종이다. 예를 들어, 표적 DNA에서 뉴클레오티드 서열과 혼성화할 수 있는 제1 뉴클레오티드 서열 도메인(VT 도메인)을 포함하는 키메라성 비-자연 발생 사이드 RNA(crRNA)는 제1 및 제2 뉴클레오티드 서열 도메인이 자연에서 모두 함께 확인되지 않는 방식으로 제2 뉴클레오티드 서열 도메인(Cpf1 인식 도메인)에 연결된다.
용어 "가변 표적화 도메인" 또는 "VT 도메인"은 본원에서 상호 교환적으로 사용되며, 이중 가닥 DNA 표적 부위의 한 가닥(뉴클레오티드 서열)과 혼성화될 수 있는(상보적인) 뉴클레오티드 서열을 포함한다. 제1 뉴클레오티드 서열 도메인(VT 도메인)과 표적 서열 사이의 상보성%는 적어도 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 63%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%일 수 있다. 가변 표적화 도메인은 적어도 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개 또는 30개 내지 50개까지의 뉴클레오티드의 길이일 수 있다.
일부 양태에서, 기능적 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체를 형성할 수 있는 가이드 폴리뉴클레오티드(cr폴리뉴클레오티드)의 가변 표적화 도메인, 및 표적 서열 간 상보성 백분율은 가이드 폴리뉴클레오티드의 가변 표적화 도메인 및 표적 서열 간 미스매치의 존재로 인해 100% 미만이다. 본원에 기술된 바와 같이, Cpf1엔도뉴클레아제는 가이드 RNA(crRNA) 및 상보적 DNA 표적 간 미스매치에 대해 높은 관용성을 갖는 영역에서 그 DNA 표적 부위를 절단한다. +21, +22, +23 및 +24에 위치하는 표적 부위 내 뉴클레오티드 위치 및 PAM의 3'은 가이드 폴리뉴클레오티드와 미스매치를 형성할 수 있고 여전히 의도되는 표적 부위에서 정확한 DNA 절단을 일으킬 수 있다(Kim, D. et al. (2016) Nature Biotechnology. 34863-868; Kleinstiver, B. et al. (2016) Nature Biotechnology. 34:869-874). 21개 뉴클레오티드의 VT 도메인 내 4개 미스매치의 존재는 약 80%의 상보성 백분율을 나타낸다.
일 구현예에서, 가이드 폴리뉴클레오티드는 PAM의 3', +21, +22, +23, +24로부터 선택되는 위치, 또는 위치 +21, +22, +23, 및 +24의 조합에서 표적 부위에 대한 미스매치를 포함한다.
일부 양태에서, VT 도메인은 +21, +22, +23 및 +24에 위치하는 표적 부위에서의 뉴클레오티드 그룹으로부터 선택되는 표적 부위 내 뉴클레오티드 위치에서 미스매치를 가질 수 있다. 일부 양태에서, VT 도메인은 그 DNA 표적 부위와 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 내지 15개까지의 미스매치를 가질 수 있고 여전히 그 의도되는 DNA 표적 부위로 Cpf1 단백질을 가이드할 수 있다.
일부 구현예에서, 가변 표적화 도메인은 12 내지 30개, 12 내지 29개, 12 내지 28개, 12 내지 27개, 12 내지 26개, 12 내지 25개, 12 내지 26개, 12 내지 25개, 12 내지 24개, 12 내지 23개, 12 내지 22개, 12 내지 21개, 12 내지 20개, 12 내지 19개, 12 내지 18개, 12 내지 17개, 12 내지 16개, 12 내지 15개, 12 내지 14개, 12 내지 13개, 13 내지 30개, 13 내지 29개, 13 내지 28개, 13 내지 27개, 13 내지 26개, 13 내지 25개, 13 내지 26개, 13 내지 25개, 13 내지 24개, 13 내지 23개, 13 내지 22개, 13 내지 21개, 13 내지 20개, 13 내지 19개, 13 내지 18개, 13 내지 17개, 13 내지 16개, 13 내지 15개, 13 내지 14개, 14 내지 30개, 14 내지 29개, 14 내지 28개, 14 내지 27개, 14 내지 26개, 14 내지 25개, 14 내지 26개, 14 내지 25개, 14 내지 24개, 14 내지 23개, 14 내지 22개, 14 내지 21개, 14 내지 20개, 14 내지 19개, 14 내지 18개, 14 내지 17개, 14 내지 16개, 14 내지 15개, 15 내지 30개, 15 내지 29개, 15 내지 28개, 15 내지 27개, 15 내지 26개, 15 내지 25개, 15 내지 26개, 15 내지 25개, 15 내지 24개, 15 내지 23개, 15 내지 22개, 15 내지 21개, 15 내지 20개, 15 내지 19개, 15 내지 18개, 15 내지 17개, 15 내지 16개, 16 내지 30개, 16 내지 29개, 16 내지 28개, 16 내지 27개, 16 내지 26개, 16 내지 25개, 16 내지 24개, 16 내지 23개, 16 내지 22개, 16 내지 21개, 16 내지 20개, 16 내지 19개, 16 내지 18개, 16 내지 17개, 17 내지 30개, 17 내지 29개, 17 내지 28개, 17 내지 27개, 17 내지 26개, 17 내지 25개, 17 내지 24개, 17 내지 23개, 17 내지 22개, 17 내지 21개, 17 내지 20개, 17 내지 19개, 17 내지 18개, 18 내지 30개, 18 내지 29개, 18 내지 28개, 18 내지 27개, 18 내지 26개, 18 내지 25개, 18 내지 24개, 18 내지 23개, 18 내지 22개, 18 내지 21개, 18 내지 20개, 18 내지 19개, 19 내지 30개, 19 내지 29개, 19 내지 28개, 19 내지 27개, 19 내지 26개, 19 내지 25개, 19 내지 24개, 19 내지 23개, 19 내지 22개, 19 내지 21개, 19 내지 20개, 20 내지 30개, 20 내지 29개, 20 내지 28개, 20 내지 27개, 20 내지 26개, 20 내지 25개, 20 내지 24개, 20 내지 23개, 20 내지 22개, 20 내지 21개, 21 내지 30개, 21 내지 29개, 21 내지 28개, 21 내지 27개, 21 내지 26개, 21 내지 25개, 21 내지 24개, 21 내지 23개, 21 내지 22개, 22 내지 30개, 22 내지 29개, 22 내지 28개, 22 내지 27개, 22 내지 26개, 22 내지 25개, 22 내지 24개, 22 내지 23개, 23 내지 30개, 23 내지 29개, 23 내지 28개, 23 내지 27개, 23 내지 26개, 23 내지 25개, 23 내지 24개, 24 내지 30개, 24 내지 29개, 24 내지 28개, 24 내지 27개, 24 내지 26개, 24 내지 25개, 25 내지 30개, 25 내지 29개, 25 내지 28개, 25 내지 27개, 25 내지 26개, 26 내지 30개, 26 내지 29개, 26 내지 28개, 26 내지 27개, 27 내지 30개, 27 내지 29개, 27 내지 28개, 28 내지 30개, 28 내지 29개, 또는 29 내지 30개 뉴클레오티드의 연속 스트레치를 포함한다.
가변 표적화 도메인은 DNA 서열, RNA 서열, 변형된 DNA 서열, 변형된 RNA 서열, 또는 이의 임의의 조합으로 구성될 수 있다.
용어 (가이드 폴리뉴클레오티드, crRNA의) "Cpf1 엔도뉴클레아제 인식 도메인" 또는 "Cpf1 인식 도메인"은 본원에서 상호 교환적으로 사용되며, Cpf1 엔도뉴클레아제 폴리펩티드와 상호작용하는 뉴클레오티드 서열을 지칭한다. Cp1f 엔도뉴클레아제 인식 도메인은 DNA 서열, RNA 서열, 변형된 DNA 서열, 변형된 RNA 서열, 또는 이의 임의의 조합으로 구성될 수 있다.
용어 가이드 폴리뉴클레오티드(또는 가이드 RNA, crRNA)의 "기능적 단편", "기능적으로 동등한 단편" 및 "기능적 동등 단편"은 본원에서 상호 교환적으로 사용되며, 가이드 폴리뉴클레오티드(가이드 RNA, crRNA)로서 기능하는 능력이 유지되는 본 발명의 가이드 폴리뉴클레오티드(또는 가이드 RNA, crRNA)의 일부 또는 하위서열을 지칭한다.
용어 가이드 폴리뉴클레오티드(또는 가이드 RNA, crRNA)의 "기능적 변이체", "기능적으로 동등한 변이체" 및 "기능적 동등 변이체"는 본원에서 상호 교환적으로 사용되며, 가이드 폴리뉴클레오티드(가이드 RNA, crRNA)로서 기능하는 능력이 유지되는 본 발명의 가이드 폴리뉴클레오티드(또는 가이드 RNA, crRNA)의 변이체를 지칭한다.
본 발명의 가이드 RNA 또는 가이드 폴리뉴클레오티드의 기능적 단편은 참조 가이드 RNA, 예컨대 SEQ ID NO: 15~18의 참조 가이드 RNA의 20~40개, 20~45개, 20~50개, 20~55개, 20~60개, 20~65개, 20~70개, 20~75개, 20~80개, 25~40개, 25~45개, 25~50개, 25~55개, 25~60개, 25~65개, 25~70개, 25~75개, 25~80개, 30~40개, 30~45개, 30~50개, 30~55개, 30~60개, 30~65개, 30~70개, 30~75개, 30~80개, 35~40개, 35~45개, 35~50개, 35~55개, 35~60개, 35~65개, 35~70개, 35~75개, 35~80개, 40~45개, 40~50개, 40~55개, 40~60개, 40~65개, 40~70개, 40~75개, 40~80개, 45~50개, 45~55개, 45~60개, 45~65개, 45~70개, 45~75개, 45~80개, 50~55개, 50~60개, 50~65개, 50~70개, 50~75개, 50~80개, 55~55개, 55~60개, 55~65개, 55~70개, 55~75개, 55~80개, 60~65개, 60~70개, 60~75개, 60~80개, 65~70개, 65~75개, 65~80개, 70~75개, 70~80 또는 75~80개 뉴클레오티드의 단편을 포함한다.
본 발명의 단일 가이드 RNA 또는 가이드 폴리뉴클레오티드의 기능적 변이체는 참조 단일 가이드 RNA, 예컨대 본원에 기술된 SEQ ID NO: 15~18의 참조 단일 가이드 RNA와 적어도 약 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 뉴클레오티드 서열을 포함할 수 있다. 일부 구현예에서, 단일 가이드 RNA의 기능적 변이체는 SEQ ID NO: 15~18에 나타낸 임의의 하나의 뉴클레오티드 서열과 적어도 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개의 연속 뉴클레오티드 스트레치에 걸쳐 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%, 적어도 약 99%, 또는 100% 뉴클레오티드 서열 동일성을 갖는 뉴클레오티드 서열을 포함한다.
본 발명의 가이드 폴리뉴클레오티드의 기능적 변이체는 변형된 가이드 폴리뉴클레오티드를 포함할 수 있으며, 상기 변형은 조작된 이차 구조, 및/또는 인공 루프, 및/또는 SEQ ID NO: 15~18의 가이드 폴리뉴클레오티드를 포함하는, 참조 가이드 폴리뉴클레오티드의 혼성화 영역 대비 혼성화 영역의 길이 및/또는 상보성 정도의 감소, 및/또는 이중 가닥 RNA 듀플렉스를 형성하는 단백질-결합 분절 일부의 길이 및/또는 상보성 정도의 감소를 포함한다.
본 발명의 가이드 폴리뉴클레오티드의 기능적 변이체는 변형된 가이드 폴리뉴클레오티드를 포함할 수 있으며, 상기 변형은 단일 가이드 RNA에 부가, 제거 또는 다른 변경 루프 및/또는 헤어핀을 포함한다. 본 발명의 가이드 폴리뉴클레오티드의 기능적 변이체는 5' 말단, 3' 말단, 또는 뉴클레오티드 서열 내에 발생하는 임의의 위치, 또는 이의 임의의 조합에서 변형된 본 발명의 가이드 폴리뉴클레오티드를 포함한다.
본 발명의 가이드 폴리뉴클레오티드의 기능적 변이체는 변형된 가이드 폴리뉴클레오티드를 포함할 수 있으며, 상기 변형은 뉴클레오티드 서열 내 또는 5' 또는 3' 말단에 하나 이상의 변형된 뉴클레오티드를 포함하고, 상기 하나 이상의 변형된 뉴클레오티드는 적어도 하나의 비-자연 발생 뉴클레오티드, 뉴클레오티드 모사체(2014년 3월 6일에 공개된 미국 출원 US2014/0068797에 기술됨) 또는 이의 유사체를 포함하거나, 상기 하나 이상의 변형된 뉴클레오티드는 2'-O-메틸유사체, 2'-플루오로 유사체 2-아미노퓨린, 5-브로모-유리딘, 슈도유리딘, 및 7-메틸구아노신으로 이루어진 군으로부터 선택된다.
일 양태에서, 가이드 RNA(crRNA)의 기능적 변이체는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 가이드 RNA/Cpf1 엔도뉴클레아제 복합체를 형성할 수 있다.
가이드 폴리뉴클레오티드는 가이드 폴리뉴클레오티드의 화학적 합성(예컨대, 문헌[Hendel et al. 2015, Nature Biotechnology 33, 985-989], 그러나 한정되지는 않음), 시험관내 생성된 가이드 폴리뉴클레오티드, 및/또는 가이드 RNA의 자가 스플라이싱(예컨대 문헌[Xie et al. 2015, PNAS 112:3570-3575], 그러나 한정되지는 않음)을 포함하는 당분야에 공지된 임의의 방법에 의해 생성될 수 있다.
RNA 성분, 예컨대 Cas-매개 DNA 표적화를 수행하기 위한 진핵생물 세포에서의 gRNA를 발현하는 방법에서는 정확히 정의되고 변형되지 않은 5'- 및 3'-말단을 갖는 RNA의 전사를 허용하는 RNA 폴리머라이제 III(Pol III) 프로모터를 사용하였다(DiCarlo et al., Nucleic Acids Res. 41: 4336-4343; Ma et al., Mol. Ther. Nucleic Acids 3:e161). 상기 전략은 옥수수 및 대두를 포함하는 몇몇 상이한 종의 세포에서 성공적으로 적용되었다(2015년 3월 19일에 공개된 US 20150082478). 5' 캡을 갖지 않는 RNA 성분을 발현하기 위한 방법이 기술되었다(2016년 2월 18일에 공개된 WO 2016/025131). 원핵생물 또는 진핵생물 세포에서 가이드 RNA를 발현할 수 있는 임의의 프로모터가 사용될 수 있다. 예를 들어, 세포에서 가이드 RNA를 전사할 수 있는 프로모터는 가이드 RNA를 암호화하는 뉴클레오티드 서열에 작동 가능하게 연결된 열 충격/열 유도성 프로모터를 포함한다.
여러 가이드 폴리뉴클레오티드(적어도 2개의 단일 가이드 폴리뉴클레오티드)가 적어도 2개의 단일 가이드 폴리뉴클레오티드로 가공되는 단일 전구체 폴리뉴클레오티드로부터 동시에 생성될 수 있고, 각각의 단일 가이드 폴리뉴클레오티드는 식물 게놈 내 단일 표적 서열과 실질적으로 상보적인 가변 표적화 도메인(프로토스페이서 인접 모티프의 3')을 포함하고, 상기 가이드 폴리뉴클레오티드는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체를 형성할 수 있다. 전구체 폴리뉴클레오티드의 적어도 2개 가이드 폴리뉴클레오티드로의 가공은 Cpf1 엔도뉴클레아제의 리보뉴클레아제 활성에 의해 달성될 수 있다. 간략하게, 단일 전구체 폴리뉴클레오티드는 여러 가이드 폴리뉴클레오티드로 합성될 수 있고, 각각의 이러한 가이드 폴리뉴클레오티드는 데옥시리보핵산(DNA), 리보핵산(RNA) 또는 DNA 및 RNA의 혼합물을 포함하며 핵산 내 표적 서열과 혼성화하도록 배치되는 가변 표적화 도메인, 및 DNA, RNA 또는 DNA 및 RNA의 혼합물을 포함하는 가변 표적화 도메인에 인접한 Cpf1 인식 도메인을 포함한다. 이어서 전구체 폴리뉴클레오티드는 Cpf1 엔도뉴클레아제의 리보뉴클레오티드 활성에 의해 여러 단일 가이드 폴리뉴클레오티드로 가공될 수 있다.
일 양태에서, 전구체 폴리뉴클레오티드는 Cpf1 엔도뉴클레아제에 의해 여러 단일 가이드 폴리뉴클레오티드로 가공될 수 있는 전구체 폴리뉴클레오티드이며, 각각의 단일 가이드 폴리뉴클레오티드 및 Cpf1 엔도뉴클레아제는 DNA 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있다.
일 양태에서, 전구체 폴리뉴클레오티드는 Cpf1 엔도뉴클레아제에 의해 여러 단일 가이드 폴리뉴클레오티드로 가공될 수 있는 전구체 폴리뉴클레오티드이며, 상기 전구체 폴리뉴클레오티드는 적어도 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 25개, 20개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개 내지 100개까지의 단일 가이드 폴리뉴클레오티드로 가공되며, 각각의 단일 가이드 폴리뉴클레오티드 및 Cpf1 엔도뉴클레아제는 DNA 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있다.
일 양태에서, 전구체 폴리뉴클레오티드는 적어도 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 25개, 20개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개 내지 100개까지의 단일 가이드 폴리뉴클레오티드를 포함하도록 합성될 수 있고, 각각의 단일 가이드 폴리뉴클레오티드는 프로토스페이서 인접 모티프의 3'에 위치하는 가변 표적화 도메인을 포함하고, 상기 가변 표적화 도메인은 식물 게놈 내 단일 표적 서열과 실질적으로 상보적이다.
여러 가이드 RNA(적어도 2개의 단일 가이드 RNA)가 적어도 2개의 단일 가이드 RNA로 가공되는 단일 전구체 폴리뉴클레오티드로부터 동시에 생성될 수 있고, 각각의 단일 가이드 RNA는 식물 게놈 내 단일 표적 서열과 실질적으로 상보적인 가변 표적화 도메인(프로토스페이서 인접 모티프의 3')을 포함하고, 상기 가이드 RNA는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 가이드 RNA/Cpf1 엔도뉴클레아제 복합체를 형성할 수 있다. 전구체 RNA의 적어도 2개 가이드 RNA로의 가공은 Cpf1 엔도뉴클레아제의 리보뉴클레아제 활성에 의해 달성될 수 있다(Fonfara, I. et al. (2016) Nature. 532: 517-521). 간략하게, 단일 전구체 RNA 분자는 단일 전구체 RNA를 발현할 수 있는 전구체 가이드 RNA 전사 개시 카세트로부터 생성될 수 있다. 이어서 전구체 RNA는 Cpf1 엔도뉴클레아제의 리보뉴클레오티드 활성에 의해 여러 단일 가이드 RNA로 가공될 수 있다.
본원에서 사용되는 용어 "전구체 가이드 RNA 전사 개시 카세트"는 적어도 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 25개, 20개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개 내지 100개까지의 단일 가이드 RNA를 포함하는 전구체 가이드 RNA를 암호화하는 재조합 DNA 분자를 지칭하며, 각각의 단일 가이드 RNA는 프로토스페이서 인접 모티프의 3'에 위치하는 가변 표적화 도메인을 포함하고, 상기 가변 표적화 도메인은 식물 게놈 내 단일 표적 서열과 실질적으로 상보적이다.
본원에서 사용되는 용어 "전구체 가이드 RNA"는 적어도 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 25개, 20개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개 내지 100개까지의 단일 가이드 RNA를 포함하는 단일 RNA 분자를 지칭하며, Cpf1 단백질의 리보뉴클레아제 활성을 통해 그 개별 단일 가이드 RNA(적어도 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 25개, 20개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개 내지 100개까지의 단일 가이드 RNA)로 가공될 수 있고, 각각의 단일 가이드 RNA는 프로토스페이서 인접 모티프의 3'에 위치하는 가변 표적화 도메인을 포함하고, 식물 게놈 내 단일 표적 서열과 실질적으로 상보적이다.
일 양태에서, 전구체 RNA는 Cpf1 엔도뉴클레아제에 의해 여러 단일 가이드 RNA로 가공될 수 있는 전구체 가이드 RNA이며, 각각의 단일 가이드 RNA 및 Cpf1 엔도뉴클레아제는 DNA 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있다.
일 양태에서, 전구체 RNA는 Cpf1 엔도뉴클레아제에 의해 여러 단일 가이드 RNA로 가공될 수 있는 전구체 가이드 RNA이며, 상기 전구체 RNA는 적어도 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 25개, 20개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개 내지 100개까지의 단일 가이드 RNA로 가공되며, 각각의 단일 가이드 RNA 및 Cpf1 엔도뉴클레아제는 DNA 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있다.
일 양태에서, 전구체 RNA는 적어도 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 25개, 20개, 35개, 40개, 45개, 50개, 55개, 60개, 65개, 70개, 75개, 80개, 85개, 90개, 95개 내지 100개까지의 단일 가이드 RNA를 포함하는 전구체 가이드 RNA를 암호화하는 뉴클레오티드 서열에 작동 가능하게 연결된 Pol-II 또는 Pol-III 프로모터를 포함하는 재조합 DNA에 의해 암호화될 수 있고, 각각의 단일 가이드 RNA는 프로토스페이서 인접 모티프의 3'에 위치하는 가변 표적화 도메인을 포함하고, 상기 가변 표적화 도메인은 식물 게놈 내 단일 표적 서열과 실질적으로 상보적이다. 전구체 RNA의 발현을 유도하는 Pol-III 프로모터의 예는 옥수수 U6 폴리머라아제 III 프로모터일 수 있지만 이에 한정되는 것은 아니다. 전구체 RNA의 발현을 유도하는 Pol-II 프로모터의 예는 유비퀴틴 프로모터일 수 있지만 이에 한정되는 것은 아니다.
일 양태에서, 전구체 RNA를 적어도 2개의 가이드 RNA로 가공하는 Cpf1 단백질은 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 가이드 RNA/Cpf1 엔도뉴클레아제 복합체를 형성할 수 있는 동일한 Cpf1 단백질이다. 전구체 가이드 RNA 전사 개시 카세트는 전구체 RNA를 암호화하는 DNA 서열에 작동 가능하게 연결된 Pol-II 또는 Pol-III 프로모터를 포함하는 재조합 DNA 분자(발현 카세트로도 지칭됨)를 포함한다.
가이드 폴리뉴클레오티드, VT 도메인 및/또는 Cpf1 인식 도메인의 뉴클레오티드 서열 변형은 5' 캡, 3' 폴리아데닐화 테일, 리보스위치 서열, 안정성 제어 서열, dsRNA 듀플렉스를 형성하는 서열, 가이드 폴리뉴클레오티드를 세포내 위치로 표적화하는 변형 또는 서열, 추적을 제공하는 변형 또는 서열, 단백질에 대한 결합 부위를 제공하는 변형 또는 서열, 잠긴 핵산(Locked Nucleic Acid, LNA), 5-메틸 dC 뉴클레오티드, 2,6-디아미노퓨린 뉴클레오티드, 2'-플루오로 A 뉴클레오티드, 2'-플루오로 U 뉴클레오티드; 2'-O-메틸 RNA 뉴클레오티드, 포스포로티오에이트 결합, 콜레스테롤 분자에 대한 연결, 폴리에틸렌 글리콜 분자에 대한 연결, 스페이서 18 분자에 대한 연결, 5'에서 3'으로의 공유 연결, 또는 이의 임의의 조합으로 이루어진 군으로부터 선택될 수 있지만, 이에 한정되는 것은 아니다. 이러한 변형은 적어도 하나의 추가적인 유익한 속성을 생성할 수 있고, 상기 추가적인 유익한 속성은 변형된 또는 조절된 안정성, 세포내 표적화, 추적, 형광 표지, 단백질 또는 단백질 복합체에 대한 결합 부위, 상보적인 표적 서열에 대해 변형된 결합 친화도, 세포 분해에 대해 변형된 저항성, 및 증가된 세포 투과성 군으로부터 선택된다.
용어 "5'-캡" 및 "7-메틸구아닐레이트(m7G) 캡"은 본원에서 상호 교환적으로 사용된다. 7-메틸구아닐레이트 잔기는 진핵생물에서 메신저 RNA(mRNA)의 5' 말단에 위치한다. RNA 폴리머라아제 II(Pol II)는 진핵생물에서 mRNA를 전사한다. 메신저 RNA 캡핑은 일반적으로 다음과 같이 일어난다: mRNA 전사체의 가장 말단 5' 포스페이트기가 RNA 말단 포스파타아제에 의해 제거되어, 2개의 말단 포스페이트를 남긴다. 구아노신 모노포스페이트(GMP)가 구아닐릴 트랜스퍼라아제에 의해 전사체의 말단 포스페이트에 부가되어, 전사체 말단에 5'-5' 트리포스페이트-연결 구아닌을 남긴다. 마지막으로, 이 말단 구아닌의 7-질소가 메틸 트랜스퍼라아제에 의해 메틸화된다.
본원에 사용된 용어 "5'-캡을 갖지 않는"은, 예를 들어, 5'-캡 대신 5'-하이드록실기를 갖는 RNA를 지칭한다. 이러한 RNA는, 예를 들어 "캡핑되지 않은 RNA"로 지칭될 수 있다. 5'-캡핑된 RNA는 핵 외수송의 대상이기 때문에 캡핑되지 않은 RNA는 전사 후 핵에 더 잘 축적될 수 있다. 본원에서 하나 이상의 RNA 성분은 캡핑되지 않는다.
본원에 사용된 용어 "가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 복합체", "가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 시스템", "가이드 폴리뉴클레오티드/Cas 복합체", "가이드 폴리뉴클레오티드/Cas 시스템", "유도 Cas 시스템", "폴리뉴클레오티드-유도 엔도뉴클레아제", "PGEN"은 본원에서 상호 교환적으로 사용되고, 복합체를 형성할 수 있는 적어도 하나의 가이드 폴리뉴클레오티드 및 적어도 하나의 Cas 엔도뉴클레아제를 지칭하며, 상기 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 복합체는 Cas 엔도뉴클레아제를 DNA 표적 부위로 유도하여 Cas 엔도뉴클레아제가 DNA 표적 부위를 인식하고, 결합하고, 선택적으로 닉킹 또는 절단(단일 또는 이중 가닥 절단을 도입)하게 할 수 있다.
일 양태에서, 본원에 기술된 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 복합체는 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체이다. 본원에서 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체는 Cpf1 단백질 및 임의의 공지된 V형 CRISPR 시스템의 적합한 폴리뉴클레오티드 성분을 포함할 수 있다(Makarova et al. 2015, Nature Reviews Microbiology Vol. 13:1-15; Zetsche et al., 2015, Cell 163, 1-13; Shmakov et al., 2015, Molecular_Cell 60, 1-13).
가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체는 원핵생물 및/또는 진핵생물 세포에서 DNA 표적 서열의 한 가닥 또는 두 가닥을 모두 절단할 수 있다. DNA 표적 서열의 두 가닥을 모두 절단할 수 있는 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체는 전형적으로 엔도뉴클레아제 도메인 모두를 기능적 상태로 가지는 Cpf1 단백질을 포함한다(예를 들어, 야생형 엔도뉴클레아제 도메인 또는 이의 변이체가 각각의 엔도뉴클레아제 도메인에서 일부 또는 모든 활성을 유지함
DNA 표적 서열의 한 가닥을 절단할 수 있는 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 복합체는 본원에서 닉카아제 활성(예를 들어, 부분적 절단능)을 갖는 것을 특징으로 할 수 있다. Cpf1 닉카아제는 전형적으로 Cpf1이 DNA 표적 서열의 한 가닥만을 절단하도록(즉 닉을 제조하도록) 허용하는 하나의 기능적 엔도뉴클레아제 도메인을 포함한다(Yamano et al., 2016, Cell 165:949-962). DNA 표적화의 특이성을 증가시키기 위해 한 쌍의 Cpf1 닉카아제가 사용될 수 있다. 일반적으로, 이는, 상이한 가이드 서열을 갖는 RNA 성분과 결합되어 있기 때문에, 원하는 표적화를 위한 영역에서 반대 가닥 상의 가까운 DNA 서열을 표적화하고 닉을 형성하는 2개의 Cpf1 닉카아제를 제공함으로써 수행될 수 있다.
특정 구현예에서 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체는 DNA 표적 부위 서열에 결합할 수 있지만, 표적 부위 서열에서 어느 가닥도 절단하지 않는다. 이러한 복합체는 모든 그 뉴클레아제 도메인이 돌연변이 기능장애인 Cpf1 단백질을 포함할 수 있다. 예를 들어, DNA 표적 부위 서열에 결합할 수 있지만, 표적 부위 서열에서 어느 가닥도 절단하지 않는 본원의 Cpf1 단백질은 돌연변이 기능장애 RuvC 도메인을 포함할 수 있다.
본 발명의 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체는 임의의 Cpf1 단백질을 포함할 수 있고, SEQ ID NO: 10, 11, 32 또는 33의 Cpf1 단백질, 또는 SEQ ID NO: 10, 11, 32 또는 33의 기능적 변이체, 또는 SEQ ID NO: 10, 11, 32 또는 33의 기능적 단편을 포함하지만 이에 한정되는 것은 아니다.
용어 "가이드 RNA/Cpf1 엔도뉴클레아제 복합체", "가이드 RNA/Cpf1 엔도뉴클레아제 시스템", "가이드 RNA/Cpf1 복합체", "가이드 RNA/Cpf1 시스템", "gRNA/Cpf1 복합체", "gRNA/Cpf1 시스템"은 본원에서 상호 교환적으로 사용되고, 복합체를 형성할 수 있는 적어도 하나의 RNA 성분 및 적어도 하나의 Cpf1 엔도뉴클레아제를 지칭하며, 상기 가이드 RNA/Cpf1 엔도뉴클레아제 복합체는 Cpf1 엔도뉴클레아제를 DNA 표적 부위로 유도하여 Cpf1 엔도뉴클레아제가 DNA 표적 부위를 인식하고, 결합하고, 선택적으로 닉킹 또는 절단(단일 또는 이중 가닥 절단을 도입)하게 할 수 있다.
일 양태에서, 가이드 RNA/Cpf1 엔도뉴클레아제 복합체는 28℃ 초과 온도에서 인큐베이션되는 경우(또는 적어도 4 hr 동안 28℃ 초과 온도에서 인큐베이션되는(노출되는) 식물 세포 또는 식물에 존재하는 경우, 약 28℃ 또는 약 20℃ 내지 28℃의 온도에서 인큐베이션된 가이드 RNA/Cpf1 엔도뉴클레아제 복합체를 포함하는 대조군 식물 세포의 표적 서열에서의 변형 빈도와 비교되는 경우 의도되는 표적 부위에서 또는 그 근처에서 이중 가닥 절단 및 후속적인 표적 부위의 돌연변이 빈도 증가를 일으킬 수 있다. 일 구현예에서, 방법은 식물 세포의 게놈 내 표적 서열을 변형하기 위한 방법을 포함하며, a) 식물 세포 내로 Cpf1 엔도뉴클레아제 또는 Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드, 및 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적 도메인을 포함하는 가이드 폴리뉴클레오티드를 도입하는 단계; 및, b) 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 식물 세포를 인큐베이션하는 단계를 포함하고, 상기 가이드 폴리뉴클레오티드 및 Cpf1 엔도뉴클레아제는 표적 서열을 절단할 수 있는 복합체를 형성할 수 있고, 상기 표적 부위에서의 돌연변이 빈도는 약 28℃의 온도에서 인큐베이션된 대조군 식물 세포(가이드 RNA/Cpf1 엔도뉴클레아제 복합체를 포함함)의 표적 부위에서의 변형 빈도와 비교되는 경우 적어도 약 2배, 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 11배, 12배, 13배, 14배, 15배만큼 증가된다. 일 양태에서, 가이드 RNA/Cpf1 엔도뉴클레아제 복합체가 적어도 4 hr 동안 28℃ 초과 온도에서 인큐베이션되는 경우 의도되는 표적 부위에서 증가된 돌연변이 빈도는 약 28℃의 온도에서 인큐베이션된 대조군 식물 세포(가이드 RNA/Cpf1 엔도뉴클레아제 복합체를 포함함)의 표적 부위에서의 변형 빈도와 비교되는 경우, 적어도 2-배, 적어도 3-배, 적어도 4-배, 적어도 5-배, 적어도 6-배, 적어도 7-배, 적어도 8-배, 적어도 9-배, 적어도 10-배, 적어도 10-배, 적어도 11-배, 적어도 12-배, 적어도 13-배, 적어도 14-배, 적어도 15-배, 적어도 30-배, 적어도 40-배, 또는 적어도 50-배만큼 증가된다.
가이드 RNA/Cpf1 엔도뉴클레아제 복합체를 포함하는 식물 세포의 28℃ 초과 온도로의 노출은 임의의 발달 단계의 식물 세포, 식물 배아 및/또는 식물에서 있을 수 있다. Cpf1 엔도뉴클레아제(또는 Cpf1 엔도뉴클레아제를 발현하는 재조합 작제물) 및 가이드 RNA(및/또는 가이드 RNA를 발현하는 재조합 작제물)를 포함하는 식물의 자손이 또한 28℃ 초과 온도에 노출되어, 자손 식물 내의 가이드 RNA/Cpf1 복합체를 활성화할 수 있고(발생 동안 원하는 단계에서), 이는 자손 식물이 가이드 RNA/Cpf1 엔도뉴클레아제 복합체에 의해 인식되는 특정한 표적 부위에서 변형될 수 있도록 한다.
용어 "표적 부위", "표적 서열", "표적 부위 서열", "표적 DNA", "표적 유전자좌", "게놈 표적 부위", "게놈 표적 서열", "게놈 표적 유전자좌" 및 "프로토스페이서"는 본원에서 상호 교환적으로 사용되며, 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 복합체, 예컨대 본원에 기술된 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체가 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 폴리뉴클레오티드 서열, 예컨대, 이에 한정되는 것은 아니지만, 염색체, 에피솜, 유전자이식 유전자좌, 또는 게놈 내의 임의의 다른 DNA 분자(염색체, 엽록체, 미토콘드리아 DNA, 플라스미드 DNA를 포함함) 상의 뉴클레오티드 서열을 지칭한다. 표적 부위가 세포 게놈 내의 내인성 부위일 수 있거나, 또는 대안적으로, 표적 부위가 세포에 이종이어서 세포의 게놈에서 자연 발생하지 않을 수 있거나, 또는 표적 부위가 자연에서 일어나는 경우에 비해 이종 게놈 위치에서 확인될 수 있다. 본원에 사용된 용어 "내인성 표적 서열" 및 "고유 표적 서열"은 본원에서 상호 교환적으로 사용되어 세포의 게놈에 내인성이거나 고유하고 세포 게놈 내 그 표적 서열의 내인성 또는 고유 위치에 있는 표적 서열을 지칭한다. "인공 표적 부위" 또는 "인공 표적 서열"은 본원에서 상호 교환적으로 사용되며, 세포 게놈 내로 도입된 표적 서열을 지칭한다. 이러한 인공 표적 서열은 세포 게놈 내의 내인성 또는 고유 표적 서열과 서열이 동일할 수 있지만, 세포 게놈에서 상이한 위치(즉, 비-내인성 또는 비-고유 위치)에 위치할 수 있다.
본원에 기술된 바와 같은 Cpf1 DNA 표적 부위는 Cpf1 엔도뉴클레아제 단백질에 의해 인식되는 DNA 표적 부위를 지칭하며, 상기 Cpf1 엔도뉴클레아제는 Cpf1 DNA 표적 부위를 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있다
본원에 기술된 바와 같은 애시드아미노코커스 Cpf1 DNA 표적 부위는 애시도아미노코커스로부터의 Cpf1 엔도뉴클레아제 단백질 또는 식물에서 생성되는 애시도아미노코커스 Cpf1 엔도뉴클레아제 단백질에 의해 인식되는 DNA 표적 부위를 포함하며, 상기 Cpf1 엔도뉴클레아제는 애시드아미노코커스 Cpf1 DNA 표적 부위를 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있다.
"변경된 표적 부위", "변경된 표적 서열", "변형된 표적 부위", "변형된 표적 서열"은 본원에서 상호 교환적으로 사용되며, 변경되지 않은 표적 서열에 비해 적어도 하나의 변경을 포함하는 본원에 개시된 표적 서열을 지칭한다. 이러한 "변경"은, 예를 들어, (i) 적어도 하나의 뉴클레오티드의 치환, (ii) 적어도 하나의 뉴클레오티드의 결실, (iii) 적어도 하나의 뉴클레오티드의 삽입, 또는 (iv) (i) 내지 (iii)의 임의의 조합을 포함한다.
"표적 부위를 변형하기 위한" 및 "표적 부위를 변경하기 위한" 방법은 본원에서 상호 교환적으로 사용되며, 변경된 표적 부위를 생성하는 방법을 지칭한다.
표적 DNA 서열(표적 부위)의 변할 수 있으며, 예를 들어, 길이가 적어도 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 28개, 29개, 30개 이상의 뉴클레오티드 길이인 표적 부위를 포함한다. 표적 부위는 회문구조일 수도 있다, 즉, 한 가닥 상에 있는 서열이 상보적 가닥 상에서 반대 방향으로 동일하게 해독되는 것이 추가로 가능하다. 닉/절단 부위는 표적 서열 내에 있을 수 있거나, 닉/절단 부위는 표적 서열의 외부에 있을 수 있다. 또 다른 변형에서, 절단은 블런트 말단 컷을 생성하기 위해 서로 바로 마주 보는 뉴클레오티드 위치에서 발생할 수 있거나, 또는 다른 경우에는 "끈끈한 말단(sticky ends)"이라고도 불리는, 5' 오버행 또는 3' 오버행일 수 있는 단일 가닥 오버행을 생성하도록 절개가 엇갈릴 수 있다. 게놈 표적 부위의 활성 변이체가 사용될 수도 있다. 이러한 활성 변이체는 주어진 표적 부위와 적어도 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 이상의 서열 동일성을 포함할 수 있고, 상기 활성 변이체는 생물학적 활성을 유지하며 이에 따라 Cpf1 엔도뉴클레아제에 의해 인식되고 절단될 수 있다.
엔도뉴클레아제에 의한 표적 부위의 단일 또는 이중 가닥 절단을 측정하기 위한 분석법은 당분야에 알려져 있으며, 일반적으로 인식 부위를 포함하는 DNA 기질 상에서 제제의 전체 활성 및 특이성을 측정한다.
본원에 기술된 가이드 RNA/Cpf1 엔도뉴클레아제 시스템의 활성에 의해 유도된 표적화된 식물 세포의 표적 부위에서의 돌연변이 빈도는 약 28℃의 온도로 노출된 대조군 식물 세포의 표적 서열에서의 변형 빈도와 비교되는 경우, 표적화된 식물 세포가 본원에 기술된 바와 같은 CPf1 엔도뉴클레아제를 활성화하는 온도 처리에 노출되는 경우 증가될 수 있다. 대조군 가이드 RNA/Cpf1 엔도뉴클레아제 시스템 28℃와 비교되는 경우 온도 유도된 가이드 RNA/Cpf1 엔도뉴클레아제 시스템의 증가된 돌연변이 빈도는 적어도 2-배, 적어도 3-배, 적어도 4-배, 적어도 5-배, 적어도 6-배, 적어도 7-배, 적어도 8-배, 적어도 9-배, 적어도 10-배, 적어도 10-배, 적어도 11-배, 적어도 12-배, 적어도 13-배, 적어도 14-배, 적어도 15-배, 적어도 30-배, 적어도 40-배, 또는 적어도 50-배일 수 있다.
본원의 "프로토스페이서 인접 모티프"(PAM)는 가이드 폴리뉴클레오티드/Cas 엔도뉴클레아제 시스템, 예컨대 본원에 기술된 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 시스템에 의해 인식(표적화)되는 표적 서열(프로토스페이서)에 인접한 짧은 뉴클레오티드 서열을 지칭한다. 표적 DNA 서열 앞에 PAM 서열이 없는 경우, Cpf1 엔도뉴클레아제는 표적 DNA 서열을 성공적으로 인식하지 못할 수 있다. 본원의 PAM의 서열과 길이는 사용되는 Cpf1 단백질 또는 Cpf1 단백질 복합체에 따라 다를 수 있다. PAM 서열은 임의의 길이일 수 있지만, 전형적으로 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개 또는 20개 뉴클레오티드의 길이이다. Cpf1 엔도뉴클레아제에 의해 인식되는 PAM 서열은 표적 부위의 5에 위치한다.
본원에 기술된 가이드 폴리뉴클레오티드/Cpf1 시스템은 유전자 표적화를 위해 사용될 수 있다.
용어 "유전자 표적화", "표적화" 및 "DNA 표적화"는 본원에서 상호 교환적으로 사용된다. 본원에서 DNA 표적화는 세포의 염색체 또는 플라스미드에서와 같은 특정 DNA 서열에서의 녹아웃, 편집, 또는 녹인의 특이적 도입일 수 있다. 일반적으로, DNA 표적화는 본원에서 적합한 폴리뉴클레오티드 성분과 결합된 Cpf1 단백질을 갖는 세포 내 특정 DNA 서열에서 하나 또는 두 가닥을 절단함으로써 수행될 수 있다. 단일 또는 또는 이중 가닥 절단이 DNA에서 유도되면, 세포의 DNA 복구 메커니즘이 활성화되어 표적 부위에서 변형을 야기할 수 있는 비상동 말단-연결(NHEJ) 또는 상동성-유도 복구(HDR) 프로세스를 통해 절단을 복구한다.
용어 "녹아웃", "유전자 녹아웃" 및 "유전적 녹아웃"은 본원에서 상호 교환적으로 사용된다. 녹아웃은 Cpf1 단백질로 표적화함으로써 부분적으로 또는 완전히 작동하지 않게 된 세포의 DNA 서열을 나타낸다; 녹아웃 이전의 이러한 DNA 서열은, 예를 들어, 아미노산 서열을 암호화할 수 있었거나, 조절 기능을 가졌을 수 있다(예를 들어, 프로모터).
본원에 기술된 유도 Cpf1 엔도뉴클레아제는 DNA 표적 서열을 인식하고, 결합하고, 단일 가닥 절단(닉) 또는 이중 가닥 절단을 도입할 수 있다. 단일 또는 이중 가닥 절단이 DNA에서 유도되면, 세포의 DNA 복구 메커니즘이 활성화되어 절단을 복구한다. 오류가 발생하기 쉬운 DNA 복구 메커니즘은 이중 가닥 절단 부위에서 돌연변이를 생성할 수 있다. 절단된 말단을 하나로 합치는 가장 일반적인 복구 메커니즘은 비상동 말단 연결(NHEJ) 경로이다(Bleuyard et al., (2006) DNA Repair 5:1-12). 염색체의 구조적 완전성은 전형적으로 복구에 의해 보존되지만, 결실, 삽입 또는 다른 재배열(예컨대 염색체 전위)이 가능하다(Siebert and Puchta, 2002, Plant Cell 14:1121-31; Pacher et al., 2007 Genetics 175:21-9).
본 발명의 일 구현예에서, 방법은 식물 세포의 게놈 내 표적 서열을 변형하기 위한 방법을 포함하며, a) 식물 세포 내로 Cpf1 엔도뉴클레아제 또는 Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드, 및 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적화 도메인을 포함하는 가이드 폴리뉴클레오티드를 도입하는 단계; 및, b) 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하고, 상기 가이드 폴리뉴클레오티드 및 Cpf1 엔도뉴클레아제는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있다.
본 발명의 일 구현예에서, 방법은 식물 세포의 게놈 내 표적 서열을 변형하기 위한 방법을 포함하며, a) Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터를 포함하는 재조합 DNA 작제물을 그 게놈에 포함하는 식물 세포 내로, 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적화 도메인을 포함하는 가이드 폴리뉴클레오티드를 도입하는 단계; 및, b) 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하고, 상기 가이드 폴리뉴클레오티드 및 Cpf1 엔도뉴클레아제는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있다.
본 발명의 일 구현예에서, 방법은 식물 또는 식물 세포의 게놈 내 표적 서열을 변형하기 위한 방법을 포함하며, a) 그 게놈에 제1 재조합 DNA 작제물로서, Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터를 포함하는 제1 재조합 DNA 작제물 및 제2 재조합 DNA 작제물로서, 가이드 RNA를 암호화하는 뉴클레오티드 서열에 작동 가능하게 연결된 프로모터를 포함하는 제2 재조합 DNA 작제물을 포함하는 식물 또는 식물 세포를 수득하는 단계로서, 상기 가이드 RNA 및 Cpf1 엔도뉴클레아제는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있는 단계; 및 b) 식물 또는 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계로서, 상기 가이드 RNA 및 Cpf1 엔도뉴클레아제는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있는 단계를 포함한다.
방법은 표적 서열에서 변형을 갖는 적어도 하나의 식물 세포, 식물 또는 자손 식물을 동정하는 단계를 더 포함할 수 있고, 상기 표적 서열에서의 변형은 (i) 적어도 하나의 뉴클레오티드의 치환, (ii) 적어도 하나의 뉴클레오티드의 결실, (iii) 적어도 하나의 뉴클레오티드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택된다. 방법은 식물 세포로 공여 DNA를 더 제공할 수 있고, 상기 공여 DNA는 관심 폴리뉴클레오티드를 포함한다. 이는 검출 가능한 표적화된 게놈 변형을 갖는 식물 세포 또는 식물을 생성할 수 있다.
녹아웃은 삽입-결실(NHEJ를 통한 표적 DNA 서열에서의 뉴클레오티드 염기의 삽입 또는 결실)에 의해, 또는 표적화 부위에서 또는 그 근처에서 서열의 기능을 감소시키거나 완전히 파괴하는 서열의 특이적 제거에 의해 생성될 수 있다.
가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 시스템은 적어도 하나의 폴리뉴클레오티드 변형 주형과 조합되어 사용되어 관심 게놈 뉴클레오티드 서열의 편집(변형)을 가능하게 한다.
"변형된 뉴클레오티드” 또는 "편집된 뉴클레오티드"는 변형되지 않은 그 뉴클레오티드 서열과 비교되는 경우 적어도 하나의 변경을 포함하는 관심 뉴클레오티드 서열을 지칭한다. 이러한 "변경"은, 예를 들어, (i) 적어도 하나의 뉴클레오티드의 치환, (ii) 적어도 하나의 뉴클레오티드의 결실, (iii) 적어도 하나의 뉴클레오티드의 삽입, 또는 (iv) (i) 내지 (iii)의 임의의 조합을 포함한다.
용어 "폴리뉴클레오티드 변형 주형"은 편집될 뉴클레오티드 서열과 비교되는 경우 적어도 하나의 뉴클레오티드 변형을 포함하는 폴리뉴클레오티드를 포함한다. 뉴클레오티드 변형은 적어도 하나의 뉴클레오티드 치환, 삽입 또는 결실일 수 있다. 선택적으로, 폴리뉴클레오티드 변형 주형은 적어도 하나의 뉴클레오티드 변형에 플랭킹 상동 뉴클레오티드 서열을 더 포함할 수 있고, 플랭킹한 상동 뉴클레오티드 서열은 편집될 원하는 뉴클레오티드 서열에 충분한 상동성을 제공한다. 폴리뉴클레오티드 변형 주형은 단일 가닥 또는 이중 가닥 DNA 분자를 포함한다.
일 양태에서 폴리뉴클레오티드 변형 주형은 미스매치에 대해 낮은 관용성을 갖는 DNA 표적 서열의 영역에서 적어도 하나의 미스매치를 포함할 수 있다. 미스매치는 염기 단일 뉴클레오티드 다형성(염기 조각), 염기 변경(염기 삽입, 염기 결실 또는 염기 변형), 뉴클레오티드 서열의 삽입, 또는 이의 임의의 조합을 포함한다.
본원에 기술된 바와 같이, Cpf1 엔도뉴클레아제는 가이드 RNA(crRNA) 및 상보적 DNA 표적 간 미스매치에 대해 높은 관용성을 갖는 영역에서 그 DNA 표적 부위를 절단한다. +21, +22, +23 및 +24에 위치하는 표적 부위 내 뉴클레오티드 위치 및 PAM의 3'은 가이드 폴리뉴클레오티드와 미스매치를 형성할 수 있고 여전히 의도되는 표적 부위에서 정확한 DNA 절단을 일으킬 수 있다. 표적 부위에 인접한 PAM 서열로부터 위치 +1 내지 +19(3')에서 미스매치의 관용성이 낮은 영역은 DNA 표적 부위에서 관용성이 낮은 위치(예컨대 표적 부위에 인접한 PAM 서열로부터의 위치 +1 내지 +19(3'))에서 적어도 1개 염기 변경(미스매치)을 도입할 수 있을 뿐만 아니라 DNA 표적의 관용성이 낮은 영역 외부의 위치에서 원하는 유전자 편집을 도입할 수 있는 폴리뉴클레오티드 변형 주형을 설계하기 위해 활용될 수 있다. 이러한 설계는 Cpf1 엔도뉴클레아제에 의한 원래 DNA 표적 인식을 파괴시킴으로써 일단 원하는 유전자 편집이 일어나면 Cpf1 엔도뉴클레아제가 계속 활성이 아니도록 확실히 할 수 있다. 이와 같이, 본원에 기술된 바와 같이 폴리뉴클레오티드 변형 주형을 주의깊게 설계하여, 일단 원하는 편집이 일어나면(적어도 하나의 미스매치가 DNA 표적의 관용성이 낮은 영역 내로 도입되므로) CPf1 활성을 감소시킬 수 있고 이에 따라 Cpf1 엔도뉴클레아제에 의한 표적을 벗어난 절단을 감소시킬 수 있다.
본 발명의 일 구현예에서, 폴리뉴클레오티드 변형 주형은 Cpf1 복합체에 의해 인식되는 PAM 서열에 인접한 DNA 표적 서열과 상보적인 적어도 하나의 영역을 포함하는 폴리뉴클레오티드 변형 주형이며, 상기 DNA 표적 서열에 대응하는 적어도 하나의 영역은 PAM 서열의 3', +1 내지 +19 위치에서 DNA 표적 서열에 비해 적어도 하나의 뉴클레오티드 미스매치를 포함한다. 폴리뉴클레오티드 변형 주형은 PAM 서열의 3', +20 내지 +21, +20 내지 +22, +20 내지 +23, +20 내지 +24, +21 내지 +22, +21 내지 +23, +21 내지 +24, +22 내지 +23, +22 내지 +24, +23 내지 +24 위치에서 표적 DNA 서열에 대응하는 영역 내 변형을 더 포함할 수 있다.
본 발명의 일 구현예에서, 폴리뉴클레오티드 변형 주형은 Cpf1 복합체에 의해 인식되는 PAM 서열에 인접한 DNA 표적 서열과 상보적인 적어도 하나의 영역을 포함하는 폴리뉴클레오티드 변형 주형이며, 상기 DNA 표적 서열에 대응하는 적어도 하나의 영역은 PAM 서열의 3', +2 내지 +19, +3 내지 +19, +4 내지 +19, +5 내지 +19, +6 내지 +19, +7 내지 +19, +8 내지 +19, +9 내지 +19, +10 내지 +19, +11 내지 +19, +12 내지 +19, +13 내지 +19, +14 내지 +19, +15 내지 +19, +16 내지 +19, +17 내지 +19, +18 내지 +19, +19 내지 +19 위치에서 DNA 표적 서열에 비해 적어도 하나의 뉴클레오티드 미스매치를 포함한다. 폴리뉴클레오티드 변형 주형은 PAM 서열의 3', +20 내지 +24 위치에서 표적 DNA 서열에 대응하는 영역에 변형을 더 포함할 수 있다.
본 발명의 일 구현예에서, 폴리뉴클레오티드 변형 주형은 Cpf1 복합체에 의해 인식되는 PAM 서열에 인접한 DNA 표적 서열과 상보적인 적어도 하나의 영역을 포함하는 폴리뉴클레오티드 변형 주형이며, 상기 DNA 표적 서열에 대응하는 적어도 하나의 영역은 PAM 서열의 +3', +1 내지 +19, +2 내지 +19, +3 내지 +19, +4 내지 +19, +5 내지 +19, +6 내지 +19, +7 내지 +19, +8 내지 +19, +9 내지 +19, +10 내지 +19, +11 내지 +19, +12 내지 +19, +13 내지 +19, +14 내지 +19, +15 내지 +19, +16 내지 +19, +17 내지 +19, +18 내지 +19, +19 내지 +19 위치에서 DNA 표적 서열에 비해 적어도 하나의 뉴클레오티드 미스매치를 포함한다. 폴리뉴클레오티드 변형 주형은 PAM 서열의 3', +20 내지 +21, +20 내지 +22, +20 내지 +23, +20 내지 +24, +21 내지 +22, +21 내지 +23, +21 내지 +24, +22 내지 +23, +22 내지 +24, +23 내지 +24 위치에서 표적 DNA 서열에 대응하는 영역 내 변형을 더 포함할 수 있다.
일 양태에서, 폴리뉴클레오티드 변형 주형은 PAM 서열의 3', +1 내지 +19 위치에서 DNA 표적 서열에 비해 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개 16개, 17개, 18개 이상의 뉴클레오티드 미스매치를 포함한다.
본 발명의 일 구현예에서, 폴리뉴클레오티드 변형 주형은 Cpf1 복합체에 의해 인식되는 PAM 서열에 인접한 DNA 표적 서열과 상보적인 적어도 하나의 영역을 포함하는 폴리뉴클레오티드 변형 주형이며, 상기 DNA 표적 서열에 대응하는 적어도 하나의 영역은 PAM 서열의 +3', +1 내지 +19, +2 내지 +19, +3 내지 +19, +4 내지 +19, +5 내지 +19, +6 내지 +19, +7 내지 +19, +8 내지 +19, +9 내지 +19, +10 내지 +19, +11 내지 +19, +12 내지 +19, +13 내지 +19, +14 내지 +19, +15 내지 +19, +16 내지 +19, +17 내지 +19, +18 내지 +19, +19 내지 +19 위치에서 DNA 표적 서열에 비해 적어도 하나의 뉴클레오티드 미스매치를 포함한다. 폴리뉴클레오티드 변형 주형은 PAM 서열의 3', +20 내지 +21, +20 내지 +22, +20 내지 +23, +20 내지 +24, +21 내지 +22, +21 내지 +23, +21 내지 +24, +22 내지 +23, +22 내지 +24, +23 내지 +24 위치에서 표적 DNA 서열에 대응하는 영역 내 적어도 하나의 뉴클레오티드 삽입을 더 포함할 수 있다.
본 발명의 일 구현예에서, 폴리뉴클레오티드 변형 주형은 Cpf1 복합체에 의해 인식되는 PAM 서열에 인접한 DNA 표적 서열과 상보적인 적어도 하나의 영역을 포함하는 폴리뉴클레오티드 변형 주형이며, 상기 DNA 표적 서열에 대응하는 적어도 하나의 영역은 PAM 서열의 +3', +1 내지 +19, +2 내지 +19, +3 내지 +19, +4 내지 +19, +5 내지 +19, +6 내지 +19, +7 내지 +19, +8 내지 +19, +9 내지 +19, +10 내지 +19, +11 내지 +19, +12 내지 +19, +13 내지 +19, +14 내지 +19, +15 내지 +19, +16 내지 +19, +17 내지 +19, +18 내지 +19, +19 내지 +19 위치에서 DNA 표적 서열에 비해 적어도 하나의 뉴클레오티드 미스매치를 포함한다. 폴리뉴클레오티드 변형 주형은 식물 게놈에서 뉴클레오티드 서열과 상보적인 제2 DNA 영역을 더 포함할 수 있으며, 상기 폴리뉴클레오티드 변형 주형은 뉴클레오티드 서열의 적어도 하나의 뉴클레오티드 변형을 포함한다. 일 양태에서, 폴리뉴클레오티드 변형 주형은 제1 플랭킹 영역 및 제2 플랭킹 영역을 더 포함하며, 상기 제1 및 제2 플랭킹 영역은 표적 DNA 서열에 플랭킹하며 상동성 유도 복구를 유도할 수 있다.
일 양태에서, 폴리뉴클레오티드 변형 주형은 Cpf1 복합체에 의해 인식되는 PAM 서열에 인접한 DNA 표적 서열과 상보적인 적어도 하나의 영역을 포함하는 폴리뉴클레오티드 변형 주형이며, 상기 DNA 표적 서열에 대응하는 적어도 하나의 영역은 PAM 서열의 3', +1 내지 +19 위치에서 DNA 표적 서열에 비해 적어도 하나의 뉴클레오티드 미스매치를 포함하고, 상기 미스매치는 PAM 서열의 3', +1 내지 +19 위치에서 적어도 하나의 뉴클레오티드 삽입 또는 적어도 하나의 폴리뉴클레오티드 삽입에 의해 유도된다. 일부 양태에서, 폴리뉴클레오티드 삽입은 본원에 기술된 관심 폴리뉴클레오티드의 삽입일 수 있다.
일 양태에서, 폴리뉴클레오티드 변형 주형은 SEQ ID NO: 23, 24 및 25로 이루어진 군으로부터 선택된다.
본 발명의 일 구현예에서, 방법은 식물 세포의 게놈 내 뉴클레오티드 서열을 편집하기 위한 방법을 포함하며, a) 식물 세포 내로 Cpf1 엔도뉴클레아제 또는 Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드, 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적화 도메인을 포함하는 가이드 폴리뉴클레오티드, 및 폴리뉴클레오티드 변형 주형을 도입하는 단계로서, 상기 폴리뉴클레오티드 변형 주형은 뉴클레오티드 서열의 적어도 하나의 뉴클레오티드 변형을 포함하는 단계; 및, b) 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하고, 상기 가이드 폴리뉴클레오티드 및 Cpf1 엔도뉴클레아제는 표적 서열의 전부 또는 일부를 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있다.
편집될 뉴클레오티드는 Cpf1 엔도뉴클레아제에 의해 인식되고 절단되는 표적 부위 내에 또는 외부에 위치할 수 있다. 일 구현예에서, 적어도 하나의 뉴클레오티드 변형은 Cpf1 엔도뉴클레아제에 의해 인식되고 절단되는 표적 부위에서의 변형이 아니다. 다른 구현예에서, 편집될 적어도 하나의 뉴클레오티드와 게놈 표적 부위 사이에는 적어도 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 25개, 26개, 27개, 30개, 40개, 50개, 100개, 200개, 300개, 400개, 500개, 600개, 700개, 900개 또는 1000개의 뉴클레오티드가 존재한다.
본 발명의 일 구현예에서, 방법은 식물 세포의 게놈 내 뉴클레오티드 서열을 편집하기 위한 방법을 포함하며, a) Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터를 포함하는 재조합 DNA 작제물을 그 게놈에 포함하는 식물 세포 내로, 폴리뉴클레오티드 변형 주형 및 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적화 도메인을 포함하는 가이드 폴리뉴클레오티드를 도입하는 단계로서, 상기 폴리뉴클레오티드 변형 주형은 뉴클레오티드 서열의 적어도 하나의 뉴클레오티드 변형을 포함하는 단계; 및, b) 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하고, 상기 가이드 폴리뉴클레오티드 및 Cpf1 엔도뉴클레아제는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있다.
본 발명의 일 구현예에서, 방법은 식물 또는 식물 세포의 게놈에서 뉴클레오티드 서열의 편집을 포함하며, a) 그 게놈에 제1 재조합 DNA 작제물로서, Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터를 포함하는 제1 재조합 DNA 작제물 및 제2 재조합 DNA 작제물로서, 가이드 RNA를 암호화하는 뉴클레오티드 서열에 작동 가능하게 연결된 프로모터를 포함하는 제2 재조합 DNA 작제물을 포함하는 식물 또는 식물 세포 내로 폴리뉴클레오티드 변형 주형을 도입하는 단계로서, 상기 가이드 RNA 및 Cpf1 엔도뉴클레아제는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있는 단계; 및 b) 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하고, 상기 가이드 RNA 및 Cpf1 엔도뉴클레아제는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 단계를 포함한다.
용어 "녹인", "유전자 녹인", "유전자 삽입" 및 "유전적 녹인"은 본원에서 상호 교환적으로 사용된다. 녹인은 (적절한 공여 DNA 폴리뉴클레오티드가 또한 사용되는 경우, 상동 재조합(HR)에 의해) Cpf1 단백질의 표적화에 의한 세포 내 특정 DNA 서열에서 DNA 서열의 치환 또는 삽입을 나타낸다. 녹인의 예는 유전자의 코딩 영역에서 이종 아미노산 코딩 서열의 특이적 삽입, 또는 유전자좌에서 전사 조절 요소의 특이적 삽입을 들 수 있다.
Cpf1 엔도뉴클레아제에 대한 표적 부위에 삽입된 관심 폴리뉴클레오티드를 갖는 세포 또는 생물을 수득하기 위해 다양한 방법 및 조성물을 이용할 수 있다. 이러한 방법은 상동 재조합(HR)을 이용하여 표적 부위에서 관심 폴리뉴클레오티드의 통합을 제공할 수 있다. 본 발명의 일 양태에서, 관심 폴리뉴클레오티드는 공여 DNA 작제물을 통해 생물 세포 내로 도입된다. 본원에 사용된 "공여 DNA"는 Cpf1 엔도뉴클레아제의 표적 부위 내로 삽입될 관심 폴리뉴클레오티드를 포함하는 DNA 작제물이다. 공여 DNA 작제물은 관심 폴리뉴클레오티드에 플랭킹한 제1 및 제2 상동성 영역을 더 포함한다. 공여 DNA의 제1 및 제2 상동성 영역은 세포 또는 생물 게놈의 표적 부위에 존재하거나 플랭킹한 제1 및 제2 게놈 영역에 대해 각각 상동성을 공유한다.
본 발명의 일 구현예에서, 방법은 식물 세포의 게놈 내로 관심 폴리뉴클레오티드를 도입하기 위한 방법을 포함하며, a) 식물 세포 내로 Cpf1 엔도뉴클레아제 또는 Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드, 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적화 도메인을 포함하는 가이드 폴리뉴클레오티드, 및 공여 DNA를 도입하는 단계로서, 상기 공여 DNA는 관심 폴리뉴클레오티드를 포함하는 단계; 및, b) 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하고, 상기 가이드 폴리뉴클레오티드 및 Cpf1 엔도뉴클레아제는 표적 서열의 전부 또는 일부를 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있다. 관심 폴리뉴클레오티드는 Cpf1 엔도뉴클레아제에 의해 인식되고 절단되는 표적 부위 내에 또는 외부에 통합될 수 있다.
본 발명의 일 구현예에서, 방법은 식물 세포의 게놈 내로 관심 폴리뉴클레오티드 서열을 도입하기 위한 방법을 포함하며, a) Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터를 포함하는 재조합 DNA 작제물을 그 게놈에 포함하는 식물 세포 내로, 공여 DNA 및 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적화 도메인을 포함하는 가이드 폴리뉴클레오티드를 도입하는 단계로서, 상기 폴리뉴클레오티드 변형 주형은 뉴클레오티드 서열의 적어도 하나의 뉴클레오티드 변형을 포함하는 단계; 및, b) 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하고, 상기 공여 DNA는 관심 폴리뉴클레오티드를 포함하고, 상기 가이드 폴리뉴클레오티드 및 Cpf1 엔도뉴클레아제는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있다.
본 발명의 일 구현예에서, 방법은 식물 세포의 게놈 내로 관심 폴리뉴클레오티드 서열의 도입을 포함하며, a) 그 게놈에 제1 재조합 DNA 작제물로서, Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터를 포함하는 제1 재조합 DNA 작제물 및 제2 재조합 DNA 작제물로서, 가이드 RNA를 암호화하는 뉴클레오티드 서열에 작동 가능하게 연결된 프로모터를 포함하는 제2 재조합 DNA 작제물을 포함하는 식물 또는 식물 세포 내로 공여 DNA를 도입하는 단계로서, 상기 공여 DNA는 관심 폴리뉴클레오티드를 포함하고, 상기 가이드 RNA 및 Cpf1 엔도뉴클레아제는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있는 단계; 및 b) 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하며, 상기 가이드 RNA 및 Cpf1 엔도뉴클레아제는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있다. 방법은 표적 서열 내로 또는 근처로 통합된 관심 폴리뉴클레오티드를 그 게놈에 포함하는 적어도 하나의 식물 세포를 동정하는 단계를 더 포함할 수 있다.
공여 DNA는 가이드 폴리뉴클레오티드로 테더링될 수 있다. 테더링된 공여 DNA는, 게놈 편집, 유전자 삽입 및 표적화된 게놈 조절에 유용한, 표적과 공여 DNA의 공동 국재화를 허용할 수 있고, 내인성 HR 기구의 기능이 매우 약해질 것으로 예상되는 유사분열 후 세포를 표적화하는 데에도 유용할 수 있다(Mali et al. 2013 Nature Methods Vol. 10 : 957-963).
에피솜 DNA 분자가 이중 가닥 절단 내로 결찰, 예컨대, T-DNA가 염색체 이중 가닥 절단 내로 통합될 수도 있다(Chilton and Que, (2003) Plant Physiol 133:956-65; Salomon and Puchta, (1998) EMBO J 17:6086-95). 예를 들어, 이중 가닥 절단의 성숙에 관련된 엑소뉴클레아제 활성에 의해 이중 가닥 절단 주위의 서열이 일단 변경되면, 상동 서열, 예컨대 비분열 체세포에서의 상동 염색체, 또는 DNA 복제 후 자매 염색분체가 이용 가능한 경우 유전자 전환 경로가 원래의 구조를 복원할 수 있다(Molinier et al., (2004) Plant Cell 16:342-52). 이소성 및/또는 후성적 DNA 서열이 또한 상동 재조합을 위한 DNA 복구 주형(폴리뉴클레오티드 변형 주형)으로 작용할 수 있다(Puchta, (1999) Genetics 152:1173-81).
상동성-유도 복구(HDR)는 이중 가닥 및 단일 가닥 DNA 절단을 복구하는 세포 내 메커니즘이다. 상동성 유도 복구는 상동 재조합(HR) 및 단일 가닥 어닐링(SSA)을 포함한다(Lieber. 2010 Annu. Rev. Biochem. 79:181-211). 가장 일반적인 형태의 HDR은 상동 재조합(HR)이라고 하며, 공여 DNA와 수용 DNA 간의 가장 긴 서열 상동성 요건을 갖는다. 다른 형태의 HDR은 단일 가닥 어닐링(SSA) 및 절단 유도 복제를 포함하며, 이들은 HR에 비해 더 짧은 서열 상동성을 필요로 한다. 닉(단일 가닥 절단)에서의 상동성-유도 복구는 이중 가닥 절단에서의 HDR과 다른 메커니즘을 통해 일어날 수 있다(Davis and Maizels. PNAS (0027-8424), 111 (10), p. E924-E932).
"상동성"이란 유사한 DNA 서열을 의미한다. 예를 들어, 공여 DNA에서 확인되는 "게놈 영역에 대한 상동성 영역"은 세포 또는 생물 게놈의 주어진 "게놈 영역"과 유사한 서열을 갖는 DNA 영역이다. 상동성 영역은 절단된 표적 부위에서 상동 재조합을 촉진시키는 데 충분한 임의의 길이일 수 있다. 예를 들어, 상동성 영역이 대응 게놈 영역과 상동 재조합을 겪는 데 충분한 상동성을 갖도록, 상동성 영역은 적어도 5~10개, 5~15개, 5~20개, 5~25개, 5~30개, 5~35개, 5~40개, 5~45개, 5~50개, 5~55개, 5~60개, 5~65개, 5~70개, 5~75개, 5~80개, 5~85개, 5~90개, 5~95개, 5~100개, 5~200개, 5~300개, 5~400개, 5~500개, 5~600개, 5~700개, 5~800개, 5~900개, 5~1000개, 5~1100개, 5~1200개, 5~1300개, 5~1400개, 5~1500개, 5~1600개, 5~1700개, 5~1800개, 5~1900개, 5~2000개, 5~2100개, 5~2200개, 5~2300개, 5~2400개, 5~2500개, 5~2600개, 5~2700개, 5~2800개, 5~2900개, 5~3000개, 5~3100개 이상 염기 길이를 포함할 수 있다. "충분한 상동성"은 2개의 폴리뉴클레오티드 서열이 상동 재조합 반응을 위한 기질로서 작용하는 데 충분한 구조적 유사성을 갖는다는 것을 나타낸다. 구조적 유사성은 각각의 폴리뉴클레오티드 단편의 전체 길이뿐만 아니라 폴리뉴클레오티드의 서열 유사성을 포함한다. 서열 유사성은 서열의 전체 길이에 걸쳐 서열 동일성 백분율 및/또는 100% 서열 동일성을 갖는 인접 뉴클레오티드와 같은 국재화된 유사성을 포함하는 보존된 영역 및 서열 길이의 일부에 걸쳐 서열 동일성 백분율에 의해 기술될 수 있다.
표적 및 공여 폴리뉴클레오티드가 공유하는 상동성 또는 서열 동일성의 양은 변할 수 있으며, 총 길이 및/또는 약 1~20 bp, 20~50 bp, 50~100 bp, 75~150 bp, 100~250 bp, 150~300 bp, 200~400 bp, 250~500 bp, 300~600 bp, 350~750 bp, 400~800 bp, 450~900 bp, 500~1000 bp, 600~1250 bp, 700~1500 bp, 800~1750 bp, 900~2000 bp, 1~2.5 kb, 1.5~3 kb, 2~4 kb, 2.5~5 kb, 3~6 kb, 3.5~7 kb, 4~8 kb, 5~10 kb, 또는 표적 부위의 전체 길이까지를 포함하는 범위의 단위 정수 값을 갖는 영역을 포함한다. 이들 범위는 범위 내의 모든 정수를 포함하며, 예를 들어, 1~20 bp 범위는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 및 20 bp를 포함한다. 상동성의 양은 2개의 폴리뉴클레오티드의 전체 정렬 길이에 걸친 서열 동일성 백분율에 의해 기술될 수도 있는데, 이는 적어도 약 50%, 55%, 60%, 65%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성 백분율을 포함한다. 충분한 상동성은 폴리뉴클레오티드 길이, 전체 서열 동일성 백분율, 및 선택적으로, 연속된 뉴클레오티드의 보존 영역 또는 국소 서열 동일성 백분율의 임의의 조합을 포함하며, 예를 들어, 충분한 상동성은 표적 유전자좌의 영역과 적어도 80% 서열 동일성을 갖는 75~150 bp의 영역으로서 기술될 수 있다. 충분한 상동성은 또한 두 폴리뉴클레오티드의 고엄격 조건 하에 특이적으로 혼성화하는 예측되는 능력에 의해 기술될 수 있으며, 예를 들어, 문헌[Sambrook et al., (1989) Molecular Cloning: A Laboratory Manual, (Cold Spring Harbor Laboratory Press, NY); Current Protocols in Molecular Biology, Ausubel et al., Eds (1994) Current Protocols, (Greene Publishing Associates, Inc. and John Wiley & Sons, Inc.); 및, Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes, (Elsevier, New York)]을 참고한다.
본원에 사용된 "게놈 영역"은 표적 부위의 어느 한 면에 존재하거나 대안적으로 표적 부위의 일부를 또한 포함하는 세포 게놈 내 염색체의 분절이다. 게놈 영역이 대응 상동성 영역과 상동 재조합을 겪기에 충분한 상동성을 갖도록, 게놈 영역은 적어도 5~10개, 5~15개, 5~20개, 5~25개, 5~30개, 5~35개, 5~40개, 5~45개, 5~50개, 5~55개, 5~60개, 5~65개, 5~70개, 5~75개, 5~80개, 5~85개, 5~90개, 5~95개, 5~100개, 5~200개, 5~300개, 5~400개, 5~500개, 5~600개, 5~700개, 5~800개, 5~900개, 5~1000개, 5~1100개, 5~1200개, 5~1300개, 5~1400개, 5~1500개, 5~1600개, 5~1700개, 5~1800개, 5~1900개, 5~2000개, 5~2100개, 5~2200개, 5~2300개, 5~2400개, 5~2500개, 5~2600개, 5~2700개, 5~2800개, 5~2900개, 5~3000개, 5~3100개 이상의 염기를 포함할 수 있다.
주어진 게놈 영역과 공여 DNA에서 확인되는 대응 상동성 영역 사이의 구조적 유사성은 상동 재조합이 일어날 수 있게 하는 임의의 서열 동일성 정도일 수 있다. 예를 들어, 공여 DNA의 "상동성 영역"과 생물 게놈의 "게놈 영역"이 공유하는 상동성 또는 서열 동일성의 양은 서열이 상동 재조합을 겪도록 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%의 서열 동일성일 수 있다.
공여 DNA 상의 상동성 영역은 표적 부위에 플랭킹한 임의의 서열과 상동성을 가질 수 있다. 일부 구현예에서 상동성 영역은 표적 부위에 바로 플랭킹하고 게놈 서열과 상당한 서열 상동성을 공유하지만, 상동성 영역은 표적 부위에 추가로 5' 또는 3'일 수 있는 영역과 충분한 상동성을 갖도록 설계될 수 있음이 인식된다. 상동성 영역은 또한 하류 게놈 영역을 따라 표적 부위의 단편과 상동성을 가질 수 있다.
일 구현예에서, 제1 상동성 영역은 표적 부위의 제1 단편을 더 포함하고, 제2 상동성 영역은 표적 부위의 제2 단편을 포함하며, 상기 제1 단편 및 제 2 단편은 상이하다.
본원에 사용된 "상동 재조합"은 상동성 부위에서 2개의 DNA 분자 간 DNA 단편의 교환을 포함한다. 상동 재조합의 빈도는 여러 인자에 영향을 받는다. 상이한 생물은 상동 재조합의 양 및 상동 재조합과 비상동 재조합의 상대 비율이 다르다. 일반적으로, 상동성 영역의 길이는 상동 재조합 이벤트의 빈도에 영향을 미친다: 상동성 영역이 길수록 빈도는 더 크다. 상동 재조합을 관찰하는 데 필요한 상동성 영역의 길이도 종에 따라 다르다. 많은 경우에, 적어도 5 kb의 상동성이 이용되었지만, 25~50 bp만큼의 적은 상동성으로 상동 재조합이 관찰되었다. 예를 들어, 문헌[Singer et al., (1982) Cell 31:25-33; Shen and Huang, (1986) Genetics 112:441-57; Watt et al., (1985) Proc. Natl. Acad. Sci. USA 82:4768-72, Sugawara and Haber, (1992) Mol Cell Biol 12:563-75, Rubnitz and Subramani, (1984) Mol Cell Biol 4:2253-8; Ayares et al., (1986) Proc. Natl. Acad. Sci. USA 83:5199-203; Liskay et al., (1987) Genetics 115:161-7]을 참고한다.
예를 들어, 상동 재조합(HR)을 통한 식물 세포 게놈의 변경은 유전자 조작을 위한 강력한 도구이다. 상동 재조합은 식물(Halfter et al., (1992) Mol Gen Genet 231:186-93) 및 곤충(Dray and Gloor, 1997, Genetics 147:689-99)에서 입증되었다. 상동 재조합은 다른 생물에서도 이루어졌다. 예를 들어, 기생 원생동물 리슈마니아에서의 상동 재조합에 적어도 150~200 bp의 상동성이 필요했다(Papadopoulou and Dumas, (1997) Nucleic Acids Res 25:4278-86). 사상균 아스페르질루스 니둘란스(Aspergillus nidulans)에서, 50 bp만큼의 적은 플랭킹 상동성으로 유전자 치환이 이루어졌다(Chaveroche et al., (2000) Nucleic Acids Res 28:e97). 표적화된 유전자 치환은 섬모 테트라하이메나 써모필라(Tetrahymena thermophila)에서도 입증되었다(Gaertig et al., (1994) Nucleic Acids Res 22:5391-8). 포유류에서, 상동 재조합은 배양물에서 성장하고, 형질전환되고, 선택되고 마우스 배아 내로 도입될 수 있는 다능성 배아 줄기 세포주(ES)를 사용하여 마우스에서 가장 성공적이었다(Watson et al., 1992, Recombinant DNA, 2nd Ed., WH Freeman & Co.에서 배포한 Scientific American Books).
DNA 이중 가닥 절단은 상동 재조합 경로를 자극하는 효과적인 인자로 보인다(Puchta et al., (1995) Plant Mol Biol 28:281-92; Tzfira and White, (2005) Trends Biotechnol 23:567-9; Puchta, (2005) J Exp Bot 56:1-14). DNA 절단제를 사용하여, 식물의 인공 제조 상동 DNA 반복 서열 사이에서 상동 재조합의 2배 내지 9배 증가가 관찰되었다(Puchta et al., (1995) Plant Mol Biol 28:281-92). 옥수수 원형질체에서, 선형 DNA 분자를 이용한 실험을 통해 플라스미드 간의 향상된 상동 재조합이 입증되었다(Lyznik et al., (1991) Mol Gen Genet 230:209-18).
당업자는 유도 Cas9 엔도뉴클레아제 시스템에 대한 용도, 예컨대 그러나 이에 한정되지는 않는 관심 뉴클레오티드 서열(예컨대 조절 요소)의 변형 또는 치환, 멀티플렉스화(2개 이상의 DNA 표적 부위가 동시에 표적화됨), 관심 폴리뉴클레오티드의 삽입 및 또는 쌓기, 유전자 녹아웃, 유전자 녹인, 스플라이싱 부위의 변형 및/또는 대안적 스플라이싱 부위의 도입, 관심 단백질, 아미노산 및/또는 단백질 융합물을 암호화하는 뉴클레오티드 서열의 변형, 및 관심 유전자 내로의 역전된 반복 서열의 발현에 의한 유전자 침묵화와 유사한 방식으로 당분야에 공지된 임의의 용도를 위해 유도 Cpf1 엔도뉴클레아제 시스템을 사용할 수 있다(모두 본원에 참조로 포함되는, 2015년 3월 19일에 공개된 특허 출원 US 2015-0082478 A1, 2015년 2월 26일에 공개된 US 2015-0059010 A1, 2015년 2월 26일에 공개된 US 2015-0059010 A1, 2014년 7월 7일에 출원된 US 출원 62/023246, 2013년 3월 14일에 공개된 WO2012/129373, 및 2013년 1월 24일에 공개된 PCT/US13/22891, 및 2014년 8월 13일에 출원된 US 출원 62/036,652).
본원에 개시된 가이드 폴리뉴클레오티드/Cpf1 시스템은 또한 관심 유전자를 도입하기 위해 이중 가닥 절단 유도제를 사용하는 대신, 본원에 개시된 것과 같은 가이드 폴리뉴클레오티드/Cpf1 시스템이 사용되는 WO2012/129373(2013년 3월 14일 공개됨)에 개시된 것과 유사한 방식으로 이식유전자 삽입을 유도하는 방법 및/또는 여러 이식유전자를 포함하는 복잡한 유전자이식 형질 유전자좌를 생성하는 방법에서 사용될 수 있다. 복잡한 형질 유전자좌는 유전자적으로 서로 연결된 여러 이식유전자를 갖는 게놈 유전자좌를 포함한다. 서로로부터 0.1, 0.2, 0.3, 0.4, 0.5, 1.0, 2, 또는 심지어 5센티모건(cM) 내에 독립적 이식유전자를 삽입함으로써, 이식유전자는 단일 유전자좌로서 증식될 수 있다(예를 들어, 미국 특허 출원 13/427,138) 또는 PCT 출원 PCT/US2012/030061 참고. 이식유전자를 포함하는 식물을 선택한 후, (적어도) 하나의 이식유전자를 포함하는 식물을 교배하여 양쪽 이식유전자를 모두 포함하는 F1을 형성할 수 있다. 이러한 F1으로부터의 자손(F2 또는 BC1)에서, 1/500의 자손이 동일한 염색체에 재조합된 두 개의 상이한 이식유전자를 가질 것이다. 이후, 복잡한 유전자좌는 양쪽 이식유전자 형질을 갖는 단일 유전자좌로서 증식될 수 있다. 이 프로세스를 반복하여 원하는 만큼 많은 형질을 쌓을 수 있다.
가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체의 임의의 한 성분, 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체 자체뿐만 아니라 폴리뉴클레오티드 변형 주형 및/또는 공여 DNA가 당분야에 공지된 임의의 방법에 의해 세포 내로 도입될 수 있다.
"도입"은 성분이 생물 세포의 내부로의 또는 세포 자체로의 접근을 획득하는 방식으로의 생물, 예컨대 세포 또는 생물, 폴리뉴클레오티드 또는 폴리펩티드 또는 폴리뉴클레오티드-단백질 복합체로의 제시를 의미하려는 것이다. 방법 및 조성물은 폴리뉴클레오티드 또는 폴리펩티드가 생물의 적어도 하나의 세포의 내부로의 접근을 획득하는 한 생물 또는 세포 내로 서열을 도입하기 위한 특정 방법에 의존하지 않는다. 도입은 핵산이 세포의 게놈 내로 혼입될 수 있는 진핵생물 또는 원핵생물 세포 내로의 핵산의 혼입에 대한 언급을 포함하며, 핵산, 단백질 또는 폴리뉴클레오티드-단백질 복합체(PGEN)의 세포로의 일시적(직접적) 제공에 대한 언급을 포함한다.
마이크로주입, 전기천공, 안정한 형질전환 방법, 일시적 형질전환 방법, 발리스틱 입자 가속화(입자 충돌), 위스커 매개 형질전환, 아그로박테리움-매개 형질전환, 직접적 유전자 전달, 바이러스-매개 도입, 형질감염, 형질도입, 세포-투과 펩티드, 메조포러스 실리카 나노입자(MSN)-매개 직접적 단백질 전달, 국소 적용, 유성 교배, 유성 육종 및 이의 임의의 조합을 포함하지만 이에 한정되지는 않는 세포 또는 생물 내로 폴리뉴클레오티드 또는 폴리펩티드 또는 폴리뉴클레오티드-단백질 복합체를 도입하기 위한 방법이 당분야에 공지되어 있다.
예를 들어, 가이드 폴리뉴클레오티드(가이드 RNA, 가이드 DNA 가이드 RNA-DNA 폴리뉴클레오티드)는 단일 가닥 또는 이중 가닥 폴리뉴클레오티드 분자로서 세포 내로 직접(일시적으로) 도입될 수 있다. 가이드 RNA는 또한 세포에서 가이드 RNA를 전사할 수 있는 프로모터에 작동 가능하게 연결된, 가이드 RNA를 암호화하는 이종 핵산 단편을 포함하느 재조합 DNA 분자를 도입하여 간접적으로 세포 내로 도입될 수 있다. 프로모터는 RNA 폴리머라아제 III 프로모터일 수 있지만 이에 한정되는 것은 아니며, 이는 정확히 정의되고 변형되지 않은 5'-말단 및 3'-말단을 갖는 RNA의 전사를 허용한다(Ma et al., 2014, Mol. Ther. Nucleic Acids 3:e161; DiCarlo et al., 2013, Nucleic Acids Res. 41: 4336-4343; 2015년 2월 26일에 공개된 WO2015026887). 세포에서 가이드 RNA를 전사할 수 있는 임의의 프로모터가 사용될 수 있고, 가이드 RNA를 암호화하는 뉴클레오티드 서열에 작동 가능하게 연결된 열 충격/열 유도성 프로모터를 포함한다.
Cpf1 엔도뉴클레아제는 당분야에 공지된 임의의 방법을 사용하여, Cpf1 단백질 자체(Cpf1 엔도뉴클레아제의 직접적 전달로 지칭됨), Cpf1 단백질을 암호화하는 mRNA, 및/또는 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체 자체(폴리뉴클레오단백질 복합체, 폴리뉴클레오티드 단백질 복합체, 또는 PNP 복합체로도 지칭됨)를 직접 도입하여 세포 내로 도입될 수 있다. Cpf1 엔도뉴클레아제는 또한 식물-최적화된 Cpf1 엔도뉴클레아제를 암호화하는 뉴클레오티드 서열에 작동 가능하게 연결된 프로모터를 포함하는 재조합 DNA 작제물을 도입하여 간접적으로 세포 내로 도입될 수 있다. 식물-최적화된 Cpf1 엔도뉴클레아제를 암호화하는 뉴클레오티드 서열에 작동 가능하게 연결된 프로모터를 포함하는 재조합 DNA 작제물은 식물 게놈 내로 안정적으로 통합될 수 있다. 엔도뉴클레아제는 당업계에 알려진 임의의 방법을 사용해서 세포 내로 일시적으로 도입될 수 있거나 식물 세포의 게놈 내로 혼입될 수 있다. 엔도뉴클레아제 및/또는 유도 폴리뉴클레오티드의 세포 내 흡수는 2016년 5월 12일 공개된 WO 2016/073433에 기술된 바와 같이 세포 투과성 펩티드(CPP)로 촉진될 수 있다. 세포에서 Cpf1 엔도뉴클레아제를 발현할 수 있는 임의의 프로모터가 사용될 수 있고, Cpf1 엔도뉴클레아제를 암호화하는 뉴클레오티드 서열에 작동 가능하게 연결된 열 충격/열 유도성 프로모터를 포함한다.
식물 세포 내로의 폴리뉴클레오티드 변형 주형의 직접적 전달은 입자 매개 전달을 통해 달성될 수 있다. 본원에 기술된 실험에 기초하여, 당업자는 이제 임의의 다른 직접적인 전달 방법, 예컨대, 이에 한정되는 것은 아니지만, 원형질체로의 폴리에틸렌 글리콜(PEG)-매개 형질감염, 위스커 매개 형질전환, 전기천공, 입자 충돌, 세포 투과성 펩티드, 또는 메조포러스 실리카 나노입자(MSN)-매개 직접 단백질 전달이 식물 세포에서 폴리뉴클레오티드 변형 주형을 전달하기 위해 성공적으로 사용될 수 있음을 구상할 수 있다.
공여 DNA는 당분야에 알려진 임의의 수단에 의해 도입될 수 있다. 공여 DNA는, 예를 들어, 아그로박테리움-매개 형질전환 또는 바이올리스틱 입자 충돌을 포함하는, 당분야에 알려진 임의의 형질전환 방법에 의해 제공될 수 있다. 공여 DNA는 세포에 일시적으로 존재할 수 있거나, 바이러스성 레플리콘을 통해 도입될 수 있다. Cpf1 엔도뉴클레아제 및 표적 부위의 존재 하에, 형질전환된 식물의 게놈 내로 공여 DNA가 삽입된다.
임의의 하나의 유도 Cpf1 시스템 성분의 직접적 전달에는 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체 성분을 수용하는 세포의 농축 및/또는 가시화를 촉진할 수 있는 다른 mRNA의 직접적 전달(공동-전달)이 수반될 수 있다. 예를 들어, 표현형 마커(예컨대 전사 활성인자, 예컨대 그러나 이에 한정되지는 않는 CRC(Bruce et al. 2000 The Plant Cell 12:65-79))를 암호화하는 mRNA와 함께 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 성분(및/또는 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체 자체)의 직접적 공동 전달은 선택 가능한 표현형 또는 선별 가능한 마커를 세포 내로 안정적으로 도입할 필요 없이 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 성분을 발현하는 세포의 선택 및 농축을 가능케 할 수 있다.
식물 또는 식물 세포 내로 폴리뉴클레오티드, 폴리펩티드 또는 폴리뉴클레오티드-단백질 복합체(PGEN)를 도입하기 위한 프로토콜은 공지되어 있고 마이크로주입(Crossway et al., (1986) Biotechniques 4:320-34 및 미국 특허 6,300,543호), 분열부 형질전환(미국 특허 5,736,369호), 전기천공(Riggs et al., (1986) Proc. Natl. Acad. Sci. USA 83:5602-6, 아그로박테리움-매개 형질전환(미국 특허 5,563,055호 및 5,981,840호), 휘스터 매개 형질전환(Ainley et al. 2013, Plant Biotechnology Journal 11:1126-1134; Shaheen A. and M. Arshad 2011 Properties and Applications of Silicon Carbide (2011), 345-358 Editor(s): Gerhardt, Rosario. Publisher: InTech, Rijeka, Croatia. codA 69PQBP; ISBN: 978-953-307-201-2), 직접적 유전자 전달(Paszkowski et al., (1984) EMBO J 3:2717-22), 및 발리스틱 입자 가속화(미국 특허 4,945,050호; 5,879,918호; 5,886,244호; 5,932,782호; Tomes et al., (1995) "Direct DNA Transfer into Intact Plant Cells via Microprojectile Bombardment" in Plant Cell, Tissue, and Organ Culture: Fundamental Methods, ed. Gamborg & Phillips (Springer-Verlag, Berlin); McCabe et al., (1988) Biotechnology 6:923-6; Weissinger et al., (1988) Ann Rev Genet 22:421-77; Sanford et al., (1987) Particulate Science and Technology 5:27-37(양파); Christou et al., (1988) Plant Physiol 87:671-4(대두); Finer and McMullen, (1991) In Vitro Cell Dev Biol 27P:175-82(대두); Singh et al., (1998) Theor Appl Genet 96:319-24(대두); Datta et al., (1990) Biotechnology 8:736-40(벼); Klein et al., (1988) Proc. Natl. Acad. Sci. USA 85:4305-9(옥수수); Klein et al., (1988) Biotechnology 6:559-63(옥수수); 미국 특허 5,240,855호; 5,322,783호 및 5,324,646호; Klein et al., (1988) Plant Physiol 91:440-4(옥수수); Fromm et al., (1990) Biotechnology 8:833-9(옥수수); Hooykaas-Van Slogteren et al., (1984) Nature 311:763-4; 미국 특허 5,736,369호(곡물); Bytebier et al., (1987) Proc. Natl. Acad. Sci. USA 84:5345-9(릴리세애(Liliaceae)); De Wet et al., (1985) in The Experimental Manipulation of Ovule Tissues, ed. Chapman et al., (Longman, New York), pp. 197-209(꽃가루); Kaeppler et al., (1990) Plant Cell Rep 9:415-8) 및 Kaeppler et al., (1992) Theor Appl Genet 84:560-6(위스커 매개 형질전환); D'Halluin et al., (1992) Plant Cell 4:1495-505(전기천공); Li et al., (1993) Plant Cell Rep 12:250-5; Christou and Ford (1995) Annals Botany 75:407-13(벼) 및 Osjoda et al., (1996) Nat Biotechnol 14:745-50(아그로박테리움 투메파시엔스(Agrobacterium tumefaciens)를 통해 옥수수)를 포함한다.
대안적으로, 폴리뉴클레오티드는 세포 또는 생물을 바이러스 또는 바이러스성 핵산과 접촉시켜 식물 또는 식물 세포 내로 도입될 수 있다. 일반적으로, 이러한 방법에는 바이러스성 DNA 또는 RNA 분자 내 폴리뉴클레오티드의 혼입이 관련된다. 일부 예에서, 관심 폴리펩티드는 처음에 바이러스성 폴리단백질의 일부로서 합성될 수 있고, 후에 생체내 또는 시험관내에서 단백분해에 의해 가공되어 원하는 재조합 단백질을 생성한다. 바이러스성 DNA 또는 RNA 분자가 관련되는 폴리뉴클레오티드를 식물 내로 도입하고 거기에서 암호화된 단백질을 발현하기 위한 방법이 알려져 있다(예를 들어, 미국 특허 5,889,191호, 5,889,190호, 5,866,785호, 5,589,367호 및 5,316,931호를 참고).
폴리뉴클레오티드 또는 재조합 DNA 작제물은 다양한 일시적 형질전환 방법을 사용하여 식물에 제공되거나 식물 내로 도입될 수 있다. 이러한 일시적 형질전환 방법은 식물 내로 직접 폴리뉴클레오티드 작제물의 도입을 포함하지만 이에 한정되는 것은 아니다.
핵산 및 단백질은 유도 Cas 시스템의 어느 한 성분 또는 모든 성분(단백질 및/또는 핵산)의 흡수를 촉진하기 위해 분자, 예컨대 세포 투과성 펩티드 및 나노캐리어를 사용하는 방법을 비롯한 임의의 방법에 의해 세포에 제공될 수 있다. 또한, 본원에 참조로 포함되는, US20110035836(Nanocarier based plant transfection and transduction), 및 EP 2821486 A1(Method of introducing nucleic acid into plant cells)를 참고한다.
색소체 형질전환 방법, 및 묘목으로부터의 조직 또는 성숙 종자 내로 폴리뉴클레오티드를 도입하기 위한 방법을 포함하는 식물 또는 식물 부분 내로 폴리뉴클레오티드를 도입하는 다른 방법이 사용될 수 있다.
안정한 형질전환은 생물의 게놈 내로 도입된 뉴클레오티드 작제물이 생물의 게놈 내로 통합되며 이의 자손에 의해 유전될 수 있음을 의미하려는 것이다. 일시적 형질전환은 폴리뉴클레오티드가 생물 내로 도입되고 생물의 게놈 내로 통합되지 않거나 폴리펩티드가 생물 내로 도입됨을 의미하려는 것이다. 일시적 형질전환은 도입된 조성물이 생물에서 일시적으로만 발현되거나 존재함을 나타낸다.
식물의 아그로박테리움-매개 형질전환에 영향을 미치는 요인은 당분야에 널리 공지되어 있다(리뷰를 위해 문헌[Cheng et al., 2004, In vitro Cell. Dev. Biol. Plant 40:31-45]을 참고한다). 식물 형질전환 및 성장은 전형적으로 30℃ 미만 온도(실온)에서 수행된다. 22℃ 온도는 쌍떡잎 식물에서 T-DNA 전달을 위해 최적인 것으로 확인되었다. T-DNA 전달 및 안정한 형질전환(식물 세포 및 아그로박테리움의 공동-배양)을 위한 최적 온도는 특정 외식편 및 아그로박테리움 균주에 따라 변할 수 있지만 일반적으로 23~25℃(실온) 범위이다(Cheng et al., 2004, In vitro Cell. Dev. Biol. Plant 40:31-45; Methods in Molecular Biology. Kang Wang Editor, Agrobacterium Protocols Volume 1-2, 2015). 이식유전자 옥수수 식물은 20℃, 이어서 28℃ 계대배양으로 아그로박테리움 및 미성숙 배아의 공동-배양에 의해 순계로부터 수득되었다(Gordon-Kamm et al., 2002, PNAS vol.99(No.18) 11975-11980).
옥수수 세포의 입자 매개 충돌에는 일반적으로 입자 충돌을 가한 조직이 실온에서 대략 4시간 동안 배양 배지에 남아있도록 한 후 25℃ 내지 약 28℃의 온도에서 계대배양(새로운 배지로의 조직 전달)이 뒤따른다(2002년 4월 11월에 공개된 US2002/0042929).
본원에 기술되는 Cpf1 엔도뉴클레아제는 식물 세포 또는 식물의 게놈 내 표적 서열을 변형하기 위해 사용될 수 있다. 일 양태에서, 본 문서는 식물 세포 또는 식물의 게놈 내 표적 서열을 변형하기 위한 방법을 특징으로 한다. 방법은 a) 표적 서열을 포함하는 식물 세포 내로 Cpf1 엔도뉴클레아제 또는 Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드, 및 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적화 도메인을 포함하는 가이드 폴리뉴클레오티드를 도입하는 단계; 및 b) 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함할 수 있고, 상기 가이드 폴리뉴클레오티드 및 Cpf1 엔도뉴클레아제는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있다. 방법은 또한 a) Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터를 포함하는 재조합 DNA 작제물을 그 게놈에 포함하는 식물 세포 내로, 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적화 도메인을 포함하는 가이드 폴리뉴클레오티드를 도입하는 단계; 및, b) 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함할 수 있고, 상기 가이드 폴리뉴클레오티드 및 Cpf1 엔도뉴클레아제는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있다. 방법은 또한 a) 제1 재조합 DNA 작제물로서, Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터를 포함하는 제1 재조합 DNA 작제물, 및 제2 재조합 DNA 작제물로서, 가이드 RNA를 암호화하는 뉴클레오티드 서열에 작동 가능하게 연결된 프로모터를 포함하는 제2 재조합 DNA 작제물을 포함하는 식물을 수득하는 단계로서, 상기 가이드 RNA 및 Cpf1 엔도뉴클레아제는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있는 단계; 및
b) 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함할 수 있고, 상기 가이드 RNA 및 Cpf1 엔도뉴클레아제는 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있다.
방법은 표적 서열에서 변형을 갖는 적어도 하나의 식물 세포, 식물 또는 자손 식물을 동정하는 단계를 더 포함할 수 있고, 상기 표적 서열에서의 변형은 (i) 적어도 하나의 뉴클레오티드의 치환, (ii) 적어도 하나의 뉴클레오티드의 결실, (iii) 적어도 하나의 뉴클레오티드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택된다. 방법은 식물 세포로 공여 DNA를 더 제공할 수 있으며, 상기 공여 DNA는 관심 폴리뉴클레오티드를 포함한다. 이는 검출 가능한 표적화된 게놈 변형을 갖는 식물 세포 또는 식물을 생성할 수 있다.
식물 세포, 식물 또는 자손 식물은 적어도 약 10분, 20분, 30분, 40분, 50분, 1 hr, 2 hr, 3 hr, 4 hr, 5 hr, 6 hr, 7 hr, 8 hr, 9 hr, 10 hr, 11 hr, 12 hr, 13 hr, 14 hr, 15 hr, 16 hr, 17 hr, 18 hr, 19 hr, 20 hr, 21 hr, 22 hr, 23 hr, 24 hr, 25 hr, 26 hr, 27 hr, 28 hr, 29 hr, 30 hr, 31 hr, 32 hr, 33 hr, 34 hr, 35 hr, 36 hr, 37 hr, 38 hr, 39 hr, 40 hr, 41 hr, 42 hr, 43 hr, 44 hr, 45 hr, 46 hr, 47 hr, 48 hr 내지 적어도 3일, 4일, 5일, 6일, 7일, 내지 적어도 1주, 2주, 3주, 4주, 5주, 또는 적어도 수 개월의 기간 동안 적어도 29℃, 30℃, 31℃, 32℃, 33℃, 34℃, 35℃, 36℃, 37℃, 38℃, 39℃, 40℃, 41℃, 42℃, 43℃, 44℃ 또는 45℃의 온도에서 인큐베이션될 수 있다.
식물 세포의 28℃ 초과 온도로의 노출은 임의의 발달 단계의 식물 세포, 식물 배아 및/또는 식물에서 있을 수 있다. 예를 들어, 식물의 게놈 내 표적 서열을 변형하기 위한 방법은 적어도 하나의 Cpf1 엔도뉴클레아제(또는 Cpf1 엔도뉴클레아제를 발현하는 재조합 작제물) 및 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적화 도메인을 포함하는 가이드 RNA(및/또는 가이드 RNA를 발현하는 재조합 작제물)를 포함하는 식물을 수득하는 단계; 및 b) 식물을 식물 발달의 특정 단계에서 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계, 예컨대 그러나 이에 한정되지는 않고, 꽃가루 생산 및 발달의 발달 단계 동안 식물을 인큐베이션하는 단계를 포함할 수 있다. Cpf1 엔도뉴클레아제(또는 Cpf1 엔도뉴클레아제를 발현하는 재조합 작제물) 및 가이드 RNA(및/또는 가이드 RNA를 발현하는 재조합 작제물)를 포함하는 식물의 자손dl 또한 증가된 온도(적어도 29℃)에 노출되어서, 자손 식물 내의 가이드 RNA/Cpf1 복합체를 활성화할 수 있고, 이는 자손 식물이 가이드 RNA/Cpf1 엔도뉴클레아제 복합체에 의해 인식되는 특정한 표적 부위에서 변형될 수 있도록 한다.
관심 폴리뉴클레오티드는 본원에 더 기술되어 있으며, 상업 시장 및 작물 개발 관련자들의 관심사를 반영하는 폴리뉴클레오티드를 포함한다. 관심 작물 및 시장은 변화하며, 개발 도상국이 세계 시장을 개방함에 따라 새로운 작물과 기술 또한 등장할 것이다. 또한, 수확량과 잡종 강세와 같은 작물학적 형질 및 특징에 대한 이해가 높아짐에 따라 유전자 조작을 위한 유전자의 선택도 변할 것이다.
관심 폴리뉴클레오티드는 농약, 제초제-저항성, 살충제 저항성, 질환 저항성, 선충 저항성, 제초제 저항성, 미생물 저항성, 진균 저항성, 바이러스 저항성, 가임성 또는 불임성, 낟알 특징 및 상업적 제품을 위해 중요한 형질을 암호화하는 폴리뉴클레오티드를 포함하지만 이에 한정되는 것은 아니다.
관심 폴리뉴클레오티드의 일반적인 범주는, 예를 들어, 징크 핑거와 같은 정보 관련 관심 유전자, 키나아제와 같은 커뮤니케이션 관련 유전자, 및 열 충격 단백질과 같은 하우스키핑 관련 유전자를 포함한다. 보다 구체적인 관심 폴리뉴클레오티드는 작물 수확량, 낟알 품질, 작물 영양소 함량, 전분 및 탄수화물 품질 및 양에 관련된 유전자뿐만 아니라 속씨 크기, 수크로스 부하, 단백질 품질 및 양, 질소 고정 및/또는 이용, 지방산 및 오일 조성에 영향을 미치는 유전자, 비생물 스트레스에 저항성을 부여하는 단백질을 암호화하는 유전자(예컨대 가뭄, 질소, 온도, 염도, 독성 금속 또는 미량 원소, 또는 독소, 예컨대 살해충제 및 제초제에 대한 저항성을 부여하는 유전자), 생물 스트레스(예컨대 진균, 바이러스, 박테리아, 곤충 및 선충에 의한 공격, 및 이러한 생물과 연관되는 질환의 발생)에 저항성을 부여하는 단백질을 암호화하는 유전자를 포함하지만 이에 한정되는 것은 아니다.
오일, 전분, 및 단백질 함량과 같은 작물학적으로 중요한 형질은 전통적인 육종 방법을 사용하는 것 외에도 유전적으로 변경될 수 있다. 변형은 올레산, 포화 및 불포화 오일의 함량 증가, 라이신과 황 수준 증가, 필수 아미노산 제공, 및 전분의 변형을 또한 포함한다. 호르도티오닌 단백질 변형은 본원에 참조로 포함되는 미국 특허 5,703,049호, 5,885,801호, 5,885,802호, 및 5,990,389호에 기술되어 있다.
관심 폴리뉴클레오티드는 작물의 바람직함을 향상시키는 단백질 또는 폴리펩티드를 암호화하는 임의의 뉴클레오티드 서열을 포함한다. 관심 폴리뉴클레오티드 서열은 질병 저항성 또는 해충 저항성의 제공에 관련된 단백질을 암호화할 수 있다. "질병 저항성" 또는 "해충 저항성"은 식물이 식물-병원균 상호작용의 결과인 유해 증상을 회피한다는 의미이다. 해충 저항성 유전자는 근충, 거세미, 유럽옥수수좀 등과 같이 수확량에 큰 방해가 되는 해충에 대한 저항성을 암호화할 수 있다. 질병 저항성 및 곤충 저항성 유전자, 예컨대, 항균 보호를 위한 라이소자임 또는 세크로핀, 또는 항진균 보호를 위한 디펜신, 글루카나아제 또는 키티나아제와 같은 단백질, 또는 선충류 또는 곤충 방제를 위한 바실러스 튜링기엔시스 내독소, 프로테아제 저해제, 콜라게나아제, 렉틴, 또는 글리코시다아제가 모두 유용한 유전자 산물의 예이다. 질환 저항성 형질을 암호화하는 유전자는 해독 유전자, 예컨대 푸모니신에 대한 해독 유전자(미국 특허 5,792,931호); 비병독성(avr) 및 질환 저항성(R) 유전자(Jones et al. (1994) Science 266:789; Martin et al. (1993) Science 262:1432; 및 Mindrinos et al. (1994) Cell 78:1089) 등을 포함한다. 곤충 저항성 유전자는 근충, 거세미, 유럽옥수수좀 등과 같이 수확량에 큰 방해가 되는 해충에 대한 저항성을 암호화할 수 있다. 이러한 유전자는, 예를 들어, 바실러스 투링기엔시스 독성 단백질 유전자(미국 특허 5,366,892호; 5,747,450호; 5,736,514호; 5,723,756호; 5,593,881호; 및 Geiser et al. (1986) Gene 48:109) 등을 포함한다.
"제초제 저항성 단백질" 또는 "제초제 저항성-암호화 핵산 분자"의 발현으로 생성되는 단백질은 이러한 단백질을 발현하지 않는 세포보다 더 높은 농도의 제초제를 견디는 능력, 또는 이러한 단백질을 발현하지 않는 세포보다 더 오랜 기간 동안 특정 농도의 제초제를 견디는 능력을 세포에 부여하는 단백질을 포함한다. 제초제 저항성 형질은 아세토락테이트 합성효소(ALS, 또한 아세토하이드록시산 합성효소, AHAS로도 지칭함)의 작용을 저해하는 작용을 하는 제초제, 특히 설포닐우레아(sulfonylurea, 영국: sulphonylurea)-유형 제초제에 대한 저항성을 코딩하는 유전자, 글루타민 합성효소의 작용을 저해하는 작용을 하는 제초제에 대한 저항성을 코딩하는 유전자, 예컨대, 포스피노트리신 또는 바스타(예컨대, bar 유전자), 글리포세이트(예컨대, EPSP 합성효소 유전자 및 GAT 유전자), HPPD 저해제(예컨대, HPPD 유전자) 또는 당분야에 알려진 다른 이러한 유전자에 의해 식물 내로 도입될 수 있다. 예를 들어, 본원에 각각 참조로 포함되는, 미국 특허 7,626,077호, 5,310,667호, 5,866,775호, 6,225,114호, 6,248,876호, 7,169,970호, 6,867,293호, 및 미국 가출원 61/401,456호를 참고한다. bar 유전자는 제초제 바스타에 대한 저항성을 암호화하고, nptII 유전자는 항생제 카나마이신 및 제네티신에 대한 저항성을 암호화하고, ALS-유전자 돌연변이는 제초제 클로르설푸론에 대한 저항성을 암호화한다.
또한, 관심 폴리뉴클레오티드는 표적화된 관심 유전자 서열에 대한 메신저 RNA(mRNA)의 적어도 일부에 상보적인 안티센스 서열을 포함할 수 있음이 인식된다. 안티센스 뉴클레오티드는 대응 mRNA와 혼성화하도록 제조된다. 안티센스 서열의 변형은 서열이 대응 mRNA와 혼성화되고 그 발현을 방해하는 한 제조될 수 있다. 이러한 방식으로, 대응 안티센스 서열과 70%, 80%, 또는 85% 서열 동일성을 갖는 안티센스 구성이 사용될 수 있다. 또한, 안티센스 뉴클레오티드의 일부는 표적 유전자의 발현을 방해하는 데 사용될 수 있다. 일반적으로, 적어도 50개 뉴클레오티드, 100개 뉴클레오티드, 200개 뉴클레오티드 이상의 서열이 사용될 수 있다.
또한, 관심 폴리뉴클레오티드는 식물에서 내인성 유전자 발현을 억제하기 위해 센스 방향으로 사용될 수도 있다. 폴리뉴클레오티드를 센스 방향으로 사용하여 식물의 유전자 발현을 억제하는 방법은 당분야에 알려져 있다. 방법에는 일반적으로 내인성 유전자의 전사체에 대응하는 뉴클레오티드 서열의 적어도 일부에 작동 가능하게 연결된 식물에서 발현을 유도하는 프로모터를 포함하는 DNA 작제물로 식물을 형질전환시키는 단계가 관련된다. 전형적으로, 이러한 뉴클레오티드 서열은 내인성 유전자의 전사체 서열과 일반적으로 약 65% 서열 동일성, 약 85% 서열 동일성보다 크거나, 약 95% 서열 동일성보다 큰 상당한 서열 동일성을 갖는다. 본원에 참조로 포함되는 미국 특허 5,283,184호 및 5,034,323호를 참고한다.
관심 폴리뉴클레오티드는 표현형 마커일 수도 있다. 표현형 마커는 시각적 마커 및 그것이 양성의 선택 가능한 마커든 음성의 선택 가능한 마커든 선택 가능한 마커를 포함하는, 선별 가능하거나 선택 가능한 마커이다. 임의의 표현형 마커가 사용될 수 있다. 구체적으로, 선택 가능하거나 선별 가능한 마커는 종종 특정한 조건 하에서, 이를 포함하는 분자 또는 세포를 동정할 수 있게 하거나, 그것에 대해 또는 그것에 반해 선택할 수 있게 하는 DNA 분절을 포함한다. 이들 마커는 활성, 예컨대, 그러나 이에 한정되는 것은 아닌 RNA, 펩티드, 또는 단백질의 생성을 암호화할 수 있거나, RNA, 펩티드, 단백질, 무기 및 유기 화합물 또는 조성물 등에 대한 결합 부위를 제공할 수 있다.
선택 가능한 마커의 예는 제한 효소 부위를 포함하는 DNA 분절; 항생제, 예컨대, 스펙티노마이신, 암피실린, 카나마이신, 테트라사이클린, 바스타(Basta), 네오마이신 포스포트랜스퍼라아제 II(NEO) 및 히그로마이신 포스포트랜스퍼라아제(HPT))를 포함하는 다른 경우 독성인 화합물에 대해 저항성을 제공하는 산물을 암호화하는 DNA 분절; 다른 경우 수용 세포에 없는 산물(예컨대, tRNA 유전자, 영양요구성 마커); 용이하게 동정될 수 있는 생성물을 암호화하는 DNA 분절(예를 들어, 표현형 마커, 예컨대, β-갈락토시다아제, GUS; 형광 단백질, 예컨대, 녹색 형광 단백질(GFP), 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP), 적색 형광 단백질(RFP) 및 세포 표면 단백질)을 암호화하는 DNA 분절; PCR을 위한 새로운 프라이머 부위(예컨대, 이전에는 나란히 놓여있지 않았던 두 DNA 서열의 병치)의 생성, 제한 엔도뉴클레아제 또는 기타 DNA 변형 효소, 화학물질 등에 의해 영향받지 않거나 영향받는 DNA 서열의 포함; 및 동정을 가능하게 하는 특이적인 변형(예컨대, 메틸화)을 위해 필요한 DNA 서열의 포함을 포함하지만, 이에 한정되는 것은 아니다.
추가적인 선택 가능한 마커는 제초제 화합물, 예컨대, 설포닐우레아, 글루포시네이트 암모늄, 브로목시닐, 이미다졸리논 및 2,4-디클로로페녹시아세테이트(2,4-D)에 대해 저항성을 부여하는 유전자를 포함한다. 예를 들어, 설포닐우레아, 이미다졸리논, 트리아졸로피리미딘, 설폰아미드, 피리미디닐살리실레이트 및 설포닐아미노카보닐-트리아졸리논에 대한 저항성을 위한 아세토락타아제 합성효소(ALS)[Shaner and Singh, 1997, Herbicide Activity: Toxicol Biochem Mol Biol 69-110); 글리포세이트 저항성 5-엔올피루빌시키메이트-3-포스페이트(EPSPS)(Saroha et al. 1998, J. Plant Biochemistry & Biotechnology Vol 7:65-72)를 참고한다;
관심 폴리뉴클레오티드는 다른 형질, 예컨대 그러나 이에 한정되지는 않는 제초제 저항성 또는 본원에 기술되는 임의의 다른 형질과 쌓이거나 조합되어 사용될 수 있는 유전자를 포함한다. 관심 폴리뉴클레오티드 및/또는 형질은, 둘 다 본원에 참조로 포함되는 2013년 10월 3일 공개된 US-2013-0263324-A1 및 2013년 1월 24일 공개된 PCT/US13/22891에 기술된 바와 같이, 복합 형질 유전자좌에 함께 쌓을 수 있다.
관심 폴리펩티드는 본원에 기술되는 관심 폴리뉴클레오티드에 의해 암호화되는 임의의 단백질 또는 폴리펩티드를 포함한다.
또한, 표적 부위에 통합된 관심 폴리뉴클레오티드를 그 게놈에 포함하는 하나 이상의 식물 세포를 동정하기 위한 방법이 제공된다. 선별 가능한 마커 표현형을 사용하지 않고 표적 부위 또는 그 근처에서 게놈 내로의 삽입을 가진 식물 세포를 동정하기 위해 다양한 방법을 이용할 수 있다. PCR 방법, 시퀀싱 방법, 뉴클레아제 소화, 서던 블롯, 및 이의 임의의 조합을 포함하나 이에 한정되지 않는 이러한 방법은 표적 서열을 직접 분석하여 표적 서열에서 임의의 변화를 검출하는 것으로 볼 수 있다. 예를 들어, 본원에 기술된 방법을 위해 필요한 정도로 본원에 참조로 포함되는 미국 특허 출원 12/147,834를 참고한다. 방법은 또한, 그 게놈 내로 통합된 관심 폴리뉴클레오티드를 포함하는 식물 세포로부터 식물을 복원하는 단계를 포함한다. 식물은 불임성 또는 가임성일 수 있다. 표적 부위에서 식물 게놈 내로 통합되고 식물에서 발현되는 임의의 관심 폴리뉴클레오티드가 제공될 수 있음이 인식된다.
본원에 사용된 "핵산"은 폴리뉴클레오티드를 의미하고 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 염기의 단일 가닥 중합체 또는 이중 가닥 중합체를 포함한다. 핵산은 또한 단편 및 변형된 뉴클레오티드를 포함할 수 있다. 따라서, 용어 "폴리뉴클레오티드", "핵산 서열", "뉴클레오티드 서열" 및 "핵산 단편"은 상호 교환적으로 사용되어 선택적으로 합성, 비-천연 또는 변경된 뉴클레오티드 염기를 포함하는, 단일 가닥 또는 이중 가닥인 RNA 및/또는 DNA 및/또는 RNA-DNA 폴리뉴클레오티드(RNA 및 DNA를 모두 포함하는 폴리뉴클레오티드)의 중합체를 나타낸다. (보통 이의 5'-모노포스페이트 형태로 확인되는) 뉴클레오티드는 다음과 같이 이의 1글자 표시에 의해 지칭된다: "A"는 아데노신 또는 데옥시아데노신(각각 RNA 또는 DNA에 대하여), "C"는 시아노 또는 데옥시시토신, "G"는 구아노신 또는 데옥시구아노신, "U"는 우리딘, "T"는 데옥시티미딘, "R"은 퓨린(A 또는 G), "Y"는 피리미딘(C 또는 T), "K"는 G 또는 T, "H"는 A 또는 C 또는 T, "I"는 이노신, 및 "N"은 임의의 뉴클레오티드.
"개방 해독틀"은 ORF로 약칭된다.
용어 "기능적으로 동등한 단편" 및 "기능적 동등 단편"은 본원에서 상호 교환적으로 사용된다. 이들 용어는 단편이 활성 효소를 암호화하는지 여부에 관계 없이 유전자 발현을 변경하거나 특정 표현형을 생성하는 능력이 유지되는 단리된 핵산 단편 또는 폴리펩티드의 일부 또는 하위서열을 지칭한다. 예를 들어, 단편은 변형된 식물에서 원하는 표현형을 생성하기 위한 유전자 설계에서 사용될 수 있다. 유전자는 이것이 활성 효소를 암호화하는지 여부에 관계 없이 핵산 단편을 식물 프로모터 서열에 대해 센스 방향 또는 안티센스 방향으로 연결함으로써 억제에서 사용하도록 설계될 수 있다.
용어 "보존된 도메인" 또는 "모티프"는 진화적으로 관련된 단백질의 정렬된 서열을 따라 특정 위치에 보존된 아미노산 세트를 의미한다. 다른 위치의 아미노산은 상동 단백질 간에 변할 수 있는 반면, 특정 위치에서 고도로 보존된 아미노산은 단백질의 구조, 안정성, 또는 활성에 필수적인 아미노산을 나타낸다. 이들은 단백질 상동체 패밀리의 정렬된 서열에서 높은 보존 정도에 의해 동정되기 때문에, 새로 결정된 서열을 가진 단백질이 이전에 동정된 단백질 패밀리에 속하는지를 결정하기 위한 식별자, 또는 "특징부"로서 사용될 수 있다.
폴리뉴클레오티드 및 폴리펩티드 서열, 이의 변이체, 및 이들 서열의 구조적 관계는 본원에서 상호 교환적으로 사용되는 용어 "상동성", "상동", "실질적으로 동일한", "실질적으로 유사한" 및 "실질적으로 대응하는"에 의해 기술될 수 있다. 이들은 하나 이상의 아미노산 또는 뉴클레오티드 염기에서의 변화가 분자의 기능, 예컨대, 유전자 발현을 매개하거나 특정 표현형을 생성하는 능력에 영향을 미치지 않는 폴리펩티드 또는 핵산 서열을 지칭한다. 이들 용어는 또한, 초기의 비변형 핵산에 비해 생성된 핵산의 기능적 특성을 실질적으로 변경하지 않는 핵산 서열의 변형을 지칭한다. 이들 변형은 핵산 단편에서의 하나 이상의 뉴클레오티드의 결실, 치환, 및/또는 삽입을 포함한다.
포함되는 실질적으로 유사한 핵산 서열은 (적당히 엄격한 조건, 예컨대, 0.5X SSC, 0.1% SDS, 60℃ 하에) 본원에 예시된 서열, 또는 본원에 개시된 뉴클레오티드 서열의 임의의 일부와 혼성화하는 이의 능력에 의해 정의될 수 있고, 본원에 개시된 임의의 핵산 서열과 기능적으로 동등하다. 엄격 조건은 원연(distantly-related) 생물로부터의 상동 서열과 같은 적당히 유사한 단편을 매우 유사한 단편, 예컨대, 근연(closely-related) 생물로부터 기능적 효소를 복제하는 유전자에 대해 선별하도록 조정될 수 있다. 혼성화 후 세척이 엄격 조건을 결정한다.
용어 "선택적으로 혼성화한다"는 엄격한 혼성화 조건 하에서, 비표적 핵산 서열과의 그 혼성화보다 검출 가능하게 더 큰 정도(예를 들어, 배경에 비해 적어도 2배)의 특정 핵산 표적 서열에 대한 핵산 서열의 혼성화 및 비표적 핵산의 실질적 배제에 대한 언급을 포함한다. 선택적으로 혼성화 서열은 전형적으로 서로 적어도 약 80% 서열 동일성, 또는 90% 서열 동일성 내지 100%까지의 서열 동일성(즉, 완전히 상보적임)을 갖는다.
용어 "엄격한 조건" 또는 "엄격한 혼성화 조건"은 시험관내 혼성화 분석법에서 프로브가 그 표적 서열과 선택적으로 혼성화할 조건에 대한 언급을 포함한다. 엄격한 조건은 서열 의존적이며 상황에 따라 상이할 것이다. 혼성화 및/또는 세척 조건의 엄격성을 제어함으로써, 프로브에 100% 상보적인 표적 서열을 동정할 수 있다(상동성 프로빙). 대안적으로, 엄격 조건은 서열에서 일부 미스매치 형성을 허용하여 더 낮은 정도의 유사성이 검출되도록 조정될 수 있다(이종 프로빙). 일반적으로 프로브는 약 1000개 뉴클레오티드 미만의 길이, 선택적으로 500개 뉴클레오티드 미만의 길이이다.
일반적으로, 엄격한 조건은 pH 7.0 내지 8.3에서 그리고 짧은 프로브(예컨대, 10 내지 50개 뉴클레오티드)의 경우 적어도 약 30℃에서, 긴 프로브(예컨대, 50개 뉴클레오티드 초과)의 경우 적어도 약 60℃에서 염 농도가 약 1.5 M Na 이온 미만, 전형적으로 약 0.01 내지 1.0 M Na 이온 농도(또는 다른 염)인 조건일 것이다. 엄격한 조건은 포름아미드와 같은 불안정화제의 첨가로 달성될 수도 있다. 예시적인 저 엄격 조건은 37℃에서 30 내지 35% 포름아미드, 1 M NaCl, 1% SDS(나트륨 도데실 설페이트) 완충 용액으로의 혼성화, 및 50 내지 55℃에서 1X 내지 2X SSC(20X SSC = 3.0 M NaCl/0.3 M 삼나트륨 시트레이트) 중 세척을 포함한다. 예시적인 적당한 엄격 조건은 37℃에서 40 내지 45% 포름아미드, 1 M NaCl, 1% SDS 중 혼성화, 및 55 내지 60℃에서 0.5X 내지 1X SSC 중 세척을 포함한다. 예시적인 고 엄격 조건은 37℃에서 50% 포름아미드, 1 M NaCl, 1% SDS 중 혼성화, 및 60 내지 65℃에서 0.1X SSC 중 세척을 포함한다.
핵산 또는 폴리펩티드 서열의 문맥에서 "서열 동일성" 또는 "동일성"은, 특정 비교창에 걸쳐 최대 일치를 위해 정렬될 때, 동일한 두 서열 내의 핵산 염기 또는 아미노산 잔기를 지칭한다.
용어 "서열 동일성 백분율"은 비교 윈도우에서 최적으로 정렬된 2개의 서열을 비교하여 결정된 값을 지칭하며, 상기 비교 윈도우 내의 폴리뉴클레오티드 또는 폴리펩티드 서열의 일부는 2개의 서열의 최적 정렬을 위해 (삽입 또는 결실을 포함하지 않는) 참조 서열과 비교하여 부가 또는 결실(즉, 갭)을 포함할 수 있다. 백분율은, 두 서열에서 모두 동일한 핵산 염기 또는 아미노산 잔기가 나타나는 위치의 개수를 결정하여 매칭되는 위치의 개수를 산출하고, 매칭되는 위치의 개수를 비교창 내의 위치의 총 개수로 나누고, 그 결과에 100을 곱하여 서열 동일성의 백분율을 산출함으로써 계산한다. 서열 동일성 백분율의 유용한 예는 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95%, 또는 50% 내지 100%의 임의의 정수 백분율을 포함하지만 이에 한정되는 것은 아니다. 이들 동일성은 본원에 기술된 프로그램 중 임의의 것을 사용하여 결정될 수 있다.
서열 정렬 및 동일성 또는 유사성 백분율 계산은 LASERGENE 생물정보학 컴퓨팅 세트(DNASTAR Inc., Madison, WI)의 MegAlignTM 프로그램을 포함하지만 이에 한정되지 않는 상동 서열을 검출하도록 설계된 다양한 비교 방법을 사용하여 결정될 수 있다. 본 출원의 문맥에서, 서열 분석 소프트웨어가 분석에 사용되는 경우, 달리 명시되지 않는 한, 분석 결과는 언급된 프로그램의 "디폴트 값"에 기초할 것임을 이해할 것이다. 본원에 사용된 바와 같이, "디폴트 값"은 최초로 초기화될 때, 원래 소프트웨어로 로딩되는 임의의 값 또는 파라미터 세트를 의미할 것이다.
"Clustal V 정렬 방법"은 Clustal V(Higgins and Sharp, (1989) CABIOS 5:151-153; Higgins et al., (1992) Comput Appl Biosci 8:189-191에 기술됨)로 명명되고 LASERGENE 생물정보학 컴퓨팅 세트(DNASTAR Inc., Madison, WI)의 MegAlignTM 프로그램에서 확인되는 정렬 방법에 해당한다. 다중 정렬의 경우, 디폴트 값은 GAP PENALTY=10 및 GAP LENGTH PENALTY=10에 해당한다. Clustal 방법을 사용하는 단백질 서열의 페어식 정렬 및 동일성 백분율의 계산을 위한 디폴트 파라미터는 KTUPLE=1, GAP PENALTY=3, WINDOW=5 및 DIAGONALS SAVED=5이다. 핵산의 경우, 이들 파라미터는 KTUPLE=2, GAP PENALTY=5, WINDOW=4 및 DIAGONALS SAVED=4이다. Clustal V 프로그램을 사용하여 서열을 정렬한 후에는, 동일한 프로그램에서 "서열 거리"표를 보고 "동일성 백분율"을 수득할 수 있다.
"Clustal W 정렬 방법"은 Clustal W(Higgins and Sharp, (1989) CABIOS 5:151-153, Higgins et al., (1992) Comput Appl Biosci 8:189-191에 기술됨)로 명명되고 LASERGENE 생물정보학 컴퓨팅 세트(DNASTAR Inc., Madison, WI)의 MegAlignTM v6.1 프로그램에서 확인되는 정렬 방법에 해당한다. 다중 정렬을 위한 디폴트 파라미터(GAP PENALTY=10, GAP LENGTH PENALTY=0.2, 지연 발산 서열(%)=30, DNA 전이 가중치=0.5, 단백질 가중치 매트릭스=Gonnet 시리즈, DNA 가중치 매트릭스=IUB). Clustal W 프로그램을 사용하여 서열을 정렬한 후에는, 동일한 프로그램에서 "서열 거리"표를 보고 "동일성 백분율"을 수득할 수 있다.
달리 명시되지 않는 한, 본원에 제공된 서열 동일성/유사성 값은 하기 파라미터를 사용하여, GAP 버전 10(GCG, Accelrys, San Diego, CA)을 사용하여 수득한 값을 지칭한다: 뉴클레오티드 서열에 대한 동일성% 및 유사성%는 갭 생성 페널티 가중치 50 및 갭 길이 연장 페널티 가중치 3, 및 nwsgapdna.cmp 점수 매트릭스를 사용하며; 아미노산 서열에 대한 동일성% 및 유사성%는 GAP 생성 페널티 가중치 8 및 갭 길이 연장 페널티 2, 및 BLOSUM62 점수 매트릭스를 사용함(Henikoff and Henikoff, (1989) Proc. Natl. Acad. Sci. USA 89:10915). GAP는 문헌[Needleman and Wunsch, (1970) J Mol Biol 48:443-53]의 알고리즘을 사용하여 매칭 수를 최대화하고 갭의 수를 최소화하는 두 개의 전체 서열의 정렬을 찾는다. GAP는 가능한 모든 정렬 및 갭 위치를 고려하고, 매칭되는 염기의 단위로 갭 생성 페널티 및 갭 연장 페널티를 사용하여 가장 많은 수의 매칭되는 염기와 가장 적은 갭을 갖는 정렬을 생성한다.
"BLAST"는 미국 국립생물공학정보센터(NCBI)에서 제공하는, 생물학적 서열 간의 유사성 영역을 찾는 데 사용되는 검색 알고리즘이다. 이 프로그램은 뉴클레오티드 또는 단백질 서열을 서열 데이터베이스와 비교하고 매칭의 통계적 유의성을 계산하여 유사성이 무작위로 발생한 것으로 예측되지 않도록 쿼리 서열과 충분한 유사성을 갖는 서열을 동정한다. BLAST는 동정된 서열 및 이의 쿼리 서열에 대한 로컬 정렬을 보고한다.
여러 수준의 서열 동일성은 다른 종으로부터의 또는 천연적 또는 합성적으로 변형된 폴리펩티드를 동정하는 데 유용하고, 이러한 폴리펩티드는 동일하거나 유사한 기능 또는 활성을 갖는다는 것은 당업자가 잘 이해한다. 동일성 백분율의 유용한 예는 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95%, 또는 50% 내지 100%의 모든 정수의 백분율을 포함하지만 이에 한정되는 것은 아니다. 실제로, 50% 내지 100%의 모든 정수, 예컨대, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 아미노산 동일성은 본 발명을 설명하는 데 유용할 수 있다.
"유전자"는 코딩 서열 앞의 조절 서열(5' 비코딩 서열) 및 뒤의 조절 서열(3' 비코딩 서열)을 포함하는 특정 단백질과 같은, 그러나 이에 한정되지 않는 기능적 분자를 발현하는 핵산 단편을 포함한다. "고유 유전자"는 그 자신의 조절 서열과 함께 자연에서 확인되는 유전자를 지칭한다.
"돌연변이된 유전자"는 인간 개입을 통해 변경된 유전자이다. 이러한 "돌연변이된 유전자"는 적어도 하나의 뉴클레오티드 삽입, 결실, 또는 치환에 의해 대응하는 돌연변이되지 않은 유전자의 서열과 상이한 서열을 갖는다. 본 발명의 특정 구현예에서, 돌연변이된 유전자는 본원에 개시된 바와 같은 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 시스템으로 생성되는 변경을 포함한다. 돌연변이 식물은 돌연변이 유전자를 포함하는 식물이다.
본원에서 사용되는 "표적화된 돌연변이"는 본원에 개시되는 유도 Cpf1 엔도뉴클레아제 시스템이 관련된 방법을 포함하는, 당업자에게 공지된 임의의 방법을 사용하여 표적 유전자 내의 표적 서열을 변경함으로써 제조된 고유 유전자를 포함하는 유전자(표적 유전자로 지칭됨)에서의 돌연변이이다.
가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 유도 표적 돌연변이는 Cpf1 엔도뉴클레아제에 의해 인식되고 절단되는 게놈 표적 부위 내에 또는 외부에 위치하는 뉴클레오티드 서열에서 발생할 수 있다.
식물 세포에 적용시 용어 "게놈"은 핵 내에서 확인되는 염색체 DNA뿐만 아니라 세포의 세포내 성분(예컨대, 미토콘드리아, 또는 색소체) 내에서 확인되는 세포소기관 DNA를 포함한다.
"대립유전자"는 염색체 상의 주어진 유전자좌를 차지하는 유전자의 몇 가지 대안적 형태 중 하나이다. 염색체 상의 주어진 유전자좌에 존재하는 모든 대립유전자가 동일한 경우, 그 식물은 그 유전자좌에서 동형접합성이다. 염색체 상의 주어진 유전자좌에 존재하는 대립유전자가 상이한 경우, 그 식물은 그 유전자좌에서 이형접합성이다.
"코딩 서열"은 특정 아미노산 서열을 코딩하는 폴리뉴클레오티드 서열을 지칭한다. "조절 서열"은 코딩 서열의 상류에(5' 비코딩 서열), 내에, 또는 하류(3' 비코딩 서열)에 위치하며 결합된 코딩 서열의 전사, RNA 가공 또는 안정성, 또는 번역에 영향을 주는 뉴클레오티드 서열을 지칭한다. 조절 서열은 프로모터, 번역 리더 서열, 5' 미번역 서열, 3' 미번역 서열, 인트론, 폴리아데닐화 표적 서열, RNA 가공 부위, 이펙터 결합 부위, 및 줄기-루프 구조를 포함하지만, 이에 한정되는 것은 아니다.
"코돈 변형 유전자" 또는 "코돈 선호 유전자" 또는 "코돈 최적화 유전자"는 숙주 세포의 선호되는 코돈 사용의 빈도를 모방하도록 설계된 그 코돈 사용 빈도를 갖는 유전자이다.
"식물-최적화된 뉴클레오티드 서열"은 식물에서의 발현, 특히 식물에서의 증가된 발현을 위해 최적화된 뉴클레오티드 서열이다. 식물-최적화된 뉴클레오티드 서열은 코돈-최적화 유전자를 포함한다. 식물-최적화된 뉴클레오티드 서열은 향상된 발현을 위한 하나 이상의 식물-선호 코돈을 사용하여, 단백질, 예를 들어 본원에 개시된 바와 같은 Cpf1 엔도뉴클레아제를 암호화하는 뉴클레오티드 서열을 변형하여 합성될 수 있다. 예를 들어, 숙주-선호 코돈 사용의 논의에 대해서는 문헌[Campbell and Gowri (1990) Plant Physiol. 92:1-11]을 참고한다.
식물 선호 유전자를 합성하기 위한 방법은 당분야에서 이용 가능하다. 예를 들어, 본원에 참조로 포함되는 미국 특허 5,380,831호, 및 5,436,391호, 및 문헌[Murray et al. (1989) Nucleic Acids Res. 17:477-498]을 참고한다. 추가적인 서열 변형은 식물 숙주에서 유전자 발현을 향상시키는 것으로 알려져 있다. 이들은, 예를 들어, 가짜 폴리아데닐화 신호를 암호화하는 하나 이상의 서열, 하나 이상의 엑손-인트론 스플라이스 부위 신호, 하나 이상의 트랜스포존-유사 반복 서열, 및 유전자 발현에 유해할 수 있는 기타 이러한 잘 특성규명된 서열의 제거를 포함한다. 서열의 G-C 함량은 숙주 식물 세포에서 발현되는 공지된 유전자를 참조하여 계산되는 주어진 식물 숙주에 대한 평균 수준으로 조정될 수 있다. 가능한 경우, 서열은 하나 이상의 예측된 헤어핀 2차 mRNA 구조를 피하도록 변형된다. 따라서, 본 발명의 "식물 최적화된 뉴클레오티드 서열"은 하나 이상의 이러한 서열 변형을 포함한다.
"프로모터"는 RNA 중합효소 및 기타 전사 개시 단백질의 인식 및 결합에 관련되는 DNA의 영역이다. 프로모터 서열은 근위 상류 요소 및 더 원위의 상류 요소로 이루어지고, 후자는 종종 인핸서로 지칭된다. "인핸서"는 프로모터 활성을 자극할 수 있는 DNA 서열이고, 프로모터 고유의 요소 또는 프로모터의 수준 또는 조직 특이성을 향상시키기 위해 삽입된 이종 요소일 수 있다. 프로모터는 고유 유전자로부터 그 전체가 유래될 수 있거나, 자연에서 확인되는 상이한 프로모터로부터 유래된 상이한 요소로 구성될 수 있고/있거나 합성 DNA 분절을 포함할 수 있다. 상이한 프로모터가 상이한 조직 또는 세포 유형으로, 또는 상이한 발달 단계에서 또는 상이한 환경 조건에 반응하여 유전자의 발현을 유도할 수 있음은 당업자가 이해한다. 또한, 대부분의 경우, 조절 서열의 정확한 경계가 완전히 정의되지 않았기 때문에, 일부 변형을 갖는 DNA 단편이 동일한 프로모터 활성을 가질 수 있음이 더 인식된다. 대부분의 시점에 대부분의 세포 유형에서 유전자가 발현되게 하는 프로모터는 일반적으로 "구성적 프로모터"로 지칭된다.
특정 프로모터는 다른 것들보다 더 빠른 속도로 RNA 합성을 유도할 수 있는 것으로 밝혀졌다. 이들은 "강력한 프로모터"라고 한다. 일부 다른 프로모터는 특정 유형의 세포 또는 조직에서만 더 높은 수준으로 RNA 합성을 유도하는 것으로 밝혀졌고, 프로모터가 바람직하게는 특정 조직에서 RNA 합성을 유도할 뿐만 아니라 다른 조직에서 감소된 수준으로 RNA 합성을 유도할 경우 종종 "조직 특이적 프로모터" 또는 "조직 선호 프로모터"라고 지칭된다.
식물 프로모터에는 식물 세포에서 전사를 개시할 수 있는 프로모터가 포함된다. 식물 프로모터의 리뷰에 대해, 문헌[Potenza et al., 2004, In Vitro Cell Dev Biol 40:1-22; Porto et al., 2014, Molecular Biotechnology (2014), 56(1), 38-49]을 참고한다.
구성적 프로모터는, 예를 들어, 코어 CaMV 35S 프로모터(Odell et al., (1985) Nature 313:810-2); 벼 액틴(McElroy et al., (1990) Plant Cell 2:163-71); 유비퀴틴(Christensen et al., (1989) Plant Mol Biol 12:619-32; ALS 프로모터(미국 특허 5,659,026호) 등을 포함한다.
조직 선호 프로모터는 특정 식물 조직 내에서 발현 향상을 목표로 하는 데 활용될 수 있다. 조직 선호 프로모터로는, 예를 들어, 2013년 7월 11일에 공개된 WO2013/103367, 문헌[Kawamata et al., (1997) Plant Cell Physiol 38:792-803; Hansen et al., (1997) Mol Gen Genet 254:337-43; Russell et al., (1997) Transgenic Res 6:157-68; Rinehart et al., (1996) Plant Physiol 112:1331-41; Van Camp et al., (1996) Plant Physiol 112:525-35; Canevascini et al., (1996) Plant Physiol 112:513-524; Lam, (1994) Results Probl Cell Differ 20:181-96; 및 Guevara-Garcia et al., (1993) Plant J 4:495-505]를 들 수 있다. 잎-선호 프로모터는, 예를 들어, 문헌[Yamamoto et al., (1997) Plant J 12:255-65; Kwon et al., (1994) Plant Physiol 105:357-67; Yamamoto et al., (1994) Plant Cell Physiol 35:773-8; Gotor et al., (1993) Plant J 3:509-18; Orozco et al., (1993) Plant Mol Biol 23:1129-38; Matsuoka et al., (1993) Proc. Natl. Acad. Sci. USA 90:9586-90; Simpson et al., (1958) EMBO J 4:2723-9; Timko et al., (1988) Nature 318:57-8]을 포함한다. 뿌리 선호 프로모터로는, 예를 들어, 문헌[Hire et al., (1992) Plant Mol Biol 20:207-18(대두 뿌리 특이적 글루타민 합성효소 유전자); Miao et al., (1991) Plant Cell 3:11-22(세포질 글루타민 합성효소(GS)); Keller and Baumgartner, (1991) Plant Cell 3:1051-61(강낭콩의 GRP 1.8 유전자의 뿌리 특이적 제어 요소); Sanger et al., (1990) Plant Mol Biol 14:433-43(A. 투메파시엔스(tumefaciens) 만노파인(mannopine) 합성효소(MAS)의 뿌리 특이적 프로모터); Bogusz et al., (1990) Plant Cell 2:633-41(파라스포니아 안데르소니이(Parasponia andersonii) 및 트레마 토멘토사(Trema tomentosa)로부터 단리된 뿌리 특이적 프로모터); Leach and Aoyagi, (1991) Plant Sci 79:69-76(A. 리조게네스(rhizogenes) rolC 및 rolD 뿌리 유도 유전자); Teeri et al., (1989) EMBO J 8:343-50(아그로박테리움(Agrobacterium) 상처 유도 TR1' 및 TR2' 유전자); VfENOD-GRP3 유전자 프로모터(Kuster et al., (1995) Plant Mol Biol 29:759-72); 및 rolB 프로모터(Capana et al., (1994) Plant Mol Biol 25:681-91; 파세올린 유전자(Murai et al., (1983) Science 23:476-82; Sengopta-Gopalen et al., (1988) Proc. Natl. Acad. Sci. USA 82:3320-4)]를 들 수 있다. 또한, 미국 특허 5,837,876호; 5,750,386호; 5,633,363호; 5,459,252호; 5,401,836호; 5,110,732호 및 5,023,179호를 참고한다.
종자 선호 프로모터는 종자 발달 동안 활성을 나타내는 종자 특이적 프로모터뿐만 아니라, 종자 발아 동안 활성을 나타내는 종자 발아 프로모터를 포함한다. 문헌[Thompson et al., (1989) BioEssays 10:108]을 참고한다. 종자 선호 프로모터는 Cim1(사이토키닌 유도 메세지); cZ19B1(옥수수 19 kDa 제인(zein)); 및 milps(미오-이노시톨-1-포스페이트 합성효소); (WO00/11177; 및 미국 특허 6,225,529호)를 포함하나, 이에 한정되는 것은 아니다. 쌍떡잎 식물의 경우, 종자 선호 프로모터는 콩류 β-파세올린, 나핀, β-콘글리시닌, 대두 렉틴, 크루시페린 등을 포함하나, 이에 한정되는 것은 아니다. 외떡잎 식물의 경우, 종자 선호 프로모터는 옥수수 15 kDa 제인, 22 kDa 제인, 27 kDa 감마 제인, 왁시(waxy), 슈렁큰(shrunken) 1, 슈렁큰 2, 글로불린 1, 올레오신(oleosin), 및 nuc1을 포함하나, 이에 한정되는 것은 아니다. 또한, END1END2 유전자로부터의 종자 선호 프로모터가 개시된 WO00/12733을 참고한다.
용어 "유도성 프로모터"는, 예를 들어, 화학적 화합물(화학적 유도물질)에 의해 내인성 또는 외인성 자극의 존재에 반응하여, 또는 환경, 호르몬, 화학물질, 및/또는 발달 신호에 반응하여 코딩 서열 또는 기능적 RNA를 선택적으로 발현하는 프로모터를 지칭한다. 유도성 또는 조절 프로모터는, 예를 들어, 빛, 열, 스트레스, 홍수 또는 가뭄, 염 스트레스, 삼투압 스트레스, 식물 호르몬, 상처, 또는 화학물질, 예컨대, 에탄올, 아브시스산(ABA), 자스모네이트, 살리실산, 또는 약해경감제에 의해 유도되거나 조절되는 프로모터를 포함한다.
화학물질 유도성(조절) 프로모터는 외인성 화학 조절인자의 적용을 통해 식물에서 유전자의 발현을 조절하는 데 사용될 수 있다. 이러한 프로모터는 화학물질의 적용이 유전자 발현을 유도하는 화학물질 유도성 프로모터, 또는 화학물질의 적용이 유전자 발현을 억제하는 화학물질 억제성 프로모터일 수 있다. 화학물질 유도성 프로모터는 벤젠 설폰아미드 제초제 약해경감제에 의해 활성화되는 옥수수 In2-2 프로모터(De Veylder et al., (1997) Plant Cell Physiol 38:568-77), 잡초 발아 전에 제초제로서 사용되는 소수성 친전자성 화합물에 의해 활성화되는 옥수수 GST 프로모터(GST-II-27, WO93/01294) 및 살리실산에 의해 활성화되는 담배 PR-1a 프로모터(Ono et al., (2004) Biosci Biotechnol Biochem 68:803-7)를 포함하나, 이에 한정되는 것은 아니다. 다른 화학물질-조절 프로모터는 스테로이드-반응성 프로모터(예를 들어, 글루코코르티코이드-유도성 프로모터(Schena et al., (1991) Proc. Natl. Acad. Sci. USA 88:10421-5; McNellis et al., (1998) Plant J 14:247-257); 테트라사이클린-유도성 및 테트라사이클린-억제성 프로모터(Gatz et al., (1991) Mol Gen Genet 227:229-37; 미국 특허 5,814,618호 및 5,789,156호)를 포함한다.
병원체에 의한 감염 후에 유도되는 병원체 유도성 프로모터는 PR 단백질, SAR 단백질, 베타-1,3-글루카나아제, 키티나아제 등의 발현을 조절하는 것들을 포함하나, 이에 한정되는 것은 아니다.
스트레스-유도성 프로모터는 RD29A 프로모터를 포함한다(Kasuga et al. (1999) Nature Biotechnol. 17:287-91). 당업자는 가뭄, 삼투압 스트레스, 염 스트레스 및 온도 스트레스와 같은 스트레스 조건을 시뮬레이션하고 시뮬레이션된 또는 자연 발생 스트레스 조건에 노출되었던 식물의 스트레스 관용성을 평가하기 위한 프로토콜을 잘 알고 있다.
식물 세포에서 유용한 유도성 프로모터의 또 다른 예는 본원에 참조로 포함되는, 2013년 11월 21일에 공개된 US 특허 출원 US 2013-0312137A1에 기술된 열 유도성 및/또는 화학물질 유도성 프로모터 ZmCAS1 프로모터이다, 열 충격 요소를 포함하거나 이에 융합된 다른 열 유도성 프로모터 또는 프로모터들, 예컨대 그러나 이에 한정되지는 않는 US544858 및 US561399에 기술된 식물 열 충격 프로모터 또는 요소는 당분야에 공지되어 있다.
식물 세포에 유용한 다양한 유형의 새로운 프로모터가 지속적으로 확인되고 있고; 많은 예가 Okamuro and Goldberg(1989)에 의한 편집[The Biochemistry of Plants, Vol. 115, Stumpf and Conn, eds (New York, NY: Academic Press), pp. 1-82]에서 확인될 수 있다.
"번역 리더 서열"은 유전자의 프로모터 서열과 코딩 서열 사이에 위치한 폴리뉴클레오티드 서열을 지칭한다. 번역 리더 서열은 번역 시작 서열의 상류 mRNA에 존재한다. 번역 리더 서열은 mRNA에 대한 1차 전사체의 가공, mRNA 안정성 또는 번역 효율에 영향을 미칠 수 있다. 번역 리더 서열의 예는 기술되어 있다(예를 들어, Turner and Foster, (1995) Mol Biotechnol 3:225-236).
"3' 비코딩 서열", "전사 종결인자" 또는 "종결 서열"은 코딩 서열의 하류에 위치한 DNA 서열을 지칭하며, 폴리아데닐화 인식 서열, 및 mRNA 가공 또는 유전자 발현에 영향을 미칠 수 있는 조절 신호를 암호화하는 다른 서열을 포함한다. 폴리아데닐화 신호는 일반적으로, mRNA 전구체 3' 말단에의 폴리아데닐산 영역 부가에 영향을 주는 것을 특징으로 한다. 다른 3' 비코딩 서열의 사용은 문헌[Ingelbrecht et al., (1989) Plant Cell 1:671-680]에 예시되어 있다.
"RNA 전사체"는 DNA 서열의 RNA 폴리머라아제-촉매 전사로부터 만들어지는 산물을 지칭한다. RNA 전사체가 DNA 서열의 완벽한 상보적인 카피인 경우, 이를 1차 전사체 또는 프리-mRNA라고 지칭한다. RNA 전사체가 1차 전사체 프리 mRNA의 전사 후 가공으로부터 유래된 RNA 서열인 경우, 성숙 RNA 또는 mRNA라고 지칭한다. "메신저 RNA" 또는 "mRNA"는 인트론이 없고 세포에 의해 단백질로 번역될 수 있는 RNA를 지칭한다. "cDNA"는 효소 역전사효소를 사용하는 mRNA 주형에 상보적이고 그로부터 합성되는 DNA를 지칭한다. cDNA는 단일 가닥이거나 DNA 폴리머라아제 I의 Klenow 단편을 사용하여 이중 가닥 형태로 변환될 수 있다. "센스" RNA는 mRNA를 포함하는 RNA 전사체를 지칭하며 세포내 또는 시험관내 단백질로 번역될 수 있다. "안티센스 RNA"는, 표적 1차 전사체 또는 mRNA의 전부 또는 일부와 상보적이고 표적 유전자의 발현을 차단하는 RNA 전사체를 지칭한다(예를 들어, 미국 특허 5,107,065호 참고). 안티센스 RNA의 상보성은 특정 유전자 전사체의 임의의 부분, 즉 5' 비-코딩 서열, 3' 비-코딩 서열, 인트론 또는 코딩 서열에 있을 수 있다. "기능적 RNA"는 번역되지 않을 수 있지만 세포 프로세스에 영향을 미치는 안티센스 RNA, 리보자임 RNA 또는 기타 RNA를 지칭한다. 용어 "상보체(complement)" 및 "역 상보체(reverse complement)"는 mRNA 전사체에 대하여 본원에서 상호 교환적으로 사용되며, 메시지의 안티센스 RNA를 정의하기 위한 의미이다.
용어 "작동 가능하게 연결된"은 하나의 기능이 다른 하나에 의해 조절되도록 된 단일 핵산 단편 상에서의 핵산 서열들의 결합을 나타낸다. 예를 들어, 프로모터는, 코딩 서열의 발현을 조절할 수 있는 경우(즉, 코딩 서열이 프로모터의 전사 제어 하에 있을 때), 코딩 서열과 작동 가능하게 연결된다. 코딩 서열은 센스 또는 안티센스 방향으로 조절 서열에 작동 가능하게 연결될 수 있다. 다른 예에서, 상보적 RNA 영역은 표적 mRNA의 5', 또는 표적 mRNA의 3', 또는 표적 mRNA 내에, 직접 또는 간접적으로 작동 가능하게 연결될 수 있거나, 제1 상보성 영역은 표적 mRNA의 5'이고 그 상보체는 3'이다.
본원에서 사용되는 표준 재조합 DNA 및 분자 클로닝 기술은 당분야에 널리 공지되어 있으며 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual; Cold Spring Harbor Laboratory: Cold Spring Harbor, NY (1989)]에 보다 자세히 기술되어 있다. 형질전환 방법은 당업자에게 잘 알려져 있고 아래에 기술된다.
용어 "재조합"은, 예를 들어, 유전자 조작 기술에 의해 단리된 핵산 분절의 조작, 또는 화학적 합성에 의한, 그렇지 않았다면 분리된 2개의 서열 분절의 인공 조합을 지칭한다.
용어 "플라스미드", "벡터" 및 "카세트"는 종종 세포의 중심 대사의 일부가 아니며, 보통 이중쇄 DNA 형태인 유전자를 수반하는 선형 또는 원형 염색체외 요소를 지칭한다. 이러한 요소는 임의의 공급원으로부터 유래된 단일 또는 이중 가닥 DNA 또는 RNA의, 선형 또는 원형 형태의, 자율적 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오티드 서열일 수 있고, 다수의 뉴클레오티드 서열은 세포 내로 관심 폴리뉴클레오티드를 도입할 수 있는 고유한 구조로 연결되거나 재조합되어 있다. "형질전환 카세트"는 유전자를 함유하며 유전자에 부가하여 특정한 숙주 세포의 형질전환을 촉진하는 요소를 갖는 특정 벡터를 지칭한다. "발현 카세트"는 유전자를 포함하면서 유전자 이외에 숙주에서 그 유전자의 발현을 허용하는 요소를 갖는 특정 벡터를 지칭한다.
용어 "재조합 DNA 분자", "재조합 DNA 작제물", "발현 작제물", "작제물" 및 "재조합 작제물"은 본원에서 상호 교환적으로 사용된다. 재조합 DNA 작제물은 핵산 서열, 예컨대 자연에서 모두 함께 확인되지 않는 조절 및 코딩 서열의 인공 조합을 포함한다. 예를 들어, 재조합 DNA 작제물은 상이한 원천에서 유래되는 조절 서열 및 코딩 서열, 또는 동일한 원천에서 유래되지만, 자연에서 확인되는 것과 상이한 방식으로 배열된 조절 서열 및 코딩 서열을 포함할 수 있다. 이러한 작제물은 자체적으로 사용되거나 벡터와 함께 사용될 수 있다. 벡터가 사용되는 경우, 벡터의 선택은 당업자에게 널리 공지된 바와 같이 숙주 세포 내에 벡터를 도입하기 위해 사용될 방법에 의존한다. 예를 들어, 플라스미드 벡터가 사용될 수 있다. 당업자는 숙주 세포를 성공적으로 형질전환하고, 선택하고, 증식시키기 위해 벡터 상에 존재해야 하는 유전 요소를 잘 인식한다. 당업자는 또한 상이한 독립적 형질전환 이벤트가 상이한 발현 수준 및 패턴으로 일어날 수 있고(Jones et al., (1985) EMBO J 4:2411-2418; De Almeida et al., (1989) Mol Gen Genetics 218:78-86), 이에 따라 원하는 발현 수준 및 패턴을 나타내는 세포주를 수득하기 위해 여러 이벤트가 전형적으로 선별됨을 또한 인식할 것이다. 이러한 선별은 표준 분자 생물학, 생화학, 및 DNA의 서던 분석, mRNA 발현의 노던 분석, PCR, 실시간 정량 PCR(qPCR), 역전사 PCR(RT-PCR), 단백질 발현의 면역블로팅 분석, 효소 또는 활성 분석법, 및/또는 표현형 분석을 비롯한 기타 분석법에 의해 달성될 수 있다.
본원에 사용된 용어 "발현"은 전구체 또는 성숙한 형태의 기능적 최종 산물(예컨대, mRNA, 가이드 RNA 또는 단백질)의 생산을 지칭한다.
"성숙" 단백질은 번역-후 가공된 폴리펩티드(즉, 일차 번역 산물에 존재하는 임의의 프리- 또는 프로펩티드가 제거된 것)을 지칭한다. "전구체" 단백질은 mRNA의 일차 번역 산물(즉, 프리- 및 프로펩티드가 여전히 존재하는 것)을 지칭한다. 프리- 및 프로펩티드는 세포내 국재화 신호일 수 있으나, 이에 한정되는 것은 아니다.
본원에 개시된 가이드 폴리뉴클레오티드, Cpf1 엔도뉴클레아제, 폴리뉴클레오티드 변형 주형, 공여 DNA, 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 시스템 및 이의 임의의 하나의 조합은 세포, 예컨대 원핵생물 또는 진핵생물 세포 내로 도입될 수 있다.
세포는 인간, 비인간, 동물, 박테리아, 진균, 곤충, 효모, 비통상적인 효모 및 식물의 세포뿐만 아니라 본원에 기술된 방법에 의해 생성된 식물 및 종자를 포함하나, 이에 한정되는 것은 아니다.
외떡잎 식물 및 쌍떡잎 식물 또는 식물 부분을 포함하는 임의의 식물 또는 식물 부분이 사용될 수 있다.
사용될 수 있는 외떡잎 식물의 예는 옥수수(제아 메이스(Zea mays)), 벼(오리자 사티바(Oryza sativa)), 호밀(세칼레 세레알레(Secale cereale)), 수수(소르검 비칼라(Sorghum bicolor), 소르검 불가레(Sorghum vulgare)), 기장(예컨대, 펄 밀렛(페니세툼 글라쿰(Pennisetum glaucum)), 프로소 밀렛(파니쿰 밀리아세움(Panicum miliaceum)), 조(세타리아 이탈리카(Setaria italica)), 손가락조(엘류신 코라카나(Eleusine coracana)), 밀(트리티쿰 종, 트리티쿰 아에스티붐(Triticum aestivum), 트리티쿰 모노코컴(Triticum monococcum)), 사탕수수(사카룸(Saccharum) 종), 귀리(아베나(Avena)), 보리(호르데움(Hordeum)), 스위치그래스(파니쿰 비르가툼(Panicum virgatum)), 파인애플(아나나스 코모수스(Ananas comosus)), 바나나(무사(Musa) 종), 야자, 관상용 식물, 잔디, 및 기타 풀을 포함할 수 있지만, 이에 한정되는 것은 아니다.
용어 "쌍떡잎 식물의(dicotyledoneae)" 또는 "쌍떡잎 식물(dicot)"은 "디코틸레도네애(dicotyledoneae)"로도 알려진 속씨 식물의 하위강을 지칭하며, 전체 식물, 식물 기관(예컨대, 잎, 줄기, 뿌리 등), 종자, 식물 세포, 및 그 자손에 대한 언급을 포함한다. 사용될 수 있는 쌍떡잎 식물의 예는 대두(글리신 맥스(Glycine max)), 브라시카(Brassica) 종(카놀라)(브라시카 나푸스(Brassica napus), B. 캄페스트리스(campestris), 브라시카 라파(Brassica rapa), 브라시카 준세아(Brassica. juncea)), 알팔파(메디카고 사티바(Medicago sativa)), 알팔파(메디카고 사티바(Medicago sativa), 담배(니코티아나 타바쿰(Nicotiana tabacum)), 애기장대(아라비답시스 탈리아나(Arabidopsis thaliana)), 해바라기(헬리안투스 안누우스(Helianthus annuus)), 목화(고시피움 아르보레움(Gossypium arboreum), 고시피움 바르바덴스(Gossypium barbadense)), 및 땅콩(아라키스 하이포가에아(Arachis hypogaea)), 토마토(솔라눔 라이코페르시쿰(Solanum lycopersicum)), 감자(솔라눔 투베로섬(Solanum tuberosum)을 포함하지만 이에 한정되는 것은 아니다.
사용될 수 있는 식물은 잇꽃(카르타무스 팅토리우스(Carthamus tinctorius)), 고구마(이포모에아 바타투스(Ipomoea batatus)), 카싸바(마니호트 에스쿨렌타(Manihot esculenta)), 커피(커피(Coffea) spp.), 코코넛(코코스 누시페라(Cocos nucifera)), 시트러스 나무(시트러스(Citrus) spp.), 코코아(테오브로마 카카오(Theobroma cacao)), 차(카멜리아 시넨시스(Camellia sinensis)), 바나나(무사(Musa) spp.), 아보카도(페르시아 아메리카나(Persea americana)), 무화과(피쿠스 카시카(Ficus casica)), 구아바(프시디움 구아자바(Psidium guajava)), 망고(망기페라 인디카(Mangifera indica)), 올리브(올레아 유로파에아(Olea europaea)), 파파야(카리카 파파야(Carica papaya)), 캐슈(아나카르디움 옥시덴탈레(Anacardium occidentale)), 마카다미아(마카다미아 인테그리폴리아(Macadamia integrifolia)), 아몬드(프루누스 아미그달루스(Prunus amygdalus)), 사탕무(베타 불가리스(Beta vulgaris)), 야채, 관상용 식물, 및 침엽수를 포함한다.
야채는 토마토(라이코페르시콘 에스쿨렌툼(Lycopersicon esculentum)), 상추(예컨대 락투카 사티바(Lactuca sativa)), 그린 빈(파세올러스 불가리스(Phaseolus vulgaris)), 리마 콩(파세올러스 리멘시스(Phaseolus limensis)), 완두콩(라티루스(Lathyrus) spp.), 및 쿠쿠미스(Cucumis)속 구성원, 예컨대 오이(C. 사티부스(sativus)), 캔탈로프(C. 칸탈루펜시스(cantalupensis)), 및 머스크 멜론(C. 멜로(melo))을 포함한다. 관상용 식물은 진달래(로도덴드론(Rhododendron) spp.), 수국(마크로필라 하이드랑게아(Macrophylla hydrangea)), 히비스커스(히비스커스 로사사넨시스(Hibiscus rosasanensis)), 장미(로자(Rosa) spp.), 튤립(튤리파(Tulipa) spp.), 수선화(나르시서스(Narcissus) spp.), 페튜니아(페튜니아 하이브리다(Petunia hybrida)), 카네이션(디안투스 카리오필러스(Dianthus caryophyllus)), 포인세티아(유포르비아 풀케리마(Euphorbia pulcherrima)), 및 국화를 포함한다.
본 발명의 실시에서 이용될 수 있는 침엽수는, 예를 들어, 소나무, 예컨대 테다 소나무(피너스 태다(Pinus taeda)), 슬래시 소나무(피너스 엘리오티이(Pinus elliotii)), 폰데로사 소나무(피너스 폰데로사(Pinus ponderosa)), 로지폴 소나무(피너스 콘토르타(Pinus contorta)), 및 몬테레이 소나무(피너스 라디아타(Pinus radiata)); 미송(슈도추가 멘지에시이(Pseudotsuga menziesii)); 미국 솔송나무(추가 카나덴시스(Tsuga canadensis)); 시트카 가문비나무(피세아 글라우카(Picea glauca)); 미국삼나무(세쿠오이아 셈페르비렌스(Sequoia sempervirens)); 전나무, 예컨대 유럽 전나무(애비스 아마빌리스(Abies amabilis)) 및 발삼 전나무(애비스 발사메아(Abies balsamea)); 및 개잎갈나무, 예컨대 미국 삼나무(투자 플리카타(Thuja plicata)) 및 알래스카 측백나무(카매사이파리스 누트카텐시스(Chamaecyparis nootkatensis))를 포함한다.
용어 "식물"은 전체 식물, 식물 기관, 식물 조직, 종자, 식물 세포, 종자 및 그 자손을 포함한다. 식물 세포는 종자로부터의 세포, 현탁 배양물, 배아, 분열부, 영역 캘러스 조직, 잎, 뿌리, 어린 싹, 배우체, 포자체, 꽃가루 및 미포자를 포함하지만 이에 한정되는 것은 아니다. 식물 부분은 뿌리, 줄기, 어린 싹, 잎, 꽃가루, 종자, 종양 조직 및 다양한 형태의 세포 및 배양물(예컨대, 단일 세포, 원형질체, 배아 및 캘러스 조직)을 포함하지만 이에 한정되지 않는 분화 및 미분화 조직을 포함한다. 식물 조직은 식물에, 또는 식물 기관, 조직, 또는 세포 배양물에 있을 수 있다. 용어 "식물 기관"은 형태학적 및 기능적으로 구별되는 식물의 부분을 구성하는 식물 조직 또는 조직군을 지칭한다. 용어 "게놈"은 생물 또는 바이러스의 각각의 세포 또는 세포 소기관에 존재하는 유전 물질(유전자 및 비코딩 서열)의 전체 상보체; 및/또는 한쪽 부모로부터 (반수체) 단위로서 유전된 완전한 염색체 세트를 지칭한다. "자손"은 식물의 임의의 후속 세대를 포함한다.
본원에서 사용되는 용어 "식물 부분"은 식물 세포, 식물 원형질체, 식물이 재생될 수 있는 식물 세포 조직 배양물, 식물 캘러스, 식물 덩어리, 및 식물 또는 식물의 부분, 예컨대 배아, 꽃가루, 난세포, 종자, 잎, 꽃, 가지, 과일, 속씨, 이삭, 속대, 껍질, 줄기, 뿌리, 뿌리 끝, 꽃밥 등뿐만 아니라 이의 부분에서 온전한 식물 세포를 지칭한다. 낟알은 종의 성장 또는 생식 이외의 목적을 위해 상업적 재배업자에 의해 생산되는 성숙 종자를 의미하려는 것이다. 재생된 식물의 자손, 변이체, 및 돌연변이체는 또한 이들 부분이 도입된 폴리뉴클레오티드를 포함하는 한, 본 발명의 범위 내로 포함된다.
유전자이식 식물은, 예를 들어, 형질전환 단계에 의해 도입된 이종 폴리뉴클레오티드를 그 게놈 내에 포함하는 식물을 포함한다. 이종 폴리뉴클레오티드는 폴리뉴클레오티드가 대대로 전달되도록 게놈 내에 안정적으로 통합될 수 있다. 이종 폴리뉴클레오티드는 단독으로 또는 재조합 DNA 작제물의 일부로서 게놈 내에 통합될 수 있다. 유전자이식 식물은 그 게놈 내에 하나보다 많은 이종 폴리뉴클레오티드를 포함할 수도 있다. 각각의 이종 폴리뉴클레오티드는 유전자이식 식물에 상이한 형질을 부여할 수 있다. 이종 폴리뉴클레오티드는 외래종으로부터 유래하는 서열을 포함할 수 있고, 또는 동일 종으로부터 유래하는 경우, 그 고유한 형태로부터 실질적으로 변형될 수 있다. 유전자이식체는 초기에 그렇게 변경된 유전자이식체뿐만 아니라 초기의 유전자이식체로부터 유성 교배 또는 무성 번식에 의해 생성된 것들을 비롯하여, 이종 핵산의 존재에 의해 유전형이 변경된 임의의 세포, 세포주, 캘러스, 조직, 식물 부분 또는 식물을 포함할 수 있다. 종래의 식물 육종 방법, 외래 폴리뉴클레오티드의 삽입을 초래하지 않는 본원에 기술된 게놈 편집 절차, 또는 자연적으로 발생하는 이벤트, 예컨대, 무작위 타가 수정, 비재조합 바이러스 감염, 비재조합 박테리아 형질전환, 비재조합 전위, 또는 자연 돌연변이에 의한 (염색체 또는 염색체외) 게놈의 변경은 유전자이식체로 간주되지 않는다.
본 발명의 특정 구현예에서, 가임성 식물은 생존 가능한 웅성 및 자성 생식체를 생산하는 식물이며, 자가 수정한다. 이러한 자가 수정 식물은 임의의 다른 식물의 배우체 및 그 안에 포함된 유전 물질의 기여 없이 자손 식물을 생산할 수 있다. 본 발명의 다른 구현예는 식물이 생존 가능하거나 달리 수정할 수 있는 웅성 생식체, 또는 자성 생식체, 또는 둘 다를 생성하지 않기 때문에 자가 수정하지 않는 식물의 사용이 관여될 수 있다. 본원에 사용된 "웅성 불임성 식물"은 생존 가능하거나 달리 수정할 수 있는 웅성 생식체를 생산하지 않는 식물이다. 본원에 사용된 "자성 불임성 식물"은 생존 가능하거나 달리 수정할 수 있는 자성 생식체를 생산하지 않는 식물이다. 웅성 불임성 및 자성 불임성 식물은 각각 자성 가임성 및 웅성 가임성일 수 있는 것으로 인식된다. 또한, 웅성 가임성(이지만, 자성 불임성) 식물은 자성 가임성 식물과 교배될 때 생존 가능한 자손을 생산할 수 있고, 자성 가임성(이지만, 웅성 불임성) 식물은 웅성 가임성 식물과 교배될 때 생존 가능한 자손을 생산할 수 있는 것으로 인정된다.
본 명세서의 문맥에서 용어 "교배"(crossed, cross, 또는 crossing)는 자손(즉, 세포, 종자, 또는 식물)을 생산하기 위한 수분을 통한 생식체의 융합을 의미한다. 이 용어는 유성 교배(다른 식물에 의한 식물의 수분) 및 자가생식(자가 수분, 즉, 꽃가루 및 밑씨(또는 소포자 및 대포자)가 동일 식물 또는 유전적으로 동일한 식물로부터 유래된 경우)을 모두 포함한다.
용어 "이입"(introgression)은 유전자좌의 원하는 대립유전자가 하나의 유전적 배경으로부터 다른 유전적 배경으로 유전되는 것을 의미한다. 예를 들어, 특정 유전자좌에서의 원하는 대립유전자의 이입은, 적어도 하나의 모체 식물이 그 게놈에 원하는 대립유전자를 갖는 두 모체 식물 간의 유성 교배를 통해 적어도 하나의 자손 식물에 유전될 수 있다. 대안적으로, 예를 들어, 대립유전자의 유전은, 예를 들어, 적어도 하나의 공여 원형질체가 그 게놈 내에 원하는 대립유전자를 갖는 융합된 원형질체에서, 두 공여 게놈 간의 재조합에 의해 일어날 수 있다. 원하는 대립유전자는, 예를 들어, 이식유전자, 변형된(돌연변이되거나 편집된) 고유한 대립유전자, 또는 마커 또는 QTL의 선택된 대립유전자일 수 있다.
"센티모건"(cM) 또는 "지도 단위"는 두 개의 연결된 유전자, 마커, 표적 부위, 유전자좌, 또는 이의 임의의 쌍 간의 거리이고, 감수분열 산물의 1%는 재조합체이다. 따라서, 센티모건은 두 개의 연결된 유전자, 마커, 표적 부위, 유전자좌, 또는 이의 임의의 쌍 간의 1% 평균 재조합 빈도에 해당하는 거리와 동등하다.
본 발명은 하나 이상의 도입된 형질을 포함하는 식물의 육종에 유용하다.
옥수수 식물(제아 메이스 L.)은 자가 수분 및 타가 수분 기술 둘 다에 의해 육종될 수 있다. 옥수수는 동일 식물에서, 수술에 위치한 수꽃 및 이삭에 위치한 암꽃을 가지고 있다. 이는 자가 수분("자가생식") 하거나 타가 수분할 수 있다. 옥수수에서 자연 수분은 수술의 꽃가루가 바람에 의해 초기 이삭의 맨 위에 튀어 나온 수염으로 날릴 때 일어난다. 수분은 당업자에게 알려진 기술에 의해 용이하게 제어될 수 있다. 옥수수 잡종의 개발은 동형접합 근친교배 계통의 개발, 이러한 계통의 교배, 및 교배의 평가를 필요로 한다. 계통 육종 및 순환 선택은 개체군으로부터 근친교배 계통을 개발하는 데 사용되는 두 가지 육종 방법이다. 육종 프로그램은 자가생식 및 원하는 표현형의 선택에 의해 새로운 근친교배 계통이 개발되는 육종 풀(breeding pool)에 둘 이상의 근친교배 계통 또는 다양한 광범위한 공급원으로부터의 원하는 형질을 결합한다. 잡종 옥수수 품종은 이러한 두 가지 근친교배 계통의 교배이며, 각각의 근친교배 계통은 다른 하나에 부족한 하나 이상의 바람직한 특징을 갖거나 다른 하나를 보완할 수 있다. 새로운 근친교배종은 다른 근친교배 계통과 교배되고, 이들 교배로부터의 잡종을 평가하여 어느 것이 상업성이 있는지 판단한다. 제1 세대의 잡종 자손은 F1으로 지정된다. F1 잡종은 근친교배된 모체보다 더 잘 자란다. 이러한 잡종 활력 또는 잡종 강세는 식물 성장의 증가 및 수확량 증가를 포함하여 여러 방식으로 증명될 수 있다.
잡종 옥수수 종자는 수동 제웅을 포함하는 웅성 불임성 시스템에 의해 생산될 수 있다. 잡종 종자를 생산하기 위해, 성장하는 자성 근친교배 모체로부터 웅성 수술이 제거되고, 웅성 근친교배 모체와 함께 다양한 교대 행 패턴으로 심을 수 있다. 결과적으로, 외래의 옥수수 꽃가루 공급원으로부터 충분히 단리되어 있다면, 자성 근친교배종의 이삭은 웅성 근친교배종으로부터의 꽃가루로만 수정될 것이다. 따라서, 얻어진 종자는 잡종(F1)이고, 잡종 식물을 형성할 것이다.
식물 발달에 영향을 미치는 필드 변화는 자성 모체의 수동 제웅이 완료된 후 식물 태슬링을 초래할 수 있다. 또는, 제웅 프로세스 동안 자성 근친교배 식물 수술이 완전히 제거되지 않을 수 있다. 어느 경우든, 결과적으로 자성 식물은 성공적으로 꽃가루를 뿌릴 것이고, 일부 자성 식물은 자가 수분될 것이다. 이는 결과적으로 정상적으로 생산되는 잡종 종자와 함께 자성 근친교배종의 종자가 수확되도록 할 것이다. 자성 근친교배 종자는 잡종 강세를 나타내지 않으므로 F1 종자만큼 생산적이지 않다. 또한, 자성 근친교배 종자의 존재는 잡종을 생산하는 회사에 대한 생식질 보안 위험을 나타낼 수 있다.
대안적으로, 자성 근친교배종은 기계에 의해 기계적으로 제웅될 수 있다. 기계적 제웅은 대략 수동 제웅만큼 신뢰할 수 있지만 더 빠르고 비용이 적게 든다. 그러나, 대부분의 제웅 기계는 수동 제웅보다 식물에 더 많은 피해를 준다. 따라서, 현재 어떠한 형태의 제웅도 완전히 만족스럽지는 않고, 생산 비용을 더 낮추고 잡종 종자의 생산에서 자성 모체의 자가 수분을 제거하는 대안에 대한 필요성이 계속 존재한다.
조절되는(온도 유도성) 가이드 RNA/Cpf1 시스템 매개 유전자 표적화는 관심 유전자를 도입하기 위해 이중 가닥 절단 유도제를 사용하는 대신, 본원에 개시된 것과 같은 조절되는 가이드 RNA/Cpf1 시스템을 사용하는 WO2013/0198888(2013년 8월 1일 공개됨)에 개시된 것과 유사한 방식으로 유전자 삽입을 유도하기 위한 방법 및/또는 여러 유전자(형질)를 포함하는 복합 형질 유전자좌를 생성하기 위한 방법에서 사용될 수 있다. 일 구현예에서, 복합 유전자이식 형질 유전자좌는 유전적으로 서로 연결된 여러 관심 유전자를 갖는 게놈 유전자좌이다. 서로로부터 0.1, 0.2, 0.3, 04, 0.5, 1, 2, 또는 심지어 5센티모건(cM) 내에 독립적 유전자를 삽입함으로써, 유전자는 단일 유전자좌로서 증식될 수 있다(예를 들어, 미국 특허 출원 13/427,138 또는 PCT 출원 PCT/US2012/030061 참고). 관심 유전자, 예컨대 이식유전자를 포함하는 식물의 선택 후, (적어도) 하나의 관심 유전자를 포함하는 식물이 교배되어 두 관심 유전자를 모두 포함하는 F1을 형성할 수 있다. 이러한 F1으로부터의 자손(F2 또는 BC1)에서, 1/500의 자손이 동일한 염색체 상에 재조합된 두 개의 상이한 유전자를 가질 것이다. 이후, 복합 유전자좌는 양쪽 관심 유전자를(양쪽 형질을) 갖는 단일 유전자좌로 증식될 수 있다. 이 프로세스를 반복하여 원하는 만큼 많은 형질을 쌓을 수 있다.
식물에서 웅성 불임성을 야기하는 돌연변이는 옥수수와 같은 경작 식물에 대한 잡종 종자 생산 방법에 유용할 잠재력을 가지고 있으며, 잡종 모체로서 사용되는 모계 모체 식물로부터 많은 노동력을 요하는 수꽃 제거(제웅으로도 알려짐)의 필요성을 제거함으로써 생산 비용을 낮출 수 있다. 이러한 방식에 사용되는 유전자의 예는 웅성 가임성 유전자, 예컨대, MS26(예를 들어, 미국 특허 7,098,388호, 7,517,975호, 7,612,251호 참고), MS45(예를 들어, 미국 특허 5,478,369호, 6,265,640호 참고) 또는 MSCA1(예를 들어, 미국 특허 7,919,676호 참고)을 포함한다.
옥수수에서 웅성 불임성을 야기하는 돌연변이는 X선 또는 UV-조사, 화학 처리 또는 전치 가능한 요소 삽입(ms23, ms25, ms26, ms32)과 같은 다양한 방법에 의해 생성되었다(Chaubal et al. (2000) Am J Bot 87:1193-1201). 가임성/불임성 "분자 스위치"를 통한 가임성 유전자의 조건부 조절은 작물 개선을 위한 새로운 웅성 불임성 시스템의 설계 옵션을 향상시킬 수 있었다(Unger et al. (2002) Transgenic Res 11:455-465).
관심 표현형 또는 형질과 상관관계가 있는 염색체 간격은 동정될 수 있다. 염색체 간격을 확인하기 위해 당분야에 잘 알려진 다양한 방법을 이용할 수 있다. 이러한 염색체 간격의 경계는 관심 형질을 제어하는 유전자에 연결될 마커를 포함하도록 정해진다. 다시 말해, 염색체 간격은 그 간격 내에 있는 임의의 마커(간격의 경계를 정의하는 말단 마커를 포함)가 노던 잎마름병 저항성을 위한 마커로서 사용될 수 있도록 정해진다. 일 구현예에서, 염색체 간격은 적어도 하나의 QTL을 포함하고, 또한 실제로 하나보다 많은 QTL을 포함할 수 있다. 하나의 마커는 하나보다 많은 QTL에 대한 연관을 나타낼 수 있으므로, 동일한 간격에서 여러 QTL의 가까운 근접성은 특정 마커와 특정 QTL의 상관관계를 모호하게 할 수 있다. 반대로, 예를 들어, 근접한 두 개의 마커가 원하는 표현형 형질과 공동 분리를 보이는 경우, 이들 각각의 마커가 동일한 QTL을 동정하는지 두 개의 다른 QTL을 동정하는지 때로는 불분명하다. 용어 "정량적 형질 유전자좌" 또는 "QTL"은 적어도 하나의 유전적 배경, 예를 들어, 적어도 하나의 육종 개체군에서 정량적 표현형 형질의 차별적 발현과 관련된 DNA의 영역을 지칭한다. QTL의 영역은 문제의 형질에 영향을 미치는 유전자 또는 유전자들을 포함하거나 이들에 가까이 연관된다. "QTL의 대립유전자"는 일배체형과 같은 연속된 게놈 영역 또는 연관군 내에 여러 유전자 또는 기타 유전 인자를 포함할 수 있다. QTL의 대립유전자는 특정 윈도우 내의 일배체형을 나타낼 수 있으며, 상기 윈도우는 하나 이상의 다형성 마커의 세트로 정의되고 추적될 수 있는 연속된 게놈 영역이다. 일배체형은 특정 윈도우 내 각각의 마커에서 대립유전자의 고유한 지문에 의해 정의될 수 있다.
선별 가능한 마커 표현형을 사용하지 않고 표적 부위 또는 그 근처에서 변경된 게놈을 가진 세포를 동정하기 위해 다양한 방법을 이용할 수 있다. PCR 방법, 시퀀싱 방법, 뉴클레아제 분해, 서던 블롯, 및 이의 임의의 조합을 포함하지만 이에 한정되지 않는 이러한 방법은 표적 서열을 직접 분석하여 표적 서열에서 임의의 변화를 검출하는 것으로 볼 수 있다.
표준 DNA 단리, 정제, 분자 클로닝, 벡터 제조, 및 확인/특성규명 방법, 단백질 변형/변경은 널리 확립되어 있으며, 예를 들어 문헌[Sambrook et al., (1989) Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1989]을 참고한다. 벡터 및 작제물은 관심 폴리뉴클레오티드와 선택적으로 링커, 어댑터, 조절 또는 분석을 비롯한 다른 성분을 포함하는 선형 폴리뉴클레오티드 및 원형 플라스미드를 포함한다. 일부 예에서, 인식 부위 및/또는 표적 부위는 인트론, 코딩 서열, 5' UTR, 3' UTR, 및/또는 조절 영역 내에 포함될 수 있다.
약어의 의미는 다음과 같다: "sec"는 초, "min"은 분, "h"는 시간, "d"는 일, "㎕"는 마이크로리터, "mL"은 밀리리터, "L"은 리터, "μM"은 마이크로몰 농도, "mM"은 밀리몰 농도, "M"은 몰 농도, "mmol"은 밀리몰, "μmole"은 마이크로몰, "g"는 그램, "㎍"는 마이크로그램, "ng"는 나노그램, "U"는 단위, "bp"는 염기쌍, "kb"는 킬로염기를 의미한다.
본원에 개시된 조성물 및 방법의 비제한적인 예는 다음과 같다:
1. 식물 세포의 게놈 내 표적 부위를 변형하기 위한 방법으로서,
a) 식물 세포 내로 Cpf1 엔도뉴클레아제 또는 상기 Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드, 및 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적화 도메인을 포함하는 가이드 폴리뉴클레오티드 또는 상기 가이드 폴리뉴클레오티드를 발현하는 재조합 DNA를 도입하는 단계; 및,
b) 상기 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하며,
상기 가이드 폴리뉴클레오티드 및 Cpf1 엔도뉴클레아제는 상기 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있는 방법.
2. 식물 세포의 게놈 내 표적 부위를 변형하기 위한 방법으로서,
a) Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터를 포함하는 재조합 DNA 작제물을 그 게놈에 포함하는 식물 세포 내로 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적화 도메인을 포함하는 가이드 폴리뉴클레오티드, 또는 상기 가이드 폴리뉴클레오티드를 발현하는 재조합 DNA를 도입하는 단계; 및,
b) 상기 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하며,
상기 가이드 폴리뉴클레오티드 및 Cpf1 엔도뉴클레아제는 상기 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있는 방법.
3. 식물 또는 식물 세포의 게놈 내 표적 서열을 변형하기 위한 방법으로서,
a) 그 게놈에 제1 재조합 DNA 작제물로서, Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드에 작동 가능하게 연결된 제1 프로모터를 포함하는 제1 재조합 DNA 작제물 및 제2 재조합 DNA 작제물로서, 가이드 RNA 또는 여러 가이드 RNA를 발현할 수 있는 전구체 가이드 RNA를 암호화하는 뉴클레오티드 서열에 작동 가능하게 연결된 제2 프로모터를 포함하는 제2 재조합 DNA 작제물을 포함하는 식물 또는 식물 세포를 수득하는 단계로서, 상기 가이드 RNA 및 Cpf1 엔도뉴클레아제는 상기 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있는 단계; 및,
b) 상기 식물 또는 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하며,
상기 가이드 RNA 또는 각각의 상기 여러 가이드 RNA 및 Cpf1 엔도뉴클레아제는 상기 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있는 방법.
4. 구현예 1에 있어서, 식물-최적화된 폴리뉴클레오티드가 상기 Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 mRNA 또는 상기 Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터를 포함하는 재조합 DNA 작제물인 방법.
5. 구현예 1 내지 4에 있어서, 상기 표적 서열에서 변형을 갖는 적어도 하나의 식물 세포를 동정하는 단계를 더 포함하며, 상기 표적 서열에서의 변형은 (i) 적어도 하나의 뉴클레오티드의 치환, (ii) 적어도 하나의 뉴클레오티드의 결실, (iii) 적어도 하나의 뉴클레오티드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택되는 방법.
6. 구현예 1 내지 4에 있어서, 식물 세포로 공여 DNA를 도입하는 단계를 더 포함하며, 상기 공여 DNA는 관심 폴리뉴클레오티드를 포함하는 방법.
7. 구현예 6에 있어서, 상기 표적 서열 내로 또는 근처로 통합된 관심 폴리뉴클레오티드를 그 게놈에 포함하는 적어도 하나의 식물 세포를 동정하는 단계를 더 포함하는 방법.
8. 식물 세포의 게놈 내 뉴클레오티드 서열을 편집하기 위한 방법으로서,
a) 식물 세포 내로 Cpf1 엔도뉴클레아제 또는 상기 Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드, 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적화 도메인을 포함하는 가이드 폴리뉴클레오티드 또는 상기 가이드 폴리뉴클레오티드를 발현하는 재조합 DNA, 및 폴리뉴클레오티드 변형 주형을 도입하는 단계로서,
상기 폴리뉴클레오티드 변형 주형은 상기 뉴클레오티드 서열의 적어도 하나의 뉴클레오티드 변형을 포함하는 단계; 및,
b) 상기 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하고,
상기 가이드 폴리뉴클레오티드 및 Cpf1 엔도뉴클레아제는 상기 표적 서열의 전부 또는 일부를 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있는 방법.
9. 식물 세포의 게놈 내 뉴클레오티드 서열을 편집하기 위한 방법으로서,
a) Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터를 포함하는 재조합 DNA 작제물을 그 게놈에 포함하는 식물 세포 내로 폴리뉴클레오티드 변형 주형 및 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적화 도메인을 포함하는 가이드 폴리뉴클레오티드 또는 상기 가이드 폴리뉴클레오티드를 발현하는 재조합 DNA를 도입하는 단계로서, 상기폴리뉴클레오티드 변형 주형은 상기 뉴클레오티드 서열의 적어도 하나의 뉴클레오티드 변형을 포함하는 단계; 및, b) 상기 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하고,
상기 가이드 폴리뉴클레오티드 및 Cpf1 엔도뉴클레아제는 상기 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있는 방법.
10.식물 또는 식물 세포의 게놈 내 뉴클레오티드 서열을 편집하기 위한 방법으로서,
a) 그 게놈에 제1 재조합 DNA 작제물로서, Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드에 작동 가능하게 연결된 제1 프로모터를 포함하는 제1 재조합 DNA 작제물 및 제2 재조합 DNA 작제물로서, 가이드 RNA를 암호화하는 뉴클레오티드 서열에 작동 가능하게 연결된 제2 프로모터를 포함하는 제2 재조합 DNA 작제물을 포함하는 식물 또는 식물 세포 내로 폴리뉴클레오티드 변형 주형을 도입하는 단계로서, 상기 가이드 RNA 및 Cpf1 엔도뉴클레아제는 상기 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있는 단계; 및,
b) 상기 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하고,
상기 가이드 RNA 및 Cpf1 엔도뉴클레아제는 상기 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있는 방법.
11. 구현예 8 내지 10에 있어서, 그 게놈에 상기 뉴클레오티드 서열의 상기 적어도 하나의 뉴클레오티드 변형을 포함하는 적어도 하나의 식물 세포를 동정하는 단계를 더 포함하는 방법.
12. 구현예 1 내지 2에 있어서, 상기 가이드 폴리뉴클레오티드가 RNA 폴리뉴클레오티드, DNA 폴리뉴클레오티드, 또는 RNA-DNA 폴리뉴클레오티드로 이루어진 군으로부터 선택되는 방법.
13. 구현예 1 내지 2에 있어서, 상기 가이드 폴리뉴클레오티드가 입자 매개 전달, 위스커 매개 전달, 세포-투과성 펩티드 매개 전달, 전기천공, PEG-매개 형질감염, 바이러스 매개 전달 및 나노입자 매개 전달로 이루어진 군으로부터 선택되는 직접적 전달을 통해 식물 세포 내로 도입되는 방법.
14. 구현예 1 또는 8에 있어서, 상기 Cpf1 엔도뉴클레아제 또는 상기 Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드가 입자 매개 전달, 위스커 매개 전달, 세포-투과성 펩티드 매개 전달, 전기천공, PEG-매개 형질감염, 바이러스 매개 전달 및 나노입자 매개 전달로 이루어진 군으로부터 선택되는 직접적 전달에 의해 식물 세포 내로 도입되는 방법.
15. 구현예 1 내지 2 중 어느 하나에 있어서, 상기 가이드 폴리뉴클레오티드 및 상기 Cpf1 엔도뉴클레아제가 상기 식물 세포로 상기 복합체의 직접적 전달에 의해 식물 세포 내로 도입되기 전에 가이드 폴리뉴클레오티드-Cpf1 엔도뉴클레아제 복합체를 형성하기 적합한 조건 하에 사전 혼합되는 방법.
16. 구현예 1 내지 15 중 어느 하나에 있어서, 상기 Cpf1 엔도뉴클레아제가 SEQ ID NO: 10 또는 이의 기능적 단편을 포함하는 방법.
17. 구현예 1 내지 16 중 어느 하나에 있어서, 상기 Cpf1 엔도뉴클레아제가 엔도뉴클레아제 코돈 영역 상류의 핵 표적화 신호 및/또는 엔도뉴클레아제 코돈 영역 하류의 핵 국재화 신호에 작동 가능하게 연결되는 방법.
18. 구현예 1 내지 17 중 어느 하나에 있어서, 식물 세포가 외떡잎 식물 세포 또는 쌍떡잎 식물 세포인 방법.
19A. 구현예 18에 있어서, 식물 세포가 옥수수, 벼, 수수, 호밀, 보리, 밀, 밀렛, 귀리, 사탕 수수, 잔디, 또는 스위치그래스, 대두, 카놀라, 알팔파, 해바라기, 목화, 담배, 땅콩, 감자, 담배, 애기장대, 및 잇꽃 세포로 이루어진 군으로부터 선택되는 방법.
19B. 구현예 1 내지 18에 있어서, Cpf1 엔도뉴클레아제가 SEQ ID NO: 10, 11, 32, 33, SEQ ID NO: 10, 11, 32, 33의 기능적 단편 및 SEQ ID NO: 10, 11, 32, 33의 기능적 변이체로 이루어진 군으로부터 선택되는 방법.
20. 구현예 1 내지 17 중 어느 하나의 방법에 의해 생산되는 식물 세포.
21. 구현예 20의 식물 세포로부터 생산되는 식물.
22. 재조합 DNA 폴리뉴클레오티드를 포함하는 식물로서, 상기 재조합 DNA 폴리뉴클레오티드가 Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터를 포함하는 식물.
23. Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터를 포함하는 재조합 DNA 폴리뉴클레오티드.
24. 식물 세포 또는 식물에서 표적 서열에 결합하고, 절단 또는 닉킹하기 위한 키트로서, 상기 키트가 상기 표적 서열에 특이적인 가이드 폴리뉴클레오티드, 및 Cpf1 엔도뉴클레아제 또는 Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드를 포함하며, 상기 가이드 폴리뉴클레오티드는 가이드 폴리뉴클레오티드/Cpf1 엔도뉴클레아제 복합체를 형성할 수 있고, 상기 복합체는 상기 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 키트.
25. 구현예 1 내지 19에 있어서, 식물-최적화된 폴리뉴클레오티드가 옥수수-최적화 폴리뉴클레오티드인 방법.
26. 구현예 1 내지 19에 있어서, 식물-최적화된 폴리뉴클레오티드가 대두-최적화된 폴리뉴클레오티드인 방법.
27. 구현예 1 내지 19에 있어서, 상기 식물 세포가 약 48 hr의 기간 동안 약 37℃의 온도에서 인큐베이션되는 방법.
28. 구현예 1 내지 19에 있어서, 상기 표적 부위에서의 돌연변이 빈도를 결정하는 단계를 더 포함하며, 돌연변이 빈도는 약 28℃의 온도에서 인큐베이션된 대조군 식물 세포의 표적 서열에서의 변형 빈도와 비교되는 경우 적어도 약 2배, 3배, 4배, 5배, 6배, 7배, 8배, 9배, 10배, 11배, 12배, 13배, 14배, 15배만큼 증가되는 방법.
29. 구현예 5에 있어서, 상기 표적 서열에서의 상기 변형이 b)의 식물 세포가 약 28℃의 전형적인 식물 조직 배양 온도에서 인큐베이션되는 대조군 방법과 비교되는 경우 증가된 빈도로 발생하는 방법.
30. 구현예 29에 있어서, 상기 대조군 방법과 비교되는 경우 증가된 빈도가 적어도 2-배, 적어도 3-배, 적어도 4-배, 적어도 5-배, 적어도 6-배, 적어도 7-배, 적어도 8-배, 적어도 9-배, 적어도 10-배, 적어도 10-배, 적어도 11-배, 적어도 12-배, 적어도 13-배, 적어도 14-배, 적어도 15-배, 적어도 30-배, 적어도 40-배, 또는 적어도 50-배만큼 증가되는 방법.
31. 식물 세포의 게놈 내 여러 표적 서열을 동시에 변형하는 방법으로서,
a) 상기 식물 세포 내로 Cpf1 엔도뉴클레아제 단백질, 또는 상기 Cpf1 엔도뉴클레아제를 암호화하는 식물-최적화된 폴리뉴클레오티드, 및 여러 단일 가이드 RNA로 가공되는 단일 전구체 RNA를 발현할 수 있는 전구체 가이드 RNA 전사 개시 카세트를 도입하는 단계로서, 각각의 단일 가이드 RNA는 프로토스페이서 인접 모티프(PAM) 3'의 가변 표적화 도메인을 포함하며, 상기 가변 표적화 도메인은 식물 게놈 내 단일 표적 서열과 상보적인 단계; 및,
b) (a)의 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하고,
각각의 상기 단일 가이드 RNA 및 상기 Cpf1 엔도뉴클레아제 단백질은 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 리보뉴클레오티드 복합체를 형성할 수 있는 방법.
32. 구현예 31에 있어서, 여러 표적 서열이 적어도 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개 표적 서열로 이루어진 방법.
33. 구현예 31에 있어서, 전구체 가이드 RNA 전사 개시 카세트가 전구체 가이드 RNA에 작동 가능하게 연결된 Pol-II 프로모터를 포함하는 방법.
34. 구현예 31에 있어서, 전구체 가이드 RNA 전사 개시 카세트가 전구체 가이드 RNA에 작동 가능하게 연결된 Pol-III 프로모터를 포함하는 방법.
35. 구현예 31에 있어서, 단일 전구체 가이드 RNA가 3개의 단일 가이드 RNA로 가공되며, 각각의 상기 단일 가이드 RNA 및 상기 Cpf1 엔도뉴클레아제 단백질이 표적 서열을 절단할 수 있는 리보뉴클레오티드 복합체를 형성할 수 있고, 3개의 표적 부위가 변형되는 방법.
36. SEQ ID NO: 15, 16, 17, 또는 18로 이루어진 군으로부터 선택되는 가이드 RNA.
37. 식물세포의 게놈 내 DNA 표적 서열을 변형하기 위한 방법으로서,
a) 식물 세포 내로 Cpf1 엔도뉴클레아제, 및 Cpf1 엔도뉴클레아제와 복합체를 형성할 수 있는 가이드 폴리뉴클레오티드를 도입하는 단계로서, 상기 가이드 폴리뉴클레오티드는 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적화 도메인을 포함하는 단계; 및,
b) Cpf1 복합체에 의해 인식되는 PAM 서열에 인접한 DNA 표적 서열에 대응하는 적어도 하나의 영역을 포함하는 폴리뉴클레오티드 변형 주형을 도입하는 단계로서, 상기 DNA 표적 서열에 대응하는 적어도 하나의 영역은 PAM 서열의 3', +1 내지 +19 위치에서 DNA 표적 서열에 비해 적어도 하나의 뉴클레오티드 미스매치를 포함하는 단계를 포함하는 방법.
38. 구현예 37에 이어서, 상기 방법이 상기 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 더 포함하는 방법.
39. 구현예 37에 있어서, 상기 Cpf1 복합체가 상기 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 방법.
40. Cpf1 복합체에 의해 인식되는 PAM 서열에 인접한 DNA 표적 서열과 상보적인 적어도 하나의 영역을 포함하는 폴리뉴클레오티드 변형 주형으로서, 상기 DNA 표적 서열에 대응하는 적어도 하나의 영역이 PAM 서열의 3', +1 내지 +19 위치에서 DNA 표적 서열에 비해 적어도 하나의 뉴클레오티드 미스매치를 포함하는 폴리뉴클레오티드 변형 주형.
41 구현예 40에 있어서, 적어도 하나의 뉴클레오티드 미스매치가 PAM 서열의 3', +14 내지 +19 위치에 있는 폴리뉴클레오티드 변형 주형.
42 구현예 40에 있어서, 주형이 PAM 서열의 3', +1 내지 +19 위치에서 DNA 표적 서열에 비해 미스매치된 2개의 뉴클레오티드를 포함하는 폴리뉴클레오티드 변형 주형.
43 구현예 41에 있어서, 주형이 PAM 서열의 3', +1 내지 +19 위치에서 DNA 표적 서열에 비해 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 뉴클레오티드 미스매치를 포함하는 폴리뉴클레오티드 변형 주형.
44 구현예 40에 있어서, DNA 표적 서열에 대응하는 적어도 하나의 영역이 PAM 서열의 3', +20 내지 +24 위치에서 표적 DNA 서열에 대응하는 영역에 변형을 더 포함하는 폴리뉴클레오티드 변형 주형.
45 구현예 44에 있어서, PAM 서열의 3', +20 내지 +24 위치에서 표적 DNA 서열에 대응하는 영역 내 변형이 적어도 하나의 뉴클레오티드 삽입을 포함하는 폴리뉴클레오티드 변형 주형.
46 구현예 45에 있어서, 적어도 하나의 삽입이 PAM 서열의 3', 위치 +21 내지 +22 사이의 위치에 있는 표적 DNA 서열에 대응하는 영역 내 뉴클레오티드 삽입인 폴리뉴클레오티드 변형 주형.
47 구현예 40에 있어서, 주형이 식물의 게놈 내 뉴클레오티드 서열과 상보적인 제2 DNA 영역을 더 포함하며, 상기 폴리뉴클레오티드 변형 주형은 상기 뉴클레오티드 서열의 적어도 하나의 뉴클레오티드 변형을 포함하는 폴리뉴클레오티드 변형 주형.
48 구현예 40에 있어서, 주형이 제1 플랭킹 영역 및 제2 플랭킹 영역을 더 포함하며, 상기 제1 및 제2 플랭킹 영역은 표적 DNA 서열에 플랭킹하여 상동성 유도 복구를 유도할 수 있는 폴리뉴클레오티드 변형 주형.
49 Cpf1 복합체에 의해 인식되는 PAM 서열에 인접한 DNA 표적 서열과 상보적인 적어도 하나의 영역을 포함하는 폴리뉴클레오티드 변형 주형으로서, DNA 표적 서열에 대응하는 적어도 하나의 영역이 PAM 서열에 비해 적어도 하나의 뉴클레오티드 미스매치를 포함하는 폴리뉴클레오티드 변형 주형.
50 SEQ ID NO: 23, 24 및 25로 이루어진 군으로부터 선택되는 폴리뉴클레오티드 변형 주형.
51 구현예 37 내지 50에 있어서, DNA 표적 서열이 Cpf1 DNA 표적 부위인 폴리뉴클레오티드.
52 구현예 40에 있어서, DNA 표적 서열이 애시드아미노코커스 Cpf1 엔도뉴클레아제 DNA 표적 부위인 폴리뉴클레오티드 변형 주형
53. 구현예 37에 있어서, 식물 세포가 외떡잎 식물 세포 또는 쌍떡잎 식물 세포인 방법.
54. 구현예 53에 있어서, 식물 세포가 옥수수, 벼, 수수, 호밀, 보리, 밀, 밀렛, 귀리, 사탕 수수, 잔디, 또는 스위치그래스, 대두, 카놀라, 알팔파, 해바라기, 목화, 담배, 땅콩, 감자, 담배, 애기장대, 및 잇꽃 세포로 이루어진 군으로부터 선택되는 방법.
실시예
다음 실시예들에서, 달리 언급되지 않는 한, 부(parts) 및 백분율은 중량 기준이고 도(degree)는 섭씨이다. 이 실시예들은 본 발명의 구현예들을 나타내지만, 예시로서만 제공되는 것임을 이해해야 한다. 상기 논의 및 이들 실시예로부터, 당업자는 다양한 용도 및 조건에 맞도록 본 발명을 다양하게 변화 및 변형시킬 수 있다. 이러한 변형도 첨부된 청구범위의 범위 내에 속하는 것으로 의도된다.
실시예 1
옥수수 식물에서 게놈 변형을 위한 옥수수 최적화된 Cpf1 엔도뉴클레아제 및 가이드 폴리뉴클레오티드 발현 카세트
옥수수 세포에서 효율적 발현을 부여하기 위해, 애시도아미노코커스로부터의 Cpf1 엔도뉴클레아제 유전자(SEQ ID NO: 1)를 당분야에 공지된 표준 기술에 따라 옥수수 코돈 최적화하고 대장균 및 아그로박테리움에서의 그 발현을 제거하기 위해 감자 ST-LS1 인트론 2(SEQ ID NO: 2)를 도입하였다. 옥수수 세포에서 옥수수 최적화된 Cpf1 엔도뉴클레아제 단백질의 핵 국재화를 촉진하기 위해, 시미안 바이러스 40(SV40) 1부분 핵 국재화 신호(SRADPKKKRKV, SEQ ID NO: 3)를 암호화하는 뉴클레오티드 서열을 3' 말단에 부가하여 SEQ ID NO: 4를 생성하였다. 이어서 옥수수 최적화된 애시드아미노코커스 Cpf1 엔도뉴클레아제 유전자 및 핵 국재화 신호를 암호화하는 SEQ ID NO: 4의 뉴클레오티드 서열을 표준 분자 생물학 기술에 의해 옥수수 유비퀴틴 프로모터(SEQ ID NO: 12), 옥수수 유비퀴틴 5' 미번역 영역(UTR)(SEQ ID NO: 13), 옥수수 유비퀴틴 인트론 1(SEQ ID NO: 14) 및 적합한 종결인자에 작동 가능하게 연결하였다. 생성된 옥수수 최적화된 Cpf1 발현 카세트의 주요 성분을 도 1에 예시한다.
Cpf1 엔도뉴클레아제는 이중-가닥 DNA를 절단하기 위해 소형 RNA(본원에서 가이드 RNA로 지칭됨)에 의해 유도된다. 이들 가이드 RNA는 Cpf1에 의한 인식을 보조하는(Cpf1 인식 도메인으로 지칭됨) 약 20 nt 5' 서열(SEQ ID NO: 5)에 이어 DNA 표적 부위의 한 가닥과 염기쌍을 형성하여 Cpf1 절단을 유도하는 작용을 하는 약 23 nt 서열(Cpf1 가변 표적화 도메인)로 구성된다. 옥수수 세포에서 Cpf1 엔도뉴클레아제 절단 활성을 유도하기 위해 필요한 소형 RNA를 전사하기 위해, U6 폴리머라아제 III 프로모터(SEQ ID NO: 6) 및 종결인자(TTTTTTTT)를 옥수수로부터 단리하고 전사 시 Cpf1에 대한 적합한 가이드 RNA를 생성할 DNA 서열의 말단에 작동 가능하게 융합하였다. 옥수수 U6 폴리머라아제 III 프로모터로부터 가이드 RNA의 최적 전사를 촉진하기 위해, G 뉴클레오티드를 전사될 서열의 5' 말단에 부가하였다. 본원에서 생성된 옥수수 최적화된 Cpf1 소형 RNA 전사 카세트의 주요 성분을 도 2에 예시한다. 상기 카세트로부터 전사된 옥수수 최적화된 Cpf1 가이드 RNA는 SEQ ID NO: 15에 기술된 바와 같다(N은 임의의 뉴클레오티드가 존재할 수 있는 가변 표적화 도메인을 나타냄).
실시예 2
애시드아미노코커스로부터의 옥수수 최적화된 Cpf1/가이드 폴리뉴클레오티드 시스템을 사용하여 옥수수 염색체 DNA의 절단을 유도할 수 있음
실시예 1에 기술된 옥수수 최적화된 애시드아미노코커스 Cpf1 엔도뉴클레아제(SEQ ID NO:11) 및 가이드 폴리뉴클레오티드 시스템이 옥수수 염색체 DNA를 인식하고, 절단하고, 돌연변이시키기 위해 사용될 수 있는지 여부를 평가하기 위해, 3개의 상이한 게놈 표적 서열(표 2)을 절단을 위해 표적화하고 절단을 시사하는 돌연변이의 존재에 대해 심층 서열분석에 의해 조사하였다.
애시드아미노코커스 Cpf1 옥수수 게놈 표적 서열.
위치 표적 부위 명칭 표적 부위 표적 부위
SEQ ID NO:
PAM PAM의 3' 23 nt
Chr1: 51.81 cM AsMS26-1 TTTC ATTCATATGGTGTCCCTGACCTA 7
Chr2: 28.45 cM AsLIGULELESS-1 TTTA CTCTTAGCTCATCACCTATGTGG 8
Chr9: 119.15cM AsMS45-1 TTTG GGAACACCAGCCCCTTGAGCACG 9
애시드아미노코커스 Cpf1을 위한 적절한 프로토스페이서 인접 모티프(PAM)를 갖는 표적 부위 및 PAM의 3'의 대략 23 nt를 선택하였다(표 2). 이어서 각각에 대해 PAM의 3' DNA 서열을 표준 분자 생물학 기술에 따라 실시예 1에 기술된 가변 표적화 도메인을 암호화하는 옥수수 최적화된 소형 RNA 전사 카세트의 영역 내로 별도 도입하여, 전사 시 각각의 카세트가 Cpf1 엔도뉴클레아제를 그 표적 부위를 유도할 수 있는 가이드 RNA/Cpf1 엔도뉴클레아제 복합체를 형성할 가이드 RNA(SEQ ID NO:16 내지 18)를 생산하였다. 그 뒤 각각의 생성된 가이드 RNA 전사 카세트를 별도로 문헌[Svitashev et al. (2015) Plant Physiology. 169:931-945]에 기술된 바와 같이 BBM 및 WUS2 유전자의 존재 하에 Hi-II형 10일령 미성숙 옥수수 배아(IME) 내로 바이올리스틱 형질전환에 의해 실시예 1에 기술된 옥수수 최적화된 Cpf1 엔도뉴클레아제 발현 카세트와 공동-전달하였다. 실시예 1에 기술된 옥수수 최적화된 Cpf1/가이드 RNA 시스템을 이전에 기술된(Svitashev et al. (2015)) 옥수수 최적화된 스트렙토코커스 피오게네스(Streptococcus pyogenes)(Spy) Cas9/가이드 RNA 시스템과 비교하기 위해, 각각의 AsMS26-1, AsLIGULELESS-1 및 AsMS45-1 표적 부위 영역 내를 절단하도록 표적 부위를 선택하였다(각각 SpyMS26-1(SEQ ID NO: 34), SpyLIGULELESS-1(SEQ ID NO: 26), SpyMS45-1(SEQ ID NO: 35)로 지칭됨). 이어서 Spy Cas9 가이드 RNA 발현 벡터를 제조하고 Cpf1에 대해 상술된 바와 같이 바이올리스틱 형질전환에 의해 Spy Cas9 엔도뉴클레아제 발현 벡터 및 BBM 및 WUS2 유전자와 공동-전달하였다. 입자 총 형질전환은 매우 가변적일 수 있으므로, 균일하게 형질전환된 IME의 선택을 보조하기 위해 황색 형광 단백질을 암호화하는 시각 마커 DNA 발현 카세트를 또한 공동 전달하였고 각각의 처리를 3개씩 수행하였다. 가이드 RNA/Cpf1 돌연변이 활성을 위해 최적인 식물 형질전환 배양 조건을 결정하기 위해, 형질전환된 IME를 입자 총 형질전환에 대한 표준인 48 hr 동안 28℃에서, 그리고 형질전환 직후 48 hr 동안 승온, 37℃에서 인큐베이션하였다. 2일 후, 20~30개의 거의 균일하게 형질전환된 IME는 이의 형광에 기반하여 수확하였다. 전체 게놈 DNA를 추출하고 의도되는 표적 부위 주변 영역을 문헌[Karvelis et al. (2015) (방법 섹션: 식물내 돌연변이 검출)]에 기술된 것과 유사한 2회 PCR 및 심층 서열분석을 통해 "테일링된" 프라이머를 사용하여 앰플리콘-특이적 바코드 및 Illumnia 서열분석을 위해 필요한 서열에 부가해서 Phusion® HighFidelity PCR 마스터 믹스(New England Biolabs, M0531L)로 PCR 증폭하였다. 이어서 24개의 가장 일반적인 돌연변이 유형을 사용하여 전체 돌연변이 빈도를 계산한 것을 제외하고, 소형 RNA 전사 카세트가 문헌[Karvelis et al. (2015)]에 기술된 바와 같이 형질전환으로부터 생략되는 대조 실험과의 비교에 의해 예상되는 절단 부위에서 돌연변이의 존재에 대해 생성 판독치를 조사하였다.
본원에 기술된 유도 폴리뉴클레오티드/Cpf1 시스템으로의 절단을 위해 표적화된 모든 3개 부위는 염색체 절단 및 복구를 시사하는 소형 삽입 또는 결실(삽입-결실) 형태로 돌연변이의 존재를 나타내었다. 예상치 못하게, 표 3에 나타낸 바와 같이, 이들 표적 부위에서의 돌연변이 빈도는 식물 세포가 37℃에서 인큐베이션되는 실험에서 가장 높았다. 이는 28℃ 및 37℃ 온도 처리 간에 염색체 DNA 표적 부위의 돌연변이 빈도 차이가 무시할 만한 S. 피오게네스 Cas9/가이드 폴리뉴클레오티드 시스템에 대해 관찰된 것과 매우 대조적이다(표 3). 28℃ 온도 처리 대비 37℃에서의 돌연변이 빈도의 배율 증가(37℃ 온도 처리에서의 돌연변이 빈도를 28℃ 온도 처리에서의 돌연변이 빈도로 나누어 계산됨)는 표적 서열 AsLIGULELESS-1에 대해 대략 2배 내지 AsMS26-1에 대해 약 15배 범위였다(표 3).
AsCpf1/가이드 폴리뉴클레오티드 시스템 및 Spy Cas9/가이드 폴리뉴클레오티드 시스템 둘 다에 대한 형질전환 후 상이한 배아 온도 인큐베이션 하에 3개 옥수수 부위에서의 삽입-결실 빈도.
입자 총 형질전환 실험 돌연변이에 대해 검정된 옥수수 표적 28℃에서의 평균 돌연변이 빈도 37℃에서의 평균 돌연변이 빈도 37℃에서 돌연변이 빈도의 증가 배율
애시드아미노코커스 Cpf1 단독(음성 대조군) AsMS26-1(SEQ ID NO: 7), AsLIGULELESS-1(SEQ ID NO: 8), AsMS45-1(SEQ ID NO: 9) 0.00% 0.00% 0.0
애시드아미노코커스 Cpf1 및 가이드 RNA AsMS26-1(SEQ ID NO: 7) 0.03% 0.44% 14.6
애시드아미노코커스 Cpf1 및 가이드 RNA AsLIGULELESS-1(SEQ ID NO: 8) 0.35% 0.80% 2.3
애시드아미노코커스 Cpf1 및 가이드 RNA AsMS45-1(SEQ ID NO: 9) 0.18% 0.80% 4.4
S. 피오게네스 Cas9 단독(음성 대조군) SpyMS26-1(SEQ ID NO: 34), SpyLIGULELESS-1(SEQ ID NO: 26), SpyMS45-1(SEQ ID NO: 35) 0.00% 0.00% 0.0
S. 피오게네스 Cas9 및 가이드 RNA SpyMS26-1(SEQ ID NO: 34) 0.84% 1.3% 1.5
S. 피오게네스 Cas9 및 가이드 RNA SpyLIGULELESS-1(SEQ ID NO: 26) 1.02% 1.39% 1.4
S. 피오게네스 Cas9 및 가이드 RNA SpyMS45-1(SEQ ID NO: 35) 0.8% 0.87% 1.1
본원에 기술된 AsCpf1/가이드 RNA 시스템에 대한 최적 식물 조직 배양 조건을 더 정의하기 위해, 본원에 기술된 옥수수 최적화된 AsCpf1 및 AsMS26-1 가이드 RNA 발현 카세트로 바이올리스틱 형질전환된 IME를 25℃, 28℃, 31℃, 34℃, 37℃, 40℃ 또는 43℃에서 2일 동안 인큐베이션하였다. 이어서 염색체 DNA 표적 부위 절단 및 불완전 세포 DNA 복구로 생성되는 삽입-결실 돌연변이 빈도를 상술된 바와 같이 심층 서열분석에 의해 검정하였다. 표 4에 나타낸 바와 같이, 37℃ 주위 온도(예컨대 34℃, 37℃ 및 40℃)는 최고 빈도의 DNA 표적 부위 삽입-결실을 생성한 반면, 상기 범위 밖의 온도는 상당히 더 낮은 삽입-결실 빈도를 축적하였다. 37℃ 온도 처리 대비 돌연변이 빈도의 감소 배율(37℃ 온도 처리에서의 돌연변이 빈도를 상이한 온도 처리에서의 돌연변이 빈도로 나누어 계산됨)은 40℃ 및 25℃ 온도 처리에서 각각 1.0배 내지 154.5배 범위였다(표 4).
본원에 기술된 AsCpf1/가이드 폴리뉴클레오티드 시스템의 돌연변이 활성에 대한 식물 조직 배양 온도의 효과.
입자 총 형질전환 실험 돌연변이에 대해 검정된 옥수수 표적 식물 조직 배양 온도 평균 돌연변이 빈도 37℃ 처리 대비 돌연변이 빈도의 감소 배율
애시드아미노코커스 Cpf1 및 가이드 RNA AsMS26-1(SEQ ID NO: 7) 25℃ 0.00% 153.5
애시드아미노코커스 Cpf1 및 가이드 RNA AsMS26-1(SEQ ID NO: 7) 28℃ 0.03% 10.8
애시드아미노코커스 Cpf1 및 가이드 RNA AsMS26-1(SEQ ID NO: 7) 31℃ 0.09% 3.9
애시드아미노코커스 Cpf1 및 가이드 RNA AsMS26-1(SEQ ID NO: 7) 34℃ 0.28% 1.2
애시드아미노코커스 Cpf1 및 가이드 RNA AsMS26-1(SEQ ID NO: 7) 37℃ 0.33% 1.0
애시드아미노코커스 Cpf1 및 가이드 RNA AsMS26-1(SEQ ID NO: 7) 40℃ 0.32% 1.0
애시드아미노코커스 Cpf1 및 가이드 RNA AsMS26-1(SEQ ID NO: 7) 43℃ 0.05% 6.4
다음으로, 본원에 기술된 가이드 RNA/Cpf1 복합체의 온도 민감성을 2개의 상이한 식물 프로모터인 바나나 스트리크 바이러스(BSV)(SEQ ID NO: 19) 및 인지질 전달 단백질(PLTP)(SEQ ID NO: 20) 프로모터와 페어링되었을 때 그 활성을 조사하여 더 확인하였다. 최적 발현을 위해, BSV 프로모터는 HPLV9 인트론 1(SEQ ID NO: 21)과 페어링한 반면, PLTP 프로모터는 PLTP 유전자로부터의 5' 미번역 영역(UTR)(SEQ ID NO: 22)과 조합하였다. 새로운 프로모터 및 인트론 또는 5'UTR 조합을 당분야에 공지된 방법에 의해 옥수수 코돈 최적화된 인트론 및 NLS(SEQ ID NO: 4) 포함 AsCpf1 유전자 및 적합한 종결인자에 작동 가능하게 연결하였다. 생성된 옥수수 최적화된 Cpf1 발현 카세트를 도 3 및 4에 예시한다. 다음으로, AsCpf1 및 그 인지체 가이드 RNA가 옥수수 염색체 DNA를 절단하고 표적화된 돌연변이를 유도하는 능력에 대한 온도의 효과를 AsMS26-1 표적 부위(SEQ ID NO: 7)에서 상술된 바와 같이 평가하였다. 표 5에 나타낸 바와 같이, AsCpf1 절단 활성을 시사하는 돌연변이유발 빈도는 사용된 옥수수 프로모터와 무관하게 온도 의존적이었다.
형질전환 후 상이한 배아 온도 요법 하에 BSV 및 PLTP 옥수수 프로모터로의 삽입-결실 빈도.
애시드아미노코커스 Cpf1 발현을 유도하는 프로모터 돌연변이에 대해 검정된 옥수수 표적 28℃에서의 평균 돌연변이 빈도 37℃에서의 평균 돌연변이 빈도 37℃에서 돌연변이 빈도의 증가 배율
바나나 스트리크 바이러스(BSV) AsMS26-1(SEQ ID NO: 7) 0.01% 0.37% 37
인지질 전달 단백질(PLTP) AsMS26-1(SEQ ID NO: 7) 0.02% 0.32% 16
종합하면, 이들 데이터는 애시드아미노코커스에 대해 본원에 기술된 Cpf1 엔도뉴클레아제 및 가이드 폴리뉴클레오티드 시스템이 옥수수 염색체 DNA를 절단을 위해 표적화하는 데 사용될 수 있고 식물 게놈 및 유전자 조작의 목적을 위해 식물 염색체 DNA에 결합하고, 닉킹 또는 절단하기 위한 도구로서 이용될 수 있음을 시사한다. 또한, 승온(28℃ 초과)에서의 인큐베이션을 필요로 하는 식물 형질전환 및 성장 조건이 본원에 기술된 옥수수 최적화된 애시드아미노코커스 가이드 폴리뉴클레오티드/Cpf1 시스템의 최적 활성을 위해 필요하다.
실시예 3
오르소로그 옥수수 최적화된 Cpf1/가이드 폴리뉴클레오티드 시스템이 옥수수 염색체 DNA의 절단을 유도하기 위해 사용될 수 있음
식물 세포에서 오르소로그 Cpf1/가이드 폴리뉴클레오티드 시스템의 활성을 연구하기 위해, 프란시셀라 노비시다(Fransincella novicida) U112(Fn) 및 라크노스피라세애 박테리움(Lachnospiraceae bacterium) ND2006(Lb)으로부터의 Cpf1 엔도뉴클레아제 및 소형 가이드 RNA를 실시예 1에 기술된 바와 같은 옥수수에서의 사용을 위해 최적화하였다. 간략하게, Fn 및 Lb Cpf1 엔도뉴클레아제(SEQ ID NO: 32 및 33)를 암호화하는 박테리아 서열(SEQ ID NO: 30 및 31)을 옥수수 코돈 최적화하였다. 다음으로, 감자 ST-LS1 인트론 2를 삽입하고(SEQ ID NO: 2) 시미안 바이러스 40(SV40) 핵 국재화 신호(NLS)를 암호화하는 서열(SRADPKKKRKV, SEQ ID NO: 3)을 유전자의 3' 말단에 첨부하여 SEQ ID NO: 36 및 37을 생성하였다. 다음으로, 옥수수 최적화된 유전자를 실시예 1에 기술되고 도 1에 예시된 바와 같은 표준 분자 생물학 기술에 의해 옥수수 유비퀴틴 프로모터(SEQ ID NO: 12), 옥수수 유비퀴틴 5' 미번역 영역(UTR)(SEQ ID NO: 13), 옥수수 유비퀴틴 인트론 1(SEQ ID NO: 14) 및 적합한 종결인자를 이용하여 식물 발현 카세트 내로 조립하였다. 옥수수 세포에서 Cpf1 엔도뉴클레아제 절단 활성을 유도할 수 있는 소형 RNA를 전사하기 위해, Cpf1 엔도뉴클레아제 인식 도메인을 암호화하는 영역을 Fn 및 Lb의 Cpf1/가이드 폴리뉴클레오티드 시스템에 특이적인 서열(표 6)을 포함하도록 변형한 것을 제외하고, 가이드 RNA 전사 카세트를 실시예 1에 기술되고 도 2에 예시된 바와 같이 조립하였다. 상기 카세트로부터 전사된 옥수수 최적화된 Fn 및 LbCpf1 가이드 RNA는 표 6에 기재된 바와 같다(N은 임의의 뉴클레오티드가 존재할 수 있는 가변 표적화 도메인을 나타냄).
프란시셀라 노비시다 U112 및 라크노스피라세애 박테리움 ND2006 옥수수 최적화된 Cpf1 가이드 폴리뉴클레오티드.
Cpf1 기원 옥수수 최적화된 가이드 RNA
강력한 U6 발현을 촉진하기 위한 G 뉴클레오티드 Cpf1 인식 서열 가변 표적화 도메인
(SEQ ID NO: 50)
전사된 가이드 RNA
F. 노비시디아(novicidia) G SEQ ID NO: 38 NNNNNNNNNNNNNNNNNNNNNNN SEQ ID NO: 40
L. 박테리움 G SEQ ID NO: 39 NNNNNNNNNNNNNNNNNNNNNNN SEQ ID NO: 41
FnCpf1(TTN) 및 LbCpf1(TTTN)에 대한 PAM 인식이 AsCpf1(TTTN)의 PAM 인식과 중첩되므로, AsMS26-1 표적 서열(SEQ ID NO: 7)을 FnCpf1 및 LbCpf1 가이드 폴리뉴클레오티드 시스템의 활성을 평가하기 위해 선택하였다. 다음으로, AsMS26-1에 대한 PAM의 3' DNA 서열(표 2)을 표준 분자 생물학 기술에 따라 상술된 옥수수 최적화된 소형 RNA 전사 카세트의 가변 표적화 도메인 내로 도입하여 전사 시 각각의 카세트가 옥수수 염색체 DNA 표적 부위 절단을 유도할 수 있는 가이드 RNA/Cpf1 엔도뉴클레아제 복합체를 형성할 수 있는 가이드 RNA(SEQ ID NO: 42 및 43)를 생산하였다.
다음으로, Cpf1 엔도뉴클레아제 및 가이드 RNA 발현 카세트(함께 적절히 페어링됨(예컨대, FnCpf1 엔도뉴클레아제 및 대응하는 FnCpf1 가이드 RNA 발현 카세트가 함께 사용됨))를 IME 내로 바이올리스틱 공동-형질전환하고 상술된 바와 같이 염색체 DNA 표적 부위 절단 및 불완전 세포 DNA 복구를 시사하는 삽입 또는 결실(삽입-결실) 돌연변이에 대해 검정하였다. 가이드 RNA 전사 카세트가 생략된 입자 총 형질전환이 음성 대조군으로 작용하였다. AsCpf1 엔도뉴클레아제 및 AsMS26-1 발현 카세트가 공동-전달된 형질전환이 양성 대조군으로 작용하였다.
표 7에 나타낸 바와 같이, FnCpf1 및 LbCpf1 가이드 폴리뉴클레오티드 시스템은 둘 다 DNA 표적 부위 절단 및 불완전 세포 복구를 시사하는 삽입-결실 돌연변이를 생성하였다. 추가로, 오르소로그 Cpf1 시스템은 본원에 기술된 AsCpf1/가이드 폴리뉴클레오티드에 대해 관찰된 것과 유사한 승온에 대한 반응을 나타내었다. 37℃ 온도 처리에 대해 관찰된 돌연변이 빈도의 증가 배율(37℃ 온도 처리에서의 돌연변이 빈도를 28℃ 온도 처리에서의 돌연변이 빈도로 나누어 계산됨)은 각각 LbCpf1 가이드 폴리뉴클레오티드 시스템에 대해 거의 2배 내지 FnCpf1 가이드 폴리뉴클레오티드 시스템에 대해 5배 초과의 범위였다(표 7).
플라시셀라 노비시다 U112 및 라크노스피라세애 박테리움 ND2006으로부터의 옥수수 최적화된 Cpf1 가이드 폴리뉴클레오티드 시스템의 형질전환 후 옥수수 표적 부위에서의 삽입-결실 빈도.
입자 총 형질전환 실험 돌연변이에 대해 검정된 옥수수 표적 28℃에서의 평균 돌연변이 빈도 37℃에서의 평균 돌연변이 빈도 37℃에서 돌연변이 빈도의 증가 배율
애시드아미노코커스 Cpf1 단독(음성 대조군) AsMS26-1(SEQ ID NO: 7) 0.00% 0.00% 0.0
F. 노비시디아 Cpf1 단독(음성 대조군) AsMS26-1(SEQ ID NO: 7) 0.00% 0.00% 0.0
L. 박테리움 Cpf1 단독(음성 대조군) AsMS26-1(SEQ ID NO: 7) 0.00% 0.00% 0.0
애시드아미노코커스 Cpf1 및 가이드 RNA AsMS26-1(SEQ ID NO: 7) 0.01% 0.2% 20.0
F. 노비시디아 Cpf1 및 가이드 RNA AsMS26-1(SEQ ID NO: 7) 0.05% 0.27% 5.4
L. 박테리움 Cpf1 및 가이드 RNA AsMS26-1(SEQ ID NO: 7) 0.29% 0.56% 1.9
종합하면, 이들 데이터는 본원에 기술된 오르소로그 Cpf1 엔도뉴클레아제 및 가이드 폴리뉴클레오티드 시스템이 옥수수 염색체 DNA를 절단을 위해 표적화하는 데 사용될 수 있고 식물 게놈 및 유전자 조작의 목적을 위해 식물 염색체 DNA에 결합하고, 닉킹 또는 절단하기 위한 도구로서 이용될 수 있음을 시사한다. 또한, 승온(28℃ 초과)에서의 인큐베이션을 필요로 하는 식물 형질전환 및 성장 조건이 본원에 기술된 가이드 폴리뉴클레오티드/Cpf1 시스템의 최적 활성을 위해 필요하다.
실시예 4
폴리뉴클레오티드 변형 주형이 보충된, 옥수수 최적화된 Cpf1 엔도뉴클레아제 및 가이드 폴리뉴클레오티드 시스템이 옥수수 염색체 DNA를 정확히 변형하기 위해 사용될 수 있음
Cpf1은 가이드 RNA 및 상보적 DNA 표적(PAM의 3'의 대략 위치 +20 내지 +24) 간 미스매치에 대해 높은 관용성을 갖는 영역 내 그 DNA 표적 부위를 절단한다(도 5a, Kim, D. et al. (2016) Nature Biotechnology. 34863-868; Kleinstiver, B. et al. (2016) Nature Biotechnology. 34:869-874). 이는 가이드 RNA 및 표적 DNA 미스매치에 대해 낮은 관용성을 갖는 영역(PAM의 5'의 대략 위치 +3 내지 +4)에서 이의 DNA 표적 부위를 절단하는 다른 RNA 유도 엔도뉴클레아제(예컨대, 스트렙토코커스 피오게네스 유래 Cas9)와 구별된다(도 5b, Jinek, M. et al. (2012) Science. 337:816-821). 전형적으로 절단 부위에 직접 도입된 원하는 변경이 여전히 Cpf1에 의해 절단될 수 있으므로, 이는 상동성 유도 폴리뉴클레오티드 변형 주형(DNA 복구 주형)의 사용을 어렵게 만든다. 이를 극복하기 위해, 폴리뉴클레오티드 변형 주형을 애시드아미노코커스(As) Cpf1 폴리뉴클레오티드 유도 시스템의 특이성에 대해 맞춤화하였다. 이는 가이드 RNA 및 절단 부위에 인접한 상보적 DNA 표적 가닥 간 미스매치에 대해 낮은 관용성을 갖는 AsCpf1 표적 부위의 영역(PAM으로부터 위치 +1 내지 +19) 내 폴리뉴클레오티드 변형 주형에 염기 변경을 도입하여 달성되었다(도 5a). 종합하면, 3개 유형의 폴리뉴클레오티드 변형 주형을 설계하였다. 첫 번째 주형은 AsLIGULELESS-1 표적 부위에서 절단된 5' 영역 내에 2개 염기 차이(PAM으로부터 위치 +15 및 +16)를 도입하였다(DNA 복구 주형-1, SEQ ID NO: 23). 두 번째 복구 주형 설계는 AsLIGULELESS-1 표적 부위 대비 5개 염기 차이(PAM으로부터 위치 +14 내지 +20)를 포함하였다(DNA 복구 주형-2, SEQ ID NO: 24). 그리고 세 번째 복구 주형은 첫 번째에 기반해서 구축하여 PAM으로부터 위치 +21 내지 +22 사이 9개 염기 삽입에 부가하여 2개 염기 차이(PAM으로부터 위치 +15 및 +16)를 포함하였다(DNA 복구 주형-3, SEQ ID NO: 25). 상동성 유도 복구(HDR)를 촉진하기 위해, 모든 폴리뉴클레오티드 변형 주형을 AsLIGULELESS-1 표적 부위에 플랭킹한 DNA 영역과 상동성을 갖도록 설계하였다. 이는 폴리뉴클레오티드 변형 주형 설계에 따라 약간 변하였고 5' 상동성 플랭킹 영역에 대해 65개 내지 66개 염기쌍 및 3' 상동성 플랭킹 영역에 대해 79개 내지 83개 염기쌍이었다.
설계된 DNA 주형이 AsLIGULELESS-1 Cpf1 절단 염색체 DNA 표적 부위의 복구를 유도하는 효율을 평가하기 위해, 실시예 1에 기술된 옥수수 최적화된 AsCpf1 및 가이드 폴리뉴클레오티드를 실시예 2에 기술된 바와 같은 입자 총 바이올리스틱 형질전환에 의해 미성숙 옥수수 배아 내로 20 ng의 각각의 이중 가닥 폴리뉴클레오티드 변형 주형과 공동 전달하고, HDR 빈도를 스트렙토코커스 피오게네스(Spy) Cas9로부터의 Cas9 및 가이드 폴리뉴클레오티드 시스템(문헌[Svitashev et al. (2015)]에 기술됨)과 비교하였다. 2개의 RNA 유도 엔도뉴클레아제 간 보다 정확한 비교를 가능하게 하기 위해, Spy Cas9 표적 부위(SpyLIGULELESS-1)(SEQ ID NO: 26)를 AsCpf1에 의해 절단된 AsLIGULELESS-1 표적 부위 영역 내를 절단하도록 선택하고 AsCpf1에 대해 설계된 동일한 복구 주형을 바이올리스틱 형질전환에 의해 미성숙 옥수수 배아 내로 Spy Cas9 가이드 폴리뉴클레오티드 시스템과 공동 전달하였다. 가이드 RNA 전사 카세트가 생략된 입자 총 형질전환이 음성 대조군으로 작용하였다. 실시예 2에 기술된 바와 같이, 배아를 형질전환 후 48시간 동안 37℃에서 인큐베이션하여 최적 AsCpf1 활성을 유도하였다. 온도 처리 후, 동일하게 형질전환된 배아를 공동-전달된 컬러 마커 유전자의 형광에 기반하여 수확하였다. 이어서, 게놈 DNA를 단리하고 실시예 2에 기술된 바와 같이 PCR 및 심층 서열분석을 수행하였다. 마지막으로, 폴리뉴클레오티드 변형 주형에서 특정된 변화의 도입에 대해 생성된 서열 판독을 조사하여 HDR을 검출하였다. 형질전환 효율 차이에 대해 더 정상화하기 위해, DSB의 비-상동 말단 연결(NHEJ) 복구로 생성되는 총 돌연변이 서열 판독수를 HDR 판독수로 나누어 HDR 빈도를 계산하였다. 표 8에 나타낸 바와 같이, 모든 3개 복구 주형은 Spy Cas9에 의해 생성된 것과 유사한 비의 NHEJ 대 HDR을 나타내었다.
종합하면, 이들 데이터는 본원에 상술된 바와 같은 Cpf1 맞춤화된 폴리뉴클레오티드 변형 주형이 보충된 본원에 기술된 Cpf1 엔도뉴클레아제 및 가이드 폴리뉴클레오티드 시스템을 사용하여 옥수수 염색체 DNA를 정확히 변형시킬 수 있음을 시사한다.
옥수수 염색체 AsLIGULELESS-1 표적 부위에서 NHEJ 및 HDR 결과 빈도.
입자 총 형질전환 실험 돌연변이에 대해 검정된 옥수수 표적 폴리뉴클레오티드 변형 주형 평균 돌연변이 빈도 평균 HDR 빈도 돌연변이-HDR 판독 비
애시드아미노코커스 Cpf1 단독(음성 대조군) AsLIGULELESS-1(SEQ ID NO: 8) DNA 복구 주형-1, 2 및 3 0.00% 0.00% 0.0
애시드아미노코커스 Cpf1 및 가이드 RNA AsLIGULELESS-1(SEQ ID NO: 8) DNA 복구 주형-1 0.60% 0.014% 42.86
애시드아미노코커스 Cpf1 및 가이드 RNA AsLIGULELESS-1(SEQ ID NO: 8) DNA 복구 주형-2 0.57% 0.012% 47.5
애시드아미노코커스 Cpf1 및 가이드 RNA AsLIGULELESS-1(SEQ ID NO: 8) DNA 복구 주형-3 0.66% 0.014% 47.14
S. 피오게네스 Cas9 단독(음성 대조군) AsLIGULELESS-1(SEQ ID NO: 8) DNA 복구 주형-1, 2 및 3 0.00% 0.00% 0.0
S. 피오게네스 Cas9 및 가이드 RNA SpyLIGULELESS-1(SEQ ID NO: 26) DNA 복구 주형-1 1.08% 0.031% 34.84
S. 피오게네스 Cas9 및 가이드 RNA SpyLIGULELESS-1(SEQ ID NO: 26) DNA 복구 주형-2 0.93% 0.028% 33.21
S. 피오게네스 Cas9 및 가이드 RNA SpyLIGULELESS-1(SEQ ID NO: 26) DNA 복구 주형-3 1.16% 0.029% 40
실시예 5
옥수수 최적화된 Cpf1 엔도뉴클레아제 및 가이드 폴리뉴클레오티드 시스템이 여러 옥수수 염색체 DNA 표적 부위를 동시에 변형하기 위해 사용될 수 있음
본원에 기술된 옥수수 최적화된 Cpf1 엔도뉴클레아제 및 가이드 폴리뉴클레오티드 시스템이 옥수수 염색체 DNA 내로 이중 가닥 절단(DSB)을 동시에 도입하는 능력을 조사하기 위해, AsLIGULELESS-1, AsMS45-1 및 AsMS26-1 유전자좌를 표적화하는 Cpf1 가이드 RNA를 단일 프로모터로부터 전사하고 절단을 시사하는 돌연변이의 존재에 대해 심층 서열분석에 의해 조사하였다.
Cpf1 엔도뉴클레아제 절단을 유도할 수 있는 3개의 성숙 소형 RNA를 생산하도록 Cpf1의 리보뉴클레아제 활성에 의해 이후 가공되는 단일 RNA 전사체를 생산하는 방식으로 가이드 RNA 전사 카세트를 설계하였다. RNA 전사 시 Cpf1에 의해 Cpf1 염색체 DNA 표적 부위 절단을 유도할 수 있는 가이드 RNA로 절단될 35 bp 서열(SEQ ID NO: 27)이 양측에 플랭킹되는 실시예 2에 기술된 AsLIGULELESS-1, AsMS45-1 및 AsMS26-1 옥수수 표적화 서열을 포함하는 2개의 전사 카세트를 설계하였다(도 6 및 7). 첫 번째 가이드 RNA 전사 카세트는 여러 표적화 서열 말단에 작동 가능하게 융합된 U6 폴리머라아제 III 프로모터(SEQ ID NO: 6) 및 종결인자(TTTTTTTT)를 도입하여 SEQ ID NO: 28을 생성하였다(도 6). 두 번째 가이드 RNA 전사 카세트는 여러 표적화 서열 말단에 작동 가능하게 융합된 옥수수 유비퀴틴 폴리머라아제 II 프로모터(SEQ ID NO: 12), 유비퀴틴 5' 미번역 영역(UTR)(SEQ ID NO: 13), 유비퀴틴 인트론 1(SEQ ID NO: 14) 및 적합한 종결인자를 도입하여 SEQ ID NO: 29를 생성하였다(도 7).
각각의 가이드 RNA 전사 카세트를 별도로 실시예 2에 기술된 바와 같은 바이올리스틱 형질전환에 의해 옥수수 최적화된 애시드아미노코커스(As) Cpf1 엔도뉴클레아제 발현 카세트(실시예 1에 기술됨)와 함께 옥수수 미성숙 배아(IME) 내로 공동 전달하였다. 형질전환된 IME를 실시예 2에 기술된 바와 같은 형질전환 직후 48 hr 동안 37℃에서 인큐베이션하였다. 온도 처리 후, 20~30개의 거의 균일하게 형질전환된 IME를 이의 형광에 기반하여 수확하고 전체 게놈 DNA를 추출하였다. PCR 및 심층 서열분석을 실시예 2에 기술된 바와 같이 수행하고 소형 RNA 전사 카세트가 문헌[Karvelis et al. (2015)]에 기술된 바와 같이 형질전환에서 생략된 대조 실험과의 비교에 의해 생성된 판독치를 예상되는 절단 부위에서 돌연변이의 존재에 대해 조사하였다.
놀랍게도, 본원에 기술된 AsCpf1 엔도뉴클레아제 및 멀티플렉스화 가이드 폴리뉴클레오티드 시스템으로 절단에 대해 표적화된 모든 3개 부위는 염색체 절단 및 음성 대조군 대비 부정확한 DNA 복구를 시사하는 삽입 및 결실(삽입-결실) 돌연변이를 나타내었다(표 9). 추가적으로, 폴리머라아제 II 및 III 전사 작제물은 둘 다 모든 3개 옥수수 염색체 표적 부위의 표적화를 허용하였다.
종합하면, 이들 데이터는 본원에 기술된 Cpf1 엔도뉴클레아제 및 폴리머라아제 II 및 III 멀티플렉스화 가이드 폴리뉴클레오티드 시스템이 여러 옥수수 염색체 DNA 표적 부위를 동시에 표적화하기 위해 사용될 수 있음을 시사한다.
가이드 RNA가 단일 폴리머라아제 II 또는 III 프로모터로부터 일렬로 전사되는 경우 AsMS26-1, AsLIGULELESS-1 및 AsMS45-1 옥수수 부위에서의 돌연변이 빈도.
입자 총 형질전환 실험 돌연변이에 대해 검정된 옥수수 표적 가이드 RNA 전사 카세트 평균 돌연변이 빈도
애시드아미노코커스 Cpf1 단독(음성 대조군) AsMS26-1(SEQ ID NO: 7), AsLIGULELESS-1(SEQ ID NO: 8), AsMS45-1(SEQ ID NO: 9) 없음 0.00%
애시드아미노코커스 Cpf1 및 멀티플렉스 가이드 RNA AsMS26-1(SEQ ID NO: 7) U6(pol III) 멀티플렉스 0.11%
애시드아미노코커스 Cpf1 및 멀티플렉스 가이드 RNA AsLIGULELESS-1(SEQ ID NO: 8) U6(pol III) 멀티플렉스 0.29%
애시드아미노코커스 Cpf1 및 멀티플렉스 가이드 RNA AsMS45-1(SEQ ID NO: 9) U6(pol III) 멀티플렉스 0.23%
애시드아미노코커스 Cpf1 및 멀티플렉스 가이드 RNA AsMS26-1(SEQ ID NO: 7) 유비퀴틴(pol II) 멀티플렉스 0.09%
애시드아미노코커스 Cpf1 및 멀티플렉스 가이드 RNA AsLIGULELESS-1(SEQ ID NO: 8) 유비퀴틴(pol II) 멀티플렉스 0.35%
애시드아미노코커스 Cpf1 및 멀티플렉스 가이드 RNA AsMS45-1
(SEQ ID NO: 9)
유비퀴틴(pol II) 멀티플렉스 0.59%
실시예 6
온도 조절 가능한 가이드 폴리뉴클레오티드 Cpf1 시스템
본원에 기술된 가이드 폴리뉴클레오티드 Cpf1 시스템의 관찰된 온도 유도를 Cpf1 엔도뉴클레아제의 절단 활성을 조절하기 위해 이용할 수 있다. 일 양태에서, 이는 표적을 벗어난 절단 활성 가능성을 감소시킬 플라스미드 DNA 발현 카세트로부터의 Cpf1 엔도뉴클레아제의 일시적 펄스를 제공할 수 있다. 이는 표적을 벗어난 절단 활성을 감소시키기 위해 리보뉴클레오단백질(RNP) 복합체로서 세포 내로 일시적으로 게놈-편집 시약을 전달하는 다른 방법과 대비된다(Svitashev, S. et al. (2016) Nature Communications. 7: 13274). 추가로, 플라스미드 DNA 발현 카세트로부터의 가이드 RNA/Cpf1 활성의 온도 유도를 이용하여 RNP 전달에 의해 불가능한 세포 내로 도입된 지 오랜 시간이 지난 후 원하는 세포, 조직 배양 또는 식물 발달 단계로 절단 활성의 시간을 조절할 수 있다. 본원에 기술된 가이드 폴리뉴클레오티드 Cpf1 시스템은 또한 Cpf1 엔도뉴클레아제 활성에 대한 추가 제어를 제공하기 위해 유도성(예컨대 열 충격, 화학물질 또는 세포 주기) 또는 조직 특이적 프로모터와 조합할 수 있다.
실시예 7
DNA RNA 하이브리드 가이드 폴리뉴클레오티드가 옥수수 염색체 DNA 표적 부위에서 Cpf1 엔도뉴클레아제 절단을 유도함
본 실시예는 하이브리드(hybrid) DNA RNA(hDRNA) 가이드 폴리뉴클레오티드(RNA-DNA 가이드 폴리뉴클레오티드로도 지칭됨)가 옥수수 염색체 DNA 표적 부위에서 Cpf1과 복합체화하고 엔도뉴클레아제 절단을 유도할 수 있는 방법을 예시한다.
첫 번째로, hDRNA 설계를 고안하였다. 도 8에 나타낸 바와 같이, DNA 뉴클레오티드를 Cpf1 인식 및 가변 표적화 도메인 둘 다에 도입하였다. Cpf1 인식 도메인에서는 DNA 뉴클레오티드를 5' 말단 또는 루프 구조 내로 도입한 반면, 가변 표적화 도메인에서는 DNA 뉴클레오티드를 3' 말단에 도입하였다(도 8). 전체적으로, AsLIGULELESS-1 표적 서열을 표적화하는 4개의 hDRNA를 설계하고 합성하였다(Integrated DNA Technologies, USA). 4개의 hDRNA는 하이브리드 DNA-RNA 가이드 폴리뉴클레오티드 1, [T]AAUUUCUACUCUUGUAGAUCUCUUAGCUCAUCACCUAUGUGG(SEQ ID NO:44), 하이브리드 DNA-RNA 가이드 폴리뉴클레오티드 2, UAAUUUCUACU[C]UUGUAGAUCUCUUAGCUCAUCACCUAUGUGG(SEQ ID NO:45), 하이브리드 DNA-RNA 가이드 폴리뉴클레오티드 3, UAAUUUCUACUC[T]UGUAGAUCUCUUAGCUCAUCACCUAUGUGG, 및 DNA-RNA 가이드 폴리뉴클레오티드 4, UAAUUUCUACUCUUGUAGAUCUCUUAGCUCAUCACCUAUGUG[G]를 포함하였다.
다음으로, 실시예 2 및 문헌[Svitashev et al. (2015)]에 기술된 바와 같이 미성숙 옥수수 배아(IME) 내로 입자 총 형질전환에 의해 35 ng의 합성된 hDRNA를 Cpf1 DNA 발현 카세트, 시각적 선택 가능 마커 및 세포 주기 자극 유전자, BBM(ZmODP2(US 공개 20050257289호)) 및 WUS2(ZmWUS2 (미국 특허 7,256,322호))와 함께 공동 전달하여 hDRNA가 Cpf1과 복합체를 형성하고 옥수수 염색체 DNA 절단을 유도하는 능력을 평가하였다. 양성 대조군으로, 옥수수 최적화된 S. 피오게네스(Spy) Cas9 DNA 발현 카세트(문헌[Svitashev et al. 2015]에 기술됨)를 IME 내로 서열 GGCCGAGGTCGACTACCGGCCGG(SpyMS45-2(SEQ ID NO: 49))를 표적화하는 75 ng의 시험관내 T7 전사(MegaScript T7 전사 키트(ThermoFisher Scientific, USA)) Spy 단일 가이드 RNA(sgRNA)(SEQ ID NO: 48)와 공동 전달하였다. 형질전환 실험을 2개씩 수행하였고, 가이드 폴리뉴클레오티드 없이 조립된 평가가 음성 대조군으로 작용하였고, IME를 형질전환 후 37℃에서 인큐베이션하였다. 형질전환 2일 후, 전체 게놈 DNA를 형질전환된 옥수수 배아로부터 추출하고 표적 부위의 PCR 증폭을 수행하였다. 이어서 생성된 앰플리콘으로 Illumina 심층 서열분석을 거쳐 실시예 2에 기술된 바와 같이 옥수수 염색체 DNA 표적 부위 절단 및 불완전 복구를 시사하는 소형 삽입 또는 결실(삽입-결실) 돌연변이의 빈도를 결정하였다.
모든 4개 hDRNA는 AsLIGULELESS-1 표적 부위에 대해 예상되는 절단 부위에서 삽입-결실 돌연변이를 생성하였다. 추가적으로, 돌연변이 빈도는 S. 피오게네스 Cas9 DNA 발현 카세트 및 T7 전사 sgRNA를 이용하는 양성 대조군의 빈도와 유사하였다(표 10). 종합하면, 이들 데이터는 본원에 기술된 Cpf1 엔도뉴클레아제 및 hDRNA 가이드 폴리뉴클레오티드 시스템이 옥수수 염색체 DNA 표적 부위를 인식하고 절단할 수 있는 기능적 복합체를 형성할 수 있고 식물 게놈 및 유전자 조작의 목적을 위해 식물 염색체 DNA에 결합하고, 닉킹 또는 절단하기 위한 도구로서 이용될 수 있음을 시사한다.
Spy Cas9 가이드 RNA 복합체 대비 옥수수 염색체 DNA 표적 부위에서 Cpf1 hDRNA 가이드 폴리뉴클레오티드 Cas9 복합체에 의해 유도된 삽입-결실 빈도.
입자 총 형질전환 실험 돌연변이에 대해 검정된 옥수수 표적 평균 돌연변이 빈도
애시드아미노코커스 Cpf1 단독(음성 대조군) AsLIGULELESS-1(SEQ ID NO: 8) 0.00%
애시드아미노코커스 Cpf1 및 hDRNA1(SEQ ID NO: 44) AsLIGULELESS-1(SEQ ID NO: 8) 0.03%
애시드아미노코커스 Cpf1 및 hDRNA2(SEQ ID NO: 45) AsLIGULELESS-1(SEQ ID NO: 8) 0.02%
애시드아미노코커스 Cpf1 및 hDRNA3(SEQ ID NO: 46) AsLIGULELESS-1(SEQ ID NO: 8) 0.01%
애시드아미노코커스 Cpf1 및 hDRNA4(SEQ ID NO: 47) AsLIGULELESS-1(SEQ ID NO: 8) 0.03%
S. 피오게네스 Cas9 단독(음성 대조군) SpyMS45-2(SEQ ID NO: 49) 0.00%
S. 피오게네스 Cas9 및 가이드 RNA(SEQ ID RNA: 48) SpyMS45-2(SEQ ID NO: 49) 0.05%
실시예 8
옥수수 미성숙 배아의 형질전환
형질전환은 입자 매개 전달, 아그로박테리움 매개 형질전환, PEG 매개 전달, 및 전기천공을 비롯하여, 식물에서 효과적이라고 알려진 다양한 방법에 의해 달성될 수 있다.
a. 입자 매개 전달
입자 전달을 사용하는 옥수수 미성숙 배아의 형질전환은 다음과 같이 수행된다. 배지 제조법은 다음과 같다.
이삭 껍질을 벗기고 30% Clorox 표백제와 0.5% Micro 세제로 20분간 표면 살균하고 멸균수로 2회 헹군다. 미성숙 배아를 단리하고, 560Y 배지에서 4시간 동안 플레이트당 25개 배아를 배아 축 측을 아래로(배반 측을 위로) 두고 나서 입자 충돌을 준비하기 위해 2.5 cm 표적 구역 내에 정렬시킨다. 대안적으로, 단리된 배아를 560L(개시 배지)에 두고, 전술된 바와 같이 입자 충돌 전 26℃에서 560Y에 4시간 동안 두기 전에 26℃ 내지 37℃ 범위의 온도에서 8 내지 24시간 동안 암실에 둔다.
이중 가닥 절단 유도제 및 공여 DNA를 포함하는 플라스미드를 표준 분자 생물학 기술을 사용하여 제조하고, 발달 유전자 ODP2(AP2 도메인 전사 인자 ODP2(밑씨 발달 단백질 2); US20090328252 A1) 및 Wushel(US2011/0167516)을 포함하는 플라스미드와 공동으로 입자 충돌시킨다.
플라스미드 및 관심 DNA를 하기와 같이 수용성 양이온성 지질 형질감염 제제를 사용하여 0.6 ㎛(평균 지름) 금 펠렛 상에 침전시킨다. 1 ㎍의 플라스미드 DNA 및 선택적으로 공동-입자 충돌을 위한 다른 작제물, 예컨대 발달 유전자 ODP2(AP2 도메인 전사 인자 ODP2(밑씨 발달 단백질 2); US20090328252 A1) 및 Wushel을 포함하는 50 ng(0.5 ㎕)의 각각의 플라스미드를 사용하여 얼음 상에서 DNA 용액을 제조한다. 사전-혼합된 DNA에, 20 ㎕의 제조된 금 입자(15 ㎎/ml) 및 5 ㎕의 수용성 양이온성 지질 형질감염 시약을 수중에 첨가하고 조심스럽게 혼합한다. 금 입자를 마이크로원심분리기에서 10,000 rpm으로 1분 동안 펠렛화하고 상청액을 제거한다. 펠렛을 재현탁하지 않고 생성된 펠렛을 100 ㎖의 100% EtOH로 조심스럽게 헹구고 EtOH 헹굼액을 조심스럽게 제거한다. 100% EtOH를 105 ㎕ 첨가하고 입자를 짧은 시간 동안 초음파로 재현탁한다. 이어서, 각각의 매크로캐리어의 중앙에 10 ㎕를 묻히고 약 2분 건조하도록 둔 후 입자 충돌시킨다.
대안적으로, 100 ㎕의 수중 제조된 텅스텐 입자, Tris EDTA 완충액 중 10 ㎕(1 ㎍) DNA(1 ㎍의 전체 DNA), 100 ㎕ 2.5 M CaC12, 및 10 ㎕ 0.1 M 스페르미딘을 혼합하여 칼슘 클로라이드(CaCl2) 침전 절차를 사용해서 1.1 ㎛(평균 지름) 텅스텐 펠렛 상에 플라스미드 및 관심 DNA를 침전시킨다. 각각의 시약을 텅스텐 입자 현탁액에 혼합하며 순차적으로 첨가한다. 최종 혼합물을 짧게 초음파 분쇄하고 10분 동안 계속 볼텍싱 하에 인큐베이션하며 둔다. 침전 기간 후, 튜브를 짧게 원심분리하고, 액체를 제거하고, 입자를 500 ㎖ 100% 에탄올로 세척한 후 30초 원심분리한다. 다시, 액체를 제거하고, 105 ㎕의 100% 에탄올을 최종 텅스텐 입자 펠렛에 첨가한다. 입자 총 충돌을 위해, 텅스텐/DNA 입자를 짧게 초음파 분쇄한다. 10 ㎕의 텅스텐/DNA 입자를 각각의 매크로캐리어의 중앙에 묻힌 후, 약 2분 동안 묻힌 입자가 건조하게 둔 뒤 입자 충돌시킨다.
샘플 플레이트를 Biorad 헬륨 총으로 레벨 #4에서 입자 충돌시킨다. 모든 샘플은 450 PSI의 단회 샷을 수여받으며, 제조된 입자/DNA의 각각의 튜브로부터 총 10개 분취물을 취한다.
입자 충돌 후, 배아를 26C 내지 37C 범위의 온도에서 12 내지 48시간 동안 560P(유지 배지)에서 인큐베이션한 다음 26C에 둔다. 5 내지 7일 후, 배아를 3 ㎎/리터의 비알라포스(Bialaphos)를 포함하는 560R 선택 배지로 옮기고, 26C에서 2주마다 계대배양한다. 선택하고 약 10주 후, 선택 저항성 캘러스 클론을 288J 배지로 옮겨 식물 재생을 개시한다. 체세포 배아 성숙(2~4주) 후, 잘 발달된 체세포 배아를 발아용 배지로 옮기고 조명이 있는 배양실로 옮긴다. 약 7~10일 후, 발달 중인 식물체를 식물체가 잘 확립될 때까지 7~10일 동안 튜브 내 호르몬 비함유 배지 272V로 옮긴다. 이어서, 식물을 화분용 영양토를 함유한 (2.5" 화분에 해당하는) 플랫의 인서트로 옮기고, 성장 챔버에서 1주일 동안 성장시킨 후 온실에서 추가로 1~2주 더 성장시킨 다음, 클래식 600 화분(1.6 갤런)으로 옮기고 성장 성숙시킨다. 식물을 모니터링하고 형질전환 효율, 및/또는 재생 능력의 변형에 대해 점수를 매긴다.
개시 배지(560 L)는 4.0 g/ℓ의 N6 기저염(SIGMA C-1416), 1.0 ㎖/ℓ의 Eriksson의 Vitamin Mix(1000X SIGMA-1511), 0.5 ㎎/ℓ의 티아민 HCl, 20.0 g/ℓ의 수크로오스, 1.0 ㎎/ℓ의 2,4-D, 및 2.88 g/ℓ의 L-프롤린(KOH로 pH 5.8로 조절 후 D-I H2O로 부피를 맞춤); 2.0 g/ℓ의 겔라이트(Gelrite)(D-I H2O로 부피를 맞춘 후 첨가); 및 8.5 ㎎/ℓ의 질산은(배지를 멸균하고 실온까지 냉각한 후 첨가)을 포함한다.
유지 배지(560P)는 4.0 g/ℓ의 N6 기저염(SIGMA C-1416), 1.0 ㎖/ℓ의 Eriksson의 Vitamin Mix(1000X SIGMA-1511), 0.5 ㎎/ℓ의 티아민 HCl, 30.0 g/ℓ의 수크로오스, 2.0 ㎎/ℓ의 2,4-D, 및 0.69 g/ℓ의 L-프롤린(KOH로 pH 5.8로 조절 후 D-I H2O로 부피를 맞춤); 3.0 g/ℓ의 겔라이트(D-I H2O로 부피를 맞춘 후 첨가); 및 0.85 ㎎/ℓ의 질산은(배지를 멸균하고 실온까지 냉각한 후 첨가)을 포함한다.
입자 충돌 배지(560Y)는 4.0 g/ℓ의 N6 기저염(SIGMA C-1416), 1.0 ㎖/ℓ의 Eriksson의 Vitamin Mix(1000X SIGMA-1511), 0.5 ㎎/ℓ의 티아민 HCl, 120.0 g/ℓ의 수크로오스, 1.0 ㎎/ℓ의 2,4-D, 및 2.88 g/ℓ의 L-프롤린(KOH로 pH 5.8로 조절 후 D-I H2O로 부피를 맞춤); 2.0 g/ℓ의 겔라이트(D-I H2O로 부피를 맞춘 후 첨가); 및 8.5 ㎎/ℓ의 질산은(배지를 멸균하고 실온까지 냉각한 후 첨가)을 포함한다.
선택 배지(560R)는 4.0 g/ℓ의 N6 기저염(SIGMA C-1416), 1.0 ㎖/ℓ의 Eriksson의 Vitamin Mix(1000X SIGMA-1511), 0.5 ㎎/ℓ의 티아민 HCl, 30.0 g/ℓ의 수크로오스, 및 2.0 ㎎/ℓ의 2,4-D(KOH로 pH 5.8로 조절 후 D-I H2O로 부피를 맞춤); 3.0 g/ℓ의 겔라이트(D-I H2O로 부피를 맞춘 후 첨가); 및 0.85 ㎎/ℓ의 질산은 및 3.0 ㎎/ℓ의 비알라포스(둘 다 배지를 멸균하고 실온까지 냉각한 후 첨가)를 포함한다.
식물 재생 배지(288J)는 4.3 g/ℓ MS 염(GIBCO 11117-074), 5.0 ㎖/ℓ MS 비타민 원액(0.100 g 니코틴산, 0.02 g/ℓ 티아민 HCL, 0.10 g/ℓ 피리독신 HCL, 및 0.40 g/ℓ 글리신에 정제 D-I H2O로 부피를 맞춤)(Murashige and Skoog (1962) Physiol. Plant. 15:473), 100 ㎎/ℓ 미오-이노시톨, 0.5 ㎎/ℓ 제아틴, 60 g/ℓ 수크로스, 및 1.0 ㎖/ℓ의 0.1 mM 아브시스산(pH 5.6으로 조절 후 정제 D-I H2O로 부피를 맞춤); 3.0 g/ℓ 젤라이트(D-I H2O로 부피를 맞춘 후 첨가); 및 1.0 ㎎/ℓ 인돌아세트산 및 3.0 ㎎/ℓ 바이알라포스(배지를 멸균화하고 60℃까지 냉각한 후 첨가)를 포함한다.
호르몬 비함유 배지(272V)는 4.3 g/ℓ MS염(GIBCO 11117-074), 5.0 ㎖/ℓ MS 비타민 원액(0.100 g/ℓ 니코틴산, 0.02 g/ℓ 티아민 HCL, 0.10 g/ℓ 피리독신 HCL, 및 0.40 g/ℓ 글리신에 정제 D-I H2O로 부피를 맞춤), 0.1 g/ℓ 미오-이노시톨, 및 40.0 g/ℓ 수크로오스(pH를 5.6으로 조절한 후 정제 D-I H2O로 부피를 맞춤); 및 6 g/ℓ 박토 한천(정제 D-I H2O로 부피를 맞추고 멸균화하고 60℃까지 냉각한 후 첨가)을 포함한다.
b. 아그로박테리움 매개 형질전환
아그로박테리움 매개 형질전환은 본질적으로 문헌[Djukanovic et al. (2006) Plant Biotech J 4:345-57]에 기술된 바와 같이 수행하였다. 간략하게, 10~12일령 미성숙 배아(0.8~2.5 mm의 크기)를 멸균 속씨로부터 절개하고 액체 배지(4.0 g/ℓ N6 기저염(Sigma C-1416), 1.0 ㎖/ℓ Eriksson Vitamin Mix(Sigma E-1511), 1.0 ㎎/ℓ 티아민 HCl, 1.5 ㎎/ℓ 2,4-D, 0.690 g/ℓ L-프롤린, 68.5 g/ℓ 수크로오스, 36.0 g/ℓ 글루코오스, pH 5.2)에 넣었다. 배아를 모은 후, 배지를 0.35~0.45 OD550의 농도에서 1 ㎖ 아그로박테리움으로 대체하였다. 옥수수 배아를 아그로박테리움과 실온에서 5분 동안 인큐베이션한 다음, 혼합물을 배지 플레이트(4.0 g/ℓ N6 기저염(Sigma C-1416), 1.0 ㎖/ℓ Eriksson의 Vitamin Mix(Sigma E-1511), 1.0 ㎎/ℓ 티아민 HCl, 1.5 ㎎/ℓ 2,4-D, 0.690 g/ℓ L-프롤린, 30.0 g/ℓ 수크로오스, 0.85 ㎎/ℓ 질산은, 0.1 nM 아세토시린곤, 및 3.0 g/ℓ 겔라이트를 함유, pH 5.8) 상에 부었다. 배아를 축을 아래로 하여 20℃ 암소에서 3일 동안 인큐베이션하고 나서, 28℃ 암소에서 4일 인큐베이션한 다음, 4.0 g/ℓ N6 기저염(Sigma C-1416), 1.0 ㎖/ℓ Eriksson의 Vitamin Mix(Sigma E-1511), 1.0 ㎎/ℓ 티아민 HCl, 1.5 ㎎/ℓ 2,4-D, 0.69 g/ℓ L-프롤린, 30.0 g/ℓ 수크로오스, 0.5 g/ℓ MES 완충액, 0.85 ㎎/ℓ 질산은, 3.0 ㎎/ℓ 비알라포스, 100 ㎎/ℓ 카베니실린, 및 6.0 g/ℓ 한천을 함유하는 pH 5.8의 새로운 배지 플레이트 상에 옮겼다. 유전자이식 이벤트가 확인될 때까지 배아를 3주마다 계대배양하였다. 소량의 조직을 재생 배지(4.3 g/ℓ MS 염(Gibco 11117), 5.0 ㎖/ℓ MS 비타민 원액, 100 ㎎/ℓ 미오-이노시톨, 0.1 μM ABA, 1 ㎎/ℓ IAA, 0.5 ㎎/ℓ 제아틴, 60.0 g/ℓ 수크로스, 1.5 ㎎/ℓ 바이알라포스, 100 ㎎/ℓ 카르베니실린, 3.0 g/ℓ 겔라이트, pH 5.6) 상에 옮기고 28℃에서 2주 동안 암소에서 인큐베이션하여 체세포 배아발생을 유도하였다. 가시적인 어린 싹 및 뿌리를 갖는 모든 물질을 4.3 g/ℓ MS 염(Gibco 11117), 5.0 ㎖/ℓ MS 비타민 원액, 100 ㎎/ℓ 미오-이노시톨, 40.0 g/ℓ 수크로오스, 1.5 g/ℓ 겔라이트를 포함하는 pH 5.6의 배지 상에 옮기고, 28℃에서 인공광 하에 인큐베이션하였다. 1주 후, 작은 식물을 동일한 배지를 포함하는 유리 튜브 내로 옮기고 이들을 샘플링하고/하거나 토양 내로 이식할 때까지 키웠다.
실시예 9
BBM의 일시적 발현이 형질전환을 향상시킴
형질전환 프로토콜의 파라미터는 BBM 활성이 일시적인지 확인하기 위해 변형할 수 있다. 이러한 한 가지 방법에는, 예를 들어 화학적 PEI를 사용하여, 전사와 발현을 허용하지만 DNA의 후속적인 방출을 배제하는 방식으로 BBM 함유 플라스미드를 침전시키는 것이 관련된다. 일례로, BBM 플라스미드는 PEI가 있는 금 입자 위에 침전되는 반면, 통합될 유전자이식 발현 카세트(UBI::moPAT~GFPm::PinII; moPAT는 옥수수 최적화된 PAT 유전자임)는 표준 염화칼슘 방법을 이용하여 금 입자 위에 침전된다.
간략하게, 금 입자를 다음과 같이 PEI로 코팅하였다. 우선, 금 입자를 세척하였다. 평균 지름 1.0의 35 ㎎의 금 입자(A.S.I. #162-0010)를 마이크로원심분리 튜브에서 칭량해내고, 1.2 ㎖ 순수 EtOH을 첨가하고 1분 동안 볼텍싱하였다. 튜브를 실온에서 15분 동안 인큐베이션한 다음, 마이크로 원심분리기를 사용하여 4℃에서 15분 동안 고속으로 원심분리하였다. 상청액을 버리고, 새로운 1.2 ㎖의 에탄올(EtOH) 분액을 첨가하고, 1분 동안 볼텍싱하고, 1분 동안 원심분리하고, 상청액을 다시 버렸다(이를 2회 반복함). 새로운 1.2 ㎖의 EtOH 분액을 첨가하고, 이 현탁액(EtOH 중 금 입자)을 -20℃에서 수 주 동안 보관하였다. 입자를 폴리에틸이민(PEI; Sigma #P3143)으로 코팅하기 위해, 세척된 금 입자/EtOH 혼합물 250 ㎕를 원심분리하고 EtOH를 버렸다. 입자를 100 ㎕의 ddH2O에서 1회 세척하여 잔류 에탄올을 제거하고, 250 ㎕의 0.25 mM PEI를 첨가한 후, 펄스 초음파 분쇄하여 입자를 현탁하고 나서, 튜브를 드라이아이스/EtOH 조에 넣어 현탁액을 급속 냉각한 다음, 이를 밤새 동결 건조하였다. 이 시점에서, 건조되고 코팅된 입자는 -80℃에서 적어도 3주 동안 보관될 수 있다. 사용하기 전에, 입자를 pH 7.1의 2.5 mM HEPES 완충액의 250 ㎕ 분액으로 3회 헹구고, 1x 펄스 초음파 분쇄한 다음, 각각의 원심분리 전에 빠르게 볼텍싱하였다. 이어서, 입자를 최종 부피 250 ㎕의 HEPES 완충액에 현탁하였다. DNA를 부착하기 전에 입자의 25 ㎕ 분액을 새로운 튜브에 첨가하였다. 코팅되지 않은 DNA를 부착하기 위해, 입자를 펄스 초음파 분쇄하고 나서, (5 ㎕ 수중) 1 ㎍의 DNA를 첨가한 후 피펫맨(Pipetteman)으로 몇 차례 위아래로 피펫팅하여 혼합하고, 10분 동안 인큐베이션하였다. 입자를 잠깐(즉, 10초) 회전시키고, 상청액을 제거하고, 60 ㎕의 EtOH를 첨가하였다. PEI-침전된 DNA-1을 가진 입자를 60 ㎕의 EtOH에서 2회 세척하였다. 입자를 원심분리하고, 상청액을 버리고, 입자를 45 ㎕의 물에 재현탁하였다. 제2 DNA(DNA-2)를 부착하기 위해, 수용성 양이온성 지질 형질감염 시약을 사용하는 침전을 사용하였다. 45 ㎕의 입자/DNA-1 현탁액을 짧게 초음파 분쇄한 후, 5 ㎕의 100 ng/㎕의 DNA-2 및 2.5 ㎕의 수용성 양이온성 지질 형질감염 시약을 첨가하였다. 용액을 회전 진탕기에 10분 동안 두고, 1분 동안 10,000 g로 원심분리하였다. 상청액을 제거하고, 입자를 60 ㎕의 EtOH에 재현탁하였다. 용액을 매크로캐리어 위에 묻히고, 그 위에 DNA-1 및 DNA-2가 순차적으로 부착된 금 입자를 PDS-1000의 표준 프로토콜을 사용하여 10개 DAP Hi-II 미성숙 배아의 배반 세포 내로 전달하였다. 이 실험에 있어서, DNA-1플라스미드는 UBI::RFP::PinII 발현 카세트를 포함하였고, DNA-2는 UBI::CFP:PinII 발현 카세트를 포함하였다. 입자 충돌 2일 후, CFP 및 RFP 형광 마커 모두의 일시적 발현이 미성숙 배아 표면의 수많은 적색 및 청색 세포로서 관찰되었다. 이어서, 배아를 비선택 배양 배지에 두고, 안정된 콜로니에 대해 점수를 매기기 전에 3주 동안 성장시켰다. 이 3주의 기간 후, 단 하나의 적색 콜로니와 비교하여, 10개의 안정적으로 발현하는 다세포 청색 콜로니가 관찰되었다. 이는 PEI-침전이 PEI-도입 DNA의 통합을 현저히 감소시키고 이에 따라 RFP-발현 유전자이식 이벤트의 복원을 감소시키는 반면 일시적 발현을 위해 DNA를 효과적으로 도입하는 데 사용될 수 있음을 보여주었다. 이러한 방식으로, PEI-침전은 BBM 및/또는 WUS2의 일시적 발현을 전달하는 데 사용될 수 있다.
예를 들어, 입자를 먼저 PEI를 사용해서 UBI::BBM::pinII로 코팅한 후 수용성 양이온성 지질 형질감염 시약을 사용해서 UBI::moPAT~YFP로 코팅하고, 이어서 미성숙 배아 표면 상에서 배반 세포 내로 입자 충돌시켰다. PEI-매개 침전은 미성숙 배아 표면 상에 고빈도의 일시적 발현 세포 및 매우 낮은 빈도의 안정한 형질전환체를 복원시킨다. 이에 따라, PEI-침전된 BBM 카세트는 일시적으로 발현되며 조직의 입자 충돌된 표면(즉, 배반 표면) 상에서 배아발생 성장의 폭발을 자극하지만, 상기 플라스미드는 통합되지 않을 것으로 예상된다. Ca++/금 입자로부터 방출된 PAT~GFP 플라스미드는 유전자이식 이벤트의 복원을 실질적으로 향상시키는 빈도로 선택 가능한 마커를 통합하고 발현할 것으로 예상된다. 대조군 처리로서, (BBM 대신) UBI::GUS::PinII를 포함하는 PEI-침전 입자를 PAT~GFP/Ca++ 입자와 혼합한다. 두 처리로부터의 미성숙 배아를 3 ㎎/ℓ의 비알라포스를 포함하는 배양 배지 상으로 옮긴다. 6~8주 후, PEI/BBM 처리에서 대조군 처리(PEI/GUS)에 비해 훨씬 더 높은 빈도로 GFP+, 비알라포스-저항성 캘러스가 관찰될 것으로 예상된다.
대안적 방법으로서, BBM 플라스미드를 PEI와 함께 금 입자 상에 침전시키고 나서, 미성숙 배아 표면의 배반 세포 내로 도입하고, 이후 BBM 유전자의 일시적인 발현이 배아발생 성장의 급속한 증식을 유발한다. 이러한 유도 성장 기간 동안, 외식편을 옥수수에 대한 표준 방법을 사용하여 아그로박테리움으로 처리하고(실시예 1 참조), 세포 내로의 T-DNA 전달로 UBI::moPAT~GFPm::pinII와 같은 유전자이식 발현 카세트를 도입한다. 공동 배양 후, 외식편을 일반 배양 배지에서 복원되도록 둔, 3 ㎎/ℓ의 비알라포스를 포함하는 배양 배지 상으로 옮긴다. 6~8주 후, PEI/BBM 처리에서 대조군 처리(PEI/GUS)에 비해 훨씬 더 높은 빈도로 GFP+, 비알라포스-저항성 캘러스가 관찰될 것으로 예상된다.
BBM 및/또는 WUS2 폴리뉴클레오티드 산물을 일시적으로 발현시킴으로써 캘러스 성장을 "시작시키는" 것이 바람직할 수 있다. 이는 BBM 및 WUS2 5'-캡핑된 폴리아데닐화 RNA, BBM 및 WUS2 DNA를 포함하는 발현 카세트, 또는 BBM 및/또는 WUS2 단백질을 전달함으로써 이루어질 수 있다. 이러한 분자는 모두 바이올리스틱 입자 총을 사용하여 전달될 수 있다. 예를 들어, 5'-캡핑된 폴리아데닐화 BBM 및/또는 WUS2 RNA는 Ambion의 mMessage mMachine 키트를 사용하여 시험관 내에서 쉽게 제조될 수 있다. RNA는 Ubi::moPAT~GFPm::PinII와 같은 선택/선별에 사용되는 마커 및 관심 폴리뉴클레오티드를 포함하는 DNA와 함께 공동으로 전달된다. RNA를 수용하는 세포는 즉시 더 빠르게 분열하기 시작할 것이고 이들 중 상당부가 통합된 작물학적 유전자를 가질 것으로 예상된다. 이러한 이벤트는 이들이 PAT~GFP 융합 단백질을 또한 발현할 (이에 따라 적절한 조명 하에서 녹색 형광을 나타낼) 것이기 때문에 유전자이식 클론 콜로니인 것으로 더 검증될 수 있다. 이어서, 이러한 배아로부터 재생된 식물을 관심 폴리뉴클레오티드의 존재에 대해 선별할 수 있다.
SEQUENCE LISTING <110> Pioneer Hi-Bred International Inc. Cigan, Andrew Mark Djukanovic, Vesna Young, Joshua Keith <120> USE OF CPF1 ENDONUCLEASE FOR PLANT GENOME MODIFICATIONS <130> 7128 PCT <150> 62/349826 <151> 2016-06-14 <150> 62/468013 <151> 2017-03-07 <160> 50 <170> PatentIn version 3.5 <210> 1 <211> 3924 <212> DNA <213> Acidaminococcus <220> <221> misc_feature <222> (1)..(3924) <223> Cpf1 Gene from Acidaminococcus sp. BV3L6 <400> 1 atgacccaat ttgaaggttt taccaattta taccaagttt cgaagaccct tcgttttgaa 60 ctgattcccc aaggaaaaac actcaaacat atccaggagc aagggttcat tgaggaggat 120 aaagctcgca atgaccatta caaagagtta aaaccaatca ttgaccgcat ctataagact 180 tatgctgatc aatgtctcca actggtacag cttgactggg agaatctatc tgcagccata 240 gactcctatc gtaaggaaaa aaccgaagaa acacgaaatg cgctgattga ggagcaagca 300 acatatagaa atgcgattca tgactacttt ataggtcgga cggataatct gacagatgcc 360 ataaataagc gccatgctga aatctataaa ggacttttta aagctgaact tttcaatgga 420 aaagttttaa agcaattagg gaccgtaacc acgacagaac atgaaaatgc tctactccgt 480 tcgtttgaca aatttacgac ctatttttcc ggcttttatg aaaaccgaaa aaatgtcttt 540 agcgctgaag atatcagcac ggcaattccc catcgaatcg tccaggacaa tttccctaaa 600 tttaaggaaa actgccatat ttttacaaga ttgataaccg cagttccttc tttgcgggag 660 cattttgaaa atgtcaaaaa ggccattgga atctttgtta gtacgtctat tgaagaagtc 720 ttttcctttc ccttttataa tcaacttcta acccaaacgc aaattgatct ttataatcaa 780 cttctcggcg gcatatctag ggaagcaggc acagaaaaaa tcaagggact taatgaagtt 840 ctcaatctgg ctatccaaaa aaatgatgaa acagcccata taatcgcgtc cctgccgcat 900 cgttttattc ctctttttaa acaaattctt tccgatcgaa atacgttatc ctttattttg 960 gaagaattca aaagcgatga ggaagtcatc caatccttct gcaaatataa aaccctcttg 1020 agaaacgaaa atgtactgga gactgcagaa gcccttttca atgaattaaa ttccattgat 1080 ttgactcata tctttatttc ccataaaaag ttagaaacca tctcttcagc gctttgtgac 1140 cattgggata ccttgcgcaa tgcactttac gaaagacgga tttctgaact cactggcaaa 1200 ataacaaaaa gtgccaaaga aaaagttcaa aggtcattaa aacatgagga tataaatctc 1260 caagaaatta tttctgctgc aggaaaagaa ctatcagaag cattcaaaca aaaaacaagt 1320 gaaattcttt cccatgccca tgctgcactt gaccagcctc ttcccacaac attaaaaaaa 1380 caggaagaaa aagaaatcct caaatcacag ctcgattcgc ttttaggcct ttatcatctt 1440 cttgattggt ttgctgtcga tgaaagcaat gaagtcgacc cagaattctc agcacggctg 1500 acaggcatta aactagaaat ggaaccaagc ctttcgtttt ataataaagc aagaaattat 1560 gcgacaaaaa agccctattc ggtggaaaaa tttaaattga attttcaaat gccaaccctt 1620 gcctctggtt gggatgtcaa taaagaaaaa aataatggag ctattttatt cgtaaaaaat 1680 ggtctctatt accttggtat catgcctaaa cagaaggggc gctataaagc cctgtctttt 1740 gagccgacag aaaaaacatc agaaggattc gataagatgt actatgacta cttcccagat 1800 gccgcaaaaa tgattcctaa gtgttccact cagctaaagg ctgtaaccgc tcattttcaa 1860 actcatacca cccccattct tctctcaaat aatttcattg aacctcttga aatcacaaaa 1920 gaaatttatg acctgaacaa tcctgaaaag gagcctaaaa agtttcaaac ggcttatgca 1980 aagaagacag gcgatcaaaa aggctataga gaagcgcttt gcaaatggat tgactttacg 2040 cgggattttc tctctaaata tacgaaaaca acttcaatcg atttatcttc actccgccct 2100 tcttcgcaat ataaagattt aggggaatat tacgccgaac tgaatccgct tctctatcat 2160 atctccttcc aacgaattgc tgaaaaggaa atcatggatg ctgtagaaac gggaaaattg 2220 tatctgttcc aaatctacaa taaggatttt gcgaagggcc atcacgggaa accaaatctc 2280 cacaccctgt attggacagg tctcttcagt cctgaaaacc ttgcgaaaac cagcatcaaa 2340 cttaatggtc aagcagaatt gttctatcga cctaaaagcc gcatgaagcg gatggcccat 2400 cgtcttgggg aaaaaatgct gaacaaaaaa ctaaaggacc agaagacacc gattccagat 2460 accctctacc aagaactgta cgattatgtc aaccaccggc taagccatga tctttccgat 2520 gaagcaaggg ccctgcttcc aaatgttatc accaaagaag tctcccatga aattataaag 2580 gatcggcggt ttacttccga taaatttttc ttccatgttc ccattacact gaattatcaa 2640 gcagccaata gtcccagtaa attcaaccag cgtgtcaatg cctaccttaa ggagcatccg 2700 gaaacgccca tcattggtat cgatcgtgga gaacgcaatc taatctatat taccgtcatt 2760 gacagtactg ggaaaatttt ggagcagcgt tccctgaata ccatccagca atttgactac 2820 caaaaaaaat tggacaacag ggaaaaagag cgtgttgccg cccgtcaagc ctggtccgtc 2880 gtcggaacga tcaaagacct taaacaaggc tacttgtcac aggtcatcca tgaaattgta 2940 gacctgatga ttcattacca agctgttgtc gtccttgaaa acctcaactt cggatttaaa 3000 tcaaaacgga caggcattgc cgaaaaagca gtctaccaac aatttgaaaa gatgctaata 3060 gataaactca actgtttggt tctcaaagat tatcctgctg agaaagtggg aggcgtctta 3120 aacccgtatc aacttacaga tcagttcacg agctttgcaa aaatgggcac gcaaagcggc 3180 ttccttttct atgtaccggc cccttatacc tcaaagattg atcccctgac tggttttgtc 3240 gatccctttg tatggaagac cattaaaaat catgaaagtc ggaagcattt cctagaagga 3300 tttgatttcc tgcattatga tgtcaaaaca ggtgatttta tcctccattt taaaatgaat 3360 cggaatctct ctttccagag agggcttcct ggcttcatgc cagcttggga tattgttttc 3420 gaaaagaatg aaacccaatt tgatgcaaaa gggacgccct tcattgcagg aaaacgaatt 3480 gttcctgtaa tcgaaaatca tcgttttacg ggtcgttaca gagacctcta tcccgctaat 3540 gaactcattg cccttctgga agaaaaaggc attgtcttta gagacggaag taatatatta 3600 cccaaacttt tagaaaatga tgattctcat gcaattgata cgatggtcgc cttgattcgc 3660 agtgtactcc aaatgagaaa cagcaatgcc gcaacggggg aagactacat caactctccc 3720 gttagggatc tgaacggggt gtgtttcgac agtcgattcc aaaatccaga atggccaatg 3780 gatgcggatg ccaacggagc ttatcatatt gccttaaaag ggcagcttct tctgaaccac 3840 ctcaaagaaa gcaaagatct gaaattacaa aacggcatca gcaaccaaga ttggctggcc 3900 tacattcagg aactgagaaa ctga 3924 <210> 2 <211> 189 <212> DNA <213> Solanum tuberosum <400> 2 gtaagtttct gcttctacct ttgatatata tataataatt atcattaatt agtagtaata 60 taatatttca aatatttttt tcaaaataaa agaatgtagt atatagcaat tgcttttctg 120 tagtttataa gtgtgtatat tttaatttat aacttttcta atatatgacc aaaacatggt 180 gatgtgcag 189 <210> 3 <211> 11 <212> PRT <213> Simian virus 40 <400> 3 Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val 1 5 10 <210> 4 <211> 4146 <212> DNA <213> Artificial Sequence <220> <223> Maize Optimized Cpf1 Gene with Intron and NLS <400> 4 atgacccagt tcgagggctt caccaacctc taccaggtca gcaagaccct caggttcgag 60 ctcatccccc agggcaagac cctcaagcac atccaggagc aggtaagttt ctgcttctac 120 ctttgatata tatataataa ttatcattaa ttagtagtaa tataatattt caaatatttt 180 tttcaaaata aaagaatgta gtatatagca attgcttttc tgtagtttat aagtgtgtat 240 attttaattt ataacttttc taatatatga ccaaaacatg gtgatgtgca gggcttcatc 300 gaggaggaca aggcccgcaa cgaccactac aaggagctca aaccaatcat cgacaggatc 360 tacaagacct acgccgacca gtgcctccag ctcgtccagc tcgactggga gaacctcagc 420 gccgccatcg actcataccg caaggaaaag accgaggaga ccaggaacgc cctcatcgag 480 gagcaggcca cctacaggaa cgccatccac gactacttca tcggcaggac cgacaacctc 540 accgacgcca taaataagcg ccacgccgag atctacaagg gcctcttcaa ggccgagctc 600 ttcaacggca aggtcctcaa gcagctcggc accgtcacca ccaccgagca tgaaaatgcc 660 ctcctccgca gcttcgacaa gttcaccacc tacttcagcg gcttctatga aaaccgcaag 720 aacgtgttca gcgccgagga catcagcacc gccatccccc acaggatcgt ccaggacaac 780 ttccccaagt tcaaggagaa ctgccacatc ttcacccgcc tcatcaccgc cgtccccagc 840 ctacgcgagc acttcgagaa cgtcaagaag gccatcggca tcttcgtcag caccagcatc 900 gaggaggtgt tcagcttccc cttctacaat caactcctca cccagaccca gatcgacctc 960 tacaatcaac tcctcggcgg catcagccgc gaggccggca ccgagaaaat caagggcctc 1020 aacgaggtcc tcaacctcgc catccagaag aacgatgaaa cagcccatat aatcgccagc 1080 ctcccccaca ggttcatccc gctcttcaag cagatcctca gcgaccgcaa caccctcagc 1140 ttcatcctcg aggagttcaa gagcgacgag gaggtcatcc agagcttctg caaatataaa 1200 accctcctca ggaacgagaa cgtcctcgag accgccgagg ccctcttcaa cgaattaaat 1260 agcatcgacc tcacccatat ctttatcagc cataaaaagc tcgagactat cagcagcgcc 1320 ctctgcgacc actgggacac cctcaggaac gccctctacg agaggcgcat cagcgagctc 1380 accggcaaaa taaccaagag cgccaaggag aaggtccagc gctcattaaa acacgaggat 1440 ataaatctcc aggagatcat cagcgccgcc ggcaaggagc tcagcgaagc attcaagcaa 1500 aagaccagcg agatcctcag ccacgcccac gccgccctcg accagcccct ccccaccaca 1560 ttaaaaaagc aggaggagaa ggagatcctc aagagccagc tcgacagcct cctcggcctc 1620 taccacctgc tcgactggtt cgccgtcgat gaaagcaacg aggtcgaccc cgagttcagc 1680 gcccgcctca ccggcattaa actcgagatg gaaccaagcc tcagcttcta caataaagcc 1740 cgcaactacg ccaccaagaa gccctacagc gtcgagaagt tcaagctcaa cttccagatg 1800 cccaccctcg ccagcggctg ggacgtcaat aaagagaaaa ataatggcgc catcctcttc 1860 gtcaagaacg gcctctacta cctcggcatc atgcccaagc agaagggccg ctacaaggcc 1920 ctcagcttcg agcccaccga aaagaccagc gagggcttcg acaagatgta ctacgactac 1980 ttccccgacg ccgccaagat gatccccaag tgcagcaccc agctcaaggc cgtcaccgcc 2040 cacttccaga cccacaccac ccccatcctc ctcagcaata atttcatcga gcccctcgag 2100 atcaccaagg agatctacga cctcaacaac cccgagaagg agcccaagaa gttccagacc 2160 gcctacgcca aaaagaccgg cgaccagaag ggctacaggg aggccctctg caagtggatc 2220 gacttcaccc gcgacttcct cagcaagtac accaagacca ccagcatcga cctcagcagc 2280 ctccgcccca gctcccaata taaagacctc ggcgagtact acgccgagct caaccccctc 2340 ctctaccaca tcagcttcca gcgcatcgcc gagaaggaga tcatggacgc cgtcgagacc 2400 ggcaagctct acctcttcca gatctacaac aaggacttcg ccaagggcca ccacggcaaa 2460 ccaaatctcc acaccctcta ctggaccggc ctcttcagcc ccgagaacct cgccaagacc 2520 agcatcaagc tcaacggcca ggccgagcta ttctacaggc ccaagagcag gatgaagcgc 2580 atggcccacc gcctcggcga gaagatgctc aacaagaagc tcaaggacca aaagaccccc 2640 atccccgaca ccctctacca ggagctctac gactacgtca accacaggct cagccacgac 2700 ctcagcgacg aggccagggc cctcctcccg aacgtcatca ccaaggaggt cagccatgaa 2760 attatcaagg accgccgctt caccagcgac aagttcttct tccacgtccc catcaccctc 2820 aactaccagg ccgccaacag ccccagcaag ttcaaccagc gcgtcaacgc ctacctaaag 2880 gagcaccccg agacccccat catcggcatc gaccgcggcg agcgcaacct catctacatc 2940 accgtcatcg acagcaccgg caagatcctc gagcagcgca gcctcaacac catccagcag 3000 ttcgactacc agaagaagct cgacaacagg gagaaggagc gcgtcgccgc caggcaggcc 3060 tggagcgtcg tcggcaccat caaggacctc aagcagggct acctcagcca ggtcatccat 3120 gaaattgtcg acctcatgat ccactaccag gccgtcgtcg tcctcgagaa cctcaacttc 3180 ggcttcaaat caaaacgcac cggcatcgcc gagaaggccg tctaccagca gttcgagaag 3240 atgctcatcg acaagctcaa ctgcctcgtc ctcaaggact accccgccga gaaggtcggc 3300 ggcgtcctca acccctacca gctcaccgac cagttcacca gcttcgccaa gatgggcacc 3360 cagagcggct tcctcttcta cgtccccgcc ccctacacca gcaagatcga ccccctcacc 3420 ggcttcgtgg accccttcgt ctggaaaacc attaaaaacc atgaaagtcg caagcatttc 3480 ctcgagggct tcgacttcct ccactacgac gtcaagaccg gcgacttcat cctccacttc 3540 aagatgaaca ggaacctcag cttccagagg gggctccccg gcttcatgcc cgcctgggac 3600 atcgtgttcg agaagaatga aacccagttc gacgccaagg gcaccccctt catcgccggc 3660 aagaggatcg tccccgtcat cgagaaccac aggttcaccg gcaggtacag ggacctctac 3720 cccgccaacg agctcatcgc cctcctcgag gagaagggca tcgtgttccg cgacggcagc 3780 aacatcctcc ccaagctcct cgagaacgac gacagccacg ccatcgacac gatggtcgcc 3840 ctcatcagga gcgtcctcca gatgaggaac agcaacgccg ccaccggcga ggactacatc 3900 aacagccccg tcagggacct caacggcgtc tgcttcgaca gccgcttcca gaaccccgag 3960 tggccgatgg acgccgacgc caacggcgcc taccacatcg ccctcaaggg ccagctcctc 4020 ctcaaccacc tcaaggagag caaggacctc aagctccaga acggcatcag caaccaagac 4080 tggctcgcct acatccagga gctccgcaac agcagggccg acccgaagaa gaagcgcaag 4140 gtgtag 4146 <210> 5 <211> 20 <212> RNA <213> Acidaminococcus <400> 5 uaauuucuac ucuuguagau 20 <210> 6 <211> 1000 <212> DNA <213> Zea mays <400> 6 tgagagtaca atgatgaacc tagattaatc aatgccaaag tctgaaaaat gcaccctcag 60 tctatgatcc agaaaatcaa gattgcttga ggccctgttc ggttgttccg gattagagcc 120 ccggattaat tcctagccgg attacttctc taatttatat agattttgat gagctggaat 180 gaatcctggc ttattccggt acaaccgaac aggccctgaa ggataccagt aatcgctgag 240 ctaaattggc atgctgtcag agtgtcagta ttgcagcaag gtagtgagat aaccggcatc 300 atggtgccag tttgatggca ccattagggt tagagatggt ggccatgggc gcatgtcctg 360 gccaactttg tatgatatat ggcagggtga ataggaaagt aaaattgtat tgtaaaaagg 420 gatttcttct gtttgttagc gcatgtacaa ggaatgcaag ttttgagcga gggggcatca 480 aagatctggc tgtgtttcca gctgtttttg ttagccccat cgaatccttg acataatgat 540 cccgcttaaa taagcaacct cgcttgtata gttccttgtg ctctaacaca cgatgatgat 600 aagtcgtaaa atagtggtgt ccaaagaatt tccaggccca gttgtaaaag ctaaaatgct 660 attcgaattt ctactagcag taagtcgtgt ttagaaatta tttttttata tacctttttt 720 ccttctatgt acagtaggac acagtgtcag cgccgcgttg acggagaata tttgcaaaaa 780 agtaaaagag aaagtcatag cggcgtatgt gccaaaaact tcgtcacaga gagggccata 840 agaaacatgg cccacggccc aatacgaagc accgcgacga agcccaaaca gcagtccgta 900 ggtggagcaa agcgctgggt aatacgcaaa cgttttgtcc caccttgact aatcacaaga 960 gtggagcgta ccttataaac cgagccgcaa gcaccgaatt 1000 <210> 7 <211> 27 <212> DNA <213> Zea mays <400> 7 tttcattcat atggtgtccc tgaccta 27 <210> 8 <211> 27 <212> DNA <213> Zea mays <400> 8 tttactctta gctcatcacc tatgtgg 27 <210> 9 <211> 27 <212> DNA <213> Zea mays <400> 9 tttgggaaca ccagcccctt gagcacg 27 <210> 10 <211> 1307 <212> PRT <213> Acidaminococcus <220> <221> MISC_FEATURE <222> (1)..(1307) <223> type V CRISPR-associated protein Cpf1 [Acidaminococcus sp. BV3L6] <220> <221> MISC_FEATURE <222> (1)..(1307) <223> gi545612232, type V CRISPR-associated protein Cpf1 [Acidaminococcus sp. BV3L6] <400> 10 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp 530 535 540 Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu 1010 1015 1020 Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly 1025 1030 1035 Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala 1040 1045 1050 Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro 1055 1060 1065 Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe 1070 1075 1080 Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu 1085 1090 1095 Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe 1100 1105 1110 Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly 1115 1120 1125 Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn 1130 1135 1140 Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys 1145 1150 1155 Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr 1160 1165 1170 Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu 1175 1180 1185 Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu 1190 1195 1200 Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu 1205 1210 1215 Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly 1220 1225 1230 Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp 1250 1255 1260 Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu 1265 1270 1275 Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile 1280 1285 1290 Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn 1295 1300 1305 <210> 11 <211> 1318 <212> PRT <213> Artificial sequence <220> <223> maize optimized CPf1 with 3 prime NLS <400> 11 Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln 20 25 30 Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys 35 40 45 Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln 50 55 60 Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile 65 70 75 80 Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile 85 90 95 Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly 100 105 110 Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile 115 120 125 Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys 130 135 140 Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg 145 150 155 160 Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg 165 170 175 Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg 180 185 190 Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe 195 200 205 Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn 210 215 220 Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val 225 230 235 240 Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp 245 250 255 Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu 260 265 270 Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn 275 280 285 Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro 290 295 300 Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu 305 310 315 320 Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr 325 330 335 Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu 340 345 350 Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His 355 360 365 Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr 370 375 380 Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys 385 390 395 400 Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu 405 410 415 Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser 420 425 430 Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala 435 440 445 Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys 450 455 460 Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu 465 470 475 480 Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe 485 490 495 Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser 500 505 510 Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val 515 520 525 Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp 530 535 540 Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn 545 550 555 560 Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys 565 570 575 Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys 580 585 590 Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys 595 600 605 Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr 610 615 620 Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys 625 630 635 640 Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln 645 650 655 Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala 660 665 670 Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr 675 680 685 Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr 690 695 700 Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His 705 710 715 720 Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu 725 730 735 Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys 740 745 750 Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu 755 760 765 Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln 770 775 780 Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His 785 790 795 800 Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr 805 810 815 Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His 820 825 830 Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn 835 840 845 Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe 850 855 860 Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln 865 870 875 880 Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu 885 890 895 Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg 900 905 910 Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu 915 920 925 Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu 930 935 940 Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val 945 950 955 960 Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile 965 970 975 His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu 980 985 990 Glu Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu 995 1000 1005 Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu 1010 1015 1020 Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly 1025 1030 1035 Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala 1040 1045 1050 Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro 1055 1060 1065 Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe 1070 1075 1080 Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu 1085 1090 1095 Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe 1100 1105 1110 Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly 1115 1120 1125 Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn 1130 1135 1140 Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys 1145 1150 1155 Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr 1160 1165 1170 Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu 1175 1180 1185 Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu 1190 1195 1200 Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu 1205 1210 1215 Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly 1220 1225 1230 Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys 1235 1240 1245 Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp 1250 1255 1260 Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu 1265 1270 1275 Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile 1280 1285 1290 Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn Ser 1295 1300 1305 Arg Ala Asp Pro Lys Lys Lys Arg Lys Val 1310 1315 <210> 12 <211> 896 <212> DNA <213> Zea mays <400> 12 gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat gtctaagtta 60 taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt atctatcttt 120 atacatatat ttaaacttta ctctacgaat aatataatct atagtactac aataatatca 180 gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca attgagtatt 240 ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc tttttttttg 300 caaatagctt cacctatata atacttcatc cattttatta gtacatccat ttagggttta 360 gggttaatgg tttttataga ctaatttttt tagtacatct attttattct attttagcct 420 ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt agatataaaa 480 tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt aaaaaaacta 540 aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc gtcgacgagt 600 ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca 660 cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc gttggacttg 720 ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc ggcacggcag 780 gcggcctcct cctcctctca cggcaccggc agctacgggg gattcctttc ccaccgctcc 840 ttcgctttcc cttcctcgcc cgccgtaata aatagacacc ccctccacac cctctt 896 <210> 13 <211> 82 <212> DNA <213> Zea mays <400> 13 tccccaacct cgtgttgttc ggagcgcaca cacacacaac cagatctccc ccaaatccac 60 ccgtcggcac ctccgcttca ag 82 <210> 14 <211> 1013 <212> DNA <213> Zea mays <400> 14 gtacgccgct cgtcctcccc cccccccctc tctaccttct ctagatcggc gttccggtcc 60 atgcatggtt agggcccggt agttctactt ctgttcatgt ttgtgttaga tccgtgtttg 120 tgttagatcc gtgctgctag cgttcgtaca cggatgcgac ctgtacgtca gacacgttct 180 gattgctaac ttgccagtgt ttctctttgg ggaatcctgg gatggctcta gccgttccgc 240 agacgggatc gatttcatga ttttttttgt ttcgttgcat agggtttggt ttgccctttt 300 cctttatttc aatatatgcc gtgcacttgt ttgtcgggtc atcttttcat gctttttttt 360 gtcttggttg tgatgatgtg gtctggttgg gcggtcgttc tagatcggag tagaattctg 420 tttcaaacta cctggtggat ttattaattt tggatctgta tgtgtgtgcc atacatattc 480 atagttacga attgaagatg atggatggaa atatcgatct aggataggta tacatgttga 540 tgcgggtttt actgatgcat atacagagat gctttttgtt cgcttggttg tgatgatgtg 600 gtgtggttgg gcggtcgttc attcgttcta gatcggagta gaatactgtt tcaaactacc 660 tggtgtattt attaattttg gaactgtatg tgtgtgtcat acatcttcat agttacgagt 720 ttaagatgga tggaaatatc gatctaggat aggtatacat gttgatgtgg gttttactga 780 tgcatataca tgatggcata tgcagcatct attcatatgc tctaaccttg agtacctatc 840 tattataata aacaagtatg ttttataatt attttgatct tgatatactt ggatgatggc 900 atatgcagca gctatatgtg gattttttta gccctgcctt catacgctat ttatttgctt 960 ggtactgttt cttttgtcga tgctcaccct gttgtttggt gttacttctg cag 1013 <210> 15 <211> 44 <212> RNA <213> Artificial Sequence <220> <223> synthesized AsCpf1 Maize Optimized Guide RNA <220> <221> misc_feature <222> (22)..(44) <223> n is a, c, g, or u <400> 15 guaauuucua cucuuguaga unnnnnnnnn nnnnnnnnnn nnnn 44 <210> 16 <211> 44 <212> RNA <213> Artificial Sequence <220> <223> synthesized Guide RNA for AsMS26-1 <400> 16 guaauuucua cucuuguaga uauucauaug gugucccuga ccua 44 <210> 17 <211> 44 <212> RNA <213> Artificial Sequence <220> <223> synthesized Guide RNA for AsLIGULELESS-1 <400> 17 guaauuucua cucuuguaga ucucuuagcu caucaccuau gugg 44 <210> 18 <211> 44 <212> RNA <213> Artificial Sequence <220> <223> synthesized Guide RNA for AsMS45-1 <400> 18 guaauuucua cucuuguaga uggaacacca gccccuugag cacg 44 <210> 19 <211> 1054 <212> DNA <213> Bannana Streak Virus <400> 19 gataaaaagg agttgatcat aagaacagac agccaggcca ttgtagcctt ctacaagaag 60 caagcggatc acaagccttc aagaacgaga tggcttatgt tgattgatta cattactggg 120 ctcggaatca acgttaaatt tgagcacatt gacggaaaag aaaatgtcct agctgacact 180 ttatcaagat tggtccaagt tctaatcaca agggttcatc atccagcaga gactcagcta 240 gttgaagccg tcatggaagt cctgagcaat ccgaaaaagg aagccttgga taaggtaaat 300 cattttatct ttctaaccca acaatggatt gcagaacaaa gaaaggagca tatggtgaac 360 acactgctcc agttggaaga acctcaacta cactgcggct gcaaagatca cacaacagga 420 gaaagaagga acgccgttct tctccaaagt cacacctcag ccaacccgta tagatggttc 480 tataagtgtg cacaagacag atgtcacact tggatttgga aggacatcct ggaccagtat 540 gctgaagatt atgccgctta caccaggatt ggacttgagg cacttagcct tgaagactgg 600 ttcgaagaac cagaacccga tccacctgac ccagtggacc gccagaagat agaagatatc 660 ctggacctgc aagatgtcag caatgacgat tgaaagattc ccaggatagc cggcggacgt 720 ggtggaccca gtctaggtgc gatgcttagt cacgcacgat gactctgtcg gaaggcatct 780 ttactttcgg caaactttaa taatacttta ggaaaagtat tgtacaagtt aggtgcagaa 840 tcaataatgc acccagcttt agtcttgtct actgaattat tgtgtcggtt gcattattgg 900 atgcctgcgt gcaccctaag caatccccgg ctctcatctc tataagagga gcctttgtat 960 tcagttgcaa gcatgcaagt cacacactgc aagcttactt ctgagcaaaa agagttttga 1020 gtgaaataaa tttgaagttc ccccttacat cttg 1054 <210> 20 <211> 971 <212> DNA <213> Zea mays <400> 20 ccctagctcc ctgcggctgt tacgcggtcc cccatcaatc ttctgttctt gcggttgtag 60 cctgtgtaac agtgctagag tatgtatgat aaataggttt taagtctgct tacatgacat 120 tttttattgt ggaagagaca tataaaaatt agagagagtg gttctcatgc aacggcggac 180 ggcccggtgc taaaagagct tcaagacaaa ataatgaaac aggaagagag tagatttatc 240 taagagccaa ctttattata tgaatgtgtt tattgttggc tttagatgat atggtaagga 300 gttagagcta ataatagata ggctctatta ttattattat taattaaact cgctctaagg 360 aggaaagtgg gaggaaggga cgaggacgaa gactactgga agcatcgtgc atggatgatg 420 gatgtggtgt ctcttaatgt aggtggccgg aggatgtacg tgttaattgc gcgataagca 480 ctcagatcca accgcaaact acctccacac tgacacactg atagagagaa agagagacct 540 ccgacgactg ccgccgcaga tgagccacgt acgtatacga cgtctgccgg ccggctcagg 600 ctgccgccat caccctgctc gaaagtcgcg ttaggcggcg ccagctacat aggagtatct 660 agtctagcca gttagtatac tactactgcg ctgatgatga attaactctg catagatact 720 gtacttgcct ccctccaaca cccaaccacc tcctgctcgg ctcttaataa cttggacacg 780 gatcgatgcc atccaaggaa gaacacgacg acgacgacgg aacatccacc atgcaagctt 840 gcatccatac gccgatacgc gtgcatccat ccatccacca ttatttccat tttccaccga 900 tcacacgtac acaggcctat ttaaggagcg acatcccact gcaactctcc tcaccactca 960 tcaccagcta g 971 <210> 21 <211> 856 <212> DNA <213> Zea mays <400> 21 gtaaggttcc cttccctcct cccctcacac ccctgttcgt gttccttcgg atcggatctc 60 agtggtgatg ttagacgtcc gcggctgcct acgtagtggc attgccgccc gaaaggtttg 120 tttaggtggg gtagatccga aacaggccgg atctggacca tgtccgcggc ggggcggcgg 180 gacttgatcg cgtagctgtc gtgtgcattt ctccctacca gtggcggaat cggcgatgtg 240 gacctaaggg ctaaggctta tctgctgcct tgaccatttc gtcgctgaca aaaacaaagt 300 gacaatcatg ccgttctctg tttgtttatc tggatcgtta ttacgctgtg aatcctgcga 360 tatgtggcta agtgattttt cttctttttc tgggggcagt ttagcctttg acccagtcct 420 aggtgtggtc actaggactg tgtagcatga tgagtgaggt tgcagcaggc tgattgctag 480 tggacgtttt tttccccaat ttgttaggtt ttcacgctcc aggttgtgca agtaattttg 540 ctagtgattg tgtgatccat cttcaacgtt gaaccttgtt tttcccccta aaacccccaa 600 caggaaatct tgccccgact tctattgcaa aaattgtaac gcttagcacc ctgattgact 660 caattcctgt cactaggcat gctcggtcaa aagcagatga tttaccactt agaaactgcc 720 ctgcccctgc tttccacata gcatttcgaa ctttttgact actattgaca cccccctaac 780 ttgccgaact atttctctct tcagctacta tttacctagt tataattaca taaatgtttg 840 tgtgtatctt gtgcag 856 <210> 22 <211> 91 <212> DNA <213> Zea mays <400> 22 ctctagcaaa gcacttgcca tctaccgacc gccgcattcc aaacagcccg acgagctagc 60 agagcggcag gcacctccct cctcaaggaa c 91 <210> 23 <211> 151 <212> DNA <213> Zea mays <400> 23 ctgcaaggaa aagtgcaggc aatattcagt actcgagaga atctacattt tactcttagc 60 tcatcagtta tgtgggatag gtgaaggcgt gaagcactcc gagtcttctt ggctattcaa 120 agtttccttt tcactttgct ttccttttgg t 151 <210> 24 <211> 151 <212> DNA <213> Zea mays <400> 24 ctgcaaggaa aagtgcaggc aatattcagt actcgagaga atctacattt tactcttagc 60 tcatcgcaga catgggatag gtgaaggcgt gaagcactcc gagtcttctt ggctattcaa 120 agtttccttt tcactttgct ttccttttgg t 151 <210> 25 <211> 160 <212> DNA <213> Zea mays <400> 25 ctgcaaggaa aagtgcaggc aatattcagt actcgagaga atctacattt tactcttagc 60 tcatcagtta tgtcgcagac atgggatagg tgaaggcgtg aagcactccg agtcttcttg 120 gctattcaaa gtttcctttt cactttgctt tccttttggt 160 <210> 26 <211> 22 <212> DNA <213> Zea mays <400> 26 gccttcacct atcccacata gg 22 <210> 27 <211> 35 <212> DNA <213> unknown <220> <223> DNA from Acidominococcus species BV3L6 <400> 27 gtcaaaagac ctttttaatt tctactcttg tagat 35 <210> 28 <211> 1217 <212> DNA <213> Artificial Sequence <220> <223> Polymerase III Multiplex Transcriptional Cassette Example <400> 28 tgagagtaca atgatgaacc tagattaatc aatgccaaag tctgaaaaat gcaccctcag 60 tctatgatcc agaaaatcaa gattgcttga ggccctgttc ggttgttccg gattagagcc 120 ccggattaat tcctagccgg attacttctc taatttatat agattttgat gagctggaat 180 gaatcctggc ttattccggt acaaccgaac aggccctgaa ggataccagt aatcgctgag 240 ctaaattggc atgctgtcag agtgtcagta ttgcagcaag gtagtgagat aaccggcatc 300 atggtgccag tttgatggca ccattagggt tagagatggt ggccatgggc gcatgtcctg 360 gccaactttg tatgatatat ggcagggtga ataggaaagt aaaattgtat tgtaaaaagg 420 gatttcttct gtttgttagc gcatgtacaa ggaatgcaag ttttgagcga gggggcatca 480 aagatctggc tgtgtttcca gctgtttttg ttagccccat cgaatccttg acataatgat 540 cccgcttaaa taagcaacct cgcttgtata gttccttgtg ctctaacaca cgatgatgat 600 aagtcgtaaa atagtggtgt ccaaagaatt tccaggccca gttgtaaaag ctaaaatgct 660 attcgaattt ctactagcag taagtcgtgt ttagaaatta tttttttata tacctttttt 720 ccttctatgt acagtaggac acagtgtcag cgccgcgttg acggagaata tttgcaaaaa 780 agtaaaagag aaagtcatag cggcgtatgt gccaaaaact tcgtcacaga gagggccata 840 agaaacatgg cccacggccc aatacgaagc accgcgacga agcccaaaca gcagtccgta 900 ggtggagcaa agcgctgggt aatacgcaaa cgttttgtcc caccttgact aatcacaaga 960 gtggagcgta ccttataaac cgagccgcaa gcaccgaatt gtcaaaagac ctttttaatt 1020 tctactcttg tagatattca tatggtgtcc ctgacctagt caaaagacct ttttaatttc 1080 tactcttgta gatctcttag ctcatcacct atgtgggtca aaagaccttt ttaatttcta 1140 ctcttgtaga tggaacacca gccccttgag cacggtcaaa agaccttttt aatttctact 1200 cttgtagatt ttttttt 1217 <210> 29 <211> 2555 <212> DNA <213> Artificial Sequence <220> <223> Polymerase II Multiplex Transcriptional Cassette Example <400> 29 gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat gtctaagtta 60 taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt atctatcttt 120 atacatatat ttaaacttta ctctacgaat aatataatct atagtactac aataatatca 180 gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca attgagtatt 240 ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc tttttttttg 300 caaatagctt cacctatata atacttcatc cattttatta gtacatccat ttagggttta 360 gggttaatgg tttttataga ctaatttttt tagtacatct attttattct attttagcct 420 ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt agatataaaa 480 tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt aaaaaaacta 540 aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc gtcgacgagt 600 ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca 660 cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc gttggacttg 720 ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc ggcacggcag 780 gcggcctcct cctcctctca cggcaccggc agctacgggg gattcctttc ccaccgctcc 840 ttcgctttcc cttcctcgcc cgccgtaata aatagacacc ccctccacac cctctttccc 900 caacctcgtg ttgttcggag cgcacacaca cacaaccaga tctcccccaa atccacccgt 960 cggcacctcc gcttcaaggt acgccgctcg tcctcccccc cccccctctc taccttctct 1020 agatcggcgt tccggtccat gcatggttag ggcccggtag ttctacttct gttcatgttt 1080 gtgttagatc cgtgtttgtg ttagatccgt gctgctagcg ttcgtacacg gatgcgacct 1140 gtacgtcaga cacgttctga ttgctaactt gccagtgttt ctctttgggg aatcctggga 1200 tggctctagc cgttccgcag acgggatcga tttcatgatt ttttttgttt cgttgcatag 1260 ggtttggttt gcccttttcc tttatttcaa tatatgccgt gcacttgttt gtcgggtcat 1320 cttttcatgc ttttttttgt cttggttgtg atgatgtggt ctggttgggc ggtcgttcta 1380 gatcggagta gaattctgtt tcaaactacc tggtggattt attaattttg gatctgtatg 1440 tgtgtgccat acatattcat agttacgaat tgaagatgat ggatggaaat atcgatctag 1500 gataggtata catgttgatg cgggttttac tgatgcatat acagagatgc tttttgttcg 1560 cttggttgtg atgatgtggt gtggttgggc ggtcgttcat tcgttctaga tcggagtaga 1620 atactgtttc aaactacctg gtgtatttat taattttgga actgtatgtg tgtgtcatac 1680 atcttcatag ttacgagttt aagatggatg gaaatatcga tctaggatag gtatacatgt 1740 tgatgtgggt tttactgatg catatacatg atggcatatg cagcatctat tcatatgctc 1800 taaccttgag tacctatcta ttataataaa caagtatgtt ttataattat tttgatcttg 1860 atatacttgg atgatggcat atgcagcagc tatatgtgga tttttttagc cctgccttca 1920 tacgctattt atttgcttgg tactgtttct tttgtcgatg ctcaccctgt tgtttggtgt 1980 tacttctgca ggtcgactct agaggatcca tggtcaaaag acctttttaa tttctactct 2040 tgtagatatt catatggtgt ccctgaccta gtcaaaagac ctttttaatt tctactcttg 2100 tagatctctt agctcatcac ctatgtgggt caaaagacct ttttaatttc tactcttgta 2160 gatggaacac cagccccttg agcacggtca aaagaccttt ttaatttcta ctcttgtaga 2220 ttaggtaccg ttaacctaga cttgtccatc ttctggattg gccaacttaa ttaatgtatg 2280 aaataaaagg atgcacacat agtgacatgc taatcactat aatgtgggca tcaaagttgt 2340 gtgttatgtg taattactag ttatctgaat aaaagagaaa gagatcatcc atatttctta 2400 tcctaaatga atgtcacgtg tctttataat tctttgatga accagatgca tttcattaac 2460 caaatccata tacatataaa tattaatcat atataattaa tatcaattgg gttagcaaaa 2520 caaatctagt ctaggtgtgt tttgcgaatg cggcc 2555 <210> 30 <211> 3903 <212> DNA <213> Francisella novicida <400> 30 atgtcaattt atcaagaatt tgttaataaa tatagtttaa gtaaaactct aagatttgag 60 ttaatcccac agggtaaaac acttgaaaac ataaaagcaa gaggtttgat tttagatgat 120 gagaaaagag ctaaagacta caaaaaggct aaacaaataa ttgataaata tcatcagttt 180 tttatagagg agatattaag ttcggtttgt attagcgaag atttattaca aaactattct 240 gatgtttatt ttaaacttaa aaagagtgat gatgataatc tacaaaaaga ttttaaaagt 300 gcaaaagata cgataaagaa acaaatatct gaatatataa aggactcaga gaaatttaag 360 aatttgttta atcaaaacct tatcgatgct aaaaaagggc aagagtcaga tttaattcta 420 tggctaaagc aatctaagga taatggtata gaactattta aagccaatag tgatatcaca 480 gatatagatg aggcgttaga aataatcaaa tcttttaaag gttggacaac ttattttaag 540 ggttttcatg aaaatagaaa aaatgtttat agtagcaatg atattcctac atctattatt 600 tataggatag tagatgataa tttgcctaaa tttctagaaa ataaagctaa gtatgagagt 660 ttaaaagaca aagctccaga agctataaac tatgaacaaa ttaaaaaaga tttggcagaa 720 gagctaacct ttgatattga ctacaaaaca tctgaagtta atcaaagagt tttttcactt 780 gatgaagttt ttgagatagc aaactttaat aattatctaa atcaaagtgg tattactaaa 840 tttaatacta ttattggtgg taaatttgta aatggtgaaa atacaaagag aaaaggtata 900 aatgaatata taaatctata ctcacagcaa ataaatgata aaacactcaa aaaatataaa 960 atgagtgttt tatttaagca aattttaagt gatacagaat ctaaatcttt tgtaattgat 1020 aagttagaag atgatagtga tgtagttaca acgatgcaaa gtttttatga gcaaatagca 1080 gcttttaaaa cagtagaaga aaaatctatt aaagaaacac tatctttatt atttgatgat 1140 ttaaaagctc aaaaacttga tttgagtaaa atttatttta aaaatgataa atctcttact 1200 gatctatcac aacaagtttt tgatgattat agtgttattg gtacagcggt actagaatat 1260 ataactcaac aaatagcacc taaaaatctt gataacccta gtaagaaaga gcaagaatta 1320 atagccaaaa aaactgaaaa agcaaaatac ttatctctag aaactataaa gcttgcctta 1380 gaagaattta ataagcatag agatatagat aaacagtgta ggtttgaaga aatacttgca 1440 aactttgcgg ctattccgat gatatttgat gaaatagctc aaaacaaaga caatttggca 1500 cagatatcta tcaaatatca aaatcaaggt aaaaaagacc tacttcaagc tagtgcggaa 1560 gatgatgtta aagctatcaa ggatctttta gatcaaacta ataatctctt acataaacta 1620 aaaatatttc atattagtca gtcagaagat aaggcaaata ttttagacaa ggatgagcat 1680 ttttatctag tatttgagga gtgctacttt gagctagcga atatagtgcc tctttataac 1740 aaaattagaa actatataac tcaaaagcca tatagtgatg agaaatttaa gctcaatttt 1800 gagaactcga ctttggctaa tggttgggat aaaaataaag agcctgacaa tacggcaatt 1860 ttatttatca aagatgataa atattatctg ggtgtgatga ataagaaaaa taacaaaata 1920 tttgatgata aagctatcaa agaaaataaa ggcgagggtt ataaaaaaat tgtttataaa 1980 cttttacctg gcgcaaataa aatgttacct aaggttttct tttctgctaa atctataaaa 2040 ttttataatc ctagtgaaga tatacttaga ataagaaatc attccacaca tacaaaaaat 2100 ggtagtcctc aaaaaggata tgaaaaattt gagtttaata ttgaagattg ccgaaaattt 2160 atagattttt ataaacagtc tataagtaag catccggagt ggaaagattt tggatttaga 2220 ttttctgata ctcaaagata taattctata gatgaatttt atagagaagt tgaaaatcaa 2280 ggctacaaac taacttttga aaatatatca gagagctata ttgatagcgt agttaatcag 2340 ggtaaattgt acctattcca aatctataat aaagattttt cagcttatag caaagggcga 2400 ccaaatctac atactttata ttggaaagcg ctgtttgatg agagaaatct tcaagatgtg 2460 gtttataagc taaatggtga ggcagagctt ttttatcgta aacaatcaat acctaaaaaa 2520 atcactcacc cagctaaaga ggcaatagct aataaaaaca aagataatcc taaaaaagag 2580 agtgtttttg aatatgattt aatcaaagat aaacgcttta ctgaagataa gtttttcttt 2640 cactgtccta ttacaatcaa ttttaaatct agtggagcta ataagtttaa tgatgaaatc 2700 aatttattgc taaaagaaaa agcaaatgat gttcatatat taagtataga tagaggtgaa 2760 agacatttag cttactatac tttggtagat ggtaaaggca atatcatcaa acaagatact 2820 ttcaacatca ttggtaatga tagaatgaaa acaaactacc atgataagct tgctgcaata 2880 gagaaagata gggattcagc taggaaagac tggaaaaaga taaataacat caaagagatg 2940 aaagagggct atctatctca ggtagttcat gaaatagcta agctagttat agagtataat 3000 gctattgtgg tttttgagga tttaaatttt ggatttaaaa gagggcgttt caaggtagag 3060 aagcaggtct atcaaaagtt agaaaaaatg ctaattgaga aactaaacta tctagttttc 3120 aaagataatg agtttgataa aactggggga gtgcttagag cttatcagct aacagcacct 3180 tttgagactt ttaaaaagat gggtaaacaa acaggtatta tctactatgt accagctggt 3240 tttacttcaa aaatttgtcc tgtaactggt tttgtaaatc agttatatcc taagtatgaa 3300 agtgtcagca aatctcaaga gttctttagt aagtttgaca agatttgtta taaccttgat 3360 aagggctatt ttgagtttag ttttgattat aaaaactttg gtgacaaggc tgccaaaggc 3420 aagtggacta tagctagctt tgggagtaga ttgattaact ttagaaattc agataaaaat 3480 cataattggg atactcgaga agtttatcca actaaagagt tggagaaatt gctaaaagat 3540 tattctatcg aatatgggca tggcgaatgt atcaaagcag ctatttgcgg tgagagcgac 3600 aaaaagtttt ttgctaagct aactagtgtc ctaaatacta tcttacaaat gcgtaactca 3660 aaaacaggta ctgagttaga ttatctaatt tcaccagtag cagatgtaaa tggcaatttc 3720 tttgattcgc gacaggcgcc aaaaaatatg cctcaagatg ctgatgccaa tggtgcttat 3780 catattgggc taaaaggtct gatgctacta ggtaggatca aaaataatca agagggcaaa 3840 aaactcaatt tggttatcaa aaatgaagag tattttgagt tcgtgcagaa taggaataac 3900 taa 3903 <210> 31 <211> 3687 <212> DNA <213> Lachnospiraceae bacterium <400> 31 atgtctaaat tagagaagtt tacaaattgt tactctttgt caaaaacact tcgttttaag 60 gcgattcctg ttggaaaaac ccaagaaaat attgataata aaagattgct tgtcgaggat 120 gaaaaacgtg cagaagatta taagggggtt aaaaaattac ttgataggta ttatttatca 180 tttattaatg atgttcttca ttccattaaa ctaaagaatt taaataatta tatttcgttg 240 tttagaaaga aaactcggac ggaaaaagaa aacaaagaat tagaaaattt agagataaat 300 ttacgtaaag aaatcgctaa ggcttttaag ggtaatgaag gttataaatc tttatttaag 360 aaggatatta tcgagacgat attgcctgaa tttcttgatg ataaagatga aattgctttg 420 gttaattcat ttaatggatt tacaacggca tttaccggtt tttttgataa tagggaaaat 480 atgttttcgg aagaagctaa atcaacctca attgcttttc gttgtattaa tgagaattta 540 acaagatata tatcaaatat ggatatattt gaaaaagttg atgcaatttt cgataagcat 600 gaagtacagg aaataaaaga aaaaattcta aacagtgatt atgatgttga agatttcttc 660 gaaggagaat tttttaattt tgttcttacg caagaaggta tcgatgttta taacgctata 720 attggtggct ttgtgacaga atccggagaa aaaataaaag gattaaatga atatattaat 780 ttatataatc agaaaactaa gcaaaaatta ccgaagttta agcctttata taaacaggtt 840 ttatcagata gagagtcact ttctttttat ggcgaaggtt atacatctga tgaggaagtt 900 ttagaagtat ttagaaatac tcttaataag aattcagaaa tattttcttc aattaagaaa 960 ttggaaaagt tatttaaaaa cttcgatgaa tattcaagtg caggaatttt cgtaaaaaat 1020 ggaccggcta tttctacaat ttctaaggat atatttggag agtggaatgt aattagagac 1080 aaatggaatg cggagtacga tgatatacat ttaaaaaaga aggctgtagt aacagaaaaa 1140 tatgaagatg acaggcgtaa atcattcaaa aaaataggaa gtttttcatt ggagcagttg 1200 caagaatacg ctgatgctga tctatctgtg gtagagaagt taaaagaaat cattatccaa 1260 aaagtggatg agatatataa agtttatggc tcgtcagaaa aattgttcga tgctgatttt 1320 gtactagaaa aatcgttaaa aaagaatgat gcagttgtag caataatgaa agatttacta 1380 gattctgtga agtcttttga aaattatata aaagcctttt ttggagaggg aaaagaaaca 1440 aatcgagatg aatcatttta tggtgatttt gttttggcat atgacattct tttgaaagtg 1500 gatcatattt atgatgcaat acgaaattat gtgacacaaa aaccgtattc gaaagataag 1560 tttaaattat attttcaaaa cccgcaattt atggggggct gggataagga taaagagaca 1620 gactataggg caactatact tagatatggc tcaaagtatt acttggcgat tatggataaa 1680 aaatatgcta agtgcttgca aaaaatagat aaggatgatg taaatggaaa ctatgaaaaa 1740 ataaattata agttgcttcc aggacctaat aagatgcttc caaaggtgtt ttttagtaag 1800 aagtggatgg cttattataa tccgtcggaa gatattcaaa aaatatataa aaatggaaca 1860 tttaaaaaag gagatatgtt taatttaaat gattgtcata aattaattga tttctttaag 1920 gattcaatca gtcggtatcc gaaatggagt aacgcatatg attttaactt ttctgagacc 1980 gagaaatata aggatatagc aggtttttac agagaggttg aagaacaagg atataaagta 2040 tcatttgaaa gtgcgtctaa aaaagaagtt gataaattgg tagaagaagg aaaattatac 2100 atgttccaaa tttataataa agacttttcg gataaaagtc atggaacgcc aaatcttcat 2160 acaatgtatt ttaagttgct gtttgatgaa aataatcatg gtcaaattag gctttctggt 2220 ggtgctgagc tattcatgcg acgtgcaagt ttgaaaaagg aagaattagt tgtgcatcct 2280 gccaatagcc cgatagcgaa taaaaacccg gataatccaa agaaaacgac tacgttgtca 2340 tatgatgtat acaaggacaa aagattttcg gaagatcagt atgagttgca tatacctatt 2400 gcaataaata aatgccctaa aaatatattt aagataaata cagaggttag agtgctgctg 2460 aagcatgatg ataatcctta tgttatagga attgataggg gggagagaaa tttactttac 2520 attgtggtgg ttgatggtaa gggtaatatt gtggagcaat attcgctgaa tgaaataatt 2580 aataatttta atggaattag aattaagacg gattaccatt cacttttgga taaaaaggag 2640 aaggaaagat ttgaagctcg tcaaaattgg acgtctatag aaaacattaa agaactaaaa 2700 gccggatata ttagtcaggt tgttcataag atatgtgagt tggtagaaaa atatgatgcg 2760 gtaattgcac ttgaagattt gaattctggt tttaagaata gtcgagttaa agttgaaaag 2820 caagtatatc agaaatttga aaaaatgctg attgataaac ttaactatat ggtagataag 2880 aaatctaatc cttgcgctac gggtggtgct ctgaaaggct atcaaattac taacaagttt 2940 gagagtttta agtcgatgag tacacaaaat ggttttattt tttatattcc ggcgtggttg 3000 actagcaaaa ttgatccgtc aacaggattt gtaaatttgt tgaaaacaaa gtatacgagc 3060 attgcagatt caaagaaatt tataagttct tttgacagaa ttatgtatgt acctgaagaa 3120 gatttattcg agtttgcatt agattataag aatttttctc ggacagacgc ggattatata 3180 aaaaaatgga aactctatag ctatggtaac aggattagaa tatttagaaa tcctaaaaaa 3240 aataatgtat ttgattggga agaggtatgt cttacatcag cctataagga actttttaat 3300 aaatatggga ttaattatca gcaaggagat atacgagctc tcttatgtga acagagtgat 3360 aaggcattct atagctcttt tatggcatta atgtcactca tgctgcaaat gagaaatagt 3420 ataacaggta ggacggatgt agattttttg atttcaccag taaaaaattc tgacggtatt 3480 ttttatgatt ccagaaatta tgaagctcag gaaaatgcaa tattaccgaa aaatgcagat 3540 gctaatgggg cttataatat cgcaagaaaa gttttgtggg ctataggtca gtttaaaaag 3600 gctgaagatg aaaaacttga taaggttaaa attgcaatat caaataagga atggctcgaa 3660 tatgcgcaaa caagtgttaa gcattga 3687 <210> 32 <211> 1300 <212> PRT <213> Francisella novicida <400> 32 Met Ser Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr 1 5 10 15 Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys 20 25 30 Ala Arg Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys 35 40 45 Lys Ala Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu 50 55 60 Ile Leu Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser 65 70 75 80 Asp Val Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys 85 90 95 Asp Phe Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr 100 105 110 Ile Lys Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile 115 120 125 Asp Ala Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln 130 135 140 Ser Lys Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr 145 150 155 160 Asp Ile Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr 165 170 175 Thr Tyr Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser 180 185 190 Asn Asp Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu 195 200 205 Pro Lys Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys 210 215 220 Ala Pro Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu 225 230 235 240 Glu Leu Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg 245 250 255 Val Phe Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr 260 265 270 Leu Asn Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys 275 280 285 Phe Val Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile 290 295 300 Asn Leu Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys 305 310 315 320 Met Ser Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser 325 330 335 Phe Val Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met 340 345 350 Gln Ser Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys 355 360 365 Ser Ile Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln 370 375 380 Lys Leu Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr 385 390 395 400 Asp Leu Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala 405 410 415 Val Leu Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn 420 425 430 Pro Ser Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala 435 440 445 Lys Tyr Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn 450 455 460 Lys His Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala 465 470 475 480 Asn Phe Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys 485 490 495 Asp Asn Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys 500 505 510 Asp Leu Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp 515 520 525 Leu Leu Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His 530 535 540 Ile Ser Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His 545 550 555 560 Phe Tyr Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val 565 570 575 Pro Leu Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser 580 585 590 Asp Glu Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly 595 600 605 Trp Asp Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys 610 615 620 Asp Asp Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile 625 630 635 640 Phe Asp Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys 645 650 655 Ile Val Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val 660 665 670 Phe Phe Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile 675 680 685 Leu Arg Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln 690 695 700 Lys Gly Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe 705 710 715 720 Ile Asp Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp 725 730 735 Phe Gly Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu 740 745 750 Phe Tyr Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn 755 760 765 Ile Ser Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr 770 775 780 Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg 785 790 795 800 Pro Asn Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn 805 810 815 Leu Gln Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr 820 825 830 Arg Lys Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala 835 840 845 Ile Ala Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu 850 855 860 Tyr Asp Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe 865 870 875 880 His Cys Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe 885 890 895 Asn Asp Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His 900 905 910 Ile Leu Ser Ile Asp Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu 915 920 925 Val Asp Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile 930 935 940 Gly Asn Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile 945 950 955 960 Glu Lys Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn 965 970 975 Ile Lys Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile 980 985 990 Ala Lys Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu 995 1000 1005 Asn Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val 1010 1015 1020 Tyr Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu 1025 1030 1035 Val Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg 1040 1045 1050 Ala Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly 1055 1060 1065 Lys Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser 1070 1075 1080 Lys Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys 1085 1090 1095 Tyr Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp 1100 1105 1110 Lys Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe 1115 1120 1125 Asp Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr 1130 1135 1140 Ile Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp 1145 1150 1155 Lys Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu 1160 1165 1170 Leu Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly 1175 1180 1185 Glu Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe 1190 1195 1200 Phe Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg 1205 1210 1215 Asn Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val 1220 1225 1230 Ala Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys 1235 1240 1245 Asn Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly 1250 1255 1260 Leu Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu 1265 1270 1275 Gly Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu 1280 1285 1290 Phe Val Gln Asn Arg Asn Asn 1295 1300 <210> 33 <211> 1228 <212> PRT <213> Lachnospiraceae bacterium <400> 33 Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr 1 5 10 15 Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp 20 25 30 Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys 35 40 45 Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp 50 55 60 Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu 65 70 75 80 Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn 85 90 95 Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn 100 105 110 Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu 115 120 125 Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe 130 135 140 Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn 145 150 155 160 Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile 165 170 175 Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys 180 185 190 Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys 195 200 205 Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe 210 215 220 Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile 225 230 235 240 Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn 245 250 255 Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys 260 265 270 Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser 275 280 285 Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe 290 295 300 Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys 305 310 315 320 Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile 325 330 335 Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe 340 345 350 Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp 355 360 365 Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp 370 375 380 Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu 385 390 395 400 Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu 405 410 415 Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser 420 425 430 Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys 435 440 445 Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys 450 455 460 Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr 465 470 475 480 Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile 485 490 495 Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr 500 505 510 Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro 515 520 525 Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala 530 535 540 Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys 545 550 555 560 Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly 565 570 575 Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met 580 585 590 Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro 595 600 605 Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly 610 615 620 Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys 625 630 635 640 Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn 645 650 655 Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu 660 665 670 Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys 675 680 685 Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile 690 695 700 Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His 705 710 715 720 Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile 725 730 735 Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys 740 745 750 Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys 755 760 765 Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr 770 775 780 Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile 785 790 795 800 Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val 805 810 815 Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp 820 825 830 Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly 835 840 845 Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn 850 855 860 Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu 865 870 875 880 Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile 885 890 895 Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys 900 905 910 Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu Asn 915 920 925 Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln 930 935 940 Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys 945 950 955 960 Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile 965 970 975 Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe 980 985 990 Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr 995 1000 1005 Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp 1010 1015 1020 Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro 1025 1030 1035 Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser 1040 1045 1050 Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr 1055 1060 1065 Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val 1070 1075 1080 Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu 1085 1090 1095 Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala 1100 1105 1110 Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met 1115 1120 1125 Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly 1130 1135 1140 Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser Asp 1145 1150 1155 Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala 1160 1165 1170 Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala 1175 1180 1185 Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp 1190 1195 1200 Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp 1205 1210 1215 Leu Glu Tyr Ala Gln Thr Ser Val Lys His 1220 1225 <210> 34 <211> 24 <212> DNA <213> Zea mays <400> 34 gacttgttcg ggagttaggt cagg 24 <210> 35 <211> 22 <212> DNA <213> Zea mays <400> 35 ggtgtccatg tcgtgctcaa gg 22 <210> 36 <211> 4125 <212> DNA <213> Artificial Sequence <220> <223> synthesized sequence of Maize Optimized Fransincella novicida U112 Cpf1 Gene with Intron and NLS <400> 36 atgagcatct accaggagtt cgtcaataaa tacagcctca gcaagaccct ccgcttcgag 60 ctcatccccc agggcaagac cctcgagaac ataaaagcca ggggcctgat cctggacgat 120 gagaagaggg ccaaggtaag tttctgcttc tacctttgat atatatataa taattatcat 180 taattagtag taatataata tttcaaatat ttttttcaaa ataaaagaat gtagtatata 240 gcaattgctt ttctgtagtt tataagtgtg tatattttaa tttataactt ttctaatata 300 tgaccaaaac atggtgatgt gcaggactac aagaaggcca agcaaataat tgacaagtac 360 caccagttct tcatcgagga gatcctcagc agcgtctgca tcagcgagga cctcctccag 420 aactacagcg acgtctactt caagctcaag aagagcgacg acgataacct ccagaaggac 480 ttcaagagcg cgaaggatac catcaagaag cagatcagcg agtatataaa ggactcagag 540 aagttcaaga acctcttcaa tcaaaacctc atcgacgcca agaagggcca ggagagcgat 600 ctgatcctgt ggctcaagca gagcaaggac aacggcatcg agctcttcaa ggccaacagc 660 gacatcaccg acatcgacga ggccctcgaa ataatcaaga gcttcaaggg ctggaccacc 720 tacttcaagg gcttccatga aaatagaaag aacgtctaca gcagcaacga catccccacc 780 agcatcatct acaggatcgt cgacgacaac ctccccaagt tcctcgaaaa taaagccaag 840 tacgagagcc tcaaggacaa ggcccccgag gccatcaact acgagcaaat taaaaaggac 900 ctcgccgagg agctcacctt cgacatcgac tacaagacca gcgaggtcaa tcaacgcgtg 960 ttcagcctcg acgaggtgtt cgagatcgcc aacttcaata attacctcaa tcaaagcggc 1020 atcaccaagt tcaatactat catcggcggc aagttcgtca acggcgaaaa tacaaagcgc 1080 aagggcatca acgagtatat aaatctctac agccagcaaa taaatgataa aacactcaaa 1140 aaatataaaa tgagcgtcct cttcaagcag atcctcagcg acaccgagag caagtccttc 1200 gtcatcgaca agctcgagga cgacagcgac gtcgtcacca ccatgcagag cttctacgag 1260 cagatcgccg ccttcaagac cgtcgaggag aagagcatta aagaaaccct cagcctcctc 1320 ttcgacgacc tcaaggccca gaagctcgac ctcagcaaga tctacttcaa gaacgacaag 1380 agcctcaccg acctcagcca gcaggtgttc gacgactaca gcgtcatcgg caccgccgtc 1440 ctcgagtata taactcagca gatcgccccc aagaacctcg acaaccccag caagaaggag 1500 caggaattaa tagccaaaaa gaccgagaag gcaaaatacc tcagcctcga aaccatcaag 1560 ctcgccctcg aggagttcaa caagcatcgc gacatcgaca agcagtgccg cttcgaggag 1620 atcctcgcca acttcgccgc catccccatg atcttcgatg aaatagccca gaacaaggac 1680 aacctcgccc agatcagcat caagtaccag aatcaaggca agaaggatct gctgcaggcg 1740 agcgcggagg acgacgtcaa ggccatcaag gacctcctcg accagaccaa taatctcctc 1800 cataaactca aaatattcca catcagccag agcgaggaca aggccaacat cctcgacaag 1860 gacgagcact tctacctcgt gttcgaggag tgctacttcg agctcgccaa catcgtcccc 1920 ctctacaaca agatccgcaa ctatataact cagaagccct acagcgacga gaagttcaag 1980 ctcaacttcg agaacagcac cctcgccaac ggctgggata aaaataaaga gcccgacaac 2040 accgccatcc tcttcatcaa ggacgataag tactacctgg gcgtgatgaa caagaaaaat 2100 aacaaaatat tcgacgacaa ggccatcaag gaaaataaag gcgagggcta taaaaaaatc 2160 gtctacaagc tcctacccgg cgccaataaa atgctcccca aggtgttctt cagcgccaag 2220 agcataaaat tctacaaccc cagcgaggac atcctccgca tccgcaacca ctcgacgcac 2280 accaagaacg gcagccccca gaagggctat gaaaaattcg agttcaacat cgaggactgc 2340 cgcaagttca tcgacttcta caagcagagc atcagcaagc atcccgagtg gaaggacttc 2400 gggttcaggt tctccgatac ccagagatat aatagcatcg acgagttcta ccgcgaggtc 2460 gagaatcaag gctacaagct caccttcgaa aatataagcg agagctacat cgacagcgtc 2520 gtcaaccagg gcaagctcta cctcttccag atctacaata aagacttcag cgcctacagc 2580 aagggccggc ccaacctcca caccctctac tggaaggccc tcttcgacga gcgcaacctc 2640 caggatgtgg tgtacaagct gaacggcgag gccgagctct tctaccgcaa gcaatcaata 2700 cccaagaaga tcacccaccc cgccaaggag gccatcgcca ataaaaacaa ggacaacccc 2760 aagaaggaga gcgtgttcga gtacgactta atcaaagaca agcgcttcac cgaggacaag 2820 ttcttcttcc actgccccat cacaatcaat ttcaagagca gcggcgccaa caagttcaac 2880 gatgaaatca atctcctcct caaggagaag gccaacgatg tgcacatcct cagcatcgac 2940 cgcggcgagc gccacctagc ctactacacc ctcgtcgacg gcaagggcaa catcatcaag 3000 caggacacct tcaacatcat cggcaacgac cgcatgaaaa ccaactacca cgacaagctc 3060 gccgccatcg agaaggacag ggacagcgcc aggaaggact ggaagaagat caacaacatc 3120 aaggagatga aagagggcta cctcagccag gtcgtccatg aaatagccaa gctcgtcatc 3180 gagtacaacg ccatcgtcgt gttcgaggac ctcaacttcg gcttcaagcg cggccgcttc 3240 aaggtcgaga agcaggtcta ccagaagctc gagaagatgc tcatcgagaa gctcaactac 3300 ctcgtgttca aggacaacga gttcgataaa actggcggcg tcctccgcgc ctaccagctc 3360 accgccccct tcgaaacctt caagaagatg ggcaagcaga ccggcatcat ctactacgtc 3420 cccgccggct tcaccagcaa gatctgcccc gtcaccggct tcgtcaacca gctctacccc 3480 aagtatgaaa gtgtcagcaa gagccaggag ttcttcagca agttcgacaa gatctgctac 3540 aacctcgaca agggctactt cgagttcagc ttcgactata aaaacttcgg cgacaaggcc 3600 gccaagggca agtggaccat cgccagcttc ggcagcaggc tcatcaactt ccgcaacagc 3660 gataaaaatc acaactggga cacccgcgag gtctacccca ccaaggagct cgagaagctc 3720 ctcaaggact acagcatcga gtacggccac ggcgagtgca tcaaggccgc catctgcggc 3780 gagagcgaca agaagttctt cgccaagctc accagcgtcc tcaatactat cctccagatg 3840 cgcaacagca agaccggcac cgagctcgac tacctcatca gccccgtcgc cgacgtcaac 3900 ggcaacttct tcgacagccg ccaggccccc aaaaatatgc cccaggacgc cgacgccaac 3960 ggcgcctacc acatcggcct caagggcctc atgctcctcg gcaggatcaa aaataatcaa 4020 gagggcaaga agctcaacct cgtcatcaag aacgaggagt acttcgagtt cgtccagaac 4080 cgcaacaaca gccgcgccga ccccaagaag aagcgcaagg tctag 4125 <210> 37 <211> 3909 <212> DNA <213> Artificial Sequence <220> <223> synthesized sequence of Maize Optimized Lachnospiraceae bacterium ND2006 Cpf1 Gene with Intron and NLS <400> 37 atgagcaagc tcgagaagtt caccaactgc tacagcctca gcaagaccct ccgcttcaag 60 gccatccccg tcggcaagac ccaggaaaat attgacaata aaagactcct cgtcgaggat 120 gaaaaacgcg ccgaggtaag tttctgcttc tacctttgat atatatataa taattatcat 180 taattagtag taatataata tttcaaatat ttttttcaaa ataaaagaat gtagtatata 240 gcaattgctt ttctgtagtt tataagtgtg tatattttaa tttataactt ttctaatata 300 tgaccaaaac atggtgatgt gcaggactac aagggcgtca agaagctcct cgaccgctac 360 tacctcagct tcattaatga cgtcctccac agcattaaac tcaagaacct caataattac 420 atcagcctct tcaggaaaaa gaccaggacc gagaaggaga acaaggagct cgagaacctc 480 gagatcaacc tcaggaagga gatcgccaag gccttcaagg gcaacgaggg ctacaagagc 540 ctcttcaaga aggacatcat cgaaaccatc ctccccgagt tcctcgacga caaggatgaa 600 attgccctcg tcaacagctt caacggcttc accaccgcct tcaccggctt cttcgacaac 660 cgcgaaaata tgttcagcga ggaggccaaa tcaaccagca tcgccttcag gtgcattaat 720 gagaacctca cccgctacat cagcaacatg gacatcttcg agaaggtcga cgccatcttc 780 gacaagcatg aggtccagga aataaaagag aagatcctca acagcgacta cgacgtcgag 840 gacttcttcg agggcgagtt cttcaacttc gtcctcaccc aggagggcat cgacgtctac 900 aacgccatca tcggcggctt cgtcaccgag agcggcgaga aaataaaagg attaaatgag 960 tacattaatt tatataatca aaagaccaag cagaagctcc ccaagttcaa gcccttatat 1020 aaacaggtcc tcagcgacag ggagtccctc tcgttctacg gcgagggcta tacatctgac 1080 gaggaggtcc tcgaggtgtt ccgcaacacc ctcaacaaga actccgagat cttcagctca 1140 attaagaagc tcgagaagct cttcaagaac ttcgacgagt acagcagcgc cggcatcttc 1200 gtcaagaacg gccccgccat cagcaccatc agcaaggaca tcttcggcga gtggaacgtc 1260 atccgcgaca agtggaacgc cgagtacgac gacatacatc tcaagaagaa ggccgtcgtc 1320 accgaaaaat atgaggacga ccgccgcaag agcttcaaga aaataggcag cttcagcctc 1380 gagcagctcc aggagtacgc cgacgccgac ctcagcgtcg tcgagaagct caaggagatt 1440 attatccaga aggtcgacga gatatataaa gtctacggca gcagcgagaa gctcttcgac 1500 gccgacttcg tcctcgagaa gagcctcaag aagaacgacg ccgtcgtcgc aataatgaaa 1560 gacctcctcg acagcgtcaa gagcttcgag aactatataa aagccttctt cggcgagggc 1620 aaggaaacca accgcgacga gagcttctac ggcgacttcg tcctcgccta cgacatcctc 1680 ctcaaggtcg accacatcta cgacgccatc cgcaactacg tcacccagaa gccctacagc 1740 aaggacaagt tcaagctcta cttccagaac ccccagttca tgggcggctg ggacaaggac 1800 aaggaaaccg actaccgcgc caccatcctc cgctacggca gcaagtacta cctcgccatc 1860 atggataaaa aatatgccaa gtgcctacag aaaatagaca aggacgacgt caacggcaac 1920 tatgaaaaaa taaattacaa gctcctcccc ggccccaaca agatgctccc caaggtgttc 1980 ttcagcaaga agtggatggc ctactacaac cccagcgagg acatccagaa aatatataaa 2040 aatggcacct tcaagaaggg cgacatgttc aacctcaacg actgccataa attaattgac 2100 ttcttcaagg acagcatcag ccgctacccc aagtggagca acgcctacga cttcaacttc 2160 agcgaaaccg agaaatataa ggacatcgcc ggcttctacc gcgaggtcga ggagcaggga 2220 tataaagtca gcttcgagag cgccagcaag aaggaggtcg acaagctcgt cgaggagggc 2280 aagttataca tgttccagat ctacaataaa gacttcagcg ataaaagtca cggcaccccc 2340 aacctccaca ccatgtactt caagctcctc ttcgatgaaa ataatcacgg ccagatcagg 2400 ctcagcggcg gcgccgagct cttcatgcgc cgcgccagcc taaagaagga ggagctcgtc 2460 gtccaccccg ccaacagccc catcgccaat aaaaaccccg acaaccccaa aaagaccacc 2520 accctcagct acgacgtcta caaggacaag aggttcagcg aggaccagta cgagctccac 2580 atccccatcg caataaataa atgccccaaa aatatattca agatcaatac agaggtccgc 2640 gtcctcctca agcatgacga caacccctac gtcatcggca tcgacagggg cgagcgcaac 2700 ctcctctaca tcgtcgtcgt cgacggcaag ggcaacatcg tcgagcagta cagcctcaat 2760 gaaataatta ataatttcaa cggcatcaga attaagaccg actaccacag cctcctcgat 2820 aaaaaggaga aggagaggtt cgaggcccgc cagaactgga ccagcatcga gaacattaaa 2880 gagctcaagg ccggctacat cagccaggtc gtccacaaga tctgcgagct cgtcgaaaaa 2940 tatgacgccg tcatcgccct cgaggacctc aacagcggct tcaagaacag ccgcgtcaag 3000 gtcgagaagc aggtctacca gaagttcgag aagatgctca tcgacaagct caactacatg 3060 gtcgacaaga agagcaaccc ctgcgccacc ggcggcgccc tcaagggcta ccagatcacc 3120 aacaagttcg agagcttcaa gagcatgagc acccagaacg gcttcatctt ctacatcccc 3180 gcctggctca ccagcaagat cgaccccagc accggcttcg tcaacctcct caagaccaag 3240 tacaccagca tcgccgacag caagaagttc atcagcagct tcgaccgcat catgtacgtc 3300 cccgaggagg acctcttcga gttcgccctc gactacaaga acttcagccg caccgacgcc 3360 gactatataa aaaagtggaa gctctacagc tacggcaaca ggatccgcat cttccgcaac 3420 cccaagaaaa ataatgtgtt cgactgggag gaggtctgcc tcaccagcgc ctacaaggag 3480 ctcttcaata aatacggcat taattaccag cagggcgaca tcagggccct cctctgcgag 3540 cagagcgaca aggccttcta cagcagcttc atggcattaa tgagcctcat gctccagatg 3600 cgcaacagca tcaccggccg caccgacgtc gacttcctca tcagccccgt caagaacagc 3660 gacggcatct tctacgacag ccgcaactac gaggcccagg agaacgccat cctccccaag 3720 aacgccgacg ccaacggcgc ctacaacatc gccaggaagg tcctctgggc catcggccag 3780 ttcaagaagg ccgaggatga aaaactcgac aaggtcaaga tcgccatcag caacaaggag 3840 tggctcgagt acgcccagac cagcgtcaag catagccgcg ccgaccccaa gaagaagcgc 3900 aaggtctag 3909 <210> 38 <211> 20 <212> RNA <213> Fransincella novicida <400> 38 uaauuucuac uguuguagau 20 <210> 39 <211> 21 <212> RNA <213> Lachnospiraceae bacterium <400> 39 uaauuucuac uaaguguaga u 21 <210> 40 <211> 44 <212> RNA <213> Artificial Sequence <220> <223> Synthesized Fn Cpf1 Maize Optimized Guide RNA <220> <221> misc_feature <222> (22)..(44) <223> n is a, c, g, or u <400> 40 guaauuucua cuguuguaga unnnnnnnnn nnnnnnnnnn nnnn 44 <210> 41 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> Synthesized Lb Cpf1 Maize Optimized Guide RNA <220> <221> misc_feature <222> (23)..(45) <223> n is a, c, g, or u <400> 41 guaauuucua cuaaguguag aunnnnnnnn nnnnnnnnnn nnnnn 45 <210> 42 <211> 44 <212> RNA <213> Artificial Sequence <220> <223> Synthesized Fn Cpf1 Maize Optimized Guide RNA Containing AsMS26-1 Variable Targeting Domain <400> 42 guaauuucua cuguuguaga uauucauaug gugucccuga ccua 44 <210> 43 <211> 45 <212> RNA <213> Artificial Sequence <220> <223> Synthesized Lb Cpf1 Maize Optimized Guide RNA Containing AsMS26-1 Variable Targeting Domain <400> 43 guaauuucua cuaaguguag auauucauau ggugucccug accua 45 <210> 44 <211> 43 <212> DNA <213> artificial sequence <220> <223> synthetic oligonulceotide comprising DNA and RNA nucleotides <220> <221> misc_feature <222> (1)..(43) <223> hybrid DNA-RNA oligonucleotide <400> 44 taauuucuac ucuuguagau cucuuagcuc aucaccuaug ugg 43 <210> 45 <211> 43 <212> DNA <213> artificial sequence <220> <223> synthetic oligonulceotide comprising DNA and RNA nucleotides <220> <221> misc_feature <222> (1)..(43) <223> hybrid DNA-RNA oligonucleotide <400> 45 uaauuucuac ucuuguagau cucuuagcuc aucaccuaug ugg 43 <210> 46 <211> 43 <212> DNA <213> artificial sequence <220> <223> synthetic oligonulceotide comprising DNA and RNA nucleotides <220> <221> misc_feature <222> (1)..(43) <223> hybrid DNA-RNA oligonucleotide <400> 46 uaauuucuac uctuguagau cucuuagcuc aucaccuaug ugg 43 <210> 47 <211> 43 <212> DNA <213> artificial sequence <220> <223> synthetic oligonulceotide comprising DNA and RNA nucleotides <220> <221> misc_feature <222> (1)..(43) <223> hybrid DNA-RNA oligonucleotide <400> 47 uaauuucuac ucuuguagau cucuuagcuc aucaccuaug ugg 43 <210> 48 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> synthetic oligonucleotide <400> 48 ggccgagguc gacuaccggc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 49 <211> 23 <212> DNA <213> Zea mays <400> 49 ggccgaggtc gactaccggc cgg 23 <210> 50 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> synthetic oligonucleotide <220> <221> misc_feature <222> (1)..(23) <223> n is a, c, g, or t <400> 50 nnnnnnnnnn nnnnnnnnnn nnn 23

Claims (29)

  1. 식물 세포의 게놈 내 표적 서열을 변형하기 위한 방법으로서,
    a) 식물 세포 내로 Cpf1 엔도뉴클레아제 단백질 또는 상기 Cpf1 엔도뉴클레아제 단백질을 암호화하는 식물-최적화된 폴리뉴클레오티드, 및 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적화 도메인을 포함하는 가이드 폴리뉴클레오티드 또는 상기 가이드 폴리뉴클레오티드를 발현하는 재조합 DNA를 도입하는 단계; 및,
    b) 상기 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하고,
    상기 가이드 폴리뉴클레오티드 및 Cpf1 엔도뉴클레아제는 상기 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있는 방법.
  2. 제1항에 있어서, 식물-최적화된 폴리뉴클레오티드가 상기 Cpf1 엔도뉴클레아제 단백질을 암호화하는 식물-최적화된 mRNA 또는 상기 Cpf1 엔도뉴클레아제 단백질을 암호화하는 식물-최적화된 폴리뉴클레오티드에 작동 가능하게 연결된 프로모터를 포함하는 재조합 DNA 작제물인 방법.
  3. 제1항에 있어서, 상기 표적 서열에서 변형을 갖는 적어도 하나의 식물 세포를 동정하는 단계를 더 포함하며, 상기 표적 서열에서 변형은 (i) 적어도 하나의 뉴클레오티드의 치환, (ii) 적어도 하나의 뉴클레오티드의 결실, (iii) 적어도 하나의 뉴클레오티드의 삽입, 및 (iv) (i) 내지 (iii)의 임의의 조합으로 이루어진 군으로부터 선택되는 방법.
  4. 제3항에 있어서, 상기 표적 서열에서의 상기 변형이 b)의 식물 세포가 약 28℃의 전형적인 식물 조직 배양 온도에서 인큐베이션되는 대조군 방법과 비교되는 경우 증가된 빈도로 발생하는 방법.
  5. 제4항에 있어서, 상기 대조군 방법과 비교되는 경우 증가된 빈도가 적어도 2-배, 적어도 3-배, 적어도 4-배, 적어도 5-배, 적어도 6-배, 적어도 7-배, 적어도 8-배, 적어도 9-배, 적어도 10-배, 적어도 10-배, 적어도 11-배, 적어도 12-배, 적어도 13-배, 적어도 14-배, 적어도 15-배, 적어도 30-배, 적어도 40-배, 또는 적어도 50-배만큼 증가되는 방법.
  6. 제1항에 있어서, 식물 세포로 공여 DNA를 도입하는 단계를 더 포함하며, 상기 공여 DNA는 관심 폴리뉴클레오티드를 포함하는 방법.
  7. 제6항에 있어서, 상기 표적 서열 내로 또는 근처로 통합된 관심 폴리뉴클레오티드를 그 게놈에 포함하는 적어도 하나의 식물 세포를 동정하는 단계를 더 포함하는 방법.
  8. 식물 세포의 게놈 내 뉴클레오티드 서열을 편집하기 위한 방법으로서,
    a) 식물 세포 내로 Cpf1 엔도뉴클레아제 단백질 또는 상기 Cpf1 엔도뉴클레아제 단백질을 암호화하는 식물-최적화된 폴리뉴클레오티드, 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적화 도메인을 포함하는 가이드 폴리뉴클레오티드, 및 폴리뉴클레오티드 변형 주형을 도입하는 단계로서,
    상기 폴리뉴클레오티드 변형 주형은 상기 뉴클레오티드 서열의 적어도 하나의 뉴클레오티드 변형을 포함하는 단계; 및,
    b) 상기 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하고,
    상기 가이드 폴리뉴클레오티드 및 Cpf1 엔도뉴클레아제 단백질은 상기 표적 서열의 전부 또는 일부를 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 복합체를 형성할 수 있는 방법.
  9. 제8항에 있어서, 상기 뉴클레오티드 서열의 상기 적어도 하나의 뉴클레오티드 변형을 그 게놈에 포함하는 적어도 하나의 식물 세포를 동정하는 단계를 더 포함하는 방법.
  10. 제1항 또는 제8항에 있어서, 상기 가이드 폴리뉴클레오티드가 RNA 폴리뉴클레오티드, DNA 폴리뉴클레오티드, 또는 RNA-DNA 폴리뉴클레오티드로 이루어진 군으로부터 선택되는 방법.
  11. 제1항에 있어서, 식물 세포가 외떡잎 식물 세포 또는 쌍떡잎 식물 세포인 방법.
  12. 제11항에 있어서, 식물 세포가 옥수수, 벼, 수수, 호밀, 보리, 밀, 밀렛, 귀리, 사탕 수수, 잔디, 또는 스위치그래스, 대두, 카놀라, 알팔파, 해바라기, 목화, 담배, 땅콩, 감자, 담배, 애기장대, 및 잇꽃 세포로 이루어진 군으로부터 선택되는 방법.
  13. 식물 세포의 게놈 내 여러 표적 서열을 동시에 변형하는 방법으로서,
    a) 상기 식물 세포 내로 Cpf1 엔도뉴클레아제 단백질, 또는 상기 Cpf1 엔도뉴클레아제 단백질을 암호화하는 식물-최적화된 폴리뉴클레오티드, 및 여러 단일 가이드 RNA로 가공되는 단일 전구체 RNA를 발현할 수 있는 전구체 가이드 RNA 전사 개시 카세트를 도입하는 단계로서, 각각의 단일 가이드 RNA는 프로토스페이서 인접 모티프(PAM) 3'의 가변 표적화 도메인을 포함하며, 상기 가변 표적화 도메인은 식물 게놈 내 단일 표적 서열과 상보적인 단계; 및,
    b) (a)의 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 포함하고,
    각각의 상기 단일 가이드 RNA 및 상기 Cpf1 엔도뉴클레아제 단백질은 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 리보뉴클레오티드 복합체를 형성할 수 있는 방법.
  14. 제13항에 있어서, 여러 표적 서열이 적어도 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 11개, 12개, 13개, 14개, 15개, 16개, 17개, 18개, 19개, 20개 표적 서열로 이루어진 방법.
  15. 제13항에 있어서, 전구체 가이드 RNA 전사 개시 카세트가 전구체 가이드 RNA에 작동 가능하게 연결된 Pol-II 프로모터를 포함하는 방법.
  16. 제13항에 있어서, 전구체 가이드 RNA 전사 개시 카세트가 전구체 가이드 RNA에 작동 가능하게 연결된 Pol-III 프로모터를 포함하는 방법.
  17. 식물 세포의 게놈 내 DNA 표적 서열을 변형하기 위한 방법으로서,
    a) 식물 세포 내로 Cpf1 엔도뉴클레아제 단백질 또는 상기 Cpf1 엔도뉴클레아제 단백질을 암호화하는 식물-최적화된 폴리뉴클레오티드, 및 Cpf1 엔도뉴클레아제 단백질과 Cpf1 복합체를 형성할 수 있는 가이드 폴리뉴클레오티드 또는 상기 가이드 폴리뉴클레오티드를 발현하는 재조합 DNA를 도입하는 단계로서, 상기 가이드 폴리뉴클레오티드는 식물 게놈 내 표적 서열과 실질적으로 상보적인 가변 표적화 도메인을 포함하는 단계; 및,
    b) Cpf1 복합체에 의해 인식되는 PAM 서열에 인접한 DNA 표적 서열에 대응하는 적어도 하나의 영역을 포함하는 폴리뉴클레오티드 변형 주형을 도입하는 단계로서, 상기 DNA 표적 서열에 대응하는 적어도 하나의 영역은 PAM 서열의 3', +1 내지 +19 위치에서 DNA 표적 서열에 비해 적어도 하나의 뉴클레오티드 미스매치를 포함하는 단계를 포함하는 방법.
  18. 제17항에 있어서, 상기 방법이 상기 식물 세포를 적어도 약 4 hr의 기간 동안 28℃ 초과 온도에서 인큐베이션하는 단계를 더 포함하는 방법.
  19. 제17항에 있어서, 상기 Cpf1 복합체가 상기 표적 서열을 인식하고, 결합하고, 선택적으로 닉킹 또는 절단할 수 있는 방법.
  20. Cpf1 복합체에 의해 인식되는 PAM 서열에 인접한 DNA 표적 서열과 상보적인 적어도 하나의 영역을 포함하는 폴리뉴클레오티드 변형 주형으로서, 상기 DNA 표적 서열에 대응하는 적어도 하나의 영역이 PAM 서열의 3', +1 내지 +19 위치에서 DNA 표적 서열에 비해 적어도 하나의 뉴클레오티드 미스매치를 포함하는, 폴리뉴클레오티드 변형 주형.
  21. 제20항에 있어서, 적어도 하나의 뉴클레오티드 미스매치가 PAM 서열의 3', +14 내지 +19 위치에 있는 폴리뉴클레오티드 변형 주형.
  22. 제21항에 있어서, 주형이 PAM 서열의 3', +1 내지 +19 위치에서 DNA 표적 서열에 비해 2개의 뉴클레오티드 미스매치를 포함하는 폴리뉴클레오티드 변형 주형.
  23. 제21항에 있어서, 주형이 PAM 서열의 3', +1 내지 +19 위치에서 DNA 표적 서열에 비해 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 뉴클레오티드 미스매치를 포함하는 폴리뉴클레오티드 변형 주형.
  24. 제20항에 있어서, DNA 표적 서열에 대응하는 적어도 하나의 영역이 PAM 서열의 3', +20 내지 +24 위치에서 표적 DNA 서열에 대응하는 영역에 변형을 더 포함하는 폴리뉴클레오티드 변형 주형.
  25. 제24항에 있어서, PAM 서열의 3', +20 내지 +24 위치에서 표적 DNA 서열에 대응하는 영역 내 변형이 적어도 하나의 뉴클레오티드 삽입을 포함하는 폴리뉴클레오티드 변형 주형.
  26. 제25항에 있어서, 적어도 하나의 삽입이 PAM 서열의 3', 위치 +21 내지 +22 사이의 위치에서 표적 DNA 서열에 대응하는 영역 내 뉴클레오티드 삽입인 폴리뉴클레오티드 변형 주형.
  27. 제20항에 있어서, 주형이 식물의 게놈 내 뉴클레오티드 서열과 상보적인 제2 DNA 영역을 더 포함하며, 상기 폴리뉴클레오티드 변형 주형은 상기 뉴클레오티드 서열의 적어도 하나의 뉴클레오티드 변형을 포함하는 폴리뉴클레오티드 변형 주형.
  28. 제40항에 있어서, 주형이 제1 플랭킹 영역 및 제2 플랭킹 영역을 더 포함하며, 상기 제1 및 제2 플랭킹 영역은 표적 DNA 서열에 플랭킹하여 상동성 유도 복구를 유도할 수 있는 폴리뉴클레오티드 변형 주형.
  29. Cpf1 복합체에 의해 인식되는 DNA 표적 서열에 인접한 PAM 서열과 상보적인 적어도 하나의 영역을 포함하는 폴리뉴클레오티드 변형 주형으로서, PAM 서열에 대응하는 적어도 하나의 영역이 적어도 하나의 뉴클레오티드 미스매치를 포함하는 폴리뉴클레오티드 변형 주형.
KR1020187036654A 2016-06-14 2017-05-31 식물 게놈 변형을 위한 cpf1 엔도뉴클레아제의 용도 KR20190016970A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662349826P 2016-06-14 2016-06-14
US62/349,826 2016-06-14
US201762468013P 2017-03-07 2017-03-07
US62/468,013 2017-03-07
PCT/US2017/035175 WO2017218185A1 (en) 2016-06-14 2017-05-31 Use of cpf1 endonuclease for plant genome modifications

Publications (1)

Publication Number Publication Date
KR20190016970A true KR20190016970A (ko) 2019-02-19

Family

ID=59067902

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187036654A KR20190016970A (ko) 2016-06-14 2017-05-31 식물 게놈 변형을 위한 cpf1 엔도뉴클레아제의 용도

Country Status (11)

Country Link
US (1) US20200332305A1 (ko)
EP (1) EP3469077A1 (ko)
KR (1) KR20190016970A (ko)
CN (1) CN109312317A (ko)
AU (1) AU2017286122A1 (ko)
BR (1) BR112018076027A2 (ko)
CA (1) CA3022854A1 (ko)
IL (1) IL262795A (ko)
MX (1) MX2018014993A (ko)
WO (1) WO2017218185A1 (ko)
ZA (1) ZA201807366B (ko)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
CN105829536A (zh) 2013-08-22 2016-08-03 纳幕尔杜邦公司 用于在不掺入选择性转基因标记的情况下,在植物基因组中产生基因修饰的方法,以及用于这种方法的组合物
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US20150165054A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting caspase-9 point mutations
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
BR112017017260A2 (pt) 2015-03-27 2018-04-17 Du Pont construções de dna, vetor, célula, plantas, semente, método de expressão de rna e método de modificação de local alvo
WO2017070633A2 (en) 2015-10-23 2017-04-27 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
SG11201900907YA (en) 2016-08-03 2019-02-27 Harvard College Adenosine nucleobase editors and uses thereof
EP3497214B1 (en) 2016-08-09 2023-06-28 President and Fellows of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
CA3039928A1 (en) 2016-10-14 2018-04-19 President And Fellows Of Harvard College Aav delivery of nucleobase editors
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
IL306092A (en) 2017-03-23 2023-11-01 Harvard College Nucleic base editors that include nucleic acid programmable DNA binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
WO2019079347A1 (en) 2017-10-16 2019-04-25 The Broad Institute, Inc. USES OF BASIC EDITORS ADENOSINE
CN111836825A (zh) * 2018-01-11 2020-10-27 科沃施种子欧洲股份两合公司 优化的植物crispr/cpf1系统
WO2020028729A1 (en) 2018-08-01 2020-02-06 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof
WO2020117837A1 (en) * 2018-12-04 2020-06-11 Monsanto Technology Llc Methods and compositions for improving silage
CN113166744A (zh) 2018-12-14 2021-07-23 先锋国际良种公司 用于基因组编辑的新颖crispr-cas系统
WO2020142754A2 (en) * 2019-01-04 2020-07-09 Mammoth Biosciences, Inc. Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection
AU2020242032A1 (en) 2019-03-19 2021-10-07 Massachusetts Institute Of Technology Methods and compositions for editing nucleotide sequences
CN110283840B (zh) * 2019-04-11 2021-04-13 华中农业大学 陆地棉基因组的精确高效编辑方法
EP4025697A1 (en) 2019-09-05 2022-07-13 Benson Hill, Inc. Compositions and methods for modifying genomes
US20230059309A1 (en) * 2020-01-09 2023-02-23 Pioneer Hi-Bred International, Inc. Two-step gene swap
WO2021162909A1 (en) * 2020-02-11 2021-08-19 Pioneer Hi-Bred International, Inc. Methods and compositions for multiplexed editing of plant cell genomes
US20230084762A1 (en) * 2020-02-24 2023-03-16 Pioneer Hi-Bred International, Inc. Novel crispr-cas systems for genome editing
KR20230019843A (ko) 2020-05-08 2023-02-09 더 브로드 인스티튜트, 인코퍼레이티드 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물
JP2023546158A (ja) * 2020-10-19 2023-11-01 カリブー・バイオサイエンシーズ・インコーポレイテッド Crispr v型系のためのdna含有ポリヌクレオチドおよびガイド、ならびにこれらを製造する方法および使用する方法
WO2023102393A1 (en) * 2021-11-30 2023-06-08 Pioneer Hi-Bred International, Inc. High efficiency large scale chromosomal genome manipulation

Family Cites Families (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US561399A (en) 1896-06-02 Voting-machine
US544858A (en) 1895-08-20 Gambrel
US5380831A (en) 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
US5107065A (en) 1986-03-28 1992-04-21 Calgene, Inc. Anti-sense regulation of gene expression in plant cells
US5316931A (en) 1988-02-26 1994-05-31 Biosource Genetics Corp. Plant viral vectors having heterologous subgenomic promoters for systemic expression of foreign genes
US5990387A (en) 1988-06-10 1999-11-23 Pioneer Hi-Bred International, Inc. Stable transformation of plant cells
US5023179A (en) 1988-11-14 1991-06-11 Eric Lam Promoter enhancer element for gene expression in plant roots
US5110732A (en) 1989-03-14 1992-05-05 The Rockefeller University Selective gene expression in plants
US5231020A (en) 1989-03-30 1993-07-27 Dna Plant Technology Corporation Genetic engineering of novel plant phenotypes
US5034323A (en) 1989-03-30 1991-07-23 Dna Plant Technology Corporation Genetic engineering of novel plant phenotypes
US5240855A (en) 1989-05-12 1993-08-31 Pioneer Hi-Bred International, Inc. Particle gun
US5879918A (en) 1989-05-12 1999-03-09 Pioneer Hi-Bred International, Inc. Pretreatment of microprojectiles prior to using in a particle gun
US5310667A (en) 1989-07-17 1994-05-10 Monsanto Company Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthases
US5322783A (en) 1989-10-17 1994-06-21 Pioneer Hi-Bred International, Inc. Soybean transformation by microparticle bombardment
AU639788B2 (en) 1990-04-26 1993-08-05 Plant Genetic Systems N.V. New bacillus thuringiensis strains and their genes encoding insecticidal toxins
US5478369A (en) 1990-06-12 1995-12-26 Pioneer Hi-Bred International, Inc. Nucleotide sequences mediating male fertility and method of using same
US5633435A (en) 1990-08-31 1997-05-27 Monsanto Company Glyphosate-tolerant 5-enolpyruvylshikimate-3-phosphate synthases
US5866775A (en) 1990-09-28 1999-02-02 Monsanto Company Glyphosate-tolerant 5-enolpyruvyl-3-phosphoshikimate synthases
US5932782A (en) 1990-11-14 1999-08-03 Pioneer Hi-Bred International, Inc. Plant transformation method using agrobacterium species adhered to microprojectiles
US5277905A (en) 1991-01-16 1994-01-11 Mycogen Corporation Coleopteran-active bacillus thuringiensis isolate
US5459252A (en) 1991-01-31 1995-10-17 North Carolina State University Root specific gene promoter
US20020042929A1 (en) 1991-05-31 2002-04-11 Gurdip S. Brar Method of creating transformed maize
GB9114259D0 (en) 1991-07-02 1991-08-21 Ici Plc Plant derived enzyme and dna sequences
DE69227911T2 (de) 1991-08-02 1999-05-12 Mycogen Corp Neuer mikroorganismus und insektizid
PT100930B (pt) 1991-10-04 2004-02-27 Univ North Carolina State Plantas transgenicas resistentes aos agentes patogenicos e metodo para a sua producao
TW261517B (ko) 1991-11-29 1995-11-01 Mitsubishi Shozi Kk
US5324646A (en) 1992-01-06 1994-06-28 Pioneer Hi-Bred International, Inc. Methods of regeneration of Medicago sativa and expressing foreign DNA in same
US5401836A (en) 1992-07-16 1995-03-28 Pioneer Hi-Bre International, Inc. Brassica regulatory sequence for root-specific or root-abundant gene expression
HUT70467A (en) 1992-07-27 1995-10-30 Pioneer Hi Bred Int An improved method of agrobactenium-mediated transformation of cultvred soyhean cells
IL108241A (en) 1992-12-30 2000-08-13 Biosource Genetics Corp Plant expression system comprising a defective tobamovirus replicon integrated into the plant chromosome and a helper virus
AU6162294A (en) 1993-01-13 1994-08-15 Pioneer Hi-Bred International, Inc. High lysine derivatives of alpha-hordothionin
US5814618A (en) 1993-06-14 1998-09-29 Basf Aktiengesellschaft Methods for regulating gene expression
US5789156A (en) 1993-06-14 1998-08-04 Basf Ag Tetracycline-regulated transcriptional inhibitors
US5593881A (en) 1994-05-06 1997-01-14 Mycogen Corporation Bacillus thuringiensis delta-endotoxin
US5633363A (en) 1994-06-03 1997-05-27 Iowa State University, Research Foundation In Root preferential promoter
US5736369A (en) 1994-07-29 1998-04-07 Pioneer Hi-Bred International, Inc. Method for producing transgenic cereal plants
US5792931A (en) 1994-08-12 1998-08-11 Pioneer Hi-Bred International, Inc. Fumonisin detoxification compositions and methods
CA2160529A1 (en) 1994-10-14 1996-04-15 Toshihiko Iizuka Bacillus strain and harmful organism controlling agents
US5659026A (en) 1995-03-24 1997-08-19 Pioneer Hi-Bred International ALS3 promoter
HUP9900878A2 (hu) 1995-06-02 1999-07-28 Pioneer Hi-Bred International, Inc. Alfa-hordotionin nagy metionintartalmú származéka
WO1996038562A1 (en) 1995-06-02 1996-12-05 Pioneer Hi-Bred International, Inc. HIGH THREONINE DERIVATIVES OF α-HORDOTHIONIN
US5837876A (en) 1995-07-28 1998-11-17 North Carolina State University Root cortex specific gene promoter
US5703049A (en) 1996-02-29 1997-12-30 Pioneer Hi-Bred Int'l, Inc. High methionine derivatives of α-hordothionin for pathogen-control
BR9711795A (pt) 1996-03-26 2000-06-06 Razvant T Radulescu Peptìdeos tendo propriedades antiproliferativas
WO1998001575A1 (en) 1996-07-08 1998-01-15 Pioneer Hi-Bred International, Inc. Transformation of zygote, egg or sperm cells and recovery of transformed plants from isolated embryo sacs
US5981840A (en) 1997-01-24 1999-11-09 Pioneer Hi-Bred International, Inc. Methods for agrobacterium-mediated transformation
DE69928264T2 (de) 1998-08-20 2006-07-13 Pioneer Hi-Bred International, Inc. Samen-bevorzugende promotoren
AU4134000A (en) 1999-04-29 2000-11-17 Syngenta Limited Herbicide resistant plants
US7256322B2 (en) 1999-10-01 2007-08-14 Pioneer Hi-Bred International, Inc. Wuschel (WUS) Gene Homologs
US7517975B2 (en) 2000-09-26 2009-04-14 Pioneer Hi-Bred International, Inc. Nucleotide sequences mediating male fertility and method of using same
AU9122801A (en) 2000-09-26 2002-04-08 Pioneer Hi Bred Int Nucleotide sequences mediating male fertility and method of using same
US7612251B2 (en) 2000-09-26 2009-11-03 Pioneer Hi-Bred International, Inc. Nucleotide sequences mediating male fertility and method of using same
CN100558897C (zh) 2000-09-29 2009-11-11 辛根塔有限公司 抗除草剂植物
EP1495330B1 (en) 2002-04-12 2009-01-21 O'Dowd, Brian, F. Method of identifying transmembrane protein-interacting compounds
US7045684B1 (en) 2002-08-19 2006-05-16 Mertec, Llc Glyphosate-resistant plants
ATE420188T1 (de) 2004-02-02 2009-01-15 Pioneer Hi Bred Int Ap2-domäne-transkriptionsfaktor odp2 (ovule development protein 2) und verwendungsverfahren
AU2006282983B2 (en) 2005-08-26 2012-08-02 Dupont Nutrition Biosciences Aps Use
BRPI0814244B1 (pt) 2007-06-07 2018-10-09 Agriculture And Agri Food Canada método para obtenção de uma planta geneticamente engenheirada
US7919676B2 (en) 2007-08-03 2011-04-05 Pioneer Hi-Bred International, Inc. Msca1 nucleotide sequences impacting plant male fertility and method of using same
WO2011082318A2 (en) 2009-12-30 2011-07-07 Pioneer Hi-Bred International, Inc. Methods and compositions for the introduction and regulated expression of genes in plants
MX2013010911A (es) 2011-03-23 2015-03-03 Pioneer Hi Bred Int Metodos para producir un locus de rasgo transgenico complejo.
US20130180007A1 (en) 2012-01-06 2013-07-11 Pioneer Hi Bred International Inc Somatic Ovule Specific Promoters and Methods of Use
AR089793A1 (es) 2012-01-27 2014-09-17 Du Pont Metodos y composiciones para generar locus de rasgos transgenicos complejos
US10723806B2 (en) 2012-02-27 2020-07-28 Riken Method of introducing nucleic acid into plant cells
CA2873518A1 (en) 2012-05-18 2013-11-21 Pioneer Hi-Bred International, Inc. Inducible promoter sequences for regulated expression and methods of use
LT2800811T (lt) 2012-05-25 2017-09-11 The Regents Of The University Of California Būdai ir kompozicijos, skirti tikslinės dnr modifikavimui, panaudojant adresuotą rnr, ir transkripcijos moduliavimui, panaudojant adresuotą rnr
CN104995302B (zh) * 2013-01-16 2021-08-31 爱默蕾大学 Cas9-核酸复合物及其相关用途
US20140273235A1 (en) * 2013-03-15 2014-09-18 Regents Of The University Of Minnesota ENGINEERING PLANT GENOMES USING CRISPR/Cas SYSTEMS
CN105829536A (zh) 2013-08-22 2016-08-03 纳幕尔杜邦公司 用于在不掺入选择性转基因标记的情况下,在植物基因组中产生基因修饰的方法,以及用于这种方法的组合物
US10513711B2 (en) 2014-08-13 2019-12-24 Dupont Us Holding, Llc Genetic targeting in non-conventional yeast using an RNA-guided endonuclease
EP3215611B1 (en) 2014-11-06 2019-08-21 E. I. du Pont de Nemours and Company Peptide-mediated delivery of rna-guided endonuclease into cells
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems

Also Published As

Publication number Publication date
IL262795A (en) 2018-12-31
CA3022854A1 (en) 2017-12-21
US20200332305A1 (en) 2020-10-22
EP3469077A1 (en) 2019-04-17
WO2017218185A1 (en) 2017-12-21
MX2018014993A (es) 2019-09-06
BR112018076027A2 (pt) 2019-03-26
AU2017286122A1 (en) 2018-11-22
CN109312317A (zh) 2019-02-05
ZA201807366B (en) 2019-06-26

Similar Documents

Publication Publication Date Title
KR20190016970A (ko) 식물 게놈 변형을 위한 cpf1 엔도뉴클레아제의 용도
US20220177900A1 (en) Genome modification using guide polynucleotide/cas endonuclease systems and methods of use
EP3191595B1 (en) Generation of site-specific-integration sites for complex trait loci in corn and soybean, and methods of use
US11332752B2 (en) Use of morphogenic factors for the improvement of gene editing
US10676754B2 (en) Compositions and methods for producing plants resistant to glyphosate herbicide
US20190100745A1 (en) Novel cas systems and methods of use
KR20210104068A (ko) 게놈 편집을 위한 신규한 crispr-cas 시스템
JP2018531024A6 (ja) マーカーフリーゲノム改変のための方法および組成物
JP2018531024A (ja) マーカーフリーゲノム改変のための方法および組成物
EP3699281A1 (en) Novel cas9 systems and methods of use
CA3097963A1 (en) Methods and compositions for homology-directed repair of cas endonuclease mediated double strand breaks
KR20210099608A (ko) 게놈 편집을 통한 유전자 침묵화
CA3183409A1 (en) Large scale genome manipulation
US20200332306A1 (en) Type i-e crispr-cas systems for eukaryotic genome editing
WO2023102393A1 (en) High efficiency large scale chromosomal genome manipulation

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application