KR20210137055A - 네이티브 miRNA의 게놈 편집을 통한 표적 유전자 발현의 억제 - Google Patents

네이티브 miRNA의 게놈 편집을 통한 표적 유전자 발현의 억제 Download PDF

Info

Publication number
KR20210137055A
KR20210137055A KR1020217030021A KR20217030021A KR20210137055A KR 20210137055 A KR20210137055 A KR 20210137055A KR 1020217030021 A KR1020217030021 A KR 1020217030021A KR 20217030021 A KR20217030021 A KR 20217030021A KR 20210137055 A KR20210137055 A KR 20210137055A
Authority
KR
South Korea
Prior art keywords
sequence
plant
dna
cell
gene
Prior art date
Application number
KR1020217030021A
Other languages
English (en)
Inventor
준타오 리우
지안핑 쑤
얀후이 첸
지창 리우
시 첸
Original Assignee
신젠타 크롭 프로텍션 아게
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 신젠타 크롭 프로텍션 아게 filed Critical 신젠타 크롭 프로텍션 아게
Publication of KR20210137055A publication Critical patent/KR20210137055A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8274Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
    • C12N15/8278Sulfonylurea
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/10Seeds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1131Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8283Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for virus resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.
    • C12N2310/141MicroRNAs, miRNAs

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Virology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Physiology (AREA)
  • Botany (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

본 발명은 네이티브 miRNA의 게놈 편집에 의해 표적 유전자 발현을 감소시키거나 억제하기 위한 방법 및 조성물에 관한 것이다.

Description

네이티브 miRNA의 게놈 편집을 통한 표적 유전자 발현의 억제
서열 목록
37 C.F.R. § 1.821하에서 제출된, 크기가 47 킬로바이트인 2019년 2월 26일에 생성된 "81815_ST25.txt"라는 명칭의 ASCII 텍스트 형식의 서열 목록. 이 서열 목록은 본원에서 그의 개시를 위해 명세서 내에 참고로 포함된다.
기술분야
본 발명은 네이티브 miRNA의 게놈 편집에 의해 표적 유전자 발현을 감소시키거나 억제하기 위한 방법 및 조성물에 관한 것이다.
불완전한 헤어핀을 함유하는 더 긴 RNA(프리-miRNA)로부터 전사되고 가공되는 마이크로RNA(miRNA)는 약 20개 내지 24개 뉴클레오티드의 RNA이다. miRNA는 전사후 방식으로 이의 mRNA 표적 유전자의 발현을 정확하게 표적화하고 감소시키거나 억제할 수 있다(문헌[Yu et al. 2017, New Phytol. Volume 216(4), pages 1002-1017; Gebert and MacRae 2019, Nature Reviews Molecular Cell Biology, volume 20, pages 21-37]). miRNA 매개 유전자 발현 억제는 작은 간섭 RNA 유도 RNAi에 비해 고도로 특이적이고 효과적이다. miRNA는, 예를 들어, 인공 miRNA가 이소성으로 과발현되는 트랜스제닉 접근법(예를 들어, WO2010/123904)을 통해 병원체로부터 외인성 RNA를 표적화하기 위해 사용되어 왔다. 이러한 접근법은 효능이 있을 수 있지만; 식물의 유전적 형질 전환에 의존하게 되면, 수용 식물의 농경학적 특징 및 이점을 보존하면서 우수한 발현 수준을 나타내는 사건을 확인하기 위해 매우 많은 수의 형질 전환 사건이 필요하다. 또한 이들 사건은, 상업화가 금지되거나, 시판되기에 비용이 많이 들고 긴 규제 절차를 거쳐야 하는 유전자 변형된 유기체(GMO)인 것으로 여겨진다.
결과적으로, 표적 유전자 발현을 조절하기 위해 miRNA의 사용에 의존하는 방법을 개선할 필요가 있다.
본 개시는 네이티브 프리-miRNA에 임베딩된 20개 내지 24개 뉴클레오티드 길이의 네이티브 miRNA 코어를, 표적 유전자 서열로부터 유래되고 이에 상보적이도록 설계된 amiRNA 코어 서열로 교체하기 위해 게놈 편집을 이용하는 신규한 표적 유전자 침묵화 방법을 제공한다. 네이티브 프리-miRNA의 변형을 통해, 추가 표적 유전자 전사물에 특이적이고, 이에 의해 신규한 표현형, 예를 들어, 바이러스와 같은 해충에 대한 신규한 저항성을 부여하는 대안적인 인공 miRNA가 생성될 것이다.
본 발명은 표적 유전자의 발현을 감소시키는 방법으로서, 식물 세포에 상기 식물 세포의 네이티브 프리-miRNA를 인코딩하는 게놈 부위에서 부위-지정 DNA 절단이 가능한 뉴클레아제를 도입하는 단계, 상기 게놈 부위에서 또는 상기 게놈 부위 부근에서 적어도 하나의 이중 가닥 파손을 생성하는 단계, 상기 적어도 하나의 이중 가닥 파손이 상기 게놈 부위를 대체하는 개재 DNA로 복구된 세포를 선택하는 단계, 및 표적 유전자의 발현을 감소시키는 단계로 구성되고, 상기 개재 DNA는 상기 표적 유전자에 상보적인 amiRNA 코어 서열을 포함하는 변형된 프리-miRNA를 인코딩하는, 방법을 제공한다.
다른 이점들 중에서, 상이한 표적 유전자에 상보적이도록 네이티브 프리-miRNA를 정확하고 특이적으로 재프로그래밍하기 위해 게놈 편집 기술에 의존하는 이러한 방법은 GMO-비함유로 여겨질 수 있는 식물의 생성을 야기할 수 있는데, 그 이유는 이러한 방법이 수행된 후 식물 게놈에 외래 DNA가 남지 않도록 제한되기 때문이다.
이러한 방법의 또 다른 이점은 동일한 유전자좌에서 네이티브 miRNA의 하나의 카피 및 변형된/편집된 miRNA의 하나의 카피를 갖는 식물을 생성하는 능력에 의존한다. 이는 특히, 이후 네이티브 mRNA의 카피 및 이의 관련 생물학적 기능을 보유하면서, 관심있는 상이한 유전자를 표적화하는 새로 변형된 miRNA 카피를 발현할 수 있는 하이브리드 작물과 관련이 있다. 유전적 형질 전환에 의존하는 이전 접근법에 비해 추가 이점은 생성되는 편집된 식물 세포가 각 miRNA의 하나의 카피(네이티브 miRNA의 하나의 카피 및 amiRNA의 하나의 카피)를 지니는 반면, 종래 기술 방법에 따라 얻어진 식물 세포가 miRNA의 각 버전의 두 개의 카피(네이티브 miRNA의 두 개의 카피 및 amiRNA의 두 개의 카피)를 지니는데, 이는 식물 세포 대사에 보다 부담을 주고 잠재적으로 식물 성능에 영향을 미칠 수 있다는 사실에 입각한다.
추가의 구현예에서, 본 발명은 전술한 구현예의 방법으로서, 표적 유전자는 외인성 표적 유전자, 더욱 바람직하게는 해충 유전자, 더욱 바람직하게는 바이러스, 진균 또는 미생물 유전자인, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 표적 유전자는 부니아바이러스목(Bunyavirales) 유전자, 바람직하게는 토스포바이러스(tospovirus) 유전자, 더욱 바람직하게는 토마토 반점 시듦 바이러스(tomato spotted wilt virus; TSWV) 유전자인, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 표적 유전자는 내인성 식물 유전자인, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 표적 내인성 식물 유전자는 식물 발달, 생물학적 또는 비생물학적 스트레스에 관여하는 유전자인, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 상기 식물 세포는 가지과(Solanaceae), 옥수수, 벼, 카놀라, 대두 또는 해바라기 세포인, 방법에 관한 것이다. 추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 상기 식물 세포는 토마토 세포인, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 네이티브 프리-miRNA를 인코딩하는 상기 게놈 부위는 네이티브 토마토 프리-miRNA를 인코딩하는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 상기 게놈 부위는 SEQ ID NO: 6 또는 SEQ ID NO: 7을 포함하는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 상기 개재 DNA는 SEQ ID NO: 1 내지 SEQ ID NO: 5 중 어느 하나를 포함하는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 상기 뉴클레아제는 메가뉴클레아제(MN), 징크-핑거 뉴클레아제(ZFN), 전사-활성자 유사 이펙터 뉴클레아제(TALEN), Cas9 뉴클레아제, Cfp1 뉴클레아제, dCas9-FokI, dCpf1-FokI, 키메라 Cas9/Cpf1-시티딘 데아미나제, 키메라 Cas9/Cpf1-아데닌 데아미나제, 키메라 FEN1-FokI, 및 Mega-TAL, 닉카제 Cas9(nCas9), 키메라 dCas9 비-FokI 뉴클레아제 및 dCpf1 비-FokI 뉴클레아제로 구성된 군으로부터 선택되는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 상기 세포는 반수체, 이배체, 배수체, 또는 헥시포이드 게놈을 갖는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 상기 세포는 변형된 프리-miRNA에 대해 이형접합인, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 하나 이상의 가이드 서열은 상기 뉴클레아제와 함께 도입되는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법에 의해 수득된 식물 세포, 바람직하게는 가지과, 옥수수, 벼, 카놀라, 대두 또는 해바라기 세포, 더욱 바람직하게는 토마토 식물 세포에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예의 식물 세포로서, 상기 세포는 SEQ ID NO: 1 내지 SEQ ID NO: 5 중 어느 하나를 포함하는, 식물 세포에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예의 식물 세포로서, 상기 세포는 SEQ ID NO: 8 내지 SEQ ID NO: 17 중 어느 하나를 포함하는, 식물 세포에 관한 것이다.
추가의 구현예에서, 본 발명은 식물 종자, 바람직하게는 가지과, 옥수수, 벼, 카놀라, 대두 또는 해바라기 종자, 더욱 바람직하게는 토마토 종자를 생산하는 방법으로서, 전술한 구현예 중 어느 하나의 방법에 의해 수득된 식물 세포를 포함하는 식물을 그 자체와 또는 동일한 작물의 또 다른 식물과 교배하는 단계를 포함하는, 방법에 관한 것이다.
도 1은 새로운 표적 유전자에 상보적인 amiRNA 코어에 대한 네이티브 miRNA 코어의 교체에 의한 네이티브 프리-miRNA 변형의 도식적 표현을 나타낸 것이다.
도 2는 상이한 과발현된 바이러스 amiRNA 코어 서열을 갖는 니코티아나 벤타미아나(Nicotiana benthamiana) 식물에서의 TSWV 저항성의 수준을 나타낸 것이다.
도 3은 상이한 과발현된 바이러스 amiRNA 코어 서열을 갖는 TSWV-침투 니코티아나 벤타미아나 식물의 사진을 나타낸 것이다.
도 4는 SEQ ID NO: 2의 바이러스 amiRNA 코어로 변형된 상이한 네이티브 프리-miRNA 서열을 갖는 니코티아나 벤타미아나 식물에서의 TSWV 저항성의 수준을 나타낸 것이다.
도 5는 니코티아나 벤타미아나 식물에서의 일과성 실험에 대한 이원 벡터 17839(SEQ ID NO: 18)를 나타낸 것이다.
도 6은 토마토 SlmiR156b 유전자(SEQ ID NO: 6)를 돌연변이시키기 위한 구성적 prAtEF1aA1-02 프로모터에 의해 구동되는 대두 코돈 최적화된 Cas9, 및 prAtU6-01 및 prSlU6에 의해 구동되는 두 개의 유전자 특이적 gRNA를 이용한 토마토 형질 전환에 대한 이원 벡터 24598(SEQ ID NO: 19)을 나타낸 것이다.
서열 목록의 서열에 대한 간략한 설명
SEQ ID NO: 1은 amiTSWV_N1w_PC의 TSWV 서열이다(본 발명의 맥락에서 amiRNA 코어로서 사용됨).
SEQ ID NO: 2는 amiTSWV_N2_PC의 TSWV 서열이다(본 발명의 맥락에서 amiRNA 코어로서 사용됨).
SEQ ID NO: 3은 amiTSWV_N2_PC_rev의 TSWV 서열이다(본 발명의 맥락에서 amiRNA 코어로서 사용됨).
SEQ ID NO: 4는 amiR159a_3p_N_GC35의 TSWV 서열이다(본 발명의 맥락에서 amiRNA 코어로서 사용됨).
SEQ ID NO: 5는 amiR159a_3p_N_GC50의 TSWV 서열이다(본 발명의 맥락에서 amiRNA 코어로서 사용됨).
SEQ ID NO: 6은 1 kb 프로모터가 포함된 miR156b의 토마토 서열이다(본 발명의 맥락에서 프리-miRNA 스캐폴드로서 사용됨).
SEQ ID NO: 7은 1 kb 프로모터가 포함된 miR1919b의 토마토 서열이다(본 발명의 맥락에서 프리-miRNA 스캐폴드로서 사용됨).
SEQ ID NO: 8 내지 SEQ ID NO: 12는 SEQ ID NO: 6 내에 각각 임베딩된 SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4 또는 SEQ ID NO: 5이다.
SEQ ID NO: 13 내지 SEQ ID NO: 17은 SEQ ID NO: 7 내에 각각 임베딩된 SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4 또는 SEQ ID NO: 5이다.
SEQ ID NO. 18은 이원 벡터 17839의 뉴클레오티드 서열이다.
SEQ ID NO. 19는 이원 벡터 24598의 뉴클레오티드 서열이다.
SEQ ID NO: 20 및 SEQ ID NO: 21은 gRNA 서열이다.
SEQ ID NO: 22는 amiTSWV_N1w_PC_rev의 TSWV 서열이다(본 발명의 맥락에서 amiRNA 코어로서 사용됨).
SEQ ID NO: 23은 amiR159a_3p_N_GC35_rev의 TSWV 서열이다(본 발명의 맥락에서 amiRNA 코어로서 사용됨).
SEQ ID NO: 24는 amiR159a_3p_N_GC50의 TSWV 서열이다(본 발명의 맥락에서 amiRNA 코어로서 사용됨).
이 설명은 본 발명이 구현될 수 있는 모든 다양한 방식 또는 본 발명에 추가될 수 있는 모든 특징의 상세한 카탈로그임을 뜻하는 것은 아니다. 예를 들어, 일 구현예에 대해 예시된 특징은 다른 구현예에 통합될 수 있고, 특정 구현예에 대해 예시된 특징은 그 구현예로부터 삭제될 수 있다. 또한, 본원에 제시된 다양한 구현예로의 많은 변화 및 추가가 본 개시를 고려하여 당업자에게 명백할 것이며, 이는 본 발명을 벗어나지 않는다. 따라서, 하기 설명은 본 발명의 일부 특정 구현예를 예시하고자 하는 것이며, 그의 모든 순열, 조합 및 변화를 망라적으로 명시하고자 하는 것이 아니다.
달리 정의되지 않는 한, 본원에 사용되는 모든 기술적 및 학술적 용어는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본원의 발명의 설명에 사용된 용어는 특정 구현예를 설명하기 위한 것이며 본 발명을 제한하려는 것이 아니다. 본원에 언급된 모든 간행물, 특허 출원, 특허, 및 기타 참고 문헌은 그 전체가 참고로 포함된다.
하기 정의 및 방법은 본 발명을 더 잘 규정하고 본 발명의 실시에 있어서 당업자를 안내하기 위해 제공된다. 달리 언급되지 않는 한, 본 명세서에 사용된 용어는 관련 기술 분야의 통상의 지식을 가진 자에 의해 통상적인 용법에 따라 이해되어야 한다. 분자 생물학의 일반 용어의 정의는 문헌[Rieger et al., Glossary of Genetics: Classical and Molecular, 5th edition, Springer-Verlag, New York, 1994]에서도 찾을 수 있다.
본 발명의 구현예의 설명 및 첨부된 청구 범위에 사용된 바와 같이, 단수 형태는 문맥이 달리 명확하게 지시하지 않는 한 복수 형태도 포함하도록 하고자 한다.
본원에 사용되는 바와 같이, "및/또는"은 하나 이상의 열거된 관련 항목들의 임의의 및 모든 가능한 조합을 지칭하고 이를 포함한다.
화합물의 양, 용량, 시간, 온도 등과 같은 측정 가능한 값을 지칭할 때 본원에 사용되는 바와 같은 용어 "약"은 명시된 양의 20%, 10%, 5%, 1%, 0.5%, 또는 심지어 0.1%의 변화를 포함하는 것을 의미한다.
본 명세서에서 사용될 때 "포함하다(comprise)", "포함하다(comprises)" 및/또는 "포함하는(comprising)"이라는 용어는 언급된 특징, 정수, 단계, 동작, 요소, 및/또는 구성 요소의 존재를 명시하지만, 하나 이상의 다른 특징, 정수, 단계, 동작, 요소, 구성 요소, 및/또는 그들의 그룹의 존재 또는 추가를 배제하지 않는다.
본원에 사용되는 바와 같이, "본질적으로 구성되는(consisting essentially of)"이라는 이행 문구는 청구항의 범주가 청구항에 언급된 특정 재료 또는 단계 및 청구된 발명의 기본 및 신규 특성(들)에 실질적으로 영향을 미치지 않는 재료 또는 단계를 포함하도록 해석되어야 함을 의미한다. 따라서, 본 발명의 청구항에 사용될 때 "본질적으로 구성되는"이라는 용어는 "포함하는"과 동등한 것으로 해석되는 것을 뜻하지 않는다.
본원에 사용되는 바와 같이, 용어 "증폭된"은 핵산 분자 중 적어도 하나를 주형으로 사용하여 핵산 분자의 다수의 카피 또는 핵산 분자에 상보적인 다수의 카피가 작제됨을 의미한다. 예를 들어, 문헌[Diagnostic Molecular Microbiology: Principles and Applications, D. H. Persing et al., Ed., American Society for Microbiology, Washington, D.C. (1993)]을 참조한다. 증폭의 산물은 앰플리콘으로 명명된다.
"코딩 서열"은 mRNA, rRNA, tRNA, snRNA, 센스 RNA 또는 안티센스 RNA와 같은 RNA로 전사되는 핵산 서열이다. 일부 구현예에서, RNA는 이어서 유기체에서 번역되어 단백질을 생성한다.
본원에 사용되는 바와 같은 트랜스제닉 "사건"이라는 용어는 이종 DNA를 갖는 단일 식물 세포의 형질 전환 및 재생, 예를 들어, 관심있는 하나 이상의 유전자(예를 들어, 트랜스진)를 포함하는 발현 카세트에 의해 생산된 재조합 식물을 지칭한다. 용어 "사건"은 본래의 형질 전환체 및/또는 이종 DNA를 포함하는 형질 전환체의 자손을 지칭한다. 용어 "사건"은 또한 형질 전환체와 또 다른 계통 사이의 성적 교배에 의해 생산된 자손을 지칭한다. 반복친에 대한 반복적인 역교배 후에도, 형질 전환된 모체로부터 삽입된 DNA 및 측접한 DNA는 동일한 염색체 위치에서 교배의 자손에 존재한다. 정상적으로, 식물 조직의 형질 전환은, 각각 식물 세포 게놈에서 상이한 위치에 DNA 작제물을 삽입하는 것을 나타내는 여러 사건을 생성한다. 트랜스진의 발현 또는 기타 바람직한 특성에 기초하여, 특정 사건이 선택된다. 따라서, 본원에 사용되는 바와 같은 "사건 MIR604," "MIR604" 또는 "MIR604 사건"은 본래의 MIR604 형질 전환체 및/또는 MIR604 형질 전환체의 자손을 의미한다(본원에 참고로 포함된 미국 특허 제7,361,813호, 제7,897,748호, 제8,354,519호, 및 제8,884,102호).
본원에 사용되는 바와 같은 "발현 카세트"는, 종결 신호에 작동 가능하게 연결된 관심있는 뉴클레오티드 서열, 전형적으로 코딩 영역에 작동 가능하게 연결된 프로모터를 포함하는, 적절한 숙주 세포에서 특정 뉴클레오티드 서열의 발현을 지시할 수 있는 핵산 분자를 의미한다. 이는 또한 전형적으로 뉴클레오티드 서열의 적절한 번역에 필요한 서열을 포함한다. 코딩 영역은 일반적으로 관심있는 단백질을 코딩하지만, 관심있는 기능적 RNA, 예를 들어 안티센스 RNA 또는 비번역 RNA도 코딩할 수 있다. 발현 카세트는 또한 관심있는 뉴클레오티드 서열의 직접적인 발현에 필요하지 않지만 발현 벡터로부터의 카세트의 제거를 위한 편리한 제한 부위로 인해 존재하는 서열을 포함할 수 있다. 관심있는 뉴클레오티드 서열을 포함하는 발현 카세트는 키메라일 수 있으며, 이는 그의 구성 요소들 중 적어도 하나가 그의 다른 구성 요소들 중 적어도 하나에 대해 이종성임을 의미한다. 발현 카세트는 또한, 자연 발생적이지만 이종성 발현에 유용한 재조합 형태로 수득된 것일 수 있다. 그러나, 전형적으로, 발현 카세트는 숙주에 대해 이종성이며, 즉, 발현 카세트의 특정 핵산 서열은 숙주 세포에서 자연적으로 발생하지 않은 것이며 당업계에 알려진 형질 전환 과정에 의해 숙주 세포 또는 숙주 세포의 조상에 도입되었던 것이어야 한다. 발현 카세트에서 뉴클레오티드 서열의 발현은 항시성 프로모터의 제어, 또는 숙주 세포가 어떤 특정 외부 자극에 노출된 경우에만 전사를 개시하는 유도성 프로모터의 제어하에 있을 수 있다. 식물과 같은 다세포 유기체의 경우, 프로모터는 또한 특정 조직, 또는 기관, 또는 발달기에 특이적일 수 있다. 발현 카세트 또는 그의 단편은 또한 식물 내로 형질 전환될 때 "삽입된 서열" 또는 "삽입 서열"로 지칭될 수 있다.
"유전자"는, 게놈 내에 위치하며, 앞서 언급된 코딩 핵산 서열 외에, 코딩 부분의 발현, 즉, 전사 및 번역의 제어를 담당하는 주로 조절 핵산 서열인 다른 핵산 서열을 포함하는 규정된 영역이다. 유전자는 코딩 및 비-코딩 영역(예를 들어, 인트론, 조절 요소, 프로모터, 인핸서, 종결 서열 및 5' 및 3' 비번역 영역) 둘 모두를 포함할 수 있다. 유전자는 전형적으로 mRNA, 기능성 RNA, 또는 조절 서열을 포함하는 특정 단백질을 발현한다. 유전자는 기능성 단백질을 생성하는 데 사용 가능하거나 사용 가능하지 않을 수 있다. 일부 구현예에서, 유전자는 코딩 영역만을 지칭한다. 용어 "천연 유전자"는 자연계에서 발견되는 유전자를 지칭한다. 용어 "키메라 유전자"는 1) 자연계에서 함께 발견되지 않는 조절 및 코딩 서열을 포함하는 DNA 서열, 또는 2) 자연적으로 결합되지 않은 단백질의 일부를 인코딩하는 서열, 또는 3) 자연적으로 결합되지 않은 프로모터의 일부를 함유하는 임의의 유전자를 지칭한다. 따라서, 키메라 유전자는 상이한 공급원으로부터 유래된 조절 서열 및 코딩 서열을 포함할 수 있거나, 동일한 공급원으로부터 유래되지만 자연계에서 발견되는 것과 상이한 방식으로 배열된 조절 서열 및 코딩 서열을 포함할 수 있다. 유전자는 "분리"될 수 있으며, 이는 정상적으로 자연 상태에서 핵산 분자와 결부된 상태로 발견되는 구성 요소가 실질적으로 또는 본질적으로 없는 핵산 분자를 의미한다. 그러한 구성 요소는 다른 세포 물질, 재조합 생산으로부터의 배양 배지, 및/또는 핵산 분자를 화학적으로 합성하는 데 사용되는 다양한 화학 물질을 포함한다.
폴리뉴클레오티드 코딩 서열을 "발현하는" 또는 그의 "발현"이라는 용어는 서열이 전사되고 선택적으로 번역됨을 의미한다.
"관심있는 유전자", "관심있는 뉴클레오티드 서열" 또는 "관심있는 서열"은 식물로 전달될 때 식물에 항생제 저항성, 바이러스 저항성, 곤충 저항성, 질병 저항성, 또는 다른 해충에 대한 저항성, 제초제 내성, 영양가 개선, 산업적 공정에서의 성능 개선 또는 생식 능력 변경과 같은 원하는 특성을 부여하는 임의의 유전자를 지칭한다. "관심있는 유전자"는 또한 식물에서 상업적으로 가치있는 효소 또는 대사 산물의 생산을 위해 식물로 전달되는 것일 수 있다.
본원에 사용되는 바와 같이, "외인성"은, 자연 발생적 핵산 서열의 다수의 비-자연 발생적 카피를 포함하는, 또 다른 종으로부터 유래하거나 동일한 종 또는 유기체로부터 비롯되지만 원래 형태 또는 세포에서 주로 발현되는 형태로부터 변형된, 도입되는 숙주 세포와 자연적으로 결부되어 있지 않은 핵산 분자 또는 뉴클레오티드 서열을 지칭한다. 따라서, 뉴클레오티드 서열이 도입된 세포와 상이한 유기체 또는 종으로부터 유래된 뉴클레오티드 서열은 그 세포 및 세포의 후손에 대해 이종성이다. 또한, 이종성 뉴클레오티드 서열은, 동일한 천연의 원래 세포 유형으로부터 유래되어 그로 삽입되지만 비천연 상태로 존재하는, 예를 들어, 핵산 분자의 천연 상태에서 발견되는 것과 상이한 카피 수로 존재하고/하거나 상이한 조절 서열의 제어하에 있는 뉴클레오티드 서열을 포함한다. 핵산 서열은 또한, 예를 들어 발현 벡터와 같은 핵산 작제물에서 이것이 결부될 수 있는 다른 핵산 서열에 이종성일 수 있다. 하나의 비-제한적 예로서, 프로모터는, 그 특정 프로모터와 결부된 상태로 자연적으로 발생하지 않는, 즉, 프로모터에 대해 이종성인 하나 이상의 조절 요소 및/또는 코딩 서열과 조합되어 핵산 작제물에 존재할 수 있다.
"상동성" 핵산 서열은 이것이 도입되는 숙주 세포와 자연적으로 결부된 핵산 서열이다. 상동성 핵산 서열은 또한, 예를 들어, 핵산 작제물에 존재할 수 있는 다른 핵산 서열과 자연적으로 결부된 핵산 서열일 수 있다. 하나의 비-제한적 예로서, 프로모터는, 그 특정 프로모터와 결부된 상태로 자연적으로 발생하는, 즉, 프로모터에 대해 상동성인 하나 이상의 조절 요소 및/또는 코딩 서열과 조합되어 핵산 작제물에 존재할 수 있다.
"작동 가능하게 연결된"은 단일 핵산 서열 상에서 핵산 서열들이 결부됨으로써 하나의 핵산 서열의 기능이 다른 하나의 핵산 서열의 기능에 영향을 미침을 지칭한다. 예를 들어, 프로모터는 이것이 코딩 서열 또는 기능적 RNA의 발현에 영향을 미칠 수 있는(즉, 코딩 서열 또는 기능적 RNA가 프로모터의 전사 제어하에 있는) 경우 그 코딩 서열 또는 기능적 RNA와 작동 가능하게 연결된 것이다. 센스 또는 안티센스 배향의 코딩 서열은 조절 서열에 작동 가능하게 연결될 수 있다. 따라서, 뉴클레오티드 서열과 작동적으로 결부된 조절 또는 제어 서열(예를 들어, 프로모터)은 뉴클레오티드 서열의 발현을 수행할 수 있다. 예를 들어, GFP를 인코딩하는 뉴클레오티드 서열에 작동 가능하게 연결된 프로모터는 그 GFP 뉴클레오티드 서열의 발현을 수행할 수 있을 것이다.
제어 서열은 관심있는 뉴클레오티드 서열의 발현을 지시하는 기능을 하는 한 그 뉴클레오티드 서열과 인접할 필요는 없다. 따라서, 예를 들어, 번역되지 않았지만 전사된 개재 서열이 프로모터와 코딩 서열 사이에 존재할 수 있고, 프로모터 서열은 여전히 코딩 서열에 "작동 가능하게 연결된"것으로 간주될 수 있다.
본원에 사용되는 바와 같은 "프라이머"는, 핵산 하이브리드화에 의해 상보적 표적 DNA 가닥에 어닐링되어 프라이머와 표적 DNA 가닥 사이에 하이브리드를 형성하고, 이어서 DNA 중합 효소와 같은 중합 효소에 의해 표적 DNA 가닥을 따라 신장되는 분리된 핵산이다. 프라이머 쌍 또는 세트는, 예를 들어, 중합 효소 연쇄 반응(PCR) 또는 다른 핵산 증폭 방법에 의한 핵산 분자의 증폭에 사용될 수 있다.
"프로브"는 표적 핵산 분자의 일부에 상보적인 분리된 핵산 분자이며, 전형적으로 표적 핵산 분자를 검출하고/하거나 정량화하는 데 사용된다. 따라서, 일부 구현예에서, 프로브는 방사성 동위 원소, 리간드, 화학 발광제, 형광제 또는 효소와 같은 검출 가능한 모이어티 또는 리포터 분자가 부착된 분리된 핵산 분자일 수 있다. 본 발명에 따른 프로브는 데옥시리보핵산 또는 리보핵산뿐만 아니라 폴리아미드, 및 표적 핵산 서열에 특이적으로 결합하는 다른 프로브 물질을 포함할 수 있으며, 그 표적 핵산의 존재를 검출하고/하거나 그 표적 핵산의 양을 정량화하는 데 사용될 수 있다.
TaqMan 프로브는 특이적 프라이머 세트에 의해 증폭된 DNA 영역 내에서 어닐링되도록 설계된다. Taq 중합 효소가 프라이머를 신장시키고 상보적 가닥의 3'에서 5'로 단일-가닥 주형으로부터 초기 가닥을 합성함에 따라, 중합 효소의 5'→3' 엑소뉴클레아제는 프로브를 통해 초기 가닥을 신장시키고 결과적으로 주형에 어닐링된 프로브를 분해한다. 프로브의 분해는 그로부터 형광단을 방출하고 켄처에 대한 밀접 근접성을 깨뜨림으로써 켄칭 효과를 완화하고 형광단의 형광을 허용한다. 따라서, 정량적 PCR 써멀 사이클러(thermal cycler)에서 검출된 형광은 방출된 형광단, 및 PCR에 존재하는 DNA 주형의 양에 정비례한다.
프라이머 및 프로브는 일반적으로 길이가 5개 내지 100개 이상의 뉴클레오티드 길이이다. 일부 구현예에서, 프라이머 및 프로브는 적어도 20개 이상의 뉴클레오티드 길이, 또는 적어도 25개 이상의 뉴클레오티드 길이, 또는 적어도 30개 이상의 뉴클레오티드 길이일 수 있다. 그러한 프라이머 및 프로브는 당업계에 알려진 바와 같은 최적의 하이브리드화 조건하에서 표적 서열에 특이적으로 하이브리드화된다. 본 발명에 따른 프라이머 및 프로브는 표적 서열과의 완전한 서열 상보성을 가질 수 있지만, 표적 서열과 다르며 표적 서열에 하이브리드화되는 능력을 보유하는 프로브가 본 발명에 따른 통상적인 방법에 의해 설계될 수 있다.
프로브 및 프라이머를 제조하고 사용하는 방법은, 예를 들어, 문헌[Molecular Cloning: A Laboratory Manual, 2nd ed., vol. 1-3, ed. Sambrook et al., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989]에 기술되어 있다. PCR-프라이머 쌍은, 예를 들어, 그 목적을 위해 의도된 컴퓨터 프로그램을 사용함으로써 알려진 서열로부터 유도될 수 있다.
중합 효소 연쇄 반응(PCR)은 특정 DNA 조각을 "증폭"시키는 기법이다. PCR을 수행하기 위해서는, 복제하려는 DNA 분자의 뉴클레오티드 서열의 적어도 일부가 알려져 있어야 한다. 일반적으로, 증폭하려는 DNA의 각 가닥의 3' 말단에 있는 뉴클레오티드 서열(알려진 서열)에 상보적인(예를 들어, 실질적으로 상보적이거나 완전히 상보적인) 프라이머 또는 짧은 올리고뉴클레오티드가 사용된다. DNA 샘플을 가열하여 그의 가닥들을 분리하고, 이를 프라이머와 혼합한다. 프라이머들은 DNA 샘플에서 그들의 상보적 서열에 하이브리드화된다. 합성은 원래 DNA 가닥을 주형으로 사용하여 (5'에서 3' 방향으로) 시작된다. 반응 혼합물은 4개의 데옥시뉴클레오티드 트리포스페이트(dATP, dCTP, dGTP 및 dTTP) 및 DNA 중합 효소를 모두 함유해야 한다. 중합은 새로 합성된 각 가닥이 다른 프라이머에 의해 인식되는 서열을 포함할 정도로 충분히 진행될 때까지 계속된다. 일단 이것이 발생하면, 원래 분자와 동일한 2개의 DNA 분자가 생성된다. 이러한 2개의 분자를 가열하여 그들의 가닥을 분리하고, 과정을 반복한다. 각 사이클은 DNA 분자의 수를 배증시킨다. 자동화된 장비를 사용하면, 각 복제 사이클이 5분 미만 내에 완료될 수 있다. 30회 사이클 후, DNA의 단일 분자로 시작된 것이 10억 개(230 = 1.02 x 109) 초과의 카피로 증폭되었다.
올리고뉴클레오티드 프라이머 쌍의 올리고뉴클레오티드는, 반대 DNA 가닥에 위치하고 증폭될 영역에 측접한 DNA 서열에 상보적이다. 어닐링된 프라이머는 새로 합성된 DNA 가닥에 하이브리드화된다. 제1 증폭 사이클은 5' 말단이 올리고뉴클레오티드 프라이머의 위치에 의해 고정되지만 3' 말단이 가변적인(‘고르지 않은' 3' 말단) 두 개의 새로운 DNA 가닥을 생성할 것이다. 두 개의 새로운 가닥은 결국 요망되는 길이의 상보적 가닥의 합성을 위한 주형으로서 작용할 수 있다(5' 말단은 프라이머에 의해 한정되고, 3' 말단은 고정되는데, 그 이유는 합성이 반대 프라이머의 말단을 지나 진행될 수 없기 때문이다). 몇 사이클 후에, 요망되는 고정된 길이의 산물이 우세하기 시작한다.
실시간 중합 효소 연쇄 반응으로도 지칭되는 정량적 중합 효소 연쇄 반응(qPCR)은 실시간으로 PCR 반응으로부터의 DNA 산물의 축적을 모니터링한다. qPCR은 중합 효소 연쇄 반응(PCR)에 기반한 분자 생물학의 실험실용 기법으로서, 표적화된 DNA 분자를 증폭하고 동시에 정량화하는 데 사용된다. 특정 서열의 1개 카피라도 PCR에서 증폭되어 검출될 수 있다. PCR 반응은 DNA 주형의 카피를 기하급수적으로 생성한다. 이는 출발 표적 서열의 양과 임의의 특정 사이클에서 축적된 PCR 산물의 양 사이의 정량적 관계를 초래한다. 주형과 함께 발견되는 중합 효소 반응의 억제제, 시약 제한 또는 피로포스페이트 분자의 축적으로 인해, PCR 반응은 결국 기하급수적 속도로 주형 생성을 멈추며(즉, 안정기), 이는 PCR 산물의 종점 정량화를 신뢰할 수 없게 한다. 따라서, 중복(duplicate) 반응은 가변적인 양의 PCR 산물을 생성할 수 있다. PCR 반응의 대수기 동안에만 주형 서열의 출발 수량을 결정하기 위해 역외삽에 의해 추정하는 것이 가능하다. PCR 산물이 축적됨에 따른 그의 측정(즉, 실시간 정량적 PCR)은 반응의 대수기에서의 정량화를 가능하게 하며, 그에 따라 통상적인 PCR과 관련된 가변성을 제거한다. 실시간 PCR 검정에서, 양성 반응은 형광 신호의 축적에 의해 검출된다. DNA 샘플 내의 하나 이상의 특정 서열에 대해, 정량적 PCR은 검출 및 정량화 둘 모두를 가능하게 한다. 수량은 절대 카피 수, 또는 DNA 입력 또는 추가 정규화 유전자에 대해 정규화될 때의 상대적인 양일 수 있다. 실시간 PCR이 최초로 기록된 이래로, 이는 mRNA 발현 연구, 게놈 또는 바이러스 DNA에서 DNA 카피 수 측정, 대립 형질 식별 검정, 유전자의 특정 스플라이스 변이체의 발현 분석 및 파라핀-포매 조직 및 레이저 포획된 미세-절제 세포에서의 유전자 발현을 포함하는 점점 더 많은 다양한 응용 분야에 사용되어 왔다.
본원에 사용되는 바와 같이, "Ct 값"이라는 문구는 "증폭된 표적의 양이 고정된 임계값에 이르는 부분 사이클 수"로서 규정되는 "임계 사이클"을 지칭한다. 일부 구현예에서, 이는 증폭 곡선과 임계선 사이의 교차점을 나타낸다. 증폭 곡선은 전형적으로 주어진 사이클(X-축)에서 각 반응의 상대 형광 변화(Y-축)를 지시하는 "S" 모양이며, 이는 일부 구현예에서 PCR 동안 실시간 PCR 기기에 의해 기록된다. 임계선은 일부 구현예에서 반응이 배경보다 높은 형광 강도에 이르는 검출 수준이다. 문헌[Livak & Schmittgen (2001) 25 Methods 402-408]을 참조한다. 이는 PCR에서 표적의 농도의 상대 척도이다. 일반적으로, qPCR과 같은 정량적 검정에 대한 우수한 Ct 값은 일부 구현예에서, 주어진 참조 유전자의 경우 10 내지 40의 범위이다. Ct 수준은 샘플 중 표적 핵산의 양에 반비례한다(즉, Ct 수준이 낮을수록 샘플에서 검출 가능한 표적 핵산의 양이 많아진다). 추가적으로, qPCR과 같은 정량적 검정에 대한 우수한 Ct 값은 표적 gDNA의 비례 희석으로 선형 반응 범위를 나타낸다.
일부 구현예에서, qPCR은 Ct 값이 정량적 분석에 대하여 실시간으로 수집될 수 있는 조건 하에 수행된다. 예를 들어, 전형적인 qPCR 실험에서, DNA 증폭은 확장기 동안 PCR의 각 사이클에 모니터링된다. 형광의 양은 일반적으로 DNA가 증폭의 로그 선형 단계에 있을 때 배경보다 높게 증가한다. 일부 구현예에서, 이 시점에 Ct 값이 수집된다.
본원에 사용되는 바와 같이, 용어 "세포"는 임의의 살아있는 세포를 지칭한다. 세포는 원핵 또는 진핵 세포일 수 있다. 세포는 분리된 것일 수 있다. 세포는 유기체로 재생될 수 있거나 재생되지 않을 수 있다. 세포는 조직, 캘러스, 배양물, 기관, 또는 부분과 관련하여 존재할 수 있다. 일부 구현예에서, 세포는 식물 세포일 수 있다. 본 발명의 식물 세포는 분리된 단일 세포의 형태로 존재할 수 있거나, 배양된 세포일 수 있거나, 예를 들어 식물 조직 또는 식물 기관과 같은 상위-체계 단위의 일부일 수 있다. 식물 세포는 속씨식물 또는 겉씨식물로부터 유래되거나 그 일부일 수 있다. 추가 구현예에서, 식물 세포는 외떡잎 식물 세포, 쌍떡잎 식물 세포일 수 있다. 외떡잎 식물 세포는, 예를 들어, 메이즈(maize), 벼, 수수, 사탕 수수, 보리, 밀, 귀리, 떼잔디(turf grass), 또는 장식용 잔디 세포일 수 있다. 쌍떡잎 식물 세포는, 예를 들어, 담배, 후추, 가지, 해바라기, 십자화과 식물, 아마, 감자, 면화, 대두, 슈가 비(sugar bee), 또는 유채 세포일 수 있다.
본원에 사용된 바와 같은 용어 "식물 부분"은 배아, 꽃가루, 밑씨, 종자, 잎, 줄기, 싹, 꽃, 가지, 열매, 속씨, 이삭, 속대, 겉껍질, 대(stalk), 뿌리, 뿌리 끝, 꽃밥, 식물 및/또는 식물의 일부에서 온전한 식물 세포를 비롯한 식물 세포, 식물 원형질체, 식물 조직, 식물 세포 조직 배양, 식물 캘리, 식물 클럼프 등을 포함하지만, 이로 한정되지 않는다. 본원에 사용되는 바와 같이, "싹"은 잎과 줄기를 포함하는 지상 부분을 지칭한다. 또한, 본원에 사용되는 바와 같이, "식물 세포"는 세포벽을 포함하는 식물의 구조적 및 생리학적 단위를 지칭하며, 원형질체를 또한 지칭할 수 있다.
세포, 원핵 세포, 박테리아 세포, 진핵 세포, 식물 세포, 식물 및/또는 식물 부분과 관련하여 용어 "도입하는(introducing)" 또는 "도입하다(introduce)"는, 핵산 분자가 세포, 진핵 세포, 식물 세포 및/또는 식물 및/또는 식물 부분의 세포의 내부에 접근하게 하는 방식으로, 핵산 분자를 세포, 진핵 세포, 식물, 식물 부분, 및/또는 식물 세포와 접촉시키는 것을 의미한다. 하나 초과의 핵산 분자가 도입되어야 하는 경우, 이들 핵산 분자는 단일 폴리뉴클레오티드 또는 핵산 작제물의 일부로서 조립되거나 별개의 폴리뉴클레오티드 또는 핵산 작제물로서 조립될 수 있으며, 동일하거나 상이한 핵산 작제물 상에 위치할 수 있다. 따라서, 이들 폴리뉴클레오티드는 단일 형질 전환 사건으로, 별개의 형질 전환 사건으로, 또는 예를 들어, 통상적인 교배를 통한 육종 프로토콜의 일부로서 식물 세포에 도입될 수 있다.
"역위"는 염색체의 한 세그먼트의 말단과 말단이 역전되는 염색체 재배열이다. 역위는 단일 염색체가 그 자체 내에서 절단 및 재배열을 거칠 때 발생한다. 염색체 "전좌"는 비-상동 염색체 사이 부분의 재배열이다.
본원에 사용되는 바와 같이, 용어 "형질 전환된" 및 "트랜스제닉"은, 적어도 하나의 재조합(예를 들어, 이종성) 폴리뉴클레오티드의 전부 또는 일부를 함유하는 임의의 세포, 원핵 세포, 진핵 세포, 식물, 식물 세포, 캘러스, 식물 조직, 또는 식물 부분을 지칭한다. 일부 구현예에서, 재조합 폴리뉴클레오티드의 전부 또는 일부는 염색체 또는 안정한 염색체 외 요소에 안정적으로 통합되며, 그에 따라 후속 세대로 전달된다. 본 발명의 목적을 위해, 용어 "재조합 폴리뉴클레오티드"는 유전자 조작에 의해 변경되거나, 재배열되거나, 변형된 폴리뉴클레오티드를 지칭한다. 예에는 이종성 서열에 연결되거나 결합된 임의의 클로닝된 폴리뉴클레오티드 또는 폴리뉴클레오티드들이 포함된다. 용어 "재조합"은 자연 발생적 사건, 예컨대 자발적 돌연변이에 기인하거나, 비-자발적 돌연변이 유발에 이은 선택적 육종에 기인한 폴리뉴클레오티드의 변경을 지칭하지 않는다.
본원에 사용되는 바와 같은 용어 "형질 전환"은 세포로의 이종성 핵산의 도입을 지칭한다. 세포의 형질 전환은 안정적이거나 일시적일 수 있다. 따라서, 본 발명의 트랜스제닉 세포, 식물 세포, 식물 및/또는 식물 부분은 안정적으로 형질 전환되거나 일시적으로 형질 전환될 수 있다. 형질 전환은, 유전자적으로 안정한 유전을 초래하는, 숙주 세포의 게놈 내로의 핵산 분자의 전달을 지칭할 수 있다. 일부 구현예에서, 식물, 식물 부분 및/또는 식물 세포로의 도입은 박테리아-매개 형질 전환, 입자 충격 형질 전환, 칼슘-포스페이트-매개 형질 전환, 사이클로덱스트린-매개 형질 전환, 전기 천공, 리포솜-매개 형질 전환, 나노 입자-매개 형질 전환, 중합체-매개 형질 전환, 바이러스-매개 핵산 전달, 위스커(whisker)-매개 핵산 전달, 미세 주입, 초음파 처리, 침투, 폴리에틸렌 글리콜-매개 형질 전환, 원형질체 형질 전환, 또는 식물, 식물 부분 및/또는 그의 세포로의 핵산의 도입을 초래하는 임의의 다른 전기적, 화학적, 물리적 및/또는 생물학적 메커니즘, 또는 그들의 임의의 조합을 통해 이루어진다.
식물을 형질 전환하는 절차는 당업계에 잘 알려져 있고 일상적이며, 문헌 전반에 걸쳐 기술되어 있다. 식물의 형질 전환을 위한 방법의 비-제한적 예에는 (예를 들어, 아그로박테리움 속 박테리아를 통한) 박테리아-매개 핵산 전달, 바이러스-매개 핵산 전달, 탄화 규소 또는 핵산 위스커-매개 핵산 전달, 리포솜 매개된 핵산 전달, 미세 주입, 미세 입자 충격, 칼슘 포스페이트-매개 형질 전환, 사이클로덱스트린-매개 형질 전환, 전기 천공, 나노 입자-매개 형질 전환, 초음파 처리, 침투, PEG-매개 핵산 흡수뿐만 아니라 식물 세포로의 핵산의 도입을 초래하는 임의의 다른 전기적, 화학적, 물리적(기계적) 및/또는 생물학적 메커니즘(그들의 임의의 조합을 포함함)을 통한 형질 전환이 포함된다. 당업계에 알려진 다양한 식물 형질 전환 방법에 대한 일반적인 가이드에는 문헌[Miki et al. ("Procedures for Introducing Foreign DNA into Plants" in Methods in Plant Molecular Biology and Biotechnology, Glick, B. R. and Thompson, J. E., Eds. (CRC Press, Inc., Boca Raton, 1993), pages 67-88)] 및 문헌[Rakowoczy-Trojanowska (Cell Mol Biol Lett 7:849-858 (2002))]이 포함된다.
아그로박테리움-매개 형질 전환은 그의 높은 형질 전환 효율, 및 많은 다양한 종과 관련된 그의 광범위한 유용성으로 인해 식물을 형질 전환하는 데 일반적으로 사용되는 방법이다. 아그로박테리움-매개 형질 전환은 전형적으로, 함께 존재하는(co-resident) Ti 플라스미드 상에 또는 염색체에 숙주 아그로박테리움 균주에 의해 운반되는 vir 유전자의 상보체에 의존할 수 있는 적절한 아그로박테리움 균주로의 관심있는 외래 DNA를 지닌 이원 벡터의 전달을 포함한다(문헌[Uknes et al. 1993, Plant Cell 5:159-169]). 아그로박테리움으로의 재조합 이원 벡터의 전달은, 표적 아그로박테리움 균주로 재조합 이원 벡터를 동원할 수 있는 플라스미드를 지닌 헬퍼(helper) 이. 콜라이(E. coli) 균주인 재조합 이원 벡터를 지닌 에스케리키아 콜라이(Escherichia coli)를 사용하는 트리-페어런탈 메이팅(tri-parental mating) 절차에 의해 달성될 수 있다. 대안적으로, 재조합 이원 벡터는 핵산 형질 전환에 의해 아그로박테리움으로 전달될 수 있다(문헌[
Figure pct00001
and Willmitzer 1988, Nucleic Acids Res 16:9877]).
재조합 아그로박테리움에 의한 식물의 형질 전환은 일반적으로 식물로부터의 외식편과 아그로박테리움의 공동-배양을 포함하며 당업계에 잘 알려진 방법을 따른다. 형질 전환된 조직은 전형적으로 이원 플라스미드 T-DNA 경계 사이에 항생제 또는 제초제 저항성 마커를 지닌 선택 배지 상에서 재생된다. 토마토 식물을 형질 전환시키기 위한 예시적인 방법은 문헌[Garcia D.,
Figure pct00002
J., Orozco-
Figure pct00003
M.L. (2015) Tomato (Solanum lycopersicum). In: Wang K. (eds) Agrobacterium Protocols. Methods in Molecular Biology, vol 1223. Springer, New York, NY]에 개시되어 있다.
식물, 식물 부분 및 식물 세포를 형질 전환하는 또 다른 방법은 식물 조직 및 세포에서 비활성 또는 생물학적 활성 입자를 추진시키는 단계를 포함한다. 예를 들어, 미국 특허 제4,945,050호; 제5,036,006호 및 제5,100,792호를 참조한다. 일반적으로, 이 방법은 세포의 외부 표면을 관통하여 그의 내부로의 혼입을 제공하기에 효과적인 조건하에서 식물 세포에서 비활성 또는 생물학적 활성 입자를 추진시키는 단계를 포함한다. 비활성 입자가 이용될 때, 벡터는 관심있는 핵산을 함유하는 벡터로 입자를 코팅함으로써 세포에 도입될 수 있다. 대안적으로, 입자의 후류에 의해 벡터가 세포 내로 운반되도록 세포 또는 세포들이 벡터에 의해 둘러싸일 수 있다. 생물학적 활성 입자(예를 들어, 도입하고자 하는 하나 이상의 핵산을 각각 함유하는, 건조된 효모 세포, 건조된 박테리아 또는 박테리오파지)가 또한 식물 조직 내로 추진될 수 있다.
폴리뉴클레오티드와 관련하여 "일시적 형질 전환"은 폴리뉴클레오티드가 세포에는 도입되고 세포의 게놈에는 통합되지 않음을 의미한다.
본원에 사용되는 바와 같이, 세포에 도입되는 폴리뉴클레오티드와 관련하여 "안정적으로 도입하는", "안정적으로 도입된", "안정적인 형질 전환" 또는 "안정적으로 형질 전환된"은 도입된 폴리뉴클레오티드가 세포의 게놈에 안정적으로 통합되며, 그에 따라 세포가 폴리뉴클레오티드로 안정적으로 형질 전환됨을 의미한다. 그와 같이, 통합된 폴리뉴클레오티드는 그의 자손에 의해, 보다 구체적으로, 다수의 후속 세대의 자손에 의해 유전될 수 있다. 본원에 사용되는 바와 같은 "게놈"은 핵 및/또는 색소체 게놈을 포함하며, 그에 따라, 예를 들어, 엽록체 게놈으로의 폴리뉴클레오티드의 통합을 포함한다. 본원에 사용되는 바와 같은 안정적인 형질 전환은 또한 염색체 외에서, 예를 들어, 미니 염색체(minichromosome)로서 유지되는 폴리뉴클레오티드를 지칭할 수 있다.
일시적 형질 전환은, 예를 들어, 효소-연결 면역 흡착 검정(ELISA) 또는 웨스턴 블롯에 의해 검출될 수 있으며, 이는 유기체에 도입된 하나 이상의 핵산 분자에 의해 인코딩되는 펩티드 또는 폴리펩티드의 존재를 검출할 수 있다. 세포의 안정적인 형질 전환은, 예를 들어, 유기체(예를 들어, 식물)에 도입된 핵산 분자의 뉴클레오티드 서열과 특이적으로 하이브리드화되는 핵산 서열을 사용한 세포의 게놈 DNA의 서던 블롯 하이브리드화 검정에 의해 검출될 수 있다. 세포의 안정적인 형질 전환은, 예를 들어, 식물 또는 다른 유기체에 도입된 핵산 분자의 뉴클레오티드 서열과 특이적으로 하이브리드화되는 핵산 서열을 사용한 세포의 RNA의 노던 블롯 하이브리드화 검정에 의해 검출될 수 있다. 세포의 안정적인 형질 전환은 또한, 예를 들어, 핵산 분자의 표적 서열(들)과 하이브리드화되어 표준 방법에 따라 검출될 수 있는 표적 서열(들)의 증폭을 초래하는 특이적 프라이머 서열을 사용하는, 중합 효소 연쇄 반응(PCR) 또는 당업계에 잘 알려진 바와 같은 다른 증폭 반응에 의해 검출될 수 있다. 형질 전환은 또한 당업계에 잘 알려진 직접 시퀀싱 및/또는 하이브리드화 프로토콜에 의해 검출될 수 있다.
따라서, 본 발명의 특정 구현예에서 식물 세포는, 당업계에 알려져 있으며 본원에 기술된 바와 같은 임의의 방법에 의해 형질 전환될 수 있고, 다양한 알려진 기법 중 임의의 것을 사용하여 이러한 형질 전환된 세포로부터 온전한 식물이 재생될 수 있다. 식물 세포, 식물 조직 배양물 및/또는 배양된 원형질체로부터의 식물 재생은, 예를 들어, 문헌[Evans et al. (Handbook of Plant Cell Cultures, Vol. 1, MacMilan Publishing Co. New York (1983))]; 및 문헌[Vasil I. R. (ed.) (Cell Culture and Somatic Cell Genetics of Plants, Acad. Press, Orlando, Vol. I (1984), and Vol. II (1986))]에 기술되어 있다. 형질 전환된 트랜스제닉 식물, 식물 세포 및/또는 식물 조직 배양물을 선택하는 방법은 당업계에서는 일상적인 것이며, 본원에 제공되는 본 발명의 방법에서 사용될 수 있다.
"형질 전환 및 재생 과정"은 트랜스진을 식물 세포에 안정적으로 도입하고 트랜스제닉 식물 세포로부터 식물을 재생시키는 과정을 지칭한다. 본원에 사용되는 바와 같이, 형질 전환 및 재생은 선택 과정을 포함하며, 이에 의해 트랜스진은 선택 가능 마커를 포함하고 형질 전환된 세포는 트랜스진을 통합하여 이를 발현함으로써, 형질 전환된 세포가 선택제의 존재하에 생존하고 발육상 번성할 것이다. "재생"은 식물 세포, 일단의 식물 세포, 또는 식물 조각으로부터, 예컨대 원형질체, 캘러스, 또는 조직 부분으로부터 전체 식물을 성장시키는 것을 지칭한다.
용어 "뉴클레오티드 서열" "핵산", "핵산 서열", "핵산 분자", "올리고뉴클레오티드" 및 "폴리뉴클레오티드"는, 뉴클레오티드의 이종 중합체를 지칭하고 cDNA, 게놈 DNA, mRNA, 합성(예를 들어, 화학적으로 합성된) DNA 또는 RNA 및 RNA와 DNA의 키메라를 비롯한 RNA 및 DNA 둘 모두를 포함하도록 본원에서 상호 교환적으로 사용된다. 핵산 분자라는 용어는 사슬의 길이와 관계없이 뉴클레오티드 사슬을 지칭한다. 뉴클레오티드는 당, 포스페이트, 및 퓨린 또는 피리미딘인 염기를 함유한다. 핵산 분자는 이중-가닥 또는 단일-가닥일 수 있다. 단일-가닥인 경우, 핵산 분자는 센스 가닥 또는 안티센스 가닥일 수 있다. 핵산 분자는 올리고뉴클레오티드 유사체 또는 유도체(예를 들어, 이노신 또는 포스포로티오에이트 뉴클레오티드)를 사용하여 합성될 수 있다. 그러한 올리고뉴클레오티드는, 예를 들어, 염기쌍 형성 능력이 변경되거나 뉴클레아제에 대한 저항성이 증가된 핵산 분자를 제조하기 위해 사용될 수 있다. 본원에 제공된 핵산 서열은 왼쪽에서 오른쪽으로 5'→3' 방향으로 본원에 제시되며, 미국 서열 규칙 37 CFR §§1.821 내지 1.825 및 세계지적재산기구(World Intellectual Property Organization, WIPO) 표준 ST.25에 명시된 바와 같은 뉴클레오티드 문자를 나타내는 표준 코드를 사용하여 표시된다.
"핵산 단편"은 주어진 핵산 분자의 일부이다. "RNA 단편"은 주어진 RNA 분자의 분획이다. "DNA 단편"은 주어진 DNA 분자의 분획이다. "핵산 세그먼트"는 주어진 핵산 분자의 분획이며, 분자로부터 분리되지 않는다. "RNA 세그먼트"는 주어진 RNA 분자의 분획이며, 분자로부터 분리되지 않는다. "DNA 세그먼트"은 주어진 DNA 분자의 분획이며, 분자로부터 분리되지 않는다. 폴리뉴클레오티드의 세그먼트는 임의의 길이, 예를 들어, 적어도 5개, 10개, 15개, 20개, 25개, 30개, 40개, 50개, 7 5개, 100개, 150개, 200개, 300개 또는 500개 이상의 뉴클레오티드 길이일 수 있다. 가이드 서열의 세그먼트 또는 일부는 가이드 서열의 약 50%, 40%, 30%, 20%, 10%, 예를 들어, 가이드 서열의 1/3 이하, 예를 들어 7개, 6개, 5개, 4개, 3개, 또는 2개 뉴클레오티드 길이일 수 있다.
분자와 관련하여 용어 "~로부터 유래된"은 모(parent) 분자 또는 그 모 분자로부터의 정보를 사용하여 분리되거나 만들어진 분자를 지칭한다. 예를 들어, Cas9 단일 돌연변이 닉카제 및 Cas9 이중 돌연변이 null-뉴클레아제는 야생형 Cas9 단백질로부터 유래된다.
고등 식물에서, 데옥시리보핵산(DNA)은 유전 물질인 한편, 리보핵산(RNA)은 DNA 내에 포함된 정보의 단백질로의 전달에 관여한다. "게놈"은 유기체의 각 세포에 포함된 유전 물질의 완전체(entire body)이다. 달리 지시되지 않는 한, 본 발명의 특정 핵산 서열은, 명시적으로 지시된 서열뿐만 아니라, 또한 그의 보존적으로 변형된 변이체(예를 들어, 축퇴성 코돈 치환체) 및 상보적 서열을 암시적으로 포함한다. 구체적으로, 축퇴성 코돈 치환체는 하나 이상의 선택된(또는 모든) 코돈의 세 번째 위치가 혼합-염기 및/또는 데옥시이노신 잔기로 치환된 서열을 생성함으로써 달성될 수 있다(문헌[Batzer et al., Nucleic Acid Res. 19:5081 (1991)]; 문헌[Ohtsuka et al., J. Biol. Chem. 260:2605-2608 (1985)]; 및 문헌[Rossolini et al., Mol. Cell. Probes 8:91-98 (1994)]). 핵산 분자라는 용어는 유전자, cDNA, 및 유전자에 의해 인코딩된 mRNA와 상호 교환적으로 사용된다.
본원에 사용되는 바와 같이, "서열 동일성"은 2개의 최적으로 정렬된 폴리뉴클레오티드 또는 펩티드 서열이 구성 요소, 예를 들어, 뉴클레오티드 또는 아미노산의 정렬 윈도우 전체에 걸쳐 불변하는 정도를 지칭한다. "동일성"은 하기 문헌에 기술된 방법을 포함하지만 이로 한정되지 않는 알려진 방법에 의해 용이하게 계산될 수 있다: 문헌[Computational Molecular Biology (Lesk, A. M., ed.) Oxford University Press, New York (1988)]; 문헌[Biocomputing: Informatics and Genome Projects (Smith, D. W., ed.) Academic Press, New York (1993)]; 문헌[Computer Analysis of Sequence Data, Part I (Griffin, A. M., and Griffin, H. G., eds.) Humana Press, New Jersey (1994)]; 문헌[Sequence Analysis in Molecular Biology (von Heinje, G., ed.) Academic Press (1987)]; 및 문헌[Sequence Analysis Primer (Gribskov, M. and Devereux, J., eds.) Stockton Press, New York (1991)].
본원에 사용되는 바와 같이, 용어 "서열 동일성 퍼센트" 또는 "동일성 퍼센트"는 시험("대상") 폴리뉴클레오티드 분자(또는 그의 상보적 가닥)와 비교한 기준("질의(query)") 폴리뉴클레오티드 분자(또는 그의 상보적 가닥)의 선형 폴리뉴클레오티드 서열에서의 동일한 뉴클레오티드의 백분율(두 서열이 최적으로 정렬된 경우)을 지칭한다. 일부 구현예에서, "동일성 퍼센트"는 아미노산 서열에서 동일한 아미노산의 백분율을 지칭할 수 있다.
본원에 사용되는 바와 같이, 2개의 핵산 분자, 뉴클레오티드 서열 또는 단백질 서열과 관련하여 "실질적으로 동일한"이라는 문구는, 하기 서열 비교 알고리즘들 중 하나를 사용하거나 육안 검사에 의해 측정되는 바와 같이, 최대 일치를 위해 비교되고 정렬되는 경우 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99%의 뉴클레오티드 또는 아미노산 잔기 동일성을 갖는 2개 이상의 서열 또는 하위서열(subsequence)을 지칭한다. 본 발명의 일부 구현예에서, 실질적 동일성은 적어도 약 50개 잔기 내지 약 150개 잔기 길이인 서열 영역에 걸쳐 존재한다. 따라서, 본 발명의 일부 구현예에서, 실질적 동일성은 적어도 약 50개, 약 60개, 약 70개, 약 80개, 약 90개, 약 100개, 약 110개, 약 120개, 약 130개, 약 140개, 약 150개, 또는 그 초과의 잔기 길이인 서열 영역에 걸쳐 존재한다. 일부 특정 구현예에서, 서열은 적어도 약 150개의 잔기에 걸쳐 실질적으로 동일하다. 추가 구현예에서, 서열은 코딩 영역의 전체 길이에 걸쳐 실질적으로 동일하다. 또한, 대표적인 구현예에서, 실질적으로 동일한 뉴클레오티드 또는 단백질 서열은 실질적으로 동일한 기능(예를 들어, 특정 게놈 표적으로의 안내, 특정 게놈 표적 부위의 엔도뉴클레아제 절단)을 수행한다.
서열 비교를 위해, 전형적으로 하나의 서열이 시험 서열과 비교되는 기준 서열로 작용한다. 서열 비교 알고리즘을 사용하는 경우, 시험 및 기준 서열을 컴퓨터에 입력하고, 필요에 따라 하위서열 좌표를 지정하고, 서열 알고리즘 프로그램 파라미터를 지정한다. 이어서 서열 비교 알고리즘은 지정된 프로그램 파라미터에 기초하여 기준 서열에 비한 시험 서열(들)에 대한 서열 동일성 퍼센트를 계산한다.
비교 윈도우를 정렬하기 위한 서열들의 최적 정렬은 당업자에게 잘 알려져 있으며, Smith 및 Waterman의 국소 상동성 알고리즘, Needleman 및 Wunsch의 상동성 정렬 알고리즘, Pearson 및 Lipman의 유사성 검색 방법과 같은 도구에 의해, 및 선택적으로 GCG® Wisconsin Package®(미국 캘리포니아주 샌디에고 소재의 Accelrys Inc.)의 일부로 이용 가능한 GAP, BESTFIT, FASTA, 및 TFASTA와 같은 이러한 알고리즘의 컴퓨터화된 구현에 의해 수행될 수 있다. 시험 서열과 기준 서열의 정렬된 세그먼트에 대한 "동일성 분율"은 두 정렬된 서열에 의해 공유되는 동일한 구성 요소 수를 기준 서열 세그먼트 내의 총 구성 요소 수, 즉, 전체 기준 서열 또는 기준 서열의 더 작은 규정된 부분으로 나눈 것이다. 서열 동일성 퍼센트는 동일성 분율에 100을 곱한 것으로 표시된다. 하나 이상의 폴리뉴클레오티드 서열의 비교는 전장 폴리뉴클레오티드 서열 또는 그의 일부에 대한 것이거나, 더 긴 폴리뉴클레오티드 서열에 대한 것일 수 있다. 본 발명의 목적을 위해 "동일성 퍼센트"는 또한 번역된 뉴클레오티드 서열의 경우 BLASTX 버전 2.0을 사용하고 폴리뉴클레오티드 서열의 경우 BLASTN 버전 2.0을 사용하여 결정될 수 있다.
BLAST 분석을 수행하기 위한 소프트웨어는 미국 국립생물공학정보센터(National Center for Biotechnology Information)를 통해 공개적으로 이용 가능하다. 이 알고리즘은 먼저 질의 서열에서 길이 W의 짧은 단어들을 확인함으로써 고득점 서열 쌍(high scoring sequence pair, HSP)을 확인하는 것을 포함하며, 이는 데이터베이스 서열 내의 동일한 길이의 단어와 정렬된 경우 어떤 양의(positive) 임계값 점수 T와 일치하거나 이를 충족한다. T는 이웃 단어 점수 임계값으로 지칭된다(문헌[Altschul et al., 1990]). 이러한 초기 이웃 단어 히트(hit)는 이를 포함하는 더 긴 HSP를 찾기 위해 검색을 개시하기 위한 시드(seed) 역할을 한다. 이어서, 단어 히트는 누적 정렬 점수가 증가될 수 있는 한 각 서열을 따라 양방향 모두로 확장된다. 뉴클레오티드 서열의 경우, 파라미터 M(일치하는 잔기 쌍에 대한 보상 점수; 항상 0보다 큼) 및 N(불일치 잔기에 대한 페널티 점수; 항상 0보다 작음)을 사용하여 누적 점수가 계산된다. 아미노산 서열의 경우, 누적 점수를 계산하기 위해 스코어링 행렬(scoring matrix)이 사용된다. 누적 정렬 점수가 그의 최대 달성 값으로부터 수량 X만큼 하락하거나, 하나 이상의 음의 점수를 내는 잔기 정렬의 축적으로 인해 누적 점수가 0 이하로 되거나, 어느 한쪽의 서열의 단부에 도달한 경우, 각 방향에서의 단어 히트의 확장이 중단된다. BLAST 알고리즘 파라미터 W, T 및 X는 정렬의 감도 및 속도를 결정한다. BLASTN 프로그램(뉴클레오티드 서열용)은 디폴트로서 11의 단어길이(W), 10의 기대값(E), 100의 컷오프, M = 5, N = -4, 및 두 가닥 모두의 비교를 사용한다. 아미노산 서열의 경우, BLASTP 프로그램은 디폴트로서 3의 단어길이(W), 10의 기대값(E), 및 BLOSUM62 스코어링 행렬을 사용한다(문헌[Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89: 10915 (1989)] 참조).
서열 동일성 퍼센트를 계산하는 것 외에, BLAST 알고리즘은 또한 두 서열 사이의 유사성에 관한 통계적 분석을 수행한다(예를 들어, 문헌[Karlin & Altschul, Proc. Nat'l. Acad. Sci. USA 90: 5873-5787 (1993)] 참조). BLAST 알고리즘에 의해 제공되는 유사성의 한 가지 척도는 최소 합 확률(P(N))이며, 이는 두 뉴클레오티드 또는 아미노산 서열 사이의 일치가 우연히 발생할 확률의 지표를 제공한다. 예를 들어, 시험 뉴클레오티드 서열과 기준 뉴클레오티드 서열의 비교에서 최소 합 확률이 약 0.1 미만 내지 약 0.001 미만인 경우 시험 핵산 서열은 기준 서열과 유사한 것으로 간주된다. 따라서, 본 발명의 일부 구현예에서, 시험 뉴클레오티드 서열과 기준 뉴클레오티드 서열의 비교에서 최소 합 확률은 약 0.001 미만이다.
두 뉴클레오티드 서열은, 두 서열이 엄격한 조건하에서 서로 하이브리드화될 때 실질적으로 동일한 것으로 또한 간주될 수 있다. 일부 대표적인 구현예에서, 실질적으로 동일한 것으로 간주되는 두 뉴클레오티드 서열은 매우 엄격한 조건하에서 서로 하이브리드화된다.
서던 및 노던 하이브리드화와 같은 핵산 하이브리드화 실험과 관련하여 "엄격한 하이브리드화 조건" 및 "엄격한 하이브리드화 세척 조건"은 서열 의존적이며, 다양한 환경 파라미터하에서 다양하다. 핵산의 하이브리드화에 대한 포괄적인 가이드는 문헌[Tijssen Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes part I chapter 2 "Overview of principles of hybridization and the strategy of nucleic acid probe assays" Elsevier, New York (1993)]에서 발견된다. 일반적으로, 매우 엄격한 하이브리드화 및 세척 조건은 규정된 이온 강도 및 pH에서의 특정 서열에 대한 열 융점(Tm)보다 약 5℃ 낮도록 선택된다.
Tm은 완벽하게 일치하는 프로브에 표적 서열의 50%가 하이브리드화되는 (규정된 이온 강도 및 pH하의) 온도이다. 매우 엄격한 조건은 특정 프로브에 대한 Tm과 동일하도록 선택된다. 서던 또는 노던 블롯에서 필터 상에 100개를 초과하는 상보적 잔기를 갖는 상보적 뉴클레오티드 서열의 하이브리드화를 위한 엄격한 하이브리드화 조건의 예는 42℃에서 1 mg의 헤파린을 갖는 50% 포름아미드이며, 하이브리드화는 밤새 수행된다. 매우 엄격한 세척 조건의 예는 약 15분 동안 72℃에서 0.1 5 M NaCl이다. 엄격한 세척 조건의 예는 15분 동안 65℃에서 0.2x SSC 세척이다(SSC 완충액에 대한 설명에 대해서는 하기 문헌[Sambrook] 참조). 종종, 백그라운드 프로브 신호를 제거하기 위해 높은 엄격도 세척에 앞서 낮은 엄격도 세척이 수행된다. 예를 들어, 100개 초과의 뉴클레오티드의 이중체에 대한 중간 엄격도 세척의 예는 15분 동안 45℃에서 1x SSC이다. 예를 들어, 100개 초과의 뉴클레오티드의 이중체에 대한 낮은 엄격도 세척의 예는 15분 동안 40℃에서 4 내지 6x SSC이다. 짧은 프로브(예를 들어, 약 10개 내지 50개 뉴클레오티드)의 경우, 엄격한 조건은 전형적으로 pH 7.0 내지 8.3에서 약 1.0 M 미만의 Na 이온의 염 농도, 전형적으로 약 0.01 내지 1.0 M Na 이온 농도(또는 다른 염)를 포함하고, 온도는 전형적으로 적어도 약 30℃이다. 엄격한 조건은 또한 포름아미드와 같은 불안정화제를 첨가하여 달성될 수 있다. 일반적으로, 특정 하이브리드화 검정에서 관련없는 프로브에 대해 관찰된 것보다 2x(또는 그 초과)의 신호 대 잡음비는 특이적 하이브리드화의 검출을 나타낸다. 엄격한 조건하에서 서로 하이브리드화되지 않은 뉴클레오티드 서열들은, 이들이 인코딩하는 단백질이 실질적으로 동일한 경우 여전히 실질적으로 동일하다. 이는, 예를 들어, 뉴클레오티드 서열의 카피가 유전자 코드에 의해 허용되는 최대 코돈 축퇴성을 사용하여 생성되는 경우 일어난다.
다음은 본 발명의 기준 뉴클레오티드 서열과 실질적으로 동일한 상동성 뉴클레오티드 서열을 클로닝하기 위해 사용될 수 있는 하이브리드화/세척 조건 세트의 예이다. 일 구현예에서, 기준 뉴클레오티드 서열은 50℃에서 7% 소듐 도데실 설페이트(SDS), 0.5 M NaPO4, 1 mM EDTA 중에서 "시험" 뉴클레오티드 서열에 하이브리드화되며 50℃에서 2X SSC, 0.1% SDS 중에서 세척된다. 또 다른 구현예에서, 기준 뉴클레오티드 서열은 50℃에서 7% 소듐 도데실 설페이트(SDS), 0.5 M NaPO4, 1 mM EDTA 중에서 "시험" 뉴클레오티드 서열에 하이브리드화되며 50℃에서 1X SSC, 0.1% SDS 중에서 세척되거나, 50℃에서 7% 소듐 도데실 설페이트(SDS), 0.5 M NaPO4, 1 mM EDTA 중에서 "시험" 뉴클레오티드 서열에 하이브리드화되며 50℃에서 0.5X SSC, 0.1% SDS 중에서 세척된다. 추가 구현예에서, 기준 뉴클레오티드 서열은 50℃에서 7% 소듐 도데실 설페이트(SDS), 0.5 M NaPO4, 1 mM EDTA 중에서 "시험" 뉴클레오티드 서열에 하이브리드화되며 50℃에서 0.1X SSC, 0.1% SDS 중에서 세척되거나, 50℃에서 7% 소듐 도데실 설페이트(SDS), 0.5 M NaPO4, 1 mM EDTA 중에서 "시험" 뉴클레오티드 서열에 하이브리드화되며 65℃에서 0.1X SSC, 0.1% SDS 중에서 세척된다.
"분리된" 핵산 분자 또는 뉴클레오티드 서열 또는 "분리된" 폴리펩티드는, 인위적으로 그의 천연 환경과는 별도로 존재하게 되고/되거나 그의 천연 환경에서의 기능과 비교하여 상이하고/하거나, 변형되고/되거나, 변조되고/되거나, 변경된 기능을 갖게 된 핵산 분자, 뉴클레오티드 서열 또는 폴리펩티드이며, 그에 따라 자연적인 산물이 아니다. 분리된 핵산 분자 또는 분리된 폴리펩티드는 정제된 형태로 존재할 수 있거나, 예를 들어 재조합 숙주 세포와 같은 비-천연 환경에 존재할 수 있다. 따라서, 예를 들어, 폴리뉴클레오티드와 관련하여, 분리된이라는 용어는 그것이 자연적으로 발생하는 염색체 및/또는 세포로부터 분리된 것임을 의미한다. 폴리뉴클레오티드는 또한 그것이 자연적으로 발생하는 염색체 및/또는 세포로부터 분리되고, 이어서 그것이 자연적으로 발생하지 않는 유전자 컨텍스트(genetic context), 염색체, 염색체 위치, 및/또는 세포에 삽입되는 경우 분리된 것이다. 본 발명의 재조합 핵산 분자 및 뉴클레오티드 서열은 상기 정의된 바와 같이 "분리된" 것으로 간주될 수 있다.
따라서, "분리된 핵산 분자" 또는 "분리된 뉴클레오티드 서열"은, 유기체의 자연 발생 게놈(유기체로부터 유래됨)에서 바로 인접한(5' 말단에 하나 및 3' 말단에 하나) 뉴클레오티드 서열과 바로 인접하지 않은 핵산 분자 또는 뉴클레오티드 서열이다. 이에 따라, 일 구현예에서, 분리된 핵산은 코딩 서열에 바로 인접한 5' 비-코딩(예를 들어, 프로모터) 서열의 일부 또는 전부를 포함한다. 따라서, 이 용어는, 예를 들어, 벡터로, 자율 복제 플라스미드 또는 바이러스로, 또는 원핵생물 또는 진핵생물의 게놈 DNA로 혼입되거나, 다른 서열과는 관계없이 별개의 분자로 존재하는 재조합 핵산(예를 들어, PCR 또는 제한 엔도뉴클레아제 처리에 의해 생산된 cDNA 또는 게놈 DNA 단편)을 포함한다. 이는 또한 추가의 폴리펩티드 또는 펩티드 서열을 인코딩하는 하이브리드 핵산 분자의 일부인 재조합 핵산을 포함한다. "분리된 핵산 분자" 또는 "분리된 뉴클레오티드 서열"은, 동일한 천연의 원래 세포 유형으로부터 유래되어 그로 삽입되지만 비천연 상태로 존재하는, 예를 들어, 핵산 분자의 천연 상태에서 발견되는 것과 상이한 카피 수로 존재하고/하거나 상이한 조절 서열의 제어하에 있는 뉴클레오티드 서열도 포함할 수 있다.
용어 "분리된"은 세포 물질, 바이러스 물질, 및/또는 배양 배지(예를 들어, 재조합 DNA 기법에 의해 생산되는 경우), 또는 화학적 전구체 또는 다른 화학물질(예를 들어, 화학적으로 합성되는 경우)을 실질적으로 함유하지 않는 핵산 분자, 뉴클레오티드 서열, 폴리펩티드, 펩티드 또는 단편을 추가로 지칭할 수 있다. 더욱이, "분리된 단편"은 단편으로서 자연 발생하지 않고 이에 따라 천연 상태에서 발견되지 않을 핵산 분자, 뉴클레오티드 서열 또는 폴리펩티드의 단편이다. "분리된"은 제제가 반드시 기술적으로 순수하다는 것(동형이라는 것)을 의미하는 것은 아니며, 의도된 목적으로 사용될 수 있는 형태로 폴리펩티드 또는 핵산을 제공하기에 충분히 순수하다는 것을 의미한다.
본 발명의 대표적인 구현예에서, "분리된" 핵산 분자, 뉴클레오티드 서열, 및/또는 폴리펩티드는 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 40%, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%(w/w) 이상 순수하다. 다른 구현예에서, "분리된" 핵산, 뉴클레오티드 서열, 및/또는 폴리펩티드는 출발 물질과 비교하여 적어도 약 5-배, 10-배, 25-배, 100-배, 1000-배, 10,000-배, 100,000-배 이상의 핵산 농축도(w/w)가 달성된다는 것을 나타낸다.
"야생형" 뉴클레오티드 서열 또는 아미노산 서열은 자연 발생적("천연") 또는 내인성 뉴클레오티드 서열 또는 아미노산 서열을 지칭한다. 따라서, 예를 들어, "야생형 mRNA"는 유기체에서 자연적으로 발생하거나 유기체에 내인성인 mRNA이다. "상동성" 뉴클레오티드 서열은 그것이 도입되는 숙주 세포와 자연적으로 결부된 뉴클레오티드 서열이다.
용어 "오픈 리딩 프레임" 및 "ORF"는 코딩 서열의 번역 개시 코돈과 종결 코돈 사이에서 인코딩되는 아미노산 서열을 지칭한다. 용어 "개시 코돈" 및 "종결 코돈"은 각각 단백질 합성(mRNA 번역)의 개시 및 사슬 종결을 특정하는 코딩 서열 내의 3개의 인접 뉴클레오티드 단위('코돈')를 지칭한다.
"프로모터"는 일반적으로 그의 코딩 서열의 업스트림(5')에 있는 뉴클레오티드 서열을 지칭하며, 이는 RNA 중합 효소 및 적절한 전사에 필요한 다른 인자에 대한 인식을 제공함으로써 코딩 서열의 발현을 제어한다. "프로모터 조절 서열"은 근위 업스트림 요소 및 보다 원위의 업스트림 요소로 구성된다. 프로모터 조절 서열은 결부된 코딩 서열의 전사, RNA 가공 또는 안정성, 또는 번역에 영향을 미친다. 조절 서열은 인핸서, 프로모터, 비번역 선도 서열, 인트론, 및 폴리아데닐화 신호 서열을 포함한다. 이는 천연 및 합성 서열뿐만 아니라 합성 서열과 천연 서열의 조합일 수 있는 서열을 포함한다. "인핸서"는 프로모터 활성을 자극할 수 있는 DNA 서열이며, 프로모터의 고유 요소이거나 프로모터의 수준 또는 조직 특이성을 향상시키기 위해 삽입된 이종성 요소일 수 있다. 이는 두 배향 모두(정상 배향 또는 뒤집힌(flipped) 배향)로 작동할 수 있으며, 프로모터의 업스트림 또는 다운스트림으로 이동하더라도 기능할 수 있다. 용어 "프로모터"의 의미는 "프로모터 조절 서열"을 포함한다.
"1차 형질 전환체" 및 "E0 세대"는 초기에 형질 전환된 조직과 동일한 유전적 세대인(즉, 형질 전환 이래로 감수 분열 및 수정을 거치지 않은) 트랜스제닉 식물을 지칭한다. "2차 형질 전환체" 및 "E1, E2, E3 등의 세대"는 1회 이상의 감수 분열 및 수정 주기를 통해 1차 형질 전환체로부터 유래된 트랜스제닉 식물을 지칭한다. 이는 1차 또는 2차 형질 전환체의 자가 수정에 의해 또는 1차 또는 2차 형질 전환체와, 형질 전환되거나 형질 전환되지 않은 다른 식물과의 교배에 의해 유래될 수 있다.
"트랜스진"은 형질 전환에 의해 게놈에 도입되어 안정적으로 유지되는 핵산 분자를 지칭한다. 트랜스진은 적어도 하나의 발현 카세트를 포함할 수 있으며, 전형적으로 적어도 2개의 발현 카세트를 포함하고, 10개 이상의 발현 카세트를 포함할 수 있다. 트랜스진은, 예를 들어, 형질 전환될 특정 식물의 유전자에 대해 이종성 또는 상동성인 유전자를 포함할 수 있다. 추가로, 트랜스진은 비-천연 유기체에 삽입된 천연 유전자 또는 키메라 유전자를 포함할 수 있다. 용어 "내인성 유전자"는 유기체의 게놈에서 그의 천연 위치에 있는 천연 유전자를 지칭한다. "외래" 유전자는 숙주 유기체에서 정상적으로는 발견되지 않지만 유전자 전달에 의해 유기체로 도입된 유전자를 지칭한다.
"인트론"은 거의 배타적으로 진핵 유전자 내에서 발생하지만 유전자 산물에서 아미노산 서열로 번역되지 않는 DNA의 개재 섹션을 지칭한다. 인트론은, 엑손은 그대로 두는 스플라이싱(splicing)으로 일컬어지는 과정을 통해 성숙전(pre-mature) mRNA로부터 제거되어 mRNA를 형성한다. 본 발명의 목적을 위해, 용어 "인트론"의 정의는 표적 유전자로부터 유래된 인트론의 뉴클레오티드 서열에 대한 변형을 포함하며, 단, 변형된 인트론은 그의 결부된 5' 조절 서열의 활성을 유의하게 감소시키지 않는다.
"엑손"은 단백질 또는 그의 일부에 대한 코딩 서열을 지닌 DNA의 섹션을 지칭한다. 엑손은 개재하는 비-코딩 서열(인트론)에 의해 분리되어 있다. 본 발명의 목적을 위해, 용어 "엑손"의 정의는 표적 유전자로부터 유래된 엑손의 뉴클레오티드 서열에 대한 변형을 포함하며, 단, 변형된 엑손은 그의 결부된 5' 조절 서열의 활성을 유의하게 감소시키지 않는다.
용어 "절단" 또는 "절단하는"은 폴리뉴클레오티드의 리보실포스포디에스테르 백본에서 공유 포스포디에스테르 결합의 파손을 지칭한다. 용어 "절단" 또는 "절단하는"은 단일-가닥 파손 및 이중-가닥 파손 둘 모두를 포함한다. 이중-가닥 절단은 2개의 구별되는 단일-가닥 절단 사건의 결과로 발생할 수 있다. 절단은 블런트형(blunt) 단부 또는 스태거형(staggered) 단부의 생성을 초래할 수 있다. "뉴클레아제 절단 부위" 또는 "게놈 뉴클레아제 절단 부위"는, 하나 또는 둘 모두의 가닥에서 게놈 DNA의 뉴클레오티드 서열을 절단하는 역할을 하는 특정 뉴클레아제에 의해 인식되는 뉴클레아제 절단 서열을 포함하는 뉴클레오티드의 영역이다. 뉴클레아제 효소에 의한 그러한 절단은 세포 내에서 DNA 복구 메커니즘을 개시하며, 이는 상동성 재조합이 발생하게 하는 환경을 조성한다.
"공여자 분자", 또는 "공여자 서열"은 표적 폴리뉴클레오티드, 전형적으로 표적 게놈 부위에 삽입하기 위한 뉴클레오티드 중합체 또는 올리고머이다. 공여자 서열은 관심있는 하나 이상의 트랜스진, 발현 카세트, 또는 뉴클레오티드 서열일 수 있다. 공여자 분자는, 단일 가닥이거나, 부분적으로 이중-가닥이거나, 이중-가닥인 공여자 DNA 분자일 수 있다. 공여자 폴리뉴클레오티드는 천연 또는 변형된 폴리뉴클레오티드, RNA-DNA 키메라, 또는 단일-가닥이거나 적어도 부분적으로 이중-가닥인 DNA 단편, 또는 완전 이중-가닥인 DNA 분자, 또는 PGR 증폭된 ssDNA 또는 적어도 부분적으로 dsDNA 단편일 수 있다. 일부 구현예에서, 공여자 DNA 분자는 원형화된 DNA 분자의 일부이다. 완전 이중-가닥 공여자 DNA가 유리한데, 이는 그것이 증가된 안정성을 제공할 수 있고, dsDNA 단편이 일반적으로 뉴클레아제 분해에 대해 ssDNA보다 더 저항성이기 때문이다. 일부 구현예에서, 공여자 폴리뉴클레오티드 분자는 적어도 약 100개, 150개, 200개, 250개, 300개, 250개, 400개, 450개, 500개, 600개, 700개, 800개, 900개, 1000개, 1500개, 2000개, 2500개, 3000개, 3500개, 4000개, 4500개, 5000개, 7500개, 10000개, 15,000개 또는 20,000개의 뉴클레오티드(이 범위에 속하지만 본원에 명시적으로 언급되지 않은 임의의 값을 포함함)를 포함할 수 있다. 일부 구현예에서, 공여자 DNA 분자는 이종성 핵산 서열을 포함한다. 일부 구현예에서, 공여자 DNA 분자는 적어도 하나의 발현 카세트를 포함한다. 일부 구현예에서, 공여자 DNA 분자는 적어도 하나의 발현 카세트를 포함하는 트랜스진을 포함할 수 있다. 일부 구현예에서, 공여자 DNA 분자는 표적 게놈에 고유한 유전자의 대립 형질 변형을 포함한다. 대립 형질 변형은 적어도 하나의 뉴클레오티드 삽입, 적어도 하나의 뉴클레오티드 결실, 및/또는 적어도 하나의 뉴클레오티드 치환을 포함할 수 있다. 일부 구현예에서, 대립 형질 변형은 INDEL을 포함할 수 있다. 일부 구현예에서, 공여자 DNA 분자는 표적 게놈 부위에 대한 상동성 아암(arm)을 포함한다. 일부 구현예에서, 공여자 DNA 분자는 게놈 핵산 서열과 적어도 90% 동일한 적어도 100개의 인접 뉴클레오티드를 포함하고, 선택적으로 트랜스진과 같은 이종성 핵산 서열을 추가로 포함할 수 있다. 일부 구현예에서, "공여자 DNA 분자"는 "개재 DNA"이다.
본원에 사용되는 바와 같이, 본 발명의 하나 이상의 뉴클레오티드 서열과 관련하여 용어 "부근", "~의 부근", "근위" 또는 "~의 근위"는 바로 옆, 또는 약 1개 염기 내지 약 2000개 염기(예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 15개, 20개, 30개, 40개, 50개, 100개, 200개, 250개, 300개, 350개, 400개, 450개, 500개, 750개, 1000개, 1500개 또는 2000개 염기)(이 범위 내에 포함되지만 본원에 명시적으로 언급되지 않은 임의의 값을 포함함)만큼 떨어져 있음을 의미한다.
"마이크로RNA"(miRNA로 약칭됨)는 RNA 침묵화 및 유전자 발현의 전사후 조절의 기능을 하는 식물, 동물 및 일부 바이러스에서 발견되는 작은 비-코딩 RNA 분자(약 20개 내지 약 24개 뉴클레오티드, 일반적으로 약 22개 뉴클레오티드 함유)이다. miRNA 유전자는 일반적으로 RNA 중합 효소 II(Pol II)에 의해 전사된다. 중합 효소는 흔히 프리-miRNA의 헤어핀 루프가 될 것을 인코딩하는 DNA 서열 근처에서 발견되는 프로모터에 결합한다. 생성된 전사물은 5' 말단에서 특수 변형된 뉴클레오티드로 캡핑되고, 다중 아데노신(폴리-A 꼬리)으로 폴리아데닐화되고, 스플라이싱된다.
"프리-miRNA"는 5' 캡 및 3' 플로이-A가 제거된 스템-루프 구조를 갖는 miRNA 전구체이다. 이는 miRNA의 생산을 돕는 천연 구조이다. 종종 이 용어는 성숙 miRNA(약 20개 내지 약 24개의 뉴클레오티드, 일반적으로 약 22개의 뉴클레오티드 서열)와 구별하기 위해 사용된다. 이러한 방식은 최종 기능적 짧은 서열이 아니라 구조를 의미한다. 용어 "miRNA 스캐폴드" 또는 "miRNA 백본"은 프리-miRNA 구조를 지칭하기 위해 본 발명의 맥락 내에서 동일하게 사용된다.
본원에 사용되는 바와 같이, 용어 "amiRNA"(인공 miRNA)는 일반적으로 이의 코어 서열(성숙 miRNA 서열 및 상응하는 miRNA* 서열)이 새로운 유전자 쪽으로 표적화(침묵화)를 재유도하기 위해 "amiRNA 코어" 서열에 의해 치환된 천연 miRNA 스캐폴드를 지칭한다. 용어 "amiRNA 코어"는 새로운 표적 유전자에 상보적인 약 20개 내지 24개 뉴클레오티드의 짧은 서열인, 이러한 접근법의 인공(설계된) 부분을 지칭한다. 이러한 맥락에서, 상보성이라는 용어는 표적 RNA 분자를 결합하는 amiRNA의 능력을 지칭한다. 일부 구현예에서, amiRNA 코어는 새로운 표적 유전자 분자에 90% 상보적이고, 표적 RNA 분자를 결합하는 이의 능력을 보유한다.
본원에 사용되는 바와 같이, 용어 "가이드 RNA" 또는 "gRNA"는, 일반적으로 CRISPR 시스템 이펙터, 예컨대, Cas 또는 Cpf1 단백질에 결합하고 표적 폴리뉴클레오티드(예를 들어, DNA) 내 특정 위치에 Cas 또는 Cpf1 단백질을 표적화하는 것을 도울 수 있는 RNA 분자(또는 총괄하여 RNA 분자의 그룹)를 지칭한다. 본 발명의 가이드 RNA는 조작된 단일 RNA 분자(sgRNA)일 수 있고, 여기서, 예를 들어, sgRNA는 crRNA 세그먼트 및 선택적으로 tracrRNA 세그먼트를 포함한다. 본 발명의 가이드 RNA는 또한 이중-가이드 시스템일 수 있고, 여기서 crRNA 및 tracrRNA 분자는 물리적으로 구별되는 분자로서, 이후 CRISPR 시스템 이펙터, 예컨대, Cas9의 모집을 위해, 그리고 표적 폴리뉴클레오티드에 그러한 단백질을 표적화하기 위해 상호 작용하여 이중체를 형성한다.
본원에 사용되는 바와 같이, 용어 "crRNA" 또는 "crRNA 세그먼트"는 폴리뉴클레오티드 표적화 가이드 서열, 단백질-결합에 관여하는 스템 서열, 및, 선택적으로, 3'-오버행 서열을 포함하는 RNA 분자 또는 RNA 분자의 일부를 지칭한다. 폴리뉴클레오티드 표적화 가이드 서열은 표적 DNA에서의 서열에 상보적인 핵산 서열이다. 폴리뉴클레오티드 표적화 가이드 서열은 "프로토스페이서"로도 지칭된다. 다시 말해서, crRNA 분자의 폴리뉴클레오티드 표적화 가이드 서열은 하이브리드화(즉, 염기 쌍형성)를 통해 서열-특이적 방식으로 표적 DNA와 상호 작용한다. 이와 같이, crRNA 분자의 폴리뉴클레오티드 표적화 가이드 서열의 뉴클레오티드 서열은 다양할 수 있고, 가이드 RNA 및 표적 DNA가 상호 작용할 표적 DNA 내 위치를 결정한다.
crRNA 분자의 폴리뉴클레오티드 표적화 가이드 서열은 표적 DNA 내 임의의 요망되는 서열에 하이브리드화되도록 변형될 수 있다(예를 들어, 유전자 조작에 의해). 본 발명의 crRNA 분자의 폴리뉴클레오티드 표적화 가이드 서열은 약 12개 뉴클레오티드 내지 약 100개 뉴클레오티드 길이를 가질 수 있다. 예를 들어, crRNA의 폴리뉴클레오티드 표적화 가이드 서열은 약 12개 뉴클레오티드(nt) 내지 약 80개 nt, 약 12개 nt 내지 약 50개 nt, 약 12개 nt 내지 약 40개 nt, 약 12개 nt 내지 약 30개 nt, 약 12개 nt 내지 약 25개 nt, 약 12개 nt 내지 약 20개 nt, 또는 약 12개 nt 내지 약 19개 nt의 길이를 가질 수 있다. 예를 들어, crRNA의 폴리뉴클레오티드 표적화 가이드 서열은 약 17개 nt 내지 약 27개 nt의 길이를 가질 수 있다. 예를 들어, crRNA의 폴리뉴클레오티드 표적화 가이드 서열은 약 19개 nt 내지 약 20개 nt, 약 19개 nt 내지 약 25개 nt, 약 19개 nt 내지 약 30개 nt, 약 19개 nt 내지 약 35개 nt, 약 19개 nt 내지 약 40개 nt, 약 19개 nt 내지 약 45개 nt, 약 19개 nt 내지 약 50개 nt, 약 19개 nt 내지 약 60개 nt, 약 19개 nt 내지 약 70개 nt, 약 19개 nt 내지 약 80개 nt, 약 19개 nt 내지 약 90개 nt, 약 19개 nt 내지 약 100개 nt, 약 20개 nt 내지 약 25개 nt, 약 20개 nt 내지 약 30개 nt, 약 20개 nt 내지 약 35개 nt, 약 20개 nt 내지 약 40개 nt, 약 20개 nt 내지 약 45개 nt, 약 20개 nt 내지 약 50개 nt, 약 20개 nt 내지 약 60개 nt, 약 20개 nt 내지 약 70개 nt, 약 20개 nt 내지 약 80개 nt, 약 20개 nt 내지 약 90개 nt, 또는 약 20개 nt 내지 약 100개 nt의 길이를 가질 수 있다. crRNA의 폴리뉴클레오티드 표적화 가이드 서열의 뉴클레오티드 서열은 적어도 약 12 nt의 길이를 가질 수 있다. 일부 구현예에서, crRNA의 폴리뉴클레오티드 표적화 가이드 서열은 20개 뉴클레오티드 길이이다. 일부 구현예에서, crRNA의 폴리뉴클레오티드 표적화 가이드 서열은 19개 뉴클레오티드 길이이다.
본 발명은 또한 조작된 crRNA를 포함하는 가이드 RNA를 제공하고, 여기서 crRNA는 게놈 표적 서열에 하이브리드화될 수 있는 베이트 RNA 세그먼트를 포함한다. 이러한 조작된 crRNA는 이중-가이드 시스템에서와 같이 물리적으로 구별되는 분자일 수 있다.
본원에 사용되는 바와 같이, 용어 "tracrRNA" 또는 "tracrRNA 세그먼트"는 단백질-결합 세그먼트를 포함하는 RNA 분자 또는 이의 일부를 지칭한다(예를 들어, 단백질-결합 세그먼트는 CRISPR-관련 단백질, 예컨대, Cas9와 상호 작용할 수 있음). 본 발명은 또한 조작된 tracrRNA를 포함하는 가이드 RNA를 제공하고, 여기서 tracrRNA는 공여자 DNA 분자에 결합할 수 있는 베이트 RNA 세그먼트를 추가로 포함한다. 조작된 tracrRNA는 이중-가이드 시스템에서와 같이 물리적으로 구별되는 분자일 수 있거나, sgRNA 분자의 세그먼트일 수 있다.
일부 구현예에서, sgRNA로서 또는 둘 이상의 RNA 분자로서의 가이드 RNA는, 일부 CRISPR-관련 뉴클레아제, 예컨대, Cpf1(Cas12a로도 알려짐)이 이의 RNA-매개 엔도뉴클레아제 활성을 위해 tracrRNA를 필요로 하지 않는 것으로 당업계에 알려져 있으므로, tracrRNA를 함유하지 않는다(문헌[Qi et al., 2013, Cell, 152: 1173-1183; Zetsche et al., 2015, Cell 163: 759-771]). 본 발명의 이러한 가이드 RNA는 crRNA와 crRNA의 5' 말단 또는 3' 말단에서 작동 가능하게 연결된 베이트 RNA를 포함할 수 있다. Cpf1은 또한 이의 동족 프리-crRNA에 대한 RNase 활성을 갖는다(문헌[Fonfara et al., 2016, Nature, doi.org/10.1038/nature17945]). 본 발명의 가이드 RNA는 Cpf1이 성숙 crRNA로 가공되는 다중 crRNA를 포함할 수 있다. 일부 구현예에서, 이들 crRNA 각각은 베이트 RNA에 작동 가능하게 연결된다. 다른 구현예에서, 이들 crRNA 중 적어도 하나는 베이트 RNA에 작동 가능하게 연결된다. 베이트 RNA는 본원의 실시예에 기재된 바와 같이, 관심있는 서열(SOI) 또는 표적 게놈 부위에 특이적일 수 있다.
본 발명은 또한 본 발명의 가이드 RNA를 인코딩하는 핵산 서열을 포함하는 핵산 분자를 제공한다. 핵산 분자는 DNA 또는 RNA 분자일 수 있다. 일부 구현예에서, 핵산 분자는 원형화된다. 다른 구현예에서, 핵산 분자는 선형이다. 일부 구현예에서, 핵산 분자는 단일 가닥이거나, 부분적으로 이중-가닥이거나, 이중-가닥이다. 일부 구현예에서, 핵산 분자는 적어도 하나의 폴리펩티드와 복합체화된다. 폴리펩티드는 핵산 인식 또는 핵산 결합 도메인을 가질 수 있다. 일부 구현예에서, 폴리펩티드는, 예를 들어, 본 발명의 키메라 RNA, 뉴클레아제, 및 선택적으로 공여자 분자의 전달을 매개하기 위한 셔틀이다. 일부 구현예에서, 폴리펩티드는 Feldan Shuttle(본원에 참고로 포함된 미국 특허 공개 제20160298078호)이다. 핵산 분자는 키메라 RNA의 발현을 유도할 수 있는 발현 카세트를 포함할 수 있다. 핵산 분자는 예를 들어, CRISPR-관련 뉴클레아제와 같은 뉴클레아제를 발현할 수 있는 추가의 발현 카세트를 추가로 포함할 수 있다. 본 발명은 또한 본 발명의 키메라 RNA를 인코딩하는 핵산 서열을 포함하는 발현 카세트를 제공한다.
"부위-지정 변형 폴리펩티드"는 표적 DNA(예를 들어, 표적 DNA의 절단 또는 메틸화) 및/또는 표적 DNA와 결부된 폴리펩티드(예를 들어, 히스톤 꼬리의 메틸화 또는 아세틸화)를 변형시킨다. 부위-지정 변형 폴리펩티드는 또한 본원에서 "부위-지정 폴리펩티드" 또는 "RNA 결합 부위-지정 변형 폴리펩티드"로 지칭된다. 부위-지정 변형 폴리펩티드는 단일 RNA 분자 또는 적어도 두 개의 RNA 분자의 RNA 이중체인 가이드 RNA와 상호 작용하고, 가이드 RNA와의 이의 회합에 의해 DNA 서열(예를 들어, 염색체 서열 또는 염색체 외 서열, 예를 들어, 에피솜 서열, 미니서클 서열, 미토콘드리아 서열, 엽록체 서열 등)에 가이딩된다.
일부 경우에, 부위-지정 변형 폴리펩티드는 자연 발생적 변형 폴리펩티드이다. 다른 경우에, 부위-지정 변형 폴리펩티드는 자연 발생적 폴리펩티드가 아니다(예를 들어, 변형, 예를 들어, 돌연변이, 결실, 삽입된 키메라 폴리펩티드 또는 자연 발생적 폴리펩티드). 예시적인 자연 발생적 부위-지정 변형 폴리펩티드는 당업계에 알려져 있다(예를 들어, 둘 모두 본원에 참고로 포함된 문헌[Makarova et al., 2017, Cell 168: 328-328.e1] 및 문헌[Shmakov et al., 2017, Nat Rev Microbiol 15(3): 169-182]을 참조함). 이러한 자연 발생적 폴리펩티드는 DNA-표적화 RNA에 결합하고, 그에 따라 표적 DNA 내의 특정 서열로 지향되고, 표적 DNA를 절단하여 이중 가닥 파손을 생성한다.
부위-지정 변형 폴리펩티드는 RNA-결합 부분과 활성 부분의 두 부분을 포함한다. 일부 구현예에서, 부위-지정 변형 폴리펩티드는 다음을 포함한다: (i) DNA-표적화 RNA와 상호 작용하는 RNA-결합 부분으로서, DNA-표적화 RNA는 표적 DNA 내의 서열에 상보적인 뉴클레오티드 서열을 포함하는, RNA-결합 부분; 및 (ii) 부위-지정 효소 활성(예를 들어, DNA 메틸화를 위한 활성, DNA 절단을 위한 활성, 히스톤 아세틸화를 위한 활성, 히스톤 메틸화를 위한 활성 등)을 나타내는 활성 부분으로서, 효소 활성 부위는 DNA-표적화 RNA에 의해 결정되는, 활성 부분. 다른 구현예에서, 부위-지정 변형 폴리펩티드는 다음을 포함한다: (i) DNA-표적화 RNA와 상호 작용하는 RNA-결합 부분으로서, DNA-표적화 RNA는 표적 DNA 내의 서열에 상보적인 뉴클레오티드 서열을 포함하는, RNA-결합 부분; 및 (ii) 표적 DNA 내에서 전사를 조절하는(예를 들어, 전사를 증가시키거나 감소시키는) 활성 부분으로서, 표적 DNA 내의 조절되는 전사 부위는 DNA-표적화 RNA에 의해 결정되는, 활성 부분.
일부 경우에, 부위-지정 변형 폴리펩티드는 표적 DNA를 변형시키는 효소 활성(예를 들어, 뉴클레아제 활성, 메틸트랜스퍼라제 활성, 데메틸라제 활성, DNA 복구 활성, DNA 손상 활성, 탈아미노화 활성, 디스뮤타제 활성, 알킬화 활성, 탈퓨린화 활성, 산화 활성, 피리미딘 이량체 형성 활성, 인테그라제 활성, 트랜스포사제 활성, 재조합 효소 활성, 중합 효소 활성, 리가제 활성, 헬리카제 활성, 광분해 효소 활성 또는 글리코실라제 활성)을 갖는다. 다른 경우에, 부위-지정 변형 폴리펩티드는 표적 DNA와 결부된 폴리펩티드(예를 들어, 히스톤)를 변형시키는 효소 활성(예를 들어, 메틸트랜스퍼라제 활성, 데메틸라제 활성, 아세틸트랜스퍼라제 활성, 데아세틸라제 활성, 키나제 활성, 포스파타제 활성, 유비퀴틴 리가제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, 수모일화(SUMOylating) 활성, 탈수모일화(deSUMOylating) 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성 또는 탈미리스토일화 활성)을 갖는다.
일부 경우에, 다양한 부위-지정 변형 폴리펩티드, 예를 들어, 다양한 Cas9 단백질(즉, 다양한 종으로부터의 Cas9 단백질)이 다양한 Cas9 단백질의 다양한 효소 특성을 이용하기 위해(예를 들어, 다양한 프로토스페이서 인접 모티프(PAM) 서열 선호를 위해; 효소 활성의 증가 또는 감소를 위해; 세포 독성 수준의 증가 또는 감소를 위해; NHEJ, 상동성-지정 복구, 단일 가닥 파손, 이중 가닥 파손 사이의 균형을 변화시키기 위해 등) 본 발명의 다양한 제공된 방법에서 사용하기에 유리할 수 있다. 다양한 종으로부터의 Cas9 단백질(예를 들어, 문헌[Shmakov et al., 2017]에 개시된 것들, 또는 그로부터 유래된 폴리펩티드들)은 표적 DNA 내의 다양한 PAM 서열을 필요로 할 수 있다. 따라서, 선택된 특정 Cas9 효소의 경우, PAM 서열 요건은 Cas9 활성을 위해 필요한 것으로 알려진 5'-N GG-3' 서열(여기서, N은 A, T, C 또는 G임)과 상이할 수 있다. 매우 다양한 종으로부터의 많은 Cas9 오르토로그가 본원에서 확인되었고, 단백질들은 몇 개의 동일한 아미노산을 공유한다. 모든 확인된 Cas9 오르토로그는 중심 HNH 엔도뉴클레아제 도메인 및 스플릿(split) RuvC/RNaseH 도메인을 갖는 동일한 도메인 아키텍처(architecture)를 갖는다. Cas9 단백질은 보존된 아키텍처를 갖는 4개의 핵심 모티프를 공유하는데, 모티프 1, 2 및 4는 RuvC 유사 모티프인 한편, 모티프 3은 HNH-모티프이다.
부위-지정 변형 폴리펩티드는 또한 키메라 및 변형된 Cas9 뉴클레아제일 수 있다. 예를 들어, 이는 변형된 Cas9 "염기 편집기"일 수 있다. 염기 편집은 DNA 절단 또는 공여자 DNA 분자를 필요로 하지 않고 프로그래밍 가능한 방식으로 하나의 표적 DNA 염기의 또 다른 염기로의 직접적이고 비가역적인 전환을 가능하게 한다. 예를 들어, 문헌[Komor et al (2016, Nature, 533: 420-424)]에는 Cas9-시티딘 데아미나제 융합이 교시되어 있으며, 여기서 Cas9는 또한 비활성화되어 이중-가닥 DNA 파손을 유도하지 않도록 조작되었다. 추가로, 문헌[Gaudelli et al (2017, Nature, doi:10.1038/nature24644)]에는 tRNA 아데노신 데아미나제에 융합된 촉매 활성이 손상된(catalytically impaired) Cas9가 교시되어 있으며, 이는 표적 DNA 서열에서 A/T의 G/C로의 전환을 매개할 수 있다. 본 발명의 방법 및 조성물에서 부위-지정 변형 폴리펩티드로 작용할 수 있는 또 다른 부류의 조작된 Cas9 뉴클레아제는, NG, GAA, 및 GAT를 비롯한 광범위한 PAM 서열을 인식할 수 있는 변이체이다(문헌[Hu et al., 2018, Nature, doi:10.1038/nature26155]).
자연적으로 발생하는 것들 및/또는 자연 발생적 Cas9 단백질로부터 돌연변이되거나 변형된 것들을 포함하는 임의의 Cas9 단백질은 본 발명의 방법 및 조성물에서 부위-지정 변형 폴리펩티드로서 사용될 수 있다. 촉매 활성 Cas9 뉴클레아제는 표적 DNA를 절단하여 이중 가닥 파손을 생성한다. 이어서 이러한 파손은 다음 두 가지 방법 중 하나로 세포에 의해 복구된다: 비-상동성 단부 결합 및 상동성-지정 복구.
비-상동성 단부 결합(NHEJ)에서, 이중-가닥 파손은 파손 단부들의 서로에 대한 직접 결찰에 의해 복구된다. 그와 같이, 새로운 핵산 물질이 부위에 삽입되지 않지만, 일부 핵산 물질이 손실되어 결실을 초래할 수 있다. 상동성-지정 복구에서, 절단된 표적 DNA 서열에 대해 상동성을 갖는 공여자 DNA 분자 또는 개재 DNA는 절단된 표적 DNA 서열의 복구를 위한 주형으로 사용되며, 이는 공여자 폴리뉴클레오티드로부터 표적 DNA로의 유전 정보의 전달을 초래한다. 그와 같이, 새로운 핵산 물질이 부위에 삽입되거나 카피될 수 있다. 일부 경우에, 표적 DNA는 공여자 분자, 예를 들어, 공여자 DNA 분자 또는 개재 DNA 분자와 접촉한다. 일부 경우에, 공여자 DNA 분자 또는 개재 DNA 분자가 세포에 도입된다. 일부 경우에, 공여자 DNA 분자 또는 개재 DNA 분자의 적어도 한 세그먼트가 세포의 게놈에 통합된다.
NHEJ 및/또는 상동성-지정 복구로 인한 표적 DNA의 변형은, 예를 들어, 유전자 교정, 유전자 대체, 유전자 태깅(tagging), 트랜스진 삽입, 뉴클레오티드 결실, 유전자 붕괴, 유전자 돌연변이 등을 야기한다. 따라서, 부위-지정 변형 폴리펩티드에 의한 DNA의 절단은, 표적 DNA 서열을 절단하여 세포가 외인적으로 제공된 공여자 폴리뉴클레오티드의 부재하에서 서열을 복구할 수 있게 함으로써 표적 DNA 서열로부터 핵산 물질을 결실시키기 위해(예를 들어, 세포를 감염에 취약하게 만드는 유전자(예를 들어, T 세포를 HIV 감염에 취약하게 만드는 CCR5 또는 CXCR4 유전자)를 붕괴시키기 위해, 뉴런에서 질병-유발 트리뉴클레오티드 반복 서열을 제거하기 위해, 연구에서 질병 모델로서 유전자 녹아웃(knock out) 및 돌연변이를 생성하기 위해 등) 사용될 수 있다. 따라서, 대상 방법은 유전자를 녹아웃시키거나(전사 또는 변경된 전사의 완전한 결여를 초래함) 표적 DNA에서 선택된 유전자좌로 유전 물질을 녹인(knock in)시키는 데 사용될 수 있다. 대안적으로, DNA-표적화 RNA 이중체 및 부위-지정 변형 폴리펩티드가 표적 DNA 서열에 대해 상동성을 갖는 적어도 한 세그먼트를 포함하는 공여자 분자와 함께 세포에 공동-투여되는 경우, 대상 방법은 표적 DNA 서열에 핵산 물질을 부가, 즉, 삽입하거나 표적 DNA 서열로 핵산 물질을 대체하는 것(예를 들어, 단백질, siRNA, miRNA 등을 인코딩하는 핵산을 "녹인"하는 것), 태그(예를 들어, 6xHis, 형광 단백질(예를 들어, 녹색 형광단백질, 황색 형광 단백질 등), 헤마글루티닌(HA), FLAG 등)를 부가하는 것, 유전자에 조절 서열(예를 들어, 프로모터, 폴리아데닐화 신호, 내부 리보솜 진입 서열(IRES), 2A 펩티드, 시작 코돈, 정지 코돈, 스플라이스 신호, 국재화 신호(localization signal) 등)을 부가하는 것, 핵산 서열을 변형(예를 들어, 돌연변이를 도입)하는 것 등을 위해 사용될 수 있다. 그와 같이, DNA-표적화 RNA 이중체 및 부위-지정 변형 폴리펩티드를 포함하는 복합체는, 예를 들어, 질병을 치료 등을 위한 유전자 요법에 사용되거나 항바이러스, 항병원체, 또는 항암 치료제로서 사용되는 바와 같은, 부위-특이적, 즉, "표적화된" 방식으로 DNA를 변형시키는 것이 바람직한 임의의 시험관내 또는 생체내 적용, 예를 들어, 유전자 녹아웃, 유전자 녹인, 유전자 편집, 유전자 태깅 등에 있어, 농업에서 유전자 변형된 유기체의 생산에 있어, 치료, 진단, 또는 연구 목적을 위한 세포에 의한 대규모 단백질 생산에 있어, iPS 세포의 유도에 있어, 생물학적 연구에 있어, 결실 또는 대체를 위한 병원체의 유전자의 표적화 등에 있어 유용하다.
용어 "CRISPR-관련 단백질", "Cas 단백질", "CRISPR-관련 뉴클레아제" 또는 "Cas 뉴클레아제"는 야생형 Cas 단백질, 그의 단편, 또는 그의 돌연변이체 또는 변이체를 지칭한다. 용어 "Cas 돌연변이체" 또는 "Cas 변이체"는 야생형 Cas 단백질의 단백질 또는 폴리펩티드 유도체, 예를 들어, 하나 이상의 점 돌연변이, 삽입, 결실, 트렁케이션(truncation)을 갖는 단백질, 융합 단백질, 또는 그들의 조합을 지칭한다. 특정 구현예에서, Cas 돌연변이체 또는 Cas 변이체는, 식물로부터 유래된 핵 국재화 신호(NLS)에 작동 가능하게 연결된 본원에 기재된 Cas9 변이체와 같은 Cas 단백질의 뉴클레아제 활성을 실질적으로 보유한다. 특정 구현예에서, Cas 뉴클레아제는 하나 또는 둘 모두의 뉴클레아제 도메인이 비활성이 되도록 돌연변이되며, 예를 들어, dCas9로 지칭되는 촉매 활성이 없는(catalytically dead) Cas9는 여전히 특정 게놈 위치를 표적으로 할 수 있지만 엔도뉴클레아제 활성은 갖지 않는다(본원에 참고로 포함된 문헌[Qi et al., 2013, Cell, 152: 1173-1183]). 일부 구현예에서, Cas 뉴클레아제는, 그의 야생형 대응물의 뉴클레아제 활성의 일부 또는 전부를 결여하도록 돌연변이된다. Cas 단백질은 Cas9, Cpf1(본원에 참고로 포함된 문헌[Zetsche et al., 2015, Cell,163: 759-771]) 또는 임의의 또 다른 CRISPR-관련 뉴클레아제일 수 있다.
테르무스 테르모필루스(Thermus thermophilus)와 같은 박테리아로부터의 아르고너트 단백질도 CRISPR/Cas9와 유사한 방식으로 게놈 편집으로서 사용될 수 있다. Cas9와 유사하게, 아르고너트 단백질은 침투 게놈을 분해하도록 가이드로서 올리고뉴클레오티드를 사용하는 것으로 여겨진다. 이들 가이드와 테르무스 테르모필루스 아르고노트 단백질의 복합체는 고온(75도씨)에서 상보성 DNA 가닥을 절단한다. WO 2014/189628에는 이러한 시스템이 게놈 편집에 사용될 수 있는 한 가지 방식이 기재되어 있다. 추가 예로는 WO2014/189628, WO2016/161375, 및 WO2016/166268이 포함된다.
본 발명은 표적 유전자의 발현을 감소시키는 방법으로서, 식물 세포에 상기 식물 세포의 네이티브 프리-miRNA를 인코딩하는 게놈 부위에서 부위-지정 DNA 절단이 가능한 뉴클레아제를 도입하는 단계, 상기 게놈 부위에서 또는 상기 게놈 부위 부근에서 적어도 하나의 이중 가닥 파손을 생성하는 단계, 상기 적어도 하나의 이중 가닥 파손이 상기 게놈 부위를 대체하는 개재 DNA로 복구된 세포를 선택하는 단계, 및 표적 유전자의 발현을 감소시키는 단계로 구성되고, 상기 개재 DNA는 상기 표적 유전자에 상보적인 amiRNA 코어 서열을 포함하는 변형된 프리-miRNA를 인코딩하는, 방법을 제공한다.
게놈 부위는 본 발명의 방법에 의해 변형되는 식물 세포의 네이티브 프리-miRNA를 인코딩한다. 개재 DNA는, 식물 세포의 네이티브 프리-miRNA를 인코딩하는 게놈 부위와 동일하지만 네이티브 miRNA 코어 서열이 새로운 표적 유전자에 상보적인 amiRNA 코어 서열로 대체된 DNA의 조각이다. 개재 DNA는 뉴클레아제와 함께 식물 세포에 도입된다.
추가의 구현예에서, 본 발명은 임의의 전술한 구현예의 방법으로서, 네이티브 프리-miRNA를 인코딩하는 게놈 부위에서 부위-지정 DNA 절단이 가능한 뉴클레아제는 상기 게놈 부위 서열에서 하나의 이중 가닥 파손을 생성하는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예의 방법으로서, 네이티브 프리-miRNA를 인코딩하는 게놈 부위에서 부위-지정 DNA 절단이 가능한 뉴클레아제는 상기 게놈 부위 부근에, 바람직하게는 상기 게놈 부위의 업스트림 또는 다운스트림으로 2 kb 이내에 하나의 이중 가닥 파손을 생성하는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예의 방법으로서, 네이티브 프리-miRNA를 인코딩하는 게놈 부위에서 부위-지정 DNA 절단이 가능한 뉴클레아제는 상기 게놈 부위 부근에, 바람직하게는 상기 게놈 부위의 업스트림 또는 다운스트림으로 500개 뉴클레오티드 이내에 하나의 이중 가닥 파손을 생성하는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예의 방법으로서, 네이티브 프리-miRNA를 인코딩하는 게놈 부위에서 부위-지정 DNA 절단이 가능한 뉴클레아제는 상기 게놈 부위의 업스트림 또는 다운스트림으로 100개 뉴클레오티드 이내에 하나의 이중 가닥 파손을 생성하는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예의 방법으로서, 상기 식물 세포의 네이티브 프리-miRNA를 인코딩하는 게놈 부위에서 부위-지정 DNA 절단이 가능한 뉴클레아제는 상기 게놈 부위에서 또는 상기 게놈 부위 부근에 적어도 두 개의 이중 가닥 파손을 생성하는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예의 방법으로서, 표적 유전자는 외인성 표적 유전자, 더욱 바람직하게는 해충 유전자, 더욱 바람직하게는 바이러스, 진균 또는 미생물 유전자인, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 임의의 전술한 구현예의 방법으로서, 표적 유전자는 해충 유전자 또는 선충류 해충 유전자인, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 표적 유전자는 부니아바이러스목 유전자, 바람직하게는 토스포바이러스 유전자, 더욱 바람직하게는 토마토 반점 시듦 바이러스(TSWV) 유전자인, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 표적 유전자는 내인성 식물 유전자인, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 표적 내인성 식물 유전자는 식물 발달, 생물학적 또는 비생물학적 스트레스에 관여하는 유전자인, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 상기 식물 세포는 가지과, 옥수수, 벼, 카놀라, 대두 또는 해바라기 세포인, 방법에 관한 것이다. 추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 상기 식물 세포는 토마토 세포인, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 네이티브 프리-miRNA를 인코딩하는 상기 게놈 부위는 네이티브 토마토 프리-miRNA를 인코딩하는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 상기 게놈 부위는 SEQ ID NO: 6 또는 SEQ ID NO: 7을 포함하는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 상기 게놈 부위는 SEQ ID NO: 6 또는 SEQ ID NO: 7로 구성되는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 상기 게놈 부위는 SlmiR156b 또는 SlmiR1919b 유전자를 인코딩하는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 개재 DNA는 SEQ ID NO: 1 내지 SEQ ID NO: 5 중 어느 하나를 포함하는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 개재 DNA는 SEQ ID NO: 22 내지 SEQ ID NO: 24 중 어느 하나를 포함하는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 개재 DNA는 SEQ ID NO: 8 내지 SEQ ID NO: 17 중 어느 하나를 포함하는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 상기 뉴클레아제는 메가뉴클레아제(MN), 징크-핑거 뉴클레아제(ZFN), 전사-활성자 유사 이펙터 뉴클레아제(TALEN), Cas9 뉴클레아제, Cfp1 뉴클레아제, dCas9-FokI, dCpf1-FokI, 키메라 Cas9/Cpf1-시티딘 데아미나제, 키메라 Cas9/Cpf1-아데닌 데아미나제, 키메라 FEN1-FokI, 및 Mega-TAL, 닉카제 Cas9(nCas9), 키메라 dCas9 비-FokI 뉴클레아제 및 dCpf1 비-FokI 뉴클레아제로 구성된 군으로부터 선택되는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 상기 세포는 반수체, 이배체, 배수체, 또는 헥시포이드 게놈을 갖는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 상기 세포는 변형된 프리-miRNA에 대해 이형접합인, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 상기 세포는 변형된 프리-miRNA의 하나의 카피 및 네이티브 프리-miRNA의 하나의 카피를 갖는, 방법에 관한 것이다.
본 발명의 맥락에서, 변형된 프리-miRNA의 하나의 카피를 포함하는 반수체 식물 세포는, 예를 들어, 종자 생산을 위한 육종 공정 및 방법에서 유용성을 갖는다.
추가의 구현예에서, 본 발명은 식물 종자, 바람직하게는 가지과, 옥수수, 벼, 카놀라, 대두 또는 해바라기 종자, 더욱 바람직하게는 토마토 종자를 생산하는 방법으로서, 전술한 구현예 중 어느 하나의 방법에 의해 수득된 식물 세포를 포함하는 식물을 그 자체와 또는 동일한 작물의 또 다른 식물과 교배하는 단계를 포함하는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 상기 방법은 하나 이상의 가이드 서열의 사용을 추가로 포함하는, 방법에 관한 것이다. 추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 하나 이상의 가이드 서열은 상기 뉴클레아제와 함께 세포에 도입되는, 방법에 관한 것이다. 추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법으로서, 하나 이상의 가이드 서열은 표적 게놈 부위로부터 유래되는, 방법에 관한 것이다.
추가의 구현예에서, 임의의 전술한 구현예의 방법은 식물 해충에 저항성을 부여한다.
추가의 구현예에서, 본 발명은 전술한 구현예 중 어느 하나의 방법에 의해 수득된 식물 세포, 바람직하게는 가지과, 옥수수, 벼, 카놀라, 대두 또는 해바라기 세포, 더욱 바람직하게는 토마토 식물 세포에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예의 식물 세포로서, 상기 세포는 SEQ ID NO: 1 내지 SEQ ID NO: 5 중 어느 하나를 포함하는, 식물 세포에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예의 식물 세포로서, 상기 세포는 SEQ ID NO: 22 내지 SEQ ID NO: 24 중 어느 하나를 포함하는, 식물 세포에 관한 것이다.
추가의 구현예에서, 본 발명은 전술한 구현예의 식물 세포로서, 상기 세포는 SEQ ID NO: 8 내지 SEQ ID NO: 17 중 어느 하나를 포함하는, 식물 세포에 관한 것이다.
추가의 구현예에서, 본 발명은 SEQ ID NO: 1 내지 SEQ ID NO: 5 중 어느 하나를 포함하는 식물 세포에 관한 것이다.
추가의 구현예에서, 본 발명은 SEQ ID NO: 22 내지 SEQ ID NO: 24 중 어느 하나를 포함하는 식물 세포에 관한 것이다.
추가의 구현예에서, 본 발명은 SEQ ID NO: 8 내지 SEQ ID NO: 17 중 어느 하나를 포함하는 식물 세포에 관한 것이다.
추가의 구현예에서, 본 발명은 SEQ ID NO: 6의 하나의 카피 및 SEQ ID NO: 8 내지 SEQ ID NO: 12 중 어느 하나의 하나의 카피를 포함하는 이배체 식물 세포에 관한 것이다.
추가의 구현예에서, 본 발명은 SEQ ID NO: 7의 하나의 카피 및 SEQ ID NO: 13 내지 SEQ ID NO: 17 중 어느 하나의 하나의 카피를 포함하는 이배체 식물 세포에 관한 것이다.
추가의 구현예에서, 본 발명은 식물 종자, 바람직하게는 가지과, 옥수수, 벼, 카놀라, 대두 또는 해바라기 종자, 더욱 바람직하게는 토마토 종자를 생산하는 방법으로서, 전술한 구현예 중 어느 하나에 따른 식물 세포를 포함하는 식물을 그 자체와 또는 동일한 작물의 또 다른 식물과 교배하는 단계를 포함하는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 임의의 전술한 구현예에 따른 식물 세포를 포함하는 식물에 관한 것이다. 추가의 구현예에서, 본 발명은 임의의 전술한 구현예에 따른 식물 세포를 포함하는 토마토 식물에 관한 것이다.
추가의 구현예에서, 본 발명은 임의의 전술한 구현예에 따른 식물 세포를 포함하는 식물 부분에 관한 것이다. 추가의 구현예에서, 본 발명은 임의의 전술한 구현예에 따른 식물 세포를 포함하는 토마토 식물 부분에 관한 것이다. 추가의 구현예에서, 식물 부분은 식물 종자, 바람직하게는 토마토 식물 종자이다.
추가의 구현예에서, 임의의 전술한 구현예에 따른 식물 또는 식물 부분은 해충 저항성을 제공한다. 추가의 구현예에서, 임의의 전술한 구현예에 따른 식물 또는 식물 부분은 토스포바이러스에 대한 해충 저항성을 제공한다. 추가의 구현예에서, 임의의 전술한 구현예에 따른 식물 또는 식물 부분은 TSWV에 대한 저항성을 제공한다.
추가의 구현예에서, 본 발명은 식물 종자, 바람직하게는 가지과, 옥수수, 벼, 카놀라, 대두 또는 해바라기 종자, 더욱 바람직하게는 토마토 종자를 생산하는 방법으로서, 전술한 구현예 중 어느 하나에 따른 식물을 그 자체와 또는 동일한 작물의 또 다른 식물과 교배하는 단계를 포함하는, 방법에 관한 것이다.
추가의 구현예에서, 본 발명은 식물, 바람직하게는 가지과, 옥수수, 벼, 카놀라, 대두 또는 해바라기 식물, 더욱 바람직하게는 토마토 식물을 생산하는 방법으로서, 전술한 구현예 중 어느 하나에 따른 식물을 그 자체와 또는 동일한 작물의 또 다른 식물과 교배하여, 본 발명의 amiRNA를 포함하고 신규한 표현형을 나타내는 자손 식물을 생산하는 단계를 포함하는, 방법에 관한 것이다.
본 발명의 방법은 모델 작물 토마토 및 모델 바이러스 토마토 반점 시듦 바이러스(TSWV)로 실시되고 예시되었다. 본원에 개시된 정보를 갖는 숙련자는 상이한 식물에서 그리고 상이한 표적 유형으로 지식을 쉽게 전하고 본 발명의 방법을 수행할 수 있다.
실시예
실시예 1: amiRNA 코어로서 사용하기에 적합한 TSWV 서열의 확인
공개된 TSWV 게놈을 수집하고(표 1), 정렬하였다.
표 1은 NCBI(월드 와이드 웹 www.ncbi.nlm.nih.gov/nuccore/에서 확인됨)로부터 수집된 TSWV 게놈을 열거한 것이다.
Figure pct00004
Figure pct00005
높은 유사성을 갖는 보존된 TSWV 영역을 선택하였다. 21-nt 서열을 GC 함량, 2차 구조, 특정 위치 및 토마토 식물 게놈 내 표적외에 대해 분석하였다(TSWV 21-nt 서열 대 토마토 게놈). 30% 내지 60%의 GC 함량, 및 토마토 게놈에 3개 미만의 불일치 히트 수를 갖는 TSWV 서열이 바람직했다.
주어진 amiRNA 코어 바이러스 서열이 바이러스를 방제하는 데 효과적일 수 있는지의 여부를 시험하기 위해, 잠재적인 표적을 상술된 바와 같은 TSWV 바이러스 게놈에서 확인하고, 일과성 실험에서 시험하였다. 아라비돕시스(Arabidopsis) 네이티브 프리-miRNA AtmiR159a를 스캐폴드로서 사용하였다. 네이티브 AtmiR159a 코어 서열을 TSWV 표적 유전자에 상보적인 설계된 21-nt 서열로 대체함으로써 변형된 miRNA를 직접적으로 합성하였다. 변형된 miRNA를 구조 및 안정성(MFE)에 대해 네이티브 miRNA와 비교하고, 최소 변화가 있는 이들 miRNA를 일과성 바이러스 검정에서 실험 평가 및 검증을 위해 선택하였다. 이들 일과성 검정을 위해, 이원 벡터 17839(도 5)를 사용하여, 설계된 amiRNA를 발현시켰다. 이원 벡터 17839 및 합성 AtmiR159a-amiRNA 단편 둘 모두를 BamHI/NcoI에 의해 절단하고, 겔 정제하였다. 두 단편을 함께 결찰하고, DH5alpha 세포로 형질 전환시켰다. 양성 클론을 BamHI/NcoI 분해에 의해 확인하고, 모든 접합을 시퀀싱하였다.
표 2는 AtmiR159a 스캐폴드 내에서 amiRNA 코어로서 시험된 모든 TSWV 서열을 열거한 것이다. 이들 중 5개(SEQ ID NO: 1 내지 SEQ ID NO: 5)가 일과성 검정에서 TSWV에 대한 높은 저항성을 제공하기에 적합한 것으로 확인되었다(도 2 및 도 3).
Figure pct00006
리드 ET-23, ET-24, ET-26, ET-38 및 ET-39는 TSWV에 대해 고수준의 저항성을 제공한다. 따라서, 실시예 1에 기재된 이러한 접근법에 의해, 새로운 표적 유전자에 상동성이고 신규한 표현형을 얻는 데 효과적으로 사용될 수 있는 적합한 amiRNA 코어 서열을 확인하는 것이 가능하다. ET-24의 역보체 서열인 ET-26도 고수준의 저항성을 제공한다는 점이 주목할 만하며, 이는 효과적인 amiRNA 코어 서열이 확인되면 본 발명의 방법을 이용하여 이의 역보체 서열도 성공적으로 이용될 수 있다는 것을 시사한다.
실시예 2: 적합한 네이티브 토마토 프리-miRNA 서열의 확인
주어진 네이티브 토마토 프리-miRNA 서열이 바이러스를 방제하기 위한 TSWV amiRNA 코어 서열의 리셉터클로서 효과적으로 사용될 수 있는지의 여부를 시험하기 위해, 잠재적인 프리-miRNA 스캐폴드를 토마토 게놈에서 확인하고, TSWV amiRNA 코어 서열로서 ET-24(SEQ ID NO: 2)를 사용하여 시험하였다(실시예 1 참조).
공개된 토마토 sRNA-seq 데이터를 수집하여(표 3) 네이티브 miRNA 발현을 확인하였다.
표 3은 NCBI SRA 데이터베이스(월드 와이드 웹 www.ncbi.nlm.nih.gov/sra/에서 확인됨)로부터 수집된 토마토 sRNA-seq 데이터세트를 열거한 것이다.
Figure pct00007
이들 데이터세트 전반에 걸쳐 성숙 miRNA 풍부도를 분석하고, miRBase의 공개된 데이터(월드 와이드 웹 www.mirbase.org/에서 확인됨)와 비교하였다. 다음 기준을 이용하여, 다계통 구성원을 갖는 miRNA를 포함하여 변형을 위한 토마토 네이티브 miRNA를 선택함으로써, 동일한 성숙 miRNA, 및 특히 그린 조직에서의 높은 발현 수준을 생성하였다.
표 3에 열거된 일부 우수한 후보를 추가 실험을 위해 선택하였다. amiRNA 코어 서열 ET24(SEQ ID NO: 2)를 먼저 사용하여 이들 후보를 검증하고, 이후 새로운 21-nt 서열도 사용하였다. 이원 벡터 17839를 먼저 Kpn1/Nco1에 의해 분해하고, 5762 bp 단편을 겔 정제하였다. 변형된 프리-miRNA(miRNA 코어 서열은 확인된 amiRNA 코어 서열 ET-24에 의해 대체됨)와 함께 1 kb 프로모터 영역을 직접적으로 합성하고, Kpn1/Nco1에 의해 절단하였다. 두 단편을 함께 결찰하고, DH5alpha 세포로 형질 전환시켰다. 양성 클론을 Kpn1/Nco1 분해에 의해 확인하고, 모든 접합을 시퀀싱하였다.
표 4는 프리-miRNA 스캐폴드로서 시험된 모든 서열을 열거한 것이다. 이들 중 2개(SEQ ID NO: 9 및 SEQ ID NO: 14)가 일과성 검정에서 TSWV에 대한 높은 저항성을 제공하기에 적합한 것으로 확인되었다(도 4).
Figure pct00008
amiRNA 코어 TSWV 서열 ET-24(각각 SEQ ID NO: 9 및 SEQ ID NO: 14)를 보유하는 토마토 프리-miRNA 스캐폴드 ET-29 및 ET-35는 TSWV에 대한 우수한 수준의 저항성을 나타내는데, 이는 본 발명의 방법에 사용하기 위한 이들의 적합성을 시사한다.
실시예 3: amiRNA 코어 서열을 대체함으로써 토마토 바이러스 병원체 유전자 표적을 표적화하도록 네이티브 토마토 프리-miRNA를 변형하는 게놈 편집 작제물의 설계.
바이러스 유전자를 표적화하도록 토마토 네이티브 miRNA를 편집하는 것이 그러한 바이러스에 대한 저항성을 토마토에 제공할 수 있는지의 여부를 시험하기 위해, 하기 작제물을 네이티브 토마토 miRNA SlmiR156b를 편집하도록 설계하였다. 시험된 표적 바이러스 유전자는 TSWV로부터의 RNA 의존적 RNA 중합 효소(RdRp), 당단백질 전구체(Gn/Gc), 비-구조적 이동 단백질(NSm), 비-구조적 침묵화 억제 단백질(NSs) 및 뉴클레오캡시드 단백질(N)이었다. Cas9는 두 개의 gRNA와 사용되어 토마토 네이티브 SlmiR156b 유전자좌 주위에 이중-가닥 파손을 생성하고, 대체를 위해 변형된 amiRNA 공여자를 제공하였다.
토마토 형질 전환을 위한 이원 벡터 24598(도 6)은 토마토 SlmiR156b 유전자를 편집하기 위한 구성적 prAtEF1aA1-02 프로모터에 의해 구동되는 대두 코돈 최적화된 Cas9, 및 prAtU6-01 및 prSlU6에 의해 구동되는 두 개의 유전자 특이적 gRNA를 함유한다. 이 작제물은 TSWV 바이러스 게놈을 표적화하는 인공 코어 서열에 의해 네이티브 SlmiR156b 코어 서열을 대체하는 것이다. 1 kb 프로모터, 인공 코어를 갖는 프리-SlmiR156b 및 0.5 kb 종결자를 함유하는 1.5 kb 공여자 서열도 포함되었다. prGmEF-01에 의해 구동되는 cSpec-03은 선택 가능 마커로서 사용된다. 공여자 DNA 단편 및 prAtU6-01-rsgRNASlmiR156b-A(SEQ ID NO: 20) 및 prSlU6-rsgRNASlmiR156b-B(SEQ ID NO: 21)의 두 개의 gRNA 카세트를 Generalbiol에 의해 합성하였다. 이러한 이원 벡터에서 네 개의 카세트 모두는 단일 트랜스진의 일부였다.
SEQUENCE LISTING <110> Syngenta Crop Protection AG Syngenta Biotechnology China Co. Ltd. LIU, Juntao XU, Jianping CHEN, Yanhui LIU, Zhiqiang CHEN, Xi <120> Suppression of target gene expression through genome editing of native miRNAs <130> 81815-CN-REG-ORG-P-1 <160> 24 <170> PatentIn version 3.5 <210> 1 <211> 21 <212> DNA <213> Tomato spotted wilt tospovirus <400> 1 cagtgttgtc tgtgctatat a 21 <210> 2 <211> 21 <212> DNA <213> Tomato spotted wilt tospovirus <400> 2 atgaaatgtt cggggttaaa a 21 <210> 3 <211> 21 <212> DNA <213> Tomato spotted wilt tospovirus <400> 3 ttttaacccc gaacatttca t 21 <210> 4 <211> 21 <212> DNA <213> Tomato spotted wilt tospovirus <400> 4 ttcaaatgct ttgcttttca g 21 <210> 5 <211> 21 <212> DNA <213> Tomato spotted wilt tospovirus <400> 5 tagcagcata ctctttcccc t 21 <210> 6 <211> 1084 <212> DNA <213> Solanum lycopersicum <400> 6 attcggttac ctctctttcc tatgtaacta aatgtctgct aatgtattca caagtccaag 60 tgatgtattc gaaattataa aatttaagga attcttataa tttgaaaaag aagtagaaaa 120 taatgtaatt agctcttaac gctatgaaat ttatgtaaat tatataatta ttatgtactc 180 cttccgattc atatgacata tcttactttt aacctttaca ttttgttcaa aataagtaat 240 tttattgtaa ctaagaatgt attactatta tttagttttt caaatttacg ccttcttttg 300 ataagtgggt tttaactttt aacgtaacca agaaatgata ttaaatatgt actatataat 360 taagaataat tagtaaaaac aatttttaat attttaggac ctaaactttt tatttttttg 420 tgcgacatgt tacctaaaag atagtaaaaa aataattgcc aataataaat ggaataattt 480 tactagaaaa taaacatagg aaaagaaata tacgtaacac attaaattat atcaacggat 540 cattaaaatt cttttgtatt gtctatataa tactatataa aagtaaagaa ttctataaaa 600 ttaatttgag ttgacataga aaaactgttt tgggttaaat tttttactag ttgtgcacta 660 tttatcttcg atctataaat agatcgacat gttggaaaac actcaaacca tcctatgcta 720 taagataata tatagctaca tttcttagat aactagaaac ctccattagc ttcctattct 780 cataagcaaa tctccaatca taatttacaa actgagactc gatgtatgat cagtgataga 840 tttaaaattt agatatcaca agtgatatgt ttagatcata agggtctaga aatgcatatc 900 taactcgatg tattctatgt tgcactttgt cccgcatcac ctcacaactg taagtataaa 960 ttatttcaaa gagagcagga aagtattggg tgagatattg ttgacagaag atagagagca 1020 cgaataatga ggtgctaatt ggaagctgca ccttaattct ttgtgctctc tattcttctg 1080 tcat 1084 <210> 7 <211> 1207 <212> DNA <213> Solanum lycopersicum <400> 7 agcgaattat acagaacata attatgcaaa ttttgctata acatacaaat atgaatttta 60 tgtttgatat atgtgaaagt tgcccattat ggaattagct atgaaattta tggtaatttt 120 aagggacaat tacgcggtga agcaaactta tactacttaa atattcatca tagctatagt 180 ttgctataat taacactcgc gactaatatt atacattaat tatgtggcct gacttcgagt 240 ttgtataatt agtcagaata aacaaataca tgttataata tacaattatc taaccgatat 300 acataaacaa tttacctctc tcccactctt tgccctctct cgctcgtctc tctcccaatc 360 tcgttcttct cttcctccct ttcccagtat tgccgccact ctcccaatct ctctctcctc 420 tctcctccct ctcccaatct ctcttgccat atatacaaat acatatgtat aatatacaat 480 tatataacca atatacatat acaatgcacc tctccccctc tctttgccct ctctcctctc 540 tctcccagtc tcgcttgcct gtctcttctc tataacatgt agttacagat tgtaattatc 600 aaactgtaac tatgaagagt aattaaacta tttttgagtg actatacgtg aaagttcctc 660 taattttaat caattcatca caaatccata tctaaatgaa atgaacaaag aaaaattatt 720 attgtttagt tatgaatttt atcaatcact aattcacgtg aatattaggg aataaaaaat 780 gactactttg gcataatcta aacttgctag tagaaatttg aagttgcaaa aagaaaaaga 840 gaagcaaaag aagtgaaaga aaaagaggcg ttattgtttt ttactttatt cagtataaag 900 tgcgttttac tcttctattt cttgtagctc acaaatcgtc tttactgacc ctacaaattc 960 tcttccggca agttttcagg ttcctccgaa tcgctccgac gcctttgatg ttcacatctt 1020 ccggtagtcc tgtcgcagat gactttcgcc catttatgga accacacttt ctttaatttg 1080 aattctatgt ggtaggacga gagtcatctg tgacaggata atggaagatc gagttatcaa 1140 aggcttattg ggcgtttcct ttttcatctt gagttcgtac cagattaatg caaaaccgaa 1200 gaagtag 1207 <210> 8 <211> 1083 <212> DNA <213> Artificial sequence <220> <223> Solanum lycopersicum / Tomato spotted wilt tospovirus <400> 8 attcggttac ctctctttcc tatgtaacta aatgtctgct aatgtattca caagtccaag 60 tgatgtattc gaaattataa aatttaagga attcttataa tttgaaaaag aagtagaaaa 120 taatgtaatt agctcttaac gctatgaaat ttatgtaaat tatataatta ttatgtactc 180 cttccgattc atatgacata tcttactttt aacctttaca ttttgttcaa aataagtaat 240 tttattgtaa ctaagaatgt attactatta tttagttttt caaatttacg ccttcttttg 300 ataagtgggt tttaactttt aacgtaacca agaaatgata ttaaatatgt actatataat 360 taagaataat tagtaaaaac aatttttaat attttaggac ctaaactttt tatttttttg 420 tgcgacatgt tacctaaaag atagtaaaaa aataattgcc aataataaat ggaataattt 480 tactagaaaa taaacatagg aaaagaaata tacgtaacac attaaattat atcaacggat 540 cattaaaatt cttttgtatt gtctatataa tactatataa aagtaaagaa ttctataaaa 600 ttaatttgag ttgacataga aaaactgttt tgggttaaat tttttactag ttgtgcacta 660 tttatcttcg atctataaat agatcgacat gttggaaaac actcaaacca tcctatgcta 720 taagataata tatagctaca tttcttagat aactagaaac ctccattagc ttcctattct 780 cataagcaaa tctccaatca taatttacaa actgagactc gatgtatgat cagtgataga 840 tttaaaattt agatatcaca agtgatatgt ttagatcata agggtctaga aatgcatatc 900 taactcgatg tattctatgt tgcactttgt cccgcatcac ctcacaactg taagtataaa 960 ttatttcaaa gagagcagga aagtattggg tgagatattg cagtgttgtc tgtgctatat 1020 agaataatga ggtgctaatt ggaagctgca ccttaattct tttatatagc acagacaaca 1080 ctg 1083 <210> 9 <211> 1083 <212> DNA <213> Artificial sequence <220> <223> Solanum lycopersicum / Tomato spotted wilt tospovirus <400> 9 attcggttac ctctctttcc tatgtaacta aatgtctgct aatgtattca caagtccaag 60 tgatgtattc gaaattataa aatttaagga attcttataa tttgaaaaag aagtagaaaa 120 taatgtaatt agctcttaac gctatgaaat ttatgtaaat tatataatta ttatgtactc 180 cttccgattc atatgacata tcttactttt aacctttaca ttttgttcaa aataagtaat 240 tttattgtaa ctaagaatgt attactatta tttagttttt caaatttacg ccttcttttg 300 ataagtgggt tttaactttt aacgtaacca agaaatgata ttaaatatgt actatataat 360 taagaataat tagtaaaaac aatttttaat attttaggac ctaaactttt tatttttttg 420 tgcgacatgt tacctaaaag atagtaaaaa aataattgcc aataataaat ggaataattt 480 tactagaaaa taaacatagg aaaagaaata tacgtaacac attaaattat atcaacggat 540 cattaaaatt cttttgtatt gtctatataa tactatataa aagtaaagaa ttctataaaa 600 ttaatttgag ttgacataga aaaactgttt tgggttaaat tttttactag ttgtgcacta 660 tttatcttcg atctataaat agatcgacat gttggaaaac actcaaacca tcctatgcta 720 taagataata tatagctaca tttcttagat aactagaaac ctccattagc ttcctattct 780 cataagcaaa tctccaatca taatttacaa actgagactc gatgtatgat cagtgataga 840 tttaaaattt agatatcaca agtgatatgt ttagatcata agggtctaga aatgcatatc 900 taactcgatg tattctatgt tgcactttgt cccgcatcac ctcacaactg taagtataaa 960 ttatttcaaa gagagcagga aagtattggg tgagatattg atgaaatgtt cggggttaaa 1020 agaataatga ggtgctaatt ggaagctgca ccttaattct ttttttaacc ccgaacattt 1080 cat 1083 <210> 10 <211> 1083 <212> DNA <213> Artificial sequence <220> <223> Solanum lycopersicum / Tomato spotted wild tospovirus <400> 10 attcggttac ctctctttcc tatgtaacta aatgtctgct aatgtattca caagtccaag 60 tgatgtattc gaaattataa aatttaagga attcttataa tttgaaaaag aagtagaaaa 120 taatgtaatt agctcttaac gctatgaaat ttatgtaaat tatataatta ttatgtactc 180 cttccgattc atatgacata tcttactttt aacctttaca ttttgttcaa aataagtaat 240 tttattgtaa ctaagaatgt attactatta tttagttttt caaatttacg ccttcttttg 300 ataagtgggt tttaactttt aacgtaacca agaaatgata ttaaatatgt actatataat 360 taagaataat tagtaaaaac aatttttaat attttaggac ctaaactttt tatttttttg 420 tgcgacatgt tacctaaaag atagtaaaaa aataattgcc aataataaat ggaataattt 480 tactagaaaa taaacatagg aaaagaaata tacgtaacac attaaattat atcaacggat 540 cattaaaatt cttttgtatt gtctatataa tactatataa aagtaaagaa ttctataaaa 600 ttaatttgag ttgacataga aaaactgttt tgggttaaat tttttactag ttgtgcacta 660 tttatcttcg atctataaat agatcgacat gttggaaaac actcaaacca tcctatgcta 720 taagataata tatagctaca tttcttagat aactagaaac ctccattagc ttcctattct 780 cataagcaaa tctccaatca taatttacaa actgagactc gatgtatgat cagtgataga 840 tttaaaattt agatatcaca agtgatatgt ttagatcata agggtctaga aatgcatatc 900 taactcgatg tattctatgt tgcactttgt cccgcatcac ctcacaactg taagtataaa 960 ttatttcaaa gagagcagga aagtattggg tgagatattg ttttaacccc gaacatttca 1020 tgaataatga ggtgctaatt ggaagctgca ccttaattct ttatgaaatg ttcggggtta 1080 aaa 1083 <210> 11 <211> 1083 <212> DNA <213> Artificial sequence <220> <223> Solanum lycopersicum / Tomato spotted wild tospovirus <400> 11 attcggttac ctctctttcc tatgtaacta aatgtctgct aatgtattca caagtccaag 60 tgatgtattc gaaattataa aatttaagga attcttataa tttgaaaaag aagtagaaaa 120 taatgtaatt agctcttaac gctatgaaat ttatgtaaat tatataatta ttatgtactc 180 cttccgattc atatgacata tcttactttt aacctttaca ttttgttcaa aataagtaat 240 tttattgtaa ctaagaatgt attactatta tttagttttt caaatttacg ccttcttttg 300 ataagtgggt tttaactttt aacgtaacca agaaatgata ttaaatatgt actatataat 360 taagaataat tagtaaaaac aatttttaat attttaggac ctaaactttt tatttttttg 420 tgcgacatgt tacctaaaag atagtaaaaa aataattgcc aataataaat ggaataattt 480 tactagaaaa taaacatagg aaaagaaata tacgtaacac attaaattat atcaacggat 540 cattaaaatt cttttgtatt gtctatataa tactatataa aagtaaagaa ttctataaaa 600 ttaatttgag ttgacataga aaaactgttt tgggttaaat tttttactag ttgtgcacta 660 tttatcttcg atctataaat agatcgacat gttggaaaac actcaaacca tcctatgcta 720 taagataata tatagctaca tttcttagat aactagaaac ctccattagc ttcctattct 780 cataagcaaa tctccaatca taatttacaa actgagactc gatgtatgat cagtgataga 840 tttaaaattt agatatcaca agtgatatgt ttagatcata agggtctaga aatgcatatc 900 taactcgatg tattctatgt tgcactttgt cccgcatcac ctcacaactg taagtataaa 960 ttatttcaaa gagagcagga aagtattggg tgagatattg ttcaaatgct ttgcttttca 1020 ggaataatga ggtgctaatt ggaagctgca ccttaattct ttctgaaaag caaagcattt 1080 gaa 1083 <210> 12 <211> 1083 <212> DNA <213> Artificial sequence <220> <223> Solanum lycopersicum / Tomato spotted wild tospovirus <400> 12 attcggttac ctctctttcc tatgtaacta aatgtctgct aatgtattca caagtccaag 60 tgatgtattc gaaattataa aatttaagga attcttataa tttgaaaaag aagtagaaaa 120 taatgtaatt agctcttaac gctatgaaat ttatgtaaat tatataatta ttatgtactc 180 cttccgattc atatgacata tcttactttt aacctttaca ttttgttcaa aataagtaat 240 tttattgtaa ctaagaatgt attactatta tttagttttt caaatttacg ccttcttttg 300 ataagtgggt tttaactttt aacgtaacca agaaatgata ttaaatatgt actatataat 360 taagaataat tagtaaaaac aatttttaat attttaggac ctaaactttt tatttttttg 420 tgcgacatgt tacctaaaag atagtaaaaa aataattgcc aataataaat ggaataattt 480 tactagaaaa taaacatagg aaaagaaata tacgtaacac attaaattat atcaacggat 540 cattaaaatt cttttgtatt gtctatataa tactatataa aagtaaagaa ttctataaaa 600 ttaatttgag ttgacataga aaaactgttt tgggttaaat tttttactag ttgtgcacta 660 tttatcttcg atctataaat agatcgacat gttggaaaac actcaaacca tcctatgcta 720 taagataata tatagctaca tttcttagat aactagaaac ctccattagc ttcctattct 780 cataagcaaa tctccaatca taatttacaa actgagactc gatgtatgat cagtgataga 840 tttaaaattt agatatcaca agtgatatgt ttagatcata agggtctaga aatgcatatc 900 taactcgatg tattctatgt tgcactttgt cccgcatcac ctcacaactg taagtataaa 960 ttatttcaaa gagagcagga aagtattggg tgagatattg tagcagcata ctctttcccc 1020 tgaataatga ggtgctaatt ggaagctgca ccttaattct ttaggggaaa gagtatgctg 1080 cta 1083 <210> 13 <211> 1144 <212> DNA <213> Artificial sequence <220> <223> Solanum lycopersicum / Tomato spotted wild tospovirus <400> 13 agcgaattat acagaacata attatgcaaa ttttgctata acatacaaat atgaatttta 60 tgtttgatat atgtgaaagt tgcccattat ggaattagct atgaaattta tggtaatttt 120 aagggacaat tacgcggtga agcaaactta tactacttaa atattcatca tagctatagt 180 ttgctataat taacactcgc gactaatatt atacattaat tatgtggcct gacttcgagt 240 ttgtataatt agtcagaata aacaaataca tgttataata tacaattatc taaccgatat 300 acataaacaa tttacctctc tcccactctt tgccctctct cgctcgtctc tctcccaatc 360 tcgttcttct cttcctccct ttcccagtat tgccgccact ctcccaatct ctctctcctc 420 tctcctccct ctcccaatct ctcttgccat atatacaaat acatatgtat aatatacaat 480 tatataacca atatacatat acaatgcacc tctccccctc tctttgccct ctctcctctc 540 tctcccagtc tcgcttgcct gtctcttctc tataacatgt agttacagat tgtaattatc 600 aaactgtaac tatgaagagt aattaaacta tttttgagtg actatacgtg aaagttcctc 660 taattttaat caattcatca caaatccata tctaaatgaa atgaacaaag aaaaattatt 720 attgtttagt tatgaatttt atcaatcact aattcacgtg aatattaggg aataaaaaat 780 gactactttg gcataatcta aacttgctag tagaaatttg aagttgcaaa aagaaaaaga 840 gaagcaaaag aagtgaaaga aaaagaggcg ttattgtttt ttactttatt cagtataaag 900 tgcgttttac tcttctattt cttgtagctc acaaatcgtc tttactgacc ctacaaattc 960 tcttccggca agttttcagg ttcctccgaa tcgctccgac gcctttgatg ttcacatctt 1020 ccggtagtcc cagtgttgtc tgtgctatat aatttatgga accacacttt ctttaatttg 1080 aattctatgt ggtatatata gcacagacaa cactgggata atggaagatc gagttatcaa 1140 aggc 1144 <210> 14 <211> 1144 <212> DNA <213> Artificial sequence <220> <223> Solanum lycopersicum / Tomato spotted wild tospovirus <400> 14 agcgaattat acagaacata attatgcaaa ttttgctata acatacaaat atgaatttta 60 tgtttgatat atgtgaaagt tgcccattat ggaattagct atgaaattta tggtaatttt 120 aagggacaat tacgcggtga agcaaactta tactacttaa atattcatca tagctatagt 180 ttgctataat taacactcgc gactaatatt atacattaat tatgtggcct gacttcgagt 240 ttgtataatt agtcagaata aacaaataca tgttataata tacaattatc taaccgatat 300 acataaacaa tttacctctc tcccactctt tgccctctct cgctcgtctc tctcccaatc 360 tcgttcttct cttcctccct ttcccagtat tgccgccact ctcccaatct ctctctcctc 420 tctcctccct ctcccaatct ctcttgccat atatacaaat acatatgtat aatatacaat 480 tatataacca atatacatat acaatgcacc tctccccctc tctttgccct ctctcctctc 540 tctcccagtc tcgcttgcct gtctcttctc tataacatgt agttacagat tgtaattatc 600 aaactgtaac tatgaagagt aattaaacta tttttgagtg actatacgtg aaagttcctc 660 taattttaat caattcatca caaatccata tctaaatgaa atgaacaaag aaaaattatt 720 attgtttagt tatgaatttt atcaatcact aattcacgtg aatattaggg aataaaaaat 780 gactactttg gcataatcta aacttgctag tagaaatttg aagttgcaaa aagaaaaaga 840 gaagcaaaag aagtgaaaga aaaagaggcg ttattgtttt ttactttatt cagtataaag 900 tgcgttttac tcttctattt cttgtagctc acaaatcgtc tttactgacc ctacaaattc 960 tcttccggca agttttcagg ttcctccgaa tcgctccgac gcctttgatg ttcacatctt 1020 ccggtagtcc atgaaatgtt cggggttaaa aatttatgga accacacttt ctttaatttg 1080 aattctatgt ggtattttaa ccccgaacat ttcatggata atggaagatc gagttatcaa 1140 aggc 1144 <210> 15 <211> 1144 <212> DNA <213> Artificial sequence <220> <223> Solanum lycopersicum / Tomato spotted wild tospovirus <400> 15 agcgaattat acagaacata attatgcaaa ttttgctata acatacaaat atgaatttta 60 tgtttgatat atgtgaaagt tgcccattat ggaattagct atgaaattta tggtaatttt 120 aagggacaat tacgcggtga agcaaactta tactacttaa atattcatca tagctatagt 180 ttgctataat taacactcgc gactaatatt atacattaat tatgtggcct gacttcgagt 240 ttgtataatt agtcagaata aacaaataca tgttataata tacaattatc taaccgatat 300 acataaacaa tttacctctc tcccactctt tgccctctct cgctcgtctc tctcccaatc 360 tcgttcttct cttcctccct ttcccagtat tgccgccact ctcccaatct ctctctcctc 420 tctcctccct ctcccaatct ctcttgccat atatacaaat acatatgtat aatatacaat 480 tatataacca atatacatat acaatgcacc tctccccctc tctttgccct ctctcctctc 540 tctcccagtc tcgcttgcct gtctcttctc tataacatgt agttacagat tgtaattatc 600 aaactgtaac tatgaagagt aattaaacta tttttgagtg actatacgtg aaagttcctc 660 taattttaat caattcatca caaatccata tctaaatgaa atgaacaaag aaaaattatt 720 attgtttagt tatgaatttt atcaatcact aattcacgtg aatattaggg aataaaaaat 780 gactactttg gcataatcta aacttgctag tagaaatttg aagttgcaaa aagaaaaaga 840 gaagcaaaag aagtgaaaga aaaagaggcg ttattgtttt ttactttatt cagtataaag 900 tgcgttttac tcttctattt cttgtagctc acaaatcgtc tttactgacc ctacaaattc 960 tcttccggca agttttcagg ttcctccgaa tcgctccgac gcctttgatg ttcacatctt 1020 ccggtagtcc ttttaacccc gaacatttca tatttatgga accacacttt ctttaatttg 1080 aattctatgt ggtaatgaaa tgttcggggt taaaaggata atggaagatc gagttatcaa 1140 aggc 1144 <210> 16 <211> 1144 <212> DNA <213> Artificial sequence <220> <223> Solanum lycopersicum / Tomato spotted wild tospovirus <400> 16 agcgaattat acagaacata attatgcaaa ttttgctata acatacaaat atgaatttta 60 tgtttgatat atgtgaaagt tgcccattat ggaattagct atgaaattta tggtaatttt 120 aagggacaat tacgcggtga agcaaactta tactacttaa atattcatca tagctatagt 180 ttgctataat taacactcgc gactaatatt atacattaat tatgtggcct gacttcgagt 240 ttgtataatt agtcagaata aacaaataca tgttataata tacaattatc taaccgatat 300 acataaacaa tttacctctc tcccactctt tgccctctct cgctcgtctc tctcccaatc 360 tcgttcttct cttcctccct ttcccagtat tgccgccact ctcccaatct ctctctcctc 420 tctcctccct ctcccaatct ctcttgccat atatacaaat acatatgtat aatatacaat 480 tatataacca atatacatat acaatgcacc tctccccctc tctttgccct ctctcctctc 540 tctcccagtc tcgcttgcct gtctcttctc tataacatgt agttacagat tgtaattatc 600 aaactgtaac tatgaagagt aattaaacta tttttgagtg actatacgtg aaagttcctc 660 taattttaat caattcatca caaatccata tctaaatgaa atgaacaaag aaaaattatt 720 attgtttagt tatgaatttt atcaatcact aattcacgtg aatattaggg aataaaaaat 780 gactactttg gcataatcta aacttgctag tagaaatttg aagttgcaaa aagaaaaaga 840 gaagcaaaag aagtgaaaga aaaagaggcg ttattgtttt ttactttatt cagtataaag 900 tgcgttttac tcttctattt cttgtagctc acaaatcgtc tttactgacc ctacaaattc 960 tcttccggca agttttcagg ttcctccgaa tcgctccgac gcctttgatg ttcacatctt 1020 ccggtagtcc ttcaaatgct ttgcttttca gatttatgga accacacttt ctttaatttg 1080 aattctatgt ggtactgaaa agcaaagcat ttgaaggata atggaagatc gagttatcaa 1140 aggc 1144 <210> 17 <211> 1144 <212> DNA <213> Artificial sequence <220> <223> Solanum lycopersicum / Tomato spotted wild tospovirus <400> 17 agcgaattat acagaacata attatgcaaa ttttgctata acatacaaat atgaatttta 60 tgtttgatat atgtgaaagt tgcccattat ggaattagct atgaaattta tggtaatttt 120 aagggacaat tacgcggtga agcaaactta tactacttaa atattcatca tagctatagt 180 ttgctataat taacactcgc gactaatatt atacattaat tatgtggcct gacttcgagt 240 ttgtataatt agtcagaata aacaaataca tgttataata tacaattatc taaccgatat 300 acataaacaa tttacctctc tcccactctt tgccctctct cgctcgtctc tctcccaatc 360 tcgttcttct cttcctccct ttcccagtat tgccgccact ctcccaatct ctctctcctc 420 tctcctccct ctcccaatct ctcttgccat atatacaaat acatatgtat aatatacaat 480 tatataacca atatacatat acaatgcacc tctccccctc tctttgccct ctctcctctc 540 tctcccagtc tcgcttgcct gtctcttctc tataacatgt agttacagat tgtaattatc 600 aaactgtaac tatgaagagt aattaaacta tttttgagtg actatacgtg aaagttcctc 660 taattttaat caattcatca caaatccata tctaaatgaa atgaacaaag aaaaattatt 720 attgtttagt tatgaatttt atcaatcact aattcacgtg aatattaggg aataaaaaat 780 gactactttg gcataatcta aacttgctag tagaaatttg aagttgcaaa aagaaaaaga 840 gaagcaaaag aagtgaaaga aaaagaggcg ttattgtttt ttactttatt cagtataaag 900 tgcgttttac tcttctattt cttgtagctc acaaatcgtc tttactgacc ctacaaattc 960 tcttccggca agttttcagg ttcctccgaa tcgctccgac gcctttgatg ttcacatctt 1020 ccggtagtcc tagcagcata ctctttcccc tatttatgga accacacttt ctttaatttg 1080 aattctatgt ggtaagggga aagagtatgc tgctaggata atggaagatc gagttatcaa 1140 aggc 1144 <210> 18 <211> 6727 <212> DNA <213> Artificial sequence <220> <223> Binary vector 17839 <400> 18 attcctgtgg ttggcatgca catacaaatg gacgaacgga taaacctttt cacgcccttt 60 taaatatccg attattctaa taaacgctct tttctcttag gtttacccgc caatatatcc 120 tgtcaaacac tgatagttta aacgggaccc ggcgcgccat ttaaatggta ccggtccgct 180 ggcagacaaa gtggcagaca tactgtccca caaatgaaga tggaatctgt aaaagaaaac 240 gcgtgaaata atgcgtctga caaaggttag gtcggctgcc tttaatcaat accaaagtgg 300 tccctaccac gatggaaaaa ctgtgcagtc ggtttggctt tttctgacga acaaataaga 360 ttcgtggccg acaggtgggg gtccaccatg tgaaggcatc ttcagactcc aataatggag 420 caatgacgta agggcttacg aaataagtaa gggtagtttg ggaaatgtcc actcacccgt 480 cagtctataa atacttagcc cctccctcat tgttaaggga gcaaaatctc agagagatag 540 tcctagagag agaaagagag caagtagcct agaagtagga tccatgtctc cagagagaag 600 gccagttgag attagacctg ctactgcggc cgatatggca gctgtttgtg atattgttaa 660 ccattatatt gagacttcta ctgttaactt cagaactgag ccacaaactc ctcaagagtg 720 gattgatgat cttgagagac ttcaagatag atacccttgg cttgttgctg aggttgaggg 780 agttgttgct ggaattgctt atgctggacc ttggaaggct agaaacgctt atgattggac 840 tgttgagtct actgtttatg tttctcatag acatcaaaga cttggacttg gatctactct 900 ttatactcat cttcttaagt ctatggaggc tcaaggattc aagtctgttg ttgctgttat 960 tggacttcca aacgatccat ctgttagact tcatgaggct cttggatata ctgctagagg 1020 aactcttaga gctgctggat ataagcatgg aggatggcat gatgttggat tctggcaaag 1080 agatttcgag cttccagctc caccaagacc agttagacca gttactcaaa tttgaccatg 1140 ggtcgacctg cagatcgttc aaacatttgg caataaagtt tcttaagatt gaatcctgtt 1200 gccggtcttg cgatgattat catataattt ctgttgaatt acgttaagca tgtaataatt 1260 aacatgtaat gcatgacgtt atttatgaga tgggttttta tgattagagt cccgcaatta 1320 tacatttaat acgcgataga aaacaaaata tagcgcgcaa actaggataa attatcgcgc 1380 gcggtgtcat ctatgttact agatctgcta gccctgcagg aaatttaccg gtgcccgggc 1440 ggccagcatg gccgtatccg caatgtgtta ttaagttgtc taagcgtcaa tttgtttaca 1500 ccacaatata tcctgccacc agccagccaa cagctccccg accggcagct cggcacaaaa 1560 tcaccactcg atacaggcag cccatcagaa ttaattctca tgtttgacag cttatcatcg 1620 actgcacggt gcaccaatgc ttctggcgtc aggcagccat cggaagctgt ggtatggctg 1680 tgcaggtcgt aaatcactgc ataattcgtg tcgctcaagg cgcactcccg ttctggataa 1740 tgttttttgc gccgacatca taacggttct ggcaaatatt ctgaaatgag ctgttgacaa 1800 ttaatcatcc ggctcgtata atgtgtggaa ttgtgagcgg ataacaattt cacacaggaa 1860 acagaccatg agggaagcgt tgatcgccga agtatcgact caactatcag aggtagttgg 1920 cgtcatcgag cgccatctcg aaccgacgtt gctggccgta catttgtacg gctccgcagt 1980 ggatggcggc ctgaagccac acagtgatat tgatttgctg gttacggtga ccgtaaggct 2040 tgatgaaaca acgcggcgag ctttgatcaa cgaccttttg gaaacttcgg cttcccctgg 2100 agagagcgag attctccgcg ctgtagaagt caccattgtt gtgcacgacg acatcattcc 2160 gtggcgttat ccagctaagc gcgaactgca atttggagaa tggcagcgca atgacattct 2220 tgcaggtatc ttcgagccag ccacgatcga cattgatctg gctatcttgc tgacaaaagc 2280 aagagaacat agcgttgcct tggtaggtcc agcggcggag gaactctttg atccggttcc 2340 tgaacaggat ctatttgagg cgctaaatga aaccttaacg ctatggaact cgccgcccga 2400 ctgggctggc gatgagcgaa atgtagtgct tacgttgtcc cgcatttggt acagcgcagt 2460 aaccggcaaa atcgcgccga aggatgtcgc tgccgactgg gcaatggagc gcctgccggc 2520 ccagtatcag cccgtcatac ttgaagctag gcaggcttat cttggacaag aagatcgctt 2580 ggcctcgcgc gcagatcagt tggaagaatt tgttcactac gtgaaaggcg agatcaccaa 2640 agtagtcggc aaataaagct ctagtggatc tccgtaccca gggatctggc tcgcggcgga 2700 cgcacgacgc cggggcgaga ccataggcga tctcctaaat caatagtagc tgtaacctcg 2760 aagcgtttca cttgtaacaa cgattgagaa tttttgtcat aaaattgaaa tacttggttc 2820 gcatttttgt catccgcggt cagccgcaat tctgacgaac tgcccattta gctggagatg 2880 attgtacatc cttcacgtga aaatttctca agcgctgtga acaagggttc agattttaga 2940 ttgaaaggtg agccgttgaa acacgttctt cttgtcgatg acgacgtcgc tatgcggcat 3000 cttattattg aataccttac gatccacgcc ttcaaagtga ccgcggtagc cgacagcacc 3060 cagttcacaa gagtactctc ttccgcgacg gtcgatgtcg tggttgttga tctagattta 3120 ggtcgtgaag atgggctcga gatcgttcgt aatctggcgg caaagtctga tattccaatc 3180 ataattatca gtggcgaccg ccttgaggag acggataaag ttgttgcact cgagctagga 3240 gcaagtgatt ttatcgctaa gccgttcagt atcagagagt ttctagcacg cattcgggtt 3300 gccttgcgcg tgcgccccaa cgttgtccgc tccaaagacc gacggtcttt ttgttttact 3360 gactggacac ttaatctcag gcaacgtcgc ttgatgtccg aagctggcgg tgaggtgaaa 3420 cttacggcag gtgagttcaa tcttctcctc gcgtttttag agaaaccccg cgacgttcta 3480 tcgcgcgagc aacttctcat tgccagtcga gtacgcgacg aggaggttta tgacaggagt 3540 atagatgttc tcattttgag gctgcgccgc aaacttgagg cagatccgtc aagccctcaa 3600 ctgataaaaa cagcaagagg tgccggttat ttctttgacg cggacgtgca ggtttcgcac 3660 ggggggacga tggcagcctg agccaattcc cagatccccg aggaatcggc gtgagcggtc 3720 gcaaaccatc cggcccggta caaatcggcg cggcgctggg tgatgacctg gtggagaagt 3780 tgaaggccgc gcaggccgcc cagcggcaac gcatcgaggc agaagcacgc cccggtgaat 3840 cgtggcaagc ggccgctgat cgaatccgca aagaatcccg gcaaccgccg gcagccggtg 3900 cgccgtcgat taggaagccg cccaagggcg acgagcaacc agattttttc gttccgatgc 3960 tctatgacgt gggcacccgc gatagtcgca gcatcatgga cgtggccgtt ttccgtctgt 4020 cgaagcgtga ccgacgagct ggcgaggtga tccgctacga gcttccagac gggcacgtag 4080 aggtttccgc agggccggcc ggcatggcca gtgtgtggga ttacgacctg gtactgatgg 4140 cggtttccca tctaaccgaa tccatgaacc gataccggga agggaaggga gacaagcccg 4200 gccgcgtgtt ccgtccacac gttgcggacg tactcaagtt ctgccggcga gccgatggcg 4260 gaaagcagaa agacgacctg gtagaaacct gcattcggtt aaacaccacg cacgttgcca 4320 tgcagcgtac gaagaaggcc aagaacggcc gcctggtgac ggtatccgag ggtgaagcct 4380 tgattagccg ctacaagatc gtaaagagcg aaaccgggcg gccggagtac atcgagatcg 4440 agctggctga ttggatgtac cgcgagatca cagaaggcaa gaacccggac gtgctgacgg 4500 ttcaccccga ttactttttg atcgatcccg gcatcggccg ttttctctac cgcctggcac 4560 gccgcgccgc aggcaaggca gaagccagat ggttgttcaa gacgatctac gaacgcagtg 4620 gcagcgccgg agagttcaag aagttctgtt tcaccgtgcg caagctgatc gggtcaaatg 4680 acctgccgga gtacgatttg aaggaggagg cggggcaggc tggcccgatc ctagtcatgc 4740 gctaccgcaa cctgatcgag ggcgaagcat ccgccggttc ctaatgtacg gagcagatgc 4800 tagggcaaat tgccctagca ggggaaaaag gtcgaaaagg tctctttcct gtggatagca 4860 cgtacattgg gaacccaaag ccgtacattg ggaaccggaa cccgtacatt gggaacccaa 4920 agccgtacat tgggaaccgg tcacacatgt aagtgactga tataaaagag aaaaaaggcg 4980 atttttccgc ctaaaactct ttaaaactta ttaaaactct taaaacccgc ctggcctgtg 5040 cataactgtc tggccagcgc acagccgaag agctgcaaaa agcgcctacc cttcggtcgc 5100 tgcgctccct acgccccgcc gcttcgcgtc ggcctatcgc ggccgctggc cgctcaaaaa 5160 tggctggcct acggccaggc aatctaccag ggcgcggaca agccgcgccg tcgccactcg 5220 accgccggcg ctgaggtctg cctcgtgaag aaggtgttgc tgactcatac caggcctgaa 5280 tcgccccatc atccagccag aaagtgaggg agccacggtt gatgagagct ttgttgtagg 5340 tggaccagtt ggtgattttg aacttttgct ttgccacgga acggtctgcg ttgtcgggaa 5400 gatgcgtgat ctgatccttc aactcagcaa aagttcgatt tattcaacaa agccgccgtc 5460 ccgtcaagtc agcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa 5520 aaactcatcg agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata 5580 tttttgaaaa agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat 5640 ggcaagatcc tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa 5700 tttcccctcg tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc 5760 cggtgagaat ggcaaaagct ctgcattaat gaatcggcca acgcgcgggg agaggcggtt 5820 tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc 5880 tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg 5940 ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg 6000 ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac 6060 gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg 6120 gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct 6180 ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg 6240 tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct 6300 gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac 6360 tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt 6420 tcttgaagtg gtggcctaac tacggctaca ctagaagaac agtatttggt atctgcgctc 6480 tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca 6540 ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat 6600 ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac 6660 gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc cttttgatcc 6720 ggaatta 6727 <210> 19 <211> 17512 <212> DNA <213> Artificial sequence <220> <223> Binary vector 24598 <400> 19 attcctgtgg ttggcatgca catacaaatg gacgaacgga taaacctttt cacgcccttt 60 taaatatccg attattctaa taaacgctct tttctcttag gtttacccgc caatatatcc 120 tgtcaaacac tgatagttta aacgggaccg ggcgccaagc ttgatatcgg aagtttctct 180 cttgagggag gttgctcgtg gaatgggaca catatggttg ttataataaa ccatttccat 240 tgtcatgaga ttttgaggtt aatatatact ttacttgttc attattttat ttggtgtttg 300 aataaatgat ataaatggct cttgataatc tgcattcatt gagatatcaa atatttactc 360 tagagaagag tgtcatatag attgatggtc cacaatcaat gaaatttttg ggagacgaac 420 atgtataacc atttgcttga ataaccttaa ttaaaaggtg tgattaaatg atgtttgtaa 480 catgtagtac taaacattca taaaacacaa ccaacccaag aggtattgag tattcacggc 540 taaacagggg cataatggta atttaaagaa tgatattatt ttatgttaaa ccctaacatt 600 ggtttcggat tcaacgctat aaataaaacc actctcgttg ctgattccat ttatcgttct 660 tattgaccct agccgctaca cacttttctg cgatatctct gaggtaagcg ttaacgtacc 720 cttagatcgt tctttttctt tttcgtctgc tgatcgttgc tcatattatt tcgatgattg 780 ttggattcga tgctctttgt tgattgatcg ttctgaaaat tctgatctgt tgtttagatt 840 ttatcgattg ttaatatcaa cgtttcactg cttctaaacg ataatttatt catgaaacta 900 ttttcccatt ctgatcgatc ttgttttgag attttaattt gttcgattga ttgttggttg 960 gtggatctat atacgagtga acttgttgat ttgcgtattt aagatgtatg tcgatttgaa 1020 ttgtgattgg gtaattctgg agtagcataa caaatccagt gttccctttt tctaagggta 1080 attctcggat tgtttgcttt atatctcttg aaattgccga tttgattgaa tttagctcgc 1140 ttagctcaga tgatagagca ccacaatttt tgtggtagaa atcggtttga ctccgatagc 1200 ggctttttac tatgattgtt ttgtgttaaa gatgattttc ataatggtta tatatgtcta 1260 ctgtttttat tgattcaata tttgattgtt cttttttttg cagatttgtt gaccagacta 1320 gtgctaaaat ggataagaag tattctattg gacttgatat tggaaccaac tctgtgggat 1380 gggctgttat tactgacgag tataaggttc catctaagaa gttcaaggtt cttggaaaca 1440 ctgatagaca ctctattaag aagaacctta ttggtgctct tcttttcgat tctggagaga 1500 ctgctgaggc tactagactt aagagaactg ctagaagaag atatactaga agaaagaaca 1560 gaatttgcta tcttcaagag attttctcta acgagatggc taaggttgac gattctttct 1620 tccacagact tgaggagtct ttccttgttg aggaggataa gaagcacgag agacacccaa 1680 ttttcggaaa cattgttgac gaggttgctt atcacgagaa gtatccaact atttatcacc 1740 ttagaaagaa gctcgttgat tctactgata aggctgatct tagacttatt tatcttgctc 1800 ttgctcacat gattaagttc agaggacact tccttattga gggagatctt aacccagata 1860 actctgacgt tgataagctc ttcattcaac ttgttcaaac ttataaccaa cttttcgagg 1920 agaacccaat taacgcttct ggagttgacg ctaaggctat tctttctgct agactttcta 1980 agtctagaag gcttgagaac cttattgctc aacttccagg agagaagaag aacggacttt 2040 tcggaaacct tattgctctt tctcttggac ttactccaaa cttcaagtct aacttcgatc 2100 ttgctgagga cgctaagctc caactttcta aggatactta cgacgatgat cttgataacc 2160 ttcttgctca aattggagat caatacgctg atcttttcct tgctgctaag aacctttctg 2220 acgctattct tctttctgat attcttagag ttaacactga gattactaag gctccacttt 2280 ctgcttctat gattaagaga tacgacgagc accaccaaga tcttactctt cttaaggctc 2340 ttgttagaca acaacttcca gagaagtata aggagatttt cttcgatcaa tctaagaacg 2400 gatacgctgg atatattgac ggaggagctt ctcaagagga gttctataag ttcattaagc 2460 caattcttga gaagatggac ggaactgagg agcttcttgt taagctcaac agagaggatc 2520 ttcttagaaa gcaaagaact ttcgataacg gatctattcc acaccaaatt caccttggag 2580 agcttcacgc tattcttaga aggcaagagg atttctatcc attccttaag gataacagag 2640 agaagattga gaagattctt actttccgta ttccatatta cgttggacca cttgctagag 2700 gaaactctag attcgcttgg atgactagaa agtctgagga gactattact ccttggaact 2760 tcgaggaggt tgttgataag ggagcttctg ctcaatcttt cattgagaga atgactaact 2820 tcgataagaa ccttccaaac gagaaggttc ttccaaagca ctctcttctt tacgagtatt 2880 tcactgttta taacgagctt actaaggtta agtacgttac tgagggaatg agaaagccag 2940 ctttcctttc tggagagcaa aagaaggcta ttgttgatct tcttttcaag actaacagaa 3000 aggttactgt taagcaactt aaggaggatt atttcaagaa gattgagtgc ttcgattctg 3060 ttgagatttc tggagttgag gatagattca acgcttctct tggaacttat cacgatcttc 3120 ttaagattat taaggataag gatttccttg ataacgagga gaacgaggat attcttgagg 3180 atattgttct tactcttact cttttcgagg atagagagat gattgaggag agacttaaga 3240 cttacgctca ccttttcgac gataaggtta tgaagcaact taagagaaga agatatactg 3300 gatggggtag actttctaga aagctcatta acggaattag agataagcaa tctggaaaga 3360 ctattcttga tttccttaag tctgacggat tcgctaacag aaacttcatg caacttattc 3420 acgacgattc tcttactttc aaggaggata ttcaaaaggc tcaagtttct ggacaaggag 3480 attctcttca cgagcacatt gctaaccttg ctggatctcc agctattaag aagggaattc 3540 ttcaaactgt taaggttgtt gacgagcttg ttaaggttat gggtagacac aagccagaga 3600 acattgttat tgagatggct agagagaacc aaactactca aaagggacaa aagaactcta 3660 gagagagaat gaagagaatt gaggagggaa ttaaggagct tggatctcaa attcttaagg 3720 agcacccagt tgagaacact caacttcaaa acgagaagct ctatctttat tatcttcaaa 3780 acggaagaga tatgtacgtt gatcaagagc ttgatattaa cagactttct gattacgacg 3840 ttgatcacat tgttccacaa tctttcctta aggacgattc tattgataac aaggttctta 3900 ctagatctga taagaacaga ggaaagtctg ataacgttcc atctgaggag gttgttaaga 3960 agatgaagaa ctattggaga caacttctta acgctaagct cattactcaa agaaagttcg 4020 ataaccttac taaggctgag agaggaggac tttctgagct tgataaggct ggattcatta 4080 agagacaact tgttgagact agacaaatta ctaagcacgt tgctcaaatt cttgattcta 4140 gaatgaacac taagtacgac gagaacgata agctcattag agaggttaag gttattactc 4200 ttaagtctaa gctcgtttct gatttcagaa aggatttcca attctataag gttagagaga 4260 ttaacaacta tcaccacgct cacgacgctt atcttaacgc tgttgttgga actgctctta 4320 ttaagaagta tccaaaactt gagtctgagt tcgtttacgg agattataag gtttacgacg 4380 ttagaaagat gattgctaag tctgagcaag agattggaaa ggctactgct aagtatttct 4440 tctattctaa cattatgaac ttcttcaaga ctgagattac tcttgctaac ggagagatta 4500 gaaagaggcc acttattgag actaacggag agactggaga gattgtttgg gataagggaa 4560 gagatttcgc tactgttaga aaggttcttt ctatgccaca agttaacatt gttaagaaaa 4620 ctgaggttca aactggagga ttctctaagg agtctattct tccaaagaga aactctgata 4680 agctcattgc tagaaagaag gattgggacc caaagaagta cggaggattc gattctccaa 4740 ctgttgctta ttctgttctt gttgttgcta aggttgagaa gggaaagtct aagaagctca 4800 agtctgttaa ggagcttgtt ggaattacta ttatggagag atcttctttc gagaagaacc 4860 cagttgattt ccttgaggct aagggatata aggaggttaa gaaggatctt attattaagc 4920 tcccaaagta ttctcttttc gagcttgaga acggaagaaa gagaatgctt gcttctgctg 4980 gagagcttca aaagggaaac gagcttgctc ttccatctaa gtacgttaac ttcctttatc 5040 ttgcttctca ctacgagaag ctcaagggat ctccagagga taacgagcaa aagcaacttt 5100 tcgttgagca acacaagcac tatcttgacg agattattga gcaaatttct gagttctcta 5160 agagagttat tcttgctgac gctaaccttg ataaggttct ttctgcttat aacaagcaca 5220 gagataagcc aattagagag caagctgaga acattattca ccttttcact cttactaacc 5280 ttggtgctcc agctgctttc aagtatttcg atactactat tgatagaaag agatatactt 5340 ctactaagga ggttcttgac gctactctta ttcaccaatc tattactgga ctttacgaga 5400 ctagaattga tctttctcaa cttggaggag attcttctcc accaaagaag aagagaaagg 5460 tttcttggaa ggacgcttct ggatggtcta gaatgtgacg tcgcgtgatc gttcaaacat 5520 ttggcaataa agtttcttaa gattgaatcc tgttgccggt cttgcgatga ttatcatata 5580 atttctgttg aattacgtta agcatgtaat aattaacatg taatgcatga cgttatttat 5640 gagatgggtt tttatgatta gagtcccgca attatacatt taatacgcga tagaaaacaa 5700 aatatagcgc gcaaactagg ataaattatc gcgcgcggtg tcatctatgt tactagatcg 5760 gcgcgccaag cttcgttgaa caacggaaac tcgacttgcc ttccgcacaa tacatcattt 5820 cttcttagct ttttttcttc ttcttcgttc atacagtttt tttttgttta tcagcttaca 5880 ttttcttgaa ccgtagcttt cgttttcttc tttttaactt tccattcgga gtttttgtat 5940 cttgtttcat agtttgtccc aggattagaa tgattaggca tcgaaccttc aagaatttga 6000 ttgaataaaa catcttcatt cttaagatat gaagataatc ttcaaaaggc ccctgggaat 6060 ctgaaagaag agaagcaggc ccatttatat gggaaagaac aatagtattt cttatatagg 6120 cccatttaag ttgaaaacaa tcttcaaaag tcccacatcg cttagataag aaaacgaagc 6180 tgagtttata tacagctaga gtcgaagtag tgattgagag gtaaccgaat agagagtttt 6240 agagctagaa atagcaagtt aaaataaggc tagtccgtta tcaacttgaa aaagtggcac 6300 cgagtcggtg cttttttttt actgatgcat tgtattataa gtacgttaga atgtgcaata 6360 aatatattat ctatcattag aacttgaatt ataagtgaat aatagattat tttttgtaat 6420 atgaattaaa agtgtattaa acatgtatta acggtgatca attggttaaa aaaaagttta 6480 ttattaaaat gataaatctt tttaatttat agtatattta tgtaagtttt cacgttgagt 6540 aaatagcgaa gaagttgggc ccaaccaagt aaaataagaa ggccgggcca ttacaattaa 6600 gtcgtcacac aactgggctt cattgaaaaa agcgcaaaac cgattccagg cccgtgttag 6660 catgaagact caactcaacc agagatttct ccctcatcgc ttacagaaaa aagctatatg 6720 ctgtttatat tgcgaaatct aacagtgtag tttgaattca gggactccaa tgagttttag 6780 agctagaaat agcaagttaa aataaggcta gtccgttatc aacttgaaaa agtggcaccg 6840 agtcggtgct ttttttttct gcagccgaga cacttgtgtg attgagagaa acactaatct 6900 tgtgaggact gaagtttggt gattatttct tgtgatctgt cgacaaaaat atcaaatggg 6960 gtttctttta caaattattt acctaaatga atctgttttg aaaatattta ctccatgggt 7020 ctattttttt attacaaagc gtctccctga agggcgcgtt ccccgtgaaa gtgacacgtg 7080 gcaggacttg ggacgtgccc tgcgtacagg cgcgatagtt agtgttgtta cagcaggcgc 7140 atcgggtcgt gttggggacc aaggtacgac aggtcgcgct ggggacccag acacgaccca 7200 attgggtcgc actttattta atatttttta tattttgtat attgttttta tttaatatat 7260 ttttatatta ttttatttaa tttttttata ttttatataa tagtttctat attaaataaa 7320 ttcttagcat tatgtatgat tttaaagtca taaataattt tttatattgt ttttatttac 7380 tatatttttt atattttatt taatatttat atattaaata aatccttcat attagaaaaa 7440 ataaagaaaa tattaaataa aatataaaat ataaaaaagt aaaaaatatt aaataaaata 7500 atataaaaaa tattataaaa acaatataaa aaatataaaa atatttaata aaataataaa 7560 aaaaatatta ttttaaataa aattatttat gactttaaac tctaaagttg aattttaaaa 7620 aaatataatt tttttacgat tttagtaaaa aaaaaataca agccgcacaa tacaagtcgc 7680 cttctcaaac ccttcctcac gacattctcg gaccttatga caccgtcacc aaaacaatga 7740 tccacgcgat attaggcgcg tgcaaatcac tctaatccga aactagtaga catgggaagc 7800 acgagctata cgcgagcgtt tcaattgccg ccacgaaagc agagaaggcc agaaacggaa 7860 ccacggtaaa atggtaaggg tattttcgta aacagaagaa aagagttgta gctataaata 7920 aaccctctaa cccacggcgc actatttctc ttcactcctt cgttcactct tcttctcttg 7980 cggctagggt tttagcgcag cttcttctag gttcgttctc ttccgccgct ctatggattt 8040 taaaccttcg aatcatgttt attccattga attatgttgc ttgcagttta tattttctga 8100 atctgtagtt gttgtcttca atttatccta tgctttatag atcaatcttt tgtgtgtgta 8160 gtacgtaatt tttgttcttt ttgcttttcg ttcaagttgt tgggaataat cggggtatca 8220 tgttttgata ttgtttgttt tcttttttga ctgcttaata atttttaagt tggttttggt 8280 tttggggttt tatgtgcttg ttatattcaa atctttggat ccagatctta caaaagtttt 8340 gggtttaagg atgtttttgg ctgatgatga atagatctat aaactgttcc ttttaatcga 8400 ttcaagctta ggattttact aggcttttgc gaataaatac gtgacagtaa gctaattatg 8460 tccttttttt gtctcaatca tatctgtctg ggtgtgccat aatttgtgat atgtctatct 8520 ggtagaatct tgtgttttat gctttacgat ttggtatacc tgtttttgaa cttgttgtat 8580 gatgggtatt tagatcaccc tatctttttt atgcttctgg aagttttatg taaatgtcga 8640 atatcttaat gttgttgaac ttataatgtt gtgttgatgt atgtatgatg gttttgacaa 8700 cttttttcac tggttctgaa agttttatgt aaattgcaaa tatgttaatg ttgttgaact 8760 tatttttttt ccttcgatgt tgttttgatg tatgtatgat ggttttcacc gtagtttcta 8820 tggctaatat cttaatgttg ttgagcttat ttttttcctt atatgttgtg ttgatgtatg 8880 tatgatggtt ttgacaactt ttttagtttc tttgcagatt taaggaagat cgatggcgca 8940 agttagcaga atctgcaatg gtgtgcagaa cccatctctt atctccaatc tctcgaaatc 9000 cagtcaacgc aaatctccct tatcggtttc tctgaagacg cagcagcatc cacgagctta 9060 tccgatttcg tcgtcgtggg gattgaagaa gagtgggatg acgttaattg gctctgagct 9120 tcgtcctctt aaggtcatgt cttctgtttc cacggcgtgc atgagggaag cgttgatcgc 9180 cgaagtatcg actcaactat cagaggtagt tggcgtcatc gagcgccatc tcgaaccgac 9240 gttgctggcc gtacatttgt acggctccgc agtggatggc ggcctgaagc cacacagtga 9300 tattgatttg ctggttacgg tgaccgtaag gcttgatgaa acaacgcggc gagctttgat 9360 caacgacctt ttggaaactt cggcttcccc tggagagagc gagattctcc gcgctgtaga 9420 agtcaccatt gttgtgcacg acgacatcat tccgtggcgt tatccagcta agcgcgaact 9480 gcaatttgga gaatggcagc gcaatgacat tcttgcaggt atcttcgagc cagccacgat 9540 cgacattgat ctggctatct tgctgacaaa agcaagagaa catagcgttg ccttggtagg 9600 tccagcggcg gaggaactct ttgatccggt tcctgaacag gatctatttg aggcgctaaa 9660 tgaaacctta acgctatgga actcgccgcc cgactgggct ggcgatgagc gaaatgtagt 9720 gcttacgttg tcccgcattt ggtacagcgc agtaaccggc aaaatcgcgc cgaaggatgt 9780 cgctgccgac tgggcaatgg agcgcctgcc ggcccagtat cagcccgtca tacttgaagc 9840 taggcaggct tatcttggac aagaagatcg cttggcctcg cgcgcagatc agttggaaga 9900 atttgttcac tacgtgaaag gcgagatcac caaagtagtc ggcaaataat gagctcatct 9960 agctagagct ttcgttcgta tcatcggttt cgacaacgtt cgtcaagttc aatgcatcag 10020 tttcattgcg cacacaccag aatcctactg agtttgagta ttatggcatt gggaaaactg 10080 tttttcttgt accatttgtt gtgcttgtaa tttactgtgt tttttattcg gttttcgcta 10140 tcgaactgtg aaatggaaat ggatggagaa gagttaatga atgatatggt ccttttgttc 10200 attctcaaat taatattatt tgttttttct cttatttgtt gtgtgttgaa tttgaaatta 10260 taagagatat gcaaacattt tgttttgagt aaaaatgtgt caaatcgtgg cctctaatga 10320 ccgaagttaa tatgaggagt aaaacacttg tagttgtacc attatgctta ttcactaggc 10380 aacaaatata ttttcagacc tagaaaagct gcaaatgtta ctgaatacaa gtatgtcctc 10440 ttgtgtttta gacatttatg aactttcctt tatgtaattt tccagaatcc ttgtcagatt 10500 ctaatcattg ctttataatt atagttatac tcatggattt gtagttgagt atgaaaatat 10560 tttttaatgc attttatgac ttgccaattg attgacaaca tgcatcaatc ccgggcggcc 10620 agcatggccg tatccggatg tcatattccc tatctgatcg tgagaggtaa ccgaatagag 10680 agggtttcct atgtaactaa atgtctgcta atgtattcac aagtccaagt gatgtattcg 10740 aaattataaa atttaaggaa ttcttataat ttgaaaaaga agtagaaaat aatgtaatta 10800 gctcttaacg ctatgaaatt tatgtaaatt atataattat tatgtactcc ttccgattca 10860 tatgacatat cttactttta acctttacat tttgttcaaa ataagtaatt ttattgtaac 10920 taagaatgta ttactattat ttagtttttc aaatttacgc cttcttttga taagtgggtt 10980 ttaactttta acgtaaccaa gaaatgatat taaatatgta ctatataatt aagaataatt 11040 agtaaaaaca atttttaata ttttaggacc taaacttttt atttttttgt gcgacatgtt 11100 acctaaaaga tagtaaaaaa ataattgcca ataataaatg gaataatttt actagaaaat 11160 aaacatagga aaagaaatat acgtaacaca ttaaattata tcaacggatc attaaaattc 11220 ttttgtattg tctatataat actatataaa agtaaagaat tctataaaat taatttgagt 11280 tgacatagaa aaactgtttt gggttaaatt ttttactagt tgtgcactat ttatcttcga 11340 tctataaata gatcgacatg ttggaaaaca ctcaaaccat cctatgctat aagataatat 11400 atagctacat ttcttagata actagaaacc tccattagct tcctattctc ataagcaaat 11460 ctccaatcat aatttacaaa ctgagactcg atgtatgatc agtgatagat ttaaaattta 11520 gatatcacaa gtgatatgtt tagatcataa gggtctagaa atgcatatct aactcgatgt 11580 attctatgtt gcactttgtc ccgcatcacc tcacaactgt aagtataaat tatttcaaag 11640 agagcaggaa agtattgggt gagatattgt tttaaccccg aacatttcat gaataatgag 11700 gtgctaattg gaagctgcac cttaattctt tatgaaatgt tcggggttaa aacatcttca 11760 gtccctcccc gaccctctct accttaattt atttctacgt ttattgtatt taaatttccc 11820 tatatgtcct cctttatctt caaaatcgaa aaatgaagtt atattaattt gtttagtgta 11880 acttaactct tgaccatgct gcttccgatc aagaaagggt tttattgatg atagttaatt 11940 agttacgtta gcttataaat tacaaacttc tagaaaagtt ctatgactat ttattgatac 12000 aattcacatc gatgtaatga aagtgaaaaa ttcataataa ttatagaaaa tcatgaataa 12060 tcgattcgtt tgacaactat aatatagtct cacaaaatct tttatctttg ccttaaatta 12120 catctttgcc ttaaattaca tcaaaaaatg atttgtaaac tttattatga tcacgaattc 12180 agggactcca atgaaggcat cattaagaag tgtatccata gtttcttgta ctaatttcgt 12240 atccgcaatg tgttattaag ttgtctaagc gtcaatttgt ttacaccaca atatatcctg 12300 ccaccagcca gccaacagct ccccgaccgg cagctcggca caaaatcacc actcgataca 12360 ggcagcccat cagaattaat tctcatgttt gacagcttat catcgactgc acggtgcacc 12420 aatgcttctg gcgtcaggca gccatcggaa gctgtggtat ggctgtgcag gtcgtaaatc 12480 actgcataat tcgtgtcgct caaggcgcac tcccgttctg gataatgttt tttgcgccga 12540 catcataacg gttctggcaa atattctgaa atgagctgtt gacaattaat catccggctc 12600 gtataatgtg tggaattgtg agcggataac aatttcacac aggaaacaga ccatgaggga 12660 agcgttgatc gccgaagtat cgactcaact atcagaggta gttggcgtca tcgagcgcca 12720 tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg gcggcctgaa 12780 gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg aaacaacgcg 12840 gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga gcgagattct 12900 ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc gttatccagc 12960 taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag gtatcttcga 13020 gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag aacatagcgt 13080 tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac aggatctatt 13140 tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg ctggcgatga 13200 gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg gcaaaatcgc 13260 gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt atcagcccgt 13320 catacttgaa gctaggcagg cttatcttgg acaagaagat cgcttggcct cgcgcgcaga 13380 tcagttggaa gaatttgttc actacgtgaa aggcgagatc accaaagtag tcggcaaata 13440 aagctctagt ggatctccgt acccagggat ctggctcgcg gcggacgcac gacgccgggg 13500 cgagaccata ggcgatctcc taaatcaata gtagctgtaa cctcgaagcg tttcacttgt 13560 aacaacgatt gagaattttt gtcataaaat tgaaatactt ggttcgcatt tttgtcatcc 13620 gcggtcagcc gcaattctga cgaactgccc atttagctgg agatgattgt acatccttca 13680 cgtgaaaatt tctcaagcgc tgtgaacaag ggttcagatt ttagattgaa aggtgagccg 13740 ttgaaacacg ttcttcttgt cgatgacgac gtcgctatgc ggcatcttat tattgaatac 13800 cttacgatcc acgccttcaa agtgaccgcg gtagccgaca gcacccagtt cacaagagta 13860 ctctcttccg cgacggtcga tgtcgtggtt gttgatctag atttaggtcg tgaagatggg 13920 ctcgagatcg ttcgtaatct ggcggcaaag tctgatattc caatcataat tatcagtggc 13980 gaccgccttg aggagacgga taaagttgtt gcactcgagc taggagcaag tgattttatc 14040 gctaagccgt tcagtatcag agagtttcta gcacgcattc gggttgcctt gcgcgtgcgc 14100 cccaacgttg tccgctccaa agaccgacgg tctttttgtt ttactgactg gacacttaat 14160 ctcaggcaac gtcgcttgat gtccgaagct ggcggtgagg tgaaacttac ggcaggtgag 14220 ttcaatcttc tcctcgcgtt tttagagaaa ccccgcgacg ttctatcgcg cgagcaactt 14280 ctcattgcca gtcgagtacg cgacgaggag gtttatgaca ggagtataga tgttctcatt 14340 ttgaggctgc gccgcaaact tgaggcagat ccgtcaagcc ctcaactgat aaaaacagca 14400 agaggtgccg gttatttctt tgacgcggac gtgcaggttt cgcacggggg gacgatggca 14460 gcctgagcca attcccagat ccccgaggaa tcggcgtgag cggtcgcaaa ccatccggcc 14520 cggtacaaat cggcgcggcg ctgggtgatg acctggtgga gaagttgaag gccgcgcagg 14580 ccgcccagcg gcaacgcatc gaggcagaag cacgccccgg tgaatcgtgg caagcggccg 14640 ctgatcgaat ccgcaaagaa tcccggcaac cgccggcagc cggtgcgccg tcgattagga 14700 agccgcccaa gggcgacgag caaccagatt ttttcgttcc gatgctctat gacgtgggca 14760 cccgcgatag tcgcagcatc atggacgtgg ccgttttccg tctgtcgaag cgtgaccgac 14820 gagctggcga ggtgatccgc tacgagcttc cagacgggca cgtagaggtt tccgcagggc 14880 cggccggcat ggccagtgtg tgggattacg acctggtact gatggcggtt tcccatctaa 14940 ccgaatccat gaaccgatac cgggaaggga agggagacaa gcccggccgc gtgttccgtc 15000 cacacgttgc ggacgtactc aagttctgcc ggcgagccga tggcggaaag cagaaagacg 15060 acctggtaga aacctgcatt cggttaaaca ccacgcacgt tgccatgcag cgtacgaaga 15120 aggccaagaa cggccgcctg gtgacggtat ccgagggtga agccttgatt agccgctaca 15180 agatcgtaaa gagcgaaacc gggcggccgg agtacatcga gatcgagctg gctgattgga 15240 tgtaccgcga gatcacagaa ggcaagaacc cggacgtgct gacggttcac cccgattact 15300 ttttgatcga tcccggcatc ggccgttttc tctaccgcct ggcacgccgc gccgcaggca 15360 aggcagaagc cagatggttg ttcaagacga tctacgaacg cagtggcagc gccggagagt 15420 tcaagaagtt ctgtttcacc gtgcgcaagc tgatcgggtc aaatgacctg ccggagtacg 15480 atttgaagga ggaggcgggg caggctggcc cgatcctagt catgcgctac cgcaacctga 15540 tcgagggcga agcatccgcc ggttcctaat gtacggagca gatgctaggg caaattgccc 15600 tagcagggga aaaaggtcga aaaggtctct ttcctgtgga tagcacgtac attgggaacc 15660 caaagccgta cattgggaac cggaacccgt acattgggaa cccaaagccg tacattggga 15720 accggtcaca catgtaagtg actgatataa aagagaaaaa aggcgatttt tccgcctaaa 15780 actctttaaa acttattaaa actcttaaaa cccgcctggc ctgtgcataa ctgtctggcc 15840 agcgcacagc cgaagagctg caaaaagcgc ctacccttcg gtcgctgcgc tccctacgcc 15900 ccgccgcttc gcgtcggcct atcgcggccg ctggccgctc aaaaatggct ggcctacggc 15960 caggcaatct accagggcgc ggacaagccg cgccgtcgcc actcgaccgc cggcgctgag 16020 gtctgcctcg tgaagaaggt gttgctgact cataccaggc ctgaatcgcc ccatcatcca 16080 gccagaaagt gagggagcca cggttgatga gagctttgtt gtaggtggac cagttggtga 16140 ttttgaactt ttgctttgcc acggaacggt ctgcgttgtc gggaagatgc gtgatctgat 16200 ccttcaactc agcaaaagtt cgatttattc aacaaagccg ccgtcccgtc aagtcagcgt 16260 aatgctctgc cagtgttaca accaattaac caattctgat tagaaaaact catcgagcat 16320 caaatgaaac tgcaatttat tcatatcagg attatcaata ccatattttt gaaaaagccg 16380 tttctgtaat gaaggagaaa actcaccgag gcagttccat aggatggcaa gatcctggta 16440 tcggtctgcg attccgactc gtccaacatc aatacaacct attaatttcc cctcgtcaaa 16500 aataaggtta tcaagtgaga aatcaccatg agtgacgact gaatccggtg agaatggcaa 16560 aagctctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct 16620 cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat 16680 cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga 16740 acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt 16800 ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt 16860 ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc 16920 gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa 16980 gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct 17040 ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta 17100 actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg 17160 gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc 17220 ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta 17280 ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg 17340 gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt 17400 tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg 17460 tcatgagatt atcaaaaagg atcttcacct agatcctttt gatccggaat ta 17512 <210> 20 <211> 20 <212> DNA <213> Artificial sequence <220> <223> gRNA sequence <400> 20 gagaggtaac cgaatagaga 20 <210> 21 <211> 20 <212> DNA <213> Artificial sequence <220> <223> gRNA sequence <400> 21 gaattcaggg actccaatga 20 <210> 22 <211> 21 <212> DNA <213> Tomato spotted wilt tospovirus <400> 22 tatatagcac agacaacact g 21 <210> 23 <211> 21 <212> DNA <213> Tomato spotted wilt tospovirus <400> 23 ctgaaaagca aagcatttga a 21 <210> 24 <211> 21 <212> DNA <213> Tomato spotted wilt tospovirus <400> 24 aggggaaaga gtatgctgct a 21

Claims (18)

  1. 표적 유전자의 발현을 감소시키는 방법으로서,
    a) 식물 세포에 상기 식물 세포의 네이티브 프리-miRNA를 인코딩하는 게놈 부위에서 부위-지정 DNA 절단이 가능한 뉴클레아제를 도입하는 단계;
    b) 상기 게놈 부위에서 또는 상기 게놈 부위 부근에서 적어도 하나의 이중 가닥 DNA 파손을 생성하는 단계;
    c) 상기 적어도 하나의 이중 가닥 파손이 상기 게놈 부위를 대체하는 개재 DNA로 복구된 세포를 선택하는 단계;
    d) 표적 유전자의 발현을 감소시키는 단계로 구성되고,
    상기 개재 DNA는 상기 표적 유전자에 상보적인 amiRNA 코어 서열을 포함하는 변형된 프리-miRNA를 인코딩하는, 방법.
  2. 제1항에 있어서, 표적 유전자는 외인성 표적 유전자, 더욱 바람직하게는 해충 유전자, 더욱 바람직하게는 바이러스, 진균 또는 미생물 유전자인, 방법.
  3. 제1항 또는 제2항에 있어서, 표적 유전자는 부니아바이러스목(Bunyavirales) 유전자, 바람직하게는 토스포바이러스(tospovirus) 유전자, 더욱 바람직하게는 토마토 반점 시듦 바이러스(tomato spotted wilt virus) 유전자인, 방법.
  4. 제1항에 있어서, 표적 유전자는 내인성 식물 유전자인, 방법.
  5. 제4항에 있어서, 표적 내인성 식물 유전자는 식물 발달, 생물학적 또는 비생물학적 스트레스에 관여하는 유전자인, 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 식물 세포는 가지과(Solanaceae), 옥수수, 벼, 카놀라, 대두 또는 해바라기 세포인, 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 세포는 토마토 세포인, 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 네이티브 프리-miRNA를 인코딩하는 상기 게놈 부위는 네이티브 토마토 프리-miRNA를 인코딩하는, 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 게놈 부위는 SEQ ID NO: 6 또는 SEQ ID NO: 7을 포함하는, 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 개재 DNA는 SEQ ID NO: 1 내지 SEQ ID NO: 5 중 어느 하나를 포함하는, 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 뉴클레아제는 메가뉴클레아제(MN), 징크-핑거 뉴클레아제(ZFN), 전사-활성자 유사 이펙터 뉴클레아제(TALEN), Cas9 뉴클레아제, Cfp1 뉴클레아제, dCas9-FokI, dCpf1-FokI, 키메라 Cas9/Cpf1-시티딘 데아미나제, 키메라 Cas9/Cpf1-아데닌 데아미나제, 키메라 FEN1-FokI, 및 Mega-TAL, 닉카제 Cas9(nCas9), 키메라 dCas9 비-FokI 뉴클레아제 및 dCpf1 비-FokI 뉴클레아제로 구성된 군으로부터 선택되는, 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 세포는 반수체, 이배체, 배수체, 또는 헥시포이드 게놈을 갖는, 방법.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 상기 세포는 변형된 프리-miRNA에 대해 이형접합인, 방법.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 하나 이상의 가이드 서열은 상기 뉴클레아제와 함께 도입되는, 방법.
  15. 바람직하게는 가지과, 옥수수, 벼, 카놀라, 대두 또는 해바라기 세포, 더욱 바람직하게는 토마토 식물 세포인, 제1항 내지 제14항 중 어느 한 항의 방법에 의해 수득되는 식물 세포.
  16. 제15항에 있어서, SEQ ID NO: 1 내지 SEQ ID NO: 5 중 어느 하나를 포함하는, 세포.
  17. 제16항에 있어서, SEQ ID NO: 8 내지 SEQ ID NO: 17 중 어느 하나를 포함하는, 세포.
  18. 식물 종자, 바람직하게는 가지과, 옥수수, 벼, 카놀라, 대두 또는 해바라기 종자, 더욱 바람직하게는 토마토 종자를 생산하는 방법으로서, 제1항 내지 제14항 중 어느 한 항의 방법에 의해 수득된 식물 세포를 포함하는 식물을 그 자체와 또는 동일한 작물의 또 다른 식물과 교배하는 단계를 포함하는, 방법.
KR1020217030021A 2019-03-01 2020-02-26 네이티브 miRNA의 게놈 편집을 통한 표적 유전자 발현의 억제 KR20210137055A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2019076722 2019-03-01
CNPCT/CN2019/076722 2019-03-01
PCT/EP2020/055028 WO2020178099A1 (en) 2019-03-01 2020-02-26 Suppression of target gene expression through genome editing of native mirnas

Publications (1)

Publication Number Publication Date
KR20210137055A true KR20210137055A (ko) 2021-11-17

Family

ID=69701211

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217030021A KR20210137055A (ko) 2019-03-01 2020-02-26 네이티브 miRNA의 게놈 편집을 통한 표적 유전자 발현의 억제

Country Status (10)

Country Link
US (1) US20220135994A1 (ko)
EP (1) EP3931321A1 (ko)
JP (1) JP2022522823A (ko)
KR (1) KR20210137055A (ko)
CN (1) CN113490741A (ko)
AU (1) AU2020230897A1 (ko)
BR (1) BR112021017159A2 (ko)
CA (1) CA3133940A1 (ko)
IL (1) IL285944A (ko)
WO (1) WO2020178099A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230050424A (ko) 2017-09-19 2023-04-14 트로픽 바이오사이언시즈 유케이 리미티드 유전자 발현을 침묵시키기 위한 식물의 비-암호화 rna 분자의 특이성 변형

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
US5100792A (en) 1984-11-13 1992-03-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues
US5036006A (en) 1984-11-13 1991-07-30 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
KR101268896B1 (ko) 2004-03-25 2013-05-30 신젠타 파티서페이션즈 아게 옥수수 이벤트 mir604
CA2759291C (en) 2009-04-20 2020-09-15 Monsanto Technology Llc Multiple virus resistance in transgenic tomato plants
IN2015DN04085A (ko) * 2012-10-16 2015-10-09 Monsanto Technology Llc
AR093296A1 (es) * 2012-10-31 2015-05-27 Kiss György Botond Identificacion de un gen de resistencia a xanthomonas euvesicatoria de pimienta (capsicum annuum) y metodo para generar plantas a esa resistencia
US9902973B2 (en) 2013-04-11 2018-02-27 Caribou Biosciences, Inc. Methods of modifying a target nucleic acid with an argonaute
US20160289734A1 (en) 2015-04-03 2016-10-06 University Of Massachusetts Methods of using oligonucleotide-guided argonaute proteins
WO2016161516A1 (en) 2015-04-10 2016-10-13 Feldan Bio Inc. Polypeptide-based shuttle agents for improving the transduction efficiency of polypeptide cargos to the cytosol of target eukaryotic cells, uses thereof, methods and kits relating to same
WO2016166268A1 (en) 2015-04-17 2016-10-20 Cellectis Engineering animal or plant genome using dna-guided argonaute interference systems (dais) from mesophilic prokaryotes
CN108368502B (zh) * 2015-06-03 2022-03-18 内布拉斯加大学董事委员会 使用单链dna的dna编辑
KR20230050424A (ko) 2017-09-19 2023-04-14 트로픽 바이오사이언시즈 유케이 리미티드 유전자 발현을 침묵시키기 위한 식물의 비-암호화 rna 분자의 특이성 변형
EP3890473A4 (en) * 2018-12-04 2022-09-07 Syngenta Crop Protection AG GENE SILENCEMENT THROUGH GENOMIC EDITING

Also Published As

Publication number Publication date
AU2020230897A1 (en) 2021-09-02
BR112021017159A2 (pt) 2021-11-23
CA3133940A1 (en) 2020-09-10
CN113490741A (zh) 2021-10-08
WO2020178099A1 (en) 2020-09-10
JP2022522823A (ja) 2022-04-20
US20220135994A1 (en) 2022-05-05
IL285944A (en) 2021-10-31
EP3931321A1 (en) 2022-01-05

Similar Documents

Publication Publication Date Title
KR102630763B1 (ko) 동시 유전자 편집 및 반수체 유도
CN110283840B (zh) 陆地棉基因组的精确高效编辑方法
CN108203714B (zh) 一种棉花基因的编辑方法
CN109593781B (zh) 陆地棉基因组的精准高效编辑方法
CN110551752B (zh) xCas9n-epBE碱基编辑系统及其在基因组碱基替换中的应用
KR20120092104A (ko) 식물에서 구성적 유전자 발현을 향상시키기 위한 조절 핵산 분자
CN112119160A (zh) 用于在植物中生产重组蛋白的复制和非复制载体及其使用方法
CN101842488B (zh) 使用转多基因改变α-和β-生育三烯酚含量的组成和方法
CN110656114B (zh) 一种烟草色素合成相关的基因及其应用
AU2018309648A1 (en) Methods and compositions for targeted genomic insertion
KR20210137055A (ko) 네이티브 miRNA의 게놈 편집을 통한 표적 유전자 발현의 억제
CN107365772B (zh) 一种植物花粉特异性启动子psp1及其应用
CN114438056A (zh) CasF2蛋白、CRISPR/Cas基因编辑系统及其在植物基因编辑中的应用
CN106459161A (zh) 涉及谷氨酸受体多肽编码基因的构建体和方法
RU2788349C2 (ru) Одновременное редактирование генов и индукция гаплоидов
KR102670917B1 (ko) 동시 유전자 편집 및 반수체 유도
CN105349570B (zh) 一种人工合成的抗虫基因表达载体及其应用
CN105400797B (zh) 一种含有抗虫基因的重组dna片段及其应用
CN114958881B (zh) 一种大豆基因GmPP2C89及一种过表达载体与应用
CN113281521B (zh) 用于植物应激颗粒相关蛋白快速鉴定的Gateway双元质粒载体、其构建方法及应用
CN117043331A (zh) 诱导型嵌合体
WO2019213910A1 (en) Methods and compositions for targeted editing of polynucleotides
CN115466319A (zh) 高粱SbMS1蛋白及其编码基因与应用