KR20220093324A - 유기체에서 새로운 돌연변이를 발생시키는 방법 및 그 활용 - Google Patents

유기체에서 새로운 돌연변이를 발생시키는 방법 및 그 활용 Download PDF

Info

Publication number
KR20220093324A
KR20220093324A KR1020227015940A KR20227015940A KR20220093324A KR 20220093324 A KR20220093324 A KR 20220093324A KR 1020227015940 A KR1020227015940 A KR 1020227015940A KR 20227015940 A KR20227015940 A KR 20227015940A KR 20220093324 A KR20220093324 A KR 20220093324A
Authority
KR
South Korea
Prior art keywords
ala
leu
dna
target
site
Prior art date
Application number
KR1020227015940A
Other languages
English (en)
Inventor
린지안 지앙
수동 모
지야오 왕
유카이 리
웨이 치
후아롱 리
보 첸
Original Assignee
칭다오 킹아그루트 케미컬 컴파운드 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 칭다오 킹아그루트 케미컬 컴파운드 컴퍼니 리미티드 filed Critical 칭다오 킹아그루트 케미컬 컴파운드 컴퍼니 리미티드
Publication of KR20220093324A publication Critical patent/KR20220093324A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8274Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
    • C12N15/8275Glyphosate
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8274Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8274Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
    • C12N15/8277Phosphinotricin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8274Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
    • C12N15/8278Sulfonylurea
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1022Transferases (2.) transferring aldehyde or ketonic groups (2.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y202/00Transferases transferring aldehyde or ketonic groups (2.2)
    • C12Y202/01Transketolases and transaldolases (2.2.1)
    • C12Y202/01006Acetolactate synthase (2.2.1.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y604/00Ligases forming carbon-carbon bonds (6.4)
    • C12Y604/01Ligases forming carbon-carbon bonds (6.4.1)
    • C12Y604/01002Acetyl-CoA carboxylase (6.4.1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Saccharide Compounds (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

본 발명은 유전 공학 기술분야에 관한 것으로, 구체적으로 인공적인 DNA 주형을 사용하지 않는 유기체의 부위-특이적 돌연변이를 발생시키는 방법과 그의 용도에 관한 것이다. 방법은 다음 단계를 포함한다: 유기체의 지놈의 특정 부위에서 2개 이상의 DNA 절단을 순차적으로 생성하고 이를 각각 자발적으로 복구하는 단계로서, 나중의 DNA 절단은 이전의 DNA 절단 복구에 의해 형성된 새로운 서열에 기초한 것인 단계. 본 발명은, 순차적 편집에 의한 새로운 DNA 복구에 의해 형성된 서열을 기반으로 새로운 표적을 설계함으로써, 지놈의 특정 부위에 돌연변이를 여러 번 순차적으로 발생시킬 수 있어, DNA 절단 이후의 복구 유형을 매우 다양하게 하며, 단일 유전자 편집에서 얻을 수 없는 새로운 염기 치환, 결실 및 삽입 돌연변이를 실현한다.

Description

유기체에서 새로운 돌연변이를 발생시키는 방법 및 그 활용
본 발명은 유전 공학 기술 분야에 관한 발명으로, 구체적으로 인공 DNA 주형 없이 유기체에서 부위-특이적 돌연변이를 발생시키는 방법 및 그의 용도에 관한 것이다.
우선권 정보
본 발명은 2019년 11월 7일에 출원된 중국 특허출원 제201911081617.X호, 2020년 8월 15일에 출원된 중국 특허출원 제202010821877.2호, 및 2020년 9월 16일에 출원된 중국 특허출원 제202010974151.2호에 대하여 우선권을 주장한다. 상기 출원은 본 출원에 전체로서 참조로 포함된다.
유기체의 지놈을 변형시키는 유전공학 기술은 제약 및 화학 분야에서 일반적으로 사용되는 유전자 변형 미생물, 농업 분야에서 내충성 및 제초제 저항성을 갖는 유전자 변형 작물과 같이 산업 및 농업 생산에 널리 사용되어 왔다. 부위 특이적 뉴클레아제의 출현으로 수용 유기체의 지놈에 표적 단편화를 도입하고 자발적인 복구를 일으키면서 지놈의 부위 특이적 편집 및 더욱 정확한 지놈 변형을 달성할 수 있게 되었다.
유전자를 편집하는 수단으로 주로 징크 핑거 뉴클레아제(zinc finger nuclease, ZFN), 전사 활성인자 유사 효과기 뉴클레아제(transcription activator-like effector nuclease, TALEN) 및 클러스터된 규칙적으로 간격을 둔 짧은 회문 반복(clustered regularly interspaced short palindromic repeats, CRISPR) 관련 Cas 시스템(CRISPR/Cas 시스템)의 세 가지 유형의 서열 특이적 뉴클레아제(sequence-specific nuclease, SSN)가 포함된다. 서열 특이적 뉴클레아제는 지놈의 특정 부위에서 DNA 이중 가닥 절단(double-strand breaks, DSBs)을 생성할 수 있게 프로그램 될 수 있는 뉴클레아제이다. DNA 이중 가닥 절단은 세포의 DNA 손상을 복구하기 위한 내인성 DNA 복구 경로(endogenous DNA repair pathway)를 활성화하지만, 복구 과정은 쉽게 표적 부위의 DNA 서열 변화로 이어져 관심 부위에 돌연변이가 도입된다. 이 기술을 통해 생물학자는 표적 유전자를 정확하게 표적화하고 편집할 수 있다. 이 중 ZFN과 TALEN은 모두 표적 서열에 대한 특이적 인식 단백질 모듈을 설계해야 하므로 처리량이 낮고 작업이 복잡하다. 그러나 Cas 단백질은 CRISPR/Cas 시스템에서 보편적이며, 표적부위를 위해 설계된 특정 CRISPR-RNA(crRNA) 단독 또는 전사활성화RNA(tracrRNA)와의 결합으로 가이드RNA(gRNA)가 형성될 수 있으며, 단일가이드RNA(sgRNA)만으로도 충분하며, crRNA와 tracrRNA를 함께 사용하거나 sgRNA 단독으로 Cas 단백질과 조립되어 리보핵단백질 복합체(ribonucleoprotein complex, RNP)를 형성할 수 있으며, 프로토스페이서 인접 모티프(Protospacer Adjacent motif, PAM)를 기반으로 표적서열이 식별되어 지놈에서 부위 특이적 편집을 실현한다. 따라서 간단한 조작, 넓은 적용 범위 및 높은 처리량으로 인해 주요 유전자 편집 수단이 되었다.
서열 특이적 뉴클레아제는 지놈의 특정 부위에서 DNA 이중 가닥 절단을 생성할 수 있다. 이러한 DNA 이중 가닥 절단은 다양한 유형으로 복구될 수 있으며 주로 염기 삽입 또는 결실 유형으로 복구된다. 예를 들어, 가장 일반적인 두 가지 유형의 CRISPR/Cas9 유전자 편집 이벤트는 DNA 절단부위의 염기 삽입 또는 결실이다(Shen et al. 2018. Predictable and precise template-free CRISPR editing of pathogenic variants. Nature. DOI: 10.1038/s41586-018-0686-x). 유전자 코딩 영역에서 염기의 삽입 또는 결실은 프레임쉬프트 돌연변이(Frameshift mutation)를 일으켜 유전자 기능을 상실시킨다. 따라서 위의 유전자 편집 도구의 주요 목적은 여전히 유전자 녹아웃(gene knockout)이다.
서열 특이적 뉴클레아제 단독으로는 염기 치환 유형의 돌연변이를 달성할 수 없다고 인식되어왔다. 이를 위해 선행기술은 3가지의 해결책을 제안한다:
1) 상동 재조합 복구 경로를 개시하기 위해 외인성 DNA 단편을 복구의 주형으로써 추가하는 방법; 2) 디아미나제를 Cas9과 융합해 염기를 C에서 T로, A에서 G로 바꾸기 위한 단일 염기 편집 수단을 순차적으로 개발하는 것; 3) 역전사효소를 Cas9과 융합하고, pegRNA를 사용해 작은 DNA 가닥의 합성 및 치환을 유도하는 것. 그러나 이들 3가지 해결책의 편집 효율은 유전자 녹아웃의 효율보다 현저히 낮고, 동시에 도입된 외인성 DNA 단편 및 역전사효소는 생물학적 안전성에 대한 우려를 쉽게 야기할 수 있다. 단일 염기 편집의 표적 외 효과(off-target effect)는 또한 세포 치료에서의 잠재적인 적용을 제한한다. 특히 장기 식물 육종 프로젝트의 경우, 유전자 편집 기술 적용시 생물 안전성에 대한 규제 당국의 우려를 줄이는 동시에 대상 부위의 염기 치환 효율을 향상시키는 것이 해결해야 할 문제이다.
요약하면, 세포 치료 및 생물학적 육종 분야에서 외래 DNA 단편을 도입하지 않고 서열 특이적 뉴클레아제의 표적화된 녹아웃만을 이용하여, 특히 비-형질전환적 일시적 편집 시스템을 통한 부위 특이적 염기 치환의 효율적인 완성에 대해 시급한 기술적 요구가 있다.
본 발명은 인공 DNA 주형의 제공 없이 지놈에 이중 가닥 절단을 생성하는 것 만으로 유기체에서 부위-특이적 돌연변이를 발생시키는 방법 및 상기 방법의 용도에 관한 것이다.
본 발명이 채택한 기술적 해결책은 다음과 같다:
유기체에서 새로운 돌연변이를 발생시키는 방법으로써, 다음과 같은 단계를 포함하는 방법: 유기체 지놈의 특정 부위에서 2개 이상의 DNA 절단을 순차적으로 생성하고 이를 각각 자발적으로 복구하는 단계로서, 나중의 DNA 절단은 이전 DNA 절단 복구에서 형성된 새로운 서열에 기반한 것인 단계.
본 발명의 일 구현예에 따르면, 본 발명의 "DNA 절단"은 표적화 특성을 갖는 뉴클레아제를 지놈 DNA의 특정 부위와 접촉하도록 유기체 세포 내로 전달함으로써 달성된다.
본 발명의 일 구현예에 따르면, 본 발명의 "표적화 특성을 갖는 뉴클레아제"는 ZFN, TALEN 또는 CRISPR/Cas 시스템이다.
본 발명의 일 구현예에 따르면, 본 발명의 "특정 부위에서 2개 이상의 DNA 절단을 순차적으로 생성"은 ZFN 또는 TALEN 편집에 의한 이전 DNA 절단 복구로부터 형성된 새로운 서열에 기초하여, 해당 부위를 다시 절단하기 위해 새로운 ZFN 또는 TALEN 단백질이 설계되는 것을 지칭한다.
본 발명의 또 다른 일 구현예에 따르면, 본 발명의 "특정 부위에서 2개 이상의 DNA 절단을 순차적으로 생성"은 CRISPR/Cas 시스템에 의한 이전 DNA 절단 복구로부터 형성된 새로운 서열에 기초하여, 해당 부위를 다시 절단하기 위해 새로운 표적RNA가 설계되는 것을 지칭한다. 예를 들어, Cas9 편집의 1차 절단 복구에서 형성된 새로운 서열을 기반으로 새로운 표적RNA를 설계하여 다시 해당 부위에서 2차 절단을 수행한다. 유사한 방식으로 도 1과 같이 2차 절단 복구 등에서 형성된 새로운 서열을 기반으로 새로운 표적RNA를 설계하여 다시 해당 부위에서 3차 절단을 수행한다.
본 발명의 일 구현예에 따르면, 본 발명의 "2개 이상의 DNA 절단"은 상이한 표적화된 뉴클레아제를 상이한 세대의 수용 세포에 순차적으로 전달함으로써 생성되며, 이 때 이전의 편집을 완료한 돌연변이 세포는 이후의 편집에서 표적화된 뉴클레아제의 전달을 받기 위한 수용체로서 사용되고, 이에 따라 두번째 편집을 수행해 부위 특이적 돌연변이가 발생된다. 이 방법은 바람직하게는 ZFN 및 TALEN 편집 시스템에 사용된다.
본 발명의 또 다른 일 구현예에 따르면, 본 발명의 "2개 이상의 DNA 절단"은 상이한 표적에 대한 상이한 표적화된 뉴클레아제를 동일한 수용 세포 내로 전달함으로써 생성된다. 이 방법은 바람직하게는 CRISPR/Cas 편집 시스템에 사용된다.
본 발명의 일 구현예에 따르면, 본 발명의 "2개 이상의 DNA 절단"은 동일한 CRISPR/Cas 뉴클레아제 및 상이한 gRNA 또는 sgRNA에 의해 각각 형성된 RNP 복합체가 상응하는 표적 서열을 순차적으로 절단할 때 생성된다.
본 발명의 또 다른 일 구현예에 따르면, 본 발명의 "2개 이상의 DNA 절단"은 각각의 gRNA 또는 sgRNA와 상이한 PAM 서열을 인식하는 2개 이상의 CRISPR/Cas 뉴클레아제 각각에 의해 형성된 RNP 복합체가 상응하는 표적 서열을 순차적으로 절단할 때 생성된다. 예를 들어, Streptococcus pyogenes의 Cas9에 의해 인식되는 PAM 서열은 "NGG" 또는 "NAG"이다(Jinek et al., "A programmable dual-RNA-guided DNA endonuclease in adaptive bacteria immunity", Science 2012, 337:816-821), Staphylococcus aureus의 Cas9이 인식하는 PAM 서열은 "NNGRRT" 또는 "NNGRR(N)"이고, Neisseria meningitidis의 Cas9이 인식하는 PAM 서열은 NNNNGATT이며, Streptococcus thermophilus의 Cas9이 인식하는 PAM 서열은 NNAGAAW이다. 이러한 방식으로 DNA 분자의 편집 가능한 창(window)이 커진다.
본 발명의 일 구현예에 따르면, 본 발명의 표적화된 뉴클레아제는 지놈 편집을 할 수 있는 임의의 CRISPR/Cas 뉴클레아제이다.
본 발명의 일 구현예에 따르면, 본 발명의 표적화된 뉴클레아제는 DNA 형태이다.
본 발명의 또 다른 일 구현예에 따르면, 본 발명의 표적화된 뉴클레아제는 DNA 대신 mRNA 또는 단백질의 형태이다. 단백질 형태가 바람직하다.
본 발명의 일 구현예에 따르면, 본 발명의 표적화된 뉴클레아제를 세포 내로 전달하는 방법은 다음 중에서 선택되나 그에 국한되지는 않는다: 1) PEG-매개 세포 형질주입 방법; 2) 리포솜-매개 세포 형질주입 방법; 3) 전기천공 형질전환 방법; 4) 미세주입법; 5) 유전자 총 충격; 또는 6) Agrobacterium-매개 형질전환 방법.
본 발명의 방법에 따르면, 이전의 DNA 절단 복구에서 형성된 새로운 서열을 기반으로 새로운 타겟이 설계되므로 지놈의 특정 부위에 여러 번 돌연변이가 순차적으로 형성될 수 있고, DNA 절단 후의 복구 유형을 기하급수적으로 풍부하게 할 수 있으며, 단일 유전자 편집으로는 얻을 수 없는 새로운 형태의 염기 치환, 결실 및 삽입 돌연변이를 발생시켜 새로운 돌연변이를 발생시키는 도구로 사용하기에 적합하다. 이 방법은 프로그램된 순차적인 절단/편집 또는 연속적인 절단/편집 방법으로 간단히 설명될 수 있다.
본 발명의 일 구현예에 따르면, 새로운 표적이 유기체 지놈의 특정 부위에서 이전의 절단 복구로부터 형성될 것으로 예측된 새로운 특정 서열을 기반으로 설계되고, 이어서 순차적 편집을 수행함으로써, 해당 부위에서 최종적으로 발생가능한 돌연변이를 미리 설계할 수 있고 기대되는 편집을 달성한다.
본 발명의 또 다른 일 구현예에 따르면, 새로운 표적이 유기체 지놈의 특정 부위에서 이전의 절단 복구로부터 형성될 것으로 예측된 새로운 서열을 기반으로 설계되고, 이어서 순차적 편집을 수행함으로써, 기대되는 편집 이벤트 외에, 해당 부위에서 다양한 상이한 돌연변이가 결국 발생될 수 있고, 다양한 상이한 돌연변이를 발생시키는 도구로 사용될 수 있다.
본 발명의 또 다른 일 양태에 따르면, 본 발명은 다음 단계를 포함하는 유기체에서 새로운 돌연변이를 발생시키는 방법을 추가로 제공한다: 유기체의 지놈 또는 염색체 수준에서 유전자의 특정 부위에 2개 이상의 DNA 절단을 순차적으로 생성, 이에 의한 정확한 염기 치환, 결실 또는 삽입의 달성.
본 발명의 일 구현예에 따르면, 본 발명의 "특정 부위에서 2개 이상의 DNA 절단"은 이전의 DNA 절단 복구로부터 형성된 새로운 서열에 기초하여 새로운 표적RNA가 설계되고, 동일부위에서 절단이 다시 수행되는 것을 의미한다.
본 발명의 일 구현예에 따르면, 본 발명의"DNA 절단"은 표적화 특성을 갖는 뉴클레아제에 의해 달성된다.
본 발명은 전술한 방법에 의해 얻어진 새로운 돌연변이를 추가로 제공한다.
본 발명은 전술한 새로운 돌연변이를 갖는 단백질 또는 생물학적 활성 단편을 추가로 제공한다.
본 발명은 단백질 또는 그의 생물학적 활성 단편을 인코딩하는 핵산 서열 또는 그의 상보적 서열을 포함하는 핵산을 제공한다.
본 발명은 다음을 포함하는 핵산을 추가로 제공한다:
(a) 표적RNA를 인코딩하는 뉴클레오타이드 서열으로써, 상기 표적RNA는 최소한 2개의 표적RNAs를 포함하며, 제1 표적RNA는 DNA를 표적하여 DNA 절단을 생성하고, 이후의 표적RNA는 이전의 절단 복구로 형성된 서열을 표적하여 다시 절단을 생성한다.
본 발명의 일 구현예에 따르면, 상기 핵산은 (b) Cas 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열을 추가로 포함한다.
본 발명의 일 구현예에 따르면, 표적RNA는 sgRNA 또는 gRNA이다.
본 발명의 일 구현예에 따르면, Cas 폴리펩타이드 및 표적RNA는 in vitro 세포 또는 ex vivo 세포에 존재한다.
본 발명은 전술한 핵산 및 이에 작동가능하게 연결된 프로모터를 포함하는 재조합 발현 벡터를 추가로 제공한다.
본 발명은 전술한 핵산을 포함하는 발현 카세트를 추가로 제공한다.
본 발명은 전술한 발현 카세트를 포함하는 숙주세포를 추가로 제공한다.
본 발명은 전술한 숙주세포를 이용하여 재생된 유기체를 추가로 제공한다.
본 발명은 표적DNA를 복합체와 접촉시키는 것을 포함하는 표적DNA 용해 방법을 추가로 제공하며, 상기 복합체는 다음을 포함한다:
(a) Cas 폴리펩타이드; 및
(b) 제1 표적RNA는 DNA를 표적하여 DNA에 절단을 일으키고, 이후의 표적RNA는 이전의 절단 복구에서 형성된 서열을 표적하여 절단을 다시 생성하는 최소한 2개의 표적RNA.
본 발명의 일 구현예에 따르면, 표적RNA는 sgRNA 또는 gRNA이다.
본 발명의 일 구현예에 따르면, 표적DNA는 박테리아 세포, 진핵 세포, 식물 세포 또는 동물 세포에 존재한다.
본 발명의 일 구현예에 따르면, 표적DNA는 염색체 DNA이다.
본 발명의 일 구현예에 따르면, Cas 폴리펩타이드 및 표적RNA는 in vitro 세포 또는 ex vivo 세포내에 존재한다.
본 발명의 일 구현예에 따르면, 접촉은 다음을 세포내로 도입하는 것을 포함한다: (a) Cas 폴리펩타이드 또는 Cas 폴리펩타이드를 인코딩하는 폴리뉴클레오타이드; 및 (b) 표적RNA 또는 표적RNA를 인코딩하는 DNA 폴리뉴클레오타이드.
본 발명은 다음을 포함하는 조성물을 추가로 제공한다:
(a) Cas 폴리펩타이드, 또는 Cas 폴리펩타이드를 인코딩하는 폴리뉴클레오타이드; 및
(b) 최소한 2개의 표적RNA, 또는 표적RNA를 인코딩하는 DNA 폴리뉴클레오타이드로써, 제1 표적RNA는 DNA를 표적하여 DNA에 절단을 일으키고, 이후의 표적RNA는 이전의 절단 복구로부터 형성된 서열을 표적하여 다시 절단을 생성하는 것.
본 발명의 일 구현예에 따르면, 표적RNA는 sgRNA 또는 gRNA이다.
본 발명의 일 구현예에 따르면, Cas 폴리펩타이드 및 표적RNA는 in vitro 세포 또는 ex vivo 세포에 존재한다.
본 발명은 질병 치료용 약제 제조에서의 조성물의 용도를 추가로 제공한다.
본 발명의 조성물로 치료할 수 있는 질환은 유전성 티로신혈증 1형, 페닐케톤뇨증, 조로증, 겸상적혈구병 등과 같은 단일 유전자 돌연변이에 의해 유발되는 질환을 포함하나 이에 국한되지 않는다. 병원성 돌연변이 부위를 복구하여 정상적으로 기능하는 단백질을 생산하게 할 것으로 기대되는 Cas 단백질 및 crRNA 또는 sgRNA 조성물을 세포내로 전달함으로써 자발적인 세포 복구가 유도되어 치료 효과를 얻을 수 있다.
본 발명은 다음을 포함하는 키트를 추가로 제공한다:
(a) Cas 폴리펩타이드, 또는 Cas 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열을 포함하는 핵산; 및
(b) 최소한 2개의 표적RNA, 또는 표적RNA를 인코딩하는 뉴클레오타이드 서열을 포함하는 핵산으로써, 제1 표적RNA는 DNA를 표적하여 DNA에 절단을 일으키고, 이후의 표적RNA는 이전의 절단 복구로부터 형성된 서열을 표적하여 다시 절단을 생성한다.
상기 (a) 및 (b)는 동일한 용기 또는 별도의 용기에 있다.
본 발명의 일 구현예에 따르면, 표적RNA는 sgRNA 또는 gRNA이다.
본 발명의 일 구현예에 따르면, 표적 RNA는 동일한 용기 또는 별도의 용기에 있다.
본 발명은 다음 단계를 포함하는 외인성 형질전환적 마커와 무관한 편집 이벤트를 선별하는 방법을 제공한다:
1) 수용 세포의 제1 표적유전자의 특정 부위에 순차적으로 2개 이상의 DNA 절단이 생성되고 각각 자발적으로 복구되며, 이전의 DNA 절단 복구로부터 형성된 새로운 서열을 기반으로 나중의 DNA 절단이 생성되는 단계;
2) 제1 표적유전자의 특정 부위가 순차적으로 절단되고 복구된 후 특정 편집 이벤트가 생성되며, 이는 돌연변이 세포에 특정 선별압력에 대한 저항성을 부여하여 표현형으로 선별가능한 형질을 생성할 수 있고, 형질을 선별하기 위해 상응하는 선별압력이 적용되어 편집 이벤트를 포함하는 세포, 조직, 기관 또는 완전한 유기체가 분리되는 단계;
3) 선택적으로, 동시에 다른 표적부위를 편집하기 위하여 제1 표적유전자에 더하여 최소한 1개의 제2 표적유전자에 표적화된 뉴클레아제가 사용되며, 제2 표적유전자의 편집은 제1 표적유전자의 돌연변이에 의해 생성된 선별가능한 형질의 선별을 통해 강화됨과 동시에 선별되며, 제1 표적유전자 및 최소한 하나의 제2 표적유전자의 편집 이벤트를 동시에 포함하는 세포, 조직, 기관 또는 완전한 유기체가 분리되는 단계.
본 발명의 일 구현예에 따르면, 본 발명의 "제1 표적유전자"는 최소한 1개의 표현형으로 선별가능한 형질을 인코딩하는 유전자 좌이며, 상기 최소한 1개의 표현형으로 선별가능한 형질은 저항성/내성 형질 또는 성장에 이점이 있는 형질이다.
본 발명의 일 구현예에 따르면, 본 발명의 "제1 표적유전자의 특정 부위"는 순차적인 절단 및 복구 후에 특정 유형의 돌연변이가 발생되는 부위를 지칭하며, 이는 수용 세포에 특정 선별압력에 대한 저항성을 부여하여 최소한 1개의 표현형으로 선별가능한 저항성/내성 형질 또는 성장에 이점이 있는 형질을 생산할 수 있다.
본 발명의 일 구현예에 따르면, 본 발명의 "특정 유형의 돌연변이"는 단일 염기의 치환, 다수의 염기의 치환, 또는 불특정 수의 염기의 삽입 또는 결실을 포함한다.
본 발명의 일 구현예에 따르면, 본 발명의 "특정 선별압력"은 환경적 압력 또는 첨가된 화합물에 의한 압력일 수 있고; 예를 들어, 환경적 압력은 고온, 저온 또는 저산소증 등이고; 첨가된 화합물에 의한 압력은 염 이온 농도, 항생제, 세포독소, 제초제 등에 의한 압력일 수 있다.
본 발명의 일 구현예에 따르면, 본 발명의 "DNA 절단"은 지놈 DNA의 특정 부위와 접촉하도록 유기체의 세포 내로 표적화 특성을 갖는 뉴클레아제를 전달함으로써 달성된다.
본 발명의 일 구현예에 따르면, 본 발명의 "표적화 특성을 갖는 뉴클레아제"는 지놈 편집을 수행할 수 있는 임의의 CRISPR/Cas 뉴클레아제이다.
본 발명의 일 구현예에 따르면, 본 발명의 "2개 이상의 DNA 절단이 특정 부위 서열에서 순차적으로 생성됨"이라는 특징은 CRISPR/Cas 시스템에 의해 생성된 이전 DNA 절단 복구에 의해 형성된 새로운 서열을 기반으로 하는 것을 지칭하며, 새로운 표적RNA는 해당 부위를 다시 절단하도록 설계된다.
본 발명의 일 구현예에 따르면, 본 발명의 "2개 이상의 DNA 절단"은 동일한 CRISPR/Cas 뉴클레아제와 각각 상이한 gRNA 또는 sgRNA에 의해 형성된 RNP 복합체가 상응하는 표적서열을 순차적으로 절단할 때 생성된다.
본 발명의 또 다른 일 구현예에 따르면, 본 발명의 "2개 이상의 DNA 절단"은 각각 상이한 PAM 서열을 인식하는 2개 이상의 CRISPR/Cas 뉴클레아제와 각각의 gRNA 또는 sgRNA에 의해 각각 형성된 RNP 복합체가 상응하는 표적 서열을 순차적으로 절단할 때 생성된다. 이러한 방식으로 DNA 분자의 편집 가능한 창(window)이 더 커진다.
본 발명의 일 구현예에 따르면, 본 발명의 "제2 표적유전자"는 제1 표적 유전자와 코딩이 상이한 또 다른 유전자를 지칭한다.
본 발명의 일 구현예에 따르면, 본 발명의 "최소한 1개의 제2 표적유전자에 대해 표적화된 뉴클레아제" 및 제1 표적유전자의 특정 부위에서 DNA 절단을 생성하는데 사용되는 CRISPR/Cas 뉴클레아제는 동일하다.
본 발명의 또 다른 일 구현예에 따르면, "최소한 1개의 제2 표적유전자에 대해 표적화된 뉴클레아제" 및 제1 표적유전자의 특정 부위에서 DNA 절단을 생성하는데 사용되는 CRISPR/Cas 뉴클레아제는 상이하다. 이러한 방식으로 제2 표적유전자에 더 많은 선별가능한 편집 부위가 있다.
본 발명의 일 구현예에 따르면, 표적화된 뉴클레아제는 DNA 형태이다.
본 발명의 또 다른 일 구현예에 따르면, 표적화된 뉴클레아제는 DNA 대신 mRNA 또는 단백질의 형태이다. 단백질 형태가 바람직하다.
본 발명의 일 구현예에 따르면, 표적화된 뉴클레아제를 세포 내로 전달하는 방법은 다음 중에서 선택되나, 그에 국한되지는 않는다: 1) PEG-매개 세포 형질주입 방법; 2) 리포솜-매개 세포 형질주입 방법; 3) 전기천공 형질전환 방법; 4) 미세주입법; 5) 유전자 총 충격; 또는 6) Agrobacterium-매개 형질전환 방법.
본 발명은 다음 단계를 포함하는 유기체 지놈의 비 형질전환적 일시적 편집 방법을 추가로 제공한다:
1) 수용 세포의 제1 표적유전자의 특정 부위에 대해 최소한 2개의 crRNA 단편의 조합 또는 최소한 2개의 sgRNA 단편의 조합이 설계 및 합성되며, 이 때 tracrRNA와 조합된 crRNA의 조합 또는 sgRNA 단독의 조합은 상응하는 Cas 단백질이 수용 세포의 제1 표적유전자의 특정 부위에서 2개 이상의 DNA 절단을 순차적으로 생성하고 이를 각각 자발적으로 복구하도록 유도할 수 있고, 여기서 나중의 DNA 절단은 이전의 DNA 절단 복구에 의해 형성된 새로운 서열에 기초한 것인 단계;
2) 사전에 위와 같이 설계 및 합성된 부위 특이적 편집을 유도할 수 있는 crRNA 단편과 tracrRNA 단편의 조합 또는 sgRNA 단편 단독의 조합과 적절한 양의 CRISPR/Cas 단백질 또는 이에 상응하는 mRNA가 혼합되어 제1 표적유전자의 부위 특이적 편집을 유도해 내인성 선별 마커를 생성할 수 있고, 선택적으로 제2, 제3 또는 그 이상의 표적유전자를 표적하는 인공적으로 합성된 최소한 1개의 crRNA 및 tracrRNA 단편 또는 인공적으로 합성된 sgRNA 단편이 추가로 첨가되고, 시험관 내에서 배양되어 RNP 복합체를 형성하는 단계;
3) 상기 RNP 복합체가 수용 세포 내로 전달되고 지놈 DNA의 특정 부위와 접촉하여 유전자를 편집하는 단계;
4) RNP 복합체에 의한 제1 표적유전자의 부위-특이적 편집에 의해 생성된 표현형으로 선별가능한 형질에 따라, 상응하는 선별압력이 적용되어 형질의 선별이 이루어지고, 편집 이벤트를 포함하는 세포, 조직, 기관 또는 완전한 유기체가 분리되며, 선택적으로, 제1 표적 유전자 및 최소한 1개의 제2, 제3 또는 그 이상의 표적유전자의 편집 이벤트를 동시에 포함하는 세포, 조직, 기관 또는 완전한 유기체가 분리되는 단계.
본 발명의 일 구현예에 따르면, 본 발명의 "제1 표적유전자"는 최소한 1개의 표현형으로 선별가능한 형질을 인코딩하는 유전자 좌이며, 상기 최소한 1개의 표현형으로 선별가능한 형질은 저항성/내성 형질 또는 성장에 이점이 있는 형질이다.
본 발명의 일 구현예에 따르면, 본 발명의 "제1 표적유전자의 특정 부위"는 순차적인 절단 및 복구 후에 특정 유형의 돌연변이가 발생되는 부위를 지칭하며, 이는 수용 세포에 특정 선별압력에 대한 저항성을 부여하여 최소한 1개의 표현형으로 선별가능한 저항성/내성 형질 또는 성장에 이점이 있는 형질을 생산할 수 있다.
본 발명의 일 구현예에 따르면, 본 발명의 "특정 유형의 돌연변이"는 단일 염기의 치환, 다수의 염기의 치환, 또는 불특정 수의 염기의 삽입 또는 결실을 포함한다.
본 발명의 일 구현예에 따르면, 본 발명의 "특정 선별압력" 환경적 압력 또는 첨가된 화합물에 의한 압력일 수 있고; 예를 들어, 환경적 압력은 고온, 저온 또는 저산소증 등이고; 첨가된 화합물에 의한 압력은 염 이온 농도, 항생제, 세포독소 또는 제초제 등에 의한 압력일 수 있다.
본 발명의 일 구현예에 따르면, CRISPR/Cas 단백질은 지놈 편집을 수행할 수 있는 임의의 CRISPR/Cas 뉴클레아제이다.
본 발명의 일 구현예에 따르면, 본 발명의 "특정 부위에서 2개 이상의 DNA 절단을 순차적으로 생성" 특징은 CRISPR/Cas 시스템에 의해 생성된 이전의 DNA 절단 복구에 의해 형성된 새로운 서열에 기초하여, 새로운 표적RNA가 설계되어 해당 부위를 다시 절단하는 것이다.
본 발명의 일 구현예에 따르면, 본 발명의 "2개 이상의 DNA 절단"은 동일한 CRISPR/Cas 뉴클레아제와 각각 상이한 gRNA 또는 sgRNA에 의해 형성된 RNP 복합체가 상응하는 표적서열을 순차적으로 절단할 때 생성된다.
본 발명의 또 다른 일 구현예에 따르면, "2개 이상의 DNA 절단"은 상이한 PAM 서열을 인식하는 2개 이상의 각각의 CRISPR/Cas 뉴클레아제와 각각의 gRNA 또는 sgRNA에 의해 각각 형성된 RNP 복합체가 상응하는 표적서열을 순차적으로 절단할 때 생성된다. 이러한 방식으로 DNA 분자의 편집 가능한 창(window)이 더 커진다.
본 발명의 일 구현예에 따르면, 본 발명의 "제2, 제3 또는 그 이상의 표적유전자"는 제1 표적유전자와 코딩이 다른 유전자를 의미한다.
본 발명의 일 구현예에 따르면, 본 발명의 "최소한 1개의 인공적으로 합성된 crRNA 및 tracrRNA 단편 또는 인공적으로 합성된 제2, 제3 또는 그 이상의 표적유전자를 표적하는 sgRNA 단편"과 제1 표적유전자를 표적하는 crRNA 또는 sgRNA는 동일한 Cas 단백질을 공유한다.
본 발명의 또 다른 일 구현예에 따르면, 본 발명의 " 최소한 1개의 인공적으로 합성된 crRNA 및 tracrRNA 단편 또는 인공적으로 합성된 제2, 제3 또는 그 이상의 표적유전자를 표적하는 sgRNA 단편 "과 제1 표적유전자를 표적하는 crRNA 또는 sgRNA는 상이한 PAM 서열을 인식하는 Cas 단백질을 사용한다. 이러한 방식으로 제2 표적유전자에 더 많은 선별가능한 편집 부위가 있다.
본 발명의 일 구현예에 따르면, RNP 복합체를 세포 내로 전달하는 방법은 다음 중 선택되지만 이에 국한되지는 않는다: 1) PEG-매개 세포 형질주입 방법; 2) 리포솜-매개 세포 형질주입 방법; 3) 전기천공 형질전환 방법; 4) 미세주입법; 5) 유전자 총 충격; 등.
본 발명은 다음 단계를 포함하는 식물 지놈의 비-형질전환적 일시적 편집 방법을 추가로 제공한다:
1) 수용 식물 세포의 제1 표적유전자의 특정 부위에 대해 최소한 2개 이상의 crRNA 단편의 조합 또는 최소한 2개 이상의 sgRNA 단편의 조합이 설계 및 합성되고, 이 때 crRNA와 tracrRNA의 조합 또는 sgRNA 단독의 조합은 상응하는 Cas 단백질이 수용 세포의 제1 표적유전자의 특정 부위에서 2개 이상의 DNA 절단을 순차적으로 생성하고 이를 각각 자발적으로 복구하도록 유도할 수 있으며, 여기서 나중의 DNA 절단은 이전의 DNA 절단 복구에 의해 형성된 새로운 서열에 기반한다;
2) 사전에 위와 같이 설계 및 합성된 부위 특이적 편집을 유도할 수 있는 crRNA 단편과 tracrRNA 단편의 조합 또는 sgRNA 단편 단독의 조합과 적절한 양의 CRISPR/Cas 단백질 또는 이에 상응하는 mRNA가 혼합되어 제1 표적유전자의 부위 특이적 편집을 유도해 내인성 선별 마커를 생성할 수 있고, 선택적으로, 제2, 제3 또는 그 이상의 표적유전자를 표적하는 인공적으로 합성된 최소한 1개의 crRNA 및 tracrRNA 단편 또는 인공적으로 합성된 sgRNA 단편이 추가로 첨가되고, 시험관 내(in vitro)에서 배양되어 RNP 복합체를 형성한다;
3) 상기 RNP 복합체는 수용 식물 세포 또는 조직으로 전달되고 지놈 DNA의 특정 부위와 접촉하여 유전자 편집을 수행한다;
4) RNP 복합체에 의한 제1 표적유전자의 부위-특이적 편집에 의해 생성된 표현형으로 선별가능한 형질에 따라, 형질을 선택하기 위한 상응하는 선별압력이 적용되고, 편집 이벤트를 포함하는 세포, 조직, 기관 또는 완전한 식물체가 분리되고, 선택적으로, 제1 표적 유전자 및 최소한 1개의 제2, 제3 또는 그 이상의 표적유전자의 편집 이벤트를 동시에 포함하는 세포, 조직, 기관 또는 완전한 식물체가 분리된다.
본 발명의 일 구현예에 따르면, 본 발명의 "제1 표적유전자"는 최소한 1개의 표현형으로 선별가능한 형질을 코딩하는 유전자 좌이며, 상기 최소한 1개의 표현형으로 선별가능한 형질은 저항성/내성 형질 또는 성장에 이점이 있는 형질이다.
본 발명의 일 구현예에 따르면, 본 발명의 "제1 표적유전자의 특정 부위"는 해당 부위에서의 순차적 절단 및 복구 후에 특정 유형의 돌연변이가 발생될 수 있는 부위를 지칭하며, 이는 수용 세포에 특정 선별압력에 대한 저항성을 부여하여 최소한 1개의 표현형으로 선별가능한 저항성/내성 형질 또는 성장에 이점이 있는 형질을 생산할 수 있다.
본 발명의 일 구현예에 따르면, 본 발명의 "특정 유형의 돌연변이"는 단일 염기의 치환, 다수의 염기의 치환, 또는 불특정 수의 염기의 삽입 또는 결실을 포함한다.
본 발명의 일 구현예에 따르면, 본 발명의 "특정 선별압력"은 환경적 압력 또는 첨가된 화합물에 의한 압력일 수 있고; 예를 들어, 환경적 압력은 바람직하게는 고온, 저온 또는 저산소증 등이고; 첨가된 화합물에 의한 압력은 염 이온 농도, 항생제, 세포독소, 제초제 등에 의한 압력일 수 있다.
본 발명의 일 구현예에 따르면, 본 발명의 "수용 식물 세포 또는 조직"은 일시적 발현을 위한 수용체로서 작용할 수 있고 조직 배양을 통해 완전한 식물로 재생될 수 있는 임의의 세포 또는 조직이다. 구체적으로, 세포는 원형질체 세포 또는 현탁 세포이고; 조직은 바람직하게는 캘러스, 미성숙 배, 성숙한 배, 잎, 싹 끝, 어린 스파이크, 배축 등이다.
본 발명의 일 구현예에 따르면, CRISPR/Cas 단백질은 지놈 편집을 수행할 수 있는 임의의 CRISPR/Cas 뉴클레아제이다.
본 발명의 일 구현예에 따르면, 본 발명의 "특정 부위에서 2개 이상의 DNA 절단을 순차적으로 생성" 특징은 CRISPR/Cas 시스템에 의해 생성된 이전의 DNA 절단 복구에 의해 형성된 새로운 서열에 기초하여, 새로운 표적RNA가 설계되어 해당 부위를 다시 절단하는 것이다.
본 발명의 일 구현예에 따르면, 본 발명의 "2개 이상의 DNA 절단"은 동일한 CRISPR/Cas 뉴클레아제와 각각 상이한 gRNA 또는 sgRNA에 의해 형성된 RNP 복합체가 상응하는 표적 서열을 순차적으로 절단할 때 생성된다.
본 발명의 또 다른 일 구현예에 따르면, "2개 이상의 DNA 절단"은 상이한 PAM 서열을 인식하는 2개 이상의 각각의 CRISPR/Cas 뉴클레아제와 각각의 gRNA 또는 sgRNA에 의해 각각 형성된 RNP 복합체가 상응하는 표적서열을 순차적으로 절단할 때 생성된다. 이러한 방식으로 DNA 분자의 편집 가능한 창(window)이 더 커진다.
본 발명의 일 구현예에 따르면, 본 발명의 "제2, 제3 또는 그 이상의 표적유전자"는 제1 표적유전자와 코딩이 다른 유전자를 의미한다.
본 발명의 일 구현예에 따르면, 본 발명의 "최소한 1개의 인공적으로 합성된 crRNA 및 tracrRNA 단편 또는 인공적으로 합성된 제2, 제3 또는 그 이상의 표적유전자를 표적하는 sgRNA 단편"과 제1 표적유전자를 표적하는 crRNA 또는 sgRNA는 동일한 Cas 단백질을 공유한다.
본 발명의 또 다른 일 구현예에 따르면, 본 발명의 " 최소한 1개의 인공적으로 합성된 crRNA 및 tracrRNA 단편 또는 인공적으로 합성된 제2, 제3 또는 그 이상의 표적유전자를 표적하는 sgRNA 단편 "과 제1 표적유전자를 표적하는 crRNA 또는 sgRNA는 상이한 PAM 서열을 인식하는 Cas 단백질을 사용한다. 이러한 방식으로 제2 표적유전자에 더 많은 선별 가능한 편집 부위가 있다.
본 발명의 일 구현예에 따르면, RNP 복합체를 식물 세포 내로 전달하는 방법은 다음 중에서 선택되나, 이에 국한되지는 않는다: 1) PEG-매개 원형질체 형질전환 방법; 2) 미세주입법; 3) 유전자 총 충격; 4) 탄화규소섬유-매개 방법; 5) 진공 침투 방법, 또는 기타 일시적인 도입 방법. 유전자 총 충격 방법이 선호된다.
본 발명의 일 구현예에 따르면, 본 발명의 "제1 표적유전자"는 제초제 저항성/내성으로부터 선별되는 최소한 1개의 표현형으로 선별가능한 형질을 인코딩하는 최소한 1개의 내인성 유전자이고, 상기 제초제 저항성/내성은 EPSPS 억제제(글리포세이트(glyphosate) 포함)에 대한 저항성/내성; 글루타민 합성 억제제(글루포시네이트(glufosinate) 포함)에 대한 저항성/내성; ALS 또는 AHAS 억제제(이미다졸린 또는 설포닐우레아 포함)에 대한 저항성/내성; ACCase 억제제(아릴옥시페녹시프로피온산(aryloxyphenoxypropionic acid, FOP) 포함)에 대한 저항성/내성; 피토엔 데새투라제(phytoene desaturase, PDS) 단계의 카로티노이드 생합성 억제제, 4-하이드록시페닐피루베이트 디옥시게나제(4-hydroxyphenylpyruvate dioxygenase, HPPD) 억제제 또는 기타 카로티노이드 생합성 표적 억제제를 포함하는 카로티노이드 생합성 억제제에 대한 저항성/내성; 셀룰로오스 억제제에 대한 저항성/내성; 지질 합성 억제제에 대한 저항성/내성; 장쇄 지방산 억제제에 대한 저항성/내성; 미세소관 조립 억제제에 대한 저항성/내성; 광계 I 전자 션트제에 대한 저항성/내성; 광계 II 억제제(카바메이트, 트리아진 및 트리아존 포함)에 대한 저항성/내성; PPO 억제제에 대한 저항성/내성; 및 합성 성장 호르몬(디캄바, 2,4-D(즉, 2,4-디클로로페녹시아세트산) 포함)에 대한 저항성/내성으로 이루어진 군에서 선택된다. 상기 제1 표적 유전자는 PsbA, ALS, EPSPS, ACCase, PPO, HPPD, PDS, GS, DOXPS, TIR1, AFB5에서 선택되고, 상기 제초제 표적유전자의 특정 부위에서 순차적 절단 및 복구 후에 발생된 몇몇 유형의 돌연변이는 수용 식물 세포에 해당 제초제에 대한 저항성/내성을 부여할 수 있다.
본 발명의 일 구현예에 따르면, 본 발명의 "제1 표적유전자"는 ALS이고, "유전자의 특정 부위"는 Arabidopsis AtALS 단백질 아미노산 서열(예를 들어, 서열번호 1에 나타냄)에서 A122, P197, R198, D204, A205, D376, R377, W574, S653 또는 G654 부위 및 AtALS 아미노산 서열을 참조 표준으로 사용한 상기 언급된 아미노산 부위에 상응하는 다른 식물의 ALS 단백질의 아미노산 부위를 지칭한다. crRNA 또는 sgRNA는 A122, P197, R198, D204, A205, D376, R377, W574, S653, G654 또는 이들의 임의의 조합으로 이루어진 군으로부터 선택된 AtALS 단백질 아미노산 서열 부위를 인코딩하는 서열을 포함하는 표적서열과 AtALS 아미노산 서열을 참조 표준으로 사용한 상기 언급된 아미노산 부위에 상응하는 다른 식물의 ALS 아미노산 부위 및 이들의 조합을 인코딩하는 서열을 포함하는 표적서열을 표적한다. ALS W574 부위가 선호된다. 선별압력은 바람직하게는 피록술람(pyroxsulam) 또는 니코설퓨론(nicosulfuron) 처리이다.
본 발명의 일 구현예에 따르면, 본 발명의 "제1 표적 유전자"는 ACCase이고, "유전자의 특정 부위"는 Alopecurus myosuroides AmACCase 단백질 아미노산서열(예를 들어, 서열번호 3에 나타냄, 유전자 서열은 서열번호 4에 나타냄)에서 I1781, E1874, N1878, W1999, W2027, I2041, D2078, C2088 또는 G2096 부위 및 AmACCase 아미노산 서열을 참조 표준으로 사용한 상기 언급된 아미노산 부위에 상응하는 다른 단자엽 식물의 ACCase 단백질의 아미노산 부위를 지칭한다. crRNA 또는 sgRNA는 I1781, E1874, N1878, W1999, W2027, I2041, D2078, C2088, G2096 또는 이들의 임의의 조합으로 이루어진 군으로부터 선택된 AmACCase 아미노산 서열 부위를 인코딩하는 서열을 포함하는 표적서열과 AmACCase 아미노산 서열을 참조 표준으로 사용한 상기 언급된 아미노산 부위에 상응하는 다른 단자엽 식물의 ACCase 아미노산 부위 및 이들의 조합을 인코딩하는 서열을 포함하는 표적서열을 표적한다. ACCase W2027 부위가 선호된다. 선별압력은 바람직하게는 퀴잘로포프-p-에틸(quizalofop-p-ethyl) 처리이다.
본 발명의 일 구현예에 따르면, 본 발명의 "제1 표적유전자"는 HPPD이고, "유전자의 특정 부위"는 Oryza sativa OsHPPD 단백질 아미노산 서열(서열번호 5로 나타냄, 지놈 서열은 서열번호 6으로 나타냄)에서 H141, L276, P277, N338, G342, R346, D370, P386, K418 또는 G419 부위 및 OsHPPD 아미노산 서열을 참조 표준으로 사용한 상기 언급된 아미노산 부위에 상응하는 다른 식물의 HPPD 단백질의 아미노산 부위를 지칭한다. crRNA 또는 sgRNA는 H141, L276, P277, N338, G342, R346, D370, P386, K418, G419 또는 이들의 임의의 조합으로 이루어진 군으로부터 선택된 OsHPPD 아미노산 서열 부위를 인코딩하는 서열을 포함하는 표적서열과 OsHPPD 아미노산 서열을 참조 표준으로 사용한 상기 언급된 아미노산 부위에 상응하는 다른 식물의 HPPD 단백질의 아미노산 부위 및 이들의 조합을 인코딩하는 서열을 포함하는 표적서열을 표적한다. 선별압력은 바람직하게는 비스카르펜트라존(biscarfentrazone) 처리이다.
본 발명의 일 구현예에 따르면, 본 발명의 "제1 표적유전자"는 PPO이고, "유전자의 특정 부위"는 Oryza sativa OsPPO1 단백질 아미노산 서열(서열번호 7로 나타냄, 지놈 서열은 서열번호 8에 나타냄)에서 S128, V217, S223, V364, K373, L423, Y425 또는 W470 부위 및 OsPPO1 아미노산 서열을 참조 표준으로 사용한 상기 언급된 아미노산 부위에 상응하는 다른 식물의 PPO 단백질의 아미노산 부위를 지칭한다. crRNA 또는 sgRNA는 S128, V217, S223, V364, K373, L423, Y425, W470 또는 이들의 임의의 조합으로 이루어진 군으로부터 선택된 OsPPO1 아미노산 서열 부위를 인코딩하는 서열을 포함하는 표적서열과 OsPPO1 아미노산 서열을 참조 표준으로 사용한 상기 언급된 아미노산 부위에 상응하는 다른 식물의 PPO 단백질의 아미노산 부위 및 이들의 조합을 인코딩하는 서열을 포함하는 표적서열을 표적한다. 선별압력은 바람직하게는 사플루페나실(saflufenacil) 처리이다.
본 발명의 일 구현예에 따르면, 본 발명의 "제1 표적유전자"는 TIR1이고, "유전자의 특정 부위"는 Oryza sativa OsTIR1 단백질 아미노산 서열(서열번호 9로 나타냄, 지놈 서열은 서열번호 10에 나타냄)의 F93, F357, C413 또는 S448 부위 및 OsTIR1 아미노산 서열을 참조표준으로 사용한 상기 언급된 아미노산 부위에 상응하는 다른 식물의 TIR1 단백질의 아미노산 부위를 지칭한다. crRNA 또는 sgRNA는 F93, F357, C413, S448 또는 이들의 임의의 조합으로 이루어진 군으로부터 선택된 OsTIR1 아미노산 서열 부위를 인코딩하는 서열을 포함하는 표적서열과 OsTIR1 아미노산 서열을 참조 표준으로 사용한 상기 언급된 아미노산 부위에 상응하는 다른 식물의 TIR1 단백질의 아미노산 부위 및 이들의 조합을 인코딩하는 서열을 포함하는 표적서열을 표적한다. 선별압력은 바람직하게는 2,4-D 처리이다.
본 발명은 전술한 방법을 사용하는 비-형질전환적 일시적 편집 시스템을 추가로 제공한다.
본 발명은 전술한 비-형질전환적 일시적 편집 시스템의 선별 마커로서의 용도를 추가로 제공한다.
본 발명은 전술한 비-형질전환적 일시적 편집 시스템의 질병의 치료 용도를 추가 제공한다.
본 발명은 전술한 비-형질전환적 일시적 편집 시스템의 생물학적 육종에서의 용도를 추가로 제공한다.
본 발명은 전술한 방법으로 얻어진 유전자 변형 식물(GMO)을 추가적으로 제공하고, 지놈은 제1 표적유전자의 편집을 포함하며, 유전자 변형 식물은 비-형질전환적 방식으로 얻어진다.
본 발명은 전술한 방법으로 얻어진 유전자 변형 식물을 추가적으로 제공하고, 지놈은 제1 표적유전자의 편집 이벤트를 포함하며, 추가적으로 최소한 1개의 제2 표적유전자 편집 이벤트를 포함하고, 유전자 변형 식물은 비-형질전환적 방식으로 얻어진다.
본 발명은 전술한 방법으로 얻어진 유전자 변형 식물을 추가적으로 제공하고, 지놈은 최소한 1개의 제2 표적유전자 편집 이벤트를 포함하고, 유전자 변형식물은 비-형질전환적적 방식으로 얻어지며, 제1 표적유전자 편집 이벤트는 유전적 분리에 의해 제거된다.
본 발명은 전술한 방법으로 얻어진 유전자 변형 식물의 지놈을 제공하고, 지놈은 다음을 포함한다: 1) 제1 표적유전자의 편집; 2) 제1 표적유전자의 편집 및 최소한 1개의 제2 표적유전자의 편집; 또는 3) 최소한1개의 제2 표적유전자 편집(여기서, 제1 표적유전자의 편집 이벤트는 유전적 분리에 의해 제거됨); 여기서 유전자 변형 식물은 비-형질전환적 방식으로 얻어진다.
본 발명의 또 다른 일 양태에 있어서, 본 발명은 전술한 방법으로 얻어진 새로운 식물 유전자 돌연변이를 제공한다.
본 발명은 또한 다음 유형 중 하나 또는 둘 이상의 조합을 포함하는 식물에서 발생된 새로운 돌연변이를 제공한다:
Arabidopsis ALS376에 상응하는 부위의 아스파르트산을 다른 아미노산으로 치환, Arabidopsis ALS574에 상응하는 부위의 트립토판을 다른 아미노산으로 치환, Arabidopsis ALS653에 상응하는 부위의 세린을 임의의 다른 아미노산으로 치환, 또는 Arabidopsis ALS654에 상응하는 부위의 세린을 임의의 다른 아미노산으로 치환; 또는 Alopecurus myosuroides ACCase2027에 상응하는 부위의 트립토판을 다른 아미노산으로 치환.
본 발명의 일 구현예에 따르면, Arabidopsis ALS376에 상응하는 부위의 아스파르트산은 글루탐산(D376E)으로 치환되고, Arabidopsis ALS574에 상응하는 부위의 트립토판은 류신 또는 메티오닌(W574L 또는 W574M)으로 치환되고, Arabidopsis ALS653에 상응하는 부위가 아스파라긴 또는 아르기닌으로 치환되고(S653N 또는 S653R), 또는 Arabidopsis ALS654에 상응하는 부위의 글리신이 아스파르트산으로 치환(G654D)되며, 상기 아미노산 부위는 Arabidopsis thalianan의 해당 아미노산 부위를 기준으로 언급되었다; 또는 Alopecurus myosuroides ACCase2027에 상응하는 부위의 트립토판이 류신 또는 시스테인(W2027L 또는 W2027C)으로 치환되며, 상기 아미노산 부위는 Alopecurus myosuroides의 해당 아미노산 부위를 기준으로 언급되었다.
본 발명의 또 다른 일 구현예에 따르면, 돌연변이 유형은 S653R/G654D이고, 상기 아미노산 부위는 Arabidopsis thalianan의 해당 아미노산 부위를 기준으로 언급되었다.
본 발명의 일 구현예에 따르면, Oryza sativa ALS의 350 부위의 아스파르트산은 임의의 다른 아미노산으로 치환되고, Oryza sativa ALS의 548 부위의 트립토판은 임의의 다른 아미노산으로 치환되고, 또는 Solanum tuberosum L. ALS2의 561 부위의 트립토판은 임의의 다른 아미노산으로 치환되고; 또는 Oryza sativa ACCase2의 2038부위의 트립토판이 임의의 다른 아미노산으로 치환된다.
본 발명의 또 다른 일 구현예에 따르면, Oryza sativa ALS의 350 부위의 아스파르트산은 글루탐산(D350E)에 의해 치환되고, Oryza sativa ALS의 548 부위의 트립토판은 류신 또는 메티오닌(W548L 또는 W548M)에 의해 치환되고, 또는 Solanum tuberosum L. ALS2의 561 부위의 트립토판은 류신 또는 메티오닌으로 치환되고(W561L 또는 W561M); 또는, Oryza sativa ACCase2의 2038 부위의 트립토판이 류신 또는 시스테인(W2038L 또는 W2038C)으로 치환되며, 상기 Oryza sativa ALS 단백질의 아미노산 서열은 서열번호 11에 나타내었으며, Solanum tuberosum L.의 StALS2 단백질의 아미노산 서열은 서열번호 19에 나타내었으며, Oryza sativa ACCase2 단백질의 아미노산 서열은 서열번호 13에 나타내었다.
본 발명은 전술한 새로운 돌연변이를 갖는 단백질 또는 이의 생물학적 활성 단편을 추가로 제공한다.
본 발명은 또한 단백질 또는 그의 생물학적 활성 단편을 인코딩하는 핵산 서열 또는 그의 상보적 서열을 포함하는 핵산을 제공한다.
본 발명은 핵산 및 이에 작동가능하게 연결된 프로모터를 포함하는 재조합 발현 벡터를 추가로 제공한다.
본 발명은 핵산을 포함하는 발현 카세트를 추가로 제공한다.
본 발명은 발현 카세트를 포함하는 식물 세포를 추가로 제공한다.
본 발명은 식물 세포를 이용하여 재생된 식물을 추가로 제공한다.
본 발명의 또 다른 일 양태에 있어서, 본 발명은 식물 세포를 식물로 재생시키는 것을 포함하는, 제초제에 대한 저항성 또는 내성이 개선된 식물의 생산 방법을 제공한다.
본 발명의 또 다른 일 양태에 있어서, 본 발명은 식물 재배 장소에서 잡초를 방제하기 위한 방법을 제공하며, 상기 식물은 전술한 식물 또는 전술한 방법에 의해 생산된 식물을 포함하고, 상기 방법은 재배 장소에 1개 이상의 제초제를 잡초를 제거하는데 유효한 양으로 처리하는 것을 포함한다.
본 발명의 또 다른 일 양태에 있어서, 본 발명은 새로운 돌연변이, 단백질 또는 이의 생물학적 활성 단편, 핵산, 재조합 발현 벡터 또는 발현 카세트의 식물 세포, 식물 조직, 식물의 일부 또는 식물체의 제초제에 대한 저항성 또는 내성 개선 용도를 제공한다.
본 발명은 다음의 우수한 기술적 효과를 갖는다:
순차 편집에 의해 생성된 새로운 복구 이벤트에서 형성된 서열을 기반으로 지놈의 특정 부위에서 여러 번 연속적으로 돌연변이를 발생시킬 수 있는 새로운 표적을 설계할 수 있으므로, 이에 따라 DNA 절단 후 복구 유형을 기하급수적으로 풍부하게 하고, 단일 유전자 편집으로 얻을 수 없는 염기 치환, 결실 및 삽입 돌연변이 유형을 실현한다. 즉, 본 발명에서 채택한 이전의 유전자 편집 복구에서 형성된 서열을 나중의 유전자 편집 대상으로 사용하는 프로그래밍된 순차적 절단/편집 방식은 간단한 녹아웃을 통해 CRISPR/Cas에 단일 염기 편집 및 정확한 부위의 염기 삽입, 결실이라는 새로운 기능을 부여할 수 있다.
본 발명은 외인성 마커 없이 유전자 편집 이벤트의 선별을 실현할 수 있고, 추가로 비-형질전환적 유전자 편집을 실현하고 편집 이벤트를 효과적으로 선별할 수 있으며, 세포 치료 및 생물학적 육종 방법에서 생물학적 안전성 문제를 크게 감소시킬 수 있다.
특히, 본 발명에서 제공하는 식물 비-형질전환적 일시적인 편집 방법은 전 과정에서 외인성 DNA의 개입 없이 Cas 단백질과 인공적으로 합성된 gRNA 또는 sgRNA의 작은 단편만을 포함하고, 순차적 절단/편집으로 제1 표적유전자를 편집하여 내인성 저항성 선별 마커를 생산하여, 편집 이벤트를 효과적으로 선별할 수 있으며, 실제로 유전적 변형 작업이 수반되지 않으므로 이 방법은 화학적 돌연변이 유발 또는 방사선-유도 육종과 동등하고, 또한 외인성 형질전환 성분의 연속적인 다세대 분리 및 검출이 필요하지 않으므로 육종 주기를 단축하고 생물학적 안전성을 보장하며 감독 및 승인 비용을 절약하고 식물의 정밀 육종에서 크게 응용될 수 있는 전망을 제공한다.
본 발명에 있어서, 달리 명시되지 않는 한, 본 명세서에서 사용되는 과학 기술 용어는 당해 기술 분야에서 통상의 지식을 가진 자에게 일반적으로 이해되는 의미를 갖는다. 또한, 본 문서에서 사용되는 단백질 및 핵산 화학, 분자생물학, 세포 및 조직 배양, 미생물학, 면역학 관련 용어 및 실험 절차는 모두 해당 분야에서 널리 사용되는 일상적인 절차이다. 동시에, 본 발명을 보다 잘 이해하기 위하여 관련 용어에 대한 정의 및 설명을 이하 제시한다.
본 명세서에서 사용되는 용어 "지놈"은 유기체의 각 세포 또는 바이러스 또는 소기관에 존재하는 유전 물질(유전자 및 비암호화 서열)의 모든 보완물 및/또는 부모로부터 하나의 단위로 유전되는 완전한 지놈(반수체)을 지칭한다.
용어 "유전자 편집"은 살아있는 유기체의 모든 유전 정보 또는 지놈의 표적화된 특이적 변형 전략 및 기술을 의미한다. 따라서, 상기 용어는 지놈의 유전자 코딩 영역뿐만 아니라 유전자 코딩 영역 이외의 영역의 편집도 포함한다. 여기에는 핵(존재하는 경우) 및 세포의 기타 유전 정보를 편집하거나 수정하는 것도 포함된다.
용어 "CRISPR/Cas 뉴클레아제"는 CRISPR 기반 뉴클레아제 또는 이를 암호화하는 핵산 서열일 수 있으며, 여기에는 다음이 포함되지만 이에 국한되지는 않는다: 1) SpCas9, ScCas9, SaCas9, xCas9, VRER-Cas9, EQR-Cas9, SpG-Cas9, SpRY-Cas9, SpCas9-NG, NG-Cas9, NGA-Cas9(VQR) 등을 포함하는 Cas9; 2) LbCpf1, FnCpf1, AsCpf1, MAD7 등을 포함하는 Cas12, 또는 전술한 CRISPR 기반 뉴클레아제의 임의의 변이체 또는 유도체; 바람직하게는, 최소한 1개의 CRISPR-기반 뉴클레아제는 상응하는 야생형 서열과 비교해 돌연변이를 포함하며, 획득한 CRISPR-기반 뉴클레아제는 상이한 PAM 서열을 인식한다. 본 명세서에 사용된 "CRISPR 기반 뉴클레아제"는 자연적으로 발생하는 CRISPR 시스템에서 확인된 임의의 뉴클레아제이며, 이는 자연적 배경으로부터 후속적으로 분리되며, 바람직하게는 목적하는 재조합 컨스트럭트(construct)로 변형되거나 조합되며, 표적화된 지놈 공학을 위한 도구로 적합하다. 본래의 야생형 CRISPR-기반 뉴클레아제가 DNA 인식, 즉 결합 특성을 제공하는 한, 본 발명의 다양한 구현예에 적합하도록 임의의 CRISPR-기반 뉴클레아제가 사용되거나 선택적으로 재프로그래밍되거나 돌연변이될 수 있다.
용어 "CRISPR"는 전사 수준에서 유전자 발현을 조절하는 RNA 간섭과 상이한, 클러스터된 규칙적으로 간격을 둔 짧은 회문 반복에 의존하는 서열 특이적 유전자 조작 기술을 지칭한다.
용어 "Cas9 뉴클레아제" 및 "Cas9"는 본 명세서에서 상호교환적으로 사용되며, Cas9 단백질 또는 이의 단편(예를 들어, Cas9의 활성 DNA 절단 도메인 및/또는 Cas9의 gRNA 결합 도메인을 함유하는 단백질)을 포함하는 RNA-가이드 뉴클레아제를 지칭한다. Cas9는 CRISPR/Cas(클러스터된 규칙적으로 간격을 둔 짧은 회문 반복 및 관련 시스템) 지놈 편집 시스템의 구성 요소이다. 가이드 RNA의 유도에 따라 DNA 표적서열을 표적하고 절단하여 DNA 이중 가닥 절단(DSB)을 생성할 수 있다.
용어 "Cas 단백질" 또는 "Cas 폴리펩타이드"는 Cas(CRISPR-연관) 유전자에 의해 인코딩된 폴리펩타이드를 지칭한다. Cas 단백질에는 Cas 엔도뉴클레아제가 포함된다. Cas 단백질은 박테리아 또는 고세균 단백질일 수 있다. 예를 들어, 본 명세서의 유형 I 내지 III CRISPR Cas 단백질은 일반적으로 원핵생물에서 유래하고; 유형 I 및 유형 III Cas 단백질은 박테리아 또는 고세균 종으로부터 유래될 수 있고, 유형 II Cas 단백질(즉, Cas9)은 박테리아 종으로부터 유래될 수 있다. "Cas 단백질"은 Cas9 단백질, Cpf1 단백질, C2c1 단백질, C2c2 단백질, C2c3 단백질, Cas3, Cas3-HD, Cas5, Cas7, Cas8, Cas10, Cas12a, Cas12b, 또는 이들의 조합 또는 복합체를 포함한다.
"Cas9 변이체" 또는 "Cas9 엔도뉴클레아제 변이체"는 모체 Cas9 엔도뉴클레아제의 변이체를 말하며, 여기서 Cas9 엔도뉴클레아제 변이체는 crRNA 및 tracRNA 또는 sgRNA와 연관될 때 DNA 표적서열의 전부 또는 일부를 인식, 결합하는 능력, 선택적으로 DNA 표적서열의 전체 또는 일부를 풀고, 틈을 만들거나(nicking) 절단하는 능력을 보유한다. Cas9 엔도뉴클레아제 변이체는 본 명세서에 기재된 Cas9 엔도뉴클레아제 변이체를 포함하며, 상기 Cas9 엔도뉴클레아제 변이체는 다음 방식으로 모체 Cas9 엔도뉴클레아제와 상이하다: Cas9 엔도뉴클레아제 변이체(gRNA와 융합되어 표적부위를 수정할 수 있는 폴리뉴클레오타이드-다이렉트 엔도뉴클레아제 복합체를 형성)는 모체 Cas9 엔도뉴클레아제(동일한 gRNA와 융합되어 동일한 표적 부위를 수정할 수 있는 폴리뉴클레오타이드-유도 엔도뉴클레아제 복합체를 형성)와 비교하여 다음과 같은, 그러나 그에 국한되지 않는 최소한 1개의 개선된 특성을 갖는다; 증가된 형질전환 효율, 증가된 DNA 편집 효율, 감소된 표적외(off-target) 절단 또는 이들의 임의의 조합과 같은 최소한 1개의 개선된 특성을 갖는다.
본 명세서에 기재된 Cas9 엔도뉴클레아제 변이체는 crRNA 및 tracrRNA 또는 sgRNA와 관련될 때 이중 가닥 DNA 표적부위에 결합하여 틈을 낼 수 있는 변이체를 포함하는 반면, 모체 Cas 엔도뉴클레아제는 crRNA 및 tracrRNA 또는 sgRNA와 관련될 때 표적부위에 결합하여 이중 가닥 절단(파손)을 생성할 수 있다.
용어 "가이드 RNA" 및 "gRNA"는 본 명세서에서 상호교환적으로 사용되며, CRISPR 기술을 사용한 교정을 위해 특정 유전자를 표적하는데 사용되는 가이드 RNA 서열을 지칭하며, 일반적으로 부분적으로 상보적인 crRNA 및 tracrRNA 분자로 구성되어 복합체를 형성하고, 상기 crRNA는 표적서열에 대해 충분한 상보성을 가진 서열을 포함해서 표적서열과 혼성화하고 CRISPR 복합체(Cas9+crRNA+tracrRNA)가 표적 서열에 특이적으로 결합하도록 지시할 수 있다. 그러나, crRNA 및 tracrRNA의 특성을 모두 포함하는 단일 가이드 RNA(sgRNA)가 설계될 수 있다는 것은 당업계에 알려져있다.
용어 "단일 가이드 RNA" 및 "sgRNA"는 본 명세서에서 상호교환적으로 사용되며, 가변 표적화 도메인(tracrRNA와 혼성화 되어 tracr페어링 서열에 연결된다)의 crRNA(CRISPR RNA) 및 tracrRNA(트랜스 활성화 CRISPR RNA)의 융합을 포함하는 2개의 RNA 분자의 합성 융합을 지칭한다. sgRNA는 유형 II Cas 엔도뉴클레아제와 복합체를 형성할 수 있는 유형 II CRISPR/Cas 시스템의 crRNA 또는 crRNA 단편 및 tracrRNA 또는 tracrRNA 단편을 포함할 수 있으며, 여기서 가이드 RNA/Cas 엔도뉴클레아제 복합체는 Cas 엔도뉴클레아제를 DNA 표적부위로 유도하여, Cas 엔도뉴클레아제가 DNA 표적부위를 인식하고, 선택적으로 결합하고, 선택적으로 DNA 표적부위에 틈을 만들거나 DNA 표적부위를 절단(단일 가닥 또는 이중 가닥 절단을 도입)하게 할 수 있다.
본 발명의 일 구현예에 따르면, 가이드 RNA(들) 및 Cas9는 리보핵단백질(ribonucleoprotein, RNP) 복합체로서 세포에 전달될 수 있다. RNP는 gRNA가 복합된 정제된 Cas9 단백질로 구성되어 있으며, RNP가 줄기세포 및 면역세포를 비롯한 다양한 세포에 효과적으로 전달될 수 있다는 것은 당업계에 잘 알려져 있다(Addgene, Cambridge, MA, Mirus Bio LLC, Madison, WI).
본 명세서에서 프로토스페이서 인접 모티프(protospacer adjacent motif, PAM)는 gRNA/Cas 엔도뉴클레아제 시스템에 의해 인식되는 (표적화된) 표적서열(프리스페이서)에 인접한 짧은 뉴클레오타이드 서열을 의미한다. 표적DNA서열이 적절한 PAM 서열에 인접하지 않으면 Cas 엔도뉴클레아제가 표적DNA서열을 성공적으로 인식하지 못할 수 있다. 본 명세서에서 PAM의 서열 및 길이는 사용 중인 Cas 단백질 또는 Cas 단백질 복합체에 따라 상이할 수 있다. PAM 서열은 임의의 길이일 수 있지만 일반적으로 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 뉴클레오타이드 길이다.
본 명세서에서, 용어 "유기체" 또는 "생체"는 동물, 식물, 진균, 박테리아 등을 포함한다.
본 명세서에서, 용어 "숙주 세포"는 식물 세포, 동물 세포, 진균 세포, 박테리아 세포 등을 포함한다.
본 발명에서, "동물"은 인간, 비인간 포유동물, 조류, 어류, 파충류, 양서류 등과 같은 척추동물 뿐만 아니라 곤충과 같은 무척추동물을 포함하지만 이에 국한되지 않는다.
본 발명에서, "식물" 광합성을 수행할 수 있는 임의의 분화된 다세포 유기체, 특히 단자엽 또는 쌍자엽 식물을 의미하는 것으로 이해되어야 하며, 예를 들어, (1) 식용 작물: Oryza sativa, Oryza latifolia, Oryza sativa, Oryza glaberrima같은 Oryza spp.; Triticum aestivum, T. Turgidumssp. durum 같은 Triticum spp.; Hordeum vulgare, Hordeum arizonicum 같은 Hordeum spp.; Secale cereale; Avena sativa, Avena fatua, Avena byzantine, Avena fatua var.sativa, Avena hybrida 같은 Avena spp.; Pennisetum glaucum, Sorghum, Sorghum bicolor, Sorghum vulgare, Triticale, Zea mays or Maize, Millet, Rice, Foxtail millet, Proso millet, Sorghum bicolor, Panicum, Fagopyrum spp., Panicum miliaceum, Setaria italica, Zizania palustris, Eragrostis tef, Panicum miliaceum, Eleusine coracana 같은 Echinochloa spp.; (2) 콩과 식물: Glycine max 같은 Glycine spp., Soja hispida, Soja max, Vicia spp., Vigna spp., Pisum spp., field bean, Lupinus spp., Vicia, Tamarindus indica, Lens culinaris, Lathyrus spp., Lablab, broad bean, mung bean, red bean, chickpea; (3) 기름작물: Arachis hypogaea, Arachis spp, Sesamum spp., Helianthus spp. like Helianthus annuus, Elaeis like Eiaeis guineensis, Elaeis oleifera, soybean, Brassicanapus, Brassica oleracea, Sesamum orientale, Brassica juncea, Oilseed rape, Camellia oleifera, oil palm, olive, castor-oil plant, Brassica napus L., canola; (4) 섬유 작물: Agave sisalana, Gossypium spp. like Gossypium, Gossypium barbadense, Gossypium hirsutum, Hibiscus cannabinus, Agave sisalana, Musa textilis Nee, Linum usitatissimum, Corchorus capsularis L, Boehmeria nivea (L.), Cannabis sativa, Cannabis sativa; (5) 과일 작물: Ziziphus spp., Cucumis spp., Passiflora edulis, Vitis spp., Vaccinium spp., Pyrus communis, Prunus spp., Psidium spp., Punica granatum, Malus spp., Citrullus lanatus, Citrus spp., Ficus carica, Fortunella spp., Fragaria spp., Crataegus spp., Diospyros spp., Eugenia unifora, Eriobotrya japonica, Dimocarpus longan, Carica papaya, Cocos spp., Averrhoa carambola, Actinidia spp., Prunus amygdalus, Musa spp. (musa acuminate), Persea spp. (Persea Americana), Psidium guajava, Mammea Americana, Mangifera indica, Canarium album (Oleaeuropaea), Caricapapaya, Cocos nucifera, Malpighia emarginata, Manilkara zapota, Ananas comosus, Annona spp., Citrus reticulate (Citrus spp.), Artocarpus spp., Litchi chinensis, Ribes spp., Rubus spp., pear, peach, apricot, plum, red bayberry, lemon, kumquat, durian, orange, strawberry, blueberry, hami melon, muskmelon, date palm, walnut tree, cherry tree; (6) 뿌리줄기 작물: Manihot spp., Ipomoea batatas, Colocasia esculenta, tuber mustard, Allium cepa (onion), eleocharis tuberose (water chestnut), Cyperus rotundus, Rhizoma dioscoreae; (7) 채소 작물: Spinacia spp., Phaseolus spp., Lactuca sativa, Momordica spp, Petroselinum crispum, Capsicum spp., Solanum spp. (Solanum tuberosum, Solanum integrifolium, Solanum lycopersicum 같은), Lycopersicon spp. (Lycopersicon esculentum, Lycopersicon lycopersicum, Lycopersicon pyriforme 같은), Macrotyloma spp., Kale, Luffa acutangula, lentil, okra, onion, potato, artichoke, asparagus, broccoli, Brussels sprouts, cabbage, carrot, cauliflower, celery, collard greens, squash, Benincasa hispida, Asparagus officinalis, Apium graveolens, Amaranthus spp., Allium spp., Abelmoschus spp., Cichorium endivia, Cucurbita spp., Coriandrum sativum, B.carinata, Rapbanus sativus, Brassica spp. (such as Brassica napus, Brassica rapa ssp., canola, oilseed rape, turnip rape, turnip rape, leaf mustard, cabbage, black mustard, canola (rapeseed), Brussels sprout, Solanaceae (eggplant), Capsicum annuum (sweet pepper), cucumber, luffa, Chinese cabbage, rape, cabbage, calabash, Chinese chives, lotus, lotus root, lettuce; (8) 꽃 작물: Tropaeolum minus, Tropaeolum majus, Canna indica, Opuntia spp., Tagetes spp., Cymbidium (orchid), Crinum asiaticum L., Clivia, Hippeastrum rutilum, Rosa rugosa, Rosa Chinensis, Jasminum sambac, Tulipa gesneriana L., Cerasus sp., Pharbitis nil (L.) Choisy, Calendula officinalis L., Nelumbo sp., Bellis perennis L., Dianthus caryophyllus, Petunia hybrida, Tulipa gesneriana L., Lilium brownie, Prunus mume, Narcissus tazetta L., Jasminum nudiflorum Lindl., Primula malacoides, Daphne odora, Camellia japonica, Michelia alba, Magnolia liliiflora, Viburnum macrocephalum, Clivia miniata, Malus spectabilis, Paeonia suffruticosa, Paeonia lactiflora, Syzygium aromaticum, Rhododendron simsii, Rhododendron hybridum, Michelia figo (Lour.) Spreng., Cercis chinensis, Kerria japonica, Weigela florida, Fructus forsythiae, Jasminum mesnyi, Parochetus communis, Cyclamen persicum Mill., Phalaenophsis hybrid, Dendrobium nobile, Hyacinthus orientalis, Iris tectorum Maxim, Zantedeschia aethiopica, Calendula officinalis, Hippeastrum rutilum, Begonia semperflorenshybr, Fuchsia hybrida, Begonia maculataRaddi, Geranium, Epipremnum aureum; (9) 약용작물: Carthamus tinctorius, Mentha spp., Rheum rhabarbarum, Crocus sativus, Lycium chinense, Polygonatum odoratum, Polygonatum Kingianum, Anemarrhena asphodeloides Bunge, Radix ophiopogonis, Fritillaria cirrhosa, Curcuma aromatica, Amomum villosum Lour., Polygonum multiflorum, Rheum officinale, Glycyrrhiza uralensis Fisch, Astragalus membranaceus, Panax ginseng, Panax notoginseng, Acanthopanax gracilistylus, Angelica sinensis, Ligusticum wallichii, Bupleurum sinenses DC., Datura stramonium Linn., Datura metel L., Mentha haplocalyx, Leonurus sibiricus L., Agastache rugosus, Scutellaria baicalensis, Prunella vulgaris L., Pyrethrum carneum, Ginkgo biloba L., Cinchona ledgeriana, Hevea brasiliensis (wild), Medicago sativa Linn, Piper Nigrum L., Radix Isatidis, Atractylodes macrocephala Koidz; (10) 원료 작물: Hevea brasiliensis, Ricinus communis, Vernicia fordii, Morus alba L., Hops Humulus lupulus, Betula, Alnus cremastogyne Burk., Rhus verniciflua stokes; (11) 목초지 작물: Agropyron spp., Trifolium spp., Miscanthus sinensis, Pennisetum sp., Phalaris arundinacea, Panicum virgatum, prairiegrasses, Indiangrass, Big bluestem grass, Phleum pratense, turf, cyperaceae (Kobresia pygmaea, Carex pediformis, Carex humilis), Medicago sativa Linn, Phleum pratense L., Medicago sativa, Melilotus suavcolen, Astragalus sinicus, Crotalaria juncea, Sesbania cannabina, Azolla imbircata, Eichhornia crassipes, Amorpha fruticosa, Lupinus micranthus, Trifolium, Astragalus adsurgens pall, Pistia stratiotes linn, Alternanthera philoxeroides, Lolium; (12) 설탕 작물: Saccharum spp., Beta vulgaris; (13) 음료 작물: Camellia sinensis, Camellia Sinensis, tea, Coffee (Coffea spp.), Theobroma cacao, Humulus lupulus Linn.; (14) 잔디 식물: Ammophila arenaria, Poa spp.(Poa pratensis (bluegrass)), Agrostis spp. (Agrostis matsumurae, Agrostis palustris), Lolium spp. (Lolium), Festuca spp. (Festuca ovina L.), Zoysia spp. (Zoysiajaponica), Cynodon spp. (Cynodon dactylon/bermudagrass),Stenotaphrum secunda tum (Stenotaphrum secundatum), Paspalum spp., Eremochloa ophiuroides (centipedegrass), Axonopus spp. (carpetweed), Bouteloua dactyloides (buffalograss), Bouteloua var. spp. (Bouteloua gracilis), Digitaria sanguinalis, Cyperusrotundus, Kyllingabrevifolia, Cyperusamuricus, Erigeron canadensis, Hydrocotylesibthorpioides, Kummerowiastriata, Euphorbia humifusa, Viola arvensis, Carex rigescens, Carex heterostachya, turf; (15) 나무 작물: Pinus spp., Salix spp., Acer spp., Hibiscus spp., Eucalyptus spp., Ginkgo biloba, Bambusa sp., Populus spp., Prosopis spp., Quercus spp., Phoenix spp., Fagus 종, Ceiba pentandra; (16) 견과 작물: Bertholletia excelsea, Castanea spp., Corylus spp., Carya spp., Juglans spp., Pistacia vera, Anacardium occidentale, Macadamia (Macadamia integrifolia), Carya illinoensis Koch, Macadamia, Pistachio, Badam, other plants that produce nuts; (17) 기타: arabidopsis thaliana, Bra chiaria eruciformis, Cenchrus echinatus, Setaria faberi, eleusine indica, Cadaba farinose, algae, Carex elata, ornamental plants, Carissa macrocarpa, Cynara spp., Daucus carota, Dioscorea spp., Erianthus sp., Festuca arundinacea, Hemerocallis fulva, Lotus spp., Luzula sylvatica, Medicago sativa, Melilotus spp., Morus nigra, Nicotiana spp., Olea spp., Ornithopus spp., Pastinaca sativa, Sambucus spp., Sinapis sp., Syzygium spp., Tripsacum dactyloides, Triticosecale rimpaui, Viola odorata 등.
본 발명의 일 구현예에 따르면, 식물은 벼, 옥수수, 밀, 대두, 해바라기, 수수, 평지, 자주개자리, 목화, 보리, 기장, 사탕수수, 토마토, 담배, 카사바, 감자, 고구마, 배추, 양배추, 오이, 장미, Scindapsus aureus, 수박, 멜론, 딸기, 블루베리, 포도, 사과, 감귤류, 복숭아, 배, 바나나 등에서 선택된다.
본 명세서에서, 용어 "식물"은 식물 전체 및 임의의 자손, 세포, 조직 또는 식물의 부분을 포함한다. 용어 "식물 부분"은 다음을 포함하지만 이에 국한되지 않는 식물의 임의의 부분을 포함한다: 종자(성숙 종자, 종피가 없는 미성숙 배 및 미성숙 종자 포함); 식물 절단; 식물 세포; 식물 세포 배양; 식물 기관(예: 꽃가루, 배아, 꽃, 과일, 새싹, 잎, 뿌리, 줄기 및 관련 외식편). 식물 조직 또는 식물 기관은 종자, 캘러스 조직 또는 구조적 또는 기능적 단위로 구성된 기타 식물 세포 집단일 수 있다. 식물 세포 또는 조직 배양물은 세포 또는 조직이 유래된 식물의 생리학적 및 형태학적 특징을 갖는 식물을 재생시킬 수 있고, 식물과 실질적으로 동일한 유전자형을 갖는 식물을 재생할 수 있다. 대조적으로, 일부 식물 세포는 식물을 재생할 수 없다. 식물 세포 또는 조직 배양에서 재생 가능한 세포는 배아, 원형질체, 분열조직 세포, 캘러스, 꽃가루, 잎, 꽃밥, 뿌리, 뿌리 끝, 실크, 꽃, 커널, 스파이크, 속대, 껍질 또는 줄기일 수 있다.
식물 부분은 수확 가능한 부분 및 자손 식물을 번식시키는 데 사용할 수 있는 부분을 포함한다. 번식을 위해 사용될 수 있는 식물 부분은 예를 들면 다음과 같으나 이에 국한되지는 않는다: 종자; 과일; 절단; 묘목; 괴경; 및 대목. 식물의 수확 가능한 부분은 예를 들면 다음과 같으나 이에 국한되지는 않는다: 꽃; 화분; 묘목; 괴경; 이파리; 줄기; 과일; 종자; 및 뿌리.
식물 세포는 식물의 구조적, 생리학적 단위이다. 본 명세서에서, 식물 세포는 원형질체 및 부분적인 세포벽을 갖는 원형질체를 포함한다. 식물 세포는 분리된 단일 세포 또는 세포 집합체(예: 느슨한 캘러스 및 배양 세포)의 형태일 수 있고, 고차 조직 단위(예: 식물 조직, 식물 기관 및 식물체)의 일부일 수 있다. 따라서 식물 세포는 원형질체, 배우자 생산 세포, 또는 전체 식물을 재생할 수 있는 세포 또는 세포의 집합체일 수 있다. 따라서, 본 명세서의 구현예에서, 다수의 식물 세포를 함유하고 전체 식물로 재생될 수 있는 종자는 "식물 부분"으로 간주된다.
본 명세서에서, "원형질체(protoplast)"라는 용어는 세포벽이 완전히 또는 부분적으로 제거되고 지질 이중층 막이 노출된 식물 세포를 의미한다. 일반적으로 원형질체는 세포벽이 없는 분리된 식물 세포로, 세포 배양 또는 전체 식물로 재생할 가능성이 있다.
식물 "자손"은 식물의 모든 후속 세대를 포함한다.
용어 "박테리아"는 원핵생물계의 모든 유기체를 포함한 모든 원핵생물을 의미한다. 용어 "박테리아"는 Mycoplasma, Chlamydia, Actinomyces, Streptomyce 및 Rickettsia를 포함하여 박테리아로 간주되는 모든 미생물을 포함한다. 구균(cocci), 간균(bacilli), 스피릴라(spirilla), 스페로플라스트(spheroplast), 원형질체(protoplast) 등을 포함한 모든 형태의 박테리아가 이 정의에 포함된다. 이 용어에는 그람 음성 또는 그람 양성인 원핵생물도 포함된다. "그람 음성" 및 "그람 양성"은 당업계에 잘 알려진 그람 염색 방법을 사용한 염색 패턴을 의미한다(예를 들어, Finegold and Martin, Diagnostic Microbiology, 6th Ed., CV Mosby St. Louis, pp. 13 -15[1982]). "그람 양성 박테리아"는 그람 염색에 사용된 원래 염료를 유지할 수 있는 박테리아로, 염색된 세포가 현미경으로 짙은 파란색에서 보라색으로 나타난다. "그람 음성 박테리아"는 그람 염색에 사용된 원래 염료를 유지하지 않지만 반대 염색으로 염색할 수 있다. 따라서 그람 음성균은 그람 염색 반응 후에 붉게 나타난다.
본 명세서에서, 용어 "진균"은 이형성 진균을 포함하는 곰팡이 및 효모와 같은 진핵 유기체를 지칭한다.
용어 "제초제 내성" 및 "제초제 저항성"은 상호 교환적으로 사용될 수 있으며, 둘 다 제초제 내성 및 제초제 저항성을 나타낸다. "제초제 내성 개선" 및 "제초제 저항성 개선"은 야생형 유전자를 함유하는 식물에 비해 제초제에 대한 내성 또는 저항성이 개선됨을 의미한다.
용어 "야생형"은 자연에서 발견될 수 있는 핵산 분자 또는 단백질을 의미한다.
본 발명에서, 용어 "재배지"는 토양과 같이 본 발명의 식물이 재배되는 장소를 포함하며, 또한 예를 들어 식물 종자, 식물 묘목 및 재배 식물을 포함한다. 용어 "잡초 방제 유효량"은 표적 잡초의 성장 또는 발달에 영향을 미치기에 충분한 제초제의 양, 예를 들어 표적 잡초의 성장 또는 발달을 예방 또는 억제하거나 잡초를 죽이기에 충분한 양을 말한다. 유리하게는, 잡초 방제 유효량은 본 발명의 식물 종자, 식물 묘목 또는 식물의 성장 및/또는 발달에 유의한 영향을 미치지 않는다. 당업자는 일상적인 실험을 통해 이러한 잡초 방제 유효량을 결정할 수 있다.
본 명세서의 용어 "표적DNA"는 "표적부위" 또는 "표적서열"을 포함하는 DNA 폴리뉴클레오타이드를 지칭한다.
용어 "용해"는 DNA 분자의 공유 골격의 절단을 의미한다. 용해는 포스포디에스테르 결합의 효소적 또는 화학적 가수분해를 포함하나 이에 국한되지 않는 다양한 방법에 의해 개시될 수 있다. 단일 가닥 및 이중 가닥 용해가 모두 가능하며, 이중 가닥 용해는 두 가지 개별 단일 가닥 용해 이벤트로 인해 생성될 수 있다. DNA 용해로 인해 끝이 뭉툭하거나 엇갈릴 수 있다(blunt or staggered ends). 본 발명의 일 구현예에 따르면, DNA-표적화 RNA 및 부위-특이적 변형 폴리펩타이드를 포함하는 복합체가 표적화된 이중 가닥 DNA 용해를 위해 사용된다.
용어 "유전자"는 코딩 서열 전(5' 비-코딩 서열)후(3' 비-코딩 서열)의 조절 서열을 포함하는 기능적 분자 (예를 들어, 특정 단백질 그러나 이에 국한되지 않음)를 발현하는 핵산 단편을 포함한다.
특정 RNA를 "암호화"하는 DNA 서열은 RNA로 전사될 수 있는 DNA 핵산 서열이다. DNA 폴리뉴클레오타이드는 단백질로 번역될 수 있는 RNA(mRNA), 또는 단백질로 번역될 수 없는 RNA(예: tRNA, rRNA 또는 DNA-표적화 RNA; "비코딩" RNA 또는 " ncRNA"로 알려짐)를 인코딩할 수 있다.
용어 "폴리펩타이드", "펩타이드" 및 "단백질"은 본 발명에서 상호교환적으로 사용되며, 아미노산 잔기의 중합체를 지칭한다. 이 용어는 1개 이상의 아미노산 잔기가 상응하는 자연 발생 아미노산의 인공적 화학적 유사체인 아미노산 중합체 뿐만 아니라 자연 발생 아미노산 중합체에 적용된다. 용어 "폴리펩타이드", "펩타이드", "아미노산 서열" 및 "단백질"은 또한 글리코실화, 지질 결합, 황산화, 글루탐산 잔기의 γ-카르복실화, 히드록실화 및 ADP-리보실화를 포함하나 이에 국한되지 않는 변형 형태를 포함할 수 있다.
용어 "생물학적 활성 단편"은 단백질의 N 및/또는 C-말단에서 결실된 1개 이상의 아미노산 잔기를 갖는 단편을 말하지만 여전히 그의 기능적 활성을 유지한다.
본 명세서에 사용된 아미노산 치환과 관련된 용어 중 첫 번째 문자는 특정 서열의 특정 부위에서 자연적으로 발생하는 아미노산을 나타내고, 다음 숫자는 해당 서열 내의 부위를, 두번째 문자는 자연 발생 아미노산을 대체하기 위한 다른 아미노산을 나타낸다. 예를 들어, W574L은 574 부위의 트립토판이 류신으로 대체되었음을 의미한다. 이중 또는 다중 돌연변이의 경우 각 돌연변이는 "/"로 구분된다.
용어 "폴리뉴클레오타이드" 및 "핵산"은 상호교환적으로 사용되며 이중 가닥 또는 단일 가닥일 수 있는 DNA, RNA 또는 이들의 혼합물을 포함한다.
용어 "뉴클레오타이드 서열" 및 "핵산 서열"이라는 용어는 둘 다 DNA 또는 RNA의 염기 서열을 지칭한다.
본 발명에서 사용된 용어 "발현 카세트", "발현 벡터" 및 "발현 컨스트럭트(expression construct)"는 식물에서 관심 뉴클레오타이드 서열의 발현에 적합한 재조합 벡터와 같은 벡터를 지칭한다. 용어 "발현"은 기능적 산물의 생산을 지칭한다. 예를 들어, 뉴클레오타이드 서열의 발현은 뉴클레오타이드 서열의 전사(예: mRNA 또는 기능적 RNA를 생성하기 위한 전사) 및/또는 RNA의 전구체 또는 성숙한 단백질로의 번역을 지칭할 수 있다.
본 발명의 "발현 컨스트럭트(expression construct)"는 선형 핵산 단편, 원형 플라스미드, 바이러스 벡터 또는 일부 구현예에서 번역될 수 있는 RNA(예: mRNA)일 수 있다.
본 발명의 "발현 컨스트럭트"는 상이한 공급원으로부터의 관심 조절 서열 및 관심 뉴클레오타이드 서열, 또는 동일한 공급원으로부터의 관심 조절 서열 및 관심 뉴클레오타이드 서열을 포함할 수 있지만 자연에서 일반적으로 발생하는 것과 다른 방식으로 배열될 수 있다.
용어 "재조합 발현 벡터" 또는 "DNA 컨스트럭트"는 본 명세서에서 상호교환적으로 사용될 수 있으며 벡터 및 최소한 1개의 삽입을 포함하는 DNA 분자를 지칭한다. 재조합 발현 벡터는 일반적으로 삽입물의 발현 및/또는 증식을 위해 또는 다른 재조합 뉴클레오타이드 서열의 구축을 위해 생산된다. 삽입물은 작동가능하게 또는 작동불가능하게 프로모터 서열 및 DNA 조절 서열에 연결될 수 있다.
용어 "조절 서열" 및 "조절 요소"는 상호교환적으로 사용될 수 있으며 코딩 서열의 상류(5' 비코딩 서열), 중간 또는 하류(3' 비코딩 서열)에 위치한 뉴클레오타이드 서열을 지칭하며 관련 코딩 서열의 전사, RNA 처리, 안정성 또는 번역에 영향을 미친다. 식물 발현 조절 요소는 식물에서 관심 뉴클레오타이드 서열의 전사, RNA 프로세싱 또는 안정성 또는 번역을 제어할 수 있는 뉴클레오타이드 서열을 지칭한다.
조절 서열은 프로모터, 번역 리더 서열, 인트론, 및 폴리A 인식 서열을 포함할 수 있지만 이에 국한되지 않는다.
용어 "프로모터"는 다른 핵산 단편의 전사를 조절할 수 있는 핵산 단편을 의미한다. 본 발명의 일부 구현예에서, 프로모터는 식물 세포로부터 유래되었는지 여부에 관계없이 식물 세포의 유전자 전사를 제어할 수 있는 프로모터이다. 프로모터는 구성적 프로모터 또는 조직-특이적 프로모터 또는 발달적으로 조절되는 프로모터 또는 유도성 프로모터일 수 있다.
용어 "구성적 프로모터"는 대부분의 경우 대부분의 세포 유형에서 일반적으로 유전자 발현을 유발하는 프로모터를 지칭한다. "조직 특이적 프로모터" 및 "조직 선호 프로모터"는 상호교환적으로 사용되며, 주로 조직 또는 기관에서 발현되지만 반드시 그러한 것은 아니며 특정 세포 또는 세포 유형에서도 발현되는 프로모터를 의미한다. "발생적으로 조절되는 프로모터"는 그의 활성이 발생적 사건에 의해 결정되는 프로모터를 지칭한다. "유도성 프로모터"는 내인성 또는 외인성 자극(환경, 호르몬, 화학적 신호 등)에 반응하여 작동 가능하게 연결된 DNA 서열을 선택적으로 발현한다.
본 명세서의 용어 "작동가능하게 연결된"은 뉴클레오타이드 서열의 전사가 전사 조절 요소에 의해 제어, 조절되도록 조절 요소(예를 들어, 프로모터 서열, 전사 종결 서열 등, 그러나 이에 국한되지 않음)를 핵산 서열(예를 들어, 코딩 서열 또는 오픈 리딩 프레임)에 연결하는 것을 의미한다. 조절 요소 영역을 핵산 분자에 작동가능하게 연결하는 기술은 당업계에 잘 알려져 있다.
핵산 분자(예: 플라스미드, 선형 핵산 단편, RNA 등) 또는 단백질을 식물에 "도입"한다는 것은 핵산 또는 단백질로 식물 세포를 형질전환시켜 핵산 또는 단백질이 식물 세포에서 기능할 수 있게 하는 것이다. 본 발명에서, 용어 "형질전환"은 안정 형질전환 및 일시적 형질전환을 포함한다.
용어 "안정 형질전환(stable transformation)"은 외인성 뉴클레오타이드 서열을 식물 지놈에 도입함으로써 외인성 유전자의 안정적인 유전을 초래하는 것을 지칭한다. 일단 안정적으로 형질전환되면, 외인성 핵산 서열은 식물 또는 이의 연속적인 세대의 지놈에 안정적으로 통합된다.
용어 "일시적 형질전환(transient transformation)"은 기능을 수행하기 위해 핵산 분자 또는 단백질을 식물 세포에 도입하지만 외래 유전자의 안정적인 유전을 초래하지 않는 것을 의미한다. 일시적 형질전환에서 외인성 핵산 서열은 식물의 지놈에 통합되지 않는다.
달리 정의되지 않는 한, 여기에서 사용되는 모든 기술적, 과학적 용어는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본 명세서에 기재된 것과 유사하거나 등가인 임의의 방법 및 재료가 또한 본 발명의 실시 또는 시험에 사용될 수 있지만, 바람직한 방법 및 재료가 이제 설명된다.
이 설명에 인용된 모든 간행물 및 특허는 각각의 개별 간행물 또는 특허가 참고문헌에 포함되도록 정확하고 개별적으로 표시된 것처럼 본 명세서에 참고문헌으로 포함되며, 인용된 간행물과 관련된 방법 및/또는 자료를 개시하고 설명하기 위해 참고문헌으로 포함된다. 출원일 이전에 출판된 간행물의 인용은 본 발명이 기존 발명의 출판물보다 선행할 자격이 없다는 뜻으로 해석되어서는 안 된다. 또한 제공된 발행일은 실제 발행일과 다를 수 있으므로 별도의 검증이 필요할 수 있다.
구체적으로 언급되거나 암시되지 않는 한, 여기에서 사용된 용어 "a", "a/an" 및 "the"는 "최소한 1개"를 의미한다. 여기에 언급되거나 인용된 모든 특허, 특허 출원 및 간행물은 개별적으로 인용된 것과 동일한 수준으로 전체가 참고문헌으로 본 명세서에 포함된다.
[서열목록 설명]
본 발명과 관련된 주요 서열을 요약하면 다음과 같으며, 관련 서열은 서열 목록에 제시되어 있다.
Figure pct00001
도 1은 본 발명에 따른 유기체에서 새로운 돌연변이를 발생시키는 방법의 개략도를 나타낸다. 도면에서는 NGG를 PAM으로 사용하는 Cas9만 예시하였다; 같은 방식으로 상이한 PAM(예: NG)을 사용하는 Cas9 종류도 사용할 수 있다.
도 2는 Arabidopsis thaliana의 ALS 유전자 부위 W574 및 S653에서 gRNA 설계의 개략도를 나타낸다.
도 3은 두 개의 상이한 프로그래밍된 순차적 절단/편집 벡터로 형질전환된 Arabidopsis thaliana T2 세대 제초제 저항성을 가진 집단을 나타낸다. pQY743 및 pQY745는 벡터 숫자이다. 저항성 집단은 정상적으로 발근이 가능하였으나, 야생형 Col-0 및 비 저항성 집단은 그렇지 못하였다.
도 4는 이마자픽(imazapic)에 저항성을 지닌 Arabidopsis thaliana의 T2 세대 집단의 ALS 유전자의 시퀀싱 피크를 나타낸 도면으로서, 화살표로 표시된 T가 G로부터 돌연변이되어 W574L 돌연변이가 발생하였다.
도 5는 Arabidopsis thaliana의 ALS 유전자의 W574 부위에서 프로그래밍된 순차적 절단/편집 방식의 설계를 나타낸다. T-DNA 서열은 4개의 유전자, sgRNA1, sgRNA2, Cas9 및 HygR을 발현하였다. 이 중 sgRNA1 및 Cas9은 지놈에서 ALS의 W574 코돈을 절단하는 복합체를 형성하고, 자발적인 복구를 통해 -G 유전자형을 발생시킬 것으로 예상되었다. 이 새로운 서열은 sgRNA2와 Cas9에 의해 형성된 복합체에 의해 인식되고 절단될 수 있었고, 세포의 자발적인 복구를 통해 +T 유전자형을 발생시켜 W574L 돌연변이가 발생하였다.
도 6은 이마자픽으로 선별한 Arabidopsis thaliana 저항성 묘목과 ALS W574 부위의 시퀀싱 결과를 나타낸 것이다.
도 7은 Arabidopsis thaliana ALS 유전자의 S653 부위에서 프로그래밍된 순차적 절단/편집 방식의 설계를 나타낸다. T-DNA 서열은 4개의 유전자, sgRNA1, sgRNA2, Cas9 및 HygR을 발현했다. 이 중 sgRNA1 및 Cas9는 지놈에서 ALS의 S653 코돈을 절단하는 복합체를 형성했다. 세포 자연 복구 후 -G 유전자형이 발생되었다. 이 서열은 sgRNA2 및 Cas9에 의해 형성된 복합체에 의해 인식되고 절단될 수 있다. 세포의 자발적 복구 후 +A 유전자형이 발생되어 돌연변이 S653N이 발생되었다.
도 8은 이마자픽으로 선별한 Arabidopsis thaliana 저항성 묘목과 ALS S653 부위의 시퀀싱 결과를 나타낸다. 왼쪽 패널은 저항성 묘목의 선별 결과와 저항성 묘목 비율을 나타내고, 오른쪽 패널은 S653 부위의 염기서열 피크와 돌연변이 유형을 도식화한 것이다.
도 9는 Arabidopsis thaliana ALS 유전자의 W574 부위에서 프로그래밍된 순차적 절단/편집 방식의 설계를 나타낸다. T-DNA 서열은 4개의 유전자, sgRNA1, sgRNA2, Cas9 및 HygR을 발현하였다. 이 중 sgRNA1 및 Cas9는 지놈에서 ALS의 W574 코돈을 절단하는 복합체를 형성했다. 세포의 자발적 복구 후 +A 유전자형이 발생되었다. 이 서열은 sgRNA2 및 Cas9에 의해 형성된 복합체에 의해 인식되고 절단될 수 있다. 세포의 자발적 복구 후 -G 유전자형이 발생되어 돌연변이 W574M이 발생되었다. 두 절단은 서로 다른 PAM 부위를 사용했다.
도 10은 Oryza sativa ACCase2 유전자의 W2038 부위에서 프로그래밍된 순차적 절단/편집 방식의 설계를 나타낸다. 이 부위는 Alopecurus myosuroides의 ACCase2 유전자의 W2027 부위에 상응한다. T-DNA 서열은 4개의 유전자, sgRNA1, sgRNA2, Cas9 및 HygR을 발현하였다. 그 중 sgRNA1 및 Cas9는 지놈에서 ACCase의 W2038 코돈을 절단하는 복합체를 형성했다. -G 유전자형이 세포의 자발적 복구 후에 발생되었다. 이 서열은 sgRNA2 및 Cas9에 의해 형성된 복합체에 의해 인식되고 절단될 수 있다. 세포의 자발적 복구 후 +T 유전자형이 발생되어 돌연변이 W2038L이 발생되었다.
도 11은 하이그로마이신(50ug/L) 및 퀴잘로포프-p(50ug/L)로 공동으로 선별한 Oryza sativa의 저항성 캘러스와 W2038 부위의 시퀀싱 결과를 나타낸다.
도 12은 원핵생물 발현에 의해 생산 및 정제된 SpCas9 및 NGA-Cas9 단백질의 폴리아크릴아미드 겔 전기영동 도식이다. 화살표로 표시된 밴드는 Cas9 단백질 밴드이다.
도 13은 정제된 Cas9 단백질의 OsALS W548 표적부위와 OsACCase2 W2038 표적부위를 포함하는 DNA 절편에 대한 in vitro 절단 활성을 나타낸 것으로, 아가로스 겔 전기영동을 통해 검출했으며, Cas9 단백질 및 sgRNA 절편을 동시에 첨가해야 DNA 단편을 예상한 크기로 절단할 수 있음을 알 수 있다.
도 14는 RNP 형질전환된 Oryza sativa 원형질체의 OsALS W548 표적부위의 시퀀싱 피크의 도식을 나타내며, 이 부위는 Arabidopsis thaliana ALS W574 부위에 상응한다. 화살표로 표시된 위치에 원래의 G 염기 신호 피크 외에 돌연변이에 의해 얻은 T 염기 신호 피크가 있었고, 이는 W548L 돌연변이로 이어졌다.
도 15는 OsACCase2 W2038 부위에서 RNP에 의해 편집되고 50ug/L 퀴잘로포프-p로 선별된 Oryza sativa의 저항성 캘러스를 나타낸다. 화살표는 저항성 캘러스를 나타낸다.
도 16은 저항성 캘러스로부터 분화된 Oryza sativa 묘목의 OsACCase2 W2038 표적부위의 시퀀싱 피크의 도식을 나타낸다. 화살표로 표시된 T는 G에서 돌연변이되어 W2038L 돌연변이가 발생했다.
도 17은 T1 세대 OsACCase2 W2038L 편집된 묘목의 할록시포프-p에 대한 저항성 테스트를 나타낸다. 왼쪽으로부터 1번 묘목은 야생형 Huaidao 5호(벼 품종)의 수처리 대조군이며, 2 내지 4번 묘목은 야생형 화이다오 5호 및 2개의 RNP 유전자 총-형질전환 T1 세대 W2038L 편집된 집단 QY367-7-12 및 QY367-7-18이며, 모두 5g/mu 활성 성분(mu, 면적 단위, 1mu = 1/15헥타르)의 할록시포프-p 처리되었고, 편집된 집단은 할록시포프-p 저항성이 개발되었음이 분명하다.
도 18은 T1 세대 OsACCase2 W2038L 편집된 묘목의 퀴잘로포프-p에 대한 저항성 테스트를 나타낸다. 왼쪽으로부터 1번 묘목은 야생형 Huaidao 5호 수처리 대조군이며, 2 내지 4번 묘목은 야생형 Huaidao 5호 및 2개의 RNP 유전자 총-형질전환 T1 세대 W2038L 편집된 집단 QY367-5-10 및 QY367-5-21이며, 모두 5g/mu 활성 성분의 퀴잘로포프-p로 처리되었다. 편집된 집단은 퀴잘로포프-p 저항성이 개발되었음이 분명하다.
도 19는 OsACCase2 W2038 부위와 OsBADH2 유전자에서 동시에 RNP에 의해 편집되고 50ug/L퀴잘로포프-p로 선별된 Oryza sativa의 저항성 캘러스를 나타낸다. 화살표는 저항성 캘러스를 나타낸다.
도 20은 T0 세대 이중 부위 편집 묘목의 OsACCase2 W2038 표적부위의 시퀀싱 피크의 도식을 나타낸다. 화살표로 표시된 T는 G에서 돌연변이되어 W2038L 돌연변이가 발생했다.
도 21은 T0 세대 이중 부위 편집 묘목의 OsBADH2 표적부위의 시퀀싱 피크의 도식을 나타낸다. 화살표로 표시된 부위에서 +A 동형 접합 돌연변이가 발생했다.
도 22는 OsALS W548 부위와 OsSWEET14 유전자에서 동시에 RNP에 의해 편집되고 5mg/L 피록술람으로 선별된 Oryza sativa의 저항성 캘러스를 나타낸다. 화살표는 저항성 캘러스를 나타낸다.
도 23은 T0 세대 이중 부위 편집 묘목의 OsALS W548 표적부위의 시퀀싱 피크의 도식을 나타낸다. 화살표로 표시된 위치에 G 염기와 T 염기 신호 피크가 모두 존재하여 W548L 돌연변이가 발생했다.
도 24는 T0 세대 이중 부위 편집 묘목의 OsSWEET14 표적부위의 시퀀싱 피크의 도식을 나타낸다. 화살표로 표시된 부위에서 -C 동형 접합 돌연변이가 발생했다.
도 25는 니코설퓨론에 대한 T1 세대 OsALS W548 부위 및 OsSWEET14 이중 부위 편집 묘목의 저항성 테스트를 나타낸다. 왼쪽으로부터 1번 묘목은 야생형 Huaidao 5호의 수처리 대조군을 나타내고, 2 내지 3번 묘목은 야생형 Huaidao 5호와 RNP 유전자 총-형질전환 T1 세대 W548L 편집 집단 QY360-7-11이며, 둘 다 4g/mu 활성 성분의 니코설퓨론으로 처리되었다. 편집된 집단은 니코설퓨론 저항성이 개발되었음이 분명하다.
도 26은 플루카바존-소듐에 대한 T1 세대 OsALS W548 부위 및 OsSWEET14 이중 부위 편집 묘목의 저항성 테스트를 나타낸다. 왼쪽으로부터 1번 묘목은 야생형 Huaidao 5호의 수처리 대조군을 나타내고, 2 내지 3번 묘목은 야생형 Huaidao 5호와 RNP 유전자 총-형질전환 T1 세대 W548L 편집 집단 QY360-7-9이며, 둘 다 2g/mu 활성 성분의 플루카바존-소듐으로 처리되었다. 편집된 집단은 플루카바존-소듐 저항성이 개발되었음이 분명하다.
도 27은 이마자픽에 대한 T1 세대 OsALS W548 부위 및 OsSWEET14 이중 부위 편집 묘목의 저항성 테스트를 나타낸다. 왼쪽으로부터 1번 묘목은 야생형 Huaidao 5호의 수처리 대조군을 나타내고 2 내지 3번 묘목은 야생형 Huaidao 5호와 RNP 유전자 총-형질전환 T1 세대 W548L 편집 집단 QY360-7-11이며, 둘 다 7g/mu 활성 성분의 이마자픽으로 처리되었다. 편집된 집단은 이마자픽 저항성이 개발되었음이 분명하다.
도 28은 피록술람에 대한 T1 세대 OsALS W548 부위 및 OsSWEET14 이중 부위 편집 묘목의 저항성 테스트를 나타낸다. 왼쪽으로부터 1번 묘목은 야생형 Huaidao 5호 수처리 대조군을 나타내고, 2 내지 4번 묘목은 야생형 Huaidao 5호와 RNP 유전자 총-형질전환 T1 세대 W548L 편집 집단 QY360-7-2 및 QY360-7-11이며, 모두 2g/mu 활성 성분의 피록술람으로 처리되었다. 편집된 집단은 피록숨람 저항성이 개발되었음이 분명하다.
도 29는 293T 세포에서 HBB 유전자의 프로그래밍된 순차적 절단/편집 개략도를 나타낸다. A. 293T 세포에서 프로그래밍된 순차적 절단/편집을 위한 HBB 유전자 부위의 설계를 나타낸다; B. 편집 벡터 별 형질전환 48시간 후 293T 세포 HBB 유전자의 프로그래밍된 순차적 절단/편집의 전환 효율; C. 293T 세포 HBB 유전자의 프로그래밍된 순차적 절단/편집 및 HBB 유전자의 단일 부위 절단/편집에서 발생된 유전자 편집 유형의 비율; WT: 야생형, indel: 결실 또는 삽입을 위한 유전자형, C->T SNP: 절단 시 C에서 T 염기로 치환된 유전자형.
이하, 실시예를 통해 본 발명에 대해 더욱 상세히 설명하고자 한다. 아래의 실시례는 예시를 통해 발명을 설명하나, 본 발명의 보호범위가 이들 실시예에 한정되어서는 안 된다. 다음 실시예의 실험 방법은 달리 명시되지 않는 한 일반적으로 사용되는 분자 생물학, 조직 배양 기술 및 농업 경제학 매뉴얼에 설명된 방법이다. 예를 들어, 특정 단계는 "Molecular Cloning: A Laboratory Manual(3rd edition)"(Sambrook, J., Russell, David W., 2001, Cold Spring Harbor), "Plant Propagation by Tissue Culture"(Edwin)에서 찾을 수 있다. 다음 실시예에 사용된 재료, 시약, 기구 등은 달리 명시되지 않는 한 상업적 출처에서 얻을 수 있다.
실시예1: Arabidopsis thaliana 의 ALS 유전자의 W574 및 S653 부위에 대한 프로그래밍된 순차적 절단/편집에 의해 도입된 예측 가능한 염기 치환 설계
A. 실험재료
1. Arabidopsis thaliana 재료
야생형 Arabidopsis thaliana Col-0은 쌍떡잎식물의 표본품종으로, 원래 종자는 중국농업대학(China Agricultural University) 식물보호대학 잡초과에서 제공받았고, 번식 및 보존은 본 연구실에서 이 분야의 표준방법에 따라 수행되었다.
2. 벡터
벡터 플라스미드 pCBC-dT1T2 (Xing HL, Dong L, Wang ZP, Zhang HY, Han CY, Liu B, Wang XC, Chen QJ 2014. A CRISPR/Cas9 toolkit for multiplex genome editing in plants. BMC Plant Biol. Nov 29 ;14(1):327, 자세한 내용은 https://www.addgene.org/50590 참조), pHEE401E(Wang ZP, Xing HL, Dong L, Zhang HY, Han CY, Wang XC, Chen QJ Genome Biol. 2015.7.21, 16:144. doi: 10.1186/s13059-015-0715-0. https://www.addgene.org/71287 참조), pHEE401E-NG(NG PAM을 인식할 수 있는 벡터pHEE401E-NG를 구성하기 위해 Nishimasu et al. 2018 Engineered CRISPR-Cas9 nuclease with expanded Targeting space. Science 361(6408):1259-1262. doi: 10.1126/science.aas9129 에서 보고된 돌연변이가 pHEE401E에 도입되었다)를 Addgene 웹사이트에서 구입하였고, 기존의 분자 생물학 방법에 따라 당사 연구실에서 구축되고, 당사 연구실에서 보관하였다.
3. 주요 장비
피펫 건, 수조, PCR 기기(Bio-rad T100), 전기영동 기기(WIX-EP600), 겔 이미저(gel imager), 전기송풍건조기(electric blast dryer), 원심분리기(Eppendorf 5424R), 고처리량 조직 용해기, 쉐이커, 전자 저울, pH 측정기, 등.
4. 주요 시약
고정확도 DNA 폴리머레이즈 (Tsingke Bio에서 구입), 아가로스 겔 리커버리 키트 및 플라스미드 추출 키트 (Sparkjade에서 구입), BsaI 및 T4 DNA ligase (NEB에서 구입), Trans5α 컴피턴트 세포(competent cells) 및 EHA105 컴피턴트 세포 (TransGen Biotech에서 구입, Beijing, China), GV3101 Agrobacterium 컴피턴트 세포 (Shanghai AngyuBio에서 구입), Tris, EDTA, 카나마이신, 세팔로스포린, 하이그로마이신, 아가로스, 효모 분말, 트립톤, NaCl(Sangon Biotech에서 구입), MS 분말, 자당, Silwet-77, 하이그로마이신(Solarbio에서 구매), 핵산염료(Dured), 앱솔루트에탄올(sinopharm에서 구매), 등.
5. 주 용액의 준비
1) 종자살균제: 10% SDS 4mL, NaClO 20mL, 물을 넣어 200mL를 만든다.
2) SDS 추출 완충액: 1M Tris·HCl(pH 8.0) 40mL, 0.1M EDTA 50mL, 5M NaCl 10mL, 10% SDS 10mL에 물을 넣어 200mL를 만든다.
3) 감염액: 초순수 30mL에 자당 1.5g, Silwet-77 9μL를 가한다.
4) LB 고체 배지: 효모분말 5g, 트립톤 10g, NaCl 10g, 한천 15g에 물을 넣어 1L를 만들고, 121℃에서 15분간 멸균한 후 접시에 부어 사용한다.
5) 50Х TAE 스톡: 초순수 800mL에 Tris 242g, Na2EDTA·2H2O 37.2g를 첨가해 잘 저어 녹이고, 아세트산 57.1mL를 첨가하고, 잘 교반하고, 최종적으로 탈이온수로 1L까지 희석하고, 실온에서 보관한다.
6) MS 고체 배지: 초순수 800mL에 MS 분말 4.42g 및 자당 10g을 측량해 첨가하여 pH 5.8로 조정한 후, 물을 첨가하여 1L가 되도록 하고 피타겔(phytagel) 10g을 첨가하여 121℃에서 15분간 멸균하고, 추후 사용을 위해 접시에 부었다.
B. 실험방법
1. CRISPR/Cas9 이중 표적 벡터의 설계 및 제작
1.1 표적 설계
Arabidopsis thaliana ALS 유전자 서열은 서열번호 2로 나타내었다. 19개 염기의 표적서열 gRNA1(5'-GCATGGTTATGCAATGGGA-3')은 Arabidopsis thaliana ALS574 부위 부근의 AGA를 PAM으로 사용하여 설계되었으며, 편집 후에 PAM의 처음 3-4 부위 사이의 하나의 G염기가 결실되는 것이 예상되며, 제2 표적서열 gRNA2(5'-GGCATGGTTATGCAATGGA-3')가 염기의 결실로부터 형성된 서열을 기반으로 설계되었으며, 하나의 T 염기가 두번째 편집을 통해 삽입되어 도 2와 같이 TGG-TTG의 변환을 실현할 것으로 예상된다.
유사하게, 19개 염기의 표적서열 gRNA3(5'-TGCCGATGATCCCGAGTGG-3')은 Arabidopsis thaliana ALS653 부위 근처의 TGG를 PAM으로 사용하여 설계되었으며, 편집 후에 PAM의 처음 3-4 부위 사이의 하나의 G 염기가 결실되는 것이 예상되며, 제2 표적서열gRNA4(5'-TTGCCGATGATCCCGATGG-3')가 염기의 결실로부터 형성된 서열을 기반으로 설계되었으며, 두번째 편집 후에 하나의 A 염기가 삽입되어 도 2와 같이 AGT-AAT의 변환을 실현할 것으로 예상된다.
1.2 벡터 제작
Xing HL, Dong L, Wang ZP, Zhang HY, Han CY, Liu B, Wang XC, Chen QJ 2014. A CRISPR/Cas9 toolkit for multiplex genome editing in plants. BMC Plant Biol. Nov 29;14(1): 327에 설명된 방법이 수행되었다. 구체적으로, dT1T2 플라스미드를 주형으로 사용하여 각각 ALS574 및 653 부위 이중표적 단편을 증폭하여 sgRNA 발현 카세트를 제작하였다. pHEE401E 및 pHEE401E-NG의 벡터 백본(backbones)을 BsaI로 분해하고, 밴드를 겔에서 절단하여 회수하고, 표적단편을 분해한 후 라이게이션 반응에 직접 사용하였다. T4 DNA 리가아제를 사용하여 벡터 백본과 표적단편을 연결하고, 연결 산물을 Trans5α 컴피턴트 세포(competent cell)로 형질전환하고, 시퀀싱을 위해 상이한 모노클론을 선택했다. 시퀀싱을 통해 확인한 후 Sparkjade High Purity Plasmid Mini Extraction Kit를 사용하여 플라스미드를 추출하여 각각 pQY743 및 pQY745로 명명된 재조합 플라스미드를 얻었다.
2. 표적 검출용 프라이머 설계
표적 검출용 프라이머는 ALS574 및 ALS653 표적부위를 중심으로 하였고, 업스트림 검출용 프라이머는 ALS574 표적부위로부터 약 100bp, 다운스트림 검출용 프라이머는 ALS653 표적부위로부터 약 280 bp였다. 프라이머 서열은 다음과 같다: 574/653checking-F: 5'ATTGACGGAGATGGAAGCTT3', 및 574/653checking-R: 5'CCAAACTGAGCCAGTCACAA3'.
3. Arabidopsis thaliana 유전자 변형 시스템 구축
3.1 Agrobacterium 형질전환
제작된 재조합 플라스미드를 Agrobacterium GV3101 컴피턴트 세포(competent cells)로 형질전환시켜 재조합 Agrobacterium 세포를 얻었다.
3.2 Agrobacterium 감염액의 제조
1) 활성화된 Agrobacterium을 채취하여 YEP 액체 배지(25mg/L Rif 및 50mg/L Kan 함유) 30ml에 접종하고 OD600 값이 약 1.0-1.5가 될 때까지 200rpm 및 28℃에서 밤새 진탕 배양하였다.
2) 6000rpm에서 10분간 원심분리한 후 Agrobacterium을 채취하고 상층액은 버렸다.
3) 추후 사용을 위해 Agrobacterium을 OD600=0.8로 감염액(pH를 조정할 필요가 없음)에 재현탁했다.
3.3 Arabidopsis thaliana의 형질전환
1) 식물 형질전환 전 식물이 잘 자라는지, 꽃차례가 무성한지, 스트레스 반응이 없는지에 주목하였다. 제1 형질전환은 식물 높이가 약 20cm일 때 수행되었다. 흙이 말랐을 때 물을 적절히 주었다. 성장한 실리크(siliques)는 형질전환 전날 가위로 잘랐다.
2) 형질전환 될 식물의 꽃차례를 상기 용액에 담가 30초 내지 1분 동안 부드럽게 저어주었고, 침투된 식물에 액체막 층이 있어야 한다.
3) 형질전환이 완료된 식물체를 암실에서 24시간 배양한 후 꺼내어 생장을 위한 정상적인 광환경에 두어 배양시켰다.
4) 1주일 후 동일한 방법으로 제2 형질전환이 수행될 수 있었다.
3.4 종자 수확
씨앗이 성숙한 후, 수확되었다. 수확 후, 종자를 37°C의 오븐에서 약 1주일 동안 건조시켰다.
4. 형질전환 식물체의 선별
종자를 소독제로 5분간 처리한 후 탈이온수로 5회 세척하고 MS 선별 배지(30μg/mL 하이그로마이신, 100μg/mL 세팔로스포린 함유)에 도포하여 인큐베이터(온도 22℃, 점등 16시간, 소등 8시간, 조도 100-150μmol/m2/s, 습도 75%)에 배지를 두고, 1주일 후 양성 묘목을 선별하여 토양에 이식하였다.
5. T1 돌변변이 식물체의 검출
5.1 지놈 DNA의 추출
1) Arabidopsis thaliana 잎을 잘라 2mL 원심분리관에 넣은 뒤 강구(steel ball)를 넣어 고처리량 조직 용해기(high-throughput tissue lyser)로 분쇄하였다.
2) 분쇄가 완료된 후 SDS 추출 완충액 400μL를 첨가하여 뒤집어 혼합하고 65℃수조에서 15분간 배양하였고 5분마다 뒤집어 혼합하였다.
3) 13,000rpm에서 5분간 원심분리를 수행하였다.
4) 300μL의 상등액을 피펫팅하여 새로운 1.5mL 원심분리 튜브로 옮기고, -20°C로 미리 냉각된 동량의 이소프로판올을 원심분리관에 첨가하고, 원심분리기 튜브를 -20°C에 1시간 또는 하룻밤 두었다.
5) 13,000 rpm에서 10분간 원심분리하고 상층액을 버렸다.
6) 원심분리관에 70% 에탄올 500μL를 넣어 펠릿을 세척하고 원심분리 후 세척액을 버리고(펠릿을 버리지 않도록 주의) 상온에서 건조한 후 DNA용해를 위해 초순수 30μL를 첨가했으며, DNA는 -20°C에서 보관되었다.
5.2 PCR 증폭
추출된 T1 식물 지놈을 주형으로 사용하고, 검출 프라이머를 사용하여 표적단편을 증폭하고, 5μL의 증폭된 생성물을 피펫팅하여 1% 아가로스 겔 전기영동으로 검출하고, 겔 이미저로 이미지화하였다. 나머지 생산물은 시퀀싱 업체에 의뢰해 직접 시퀀싱을 진행했다.
6. T2돌연변이 식물의 검출
단일 식물에서 T1 집단의 종자를 수확한 후, 두 벡터의 상이한 집단의 종자를 선별하여 이마자픽(imazapic) 선별배지(MS 배지 + 0.24μg/mL imazapic)에 도포하여 선별하고 양성묘를 이식하였다. 1주일 후 토양에 이식하고 분자 검출을 하였으며, 방법은 5단계와 동일하였다.
사용된 프라이머 및 이의 서열:
Figure pct00002
C. 실험결과
1. T1 식물체의 유전자형 검출
T1 종자는 MS 하이그로마이신 배지에 의해 선별되었고, pQY743 벡터에 대해 총 32개의 양성 묘목을 얻었고, pQY745 벡터에 대해 총 18개의 양성 묘목을 얻었다. 각 벡터에 대해 10개의 묘목을 선별하고 이의 잎 지놈 DNA를 추출하여 표적부위를 검출하였다. ALS574 부위에서는 T1세대에서 편집 이벤트가 발생하지 않았으며, ALS653 부위에서는 설계 기대치를 충족시키는 편집 이벤트가 있는 것으로 확인됐다. 검출 결과는 표 1에 나타내었다.
T1 식물체의 돌연변이 유형
ALS 부위 벡터 번호 T1 식물 번호 편집 유형
574 pQY743 1-10 WT
653 pQY745 3,4-8,10 Chimera
1,2,9 Heterozygote
2. T2 세대 종자의 선별 결과
단일 식물의T2 세대 종자를 수확한 후 이마자픽 저항성 배지에 도포하여 선별을 수행한 결과, 야생형 Col-0은 저항성 배지에서 성장하지 못하는 반면, 도 3과 같이 돌연변이체 양성 식물은 정상적으로 성장함을 알 수 있었다.
각 벡터에 대해, 10개의 묘목을 선별하고 분자 검출을 위해 잎에서 지놈 DNA를 추출하였다. pQY743 벡터의 경우, 예상한대로 도 4와 같이 TGG에서 TTG로 변이된 돌연변이를 가진 6개의 집단이 있음을 확인했다. 또한, 이형 돌연변이가 있는 집단이 1개 있었고, 키메라 돌연변이가 있는 3개의 집단이 있었다. 검출 결과는 표 2에 나타내었다.
T2 식물체의 돌연변이 유형
ALS 부위 벡터 번호 T2 식물 번호 편집 유형
574 pQY743 2,3,5,6,7,9 Homozygote
4 Heterozygote
1,8,10 Chimera
상기 결과는 본 발명의 프로그래밍된 순차적 절단/편집 기술을 사용함으로써 표적부위에서 예상되는 돌연변이의 설계 및 실현이 가능하며, 순차적인 sgRNA와 Cas9단백질만의 조합만으로 염기 치환 돌연변이가 실현될 수 있음을 보여준다.
실시예 2: Arabidopsis thaliana ALS 유전자의 W574 및 S653 부위에서 프로그래밍된 순차적 절단/편집을 통해 다중 돌연변이 유형의 달성
벡터 설계, 제작, Arabidopsis thaliana 형질전환 및 선별을 위한 조작 단계는 실시예 1을 참조하여 수행하였다. AtALS W574 부위에서, 벡터의 설계는 실시예 1과 동일하였다. 벡터의 개략도는 도 5에 나타나 있으며, W574L 돌연변이는 특정 부위에서 먼저 -G, 그 다음 +T에 의해 실현될 것으로 예상되었다. 벡터 형질전환된 Arabidopsis thaliana의 T1 세대에서는 편집 이벤트가 검출되지 않았다. 0.24 mg/L 이마자픽으로 형질전환된 Arabidopsis thaliana의 T2 세대를 선별하였고, 도 6의 좌측 패널에 나타낸 바와 같이 다수의 제초제 저항성 식물이 획득되었고, 이들 저항성 식물의 분자 검출을 수행하였으며, PCR 생산물 시퀀싱 결과, 도 6의 우측 패널에 나타낸 바와 같이 W574 부위에 예상되는 W574L 돌연변이뿐만 아니라 또 다른 저항성 돌연변이 W574M도 나타났다.
AtALS S653 부위에서, 벡터의 설계는 실시예 1과 동일하였다. 벡터의 도면은 도 7에 나타내었고, S653N 돌연변이는 특정 부위에서 먼저 -G, 그 다음 +A에 의해 실현될 것으로 예상되었다. 벡터 형질전환된 Arabidopsis thaliana의 T1 세대에서 예상된 S653N 돌연변이의 편집 이벤트가 검출되었다. 0.24 mg/L 이마자픽으로 형질전환된 Arabidopsis thaliana의 T2 세대를 연속적으로 선별하였고, 도 8의 좌측 패널과 같이 다수의 제초제 저항성 식물이 획득되었고, 이들 저항성 식물의 분자 검출을 수행하였으며, PCR 생산물 시퀀싱 결과, 도 8의 우측 패널에 나타낸 바와 같이 S653 부위에서 예상되는 S653N 돌연변이뿐만 아니라 두 개의 다른 저항성 돌연변이 S653R과 S653R/G654D도 나타났다.
상기 결과는 본 발명의 프로그래밍된 순차적 절단/편집의 기술을 사용하여 표적부위에 대해 설계된 예상 돌연변이 외에, 순차적인 sgRNA와 상응하는 Cas9단백질만의 조합만을 설계함으로써 다수의 기능적인 돌연변이 유형들을 발생시킬 수 있으며, 이는 새로운 기능적인 돌연변이를 만드는 데 적합한 도구라는 것을 보여준다.
실시예 3: Arabidopsis thaliana ALS 유전자의 W574 부위 근처에서 프로그래밍된 순차적인 절단/편집을 위해 상이한 PAMs를 사용한 W574M 저항성 돌연변이의 발생
벡터 설계, 제작 및 Arabidopsis thaliana 형질전환 및 선별은 실시예 1을 참조하여 수행되었으나, AtALS W574 부위 근처의 서열 5'CTTGGCATGGTTATGCAATG gg 3'에 대해 W574 부위에 가까운 GG가 sgRNA1: 5'CTTGGCATGGTTATGCAATG3'을 설계하기 위한 PAM으로 먼저 사용되었다, 여기서 W574 부위는 밑줄이 그어져 있고 NG PAM은 이탤릭체로 표시되었다. 절단 및 복구 후 +A에 의해 새로운 서열 5'CTTGGCATGGTTATGCAAATGGGAag3'이 형성될 것으로 예측되었다. AG는 sgRNA2: 5'CTTGGCATGGTTATGCAAATGGGA3'를 설계하기 위한 새로운 PAM 부위로 사용되었고, 세포의 자발적인 복구 후에 -G 유전자형이 발생되어 W574M이 발생되었다. 즉, 이 계획에서 두 절단에 대해 서로 다른 PAM 부위가 사용되었다. 벡터 도면은 도 9에 나타내었다. 벡터는 Arabidopsis thaliana를 형질전환하는 데 사용되었으며, T1 세대 형질전환 집단은 유전자형 검출을 거쳐, W574M의 예상되는 편집 이벤트가 검출되었고, 식물체는 이마자픽(imazapic) 처리에 저항성을 보였다.
실험결과는 본 발명의 기술 및 상이한 PAM을 사용한 프로그래밍된 순차적 절단/편집을 사용함으로써 더 넓은 서열 범위에서 편집이 수행되어 아미노산 치환을 얻을 수 있음을 보여준다.
실시예 4: Oryza sativa ALS 유전자의 D350 및 W548에 대한 예측 가능한 염기 치환 설계
NG PAM을 인식할 수 있는 벡터pHEE401E-NG를 구성하기 위해 Nishimasu et al. 2018 Engineered CRISPR-Cas9 nuclease with expanded Targeting space. Science 361(6408):1259-1262. doi: 10.1126/science.aas9129 에서 보고된 돌연변이가 pHEE401E에 도입되었다((A CRISPR/Cas9 toolkit for multiplex genome editing in plants. Xing HL, Dong L, Wang ZP, Zhang HY, Han CY, Liu B, Wang XC, Chen QJ. BMC Plant Biol. 2014 Nov 29;14(1):327. 10.1186/s12870-014-0327-y, 자세한 내용은 https://www.addgene.org/71287/ 참조).
Oryza sativa의 ALS 유전자 서열은 서열번호 12번에 나타내었다. Xing HL, Dong L, Wang ZP, Zhang HY, Han CY, Liu B, Wang XC, Chen QJ. BMC Plant Biol. 2014에 설명된 방법에 따라, 5'GGCGTGCGGTTTGATGATCG3' (밑줄은 Arabidopsis thaliana ALS-D376에 상응하는 OsALS-D350 부위) 및 편집에서 형성될 것으로 예상되는 새로운 서열 5'GGCGTGCGGTTTGATGACG3'을 표적으로 사용해 이중표적 벡터를 제작하였으며, OsALS D350E 돌연변이를 일으키는 TGG-TTG 변환을 얻을 것으로 예상되었다.
5'GGTATGGTTGTGCAATGGGA3' (밑줄은 Arabidopsis thaliana ALS-W574에 상응하는 OsALS-W548 부위) 및 편집에서 형성될 것으로 예상되는 5'GGTATGGTTGTGCAATGGA 3'을 표적으로 사용해 이중표적 벡터를 제작하였으며, OsALS W548L 돌연변이를 일으키는 TGG-TTG 변환을 얻을 것으로 예상되었다.
그런 다음 형질전환 식물체를 얻기 위해 두 벡터를 Oryza sativa로 옮겨, 확인 결과 예상했던 전환인 D350E 및 W548L이 있는 식물체를 얻었다. 현장에서 제초제 저항성 바이오테스트 결과 D350E 및 W548L 돌연변이체가 ALS 억제제 제초제에 대한 저항성을 획득한 것으로 나타났다.
실시예 5: Oryza sativa ACCase2 유전자의 W2038 부위에 대한 예측 가능한 염기 치환 설계 및 다중 돌연변이 유형의 선별
Oryza sativa ACCase2 유전자 서열은 서열번호 14번에 나타내었으며, 여기서 OsACCase2 W2038 부위는 Alopecurus myosuroides의 ACCase W2027 부위에 상응된다. sgRNA1: 5'TTCATCCTCGCTAAC-TGAG3'를 설계하기 위해 이 부위에 가까운 AGG가 PAM으로 사용되었고, 절단 및 복구 이후 -G에 의해 새로운 서열이 형성될 것으로 예측되었다. sgRNA2: 5'CTTC-ATCCTCGCTAACTGAG3'를 설계하기 위해 AGG를 PAM으로 계속 사용하였으며, 절단 및 복구를 다시 거쳐 +T 유전자형이 발생되었으며, W2038L 돌연변이가 발생되었다. pHUE411 벡터에 sgRNA1 및 sgRNA2를 구성하여 편집벡터를 제작하였으며, 벡터 도해는 도 10에 나타내었다.
편집 벡터를 사용하여 Huaidao 5호(벼 품종)의 캘러스를 형질전환시켰고, 50㎍/L 하이그로마이신과 50㎍/L퀴잘로포프-p로 함께 선별을 한 3주 후, 많은 수의 저항성을 가진 캘러스를 얻었으며, 도 11의 좌측 패널에 나타내었다. 유전자형 식별을 위해 저항성 캘러스를 채취하였고, 도 11의 우측 패널과 같이 예상되는 W2038L 돌연변이뿐만 아니라 W2038C 돌연변이도 발생함을 확인하였다.
상기 Oryza sativa 유전자의 프로그래밍된 순차적 절단/편집 결과는 본 발명의 기술이 단자엽 및 쌍자엽 식물 모두에 적용가능함을 보여주었다.
실시예 6: SpCas9 및 NGA-Cas9 단백질의 발현 및 정제
1. 실험 기구 및 시약
실험 시약
시약 준비 및 사용
Q5 DNA 폴리머레이즈 NEB에서 구매
I5 DNA 폴리머레이즈 및 I5 반응용액 Tsingke Bio에서 구매
dNTPs Shanghai Sangon
Ni-NTA 레진 Shanghai Sangon
Tris/NaCl/imidazole Shanghai Sangong
DTT Shanghai Sangong
β-mercaptoethanol Sigma
SDS-PAGE 프리캐스트 겔 Nanjing GenScript
Superdex200 컬럼 GE Healthcare
실험 기구
실험기구 모델
PCR 기구 Bio-rad T100
항온 진탕 장치 Ounuo HNY-200B
세포 파쇄기(Cell disrupter) Ningbo Xinzhi JY92-IIN
전기영동장치 WIX-EP600
단백질 정제기 GE AKTA pure
고속 대용량 냉동원심분리기 Xiangzhi ZX21K
고속 원심분리기 Eppendorf 5424R
백색광 필름 뷰어(White light film viewer) Beijing Liuyi WD-9406
핵산 겔 이미저(Nucleic acid gel imager) Beijing Sage ChampGelTM 5000
미세 분광 광도계(Micro spectrophotometer) DS-II
2. 실험 방법
2.1 pET15b-Cas9 발현 벡터의 제작
식물 코돈의 최적화 후 얻은 SpCas9 및 NGA-Cas9 단백질의 DNA 서열은 각각 서열번호 15 및 서열번호 16에 나타내었으며, 각각의 서열은 GenScript를 통해 주형 DNA로 합성되었다
NG-Cas9및 NGA-Cas9 서열을 따로 증폭시킨 후, 두 개의 단편을 pET15b 발현벡터에 주입법(infusion)으로 연결하고, DH5a로 형질전환하여, 검증을 거친 후 서열분석을 하였다.
PCR 검증 증폭 시스템 및 프라이머
반응계, 50 ul
2Х I5 반응 용액 25 ul
주형 DNA 1 ul
포워드 및 리버스 프라이머 각각 2 ul
초순수 50 ul까지 첨가
프라이머 서열: 5'-3'
pET15b-NG Cas9 -F Gtgccgcgcggcagccatatggattacaaggaccacgacg
pET15b-NG Cas9-R Tttgttagcagccggatcctcacttcttcttcttcgcctgc
pET15b-NGA Cas9 -F Tgccgcgcggcagccatatgatggattacaaggaccacgacg
pET15b-NG Cas9 -R Tttgttagcagccggatcctcacttcttcttcttggcctgtccc
2.2 단백질의 발현 및 정제
제조된 발현 벡터를 Escherichia coli Rosetta(DE3)에 형질전환시키고, IPTG로 발현을 유도하고, Ni-NTA 컬럼을 이용하여 박테리아를 채취, 용해 및 정제하였다. 구체적인 방법은 다음과 같았다:
a) 재조합 발현 벡터를 Rosetta(DE3) 집단으로 형질전환하고, 10 ml의 LB 배지에서 CmR+Amp(pET15b) 또는 CmR+Kana(pET28a) 저항성을 가진 단일 콜로니를 선별하여, 37℃에서 200 rpm으로 밤새 배양하고, 1L의 LB 배지를 포함하는 2L 진탕 플라스크로 옮기고, OD600이 0.6-0.8에 도달할 때까지 37°C 및 200rpm에서 배양하고, 18°C로 냉각하고, 0.5mM IPTG로 밤새 발현을 유도하고, 박테리아는 4000g에서 원심분리에 의해 채취되었다.
b) 채취한 박테리아를 Ni-완충액 A에서 재현탁시켰다: 50mM HEPES, pH7.4, 500mM NaCl, 20mM 이미다졸, 5mM β-메르캅토에탄올에 PMSF, 최종 농도 1mM 및 250 ul 혼합 억제제 250ul를 추가, 그리고 잘 섞어주었다.
c) 재현탁된 세포를 초음파 파쇄기로 파쇄한 후 4°C에서 40000g으로 30분간 원심분리하고 상층액을 모아 Ni-NTA 컬럼에 통과시켰다.
d) Ni-NTA 컬럼을 통한 정제: 용해물 상층액을 레진과 20분간 결합시키고, 50mM 이미다졸이 포함된 완충액 A로 용출하여 불순물을 제거하고, 최종적으로 400mM 이미다졸을 포함하는 용출 완충액으로 용출하였다.
e) SDS-PAGE 겔 전기영동 시스템을 사용하여 단백질의 정제 효과를 검출하였다.
f) 완충액을 50mM HEPES pH 7.5, 150mM KCl, 1mM DTT, 3% 글리세롤로 변경하여 투석을 수행했다.
h) 최종 시료를 SDS-PAGE 겔 전기영동하여 단백질의 정제 효과를 검출하였다. 한외여과에 의한 농축 후, 단백질은 추후 사용을 위해 -80°C에서 동결되었다.
2.3 Cas9 융합 단백질의 발현 및 정제 결과
SpCas9 및 NGA-Cas9 단백질의 정제 결과를 도 12에 나타내었다. 화살표는 Cas9 단백질 밴드를 나타내며, 이는 더 높은 순도로 정제되었음을 나타낸다.
실시예 7: OsACCase2 W2038 및 OsALS W548 표적부위에 각각 검출된 SpCas9 및 NGA Cas9 단백질의 In vitro 효소 절단 활성
1. OsALS 및 OsACCase2 유전자의 DNA 서열은 CRISPOR 온라인 툴(http://crispor.tefor.net/)에 입력되었으며, 다음의 sgRNA는 Arabidopsis thaliana ALS 단백질의 574번 아미노산 부위와 상응되는 OsALS의 W548 (OsALS의 548번째 아미노산, Oryza sativa ALS 단백질의 아미노산 서열은 서열번호 11에 나타내었다) 및 Alopecurus myosuroides의 아미노산 부위 2027에 상응하는 OsACCase2의 W2038 (OsACCase2의 2038번째 아미노산, Oryza sativa ACCase2 단백질의 아미노산 서열은 서열번호 13에 나타내었다) 를 위해 설계되었으며, 이러한 sgRNA는 GenScript에 의해 합성되었다 .
>sgRNA1-548-G:
5'GGGUAUGGUUGUGCAAUGGGAguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc3'
> sgRNA1-2038-G:
5'GUUCAUCCUCGCUAACUGGAGguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc3'
2. 특정 검출 프라이머 OsALS265AA-F: 5'ggtcttgcgtctggttggc3' 및 OsALS-end-R: 5'ccatgccaagcacatcaaacaag3'는 OsALS W548 표적부위를 포함하는 단편을 증폭하는 데 사용되었으며 PCR 산물의 길이는 1200 bp였다.
특정 검출 프라이머 OsACC1750AA-F: 5'gcgaagaagactatgctcgtattgg3' 및 OsACC2196AA-R: 5'cttaatcacacctttcgcagcc3'은 OsACCase W2038 표적부위를 포함하는 단편을 증폭하는데 사용되었으며 PCR 산물은 1500bp 길이였다.
PCR 시스템은 아래에 나타내었다:
Figure pct00003
3. PCR 반응이 확립되었고, 반응 조건은 아래에 나타내었다:
Figure pct00004
4. PCR 산물은 아가로스 겔 전기영동으로 검출되었고 추가 검증을 위해 시퀀싱을 거쳤다. 정확하게 검증된 후 젤을 절단하여 DNA 단편을 회수했다. 회수된 DNA 단편을 RNase가 없는 초순수 30ul를 첨가하여 용해시키고 농도를 측정하였다.
5. Cas9 단백질 활성을 검출하기 위해 아래와 같은 검출 시스템을 사용하였으며, 시스템이 준비된 후 37°C에서 1시간 동안 배양하였다.
Figure pct00005
6. 반응이 완료된 후, 시스템을 65℃에서 10분 동안 처리하고, 4 ul의 6x DNA 로딩 완충액을 첨가하고, 밴드 크기를 검출하기 위해 2% 아가로스 겔 상에서 작동시켰다.
그 결과를 도 13에 나타내었고, 정제된 Cas9 단백질은 sgRNA의 존재 하에서만 설계된 표적부위에서 DNA 이중 가닥을 절단할 수 있음을 알 수 있다.
실시예 8: 2개의 다른 표적 RNP 복합체로 Oryza sativa 원형질체를 형질전환하여 OsALS548 부위에서 W548L 돌연변이 발생
1. Oryza sativa 원형질체의 준비 및 PEG-매개 형질전환은 발간된 방법(Bart et al., 2006)을 부분적으로 변형한 것을 기반으로 수행되었으며, 구체적인 준비 단계는 다음과 같다:
(1) 원형질체를 위해 Oryza sativa 묘목을 먼저 준비하였다. 쌀의 품종은 Nipponbare였다. 먼저 벼 종자를 껍질을 벗기고, 껍질을 벗긴 종자를 75% 에탄올로 1분간 헹구고, 5%(v/v) 차아염소산나트륨으로 20분간 처리한 후, 멸균수로 5회 이상 세척하고, 매우 청결한 테이블에 놓고 블로우-드라이를 한 다음, 1/2 MS 배지가 들어 있는 조직 배양 플라스크에 각 20개의 종자를 넣었다. 원형질체는 종자를 약 10일 동안 26°C 및 12시간의 광환경에서 배양하여 준비했다.
(2) 묘목의 잎 덮개를 선별하고, 날카로운 질레트 면도날로 약 1mm 조각으로 자르고, 추후 사용을 위해 0.6M 만니톨 및 MES 배양 배지(제형: 0.6M 만니톨, 0.4M MES, pH 5.7)에 넣었다. 모든 물질을 절단한 후, 효소용액 20mL(제제: 1.5% 셀룰라아제 R10/RS(YaKult Honsha), 0.5% Mecerozyme R10(YaKult Honsha), 0.5M 만니톨, 20mM KCl, 25mM MES, pH .7, 10mM CaCl2, 0.1% BSA, 5mM β-mercaptoethanol)로 옮겨졌고, 알루미늄 호일로 싸서 28℃에서 진탕기에 넣었다. 암실에서 약 4시간 동안 50rpm으로 효소분해를 수행하고, 마지막 2분 동안 속도를 100rpm으로 증가시켰다.
(3) 효소분해 후, 동일한 부피의 W5 용액(제형: 154mM NaCl, 125mM CaCl2, 5mM KCl, 15mM MES)을 첨가하고, 10초 동안 수평으로 흔들어 원형질체를 방출시켰다. 효소 분해 처리한 세포를 300-mesh 체를 통해 여과하고 150g에서 5분 동안 원심분리하여 원형질체를 채취하였다;
(4) 세포를 W5 용액으로 두 번 헹구고 150g에서 5분 동안 원심분리하여 원형질체를 채취하였다.
(5) 원형질체를 적절한 양의 MMG 용액(제형: 3.05g/L MgCl2, 1g/L MES, 91.2g/L 만니톨)으로 재현탁시켰고, 원형질체 농도는 약 2 x 106 cells/mL이었다.
2. RNP 복합체의 준비:
OsALS548 표적 부위 서열 GGGTATGGTTGTGCAATGGGAgga (OsALS W548 부위는 밑줄, Arabidopsis thaliana ALS W574에 상응하며 Cas9 단백질에 의해 인식되는 PAM 부위는 이탤릭체 소문자로 표시)에 따라, 정제된 NGA-Cas9 단백질을 선별하여 RNP를 제조하였다. >CrRNA1-548-G: 5'-GGGUAUGGUUGUGCAAUGGGAguuuuagagcuaugcu-3'를 설계하기 위해 GGA가 PAM으로 사용되었으며, 편집 후 PAM의 처음 3-4개 위치 사이에서 하나의 G 염기가 결실될 것으로 예측되었으며, 위 염기의 결실로 얻은 서열이 두번째 >CrRNA2-548+T: 5'-UGGGUAUGGUUGUGCAAUGGAguuuuagagcuaugcu-3'를 설계하기 위해 사용되었으며, TGG-TTG 변환을 얻기 위해 두번째 편집 후에 하나의 T 염기가 삽입될 것으로 예측되었다.
>CrRNA1-548-G 및 >CrRNA1-548+T는 GenScript Biotechnology Company에서 합성되었으며 sgRNA도 합성되었다:
>sgRNA1-548-G:
5'GGGUAUGGUUGUGCAAUGGGAguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc3'
>sgRNA2-548+T:
5'UGGGUAUGGUUGUGCAAUGGAguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc3'.
합성된 crRNA와 GenCRISPR tracrRNA(GenScript SC1933)를 등몰로 혼합하고, crRNA&tracrRNA 어닐링 완충액(GenScript SC1957-B)을 첨가하고 어닐링하여 지침에 따라 gRNA를 제조하였다. tracrRNA 서열은 5'-agcauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuu-3'이었다.
RNP 반응 시스템은 아래에 따라 준비되었으며, 반응 시스템이 준비된 후 25℃에서 10분간 배양하였다.
Figure pct00006
3. 원형질체 형질전환
(1) 위에서 제조한 MMG 재현탁된 원형질체 200㎕를 취하여 배양으로 생성된 RNP 복합체(Cas9 단백질 20㎍, sgRNA 20㎍)를 첨가하고, 부드럽게 휘저어 잘 혼합하였다.
(2) 동일한 부피의 40%(w/v) PEG 용액(제형: 40%(w/v) PEG, 0.5M 만니톨, 100mM CaCl2)을 첨가하고 부드럽게 흔들어 잘 섞이도록 하고 15분간 28°C암실에 두었다;
(3) 유도 및 형질전환 후, W5 용액 1.5mL를 천천히 첨가하고, 세포가 잘 혼합되도록 부드럽게 흔들어준 뒤, 150g에서 3분 동안 원심분리하여 세포를 수집하였다. 이 단계는 한 번 반복되었다;
(4) 1.5mL의 W5 용액을 첨가하여 세포를 재현탁시키고, 28℃배양기에 넣고 12-16시간 동안 암실에서 배양하였다. 원형질체 지놈 DNA를 추출하는 경우 세포를 48~60시간 동안 배양해야한다.
4. 지놈 표적 편집 이벤트의 검출
(1) 부분적으로 변형된 CTAB 방법을 사용하여 원형질체 DNA를 추출하였으며, 방법은 구체적으로 다음과 같다: 원형질체를 원심분리하고 상층액을 버리고, 500 μL의 DNA 추출 용액을 첨가하고, 진탕 및 잘 혼합하고, 65°C 수조에서 1시간 동안 배양하였다; 샘플을 수조에서 배양한 후 냉각하고 동일한 부피의 클로로포름을 첨가하고, 잘 혼합되도록 여러 번 뒤집어 10분 동안 10,000 rpm에서 원심분리했다. 400μl의 상층액을 취하여 새로운 1.5mL 원심분리관에 옮기고 70%(v/v) 에탄올 1mL를 첨가하고 -20°C에서 20분 동안 침전되도록 두었다; 12,000 rpm에서 15분간 원심분리하여 DNA를 침전시키고, 침전물을 공기 중에서 건조시킨 다음 초순수 50 ㎕를 첨가하여 용해시키고, 추후 사용을 위해 -20℃에서 보관하였다.
(2) 유전자-특이적 프라이머를 사용하여 W548 표적부위를 포함하는 단편을 증폭시키고, 표적부위에 대해 다음 검출 프라이머를 설계하였다:
OsALS500AA-F: 5'GGCTAACCCAGGTGTCACAG3',
OsALS-3'UTR-R: 5'CCATGCCAAGCACATCAAACAAG3'
PCR 반응 시스템은 아래에 나타내었다:
Figure pct00007
(3) PCR 반응이 확립되었고, 일반적인 반응 조건은 아래에 나타내었다:
Figure pct00008
(4) 검출은 아가로스 겔 전기영동으로 수행하였고, PCR 단편을 회수하고 시퀀싱하였다.
5. 실험결과:
어닐링에 의한 합성 crRNA 및 tracrRNA로 제조된 gRNA를 사용하거나 합성 sgRNA를 직접 사용함으로써, 활성 RNP 복합체가 정제된 NGA-Cas9 단백질로 형성될 수 있었다. OsALS548 표적부위를 시퀀싱함으로써, TGG에서 TTG로의 돌연변이를 검출할 수 있었고, 이는 crRNA 또는 sgRNA의 순차적인 조합으로 형성된 RNP복합체의 프로그래밍된 순차적인 절단/편집으로 세포 내 표적부위의 부위 특이적 돌연변이가 발생될 수 있음을 입증한다. 도14에 도시된 바와 같이, 원형질체 OsALS548 표적 시퀀싱 피크의 화살표 지점에는 원래의 G 염기 신호 피크 외에 돌연변이로부터 생성된 T 염기 신호 피크도 있었고, 이는 OsALS548 부위에서 W548L 돌연변이를 초래하였다.
실시예 9: Oryza sativa 캘러스에 2개의 상이한 RNP 복합체를 충돌시켜 OsACCase2 W2038 부위에서 W2038L 돌연변이 발생
1. RNP 복합체의 준비:
OsACCase2 W2038 표적부위서열 GTTCATCCTCGCTAACTGGAGagg에 따라, 이 때 Alopecurus myosuroides ACCase W2027에 상응하는 OsACCase2 W2038 부위에 밑줄로 표시하였으며 Cas9 단백질이 인식하는 PAM 부위를 이탤릭체 소문자로 나타내었고, 정제된 SpCas9 단백질을 선별하여 RNP 복합체를 준비했다. >CrRNA1-2038-G: 5'-GUUCAUCCUCGCUAACUGGAGguuuuagagcuaugcu-3'을 설계하기 위해 GGA가 PAM으로 사용되었으며, 편집 후 PAM의 처음 3-4개 위치 사이에서 하나의 G 염기가 결실될 것으로 예측되었으며, 염기의 결실로 인해 형성된 서열을 사용하여 두번째 >CrRNA2-2038+T: 5'-UGUUCAUCCUCCGCUAACUGAGguuuuagagcuaugcu-3'을 설계했으며, 두번째 편집 후에 하나의 T 염기가 삽입될 것으로 예측되어, TGG-TTG의 전환이 획득되었다.
>CrRNA1-2038-G 및 >CrRNA2-2038+T GenScript Biotechnology Company에서 합성되었으며, sgRNA도 합성되었다:
>sgRNA1-2038-G:
5'GUUCAUCCUCGCUAACUGGAGguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc 3'
>sgRNA2-2038+T:
5'UGUUCAUCCUCGCUAACUGAGguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc 3'.
합성된 crRNA와 GenCRISPR tracrRNA(GenScript SC1933)를 등몰로 혼합하고, crRNA&tracrRNA 어닐링 완충액(GenScript SC1957-B)를 첨가하고 어닐링하여 지침에 따라 gRNA를 준비하였다.
RNP 복합체는 실시예 8과 동일한 반응 시스템에서 배양하여 제조되었다. 형질전환을 위한 10개의 유전자 총 충격량을 예로 들면: 20㎍의 Cas9 단백질, 20㎍의 gRNA 또는 sgRNA, 10㎕의 10x Cas9 반응 완충액, RNase 가 없는 초순수로 만든 완충액 총 100μl를 25°C에서 10분 동안 배양하고 부드럽게 혼합했다.
2. Oryza sativa 캘러스 유도
성숙하고 통통한 Oryza sativa 종자를 선별하고, 껍질을 벗기고, 다음 단계에 따라 살균하였다:
(1) 벼(Oryza sativa) 종자를 껍질을 벗기고, 벼 품종은 종자 시장에서 구입한 Huaidao 5호 였다.
(2) 세척된 물이 투명해질 때까지 종자를 멸균수로 무제한 세척하였다.
(3) 70% 알코올로 1분간 살균한 후, 종자를 10% 차아염소산나트륨에 넣고 수평진탕기에서 25분간 진탕 배양하였다.
(4) 차아염소산나트륨 살균 후 종자를 멸균수로 5회 세척하였다. 종자를 캘러스 유도 배지(제형: MS 분말(4.42g/L) + 2,4-D(2mg/L) + 자당(30g/L) + 피타겔(4g/L))에 파종하고, 캘러스를 유도하기 위해 28°C 암실에서 배양했다.
3. 유전자 총 RNP 충격:
(1) 고장성 재배
배발생성이 좋은 캘러스를 고장성 배지로 옮겼다(제형: MS 분말(4.42g/L) + 2,4-D(2mg/L) + 자당(30g/L) + D-만니톨(0.4M)) + 피타겔 (4g/L)), 매우 청결한 벤치에서 무균 작업을 하였으며, 25℃ 암실에서 4-6시간 동안 배양하였다.
(2) 금 분말 현탁액의 제조: 수입된 1.5 mL EP 튜브를 사용하여 금 분말(직경 0.6 μm) 30 mg을 측량하였다; 70% 에탄올 1mL를 가하고 잘 볼텍싱한 후 얼음 위에 10분간 두었다. 1분 동안 원심분리한 후, 상층액을 버렸다; 멸균수 1mL를 넣고 충분히 볼텍싱한 후 1분간 원심분리한 후 상층액을 버리고 위의 과정을 3회 반복하였다. 멸균된 글리세롤(50%) 500μL를 첨가하고 철저히 볼텍싱하여 농도 60μg/μl의 금 분말 현탁액을 제조하고 -20°C에서 보관하였다.
(3) 50μl의 금 분말 현탁액(60μg/ml)을 취하여 제조된 RNP 복합체 100μL를 첨가하고 부드럽게 혼합하였다.
(4) 15 μl의 RNP/금 분말 혼합물을 취하여 PDS-1000 벤치탑 유전자 총(Bio-Rad)의 절단 가능한 막 중앙에 놓고, 건조시킨 다음, 기기의 지시에 따라 충격을 가했다.
폭격 매개변수: 진공도는 26-28, 거리는 6cm, 기압은 1100 psi 또는 1350 psi였다.
(5) 충격이 완료된 후 캘러스를 25°C의 고장성 배지에서 암실에서 밤새(16시간 동안) 배양하였다.
4. 선별, 분화 및 발근(rooting):
(1) 충격된 캘러스를 밤새 배양한 후, 유도 배지로 옮기고, 회복을 위해 28℃에서 1주일 동안 배양하였다.
(2) 1주일의 회복 후, 캘러스를 선별 배지(제제: 4.1g/L N6 분말 + 0.3g/L 가수분해 카제인 + 2.8g/L 프롤린 + 2mg/L 2,4-D + 3% 자당 + 50ug/L 퀴잘로포프-p(quizalofop-p) + 500mg/L 세팔로스포린(Cef) + 0.1g/L 이노시톨 + 0.35% 피타겔, pH5.8)로 옮겨 3-4주 동안 선별과정을 수행했다; 도 15와 같이 이후의 OsACCase2 W2038의 편집을 위해 50ug/L퀴잘로포프-p가 선별에 사용되었다.
(3) 선별된 성장 상태가 좋은 저항성 캘러스를 분화 배지(제제: MS 분말(4.42g/L) + KT(1mg/L) + 자당(30g/L) + 피타겔(4.5g/L))로 옮겼다. + 50 ug/L 퀴잘로포프-p, pH 5.8), 28℃의 빛이 있는 상태에서 배양하여 2-4주간 분화를 유도했다.
(4) 분화된 묘목을 발근을 위해 발근 배지(제형: 1/2 MS 분말(2.3g/L) + 자당(30g/L) + 피타겔(4.5g/L))로 옮기고, 발근이 완료된 후 묘목을 템퍼링하여, 흙을 채운 화분에 옮겨 온실에 넣어 재배하였다.
5. 저항성 캘러스 및 T0 조직 배양 묘목에서 표적 편집 이벤트의 검출:
총 11개의 저항성 캘러스가 선별되었으며, 이들의 DNA는 CTAB 방법으로 추출되었다. 표적부위에 대한 검출 프라이머는 다음과 같이 설계되었다: OsACC2038test-F: 5'CTGTAGGCATTTGAAACTGCAGTG3', OsACC2038test-R: 5'GCAATCCTGGAGTTCCT-CTGACC3', 및 OsACCase2 W2038 부위를 포함하는 PCR 단편을 증폭, 회수 및 서열화하였다. 시퀀싱 검출에서 그 중 10개가 OsACCase2 W2038 부위에서 TGG에서 TTG로의 돌연변이를 갖는 것으로 나타났으며, 여기서 3개의 샘플은 동형 돌연변이체였다.
저항성 캘러스 분화에 의해 얻어진 T0 세대 조직 배양 묘목의 경우, 편집 표적 부위 서열을 검출하기 위해 그 DNA를 추출하였고, 도 16에 도시된 바와 같이 OsACCase2 W2038 부위에서 TGG에서 TTG로의 동형 돌연변이도 존재하였다.
6. ACCase 억제제 제초제에 대한 T1 세대 묘목의 저항성 테스트
W2038L 돌연변이를 포함하는 T0 집단을 번식시킨 후, T1 세대 돌연변이 묘목을 현장 농도의 퀴잘로포프-p 및 할록시포프-p로 제초제 저항성 테스트를 하였다. OsACCase2 W2038L 돌연변이 집단은 도 17-18에 도시된 바와 같이 이들 2가지 ACCase 억제제 제초제에 대해 상당한 저항성이 있음을 알 수 있었다.
요약하면, 합성 crRNA 및 tracrRNA로 어닐링하여 제조한 gRNA를 사용하거나 합성 sgRNA를 직접 사용하여, 활성 RNP 복합체가 정제된 SpCas9단백질로 형성될 수 있었다; 유전자 총 충격을 받은 캘러스는 조직 배양 단계에서 퀴잘로포프-p를 사용하여 선별될 수 있었고; TGG에서 TTG로의 동형 접합 돌연변이는 T0 세대 조직 배양 묘목의 OsACCase2 W2038 표적부위를 시퀀싱하여 검출할 수 있었다. 돌연변이는 T1 세대로 유전될 수 있고 ACCase 억제제 제초제에 대한 저항성을 나타냈으며, 이는 crRNA 또는 sgRNA의 순차적인 조합으로 형성된 RNP복합체의 프로그래밍된 순차적인 절단/편집으로 세포 내 표적부위에 부위 특이적 돌연변이가 발생될 수 있다는 것, 및 조직 배양 선별을 위한 세포-내인성 선별 마커의 생산을 유도하여 제초제 저항성 작물을 생산할 수 있다는 것을 입증한다.
실시예 10: 상이한 표적화 RNP 복합체는 Oryza sativa 캘러스의 OsACCase2 W2038 부위 및 OsBADH2 유전자를 동시에 편집한다
실시예 8에 따른 방법으로 RNP 복합체를 제조하였으며, 유전자 총 충격 및 조직 배양 절차는 실시예 9와 동일하였다. OsACCase2 W2038 부위를 표적하는 crRNA 또는 sgRNA 외에 OsBADH2 유전자를 표적하는 crRNA 또는 sgRNA를 동시에 첨가하고, SpCas9 단백질과 함께 배양하여 제2 표적유전자 OsBADH2에 대한 표적 RNP 복합체를 형성했다. 유전자 총 충격을 진행하고, 회복 배양, 스크리닝, 분화 및 발근 후에 T0 세대 조직 배양 묘목을 얻고, 번식에 의해 T1 세대를 얻었다.
Oryza sativa OsBADH2 지놈 서열은 서열번호 17에 나타내었다. CRISPOR 온라인 툴(http://crispor.tefor.net/ )에 따라, 표적부위 서열 CCAAGTACCTCCGCGCAATCGcgg를 선별하였고, 여기서 Cas9 단백질에 의해 인식되는 PAM 부위는 이탤릭체 소문자로 표시하였으며, 정제된 SpCas9 단백질을 선별하여 RNP 복합체를 제조하였다. >CrRNA1-OsBADH2:5'-CCAAGUACCUCCGCGCAAUCGguuuuagagcuaugcu-3'을 설계하기 위해 CGG를 PAM으로 사용했으며, 퀴잘로포프-p 선별에 의해 얻은 저항성 캘러스에서 OsACCase2 W2038L의 저항성 돌연변이와 OsBADH2의 녹아웃 돌연변이 이벤트를 동시에 검출할 수 있을 것으로 예측되었다.
>CrRNA1-OsBADH2는 GenScript Biotechnology Company에서 합성되었으며 sgRNA도 합성되었다:
>OsBADH2-sgRNA:5'CCAAGUACCUCCGCGCAAUCGguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc3'.
도 19와 같이 실시예 9의 형질전환 단계에 따라 저항성 캘러스를 선별하고, 저항성 캘러스를 선별하여 분화 및 묘목을 발생시키고, 캘러스 및 T0 세대의 조직 배양 묘목의 OsACCase2 및 OsBADH2 표적부위의 서열을 시퀀싱했다. OsBADH2 표적 검출 프라이머는 다음과 같다:
OsBADH2-check F: 5'CATCGGTACCCTCCTCTTC3'
OsBADH2-check R: 5'ATCGATCGATTTGGGGCTCA3'
그 결과 총 13개의 저항성 캘러스가 선별되었고, 그 중 11개에서 OsACCase2 W2038L 돌연변이가 검출되었고, 이들 11개 캘러스 샘플에 대한 OsBADH2 표적서열의 검출에서 그 중 8개의 샘플은 OsBADH2편집을 동시에 포함하는 것으로 나타났다. 분화를 통해 얻은 T0 세대 조직배양 묘목에서는, 도 20-21과 같이 OsACCase2 W2038L 돌연변이와 OsBADH2+A 동형 돌연변이의 존재를 확인하였다.
요약하면, 쌀 캘러스가 OsACCase2 W2038의 부위-특이적 편집을 수행하기 위해 순차적인 crRNA-표적화 또는 sgRNA-표적화 RNP 복합체로 유전자 총 충격과 제2 표적유전자 OsBADH2를 표적하는 표적화 RNP 복합체를 동시에 추가한 후, 퀴잘로포프-p를 사용한 조직 배양 단계에서 캘러스의 선별이 가능했다; 저항성 캘러스의 61%에서 OsACCase2 W2038 돌연변이와 표적화된 OsBADH2 녹아웃이 동시에 발생하였고, OsBADH2의 동형 돌연변이를 포함하는 집단은 T0 세대 조직 배양 묘목에서 검출되었다. 이들은 저항성 유전자의 부위 특이적 편집을 위한 RNP 형질전환과 순차적 절단/편집의 조합이 내인성 선별 마커를 생성할 수 있고, 상응하는 선별압력의 추가가 제2 표적유전자의 편집 이벤트를 동시에 선별할 수 있으며, 이에 따라 비 형질전환적 수단에 의한 지놈의 부위 특이적 편집이 가능함을 암시한다.
실시예 11: 상이한 표적화된 RNP 복합체가 Oryza sativa 캘러스의 OsALS548 부위 및 OsSWEET14 유전자를 동시에 편집한다.
OsALS548 부위에 대한 표적화 RNP 복합체가 실시예8의 방법과 동일한 방법으로 준비되었으며, 여기서 crRNA 및 sgRNA 서열이 각각 실시예 8에서와 각각 같다:
>CrRNA1-548-G: 5'-GGGUAUGGUUGUGCAAUGGGAguuuuagagcuaugcu-3',
>CrRNA2-548+T: 5'-UGGGUAUGGUUGUGCAAUGGAguuuuagagcuaugcu-3',
>sgRNA1-548-G:
5'GGGUAUGGUUGUGCAAUGGGAguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc3',
>sgRNA2-548+T:
5'UGGGUAUGGUUGUGCAAUGGAguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc3'.
실시예 8을 참조하여, gRNA 또는 sgRNA를 NGA-Cas9와 함께 배양하여 OsALS548 부위를 표적하는 RNP 복합체를 제조하였다.
OsALS548 부위에 표적화된 RNP 복합체에, 추가로 OsSWEET14 유전자에 대한 crRNA 또는 sgRNA를 동시에 첨가하고, SpCas9 단백질과의 배양에 의해 제2 표적유전자 OsSWEET14에 대한 표적화 RNP 복합체를 형성하였다. T0세대 조직배양 묘목은 유전자 총 충격, 회수 배양, 선별, 분화, 발근을 통해 획득하였고, T1세대는 번식을 통해 획득하였다. 선별압력은 5 mg/L 피록술람이었다.
Oryza sativa OsSWEET14 지놈 서열은 서열번호18에 나타내었다. CRISPOR 온라인 툴(http://crispor.tefor.net/ )에 따라 표적 부위 서열 GAGCTTAGCACCTGGTTGGAGggg가 선별되었으며, 여기서 SpCas9 단백질에 의해 인식되는 PAM 부위는 이탤릭체 소문자로 표시하였으며, 정제된 SpCas9 단백질을 선별하여 RNP 복합체를 제조하였다. GGG는 다음을 설계하기 위한 PAM으로 사용되었다:
>CrRNA1-OsSWEET14:
5'-GAGCUUAGCACCUGGUUGGAGguuuuagagcuaugcu-3', 그리고 OsALS W548L의 저항성 돌연변이와 OsSWEET14의 녹아웃 돌연변이가 피록술람의 선별에 의해 얻어진 저항성 캘러스에서 동시에 검출될 수 있을 것으로 예측되었다.
>CrRNA1-Os SWEET14는 GenScript Biotechnology Company에서 합성되었으며 sgRNA도 합성되었다:
>Os SWEET14-sgRNA:
5'GAGCUUAGCACCUGGUUGGAGguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc3'.
저항성 캘러스는 도 22에 도시된 바와 같이 실시예 9에 기재된 바와 같이 유전자 총 충격 및 조직 배양 절차에 따라 선별되었고, 저항성 캘러스는 분화 및 묘목 발생을 위해 선별되었으며, 여기서 선별 배지 제형은: 4.1/L N6 분말 + 0.3 g/L 가수분해된 카제인 + 2.8 g/L 프롤린 + 2 mg/L 2,4-D + 3% 자당 + 5 mg/L 피록술람(pyroxsulam) + 500 mg/L 세팔로스포린(Cef) + 0.1 g/L 이노시톨 + 0.35% 피타겔, pH 5.8. 이었다.
캘러스 및 T0 세대 조직 배양 묘목의 OsALS548 부위 및 OsSWEET14 표적부위의 서열을 시퀀싱하였다. OsSWEET14 표적부위 검출 프라이머는 다음과 같다:
OsSWEET14-check F: 5' ATGGGTGCTGATGATTATCTTGTAT3'
OsSWEET14-check R: 5' TGAAGAGACATGCCAGCCATTG3'
그 결과 총 9개의 저항성 캘러스가 선별되었고, 그 중 8개에서 OsALS W548L 돌연변이 이벤트가 검출되었으며, 그중 5개의 캘러스 샘플은 OsSWEET14 표적 서열의 편집 역시 포함했다. 분화에 의해 얻어진 T0 세대 조직 배양 묘목에서, 도 23-24에 도시된 바와 같이, OsALS W548L 돌연변이 및 OsSWEET14-C 동형 접합 돌연변이 두가지 모두가 검출될 수 있었다.
OsALS W548L 돌연변이 발생이 검출된 T0 집단의 번식 후, T1 세대 돌연변이 묘목 집단을 현장 농도에서 피록술람, 이마자픽, 니코설퓨론 및 플루카바존-소듐으로 제초제 저항성 시험을 하였다. OsALS W548L 돌연변이 집단은 도 25-28에 나타낸 바와 같이 이들 4가지 ALS 억제제 제초제 모두에 대해 상당한 저항성을 나타냄을 알 수 있었다.
요약하면, 합성 crRNA 및 tracrRNA를 어닐링하여 제조한 gRNA를 사용하거나 합성 sgRNA를 직접 사용함으로써, 활성 RNP 복합체가 정제된 NGA Cas9 단백질로 형성될 수 있으며, 순차적인 표적 crRNA 또는 sgRNA의 조합으로 형성된 RNP 복합체의 순차적 절단/복구에 의해 부위-특이적 돌연변이가 발생될 수 있으며, 유전자 총 충격을 받은 캘러스의 선별은 조직 배양 단계에서 피록술람으로 수행될 수 있으며, TGG에서 TTG로의 돌연변이는 T0 세대 조직 배양 묘목의 OsALS548 표적부위를 시퀀싱하여 검출되었고, 이 돌연변이는 T1 세대로 유전될 수 있고 ALS 억제제 제초제에 대한 저항성을 나타냈다.
쌀 캘러스에 제2 표적유전자인 OsSWEET14를 표적하는 표적화 RNP 복합체를 동시에 첨가하여 유전자 총 충격을 가하고, NGG PAM을 인식하는 SpCas9 단백질을 이용하여, 조직 배양 단계에서 피록술람으로 캘러스를 선별하였다. OsALS W548L 돌연변이와 OsSWEET14의 표적 녹아웃은 저항성 캘러스의 55%에서 동시에 발생했으며, OsSWEET14의 동형 접합 돌연변이의 발생이 T0 세대 조직 배양 묘목에서 검출될 수 있었고, 이는 추가로 PNP 형질전환으로 발생된 저항성 유전자의 부위 특이적 편집과 순차적 절단/편집의 조합으로 내인성 선별 마커가 생성될 수 있음을 나타내며, 상이한 PAM 부위를 인식하는 Cas9 단백질을 동시에 사용하고 상응하는 선별압력을 가하여 제2 표적유전자의 편집을 동시에 선별할 수 있었고, 이에 의해 비 형질전화적 수단에 의한 지놈의 부위-특이적 편집을 달성할 수 있었다.
실시예 12: 감자( Solanum tuberosum L .)의 외식편에 2개의 다른 표적 RNP 복합체를 충격시켜 StALS561 부위에서 W561L 돌연변이 발생
Solanum tuberosum L. StALS2 단백질의 아미노산 서열은 서열번호19로, Solanum tuberosum L. StALS2 유전자의 서열은 서열번호20으로 나타내었다. RNP 복합체의 제조 방법 및 유전자 총 충격 방법은 실시예 8-9를 참조했으며, Arabidopsis thaliana ALS574 부위에 상응하는 Solanum tuberosum L. StALS2의 StALS2 W561 부위에 대해 설계된 원래 서열 및 편집된 서열에 대한 sgRNA는 다음과 같았다:
>StALS561- G:
5'GGGAAUGGUGGUUCAGUGGGAguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc3'
>StALS561 +T:
5'UGGGAAUGGUGGUUCAGUGGAguuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc3',
그리고 실시예 8에 기재된 방법에 따라 RNP 복합체를 제조하였다.
감자 품종은 Atlantic 또는 Favorita였으며, 각각의 잎, 줄기 및 곁눈을 각각 외식편으로 사용하였다. 유전자 총 충격 및 선별 및 분화 방법은 다음과 같다:
(1) 잎: 전체 잎을 절단하고 고장성 M6 배지(제제: 4.42g/L MS 분말 + 1 ml/L B5 비타민(Phytotechlab, G219) + 30g/L 자당 + 8g/L 한천 + 2mg/L 2,4-D + 0.8mg/L 제아틴 리보사이드 + 0.2M 만니톨 + 250mg/L Cef)에 평평하게 도포하고, 각 충격에 약 5-6개의 잎이 사용되었다. 24시간 동안 사전 배양 후, 금 분말로 충격을 수행하였다. 충격 후, 암실의 고장성 M6 배지에서 2일 동안 연속 배양한 후 M6 배지(4.42g/L MS 분말 + 1 ml/L B5 비타민(Phytotechlab, G219) + 30g/L 자당 + 8g/L 한천 + 2mg/L 2,4-D + 0.8mg/L 제아틴 리보사이드 + 250mg/L Cef)로 옮겼다. 1주의 연속 배양 후, M6 배지로 옮겨 선별압력을 가했으며, 저항성 캘러스 선별을 20μg/L 클로설퓨론 (제형: 4.42g/L MS 분말 + 1 ml/L B5 비타민(Phytotechlab, G219) + 30g/L 자당 + 8g/L 한천 + 2mg/L 2,4-D + 0.8 mg/L 제아틴 리보사이드 + 250mg/L Cef + 20μg/L 클로설퓨론) 선별압력을 통해 수행하였다. 4주 후, 묘목이 발생할 때까지 선별압력을 가진 눈 유도 배지 R4 (제형: 4.42g/L MS 분말 + 1ml/L B5 비타민(Phytotechlab, G219) + 30g/L 자당 + 8g/L 한천 + 2mg/L GA3 + 0.8mg/L 제아틴 리보사이드 + 250mg/L Cef + 20μg/L 클로설퓨론)으로 옮겨졌다.
(2) 줄기: 감자 줄기(곁눈이 없는)를 채취하여 절개부가 위를 향하도록 세로로 자르고 CIMI 배지(4.42g/L MS 분말 + 20g/L 자당 + 8g/L 한천 + 0.5 mg/L 제아틴 뉴클레오사이드 + 2mg/L 2,4-D + 250mg/L Cef + 20μg/L 클로설퓨론)에 두었으며, 이어서 유전자 총 충격을 가하고, 충격 후 1일 동안 암실에서 배양하고, 줄기를 신선한 CIMI 배지로 옮겨 1주일 동안 연속 배양한 후, 줄기를 선별압력을 포함하는 SIMI 배지로 옮겨(제형: 4.42g/L MS 분말 + 20g/L 자당 + 8g/L 한천 + 1mg/L 제아틴 리보사이드 + 0.1mg/L GA3 + 250mg/L Cef + 20μg/L 클로설퓨론), 묘목이 발생할 때까지 저항성 눈에 대한 선별을 수행했다.
(3) 곁눈: 감자 줄기에서 곁눈을 채취하여 절개부가 위를 향하도록 세로로 자르고 CIMI 배지에 두었으며, 이어서 유전자 총 충격을 가하고, 충격 후 1 일 동안 암실에서 배양하고, 신선한 CIMI 배지로 옮겨 1주일 동안 연속 배양한 후, 선별압력이 포함된 SIMI 배지로 옮겨 묘목 발생까지 저항성 눈 선별을 수행하였다.
StALS2 W561 부위의 검출 프라이머는 다음과 같다:
StALS561-Check F: 5'GTGGATTAGGAGCAATGGGATTT3'
StALS561-Check R: 5' TTATTTTAGATAATACAATGCCTCG3'
검출 후, W561L의 편집은 저항성-선별된 T0 세대 감자 조직 배양 묘목의 StALS2 W561 부위에서 발생하였으며, 이는 본 발명에서 제공하는 비 형질전환적 일시적 유전자 편집 방법이 감자와 같은 작물에 적합함을 입증한다. 외인성 형질전환 요소는 자가 또는 혼성화에 의해 거의 분리 및 제거될 수 없다.
실시예 13: 인간 293T 세포에서 염기 치환을 위해 프로그래밍된 순차적 절단/편집 계획의 성공적인 활용
인간 배아 신장 세포 293T의 HBB(헤모글로빈 서브유닛 베타) 유전자(이의 DNA 서열은 서열번호 21에, CDS 서열은 서열번호 22에, 아미노산 서열은 서열번호 23에 나타내었다)가 선별되었고, 첫 번째 엑손 영역에 sgRNA의 순차적인 절단/편집을 위한 표적부위가 설계되었으며, 제1표적은 catggtgcaCctgactcctgAGG였다.
이 표적을 인식한 sgRNA를 sgHBB로 명명하였고, 이 부위의 sgRNA 절단에서 하나의 C 염기의 결실이 발생할 수 있음을 예측하였다. 제2 표적은 ccatggtgcatctgactctgAGG 로 제1표적의 절단/편집 과정에서 형성된 하나의 C 염기가 결실된 서열을 인식하였으며, 이 표적의 sgRNA를 sgHBB-c로 명명하였다. 293T 세포에 표적부위가 없는 sgRNA를 설계하고 sgNOTAR로 명명했으며, 이는 실험에서 형질주입을 위한 보완 플라스미드로 사용되었다.
위의 설계에 따라 상보적인 단일 가닥 DNA 단편이 각각 합성되었다. 어닐링 후 BbsI 효소로 분해된 px458(addgene: 48138) 플라스미드에 연결하고 E. coli DH5a 컴피턴트로 형질전환했다. 생성된 E. coli 단일 콜로니를 시퀀싱으로 검증한 후, 엔도톡신이 없는 플라스미드 추출 키트(Tiangen Bio)로 플라스미드를 추출 및 정제하였다.
활발하게 성장하는 293T 세포를 0.05% 트립신(Gibico)으로 소화 및 분리하고 DMEM 배지(10% 소태아혈청; 페니실린 + 스트렙토마이신 이중 내성)로 희석하여 24웰 배양 접시에 접종하고 이산화탄소 배양기에 밤새 넣었다. 다음날, 순차적 절단/편집에 따라 sgHBB 및 sgHBB-c 플라스미드 각각 0.5ug; 단일 표적 절단/편집: sgHBB 및 sgNOTAR 플라스미드 각각 0.5ug; 표적 없는 대조군: pEGFP-c1 플라스미드 1μg. 형질전환은 리포펙타민3000(Invitrogen)으로 수행되었다. 각 그룹에 대해 3번의 반복실험이 있었다.
48시간 형질전환 후 형광현미경으로 사진을 촬영하여 형질전환 효율을 기록하였고, 각 웰의 전체 DNA를 핵산 추출 키트(Omega)로 추출하였다.
설계된 Hi-tom 시퀀싱 프라이머는 다음과 같다:
Hi-HBB-F: gaggtgagtacggtgtgcGCTTACATTTGCTTCTGACACAACT;
Hi-HBB-R: gagttggatgctggatggTCTATTGGTCTCCTTAAACCTGTCTTG.
이 프라이머를 사용하여 각 DNA 샘플에 대한 PCR을 수행했다. PCR 산물의 고처리량 시퀀싱은 Hi-tom 방법(Sci China Life Sci. 2019 Jan;62(1):1-7. doi: 10.1007/s11427-018-9402-9)을 사용하여 수행되었다.
시퀀싱 결과의 통계 데이터는 표 6과 표 7에 나타내었다. 이 데이터는 HBB 부위에서 순차적인 절단/편집 방법이 약 1.67%의 비율로 C에서 T로의 편집 (P6S 돌연변이 발생)을 발생시킴을 나타내며, 반면에 단일 표적 절단/편집 방법은 이러한 염기 치환을 발생시킬 수 없다.
293T 세포 HBB 유전자의 순차적 절단/편집 실험에서 서로 상이한 sgRNA 조합에 의해 발생된 편집 유형 및 Hi-Tom 시퀀싱으로 검출된 상이한 유전자형의 판독
유전자형 HBB
프로그래밍된 순차적인 절단/편집 반복 1
HBB
프로그래밍된 순차적인 절단/편집 반복 2
HBB
프로그래밍된 순차적인 절단/편집 반복 3
HBB
단일 타겟 절단/편집 반복 1
HBB
단일 타겟 절단/편집 반복 2
HBB
단일 타겟 절단/편집 반복 3
GFP 형질전환 반복 1 GFP 형질 전환 반복 2
WT 6025 6037 6003 5776 5636 5614 7564 7430
1결실 555 593 613 1170 1134 1120 252 288
2결실 594 625 410 465 509 405
3결실 304 263 258 260 243
4결실 222
5결실 220 217
6결실
7결실 312 223 232 274 229 278
삽입 273 308
C->T SNP 168 230
7958 7963 7966 7958 7985 7968 7816 7718
293T 세포 HBB 유전자의 순차적 절단/편집 실험에서 서로 상이한 sgRNA 조합에 의해 발생된 편집 유형의 비율에 대한 통합된 통계
유전자형 HBB
프로그래밍된 순차적인 절단/편집
HBB
단일 타겟 절단/편집
GFP 형질 전 환 백그라운드 HBB
프로그래밍된 순차적인 절단/편집 비율
HBB
단일 타겟 절단/편집 비율
GFP 형질 전 환 백그라운드 비율
WT 18065 17026 14994 75.63% 71.21% 96.52%
1결실 1761 3424 540 7.37% 14.32% 3.48%
2결실 1629 1379 0 6.82% 5.77% 0.00%
3결실 825 503 0 3.45% 2.10% 0.00%
4결실 222 0 0 0.93% 0.00% 0.00%
5결실 220 217 0 0.92% 0.91% 0.00%
6결실 0 0 0 0.00% 0.00% 0.00%
7결실 767 781 0 3.21% 3.27% 0.00%
삽입 0 581 0 0.00% 2.43% 0.00%
C->T SNP 398 0 0 1.67% 0.00% 0.00%
23887 23911 15534 100.00% 100.00% 100.00%
참고: WT는 야생형을 나타낸다; 결실은 결실 유전자형을 나타내며; 삽입은 삽입 유전자형을 나타낸다; C->T SNP는 절단에서 C에서 T로 염기 치환이 있는 유전자형을 나타낸다; 합계는 총계를 나타낸다.
또한 겸상 적혈구 빈혈과 베타 지중해 빈혈은 모두 성인의 헤모글로빈 β 소단위를 암호화하는 HBB 유전자의 돌연변이로 인해 발생하는 유전성 빈혈이다. 이러한 질병을 가진 환자는 평생 동안 수혈 또는 기타 요법이 필요할 수 있다. 상기 실험의 결과는 본 발명의 프로그램된 순차적 절단/편집 기술을 통한 crRNA 또는 sgRNA의 조합이 HBB 유전자의 돌연변이 부위에 대해 설계되어 돌연변이에서 예상되는 복구를 유도할 수 있음을 입증하였으며, 세포가 활성 헤모글로빈을 생성하고 기능을 회복하여 치료 효과를 얻을 수 있다. 즉, 본 발명에 의해 제공되는 조성물은 질병의 치료 용도를 가진다.
다양한 테스트를 동시에 거친 이 새로운 방법은 완전히 Cas9의 기존 기능을 기반으로 하기 때문에, 본 발명의 방법은 Cas9가 잘 작동할 수 있는 다른 유기체(식물, 동물, 균류 또는 박테리아 등)에서 특정 단편의 염기 치환, 결실 및 삽입이라는 새로운 기능을 달성하는 데 완벽하게 적용될 수 있다.
설명에 언급된 모든 간행물 및 특허 출원은 마치 각 간행물 또는 특허 출원이 개별적, 구체적인 참고문헌으로 여기에 포함되는 것처럼 참고문헌으로 포함된다.
이상에서 본 발명은 명확한 이해를 위하여 실시예 및 구현예를 통하여 더욱 상세하게 설명하였지만, 특허청구범위의 범위 내에서 소정의 변경 및 수정을 가할 수 있음은 자명하며, 이러한 변경 및 수정은 모두 본 발명의 특허청구범위에 포함되는 것임은 자명하다.
<110> QINGDAO KINGAGROOT CHEMICAL COMPOUND CO., LTD. <120> Method For Generating New Mutations In Organisms, And Application Thereof <130> PI210046CN <150> CN 201911081617.X <151> 2019-11-07 <150> CN 202010821877.2 <151> 2020-08-15 <150> CN 202010974151.2 <151> 2020-09-16 <160> 23 <170> KoPatentIn 3.0 <210> 1 <211> 670 <212> PRT <213> Artificial Sequence <220> <223> Arabidopsis thaliana ALS protein amino acid sequence (amino acid sequence) <400> 1 Met Ala Ala Ala Thr Thr Thr Thr Thr Thr Ser Ser Ser Ile Ser Phe 1 5 10 15 Ser Thr Lys Pro Ser Pro Ser Ser Ser Lys Ser Pro Leu Pro Ile Ser 20 25 30 Arg Phe Ser Leu Pro Phe Ser Leu Asn Pro Asn Lys Ser Ser Ser Ser 35 40 45 Ser Arg Arg Arg Gly Ile Lys Ser Ser Ser Pro Ser Ser Ile Ser Ala 50 55 60 Val Leu Asn Thr Thr Thr Asn Val Thr Thr Thr Pro Ser Pro Thr Lys 65 70 75 80 Pro Thr Lys Pro Glu Thr Phe Ile Ser Arg Phe Ala Pro Asp Gln Pro 85 90 95 Arg Lys Gly Ala Asp Ile Leu Val Glu Ala Leu Glu Arg Gln Gly Val 100 105 110 Glu Thr Val Phe Ala Tyr Pro Gly Gly Ala Ser Met Glu Ile His Gln 115 120 125 Ala Leu Thr Arg Ser Ser Ser Ile Arg Asn Val Leu Pro Arg His Glu 130 135 140 Gln Gly Gly Val Phe Ala Ala Glu Gly Tyr Ala Arg Ser Ser Gly Lys 145 150 155 160 Pro Gly Ile Cys Ile Ala Thr Ser Gly Pro Gly Ala Thr Asn Leu Val 165 170 175 Ser Gly Leu Ala Asp Ala Leu Leu Asp Ser Val Pro Leu Val Ala Ile 180 185 190 Thr Gly Gln Val Pro Arg Arg Met Ile Gly Thr Asp Ala Phe Gln Glu 195 200 205 Thr Pro Ile Val Glu Val Thr Arg Ser Ile Thr Lys His Asn Tyr Leu 210 215 220 Val Met Asp Val Glu Asp Ile Pro Arg Ile Ile Glu Glu Ala Phe Phe 225 230 235 240 Leu Ala Thr Ser Gly Arg Pro Gly Pro Val Leu Val Asp Val Pro Lys 245 250 255 Asp Ile Gln Gln Gln Leu Ala Ile Pro Asn Trp Glu Gln Ala Met Arg 260 265 270 Leu Pro Gly Tyr Met Ser Arg Met Pro Lys Pro Pro Glu Asp Ser His 275 280 285 Leu Glu Gln Ile Val Arg Leu Ile Ser Glu Ser Lys Lys Pro Val Leu 290 295 300 Tyr Val Gly Gly Gly Cys Leu Asn Ser Ser Asp Glu Leu Gly Arg Phe 305 310 315 320 Val Glu Leu Thr Gly Ile Pro Val Ala Ser Thr Leu Met Gly Leu Gly 325 330 335 Ser Tyr Pro Cys Asp Asp Glu Leu Ser Leu His Met Leu Gly Met His 340 345 350 Gly Thr Val Tyr Ala Asn Tyr Ala Val Glu His Ser Asp Leu Leu Leu 355 360 365 Ala Phe Gly Val Arg Phe Asp Asp Arg Val Thr Gly Lys Leu Glu Ala 370 375 380 Phe Ala Ser Arg Ala Lys Ile Val His Ile Asp Ile Asp Ser Ala Glu 385 390 395 400 Ile Gly Lys Asn Lys Thr Pro His Val Ser Val Cys Gly Asp Val Lys 405 410 415 Leu Ala Leu Gln Gly Met Asn Lys Val Leu Glu Asn Arg Ala Glu Glu 420 425 430 Leu Lys Leu Asp Phe Gly Val Trp Arg Asn Glu Leu Asn Val Gln Lys 435 440 445 Gln Lys Phe Pro Leu Ser Phe Lys Thr Phe Gly Glu Ala Ile Pro Pro 450 455 460 Gln Tyr Ala Ile Lys Val Leu Asp Glu Leu Thr Asp Gly Lys Ala Ile 465 470 475 480 Ile Ser Thr Gly Val Gly Gln His Gln Met Trp Ala Ala Gln Phe Tyr 485 490 495 Asn Tyr Lys Lys Pro Arg Gln Trp Leu Ser Ser Gly Gly Leu Gly Ala 500 505 510 Met Gly Phe Gly Leu Pro Ala Ala Ile Gly Ala Ser Val Ala Asn Pro 515 520 525 Asp Ala Ile Val Val Asp Ile Asp Gly Asp Gly Ser Phe Ile Met Asn 530 535 540 Val Gln Glu Leu Ala Thr Ile Arg Val Glu Asn Leu Pro Val Lys Val 545 550 555 560 Leu Leu Leu Asn Asn Gln His Leu Gly Met Val Met Gln Trp Glu Asp 565 570 575 Arg Phe Tyr Lys Ala Asn Arg Ala His Thr Phe Leu Gly Asp Pro Ala 580 585 590 Gln Glu Asp Glu Ile Phe Pro Asn Met Leu Leu Phe Ala Ala Ala Cys 595 600 605 Gly Ile Pro Ala Ala Arg Val Thr Lys Lys Ala Asp Leu Arg Glu Ala 610 615 620 Ile Gln Thr Met Leu Asp Thr Pro Gly Pro Tyr Leu Leu Asp Val Ile 625 630 635 640 Cys Pro His Gln Glu His Val Leu Pro Met Ile Pro Ser Gly Gly Thr 645 650 655 Phe Asn Asp Val Ile Thr Glu Gly Asp Gly Arg Ile Lys Tyr 660 665 670 <210> 2 <211> 2013 <212> DNA <213> Artificial Sequence <220> <223> Arabidopsis thaliana ALS gene DNA sequence (DNA sequence) <400> 2 atggcggcgg caacaacaac aacaacaaca tcttcttcga tctccttctc caccaaacca 60 tctccttcct cctccaaatc accattacca atctccagat tctccctccc attctcccta 120 aaccccaaca aatcatcctc ctcctcccgc cgccgcggta tcaaatccag ctctccctcc 180 tccatctccg ccgtgctcaa cacaaccacc aatgtcacaa ccactccctc tccaaccaaa 240 cctaccaaac ccgaaacatt catctcccga ttcgctccag atcaaccccg caaaggcgct 300 gatatcctcg tcgaagcttt agaacgtcaa ggcgtagaaa ccgtattcgc ttaccctgga 360 ggtgcatcaa tggagattca ccaagcctta acccgctctt cctcaatccg taacgtcctt 420 cctcgtcacg aacaaggagg tgtattcgca gcagaaggat acgctcgatc ctcaggtaaa 480 ccaggtatct gtatagccac ttcaggtccc ggagctacaa atctcgttag cggattagcc 540 gatgcgttgt tagatagtgt tcctcttgta gcaatcacag gacaagtccc tcgtcgtatg 600 attggtacag atgcgtttca agagactccg attgttgagg taacgcgttc gattacgaag 660 cataactatc ttgtgatgga tgttgaagat atccctagga ttattgagga agctttcttt 720 ttagctactt ctggtagacc tggacctgtt ttggttgatg ttcctaaaga tattcaacaa 780 cagcttgcga ttcctaattg ggaacaggct atgagattac ctggttatat gtctaggatg 840 cctaaacctc cggaagattc tcatttggag cagattgtta ggttgatttc tgagtctaag 900 aagcctgtgt tgtatgttgg tggtggttgt ttgaattcta gcgatgaatt gggtaggttt 960 gttgagctta cggggatccc tgttgcgagt acgttgatgg ggctgggatc ttatccttgt 1020 gatgatgagt tgtcgttaca tatgcttgga atgcatggga ctgtgtatgc aaattacgct 1080 gtggagcata gtgatttgtt gttggcgttt ggggtaaggt ttgatgatcg tgtcacgggt 1140 aagcttgagg cttttgctag tagggctaag attgttcata ttgatattga ctcggctgag 1200 attgggaaga ataagactcc tcatgtgtct gtgtgtggtg atgttaagct ggctttgcaa 1260 gggatgaata aggttcttga gaaccgagcg gaggagctta agcttgattt tggagtttgg 1320 aggaatgagt tgaacgtaca gaaacagaag tttccgttga gctttaagac gtttggggaa 1380 gctattcctc cacagtatgc gattaaggtc cttgatgagt tgactgatgg aaaagccata 1440 ataagtactg gtgtcgggca acatcaaatg tgggcggcgc agttctacaa ttacaagaaa 1500 ccaaggcagt ggctatcatc aggaggcctt ggagctatgg gatttggact tcctgctgcg 1560 attggagcgt ctgttgctaa ccctgatgcg atagttgtgg atattgacgg agatggaagc 1620 tttataatga atgtgcaaga gctagccact attcgtgtag agaatcttcc agtgaaggta 1680 cttttattaa acaaccagca tcttggcatg gttatgcaat gggaagatcg gttctacaaa 1740 gctaaccgag ctcacacatt tctcggggat ccggctcagg aggacgagat attcccgaac 1800 atgttgctgt ttgcagcagc ttgcgggatt ccagcggcga gggtgacaaa gaaagcagat 1860 ctccgagaag ctattcagac aatgctggat acaccaggac cttacctgtt ggatgtgatt 1920 tgtccgcacc aagaacatgt gttgccgatg atcccgagtg gtggcacttt caacgatgtc 1980 ataacggaag gagatggccg gattaaatac tga 2013 <210> 3 <211> 2320 <212> PRT <213> Artificial Sequence <220> <223> Alopecurus myosuroides ACCase protein amino acid sequence (amino acid sequence) <400> 3 Met Gly Ser Thr His Leu Pro Ile Val Gly Phe Asn Ala Ser Thr Thr 1 5 10 15 Pro Ser Leu Ser Thr Leu Arg Gln Ile Asn Ser Ala Ala Ala Ala Phe 20 25 30 Gln Ser Ser Ser Pro Ser Arg Ser Ser Lys Lys Lys Ser Arg Arg Val 35 40 45 Lys Ser Ile Arg Asp Asp Gly Asp Gly Ser Val Pro Asp Pro Ala Gly 50 55 60 His Gly Gln Ser Ile Arg Gln Gly Leu Ala Gly Ile Ile Asp Leu Pro 65 70 75 80 Lys Glu Gly Ala Ser Ala Pro Asp Val Asp Ile Ser His Gly Ser Glu 85 90 95 Asp His Lys Ala Ser Tyr Gln Met Asn Gly Ile Leu Asn Glu Ser His 100 105 110 Asn Gly Arg His Ala Ser Leu Ser Lys Val Tyr Glu Phe Cys Thr Glu 115 120 125 Leu Gly Gly Lys Thr Pro Ile His Ser Val Leu Val Ala Asn Asn Gly 130 135 140 Met Ala Ala Ala Lys Phe Met Arg Ser Val Arg Thr Trp Ala Asn Asp 145 150 155 160 Thr Phe Gly Ser Glu Lys Ala Ile Gln Leu Ile Ala Met Ala Thr Pro 165 170 175 Glu Asp Met Arg Ile Asn Ala Glu His Ile Arg Ile Ala Asp Gln Phe 180 185 190 Val Glu Val Pro Gly Gly Thr Asn Asn Asn Asn Tyr Ala Asn Val Gln 195 200 205 Leu Ile Val Glu Ile Ala Glu Arg Thr Gly Val Ser Ala Val Trp Pro 210 215 220 Gly Trp Gly His Ala Ser Glu Asn Pro Glu Leu Pro Asp Ala Leu Thr 225 230 235 240 Ala Lys Gly Ile Val Phe Leu Gly Pro Pro Ala Ser Ser Met Asn Ala 245 250 255 Leu Gly Asp Lys Val Gly Ser Ala Leu Ile Ala Gln Ala Ala Gly Val 260 265 270 Pro Thr Leu Ala Trp Ser Gly Ser His Val Glu Ile Pro Leu Glu Leu 275 280 285 Cys Leu Asp Ser Ile Pro Glu Glu Met Tyr Arg Lys Ala Cys Val Thr 290 295 300 Thr Ala Asp Glu Ala Val Ala Ser Cys Gln Met Ile Gly Tyr Pro Ala 305 310 315 320 Met Ile Lys Ala Ser Trp Gly Gly Gly Gly Lys Gly Ile Arg Lys Val 325 330 335 Asn Asn Asp Asp Glu Val Lys Ala Leu Phe Lys Gln Val Gln Gly Glu 340 345 350 Val Pro Gly Ser Pro Ile Phe Ile Met Arg Leu Ala Ser Gln Ser Arg 355 360 365 His Leu Glu Val Gln Leu Leu Cys Asp Glu Tyr Gly Asn Val Ala Ala 370 375 380 Leu His Ser Arg Asp Cys Ser Val Gln Arg Arg His Gln Lys Ile Ile 385 390 395 400 Glu Glu Gly Pro Val Thr Val Ala Pro Arg Glu Thr Val Lys Glu Leu 405 410 415 Glu Gln Ala Ala Arg Arg Leu Ala Lys Ala Val Gly Tyr Val Gly Ala 420 425 430 Ala Thr Val Glu Tyr Leu Tyr Ser Met Glu Thr Gly Glu Tyr Tyr Phe 435 440 445 Leu Glu Leu Asn Pro Arg Leu Gln Val Glu His Pro Val Thr Glu Ser 450 455 460 Ile Ala Glu Val Asn Leu Pro Ala Ala Gln Val Ala Val Gly Met Gly 465 470 475 480 Ile Pro Leu Trp Gln Ile Pro Glu Ile Arg Arg Phe Tyr Gly Met Asp 485 490 495 Asn Gly Gly Gly Tyr Asp Ile Trp Arg Lys Thr Ala Ala Leu Ala Thr 500 505 510 Pro Phe Asn Phe Asp Glu Val Asp Ser Gln Trp Pro Lys Gly His Cys 515 520 525 Val Ala Val Arg Ile Thr Ser Glu Asn Pro Asp Asp Gly Phe Lys Pro 530 535 540 Thr Gly Gly Lys Val Lys Glu Ile Ser Phe Lys Ser Lys Pro Asn Val 545 550 555 560 Trp Gly Tyr Phe Ser Val Lys Ser Gly Gly Gly Ile His Glu Phe Ala 565 570 575 Asp Ser Gln Phe Gly His Val Phe Ala Tyr Gly Glu Thr Arg Ser Ala 580 585 590 Ala Ile Thr Ser Met Ser Leu Ala Leu Lys Glu Ile Gln Ile Arg Gly 595 600 605 Glu Ile His Thr Asn Val Asp Tyr Thr Val Asp Leu Leu Asn Ala Pro 610 615 620 Asp Phe Arg Glu Asn Thr Ile His Thr Gly Trp Leu Asp Thr Arg Ile 625 630 635 640 Ala Met Arg Val Gln Ala Glu Arg Pro Pro Trp Tyr Ile Ser Val Val 645 650 655 Gly Gly Ala Leu Tyr Lys Thr Ile Thr Thr Asn Ala Glu Thr Val Ser 660 665 670 Glu Tyr Val Ser Tyr Leu Ile Lys Gly Gln Ile Pro Pro Lys His Ile 675 680 685 Ser Leu Val His Ser Thr Ile Ser Leu Asn Ile Glu Glu Ser Lys Tyr 690 695 700 Thr Ile Glu Ile Val Arg Ser Gly Gln Gly Ser Tyr Arg Leu Arg Leu 705 710 715 720 Asn Gly Ser Leu Ile Glu Ala Asn Val Gln Thr Leu Cys Asp Gly Gly 725 730 735 Leu Leu Met Gln Leu Asp Gly Asn Ser His Val Ile Tyr Ala Glu Glu 740 745 750 Glu Ala Gly Gly Thr Arg Leu Leu Ile Asp Gly Lys Thr Cys Leu Leu 755 760 765 Gln Asn Asp His Asp Pro Ser Arg Leu Leu Ala Glu Thr Pro Cys Lys 770 775 780 Leu Leu Arg Phe Leu Ile Ala Asp Gly Ala His Val Asp Ala Asp Val 785 790 795 800 Pro Tyr Ala Glu Val Glu Val Met Lys Met Cys Met Pro Leu Leu Ser 805 810 815 Pro Ala Ala Gly Val Ile Asn Val Leu Leu Ser Glu Gly Gln Ala Met 820 825 830 Gln Ala Gly Asp Leu Ile Ala Arg Leu Asp Leu Asp Asp Pro Ser Ala 835 840 845 Val Lys Arg Ala Glu Pro Phe Glu Gly Ser Phe Pro Glu Met Ser Leu 850 855 860 Pro Ile Ala Ala Ser Gly Gln Val His Lys Arg Cys Ala Ala Ser Leu 865 870 875 880 Asn Ala Ala Arg Met Val Leu Ala Gly Tyr Asp His Ala Ala Asn Lys 885 890 895 Val Val Gln Asp Leu Val Trp Cys Leu Asp Thr Pro Ala Leu Pro Phe 900 905 910 Leu Gln Trp Glu Glu Leu Met Ser Val Leu Ala Thr Arg Leu Pro Arg 915 920 925 Arg Leu Lys Ser Glu Leu Glu Gly Lys Tyr Asn Glu Tyr Lys Leu Asn 930 935 940 Val Asp His Val Lys Ile Lys Asp Phe Pro Thr Glu Met Leu Arg Glu 945 950 955 960 Thr Ile Glu Glu Asn Leu Ala Cys Val Ser Glu Lys Glu Met Val Thr 965 970 975 Ile Glu Arg Leu Val Asp Pro Leu Met Ser Leu Leu Lys Ser Tyr Glu 980 985 990 Gly Gly Arg Glu Ser His Ala His Phe Ile Val Lys Ser Leu Phe Glu 995 1000 1005 Glu Tyr Leu Ser Val Glu Glu Leu Phe Ser Asp Gly Ile Gln Ser Asp 1010 1015 1020 Val Ile Glu Arg Leu Arg Leu Gln Tyr Ser Lys Asp Leu Gln Lys Val 1025 1030 1035 1040 Val Asp Ile Val Leu Ser His Gln Gly Val Arg Asn Lys Thr Lys Leu 1045 1050 1055 Ile Leu Ala Leu Met Glu Lys Leu Val Tyr Pro Asn Pro Ala Ala Tyr 1060 1065 1070 Arg Asp Gln Leu Ile Arg Phe Ser Ser Leu Asn His Lys Arg Tyr Tyr 1075 1080 1085 Lys Leu Ala Leu Lys Ala Ser Glu Leu Leu Glu Gln Thr Lys Leu Ser 1090 1095 1100 Glu Leu Arg Thr Ser Ile Ala Arg Asn Leu Ser Ala Leu Asp Met Phe 1105 1110 1115 1120 Thr Glu Glu Lys Ala Asp Phe Ser Leu Gln Asp Arg Lys Leu Ala Ile 1125 1130 1135 Asn Glu Ser Met Gly Asp Leu Val Thr Ala Pro Leu Pro Val Glu Asp 1140 1145 1150 Ala Leu Val Ser Leu Phe Asp Cys Thr Asp Gln Thr Leu Gln Gln Arg 1155 1160 1165 Val Ile Gln Thr Tyr Ile Ser Arg Leu Tyr Gln Pro Gln Leu Val Lys 1170 1175 1180 Asp Ser Ile Gln Leu Lys Tyr Gln Asp Ser Gly Val Ile Ala Leu Trp 1185 1190 1195 1200 Glu Phe Thr Glu Gly Asn His Glu Lys Arg Leu Gly Ala Met Val Ile 1205 1210 1215 Leu Lys Ser Leu Glu Ser Val Ser Thr Ala Ile Gly Ala Ala Leu Lys 1220 1225 1230 Asp Ala Ser His Tyr Ala Ser Ser Ala Gly Asn Thr Val His Ile Ala 1235 1240 1245 Leu Leu Asp Ala Asp Thr Gln Leu Asn Thr Thr Glu Asp Ser Gly Asp 1250 1255 1260 Asn Asp Gln Ala Gln Asp Lys Met Asp Lys Leu Ser Phe Val Leu Lys 1265 1270 1275 1280 Gln Asp Val Val Met Ala Asp Leu Arg Ala Ala Asp Val Lys Val Val 1285 1290 1295 Ser Cys Ile Val Gln Arg Asp Gly Ala Ile Met Pro Met Arg Arg Thr 1300 1305 1310 Phe Leu Leu Ser Glu Glu Lys Leu Cys Tyr Glu Glu Glu Pro Ile Leu 1315 1320 1325 Arg His Val Glu Pro Pro Leu Ser Ala Leu Leu Glu Leu Asp Lys Leu 1330 1335 1340 Lys Val Lys Gly Tyr Asn Glu Met Lys Tyr Thr Pro Ser Arg Asp Arg 1345 1350 1355 1360 Gln Trp His Ile Tyr Thr Leu Arg Asn Thr Glu Asn Pro Lys Met Leu 1365 1370 1375 His Arg Val Phe Phe Arg Thr Leu Val Arg Gln Pro Ser Ala Gly Asn 1380 1385 1390 Arg Phe Thr Ser Asp His Ile Thr Asp Val Glu Val Gly His Ala Glu 1395 1400 1405 Glu Pro Leu Ser Phe Thr Ser Ser Ser Ile Leu Lys Ser Leu Lys Ile 1410 1415 1420 Ala Lys Glu Glu Leu Glu Leu His Ala Ile Arg Thr Gly His Ser His 1425 1430 1435 1440 Met Tyr Leu Cys Ile Leu Lys Glu Gln Lys Leu Leu Asp Leu Val Pro 1445 1450 1455 Val Ser Gly Asn Thr Val Val Asp Val Gly Gln Asp Glu Ala Thr Ala 1460 1465 1470 Cys Ser Leu Leu Lys Glu Met Ala Leu Lys Ile His Glu Leu Val Gly 1475 1480 1485 Ala Arg Met His His Leu Ser Val Cys Gln Trp Glu Val Lys Leu Lys 1490 1495 1500 Leu Val Ser Asp Gly Pro Ala Ser Gly Ser Trp Arg Val Val Thr Thr 1505 1510 1515 1520 Asn Val Thr Gly His Thr Cys Thr Val Asp Ile Tyr Arg Glu Val Glu 1525 1530 1535 Asp Thr Glu Ser Gln Lys Leu Val Tyr His Ser Thr Ala Leu Ser Ser 1540 1545 1550 Gly Pro Leu His Gly Val Ala Leu Asn Thr Ser Tyr Gln Pro Leu Ser 1555 1560 1565 Val Ile Asp Leu Lys Arg Cys Ser Ala Arg Asn Asn Lys Thr Thr Tyr 1570 1575 1580 Cys Tyr Asp Phe Pro Leu Thr Phe Glu Ala Ala Val Gln Lys Ser Trp 1585 1590 1595 1600 Ser Asn Ile Ser Ser Glu Asn Asn Gln Cys Tyr Val Lys Ala Thr Glu 1605 1610 1615 Leu Val Phe Ala Glu Lys Asn Gly Ser Trp Gly Thr Pro Ile Ile Pro 1620 1625 1630 Met Gln Arg Ala Ala Gly Leu Asn Asp Ile Gly Met Val Ala Trp Ile 1635 1640 1645 Leu Asp Met Ser Thr Pro Glu Phe Pro Ser Gly Arg Gln Ile Ile Val 1650 1655 1660 Ile Ala Asn Asp Ile Thr Phe Arg Ala Gly Ser Phe Gly Pro Arg Glu 1665 1670 1675 1680 Asp Ala Phe Phe Glu Ala Val Thr Asn Leu Ala Cys Glu Lys Lys Leu 1685 1690 1695 Pro Leu Ile Tyr Leu Ala Ala Asn Ser Gly Ala Arg Ile Gly Ile Ala 1700 1705 1710 Asp Glu Val Lys Ser Cys Phe Arg Val Gly Trp Thr Asp Asp Ser Ser 1715 1720 1725 Pro Glu Arg Gly Phe Arg Tyr Ile Tyr Met Thr Asp Glu Asp His Asp 1730 1735 1740 Arg Ile Gly Ser Ser Val Ile Ala His Lys Met Gln Leu Asp Ser Gly 1745 1750 1755 1760 Glu Ile Arg Trp Val Ile Asp Ser Val Val Gly Lys Glu Asp Gly Leu 1765 1770 1775 Gly Val Glu Asn Ile His Gly Ser Ala Ala Ile Ala Ser Ala Tyr Ser 1780 1785 1790 Arg Ala Tyr Glu Glu Thr Phe Thr Leu Thr Phe Val Thr Gly Arg Thr 1795 1800 1805 Val Gly Ile Gly Ala Tyr Leu Ala Arg Leu Gly Ile Arg Cys Ile Gln 1810 1815 1820 Arg Ile Asp Gln Pro Ile Ile Leu Thr Gly Phe Ser Ala Leu Asn Lys 1825 1830 1835 1840 Leu Leu Gly Arg Glu Val Tyr Ser Ser His Met Gln Leu Gly Gly Pro 1845 1850 1855 Lys Ile Met Ala Thr Asn Gly Val Val His Leu Thr Val Pro Asp Asp 1860 1865 1870 Leu Glu Gly Val Ser Asn Ile Leu Arg Trp Leu Ser Tyr Val Pro Ala 1875 1880 1885 Asn Ile Gly Gly Pro Leu Pro Ile Thr Lys Ser Leu Asp Pro Ile Asp 1890 1895 1900 Arg Pro Val Ala Tyr Ile Pro Glu Asn Thr Cys Asp Pro Arg Ala Ala 1905 1910 1915 1920 Ile Ser Gly Ile Asp Asp Ser Gln Gly Lys Trp Leu Gly Gly Met Phe 1925 1930 1935 Asp Lys Asp Ser Phe Val Glu Thr Phe Glu Gly Trp Ala Lys Thr Val 1940 1945 1950 Val Thr Gly Arg Ala Lys Leu Gly Gly Ile Pro Val Gly Val Ile Ala 1955 1960 1965 Val Glu Thr Gln Thr Met Met Gln Leu Val Pro Ala Asp Pro Gly Gln 1970 1975 1980 Pro Asp Ser His Glu Arg Ser Val Pro Arg Ala Gly Gln Val Trp Phe 1985 1990 1995 2000 Pro Asp Ser Ala Thr Lys Thr Ala Gln Ala Met Leu Asp Phe Asn Arg 2005 2010 2015 Glu Gly Leu Pro Leu Phe Ile Leu Ala Asn Trp Arg Gly Phe Ser Gly 2020 2025 2030 Gly Gln Arg Asp Leu Phe Glu Gly Ile Leu Gln Ala Gly Ser Thr Ile 2035 2040 2045 Val Glu Asn Leu Arg Thr Tyr Asn Gln Pro Ala Phe Val Tyr Ile Pro 2050 2055 2060 Lys Ala Ala Glu Leu Arg Gly Gly Ala Trp Val Val Ile Asp Ser Lys 2065 2070 2075 2080 Ile Asn Pro Asp Arg Ile Glu Cys Tyr Ala Glu Arg Thr Ala Lys Gly 2085 2090 2095 Asn Val Leu Glu Pro Gln Gly Leu Ile Glu Ile Lys Phe Arg Ser Glu 2100 2105 2110 Glu Leu Lys Glu Cys Met Gly Arg Leu Asp Pro Glu Leu Ile Asp Leu 2115 2120 2125 Lys Ala Arg Leu Gln Gly Ala Asn Gly Ser Leu Ser Asp Gly Glu Ser 2130 2135 2140 Leu Gln Lys Ser Ile Glu Ala Arg Lys Lys Gln Leu Leu Pro Leu Tyr 2145 2150 2155 2160 Thr Gln Ile Ala Val Arg Phe Ala Glu Leu His Asp Thr Ser Leu Arg 2165 2170 2175 Met Ala Ala Lys Gly Val Ile Arg Lys Val Val Asp Trp Glu Asp Ser 2180 2185 2190 Arg Ser Phe Phe Tyr Lys Arg Leu Arg Arg Arg Leu Ser Glu Asp Val 2195 2200 2205 Leu Ala Lys Glu Ile Arg Gly Val Ile Gly Glu Lys Phe Pro His Lys 2210 2215 2220 Ser Ala Ile Glu Leu Ile Lys Lys Trp Tyr Leu Ala Ser Glu Ala Ala 2225 2230 2235 2240 Ala Ala Gly Ser Thr Asp Trp Asp Asp Asp Asp Ala Phe Val Ala Trp 2245 2250 2255 Arg Glu Asn Pro Glu Asn Tyr Lys Glu Tyr Ile Lys Glu Leu Arg Ala 2260 2265 2270 Gln Arg Val Ser Arg Leu Leu Ser Asp Val Ala Gly Ser Ser Ser Asp 2275 2280 2285 Leu Gln Ala Leu Pro Gln Gly Leu Ser Met Leu Leu Asp Lys Met Asp 2290 2295 2300 Pro Ser Lys Arg Ala Gln Phe Ile Glu Glu Val Met Lys Val Leu Lys 2305 2310 2315 2320 <210> 4 <211> 6963 <212> DNA <213> Artificial Sequence <220> <223> Alopecurus myosuroides ACCase gene DNA sequence (DNA sequence) <400> 4 atgggatcca cacatctgcc cattgtcggg tttaatgcat ccacaacacc atcgctatcc 60 actcttcgcc agataaactc agctgctgct gcattccaat cttcgtcccc ttcaaggtca 120 tccaagaaga aaagccgacg tgttaagtca ataagggatg atggcgatgg aagcgtgcca 180 gaccctgcag gccatggcca gtctattcgc caaggtctcg ctggcatcat cgacctccca 240 aaggagggcg catcagctcc agatgtggac atttcacatg ggtctgaaga ccacaaggcc 300 tcctaccaaa tgaatgggat actgaatgaa tcacataacg ggaggcacgc ctctctgtct 360 aaagtttatg aattttgcac ggaattgggt ggaaaaacac caattcacag tgtattagtc 420 gccaacaatg gaatggcagc agctaagttc atgcggagtg tccggacatg ggctaatgat 480 acatttgggt cagagaaggc gattcagttg atagctatgg caactccgga agacatgaga 540 ataaatgcag agcacattag aattgctgat cagtttgttg aagtacctgg tggaacaaac 600 aataacaact atgcaaatgt ccaactcata gtggagatag cagagagaac tggtgtctcc 660 gccgtttggc ctggttgggg ccatgcatct gagaatcctg aacttccaga tgcactaact 720 gcaaaaggaa ttgtttttct tgggccacca gcatcatcaa tgaacgcact aggcgacaag 780 gttggttcag ctctcattgc tcaagcagca ggggttccca ctcttgcttg gagtggatca 840 catgtggaaa ttccattaga actttgtttg gactcgatac ctgaggagat gtataggaaa 900 gcctgtgtta caaccgctga tgaagcagtt gcaagttgtc agatgattgg ttaccctgcc 960 atgatcaagg catcctgggg tggtggtggt aaagggatta gaaaggttaa taatgatgac 1020 gaggtgaaag cactgtttaa gcaagtacag ggtgaagttc ctggctcccc gatatttatc 1080 atgagacttg catctcagag tcgtcatctt gaagtccagc tgctttgtga tgaatatggc 1140 aatgtagcag cacttcacag tcgtgattgc agtgtgcaac gacgacacca aaagattatc 1200 gaggaaggac cagttactgt tgctcctcgt gaaacagtga aagagctaga gcaagcagca 1260 aggaggcttg ctaaggccgt gggttacgtc ggtgctgcta ctgttgaata tctctacagc 1320 atggagactg gtgaatacta ttttctggag cttaatccac ggttgcaggt tgagcaccca 1380 gtcaccgagt cgatagctga agtaaatttg cctgcagccc aagttgcagt tgggatgggt 1440 ataccccttt ggcagattcc agagatcaga cgtttctacg gaatggacaa tggaggaggc 1500 tatgatattt ggaggaaaac agcagctctc gctactccat tcaactttga tgaagtagat 1560 tctcaatggc cgaagggtca ttgtgtggca gttaggataa ccagtgagaa tccagatgat 1620 ggattcaagc ctactggtgg aaaagtaaag gagataagtt ttaaaagtaa gccaaatgtc 1680 tggggatatt tctcagttaa gtctggtgga ggcattcatg aatttgcgga ttctcagttt 1740 ggacacgttt ttgcctatgg agagactaga tcagcagcaa taaccagcat gtctcttgca 1800 ctaaaagaga ttcaaattcg tggagaaatt catacaaacg ttgattacac ggttgatctc 1860 ttgaatgccc cagacttcag agaaaacacg atccataccg gttggctgga taccagaata 1920 gctatgcgtg ttcaagctga gaggcctccc tggtatattt cagtggttgg aggagctcta 1980 tataaaacaa taaccaccaa tgcggagacc gtttctgaat atgttagcta tctcatcaag 2040 ggtcagattc caccaaagca catatccctt gtccattcaa ctatttcttt gaatatagag 2100 gaaagcaaat atacaattga gattgtgagg agtggacagg gtagctacag attgagactg 2160 aatggatcac ttattgaagc caatgtacaa acattatgtg atggaggcct tttaatgcag 2220 ctggatggaa atagccatgt tatttatgct gaagaagaag cgggtggtac acggcttctt 2280 attgatggaa aaacatgctt gctacagaat gaccatgatc cgtcaaggtt attagctgag 2340 acaccctgca aacttcttcg tttcttgatt gccgatggtg ctcatgttga tgctgatgta 2400 ccatacgcgg aagttgaggt tatgaagatg tgcatgcccc tcttgtcgcc tgctgctggt 2460 gtcattaatg ttttgttgtc tgagggccag gcgatgcagg ctggtgatct tatagcgaga 2520 cttgatctcg atgacccttc tgctgtgaag agagccgagc catttgaagg atcttttcca 2580 gaaatgagcc ttcctattgc tgcttctggc caagttcaca aaagatgtgc tgcaagtttg 2640 aacgctgctc gaatggtcct tgcaggatat gaccatgcgg ccaacaaagt tgtgcaagat 2700 ttggtatggt gccttgatac acctgctctt cctttcctac aatgggaaga gcttatgtct 2760 gttttagcaa ctagacttcc aagacgtctt aagagcgagt tggagggcaa atacaatgaa 2820 tacaagttaa atgttgacca tgtgaagatc aaggatttcc ctaccgagat gcttagagag 2880 acaatcgagg aaaatcttgc atgtgtttcc gagaaggaaa tggtgacaat tgagaggctt 2940 gttgaccctc tgatgagcct gctgaagtca tacgagggtg ggagagaaag ccatgcccac 3000 tttattgtca agtccctttt tgaggagtat ctctcggttg aggaactatt cagtgatggc 3060 attcagtctg acgtgattga acgcctgcgc ctacaatata gtaaagacct ccagaaggtt 3120 gtagacattg ttttgtctca ccagggtgtg agaaacaaaa caaagctgat actcgcgctc 3180 atggagaaac tggtctatcc aaaccctgct gcctacagag atcagttgat tcgcttttct 3240 tccctcaacc ataaaagata ttataagttg gctcttaaag ctagtgaact tcttgaacaa 3300 accaagctca gcgaactccg cacaagcatt gcaaggaacc tttcagcgct ggatatgttc 3360 accgaggaaa aggcagattt ctccttgcaa gacagaaaat tggccattaa tgagagcatg 3420 ggagatttag tcactgcccc actgccagtt gaagatgcac ttgtttcttt gtttgattgt 3480 actgatcaaa ctcttcagca gagagtgatt cagacataca tatctcgatt ataccagcct 3540 caacttgtga aggatagcat ccagctgaaa tatcaggatt ctggtgttat tgctttatgg 3600 gaattcactg aaggaaatca tgagaagaga ttgggtgcta tggttatcct gaagtcacta 3660 gaatctgtgt caacagccat tggagctgct ctaaaggatg catcacatta tgcaagctct 3720 gcgggcaaca cggtgcatat tgctttgttg gatgctgata cccaactgaa tacaactgaa 3780 gatagtggtg ataatgacca agctcaagac aagatggata aactttcttt tgtactgaaa 3840 caagatgttg tcatggctga tctacgtgct gctgatgtca aggttgttag ttgcattgtt 3900 caaagagatg gagcaatcat gcctatgcgc cgtaccttcc tcttgtcaga ggaaaaactt 3960 tgttacgagg aagagccgat tcttcggcat gtggagcctc cactttctgc acttcttgag 4020 ttggataaat tgaaagtgaa aggatacaat gagatgaagt atacaccgtc acgtgatcgt 4080 cagtggcata tatacacact tagaaatact gaaaatccaa aaatgctgca cagggtattt 4140 ttccgaacac ttgtcagaca acccagtgca ggcaacaggt ttacatcaga ccatatcact 4200 gatgttgaag taggacacgc agaggaacct ctttcattta cttcaagcag catattaaaa 4260 tcgttgaaga ttgctaaaga agaattggag cttcacgcga tcaggactgg ccattctcat 4320 atgtacttgt gcatattgaa agagcaaaag cttcttgacc ttgttcctgt ttcagggaac 4380 actgttgtgg atgttggtca agatgaagct actgcatgct ctcttttgaa agaaatggct 4440 ttaaagatac atgaacttgt tggtgcaaga atgcatcatc tttctgtatg ccagtgggaa 4500 gtgaaactta agttggtgag cgatgggcct gccagtggta gctggagagt tgtaacaacc 4560 aatgttactg gtcacacctg cactgtggat atctaccggg aggtcgaaga tacagaatca 4620 cagaaactag tataccactc caccgcattg tcatctggtc ctttgcatgg tgttgcactg 4680 aatacttcgt atcagccttt gagtgttatt gatttaaaac gttgctctgc caggaacaac 4740 aaaactacat actgctatga ttttccattg acatttgaag ctgcagtgca gaagtcgtgg 4800 tctaacattt ccagtgaaaa caaccaatgt tatgttaaag cgacagagct tgtgtttgct 4860 gaaaagaatg ggtcgtgggg cactcctata attcctatgc agcgtgctgc tgggctgaat 4920 gacattggta tggtagcctg gatcttggac atgtccactc ctgaatttcc cagcggcaga 4980 cagatcattg ttatcgcaaa tgatattaca tttagagctg gatcatttgg cccaagggaa 5040 gatgcatttt tcgaagctgt aaccaacctg gcttgtgaga agaagcttcc acttatctac 5100 ttggctgcaa actctggtgc tcggattggc attgctgatg aagtaaaatc ttgcttccgt 5160 gttggatgga ctgatgatag cagccctgaa cgtggattta ggtacattta tatgactgac 5220 gaagaccatg atcgtattgg ctcttcagtt atagcacaca agatgcagct agatagtggc 5280 gagatcaggt gggttattga ttctgttgtg ggaaaagagg atggactagg tgtggagaac 5340 atacatggaa gtgctgctat tgccagtgcc tattctaggg cgtacgagga gacatttaca 5400 cttacattcg ttactggacg aactgttgga atcggagcct atcttgctcg acttggcata 5460 cggtgcatac agcgtattga ccagcccatt attttgaccg ggttttctgc cctgaacaag 5520 cttcttgggc gggaggtgta cagctcccac atgcagttgg gtggtcccaa aatcatggcg 5580 acgaatggtg ttgtccatct gactgttcca gatgaccttg aaggtgtttc taatatattg 5640 aggtggctca gctatgttcc tgcaaacatt ggtggacctc ttcctattac aaaatctttg 5700 gacccaatag acagacccgt tgcatacatc cctgagaata catgtgatcc tcgtgcagcc 5760 atcagtggca ttgatgacag ccaagggaaa tggttgggtg gcatgtttga caaagacagt 5820 tttgtggaga catttgaagg atgggcgaag acagtagtta ctggcagagc aaaacttgga 5880 gggattcctg ttggtgttat agctgtggag acacagacca tgatgcagct cgtccccgct 5940 gatccaggcc agcctgattc ccacgagcgg tctgttcctc gtgctgggca agtttggttt 6000 ccagattctg ctaccaagac agcgcaggcg atgttggact tcaaccgtga aggattacct 6060 ctgttcatac ttgctaactg gagaggcttc tctggagggc aaagagatct ttttgaagga 6120 attctgcagg ctgggtcaac aattgttgag aaccttagga catacaatca gcctgccttt 6180 gtatatatcc ccaaggctgc agagctacgt ggaggagcct gggtcgtgat tgatagcaag 6240 ataaacccag atcgcatcga gtgctatgct gagaggactg caaagggtaa tgttctcgaa 6300 cctcaagggt tgattgagat caagttcagg tcagaggaac tcaaagaatg catgggtagg 6360 cttgatccag aattgataga tctgaaagca agactccagg gagcaaatgg aagcctatct 6420 gatggagaat cccttcagaa gagcatagaa gctcggaaga aacagttgct gcctctgtac 6480 acccaaatcg cggtacgttt tgcggaattg cacgacactt cccttagaat ggctgctaaa 6540 ggtgtgatca ggaaagttgt agactgggaa gactctcggt ctttcttcta caagagatta 6600 cggaggaggc tatccgagga cgttctggca aaggagatta gaggtgtaat tggtgagaag 6660 tttcctcaca aatcagcgat cgagctgatc aagaaatggt acttggcttc tgaggcagct 6720 gcagcaggaa gcaccgactg ggatgacgac gatgcttttg tcgcctggag ggagaaccct 6780 gaaaactata aggagtatat caaagagctt agggctcaaa gggtatctcg gttgctctca 6840 gatgttgcag gctccagttc ggatttacaa gccttgccgc agggtctttc catgctacta 6900 gataagatgg atccctctaa gagagcacag tttatcgagg aggtcatgaa ggtcctgaaa 6960 tga 6963 <210> 5 <211> 446 <212> PRT <213> Artificial Sequence <220> <223> Oryza sativa L. HPPD protein amino acid sequence (amino acid sequence) <400> 5 Met Pro Pro Thr Pro Thr Pro Thr Ala Thr Thr Gly Ala Val Ser Ala 1 5 10 15 Ala Ala Ala Ala Gly Glu Asn Ala Gly Phe Arg Leu Val Gly His Arg 20 25 30 Arg Phe Val Arg Ala Asn Pro Arg Ser Asp Arg Phe Gln Ala Leu Ala 35 40 45 Phe His His Val Glu Leu Trp Cys Ala Asp Ala Ala Ser Ala Ala Gly 50 55 60 Arg Phe Ala Phe Ala Leu Gly Ala Pro Leu Ala Ala Arg Ser Asp Leu 65 70 75 80 Ser Thr Gly Asn Ser Ala His Ala Ser Leu Leu Leu Arg Ser Ala Ser 85 90 95 Val Ala Phe Leu Phe Thr Ala Pro Tyr Gly Gly Asp His Gly Val Gly 100 105 110 Ala Asp Ala Ala Thr Thr Ala Ser Ile Pro Ser Phe Ser Pro Gly Ala 115 120 125 Ala Arg Arg Phe Ala Ala Asp His Gly Leu Ala Val His Ala Val Ala 130 135 140 Leu Arg Val Ala Asp Ala Ala Asp Ala Phe Arg Ala Ser Val Ala Ala 145 150 155 160 Gly Ala Arg Pro Ala Phe Gln Pro Ala Asp Leu Gly Gly Gly Phe Gly 165 170 175 Leu Ala Glu Val Glu Leu Tyr Gly Asp Val Val Leu Arg Phe Val Ser 180 185 190 His Pro Asp Gly Ala Asp Ala Pro Phe Leu Pro Gly Phe Glu Gly Val 195 200 205 Ser Asn Pro Gly Ala Val Asp Tyr Gly Leu Arg Arg Phe Asp His Val 210 215 220 Val Gly Asn Val Pro Glu Leu Ala Pro Val Ala Ala Tyr Ile Ser Gly 225 230 235 240 Phe Thr Gly Phe His Glu Phe Ala Glu Phe Thr Ala Glu Asp Val Gly 245 250 255 Thr Ala Glu Ser Gly Leu Asn Ser Val Val Leu Ala Asn Asn Ala Glu 260 265 270 Thr Val Leu Leu Pro Leu Asn Glu Pro Val His Gly Thr Lys Arg Arg 275 280 285 Ser Gln Ile Gln Thr Tyr Leu Asp His His Gly Gly Pro Gly Val Gln 290 295 300 His Ile Ala Leu Ala Ser Asp Asp Val Leu Gly Thr Leu Arg Glu Met 305 310 315 320 Arg Ala Arg Ser Ala Met Gly Gly Phe Glu Phe Leu Ala Pro Pro Pro 325 330 335 Pro Asn Tyr Tyr Asp Gly Val Arg Arg Arg Ala Gly Asp Val Leu Ser 340 345 350 Glu Glu Gln Ile Asn Glu Cys Gln Glu Leu Gly Val Leu Val Asp Arg 355 360 365 Asp Asp Gln Gly Val Leu Leu Gln Ile Phe Thr Lys Pro Val Gly Asp 370 375 380 Arg Pro Thr Phe Phe Leu Glu Met Ile Gln Arg Ile Gly Cys Met Glu 385 390 395 400 Lys Asp Glu Ser Gly Gln Glu Tyr Gln Lys Gly Gly Cys Gly Gly Phe 405 410 415 Gly Lys Gly Asn Phe Ser Glu Leu Phe Lys Ser Ile Glu Glu Tyr Glu 420 425 430 Lys Ser Leu Glu Ala Lys Gln Ala Pro Thr Val Gln Gly Ser 435 440 445 <210> 6 <211> 2099 <212> DNA <213> Artificial Sequence <220> <223> Oryza sativa L. HPPD genome DNA sequence (DNA sequence) <400> 6 atgcctccca ctcccacccc caccgccacc accggcgccg tctcggccgc tgcggcggcg 60 ggggagaacg cggggttccg cctcgtcggg caccgccgct tcgtccgcgc caacccgcgg 120 agcgaccggt tccaggcgct cgcgttccac cacgtcgagc tctggtgcgc cgacgccgcg 180 tccgccgcgg gccggttcgc cttcgccctg ggcgcgccgc tcgccgccag gtccgacctc 240 tccacgggga actccgcgca cgcctccctc ctcctccgct ccgcctccgt cgcgttcctc 300 ttcaccgccc cctacggcgg cgaccacggc gtcggcgcgg acgcggccac caccgcctcc 360 atcccttcct tctccccagg cgccgcgcgg aggttcgccg cggaccacgg cctcgcggtg 420 cacgccgtgg cgctgcgcgt cgccgacgcg gccgacgcct tccgcgccag cgtcgcggcc 480 ggtgcgcgcc cggcgttcca gcccgccgac ctcggcggtg gcttcggcct cgcggaggtg 540 gagctctacg gcgacgtcgt gctccgcttc gtcagccacc cggacggcgc cgacgcgccc 600 ttcctcccgg gtttcgaggg cgtcagcaac ccgggcgccg tggactacgg cctccgccgg 660 ttcgaccacg tcgtcggcaa cgtgccggag ctcgctccgg tagccgcgta catctccggg 720 ttcaccgggt tccacgagtt cgccgagttc accgccgagg acgtgggcac cgccgagagc 780 ggcctcaact cggtggtgct cgccaacaac gcggagaccg tgctgctgcc gctcaacgag 840 ccggtgcacg gcaccaagcg gcggagccag atacagacgt acctggacca ccacggcggc 900 ccgggggtgc agcacatcgc gctggccagc gacgacgtgc tcgggacgct gagggagatg 960 cgggcgcgct ccgccatggg cggcttcgag ttcttggcgc cgccgccgcc caactactac 1020 gacggcgtgc ggcggcgcgc cggggacgtg ctctcggagg agcagatcaa cgagtgccag 1080 gagctcgggg tgctcgtgga cagggatgac cagggggtgt tgctccagat cttcaccaag 1140 ccagtaggag acaggtaaaa tcctcacctc tttcatgatg aaaatggctt atgaattcag 1200 atttgcagtt atttgttggc acatagcatc gattaggcgc agaaaggtgt caagcattat 1260 gaaattaatc cagaatgctt gaataataca gtataatata tgatagtgag ctctgtgata 1320 ctccatggat actctttatg tgtctccatg aatccatgat gcgcctttct gaagattgtg 1380 acactagaaa gggaataaag ctgaatgtgc ataggaaaaa aatgaaaagc caatgtgtgt 1440 ctgtttatgc cttcttgcaa gcatatccca gttccttttt gccggcatgt tgtaatgcag 1500 atagccagcc acatatagct acttaattag tgagtactcc ctctcacaat gtaagtcatt 1560 ctagtatttt ccacattcat attgatgcta atctatctag attcattagc atcaatatga 1620 atatgggaaa tactagaatg acttacattg tgaaacggag gaagtattac ttactacatc 1680 taaggtccat ggattccttt ttttacaaaa gaaagaaaga atcttatggc aactccatca 1740 gcataaacca gcaatgctgc tgggaacaac ttaaacttta ggttcaggag gttgtaattg 1800 tctttaagct taatagtctg attcagtcag tattctaatt tctgctgcat ctttgctatt 1860 gttatttcct ctctgtgact ccaaatctaa ctggatcagc tatttcactc aggccaacct 1920 ttttcttgga gatgatacaa aggattgggt gcatggagaa ggatgagagt gggcaggagt 1980 accagaaggg cggctgcggc gggtttggga agggcaactt ctcggagctg ttcaagtcca 2040 ttgaggagta tgagaaatcc cttgaagcca agcaagcccc tacagttcaa ggatcctag 2099 <210> 7 <211> 536 <212> PRT <213> Artificial Sequence <220> <223> Oryza sativa L. PPO1 protein amino acid sequence (amino acid sequence) <400> 7 Met Ala Ala Ala Ala Ala Ala Met Ala Thr Ala Thr Ser Ala Thr Ala 1 5 10 15 Ala Pro Pro Leu Arg Ile Arg Asp Ala Ala Arg Arg Thr Arg Arg Arg 20 25 30 Gly His Val Arg Cys Ala Val Ala Ser Gly Ala Ala Glu Ala Pro Ala 35 40 45 Ala Pro Gly Ala Arg Val Ser Ala Asp Cys Val Val Val Gly Gly Gly 50 55 60 Ile Ser Gly Leu Cys Thr Ala Gln Ala Leu Ala Thr Lys His Gly Val 65 70 75 80 Gly Asp Val Leu Val Thr Glu Ala Arg Ala Arg Pro Gly Gly Asn Ile 85 90 95 Thr Thr Ala Glu Arg Ala Gly Glu Gly Tyr Leu Trp Glu Glu Gly Pro 100 105 110 Asn Ser Phe Gln Pro Ser Asp Pro Val Leu Thr Met Ala Val Asp Ser 115 120 125 Gly Leu Lys Asp Asp Leu Val Phe Gly Asp Pro Asn Ala Pro Arg Phe 130 135 140 Val Leu Trp Glu Gly Lys Leu Arg Pro Val Pro Ser Lys Pro Gly Asp 145 150 155 160 Leu Pro Phe Phe Asp Leu Met Ser Ile Pro Gly Lys Leu Arg Ala Gly 165 170 175 Leu Gly Ala Leu Gly Val Arg Ala Pro Pro Pro Gly Arg Glu Glu Ser 180 185 190 Val Glu Asp Phe Val Arg Arg Asn Leu Gly Ala Glu Val Phe Glu Arg 195 200 205 Leu Ile Glu Pro Phe Cys Ser Gly Val Tyr Ala Gly Asp Pro Ser Lys 210 215 220 Leu Ser Met Lys Ala Ala Phe Gly Lys Val Trp Arg Leu Glu Asp Thr 225 230 235 240 Gly Gly Ser Ile Ile Gly Gly Thr Ile Lys Thr Ile Gln Glu Arg Gly 245 250 255 Lys Asn Pro Lys Pro Pro Arg Asp Pro Arg Leu Pro Thr Pro Lys Gly 260 265 270 Gln Thr Val Ala Ser Phe Arg Lys Gly Leu Thr Met Leu Pro Asp Ala 275 280 285 Ile Thr Ser Arg Leu Gly Ser Lys Val Lys Leu Ser Trp Lys Leu Thr 290 295 300 Ser Ile Thr Lys Ser Asp Asn Lys Gly Tyr Ala Leu Val Tyr Glu Thr 305 310 315 320 Pro Glu Gly Val Val Ser Val Gln Ala Lys Thr Val Val Met Thr Ile 325 330 335 Pro Ser Tyr Val Ala Ser Asp Ile Leu Arg Pro Leu Ser Ser Asp Ala 340 345 350 Ala Asp Ala Leu Ser Ile Phe Tyr Tyr Pro Pro Val Ala Ala Val Thr 355 360 365 Val Ser Tyr Pro Lys Glu Ala Ile Arg Lys Glu Cys Leu Ile Asp Gly 370 375 380 Glu Leu Gln Gly Phe Gly Gln Leu His Pro Arg Ser Gln Gly Val Glu 385 390 395 400 Thr Leu Gly Thr Ile Tyr Ser Ser Ser Leu Phe Pro Asn Arg Ala Pro 405 410 415 Ala Gly Arg Val Leu Leu Leu Asn Tyr Ile Gly Gly Ser Thr Asn Thr 420 425 430 Gly Ile Val Ser Lys Thr Glu Ser Glu Leu Val Glu Ala Val Asp Arg 435 440 445 Asp Leu Arg Lys Met Leu Ile Asn Pro Lys Ala Val Asp Pro Leu Val 450 455 460 Leu Gly Val Arg Val Trp Pro Gln Ala Ile Pro Gln Phe Leu Ile Gly 465 470 475 480 His Leu Asp His Leu Glu Ala Ala Lys Ser Ala Leu Gly Lys Gly Gly 485 490 495 Tyr Asp Gly Leu Phe Leu Gly Gly Asn Tyr Val Ala Gly Val Ala Leu 500 505 510 Gly Arg Cys Val Glu Gly Ala Tyr Glu Ser Ala Ser Gln Ile Ser Asp 515 520 525 Tyr Leu Thr Lys Tyr Ala Tyr Lys 530 535 <210> 8 <211> 3246 <212> DNA <213> Artificial Sequence <220> <223> Oryza sativa L. PPO1 genome DNA sequence (DNA sequence) <400> 8 atggccgccg ccgccgcagc catggccacc gccacctccg ccacggcagc gccgccgctc 60 cgcattcgcg acgccgcgag gaggacccgc cgacgcggcc acgttcgctg cgccgtcgcc 120 agcggcgcgg ccgaggcgcc cgcggcgccc ggggcgcggg tgtcggcgga ctgcgtcgtg 180 gtgggcggcg gcatcagcgg gctctgcacc gcgcaggcgc tggccacaaa gcacggcgtc 240 ggcgacgtgc tcgtcacgga ggcccgcgcc cgccccggcg gcaacatcac caccgccgag 300 cgcgccggcg agggctacct ctgggaggag gggcccaaca gcttccagcc ttccgacccc 360 gtcctcacca tggccgtacg tcttcttgct ccccttctct tctgattctc tcgcggcgga 420 gacgacatga atgggaatgg tggtgcatgg attggggcgc gcaggtggac agcgggctca 480 aggacgatct cgtgttcggg gaccccaacg cgccgcggtt cgtgctgtgg gaggggaagc 540 taaggccggt gccgtccaag cccggcgacc tgccgttctt cgacctcatg agcatccccg 600 gcaagctcag ggccggcctt ggcgcgctcg gcgttcgagc gccacctcca gtttgtgtgc 660 tctccccgct gtgcattctt gattcacttg tgaaattcga ttgtgctgag cgtttccggc 720 gaaggtttca ggggcgtgag gagtcggtgg aggacttcgt gcggcgcaac ctcggcgcgg 780 aggtctttga gcgcctcatt gagcctttct gctcaggtgt ttattgtagt gtgcaattgc 840 tgttttgttt ttgatgattc agataagaat acggtgattt cggtgcttag gtgtgtatgc 900 tggtgatcct tcaaagctca gtatgaaggc tgcatttggg aaggtgtgga ggctggagga 960 tactggaggt agcattattg gtggaaccat caaaacaatc caggagaggg ggaaaaaccc 1020 caaaccgccg agggatccgt gagtgagaaa ttgccttctt tgttggatta attgtccatt 1080 gtgttacact gatatgcctt caccattttt agccgccttc caacgccaaa ggggcagaca 1140 gttgcatctt tcaggaaggg tctgactatg ctcccggatg ctattacatc taggtttgtt 1200 atcattgtct ttgtaattta cctagttctt caactatgga tattaggtgc tgtagattgt 1260 tcagatagat gcacattgta caacaatcta ggtagattga ttgctatggc ttgttgaatt 1320 aactgtttca cttgcatcat tgcctcagca catatgaagc atatggatag attcttcaat 1380 catttatccc tcaataacac aattttgaca ccagtgcttc tccttttttt catcctgctt 1440 catctggcta tccacaatat aattaagcat acaaaagagg cactctttga tggacaattc 1500 atagtgttgt gggttaatat tcatttgcat tctttgaggg acaattcgtt acaccctaac 1560 atgaactagt aatgattggg gtgcttaacc atttgttctg catttcctcc attttcaggt 1620 tgggtagcaa agtcaaactt tcatggaagt tgacaagcat tacaaagtca gacaacaaag 1680 gatatgcatt agtgtatgaa acaccagaag gggtggtctc ggtgcaagct aaaactgttg 1740 tcatgaccat cccatcatat gttgctagtg atatcttgcg gccactttca gtaagttata 1800 tatatttaat taactttctg ttcccaaaat acactgcagc acttcattgc ttcctgaggt 1860 cctcgattca tttttcggta gacaggaagt agtattcatt tgcacttttt aagggattaa 1920 ttcaacatat ccactggaaa tatacatatc ctacacatcc tgtcaacata cttgctaaac 1980 agcattttgt ttgagttgac tggcatctca gcagccaatt actatcttta ggggacaagc 2040 cacattctta ataaatcctg tcggaaatca ctttttgatt tttatagatt agtgttgtca 2100 tagaatttgg cttggtgatc tacttggtaa ggttaactga ttcacaagtc ggacaatttc 2160 ttcaccaatc tagcagtatg tttaagtgtg ttggtactta attctaaatg tcctgcgcat 2220 ggtaacatat catatgcaaa aattcctcag taaccgaaat ttatactgta agttttaact 2280 gtctttacac tgttaatttt agacatactt cttccttgct tgttcattga acttgtttcc 2340 cccttccaca gagtgatgca gcagatgctc tgtcaatatt ctattatcca ccagttgctg 2400 ctgtaactgt ttcatatcca aaagaagcaa ttagaaaaga atgcttaatt gacggagagc 2460 tccagggttt cggccagctg catccgcgta gtcagggagt tgagacttta ggtacttata 2520 ggaattcaac cttattattc ttctaacata taaatgaact aatctttctt gtctagtttg 2580 catttattgt ggattaagtt tggttatatt gttcttacaa gtttgtggta ttattttgta 2640 taggaacaat atatagctca tcactctttc caaatcgtgc tccagctgga agggtgttac 2700 ttctgaacta cataggaggt tctacaaata cagggattgt ttccaaggta tcgctgtcaa 2760 gttgtttatt ttgcgactat atgattacag tatcctgttt ttcaactcca gctgctgtta 2820 gactgtcata ataaatctgc tactacatgt ttgcacacta tttgactgca tttaaaaact 2880 cagatagcct atatttttag ttgcctgcta ctgggtgtat ttctaatgat cccatcatgt 2940 ttgcagactg aaagtgagct ggtagaagca gttgaccgtg acctcaggaa gatgctgata 3000 aatcctaaag cagtggaccc tttggtcctt ggcgtccggg tatggccaca agccatacca 3060 cagttcctca ttggccatct tgatcatctt gaggctgcaa aatctgccct gggcaaaggt 3120 ggttatgatg gattgttcct cggagggaac tatgttgcag gagttgccct gggccgatgc 3180 gttgaaggtg catatgagag tgcctcacaa atatctgact acttgaccaa gtacgcctac 3240 aagtga 3246 <210> 9 <211> 587 <212> PRT <213> Artificial Sequence <220> <223> Oryza sativa L. TIR1 protein amino acid sequence (amino acid sequence) <400> 9 Met Gly Arg Gly Gly Ser Arg Ala Ala Cys Ala Ala Ala Ala Pro Pro 1 5 10 15 Trp His Ser Leu Pro Asp Glu Val Trp Glu His Ala Phe Ser Phe Leu 20 25 30 Pro Ala Ala Ala Asp Arg Gly Ala Ala Ala Gly Ala Cys Ser Ser Trp 35 40 45 Leu Arg Ala Glu Arg Arg Ser Arg Arg Arg Leu Ala Val Ala Asn Cys 50 55 60 Tyr Ala Ala Ala Pro Arg Asp Ala Val Glu Arg Phe Pro Ser Val Arg 65 70 75 80 Ala Ala Glu Val Lys Gly Lys Pro His Phe Ala Asp Phe Gly Leu Val 85 90 95 Pro Pro Ala Trp Gly Ala Ala Ala Ala Pro Trp Ile Ala Ala Ala Ala 100 105 110 Asp Gly Trp Pro Leu Leu Glu Glu Leu Ser Phe Lys Arg Met Val Val 115 120 125 Thr Asp Glu Cys Leu Glu Met Ile Ala Ala Ser Phe Arg Asn Phe Gln 130 135 140 Val Leu Arg Leu Val Ser Cys Asp Gly Phe Ser Thr Ala Gly Leu Ala 145 150 155 160 Ala Ile Ala Ala Gly Cys Arg His Leu Arg Glu Leu Asp Leu Gln Glu 165 170 175 Asn Glu Ile Glu Asp Cys Ser Ile His Trp Leu Ser Leu Phe Pro Glu 180 185 190 Ser Phe Thr Ser Leu Val Thr Leu Asn Phe Ser Cys Leu Glu Gly Glu 195 200 205 Val Asn Ile Thr Val Leu Glu Arg Leu Val Thr Arg Cys His Asn Leu 210 215 220 Lys Thr Leu Lys Leu Asn Asn Ala Ile Pro Leu Asp Lys Leu Ala Ser 225 230 235 240 Leu Leu His Lys Ala Pro Gln Leu Val Glu Leu Gly Thr Gly Lys Phe 245 250 255 Ser Ala Asp Tyr His Ser Asp Leu Phe Ala Lys Leu Glu Ala Ala Phe 260 265 270 Gly Gly Cys Lys Ser Leu Arg Arg Leu Ser Gly Ala Trp Asp Ala Val 275 280 285 Pro Asp Tyr Leu Pro Ala Phe Tyr Cys Val Cys Glu Gly Leu Thr Ser 290 295 300 Leu Asn Leu Ser Tyr Ala Thr Val Arg Gly Pro Glu Leu Ile Lys Phe 305 310 315 320 Ile Ser Arg Cys Arg Asn Leu Gln Gln Leu Trp Val Met Asp Leu Ile 325 330 335 Glu Asp His Gly Leu Ala Val Val Ala Ser Ser Cys Asn Lys Leu Gln 340 345 350 Glu Leu Arg Val Phe Pro Ser Asp Pro Phe Gly Ala Gly Phe Leu Thr 355 360 365 Glu Arg Gly Leu Val Asp Val Ser Ala Ser Cys Pro Met Leu Glu Ser 370 375 380 Val Leu Tyr Phe Cys Arg Arg Met Thr Asn Glu Ala Leu Ile Thr Ile 385 390 395 400 Ala Lys Asn Arg Pro Asn Phe Thr Cys Phe Arg Leu Cys Ile Leu Glu 405 410 415 Pro His Thr Pro Asp Tyr Ile Thr Arg Glu Pro Leu Asp Ala Gly Phe 420 425 430 Ser Ala Ile Val Glu Ser Cys Arg Gly Leu Arg Arg Leu Ser Ile Ser 435 440 445 Gly Leu Leu Thr Asp Leu Val Phe Lys Ser Ile Gly Ala His Ala Asp 450 455 460 Arg Leu Glu Met Leu Ser Ile Ala Phe Ala Gly Asn Ser Asp Leu Gly 465 470 475 480 Leu His Tyr Ile Leu Ser Gly Cys Lys Ser Leu Lys Lys Leu Glu Ile 485 490 495 Arg Asp Cys Pro Phe Gly Asp Lys Pro Leu Leu Ala Asn Ala Ala Lys 500 505 510 Leu Glu Thr Met Arg Ser Leu Trp Met Ser Ser Cys Leu Leu Thr Leu 515 520 525 Gly Ala Cys Arg Gln Leu Ala Arg Lys Met Pro Arg Leu Ser Val Glu 530 535 540 Ile Met Asn Asp Pro Gly Arg Ser Cys Pro Leu Asp Ser Leu Pro Asp 545 550 555 560 Glu Thr Pro Val Glu Lys Leu Tyr Val Tyr Arg Thr Ile Ala Gly Pro 565 570 575 Arg Ser Asp Thr Pro Ala Cys Val Gln Ile Val 580 585 <210> 10 <211> 5791 <212> DNA <213> Artificial Sequence <220> <223> Oryza sativa L. TIR1 genome DNA sequence (DNA sequence) <400> 10 atggggcgcg gcggctcgcg cgcggcgtgc gccgccgcgg cgccgccgtg gcactcgctc 60 ccggacgagg tctgggagca cgccttctcc ttcctccccg ccgccgcgga caggggcgcc 120 gcggcggggg cgtgcagctc gtggctccgc gccgagcgcc ggtcgcgccg ccgcctcgcc 180 gtcgccaact gctacgccgc cgcgccgcgg gacgccgtcg agcggttccc gtccgtgcgc 240 gccgccgagg tcaagggcaa gccccacttc gccgacttcg gcctcgtccc ccccgcctgg 300 ggcgccgccg cggcgccgtg gatcgccgcc gccgccgacg ggtggccgct gctcgaggag 360 ctcagcttca agcgcatggt cgtcaccgac gagtgcctcg agatgatcgc cgcgtccttc 420 aggaacttcc aggtgctccg cctcgtctcc tgcgacggct tcagcaccgc gggcctcgcc 480 gccattgctg ccggttgcag gtgaggtgga gagtgttgtt tgggtcaaat ctttttagct 540 aaataagcat gggatctttg ggttgttctt ggatttgaga ggaatctttc acggcccaag 600 ctttgattcg tcttcttttt agctaaaaca tgacagattt cttggtgcca tttctttctt 660 cacagtgttc tttagtgagt tcatggtcta gctgaagtga tttgttcttc catgattcct 720 atattaactt tgttttgaac ttcattgagt agtatgtgga agtagatgtg gctttctgct 780 aagatttgat ctattcttgg tgtttaattt gcaaagggac agtttttttt tctgtttact 840 tgtgtatgat ctggatttac ttttggtgtt tcctaagttg aagaccaaga agtcttcttg 900 tgacagtatt ttagatgctt ataacgtgtt aatgtcaaag gaatgattcc catgaaaatt 960 ctgctgtgat ttgtacattt tattaggagt taagtaacag agtgaattga gtgatgctca 1020 cgtcttcttt aaatcttagc tatgatttgt tcctaggaag ctttgacttg tatttgagtg 1080 cctggtttgc gaagatgtga ttctcttgca cggatctgtg tgattgacag aagaaatatt 1140 tctacctgtt taagcaatga tggatccatc tctttgtttc tttttgtgct ttttacccaa 1200 aagaatggga tatttcaagt ttacaaacaa ctggtgatgc gcctttataa ttttgggctt 1260 ttttaaaaga atgtattctt cccatcatga gttactagat ctgagttgaa ctgttttcct 1320 ttatattttc ctgatattta agtgaatttg ttgagttcct atcctgattt gaacttccag 1380 attctaaaga accaggtctt ttaagcatgt ttttgtcatg tagattccca gtttatcccc 1440 tccccctcct tttgtgctca agaatctact accttttatc ttgcttttgg tgagggaaag 1500 tgatttttgc tccaatattt gtgatgtcct catgtaatgg acagttaaaa caaacagatt 1560 tgttcttgcg agtatcttct ggactccccc cagaaaagaa ttaggaatgt gtgggattcc 1620 tatcattggg gaatttatat cctaaaccag atagaaggat ctaatagtgg gagtttcgat 1680 cctgattcat ccattagtag tagtttaata tgccaaagca gtatcatttg catcattttg 1740 aggaactcga aacagttgaa ctgtgaagtt taactactgt acacttcaaa caggcagatt 1800 agaataggtt gtgagataac taaatttggt tcggtgatcg tataaggcca tattcttgga 1860 tattaggacg aaatgagcct gagcaccaca tgtgtacttg ctgatggttg agaacttagc 1920 atagatacta gtttttatgc tagactagag ggctactggt acattcactt gtttgataaa 1980 tccagatgta tttaagtttt gattcaaaat attttgactc tagattggag actacatttt 2040 agagcattca aaatttacaa tggaagcagg attttagcaa aactattttc atacatttac 2100 tctgttattg agccagaatc attttttagt tcttgctact tttttgttaa cactgttatg 2160 catgtaaact cagcgttaca tttatttcaa ttacaaggat ctacacttgt agctctgggt 2220 gcagatggta gttaacattg atgaatctta gctatatcga aatactatct tctaagtaca 2280 aacttttctt gtgtgattct tatccttgtt gttactgttg ctacttatat ccattgattg 2340 agcatgcttt gaattacctt aagaatttct ctctccagtc aaatttattt gactttgaga 2400 gaactgtgtt tatttctccc aacgtcaaat gttttgaatt ttgaatggac agagtatgta 2460 gtagtgggca gcacattggt gccctagctg caaataaaac cttttttttt tgttaaaaca 2520 atgattatga ggatgtcggt ttacactgtc cactcagaaa tttgacttga ttatggatag 2580 ggtacacctt gttgttttag atggttcctt cttaacaaga tgctagattt tgatgatttg 2640 attctttaca aggagtagtc taaaatactg gaagtgtcaa cttaaaaagt tcaaacttgc 2700 cctagccata cgtgatacat tagacaactg atgtgctgtg ttatctgcaa ctgacaatta 2760 ttgttgttgc tatctccttt ttttgcttta gagtaggcag gtattttgtg tcaactaaaa 2820 gtgtgtttca cgtgttgcct ttcttaatac cttttgaata atagggtata agaaaatttt 2880 catgaatggt ttgctttcca attgttgatg ttgctttcct tcaccttatt ttttaaacca 2940 ccatgattaa tctatttatc taggtaatat tgctcatgct gattcatgat acgtggtaaa 3000 aaaataggtc ttttcaactt tcagaggctg ctggactcca tttatttagt tgattttgat 3060 ccctacaccg attttatcca ttggtttata ttcactgcta acatatgata ctcgctatca 3120 tttacttcac tgttgatcat caatgtttta attttgacca ttattaactt ttatatgatt 3180 aatttagtat taatgaaagt tgtgcggttg tatttatggc atgacacaca tttctaacat 3240 ggcatacttt taagcataca taactttttt tgtaaaaagg acaagcgatc aaaggtaaaa 3300 aggtgaatag catacagtga gaagtatttg agaccaaagg gagtataatc attatctact 3360 aaacaaatac aataccattc attataagct gagttcgcat agtgtaattg aaagtgggga 3420 atgctagtat agctcacaca tgaaatcaag tccctgtgaa atgatagtaa accctacgtg 3480 ttcattgttt tagtcttatg atatgttcca gttatgtttg ccatggttgt tgaatgcagt 3540 agtcaaagtt tgcttctgtt tgtttgagtg gattctcatt taccttgcct tttccaccat 3600 atactcatat gggctttgtt tcacaagtga taacattggt taatggctat atgctatcct 3660 tacagtttca ttcttctttt aagatatgag tcaccatgca catttcttca acttctgatt 3720 ttgtctaata ttgcagacac ctaagagaac ttgacctgca agagaacgag attgaggatt 3780 gttctattca ttggctcagc ctcttcccgg aatcgttcac ttctctagta actctaaact 3840 tttcatgctt agagggggag gtcaatatca ctgtacttga acggttagtg accagatgtc 3900 acaacctgaa gactcttaag ctcaacaatg ctatccccct tgacaagctt gctagcctcc 3960 ttcataaggc tcctcagcta gttgaactcg gaactggcaa attctctgct gattaccatt 4020 ccgatctgtt tgcaaagctg gaggcggcgt ttggaggttg taaaagcttg agaaggcttt 4080 ctggggcttg ggatgctgtt ccagattatc tgccagcatt ctattgtgta tgtgaaggcc 4140 tcacatcact taatctgagt tatgctactg tgcgaggtcc tgagctcatc aaattcatta 4200 gtagatgcag aaatttgcaa caattatggg tatgcaactc ttgtcaattc ttttttacta 4260 ctatgtattc atcccattcg aatctgttaa cttttgaaaa actgttgcat atctctttgc 4320 aatacaagca cttgattccc tacaagtgga ttttgcaaat tttttctttt cttctgtgac 4380 ctccagtaaa aaagttcctg atgttttctt acttatcatg gtcactagta aaagtccgac 4440 tacatgtatt cttttttcac aatgtagttt tatcaattat attggtatag ggctgcaata 4500 gcattttatg atgaaactga ctgcactttt cccatgacaa caagaatttg tggcttggaa 4560 taatctattg agtgttaaat catgcatatg tttttcatgt ttgtcaatac agttttgtag 4620 gatgcatgtt acattcaatg gcatgctgtt gggtgcctcc aatgaataga ttgaaattac 4680 cactcttatc ttttggggaa gtaggatatt tatatggaaa aaacatagat gacaatggta 4740 tcctatcctt attagaatca ttgtgaaaag actgccagat gaatccattt gctctagggc 4800 agcattcttt gcctttcttg gcaaactgag ttattgtctg aaccctcata gtttccatcc 4860 tttaactgtt aactgctaga tgagttgctt gctctacggc agatatttta aactgaatta 4920 tgatctgaac cccaatggct attaacctgg tcatgttagc tctttatgca atcttttttc 4980 tctatatttt tcttctaaaa gttaagctgc aatttttcag gtgatggacc tcattgagga 5040 tcatggttta gctgttgtgg catcatcttg caataaactt caagagttgc gggtcttccc 5100 ttctgaccct tttggtgcag gattcttgac tgaaagaggt cttgttgatg tctctgcaag 5160 ttgtccaatg ttggagtcag tgctctactt ctgcagacgg atgacaaatg aggcacttat 5220 taccattgca aagaaccgtc ccaacttcac ttgcttccgc ctatgcatcc ttgagccaca 5280 cactccagac tacatcacac gggagcctct tgatgcaggt ttcagcgcca ttgtggagtc 5340 atgcaggggc cttaggcgtc tctctatctc aggccttctc acagatcttg tgtttaaatc 5400 cattggggca catgctgatc gtcttgagat gctttcaatc gccttcgctg ggaacagcga 5460 cttgggcctg cattacatcc tctcaggctg caagagcctg aagaaactgg agatcaggga 5520 ctgcccattt ggtgataagc cattgctggc gaacgcagca aagctggaga caatgcgatc 5580 cctttggatg tcgtcgtgct tgttgaccct gggcgcatgc cgacagcttg cacgcaagat 5640 gccccgcctt agtgtggaga tcatgaacga tcctggaagg tcatgcccct tggattcgct 5700 tccggatgaa acacctgttg agaaactgta cgtctaccgg acgatcgcag gtccaaggtc 5760 cgacacacca gcctgcgtcc agattgtgta g 5791 <210> 11 <211> 644 <212> PRT <213> Artificial Sequence <220> <223> Oryza sativa L. ALS protein amino acid sequence (amino acid sequence) <400> 11 Met Ala Thr Thr Ala Ala Ala Ala Ala Ala Thr Leu Ser Ala Ala Ala 1 5 10 15 Thr Ala Lys Thr Gly Arg Lys Asn His Gln Arg His His Val Leu Pro 20 25 30 Ala Arg Gly Arg Val Gly Ala Ala Ala Val Arg Cys Ser Ala Val Ser 35 40 45 Pro Val Thr Pro Pro Ser Pro Ala Pro Pro Ala Thr Pro Leu Arg Pro 50 55 60 Trp Gly Pro Ala Glu Pro Arg Lys Gly Ala Asp Ile Leu Val Glu Ala 65 70 75 80 Leu Glu Arg Cys Gly Val Ser Asp Val Phe Ala Tyr Pro Gly Gly Ala 85 90 95 Ser Met Glu Ile His Gln Ala Leu Thr Arg Ser Pro Val Ile Thr Asn 100 105 110 His Leu Phe Arg His Glu Gln Gly Glu Ala Phe Ala Ala Ser Gly Tyr 115 120 125 Ala Arg Ala Ser Gly Arg Val Gly Val Cys Val Ala Thr Ser Gly Pro 130 135 140 Gly Ala Thr Asn Leu Val Ser Ala Leu Ala Asp Ala Leu Leu Asp Ser 145 150 155 160 Val Pro Met Val Ala Ile Thr Gly Gln Val Pro Arg Arg Met Ile Gly 165 170 175 Thr Asp Ala Phe Gln Glu Thr Pro Ile Val Glu Val Thr Arg Ser Ile 180 185 190 Thr Lys His Asn Tyr Leu Val Leu Asp Val Glu Asp Ile Pro Arg Val 195 200 205 Ile Gln Glu Ala Phe Phe Leu Ala Ser Ser Gly Arg Pro Gly Pro Val 210 215 220 Leu Val Asp Ile Pro Lys Asp Ile Gln Gln Gln Met Ala Val Pro Val 225 230 235 240 Trp Asp Thr Ser Met Asn Leu Pro Gly Tyr Ile Ala Arg Leu Pro Lys 245 250 255 Pro Pro Ala Thr Glu Leu Leu Glu Gln Val Leu Arg Leu Val Gly Glu 260 265 270 Ser Arg Arg Pro Ile Leu Tyr Val Gly Gly Gly Cys Ser Ala Ser Gly 275 280 285 Asp Glu Leu Arg Arg Phe Val Glu Leu Thr Gly Ile Pro Val Thr Thr 290 295 300 Thr Leu Met Gly Leu Gly Asn Phe Pro Ser Asp Asp Pro Leu Ser Leu 305 310 315 320 Arg Met Leu Gly Met His Gly Thr Val Tyr Ala Asn Tyr Ala Val Asp 325 330 335 Lys Ala Asp Leu Leu Leu Ala Phe Gly Val Arg Phe Asp Asp Arg Val 340 345 350 Thr Gly Lys Ile Glu Ala Phe Ala Ser Arg Ala Lys Ile Val His Ile 355 360 365 Asp Ile Asp Pro Ala Glu Ile Gly Lys Asn Lys Gln Pro His Val Ser 370 375 380 Ile Cys Ala Asp Val Lys Leu Ala Leu Gln Gly Leu Asn Ala Leu Leu 385 390 395 400 Asp Gln Ser Thr Thr Lys Thr Ser Ser Asp Phe Ser Ala Trp His Asn 405 410 415 Glu Leu Asp Gln Gln Lys Arg Glu Phe Pro Leu Gly Tyr Lys Thr Phe 420 425 430 Gly Glu Glu Ile Pro Pro Gln Tyr Ala Ile Gln Val Leu Asp Glu Leu 435 440 445 Thr Lys Gly Glu Ala Ile Ile Ala Thr Gly Val Gly Gln His Gln Met 450 455 460 Trp Ala Ala Gln Tyr Tyr Thr Tyr Lys Arg Pro Arg Gln Trp Leu Ser 465 470 475 480 Ser Ala Gly Leu Gly Ala Met Gly Phe Gly Leu Pro Ala Ala Ala Gly 485 490 495 Ala Ser Val Ala Asn Pro Gly Val Thr Val Val Asp Ile Asp Gly Asp 500 505 510 Gly Ser Phe Leu Met Asn Ile Gln Glu Leu Ala Leu Ile Arg Ile Glu 515 520 525 Asn Leu Pro Val Lys Val Met Val Leu Asn Asn Gln His Leu Gly Met 530 535 540 Val Val Gln Trp Glu Asp Arg Phe Tyr Lys Ala Asn Arg Ala His Thr 545 550 555 560 Tyr Leu Gly Asn Pro Glu Cys Glu Ser Glu Ile Tyr Pro Asp Phe Val 565 570 575 Thr Ile Ala Lys Gly Phe Asn Ile Pro Ala Val Arg Val Thr Lys Lys 580 585 590 Ser Glu Val Arg Ala Ala Ile Lys Lys Met Leu Glu Thr Pro Gly Pro 595 600 605 Tyr Leu Leu Asp Ile Ile Val Pro His Gln Glu His Val Leu Pro Met 610 615 620 Ile Pro Asn Gly Gly Ala Phe Lys Asp Met Ile Leu Asp Gly Asp Gly 625 630 635 640 Arg Thr Met Tyr <210> 12 <211> 1935 <212> DNA <213> Artificial Sequence <220> <223> Oryza sativa L. ALS gene DNA sequence (DNA sequence) <400> 12 atggctacga ccgccgcggc cgcggccgcc accttgtccg ccgccgcgac ggccaagacc 60 ggccgtaaga accaccagcg acaccacgtc cttcccgctc gaggccgggt gggggcggcg 120 gcggtcaggt gctcggcggt gtccccggtc accccgccgt ccccggcgcc gccggccacg 180 ccgctccggc cgtgggggcc ggccgagccc cgcaagggcg cggacatcct cgtggaggcg 240 ctggagcggt gcggcgtcag cgacgtgttc gcctacccgg gcggcgcgtc catggagatc 300 caccaggcgc tgacgcgctc cccggtcatc accaaccacc tcttccgcca cgagcagggc 360 gaggcgttcg cggcgtccgg gtacgcgcgc gcgtccggcc gcgtcggggt ctgcgtcgcc 420 acctccggcc ccggggcaac caacctcgtg tccgcgctcg ccgacgcgct gctcgactcc 480 gtcccgatgg tcgccatcac gggccaggtc ccccgccgca tgatcggcac cgacgccttc 540 caggagacgc ccatagtcga ggtcacccgc tccatcacca agcacaatta ccttgtcctt 600 gatgtggagg acatcccccg cgtcatacag gaagccttct tcctcgcgtc ctcgggccgt 660 cctggcccgg tgctggtcga catccccaag gacatccagc agcagatggc tgtgccagtc 720 tgggacacct cgatgaatct accggggtac attgcacgcc tgcccaagcc acccgcgaca 780 gaattgcttg agcaggtctt gcgtctggtt ggcgagtcac ggcgcccgat tctctatgtc 840 ggtggtggct gctctgcatc tggtgatgaa ttgcgccggt ttgttgagct gaccggcatc 900 ccagttacaa ccactctgat gggcctcggc aatttcccca gtgatgatcc gttgtccctg 960 cgcatgcttg ggatgcatgg cacggtgtac gcaaattatg cggtggataa ggctgacctg 1020 ttgcttgcat ttggcgtgcg gtttgatgat cgtgtgacag ggaaaattga ggcttttgca 1080 agcagggcca agattgtgca cattgacatt gatccagcgg agattggaaa gaacaagcaa 1140 ccacatgtgt caatttgcgc agatgttaag cttgctttac agggcttgaa tgctctgcta 1200 gaccagagca caacaaagac aagttctgat tttagtgcat ggcacaatga gttggaccag 1260 cagaagaggg agtttcctct ggggtacaag acttttggtg aagagatccc accgcaatat 1320 gctattcagg tgctggatga gctgacgaaa ggggaggcaa tcatcgctac tggtgttgga 1380 cagcaccaga tgtgggcggc acaatattac acctacaagc ggccacggca gtggctgtct 1440 tcggctggtc tgggcgcaat gggatttggg ctgcctgctg cagctggtgc ttctgtggct 1500 aacccaggtg tcacagttgt tgatattgat ggggatggta gcttcctcat gaacattcag 1560 gagttggcat tgatccgcat tgagaacctc ccggtgaagg tgatggtgtt gaacaaccaa 1620 catttgggta tggttgtgca atgggaggat aggttttaca aggcaaatag ggcgcataca 1680 tacttgggca acccagaatg tgagagcgag atatatccag attttgtgac tattgctaaa 1740 gggttcaata ttcctgcagt ccgtgtaaca aagaagagtg aagtccgtgc cgccatcaag 1800 aagatgctcg agaccccagg gccatacttg ttggatatca tcgtcccaca ccaggagcat 1860 gtgctgccta tgatcccaaa tgggggcgca ttcaaggaca tgatcctgga tggtgatggc 1920 aggactatgt attaa 1935 <210> 13 <211> 2327 <212> PRT <213> Artificial Sequence <220> <223> Oryza sativa L. ACCase2 protein amino acid sequence (amino acid sequence) <400> 13 Met Thr Ser Thr His Val Ala Thr Leu Gly Val Gly Ala Gln Ala Pro 1 5 10 15 Pro Arg His Gln Lys Lys Ser Ala Gly Thr Ala Phe Val Ser Ser Gly 20 25 30 Ser Ser Arg Pro Ser Tyr Arg Lys Asn Gly Gln Arg Thr Arg Ser Leu 35 40 45 Arg Glu Glu Ser Asn Gly Gly Val Ser Asp Ser Lys Lys Leu Asn His 50 55 60 Ser Ile Arg Gln Gly Leu Ala Gly Ile Ile Asp Leu Pro Asn Asp Ala 65 70 75 80 Ala Ser Glu Val Asp Ile Ser His Gly Ser Glu Asp Pro Arg Gly Pro 85 90 95 Thr Val Pro Gly Ser Tyr Gln Met Asn Gly Ile Ile Asn Glu Thr His 100 105 110 Asn Gly Arg His Ala Ser Val Ser Lys Val Val Glu Phe Cys Thr Ala 115 120 125 Leu Gly Gly Lys Thr Pro Ile His Ser Val Leu Val Ala Asn Asn Gly 130 135 140 Met Ala Ala Ala Lys Phe Met Arg Ser Val Arg Thr Trp Ala Asn Asp 145 150 155 160 Thr Phe Gly Ser Glu Lys Ala Ile Gln Leu Ile Ala Met Ala Thr Pro 165 170 175 Glu Asp Leu Arg Ile Asn Ala Glu His Ile Arg Ile Ala Asp Gln Phe 180 185 190 Val Glu Val Pro Gly Gly Thr Asn Asn Asn Asn Tyr Ala Asn Val Gln 195 200 205 Leu Ile Val Glu Ile Ala Glu Arg Thr Gly Val Ser Ala Val Trp Pro 210 215 220 Gly Trp Gly His Ala Ser Glu Asn Pro Glu Leu Pro Asp Ala Leu Thr 225 230 235 240 Ala Lys Gly Ile Val Phe Leu Gly Pro Pro Ala Ser Ser Met His Ala 245 250 255 Leu Gly Asp Lys Val Gly Ser Ala Leu Ile Ala Gln Ala Ala Gly Val 260 265 270 Pro Thr Leu Ala Trp Ser Gly Ser His Val Glu Val Pro Leu Glu Cys 275 280 285 Cys Leu Asp Ser Ile Pro Asp Glu Met Tyr Arg Lys Ala Cys Val Thr 290 295 300 Thr Thr Glu Glu Ala Val Ala Ser Cys Gln Val Val Gly Tyr Pro Ala 305 310 315 320 Met Ile Lys Ala Ser Trp Gly Gly Gly Gly Lys Gly Ile Arg Lys Val 325 330 335 His Asn Asp Asp Glu Val Arg Thr Leu Phe Lys Gln Val Gln Gly Glu 340 345 350 Val Pro Gly Ser Pro Ile Phe Ile Met Arg Leu Ala Ala Gln Ser Arg 355 360 365 His Leu Glu Val Gln Leu Leu Cys Asp Gln Tyr Gly Asn Val Ala Ala 370 375 380 Leu His Ser Arg Asp Cys Ser Val Gln Arg Arg His Gln Lys Ile Ile 385 390 395 400 Glu Glu Gly Pro Val Thr Val Ala Pro Arg Glu Thr Val Lys Glu Leu 405 410 415 Glu Gln Ala Ala Arg Arg Leu Ala Lys Ala Val Gly Tyr Val Gly Ala 420 425 430 Ala Thr Val Glu Tyr Leu Tyr Ser Met Glu Thr Gly Glu Tyr Tyr Phe 435 440 445 Leu Glu Leu Asn Pro Arg Leu Gln Val Glu His Pro Val Thr Glu Trp 450 455 460 Ile Ala Glu Val Asn Leu Pro Ala Ala Gln Val Ala Val Gly Met Gly 465 470 475 480 Ile Pro Leu Trp Gln Ile Pro Glu Ile Arg Arg Phe Tyr Gly Met Asn 485 490 495 His Gly Gly Gly Tyr Asp Leu Trp Arg Lys Thr Ala Ala Leu Ala Thr 500 505 510 Pro Phe Asn Phe Asp Glu Val Asp Ser Lys Trp Pro Lys Gly His Cys 515 520 525 Val Ala Val Arg Ile Thr Ser Glu Asp Pro Asp Asp Gly Phe Lys Pro 530 535 540 Thr Gly Gly Lys Val Lys Glu Ile Ser Phe Lys Ser Lys Pro Asn Val 545 550 555 560 Trp Ala Tyr Phe Ser Val Lys Ser Gly Gly Gly Ile His Glu Phe Ala 565 570 575 Asp Ser Gln Phe Gly His Val Phe Ala Tyr Gly Thr Thr Arg Ser Ala 580 585 590 Ala Ile Thr Thr Met Ala Leu Ala Leu Lys Glu Val Gln Ile Arg Gly 595 600 605 Glu Ile His Ser Asn Val Asp Tyr Thr Val Asp Leu Leu Asn Ala Ser 610 615 620 Asp Phe Arg Glu Asn Lys Ile His Thr Gly Trp Leu Asp Thr Arg Ile 625 630 635 640 Ala Met Arg Val Gln Ala Glu Arg Pro Pro Trp Tyr Ile Ser Val Val 645 650 655 Gly Gly Ala Leu Tyr Lys Thr Val Thr Ala Asn Thr Ala Thr Val Ser 660 665 670 Asp Tyr Val Gly Tyr Leu Thr Lys Gly Gln Ile Pro Pro Lys His Ile 675 680 685 Ser Leu Val Tyr Thr Thr Val Ala Leu Asn Ile Asp Gly Lys Lys Tyr 690 695 700 Thr Ile Asp Thr Val Arg Ser Gly His Gly Ser Tyr Arg Leu Arg Met 705 710 715 720 Asn Gly Ser Thr Val Asp Ala Asn Val Gln Ile Leu Cys Asp Gly Gly 725 730 735 Leu Leu Met Gln Leu Asp Gly Asn Ser His Val Ile Tyr Ala Glu Glu 740 745 750 Glu Ala Ser Gly Thr Arg Leu Leu Ile Asp Gly Lys Thr Cys Met Leu 755 760 765 Gln Asn Asp His Asp Pro Ser Lys Leu Leu Ala Glu Thr Pro Cys Lys 770 775 780 Leu Leu Arg Phe Leu Val Ala Asp Gly Ala His Val Asp Ala Asp Val 785 790 795 800 Pro Tyr Ala Glu Val Glu Val Met Lys Met Cys Met Pro Leu Leu Ser 805 810 815 Pro Ala Ser Gly Val Ile His Val Val Met Ser Glu Gly Gln Ala Met 820 825 830 Gln Ala Gly Asp Leu Ile Ala Arg Leu Asp Leu Asp Asp Pro Ser Ala 835 840 845 Val Lys Arg Ala Glu Pro Phe Glu Asp Thr Phe Pro Gln Met Gly Leu 850 855 860 Pro Ile Ala Ala Ser Gly Gln Val His Lys Leu Cys Ala Ala Ser Leu 865 870 875 880 Asn Ala Cys Arg Met Ile Leu Ala Gly Tyr Glu His Asp Ile Asp Lys 885 890 895 Val Val Pro Glu Leu Val Tyr Cys Leu Asp Thr Pro Glu Leu Pro Phe 900 905 910 Leu Gln Trp Glu Glu Leu Met Ser Val Leu Ala Thr Arg Leu Pro Arg 915 920 925 Asn Leu Lys Ser Glu Leu Glu Gly Lys Tyr Glu Glu Tyr Lys Val Lys 930 935 940 Phe Asp Ser Gly Ile Ile Asn Asp Phe Pro Ala Asn Met Leu Arg Val 945 950 955 960 Ile Ile Glu Glu Asn Leu Ala Cys Gly Ser Glu Lys Glu Lys Ala Thr 965 970 975 Asn Glu Arg Leu Val Glu Pro Leu Met Ser Leu Leu Lys Ser Tyr Glu 980 985 990 Gly Gly Arg Glu Ser His Ala His Phe Val Val Lys Ser Leu Phe Glu 995 1000 1005 Glu Tyr Leu Tyr Val Glu Glu Leu Phe Ser Asp Gly Ile Gln Ser Asp 1010 1015 1020 Val Ile Glu Arg Leu Arg Leu Gln His Ser Lys Asp Leu Gln Lys Val 1025 1030 1035 1040 Val Asp Ile Val Leu Ser His Gln Ser Val Arg Asn Lys Thr Lys Leu 1045 1050 1055 Ile Leu Lys Leu Met Glu Ser Leu Val Tyr Pro Asn Pro Ala Ala Tyr 1060 1065 1070 Arg Asp Gln Leu Ile Arg Phe Ser Ser Leu Asn His Lys Ala Tyr Tyr 1075 1080 1085 Lys Leu Ala Leu Lys Ala Ser Glu Leu Leu Glu Gln Thr Lys Leu Ser 1090 1095 1100 Glu Leu Arg Ala Arg Ile Ala Arg Ser Leu Ser Glu Leu Glu Met Phe 1105 1110 1115 1120 Thr Glu Glu Ser Lys Gly Leu Ser Met His Lys Arg Glu Ile Ala Ile 1125 1130 1135 Lys Glu Ser Met Glu Asp Leu Val Thr Ala Pro Leu Pro Val Glu Asp 1140 1145 1150 Ala Leu Ile Ser Leu Phe Asp Cys Ser Asp Thr Thr Val Gln Gln Arg 1155 1160 1165 Val Ile Glu Thr Tyr Ile Ala Arg Leu Tyr Gln Pro His Leu Val Lys 1170 1175 1180 Asp Ser Ile Lys Met Lys Trp Ile Glu Ser Gly Val Ile Ala Leu Trp 1185 1190 1195 1200 Glu Phe Pro Glu Gly His Phe Asp Ala Arg Asn Gly Gly Ala Val Leu 1205 1210 1215 Gly Asp Lys Arg Trp Gly Ala Met Val Ile Val Lys Ser Leu Glu Ser 1220 1225 1230 Leu Ser Met Ala Ile Arg Phe Ala Leu Lys Glu Thr Ser His Tyr Thr 1235 1240 1245 Ser Ser Glu Gly Asn Met Met His Ile Ala Leu Leu Gly Ala Asp Asn 1250 1255 1260 Lys Met His Ile Ile Gln Glu Ser Gly Asp Asp Ala Asp Arg Ile Ala 1265 1270 1275 1280 Lys Leu Pro Leu Ile Leu Lys Asp Asn Val Thr Asp Leu His Ala Ser 1285 1290 1295 Gly Val Lys Thr Ile Ser Phe Ile Val Gln Arg Asp Glu Ala Arg Met 1300 1305 1310 Thr Met Arg Arg Thr Phe Leu Trp Ser Asp Glu Lys Leu Ser Tyr Glu 1315 1320 1325 Glu Glu Pro Ile Leu Arg His Val Glu Pro Pro Leu Ser Ala Leu Leu 1330 1335 1340 Glu Leu Asp Lys Leu Lys Val Lys Gly Tyr Asn Glu Met Lys Tyr Thr 1345 1350 1355 1360 Pro Ser Arg Asp Arg Gln Trp His Ile Tyr Thr Leu Arg Asn Thr Glu 1365 1370 1375 Asn Pro Lys Met Leu His Arg Val Phe Phe Arg Thr Leu Val Arg Gln 1380 1385 1390 Pro Ser Val Ser Asn Lys Phe Ser Ser Gly Gln Ile Gly Asp Met Glu 1395 1400 1405 Val Gly Ser Ala Glu Glu Pro Leu Ser Phe Thr Ser Thr Ser Ile Leu 1410 1415 1420 Arg Ser Leu Met Thr Ala Ile Glu Glu Leu Glu Leu His Ala Ile Arg 1425 1430 1435 1440 Thr Gly His Ser His Met Tyr Leu His Val Leu Lys Glu Gln Lys Leu 1445 1450 1455 Leu Asp Leu Val Pro Val Ser Gly Asn Thr Val Leu Asp Val Gly Gln 1460 1465 1470 Asp Glu Ala Thr Ala Tyr Ser Leu Leu Lys Glu Met Ala Met Lys Ile 1475 1480 1485 His Glu Leu Val Gly Ala Arg Met His His Leu Ser Val Cys Gln Trp 1490 1495 1500 Glu Val Lys Leu Lys Leu Asp Cys Asp Gly Pro Ala Ser Gly Thr Trp 1505 1510 1515 1520 Arg Ile Val Thr Thr Asn Val Thr Ser His Thr Cys Thr Val Asp Ile 1525 1530 1535 Tyr Arg Glu Met Glu Asp Lys Glu Ser Arg Lys Leu Val Tyr His Pro 1540 1545 1550 Ala Thr Pro Ala Ala Gly Pro Leu His Gly Val Ala Leu Asn Asn Pro 1555 1560 1565 Tyr Gln Pro Leu Ser Val Ile Asp Leu Lys Arg Cys Ser Ala Arg Asn 1570 1575 1580 Asn Arg Thr Thr Tyr Cys Tyr Asp Phe Pro Leu Ala Phe Glu Thr Ala 1585 1590 1595 1600 Val Arg Lys Ser Trp Ser Ser Ser Thr Ser Gly Ala Ser Lys Gly Val 1605 1610 1615 Glu Asn Ala Gln Cys Tyr Val Lys Ala Thr Glu Leu Val Phe Ala Asp 1620 1625 1630 Lys His Gly Ser Trp Gly Thr Pro Leu Val Gln Met Asp Arg Pro Ala 1635 1640 1645 Gly Leu Asn Asp Ile Gly Met Val Ala Trp Thr Leu Lys Met Ser Thr 1650 1655 1660 Pro Glu Phe Pro Ser Gly Arg Glu Ile Ile Val Val Ala Asn Asp Ile 1665 1670 1675 1680 Thr Phe Arg Ala Gly Ser Phe Gly Pro Arg Glu Asp Ala Phe Phe Glu 1685 1690 1695 Ala Val Thr Asn Leu Ala Cys Glu Lys Lys Leu Pro Leu Ile Tyr Leu 1700 1705 1710 Ala Ala Asn Ser Gly Ala Arg Ile Gly Ile Ala Asp Glu Val Lys Ser 1715 1720 1725 Cys Phe Arg Val Gly Trp Ser Asp Asp Gly Ser Pro Glu Arg Gly Phe 1730 1735 1740 Gln Tyr Ile Tyr Leu Ser Glu Glu Asp Tyr Ala Arg Ile Gly Thr Ser 1745 1750 1755 1760 Val Ile Ala His Lys Met Gln Leu Asp Ser Gly Glu Ile Arg Trp Val 1765 1770 1775 Ile Asp Ser Val Val Gly Lys Glu Asp Gly Leu Gly Val Glu Asn Ile 1780 1785 1790 His Gly Ser Ala Ala Ile Ala Ser Ala Tyr Ser Arg Ala Tyr Lys Glu 1795 1800 1805 Thr Phe Thr Leu Thr Phe Val Thr Gly Arg Thr Val Gly Ile Gly Ala 1810 1815 1820 Tyr Leu Ala Arg Leu Gly Ile Arg Cys Ile Gln Arg Leu Asp Gln Pro 1825 1830 1835 1840 Ile Ile Leu Thr Gly Tyr Ser Ala Leu Asn Lys Leu Leu Gly Arg Glu 1845 1850 1855 Val Tyr Ser Ser His Met Gln Leu Gly Gly Pro Lys Ile Met Ala Thr 1860 1865 1870 Asn Gly Val Val His Leu Thr Val Ser Asp Asp Leu Glu Gly Val Ser 1875 1880 1885 Asn Ile Leu Arg Trp Leu Ser Tyr Val Pro Ala Tyr Ile Gly Gly Pro 1890 1895 1900 Leu Pro Val Thr Thr Pro Leu Asp Pro Pro Asp Arg Pro Val Ala Tyr 1905 1910 1915 1920 Ile Pro Glu Asn Ser Cys Asp Pro Arg Ala Ala Ile Arg Gly Val Asp 1925 1930 1935 Asp Ser Gln Gly Lys Trp Leu Gly Gly Met Phe Asp Lys Asp Ser Phe 1940 1945 1950 Val Glu Thr Phe Glu Gly Trp Ala Lys Thr Val Val Thr Gly Arg Ala 1955 1960 1965 Lys Leu Gly Gly Ile Pro Val Gly Val Ile Ala Val Glu Thr Gln Thr 1970 1975 1980 Met Met Gln Thr Ile Pro Ala Asp Pro Gly Gln Leu Asp Ser Arg Glu 1985 1990 1995 2000 Gln Ser Val Pro Arg Ala Gly Gln Val Trp Phe Pro Asp Ser Ala Thr 2005 2010 2015 Lys Thr Ala Gln Ala Leu Leu Asp Phe Asn Arg Glu Gly Leu Pro Leu 2020 2025 2030 Phe Ile Leu Ala Asn Trp Arg Gly Phe Ser Gly Gly Gln Arg Asp Leu 2035 2040 2045 Phe Glu Gly Ile Leu Gln Ala Gly Ser Thr Ile Val Glu Asn Leu Arg 2050 2055 2060 Thr Tyr Asn Gln Pro Ala Phe Val Tyr Ile Pro Met Ala Ala Glu Leu 2065 2070 2075 2080 Arg Gly Gly Ala Trp Val Val Val Asp Ser Lys Ile Asn Pro Asp Arg 2085 2090 2095 Ile Glu Cys Tyr Ala Glu Arg Thr Ala Lys Gly Asn Val Leu Glu Pro 2100 2105 2110 Gln Gly Leu Ile Glu Ile Lys Phe Arg Ser Glu Glu Leu Gln Asp Cys 2115 2120 2125 Met Ser Arg Leu Asp Pro Thr Leu Ile Asp Leu Lys Ala Lys Leu Glu 2130 2135 2140 Val Ala Asn Lys Asn Gly Ser Ala Asp Thr Lys Ser Leu Gln Glu Asn 2145 2150 2155 2160 Ile Glu Ala Arg Thr Lys Gln Leu Met Pro Leu Tyr Thr Gln Ile Ala 2165 2170 2175 Ile Arg Phe Ala Glu Leu His Asp Thr Ser Leu Arg Met Ala Ala Lys 2180 2185 2190 Gly Val Ile Lys Lys Val Val Asp Trp Glu Glu Ser Arg Ser Phe Phe 2195 2200 2205 Tyr Lys Arg Leu Arg Arg Arg Ile Ser Glu Asp Val Leu Ala Lys Glu 2210 2215 2220 Ile Arg Ala Val Ala Gly Glu Gln Phe Ser His Gln Pro Ala Ile Glu 2225 2230 2235 2240 Leu Ile Lys Lys Trp Tyr Ser Ala Ser His Ala Ala Glu Trp Asp Asp 2245 2250 2255 Asp Asp Ala Phe Val Ala Trp Met Asp Asn Pro Glu Asn Tyr Lys Asp 2260 2265 2270 Tyr Ile Gln Tyr Leu Lys Ala Gln Arg Val Ser Gln Ser Leu Ser Ser 2275 2280 2285 Leu Ser Asp Ser Ser Ser Asp Leu Gln Ala Leu Pro Gln Gly Leu Ser 2290 2295 2300 Met Leu Leu Asp Lys Met Asp Pro Ser Arg Arg Ala Gln Leu Val Glu 2305 2310 2315 2320 Glu Ile Arg Lys Val Leu Gly 2325 <210> 14 <211> 11927 <212> DNA <213> Artificial Sequence <220> <223> Oryza sativa L. ACCase2 genome DNA sequence (DNA Sequence) <400> 14 atgacatcca cacatgtggc gacattggga gttggtgccc aggcacctcc tcgtcaccag 60 aaaaagtcag ctggcactgc atttgtatca tctgggtcat caagaccctc ataccgaaag 120 aatggtcagc gtactcggtc acttagggaa gaaagcaatg gaggagtgtc tgattccaaa 180 aagcttaacc actctattcg ccaaggtgac cactagctac tttacatatg ctataatttg 240 tgccaaacat aaacatgcaa tggctgctat tatttaaacg ttaatgttga aatagctgct 300 ataggataca gcaaaaatat ataattgact gggcaagatg caacaattgt ttttcactaa 360 agttagttat cttttgctgt aaaagacaac tgttttttac ataaaatggt attaataacc 420 ttgtaatatt caatgcaaca tgttctcaag taaaaaaaaa cattgcctgg ttgtataagc 480 aaatgtgtcg ttgtagacat cttattaaac ctttttgtga tatctattac cgtagggaac 540 aggggagctg tttaaatctg ttatcataga gtaatatgag aaaagtggat tgtgcgactt 600 tggcatgtat acctgctcaa tttcaaatat atgtctatgt gcaggtcttg ctggcatcat 660 tgacctccca aatgacgcag cttcagaagt tgatatttca cagtaaggac tttatatttt 720 ataataatta ttatataatt ttctgacatg ttttgagaac ctcaaaacat gtgattgcac 780 cttccttttt tatgtctggt tcagaaactg ataagttttg acagtgttta ggatggatct 840 ttgatgcgca cagtgctttc taatgttttc atttttgaaa gtaatgtttt aggaagaaat 900 atctgattaa atttatactt tatctttaca aaagtcaaat gcgttctgta tcaattgcgg 960 tttgtaatat ggcaagaaca tgctttcaga atttgttcat acaatgcttt ctttctatta 1020 ttatgtagaa caaataccta atactttgtt caccttttat agtggacacc tctcacagct 1080 ttttcagtaa gtgatgcaat tttgtacatt tgtaagatgt gttccagaaa ccttttctcc 1140 tgcaattcta atgtacccac tcaaactggt atcaccaaag atctccatct gattgaaaaa 1200 aagctgcgtg aagtatgctt atttatgcta accatacatg atttatactg ttttatagta 1260 caatgcttat ttatgctaac catacataat tttattctgt tttctagtac attatttgtg 1320 cccctgacca taaatgatcc tttcttttac agtggttccg aagatcccag ggggcctacg 1380 gtcccaggtt cctaccaaat gaatgggatt atcaatgaaa cacataatgg gaggcatgct 1440 tcagtctcca aggttgttga gttttgtacg gcacttggtg gcaaaacacc aattcacagt 1500 gtattagtgg ccaacaatgg aatggcagca gctaagttca tgcggagtgt ccgaacatgg 1560 gctaatgata cttttggatc agagaaggca attcagctga tagctatggc aactccggag 1620 gatctgagga taaatgcaga gcacatcaga attgccgatc aatttgtaga ggtacctggt 1680 ggaacaaaca acaacaacta tgcaaatgtc caactcatag tggaggttag ttcagctcat 1740 ccctcaacac aacattttcg tttctattta agttagggaa aaatctctac gaccctccaa 1800 tttctgaaca tccaattttc accatcaact gcaatcacag atagcagaga gaacaggtgt 1860 ttctgctgtt tggcctggtt ggggtcatgc atctgagaat cctgaacttc cagatgcgct 1920 gactgcaaaa ggaattgttt ttcttgggcc accagcatca tcaatgcatg cattaggaga 1980 caaggttggc tcagctctca ttgctcaagc agctggagtt ccaacacttg cttggagtgg 2040 atcacatgtg agccttgtct tctctttttt agcttatcat cttatctttt cggtgatgca 2100 ttatcccaat gacactaaac cataggtgga agttcctctg gagtgttgct tggactcaat 2160 acctgatgag atgtatagaa aagcttgtgt tactaccaca gaggaagcag ttgcaagttg 2220 tcaggtggtt ggttatcctg ccatgattaa ggcatcttgg ggtggtggtg gtaaaggaat 2280 aaggaaggtt tgttcttctt gtagttatca agagattgtt tggattgcaa gtgtttagtg 2340 cccatagtta actctggtct ttctaacatg agtaactcaa ctttcttgca ggttcataat 2400 gatgatgagg ttaggacatt atttaagcaa gttcaaggcg aagtacctgg ttccccaata 2460 tttatcatga ggctagctgc tcaggtgggg ccttttatgg aagttacacc ttttccctta 2520 atgttgagtt attccggagt tattatggtt atgttctgta tgtttgatct gtaaattatt 2580 gaaattcacc tccattggtt ctccagatta gcagacctac aattctacat atggtttata 2640 ctttataaat actaggattt agggatcttc atatagttta tacatggtat ttagatttca 2700 tttgtaaccc tattgaagac atcctgattg ttgtcttatg tagagtcgac atcttgaagt 2760 tcagttgctt tgtgatcaat atggcaacgt agcagcactt cacagtcgag attgcagtgt 2820 acaacggcga caccaaaagg tctgctgtct cagttaaatc acccctctga atgatctact 2880 tcttgcctgc tgcgttggtc agaggaataa tggttgtatt ctactgaaca gataatcgag 2940 gaaggaccag ttactgttgc tcctcgtgag actgtgaaag agcttgagca ggcagcacgg 3000 aggcttgcta aagctgtggg ttatgttggt gctgctactg ttgaatacct ttacagcatg 3060 gaaactggtg aatattattt tctggaactt aatccacggc tacaggtcgg ctcctttgac 3120 attcttcagg aattaatttc tgttgaccac atgatttaca ttgtcaaatg gtctcacagg 3180 ttgagcatcc tgtcactgag tggatagctg aagtaaattt gcctgcggct caagttgctg 3240 ttggaatggg tatacccctt tggcagattc caggtaatgc ttcttcattt agttcctgct 3300 ctttgttaat tgaatgagct cttatacaga ccatgagaca cattctactg ttaattcata 3360 gtatcccctg acttgttagt gttagagata cagagatgta tcacaaattc attgtatctc 3420 ctcaaggact gtaaaaatcc tataattaaa tttctgaaaa tttgttcttt taagcagaaa 3480 aaaaatctct aaattatctc cctgtataca gagatcaggc gcttctacgg aatgaaccat 3540 ggaggaggct atgacctttg gaggaaaaca gcagctctag cgactccatt taactttgat 3600 gaagtagatt ctaaatggcc aaaaggccac tgcgtagctg ttagaataac tagcgaggat 3660 ccagatgatg ggtttaagcc tactggtgga aaagtaaagg tgcggtttcc tgatgttagg 3720 tgtatgaatt gaacacattg ctatattgca gctagtgaaa tgactggatc atggttctct 3780 tattttcagg agataagttt caagagtaaa ccaaatgttt gggcctattt ctcagtaaag 3840 gtagtcctca atattgttgc actgccacat tatttgagtt gtcctaacaa ttgtgctgca 3900 attgttagtt ttcaactatt tgttgttctg tttggttgac tggtaccctc tctttgcagt 3960 ctggtggagg catccatgaa ttcgctgatt ctcagttcgg tatgtaaagt taaaagagta 4020 atattgtctt tgctatttat gtttgtcctc acttttaaaa gatattgcct tccattacag 4080 gacatgtttt tgcgtatgga actactagat cggcagcaat aactaccatg gctcttgcac 4140 taaaagaggt tcaaattcgt ggagaaattc attcaaacgt agactacaca gttgacctat 4200 taaatgtaag gactaaatat ctgcttattg aaccttgctt tttggttccc taatgccatt 4260 ttagtctggc tactgaagaa cttatccatc atgccatttc tgttatctta aattcaggcc 4320 tcagatttta gagaaaataa gattcatact ggttggctgg ataccaggat agccatgcgt 4380 gttcaagctg agaggcctcc atggtatatt tcagtcgttg gaggggcttt atatgtaaga 4440 caaactatgc cactcattag catttatgtg aagcaaatgc ggaaaacatg atcaatatgt 4500 cgtcttattt aaatttattt atttttgtgc tgcagaaaac agtaactgcc aacacggcca 4560 ctgtttctga ttatgttggt tatcttacca agggccagat tccaccaaag gtactattct 4620 gttttttcag gatatgaatg ctgtttgaat gtgaaaacca ttgaccataa atccttgttt 4680 gcagcatata tcccttgtct atacgactgt tgctttgaat atagatggga aaaaatatac 4740 agtaagtgtg acattcttaa tggggaaact taatttgttg taaataatca atatcatatt 4800 gactcgtgta tgctgcatca tagatcgata ctgtgaggag tggacatggt agctacagat 4860 tgcgaatgaa tggatcaacg gttgacgcaa atgtacaaat attatgtgat ggtgggcttt 4920 taatgcaggt aatatcttct tcctagttaa agaagatata tcttgttcaa agaattctga 4980 ttattgatct tttaatgttt tcagctggat ggaaacagcc atgtaattta tgctgaagaa 5040 gaggccagtg gtacacgact tcttattgat ggaaagacat gcatgttaca ggtaatgata 5100 gccttgttct ttttagttct agtcacggtg tttgcttgct atttgttgta tctatttaat 5160 gcattcacta attactatat tagtttgcat catcaagtta aaatggaact tctttcttgc 5220 agaatgacca tgacccatca aagttattag ctgagacacc atgcaaactt cttcgtttct 5280 tggttgctga tggtgctcat gttgatgctg atgtaccata tgcggaagtt gaggttatga 5340 agatgtgcat gcccctctta tcacccgctt ctggtgtcat acatgttgta atgtctgagg 5400 gccaagcaat gcaggtacat tcctacattc cattcattgt gctgtgctga catgaacatt 5460 tcaagtaaat acctgtaact tgtttattat tctaggctgg tgatcttata gctaggctgg 5520 atcttgatga cccttctgct gttaagagag ctgagccgtt cgaagatact tttccacaaa 5580 tgggtctccc tattgctgct tctggccaag ttcacaaatt atgtgctgca agtctgaatg 5640 cttgtcgaat gatccttgcg gggtatgagc atgatattga caaggtaaac atcatgtcct 5700 cttgtttttt cttttgttta tcatgcattc ttatgttcat catgtcctct ggcaaatcta 5760 gattccgctg tcgtttcaca cagatttttc tcattctcat aatggtgcca aacataaata 5820 tgctgctata ttcatcaatg ttttcactcg atttctaatt ttgcttttga gttttaaact 5880 ttagtacaat ccatatctaa tctcctttgg caacagtgaa tccattatat atatttttat 5940 taaactgctt tctttttcag gttgtgccag agttggtata ctgcctagac actccggagc 6000 ttcctttcct gcagtgggag gagcttatgt ctgttttagc aactagactt ccaagaaatc 6060 ttaaaagtga ggtatattat ggttgacaag atagctagtc tcatgctcta aggacttgta 6120 catttcgcca cataggttaa ttttccatat caagttctaa tgtacgatat aaaagtagta 6180 ctggcctaaa acagtattgg tggttgacta tctttgttgt gtaagatcaa gtatttcttt 6240 ttcatgctta gtttgtcaat acttcacatt tatcactgac ttgtcgagct aaatgagatt 6300 ttatttgatt tctgtgctcc attatttttg tatatatata tatatattta actatgacta 6360 tatgttatgc ctcaaacgtt tcaaactctt tcagttggag ggcaaatatg aggaatacaa 6420 agtaaaattt gactctggga taatcaatga tttccctgcc aatatgctac gagtgataat 6480 tgaggtcagt tattcaattt gttgtgataa tcactgcctt aactgttcgt tcttttaaca 6540 agcggtttta taggaaaatc ttgcatgtgg ttctgagaag gagaaggcta caaatgagag 6600 gcttgttgag cctcttatga gcctactgaa gtcatatgag ggtgggagag aaagtcatgc 6660 tcactttgtt gtcaagtccc tttttgagga gtatctctat gttgaagaat tgttcagtga 6720 tggaattcag gttaacttac ctattcgcat taaacaaatc atcagttgtt ttatgataaa 6780 gtcaaaatgt ttatatttcc cattcttctg tggatcaaat atatcacgga catgatatag 6840 tttccttagg ctatataatg gttcttcatc aaataatatt gcaggaaaca gtatagcaaa 6900 ctatttgtat atactcgaga tggaaattgt tagaaacatc attgactaaa tctgtccttt 6960 gttacgctgt ttttgtagtc tgatgtgatt gagcgtctgc gccttcaaca tagtaaagac 7020 ctacagaagg tcgtagacat tgtgttgtcc caccaggtaa atttcttcat ggtctgatga 7080 cttcactgcg aatggttact gaactgtctt cttgttctga caatgtgact tttctttgta 7140 gagtgttaga aataaaacta agctgatact aaaactcatg gagagtctgg tctatccaaa 7200 tcctgctgcc tacagggatc aattgattcg cttttcttcc cttaatcaca aagcgtatta 7260 caaggtgacc aggataaaca taaataaacg tgaatttttc aatgaccttt tcttctgaca 7320 tctgaatctg atgaatttct tgcatattaa tacagttggc acttaaagct agtgaacttc 7380 ttgaacaaac aaaacttagt gagctccgtg caagaatagc aaggagcctt tcagagctgg 7440 agatgtttac tgaggaaagc aagggtctct ccatgcataa gcgagaaatt gccattaagg 7500 agagcatgga agatttagtc actgctccac tgccagttga agatgcgctc atttctttat 7560 ttgattgtag tgatacaact gttcaacaga gagtgattga gacttatata gctcgattat 7620 accaggtatg agaagaaaga ccttttgaaa ttatttatat taacatatcc tagtaaaaca 7680 gcatgctcat catttcttaa aaaaagttta cagcacctga tgtttggtta ctgaccgcat 7740 cattaaaata aagttacttg ttgtggagag atgtattttg gaacttgtgg cacatgcagt 7800 aacatgctac tgctcgatat gtttgctaac ttgacaacaa tatttttcag cctcatcttg 7860 taaaggacag tatcaaaatg aaatggatag aatcgggtgt tattgcttta tgggaatttc 7920 ctgaagggca ttttgatgca agaaatggag gagcggttct tggtgacaaa agatggggtg 7980 ccatggtcat tgtcaagtct cttgaatcac tttcaatggc cattagattt gcactaaagg 8040 agacatcaca ctacactagc tctgagggca atatgatgca tattgctttg ttgggtgctg 8100 ataataagat gcatataatt caagaaaggt atgttcatat gctatgttgg tgctgaaata 8160 gttatatatg tagttagctg gtggagttct ggtaattaac ctatcccatt gttcagtggt 8220 gatgatgctg acagaatagc caaacttccc ttgatactaa aggataatgt aaccgatctg 8280 catgcctctg gtgtgaaaac aataagtttc attgttcaaa gagatgaagc acggatgaca 8340 atgcgtcgta ccttcctttg gtctgatgaa aagctttctt atgaggaaga gccaattctc 8400 cggcatgtgg aacctcctct ttctgcactt cttgagttgg tacgtgatat catcaaaatg 8460 ataatgtttt ggtatggcat tgattatctt ctatgctctt tgtatttatt cagcctattg 8520 tggatacagg acaagttgaa agtgaaagga tacaatgaaa tgaagtatac cccatcacgg 8580 gatcgtcaat ggcatatcta cacacttaga aatactgaaa accccaaaat gttgcaccgg 8640 gtatttttcc gaacccttgt caggcaaccc agtgtatcca acaagttttc ttcgggccag 8700 attggtgaca tggaagttgg gagtgctgaa gaacctctgt catttacatc aaccagcata 8760 ttaagatctt tgatgactgc tatagaggaa ttggagcttc acgcaattag aactggccat 8820 tcacacatgt atttgcatgt attgaaagaa caaaagcttc ttgatcttgt tccagtttca 8880 gggtaagtgc gcatatttct ttttgggaac atatgcttgc ttatgaggtt ggtcttctca 8940 atgatcttct tatcttactc aggaatacag ttttggatgt tggtcaagat gaagctactg 9000 catattcact tttaaaagaa atggctatga agatacatga acttgttggt gcaagaatgc 9060 accatctttc tgtatgccaa tgggaagtga aacttaagtt ggactgcgat ggtcctgcca 9120 gtggtacctg gaggattgta acaaccaatg ttactagtca cacttgcact gtggatgtaa 9180 gtttaatcct ctagcatttt gttttctttg gaaaagcatg tgattttaag ccggctggtc 9240 ctcataccca gacctagtga tctttatata gtgtagacat ttttctaact gcttttaatt 9300 gttttagatc taccgtgaga tggaagataa agaatcacgg aagttagtat accatcccgc 9360 cactccggcg gctggtcctc tgcatggtgt ggcactgaat aatccatatc agcctttgag 9420 tgtcattgat ctcaaacgct gttctgctag gaataataga actacatact gctatgattt 9480 tccactggtg agttgactgc tcccttatat tcaatgcatt accatagcaa attcatattc 9540 gttcatgttg tcaaaataag ccgatgaaaa ttcaaaactg taggcatttg aaactgcagt 9600 gaggaagtca tggtcctcta gtacctctgg tgcttctaaa ggtgttgaaa atgcccaatg 9660 ttatgttaaa gctacagagt tggtatttgc ggacaaacat gggtcatggg gcactccttt 9720 agttcaaatg gaccggcctg ctgggctcaa tgacattggt atggtagctt ggaccttgaa 9780 gatgtccact cctgaatttc ctagtggtag ggagattatt gttgttgcaa atgatattac 9840 gttcagagct ggatcatttg gcccaaggga agatgcattt tttgaagctg ttaccaacct 9900 agcctgtgag aagaaacttc ctcttattta tttggcagca aattctggtg ctcgaattgg 9960 catagcagat gaagtgaaat cttgcttccg tgttgggtgg tctgatgatg gcagccctga 10020 acgtgggttt cagtacattt atctaagcga agaagactat gctcgtattg gcacttctgt 10080 catagcacat aagatgcagc tagacagtgg tgaaattagg tgggttattg attctgttgt 10140 gggcaaggaa gatggacttg gtgtggagaa tatacatgga agtgctgcta ttgccagtgc 10200 ttattctagg gcatataagg agacatttac acttacattt gtgactggaa gaactgttgg 10260 aataggagct tatcttgctc gacttggcat ccggtgcata cagcgtcttg accagcctat 10320 tattcttaca ggctattctg cactgaacaa gcttcttggg cgggaagtgt acagctccca 10380 catgcagttg ggtggtccca aaatcatggc aactaatggt gttgtccatc ttactgtttc 10440 agatgacctt gaaggcgttt ctaatatatt gaggtggctc agttatgttc ctgcctacat 10500 tggtggacca cttccagtaa caacaccgtt ggacccaccg gacagacctg ttgcatacat 10560 tcctgagaac tcgtgtgatc ctcgagcggc tatccgtggt gttgatgaca gccaagggaa 10620 atggttaggt ggtatgtttg ataaagacag ctttgtggaa acatttgaag gttgggctaa 10680 gacagtggtt actggcagag caaagcttgg tggaattcca gtgggtgtga tagctgtgga 10740 gactcagacc atgatgcaaa ctatccctgc tgaccctggt cagcttgatt cccgtgagca 10800 atctgttcct cgtgctggac aagtgtggtt tccagattct gcaaccaaga ctgcgcaggc 10860 attgctggac ttcaaccgtg aaggattacc tctgttcatc ctcgctaact ggagaggctt 10920 ctctggtgga caaagagatc tttttgaagg aattcttcag gctggctcga ctattgttga 10980 gaaccttagg acatacaatc agcctgcctt tgtctacatt cccatggctg cagagctacg 11040 aggaggggct tgggttgtgg ttgatagcaa gataaaccca gaccgcattg agtgctatgc 11100 tgagaggact gcaaaaggca atgttctgga accgcaaggg ttaattgaga tcaagttcag 11160 gtcagaggaa ctccaggatt gcatgagtcg gcttgaccca acattaattg atctgaaagc 11220 aaaactcgaa gtagcaaata aaaatggaag tgctgacaca aaatcgcttc aagaaaatat 11280 agaagctcga acaaaacagt tgatgcctct atatactcag attgcgatac ggtttgctga 11340 attgcatgat acatccctca gaatggctgc gaaaggtgtg attaagaaag ttgtggactg 11400 ggaagaatca cgatctttct tctataagag attacggagg aggatctctg aggatgttct 11460 tgcaaaagaa attagagctg tagcaggtga gcagttttcc caccaaccag caatcgagct 11520 gatcaagaaa tggtattcag cttcacatgc agctgaatgg gatgatgacg atgcttttgt 11580 tgcttggatg gataaccctg aaaactacaa ggattatatt caatatctta aggctcaaag 11640 agtatcccaa tccctctcaa gtctttcaga ttccagctca gatttgcaag ccctgccaca 11700 gggtctttcc atgttactag ataaggtaat tagcttactg atgcttatat aaattctttt 11760 tcattacata tggctggaga actatctaat caaataatga ttataattcc aatcgttctt 11820 tttatgccat tatgatcttc tgaaatttcc ttctttggac acttattcag atggatccct 11880 ctagaagagc tcaacttgtt gaagaaatca ggaaggtcct tggttga 11927 <210> 15 <211> 4203 <212> DNA <213> Artificial Sequence <220> <223> SpCas9 DNA sequence (DNA sequence) <400> 15 atggctccga agaagaagag gaaggttggc atccacgggg tgccagctgc tgacaagaag 60 tactcgatcg gcctcgatat tgggactaac tctgttggct gggccgtgat caccgacgag 120 tacaaggtgc cctcaaagaa gttcaaggtc ctgggcaaca ccgatcggca ttccatcaag 180 aagaatctca ttggcgctct cctgttcgac agcggcgaga cggctgaggc tacgcggctc 240 aagcgcaccg cccgcaggcg gtacacgcgc aggaagaatc gcatctgcta cctgcaggag 300 attttctcca acgagatggc gaaggttgac gattctttct tccacaggct ggaggagtca 360 ttcctcgtgg aggaggataa gaagcacgag cggcatccaa tcttcggcaa cattgtcgac 420 gaggttgcct accacgagaa gtaccctacg atctaccatc tgcggaagaa gctcgtggac 480 tccacagata aggcggacct ccgcctgatc tacctcgctc tggcccacat gattaagttc 540 aggggccatt tcctgatcga gggggatctc aacccggaca atagcgatgt tgacaagctg 600 ttcatccagc tcgtgcagac gtacaaccag ctcttcgagg agaaccccat taatgcgtca 660 ggcgtcgacg cgaaggctat cctgtccgct aggctctcga agtctcggcg cctcgagaac 720 ctgatcgccc agctgccggg cgagaagaag aacggcctgt tcgggaatct cattgcgctc 780 agcctggggc tcacgcccaa cttcaagtcg aatttcgatc tcgctgagga cgccaagctg 840 cagctctcca aggacacata cgacgatgac ctggataacc tcctggccca gatcggcgat 900 cagtacgcgg acctgttcct cgctgccaag aatctgtcgg acgccatcct cctgtctgat 960 attctcaggg tgaacaccga gattacgaag gctccgctct cagcctccat gatcaagcgc 1020 tacgacgagc accatcagga tctgaccctc ctgaaggcgc tggtcaggca gcagctcccc 1080 gagaagtaca aggagatctt cttcgatcag tcgaagaacg gctacgctgg gtacattgac 1140 ggcggggcct ctcaggagga gttctacaag ttcatcaagc cgattctgga gaagatggac 1200 ggcacggagg agctgctggt gaagctcaat cgcgaggacc tcctgaggaa gcagcggaca 1260 ttcgataacg gcagcatccc acaccagatt catctcgggg agctgcacgc tatcctgagg 1320 aggcaggagg acttctaccc tttcctcaag gataaccgcg agaagatcga gaagattctg 1380 actttcagga tcccgtacta cgtcggccca ctcgctaggg gcaactcccg cttcgcttgg 1440 atgacccgca agtcagagga gacgatcacg ccgtggaact tcgaggaggt ggtcgacaag 1500 ggcgctagcg ctcagtcgtt catcgagagg atgacgaatt tcgacaagaa cctgccaaat 1560 gagaaggtgc tccctaagca ctcgctcctg tacgagtact tcacagtcta caacgagctg 1620 actaaggtga agtatgtgac cgagggcatg aggaagccgg ctttcctgtc tggggagcag 1680 aagaaggcca tcgtggacct cctgttcaag accaaccgga aggtcacggt taagcagctc 1740 aaggaggact acttcaagaa gattgagtgc ttcgattcgg tcgagatctc tggcgttgag 1800 gaccgcttca acgcctccct ggggacctac cacgatctcc tgaagatcat taaggataag 1860 gacttcctgg acaacgagga gaatgaggat atcctcgagg acattgtgct gacactcact 1920 ctgttcgagg accgggagat gatcgaggag cgcctgaaga cttacgccca tctcttcgat 1980 gacaaggtca tgaagcagct caagaggagg aggtacaccg gctgggggag gctgagcagg 2040 aagctcatca acggcattcg ggacaagcag tccgggaaga cgatcctcga cttcctgaag 2100 agcgatggct tcgcgaaccg caatttcatg cagctgattc acgatgacag cctcacattc 2160 aaggaggata tccagaaggc tcaggtgagc ggccaggggg actcgctgca cgagcatatc 2220 gcgaacctcg ctggctcgcc agctatcaag aaggggattc tgcagaccgt gaaggttgtg 2280 gacgagctgg tgaaggtcat gggcaggcac aagcctgaga acatcgtcat tgagatggcc 2340 cgggagaatc agaccacgca gaagggccag aagaactcac gcgagaggat gaagaggatc 2400 gaggagggca ttaaggagct ggggtcccag atcctcaagg agcacccggt ggagaacacg 2460 cagctgcaga atgagaagct ctacctgtac tacctccaga atggccgcga tatgtatgtg 2520 gaccaggagc tggatattaa caggctcagc gattacgacg tcgatcatat cgttccacag 2580 tcattcctga aggatgactc cattgacaac aaggtcctca ccaggtcgga caagaaccgg 2640 ggcaagtctg ataatgttcc ttcagaggag gtcgttaaga agatgaagaa ctactggcgc 2700 cagctcctga atgccaagct gatcacgcag cggaagttcg ataacctcac aaaggctgag 2760 aggggcgggc tctctgagct ggacaaggcg ggcttcatca agaggcagct ggtcgagaca 2820 cggcagatca ctaagcacgt tgcgcagatt ctcgactcac ggatgaacac taagtacgat 2880 gagaatgaca agctgatccg cgaggtgaag gtcatcaccc tgaagtcaaa gctcgtctcc 2940 gacttcagga aggatttcca gttctacaag gttcgggaga tcaacaatta ccaccatgcc 3000 catgacgcgt acctgaacgc ggtggtcggc acagctctga tcaagaagta cccaaagctc 3060 gagagcgagt tcgtgtacgg ggactacaag gtttacgatg tgaggaagat gatcgccaag 3120 tcggagcagg agattggcaa ggctaccgcc aagtacttct tctactctaa cattatgaat 3180 ttcttcaaga cagagatcac tctggccaat ggcgagatcc ggaagcgccc cctcatcgag 3240 acgaacggcg agacggggga gatcgtgtgg gacaagggca gggatttcgc gaccgtcagg 3300 aaggttctct ccatgccaca agtgaatatc gtcaagaaga cagaggtcca gactggcggg 3360 ttctctaagg agtcaattct gcctaagcgg aacagcgaca agctcatcgc ccgcaagaag 3420 gactgggatc cgaagaagta cggcgggttc gacagcccca ctgtggccta ctcggtcctg 3480 gttgtggcga aggttgagaa gggcaagtcc aagaagctca agagcgtgaa ggagctgctg 3540 gggatcacga ttatggagcg ctccagcttc gagaagaacc cgatcgattt cctggaggcg 3600 aagggctaca aggaggtgaa gaaggacctg atcattaagc tccccaagta ctcactcttc 3660 gagctggaga acggcaggaa gcggatgctg gcttccgctg gcgagctgca gaaggggaac 3720 gagctggctc tgccgtccaa gtatgtgaac ttcctctacc tggcctccca ctacgagaag 3780 ctcaagggca gccccgagga caacgagcag aagcagctgt tcgtcgagca gcacaagcat 3840 tacctcgacg agatcattga gcagatttcc gagttctcca agcgcgtgat cctggccgac 3900 gcgaatctgg ataaggtcct ctccgcgtac aacaagcacc gcgacaagcc aatcagggag 3960 caggctgaga atatcattca tctcttcacc ctgacgaacc tcggcgcccc tgctgctttc 4020 aagtacttcg acacaactat cgatcgcaag aggtacacaa gcactaagga ggtcctggac 4080 gcgaccctca tccaccagtc gattaccggc ctctacgaga cgcgcatcga cctgtctcag 4140 ctcgggggcg acaagcggcc agcggcgacg aagaaggcgg ggcaggcgaa gaagaagaag 4200 tga 4203 <210> 16 <211> 4203 <212> DNA <213> Artificial Sequence <220> <223> NGA-Cas9 DNA sequence (DNA sequence) <400> 16 atggctccga agaagaagag gaaggttggc atccacgggg tgccagctgc tgacaagaag 60 tactcgatcg gcctcgatat tgggactaac tctgttggct gggccgtgat caccgacgag 120 tacaaggtgc cctcaaagaa gttcaaggtc ctgggcaaca ccgatcggca ttccatcaag 180 aagaatctca ttggcgctct cctgttcgac agcggcgaga cggctgaggc tacgcggctc 240 aagcgcaccg cccgcaggcg gtacacgcgc aggaagaatc gcatctgcta cctgcaggag 300 attttctcca acgagatggc gaaggttgac gattctttct tccacaggct ggaggagtca 360 ttcctcgtgg aggaggataa gaagcacgag cggcatccaa tcttcggcaa cattgtcgac 420 gaggttgcct accacgagaa gtaccctacg atctaccatc tgcggaagaa gctcgtggac 480 tccacagata aggcggacct ccgcctgatc tacctcgctc tggcccacat gattaagttc 540 aggggccatt tcctgatcga gggggatctc aacccggaca atagcgatgt tgacaagctg 600 ttcatccagc tcgtgcagac gtacaaccag ctcttcgagg agaaccccat taatgcgtca 660 ggcgtcgacg cgaaggctat cctgtccgct aggctctcga agtctcggcg cctcgagaac 720 ctgatcgccc agctgccggg cgagaagaag aacggcctgt tcgggaatct cattgcgctc 780 agcctggggc tcacgcccaa cttcaagtcg aatttcgatc tcgctgagga cgccaagctg 840 cagctctcca aggacacata cgacgatgac ctggataacc tcctggccca gatcggcgat 900 cagtacgcgg acctgttcct cgctgccaag aatctgtcgg acgccatcct cctgtctgat 960 attctcaggg tgaacaccga gattacgaag gctccgctct cagcctccat gatcaagcgc 1020 tacgacgagc accatcagga tctgaccctc ctgaaggcgc tggtcaggca gcagctcccc 1080 gagaagtaca aggagatctt cttcgatcag tcgaagaacg gctacgctgg gtacattgac 1140 ggcggggcct ctcaggagga gttctacaag ttcatcaagc cgattctgga gaagatggac 1200 ggcacggagg agctgctggt gaagctcaat cgcgaggacc tcctgaggaa gcagcggaca 1260 ttcgataacg gcagcatccc acaccagatt catctcgggg agctgcacgc tatcctgagg 1320 aggcaggagg acttctaccc tttcctcaag gataaccgcg agaagatcga gaagattctg 1380 actttcagga tcccgtacta cgtcggccca ctcgctaggg gcaactcccg cttcgcttgg 1440 atgacccgca agtcagagga gacgatcacg ccgtggaact tcgaggaggt ggtcgacaag 1500 ggcgctagcg ctcagtcgtt catcgagagg atgacgaatt tcgacaagaa cctgccaaat 1560 gagaaggtgc tccctaagca ctcgctcctg tacgagtact tcacagtcta caacgagctg 1620 actaaggtga agtatgtgac cgagggcatg aggaagccgg ctttcctgtc tggggagcag 1680 aagaaggcca tcgtggacct cctgttcaag accaaccgga aggtcacggt taagcagctc 1740 aaggaggact acttcaagaa gattgagtgc ttcgattcgg tcgagatctc tggcgttgag 1800 gaccgcttca acgcctccct ggggacctac cacgatctcc tgaagatcat taaggataag 1860 gacttcctgg acaacgagga gaatgaggat atcctcgagg acattgtgct gacactcact 1920 ctgttcgagg accgggagat gatcgaggag cgcctgaaga cttacgccca tctcttcgat 1980 gacaaggtca tgaagcagct caagaggagg aggtacaccg gctgggggag gctgagcagg 2040 aagctcatca acggcattcg ggacaagcag tccgggaaga cgatcctcga cttcctgaag 2100 agcgatggct tcgcgaaccg caatttcatg cagctgattc acgatgacag cctcacattc 2160 aaggaggata tccagaaggc tcaggtgagc ggccaggggg actcgctgca cgagcatatc 2220 gcgaacctcg ctggctcgcc agctatcaag aaggggattc tgcagaccgt gaaggttgtg 2280 gacgagctgg tgaaggtcat gggcaggcac aagcctgaga acatcgtcat tgagatggcc 2340 cgggagaatc agaccacgca gaagggccag aagaactcac gcgagaggat gaagaggatc 2400 gaggagggca ttaaggagct ggggtcccag atcctcaagg agcacccggt ggagaacacg 2460 cagctgcaga atgagaagct ctacctgtac tacctccaga atggccgcga tatgtatgtg 2520 gaccaggagc tggatattaa caggctcagc gattacgacg tcgatcatat cgttccacag 2580 tcattcctga aggatgactc cattgacaac aaggtcctca ccaggtcgga caagaaccgg 2640 ggcaagtctg ataatgttcc ttcagaggag gtcgttaaga agatgaagaa ctactggcgc 2700 cagctcctga atgccaagct gatcacgcag cggaagttcg ataacctcac aaaggctgag 2760 aggggcgggc tctctgagct ggacaaggcg ggcttcatca agaggcagct ggtcgagaca 2820 cggcagatca ctaagcacgt tgcgcagatt ctcgactcac ggatgaacac taagtacgat 2880 gagaatgaca agctgatccg cgaggtgaag gtcatcaccc tgaagtcaaa gctcgtctcc 2940 gacttcagga aggatttcca gttctacaag gttcgggaga tcaacaatta ccaccatgcc 3000 catgacgcgt acctgaacgc ggtggtcggc acagctctga tcaagaagta cccaaagctc 3060 gagagcgagt tcgtgtacgg ggactacaag gtttacgatg tgaggaagat gatcgccaag 3120 tcggagcagg agattggcaa ggctaccgcc aagtacttct tctactctaa cattatgaat 3180 ttcttcaaga cagagatcac tctggccaat ggcgagatcc ggaagcgccc cctcatcgag 3240 acgaacggcg agacggggga gatcgtgtgg gacaagggca gggatttcgc gaccgtcagg 3300 aaggttctct ccatgccaca agtgaatatc gtcaagaaga cagaggtcca gactggcggg 3360 ttctctaagg agtcaattct gcctaagcgg aacagcgaca agctcatcgc ccgcaagaag 3420 gactgggatc cgaagaagta cggcgggttc gtcagcccca ctgtggccta ctcggtcctg 3480 gttgtggcga aggttgagaa gggcaagtcc aagaagctca agagcgtgaa ggagctgctg 3540 gggatcacga ttatggagcg ctccagcttc gagaagaacc cgatcgattt cctggaggcg 3600 aagggctaca aggaggtgaa gaaggacctg atcattaagc tccccaagta ctcactcttc 3660 gagctggaga acggcaggaa gcggatgctg gcttccgctg gcgagctgca gaaggggaac 3720 gagctggctc tgccgtccaa gtatgtgaac ttcctctacc tggcctccca ctacgagaag 3780 ctcaagggca gccccgagga caacgagcag aagcagctgt tcgtcgagca gcacaagcat 3840 tacctcgacg agatcattga gcagatttcc gagttctcca agcgcgtgat cctggccgac 3900 gcgaatctgg ataaggtcct ctccgcgtac aacaagcacc gcgacaagcc aatcagggag 3960 caggctgaga atatcattca tctcttcacc ctgacgaacc tcggcgcccc tgctgctttc 4020 aagtacttcg acacaactat cgatcgcaag cagtaccgga gcactaagga ggtcctggac 4080 gcgaccctca tccaccagtc gattaccggc ctctacgaga cgcgcatcga cctgtctcag 4140 ctcgggggcg acaagcggcc agcggcgacg aagaaggcgg ggcaggcgaa gaagaagaag 4200 tga 4203 <210> 17 <211> 5860 <212> DNA <213> Artificial Sequence <220> <223> Oryza sativa L. OsBADH2 genome DNA sequence (DNA sequence) <400> 17 atggccacgg cgatcccgca gcggcagctc ttcgtcgccg gcgagtggcg cgcccccgcg 60 ctcggccgcc gcctccccgt cgtcaacccc gccaccgagt cccccatcgg taccctcctc 120 ttcaccctct ccaccctctg cttctgcctc tgattagcct ttttgttgtt gttgttgttg 180 ctgctgtttt ttgcgtgtcg gtgcgcaggc gagatcccgg cgggcacggc ggaggacgtg 240 gacgcggcgg tggcggcggc gcgggaggcg ctgaagagga accggggccg cgactgggcg 300 cgcgcgccgg gcgccgtccg ggccaagtac ctccgcgcaa tcgcggccaa ggtagggtgg 360 tgactacccc cacccccccc ccccccccca acgcgacccg cgtgcgtgtg ttccgtacag 420 ggggaggagc tccgcgtggc tctccagtag gtttttgagc cccaaatcga tcgatatgct 480 ctagttttaa gtttgctgct taaattcctc aagggtttag tttgcaacca aatccttatt 540 ttagcttcgg tataagcccc ccatatgatg tgcgtgcgtc ggcatcggaa gtgcgtatcc 600 tctgttctgg actaggaatt ggccataggt tgatcgacag ttcgagtatt ctgcttctgt 660 ttggaataag ttggaagcat ggctgattgt gtatctggat gctgtttttg tggtgattcg 720 tttcaagctc ttgttaattg atgggttcaa gcggagaggg tgcgcaacaa caagtgtata 780 tggctcacgg ccatgggtgt gcacatttga ttggtgcgca acaacaagtg tatattgttt 840 gtgtgcttcg ttagttggca ggtcctagtc actaaatcac tattggattg gtactagtta 900 cttttgtgcc ttgacgatgg gactggatta ctagcctttt ggttgccttt gtggtattcc 960 gttgttatgg gcctgttgat ggatggatcc ctttaatttc tagtgccaaa tgcatgctag 1020 atttctcaca gtttttctct tcaggttata tttctcgtat ttccttttcc taaaggattg 1080 ctttttcatg tattttctgg catatatagg ttattattat tattattctc cagaacaaga 1140 ttacccatat tatggatcac tagtgtacac ttttttggat gaaaaaccta cttactgaaa 1200 gtaaaacagt gaccagtgca cactttactt gaactgtcaa accatcaatt ttctagcaaa 1260 gcaggggatg ctagccttcc agtctaaatg acagtaaact actatacttt tgtccgtagg 1320 tttggaaata tgctaatttc tatcataaaa attttcatgg catatgcgag cattttatga 1380 tcaccttttc cctttttctt cagataatcg agaggaaatc tgagctggct agactagaga 1440 cgcttgattg tgggaagcct cttgatgaag cagcatggga catggtatgt ggccagttat 1500 ccactgtatg aatatgtagt tgcctacaca gcaatctttc ctgaacatga atcctgatgt 1560 atgatattcc atttgtcagg acgatgttgc tggatgcttt gagtactttg cagatcttgc 1620 agaatccttg gacaaaaggc aaaatgcacc tgtctctctt ccaatggaaa actttaaatg 1680 ctatcttcgg aaagagccta tcggtgtagt tgggttgatc acaccttggt atttcacatt 1740 tttctctcat cctgcgctta tatttattta tgacccaagc atggtactaa atagtactag 1800 taacatgcat atactgaatg agtttacaac tttacatgat ttttttgaac tatgaaagtt 1860 gaagacattt gagattttat tcctcttctc ttgtgcaaac atattattgt ctcacaaatt 1920 gtacctagca gctactctct ccgtttcata ttataagtcg tttgactttt ttcctagtca 1980 aaatgtgtta agtttgacca agtttataga aaaatttagc aacatctaaa atatcaaagt 2040 catgttttag tgttttttca ggctctcatg taagcaattt tgatgtgccc tctcctttct 2100 tcttaatata atgatacaca gctcttgtgt attcaaagga aaatatatat atatataatg 2160 atacacacct ctcctccgtg ttaatgcagc tcatttgttc tgtcccggtt caaatatcta 2220 tttttctcat atgttgtcag catgattcac ttaatttagt atatagaaga tgccattatt 2280 tatgtctgga atcttactgc agaagggaaa acaattgata acggaattga ttgcattcta 2340 atttgttgtt tctttgttat gttcttatcg acaattacaa atttgattct gagaatcatg 2400 ttcgggatgt gtatttctac tgcaggaact atcctctcct gatggcaaca tggaaggtag 2460 ctcctgccct ggctgctggc tgtacagctg tactaaaacc atctgaattg gcttccgtgt 2520 aagtttaaca tgttaacttg ttaatgtcat acccatgcta gttgcaatga catttgattt 2580 taaaatgttg tggcatgtcc atgctgcaag caatgtaatt tgaaatctct ctctatcatt 2640 aattaccagg acttgtttgg agcttgctga tgtgtgtaaa gaggttggtc ttccttcagg 2700 tgtgctaaac atagtgactg gattaggttc tgaagccggt gctcctttgt catcacaccc 2760 tggtgtagac aaggtacagc tattcctcct gtaatcatgt ataccccatc aatggaaatg 2820 atattcctct caatacatgg tttatgtttt ctgttaggtt gcatttactg ggagttatga 2880 aactggtaaa aagattatgg cttcagctgc tcctatggtt aaggtttgtt tccaaatttc 2940 tgtggatatt ttttgttctc tttctactaa ctctctatta tcaattctca atgttgtcct 3000 tttcttttaa ctcctttact ttttagaatt gtgatcaaga cactttgagc atcattctag 3060 tagccagttc tatcctgttt cttacctttt tatggttcgt cttttcttga cagcctgttt 3120 cactggaact tggtggaaaa agtcctatag tggtgtttga tgatgttgat gttgaaaaag 3180 gtacatgcca cttgctatga ttaactaatt ctgaagtgcg ggactttgta aagcacttaa 3240 ctgagctgga tgctagaccc ccaaaagccc tttttggtgt cttgggcttg ttgcagaaat 3300 actggtccca gacgagcagg atgcaagaaa attaactact tttgccactg attagtattt 3360 cttagaagtt acacctcaag gattagcaat actttcttaa aatgtgctat tgattaaaaa 3420 gatgtcctgt attattttga gcagatcttg tactggttga tcggcttgca tgaaaatatt 3480 gttgaggatt ataatgccat gccaactgag taaagaaaag agttgtaaaa tatgttatgc 3540 aacatgaata tatatgtgat ttcatttttc ctttttcttt tcgtggcaag gaaggcagtt 3600 aggaaggact gatgtgaaaa gcacaagtac tattcttagt tctggaaaac tgtgttcttt 3660 attttcctaa ctacaattca ccttgattag tcagtaactt gatattggca attctagctg 3720 attatgaatt ctgtttatat ttcactaatt ttgaatcttt aattacattt tatggttgaa 3780 atttaacgtt ttgtctggtt atggactctg tttgtattca ctcaatttgg atcttccatt 3840 agatttcatt gttggtcctt cttcttgtac agctgttgag tggactctct ttggttgctt 3900 ttggaccaat ggccagattt gcagtgcaac atcgcgtctt attcttcatg taagcattga 3960 atatatccgt caatcataat ctattgttgt acttgatttt ttttctgatc aactcctgag 4020 ttcagattat tatatgatgc cattactatt gcacagagcg aataaaattg tatttatgca 4080 cagcatgtat tttgagtaat atatgcattg cctattattt aatatataga ttgtagcact 4140 taattttgtg tccatgtctc tatgatgttt attactttat tattgccggc atgaagcaac 4200 tttgaactct atgttgatct tgaactaaaa ttgaaattaa ttggcttatt gctattaatg 4260 atatagcttt cagcttcttg ctcctgacca tgaaagtttt gcagaaaaaa atcgctaaag 4320 aatttcaaga aaggatggtt gcatgggcca aaaatattaa ggtgtcagat ccacttgaag 4380 agggttgcag gcttgggccc gttgttagtg aaggacaggt accacatgta aactttttct 4440 aaattcaaaa aagaaatgcc actgatcaat ggtaggtcct tccaagcctt attgctggat 4500 tgttgcactg ttttgtcaat tttgtgtaat atagttctga atgaattagt cggtgtatgc 4560 tcttgctagt tgctagtatg tggtacaggg tcttcctact ttgagcaaat tcgtgttaaa 4620 atgcattgat gaaaaggcca cctttccgta ggtttatctt gtcataattt aaaccccaat 4680 aaaattttaa ttttttgttt tgaccccatg gcactttaat gaaatcactt agccatgagc 4740 ttttgtatat attttcaaag caccagaatg tttagatggt ttgttggaaa tcttacacat 4800 cctattgcct tgtgtcagta tgagaagatt aagcaatttg tatctaccgc caaaagccaa 4860 ggtgctacca ttctgactgg tggggttaga cccaaggtaa taatctacta cacggttgta 4920 tatataggta cccacatatc attatgaagt agaaataatc ttgtatgttt ttgtcagcat 4980 ctggagaaag gtttctatat tgaacccaca atcattactg atgtcgatac atcaatgcaa 5040 atttggaggg aagaagtttt tggtccagtg ctctgtgtga aagaatttag cactgaagaa 5100 gaagccattg aattggccaa cgatactcag tgagtttttt ttttaataca gttcattgtc 5160 ctgttcaatc ttgcagcata tgtatatact ctgtggcata tgaacttatt ctgctactac 5220 tacttttgat agttatggtc tggctggtgc tgtgctttcc ggtgaccgcg agcgatgcca 5280 gagattaact gaggtatatc caagtgaagg gggttggcat tgtttgattc atatgacatg 5340 gttgcatcaa gctgatattc aagaatctca tttattactt gcattctatg catctccagt 5400 tcttccctgg actccggtca atgttaatat agtttgtttg ctagtagtat gctactccaa 5460 ttaagttgct cttcacttcc acatcatctg atccatgact ttatatttga cccctttttt 5520 ttgcaaaaga aagggaaata cttaacgaaa atttcctact gcaggagatc gatgccggaa 5580 ttatctgggt gaactgctcg caaccctgct tctgccaagc tccatggggc gggaacaagc 5640 gcagcggctt tggacgcgag ctcggagaag ggtgggtagc acacaacaat ctcactttaa 5700 aacaccattt cgatcgtctg atgatctcga cctgacatca tgcctttggt attttcattc 5760 acttttcagg ggcattgaca actacctaag cgtcaagcaa gtgacggagt acgcctccga 5820 tgagccgtgg ggatggtaca aatccccttc caagctgtaa 5860 <210> 18 <211> 2192 <212> DNA <213> Artificial Sequence <220> <223> Oryza sativa L.OsSWEET14 genome DNA sequence (DNA sequence) <400> 18 atggctggca tgtctcttca gcatccctgg gccttcgcct ttggtctcct aggtgtgttg 60 cctttgatct gatccaagga attctcttga gaattaatct tgcatggtta tttacttttg 120 ttgttattat tctctacatt tttaatcatg tacttttcca tgttccactt ttgttgccaa 180 agctactata tttttcctac caattcatcc aaaactacta tattatagca aggcagctag 240 tggatcgact ttgcactttt ggatgcaatt gtgagtggtt tacattagag gggccatgca 300 tagccaaata aattgtttgg caaaatatga tttcccttgt agttagcaca atattgtgat 360 ctttcattcc tttactcttt ttgttccacc accctcatta ttgcaaagcc ccctctttta 420 gaaccaaact aaagataaga aacatttgat tcatcattag aggagattag atatacatac 480 atactacaca tgcattgctg tgataagcct agccaggcac agaaagagcc aagacaaaag 540 gagctcaaaa gaaaaggggc tccaatatct tgcccggcct gatcagtgta acatgacgtc 600 acccacacaa ttattaaaag gatagatgca tatgtgttcg ttacgtatct ccttgtgtca 660 cgttgctgtg catggttcac tcgcttaatt ataacgtccg tcgcatttta tgcatgcact 720 tcgtttttag ttaatcaaat taaacaagat cctaacatat gatttctatt ttattctctt 780 tgcaggcaac atcatctcct tcatgaccta cctggcccca ctgtaagtcc cacacatccg 840 gatattttct tttctttagc gaaattttac attgctccag aaagtacctt ttacactaaa 900 atttcttata caccaccata aaattaatgt ggtactattg gtaccttatc aaaaatgata 960 aaattacctt tttcttcaga taaaaacact ccccgtctct gtataactaa gatgtagaca 1020 accaatacac atgtctagag ctaatcctat caattaacat tgctagtaaa tacaaggaaa 1080 aatataaaga attaaccaat tgcttggatg tcttgcaggc cgacgttcta caggatctac 1140 aagagcaagt cgacgcaggg gttccagtcg gtaccctacg tggtggcgct gttcagcgcg 1200 atgctgtgga tctactacgc gctgctcaag tccgacgagt gcctcctcat caccatcaac 1260 tccgctggct gcgtcatcga gaccatctac atcgccgtct acctcgtcta cgcccccaag 1320 aaggccaaga tgttcaccgc caagctcctc ctcctcgtca acgtcggcgt cttcggcctc 1380 atcctcctcc tcaccctcct cctctccgcc ggcgaccgcc gcatcgtggt tcttggttgg 1440 gtctgcgttg gcttctccgt cagcgtcttc gtcgcccccc ttagcatcat cgtaagaaac 1500 cctagaattg cctgtaaaca ataataactt tcggtctctg caccaactaa ggatgcacat 1560 atttacgcac cgcttttgct atctctgcag aggctggtgg tgcgcaccaa gagcgtggag 1620 ttcatgccgt tctcgctctc cttctccctc accatcagcg ccgtcgtctg gttcctctac 1680 ggcctcctca tcaaggacaa atatgtcgct gtgagtagct ccgattcgac ccgttcttct 1740 tcctaaattt tccgctgctc gatttaattt ctatttctaa ttgtggaaga ttgtttaatt 1800 atagtgatta tggctagctg ataaccgatt ttaatttctg atggtgatcc aaaatggaac 1860 agcttcccaa cgtgctgggc ttctccttcg gcgtcatcca gatggggctg tacgccatgt 1920 acaggaactc gacgcccaag gccgtgctga ccaaggaggt cgaggcggcg acggccaccg 1980 gcgacgacga ccactccgcc gccggcgtca aggagcacgt cgtcaacatc gccaagctct 2040 ctgccgccgt cgacgtcgtc aagacccgcg aggtgcaccc cgtcgacgtc gagtccccgc 2100 cggcagaggc gccgcctgag gaggacgaca aggccgccgc cgccaccgcc gccgccgtcg 2160 ccggcgccgg cgagaagaag gtagctgcat ga 2192 <210> 19 <211> 657 <212> PRT <213> Artificial Sequence <220> <223> Solanum tuberosum L. StALS2 protein amino acid sequence (amino acid sequence) <400> 19 Met Ala Ala Ala Ser Pro Ser Pro Cys Phe Ser Lys Asn Leu Pro Pro 1 5 10 15 Ser Ser Ser Lys Ser Ser Ile Leu Leu Pro Lys Ser Thr Phe Thr Phe 20 25 30 His Asn His Pro Lys Asn Thr Ser Pro Leu His Leu Thr His Thr Gln 35 40 45 His His Ser Arg Phe Thr Val Ser Asn Val Ile Leu Ser Thr Thr Thr 50 55 60 His Asn Asp Val Ser Glu Pro Glu Ile Phe Val Ser Arg Phe Ala Pro 65 70 75 80 Asp Glu Pro Arg Lys Gly Cys Asp Val Leu Val Glu Ala Leu Glu Arg 85 90 95 Glu Gly Val Lys Asp Val Phe Ala Tyr Pro Gly Gly Ala Ser Met Glu 100 105 110 Ile His Gln Ala Leu Thr Arg Ser Asn Ile Ile Arg Asn Val Leu Pro 115 120 125 Arg His Glu Gln Gly Gly Val Phe Ala Ala Glu Gly Tyr Ala Arg Ala 130 135 140 Thr Gly Phe Pro Gly Val Cys Ile Ala Thr Ser Gly Pro Gly Ala Thr 145 150 155 160 Asn Leu Val Ser Gly Leu Ala Asp Ala Leu Leu Asp Ser Ile Pro Ile 165 170 175 Val Ala Ile Thr Gly Gln Val Pro Arg Arg Met Ile Gly Thr Asp Ala 180 185 190 Phe Gln Glu Thr Pro Ile Val Glu Val Thr Arg Ser Ile Thr Lys His 195 200 205 Asn Tyr Leu Val Met Asp Val Glu Asp Ile Pro Arg Val Val Arg Glu 210 215 220 Ala Phe Phe Leu Ala Lys Ser Gly Arg Pro Gly Pro Val Leu Ile Asp 225 230 235 240 Val Pro Lys Asp Ile Gln Gln Gln Leu Val Ile Pro Asn Trp Asp Gln 245 250 255 Pro Met Arg Leu Pro Gly Tyr Ile Ser Arg Leu Pro Lys Leu Pro Asn 260 265 270 Glu Met Leu Leu Glu Gln Ile Val Arg Leu Ile Ser Glu Ser Lys Lys 275 280 285 Pro Val Leu Tyr Val Gly Gly Gly Cys Thr Gln Ser Ser Glu Glu Leu 290 295 300 Arg Arg Phe Val Glu Leu Thr Gly Ile Pro Val Ala Ser Thr Leu Met 305 310 315 320 Gly Leu Gly Thr Phe Pro Cys Gly Asp Glu Leu Ser Leu Gln Met Leu 325 330 335 Gly Met His Gly Thr Val Tyr Ala Asn Tyr Ala Val Asp Ser Ser Asp 340 345 350 Leu Leu Leu Ala Phe Gly Val Arg Phe Asp Asp Arg Val Thr Gly Lys 355 360 365 Leu Glu Ala Phe Ala Ser Arg Ala Lys Ile Val His Ile Asp Ile Asp 370 375 380 Ser Ala Glu Ile Gly Lys Asn Lys Gln Pro His Val Ser Ile Cys Ala 385 390 395 400 Asp Ile Lys Leu Ala Leu Gln Gly Leu Asn Ser Ile Leu Glu Gly Lys 405 410 415 Glu Gly Lys Leu Lys Leu Asp Phe Ser Ala Trp Arg Gln Glu Leu Thr 420 425 430 Glu Gln Lys Val Lys Tyr Pro Leu Asn Tyr Lys Thr Phe Gly Glu Ala 435 440 445 Ile Pro Pro Gln Tyr Ala Ile Gln Val Leu Asp Glu Leu Thr Asn Gly 450 455 460 Asn Ala Ile Ile Ser Thr Gly Val Gly Gln His Gln Met Trp Ala Ala 465 470 475 480 Gln Tyr Tyr Lys Tyr Lys Lys Pro Arg Gln Trp Leu Thr Ser Gly Gly 485 490 495 Leu Gly Ala Met Gly Phe Gly Leu Pro Ala Ala Ile Gly Ala Ala Val 500 505 510 Gly Arg Pro Gly Glu Ile Val Val Asp Ile Asp Gly Asp Gly Ser Phe 515 520 525 Ile Met Asn Val Gln Glu Leu Ala Thr Ile Lys Val Glu Asn Leu Pro 530 535 540 Val Lys Ile Met Leu Leu Asn Asn Gln His Leu Gly Met Val Val Gln 545 550 555 560 Trp Glu Asp Arg Phe Tyr Lys Ala Asn Arg Ala His Thr Tyr Leu Gly 565 570 575 Asn Pro Ala Asn Glu Glu Glu Ile Phe Pro Asn Met Leu Lys Phe Ala 580 585 590 Glu Ala Cys Gly Val Pro Ala Ala Arg Val Ser His Arg Asp Asp Leu 595 600 605 Arg Ala Ala Ile Gln Lys Met Leu Asp Thr Pro Gly Pro Tyr Leu Leu 610 615 620 Asp Val Ile Val Pro His Gln Glu His Val Leu Pro Met Ile Pro Ser 625 630 635 640 Gly Gly Ala Phe Lys Asp Val Ile Thr Glu Gly Asp Gly Arg Arg Ser 645 650 655 Tyr <210> 20 <211> 1974 <212> DNA <213> Artificial Sequence <220> <223> Solanum tuberosum L. StALS2 gene DNA sequence (DNA sequence) <400> 20 atggcggctg catctccatc tccttgtttt tccaaaaacc tacctccatc ttcatcaaaa 60 tcttccatcc ttcttcccaa atctaccttt actttccaca atcaccccaa aaatacctca 120 ccccttcacc ttacccacac ccaacatcat agccgtttca ctgtctcaaa tgtcatccta 180 tcaaccacga cccataacga cgtttctgaa cccgaaatct tcgtttcacg tttcgcccct 240 gacgaaccca gaaagggttg tgatgttctt gtggaggcac ttgaaaggga aggggttaag 300 gatgtatttg catacccagg aggtgcttcc atggagattc atcaggcttt gacacgttcc 360 aatattattc gtaatgtgct gccacgtcat gaacagggtg gtgtgtttgc tgcagagggt 420 tacgcacggg ccactgggtt ccctggtgtt tgcattgcta catctggtcc gggagctacg 480 aatcttgtta gcggtcttgc ggatgctttg ttggatagta ttccgattgt tgctattacg 540 ggtcaagtgc cgaggaggat gattggtact gatgcgtttc aggaaactcc tattgttgag 600 gtaacgagat ccattacgaa gcataattat cttgttatgg atgtagagga tattcctagg 660 gttgttcgtg aagcgttttt tctagcgaaa tcgggacggc ctggaccggt tctgattgat 720 gttcctaagg atattcagca acaattggtg atacctaatt gggatcagcc aatgaggttg 780 cctggttaca tctctaggtt gcctaaattg cctaatgaga tgcttttgga acaaattgtt 840 aggctgattt cggagtcgaa gaagcctgtt ttgtatgtgg gtggtgggtg tacacaatcg 900 agtgaggagc tgagacgatt tgtggagctt acgggtattc ctgtggcgag tactttgatg 960 ggtcttggaa cttttccatg tggggatgag ctttctcttc aaatgttggg tatgcatggg 1020 actgtgtatg ctaattatgc ggtggatagt agtgatttgt tgcttgcatt tggggtgagg 1080 tttgatgatc gagttactgg taaattggaa gcttttgcta gccgagcgaa aattgtccac 1140 attgatattg attcggctga gattggaaag aacaagcaac ctcatgtttc catttgtgca 1200 gatatcaagt tggcattaca gggtttgaat tccatattgg agggtaaaga aggtaagctg 1260 aagttggact tttctgcttg gaggcaggag ttaacggagc agaaggtgaa gtacccattg 1320 aattataaga cttttggtga agccatccct ccacaatatg ctattcaggt tcttgatgag 1380 ttaactaacg gaaatgccat tattagtact ggtgtggggc aacaccaaat gtgggctgcc 1440 caatactata agtacaaaaa gccacgccaa tggttgacat ctggtggatt aggagcaatg 1500 ggatttggtt tgcctgctgc tataggtgcg gctgttggaa gaccgggtga gattgtggtt 1560 gacattgatg gtgacgggag ttttatcatg aatgtgcagg agttagcaac aattaaggtg 1620 gagaatctcc cagttaagat tatgttactg aataatcaac acttgggaat ggtggttcag 1680 tgggaggatc gattctataa ggctaacaga gcacacactt acttgggtaa tcctgctaat 1740 gaggaagaaa tcttccctaa tatgctgaaa tttgcagagg cttgtggcgt acctgctgca 1800 agagtgtcac acagggatga tcttagagct gccattcaaa agatgttaga cactcctggg 1860 ccatacttgt tggatgtgat tgtacctcat caggagcacg ttctacctat gattcccagt 1920 ggtggcgctt tcaaagatgt gattacggag ggtgatggga gacgttccta ttga 1974 <210> 21 <211> 1424 <212> DNA <213> Artificial Sequence <220> <223> HBB gene DNA sequence (comprising intron)(DNA sequence) <400> 21 atggtgcacc tgactcctga ggagaagtct gccgttactg ccctgtgggg caaggtgaac 60 gtggatgaag ttggtggtga ggccctgggc aggttggtat caaggttaca agacaggttt 120 aaggagacca atagaaactg ggcatgtgga gacagagaag actcttgggt ttctgatagg 180 cactgactct ctctgcctat tggtctattt tcccaccctt aggctgctgg tggtctaccc 240 ttggacccag aggttctttg agtcctttgg ggatctgtcc actcctgatg ctgttatggg 300 caaccctaag gtgaaggctc atggcaagaa agtgctcggt gcctttagtg atggcctggc 360 tcacctggac aacctcaagg gcacctttgc cacactgagt gagctgcact gtgacaagct 420 gcacgtggat cctgagaact tcagggtgag tctatgggac gcttgatgtt ttctttcccc 480 ttcttttcta tggttaagtt catgtcatag gaaggggata agtaacaggg tacagtttag 540 aatgggaaac agacgaatga ttgcatcagt gtggaagtct caggatcgtt ttagtttctt 600 ttatttgctg ttcataacaa ttgttttctt ttgtttaatt cttgctttct ttttttttct 660 tctccgcaat ttttactatt atacttaatg ccttaacatt gtgtataaca aaaggaaata 720 tctctgagat acattaagta acttaaaaaa aaactttaca cagtctgcct agtacattac 780 tatttggaat atatgtgtgc ttatttgcat attcataatc tccctacttt attttctttt 840 atttttaatt gatacataat cattatacat atttatgggt taaagtgtaa tgttttaata 900 tgtgtacaca tattgaccaa atcagggtaa ttttgcattt gtaattttaa aaaatgcttt 960 cttcttttaa tatacttttt tgtttatctt atttctaata ctttccctaa tctctttctt 1020 tcagggcaat aatgatacaa tgtatcatgc ctctttgcac cattctaaag aataacagtg 1080 ataatttctg ggttaaggca atagcaatat ctctgcatat aaatatttct gcatataaat 1140 tgtaactgat gtaagaggtt tcatattgct aatagcagct acaatccagc taccattctg 1200 cttttatttt atggttggga taaggctgga ttattctgag tccaagctag gcccttttgc 1260 taatcatgtt catacctctt atcttcctcc cacagctcct gggcaacgtg ctggtctgtg 1320 tgctggccca tcactttggc aaagaattca ccccaccagt gcaggctgcc tatcagaaag 1380 tggtggctgg tgtggctaat gccctggccc acaagtatca ctaa 1424 <210> 22 <211> 444 <212> DNA <213> Artificial Sequence <220> <223> HBB gene CDS sequence (DNA sequence) <400> 22 atggtgcacc tgactcctga ggagaagtct gccgttactg ccctgtgggg caaggtgaac 60 gtggatgaag ttggtggtga ggccctgggc aggctgctgg tggtctaccc ttggacccag 120 aggttctttg agtcctttgg ggatctgtcc actcctgatg ctgttatggg caaccctaag 180 gtgaaggctc atggcaagaa agtgctcggt gcctttagtg atggcctggc tcacctggac 240 aacctcaagg gcacctttgc cacactgagt gagctgcact gtgacaagct gcacgtggat 300 cctgagaact tcaggctcct gggcaacgtg ctggtctgtg tgctggccca tcactttggc 360 aaagaattca ccccaccagt gcaggctgcc tatcagaaag tggtggctgg tgtggctaat 420 gccctggccc acaagtatca ctaa 444 <210> 23 <211> 147 <212> PRT <213> Artificial Sequence <220> <223> HBB gene amino acid sequence (amino acid sequence) <400> 23 Met Val His Leu Thr Pro Glu Glu Lys Ser Ala Val Thr Ala Leu Trp 1 5 10 15 Gly Lys Val Asn Val Asp Glu Val Gly Gly Glu Ala Leu Gly Arg Leu 20 25 30 Leu Val Val Tyr Pro Trp Thr Gln Arg Phe Phe Glu Ser Phe Gly Asp 35 40 45 Leu Ser Thr Pro Asp Ala Val Met Gly Asn Pro Lys Val Lys Ala His 50 55 60 Gly Lys Lys Val Leu Gly Ala Phe Ser Asp Gly Leu Ala His Leu Asp 65 70 75 80 Asn Leu Lys Gly Thr Phe Ala Thr Leu Ser Glu Leu His Cys Asp Lys 85 90 95 Leu His Val Asp Pro Glu Asn Phe Arg Leu Leu Gly Asn Val Leu Val 100 105 110 Cys Val Leu Ala His His Phe Gly Lys Glu Phe Thr Pro Pro Val Gln 115 120 125 Ala Ala Tyr Gln Lys Val Val Ala Gly Val Ala Asn Ala Leu Ala His 130 135 140 Lys Tyr His 145

Claims (102)

  1. 다음 단계를 포함하는 유기체에서 새로운 돌연변이를 발생시키는 방법: 순차적으로 유기체 지놈 내의 특정 부위에 2개 이상의 DNA 절단을 생성하고 각각 자발적으로 복구하는 단계로서, 후기 DNA 절단(later DNA break)은 이전 DNA 절단(previous DNA break)의 복구로부터 형성된 새로운 서열에 기초해 생성되는 것인 단계.
  2. 제1항에 있어서, 상기 DNA 절단은 표적화 특성을 갖는 뉴클레아제를 유기체의 세포 내로 전달하여 지놈 DNA의 특정 부위와 접촉함으로써 생성되는 것인, 돌연변이를 발생시키는 방법.
  3. 제2항에 있어서, 상기 표적화 특성을 갖는 뉴클레아제는 ZFN, TALEN 또는 CRISPR/Cas 시스템인, 돌연변이를 발생시키는 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 순차적으로 유기체 지놈 내의 특정 부위에 2개 이상의 DNA 절단을 생성하는 단계는 ZFN 또는 TALEN의 편집에 의해 생성된 DNA 절단 복구 이벤트에 의해 형성된 새로운 서열에 기초하여 새로운 ZFN 또는 TALEN 단백질이 해당 부위를 다시 절단하도록 설계되는 것인, 돌연변이를 발생시키는 방법.
  5. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 순차적으로 유기체 지놈 내의 특정 부위에 2개 이상의 DNA 절단을 생성하는 단계는 CRISPR/Cas 시스템에 의해 생성된 DNA 절단 복구 이벤트에 의해 형성된 새로운 서열에 기초하여, 새로운 표적RNA가 해당 부위를 다시 절단하도록 설계되는 것인, 돌연변이를 발생시키는 방법.
  6. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 2개 이상의 DNA 절단은 상이한 표적화된 뉴클레아제를 상이한 세대의 수용 세포에 순차적으로 전달함으로써 생성되고, 여기서 이전의 지놈 편집이 완료된 돌연변이 세포는 나중의 지놈 편집에서 표적화된 뉴클레아제의 전달을 받기 위한 수용체로 사용되어 두번째 지놈 편집을 수행해 부위 특이적 돌연변이를 발생시키는 것인, 돌연변이를 발생시키는 방법.
  7. 제1항 내지 제3항, 및 제5항 중 어느 한 항에 있어서, 상기 2개 이상의 DNA 절단은 상이한 표적에 대한 상이한 표적화된 뉴클레아제를 동일한 수용 세포 내로 전달함으로써 생성되는 것인, 돌연변이를 발생시키는 방법.
  8. 제1항 내지 제3항, 제5항 및 제7항 중 어느 한 항에 있어서, 상기 2개 이상의 DNA절단은, 동일한 CRISPR/Cas 뉴클레아제와 각각의 상이한 gRNA 또는 sgRNA에 의해 형성된 RNP 복합체가, 상응하는 표적서열을 순차적으로 절단하여 생성되는 것인, 돌연변이를 발생시키는 방법.
  9. 제1항 내지 제3항, 제5항 및 제7항 중 어느 한 항에 있어서, 상기 2개 이상의 DNA절단은, 상이한 PAM 서열을 인식하는 2개 이상의 CRISPR/Cas 뉴클레아제와 각각의 gRNA 또는 sgRNA에 의해 각각 형성된 RNP 복합체가, 상응하는 표적 서열을 순차적으로 절단하여 생성되는 것인, 돌연변이를 발생시키는 방법.
  10. 제7항에 있어서, 상기 표적화된 뉴클레아제는 지놈의 편집을 수행할 수 있는 임의의 CRISPR/Cas 뉴클레아제인, 돌연변이를 발생시키는 방법.
  11. 제6항 또는 제7항에 있어서, 상기 표적화된 뉴클레아제는 DNA 형태인 돌연변이를 발생시키는 방법.
  12. 제7항 내지 제9항 중 어느 한 항에 있어서, 상기 표적화된 뉴클레아제는 DNA 대신 mRNA 또는 단백질의 형태인 돌연변이를 발생시키는 방법.
  13. 제6항 또는 제7항 중 어느 한 항에 있어서, 상기 표적화된 뉴클레아제를 세포내로 전달하는 방법은 다음 중에서 선택되는 것인, 돌연변이를 발생시키는 방법: 1) PEG-매개 세포 형질주입 방법; 2) 리포솜-매개 세포 형질주입 방법; 3) 전기천공 형질전환 방법; 4) 미세주입법; 5) 유전자 총 충격 방법; 또는6) Agrobacterium-매개 형질전환 방법.
  14. 제1항 내지 제13항 중 어느 한 항에 따른 돌연변이를 발생시키는 방법에 의해 얻어진 새로운 돌연변이.
  15. 제14항의 새로운 돌연변이를 갖는 단백질 또는 그 생물학적 활성 단편.
  16. 제15항의 단백질 또는 그 생물학적 활성 단편을 인코딩하는 핵산 서열 또는 그 상보적 서열을 포함하는 핵산.
  17. 다음을 포함하는 핵산:
    (a) 표적RNA를 인코딩하는 뉴클레오타이드 서열,
    상기 표적RNA는 최소한 2개의 표적RNA를 포함하며, 제1 표적RNA는 DNA를 표적하여 DNA 절단을 생성하고, 이후의 표적RNA는 이전의 절단 복구 이벤트로부터 형성된 서열을 표적하여 다시 절단을 생성함.
  18. 제17항에 있어서, 추가적으로 (b) Cas 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열을 포함하는 핵산.
  19. 제17항 또는 제18항에 있어서, 표적RNA는 sgRNA 또는 gRNA인 핵산.
  20. 제17항 내지 19항 중 어느 한 항에 있어서, 상기 Cas 폴리펩타이드 및 표적RNA는 in vitro 세포 또는 ex vivo 세포에 존재하는 것인 핵산.
  21. 제16항 내지 제20항 중 어느 한 항에 따른 핵산과, 이에 작동가능하게 연결된 프로모터를 포함하는, 재조합 발현 벡터.
  22. 제16항 내지 제20항 중 어느 한 항에 따른 핵산을 포함하는 발현 카세트.
  23. 제22항에 따른 발현 카세트를 포함하는 숙주세포.
  24. 제23항에 따른 숙주세포로부터 재생된 유기체.
  25. 표적DNA를 복합체와 접촉시키는 단계를 포함하는 표적DNA를 용해시키는 방법으로서, 상기 복합체는 다음을 포함하는 것인 방법:
    (a) Cas 폴리펩타이드; 및
    (b) 제1 표적RNA가 DNA를 표적하여 DNA 절단을 생성시키고, 이후의 표적RNA는 이전의 절단 복구로부터 형성된 서열을 표적하여 절단을 다시 생성하는 것인 최소한 2개의 표적RNA.
  26. 제25항에 있어서, 상기 표적RNA는 sgRNA 또는 gRNA인, 표적DNA를 용해시키는 방법.
  27. 제25항 또는 제26항에 있어서, 상기 표적DNA는 세균 세포, 진핵 세포, 식물 세포 또는 동물 세포에 존재하는 것인 표적DNA를 용해시키는 방법.
  28. 제25항 내지 제27항 중 어느 한 항에 있어서, 상기 표적DNA는 염색체 DNA인, 표적DNA를 용해시키는 방법.
  29. 제25항 내지 제28항 중 어느 한 항에 있어서, 상기 Cas 폴리펩타이드 및 표적RNA는 in vitro 세포 또는 ex vivo 세포에 존재하는 것인 표적DNA를 용해시키는 방법.
  30. 제25항 내지 제29항 중 어느 한 항에 있어서, 상기 접촉시키는 단계는 다음과 같은 것을 세포 내부로 도입하는 것을 포함하는 표적DNA를 용해시키는 방법:
    (a) Cas 폴리펩타이드, 또는 Cas 폴리펩타이드를 인코딩하는 폴리뉴클레오타이드; 및
    (b) 표적RNA, 또는 표적RNA를 인코딩하는 DNA 폴리뉴클레오타이드.
  31. 다음을 포함하는 조성물:
    (a) Cas 폴리펩타이드, 또는 Cas폴리펩타이드를 인코딩하는 폴리뉴클레오타이드; 및
    (b) 최소한 2개의 표적RNAs 또는 표적RNAs를 인코딩하는 DNA 폴리뉴클레오타이드,
    여기에서 제1표적 RNA는 DNA를 표적하여 DNA 절단을 생성하고, 이후의 표적RNA는 이전의 절단 복구 이벤트로부터 형성된 서열을 표적하여 다시 절단을 생성시킴.
  32. 제31항에 있어서, 상기 표적RNA는 sgRNA 또는 gRNA인 조성물.
  33. 제31항 또는 제32항 중 어느 한 항에 있어서, 상기 Cas 폴리펩타이드 및 표적RNA는 in vitro 세포 또는 ex vivo 세포에 존재하는 것인 조성물.
  34. 제31항 내지 제33항에 따른 조성물의 질병 치료용 약제의 제조 용도.

  35. 다음을 포함하는 키트:
    (a) Cas 폴리펩타이드 또는 Cas 폴리펩타이드를 인코딩하는 뉴클레오타이드 서열을 포함하는 핵산; 및
    (b) 최소한 2개의 표적RNAs 또는 표적RNAs를 인코딩하는 뉴클레오타이드 서열을 포함하는 핵산으로서, 제1표적 RNA는 DNA를 표적하여 DNA 절단을 생성하고 이후의 표적RNA는 이전의 절단 복구로부터 형성된 서열을 표적하여 다시 절단을 생성시키는 것인 표적RNA 또는 핵산;
    상기 (a) 및 (b)는 동일하거나 별도의 컨테이너에 있다.
  36. 제35항에 있어서, 상기 표적RNA는 sgRNA 또는 gRNA인 키트.
  37. 제35항 또는 제36항 중 어느 한 항에 있어서, 상기 표적RNAs는 동일하거나 별도의 컨테이너에 담긴 키트.
  38. 다음 단계를 포함하는 외인성 형질전환 마커(exogenous transgenic marker)와 독립적인 편집 이벤트를 선별하는 방법:
    1) 수용 세포의 제1 표적유전자의 특정 부위의 서열상에서 2개 이상의 DNA 절단이 순차적으로 생성되고 자발적으로 각각 복구되는 단계, 나중의 DNA 절단은 이전의 DNA 절단 복구에 의해 형성된 서열에 기초해 생성됨;
    2) 제1 표적유전자의 특정 부위가 순차적으로 절단되고 복구된 후 특정 편집 이벤트가 발생되며, 이는 표현형으로 선별가능한 형질을 생성하기 위한 특정 선별압력에 대한 저항력을 돌연변이 세포에 부여하고, 상응하는 선별압력이 적용되어 형질이 선별되며, 지놈 편집 이벤트를 포함한 세포, 조직, 기관 또는 완전한 유기체가 분리되는 단계;
    3) 선택적으로, 제1 표적유전자에 더하여 동시에 다른 표적부위를 편집하기 위해 최소한 1개의 제2 표적유전자에 표적화된 뉴클레아제가 사용되며, 제2 표적유전자의 편집 이벤트는 제1 표적유전자의 돌연변이에 의해 생성된 선별가능한 형질의 선별을 통해 강화됨과 동시에 선별되며, 제1 표적유전자의 편집 이벤트 및 최소한 하나의 제2 표적유전자의 편집 이벤트를 동시에 포함하는 세포, 조직, 기관 또는 완전한 유기체가 분리되는 단계.
  39. 제38항에 있어서, 상기 제1 표적유전자는 최소한 1개의 표현형으로 선별가능한 형질을 인코딩하는 유전자 좌(gene locus)이며, 상기 최소한 1개의 표현형으로 선별가능한 형질은 저항성/내성 또는 성장에 이점을 갖는 형질인, 편집 이벤트를 선별하는 방법.
  40. 제38항 또는 제39항 중 어느 한 항에 있어서, 상기 제1 표적유전자의 특정 부위는 순차적인 DNA 절단과 복구후에 특정 유형의 돌연변이가 발생되는 부위를 말하며, 이는 수용 세포에 특정 선별압력에 대한 저항성을 부여하여 최소한 1개의 표현형으로 선별가능한 저항성/내성 또는 성장에 이점을 갖는 형질을 생산할 수 있는 것인 편집 이벤트를 선별하는 방법.
  41. 제40항에 있어서, 상기 특정 유형의 돌연변이는 단일 염기의 치환, 다수의 염기의 치환, 또는 불특정한 수의 염기의 삽입 또는 결실을 포함하는 것인, 편집 이벤트를 선별하는 방법.
  42. 제38항 내지 제41항 중 어느 한 항에 있어서, 상기 특정 선별압력은 환경적 압력 또는 첨가된 화합물에 의한 압력이며, 상기 환경적 압력은 바람직하게는 고온, 저온 또는 저산소증이고; 상기 첨가된 화합물에 의한 압력은 바람직하게는 염 이온 농도, 항생제, 세포독소 또는 제초제로 인한 압력인, 편집 이벤트를 선별하는 방법.
  43. 제38항 내지 제42항 중 어느 한 항에 있어서, 상기 DNA 절단은 지놈 DNA의 특정 부위와 접촉하도록 표적화 특성을 갖는 뉴클레아제를 유기체의 세포내로 전달함으로써 생성되는 것인 편집 이벤트를 선별하는 방법.
  44. 제43항에 있어서, 상기 표적화 특성을 갖는 뉴클레아제는 지놈 편집을 수행할 수 있는 임의의 CRISPR/Cas 뉴클레아제인 편집 이벤트를 선별하는 방법.
  45. 제38항 내지 제44항 중 어느 한 항에 있어서, 상기 특정 부위의 서열상에서 2개 이상의 DNA 절단이 순차적으로 생성된다는 특성은 CRISPR/Cas 시스템에 의한 이전의 DNA 절단 복구 이벤트에 의해 형성된 새로운 서열에 기초해, 새로운 표적RNA가 해당 부위를 다시 절단하도록 설계되는 것인, 편집 이벤트를 선별하는 방법.
  46. 제38항 내지 45항 중 어느 한 항에 있어서, 상기 2개 이상의 DNA 절단은 동일한 CRISPR/Cas 뉴클레아제와 각각의 상이한 gRNA 또는 sgRNA에 의해 형성된 RNP 복합체가 상응하는 표적서열을 순차적으로 절단함에 따라 생성된 것인, 편집 이벤트를 선별하는 방법.
  47. 제38항 내지 제45항 중 어느 한 항에 있어서, 상기 2개 이상의 DNA 절단은 상이한 PAM 서열을 인식하는 2개 이상의 CRISPR/Cas 뉴클레아제와 각각의 gRNA 또는 sgRNA에 의해 각각 형성된 RNP 복합체가 상응하는 표적서열을 순차적으로 절단함에 따라 생성된 것인, 편집 이벤트를 선별하는 방법.
  48. 제38항 내지 제47항 중 어느 한 항에 있어서, 상기 제2 표적유전자는 제1 표적유전자와 코딩이 상이한 또 다른 유전자인, 편집 이벤트를 선별하는 방법.
  49. 제38항 내지 제48항 중 어느 한 항에 있어서, 상기 최소한 1개의 제2 표적유전자에 표적화된 뉴클레아제는 제1 표적유전자의 특정 부위에 DNA 절단을 생성시키는데 사용되는 CRISPR/Cas 뉴클레아제와 동일하거나 상이한 것인, 편집 이벤트를 선별하는 방법.
  50. 제38항 내지 제45항 및 제48항 내지 제49항 중 어느 한 항에 있어서, 상기 표적화된 뉴클레아제는 DNA 형태인, 편집 이벤트를 선별하는 방법.
  51. 제38항 내지 제49항 중 어느 한 항에 있어서, 상기 표적화된 뉴클레아제는 DNA 대신 mRNA 또는 단백질의 형태인, 편집 이벤트를 선별하는 방법.
  52. 제43항 내지 제51항 중 어느 한 항에 있어서, 상기 표적화된 뉴클레아제를 세포 내로 전달하는 방법은 다음 중 선택되는 것인, 편집 이벤트를 선별하는 방법: 1) PEG-매개 세포 형질주입 방법; 2) 리포솜-매개 세포 형질주입 방법; 3) 전기천공 형질전환 방법; 4) 미세주입법; 5) 유전자 총 충격 방법; 또는6) Agrobacterium -매개 형질전환 방법.
  53. 다음과 같은 단계를 포함하는 비 형질전환적 일시적인 유기체 지놈의 편집 방법:
    1) 최소한 2개의 crRNA 단편의 조합 또는 최소한 2개의 sgRNA 단편의 조합이 수용 세포의 제1 표적유전자의 특정 부위에 맞게 설계 및 합성되며, 이 때 tracrRNA와 조합된 crRNA 단편의 조합 또는 sgRNA 단독의 조합은 상응하는 Cas 단백질이 수용 세포의 제1 표적유전자의 특정 부위에서 2개 이상의 DNA 절단을 순차적으로 생성하고 각각 자발적으로 복구하도록 유도하며, 이 때 나중의 DNA 절단은 이전의 DNA 절단 복구에 의해 형성된 새로운 서열에 기초한 것인 단계;
    2) 적절한 양의 CRISPR/Cas 단백질 또는 그와 상응하는 mRNA가 앞서 설계 및 합성된 tracrRNA와 조합된 crRNA 단편의 조합 또는 sgRNA 단독의 조합과 혼합되어 제1 표적유전자의 부위 특이적 편집을 유도해 내인성 선별 마커를 생성할 수 있으며, 선택적으로, 제2, 제3, 또는 그 이상의 표적유전자를 표적하는 최소한 1개의 인공적으로 합성된 crRNA 및 tracrRNA 단편 또는 인공적으로 합성된 sgRNA 단편이 추가적으로 첨가되며, in vitro 상에서 배양이 수행되어 RNP 복합체를 형성하는 단계;
    3) 상기 RNP 복합체가 수용 세포 내로 전달되고 지놈 DNA의 특정 부위와 접촉해 유전자를 편집하는 단계;
    4) RNP 복합체의 제1 표적유전자의 부위 특이적 편집으로 생성된 표현형으로 선별가능한 형질에 따라, 상응하는 선별압력이 적용되어 형질의 선별이 이루어지고, 편집 이벤트를 포함한 세포, 조직, 기관 또는 완전한 유기체가 분리되며, 선택적으로 제1 표적유전자 및 최소한 1개의 제2, 제3 또는 그 이상의 표적유전자의 편집 이벤트를 포함한 세포, 조직, 기관 또는 완전한 유기체가 분리되는 단계.
  54. 제53항에 있어서, 상기 제1 표적유전자는 최소한 1개의 표현형으로 선별가능한 형질을 인코딩하는 유전자 좌이고, 상기 최소한 1개의 표현형으로 선별가능한 형질은 저항성/내성 형질 또는 성장에 이점을 갖는 형질인, 지놈의 편집 방법.
  55. 제53항 또는 제54항 중 어느 한 항에 있어서, 상기 제1 표적유전자의 특정 부위는 순차적인 DNA 절단과 복구 이후에 특정 유형의 돌연변이가 발생되는 부위이며, 이는 수용 세포에 특정 선별압력에 대한 저항성을 부여하여 최소한 1개의 표현형으로 선별가능한 저항성/내성 형질 또는 성장에 이점을 갖는 형질을 생산할 수 있는 것인, 지놈의 편집 방법.
  56. 제55항에 있어서, 상기 특정 유형의 돌연변이는 단일 염기의 치환, 복수의 염기의 치환, 또는 불특정 개수의 염기의 삽입 또는 결실을 포함하는 것인, 지놈의 편집 방법.
  57. 제55항 또는 제56항 중 어느 한 항에 있어서, 상기 특정 선별압력은 환경적 압력 또는 첨가된 화합물에 의한 압력이며; 상기 환경적 압력은 바람직하게는 고온, 저온 또는 저산소증이고; 상기 첨가된 화합물에 의한 압력은 바람직하게는 염 이온 농도, 항생제, 세포독소 또는 제초제로 인한 압력인 지놈의 편집 방법.
  58. 제53항 내지 57항 중 어느 한 항에 있어서, 상기 CRISPR/Cas 단백질은 지놈 편집을 수행할 수 있는 임의의 CRISPR/Cas 뉴클레아제인 지놈의 편집 방법.
  59. 제53항 내지 58항 중 어느 한 항에 있어서, 상기 특정 부위에서 2개 이상의 DNA 절단을 순차적으로 생성시키는 특성은 CRISPR/Cas 시스템에 의해 생성된 이전의 DNA 절단 복구 이벤트에 의해 형성된 새로운 서열에 기초하여, 해당 부위를 다시 절단하기 위해 새로운 표적RNA가 설계되는 것인 지놈의 편집 방법.
  60. 제53항 내지 제59항 중 어느 한 항에 있어서, 상기 2개 이상의 DNA 절단은 동일한 CRISPR/Cas 뉴클레아제와 각각 상이한 gRNA 또는 sgRNA로 형성된 RNP 복합체가 순차적으로 상응하는 표적서열을 절단할 때 생성되는 것인 지놈의 편집 방법.
  61. 제53항 내지 제59항 중 어느 한 항에 있어서, 상기 2개 이상의 DNA 절단은 상이한 PAM 서열을 인식하는 2개 이상의 각각의 CRISPR/Cas 뉴클레아제와 각각의 gRNA 또는 sgRNA로부터 각각 형성된 RNP 복합체가 상응하는 표적 서열을 절단할 때 생성되는 것인 지놈의 편집 방법.
  62. 제53항 내지 제61항 중 어느 한 항에 있어서, 상기 제2, 제3 또는 그 이상의 표적유전자는 제1 표적유전자와 코딩이 상이한 다른 유전자인 지놈의 편집 방법.
  63. 제53항 내지 제62항 중 어느 한 항에 있어서, 상기 제2, 제3, 또는 그 이상의 표적유전자를 표적하는 최소한 1개의 인공적으로 합성된 crRNA 및 tracrRNA 단편 또는 인공적으로 합성된 sgRNA 단편은 제1 표적유전자를 표적하는 crRNA 또는 sgRNA와 동일한 Cas 단백질을 공유하는 것인 지놈의 편집 방법.
  64. 제53항 내지 제62항 중 어느 한 항에 있어서, 상기 제2, 제3, 또는 그 이상의 표적유전자를 표적하는 최소한 1개의 인공적으로 합성된 crRNA 및 tracrRNA 단편 또는 인공적으로 합성된 sgRNA 단편은 제1 표적유전자를 표적하는 crRNA 또는 sgRNA와 상이한 PAM 서열을 인식하는 Cas 단백질을 사용하는 것인 지놈의 편집 방법.
  65. 제53항 내지 64항 중 어느 한 항에 있어서, 상기 RNP 복합체를 세포 내로 전달하는 방법은 다음 중 선택되는 것인 지놈의 편집 방법: 1) PEG-매개 세포 형질주입 방법; 2) 리포솜-매개 세포 형질주입 방법; 3) 전기천공 형질전환 방법; 4) 미세주입법; 또는 5) 유전자 총 충격 방법.
  66. 다음과 같은 단계를 포함하는 비 형질전환적 일시적인 식물체 지놈의 편집 방법:
    1) 최소한 2개의 crRNA 단편의 조합 또는 최소한 2개의 sgRNA 단편의 조합이 수용 식물 세포 또는 조직의 제1 표적유전자의 특정 부위에 맞게 설계 및 합성되며, 이 때 tracrRNA와 조합된 crRNA 단편의 조합 또는 sgRNA 단독의 조합은 상응하는 Cas 단백질이 수용 세포의 제1 표적유전자의 특정 부위에서 2개 이상의 DNA 절단을 순차적으로 생성하고 각각 자발적으로 복구하도록 유도하며, 이 때 나중의 DNA 절단은 이전의 DNA 절단 복구에 의해 형성된 새로운 서열에 기초한 것인 단계.
    2) 적절한 양의 CRISPR/Cas 단백질 또는 그와 상응하는 mRNA가 앞서 설계 및 합성된 tracrRNA와 조합된 crRNA 단편의 조합 또는 sgRNA 단독의 조합과 혼합되어 제1 표적유전자의 부위 특이적 편집을 유도해 내인성 선별 마커를 생성할 수 있으며, 선택적으로, 제2, 제3, 또는 그 이상의 표적유전자를 표적하는 최소한 1개의 인공적으로 합성된 crRNA 및 tracrRNA 단편 또는 인공적으로 합성된 sgRNA 단편이 추가적으로 첨가되며, RNP 복합체를 형성하기 위해 in vitro상에서 배양이 수행되는 단계;
    3) 상기 RNP 복합체가 수용 식물 세포 또는 조직 내로 전달되고 지놈 DNA의 특정 부위와 접촉해 유전자를 편집하는 단계;
    4) RNP 복합체의 제1 표적유전자의 부위 특이적 편집으로 생성된 표현형으로 선별가능한 형질에 따라, 상응하는 선별압력이 적용되어 형질의 선별이 이루어지고, 편집 이벤트를 포함한 세포, 조직, 기관 또는 완전한 식물체가 분리되며, 선택적으로 제1 표적유전자 및 최소한 1개의 제2, 제3 또는 그 이상의 표적유전자의 편집 이벤트를 가진 세포, 조직, 기관 또는 완전한 식물체가 분리되는 단계.
  67. 제66항에 있어서, 상기 제1 표적유전자는 최소한 1개의 표현형으로 선별가능한 형질을 인코딩하는 유전자 좌이고, 상기 최소한 1개의 표현형으로 선별가능한 형질은 저항성/내성 형질 또는 성장에 이점을 갖는 형질인 지놈의 편집 방법.
  68. 제66항 또는 제67항 중 어느 한 항에 있어서, 상기 제1 표적유전자의 특정 부위는 순차적인 DNA 절단과 복구 이후에 특정 유형의 돌연변이가 발생되는 부위이며, 이는 수용 세포에 특정 선별압력에 대한 저항성을 부여하여 최소한 1개의 표현형으로 선별가능한 저항성/내성 형질 또는 성장에 이점을 갖는 형질을 생산할 수 있는 것인 지놈의 편집 방법.
  69. 제68항에 있어서, 상기 특정 유형의 돌연변이는 단일 염기의 치환, 복수의 염기의 치환, 또는 불특정 개수의 염기의 삽입 또는 결실을 포함하는 것인 지놈의 편집 방법.
  70. 제68항 또는 제69항 중 어느 한 항에 있어서, 상기 특정 선별압력은 환경적 압력 또는 첨가된 화합물에 의한 압력이며; 상기 환경적 압력은 바람직하게는 고온, 저온 또는 저산소증이고; 상기 첨가된 화합물에 의한 압력은 바람직하게는 염 이온 농도, 항생제, 세포독소 또는 제초제로 인한 압력인 지놈의 편집 방법.
  71. 제66항 내지 제70항 중 어느 한 항에 있어서, 상기 수용 식물 세포 또는 조직은 일시적 발현을 위한 수용체로 작용할 수 있고 조직배양을 통해 완전한 식물체로 재생될 수 있는 임의의 세포 또는 조직이며; 상기 세포는 바람직하게는 원형질체 세포 또는 현탁 세포이며; 상기 조직은 바람직하게는 캘러스, 미성숙 배, 성숙한 배, 잎, 새싹 끝, 어린 스파이크 또는 배축인 지놈의 편집 방법.
  72. 제66항 내지 71항 중 어느 한 항에 있어서, 상기 CRISPR/Cas 단백질은 지놈 편집을 수행할 수 있는 임의의 CRISPR/Cas 뉴클레아제인 지놈의 편집 방법.
  73. 제66항 내지 72항 중 어느 한 항에 있어서, 상기 특정 부위에서 2개 이상의 DNA 절단을 순차적으로 생성시키는 특성은 CRISPR/Cas 시스템에 의해 생성된 이전의 DNA 절단 복구 이벤트에 의해 형성된 새로운 서열에 기초하여, 해당 부위를 다시 절단하기 위해 새로운 표적RNA가 설계되는 것인 지놈의 편집 방법.
  74. 제66항 내지 제73항 중 어느 한 항에 있어서, 상기 2개 이상의 DNA 절단은 동일한 CRISPR/Cas 뉴클레아제와 상이한 gRNAs 또는 sgRNAs로부터 각각 형성된 RNP 복합체가 상응하는 표적서열을 순차적으로 절단할 때 생성되는 것인 지놈의 편집 방법.
  75. 제66항 내지 제73항 중 어느 한 항에 있어서, 상기 2개 이상의 DNA 절단은 상이한 PAM 서열을 인식하는 2개 이상의 각각의 CRISPR/Cas 뉴클레아제와 각각의 gRNA 또는 sgRNA로 각각 형성된 RNP 복합체가 상응하는 표적서열을 순차적으로 절단할 때 생성되는 것인 지놈의 편집 방법.
  76. 제66항 내지 제75항 중 어느 한 항에 있어서, 상기 제2, 제3 또는 그 이상의 표적유전자는 제1 표적유전자와 코딩이 상이한 다른 유전자인 지놈의 편집 방법.
  77. 제66항 내지 제76항 중 어느 한 항에 있어서, 상기 제2, 제3, 또는 그 이상의 표적유전자를 표적하는 최소한 1개의 인공적으로 합성된 crRNA 및 tracrRNA 단편 또는 인공적으로 합성된 sgRNA 단편은 제1 표적유전자를 표적하는 crRNA 또는 sgRNA와 동일한 Cas 단백질을 공유하는 것인 지놈의 편집 방법.
  78. 제66항 내지 제76항 중 어느 한 항에 있어서, 상기 제2, 제3, 또는 그 이상의 표적유전자를 표적하는 최소한 1개의 인공적으로 합성된 crRNA 및 tracrRNA 단편 또는 인공적으로 합성된 sgRNA 단편은 제1 표적유전자를 표적하는 crRNA 또는 sgRNA와 상이한 PAM 서열을 인식하는 Cas 단백질을 사용하는 것인 지놈의 편집 방법.
  79. 제66항 내지 78항 중 어느 한 항에 있어서, 상기 RNP 복합체를 식물 세포 내로 전달하는 방법은 다음 중에서 선택되는 것인 지놈의 편집 방법: 1) PEG-매개 원형질체 형질전환 방법; 2) 미세주입법; 3) 유전자 총 충격 방법; 4) 탄화규소섬유-매개 방법; 또는 5) 진공 침투 방법, 또는 임의의 다른 일시적 도입 방법.
  80. 제66항 내지 제79항 중 어느 한 항에 있어서, 상기 제1 표적유전자는 제초제 저항성/내성으로 선별되는 최소한 1개의 표현형으로 선별가능한 형질을 인코딩하는 최소한 1개의 내인성 유전자이며, 상기 제초제 저항성/내성은 EPSPS 억제제에 대한 저항성/내성, 글루타민 합성 억제제에 대한 저항성/내성, ALS 또는 AHAS 억제제에 대한 저항성/내성, ACCase 억제제에 대한 저항성/내성, 카로티노이드 생합성 억제제에 대한 저항성/내성, 셀룰로오스 억제제에 대한 저항성/내성, 지질 합성 억제제에 대한 저항성/내성, 장쇄 지방산 억제제에 대한 저항성/내성, 미세소관 조립 억제제에 대한 저항성/내성, 광계1 전자 션트제에 대한 저항성/내성, 광계2 억제제에 대한 저항성/내성, 또는 PPO 억제제에 대한 저항성/내성, 및 합성 성장호르몬에 대한 저항성/내성 중에서 선택되는 것이며; 바람직하게는, 제1 표적유전자는 PsbA, ALS, EPSPS, ACCase, PPO, HPPD, PDS, GS, DOXPS, TIR1 또는 AFB5로부터 선택되는 것인 지놈의 편집 방법.
  81. 제80항에 있어서, 상기 제1 표적유전자는 ALS이고, 상기 유전자의 특정 부위는 Arabidopsis AtALS 단백질 아미노산 서열내의 A122, P197, R198, D204, A205, D376, R377, W574, S653 또는 G654 부위, 및 AtALS 아미노산 서열을 참조 표준으로 사용한 상기 아미노산 부위에 상응하는 다른 식물의 ALS 단백질내의 아미노산 부위를 지칭; 또는
    crRNA 또는 sgRNA는 A122, P197, R198, D204, A205, D376, R377, W574, S653, G654 또는 이들의 임의의 조합으로 이루어진 군에서 선택된 AtALS 단백질 아미노산 서열 부위를 포함하는 표적서열, 및 AtALS 아미노산 서열을 참조 표준으로 사용한, 상기 아미노산 부위에 상응하는 다른 식물의 ALS 단백질내의 아미노산 부위 및 이들의 임의의 조합을 인코딩하는 서열을 포함하는 표적서열을 표적하는 것인 지놈의 편집 방법.
  82. 제80항에 있어서, 상기 제1 표적유전자는 ACCase이며, 상기 유전자의 특정 부위는 Alopecurus myosuroides AmACCase 단백질 아미노산 서열내의 I1781, E1874, N1878, W1999, W2027, I2041, D2078, C2088 또는 G2096 부위, 및 AmACCase 아미노산 서열을 참조 표준으로 사용한, 상기 아미노산 부위에 상응하는 다른 단자엽 식물의 ACCase 단백질 내의 아미노산 부위를 지칭하며; 또는
    crRNA 또는 sgRNA는 I1781, E1874, N1878, W1999, W2027, I2041, D2078, C2088, G2096 또는 이들의 임의의 조합으로 이루어진 군에서 선택된 AmACCase 아미노산 서열 부위를 포함하는 표적서열, 및 AmACCase 아미노산 서열을 참조 표준으로 사용한, 상기 아미노산 부위에 상응하는 다른 단자엽 식물의 ACC 단백질의 아미노산 부위 및 이들의 임의의 조합을 인코딩하는 서열을 포함하는 표적서열을 표적하는 것인 지놈의 편집 방법.
  83. 제80항에 있어서, 상기 제1 표적유전자는 HPPD이며, 상기 유전자의 특정 부위는 Oryza sativa OsHPPD 단백질 아미노산 서열내의 H141, L276, P277, N338, G342, R346, D370, P386, K418 또는 G419 부위, 및 OsHPPD 아미노산 서열을 참조 표준으로 사용한, 상기 아미노산 부위에 상응하는 다른 식물의 HPPD 단백질 내의 아미노산 부위를 지칭하며; 또는
    crRNA 또는 sgRNA는 H141, L276, P277, N338, G342, R346, D370, P386, K418, G419 또는 이들의 임의의 조합으로 이루어진 군에서 선택된 OsHPPD 아미노산 서열 부위를 포함하는 표적서열, 및 OsHPPD 아미노산 서열을 참조 표준으로 사용한, 상기 아미노산 부위에 상응하는 다른 식물의 HPPD 단백질의 아미노산 부위 및 이들의 임의의 조합을 인코딩하는 서열을 포함하는 표적서열을 표적하는 것인 지놈의 편집 방법.
  84. 제80항에 있어서, 상기 제1 표적유전자는 PPO이며, 상기 유전자의 특정 부위는 Oryza sativa OsPPO1 단백질 아미노산 서열내의 S128, V217, S223, V364, K373, L423, Y425 또는 W470 부위, 및 OsPPO1 아미노산 서열을 참조 표준으로 사용한, 상기 아미노산 부위에 상응하는 다른 식물의 PPO 단백질 내의 아미노산 부위를 지칭하며; 또는
    crRNA 또는 sgRNA는 S128, V217, S223, V364, K373, L423, Y425, W470 또는 이들의 임의의 조합으로 이루어진 군에서 선택된 OsPPO1 아미노산 서열 부위를 포함하는 표적서열, 및 OsPPO1 아미노산 서열을 참조 표준으로 사용한, 상기 아미노산 부위에 상응하는 다른 식물의 PPO 단백질의 아미노산 부위 및 이들의 임의의 조합을 인코딩하는 서열을 포함하는 표적서열을 표적하는 것인 지놈의 편집 방법.
  85. 제80항에 있어서, 상기 제1 표적유전자는 TIR1이며, 상기 유전자의 특정 부위는 Oryza sativa OsTIR1 단백질 아미노산 서열내의 F93, F357, C413 또는 S448부위, 및 OsTIR1 아미노산 서열을 참조 표준으로 사용한, 상기 아미노산 부위에 상응하는 다른 식물의 TIR1 단백질 내의 아미노산 부위를 지칭하며; 또는
    crRNA 또는 sgRNA는 F93, F357, C413, S448 또는 이들의 임의의 조합으로 이루어진 군에서 선택된 OsTIR1 아미노산 서열 부위를 포함하는 표적서열, 및 OsTIR1 아미노산 서열을 참조 표준으로 사용한, 상기 아미노산 부위에 상응하는 다른 식물의 TIR1 단백질의 아미노산 부위 및 이들의 임의의 조합을 인코딩하는 서열을 포함하는 표적서열을 표적하는 것인 지놈의 편집 방법.
  86. 제53항 내지 제85항 중 어느 한 항의 지놈의 편집방법을 사용하는 비-형질전환적 일시적인 편집 시스템.
  87. 제86항의 비-형질전환적 일시적인 편집 시스템의 선별 마커 또는 질병치료 또는 생물학적 육종에서의 용도.
  88. 제66항 내지 제85항 중 어느 한 항에 따른 지놈의 편집 방법에 의해 얻어진 유전자 변형 식물, 상기 식물의 지놈은 다음을 포함함:
    1) 제1 표적유전자의 편집 이벤트;
    2) 제1 표적유전자의 편집 이벤트 및 최소한 1개의 제2 표적유전자의 편집 이벤트; 또는
    3) 유전적 분리에 의해 제1 표적유전자의 편집 이벤트가 제거된 최소한 1개의 제2 표적유전자 편집 이벤트;
    상기 유전자 변형 식물은 비-형질전환적 방법으로 얻어짐.
  89. 제66항 내지 제85항 중 어느 한 항에 따른 지놈 편집 방법에 의해 얻어진 새로운 식물 유전자 돌연변이.
  90. 다음 유형 중 하나 또는 둘 이상의 조합을 포함하는 식물에서 발생된 새로운 돌연변이:
    Arabidopsis ALS376에 상응하는 부위의 아스파르트산이 임의의 다른 아미노산으로 치환, Arabidopsis ALS574에 상응하는 부위의 트립토판이 임의의 다른 아미노산으로 치환, Arabidopsis ALS653에 상응하는 부위의 세린이 임의의 다른 아미노산으로 치환, 또는 Arabidopsis ALS654에 상응하는 부위의 세린이 임의의 다른 아미노산으로 치환; 또는 Alopecurus myosuroides ACCase2027에 상응하는 부위의 트립토판이 임의의 다른 아미노산으로 치환.
  91. 제90항에 있어서, 상기 Arabidopsis ALS376에 상응하는 부위의 아스파르트산이 글루탐산으로 치환, Arabidopsis ALS574에 상응하는 부위의 트립토판이 류신 또는 메티오닌으로 치환, Arabidopsis ALS653에 상응하는 부위의 세린이 아스파라긴 또는 아르기닌으로 치환, 또는 Arabidopsis ALS654에 상응하는 부위의 글라이신이 아스파르트산으로 치환; 또는, Alopecurus myosuroides ACCase2027에 상응하는 부위의 트립토판이 류신 또는 시스테인으로 치환된 식물에서 발생된 새로운 돌연변이.
  92. 제90항에 있어서, Oryza sativa ALS의 350 부위에 있는 아스파르트산이 임의의 다른 아미노산으로 치환, Oryza sativa ALS의 548 부위에 있는 트립토판이 임의의 다른 아미노산으로 치환, 또는 Solanum tuberosum L. ALS2의 561 부위에 있는 트립토판이 임의의 다른 아미노산으로 치환; 또는, Oryza sativa ACCase2의 2038 부위에 있는 트립토판이 임의의 다른 아미노산으로 치환된 식물에서 발생된 새로운 돌연변이.
  93. 제90항 내지 제92항 중 어느 한 항에 있어서, 상기 Oryza sativa ALS의 350 부위에 있는 아스파르트산이 글루탐산으로 치환, Oryza sativa ALS의 548 부위에 있는 트립토판이 류신 또는 메티오닌으로 치환, 또는 Solanum tuberosum L. ALS2의 561 부위에 있는 트립토판이 류신 또는 메티오닌으로 치환; 또는, Oryza sativa ACCase2의 2038 부위에 있는 트립토판이 류신 또는 시스테인으로 치환된 식물에서 발생된 새로운 돌연변이.
  94. 제89항 내지 제93항 중 어느 한 항에 따른 새로운 돌연변이를 포함하는 단백질 또는 그 생물학적 활성 단편.
  95. 제94항에 따른 단백질 또는 그 생물학적 활성 단편을 인코딩하는 핵산 서열 또는 그 상보적 서열을 포함하는 핵산.
  96. 제95항에 따른 핵산 및 그와 작동가능하게 연결된 프로모터를 포함하는 재조합 발현 벡터.
  97. 제95항에 따른 핵산을 포함하는 발현 카세트.
  98. 제97항에 따른 발현 카세트를 포함하는 식물 세포.
  99. 제98항에 따른 식물 세포를 사용하여 재생된 식물체.
  100. 제96항에 따른 재조합 발현 벡터 또는 제97항에 따른 발현 카세트로 식물 세포를 형질전환 또는 형질주입시키는 단계, 및 형질전환 또는 형질감염된 식물 세포를 식물체로 재생시키는 것을 포함하는 제초제 저항성 또는 내성이 향상된 식물을 제조하는 방법.
  101. 제88항 또는 제99항에 따른 식물 또는 제100항에 따른 방법에 의해 생산된 식물을 포함하는 식물 재배 장소에서 잡초를 방제하는 방법으로서, 상기 방법은 1개 이상의 제초제를 잡초를 제거하기 위한 효과적인 양으로 적용하는 것을 포함하는 것인 잡초를 방제하는 방법.
  102. 제89항 내지 제93항 중 어느 한 항에 따른 새로운 돌연변이, 제94항에 따른 단백질 또는 그 생물학적 활성 단편, 제95항에 따른 핵산, 제96항에 따른 재조합 발현 벡터, 또는 제97항에 따른 발현 카세트의, 식물 세포, 식물 조직, 식물 부분, 식물체의 제초제에 대한 저항성 또는 내성을 향상시키는 용도.

KR1020227015940A 2019-11-07 2020-10-13 유기체에서 새로운 돌연변이를 발생시키는 방법 및 그 활용 KR20220093324A (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
CN201911081617.X 2019-11-07
CN201911081617 2019-11-07
CN202010821877.2 2020-08-15
CN202010821877 2020-08-15
CN202010974151.2 2020-09-16
CN202010974151 2020-09-16
PCT/CN2020/120633 WO2021088601A1 (zh) 2019-11-07 2020-10-13 一种在生物体内产生新突变的方法及应用

Publications (1)

Publication Number Publication Date
KR20220093324A true KR20220093324A (ko) 2022-07-05

Family

ID=74243079

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227015940A KR20220093324A (ko) 2019-11-07 2020-10-13 유기체에서 새로운 돌연변이를 발생시키는 방법 및 그 활용

Country Status (13)

Country Link
US (1) US20230287389A1 (ko)
EP (1) EP3889266A4 (ko)
JP (1) JP2023500357A (ko)
KR (1) KR20220093324A (ko)
CN (1) CN112251419B (ko)
AU (1) AU2020378387A1 (ko)
BR (1) BR112022008916A2 (ko)
CA (1) CA3159682A1 (ko)
CL (1) CL2021003593A1 (ko)
IL (1) IL289541A (ko)
MX (1) MX2022001245A (ko)
WO (1) WO2021088601A1 (ko)
ZA (1) ZA202203920B (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115161316A (zh) * 2021-04-02 2022-10-11 上海科技大学 一种引导编辑工具、融合rna及其用途
CN113846075A (zh) * 2021-11-29 2021-12-28 科稷达隆(北京)生物技术有限公司 Mad7-nls融合蛋白、用于植物基因组定点编辑的核酸构建物及其应用
CN114145231B (zh) * 2021-12-16 2022-09-13 广西壮族自治区中国科学院广西植物研究所 一种二色波罗蜜种苗快速繁殖方法
CN117987447A (zh) * 2022-11-02 2024-05-07 广州大学 一种真核细胞持续进化的控制方法及其应用
CN115644067B (zh) * 2022-12-09 2023-03-14 云南省农业科学院药用植物研究所 一种生产滇黄精双单倍体的方法
CN116286869B (zh) * 2023-03-23 2024-04-05 石河子大学 一种羽毛针禾糖转运蛋白基因SpSWEET14在提高植物抗寒性中的应用
CN116410989B (zh) * 2023-05-12 2024-06-14 云南农业大学 一种病毒诱导的三七pds基因沉默体系及应用
CN117918260B (zh) * 2024-03-21 2024-05-24 西南林业大学 一种云南松组培苗的繁殖方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101668419B (zh) * 2007-04-04 2016-03-23 巴斯福植物科学有限公司 Ahas突变体
US20120005773A1 (en) * 2008-10-01 2012-01-05 Aasen Eric D Transgenic plants with enhanced agronomic traits
WO2015024957A1 (en) * 2013-08-21 2015-02-26 Bayer Cropscience Nv Als inhibitor herbicide tolerant mutant plants
US20160298129A1 (en) * 2013-12-02 2016-10-13 Bayer Cropscience Nv Als inhibitor herbicide tolerant mutant plants
BR112018011133A2 (pt) * 2015-11-30 2018-11-21 Univ Duke alvos terapêuticos para a correção do gene humano de distrofina por edição de gene e métodos de uso
US20170314033A1 (en) * 2016-05-02 2017-11-02 Ohio State Innovation Foundation Herbicide-resistant taraxacum kok-saghyz and taraxacum brevicorniculatum
AU2018212986A1 (en) * 2017-01-28 2019-08-08 Inari Agriculture Technology, Inc. Novel plant cells, plants, and seeds
CN108795972B (zh) * 2017-05-05 2023-07-14 苏州齐禾生科生物科技有限公司 不使用转基因标记序列分离细胞的方法
JP2020518253A (ja) * 2017-05-05 2020-06-25 インスティテュート・オブ・ジェネティクス・アンド・ディヴェロプメンタル・バイオロジー、チャイニーズ・アカデミー・オブ・サイエンシズInstitute of Genetics and Developmental Biology, Chinese Academy of Sciences トランスジェニックマーカー配列を使用せず細胞を単離する方法
BR112019023377A2 (pt) * 2017-05-11 2020-06-16 Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences Criação de um gene resistente a herbicida e uso do mesmo
CN110157727A (zh) * 2017-12-21 2019-08-23 中国科学院遗传与发育生物学研究所 植物碱基编辑方法
CA3087715A1 (en) * 2018-02-08 2019-08-15 Zymergen Inc. Genome editing using crispr in corynebacterium
WO2019196717A1 (zh) * 2018-04-13 2019-10-17 青岛清原化合物有限公司 一种随机突变的基因编辑系统及其应用
US20190330643A1 (en) * 2018-04-25 2019-10-31 The Catholic University Of America Engineering of bacteriophages by genome editing using the crispr-cas9 system
CN109536527A (zh) * 2018-11-27 2019-03-29 中国科学院动物研究所 一种基因点突变修复的新方法

Also Published As

Publication number Publication date
CL2021003593A1 (es) 2022-08-19
BR112022008916A2 (pt) 2022-08-02
EP3889266A4 (en) 2022-08-10
IL289541A (en) 2022-03-01
ZA202203920B (en) 2023-11-29
JP2023500357A (ja) 2023-01-05
AU2020378387A1 (en) 2022-01-20
CN112251419B (zh) 2023-11-10
CA3159682A1 (en) 2021-05-14
US20230287389A1 (en) 2023-09-14
WO2021088601A1 (zh) 2021-05-14
EP3889266A1 (en) 2021-10-06
TW202130813A (zh) 2021-08-16
CN112251419A (zh) 2021-01-22
MX2022001245A (es) 2022-02-22

Similar Documents

Publication Publication Date Title
KR20220093324A (ko) 유기체에서 새로운 돌연변이를 발생시키는 방법 및 그 활용
EP4074832A1 (en) Method for creating new gene in organism and use thereof
US20210230563A1 (en) Mutant p-hydroxyphenylpyruvate dioxygenase, and coding nucleic acid and use thereof
CN101978064A (zh) 具有改变的生长和/或发育的植物及其生产方法
TW201825678A (zh) 用於建立靶向重組及中斷性狀之間之連鎖的方法及組成物
US20180208939A1 (en) Modified plants
CN115354039A (zh) 在生物体内创制新基因的方法及应用
CN110621154A (zh) 用于植物的除草剂耐受性的方法和组合物
US20220098605A1 (en) Genetic regulatory element
BR112015030105B1 (pt) Construção de gene quimérico, vetor recombinante, usos dos mesmos, bem como método para a produção de uma planta monocotiledônea com maior rendimento em comparação com uma planta monocotiledônea do tipo selvagem correspondente
WO2018098420A1 (en) Induction of haploid plants using baby boom1 gene
WO2022129579A1 (en) Modulating plant responses to activities of pathogen virulence factors
US20230323384A1 (en) Plants having a modified lazy protein
CA3124395A1 (en) Native delivery of biomolecules into plant cells using ionic complexes with cell-penetrating peptides
CN101548016B (zh) 产率相关性状增强的植物及使用来自yabby蛋白家族的共有序列制备其的方法
TWI840629B (zh) 一種產生突變的基因的方法
CA3194195A1 (en) Genetic regulatory element
Petolino et al. Plant cell culture: a critical tool for agricultural biotechnology
WO2019150200A2 (en) Dna free crispr plant transformation
WO2024133272A1 (en) Increased editing efficiency by co-delivery of rnp with nucleic acid
OA21191A (en) Method for creating new gene in organism and use thereof.
RU2781830C2 (ru) Мутантная п-гидроксифенилпируватдиоксигеназа, нуклеиновая кислота, кодирующая ее, и их применение
CA3240766A1 (en) Use of tawox for improving regeneration of plant cells
AU2022417496A1 (en) Use of tawox for improving regeneration of plant cells

Legal Events

Date Code Title Description
A201 Request for examination