KR20220032126A - 표적 핵산의 변형을 위한 개선된 방법 - Google Patents

표적 핵산의 변형을 위한 개선된 방법 Download PDF

Info

Publication number
KR20220032126A
KR20220032126A KR1020227006922A KR20227006922A KR20220032126A KR 20220032126 A KR20220032126 A KR 20220032126A KR 1020227006922 A KR1020227006922 A KR 1020227006922A KR 20227006922 A KR20227006922 A KR 20227006922A KR 20220032126 A KR20220032126 A KR 20220032126A
Authority
KR
South Korea
Prior art keywords
nucleic acid
molecule
lys
leu
vector
Prior art date
Application number
KR1020227006922A
Other languages
English (en)
Other versions
KR102506185B1 (ko
Inventor
린더트 더블유 뉴트붐
존 에이 맥엘버
로사 데 핀호 바로코
크리스 데 빌데
막스 파비앙 펠레
Original Assignee
바스프 플랜트 사이언스 컴퍼니 게엠베하
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=58640844&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR20220032126(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 바스프 플랜트 사이언스 컴퍼니 게엠베하 filed Critical 바스프 플랜트 사이언스 컴퍼니 게엠베하
Priority to KR1020237007132A priority Critical patent/KR20230038804A/ko
Publication of KR20220032126A publication Critical patent/KR20220032126A/ko
Application granted granted Critical
Publication of KR102506185B1 publication Critical patent/KR102506185B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8274Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/905Stable introduction of foreign DNA into chromosome using homologous recombination in yeast
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Veterinary Medicine (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Virology (AREA)
  • Communicable Diseases (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Oncology (AREA)
  • Peptides Or Proteins (AREA)
  • Epidemiology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • AIDS & HIV (AREA)

Abstract

표적 핵산의 변형을 위한 방법. 방법은 가이드 RNA가 공여자 RNA에 공유 연결된 구축물 (융합 NA)이 상동 재조합에 의해 표적 핵산 내로 도입되는 것을 수반하고, 표적 핵산을 함유하는 세포 내로의 뉴클레아제, 예를 들어 CRISPR 또는 TALEN의 도입에 기초한다. 융합 NA는 DNA 벡터로서 도입될 수 있다.

Description

표적 핵산의 변형을 위한 개선된 방법{IMPROVED METHODS FOR MODIFICATION OF TARGET NUCLEIC ACIDS}
본 발명은 표적 핵산의 변형을 위한 개선된 방법에 관한 것이다.
본 발명의 설명
CRISPR (클러스터링된 규칙적 간격의 짧은 회문식 반복부) 시스템은 처음에 스트렙토코쿠스(Streptococcus) 속에 속하는 박테리아의 적응성 방어 메카니즘으로서 확인되었다 (WO2007/025097). 이들 박테리아 CRISPR 시스템은 침입 바이러스 DNA 내에 존재하는 상보적 서열의 분해를 지시하는 절단 단백질과 복합체화된 가이드 RNA (gRNA)에게 의존한다. CRISPR/Cas 시스템의 최초로 확인된 단백질인 Cas9는 2개의 비코딩 RNA: crRNA 및 트랜스-활성화 crRNA (tracrRNA)의 복합체에 의해 PAM (프로토스페이서 인접 모티프) 서열 모티프에 인접한 DNA 표적 서열로 가이드되는 대형 단량체 DNA 뉴클레아제이다. 이후에, crRNA를 tracrRNA와 융합시키는 것에 의해 생성된 합성 RNA 키메라 (단일 가이드 RNA 또는 gRNA)는 동등하게 기능적인 것으로 나타났다 (Jinek et al. 2012).
여러 연구 군은 CRISPR 절단 특성이 전례없이 용이하게 대부분의 임의의 유기체의 게놈에서 유전자를 파괴하는데 사용될 수 있었다는 것을 밝혀냈다 (Mali P, et al. (2013) Science. 339(6121):819-823; Cong L, et al. (2013) Science 339(6121)). 최근에는, 복구를 위한 주형을 제공하는 것이 게놈을 거의 모든 부위에서 거의 모든 목적하는 서열로 편집하도록 하여, CRISPR을 강력한 유전자 편집 도구로 전환시킨다는 것이 명백해졌다 (WO/2014/150624, WO/2014/204728).
유전자 표적화는 상동 재조합 (HR)을 통한 핵산 결실, 삽입 또는 대체에 의한 부위 특이적 유전자 변형을 지칭한다. 표적화 효율은 게놈 표적에서 이중-가닥 절단 (DSB)에 의해 고도로 촉진된다. 또한, 염색체 DNA의 DSB 후에 상동성의 직접적 존재는 상동 재조합을 위해 비-상동성 말단 연결 (NHEJ) 복구를 거의 제거하는 것으로 보인다.
당면한 본 발명은 핵산 변형 폴리펩티드와 상호작용하는 HR 복구를 위한 적절한 공여자에 융합된 가이드 핵산 (적어도 하나의 공여자 핵산 (doNA) 분자에 공유 연결된 가이드 핵산 (gNA) 분자를 포함하는 융합 핵산 (fuNA) 분자)을 제공한다. 뉴클레아제 절단 부위에 플랭킹된 표적 DNA에 대한 상동성을 갖는 공여자 핵산의 전달을 개선하기 위해, 유전자 표적화 전략은 공여자 핵산 (doNA)이 CRISPR 성분에 공유 연결된 곳에 제시된다. 이 방식으로, 유전자 편집 복합체는 필요한 인식 및 절단 도구뿐 아니라 변형을 위한 주형을 포함한다. 가이드 핵산 (gNA)에 의해 인식되면, 뉴클레아제는 표적 영역을 절단하고, 즉시 동시발생하는 유입되는 공여자의 존재는 HR 과정을 용이하게 할 것이며, 그로 인해 유전자 복구 효능을 증가시킨다.
많은 미생물 시스템은 효율적 NHEJ 시스템이 결여되어 있다 [Standage-Beier K, Zhang Q, Wang X (2015) Targeted Large-Scale Deletion of Bacterial Genomes Using CRISPR-Nickases. ACS Synth Biol. 4(11): 1217-1225]. 예를 들어, 바이오에너지 연구에 중요한 클로스트리디움 셀룰롤리티쿰(Clostridium cellulolyticum)은 CRISPR/Cas9에 의해 용이하게 조작될 수 없고 [Xu T, Li Y, Shi Z, Hemme CL, Li Y, Zhu Y, Van Nostrand JD, He Z, Zhou J (2015) Efficient Genome Editing in Clostridium cellulolyticum via CRISPR-Cas9 Nickase. Appl Environ Microbiol. 81(13):4423-31], DSB를 도입하는 것에 의해 유전자를 녹아웃 하는 시도는 세포 사멸을 발생시킨다. 또 다른 예는 DSB 복구를 위해 상동 재조합 (HR)에 또한 의존하는 에스케리키아 콜라이(Escherichia coli)이다. 이러한 유기체에서의 게놈 편집을 위한 현재 기술은, 뉴클레아제 작용을 조정하기 위해 비-융합된 핵산 공여자, 유도성 CRISPR/Cas 발현을 통해 후속하는 비효율적 복구를 나타내는 CRISPR/Cas9-기반 니카제를 사용하는 것 및 맞춤 DNA 서열을 다루는 데 있어서 유연성이 결여된 핵산 공여자 또는 레콤비나제를 도입하는 것에 집중되어 있다.
fuNA 분자를 포함하는 CRISPR/Cas 또는 CRISPR/Cas 유사 시스템을 제공 및/또는 적용하는 것인, 융합CRISPR(FusionCRISPR) 기술의 적용은 이전에 고처리량 표적화에 적용가능하지 않았던 매우 다양한 미생물 종에서 녹아웃의 생성을 간단하게 할 것이다. 이중 가닥 절단 (DSB)의 유도 시에 신속하게 공여자 핵산을 제공함으로써, HR 복구 기구는 절단부를 동반되는 주형에 성공적으로 라이게이션할 것이다. 융합CRISPR의 도입은 다르게는 CRISPR/Cas9의 닉킹 버전, 레콤비나제 또는 임의의 다른 관심 (트랜스)유전자의 도입을 위해 사용되는 통상의 기술에 의해 수행된다. 이들 기술은 플라스미드의 전기천공/열 쇼크, 바이러스 형질도입 및 접합을 포함하나, 이에 제한되지는 않는다.
효율적 NHEJ를 갖는 유기체 내의 유전자는 가이드 RNA가 (1) 표적 유전자에 매칭되는 스페이서 (2) ~99개의 뉴클레오티드의 전형적 길이를 갖는 정확한 가이드 RNA 폴딩을 위한 필수 서열 (tracrRNA: 하나의 단일 가이드 RNA (sgRNA)에 통상적으로 조합된 crRNA)로 이루어지는 CRISPR/Cas9를 도입함으로써 녹아웃될 수 있는 반면에, DSB-감수성 미생물에서의 녹아웃은 하기 조성: (1) 스페이서 (2) 정확한 2차 구조을 위한 필수 서열 (3) 표적에 매칭되는 적어도 15개의 뉴클레오티드 (4) 표적에 매칭되는 제1의 적어도 15개의 뉴클레오티드로부터 하나 이상의 염기만큼 하류에 있는, 표적에 매칭되는 적어도 15개의 뉴클레오티드를 생성하는 RNA의 간단한 적응을 통해 달성될 수 있다. 녹아웃 융합CRISPR 카세트를 나타내는 2개의 상보적 ssDNA 올리고뉴클레오티드는 임의의 올리고 합성 회사로부터 상업적으로 용이하게 구입될 수 있다. 대안적으로, 그것은 dsDNA로서 합성될 수 있다. 융합CRISPR 녹아웃 카세트의 클로닝은 일반 CRISPR 카세트에서 의도된 표적을 위한 20개의 뉴클레오티드 스페이서를 유형 IIS 제한 효소에 의해 클로닝하는 것에 관한 가장 통상적인 방법과 유사하게 진행될 수 있다. 따라서, 융합CRISPR을 통한 제어된 유전자 녹아웃의 사용의 접근성, 유연성 및 용이성은 일반 CRISPR/Cas9에 필적하고, 본 발명은 NHEJ가 비효율적이거나 부재하는 표적 종까지 고처리량 녹아웃을 확장한다.
융합CRISPR은 또한 임의의 유기체 내의 녹인(knock-in)을 위해 사용될 수 있다. 선택 마커는 단순한 플라스미드를 포함하는 표준 도입 기술 및 표준 발현 비히클을 사용하여 녹인될 수 있다. 이것은 선택 용이성을 제공하면서 내인성 유전자를 방해하고 녹아웃하기 위해 행해질 수 있다.
인간 및 다른 세포에서의 게놈-규모 녹아웃은 질환, 약물 반응 및 정상적인 생물학적 과정에 수반되는 유전자의 발견 및 질환 모델의 생성을 가능하게 한다 [Shalem O, Sanjana NE, Hartenian E, Shi X, Scott DA, Mikkelsen TS, Heckl D, Ebert BL, Root DE, Doench JG, Zhang F (2014) Genome-scale CRISPR-Cas9 knockout screening in human cells. Science ;343(6166):84-7]. 녹아웃은 전형적으로 특이적 표적을 위한 CRISPR/Cas9의 도입에 의해 생성되고 해당 유전자를 위한 "널(null)"을 생성하기 위해 NHEJ에게 의지한다. 이 방법에 있어서 3가지 주요 문제점이 나타난다: (1) NHEJ 복구가 프레임 시프트를 발생시키지 않기 때문에 (또는 대안적 하류 개시 코돈이 사용되어 말단절단된 유전자 산물을 생성하기 때문에) 녹아웃이 종종 생성되지 않고, (2) 결과, 즉, 정확한 1차 DNA 서열은 알려져 있지 않고, 각각의 DNA 변형 "사건"에 대해 결정될 필요가 있으며, 이는 비용이 들고 시간 소모적이고, (3) 이배체 또는 배수체 유기체에서, 모든 이용가능한 "기질"에 대한 성공적 표적화가 심지어 첫 번째 장소에서 달성되어 복잡한 분자 분석 및/또는 반수체 모델 라인으로의 강제 전환을 발생시킨다면, 각각의 염색체에 대한 NHEJ 복구는 상이하게 일어날 것이다 [Wade M (2015) High-throughput silencing using the CRISPR-Cas9 system: A review of the benefits and challenges. Journal of Biomolecular Screening, Vol. 20(8):1027-39]. 융합CRISPR은 상기 기재된 바와 같이 결실의 제어를 가능하게 하며, 이는 예측할 수 있는 결과를 이끈다. 이배체 및 배수체 세포 시스템에서 각각의 염색체에 대한 임의의 도입된 변형은 대부분은 동일할 것이다. 결실은 대안적 전사 가능성이 감소되도록 충분히 크게 설계될 수 있고, 결실이 3으로 나누어질 수 없는 수의 염기로 이루어지도록 설계함으로써, 단지 아미노산의 짧은 스트레치가 결여된 기능적 단백질을 여전히 생성할 위험이 제거될 것이다.
임의의 세포 시스템에서 녹아웃을 제어하기 위해 설계된 융합CRISPR 구성을 도입하는 방법은 녹아웃의 생성을 위한 NHEJ 복구가 이어지는 CRISPR/Cas9의 도입에 사용된 방법과 동일하다. 이것은 곤충 세포의 바큘로바이러스 발현 시스템에 대해 인간 세포를 위한 AAV 및 렌티바이러스 벡터를 사용하는 것을 포함하나, 이에 제한되지는 않는다. 상기 기재된 바와 같이 가이드RNA의 짧은 확장 외에 현재 방법에 대한 어떠한 추가적 적응도 필요하지 않다.
게놈 편집은 다양한 유전 장애를 치료하는데 사용될 수 있다. 많은 유전 장애는 필요한 교정(들)을 함유하는 교정 핵산 주형과 함께 부위 특이적 뉴클레아제를 제공함으로써 잠재적으로 교정될 수 있었던 점 돌연변이를 수반한다. 한 예는 β-글로빈 유전자의 제6 코돈에서의 단일 DNA 염기 돌연변이 (A>T)로부터 유래한 겸상 적혈구 질환이다 [Li C, Ding L, Sun CW, Wu LC, Zhou D, Pawlik KM, Khodadadi-Jamayran A, Westin E, Goldman FD, Townes TM (2016) Novel HDAd/EBV Reprogramming Vector and Highly Efficient Ad/CRISPR-Cas Sickle Cell Disease Gene Correction. Sci Rep. 6:30422]. 뉴클레아제 및 교정 주형을 개별적으로 제공하는 것에 의해 세포 내 돌연변이를 교정하는 것은 종종 DNA 내 미조정된 초기 손상 및 HDR 복구를 위한 교정 주형의 국부적 도착을 발생시킬 것이다. 시간적/공간적 조정 뉴클레아제 및 교정 주형의 결여를 보상하기 위해 농도는 비교적 높을 필요가 있다. 보다 높은 뉴클레아제 농도는 부정적 결과 (보다 높은 환자 위험 및/또는 분자 분석에서의 보다 높은 비용)를 나타내는 보다 높은 표적-이탈 절단으로 이어질 수 있다. 융합CRISPR은 훨씬 더 낮은 농도에 정확한 유전자 교정을 달성할 것이다. 융합CRISPR을 적용하는 방법은 관련 분야의 현재 표준과 동일하며 [Maeder ML, Gersbach CA (2016) Genome-editing Technologies for Gene and Cell Therapy. Mol Ther. 24(3):430-46] 유일한 차이는 목적하는 교정을 포괄하는 다소 더 긴 sgRNA이다.
융합CRISPR은 다양한 상이한 유기체에서 다양한 효소의 기질 또는 산물 특이성을 변경하는데 사용될 수 있다. 예를 들어, 단일 아미노산은 다양한 식물 종에서 트리테르펜 신타제 기질 및 산물 특이성의 주요 결정인자인 것으로 밝혀졌다 [Salmon M, Thimmappa RB, Minto RE, Melton RE, Hughes RK, O'Maille PE, Hemmings AM, Osbourn A (2016) A conserved amino acid residue critical for product and substrate specificity in plant triterpene synthases. Proc Natl Acad Sci U S A. 113(30):E4407-14]. 트리테르펜은 약학 및 생명공학에서 적용되는 다양한 군의 천연 산물이고 산물 특이성에 영향을 미치는 능력이 관심 식물에서 신규하거나 또는 보다 많은 양의 생체분자를 합성하는 기회를 제공한다. 융합CRISPR은 기질 포켓 또는 특이성에 영향을 미치는 효소의 다른 도메인에서 결정적 아미노산의 변형을 가능하게 한다. 목적하는 아미노산은 게놈에서 대체될 필요가 있는 코돈에 플랭킹된 뉴클레오티드 서열과 상동성을 갖는 뉴클레오티드 서열에 의해 플랭킹된 융합된 주형 내에 상응하는 코돈을 포함시킴으로써 도입된다. 융합CRISPR 구축물을 도입하는 하나의 예는 아그로박테리움-매개 T-DNA 형질전환에 의한 것이며, 여기서 T-DNA는 선택 마커, 강한 프로모터에 의해 구동되는 Cas9, 및 하기로 각각 이루어지는 융합CRISPR 구축물을 함유한다: (1) RNA 폴리머라제 III 프로모터, (2) 의도된 표적 코돈 또는 그것에 인접한 서열 (가장 가까운 PAM을 찾음)에 매칭되는 스페이서, (3) 가이드의 정확한 2차 구조를 위한 필수 서열, (4) 절단부에 플랭킹된 하나의 영역에 매칭되는 상동성 아암, (5) 효소에서 특이성에 영향을 미치는 아미노산(들)에 매칭되는 신규 코돈(들), (6) 절단부의 다른 측면 상의 상동성 아암 및 (7) 종결인자. 어디에 절단이 만들어지는지에 따라, 공여자 내에 PAM 서열을 갖는 것을 회피하기 위한 침묵 돌연변이가 포함되어야 할 수 있다. 상동성 아암, 의도된 변화 및 의도된 변화 사이의 서열은 공여자의 매끄러운 혼입을 위해 인접할 것이다. 선택 마커는 안정하게 통합된 T-DNA를 갖는 식물 세포를 획득하기 위해 사용된다. 이들 세포에서, 형질전환된 식물의 유지 및 재생 전체에 걸쳐, 융합CRISPR 성분은 의도된 표적에서 게놈을 변경시킬 기회를 갖는다. 이들 변경은 배선으로 진입할 수 있고 묘목의 다음 세대는 T-DNA의 신규 내인성 서열 및 분리에 대해 스크리닝될 수 있다.
융합CRISPR은 임의의 유기체 내의 내인성 유전자에서 에피토프 또는 다른 태그의 삽입을 가능하게 한다. 태그는 세포 또는 세포하 수준에서 내인성 유전자 산물의 트래킹, 단백질-단백질 상호작용의 확인, ChIP 및 다른 분자 상호작용 및 단백질 정제에 사용될 수 있다. 약물 표적의 경로 발견 및 확인에 대부분 적용될 것이다. 융합CRISPR 구축물은 치환의 도입에 대해 상기 유사하게 기재된 바와 같이 상동성의 스트레치 사이의 페이로드로서 태그를 코딩하는 핵산을 가질 것이다. DNA로서 또는 일시적으로 융합CRISPR을 도입하는 것은 관심 유기체에서 보통 CRISPR/Cas9에 현재 사용되는 것과 동일한 프로토콜을 따를 것이다.
본 발명자들의 효모 실험은 융합CRISPR에서의 페이로드가 뉴클레아제의 전체 기능에 영향을 미치는 것 없이 적어도 731개의 뉴클레오티드일 수 있다는 것을 보여주었다. 이러한 또는 잠재적으로 보다 큰 크기의 서열은 천연 프로모터와 비교하여 강한 프로모터 또는 다양한 조직 또는 환경 신호 특이적 활성을 갖는 프로모터를 포함할 수 있다. 융합CRISPR은 잠재적으로 내인성 프로모터를 대체하고 상향조절을 포함하는 유전자 조절의 대안적 방법을 가능하게 할 수 있다.
CRISPR/Cas DNA 복구 시스템 또는 CRISPR/Cas 유사 DNA 복구 시스템의 적용을 간단하게 하는 것은 당면한 본 발명의 하나의 목적이다.
DNA 절단 복구 동안 표적 핵산에서 상동 재조합의 효율을 증진시키는 것은 당면한 본 발명의 추가의 목적이다.
놀랍게도 이것은 공여자 핵산 분자 및 가이드 핵산 분자를 공유 연결하는 것에 의해 달성되었으며, 가이드 핵산 분자는 CRISPR/Cas DNA 복구 시스템 또는 CRISPR/Cas 유사 DNA 복구 시스템의 요소로서 부위 지정된 핵산 변형 폴리펩티드와 상호작용한다.
발명의 상세한 설명
당면한 본 발명의 한 실시양태는
a. 적어도 하나의 공여자 핵산 (doNA) 분자에 공유 연결된 가이드 핵산 (gNA) 분자를 포함하는 재조합 융합 핵산 (fuNA) 분자를 제공하는 단계, 및
b. 상기 fuNA 분자를 표적 NA 분자를 포함하는 하나 이상의 세포 또는 조성물 내에 도입하는 단계, 및
c. 상기 하나 이상의 세포 또는 조성물 내로 부위 지정된 핵산 변형 폴리펩티드를 도입하는 단계, 및
d. 하나 이상의 세포 또는 조성물을 상기 하나 이상의 세포 또는 조성물에서 상동 재조합을 가능하게 하는 조건 하에 인큐베이션하는 단계, 및 임의로
e. 상동 재조합이 일어난 하나 이상의 세포를 단리시키는 단계
를 포함하는, 세포 또는 조성물 내 표적 핵산 (표적 NA) 분자의 변형을 위한 방법이다.
본 발명에 따른 융합 핵산 분자의 다양한 바람직한 구조는 도 1 내지 12에 도시된다. 가장 바람직한 구조는 도 1에 도시된다.
표적 핵산은 핵산 분자를 표적 핵산 내에 도입하는 것에 의해 변형될 수 있으며, 여기서 도입된 핵산 분자는 표적 핵산에 대해 이종이다. 공여자 핵산 분자의 상동성 아암 1과 상동성 아암 2 사이의 서열은 이 경우에, 표적 핵산 내에 도입되기로 되어 있고 상동성 아암에 대해 상보적인 표적 핵산 내 영역 사이에 존재하지 않는 핵산 분자를 포함할 것이다.
표적 핵산은 또한 표적 핵산으로부터 적어도 하나의 염기를 결실시킴으로써 변형될 수 있다. 그러한 경우에, 공여자 핵산 분자의 상동성 아암 1과 상동성 아암 2 사이의 서열은 표적 핵산에 비교하여 적어도 하나의 염기가 결여된 표적 핵산 분자에 대해 상보적인 서열을 포함할 것이다.
표적 핵산은 추가로 표적 핵산 내 적어도 하나의 염기를 표적 핵산에 대해 이종인 하나 이상의 염기로 대체함으로써 변형될 수 있다. 그러한 경우에 공여자 핵산의 상동성 아암 1과 2 사이의 서열은 표적 핵산 내 상보적 영역과 비교하여 적어도 하나의 미스매치를 포함할 것이다.
표적 핵산은 정확한 표적 부위 확인 및 결합을 위해 일부 부위 지정된 핵산 변형 폴리펩티드에 필요한 표적 핵산 분자 내 표적화된 서열에 인접한 "프로토스페이서 인접 모티프" (PAM) 서열을 포함할 수 있다. PAM의 서열은 다양한 부위 지정된 핵산 변형 폴리펩티드에 특이적이고 (Doudna and Charpentier, 2014, Science 346 (6213):1258096), 통상의 기술자에게 공지되어 있다.
본 발명의 방법은 바람직하게는 살아 있는 세포 내 표적 핵산 변형에 대하여 적용되지만, 시험관내 시스템에 또한 적용될 수 있다.
표적 핵산 분자는 RNA 또는 DNA일 수 있고, 그것은 단일- 또는 이중-가닥일 수 있다. 바람직하게는, 표적 핵산 분자는 DNA이고, 더 바람직하게는 표적 핵산 분자는 이중-가닥 DNA이다.
부위 지정된 핵산 변형 폴리펩티드는 폴리펩티드로서 세포 또는 조성물 내에 도입될 수 있거나, 또는 상기 부위 지정된 핵산 변형 폴리펩티드를 코딩하는 RNA 분자의 도입에 의해 또는 상기 부위 지정된 핵산 변형 폴리펩티드를 발현시키는 발현 구축물의 도입에 의해 (여기서 발현 구축물은 상기 부위 지정된 핵산 변형 폴리펩티드를 코딩하는 유전자에 기능적으로 연결된 각각의 세포에 또는 조성물에 기능적인 프로모터를 포함하고 있음) 도입될 수 있다. 이러한 부위 지정된 핵산 변형 폴리펩티드에 대한 예는 표 1에 나타내었다. 또한, 이러한 부위 지정된 핵산 변형 폴리펩티드의 임의의 기능적 등가물이 본 발명의 방법에 사용될 수 있다.
표 1 부위 지정된 핵산 변형 폴리펩티드에 대한 예
Figure pat00001
Figure pat00002
Figure pat00003
부위 지정된 핵산 변형 폴리펩티드는 이중-가닥 핵산 소화 기능을 가질 수 있거나, 또는 그것은 이중-가닥 핵산 분자의 단지 하나의 가닥만을 절단하는 니카제 기능을 가질 수 있다. 부위 지정된 핵산 변형 폴리펩티드의 핵산 제한 또는 니카제 능력은 또한 불활성화될 수 있고, 재조합 부위 지정된 핵산 변형 폴리펩티드는 다른 기능적 그룹 예컨대 FokI 또는 귀소성 엔도뉴클레아제의 DNA 제한 영역에 연결될 수 있다. 이러한 재조합 부위 지정된 핵산 변형 폴리펩티드는 예를 들어 문헌 [Tsai et al. (2014; Nat Biotechnol. 2014 32(6):569-76.) 또는 Guilinger et al. (2014; Nat Biotechnol. 2014 32(6):577-82)]에 기재되어 있다.
gNA 분자는 표적 NA 분자에 100% 상보적인 적어도 12개의 염기를 포함하는 스페이서 핵산 (스페이서 NA) 분자를 포함한다. 바람직하게는 그것은 표적 NA 분자에 대해 상보적인 적어도 13개의 염기, 적어도 14개의 염기 또는 적어도 15개의 염기를 포함한다. 보다 바람직하게는 그것은 표적 NA 분자에 대해 상보적인 적어도 16개의 염기, 적어도 17개의 염기 또는 적어도 18개의 염기를 포함한다. 훨씬 더 바람직하게는 그것은 표적 NA에 대해 상보적인 적어도 19개의 염기 또는 적어도 20개의 염기를 포함한다.
gNA 분자는 스캐폴드 핵산 (스캐폴드 NA) 분자를 추가로 포함한다.
스캐폴드 NA는, 혼성화하여 헤어핀 구조를 형성할 수 있는, 각각이 서로 상보적인 적어도 8개의 염기를 포함하는 2개의 영역을 포함하는 하나의 핵산 분자로 이루어질 수 있다. 스캐폴드 NA는, 혼성화하여 이중-가닥 구조를 형성할 수 있는, 각각이 서로 상보적인 적어도 8개의 염기의 적어도 하나의 영역을 포함하는 2개의 핵산 분자로 이루어질 수 있다. 상기 영역이 8개 초과의 상보적 염기를 포함하고 있는 경우, 각각의 영역은 다른 영역의 적어도 8개의 염기에 대해 상보적인 적어도 8개의 염기를 포함한다.
바람직하게는 스캐폴드 NA는 1개의 분자로 이루어진다.
스캐폴드 NA 분자는 스페이서 NA 분자에 공유 연결된다. 스캐폴드 NA 분자가 2개의 독립적 분자로 이루어지는 경우, 스캐폴드 NA의 이들 분자 중 적어도 하나는 스페이서 NA 분자에 공유 연결된다.
서로에 대해 상보적인 적어도 8개의 염기를 포함하는 2개의 영역에 더하여, 스캐폴드 NA 분자는 적어도 하나의 헤어핀, 바람직하게는 적어도 2개의 헤어핀을 포함하는 2차 구조를 형성하는 추가의 영역을 포함한다.
공여자 NA 분자는 2개의 상동성 아암을 포함한다. 공여자 NA 분자의 각각의 상동성 아암은 적어도 15개의 염기를 포함하고, 상동성 아암을 이격하는 추가의 NA 영역의 크기의 적어도 5%, 바람직하게는 적어도 10%, 보다 바람직하게는 적어도 15%, 가장 바람직하게는 적어도 20%이다. 상동성 아암 1 및 2는 동일한 길이 또는 상이한 길이를 가질 수 있다.
상동성 아암 각각은 표적 NA 분자 내의 동일한 수의 연속적 염기에 대해 100% 상보적인 적어도 15개의 염기를 포함한다. 상동성 아암이 15개 초과의 염기인 경우, 그것은 표적 NA 분자에 대해 바람직하게는 적어도 60%, 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 더 바람직하게는 80%, 더 바람직하게는 적어도 85%, 더 바람직하게는 적어도 90%, 훨씬 더 바람직하게는 적어도 95%, 훨씬 더 바람직하게는 적어도 98%, 훨씬 더 바람직하게는 적어도 99% 상보적이다. 가장 바람직하게는 각각의 상동성 아암은 표적 NA 분자에 대해 100% 상보적이다.
본 발명의 방법은 표적 NA 분자를 포함하는 세포 또는 조성물에 적용될 수 있다. 바람직하게는 방법은 세포에 적용되며, 여기서 세포는 미생물, 동물, 인간 또는 식물 세포이고, 더 바람직하게는 방법은 효모 또는 식물 세포에 적용된다.
본 발명의 방법은 임의의 식물 세포, 예를 들어 겉씨식물 또는 속씨식물, 바람직하게는 속씨식물, 예를 들어 쌍자엽 또는 단자엽 식물 세포에 적용될 수 있다. 바람직한 단자엽 식물 세포는 예를 들어 옥수수, 밀, 벼, 보리, 수수, 무사, 사탕수수, 억새 및 브라키포디움(brachypodium)이고, 특히 바람직한 단자엽 식물 세포는 옥수수, 밀 및 벼이다. 바람직한 쌍자엽 식물 세포는 예를 들어 대두, 평지 종자, 카놀라, 아마인, 목화, 감자, 사탕무, 타게테스(tagetes) 및 아라비돕시스(Arabidopsis)이고, 특히 바람직한 쌍자엽 식물 세포는 대두, 평지 종자, 카놀라 및 감자이다.
본 발명의 방법은 또한 임의의 미생물에 적용될 수 있다. 미생물은 박테리아일 수 있고, 박테리아 세포는 임의의 그람-양성 박테리아 또는 그람 음성 박테리아일 수 있다. 그람 양성 박테리아는 바실루스(Bacillus), 브레비박테리움(Brevibacterium), 코리네박테리움(Corynebacterium), 스트렙토코쿠스(Streptococcus), 스트렙토미세스(Streptomyces), 스타필로코쿠스(Staphylococcus), 엔테로코쿠스(Enterococcus), 락토바실루스(Lactobacillus), 락토코쿠스(Lactococcus), 클로스트리디움(Clostridium), 게오바실루스(Geobacillus) 및 오세아노바실루스(Oceanobacillus)를 포함하나, 이에 제한되지는 않는다.
그람 음성 박테리아는 이. 콜라이(E. coli), 슈도모나스(Pseudomonas), 살모넬라(Salmonella), 캄필로박터(Campylobacter), 헬리코박터(Helicobacter), 아세토박터(Acetobacter), 플라보박테리움(Flavobacterium), 푸소박테리움(Fusobacterium), 글루코노박터(Gluconobacter)를 포함하나, 이에 제한되지는 않는다. 바람직하게는, 그람 음성 세포는 이. 콜라이 세포이다.
본 발명의 방법에서, 박테리아 세포는 임의의 바실루스 세포일 수 있다. 본 발명의 실시에 유용한 바실루스 세포는 바실루스 알칼로필루스(Bacillus alkalophilus), 바실루스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens), 바실루스 브레비스(Bacillus brevis), 바실루스 시르쿨란스(Bacillus circulans), 바실루스 클라우시이(Bacillus clausii), 바실루스 코아굴란스(Bacillus coagulans), 바실루스 피르무스(Bacillus firmus), 바실루스 라우투스(Bacillus lautus), 바실루스 렌투스(Bacillus lentus), 바실루스 리케니포르미스(Bacillus licheniformis), 바실루스 메가테리움(Bacillus megaterium), 바실루스 푸밀루스(Bacillus pumilus), 바실루스 스테아로써모필루스(Bacillus stearothermophilus), 바실루스 서브틸리스(Bacillus subtilis) 및 바실루스 투린기엔시스(Bacillus thuringiensis) 세포를 포함하나, 이에 제한되지는 않는다. 바람직한 측면에서, 박테리아 세포는 바실루스 아밀로리퀘파시엔스, 바실루스 렌투스, 바실루스 리케니포르미스, 바실루스 스테아로써모필루스 또는 바실루스 서브틸리스 세포이다. 더 바람직한 측면에서, 박테리아 세포는 바실루스 리케니포르미스 세포 또는 바실루스 서브틸리스 세포이고, 바람직하게는 바실루스 서브틸리스 세포이다.
본 발명의 방법에서, 박테리아 숙주 세포는 락토바실루스 아시도필루스 (Lactobacillus acidophilus), 락토바실루스 플란타룸(Lactobacillus plantarum), 락토바실루스 가세리(Lactobacillus gasseri), 락토바실루스 불가리쿠스(Lactobacillus bulgaricus), 락토바실루스 레우테리(Lactobacillus reuteri), 스타필로코쿠스 아우레우스(Staphylococcus aureus), 코리네박테리움(Corynebacterium), 특히 종 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 코리네박테리움 아세토글루타미쿰(Corynebacterium acetoglutamicum), 코리네박테리움 아세토아시도필룸(Corynebacterium acetoacidophilum), 코리네박테리움 칼루나에(Corynebacterium callunae), 코리네박테리움 암모니아게네스(Corynebacterium ammoniagenes), 코리네박테리움 써모아미노게네스(Corynebacterium thermoaminogenes), 코리네박테리움 멜라세콜라(Corynebacterium melassecola)코리네박테리움 에피지엔스(Corynebacterium effiziens), 코리네박테리움 에피시엔스(Corynebacterium efficiens), 코리네박테리움 데세르티(Corynebacterium deserti), 브레비박테리움 플라붐(Brevibacterium flavum), 브레비박테리움 락토페르멘툼(Brevibacterium lactofermentum), 브레비박테리움 디바리카툼(Brevibacterium divaricatum), 슈도모나스 푸티다(Pseudomonas putida), 슈도모나스 시린가에(Pseudomonas syringae), 스트렙토미세스, 특히 종 스트렙토미세스 코엘리콜로르(Streptomyces coelicolor), 스트렙토미세스 리비단스(Streptomyces lividans), 스트렙토미세스 알부스(Streptomyces albus), 스트렙토미세스 아베르미틸리스(Streptomyces avermitilis), 글루코노박터 옥시단스(Gluconobacter oxydans), 글루코노박터 모르비페르(Gluconobacter morbifer), 글루코노박터 타일란디쿠스(Gluconobacter thailandicus), 아세토박터 아세티(Acetobacter aceti), 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum), 클로스트리디움 사카로부틸리쿰(Clostridium saccharobutylicum), 클로스트리디움 베이제린크키이(Clostridium beijerinckii), 스트렙토코쿠스 에퀴시밀리스(Streptococcus equisimilis), 스트렙토코쿠스 피오게네스(Streptococcus pyogenes), 스트렙토코쿠스 우베리스(Streptococcus uberis) 스트렙토코쿠스 에퀴(Streptococcus equi) 아종 주에피데미쿠스(Zooepidemicus)일 수 있다. 또 다른 바람직한 박테리아는 바스피아 숙시니시프로두센스(Basfia succiniciproducens)이다.
미생물은 진핵 세포일 수 있다. 적합한 진핵 세포는 효모 세포, 예를 들어 사카로미세스(Saccharomyces) 종, 예컨대 사카로미세스 세레비지아에(Saccharomyces cerevisiae), 한세눌라(Hansenula) 종, 예컨대 한세눌라 폴리모르파(Hansenula polymorpha), 쉬조사카로미세스(Schizosaccharomyces) 종, 예컨대 쉬조사카로미세스 폼베(Schizosaccharomyces pombe), 클루이베로미세스(Kluyveromyces) 종, 예컨대 클루이베로미세스 락티스(Kluyveromyces lactis) 및 클루이베로미세스 마르시아누스(Kluyveromyces marxianus), 야로위아(Yarrowia) 종, 예컨대 야로위아 리폴리티카(Yarrowia lipolytica), 피키아(Pichia) 종, 예컨대 피키아 메타놀리카(Pichia methanolica), 피키아 스티피테스(Pichia stipites) 및 피키아 파스토리스(Pichia pastoris), 지고사카로미세스(Zygosaccharomyces) 종, 예컨대 지고사카로미세스 로욱시이(Zygosaccharomyces rouxii) 및 지고사카로미세스 바일리이(Zygosaccharomyces bailii), 칸디다(Candida) 종, 예컨대 칸디다 보이디니이(Candida boidinii), 칸디다 우틸리스(Candida utilis), 칸디다 프레이슈시이(Candida freyschussii), 칸디다 글라브라타(Candida glabrata) 및 칸디다 소노렌시스(Candida sonorensis), 슈완니오미세스(Schwanniomyces) 종, 예컨대 슈완니오미세스 옥시덴탈리스(Schwanniomyces occidentalis), 아륵술라(Arxula) 종, 예컨대 아륵술라 아데니니보란스(Arxula adeninivorans), 오가타에아(Ogataea) 종, 예컨대 오가타에아 미누타(Ogataea minuta), 클레브시엘라(Klebsiella) 종, 예컨대 클레브시엘라 뉴모니아(Klebsiella pneumonia)를 포함한다.
표적 핵산 분자는 세포에 내인성일 수 있거나, 또는 그것은 예를 들어 트랜스진 또는 바이러스 핵산 분자와 같이 세포에 이종일 수 있다.
doNA 분자 및 gNA 분자는 서로 공유 결합되어 융합 핵산 (융합 NA) 분자를 형성한다. 공여자 NA 분자는 gNA 분자의 스페이서 NA 부분에 또는 gNA 분자의 스캐폴드 NA 부분에 공유 결합될 수 있다. 바람직한 실시양태에서, 공여자 NA는 gNA 분자의 스캐폴드 NA 부분에 공유 연결된다.
가장 바람직하게는 융합 NA 분자는 1개의 분자, 바람직하게는 1개의 연속적 RNA 분자이며, 여기서 모든 요소 (gNA, 스캐폴드 NA 및 doNA)는 공유 연결된다.
doNA 분자 및 가이드 NA 분자는 RNA, DNA, PNA로 이루어질 수 있다. 바람직하게는 그들은 RNA 또는 DNA로 이루어진다. 더 바람직하게는 doNA 분자는 DNA로 이루어지고 가이드 NA 분자는 RNA로 이루어진다.
가장 바람직한 실시양태에서, 가이드 및 공여자 NA 둘 다는 RNA로 이루어지며, 여기서 적어도 doNA 및 gNA는 서로 공유 연결되어 융합 리보핵산 분자 (fuRNA)를 형성한다.
fuRNA 분자는 RNA 분자로서 또는 상기 fuRNA 분자를 코딩하는 하나 이상의 발현 구축물로서 표적 NA 분자를 포함하는 세포 또는 조성물 내에 도입될 수 있다.
또 다른 실시양태에서 doNA 분자 및 gNA 분자는 DNA로 이루어질 수 있으며, 여기서 doNA 및 gNA는 서로 공유 연결되어 융합 데옥시리보핵산 분자 (fuDNA)를 형성한다.
fuDNA 분자는 예를 들어 형질감염, 바이오리스틱, 전기천공, 광천공(photoporation), 휘스커, 초음파처리, 나노바디 또는 마이크로유체같은 다양한 방법에 의해 DNA 분자로서 표적 NA 분자를 포함하는 세포 또는 조성물 내에 도입될 수 있다. 그것은 T-DNA 분자를 세포 내로 전달할 수 있지만 표적 세포의 게놈 DNA 내로 상기 T-DNA 분자의 통합을 매개할 수는 없는 비히클로서 아그로박테리움을 사용하여 또한 도입될 수 있다. T-DNA는 fuDNA 분자를 포함하거나 이로 이루어질 것이다.
본 발명의 추가 실시양태는 재조합 fuNA 분자, 예를 들어 gNA 분자에 공유 연결된 doNA 분자를 포함하는, fuRNA 또는 fuDNA 분자이다.
본 발명의 또 다른 실시양태는 본 발명의 fuNA 분자를 코딩하는 DNA 분자에 기능적으로 연결된 프로모터를 포함하는 발현 구축물을 포함하는 벡터이다.
본 발명의 추가 실시양태는 본 발명의 fuNA 분자 및 핵산 변형 폴리펩티드를 포함하는 세포이다.
본 발명의 추가 실시양태는
a. 본 발명의 fuNA 분자를 코딩하는 DNA 분자에 기능적으로 연결된 프로모터를 포함하는 발현 구축물을 포함하는 제1 벡터 및
b. 부위 지정된 핵산 변형 폴리펩티드를 코딩하는 제2 벡터 및 임의로
c. 스캐폴드 NA 분자의 일부분을 코딩하는 제3 벡터
를 포함하는 벡터 시스템이다.
바람직한 실시양태에서, a. 하의 벡터는 스페이서 NA, 스캐폴드 NA 및 doNA를 포함하는 fuNA 분자를 코딩하는 발현 구축물을 포함한다.
c. 하의 벡터는 스캐폴드 NA가 2개의 분자로 이루어져 있는 경우, 및 a. 하의 벡터가 스캐폴드 NA 분자의 단지 1개의 분자를 포함하는 융합 NA 분자를 코딩하고 스캐폴드 NA 분자의 제2 분자를 코딩하지 않는 경우에 필요하고 본 발명의 벡터 시스템의 부분이다.
A. 본 발명의 fuNA 분자를 코딩하는 DNA 분자에 기능적으로 연결된 프로모터를 포함하는 발현 구축물을 포함하는 제1 벡터 및
B. 부위 지정된 핵산 변형 폴리펩티드를 코딩하는 제2 벡터 및
C. 표적 NA 분자를 포함하는 세포 및 임의로
D. 스캐폴드 NA 분자의 일부분을 코딩하는 제3 벡터
를 포함하는, 세포 내 표적 NA의 변형을 위한 시스템
이 본 발명의 또 다른 실시양태이다. 바람직한 실시양태에서, A. 하의 벡터는 스페이서 NA, 스캐폴드 NA 및 doNA를 포함하는 fuNA 분자를 코딩하는 발현 구축물을 포함한다. D. 하의 벡터는 스캐폴드 NA가 2개의 분자로 이루어져 있는 경우, 및 A. 하의 벡터가 스캐폴드 NA 분자의 단지 1개의 분자를 포함하는 융합 NA 분자를 코딩하고 스캐폴드 NA 분자의 제2 분자를 코딩하지 않은 경우에 필요하고 본 발명의 시스템의 부분이다.
본 발명의 또 다른 실시양태는
a. 본 발명의 fuNA 분자를 코딩하는 DNA 분자에 기능적으로 연결된 프로모터를 포함하는 발현 구축물을 포함하는 제1 벡터 및
b. 부위 지정된 핵산 변형 폴리펩티드를 코딩하는 제2 벡터 및
c. 표적 NA 분자를 포함하는 세포 및 임의로
d. 스캐폴드 NA 분자의 일부분을 코딩하는 제3 벡터
를 포함하는 조성물이다.
바람직한 실시양태에서, a. 하의 벡터는 스페이서 NA, 스캐폴드 NA 및 doNA를 포함하는 fuNA 분자를 코딩하는 발현 구축물을 포함한다. d. 하의 벡터는 스캐폴드 NA가 2개의 분자로 이루어져 있는 경우, 및 a. 하의 벡터가 스캐폴드 NA 분자의 단지 1개의 분자를 포함하는 융합 NA 분자를 코딩하고 스캐폴드 NA 분자의 제2 분자를 코딩하지 않는 경우에 필요하고 본 발명의 조성물의 부분이다.
세포 또는 조성물 내 표적 NA 분자의 변형을 위한 본 발명의 벡터, 본 발명의 벡터 시스템, 본 발명의 시스템 및/또는 본 발명의 조성물의 용도가 또한 본 발명의 한 실시양태이다.
정의
본 발명은 특정한 방법론 또는 프로토콜로 제한되지 않는 것으로 이해되어야 한다. 또한, 본원에 사용된 용어는 특정한 실시양태만을 기재하기 위한 목적을 위한 것으로, 본 발명의 범위를 제한하고자 하는 것이 아니며, 본 발명의 범주는 첨부된 청구범위에 의해서만 제한될 것으로 이해되어야 한다. 본원 및 첨부된 청구범위에서 사용되는 바와 같이, 단수 형태는 문맥에서 달리 명백하게 나타내지 않는 한 복수 지시대상을 포함함을 주목하여야 한다. 따라서, 예를 들어, "벡터"에 대한 언급은 하나 이상의 벡터에 대한 언급이고, 관련 기술분야의 통상의 기술자에게 공지된 그의 등가물 등을 포함한다. 용어 "약"은 대략적으로, 대략, 부근 또는 영역 내의 것을 의미하는 것으로 본원에 사용된다. 용어 "약"이 수치 범위와 함께 사용되는 경우에, 이는 경계를 기재된 수치 값 초과 및 미만까지 확장함으로써 범위를 변경한다. 일반적으로, 용어 "약"은 수치값을 언급된 값의 위 및 아래로 20%, 바람직하게는 10% 증가 또는 감소한 (더 높거나 또는 더 낮은) 변동치만큼 변경하기 위해 본원에서 사용된다. 본원에 사용된 용어 "또는"은 특정한 목록의 임의의 하나의 구성원을 의미하고, 상기 목록의 구성원의 임의의 조합도 또한 포함한다. 용어 "포함하다" 및 "포함하는"은 본 명세서 및 하기 청구범위에서 사용될 때 하나 이상의 언급된 특색, 정수, 성분 또는 단계의 존재를 구체화하는 것이 의도되지만, 하나 이상의 다른 특색, 정수, 성분, 단계 또는 이들의 군의 존재 또는 추가를 배제하지 않는다. 명확성을 위해, 본 명세서에 사용된 특정 용어는 다음과 같이 정의되고 사용된다:
공여자 NA: 용어 "공여자 NA" 또는 "doNA"는 각각이 표적 NA의 적어도 15개의 연속적 염기의 2개의 상이한 영역에 대해 상보적인 적어도 15개의 염기를 포함하는 2개의 상동성 아암을 포함하는 핵산을 의미하며, 여기서 상기 2개의 상동성 아암은 서로 직접 인접하거나, 또는 하나 이상의 추가의 염기에 의해 분리된다.
상동성 아암이 상보적인 표적 NA의 2개의 상이한 영역은 서로 직접 인접하거나, 또는 20 kb 이하, 바람직하게는 10 kb 이하, 바람직하게는 5 kb 이하, 보다 바람직하게는 3 kb 이하, 보다 바람직하게는 2.5 kb 이하, 보다 바람직하게는 2 kb 이하의 추가의 염기에 의해 분리될 수 있다.
상동성 아암이 15개 초과의 염기를 포함하는 경우, 그것은 표적 NA에 대해 100% 상보적일 수 있거나, 또는 그것은 표적 NA에 대해 적어도 75% 상보적, 바람직하게는 적어도 80% 상보적, 보다 바람직하게는 적어도 85% 상보적, 보다 바람직하게는 적어도 90% 상보적, 보다 바람직하게는 적어도 95% 상보적, 보다 바람직하게는 적어도 98% 상보적일 수 있으며, 여기서 상동성 아암이 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 15개의 염기의 적어도 하나의 스트레치를 포함하고, 바람직하게는 상동성 아암이 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 18개의 염기의 적어도 하나의 스트레치를 포함하고, 보다 바람직하게는 상동성 아암이 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 20개의 염기의 적어도 하나의 스트레치를 포함하고, 훨씬 더 바람직하게는 상동성 아암이 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 25개의 염기의 적어도 하나의 스트레치를 포함하고, 훨씬 더 바람직하게는 상동성 아암이 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 50개의 염기의 적어도 하나의 스트레치를 포함한다.
상동성 아암은 표적 NA에 대해 동일한 길이 및/또는 동일한 정도의 상보성을 가질 수 있거나, 또는 표적 NA에 대해 상이한 길이 및/또는 상이한 정도의 상보성을 가질 수 있다.
상동성 아암은 서로 직접 인접하거나, 또는 상동성 아암에 대해 상보적인 표적 핵산 내 영역 사이에 존재하지 않는 적어도 하나의 염기를 포함하는 핵산 분자에 의해 분리될 수 있다.
스페이서 NA: 용어 "스페이서 핵산" 또는 "스페이서 NA"는 표적 NA에 대해 100% 상보적인 적어도 12개의 염기를 포함하는 핵산을 의미한다.
스페이서 NA가 12개 초과의 염기를 포함하는 경우, 그것은 표적 NA에 대해 적어도 75% 상보적, 바람직하게는 적어도 80% 상보적, 보다 바람직하게는 적어도 85% 상보적, 보다 바람직하게는 적어도 90% 상보적, 보다 바람직하게는 적어도 95% 상보적, 보다 바람직하게는 적어도 98% 상보적일 수 있고, 가장 바람직하게는 그것은 표적 NA에 대해 100% 상보적이며, 여기서 스페이서 NA가 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 12개의 염기의 적어도 하나의 스트레치를 포함하고, 바람직하게는 스페이서 NA가 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 15개의 염기의 적어도 하나의 스트레치를 포함하고, 바람직하게는 스페이서 NA가 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 18개의 염기의 적어도 하나의 스트레치를 포함하고, 보다 바람직하게는 스페이서 NA가 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 20개의 염기의 적어도 하나의 스트레치를 포함하고, 훨씬 더 바람직하게는 스페이서 NA가 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 25개의 염기의 적어도 하나의 스트레치를 포함하고, 훨씬 더 바람직하게는 스페이서 NA가 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 50개의 염기의 적어도 하나의 스트레치를 포함한다.
스페이서 NA는 스캐폴드 NA에 공유 연결된다. 스캐폴드 NA가 2개의 핵산 분자로 이루어져 있는 경우, 스페이서는 스캐폴드 NA의 1개의 분자에 공유 연결된다.
스캐폴드 NA: 스캐폴드 핵산 또는 스캐폴드 NA는 부위 지정된 핵산 변형 폴리펩티드에 의해 결합되는 적어도 하나의 헤어핀, 바람직하게는 적어도 2개의 헤어핀 및/또는 서열을 포함하는 2차 구조를 형성하는 핵산을 포함한다. 이러한 부위 지정된 핵산 변형 폴리펩티드는 관련 기술분야에, 예를 들어 WO/2014/150624; WO/2014/204728에 공지되어 있다. 스캐폴드 NA는 각각이 서로 상보적인 적어도 8개의 염기를 포함하는 2개 영역을 추가로 포함하며, 따라서 혼성화하여 이중-가닥 구조를 형성하는 것이 가능하다. 서로 상보적인 적어도 8개의 염기의 상기 영역이 8개 초과의 염기를 포함하고 있는 경우, 각각의 영역은 다른 영역의 적어도 8개의 염기에 대해 상보적인 적어도 8개의 염기를 포함한다.
스캐폴드 NA의 2개의 상보적 영역은 헤어핀 구조를 형성하는 링커 분자를 통해 서로 공유 연결될 수 있거나, 또는 2개의 독립적 핵산 분자로 이루어질 수 있다.
가이드 NA: 가이드 핵산 또는 가이드 NA 또는 gNA는 스페이서 핵산 및 스캐폴드 핵산을 포함하며, 여기서 스페이서 NA 및 스캐폴드 NA는 서로 공유 연결된다. 스캐폴드 NA가 2개의 분자로 이루어지는 경우, 스페이서 NA는 스캐폴드 NA의 1개의 분자에 공유 연결되는 반면, 스캐폴드 NA 분자의 다른 분자는 제1 스캐폴드 NA 분자에 혼성화된다. 따라서, 가이드 NA 분자는 하나의 핵산 분자로 이루어질 수 있거나, 2개의 핵산 분자로 이루어질 수 있다. 바람직하게는 가이드 NA는 1개의 분자로 이루어진다.
융합 NA: 융합 핵산은 공여자 NA 및 가이드 NA를 포함하며, 여기서 가이드 NA 및 공여자 NA는 서로 공유 연결된다.
부위 지정된 핵산 변형 폴리펩티드: "부위 지정된 핵산 변형 폴리펩티드", "핵산-결합 부위 지정된 핵산 변형 폴리펩티드" 또는 "부위 지정된 폴리펩티드"는 핵산에 결합하고 특정한 핵산 서열에 표적화되는 폴리펩티드를 의미한다. 본원엔 기재된 부위-지정된 핵산 변형 폴리펩티드는 폴리펩티드에 대해 고유한 메카니즘에 의해 또는 바람직하게는 그것이 결합된 핵산 분자에 의해 표적 핵산 내 특정한 핵산 서열에 표적화된다. 폴리펩티드에 의해 결합된 핵산 분자는 표적 핵산 내의 표적 서열에 대해 상보적인 서열을 포함하며, 따라서 결합된 폴리펩티드는 표적 핵산 내의 특정한 위치 (표적 서열)를 표적화한다.
대부분의 부위 지정된 핵산 변형 폴리펩티드는 dsDNA 절단부를 도입하지만, 그들은 단지 니킹 활성만을 갖도록 변형될 수 있거나 또는 뉴클레아제 활성이 불활성화될 수 있다. 부위 지정된 핵산 변형 폴리펩티드는 활성 예컨대 형광 또는 뉴클레아제 활성 예컨대 FokI 폴리펩티드 또는 I-SceI와 같은 귀소 엔도뉴클레아제 폴리펩티드의 뉴클레아제 활성을 갖는 추가적 폴리펩티드에 결합될 수 있다.
코딩 영역: 본원에 사용된 용어 "코딩 영역"은 구조 유전자에 관련하여 사용될 때, mRNA 분자의 번역의 결과로서 신생 폴리펩티드 내에서 발견되는 아미노산을 코딩하는 뉴클레오티드 서열을 나타낸다. 코딩 영역은 진핵생물에서, 개시인자 메티오닌을 코딩하는 뉴클레오티드 삼중자 "ATG"에 의해 5'-측 상에 결합되고, 원핵생물은 또한 개시 코돈으로서 삼중자 "GTG" 및 "TTG"를 사용한다. 3'-측 상에서 이는 정지 코돈을 지정하는 3개의 삼중자 (즉, TAA, TAG, TGA) 중 하나에 의해 결합된다. 또한, 유전자는 RNA 전사체 상에 존재하는 서열의 5'-말단과 3'-말단 둘 다 상에 위치한 서열을 포함할 수 있다. 이들 서열은 "플랭킹" 서열 또는 영역으로서 언급된다 (이들 플랭킹 서열은 mRNA 전사체 상에 존재하는 비-번역 서열의 5' 또는 3'에 위치한다). 5'-플랭킹 영역은 유전자의 전사를 제어하거나 또는 이에 영향을 미치는 조절 서열, 예컨대 프로모터 및 인핸서를 함유할 수 있다. 3'-플랭킹 영역은 전사의 종결, 전사후 절단 및 폴리아데닐화를 지시하는 서열을 함유할 수 있다.
상보적: "상보적" 또는 "상보성"은 역평행 뉴클레오티드 서열 내의 상보적 염기 잔기들 간의 수소 결합 형성시 서로 쌍을 형성할 수 있는 (염기 쌍 형성 규칙에 의함) 역평행 뉴클레오티드 서열을 포함하는 2개의 뉴클레오티드 서열을 지칭한다. 예를 들어, 서열 5'-AGT-3'는 서열 5'-ACT-3'에 대해 상보적이다. 상보성은 "부분적" 또는 "전체"일 수 있다. "부분적" 상보성은 1개 이상의 핵산 염기가 염기 쌍 형성 규칙에 따라서 매칭되지 않는 경우이다. 핵산 분자 간의 "전체" 또는 "완전한" 상보성은 각각의 및 모든 핵산 염기가 염기 쌍 형성 규칙 하에 또 다른 염기와 매칭되는 경우이다. 핵산 분자 가닥 간의 상보성 정도는 핵산 분자 가닥 간의 혼성화의 효율 및 강도에 대해 상당한 효과를 지니고 있다. 본원에 사용된 바와 같은 핵산 서열의 "상보체"는 그의 핵산 분자가 핵산 서열의 핵산 분자에 대해 전체 상보성을 나타내는 뉴클레오티드 서열을 지칭한다.
내인성: "내인성" 뉴클레오티드 서열은 야생형 미생물의 게놈에 존재하는 뉴클레오티드 서열을 지칭한다.
증진된 발현: 미생물에서의 핵산 분자의 발현을 "증진" 또는 "증가"시키는 것은 본원에서 동등하게 사용되고, 이는 미생물에서의 핵산 분자의 발현 수준이 참조 미생물, 예를 들어 야생형과 비교하여 더 높다는 것을 의미한다. 본원에 사용된 용어 "증진된" 또는 "증가된"은 발현될 핵산 분자의 발현이 본원에서 더 높다는 것을, 바람직하게는 유의하게 더 높다는 것을 의미한다. 본원에 사용된 바와 같은, 단백질, mRNA 또는 RNA와 같은 작용제의 수준의 "증진" 또는 "증가"는 그 수준이 실질적으로 동일한 조건 하에 성장한 실질적으로 동일한 미생물과 비교하여 증가되는 것을 의미한다. 본원에 사용된 바와 같은, 표적 유전자에 의해 발현된 작용제, 예컨대 예를 들어 preRNA, mRNA, rRNA, tRNA, 및/또는 그에 의해 코딩된 단백질 산물의 수준의 "증진" 또는 "증가"는 그 수준이 적합한 참조 미생물과 비교하여 50% 이상, 예를 들어 100% 이상, 바람직하게는 200% 이상, 보다 바람직하게는 5배 이상, 보다 더 바람직하게는 10배 이상, 가장 바람직하게는 20배 이상, 예를 들어 50배 증가되는 것을 의미한다. 이러한 증진 또는 증가는 통상의 기술자에게 친숙한 방법에 의해 결정될 수 있다. 따라서, 핵산 또는 단백질 양의 증진 또는 증가는, 예를 들어 단백질의 면역학적 검출에 의해 결정될 수 있다. 더욱이, 단백질 검정, 형광, 노던(Northern) 혼성화, 뉴클레아제 보호 검정, 겔 중 핵산 농도의 밀도측정 측정, 역전사 (정량적 RT-PCR), ELISA (효소-연결 면역흡착 검정), 웨스턴 블롯팅(Western blotting), 방사성면역검정 (RIA) 또는 기타 면역검정 및 형광-활성화 세포 분석 (FACS)과 같은 기술을 사용하여, 미생물에서의 특정 단백질 또는 RNA를 측정할 수 있다. 유도된 단백질 산물의 유형에 따라서, 상기 미생물의 표현형에 대한 효과 또는 그의 활성을 또한 결정할 수 있다. 단백질 양을 결정하는 방법은 숙련된 작업자에게 공지되어 있다. 언급될 수 있는 예는 다음과 같다: 마이크로-뷰렛(micro-Biuret) 방법 (Goa J (1953) Scand J Clin Lab Invest 5:218-222), 폴린-시오칼토(Folin-Ciocalteau) 방법 (Lowry OH et al. (1951) J Biol Chem 193:265-275) 또는 CBB G-250의 흡광도를 측정하는 방법 (Bradford MM (1976) Analyt Biochem 72:248-254).
발현: "발현"은 세포에서 유전자 산물의 생합성, 바람직하게는 뉴클레오티드 서열, 예를 들어 내인성 유전자 또는 이종 유전자의 전사 및/또는 번역을 지칭한다. 예를 들어, 구조 유전자의 경우에, 발현은 이러한 구조 유전자를 mRNA로 전사하고, 임의로 mRNA를 하나 이상의 폴리펩티드로 후속 번역하는 것을 포함한다. 다른 경우에, 발현은 RNA 분자를 정착시킨 DNA의 전사만을 지칭할 수 있다.
외래: 용어 "외래"는 실험적 조작에 의해 세포 내로 도입되는 임의의 핵산 분자 (예를 들어, 유전자 서열)를 지칭하고, 이와 같이 도입된 서열이 일부 변형 (예를 들어, 점 돌연변이, 선택 마커 유전자의 존재 등)을 함유하는 한은 그 세포에서 발견되는 서열을 포함할 수 있고, 따라서 자연 발생 서열에 비해 상이하다.
기능적 단편: 용어 "기능적 단편"은 단지 본 발명의 전장 핵산 및/또는 전장 폴리펩티드의 부분을 포함하지만, 여전히 동일한 기능, 즉, 아크릴로일-CoA 및 부탄올의 n-BA 및 CoA로의 반응을 촉매하는 AAT 효소의 기능을 제공하는 임의의 핵산 및/또는 단백질을 지칭한다. 바람직하게는, 단편은 그것이 유래된 서열의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%를 포함한다. 바람직하게는, 기능적 단편은 기능적 단편이 유래된 핵산 및/또는 단백질의 인접한 핵산 또는 아미노산을 포함한다. 단백질을 코딩하는 핵산 분자의 기능적 단편은 단백질의 기능적 단편을 코딩하는 핵산 분자의 단편을 의미한다.
기능적 연결: 용어 "기능적 연결" 또는 "기능적으로 연결된"은 용어 "작동가능한 연결" 또는 "작동가능하게 연결"과 동등하고, 예를 들어 각각의 조절 요소가 그의 의도된 기능을 충족시켜, 발현될 핵산 서열의 발현을 허용하거나, 변형시키거나, 촉진시키거나 또는 달리 영향을 미칠 수 있도록 하는 방식으로, 조절 요소 (예를 들어, 프로모터)가 상기 발현될 핵산 서열, 및 경우에 따라 추가의 조절 요소 (예컨대 예를 들어, 종결인자)와 순차적으로 배열되는 것을 의미하는 것으로 이해되어야 한다. 동의어로서, "작동가능한 연결" 또는 "작동가능하게 연결"이란 표현을 사용할 수 있다. 발현은 센스 또는 안티센스 RNA와 관련한 핵산 서열의 배열에 따라서 유발될 수 있다. 이러한 목적을 위해, 화학적 의미에서의 직접적인 연결이 반드시 요구되지는 않는다. 유전자 제어 서열, 예컨대 예를 들어 인핸서 서열은 또한, 추가로 떨어져 있거나 또는 실제로 다른 DNA 분자로부터 떨어져 있는 위치에서 표적 서열에 대해 그의 기능을 발휘할 수 있다. 바람직한 배열은 재조합적으로 발현될 핵산 서열이 프로모터로서 작용하는 서열 뒤에 위치하고 있으므로, 두 서열이 서로 공유 연결되는 배열이다. 바람직한 실시양태에서, 전사될 핵산 서열은 전사 출발점이 본 발명의 키메라 RNA의 목적하는 시작점과 동일한 방식으로 프로모터 뒤에 위치한다. 기능적 연결, 및 발현 구축물은 문헌 (예를 들어, 문헌 [Sambrook J, Fritsch EF and Maniatis T (1989); Silhavy et al. (1984) Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor (NY); Ausubel et al. (1987) Current Protocols in Molecular Biology, Greene Publishing Assoc. and Wiley Interscience; Gelvin et al. (Eds) (1990) Plant Molecular Biology Manual; Kluwer Academic Publisher, Dordrecht, The Netherlands])에 기재된 바와 같은 통상적인 재조합 및 클로닝 기술을 통해 생성될 수 있다. 그러나, 예를 들어 제한 효소에 대한 특이적 절단 부위를 수반한 링커로서 작용하거나 또는 신호 펩티드로서 작용하는 추가 서열이 또한, 상기 두 서열 사이에 위치할 수 있다. 서열의 삽입으로 인해, 융합 단백질의 발현이 유발될 수도 있다. 바람직하게는, 조절 영역, 예를 들어 프로모터와 발현될 핵산 서열의 연결로 이루어진 발현 구축물이 벡터-통합된 형태로 존재할 수 있거나 또는 예를 들어 형질전환에 의해 게놈 내로 삽입될 수 있다.
유전자: 용어 "유전자"는 일부 방식으로 유전자 산물 (예를 들어, 폴리펩티드 또는 기능적 RNA)의 발현을 조절할 수 있는 적절한 조절 서열과 작동가능하게 연결된 영역을 지칭한다. 유전자는 코딩 영역 (오픈 리딩 프레임, ORF) 선행 (상류) 및 하행 (하류) DNA의 비번역 조절 영역 (예를 들어, 프로모터, 인핸서, 리프레서 등)을 포함한다. 본원에 사용된 용어 "구조 유전자"는 mRNA로 전사된 다음, 특정 폴리펩티드 특유의 아미노산 서열로 번역되는 DNA 서열을 의미한다.
게놈 또는 게놈 DNA: 용어 "게놈" 또는 "게놈 DNA"는 숙주 유기체의 유전적 유전자 정보를 지칭한다. 상기 게놈 DNA는 핵양체의 DNA 뿐만 아니라 자기-복제 플라스미드의 DNA를 포함한다.
이종: 핵산 분자 또는 DNA와 관련된 용어 "이종"은 자연에서는 작동가능하게 연결되지 않거나 또는 자연에서는 상이한 위치에서 작동가능하게 연결되는 제2의 핵산 분자와 작동가능하게 연결되거나 또는 이러한 분자와 작동가능하게 연결되도록 조작되는 핵산 분자를 지칭한다. 핵산 분자, 및 이와 연결된 하나 이상의 조절 핵산 분자 (예컨대, 프로모터 또는 전사 종결 신호)를 포함하는 이종 발현 구축물은 예를 들어, a) 상기 핵산 분자, 또는 b) 상기 조절 핵산 분자, 또는 c) 둘 다 (즉 (a) 및 (b))가 그의 자연 (천연) 유전적 환경에 위치되지 않거나 또는 실험적 조작에 의해 변형된 (변형의 예는 하나 이상의 뉴클레오티드 잔기의 치환, 부가, 결실, 역위 또는 삽입임), 실험적 조작에 의해 유래되는 구축물이다. 자연 유전적 환경은 기원 유기체 내의 자연 게놈 유전자좌, 또는 게놈 라이브러리 내에서의 존재를 지칭한다. 게놈 라이브러리의 경우에는, 핵산 분자의 서열의 자연 유전적 환경이 적어도 부분적으로 보유되는 것이 바람직하다. 이러한 환경은 적어도 한쪽에 있는 핵산 서열에 플랭킹되고, 적어도 50 bp, 바람직하게는 적어도 500 bp, 특히 바람직하게는 적어도 1,000 bp, 매우 특히 바람직하게는 적어도 5,000 bp 길이의 서열을 갖는다. 자연 발생 발현 구축물 - 예를 들어 프로모터와 상응하는 유전자의 자연 발생 조합물 - 은 비-자연, 합성 "인공" 방법, 예컨대 예를 들어, 돌연변이유발에 의해 변형되는 경우에 트랜스제닉 발현 구축물로 된다. 상기 방법은 문헌에 기재되어 있다 (US 5,565,350; WO 00/15815). 예를 들어, 핵산 분자의 천연 프로모터가 아닌 프로모터와 작동가능하게 연결된 핵산 분자를 코딩하는 단백질이, 이러한 프로모터와 관련하여 이종인 것으로 간주된다. 바람직하게는, 이종 DNA는 이것이 도입되는 세포에 대해 내인성이 아니거나 또는 이러한 세포와 자연적으로 회합되지 않지만, 또 다른 세포로부터 수득되거나 또는 합성된 것이다. 이종 DNA는 또한, 내인성 DNA 서열의 일부 변형, 비-자연 발생, 다중 카피를 함유하는 내인성 DNA 서열, 또는 그와 물리적으로 연결된 또 다른 DNA 서열과 자연적으로 회합되지 않는 DNA 서열을 포함한다. 반드시는 아니지만 일반적으로, 이종 DNA는 이것이 발현되는 세포에 의해서는 정상적으로 생산되지 않는 RNA 또는 단백질을 코딩한다.
혼성화: 본원에 사용된 용어 "혼성화"는 "핵산 분자의 가닥이 염기 쌍형성을 통해 상보적 가닥과 결합되는 임의의 공정"을 포함한다 (J. Coombs (1994) Dictionary of Biotechnology, Stockton Press, New York). 혼성화 및 혼성화의 강도 (즉, 핵산 분자들 간의 회합 강도)는 핵산 분자들 간의 상보성 정도, 관련된 조건의 엄격도, 형성된 혼성체의 Tm, 및 핵산 분자 내의 G:C 비와 같은 요인들에 의해 영향을 받는다. 본원에 사용된 용어 "Tm"은 "용융 온도"와 관련하여 사용된다. 용융 온도는 이중 가닥 핵산 분자의 집단이 절반 분리되어 단일 가닥으로 되는 온도이다. 핵산 분자의 Tm을 계산하는 방정식은 관련 기술분야에 널리 공지되어 있다. 표준 참고문헌에 의해 표시된 바와 같이, Tm 값의 간단한 평가치는, 핵산 분자가 1 M NaCl 하의 수용액 중에 있는 경우에 다음 방정식으로써 계산될 수 있다: Tm=81.5+0.41(% G+C) (예를 들어, 문헌 [Anderson and Young, Quantitative Filter Hybridization, in Nucleic Acid Hybridization (1985)] 참조). 다른 참고문헌은 보다 복잡한 계산을 포함하는데, 이는 Tm을 계산하기 위해 구조적 특징뿐만 아니라 서열 특징을 고려한다. 엄격한 조건은 관련 기술분야의 통상의 기술자에게 공지되어 있고 문헌 [Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6]에서 찾을 수 있다.
적합한 혼성화 조건은, 예를 들어 서열의 상보체의 적어도 50개, 바람직하게는 적어도 100개, 보다 바람직하게는 적어도 150개, 보다 더 바람직하게는 적어도 200개, 가장 바람직하게는 적어도 250개의 연속되는 뉴클레오티드를 포함하는 핵산 분자와, 50℃ 하에 2 X SSC, 0.1% 소듐 도데실 술페이트 (SDS)에서 세척하면서 (저 엄격도) 50℃ 하에 7% SDS, 0.5 M NaPO4, 1 mM EDTA에서 혼성화시키는 것과 등가의 조건 하에 혼성화되는 것이다. 다른 적합한 혼성화 조건은 서열의 상보체의 적어도 50개, 바람직하게는 적어도 100개, 보다 바람직하게는 적어도 150개, 보다 더 바람직하게는 적어도 200개, 가장 바람직하게는 적어도 250개의 연속되는 뉴클레오티드를 포함하는 핵산 분자와, 50℃ (중간 수준의 엄격도) 또는 65℃ (고도의 엄격도) 하에 1 X SSC, 0.1% 소듐 도데실 술페이트 (SDS)에서 세척하면서 50℃ 하에 7% SDS, 0.5 M NaPO4, 1 mM EDTA에서 혼성화시키는 것이다. 다른 적합한 혼성화 조건은 서열의 상보체의 적어도 50개, 바람직하게는 적어도 100개, 보다 바람직하게는 적어도 150개, 보다 더 바람직하게는 적어도 200개, 가장 바람직하게는 적어도 250개의 연속되는 뉴클레오티드를 포함하는 핵산 분자와, 65℃ (매우 고도의 엄격도) 하에 0.1 X SSC, 0.1% 소듐 도데실 술페이트 (SDS)에서 세척하면서 50℃ 하에 7% SDS, 0.5 M NaPO4, 1 mM EDTA에서 혼성화시키는 것이다.
"동일성": 2개 이상의 핵산 또는 아미노산 분자의 비교와 관련하여 사용되는 경우의 "동일성"은 상기 분자의 서열이 특정 정도의 서열 유사성을 공유하는 것을 의미하며, 서열은 부분적으로 동일하다.
2개 이상의 아미노산 또는 2개 이상의 뉴클레오티드 서열의 백분율 동일성을 결정하기 위한 여러 컴퓨터 소프트웨어 프로그램이 개발되었다. 2개 이상의 서열의 동일성은, 예를 들어 소프트웨어 파스타(fasta) (이는 현재 버전 파스타 3으로 사용되고 있음)를 사용하여 계산할 수 있다 (W. R. Pearson and D. J. Lipman, PNAS 85, 2444(1988); W. R. Pearson, Methods in Enzymology 183, 63 (1990); W. R. Pearson and D. J. Lipman, PNAS 85, 2444 (1988); W. R. Pearson, Enzymology 183, 63 (1990)). 상이한 서열의 동일성 계산을 위한 또 다른 유용한 프로그램은 바이오맥스 페던트(Biomax pedant) 소프트웨어에 포함된 표준 블라스트(blast) 프로그램이다 (바이오맥스, 독일 뮌헨). 이는 불행하게도 때때로, 준최적 결과를 유발하는데, 이는 블라스트가 대상 및 질의의 완전한 서열을 항상 포함하지는 않기 때문이다. 그럼에도 불구하고, 이러한 프로그램은 매우 효율적이기 때문에, 매우 많은 수의 서열을 비교하는데 사용될 수 있다. 하기 설정이 이러한 서열 비교를 위해 전형적으로 사용된다:
-p 프로그램 명칭 [문자열]; -d 데이터베이스 [문자열]; 디폴트 = nr; -i 질의 파일 [파일 인]; 디폴트 = stdin; -e 기대 값 (E) [실제]; 디폴트 = 10.0; -m 정렬 뷰 옵션: 0 = 쌍형성; 1 = 동일성을 보여주는 질의-참조; 2 = 동일성이 없는 질의-참조; 3 = 동일성을 보여주는, 플랫 질의-참조; 4 = 동일성이 없는, 플랫 질의-참조; 5 = 동일성이 없고 평활 말단인, 질의-참조; 6 = 동일성이 없고 평활 말단인, 플랫 질의-참조; 7 = XML 블라스트 출력; 8 = 테이블 형태; 9 = 주석 라인을 수반한 테이블 형태 [정수]; 디폴트 = 0; -o BLAST 리포트 출력 파일 [파일 아웃] 선택적; 디폴트 = stdout; -F 필터 질의 서열 (blastn을 수반한 DUST, 다른 것을 수반한 SEG) [문자열]; 디폴트 = T; -G 갭을 개방하기 위한 비용 (제로는 디폴트 행위를 호출한다) [정수]; 디폴트 = 0; -E 갭을 확장하기 위한 비용 (제로는 디폴트 행위를 호출한다) [정수]; 디폴트 = 0; -X 갭 형성된 정렬에 대한 X 드롭오프 (비트) (제로는 디폴트 행위를 호출한다); blastn 30, 메가블라스트 20, tblastx 0, 기타 모두 15 [정수]; 디폴트 = 0; -I 디플라인에서의 GI를 나타낸다 [T/F]; 디폴트 = F; -q 뉴클레오티드 미스매치에 대한 페널티 (blastn 경우만) [정수]; 디폴트 = -3; -r 뉴클레오티드 매치에 대한 보상 (blastn 경우만) [정수]; 디폴트 = 1; -v (V)에 대한 온-라인 설명을 나타내는 데이터베이스 서열의 수 [정수]; 디폴트 = 500; -b (B)에 대한 정렬을 나타내는 데이터베이스 서열의 수 [정수]; 디폴트 = 250; -f 확장성 히트에 대한 역치, 제로인 경우 디폴트; blastp 11, blastn 0, blastx 12, tblastn 13; tblastx 13, 메가블라스트 0 [정수]; 디폴트 = 0; -g 갭 형성된 정렬을 수행한다 (tblastx으로는 이용가능하지 않음) [T/F]; 디폴트 = T; -Q 사용하기 위한 질의 유전자 코드 [정수]; 디폴트 = 1; -D DB 유전자 코드 (tblast[nx] 경우에만) [정수]; 디폴트 = 1; -a 사용되는 프로세서의 수 [정수]; 디폴트 = 1; -O SeqAlign 파일 [파일 아웃] 선택적; -J 질의 디플라인을 신뢰한다 [T/F]; 디폴트 = F; -M 매트릭스 [문자열]; 디폴트 = BLOSUM62; -W 단어 크기, 제로인 경우 디폴트 (blastn 11, 메가블라스트 28, 기타 모두 3) [정수]; 디폴트 = 0; -z 데이터베이스의 유효 길이 (실제 크기에 대해서는 제로를 이용한다) [실제]; 디폴트 = 0; -K 유지하기 위한 영역으로부터 최적 히트의 수 (디폴트에 의한 오프, 사용된 경우에는 100의 값이 권장된다) [정수]; 디폴트 = 0; -P 다중 히트의 경우에는 0이고, 단일 히트에 대해서는 1이다 [정수]; 디폴트 = 0; -Y 조사 공간의 유효 길이 (실제 크기에 대해서는 제로를 이용한다) [실제]; 디폴트 = 0; -S 데이터베이스에 대항하여 조사하기 위한 질의 가닥 (blast[nx], 및 tblastx의 경우); 3은 둘 다이고, 1은 상단이며, 2는 하단이다 [정수]; 디폴트 = 3; -T HTML 출력을 생산한다 [T/F]; 디폴트 = F; -l 데이터베이스의 조사를 GI의 목록으로 제한한다 [문자열] 선택적; -U FASTA 서열의 소문자 필터를 이용한다 [T/F] 선택적; 디폴트 = F; -y 갭을 형성하지 않은 확장물에 대한 X 드롭오프 값 (비트) (0.0은 디폴트 행위를 호출한다); blastn 20, 메가블라스트 10, 기타 모두 7 [실제]; 디폴트 = 0.0; -Z 최종 갭 형성된 정렬에 대한 X 드롭오프 값 (비트) (0.0은 디폴트 행위를 호출한다); blastn/메가블라스트 50, tblastx 0, 기타 모두 25 [정수]; 디폴트 = 0; -R PSI-TBLASTN 체크포인트 파일 [파일 인] 선택적; -n 메가블라스트 조사 [T/F]; 디폴트 = F; -L 질의 서열 상의 위치 [문자열] 선택적; -A 다중 히트 윈도우 크기, 제로인 경우 디폴트 (blastn/메가블라스트 0, 기타 모두 40 [정수]; 디폴트 = 0; -w 프레임 시프트 페널티 (blastx에 대한 OOF 알고리즘) [정수]; 디폴트 = 0; -t HSP를 연결하기 위해 tblastn에서 허용된 가장 큰 인트론의 길이 (0 연결할 수 없게 된다) [정수]; 디폴트 = 0.
고품질의 결과는 니들만(Needleman) 및 분쉬(Wunsch)의 알고리즘 또는 스미스(Smith) 및 워터만(Waterman)의 알고리즘을 사용함으로써 달성된다. 따라서, 상기 알고리즘에 기초한 프로그램이 바람직하다. 유리하게는, 서열의 비교는 프로그램 파일업(PileUp) (J. Mol. Evolution., 25, 351 (1987), Higgins et al., CABIOS 5, 151 (1989)) 또는 바람직하게 프로그램 "갭(Gap)" 및 "니들(Needle)" (이는 둘 다 니들만 및 분쉬의 알고리즘에 기초함) (J. Mol. Biol. 48; 443 (1970)), 및 "베스트피트(BestFit)" (이는 스미스 및 워터만의 알고리즘에 기초함) (Adv. Appl. Math. 2; 482 (1981))를 사용하여 수행될 수 있다. "갭" 및 "베스트피트"는 GCG 소프트웨어-패키지의 일부이고 (Genetics Computer Group, 575 Science Drive, Madison, Wisconsin, USA 53711 (1991); Altschul et al., (Nucleic Acids Res. 25, 3389 (1997)), "니들"은 유럽 분자 생물학 오픈 소프트웨어 스위트 (EMBOSS)의 일부이다 (Trends in Genetics 16 (6), 276 (2000)). 따라서 바람직하게는, 서열 동일성의 백분율을 결정하기 위한 계산은 서열의 전체 범위 전반에 걸쳐 프로그램 "갭" 또는 "니들"을 사용하여 수행된다. "니들"의 경우에는 핵산 서열의 비교를 위해 다음 표준 조정을 사용하였다: 매트릭스: EDNAFULL, 갭_페널티: 10.0, 확장_페널티: 0.5. "갭"의 경우에는 핵산 서열의 비교를 위해 다음 표준 조정을 사용하였다: 갭 가중치: 50, 길이 가중치: 3, 평균 매치: 10.000, 평균 미스매치: 0.000.
예를 들어, 핵산 수준에서 서열 서열식별번호(SEQ ID number) 1과 80% 동일성을 갖는 것으로 언급되는 서열은 상기 파라미터 세트를 수반하는 상기 프로그램 "니들"에 의해 서열식별번호: 1로 나타낸 서열과 비교할 때, 80% 동일성을 갖는 서열을 의미하는 것으로 이해된다. 바람직하게는 동일성은 질의 서열, 예를 들어 서열식별번호: 1의 완전한 길이 상에서 계산된다.
단리된: 본원에 사용된 용어 "단리된"은 물질이 인공적으로 제거되어 그의 원래 천연 환경에서 벗어나서 존재하고, 따라서 자연의 산물이 아님을 의미한다. 단리된 물질 또는 분자 (예컨대, DNA 분자 또는 효소)는 정제된 형태로 존재할 수 있거나 또는 비-천연 환경, 예컨대 예를 들어 트랜스제닉 숙주 세포에 존재할 수 있다. 예를 들어, 살아있는 세포에 존재하는 자연 발생 핵산 분자 또는 폴리펩티드는 단리된 것이 아니지만, 자연계에서 공존하는 물질의 일부 또는 전부로부터 분리된 동일한 핵산 분자 또는 폴리펩티드는 단리된 것이다. 이러한 핵산 분자는 벡터의 일부일 수 있고/거나 상기 핵산 분자 또는 폴리펩티드는 조성물의 일부일 수 있으며, 상기 벡터 또는 조성물이 그의 원래 환경의 일부가 아니라는 점에서 단리된 것일 것이다. 바람직하게는, 용어 "단리된"은 "단리된 핵산 서열"에서처럼 핵산 분자에 대해 사용될 때 그의 자연 공급원에서 통상 회합되는 적어도 하나의 오염 핵산 분자로부터 확인되고 분리된 핵산 서열을 의미한다. 단리된 핵산 분자는 그것이 자연에서 발견되는 것과 상이한 형태 또는 세팅으로 존재하는 핵산 분자이다. 이와는 달리, 비-단리된 핵산 분자는 그들이 자연에서 존재하는 상태로 발견되는 핵산 분자, 예컨대 DNA 및 RNA이다. 예를 들어, 소정의 DNA 서열 (예를 들어, 유전자)은 이웃하는 유전자에 근접하여 숙주 세포 염색체 상에서 발견되고; RNA 서열, 예컨대 특정한 단백질을 코딩하는 특정한 mRNA 서열은 다수의 단백질을 코딩하는 수많은 다른 mRNA와의 혼합물로서 세포에서 발견된다. 그러나, 예를 들어 서열식별번호: 1을 포함하는 단리된 핵산 서열은 한 예로서, 핵산 서열이 자연 세포의 것과 상이한 게놈 또는 플라스미드 위치에 있거나 또는 자연에서 발견되는 것보다 상이한 핵산 서열이 플랭킹된 서열식별번호: 1을 통상적으로 함유하는 세포에서의 상기 핵산 서열을 포함한다. 단리된 핵산 서열은 단일 또는 이중 가닥 형태로 존재할 수 있다. 단리된 핵산 서열을 활용하여 단백질을 발현시켜야 하는 경우에는, 이러한 핵산 서열이 최소한, 센스 또는 코딩 가닥의 적어도 일부를 함유할 것이다 (즉, 상기 핵산 서열은 단일 가닥일 수 있다). 대안적으로, 이는 센스 가닥과 안티센스 가닥 둘 다를 함유할 수 있다 (즉, 상기 핵산 서열은 이중 가닥일 수 있다).
비-코딩: 용어 "비-코딩"은 발현되는 단백질의 일부 또는 전부를 코딩하지 않는 핵산 분자의 서열을 의미한다. 비-코딩 서열은 인핸서, 프로모터 영역, 3' 비번역 영역 및 5' 비번역 영역을 포함하나, 이에 제한되지는 않는다.
핵산 및 뉴클레오티드: 용어 "핵산" 및 "뉴클레오티드"는 자연 발생 또는 합성 또는 인공 핵산 또는 뉴클레오티드를 지칭한다. 용어 "핵산" 및 "뉴클레오티드"는 단일 가닥 또는 이중 가닥, 센스 또는 안티센스 형태의, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 또는 그의 모든 뉴클레오티드 유사체 및 중합체 또는 혼성체를 포함한다. 달리 나타내지 않는 한, 특정한 핵산 서열은 또한, 그의 보존적으로 변형된 변이체 (예를 들어, 축중성 코돈 치환) 및 상보적 서열, 뿐만 아니라 명시적으로 나타낸 서열을 암시적으로 포괄한다. 용어 "핵산"은 본원에서 "유전자", "cDNA", "mRNA", "올리고뉴클레오티드" 및 "핵산 분자"와 상호교환가능하게 사용된다. 뉴클레오티드 유사체는 염기, 당 및/또는 포스페이트의 화학적 구조에서의 변형을 갖는 뉴클레오티드를 포함하며, 이러한 변형은 5-위치 피리미딘 변형, 8-위치 퓨린 변형, 시토신 엑소시클릭 아민에서의 변형, 5-브로모-우라실의 치환 등; 및 2'-위치 당 변형 (이는 2'-OH를 H, OR, R, 할로, SH, SR, NH2, NHR, NR2, 또는 CN으로부터 선택된 군으로 대체시킨, 당-변형된 리보뉴클레오티드를 포함하나, 이에 제한되지는 않음)을 포함하나, 이에 제한되지는 않는다. 짧은 헤어핀 RNA (shRNA)는 또한, 비-자연 요소, 예컨대 비-자연 염기, 예를 들어 이노신 및 크산틴, 비-자연 당, 예를 들어 2'-메톡시 리보스, 또는 비-자연 포스포디에스테르 연결, 예를 들어 메틸포스포네이트, 포스포로티오에이트 및 펩티드를 포함할 수 있다.
핵산 서열: 어구 "핵산 서열"은 5'-말단에서 3'-말단으로 읽는 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 염기의 단일 또는 이중 가닥 중합체를 지칭한다. 이는 염색체 DNA, 자기-복제 플라스미드, DNA 또는 RNA의 감염성 중합체, 및 주로 구조적 역할을 수행하는 DNA 또는 RNA를 포함한다. "핵산 서열"은 또한 뉴클레오티드를 나타내는 약어, 글자, 문자 또는 단어의 연속적인 목록을 지칭한다. 한 실시양태에서, 핵산은 길이가 대체로 100개 미만의 뉴클레오티드인 비교적 짧은 핵산인 "프로브"일 수 있다. 종종 핵산 프로브는 약 50개 뉴클레오티드 길이 내지 약 10개 뉴클레오티드 길이이다. 핵산의 "표적 영역"은 관심있는 것으로 확인된 핵산의 부분이다. 핵산의 "코딩 영역"은 적절한 조절 서열의 제어 하에 위치할 때 특정한 폴리펩티드 또는 단백질을 생산하기 위해 서열-특이적 방식으로 전사 및 번역되는 핵산의 부분이다. 코딩 영역은 이러한 폴리펩티드 또는 단백질을 코딩하는 것으로 전해진다.
올리고뉴클레오티드: 용어 "올리고뉴클레오티드"는 리보핵산 (RNA) 또는 데옥시리보핵산 (DNA) 또는 그의 모방체의 올리고머 또는 중합체, 및 유사하게 기능하는 비-자연 발생 부분을 갖는 올리고뉴클레오티드를 지칭한다. 이러한 변형 또는 치환된 올리고뉴클레오티드는 종종 천연 형태에 비해 바람직한데, 이는 바람직한 특성, 예컨대 예를 들어 증진된 세포 흡수, 핵산 표적에 대한 증진된 친화성, 및 뉴클레아제의 존재 하의 증가된 안정성 때문이다. 올리고뉴클레오티드는 바람직하게는, 연결 (예를 들어, 포스포디에스테르) 또는 치환 연결에 의해 서로 공유 커플링된 2개 이상의 뉴클레오단량체를 포함한다.
오버행: "오버행"은 이중 가닥 올리고뉴클레오티드 분자의 5'- 또는 3'-히드록실 말단 상의 비교적 짧은 단일 가닥 뉴클레오티드 서열이다 ("연장물", "돌출성 말단" 또는 "점착성 말단"으로서 지칭되기도 함).
폴리펩티드: 용어 "폴리펩티드", "펩티드", "올리고펩티드", "폴리펩티드", "유전자 산물", "발현 산물" 및 "단백질"은 연속되는 아미노산 잔기의 중합체 또는 올리고머를 지칭하기 위해 본원에서 상호교환가능하게 사용된다.
프로모터: 용어 "프로모터" 또는 "프로모터 서열"은 동등하고, 본원에 사용된 바와 같이, 관심 뉴클레오티드 서열과 작동가능하게 연결되는 경우에, 이러한 관심 뉴클레오티드 서열을 RNA로 전사하는 것을 제어할 수 있는 DNA 서열을 지칭한다. 프로모터는 그의 mRNA로의 전사를 제어하는 관심 뉴클레오티드 서열의 전사 출발 부위에 근접한 5' (즉, 상류)에 위치하고, 전사 개시를 위한 다른 전사 인자 및 RNA 폴리머라제에 의한 특이적 결합을 위한 부위를 제공한다. 프로모터는 코딩 영역 또는 5' 비번역 영역을 포함하지 않는다. 프로모터는, 예를 들어 각각의 세포에 대해 이종 또는 동종일 수 있다. 핵산 분자 서열은 이것이 외래 종으로부터 유래되는 경우에, 또는 동일한 종으로부터 그의 원래 형태로부터 변형되는 경우에, 유기체 또는 제2의 핵산 분자 서열에 대해 "이종"이다. 예를 들어, 이종 코딩 서열과 작동가능하게 연결된 프로모터는 프로모터가 유래되는 것과 상이한 종으로부터의 코딩 서열, 또는 동일한 종으로부터 유래된 경우에는, 프로모터와 자연적으로 회합되지 않는 코딩 서열 (예를 들어, 유전자 조작된 코딩 서열 또는 상이한 생태형 또는 변종으로부터의 대립 유전자)을 지칭한다. 적합한 프로모터는 발현이 일어나야 하는 숙주 세포의 유전자로부터 유래되거나 또는 이러한 숙주에 대한 병원체로부터 유래될 수 있다.
정제된: 본원에 사용된 용어 "정제된"은 그의 자연 환경으로부터 제거되거나, 단리되거나 또는 분리되는 핵산 또는 아미노산 서열 분자를 지칭한다. "실질적으로 정제된" 분자는 이들과 자연적으로 회합되는 다른 성분이 적어도 60% 없고, 바람직하게는 적어도 75% 없고, 보다 바람직하게는 적어도 90% 없다. 정제된 핵산 서열은 단리된 핵산 서열일 수 있다.
유의한 증가: 측정 기술에 고유한 오차 한계보다 더 큰, 예를 들어 특정 산물의 효소 활성, 유전자 발현, 생산성 또는 수율의 증가, 바람직하게는 대조군 효소의 활성, 발현, 생산성 또는 수율, 또는 대조군 세포에서의 발현, 대조군 세포의 생산성 또는 수율의 약 10% 또는 25%만큼, 바람직하게는 50% 또는 75%만큼, 보다 바람직하게는 2배 또는 5배 이상만큼의 증가, 보다 더 바람직하게는 약 10배 이상만큼의 증가.
유의한 감소: 측정 기술에 고유한 오차 한계보다 더 큰, 예를 들어 특정 산물의 효소 활성, 유전자 발현, 생산성 또는 수율 상의 감소, 바람직하게는 적어도 약 5% 또는 10%만큼, 바람직하게는 적어도 약 20% 또는 25%만큼, 보다 바람직하게는 적어도 약 50% 또는 75%만큼, 보다 더 바람직하게는 적어도 약 80% 또는 85%만큼, 가장 바람직하게는 적어도 약 90%, 95%, 97%, 98% 또는 99%만큼의 감소.
실질적으로 상보적: 그의 가장 넓은 의미에서, 참조 또는 표적 뉴클레오티드 서열과 관련하여 뉴클레오티드 서열에 대하여 본원에서 사용되는 경우, 용어 "실질적으로 상보적"은 상기 참조 또는 표적 뉴클레오티드 서열의 실질적으로 상보적인 뉴클레오티드 서열과 정확히 상보적인 서열 간의 동일성 백분율이 적어도 60%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 80% 또는 85%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 93%, 보다 더 바람직하게는 적어도 95% 또는 96%, 또한 보다 더 바람직하게는 적어도 97% 또는 98%, 또한 보다 더 바람직하게는 적어도 99% 또는 가장 바람직하게는 100% (후자는 본 문맥에서 용어 "동일한" 것과 동등함)인 뉴클레오티드 서열을 의미한다. 바람직하게는 동일성은 상기 참조 서열에 대해 적어도 19개 뉴클레오티드의 길이, 바람직하게는 적어도 50개 뉴클레오티드의 길이, 보다 바람직하게는 핵산 서열의 전체 길이 전반에 걸쳐 (하기에 달리 명시되지 않는 한) 평가된다. 서열 비교는 니들만 및 분쉬의 알고리즘 (Needleman and Wunsch (1970) J Mol. Biol. 48: 443-453; 상기 정의된 바와 같음)에 기초한, GAP의 위스콘신 대학교 GCG, SEQWEB 적용 하에 디폴트 GAP 분석을 사용하여 수행된다. 참조 뉴클레오티드 서열에 대해 "실질적으로 상보적"인 뉴클레오티드 서열은 저 엄격도 조건, 바람직하게는 중간 엄격도 조건, 가장 바람직하게는 고도 엄격도 조건 (상기 정의된 바와 같음) 하에 참조 뉴클레오티드 서열에 혼성화된다.
트랜스진: 본원에 사용된 용어 "트랜스진"은 실험적 조작에 의해 세포의 게놈 내로 도입되는 임의의 핵산 서열을 지칭한다. 트랜스진은 "내인성 DNA 서열" 또는 "이종 DNA 서열" (즉, "외래 DNA")일 수 있다. 용어 "내인성 DNA 서열"은 그것이 도입되는 세포에서 자연적으로 발견되는 뉴클레오티드 서열을 지칭하며, 단 이것은 자연 발생 서열과 대비하여 일부 변형 (예를 들어, 점 돌연변이, 선택 마커 유전자의 존재 등)을 함유하지 않아야 한다.
트랜스제닉: 유기체를 지칭하는 경우의 용어 트랜스제닉은 적어도 하나의 재조합 핵산 분자로 형질전환, 바람직하게는 안정하게 형질전환된 것을 의미한다.
벡터: 본원에 사용된 용어 "벡터"는 이와 연결된 또 다른 핵산 분자를 수송할 수 있는 핵산 분자를 지칭한다. 한 가지 유형의 벡터는 게놈 통합된 벡터 또는 "통합된 벡터"이며, 이는 숙주 세포의 게놈 DNA 내로 통합될 수 있다. 또 다른 유형의 벡터는 에피솜 벡터, 즉 염색체외 복제할 수 있는 핵산 분자 또는 플라스미드이다. 이들과 작동가능하게 연결되는 유전자의 발현을 지시할 수 있는 벡터는 본원에서 "발현 벡터"로서 지칭된다. 본 명세서에서, "플라스미드" 및 "벡터"는 문맥상 달리 명확하지 않는 한 상호교환가능하게 사용된다.
야생형: 용어 "야생형", "자연" 또는 "자연 기원"은 유기체와 관련하여, 이러한 유기체가 인간에 의해 변화되지 않거나, 돌연변이되지 않거나 또는 달리 조작되지 않은 것을 의미한다. 폴리펩티드 또는 핵산 서열과 관련해서는, 폴리펩티드 또는 핵산 서열이 자연 발생이거나, 또는 인간에 의해 변화되지 않거나, 돌연변이되지 않거나 또는 달리 조작되지 않은 적어도 하나의 자연 발생 유기체에서 이용가능하다는 것을 의미한다.
미생물의 야생형은 그의 게놈이 특정 유전자의 유전자 변형의 도입 이전과 같은 상태로 존재하는 미생물을 지칭한다. 유전자 변형은, 예를 들어 유전자 또는 그의 일부의 결실 또는 점 돌연변이 또는 유전자의 도입일 수 있다.
용어 "생산" 또는 "생산성"은 관련 기술분야에서 인식되고, 소정의 시간 및 소정의 발효 부피 내에서 형성된 발효 산물 (예를 들어, dsRNA)의 농도 (예를 들어, 리터당 시간당 산물 kg)를 포함한다. 용어 "생산 효율"은 달성하고자 하는 특정한 생산 수준에 요구되는 시간 (예를 들어, 세포가 정밀 화학물질의 특정한 산출 비율을 획득하기 위해 소요되는 시간)을 포함한다.
용어 "수율" 또는 "산물/탄소 수율"은 관련 기술분야에서 인식되고, 탄소 공급원이 산물 (즉, 정밀 화학물질)로 전환되는 효율을 포함한다. 이것은 일반적으로, 예를 들어 탄소 공급원 kg당 산물 kg으로서 표기된다. 화합물의 수율 또는 생산을 증가시킴으로써, 소정 양의 시간에 걸쳐 소정 양의 배양물 중에서 상기 화합물의 회수된 분자 또는 유용한 회수된 분자의 양이 증가된다.
용어 "재조합 미생물"은 그것이 유래되는 야생형 미생물과 비교하여 변경되거나 상이한 유전자형 및/또는 표현형을 나타내도록 유전자 변형시킨 (예를 들어, 이러한 유전자 변형이 미생물의 코딩 핵산 서열에 영향을 미치는 경우) 미생물을 포함한다. 재조합 미생물은 적어도 하나의 재조합 핵산 분자를 포함한다.
핵산 분자와 관련하여 용어 "재조합"은 재조합 핵산 기술을 사용하여 인간에 의해 생산된 핵산 분자를 지칭한다. 용어는 그 자체로는 자연에서 존재하지 않거나 또는 핵산 분자가 유래되는 유기체에는 존재하지 않지만, 인간에 의해 변형되거나, 변화되거나, 돌연변이되거나 또는 달리 조작되는 핵산 분자를 포함한다. 바람직하게는, "재조합 핵산 분자"는 자연 발생 핵산 분자와 서열상 적어도 1개의 핵산이 상이한 비-자연 발생 핵산 분자이다. "재조합 핵산 분자"는 또한, 그 순서로는 자연 발생이지 않는 핵산 분자의 서열을 포함하는, 바람직하게는 작동가능하게 연결된 "재조합 구축물"을 포함할 수 있다. 상기 재조합 핵산 분자를 생산하는 바람직한 방법은 클로닝 기술, 지정된 또는 비-지정된 돌연변이유발, 유전자 합성 또는 재조합 기술을 포함할 수 있다.
이러한 재조합 핵산 분자의 예는 이종 DNA-서열이 삽입된 플라스미드, 또는 재조합 핵산 분자가 유래되는 유전자 또는 프로모터와 비교하여 돌연변이된 유전자 또는 프로모터이다. 돌연변이는 관련 기술분야에 공지된 지정 돌연변이유발 기술 또는 무작위 돌연변이유발 기술, 예컨대 화학물질, UV 광 또는 X선 돌연변이유발 또는 방향적 진화 기술에 의해 도입될 수 있다.
용어 "방향적 진화"는 본원에서 용어 "대사 진화"와 동의어로 사용되고, 관심 형질을 지닌 돌연변이체의 성장을 선호하는 선택 압력을 적용하는 것을 수반한다. 선택 압력은 상이한 배양 조건, ATP 및 성장 커플링된 선택 및 산화환원 관련 선택에 기초할 수 있다. 선택 압력은 일련의 전송 접종을 수반하는 회분식 발효 또는 동일한 압력을 사용하는 연속식 배양으로 수행될 수 있다.
용어 "발현" 또는 "유전자 발현"은 특이적 유전자(들) 또는 특이적 유전적 벡터 구축물의 전사를 의미한다. 용어 "발현" 또는 "유전자 발현"은 특히, 유전자(들) 또는 유전적 벡터 구축물의 mRNA로의 전사를 의미한다. 과정은 DNA의 전사를 포함하고, 생성된 RNA-산물의 프로세싱을 포함할 수 있다. 용어 "발현" 또는 "유전자 발현"은 또한, mRNA의 번역 및 그를 이용한, 코딩된 단백질의 합성, 즉 단백질 발현을 포함할 수 있다.
도면
도 1 내지 12는 본 발명의 융합 핵산 분자의 바람직한 구조를 도시한다. 부위 지정된 핵산 변형 폴리펩티드는 공여자 NA에 융합된 가이드 NA (이들이 함께 fuNA 분자를 형성함)에 의해 표적 이중-가닥 핵산 내의 표적 서열로 향한다.
도 1
5'에서 3'로 가이드 NA (스페이서에 이어서 스캐폴드), 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 1 및 2를 포함하는 융합 NA 분자.
도 2
5'에서 3'로 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 2 및 1, 및 가이드 NA (스캐폴드에 이어서 스페이서)를 포함하는 융합 NA 분자.
도 3
5'에서 3'로 가이드 NA (스페이서에 이어서 스캐폴드), 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 2 및 1을 포함하는 융합 NA 분자.
도 4
5'에서 3'로 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 1 및 2, 및 가이드 NA (스캐폴드에 이어서 스페이서)를 포함하는 융합 NA 분자.
도 5
5'에서 3'로 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 1 및 2, 및 가이드 NA (스페이서에 이어서 스캐폴드)를 포함하는 융합 NA 분자.
도 6
5'에서 3'로 가이드 NA (스캐폴드에 이어서 스페이서), 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 1 및 2를 포함하는 융합 NA 분자.
도 7
5'에서 3'로 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 2 및 1, 및 가이드 NA (스페이서에 이어서 스캐폴드)를 포함하는 융합 NA 분자.
도 8
5'에서 3'로 가이드 NA (스캐폴드에 이어서 스페이서), 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 2 및 1를 포함하는 융합 NA 분자.
도 9
5'에서 3'로 가이드 NA (스페이서 및 스캐폴드의 제1 분자를 포함함), 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 1 및 2를 포함하는 융합 NA 분자. 스캐폴드의 제2 분자는 스캐폴드의 제1 분자에 혼성화되어 있음.
도 10
5'에서 3'로 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 1 및 2, 가이드 NA (스캐폴드의 제1 분자 및 스페이서를 포함함)를 포함하는 융합 NA 분자. 스캐폴드의 제2 분자는 스캐폴드의 제1 분자에 혼성화되어 있음.
도 11
5'에서 3'로 가이드 NA (스페이서 및 스캐폴드의 제1 분자를 포함함), 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 2 및 1을 포함하는 융합 NA 분자. 스캐폴드의 제2 분자는 스캐폴드의 제1 분자에 혼성화되어 있음.
도 12
5'에서 3'로 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 2 및 1, 가이드 NA (스캐폴드의 제1 분자, 스페이서, 및 스캐폴드의 제1 분자에 혼성화되어 있는 스캐폴드의 제2 분자를 포함함)를 포함하는 융합 NA 분자.
도 13
벡터 RWL121.
도 14
벡터 Cas003.
도 15
벡터 Cas018.
도 16
벡터 Cas006.
도 17
벡터 RWL137.
도 18
벡터 Cas019.
도 19
벡터 RLW138.
도 20
벡터 Cas020.
도 21
벡터 RLW139.
도 22
나타낸 바와 같은 상동성 영역 HomA 및 HomB의 위치를 갖는 비. 서브틸리스 ATCC6051 균주의 아밀라제 amyE 유전자좌 (A)를 보여준다. amyE 유전자 내의 프로토스페이서 서열 PS의 위치를 나타내고 (A), PS의 서열을 강조하였다 (백색 문자를 갖는 흑색부, B).
도 23
pCC004 플라스미드 - amyE 프로토스페이서 및 amyE 유전자에 인접한 영역의 상동성 영역 HomA 및 HomB를 보유하는 pJOE8999 플라스미드의 유도체의 벡터 지도를 보여준다. PS = 프로토스페이서; PvanP* = 반합성(hemisynthetic) 프로모터; 'gRNA = 가이드RNA; 람다 T0 종결인자; PmanP = manP 유전자 비. 서브틸리스의 프로모터; Cas9 = 에스. 피로게네스로부터의 엔도뉴클레아제; KanR = 카나마이신 내성 유전자; 이. 콜라이에서의 복제를 위한 pUC의 기점, 바실루스에서의 복제를 위한 pE194의 기점.
도 24
(플라스미드 pCC004를 나타내는 도 2에 예시된 바와 같이) 본 연구에 사용된 다양한 플라스미드의 EcoRI/XbaI 단편의 개략적 도면을 보여준다. Cas9 엔도뉴클레아제, PmanP 프로모터 및 pUC 복제 기점, pE194 복제 기점, 카나마이신 내성 유전자를 갖는 벡터 백본은 나타내지 않았다. 하류 유전자 요소의 전사를 유도하는 프로모터 (Pro)는 나타내어진다. PS = 프로토스페이서; gRNA = crRNA-루프-tracrRNA로 이루어지는 가이드 RNA, T= 람다 T0 종결인자; 상동성 영역 A 및 상동성 영역 B는 amyE 유전자의 배향을 나타낸 화살표로 도시하였다. 플라스미드 유전자 요소의 상세한 설명은 제이. 알텐부흐너(J. Altenbuchner)에 의해 기재된다 (Altenbuchner J. 2016. Editing of the Bacillus subtilis genome by the CRISPR-Cas9 system. Appl Environ Microbiol 82:5421-5).
도 25
pCC004에 비한 각각의 유전자 결실 구축물 (pJOE8999, pCC005-pCC008)에 대한 아밀라제 유전자에 대해 예시된 바와 같은 유전자 녹아웃 효율을, 나타낸 바와 같은 결실 구축물에 대하여 플롯팅하였다.
도 26
나타낸 플라스미드 pCC004, pCC005, pCC006, pCC007, pCC008에 대한 유전자 결실 반응으로부터의 13개의 개별 클론의 게놈 DNA 상에서 올리고뉴클레오티드 서열식별번호: 60 및 61에 의한 PCR 반응의 0.8% 아가로스 겔을 보여준다. 1.4 kb의 DNA 단편의 증폭은 재조합에 의한 유전자 녹아웃을 나타내지만, 3.4 kb의 DNA 단편은 오히려 SOS 복구 메카니즘에 의한 아밀라제 유전자 불활성화를 나타낸다. WT에 있어서 3.4 kb 밴드는 비-. 서브틸리스 WT ATCC6051의 야생형 아밀라제 유전자좌를 나타낸다. C는 첨가된 게놈 DNA가 없는 물 대조군을 표시한다. M은 나타낸 3개의 밴드의 크기 (1.0 kb, 1.5 kb. 4.0 kb)를 갖는 DNA 래더(ladder) '퍼펙트 플러스(Perfect plus) 1 kb DNA 래더' (로보클론(roboklon))를 나타낸다.
실시예
화학물질 및 통상의 방법
달리 나타내지 않는 한, 제한 소화, 아가로스 겔 전기영동, 핵산의 정제, 핵산의 라이게이션, 박테리아 세포의 형질전환, 선택 및 배양을 포함하는 본 발명의 목적을 위해 수행된 클로닝 절차는 문헌 [Sambrook J, Fritsch EF and Maniatis T (1989)]에 기재된 바와 같이 수행하였다. 재조합 DNA의 서열분석은 생어(Sanger) 기술 (Sanger et al., 1977)을 사용하여 레이저 형광 DNA 서열분석기 (어플라이드 바이오시스템즈(Applied Biosystems), 미국 캘리포니아주 포스터 시티)로 수행하였다. 달리 기재되지 않는 한, 화학물질 및 시약은 시그마 알드리치(Sigma Aldrich) (미국 세인트 루이스 시그마 알드리치), 프로메가(Promega) (미국 위스콘신주 매디슨), 두체파(Duchefa) (네덜란드 하를렘) 또는 인비트로젠(Invitrogen) (미국 캘리포니아주 칼스배드)으로부터 수득하였다. 제한 엔도뉴클레아제는 뉴 잉글랜드 바이오랩스(New England Biolabs) (미국 매사추세츠주 입스위치) 또는 로슈 다이아그노스틱스 게엠베하(Roche Diagnostics GmbH) (독일 펜즈베르크)로부터 수득하였다. 올리고뉴클레오티드는 유로핀스 MWG 오페론(Eurofins MWG Operon) (독일 에버스베르크)에 의해 합성하였다.
실험 절차의 소개
C-말단 SV40 핵 국재화 신호를 지니는 Cas9 단백질의 효모 코돈-최적화된 버전 (서열식별번호: 1)을 합성하고, 효모 발현 벡터 내로 클로닝하였다. 동일한 벡터는 사카로미세스 세레비지아에 SNR52 폴리머라제 III 프로모터로부터 발현된 하나 이상의 가이드 RNA (gRNA)를 포함했다.
Cas9는 DNA에 결합하고, gRNA에 의한 표적 서열의 인식 시에 가닥 둘 다를 절단시키지만, 이는 오직 정확한 프로토스페이서-인접한 모티프 (PAM)가 3' 말단에 존재하는 경우에만 해당된다. 이론적으로 형태 GN20GG의 임의의 서열이 표적화될 수 있다. 그러므로, 설계된 CRISPR 시스템에 의해 표적화될 리포터 시스템 (GAL4-UAS (서열식별번호: 7))의 효모에서의 공동-발현을 위해 제2 벡터를 구축하였다. gRNA-공여자 융합체 (융합 NA)를 여러 비-기능적 Gal4 표적 (서열식별번호: 9-15)을 표적화하고 복구시키는데 사용하였다.
Gal4 (서열식별번호: 8)는 2-성분: N-말단에 위치된 DNA 결합 도메인 및 C-말단의 전사 활성화를 위한 영역으로 이루어지는 효모 전사 활성인자이다. Gal4는 효모 게놈 내 마커 유전자의 특정한 인식 서열 UAS (상류 활성화 서열)에 결합하여, 그의 전사를 활성화시킨다. MaV203 효모 균주는 효모 게놈 내 상이한 유전자좌에 안정하게 통합된 각각의 3개의 리포터 유전자 (HIS3, URA3 및 lacZ)의 단일 카피를 함유한다. URA3, HIS3 및 lacZ의 프로모터 영역은 (GAL4 결합 부위의 존재를 제외하고) 관련이 없다.
Gal4의 여러 비-기능적 (정지 코돈의 삽입에 의해 결실되고/거나 파괴된) 버전을 합성하고 (서열식별번호: 9-15), 효모 세포 내로 형질전환하여, 그들을 공동-발현된 CRISPR 기구에 의해 표적화하고 복구시킬 수 있었다. CRISPR 성분이 제공되는 적절한 복구 공여자 서열에 의한 상동 재조합 (HR)에 의한 전장 Gal4의 복원은 lacZ 및 HIS3 리포터 유전자의 활성화를 발생시킨다. Gal4 유전자 복구 및 결과적인 전사 활성화는 히스티딘이 결여된 플레이트 상에서의 세포 성장에 의해 모니터링될 수 있고, 반면에 lacZ 유전자의 유도는 X-gal (5-브로모-4-클로로-3-인돌릴-β-D-갈락토피라노시드)으로 검정할 시에 청색 색상을 생성한다.
사용된 효모 균주는 발현 구축물 둘 다에 대한 선택을 가능하게 하는 2개의 추가적인 영양요구성 돌연변이 (leu2 및 trp1)를 함유한다.
본원에 개시된 융합 시스템의 복구 효능 증가를 입증하기 위하여, 모든 실험을 공여자 및 가이드 RNA가 개별적으로 전사되는 비-융합된 카세트와 병행하여 수행하였다.
효모 균주, 배지 및 배양 조건
기재된 실시예에 사용된 사카로미세스 세레비지아에 균주는 라이프 테크놀로지스(Life Technologies)에 의해 상업화된 MaV203 (MATα, leu2-3,112, trp1-901, his3Δ200, ade2-101, gal4Δ, gal80Δ, SPAL10::URA3, GAL1::lacZ, HIS3UAS GAL1::HIS3@LYS2, can1R, cyh2R)이다. 효모를 2% 글루코스가 보충되고 적절한 영양요구성 화합물이 결여된 효모 질소 염기에 기초한 합성 최소 배지 (SD 배지) (포미디움(ForMedium), 영국)에서 성장시켰다. 배양물을 진탕기 또는 인큐베이션 오븐에서 30℃에서 성장시켰다.
에스케리키아 콜라이를 본 발명자들의 실험에 사용된 모든 플라스미드를 위한 증식 미생물로서, 뿐만 아니라 변형된 표적의 추가적 증식 및 유지를 위해 사용하였다. 이. 콜라이를 표준 미생물학적 실시에 따라 성장시켰다 (Molecular Cloning: A Laboratory Manual, 3rd ed., Vols 1,2 and 3. J.F. Sambrook and D.W. Russell, ed., Cold Spring Harbor Laboratory Press, 2001). Cas9, 가이드 RNA 및 공여자 NA를 함유하는 플라스미드는 이. 콜라이에서의 복제 및 유지를 위한 pUC-기반 복제 기점 및 암피실린 내성 유전자를 포함했다. 반면에 GAL4 표적 플라스미드는 겐타미신 내성 유전자 (Gmr)를 함유했다.
실시예 1 플라스미드 구축
Cas9 유전자는 원래 진핵 세포에서의 발현을 위해 구축된 스트렙토코쿠스 피오게네스 Cas9 (SpCas9; WO2007/025097)의 효모 코돈-최적화된 버전이었다 (Mali et al. (2013) Science 339(6121); Cong et al. (2013) Science 339(6121)). 이 Cas9 유전자를 양쪽 말단에 SV40 핵 국재화 신호로 태그부착하고 합성하였다. 또한, 생체내 RNA 합성을 위한 SNR52 프로모터를 함유하는 gRNA 및 공여자 발현 카세트를 합성하였다.
pDEST22 (라이프 테크놀로지스) 내 GAL4-AD 코딩 서열을 심리스 클로닝(Seamless Cloning) (라이프 테크놀로지스)을 통해 합성 Cas9에 의해 대체하였다. 이 벡터는 효모에서의 발현을 위한 효모 알콜 데히드로게나제 유전자 (ADH1)의 구성적 중등-강도 프로모터 및 전사 종결인자뿐만 아니라 트립토판 결여 배지 상의 효모에서의 선택을 위한 TRP1 유전자를 함유한다.
동일한 벡터는 클로람페니콜 내성 유전자 (Cmr) 및 ccdB 유전자에 플랭킹되는 2개의 재조합 부위, attR1 및 attR2를 함유하며, 이는 설계된 gRNA 및 공여자 발현 카세트 (융합 또는 이중 분자로서)가 게이트웨이 클로닝(Gateway Cloning) (라이프 테크놀로지스)을 통해 동일한 발현 벡터에 도입되도록 한다. LR 재조합 반응에 이어서, Cmr 및 ccdB 유전자를 융합 NA 카세트 또는 비-융합된 공여자 및 가이드 발현 카세트에 의해 대체시켰다.
효모에서 CRISPR 복구를 위한 표적으로서 사용된 변형된 GAL4 코딩 서열을 합성하였다. 효모에서의 발현을 위한 pDEST32 플라스미드 (라이프 테크놀로지스)를 HindIII 및 SacII로 절단하였고, ADH1 프로모터 및 종결인자를 함유하는 백본을 겔 정제하였다. GAL4 합성된 삽입체를 심리스 클로닝을 사용하여 벡터 내로 조립하였다. 이 벡터는 트립토판 결여 배지 상의 효모에서의 선택을 위한 LEU2 유전자를 포함했다.
GAL4 서열에서 Cas9에 의한 인식을 위한 표적-부위를 GAL4 유전자 내의 잠재적 PAM (NGG) 서열 이전의 20-머 영역을 선택함으로써 실험적으로 선택하였다 (Sternberg et al. (2014); Nature 507(7490)).
Cas9 결합 및 R-루프 형성을 용이하게 하기 위해, 본 발명자들은 문헌 [Jinek et al. (2012) Science;337(6096))]에 의해 처음에 설계된 바와 같이, 매달린(dangling) 스페이서, 확장된 헤어핀 영역 및 긴 3' 말단을 함유하는 2차 구조를 갖는 단일 가이드 RNA 설계를 선택했다.
실시예 2 효모 형질전환
CRISPR 편집 도구 (Cas9 효소 및 융합 NA 발현 카세트) 및 GAL4 표적 플라스미드의 동시 형질전환을 제조업체의 프로토콜 (라이프 테크놀로지스)에 기재된 바와 같이 열-쇼크에 의해 수행하였고, 도입되는 플라스미드에 의해 보충되는 영양요구성 화합물 (류신 및 트립토판)이 결여된 적절한 합성 완전 (SC) 배지에서 증식시켰다. 형질전환된 세포를 밤새 증식되도록 하고, (OD 측정에 따른) 형질전환체의 동등량을 100mM 3-아미노-1,2,4-트리아졸 (3-AT; 포미디움, 영국)을 갖는 히스티딘 결여 합성 완전 (SC) 배지를 함유하는 중실 플레이트로 옮겼다. (히스티딘 없이 배지에서 효모 성장을 가능하게 하기 위한) HIS3의 발현은 GAL4-의존성이고, 따라서 형질전환체는 GAL4 복구가 발생한 경우에만 성장할 수 있다. 보다 앞서, 3-AT는, 히스티딘을 생산하기 위해 HIS3에 의존하는 효모 형질전환체에 3-AT를 적용하는 것에 의한 HIS3 유전자의 산물의 경쟁적 억제제이고, HIS3 발현의 증가된 수준이 효모 세포가 생존하기 위하여 요구된다.
추가적으로 사용된 효모 균주는 GAL4의 제어 하에 lacZ 마커 유전자를 함유하며, 이는 GAL4-복구된 형질전환체의 청색/백색 선택을 가능하게 했다. lacZ 유전자의 유도는 X-gal (5-브로모-4-클로로-3-인돌릴-β-D-갈락토피라노시드)로 검정 시에 청색 색상을 생성한다.
실시예 3 X-gal 검정
히스티딘이 결여된 플레이트에서 성장하는 형질전환체를 YPAD 배지 (펩톤, 효모 추출물 및 글루코스의 균질 블렌드를 함유하는 복합 효모 배지; 포미디움, 영국)를 갖는 플레이트의 표면 상에 놓인 니트로셀룰로스 막 (하이본드(Hybond), 지이 헬스케어(GE Healthcare)) 상으로 복제 플레이팅하였다. 막을 함유하는 YPAD 플레이트를 18-24시간 인큐베이션한 후에 검정을 수행하였다. 각각의 막에 대해, 5mg X-gal을 50μl DMF에 용해시키고 30μl 2-메르캅토에탄올 및 5ml Z 완충제와 합하였다. 이 용액을 사용하여 15-cm 페트리 디쉬에서 2개의 둥근 여과지 (와트만(Whatman) 541)를 적셨다. 겸자를 사용하여, 막을 YPAD 플레이트의 표면으로부터 조심스럽게 분리하고, 약 20초 동안 액체 질소 중에 완전히 침지시켰다. 동결된 막을 침지된 와트만 필터의 상부에 놓았다 (콜로니 측면이 위로 가게 함). 플레이트를 치밀하게 덮고, 37℃에서 인큐베이션하였다. 24시간 후에 청색 색상의 외관을 모니터링하였다.
실시예 4 표적 (CRISPR가 복구된) 플라스미드의 서열분석
각각의 실험에 대해, 적어도 8개의 GAL4-복구된 양성 형질전환체 (히스티딘 없는 배지에서 성장할 수 있는 콜로니)를 액체 배지 중에서 밤새 계대-배양하였고, GAL4 함유 플라스미드를 단리하였다 (지모프렙(Zymoprep) 효모 플라스미드 미니프렙 II, 지모 리서치(Zymo Research)를 사용함). 단리된 플라스미드를 추가적 증식 및 상업적 서열분석을 위하여 이. 콜라이에 도입하였다. GAL4 서열분석은 공여자 분자에 의한 서열 복구 및 조립을 입증가능하도록 했다.
양성 클론에서의 Gal4 유전자의 생어 서열분석은 이 표적화 과정의 서열 특이성을 추가로 검증하였고, 융합 NA에 의해 형질전환된 세포가 훨씬 더 많은 수의 성공적 HR 사건을 나타낼지라도, 공여자 및 gRNA를 융합 또는 비-융합된 것으로서 발현하는 세포의 복구에서 어떠한 차이도 보여주지 않았다.
실시예 5 15bp 상동성 아암에 의한 1nt의 결실
가이드 RNA로의 공여자 (공여자 1; 서열식별번호: 26)의 융합은 (히스티딘이 결여된 배지 상에서 성장할 수 있는) 복구된 형질전환체를 생성한 반면, 비-융합된 가이드 및 공여자 RNA에 의한 형질전환체에 대해서는 어떠한 성장도 관찰되지 않았다. 유전자 복구의 낮은 효율은 상동 재조합에 이용가능한 서열 중첩의 감소와 일치한다.
실시예 6 50bp 상동성 아암에 의한 1nt의 결실
가이드 RNA로의 공여자 (공여자 2; 서열식별번호: 27)의 융합은 비-융합된 공여자 및 가이드 NA에 의한 것보다 적어도 50배 더 형질전환체를 생성했다.
양성 클론에서의 Gal4 유전자의 서열분석은 복구가 HR로부터만 또는 극히 대부분 HR로부터 기인한다는 것을 보여주었다 (모든 서열분석된 클론에 대해 NHEJ의 증거가 없음).
실시예 7 50/26bp 상동성 아암에 의한 20nt의 삽입
상기와 동일한 융합 NA를 사용하여 20nt가 제거된 유사한 표적을 복구하였고 (표적 3; 서열식별번호: 11), 결과적으로 하나의 상동성 아암을 감소시켰다. 융합은 비-융합된 공여자 및 가이드 NA에 의한 것보다 약 5배 더 형질전환체를 생성했다. 양성 클론에서의 Gal4 유전자의 서열분석은 복구가 상동 재조합으로부터 독점적으로 기인한다는 것을 보여주었다.
실시예 8 50bp 상동성 아암에 의한 누락 400bp의 삽입 (3nt 떨어진 2개의 표적 서열을 시험함)
본 발명자들은 매우 근접하여 (2개의 20 nt 표적 사이에 3nt 간격으로) 위치한 2개의 서열 (스페이서 2 및 스페이서 3; 서열식별번호: 20 및 21)의 동시 표적화를 독립적으로 그리고 함께 (멀티플렉스화 표적화) 시험했다. 멀티플렉스 융합 카세트는 프로모터에 이어서 2개의 탠덤 융합 NA 서열로 이루어졌고, 이는 2개의 gRNA 및 복구 주형으로 구성된 단일 분자를 제조하도록 한다. 본 발명자들의 실험은 융합 NA가 2개의 서열을 동시에 표적화하는 것에 또한 적용가능하다는 것을 분명히 보여주었다.
표적 둘 다에 대해, 공여자-가이드 융합의 존재 하의 복구는 비-융합된 버전에 의한 것보다 매우 더 (스페이서 2에 의한 표적화에 대해 최고 10배 더, 스페이서 3에 대해 5배 더) 효율적이었다.
실시예 9 120 bp 상동성 아암에 의한 HR 말단 제외 전장 GAL4 유전자 (960bp)의 삽입
융합 CRISPR이 전장 코딩 서열의 도입에 효과적일 수 있는지를 시험하기 위해, 본 발명자들은 전장 GAL4 유전자 (서열식별번호: 7)를 도입하는 것을 시험했다. 예로서, 본 발명자들은 실시예 4에서 이미 효과적인 것으로 밝혀진 공여자/상동성 아암 길이의 비를 유지하기 위해 120bp 상동성 아암을 선택했다. 전장 GAL4 유전자의 삽입은 융합 구축물에 의해 약 4배 더 효과적이다.
표적화된 편집은 복구 공여자 서열이 gRNA에 융합되었을 때 적어도 50배 더 효율적이라는 것을 본 발명자들의 결과가 보여준다. 수행된 실험은 단일 염기 제거에서부터 전체 유전자 삽입에 이르기까지 광범위한 융합-관련 개선된 유효성을 나타낸다. 보고된 실시예는 이러한 CRISPR 융합 시스템이 비교적 큰, 가이드 RNA에 융합된 공여자 분자를 운반하기에 적합하다는 것을 보여준다.
실시예 10a 벼에서의 발현을 위한 구축물
아그로박테리움-매개된 식물 형질전환에 CRISPR/Cas 시스템을 제공하기 위해, 게이트웨이(Gateway) 2원 T-DNA 벡터를 Cas9 뉴클레아제 및 가이드 RNA-공여자 발현 카세트의 (단일 또는 이중 RNA 분자로서의) 공동-발현을 위해 설계하였다. 양쪽 말단에서 SV40 핵 국재화 신호 (NLS) (서열식별번호: 6)에 부착된, 벼 (오리자 사티바(Oryza sativa))에서 발현을 위해 코돈-최적화된 스트렙토코쿠스 피오게네스 Cas9 (SpCas9)의 버전을 합성하였다. 합성된 카세트는 Cas9 상류에 위치한 구성적 발현을 위한 메이즈 폴리유비퀴틴 (Ubi) 프로모터 (서열식별번호: 32), 및 3'-말단에서 노팔린 신타제 (nos) 종결인자 (서열식별번호: 33)를 포함한다. 이 유전자 카세트를 심리스를 통해, T-DNA 경계 내에 기능적 요소로서 식물 선택 마커; 스크리닝 마커 발현 카세트; 및 진입 클론에서 gRNA-공여자 발현 카세트와의 LR 재조합을 위해 의도된 게이트웨이 카세트를 함유하는 벡터 내로 클로닝하였다.
3개의 gRNA를 설계하였으며, 그들은 벼 프로토포르피리노겐 옥시다제 (PPO) 유전자 (WO/2015/092706; WO/2015/022640) (서열식별번호: 35)를 표적화했고, 이는 선택된 표적 부위 (스페이서 8, 스페이서 9 및 스페이서 10 (서열식별번호: 36, 37 및 38))에서 게놈 이중-가닥 절단을 발생시켰다. 변형은 2개의 아미노산 치환 (L419F, F442V; 단일 부위 돌연변이 및 이중 부위 돌연변이)을 목적으로 하며, 그들은 이전에 사플루페나실 생존을 위한 잠재적 핫스팟으로서 확인되었다.
융합 또는 비-융합 NA를 함유하는 RNA 발현 카세트 (PPO 유전자 내의 선택된 위치에 대한 유전자-특이적 스페이서 서열을 포함함)를 합성하고, 진입 벡터 내로 클로닝하였으며, 이를 CAS9 발현 카세트를 함유하는 목표 벡터 내로 (게이트웨이를 통해) 클로닝하였다. gRNA 및 공여자의 RNA 발현을 U3 snRNA의 pol III 유형 프로모터에 의해 유도하였다.
LR 재조합 단계 후에, 생성된 발현 벡터를 관련 기술분야에 널리 공지된 방법에 따라 아그로박테리움 균주 LBA4044 내로 형질전환시켰다.
실시예 10b 벼에서의 발현을 위한 구축물
SV40으로부터 유래된 NLS가 N-말단 단부에서 식물 핵 국재화 신호 (NLS) (MSERKRREKL, 서열식별번호: 71)로, C-말단 단부에서 임포르틴 NLS (KRPAATKKAGQAKKKK, 서열식별번호: 72)로 대체된 점을 제외하고는, 실시예 10a에 기재된 바와 동일한 벡터를 합성하였고, gRNA 및 공여자의 RNA 발현을 유도하는 프로모터는 U3 snRNA의 벼 pol III 유형 프로모터 (서열식별번호: 73)였다.
융합 또는 비-융합 NA를 함유하는 RNA 발현 카세트 (PPO 유전자 내의 선택된 위치에 대한 유전자-특이적 스페이서 서열을 포함함)를 합성하고, 진입 벡터 내로 클로닝하였으며, 이를 CAS9 발현 카세트를 함유하는 목표 벡터 내로 (게이트웨이를 통해) 클로닝하였다.
비 융합 대조군으로서 사용된 벡터는 PRO0231::U3 RNA pol III 프로모터::스페이서::sgRNA 스캐폴드::TTTTTTTT 종결인자::U3 RNA pol III 프로모터::주형::TTTTTTTT 종결인자를 함유한다.
LR 재조합 단계 후에, 생성된 발현 벡터를 관련 기술분야에 널리 공지된 방법에 따라 아그로박테리움 균주 LBA4044 내로 형질전환시켰다.
실시예 11 제초제-내성 캘러스의 벼 형질전환 및 선택
발현 벡터를 함유하는 아그로박테리움을 사용하여 인디카 벼 (오리자 사티바 L.(Oryza sativa L.))의 배반-유래 캘러스를 형질전환시켰다. 성숙한 종자의 멸균을 70% 에탄올에서 1분 동안에 이어서 6% 차아염소산나트륨에서 40분 동안 인큐베이션한 후에, 멸균 MQ 물로 3 내지 5회 세척함으로써 수행하였다. 이어서, 멸균된 종자를 2,4-D를 함유하는 배지 (캘러스 유도 배지) 상에서 발아시켰다. 광 하에 6일 인큐베이션한 후에, 배반-유래 캘러스를 박테리아 용액 (OD600 = 0.1) 내에서 90초 동안 인큐베이션하고, 배수시키고, 멸균 필터 종이 상에서 건조시킨 다음, 3일 동안 암실에서 25℃에서 박테리아와 공동-배양하였다. 공동-배양된 캘러스를 4주 동안 광 하에 32℃에서 G418을 함유하는 선택 배지로 옮겼다. 항생제-내성 캘러스 조각을 2주 동안 광 하에 32℃에서 25 또는 50 μM 사플루페나실 (킥소르(Kixor)™)을 함유하는 선택 배지로 옮겼다. 이들 제초제 선택 조건을 사플루페나실에 의한 사멸 곡선에서의 조직 생존의 분석을 통해 확립하였다. 제초제-내성 물질을 재생 배지로 옮기고 광 하에 인큐베이션한 후, 배아발생 잠재력이 나타났고, 다음 4 내지 5주 내에 싹이 발생하였다. 싹을 캘러스로부터 절제하고, 싹이 토양으로 옮기기 위해 잘 뿌리를 내릴 때까지 옥신-함유 배지 상에서 2 내지 3주 동안 인큐베이션하였다. 단단해진 싹을 온실 내에서 높은 습도 및 짧은 기간 하에 성장시켰다.
실시예 12 제초제 내성 형질전환체의 분자 특징화
각각의 개별 식물 형질전환체로부터 수집된 잎 조직을 PPO 유전자 서열 돌연변이의 카피수 분석 및 분자 특징화에 사용하였다. 제조업체에 의해 지시된 바와 같이 위자드(Wizard) 96 마그네틱 DNA 식물 시스템 키트 (프로메가, 미국 특허 번호 6,027,945 & 6,368,800)를 사용하여 게놈 DNA를 추출하였다. 정방향 및 역방향 프라이머와 함께 적절한 프로브를 사용하여 단리된 DNA를 PCR 증폭시켰다. T-DNA 삽입체의 카피수를 입증하기 위한 이러한 정량적 PCR 분석 후에, 선택제에 대한 내성을 나타내는 단지 낮은 카피의 트랜스제닉 식물만을 T1 종자의 수확를 위해 유지하였다. 이어서, 이식 3 내지 5개월 후에 종자를 수확하였다.
PPO 게놈 서열의 PCR 증폭을 하기와 같이: 96℃에서 15분 동안, 이어서 35 사이클 (96℃, 30초; 58℃, 30초; 72℃, 3분 30초), 72℃에서 10분 열순환 프로그램을 사용하여 융합 Taq DNA 폴리머라제 (써모 사이언티픽(Thermo Scientific))를 사용하여 수행하였다. PCR 생성물을 아가로스 겔 전기영동을 통해 농도 및 단편 크기에 대해 입증하고, PCR 프라이머를 사용하는 서열분석을 위해 보냈다. 디폴트 설정을 사용하여 대표적인 크로마토그램 추적 파일 및 상응하는 얼라인X(AlignX) 정렬 상에서 서열 분석을 수행하고, 2차 피크를 호출하기 위해 편집하였다.
서열 정보에 기초하여 여러 개체에서 확인된 돌연변이는, NA의 CRISPR 성분으로의 융합을 수반하는 본 발명에 기재된 기술이 식물 유기체에 적용될 수 있다는 것을 보여준다. 제공된 공여자에 의한 상동 재조합 복구는 사플루페나실 (단일 부위 돌연변이 및 다중 부위 돌연변이)에 대한 내성을 부여한다.
실시예 13 에스케리키아 콜라이에서의 제어된 유전자 녹아웃
본 실시예에서 융합CRISPR은 이. 콜라이 균주 K-12 하위균주 MG1655에서 표적 유전자 RecA를 녹아웃시키는데 사용된다. 박테리아 균주를 100 ml 삼각 플라스크에서 10 ml SOB 중에 접종시키고, 밤새 37℃에서 성장시켰다 (SOB: 2% 박토-트립톤, 0.5% 효모 추출물, 10 mM NaCl, 2.5 mM KCl, 10 mM MgCl2, 10 mM MgSO4). 밤샘 배양물 3 ml를 1 리터 삼각 플라스크에서 250 ml SOB 중에 희석하고, OD660nm가 0.6이 될 때까지 18℃에서 격렬히 진탕시키면서 (200-250 rpm) 성장시켰다. 후속적으로 배양물을 사전 냉각된 50 ml 튜브로 옮기고, 5분 동안 4℃에서 5000 rpm으로 원심분리하였다. 펠릿을 빙냉 TB의 원래 부피의 1/3 중에 재현탁하고 (TB: 250 mM KCl, 10 mM PIPES 유리 산, 15 mM CaCl2·2H2O, 55 mM MnCl2·2H2O), 10분 동안 얼음 상에서 인큐베이션하였다. 세포를 5분 동안 4℃에서 5000 rpm으로 원심분리하고, 펠릿을 빙냉 TB의 원래 부피의 1/12 중에 재현탁하였다. DMSO를 부드럽게 혼합하면서 7%의 최종 농도로 첨가하였다. 적격 세포를 200 μl 부분으로 분취하고, 액체 질소에서 동결시켰다. 적격 세포의 하나의 분취물을 클로람페니콜 선택 마커 및 pCas9에 존재하는 바와 같은 Cas9 발현 카세트 [Jiang W, Bikard D, Cox D, Zhang F, Marraffini L (2013) RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nat Biotechnol] 및 융합 RNA의 발현을 위한 카세트 [Zhao D, Yuan S, Xiong B, Sun H, Ye L, Li J, Zhang X, Bi C. (2016) Development of a fast and easy method for Escherichia coli genome editing with CRISPR/Cas9. Microb Cell Fact. 15(1):205]를 함유하고 하기 융합CRISPR 서열 및 RecA 스페이서를 갖는 0.1-0.5 μg의 플라스미드와 함께 첨가하였다:
Figure pat00004
여기서 RecA를 인지하는 스페이서는 강조표시하고, sgRNA에 대한 필수 서열은 대문자표시하되, 밑줄표시하지 않았고, RecA와의 상동성 아암 1은 이중 밑줄표시하고, RecA와의 상동성 아암 2는 단일 밑줄표시하였다. 융합CRISPR 구축물 및 Cas9를 위한 프로모터 및 종결인자는 http://parts.igem.org/Promoters/Catalog/Constitutive 및 http://parts.igem.org/Terminators/Catalog로부터 선택될 수 있다. 표적화된 RecA 유전자는 하기 서열을 갖는다:
Figure pat00005
여기서 PAM 서열은 이탤릭표시하고, 상동성 아암 1은 이중 밑줄표시하고, 상동성 아암 2는 단일 밑줄표시하고, 프로토스페이서는 강조표시하였다. DNA 및 세포를 얼음 상에서 30분 동안 유지한 후에 42℃에서 90초 열 쇼크에 적용하였다. 세포 및 DNA를 얼음으로 옮기고, 1 ml LB를 1분 후에 첨가하였다 (LB: 1% 트립톤, 1% NaCl, 0.5% 효모 추출물, pH 7.0). 세포를 1시간 동안 37℃에서 회복하도록 하였다. 회복기는 융합CRISPR 성분이 더 많은 시간 동안 이. 콜라이 게놈을 편집하도록 하기 위해 16시간으로 연장될 수 있다. 25 μg/ml 클로람페니콜을 1시간 후에 첨가하여 플라스미드의 손실을 막아야 한다. 세포를 25 μg/ml 클로람페니콜을 갖는 LB 배지 상에 플레이팅하고, 37℃에서 1일 동안 인큐베이션하였다. 플레이트로부터 단일 콜로니를 선택하고, 밤새 클로람페니콜을 갖는 LB에서 37℃에서 성장시킨 후 게놈 DNA를 추출하였다 [He, F. (2011) E. coli Genomic DNA Extraction. Bio-protocol Bio101: e97]. 제1 상동성 아암 상류의 정방향 프라이머 (ATGGCTATCGACGAAAACAAA) (서열식별번호: 44) 및 제2 상동성 아암 하류의 역방향 프라이머 (CGTCAGCGTGGTTTTACCGGA) (서열식별번호: 45)에 의한 PCR을 수행하여 RecA 서열 (서열식별번호: 43)에서 볼드체표시로 나타낸 11개의 뉴클레오티드가 융합CRISPR 주형에 의한 상동 재조합 복구로 인해 더 이상 존재하지 않는 콜로니를 확인하였다. PCR 단편을 서열분석하거나 (예상된 크기 220 bp), 또는 이 경우 AgeI 소화에 적용하여 (PAM 주위에 결실된 서열이 AgeI 인식 부위 ACCGGT를 함유함) 표준 겔 전기영동 후에 유전자좌의 변형을 입증할 수 있었다. 11개의 뉴클레오티드의 결실은 오픈 리딩 프레임의 파괴를 보증한다.
실시예 14 인간-유도된 만능 줄기 세포 (hiPSC) 및 HEK293 세포의 PRDM9 유전자의 제어된 녹아웃
세포 배양 유지, 플라스미드 구축, 형질감염 방법 및 hiPSC 및 HEK293 세포에서의 게놈 편집의 분자 분석은 문헌 [Yang L, Yang JL, Byrne S, Pan J, Church G (2014) CRISPR/Cas9-directed genome editing of cultured cells. Current Protocols in Molecular Biology 31.1.1-31.1.17]에 매우 상세하게 기재되어 있다. PRDM9 유전자의 녹아웃을 위해, 모든 단계는 gRNA 플라스미드 설계에서의 단지 작은 변화만 갖고, 본원에 기재된 바를 따랐다. 합성된 gRNA는 하기 서열을 가질 것이다:
Figure pat00006
여기서 U6 프로모터는 이탤릭체표시로 나타내고, PRDM9 엑손 ENSE00001804383을 인지하는 스페이서는 강조표시하고, sgRNA를 위한 필수 서열은 대문자표시하되 밑줄표시 또는 이탤릭체표시하지 않았고, PRDM9와의 상동성 아암 1은 이중 밑줄표시하고, PRDM9와의 상동성 아암 2는 단일 밑줄표시하고, 종결인자는 소문자표시하였다. 표적화된 PRDM9 엑손 ENSE00001804383은 하기 서열을 갖는다:
Figure pat00007
여기서 PAM 서열은 이탤릭체표시하고, 상동성 아암 1은 이중 밑줄표시하고, 상동성 아암 2는 단일 밑줄표시하고, 프로토스페이서는 강조표시하였다. 볼드체표시로 나타낸 뉴클레오티드는 융합CRISPR 구축물과의 상동 재조합 시에 결실되어 게놈 DNA로부터의 각각의 게놈 영역의 PCR 증폭 및 생성된 PCR 생성물의 후속 서열분석을 사용하여 나타낸 바와 같은 프레임 시프트를 생성한다.
실시예 15: 벼에서 시클로헥산디온 (DIM) 및/또는 아릴옥시페녹시프로피오네이트 (FOP)에 대해 생성된 벼 식물 내 점 돌연변이의 도입.
색소체성(plastidic) 아세틸 조효소 A 카르복실라제 (ACCase)의 돌연변이 I1781L 및 G2096S는 DIM 및 FOP 제초제에 대한 내성을 부여하는 것으로 공지되어 있다. 이들 돌연변이를 하기 벡터를 사용하여 내인성 ACCase 유전자좌에 도입할 수 있다.
벡터 RLW137 서열식별번호: 66
이 벡터의 백본은 게이트웨이-가능 구축물 RLW121 서열식별번호: 62이다.
RLW137을 위한 ENTR 벡터는 벡터 CC003 서열식별번호: 63 (유입되는 T-DNA를 위한 선택 마커), CC018 서열식별번호: 64 (G2096에 상응하는 DNA의 상류를 절단한 후에 G2096S를 표적화하고 도입하는 융합CRISPR 구축물을 생성함) 및 CC006 서열식별번호: 65 (Cas9를 제공함)이다.
CC018 (CRISPRCas018에 대해 짧음)은 유입되는 뉴클레오티드 (이 경우에 G2096S를 코딩함)에 플랭킹된 ~300 nt 상동성 아암을 함유한다. 추가의 돌연변이를 공동-도입하여 T-DNA (돌연변이된 PAM, 대안적으로 또는 추가로 스페이서는 바람직하게는 존재하는 경우에 엑손과 부합하고 인트론/엑손 경계에 영향을 미치지 않은 부분에서 침묵하는 많은 돌연변이를 포함할 수 있음)의 자기-절단 및 상동성 아암 또는 유입되는 뉴클레오티드에 존재하는 T의 긴 스트레치 상에서의 전사의 조기 종결을 회피할 수 있었다.
공여자 분자가 가이드 RNA에 연결되지 않는 개별 분자로서 발현되는 것을 제외하고 동일한 대조군 벡터를 합성하였다.
벡터 RLW137 및 대조군 벡터를 상기 기재된 프로토콜을 사용하여 벼 내로 형질전환시켰다. 초기 선택은 ZmAHAS A122T S553N 마커의 존재에 대한 것이다. 형질전환된 식물의 분석을 실시예 12에 기재된 바와 같이 수행하였다.
RLW137에 대해 상기 기재된 절차와 유사하게, RLW138에 동일한 돌연변이를 도입하되, 이번에는 대안적 하류 프로토스페이서 부위를 사용하였다. RLW138은 CC003, CC019 (서열식별번호: 67) 및 CC006과 RLW121 백본으로 이루어진다.
돌연변이 I1781L을 RLW121, CC003, CC020 (서열식별번호: 69) 및 CC006으로 이루어지는 RLW139 (서열식별번호: 70)에 의해 도입하였다.
실시예 16 바실루스에서의 융합 CRISPR의 적용
전기적격 바실루스 서브틸리스 세포 및 전기천공
비. 서브틸리스 ATCC 6051 내로의 DNA의 형질전환을 전기천공을 통해 수행하였다. 전기적격 비. 서브틸리스 ATCC 6051 세포의 제조 및 DNA의 형질전환을 수(Xue) 등에 의해 본질적으로 기재된 바에 따라 (Xue, G.-P., 1999, Journal of Microbiological Methods 34, 183-191), 하기와 같이 변형하여 수행하였다: DNA의 형질전환 시에, 세포를 1ml LBSPG 완충제 중에서 회복시키고, 60분 동안 37℃에서 인큐베이션한 후에 (Vehmaanperae J., 1989, FEMS Microbio. Lett., 61: 165-170) 선택적 LB-한천 플레이트 상에 플레이팅하였다. 온도-감수성 pE194 복제 기점을 함유하는 플라스미드를 위해, 세포를 3시간 동안 33℃에서 회복시켰다.
플라스미드 단리
플라스미드 DNA를 문헌 [Sambrook,J. and Russell,D.W. Molecular cloning. A laboratory manual, 3rd ed, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY. 2001.]에 기재된 표준 분자 생물학 방법에 의해, 또는 알칼리성 용해 방법에 의해 (Birnboim, H. C., Doly, J. (1979). Nucleic Acids Res 7(6): 1513-1523) 바실루스 및 이. 콜라이 세포로부터 단리하였다. 바실루스 세포는 이. 콜라이와 비교하여 세포 용해 전에 30분 동안 37℃에서 10mg/ml 리소자임으로 처리하였다.
올리고뉴클레오티드-듀플렉스를 형성하기 위한 올리고뉴클레오티드의 어닐링.
올리고뉴클레오티드를 물에서 100μM의 농도로 조정하였다. 정방향 올리고뉴클레오티드 5μl 및 상응하는 역방향 올리고뉴클레오티드 5μl를 90μl 30mM HEPES-완충제 (pH 7.8)에 첨가하였다. 반응 혼합물을 5분 동안 95℃로 가열한 다음, 95℃에서 4℃로 0.1℃/초씩 온도를 감소시키면서 경사지도록 함으로써 어닐링하였다 (Cobb, R. E., Wang, Y., & Zhao, H. (2015). High-Efficiency Multiplex Genome Editing of Streptomyces Species Using an Engineered CRISPR/Cas System. ACS Synthetic Biology, 4(6), 723-728).
분자 생물학 방법 및 기술
플라스미드 pJOE8999:
문헌 [Altenbuchner J. 2016. Editing of the Bacillus subtilis genome by the CRISPR-Cas9 system. Appl Environ Microbiol 82:5421-5].
플라스미드 pCC001
표준 이. 콜라이 클로닝 벡터 (pUC 유도체)에 제공된 pJOE8999 및 합성 유전자 단편 서열식별번호: 048을 AvrII 및 XbaI로 절단한 후, pJOE8999 플라스미드 백본 및 서열식별번호: 048의 더 작은 AvrII/XbaI 단편을 단리하였다. 2개의 단편을 T4-DNA 리가제 (NEB)를 사용하여 라이게이션한 후, 이. 콜라이 XL1-블루 적격 세포 (스트라타진(Stratagene)) 내로 형질전환하였다. 정확한 플라스미드를 회수하고 pCC001로 명명하였다.
플라스미드 pCC002
표준 이. 콜라이 클로닝 벡터 (pUC 유도체)에 제공된 pJOE8999 및 합성 유전자 단편 서열식별번호: 049를 AvrII 및 XbaI로 절단한 후, pJOE8999 플라스미드 백본 및 서열식별번호: 049의 더 작은 AvrII/XbaI 단편을 단리하였다. 2개의 단편을 T4-DNA 리가제 (NEB)를 사용하여 라이게이션한 후, 이. 콜라이 XL1-블루 적격 세포 (스트라타진) 내로 형질전환하였다. 정확한 플라스미드를 회수하고 pCC002로 명명하였다.
플라스미드 pCC003
5' 인산화를 갖는 올리고뉴클레오티드 서열식별번호: 050 및 서열식별번호: 051을 어닐링하여 비. 서브틸리스 ATCC6051의 아밀라제 유전자 amyE를 표적화하는 프로토스페이서 서열을 코딩하는 올리고뉴클레오티드 듀플렉스를 형성하였다. 플라스미드 pJOE8999를 BsaI로 절단한 후, 올리고뉴클레오티드 듀플렉스와 라이게이션하여 플라스미드 pCC003을 회수하였다.
플라스미드 pCC004
비. 서브틸리스 ATCC6051의 아밀라제 amyE 유전자에 인접한 5' 상동성 영역 (HomA로서도 지칭됨) 및 3' 상동성 영역 (HomB로서도 지칭됨)을 각각 올리고뉴클레오티드 서열식별번호: 52, 서열식별번호: 53 및 서열식별번호: 54, 서열식별번호: 55에 의해 단리된 게놈 DNA 상에서 PCR-증폭시켰다. 2개의 상동성 영역 HomA 및 HomB를 융합시키고, 올리고뉴클레오티드 서열식별번호: 52 및 서열식별번호: 55에 의해 중첩 PCR을 사용하여 증폭시켜 amyE 유전자의 상동성 영역의 HomAB PCR 단편을 회수하였다. 플라스미드 pCC003 및 HomAB-amyE PCR 단편을 SfiI로 절단한 후, T4-DNA 리가제 (NEB)에 의해 라이게이션하였다. 반응 혼합물을 이. 콜라이 XL1-블루 적격 세포 (스트라타진) 내로 형질전환시켰다. amyE 프로토스페이서 및 amyE의 HomAB를 함유하는 정확한 플라스미드를 회수하고 pCC004 (도 23)로 명명하였다.
플라스미드 pCC005
플라스미드 pCC001을 BsaI로 절단한 후, pCC003에 대해 기재된 바와 같이 amyE 프로토스페이서 올리고뉴클레오티드 듀플렉스 (서열식별번호: 050/서열식별번호: 051)를 클로닝하였다. pCC004의 구축에 대해 기재된 바와 같이 생성된 플라스미드 및 amyE 유전자의 상동성 영역 HomAB의 PCR-단편을 SfiI로 절단한 후, T4-DNA 리가제 (NEB)에 의해 라이게이션하였다. 반응 혼합물을 이. 콜라이 XL1-블루 적격 세포 (스트라타진) 내로 형질전환시켰다. amyE 프로토스페이서 및 amyE의 HomAB를 함유하는 정확한 플라스미드를 회수하고 pCC005로 명명하였다.
플라스미드 pCC006
비. 서브틸리스 ATCC6051의 아밀라제 amyE 유전자에 인접한 5' 상동성 영역 (HomA로서도 지칭됨) 및 3' 상동성 영역 (HomB로서도 지칭됨)을 각각 올리고뉴클레오티드 서열식별번호: 56, 서열식별번호: 57 및 서열식별번호: 58, 서열식별번호: 59에 의해 단리된 게놈 DNA 상에서 PCR-증폭시켰다. 2개의 상동성 영역 HomA 및 HomB를 융합시키고, 올리고뉴클레오티드 서열식별번호: 56 및 서열식별번호: 59에 의해 중첩 PCR을 사용하여 증폭시켜 amyE 유전자의 상동성 영역의 HomAB PCR 단편을 회수하였다. 플라스미드 pCC001을 BsaI로 절단한 후, pCC003에 대해 기재된 바와 같이 T4-DNA 리가제 (NEB)로 amyE 프로토스페이서 올리고뉴클레오티드 듀플렉스 (서열식별번호: 50/서열식별번호: 51)와 라이게이션하였다. 생성된 플라스미드 및 amyE 유전자의 상동성 영역 HomAB의 PCR-단편을 SfiI로 절단한 후, T4-DNA 리가제 (NEB)로 라이게이션하였다. 반응 혼합물을 이. 콜라이 XL1-블루 적격 세포 (스트라타진) 내로 형질전환시켰다. amyE 프로토스페이서 및 amyE의 HomAB를 pCC005와 비교하여 역 배향으로 함유하는 정확한 플라스미드를 회수하고 pCC006으로 명명하였다.
플라스미드 pCC007
플라스미드 pCC002를 BsaI로 절단한 후, pCC003에 대해 기재된 바와 같이 T4-DNA 리가제 (NEB)로 amyE 프로토스페이서 올리고뉴클레오티드 듀플렉스 (서열식별번호: 50/서열식별번호: 51)와 라이게이션하였다. pCC004의 구축에 대해 기재된 바와 같이 생성된 플라스미드 및 amyE 유전자의 상동성 영역 HomAB의 PCR-단편을 SfiI로 절단한 후, T4-DNA 리가제 (NEB)로 라이게이션하였다. 반응 혼합물을 이. 콜라이 XL1-블루 적격 세포 (스트라타진) 내로 형질전환시켰다. amyE 유전자의 HomAB 및 amyE 프로토스페이서를 함유하는 정확한 플라스미드를 회수하고 pCC007로 명명하였다.
플라스미드 pCC008
플라스미드 pCC002를 BsaI로 절단한 후, pCC003에 대해 기재된 바와 같이 T4-DNA 리가제 (NEB)로 amyE 프로토스페이서 올리고뉴클레오티드 듀플렉스 (서열식별번호: 50/서열식별번호: 51)와 라이게이션하였다. pCC006에 대해 기재된 바와 같이 생성된 플라스미드 및 올리고뉴클레오티드 서열식별번호: 56 및 서열식별번호: 59에 의해 증폭시킨 amyE의 상동성 영역 HomAB의 PCR-단편을 SfiI로 절단한 후, T4-DNA 리가제 (NEB)로 라이게이션하였다. 반응 혼합물을 이. 콜라이 XL1-블루 적격 세포 (스트라타진) 내로 형질전환시켰다. pCC007과 비교하여 역 배향으로 amyE의 HomAB 및 amyE 프로토스페이서를 함유하는 정확한 플라스미드를 회수하고 pCC008로 명명하였다.
융합-CRISPR을 사용한 유전자 결실.
전기적격 비. 서브틸리스 ATCC6051 세포를 수(Xue) 등에 의해 본질적으로 기재된 바에 따라 (Xue, G.-P., 1999, Journal of Microbiological Methods 34, 183-191), 1μg의 각각의 플라스미드 pJOE8999, pCC004, pCC005, pCC006, pCC007, pCC008에 의해, 하기와 같이 변형하여 형질전환시켰다: DNA의 형질전환 시에, 세포를 1ml LBSPG 완충제 중에서 회복시키고, 3시간 동안 33℃에서 인큐베이션한 후 (Vehmaanperae J., 1989, FEMS Microbio. Lett., 61: 165-170), Cas9 유도를 위한 0.2% D-만노스 및 20μg/ml 카나마이신이 보충된 LB-레녹스(Lennox) 플레이트 상에 플레이팅하였다. 플레이트를 20-22시간 동안 33℃에서 인큐베이션하였다. 각각의 플라스미드 형질전환으로부터 10개 이하의 클론을 피킹하고, 새로운 예열된 LB-레녹스-플레이트 상에 옮긴 후, 50℃에서 18시간 동안 인큐베이션하였다. 각각의 크게 성장한 콜로니로부터, 세포를 피킹하고, 45℃에서 7-8시간 인큐베이션한 후에 단일 콜로니를 수득하기 위해 새로운 LB-레녹스 플레이트 상에서 3회의 스트로크를 수행하였다. 단일 콜로니를 LB-레녹스 플레이트 상으로 옮기고, LB-레녹스 플레이트에 20μg/ml 카나마이신을 보충한 후, 30℃에서 16-18시간 동안 인큐베이션하였다. 플라스미드 손실을 나타내는, 카나마이신-감수성 클론을 1% 가용성 전분으로 보충된 LB-레녹스 플레이트 상에 플레이팅한 후, 20시간 동안 30℃에서 인큐베이션하였다. 아밀라제 amyE 유전자의 불활성화를 아이오딘 함유 루골(Lugol) 용액으로 플레이트를 덮음으로써 시각화하였고, 할로 광의 존재 또는 부재를 분석했고, 후자가 성공적 불활성화를 나타낸다.
표 2는 플라스미드 큐어링 후에 전체 클론의 양, 불활성화된 아밀라제를 갖는 클론의 양, 전체 클론에 비해 불활성화된 아밀라제를 갖는 클론의 백분율 및 pCC004에 비해 나타낸 플라스미드에 의한 상대 녹아웃 효율 (도 25)을 요약한다.
표 2
Figure pat00008
SEQUENCE LISTING <110> BASF Plant Science Company GmbH <120> Improved methods for modification of target nucleic acids <130> 160315WO01 <160> 73 <170> BiSSAP 1.3 <210> 1 <211> 4140 <212> DNA <213> Artificial Sequence <220> <223> Cas9 yeast <400> 1 atggataaaa aatattctat tggtttggat attggtacta attctgttgg ttgggctgtt 60 attactgatg aatataaagt tccatctaaa aaatttaaag ttttgggtaa tactgataga 120 cattctatta aaaaaaattt gattggtgct ttgttgtttg attctggtga aactgctgaa 180 gctactagat tgaaaagaac tgctagaaga agatatacta gaagaaaaaa tagaatttgt 240 tatttgcaag aaattttttc taatgaaatg gctaaagttg atgattcttt ttttcataga 300 ttggaagaat cttttttggt tgaagaagat aaaaaacatg aaagacatcc aatttttggt 360 aatattgttg atgaagttgc ttatcatgaa aaatatccaa ctatttatca tttgagaaaa 420 aaattggttg attctactga taaagctgat ttgagattga tttatttggc tttggctcat 480 atgattaaat ttagaggtca ttttttgatt gaaggtgatt tgaatccaga taattctgat 540 gttgataaat tgtttattca attggttcaa acttataatc aattgtttga agaaaatcca 600 attaatgctt ctggtgttga tgctaaagct attttgtctg ctagattgtc taaatctaga 660 agattggaaa atttgattgc tcaattgcca ggtgaaaaaa aaaatggttt gtttggtaat 720 ttgattgctt tgtctttggg tttgactcca aattttaaat ctaattttga tttggctgaa 780 gatgctaaat tgcaattgtc taaagatact tatgatgatg atttggataa tttgttggct 840 caaattggtg atcaatatgc tgatttgttt ttggctgcta aaaatttgtc tgatgctatt 900 ttgttgtctg atattttgag agttaatact gaaattacta aagctccatt gtctgcttct 960 atgattaaaa gatatgatga acatcatcaa gatttgactt tgttgaaagc tttggttaga 1020 caacaattgc cagaaaaata taaagaaatt ttttttgatc aatctaaaaa tggttatgct 1080 ggttatattg atggtggtgc ttctcaagaa gaattttata aatttattaa accaattttg 1140 gaaaaaatgg atggtactga agaattgttg gttaaattga atagagaaga tttgttgaga 1200 aaacaaagaa cttttgataa tggttctatt ccacatcaaa ttcatttggg tgaattgcat 1260 gctattttga gaagacaaga agatttttat ccatttttga aagataatag agaaaaaatt 1320 gaaaaaattt tgacttttag aattccatat tatgttggtc cattggctag aggtaattct 1380 agatttgctt ggatgactag aaaatctgaa gaaactatta ctccatggaa ttttgaagaa 1440 gttgttgata aaggtgcttc tgctcaatct tttattgaaa gaatgactaa ttttgataaa 1500 aatttgccaa atgaaaaagt tttgccaaaa cattctttgt tgtatgaata ttttactgtt 1560 tataatgaat tgactaaagt taaatatgtt actgaaggta tgagaaaacc agcttttttg 1620 tctggtgaac aaaaaaaagc tattgttgat ttgttgttta aaactaatag aaaagttact 1680 gttaaacaat tgaaagaaga ttattttaaa aaaattgaat gttttgattc tgttgaaatt 1740 tctggtgttg aagatagatt taatgcttct ttgggtactt atcatgattt gttgaaaatt 1800 attaaagata aagatttttt ggataatgaa gaaaatgaag atattttgga agatattgtt 1860 ttgactttga ctttgtttga agatagagaa atgattgaag aaagattgaa aacttatgct 1920 catttgtttg atgataaagt tatgaaacaa ttgaaaagaa gaagatatac tggttggggt 1980 agattgtcta gaaaattgat taatggtatt agagataaac aatctggtaa aactattttg 2040 gattttttga aatctgatgg ttttgctaat agaaatttta tgcaattgat tcatgatgat 2100 tctttgactt ttaaagaaga tattcaaaaa gctcaagttt ctggtcaagg tgattctttg 2160 catgaacata ttgctaattt ggctggttct ccagctatta aaaaaggtat tttgcaaact 2220 gttaaagttg ttgatgaatt ggttaaagtt atgggtagac ataaaccaga aaatattgtt 2280 attgaaatgg ctagagaaaa tcaaactact caaaaaggtc aaaaaaattc tagagaaaga 2340 atgaaaagaa ttgaagaagg tattaaagaa ttgggttctc aaattttgaa agaacatcca 2400 gttgaaaata ctcaattgca aaatgaaaaa ttgtatttgt attatttgca aaatggtaga 2460 gatatgtatg ttgatcaaga attggatatt aatagattgt ctgattatga tgttgatcat 2520 attgttccac aatctttttt gaaagatgat tctattgata ataaagtttt gactagatct 2580 gataaaaata gaggtaaatc tgataatgtt ccatctgaag aagttgttaa aaaaatgaaa 2640 aattattgga gacaattgtt gaatgctaaa ttgattactc aaagaaaatt tgataatttg 2700 actaaagctg aaagaggtgg tttgtctgaa ttggataaag ctggttttat taaaagacaa 2760 ttggttgaaa ctagacaaat tactaaacat gttgctcaaa ttttggattc tagaatgaat 2820 actaaatatg atgaaaatga taaattgatt agagaagtta aagttattac tttgaaatct 2880 aaattggttt ctgattttag aaaagatttt caattttata aagttagaga aattaataat 2940 tatcatcatg ctcatgatgc ttatttgaat gctgttgttg gtactgcttt gattaaaaaa 3000 tatccaaaat tggaatctga atttgtttat ggtgattata aagtttatga tgttagaaaa 3060 atgattgcta aatctgaaca agaaattggt aaagctactg ctaaatattt tttttattct 3120 aatattatga atttttttaa aactgaaatt actttggcta atggtgaaat tagaaaaaga 3180 ccattgattg aaactaatgg tgaaactggt gaaattgttt gggataaagg tagagatttt 3240 gctactgtta gaaaagtttt gtctatgcca caagttaata ttgttaaaaa aactgaagtt 3300 caaactggtg gtttttctaa agaatctatt ttgccaaaaa gaaattctga taaattgatt 3360 gctagaaaaa aagattggga tccaaaaaaa tatggtggtt ttgattctcc aactgttgct 3420 tattctgttt tggttgttgc taaagttgaa aaaggtaaat ctaaaaaatt gaaatctgtt 3480 aaagaattgt tgggtattac tattatggaa agatcttctt ttgaaaaaaa tccaattgat 3540 tttttggaag ctaaaggtta taaagaagtt aaaaaagatt tgattattaa attgccaaaa 3600 tattctttgt ttgaattgga aaatggtaga aaaagaatgt tggcttctgc tggtgaattg 3660 caaaaaggta atgaattggc tttgccatct aaatatgtta attttttgta tttggcttct 3720 cattatgaaa aattgaaagg ttctccagaa gataatgaac aaaaacaatt gtttgttgaa 3780 caacataaac attatttgga tgaaattatt gaacaaattt ctgaattttc taaaagagtt 3840 attttggctg atgctaattt ggataaagtt ttgtctgctt ataataaaca tagagataaa 3900 ccaattagag aacaagctga aaatattatt catttgttta ctttgactaa tttgggtgct 3960 ccagctgctt ttaaatattt tgatactact attgatagaa aaagatatac ttctactaaa 4020 gaagttttgg atgctacttt gattcatcaa tctattactg gtttgtatga aactagaatt 4080 gatttgtctc aattgggtgg tgattctaga gctgatccaa aaaaaaaaag aaaagtttaa 4140 <210> 2 <211> 1379 <212> PRT <213> Artificial Sequence <220> <223> Cas9 yeast protein <400> 2 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser 1025 1030 1035 1040 Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu 1045 1050 1055 Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile 1060 1065 1070 Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser 1075 1080 1085 Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly 1090 1095 1100 Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile 1105 1110 1115 1120 Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser 1125 1130 1135 Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1140 1145 1150 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile 1155 1160 1165 Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala 1170 1175 1180 Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys 1185 1190 1195 1200 Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1205 1210 1215 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr 1220 1225 1230 Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val 1265 1270 1275 1280 Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys 1285 1290 1295 His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu 1300 1305 1310 Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp 1315 1320 1325 Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp 1330 1335 1340 Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile 1345 1350 1355 1360 Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys 1365 1370 1375 Arg Lys Val <210> 3 <211> 4140 <212> DNA <213> Artificial Sequence <220> <223> Cas9 D10A H840A inactive <400> 3 atggataaaa aatattctat tggtttggct attggtacta attctgttgg ttgggctgtt 60 attactgatg aatataaagt tccatctaaa aaatttaaag ttttgggtaa tactgataga 120 cattctatta aaaaaaattt gattggtgct ttgttgtttg attctggtga aactgctgaa 180 gctactagat tgaaaagaac tgctagaaga agatatacta gaagaaaaaa tagaatttgt 240 tatttgcaag aaattttttc taatgaaatg gctaaagttg atgattcttt ttttcataga 300 ttggaagaat cttttttggt tgaagaagat aaaaaacatg aaagacatcc aatttttggt 360 aatattgttg atgaagttgc ttatcatgaa aaatatccaa ctatttatca tttgagaaaa 420 aaattggttg attctactga taaagctgat ttgagattga tttatttggc tttggctcat 480 atgattaaat ttagaggtca ttttttgatt gaaggtgatt tgaatccaga taattctgat 540 gttgataaat tgtttattca attggttcaa acttataatc aattgtttga agaaaatcca 600 attaatgctt ctggtgttga tgctaaagct attttgtctg ctagattgtc taaatctaga 660 agattggaaa atttgattgc tcaattgcca ggtgaaaaaa aaaatggttt gtttggtaat 720 ttgattgctt tgtctttggg tttgactcca aattttaaat ctaattttga tttggctgaa 780 gatgctaaat tgcaattgtc taaagatact tatgatgatg atttggataa tttgttggct 840 caaattggtg atcaatatgc tgatttgttt ttggctgcta aaaatttgtc tgatgctatt 900 ttgttgtctg atattttgag agttaatact gaaattacta aagctccatt gtctgcttct 960 atgattaaaa gatatgatga acatcatcaa gatttgactt tgttgaaagc tttggttaga 1020 caacaattgc cagaaaaata taaagaaatt ttttttgatc aatctaaaaa tggttatgct 1080 ggttatattg atggtggtgc ttctcaagaa gaattttata aatttattaa accaattttg 1140 gaaaaaatgg atggtactga agaattgttg gttaaattga atagagaaga tttgttgaga 1200 aaacaaagaa cttttgataa tggttctatt ccacatcaaa ttcatttggg tgaattgcat 1260 gctattttga gaagacaaga agatttttat ccatttttga aagataatag agaaaaaatt 1320 gaaaaaattt tgacttttag aattccatat tatgttggtc cattggctag aggtaattct 1380 agatttgctt ggatgactag aaaatctgaa gaaactatta ctccatggaa ttttgaagaa 1440 gttgttgata aaggtgcttc tgctcaatct tttattgaaa gaatgactaa ttttgataaa 1500 aatttgccaa atgaaaaagt tttgccaaaa cattctttgt tgtatgaata ttttactgtt 1560 tataatgaat tgactaaagt taaatatgtt actgaaggta tgagaaaacc agcttttttg 1620 tctggtgaac aaaaaaaagc tattgttgat ttgttgttta aaactaatag aaaagttact 1680 gttaaacaat tgaaagaaga ttattttaaa aaaattgaat gttttgattc tgttgaaatt 1740 tctggtgttg aagatagatt taatgcttct ttgggtactt atcatgattt gttgaaaatt 1800 attaaagata aagatttttt ggataatgaa gaaaatgaag atattttgga agatattgtt 1860 ttgactttga ctttgtttga agatagagaa atgattgaag aaagattgaa aacttatgct 1920 catttgtttg atgataaagt tatgaaacaa ttgaaaagaa gaagatatac tggttggggt 1980 agattgtcta gaaaattgat taatggtatt agagataaac aatctggtaa aactattttg 2040 gattttttga aatctgatgg ttttgctaat agaaatttta tgcaattgat tcatgatgat 2100 tctttgactt ttaaagaaga tattcaaaaa gctcaagttt ctggtcaagg tgattctttg 2160 catgaacata ttgctaattt ggctggttct ccagctatta aaaaaggtat tttgcaaact 2220 gttaaagttg ttgatgaatt ggttaaagtt atgggtagac ataaaccaga aaatattgtt 2280 attgaaatgg ctagagaaaa tcaaactact caaaaaggtc aaaaaaattc tagagaaaga 2340 atgaaaagaa ttgaagaagg tattaaagaa ttgggttctc aaattttgaa agaacatcca 2400 gttgaaaata ctcaattgca aaatgaaaaa ttgtatttgt attatttgca aaatggtaga 2460 gatatgtatg ttgatcaaga attggatatt aatagattgt ctgattatga tgttgatgct 2520 attgttccac aatctttttt gaaagatgat tctattgata ataaagtttt gactagatct 2580 gataaaaata gaggtaaatc tgataatgtt ccatctgaag aagttgttaa aaaaatgaaa 2640 aattattgga gacaattgtt gaatgctaaa ttgattactc aaagaaaatt tgataatttg 2700 actaaagctg aaagaggtgg tttgtctgaa ttggataaag ctggttttat taaaagacaa 2760 ttggttgaaa ctagacaaat tactaaacat gttgctcaaa ttttggattc tagaatgaat 2820 actaaatatg atgaaaatga taaattgatt agagaagtta aagttattac tttgaaatct 2880 aaattggttt ctgattttag aaaagatttt caattttata aagttagaga aattaataat 2940 tatcatcatg ctcatgatgc ttatttgaat gctgttgttg gtactgcttt gattaaaaaa 3000 tatccaaaat tggaatctga atttgtttat ggtgattata aagtttatga tgttagaaaa 3060 atgattgcta aatctgaaca agaaattggt aaagctactg ctaaatattt tttttattct 3120 aatattatga atttttttaa aactgaaatt actttggcta atggtgaaat tagaaaaaga 3180 ccattgattg aaactaatgg tgaaactggt gaaattgttt gggataaagg tagagatttt 3240 gctactgtta gaaaagtttt gtctatgcca caagttaata ttgttaaaaa aactgaagtt 3300 caaactggtg gtttttctaa agaatctatt ttgccaaaaa gaaattctga taaattgatt 3360 gctagaaaaa aagattggga tccaaaaaaa tatggtggtt ttgattctcc aactgttgct 3420 tattctgttt tggttgttgc taaagttgaa aaaggtaaat ctaaaaaatt gaaatctgtt 3480 aaagaattgt tgggtattac tattatggaa agatcttctt ttgaaaaaaa tccaattgat 3540 tttttggaag ctaaaggtta taaagaagtt aaaaaagatt tgattattaa attgccaaaa 3600 tattctttgt ttgaattgga aaatggtaga aaaagaatgt tggcttctgc tggtgaattg 3660 caaaaaggta atgaattggc tttgccatct aaatatgtta attttttgta tttggcttct 3720 cattatgaaa aattgaaagg ttctccagaa gataatgaac aaaaacaatt gtttgttgaa 3780 caacataaac attatttgga tgaaattatt gaacaaattt ctgaattttc taaaagagtt 3840 attttggctg atgctaattt ggataaagtt ttgtctgctt ataataaaca tagagataaa 3900 ccaattagag aacaagctga aaatattatt catttgttta ctttgactaa tttgggtgct 3960 ccagctgctt ttaaatattt tgatactact attgatagaa aaagatatac ttctactaaa 4020 gaagttttgg atgctacttt gattcatcaa tctattactg gtttgtatga aactagaatt 4080 gatttgtctc aattgggtgg tgattctaga gctgatccaa aaaaaaaaag aaaagtttaa 4140 <210> 4 <211> 1379 <212> PRT <213> Artificial Sequence <220> <223> Cas9 D10A H840A inactive protein <400> 4 Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser 1025 1030 1035 1040 Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu 1045 1050 1055 Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile 1060 1065 1070 Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser 1075 1080 1085 Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly 1090 1095 1100 Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile 1105 1110 1115 1120 Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser 1125 1130 1135 Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly 1140 1145 1150 Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile 1155 1160 1165 Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala 1170 1175 1180 Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys 1185 1190 1195 1200 Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser 1205 1210 1215 Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr 1220 1225 1230 Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val 1265 1270 1275 1280 Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys 1285 1290 1295 His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu 1300 1305 1310 Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp 1315 1320 1325 Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp 1330 1335 1340 Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile 1345 1350 1355 1360 Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys 1365 1370 1375 Arg Lys Val <210> 5 <211> 4155 <212> DNA <213> Artificial Sequence <220> <223> Cas9 rice <400> 5 atggacaaga agtatagtat tggtctggac attgggacga attccgttgg ctgggccgtg 60 atcaccgatg agtacaaggt cccttccaag aagtttaagg ttctggggaa caccgatcgg 120 cacagcatca agaagaatct cattggagcc ctcctgttcg actcaggcga gaccgccgaa 180 gcaacaaggc tcaagagaac cgcaaggaga cggtatacaa gaaggaagaa taggatctgc 240 tacctgcagg agattttcag caacgaaatg gcgaaggtgg acgattcgtt ctttcataga 300 ttggaggaga gtttcctcgt cgaggaagat aagaagcacg agaggcatcc tatctttggc 360 aacattgtcg acgaggttgc ctatcacgaa aagtacccca caatctatca tctgcggaag 420 aagcttgtgg actcgactga taaggcggac cttagattga tctacctcgc tctggcacac 480 atgattaagt tcaggggcca ttttctgatc gagggggatc ttaacccgga caatagcgat 540 gtggacaagt tgttcatcca gctcgtccaa acctacaatc agctctttga ggaaaaccca 600 attaatgctt caggcgtcga cgccaaggcg atcctgtctg cacgcctttc aaagtctcgc 660 cggcttgaga acttgatcgc tcaactcccg ggcgaaaaga agaacggctt gttcgggaat 720 ctcattgcac tttcgttggg gctcacacca aacttcaaga gtaattttga tctcgctgag 780 gacgcaaagc tgcagctttc caaggacact tatgacgatg acctggataa ccttttggcc 840 caaatcggcg atcagtacgc ggacttgttc ctcgccgcga agaatttgtc ggacgcgatc 900 ctcctgagtg atattctccg cgtgaacacc gagattacaa aggccccgct ctcggcgagt 960 atgatcaagc gctatgacga gcaccatcag gatctgaccc ttttgaaggc tttggtccgg 1020 cagcaactcc cagagaagta caaggaaatc ttctttgatc aatccaagaa cggctacgct 1080 ggttatattg acggcggggc atcgcaggag gaattctaca agtttatcaa gccaattctg 1140 gagaagatgg atggcacaga ggaactcctg gtgaagctca atagggagga ccttttgcgg 1200 aagcaaagaa ctttcgataa cggcagcatc cctcaccaga ttcatctcgg ggagctgcac 1260 gccatcctga gaaggcagga agacttctac ccctttctta aggataaccg ggagaagatc 1320 gaaaagattc tgacgttcag aattccgtac tatgtcggac cactcgcccg gggtaattcc 1380 agatttgcgt ggatgaccag aaagagcgag gaaaccatca caccttggaa cttcgaggaa 1440 gtggtcgata agggcgcttc cgcacagagc ttcattgagc gcatgacaaa ttttgacaag 1500 aacctgccta atgagaaggt ccttcccaag cattccctcc tgtacgagta tttcactgtt 1560 tataacgaac tcacgaaggt gaagtatgtg accgagggaa tgcgcaagcc cgccttcctg 1620 agcggcgagc aaaagaaggc gatcgtggac cttttgttta agaccaatcg gaaggtcaca 1680 gttaagcagc tcaaggagga ctacttcaag aagattgaat gcttcgattc cgttgagatc 1740 agcggcgtgg aagacaggtt taacgcgtca ctggggactt accacgatct cctgaagatc 1800 attaaggata aggacttctt ggacaacgag gaaaatgagg atatcctcga agacattgtc 1860 ctgactctta cgttgtttga ggatagggaa atgatcgagg aacgcttgaa gacgtatgcc 1920 catctcttcg atgacaaggt tatgaagcag ctcaagagaa gaagatacac cggatgggga 1980 aggctgtccc gcaagcttat caatggcatt agagacaagc aatcagggaa gacaatcctt 2040 gactttttga agtctgatgg cttcgcgaac aggaatttta tgcagctgat tcacgatgac 2100 tcacttactt tcaaggagga tatccagaag gctcaagtgt cgggacaagg tgacagtctg 2160 cacgagcata tcgccaacct tgcgggatct cctgcaatca agaagggtat tctgcagaca 2220 gtcaaggttg tggatgagct tgtgaaggtc atgggacggc ataagcccga gaacatcgtt 2280 attgagatgg ccagagaaaa tcagaccaca caaaagggtc agaagaactc gagggagcgc 2340 atgaagcgca tcgaggaagg cattaaggag ctggggagtc agatccttaa ggagcacccg 2400 gtggaaaaca cgcagttgca aaatgagaag ctctatctgt actatctgca aaatggcagg 2460 gatatgtatg tggaccagga gttggatatt aaccgcctct cggattacga cgtcgatcat 2520 atcgttcctc agtccttcct taaggatgac agcattgaca ataaggttct caccaggtcc 2580 gacaagaacc gcgggaagtc cgataatgtg cccagcgagg aagtcgttaa gaagatgaag 2640 aactactgga ggcaactttt gaatgccaag ttgatcacac agaggaagtt tgataacctc 2700 actaaggccg agcgcggagg tctcagcgaa ctggacaagg cgggcttcat taagcggcaa 2760 ctggttgaga ctagacagat cacgaagcac gtggcgcaga ttctcgattc acgcatgaac 2820 acgaagtacg atgagaatga caagctgatc cgggaagtga aggtcatcac cttgaagtca 2880 aagctcgttt ctgacttcag gaaggatttc caattttata aggtgcgcga gatcaacaat 2940 tatcaccatg ctcatgacgc atacctcaac gctgtggtcg gaacagcatt gattaagaag 3000 tacccgaagc tcgagtccga attcgtgtac ggtgactata aggtttacga tgtgcgcaag 3060 atgatcgcca agtcagagca ggaaattggc aaggccactg cgaagtattt cttttactct 3120 aacattatga atttctttaa gactgagatc acgctggcta atggcgaaat ccggaagaga 3180 ccacttattg agaccaacgg cgagacaggg gaaatcgtgt gggacaaggg gagggatttc 3240 gccacagtcc gcaaggttct ctctatgcct caagtgaata ttgtcaagaa gactgaagtc 3300 cagacgggcg ggttctcaaa ggaatctatt ctgcccaagc ggaactcgga taagcttatc 3360 gccagaaaga aggactggga cccgaagaag tatggaggtt tcgactcacc aacggtggct 3420 tactctgtcc tggttgtggc aaaggtggag aagggaaagt caaagaagct caagtctgtc 3480 aaggagctcc tgggtatcac cattatggag aggtccagct tcgaaaagaa tccgatcgat 3540 tttctcgagg cgaagggata taaggaagtg aagaaggacc tgatcattaa gcttccaaag 3600 tacagtcttt tcgagttgga aaacggcagg aagcgcatgt tggcttccgc aggagagctc 3660 cagaagggta acgagcttgc tttgccgtcc aagtatgtga acttcctcta tctggcatcc 3720 cactacgaga agctcaaggg cagcccagag gataacgaac agaagcaact gtttgtggag 3780 caacacaagc attatcttga cgagatcatt gaacagattt cggagttcag taagcgcgtc 3840 atcctcgccg acgcgaattt ggataaggtt ctctcagcct acaacaagca ccgggacaag 3900 cctatcagag agcaggcgga aaatatcatt catctcttca ccctgacaaa ccttggggct 3960 cccgctgcat tcaagtattt tgacactacg attgatcgga agagatacac ttctacgaag 4020 gaggtgctgg atgcaaccct tatccaccaa tcgattactg gcctctacga gacgcggatc 4080 gacttgagtc agctcggggg ggataagaga ccagcggcaa ccaagaaggc aggacaagcg 4140 aagaagaaga agtag 4155 <210> 6 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> SV40 Nuclear Localizaion Signal <400> 6 cccaagaaga agcggaaggt ctcg 24 <210> 7 <211> 957 <212> DNA <213> Artificial Sequence <220> <223> GAL4 <400> 7 atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60 tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120 tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180 ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt 240 ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat 300 aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta 360 acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt 420 caaagacagt tgactgtatc gccggaattt gtaatacgac tcactatagg gcgagccgcc 480 atcatggagg agcagaagct gatctcagag gaggacctgc atatggccat ggaggccgaa 540 ttcatggata aagcggaatt aattcccgag cctccaaaaa agaagagaaa ggtcgaattg 600 ggtaccgccg ccaattttaa tcaaagtggg aatattgctg atagctcatt gtccttcact 660 ttcactaaca gtagcaacgg tccgaacctc ataacaactc aaacaaattc tcaagcgctt 720 tcacaaccaa ttgcctcctc taacgttcat gataacttca tgaataatga aatcacggct 780 agtaaaattg atgatggtaa taattcaaaa ccactgtcac ctggttggac ggaccaaact 840 gcgtataacg cgtttggaat cactacaggg atgtttaata ccactacaat ggatgatgta 900 tataactatc tattcgatga tgaagatacc ccaccaaacc caaaaaaaga gatttaa 957 <210> 8 <211> 318 <212> PRT <213> Artificial Sequence <220> <223> GAL4 protein <400> 8 Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile Cys Arg Leu 1 5 10 15 Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys Leu 20 25 30 Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser Pro 35 40 45 Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu Glu Arg Leu 50 55 60 Glu Gln Leu Phe Leu Leu Ile Phe Pro Arg Glu Asp Leu Asp Met Ile 65 70 75 80 Leu Lys Met Asp Ser Leu Gln Asp Ile Lys Ala Leu Leu Thr Gly Leu 85 90 95 Phe Val Gln Asp Asn Val Asn Lys Asp Ala Val Thr Asp Arg Leu Ala 100 105 110 Ser Val Glu Thr Asp Met Pro Leu Thr Leu Arg Gln His Arg Ile Ser 115 120 125 Ala Thr Ser Ser Ser Glu Glu Ser Ser Asn Lys Gly Gln Arg Gln Leu 130 135 140 Thr Val Ser Pro Glu Phe Val Ile Arg Leu Thr Ile Gly Arg Ala Ala 145 150 155 160 Ile Met Glu Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu His Met Ala 165 170 175 Met Glu Ala Glu Phe Met Asp Lys Ala Glu Leu Ile Pro Glu Pro Pro 180 185 190 Lys Lys Lys Arg Lys Val Glu Leu Gly Thr Ala Ala Asn Phe Asn Gln 195 200 205 Ser Gly Asn Ile Ala Asp Ser Ser Leu Ser Phe Thr Phe Thr Asn Ser 210 215 220 Ser Asn Gly Pro Asn Leu Ile Thr Thr Gln Thr Asn Ser Gln Ala Leu 225 230 235 240 Ser Gln Pro Ile Ala Ser Ser Asn Val His Asp Asn Phe Met Asn Asn 245 250 255 Glu Ile Thr Ala Ser Lys Ile Asp Asp Gly Asn Asn Ser Lys Pro Leu 260 265 270 Ser Pro Gly Trp Thr Asp Gln Thr Ala Tyr Asn Ala Phe Gly Ile Thr 275 280 285 Thr Gly Met Phe Asn Thr Thr Thr Met Asp Asp Val Tyr Asn Tyr Leu 290 295 300 Phe Asp Asp Glu Asp Thr Pro Pro Asn Pro Lys Lys Glu Ile 305 310 315 <210> 9 <211> 958 <212> DNA <213> Artificial Sequence <220> <223> GAL4 target 1 <400> 9 atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60 tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga actaactggg agtgtcgcta 120 ctctcccaaa accaaaaggt ctccgctgac tagggcacat ctgacagaag tggaatcaag 180 gctagaaaga ctggaacagc tatttctact gatttttcct cgagaagacc ttgacatgat 240 tttgaaaatg gattctttac aggatataaa agcattgtta acaggattat ttgtacaaga 300 taatgtgaat aaagatgccg tcacagatag attggcttca gtggagactg atatgcctct 360 aacattgaga cagcatagaa taagtgcgac atcatcatcg gaagagagta gtaacaaagg 420 tcaaagacag ttgactgtat cgccggaatt tgtaatacga ctcactatag ggcgagccgc 480 catcatggag gagcagaagc tgatctcaga ggaggacctg catatggcca tggaggccga 540 attcatggat aaagcggaat taattcccga gcctccaaaa aagaagagaa aggtcgaatt 600 gggtaccgcc gccaatttta atcaaagtgg gaatattgct gatagctcat tgtccttcac 660 tttcactaac agtagcaacg gtccgaacct cataacaact caaacaaatt ctcaagcgct 720 ttcacaacca attgcctcct ctaacgttca tgataacttc atgaataatg aaatcacggc 780 tagtaaaatt gatgatggta ataattcaaa accactgtca cctggttgga cggaccaaac 840 tgcgtataac gcgtttggaa tcactacagg gatgtttaat accactacaa tggatgatgt 900 atataactat ctattcgatg atgaagatac cccaccaaac ccaaaaaaag agatttaa 958 <210> 10 <211> 938 <212> DNA <213> Artificial Sequence <220> <223> GAL4 target 2 <400> 10 atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60 tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga actaactgga accaaaaggt 120 ctccgctgac tagggcacat ctgacagaag tggaatcaag gctagaaaga ctggaacagc 180 tatttctact gatttttcct cgagaagacc ttgacatgat tttgaaaatg gattctttac 240 aggatataaa agcattgtta acaggattat ttgtacaaga taatgtgaat aaagatgccg 300 tcacagatag attggcttca gtggagactg atatgcctct aacattgaga cagcatagaa 360 taagtgcgac atcatcatcg gaagagagta gtaacaaagg tcaaagacag ttgactgtat 420 cgccggaatt tgtaatacga ctcactatag ggcgagccgc catcatggag gagcagaagc 480 tgatctcaga ggaggacctg catatggcca tggaggccga attcatggat aaagcggaat 540 taattcccga gcctccaaaa aagaagagaa aggtcgaatt gggtaccgcc gccaatttta 600 atcaaagtgg gaatattgct gatagctcat tgtccttcac tttcactaac agtagcaacg 660 gtccgaacct cataacaact caaacaaatt ctcaagcgct ttcacaacca attgcctcct 720 ctaacgttca tgataacttc atgaataatg aaatcacggc tagtaaaatt gatgatggta 780 ataattcaaa accactgtca cctggttgga cggaccaaac tgcgtataac gcgtttggaa 840 tcactacagg gatgtttaat accactacaa tggatgatgt atataactat ctattcgatg 900 atgaagatac cccaccaaac ccaaaaaaag agatttaa 938 <210> 11 <211> 920 <212> DNA <213> Artificial Sequence <220> <223> GAL4 target 3 <400> 11 atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60 tgctccaaag aaaacaagtg tctgaagaac taactggaag gtctccgctg actagggcac 120 atctgacaga agtggaatca aggctagaaa gactggaaca gctatttcta ctgatttttc 180 ctcgagaaga ccttgacatg attttgaaaa tggattcttt acaggatata aaagcattgt 240 taacaggatt atttgtacaa gataatgtga ataaagatgc cgtcacagat agattggctt 300 cagtggagac tgatatgcct ctaacattga gacagcatag aataagtgcg acatcatcat 360 cggaagagag tagtaacaaa ggtcaaagac agttgactgt atcgccggaa tttgtaatac 420 gactcactat agggcgagcc gccatcatgg aggagcagaa gctgatctca gaggaggacc 480 tgcatatggc catggaggcc gaattcatgg ataaagcgga attaattccc gagcctccaa 540 aaaagaagag aaaggtcgaa ttgggtaccg ccgccaattt taatcaaagt gggaatattg 600 ctgatagctc attgtccttc actttcacta acagtagcaa cggtccgaac ctcataacaa 660 ctcaaacaaa ttctcaagcg ctttcacaac caattgcctc ctctaacgtt catgataact 720 tcatgaataa tgaaatcacg gctagtaaaa ttgatgatgg taataattca aaaccactgt 780 cacctggttg gacggaccaa actgcgtata acgcgtttgg aatcactaca gggatgttta 840 ataccactac aatggatgat gtatataact atctattcga tgatgaagat accccaccaa 900 acccaaaaaa agagatttaa 920 <210> 12 <211> 560 <212> DNA <213> Artificial Sequence <220> <223> GAL4 target 4 <400> 12 atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60 tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120 tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180 ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt 240 ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat 300 aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta 360 acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt 420 caaagacagt tgactgtata acgccggaac gcgtttggaa tcacttaaca gggatgttta 480 ataccactac aatggatgat gtatataact atctattcga tgatgaagat accccaccaa 540 acccaaaaaa agagatttaa 560 <210> 13 <211> 708 <212> DNA <213> Artificial Sequence <220> <223> GAL4 target 5 <400> 13 atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60 tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120 tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180 ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt 240 ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat 300 aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta 360 acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt 420 caaagacagt tgactgtatc gccggaattt gtaatacgac tcactatagg gcgagccgcc 480 atcatggagg agcagaagct gatctcagag gaggacctgc atatggccat ggaggccgaa 540 ttcatgtgat aaagcggaat taattcccca cctggttgga cggaccaaac tgcgtataac 600 gcgtttggaa tcactacagg gatgtttaat accactacaa tggatgatgt atataactat 660 ctattcgatg atgaagatac cccaccaaac ccaaaaaaag agatttaa 708 <210> 14 <211> 240 <212> DNA <213> Artificial Sequence <220> <223> GAL4 target 6 <400> 14 atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60 tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga actaactgga ctgcgtccaa 120 actgcgtata acgcgtttgg aatcactaca gggatgttta ataccactac aatggatgat 180 gtatataact atctattcga tgatgaagat accccaccaa acccaaaaaa agagatttaa 240 <210> 15 <211> 356 <212> DNA <213> Artificial Sequence <220> <223> GAL4 target 7 <400> 15 atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60 tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120 tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180 ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgactgattt 240 tgtataacgc gtttggaatc actacaggga tgtttaatac cactacaatg gatgatgtat 300 ataactatct attcgatgat gaagataccc caccaaaccc aaaaaaagag atttaa 356 <210> 16 <211> 268 <212> DNA <213> Saccharomyces cerevisiae <220> <223> SNR52 promoter <400> 16 ctttgaaaag ataatgtatg attatgcttt cactcatatt tatacagaaa cttgatgttt 60 tctttcgagt atatacaagg tgattacatg tacgtttgaa gtacaactct agattttgta 120 gtgccctctt gggctagcgg taaaggtgcg cattttttca caccctacaa tgttctgttc 180 aaaagatttt ggtcaaacgc tgtagaagtg aaagttggtg cgcatgtttc ggcgttcgaa 240 acttctccgc agtgaaagat aaatgatc 268 <210> 17 <211> 20 <212> DNA <213> Saccharomyces cerevisiae <220> <223> SUP4 terminator <400> 17 tttttttgtt ttttatgtct 20 <210> 18 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> scaffold guide RNA Cas9 <400> 18 ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg 60 gcaccgagtc ggtgc 75 <210> 19 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> spacer 1 <400> 19 caagtgtctg aagaactaac 20 <210> 20 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> spacer 2 <400> 20 gacagttgac tgtataacgc 20 <210> 21 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> spacer 3 <400> 21 gcgtttggaa tcacttaaca 20 <210> 22 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> spacer 4 <400> 22 gcatatggcc atggaggccg 20 <210> 23 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> spacer 5 <400> 23 acgcgtttgg aatcactaca 20 <210> 24 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> spacer 6 <400> 24 atggtctcaa aacccttggt 20 <210> 25 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> spacer 7 <400> 25 acacgcttac tgcctgacta 20 <210> 26 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> donor 1 <400> 26 cctcgagaag accttgacat gattttgaaa atggattctt taca 44 <210> 27 <211> 108 <212> DNA <213> Artificial Sequence <220> <223> donor 2 <400> 27 aaagactgga acagctattt ctactgattt ttcctcgaga agaccttgac atgattttga 60 aaatggattc tttacaggat ataaaagcat tgttaacagg attatttg 108 <210> 28 <211> 520 <212> DNA <213> Artificial Sequence <220> <223> donor 3 <400> 28 tcatcatcgg aagagagtag taacaaaggt caaagacagt tgactgtatc gccggaattt 60 gtaatacgac tcactatagg gcgagccgcc atcatggagg agcagaagct gatctcagag 120 gaggacctgc atatggccat ggaggccgaa ttcatggata aagcggaatt aattcccgag 180 cctccaaaaa agaagagaaa ggtcgaattg ggtaccgccg ccaattttaa tcaaagtggg 240 aatattgctg atagctcatt gtccttcact ttcactaaca gtagcaacgg tccgaacctc 300 ataacaactc aaacaaattc tcaagcgctt tcacaaccaa ttgcctcctc taacgttcat 360 gataacttca tgaataatga aatcacggct agtaaaattg atgatggtaa taattcaaaa 420 ccactgtcac ctggttggac ggaccaaact gcgtataacg cgtttggaat cactacaggg 480 atgtttaata ccactacaat ggatgatgta tataactatc 520 <210> 29 <211> 635 <212> DNA <213> Artificial Sequence <220> <223> donor 4 <400> 29 cagatagatt ggcttcagtg gagactgata tgcctctaac attgagacag catagaataa 60 gtgcgacatc atcatcggaa gagagtagta acaaaggtca aagacagttg actgtatcgc 120 cggaatttgt aatacgactc actatagggc gagccgccat catggaggag cagaagctga 180 tctcagagga ggacctgcat atggccatgg aggccgaatt catggataaa gcggaattaa 240 ttcccgagcc tccaaaaaag aagagaaagg tcgaattggg taccgccgcc aattttaatc 300 aaagtgggaa tattgctgat agctcattgt ccttcacttt cactaacagt agcaacggtc 360 cgaacctcat aacaactcaa acaaattctc aagcgctttc acaaccaatt gcctcctcta 420 acgttcatga taacttcatg aataatgaaa tcacggctag taaaattgat gatggtaata 480 attcaaaacc actgtcacct ggttggacgg accaaactgc gtataacgcg tttggaatca 540 ctacagggat gtttaatacc actacaatgg atgatgtata taactatcta ttcgatgatg 600 aagatacccc accaaaccca aaaaaagaga tttaa 635 <210> 30 <211> 957 <212> DNA <213> Artificial Sequence <220> <223> donor 5 <400> 30 atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60 tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120 tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180 ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt 240 ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat 300 aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta 360 acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt 420 caaagacagt tgactgtatc gccggaattt gtaatacgac tcactatagg gcgagccgcc 480 atcatggagg agcagaagct gatctcagag gaggacctgc atatggccat ggaggccgaa 540 ttcatggata aagcggaatt aattcccgag cctccaaaaa agaagagaaa ggtcgaattg 600 ggtaccgccg ccaattttaa tcaaagtggg aatattgctg atagctcatt gtccttcact 660 ttcactaaca gtagcaacgg tccgaacctc ataacaactc aaacaaattc tcaagcgctt 720 tcacaaccaa ttgcctcctc taacgttcat gataacttca tgaataatga aatcacggct 780 agtaaaattg atgatggtaa taattcaaaa ccactgtcac ctggttggac ggaccaaact 840 gcgtataacg cgtttggaat cactacaggg atgtttaata ccactacaat ggatgatgta 900 tataactatc tattcgatga tgaagatacc ccaccaaacc caaaaaaaga gatttaa 957 <210> 31 <211> 4155 <212> DNA <213> Artificial Sequence <220> <223> Cas9 rice codon-optimized <400> 31 atggacaaga agtatagtat tggtctggac attgggacga attccgttgg ctgggccgtg 60 atcaccgatg agtacaaggt cccttccaag aagtttaagg ttctggggaa caccgatcgg 120 cacagcatca agaagaatct cattggagcc ctcctgttcg actcaggcga gaccgccgaa 180 gcaacaaggc tcaagagaac cgcaaggaga cggtatacaa gaaggaagaa taggatctgc 240 tacctgcagg agattttcag caacgaaatg gcgaaggtgg acgattcgtt ctttcataga 300 ttggaggaga gtttcctcgt cgaggaagat aagaagcacg agaggcatcc tatctttggc 360 aacattgtcg acgaggttgc ctatcacgaa aagtacccca caatctatca tctgcggaag 420 aagcttgtgg actcgactga taaggcggac cttagattga tctacctcgc tctggcacac 480 atgattaagt tcaggggcca ttttctgatc gagggggatc ttaacccgga caatagcgat 540 gtggacaagt tgttcatcca gctcgtccaa acctacaatc agctctttga ggaaaaccca 600 attaatgctt caggcgtcga cgccaaggcg atcctgtctg cacgcctttc aaagtctcgc 660 cggcttgaga acttgatcgc tcaactcccg ggcgaaaaga agaacggctt gttcgggaat 720 ctcattgcac tttcgttggg gctcacacca aacttcaaga gtaattttga tctcgctgag 780 gacgcaaagc tgcagctttc caaggacact tatgacgatg acctggataa ccttttggcc 840 caaatcggcg atcagtacgc ggacttgttc ctcgccgcga agaatttgtc ggacgcgatc 900 ctcctgagtg atattctccg cgtgaacacc gagattacaa aggccccgct ctcggcgagt 960 atgatcaagc gctatgacga gcaccatcag gatctgaccc ttttgaaggc tttggtccgg 1020 cagcaactcc cagagaagta caaggaaatc ttctttgatc aatccaagaa cggctacgct 1080 ggttatattg acggcggggc atcgcaggag gaattctaca agtttatcaa gccaattctg 1140 gagaagatgg atggcacaga ggaactcctg gtgaagctca atagggagga ccttttgcgg 1200 aagcaaagaa ctttcgataa cggcagcatc cctcaccaga ttcatctcgg ggagctgcac 1260 gccatcctga gaaggcagga agacttctac ccctttctta aggataaccg ggagaagatc 1320 gaaaagattc tgacgttcag aattccgtac tatgtcggac cactcgcccg gggtaattcc 1380 agatttgcgt ggatgaccag aaagagcgag gaaaccatca caccttggaa cttcgaggaa 1440 gtggtcgata agggcgcttc cgcacagagc ttcattgagc gcatgacaaa ttttgacaag 1500 aacctgccta atgagaaggt ccttcccaag cattccctcc tgtacgagta tttcactgtt 1560 tataacgaac tcacgaaggt gaagtatgtg accgagggaa tgcgcaagcc cgccttcctg 1620 agcggcgagc aaaagaaggc gatcgtggac cttttgttta agaccaatcg gaaggtcaca 1680 gttaagcagc tcaaggagga ctacttcaag aagattgaat gcttcgattc cgttgagatc 1740 agcggcgtgg aagacaggtt taacgcgtca ctggggactt accacgatct cctgaagatc 1800 attaaggata aggacttctt ggacaacgag gaaaatgagg atatcctcga agacattgtc 1860 ctgactctta cgttgtttga ggatagggaa atgatcgagg aacgcttgaa gacgtatgcc 1920 catctcttcg atgacaaggt tatgaagcag ctcaagagaa gaagatacac cggatgggga 1980 aggctgtccc gcaagcttat caatggcatt agagacaagc aatcagggaa gacaatcctt 2040 gactttttga agtctgatgg cttcgcgaac aggaatttta tgcagctgat tcacgatgac 2100 tcacttactt tcaaggagga tatccagaag gctcaagtgt cgggacaagg tgacagtctg 2160 cacgagcata tcgccaacct tgcgggatct cctgcaatca agaagggtat tctgcagaca 2220 gtcaaggttg tggatgagct tgtgaaggtc atgggacggc ataagcccga gaacatcgtt 2280 attgagatgg ccagagaaaa tcagaccaca caaaagggtc agaagaactc gagggagcgc 2340 atgaagcgca tcgaggaagg cattaaggag ctggggagtc agatccttaa ggagcacccg 2400 gtggaaaaca cgcagttgca aaatgagaag ctctatctgt actatctgca aaatggcagg 2460 gatatgtatg tggaccagga gttggatatt aaccgcctct cggattacga cgtcgatcat 2520 atcgttcctc agtccttcct taaggatgac agcattgaca ataaggttct caccaggtcc 2580 gacaagaacc gcgggaagtc cgataatgtg cccagcgagg aagtcgttaa gaagatgaag 2640 aactactgga ggcaactttt gaatgccaag ttgatcacac agaggaagtt tgataacctc 2700 actaaggccg agcgcggagg tctcagcgaa ctggacaagg cgggcttcat taagcggcaa 2760 ctggttgaga ctagacagat cacgaagcac gtggcgcaga ttctcgattc acgcatgaac 2820 acgaagtacg atgagaatga caagctgatc cgggaagtga aggtcatcac cttgaagtca 2880 aagctcgttt ctgacttcag gaaggatttc caattttata aggtgcgcga gatcaacaat 2940 tatcaccatg ctcatgacgc atacctcaac gctgtggtcg gaacagcatt gattaagaag 3000 tacccgaagc tcgagtccga attcgtgtac ggtgactata aggtttacga tgtgcgcaag 3060 atgatcgcca agtcagagca ggaaattggc aaggccactg cgaagtattt cttttactct 3120 aacattatga atttctttaa gactgagatc acgctggcta atggcgaaat ccggaagaga 3180 ccacttattg agaccaacgg cgagacaggg gaaatcgtgt gggacaaggg gagggatttc 3240 gccacagtcc gcaaggttct ctctatgcct caagtgaata ttgtcaagaa gactgaagtc 3300 cagacgggcg ggttctcaaa ggaatctatt ctgcccaagc ggaactcgga taagcttatc 3360 gccagaaaga aggactggga cccgaagaag tatggaggtt tcgactcacc aacggtggct 3420 tactctgtcc tggttgtggc aaaggtggag aagggaaagt caaagaagct caagtctgtc 3480 aaggagctcc tgggtatcac cattatggag aggtccagct tcgaaaagaa tccgatcgat 3540 tttctcgagg cgaagggata taaggaagtg aagaaggacc tgatcattaa gcttccaaag 3600 tacagtcttt tcgagttgga aaacggcagg aagcgcatgt tggcttccgc aggagagctc 3660 cagaagggta acgagcttgc tttgccgtcc aagtatgtga acttcctcta tctggcatcc 3720 cactacgaga agctcaaggg cagcccagag gataacgaac agaagcaact gtttgtggag 3780 caacacaagc attatcttga cgagatcatt gaacagattt cggagttcag taagcgcgtc 3840 atcctcgccg acgcgaattt ggataaggtt ctctcagcct acaacaagca ccgggacaag 3900 cctatcagag agcaggcgga aaatatcatt catctcttca ccctgacaaa ccttggggct 3960 cccgctgcat tcaagtattt tgacactacg attgatcgga agagatacac ttctacgaag 4020 gaggtgctgg atgcaaccct tatccaccaa tcgattactg gcctctacga gacgcggatc 4080 gacttgagtc agctcggggg ggataagaga ccagcggcaa ccaagaaggc aggacaagcg 4140 aagaagaaga agtag 4155 <210> 32 <211> 1995 <212> DNA <213> Zea mays <220> <223> maize Ubi promoter containing MubG1 intron <400> 32 tgcagtgcag cgtgacccgg tcgtgcccct ctctagagat aatgagcatt gcatgtctaa 60 gttataaaaa attaccacat attttttttg tcacacttgt ttgaagtgca gtttatctat 120 ctttatacat atatttaaac tttactctac gaataatata atctatagta ctacaataat 180 atcagtgttt tagagaatca tataaatgaa cagttagaca tggtctaaag gacaattgag 240 tattttgaca acaggactct acagttttat ctttttagtg tgcatgtgtt ctcctttttt 300 tttgcaaata gcttcaccta tataatactt catccatttt attagtacat ccatttaggg 360 tttagggtta atggttttta tagactaatt tttttagtac atctatttta ttctatttta 420 gcctctaaat taagaaaact aaaactctat tttagttttt ttatttaata gtttagatat 480 aaaatagaat aaaataaagt gactaaaaat taaacaaata ccctttaaga aattaaaaaa 540 actaaggaaa catttttctt gtttcgagta gataatgcca gcctgttaaa cgccgtcgac 600 gagtctaacg gacaccaacc agcgaaccag cagcgtcgcg tcgggccaag cgaagcagac 660 ggcacggcat ctctgtcgct gcctctggac ccctctcgag agttccgctc caccgttgga 720 cttgctccgc tgtcggcatc cagaaattgc gtggcggagc ggcagacgtg agccggcacg 780 gcaggcggcc tcctcctcct ctcacggcac cggcagctac gggggattcc tttcccaccg 840 ctccttcgct ttcccttcct cgcccgccgt aataaataga caccccctcc acaccctctt 900 tccccaacct cgtgttgttc ggagcgcaca cacacacaac cagatctccc ccaaatccac 960 ccgtcggcac ctccgcttca aggtacgccg ctcgtcctcc cccccccccc cccctctcta 1020 ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat 1080 gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg 1140 acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct 1200 gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc 1260 atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg 1320 tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt 1380 tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg 1440 tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat 1500 ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg 1560 ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag 1620 tagagtactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc 1680 atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac 1740 atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat 1800 gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttatttcgat 1860 cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc 1920 ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg 1980 gtgttacttc tgcag 1995 <210> 33 <211> 294 <212> DNA <213> Agrobacterium tumefaciens <220> <223> nopaline synthase terminator (tnos) <400> 33 agcggccgcc cggctgcaga tcgttcaaac atttggcaat aaagtttctt aagattgaat 60 cctgttgccg gtcttgcgat gattatcata taatttctgt tgaattacgt taagcatgta 120 ataattaaca tgtaatgcat gacgttattt atgagatggg tttttatgat tagagtcccg 180 caattataca tttaatacgc gatagaaaac aaaatatagc gcgcaaacta ggataaatta 240 tcgcgcgcgg tgtcatctat gttactagat ccgatgataa gctgtcaaac atga 294 <210> 34 <211> 377 <212> DNA <213> Oryza sativa <220> <223> RNA pol III promoter promoter from the rice U3 small nucle ar RNA gene (OsU3) <400> 34 aagggatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60 tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaggaca 120 ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180 aaccacgtga tgtggagtaa gataaactgt aggagaaaag catttcgtag tgggccatga 240 agcctttcag gacatgtatt gcagtatggg ccggcccatt acgcaattgg acgacaacaa 300 agactagtat tagtaccacc tcggctatcc acatagatca aagctggttt aaaagagttg 360 tgcagatgat ccgtggc 377 <210> 35 <211> 7787 <212> DNA <213> Oryza sativa <220> <223> rice Protoporphyrinogen Oxidase (PPO2) <400> 35 atgctctctc ctgccaccac cttctcctcc tcctcctcct cctcgtcgcc gtcgcgcgcc 60 cacgctcgcg ctcccacccg cttcgcggtc gcagcatccg cgcgcgccgc acggttccgc 120 cccgcgcgcg ccatggccgc ctccgacgac ccccgcggcg ggaggtccgt cgccgtcgtc 180 ggcgccggcg tcaggtgggt ggggagccgc gcgcgctctc cgtgggttca gttctgccct 240 aggtttgggg tgccgtgtgc gtgtgagtgg ggaggttgtt ttttttgatg attgatgaaa 300 tggttgcctc tctgcagtgg gctcgcggcg gcgtacaggc tgaggaagcg cggcgtgcag 360 gtgacggtgt tcgaggcggc cgacagggcg ggtgggaaga tacggaccaa ctccgagggc 420 gggttcatct gggacgaagg ggccaacacc atggtgagcg cgctttggtg tgcctcgctg 480 cttctgtttg atcacaatct cgggctgtgt tggtctgcat tgctgcaaat gctgcttctg 540 tatgttttgg attgtggcgc actggcgctg ctgcggctat ttgagggctg gagcacacta 600 gcgagtagtg ctccttggtg cgcaggctga ggaaacttgt gtttgtgaac gaaatgcaag 660 ctgctcacta atgcagacag ttgttcctgc aaatggagaa gtgttttctt ctgcattcgt 720 atcccacaac agacgtgaac cctttctgct atgagcatca ttgaacaccg ttatgtaact 780 tatcatagcc tgattcgatt tcattcacca tgatctataa ctattatact taccatatta 840 gttactttgt actactctta gtaaaataaa taaattattt taatactcca ctgacaaaat 900 aggttaagat tgtttcattg cttgggcaca tgtgcaatac tagtcgcatt ttttttacct 960 gcgtgcaaat cttatcatgc ctgcttgatt caatttgccg ttctctctgt aatttaatta 1020 ttttgcctcc agacagagag tgaattggag gcaagcaggc ttattgacga tcttggccta 1080 caaggcaaac agcagtatgt atgtgctaat gttatctgtg atggttaact gctttgaatg 1140 tcttctgttt cataatttac actgatatgt ttaatatttc gatatccttt agcctaactc 1200 acaacacaag cgttacattg tcaaagatgg agcaccaaca ctggtaaata gacttttcat 1260 gatatgatgc attttgtttt gttcttccta tagtatgcct cacttttgaa tatatttttt 1320 tgtcacataa gattccctca gatcccattg cgctcatgaa aagcactgtt ctttctacaa 1380 aatcaaaggt atgtaagtta ttgagtgcta attgctacaa catatcatga cctcctgacc 1440 tatttgcaac aagttgcttg ttgtttccac ttgtcactga tggattaaaa ttcactagtg 1500 tagaaacaat catattaaac tgatcaccgt gacttgattt acttgttttc agttcactat 1560 tacaaatttg tacatttcct gatctttcgt gttcaagctg tgtgatcgac tgattgcaac 1620 cgtcatatta tattactgta ttgagtttag taaaacatgg tcttatcttt gcagctcaag 1680 ctatttctgg aaccatttct ctatgagaaa tctagcagaa ggacctcggg aaaagtgtct 1740 gatgaacatt taagtgagag gtgagccttc atactgatgt tattttgagt tgttgtaaac 1800 ttgaaccact gataatatag ttatatgttt ttttcctgtg ttcttccttc attctcatgc 1860 ccttgtgaaa tacaaatata tacttcatat cacacactcc ctttggtcat ttttcatgtc 1920 aaacttttaa aactttgtac ataaaatcag ttcaatattt agattgaacg catgagaaag 1980 tattttcata atattatgat tttaccattt ttttcatata cgttgcaaca gaatttagtg 2040 gtcaaagcta cactttgaag accttattga tgtcaaaaac agcatgtttt ctgaccagag 2100 agaatacatt tgcagtgtga tttttctgtg tatatgtaga gataatcagg tttctctttt 2160 gcagtgttgc aagtttcttt gaacgccact ttggaaaaga ggcaagttca tttttaatga 2220 agaaatttat ggattgttaa gtgaatacaa tcaacacttt gcaacttaca tgcccattat 2280 aatcagtaga gggtaagaat ttataacttt attacaggtt gttgattatc ttattgatcc 2340 atttgtggct ggaacaagcg gaggagatcc tgagtcatta tcagtaagtt attataacat 2400 gtctcactat ttgcattttc catatcagca cctttgcatt tctacagtaa attgtagtca 2460 taattatttt tatgtaaatt gtgcgtataa acaacatatg tgcttgactt tgtgatgtgt 2520 tcttggggat gataactgat acggctagaa cttttggggg ctaatctcct tgagccgtat 2580 cagtaagtca taacaattct cattcataat gatcaaaaca tatcaccttc ttgtgtagaa 2640 ctgttctggt tttgagtaat attttcttct gtgcagattc gtcatgcatt tccagcatta 2700 tggaatttgg agaataagta agtttgtagt agtttgtttg gagaataagt aagtttgtag 2760 tttgtgcatt gatgttcatt caagatttac cttatcaata attcacttgt ccacgtccat 2820 atgctcgtgc tatatcctgt ccattcaaat gtcaacaccg ccatgtgaat ttactgcata 2880 gtgcatttta atgatttcat ttatccttgt tgcttgcatc tcttttttgg gctcctgctg 2940 ttagcttgtt tttggttcct gctgttacct atttcttttc tatcattttt tcattggaca 3000 gatggtgctc tcagtcctta ctgcttatta tttgttaacc tgatatgcac ctacttgaag 3060 ttaatgttat gatttttagt attttatagt catggtatca ttaatactta tttttggcaa 3120 tcgaaattaa aaaaacatga tgtcaaaata aaaaatcatg gcagttgaat gcagtgggta 3180 tatgtatcaa gaatttaaga tcttgaacat aagtccaatt gctatatgtt caattcgttg 3240 gagcataaca tgatctaatt tgtaagttaa atttatctga taaacgatgg aaggaaattc 3300 tggtaccact catgcaacta tacaagcttc aaaggcttct tacatgtgga ccattggacc 3360 tagaatagaa tctaaattta ttcataagta tataattttt tttccttcat gggccatgat 3420 agttaactat atgagcttgt agagtcaaaa taggcataat tgcttctttg ggtttccact 3480 taatttaccc tacaacactt ctattgcaat aaatatggtc aacaacattt ctttacggtc 3540 cgtttggttg gagggagttt ttaggaggga ttgggagttt agagggatgg agctattaac 3600 tgttttgttt ggttgggaga gatgggaatt ttggtgggat ggagatgggg aattgaggaa 3660 ggaactccct ccttttcaat acctgggtag ggggtggtaa ttgggaggga attcctcctt 3720 tactttgcct aaacaaatct cagccatccg ttttcattaa tgacctaatc tccaactaaa 3780 cttcctgtca atttccacca cctctgccaa acaagatatt gggattaaaa atcaaattcc 3840 catcttaatc tcaccatcaa ttccctcgtg taaactccca atccccttcc ctcaagttgc 3900 caaacaagcc attagtgccc agttatgttc tttggtcatc ttcttcataa tttgttgctc 3960 catgcacttt caatgctcac aggtatggct ctgtcattgc tggtgccatc ttgtccaaac 4020 tatccactaa gggtgattca gtgaagacag gaggtgcttc gccagggaaa ggaaggaata 4080 aacgtgtgtc attttcattt catggtggaa tgcaggtact ccacagatgt cctgtagttt 4140 cttttgtcag tgtcaaagat atcaaagaca gtgataaacc ctgaacttta gtttgagcaa 4200 ttctacatgc cactaaaaaa tgccgaattc atatgttgtg aattgaagac ctgttatttt 4260 cctgcaacta ggacatatgt ttagtcggtg aaacttcatt gctgctttaa gaagtcttac 4320 aggccagaga aaactgtctt gttttttttt tttttgattt gatgtcctgc tttatattta 4380 tgatccagcc aagcttatcc atccatctgc accctgatcc tgccataatc atttttttta 4440 tcagcctgac atgagcttat tatgttgcat aagttaggtt gaagctagat cgaacaaaaa 4500 actcaaagct actgataagt acaggatatg caacagaagt atcacacgag ccaaatctgc 4560 tataagaata aaacatacca agagccttag acaccactaa atagtgtgaa tggtagtgat 4620 agcgaataat ctcagaagat gacattttgg gaaatattat cgtgtagtat actttattaa 4680 ttgggagttg cgatacttgc cctgcacgct aaacatgctg aaaagtttca cagttatact 4740 acataacatc tgggtgtgta aaggttttat gttgttcatt gcttttcagt cactaataga 4800 tgcacttcac aatgaagttg gagatggtaa cgtgaagctt ggtacagaag tgttgtcatt 4860 ggcatgttgc tgtgatggag tctcttcttc tggtggttgg tcaatttctg ttgattcaaa 4920 agatgctaaa gggaaagatc tcagaaagaa ccaatctttc gatgctgtta taatgactgt 4980 aagaaaaaaa ttatctgtat tcatctcttt agaagcttga tcatttgaca gccacaaatt 5040 aaaatatttt accgtgtttt tctttttgcc cctttaggct ccattgtcta atgtccagag 5100 gatgaagttt acaaaaggtg gagttccctt tgtgctagac tttcttccta aggtcaggtt 5160 agaatcactc ttttagattt aacaaatgca gtgttgcact agcatgttct tgagaaattt 5220 gtgctggggg aaattcctct taatccttca aattgcattt aatttcatcc attaggtcga 5280 tggatccatg tcacagaaaa tattttgttt atcttctaga tttctattat atatgtaaga 5340 ctgtctctta gtttgtgaat ttacaggagt caatcatcac tcccttgaat ctgagcatat 5400 cagcagttca tcagcaatat ggtttatttg agaaggcaac ggaaactatt gtttccaaag 5460 gccacttgtt tgaaactttc accactgttt tgaacagtgt attaaagtaa cagtcatttg 5520 tatagcagca cctggtgatt tttaagtaaa ttttccattc ccaatcaaaa caagtaacat 5580 tatatgttga acatgtactg aattgaatat ggaactttat gctggagatg ccagacttta 5640 ttttactggc atgaatacac aattattgta acaatggtat tattgcttgg ttacttctcc 5700 gctgtgaaga catacctttc gtcacctttt cttgtttccc atattctgca ccttatggga 5760 ttgtcttcca catgttaaga tgccttgtag taccagttcc cctattattt gaatgtgttc 5820 ttccttagat atatgtgcat ttggaacgtg attggaaata caacagcaaa ctggtattgt 5880 tagctgcttg cctgccacag cctacatatg ctgccatatt acagaattat gagataggtg 5940 gactttgatt tctgtcataa tgattaacta acttgatata ctcaaactat gcagctccta 6000 gctggtatcc ttagaattta tcgagtatgc atagaagtct actcttaatc catatctatt 6060 tgatgtactc aaacttgaaa ctatgcagct cctagctggg ctccttagaa ttatcaagta 6120 tgcatagaaa tcttaatcca tatttattta ttatatgcag gtcgattatc taccactatc 6180 tctcatggta acagctttta agaaggaaga tgtcaaaaaa ccattggaag gatttggtgc 6240 cttgataccc tataaggaac agcaaaagca tggtctcaaa acccttggta ggttaattca 6300 gctttacact tatattttat ccagcttgta gctgcttata ttttgatttg cgaattaaaa 6360 attattaaaa cagccttgaa agaagaaacc atgttcgctg tggagactag aaattcccac 6420 attaattggg gaaagagaaa tatttacacc ctatgatttt ggcaagtgca agttttaatg 6480 gttgagattg atggattgaa tatatatcat atttggactc agtatgaaca aataccagat 6540 acataaatag atagtactaa ttcaacatgg atctgaactg ttgatcagac caattgagca 6600 cttggttgta attgctcgcg gactacacgc ttactgcctg actagggttc catgatgata 6660 aggttcgatt ttctaaaata ctattacaac aagatgacta tttaataaaa tttaaagaga 6720 ataacgtata taaaaattta gataaatttg gtgcaccgcg caattgcgca ggtcaccctg 6780 ctagctgtat tgaactcaat atacaaatca accttgctac attgctctac tttttctcag 6840 gtcttattta ctctgatttc tatttattct aatctataca tgtcgtcttg tacagggacc 6900 ctcttctcct cgatgatgtt tccagatcga gctcctaatg atcaatatct atatacatct 6960 ttcattgggg ggagccataa tagagacctc gctggggctc caacgtatac ttccatatta 7020 tgatcattta tgttttggtt gttttttctt ttcttgctag atttttctga tatatatact 7080 tatgtagggc tattctgaaa caacttgtga cctctgacct aagaaagctc ttgggtgttg 7140 agggacaacc tacttttgtg aagtaagtga taagaaacta ctgccatggt ttagagtatc 7200 tatatgtttt ctcttgttgt gcttgtgtta tggttttcca tcactatgga gttttgagga 7260 ttcattcagg tttttgcact accacttgcg aattcaatat gatgttcttt tacacaggca 7320 tgtacattgg agaaatgctt ttcctttata tggccagaat tatgatctgg tactggaagc 7380 tatagcaaaa atggagaaca atcttccagg gttcttttac gcaggcaagt caatgaaggc 7440 acccctattg tacaaaagaa atcttagata tttgaaacat attcctgttg attgagtacg 7500 tgaataattt gctgtttcta gtaagtcaat ttggtatttc tcatgcaact tatggggctc 7560 cttgatttgc tgagaatgat gagtttccta gagcaagcca ggaactgtaa tcccagcatg 7620 taatacttta ccttgaaatt aacttcaaaa aaataattga agctttttct gtatctgtag 7680 gaaataacaa ggatgggttg gctgttggaa atgttatagc ttcaggaagc aaggctgctg 7740 accttgtgat ctcttatctt gaatcttgca cagatcagga caattag 7787 <210> 36 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> spacer 8 <400> 36 atggtctcaa aacccttggt 20 <210> 37 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> spacer 9 <400> 37 acacgcttac tgcctgacta 20 <210> 38 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> spacer 10 <400> 38 tatatacatc tttcattggg 20 <210> 39 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> donor 6 <400> 39 gaaggatttg gtgccttgat accctataag gaacagcaaa agcatggtct caaaaccttt 60 ggtagattaa ttcagcttta cacttatatt ttatccagct tgtagctgct tatattttga 120 <210> 40 <211> 794 <212> DNA <213> Artificial Sequence <220> <223> donor 7 <400> 40 gaaggatttg gtgccttgat accctataag gaacagcaaa agcatggtct caaaaccttt 60 ggtaggttaa ttcagcttta cacttatatt ttatccagct tgtagctgct tatattttga 120 tttgcgaatt aaaaattatt aaaacagcct tgaaagaaga aaccatgttc gctgtggaga 180 ctagaaattc ccacattaat tggggaaaga gaaatattta caccctatga ttttggcaag 240 tgcaagtttt aatggttgag attgatggat tgaatatata tcatatttgg actcagtatg 300 aacaaatacc agatacataa atagatagta ctaattcaac atggatctga actgttgatc 360 agaccaattg agcacttggt tgtaattgct cgcggactac acgcttactg cctgactagc 420 gttccatgat gataaggttc gattttctaa aatactatta caacaagatg actatttaat 480 aaaatttaaa gagaataacg tatataaaaa tttagataaa tttggtgcac cgcgcaattg 540 cgcaggtcac cctgctagct gtattgaact caatatacaa atcaaccttg ctacattgct 600 ctactttttc tcaggtctta tttactctga tttctattta ttctaatcta tacatgtcgt 660 cttgtacagg gaccctcttc tcctcgatga tgtttccaga tcgagctcct aatgatcaat 720 atctatatac atctgtaatt ggggggagcc ataatagaga cctcgctggg gctccaacgt 780 atacttccat atta 794 <210> 41 <211> 800 <212> DNA <213> Artificial Sequence <220> <223> donor 8 <400> 41 atggatctga actgttgatc agaccaattg agcacttggt tgtaattgct cgcggactac 60 acgcttactg cctgactagg gttccatgat gataaggttc gattttctaa aatactatta 120 caacaagatg actatttaat aaaatttaaa gagaataacg tatataaaaa tttagataaa 180 tttggtgcac cgcgcaattg cgcaggtcac cctgctagct gtattgaact caatatacaa 240 atcaaccttg ctacattgct ctactttttc tcaggtctta tttactctga tttctattta 300 ttctaatcta tacatgtcgt cttgtacagg gaccttcttc tcctcgatga tgtttccaga 360 tcgagctcct aatgatcaat atctatatac atctgtaatt ggcggcagcc ataatagaga 420 cctcgctggg gctccaacgt atacttccat attatgatca tttatgtttt ggttgttttt 480 tcttttcttg ctagattttt ctgatatata tacttatgta gggctattct gaaacaactt 540 gtgacctctg acctaagaaa gctcttgggt gttgagggac aacctacttt tgtgaagtaa 600 gtgataagaa actactgcca tggtttagag tatctatatg ttttctcttg ttgtgcttgt 660 gttatggttt tccatcacta tggagttttg aggattcatt caggtttttg cactaccact 720 tgcgaattca atatgatgtt cttttacaca ggcatgtaca ttggagaaat gcttttcctt 780 tatatggcca gaattatgat 800 <210> 42 <211> 138 <212> DNA <213> Artificial Sequence <220> <223> RecA FusionCRISPR <400> 42 gatgtggaaa ccatctctac gttttagagc tagaaatagc aagttaaaat aaggctagtc 60 cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttc catggatgtg gaaaccatcg 120 ctttcactgg atatcgcg 138 <210> 43 <211> 1062 <212> DNA <213> Escherichia coli <220> <223> RecA <400> 43 atggctatcg acgaaaacaa acagaaagcg ttggcggcag cactgggcca gattgagaaa 60 caatttggta aaggctccat catgcgcctg ggtgaagacc gttccatgga tgtggaaacc 120 atctctaccg gttcgctttc actggatatc gcgcttgggg caggtggtct gccgatgggc 180 cgtatcgtcg aaatctacgg accggaatct tccggtaaaa ccacgctgac gctgcaggtg 240 atcgccgcag cgcagcgtga aggtaaaacc tgtgcgttta tcgatgctga acacgcgctg 300 gacccaatct acgcacgtaa actgggcgtc gatatcgaca acctgctgtg ctcccagccg 360 gacaccggcg agcaggcact ggaaatctgt gacgccctgg cgcgttctgg cgcagtagac 420 gttatcgtcg ttgactccgt ggcggcactg acgccgaaag cggaaatcga aggcgaaatc 480 ggcgactctc acatgggcct tgcggcacgt atgatgagcc aggcgatgcg taagctggcg 540 ggtaacctga agcagtccaa cacgctgctg atcttcatca accagatccg tatgaaaatt 600 ggtgtgatgt tcggtaaccc ggaaaccact accggtggta acgcgctgaa attctacgcc 660 tctgttcgtc tcgacatccg tcgtatcggc gcggtgaaag agggcgaaaa cgtggtgggt 720 agcgaaaccc gcgtgaaagt ggtgaagaac aaaatcgctg cgccgtttaa acaggctgaa 780 ttccagatcc tctacggcga aggtatcaac ttctacggcg aactggttga cctgggcgta 840 aaagagaagc tgatcgagaa agcaggcgcg tggtacagct acaaaggtga gaagatcggt 900 cagggtaaag cgaatgcgac tgcctggctg aaagataacc cggaaaccgc gaaagagatc 960 gagaagaaag tacgtgagtt gctgctgagc aacccgaact caacgccgga tttctctgta 1020 gatgatagcg aaggcgtagc agaaactaac gaagattttt aa 1062 <210> 44 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 44 atggctatcg acgaaaacaa a 21 <210> 45 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 45 cgtcagcgtg gttttaccgg a 21 <210> 46 <211> 461 <212> DNA <213> Artificial Sequence <220> <223> Expression Cassette <400> 46 tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60 gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120 gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180 tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240 gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300 tggaaaggac gaaacaccgg catccctcag gctgggctgt tttagagcta gaaatagcaa 360 gttaaaataa ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctggcca 420 tcaggcatcc ctcagtatgg aatgaggcat ctgatttttt t 461 <210> 47 <211> 275 <212> DNA <213> Homo sapiens <220> <223> PRDM9 exon ENSE00001804383 <400> 47 attgtgagat gtgtcagaac ttcttcattg acagctgtgc tgcccatggg ccccctacat 60 ttgtaaagga cagtgcagtg gacaaggggc accccaaccg ttcagccctc agtctgcccc 120 cagggctgag aattgggcca tcaggcatcc ctcaggctgg gcttggagta tggaatgagg 180 catctgatct gccgctgggt ctgcactttg gcccttatga gggccgaatt acagaagacg 240 aagaggcagc caacaatgga tactcctggc tgtgg 275 <210> 48 <211> 783 <212> DNA <213> Artificial Sequence <220> <223> Gene Fragment <400> 48 cacctagggg ggaggtcgta gtacccccct atgttttctc ccctaaataa ccccaaaaat 60 ctaagaaaaa aagacctcaa aaaggtcttt aattaacatc tcaaatttcg catttattcc 120 aatttccttt ttgcgtgtga tgcgaattct tgaccgtgat tagagaattg agtaaaatgt 180 acctacgcga gacctcattc gccattcagg ctacgcaact gttgggaagg gcgatcggtg 240 cgggcctctt cgctattacg ccatgaggcg aaagggggat gtgctgcaag gcgattaagt 300 tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag actattcgta 360 atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 420 acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 480 aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctcgatta 540 atgaatcggt ctcagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat 600 caacttgaaa aagtggcacc gagtcggtgc tggccaacga ggcccgggcc aataaggcct 660 tttttactcc atctggattt gttcagaacg ctcggttgcc gccgggcgtt ttttatctaa 720 agcttaggcc cagtcgaaag actgggcctt tttaatacga ctcactatag ggtcgactct 780 aga 783 <210> 49 <211> 784 <212> DNA <213> Artificial Sequence <220> <223> Gene Fragment <400> 49 cacctagggg ggaggtcgta gtacccccct atgttttctc ccctaaataa ccccaaaaat 60 ctaagaaaaa aagacctcaa aaaggtcttt aattaacatc tcaaatttcg catttattcc 120 aatttccttt ttgcgtgtga tgcgaattct tgaccgtgat tagagaattg agtaaaatgt 180 acctacggcc aacgaggccc gggccaataa ggcctacgcg agacctcatt cgccattcag 240 gctacgcaac tgttgggaag ggcgatcggt gcgggcctct tcgctattac gccatgaggc 300 gaaaggggga tgtgctgcaa ggcgattaag ttgggtaacg ccagggtttt cccagtcacg 360 acgttgtaaa acgacggcca gactattcgt aatcatggtc atagctgttt cctgtgtgaa 420 attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag tgtaaagcct 480 ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg cccgctttcc 540 agtcgggaaa cctgtcgtgc cagctcgatt aatgaatcgg tctcagtttt agagctagaa 600 atagcaagtt aaaataaggc tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg 660 ctttttactc catctggatt tgttcagaac gctcggttgc cgccgggcgt tttttatcta 720 aagcttaggc ccagtcgaaa gactgggcct ttttaatacg actcactata gggtcgactc 780 taga 784 <210> 50 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide <400> 50 tacgtgaaga tcaggctatc actg 24 <210> 51 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide <400> 51 aaaccagtga tagcctgatc ttca 24 <210> 52 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide <400> 52 gatcggccaa cgaggccgcg gcattatgtt tgaatttccg tttaaagaat gg 52 <210> 53 <211> 76 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide <400> 53 gatggtttct ttcggtaagt cccgtctagc cttgccctca tcttgacact ccttatttga 60 ttttttgaag acttac 76 <210> 54 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide <400> 54 tgagggcaag gctagacggg acttaccgaa agaaaccatc 40 <210> 55 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide <400> 55 gatcaggcct tattggcctt ggcaggccgc tgaatttcca tgttgcgtaa gtcagg 56 <210> 56 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide <400> 56 gatcggccaa cgaggccttg gcaggccgct gaatttccat gttgcgtaag tc 52 <210> 57 <211> 76 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide <400> 57 cgaagtaagt cttcaaaaaa tcaaataagg agtgtcaaga tgagggcaag gctagacggg 60 acttaccgaa agaaac 76 <210> 58 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide <400> 58 tcttgacact ccttatttga ttttttgaag acttacttcg 40 <210> 59 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide <400> 59 gatcggcctt attggccgcg gcattatgtt tgaatttccg tttaaagaat ggtctgc 57 <210> 60 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide <400> 60 gactttcagg cgtgaatgg 19 <210> 61 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Oligonucleotide <400> 61 cgtgctctcc gataatatgc 20 <210> 62 <211> 6588 <212> DNA <213> Artificial Sequence <220> <223> Vector RLW121 <400> 62 ccgtttaaac ttagttacta atcagtgatc agattgtcgt ttcccgcctt cactttaaac 60 tatcagtgtt tgacaggata tattggcggg taaacctaag agaaaagagc gtttattaga 120 ataatcggat atttaaaagg gcgtgaaaag gtttatccgt tcgtccattt gtatgtcaat 180 attggggggg ggggaaagcc acgttgtgtc tcaaaatctc tgatgttaca ttgcacaaga 240 taaaaatata tcatcatgaa caataaaact gtctgcttac ataaacagta atacaagggg 300 tgttcgccac catgagccat atccagcgtg aaacctcgtg ctcccgcccg cgcctcaatt 360 ccaatatgga tgccgacctt tatggctaca agtgggcgcg cgacaacgtc ggccagtcgg 420 gcgcgaccat ttatcggctt tatggcaaac ccgatgcccc ggaactgttc ctgaagcacg 480 gcaaaggcag cgtcgcaaac gatgtcaccg atgagatggt ccgcctgaac tggcttaccg 540 agttcatgcc gctgccgacg attaagcatt tcatccgtac cccggacgat gcctggctct 600 tgaccacggc cattccgggc aaaacggcct ttcaggtcct tgaagagtac ccggactccg 660 gtgagaatat cgtggacgcc ctcgcggtct tcctccgccg tttgcatagc atccccgtgt 720 gcaactgccc cttcaactcg gaccgggttt tccgcctggc acaggcccag tcgcgcatga 780 ataacggcct cgttgacgcg agcgatttcg acgatgaacg gaatggctgg ccggtggaac 840 aggtttggaa ggaaatgcac aaactgcttc cgttctcgcc ggattcggtg gtcacgcatg 900 gtgatttttc cctggataat ctgatctttg acgagggcaa gctgatcggc tgcatcgacg 960 tgggtcgcgt cggtatcgcc gaccgctatc aggacctggc gatcttgtgg aattgcctcg 1020 gcgagttctc gccctcgctc cagaagcgcc tgttccagaa gtacggcatc gacaacccgg 1080 atatgaacaa gctccagttc cacctcatgc tggacgaatt tttttgaaca gaattggtta 1140 attggttgta acactggcag agcattacgc tgacttgacg ggacggcggc tttgttgaat 1200 aaatcgaact tttgctgagt tgaaggatcg atgagttgaa ggaccccgta gaaaagatca 1260 aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac 1320 caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg 1380 taactggctt cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag 1440 gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac 1500 cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt 1560 taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg 1620 agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc 1680 ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc 1740 gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc 1800 acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa 1860 acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt 1920 tctttcctgc gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg 1980 ataccgctcg ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag 2040 agcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcataggcc 2100 gcgataggcc gacgcgaagc ggcggggcgt agggagcgca gcgaccgaag ggtaggcgct 2160 ttttgcagct cttcggctgt gcgctggcca gacagttatg cacaggccag gcgggtttta 2220 agagttttaa taagttttaa agagttttag gcggaaaaat cgcctttttt ctcttttata 2280 tcagtcactt acatgtgtga ccggttccca atgtacggct ttgggttccc aatgtacggg 2340 ttccggttcc caatgtacgg ctttgggttc ccaatgtacg tgctatccac aggaaagaga 2400 ccttttcgac ctttttcccc tgctagggca atttgcccta gcatctgctc cgtacattag 2460 gaaccggcgg atgcttcgcc ctcgatcagg ttgcggtagc gcatgactag gatcgggcca 2520 gcctgccccg cctcctcctt caaatcgtac tccggcaggt catttgaccc gatcagcttg 2580 cgcacggtga aacagaactt cttgaactct ccggcgctgc cactgcgttc gtagatcgtc 2640 ttgaacaacc atctggcttc tgccttgcct gcggcgcggc gtgccaggcg gtagagaaaa 2700 cggccgatgc cggggtcgat caaaaagtaa tcggggtgaa ccgtcagcac gtccgggttc 2760 ttgccttctg tgatctcgcg gtacatccaa tcagcaagct cgatctcgat gtactccggc 2820 cgcccggttt cgctctttac gatcttgtag cggctaatca aggcttcacc ctcggatacc 2880 gtcaccaggc ggccgttctt ggccttcttg gtacgctgca tggcaacgtg cgtggtgttt 2940 aaccgaatgc aggtttctac caggtcgtct ttctgctttc cgccatcggc tcgccggcag 3000 aacttgagta cgtccgcaac gtgtggacgg aacacgcggc cgggcttgtc tcccttccct 3060 tcccggtatc ggttcatgga ttcggttaga tgggaaaccg ccatcagtac caggtcgtaa 3120 tcccacacac tggccatgcc ggcggggcct gcggaaacct ctacgtgccc gtctggaagc 3180 tcgtagcgga tcacctcgcc agctcgtcgg tcacgcttcg acagacggaa aacggccacg 3240 tccatgatgc tgcgactatc gcgggtgccc acgtcataga gcatcggaac gaaaaaatct 3300 ggttgctcgt cgcccttggg cggcttccta atcgacggcg caccggctgc cggcggttgc 3360 cgggattctt tgcggattcg atcagcggcc ccttgccacg attcaccggg gcgtgcttct 3420 gcctcgatgc gttgccgctg ggcggcctgc gcggccttca acttctccac caggtcatca 3480 cccagcgccg cgccgatttg taccgggccg gatggtttgc gaccgctcac gccgattcct 3540 cgggcttggg ggttccagtg ccattgcagg gccggcagac aacccagccg cttacgcctg 3600 gccaaccgcc cgttcctcca cacatggggc attccacggc gtcggtgcct ggttgttctt 3660 gattttccat gccgcctcct ttagccgcta aaattcatct actcatttat tcatttgctc 3720 atttactctg gtagctgcgc gatgtattca gatagcagct cggtaatggt cttgccttgg 3780 cgtaccgcgt acatcttcag cttggtgtga tcctccgccg gcaactgaaa gttgacccgc 3840 ttcatggctg gcgtgtctgc caggctggcc aacgttgcag ccttgctgct gcgtgcgctc 3900 ggacggccgg cacttagcgt gtttgtgctt ttgctcattt tctctttacc tcattaactc 3960 aaatgagttt tgatttaatt tcagcggcca gcgcctggac ctcgcgggca gcgtcgccct 4020 cgggttctga ttcaagaacg gttgtgccgg cggcggcagt gcctgggtag ctcacgcgct 4080 gcgtgatacg ggactcaaga atgggcagct cgtacccggc cagcgcctcg gcaacctcac 4140 cgccgatgcg cgtgcctttg atcgcccgcg acacgacaaa ggccgcttgt agccttccat 4200 ccgtgacctc aatgcgctgc ttaaccagct ccaccaggtc ggcggtggcc caaatgtcgt 4260 aagggcttgg ctgcaccgga atcagcacga agtcggctgc cttgatcgcg gacacagcca 4320 agtccgccgc ctggggcgct ccgtcgatca ctacgaagtc gcgccggccg atggccttca 4380 cgtcgcggtc aatcgtcggg cggtcgatgc cgacaacggt tagcggttga tcttcccgca 4440 cggccgccca atcgcgggca ctgccctggg gatcggaatc gactaacaga acatcggccc 4500 cggcgagttg cagggcgcgg gctagatggg ttgcgatggt cgtcttgcct gacccgcctt 4560 tctggttaag tacagcgata accttcatgc gttccccttg cgtatttgtt tatttactca 4620 tcgcatcata tacgcagcga ccgcatgacg caagctgttt tactcaaata cacatcacct 4680 ttttagatga tcagtgattt tgtgccgagc tgccggtcgg ggagctgttg gctggctggt 4740 ggcaggatat attgtggtgt aaacaaattg acgcttagac aacttaataa cacattgcgg 4800 acgtctttaa tgtactgaat ttagttactg atcactgatt aagtactgat aaatttaatt 4860 aacagatctc aactttgtat agaaaagttg aacgagaaac gtaaaatgat ataaatatca 4920 atatattaaa ttagattttg cataaaaaac agactacata atactgtaaa acacaacata 4980 tccagtcact atggtcgacc tgcagactgg ctgtgtataa gggagcctga catttatatt 5040 ccccagaaca tcaggttaat ggcgtttttg atgtcatttt cgcggtggct gagatcagcc 5100 acttcttccc cgataacgga gaccggcaca ctggccatat cggtggtcat catgcgccag 5160 ctttcatccc cgatatgcac caccgggtaa agttcacggg ggactttatc tgacagcaga 5220 cgtgcactgg ccagggggat caccatccgt cgcccgggcg tgtcaataat atcactctgt 5280 acatccacaa acagacgata acggctctct cttttatagg tgtaaacctt aaactgcatt 5340 tcaccagccc ctgttctcgt cggcaaaaga gccgttcatt tcaatgaacc gggcgacctc 5400 agccatccct tcctgatttt ccgctttcca gcgttcggca cgcagacgac gggcttcatt 5460 ctgcatggtt gtgcttaccg aaccggagat attgacatca tatatgcctt gagcaactga 5520 tagctgtcgc tgtcaactgt cactgtaata cgctgcttca tagcatacct ctttttgaca 5580 tacttcgggt atacatatca gtatatattc ttataccgca aaaatcagcg cgcaaatacg 5640 catactgtta tctggctttt agtaagccgg atcctctaga ttacgccccg cctgccactc 5700 atcgcagtac tgttgtaatt cattaagcat tctgccgaca tggaagccat cacaaacggc 5760 atgatgaacc tgaatcgcca gcggcatcag caccttgtcg ccttgcgtat aatatttgcc 5820 catggtgaaa acgggggcga agaagttgtc catattggcc acgtttaaat caaaactggt 5880 gaaactcacc cagggattgg ctgagacgaa aaacatattc tcaataaacc ctttagggaa 5940 ataggccagg ttttcaccgt aacacgccac atcttgcgaa tatatgtgta gaaactgccg 6000 gaaatcgtcg tggtattcac tccagagcga tgaaaacgtt tcagtttgct catggaaaac 6060 ggtgtaacaa gggtgaacac tatcccatat caccagctca ccgtctttca ttgccatacg 6120 gaattccgga tgagcattca tcaggcgggc aagaatgtga ataaaggccg gataaaactt 6180 gtgcttattt ttctttacgg tctttaaaaa ggccgtaata tccagctgaa cggtctggtt 6240 ataggtacat tgagcaactg actgaaatgc ctcaaaatgt tctttacgat gccattggga 6300 tatatcaacg gtggtatatc cagtgatttt tttctccatt ttagcttcct tagctcctga 6360 aaatctcgac ggatcctaac tcaaaatcca catattatac gagccggaag cataaagtgt 6420 aaagcctggg gtgcctaatg cggccgccat agtgactgga tatgttgtgt tttacagtat 6480 tatgtagtct gttttttatg caaaatctaa tttaatatat tgatatttat atcattttac 6540 gtttctcgtt caactttatt atacatagtt gataattcac tgggccgg 6588 <210> 63 <211> 7443 <212> DNA <213> Artificial Sequence <220> <223> Vector CC003 <400> 63 ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60 attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120 gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180 gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240 gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300 acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360 aggccgcata aataatgatt ttattttgac tgatagtgac ctgttcgttg caacaaattg 420 ataagcaatg cttttttata atgccaactt tgtatagaaa agttgattta aatgaattca 480 agcttttaat taacttagcc actgcaacaa gttcttgaac cttagcacaa tcatattgtg 540 catgcacttg tttattgcaa agaatggtgc gtagggaaca cgcatgattt ttgaattgct 600 ggcacataat tttatcatta gaaactggaa tgcaacatgt accctttgtc atggtttctt 660 tccgagacat tgcactgttt tttttaatcc tatcattatc ataatgccaa gaactggtca 720 ccaaccagca ttttgcatca tggttagttg agctgtcccc atgtatcaat aggtgcattg 780 tattggtcca aaatataaat gcagtggatg caacctatct catggccgtc aacaaaagaa 840 atcaaaaggg aaatgcacca tcttatatct ccagtttata tgaacagatt ggataagatc 900 ataagatcaa gtggtttata ttattttgag gaatataaca tggattcatc ctaatcactc 960 gtctaggcag tatgtgtatt catgatggat atggtactat actacggagt tttttcttca 1020 caaaataacc tgttattttg acctccaacc aaacacgaat tataccaaaa attgggttat 1080 ttcatctata gtacaactct attataaaca tgcagtaaat tatcctacac atataccaaa 1140 attcaagtgt aataatccta atacacagac ttaaaaaaca aactatttcc tttttaagaa 1200 aaggaaaacc atttttttaa cggaaggaaa acaaattcgg gtcaaggcgg aagccagcgc 1260 gccaccccac gtcagcgaat acggaggcgc ggggttgacg gcgtcacccg gtcctaacgg 1320 cgaccaacaa accagccaga agaaattaca gtaaaaaaaa gtaaattgca ctttgatcca 1380 ccttttatta cccaagtttc aatttggacc acccttaaac ctatcttttc aaattgggcc 1440 gggttgtggt ttggactacc atgaacaact tttcgtcatg tctaacttcc ctttcggcaa 1500 acatatgaac catatataga ggagatcggc cgtatactag agctgatgtg tttaaggtcg 1560 ttgattgcac gagaaaaaaa aaatccaaat cgcaacaata gcaaatttat ctagttcaaa 1620 gtgaaaagat atgtttaaag gtagtccaaa gtaaaactta ggggctgttt ggttcccagc 1680 catactttac cattacttgc caacaaaagt tgccacacct tgtctaaggt gaggtgatca 1740 aattgttagc cacaacttac taagcctaag ggaatcttgc cacacttttt tgagccattg 1800 acacgtggga cttaatttgt tagagggaaa tcttgccaca actgtggcta caaccaaaca 1860 cctgtcaaat ttgcctaacc ttaggcgtgg caaactgtgg caaagtgtgg cttacaacca 1920 aacacaccct tagataataa aatgtggtcc aaagcgtaat tcactaaaaa aaaatcaacg 1980 agacgtgtac caaacggaga caaacggcat cttctcgaaa tttcccaacc gctcgctcgc 2040 ccgcctcgtc ttcccggaaa ccgcggtggt ttcagcgtgg cggattctcc aagcagacgg 2100 agacgtcacg gcacgggact cctcccacca cccaaccgcc ataaatacca gccccctcat 2160 ctcctctcct cgcatcagct ccacccccga aaaatttctc cccaatctcg cgaggctctc 2220 gtcgtcgaat cgaatcctct cgcgtcctca agcttggcat ccaggtacgg atccgcgtcc 2280 catctccctc accccccgtg ttcttcgtgc ctgcttctgg gtcagatctg ggtggattcg 2340 cggttgttgg atgtgggggg ctgtgtttat ttgtcggtgg atctggttgt ctggatctgc 2400 gttttctctg tcgtagttag cggatctgat gaaatgttta gtgttcgtgt atactggtat 2460 ggtggatctg gtcctaggat gcgtggaatg gatatatgta ggcgaattgg aggatttatt 2520 ttgtgaattt tgctgaaatg atagttctaa acactggatc tgacctcggg atgctgttaa 2580 atgtggaaat catggtcgat gctgtcatga acatggtgtt cttatggtag atctgagcaa 2640 tgtatgtttc aaaattgttt gtcacatgga aatgctatgg ttctagatgc aatagaatga 2700 tacatgccga gatcccctct agttgatatg atagatcatg atgttttaca gctatgtcat 2760 atgaatatgt tcatttgtta ccgatgtatt tggatctact taacatttcc aaagcacgcc 2820 gcgttctaat tctagatctg gtagtcatgt ttgtacacgt cacccaccta atacaaatac 2880 atatgtctag tgtttggtga cactgcccgt cagatctgtt ttttccagat ctgtggaaca 2940 aatactccac gcatgtatgg tagttttgaa acgatcttgt atcttccatt gttgtagtaa 3000 caactaaata aagtacaatt gttcaattat tgggaatcgt attttctgta gtgccgatgt 3060 acagcatatt catagatgtc tatttaggaa ctcaaatttt aaattgagga ctagttattt 3120 attgtgggtc agtcttttga attgtgttat cttgctgtac tggcgcgcca ccatggccac 3180 cgccgccgcc gcgtctaccg cgctcactgg cgccactacc gctgcgccca aggcgaggcg 3240 ccgggcgcac ctcctggcca cccgccgcgc cctcgccgcg cccatcaggt gctcagcggc 3300 gtcacccgcc atgccgatgg ctcccccggc caccccgctc cggccgtggg gccccaccga 3360 tccccgcaag ggcgccgaca tcctcgtcga gtccctcgag cgctgcggcg tccgcgacgt 3420 cttcgcctac cccggcggca cgtccatgga gatccaccag gcactcaccc gctcccccgt 3480 catcgccaac cacctcttcc gccacgagca aggggaggcc tttgcggcct ccggctacgc 3540 gcgctcctcg ggccgcgtcg gcgtctgcat cgccacctcc ggccccggcg ccaccaacct 3600 tgtctccgcg ctcgccgacg cgctgctcga ttccgtcccc atggtcgcca tcacgggaca 3660 ggtgccgcga cgcatgattg gcaccgacgc cttccaggag acgcccatcg tcgaggtcac 3720 ccgctccatc accaagcaca actacctggt cctcgacgtc gacgacatcc cccgcgtcgt 3780 gcaggaggct ttcttcctcg cctcctctgg tcgaccgggg ccggtgcttg tcgacatccc 3840 caaggacatc cagcagcaga tggcggtgcc tgtctgggac aagcccatga gtctgcctgg 3900 gtacattgcg cgccttccca agccccctgc gactgagttg cttgagcagg tgctgcgtct 3960 tgttggtgaa tcccggcgcc ctgttcttta tgttggcggt ggctgcgcag catctggtga 4020 ggagttgcga cgctttgtgg agctgactgg aatcccggtc acaactactc ttatgggcct 4080 cggcaacttc cccagcgacg acccactgtc tctgcgcatg ctaggtatgc atggcacggt 4140 gtatgcaaat tatgcagtgg ataaggccga tctgttgctt gcacttggtg tgcggtttga 4200 tgatcgtgtg acagggaaga ttgaggcttt tgcaagcagg gctaagattg tgcacgttga 4260 tattgatccg gctgagattg gcaagaacaa gcagccacat gtgtccatct gtgcagatgt 4320 taagcttgct ttgcagggca tgaatgctct tcttgaagga agcacatcaa agaagagctt 4380 tgactttggc tcatggaacg atgagttgga tcagcagaag agggaattcc cccttgggta 4440 taaaacatct aatgaggaga tccagccaca atatgctatt caggttcttg atgagctgac 4500 gaaaggcgag gccatcatcg gcacaggtgt tgggcagcac cagatgtggg cggcacagta 4560 ctacacttac aagcggccaa ggcagtggtt gtcttcagct ggtcttgggg ctatgggatt 4620 tggtttgccg gctgctgctg gtgcttctgt ggccaaccca ggtgttactg ttgttgacat 4680 cgatggagat ggtagctttc tcatgaacgt tcaggagcta gctatgatcc gaattgagaa 4740 cctcccggtg aaggtctttg tgctaaacaa ccagcacctg gggatggtgg tgcagtggga 4800 ggacaggttc tataaggcca acagagcgca cacatacttg ggaaacccag agaatgaaag 4860 tgagatatat ccagatttcg tgacgatcgc caaagggttc aacattccag cggtccgtgt 4920 gacaaagaag aacgaagtcc gcgcagcgat aaagaagatg ctcgagactc cagggccgta 4980 cctcttggat ataatcgtcc cacaccagga gcatgtgttg cctatgatcc ctaatggtgg 5040 ggctttcaag gatatgatcc tggatggtga tggcaggact gtgtactagc ctgcaggcct 5100 aggatcgttc aaacatttgg caataaagtt tcttaagatt gaatcctgtt gccggtcttg 5160 cgatgattat catataattt ctgttgaatt acgttaagca tgtaataatt aacatgtaat 5220 gcatgacgtt atttatgaga tgggttttta tgattagagt cccgcaatta tacatttaat 5280 acgcgataga aaacaaaata tagcgcgcaa actaggataa attatcgcgc gcggtgtcat 5340 ctatgttact agatcggccg gccgtttaaa cagcctgctt ttttgtacaa agttggcatt 5400 ataaaaaagc attgctcatc aatttgttgc aacgaacagg tcactatcag tcaaaataaa 5460 atcattattt gctgggcctc atgggccttc cgctcactgc ccgctttcca gtcgggaaac 5520 ctgtcgtgcc agctgcatta acatggtcat agctgtttcc ttgcgtattg ggcgctctcc 5580 gcttcctcgc tcactgactc gctgcgctcg gtcgttcggg taaagcctgg ggtgcctaat 5640 gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 5700 ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 5760 acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 5820 ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 5880 cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 5940 tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 6000 gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 6060 ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 6120 acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 6180 gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 6240 ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 6300 tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 6360 gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 6420 tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 6480 ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 6540 taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagaac 6600 cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 6660 gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 6720 gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 6780 tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 6840 gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 6900 ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 6960 ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 7020 cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 7080 ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 7140 gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 7200 ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 7260 ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 7320 tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 7380 ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 7440 cac 7443 <210> 64 <211> 3734 <212> DNA <213> Artificial Sequence <220> <223> Vector CC018 <400> 64 cgcggatcat gaaccaacgg cctggctgta tttggtggtt gtgtagggag atggggagaa 60 gaaaagcccg attctcttcg ctgtgatggg ctggatgcat gcgggggagc gggaggccca 120 agtacgtgca cggtgagcgg cccacagggc gagtgtgagc gcgagaggcg ggaggaacag 180 tttagtacca cattgcccag ctaactcgaa cgcgaccaac ttataaaccc gcgcgctgtc 240 gcttgtgtgc attgagtgct atgctgaggt tttagagcta gaaatagcaa gttaaaataa 300 ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctctgtt cctcgtgctg 360 gacaagtgtg gtttccagat tctgcaacca agactgcgca ggcattgctg gacttcaacc 420 gtgaaggatt acctctgttc atcctcgcta actggagagg cttctctggt ggacaaagag 480 atctctttga aggaattctt caggctggct cgactattgt tgagaacctt aggacataca 540 atcagcctgc ctttgtctac attcccatgg ctgcagagct acgaggaggg gcttgggttg 600 tggttgatag caagataaac ccagaccgca ttgagtgcta tgctgagaga actgcaaaat 660 ccaatgttct ggaaccgcaa gggttaattg agatcaagtt caggtcagag gaactccagg 720 attgcatgag tcggcttgac ccaacattaa ttgatctgaa agcaaaactc gaagtagcaa 780 ataaaaatgg aagtgctgac acaaaatcgc ttcaagaaaa tatagaagct cgaacaaaac 840 agttgatgcc tctatatact cagattgcga tacggtttgc tgaattgcat gatacatccc 900 tcagaatggc tgcgaaaggt gtgattaaga aagttgtgga ctgggaagaa tcacgatctt 960 tctttttttt gcggccgccc cgggcctgca ggggatcccg atcgggccgg ccgtttaaac 1020 ccactttgta caagaaagtt gaacgagaaa cgtaaaatga tataaatatc aatatattaa 1080 attagatttt gcataaaaaa cagactacat aatactgtaa aacacaacat atgcagtcac 1140 tatgaaccaa ctacttagat ggtattagtg acctgtactg ggcctcatgg gccttccgct 1200 cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaacat ggtcatagct 1260 gtttccttgc gtattgggcg ctctccgctt cctcgctcac tgactcgctg cgctcggtcg 1320 ttcgggtaaa gcctggggtg cctaatgagc aaaaggccag caaaaggcca ggaaccgtaa 1380 aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 1440 tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 1500 ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 1560 cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 1620 ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 1680 ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 1740 gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 1800 agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg 1860 cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 1920 aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 1980 aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 2040 ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 2100 aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 2160 ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 2220 agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 2280 cagtgctgca atgataccgc gagaaccacg ctcaccggct ccagatttat cagcaataaa 2340 ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 2400 gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 2460 cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 2520 cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 2580 ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 2640 catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 2700 tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 2760 ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 2820 catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 2880 cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 2940 cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 3000 acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 3060 ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 3120 tccgcgcaca tttccccgaa aagtgccacc taaattgtaa gcgttaatat tttgttaaaa 3180 ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa 3240 atcccttata aatcaaaaga atagaccgag atagggttga gtggccgcta cagggcgctc 3300 ccattcgcca ttcaggctgc gcaactgttg ggaagggcgt ttcggtgcgg gcctcttcgc 3360 tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 3420 ggttttccca gtcacgacgt tgtaaaacga cggccagtga gcgcgacgta atacgactca 3480 ctatagggcg aattggcgga aggccgtcaa ggccgcatta caggtcacta ataccatcta 3540 agtagttggt tcatagtgac tgcatatgtt gtgttttaca gtattatgta gtctgttttt 3600 tatgcaaaat ctaatttaat atattgatat ttatatcatt ttacgtttct cgttcaactt 3660 ttttgtacaa acttgattta aatgaattca agcttttaat taagcatgcg agctcggcgc 3720 gccggtaccg cgat 3734 <210> 65 <211> 9506 <212> DNA <213> Artificial Sequence <220> <223> Vector CC006 <400> 65 ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60 attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120 gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180 gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240 gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300 acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360 aggccgcatc aaataatgat tttattttga ctgatagtga cctgttcgtt gcaacaaatt 420 gataagcaat gctttcttat aatgccaact ttgtacaaga aagctgggta tttaaatgaa 480 ttcaagcttt taattaatgc agtgcagcgt gacccggtcg tgcccctctc tagagataat 540 gagcattgca tgtctaagtt ataaaaaatt accacatatt ttttttgtca cacttgtttg 600 aagtgcagtt tatctatctt tatacatata tttaaacttt actctacgaa taatataatc 660 tatagtacta caataatatc agtgttttag agaatcatat aaatgaacag ttagacatgg 720 tctaaaggac aattgagtat tttgacaaca ggactctaca gttttatctt tttagtgtgc 780 atgtgttctc cttttttttt gcaaatagct tcacctatat aatacttcat ccattttatt 840 agtacatcca tttagggttt agggttaatg gtttttatag actaattttt ttagtacatc 900 tattttattc tattttagcc tctaaattaa gaaaactaaa actctatttt agttttttta 960 tttaatagtt tagatataaa atagaataaa ataaagtgac taaaaattaa acaaataccc 1020 tttaagaaat taaaaaaact aaggaaacat ttttcttgtt tcgagtagat aatgccagcc 1080 tgttaaacgc cgtcgacgag tctaacggac accaaccagc gaaccagcag cgtcgcgtcg 1140 ggccaagcga agcagacggc acggcatctc tgtcgctgcc tctggacccc tctcgagagt 1200 tccgctccac cgttggactt gctccgctgt cggcatccag aaattgcgtg gcggagcggc 1260 agacgtgagc cggcacggca ggcggcctcc tcctcctctc acggcaccgg cagctacggg 1320 ggattccttt cccaccgctc cttcgctttc ccttcctcgc ccgccgtaat aaatagacac 1380 cccctccaca ccctctttcc ccaacctcgt gttgttcgga gcgcacacac acacaaccag 1440 atctccccca aatccacccg tcggcacctc cgcttcaagg tacgccgctc gtcctccccc 1500 cccccccccc tctctacctt ctctagatcg gcgttccggt ccatggttag ggcccggtag 1560 ttctacttct gttcatgttt gtgttagatc cgtgtttgtg ttagatccgt gctgctagcg 1620 ttcgtacacg gatgcgacct gtacgtcaga cacgttctga ttgctaactt gccagtgttt 1680 ctctttgggg aatcctggga tggctctagc cgttccgcag acgggatcga tttcatgatt 1740 ttttttgttt cgttgcatag ggtttggttt gcccttttcc tttatttcaa tatatgccgt 1800 gcacttgttt gtcgggtcat cttttcatgc ttttttttgt cttggttgtg atgatgtggt 1860 ctggttgggc ggtcgttcta gatcggagta gaattctgtt tcaaactacc tggtggattt 1920 attaattttg gatctgtatg tgtgtgccat acatattcat agttacgaat tgaagatgat 1980 ggatggaaat atcgatctag gataggtata catgttgatg cgggttttac tgatgcatat 2040 acagagatgc tttttgttcg cttggttgtg atgatgtggt gtggttgggc ggtcgttcat 2100 tcgttctaga tcggagtaga atactgtttc aaactacctg gtgtatttat taattttgga 2160 actgtatgtg tgtgtcatac atcttcatag ttacgagttt aagatggatg gaaatatcga 2220 tctaggatag gtatacatgt tgatgtgggt tttactgatg catatacatg atggcatatg 2280 cagcatctat tcatatgctc taaccttgag tacctatcta ttataataaa caagtatgtt 2340 ttataattat ttcgatcttg atatacttgg atgatggcat atgcagcagc tatatgtgga 2400 tttttttagc cctgccttca tacgctattt atttgcttgg tactgtttct tttgtcgatg 2460 ctcaccctgt tgtttggtgt tacttctgca gggcgcgcca ccatggctcc taagaagaag 2520 cggaaggttg gtattcacgg ggtgcctgcg gctgacaaga agtactccat cggcctcgac 2580 atcggcacca acagcgtcgg ctgggcggtg atcaccgacg agtacaaggt cccgtccaag 2640 aagttcaagg tcctgggcaa caccgaccgc cactccatca agaagaacct catcggcgcc 2700 ctcctcttcg actccggcga gacggcggag gcgacccgcc tcaagcgcac cgcccgccgc 2760 cgctacaccc gccgcaagaa ccgcatctgc tacctccagg agatcttctc caacgagatg 2820 gcgaaggtcg acgactcctt cttccaccgc ctcgaggagt ccttcctcgt ggaggaggac 2880 aagaagcacg agcgccaccc catcttcggc aacatcgtcg acgaggtcgc ctaccacgag 2940 aagtacccca ctatctacca ccttcgtaag aagcttgttg actctactga taaggctgat 3000 cttcgtctca tctaccttgc tctcgctcac atgatcaagt tccgtggtca cttccttatc 3060 gagggtgacc ttaaccctga taactccgac gtggacaagc tcttcatcca gctcgtccag 3120 acctacaacc agctcttcga ggagaaccct atcaacgctt ccggtgtcga cgctaaggcg 3180 atcctttccg ctaggctctc caagtccagg cgtctcgaga acctcatcgc ccagctccct 3240 ggtgagaaga agaacggtct tttcggtaac ctcatcgctc tctccctcgg tctgacccct 3300 aacttcaagt ccaacttcga cctcgctgag gacgctaagc ttcagctctc caaggatacc 3360 tacgacgatg atctcgacaa cctcctcgct cagattggag atcagtacgc tgatctcttc 3420 cttgctgcta agaacctctc cgatgctatc ctcctttcgg atatccttag ggttaacact 3480 gagatcacta aggctcctct ttctgcttcc atgatcaagc gctacgacga gcaccaccag 3540 gacctcaccc tcctcaaggc tcttgttcgt cagcagctcc ccgagaagta caaggagatc 3600 ttcttcgacc agtccaagaa cggctacgcc ggttacattg acggtggagc tagccaggag 3660 gagttctaca agttcatcaa gccaatcctt gagaagatgg atggtactga ggagcttctc 3720 gttaagctta accgtgagga cctccttagg aagcagagga ctttcgataa cggctctatc 3780 cctcaccaga tccaccttgg tgagcttcac gccatccttc gtaggcagga ggacttctac 3840 cctttcctca aggacaaccg tgagaagatc gagaagatcc ttactttccg tattccttac 3900 tacgttggtc ctcttgctcg tggtaactcc cgtttcgctt ggatgactag gaagtccgag 3960 gagactatca ccccttggaa cttcgaggag gttgttgaca agggtgcttc cgcccagtcc 4020 ttcatcgagc gcatgaccaa cttcgacaag aacctcccca acgagaaggt cctccccaag 4080 cactccctcc tctacgagta cttcacggtc tacaacgagc tcaccaaggt caagtacgtc 4140 accgagggta tgcgcaagcc tgccttcctc tccggcgagc agaagaaggc tatcgttgac 4200 ctcctcttca agaccaaccg caaggtcacc gtcaagcagc tcaaggagga ctacttcaag 4260 aagatcgagt gcttcgactc cgtcgagatc agcggcgttg aggaccgttt caacgcttct 4320 ctcggcacct accacgatct cctcaagatc atcaaggaca aggacttcct cgacaacgag 4380 gagaacgagg acatcctcga ggacatcgtc ctcactctta ctctcttcga ggatagggag 4440 atgatcgagg agaggctcaa gacttacgct catctcttcg atgacaaggt tatgaagcag 4500 ctcaagcgtc gccgttacac cggttggggt aggctctccc gcaagctcat caacggtatc 4560 agggataagc agagcggcaa gactatcctc gacttcctca agtctgatgg tttcgctaac 4620 aggaacttca tgcagctcat ccacgatgac tctcttacct tcaaggagga tattcagaag 4680 gctcaggtgt ccggtcaggg cgactctctc cacgagcaca ttgctaacct tgctggttcc 4740 cctgctatca agaagggcat ccttcagact gttaaggttg tcgatgagct tgtcaaggtt 4800 atgggtcgtc acaagcctga gaacatcgtc atcgagatgg ctcgtgagaa ccagactacc 4860 cagaagggtc agaagaactc gagggagcgc atgaagagga ttgaggaggg tatcaaggag 4920 cttggttctc agatccttaa ggagcaccct gtcgagaaca cccagctcca gaacgagaag 4980 ctctacctct actacctcca gaacggtagg gatatgtacg ttgaccagga gctcgacatc 5040 aacaggcttt ctgactacga cgtcgaccac attgttcctc agtctttcct taaggatgac 5100 tccatcgaca acaaggtcct cacgaggtcc gacaagaaca ggggtaagtc ggacaacgtc 5160 ccttccgagg aggttgtcaa gaagatgaag aactactgga ggcagcttct caacgctaag 5220 ctcattaccc agaggaagtt cgacaacctc acgaaggctg agaggggtgg cctttccgag 5280 cttgacaagg ctggtttcat caagaggcag cttgttgaga cgaggcagat taccaagcac 5340 gttgctcaga tcctcgattc taggatgaac accaagtacg acgagaacga caagctcatc 5400 cgcgaggtca aggtgatcac cctcaagtcc aagctcgtct ccgacttccg caaggacttc 5460 cagttctaca aggtccgcga gatcaacaac taccaccacg ctcacgatgc ttaccttaac 5520 gctgtcgttg gcaccgctct tatcaagaag taccctaagc ttgagtccga gttcgtctac 5580 ggtgactaca aggtctacga cgttcgtaag atgatcgcca agtccgagca ggagatcggc 5640 aaggccaccg ccaagtactt cttctactcc aacatcatga acttcttcaa gaccgagatc 5700 accctcgcca acggcgagat ccgcaagcgc cctcttatcg agacgaacgg tgagactggt 5760 gagatcgttt gggacaaggg tcgcgacttc gctactgttc gcaaggtcct ttctatgcct 5820 caggttaaca tcgtcaagaa gaccgaggtc cagaccggtg gcttctccaa ggagtctatc 5880 cttccaaaga gaaactcgga caagctcatc gctaggaaga aggattggga ccctaagaag 5940 tacggtggtt tcgactcccc tactgtcgcc tactccgtcc tcgtggtcgc caaggtggag 6000 aagggtaagt cgaagaagct caagtccgtc aaggagctcc tcggcatcac catcatggag 6060 cgctcctcct tcgagaagaa cccgatcgac ttcctcgagg ccaagggcta caaggaggtc 6120 aagaaggacc tcatcatcaa gctccccaag tactctcttt tcgagctcga gaacggtcgt 6180 aagaggatgc tggcttccgc tggtgagctc cagaagggta acgagcttgc tcttccttcc 6240 aagtacgtga acttcctcta cctcgcctcc cactacgaga agctcaaggg ttcccctgag 6300 gataacgagc agaagcagct cttcgtggag cagcacaagc actacctcga cgagatcatc 6360 gagcagatct ccgagttctc caagcgcgtc atcctcgctg acgctaacct cgacaaggtc 6420 ctctccgcct acaacaagca ccgcgacaag cccatccgcg agcaggccga gaacatcatc 6480 cacctcttca cgctcacgaa cctcggcgcc cctgctgctt tcaagtactt cgacaccacc 6540 atcgacagga agcgttacac gtccaccaag gaggttctcg acgctactct catccaccag 6600 tccatcaccg gtctttacga gactcgtatc gacctttccc agcttggtgg tgataagcgt 6660 cctgctgcca ccaaaaaggc cggacaggct aagaaaaaga agtagcctgc aggtcctgct 6720 ttaatgagat atgcgagacg cctatgatcg catgatattt gctttcaatt ctgttgtgca 6780 cgttgtaaaa aacctgagca tgtgtagctc agatccttac cgccggtttc ggttcattct 6840 aatgaatata tcacccgtta ctatcgtatt tttatgaata atattctccg ttcaatttac 6900 tgattgtacc ctactactta tatgtacaat attaaaatga aaacaatata ttgtgctgaa 6960 taggtttata gcgacatcta tgatagagcg ccacaataac aaacaattgc gttttattat 7020 tacaaatcca attttaaaaa aagcggcaga accggtcaaa cctaaaagac tgattacata 7080 aatcttattc aaatttcaaa agtgccccag gggctagtat ctacgacaca ccgagcggcg 7140 aactaataac gctcactgaa gggaactccg gttccccgcc ggcgcgcatg ggtgagattc 7200 cttgaagttg agtattggcc gtccgctcta ccgaaagtta cgggcaccat tcaacccggt 7260 ccagcacggc ggccgggtaa ccgacttgct gccccgagaa ttatgcagca tttttttggt 7320 gtatgtgggc cccaaatgaa gtgcaggtca aaccttgaca gtgacgacaa atcgttgggc 7380 gggtccaggg cgaattttgc gacaacatgt cgaggctcag caggccggcc gtttaaacca 7440 actttattat acaaagttgg cattataaaa aagcattgct tatcaatttg ttgcaacgaa 7500 caggtcacta tcagtcaaaa taaaatcatt atttctgggc ctcatgggcc ttccgctcac 7560 tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaacatggt catagctgtt 7620 tccttgcgta ttgggcgctc tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 7680 gggtaaagcc tggggtgcct aatgagcaaa aggccagcaa aaggccagga accgtaaaaa 7740 ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 7800 acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 7860 tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 7920 ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 7980 ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 8040 ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 8100 actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 8160 gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 8220 tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 8280 caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 8340 atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 8400 acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 8460 ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 8520 ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 8580 tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 8640 tgctgcaatg ataccgcgag aaccacgctc accggctcca gatttatcag caataaacca 8700 gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 8760 tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 8820 tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 8880 ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 8940 tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 9000 ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 9060 gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 9120 ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 9180 cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 9240 ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 9300 ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 9360 gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 9420 ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 9480 gcgcacattt ccccgaaaag tgccac 9506 <210> 66 <211> 17930 <212> DNA <213> Artificial Sequence <220> <223> Vector RLW137 <400> 66 ttatacatag ttgataattc actgggccgg ccgtttaaac ttagttacta atcagtgatc 60 agattgtcgt ttcccgcctt cactttaaac tatcagtgtt tgacaggata tattggcggg 120 taaacctaag agaaaagagc gtttattaga ataatcggat atttaaaagg gcgtgaaaag 180 gtttatccgt tcgtccattt gtatgtcaat attggggggg ggggaaagcc acgttgtgtc 240 tcaaaatctc tgatgttaca ttgcacaaga taaaaatata tcatcatgaa caataaaact 300 gtctgcttac ataaacagta atacaagggg tgttcgccac catgagccat atccagcgtg 360 aaacctcgtg ctcccgcccg cgcctcaatt ccaatatgga tgccgacctt tatggctaca 420 agtgggcgcg cgacaacgtc ggccagtcgg gcgcgaccat ttatcggctt tatggcaaac 480 ccgatgcccc ggaactgttc ctgaagcacg gcaaaggcag cgtcgcaaac gatgtcaccg 540 atgagatggt ccgcctgaac tggcttaccg agttcatgcc gctgccgacg attaagcatt 600 tcatccgtac cccggacgat gcctggctct tgaccacggc cattccgggc aaaacggcct 660 ttcaggtcct tgaagagtac ccggactccg gtgagaatat cgtggacgcc ctcgcggtct 720 tcctccgccg tttgcatagc atccccgtgt gcaactgccc cttcaactcg gaccgggttt 780 tccgcctggc acaggcccag tcgcgcatga ataacggcct cgttgacgcg agcgatttcg 840 acgatgaacg gaatggctgg ccggtggaac aggtttggaa ggaaatgcac aaactgcttc 900 cgttctcgcc ggattcggtg gtcacgcatg gtgatttttc cctggataat ctgatctttg 960 acgagggcaa gctgatcggc tgcatcgacg tgggtcgcgt cggtatcgcc gaccgctatc 1020 aggacctggc gatcttgtgg aattgcctcg gcgagttctc gccctcgctc cagaagcgcc 1080 tgttccagaa gtacggcatc gacaacccgg atatgaacaa gctccagttc cacctcatgc 1140 tggacgaatt tttttgaaca gaattggtta attggttgta acactggcag agcattacgc 1200 tgacttgacg ggacggcggc tttgttgaat aaatcgaact tttgctgagt tgaaggatcg 1260 atgagttgaa ggaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc 1320 gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg 1380 atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa 1440 atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc 1500 ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt 1560 gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa 1620 cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc 1680 tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc 1740 cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct 1800 ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat 1860 gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc 1920 tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg 1980 ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc 2040 gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc 2100 atctgtgcgg tatttcacac cgcataggcc gcgataggcc gacgcgaagc ggcggggcgt 2160 agggagcgca gcgaccgaag ggtaggcgct ttttgcagct cttcggctgt gcgctggcca 2220 gacagttatg cacaggccag gcgggtttta agagttttaa taagttttaa agagttttag 2280 gcggaaaaat cgcctttttt ctcttttata tcagtcactt acatgtgtga ccggttccca 2340 atgtacggct ttgggttccc aatgtacggg ttccggttcc caatgtacgg ctttgggttc 2400 ccaatgtacg tgctatccac aggaaagaga ccttttcgac ctttttcccc tgctagggca 2460 atttgcccta gcatctgctc cgtacattag gaaccggcgg atgcttcgcc ctcgatcagg 2520 ttgcggtagc gcatgactag gatcgggcca gcctgccccg cctcctcctt caaatcgtac 2580 tccggcaggt catttgaccc gatcagcttg cgcacggtga aacagaactt cttgaactct 2640 ccggcgctgc cactgcgttc gtagatcgtc ttgaacaacc atctggcttc tgccttgcct 2700 gcggcgcggc gtgccaggcg gtagagaaaa cggccgatgc cggggtcgat caaaaagtaa 2760 tcggggtgaa ccgtcagcac gtccgggttc ttgccttctg tgatctcgcg gtacatccaa 2820 tcagcaagct cgatctcgat gtactccggc cgcccggttt cgctctttac gatcttgtag 2880 cggctaatca aggcttcacc ctcggatacc gtcaccaggc ggccgttctt ggccttcttg 2940 gtacgctgca tggcaacgtg cgtggtgttt aaccgaatgc aggtttctac caggtcgtct 3000 ttctgctttc cgccatcggc tcgccggcag aacttgagta cgtccgcaac gtgtggacgg 3060 aacacgcggc cgggcttgtc tcccttccct tcccggtatc ggttcatgga ttcggttaga 3120 tgggaaaccg ccatcagtac caggtcgtaa tcccacacac tggccatgcc ggcggggcct 3180 gcggaaacct ctacgtgccc gtctggaagc tcgtagcgga tcacctcgcc agctcgtcgg 3240 tcacgcttcg acagacggaa aacggccacg tccatgatgc tgcgactatc gcgggtgccc 3300 acgtcataga gcatcggaac gaaaaaatct ggttgctcgt cgcccttggg cggcttccta 3360 atcgacggcg caccggctgc cggcggttgc cgggattctt tgcggattcg atcagcggcc 3420 ccttgccacg attcaccggg gcgtgcttct gcctcgatgc gttgccgctg ggcggcctgc 3480 gcggccttca acttctccac caggtcatca cccagcgccg cgccgatttg taccgggccg 3540 gatggtttgc gaccgctcac gccgattcct cgggcttggg ggttccagtg ccattgcagg 3600 gccggcagac aacccagccg cttacgcctg gccaaccgcc cgttcctcca cacatggggc 3660 attccacggc gtcggtgcct ggttgttctt gattttccat gccgcctcct ttagccgcta 3720 aaattcatct actcatttat tcatttgctc atttactctg gtagctgcgc gatgtattca 3780 gatagcagct cggtaatggt cttgccttgg cgtaccgcgt acatcttcag cttggtgtga 3840 tcctccgccg gcaactgaaa gttgacccgc ttcatggctg gcgtgtctgc caggctggcc 3900 aacgttgcag ccttgctgct gcgtgcgctc ggacggccgg cacttagcgt gtttgtgctt 3960 ttgctcattt tctctttacc tcattaactc aaatgagttt tgatttaatt tcagcggcca 4020 gcgcctggac ctcgcgggca gcgtcgccct cgggttctga ttcaagaacg gttgtgccgg 4080 cggcggcagt gcctgggtag ctcacgcgct gcgtgatacg ggactcaaga atgggcagct 4140 cgtacccggc cagcgcctcg gcaacctcac cgccgatgcg cgtgcctttg atcgcccgcg 4200 acacgacaaa ggccgcttgt agccttccat ccgtgacctc aatgcgctgc ttaaccagct 4260 ccaccaggtc ggcggtggcc caaatgtcgt aagggcttgg ctgcaccgga atcagcacga 4320 agtcggctgc cttgatcgcg gacacagcca agtccgccgc ctggggcgct ccgtcgatca 4380 ctacgaagtc gcgccggccg atggccttca cgtcgcggtc aatcgtcggg cggtcgatgc 4440 cgacaacggt tagcggttga tcttcccgca cggccgccca atcgcgggca ctgccctggg 4500 gatcggaatc gactaacaga acatcggccc cggcgagttg cagggcgcgg gctagatggg 4560 ttgcgatggt cgtcttgcct gacccgcctt tctggttaag tacagcgata accttcatgc 4620 gttccccttg cgtatttgtt tatttactca tcgcatcata tacgcagcga ccgcatgacg 4680 caagctgttt tactcaaata cacatcacct ttttagatga tcagtgattt tgtgccgagc 4740 tgccggtcgg ggagctgttg gctggctggt ggcaggatat attgtggtgt aaacaaattg 4800 acgcttagac aacttaataa cacattgcgg acgtctttaa tgtactgaat ttagttactg 4860 atcactgatt aagtactgat aaatttaatt aacagatctc aactttgtat agaaaagttg 4920 atttaaatga attcaagctt ttaattaact tagccactgc aacaagttct tgaaccttag 4980 cacaatcata ttgtgcatgc acttgtttat tgcaaagaat ggtgcgtagg gaacacgcat 5040 gatttttgaa ttgctggcac ataattttat cattagaaac tggaatgcaa catgtaccct 5100 ttgtcatggt ttctttccga gacattgcac tgtttttttt aatcctatca ttatcataat 5160 gccaagaact ggtcaccaac cagcattttg catcatggtt agttgagctg tccccatgta 5220 tcaataggtg cattgtattg gtccaaaata taaatgcagt ggatgcaacc tatctcatgg 5280 ccgtcaacaa aagaaatcaa aagggaaatg caccatctta tatctccagt ttatatgaac 5340 agattggata agatcataag atcaagtggt ttatattatt ttgaggaata taacatggat 5400 tcatcctaat cactcgtcta ggcagtatgt gtattcatga tggatatggt actatactac 5460 ggagtttttt cttcacaaaa taacctgtta ttttgacctc caaccaaaca cgaattatac 5520 caaaaattgg gttatttcat ctatagtaca actctattat aaacatgcag taaattatcc 5580 tacacatata ccaaaattca agtgtaataa tcctaataca cagacttaaa aaacaaacta 5640 tttccttttt aagaaaagga aaaccatttt tttaacggaa ggaaaacaaa ttcgggtcaa 5700 ggcggaagcc agcgcgccac cccacgtcag cgaatacgga ggcgcggggt tgacggcgtc 5760 acccggtcct aacggcgacc aacaaaccag ccagaagaaa ttacagtaaa aaaaagtaaa 5820 ttgcactttg atccaccttt tattacccaa gtttcaattt ggaccaccct taaacctatc 5880 ttttcaaatt gggccgggtt gtggtttgga ctaccatgaa caacttttcg tcatgtctaa 5940 cttccctttc ggcaaacata tgaaccatat atagaggaga tcggccgtat actagagctg 6000 atgtgtttaa ggtcgttgat tgcacgagaa aaaaaaaatc caaatcgcaa caatagcaaa 6060 tttatctagt tcaaagtgaa aagatatgtt taaaggtagt ccaaagtaaa acttaggggc 6120 tgtttggttc ccagccatac tttaccatta cttgccaaca aaagttgcca caccttgtct 6180 aaggtgaggt gatcaaattg ttagccacaa cttactaagc ctaagggaat cttgccacac 6240 ttttttgagc cattgacacg tgggacttaa tttgttagag ggaaatcttg ccacaactgt 6300 ggctacaacc aaacacctgt caaatttgcc taaccttagg cgtggcaaac tgtggcaaag 6360 tgtggcttac aaccaaacac acccttagat aataaaatgt ggtccaaagc gtaattcact 6420 aaaaaaaaat caacgagacg tgtaccaaac ggagacaaac ggcatcttct cgaaatttcc 6480 caaccgctcg ctcgcccgcc tcgtcttccc ggaaaccgcg gtggtttcag cgtggcggat 6540 tctccaagca gacggagacg tcacggcacg ggactcctcc caccacccaa ccgccataaa 6600 taccagcccc ctcatctcct ctcctcgcat cagctccacc cccgaaaaat ttctccccaa 6660 tctcgcgagg ctctcgtcgt cgaatcgaat cctctcgcgt cctcaagctt ggcatccagg 6720 tacggatccg cgtcccatct ccctcacccc ccgtgttctt cgtgcctgct tctgggtcag 6780 atctgggtgg attcgcggtt gttggatgtg gggggctgtg tttatttgtc ggtggatctg 6840 gttgtctgga tctgcgtttt ctctgtcgta gttagcggat ctgatgaaat gtttagtgtt 6900 cgtgtatact ggtatggtgg atctggtcct aggatgcgtg gaatggatat atgtaggcga 6960 attggaggat ttattttgtg aattttgctg aaatgatagt tctaaacact ggatctgacc 7020 tcgggatgct gttaaatgtg gaaatcatgg tcgatgctgt catgaacatg gtgttcttat 7080 ggtagatctg agcaatgtat gtttcaaaat tgtttgtcac atggaaatgc tatggttcta 7140 gatgcaatag aatgatacat gccgagatcc cctctagttg atatgataga tcatgatgtt 7200 ttacagctat gtcatatgaa tatgttcatt tgttaccgat gtatttggat ctacttaaca 7260 tttccaaagc acgccgcgtt ctaattctag atctggtagt catgtttgta cacgtcaccc 7320 acctaataca aatacatatg tctagtgttt ggtgacactg cccgtcagat ctgttttttc 7380 cagatctgtg gaacaaatac tccacgcatg tatggtagtt ttgaaacgat cttgtatctt 7440 ccattgttgt agtaacaact aaataaagta caattgttca attattggga atcgtatttt 7500 ctgtagtgcc gatgtacagc atattcatag atgtctattt aggaactcaa attttaaatt 7560 gaggactagt tatttattgt gggtcagtct tttgaattgt gttatcttgc tgtactggcg 7620 cgccaccatg gccaccgccg ccgccgcgtc taccgcgctc actggcgcca ctaccgctgc 7680 gcccaaggcg aggcgccggg cgcacctcct ggccacccgc cgcgccctcg ccgcgcccat 7740 caggtgctca gcggcgtcac ccgccatgcc gatggctccc ccggccaccc cgctccggcc 7800 gtggggcccc accgatcccc gcaagggcgc cgacatcctc gtcgagtccc tcgagcgctg 7860 cggcgtccgc gacgtcttcg cctaccccgg cggcacgtcc atggagatcc accaggcact 7920 cacccgctcc cccgtcatcg ccaaccacct cttccgccac gagcaagggg aggcctttgc 7980 ggcctccggc tacgcgcgct cctcgggccg cgtcggcgtc tgcatcgcca cctccggccc 8040 cggcgccacc aaccttgtct ccgcgctcgc cgacgcgctg ctcgattccg tccccatggt 8100 cgccatcacg ggacaggtgc cgcgacgcat gattggcacc gacgccttcc aggagacgcc 8160 catcgtcgag gtcacccgct ccatcaccaa gcacaactac ctggtcctcg acgtcgacga 8220 catcccccgc gtcgtgcagg aggctttctt cctcgcctcc tctggtcgac cggggccggt 8280 gcttgtcgac atccccaagg acatccagca gcagatggcg gtgcctgtct gggacaagcc 8340 catgagtctg cctgggtaca ttgcgcgcct tcccaagccc cctgcgactg agttgcttga 8400 gcaggtgctg cgtcttgttg gtgaatcccg gcgccctgtt ctttatgttg gcggtggctg 8460 cgcagcatct ggtgaggagt tgcgacgctt tgtggagctg actggaatcc cggtcacaac 8520 tactcttatg ggcctcggca acttccccag cgacgaccca ctgtctctgc gcatgctagg 8580 tatgcatggc acggtgtatg caaattatgc agtggataag gccgatctgt tgcttgcact 8640 tggtgtgcgg tttgatgatc gtgtgacagg gaagattgag gcttttgcaa gcagggctaa 8700 gattgtgcac gttgatattg atccggctga gattggcaag aacaagcagc cacatgtgtc 8760 catctgtgca gatgttaagc ttgctttgca gggcatgaat gctcttcttg aaggaagcac 8820 atcaaagaag agctttgact ttggctcatg gaacgatgag ttggatcagc agaagaggga 8880 attccccctt gggtataaaa catctaatga ggagatccag ccacaatatg ctattcaggt 8940 tcttgatgag ctgacgaaag gcgaggccat catcggcaca ggtgttgggc agcaccagat 9000 gtgggcggca cagtactaca cttacaagcg gccaaggcag tggttgtctt cagctggtct 9060 tggggctatg ggatttggtt tgccggctgc tgctggtgct tctgtggcca acccaggtgt 9120 tactgttgtt gacatcgatg gagatggtag ctttctcatg aacgttcagg agctagctat 9180 gatccgaatt gagaacctcc cggtgaaggt ctttgtgcta aacaaccagc acctggggat 9240 ggtggtgcag tgggaggaca ggttctataa ggccaacaga gcgcacacat acttgggaaa 9300 cccagagaat gaaagtgaga tatatccaga tttcgtgacg atcgccaaag ggttcaacat 9360 tccagcggtc cgtgtgacaa agaagaacga agtccgcgca gcgataaaga agatgctcga 9420 gactccaggg ccgtacctct tggatataat cgtcccacac caggagcatg tgttgcctat 9480 gatccctaat ggtggggctt tcaaggatat gatcctggat ggtgatggca ggactgtgta 9540 ctagcctgca ggcctaggat cgttcaaaca tttggcaata aagtttctta agattgaatc 9600 ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt aagcatgtaa 9660 taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt agagtcccgc 9720 aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag gataaattat 9780 cgcgcgcggt gtcatctatg ttactagatc ggccggccgt ttaaacagcc tgcttttttg 9840 tacaaacttg atttaaatga attcaagctt ttaattaagc atgcgagctc ggcgcgccgg 9900 taccgcgatc gcggatcatg aaccaacggc ctggctgtat ttggtggttg tgtagggaga 9960 tggggagaag aaaagcccga ttctcttcgc tgtgatgggc tggatgcatg cgggggagcg 10020 ggaggcccaa gtacgtgcac ggtgagcggc ccacagggcg agtgtgagcg cgagaggcgg 10080 gaggaacagt ttagtaccac attgcccagc taactcgaac gcgaccaact tataaacccg 10140 cgcgctgtcg cttgtgtgca ttgagtgcta tgctgaggtt ttagagctag aaatagcaag 10200 ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgctctgttc 10260 ctcgtgctgg acaagtgtgg tttccagatt ctgcaaccaa gactgcgcag gcattgctgg 10320 acttcaaccg tgaaggatta cctctgttca tcctcgctaa ctggagaggc ttctctggtg 10380 gacaaagaga tctctttgaa ggaattcttc aggctggctc gactattgtt gagaacctta 10440 ggacatacaa tcagcctgcc tttgtctaca ttcccatggc tgcagagcta cgaggagggg 10500 cttgggttgt ggttgatagc aagataaacc cagaccgcat tgagtgctat gctgagagaa 10560 ctgcaaaatc caatgttctg gaaccgcaag ggttaattga gatcaagttc aggtcagagg 10620 aactccagga ttgcatgagt cggcttgacc caacattaat tgatctgaaa gcaaaactcg 10680 aagtagcaaa taaaaatgga agtgctgaca caaaatcgct tcaagaaaat atagaagctc 10740 gaacaaaaca gttgatgcct ctatatactc agattgcgat acggtttgct gaattgcatg 10800 atacatccct cagaatggct gcgaaaggtg tgattaagaa agttgtggac tgggaagaat 10860 cacgatcttt cttttttttg cggccgcccc gggcctgcag gggatcccga tcgggccggc 10920 cgtttaaacc cactttgtac aagaaagctg ggtatttaaa tgaattcaag cttttaatta 10980 atgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat tgcatgtcta 11040 agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc agtttatcta 11100 tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt actacaataa 11160 tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa ggacaattga 11220 gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt tctccttttt 11280 ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca tccatttagg 11340 gtttagggtt aatggttttt atagactaat ttttttagta catctatttt attctatttt 11400 agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat agtttagata 11460 taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa 11520 aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga 11580 cgagtctaac ggacaccaac cagcgaacca gcagcgtcgc gtcgggccaa gcgaagcaga 11640 cggcacggca tctctgtcgc tgcctctgga cccctctcga gagttccgct ccaccgttgg 11700 acttgctccg ctgtcggcat ccagaaattg cgtggcggag cggcagacgt gagccggcac 11760 ggcaggcggc ctcctcctcc tctcacggca ccggcagcta cgggggattc ctttcccacc 11820 gctccttcgc tttcccttcc tcgcccgccg taataaatag acaccccctc cacaccctct 11880 ttccccaacc tcgtgttgtt cggagcgcac acacacacaa ccagatctcc cccaaatcca 11940 cccgtcggca cctccgcttc aaggtacgcc gctcgtcctc cccccccccc cccctctcta 12000 ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat 12060 gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg 12120 acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct 12180 gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc 12240 atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg 12300 tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt 12360 tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg 12420 tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat 12480 ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg 12540 ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag 12600 tagaatactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc 12660 atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac 12720 atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat 12780 gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttatttcgat 12840 cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc 12900 ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg 12960 gtgttacttc tgcagggcgc gccaccatgg ctcctaagaa gaagcggaag gttggtattc 13020 acggggtgcc tgcggctgac aagaagtact ccatcggcct cgacatcggc accaacagcg 13080 tcggctgggc ggtgatcacc gacgagtaca aggtcccgtc caagaagttc aaggtcctgg 13140 gcaacaccga ccgccactcc atcaagaaga acctcatcgg cgccctcctc ttcgactccg 13200 gcgagacggc ggaggcgacc cgcctcaagc gcaccgcccg ccgccgctac acccgccgca 13260 agaaccgcat ctgctacctc caggagatct tctccaacga gatggcgaag gtcgacgact 13320 ccttcttcca ccgcctcgag gagtccttcc tcgtggagga ggacaagaag cacgagcgcc 13380 accccatctt cggcaacatc gtcgacgagg tcgcctacca cgagaagtac cccactatct 13440 accaccttcg taagaagctt gttgactcta ctgataaggc tgatcttcgt ctcatctacc 13500 ttgctctcgc tcacatgatc aagttccgtg gtcacttcct tatcgagggt gaccttaacc 13560 ctgataactc cgacgtggac aagctcttca tccagctcgt ccagacctac aaccagctct 13620 tcgaggagaa ccctatcaac gcttccggtg tcgacgctaa ggcgatcctt tccgctaggc 13680 tctccaagtc caggcgtctc gagaacctca tcgcccagct ccctggtgag aagaagaacg 13740 gtcttttcgg taacctcatc gctctctccc tcggtctgac ccctaacttc aagtccaact 13800 tcgacctcgc tgaggacgct aagcttcagc tctccaagga tacctacgac gatgatctcg 13860 acaacctcct cgctcagatt ggagatcagt acgctgatct cttccttgct gctaagaacc 13920 tctccgatgc tatcctcctt tcggatatcc ttagggttaa cactgagatc actaaggctc 13980 ctctttctgc ttccatgatc aagcgctacg acgagcacca ccaggacctc accctcctca 14040 aggctcttgt tcgtcagcag ctccccgaga agtacaagga gatcttcttc gaccagtcca 14100 agaacggcta cgccggttac attgacggtg gagctagcca ggaggagttc tacaagttca 14160 tcaagccaat ccttgagaag atggatggta ctgaggagct tctcgttaag cttaaccgtg 14220 aggacctcct taggaagcag aggactttcg ataacggctc tatccctcac cagatccacc 14280 ttggtgagct tcacgccatc cttcgtaggc aggaggactt ctaccctttc ctcaaggaca 14340 accgtgagaa gatcgagaag atccttactt tccgtattcc ttactacgtt ggtcctcttg 14400 ctcgtggtaa ctcccgtttc gcttggatga ctaggaagtc cgaggagact atcacccctt 14460 ggaacttcga ggaggttgtt gacaagggtg cttccgccca gtccttcatc gagcgcatga 14520 ccaacttcga caagaacctc cccaacgaga aggtcctccc caagcactcc ctcctctacg 14580 agtacttcac ggtctacaac gagctcacca aggtcaagta cgtcaccgag ggtatgcgca 14640 agcctgcctt cctctccggc gagcagaaga aggctatcgt tgacctcctc ttcaagacca 14700 accgcaaggt caccgtcaag cagctcaagg aggactactt caagaagatc gagtgcttcg 14760 actccgtcga gatcagcggc gttgaggacc gtttcaacgc ttctctcggc acctaccacg 14820 atctcctcaa gatcatcaag gacaaggact tcctcgacaa cgaggagaac gaggacatcc 14880 tcgaggacat cgtcctcact cttactctct tcgaggatag ggagatgatc gaggagaggc 14940 tcaagactta cgctcatctc ttcgatgaca aggttatgaa gcagctcaag cgtcgccgtt 15000 acaccggttg gggtaggctc tcccgcaagc tcatcaacgg tatcagggat aagcagagcg 15060 gcaagactat cctcgacttc ctcaagtctg atggtttcgc taacaggaac ttcatgcagc 15120 tcatccacga tgactctctt accttcaagg aggatattca gaaggctcag gtgtccggtc 15180 agggcgactc tctccacgag cacattgcta accttgctgg ttcccctgct atcaagaagg 15240 gcatccttca gactgttaag gttgtcgatg agcttgtcaa ggttatgggt cgtcacaagc 15300 ctgagaacat cgtcatcgag atggctcgtg agaaccagac tacccagaag ggtcagaaga 15360 actcgaggga gcgcatgaag aggattgagg agggtatcaa ggagcttggt tctcagatcc 15420 ttaaggagca ccctgtcgag aacacccagc tccagaacga gaagctctac ctctactacc 15480 tccagaacgg tagggatatg tacgttgacc aggagctcga catcaacagg ctttctgact 15540 acgacgtcga ccacattgtt cctcagtctt tccttaagga tgactccatc gacaacaagg 15600 tcctcacgag gtccgacaag aacaggggta agtcggacaa cgtcccttcc gaggaggttg 15660 tcaagaagat gaagaactac tggaggcagc ttctcaacgc taagctcatt acccagagga 15720 agttcgacaa cctcacgaag gctgagaggg gtggcctttc cgagcttgac aaggctggtt 15780 tcatcaagag gcagcttgtt gagacgaggc agattaccaa gcacgttgct cagatcctcg 15840 attctaggat gaacaccaag tacgacgaga acgacaagct catccgcgag gtcaaggtga 15900 tcaccctcaa gtccaagctc gtctccgact tccgcaagga cttccagttc tacaaggtcc 15960 gcgagatcaa caactaccac cacgctcacg atgcttacct taacgctgtc gttggcaccg 16020 ctcttatcaa gaagtaccct aagcttgagt ccgagttcgt ctacggtgac tacaaggtct 16080 acgacgttcg taagatgatc gccaagtccg agcaggagat cggcaaggcc accgccaagt 16140 acttcttcta ctccaacatc atgaacttct tcaagaccga gatcaccctc gccaacggcg 16200 agatccgcaa gcgccctctt atcgagacga acggtgagac tggtgagatc gtttgggaca 16260 agggtcgcga cttcgctact gttcgcaagg tcctttctat gcctcaggtt aacatcgtca 16320 agaagaccga ggtccagacc ggtggcttct ccaaggagtc tatccttcca aagagaaact 16380 cggacaagct catcgctagg aagaaggatt gggaccctaa gaagtacggt ggtttcgact 16440 cccctactgt cgcctactcc gtcctcgtgg tcgccaaggt ggagaagggt aagtcgaaga 16500 agctcaagtc cgtcaaggag ctcctcggca tcaccatcat ggagcgctcc tccttcgaga 16560 agaacccgat cgacttcctc gaggccaagg gctacaagga ggtcaagaag gacctcatca 16620 tcaagctccc caagtactct cttttcgagc tcgagaacgg tcgtaagagg atgctggctt 16680 ccgctggtga gctccagaag ggtaacgagc ttgctcttcc ttccaagtac gtgaacttcc 16740 tctacctcgc ctcccactac gagaagctca agggttcccc tgaggataac gagcagaagc 16800 agctcttcgt ggagcagcac aagcactacc tcgacgagat catcgagcag atctccgagt 16860 tctccaagcg cgtcatcctc gctgacgcta acctcgacaa ggtcctctcc gcctacaaca 16920 agcaccgcga caagcccatc cgcgagcagg ccgagaacat catccacctc ttcacgctca 16980 cgaacctcgg cgcccctgct gctttcaagt acttcgacac caccatcgac aggaagcgtt 17040 acacgtccac caaggaggtt ctcgacgcta ctctcatcca ccagtccatc accggtcttt 17100 acgagactcg tatcgacctt tcccagcttg gtggtgataa gcgtcctgct gccaccaaaa 17160 aggccggaca ggctaagaaa aagaagtagc ctgcaggtcc tgctttaatg agatatgcga 17220 gacgcctatg atcgcatgat atttgctttc aattctgttg tgcacgttgt aaaaaacctg 17280 agcatgtgta gctcagatcc ttaccgccgg tttcggttca ttctaatgaa tatatcaccc 17340 gttactatcg tatttttatg aataatattc tccgttcaat ttactgattg taccctacta 17400 cttatatgta caatattaaa atgaaaacaa tatattgtgc tgaataggtt tatagcgaca 17460 tctatgatag agcgccacaa taacaaacaa ttgcgtttta ttattacaaa tccaatttta 17520 aaaaaagcgg cagaaccggt caaacctaaa agactgatta cataaatctt attcaaattt 17580 caaaagtgcc ccaggggcta gtatctacga cacaccgagc ggcgaactaa taacgctcac 17640 tgaagggaac tccggttccc cgccggcgcg catgggtgag attccttgaa gttgagtatt 17700 ggccgtccgc tctaccgaaa gttacgggca ccattcaacc cggtccagca cggcggccgg 17760 gtaaccgact tgctgccccg agaattatgc agcatttttt tggtgtatgt gggccccaaa 17820 tgaagtgcag gtcaaacctt gacagtgacg acaaatcgtt gggcgggtcc agggcgaatt 17880 ttgcgacaac atgtcgaggc tcagcaggcc ggccgtttaa accaacttta 17930 <210> 67 <211> 3734 <212> DNA <213> Artificial Sequence <220> <223> Vector CC019 <400> 67 cgcggatcat gaaccaacgg cctggctgta tttggtggtt gtgtagggag atggggagaa 60 gaaaagcccg attctcttcg ctgtgatggg ctggatgcat gcgggggagc gggaggccca 120 agtacgtgca cggtgagcgg cccacagggc gagtgtgagc gcgagaggcg ggaggaacag 180 tttagtacca cattgcccag ctaactcgaa cgcgaccaac ttataaaccc gcgcgctgtc 240 gcttgtgtga ctgcaaaagg caatgttcgt tttagagcta gaaatagcaa gttaaaataa 300 ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctctgtt cctcgtgctg 360 gacaagtgtg gtttccagat tctgcaacca agactgcgca ggcattgctg gacttcaacc 420 gtgaaggatt acctctgttc atcctcgcta actggagagg cttctctggt ggacaaagag 480 atctctttga aggaattctt caggctggct cgactattgt tgagaacctt aggacataca 540 atcagcctgc ctttgtctac attcccatgg ctgcagagct acgaggaggg gcttgggttg 600 tggttgatag caagataaac ccagaccgca ttgagtgcta tgctgagagg actgcaaaat 660 ccaatgttct cgaaccgcaa gggttaattg agatcaagtt caggtcagag gaactccagg 720 attgcatgag tcggcttgac ccaacattaa ttgatctgaa agcaaaactc gaagtagcaa 780 ataaaaatgg aagtgctgac acaaaatcgc ttcaagaaaa tatagaagct cgaacaaaac 840 agttgatgcc tctatatact cagattgcga tacggtttgc tgaattgcat gatacatccc 900 tcagaatggc tgcgaaaggt gtgattaaga aagttgtgga ctgggaagaa tcacgatctt 960 tctttttttt gcggccgccc cgggcctgca ggggatcccg atcgggccgg ccgtttaaac 1020 ccactttgta caagaaagtt gaacgagaaa cgtaaaatga tataaatatc aatatattaa 1080 attagatttt gcataaaaaa cagactacat aatactgtaa aacacaacat atgcagtcac 1140 tatgaaccaa ctacttagat ggtattagtg acctgtactg ggcctcatgg gccttccgct 1200 cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaacat ggtcatagct 1260 gtttccttgc gtattgggcg ctctccgctt cctcgctcac tgactcgctg cgctcggtcg 1320 ttcgggtaaa gcctggggtg cctaatgagc aaaaggccag caaaaggcca ggaaccgtaa 1380 aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 1440 tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 1500 ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 1560 cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 1620 ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 1680 ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 1740 gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 1800 agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg 1860 cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 1920 aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 1980 aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 2040 ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 2100 aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 2160 ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 2220 agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 2280 cagtgctgca atgataccgc gagaaccacg ctcaccggct ccagatttat cagcaataaa 2340 ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 2400 gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 2460 cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 2520 cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 2580 ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 2640 catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 2700 tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 2760 ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 2820 catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 2880 cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 2940 cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 3000 acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 3060 ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 3120 tccgcgcaca tttccccgaa aagtgccacc taaattgtaa gcgttaatat tttgttaaaa 3180 ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa 3240 atcccttata aatcaaaaga atagaccgag atagggttga gtggccgcta cagggcgctc 3300 ccattcgcca ttcaggctgc gcaactgttg ggaagggcgt ttcggtgcgg gcctcttcgc 3360 tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 3420 ggttttccca gtcacgacgt tgtaaaacga cggccagtga gcgcgacgta atacgactca 3480 ctatagggcg aattggcgga aggccgtcaa ggccgcatta caggtcacta ataccatcta 3540 agtagttggt tcatagtgac tgcatatgtt gtgttttaca gtattatgta gtctgttttt 3600 tatgcaaaat ctaatttaat atattgatat ttatatcatt ttacgtttct cgttcaactt 3660 ttttgtacaa acttgattta aatgaattca agcttttaat taagcatgcg agctcggcgc 3720 gccggtaccg cgat 3734 <210> 68 <211> 17930 <212> DNA <213> Artificial Sequence <220> <223> Vector RLW138 <400> 68 ttatacatag ttgataattc actgggccgg ccgtttaaac ttagttacta atcagtgatc 60 agattgtcgt ttcccgcctt cactttaaac tatcagtgtt tgacaggata tattggcggg 120 taaacctaag agaaaagagc gtttattaga ataatcggat atttaaaagg gcgtgaaaag 180 gtttatccgt tcgtccattt gtatgtcaat attggggggg ggggaaagcc acgttgtgtc 240 tcaaaatctc tgatgttaca ttgcacaaga taaaaatata tcatcatgaa caataaaact 300 gtctgcttac ataaacagta atacaagggg tgttcgccac catgagccat atccagcgtg 360 aaacctcgtg ctcccgcccg cgcctcaatt ccaatatgga tgccgacctt tatggctaca 420 agtgggcgcg cgacaacgtc ggccagtcgg gcgcgaccat ttatcggctt tatggcaaac 480 ccgatgcccc ggaactgttc ctgaagcacg gcaaaggcag cgtcgcaaac gatgtcaccg 540 atgagatggt ccgcctgaac tggcttaccg agttcatgcc gctgccgacg attaagcatt 600 tcatccgtac cccggacgat gcctggctct tgaccacggc cattccgggc aaaacggcct 660 ttcaggtcct tgaagagtac ccggactccg gtgagaatat cgtggacgcc ctcgcggtct 720 tcctccgccg tttgcatagc atccccgtgt gcaactgccc cttcaactcg gaccgggttt 780 tccgcctggc acaggcccag tcgcgcatga ataacggcct cgttgacgcg agcgatttcg 840 acgatgaacg gaatggctgg ccggtggaac aggtttggaa ggaaatgcac aaactgcttc 900 cgttctcgcc ggattcggtg gtcacgcatg gtgatttttc cctggataat ctgatctttg 960 acgagggcaa gctgatcggc tgcatcgacg tgggtcgcgt cggtatcgcc gaccgctatc 1020 aggacctggc gatcttgtgg aattgcctcg gcgagttctc gccctcgctc cagaagcgcc 1080 tgttccagaa gtacggcatc gacaacccgg atatgaacaa gctccagttc cacctcatgc 1140 tggacgaatt tttttgaaca gaattggtta attggttgta acactggcag agcattacgc 1200 tgacttgacg ggacggcggc tttgttgaat aaatcgaact tttgctgagt tgaaggatcg 1260 atgagttgaa ggaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc 1320 gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg 1380 atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa 1440 atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc 1500 ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt 1560 gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa 1620 cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc 1680 tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc 1740 cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct 1800 ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat 1860 gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc 1920 tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg 1980 ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc 2040 gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc 2100 atctgtgcgg tatttcacac cgcataggcc gcgataggcc gacgcgaagc ggcggggcgt 2160 agggagcgca gcgaccgaag ggtaggcgct ttttgcagct cttcggctgt gcgctggcca 2220 gacagttatg cacaggccag gcgggtttta agagttttaa taagttttaa agagttttag 2280 gcggaaaaat cgcctttttt ctcttttata tcagtcactt acatgtgtga ccggttccca 2340 atgtacggct ttgggttccc aatgtacggg ttccggttcc caatgtacgg ctttgggttc 2400 ccaatgtacg tgctatccac aggaaagaga ccttttcgac ctttttcccc tgctagggca 2460 atttgcccta gcatctgctc cgtacattag gaaccggcgg atgcttcgcc ctcgatcagg 2520 ttgcggtagc gcatgactag gatcgggcca gcctgccccg cctcctcctt caaatcgtac 2580 tccggcaggt catttgaccc gatcagcttg cgcacggtga aacagaactt cttgaactct 2640 ccggcgctgc cactgcgttc gtagatcgtc ttgaacaacc atctggcttc tgccttgcct 2700 gcggcgcggc gtgccaggcg gtagagaaaa cggccgatgc cggggtcgat caaaaagtaa 2760 tcggggtgaa ccgtcagcac gtccgggttc ttgccttctg tgatctcgcg gtacatccaa 2820 tcagcaagct cgatctcgat gtactccggc cgcccggttt cgctctttac gatcttgtag 2880 cggctaatca aggcttcacc ctcggatacc gtcaccaggc ggccgttctt ggccttcttg 2940 gtacgctgca tggcaacgtg cgtggtgttt aaccgaatgc aggtttctac caggtcgtct 3000 ttctgctttc cgccatcggc tcgccggcag aacttgagta cgtccgcaac gtgtggacgg 3060 aacacgcggc cgggcttgtc tcccttccct tcccggtatc ggttcatgga ttcggttaga 3120 tgggaaaccg ccatcagtac caggtcgtaa tcccacacac tggccatgcc ggcggggcct 3180 gcggaaacct ctacgtgccc gtctggaagc tcgtagcgga tcacctcgcc agctcgtcgg 3240 tcacgcttcg acagacggaa aacggccacg tccatgatgc tgcgactatc gcgggtgccc 3300 acgtcataga gcatcggaac gaaaaaatct ggttgctcgt cgcccttggg cggcttccta 3360 atcgacggcg caccggctgc cggcggttgc cgggattctt tgcggattcg atcagcggcc 3420 ccttgccacg attcaccggg gcgtgcttct gcctcgatgc gttgccgctg ggcggcctgc 3480 gcggccttca acttctccac caggtcatca cccagcgccg cgccgatttg taccgggccg 3540 gatggtttgc gaccgctcac gccgattcct cgggcttggg ggttccagtg ccattgcagg 3600 gccggcagac aacccagccg cttacgcctg gccaaccgcc cgttcctcca cacatggggc 3660 attccacggc gtcggtgcct ggttgttctt gattttccat gccgcctcct ttagccgcta 3720 aaattcatct actcatttat tcatttgctc atttactctg gtagctgcgc gatgtattca 3780 gatagcagct cggtaatggt cttgccttgg cgtaccgcgt acatcttcag cttggtgtga 3840 tcctccgccg gcaactgaaa gttgacccgc ttcatggctg gcgtgtctgc caggctggcc 3900 aacgttgcag ccttgctgct gcgtgcgctc ggacggccgg cacttagcgt gtttgtgctt 3960 ttgctcattt tctctttacc tcattaactc aaatgagttt tgatttaatt tcagcggcca 4020 gcgcctggac ctcgcgggca gcgtcgccct cgggttctga ttcaagaacg gttgtgccgg 4080 cggcggcagt gcctgggtag ctcacgcgct gcgtgatacg ggactcaaga atgggcagct 4140 cgtacccggc cagcgcctcg gcaacctcac cgccgatgcg cgtgcctttg atcgcccgcg 4200 acacgacaaa ggccgcttgt agccttccat ccgtgacctc aatgcgctgc ttaaccagct 4260 ccaccaggtc ggcggtggcc caaatgtcgt aagggcttgg ctgcaccgga atcagcacga 4320 agtcggctgc cttgatcgcg gacacagcca agtccgccgc ctggggcgct ccgtcgatca 4380 ctacgaagtc gcgccggccg atggccttca cgtcgcggtc aatcgtcggg cggtcgatgc 4440 cgacaacggt tagcggttga tcttcccgca cggccgccca atcgcgggca ctgccctggg 4500 gatcggaatc gactaacaga acatcggccc cggcgagttg cagggcgcgg gctagatggg 4560 ttgcgatggt cgtcttgcct gacccgcctt tctggttaag tacagcgata accttcatgc 4620 gttccccttg cgtatttgtt tatttactca tcgcatcata tacgcagcga ccgcatgacg 4680 caagctgttt tactcaaata cacatcacct ttttagatga tcagtgattt tgtgccgagc 4740 tgccggtcgg ggagctgttg gctggctggt ggcaggatat attgtggtgt aaacaaattg 4800 acgcttagac aacttaataa cacattgcgg acgtctttaa tgtactgaat ttagttactg 4860 atcactgatt aagtactgat aaatttaatt aacagatctc aactttgtat agaaaagttg 4920 atttaaatga attcaagctt ttaattaact tagccactgc aacaagttct tgaaccttag 4980 cacaatcata ttgtgcatgc acttgtttat tgcaaagaat ggtgcgtagg gaacacgcat 5040 gatttttgaa ttgctggcac ataattttat cattagaaac tggaatgcaa catgtaccct 5100 ttgtcatggt ttctttccga gacattgcac tgtttttttt aatcctatca ttatcataat 5160 gccaagaact ggtcaccaac cagcattttg catcatggtt agttgagctg tccccatgta 5220 tcaataggtg cattgtattg gtccaaaata taaatgcagt ggatgcaacc tatctcatgg 5280 ccgtcaacaa aagaaatcaa aagggaaatg caccatctta tatctccagt ttatatgaac 5340 agattggata agatcataag atcaagtggt ttatattatt ttgaggaata taacatggat 5400 tcatcctaat cactcgtcta ggcagtatgt gtattcatga tggatatggt actatactac 5460 ggagtttttt cttcacaaaa taacctgtta ttttgacctc caaccaaaca cgaattatac 5520 caaaaattgg gttatttcat ctatagtaca actctattat aaacatgcag taaattatcc 5580 tacacatata ccaaaattca agtgtaataa tcctaataca cagacttaaa aaacaaacta 5640 tttccttttt aagaaaagga aaaccatttt tttaacggaa ggaaaacaaa ttcgggtcaa 5700 ggcggaagcc agcgcgccac cccacgtcag cgaatacgga ggcgcggggt tgacggcgtc 5760 acccggtcct aacggcgacc aacaaaccag ccagaagaaa ttacagtaaa aaaaagtaaa 5820 ttgcactttg atccaccttt tattacccaa gtttcaattt ggaccaccct taaacctatc 5880 ttttcaaatt gggccgggtt gtggtttgga ctaccatgaa caacttttcg tcatgtctaa 5940 cttccctttc ggcaaacata tgaaccatat atagaggaga tcggccgtat actagagctg 6000 atgtgtttaa ggtcgttgat tgcacgagaa aaaaaaaatc caaatcgcaa caatagcaaa 6060 tttatctagt tcaaagtgaa aagatatgtt taaaggtagt ccaaagtaaa acttaggggc 6120 tgtttggttc ccagccatac tttaccatta cttgccaaca aaagttgcca caccttgtct 6180 aaggtgaggt gatcaaattg ttagccacaa cttactaagc ctaagggaat cttgccacac 6240 ttttttgagc cattgacacg tgggacttaa tttgttagag ggaaatcttg ccacaactgt 6300 ggctacaacc aaacacctgt caaatttgcc taaccttagg cgtggcaaac tgtggcaaag 6360 tgtggcttac aaccaaacac acccttagat aataaaatgt ggtccaaagc gtaattcact 6420 aaaaaaaaat caacgagacg tgtaccaaac ggagacaaac ggcatcttct cgaaatttcc 6480 caaccgctcg ctcgcccgcc tcgtcttccc ggaaaccgcg gtggtttcag cgtggcggat 6540 tctccaagca gacggagacg tcacggcacg ggactcctcc caccacccaa ccgccataaa 6600 taccagcccc ctcatctcct ctcctcgcat cagctccacc cccgaaaaat ttctccccaa 6660 tctcgcgagg ctctcgtcgt cgaatcgaat cctctcgcgt cctcaagctt ggcatccagg 6720 tacggatccg cgtcccatct ccctcacccc ccgtgttctt cgtgcctgct tctgggtcag 6780 atctgggtgg attcgcggtt gttggatgtg gggggctgtg tttatttgtc ggtggatctg 6840 gttgtctgga tctgcgtttt ctctgtcgta gttagcggat ctgatgaaat gtttagtgtt 6900 cgtgtatact ggtatggtgg atctggtcct aggatgcgtg gaatggatat atgtaggcga 6960 attggaggat ttattttgtg aattttgctg aaatgatagt tctaaacact ggatctgacc 7020 tcgggatgct gttaaatgtg gaaatcatgg tcgatgctgt catgaacatg gtgttcttat 7080 ggtagatctg agcaatgtat gtttcaaaat tgtttgtcac atggaaatgc tatggttcta 7140 gatgcaatag aatgatacat gccgagatcc cctctagttg atatgataga tcatgatgtt 7200 ttacagctat gtcatatgaa tatgttcatt tgttaccgat gtatttggat ctacttaaca 7260 tttccaaagc acgccgcgtt ctaattctag atctggtagt catgtttgta cacgtcaccc 7320 acctaataca aatacatatg tctagtgttt ggtgacactg cccgtcagat ctgttttttc 7380 cagatctgtg gaacaaatac tccacgcatg tatggtagtt ttgaaacgat cttgtatctt 7440 ccattgttgt agtaacaact aaataaagta caattgttca attattggga atcgtatttt 7500 ctgtagtgcc gatgtacagc atattcatag atgtctattt aggaactcaa attttaaatt 7560 gaggactagt tatttattgt gggtcagtct tttgaattgt gttatcttgc tgtactggcg 7620 cgccaccatg gccaccgccg ccgccgcgtc taccgcgctc actggcgcca ctaccgctgc 7680 gcccaaggcg aggcgccggg cgcacctcct ggccacccgc cgcgccctcg ccgcgcccat 7740 caggtgctca gcggcgtcac ccgccatgcc gatggctccc ccggccaccc cgctccggcc 7800 gtggggcccc accgatcccc gcaagggcgc cgacatcctc gtcgagtccc tcgagcgctg 7860 cggcgtccgc gacgtcttcg cctaccccgg cggcacgtcc atggagatcc accaggcact 7920 cacccgctcc cccgtcatcg ccaaccacct cttccgccac gagcaagggg aggcctttgc 7980 ggcctccggc tacgcgcgct cctcgggccg cgtcggcgtc tgcatcgcca cctccggccc 8040 cggcgccacc aaccttgtct ccgcgctcgc cgacgcgctg ctcgattccg tccccatggt 8100 cgccatcacg ggacaggtgc cgcgacgcat gattggcacc gacgccttcc aggagacgcc 8160 catcgtcgag gtcacccgct ccatcaccaa gcacaactac ctggtcctcg acgtcgacga 8220 catcccccgc gtcgtgcagg aggctttctt cctcgcctcc tctggtcgac cggggccggt 8280 gcttgtcgac atccccaagg acatccagca gcagatggcg gtgcctgtct gggacaagcc 8340 catgagtctg cctgggtaca ttgcgcgcct tcccaagccc cctgcgactg agttgcttga 8400 gcaggtgctg cgtcttgttg gtgaatcccg gcgccctgtt ctttatgttg gcggtggctg 8460 cgcagcatct ggtgaggagt tgcgacgctt tgtggagctg actggaatcc cggtcacaac 8520 tactcttatg ggcctcggca acttccccag cgacgaccca ctgtctctgc gcatgctagg 8580 tatgcatggc acggtgtatg caaattatgc agtggataag gccgatctgt tgcttgcact 8640 tggtgtgcgg tttgatgatc gtgtgacagg gaagattgag gcttttgcaa gcagggctaa 8700 gattgtgcac gttgatattg atccggctga gattggcaag aacaagcagc cacatgtgtc 8760 catctgtgca gatgttaagc ttgctttgca gggcatgaat gctcttcttg aaggaagcac 8820 atcaaagaag agctttgact ttggctcatg gaacgatgag ttggatcagc agaagaggga 8880 attccccctt gggtataaaa catctaatga ggagatccag ccacaatatg ctattcaggt 8940 tcttgatgag ctgacgaaag gcgaggccat catcggcaca ggtgttgggc agcaccagat 9000 gtgggcggca cagtactaca cttacaagcg gccaaggcag tggttgtctt cagctggtct 9060 tggggctatg ggatttggtt tgccggctgc tgctggtgct tctgtggcca acccaggtgt 9120 tactgttgtt gacatcgatg gagatggtag ctttctcatg aacgttcagg agctagctat 9180 gatccgaatt gagaacctcc cggtgaaggt ctttgtgcta aacaaccagc acctggggat 9240 ggtggtgcag tgggaggaca ggttctataa ggccaacaga gcgcacacat acttgggaaa 9300 cccagagaat gaaagtgaga tatatccaga tttcgtgacg atcgccaaag ggttcaacat 9360 tccagcggtc cgtgtgacaa agaagaacga agtccgcgca gcgataaaga agatgctcga 9420 gactccaggg ccgtacctct tggatataat cgtcccacac caggagcatg tgttgcctat 9480 gatccctaat ggtggggctt tcaaggatat gatcctggat ggtgatggca ggactgtgta 9540 ctagcctgca ggcctaggat cgttcaaaca tttggcaata aagtttctta agattgaatc 9600 ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt aagcatgtaa 9660 taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt agagtcccgc 9720 aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag gataaattat 9780 cgcgcgcggt gtcatctatg ttactagatc ggccggccgt ttaaacagcc tgcttttttg 9840 tacaaacttg atttaaatga attcaagctt ttaattaagc atgcgagctc ggcgcgccgg 9900 taccgcgatc gcggatcatg aaccaacggc ctggctgtat ttggtggttg tgtagggaga 9960 tggggagaag aaaagcccga ttctcttcgc tgtgatgggc tggatgcatg cgggggagcg 10020 ggaggcccaa gtacgtgcac ggtgagcggc ccacagggcg agtgtgagcg cgagaggcgg 10080 gaggaacagt ttagtaccac attgcccagc taactcgaac gcgaccaact tataaacccg 10140 cgcgctgtcg cttgtgtgac tgcaaaaggc aatgttcgtt ttagagctag aaatagcaag 10200 ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgctctgttc 10260 ctcgtgctgg acaagtgtgg tttccagatt ctgcaaccaa gactgcgcag gcattgctgg 10320 acttcaaccg tgaaggatta cctctgttca tcctcgctaa ctggagaggc ttctctggtg 10380 gacaaagaga tctctttgaa ggaattcttc aggctggctc gactattgtt gagaacctta 10440 ggacatacaa tcagcctgcc tttgtctaca ttcccatggc tgcagagcta cgaggagggg 10500 cttgggttgt ggttgatagc aagataaacc cagaccgcat tgagtgctat gctgagagga 10560 ctgcaaaatc caatgttctc gaaccgcaag ggttaattga gatcaagttc aggtcagagg 10620 aactccagga ttgcatgagt cggcttgacc caacattaat tgatctgaaa gcaaaactcg 10680 aagtagcaaa taaaaatgga agtgctgaca caaaatcgct tcaagaaaat atagaagctc 10740 gaacaaaaca gttgatgcct ctatatactc agattgcgat acggtttgct gaattgcatg 10800 atacatccct cagaatggct gcgaaaggtg tgattaagaa agttgtggac tgggaagaat 10860 cacgatcttt cttttttttg cggccgcccc gggcctgcag gggatcccga tcgggccggc 10920 cgtttaaacc cactttgtac aagaaagctg ggtatttaaa tgaattcaag cttttaatta 10980 atgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat tgcatgtcta 11040 agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc agtttatcta 11100 tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt actacaataa 11160 tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa ggacaattga 11220 gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt tctccttttt 11280 ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca tccatttagg 11340 gtttagggtt aatggttttt atagactaat ttttttagta catctatttt attctatttt 11400 agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat agtttagata 11460 taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa 11520 aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga 11580 cgagtctaac ggacaccaac cagcgaacca gcagcgtcgc gtcgggccaa gcgaagcaga 11640 cggcacggca tctctgtcgc tgcctctgga cccctctcga gagttccgct ccaccgttgg 11700 acttgctccg ctgtcggcat ccagaaattg cgtggcggag cggcagacgt gagccggcac 11760 ggcaggcggc ctcctcctcc tctcacggca ccggcagcta cgggggattc ctttcccacc 11820 gctccttcgc tttcccttcc tcgcccgccg taataaatag acaccccctc cacaccctct 11880 ttccccaacc tcgtgttgtt cggagcgcac acacacacaa ccagatctcc cccaaatcca 11940 cccgtcggca cctccgcttc aaggtacgcc gctcgtcctc cccccccccc cccctctcta 12000 ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat 12060 gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg 12120 acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct 12180 gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc 12240 atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg 12300 tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt 12360 tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg 12420 tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat 12480 ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg 12540 ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag 12600 tagaatactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc 12660 atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac 12720 atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat 12780 gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttatttcgat 12840 cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc 12900 ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg 12960 gtgttacttc tgcagggcgc gccaccatgg ctcctaagaa gaagcggaag gttggtattc 13020 acggggtgcc tgcggctgac aagaagtact ccatcggcct cgacatcggc accaacagcg 13080 tcggctgggc ggtgatcacc gacgagtaca aggtcccgtc caagaagttc aaggtcctgg 13140 gcaacaccga ccgccactcc atcaagaaga acctcatcgg cgccctcctc ttcgactccg 13200 gcgagacggc ggaggcgacc cgcctcaagc gcaccgcccg ccgccgctac acccgccgca 13260 agaaccgcat ctgctacctc caggagatct tctccaacga gatggcgaag gtcgacgact 13320 ccttcttcca ccgcctcgag gagtccttcc tcgtggagga ggacaagaag cacgagcgcc 13380 accccatctt cggcaacatc gtcgacgagg tcgcctacca cgagaagtac cccactatct 13440 accaccttcg taagaagctt gttgactcta ctgataaggc tgatcttcgt ctcatctacc 13500 ttgctctcgc tcacatgatc aagttccgtg gtcacttcct tatcgagggt gaccttaacc 13560 ctgataactc cgacgtggac aagctcttca tccagctcgt ccagacctac aaccagctct 13620 tcgaggagaa ccctatcaac gcttccggtg tcgacgctaa ggcgatcctt tccgctaggc 13680 tctccaagtc caggcgtctc gagaacctca tcgcccagct ccctggtgag aagaagaacg 13740 gtcttttcgg taacctcatc gctctctccc tcggtctgac ccctaacttc aagtccaact 13800 tcgacctcgc tgaggacgct aagcttcagc tctccaagga tacctacgac gatgatctcg 13860 acaacctcct cgctcagatt ggagatcagt acgctgatct cttccttgct gctaagaacc 13920 tctccgatgc tatcctcctt tcggatatcc ttagggttaa cactgagatc actaaggctc 13980 ctctttctgc ttccatgatc aagcgctacg acgagcacca ccaggacctc accctcctca 14040 aggctcttgt tcgtcagcag ctccccgaga agtacaagga gatcttcttc gaccagtcca 14100 agaacggcta cgccggttac attgacggtg gagctagcca ggaggagttc tacaagttca 14160 tcaagccaat ccttgagaag atggatggta ctgaggagct tctcgttaag cttaaccgtg 14220 aggacctcct taggaagcag aggactttcg ataacggctc tatccctcac cagatccacc 14280 ttggtgagct tcacgccatc cttcgtaggc aggaggactt ctaccctttc ctcaaggaca 14340 accgtgagaa gatcgagaag atccttactt tccgtattcc ttactacgtt ggtcctcttg 14400 ctcgtggtaa ctcccgtttc gcttggatga ctaggaagtc cgaggagact atcacccctt 14460 ggaacttcga ggaggttgtt gacaagggtg cttccgccca gtccttcatc gagcgcatga 14520 ccaacttcga caagaacctc cccaacgaga aggtcctccc caagcactcc ctcctctacg 14580 agtacttcac ggtctacaac gagctcacca aggtcaagta cgtcaccgag ggtatgcgca 14640 agcctgcctt cctctccggc gagcagaaga aggctatcgt tgacctcctc ttcaagacca 14700 accgcaaggt caccgtcaag cagctcaagg aggactactt caagaagatc gagtgcttcg 14760 actccgtcga gatcagcggc gttgaggacc gtttcaacgc ttctctcggc acctaccacg 14820 atctcctcaa gatcatcaag gacaaggact tcctcgacaa cgaggagaac gaggacatcc 14880 tcgaggacat cgtcctcact cttactctct tcgaggatag ggagatgatc gaggagaggc 14940 tcaagactta cgctcatctc ttcgatgaca aggttatgaa gcagctcaag cgtcgccgtt 15000 acaccggttg gggtaggctc tcccgcaagc tcatcaacgg tatcagggat aagcagagcg 15060 gcaagactat cctcgacttc ctcaagtctg atggtttcgc taacaggaac ttcatgcagc 15120 tcatccacga tgactctctt accttcaagg aggatattca gaaggctcag gtgtccggtc 15180 agggcgactc tctccacgag cacattgcta accttgctgg ttcccctgct atcaagaagg 15240 gcatccttca gactgttaag gttgtcgatg agcttgtcaa ggttatgggt cgtcacaagc 15300 ctgagaacat cgtcatcgag atggctcgtg agaaccagac tacccagaag ggtcagaaga 15360 actcgaggga gcgcatgaag aggattgagg agggtatcaa ggagcttggt tctcagatcc 15420 ttaaggagca ccctgtcgag aacacccagc tccagaacga gaagctctac ctctactacc 15480 tccagaacgg tagggatatg tacgttgacc aggagctcga catcaacagg ctttctgact 15540 acgacgtcga ccacattgtt cctcagtctt tccttaagga tgactccatc gacaacaagg 15600 tcctcacgag gtccgacaag aacaggggta agtcggacaa cgtcccttcc gaggaggttg 15660 tcaagaagat gaagaactac tggaggcagc ttctcaacgc taagctcatt acccagagga 15720 agttcgacaa cctcacgaag gctgagaggg gtggcctttc cgagcttgac aaggctggtt 15780 tcatcaagag gcagcttgtt gagacgaggc agattaccaa gcacgttgct cagatcctcg 15840 attctaggat gaacaccaag tacgacgaga acgacaagct catccgcgag gtcaaggtga 15900 tcaccctcaa gtccaagctc gtctccgact tccgcaagga cttccagttc tacaaggtcc 15960 gcgagatcaa caactaccac cacgctcacg atgcttacct taacgctgtc gttggcaccg 16020 ctcttatcaa gaagtaccct aagcttgagt ccgagttcgt ctacggtgac tacaaggtct 16080 acgacgttcg taagatgatc gccaagtccg agcaggagat cggcaaggcc accgccaagt 16140 acttcttcta ctccaacatc atgaacttct tcaagaccga gatcaccctc gccaacggcg 16200 agatccgcaa gcgccctctt atcgagacga acggtgagac tggtgagatc gtttgggaca 16260 agggtcgcga cttcgctact gttcgcaagg tcctttctat gcctcaggtt aacatcgtca 16320 agaagaccga ggtccagacc ggtggcttct ccaaggagtc tatccttcca aagagaaact 16380 cggacaagct catcgctagg aagaaggatt gggaccctaa gaagtacggt ggtttcgact 16440 cccctactgt cgcctactcc gtcctcgtgg tcgccaaggt ggagaagggt aagtcgaaga 16500 agctcaagtc cgtcaaggag ctcctcggca tcaccatcat ggagcgctcc tccttcgaga 16560 agaacccgat cgacttcctc gaggccaagg gctacaagga ggtcaagaag gacctcatca 16620 tcaagctccc caagtactct cttttcgagc tcgagaacgg tcgtaagagg atgctggctt 16680 ccgctggtga gctccagaag ggtaacgagc ttgctcttcc ttccaagtac gtgaacttcc 16740 tctacctcgc ctcccactac gagaagctca agggttcccc tgaggataac gagcagaagc 16800 agctcttcgt ggagcagcac aagcactacc tcgacgagat catcgagcag atctccgagt 16860 tctccaagcg cgtcatcctc gctgacgcta acctcgacaa ggtcctctcc gcctacaaca 16920 agcaccgcga caagcccatc cgcgagcagg ccgagaacat catccacctc ttcacgctca 16980 cgaacctcgg cgcccctgct gctttcaagt acttcgacac caccatcgac aggaagcgtt 17040 acacgtccac caaggaggtt ctcgacgcta ctctcatcca ccagtccatc accggtcttt 17100 acgagactcg tatcgacctt tcccagcttg gtggtgataa gcgtcctgct gccaccaaaa 17160 aggccggaca ggctaagaaa aagaagtagc ctgcaggtcc tgctttaatg agatatgcga 17220 gacgcctatg atcgcatgat atttgctttc aattctgttg tgcacgttgt aaaaaacctg 17280 agcatgtgta gctcagatcc ttaccgccgg tttcggttca ttctaatgaa tatatcaccc 17340 gttactatcg tatttttatg aataatattc tccgttcaat ttactgattg taccctacta 17400 cttatatgta caatattaaa atgaaaacaa tatattgtgc tgaataggtt tatagcgaca 17460 tctatgatag agcgccacaa taacaaacaa ttgcgtttta ttattacaaa tccaatttta 17520 aaaaaagcgg cagaaccggt caaacctaaa agactgatta cataaatctt attcaaattt 17580 caaaagtgcc ccaggggcta gtatctacga cacaccgagc ggcgaactaa taacgctcac 17640 tgaagggaac tccggttccc cgccggcgcg catgggtgag attccttgaa gttgagtatt 17700 ggccgtccgc tctaccgaaa gttacgggca ccattcaacc cggtccagca cggcggccgg 17760 gtaaccgact tgctgccccg agaattatgc agcatttttt tggtgtatgt gggccccaaa 17820 tgaagtgcag gtcaaacctt gacagtgacg acaaatcgtt gggcgggtcc agggcgaatt 17880 ttgcgacaac atgtcgaggc tcagcaggcc ggccgtttaa accaacttta 17930 <210> 69 <211> 3755 <212> DNA <213> Artificial Sequence <220> <223> Vector CC020 <400> 69 cgcggatcat gaaccaacgg cctggctgta tttggtggtt gtgtagggag atggggagaa 60 gaaaagcccg attctcttcg ctgtgatggg ctggatgcat gcgggggagc gggaggccca 120 agtacgtgca cggtgagcgg cccacagggc gagtgtgagc gcgagaggcg ggaggaacag 180 tttagtacca cattgcccag ctaactcgaa cgcgaccaac ttataaaccc gcgcgctgtc 240 gcttgtgtgt gggttattga ttctgttggt tttagagcta gaaatagcaa gttaaaataa 300 ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgcattacg ttcagagctg 360 gatcatttgg cccaagggaa gatgcattct ttgaagctgt taccaaccta gcctgtgaga 420 agaaacttcc tcttatttat ttggcagcaa attctggtgc tcgaattggc atagcagatg 480 aagtgaaatc ttgcttccgt gttgggtggt ctgatgatgg cagccctgaa cgtgggtttc 540 agtacattta tctaagcgaa gaagactatg ctcgtattgg cacttctgtc atagcacata 600 agatgcagct agacagtggt gaaattaggt gggttattga ttctgttgtc ggcaaggaag 660 atggacttgg tgtggagaat ctccatggaa gtgctgctat tgccagtgct tattctaggg 720 catataagga gacatttaca cttacatttg tgactggaag aactgttgga ataggagctt 780 atcttgctcg acttggcatc cggtgcatac agcgtcttga ccagcctatt attcttacag 840 gctattctgc actgaacaag cttcttgggc gggaagtgta cagctcccac atgcagttgg 900 gtggtcccaa aatcatggca actaatggtg ttgtccatct tactgtttca gatgaccttg 960 aaggcgtttc taatatattg aggttttttt tgcggccgcc ccgggcctgc aggggatccc 1020 gatcgggccg gccgtttaaa cccactttgt acaagaaagt tgaacgagaa acgtaaaatg 1080 atataaatat caatatatta aattagattt tgcataaaaa acagactaca taatactgta 1140 aaacacaaca tatgcagtca ctatgaacca actacttaga tggtattagt gacctgtact 1200 gggcctcatg ggccttccgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 1260 tgcattaaca tggtcatagc tgtttccttg cgtattgggc gctctccgct tcctcgctca 1320 ctgactcgct gcgctcggtc gttcgggtaa agcctggggt gcctaatgag caaaaggcca 1380 gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 1440 ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 1500 ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 1560 gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 1620 ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 1680 cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 1740 cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 1800 gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 1860 aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 1920 tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 1980 gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 2040 tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 2100 gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 2160 tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 2220 ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 2280 ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagaaccac gctcaccggc 2340 tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 2400 aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 2460 gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 2520 gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 2580 ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 2640 gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 2700 gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 2760 gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 2820 tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 2880 gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 2940 agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 3000 aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 3060 ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 3120 gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctaaattgta 3180 agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc attttttaac 3240 caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga gatagggttg 3300 agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt gggaagggcg 3360 tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 3420 gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 3480 agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca aggccgcatt 3540 acaggtcact aataccatct aagtagttgg ttcatagtga ctgcatatgt tgtgttttac 3600 agtattatgt agtctgtttt ttatgcaaaa tctaatttaa tatattgata tttatatcat 3660 tttacgtttc tcgttcaact tttttgtaca aacttgattt aaatgaattc aagcttttaa 3720 ttaagcatgc gagctcggcg cgccggtacc gcgat 3755 <210> 70 <211> 17951 <212> DNA <213> Artificial Sequence <220> <223> Vector RLW139 <400> 70 ttatacatag ttgataattc actgggccgg ccgtttaaac ttagttacta atcagtgatc 60 agattgtcgt ttcccgcctt cactttaaac tatcagtgtt tgacaggata tattggcggg 120 taaacctaag agaaaagagc gtttattaga ataatcggat atttaaaagg gcgtgaaaag 180 gtttatccgt tcgtccattt gtatgtcaat attggggggg ggggaaagcc acgttgtgtc 240 tcaaaatctc tgatgttaca ttgcacaaga taaaaatata tcatcatgaa caataaaact 300 gtctgcttac ataaacagta atacaagggg tgttcgccac catgagccat atccagcgtg 360 aaacctcgtg ctcccgcccg cgcctcaatt ccaatatgga tgccgacctt tatggctaca 420 agtgggcgcg cgacaacgtc ggccagtcgg gcgcgaccat ttatcggctt tatggcaaac 480 ccgatgcccc ggaactgttc ctgaagcacg gcaaaggcag cgtcgcaaac gatgtcaccg 540 atgagatggt ccgcctgaac tggcttaccg agttcatgcc gctgccgacg attaagcatt 600 tcatccgtac cccggacgat gcctggctct tgaccacggc cattccgggc aaaacggcct 660 ttcaggtcct tgaagagtac ccggactccg gtgagaatat cgtggacgcc ctcgcggtct 720 tcctccgccg tttgcatagc atccccgtgt gcaactgccc cttcaactcg gaccgggttt 780 tccgcctggc acaggcccag tcgcgcatga ataacggcct cgttgacgcg agcgatttcg 840 acgatgaacg gaatggctgg ccggtggaac aggtttggaa ggaaatgcac aaactgcttc 900 cgttctcgcc ggattcggtg gtcacgcatg gtgatttttc cctggataat ctgatctttg 960 acgagggcaa gctgatcggc tgcatcgacg tgggtcgcgt cggtatcgcc gaccgctatc 1020 aggacctggc gatcttgtgg aattgcctcg gcgagttctc gccctcgctc cagaagcgcc 1080 tgttccagaa gtacggcatc gacaacccgg atatgaacaa gctccagttc cacctcatgc 1140 tggacgaatt tttttgaaca gaattggtta attggttgta acactggcag agcattacgc 1200 tgacttgacg ggacggcggc tttgttgaat aaatcgaact tttgctgagt tgaaggatcg 1260 atgagttgaa ggaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc 1320 gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg 1380 atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa 1440 atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc 1500 ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt 1560 gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa 1620 cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc 1680 tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc 1740 cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct 1800 ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat 1860 gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc 1920 tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg 1980 ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc 2040 gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc 2100 atctgtgcgg tatttcacac cgcataggcc gcgataggcc gacgcgaagc ggcggggcgt 2160 agggagcgca gcgaccgaag ggtaggcgct ttttgcagct cttcggctgt gcgctggcca 2220 gacagttatg cacaggccag gcgggtttta agagttttaa taagttttaa agagttttag 2280 gcggaaaaat cgcctttttt ctcttttata tcagtcactt acatgtgtga ccggttccca 2340 atgtacggct ttgggttccc aatgtacggg ttccggttcc caatgtacgg ctttgggttc 2400 ccaatgtacg tgctatccac aggaaagaga ccttttcgac ctttttcccc tgctagggca 2460 atttgcccta gcatctgctc cgtacattag gaaccggcgg atgcttcgcc ctcgatcagg 2520 ttgcggtagc gcatgactag gatcgggcca gcctgccccg cctcctcctt caaatcgtac 2580 tccggcaggt catttgaccc gatcagcttg cgcacggtga aacagaactt cttgaactct 2640 ccggcgctgc cactgcgttc gtagatcgtc ttgaacaacc atctggcttc tgccttgcct 2700 gcggcgcggc gtgccaggcg gtagagaaaa cggccgatgc cggggtcgat caaaaagtaa 2760 tcggggtgaa ccgtcagcac gtccgggttc ttgccttctg tgatctcgcg gtacatccaa 2820 tcagcaagct cgatctcgat gtactccggc cgcccggttt cgctctttac gatcttgtag 2880 cggctaatca aggcttcacc ctcggatacc gtcaccaggc ggccgttctt ggccttcttg 2940 gtacgctgca tggcaacgtg cgtggtgttt aaccgaatgc aggtttctac caggtcgtct 3000 ttctgctttc cgccatcggc tcgccggcag aacttgagta cgtccgcaac gtgtggacgg 3060 aacacgcggc cgggcttgtc tcccttccct tcccggtatc ggttcatgga ttcggttaga 3120 tgggaaaccg ccatcagtac caggtcgtaa tcccacacac tggccatgcc ggcggggcct 3180 gcggaaacct ctacgtgccc gtctggaagc tcgtagcgga tcacctcgcc agctcgtcgg 3240 tcacgcttcg acagacggaa aacggccacg tccatgatgc tgcgactatc gcgggtgccc 3300 acgtcataga gcatcggaac gaaaaaatct ggttgctcgt cgcccttggg cggcttccta 3360 atcgacggcg caccggctgc cggcggttgc cgggattctt tgcggattcg atcagcggcc 3420 ccttgccacg attcaccggg gcgtgcttct gcctcgatgc gttgccgctg ggcggcctgc 3480 gcggccttca acttctccac caggtcatca cccagcgccg cgccgatttg taccgggccg 3540 gatggtttgc gaccgctcac gccgattcct cgggcttggg ggttccagtg ccattgcagg 3600 gccggcagac aacccagccg cttacgcctg gccaaccgcc cgttcctcca cacatggggc 3660 attccacggc gtcggtgcct ggttgttctt gattttccat gccgcctcct ttagccgcta 3720 aaattcatct actcatttat tcatttgctc atttactctg gtagctgcgc gatgtattca 3780 gatagcagct cggtaatggt cttgccttgg cgtaccgcgt acatcttcag cttggtgtga 3840 tcctccgccg gcaactgaaa gttgacccgc ttcatggctg gcgtgtctgc caggctggcc 3900 aacgttgcag ccttgctgct gcgtgcgctc ggacggccgg cacttagcgt gtttgtgctt 3960 ttgctcattt tctctttacc tcattaactc aaatgagttt tgatttaatt tcagcggcca 4020 gcgcctggac ctcgcgggca gcgtcgccct cgggttctga ttcaagaacg gttgtgccgg 4080 cggcggcagt gcctgggtag ctcacgcgct gcgtgatacg ggactcaaga atgggcagct 4140 cgtacccggc cagcgcctcg gcaacctcac cgccgatgcg cgtgcctttg atcgcccgcg 4200 acacgacaaa ggccgcttgt agccttccat ccgtgacctc aatgcgctgc ttaaccagct 4260 ccaccaggtc ggcggtggcc caaatgtcgt aagggcttgg ctgcaccgga atcagcacga 4320 agtcggctgc cttgatcgcg gacacagcca agtccgccgc ctggggcgct ccgtcgatca 4380 ctacgaagtc gcgccggccg atggccttca cgtcgcggtc aatcgtcggg cggtcgatgc 4440 cgacaacggt tagcggttga tcttcccgca cggccgccca atcgcgggca ctgccctggg 4500 gatcggaatc gactaacaga acatcggccc cggcgagttg cagggcgcgg gctagatggg 4560 ttgcgatggt cgtcttgcct gacccgcctt tctggttaag tacagcgata accttcatgc 4620 gttccccttg cgtatttgtt tatttactca tcgcatcata tacgcagcga ccgcatgacg 4680 caagctgttt tactcaaata cacatcacct ttttagatga tcagtgattt tgtgccgagc 4740 tgccggtcgg ggagctgttg gctggctggt ggcaggatat attgtggtgt aaacaaattg 4800 acgcttagac aacttaataa cacattgcgg acgtctttaa tgtactgaat ttagttactg 4860 atcactgatt aagtactgat aaatttaatt aacagatctc aactttgtat agaaaagttg 4920 atttaaatga attcaagctt ttaattaact tagccactgc aacaagttct tgaaccttag 4980 cacaatcata ttgtgcatgc acttgtttat tgcaaagaat ggtgcgtagg gaacacgcat 5040 gatttttgaa ttgctggcac ataattttat cattagaaac tggaatgcaa catgtaccct 5100 ttgtcatggt ttctttccga gacattgcac tgtttttttt aatcctatca ttatcataat 5160 gccaagaact ggtcaccaac cagcattttg catcatggtt agttgagctg tccccatgta 5220 tcaataggtg cattgtattg gtccaaaata taaatgcagt ggatgcaacc tatctcatgg 5280 ccgtcaacaa aagaaatcaa aagggaaatg caccatctta tatctccagt ttatatgaac 5340 agattggata agatcataag atcaagtggt ttatattatt ttgaggaata taacatggat 5400 tcatcctaat cactcgtcta ggcagtatgt gtattcatga tggatatggt actatactac 5460 ggagtttttt cttcacaaaa taacctgtta ttttgacctc caaccaaaca cgaattatac 5520 caaaaattgg gttatttcat ctatagtaca actctattat aaacatgcag taaattatcc 5580 tacacatata ccaaaattca agtgtaataa tcctaataca cagacttaaa aaacaaacta 5640 tttccttttt aagaaaagga aaaccatttt tttaacggaa ggaaaacaaa ttcgggtcaa 5700 ggcggaagcc agcgcgccac cccacgtcag cgaatacgga ggcgcggggt tgacggcgtc 5760 acccggtcct aacggcgacc aacaaaccag ccagaagaaa ttacagtaaa aaaaagtaaa 5820 ttgcactttg atccaccttt tattacccaa gtttcaattt ggaccaccct taaacctatc 5880 ttttcaaatt gggccgggtt gtggtttgga ctaccatgaa caacttttcg tcatgtctaa 5940 cttccctttc ggcaaacata tgaaccatat atagaggaga tcggccgtat actagagctg 6000 atgtgtttaa ggtcgttgat tgcacgagaa aaaaaaaatc caaatcgcaa caatagcaaa 6060 tttatctagt tcaaagtgaa aagatatgtt taaaggtagt ccaaagtaaa acttaggggc 6120 tgtttggttc ccagccatac tttaccatta cttgccaaca aaagttgcca caccttgtct 6180 aaggtgaggt gatcaaattg ttagccacaa cttactaagc ctaagggaat cttgccacac 6240 ttttttgagc cattgacacg tgggacttaa tttgttagag ggaaatcttg ccacaactgt 6300 ggctacaacc aaacacctgt caaatttgcc taaccttagg cgtggcaaac tgtggcaaag 6360 tgtggcttac aaccaaacac acccttagat aataaaatgt ggtccaaagc gtaattcact 6420 aaaaaaaaat caacgagacg tgtaccaaac ggagacaaac ggcatcttct cgaaatttcc 6480 caaccgctcg ctcgcccgcc tcgtcttccc ggaaaccgcg gtggtttcag cgtggcggat 6540 tctccaagca gacggagacg tcacggcacg ggactcctcc caccacccaa ccgccataaa 6600 taccagcccc ctcatctcct ctcctcgcat cagctccacc cccgaaaaat ttctccccaa 6660 tctcgcgagg ctctcgtcgt cgaatcgaat cctctcgcgt cctcaagctt ggcatccagg 6720 tacggatccg cgtcccatct ccctcacccc ccgtgttctt cgtgcctgct tctgggtcag 6780 atctgggtgg attcgcggtt gttggatgtg gggggctgtg tttatttgtc ggtggatctg 6840 gttgtctgga tctgcgtttt ctctgtcgta gttagcggat ctgatgaaat gtttagtgtt 6900 cgtgtatact ggtatggtgg atctggtcct aggatgcgtg gaatggatat atgtaggcga 6960 attggaggat ttattttgtg aattttgctg aaatgatagt tctaaacact ggatctgacc 7020 tcgggatgct gttaaatgtg gaaatcatgg tcgatgctgt catgaacatg gtgttcttat 7080 ggtagatctg agcaatgtat gtttcaaaat tgtttgtcac atggaaatgc tatggttcta 7140 gatgcaatag aatgatacat gccgagatcc cctctagttg atatgataga tcatgatgtt 7200 ttacagctat gtcatatgaa tatgttcatt tgttaccgat gtatttggat ctacttaaca 7260 tttccaaagc acgccgcgtt ctaattctag atctggtagt catgtttgta cacgtcaccc 7320 acctaataca aatacatatg tctagtgttt ggtgacactg cccgtcagat ctgttttttc 7380 cagatctgtg gaacaaatac tccacgcatg tatggtagtt ttgaaacgat cttgtatctt 7440 ccattgttgt agtaacaact aaataaagta caattgttca attattggga atcgtatttt 7500 ctgtagtgcc gatgtacagc atattcatag atgtctattt aggaactcaa attttaaatt 7560 gaggactagt tatttattgt gggtcagtct tttgaattgt gttatcttgc tgtactggcg 7620 cgccaccatg gccaccgccg ccgccgcgtc taccgcgctc actggcgcca ctaccgctgc 7680 gcccaaggcg aggcgccggg cgcacctcct ggccacccgc cgcgccctcg ccgcgcccat 7740 caggtgctca gcggcgtcac ccgccatgcc gatggctccc ccggccaccc cgctccggcc 7800 gtggggcccc accgatcccc gcaagggcgc cgacatcctc gtcgagtccc tcgagcgctg 7860 cggcgtccgc gacgtcttcg cctaccccgg cggcacgtcc atggagatcc accaggcact 7920 cacccgctcc cccgtcatcg ccaaccacct cttccgccac gagcaagggg aggcctttgc 7980 ggcctccggc tacgcgcgct cctcgggccg cgtcggcgtc tgcatcgcca cctccggccc 8040 cggcgccacc aaccttgtct ccgcgctcgc cgacgcgctg ctcgattccg tccccatggt 8100 cgccatcacg ggacaggtgc cgcgacgcat gattggcacc gacgccttcc aggagacgcc 8160 catcgtcgag gtcacccgct ccatcaccaa gcacaactac ctggtcctcg acgtcgacga 8220 catcccccgc gtcgtgcagg aggctttctt cctcgcctcc tctggtcgac cggggccggt 8280 gcttgtcgac atccccaagg acatccagca gcagatggcg gtgcctgtct gggacaagcc 8340 catgagtctg cctgggtaca ttgcgcgcct tcccaagccc cctgcgactg agttgcttga 8400 gcaggtgctg cgtcttgttg gtgaatcccg gcgccctgtt ctttatgttg gcggtggctg 8460 cgcagcatct ggtgaggagt tgcgacgctt tgtggagctg actggaatcc cggtcacaac 8520 tactcttatg ggcctcggca acttccccag cgacgaccca ctgtctctgc gcatgctagg 8580 tatgcatggc acggtgtatg caaattatgc agtggataag gccgatctgt tgcttgcact 8640 tggtgtgcgg tttgatgatc gtgtgacagg gaagattgag gcttttgcaa gcagggctaa 8700 gattgtgcac gttgatattg atccggctga gattggcaag aacaagcagc cacatgtgtc 8760 catctgtgca gatgttaagc ttgctttgca gggcatgaat gctcttcttg aaggaagcac 8820 atcaaagaag agctttgact ttggctcatg gaacgatgag ttggatcagc agaagaggga 8880 attccccctt gggtataaaa catctaatga ggagatccag ccacaatatg ctattcaggt 8940 tcttgatgag ctgacgaaag gcgaggccat catcggcaca ggtgttgggc agcaccagat 9000 gtgggcggca cagtactaca cttacaagcg gccaaggcag tggttgtctt cagctggtct 9060 tggggctatg ggatttggtt tgccggctgc tgctggtgct tctgtggcca acccaggtgt 9120 tactgttgtt gacatcgatg gagatggtag ctttctcatg aacgttcagg agctagctat 9180 gatccgaatt gagaacctcc cggtgaaggt ctttgtgcta aacaaccagc acctggggat 9240 ggtggtgcag tgggaggaca ggttctataa ggccaacaga gcgcacacat acttgggaaa 9300 cccagagaat gaaagtgaga tatatccaga tttcgtgacg atcgccaaag ggttcaacat 9360 tccagcggtc cgtgtgacaa agaagaacga agtccgcgca gcgataaaga agatgctcga 9420 gactccaggg ccgtacctct tggatataat cgtcccacac caggagcatg tgttgcctat 9480 gatccctaat ggtggggctt tcaaggatat gatcctggat ggtgatggca ggactgtgta 9540 ctagcctgca ggcctaggat cgttcaaaca tttggcaata aagtttctta agattgaatc 9600 ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt aagcatgtaa 9660 taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt agagtcccgc 9720 aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag gataaattat 9780 cgcgcgcggt gtcatctatg ttactagatc ggccggccgt ttaaacagcc tgcttttttg 9840 tacaaacttg atttaaatga attcaagctt ttaattaagc atgcgagctc ggcgcgccgg 9900 taccgcgatc gcggatcatg aaccaacggc ctggctgtat ttggtggttg tgtagggaga 9960 tggggagaag aaaagcccga ttctcttcgc tgtgatgggc tggatgcatg cgggggagcg 10020 ggaggcccaa gtacgtgcac ggtgagcggc ccacagggcg agtgtgagcg cgagaggcgg 10080 gaggaacagt ttagtaccac attgcccagc taactcgaac gcgaccaact tataaacccg 10140 cgcgctgtcg cttgtgtgtg ggttattgat tctgttggtt ttagagctag aaatagcaag 10200 ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcattacgt 10260 tcagagctgg atcatttggc ccaagggaag atgcattctt tgaagctgtt accaacctag 10320 cctgtgagaa gaaacttcct cttatttatt tggcagcaaa ttctggtgct cgaattggca 10380 tagcagatga agtgaaatct tgcttccgtg ttgggtggtc tgatgatggc agccctgaac 10440 gtgggtttca gtacatttat ctaagcgaag aagactatgc tcgtattggc acttctgtca 10500 tagcacataa gatgcagcta gacagtggtg aaattaggtg ggttattgat tctgttgtcg 10560 gcaaggaaga tggacttggt gtggagaatc tccatggaag tgctgctatt gccagtgctt 10620 attctagggc atataaggag acatttacac ttacatttgt gactggaaga actgttggaa 10680 taggagctta tcttgctcga cttggcatcc ggtgcataca gcgtcttgac cagcctatta 10740 ttcttacagg ctattctgca ctgaacaagc ttcttgggcg ggaagtgtac agctcccaca 10800 tgcagttggg tggtcccaaa atcatggcaa ctaatggtgt tgtccatctt actgtttcag 10860 atgaccttga aggcgtttct aatatattga ggtttttttt gcggccgccc cgggcctgca 10920 ggggatcccg atcgggccgg ccgtttaaac ccactttgta caagaaagct gggtatttaa 10980 atgaattcaa gcttttaatt aatgcagtgc agcgtgaccc ggtcgtgccc ctctctagag 11040 ataatgagca ttgcatgtct aagttataaa aaattaccac atattttttt tgtcacactt 11100 gtttgaagtg cagtttatct atctttatac atatatttaa actttactct acgaataata 11160 taatctatag tactacaata atatcagtgt tttagagaat catataaatg aacagttaga 11220 catggtctaa aggacaattg agtattttga caacaggact ctacagtttt atctttttag 11280 tgtgcatgtg ttctcctttt tttttgcaaa tagcttcacc tatataatac ttcatccatt 11340 ttattagtac atccatttag ggtttagggt taatggtttt tatagactaa tttttttagt 11400 acatctattt tattctattt tagcctctaa attaagaaaa ctaaaactct attttagttt 11460 ttttatttaa tagtttagat ataaaataga ataaaataaa gtgactaaaa attaaacaaa 11520 taccctttaa gaaattaaaa aaactaagga aacatttttc ttgtttcgag tagataatgc 11580 cagcctgtta aacgccgtcg acgagtctaa cggacaccaa ccagcgaacc agcagcgtcg 11640 cgtcgggcca agcgaagcag acggcacggc atctctgtcg ctgcctctgg acccctctcg 11700 agagttccgc tccaccgttg gacttgctcc gctgtcggca tccagaaatt gcgtggcgga 11760 gcggcagacg tgagccggca cggcaggcgg cctcctcctc ctctcacggc accggcagct 11820 acgggggatt cctttcccac cgctccttcg ctttcccttc ctcgcccgcc gtaataaata 11880 gacaccccct ccacaccctc tttccccaac ctcgtgttgt tcggagcgca cacacacaca 11940 accagatctc ccccaaatcc acccgtcggc acctccgctt caaggtacgc cgctcgtcct 12000 cccccccccc ccccctctct accttctcta gatcggcgtt ccggtccatg gttagggccc 12060 ggtagttcta cttctgttca tgtttgtgtt agatccgtgt ttgtgttaga tccgtgctgc 12120 tagcgttcgt acacggatgc gacctgtacg tcagacacgt tctgattgct aacttgccag 12180 tgtttctctt tggggaatcc tgggatggct ctagccgttc cgcagacggg atcgatttca 12240 tgattttttt tgtttcgttg catagggttt ggtttgccct tttcctttat ttcaatatat 12300 gccgtgcact tgtttgtcgg gtcatctttt catgcttttt tttgtcttgg ttgtgatgat 12360 gtggtctggt tgggcggtcg ttctagatcg gagtagaatt ctgtttcaaa ctacctggtg 12420 gatttattaa ttttggatct gtatgtgtgt gccatacata ttcatagtta cgaattgaag 12480 atgatggatg gaaatatcga tctaggatag gtatacatgt tgatgcgggt tttactgatg 12540 catatacaga gatgcttttt gttcgcttgg ttgtgatgat gtggtgtggt tgggcggtcg 12600 ttcattcgtt ctagatcgga gtagaatact gtttcaaact acctggtgta tttattaatt 12660 ttggaactgt atgtgtgtgt catacatctt catagttacg agtttaagat ggatggaaat 12720 atcgatctag gataggtata catgttgatg tgggttttac tgatgcatat acatgatggc 12780 atatgcagca tctattcata tgctctaacc ttgagtacct atctattata ataaacaagt 12840 atgttttata attatttcga tcttgatata cttggatgat ggcatatgca gcagctatat 12900 gtggattttt ttagccctgc cttcatacgc tatttatttg cttggtactg tttcttttgt 12960 cgatgctcac cctgttgttt ggtgttactt ctgcagggcg cgccaccatg gctcctaaga 13020 agaagcggaa ggttggtatt cacggggtgc ctgcggctga caagaagtac tccatcggcc 13080 tcgacatcgg caccaacagc gtcggctggg cggtgatcac cgacgagtac aaggtcccgt 13140 ccaagaagtt caaggtcctg ggcaacaccg accgccactc catcaagaag aacctcatcg 13200 gcgccctcct cttcgactcc ggcgagacgg cggaggcgac ccgcctcaag cgcaccgccc 13260 gccgccgcta cacccgccgc aagaaccgca tctgctacct ccaggagatc ttctccaacg 13320 agatggcgaa ggtcgacgac tccttcttcc accgcctcga ggagtccttc ctcgtggagg 13380 aggacaagaa gcacgagcgc caccccatct tcggcaacat cgtcgacgag gtcgcctacc 13440 acgagaagta ccccactatc taccaccttc gtaagaagct tgttgactct actgataagg 13500 ctgatcttcg tctcatctac cttgctctcg ctcacatgat caagttccgt ggtcacttcc 13560 ttatcgaggg tgaccttaac cctgataact ccgacgtgga caagctcttc atccagctcg 13620 tccagaccta caaccagctc ttcgaggaga accctatcaa cgcttccggt gtcgacgcta 13680 aggcgatcct ttccgctagg ctctccaagt ccaggcgtct cgagaacctc atcgcccagc 13740 tccctggtga gaagaagaac ggtcttttcg gtaacctcat cgctctctcc ctcggtctga 13800 cccctaactt caagtccaac ttcgacctcg ctgaggacgc taagcttcag ctctccaagg 13860 atacctacga cgatgatctc gacaacctcc tcgctcagat tggagatcag tacgctgatc 13920 tcttccttgc tgctaagaac ctctccgatg ctatcctcct ttcggatatc cttagggtta 13980 acactgagat cactaaggct cctctttctg cttccatgat caagcgctac gacgagcacc 14040 accaggacct caccctcctc aaggctcttg ttcgtcagca gctccccgag aagtacaagg 14100 agatcttctt cgaccagtcc aagaacggct acgccggtta cattgacggt ggagctagcc 14160 aggaggagtt ctacaagttc atcaagccaa tccttgagaa gatggatggt actgaggagc 14220 ttctcgttaa gcttaaccgt gaggacctcc ttaggaagca gaggactttc gataacggct 14280 ctatccctca ccagatccac cttggtgagc ttcacgccat ccttcgtagg caggaggact 14340 tctacccttt cctcaaggac aaccgtgaga agatcgagaa gatccttact ttccgtattc 14400 cttactacgt tggtcctctt gctcgtggta actcccgttt cgcttggatg actaggaagt 14460 ccgaggagac tatcacccct tggaacttcg aggaggttgt tgacaagggt gcttccgccc 14520 agtccttcat cgagcgcatg accaacttcg acaagaacct ccccaacgag aaggtcctcc 14580 ccaagcactc cctcctctac gagtacttca cggtctacaa cgagctcacc aaggtcaagt 14640 acgtcaccga gggtatgcgc aagcctgcct tcctctccgg cgagcagaag aaggctatcg 14700 ttgacctcct cttcaagacc aaccgcaagg tcaccgtcaa gcagctcaag gaggactact 14760 tcaagaagat cgagtgcttc gactccgtcg agatcagcgg cgttgaggac cgtttcaacg 14820 cttctctcgg cacctaccac gatctcctca agatcatcaa ggacaaggac ttcctcgaca 14880 acgaggagaa cgaggacatc ctcgaggaca tcgtcctcac tcttactctc ttcgaggata 14940 gggagatgat cgaggagagg ctcaagactt acgctcatct cttcgatgac aaggttatga 15000 agcagctcaa gcgtcgccgt tacaccggtt ggggtaggct ctcccgcaag ctcatcaacg 15060 gtatcaggga taagcagagc ggcaagacta tcctcgactt cctcaagtct gatggtttcg 15120 ctaacaggaa cttcatgcag ctcatccacg atgactctct taccttcaag gaggatattc 15180 agaaggctca ggtgtccggt cagggcgact ctctccacga gcacattgct aaccttgctg 15240 gttcccctgc tatcaagaag ggcatccttc agactgttaa ggttgtcgat gagcttgtca 15300 aggttatggg tcgtcacaag cctgagaaca tcgtcatcga gatggctcgt gagaaccaga 15360 ctacccagaa gggtcagaag aactcgaggg agcgcatgaa gaggattgag gagggtatca 15420 aggagcttgg ttctcagatc cttaaggagc accctgtcga gaacacccag ctccagaacg 15480 agaagctcta cctctactac ctccagaacg gtagggatat gtacgttgac caggagctcg 15540 acatcaacag gctttctgac tacgacgtcg accacattgt tcctcagtct ttccttaagg 15600 atgactccat cgacaacaag gtcctcacga ggtccgacaa gaacaggggt aagtcggaca 15660 acgtcccttc cgaggaggtt gtcaagaaga tgaagaacta ctggaggcag cttctcaacg 15720 ctaagctcat tacccagagg aagttcgaca acctcacgaa ggctgagagg ggtggccttt 15780 ccgagcttga caaggctggt ttcatcaaga ggcagcttgt tgagacgagg cagattacca 15840 agcacgttgc tcagatcctc gattctagga tgaacaccaa gtacgacgag aacgacaagc 15900 tcatccgcga ggtcaaggtg atcaccctca agtccaagct cgtctccgac ttccgcaagg 15960 acttccagtt ctacaaggtc cgcgagatca acaactacca ccacgctcac gatgcttacc 16020 ttaacgctgt cgttggcacc gctcttatca agaagtaccc taagcttgag tccgagttcg 16080 tctacggtga ctacaaggtc tacgacgttc gtaagatgat cgccaagtcc gagcaggaga 16140 tcggcaaggc caccgccaag tacttcttct actccaacat catgaacttc ttcaagaccg 16200 agatcaccct cgccaacggc gagatccgca agcgccctct tatcgagacg aacggtgaga 16260 ctggtgagat cgtttgggac aagggtcgcg acttcgctac tgttcgcaag gtcctttcta 16320 tgcctcaggt taacatcgtc aagaagaccg aggtccagac cggtggcttc tccaaggagt 16380 ctatccttcc aaagagaaac tcggacaagc tcatcgctag gaagaaggat tgggacccta 16440 agaagtacgg tggtttcgac tcccctactg tcgcctactc cgtcctcgtg gtcgccaagg 16500 tggagaaggg taagtcgaag aagctcaagt ccgtcaagga gctcctcggc atcaccatca 16560 tggagcgctc ctccttcgag aagaacccga tcgacttcct cgaggccaag ggctacaagg 16620 aggtcaagaa ggacctcatc atcaagctcc ccaagtactc tcttttcgag ctcgagaacg 16680 gtcgtaagag gatgctggct tccgctggtg agctccagaa gggtaacgag cttgctcttc 16740 cttccaagta cgtgaacttc ctctacctcg cctcccacta cgagaagctc aagggttccc 16800 ctgaggataa cgagcagaag cagctcttcg tggagcagca caagcactac ctcgacgaga 16860 tcatcgagca gatctccgag ttctccaagc gcgtcatcct cgctgacgct aacctcgaca 16920 aggtcctctc cgcctacaac aagcaccgcg acaagcccat ccgcgagcag gccgagaaca 16980 tcatccacct cttcacgctc acgaacctcg gcgcccctgc tgctttcaag tacttcgaca 17040 ccaccatcga caggaagcgt tacacgtcca ccaaggaggt tctcgacgct actctcatcc 17100 accagtccat caccggtctt tacgagactc gtatcgacct ttcccagctt ggtggtgata 17160 agcgtcctgc tgccaccaaa aaggccggac aggctaagaa aaagaagtag cctgcaggtc 17220 ctgctttaat gagatatgcg agacgcctat gatcgcatga tatttgcttt caattctgtt 17280 gtgcacgttg taaaaaacct gagcatgtgt agctcagatc cttaccgccg gtttcggttc 17340 attctaatga atatatcacc cgttactatc gtatttttat gaataatatt ctccgttcaa 17400 tttactgatt gtaccctact acttatatgt acaatattaa aatgaaaaca atatattgtg 17460 ctgaataggt ttatagcgac atctatgata gagcgccaca ataacaaaca attgcgtttt 17520 attattacaa atccaatttt aaaaaaagcg gcagaaccgg tcaaacctaa aagactgatt 17580 acataaatct tattcaaatt tcaaaagtgc cccaggggct agtatctacg acacaccgag 17640 cggcgaacta ataacgctca ctgaagggaa ctccggttcc ccgccggcgc gcatgggtga 17700 gattccttga agttgagtat tggccgtccg ctctaccgaa agttacgggc accattcaac 17760 ccggtccagc acggcggccg ggtaaccgac ttgctgcccc gagaattatg cagcattttt 17820 ttggtgtatg tgggccccaa atgaagtgca ggtcaaacct tgacagtgac gacaaatcgt 17880 tgggcgggtc cagggcgaat tttgcgacaa catgtcgagg ctcagcaggc cggccgttta 17940 aaccaacttt a 17951 <210> 71 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Nuclear Localization Signal <400> 71 Met Ser Glu Arg Lys Arg Arg Glu Lys Leu 1 5 10 <210> 72 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Nuclear Localization Signal <400> 72 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 73 <211> 377 <212> DNA <213> Oryza sativa <220> <223> U3 snRNA promoter <400> 73 aagggatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60 tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaggaca 120 ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180 aaccacgtga tgtggagtaa gataaactgt aggagaaaag catttcgtag tgggccatga 240 agcctttcag gacatgtatt gcagtatggg ccggcccatt acgcaattgg acgacaacaa 300 agactagtat tagtaccacc tcggctatcc acatagatca aagctggttt aaaagagttg 360 tgcagatgat ccgtggc 377

Claims (21)

  1. 세포 내 표적 핵산 (표적 NA) 분자의 변형을 위한 방법이며,
    a. 적어도 하나의 공여자 핵산 (doNA) 분자에 공유 연결된 가이드 핵산 (gNA) 분자를 포함하는 재조합 융합 핵산 (fuNA) 분자를 제공하는 단계, 및
    b. 상기 fuNA 분자를 표적 NA 분자를 포함하는 하나 이상의 세포 내에 도입하는 단계, 및
    c. 니카제 기능을 갖는 부위 지정 핵산 변형 폴리펩티드, 불활성화된 부위 지정 핵산 변형 폴리펩티드, 또는 다른 기능적 그룹에 연결된 불활성화된 부위 지정 핵산 변형 폴리펩티드를 상기 하나 이상의 세포 내로 도입하는 단계, 및
    d. 하나 이상의 세포를 상기 하나 이상의 세포에서 상동 재조합을 가능하게 하는 조건 하에 인큐베이션하는 단계, 및 임의적으로
    e. 상동 재조합이 일어난 하나 이상의 세포를 단리시키는 단계
    를 포함하며, 여기서 fuNA는 RNA로 이루어진 것이고,
    요법에 의한 인체 또는 동물체의 치료 방법이 아닌 방법.
  2. 제1항에 있어서, gNA 분자가 표적 NA 분자의 동일한 수의 연속적 염기에 대해 상보적인 적어도 12개의 염기를 포함하는 스페이서 핵산 (스페이서 NA) 분자를 포함하는 것인 방법.
  3. 제2항에 있어서, gNA 분자가 스캐폴드 핵산 (스캐폴드 NA) 분자를 추가로 포함하는 것인 방법.
  4. 제3항에 있어서, 스캐폴드 NA 분자가 gNA 분자에 공유 결합된 것인 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 세포가 미생물, 동물, 인간 또는 식물 세포인 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 니카제 기능을 갖는 부위 지정 핵산 변형 폴리펩티드, 불활성화된 부위 지정 핵산 변형 폴리펩티드, 또는 다른 기능적 그룹에 연결된 불활성화된 부위 지정 핵산 변형 폴리펩티드가 핵산 가이드된 핵산 변형 폴리펩티드 또는 그의 기능적 등가물인 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, fuNA 분자가 상기 fuNA 분자를 코딩하는 발현 구축물로서 도입되는 것인 방법.
  8. gNA 분자에 공유 연결된 doNA 분자를 포함하는 재조합 fuNA 분자이며, 여기서 fuNA는 RNA로 이루어지고, doNA는 표적 핵산의 적어도 15개의 연속적 염기의 2개의 상이한 영역에 대해 상보적인 적어도 15개의 염기를 각각 포함하는 2개의 상동성 아암을 포함하고, 상기 2개의 상동성 아암은 서로 직접 인접하거나 하나 이상의 추가 염기 핵산에 의해 분리되어 있는 것인 재조합 fuNA 분자.
  9. 제8항의 fuNA 분자를 코딩하는 DNA 분자에 기능적으로 연결된 프로모터를 포함하는 발현 구축물을 포함하는 벡터.
  10. 제9항의 벡터 및 니카제 기능을 갖는 부위 지정 핵산 변형 폴리펩티드, 불활성화된 부위 지정 핵산 변형 폴리펩티드, 또는 다른 기능적 그룹에 연결된 불활성화된 부위 지정 핵산 변형 폴리펩티드를 코딩하는 벡터
    를 포함하는 벡터 시스템.
  11. a. 제9항의 벡터 및
    b. 니카제 기능을 갖는 부위 지정 핵산 변형 폴리펩티드, 불활성화된 부위 지정 핵산 변형 폴리펩티드, 또는 다른 기능적 그룹에 연결된 불활성화된 부위 지정 핵산 변형 폴리펩티드를 코딩하는 벡터 및
    c. 표적 NA 분자를 포함하는 세포
    를 포함하는, 세포 내 표적 NA의 변형을 위한 시스템.
  12. a. 제9항의 벡터 및
    b. 니카제 기능을 갖는 부위 지정 핵산 변형 폴리펩티드, 불활성화된 부위 지정 핵산 변형 폴리펩티드, 또는 다른 기능적 그룹에 연결된 불활성화된 부위 지정 핵산 변형 폴리펩티드를 코딩하는 벡터 및
    c. 표적 NA 분자를 포함하는 세포
    를 포함하는 조성물.
  13. 제12항에 있어서, 제8항의 재조합 fuNA 분자, 제9항의 벡터, 제10항의 벡터 시스템, 또는 제11항의 시스템을 포함하는 조성물.
  14. 제8항의 재조합 fuNA 분자, 제9항의 벡터, 제10항의 벡터 시스템, 제11항의 시스템을 포함하는 세포.
  15. 제1항 내지 제7항 중 어느 한 항의 방법에 의해 생산된 세포.
  16. 제14항 또는 제15항에 있어서, 미생물, 동물, 인간 또는 식물 세포인 세포.
  17. 세포 내 표적 NA 분자의 변형을 위한 제8항의 재조합 fuNA 분자, 제9항의 벡터, 제10항의 벡터 시스템, 제11항의 시스템 또는 제12항의 조성물의 용도.
  18. 제1항 내지 제7항 중 어느 한 항의 방법, 제9항의 벡터, 제10항의 벡터 시스템, 제11항의 시스템 또는 제12항의 조성물에 있어서, 기능적 그룹은 FokI 또는 귀소성 엔도뉴클레아제의 aDNA 제한 영역인 것인 방법, 벡터, 벡터 시스템, 시스템 또는 조성물.
  19. 제1항 내지 제7항 중 어느 한 항의 방법, 제9항의 벡터, 제10항의 벡터 시스템, 제11항의 시스템 또는 제12항의 조성물에 있어서, 공여자 NA 분자가 gNA 분자의 스페이서 NA 부분 또는 gNA 분자의 스캐폴드 NA 부분에 공유 결합된 것인 방법, 벡터, 벡터 시스템, 시스템 또는 조성물.
  20. 제1항 내지 제7항 중 어느 한 항의 방법, 제9항의 벡터, 제10항의 벡터 시스템, 제11항의 시스템 또는 제12항의 조성물에 있어서, 융합 NA 분자가 1분자, 바람직하게는 모든 요소(gNA, scaffold NA 및 doNA)가 공유 연결된 1개의 연속 분자인 것인 방법, 벡터, 벡터 시스템, 시스템 또는 조성물.
  21. 제1항 내지 제7항 중 어느 한 항의 방법, 제9항의 벡터, 제10항의 벡터 시스템, 제11항의 시스템 또는 제12항의 조성물로서, gNA는 스페이서 NA 및 스캐폴드 NA를 포함하고, 여기서 스캐폴드 NA는 적어도 하나의 헤어핀, 바람직하게는 부위 지정 핵산 변형 폴리펩타이드에 의해 결합되는 적어도 두 개의 헤어핀 및/또는 서열을 포함하는 2차 구조를 형성하는 것인, 방법, 벡터, 벡터 시스템, 시스템 또는 조성물.
KR1020227006922A 2016-04-29 2017-04-20 표적 핵산의 변형을 위한 개선된 방법 KR102506185B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020237007132A KR20230038804A (ko) 2016-04-29 2017-04-20 표적 핵산의 변형을 위한 개선된 방법

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
EP16167774 2016-04-29
EP16167773 2016-04-29
EP16167773.7 2016-04-29
EP16167774.5 2016-04-29
EP17156018.8 2017-02-14
EP17156018 2017-02-14
PCT/EP2017/059331 WO2017186550A1 (en) 2016-04-29 2017-04-20 Improved methods for modification of target nucleic acids
KR1020187030717A KR102370675B1 (ko) 2016-04-29 2017-04-20 표적 핵산의 변형을 위한 개선된 방법

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020187030717A Division KR102370675B1 (ko) 2016-04-29 2017-04-20 표적 핵산의 변형을 위한 개선된 방법

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020237007132A Division KR20230038804A (ko) 2016-04-29 2017-04-20 표적 핵산의 변형을 위한 개선된 방법

Publications (2)

Publication Number Publication Date
KR20220032126A true KR20220032126A (ko) 2022-03-15
KR102506185B1 KR102506185B1 (ko) 2023-03-07

Family

ID=58640844

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020187030717A KR102370675B1 (ko) 2016-04-29 2017-04-20 표적 핵산의 변형을 위한 개선된 방법
KR1020227006922A KR102506185B1 (ko) 2016-04-29 2017-04-20 표적 핵산의 변형을 위한 개선된 방법
KR1020237007132A KR20230038804A (ko) 2016-04-29 2017-04-20 표적 핵산의 변형을 위한 개선된 방법

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020187030717A KR102370675B1 (ko) 2016-04-29 2017-04-20 표적 핵산의 변형을 위한 개선된 방법

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020237007132A KR20230038804A (ko) 2016-04-29 2017-04-20 표적 핵산의 변형을 위한 개선된 방법

Country Status (13)

Country Link
US (5) US11608499B2 (ko)
EP (5) EP4166661A1 (ko)
JP (2) JP7184648B2 (ko)
KR (3) KR102370675B1 (ko)
CN (1) CN109072207B (ko)
AU (5) AU2017256517B2 (ko)
BR (1) BR112018068934A2 (ko)
CA (1) CA3022475A1 (ko)
CL (1) CL2018003074A1 (ko)
DK (1) DK3448990T5 (ko)
IL (1) IL262409A (ko)
MX (2) MX2018013256A (ko)
WO (1) WO2017186550A1 (ko)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2734621B1 (en) 2011-07-22 2019-09-04 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US11053481B2 (en) 2013-12-12 2021-07-06 President And Fellows Of Harvard College Fusions of Cas9 domains and nucleic acid-editing domains
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
EP3215617B1 (en) 2014-11-07 2024-05-08 Editas Medicine, Inc. Systems for improving crispr/cas-mediated genome-editing
WO2017053879A1 (en) 2015-09-24 2017-03-30 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
IL310721A (en) 2015-10-23 2024-04-01 Harvard College Nucleobase editors and their uses
EP3433363A1 (en) 2016-03-25 2019-01-30 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
WO2017180694A1 (en) 2016-04-13 2017-10-19 Editas Medicine, Inc. Cas9 fusion molecules gene editing systems, and methods of use thereof
CA3032699A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
CN110214180A (zh) 2016-10-14 2019-09-06 哈佛大学的校长及成员们 核碱基编辑器的aav递送
WO2018071663A1 (en) * 2016-10-14 2018-04-19 Emendobio Inc. Rna compositions for genome editing
EP3541945A4 (en) * 2016-11-18 2020-12-09 Genedit Inc. COMPOSITIONS AND METHODS OF MODIFICATION OF TARGET NUCLEIC ACIDS
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
BR112019015578A2 (pt) * 2017-01-30 2020-03-10 KWS SAAT SE & Co. KGaA Ligação de modelo de reparo a endonucleases para engenharia de genoma
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
CN110914426A (zh) 2017-03-23 2020-03-24 哈佛大学的校长及成员们 包含核酸可编程dna结合蛋白的核碱基编辑器
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
CA3067382A1 (en) 2017-06-15 2018-12-20 The Regents Of The University Of California Targeted non-viral dna insertions
US11866726B2 (en) 2017-07-14 2024-01-09 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
CN111801345A (zh) 2017-07-28 2020-10-20 哈佛大学的校长及成员们 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
AU2018352592A1 (en) 2017-10-16 2020-06-04 Beam Therapeutics, Inc. Uses of adenosine base editors
BR112020008201A2 (pt) 2017-10-27 2020-10-06 The Regents Of The University Of California substituição-alvo de receptores de células t endógenos
US11268092B2 (en) 2018-01-12 2022-03-08 GenEdit, Inc. Structure-engineered guide RNA
KR102298105B1 (ko) 2019-01-08 2021-09-03 주식회사 엘지에너지솔루션 스웰링 게이지를 구비한 배터리 모듈 및 이를 포함하는 배터리 팩
AU2020242032A1 (en) 2019-03-19 2021-10-07 Massachusetts Institute Of Technology Methods and compositions for editing nucleotide sequences
CN115605597A (zh) 2020-03-04 2023-01-13 巴斯夫欧洲公司(De) 用于产生赋予低至中等表达的组成型细菌启动子的方法
CN115176018A (zh) 2020-03-04 2022-10-11 巴斯夫欧洲公司 用于大肠杆菌和芽孢杆菌中表达的穿梭载体
CA3177481A1 (en) 2020-05-08 2021-11-11 David R. Liu Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
CN112111505B (zh) * 2020-09-17 2022-03-15 江南大学 一种氧化葡萄糖酸杆菌中基因敲除的方法
WO2022251179A1 (en) * 2021-05-26 2022-12-01 Inscripta, Inc. Crispr editing in diploid genomes
WO2023019164A2 (en) * 2021-08-11 2023-02-16 The Board Of Trustees Of The Leland Stanford Junior University High-throughput precision genome editing in human cells
WO2023114872A2 (en) * 2021-12-14 2023-06-22 The Broad Institute, Inc. Reprogrammable fanzor polynucleotides and uses thereof
TW202342754A (zh) 2022-03-01 2023-11-01 美商巴斯夫農業解決方案種子美國有限責任公司 Cas12a切口酶
CN114774420B (zh) * 2022-04-27 2023-09-22 扬州大学 一种水稻增强子及基于CRISPR/Cas9技术评估水稻增强子活性的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014150624A1 (en) * 2013-03-14 2014-09-25 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids
WO2016065364A1 (en) * 2014-10-24 2016-04-28 Life Technologies Corporation Compositions and methods for enhancing homologous recombination

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ278490A (en) 1993-12-09 1998-03-25 Univ Jefferson Chimeric polynucleotide with both ribo- and deoxyribonucleotides in one strand and deoxyribonucleotides in a second strand
US6027945A (en) 1997-01-21 2000-02-22 Promega Corporation Methods of isolating biological target materials using silica magnetic particles
US6555732B1 (en) 1998-09-14 2003-04-29 Pioneer Hi-Bred International, Inc. Rac-like genes and methods of use
EP1152058A1 (en) 2000-05-03 2001-11-07 Institut Curie Methods and compositions for effecting homologous recombination
ES2398918T3 (es) 2005-08-26 2013-03-22 Dupont Nutrition Biosciences Aps Un método y una ordenación para soportar verticalmente elementos de resistencia eléctrica pendientes
EP3011032B1 (en) 2013-06-17 2019-10-16 The Broad Institute, Inc. Delivery, engineering and optimization of systems, methods and compositions for targeting and modeling diseases and disorders of post mitotic cells
US11306328B2 (en) * 2013-07-26 2022-04-19 President And Fellows Of Harvard College Genome engineering
BR112016002851B1 (pt) 2013-08-12 2022-02-22 BASF Agro B.V. Molécula de ácido nucleico, constructo de ácido nucleico, vetor, polipeptídeo ppo, método para controlar vegetação indesejada e uso do ácido nucleico
WO2015092706A1 (en) 2013-12-18 2015-06-25 BASF Agro B.V. Plants having increased tolerance to herbicides
CA2951707A1 (en) 2014-06-10 2015-12-17 Massachusetts Institute Of Technology Method for gene editing
US11535871B2 (en) * 2015-05-14 2022-12-27 University Of Southern California Optimized gene editing utilizing a recombinant endonuclease system
WO2017024047A1 (en) 2015-08-03 2017-02-09 Emendobio Inc. Compositions and methods for increasing nuclease induced recombination rate in cells
JP2018532402A (ja) * 2015-09-24 2018-11-08 クリスパー セラピューティクス アーゲー Rnaプログラム可能エンドヌクレアーゼの新規のファミリーならびにゲノム編集および他の適用におけるそれらの使用
EP3356520B1 (en) * 2015-10-02 2022-03-23 The U.S.A. as represented by the Secretary, Department of Health and Human Services Lentiviral protein delivery system for rna-guided genome editing
CN106811479B (zh) * 2015-11-30 2019-10-25 中国农业科学院作物科学研究所 利用CRISPR/Cas9系统定点修饰ALS基因获得抗除草剂水稻的系统及其应用
EP3443088A1 (en) * 2016-04-13 2019-02-20 Editas Medicine, Inc. Grna fusion molecules, gene editing systems, and methods of use thereof
EP3541945A4 (en) * 2016-11-18 2020-12-09 Genedit Inc. COMPOSITIONS AND METHODS OF MODIFICATION OF TARGET NUCLEIC ACIDS

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014150624A1 (en) * 2013-03-14 2014-09-25 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids
WO2016065364A1 (en) * 2014-10-24 2016-04-28 Life Technologies Corporation Compositions and methods for enhancing homologous recombination

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Gene Therapy, 2002, Vol.9, pp.703-707 1부.* *

Also Published As

Publication number Publication date
DK3448990T5 (da) 2021-09-27
JP2019514376A (ja) 2019-06-06
KR20230038804A (ko) 2023-03-21
AU2022100155A4 (en) 2022-12-01
MX2021009235A (es) 2021-09-08
AU2022100158A4 (en) 2022-12-01
KR20190002470A (ko) 2019-01-08
AU2022100157A4 (en) 2022-12-01
EP4166662A1 (en) 2023-04-19
AU2022100170A4 (en) 2022-12-08
US20230107997A1 (en) 2023-04-06
US11608499B2 (en) 2023-03-21
US20230183686A1 (en) 2023-06-15
EP3448990A1 (en) 2019-03-06
AU2017256517A1 (en) 2018-10-04
DK3448990T3 (da) 2021-08-30
KR102506185B1 (ko) 2023-03-07
CN109072207B (zh) 2024-05-07
CA3022475A1 (en) 2017-11-02
JP7184648B2 (ja) 2022-12-06
US20230049124A1 (en) 2023-02-16
JP2023018093A (ja) 2023-02-07
CN109072207A (zh) 2018-12-21
US20190309290A1 (en) 2019-10-10
BR112018068934A2 (pt) 2019-01-22
US20230024869A1 (en) 2023-01-26
EP3868880A1 (en) 2021-08-25
MX2018013256A (es) 2019-06-24
EP4166661A1 (en) 2023-04-19
EP3448990B1 (en) 2021-06-09
IL262409A (en) 2018-12-31
KR102370675B1 (ko) 2022-03-04
CL2018003074A1 (es) 2018-12-07
EP4166660A1 (en) 2023-04-19
WO2017186550A1 (en) 2017-11-02
AU2017256517B2 (en) 2023-09-28

Similar Documents

Publication Publication Date Title
KR102370675B1 (ko) 표적 핵산의 변형을 위한 개선된 방법
AU2023226754A1 (en) Compositions and methods for modifying genomes
CN101939434B (zh) 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因
DK2087106T3 (en) MUTATING DELTA8 DESATURATION GENES CONSTRUCTED BY TARGETED MUTAGENES AND USE THEREOF IN THE MANUFACTURE OF MULTI-Saturated FAT ACIDS
DK2576605T3 (en) PREPARATION OF METABOLITES
CN109563505A (zh) 用于真核细胞的组装系统
CN101365788B (zh) Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途
KR20120099509A (ko) 재조합 숙주 세포에서 육탄당 키나아제의 발현
KR20130132405A (ko) 형질전환 빈도를 증가시키기 위해 변형된 아그로박테리움 균주
KR20180081618A (ko) 유전자 편집에 의한 인간 디스트로핀 유전자의 교정을 위한 치료용 표적 및 사용 방법
KR20070085669A (ko) 고농도의 아라키돈산을 생성하는 야로위아 리폴리티카 균주
KR20170036792A (ko) Rna-유도 엔도뉴클레아제를 사용한 통상적이지 않은 효모에서의 유전자 표적화
KR20140092759A (ko) 숙주 세포 및 아이소부탄올의 제조 방법
KR20140099224A (ko) 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법
CN107868780B (zh) 在大于10kb环状DNA分子上实现定点突变的方法
CN108779480A (zh) 生产鞘氨醇碱和鞘脂类的方法
KR20120034652A (ko) 유전적으로 변형된 미생물을 발생시키는 방법
US11001859B2 (en) Recombinantly-modified adeno-associated virus helper vectors and their use to improve the packaging efficiency of recombinantly-modified adeno-associated virus
KR20130138760A (ko) 고농도의 에이코사펜타엔산 생성을 위한 재조합 미생물 숙주 세포
CN109996874A (zh) 10-甲基硬脂酸的异源性产生
CN115698297A (zh) 多模块生物合成酶基因组合文库的制备方法
CN113518825A (zh) Wiskott-aldrich综合征的造血干细胞基因疗法
BRPI0616533A2 (pt) polinucleotìdeo isolado, fragmento de ácido nucléico isolado, construções de dna recombinante, plantas, sementes, células vegetais, tecidos vegetais, método de isolamento de fragmentos de ácidos nucléico, método de mapeamento de variações genéticas, método de cultivo molecular, plantas de milho, métodos de alteração do transporte de nitrogênio das plantas e variantes de hat de plantas alteradas
KR102315601B1 (ko) 재조합 벡터 및 이를 이용한 재조합 섬유아세포 성장인자 19의 제조 방법
KR20230159050A (ko) 플라스틱 분해 효소와 탄수화물 결합 모듈을 박테리아 표면에 발현한 전세포 생체촉매

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant