KR20190002470A - 표적 핵산의 변형을 위한 개선된 방법 - Google Patents
표적 핵산의 변형을 위한 개선된 방법 Download PDFInfo
- Publication number
- KR20190002470A KR20190002470A KR1020187030717A KR20187030717A KR20190002470A KR 20190002470 A KR20190002470 A KR 20190002470A KR 1020187030717 A KR1020187030717 A KR 1020187030717A KR 20187030717 A KR20187030717 A KR 20187030717A KR 20190002470 A KR20190002470 A KR 20190002470A
- Authority
- KR
- South Korea
- Prior art keywords
- nucleic acid
- molecule
- lys
- leu
- glu
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/75—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8274—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/8509—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/905—Stable introduction of foreign DNA into chromosome using homologous recombination in yeast
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Mycology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Veterinary Medicine (AREA)
- Medicinal Chemistry (AREA)
- Cell Biology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Virology (AREA)
- Communicable Diseases (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Oncology (AREA)
- Peptides Or Proteins (AREA)
- Epidemiology (AREA)
- AIDS & HIV (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Hematology (AREA)
Abstract
표적 핵산의 변형을 위한 방법. 방법은 가이드 RNA가 공여자 RNA에 공유 연결된 구축물 (융합 NA)이 상동 재조합에 의해 표적 핵산 내로 도입되는 것을 수반하고, 표적 핵산을 함유하는 세포 내로의 뉴클레아제, 예를 들어 CRISPR 또는 TALEN의 도입에 기초한다. 융합 NA는 DNA 벡터로서 도입될 수 있다.
Description
본 발명은 표적 핵산의 변형을 위한 개선된 방법에 관한 것이다.
본 발명의 설명
CRISPR (클러스터링된 규칙적 간격의 짧은 회문식 반복부) 시스템은 처음에 스트렙토코쿠스(Streptococcus) 속에 속하는 박테리아의 적응성 방어 메카니즘으로서 확인되었다 (WO2007/025097). 이들 박테리아 CRISPR 시스템은 침입 바이러스 DNA 내에 존재하는 상보적 서열의 분해를 지시하는 절단 단백질과 복합체화된 가이드 RNA (gRNA)에게 의존한다. CRISPR/Cas 시스템의 최초로 확인된 단백질인 Cas9는 2개의 비코딩 RNA: crRNA 및 트랜스-활성화 crRNA (tracrRNA)의 복합체에 의해 PAM (프로토스페이서 인접 모티프) 서열 모티프에 인접한 DNA 표적 서열로 가이드되는 대형 단량체 DNA 뉴클레아제이다. 이후에, crRNA를 tracrRNA와 융합시키는 것에 의해 생성된 합성 RNA 키메라 (단일 가이드 RNA 또는 gRNA)는 동등하게 기능적인 것으로 나타났다 (Jinek et al. 2012).
여러 연구 군은 CRISPR 절단 특성이 전례없이 용이하게 대부분의 임의의 유기체의 게놈에서 유전자를 파괴하는데 사용될 수 있었다는 것을 밝혀냈다 (Mali P, et al. (2013) Science. 339(6121):819-823; Cong L, et al. (2013) Science 339(6121)). 최근에는, 복구를 위한 주형을 제공하는 것이 게놈을 거의 모든 부위에서 거의 모든 목적하는 서열로 편집하도록 하여, CRISPR을 강력한 유전자 편집 도구로 전환시킨다는 것이 명백해졌다 (WO/2014/150624, WO/2014/204728).
유전자 표적화는 상동 재조합 (HR)을 통한 핵산 결실, 삽입 또는 대체에 의한 부위 특이적 유전자 변형을 지칭한다. 표적화 효율은 게놈 표적에서 이중-가닥 절단 (DSB)에 의해 고도로 촉진된다. 또한, 염색체 DNA의 DSB 후에 상동성의 직접적 존재는 상동 재조합을 위해 비-상동성 말단 연결 (NHEJ) 복구를 거의 제거하는 것으로 보인다.
당면한 본 발명은 핵산 변형 폴리펩티드와 상호작용하는 HR 복구를 위한 적절한 공여자에 융합된 가이드 핵산 (적어도 하나의 공여자 핵산 (doNA) 분자에 공유 연결된 가이드 핵산 (gNA) 분자를 포함하는 융합 핵산 (fuNA) 분자)을 제공한다. 뉴클레아제 절단 부위에 플랭킹된 표적 DNA에 대한 상동성을 갖는 공여자 핵산의 전달을 개선하기 위해, 유전자 표적화 전략은 공여자 핵산 (doNA)이 CRISPR 성분에 공유 연결된 곳에 제시된다. 이 방식으로, 유전자 편집 복합체는 필요한 인식 및 절단 도구뿐 아니라 변형을 위한 주형을 포함한다. 가이드 핵산 (gNA)에 의해 인식되면, 뉴클레아제는 표적 영역을 절단하고, 즉시 동시발생하는 유입되는 공여자의 존재는 HR 과정을 용이하게 할 것이며, 그로 인해 유전자 복구 효능을 증가시킨다.
많은 미생물 시스템은 효율적 NHEJ 시스템이 결여되어 있다 [Standage-Beier K, Zhang Q, Wang X (2015) Targeted Large-Scale Deletion of Bacterial Genomes Using CRISPR-Nickases. ACS Synth Biol. 4(11): 1217-1225]. 예를 들어, 바이오에너지 연구에 중요한 클로스트리디움 셀룰롤리티쿰(Clostridium cellulolyticum)은 CRISPR/Cas9에 의해 용이하게 조작될 수 없고 [Xu T, Li Y, Shi Z, Hemme CL, Li Y, Zhu Y, Van Nostrand JD, He Z, Zhou J (2015) Efficient Genome Editing in Clostridium cellulolyticum via CRISPR-Cas9 Nickase. Appl Environ Microbiol. 81(13):4423-31], DSB를 도입하는 것에 의해 유전자를 녹아웃 하는 시도는 세포 사멸을 발생시킨다. 또 다른 예는 DSB 복구를 위해 상동 재조합 (HR)에 또한 의존하는 에스케리키아 콜라이(Escherichia coli)이다. 이러한 유기체에서의 게놈 편집을 위한 현재 기술은, 뉴클레아제 작용을 조정하기 위해 비-융합된 핵산 공여자, 유도성 CRISPR/Cas 발현을 통해 후속하는 비효율적 복구를 나타내는 CRISPR/Cas9-기반 니카제를 사용하는 것 및 맞춤 DNA 서열을 다루는 데 있어서 유연성이 결여된 핵산 공여자 또는 레콤비나제를 도입하는 것에 집중되어 있다.
fuNA 분자를 포함하는 CRISPR/Cas 또는 CRISPR/Cas 유사 시스템을 제공 및/또는 적용하는 것인, 융합CRISPR(FusionCRISPR) 기술의 적용은 이전에 고처리량 표적화에 적용가능하지 않았던 매우 다양한 미생물 종에서 녹아웃의 생성을 간단하게 할 것이다. 이중 가닥 절단 (DSB)의 유도 시에 신속하게 공여자 핵산을 제공함으로써, HR 복구 기구는 절단부를 동반되는 주형에 성공적으로 라이게이션할 것이다. 융합CRISPR의 도입은 다르게는 CRISPR/Cas9의 닉킹 버전, 레콤비나제 또는 임의의 다른 관심 (트랜스)유전자의 도입을 위해 사용되는 통상의 기술에 의해 수행된다. 이들 기술은 플라스미드의 전기천공/열 쇼크, 바이러스 형질도입 및 접합을 포함하나, 이에 제한되지는 않는다.
효율적 NHEJ를 갖는 유기체 내의 유전자는 가이드 RNA가 (1) 표적 유전자에 매칭되는 스페이서 (2) ~99개의 뉴클레오티드의 전형적 길이를 갖는 정확한 가이드 RNA 폴딩을 위한 필수 서열 (tracrRNA: 하나의 단일 가이드 RNA (sgRNA)에 통상적으로 조합된 crRNA)로 이루어지는 CRISPR/Cas9를 도입함으로써 녹아웃될 수 있는 반면에, DSB-감수성 미생물에서의 녹아웃은 하기 조성: (1) 스페이서 (2) 정확한 2차 구조을 위한 필수 서열 (3) 표적에 매칭되는 적어도 15개의 뉴클레오티드 (4) 표적에 매칭되는 제1의 적어도 15개의 뉴클레오티드로부터 하나 이상의 염기만큼 하류에 있는, 표적에 매칭되는 적어도 15개의 뉴클레오티드를 생성하는 RNA의 간단한 적응을 통해 달성될 수 있다. 녹아웃 융합CRISPR 카세트를 나타내는 2개의 상보적 ssDNA 올리고뉴클레오티드는 임의의 올리고 합성 회사로부터 상업적으로 용이하게 구입될 수 있다. 대안적으로, 그것은 dsDNA로서 합성될 수 있다. 융합CRISPR 녹아웃 카세트의 클로닝은 일반 CRISPR 카세트에서 의도된 표적을 위한 20개의 뉴클레오티드 스페이서를 유형 IIS 제한 효소에 의해 클로닝하는 것에 관한 가장 통상적인 방법과 유사하게 진행될 수 있다. 따라서, 융합CRISPR을 통한 제어된 유전자 녹아웃의 사용의 접근성, 유연성 및 용이성은 일반 CRISPR/Cas9에 필적하고, 본 발명은 NHEJ가 비효율적이거나 부재하는 표적 종까지 고처리량 녹아웃을 확장한다.
융합CRISPR은 또한 임의의 유기체 내의 녹인(knock-in)을 위해 사용될 수 있다. 선택 마커는 단순한 플라스미드를 포함하는 표준 도입 기술 및 표준 발현 비히클을 사용하여 녹인될 수 있다. 이것은 선택 용이성을 제공하면서 내인성 유전자를 방해하고 녹아웃하기 위해 행해질 수 있다.
인간 및 다른 세포에서의 게놈-규모 녹아웃은 질환, 약물 반응 및 정상적인 생물학적 과정에 수반되는 유전자의 발견 및 질환 모델의 생성을 가능하게 한다 [Shalem O, Sanjana NE, Hartenian E, Shi X, Scott DA, Mikkelsen TS, Heckl D, Ebert BL, Root DE, Doench JG, Zhang F (2014) Genome-scale CRISPR-Cas9 knockout screening in human cells. Science ;343(6166):84-7]. 녹아웃은 전형적으로 특이적 표적을 위한 CRISPR/Cas9의 도입에 의해 생성되고 해당 유전자를 위한 "널(null)"을 생성하기 위해 NHEJ에게 의지한다. 이 방법에 있어서 3가지 주요 문제점이 나타난다: (1) NHEJ 복구가 프레임 시프트를 발생시키지 않기 때문에 (또는 대안적 하류 개시 코돈이 사용되어 말단절단된 유전자 산물을 생성하기 때문에) 녹아웃이 종종 생성되지 않고, (2) 결과, 즉, 정확한 1차 DNA 서열은 알려져 있지 않고, 각각의 DNA 변형 "사건"에 대해 결정될 필요가 있으며, 이는 비용이 들고 시간 소모적이고, (3) 이배체 또는 배수체 유기체에서, 모든 이용가능한 "기질"에 대한 성공적 표적화가 심지어 첫 번째 장소에서 달성되어 복잡한 분자 분석 및/또는 반수체 모델 라인으로의 강제 전환을 발생시킨다면, 각각의 염색체에 대한 NHEJ 복구는 상이하게 일어날 것이다 [Wade M (2015) High-throughput silencing using the CRISPR-Cas9 system: A review of the benefits and challenges. Journal of Biomolecular Screening, Vol. 20(8):1027-39]. 융합CRISPR은 상기 기재된 바와 같이 결실의 제어를 가능하게 하며, 이는 예측할 수 있는 결과를 이끈다. 이배체 및 배수체 세포 시스템에서 각각의 염색체에 대한 임의의 도입된 변형은 대부분은 동일할 것이다. 결실은 대안적 전사 가능성이 감소되도록 충분히 크게 설계될 수 있고, 결실이 3으로 나누어질 수 없는 수의 염기로 이루어지도록 설계함으로써, 단지 아미노산의 짧은 스트레치가 결여된 기능적 단백질을 여전히 생성할 위험이 제거될 것이다.
임의의 세포 시스템에서 녹아웃을 제어하기 위해 설계된 융합CRISPR 구성을 도입하는 방법은 녹아웃의 생성을 위한 NHEJ 복구가 이어지는 CRISPR/Cas9의 도입에 사용된 방법과 동일하다. 이것은 곤충 세포의 바큘로바이러스 발현 시스템에 대해 인간 세포를 위한 AAV 및 렌티바이러스 벡터를 사용하는 것을 포함하나, 이에 제한되지는 않는다. 상기 기재된 바와 같이 가이드RNA의 짧은 확장 외에 현재 방법에 대한 어떠한 추가적 적응도 필요하지 않다.
게놈 편집은 다양한 유전 장애를 치료하는데 사용될 수 있다. 많은 유전 장애는 필요한 교정(들)을 함유하는 교정 핵산 주형과 함께 부위 특이적 뉴클레아제를 제공함으로써 잠재적으로 교정될 수 있었던 점 돌연변이를 수반한다. 한 예는 β-글로빈 유전자의 제6 코돈에서의 단일 DNA 염기 돌연변이 (A>T)로부터 유래한 겸상 적혈구 질환이다 [Li C, Ding L, Sun CW, Wu LC, Zhou D, Pawlik KM, Khodadadi-Jamayran A, Westin E, Goldman FD, Townes TM (2016) Novel HDAd/EBV Reprogramming Vector and Highly Efficient Ad/CRISPR-Cas Sickle Cell Disease Gene Correction. Sci Rep. 6:30422]. 뉴클레아제 및 교정 주형을 개별적으로 제공하는 것에 의해 세포 내 돌연변이를 교정하는 것은 종종 DNA 내 미조정된 초기 손상 및 HDR 복구를 위한 교정 주형의 국부적 도착을 발생시킬 것이다. 시간적/공간적 조정 뉴클레아제 및 교정 주형의 결여를 보상하기 위해 농도는 비교적 높을 필요가 있다. 보다 높은 뉴클레아제 농도는 부정적 결과 (보다 높은 환자 위험 및/또는 분자 분석에서의 보다 높은 비용)를 나타내는 보다 높은 표적-이탈 절단으로 이어질 수 있다. 융합CRISPR은 훨씬 더 낮은 농도에 정확한 유전자 교정을 달성할 것이다. 융합CRISPR을 적용하는 방법은 관련 분야의 현재 표준과 동일하며 [Maeder ML, Gersbach CA (2016) Genome-editing Technologies for Gene and Cell Therapy. Mol Ther. 24(3):430-46] 유일한 차이는 목적하는 교정을 포괄하는 다소 더 긴 sgRNA이다.
융합CRISPR은 다양한 상이한 유기체에서 다양한 효소의 기질 또는 산물 특이성을 변경하는데 사용될 수 있다. 예를 들어, 단일 아미노산은 다양한 식물 종에서 트리테르펜 신타제 기질 및 산물 특이성의 주요 결정인자인 것으로 밝혀졌다 [Salmon M, Thimmappa RB, Minto RE, Melton RE, Hughes RK, O'Maille PE, Hemmings AM, Osbourn A (2016) A conserved amino acid residue critical for product and substrate specificity in plant triterpene synthases. Proc Natl Acad Sci U S A. 113(30):E4407-14]. 트리테르펜은 약학 및 생명공학에서 적용되는 다양한 군의 천연 산물이고 산물 특이성에 영향을 미치는 능력이 관심 식물에서 신규하거나 또는 보다 많은 양의 생체분자를 합성하는 기회를 제공한다. 융합CRISPR은 기질 포켓 또는 특이성에 영향을 미치는 효소의 다른 도메인에서 결정적 아미노산의 변형을 가능하게 한다. 목적하는 아미노산은 게놈에서 대체될 필요가 있는 코돈에 플랭킹된 뉴클레오티드 서열과 상동성을 갖는 뉴클레오티드 서열에 의해 플랭킹된 융합된 주형 내에 상응하는 코돈을 포함시킴으로써 도입된다. 융합CRISPR 구축물을 도입하는 하나의 예는 아그로박테리움-매개 T-DNA 형질전환에 의한 것이며, 여기서 T-DNA는 선택 마커, 강한 프로모터에 의해 구동되는 Cas9, 및 하기로 각각 이루어지는 융합CRISPR 구축물을 함유한다: (1) RNA 폴리머라제 III 프로모터, (2) 의도된 표적 코돈 또는 그것에 인접한 서열 (가장 가까운 PAM을 찾음)에 매칭되는 스페이서, (3) 가이드의 정확한 2차 구조를 위한 필수 서열, (4) 절단부에 플랭킹된 하나의 영역에 매칭되는 상동성 아암, (5) 효소에서 특이성에 영향을 미치는 아미노산(들)에 매칭되는 신규 코돈(들), (6) 절단부의 다른 측면 상의 상동성 아암 및 (7) 종결인자. 어디에 절단이 만들어지는지에 따라, 공여자 내에 PAM 서열을 갖는 것을 회피하기 위한 침묵 돌연변이가 포함되어야 할 수 있다. 상동성 아암, 의도된 변화 및 의도된 변화 사이의 서열은 공여자의 매끄러운 혼입을 위해 인접할 것이다. 선택 마커는 안정하게 통합된 T-DNA를 갖는 식물 세포를 획득하기 위해 사용된다. 이들 세포에서, 형질전환된 식물의 유지 및 재생 전체에 걸쳐, 융합CRISPR 성분은 의도된 표적에서 게놈을 변경시킬 기회를 갖는다. 이들 변경은 배선으로 진입할 수 있고 묘목의 다음 세대는 T-DNA의 신규 내인성 서열 및 분리에 대해 스크리닝될 수 있다.
융합CRISPR은 임의의 유기체 내의 내인성 유전자에서 에피토프 또는 다른 태그의 삽입을 가능하게 한다. 태그는 세포 또는 세포하 수준에서 내인성 유전자 산물의 트래킹, 단백질-단백질 상호작용의 확인, ChIP 및 다른 분자 상호작용 및 단백질 정제에 사용될 수 있다. 약물 표적의 경로 발견 및 확인에 대부분 적용될 것이다. 융합CRISPR 구축물은 치환의 도입에 대해 상기 유사하게 기재된 바와 같이 상동성의 스트레치 사이의 페이로드로서 태그를 코딩하는 핵산을 가질 것이다. DNA로서 또는 일시적으로 융합CRISPR을 도입하는 것은 관심 유기체에서 보통 CRISPR/Cas9에 현재 사용되는 것과 동일한 프로토콜을 따를 것이다.
본 발명자들의 효모 실험은 융합CRISPR에서의 페이로드가 뉴클레아제의 전체 기능에 영향을 미치는 것 없이 적어도 731개의 뉴클레오티드일 수 있다는 것을 보여주었다. 이러한 또는 잠재적으로 보다 큰 크기의 서열은 천연 프로모터와 비교하여 강한 프로모터 또는 다양한 조직 또는 환경 신호 특이적 활성을 갖는 프로모터를 포함할 수 있다. 융합CRISPR은 잠재적으로 내인성 프로모터를 대체하고 상향조절을 포함하는 유전자 조절의 대안적 방법을 가능하게 할 수 있다.
CRISPR/Cas DNA 복구 시스템 또는 CRISPR/Cas 유사 DNA 복구 시스템의 적용을 간단하게 하는 것은 당면한 본 발명의 하나의 목적이다.
DNA 절단 복구 동안 표적 핵산에서 상동 재조합의 효율을 증진시키는 것은 당면한 본 발명의 추가의 목적이다.
놀랍게도 이것은 공여자 핵산 분자 및 가이드 핵산 분자를 공유 연결하는 것에 의해 달성되었으며, 가이드 핵산 분자는 CRISPR/Cas DNA 복구 시스템 또는 CRISPR/Cas 유사 DNA 복구 시스템의 요소로서 부위 지정된 핵산 변형 폴리펩티드와 상호작용한다.
발명의 상세한 설명
당면한 본 발명의 한 실시양태는
a. 적어도 하나의 공여자 핵산 (doNA) 분자에 공유 연결된 가이드 핵산 (gNA) 분자를 포함하는 재조합 융합 핵산 (fuNA) 분자를 제공하는 단계, 및
b. 상기 fuNA 분자를 표적 NA 분자를 포함하는 하나 이상의 세포 또는 조성물 내에 도입하는 단계, 및
c. 상기 하나 이상의 세포 또는 조성물 내로 부위 지정된 핵산 변형 폴리펩티드를 도입하는 단계, 및
d. 하나 이상의 세포 또는 조성물을 상기 하나 이상의 세포 또는 조성물에서 상동 재조합을 가능하게 하는 조건 하에 인큐베이션하는 단계, 및 임의로
e. 상동 재조합이 일어난 하나 이상의 세포를 단리시키는 단계
를 포함하는, 세포 또는 조성물 내 표적 핵산 (표적 NA) 분자의 변형을 위한 방법이다.
본 발명에 따른 융합 핵산 분자의 다양한 바람직한 구조는 도 1 내지 12에 도시된다. 가장 바람직한 구조는 도 1에 도시된다.
표적 핵산은 핵산 분자를 표적 핵산 내에 도입하는 것에 의해 변형될 수 있으며, 여기서 도입된 핵산 분자는 표적 핵산에 대해 이종이다. 공여자 핵산 분자의 상동성 아암 1과 상동성 아암 2 사이의 서열은 이 경우에, 표적 핵산 내에 도입되기로 되어 있고 상동성 아암에 대해 상보적인 표적 핵산 내 영역 사이에 존재하지 않는 핵산 분자를 포함할 것이다.
표적 핵산은 또한 표적 핵산으로부터 적어도 하나의 염기를 결실시킴으로써 변형될 수 있다. 그러한 경우에, 공여자 핵산 분자의 상동성 아암 1과 상동성 아암 2 사이의 서열은 표적 핵산에 비교하여 적어도 하나의 염기가 결여된 표적 핵산 분자에 대해 상보적인 서열을 포함할 것이다.
표적 핵산은 추가로 표적 핵산 내 적어도 하나의 염기를 표적 핵산에 대해 이종인 하나 이상의 염기로 대체함으로써 변형될 수 있다. 그러한 경우에 공여자 핵산의 상동성 아암 1과 2 사이의 서열은 표적 핵산 내 상보적 영역과 비교하여 적어도 하나의 미스매치를 포함할 것이다.
표적 핵산은 정확한 표적 부위 확인 및 결합을 위해 일부 부위 지정된 핵산 변형 폴리펩티드에 필요한 표적 핵산 분자 내 표적화된 서열에 인접한 "프로토스페이서 인접 모티프" (PAM) 서열을 포함할 수 있다. PAM의 서열은 다양한 부위 지정된 핵산 변형 폴리펩티드에 특이적이고 (Doudna and Charpentier, 2014, Science 346 (6213):1258096), 통상의 기술자에게 공지되어 있다.
본 발명의 방법은 바람직하게는 살아 있는 세포 내 표적 핵산 변형에 대하여 적용되지만, 시험관내 시스템에 또한 적용될 수 있다.
표적 핵산 분자는 RNA 또는 DNA일 수 있고, 그것은 단일- 또는 이중-가닥일 수 있다. 바람직하게는, 표적 핵산 분자는 DNA이고, 더 바람직하게는 표적 핵산 분자는 이중-가닥 DNA이다.
부위 지정된 핵산 변형 폴리펩티드는 폴리펩티드로서 세포 또는 조성물 내에 도입될 수 있거나, 또는 상기 부위 지정된 핵산 변형 폴리펩티드를 코딩하는 RNA 분자의 도입에 의해 또는 상기 부위 지정된 핵산 변형 폴리펩티드를 발현시키는 발현 구축물의 도입에 의해 (여기서 발현 구축물은 상기 부위 지정된 핵산 변형 폴리펩티드를 코딩하는 유전자에 기능적으로 연결된 각각의 세포에 또는 조성물에 기능적인 프로모터를 포함하고 있음) 도입될 수 있다. 이러한 부위 지정된 핵산 변형 폴리펩티드에 대한 예는 표 1에 나타내었다. 또한, 이러한 부위 지정된 핵산 변형 폴리펩티드의 임의의 기능적 등가물이 본 발명의 방법에 사용될 수 있다.
표 1 부위 지정된 핵산 변형 폴리펩티드에 대한 예
부위 지정된 핵산 변형 폴리펩티드는 이중-가닥 핵산 소화 기능을 가질 수 있거나, 또는 그것은 이중-가닥 핵산 분자의 단지 하나의 가닥만을 절단하는 니카제 기능을 가질 수 있다. 부위 지정된 핵산 변형 폴리펩티드의 핵산 제한 또는 니카제 능력은 또한 불활성화될 수 있고, 재조합 부위 지정된 핵산 변형 폴리펩티드는 다른 기능적 그룹 예컨대 FokI 또는 귀소성 엔도뉴클레아제의 DNA 제한 영역에 연결될 수 있다. 이러한 재조합 부위 지정된 핵산 변형 폴리펩티드는 예를 들어 문헌 [Tsai et al. (2014; Nat Biotechnol. 2014 32(6):569-76.) 또는 Guilinger et al. (2014; Nat Biotechnol. 2014 32(6):577-82)]에 기재되어 있다.
gNA 분자는 표적 NA 분자에 100% 상보적인 적어도 12개의 염기를 포함하는 스페이서 핵산 (스페이서 NA) 분자를 포함한다. 바람직하게는 그것은 표적 NA 분자에 대해 상보적인 적어도 13개의 염기, 적어도 14개의 염기 또는 적어도 15개의 염기를 포함한다. 보다 바람직하게는 그것은 표적 NA 분자에 대해 상보적인 적어도 16개의 염기, 적어도 17개의 염기 또는 적어도 18개의 염기를 포함한다. 훨씬 더 바람직하게는 그것은 표적 NA에 대해 상보적인 적어도 19개의 염기 또는 적어도 20개의 염기를 포함한다.
gNA 분자는 스캐폴드 핵산 (스캐폴드 NA) 분자를 추가로 포함한다.
스캐폴드 NA는, 혼성화하여 헤어핀 구조를 형성할 수 있는, 각각이 서로 상보적인 적어도 8개의 염기를 포함하는 2개의 영역을 포함하는 하나의 핵산 분자로 이루어질 수 있다. 스캐폴드 NA는, 혼성화하여 이중-가닥 구조를 형성할 수 있는, 각각이 서로 상보적인 적어도 8개의 염기의 적어도 하나의 영역을 포함하는 2개의 핵산 분자로 이루어질 수 있다. 상기 영역이 8개 초과의 상보적 염기를 포함하고 있는 경우, 각각의 영역은 다른 영역의 적어도 8개의 염기에 대해 상보적인 적어도 8개의 염기를 포함한다.
바람직하게는 스캐폴드 NA는 1개의 분자로 이루어진다.
스캐폴드 NA 분자는 스페이서 NA 분자에 공유 연결된다. 스캐폴드 NA 분자가 2개의 독립적 분자로 이루어지는 경우, 스캐폴드 NA의 이들 분자 중 적어도 하나는 스페이서 NA 분자에 공유 연결된다.
서로에 대해 상보적인 적어도 8개의 염기를 포함하는 2개의 영역에 더하여, 스캐폴드 NA 분자는 적어도 하나의 헤어핀, 바람직하게는 적어도 2개의 헤어핀을 포함하는 2차 구조를 형성하는 추가의 영역을 포함한다.
공여자 NA 분자는 2개의 상동성 아암을 포함한다. 공여자 NA 분자의 각각의 상동성 아암은 적어도 15개의 염기를 포함하고, 상동성 아암을 이격하는 추가의 NA 영역의 크기의 적어도 5%, 바람직하게는 적어도 10%, 보다 바람직하게는 적어도 15%, 가장 바람직하게는 적어도 20%이다. 상동성 아암 1 및 2는 동일한 길이 또는 상이한 길이를 가질 수 있다.
상동성 아암 각각은 표적 NA 분자 내의 동일한 수의 연속적 염기에 대해 100% 상보적인 적어도 15개의 염기를 포함한다. 상동성 아암이 15개 초과의 염기인 경우, 그것은 표적 NA 분자에 대해 바람직하게는 적어도 60%, 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 75%, 더 바람직하게는 80%, 더 바람직하게는 적어도 85%, 더 바람직하게는 적어도 90%, 훨씬 더 바람직하게는 적어도 95%, 훨씬 더 바람직하게는 적어도 98%, 훨씬 더 바람직하게는 적어도 99% 상보적이다. 가장 바람직하게는 각각의 상동성 아암은 표적 NA 분자에 대해 100% 상보적이다.
본 발명의 방법은 표적 NA 분자를 포함하는 세포 또는 조성물에 적용될 수 있다. 바람직하게는 방법은 세포에 적용되며, 여기서 세포는 미생물, 동물, 인간 또는 식물 세포이고, 더 바람직하게는 방법은 효모 또는 식물 세포에 적용된다.
본 발명의 방법은 임의의 식물 세포, 예를 들어 겉씨식물 또는 속씨식물, 바람직하게는 속씨식물, 예를 들어 쌍자엽 또는 단자엽 식물 세포에 적용될 수 있다. 바람직한 단자엽 식물 세포는 예를 들어 옥수수, 밀, 벼, 보리, 수수, 무사, 사탕수수, 억새 및 브라키포디움(brachypodium)이고, 특히 바람직한 단자엽 식물 세포는 옥수수, 밀 및 벼이다. 바람직한 쌍자엽 식물 세포는 예를 들어 대두, 평지 종자, 카놀라, 아마인, 목화, 감자, 사탕무, 타게테스(tagetes) 및 아라비돕시스(Arabidopsis)이고, 특히 바람직한 쌍자엽 식물 세포는 대두, 평지 종자, 카놀라 및 감자이다.
본 발명의 방법은 또한 임의의 미생물에 적용될 수 있다. 미생물은 박테리아일 수 있고, 박테리아 세포는 임의의 그람-양성 박테리아 또는 그람 음성 박테리아일 수 있다. 그람 양성 박테리아는 바실루스(Bacillus), 브레비박테리움(Brevibacterium), 코리네박테리움(Corynebacterium), 스트렙토코쿠스(Streptococcus), 스트렙토미세스(Streptomyces), 스타필로코쿠스(Staphylococcus), 엔테로코쿠스(Enterococcus), 락토바실루스(Lactobacillus), 락토코쿠스(Lactococcus), 클로스트리디움(Clostridium), 게오바실루스(Geobacillus) 및 오세아노바실루스(Oceanobacillus)를 포함하나, 이에 제한되지는 않는다.
그람 음성 박테리아는 이. 콜라이(E. coli), 슈도모나스(Pseudomonas), 살모넬라(Salmonella), 캄필로박터(Campylobacter), 헬리코박터(Helicobacter), 아세토박터(Acetobacter), 플라보박테리움(Flavobacterium), 푸소박테리움(Fusobacterium), 글루코노박터(Gluconobacter)를 포함하나, 이에 제한되지는 않는다. 바람직하게는, 그람 음성 세포는 이. 콜라이 세포이다.
본 발명의 방법에서, 박테리아 세포는 임의의 바실루스 세포일 수 있다. 본 발명의 실시에 유용한 바실루스 세포는 바실루스 알칼로필루스(Bacillus alkalophilus), 바실루스 아밀로리퀘파시엔스(Bacillus amyloliquefaciens), 바실루스 브레비스(Bacillus brevis), 바실루스 시르쿨란스(Bacillus circulans), 바실루스 클라우시이(Bacillus clausii), 바실루스 코아굴란스(Bacillus coagulans), 바실루스 피르무스(Bacillus firmus), 바실루스 라우투스(Bacillus lautus), 바실루스 렌투스(Bacillus lentus), 바실루스 리케니포르미스(Bacillus licheniformis), 바실루스 메가테리움(Bacillus megaterium), 바실루스 푸밀루스(Bacillus pumilus), 바실루스 스테아로써모필루스(Bacillus stearothermophilus), 바실루스 서브틸리스(Bacillus subtilis) 및 바실루스 투린기엔시스(Bacillus thuringiensis) 세포를 포함하나, 이에 제한되지는 않는다. 바람직한 측면에서, 박테리아 세포는 바실루스 아밀로리퀘파시엔스, 바실루스 렌투스, 바실루스 리케니포르미스, 바실루스 스테아로써모필루스 또는 바실루스 서브틸리스 세포이다. 더 바람직한 측면에서, 박테리아 세포는 바실루스 리케니포르미스 세포 또는 바실루스 서브틸리스 세포이고, 바람직하게는 바실루스 서브틸리스 세포이다.
본 발명의 방법에서, 박테리아 숙주 세포는 락토바실루스 아시도필루스 (Lactobacillus acidophilus), 락토바실루스 플란타룸(Lactobacillus plantarum), 락토바실루스 가세리(Lactobacillus gasseri), 락토바실루스 불가리쿠스(Lactobacillus bulgaricus), 락토바실루스 레우테리(Lactobacillus reuteri), 스타필로코쿠스 아우레우스(Staphylococcus aureus), 코리네박테리움(Corynebacterium), 특히 종 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 코리네박테리움 아세토글루타미쿰(Corynebacterium acetoglutamicum), 코리네박테리움 아세토아시도필룸(Corynebacterium acetoacidophilum), 코리네박테리움 칼루나에(Corynebacterium callunae), 코리네박테리움 암모니아게네스(Corynebacterium ammoniagenes), 코리네박테리움 써모아미노게네스(Corynebacterium thermoaminogenes), 코리네박테리움 멜라세콜라(Corynebacterium melassecola) 및 코리네박테리움 에피지엔스(Corynebacterium effiziens), 코리네박테리움 에피시엔스(Corynebacterium efficiens), 코리네박테리움 데세르티(Corynebacterium deserti), 브레비박테리움 플라붐(Brevibacterium flavum), 브레비박테리움 락토페르멘툼(Brevibacterium lactofermentum), 브레비박테리움 디바리카툼(Brevibacterium divaricatum), 슈도모나스 푸티다(Pseudomonas putida), 슈도모나스 시린가에(Pseudomonas syringae), 스트렙토미세스, 특히 종 스트렙토미세스 코엘리콜로르(Streptomyces coelicolor), 스트렙토미세스 리비단스(Streptomyces lividans), 스트렙토미세스 알부스(Streptomyces albus), 스트렙토미세스 아베르미틸리스(Streptomyces avermitilis), 글루코노박터 옥시단스(Gluconobacter oxydans), 글루코노박터 모르비페르(Gluconobacter morbifer), 글루코노박터 타일란디쿠스(Gluconobacter thailandicus), 아세토박터 아세티(Acetobacter aceti), 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum), 클로스트리디움 사카로부틸리쿰(Clostridium saccharobutylicum), 클로스트리디움 베이제린크키이(Clostridium beijerinckii), 스트렙토코쿠스 에퀴시밀리스(Streptococcus equisimilis), 스트렙토코쿠스 피오게네스(Streptococcus pyogenes), 스트렙토코쿠스 우베리스(Streptococcus uberis) 및 스트렙토코쿠스 에퀴(Streptococcus equi) 아종 주에피데미쿠스(Zooepidemicus)일 수 있다. 또 다른 바람직한 박테리아는 바스피아 숙시니시프로두센스(Basfia succiniciproducens)이다.
미생물은 진핵 세포일 수 있다. 적합한 진핵 세포는 효모 세포, 예를 들어 사카로미세스(Saccharomyces) 종, 예컨대 사카로미세스 세레비지아에(Saccharomyces cerevisiae), 한세눌라(Hansenula) 종, 예컨대 한세눌라 폴리모르파(Hansenula polymorpha), 쉬조사카로미세스(Schizosaccharomyces) 종, 예컨대 쉬조사카로미세스 폼베(Schizosaccharomyces pombe), 클루이베로미세스(Kluyveromyces) 종, 예컨대 클루이베로미세스 락티스(Kluyveromyces lactis) 및 클루이베로미세스 마르시아누스(Kluyveromyces marxianus), 야로위아(Yarrowia) 종, 예컨대 야로위아 리폴리티카(Yarrowia lipolytica), 피키아(Pichia) 종, 예컨대 피키아 메타놀리카(Pichia methanolica), 피키아 스티피테스(Pichia stipites) 및 피키아 파스토리스(Pichia pastoris), 지고사카로미세스(Zygosaccharomyces) 종, 예컨대 지고사카로미세스 로욱시이(Zygosaccharomyces rouxii) 및 지고사카로미세스 바일리이(Zygosaccharomyces bailii), 칸디다(Candida) 종, 예컨대 칸디다 보이디니이(Candida boidinii), 칸디다 우틸리스(Candida utilis), 칸디다 프레이슈시이(Candida freyschussii), 칸디다 글라브라타(Candida glabrata) 및 칸디다 소노렌시스(Candida sonorensis), 슈완니오미세스(Schwanniomyces) 종, 예컨대 슈완니오미세스 옥시덴탈리스(Schwanniomyces occidentalis), 아륵술라(Arxula) 종, 예컨대 아륵술라 아데니니보란스(Arxula adeninivorans), 오가타에아(Ogataea) 종, 예컨대 오가타에아 미누타(Ogataea minuta), 클레브시엘라(Klebsiella) 종, 예컨대 클레브시엘라 뉴모니아(Klebsiella pneumonia)를 포함한다.
표적 핵산 분자는 세포에 내인성일 수 있거나, 또는 그것은 예를 들어 트랜스진 또는 바이러스 핵산 분자와 같이 세포에 이종일 수 있다.
doNA 분자 및 gNA 분자는 서로 공유 결합되어 융합 핵산 (융합 NA) 분자를 형성한다. 공여자 NA 분자는 gNA 분자의 스페이서 NA 부분에 또는 gNA 분자의 스캐폴드 NA 부분에 공유 결합될 수 있다. 바람직한 실시양태에서, 공여자 NA는 gNA 분자의 스캐폴드 NA 부분에 공유 연결된다.
가장 바람직하게는 융합 NA 분자는 1개의 분자, 바람직하게는 1개의 연속적 RNA 분자이며, 여기서 모든 요소 (gNA, 스캐폴드 NA 및 doNA)는 공유 연결된다.
doNA 분자 및 가이드 NA 분자는 RNA, DNA, PNA로 이루어질 수 있다. 바람직하게는 그들은 RNA 또는 DNA로 이루어진다. 더 바람직하게는 doNA 분자는 DNA로 이루어지고 가이드 NA 분자는 RNA로 이루어진다.
가장 바람직한 실시양태에서, 가이드 및 공여자 NA 둘 다는 RNA로 이루어지며, 여기서 적어도 doNA 및 gNA는 서로 공유 연결되어 융합 리보핵산 분자 (fuRNA)를 형성한다.
fuRNA 분자는 RNA 분자로서 또는 상기 fuRNA 분자를 코딩하는 하나 이상의 발현 구축물로서 표적 NA 분자를 포함하는 세포 또는 조성물 내에 도입될 수 있다.
또 다른 실시양태에서 doNA 분자 및 gNA 분자는 DNA로 이루어질 수 있으며, 여기서 doNA 및 gNA는 서로 공유 연결되어 융합 데옥시리보핵산 분자 (fuDNA)를 형성한다.
fuDNA 분자는 예를 들어 형질감염, 바이오리스틱, 전기천공, 광천공(photoporation), 휘스커, 초음파처리, 나노바디 또는 마이크로유체같은 다양한 방법에 의해 DNA 분자로서 표적 NA 분자를 포함하는 세포 또는 조성물 내에 도입될 수 있다. 그것은 T-DNA 분자를 세포 내로 전달할 수 있지만 표적 세포의 게놈 DNA 내로 상기 T-DNA 분자의 통합을 매개할 수는 없는 비히클로서 아그로박테리움을 사용하여 또한 도입될 수 있다. T-DNA는 fuDNA 분자를 포함하거나 이로 이루어질 것이다.
본 발명의 추가 실시양태는 재조합 fuNA 분자, 예를 들어 gNA 분자에 공유 연결된 doNA 분자를 포함하는, fuRNA 또는 fuDNA 분자이다.
본 발명의 또 다른 실시양태는 본 발명의 fuNA 분자를 코딩하는 DNA 분자에 기능적으로 연결된 프로모터를 포함하는 발현 구축물을 포함하는 벡터이다.
본 발명의 추가 실시양태는 본 발명의 fuNA 분자 및 핵산 변형 폴리펩티드를 포함하는 세포이다.
본 발명의 추가 실시양태는
a. 본 발명의 fuNA 분자를 코딩하는 DNA 분자에 기능적으로 연결된 프로모터를 포함하는 발현 구축물을 포함하는 제1 벡터 및
b. 부위 지정된 핵산 변형 폴리펩티드를 코딩하는 제2 벡터 및 임의로
c. 스캐폴드 NA 분자의 일부분을 코딩하는 제3 벡터
를 포함하는 벡터 시스템이다.
바람직한 실시양태에서, a. 하의 벡터는 스페이서 NA, 스캐폴드 NA 및 doNA를 포함하는 fuNA 분자를 코딩하는 발현 구축물을 포함한다.
c. 하의 벡터는 스캐폴드 NA가 2개의 분자로 이루어져 있는 경우, 및 a. 하의 벡터가 스캐폴드 NA 분자의 단지 1개의 분자를 포함하는 융합 NA 분자를 코딩하고 스캐폴드 NA 분자의 제2 분자를 코딩하지 않는 경우에 필요하고 본 발명의 벡터 시스템의 부분이다.
A. 본 발명의 fuNA 분자를 코딩하는 DNA 분자에 기능적으로 연결된 프로모터를 포함하는 발현 구축물을 포함하는 제1 벡터 및
B. 부위 지정된 핵산 변형 폴리펩티드를 코딩하는 제2 벡터 및
C. 표적 NA 분자를 포함하는 세포 및 임의로
D. 스캐폴드 NA 분자의 일부분을 코딩하는 제3 벡터
를 포함하는, 세포 내 표적 NA의 변형을 위한 시스템
이 본 발명의 또 다른 실시양태이다. 바람직한 실시양태에서, A. 하의 벡터는 스페이서 NA, 스캐폴드 NA 및 doNA를 포함하는 fuNA 분자를 코딩하는 발현 구축물을 포함한다. D. 하의 벡터는 스캐폴드 NA가 2개의 분자로 이루어져 있는 경우, 및 A. 하의 벡터가 스캐폴드 NA 분자의 단지 1개의 분자를 포함하는 융합 NA 분자를 코딩하고 스캐폴드 NA 분자의 제2 분자를 코딩하지 않은 경우에 필요하고 본 발명의 시스템의 부분이다.
본 발명의 또 다른 실시양태는
a. 본 발명의 fuNA 분자를 코딩하는 DNA 분자에 기능적으로 연결된 프로모터를 포함하는 발현 구축물을 포함하는 제1 벡터 및
b. 부위 지정된 핵산 변형 폴리펩티드를 코딩하는 제2 벡터 및
c. 표적 NA 분자를 포함하는 세포 및 임의로
d. 스캐폴드 NA 분자의 일부분을 코딩하는 제3 벡터
를 포함하는 조성물이다.
바람직한 실시양태에서, a. 하의 벡터는 스페이서 NA, 스캐폴드 NA 및 doNA를 포함하는 fuNA 분자를 코딩하는 발현 구축물을 포함한다. d. 하의 벡터는 스캐폴드 NA가 2개의 분자로 이루어져 있는 경우, 및 a. 하의 벡터가 스캐폴드 NA 분자의 단지 1개의 분자를 포함하는 융합 NA 분자를 코딩하고 스캐폴드 NA 분자의 제2 분자를 코딩하지 않는 경우에 필요하고 본 발명의 조성물의 부분이다.
세포 또는 조성물 내 표적 NA 분자의 변형을 위한 본 발명의 벡터, 본 발명의 벡터 시스템, 본 발명의 시스템 및/또는 본 발명의 조성물의 용도가 또한 본 발명의 한 실시양태이다.
정의
본 발명은 특정한 방법론 또는 프로토콜로 제한되지 않는 것으로 이해되어야 한다. 또한, 본원에 사용된 용어는 특정한 실시양태만을 기재하기 위한 목적을 위한 것으로, 본 발명의 범위를 제한하고자 하는 것이 아니며, 본 발명의 범주는 첨부된 청구범위에 의해서만 제한될 것으로 이해되어야 한다. 본원 및 첨부된 청구범위에서 사용되는 바와 같이, 단수 형태는 문맥에서 달리 명백하게 나타내지 않는 한 복수 지시대상을 포함함을 주목하여야 한다. 따라서, 예를 들어, "벡터"에 대한 언급은 하나 이상의 벡터에 대한 언급이고, 관련 기술분야의 통상의 기술자에게 공지된 그의 등가물 등을 포함한다. 용어 "약"은 대략적으로, 대략, 부근 또는 영역 내의 것을 의미하는 것으로 본원에 사용된다. 용어 "약"이 수치 범위와 함께 사용되는 경우에, 이는 경계를 기재된 수치 값 초과 및 미만까지 확장함으로써 범위를 변경한다. 일반적으로, 용어 "약"은 수치값을 언급된 값의 위 및 아래로 20%, 바람직하게는 10% 증가 또는 감소한 (더 높거나 또는 더 낮은) 변동치만큼 변경하기 위해 본원에서 사용된다. 본원에 사용된 용어 "또는"은 특정한 목록의 임의의 하나의 구성원을 의미하고, 상기 목록의 구성원의 임의의 조합도 또한 포함한다. 용어 "포함하다" 및 "포함하는"은 본 명세서 및 하기 청구범위에서 사용될 때 하나 이상의 언급된 특색, 정수, 성분 또는 단계의 존재를 구체화하는 것이 의도되지만, 하나 이상의 다른 특색, 정수, 성분, 단계 또는 이들의 군의 존재 또는 추가를 배제하지 않는다. 명확성을 위해, 본 명세서에 사용된 특정 용어는 다음과 같이 정의되고 사용된다:
공여자 NA: 용어 "공여자 NA" 또는 "doNA"는 각각이 표적 NA의 적어도 15개의 연속적 염기의 2개의 상이한 영역에 대해 상보적인 적어도 15개의 염기를 포함하는 2개의 상동성 아암을 포함하는 핵산을 의미하며, 여기서 상기 2개의 상동성 아암은 서로 직접 인접하거나, 또는 하나 이상의 추가의 염기에 의해 분리된다.
상동성 아암이 상보적인 표적 NA의 2개의 상이한 영역은 서로 직접 인접하거나, 또는 20 kb 이하, 바람직하게는 10 kb 이하, 바람직하게는 5 kb 이하, 보다 바람직하게는 3 kb 이하, 보다 바람직하게는 2.5 kb 이하, 보다 바람직하게는 2 kb 이하의 추가의 염기에 의해 분리될 수 있다.
상동성 아암이 15개 초과의 염기를 포함하는 경우, 그것은 표적 NA에 대해 100% 상보적일 수 있거나, 또는 그것은 표적 NA에 대해 적어도 75% 상보적, 바람직하게는 적어도 80% 상보적, 보다 바람직하게는 적어도 85% 상보적, 보다 바람직하게는 적어도 90% 상보적, 보다 바람직하게는 적어도 95% 상보적, 보다 바람직하게는 적어도 98% 상보적일 수 있으며, 여기서 상동성 아암이 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 15개의 염기의 적어도 하나의 스트레치를 포함하고, 바람직하게는 상동성 아암이 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 18개의 염기의 적어도 하나의 스트레치를 포함하고, 보다 바람직하게는 상동성 아암이 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 20개의 염기의 적어도 하나의 스트레치를 포함하고, 훨씬 더 바람직하게는 상동성 아암이 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 25개의 염기의 적어도 하나의 스트레치를 포함하고, 훨씬 더 바람직하게는 상동성 아암이 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 50개의 염기의 적어도 하나의 스트레치를 포함한다.
상동성 아암은 표적 NA에 대해 동일한 길이 및/또는 동일한 정도의 상보성을 가질 수 있거나, 또는 표적 NA에 대해 상이한 길이 및/또는 상이한 정도의 상보성을 가질 수 있다.
상동성 아암은 서로 직접 인접하거나, 또는 상동성 아암에 대해 상보적인 표적 핵산 내 영역 사이에 존재하지 않는 적어도 하나의 염기를 포함하는 핵산 분자에 의해 분리될 수 있다.
스페이서 NA: 용어 "스페이서 핵산" 또는 "스페이서 NA"는 표적 NA에 대해 100% 상보적인 적어도 12개의 염기를 포함하는 핵산을 의미한다.
스페이서 NA가 12개 초과의 염기를 포함하는 경우, 그것은 표적 NA에 대해 적어도 75% 상보적, 바람직하게는 적어도 80% 상보적, 보다 바람직하게는 적어도 85% 상보적, 보다 바람직하게는 적어도 90% 상보적, 보다 바람직하게는 적어도 95% 상보적, 보다 바람직하게는 적어도 98% 상보적일 수 있고, 가장 바람직하게는 그것은 표적 NA에 대해 100% 상보적이며, 여기서 스페이서 NA가 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 12개의 염기의 적어도 하나의 스트레치를 포함하고, 바람직하게는 스페이서 NA가 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 15개의 염기의 적어도 하나의 스트레치를 포함하고, 바람직하게는 스페이서 NA가 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 18개의 염기의 적어도 하나의 스트레치를 포함하고, 보다 바람직하게는 스페이서 NA가 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 20개의 염기의 적어도 하나의 스트레치를 포함하고, 훨씬 더 바람직하게는 스페이서 NA가 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 25개의 염기의 적어도 하나의 스트레치를 포함하고, 훨씬 더 바람직하게는 스페이서 NA가 표적 NA 내에 동일한 수의 연속적 염기의 스트레치에 대해 100% 상보적인 적어도 50개의 염기의 적어도 하나의 스트레치를 포함한다.
스페이서 NA는 스캐폴드 NA에 공유 연결된다. 스캐폴드 NA가 2개의 핵산 분자로 이루어져 있는 경우, 스페이서는 스캐폴드 NA의 1개의 분자에 공유 연결된다.
스캐폴드 NA: 스캐폴드 핵산 또는 스캐폴드 NA는 부위 지정된 핵산 변형 폴리펩티드에 의해 결합되는 적어도 하나의 헤어핀, 바람직하게는 적어도 2개의 헤어핀 및/또는 서열을 포함하는 2차 구조를 형성하는 핵산을 포함한다. 이러한 부위 지정된 핵산 변형 폴리펩티드는 관련 기술분야에, 예를 들어 WO/2014/150624; WO/2014/204728에 공지되어 있다. 스캐폴드 NA는 각각이 서로 상보적인 적어도 8개의 염기를 포함하는 2개 영역을 추가로 포함하며, 따라서 혼성화하여 이중-가닥 구조를 형성하는 것이 가능하다. 서로 상보적인 적어도 8개의 염기의 상기 영역이 8개 초과의 염기를 포함하고 있는 경우, 각각의 영역은 다른 영역의 적어도 8개의 염기에 대해 상보적인 적어도 8개의 염기를 포함한다.
스캐폴드 NA의 2개의 상보적 영역은 헤어핀 구조를 형성하는 링커 분자를 통해 서로 공유 연결될 수 있거나, 또는 2개의 독립적 핵산 분자로 이루어질 수 있다.
가이드 NA: 가이드 핵산 또는 가이드 NA 또는 gNA는 스페이서 핵산 및 스캐폴드 핵산을 포함하며, 여기서 스페이서 NA 및 스캐폴드 NA는 서로 공유 연결된다. 스캐폴드 NA가 2개의 분자로 이루어지는 경우, 스페이서 NA는 스캐폴드 NA의 1개의 분자에 공유 연결되는 반면, 스캐폴드 NA 분자의 다른 분자는 제1 스캐폴드 NA 분자에 혼성화된다. 따라서, 가이드 NA 분자는 하나의 핵산 분자로 이루어질 수 있거나, 2개의 핵산 분자로 이루어질 수 있다. 바람직하게는 가이드 NA는 1개의 분자로 이루어진다.
융합 NA: 융합 핵산은 공여자 NA 및 가이드 NA를 포함하며, 여기서 가이드 NA 및 공여자 NA는 서로 공유 연결된다.
부위 지정된 핵산 변형 폴리펩티드: "부위 지정된 핵산 변형 폴리펩티드", "핵산-결합 부위 지정된 핵산 변형 폴리펩티드" 또는 "부위 지정된 폴리펩티드"는 핵산에 결합하고 특정한 핵산 서열에 표적화되는 폴리펩티드를 의미한다. 본원엔 기재된 부위-지정된 핵산 변형 폴리펩티드는 폴리펩티드에 대해 고유한 메카니즘에 의해 또는 바람직하게는 그것이 결합된 핵산 분자에 의해 표적 핵산 내 특정한 핵산 서열에 표적화된다. 폴리펩티드에 의해 결합된 핵산 분자는 표적 핵산 내의 표적 서열에 대해 상보적인 서열을 포함하며, 따라서 결합된 폴리펩티드는 표적 핵산 내의 특정한 위치 (표적 서열)를 표적화한다.
대부분의 부위 지정된 핵산 변형 폴리펩티드는 dsDNA 절단부를 도입하지만, 그들은 단지 니킹 활성만을 갖도록 변형될 수 있거나 또는 뉴클레아제 활성이 불활성화될 수 있다. 부위 지정된 핵산 변형 폴리펩티드는 활성 예컨대 형광 또는 뉴클레아제 활성 예컨대 FokI 폴리펩티드 또는 I-SceI와 같은 귀소 엔도뉴클레아제 폴리펩티드의 뉴클레아제 활성을 갖는 추가적 폴리펩티드에 결합될 수 있다.
코딩 영역: 본원에 사용된 용어 "코딩 영역"은 구조 유전자에 관련하여 사용될 때, mRNA 분자의 번역의 결과로서 신생 폴리펩티드 내에서 발견되는 아미노산을 코딩하는 뉴클레오티드 서열을 나타낸다. 코딩 영역은 진핵생물에서, 개시인자 메티오닌을 코딩하는 뉴클레오티드 삼중자 "ATG"에 의해 5'-측 상에 결합되고, 원핵생물은 또한 개시 코돈으로서 삼중자 "GTG" 및 "TTG"를 사용한다. 3'-측 상에서 이는 정지 코돈을 지정하는 3개의 삼중자 (즉, TAA, TAG, TGA) 중 하나에 의해 결합된다. 또한, 유전자는 RNA 전사체 상에 존재하는 서열의 5'-말단과 3'-말단 둘 다 상에 위치한 서열을 포함할 수 있다. 이들 서열은 "플랭킹" 서열 또는 영역으로서 언급된다 (이들 플랭킹 서열은 mRNA 전사체 상에 존재하는 비-번역 서열의 5' 또는 3'에 위치한다). 5'-플랭킹 영역은 유전자의 전사를 제어하거나 또는 이에 영향을 미치는 조절 서열, 예컨대 프로모터 및 인핸서를 함유할 수 있다. 3'-플랭킹 영역은 전사의 종결, 전사후 절단 및 폴리아데닐화를 지시하는 서열을 함유할 수 있다.
상보적: "상보적" 또는 "상보성"은 역평행 뉴클레오티드 서열 내의 상보적 염기 잔기들 간의 수소 결합 형성시 서로 쌍을 형성할 수 있는 (염기 쌍 형성 규칙에 의함) 역평행 뉴클레오티드 서열을 포함하는 2개의 뉴클레오티드 서열을 지칭한다. 예를 들어, 서열 5'-AGT-3'는 서열 5'-ACT-3'에 대해 상보적이다. 상보성은 "부분적" 또는 "전체"일 수 있다. "부분적" 상보성은 1개 이상의 핵산 염기가 염기 쌍 형성 규칙에 따라서 매칭되지 않는 경우이다. 핵산 분자 간의 "전체" 또는 "완전한" 상보성은 각각의 및 모든 핵산 염기가 염기 쌍 형성 규칙 하에 또 다른 염기와 매칭되는 경우이다. 핵산 분자 가닥 간의 상보성 정도는 핵산 분자 가닥 간의 혼성화의 효율 및 강도에 대해 상당한 효과를 지니고 있다. 본원에 사용된 바와 같은 핵산 서열의 "상보체"는 그의 핵산 분자가 핵산 서열의 핵산 분자에 대해 전체 상보성을 나타내는 뉴클레오티드 서열을 지칭한다.
내인성: "내인성" 뉴클레오티드 서열은 야생형 미생물의 게놈에 존재하는 뉴클레오티드 서열을 지칭한다.
증진된 발현: 미생물에서의 핵산 분자의 발현을 "증진" 또는 "증가"시키는 것은 본원에서 동등하게 사용되고, 이는 미생물에서의 핵산 분자의 발현 수준이 참조 미생물, 예를 들어 야생형과 비교하여 더 높다는 것을 의미한다. 본원에 사용된 용어 "증진된" 또는 "증가된"은 발현될 핵산 분자의 발현이 본원에서 더 높다는 것을, 바람직하게는 유의하게 더 높다는 것을 의미한다. 본원에 사용된 바와 같은, 단백질, mRNA 또는 RNA와 같은 작용제의 수준의 "증진" 또는 "증가"는 그 수준이 실질적으로 동일한 조건 하에 성장한 실질적으로 동일한 미생물과 비교하여 증가되는 것을 의미한다. 본원에 사용된 바와 같은, 표적 유전자에 의해 발현된 작용제, 예컨대 예를 들어 preRNA, mRNA, rRNA, tRNA, 및/또는 그에 의해 코딩된 단백질 산물의 수준의 "증진" 또는 "증가"는 그 수준이 적합한 참조 미생물과 비교하여 50% 이상, 예를 들어 100% 이상, 바람직하게는 200% 이상, 보다 바람직하게는 5배 이상, 보다 더 바람직하게는 10배 이상, 가장 바람직하게는 20배 이상, 예를 들어 50배 증가되는 것을 의미한다. 이러한 증진 또는 증가는 통상의 기술자에게 친숙한 방법에 의해 결정될 수 있다. 따라서, 핵산 또는 단백질 양의 증진 또는 증가는, 예를 들어 단백질의 면역학적 검출에 의해 결정될 수 있다. 더욱이, 단백질 검정, 형광, 노던(Northern) 혼성화, 뉴클레아제 보호 검정, 겔 중 핵산 농도의 밀도측정 측정, 역전사 (정량적 RT-PCR), ELISA (효소-연결 면역흡착 검정), 웨스턴 블롯팅(Western blotting), 방사성면역검정 (RIA) 또는 기타 면역검정 및 형광-활성화 세포 분석 (FACS)과 같은 기술을 사용하여, 미생물에서의 특정 단백질 또는 RNA를 측정할 수 있다. 유도된 단백질 산물의 유형에 따라서, 상기 미생물의 표현형에 대한 효과 또는 그의 활성을 또한 결정할 수 있다. 단백질 양을 결정하는 방법은 숙련된 작업자에게 공지되어 있다. 언급될 수 있는 예는 다음과 같다: 마이크로-뷰렛(micro-Biuret) 방법 (Goa J (1953) Scand J Clin Lab Invest 5:218-222), 폴린-시오칼토(Folin-Ciocalteau) 방법 (Lowry OH et al. (1951) J Biol Chem 193:265-275) 또는 CBB G-250의 흡광도를 측정하는 방법 (Bradford MM (1976) Analyt Biochem 72:248-254).
발현: "발현"은 세포에서 유전자 산물의 생합성, 바람직하게는 뉴클레오티드 서열, 예를 들어 내인성 유전자 또는 이종 유전자의 전사 및/또는 번역을 지칭한다. 예를 들어, 구조 유전자의 경우에, 발현은 이러한 구조 유전자를 mRNA로 전사하고, 임의로 mRNA를 하나 이상의 폴리펩티드로 후속 번역하는 것을 포함한다. 다른 경우에, 발현은 RNA 분자를 정착시킨 DNA의 전사만을 지칭할 수 있다.
외래: 용어 "외래"는 실험적 조작에 의해 세포 내로 도입되는 임의의 핵산 분자 (예를 들어, 유전자 서열)를 지칭하고, 이와 같이 도입된 서열이 일부 변형 (예를 들어, 점 돌연변이, 선택 마커 유전자의 존재 등)을 함유하는 한은 그 세포에서 발견되는 서열을 포함할 수 있고, 따라서 자연 발생 서열에 비해 상이하다.
기능적 단편: 용어 "기능적 단편"은 단지 본 발명의 전장 핵산 및/또는 전장 폴리펩티드의 부분을 포함하지만, 여전히 동일한 기능, 즉, 아크릴로일-CoA 및 부탄올의 n-BA 및 CoA로의 반응을 촉매하는 AAT 효소의 기능을 제공하는 임의의 핵산 및/또는 단백질을 지칭한다. 바람직하게는, 단편은 그것이 유래된 서열의 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%를 포함한다. 바람직하게는, 기능적 단편은 기능적 단편이 유래된 핵산 및/또는 단백질의 인접한 핵산 또는 아미노산을 포함한다. 단백질을 코딩하는 핵산 분자의 기능적 단편은 단백질의 기능적 단편을 코딩하는 핵산 분자의 단편을 의미한다.
기능적 연결: 용어 "기능적 연결" 또는 "기능적으로 연결된"은 용어 "작동가능한 연결" 또는 "작동가능하게 연결"과 동등하고, 예를 들어 각각의 조절 요소가 그의 의도된 기능을 충족시켜, 발현될 핵산 서열의 발현을 허용하거나, 변형시키거나, 촉진시키거나 또는 달리 영향을 미칠 수 있도록 하는 방식으로, 조절 요소 (예를 들어, 프로모터)가 상기 발현될 핵산 서열, 및 경우에 따라 추가의 조절 요소 (예컨대 예를 들어, 종결인자)와 순차적으로 배열되는 것을 의미하는 것으로 이해되어야 한다. 동의어로서, "작동가능한 연결" 또는 "작동가능하게 연결"이란 표현을 사용할 수 있다. 발현은 센스 또는 안티센스 RNA와 관련한 핵산 서열의 배열에 따라서 유발될 수 있다. 이러한 목적을 위해, 화학적 의미에서의 직접적인 연결이 반드시 요구되지는 않는다. 유전자 제어 서열, 예컨대 예를 들어 인핸서 서열은 또한, 추가로 떨어져 있거나 또는 실제로 다른 DNA 분자로부터 떨어져 있는 위치에서 표적 서열에 대해 그의 기능을 발휘할 수 있다. 바람직한 배열은 재조합적으로 발현될 핵산 서열이 프로모터로서 작용하는 서열 뒤에 위치하고 있으므로, 두 서열이 서로 공유 연결되는 배열이다. 바람직한 실시양태에서, 전사될 핵산 서열은 전사 출발점이 본 발명의 키메라 RNA의 목적하는 시작점과 동일한 방식으로 프로모터 뒤에 위치한다. 기능적 연결, 및 발현 구축물은 문헌 (예를 들어, 문헌 [Sambrook J, Fritsch EF and Maniatis T (1989); Silhavy et al. (1984) Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor (NY); Ausubel et al. (1987) Current Protocols in Molecular Biology, Greene Publishing Assoc. and Wiley Interscience; Gelvin et al. (Eds) (1990) Plant Molecular Biology Manual; Kluwer Academic Publisher, Dordrecht, The Netherlands])에 기재된 바와 같은 통상적인 재조합 및 클로닝 기술을 통해 생성될 수 있다. 그러나, 예를 들어 제한 효소에 대한 특이적 절단 부위를 수반한 링커로서 작용하거나 또는 신호 펩티드로서 작용하는 추가 서열이 또한, 상기 두 서열 사이에 위치할 수 있다. 서열의 삽입으로 인해, 융합 단백질의 발현이 유발될 수도 있다. 바람직하게는, 조절 영역, 예를 들어 프로모터와 발현될 핵산 서열의 연결로 이루어진 발현 구축물이 벡터-통합된 형태로 존재할 수 있거나 또는 예를 들어 형질전환에 의해 게놈 내로 삽입될 수 있다.
유전자: 용어 "유전자"는 일부 방식으로 유전자 산물 (예를 들어, 폴리펩티드 또는 기능적 RNA)의 발현을 조절할 수 있는 적절한 조절 서열과 작동가능하게 연결된 영역을 지칭한다. 유전자는 코딩 영역 (오픈 리딩 프레임, ORF) 선행 (상류) 및 하행 (하류) DNA의 비번역 조절 영역 (예를 들어, 프로모터, 인핸서, 리프레서 등)을 포함한다. 본원에 사용된 용어 "구조 유전자"는 mRNA로 전사된 다음, 특정 폴리펩티드 특유의 아미노산 서열로 번역되는 DNA 서열을 의미한다.
게놈 또는 게놈 DNA: 용어 "게놈" 또는 "게놈 DNA"는 숙주 유기체의 유전적 유전자 정보를 지칭한다. 상기 게놈 DNA는 핵양체의 DNA 뿐만 아니라 자기-복제 플라스미드의 DNA를 포함한다.
이종: 핵산 분자 또는 DNA와 관련된 용어 "이종"은 자연에서는 작동가능하게 연결되지 않거나 또는 자연에서는 상이한 위치에서 작동가능하게 연결되는 제2의 핵산 분자와 작동가능하게 연결되거나 또는 이러한 분자와 작동가능하게 연결되도록 조작되는 핵산 분자를 지칭한다. 핵산 분자, 및 이와 연결된 하나 이상의 조절 핵산 분자 (예컨대, 프로모터 또는 전사 종결 신호)를 포함하는 이종 발현 구축물은 예를 들어, a) 상기 핵산 분자, 또는 b) 상기 조절 핵산 분자, 또는 c) 둘 다 (즉 (a) 및 (b))가 그의 자연 (천연) 유전적 환경에 위치되지 않거나 또는 실험적 조작에 의해 변형된 (변형의 예는 하나 이상의 뉴클레오티드 잔기의 치환, 부가, 결실, 역위 또는 삽입임), 실험적 조작에 의해 유래되는 구축물이다. 자연 유전적 환경은 기원 유기체 내의 자연 게놈 유전자좌, 또는 게놈 라이브러리 내에서의 존재를 지칭한다. 게놈 라이브러리의 경우에는, 핵산 분자의 서열의 자연 유전적 환경이 적어도 부분적으로 보유되는 것이 바람직하다. 이러한 환경은 적어도 한쪽에 있는 핵산 서열에 플랭킹되고, 적어도 50 bp, 바람직하게는 적어도 500 bp, 특히 바람직하게는 적어도 1,000 bp, 매우 특히 바람직하게는 적어도 5,000 bp 길이의 서열을 갖는다. 자연 발생 발현 구축물 - 예를 들어 프로모터와 상응하는 유전자의 자연 발생 조합물 - 은 비-자연, 합성 "인공" 방법, 예컨대 예를 들어, 돌연변이유발에 의해 변형되는 경우에 트랜스제닉 발현 구축물로 된다. 상기 방법은 문헌에 기재되어 있다 (US 5,565,350; WO 00/15815). 예를 들어, 핵산 분자의 천연 프로모터가 아닌 프로모터와 작동가능하게 연결된 핵산 분자를 코딩하는 단백질이, 이러한 프로모터와 관련하여 이종인 것으로 간주된다. 바람직하게는, 이종 DNA는 이것이 도입되는 세포에 대해 내인성이 아니거나 또는 이러한 세포와 자연적으로 회합되지 않지만, 또 다른 세포로부터 수득되거나 또는 합성된 것이다. 이종 DNA는 또한, 내인성 DNA 서열의 일부 변형, 비-자연 발생, 다중 카피를 함유하는 내인성 DNA 서열, 또는 그와 물리적으로 연결된 또 다른 DNA 서열과 자연적으로 회합되지 않는 DNA 서열을 포함한다. 반드시는 아니지만 일반적으로, 이종 DNA는 이것이 발현되는 세포에 의해서는 정상적으로 생산되지 않는 RNA 또는 단백질을 코딩한다.
혼성화: 본원에 사용된 용어 "혼성화"는 "핵산 분자의 가닥이 염기 쌍형성을 통해 상보적 가닥과 결합되는 임의의 공정"을 포함한다 (J. Coombs (1994) Dictionary of Biotechnology, Stockton Press, New York). 혼성화 및 혼성화의 강도 (즉, 핵산 분자들 간의 회합 강도)는 핵산 분자들 간의 상보성 정도, 관련된 조건의 엄격도, 형성된 혼성체의 Tm, 및 핵산 분자 내의 G:C 비와 같은 요인들에 의해 영향을 받는다. 본원에 사용된 용어 "Tm"은 "용융 온도"와 관련하여 사용된다. 용융 온도는 이중 가닥 핵산 분자의 집단이 절반 분리되어 단일 가닥으로 되는 온도이다. 핵산 분자의 Tm을 계산하는 방정식은 관련 기술분야에 널리 공지되어 있다. 표준 참고문헌에 의해 표시된 바와 같이, Tm 값의 간단한 평가치는, 핵산 분자가 1 M NaCl 하의 수용액 중에 있는 경우에 다음 방정식으로써 계산될 수 있다: Tm=81.5+0.41(% G+C) (예를 들어, 문헌 [Anderson and Young, Quantitative Filter Hybridization, in Nucleic Acid Hybridization (1985)] 참조). 다른 참고문헌은 보다 복잡한 계산을 포함하는데, 이는 Tm을 계산하기 위해 구조적 특징뿐만 아니라 서열 특징을 고려한다. 엄격한 조건은 관련 기술분야의 통상의 기술자에게 공지되어 있고 문헌 [Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6]에서 찾을 수 있다.
적합한 혼성화 조건은, 예를 들어 서열의 상보체의 적어도 50개, 바람직하게는 적어도 100개, 보다 바람직하게는 적어도 150개, 보다 더 바람직하게는 적어도 200개, 가장 바람직하게는 적어도 250개의 연속되는 뉴클레오티드를 포함하는 핵산 분자와, 50℃ 하에 2 X SSC, 0.1% 소듐 도데실 술페이트 (SDS)에서 세척하면서 (저 엄격도) 50℃ 하에 7% SDS, 0.5 M NaPO4, 1 mM EDTA에서 혼성화시키는 것과 등가의 조건 하에 혼성화되는 것이다. 다른 적합한 혼성화 조건은 서열의 상보체의 적어도 50개, 바람직하게는 적어도 100개, 보다 바람직하게는 적어도 150개, 보다 더 바람직하게는 적어도 200개, 가장 바람직하게는 적어도 250개의 연속되는 뉴클레오티드를 포함하는 핵산 분자와, 50℃ (중간 수준의 엄격도) 또는 65℃ (고도의 엄격도) 하에 1 X SSC, 0.1% 소듐 도데실 술페이트 (SDS)에서 세척하면서 50℃ 하에 7% SDS, 0.5 M NaPO4, 1 mM EDTA에서 혼성화시키는 것이다. 다른 적합한 혼성화 조건은 서열의 상보체의 적어도 50개, 바람직하게는 적어도 100개, 보다 바람직하게는 적어도 150개, 보다 더 바람직하게는 적어도 200개, 가장 바람직하게는 적어도 250개의 연속되는 뉴클레오티드를 포함하는 핵산 분자와, 65℃ (매우 고도의 엄격도) 하에 0.1 X SSC, 0.1% 소듐 도데실 술페이트 (SDS)에서 세척하면서 50℃ 하에 7% SDS, 0.5 M NaPO4, 1 mM EDTA에서 혼성화시키는 것이다.
"동일성": 2개 이상의 핵산 또는 아미노산 분자의 비교와 관련하여 사용되는 경우의 "동일성"은 상기 분자의 서열이 특정 정도의 서열 유사성을 공유하는 것을 의미하며, 서열은 부분적으로 동일하다.
2개 이상의 아미노산 또는 2개 이상의 뉴클레오티드 서열의 백분율 동일성을 결정하기 위한 여러 컴퓨터 소프트웨어 프로그램이 개발되었다. 2개 이상의 서열의 동일성은, 예를 들어 소프트웨어 파스타(fasta) (이는 현재 버전 파스타 3으로 사용되고 있음)를 사용하여 계산할 수 있다 (W. R. Pearson and D. J. Lipman, PNAS 85, 2444(1988); W. R. Pearson, Methods in Enzymology 183, 63 (1990); W. R. Pearson and D. J. Lipman, PNAS 85, 2444 (1988); W. R. Pearson, Enzymology 183, 63 (1990)). 상이한 서열의 동일성 계산을 위한 또 다른 유용한 프로그램은 바이오맥스 페던트(Biomax pedant) 소프트웨어에 포함된 표준 블라스트(blast) 프로그램이다 (바이오맥스, 독일 뮌헨). 이는 불행하게도 때때로, 준최적 결과를 유발하는데, 이는 블라스트가 대상 및 질의의 완전한 서열을 항상 포함하지는 않기 때문이다. 그럼에도 불구하고, 이러한 프로그램은 매우 효율적이기 때문에, 매우 많은 수의 서열을 비교하는데 사용될 수 있다. 하기 설정이 이러한 서열 비교를 위해 전형적으로 사용된다:
-p 프로그램 명칭 [문자열]; -d 데이터베이스 [문자열]; 디폴트 = nr; -i 질의 파일 [파일 인]; 디폴트 = stdin; -e 기대 값 (E) [실제]; 디폴트 = 10.0; -m 정렬 뷰 옵션: 0 = 쌍형성; 1 = 동일성을 보여주는 질의-참조; 2 = 동일성이 없는 질의-참조; 3 = 동일성을 보여주는, 플랫 질의-참조; 4 = 동일성이 없는, 플랫 질의-참조; 5 = 동일성이 없고 평활 말단인, 질의-참조; 6 = 동일성이 없고 평활 말단인, 플랫 질의-참조; 7 = XML 블라스트 출력; 8 = 테이블 형태; 9 = 주석 라인을 수반한 테이블 형태 [정수]; 디폴트 = 0; -o BLAST 리포트 출력 파일 [파일 아웃] 선택적; 디폴트 = stdout; -F 필터 질의 서열 (blastn을 수반한 DUST, 다른 것을 수반한 SEG) [문자열]; 디폴트 = T; -G 갭을 개방하기 위한 비용 (제로는 디폴트 행위를 호출한다) [정수]; 디폴트 = 0; -E 갭을 확장하기 위한 비용 (제로는 디폴트 행위를 호출한다) [정수]; 디폴트 = 0; -X 갭 형성된 정렬에 대한 X 드롭오프 (비트) (제로는 디폴트 행위를 호출한다); blastn 30, 메가블라스트 20, tblastx 0, 기타 모두 15 [정수]; 디폴트 = 0; -I 디플라인에서의 GI를 나타낸다 [T/F]; 디폴트 = F; -q 뉴클레오티드 미스매치에 대한 페널티 (blastn 경우만) [정수]; 디폴트 = -3; -r 뉴클레오티드 매치에 대한 보상 (blastn 경우만) [정수]; 디폴트 = 1; -v (V)에 대한 온-라인 설명을 나타내는 데이터베이스 서열의 수 [정수]; 디폴트 = 500; -b (B)에 대한 정렬을 나타내는 데이터베이스 서열의 수 [정수]; 디폴트 = 250; -f 확장성 히트에 대한 역치, 제로인 경우 디폴트; blastp 11, blastn 0, blastx 12, tblastn 13; tblastx 13, 메가블라스트 0 [정수]; 디폴트 = 0; -g 갭 형성된 정렬을 수행한다 (tblastx으로는 이용가능하지 않음) [T/F]; 디폴트 = T; -Q 사용하기 위한 질의 유전자 코드 [정수]; 디폴트 = 1; -D DB 유전자 코드 (tblast[nx] 경우에만) [정수]; 디폴트 = 1; -a 사용되는 프로세서의 수 [정수]; 디폴트 = 1; -O SeqAlign 파일 [파일 아웃] 선택적; -J 질의 디플라인을 신뢰한다 [T/F]; 디폴트 = F; -M 매트릭스 [문자열]; 디폴트 = BLOSUM62; -W 단어 크기, 제로인 경우 디폴트 (blastn 11, 메가블라스트 28, 기타 모두 3) [정수]; 디폴트 = 0; -z 데이터베이스의 유효 길이 (실제 크기에 대해서는 제로를 이용한다) [실제]; 디폴트 = 0; -K 유지하기 위한 영역으로부터 최적 히트의 수 (디폴트에 의한 오프, 사용된 경우에는 100의 값이 권장된다) [정수]; 디폴트 = 0; -P 다중 히트의 경우에는 0이고, 단일 히트에 대해서는 1이다 [정수]; 디폴트 = 0; -Y 조사 공간의 유효 길이 (실제 크기에 대해서는 제로를 이용한다) [실제]; 디폴트 = 0; -S 데이터베이스에 대항하여 조사하기 위한 질의 가닥 (blast[nx], 및 tblastx의 경우); 3은 둘 다이고, 1은 상단이며, 2는 하단이다 [정수]; 디폴트 = 3; -T HTML 출력을 생산한다 [T/F]; 디폴트 = F; -l 데이터베이스의 조사를 GI의 목록으로 제한한다 [문자열] 선택적; -U FASTA 서열의 소문자 필터를 이용한다 [T/F] 선택적; 디폴트 = F; -y 갭을 형성하지 않은 확장물에 대한 X 드롭오프 값 (비트) (0.0은 디폴트 행위를 호출한다); blastn 20, 메가블라스트 10, 기타 모두 7 [실제]; 디폴트 = 0.0; -Z 최종 갭 형성된 정렬에 대한 X 드롭오프 값 (비트) (0.0은 디폴트 행위를 호출한다); blastn/메가블라스트 50, tblastx 0, 기타 모두 25 [정수]; 디폴트 = 0; -R PSI-TBLASTN 체크포인트 파일 [파일 인] 선택적; -n 메가블라스트 조사 [T/F]; 디폴트 = F; -L 질의 서열 상의 위치 [문자열] 선택적; -A 다중 히트 윈도우 크기, 제로인 경우 디폴트 (blastn/메가블라스트 0, 기타 모두 40 [정수]; 디폴트 = 0; -w 프레임 시프트 페널티 (blastx에 대한 OOF 알고리즘) [정수]; 디폴트 = 0; -t HSP를 연결하기 위해 tblastn에서 허용된 가장 큰 인트론의 길이 (0 연결할 수 없게 된다) [정수]; 디폴트 = 0.
고품질의 결과는 니들만(Needleman) 및 분쉬(Wunsch)의 알고리즘 또는 스미스(Smith) 및 워터만(Waterman)의 알고리즘을 사용함으로써 달성된다. 따라서, 상기 알고리즘에 기초한 프로그램이 바람직하다. 유리하게는, 서열의 비교는 프로그램 파일업(PileUp) (J. Mol. Evolution., 25, 351 (1987), Higgins et al., CABIOS 5, 151 (1989)) 또는 바람직하게 프로그램 "갭(Gap)" 및 "니들(Needle)" (이는 둘 다 니들만 및 분쉬의 알고리즘에 기초함) (J. Mol. Biol. 48; 443 (1970)), 및 "베스트피트(BestFit)" (이는 스미스 및 워터만의 알고리즘에 기초함) (Adv. Appl. Math. 2; 482 (1981))를 사용하여 수행될 수 있다. "갭" 및 "베스트피트"는 GCG 소프트웨어-패키지의 일부이고 (Genetics Computer Group, 575 Science Drive, Madison, Wisconsin, USA 53711 (1991); Altschul et al., (Nucleic Acids Res. 25, 3389 (1997)), "니들"은 유럽 분자 생물학 오픈 소프트웨어 스위트 (EMBOSS)의 일부이다 (Trends in Genetics 16 (6), 276 (2000)). 따라서 바람직하게는, 서열 동일성의 백분율을 결정하기 위한 계산은 서열의 전체 범위 전반에 걸쳐 프로그램 "갭" 또는 "니들"을 사용하여 수행된다. "니들"의 경우에는 핵산 서열의 비교를 위해 다음 표준 조정을 사용하였다: 매트릭스: EDNAFULL, 갭_페널티: 10.0, 확장_페널티: 0.5. "갭"의 경우에는 핵산 서열의 비교를 위해 다음 표준 조정을 사용하였다: 갭 가중치: 50, 길이 가중치: 3, 평균 매치: 10.000, 평균 미스매치: 0.000.
예를 들어, 핵산 수준에서 서열 서열식별번호(SEQ ID number) 1과 80% 동일성을 갖는 것으로 언급되는 서열은 상기 파라미터 세트를 수반하는 상기 프로그램 "니들"에 의해 서열식별번호: 1로 나타낸 서열과 비교할 때, 80% 동일성을 갖는 서열을 의미하는 것으로 이해된다. 바람직하게는 동일성은 질의 서열, 예를 들어 서열식별번호: 1의 완전한 길이 상에서 계산된다.
단리된: 본원에 사용된 용어 "단리된"은 물질이 인공적으로 제거되어 그의 원래 천연 환경에서 벗어나서 존재하고, 따라서 자연의 산물이 아님을 의미한다. 단리된 물질 또는 분자 (예컨대, DNA 분자 또는 효소)는 정제된 형태로 존재할 수 있거나 또는 비-천연 환경, 예컨대 예를 들어 트랜스제닉 숙주 세포에 존재할 수 있다. 예를 들어, 살아있는 세포에 존재하는 자연 발생 핵산 분자 또는 폴리펩티드는 단리된 것이 아니지만, 자연계에서 공존하는 물질의 일부 또는 전부로부터 분리된 동일한 핵산 분자 또는 폴리펩티드는 단리된 것이다. 이러한 핵산 분자는 벡터의 일부일 수 있고/거나 상기 핵산 분자 또는 폴리펩티드는 조성물의 일부일 수 있으며, 상기 벡터 또는 조성물이 그의 원래 환경의 일부가 아니라는 점에서 단리된 것일 것이다. 바람직하게는, 용어 "단리된"은 "단리된 핵산 서열"에서처럼 핵산 분자에 대해 사용될 때 그의 자연 공급원에서 통상 회합되는 적어도 하나의 오염 핵산 분자로부터 확인되고 분리된 핵산 서열을 의미한다. 단리된 핵산 분자는 그것이 자연에서 발견되는 것과 상이한 형태 또는 세팅으로 존재하는 핵산 분자이다. 이와는 달리, 비-단리된 핵산 분자는 그들이 자연에서 존재하는 상태로 발견되는 핵산 분자, 예컨대 DNA 및 RNA이다. 예를 들어, 소정의 DNA 서열 (예를 들어, 유전자)은 이웃하는 유전자에 근접하여 숙주 세포 염색체 상에서 발견되고; RNA 서열, 예컨대 특정한 단백질을 코딩하는 특정한 mRNA 서열은 다수의 단백질을 코딩하는 수많은 다른 mRNA와의 혼합물로서 세포에서 발견된다. 그러나, 예를 들어 서열식별번호: 1을 포함하는 단리된 핵산 서열은 한 예로서, 핵산 서열이 자연 세포의 것과 상이한 게놈 또는 플라스미드 위치에 있거나 또는 자연에서 발견되는 것보다 상이한 핵산 서열이 플랭킹된 서열식별번호: 1을 통상적으로 함유하는 세포에서의 상기 핵산 서열을 포함한다. 단리된 핵산 서열은 단일 또는 이중 가닥 형태로 존재할 수 있다. 단리된 핵산 서열을 활용하여 단백질을 발현시켜야 하는 경우에는, 이러한 핵산 서열이 최소한, 센스 또는 코딩 가닥의 적어도 일부를 함유할 것이다 (즉, 상기 핵산 서열은 단일 가닥일 수 있다). 대안적으로, 이는 센스 가닥과 안티센스 가닥 둘 다를 함유할 수 있다 (즉, 상기 핵산 서열은 이중 가닥일 수 있다).
비-코딩: 용어 "비-코딩"은 발현되는 단백질의 일부 또는 전부를 코딩하지 않는 핵산 분자의 서열을 의미한다. 비-코딩 서열은 인핸서, 프로모터 영역, 3' 비번역 영역 및 5' 비번역 영역을 포함하나, 이에 제한되지는 않는다.
핵산 및 뉴클레오티드: 용어 "핵산" 및 "뉴클레오티드"는 자연 발생 또는 합성 또는 인공 핵산 또는 뉴클레오티드를 지칭한다. 용어 "핵산" 및 "뉴클레오티드"는 단일 가닥 또는 이중 가닥, 센스 또는 안티센스 형태의, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 또는 그의 모든 뉴클레오티드 유사체 및 중합체 또는 혼성체를 포함한다. 달리 나타내지 않는 한, 특정한 핵산 서열은 또한, 그의 보존적으로 변형된 변이체 (예를 들어, 축중성 코돈 치환) 및 상보적 서열, 뿐만 아니라 명시적으로 나타낸 서열을 암시적으로 포괄한다. 용어 "핵산"은 본원에서 "유전자", "cDNA", "mRNA", "올리고뉴클레오티드" 및 "핵산 분자"와 상호교환가능하게 사용된다. 뉴클레오티드 유사체는 염기, 당 및/또는 포스페이트의 화학적 구조에서의 변형을 갖는 뉴클레오티드를 포함하며, 이러한 변형은 5-위치 피리미딘 변형, 8-위치 퓨린 변형, 시토신 엑소시클릭 아민에서의 변형, 5-브로모-우라실의 치환 등; 및 2'-위치 당 변형 (이는 2'-OH를 H, OR, R, 할로, SH, SR, NH2, NHR, NR2, 또는 CN으로부터 선택된 군으로 대체시킨, 당-변형된 리보뉴클레오티드를 포함하나, 이에 제한되지는 않음)을 포함하나, 이에 제한되지는 않는다. 짧은 헤어핀 RNA (shRNA)는 또한, 비-자연 요소, 예컨대 비-자연 염기, 예를 들어 이노신 및 크산틴, 비-자연 당, 예를 들어 2'-메톡시 리보스, 또는 비-자연 포스포디에스테르 연결, 예를 들어 메틸포스포네이트, 포스포로티오에이트 및 펩티드를 포함할 수 있다.
핵산 서열: 어구 "핵산 서열"은 5'-말단에서 3'-말단으로 읽는 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 염기의 단일 또는 이중 가닥 중합체를 지칭한다. 이는 염색체 DNA, 자기-복제 플라스미드, DNA 또는 RNA의 감염성 중합체, 및 주로 구조적 역할을 수행하는 DNA 또는 RNA를 포함한다. "핵산 서열"은 또한 뉴클레오티드를 나타내는 약어, 글자, 문자 또는 단어의 연속적인 목록을 지칭한다. 한 실시양태에서, 핵산은 길이가 대체로 100개 미만의 뉴클레오티드인 비교적 짧은 핵산인 "프로브"일 수 있다. 종종 핵산 프로브는 약 50개 뉴클레오티드 길이 내지 약 10개 뉴클레오티드 길이이다. 핵산의 "표적 영역"은 관심있는 것으로 확인된 핵산의 부분이다. 핵산의 "코딩 영역"은 적절한 조절 서열의 제어 하에 위치할 때 특정한 폴리펩티드 또는 단백질을 생산하기 위해 서열-특이적 방식으로 전사 및 번역되는 핵산의 부분이다. 코딩 영역은 이러한 폴리펩티드 또는 단백질을 코딩하는 것으로 전해진다.
올리고뉴클레오티드: 용어 "올리고뉴클레오티드"는 리보핵산 (RNA) 또는 데옥시리보핵산 (DNA) 또는 그의 모방체의 올리고머 또는 중합체, 및 유사하게 기능하는 비-자연 발생 부분을 갖는 올리고뉴클레오티드를 지칭한다. 이러한 변형 또는 치환된 올리고뉴클레오티드는 종종 천연 형태에 비해 바람직한데, 이는 바람직한 특성, 예컨대 예를 들어 증진된 세포 흡수, 핵산 표적에 대한 증진된 친화성, 및 뉴클레아제의 존재 하의 증가된 안정성 때문이다. 올리고뉴클레오티드는 바람직하게는, 연결 (예를 들어, 포스포디에스테르) 또는 치환 연결에 의해 서로 공유 커플링된 2개 이상의 뉴클레오단량체를 포함한다.
오버행: "오버행"은 이중 가닥 올리고뉴클레오티드 분자의 5'- 또는 3'-히드록실 말단 상의 비교적 짧은 단일 가닥 뉴클레오티드 서열이다 ("연장물", "돌출성 말단" 또는 "점착성 말단"으로서 지칭되기도 함).
폴리펩티드: 용어 "폴리펩티드", "펩티드", "올리고펩티드", "폴리펩티드", "유전자 산물", "발현 산물" 및 "단백질"은 연속되는 아미노산 잔기의 중합체 또는 올리고머를 지칭하기 위해 본원에서 상호교환가능하게 사용된다.
프로모터: 용어 "프로모터" 또는 "프로모터 서열"은 동등하고, 본원에 사용된 바와 같이, 관심 뉴클레오티드 서열과 작동가능하게 연결되는 경우에, 이러한 관심 뉴클레오티드 서열을 RNA로 전사하는 것을 제어할 수 있는 DNA 서열을 지칭한다. 프로모터는 그의 mRNA로의 전사를 제어하는 관심 뉴클레오티드 서열의 전사 출발 부위에 근접한 5' (즉, 상류)에 위치하고, 전사 개시를 위한 다른 전사 인자 및 RNA 폴리머라제에 의한 특이적 결합을 위한 부위를 제공한다. 프로모터는 코딩 영역 또는 5' 비번역 영역을 포함하지 않는다. 프로모터는, 예를 들어 각각의 세포에 대해 이종 또는 동종일 수 있다. 핵산 분자 서열은 이것이 외래 종으로부터 유래되는 경우에, 또는 동일한 종으로부터 그의 원래 형태로부터 변형되는 경우에, 유기체 또는 제2의 핵산 분자 서열에 대해 "이종"이다. 예를 들어, 이종 코딩 서열과 작동가능하게 연결된 프로모터는 프로모터가 유래되는 것과 상이한 종으로부터의 코딩 서열, 또는 동일한 종으로부터 유래된 경우에는, 프로모터와 자연적으로 회합되지 않는 코딩 서열 (예를 들어, 유전자 조작된 코딩 서열 또는 상이한 생태형 또는 변종으로부터의 대립 유전자)을 지칭한다. 적합한 프로모터는 발현이 일어나야 하는 숙주 세포의 유전자로부터 유래되거나 또는 이러한 숙주에 대한 병원체로부터 유래될 수 있다.
정제된: 본원에 사용된 용어 "정제된"은 그의 자연 환경으로부터 제거되거나, 단리되거나 또는 분리되는 핵산 또는 아미노산 서열 분자를 지칭한다. "실질적으로 정제된" 분자는 이들과 자연적으로 회합되는 다른 성분이 적어도 60% 없고, 바람직하게는 적어도 75% 없고, 보다 바람직하게는 적어도 90% 없다. 정제된 핵산 서열은 단리된 핵산 서열일 수 있다.
유의한 증가: 측정 기술에 고유한 오차 한계보다 더 큰, 예를 들어 특정 산물의 효소 활성, 유전자 발현, 생산성 또는 수율의 증가, 바람직하게는 대조군 효소의 활성, 발현, 생산성 또는 수율, 또는 대조군 세포에서의 발현, 대조군 세포의 생산성 또는 수율의 약 10% 또는 25%만큼, 바람직하게는 50% 또는 75%만큼, 보다 바람직하게는 2배 또는 5배 이상만큼의 증가, 보다 더 바람직하게는 약 10배 이상만큼의 증가.
유의한 감소: 측정 기술에 고유한 오차 한계보다 더 큰, 예를 들어 특정 산물의 효소 활성, 유전자 발현, 생산성 또는 수율 상의 감소, 바람직하게는 적어도 약 5% 또는 10%만큼, 바람직하게는 적어도 약 20% 또는 25%만큼, 보다 바람직하게는 적어도 약 50% 또는 75%만큼, 보다 더 바람직하게는 적어도 약 80% 또는 85%만큼, 가장 바람직하게는 적어도 약 90%, 95%, 97%, 98% 또는 99%만큼의 감소.
실질적으로 상보적: 그의 가장 넓은 의미에서, 참조 또는 표적 뉴클레오티드 서열과 관련하여 뉴클레오티드 서열에 대하여 본원에서 사용되는 경우, 용어 "실질적으로 상보적"은 상기 참조 또는 표적 뉴클레오티드 서열의 실질적으로 상보적인 뉴클레오티드 서열과 정확히 상보적인 서열 간의 동일성 백분율이 적어도 60%, 보다 바람직하게는 적어도 70%, 보다 바람직하게는 적어도 80% 또는 85%, 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 93%, 보다 더 바람직하게는 적어도 95% 또는 96%, 또한 보다 더 바람직하게는 적어도 97% 또는 98%, 또한 보다 더 바람직하게는 적어도 99% 또는 가장 바람직하게는 100% (후자는 본 문맥에서 용어 "동일한" 것과 동등함)인 뉴클레오티드 서열을 의미한다. 바람직하게는 동일성은 상기 참조 서열에 대해 적어도 19개 뉴클레오티드의 길이, 바람직하게는 적어도 50개 뉴클레오티드의 길이, 보다 바람직하게는 핵산 서열의 전체 길이 전반에 걸쳐 (하기에 달리 명시되지 않는 한) 평가된다. 서열 비교는 니들만 및 분쉬의 알고리즘 (Needleman and Wunsch (1970) J Mol. Biol. 48: 443-453; 상기 정의된 바와 같음)에 기초한, GAP의 위스콘신 대학교 GCG, SEQWEB 적용 하에 디폴트 GAP 분석을 사용하여 수행된다. 참조 뉴클레오티드 서열에 대해 "실질적으로 상보적"인 뉴클레오티드 서열은 저 엄격도 조건, 바람직하게는 중간 엄격도 조건, 가장 바람직하게는 고도 엄격도 조건 (상기 정의된 바와 같음) 하에 참조 뉴클레오티드 서열에 혼성화된다.
트랜스진: 본원에 사용된 용어 "트랜스진"은 실험적 조작에 의해 세포의 게놈 내로 도입되는 임의의 핵산 서열을 지칭한다. 트랜스진은 "내인성 DNA 서열" 또는 "이종 DNA 서열" (즉, "외래 DNA")일 수 있다. 용어 "내인성 DNA 서열"은 그것이 도입되는 세포에서 자연적으로 발견되는 뉴클레오티드 서열을 지칭하며, 단 이것은 자연 발생 서열과 대비하여 일부 변형 (예를 들어, 점 돌연변이, 선택 마커 유전자의 존재 등)을 함유하지 않아야 한다.
트랜스제닉: 유기체를 지칭하는 경우의 용어 트랜스제닉은 적어도 하나의 재조합 핵산 분자로 형질전환, 바람직하게는 안정하게 형질전환된 것을 의미한다.
벡터: 본원에 사용된 용어 "벡터"는 이와 연결된 또 다른 핵산 분자를 수송할 수 있는 핵산 분자를 지칭한다. 한 가지 유형의 벡터는 게놈 통합된 벡터 또는 "통합된 벡터"이며, 이는 숙주 세포의 게놈 DNA 내로 통합될 수 있다. 또 다른 유형의 벡터는 에피솜 벡터, 즉 염색체외 복제할 수 있는 핵산 분자 또는 플라스미드이다. 이들과 작동가능하게 연결되는 유전자의 발현을 지시할 수 있는 벡터는 본원에서 "발현 벡터"로서 지칭된다. 본 명세서에서, "플라스미드" 및 "벡터"는 문맥상 달리 명확하지 않는 한 상호교환가능하게 사용된다.
야생형: 용어 "야생형", "자연" 또는 "자연 기원"은 유기체와 관련하여, 이러한 유기체가 인간에 의해 변화되지 않거나, 돌연변이되지 않거나 또는 달리 조작되지 않은 것을 의미한다. 폴리펩티드 또는 핵산 서열과 관련해서는, 폴리펩티드 또는 핵산 서열이 자연 발생이거나, 또는 인간에 의해 변화되지 않거나, 돌연변이되지 않거나 또는 달리 조작되지 않은 적어도 하나의 자연 발생 유기체에서 이용가능하다는 것을 의미한다.
미생물의 야생형은 그의 게놈이 특정 유전자의 유전자 변형의 도입 이전과 같은 상태로 존재하는 미생물을 지칭한다. 유전자 변형은, 예를 들어 유전자 또는 그의 일부의 결실 또는 점 돌연변이 또는 유전자의 도입일 수 있다.
용어 "생산" 또는 "생산성"은 관련 기술분야에서 인식되고, 소정의 시간 및 소정의 발효 부피 내에서 형성된 발효 산물 (예를 들어, dsRNA)의 농도 (예를 들어, 리터당 시간당 산물 kg)를 포함한다. 용어 "생산 효율"은 달성하고자 하는 특정한 생산 수준에 요구되는 시간 (예를 들어, 세포가 정밀 화학물질의 특정한 산출 비율을 획득하기 위해 소요되는 시간)을 포함한다.
용어 "수율" 또는 "산물/탄소 수율"은 관련 기술분야에서 인식되고, 탄소 공급원이 산물 (즉, 정밀 화학물질)로 전환되는 효율을 포함한다. 이것은 일반적으로, 예를 들어 탄소 공급원 kg당 산물 kg으로서 표기된다. 화합물의 수율 또는 생산을 증가시킴으로써, 소정 양의 시간에 걸쳐 소정 양의 배양물 중에서 상기 화합물의 회수된 분자 또는 유용한 회수된 분자의 양이 증가된다.
용어 "재조합 미생물"은 그것이 유래되는 야생형 미생물과 비교하여 변경되거나 상이한 유전자형 및/또는 표현형을 나타내도록 유전자 변형시킨 (예를 들어, 이러한 유전자 변형이 미생물의 코딩 핵산 서열에 영향을 미치는 경우) 미생물을 포함한다. 재조합 미생물은 적어도 하나의 재조합 핵산 분자를 포함한다.
핵산 분자와 관련하여 용어 "재조합"은 재조합 핵산 기술을 사용하여 인간에 의해 생산된 핵산 분자를 지칭한다. 용어는 그 자체로는 자연에서 존재하지 않거나 또는 핵산 분자가 유래되는 유기체에는 존재하지 않지만, 인간에 의해 변형되거나, 변화되거나, 돌연변이되거나 또는 달리 조작되는 핵산 분자를 포함한다. 바람직하게는, "재조합 핵산 분자"는 자연 발생 핵산 분자와 서열상 적어도 1개의 핵산이 상이한 비-자연 발생 핵산 분자이다. "재조합 핵산 분자"는 또한, 그 순서로는 자연 발생이지 않는 핵산 분자의 서열을 포함하는, 바람직하게는 작동가능하게 연결된 "재조합 구축물"을 포함할 수 있다. 상기 재조합 핵산 분자를 생산하는 바람직한 방법은 클로닝 기술, 지정된 또는 비-지정된 돌연변이유발, 유전자 합성 또는 재조합 기술을 포함할 수 있다.
이러한 재조합 핵산 분자의 예는 이종 DNA-서열이 삽입된 플라스미드, 또는 재조합 핵산 분자가 유래되는 유전자 또는 프로모터와 비교하여 돌연변이된 유전자 또는 프로모터이다. 돌연변이는 관련 기술분야에 공지된 지정 돌연변이유발 기술 또는 무작위 돌연변이유발 기술, 예컨대 화학물질, UV 광 또는 X선 돌연변이유발 또는 방향적 진화 기술에 의해 도입될 수 있다.
용어 "방향적 진화"는 본원에서 용어 "대사 진화"와 동의어로 사용되고, 관심 형질을 지닌 돌연변이체의 성장을 선호하는 선택 압력을 적용하는 것을 수반한다. 선택 압력은 상이한 배양 조건, ATP 및 성장 커플링된 선택 및 산화환원 관련 선택에 기초할 수 있다. 선택 압력은 일련의 전송 접종을 수반하는 회분식 발효 또는 동일한 압력을 사용하는 연속식 배양으로 수행될 수 있다.
용어 "발현" 또는 "유전자 발현"은 특이적 유전자(들) 또는 특이적 유전적 벡터 구축물의 전사를 의미한다. 용어 "발현" 또는 "유전자 발현"은 특히, 유전자(들) 또는 유전적 벡터 구축물의 mRNA로의 전사를 의미한다. 과정은 DNA의 전사를 포함하고, 생성된 RNA-산물의 프로세싱을 포함할 수 있다. 용어 "발현" 또는 "유전자 발현"은 또한, mRNA의 번역 및 그를 이용한, 코딩된 단백질의 합성, 즉 단백질 발현을 포함할 수 있다.
도면
도 1 내지 12는 본 발명의 융합 핵산 분자의 바람직한 구조를 도시한다. 부위 지정된 핵산 변형 폴리펩티드는 공여자 NA에 융합된 가이드 NA (이들이 함께 fuNA 분자를 형성함)에 의해 표적 이중-가닥 핵산 내의 표적 서열로 향한다.
도 1
5'에서 3'로 가이드 NA (스페이서에 이어서 스캐폴드), 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 1 및 2를 포함하는 융합 NA 분자.
도 2
5'에서 3'로 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 2 및 1, 및 가이드 NA (스캐폴드에 이어서 스페이서)를 포함하는 융합 NA 분자.
도 3
5'에서 3'로 가이드 NA (스페이서에 이어서 스캐폴드), 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 2 및 1을 포함하는 융합 NA 분자.
도 4
5'에서 3'로 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 1 및 2, 및 가이드 NA (스캐폴드에 이어서 스페이서)를 포함하는 융합 NA 분자.
도 5
5'에서 3'로 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 1 및 2, 및 가이드 NA (스페이서에 이어서 스캐폴드)를 포함하는 융합 NA 분자.
도 6
5'에서 3'로 가이드 NA (스캐폴드에 이어서 스페이서), 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 1 및 2를 포함하는 융합 NA 분자.
도 7
5'에서 3'로 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 2 및 1, 및 가이드 NA (스페이서에 이어서 스캐폴드)를 포함하는 융합 NA 분자.
도 8
5'에서 3'로 가이드 NA (스캐폴드에 이어서 스페이서), 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 2 및 1를 포함하는 융합 NA 분자.
도 9
5'에서 3'로 가이드 NA (스페이서 및 스캐폴드의 제1 분자를 포함함), 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 1 및 2를 포함하는 융합 NA 분자. 스캐폴드의 제2 분자는 스캐폴드의 제1 분자에 혼성화되어 있음.
도 10
5'에서 3'로 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 1 및 2, 가이드 NA (스캐폴드의 제1 분자 및 스페이서를 포함함)를 포함하는 융합 NA 분자. 스캐폴드의 제2 분자는 스캐폴드의 제1 분자에 혼성화되어 있음.
도 11
5'에서 3'로 가이드 NA (스페이서 및 스캐폴드의 제1 분자를 포함함), 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 2 및 1을 포함하는 융합 NA 분자. 스캐폴드의 제2 분자는 스캐폴드의 제1 분자에 혼성화되어 있음.
도 12
5'에서 3'로 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 2 및 1, 가이드 NA (스캐폴드의 제1 분자, 스페이서, 및 스캐폴드의 제1 분자에 혼성화되어 있는 스캐폴드의 제2 분자를 포함함)를 포함하는 융합 NA 분자.
도 13
벡터 RWL121.
도 14
벡터 Cas003.
도 15
벡터 Cas018.
도 16
벡터 Cas006.
도 17
벡터 RWL137.
도 18
벡터 Cas019.
도 19
벡터 RLW138.
도 20
벡터 Cas020.
도 21
벡터 RLW139.
도 22
나타낸 바와 같은 상동성 영역 HomA 및 HomB의 위치를 갖는 비. 서브틸리스 ATCC6051 균주의 아밀라제 amyE 유전자좌 (A)를 보여준다. amyE 유전자 내의 프로토스페이서 서열 PS의 위치를 나타내고 (A), PS의 서열을 강조하였다 (백색 문자를 갖는 흑색부, B).
도 23
pCC004 플라스미드 - amyE 프로토스페이서 및 amyE 유전자에 인접한 영역의 상동성 영역 HomA 및 HomB를 보유하는 pJOE8999 플라스미드의 유도체의 벡터 지도를 보여준다. PS = 프로토스페이서; PvanP* = 반합성(hemisynthetic) 프로모터; 'gRNA = 가이드RNA; 람다 T0 종결인자; PmanP = manP 유전자 비. 서브틸리스의 프로모터; Cas9 = 에스. 피로게네스로부터의 엔도뉴클레아제; KanR = 카나마이신 내성 유전자; 이. 콜라이에서의 복제를 위한 pUC의 기점, 바실루스에서의 복제를 위한 pE194의 기점.
도 24
(플라스미드 pCC004를 나타내는 도 2에 예시된 바와 같이) 본 연구에 사용된 다양한 플라스미드의 EcoRI/XbaI 단편의 개략적 도면을 보여준다. Cas9 엔도뉴클레아제, PmanP 프로모터 및 pUC 복제 기점, pE194 복제 기점, 카나마이신 내성 유전자를 갖는 벡터 백본은 나타내지 않았다. 하류 유전자 요소의 전사를 유도하는 프로모터 (Pro)는 나타내어진다. PS = 프로토스페이서; gRNA = crRNA-루프-tracrRNA로 이루어지는 가이드 RNA, T= 람다 T0 종결인자; 상동성 영역 A 및 상동성 영역 B는 amyE 유전자의 배향을 나타낸 화살표로 도시하였다. 플라스미드 유전자 요소의 상세한 설명은 제이. 알텐부흐너(J. Altenbuchner)에 의해 기재된다 (Altenbuchner J. 2016. Editing of the Bacillus subtilis genome by the CRISPR-Cas9 system. Appl Environ Microbiol 82:5421-5).
도 25
pCC004에 비한 각각의 유전자 결실 구축물 (pJOE8999, pCC005-pCC008)에 대한 아밀라제 유전자에 대해 예시된 바와 같은 유전자 녹아웃 효율을, 나타낸 바와 같은 결실 구축물에 대하여 플롯팅하였다.
도 26
나타낸 플라스미드 pCC004, pCC005, pCC006, pCC007, pCC008에 대한 유전자 결실 반응으로부터의 13개의 개별 클론의 게놈 DNA 상에서 올리고뉴클레오티드 서열식별번호: 60 및 61에 의한 PCR 반응의 0.8% 아가로스 겔을 보여준다. 1.4 kb의 DNA 단편의 증폭은 재조합에 의한 유전자 녹아웃을 나타내지만, 3.4 kb의 DNA 단편은 오히려 SOS 복구 메카니즘에 의한 아밀라제 유전자 불활성화를 나타낸다. WT에 있어서 3.4 kb 밴드는 비-. 서브틸리스 WT ATCC6051의 야생형 아밀라제 유전자좌를 나타낸다. C는 첨가된 게놈 DNA가 없는 물 대조군을 표시한다. M은 나타낸 3개의 밴드의 크기 (1.0 kb, 1.5 kb. 4.0 kb)를 갖는 DNA 래더(ladder) '퍼펙트 플러스(Perfect plus) 1 kb DNA 래더' (로보클론(roboklon))를 나타낸다.
도 1 내지 12는 본 발명의 융합 핵산 분자의 바람직한 구조를 도시한다. 부위 지정된 핵산 변형 폴리펩티드는 공여자 NA에 융합된 가이드 NA (이들이 함께 fuNA 분자를 형성함)에 의해 표적 이중-가닥 핵산 내의 표적 서열로 향한다.
도 1
5'에서 3'로 가이드 NA (스페이서에 이어서 스캐폴드), 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 1 및 2를 포함하는 융합 NA 분자.
도 2
5'에서 3'로 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 2 및 1, 및 가이드 NA (스캐폴드에 이어서 스페이서)를 포함하는 융합 NA 분자.
도 3
5'에서 3'로 가이드 NA (스페이서에 이어서 스캐폴드), 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 2 및 1을 포함하는 융합 NA 분자.
도 4
5'에서 3'로 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 1 및 2, 및 가이드 NA (스캐폴드에 이어서 스페이서)를 포함하는 융합 NA 분자.
도 5
5'에서 3'로 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 1 및 2, 및 가이드 NA (스페이서에 이어서 스캐폴드)를 포함하는 융합 NA 분자.
도 6
5'에서 3'로 가이드 NA (스캐폴드에 이어서 스페이서), 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 1 및 2를 포함하는 융합 NA 분자.
도 7
5'에서 3'로 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 2 및 1, 및 가이드 NA (스페이서에 이어서 스캐폴드)를 포함하는 융합 NA 분자.
도 8
5'에서 3'로 가이드 NA (스캐폴드에 이어서 스페이서), 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 2 및 1를 포함하는 융합 NA 분자.
도 9
5'에서 3'로 가이드 NA (스페이서 및 스캐폴드의 제1 분자를 포함함), 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 1 및 2를 포함하는 융합 NA 분자. 스캐폴드의 제2 분자는 스캐폴드의 제1 분자에 혼성화되어 있음.
도 10
5'에서 3'로 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 1 및 2, 가이드 NA (스캐폴드의 제1 분자 및 스페이서를 포함함)를 포함하는 융합 NA 분자. 스캐폴드의 제2 분자는 스캐폴드의 제1 분자에 혼성화되어 있음.
도 11
5'에서 3'로 가이드 NA (스페이서 및 스캐폴드의 제1 분자를 포함함), 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 2 및 1을 포함하는 융합 NA 분자. 스캐폴드의 제2 분자는 스캐폴드의 제1 분자에 혼성화되어 있음.
도 12
5'에서 3'로 추가의 핵산 영역에 의해 임의로 분리된 상동성 아암 2 및 1, 가이드 NA (스캐폴드의 제1 분자, 스페이서, 및 스캐폴드의 제1 분자에 혼성화되어 있는 스캐폴드의 제2 분자를 포함함)를 포함하는 융합 NA 분자.
도 13
벡터 RWL121.
도 14
벡터 Cas003.
도 15
벡터 Cas018.
도 16
벡터 Cas006.
도 17
벡터 RWL137.
도 18
벡터 Cas019.
도 19
벡터 RLW138.
도 20
벡터 Cas020.
도 21
벡터 RLW139.
도 22
나타낸 바와 같은 상동성 영역 HomA 및 HomB의 위치를 갖는 비. 서브틸리스 ATCC6051 균주의 아밀라제 amyE 유전자좌 (A)를 보여준다. amyE 유전자 내의 프로토스페이서 서열 PS의 위치를 나타내고 (A), PS의 서열을 강조하였다 (백색 문자를 갖는 흑색부, B).
도 23
pCC004 플라스미드 - amyE 프로토스페이서 및 amyE 유전자에 인접한 영역의 상동성 영역 HomA 및 HomB를 보유하는 pJOE8999 플라스미드의 유도체의 벡터 지도를 보여준다. PS = 프로토스페이서; PvanP* = 반합성(hemisynthetic) 프로모터; 'gRNA = 가이드RNA; 람다 T0 종결인자; PmanP = manP 유전자 비. 서브틸리스의 프로모터; Cas9 = 에스. 피로게네스로부터의 엔도뉴클레아제; KanR = 카나마이신 내성 유전자; 이. 콜라이에서의 복제를 위한 pUC의 기점, 바실루스에서의 복제를 위한 pE194의 기점.
도 24
(플라스미드 pCC004를 나타내는 도 2에 예시된 바와 같이) 본 연구에 사용된 다양한 플라스미드의 EcoRI/XbaI 단편의 개략적 도면을 보여준다. Cas9 엔도뉴클레아제, PmanP 프로모터 및 pUC 복제 기점, pE194 복제 기점, 카나마이신 내성 유전자를 갖는 벡터 백본은 나타내지 않았다. 하류 유전자 요소의 전사를 유도하는 프로모터 (Pro)는 나타내어진다. PS = 프로토스페이서; gRNA = crRNA-루프-tracrRNA로 이루어지는 가이드 RNA, T= 람다 T0 종결인자; 상동성 영역 A 및 상동성 영역 B는 amyE 유전자의 배향을 나타낸 화살표로 도시하였다. 플라스미드 유전자 요소의 상세한 설명은 제이. 알텐부흐너(J. Altenbuchner)에 의해 기재된다 (Altenbuchner J. 2016. Editing of the Bacillus subtilis genome by the CRISPR-Cas9 system. Appl Environ Microbiol 82:5421-5).
도 25
pCC004에 비한 각각의 유전자 결실 구축물 (pJOE8999, pCC005-pCC008)에 대한 아밀라제 유전자에 대해 예시된 바와 같은 유전자 녹아웃 효율을, 나타낸 바와 같은 결실 구축물에 대하여 플롯팅하였다.
도 26
나타낸 플라스미드 pCC004, pCC005, pCC006, pCC007, pCC008에 대한 유전자 결실 반응으로부터의 13개의 개별 클론의 게놈 DNA 상에서 올리고뉴클레오티드 서열식별번호: 60 및 61에 의한 PCR 반응의 0.8% 아가로스 겔을 보여준다. 1.4 kb의 DNA 단편의 증폭은 재조합에 의한 유전자 녹아웃을 나타내지만, 3.4 kb의 DNA 단편은 오히려 SOS 복구 메카니즘에 의한 아밀라제 유전자 불활성화를 나타낸다. WT에 있어서 3.4 kb 밴드는 비-. 서브틸리스 WT ATCC6051의 야생형 아밀라제 유전자좌를 나타낸다. C는 첨가된 게놈 DNA가 없는 물 대조군을 표시한다. M은 나타낸 3개의 밴드의 크기 (1.0 kb, 1.5 kb. 4.0 kb)를 갖는 DNA 래더(ladder) '퍼펙트 플러스(Perfect plus) 1 kb DNA 래더' (로보클론(roboklon))를 나타낸다.
실시예
화학물질 및 통상의 방법
달리 나타내지 않는 한, 제한 소화, 아가로스 겔 전기영동, 핵산의 정제, 핵산의 라이게이션, 박테리아 세포의 형질전환, 선택 및 배양을 포함하는 본 발명의 목적을 위해 수행된 클로닝 절차는 문헌 [Sambrook J, Fritsch EF and Maniatis T (1989)]에 기재된 바와 같이 수행하였다. 재조합 DNA의 서열분석은 생어(Sanger) 기술 (Sanger et al., 1977)을 사용하여 레이저 형광 DNA 서열분석기 (어플라이드 바이오시스템즈(Applied Biosystems), 미국 캘리포니아주 포스터 시티)로 수행하였다. 달리 기재되지 않는 한, 화학물질 및 시약은 시그마 알드리치(Sigma Aldrich) (미국 세인트 루이스 시그마 알드리치), 프로메가(Promega) (미국 위스콘신주 매디슨), 두체파(Duchefa) (네덜란드 하를렘) 또는 인비트로젠(Invitrogen) (미국 캘리포니아주 칼스배드)으로부터 수득하였다. 제한 엔도뉴클레아제는 뉴 잉글랜드 바이오랩스(New England Biolabs) (미국 매사추세츠주 입스위치) 또는 로슈 다이아그노스틱스 게엠베하(Roche Diagnostics GmbH) (독일 펜즈베르크)로부터 수득하였다. 올리고뉴클레오티드는 유로핀스 MWG 오페론(Eurofins MWG Operon) (독일 에버스베르크)에 의해 합성하였다.
실험 절차의 소개
C-말단 SV40 핵 국재화 신호를 지니는 Cas9 단백질의 효모 코돈-최적화된 버전 (서열식별번호: 1)을 합성하고, 효모 발현 벡터 내로 클로닝하였다. 동일한 벡터는 사카로미세스 세레비지아에 SNR52 폴리머라제 III 프로모터로부터 발현된 하나 이상의 가이드 RNA (gRNA)를 포함했다.
Cas9는 DNA에 결합하고, gRNA에 의한 표적 서열의 인식 시에 가닥 둘 다를 절단시키지만, 이는 오직 정확한 프로토스페이서-인접한 모티프 (PAM)가 3' 말단에 존재하는 경우에만 해당된다. 이론적으로 형태 GN20GG의 임의의 서열이 표적화될 수 있다. 그러므로, 설계된 CRISPR 시스템에 의해 표적화될 리포터 시스템 (GAL4-UAS (서열식별번호: 7))의 효모에서의 공동-발현을 위해 제2 벡터를 구축하였다. gRNA-공여자 융합체 (융합 NA)를 여러 비-기능적 Gal4 표적 (서열식별번호: 9-15)을 표적화하고 복구시키는데 사용하였다.
Gal4 (서열식별번호: 8)는 2-성분: N-말단에 위치된 DNA 결합 도메인 및 C-말단의 전사 활성화를 위한 영역으로 이루어지는 효모 전사 활성인자이다. Gal4는 효모 게놈 내 마커 유전자의 특정한 인식 서열 UAS (상류 활성화 서열)에 결합하여, 그의 전사를 활성화시킨다. MaV203 효모 균주는 효모 게놈 내 상이한 유전자좌에 안정하게 통합된 각각의 3개의 리포터 유전자 (HIS3, URA3 및 lacZ)의 단일 카피를 함유한다. URA3, HIS3 및 lacZ의 프로모터 영역은 (GAL4 결합 부위의 존재를 제외하고) 관련이 없다.
Gal4의 여러 비-기능적 (정지 코돈의 삽입에 의해 결실되고/거나 파괴된) 버전을 합성하고 (서열식별번호: 9-15), 효모 세포 내로 형질전환하여, 그들을 공동-발현된 CRISPR 기구에 의해 표적화하고 복구시킬 수 있었다. CRISPR 성분이 제공되는 적절한 복구 공여자 서열에 의한 상동 재조합 (HR)에 의한 전장 Gal4의 복원은 lacZ 및 HIS3 리포터 유전자의 활성화를 발생시킨다. Gal4 유전자 복구 및 결과적인 전사 활성화는 히스티딘이 결여된 플레이트 상에서의 세포 성장에 의해 모니터링될 수 있고, 반면에 lacZ 유전자의 유도는 X-gal (5-브로모-4-클로로-3-인돌릴-β-D-갈락토피라노시드)으로 검정할 시에 청색 색상을 생성한다.
사용된 효모 균주는 발현 구축물 둘 다에 대한 선택을 가능하게 하는 2개의 추가적인 영양요구성 돌연변이 (leu2 및 trp1)를 함유한다.
본원에 개시된 융합 시스템의 복구 효능 증가를 입증하기 위하여, 모든 실험을 공여자 및 가이드 RNA가 개별적으로 전사되는 비-융합된 카세트와 병행하여 수행하였다.
효모 균주, 배지 및 배양 조건
기재된 실시예에 사용된 사카로미세스 세레비지아에 균주는 라이프 테크놀로지스(Life Technologies)에 의해 상업화된 MaV203 (MATα, leu2-3,112, trp1-901, his3Δ200, ade2-101, gal4Δ, gal80Δ, SPAL10::URA3, GAL1::lacZ, HIS3UAS GAL1::HIS3@LYS2, can1R, cyh2R)이다. 효모를 2% 글루코스가 보충되고 적절한 영양요구성 화합물이 결여된 효모 질소 염기에 기초한 합성 최소 배지 (SD 배지) (포미디움(ForMedium), 영국)에서 성장시켰다. 배양물을 진탕기 또는 인큐베이션 오븐에서 30℃에서 성장시켰다.
에스케리키아 콜라이를 본 발명자들의 실험에 사용된 모든 플라스미드를 위한 증식 미생물로서, 뿐만 아니라 변형된 표적의 추가적 증식 및 유지를 위해 사용하였다. 이. 콜라이를 표준 미생물학적 실시에 따라 성장시켰다 (Molecular Cloning: A Laboratory Manual, 3rd ed., Vols 1,2 and 3. J.F. Sambrook and D.W. Russell, ed., Cold Spring Harbor Laboratory Press, 2001). Cas9, 가이드 RNA 및 공여자 NA를 함유하는 플라스미드는 이. 콜라이에서의 복제 및 유지를 위한 pUC-기반 복제 기점 및 암피실린 내성 유전자를 포함했다. 반면에 GAL4 표적 플라스미드는 겐타미신 내성 유전자 (Gmr)를 함유했다.
실시예 1 플라스미드 구축
Cas9 유전자는 원래 진핵 세포에서의 발현을 위해 구축된 스트렙토코쿠스 피오게네스 Cas9 (SpCas9; WO2007/025097)의 효모 코돈-최적화된 버전이었다 (Mali et al. (2013) Science 339(6121); Cong et al. (2013) Science 339(6121)). 이 Cas9 유전자를 양쪽 말단에 SV40 핵 국재화 신호로 태그부착하고 합성하였다. 또한, 생체내 RNA 합성을 위한 SNR52 프로모터를 함유하는 gRNA 및 공여자 발현 카세트를 합성하였다.
pDEST22 (라이프 테크놀로지스) 내 GAL4-AD 코딩 서열을 심리스 클로닝(Seamless Cloning) (라이프 테크놀로지스)을 통해 합성 Cas9에 의해 대체하였다. 이 벡터는 효모에서의 발현을 위한 효모 알콜 데히드로게나제 유전자 (ADH1)의 구성적 중등-강도 프로모터 및 전사 종결인자뿐만 아니라 트립토판 결여 배지 상의 효모에서의 선택을 위한 TRP1 유전자를 함유한다.
동일한 벡터는 클로람페니콜 내성 유전자 (Cmr) 및 ccdB 유전자에 플랭킹되는 2개의 재조합 부위, attR1 및 attR2를 함유하며, 이는 설계된 gRNA 및 공여자 발현 카세트 (융합 또는 이중 분자로서)가 게이트웨이 클로닝(Gateway Cloning) (라이프 테크놀로지스)을 통해 동일한 발현 벡터에 도입되도록 한다. LR 재조합 반응에 이어서, Cmr 및 ccdB 유전자를 융합 NA 카세트 또는 비-융합된 공여자 및 가이드 발현 카세트에 의해 대체시켰다.
효모에서 CRISPR 복구를 위한 표적으로서 사용된 변형된 GAL4 코딩 서열을 합성하였다. 효모에서의 발현을 위한 pDEST32 플라스미드 (라이프 테크놀로지스)를 HindIII 및 SacII로 절단하였고, ADH1 프로모터 및 종결인자를 함유하는 백본을 겔 정제하였다. GAL4 합성된 삽입체를 심리스 클로닝을 사용하여 벡터 내로 조립하였다. 이 벡터는 트립토판 결여 배지 상의 효모에서의 선택을 위한 LEU2 유전자를 포함했다.
GAL4 서열에서 Cas9에 의한 인식을 위한 표적-부위를 GAL4 유전자 내의 잠재적 PAM (NGG) 서열 이전의 20-머 영역을 선택함으로써 실험적으로 선택하였다 (Sternberg et al. (2014); Nature 507(7490)).
Cas9 결합 및 R-루프 형성을 용이하게 하기 위해, 본 발명자들은 문헌 [Jinek et al. (2012) Science;337(6096))]에 의해 처음에 설계된 바와 같이, 매달린(dangling) 스페이서, 확장된 헤어핀 영역 및 긴 3' 말단을 함유하는 2차 구조를 갖는 단일 가이드 RNA 설계를 선택했다.
실시예 2 효모 형질전환
CRISPR 편집 도구 (Cas9 효소 및 융합 NA 발현 카세트) 및 GAL4 표적 플라스미드의 동시 형질전환을 제조업체의 프로토콜 (라이프 테크놀로지스)에 기재된 바와 같이 열-쇼크에 의해 수행하였고, 도입되는 플라스미드에 의해 보충되는 영양요구성 화합물 (류신 및 트립토판)이 결여된 적절한 합성 완전 (SC) 배지에서 증식시켰다. 형질전환된 세포를 밤새 증식되도록 하고, (OD 측정에 따른) 형질전환체의 동등량을 100mM 3-아미노-1,2,4-트리아졸 (3-AT; 포미디움, 영국)을 갖는 히스티딘 결여 합성 완전 (SC) 배지를 함유하는 중실 플레이트로 옮겼다. (히스티딘 없이 배지에서 효모 성장을 가능하게 하기 위한) HIS3의 발현은 GAL4-의존성이고, 따라서 형질전환체는 GAL4 복구가 발생한 경우에만 성장할 수 있다. 보다 앞서, 3-AT는, 히스티딘을 생산하기 위해 HIS3에 의존하는 효모 형질전환체에 3-AT를 적용하는 것에 의한 HIS3 유전자의 산물의 경쟁적 억제제이고, HIS3 발현의 증가된 수준이 효모 세포가 생존하기 위하여 요구된다.
추가적으로 사용된 효모 균주는 GAL4의 제어 하에 lacZ 마커 유전자를 함유하며, 이는 GAL4-복구된 형질전환체의 청색/백색 선택을 가능하게 했다. lacZ 유전자의 유도는 X-gal (5-브로모-4-클로로-3-인돌릴-β-D-갈락토피라노시드)로 검정 시에 청색 색상을 생성한다.
실시예 3 X-gal 검정
히스티딘이 결여된 플레이트에서 성장하는 형질전환체를 YPAD 배지 (펩톤, 효모 추출물 및 글루코스의 균질 블렌드를 함유하는 복합 효모 배지; 포미디움, 영국)를 갖는 플레이트의 표면 상에 놓인 니트로셀룰로스 막 (하이본드(Hybond), 지이 헬스케어(GE Healthcare)) 상으로 복제 플레이팅하였다. 막을 함유하는 YPAD 플레이트를 18-24시간 인큐베이션한 후에 검정을 수행하였다. 각각의 막에 대해, 5mg X-gal을 50μl DMF에 용해시키고 30μl 2-메르캅토에탄올 및 5ml Z 완충제와 합하였다. 이 용액을 사용하여 15-cm 페트리 디쉬에서 2개의 둥근 여과지 (와트만(Whatman) 541)를 적셨다. 겸자를 사용하여, 막을 YPAD 플레이트의 표면으로부터 조심스럽게 분리하고, 약 20초 동안 액체 질소 중에 완전히 침지시켰다. 동결된 막을 침지된 와트만 필터의 상부에 놓았다 (콜로니 측면이 위로 가게 함). 플레이트를 치밀하게 덮고, 37℃에서 인큐베이션하였다. 24시간 후에 청색 색상의 외관을 모니터링하였다.
실시예 4 표적 (CRISPR가 복구된) 플라스미드의 서열분석
각각의 실험에 대해, 적어도 8개의 GAL4-복구된 양성 형질전환체 (히스티딘 없는 배지에서 성장할 수 있는 콜로니)를 액체 배지 중에서 밤새 계대-배양하였고, GAL4 함유 플라스미드를 단리하였다 (지모프렙(Zymoprep) 효모 플라스미드 미니프렙 II, 지모 리서치(Zymo Research)를 사용함). 단리된 플라스미드를 추가적 증식 및 상업적 서열분석을 위하여 이. 콜라이에 도입하였다. GAL4 서열분석은 공여자 분자에 의한 서열 복구 및 조립을 입증가능하도록 했다.
양성 클론에서의 Gal4 유전자의 생어 서열분석은 이 표적화 과정의 서열 특이성을 추가로 검증하였고, 융합 NA에 의해 형질전환된 세포가 훨씬 더 많은 수의 성공적 HR 사건을 나타낼지라도, 공여자 및 gRNA를 융합 또는 비-융합된 것으로서 발현하는 세포의 복구에서 어떠한 차이도 보여주지 않았다.
실시예 5 15bp 상동성 아암에 의한 1nt의 결실
가이드 RNA로의 공여자 (공여자 1; 서열식별번호: 26)의 융합은 (히스티딘이 결여된 배지 상에서 성장할 수 있는) 복구된 형질전환체를 생성한 반면, 비-융합된 가이드 및 공여자 RNA에 의한 형질전환체에 대해서는 어떠한 성장도 관찰되지 않았다. 유전자 복구의 낮은 효율은 상동 재조합에 이용가능한 서열 중첩의 감소와 일치한다.
실시예 6 50bp 상동성 아암에 의한 1nt의 결실
가이드 RNA로의 공여자 (공여자 2; 서열식별번호: 27)의 융합은 비-융합된 공여자 및 가이드 NA에 의한 것보다 적어도 50배 더 형질전환체를 생성했다.
양성 클론에서의 Gal4 유전자의 서열분석은 복구가 HR로부터만 또는 극히 대부분 HR로부터 기인한다는 것을 보여주었다 (모든 서열분석된 클론에 대해 NHEJ의 증거가 없음).
실시예 7 50/26bp 상동성 아암에 의한 20nt의 삽입
상기와 동일한 융합 NA를 사용하여 20nt가 제거된 유사한 표적을 복구하였고 (표적 3; 서열식별번호: 11), 결과적으로 하나의 상동성 아암을 감소시켰다. 융합은 비-융합된 공여자 및 가이드 NA에 의한 것보다 약 5배 더 형질전환체를 생성했다. 양성 클론에서의 Gal4 유전자의 서열분석은 복구가 상동 재조합으로부터 독점적으로 기인한다는 것을 보여주었다.
실시예 8 50bp 상동성 아암에 의한 누락 400bp의 삽입 (3nt 떨어진 2개의 표적 서열을 시험함)
본 발명자들은 매우 근접하여 (2개의 20 nt 표적 사이에 3nt 간격으로) 위치한 2개의 서열 (스페이서 2 및 스페이서 3; 서열식별번호: 20 및 21)의 동시 표적화를 독립적으로 그리고 함께 (멀티플렉스화 표적화) 시험했다. 멀티플렉스 융합 카세트는 프로모터에 이어서 2개의 탠덤 융합 NA 서열로 이루어졌고, 이는 2개의 gRNA 및 복구 주형으로 구성된 단일 분자를 제조하도록 한다. 본 발명자들의 실험은 융합 NA가 2개의 서열을 동시에 표적화하는 것에 또한 적용가능하다는 것을 분명히 보여주었다.
표적 둘 다에 대해, 공여자-가이드 융합의 존재 하의 복구는 비-융합된 버전에 의한 것보다 매우 더 (스페이서 2에 의한 표적화에 대해 최고 10배 더, 스페이서 3에 대해 5배 더) 효율적이었다.
실시예 9 120 bp 상동성 아암에 의한 HR 말단 제외 전장 GAL4 유전자 (960bp)의 삽입
융합 CRISPR이 전장 코딩 서열의 도입에 효과적일 수 있는지를 시험하기 위해, 본 발명자들은 전장 GAL4 유전자 (서열식별번호: 7)를 도입하는 것을 시험했다. 예로서, 본 발명자들은 실시예 4에서 이미 효과적인 것으로 밝혀진 공여자/상동성 아암 길이의 비를 유지하기 위해 120bp 상동성 아암을 선택했다. 전장 GAL4 유전자의 삽입은 융합 구축물에 의해 약 4배 더 효과적이다.
표적화된 편집은 복구 공여자 서열이 gRNA에 융합되었을 때 적어도 50배 더 효율적이라는 것을 본 발명자들의 결과가 보여준다. 수행된 실험은 단일 염기 제거에서부터 전체 유전자 삽입에 이르기까지 광범위한 융합-관련 개선된 유효성을 나타낸다. 보고된 실시예는 이러한 CRISPR 융합 시스템이 비교적 큰, 가이드 RNA에 융합된 공여자 분자를 운반하기에 적합하다는 것을 보여준다.
실시예 10a 벼에서의 발현을 위한 구축물
아그로박테리움-매개된 식물 형질전환에 CRISPR/Cas 시스템을 제공하기 위해, 게이트웨이(Gateway) 2원 T-DNA 벡터를 Cas9 뉴클레아제 및 가이드 RNA-공여자 발현 카세트의 (단일 또는 이중 RNA 분자로서의) 공동-발현을 위해 설계하였다. 양쪽 말단에서 SV40 핵 국재화 신호 (NLS) (서열식별번호: 6)에 부착된, 벼 (오리자 사티바(Oryza sativa))에서 발현을 위해 코돈-최적화된 스트렙토코쿠스 피오게네스 Cas9 (SpCas9)의 버전을 합성하였다. 합성된 카세트는 Cas9 상류에 위치한 구성적 발현을 위한 메이즈 폴리유비퀴틴 (Ubi) 프로모터 (서열식별번호: 32), 및 3'-말단에서 노팔린 신타제 (nos) 종결인자 (서열식별번호: 33)를 포함한다. 이 유전자 카세트를 심리스를 통해, T-DNA 경계 내에 기능적 요소로서 식물 선택 마커; 스크리닝 마커 발현 카세트; 및 진입 클론에서 gRNA-공여자 발현 카세트와의 LR 재조합을 위해 의도된 게이트웨이 카세트를 함유하는 벡터 내로 클로닝하였다.
3개의 gRNA를 설계하였으며, 그들은 벼 프로토포르피리노겐 옥시다제 (PPO) 유전자 (WO/2015/092706; WO/2015/022640) (서열식별번호: 35)를 표적화했고, 이는 선택된 표적 부위 (스페이서 8, 스페이서 9 및 스페이서 10 (서열식별번호: 36, 37 및 38))에서 게놈 이중-가닥 절단을 발생시켰다. 변형은 2개의 아미노산 치환 (L419F, F442V; 단일 부위 돌연변이 및 이중 부위 돌연변이)을 목적으로 하며, 그들은 이전에 사플루페나실 생존을 위한 잠재적 핫스팟으로서 확인되었다.
융합 또는 비-융합 NA를 함유하는 RNA 발현 카세트 (PPO 유전자 내의 선택된 위치에 대한 유전자-특이적 스페이서 서열을 포함함)를 합성하고, 진입 벡터 내로 클로닝하였으며, 이를 CAS9 발현 카세트를 함유하는 목표 벡터 내로 (게이트웨이를 통해) 클로닝하였다. gRNA 및 공여자의 RNA 발현을 U3 snRNA의 pol III 유형 프로모터에 의해 유도하였다.
LR 재조합 단계 후에, 생성된 발현 벡터를 관련 기술분야에 널리 공지된 방법에 따라 아그로박테리움 균주 LBA4044 내로 형질전환시켰다.
실시예 10b 벼에서의 발현을 위한 구축물
SV40으로부터 유래된 NLS가 N-말단 단부에서 식물 핵 국재화 신호 (NLS) (MSERKRREKL, 서열식별번호: 71)로, C-말단 단부에서 임포르틴 NLS (KRPAATKKAGQAKKKK, 서열식별번호: 72)로 대체된 점을 제외하고는, 실시예 10a에 기재된 바와 동일한 벡터를 합성하였고, gRNA 및 공여자의 RNA 발현을 유도하는 프로모터는 U3 snRNA의 벼 pol III 유형 프로모터 (서열식별번호: 73)였다.
융합 또는 비-융합 NA를 함유하는 RNA 발현 카세트 (PPO 유전자 내의 선택된 위치에 대한 유전자-특이적 스페이서 서열을 포함함)를 합성하고, 진입 벡터 내로 클로닝하였으며, 이를 CAS9 발현 카세트를 함유하는 목표 벡터 내로 (게이트웨이를 통해) 클로닝하였다.
비 융합 대조군으로서 사용된 벡터는 PRO0231::U3 RNA pol III 프로모터::스페이서::sgRNA 스캐폴드::TTTTTTTT 종결인자::U3 RNA pol III 프로모터::주형::TTTTTTTT 종결인자를 함유한다.
LR 재조합 단계 후에, 생성된 발현 벡터를 관련 기술분야에 널리 공지된 방법에 따라 아그로박테리움 균주 LBA4044 내로 형질전환시켰다.
실시예 11 제초제-내성 캘러스의 벼 형질전환 및 선택
발현 벡터를 함유하는 아그로박테리움을 사용하여 인디카 벼 (오리자 사티바 L.(Oryza sativa L.))의 배반-유래 캘러스를 형질전환시켰다. 성숙한 종자의 멸균을 70% 에탄올에서 1분 동안에 이어서 6% 차아염소산나트륨에서 40분 동안 인큐베이션한 후에, 멸균 MQ 물로 3 내지 5회 세척함으로써 수행하였다. 이어서, 멸균된 종자를 2,4-D를 함유하는 배지 (캘러스 유도 배지) 상에서 발아시켰다. 광 하에 6일 인큐베이션한 후에, 배반-유래 캘러스를 박테리아 용액 (OD600 = 0.1) 내에서 90초 동안 인큐베이션하고, 배수시키고, 멸균 필터 종이 상에서 건조시킨 다음, 3일 동안 암실에서 25℃에서 박테리아와 공동-배양하였다. 공동-배양된 캘러스를 4주 동안 광 하에 32℃에서 G418을 함유하는 선택 배지로 옮겼다. 항생제-내성 캘러스 조각을 2주 동안 광 하에 32℃에서 25 또는 50 μM 사플루페나실 (킥소르(Kixor)™)을 함유하는 선택 배지로 옮겼다. 이들 제초제 선택 조건을 사플루페나실에 의한 사멸 곡선에서의 조직 생존의 분석을 통해 확립하였다. 제초제-내성 물질을 재생 배지로 옮기고 광 하에 인큐베이션한 후, 배아발생 잠재력이 나타났고, 다음 4 내지 5주 내에 싹이 발생하였다. 싹을 캘러스로부터 절제하고, 싹이 토양으로 옮기기 위해 잘 뿌리를 내릴 때까지 옥신-함유 배지 상에서 2 내지 3주 동안 인큐베이션하였다. 단단해진 싹을 온실 내에서 높은 습도 및 짧은 기간 하에 성장시켰다.
실시예 12 제초제 내성 형질전환체의 분자 특징화
각각의 개별 식물 형질전환체로부터 수집된 잎 조직을 PPO 유전자 서열 돌연변이의 카피수 분석 및 분자 특징화에 사용하였다. 제조업체에 의해 지시된 바와 같이 위자드(Wizard) 96 마그네틱 DNA 식물 시스템 키트 (프로메가, 미국 특허 번호 6,027,945 & 6,368,800)를 사용하여 게놈 DNA를 추출하였다. 정방향 및 역방향 프라이머와 함께 적절한 프로브를 사용하여 단리된 DNA를 PCR 증폭시켰다. T-DNA 삽입체의 카피수를 입증하기 위한 이러한 정량적 PCR 분석 후에, 선택제에 대한 내성을 나타내는 단지 낮은 카피의 트랜스제닉 식물만을 T1 종자의 수확를 위해 유지하였다. 이어서, 이식 3 내지 5개월 후에 종자를 수확하였다.
PPO 게놈 서열의 PCR 증폭을 하기와 같이: 96℃에서 15분 동안, 이어서 35 사이클 (96℃, 30초; 58℃, 30초; 72℃, 3분 30초), 72℃에서 10분 열순환 프로그램을 사용하여 융합 Taq DNA 폴리머라제 (써모 사이언티픽(Thermo Scientific))를 사용하여 수행하였다. PCR 생성물을 아가로스 겔 전기영동을 통해 농도 및 단편 크기에 대해 입증하고, PCR 프라이머를 사용하는 서열분석을 위해 보냈다. 디폴트 설정을 사용하여 대표적인 크로마토그램 추적 파일 및 상응하는 얼라인X(AlignX) 정렬 상에서 서열 분석을 수행하고, 2차 피크를 호출하기 위해 편집하였다.
서열 정보에 기초하여 여러 개체에서 확인된 돌연변이는, NA의 CRISPR 성분으로의 융합을 수반하는 본 발명에 기재된 기술이 식물 유기체에 적용될 수 있다는 것을 보여준다. 제공된 공여자에 의한 상동 재조합 복구는 사플루페나실 (단일 부위 돌연변이 및 다중 부위 돌연변이)에 대한 내성을 부여한다.
실시예 13 에스케리키아 콜라이에서의 제어된 유전자 녹아웃
본 실시예에서 융합CRISPR은 이. 콜라이 균주 K-12 하위균주 MG1655에서 표적 유전자 RecA를 녹아웃시키는데 사용된다. 박테리아 균주를 100 ml 삼각 플라스크에서 10 ml SOB 중에 접종시키고, 밤새 37℃에서 성장시켰다 (SOB: 2% 박토-트립톤, 0.5% 효모 추출물, 10 mM NaCl, 2.5 mM KCl, 10 mM MgCl2, 10 mM MgSO4). 밤샘 배양물 3 ml를 1 리터 삼각 플라스크에서 250 ml SOB 중에 희석하고, OD660nm가 0.6이 될 때까지 18℃에서 격렬히 진탕시키면서 (200-250 rpm) 성장시켰다. 후속적으로 배양물을 사전 냉각된 50 ml 튜브로 옮기고, 5분 동안 4℃에서 5000 rpm으로 원심분리하였다. 펠릿을 빙냉 TB의 원래 부피의 1/3 중에 재현탁하고 (TB: 250 mM KCl, 10 mM PIPES 유리 산, 15 mM CaCl2·2H2O, 55 mM MnCl2·2H2O), 10분 동안 얼음 상에서 인큐베이션하였다. 세포를 5분 동안 4℃에서 5000 rpm으로 원심분리하고, 펠릿을 빙냉 TB의 원래 부피의 1/12 중에 재현탁하였다. DMSO를 부드럽게 혼합하면서 7%의 최종 농도로 첨가하였다. 적격 세포를 200 μl 부분으로 분취하고, 액체 질소에서 동결시켰다. 적격 세포의 하나의 분취물을 클로람페니콜 선택 마커 및 pCas9에 존재하는 바와 같은 Cas9 발현 카세트 [Jiang W, Bikard D, Cox D, Zhang F, Marraffini L (2013) RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nat Biotechnol] 및 융합 RNA의 발현을 위한 카세트 [Zhao D, Yuan S, Xiong B, Sun H, Ye L, Li J, Zhang X, Bi C. (2016) Development of a fast and easy method for Escherichia coli genome editing with CRISPR/Cas9. Microb Cell Fact. 15(1):205]를 함유하고 하기 융합CRISPR 서열 및 RecA 스페이서를 갖는 0.1-0.5 μg의 플라스미드와 함께 첨가하였다:
여기서 RecA를 인지하는 스페이서는 강조표시하고, sgRNA에 대한 필수 서열은 대문자표시하되, 밑줄표시하지 않았고, RecA와의 상동성 아암 1은 이중 밑줄표시하고, RecA와의 상동성 아암 2는 단일 밑줄표시하였다. 융합CRISPR 구축물 및 Cas9를 위한 프로모터 및 종결인자는 http://parts.igem.org/Promoters/Catalog/Constitutive 및 http://parts.igem.org/Terminators/Catalog로부터 선택될 수 있다. 표적화된 RecA 유전자는 하기 서열을 갖는다:
여기서 PAM 서열은 이탤릭표시하고, 상동성 아암 1은 이중 밑줄표시하고, 상동성 아암 2는 단일 밑줄표시하고, 프로토스페이서는 강조표시하였다. DNA 및 세포를 얼음 상에서 30분 동안 유지한 후에 42℃에서 90초 열 쇼크에 적용하였다. 세포 및 DNA를 얼음으로 옮기고, 1 ml LB를 1분 후에 첨가하였다 (LB: 1% 트립톤, 1% NaCl, 0.5% 효모 추출물, pH 7.0). 세포를 1시간 동안 37℃에서 회복하도록 하였다. 회복기는 융합CRISPR 성분이 더 많은 시간 동안 이. 콜라이 게놈을 편집하도록 하기 위해 16시간으로 연장될 수 있다. 25 μg/ml 클로람페니콜을 1시간 후에 첨가하여 플라스미드의 손실을 막아야 한다. 세포를 25 μg/ml 클로람페니콜을 갖는 LB 배지 상에 플레이팅하고, 37℃에서 1일 동안 인큐베이션하였다. 플레이트로부터 단일 콜로니를 선택하고, 밤새 클로람페니콜을 갖는 LB에서 37℃에서 성장시킨 후 게놈 DNA를 추출하였다 [He, F. (2011) E. coli Genomic DNA Extraction. Bio-protocol Bio101: e97]. 제1 상동성 아암 상류의 정방향 프라이머 (ATGGCTATCGACGAAAACAAA) (서열식별번호: 44) 및 제2 상동성 아암 하류의 역방향 프라이머 (CGTCAGCGTGGTTTTACCGGA) (서열식별번호: 45)에 의한 PCR을 수행하여 RecA 서열 (서열식별번호: 43)에서 볼드체표시로 나타낸 11개의 뉴클레오티드가 융합CRISPR 주형에 의한 상동 재조합 복구로 인해 더 이상 존재하지 않는 콜로니를 확인하였다. PCR 단편을 서열분석하거나 (예상된 크기 220 bp), 또는 이 경우 AgeI 소화에 적용하여 (PAM 주위에 결실된 서열이 AgeI 인식 부위 ACCGGT를 함유함) 표준 겔 전기영동 후에 유전자좌의 변형을 입증할 수 있었다. 11개의 뉴클레오티드의 결실은 오픈 리딩 프레임의 파괴를 보증한다.
실시예 14 인간-유도된 만능 줄기 세포 (hiPSC) 및 HEK293 세포의 PRDM9 유전자의 제어된 녹아웃
세포 배양 유지, 플라스미드 구축, 형질감염 방법 및 hiPSC 및 HEK293 세포에서의 게놈 편집의 분자 분석은 문헌 [Yang L, Yang JL, Byrne S, Pan J, Church G (2014) CRISPR/Cas9-directed genome editing of cultured cells. Current Protocols in Molecular Biology 31.1.1-31.1.17]에 매우 상세하게 기재되어 있다. PRDM9 유전자의 녹아웃을 위해, 모든 단계는 gRNA 플라스미드 설계에서의 단지 작은 변화만 갖고, 본원에 기재된 바를 따랐다. 합성된 gRNA는 하기 서열을 가질 것이다:
여기서 U6 프로모터는 이탤릭체표시로 나타내고, PRDM9 엑손 ENSE00001804383을 인지하는 스페이서는 강조표시하고, sgRNA를 위한 필수 서열은 대문자표시하되 밑줄표시 또는 이탤릭체표시하지 않았고, PRDM9와의 상동성 아암 1은 이중 밑줄표시하고, PRDM9와의 상동성 아암 2는 단일 밑줄표시하고, 종결인자는 소문자표시하였다. 표적화된 PRDM9 엑손 ENSE00001804383은 하기 서열을 갖는다:
여기서 PAM 서열은 이탤릭체표시하고, 상동성 아암 1은 이중 밑줄표시하고, 상동성 아암 2는 단일 밑줄표시하고, 프로토스페이서는 강조표시하였다. 볼드체표시로 나타낸 뉴클레오티드는 융합CRISPR 구축물과의 상동 재조합 시에 결실되어 게놈 DNA로부터의 각각의 게놈 영역의 PCR 증폭 및 생성된 PCR 생성물의 후속 서열분석을 사용하여 나타낸 바와 같은 프레임 시프트를 생성한다.
실시예 15: 벼에서 시클로헥산디온 (DIM) 및/또는 아릴옥시페녹시프로피오네이트 (FOP)에 대해 생성된 벼 식물 내 점 돌연변이의 도입.
색소체성(plastidic) 아세틸 조효소 A 카르복실라제 (ACCase)의 돌연변이 I1781L 및 G2096S는 DIM 및 FOP 제초제에 대한 내성을 부여하는 것으로 공지되어 있다. 이들 돌연변이를 하기 벡터를 사용하여 내인성 ACCase 유전자좌에 도입할 수 있다.
벡터 RLW137 서열식별번호: 66
이 벡터의 백본은 게이트웨이-가능 구축물 RLW121 서열식별번호: 62이다.
RLW137을 위한 ENTR 벡터는 벡터 CC003 서열식별번호: 63 (유입되는 T-DNA를 위한 선택 마커), CC018 서열식별번호: 64 (G2096에 상응하는 DNA의 상류를 절단한 후에 G2096S를 표적화하고 도입하는 융합CRISPR 구축물을 생성함) 및 CC006 서열식별번호: 65 (Cas9를 제공함)이다.
CC018 (CRISPRCas018에 대해 짧음)은 유입되는 뉴클레오티드 (이 경우에 G2096S를 코딩함)에 플랭킹된 ~300 nt 상동성 아암을 함유한다. 추가의 돌연변이를 공동-도입하여 T-DNA (돌연변이된 PAM, 대안적으로 또는 추가로 스페이서는 바람직하게는 존재하는 경우에 엑손과 부합하고 인트론/엑손 경계에 영향을 미치지 않은 부분에서 침묵하는 많은 돌연변이를 포함할 수 있음)의 자기-절단 및 상동성 아암 또는 유입되는 뉴클레오티드에 존재하는 T의 긴 스트레치 상에서의 전사의 조기 종결을 회피할 수 있었다.
공여자 분자가 가이드 RNA에 연결되지 않는 개별 분자로서 발현되는 것을 제외하고 동일한 대조군 벡터를 합성하였다.
벡터 RLW137 및 대조군 벡터를 상기 기재된 프로토콜을 사용하여 벼 내로 형질전환시켰다. 초기 선택은 ZmAHAS A122T S553N 마커의 존재에 대한 것이다. 형질전환된 식물의 분석을 실시예 12에 기재된 바와 같이 수행하였다.
RLW137에 대해 상기 기재된 절차와 유사하게, RLW138에 동일한 돌연변이를 도입하되, 이번에는 대안적 하류 프로토스페이서 부위를 사용하였다. RLW138은 CC003, CC019 (서열식별번호: 67) 및 CC006과 RLW121 백본으로 이루어진다.
돌연변이 I1781L을 RLW121, CC003, CC020 (서열식별번호: 69) 및 CC006으로 이루어지는 RLW139 (서열식별번호: 70)에 의해 도입하였다.
실시예 16 바실루스에서의 융합 CRISPR의 적용
전기적격 바실루스 서브틸리스 세포 및 전기천공
비. 서브틸리스 ATCC 6051 내로의 DNA의 형질전환을 전기천공을 통해 수행하였다. 전기적격 비. 서브틸리스 ATCC 6051 세포의 제조 및 DNA의 형질전환을 수(Xue) 등에 의해 본질적으로 기재된 바에 따라 (Xue, G.-P., 1999, Journal of Microbiological Methods 34, 183-191), 하기와 같이 변형하여 수행하였다: DNA의 형질전환 시에, 세포를 1ml LBSPG 완충제 중에서 회복시키고, 60분 동안 37℃에서 인큐베이션한 후에 (Vehmaanperae J., 1989, FEMS Microbio. Lett., 61: 165-170) 선택적 LB-한천 플레이트 상에 플레이팅하였다. 온도-감수성 pE194 복제 기점을 함유하는 플라스미드를 위해, 세포를 3시간 동안 33℃에서 회복시켰다.
플라스미드 단리
플라스미드 DNA를 문헌 [Sambrook,J. and Russell,D.W. Molecular cloning. A laboratory manual, 3rd ed, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY. 2001.]에 기재된 표준 분자 생물학 방법에 의해, 또는 알칼리성 용해 방법에 의해 (Birnboim, H. C., Doly, J. (1979). Nucleic Acids Res 7(6): 1513-1523) 바실루스 및 이. 콜라이 세포로부터 단리하였다. 바실루스 세포는 이. 콜라이와 비교하여 세포 용해 전에 30분 동안 37℃에서 10mg/ml 리소자임으로 처리하였다.
올리고뉴클레오티드-듀플렉스를 형성하기 위한 올리고뉴클레오티드의 어닐링.
올리고뉴클레오티드를 물에서 100μM의 농도로 조정하였다. 정방향 올리고뉴클레오티드 5μl 및 상응하는 역방향 올리고뉴클레오티드 5μl를 90μl 30mM HEPES-완충제 (pH 7.8)에 첨가하였다. 반응 혼합물을 5분 동안 95℃로 가열한 다음, 95℃에서 4℃로 0.1℃/초씩 온도를 감소시키면서 경사지도록 함으로써 어닐링하였다 (Cobb, R. E., Wang, Y., & Zhao, H. (2015). High-Efficiency Multiplex Genome Editing of Streptomyces Species Using an Engineered CRISPR/Cas System. ACS Synthetic Biology, 4(6), 723-728).
분자 생물학 방법 및 기술
플라스미드 pJOE8999:
문헌 [Altenbuchner J. 2016. Editing of the Bacillus subtilis genome by the CRISPR-Cas9 system. Appl Environ Microbiol 82:5421-5].
플라스미드 pCC001
표준 이. 콜라이 클로닝 벡터 (pUC 유도체)에 제공된 pJOE8999 및 합성 유전자 단편 서열식별번호: 048을 AvrII 및 XbaI로 절단한 후, pJOE8999 플라스미드 백본 및 서열식별번호: 048의 더 작은 AvrII/XbaI 단편을 단리하였다. 2개의 단편을 T4-DNA 리가제 (NEB)를 사용하여 라이게이션한 후, 이. 콜라이 XL1-블루 적격 세포 (스트라타진(Stratagene)) 내로 형질전환하였다. 정확한 플라스미드를 회수하고 pCC001로 명명하였다.
플라스미드 pCC002
표준 이. 콜라이 클로닝 벡터 (pUC 유도체)에 제공된 pJOE8999 및 합성 유전자 단편 서열식별번호: 049를 AvrII 및 XbaI로 절단한 후, pJOE8999 플라스미드 백본 및 서열식별번호: 049의 더 작은 AvrII/XbaI 단편을 단리하였다. 2개의 단편을 T4-DNA 리가제 (NEB)를 사용하여 라이게이션한 후, 이. 콜라이 XL1-블루 적격 세포 (스트라타진) 내로 형질전환하였다. 정확한 플라스미드를 회수하고 pCC002로 명명하였다.
플라스미드 pCC003
5' 인산화를 갖는 올리고뉴클레오티드 서열식별번호: 050 및 서열식별번호: 051을 어닐링하여 비. 서브틸리스 ATCC6051의 아밀라제 유전자 amyE를 표적화하는 프로토스페이서 서열을 코딩하는 올리고뉴클레오티드 듀플렉스를 형성하였다. 플라스미드 pJOE8999를 BsaI로 절단한 후, 올리고뉴클레오티드 듀플렉스와 라이게이션하여 플라스미드 pCC003을 회수하였다.
플라스미드 pCC004
비. 서브틸리스 ATCC6051의 아밀라제 amyE 유전자에 인접한 5' 상동성 영역 (HomA로서도 지칭됨) 및 3' 상동성 영역 (HomB로서도 지칭됨)을 각각 올리고뉴클레오티드 서열식별번호: 52, 서열식별번호: 53 및 서열식별번호: 54, 서열식별번호: 55에 의해 단리된 게놈 DNA 상에서 PCR-증폭시켰다. 2개의 상동성 영역 HomA 및 HomB를 융합시키고, 올리고뉴클레오티드 서열식별번호: 52 및 서열식별번호: 55에 의해 중첩 PCR을 사용하여 증폭시켜 amyE 유전자의 상동성 영역의 HomAB PCR 단편을 회수하였다. 플라스미드 pCC003 및 HomAB-amyE PCR 단편을 SfiI로 절단한 후, T4-DNA 리가제 (NEB)에 의해 라이게이션하였다. 반응 혼합물을 이. 콜라이 XL1-블루 적격 세포 (스트라타진) 내로 형질전환시켰다. amyE 프로토스페이서 및 amyE의 HomAB를 함유하는 정확한 플라스미드를 회수하고 pCC004 (도 23)로 명명하였다.
플라스미드 pCC005
플라스미드 pCC001을 BsaI로 절단한 후, pCC003에 대해 기재된 바와 같이 amyE 프로토스페이서 올리고뉴클레오티드 듀플렉스 (서열식별번호: 050/서열식별번호: 051)를 클로닝하였다. pCC004의 구축에 대해 기재된 바와 같이 생성된 플라스미드 및 amyE 유전자의 상동성 영역 HomAB의 PCR-단편을 SfiI로 절단한 후, T4-DNA 리가제 (NEB)에 의해 라이게이션하였다. 반응 혼합물을 이. 콜라이 XL1-블루 적격 세포 (스트라타진) 내로 형질전환시켰다. amyE 프로토스페이서 및 amyE의 HomAB를 함유하는 정확한 플라스미드를 회수하고 pCC005로 명명하였다.
플라스미드 pCC006
비. 서브틸리스 ATCC6051의 아밀라제 amyE 유전자에 인접한 5' 상동성 영역 (HomA로서도 지칭됨) 및 3' 상동성 영역 (HomB로서도 지칭됨)을 각각 올리고뉴클레오티드 서열식별번호: 56, 서열식별번호: 57 및 서열식별번호: 58, 서열식별번호: 59에 의해 단리된 게놈 DNA 상에서 PCR-증폭시켰다. 2개의 상동성 영역 HomA 및 HomB를 융합시키고, 올리고뉴클레오티드 서열식별번호: 56 및 서열식별번호: 59에 의해 중첩 PCR을 사용하여 증폭시켜 amyE 유전자의 상동성 영역의 HomAB PCR 단편을 회수하였다. 플라스미드 pCC001을 BsaI로 절단한 후, pCC003에 대해 기재된 바와 같이 T4-DNA 리가제 (NEB)로 amyE 프로토스페이서 올리고뉴클레오티드 듀플렉스 (서열식별번호: 50/서열식별번호: 51)와 라이게이션하였다. 생성된 플라스미드 및 amyE 유전자의 상동성 영역 HomAB의 PCR-단편을 SfiI로 절단한 후, T4-DNA 리가제 (NEB)로 라이게이션하였다. 반응 혼합물을 이. 콜라이 XL1-블루 적격 세포 (스트라타진) 내로 형질전환시켰다. amyE 프로토스페이서 및 amyE의 HomAB를 pCC005와 비교하여 역 배향으로 함유하는 정확한 플라스미드를 회수하고 pCC006으로 명명하였다.
플라스미드 pCC007
플라스미드 pCC002를 BsaI로 절단한 후, pCC003에 대해 기재된 바와 같이 T4-DNA 리가제 (NEB)로 amyE 프로토스페이서 올리고뉴클레오티드 듀플렉스 (서열식별번호: 50/서열식별번호: 51)와 라이게이션하였다. pCC004의 구축에 대해 기재된 바와 같이 생성된 플라스미드 및 amyE 유전자의 상동성 영역 HomAB의 PCR-단편을 SfiI로 절단한 후, T4-DNA 리가제 (NEB)로 라이게이션하였다. 반응 혼합물을 이. 콜라이 XL1-블루 적격 세포 (스트라타진) 내로 형질전환시켰다. amyE 유전자의 HomAB 및 amyE 프로토스페이서를 함유하는 정확한 플라스미드를 회수하고 pCC007로 명명하였다.
플라스미드 pCC008
플라스미드 pCC002를 BsaI로 절단한 후, pCC003에 대해 기재된 바와 같이 T4-DNA 리가제 (NEB)로 amyE 프로토스페이서 올리고뉴클레오티드 듀플렉스 (서열식별번호: 50/서열식별번호: 51)와 라이게이션하였다. pCC006에 대해 기재된 바와 같이 생성된 플라스미드 및 올리고뉴클레오티드 서열식별번호: 56 및 서열식별번호: 59에 의해 증폭시킨 amyE의 상동성 영역 HomAB의 PCR-단편을 SfiI로 절단한 후, T4-DNA 리가제 (NEB)로 라이게이션하였다. 반응 혼합물을 이. 콜라이 XL1-블루 적격 세포 (스트라타진) 내로 형질전환시켰다. pCC007과 비교하여 역 배향으로 amyE의 HomAB 및 amyE 프로토스페이서를 함유하는 정확한 플라스미드를 회수하고 pCC008로 명명하였다.
융합-CRISPR을 사용한 유전자 결실.
전기적격 비. 서브틸리스 ATCC6051 세포를 수(Xue) 등에 의해 본질적으로 기재된 바에 따라 (Xue, G.-P., 1999, Journal of Microbiological Methods 34, 183-191), 1μg의 각각의 플라스미드 pJOE8999, pCC004, pCC005, pCC006, pCC007, pCC008에 의해, 하기와 같이 변형하여 형질전환시켰다: DNA의 형질전환 시에, 세포를 1ml LBSPG 완충제 중에서 회복시키고, 3시간 동안 33℃에서 인큐베이션한 후 (Vehmaanperae J., 1989, FEMS Microbio. Lett., 61: 165-170), Cas9 유도를 위한 0.2% D-만노스 및 20μg/ml 카나마이신이 보충된 LB-레녹스(Lennox) 플레이트 상에 플레이팅하였다. 플레이트를 20-22시간 동안 33℃에서 인큐베이션하였다. 각각의 플라스미드 형질전환으로부터 10개 이하의 클론을 피킹하고, 새로운 예열된 LB-레녹스-플레이트 상에 옮긴 후, 50℃에서 18시간 동안 인큐베이션하였다. 각각의 크게 성장한 콜로니로부터, 세포를 피킹하고, 45℃에서 7-8시간 인큐베이션한 후에 단일 콜로니를 수득하기 위해 새로운 LB-레녹스 플레이트 상에서 3회의 스트로크를 수행하였다. 단일 콜로니를 LB-레녹스 플레이트 상으로 옮기고, LB-레녹스 플레이트에 20μg/ml 카나마이신을 보충한 후, 30℃에서 16-18시간 동안 인큐베이션하였다. 플라스미드 손실을 나타내는, 카나마이신-감수성 클론을 1% 가용성 전분으로 보충된 LB-레녹스 플레이트 상에 플레이팅한 후, 20시간 동안 30℃에서 인큐베이션하였다. 아밀라제 amyE 유전자의 불활성화를 아이오딘 함유 루골(Lugol) 용액으로 플레이트를 덮음으로써 시각화하였고, 할로 광의 존재 또는 부재를 분석했고, 후자가 성공적 불활성화를 나타낸다.
표 2는 플라스미드 큐어링 후에 전체 클론의 양, 불활성화된 아밀라제를 갖는 클론의 양, 전체 클론에 비해 불활성화된 아밀라제를 갖는 클론의 백분율 및 pCC004에 비해 나타낸 플라스미드에 의한 상대 녹아웃 효율 (도 25)을 요약한다.
표 2
SEQUENCE LISTING
<110> BASF Plant Science Company GmbH
<120> Improved methods for modification of target nucleic acids
<130> 160315WO01
<160> 73
<170> BiSSAP 1.3
<210> 1
<211> 4140
<212> DNA
<213> Artificial Sequence
<220>
<223> Cas9 yeast
<400> 1
atggataaaa aatattctat tggtttggat attggtacta attctgttgg ttgggctgtt 60
attactgatg aatataaagt tccatctaaa aaatttaaag ttttgggtaa tactgataga 120
cattctatta aaaaaaattt gattggtgct ttgttgtttg attctggtga aactgctgaa 180
gctactagat tgaaaagaac tgctagaaga agatatacta gaagaaaaaa tagaatttgt 240
tatttgcaag aaattttttc taatgaaatg gctaaagttg atgattcttt ttttcataga 300
ttggaagaat cttttttggt tgaagaagat aaaaaacatg aaagacatcc aatttttggt 360
aatattgttg atgaagttgc ttatcatgaa aaatatccaa ctatttatca tttgagaaaa 420
aaattggttg attctactga taaagctgat ttgagattga tttatttggc tttggctcat 480
atgattaaat ttagaggtca ttttttgatt gaaggtgatt tgaatccaga taattctgat 540
gttgataaat tgtttattca attggttcaa acttataatc aattgtttga agaaaatcca 600
attaatgctt ctggtgttga tgctaaagct attttgtctg ctagattgtc taaatctaga 660
agattggaaa atttgattgc tcaattgcca ggtgaaaaaa aaaatggttt gtttggtaat 720
ttgattgctt tgtctttggg tttgactcca aattttaaat ctaattttga tttggctgaa 780
gatgctaaat tgcaattgtc taaagatact tatgatgatg atttggataa tttgttggct 840
caaattggtg atcaatatgc tgatttgttt ttggctgcta aaaatttgtc tgatgctatt 900
ttgttgtctg atattttgag agttaatact gaaattacta aagctccatt gtctgcttct 960
atgattaaaa gatatgatga acatcatcaa gatttgactt tgttgaaagc tttggttaga 1020
caacaattgc cagaaaaata taaagaaatt ttttttgatc aatctaaaaa tggttatgct 1080
ggttatattg atggtggtgc ttctcaagaa gaattttata aatttattaa accaattttg 1140
gaaaaaatgg atggtactga agaattgttg gttaaattga atagagaaga tttgttgaga 1200
aaacaaagaa cttttgataa tggttctatt ccacatcaaa ttcatttggg tgaattgcat 1260
gctattttga gaagacaaga agatttttat ccatttttga aagataatag agaaaaaatt 1320
gaaaaaattt tgacttttag aattccatat tatgttggtc cattggctag aggtaattct 1380
agatttgctt ggatgactag aaaatctgaa gaaactatta ctccatggaa ttttgaagaa 1440
gttgttgata aaggtgcttc tgctcaatct tttattgaaa gaatgactaa ttttgataaa 1500
aatttgccaa atgaaaaagt tttgccaaaa cattctttgt tgtatgaata ttttactgtt 1560
tataatgaat tgactaaagt taaatatgtt actgaaggta tgagaaaacc agcttttttg 1620
tctggtgaac aaaaaaaagc tattgttgat ttgttgttta aaactaatag aaaagttact 1680
gttaaacaat tgaaagaaga ttattttaaa aaaattgaat gttttgattc tgttgaaatt 1740
tctggtgttg aagatagatt taatgcttct ttgggtactt atcatgattt gttgaaaatt 1800
attaaagata aagatttttt ggataatgaa gaaaatgaag atattttgga agatattgtt 1860
ttgactttga ctttgtttga agatagagaa atgattgaag aaagattgaa aacttatgct 1920
catttgtttg atgataaagt tatgaaacaa ttgaaaagaa gaagatatac tggttggggt 1980
agattgtcta gaaaattgat taatggtatt agagataaac aatctggtaa aactattttg 2040
gattttttga aatctgatgg ttttgctaat agaaatttta tgcaattgat tcatgatgat 2100
tctttgactt ttaaagaaga tattcaaaaa gctcaagttt ctggtcaagg tgattctttg 2160
catgaacata ttgctaattt ggctggttct ccagctatta aaaaaggtat tttgcaaact 2220
gttaaagttg ttgatgaatt ggttaaagtt atgggtagac ataaaccaga aaatattgtt 2280
attgaaatgg ctagagaaaa tcaaactact caaaaaggtc aaaaaaattc tagagaaaga 2340
atgaaaagaa ttgaagaagg tattaaagaa ttgggttctc aaattttgaa agaacatcca 2400
gttgaaaata ctcaattgca aaatgaaaaa ttgtatttgt attatttgca aaatggtaga 2460
gatatgtatg ttgatcaaga attggatatt aatagattgt ctgattatga tgttgatcat 2520
attgttccac aatctttttt gaaagatgat tctattgata ataaagtttt gactagatct 2580
gataaaaata gaggtaaatc tgataatgtt ccatctgaag aagttgttaa aaaaatgaaa 2640
aattattgga gacaattgtt gaatgctaaa ttgattactc aaagaaaatt tgataatttg 2700
actaaagctg aaagaggtgg tttgtctgaa ttggataaag ctggttttat taaaagacaa 2760
ttggttgaaa ctagacaaat tactaaacat gttgctcaaa ttttggattc tagaatgaat 2820
actaaatatg atgaaaatga taaattgatt agagaagtta aagttattac tttgaaatct 2880
aaattggttt ctgattttag aaaagatttt caattttata aagttagaga aattaataat 2940
tatcatcatg ctcatgatgc ttatttgaat gctgttgttg gtactgcttt gattaaaaaa 3000
tatccaaaat tggaatctga atttgtttat ggtgattata aagtttatga tgttagaaaa 3060
atgattgcta aatctgaaca agaaattggt aaagctactg ctaaatattt tttttattct 3120
aatattatga atttttttaa aactgaaatt actttggcta atggtgaaat tagaaaaaga 3180
ccattgattg aaactaatgg tgaaactggt gaaattgttt gggataaagg tagagatttt 3240
gctactgtta gaaaagtttt gtctatgcca caagttaata ttgttaaaaa aactgaagtt 3300
caaactggtg gtttttctaa agaatctatt ttgccaaaaa gaaattctga taaattgatt 3360
gctagaaaaa aagattggga tccaaaaaaa tatggtggtt ttgattctcc aactgttgct 3420
tattctgttt tggttgttgc taaagttgaa aaaggtaaat ctaaaaaatt gaaatctgtt 3480
aaagaattgt tgggtattac tattatggaa agatcttctt ttgaaaaaaa tccaattgat 3540
tttttggaag ctaaaggtta taaagaagtt aaaaaagatt tgattattaa attgccaaaa 3600
tattctttgt ttgaattgga aaatggtaga aaaagaatgt tggcttctgc tggtgaattg 3660
caaaaaggta atgaattggc tttgccatct aaatatgtta attttttgta tttggcttct 3720
cattatgaaa aattgaaagg ttctccagaa gataatgaac aaaaacaatt gtttgttgaa 3780
caacataaac attatttgga tgaaattatt gaacaaattt ctgaattttc taaaagagtt 3840
attttggctg atgctaattt ggataaagtt ttgtctgctt ataataaaca tagagataaa 3900
ccaattagag aacaagctga aaatattatt catttgttta ctttgactaa tttgggtgct 3960
ccagctgctt ttaaatattt tgatactact attgatagaa aaagatatac ttctactaaa 4020
gaagttttgg atgctacttt gattcatcaa tctattactg gtttgtatga aactagaatt 4080
gatttgtctc aattgggtgg tgattctaga gctgatccaa aaaaaaaaag aaaagtttaa 4140
<210> 2
<211> 1379
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas9 yeast protein
<400> 2
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys
1365 1370 1375
Arg Lys Val
<210> 3
<211> 4140
<212> DNA
<213> Artificial Sequence
<220>
<223> Cas9 D10A H840A inactive
<400> 3
atggataaaa aatattctat tggtttggct attggtacta attctgttgg ttgggctgtt 60
attactgatg aatataaagt tccatctaaa aaatttaaag ttttgggtaa tactgataga 120
cattctatta aaaaaaattt gattggtgct ttgttgtttg attctggtga aactgctgaa 180
gctactagat tgaaaagaac tgctagaaga agatatacta gaagaaaaaa tagaatttgt 240
tatttgcaag aaattttttc taatgaaatg gctaaagttg atgattcttt ttttcataga 300
ttggaagaat cttttttggt tgaagaagat aaaaaacatg aaagacatcc aatttttggt 360
aatattgttg atgaagttgc ttatcatgaa aaatatccaa ctatttatca tttgagaaaa 420
aaattggttg attctactga taaagctgat ttgagattga tttatttggc tttggctcat 480
atgattaaat ttagaggtca ttttttgatt gaaggtgatt tgaatccaga taattctgat 540
gttgataaat tgtttattca attggttcaa acttataatc aattgtttga agaaaatcca 600
attaatgctt ctggtgttga tgctaaagct attttgtctg ctagattgtc taaatctaga 660
agattggaaa atttgattgc tcaattgcca ggtgaaaaaa aaaatggttt gtttggtaat 720
ttgattgctt tgtctttggg tttgactcca aattttaaat ctaattttga tttggctgaa 780
gatgctaaat tgcaattgtc taaagatact tatgatgatg atttggataa tttgttggct 840
caaattggtg atcaatatgc tgatttgttt ttggctgcta aaaatttgtc tgatgctatt 900
ttgttgtctg atattttgag agttaatact gaaattacta aagctccatt gtctgcttct 960
atgattaaaa gatatgatga acatcatcaa gatttgactt tgttgaaagc tttggttaga 1020
caacaattgc cagaaaaata taaagaaatt ttttttgatc aatctaaaaa tggttatgct 1080
ggttatattg atggtggtgc ttctcaagaa gaattttata aatttattaa accaattttg 1140
gaaaaaatgg atggtactga agaattgttg gttaaattga atagagaaga tttgttgaga 1200
aaacaaagaa cttttgataa tggttctatt ccacatcaaa ttcatttggg tgaattgcat 1260
gctattttga gaagacaaga agatttttat ccatttttga aagataatag agaaaaaatt 1320
gaaaaaattt tgacttttag aattccatat tatgttggtc cattggctag aggtaattct 1380
agatttgctt ggatgactag aaaatctgaa gaaactatta ctccatggaa ttttgaagaa 1440
gttgttgata aaggtgcttc tgctcaatct tttattgaaa gaatgactaa ttttgataaa 1500
aatttgccaa atgaaaaagt tttgccaaaa cattctttgt tgtatgaata ttttactgtt 1560
tataatgaat tgactaaagt taaatatgtt actgaaggta tgagaaaacc agcttttttg 1620
tctggtgaac aaaaaaaagc tattgttgat ttgttgttta aaactaatag aaaagttact 1680
gttaaacaat tgaaagaaga ttattttaaa aaaattgaat gttttgattc tgttgaaatt 1740
tctggtgttg aagatagatt taatgcttct ttgggtactt atcatgattt gttgaaaatt 1800
attaaagata aagatttttt ggataatgaa gaaaatgaag atattttgga agatattgtt 1860
ttgactttga ctttgtttga agatagagaa atgattgaag aaagattgaa aacttatgct 1920
catttgtttg atgataaagt tatgaaacaa ttgaaaagaa gaagatatac tggttggggt 1980
agattgtcta gaaaattgat taatggtatt agagataaac aatctggtaa aactattttg 2040
gattttttga aatctgatgg ttttgctaat agaaatttta tgcaattgat tcatgatgat 2100
tctttgactt ttaaagaaga tattcaaaaa gctcaagttt ctggtcaagg tgattctttg 2160
catgaacata ttgctaattt ggctggttct ccagctatta aaaaaggtat tttgcaaact 2220
gttaaagttg ttgatgaatt ggttaaagtt atgggtagac ataaaccaga aaatattgtt 2280
attgaaatgg ctagagaaaa tcaaactact caaaaaggtc aaaaaaattc tagagaaaga 2340
atgaaaagaa ttgaagaagg tattaaagaa ttgggttctc aaattttgaa agaacatcca 2400
gttgaaaata ctcaattgca aaatgaaaaa ttgtatttgt attatttgca aaatggtaga 2460
gatatgtatg ttgatcaaga attggatatt aatagattgt ctgattatga tgttgatgct 2520
attgttccac aatctttttt gaaagatgat tctattgata ataaagtttt gactagatct 2580
gataaaaata gaggtaaatc tgataatgtt ccatctgaag aagttgttaa aaaaatgaaa 2640
aattattgga gacaattgtt gaatgctaaa ttgattactc aaagaaaatt tgataatttg 2700
actaaagctg aaagaggtgg tttgtctgaa ttggataaag ctggttttat taaaagacaa 2760
ttggttgaaa ctagacaaat tactaaacat gttgctcaaa ttttggattc tagaatgaat 2820
actaaatatg atgaaaatga taaattgatt agagaagtta aagttattac tttgaaatct 2880
aaattggttt ctgattttag aaaagatttt caattttata aagttagaga aattaataat 2940
tatcatcatg ctcatgatgc ttatttgaat gctgttgttg gtactgcttt gattaaaaaa 3000
tatccaaaat tggaatctga atttgtttat ggtgattata aagtttatga tgttagaaaa 3060
atgattgcta aatctgaaca agaaattggt aaagctactg ctaaatattt tttttattct 3120
aatattatga atttttttaa aactgaaatt actttggcta atggtgaaat tagaaaaaga 3180
ccattgattg aaactaatgg tgaaactggt gaaattgttt gggataaagg tagagatttt 3240
gctactgtta gaaaagtttt gtctatgcca caagttaata ttgttaaaaa aactgaagtt 3300
caaactggtg gtttttctaa agaatctatt ttgccaaaaa gaaattctga taaattgatt 3360
gctagaaaaa aagattggga tccaaaaaaa tatggtggtt ttgattctcc aactgttgct 3420
tattctgttt tggttgttgc taaagttgaa aaaggtaaat ctaaaaaatt gaaatctgtt 3480
aaagaattgt tgggtattac tattatggaa agatcttctt ttgaaaaaaa tccaattgat 3540
tttttggaag ctaaaggtta taaagaagtt aaaaaagatt tgattattaa attgccaaaa 3600
tattctttgt ttgaattgga aaatggtaga aaaagaatgt tggcttctgc tggtgaattg 3660
caaaaaggta atgaattggc tttgccatct aaatatgtta attttttgta tttggcttct 3720
cattatgaaa aattgaaagg ttctccagaa gataatgaac aaaaacaatt gtttgttgaa 3780
caacataaac attatttgga tgaaattatt gaacaaattt ctgaattttc taaaagagtt 3840
attttggctg atgctaattt ggataaagtt ttgtctgctt ataataaaca tagagataaa 3900
ccaattagag aacaagctga aaatattatt catttgttta ctttgactaa tttgggtgct 3960
ccagctgctt ttaaatattt tgatactact attgatagaa aaagatatac ttctactaaa 4020
gaagttttgg atgctacttt gattcatcaa tctattactg gtttgtatga aactagaatt 4080
gatttgtctc aattgggtgg tgattctaga gctgatccaa aaaaaaaaag aaaagtttaa 4140
<210> 4
<211> 1379
<212> PRT
<213> Artificial Sequence
<220>
<223> Cas9 D10A H840A inactive protein
<400> 4
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala Asp Pro Lys Lys Lys
1365 1370 1375
Arg Lys Val
<210> 5
<211> 4155
<212> DNA
<213> Artificial Sequence
<220>
<223> Cas9 rice
<400> 5
atggacaaga agtatagtat tggtctggac attgggacga attccgttgg ctgggccgtg 60
atcaccgatg agtacaaggt cccttccaag aagtttaagg ttctggggaa caccgatcgg 120
cacagcatca agaagaatct cattggagcc ctcctgttcg actcaggcga gaccgccgaa 180
gcaacaaggc tcaagagaac cgcaaggaga cggtatacaa gaaggaagaa taggatctgc 240
tacctgcagg agattttcag caacgaaatg gcgaaggtgg acgattcgtt ctttcataga 300
ttggaggaga gtttcctcgt cgaggaagat aagaagcacg agaggcatcc tatctttggc 360
aacattgtcg acgaggttgc ctatcacgaa aagtacccca caatctatca tctgcggaag 420
aagcttgtgg actcgactga taaggcggac cttagattga tctacctcgc tctggcacac 480
atgattaagt tcaggggcca ttttctgatc gagggggatc ttaacccgga caatagcgat 540
gtggacaagt tgttcatcca gctcgtccaa acctacaatc agctctttga ggaaaaccca 600
attaatgctt caggcgtcga cgccaaggcg atcctgtctg cacgcctttc aaagtctcgc 660
cggcttgaga acttgatcgc tcaactcccg ggcgaaaaga agaacggctt gttcgggaat 720
ctcattgcac tttcgttggg gctcacacca aacttcaaga gtaattttga tctcgctgag 780
gacgcaaagc tgcagctttc caaggacact tatgacgatg acctggataa ccttttggcc 840
caaatcggcg atcagtacgc ggacttgttc ctcgccgcga agaatttgtc ggacgcgatc 900
ctcctgagtg atattctccg cgtgaacacc gagattacaa aggccccgct ctcggcgagt 960
atgatcaagc gctatgacga gcaccatcag gatctgaccc ttttgaaggc tttggtccgg 1020
cagcaactcc cagagaagta caaggaaatc ttctttgatc aatccaagaa cggctacgct 1080
ggttatattg acggcggggc atcgcaggag gaattctaca agtttatcaa gccaattctg 1140
gagaagatgg atggcacaga ggaactcctg gtgaagctca atagggagga ccttttgcgg 1200
aagcaaagaa ctttcgataa cggcagcatc cctcaccaga ttcatctcgg ggagctgcac 1260
gccatcctga gaaggcagga agacttctac ccctttctta aggataaccg ggagaagatc 1320
gaaaagattc tgacgttcag aattccgtac tatgtcggac cactcgcccg gggtaattcc 1380
agatttgcgt ggatgaccag aaagagcgag gaaaccatca caccttggaa cttcgaggaa 1440
gtggtcgata agggcgcttc cgcacagagc ttcattgagc gcatgacaaa ttttgacaag 1500
aacctgccta atgagaaggt ccttcccaag cattccctcc tgtacgagta tttcactgtt 1560
tataacgaac tcacgaaggt gaagtatgtg accgagggaa tgcgcaagcc cgccttcctg 1620
agcggcgagc aaaagaaggc gatcgtggac cttttgttta agaccaatcg gaaggtcaca 1680
gttaagcagc tcaaggagga ctacttcaag aagattgaat gcttcgattc cgttgagatc 1740
agcggcgtgg aagacaggtt taacgcgtca ctggggactt accacgatct cctgaagatc 1800
attaaggata aggacttctt ggacaacgag gaaaatgagg atatcctcga agacattgtc 1860
ctgactctta cgttgtttga ggatagggaa atgatcgagg aacgcttgaa gacgtatgcc 1920
catctcttcg atgacaaggt tatgaagcag ctcaagagaa gaagatacac cggatgggga 1980
aggctgtccc gcaagcttat caatggcatt agagacaagc aatcagggaa gacaatcctt 2040
gactttttga agtctgatgg cttcgcgaac aggaatttta tgcagctgat tcacgatgac 2100
tcacttactt tcaaggagga tatccagaag gctcaagtgt cgggacaagg tgacagtctg 2160
cacgagcata tcgccaacct tgcgggatct cctgcaatca agaagggtat tctgcagaca 2220
gtcaaggttg tggatgagct tgtgaaggtc atgggacggc ataagcccga gaacatcgtt 2280
attgagatgg ccagagaaaa tcagaccaca caaaagggtc agaagaactc gagggagcgc 2340
atgaagcgca tcgaggaagg cattaaggag ctggggagtc agatccttaa ggagcacccg 2400
gtggaaaaca cgcagttgca aaatgagaag ctctatctgt actatctgca aaatggcagg 2460
gatatgtatg tggaccagga gttggatatt aaccgcctct cggattacga cgtcgatcat 2520
atcgttcctc agtccttcct taaggatgac agcattgaca ataaggttct caccaggtcc 2580
gacaagaacc gcgggaagtc cgataatgtg cccagcgagg aagtcgttaa gaagatgaag 2640
aactactgga ggcaactttt gaatgccaag ttgatcacac agaggaagtt tgataacctc 2700
actaaggccg agcgcggagg tctcagcgaa ctggacaagg cgggcttcat taagcggcaa 2760
ctggttgaga ctagacagat cacgaagcac gtggcgcaga ttctcgattc acgcatgaac 2820
acgaagtacg atgagaatga caagctgatc cgggaagtga aggtcatcac cttgaagtca 2880
aagctcgttt ctgacttcag gaaggatttc caattttata aggtgcgcga gatcaacaat 2940
tatcaccatg ctcatgacgc atacctcaac gctgtggtcg gaacagcatt gattaagaag 3000
tacccgaagc tcgagtccga attcgtgtac ggtgactata aggtttacga tgtgcgcaag 3060
atgatcgcca agtcagagca ggaaattggc aaggccactg cgaagtattt cttttactct 3120
aacattatga atttctttaa gactgagatc acgctggcta atggcgaaat ccggaagaga 3180
ccacttattg agaccaacgg cgagacaggg gaaatcgtgt gggacaaggg gagggatttc 3240
gccacagtcc gcaaggttct ctctatgcct caagtgaata ttgtcaagaa gactgaagtc 3300
cagacgggcg ggttctcaaa ggaatctatt ctgcccaagc ggaactcgga taagcttatc 3360
gccagaaaga aggactggga cccgaagaag tatggaggtt tcgactcacc aacggtggct 3420
tactctgtcc tggttgtggc aaaggtggag aagggaaagt caaagaagct caagtctgtc 3480
aaggagctcc tgggtatcac cattatggag aggtccagct tcgaaaagaa tccgatcgat 3540
tttctcgagg cgaagggata taaggaagtg aagaaggacc tgatcattaa gcttccaaag 3600
tacagtcttt tcgagttgga aaacggcagg aagcgcatgt tggcttccgc aggagagctc 3660
cagaagggta acgagcttgc tttgccgtcc aagtatgtga acttcctcta tctggcatcc 3720
cactacgaga agctcaaggg cagcccagag gataacgaac agaagcaact gtttgtggag 3780
caacacaagc attatcttga cgagatcatt gaacagattt cggagttcag taagcgcgtc 3840
atcctcgccg acgcgaattt ggataaggtt ctctcagcct acaacaagca ccgggacaag 3900
cctatcagag agcaggcgga aaatatcatt catctcttca ccctgacaaa ccttggggct 3960
cccgctgcat tcaagtattt tgacactacg attgatcgga agagatacac ttctacgaag 4020
gaggtgctgg atgcaaccct tatccaccaa tcgattactg gcctctacga gacgcggatc 4080
gacttgagtc agctcggggg ggataagaga ccagcggcaa ccaagaaggc aggacaagcg 4140
aagaagaaga agtag 4155
<210> 6
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> SV40 Nuclear Localizaion Signal
<400> 6
cccaagaaga agcggaaggt ctcg 24
<210> 7
<211> 957
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4
<400> 7
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120
tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180
ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt 240
ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat 300
aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta 360
acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt 420
caaagacagt tgactgtatc gccggaattt gtaatacgac tcactatagg gcgagccgcc 480
atcatggagg agcagaagct gatctcagag gaggacctgc atatggccat ggaggccgaa 540
ttcatggata aagcggaatt aattcccgag cctccaaaaa agaagagaaa ggtcgaattg 600
ggtaccgccg ccaattttaa tcaaagtggg aatattgctg atagctcatt gtccttcact 660
ttcactaaca gtagcaacgg tccgaacctc ataacaactc aaacaaattc tcaagcgctt 720
tcacaaccaa ttgcctcctc taacgttcat gataacttca tgaataatga aatcacggct 780
agtaaaattg atgatggtaa taattcaaaa ccactgtcac ctggttggac ggaccaaact 840
gcgtataacg cgtttggaat cactacaggg atgtttaata ccactacaat ggatgatgta 900
tataactatc tattcgatga tgaagatacc ccaccaaacc caaaaaaaga gatttaa 957
<210> 8
<211> 318
<212> PRT
<213> Artificial Sequence
<220>
<223> GAL4 protein
<400> 8
Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile Cys Arg Leu
1 5 10 15
Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys Leu
20 25 30
Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser Pro
35 40 45
Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu Glu Arg Leu
50 55 60
Glu Gln Leu Phe Leu Leu Ile Phe Pro Arg Glu Asp Leu Asp Met Ile
65 70 75 80
Leu Lys Met Asp Ser Leu Gln Asp Ile Lys Ala Leu Leu Thr Gly Leu
85 90 95
Phe Val Gln Asp Asn Val Asn Lys Asp Ala Val Thr Asp Arg Leu Ala
100 105 110
Ser Val Glu Thr Asp Met Pro Leu Thr Leu Arg Gln His Arg Ile Ser
115 120 125
Ala Thr Ser Ser Ser Glu Glu Ser Ser Asn Lys Gly Gln Arg Gln Leu
130 135 140
Thr Val Ser Pro Glu Phe Val Ile Arg Leu Thr Ile Gly Arg Ala Ala
145 150 155 160
Ile Met Glu Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu His Met Ala
165 170 175
Met Glu Ala Glu Phe Met Asp Lys Ala Glu Leu Ile Pro Glu Pro Pro
180 185 190
Lys Lys Lys Arg Lys Val Glu Leu Gly Thr Ala Ala Asn Phe Asn Gln
195 200 205
Ser Gly Asn Ile Ala Asp Ser Ser Leu Ser Phe Thr Phe Thr Asn Ser
210 215 220
Ser Asn Gly Pro Asn Leu Ile Thr Thr Gln Thr Asn Ser Gln Ala Leu
225 230 235 240
Ser Gln Pro Ile Ala Ser Ser Asn Val His Asp Asn Phe Met Asn Asn
245 250 255
Glu Ile Thr Ala Ser Lys Ile Asp Asp Gly Asn Asn Ser Lys Pro Leu
260 265 270
Ser Pro Gly Trp Thr Asp Gln Thr Ala Tyr Asn Ala Phe Gly Ile Thr
275 280 285
Thr Gly Met Phe Asn Thr Thr Thr Met Asp Asp Val Tyr Asn Tyr Leu
290 295 300
Phe Asp Asp Glu Asp Thr Pro Pro Asn Pro Lys Lys Glu Ile
305 310 315
<210> 9
<211> 958
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4 target 1
<400> 9
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga actaactggg agtgtcgcta 120
ctctcccaaa accaaaaggt ctccgctgac tagggcacat ctgacagaag tggaatcaag 180
gctagaaaga ctggaacagc tatttctact gatttttcct cgagaagacc ttgacatgat 240
tttgaaaatg gattctttac aggatataaa agcattgtta acaggattat ttgtacaaga 300
taatgtgaat aaagatgccg tcacagatag attggcttca gtggagactg atatgcctct 360
aacattgaga cagcatagaa taagtgcgac atcatcatcg gaagagagta gtaacaaagg 420
tcaaagacag ttgactgtat cgccggaatt tgtaatacga ctcactatag ggcgagccgc 480
catcatggag gagcagaagc tgatctcaga ggaggacctg catatggcca tggaggccga 540
attcatggat aaagcggaat taattcccga gcctccaaaa aagaagagaa aggtcgaatt 600
gggtaccgcc gccaatttta atcaaagtgg gaatattgct gatagctcat tgtccttcac 660
tttcactaac agtagcaacg gtccgaacct cataacaact caaacaaatt ctcaagcgct 720
ttcacaacca attgcctcct ctaacgttca tgataacttc atgaataatg aaatcacggc 780
tagtaaaatt gatgatggta ataattcaaa accactgtca cctggttgga cggaccaaac 840
tgcgtataac gcgtttggaa tcactacagg gatgtttaat accactacaa tggatgatgt 900
atataactat ctattcgatg atgaagatac cccaccaaac ccaaaaaaag agatttaa 958
<210> 10
<211> 938
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4 target 2
<400> 10
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga actaactgga accaaaaggt 120
ctccgctgac tagggcacat ctgacagaag tggaatcaag gctagaaaga ctggaacagc 180
tatttctact gatttttcct cgagaagacc ttgacatgat tttgaaaatg gattctttac 240
aggatataaa agcattgtta acaggattat ttgtacaaga taatgtgaat aaagatgccg 300
tcacagatag attggcttca gtggagactg atatgcctct aacattgaga cagcatagaa 360
taagtgcgac atcatcatcg gaagagagta gtaacaaagg tcaaagacag ttgactgtat 420
cgccggaatt tgtaatacga ctcactatag ggcgagccgc catcatggag gagcagaagc 480
tgatctcaga ggaggacctg catatggcca tggaggccga attcatggat aaagcggaat 540
taattcccga gcctccaaaa aagaagagaa aggtcgaatt gggtaccgcc gccaatttta 600
atcaaagtgg gaatattgct gatagctcat tgtccttcac tttcactaac agtagcaacg 660
gtccgaacct cataacaact caaacaaatt ctcaagcgct ttcacaacca attgcctcct 720
ctaacgttca tgataacttc atgaataatg aaatcacggc tagtaaaatt gatgatggta 780
ataattcaaa accactgtca cctggttgga cggaccaaac tgcgtataac gcgtttggaa 840
tcactacagg gatgtttaat accactacaa tggatgatgt atataactat ctattcgatg 900
atgaagatac cccaccaaac ccaaaaaaag agatttaa 938
<210> 11
<211> 920
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4 target 3
<400> 11
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaacaagtg tctgaagaac taactggaag gtctccgctg actagggcac 120
atctgacaga agtggaatca aggctagaaa gactggaaca gctatttcta ctgatttttc 180
ctcgagaaga ccttgacatg attttgaaaa tggattcttt acaggatata aaagcattgt 240
taacaggatt atttgtacaa gataatgtga ataaagatgc cgtcacagat agattggctt 300
cagtggagac tgatatgcct ctaacattga gacagcatag aataagtgcg acatcatcat 360
cggaagagag tagtaacaaa ggtcaaagac agttgactgt atcgccggaa tttgtaatac 420
gactcactat agggcgagcc gccatcatgg aggagcagaa gctgatctca gaggaggacc 480
tgcatatggc catggaggcc gaattcatgg ataaagcgga attaattccc gagcctccaa 540
aaaagaagag aaaggtcgaa ttgggtaccg ccgccaattt taatcaaagt gggaatattg 600
ctgatagctc attgtccttc actttcacta acagtagcaa cggtccgaac ctcataacaa 660
ctcaaacaaa ttctcaagcg ctttcacaac caattgcctc ctctaacgtt catgataact 720
tcatgaataa tgaaatcacg gctagtaaaa ttgatgatgg taataattca aaaccactgt 780
cacctggttg gacggaccaa actgcgtata acgcgtttgg aatcactaca gggatgttta 840
ataccactac aatggatgat gtatataact atctattcga tgatgaagat accccaccaa 900
acccaaaaaa agagatttaa 920
<210> 12
<211> 560
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4 target 4
<400> 12
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120
tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180
ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt 240
ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat 300
aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta 360
acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt 420
caaagacagt tgactgtata acgccggaac gcgtttggaa tcacttaaca gggatgttta 480
ataccactac aatggatgat gtatataact atctattcga tgatgaagat accccaccaa 540
acccaaaaaa agagatttaa 560
<210> 13
<211> 708
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4 target 5
<400> 13
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120
tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180
ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt 240
ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat 300
aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta 360
acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt 420
caaagacagt tgactgtatc gccggaattt gtaatacgac tcactatagg gcgagccgcc 480
atcatggagg agcagaagct gatctcagag gaggacctgc atatggccat ggaggccgaa 540
ttcatgtgat aaagcggaat taattcccca cctggttgga cggaccaaac tgcgtataac 600
gcgtttggaa tcactacagg gatgtttaat accactacaa tggatgatgt atataactat 660
ctattcgatg atgaagatac cccaccaaac ccaaaaaaag agatttaa 708
<210> 14
<211> 240
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4 target 6
<400> 14
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga actaactgga ctgcgtccaa 120
actgcgtata acgcgtttgg aatcactaca gggatgttta ataccactac aatggatgat 180
gtatataact atctattcga tgatgaagat accccaccaa acccaaaaaa agagatttaa 240
<210> 15
<211> 356
<212> DNA
<213> Artificial Sequence
<220>
<223> GAL4 target 7
<400> 15
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120
tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180
ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgactgattt 240
tgtataacgc gtttggaatc actacaggga tgtttaatac cactacaatg gatgatgtat 300
ataactatct attcgatgat gaagataccc caccaaaccc aaaaaaagag atttaa 356
<210> 16
<211> 268
<212> DNA
<213> Saccharomyces cerevisiae
<220>
<223> SNR52 promoter
<400> 16
ctttgaaaag ataatgtatg attatgcttt cactcatatt tatacagaaa cttgatgttt 60
tctttcgagt atatacaagg tgattacatg tacgtttgaa gtacaactct agattttgta 120
gtgccctctt gggctagcgg taaaggtgcg cattttttca caccctacaa tgttctgttc 180
aaaagatttt ggtcaaacgc tgtagaagtg aaagttggtg cgcatgtttc ggcgttcgaa 240
acttctccgc agtgaaagat aaatgatc 268
<210> 17
<211> 20
<212> DNA
<213> Saccharomyces cerevisiae
<220>
<223> SUP4 terminator
<400> 17
tttttttgtt ttttatgtct 20
<210> 18
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> scaffold guide RNA Cas9
<400> 18
ttttagagct agaaatagca agttaaaata aggctagtcc gttatcaact tgaaaaagtg 60
gcaccgagtc ggtgc 75
<210> 19
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 1
<400> 19
caagtgtctg aagaactaac 20
<210> 20
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 2
<400> 20
gacagttgac tgtataacgc 20
<210> 21
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 3
<400> 21
gcgtttggaa tcacttaaca 20
<210> 22
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 4
<400> 22
gcatatggcc atggaggccg 20
<210> 23
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 5
<400> 23
acgcgtttgg aatcactaca 20
<210> 24
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 6
<400> 24
atggtctcaa aacccttggt 20
<210> 25
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 7
<400> 25
acacgcttac tgcctgacta 20
<210> 26
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 1
<400> 26
cctcgagaag accttgacat gattttgaaa atggattctt taca 44
<210> 27
<211> 108
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 2
<400> 27
aaagactgga acagctattt ctactgattt ttcctcgaga agaccttgac atgattttga 60
aaatggattc tttacaggat ataaaagcat tgttaacagg attatttg 108
<210> 28
<211> 520
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 3
<400> 28
tcatcatcgg aagagagtag taacaaaggt caaagacagt tgactgtatc gccggaattt 60
gtaatacgac tcactatagg gcgagccgcc atcatggagg agcagaagct gatctcagag 120
gaggacctgc atatggccat ggaggccgaa ttcatggata aagcggaatt aattcccgag 180
cctccaaaaa agaagagaaa ggtcgaattg ggtaccgccg ccaattttaa tcaaagtggg 240
aatattgctg atagctcatt gtccttcact ttcactaaca gtagcaacgg tccgaacctc 300
ataacaactc aaacaaattc tcaagcgctt tcacaaccaa ttgcctcctc taacgttcat 360
gataacttca tgaataatga aatcacggct agtaaaattg atgatggtaa taattcaaaa 420
ccactgtcac ctggttggac ggaccaaact gcgtataacg cgtttggaat cactacaggg 480
atgtttaata ccactacaat ggatgatgta tataactatc 520
<210> 29
<211> 635
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 4
<400> 29
cagatagatt ggcttcagtg gagactgata tgcctctaac attgagacag catagaataa 60
gtgcgacatc atcatcggaa gagagtagta acaaaggtca aagacagttg actgtatcgc 120
cggaatttgt aatacgactc actatagggc gagccgccat catggaggag cagaagctga 180
tctcagagga ggacctgcat atggccatgg aggccgaatt catggataaa gcggaattaa 240
ttcccgagcc tccaaaaaag aagagaaagg tcgaattggg taccgccgcc aattttaatc 300
aaagtgggaa tattgctgat agctcattgt ccttcacttt cactaacagt agcaacggtc 360
cgaacctcat aacaactcaa acaaattctc aagcgctttc acaaccaatt gcctcctcta 420
acgttcatga taacttcatg aataatgaaa tcacggctag taaaattgat gatggtaata 480
attcaaaacc actgtcacct ggttggacgg accaaactgc gtataacgcg tttggaatca 540
ctacagggat gtttaatacc actacaatgg atgatgtata taactatcta ttcgatgatg 600
aagatacccc accaaaccca aaaaaagaga tttaa 635
<210> 30
<211> 957
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 5
<400> 30
atgaagctac tgtcttctat cgaacaagca tgcgatattt gccgacttaa aaagctcaag 60
tgctccaaag aaaaaccgaa gtgcgccaag tgtctgaaga acaactggga gtgtcgctac 120
tctcccaaaa ccaaaaggtc tccgctgact agggcacatc tgacagaagt ggaatcaagg 180
ctagaaagac tggaacagct atttctactg atttttcctc gagaagacct tgacatgatt 240
ttgaaaatgg attctttaca ggatataaaa gcattgttaa caggattatt tgtacaagat 300
aatgtgaata aagatgccgt cacagataga ttggcttcag tggagactga tatgcctcta 360
acattgagac agcatagaat aagtgcgaca tcatcatcgg aagagagtag taacaaaggt 420
caaagacagt tgactgtatc gccggaattt gtaatacgac tcactatagg gcgagccgcc 480
atcatggagg agcagaagct gatctcagag gaggacctgc atatggccat ggaggccgaa 540
ttcatggata aagcggaatt aattcccgag cctccaaaaa agaagagaaa ggtcgaattg 600
ggtaccgccg ccaattttaa tcaaagtggg aatattgctg atagctcatt gtccttcact 660
ttcactaaca gtagcaacgg tccgaacctc ataacaactc aaacaaattc tcaagcgctt 720
tcacaaccaa ttgcctcctc taacgttcat gataacttca tgaataatga aatcacggct 780
agtaaaattg atgatggtaa taattcaaaa ccactgtcac ctggttggac ggaccaaact 840
gcgtataacg cgtttggaat cactacaggg atgtttaata ccactacaat ggatgatgta 900
tataactatc tattcgatga tgaagatacc ccaccaaacc caaaaaaaga gatttaa 957
<210> 31
<211> 4155
<212> DNA
<213> Artificial Sequence
<220>
<223> Cas9 rice codon-optimized
<400> 31
atggacaaga agtatagtat tggtctggac attgggacga attccgttgg ctgggccgtg 60
atcaccgatg agtacaaggt cccttccaag aagtttaagg ttctggggaa caccgatcgg 120
cacagcatca agaagaatct cattggagcc ctcctgttcg actcaggcga gaccgccgaa 180
gcaacaaggc tcaagagaac cgcaaggaga cggtatacaa gaaggaagaa taggatctgc 240
tacctgcagg agattttcag caacgaaatg gcgaaggtgg acgattcgtt ctttcataga 300
ttggaggaga gtttcctcgt cgaggaagat aagaagcacg agaggcatcc tatctttggc 360
aacattgtcg acgaggttgc ctatcacgaa aagtacccca caatctatca tctgcggaag 420
aagcttgtgg actcgactga taaggcggac cttagattga tctacctcgc tctggcacac 480
atgattaagt tcaggggcca ttttctgatc gagggggatc ttaacccgga caatagcgat 540
gtggacaagt tgttcatcca gctcgtccaa acctacaatc agctctttga ggaaaaccca 600
attaatgctt caggcgtcga cgccaaggcg atcctgtctg cacgcctttc aaagtctcgc 660
cggcttgaga acttgatcgc tcaactcccg ggcgaaaaga agaacggctt gttcgggaat 720
ctcattgcac tttcgttggg gctcacacca aacttcaaga gtaattttga tctcgctgag 780
gacgcaaagc tgcagctttc caaggacact tatgacgatg acctggataa ccttttggcc 840
caaatcggcg atcagtacgc ggacttgttc ctcgccgcga agaatttgtc ggacgcgatc 900
ctcctgagtg atattctccg cgtgaacacc gagattacaa aggccccgct ctcggcgagt 960
atgatcaagc gctatgacga gcaccatcag gatctgaccc ttttgaaggc tttggtccgg 1020
cagcaactcc cagagaagta caaggaaatc ttctttgatc aatccaagaa cggctacgct 1080
ggttatattg acggcggggc atcgcaggag gaattctaca agtttatcaa gccaattctg 1140
gagaagatgg atggcacaga ggaactcctg gtgaagctca atagggagga ccttttgcgg 1200
aagcaaagaa ctttcgataa cggcagcatc cctcaccaga ttcatctcgg ggagctgcac 1260
gccatcctga gaaggcagga agacttctac ccctttctta aggataaccg ggagaagatc 1320
gaaaagattc tgacgttcag aattccgtac tatgtcggac cactcgcccg gggtaattcc 1380
agatttgcgt ggatgaccag aaagagcgag gaaaccatca caccttggaa cttcgaggaa 1440
gtggtcgata agggcgcttc cgcacagagc ttcattgagc gcatgacaaa ttttgacaag 1500
aacctgccta atgagaaggt ccttcccaag cattccctcc tgtacgagta tttcactgtt 1560
tataacgaac tcacgaaggt gaagtatgtg accgagggaa tgcgcaagcc cgccttcctg 1620
agcggcgagc aaaagaaggc gatcgtggac cttttgttta agaccaatcg gaaggtcaca 1680
gttaagcagc tcaaggagga ctacttcaag aagattgaat gcttcgattc cgttgagatc 1740
agcggcgtgg aagacaggtt taacgcgtca ctggggactt accacgatct cctgaagatc 1800
attaaggata aggacttctt ggacaacgag gaaaatgagg atatcctcga agacattgtc 1860
ctgactctta cgttgtttga ggatagggaa atgatcgagg aacgcttgaa gacgtatgcc 1920
catctcttcg atgacaaggt tatgaagcag ctcaagagaa gaagatacac cggatgggga 1980
aggctgtccc gcaagcttat caatggcatt agagacaagc aatcagggaa gacaatcctt 2040
gactttttga agtctgatgg cttcgcgaac aggaatttta tgcagctgat tcacgatgac 2100
tcacttactt tcaaggagga tatccagaag gctcaagtgt cgggacaagg tgacagtctg 2160
cacgagcata tcgccaacct tgcgggatct cctgcaatca agaagggtat tctgcagaca 2220
gtcaaggttg tggatgagct tgtgaaggtc atgggacggc ataagcccga gaacatcgtt 2280
attgagatgg ccagagaaaa tcagaccaca caaaagggtc agaagaactc gagggagcgc 2340
atgaagcgca tcgaggaagg cattaaggag ctggggagtc agatccttaa ggagcacccg 2400
gtggaaaaca cgcagttgca aaatgagaag ctctatctgt actatctgca aaatggcagg 2460
gatatgtatg tggaccagga gttggatatt aaccgcctct cggattacga cgtcgatcat 2520
atcgttcctc agtccttcct taaggatgac agcattgaca ataaggttct caccaggtcc 2580
gacaagaacc gcgggaagtc cgataatgtg cccagcgagg aagtcgttaa gaagatgaag 2640
aactactgga ggcaactttt gaatgccaag ttgatcacac agaggaagtt tgataacctc 2700
actaaggccg agcgcggagg tctcagcgaa ctggacaagg cgggcttcat taagcggcaa 2760
ctggttgaga ctagacagat cacgaagcac gtggcgcaga ttctcgattc acgcatgaac 2820
acgaagtacg atgagaatga caagctgatc cgggaagtga aggtcatcac cttgaagtca 2880
aagctcgttt ctgacttcag gaaggatttc caattttata aggtgcgcga gatcaacaat 2940
tatcaccatg ctcatgacgc atacctcaac gctgtggtcg gaacagcatt gattaagaag 3000
tacccgaagc tcgagtccga attcgtgtac ggtgactata aggtttacga tgtgcgcaag 3060
atgatcgcca agtcagagca ggaaattggc aaggccactg cgaagtattt cttttactct 3120
aacattatga atttctttaa gactgagatc acgctggcta atggcgaaat ccggaagaga 3180
ccacttattg agaccaacgg cgagacaggg gaaatcgtgt gggacaaggg gagggatttc 3240
gccacagtcc gcaaggttct ctctatgcct caagtgaata ttgtcaagaa gactgaagtc 3300
cagacgggcg ggttctcaaa ggaatctatt ctgcccaagc ggaactcgga taagcttatc 3360
gccagaaaga aggactggga cccgaagaag tatggaggtt tcgactcacc aacggtggct 3420
tactctgtcc tggttgtggc aaaggtggag aagggaaagt caaagaagct caagtctgtc 3480
aaggagctcc tgggtatcac cattatggag aggtccagct tcgaaaagaa tccgatcgat 3540
tttctcgagg cgaagggata taaggaagtg aagaaggacc tgatcattaa gcttccaaag 3600
tacagtcttt tcgagttgga aaacggcagg aagcgcatgt tggcttccgc aggagagctc 3660
cagaagggta acgagcttgc tttgccgtcc aagtatgtga acttcctcta tctggcatcc 3720
cactacgaga agctcaaggg cagcccagag gataacgaac agaagcaact gtttgtggag 3780
caacacaagc attatcttga cgagatcatt gaacagattt cggagttcag taagcgcgtc 3840
atcctcgccg acgcgaattt ggataaggtt ctctcagcct acaacaagca ccgggacaag 3900
cctatcagag agcaggcgga aaatatcatt catctcttca ccctgacaaa ccttggggct 3960
cccgctgcat tcaagtattt tgacactacg attgatcgga agagatacac ttctacgaag 4020
gaggtgctgg atgcaaccct tatccaccaa tcgattactg gcctctacga gacgcggatc 4080
gacttgagtc agctcggggg ggataagaga ccagcggcaa ccaagaaggc aggacaagcg 4140
aagaagaaga agtag 4155
<210> 32
<211> 1995
<212> DNA
<213> Zea mays
<220>
<223> maize Ubi promoter containing MubG1 intron
<400> 32
tgcagtgcag cgtgacccgg tcgtgcccct ctctagagat aatgagcatt gcatgtctaa 60
gttataaaaa attaccacat attttttttg tcacacttgt ttgaagtgca gtttatctat 120
ctttatacat atatttaaac tttactctac gaataatata atctatagta ctacaataat 180
atcagtgttt tagagaatca tataaatgaa cagttagaca tggtctaaag gacaattgag 240
tattttgaca acaggactct acagttttat ctttttagtg tgcatgtgtt ctcctttttt 300
tttgcaaata gcttcaccta tataatactt catccatttt attagtacat ccatttaggg 360
tttagggtta atggttttta tagactaatt tttttagtac atctatttta ttctatttta 420
gcctctaaat taagaaaact aaaactctat tttagttttt ttatttaata gtttagatat 480
aaaatagaat aaaataaagt gactaaaaat taaacaaata ccctttaaga aattaaaaaa 540
actaaggaaa catttttctt gtttcgagta gataatgcca gcctgttaaa cgccgtcgac 600
gagtctaacg gacaccaacc agcgaaccag cagcgtcgcg tcgggccaag cgaagcagac 660
ggcacggcat ctctgtcgct gcctctggac ccctctcgag agttccgctc caccgttgga 720
cttgctccgc tgtcggcatc cagaaattgc gtggcggagc ggcagacgtg agccggcacg 780
gcaggcggcc tcctcctcct ctcacggcac cggcagctac gggggattcc tttcccaccg 840
ctccttcgct ttcccttcct cgcccgccgt aataaataga caccccctcc acaccctctt 900
tccccaacct cgtgttgttc ggagcgcaca cacacacaac cagatctccc ccaaatccac 960
ccgtcggcac ctccgcttca aggtacgccg ctcgtcctcc cccccccccc cccctctcta 1020
ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat 1080
gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg 1140
acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct 1200
gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc 1260
atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg 1320
tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt 1380
tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg 1440
tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat 1500
ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg 1560
ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag 1620
tagagtactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc 1680
atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac 1740
atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat 1800
gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttatttcgat 1860
cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc 1920
ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg 1980
gtgttacttc tgcag 1995
<210> 33
<211> 294
<212> DNA
<213> Agrobacterium tumefaciens
<220>
<223> nopaline synthase terminator (tnos)
<400> 33
agcggccgcc cggctgcaga tcgttcaaac atttggcaat aaagtttctt aagattgaat 60
cctgttgccg gtcttgcgat gattatcata taatttctgt tgaattacgt taagcatgta 120
ataattaaca tgtaatgcat gacgttattt atgagatggg tttttatgat tagagtcccg 180
caattataca tttaatacgc gatagaaaac aaaatatagc gcgcaaacta ggataaatta 240
tcgcgcgcgg tgtcatctat gttactagat ccgatgataa gctgtcaaac atga 294
<210> 34
<211> 377
<212> DNA
<213> Oryza sativa
<220>
<223> RNA pol III promoter promoter from the rice U3 small nucle ar RNA
gene (OsU3)
<400> 34
aagggatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaggaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtggagtaa gataaactgt aggagaaaag catttcgtag tgggccatga 240
agcctttcag gacatgtatt gcagtatggg ccggcccatt acgcaattgg acgacaacaa 300
agactagtat tagtaccacc tcggctatcc acatagatca aagctggttt aaaagagttg 360
tgcagatgat ccgtggc 377
<210> 35
<211> 7787
<212> DNA
<213> Oryza sativa
<220>
<223> rice Protoporphyrinogen Oxidase (PPO2)
<400> 35
atgctctctc ctgccaccac cttctcctcc tcctcctcct cctcgtcgcc gtcgcgcgcc 60
cacgctcgcg ctcccacccg cttcgcggtc gcagcatccg cgcgcgccgc acggttccgc 120
cccgcgcgcg ccatggccgc ctccgacgac ccccgcggcg ggaggtccgt cgccgtcgtc 180
ggcgccggcg tcaggtgggt ggggagccgc gcgcgctctc cgtgggttca gttctgccct 240
aggtttgggg tgccgtgtgc gtgtgagtgg ggaggttgtt ttttttgatg attgatgaaa 300
tggttgcctc tctgcagtgg gctcgcggcg gcgtacaggc tgaggaagcg cggcgtgcag 360
gtgacggtgt tcgaggcggc cgacagggcg ggtgggaaga tacggaccaa ctccgagggc 420
gggttcatct gggacgaagg ggccaacacc atggtgagcg cgctttggtg tgcctcgctg 480
cttctgtttg atcacaatct cgggctgtgt tggtctgcat tgctgcaaat gctgcttctg 540
tatgttttgg attgtggcgc actggcgctg ctgcggctat ttgagggctg gagcacacta 600
gcgagtagtg ctccttggtg cgcaggctga ggaaacttgt gtttgtgaac gaaatgcaag 660
ctgctcacta atgcagacag ttgttcctgc aaatggagaa gtgttttctt ctgcattcgt 720
atcccacaac agacgtgaac cctttctgct atgagcatca ttgaacaccg ttatgtaact 780
tatcatagcc tgattcgatt tcattcacca tgatctataa ctattatact taccatatta 840
gttactttgt actactctta gtaaaataaa taaattattt taatactcca ctgacaaaat 900
aggttaagat tgtttcattg cttgggcaca tgtgcaatac tagtcgcatt ttttttacct 960
gcgtgcaaat cttatcatgc ctgcttgatt caatttgccg ttctctctgt aatttaatta 1020
ttttgcctcc agacagagag tgaattggag gcaagcaggc ttattgacga tcttggccta 1080
caaggcaaac agcagtatgt atgtgctaat gttatctgtg atggttaact gctttgaatg 1140
tcttctgttt cataatttac actgatatgt ttaatatttc gatatccttt agcctaactc 1200
acaacacaag cgttacattg tcaaagatgg agcaccaaca ctggtaaata gacttttcat 1260
gatatgatgc attttgtttt gttcttccta tagtatgcct cacttttgaa tatatttttt 1320
tgtcacataa gattccctca gatcccattg cgctcatgaa aagcactgtt ctttctacaa 1380
aatcaaaggt atgtaagtta ttgagtgcta attgctacaa catatcatga cctcctgacc 1440
tatttgcaac aagttgcttg ttgtttccac ttgtcactga tggattaaaa ttcactagtg 1500
tagaaacaat catattaaac tgatcaccgt gacttgattt acttgttttc agttcactat 1560
tacaaatttg tacatttcct gatctttcgt gttcaagctg tgtgatcgac tgattgcaac 1620
cgtcatatta tattactgta ttgagtttag taaaacatgg tcttatcttt gcagctcaag 1680
ctatttctgg aaccatttct ctatgagaaa tctagcagaa ggacctcggg aaaagtgtct 1740
gatgaacatt taagtgagag gtgagccttc atactgatgt tattttgagt tgttgtaaac 1800
ttgaaccact gataatatag ttatatgttt ttttcctgtg ttcttccttc attctcatgc 1860
ccttgtgaaa tacaaatata tacttcatat cacacactcc ctttggtcat ttttcatgtc 1920
aaacttttaa aactttgtac ataaaatcag ttcaatattt agattgaacg catgagaaag 1980
tattttcata atattatgat tttaccattt ttttcatata cgttgcaaca gaatttagtg 2040
gtcaaagcta cactttgaag accttattga tgtcaaaaac agcatgtttt ctgaccagag 2100
agaatacatt tgcagtgtga tttttctgtg tatatgtaga gataatcagg tttctctttt 2160
gcagtgttgc aagtttcttt gaacgccact ttggaaaaga ggcaagttca tttttaatga 2220
agaaatttat ggattgttaa gtgaatacaa tcaacacttt gcaacttaca tgcccattat 2280
aatcagtaga gggtaagaat ttataacttt attacaggtt gttgattatc ttattgatcc 2340
atttgtggct ggaacaagcg gaggagatcc tgagtcatta tcagtaagtt attataacat 2400
gtctcactat ttgcattttc catatcagca cctttgcatt tctacagtaa attgtagtca 2460
taattatttt tatgtaaatt gtgcgtataa acaacatatg tgcttgactt tgtgatgtgt 2520
tcttggggat gataactgat acggctagaa cttttggggg ctaatctcct tgagccgtat 2580
cagtaagtca taacaattct cattcataat gatcaaaaca tatcaccttc ttgtgtagaa 2640
ctgttctggt tttgagtaat attttcttct gtgcagattc gtcatgcatt tccagcatta 2700
tggaatttgg agaataagta agtttgtagt agtttgtttg gagaataagt aagtttgtag 2760
tttgtgcatt gatgttcatt caagatttac cttatcaata attcacttgt ccacgtccat 2820
atgctcgtgc tatatcctgt ccattcaaat gtcaacaccg ccatgtgaat ttactgcata 2880
gtgcatttta atgatttcat ttatccttgt tgcttgcatc tcttttttgg gctcctgctg 2940
ttagcttgtt tttggttcct gctgttacct atttcttttc tatcattttt tcattggaca 3000
gatggtgctc tcagtcctta ctgcttatta tttgttaacc tgatatgcac ctacttgaag 3060
ttaatgttat gatttttagt attttatagt catggtatca ttaatactta tttttggcaa 3120
tcgaaattaa aaaaacatga tgtcaaaata aaaaatcatg gcagttgaat gcagtgggta 3180
tatgtatcaa gaatttaaga tcttgaacat aagtccaatt gctatatgtt caattcgttg 3240
gagcataaca tgatctaatt tgtaagttaa atttatctga taaacgatgg aaggaaattc 3300
tggtaccact catgcaacta tacaagcttc aaaggcttct tacatgtgga ccattggacc 3360
tagaatagaa tctaaattta ttcataagta tataattttt tttccttcat gggccatgat 3420
agttaactat atgagcttgt agagtcaaaa taggcataat tgcttctttg ggtttccact 3480
taatttaccc tacaacactt ctattgcaat aaatatggtc aacaacattt ctttacggtc 3540
cgtttggttg gagggagttt ttaggaggga ttgggagttt agagggatgg agctattaac 3600
tgttttgttt ggttgggaga gatgggaatt ttggtgggat ggagatgggg aattgaggaa 3660
ggaactccct ccttttcaat acctgggtag ggggtggtaa ttgggaggga attcctcctt 3720
tactttgcct aaacaaatct cagccatccg ttttcattaa tgacctaatc tccaactaaa 3780
cttcctgtca atttccacca cctctgccaa acaagatatt gggattaaaa atcaaattcc 3840
catcttaatc tcaccatcaa ttccctcgtg taaactccca atccccttcc ctcaagttgc 3900
caaacaagcc attagtgccc agttatgttc tttggtcatc ttcttcataa tttgttgctc 3960
catgcacttt caatgctcac aggtatggct ctgtcattgc tggtgccatc ttgtccaaac 4020
tatccactaa gggtgattca gtgaagacag gaggtgcttc gccagggaaa ggaaggaata 4080
aacgtgtgtc attttcattt catggtggaa tgcaggtact ccacagatgt cctgtagttt 4140
cttttgtcag tgtcaaagat atcaaagaca gtgataaacc ctgaacttta gtttgagcaa 4200
ttctacatgc cactaaaaaa tgccgaattc atatgttgtg aattgaagac ctgttatttt 4260
cctgcaacta ggacatatgt ttagtcggtg aaacttcatt gctgctttaa gaagtcttac 4320
aggccagaga aaactgtctt gttttttttt tttttgattt gatgtcctgc tttatattta 4380
tgatccagcc aagcttatcc atccatctgc accctgatcc tgccataatc atttttttta 4440
tcagcctgac atgagcttat tatgttgcat aagttaggtt gaagctagat cgaacaaaaa 4500
actcaaagct actgataagt acaggatatg caacagaagt atcacacgag ccaaatctgc 4560
tataagaata aaacatacca agagccttag acaccactaa atagtgtgaa tggtagtgat 4620
agcgaataat ctcagaagat gacattttgg gaaatattat cgtgtagtat actttattaa 4680
ttgggagttg cgatacttgc cctgcacgct aaacatgctg aaaagtttca cagttatact 4740
acataacatc tgggtgtgta aaggttttat gttgttcatt gcttttcagt cactaataga 4800
tgcacttcac aatgaagttg gagatggtaa cgtgaagctt ggtacagaag tgttgtcatt 4860
ggcatgttgc tgtgatggag tctcttcttc tggtggttgg tcaatttctg ttgattcaaa 4920
agatgctaaa gggaaagatc tcagaaagaa ccaatctttc gatgctgtta taatgactgt 4980
aagaaaaaaa ttatctgtat tcatctcttt agaagcttga tcatttgaca gccacaaatt 5040
aaaatatttt accgtgtttt tctttttgcc cctttaggct ccattgtcta atgtccagag 5100
gatgaagttt acaaaaggtg gagttccctt tgtgctagac tttcttccta aggtcaggtt 5160
agaatcactc ttttagattt aacaaatgca gtgttgcact agcatgttct tgagaaattt 5220
gtgctggggg aaattcctct taatccttca aattgcattt aatttcatcc attaggtcga 5280
tggatccatg tcacagaaaa tattttgttt atcttctaga tttctattat atatgtaaga 5340
ctgtctctta gtttgtgaat ttacaggagt caatcatcac tcccttgaat ctgagcatat 5400
cagcagttca tcagcaatat ggtttatttg agaaggcaac ggaaactatt gtttccaaag 5460
gccacttgtt tgaaactttc accactgttt tgaacagtgt attaaagtaa cagtcatttg 5520
tatagcagca cctggtgatt tttaagtaaa ttttccattc ccaatcaaaa caagtaacat 5580
tatatgttga acatgtactg aattgaatat ggaactttat gctggagatg ccagacttta 5640
ttttactggc atgaatacac aattattgta acaatggtat tattgcttgg ttacttctcc 5700
gctgtgaaga catacctttc gtcacctttt cttgtttccc atattctgca ccttatggga 5760
ttgtcttcca catgttaaga tgccttgtag taccagttcc cctattattt gaatgtgttc 5820
ttccttagat atatgtgcat ttggaacgtg attggaaata caacagcaaa ctggtattgt 5880
tagctgcttg cctgccacag cctacatatg ctgccatatt acagaattat gagataggtg 5940
gactttgatt tctgtcataa tgattaacta acttgatata ctcaaactat gcagctccta 6000
gctggtatcc ttagaattta tcgagtatgc atagaagtct actcttaatc catatctatt 6060
tgatgtactc aaacttgaaa ctatgcagct cctagctggg ctccttagaa ttatcaagta 6120
tgcatagaaa tcttaatcca tatttattta ttatatgcag gtcgattatc taccactatc 6180
tctcatggta acagctttta agaaggaaga tgtcaaaaaa ccattggaag gatttggtgc 6240
cttgataccc tataaggaac agcaaaagca tggtctcaaa acccttggta ggttaattca 6300
gctttacact tatattttat ccagcttgta gctgcttata ttttgatttg cgaattaaaa 6360
attattaaaa cagccttgaa agaagaaacc atgttcgctg tggagactag aaattcccac 6420
attaattggg gaaagagaaa tatttacacc ctatgatttt ggcaagtgca agttttaatg 6480
gttgagattg atggattgaa tatatatcat atttggactc agtatgaaca aataccagat 6540
acataaatag atagtactaa ttcaacatgg atctgaactg ttgatcagac caattgagca 6600
cttggttgta attgctcgcg gactacacgc ttactgcctg actagggttc catgatgata 6660
aggttcgatt ttctaaaata ctattacaac aagatgacta tttaataaaa tttaaagaga 6720
ataacgtata taaaaattta gataaatttg gtgcaccgcg caattgcgca ggtcaccctg 6780
ctagctgtat tgaactcaat atacaaatca accttgctac attgctctac tttttctcag 6840
gtcttattta ctctgatttc tatttattct aatctataca tgtcgtcttg tacagggacc 6900
ctcttctcct cgatgatgtt tccagatcga gctcctaatg atcaatatct atatacatct 6960
ttcattgggg ggagccataa tagagacctc gctggggctc caacgtatac ttccatatta 7020
tgatcattta tgttttggtt gttttttctt ttcttgctag atttttctga tatatatact 7080
tatgtagggc tattctgaaa caacttgtga cctctgacct aagaaagctc ttgggtgttg 7140
agggacaacc tacttttgtg aagtaagtga taagaaacta ctgccatggt ttagagtatc 7200
tatatgtttt ctcttgttgt gcttgtgtta tggttttcca tcactatgga gttttgagga 7260
ttcattcagg tttttgcact accacttgcg aattcaatat gatgttcttt tacacaggca 7320
tgtacattgg agaaatgctt ttcctttata tggccagaat tatgatctgg tactggaagc 7380
tatagcaaaa atggagaaca atcttccagg gttcttttac gcaggcaagt caatgaaggc 7440
acccctattg tacaaaagaa atcttagata tttgaaacat attcctgttg attgagtacg 7500
tgaataattt gctgtttcta gtaagtcaat ttggtatttc tcatgcaact tatggggctc 7560
cttgatttgc tgagaatgat gagtttccta gagcaagcca ggaactgtaa tcccagcatg 7620
taatacttta ccttgaaatt aacttcaaaa aaataattga agctttttct gtatctgtag 7680
gaaataacaa ggatgggttg gctgttggaa atgttatagc ttcaggaagc aaggctgctg 7740
accttgtgat ctcttatctt gaatcttgca cagatcagga caattag 7787
<210> 36
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 8
<400> 36
atggtctcaa aacccttggt 20
<210> 37
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 9
<400> 37
acacgcttac tgcctgacta 20
<210> 38
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer 10
<400> 38
tatatacatc tttcattggg 20
<210> 39
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 6
<400> 39
gaaggatttg gtgccttgat accctataag gaacagcaaa agcatggtct caaaaccttt 60
ggtagattaa ttcagcttta cacttatatt ttatccagct tgtagctgct tatattttga 120
<210> 40
<211> 794
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 7
<400> 40
gaaggatttg gtgccttgat accctataag gaacagcaaa agcatggtct caaaaccttt 60
ggtaggttaa ttcagcttta cacttatatt ttatccagct tgtagctgct tatattttga 120
tttgcgaatt aaaaattatt aaaacagcct tgaaagaaga aaccatgttc gctgtggaga 180
ctagaaattc ccacattaat tggggaaaga gaaatattta caccctatga ttttggcaag 240
tgcaagtttt aatggttgag attgatggat tgaatatata tcatatttgg actcagtatg 300
aacaaatacc agatacataa atagatagta ctaattcaac atggatctga actgttgatc 360
agaccaattg agcacttggt tgtaattgct cgcggactac acgcttactg cctgactagc 420
gttccatgat gataaggttc gattttctaa aatactatta caacaagatg actatttaat 480
aaaatttaaa gagaataacg tatataaaaa tttagataaa tttggtgcac cgcgcaattg 540
cgcaggtcac cctgctagct gtattgaact caatatacaa atcaaccttg ctacattgct 600
ctactttttc tcaggtctta tttactctga tttctattta ttctaatcta tacatgtcgt 660
cttgtacagg gaccctcttc tcctcgatga tgtttccaga tcgagctcct aatgatcaat 720
atctatatac atctgtaatt ggggggagcc ataatagaga cctcgctggg gctccaacgt 780
atacttccat atta 794
<210> 41
<211> 800
<212> DNA
<213> Artificial Sequence
<220>
<223> donor 8
<400> 41
atggatctga actgttgatc agaccaattg agcacttggt tgtaattgct cgcggactac 60
acgcttactg cctgactagg gttccatgat gataaggttc gattttctaa aatactatta 120
caacaagatg actatttaat aaaatttaaa gagaataacg tatataaaaa tttagataaa 180
tttggtgcac cgcgcaattg cgcaggtcac cctgctagct gtattgaact caatatacaa 240
atcaaccttg ctacattgct ctactttttc tcaggtctta tttactctga tttctattta 300
ttctaatcta tacatgtcgt cttgtacagg gaccttcttc tcctcgatga tgtttccaga 360
tcgagctcct aatgatcaat atctatatac atctgtaatt ggcggcagcc ataatagaga 420
cctcgctggg gctccaacgt atacttccat attatgatca tttatgtttt ggttgttttt 480
tcttttcttg ctagattttt ctgatatata tacttatgta gggctattct gaaacaactt 540
gtgacctctg acctaagaaa gctcttgggt gttgagggac aacctacttt tgtgaagtaa 600
gtgataagaa actactgcca tggtttagag tatctatatg ttttctcttg ttgtgcttgt 660
gttatggttt tccatcacta tggagttttg aggattcatt caggtttttg cactaccact 720
tgcgaattca atatgatgtt cttttacaca ggcatgtaca ttggagaaat gcttttcctt 780
tatatggcca gaattatgat 800
<210> 42
<211> 138
<212> DNA
<213> Artificial Sequence
<220>
<223> RecA FusionCRISPR
<400> 42
gatgtggaaa ccatctctac gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttc catggatgtg gaaaccatcg 120
ctttcactgg atatcgcg 138
<210> 43
<211> 1062
<212> DNA
<213> Escherichia coli
<220>
<223> RecA
<400> 43
atggctatcg acgaaaacaa acagaaagcg ttggcggcag cactgggcca gattgagaaa 60
caatttggta aaggctccat catgcgcctg ggtgaagacc gttccatgga tgtggaaacc 120
atctctaccg gttcgctttc actggatatc gcgcttgggg caggtggtct gccgatgggc 180
cgtatcgtcg aaatctacgg accggaatct tccggtaaaa ccacgctgac gctgcaggtg 240
atcgccgcag cgcagcgtga aggtaaaacc tgtgcgttta tcgatgctga acacgcgctg 300
gacccaatct acgcacgtaa actgggcgtc gatatcgaca acctgctgtg ctcccagccg 360
gacaccggcg agcaggcact ggaaatctgt gacgccctgg cgcgttctgg cgcagtagac 420
gttatcgtcg ttgactccgt ggcggcactg acgccgaaag cggaaatcga aggcgaaatc 480
ggcgactctc acatgggcct tgcggcacgt atgatgagcc aggcgatgcg taagctggcg 540
ggtaacctga agcagtccaa cacgctgctg atcttcatca accagatccg tatgaaaatt 600
ggtgtgatgt tcggtaaccc ggaaaccact accggtggta acgcgctgaa attctacgcc 660
tctgttcgtc tcgacatccg tcgtatcggc gcggtgaaag agggcgaaaa cgtggtgggt 720
agcgaaaccc gcgtgaaagt ggtgaagaac aaaatcgctg cgccgtttaa acaggctgaa 780
ttccagatcc tctacggcga aggtatcaac ttctacggcg aactggttga cctgggcgta 840
aaagagaagc tgatcgagaa agcaggcgcg tggtacagct acaaaggtga gaagatcggt 900
cagggtaaag cgaatgcgac tgcctggctg aaagataacc cggaaaccgc gaaagagatc 960
gagaagaaag tacgtgagtt gctgctgagc aacccgaact caacgccgga tttctctgta 1020
gatgatagcg aaggcgtagc agaaactaac gaagattttt aa 1062
<210> 44
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 44
atggctatcg acgaaaacaa a 21
<210> 45
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer
<400> 45
cgtcagcgtg gttttaccgg a 21
<210> 46
<211> 461
<212> DNA
<213> Artificial Sequence
<220>
<223> Expression Cassette
<400> 46
tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60
gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120
gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180
tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240
gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300
tggaaaggac gaaacaccgg catccctcag gctgggctgt tttagagcta gaaatagcaa 360
gttaaaataa ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctggcca 420
tcaggcatcc ctcagtatgg aatgaggcat ctgatttttt t 461
<210> 47
<211> 275
<212> DNA
<213> Homo sapiens
<220>
<223> PRDM9 exon ENSE00001804383
<400> 47
attgtgagat gtgtcagaac ttcttcattg acagctgtgc tgcccatggg ccccctacat 60
ttgtaaagga cagtgcagtg gacaaggggc accccaaccg ttcagccctc agtctgcccc 120
cagggctgag aattgggcca tcaggcatcc ctcaggctgg gcttggagta tggaatgagg 180
catctgatct gccgctgggt ctgcactttg gcccttatga gggccgaatt acagaagacg 240
aagaggcagc caacaatgga tactcctggc tgtgg 275
<210> 48
<211> 783
<212> DNA
<213> Artificial Sequence
<220>
<223> Gene Fragment
<400> 48
cacctagggg ggaggtcgta gtacccccct atgttttctc ccctaaataa ccccaaaaat 60
ctaagaaaaa aagacctcaa aaaggtcttt aattaacatc tcaaatttcg catttattcc 120
aatttccttt ttgcgtgtga tgcgaattct tgaccgtgat tagagaattg agtaaaatgt 180
acctacgcga gacctcattc gccattcagg ctacgcaact gttgggaagg gcgatcggtg 240
cgggcctctt cgctattacg ccatgaggcg aaagggggat gtgctgcaag gcgattaagt 300
tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag actattcgta 360
atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 420
acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 480
aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctcgatta 540
atgaatcggt ctcagtttta gagctagaaa tagcaagtta aaataaggct agtccgttat 600
caacttgaaa aagtggcacc gagtcggtgc tggccaacga ggcccgggcc aataaggcct 660
tttttactcc atctggattt gttcagaacg ctcggttgcc gccgggcgtt ttttatctaa 720
agcttaggcc cagtcgaaag actgggcctt tttaatacga ctcactatag ggtcgactct 780
aga 783
<210> 49
<211> 784
<212> DNA
<213> Artificial Sequence
<220>
<223> Gene Fragment
<400> 49
cacctagggg ggaggtcgta gtacccccct atgttttctc ccctaaataa ccccaaaaat 60
ctaagaaaaa aagacctcaa aaaggtcttt aattaacatc tcaaatttcg catttattcc 120
aatttccttt ttgcgtgtga tgcgaattct tgaccgtgat tagagaattg agtaaaatgt 180
acctacggcc aacgaggccc gggccaataa ggcctacgcg agacctcatt cgccattcag 240
gctacgcaac tgttgggaag ggcgatcggt gcgggcctct tcgctattac gccatgaggc 300
gaaaggggga tgtgctgcaa ggcgattaag ttgggtaacg ccagggtttt cccagtcacg 360
acgttgtaaa acgacggcca gactattcgt aatcatggtc atagctgttt cctgtgtgaa 420
attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag tgtaaagcct 480
ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg cccgctttcc 540
agtcgggaaa cctgtcgtgc cagctcgatt aatgaatcgg tctcagtttt agagctagaa 600
atagcaagtt aaaataaggc tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg 660
ctttttactc catctggatt tgttcagaac gctcggttgc cgccgggcgt tttttatcta 720
aagcttaggc ccagtcgaaa gactgggcct ttttaatacg actcactata gggtcgactc 780
taga 784
<210> 50
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 50
tacgtgaaga tcaggctatc actg 24
<210> 51
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 51
aaaccagtga tagcctgatc ttca 24
<210> 52
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 52
gatcggccaa cgaggccgcg gcattatgtt tgaatttccg tttaaagaat gg 52
<210> 53
<211> 76
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 53
gatggtttct ttcggtaagt cccgtctagc cttgccctca tcttgacact ccttatttga 60
ttttttgaag acttac 76
<210> 54
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 54
tgagggcaag gctagacggg acttaccgaa agaaaccatc 40
<210> 55
<211> 56
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 55
gatcaggcct tattggcctt ggcaggccgc tgaatttcca tgttgcgtaa gtcagg 56
<210> 56
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 56
gatcggccaa cgaggccttg gcaggccgct gaatttccat gttgcgtaag tc 52
<210> 57
<211> 76
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 57
cgaagtaagt cttcaaaaaa tcaaataagg agtgtcaaga tgagggcaag gctagacggg 60
acttaccgaa agaaac 76
<210> 58
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 58
tcttgacact ccttatttga ttttttgaag acttacttcg 40
<210> 59
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 59
gatcggcctt attggccgcg gcattatgtt tgaatttccg tttaaagaat ggtctgc 57
<210> 60
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 60
gactttcagg cgtgaatgg 19
<210> 61
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Oligonucleotide
<400> 61
cgtgctctcc gataatatgc 20
<210> 62
<211> 6588
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector RLW121
<400> 62
ccgtttaaac ttagttacta atcagtgatc agattgtcgt ttcccgcctt cactttaaac 60
tatcagtgtt tgacaggata tattggcggg taaacctaag agaaaagagc gtttattaga 120
ataatcggat atttaaaagg gcgtgaaaag gtttatccgt tcgtccattt gtatgtcaat 180
attggggggg ggggaaagcc acgttgtgtc tcaaaatctc tgatgttaca ttgcacaaga 240
taaaaatata tcatcatgaa caataaaact gtctgcttac ataaacagta atacaagggg 300
tgttcgccac catgagccat atccagcgtg aaacctcgtg ctcccgcccg cgcctcaatt 360
ccaatatgga tgccgacctt tatggctaca agtgggcgcg cgacaacgtc ggccagtcgg 420
gcgcgaccat ttatcggctt tatggcaaac ccgatgcccc ggaactgttc ctgaagcacg 480
gcaaaggcag cgtcgcaaac gatgtcaccg atgagatggt ccgcctgaac tggcttaccg 540
agttcatgcc gctgccgacg attaagcatt tcatccgtac cccggacgat gcctggctct 600
tgaccacggc cattccgggc aaaacggcct ttcaggtcct tgaagagtac ccggactccg 660
gtgagaatat cgtggacgcc ctcgcggtct tcctccgccg tttgcatagc atccccgtgt 720
gcaactgccc cttcaactcg gaccgggttt tccgcctggc acaggcccag tcgcgcatga 780
ataacggcct cgttgacgcg agcgatttcg acgatgaacg gaatggctgg ccggtggaac 840
aggtttggaa ggaaatgcac aaactgcttc cgttctcgcc ggattcggtg gtcacgcatg 900
gtgatttttc cctggataat ctgatctttg acgagggcaa gctgatcggc tgcatcgacg 960
tgggtcgcgt cggtatcgcc gaccgctatc aggacctggc gatcttgtgg aattgcctcg 1020
gcgagttctc gccctcgctc cagaagcgcc tgttccagaa gtacggcatc gacaacccgg 1080
atatgaacaa gctccagttc cacctcatgc tggacgaatt tttttgaaca gaattggtta 1140
attggttgta acactggcag agcattacgc tgacttgacg ggacggcggc tttgttgaat 1200
aaatcgaact tttgctgagt tgaaggatcg atgagttgaa ggaccccgta gaaaagatca 1260
aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac 1320
caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg 1380
taactggctt cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag 1440
gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac 1500
cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt 1560
taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg 1620
agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc 1680
ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc 1740
gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc 1800
acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa 1860
acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt 1920
tctttcctgc gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg 1980
ataccgctcg ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag 2040
agcgcctgat gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcataggcc 2100
gcgataggcc gacgcgaagc ggcggggcgt agggagcgca gcgaccgaag ggtaggcgct 2160
ttttgcagct cttcggctgt gcgctggcca gacagttatg cacaggccag gcgggtttta 2220
agagttttaa taagttttaa agagttttag gcggaaaaat cgcctttttt ctcttttata 2280
tcagtcactt acatgtgtga ccggttccca atgtacggct ttgggttccc aatgtacggg 2340
ttccggttcc caatgtacgg ctttgggttc ccaatgtacg tgctatccac aggaaagaga 2400
ccttttcgac ctttttcccc tgctagggca atttgcccta gcatctgctc cgtacattag 2460
gaaccggcgg atgcttcgcc ctcgatcagg ttgcggtagc gcatgactag gatcgggcca 2520
gcctgccccg cctcctcctt caaatcgtac tccggcaggt catttgaccc gatcagcttg 2580
cgcacggtga aacagaactt cttgaactct ccggcgctgc cactgcgttc gtagatcgtc 2640
ttgaacaacc atctggcttc tgccttgcct gcggcgcggc gtgccaggcg gtagagaaaa 2700
cggccgatgc cggggtcgat caaaaagtaa tcggggtgaa ccgtcagcac gtccgggttc 2760
ttgccttctg tgatctcgcg gtacatccaa tcagcaagct cgatctcgat gtactccggc 2820
cgcccggttt cgctctttac gatcttgtag cggctaatca aggcttcacc ctcggatacc 2880
gtcaccaggc ggccgttctt ggccttcttg gtacgctgca tggcaacgtg cgtggtgttt 2940
aaccgaatgc aggtttctac caggtcgtct ttctgctttc cgccatcggc tcgccggcag 3000
aacttgagta cgtccgcaac gtgtggacgg aacacgcggc cgggcttgtc tcccttccct 3060
tcccggtatc ggttcatgga ttcggttaga tgggaaaccg ccatcagtac caggtcgtaa 3120
tcccacacac tggccatgcc ggcggggcct gcggaaacct ctacgtgccc gtctggaagc 3180
tcgtagcgga tcacctcgcc agctcgtcgg tcacgcttcg acagacggaa aacggccacg 3240
tccatgatgc tgcgactatc gcgggtgccc acgtcataga gcatcggaac gaaaaaatct 3300
ggttgctcgt cgcccttggg cggcttccta atcgacggcg caccggctgc cggcggttgc 3360
cgggattctt tgcggattcg atcagcggcc ccttgccacg attcaccggg gcgtgcttct 3420
gcctcgatgc gttgccgctg ggcggcctgc gcggccttca acttctccac caggtcatca 3480
cccagcgccg cgccgatttg taccgggccg gatggtttgc gaccgctcac gccgattcct 3540
cgggcttggg ggttccagtg ccattgcagg gccggcagac aacccagccg cttacgcctg 3600
gccaaccgcc cgttcctcca cacatggggc attccacggc gtcggtgcct ggttgttctt 3660
gattttccat gccgcctcct ttagccgcta aaattcatct actcatttat tcatttgctc 3720
atttactctg gtagctgcgc gatgtattca gatagcagct cggtaatggt cttgccttgg 3780
cgtaccgcgt acatcttcag cttggtgtga tcctccgccg gcaactgaaa gttgacccgc 3840
ttcatggctg gcgtgtctgc caggctggcc aacgttgcag ccttgctgct gcgtgcgctc 3900
ggacggccgg cacttagcgt gtttgtgctt ttgctcattt tctctttacc tcattaactc 3960
aaatgagttt tgatttaatt tcagcggcca gcgcctggac ctcgcgggca gcgtcgccct 4020
cgggttctga ttcaagaacg gttgtgccgg cggcggcagt gcctgggtag ctcacgcgct 4080
gcgtgatacg ggactcaaga atgggcagct cgtacccggc cagcgcctcg gcaacctcac 4140
cgccgatgcg cgtgcctttg atcgcccgcg acacgacaaa ggccgcttgt agccttccat 4200
ccgtgacctc aatgcgctgc ttaaccagct ccaccaggtc ggcggtggcc caaatgtcgt 4260
aagggcttgg ctgcaccgga atcagcacga agtcggctgc cttgatcgcg gacacagcca 4320
agtccgccgc ctggggcgct ccgtcgatca ctacgaagtc gcgccggccg atggccttca 4380
cgtcgcggtc aatcgtcggg cggtcgatgc cgacaacggt tagcggttga tcttcccgca 4440
cggccgccca atcgcgggca ctgccctggg gatcggaatc gactaacaga acatcggccc 4500
cggcgagttg cagggcgcgg gctagatggg ttgcgatggt cgtcttgcct gacccgcctt 4560
tctggttaag tacagcgata accttcatgc gttccccttg cgtatttgtt tatttactca 4620
tcgcatcata tacgcagcga ccgcatgacg caagctgttt tactcaaata cacatcacct 4680
ttttagatga tcagtgattt tgtgccgagc tgccggtcgg ggagctgttg gctggctggt 4740
ggcaggatat attgtggtgt aaacaaattg acgcttagac aacttaataa cacattgcgg 4800
acgtctttaa tgtactgaat ttagttactg atcactgatt aagtactgat aaatttaatt 4860
aacagatctc aactttgtat agaaaagttg aacgagaaac gtaaaatgat ataaatatca 4920
atatattaaa ttagattttg cataaaaaac agactacata atactgtaaa acacaacata 4980
tccagtcact atggtcgacc tgcagactgg ctgtgtataa gggagcctga catttatatt 5040
ccccagaaca tcaggttaat ggcgtttttg atgtcatttt cgcggtggct gagatcagcc 5100
acttcttccc cgataacgga gaccggcaca ctggccatat cggtggtcat catgcgccag 5160
ctttcatccc cgatatgcac caccgggtaa agttcacggg ggactttatc tgacagcaga 5220
cgtgcactgg ccagggggat caccatccgt cgcccgggcg tgtcaataat atcactctgt 5280
acatccacaa acagacgata acggctctct cttttatagg tgtaaacctt aaactgcatt 5340
tcaccagccc ctgttctcgt cggcaaaaga gccgttcatt tcaatgaacc gggcgacctc 5400
agccatccct tcctgatttt ccgctttcca gcgttcggca cgcagacgac gggcttcatt 5460
ctgcatggtt gtgcttaccg aaccggagat attgacatca tatatgcctt gagcaactga 5520
tagctgtcgc tgtcaactgt cactgtaata cgctgcttca tagcatacct ctttttgaca 5580
tacttcgggt atacatatca gtatatattc ttataccgca aaaatcagcg cgcaaatacg 5640
catactgtta tctggctttt agtaagccgg atcctctaga ttacgccccg cctgccactc 5700
atcgcagtac tgttgtaatt cattaagcat tctgccgaca tggaagccat cacaaacggc 5760
atgatgaacc tgaatcgcca gcggcatcag caccttgtcg ccttgcgtat aatatttgcc 5820
catggtgaaa acgggggcga agaagttgtc catattggcc acgtttaaat caaaactggt 5880
gaaactcacc cagggattgg ctgagacgaa aaacatattc tcaataaacc ctttagggaa 5940
ataggccagg ttttcaccgt aacacgccac atcttgcgaa tatatgtgta gaaactgccg 6000
gaaatcgtcg tggtattcac tccagagcga tgaaaacgtt tcagtttgct catggaaaac 6060
ggtgtaacaa gggtgaacac tatcccatat caccagctca ccgtctttca ttgccatacg 6120
gaattccgga tgagcattca tcaggcgggc aagaatgtga ataaaggccg gataaaactt 6180
gtgcttattt ttctttacgg tctttaaaaa ggccgtaata tccagctgaa cggtctggtt 6240
ataggtacat tgagcaactg actgaaatgc ctcaaaatgt tctttacgat gccattggga 6300
tatatcaacg gtggtatatc cagtgatttt tttctccatt ttagcttcct tagctcctga 6360
aaatctcgac ggatcctaac tcaaaatcca catattatac gagccggaag cataaagtgt 6420
aaagcctggg gtgcctaatg cggccgccat agtgactgga tatgttgtgt tttacagtat 6480
tatgtagtct gttttttatg caaaatctaa tttaatatat tgatatttat atcattttac 6540
gtttctcgtt caactttatt atacatagtt gataattcac tgggccgg 6588
<210> 63
<211> 7443
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector CC003
<400> 63
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgcata aataatgatt ttattttgac tgatagtgac ctgttcgttg caacaaattg 420
ataagcaatg cttttttata atgccaactt tgtatagaaa agttgattta aatgaattca 480
agcttttaat taacttagcc actgcaacaa gttcttgaac cttagcacaa tcatattgtg 540
catgcacttg tttattgcaa agaatggtgc gtagggaaca cgcatgattt ttgaattgct 600
ggcacataat tttatcatta gaaactggaa tgcaacatgt accctttgtc atggtttctt 660
tccgagacat tgcactgttt tttttaatcc tatcattatc ataatgccaa gaactggtca 720
ccaaccagca ttttgcatca tggttagttg agctgtcccc atgtatcaat aggtgcattg 780
tattggtcca aaatataaat gcagtggatg caacctatct catggccgtc aacaaaagaa 840
atcaaaaggg aaatgcacca tcttatatct ccagtttata tgaacagatt ggataagatc 900
ataagatcaa gtggtttata ttattttgag gaatataaca tggattcatc ctaatcactc 960
gtctaggcag tatgtgtatt catgatggat atggtactat actacggagt tttttcttca 1020
caaaataacc tgttattttg acctccaacc aaacacgaat tataccaaaa attgggttat 1080
ttcatctata gtacaactct attataaaca tgcagtaaat tatcctacac atataccaaa 1140
attcaagtgt aataatccta atacacagac ttaaaaaaca aactatttcc tttttaagaa 1200
aaggaaaacc atttttttaa cggaaggaaa acaaattcgg gtcaaggcgg aagccagcgc 1260
gccaccccac gtcagcgaat acggaggcgc ggggttgacg gcgtcacccg gtcctaacgg 1320
cgaccaacaa accagccaga agaaattaca gtaaaaaaaa gtaaattgca ctttgatcca 1380
ccttttatta cccaagtttc aatttggacc acccttaaac ctatcttttc aaattgggcc 1440
gggttgtggt ttggactacc atgaacaact tttcgtcatg tctaacttcc ctttcggcaa 1500
acatatgaac catatataga ggagatcggc cgtatactag agctgatgtg tttaaggtcg 1560
ttgattgcac gagaaaaaaa aaatccaaat cgcaacaata gcaaatttat ctagttcaaa 1620
gtgaaaagat atgtttaaag gtagtccaaa gtaaaactta ggggctgttt ggttcccagc 1680
catactttac cattacttgc caacaaaagt tgccacacct tgtctaaggt gaggtgatca 1740
aattgttagc cacaacttac taagcctaag ggaatcttgc cacacttttt tgagccattg 1800
acacgtggga cttaatttgt tagagggaaa tcttgccaca actgtggcta caaccaaaca 1860
cctgtcaaat ttgcctaacc ttaggcgtgg caaactgtgg caaagtgtgg cttacaacca 1920
aacacaccct tagataataa aatgtggtcc aaagcgtaat tcactaaaaa aaaatcaacg 1980
agacgtgtac caaacggaga caaacggcat cttctcgaaa tttcccaacc gctcgctcgc 2040
ccgcctcgtc ttcccggaaa ccgcggtggt ttcagcgtgg cggattctcc aagcagacgg 2100
agacgtcacg gcacgggact cctcccacca cccaaccgcc ataaatacca gccccctcat 2160
ctcctctcct cgcatcagct ccacccccga aaaatttctc cccaatctcg cgaggctctc 2220
gtcgtcgaat cgaatcctct cgcgtcctca agcttggcat ccaggtacgg atccgcgtcc 2280
catctccctc accccccgtg ttcttcgtgc ctgcttctgg gtcagatctg ggtggattcg 2340
cggttgttgg atgtgggggg ctgtgtttat ttgtcggtgg atctggttgt ctggatctgc 2400
gttttctctg tcgtagttag cggatctgat gaaatgttta gtgttcgtgt atactggtat 2460
ggtggatctg gtcctaggat gcgtggaatg gatatatgta ggcgaattgg aggatttatt 2520
ttgtgaattt tgctgaaatg atagttctaa acactggatc tgacctcggg atgctgttaa 2580
atgtggaaat catggtcgat gctgtcatga acatggtgtt cttatggtag atctgagcaa 2640
tgtatgtttc aaaattgttt gtcacatgga aatgctatgg ttctagatgc aatagaatga 2700
tacatgccga gatcccctct agttgatatg atagatcatg atgttttaca gctatgtcat 2760
atgaatatgt tcatttgtta ccgatgtatt tggatctact taacatttcc aaagcacgcc 2820
gcgttctaat tctagatctg gtagtcatgt ttgtacacgt cacccaccta atacaaatac 2880
atatgtctag tgtttggtga cactgcccgt cagatctgtt ttttccagat ctgtggaaca 2940
aatactccac gcatgtatgg tagttttgaa acgatcttgt atcttccatt gttgtagtaa 3000
caactaaata aagtacaatt gttcaattat tgggaatcgt attttctgta gtgccgatgt 3060
acagcatatt catagatgtc tatttaggaa ctcaaatttt aaattgagga ctagttattt 3120
attgtgggtc agtcttttga attgtgttat cttgctgtac tggcgcgcca ccatggccac 3180
cgccgccgcc gcgtctaccg cgctcactgg cgccactacc gctgcgccca aggcgaggcg 3240
ccgggcgcac ctcctggcca cccgccgcgc cctcgccgcg cccatcaggt gctcagcggc 3300
gtcacccgcc atgccgatgg ctcccccggc caccccgctc cggccgtggg gccccaccga 3360
tccccgcaag ggcgccgaca tcctcgtcga gtccctcgag cgctgcggcg tccgcgacgt 3420
cttcgcctac cccggcggca cgtccatgga gatccaccag gcactcaccc gctcccccgt 3480
catcgccaac cacctcttcc gccacgagca aggggaggcc tttgcggcct ccggctacgc 3540
gcgctcctcg ggccgcgtcg gcgtctgcat cgccacctcc ggccccggcg ccaccaacct 3600
tgtctccgcg ctcgccgacg cgctgctcga ttccgtcccc atggtcgcca tcacgggaca 3660
ggtgccgcga cgcatgattg gcaccgacgc cttccaggag acgcccatcg tcgaggtcac 3720
ccgctccatc accaagcaca actacctggt cctcgacgtc gacgacatcc cccgcgtcgt 3780
gcaggaggct ttcttcctcg cctcctctgg tcgaccgggg ccggtgcttg tcgacatccc 3840
caaggacatc cagcagcaga tggcggtgcc tgtctgggac aagcccatga gtctgcctgg 3900
gtacattgcg cgccttccca agccccctgc gactgagttg cttgagcagg tgctgcgtct 3960
tgttggtgaa tcccggcgcc ctgttcttta tgttggcggt ggctgcgcag catctggtga 4020
ggagttgcga cgctttgtgg agctgactgg aatcccggtc acaactactc ttatgggcct 4080
cggcaacttc cccagcgacg acccactgtc tctgcgcatg ctaggtatgc atggcacggt 4140
gtatgcaaat tatgcagtgg ataaggccga tctgttgctt gcacttggtg tgcggtttga 4200
tgatcgtgtg acagggaaga ttgaggcttt tgcaagcagg gctaagattg tgcacgttga 4260
tattgatccg gctgagattg gcaagaacaa gcagccacat gtgtccatct gtgcagatgt 4320
taagcttgct ttgcagggca tgaatgctct tcttgaagga agcacatcaa agaagagctt 4380
tgactttggc tcatggaacg atgagttgga tcagcagaag agggaattcc cccttgggta 4440
taaaacatct aatgaggaga tccagccaca atatgctatt caggttcttg atgagctgac 4500
gaaaggcgag gccatcatcg gcacaggtgt tgggcagcac cagatgtggg cggcacagta 4560
ctacacttac aagcggccaa ggcagtggtt gtcttcagct ggtcttgggg ctatgggatt 4620
tggtttgccg gctgctgctg gtgcttctgt ggccaaccca ggtgttactg ttgttgacat 4680
cgatggagat ggtagctttc tcatgaacgt tcaggagcta gctatgatcc gaattgagaa 4740
cctcccggtg aaggtctttg tgctaaacaa ccagcacctg gggatggtgg tgcagtggga 4800
ggacaggttc tataaggcca acagagcgca cacatacttg ggaaacccag agaatgaaag 4860
tgagatatat ccagatttcg tgacgatcgc caaagggttc aacattccag cggtccgtgt 4920
gacaaagaag aacgaagtcc gcgcagcgat aaagaagatg ctcgagactc cagggccgta 4980
cctcttggat ataatcgtcc cacaccagga gcatgtgttg cctatgatcc ctaatggtgg 5040
ggctttcaag gatatgatcc tggatggtga tggcaggact gtgtactagc ctgcaggcct 5100
aggatcgttc aaacatttgg caataaagtt tcttaagatt gaatcctgtt gccggtcttg 5160
cgatgattat catataattt ctgttgaatt acgttaagca tgtaataatt aacatgtaat 5220
gcatgacgtt atttatgaga tgggttttta tgattagagt cccgcaatta tacatttaat 5280
acgcgataga aaacaaaata tagcgcgcaa actaggataa attatcgcgc gcggtgtcat 5340
ctatgttact agatcggccg gccgtttaaa cagcctgctt ttttgtacaa agttggcatt 5400
ataaaaaagc attgctcatc aatttgttgc aacgaacagg tcactatcag tcaaaataaa 5460
atcattattt gctgggcctc atgggccttc cgctcactgc ccgctttcca gtcgggaaac 5520
ctgtcgtgcc agctgcatta acatggtcat agctgtttcc ttgcgtattg ggcgctctcc 5580
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggg taaagcctgg ggtgcctaat 5640
gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 5700
ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 5760
acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 5820
ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 5880
cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 5940
tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 6000
gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 6060
ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 6120
acggctacac tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 6180
gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 6240
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 6300
tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 6360
gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 6420
tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 6480
ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 6540
taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagaac 6600
cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 6660
gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 6720
gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 6780
tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 6840
gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 6900
ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 6960
ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 7020
cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 7080
ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 7140
gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 7200
ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 7260
ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 7320
tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 7380
ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 7440
cac 7443
<210> 64
<211> 3734
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector CC018
<400> 64
cgcggatcat gaaccaacgg cctggctgta tttggtggtt gtgtagggag atggggagaa 60
gaaaagcccg attctcttcg ctgtgatggg ctggatgcat gcgggggagc gggaggccca 120
agtacgtgca cggtgagcgg cccacagggc gagtgtgagc gcgagaggcg ggaggaacag 180
tttagtacca cattgcccag ctaactcgaa cgcgaccaac ttataaaccc gcgcgctgtc 240
gcttgtgtgc attgagtgct atgctgaggt tttagagcta gaaatagcaa gttaaaataa 300
ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctctgtt cctcgtgctg 360
gacaagtgtg gtttccagat tctgcaacca agactgcgca ggcattgctg gacttcaacc 420
gtgaaggatt acctctgttc atcctcgcta actggagagg cttctctggt ggacaaagag 480
atctctttga aggaattctt caggctggct cgactattgt tgagaacctt aggacataca 540
atcagcctgc ctttgtctac attcccatgg ctgcagagct acgaggaggg gcttgggttg 600
tggttgatag caagataaac ccagaccgca ttgagtgcta tgctgagaga actgcaaaat 660
ccaatgttct ggaaccgcaa gggttaattg agatcaagtt caggtcagag gaactccagg 720
attgcatgag tcggcttgac ccaacattaa ttgatctgaa agcaaaactc gaagtagcaa 780
ataaaaatgg aagtgctgac acaaaatcgc ttcaagaaaa tatagaagct cgaacaaaac 840
agttgatgcc tctatatact cagattgcga tacggtttgc tgaattgcat gatacatccc 900
tcagaatggc tgcgaaaggt gtgattaaga aagttgtgga ctgggaagaa tcacgatctt 960
tctttttttt gcggccgccc cgggcctgca ggggatcccg atcgggccgg ccgtttaaac 1020
ccactttgta caagaaagtt gaacgagaaa cgtaaaatga tataaatatc aatatattaa 1080
attagatttt gcataaaaaa cagactacat aatactgtaa aacacaacat atgcagtcac 1140
tatgaaccaa ctacttagat ggtattagtg acctgtactg ggcctcatgg gccttccgct 1200
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaacat ggtcatagct 1260
gtttccttgc gtattgggcg ctctccgctt cctcgctcac tgactcgctg cgctcggtcg 1320
ttcgggtaaa gcctggggtg cctaatgagc aaaaggccag caaaaggcca ggaaccgtaa 1380
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 1440
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 1500
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 1560
cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 1620
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 1680
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 1740
gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 1800
agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg 1860
cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 1920
aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 1980
aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 2040
ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 2100
aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 2160
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 2220
agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 2280
cagtgctgca atgataccgc gagaaccacg ctcaccggct ccagatttat cagcaataaa 2340
ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 2400
gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 2460
cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 2520
cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 2580
ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 2640
catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 2700
tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 2760
ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 2820
catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 2880
cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 2940
cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 3000
acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 3060
ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 3120
tccgcgcaca tttccccgaa aagtgccacc taaattgtaa gcgttaatat tttgttaaaa 3180
ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa 3240
atcccttata aatcaaaaga atagaccgag atagggttga gtggccgcta cagggcgctc 3300
ccattcgcca ttcaggctgc gcaactgttg ggaagggcgt ttcggtgcgg gcctcttcgc 3360
tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 3420
ggttttccca gtcacgacgt tgtaaaacga cggccagtga gcgcgacgta atacgactca 3480
ctatagggcg aattggcgga aggccgtcaa ggccgcatta caggtcacta ataccatcta 3540
agtagttggt tcatagtgac tgcatatgtt gtgttttaca gtattatgta gtctgttttt 3600
tatgcaaaat ctaatttaat atattgatat ttatatcatt ttacgtttct cgttcaactt 3660
ttttgtacaa acttgattta aatgaattca agcttttaat taagcatgcg agctcggcgc 3720
gccggtaccg cgat 3734
<210> 65
<211> 9506
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector CC006
<400> 65
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggccgcatc aaataatgat tttattttga ctgatagtga cctgttcgtt gcaacaaatt 420
gataagcaat gctttcttat aatgccaact ttgtacaaga aagctgggta tttaaatgaa 480
ttcaagcttt taattaatgc agtgcagcgt gacccggtcg tgcccctctc tagagataat 540
gagcattgca tgtctaagtt ataaaaaatt accacatatt ttttttgtca cacttgtttg 600
aagtgcagtt tatctatctt tatacatata tttaaacttt actctacgaa taatataatc 660
tatagtacta caataatatc agtgttttag agaatcatat aaatgaacag ttagacatgg 720
tctaaaggac aattgagtat tttgacaaca ggactctaca gttttatctt tttagtgtgc 780
atgtgttctc cttttttttt gcaaatagct tcacctatat aatacttcat ccattttatt 840
agtacatcca tttagggttt agggttaatg gtttttatag actaattttt ttagtacatc 900
tattttattc tattttagcc tctaaattaa gaaaactaaa actctatttt agttttttta 960
tttaatagtt tagatataaa atagaataaa ataaagtgac taaaaattaa acaaataccc 1020
tttaagaaat taaaaaaact aaggaaacat ttttcttgtt tcgagtagat aatgccagcc 1080
tgttaaacgc cgtcgacgag tctaacggac accaaccagc gaaccagcag cgtcgcgtcg 1140
ggccaagcga agcagacggc acggcatctc tgtcgctgcc tctggacccc tctcgagagt 1200
tccgctccac cgttggactt gctccgctgt cggcatccag aaattgcgtg gcggagcggc 1260
agacgtgagc cggcacggca ggcggcctcc tcctcctctc acggcaccgg cagctacggg 1320
ggattccttt cccaccgctc cttcgctttc ccttcctcgc ccgccgtaat aaatagacac 1380
cccctccaca ccctctttcc ccaacctcgt gttgttcgga gcgcacacac acacaaccag 1440
atctccccca aatccacccg tcggcacctc cgcttcaagg tacgccgctc gtcctccccc 1500
cccccccccc tctctacctt ctctagatcg gcgttccggt ccatggttag ggcccggtag 1560
ttctacttct gttcatgttt gtgttagatc cgtgtttgtg ttagatccgt gctgctagcg 1620
ttcgtacacg gatgcgacct gtacgtcaga cacgttctga ttgctaactt gccagtgttt 1680
ctctttgggg aatcctggga tggctctagc cgttccgcag acgggatcga tttcatgatt 1740
ttttttgttt cgttgcatag ggtttggttt gcccttttcc tttatttcaa tatatgccgt 1800
gcacttgttt gtcgggtcat cttttcatgc ttttttttgt cttggttgtg atgatgtggt 1860
ctggttgggc ggtcgttcta gatcggagta gaattctgtt tcaaactacc tggtggattt 1920
attaattttg gatctgtatg tgtgtgccat acatattcat agttacgaat tgaagatgat 1980
ggatggaaat atcgatctag gataggtata catgttgatg cgggttttac tgatgcatat 2040
acagagatgc tttttgttcg cttggttgtg atgatgtggt gtggttgggc ggtcgttcat 2100
tcgttctaga tcggagtaga atactgtttc aaactacctg gtgtatttat taattttgga 2160
actgtatgtg tgtgtcatac atcttcatag ttacgagttt aagatggatg gaaatatcga 2220
tctaggatag gtatacatgt tgatgtgggt tttactgatg catatacatg atggcatatg 2280
cagcatctat tcatatgctc taaccttgag tacctatcta ttataataaa caagtatgtt 2340
ttataattat ttcgatcttg atatacttgg atgatggcat atgcagcagc tatatgtgga 2400
tttttttagc cctgccttca tacgctattt atttgcttgg tactgtttct tttgtcgatg 2460
ctcaccctgt tgtttggtgt tacttctgca gggcgcgcca ccatggctcc taagaagaag 2520
cggaaggttg gtattcacgg ggtgcctgcg gctgacaaga agtactccat cggcctcgac 2580
atcggcacca acagcgtcgg ctgggcggtg atcaccgacg agtacaaggt cccgtccaag 2640
aagttcaagg tcctgggcaa caccgaccgc cactccatca agaagaacct catcggcgcc 2700
ctcctcttcg actccggcga gacggcggag gcgacccgcc tcaagcgcac cgcccgccgc 2760
cgctacaccc gccgcaagaa ccgcatctgc tacctccagg agatcttctc caacgagatg 2820
gcgaaggtcg acgactcctt cttccaccgc ctcgaggagt ccttcctcgt ggaggaggac 2880
aagaagcacg agcgccaccc catcttcggc aacatcgtcg acgaggtcgc ctaccacgag 2940
aagtacccca ctatctacca ccttcgtaag aagcttgttg actctactga taaggctgat 3000
cttcgtctca tctaccttgc tctcgctcac atgatcaagt tccgtggtca cttccttatc 3060
gagggtgacc ttaaccctga taactccgac gtggacaagc tcttcatcca gctcgtccag 3120
acctacaacc agctcttcga ggagaaccct atcaacgctt ccggtgtcga cgctaaggcg 3180
atcctttccg ctaggctctc caagtccagg cgtctcgaga acctcatcgc ccagctccct 3240
ggtgagaaga agaacggtct tttcggtaac ctcatcgctc tctccctcgg tctgacccct 3300
aacttcaagt ccaacttcga cctcgctgag gacgctaagc ttcagctctc caaggatacc 3360
tacgacgatg atctcgacaa cctcctcgct cagattggag atcagtacgc tgatctcttc 3420
cttgctgcta agaacctctc cgatgctatc ctcctttcgg atatccttag ggttaacact 3480
gagatcacta aggctcctct ttctgcttcc atgatcaagc gctacgacga gcaccaccag 3540
gacctcaccc tcctcaaggc tcttgttcgt cagcagctcc ccgagaagta caaggagatc 3600
ttcttcgacc agtccaagaa cggctacgcc ggttacattg acggtggagc tagccaggag 3660
gagttctaca agttcatcaa gccaatcctt gagaagatgg atggtactga ggagcttctc 3720
gttaagctta accgtgagga cctccttagg aagcagagga ctttcgataa cggctctatc 3780
cctcaccaga tccaccttgg tgagcttcac gccatccttc gtaggcagga ggacttctac 3840
cctttcctca aggacaaccg tgagaagatc gagaagatcc ttactttccg tattccttac 3900
tacgttggtc ctcttgctcg tggtaactcc cgtttcgctt ggatgactag gaagtccgag 3960
gagactatca ccccttggaa cttcgaggag gttgttgaca agggtgcttc cgcccagtcc 4020
ttcatcgagc gcatgaccaa cttcgacaag aacctcccca acgagaaggt cctccccaag 4080
cactccctcc tctacgagta cttcacggtc tacaacgagc tcaccaaggt caagtacgtc 4140
accgagggta tgcgcaagcc tgccttcctc tccggcgagc agaagaaggc tatcgttgac 4200
ctcctcttca agaccaaccg caaggtcacc gtcaagcagc tcaaggagga ctacttcaag 4260
aagatcgagt gcttcgactc cgtcgagatc agcggcgttg aggaccgttt caacgcttct 4320
ctcggcacct accacgatct cctcaagatc atcaaggaca aggacttcct cgacaacgag 4380
gagaacgagg acatcctcga ggacatcgtc ctcactctta ctctcttcga ggatagggag 4440
atgatcgagg agaggctcaa gacttacgct catctcttcg atgacaaggt tatgaagcag 4500
ctcaagcgtc gccgttacac cggttggggt aggctctccc gcaagctcat caacggtatc 4560
agggataagc agagcggcaa gactatcctc gacttcctca agtctgatgg tttcgctaac 4620
aggaacttca tgcagctcat ccacgatgac tctcttacct tcaaggagga tattcagaag 4680
gctcaggtgt ccggtcaggg cgactctctc cacgagcaca ttgctaacct tgctggttcc 4740
cctgctatca agaagggcat ccttcagact gttaaggttg tcgatgagct tgtcaaggtt 4800
atgggtcgtc acaagcctga gaacatcgtc atcgagatgg ctcgtgagaa ccagactacc 4860
cagaagggtc agaagaactc gagggagcgc atgaagagga ttgaggaggg tatcaaggag 4920
cttggttctc agatccttaa ggagcaccct gtcgagaaca cccagctcca gaacgagaag 4980
ctctacctct actacctcca gaacggtagg gatatgtacg ttgaccagga gctcgacatc 5040
aacaggcttt ctgactacga cgtcgaccac attgttcctc agtctttcct taaggatgac 5100
tccatcgaca acaaggtcct cacgaggtcc gacaagaaca ggggtaagtc ggacaacgtc 5160
ccttccgagg aggttgtcaa gaagatgaag aactactgga ggcagcttct caacgctaag 5220
ctcattaccc agaggaagtt cgacaacctc acgaaggctg agaggggtgg cctttccgag 5280
cttgacaagg ctggtttcat caagaggcag cttgttgaga cgaggcagat taccaagcac 5340
gttgctcaga tcctcgattc taggatgaac accaagtacg acgagaacga caagctcatc 5400
cgcgaggtca aggtgatcac cctcaagtcc aagctcgtct ccgacttccg caaggacttc 5460
cagttctaca aggtccgcga gatcaacaac taccaccacg ctcacgatgc ttaccttaac 5520
gctgtcgttg gcaccgctct tatcaagaag taccctaagc ttgagtccga gttcgtctac 5580
ggtgactaca aggtctacga cgttcgtaag atgatcgcca agtccgagca ggagatcggc 5640
aaggccaccg ccaagtactt cttctactcc aacatcatga acttcttcaa gaccgagatc 5700
accctcgcca acggcgagat ccgcaagcgc cctcttatcg agacgaacgg tgagactggt 5760
gagatcgttt gggacaaggg tcgcgacttc gctactgttc gcaaggtcct ttctatgcct 5820
caggttaaca tcgtcaagaa gaccgaggtc cagaccggtg gcttctccaa ggagtctatc 5880
cttccaaaga gaaactcgga caagctcatc gctaggaaga aggattggga ccctaagaag 5940
tacggtggtt tcgactcccc tactgtcgcc tactccgtcc tcgtggtcgc caaggtggag 6000
aagggtaagt cgaagaagct caagtccgtc aaggagctcc tcggcatcac catcatggag 6060
cgctcctcct tcgagaagaa cccgatcgac ttcctcgagg ccaagggcta caaggaggtc 6120
aagaaggacc tcatcatcaa gctccccaag tactctcttt tcgagctcga gaacggtcgt 6180
aagaggatgc tggcttccgc tggtgagctc cagaagggta acgagcttgc tcttccttcc 6240
aagtacgtga acttcctcta cctcgcctcc cactacgaga agctcaaggg ttcccctgag 6300
gataacgagc agaagcagct cttcgtggag cagcacaagc actacctcga cgagatcatc 6360
gagcagatct ccgagttctc caagcgcgtc atcctcgctg acgctaacct cgacaaggtc 6420
ctctccgcct acaacaagca ccgcgacaag cccatccgcg agcaggccga gaacatcatc 6480
cacctcttca cgctcacgaa cctcggcgcc cctgctgctt tcaagtactt cgacaccacc 6540
atcgacagga agcgttacac gtccaccaag gaggttctcg acgctactct catccaccag 6600
tccatcaccg gtctttacga gactcgtatc gacctttccc agcttggtgg tgataagcgt 6660
cctgctgcca ccaaaaaggc cggacaggct aagaaaaaga agtagcctgc aggtcctgct 6720
ttaatgagat atgcgagacg cctatgatcg catgatattt gctttcaatt ctgttgtgca 6780
cgttgtaaaa aacctgagca tgtgtagctc agatccttac cgccggtttc ggttcattct 6840
aatgaatata tcacccgtta ctatcgtatt tttatgaata atattctccg ttcaatttac 6900
tgattgtacc ctactactta tatgtacaat attaaaatga aaacaatata ttgtgctgaa 6960
taggtttata gcgacatcta tgatagagcg ccacaataac aaacaattgc gttttattat 7020
tacaaatcca attttaaaaa aagcggcaga accggtcaaa cctaaaagac tgattacata 7080
aatcttattc aaatttcaaa agtgccccag gggctagtat ctacgacaca ccgagcggcg 7140
aactaataac gctcactgaa gggaactccg gttccccgcc ggcgcgcatg ggtgagattc 7200
cttgaagttg agtattggcc gtccgctcta ccgaaagtta cgggcaccat tcaacccggt 7260
ccagcacggc ggccgggtaa ccgacttgct gccccgagaa ttatgcagca tttttttggt 7320
gtatgtgggc cccaaatgaa gtgcaggtca aaccttgaca gtgacgacaa atcgttgggc 7380
gggtccaggg cgaattttgc gacaacatgt cgaggctcag caggccggcc gtttaaacca 7440
actttattat acaaagttgg cattataaaa aagcattgct tatcaatttg ttgcaacgaa 7500
caggtcacta tcagtcaaaa taaaatcatt atttctgggc ctcatgggcc ttccgctcac 7560
tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaacatggt catagctgtt 7620
tccttgcgta ttgggcgctc tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 7680
gggtaaagcc tggggtgcct aatgagcaaa aggccagcaa aaggccagga accgtaaaaa 7740
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 7800
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 7860
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 7920
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 7980
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 8040
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 8100
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 8160
gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 8220
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 8280
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 8340
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 8400
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 8460
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 8520
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 8580
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 8640
tgctgcaatg ataccgcgag aaccacgctc accggctcca gatttatcag caataaacca 8700
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 8760
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 8820
tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 8880
ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 8940
tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 9000
ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 9060
gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 9120
ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 9180
cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 9240
ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 9300
ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 9360
gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 9420
ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 9480
gcgcacattt ccccgaaaag tgccac 9506
<210> 66
<211> 17930
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector RLW137
<400> 66
ttatacatag ttgataattc actgggccgg ccgtttaaac ttagttacta atcagtgatc 60
agattgtcgt ttcccgcctt cactttaaac tatcagtgtt tgacaggata tattggcggg 120
taaacctaag agaaaagagc gtttattaga ataatcggat atttaaaagg gcgtgaaaag 180
gtttatccgt tcgtccattt gtatgtcaat attggggggg ggggaaagcc acgttgtgtc 240
tcaaaatctc tgatgttaca ttgcacaaga taaaaatata tcatcatgaa caataaaact 300
gtctgcttac ataaacagta atacaagggg tgttcgccac catgagccat atccagcgtg 360
aaacctcgtg ctcccgcccg cgcctcaatt ccaatatgga tgccgacctt tatggctaca 420
agtgggcgcg cgacaacgtc ggccagtcgg gcgcgaccat ttatcggctt tatggcaaac 480
ccgatgcccc ggaactgttc ctgaagcacg gcaaaggcag cgtcgcaaac gatgtcaccg 540
atgagatggt ccgcctgaac tggcttaccg agttcatgcc gctgccgacg attaagcatt 600
tcatccgtac cccggacgat gcctggctct tgaccacggc cattccgggc aaaacggcct 660
ttcaggtcct tgaagagtac ccggactccg gtgagaatat cgtggacgcc ctcgcggtct 720
tcctccgccg tttgcatagc atccccgtgt gcaactgccc cttcaactcg gaccgggttt 780
tccgcctggc acaggcccag tcgcgcatga ataacggcct cgttgacgcg agcgatttcg 840
acgatgaacg gaatggctgg ccggtggaac aggtttggaa ggaaatgcac aaactgcttc 900
cgttctcgcc ggattcggtg gtcacgcatg gtgatttttc cctggataat ctgatctttg 960
acgagggcaa gctgatcggc tgcatcgacg tgggtcgcgt cggtatcgcc gaccgctatc 1020
aggacctggc gatcttgtgg aattgcctcg gcgagttctc gccctcgctc cagaagcgcc 1080
tgttccagaa gtacggcatc gacaacccgg atatgaacaa gctccagttc cacctcatgc 1140
tggacgaatt tttttgaaca gaattggtta attggttgta acactggcag agcattacgc 1200
tgacttgacg ggacggcggc tttgttgaat aaatcgaact tttgctgagt tgaaggatcg 1260
atgagttgaa ggaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc 1320
gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg 1380
atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa 1440
atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc 1500
ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt 1560
gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa 1620
cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc 1680
tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc 1740
cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct 1800
ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat 1860
gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc 1920
tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg 1980
ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc 2040
gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc 2100
atctgtgcgg tatttcacac cgcataggcc gcgataggcc gacgcgaagc ggcggggcgt 2160
agggagcgca gcgaccgaag ggtaggcgct ttttgcagct cttcggctgt gcgctggcca 2220
gacagttatg cacaggccag gcgggtttta agagttttaa taagttttaa agagttttag 2280
gcggaaaaat cgcctttttt ctcttttata tcagtcactt acatgtgtga ccggttccca 2340
atgtacggct ttgggttccc aatgtacggg ttccggttcc caatgtacgg ctttgggttc 2400
ccaatgtacg tgctatccac aggaaagaga ccttttcgac ctttttcccc tgctagggca 2460
atttgcccta gcatctgctc cgtacattag gaaccggcgg atgcttcgcc ctcgatcagg 2520
ttgcggtagc gcatgactag gatcgggcca gcctgccccg cctcctcctt caaatcgtac 2580
tccggcaggt catttgaccc gatcagcttg cgcacggtga aacagaactt cttgaactct 2640
ccggcgctgc cactgcgttc gtagatcgtc ttgaacaacc atctggcttc tgccttgcct 2700
gcggcgcggc gtgccaggcg gtagagaaaa cggccgatgc cggggtcgat caaaaagtaa 2760
tcggggtgaa ccgtcagcac gtccgggttc ttgccttctg tgatctcgcg gtacatccaa 2820
tcagcaagct cgatctcgat gtactccggc cgcccggttt cgctctttac gatcttgtag 2880
cggctaatca aggcttcacc ctcggatacc gtcaccaggc ggccgttctt ggccttcttg 2940
gtacgctgca tggcaacgtg cgtggtgttt aaccgaatgc aggtttctac caggtcgtct 3000
ttctgctttc cgccatcggc tcgccggcag aacttgagta cgtccgcaac gtgtggacgg 3060
aacacgcggc cgggcttgtc tcccttccct tcccggtatc ggttcatgga ttcggttaga 3120
tgggaaaccg ccatcagtac caggtcgtaa tcccacacac tggccatgcc ggcggggcct 3180
gcggaaacct ctacgtgccc gtctggaagc tcgtagcgga tcacctcgcc agctcgtcgg 3240
tcacgcttcg acagacggaa aacggccacg tccatgatgc tgcgactatc gcgggtgccc 3300
acgtcataga gcatcggaac gaaaaaatct ggttgctcgt cgcccttggg cggcttccta 3360
atcgacggcg caccggctgc cggcggttgc cgggattctt tgcggattcg atcagcggcc 3420
ccttgccacg attcaccggg gcgtgcttct gcctcgatgc gttgccgctg ggcggcctgc 3480
gcggccttca acttctccac caggtcatca cccagcgccg cgccgatttg taccgggccg 3540
gatggtttgc gaccgctcac gccgattcct cgggcttggg ggttccagtg ccattgcagg 3600
gccggcagac aacccagccg cttacgcctg gccaaccgcc cgttcctcca cacatggggc 3660
attccacggc gtcggtgcct ggttgttctt gattttccat gccgcctcct ttagccgcta 3720
aaattcatct actcatttat tcatttgctc atttactctg gtagctgcgc gatgtattca 3780
gatagcagct cggtaatggt cttgccttgg cgtaccgcgt acatcttcag cttggtgtga 3840
tcctccgccg gcaactgaaa gttgacccgc ttcatggctg gcgtgtctgc caggctggcc 3900
aacgttgcag ccttgctgct gcgtgcgctc ggacggccgg cacttagcgt gtttgtgctt 3960
ttgctcattt tctctttacc tcattaactc aaatgagttt tgatttaatt tcagcggcca 4020
gcgcctggac ctcgcgggca gcgtcgccct cgggttctga ttcaagaacg gttgtgccgg 4080
cggcggcagt gcctgggtag ctcacgcgct gcgtgatacg ggactcaaga atgggcagct 4140
cgtacccggc cagcgcctcg gcaacctcac cgccgatgcg cgtgcctttg atcgcccgcg 4200
acacgacaaa ggccgcttgt agccttccat ccgtgacctc aatgcgctgc ttaaccagct 4260
ccaccaggtc ggcggtggcc caaatgtcgt aagggcttgg ctgcaccgga atcagcacga 4320
agtcggctgc cttgatcgcg gacacagcca agtccgccgc ctggggcgct ccgtcgatca 4380
ctacgaagtc gcgccggccg atggccttca cgtcgcggtc aatcgtcggg cggtcgatgc 4440
cgacaacggt tagcggttga tcttcccgca cggccgccca atcgcgggca ctgccctggg 4500
gatcggaatc gactaacaga acatcggccc cggcgagttg cagggcgcgg gctagatggg 4560
ttgcgatggt cgtcttgcct gacccgcctt tctggttaag tacagcgata accttcatgc 4620
gttccccttg cgtatttgtt tatttactca tcgcatcata tacgcagcga ccgcatgacg 4680
caagctgttt tactcaaata cacatcacct ttttagatga tcagtgattt tgtgccgagc 4740
tgccggtcgg ggagctgttg gctggctggt ggcaggatat attgtggtgt aaacaaattg 4800
acgcttagac aacttaataa cacattgcgg acgtctttaa tgtactgaat ttagttactg 4860
atcactgatt aagtactgat aaatttaatt aacagatctc aactttgtat agaaaagttg 4920
atttaaatga attcaagctt ttaattaact tagccactgc aacaagttct tgaaccttag 4980
cacaatcata ttgtgcatgc acttgtttat tgcaaagaat ggtgcgtagg gaacacgcat 5040
gatttttgaa ttgctggcac ataattttat cattagaaac tggaatgcaa catgtaccct 5100
ttgtcatggt ttctttccga gacattgcac tgtttttttt aatcctatca ttatcataat 5160
gccaagaact ggtcaccaac cagcattttg catcatggtt agttgagctg tccccatgta 5220
tcaataggtg cattgtattg gtccaaaata taaatgcagt ggatgcaacc tatctcatgg 5280
ccgtcaacaa aagaaatcaa aagggaaatg caccatctta tatctccagt ttatatgaac 5340
agattggata agatcataag atcaagtggt ttatattatt ttgaggaata taacatggat 5400
tcatcctaat cactcgtcta ggcagtatgt gtattcatga tggatatggt actatactac 5460
ggagtttttt cttcacaaaa taacctgtta ttttgacctc caaccaaaca cgaattatac 5520
caaaaattgg gttatttcat ctatagtaca actctattat aaacatgcag taaattatcc 5580
tacacatata ccaaaattca agtgtaataa tcctaataca cagacttaaa aaacaaacta 5640
tttccttttt aagaaaagga aaaccatttt tttaacggaa ggaaaacaaa ttcgggtcaa 5700
ggcggaagcc agcgcgccac cccacgtcag cgaatacgga ggcgcggggt tgacggcgtc 5760
acccggtcct aacggcgacc aacaaaccag ccagaagaaa ttacagtaaa aaaaagtaaa 5820
ttgcactttg atccaccttt tattacccaa gtttcaattt ggaccaccct taaacctatc 5880
ttttcaaatt gggccgggtt gtggtttgga ctaccatgaa caacttttcg tcatgtctaa 5940
cttccctttc ggcaaacata tgaaccatat atagaggaga tcggccgtat actagagctg 6000
atgtgtttaa ggtcgttgat tgcacgagaa aaaaaaaatc caaatcgcaa caatagcaaa 6060
tttatctagt tcaaagtgaa aagatatgtt taaaggtagt ccaaagtaaa acttaggggc 6120
tgtttggttc ccagccatac tttaccatta cttgccaaca aaagttgcca caccttgtct 6180
aaggtgaggt gatcaaattg ttagccacaa cttactaagc ctaagggaat cttgccacac 6240
ttttttgagc cattgacacg tgggacttaa tttgttagag ggaaatcttg ccacaactgt 6300
ggctacaacc aaacacctgt caaatttgcc taaccttagg cgtggcaaac tgtggcaaag 6360
tgtggcttac aaccaaacac acccttagat aataaaatgt ggtccaaagc gtaattcact 6420
aaaaaaaaat caacgagacg tgtaccaaac ggagacaaac ggcatcttct cgaaatttcc 6480
caaccgctcg ctcgcccgcc tcgtcttccc ggaaaccgcg gtggtttcag cgtggcggat 6540
tctccaagca gacggagacg tcacggcacg ggactcctcc caccacccaa ccgccataaa 6600
taccagcccc ctcatctcct ctcctcgcat cagctccacc cccgaaaaat ttctccccaa 6660
tctcgcgagg ctctcgtcgt cgaatcgaat cctctcgcgt cctcaagctt ggcatccagg 6720
tacggatccg cgtcccatct ccctcacccc ccgtgttctt cgtgcctgct tctgggtcag 6780
atctgggtgg attcgcggtt gttggatgtg gggggctgtg tttatttgtc ggtggatctg 6840
gttgtctgga tctgcgtttt ctctgtcgta gttagcggat ctgatgaaat gtttagtgtt 6900
cgtgtatact ggtatggtgg atctggtcct aggatgcgtg gaatggatat atgtaggcga 6960
attggaggat ttattttgtg aattttgctg aaatgatagt tctaaacact ggatctgacc 7020
tcgggatgct gttaaatgtg gaaatcatgg tcgatgctgt catgaacatg gtgttcttat 7080
ggtagatctg agcaatgtat gtttcaaaat tgtttgtcac atggaaatgc tatggttcta 7140
gatgcaatag aatgatacat gccgagatcc cctctagttg atatgataga tcatgatgtt 7200
ttacagctat gtcatatgaa tatgttcatt tgttaccgat gtatttggat ctacttaaca 7260
tttccaaagc acgccgcgtt ctaattctag atctggtagt catgtttgta cacgtcaccc 7320
acctaataca aatacatatg tctagtgttt ggtgacactg cccgtcagat ctgttttttc 7380
cagatctgtg gaacaaatac tccacgcatg tatggtagtt ttgaaacgat cttgtatctt 7440
ccattgttgt agtaacaact aaataaagta caattgttca attattggga atcgtatttt 7500
ctgtagtgcc gatgtacagc atattcatag atgtctattt aggaactcaa attttaaatt 7560
gaggactagt tatttattgt gggtcagtct tttgaattgt gttatcttgc tgtactggcg 7620
cgccaccatg gccaccgccg ccgccgcgtc taccgcgctc actggcgcca ctaccgctgc 7680
gcccaaggcg aggcgccggg cgcacctcct ggccacccgc cgcgccctcg ccgcgcccat 7740
caggtgctca gcggcgtcac ccgccatgcc gatggctccc ccggccaccc cgctccggcc 7800
gtggggcccc accgatcccc gcaagggcgc cgacatcctc gtcgagtccc tcgagcgctg 7860
cggcgtccgc gacgtcttcg cctaccccgg cggcacgtcc atggagatcc accaggcact 7920
cacccgctcc cccgtcatcg ccaaccacct cttccgccac gagcaagggg aggcctttgc 7980
ggcctccggc tacgcgcgct cctcgggccg cgtcggcgtc tgcatcgcca cctccggccc 8040
cggcgccacc aaccttgtct ccgcgctcgc cgacgcgctg ctcgattccg tccccatggt 8100
cgccatcacg ggacaggtgc cgcgacgcat gattggcacc gacgccttcc aggagacgcc 8160
catcgtcgag gtcacccgct ccatcaccaa gcacaactac ctggtcctcg acgtcgacga 8220
catcccccgc gtcgtgcagg aggctttctt cctcgcctcc tctggtcgac cggggccggt 8280
gcttgtcgac atccccaagg acatccagca gcagatggcg gtgcctgtct gggacaagcc 8340
catgagtctg cctgggtaca ttgcgcgcct tcccaagccc cctgcgactg agttgcttga 8400
gcaggtgctg cgtcttgttg gtgaatcccg gcgccctgtt ctttatgttg gcggtggctg 8460
cgcagcatct ggtgaggagt tgcgacgctt tgtggagctg actggaatcc cggtcacaac 8520
tactcttatg ggcctcggca acttccccag cgacgaccca ctgtctctgc gcatgctagg 8580
tatgcatggc acggtgtatg caaattatgc agtggataag gccgatctgt tgcttgcact 8640
tggtgtgcgg tttgatgatc gtgtgacagg gaagattgag gcttttgcaa gcagggctaa 8700
gattgtgcac gttgatattg atccggctga gattggcaag aacaagcagc cacatgtgtc 8760
catctgtgca gatgttaagc ttgctttgca gggcatgaat gctcttcttg aaggaagcac 8820
atcaaagaag agctttgact ttggctcatg gaacgatgag ttggatcagc agaagaggga 8880
attccccctt gggtataaaa catctaatga ggagatccag ccacaatatg ctattcaggt 8940
tcttgatgag ctgacgaaag gcgaggccat catcggcaca ggtgttgggc agcaccagat 9000
gtgggcggca cagtactaca cttacaagcg gccaaggcag tggttgtctt cagctggtct 9060
tggggctatg ggatttggtt tgccggctgc tgctggtgct tctgtggcca acccaggtgt 9120
tactgttgtt gacatcgatg gagatggtag ctttctcatg aacgttcagg agctagctat 9180
gatccgaatt gagaacctcc cggtgaaggt ctttgtgcta aacaaccagc acctggggat 9240
ggtggtgcag tgggaggaca ggttctataa ggccaacaga gcgcacacat acttgggaaa 9300
cccagagaat gaaagtgaga tatatccaga tttcgtgacg atcgccaaag ggttcaacat 9360
tccagcggtc cgtgtgacaa agaagaacga agtccgcgca gcgataaaga agatgctcga 9420
gactccaggg ccgtacctct tggatataat cgtcccacac caggagcatg tgttgcctat 9480
gatccctaat ggtggggctt tcaaggatat gatcctggat ggtgatggca ggactgtgta 9540
ctagcctgca ggcctaggat cgttcaaaca tttggcaata aagtttctta agattgaatc 9600
ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt aagcatgtaa 9660
taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt agagtcccgc 9720
aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag gataaattat 9780
cgcgcgcggt gtcatctatg ttactagatc ggccggccgt ttaaacagcc tgcttttttg 9840
tacaaacttg atttaaatga attcaagctt ttaattaagc atgcgagctc ggcgcgccgg 9900
taccgcgatc gcggatcatg aaccaacggc ctggctgtat ttggtggttg tgtagggaga 9960
tggggagaag aaaagcccga ttctcttcgc tgtgatgggc tggatgcatg cgggggagcg 10020
ggaggcccaa gtacgtgcac ggtgagcggc ccacagggcg agtgtgagcg cgagaggcgg 10080
gaggaacagt ttagtaccac attgcccagc taactcgaac gcgaccaact tataaacccg 10140
cgcgctgtcg cttgtgtgca ttgagtgcta tgctgaggtt ttagagctag aaatagcaag 10200
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgctctgttc 10260
ctcgtgctgg acaagtgtgg tttccagatt ctgcaaccaa gactgcgcag gcattgctgg 10320
acttcaaccg tgaaggatta cctctgttca tcctcgctaa ctggagaggc ttctctggtg 10380
gacaaagaga tctctttgaa ggaattcttc aggctggctc gactattgtt gagaacctta 10440
ggacatacaa tcagcctgcc tttgtctaca ttcccatggc tgcagagcta cgaggagggg 10500
cttgggttgt ggttgatagc aagataaacc cagaccgcat tgagtgctat gctgagagaa 10560
ctgcaaaatc caatgttctg gaaccgcaag ggttaattga gatcaagttc aggtcagagg 10620
aactccagga ttgcatgagt cggcttgacc caacattaat tgatctgaaa gcaaaactcg 10680
aagtagcaaa taaaaatgga agtgctgaca caaaatcgct tcaagaaaat atagaagctc 10740
gaacaaaaca gttgatgcct ctatatactc agattgcgat acggtttgct gaattgcatg 10800
atacatccct cagaatggct gcgaaaggtg tgattaagaa agttgtggac tgggaagaat 10860
cacgatcttt cttttttttg cggccgcccc gggcctgcag gggatcccga tcgggccggc 10920
cgtttaaacc cactttgtac aagaaagctg ggtatttaaa tgaattcaag cttttaatta 10980
atgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat tgcatgtcta 11040
agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc agtttatcta 11100
tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt actacaataa 11160
tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa ggacaattga 11220
gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt tctccttttt 11280
ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca tccatttagg 11340
gtttagggtt aatggttttt atagactaat ttttttagta catctatttt attctatttt 11400
agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat agtttagata 11460
taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa 11520
aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga 11580
cgagtctaac ggacaccaac cagcgaacca gcagcgtcgc gtcgggccaa gcgaagcaga 11640
cggcacggca tctctgtcgc tgcctctgga cccctctcga gagttccgct ccaccgttgg 11700
acttgctccg ctgtcggcat ccagaaattg cgtggcggag cggcagacgt gagccggcac 11760
ggcaggcggc ctcctcctcc tctcacggca ccggcagcta cgggggattc ctttcccacc 11820
gctccttcgc tttcccttcc tcgcccgccg taataaatag acaccccctc cacaccctct 11880
ttccccaacc tcgtgttgtt cggagcgcac acacacacaa ccagatctcc cccaaatcca 11940
cccgtcggca cctccgcttc aaggtacgcc gctcgtcctc cccccccccc cccctctcta 12000
ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat 12060
gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg 12120
acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct 12180
gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc 12240
atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg 12300
tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt 12360
tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg 12420
tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat 12480
ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg 12540
ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag 12600
tagaatactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc 12660
atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac 12720
atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat 12780
gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttatttcgat 12840
cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc 12900
ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg 12960
gtgttacttc tgcagggcgc gccaccatgg ctcctaagaa gaagcggaag gttggtattc 13020
acggggtgcc tgcggctgac aagaagtact ccatcggcct cgacatcggc accaacagcg 13080
tcggctgggc ggtgatcacc gacgagtaca aggtcccgtc caagaagttc aaggtcctgg 13140
gcaacaccga ccgccactcc atcaagaaga acctcatcgg cgccctcctc ttcgactccg 13200
gcgagacggc ggaggcgacc cgcctcaagc gcaccgcccg ccgccgctac acccgccgca 13260
agaaccgcat ctgctacctc caggagatct tctccaacga gatggcgaag gtcgacgact 13320
ccttcttcca ccgcctcgag gagtccttcc tcgtggagga ggacaagaag cacgagcgcc 13380
accccatctt cggcaacatc gtcgacgagg tcgcctacca cgagaagtac cccactatct 13440
accaccttcg taagaagctt gttgactcta ctgataaggc tgatcttcgt ctcatctacc 13500
ttgctctcgc tcacatgatc aagttccgtg gtcacttcct tatcgagggt gaccttaacc 13560
ctgataactc cgacgtggac aagctcttca tccagctcgt ccagacctac aaccagctct 13620
tcgaggagaa ccctatcaac gcttccggtg tcgacgctaa ggcgatcctt tccgctaggc 13680
tctccaagtc caggcgtctc gagaacctca tcgcccagct ccctggtgag aagaagaacg 13740
gtcttttcgg taacctcatc gctctctccc tcggtctgac ccctaacttc aagtccaact 13800
tcgacctcgc tgaggacgct aagcttcagc tctccaagga tacctacgac gatgatctcg 13860
acaacctcct cgctcagatt ggagatcagt acgctgatct cttccttgct gctaagaacc 13920
tctccgatgc tatcctcctt tcggatatcc ttagggttaa cactgagatc actaaggctc 13980
ctctttctgc ttccatgatc aagcgctacg acgagcacca ccaggacctc accctcctca 14040
aggctcttgt tcgtcagcag ctccccgaga agtacaagga gatcttcttc gaccagtcca 14100
agaacggcta cgccggttac attgacggtg gagctagcca ggaggagttc tacaagttca 14160
tcaagccaat ccttgagaag atggatggta ctgaggagct tctcgttaag cttaaccgtg 14220
aggacctcct taggaagcag aggactttcg ataacggctc tatccctcac cagatccacc 14280
ttggtgagct tcacgccatc cttcgtaggc aggaggactt ctaccctttc ctcaaggaca 14340
accgtgagaa gatcgagaag atccttactt tccgtattcc ttactacgtt ggtcctcttg 14400
ctcgtggtaa ctcccgtttc gcttggatga ctaggaagtc cgaggagact atcacccctt 14460
ggaacttcga ggaggttgtt gacaagggtg cttccgccca gtccttcatc gagcgcatga 14520
ccaacttcga caagaacctc cccaacgaga aggtcctccc caagcactcc ctcctctacg 14580
agtacttcac ggtctacaac gagctcacca aggtcaagta cgtcaccgag ggtatgcgca 14640
agcctgcctt cctctccggc gagcagaaga aggctatcgt tgacctcctc ttcaagacca 14700
accgcaaggt caccgtcaag cagctcaagg aggactactt caagaagatc gagtgcttcg 14760
actccgtcga gatcagcggc gttgaggacc gtttcaacgc ttctctcggc acctaccacg 14820
atctcctcaa gatcatcaag gacaaggact tcctcgacaa cgaggagaac gaggacatcc 14880
tcgaggacat cgtcctcact cttactctct tcgaggatag ggagatgatc gaggagaggc 14940
tcaagactta cgctcatctc ttcgatgaca aggttatgaa gcagctcaag cgtcgccgtt 15000
acaccggttg gggtaggctc tcccgcaagc tcatcaacgg tatcagggat aagcagagcg 15060
gcaagactat cctcgacttc ctcaagtctg atggtttcgc taacaggaac ttcatgcagc 15120
tcatccacga tgactctctt accttcaagg aggatattca gaaggctcag gtgtccggtc 15180
agggcgactc tctccacgag cacattgcta accttgctgg ttcccctgct atcaagaagg 15240
gcatccttca gactgttaag gttgtcgatg agcttgtcaa ggttatgggt cgtcacaagc 15300
ctgagaacat cgtcatcgag atggctcgtg agaaccagac tacccagaag ggtcagaaga 15360
actcgaggga gcgcatgaag aggattgagg agggtatcaa ggagcttggt tctcagatcc 15420
ttaaggagca ccctgtcgag aacacccagc tccagaacga gaagctctac ctctactacc 15480
tccagaacgg tagggatatg tacgttgacc aggagctcga catcaacagg ctttctgact 15540
acgacgtcga ccacattgtt cctcagtctt tccttaagga tgactccatc gacaacaagg 15600
tcctcacgag gtccgacaag aacaggggta agtcggacaa cgtcccttcc gaggaggttg 15660
tcaagaagat gaagaactac tggaggcagc ttctcaacgc taagctcatt acccagagga 15720
agttcgacaa cctcacgaag gctgagaggg gtggcctttc cgagcttgac aaggctggtt 15780
tcatcaagag gcagcttgtt gagacgaggc agattaccaa gcacgttgct cagatcctcg 15840
attctaggat gaacaccaag tacgacgaga acgacaagct catccgcgag gtcaaggtga 15900
tcaccctcaa gtccaagctc gtctccgact tccgcaagga cttccagttc tacaaggtcc 15960
gcgagatcaa caactaccac cacgctcacg atgcttacct taacgctgtc gttggcaccg 16020
ctcttatcaa gaagtaccct aagcttgagt ccgagttcgt ctacggtgac tacaaggtct 16080
acgacgttcg taagatgatc gccaagtccg agcaggagat cggcaaggcc accgccaagt 16140
acttcttcta ctccaacatc atgaacttct tcaagaccga gatcaccctc gccaacggcg 16200
agatccgcaa gcgccctctt atcgagacga acggtgagac tggtgagatc gtttgggaca 16260
agggtcgcga cttcgctact gttcgcaagg tcctttctat gcctcaggtt aacatcgtca 16320
agaagaccga ggtccagacc ggtggcttct ccaaggagtc tatccttcca aagagaaact 16380
cggacaagct catcgctagg aagaaggatt gggaccctaa gaagtacggt ggtttcgact 16440
cccctactgt cgcctactcc gtcctcgtgg tcgccaaggt ggagaagggt aagtcgaaga 16500
agctcaagtc cgtcaaggag ctcctcggca tcaccatcat ggagcgctcc tccttcgaga 16560
agaacccgat cgacttcctc gaggccaagg gctacaagga ggtcaagaag gacctcatca 16620
tcaagctccc caagtactct cttttcgagc tcgagaacgg tcgtaagagg atgctggctt 16680
ccgctggtga gctccagaag ggtaacgagc ttgctcttcc ttccaagtac gtgaacttcc 16740
tctacctcgc ctcccactac gagaagctca agggttcccc tgaggataac gagcagaagc 16800
agctcttcgt ggagcagcac aagcactacc tcgacgagat catcgagcag atctccgagt 16860
tctccaagcg cgtcatcctc gctgacgcta acctcgacaa ggtcctctcc gcctacaaca 16920
agcaccgcga caagcccatc cgcgagcagg ccgagaacat catccacctc ttcacgctca 16980
cgaacctcgg cgcccctgct gctttcaagt acttcgacac caccatcgac aggaagcgtt 17040
acacgtccac caaggaggtt ctcgacgcta ctctcatcca ccagtccatc accggtcttt 17100
acgagactcg tatcgacctt tcccagcttg gtggtgataa gcgtcctgct gccaccaaaa 17160
aggccggaca ggctaagaaa aagaagtagc ctgcaggtcc tgctttaatg agatatgcga 17220
gacgcctatg atcgcatgat atttgctttc aattctgttg tgcacgttgt aaaaaacctg 17280
agcatgtgta gctcagatcc ttaccgccgg tttcggttca ttctaatgaa tatatcaccc 17340
gttactatcg tatttttatg aataatattc tccgttcaat ttactgattg taccctacta 17400
cttatatgta caatattaaa atgaaaacaa tatattgtgc tgaataggtt tatagcgaca 17460
tctatgatag agcgccacaa taacaaacaa ttgcgtttta ttattacaaa tccaatttta 17520
aaaaaagcgg cagaaccggt caaacctaaa agactgatta cataaatctt attcaaattt 17580
caaaagtgcc ccaggggcta gtatctacga cacaccgagc ggcgaactaa taacgctcac 17640
tgaagggaac tccggttccc cgccggcgcg catgggtgag attccttgaa gttgagtatt 17700
ggccgtccgc tctaccgaaa gttacgggca ccattcaacc cggtccagca cggcggccgg 17760
gtaaccgact tgctgccccg agaattatgc agcatttttt tggtgtatgt gggccccaaa 17820
tgaagtgcag gtcaaacctt gacagtgacg acaaatcgtt gggcgggtcc agggcgaatt 17880
ttgcgacaac atgtcgaggc tcagcaggcc ggccgtttaa accaacttta 17930
<210> 67
<211> 3734
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector CC019
<400> 67
cgcggatcat gaaccaacgg cctggctgta tttggtggtt gtgtagggag atggggagaa 60
gaaaagcccg attctcttcg ctgtgatggg ctggatgcat gcgggggagc gggaggccca 120
agtacgtgca cggtgagcgg cccacagggc gagtgtgagc gcgagaggcg ggaggaacag 180
tttagtacca cattgcccag ctaactcgaa cgcgaccaac ttataaaccc gcgcgctgtc 240
gcttgtgtga ctgcaaaagg caatgttcgt tttagagcta gaaatagcaa gttaaaataa 300
ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctctgtt cctcgtgctg 360
gacaagtgtg gtttccagat tctgcaacca agactgcgca ggcattgctg gacttcaacc 420
gtgaaggatt acctctgttc atcctcgcta actggagagg cttctctggt ggacaaagag 480
atctctttga aggaattctt caggctggct cgactattgt tgagaacctt aggacataca 540
atcagcctgc ctttgtctac attcccatgg ctgcagagct acgaggaggg gcttgggttg 600
tggttgatag caagataaac ccagaccgca ttgagtgcta tgctgagagg actgcaaaat 660
ccaatgttct cgaaccgcaa gggttaattg agatcaagtt caggtcagag gaactccagg 720
attgcatgag tcggcttgac ccaacattaa ttgatctgaa agcaaaactc gaagtagcaa 780
ataaaaatgg aagtgctgac acaaaatcgc ttcaagaaaa tatagaagct cgaacaaaac 840
agttgatgcc tctatatact cagattgcga tacggtttgc tgaattgcat gatacatccc 900
tcagaatggc tgcgaaaggt gtgattaaga aagttgtgga ctgggaagaa tcacgatctt 960
tctttttttt gcggccgccc cgggcctgca ggggatcccg atcgggccgg ccgtttaaac 1020
ccactttgta caagaaagtt gaacgagaaa cgtaaaatga tataaatatc aatatattaa 1080
attagatttt gcataaaaaa cagactacat aatactgtaa aacacaacat atgcagtcac 1140
tatgaaccaa ctacttagat ggtattagtg acctgtactg ggcctcatgg gccttccgct 1200
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaacat ggtcatagct 1260
gtttccttgc gtattgggcg ctctccgctt cctcgctcac tgactcgctg cgctcggtcg 1320
ttcgggtaaa gcctggggtg cctaatgagc aaaaggccag caaaaggcca ggaaccgtaa 1380
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 1440
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 1500
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 1560
cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 1620
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 1680
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 1740
gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 1800
agagttcttg aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg 1860
cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 1920
aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 1980
aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 2040
ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 2100
aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 2160
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 2220
agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 2280
cagtgctgca atgataccgc gagaaccacg ctcaccggct ccagatttat cagcaataaa 2340
ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 2400
gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 2460
cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 2520
cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 2580
ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 2640
catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 2700
tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 2760
ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 2820
catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 2880
cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 2940
cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 3000
acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 3060
ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 3120
tccgcgcaca tttccccgaa aagtgccacc taaattgtaa gcgttaatat tttgttaaaa 3180
ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga aatcggcaaa 3240
atcccttata aatcaaaaga atagaccgag atagggttga gtggccgcta cagggcgctc 3300
ccattcgcca ttcaggctgc gcaactgttg ggaagggcgt ttcggtgcgg gcctcttcgc 3360
tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 3420
ggttttccca gtcacgacgt tgtaaaacga cggccagtga gcgcgacgta atacgactca 3480
ctatagggcg aattggcgga aggccgtcaa ggccgcatta caggtcacta ataccatcta 3540
agtagttggt tcatagtgac tgcatatgtt gtgttttaca gtattatgta gtctgttttt 3600
tatgcaaaat ctaatttaat atattgatat ttatatcatt ttacgtttct cgttcaactt 3660
ttttgtacaa acttgattta aatgaattca agcttttaat taagcatgcg agctcggcgc 3720
gccggtaccg cgat 3734
<210> 68
<211> 17930
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector RLW138
<400> 68
ttatacatag ttgataattc actgggccgg ccgtttaaac ttagttacta atcagtgatc 60
agattgtcgt ttcccgcctt cactttaaac tatcagtgtt tgacaggata tattggcggg 120
taaacctaag agaaaagagc gtttattaga ataatcggat atttaaaagg gcgtgaaaag 180
gtttatccgt tcgtccattt gtatgtcaat attggggggg ggggaaagcc acgttgtgtc 240
tcaaaatctc tgatgttaca ttgcacaaga taaaaatata tcatcatgaa caataaaact 300
gtctgcttac ataaacagta atacaagggg tgttcgccac catgagccat atccagcgtg 360
aaacctcgtg ctcccgcccg cgcctcaatt ccaatatgga tgccgacctt tatggctaca 420
agtgggcgcg cgacaacgtc ggccagtcgg gcgcgaccat ttatcggctt tatggcaaac 480
ccgatgcccc ggaactgttc ctgaagcacg gcaaaggcag cgtcgcaaac gatgtcaccg 540
atgagatggt ccgcctgaac tggcttaccg agttcatgcc gctgccgacg attaagcatt 600
tcatccgtac cccggacgat gcctggctct tgaccacggc cattccgggc aaaacggcct 660
ttcaggtcct tgaagagtac ccggactccg gtgagaatat cgtggacgcc ctcgcggtct 720
tcctccgccg tttgcatagc atccccgtgt gcaactgccc cttcaactcg gaccgggttt 780
tccgcctggc acaggcccag tcgcgcatga ataacggcct cgttgacgcg agcgatttcg 840
acgatgaacg gaatggctgg ccggtggaac aggtttggaa ggaaatgcac aaactgcttc 900
cgttctcgcc ggattcggtg gtcacgcatg gtgatttttc cctggataat ctgatctttg 960
acgagggcaa gctgatcggc tgcatcgacg tgggtcgcgt cggtatcgcc gaccgctatc 1020
aggacctggc gatcttgtgg aattgcctcg gcgagttctc gccctcgctc cagaagcgcc 1080
tgttccagaa gtacggcatc gacaacccgg atatgaacaa gctccagttc cacctcatgc 1140
tggacgaatt tttttgaaca gaattggtta attggttgta acactggcag agcattacgc 1200
tgacttgacg ggacggcggc tttgttgaat aaatcgaact tttgctgagt tgaaggatcg 1260
atgagttgaa ggaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc 1320
gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg 1380
atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa 1440
atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc 1500
ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt 1560
gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa 1620
cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc 1680
tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc 1740
cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct 1800
ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat 1860
gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc 1920
tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg 1980
ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc 2040
gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc 2100
atctgtgcgg tatttcacac cgcataggcc gcgataggcc gacgcgaagc ggcggggcgt 2160
agggagcgca gcgaccgaag ggtaggcgct ttttgcagct cttcggctgt gcgctggcca 2220
gacagttatg cacaggccag gcgggtttta agagttttaa taagttttaa agagttttag 2280
gcggaaaaat cgcctttttt ctcttttata tcagtcactt acatgtgtga ccggttccca 2340
atgtacggct ttgggttccc aatgtacggg ttccggttcc caatgtacgg ctttgggttc 2400
ccaatgtacg tgctatccac aggaaagaga ccttttcgac ctttttcccc tgctagggca 2460
atttgcccta gcatctgctc cgtacattag gaaccggcgg atgcttcgcc ctcgatcagg 2520
ttgcggtagc gcatgactag gatcgggcca gcctgccccg cctcctcctt caaatcgtac 2580
tccggcaggt catttgaccc gatcagcttg cgcacggtga aacagaactt cttgaactct 2640
ccggcgctgc cactgcgttc gtagatcgtc ttgaacaacc atctggcttc tgccttgcct 2700
gcggcgcggc gtgccaggcg gtagagaaaa cggccgatgc cggggtcgat caaaaagtaa 2760
tcggggtgaa ccgtcagcac gtccgggttc ttgccttctg tgatctcgcg gtacatccaa 2820
tcagcaagct cgatctcgat gtactccggc cgcccggttt cgctctttac gatcttgtag 2880
cggctaatca aggcttcacc ctcggatacc gtcaccaggc ggccgttctt ggccttcttg 2940
gtacgctgca tggcaacgtg cgtggtgttt aaccgaatgc aggtttctac caggtcgtct 3000
ttctgctttc cgccatcggc tcgccggcag aacttgagta cgtccgcaac gtgtggacgg 3060
aacacgcggc cgggcttgtc tcccttccct tcccggtatc ggttcatgga ttcggttaga 3120
tgggaaaccg ccatcagtac caggtcgtaa tcccacacac tggccatgcc ggcggggcct 3180
gcggaaacct ctacgtgccc gtctggaagc tcgtagcgga tcacctcgcc agctcgtcgg 3240
tcacgcttcg acagacggaa aacggccacg tccatgatgc tgcgactatc gcgggtgccc 3300
acgtcataga gcatcggaac gaaaaaatct ggttgctcgt cgcccttggg cggcttccta 3360
atcgacggcg caccggctgc cggcggttgc cgggattctt tgcggattcg atcagcggcc 3420
ccttgccacg attcaccggg gcgtgcttct gcctcgatgc gttgccgctg ggcggcctgc 3480
gcggccttca acttctccac caggtcatca cccagcgccg cgccgatttg taccgggccg 3540
gatggtttgc gaccgctcac gccgattcct cgggcttggg ggttccagtg ccattgcagg 3600
gccggcagac aacccagccg cttacgcctg gccaaccgcc cgttcctcca cacatggggc 3660
attccacggc gtcggtgcct ggttgttctt gattttccat gccgcctcct ttagccgcta 3720
aaattcatct actcatttat tcatttgctc atttactctg gtagctgcgc gatgtattca 3780
gatagcagct cggtaatggt cttgccttgg cgtaccgcgt acatcttcag cttggtgtga 3840
tcctccgccg gcaactgaaa gttgacccgc ttcatggctg gcgtgtctgc caggctggcc 3900
aacgttgcag ccttgctgct gcgtgcgctc ggacggccgg cacttagcgt gtttgtgctt 3960
ttgctcattt tctctttacc tcattaactc aaatgagttt tgatttaatt tcagcggcca 4020
gcgcctggac ctcgcgggca gcgtcgccct cgggttctga ttcaagaacg gttgtgccgg 4080
cggcggcagt gcctgggtag ctcacgcgct gcgtgatacg ggactcaaga atgggcagct 4140
cgtacccggc cagcgcctcg gcaacctcac cgccgatgcg cgtgcctttg atcgcccgcg 4200
acacgacaaa ggccgcttgt agccttccat ccgtgacctc aatgcgctgc ttaaccagct 4260
ccaccaggtc ggcggtggcc caaatgtcgt aagggcttgg ctgcaccgga atcagcacga 4320
agtcggctgc cttgatcgcg gacacagcca agtccgccgc ctggggcgct ccgtcgatca 4380
ctacgaagtc gcgccggccg atggccttca cgtcgcggtc aatcgtcggg cggtcgatgc 4440
cgacaacggt tagcggttga tcttcccgca cggccgccca atcgcgggca ctgccctggg 4500
gatcggaatc gactaacaga acatcggccc cggcgagttg cagggcgcgg gctagatggg 4560
ttgcgatggt cgtcttgcct gacccgcctt tctggttaag tacagcgata accttcatgc 4620
gttccccttg cgtatttgtt tatttactca tcgcatcata tacgcagcga ccgcatgacg 4680
caagctgttt tactcaaata cacatcacct ttttagatga tcagtgattt tgtgccgagc 4740
tgccggtcgg ggagctgttg gctggctggt ggcaggatat attgtggtgt aaacaaattg 4800
acgcttagac aacttaataa cacattgcgg acgtctttaa tgtactgaat ttagttactg 4860
atcactgatt aagtactgat aaatttaatt aacagatctc aactttgtat agaaaagttg 4920
atttaaatga attcaagctt ttaattaact tagccactgc aacaagttct tgaaccttag 4980
cacaatcata ttgtgcatgc acttgtttat tgcaaagaat ggtgcgtagg gaacacgcat 5040
gatttttgaa ttgctggcac ataattttat cattagaaac tggaatgcaa catgtaccct 5100
ttgtcatggt ttctttccga gacattgcac tgtttttttt aatcctatca ttatcataat 5160
gccaagaact ggtcaccaac cagcattttg catcatggtt agttgagctg tccccatgta 5220
tcaataggtg cattgtattg gtccaaaata taaatgcagt ggatgcaacc tatctcatgg 5280
ccgtcaacaa aagaaatcaa aagggaaatg caccatctta tatctccagt ttatatgaac 5340
agattggata agatcataag atcaagtggt ttatattatt ttgaggaata taacatggat 5400
tcatcctaat cactcgtcta ggcagtatgt gtattcatga tggatatggt actatactac 5460
ggagtttttt cttcacaaaa taacctgtta ttttgacctc caaccaaaca cgaattatac 5520
caaaaattgg gttatttcat ctatagtaca actctattat aaacatgcag taaattatcc 5580
tacacatata ccaaaattca agtgtaataa tcctaataca cagacttaaa aaacaaacta 5640
tttccttttt aagaaaagga aaaccatttt tttaacggaa ggaaaacaaa ttcgggtcaa 5700
ggcggaagcc agcgcgccac cccacgtcag cgaatacgga ggcgcggggt tgacggcgtc 5760
acccggtcct aacggcgacc aacaaaccag ccagaagaaa ttacagtaaa aaaaagtaaa 5820
ttgcactttg atccaccttt tattacccaa gtttcaattt ggaccaccct taaacctatc 5880
ttttcaaatt gggccgggtt gtggtttgga ctaccatgaa caacttttcg tcatgtctaa 5940
cttccctttc ggcaaacata tgaaccatat atagaggaga tcggccgtat actagagctg 6000
atgtgtttaa ggtcgttgat tgcacgagaa aaaaaaaatc caaatcgcaa caatagcaaa 6060
tttatctagt tcaaagtgaa aagatatgtt taaaggtagt ccaaagtaaa acttaggggc 6120
tgtttggttc ccagccatac tttaccatta cttgccaaca aaagttgcca caccttgtct 6180
aaggtgaggt gatcaaattg ttagccacaa cttactaagc ctaagggaat cttgccacac 6240
ttttttgagc cattgacacg tgggacttaa tttgttagag ggaaatcttg ccacaactgt 6300
ggctacaacc aaacacctgt caaatttgcc taaccttagg cgtggcaaac tgtggcaaag 6360
tgtggcttac aaccaaacac acccttagat aataaaatgt ggtccaaagc gtaattcact 6420
aaaaaaaaat caacgagacg tgtaccaaac ggagacaaac ggcatcttct cgaaatttcc 6480
caaccgctcg ctcgcccgcc tcgtcttccc ggaaaccgcg gtggtttcag cgtggcggat 6540
tctccaagca gacggagacg tcacggcacg ggactcctcc caccacccaa ccgccataaa 6600
taccagcccc ctcatctcct ctcctcgcat cagctccacc cccgaaaaat ttctccccaa 6660
tctcgcgagg ctctcgtcgt cgaatcgaat cctctcgcgt cctcaagctt ggcatccagg 6720
tacggatccg cgtcccatct ccctcacccc ccgtgttctt cgtgcctgct tctgggtcag 6780
atctgggtgg attcgcggtt gttggatgtg gggggctgtg tttatttgtc ggtggatctg 6840
gttgtctgga tctgcgtttt ctctgtcgta gttagcggat ctgatgaaat gtttagtgtt 6900
cgtgtatact ggtatggtgg atctggtcct aggatgcgtg gaatggatat atgtaggcga 6960
attggaggat ttattttgtg aattttgctg aaatgatagt tctaaacact ggatctgacc 7020
tcgggatgct gttaaatgtg gaaatcatgg tcgatgctgt catgaacatg gtgttcttat 7080
ggtagatctg agcaatgtat gtttcaaaat tgtttgtcac atggaaatgc tatggttcta 7140
gatgcaatag aatgatacat gccgagatcc cctctagttg atatgataga tcatgatgtt 7200
ttacagctat gtcatatgaa tatgttcatt tgttaccgat gtatttggat ctacttaaca 7260
tttccaaagc acgccgcgtt ctaattctag atctggtagt catgtttgta cacgtcaccc 7320
acctaataca aatacatatg tctagtgttt ggtgacactg cccgtcagat ctgttttttc 7380
cagatctgtg gaacaaatac tccacgcatg tatggtagtt ttgaaacgat cttgtatctt 7440
ccattgttgt agtaacaact aaataaagta caattgttca attattggga atcgtatttt 7500
ctgtagtgcc gatgtacagc atattcatag atgtctattt aggaactcaa attttaaatt 7560
gaggactagt tatttattgt gggtcagtct tttgaattgt gttatcttgc tgtactggcg 7620
cgccaccatg gccaccgccg ccgccgcgtc taccgcgctc actggcgcca ctaccgctgc 7680
gcccaaggcg aggcgccggg cgcacctcct ggccacccgc cgcgccctcg ccgcgcccat 7740
caggtgctca gcggcgtcac ccgccatgcc gatggctccc ccggccaccc cgctccggcc 7800
gtggggcccc accgatcccc gcaagggcgc cgacatcctc gtcgagtccc tcgagcgctg 7860
cggcgtccgc gacgtcttcg cctaccccgg cggcacgtcc atggagatcc accaggcact 7920
cacccgctcc cccgtcatcg ccaaccacct cttccgccac gagcaagggg aggcctttgc 7980
ggcctccggc tacgcgcgct cctcgggccg cgtcggcgtc tgcatcgcca cctccggccc 8040
cggcgccacc aaccttgtct ccgcgctcgc cgacgcgctg ctcgattccg tccccatggt 8100
cgccatcacg ggacaggtgc cgcgacgcat gattggcacc gacgccttcc aggagacgcc 8160
catcgtcgag gtcacccgct ccatcaccaa gcacaactac ctggtcctcg acgtcgacga 8220
catcccccgc gtcgtgcagg aggctttctt cctcgcctcc tctggtcgac cggggccggt 8280
gcttgtcgac atccccaagg acatccagca gcagatggcg gtgcctgtct gggacaagcc 8340
catgagtctg cctgggtaca ttgcgcgcct tcccaagccc cctgcgactg agttgcttga 8400
gcaggtgctg cgtcttgttg gtgaatcccg gcgccctgtt ctttatgttg gcggtggctg 8460
cgcagcatct ggtgaggagt tgcgacgctt tgtggagctg actggaatcc cggtcacaac 8520
tactcttatg ggcctcggca acttccccag cgacgaccca ctgtctctgc gcatgctagg 8580
tatgcatggc acggtgtatg caaattatgc agtggataag gccgatctgt tgcttgcact 8640
tggtgtgcgg tttgatgatc gtgtgacagg gaagattgag gcttttgcaa gcagggctaa 8700
gattgtgcac gttgatattg atccggctga gattggcaag aacaagcagc cacatgtgtc 8760
catctgtgca gatgttaagc ttgctttgca gggcatgaat gctcttcttg aaggaagcac 8820
atcaaagaag agctttgact ttggctcatg gaacgatgag ttggatcagc agaagaggga 8880
attccccctt gggtataaaa catctaatga ggagatccag ccacaatatg ctattcaggt 8940
tcttgatgag ctgacgaaag gcgaggccat catcggcaca ggtgttgggc agcaccagat 9000
gtgggcggca cagtactaca cttacaagcg gccaaggcag tggttgtctt cagctggtct 9060
tggggctatg ggatttggtt tgccggctgc tgctggtgct tctgtggcca acccaggtgt 9120
tactgttgtt gacatcgatg gagatggtag ctttctcatg aacgttcagg agctagctat 9180
gatccgaatt gagaacctcc cggtgaaggt ctttgtgcta aacaaccagc acctggggat 9240
ggtggtgcag tgggaggaca ggttctataa ggccaacaga gcgcacacat acttgggaaa 9300
cccagagaat gaaagtgaga tatatccaga tttcgtgacg atcgccaaag ggttcaacat 9360
tccagcggtc cgtgtgacaa agaagaacga agtccgcgca gcgataaaga agatgctcga 9420
gactccaggg ccgtacctct tggatataat cgtcccacac caggagcatg tgttgcctat 9480
gatccctaat ggtggggctt tcaaggatat gatcctggat ggtgatggca ggactgtgta 9540
ctagcctgca ggcctaggat cgttcaaaca tttggcaata aagtttctta agattgaatc 9600
ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt aagcatgtaa 9660
taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt agagtcccgc 9720
aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag gataaattat 9780
cgcgcgcggt gtcatctatg ttactagatc ggccggccgt ttaaacagcc tgcttttttg 9840
tacaaacttg atttaaatga attcaagctt ttaattaagc atgcgagctc ggcgcgccgg 9900
taccgcgatc gcggatcatg aaccaacggc ctggctgtat ttggtggttg tgtagggaga 9960
tggggagaag aaaagcccga ttctcttcgc tgtgatgggc tggatgcatg cgggggagcg 10020
ggaggcccaa gtacgtgcac ggtgagcggc ccacagggcg agtgtgagcg cgagaggcgg 10080
gaggaacagt ttagtaccac attgcccagc taactcgaac gcgaccaact tataaacccg 10140
cgcgctgtcg cttgtgtgac tgcaaaaggc aatgttcgtt ttagagctag aaatagcaag 10200
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgctctgttc 10260
ctcgtgctgg acaagtgtgg tttccagatt ctgcaaccaa gactgcgcag gcattgctgg 10320
acttcaaccg tgaaggatta cctctgttca tcctcgctaa ctggagaggc ttctctggtg 10380
gacaaagaga tctctttgaa ggaattcttc aggctggctc gactattgtt gagaacctta 10440
ggacatacaa tcagcctgcc tttgtctaca ttcccatggc tgcagagcta cgaggagggg 10500
cttgggttgt ggttgatagc aagataaacc cagaccgcat tgagtgctat gctgagagga 10560
ctgcaaaatc caatgttctc gaaccgcaag ggttaattga gatcaagttc aggtcagagg 10620
aactccagga ttgcatgagt cggcttgacc caacattaat tgatctgaaa gcaaaactcg 10680
aagtagcaaa taaaaatgga agtgctgaca caaaatcgct tcaagaaaat atagaagctc 10740
gaacaaaaca gttgatgcct ctatatactc agattgcgat acggtttgct gaattgcatg 10800
atacatccct cagaatggct gcgaaaggtg tgattaagaa agttgtggac tgggaagaat 10860
cacgatcttt cttttttttg cggccgcccc gggcctgcag gggatcccga tcgggccggc 10920
cgtttaaacc cactttgtac aagaaagctg ggtatttaaa tgaattcaag cttttaatta 10980
atgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat tgcatgtcta 11040
agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc agtttatcta 11100
tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt actacaataa 11160
tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa ggacaattga 11220
gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt tctccttttt 11280
ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca tccatttagg 11340
gtttagggtt aatggttttt atagactaat ttttttagta catctatttt attctatttt 11400
agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat agtttagata 11460
taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa 11520
aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga 11580
cgagtctaac ggacaccaac cagcgaacca gcagcgtcgc gtcgggccaa gcgaagcaga 11640
cggcacggca tctctgtcgc tgcctctgga cccctctcga gagttccgct ccaccgttgg 11700
acttgctccg ctgtcggcat ccagaaattg cgtggcggag cggcagacgt gagccggcac 11760
ggcaggcggc ctcctcctcc tctcacggca ccggcagcta cgggggattc ctttcccacc 11820
gctccttcgc tttcccttcc tcgcccgccg taataaatag acaccccctc cacaccctct 11880
ttccccaacc tcgtgttgtt cggagcgcac acacacacaa ccagatctcc cccaaatcca 11940
cccgtcggca cctccgcttc aaggtacgcc gctcgtcctc cccccccccc cccctctcta 12000
ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat 12060
gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg 12120
acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct 12180
gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc 12240
atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg 12300
tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt 12360
tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg 12420
tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat 12480
ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg 12540
ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag 12600
tagaatactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc 12660
atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac 12720
atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat 12780
gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttatttcgat 12840
cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc 12900
ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg 12960
gtgttacttc tgcagggcgc gccaccatgg ctcctaagaa gaagcggaag gttggtattc 13020
acggggtgcc tgcggctgac aagaagtact ccatcggcct cgacatcggc accaacagcg 13080
tcggctgggc ggtgatcacc gacgagtaca aggtcccgtc caagaagttc aaggtcctgg 13140
gcaacaccga ccgccactcc atcaagaaga acctcatcgg cgccctcctc ttcgactccg 13200
gcgagacggc ggaggcgacc cgcctcaagc gcaccgcccg ccgccgctac acccgccgca 13260
agaaccgcat ctgctacctc caggagatct tctccaacga gatggcgaag gtcgacgact 13320
ccttcttcca ccgcctcgag gagtccttcc tcgtggagga ggacaagaag cacgagcgcc 13380
accccatctt cggcaacatc gtcgacgagg tcgcctacca cgagaagtac cccactatct 13440
accaccttcg taagaagctt gttgactcta ctgataaggc tgatcttcgt ctcatctacc 13500
ttgctctcgc tcacatgatc aagttccgtg gtcacttcct tatcgagggt gaccttaacc 13560
ctgataactc cgacgtggac aagctcttca tccagctcgt ccagacctac aaccagctct 13620
tcgaggagaa ccctatcaac gcttccggtg tcgacgctaa ggcgatcctt tccgctaggc 13680
tctccaagtc caggcgtctc gagaacctca tcgcccagct ccctggtgag aagaagaacg 13740
gtcttttcgg taacctcatc gctctctccc tcggtctgac ccctaacttc aagtccaact 13800
tcgacctcgc tgaggacgct aagcttcagc tctccaagga tacctacgac gatgatctcg 13860
acaacctcct cgctcagatt ggagatcagt acgctgatct cttccttgct gctaagaacc 13920
tctccgatgc tatcctcctt tcggatatcc ttagggttaa cactgagatc actaaggctc 13980
ctctttctgc ttccatgatc aagcgctacg acgagcacca ccaggacctc accctcctca 14040
aggctcttgt tcgtcagcag ctccccgaga agtacaagga gatcttcttc gaccagtcca 14100
agaacggcta cgccggttac attgacggtg gagctagcca ggaggagttc tacaagttca 14160
tcaagccaat ccttgagaag atggatggta ctgaggagct tctcgttaag cttaaccgtg 14220
aggacctcct taggaagcag aggactttcg ataacggctc tatccctcac cagatccacc 14280
ttggtgagct tcacgccatc cttcgtaggc aggaggactt ctaccctttc ctcaaggaca 14340
accgtgagaa gatcgagaag atccttactt tccgtattcc ttactacgtt ggtcctcttg 14400
ctcgtggtaa ctcccgtttc gcttggatga ctaggaagtc cgaggagact atcacccctt 14460
ggaacttcga ggaggttgtt gacaagggtg cttccgccca gtccttcatc gagcgcatga 14520
ccaacttcga caagaacctc cccaacgaga aggtcctccc caagcactcc ctcctctacg 14580
agtacttcac ggtctacaac gagctcacca aggtcaagta cgtcaccgag ggtatgcgca 14640
agcctgcctt cctctccggc gagcagaaga aggctatcgt tgacctcctc ttcaagacca 14700
accgcaaggt caccgtcaag cagctcaagg aggactactt caagaagatc gagtgcttcg 14760
actccgtcga gatcagcggc gttgaggacc gtttcaacgc ttctctcggc acctaccacg 14820
atctcctcaa gatcatcaag gacaaggact tcctcgacaa cgaggagaac gaggacatcc 14880
tcgaggacat cgtcctcact cttactctct tcgaggatag ggagatgatc gaggagaggc 14940
tcaagactta cgctcatctc ttcgatgaca aggttatgaa gcagctcaag cgtcgccgtt 15000
acaccggttg gggtaggctc tcccgcaagc tcatcaacgg tatcagggat aagcagagcg 15060
gcaagactat cctcgacttc ctcaagtctg atggtttcgc taacaggaac ttcatgcagc 15120
tcatccacga tgactctctt accttcaagg aggatattca gaaggctcag gtgtccggtc 15180
agggcgactc tctccacgag cacattgcta accttgctgg ttcccctgct atcaagaagg 15240
gcatccttca gactgttaag gttgtcgatg agcttgtcaa ggttatgggt cgtcacaagc 15300
ctgagaacat cgtcatcgag atggctcgtg agaaccagac tacccagaag ggtcagaaga 15360
actcgaggga gcgcatgaag aggattgagg agggtatcaa ggagcttggt tctcagatcc 15420
ttaaggagca ccctgtcgag aacacccagc tccagaacga gaagctctac ctctactacc 15480
tccagaacgg tagggatatg tacgttgacc aggagctcga catcaacagg ctttctgact 15540
acgacgtcga ccacattgtt cctcagtctt tccttaagga tgactccatc gacaacaagg 15600
tcctcacgag gtccgacaag aacaggggta agtcggacaa cgtcccttcc gaggaggttg 15660
tcaagaagat gaagaactac tggaggcagc ttctcaacgc taagctcatt acccagagga 15720
agttcgacaa cctcacgaag gctgagaggg gtggcctttc cgagcttgac aaggctggtt 15780
tcatcaagag gcagcttgtt gagacgaggc agattaccaa gcacgttgct cagatcctcg 15840
attctaggat gaacaccaag tacgacgaga acgacaagct catccgcgag gtcaaggtga 15900
tcaccctcaa gtccaagctc gtctccgact tccgcaagga cttccagttc tacaaggtcc 15960
gcgagatcaa caactaccac cacgctcacg atgcttacct taacgctgtc gttggcaccg 16020
ctcttatcaa gaagtaccct aagcttgagt ccgagttcgt ctacggtgac tacaaggtct 16080
acgacgttcg taagatgatc gccaagtccg agcaggagat cggcaaggcc accgccaagt 16140
acttcttcta ctccaacatc atgaacttct tcaagaccga gatcaccctc gccaacggcg 16200
agatccgcaa gcgccctctt atcgagacga acggtgagac tggtgagatc gtttgggaca 16260
agggtcgcga cttcgctact gttcgcaagg tcctttctat gcctcaggtt aacatcgtca 16320
agaagaccga ggtccagacc ggtggcttct ccaaggagtc tatccttcca aagagaaact 16380
cggacaagct catcgctagg aagaaggatt gggaccctaa gaagtacggt ggtttcgact 16440
cccctactgt cgcctactcc gtcctcgtgg tcgccaaggt ggagaagggt aagtcgaaga 16500
agctcaagtc cgtcaaggag ctcctcggca tcaccatcat ggagcgctcc tccttcgaga 16560
agaacccgat cgacttcctc gaggccaagg gctacaagga ggtcaagaag gacctcatca 16620
tcaagctccc caagtactct cttttcgagc tcgagaacgg tcgtaagagg atgctggctt 16680
ccgctggtga gctccagaag ggtaacgagc ttgctcttcc ttccaagtac gtgaacttcc 16740
tctacctcgc ctcccactac gagaagctca agggttcccc tgaggataac gagcagaagc 16800
agctcttcgt ggagcagcac aagcactacc tcgacgagat catcgagcag atctccgagt 16860
tctccaagcg cgtcatcctc gctgacgcta acctcgacaa ggtcctctcc gcctacaaca 16920
agcaccgcga caagcccatc cgcgagcagg ccgagaacat catccacctc ttcacgctca 16980
cgaacctcgg cgcccctgct gctttcaagt acttcgacac caccatcgac aggaagcgtt 17040
acacgtccac caaggaggtt ctcgacgcta ctctcatcca ccagtccatc accggtcttt 17100
acgagactcg tatcgacctt tcccagcttg gtggtgataa gcgtcctgct gccaccaaaa 17160
aggccggaca ggctaagaaa aagaagtagc ctgcaggtcc tgctttaatg agatatgcga 17220
gacgcctatg atcgcatgat atttgctttc aattctgttg tgcacgttgt aaaaaacctg 17280
agcatgtgta gctcagatcc ttaccgccgg tttcggttca ttctaatgaa tatatcaccc 17340
gttactatcg tatttttatg aataatattc tccgttcaat ttactgattg taccctacta 17400
cttatatgta caatattaaa atgaaaacaa tatattgtgc tgaataggtt tatagcgaca 17460
tctatgatag agcgccacaa taacaaacaa ttgcgtttta ttattacaaa tccaatttta 17520
aaaaaagcgg cagaaccggt caaacctaaa agactgatta cataaatctt attcaaattt 17580
caaaagtgcc ccaggggcta gtatctacga cacaccgagc ggcgaactaa taacgctcac 17640
tgaagggaac tccggttccc cgccggcgcg catgggtgag attccttgaa gttgagtatt 17700
ggccgtccgc tctaccgaaa gttacgggca ccattcaacc cggtccagca cggcggccgg 17760
gtaaccgact tgctgccccg agaattatgc agcatttttt tggtgtatgt gggccccaaa 17820
tgaagtgcag gtcaaacctt gacagtgacg acaaatcgtt gggcgggtcc agggcgaatt 17880
ttgcgacaac atgtcgaggc tcagcaggcc ggccgtttaa accaacttta 17930
<210> 69
<211> 3755
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector CC020
<400> 69
cgcggatcat gaaccaacgg cctggctgta tttggtggtt gtgtagggag atggggagaa 60
gaaaagcccg attctcttcg ctgtgatggg ctggatgcat gcgggggagc gggaggccca 120
agtacgtgca cggtgagcgg cccacagggc gagtgtgagc gcgagaggcg ggaggaacag 180
tttagtacca cattgcccag ctaactcgaa cgcgaccaac ttataaaccc gcgcgctgtc 240
gcttgtgtgt gggttattga ttctgttggt tttagagcta gaaatagcaa gttaaaataa 300
ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgcattacg ttcagagctg 360
gatcatttgg cccaagggaa gatgcattct ttgaagctgt taccaaccta gcctgtgaga 420
agaaacttcc tcttatttat ttggcagcaa attctggtgc tcgaattggc atagcagatg 480
aagtgaaatc ttgcttccgt gttgggtggt ctgatgatgg cagccctgaa cgtgggtttc 540
agtacattta tctaagcgaa gaagactatg ctcgtattgg cacttctgtc atagcacata 600
agatgcagct agacagtggt gaaattaggt gggttattga ttctgttgtc ggcaaggaag 660
atggacttgg tgtggagaat ctccatggaa gtgctgctat tgccagtgct tattctaggg 720
catataagga gacatttaca cttacatttg tgactggaag aactgttgga ataggagctt 780
atcttgctcg acttggcatc cggtgcatac agcgtcttga ccagcctatt attcttacag 840
gctattctgc actgaacaag cttcttgggc gggaagtgta cagctcccac atgcagttgg 900
gtggtcccaa aatcatggca actaatggtg ttgtccatct tactgtttca gatgaccttg 960
aaggcgtttc taatatattg aggttttttt tgcggccgcc ccgggcctgc aggggatccc 1020
gatcgggccg gccgtttaaa cccactttgt acaagaaagt tgaacgagaa acgtaaaatg 1080
atataaatat caatatatta aattagattt tgcataaaaa acagactaca taatactgta 1140
aaacacaaca tatgcagtca ctatgaacca actacttaga tggtattagt gacctgtact 1200
gggcctcatg ggccttccgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 1260
tgcattaaca tggtcatagc tgtttccttg cgtattgggc gctctccgct tcctcgctca 1320
ctgactcgct gcgctcggtc gttcgggtaa agcctggggt gcctaatgag caaaaggcca 1380
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 1440
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 1500
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 1560
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 1620
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 1680
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 1740
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 1800
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 1860
aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 1920
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 1980
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 2040
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 2100
gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 2160
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 2220
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 2280
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagaaccac gctcaccggc 2340
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 2400
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 2460
gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 2520
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 2580
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 2640
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 2700
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 2760
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 2820
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 2880
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 2940
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 3000
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 3060
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 3120
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctaaattgta 3180
agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc attttttaac 3240
caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga gatagggttg 3300
agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt gggaagggcg 3360
tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 3420
gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 3480
agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca aggccgcatt 3540
acaggtcact aataccatct aagtagttgg ttcatagtga ctgcatatgt tgtgttttac 3600
agtattatgt agtctgtttt ttatgcaaaa tctaatttaa tatattgata tttatatcat 3660
tttacgtttc tcgttcaact tttttgtaca aacttgattt aaatgaattc aagcttttaa 3720
ttaagcatgc gagctcggcg cgccggtacc gcgat 3755
<210> 70
<211> 17951
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector RLW139
<400> 70
ttatacatag ttgataattc actgggccgg ccgtttaaac ttagttacta atcagtgatc 60
agattgtcgt ttcccgcctt cactttaaac tatcagtgtt tgacaggata tattggcggg 120
taaacctaag agaaaagagc gtttattaga ataatcggat atttaaaagg gcgtgaaaag 180
gtttatccgt tcgtccattt gtatgtcaat attggggggg ggggaaagcc acgttgtgtc 240
tcaaaatctc tgatgttaca ttgcacaaga taaaaatata tcatcatgaa caataaaact 300
gtctgcttac ataaacagta atacaagggg tgttcgccac catgagccat atccagcgtg 360
aaacctcgtg ctcccgcccg cgcctcaatt ccaatatgga tgccgacctt tatggctaca 420
agtgggcgcg cgacaacgtc ggccagtcgg gcgcgaccat ttatcggctt tatggcaaac 480
ccgatgcccc ggaactgttc ctgaagcacg gcaaaggcag cgtcgcaaac gatgtcaccg 540
atgagatggt ccgcctgaac tggcttaccg agttcatgcc gctgccgacg attaagcatt 600
tcatccgtac cccggacgat gcctggctct tgaccacggc cattccgggc aaaacggcct 660
ttcaggtcct tgaagagtac ccggactccg gtgagaatat cgtggacgcc ctcgcggtct 720
tcctccgccg tttgcatagc atccccgtgt gcaactgccc cttcaactcg gaccgggttt 780
tccgcctggc acaggcccag tcgcgcatga ataacggcct cgttgacgcg agcgatttcg 840
acgatgaacg gaatggctgg ccggtggaac aggtttggaa ggaaatgcac aaactgcttc 900
cgttctcgcc ggattcggtg gtcacgcatg gtgatttttc cctggataat ctgatctttg 960
acgagggcaa gctgatcggc tgcatcgacg tgggtcgcgt cggtatcgcc gaccgctatc 1020
aggacctggc gatcttgtgg aattgcctcg gcgagttctc gccctcgctc cagaagcgcc 1080
tgttccagaa gtacggcatc gacaacccgg atatgaacaa gctccagttc cacctcatgc 1140
tggacgaatt tttttgaaca gaattggtta attggttgta acactggcag agcattacgc 1200
tgacttgacg ggacggcggc tttgttgaat aaatcgaact tttgctgagt tgaaggatcg 1260
atgagttgaa ggaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc 1320
gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg 1380
atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa 1440
atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc 1500
ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt 1560
gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa 1620
cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc 1680
tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc 1740
cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct 1800
ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat 1860
gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc 1920
tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg 1980
ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc 2040
gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc 2100
atctgtgcgg tatttcacac cgcataggcc gcgataggcc gacgcgaagc ggcggggcgt 2160
agggagcgca gcgaccgaag ggtaggcgct ttttgcagct cttcggctgt gcgctggcca 2220
gacagttatg cacaggccag gcgggtttta agagttttaa taagttttaa agagttttag 2280
gcggaaaaat cgcctttttt ctcttttata tcagtcactt acatgtgtga ccggttccca 2340
atgtacggct ttgggttccc aatgtacggg ttccggttcc caatgtacgg ctttgggttc 2400
ccaatgtacg tgctatccac aggaaagaga ccttttcgac ctttttcccc tgctagggca 2460
atttgcccta gcatctgctc cgtacattag gaaccggcgg atgcttcgcc ctcgatcagg 2520
ttgcggtagc gcatgactag gatcgggcca gcctgccccg cctcctcctt caaatcgtac 2580
tccggcaggt catttgaccc gatcagcttg cgcacggtga aacagaactt cttgaactct 2640
ccggcgctgc cactgcgttc gtagatcgtc ttgaacaacc atctggcttc tgccttgcct 2700
gcggcgcggc gtgccaggcg gtagagaaaa cggccgatgc cggggtcgat caaaaagtaa 2760
tcggggtgaa ccgtcagcac gtccgggttc ttgccttctg tgatctcgcg gtacatccaa 2820
tcagcaagct cgatctcgat gtactccggc cgcccggttt cgctctttac gatcttgtag 2880
cggctaatca aggcttcacc ctcggatacc gtcaccaggc ggccgttctt ggccttcttg 2940
gtacgctgca tggcaacgtg cgtggtgttt aaccgaatgc aggtttctac caggtcgtct 3000
ttctgctttc cgccatcggc tcgccggcag aacttgagta cgtccgcaac gtgtggacgg 3060
aacacgcggc cgggcttgtc tcccttccct tcccggtatc ggttcatgga ttcggttaga 3120
tgggaaaccg ccatcagtac caggtcgtaa tcccacacac tggccatgcc ggcggggcct 3180
gcggaaacct ctacgtgccc gtctggaagc tcgtagcgga tcacctcgcc agctcgtcgg 3240
tcacgcttcg acagacggaa aacggccacg tccatgatgc tgcgactatc gcgggtgccc 3300
acgtcataga gcatcggaac gaaaaaatct ggttgctcgt cgcccttggg cggcttccta 3360
atcgacggcg caccggctgc cggcggttgc cgggattctt tgcggattcg atcagcggcc 3420
ccttgccacg attcaccggg gcgtgcttct gcctcgatgc gttgccgctg ggcggcctgc 3480
gcggccttca acttctccac caggtcatca cccagcgccg cgccgatttg taccgggccg 3540
gatggtttgc gaccgctcac gccgattcct cgggcttggg ggttccagtg ccattgcagg 3600
gccggcagac aacccagccg cttacgcctg gccaaccgcc cgttcctcca cacatggggc 3660
attccacggc gtcggtgcct ggttgttctt gattttccat gccgcctcct ttagccgcta 3720
aaattcatct actcatttat tcatttgctc atttactctg gtagctgcgc gatgtattca 3780
gatagcagct cggtaatggt cttgccttgg cgtaccgcgt acatcttcag cttggtgtga 3840
tcctccgccg gcaactgaaa gttgacccgc ttcatggctg gcgtgtctgc caggctggcc 3900
aacgttgcag ccttgctgct gcgtgcgctc ggacggccgg cacttagcgt gtttgtgctt 3960
ttgctcattt tctctttacc tcattaactc aaatgagttt tgatttaatt tcagcggcca 4020
gcgcctggac ctcgcgggca gcgtcgccct cgggttctga ttcaagaacg gttgtgccgg 4080
cggcggcagt gcctgggtag ctcacgcgct gcgtgatacg ggactcaaga atgggcagct 4140
cgtacccggc cagcgcctcg gcaacctcac cgccgatgcg cgtgcctttg atcgcccgcg 4200
acacgacaaa ggccgcttgt agccttccat ccgtgacctc aatgcgctgc ttaaccagct 4260
ccaccaggtc ggcggtggcc caaatgtcgt aagggcttgg ctgcaccgga atcagcacga 4320
agtcggctgc cttgatcgcg gacacagcca agtccgccgc ctggggcgct ccgtcgatca 4380
ctacgaagtc gcgccggccg atggccttca cgtcgcggtc aatcgtcggg cggtcgatgc 4440
cgacaacggt tagcggttga tcttcccgca cggccgccca atcgcgggca ctgccctggg 4500
gatcggaatc gactaacaga acatcggccc cggcgagttg cagggcgcgg gctagatggg 4560
ttgcgatggt cgtcttgcct gacccgcctt tctggttaag tacagcgata accttcatgc 4620
gttccccttg cgtatttgtt tatttactca tcgcatcata tacgcagcga ccgcatgacg 4680
caagctgttt tactcaaata cacatcacct ttttagatga tcagtgattt tgtgccgagc 4740
tgccggtcgg ggagctgttg gctggctggt ggcaggatat attgtggtgt aaacaaattg 4800
acgcttagac aacttaataa cacattgcgg acgtctttaa tgtactgaat ttagttactg 4860
atcactgatt aagtactgat aaatttaatt aacagatctc aactttgtat agaaaagttg 4920
atttaaatga attcaagctt ttaattaact tagccactgc aacaagttct tgaaccttag 4980
cacaatcata ttgtgcatgc acttgtttat tgcaaagaat ggtgcgtagg gaacacgcat 5040
gatttttgaa ttgctggcac ataattttat cattagaaac tggaatgcaa catgtaccct 5100
ttgtcatggt ttctttccga gacattgcac tgtttttttt aatcctatca ttatcataat 5160
gccaagaact ggtcaccaac cagcattttg catcatggtt agttgagctg tccccatgta 5220
tcaataggtg cattgtattg gtccaaaata taaatgcagt ggatgcaacc tatctcatgg 5280
ccgtcaacaa aagaaatcaa aagggaaatg caccatctta tatctccagt ttatatgaac 5340
agattggata agatcataag atcaagtggt ttatattatt ttgaggaata taacatggat 5400
tcatcctaat cactcgtcta ggcagtatgt gtattcatga tggatatggt actatactac 5460
ggagtttttt cttcacaaaa taacctgtta ttttgacctc caaccaaaca cgaattatac 5520
caaaaattgg gttatttcat ctatagtaca actctattat aaacatgcag taaattatcc 5580
tacacatata ccaaaattca agtgtaataa tcctaataca cagacttaaa aaacaaacta 5640
tttccttttt aagaaaagga aaaccatttt tttaacggaa ggaaaacaaa ttcgggtcaa 5700
ggcggaagcc agcgcgccac cccacgtcag cgaatacgga ggcgcggggt tgacggcgtc 5760
acccggtcct aacggcgacc aacaaaccag ccagaagaaa ttacagtaaa aaaaagtaaa 5820
ttgcactttg atccaccttt tattacccaa gtttcaattt ggaccaccct taaacctatc 5880
ttttcaaatt gggccgggtt gtggtttgga ctaccatgaa caacttttcg tcatgtctaa 5940
cttccctttc ggcaaacata tgaaccatat atagaggaga tcggccgtat actagagctg 6000
atgtgtttaa ggtcgttgat tgcacgagaa aaaaaaaatc caaatcgcaa caatagcaaa 6060
tttatctagt tcaaagtgaa aagatatgtt taaaggtagt ccaaagtaaa acttaggggc 6120
tgtttggttc ccagccatac tttaccatta cttgccaaca aaagttgcca caccttgtct 6180
aaggtgaggt gatcaaattg ttagccacaa cttactaagc ctaagggaat cttgccacac 6240
ttttttgagc cattgacacg tgggacttaa tttgttagag ggaaatcttg ccacaactgt 6300
ggctacaacc aaacacctgt caaatttgcc taaccttagg cgtggcaaac tgtggcaaag 6360
tgtggcttac aaccaaacac acccttagat aataaaatgt ggtccaaagc gtaattcact 6420
aaaaaaaaat caacgagacg tgtaccaaac ggagacaaac ggcatcttct cgaaatttcc 6480
caaccgctcg ctcgcccgcc tcgtcttccc ggaaaccgcg gtggtttcag cgtggcggat 6540
tctccaagca gacggagacg tcacggcacg ggactcctcc caccacccaa ccgccataaa 6600
taccagcccc ctcatctcct ctcctcgcat cagctccacc cccgaaaaat ttctccccaa 6660
tctcgcgagg ctctcgtcgt cgaatcgaat cctctcgcgt cctcaagctt ggcatccagg 6720
tacggatccg cgtcccatct ccctcacccc ccgtgttctt cgtgcctgct tctgggtcag 6780
atctgggtgg attcgcggtt gttggatgtg gggggctgtg tttatttgtc ggtggatctg 6840
gttgtctgga tctgcgtttt ctctgtcgta gttagcggat ctgatgaaat gtttagtgtt 6900
cgtgtatact ggtatggtgg atctggtcct aggatgcgtg gaatggatat atgtaggcga 6960
attggaggat ttattttgtg aattttgctg aaatgatagt tctaaacact ggatctgacc 7020
tcgggatgct gttaaatgtg gaaatcatgg tcgatgctgt catgaacatg gtgttcttat 7080
ggtagatctg agcaatgtat gtttcaaaat tgtttgtcac atggaaatgc tatggttcta 7140
gatgcaatag aatgatacat gccgagatcc cctctagttg atatgataga tcatgatgtt 7200
ttacagctat gtcatatgaa tatgttcatt tgttaccgat gtatttggat ctacttaaca 7260
tttccaaagc acgccgcgtt ctaattctag atctggtagt catgtttgta cacgtcaccc 7320
acctaataca aatacatatg tctagtgttt ggtgacactg cccgtcagat ctgttttttc 7380
cagatctgtg gaacaaatac tccacgcatg tatggtagtt ttgaaacgat cttgtatctt 7440
ccattgttgt agtaacaact aaataaagta caattgttca attattggga atcgtatttt 7500
ctgtagtgcc gatgtacagc atattcatag atgtctattt aggaactcaa attttaaatt 7560
gaggactagt tatttattgt gggtcagtct tttgaattgt gttatcttgc tgtactggcg 7620
cgccaccatg gccaccgccg ccgccgcgtc taccgcgctc actggcgcca ctaccgctgc 7680
gcccaaggcg aggcgccggg cgcacctcct ggccacccgc cgcgccctcg ccgcgcccat 7740
caggtgctca gcggcgtcac ccgccatgcc gatggctccc ccggccaccc cgctccggcc 7800
gtggggcccc accgatcccc gcaagggcgc cgacatcctc gtcgagtccc tcgagcgctg 7860
cggcgtccgc gacgtcttcg cctaccccgg cggcacgtcc atggagatcc accaggcact 7920
cacccgctcc cccgtcatcg ccaaccacct cttccgccac gagcaagggg aggcctttgc 7980
ggcctccggc tacgcgcgct cctcgggccg cgtcggcgtc tgcatcgcca cctccggccc 8040
cggcgccacc aaccttgtct ccgcgctcgc cgacgcgctg ctcgattccg tccccatggt 8100
cgccatcacg ggacaggtgc cgcgacgcat gattggcacc gacgccttcc aggagacgcc 8160
catcgtcgag gtcacccgct ccatcaccaa gcacaactac ctggtcctcg acgtcgacga 8220
catcccccgc gtcgtgcagg aggctttctt cctcgcctcc tctggtcgac cggggccggt 8280
gcttgtcgac atccccaagg acatccagca gcagatggcg gtgcctgtct gggacaagcc 8340
catgagtctg cctgggtaca ttgcgcgcct tcccaagccc cctgcgactg agttgcttga 8400
gcaggtgctg cgtcttgttg gtgaatcccg gcgccctgtt ctttatgttg gcggtggctg 8460
cgcagcatct ggtgaggagt tgcgacgctt tgtggagctg actggaatcc cggtcacaac 8520
tactcttatg ggcctcggca acttccccag cgacgaccca ctgtctctgc gcatgctagg 8580
tatgcatggc acggtgtatg caaattatgc agtggataag gccgatctgt tgcttgcact 8640
tggtgtgcgg tttgatgatc gtgtgacagg gaagattgag gcttttgcaa gcagggctaa 8700
gattgtgcac gttgatattg atccggctga gattggcaag aacaagcagc cacatgtgtc 8760
catctgtgca gatgttaagc ttgctttgca gggcatgaat gctcttcttg aaggaagcac 8820
atcaaagaag agctttgact ttggctcatg gaacgatgag ttggatcagc agaagaggga 8880
attccccctt gggtataaaa catctaatga ggagatccag ccacaatatg ctattcaggt 8940
tcttgatgag ctgacgaaag gcgaggccat catcggcaca ggtgttgggc agcaccagat 9000
gtgggcggca cagtactaca cttacaagcg gccaaggcag tggttgtctt cagctggtct 9060
tggggctatg ggatttggtt tgccggctgc tgctggtgct tctgtggcca acccaggtgt 9120
tactgttgtt gacatcgatg gagatggtag ctttctcatg aacgttcagg agctagctat 9180
gatccgaatt gagaacctcc cggtgaaggt ctttgtgcta aacaaccagc acctggggat 9240
ggtggtgcag tgggaggaca ggttctataa ggccaacaga gcgcacacat acttgggaaa 9300
cccagagaat gaaagtgaga tatatccaga tttcgtgacg atcgccaaag ggttcaacat 9360
tccagcggtc cgtgtgacaa agaagaacga agtccgcgca gcgataaaga agatgctcga 9420
gactccaggg ccgtacctct tggatataat cgtcccacac caggagcatg tgttgcctat 9480
gatccctaat ggtggggctt tcaaggatat gatcctggat ggtgatggca ggactgtgta 9540
ctagcctgca ggcctaggat cgttcaaaca tttggcaata aagtttctta agattgaatc 9600
ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt aagcatgtaa 9660
taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt agagtcccgc 9720
aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag gataaattat 9780
cgcgcgcggt gtcatctatg ttactagatc ggccggccgt ttaaacagcc tgcttttttg 9840
tacaaacttg atttaaatga attcaagctt ttaattaagc atgcgagctc ggcgcgccgg 9900
taccgcgatc gcggatcatg aaccaacggc ctggctgtat ttggtggttg tgtagggaga 9960
tggggagaag aaaagcccga ttctcttcgc tgtgatgggc tggatgcatg cgggggagcg 10020
ggaggcccaa gtacgtgcac ggtgagcggc ccacagggcg agtgtgagcg cgagaggcgg 10080
gaggaacagt ttagtaccac attgcccagc taactcgaac gcgaccaact tataaacccg 10140
cgcgctgtcg cttgtgtgtg ggttattgat tctgttggtt ttagagctag aaatagcaag 10200
ttaaaataag gctagtccgt tatcaacttg aaaaagtggc accgagtcgg tgcattacgt 10260
tcagagctgg atcatttggc ccaagggaag atgcattctt tgaagctgtt accaacctag 10320
cctgtgagaa gaaacttcct cttatttatt tggcagcaaa ttctggtgct cgaattggca 10380
tagcagatga agtgaaatct tgcttccgtg ttgggtggtc tgatgatggc agccctgaac 10440
gtgggtttca gtacatttat ctaagcgaag aagactatgc tcgtattggc acttctgtca 10500
tagcacataa gatgcagcta gacagtggtg aaattaggtg ggttattgat tctgttgtcg 10560
gcaaggaaga tggacttggt gtggagaatc tccatggaag tgctgctatt gccagtgctt 10620
attctagggc atataaggag acatttacac ttacatttgt gactggaaga actgttggaa 10680
taggagctta tcttgctcga cttggcatcc ggtgcataca gcgtcttgac cagcctatta 10740
ttcttacagg ctattctgca ctgaacaagc ttcttgggcg ggaagtgtac agctcccaca 10800
tgcagttggg tggtcccaaa atcatggcaa ctaatggtgt tgtccatctt actgtttcag 10860
atgaccttga aggcgtttct aatatattga ggtttttttt gcggccgccc cgggcctgca 10920
ggggatcccg atcgggccgg ccgtttaaac ccactttgta caagaaagct gggtatttaa 10980
atgaattcaa gcttttaatt aatgcagtgc agcgtgaccc ggtcgtgccc ctctctagag 11040
ataatgagca ttgcatgtct aagttataaa aaattaccac atattttttt tgtcacactt 11100
gtttgaagtg cagtttatct atctttatac atatatttaa actttactct acgaataata 11160
taatctatag tactacaata atatcagtgt tttagagaat catataaatg aacagttaga 11220
catggtctaa aggacaattg agtattttga caacaggact ctacagtttt atctttttag 11280
tgtgcatgtg ttctcctttt tttttgcaaa tagcttcacc tatataatac ttcatccatt 11340
ttattagtac atccatttag ggtttagggt taatggtttt tatagactaa tttttttagt 11400
acatctattt tattctattt tagcctctaa attaagaaaa ctaaaactct attttagttt 11460
ttttatttaa tagtttagat ataaaataga ataaaataaa gtgactaaaa attaaacaaa 11520
taccctttaa gaaattaaaa aaactaagga aacatttttc ttgtttcgag tagataatgc 11580
cagcctgtta aacgccgtcg acgagtctaa cggacaccaa ccagcgaacc agcagcgtcg 11640
cgtcgggcca agcgaagcag acggcacggc atctctgtcg ctgcctctgg acccctctcg 11700
agagttccgc tccaccgttg gacttgctcc gctgtcggca tccagaaatt gcgtggcgga 11760
gcggcagacg tgagccggca cggcaggcgg cctcctcctc ctctcacggc accggcagct 11820
acgggggatt cctttcccac cgctccttcg ctttcccttc ctcgcccgcc gtaataaata 11880
gacaccccct ccacaccctc tttccccaac ctcgtgttgt tcggagcgca cacacacaca 11940
accagatctc ccccaaatcc acccgtcggc acctccgctt caaggtacgc cgctcgtcct 12000
cccccccccc ccccctctct accttctcta gatcggcgtt ccggtccatg gttagggccc 12060
ggtagttcta cttctgttca tgtttgtgtt agatccgtgt ttgtgttaga tccgtgctgc 12120
tagcgttcgt acacggatgc gacctgtacg tcagacacgt tctgattgct aacttgccag 12180
tgtttctctt tggggaatcc tgggatggct ctagccgttc cgcagacggg atcgatttca 12240
tgattttttt tgtttcgttg catagggttt ggtttgccct tttcctttat ttcaatatat 12300
gccgtgcact tgtttgtcgg gtcatctttt catgcttttt tttgtcttgg ttgtgatgat 12360
gtggtctggt tgggcggtcg ttctagatcg gagtagaatt ctgtttcaaa ctacctggtg 12420
gatttattaa ttttggatct gtatgtgtgt gccatacata ttcatagtta cgaattgaag 12480
atgatggatg gaaatatcga tctaggatag gtatacatgt tgatgcgggt tttactgatg 12540
catatacaga gatgcttttt gttcgcttgg ttgtgatgat gtggtgtggt tgggcggtcg 12600
ttcattcgtt ctagatcgga gtagaatact gtttcaaact acctggtgta tttattaatt 12660
ttggaactgt atgtgtgtgt catacatctt catagttacg agtttaagat ggatggaaat 12720
atcgatctag gataggtata catgttgatg tgggttttac tgatgcatat acatgatggc 12780
atatgcagca tctattcata tgctctaacc ttgagtacct atctattata ataaacaagt 12840
atgttttata attatttcga tcttgatata cttggatgat ggcatatgca gcagctatat 12900
gtggattttt ttagccctgc cttcatacgc tatttatttg cttggtactg tttcttttgt 12960
cgatgctcac cctgttgttt ggtgttactt ctgcagggcg cgccaccatg gctcctaaga 13020
agaagcggaa ggttggtatt cacggggtgc ctgcggctga caagaagtac tccatcggcc 13080
tcgacatcgg caccaacagc gtcggctggg cggtgatcac cgacgagtac aaggtcccgt 13140
ccaagaagtt caaggtcctg ggcaacaccg accgccactc catcaagaag aacctcatcg 13200
gcgccctcct cttcgactcc ggcgagacgg cggaggcgac ccgcctcaag cgcaccgccc 13260
gccgccgcta cacccgccgc aagaaccgca tctgctacct ccaggagatc ttctccaacg 13320
agatggcgaa ggtcgacgac tccttcttcc accgcctcga ggagtccttc ctcgtggagg 13380
aggacaagaa gcacgagcgc caccccatct tcggcaacat cgtcgacgag gtcgcctacc 13440
acgagaagta ccccactatc taccaccttc gtaagaagct tgttgactct actgataagg 13500
ctgatcttcg tctcatctac cttgctctcg ctcacatgat caagttccgt ggtcacttcc 13560
ttatcgaggg tgaccttaac cctgataact ccgacgtgga caagctcttc atccagctcg 13620
tccagaccta caaccagctc ttcgaggaga accctatcaa cgcttccggt gtcgacgcta 13680
aggcgatcct ttccgctagg ctctccaagt ccaggcgtct cgagaacctc atcgcccagc 13740
tccctggtga gaagaagaac ggtcttttcg gtaacctcat cgctctctcc ctcggtctga 13800
cccctaactt caagtccaac ttcgacctcg ctgaggacgc taagcttcag ctctccaagg 13860
atacctacga cgatgatctc gacaacctcc tcgctcagat tggagatcag tacgctgatc 13920
tcttccttgc tgctaagaac ctctccgatg ctatcctcct ttcggatatc cttagggtta 13980
acactgagat cactaaggct cctctttctg cttccatgat caagcgctac gacgagcacc 14040
accaggacct caccctcctc aaggctcttg ttcgtcagca gctccccgag aagtacaagg 14100
agatcttctt cgaccagtcc aagaacggct acgccggtta cattgacggt ggagctagcc 14160
aggaggagtt ctacaagttc atcaagccaa tccttgagaa gatggatggt actgaggagc 14220
ttctcgttaa gcttaaccgt gaggacctcc ttaggaagca gaggactttc gataacggct 14280
ctatccctca ccagatccac cttggtgagc ttcacgccat ccttcgtagg caggaggact 14340
tctacccttt cctcaaggac aaccgtgaga agatcgagaa gatccttact ttccgtattc 14400
cttactacgt tggtcctctt gctcgtggta actcccgttt cgcttggatg actaggaagt 14460
ccgaggagac tatcacccct tggaacttcg aggaggttgt tgacaagggt gcttccgccc 14520
agtccttcat cgagcgcatg accaacttcg acaagaacct ccccaacgag aaggtcctcc 14580
ccaagcactc cctcctctac gagtacttca cggtctacaa cgagctcacc aaggtcaagt 14640
acgtcaccga gggtatgcgc aagcctgcct tcctctccgg cgagcagaag aaggctatcg 14700
ttgacctcct cttcaagacc aaccgcaagg tcaccgtcaa gcagctcaag gaggactact 14760
tcaagaagat cgagtgcttc gactccgtcg agatcagcgg cgttgaggac cgtttcaacg 14820
cttctctcgg cacctaccac gatctcctca agatcatcaa ggacaaggac ttcctcgaca 14880
acgaggagaa cgaggacatc ctcgaggaca tcgtcctcac tcttactctc ttcgaggata 14940
gggagatgat cgaggagagg ctcaagactt acgctcatct cttcgatgac aaggttatga 15000
agcagctcaa gcgtcgccgt tacaccggtt ggggtaggct ctcccgcaag ctcatcaacg 15060
gtatcaggga taagcagagc ggcaagacta tcctcgactt cctcaagtct gatggtttcg 15120
ctaacaggaa cttcatgcag ctcatccacg atgactctct taccttcaag gaggatattc 15180
agaaggctca ggtgtccggt cagggcgact ctctccacga gcacattgct aaccttgctg 15240
gttcccctgc tatcaagaag ggcatccttc agactgttaa ggttgtcgat gagcttgtca 15300
aggttatggg tcgtcacaag cctgagaaca tcgtcatcga gatggctcgt gagaaccaga 15360
ctacccagaa gggtcagaag aactcgaggg agcgcatgaa gaggattgag gagggtatca 15420
aggagcttgg ttctcagatc cttaaggagc accctgtcga gaacacccag ctccagaacg 15480
agaagctcta cctctactac ctccagaacg gtagggatat gtacgttgac caggagctcg 15540
acatcaacag gctttctgac tacgacgtcg accacattgt tcctcagtct ttccttaagg 15600
atgactccat cgacaacaag gtcctcacga ggtccgacaa gaacaggggt aagtcggaca 15660
acgtcccttc cgaggaggtt gtcaagaaga tgaagaacta ctggaggcag cttctcaacg 15720
ctaagctcat tacccagagg aagttcgaca acctcacgaa ggctgagagg ggtggccttt 15780
ccgagcttga caaggctggt ttcatcaaga ggcagcttgt tgagacgagg cagattacca 15840
agcacgttgc tcagatcctc gattctagga tgaacaccaa gtacgacgag aacgacaagc 15900
tcatccgcga ggtcaaggtg atcaccctca agtccaagct cgtctccgac ttccgcaagg 15960
acttccagtt ctacaaggtc cgcgagatca acaactacca ccacgctcac gatgcttacc 16020
ttaacgctgt cgttggcacc gctcttatca agaagtaccc taagcttgag tccgagttcg 16080
tctacggtga ctacaaggtc tacgacgttc gtaagatgat cgccaagtcc gagcaggaga 16140
tcggcaaggc caccgccaag tacttcttct actccaacat catgaacttc ttcaagaccg 16200
agatcaccct cgccaacggc gagatccgca agcgccctct tatcgagacg aacggtgaga 16260
ctggtgagat cgtttgggac aagggtcgcg acttcgctac tgttcgcaag gtcctttcta 16320
tgcctcaggt taacatcgtc aagaagaccg aggtccagac cggtggcttc tccaaggagt 16380
ctatccttcc aaagagaaac tcggacaagc tcatcgctag gaagaaggat tgggacccta 16440
agaagtacgg tggtttcgac tcccctactg tcgcctactc cgtcctcgtg gtcgccaagg 16500
tggagaaggg taagtcgaag aagctcaagt ccgtcaagga gctcctcggc atcaccatca 16560
tggagcgctc ctccttcgag aagaacccga tcgacttcct cgaggccaag ggctacaagg 16620
aggtcaagaa ggacctcatc atcaagctcc ccaagtactc tcttttcgag ctcgagaacg 16680
gtcgtaagag gatgctggct tccgctggtg agctccagaa gggtaacgag cttgctcttc 16740
cttccaagta cgtgaacttc ctctacctcg cctcccacta cgagaagctc aagggttccc 16800
ctgaggataa cgagcagaag cagctcttcg tggagcagca caagcactac ctcgacgaga 16860
tcatcgagca gatctccgag ttctccaagc gcgtcatcct cgctgacgct aacctcgaca 16920
aggtcctctc cgcctacaac aagcaccgcg acaagcccat ccgcgagcag gccgagaaca 16980
tcatccacct cttcacgctc acgaacctcg gcgcccctgc tgctttcaag tacttcgaca 17040
ccaccatcga caggaagcgt tacacgtcca ccaaggaggt tctcgacgct actctcatcc 17100
accagtccat caccggtctt tacgagactc gtatcgacct ttcccagctt ggtggtgata 17160
agcgtcctgc tgccaccaaa aaggccggac aggctaagaa aaagaagtag cctgcaggtc 17220
ctgctttaat gagatatgcg agacgcctat gatcgcatga tatttgcttt caattctgtt 17280
gtgcacgttg taaaaaacct gagcatgtgt agctcagatc cttaccgccg gtttcggttc 17340
attctaatga atatatcacc cgttactatc gtatttttat gaataatatt ctccgttcaa 17400
tttactgatt gtaccctact acttatatgt acaatattaa aatgaaaaca atatattgtg 17460
ctgaataggt ttatagcgac atctatgata gagcgccaca ataacaaaca attgcgtttt 17520
attattacaa atccaatttt aaaaaaagcg gcagaaccgg tcaaacctaa aagactgatt 17580
acataaatct tattcaaatt tcaaaagtgc cccaggggct agtatctacg acacaccgag 17640
cggcgaacta ataacgctca ctgaagggaa ctccggttcc ccgccggcgc gcatgggtga 17700
gattccttga agttgagtat tggccgtccg ctctaccgaa agttacgggc accattcaac 17760
ccggtccagc acggcggccg ggtaaccgac ttgctgcccc gagaattatg cagcattttt 17820
ttggtgtatg tgggccccaa atgaagtgca ggtcaaacct tgacagtgac gacaaatcgt 17880
tgggcgggtc cagggcgaat tttgcgacaa catgtcgagg ctcagcaggc cggccgttta 17940
aaccaacttt a 17951
<210> 71
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Signal
<400> 71
Met Ser Glu Arg Lys Arg Arg Glu Lys Leu
1 5 10
<210> 72
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Nuclear Localization Signal
<400> 72
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 73
<211> 377
<212> DNA
<213> Oryza sativa
<220>
<223> U3 snRNA promoter
<400> 73
aagggatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaggaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtggagtaa gataaactgt aggagaaaag catttcgtag tgggccatga 240
agcctttcag gacatgtatt gcagtatggg ccggcccatt acgcaattgg acgacaacaa 300
agactagtat tagtaccacc tcggctatcc acatagatca aagctggttt aaaagagttg 360
tgcagatgat ccgtggc 377
Claims (13)
- a. 적어도 하나의 공여자 핵산 (doNA) 분자에 공유 연결된 가이드 핵산 (gNA) 분자를 포함하는 재조합 융합 핵산 (fuNA) 분자를 제공하는 단계, 및
b. 상기 fuNA 분자를 표적 NA 분자를 포함하는 하나 이상의 세포 내에 도입하는 단계, 및
c. 상기 하나 이상의 세포 내로 부위 지정된 핵산 변형 폴리펩티드를 도입하는 단계, 및
d. 하나 이상의 세포를 상기 하나 이상의 세포에서 상동 재조합을 가능하게 하는 조건 하에 인큐베이션하는 단계, 및 임의로
e. 상동 재조합이 일어난 하나 이상의 세포를 단리시키는 단계
를 포함하며, 여기서 fuNA는 RNA로 이루어진 것인,
세포 내 표적 핵산 (표적 NA) 분자의 변형을 위한 방법. - 제1항에 있어서, gNA 분자가 표적 NA 분자의 동일한 수의 연속적 염기에 대해 상보적인 적어도 12개의 염기를 포함하는 스페이서 핵산 (스페이서 NA) 분자를 포함하는 것인 방법.
- 제2항에 있어서, gNA 분자가 스캐폴드 핵산 (스캐폴드 NA) 분자를 추가로 포함하는 것인 방법.
- 제3항에 있어서, 스캐폴드 NA 분자가 gNA 분자에 공유 결합된 것인 방법.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 세포가 미생물, 동물, 인간 또는 식물 세포인 방법.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 부위 지정된 핵산 변형 폴리펩티드가 핵산 가이드된 핵산 변형 폴리펩티드 또는 그의 기능적 등가물인 방법.
- 제1항 내지 제6항 중 어느 한 항에 있어서, fuNA 분자가 상기 fuNA 분자를 코딩하는 하나 이상의 발현 구축물로서 도입되는 것인 방법.
- gNA 분자에 공유 연결된 doNA 분자를 포함하는 재조합 fuNA 분자이며, 여기서 fuNA는 RNA로 이루어진 것인 재조합 fuNA 분자.
- 제8항의 fuNA 분자를 코딩하는 DNA 분자에 기능적으로 연결된 프로모터를 포함하는 발현 구축물을 포함하는 벡터.
- a. 제9항의 벡터 및
b. 부위 지정된 핵산 변형 폴리펩티드를 코딩하는 벡터 및 임의로
c. 스캐폴드 NA 분자를 코딩하는 벡터
를 포함하는 벡터 시스템. - a. 제9항의 벡터 및
b. 부위 지정된 핵산 변형 폴리펩티드를 코딩하는 벡터 및
c. 표적 NA 분자를 포함하는 세포 및 임의로
d. 스캐폴드 NA 분자를 코딩하는 벡터
를 포함하는, 세포 내 표적 NA의 변형을 위한 시스템. - a. 제9항의 벡터 및
b. 부위 지정된 핵산 변형 폴리펩티드를 코딩하는 벡터 및
c. 표적 NA 분자를 포함하는 세포 및 임의로
d. 스캐폴드 NA 분자를 코딩하는 벡터
를 포함하는 조성물 - 세포 내 표적 NA 분자의 변형을 위한 제9항 내지 제12항 중 어느 한 항의 벡터, 벡터 시스템, 시스템 또는 조성물의 용도.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020227006922A KR102506185B1 (ko) | 2016-04-29 | 2017-04-20 | 표적 핵산의 변형을 위한 개선된 방법 |
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16167774.5 | 2016-04-29 | ||
EP16167773 | 2016-04-29 | ||
EP16167773.7 | 2016-04-29 | ||
EP16167774 | 2016-04-29 | ||
EP17156018 | 2017-02-14 | ||
EP17156018.8 | 2017-02-14 | ||
PCT/EP2017/059331 WO2017186550A1 (en) | 2016-04-29 | 2017-04-20 | Improved methods for modification of target nucleic acids |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227006922A Division KR102506185B1 (ko) | 2016-04-29 | 2017-04-20 | 표적 핵산의 변형을 위한 개선된 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190002470A true KR20190002470A (ko) | 2019-01-08 |
KR102370675B1 KR102370675B1 (ko) | 2022-03-04 |
Family
ID=58640844
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227006922A KR102506185B1 (ko) | 2016-04-29 | 2017-04-20 | 표적 핵산의 변형을 위한 개선된 방법 |
KR1020237007132A KR20230038804A (ko) | 2016-04-29 | 2017-04-20 | 표적 핵산의 변형을 위한 개선된 방법 |
KR1020187030717A KR102370675B1 (ko) | 2016-04-29 | 2017-04-20 | 표적 핵산의 변형을 위한 개선된 방법 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227006922A KR102506185B1 (ko) | 2016-04-29 | 2017-04-20 | 표적 핵산의 변형을 위한 개선된 방법 |
KR1020237007132A KR20230038804A (ko) | 2016-04-29 | 2017-04-20 | 표적 핵산의 변형을 위한 개선된 방법 |
Country Status (13)
Country | Link |
---|---|
US (5) | US11608499B2 (ko) |
EP (5) | EP3448990B1 (ko) |
JP (2) | JP7184648B2 (ko) |
KR (3) | KR102506185B1 (ko) |
CN (1) | CN109072207B (ko) |
AU (5) | AU2017256517B2 (ko) |
BR (1) | BR112018068934A2 (ko) |
CA (1) | CA3022475A1 (ko) |
CL (1) | CL2018003074A1 (ko) |
DK (1) | DK3448990T5 (ko) |
IL (1) | IL262409A (ko) |
MX (2) | MX2018013256A (ko) |
WO (1) | WO2017186550A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020145549A1 (ko) | 2019-01-08 | 2020-07-16 | 주식회사 엘지화학 | 스웰링 게이지를 구비한 배터리 모듈 및 이를 포함하는 배터리 팩 |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6261500B2 (ja) | 2011-07-22 | 2018-01-17 | プレジデント アンド フェローズ オブ ハーバード カレッジ | ヌクレアーゼ切断特異性の評価および改善 |
US9163284B2 (en) | 2013-08-09 | 2015-10-20 | President And Fellows Of Harvard College | Methods for identifying a target site of a Cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9737604B2 (en) | 2013-09-06 | 2017-08-22 | President And Fellows Of Harvard College | Use of cationic lipids to deliver CAS9 |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
US9228207B2 (en) | 2013-09-06 | 2016-01-05 | President And Fellows Of Harvard College | Switchable gRNAs comprising aptamers |
US9840699B2 (en) | 2013-12-12 | 2017-12-12 | President And Fellows Of Harvard College | Methods for nucleic acid editing |
EP4079847A1 (en) | 2014-07-30 | 2022-10-26 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
US11680268B2 (en) | 2014-11-07 | 2023-06-20 | Editas Medicine, Inc. | Methods for improving CRISPR/Cas-mediated genome-editing |
WO2017053879A1 (en) | 2015-09-24 | 2017-03-30 | Editas Medicine, Inc. | Use of exonucleases to improve crispr/cas-mediated genome editing |
EP3365356B1 (en) | 2015-10-23 | 2023-06-28 | President and Fellows of Harvard College | Nucleobase editors and uses thereof |
EP3433363A1 (en) | 2016-03-25 | 2019-01-30 | Editas Medicine, Inc. | Genome editing systems comprising repair-modulating enzyme molecules and methods of their use |
EP4047092A1 (en) | 2016-04-13 | 2022-08-24 | Editas Medicine, Inc. | Cas9 fusion molecules, gene editing systems, and methods of use thereof |
BR112018074494A2 (pt) * | 2016-06-01 | 2019-03-19 | Kws Saat Se & Co Kgaa | sequências de ácidos nucleicos híbridas para engenharia genômica |
WO2018027078A1 (en) | 2016-08-03 | 2018-02-08 | President And Fellows Of Harard College | Adenosine nucleobase editors and uses thereof |
AU2017308889B2 (en) | 2016-08-09 | 2023-11-09 | President And Fellows Of Harvard College | Programmable Cas9-recombinase fusion proteins and uses thereof |
WO2018039438A1 (en) | 2016-08-24 | 2018-03-01 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
US20190330620A1 (en) * | 2016-10-14 | 2019-10-31 | Emendobio Inc. | Rna compositions for genome editing |
WO2018071868A1 (en) | 2016-10-14 | 2018-04-19 | President And Fellows Of Harvard College | Aav delivery of nucleobase editors |
WO2018094356A2 (en) * | 2016-11-18 | 2018-05-24 | Genedit Inc. | Compositions and methods for target nucleic acid modification |
US10745677B2 (en) | 2016-12-23 | 2020-08-18 | President And Fellows Of Harvard College | Editing of CCR5 receptor gene to protect against HIV infection |
DK3574101T5 (da) * | 2017-01-30 | 2024-09-02 | Kws Saat Se & Co Kgaa | Reparationsskabelonbinding til endonukleaser til genommodifikation |
WO2018165504A1 (en) | 2017-03-09 | 2018-09-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
JP2020510439A (ja) | 2017-03-10 | 2020-04-09 | プレジデント アンド フェローズ オブ ハーバード カレッジ | シトシンからグアニンへの塩基編集因子 |
JP7191388B2 (ja) | 2017-03-23 | 2022-12-19 | プレジデント アンド フェローズ オブ ハーバード カレッジ | 核酸によってプログラム可能なdna結合蛋白質を含む核酸塩基編集因子 |
WO2018209320A1 (en) | 2017-05-12 | 2018-11-15 | President And Fellows Of Harvard College | Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation |
KR20240027153A (ko) | 2017-06-15 | 2024-02-29 | 더 리전트 오브 더 유니버시티 오브 캘리포니아 | 표적화된 비-바이러스 dna 삽입 |
US11866726B2 (en) | 2017-07-14 | 2024-01-09 | Editas Medicine, Inc. | Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites |
US11732274B2 (en) | 2017-07-28 | 2023-08-22 | President And Fellows Of Harvard College | Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE) |
EP3676376A2 (en) | 2017-08-30 | 2020-07-08 | President and Fellows of Harvard College | High efficiency base editors comprising gam |
AU2018352592A1 (en) | 2017-10-16 | 2020-06-04 | Beam Therapeutics, Inc. | Uses of adenosine base editors |
EA202091056A1 (ru) | 2017-10-27 | 2020-09-17 | Те Риджентс Оф Те Юниверсити Оф Калифорния | Направленная замена эндогенных т-клеточных рецепторов |
US11268092B2 (en) | 2018-01-12 | 2022-03-08 | GenEdit, Inc. | Structure-engineered guide RNA |
JP2021534798A (ja) | 2018-08-28 | 2021-12-16 | フラッグシップ パイオニアリング イノベーションズ シックス,エルエルシー | ゲノムを調節するための方法及び組成物 |
WO2020191243A1 (en) | 2019-03-19 | 2020-09-24 | The Broad Institute, Inc. | Methods and compositions for editing nucleotide sequences |
KR20230053735A (ko) | 2020-03-04 | 2023-04-21 | 플래그쉽 파이어니어링 이노베이션스 브이아이, 엘엘씨 | 게놈의 조정을 위한 개선된 방법 및 조성물 |
WO2021175756A1 (en) | 2020-03-04 | 2021-09-10 | Basf Se | Shuttle vector for expression in e. coli and bacilli |
CN115605597A (zh) | 2020-03-04 | 2023-01-13 | 巴斯夫欧洲公司(De) | 用于产生赋予低至中等表达的组成型细菌启动子的方法 |
CA3177481A1 (en) | 2020-05-08 | 2021-11-11 | David R. Liu | Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence |
CN112111505B (zh) * | 2020-09-17 | 2022-03-15 | 江南大学 | 一种氧化葡萄糖酸杆菌中基因敲除的方法 |
US20220389461A1 (en) * | 2021-05-26 | 2022-12-08 | Inscripta, Inc. | Crispr editing in diploid genomes |
US20240263173A1 (en) * | 2021-08-11 | 2024-08-08 | The Board Of Trustees Of The Leland Stanford Junior University | High-throughput precision genome editing in human cells |
MX2024003887A (es) | 2021-10-14 | 2024-07-09 | Arsenal Biosciences Inc | Células inmunitarias que tienen arnch coespresados y sistemas de compuerta lógica. |
EP4448744A2 (en) * | 2021-12-14 | 2024-10-23 | The Broad Institute, Inc. | Reprogrammable fanzor polynucleotides and uses thereof |
TW202342756A (zh) | 2022-03-01 | 2023-11-01 | 美商巴斯夫農業解決方案種子美國有限責任公司 | Cas12a切口酶 |
CN114774420B (zh) * | 2022-04-27 | 2023-09-22 | 扬州大学 | 一种水稻增强子及基于CRISPR/Cas9技术评估水稻增强子活性的方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014150624A1 (en) * | 2013-03-14 | 2014-09-25 | Caribou Biosciences, Inc. | Compositions and methods of nucleic acid-targeting nucleic acids |
WO2016065364A1 (en) * | 2014-10-24 | 2016-04-28 | Life Technologies Corporation | Compositions and methods for enhancing homologous recombination |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69425903T2 (de) | 1993-12-09 | 2001-02-15 | Thomas Jefferson University, Philadelphia | Verbindungen und verfahren zur ortsspezifischen mutation in eukaryotischen zellen |
US6027945A (en) | 1997-01-21 | 2000-02-22 | Promega Corporation | Methods of isolating biological target materials using silica magnetic particles |
US6555732B1 (en) | 1998-09-14 | 2003-04-29 | Pioneer Hi-Bred International, Inc. | Rac-like genes and methods of use |
EP1152058A1 (en) | 2000-05-03 | 2001-11-07 | Institut Curie | Methods and compositions for effecting homologous recombination |
US10066233B2 (en) | 2005-08-26 | 2018-09-04 | Dupont Nutrition Biosciences Aps | Method of modulating cell resistance |
DK3011032T3 (da) | 2013-06-17 | 2020-01-20 | Broad Inst Inc | Fremføring, modificering og optimering af systemer, fremgangsmåder og sammensætninger til målretning mod og modellering af sygdomme og forstyrrelser i postmitotiske celler |
US10563225B2 (en) * | 2013-07-26 | 2020-02-18 | President And Fellows Of Harvard College | Genome engineering |
EP3033419A4 (en) | 2013-08-12 | 2017-07-05 | BASF Agro B.V. | Plants having increased tolerance to herbicides (ppo) |
CN106029890B (zh) | 2013-12-18 | 2022-04-12 | 巴斯夫农业公司 | 对除草剂具有增强的耐受性的植物 |
WO2015191693A2 (en) | 2014-06-10 | 2015-12-17 | Massachusetts Institute Of Technology | Method for gene editing |
CN107614680A (zh) * | 2015-05-14 | 2018-01-19 | 南加利福尼亚大学 | 利用重组核酸内切酶系统的最佳化基因编辑 |
WO2017024047A1 (en) | 2015-08-03 | 2017-02-09 | Emendobio Inc. | Compositions and methods for increasing nuclease induced recombination rate in cells |
AU2016339053A1 (en) * | 2015-09-24 | 2018-04-12 | Crispr Therapeutics Ag | Novel family of RNA-programmable endonucleases and their uses in genome editing and other applications |
EP3356520B1 (en) | 2015-10-02 | 2022-03-23 | The U.S.A. as represented by the Secretary, Department of Health and Human Services | Lentiviral protein delivery system for rna-guided genome editing |
CN106811479B (zh) * | 2015-11-30 | 2019-10-25 | 中国农业科学院作物科学研究所 | 利用CRISPR/Cas9系统定点修饰ALS基因获得抗除草剂水稻的系统及其应用 |
US20190062734A1 (en) * | 2016-04-13 | 2019-02-28 | Editas Medicine, Inc. | Grna fusion molecules, gene editing systems, and methods of use thereof |
WO2018094356A2 (en) * | 2016-11-18 | 2018-05-24 | Genedit Inc. | Compositions and methods for target nucleic acid modification |
-
2017
- 2017-04-20 MX MX2018013256A patent/MX2018013256A/es unknown
- 2017-04-20 EP EP17720040.9A patent/EP3448990B1/en not_active Revoked
- 2017-04-20 EP EP22193659.4A patent/EP4166662A1/en not_active Withdrawn
- 2017-04-20 EP EP22193654.5A patent/EP4166661A1/en active Pending
- 2017-04-20 EP EP21162462.2A patent/EP3868880A1/en active Pending
- 2017-04-20 JP JP2018555963A patent/JP7184648B2/ja active Active
- 2017-04-20 KR KR1020227006922A patent/KR102506185B1/ko active IP Right Grant
- 2017-04-20 EP EP22193652.9A patent/EP4166660A1/en not_active Withdrawn
- 2017-04-20 AU AU2017256517A patent/AU2017256517B2/en active Active
- 2017-04-20 KR KR1020237007132A patent/KR20230038804A/ko not_active Application Discontinuation
- 2017-04-20 KR KR1020187030717A patent/KR102370675B1/ko active IP Right Grant
- 2017-04-20 US US16/097,300 patent/US11608499B2/en active Active
- 2017-04-20 DK DK17720040.9T patent/DK3448990T5/da active
- 2017-04-20 CA CA3022475A patent/CA3022475A1/en active Pending
- 2017-04-20 CN CN201780025990.6A patent/CN109072207B/zh active Active
- 2017-04-20 WO PCT/EP2017/059331 patent/WO2017186550A1/en active Application Filing
- 2017-04-20 BR BR112018068934A patent/BR112018068934A2/pt active Search and Examination
-
2018
- 2018-10-16 IL IL262409A patent/IL262409A/en unknown
- 2018-10-29 MX MX2021009235A patent/MX2021009235A/es unknown
- 2018-10-29 CL CL2018003074A patent/CL2018003074A1/es unknown
-
2022
- 2022-09-16 US US17/933,023 patent/US20230107997A1/en active Pending
- 2022-09-16 US US17/933,003 patent/US20230024869A1/en active Pending
- 2022-09-16 US US17/933,005 patent/US20230183686A1/en active Pending
- 2022-09-16 US US17/933,015 patent/US20230049124A1/en active Pending
- 2022-11-04 AU AU2022100157A patent/AU2022100157A4/en active Active
- 2022-11-04 AU AU2022100155A patent/AU2022100155A4/en active Active
- 2022-11-04 AU AU2022100158A patent/AU2022100158A4/en active Active
- 2022-11-14 AU AU2022100170A patent/AU2022100170A4/en active Active
- 2022-11-24 JP JP2022187824A patent/JP2023018093A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014150624A1 (en) * | 2013-03-14 | 2014-09-25 | Caribou Biosciences, Inc. | Compositions and methods of nucleic acid-targeting nucleic acids |
WO2016065364A1 (en) * | 2014-10-24 | 2016-04-28 | Life Technologies Corporation | Compositions and methods for enhancing homologous recombination |
Non-Patent Citations (1)
Title |
---|
Gene Therapy, 2002, Vol.9, pp.703-707 1부.* * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020145549A1 (ko) | 2019-01-08 | 2020-07-16 | 주식회사 엘지화학 | 스웰링 게이지를 구비한 배터리 모듈 및 이를 포함하는 배터리 팩 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102506185B1 (ko) | 표적 핵산의 변형을 위한 개선된 방법 | |
AU2023226754A1 (en) | Compositions and methods for modifying genomes | |
CN101939434B (zh) | 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因 | |
DK2576605T3 (en) | PREPARATION OF METABOLITES | |
DK2087106T3 (en) | MUTATING DELTA8 DESATURATION GENES CONSTRUCTED BY TARGETED MUTAGENES AND USE THEREOF IN THE MANUFACTURE OF MULTI-Saturated FAT ACIDS | |
CN108026523B (zh) | 向导rna组装载体 | |
CN101365788B (zh) | Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途 | |
CN109563505A (zh) | 用于真核细胞的组装系统 | |
KR20120099509A (ko) | 재조합 숙주 세포에서 육탄당 키나아제의 발현 | |
KR20130132405A (ko) | 형질전환 빈도를 증가시키기 위해 변형된 아그로박테리움 균주 | |
KR20070085669A (ko) | 고농도의 아라키돈산을 생성하는 야로위아 리폴리티카 균주 | |
KR20170036792A (ko) | Rna-유도 엔도뉴클레아제를 사용한 통상적이지 않은 효모에서의 유전자 표적화 | |
KR20140092759A (ko) | 숙주 세포 및 아이소부탄올의 제조 방법 | |
US11001859B2 (en) | Recombinantly-modified adeno-associated virus helper vectors and their use to improve the packaging efficiency of recombinantly-modified adeno-associated virus | |
CN108779480A (zh) | 生产鞘氨醇碱和鞘脂类的方法 | |
KR20140099224A (ko) | 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법 | |
KR20120034652A (ko) | 유전적으로 변형된 미생물을 발생시키는 방법 | |
CN107868780B (zh) | 在大于10kb环状DNA分子上实现定点突变的方法 | |
KR20130138760A (ko) | 고농도의 에이코사펜타엔산 생성을 위한 재조합 미생물 숙주 세포 | |
CN109996874A (zh) | 10-甲基硬脂酸的异源性产生 | |
CN115698297A (zh) | 多模块生物合成酶基因组合文库的制备方法 | |
BRPI0616533A2 (pt) | polinucleotìdeo isolado, fragmento de ácido nucléico isolado, construções de dna recombinante, plantas, sementes, células vegetais, tecidos vegetais, método de isolamento de fragmentos de ácidos nucléico, método de mapeamento de variações genéticas, método de cultivo molecular, plantas de milho, métodos de alteração do transporte de nitrogênio das plantas e variantes de hat de plantas alteradas | |
CN116135974A (zh) | 一种重组糖基化酶碱基编辑系统及其应用 | |
KR102315601B1 (ko) | 재조합 벡터 및 이를 이용한 재조합 섬유아세포 성장인자 19의 제조 방법 | |
KR20230159050A (ko) | 플라스틱 분해 효소와 탄수화물 결합 모듈을 박테리아 표면에 발현한 전세포 생체촉매 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |